TW202342069A - 經修飾之基於crispr之基因編輯系統及使用方法 - Google Patents
經修飾之基於crispr之基因編輯系統及使用方法 Download PDFInfo
- Publication number
- TW202342069A TW202342069A TW112108604A TW112108604A TW202342069A TW 202342069 A TW202342069 A TW 202342069A TW 112108604 A TW112108604 A TW 112108604A TW 112108604 A TW112108604 A TW 112108604A TW 202342069 A TW202342069 A TW 202342069A
- Authority
- TW
- Taiwan
- Prior art keywords
- donor dna
- nucleotides
- internal
- sequence
- seq
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 108091033409 CRISPR Proteins 0.000 title claims description 35
- 238000010362 genome editing Methods 0.000 title description 14
- 239000002773 nucleotide Substances 0.000 claims abstract description 240
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 240
- 230000027455 binding Effects 0.000 claims abstract description 82
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims abstract 3
- 101710163270 Nuclease Proteins 0.000 claims description 73
- 108020005004 Guide RNA Proteins 0.000 claims description 50
- 238000012217 deletion Methods 0.000 claims description 49
- 230000037430 deletion Effects 0.000 claims description 49
- 238000003780 insertion Methods 0.000 claims description 49
- 230000037431 insertion Effects 0.000 claims description 49
- 210000004027 cell Anatomy 0.000 claims description 47
- 108020004414 DNA Proteins 0.000 claims description 46
- 108091079001 CRISPR RNA Proteins 0.000 claims description 42
- 102000004389 Ribonucleoproteins Human genes 0.000 claims description 27
- 108010081734 Ribonucleoproteins Proteins 0.000 claims description 27
- 238000011144 upstream manufacturing Methods 0.000 claims description 25
- 210000000349 chromosome Anatomy 0.000 claims description 14
- 238000006467 substitution reaction Methods 0.000 claims description 13
- 230000003993 interaction Effects 0.000 claims description 10
- 238000010354 CRISPR gene editing Methods 0.000 claims description 9
- 230000005945 translocation Effects 0.000 claims description 7
- 239000013598 vector Substances 0.000 claims description 7
- 208000026350 Inborn Genetic disease Diseases 0.000 claims description 6
- 208000016361 genetic disease Diseases 0.000 claims description 6
- 210000002865 immune cell Anatomy 0.000 claims description 5
- 150000002632 lipids Chemical class 0.000 claims description 5
- 239000002502 liposome Substances 0.000 claims description 5
- 239000002105 nanoparticle Substances 0.000 claims description 5
- 239000013603 viral vector Substances 0.000 claims description 5
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 3
- 210000003719 b-lymphocyte Anatomy 0.000 claims description 3
- 238000004520 electroporation Methods 0.000 claims description 3
- 210000003958 hematopoietic stem cell Anatomy 0.000 claims description 3
- 238000001727 in vivo Methods 0.000 claims description 3
- 210000000822 natural killer cell Anatomy 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 abstract 1
- 238000013461 design Methods 0.000 description 60
- 108091028113 Trans-activating crRNA Proteins 0.000 description 31
- 230000000295 complement effect Effects 0.000 description 28
- 108090000623 proteins and genes Proteins 0.000 description 28
- 102000004169 proteins and genes Human genes 0.000 description 20
- 239000000047 product Substances 0.000 description 15
- 102000053602 DNA Human genes 0.000 description 14
- 230000002441 reversible effect Effects 0.000 description 11
- 102100021601 Ephrin type-A receptor 8 Human genes 0.000 description 9
- 101000898676 Homo sapiens Ephrin type-A receptor 8 Proteins 0.000 description 9
- 230000000670 limiting effect Effects 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 239000012634 fragment Substances 0.000 description 7
- 230000006780 non-homologous end joining Effects 0.000 description 7
- 150000007523 nucleic acids Chemical class 0.000 description 7
- 102000040430 polynucleotide Human genes 0.000 description 7
- 108091033319 polynucleotide Proteins 0.000 description 7
- 239000002157 polynucleotide Substances 0.000 description 7
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- 101150038500 cas9 gene Proteins 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 5
- 238000003776 cleavage reaction Methods 0.000 description 5
- 230000005782 double-strand break Effects 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 238000007481 next generation sequencing Methods 0.000 description 5
- 102000039446 nucleic acids Human genes 0.000 description 5
- 108020004707 nucleic acids Proteins 0.000 description 5
- 230000007017 scission Effects 0.000 description 5
- 238000012163 sequencing technique Methods 0.000 description 5
- 230000008685 targeting Effects 0.000 description 5
- 238000001890 transfection Methods 0.000 description 5
- 238000010453 CRISPR/Cas method Methods 0.000 description 4
- 102100021699 Eukaryotic translation initiation factor 3 subunit B Human genes 0.000 description 4
- 101000896557 Homo sapiens Eukaryotic translation initiation factor 3 subunit B Proteins 0.000 description 4
- 101000988834 Homo sapiens Hypoxanthine-guanine phosphoribosyltransferase Proteins 0.000 description 4
- 108020004682 Single-Stranded DNA Proteins 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 108091093088 Amplicon Proteins 0.000 description 3
- 241000271566 Aves Species 0.000 description 3
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 241000286209 Phasianidae Species 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 108700028369 Alleles Proteins 0.000 description 2
- 241000272517 Anseriformes Species 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 102100031780 Endonuclease Human genes 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 101150050559 SOAT1 gene Proteins 0.000 description 2
- 102100021993 Sterol O-acyltransferase 1 Human genes 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 210000002706 plastid Anatomy 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-ULQXZJNLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidin-2-one Chemical compound O=C1N=C(N)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-ULQXZJNLSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- 101150018129 CSF2 gene Proteins 0.000 description 1
- 101150069031 CSN2 gene Proteins 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 108700004991 Cas12a Proteins 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 101150074775 Csf1 gene Proteins 0.000 description 1
- -1 Csm2 Proteins 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 230000010337 G2 phase Effects 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 241000699694 Gerbillinae Species 0.000 description 1
- 241000282575 Gorilla Species 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101150065753 LEG1 gene Proteins 0.000 description 1
- 241000270322 Lepidosauria Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 241000282520 Papio Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 101150097169 RBBP8 gene Proteins 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 101100047461 Rattus norvegicus Trpm8 gene Proteins 0.000 description 1
- 230000018199 S phase Effects 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 101150063416 add gene Proteins 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 108010045512 cohesins Proteins 0.000 description 1
- 101150055601 cops2 gene Proteins 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 239000005090 green fluorescent protein Substances 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000033607 mismatch repair Effects 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/351—Conjugate
- C12N2310/3519—Fusion with another nucleic acid
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
本發明揭示包含一或多個經修飾之單嚮導RNA (sgRNA)及供體DNA之系統,其中該等經修飾之sgRNA中之各者包含距離該等經修飾之sgRNA中之各者之3'及5'端至少5個核苷酸的一或多個內部錨,其中該供體DNA包含能夠結合至該一或多個內部錨之內部錨的一或多個結合區段。本文進一步揭示使用此處所描述之系統的方法。
Description
基因編輯技術一直蓬勃發展,且為操控目標細胞、組織或生物體中之遺傳物質的強大工具。成簇規律間隔短回文重複序列(CRISPR)相關技術為最有前景的可用基因編輯工具之一。然而,所需精確的同源定向修復(HDR)介導編輯之低編輯率、不太令人滿意之脫靶率及高易位率及其導致的突變誘發已成為進一步推進該技術及其更廣泛使用的主要障礙。
在一個態樣中,為解決對更有效及特異性基因編輯結果之需求,本文中提供一種用於改變目標序列之系統,該系統包含經修飾之單嚮導RNA (sgRNA)及供體DNA,其中經修飾之sgRNA包含CRISPR RNA (crRNA)及反式活性RNA (tracrRNA),其中經修飾之sgRNA包含距離該經修飾之sgRNA之3'及5'端至少5個核苷酸的一或多個內部錨,其中該供體DNA包含第一部分及第二部分,其中該第一部分包含能夠經由非共價鍵結合至該一或多個內部錨之內部錨的一或多個結合區段,且該第二部分包含相關序列(SOI)。
在一些實施例中,非共價鍵係華生-克里克相互作用(Watson-Crick interaction)。
在一些實施例中,經修飾之sgRNA包含連結(nexus)、第一髮夾及tracrRNA與crRNA之間的單股區。在一些實施例中,經修飾之sgRNA進一步包含突出區(bulge region)。在一些實施例中,經修飾之sgRNA進一步包含第二髮夾。
在一些實施例中,一或多個內部錨之內部錨位於經修飾之sgRNA之單股區中。在一些特定實施例中,一或多個內部錨之內部錨位於tracrRNA與crRNA之間的單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於第一髮夾內之單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於連結與第一髮夾之間的單股區中。在其他特定實施例中,經修飾之sgRNA進一步包含第二髮夾,且其中單股區在第二髮夾內。
在一些實施例中,一或多個內部錨中之各者或一或多個結合區段中之各者為3個核苷酸至100個核苷酸長。在其他實施例中,一或多個內部錨中之各者或一或多個結合區段中之各者為3個核苷酸至20個核苷酸長。在另外其他實施例中,一或多個內部錨中之各者或一或多個結合區段中之各者為約5個核苷酸長。
在一些實施例中,一或多個內部錨中之各者包含來自表1之SEQ ID NO 1至SEQ ID NO 472的序列。在其他實施例中,一或多個內部錨中之各者包含來自表2之SEQ ID NO 473至SEQ ID NO 3056的序列。在其他實施例中,一或多個結合區段中之各者包含來自表3之SEQ ID NO 3057至SEQ ID NO 3528的序列。在其他實施例中,一或多個結合區段中之各者包含來自表4之SEQ ID NO 3529至SEQ ID NO 6112的序列。
在一些實施例中,一或多個結合區段係藉由連接子連接。在一些特定實施例中,連接子為約1至30個核苷酸長。在其他特定實施例中,連接子為約10至25個核苷酸長。在其他實施例中,連接子為聚去氧腺苷之序列。
在一些實施例中,SOI包含具有一或多個核苷酸取代、一或多個核苷酸插入、一或多個核苷酸缺失或其任何組合之目標序列。在一些實施例中,一或多個核苷酸插入包含1至100個核苷酸。在一些實施例中,一或多個核苷酸插入包含101至1,000個核苷酸。在一些實施例中,一或多個核苷酸插入包含1,001至10,000個核苷酸。在一些實施例中,一或多個核苷酸插入包含10,001至100,000個核苷酸。在其他實施例中,一或多個核苷酸插入包含2至10個隨機核苷酸。在其他實施例中,一或多個核苷酸缺失包含1至50個核苷酸。
在一些實施例中,供體DNA之第二部分進一步包含上游及/或下游同源臂。在特定實施例中,上游同源臂為5至1000個核苷酸長。在特定實施例中,下游同源臂為約10至1000個核苷酸長。在其他實施例中,上游同源臂為100至1,000個核苷酸長。在其他實施例中,下游同源臂為約41至1,000個核苷酸長。
在一些實施例中,供體DNA之第一部分在供體DNA之第二部分之5'處。在其他實施例中,供體DNA之第一部分在供體DNA之第二部分之3'處。
在一些實施例中,供體DNA為單股。在其他實施例中,供體DNA之第一部分為單股且供體DNA之第二部分為完全或部分雙股。
在一些實施例中,供體DNA在3'及/或5'端封閉。
在一些實施例中,系統進一步包含CRISPR核酸酶。在特定實施例中,CRISPR核酸酶為DNA核酸酶。在特定實施例中,DNA核酸酶為Cas9、Cas12、Cas14或CasΦ。
在另一態樣中,本文提供一種包含供體DNA及兩個經修飾之單嚮導RNA (sgRNA)的系統,其用於切割第一染色體上之第一基因座及第二染色體上之第二基因座,其中經修飾之sgRNA中之各者包含CRISPR RNA (crRNA)及反式活性RNA (tracrRNA),其中經修飾之sgRNA中之各者包含距離該等經修飾之sgRNA中之各者之3'及5'端至少5個核苷酸的一或多個內部錨,其中該供體DNA包含第一部分及第二部分,其中該第一部分包含能夠經由非共價鍵結合至該一或多個內部錨之內部錨的一或多個結合區段,且該第二部分包含相關序列(SOI),其中該供體DNA包含上游同源臂及/或下游同源臂。
在一些實施例中,第一染色體與第二染色體相同。在一些特定實施例中,第一基因座在第二基因座之5'處。在其他實施例中,第一染色體與第二染色體不同。在一些實施例中,兩個經修飾之sgRNA靶向相同基因上之不同基因座。在一些實施例中,兩個經修飾之sgRNA靶向同一股上之不同基因座。在一些實施例中,兩個經修飾之sgRNA靶向不同股上之不同基因座。在一些實施例中,系統包含第二供體DNA。在一些實施例中,供體DNA及第二供體DNA各自包含上游同源臂及/或下游同源臂。在一些實施例中,供體DNA之同源臂及第二供體DNA之同源臂與同一股上之序列互補。在一些實施例中,供體DNA之同源臂及第二供體DNA之同源臂與不同股上之序列互補。
在一些實施例中,第一基因座及第二基因座相隔至少50、100、1,000、10,000或100,000個核苷酸。
在一些實施例中,上游同源臂側接第一基因座之5'端。在其他實施例中,下游同源臂側接第二基因座之3'端。
在一些實施例中,非共價鍵係華生-克里克相互作用。
在一些實施例中,經修飾之sgRNA包含連結、第一髮夾及tracrRNA與crRNA之間的單股區。在一些實施例中,經修飾之sgRNA進一步包含突出區。在一些實施例中,經修飾之sgRNA進一步包含第二髮夾。
在一些實施例中,一或多個內部錨之內部錨位於經修飾之sgRNA之單股區中。在一些特定實施例中,一或多個內部錨之內部錨位於tracrRNA與crRNA之間的單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於第一髮夾內之單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於連結與第一髮夾之間的單股區中。在其他特定實施例中,經修飾之sgRNA進一步包含第二髮夾,且其中單股區在第二髮夾內。
在一些實施例中,一或多個內部錨中之各者或一或多個結合區段中之各者為3個核苷酸至100個核苷酸長。在其他實施例中,一或多個內部錨中之各者或一或多個結合區段中之各者為3個核苷酸至20個核苷酸長。在另外其他實施例中,一或多個內部錨中之各者或一或多個結合區段中之各者為約5個核苷酸長。
在一些實施例中,一或多個內部錨中之各者包含來自表1之SEQ ID NO 1至SEQ ID NO 472的序列。在其他實施例中,一或多個內部錨中之各者包含來自表2之SEQ ID NO 473至SEQ ID NO 3056的序列。在其他實施例中,一或多個結合區段中之各者包含來自表3之SEQ ID NO 3057至SEQ ID NO 3528的序列。在其他實施例中,一或多個結合區段中之各者包含來自表4之SEQ ID NO 3529至SEQ ID NO 6112的序列。
在一些實施例中,一或多個結合區段係藉由連接子連接。在一些特定實施例中,連接子為約1至30個核苷酸長。在其他特定實施例中,連接子為約10至25個核苷酸長。在其他實施例中,連接子為聚去氧腺苷之序列。
在一些實施例中,SOI包含第一基因座與第二基因座之間的具有一或多個核苷酸取代、一或多個核苷酸插入、一或多個核苷酸缺失或其任何組合的區域。在一些實施例中,一或多個核苷酸插入包含1至100個核苷酸。在一些實施例中,一或多個核苷酸插入包含101至1,000個核苷酸。在一些實施例中,一或多個核苷酸插入包含1,001至10,000個核苷酸。在一些實施例中,一或多個核苷酸插入包含1,001至10,000個核苷酸。在一些實施例中,一或多個核苷酸插入包含10,001至100,000個核苷酸。在一些實施例中,一或多個核苷酸缺失包含1至100個核苷酸。在一些實施例中,一或多個核苷酸缺失包含101至1,000個核苷酸。在一些實施例中,一或多個核苷酸缺失包含1,001至10,000個核苷酸。在一些實施例中,一或多個核苷酸缺失包含1,001至10,000個核苷酸。在一些實施例中,一或多個核苷酸缺失包含10,001至100,000個核苷酸。
在特定實施例中,上游同源臂為5至1000個核苷酸長。在特定實施例中,下游同源臂為約10至1000個核苷酸長。在其他實施例中,上游同源臂為100至1,000個核苷酸長。在其他實施例中,下游同源臂為約41至1,000個核苷酸長。
在一些實施例中,供體DNA之第一部分在供體DNA之第二部分之5'處。在其他實施例中,供體DNA之第一部分在供體DNA之第二部分之3'處。
在一些實施例中,供體DNA為單股。在其他實施例中,供體DNA之第一部分為單股且供體DNA之第二部分為完全或部分雙股。
在一些實施例中,供體DNA在3'及/或5'端封閉。
在一些實施例中,系統進一步包含CRISPR核酸酶。在特定實施例中,CRISPR核酸酶為DNA核酸酶。在特定實施例中,DNA核酸酶為Cas9、Cas12、Cas14或CasΦ。
在另一態樣中,本文提供一種修飾細胞之方法,其中該方法包含轉運依本文所描述之系統。
在一些實施例中,該轉運包含:(a)培育CRISPR核酸酶及經修飾之sgRNA以形成核糖核蛋白(RNP)複合物;(b)將供體DNA施用於RNP複合物;及(c)將來自(b)之RNP複合物-供體DNA輸送至細胞。在一些特定實施例中,在步驟(a)中CRISPR核酸酶與經修飾之sgRNA的比率為約1:0.5至約1:10。在其他特定實施例中,在步驟(a)中CRISPR核酸酶與經修飾之sgRNA的比率為約1:1至1:2。
在其他實施例中,轉運包含:(a)提供包含編碼CRISPR核酸酶之核苷酸序列及編碼經修飾之gRNA之核苷酸序列的一或多種載體;(b)將(a)之一或多種載體輸送至細胞;及(c)將供體DNA輸送至細胞。在特定實施例中,步驟(c)在步驟(b)之後約6至48小時進行。
在一些實施例中,輸送係藉由病毒載體、脂質體、脂質奈米粒子或電穿孔達成。
在一些實施例中,細胞為免疫細胞。在特定實施例中,免疫細胞為T細胞、B細胞、NK細胞或造血幹細胞。
在一些實施例中,該方法係離體或活體內進行。
在一些實施例中,所需編輯之百分比比不含包含結合至經修飾之sgRNA之第一部分之供體DNA及/或不含含有一或多個內部錨之經修飾之sgRNA的類似系統高至少10%、至少50%、至少100%或至少200%。在其他實施例中,方法之脫靶率比不含包含結合至經修飾之sgRNA之第一部分之供體DNA及/或不含含有一或多個內部錨之經修飾之sgRNA的類似系統低至少10%、至少50%或至少100%。在其他實施例中,方法之易位率、大插入率或大缺失率比不含包含結合至經修飾之sgRNA之第一部分之供體DNA及/或不含含有一或多個內部錨之經修飾之sgRNA的類似系統低至少10%、至少50%或至少100%。
在另一態樣中,本文提供一種治療遺傳病症之方法,其中該方法包含向個體投與有效量之依本文所描述之系統。在一些實施例中,SOI包含逆轉或緩解遺傳病症之序列。
根據以下詳細說明,本發明之其他態樣及優點對於熟習此項技術者將變得顯而易見,其中僅展示及描述本發明之說明性實施例。應認識到,本發明能夠具有其他及不同實施例,且其若干細節能夠在各種顯而易見的方面進行修改,該等修改皆不偏離本發明。因此,圖式及描述應在本質上視為說明性的而非限制性的。
以引用方式之併入
本說明書中所提及之所有公開案、專利及專利申請案均以引用之方式併入本文中,其引用之程度如同各單獨公開案、專利或專利申請案經特定及單獨地指示以引用之方式併入一般。就以引用的方式併入之公開案及專利或專利申請案與本說明書中所含有之揭示內容相抵觸而言,本說明書意欲替代及/或優先於任何此類相抵觸之材料。
關於聯邦政府贊助研究之申明
本發明係在瑞典研究理事會(Swedish Research Council)授予Zongli Zheng之授權號2016-02830下利用政府支持進行的。
交叉參考
本申請案主張在2022年3月9日申請之美國臨時申請案序列號63/318,362之權益,其全部內容以引用之方式併入本文中。
本發明部分基於以下驚人發現:當設計供體DNA以與sgRNA偶合時,有效偶合之位置不隨機。依以下圖式及實例中所示,供體DNA與sgRNA之間的偶合位於距離經修飾之sgRNA之3'及5'端至少5個核苷酸處。
本文提供依本文所描述之系統的組合物。分別揭示關於非共價鍵、內部錨在經修飾之sgRNA上之位置、經修飾之sgRNA之內部錨/供體DNA之結合區段之長度及序列、供體DNA上之一或多個結合區段之間的連接子、SOI、供體DNA之其他特徵及Cas蛋白的各種實施例。此外,本文提供使用本文所描述之系統的方法。
雖然本文中已展示及描述本發明之各種實施例,但熟習此項技術者將顯而易見,此類實施例僅作為實例提供。熟習此項技術者在不脫離本發明下可想到許多變化形式、改變及替代。應理解,可以採用本文所描述之本發明之實施例的多種替代方案。
依本文所使用,術語「CRISPR/Cas」可指核糖核蛋白複合物,例如具有單嚮導RNA (sgRNA)及CRISPR相關(Cas)核酸內切酶之兩部分組分的核糖核蛋白複合物。在一些情況下,CRISPR/Cas包含超過兩種組分。術語「CRISPR」可指成簇規律間隔短回文重複序列及其相關系統。CRISPR可用作使細菌及古菌能夠偵測及沉默外來核酸(例如來自病毒或質體)的適應性防禦系統。CRISPR可用於多種細胞類型以允許以序列特異性方式進行聚核苷酸編輯。在一些情況下,CRISPR系統之一或多個元件可源自I型、II型、III型、IV型、V型或VI型CRISPR系統。在CRISPR II型系統中,嚮導RNA可與Cas相互作用且將Cas酶之核酸酶活性引導至目標區域。目標區域可包含「原間隔區」及「原間隔區相鄰模體」(PAM),且兩個域均可用於Cas酶介導之活性(例如裂解)。原間隔區可稱為目標位點(或基因體目標位點)。sgRNA可與原間隔區(結合位點)之相對股配對(或雜交)以將Cas酶引導至目標區域。PAM位點可指藉由Cas酶識別之短序列,且在一些情況下,為Cas酶活性所需要的。PAM位點之序列及核苷酸數量可視Cas酶之類型而不同。
依本文所使用,術語「Cas」通常係指野生型Cas蛋白、其片段或其突變體或變異體。在整個本發明中,術語「Cas」、「酶Cas」、「酶CRISPR」、「蛋白CRISPR」、或「蛋白Cas」可互換使用。
Cas蛋白可包含CRISPR/Cas I型、II型、III型或IV型之蛋白或源自CRISPR/Cas I型、II型、III型或IV型之蛋白,其具有RNA引導之聚核苷酸結合或核酸酶活性。適合之Cas蛋白的實例包括:CasX、Cas3、Cas4、Cas5、Cas5e (或CasD)、Cas6、Cas6e、Cas6f、Cas7、Cas8a1、Cas8a2、Cas8b、Cas8c、Cas9 (亦稱為Csnl及Csxl2)、Cas10、Cas10d、CasF、CasG、CasH、Csy1、Csy2、Csy3、Cse1 (或CasA)、Cse2 (或CasB)、Cse3 (或CasE)、Cse4 (或CasC)、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csz1、Csx15、Csf1、Csf2、Csf3、Csf4、Cu1966、其同系物及其經修飾之形式。在一些情況下,Cas蛋白可包含CRISPR/Cas V型或VI型系統之蛋白或源自CRISPR/Cas V型或VI型系統之蛋白,及其經修飾之形式。在一些情況下,Cas蛋白可為催化死亡或失活Cas (dCas)。在一些情況下,Cas蛋白可具有降低或最小核酸酶活性(亦即失活Cas或dCas)。在一些情況下,Cas蛋白可以可操作方式偶合至一或多種其他蛋白質,諸如核酸聚合酶。在一實例中,Cas蛋白可為與逆轉錄酶融合之dCas。
依本文所使用,術語「單嚮導RNA」或「sgRNA」可指可結合至Cas蛋白且輔助將Cas蛋白靶向目標聚核苷酸(例如DNA)內之特定位置的RNA分子(或統稱為一組RNA分子)。單嚮導RNA包含CRISPR RNA (crRNA)區段及反式活化crRNA (tracrRNA)區段。依本文所使用,術語「crRNA」或「crRNA區段」係指包括聚核苷酸靶向嚮導序列、莖序列及視情況存在之5'-突出序列的RNA分子或其部分。術語「tracrRNA」或「tracrRNA區段」係指包括蛋白結合區段之RNA分子或其部分(例如,蛋白結合區段能夠與CRISPR相關蛋白,諸如Cas9相互作用)。
術語「聚核苷酸」或「核酸」在本文中可互換使用,可指任何長度之核苷酸(例如核糖核苷酸或去氧核糖核苷酸)之聚合形式。因此,此術語包括單股、雙股或多股DNA或RNA、基因體DNA、互補DNA (cDNA)、嚮導RNA (gRNA)、信使RNA (mRNA)、DNA-RNA雜交體,或包含嘌呤及嘧啶鹼基或其他天然、化學或生物化學修飾、非天然或衍生之核苷酸鹼基的聚合物。依本文所使用,「寡核苷酸」可指在單股或雙股DNA或RNA之約5至約100個核苷酸之間的聚核苷酸。核酸之長度可以參考核酸序列中鹼基之數目指代。例如,100個核苷酸之序列可稱為100個鹼基長度。然而,出於本發明之目的,寡核苷酸之長度可不存在上限。在一些情況下,寡核苷酸(oligonucleotide)可被稱為「寡聚物(oligomer)」或「寡核苷酸(oligo)」,且可自基因分離,或藉由此項技術中已知之方法化學合成。術語「聚核苷酸」及「核酸」可包括單股(諸如有義或反義)及雙股聚核苷酸。DNA之核苷酸之實例可包括胞嘧啶(C)、鳥嘌呤(G)、腺嘌呤(A)、胸腺嘧啶(T)或其修飾。RNA之核苷酸之實例可包括C、G、A、尿嘧啶(U)或其修飾。
本文所揭示之「個體」包括任何活有機體。因此,在一些實施例中,個體為哺乳動物、禽類、爬行動物、兩棲動物、魚類、植物、真菌或細菌。哺乳動物個體包括但不限於人類、非人類靈長類動物(例如大猩猩、猴子、狒狒及黑猩猩等)、犬、貓、山羊、馬、豬、家牛、綿羊及類似動物以及實驗室動物(例如大鼠、天竺鼠、小鼠、沙鼠、倉鼠及類似動物)。鳥類個體包括但不限於雞、鴨、火雞、鵝、鵪鶉、雉雞及作為寵物之鳥類。在一些實施例中,適合之個體包括男性及女性以及任何年齡之個體,包括胚胎(例如在子宮內或卵內)、嬰兒、幼年、青年、成年及老年個體。在一些實施例中,個體為人類。
「治療(Treating)」或「治療(treatment)」可指治療性治療及防治性或預防性量測,其中目的可為預防或減緩(減輕)靶向病理性病狀或病症。需要治療者可包括已患有病症者,以及傾向於患有病症者,或待預防病症者。例如,若在根據本發明之方法接受治療量之組合物後,個體顯示可觀測及/或可量測的以下一或多者減少或不存在:在一定程度上緩解與特定疾病相關之一或多種症狀;降低發病率及/或死亡率,及改善生活品質問題,則個體可成功地「治療」由功能獲得性突變引起之疾病。
本文在數值前存在術語「約」之情況下呈現某些範圍。術語「約」在本文中可用以提供其後之準確數字以及接近或近似該術語之後之數字之數字的文字支持。在確定一個數字是否接近或近似於具體列舉的數字時,接近的或近似的未列舉的數字可為在其呈現的上下文中提供具體列舉的數字的實質等效的數字。在提供一定範圍之值之情況下,應理解除非上下文另外清晰地指示,否則相對於下限之單位之十分之一,本文所描述之方法及組合物內可涵蓋彼範圍之上限與下限之間之各中間值及彼所陳述範圍中的任何其他所陳述或中間值。此等較小範圍之上限及下限可獨立地包括於較小範圍內且亦涵蓋於本文所描述之方法及組合物內,經受所陳述範圍內之任何特定排他性限制。當所陳述之範圍包括界限值中之一或兩者時,不包括彼等所包括之界限值中之一或兩者的範圍亦可包括於本文所描述之方法及組合物中。
只要術語「至少」、「大於」或「大於或等於」在兩個或更多個數值系列中之第一數值前,則術語「至少」、「大於」或「大於或等於」可用於彼等數值系列中之數值中之各者。例如,大於或等於1、2或3相當於大於或等於1、大於或等於2,或大於或等於3。
只要術語「不超過」、「小於」或「小於或等於」在兩個或更多個數值系列中之第一數值前,則術語「不超過」、「小於」或「小於或等於」可用於彼等數值系列中之數值中之各者。例如,小於或等於3、2或1相當於小於或等於3、小於或等於2,或小於或等於1。
本文中所使用之術語「所需編輯效率」或「所需編輯之百分比」係指基於本文所描述之供體DNA中之SOI設計,具有設計序列及設計位置的預期編輯結果。在SOI包含具有一或多個核苷酸取代、一或多個核苷酸插入、一或多個核苷酸缺失或其任何組合之目標序列的一些實施例中,所需編輯效率或所需編輯之百分比定義為包含具有一或多個核苷酸取代、一或多個核苷酸插入、一或多個核苷酸缺失或其任何組合之目標序列的相應基因編輯產物的比例,且在供體DNA之第二部分具有任何同源臂的情況下位於基於上游及/或下游同源臂之設計的預期基因座上。
本文所用之術語「上游同源臂」係指目標序列之區段或第一與第二基因座之間的切割位點5'側的區域。本文所用之術語「下游同源臂」係指目標序列之區段或第一與第二基因座之間的切割位點3'側的區域。本文所用之術語「遠端/近端同源臂」係指目標序列區段或第一與第二基因座之間相對於原間隔區相鄰模體(PAM)位點遠端或近端的區域。
1. 依本文所描述之系統之組合物
在一個態樣中,本文提供用於改變目標序列之系統,其包含經修飾之單嚮導RNA (sgRNA)及供體DNA,其中該經修飾之sgRNA包含CRISPR RNA (crRNA)及反式活性RNA (tracrRNA),其中該經修飾之sgRNA包含距離該經修飾之sgRNA之3'及5'端至少5個核苷酸的一或多個內部錨,其中該供體DNA包含第一部分及第二部分,其中該第一部分包含能夠經由非共價鍵結合至該一或多個內部錨之內部錨的一或多個結合區段,且該第二部分包含相關序列(SOI)。在另一態樣中,本文提供一種包含供體DNA及兩個經修飾之單嚮導RNA (sgRNA)的系統,其用於切割第一染色體上之第一基因座及第二染色體上之第二基因座,其中經修飾之sgRNA中之各者包含CRISPR RNA (crRNA)及反式活性RNA (tracrRNA),其中經修飾之sgRNA中之各者包含距離該等經修飾之sgRNA中之各者之3'及5'端至少5個核苷酸的一或多個內部錨,其中該供體DNA包含第一部分及第二部分,其中該第一部分包含能夠經由非共價鍵結合至一或多個內部錨之內部錨的一或多個結合區段,且該第二部分包含相關序列(SOI),其中該供體DNA包含上游同源臂及/或下游同源臂。
(a)
非共價鍵
在一些實施例中,本文所描述之非共價鍵為氫鍵。在特定實施例中,本文所描述之非共價鍵係華生-克里克相互作用。在其他實施例中,本文所描述之非共價鍵係離子型相互作用。在其他實施例中,本文所描述之非共價鍵係凡得瓦爾力相互作用(Van der Waals interaction)。在其他實施例中,本文所描述之非共價鍵係疏水性鍵。
(b)
經修飾之 sgRNA 上之內部錨之位置
在一些實施例中,經修飾之sgRNA包含連結、第一髮夾及tracrRNA與crRNA之間的單股區。因此,在一些特定實施例中,一或多個內部錨之內部錨位於tracrRNA與crRNA之間的單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於第一髮夾內之單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於連結與第一髮夾之間的單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於第一髮夾之莖部分中,因此在第一髮夾之莖部分中產生人工突出狀結構。在其他特定實施例中,因為tracrRNA中之一或多個序列與crRNA中之對應序列反向互補,所以在tracrRNA與crRNA之間形成莖。因此,一或多個內部錨之內部錨位於tracrRNA與crRNA之間的莖中,因此在莖中產生人工突出狀結構。
在一些實施例中,經修飾之sgRNA包含連結、第一髮夾、第二髮夾、視情況存在之一或多個髮夾及tracrRNA與crRNA之間的單股區。因此,在一些特定實施例中,一或多個內部錨之內部錨位於tracrRNA與crRNA之間的單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於第一髮夾內之單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於第二髮夾內之單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於視情況存在之一或多個髮夾內之單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於連結與第一髮夾之間的單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於第一髮夾與第二髮夾之間的單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於第二髮夾與第三髮夾、或兩個相鄰髮夾之間的單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於第一髮夾之莖部分中,因此在第一髮夾之莖部分中產生人工突出狀結構。在其他特定實施例中,一或多個內部錨之內部錨位於第二髮夾之莖部分中,因此在第二髮夾之莖部分中產生人工突出狀結構。在其他特定實施例中,一或多個內部錨之內部錨位於視情況存在之一或多個髮夾之莖部分中,因此在視情況存在之一或多個髮夾之莖部分中產生人工突出狀結構。在其他特定實施例中,因為tracrRNA中之一或多個序列與crRNA中之對應序列反向互補,所以在tracrRNA與crRNA之間形成莖。因此,一或多個內部錨之內部錨位於tracrRNA與crRNA之間的莖中,因此在莖中產生人工突出狀結構。
在一些實施例中,經修飾之sgRNA包含連結、突出區、第一髮夾及tracrRNA與crRNA之間的單股區。具體而言,因為tracrRNA中之一或多個序列與crRNA中之對應序列反向互補,所以在tracrRNA與crRNA之間形成莖。莖被突出區分為上莖及下莖。因此,在一些特定實施例中,一或多個內部錨之內部錨位於tracrRNA與crRNA之間的單股區中,其對應於上莖頂部的環。在其他特定實施例中,一或多個內部錨之內部錨位於第一髮夾內之單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於連結與第一髮夾之間的單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於第一髮夾之莖部分中,因此在第一髮夾之莖部分中產生人工突出狀結構。在其他特定實施例中,一或多個內部錨之內部錨位於上莖內,因此在上莖中產生人工突出狀結構。在其他特定實施例中,一或多個內部錨之內部錨位於下莖內,因此在下莖中產生人工突出狀結構。
在一些實施例中,經修飾之sgRNA包含連結、突出區、第一髮夾、第二髮夾、視情況存在之一或多個髮夾及tracrRNA與crRNA之間的單股區。具體而言,因為tracrRNA中之一或多個序列與crRNA中之對應序列反向互補,所以在tracrRNA與crRNA之間形成莖。莖被突出區分為上莖及下莖。因此,在一些特定實施例中,一或多個內部錨之內部錨位於tracrRNA與crRNA之間的單股區中,其對應於上莖頂部的環。在其他特定實施例中,一或多個內部錨之內部錨位於第一髮夾內之單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於第二髮夾內之單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於視情況存在之一或多個髮夾內之單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於連結與第一髮夾之間的單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於第一髮夾與第二髮夾、或任何相鄰髮夾之間的單股區中。在其他特定實施例中,一或多個內部錨之內部錨位於第一髮夾之莖部分中,因此在第一髮夾之莖部分中產生人工突出狀結構。在其他特定實施例中,一或多個內部錨之內部錨位於第二髮夾之莖部分中,因此在第二髮夾之莖部分中產生人工突出狀結構。在其他特定實施例中,一或多個內部錨之內部錨位於視情況存在之一或多個髮夾之莖部分中,因此在一或多個髮夾之莖部分中產生人工突出狀結構。在其他特定實施例中,一或多個內部錨之內部錨位於上莖內,因此在上莖中產生人工突出狀結構。在其他特定實施例中,一或多個內部錨之內部錨位於下莖內,因此在下莖中產生人工突出狀結構。
(c)
經修飾之 sgRNA 之 內部錨 / 供體 DNA 之結合區段之長度
在一些實施例中,一或多個內部錨中之各者為3個核苷酸至100個核苷酸長。在其他實施例中,一或多個內部錨中之各者為3個核苷酸至20個核苷酸長。在其他實施例中,一或多個內部錨中之各者為至少3個核苷酸長。在其他實施例中,一或多個內部錨中之各者為至少4個核苷酸長。在其他實施例中,一或多個內部錨中之各者為至少5個核苷酸長。在其他實施例中,一或多個內部錨中之各者為至少6個核苷酸長。在其他實施例中,一或多個內部錨中之各者為至少7個核苷酸長。在其他實施例中,一或多個內部錨中之各者為至少8個核苷酸長。在其他實施例中,一或多個內部錨中之各者為至少9個核苷酸長。在其他實施例中,一或多個內部錨中之各者為至少10個核苷酸長。在其他實施例中,一或多個內部錨中之各者為3個核苷酸長。在其他實施例中,一或多個內部錨中之各者為4個核苷酸長。在其他實施例中,一或多個內部錨中之各者為5個核苷酸長。在其他實施例中,一或多個內部錨中之各者為6個核苷酸長。在其他實施例中,一或多個內部錨中之各者為7個核苷酸長。在其他實施例中,一或多個內部錨中之各者為8個核苷酸長。在其他實施例中,一或多個內部錨中之各者為9個核苷酸長。在其他實施例中,一或多個內部錨中之各者為10個核苷酸長。
在一些實施例中,供體DNA之結合區段經由華生-克里克相互作用與經修飾之sgRNA的內部錨結合。因此,供體DNA之結合區段亦與經修飾之sgRNA之內部錨具有類似長度。因此,在一些實施例中,一或多個結合區段中之各者為3個核苷酸至100個核苷酸長。在其他實施例中,一或多個結合區段中之各者為3個核苷酸至20個核苷酸長。在其他實施例中,一或多個結合區段中之各者為至少3個核苷酸長。在其他實施例中,一或多個結合區段中之各者為至少4個核苷酸長。在其他實施例中,一或多個結合區段中之各者為至少5個核苷酸長。在其他實施例中,一或多個結合區段中之各者為至少6個核苷酸長。在其他實施例中,一或多個結合區段中之各者為至少7個核苷酸長。在其他實施例中,一或多個結合區段中之各者為至少8個核苷酸長。在其他實施例中,一或多個結合區段中之各者為至少9個核苷酸長。在其他實施例中,一或多個結合區段中之各者為至少10個核苷酸長。在其他實施例中,一或多個結合區段中之各者為3個核苷酸長。在其他實施例中,一或多個結合區段中之各者為4個核苷酸長。在其他實施例中,一或多個結合區段中之各者為5個核苷酸長。在其他實施例中,一或多個結合區段中之各者為6個核苷酸長。在其他實施例中,一或多個結合區段中之各者為7個核苷酸長。在其他實施例中,一或多個結合區段中之各者為8個核苷酸長。在其他實施例中,一或多個結合區段中之各者為9個核苷酸長。在其他實施例中,一或多個結合區段中之各者為10個核苷酸長。
(d)
經修飾之 sgRNA 之內部錨 / 供體 DNA 之結合區段之序列
在一些實施例中,經修飾之sgRNA之內部錨中之各者包含為宿主基因體中不常見模體之序列。在特定實施例中,在一些實施例中,經修飾之sgRNA之內部錨中之各者包含為人類基因體中不常見模體之序列。作為非限制性實例,在一些實施例中,經修飾之sgRNA之內部錨中之各者包含來自表1之序列。在另一實施例中,經修飾之sgRNA之內部錨中之各者包含來自表2之序列。在一些實施例中,供體DNA之結合區段經由華生-克里克相互作用與經修飾之sgRNA的內部錨結合。因此,在一些實施例中,供體DNA之結合區段中之各者包含與表1之序列反向互補的序列。在其他實施例中,供體DNA之結合區段中之各者包含與表2之序列反向互補的序列。
在一些實施例中,供體DNA之結合區段中之各者包含為宿主基因體中之不常見模體的序列。在特定實施例中,在一些實施例中,供體DNA之結合區段中之各者包含為人類基因體中不常見模體之序列。作為非限制性實例,在一些實施例中,供體DNA之結合區段中之各者包含來自表3之序列。在另一實施例中,供體DNA之結合區段中之各者包含來自表4之序列。在一些實施例中,供體DNA之結合區段經由華生-克里克相互作用與經修飾之sgRNA的內部錨結合。因此,在一些實施例中,經修飾之sgRNA之內部錨中之各者包含與表3之序列反向互補的序列。在一些實施例中,經修飾之sgRNA之內部錨中之各者包含與表4之序列反向互補的序列。
表 1 經修飾之 sgRNA 之內部錨之例示性序列 (5 個核苷酸長 )
表 2 經修飾之 sgRNA 之內部錨之例示性序列 (6 個核苷酸長 )
表 2( 續 )
表2(續)
表2(續)
表2(續)
表2(續)
表 3 供體 DNA 之結合區段之例示性序列 (5 個核苷酸長 )
表4 供體DNA之結合區段之例示性序列(6個核苷酸長)
(e) 供體 DNA 上一或多個結合區段之間的連接子
SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 |
1 | CCCAG | 101 | CAGAC | 201 | CGUCC | 301 | GCCCA | 401 | CCGUC |
2 | UCCCA | 102 | CUUGC | 202 | ACGUC | 302 | ACUCC | 402 | CGUGC |
3 | CAGAG | 103 | CUGAC | 203 | CCGAA | 303 | AAGGG | 403 | ACCCG |
4 | CCAGG | 104 | AACCC | 204 | AUCCG | 304 | GGUGA | 404 | CGCAG |
5 | AGGAG | 105 | AGACC | 205 | ACGGC | 305 | CACUC | 405 | AAGCG |
6 | CAGGA | 106 | AGCCC | 206 | AUGCG | 306 | AGAGC | 406 | CACGA |
7 | CCUCC | 107 | ACCCU | 207 | UCGCA | 307 | GUGGA | 407 | CCCGA |
8 | CUCAG | 108 | ACACC | 208 | CGAGC | 308 | AUGGG | 408 | CUCGA |
9 | CCAGC | 109 | CAAGC | 209 | CGCAA | 309 | GCACA | 409 | ACGGA |
10 | AGGCA | 110 | CCAAC | 210 | AACGC | 310 | CCCUC | 410 | GCGGA |
11 | CUGCA | 111 | GACCA | 211 | AACCG | 311 | ACCAG | 411 | CGCUC |
12 | CAGCC | 112 | CAGUC | 212 | CGAAC | 312 | ACCAC | 412 | ACGAG |
13 | CACAG | 113 | AGGGC | 213 | GACGA | 313 | GGGCA | 413 | CCGCA |
14 | CAGCA | 114 | AGGAC | 214 | ACCGA | 314 | GCCAC | 414 | CUCGC |
15 | CACUG | 115 | GGUCA | 215 | UCCGA | 315 | AGGCC | 415 | AUCGC |
16 | CUCCA | 116 | GCUCC | 216 | CGUAG | 316 | GAGCA | 416 | ACGCA |
17 | CUCCC | 117 | AGGUC | 217 | GCGAA | 317 | ACUGG | 417 | ACUCG |
18 | CAGGC | 118 | GGCAC | 218 | ACCGG | 318 | CAUGC | 418 | CGAAG |
19 | AGCCU | 119 | CAACC | 219 | GACGC | 319 | ACAGC | 419 | GGCGA |
20 | CACAC | 120 | AGUCC | 220 | AGUCG | 320 | GUGCA | 420 | ACCGU |
21 | CCUCA | 121 | GACAC | 221 | CCGUA | 321 | GCCAA | 421 | AGCGG |
22 | AGCCA | 122 | CCUAG | 222 | CCGAC | 322 | CACCC | 422 | AACGG |
23 | CUGGA | 123 | GGAAC | 223 | GCGAC | 323 | AGCAC | 423 | CGGCA |
24 | GGAGA | 124 | GUCCA | 224 | CGGUC | 324 | AUCCC | 424 | CAACG |
25 | CUUCC | 125 | GUCAC | 225 | CGACC | 325 | AAGGC | 425 | CGGAA |
26 | AGCUG | 126 | GCAAC | 226 | CGGAC | 326 | AGCUC | 426 | CGCAC |
27 | CACCA | 127 | GACUC | 227 | ACGAC | 327 | GGCAA | 427 | ACGCU |
28 | GAGGC | 128 | GAACC | 228 | AUCGG | 328 | GAGCC | 428 | AGCGC |
29 | AGAGG | 129 | GGGAC | 229 | CGGUA | 329 | AGUGC | 429 | ACCGC |
30 | AGCAG | 130 | GCACC | 230 | CGCUA | 330 | AUGCC | 430 | GCGCA |
31 | CUCUC | 131 | GGCUA | 231 | GCGUA | 331 | GCAGC | 431 | CGAUC |
32 | CUGCC | 132 | GAUGC | 232 | GUCGA | 332 | GAAGC | 432 | CGUUC |
33 | ACAGG | 133 | CCCUA | 233 | CGUAC | 333 | AUGGC | 433 | CGUCA |
34 | AGGGA | 134 | CUACC | 234 | CGCGA | 334 | AAGCC | 434 | CCGGA |
35 | CCUGA | 135 | GAUCC | 235 | ACGCG | 335 | CAUCC | 435 | CGACA |
36 | CCACA | 136 | GCUAC | 236 | CGACG | 336 | GGACA | 436 | CAUCG |
37 | CCACC | 137 | GCCUA | 237 | CCCAG | 337 | CAGAC | 437 | CGUCC |
38 | GAGGA | 138 | CCUAC | 238 | UCCCA | 338 | CUUGC | 438 | ACGUC |
39 | GGGAA | 139 | GACCC | 239 | CAGAG | 339 | CUGAC | 439 | CCGAA |
40 | GCAGA | 140 | GGGUA | 240 | CCAGG | 340 | AACCC | 440 | AUCCG |
41 | CCAGA | 141 | CUAGC | 241 | AGGAG | 341 | AGACC | 441 | ACGGC |
42 | AGGUG | 142 | GGACC | 242 | CAGGA | 342 | AGCCC | 442 | AUGCG |
43 | CUCAC | 143 | GGUAC | 243 | CCUCC | 343 | ACCCU | 443 | UCGCA |
44 | UGCCA | 144 | AGGCG | 244 | CUCAG | 344 | ACACC | 444 | CGAGC |
45 | CAGGG | 145 | CCGAG | 245 | CCAGC | 345 | CAAGC | 445 | CGCAA |
46 | CCUUC | 146 | CACGC | 246 | AGGCA | 346 | CCAAC | 446 | AACGC |
47 | AGUGG | 147 | CGAGA | 247 | CUGCA | 347 | GACCA | 447 | AACCG |
48 | CCCAA | 148 | CGGGA | 248 | CAGCC | 348 | CAGUC | 448 | CGAAC |
49 | GCUGA | 149 | CGUGA | 249 | CACAG | 349 | AGGGC | 449 | GACGA |
50 | CAUGG | 150 | CCACG | 250 | CAGCA | 350 | AGGAC | 450 | ACCGA |
51 | CCUGC | 151 | ACGUG | 251 | CACUG | 351 | GGUCA | 451 | UCCGA |
52 | ACCUG | 152 | CCUCG | 252 | CUCCA | 352 | GCUCC | 452 | CGUAG |
53 | CUGGC | 153 | AGACG | 253 | CUCCC | 353 | AGGUC | 453 | GCGAA |
54 | GAGAC | 154 | CGCCA | 254 | CAGGC | 354 | GGCAC | 454 | ACCGG |
55 | CUGUC | 155 | CGGAG | 255 | AGCCU | 355 | CAACC | 455 | GACGC |
56 | CCAAG | 156 | AGCCG | 256 | CACAC | 356 | AGUCC | 456 | AGUCG |
57 | GCUCA | 157 | ACGCC | 257 | CCUCA | 357 | GACAC | 457 | CCGUA |
58 | ACCCA | 158 | CACGG | 258 | AGCCA | 358 | CCUAG | 458 | CCGAC |
59 | ACUGC | 159 | CACCG | 259 | CUGGA | 359 | GGAAC | 459 | GCGAC |
60 | ACCUC | 160 | ACACG | 260 | GGAGA | 360 | GUCCA | 460 | CGGUC |
61 | GGCCA | 161 | ACGGG | 261 | CUUCC | 361 | GUCAC | 461 | CGACC |
62 | CCCAC | 162 | GCCGA | 262 | AGCUG | 362 | GCAAC | 462 | CGGAC |
63 | CCAUC | 163 | AGCGA | 263 | CACCA | 363 | GACUC | 463 | ACGAC |
64 | CAAGG | 164 | CAGCG | 264 | GAGGC | 364 | GAACC | 464 | AUCGG |
65 | GCCCA | 165 | CCGUC | 265 | AGAGG | 365 | GGGAC | 465 | CGGUA |
66 | ACUCC | 166 | CGUGC | 266 | AGCAG | 366 | GCACC | 466 | CGCUA |
67 | AAGGG | 167 | ACCCG | 267 | CUCUC | 367 | GGCUA | 467 | GCGUA |
68 | GGUGA | 168 | CGCAG | 268 | CUGCC | 368 | GAUGC | 468 | GUCGA |
69 | CACUC | 169 | AAGCG | 269 | ACAGG | 369 | CCCUA | 469 | CGUAC |
70 | AGAGC | 170 | CACGA | 270 | AGGGA | 370 | CUACC | 470 | CGCGA |
71 | GUGGA | 171 | CCCGA | 271 | CCUGA | 371 | GAUCC | 471 | ACGCG |
72 | AUGGG | 172 | CUCGA | 272 | CCACA | 372 | GCUAC | 472 | CGACG |
73 | GCACA | 173 | ACGGA | 273 | CCACC | 373 | GCCUA | ||
74 | CCCUC | 174 | GCGGA | 274 | GAGGA | 374 | CCUAC | ||
75 | ACCAG | 175 | CGCUC | 275 | GGGAA | 375 | GACCC | ||
76 | ACCAC | 176 | ACGAG | 276 | GCAGA | 376 | GGGUA | ||
77 | GGGCA | 177 | CCGCA | 277 | CCAGA | 377 | CUAGC | ||
78 | GCCAC | 178 | CUCGC | 278 | AGGUG | 378 | GGACC | ||
79 | AGGCC | 179 | AUCGC | 279 | CUCAC | 379 | GGUAC | ||
80 | GAGCA | 180 | ACGCA | 280 | UGCCA | 380 | AGGCG | ||
81 | ACUGG | 181 | ACUCG | 281 | CAGGG | 381 | CCGAG | ||
82 | CAUGC | 182 | CGAAG | 282 | CCUUC | 382 | CACGC | ||
83 | ACAGC | 183 | GGCGA | 283 | AGUGG | 383 | CGAGA | ||
84 | GUGCA | 184 | ACCGU | 284 | CCCAA | 384 | CGGGA | ||
85 | GCCAA | 185 | AGCGG | 285 | GCUGA | 385 | CGUGA | ||
86 | CACCC | 186 | AACGG | 286 | CAUGG | 386 | CCACG | ||
87 | AGCAC | 187 | CGGCA | 287 | CCUGC | 387 | ACGUG | ||
88 | AUCCC | 188 | CAACG | 288 | ACCUG | 388 | CCUCG | ||
89 | AAGGC | 189 | CGGAA | 289 | CUGGC | 389 | AGACG | ||
90 | AGCUC | 190 | CGCAC | 290 | GAGAC | 390 | CGCCA | ||
91 | GGCAA | 191 | ACGCU | 291 | CUGUC | 391 | CGGAG | ||
92 | GAGCC | 192 | AGCGC | 292 | CCAAG | 392 | AGCCG | ||
93 | AGUGC | 193 | ACCGC | 293 | GCUCA | 393 | ACGCC | ||
94 | AUGCC | 194 | GCGCA | 294 | ACCCA | 394 | CACGG | ||
95 | GCAGC | 195 | CGAUC | 295 | ACUGC | 395 | CACCG | ||
96 | GAAGC | 196 | CGUUC | 296 | ACCUC | 396 | ACACG | ||
97 | AUGGC | 197 | CGUCA | 297 | GGCCA | 397 | ACGGG | ||
98 | AAGCC | 198 | CCGGA | 298 | CCCAC | 398 | GCCGA | ||
99 | CAUCC | 199 | CGACA | 299 | CCAUC | 399 | AGCGA | ||
100 | GGACA | 200 | CAUCG | 300 | CAAGG | 400 | CAGCG |
SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 |
473 | AGGCUG | 573 | AAGCAG | 673 | CAAGUG | 773 | CAUCCA | 873 | GCCUGA |
474 | CACACA | 574 | CUUCCC | 674 | GGAAAC | 774 | ACUGGG | 874 | GCCAGA |
475 | CCUCCC | 575 | CCUUUC | 675 | AGGACA | 775 | CACUCA | 875 | GACCUC |
476 | CAGGAG | 576 | AAUCCC | 676 | CAGCUC | 776 | AUCCAG | 876 | AGGAAC |
477 | CUGGGA | 577 | AGAGCA | 677 | CAAGGA | 777 | CUGUUC | 877 | CAUGGC |
478 | CCCAGC | 578 | GCAGGA | 678 | GAAACC | 778 | AUCUCC | 878 | ACCUUG |
479 | ACACAC | 579 | GCAGAA | 679 | AUGGCA | 779 | CCUGUC | 879 | GAGUGC |
480 | CUCCCA | 580 | UCCUCA | 680 | CCUUCA | 780 | CUACAG | 880 | AACUGC |
481 | CCCAGG | 581 | CCCACC | 681 | AGCUCA | 781 | AGUGGG | 881 | ACAUGC |
482 | AGGCAG | 582 | CUCUUC | 682 | CUGUCA | 782 | GGUUCA | 882 | ACCCAA |
483 | ACAGAG | 583 | CCUCCA | 683 | CAUGAG | 783 | ACUUCC | 883 | GGAUCA |
484 | AGAGAG | 584 | CAGCCA | 684 | CACACC | 784 | AGCAUG | 884 | ACCACC |
485 | CCAGGC | 585 | AAGGGA | 685 | CUCCAA | 785 | AGGGCA | 885 | AAGACC |
486 | GCCUCC | 586 | CUCACA | 686 | GACACA | 786 | UAGCCA | 886 | CAAACC |
487 | CCAGCC | 587 | AAGGCA | 687 | ACCUGG | 787 | CUGACC | 887 | GGGUGA |
488 | AGGAAG | 588 | AGAGAC | 688 | CACUGA | 788 | GAGACC | 888 | GGCUAA |
489 | AGGAGA | 589 | CAGGGA | 689 | AAGUGG | 789 | UGGACA | 889 | ACCAGG |
490 | CCUCAG | 590 | CAGCAC | 690 | CAAGAG | 790 | AAGGCU | 890 | AGGGUG |
491 | GAGAGA | 591 | ACAGCA | 691 | AUGUGG | 791 | CACUUC | 891 | CAGUUC |
492 | AGCCUG | 592 | ACAUGG | 692 | AGGAUG | 792 | AAUGGC | 892 | GAGAUC |
493 | GGAGAA | 593 | CUGGCC | 693 | ACCUCC | 793 | CAUCAG | 893 | GAAGAC |
494 | CAGAGA | 594 | UCACCA | 694 | GAUGGA | 794 | CACUGG | 894 | ACAGCC |
495 | ACUGCA | 595 | ACAGUG | 695 | AGAGGG | 795 | CUGAGC | 895 | AUCACC |
496 | CUCAGC | 596 | AAGAGG | 696 | CCACCC | 796 | AUCCUC | 896 | CAAGGC |
497 | AGACAG | 597 | CACCCA | 697 | CCAGGG | 797 | CAGGCC | 897 | ACCAUC |
498 | CACUGC | 598 | CUCUGA | 698 | CAUGGA | 798 | AACAGG | 898 | AAUGCC |
499 | AGGAGG | 599 | GGGAGA | 699 | ACCUCU | 799 | CAGAAC | 899 | ACCUGC |
500 | CCCAAA | 600 | AGACCA | 700 | GUGGGA | 800 | AUCUGC | 900 | GAAGGC |
501 | CUGAGA | 601 | AGCCAC | 701 | GUGGCA | 801 | ACUUGG | 901 | AACCAC |
502 | CUCCAG | 602 | AGCACU | 702 | CAUUCC | 802 | CAAGAC | 902 | GCUCCA |
503 | CAGGCA | 603 | ACCACA | 703 | ACUGAG | 803 | CUUGGA | 903 | AACCCU |
504 | AGCUGG | 604 | CACAUG | 704 | AGUGGC | 804 | AGCUAC | 904 | CAUUGC |
505 | AGUGAG | 605 | CUCCUC | 705 | AGCACA | 805 | AGCUUC | 905 | CUGUCC |
506 | CACAGA | 606 | CAGAGC | 706 | CCAUCA | 806 | GCAACA | 906 | GGAUGA |
507 | UCAGGA | 607 | CAGCAA | 707 | AUGCAG | 807 | ACACCU | 907 | GUUGCA |
508 | CAGGAA | 608 | AAGCCA | 708 | AAGUGC | 808 | ACCUGA | 908 | CAUGGG |
509 | CCACCA | 609 | CCCAGA | 709 | CAAAGC | 809 | GAGCAA | 909 | GCUCAA |
510 | CCUGCC | 610 | CCACAG | 710 | CUUUGC | 810 | GCCAAA | 910 | CAACUC |
511 | CAGUGA | 611 | CUGAAG | 711 | GGUGGA | 811 | GAAAGC | 911 | GCAGGC |
512 | CUGGGC | 612 | CAGCUA | 712 | GUGGAA | 812 | CACCAA | 912 | GGAGCA |
513 | CCUGGC | 613 | GCUCAC | 713 | AGAGCU | 813 | CCCUGA | 913 | ACCAAG |
514 | UCCCAA | 614 | CUCUCC | 714 | CAACAG | 814 | AACUGG | 914 | CUACUC |
515 | CCAGGA | 615 | AGGCAU | 715 | CCCACA | 815 | CCAUCC | 915 | AGCUUG |
516 | CAGAAG | 616 | ACCUCA | 716 | GGUGAA | 816 | CUUGCA | 916 | AUGAGC |
517 | CCAAAG | 617 | CCCUCC | 717 | ACUGCU | 817 | CAGGGC | 917 | AGAGCC |
518 | CCAGCA | 618 | CCUGGA | 718 | AGUCUC | 818 | GGAACA | 918 | AGGACU |
519 | GAGGCA | 619 | ACCAUG | 719 | GGCAAA | 819 | CUUCAC | 919 | ACUCAC |
520 | AUCCCA | 620 | CAGACA | 720 | CCUGCA | 820 | ACCACU | 920 | CAUCCC |
521 | AGCCUC | 621 | CCUCUC | 721 | AGGUUG | 821 | CUGACA | 921 | AAGGAC |
522 | CAGUGG | 622 | UCCAGA | 722 | GCUGCA | 822 | GCAGCC | 922 | GUUCCA |
523 | GGCUCA | 623 | AGCUGA | 723 | UGAGCA | 823 | CCAUGA | 923 | GGAGAC |
524 | GACAGA | 624 | CAAAGG | 724 | AGUGGA | 824 | AAGGUG | 924 | GCUGCC |
525 | UGGGAA | 625 | AUGGAG | 725 | AGACUG | 825 | CACCAG | 925 | AGUCCC |
526 | GGAAGA | 626 | AGAGUG | 726 | AGCCCA | 826 | ACAGAC | 926 | GGGACA |
527 | AGGGAA | 627 | GUGAGA | 727 | AACCUC | 827 | GUGACA | 927 | UGACCA |
528 | GGGAAA | 628 | AGGCCA | 728 | AUGCCA | 828 | GCUUCC | 928 | CCACUC |
529 | CUGGAA | 629 | CUGCAC | 729 | CAAGCA | 829 | GAACUC | 929 | GUCACA |
530 | UCUCCA | 630 | ACUCCU | 730 | AACCCA | 830 | AGACUC | 930 | CAUGUC |
531 | GAGGAA | 631 | AAACCC | 731 | GCAGCA | 831 | AGUCAG | 931 | AUGUCC |
532 | CACCUG | 632 | AAAGGG | 732 | ACAGGG | 832 | AAGAGC | 932 | AAGCAC |
533 | GAAGGA | 633 | UCAGCA | 733 | CUCCAC | 833 | CCCUCA | 933 | CAACAC |
534 | ACACAG | 634 | CCAGAG | 734 | GAGUGA | 834 | CACAUC | 934 | GAAGCC |
535 | GGCUGA | 635 | CCAACA | 735 | AGCAGC | 835 | GCCACA | 935 | UACCCA |
536 | GCCUCA | 636 | AGCCAA | 736 | CCCAAG | 836 | AAGCCU | 936 | GCACCA |
537 | AGAGGA | 637 | GAGGGA | 737 | GCUGAA | 837 | AGUAGC | 937 | AGAUGC |
538 | GAGACA | 638 | GAAGCA | 738 | CUUGGC | 838 | AGUCUG | 938 | ACACUC |
539 | GCUGGA | 639 | CAGAUG | 739 | AAUGGG | 839 | CUGGUC | 939 | CAGUGC |
540 | CUUUCC | 640 | GAGGCC | 740 | CCUGAC | 840 | GGGCAA | 940 | CUCCUA |
541 | CUGCAA | 641 | ACUGUG | 741 | CCACAA | 841 | AUGUGC | 941 | AGAGUC |
542 | CUUCUC | 642 | CAUGCC | 742 | GGCCAA | 842 | GAUCAC | 942 | ACCCAC |
543 | CCUGAG | 643 | CCUGAA | 743 | ACACCA | 843 | CCUCAC | 943 | AAGCUC |
544 | CCUGUA | 644 | CCAAGA | 744 | CUGGCA | 844 | GCAUGA | 944 | GUCAGA |
545 | CAGAGG | 645 | CUCUCA | 745 | GUGUGA | 845 | CCUUGA | 945 | ACUCUC |
546 | AGAUGG | 646 | UGCACA | 746 | UGGCAA | 846 | UGCCAA | 946 | GCACAC |
547 | AUGGUG | 647 | AUGCUG | 747 | AGCCAU | 847 | CCAUGC | 947 | AGACCU |
548 | CACCAC | 648 | CCUCAA | 748 | CCAAGG | 848 | AACCAG | 948 | CAGGUA |
549 | ACUCCA | 649 | AACUCC | 749 | ACCAGC | 849 | GCUUCA | 949 | ACCUUC |
550 | ACCCAG | 650 | CUGCCA | 750 | AUCCUG | 850 | ACAAGG | 950 | CUUGCC |
551 | UGCCCA | 651 | CACUCC | 751 | CAUCAC | 851 | GUGCCA | 951 | CUGCAG |
552 | AGAAGG | 652 | AGGUGA | 752 | CCCUGC | 852 | CUCAUC | 952 | GAACCA |
553 | CUUCCA | 653 | CACAGG | 753 | AUGAGG | 853 | CUCACC | 953 | UAGGCA |
554 | AGCCAG | 654 | AGCAAG | 754 | CAGCCC | 854 | AGGCAC | 954 | AGUCCA |
555 | CCUUCC | 655 | AAGCUG | 755 | CAUGCA | 855 | AGCUGC | 955 | CUAGGA |
556 | GGAGGA | 656 | ACAGGA | 756 | GGCACA | 856 | AGCUCC | 956 | CAACCA |
557 | AGGGAG | 657 | CACCUC | 757 | AGAGGC | 857 | GCUUGA | 957 | AGUUCC |
558 | CUGUGA | 658 | AGCAGG | 758 | CCCUUC | 858 | AUUCCC | 958 | AGUCAC |
559 | ACUCUG | 659 | AGGUCA | 759 | AGUGUG | 859 | AACAGC | 959 | AGGCUC |
560 | CAGCAG | 660 | GCCACC | 760 | AACCUG | 860 | CCAAAC | 960 | GAAGUC |
561 | CCAGAA | 661 | AGUGCA | 761 | AGACAC | 861 | GAGAAC | 961 | GAGCCC |
562 | GGCAGA | 662 | AGAAGC | 762 | AAAGGC | 862 | AGCCCU | 962 | AUCAGG |
563 | CUCAGA | 663 | AGGCAA | 763 | CCACAC | 863 | CAGUCA | 963 | AGCAUC |
564 | UCUGCA | 664 | ACACUG | 764 | GCAAGA | 864 | AGGAGC | 964 | UGGCCA |
565 | GUCUCA | 665 | CCAUUC | 765 | CCCAUC | 865 | AUCUGG | 965 | CAGGAC |
566 | CUCUGC | 666 | CACAGC | 766 | CUGUGC | 866 | CAAUGG | 966 | GGUGCA |
567 | AAGGAG | 667 | CUGCCC | 767 | ACCCUG | 867 | CACAAG | 967 | CCAGAC |
568 | GAGCCA | 668 | CUCAAG | 768 | AAAGCC | 868 | AGGGAU | 968 | AAGGCC |
569 | AGGUGG | 669 | ACUCAG | 769 | CUCUAC | 869 | GAAUGC | 969 | GUUGGA |
570 | CAUCUC | 670 | CUGCUC | 770 | ACAGGU | 870 | ACCAGA | 970 | GCAAAC |
571 | AGCAGA | 671 | UCCACA | 771 | ACUGGA | 871 | AUCCAC | 971 | CAACUG |
572 | ACAGGC | 672 | AUGGGA | 772 | ACAGCU | 872 | GUCCCA | 972 | CUGAAC |
SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 |
973 | GAGUCA | 1073 | GAUUGC | 1173 | CUACAC | 1273 | CACACG | 1373 | GAUCGC |
974 | AUGCAC | 1074 | AGUGCC | 1174 | CUAGAC | 1274 | CACCGC | 1374 | ACCCGC |
975 | GCACAA | 1075 | CAUGAC | 1175 | AUACCC | 1275 | UCCCGA | 1375 | CACGUG |
976 | CAAGGG | 1076 | GACCCA | 1176 | GACACC | 1276 | AGAUCG | 1376 | GCUAGC |
977 | CAGAUC | 1077 | GAGGAC | 1177 | CACUAC | 1277 | CACCCG | 1377 | ACACGC |
978 | CUGCUA | 1078 | CAGCUG | 1178 | AUAGGG | 1278 | CGUUUC | 1378 | AAGGCG |
979 | GCCAGC | 1079 | CCCUAA | 1179 | GGGACC | 1279 | ACCUCG | 1379 | CGGCUA |
980 | AGGUGC | 1080 | CAAUCC | 1180 | CUAAGC | 1280 | ACGUGG | 1380 | ACUGCG |
981 | CCAGUC | 1081 | GUGAAC | 1181 | CCCUAG | 1281 | ACGGUG | 1381 | ACGUCU |
982 | CUACCA | 1082 | CCAACC | 1182 | AUAGCC | 1282 | ACGGAG | 1382 | CAGCGA |
983 | AGUUGG | 1083 | ACUGAC | 1183 | CAUACC | 1283 | AAGCGA | 1383 | CACGUC |
984 | CCUUGC | 1084 | CAGGUC | 1184 | GCCUAA | 1284 | AAACGG | 1384 | ACGUUG |
985 | CUUGUC | 1085 | AGCCUA | 1185 | CCUUAC | 1285 | AGCGAG | 1385 | GCGACA |
986 | AGUGAC | 1086 | GAAUCC | 1186 | GGUCCA | 1286 | AGGCGC | 1386 | AUCCCG |
987 | GACUGA | 1087 | AGGGUC | 1187 | CUAUCC | 1287 | CAAGCG | 1387 | AGGGCG |
988 | AGGUUC | 1088 | GACAGC | 1188 | CCUAGC | 1288 | CUCGAA | 1388 | CCUCGC |
989 | GAACAC | 1089 | CUAGCA | 1189 | ACUAGG | 1289 | ACUCGG | 1389 | CGGAGA |
990 | GACUCA | 1090 | AGUAGG | 1190 | GACAAC | 1290 | ACCGUG | 1390 | CGCCAG |
991 | AUGCCC | 1091 | GAGGUA | 1191 | CAGUAC | 1291 | AGAGCG | 1391 | CCGUGA |
992 | CAGUAG | 1092 | AUGGAC | 1192 | CUAGCC | 1292 | AGCGAU | 1392 | ACGAGA |
993 | GUGCAA | 1093 | GCCCAA | 1193 | CCUAAC | 1293 | CCGCCA | 1393 | ACAGCG |
994 | UAGGGA | 1094 | AUUGGG | 1194 | GGUGUA | 1294 | CACGAG | 1394 | AGCACG |
995 | GGCCCA | 1095 | AUGGGC | 1195 | AGGUAC | 1295 | ACACGU | 1395 | AUCCGC |
996 | AGGGAC | 1096 | CAUAGG | 1196 | CGGGAG | 1296 | AUGGCG | 1396 | UCGCCA |
997 | GGACAA | 1097 | GUGGUA | 1197 | CACUAG | 1297 | AACGUG | 1397 | CUCGCC |
998 | AGGUAG | 1098 | CCUAAG | 1198 | GUCCAC | 1298 | CCCACG | 1398 | CCUUCG |
999 | ACUGCC | 1099 | GGGCAC | 1199 | GAUCCC | 1299 | CGUGAA | 1399 | CCACGA |
1000 | ACUGUC | 1100 | ACAACC | 1200 | AGGCGG | 1300 | ACACGG | 1400 | CAGCGC |
1001 | GGGCCA | 1101 | CUGUAC | 1201 | GGACCC | 1301 | ACGAGG | 1401 | CCCUCG |
1002 | AGAACC | 1102 | CCACUA | 1202 | CUACCC | 1302 | AACACG | 1402 | CCCGGA |
1003 | CCUAGA | 1103 | GGCACC | 1203 | CUCGGC | 1303 | GCGCCA | 1403 | CGAGAG |
1004 | AGCAAC | 1104 | AGCUAG | 1204 | CCUAUC | 1304 | ACGCCA | 1404 | GGCGAC |
1005 | ACUCCC | 1105 | GGGAAC | 1205 | CCAUAC | 1305 | UCACGA | 1405 | CCCGCA |
1006 | GAGAGC | 1106 | CUGAUC | 1206 | GGCCUA | 1306 | GGAUCC | 1406 | CACGAA |
1007 | GAUGCA | 1107 | GCAGAC | 1207 | CCCUAC | 1307 | GCGAGA | 1407 | AGACGA |
1008 | AGACCC | 1108 | AUGGUC | 1208 | CCAUGG | 1308 | AACCCG | 1408 | CGAAGA |
1009 | ACCCAU | 1109 | AUUGGC | 1209 | GGGUUA | 1309 | CAGCCG | 1409 | AGCCGC |
1010 | AAGUCC | 1110 | GGGUCA | 1210 | ACUACC | 1310 | ACGUGA | 1410 | CGGAAA |
1011 | AAGCCC | 1111 | CAACCC | 1211 | GUCCUA | 1311 | ACGCCC | 1411 | AUCGAG |
1012 | CCUCUA | 1112 | AGAUCC | 1212 | GCACUA | 1312 | GAGCGA | 1412 | CGCAGA |
1013 | GCCCAC | 1113 | CUUGAC | 1213 | GCUAAC | 1313 | CCACGG | 1413 | CGGAUC |
1014 | AACACC | 1114 | GGACUA | 1214 | GUACAC | 1314 | GACGGA | 1414 | CCGCAC |
1015 | AGGCCC | 1115 | CCUUAG | 1215 | GACCUA | 1315 | CGAUUC | 1415 | CGAAAC |
1016 | AUCAGC | 1116 | GCAGUA | 1216 | AGUACC | 1316 | ACGGGA | 1416 | AUCGCA |
1017 | GUCUGA | 1117 | CCCAUA | 1217 | CUAACC | 1317 | CGGCCA | 1417 | AAACCG |
1018 | ACUUGC | 1118 | GAGCUA | 1218 | GGUCUA | 1318 | GGCGCA | 1418 | GCACGC |
1019 | ACAUCC | 1119 | GAUGAC | 1219 | GGAUAC | 1319 | ACUCCG | 1419 | CAUUCG |
1020 | CUAGAG | 1120 | GGUUGA | 1220 | GCUUAC | 1320 | CACGCA | 1420 | CGUGUC |
1021 | CCAAGC | 1121 | GCUACA | 1221 | GGGCUA | 1321 | GGGCGA | 1421 | CGUUCA |
1022 | GAUUCC | 1122 | GCACCC | 1222 | GUCAAC | 1322 | AAUCGC | 1422 | AACGGA |
1023 | CUGGAC | 1123 | GGCUUA | 1223 | CGCCUC | 1323 | AAAGCG | 1423 | GCACGA |
1024 | GAUCCA | 1124 | GGGAUA | 1224 | CUAGUC | 1324 | CGGGAA | 1424 | ACGCAC |
1025 | GUGUCA | 1125 | GGUCAA | 1225 | GAUACC | 1325 | CGGUGA | 1425 | ACGAUG |
1026 | GAACCC | 1126 | AGGGUA | 1226 | GCCCUA | 1326 | CGUGGC | 1426 | AGGACG |
1027 | CAAGUC | 1127 | AUGACC | 1227 | GGUAAC | 1327 | CGCUGC | 1427 | AACGCA |
1028 | GCAUCA | 1128 | ACCUAG | 1228 | GAUAGC | 1328 | ACGAAG | 1428 | CGCUUC |
1029 | AUGCUC | 1129 | GUAGGA | 1229 | AGACGG | 1329 | ACGUGC | 1429 | CGUCCC |
1030 | GGCAAC | 1130 | GCUAGA | 1230 | GGCUAC | 1330 | CCAGCG | 1430 | AAGCGG |
1031 | GGAGCC | 1131 | CAUAGC | 1231 | CGUCUC | 1331 | AGUUCG | 1431 | AGGCGA |
1032 | ACAGUC | 1132 | GUCCAA | 1232 | ACUAGC | 1332 | CGCACC | 1432 | ACACGA |
1033 | GCUCCC | 1133 | AGUUGC | 1233 | GCAUAC | 1333 | CGUGGA | 1433 | ACGGCA |
1034 | GGUGAC | 1134 | GGUACA | 1234 | GGUUAC | 1334 | CGACAG | 1434 | CCUCGA |
1035 | CAUUGG | 1135 | GAGCAC | 1235 | GAGUAC | 1335 | CGGCAG | 1435 | ACGUCA |
1036 | GACUCC | 1136 | GCCAUA | 1236 | CGAGAC | 1336 | CCGCAG | 1436 | CCGCUC |
1037 | CUCAAC | 1137 | CCAUAG | 1237 | GUAGAC | 1337 | CGAGUA | 1437 | CAUGCG |
1038 | GCAACC | 1138 | CUUAGC | 1238 | AGGCCG | 1338 | GUUCGA | 1438 | AAGCCG |
1039 | AGUGUC | 1139 | GAUGCC | 1239 | GCCUAC | 1339 | AACGGG | 1439 | AACGAG |
1040 | CACAAC | 1140 | GCUCUA | 1240 | GCUACC | 1340 | CGUGCA | 1440 | CCGGCA |
1041 | AGCACC | 1141 | AGGACC | 1241 | CGCCCA | 1341 | ACGCUG | 1441 | AAGCGC |
1042 | ACUGGC | 1142 | CCCUUA | 1242 | GCGUGA | 1342 | CAGACG | 1442 | GAGCGC |
1043 | CCAGUA | 1143 | AUAGGC | 1243 | GAGCUC | 1343 | CCAACG | 1443 | AAACGC |
1044 | ACACCC | 1144 | CACGCC | 1244 | CCUAGG | 1344 | GCGGGA | 1444 | ACGUUC |
1045 | AAGGGU | 1145 | GGCAUA | 1245 | ACGCCU | 1345 | CAGCGG | 1445 | ACCGAG |
1046 | ACCCUC | 1146 | GCAUCC | 1246 | CCGAGG | 1346 | CGGAGC | 1446 | CGCUGA |
1047 | GAGGGC | 1147 | GUGCUA | 1247 | GGCGGA | 1347 | AGCGUG | 1447 | CCGAGC |
1048 | GGUAGA | 1148 | CCAAUC | 1248 | CGCCAC | 1348 | CGCUCC | 1448 | CCGUCC |
1049 | ACCAAC | 1149 | GACAUC | 1249 | GGGUAC | 1349 | CUGCGC | 1449 | CGCUCA |
1050 | AAGGGC | 1150 | CAGGCG | 1250 | CGUGAG | 1350 | AUCGUG | 1450 | GCGAAA |
1051 | AGGCUA | 1151 | GUAGCA | 1251 | ACCACG | 1351 | CCGUGC | 1451 | GCGGCA |
1052 | AUGGCC | 1152 | GGACCA | 1252 | GCAUGC | 1352 | CCUGCG | 1452 | CCGAAG |
1053 | ACCAGU | 1153 | GACUGC | 1253 | CCACCG | 1353 | ACCGCA | 1453 | AACGCU |
1054 | AGGAUC | 1154 | GGGUAA | 1254 | CCACGC | 1354 | ACGGAA | 1454 | ACACCG |
1055 | CCCAAC | 1155 | CUAGGC | 1255 | CCGAGA | 1355 | CACGGC | 1455 | AGCGGC |
1056 | AGGGCC | 1156 | GCAAGC | 1256 | CCCGAG | 1356 | AGCCCG | 1456 | CGAAAG |
1057 | CAAGCC | 1157 | AGGCCU | 1257 | CGGCUC | 1357 | CACGGG | 1457 | CUCGGA |
1058 | AAGGUC | 1158 | GGAGUA | 1258 | CCGGGA | 1358 | CACGGA | 1458 | CGUGUA |
1059 | GACCAA | 1159 | GACCAC | 1259 | UCGAGA | 1359 | CAACGA | 1459 | AGCGAA |
1060 | CCUACA | 1160 | GGAACC | 1260 | GUGCAC | 1360 | CACGUA | 1460 | CCAUCG |
1061 | AUUGCC | 1161 | ACCCUA | 1261 | CGAGGC | 1361 | AGCGGG | 1461 | CCCGAC |
1062 | CAGACC | 1162 | GAGUCC | 1262 | CCUCCG | 1362 | CGGAAG | 1462 | AGCGCC |
1063 | ACAAGC | 1163 | GCUGAC | 1263 | GGCCGA | 1363 | CGAGAA | 1463 | CGUUCC |
1064 | CAGUCC | 1164 | AGGUCC | 1264 | CGGGCA | 1364 | CGCACA | 1464 | AUGACG |
1065 | GGACAC | 1165 | CCUACC | 1265 | ACCCGG | 1365 | AGAACG | 1465 | CGAGCC |
1066 | GCCAAC | 1166 | GGUCAC | 1266 | AGCCGA | 1366 | CGCAGC | 1466 | CACUCG |
1067 | GCUGUA | 1167 | GCCUUA | 1267 | CUCCGC | 1367 | CAAACG | 1467 | CUGCGA |
1068 | CUGGUA | 1168 | GUACCA | 1268 | AUCUCG | 1368 | ACGCAG | 1468 | CUCGUC |
1069 | GGCCAC | 1169 | CUUACC | 1269 | CCCGUC | 1369 | AAGACG | 1469 | AAGCGU |
1070 | GAUGGC | 1170 | GACUAC | 1270 | CGUGCC | 1370 | GGUACC | 1470 | ACAACG |
1071 | CAAUGC | 1171 | CUAUGC | 1271 | AUCACG | 1371 | CCGGAG | 1471 | GCCGCA |
1072 | CACCUA | 1172 | ACCUAC | 1272 | AGCCGG | 1372 | CGAGGA | 1472 | AACUCG |
SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 |
1473 | CCGAAA | 1573 | GCCGAA | 1673 | AUCGGA | 1773 | CCCAGG | 1873 | CCCACC |
1474 | CGUCCA | 1574 | AUACGG | 1674 | CGUAAC | 1774 | AGGCAG | 1874 | CUCUUC |
1475 | CUCCGA | 1575 | CGAUCA | 1675 | CGAUAG | 1775 | ACAGAG | 1875 | CCUCCA |
1476 | ACGAUC | 1576 | CGCAAG | 1676 | GCCGAC | 1776 | AGAGAG | 1876 | CAGCCA |
1477 | ACGUCC | 1577 | GCGAGC | 1677 | CUCGAG | 1777 | CCAGGC | 1877 | AAGGGA |
1478 | ACCGGG | 1578 | AAGUCG | 1678 | ACCGAU | 1778 | GCCUCC | 1878 | CUCACA |
1479 | CACCGG | 1579 | CACGAC | 1679 | AUACCG | 1779 | CCAGCC | 1879 | AAGGCA |
1480 | CGGCAC | 1580 | CCGACA | 1680 | CUACGC | 1780 | AGGAAG | 1880 | AGAGAC |
1481 | AACGUC | 1581 | AACGCC | 1681 | AGUACG | 1781 | AGGAGA | 1881 | CAGGGA |
1482 | AGACGC | 1582 | ACGGUA | 1682 | GUCGAA | 1782 | CCUCAG | 1882 | CAGCAC |
1483 | CCGGAA | 1583 | UACGCA | 1683 | GGCGUA | 1783 | GAGAGA | 1883 | ACAGCA |
1484 | CGUCAG | 1584 | AGUCGG | 1684 | GCGGAC | 1784 | AGCCUG | 1884 | ACAUGG |
1485 | ACUUCG | 1585 | ACUACG | 1685 | UACCGA | 1785 | GGAGAA | 1885 | CUGGCC |
1486 | ACGGCU | 1586 | CGGUUC | 1686 | CCGCUA | 1786 | CAGAGA | 1886 | UCACCA |
1487 | CACCGA | 1587 | AUGCGC | 1687 | GGUCGA | 1787 | ACUGCA | 1887 | ACAGUG |
1488 | AGCGGA | 1588 | ACCGCG | 1688 | GCGAUA | 1788 | CUCAGC | 1888 | AAGAGG |
1489 | CGUGAC | 1589 | AAUCCG | 1689 | ACGACC | 1789 | AGACAG | 1889 | CACCCA |
1490 | CGCAAA | 1590 | GACGGC | 1690 | AGUCGC | 1790 | CACUGC | 1890 | CUCUGA |
1491 | AGGUCG | 1591 | ACCGUC | 1691 | GCGCGA | 1791 | AGGAGG | 1891 | GGGAGA |
1492 | CGAUGA | 1592 | CAGUCG | 1692 | CGUUAC | 1792 | CCCAAA | 1892 | AGACCA |
1493 | ACGUAG | 1593 | CGCCUA | 1693 | AUCGGC | 1793 | CUGAGA | 1893 | AGCCAC |
1494 | CGUCAC | 1594 | CGUCUA | 1694 | CGGAUA | 1794 | CUCCAG | 1894 | AGCACU |
1495 | CCCGAA | 1595 | ACGUAC | 1695 | GCGUAA | 1795 | CAGGCA | 1895 | ACCACA |
1496 | GAUCGA | 1596 | CGCAUC | 1696 | CGAACC | 1796 | AGCUGG | 1896 | CACAUG |
1497 | CGAGCA | 1597 | CGGUCA | 1697 | GCGUUA | 1797 | AGUGAG | 1897 | CUCCUC |
1498 | CGGUGC | 1598 | CGUACA | 1698 | GACGAC | 1798 | CACAGA | 1898 | CAGAGC |
1499 | AGCGCA | 1599 | CAACGG | 1699 | CGCUAC | 1799 | UCAGGA | 1899 | CAGCAA |
1500 | AUGCGG | 1600 | UGCGAA | 1700 | GCGACC | 1800 | CAGGAA | 1900 | AAGCCA |
1501 | CAUACG | 1601 | CGAUGC | 1701 | CGGUUA | 1801 | CCACCA | 1901 | CCCAGA |
1502 | CCGUCA | 1602 | AUGUCG | 1702 | CCGAAC | 1802 | CCUGCC | 1902 | CCACAG |
1503 | AGACCG | 1603 | CGACUC | 1703 | GUCGGA | 1803 | CAGUGA | 1903 | CUGAAG |
1504 | UCGUCA | 1604 | CCUACG | 1704 | GUCGCA | 1804 | CUGGGC | 1904 | CAGCUA |
1505 | ACGCAU | 1605 | GGACGA | 1705 | GCCGUA | 1805 | CCUGGC | 1905 | GCUCAC |
1506 | ACGGGC | 1606 | ACCGGC | 1706 | CCGGUA | 1806 | UCCCAA | 1906 | CUCUCC |
1507 | GGCGAA | 1607 | CGACAA | 1707 | CGUACC | 1807 | CCAGGA | 1907 | AGGCAU |
1508 | GAACGA | 1608 | UACGGA | 1708 | ACCGAC | 1808 | CAGAAG | 1908 | ACCUCA |
1509 | AGCUCG | 1609 | CCGGAC | 1709 | CCGAUC | 1809 | CCAAAG | 1909 | CCCUCC |
1510 | ACGACA | 1610 | AACGGC | 1710 | AUCGCG | 1810 | CCAGCA | 1910 | CCUGGA |
1511 | CCGCAA | 1611 | CGUCAA | 1711 | CGCUAG | 1811 | GAGGCA | 1911 | ACCAUG |
1512 | ACGGCC | 1612 | CGUAUC | 1712 | GUCCGA | 1812 | AUCCCA | 1912 | CAGACA |
1513 | GCGCAC | 1613 | AACCGC | 1713 | UCCGGA | 1813 | AGCCUC | 1913 | CCUCUC |
1514 | ACAUCG | 1614 | CAUCGG | 1714 | CCGAUA | 1814 | CAGUGG | 1914 | UCCAGA |
1515 | GCCGGA | 1615 | CGUUAG | 1715 | AUCGAC | 1815 | GGCUCA | 1915 | AGCUGA |
1516 | CAUCGC | 1616 | AUGCGA | 1716 | GCGGUA | 1816 | GACAGA | 1916 | CAAAGG |
1517 | UCCGCA | 1617 | GCGCAA | 1717 | GCGCUA | 1817 | UGGGAA | 1917 | AUGGAG |
1518 | CGGGAC | 1618 | AAUCGG | 1718 | CACGCG | 1818 | GGAAGA | 1918 | AGAGUG |
1519 | CAUCGA | 1619 | ACGAGC | 1719 | GUACGA | 1819 | AGGGAA | 1919 | GUGAGA |
1520 | ACCGCC | 1620 | AUCGUC | 1720 | UGCGCA | 1820 | GGGAAA | 1920 | AGGCCA |
1521 | AUUCCG | 1621 | CUCGAC | 1721 | GUCGUA | 1821 | CUGGAA | 1921 | CUGCAC |
1522 | CAUCCG | 1622 | AGUCCG | 1722 | CGACUA | 1822 | UCUCCA | 1922 | ACUCCU |
1523 | ACCCGU | 1623 | UCGCAA | 1723 | CCGUAC | 1823 | GAGGAA | 1923 | AAACCC |
1524 | CUUCGA | 1624 | GCGUCA | 1724 | CGAUAC | 1824 | CACCUG | 1924 | AAAGGG |
1525 | UCGGAA | 1625 | ACGACU | 1725 | CGGUAC | 1825 | GAAGGA | 1925 | UCAGCA |
1526 | ACGCAA | 1626 | AACCGG | 1726 | CGCACG | 1826 | ACACAG | 1926 | CCAGAG |
1527 | AUUGCG | 1627 | CGGUCC | 1727 | GCGAAC | 1827 | GGCUGA | 1927 | CCAACA |
1528 | ACGAGU | 1628 | CGGGUA | 1728 | CGCGCA | 1828 | GCCUCA | 1928 | AGCCAA |
1529 | GAACGC | 1629 | ACGGAC | 1729 | AGCGCG | 1829 | AGAGGA | 1929 | GAGGGA |
1530 | ACCCGA | 1630 | CGACCC | 1730 | ACGCGG | 1830 | GAGACA | 1930 | GAAGCA |
1531 | AUUCGG | 1631 | UCGACA | 1731 | ACGGCG | 1831 | GCUGGA | 1931 | CAGAUG |
1532 | UCGGCA | 1632 | CGACAC | 1732 | GACGUC | 1832 | CUUUCC | 1932 | GAGGCC |
1533 | AAUGCG | 1633 | ACGAAC | 1733 | CGAGCG | 1833 | CUGCAA | 1933 | ACUGUG |
1534 | CCGACC | 1634 | GCUCGA | 1734 | CGGACG | 1834 | CUUCUC | 1934 | CAUGCC |
1535 | CCGUUC | 1635 | CUACGA | 1735 | ACGCCG | 1835 | CCUGAG | 1935 | CCUGAA |
1536 | AUGCCG | 1636 | CCGGUC | 1736 | ACGCGC | 1836 | CCUGUA | 1936 | CCAAGA |
1537 | AUCGCC | 1637 | CGAAUC | 1737 | GCGUAC | 1837 | CAGAGG | 1937 | CUCUCA |
1538 | ACCGAA | 1638 | CAACGC | 1738 | CGCGAG | 1838 | AGAUGG | 1938 | UGCACA |
1539 | AACCGA | 1639 | AGCGAC | 1739 | CGCGGA | 1839 | AUGGUG | 1939 | AUGCUG |
1540 | UCCGAA | 1640 | CCGUAG | 1740 | CGCGUC | 1840 | CACCAC | 1940 | CCUCAA |
1541 | ACCGCU | 1641 | ACUCGC | 1741 | CGGCGA | 1841 | ACUCCA | 1941 | AACUCC |
1542 | CGUAAG | 1642 | AUCGGG | 1742 | CCGCGA | 1842 | ACCCAG | 1942 | CUGCCA |
1543 | ACUCGA | 1643 | CGGUAA | 1743 | CGCCGA | 1843 | UGCCCA | 1943 | CACUCC |
1544 | CGUUGA | 1644 | AACGAC | 1744 | ACCGGU | 1844 | AGAAGG | 1944 | AGGUGA |
1545 | AACCGU | 1645 | AGUCGA | 1745 | CCGACG | 1845 | CUUCCA | 1945 | CACAGG |
1546 | GCGUCC | 1646 | AUCCGG | 1746 | CCGUCG | 1846 | AGCCAG | 1946 | AGCAAG |
1547 | CUCGCA | 1647 | CCCGUA | 1747 | CGUCGC | 1847 | CCUUCC | 1947 | AAGCUG |
1548 | GCGGAA | 1648 | ACGCUA | 1748 | CGACGC | 1848 | GGAGGA | 1948 | ACAGGA |
1549 | CGGCAA | 1649 | CAACCG | 1749 | ACGACG | 1849 | AGGGAG | 1949 | CACCUC |
1550 | CGAAGC | 1650 | ACGGUC | 1750 | AACGCG | 1850 | CUGUGA | 1950 | AGCAGG |
1551 | GCCCGA | 1651 | GACGUA | 1751 | ACGUCG | 1851 | ACUCUG | 1951 | AGGUCA |
1552 | ACGCUC | 1652 | AUAGCG | 1752 | CGCGAC | 1852 | CAGCAG | 1952 | GCCACC |
1553 | AGCGUC | 1653 | CGACCA | 1753 | CGAACG | 1853 | CCAGAA | 1953 | AGUGCA |
1554 | GUGCGA | 1654 | CAAUCG | 1754 | CGACCG | 1854 | GGCAGA | 1954 | AGAAGC |
1555 | CGGACA | 1655 | CGGAAC | 1755 | ACGCGA | 1855 | CUCAGA | 1955 | AGGCAA |
1556 | AACGGU | 1656 | CGGUAG | 1756 | CGCGAA | 1856 | UCUGCA | 1956 | ACACUG |
1557 | CGAACA | 1657 | CUCGUA | 1757 | CGACGA | 1857 | GUCUCA | 1957 | CCAUUC |
1558 | ACGGAU | 1658 | AUCCGA | 1758 | GUCGAC | 1858 | CUCUGC | 1958 | CACAGC |
1559 | GACGCA | 1659 | GACCGA | 1759 | CGUCGA | 1859 | AAGGAG | 1959 | CUGCCC |
1560 | CUUCGC | 1660 | ACCGGA | 1760 | CGCGUA | 1860 | GAGCCA | 1960 | CUCAAG |
1561 | AGUGCG | 1661 | CGCAUA | 1761 | ACGCGU | 1861 | AGGUGG | 1961 | ACUCAG |
1562 | CCGUAA | 1662 | AUACGC | 1762 | UCGCGA | 1862 | CAUCUC | 1962 | CUGCUC |
1563 | CGGGUC | 1663 | AGCGUA | 1763 | CGAUCG | 1863 | AGCAGA | 1963 | UCCACA |
1564 | CGUAGA | 1664 | GACCGC | 1764 | CGUACG | 1864 | ACAGGC | 1964 | AUGGGA |
1565 | CGUUGC | 1665 | CGCUUA | 1765 | AGGCUG | 1865 | AAGCAG | 1965 | CAAGUG |
1566 | CGCCAA | 1666 | CGCUAA | 1766 | CACACA | 1866 | CUUCCC | 1966 | GGAAAC |
1567 | AGCGCU | 1667 | CCGUUA | 1767 | CCUCCC | 1867 | CCUUUC | 1967 | AGGACA |
1568 | GACGAA | 1668 | AUUCGC | 1768 | CAGGAG | 1868 | AAUCCC | 1968 | CAGCUC |
1569 | GACGCC | 1669 | CGUAGC | 1769 | CUGGGA | 1869 | AGAGCA | 1969 | CAAGGA |
1570 | CGAGUC | 1670 | UAGCGA | 1770 | CCCAGC | 1870 | GCAGGA | 1970 | GAAACC |
1571 | ACCGUA | 1671 | CGCAAC | 1771 | ACACAC | 1871 | GCAGAA | 1971 | AUGGCA |
1572 | CGAUCC | 1672 | CGGACC | 1772 | CUCCCA | 1872 | UCCUCA | 1972 | CCUUCA |
SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 |
1973 | AGCUCA | 2073 | AGUGGG | 2173 | ACAUGC | 2273 | CCAGUC | 2373 | GUGAAC |
1974 | CUGUCA | 2074 | GGUUCA | 2174 | ACCCAA | 2274 | CUACCA | 2374 | CCAACC |
1975 | CAUGAG | 2075 | ACUUCC | 2175 | GGAUCA | 2275 | AGUUGG | 2375 | ACUGAC |
1976 | CACACC | 2076 | AGCAUG | 2176 | ACCACC | 2276 | CCUUGC | 2376 | CAGGUC |
1977 | CUCCAA | 2077 | AGGGCA | 2177 | AAGACC | 2277 | CUUGUC | 2377 | AGCCUA |
1978 | GACACA | 2078 | UAGCCA | 2178 | CAAACC | 2278 | AGUGAC | 2378 | GAAUCC |
1979 | ACCUGG | 2079 | CUGACC | 2179 | GGGUGA | 2279 | GACUGA | 2379 | AGGGUC |
1980 | CACUGA | 2080 | GAGACC | 2180 | GGCUAA | 2280 | AGGUUC | 2380 | GACAGC |
1981 | AAGUGG | 2081 | UGGACA | 2181 | ACCAGG | 2281 | GAACAC | 2381 | CUAGCA |
1982 | CAAGAG | 2082 | AAGGCU | 2182 | AGGGUG | 2282 | GACUCA | 2382 | AGUAGG |
1983 | AUGUGG | 2083 | CACUUC | 2183 | CAGUUC | 2283 | AUGCCC | 2383 | GAGGUA |
1984 | AGGAUG | 2084 | AAUGGC | 2184 | GAGAUC | 2284 | CAGUAG | 2384 | AUGGAC |
1985 | ACCUCC | 2085 | CAUCAG | 2185 | GAAGAC | 2285 | GUGCAA | 2385 | GCCCAA |
1986 | GAUGGA | 2086 | CACUGG | 2186 | ACAGCC | 2286 | UAGGGA | 2386 | AUUGGG |
1987 | AGAGGG | 2087 | CUGAGC | 2187 | AUCACC | 2287 | GGCCCA | 2387 | AUGGGC |
1988 | CCACCC | 2088 | AUCCUC | 2188 | CAAGGC | 2288 | AGGGAC | 2388 | CAUAGG |
1989 | CCAGGG | 2089 | CAGGCC | 2189 | ACCAUC | 2289 | GGACAA | 2389 | GUGGUA |
1990 | CAUGGA | 2090 | AACAGG | 2190 | AAUGCC | 2290 | AGGUAG | 2390 | CCUAAG |
1991 | ACCUCU | 2091 | CAGAAC | 2191 | ACCUGC | 2291 | ACUGCC | 2391 | GGGCAC |
1992 | GUGGGA | 2092 | AUCUGC | 2192 | GAAGGC | 2292 | ACUGUC | 2392 | ACAACC |
1993 | GUGGCA | 2093 | ACUUGG | 2193 | AACCAC | 2293 | GGGCCA | 2393 | CUGUAC |
1994 | CAUUCC | 2094 | CAAGAC | 2194 | GCUCCA | 2294 | AGAACC | 2394 | CCACUA |
1995 | ACUGAG | 2095 | CUUGGA | 2195 | AACCCU | 2295 | CCUAGA | 2395 | GGCACC |
1996 | AGUGGC | 2096 | AGCUAC | 2196 | CAUUGC | 2296 | AGCAAC | 2396 | AGCUAG |
1997 | AGCACA | 2097 | AGCUUC | 2197 | CUGUCC | 2297 | ACUCCC | 2397 | GGGAAC |
1998 | CCAUCA | 2098 | GCAACA | 2198 | GGAUGA | 2298 | GAGAGC | 2398 | CUGAUC |
1999 | AUGCAG | 2099 | ACACCU | 2199 | GUUGCA | 2299 | GAUGCA | 2399 | GCAGAC |
2000 | AAGUGC | 2100 | ACCUGA | 2200 | CAUGGG | 2300 | AGACCC | 2400 | AUGGUC |
2001 | CAAAGC | 2101 | GAGCAA | 2201 | GCUCAA | 2301 | ACCCAU | 2401 | AUUGGC |
2002 | CUUUGC | 2102 | GCCAAA | 2202 | CAACUC | 2302 | AAGUCC | 2402 | GGGUCA |
2003 | GGUGGA | 2103 | GAAAGC | 2203 | GCAGGC | 2303 | AAGCCC | 2403 | CAACCC |
2004 | GUGGAA | 2104 | CACCAA | 2204 | GGAGCA | 2304 | CCUCUA | 2404 | AGAUCC |
2005 | AGAGCU | 2105 | CCCUGA | 2205 | ACCAAG | 2305 | GCCCAC | 2405 | CUUGAC |
2006 | CAACAG | 2106 | AACUGG | 2206 | CUACUC | 2306 | AACACC | 2406 | GGACUA |
2007 | CCCACA | 2107 | CCAUCC | 2207 | AGCUUG | 2307 | AGGCCC | 2407 | CCUUAG |
2008 | GGUGAA | 2108 | CUUGCA | 2208 | AUGAGC | 2308 | AUCAGC | 2408 | GCAGUA |
2009 | ACUGCU | 2109 | CAGGGC | 2209 | AGAGCC | 2309 | GUCUGA | 2409 | CCCAUA |
2010 | AGUCUC | 2110 | GGAACA | 2210 | AGGACU | 2310 | ACUUGC | 2410 | GAGCUA |
2011 | GGCAAA | 2111 | CUUCAC | 2211 | ACUCAC | 2311 | ACAUCC | 2411 | GAUGAC |
2012 | CCUGCA | 2112 | ACCACU | 2212 | CAUCCC | 2312 | CUAGAG | 2412 | GGUUGA |
2013 | AGGUUG | 2113 | CUGACA | 2213 | AAGGAC | 2313 | CCAAGC | 2413 | GCUACA |
2014 | GCUGCA | 2114 | GCAGCC | 2214 | GUUCCA | 2314 | GAUUCC | 2414 | GCACCC |
2015 | UGAGCA | 2115 | CCAUGA | 2215 | GGAGAC | 2315 | CUGGAC | 2415 | GGCUUA |
2016 | AGUGGA | 2116 | AAGGUG | 2216 | GCUGCC | 2316 | GAUCCA | 2416 | GGGAUA |
2017 | AGACUG | 2117 | CACCAG | 2217 | AGUCCC | 2317 | GUGUCA | 2417 | GGUCAA |
2018 | AGCCCA | 2118 | ACAGAC | 2218 | GGGACA | 2318 | GAACCC | 2418 | AGGGUA |
2019 | AACCUC | 2119 | GUGACA | 2219 | UGACCA | 2319 | CAAGUC | 2419 | AUGACC |
2020 | AUGCCA | 2120 | GCUUCC | 2220 | CCACUC | 2320 | GCAUCA | 2420 | ACCUAG |
2021 | CAAGCA | 2121 | GAACUC | 2221 | GUCACA | 2321 | AUGCUC | 2421 | GUAGGA |
2022 | AACCCA | 2122 | AGACUC | 2222 | CAUGUC | 2322 | GGCAAC | 2422 | GCUAGA |
2023 | GCAGCA | 2123 | AGUCAG | 2223 | AUGUCC | 2323 | GGAGCC | 2423 | CAUAGC |
2024 | ACAGGG | 2124 | AAGAGC | 2224 | AAGCAC | 2324 | ACAGUC | 2424 | GUCCAA |
2025 | CUCCAC | 2125 | CCCUCA | 2225 | CAACAC | 2325 | GCUCCC | 2425 | AGUUGC |
2026 | GAGUGA | 2126 | CACAUC | 2226 | GAAGCC | 2326 | GGUGAC | 2426 | GGUACA |
2027 | AGCAGC | 2127 | GCCACA | 2227 | UACCCA | 2327 | CAUUGG | 2427 | GAGCAC |
2028 | CCCAAG | 2128 | AAGCCU | 2228 | GCACCA | 2328 | GACUCC | 2428 | GCCAUA |
2029 | GCUGAA | 2129 | AGUAGC | 2229 | AGAUGC | 2329 | CUCAAC | 2429 | CCAUAG |
2030 | CUUGGC | 2130 | AGUCUG | 2230 | ACACUC | 2330 | GCAACC | 2430 | CUUAGC |
2031 | AAUGGG | 2131 | CUGGUC | 2231 | CAGUGC | 2331 | AGUGUC | 2431 | GAUGCC |
2032 | CCUGAC | 2132 | GGGCAA | 2232 | CUCCUA | 2332 | CACAAC | 2432 | GCUCUA |
2033 | CCACAA | 2133 | AUGUGC | 2233 | AGAGUC | 2333 | AGCACC | 2433 | AGGACC |
2034 | GGCCAA | 2134 | GAUCAC | 2234 | ACCCAC | 2334 | ACUGGC | 2434 | CCCUUA |
2035 | ACACCA | 2135 | CCUCAC | 2235 | AAGCUC | 2335 | CCAGUA | 2435 | AUAGGC |
2036 | CUGGCA | 2136 | GCAUGA | 2236 | GUCAGA | 2336 | ACACCC | 2436 | CACGCC |
2037 | GUGUGA | 2137 | CCUUGA | 2237 | ACUCUC | 2337 | AAGGGU | 2437 | GGCAUA |
2038 | UGGCAA | 2138 | UGCCAA | 2238 | GCACAC | 2338 | ACCCUC | 2438 | GCAUCC |
2039 | AGCCAU | 2139 | CCAUGC | 2239 | AGACCU | 2339 | GAGGGC | 2439 | GUGCUA |
2040 | CCAAGG | 2140 | AACCAG | 2240 | CAGGUA | 2340 | GGUAGA | 2440 | CCAAUC |
2041 | ACCAGC | 2141 | GCUUCA | 2241 | ACCUUC | 2341 | ACCAAC | 2441 | GACAUC |
2042 | AUCCUG | 2142 | ACAAGG | 2242 | CUUGCC | 2342 | AAGGGC | 2442 | CAGGCG |
2043 | CAUCAC | 2143 | GUGCCA | 2243 | CUGCAG | 2343 | AGGCUA | 2443 | GUAGCA |
2044 | CCCUGC | 2144 | CUCAUC | 2244 | GAACCA | 2344 | AUGGCC | 2444 | GGACCA |
2045 | AUGAGG | 2145 | CUCACC | 2245 | UAGGCA | 2345 | ACCAGU | 2445 | GACUGC |
2046 | CAGCCC | 2146 | AGGCAC | 2246 | AGUCCA | 2346 | AGGAUC | 2446 | GGGUAA |
2047 | CAUGCA | 2147 | AGCUGC | 2247 | CUAGGA | 2347 | CCCAAC | 2447 | CUAGGC |
2048 | GGCACA | 2148 | AGCUCC | 2248 | CAACCA | 2348 | AGGGCC | 2448 | GCAAGC |
2049 | AGAGGC | 2149 | GCUUGA | 2249 | AGUUCC | 2349 | CAAGCC | 2449 | AGGCCU |
2050 | CCCUUC | 2150 | AUUCCC | 2250 | AGUCAC | 2350 | AAGGUC | 2450 | GGAGUA |
2051 | AGUGUG | 2151 | AACAGC | 2251 | AGGCUC | 2351 | GACCAA | 2451 | GACCAC |
2052 | AACCUG | 2152 | CCAAAC | 2252 | GAAGUC | 2352 | CCUACA | 2452 | GGAACC |
2053 | AGACAC | 2153 | GAGAAC | 2253 | GAGCCC | 2353 | AUUGCC | 2453 | ACCCUA |
2054 | AAAGGC | 2154 | AGCCCU | 2254 | AUCAGG | 2354 | CAGACC | 2454 | GAGUCC |
2055 | CCACAC | 2155 | CAGUCA | 2255 | AGCAUC | 2355 | ACAAGC | 2455 | GCUGAC |
2056 | GCAAGA | 2156 | AGGAGC | 2256 | UGGCCA | 2356 | CAGUCC | 2456 | AGGUCC |
2057 | CCCAUC | 2157 | AUCUGG | 2257 | CAGGAC | 2357 | GGACAC | 2457 | CCUACC |
2058 | CUGUGC | 2158 | CAAUGG | 2258 | GGUGCA | 2358 | GCCAAC | 2458 | GGUCAC |
2059 | ACCCUG | 2159 | CACAAG | 2259 | CCAGAC | 2359 | GCUGUA | 2459 | GCCUUA |
2060 | AAAGCC | 2160 | AGGGAU | 2260 | AAGGCC | 2360 | CUGGUA | 2460 | GUACCA |
2061 | CUCUAC | 2161 | GAAUGC | 2261 | GUUGGA | 2361 | GGCCAC | 2461 | CUUACC |
2062 | ACAGGU | 2162 | ACCAGA | 2262 | GCAAAC | 2362 | GAUGGC | 2462 | GACUAC |
2063 | ACUGGA | 2163 | AUCCAC | 2263 | CAACUG | 2363 | CAAUGC | 2463 | CUAUGC |
2064 | ACAGCU | 2164 | GUCCCA | 2264 | CUGAAC | 2364 | CACCUA | 2464 | ACCUAC |
2065 | CAUCCA | 2165 | GCCUGA | 2265 | GAGUCA | 2365 | GAUUGC | 2465 | CUACAC |
2066 | ACUGGG | 2166 | GCCAGA | 2266 | AUGCAC | 2366 | AGUGCC | 2466 | CUAGAC |
2067 | CACUCA | 2167 | GACCUC | 2267 | GCACAA | 2367 | CAUGAC | 2467 | AUACCC |
2068 | AUCCAG | 2168 | AGGAAC | 2268 | CAAGGG | 2368 | GACCCA | 2468 | GACACC |
2069 | CUGUUC | 2169 | CAUGGC | 2269 | CAGAUC | 2369 | GAGGAC | 2469 | CACUAC |
2070 | AUCUCC | 2170 | ACCUUG | 2270 | CUGCUA | 2370 | CAGCUG | 2470 | AUAGGG |
2071 | CCUGUC | 2171 | GAGUGC | 2271 | GCCAGC | 2371 | CCCUAA | 2471 | GGGACC |
2072 | CUACAG | 2172 | AACUGC | 2272 | AGGUGC | 2372 | CAAUCC | 2472 | CUAAGC |
SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 |
2473 | CCCUAG | 2573 | ACGGUG | 2673 | ACGUCU | 2773 | AACGUC | 2873 | AACGCC |
2474 | AUAGCC | 2574 | ACGGAG | 2674 | CAGCGA | 2774 | AGACGC | 2874 | ACGGUA |
2475 | CAUACC | 2575 | AAGCGA | 2675 | CACGUC | 2775 | CCGGAA | 2875 | UACGCA |
2476 | GCCUAA | 2576 | AAACGG | 2676 | ACGUUG | 2776 | CGUCAG | 2876 | AGUCGG |
2477 | CCUUAC | 2577 | AGCGAG | 2677 | GCGACA | 2777 | ACUUCG | 2877 | ACUACG |
2478 | GGUCCA | 2578 | AGGCGC | 2678 | AUCCCG | 2778 | ACGGCU | 2878 | CGGUUC |
2479 | CUAUCC | 2579 | CAAGCG | 2679 | AGGGCG | 2779 | CACCGA | 2879 | AUGCGC |
2480 | CCUAGC | 2580 | CUCGAA | 2680 | CCUCGC | 2780 | AGCGGA | 2880 | ACCGCG |
2481 | ACUAGG | 2581 | ACUCGG | 2681 | CGGAGA | 2781 | CGUGAC | 2881 | AAUCCG |
2482 | GACAAC | 2582 | ACCGUG | 2682 | CGCCAG | 2782 | CGCAAA | 2882 | GACGGC |
2483 | CAGUAC | 2583 | AGAGCG | 2683 | CCGUGA | 2783 | AGGUCG | 2883 | ACCGUC |
2484 | CUAGCC | 2584 | AGCGAU | 2684 | ACGAGA | 2784 | CGAUGA | 2884 | CAGUCG |
2485 | CCUAAC | 2585 | CCGCCA | 2685 | ACAGCG | 2785 | ACGUAG | 2885 | CGCCUA |
2486 | GGUGUA | 2586 | CACGAG | 2686 | AGCACG | 2786 | CGUCAC | 2886 | CGUCUA |
2487 | AGGUAC | 2587 | ACACGU | 2687 | AUCCGC | 2787 | CCCGAA | 2887 | ACGUAC |
2488 | CGGGAG | 2588 | AUGGCG | 2688 | UCGCCA | 2788 | GAUCGA | 2888 | CGCAUC |
2489 | CACUAG | 2589 | AACGUG | 2689 | CUCGCC | 2789 | CGAGCA | 2889 | CGGUCA |
2490 | GUCCAC | 2590 | CCCACG | 2690 | CCUUCG | 2790 | CGGUGC | 2890 | CGUACA |
2491 | GAUCCC | 2591 | CGUGAA | 2691 | CCACGA | 2791 | AGCGCA | 2891 | CAACGG |
2492 | AGGCGG | 2592 | ACACGG | 2692 | CAGCGC | 2792 | AUGCGG | 2892 | UGCGAA |
2493 | GGACCC | 2593 | ACGAGG | 2693 | CCCUCG | 2793 | CAUACG | 2893 | CGAUGC |
2494 | CUACCC | 2594 | AACACG | 2694 | CCCGGA | 2794 | CCGUCA | 2894 | AUGUCG |
2495 | CUCGGC | 2595 | GCGCCA | 2695 | CGAGAG | 2795 | AGACCG | 2895 | CGACUC |
2496 | CCUAUC | 2596 | ACGCCA | 2696 | GGCGAC | 2796 | UCGUCA | 2896 | CCUACG |
2497 | CCAUAC | 2597 | UCACGA | 2697 | CCCGCA | 2797 | ACGCAU | 2897 | GGACGA |
2498 | GGCCUA | 2598 | GGAUCC | 2698 | CACGAA | 2798 | ACGGGC | 2898 | ACCGGC |
2499 | CCCUAC | 2599 | GCGAGA | 2699 | AGACGA | 2799 | GGCGAA | 2899 | CGACAA |
2500 | CCAUGG | 2600 | AACCCG | 2700 | CGAAGA | 2800 | GAACGA | 2900 | UACGGA |
2501 | GGGUUA | 2601 | CAGCCG | 2701 | AGCCGC | 2801 | AGCUCG | 2901 | CCGGAC |
2502 | ACUACC | 2602 | ACGUGA | 2702 | CGGAAA | 2802 | ACGACA | 2902 | AACGGC |
2503 | GUCCUA | 2603 | ACGCCC | 2703 | AUCGAG | 2803 | CCGCAA | 2903 | CGUCAA |
2504 | GCACUA | 2604 | GAGCGA | 2704 | CGCAGA | 2804 | ACGGCC | 2904 | CGUAUC |
2505 | GCUAAC | 2605 | CCACGG | 2705 | CGGAUC | 2805 | GCGCAC | 2905 | AACCGC |
2506 | GUACAC | 2606 | GACGGA | 2706 | CCGCAC | 2806 | ACAUCG | 2906 | CAUCGG |
2507 | GACCUA | 2607 | CGAUUC | 2707 | CGAAAC | 2807 | GCCGGA | 2907 | CGUUAG |
2508 | AGUACC | 2608 | ACGGGA | 2708 | AUCGCA | 2808 | CAUCGC | 2908 | AUGCGA |
2509 | CUAACC | 2609 | CGGCCA | 2709 | AAACCG | 2809 | UCCGCA | 2909 | GCGCAA |
2510 | GGUCUA | 2610 | GGCGCA | 2710 | GCACGC | 2810 | CGGGAC | 2910 | AAUCGG |
2511 | GGAUAC | 2611 | ACUCCG | 2711 | CAUUCG | 2811 | CAUCGA | 2911 | ACGAGC |
2512 | GCUUAC | 2612 | CACGCA | 2712 | CGUGUC | 2812 | ACCGCC | 2912 | AUCGUC |
2513 | GGGCUA | 2613 | GGGCGA | 2713 | CGUUCA | 2813 | AUUCCG | 2913 | CUCGAC |
2514 | GUCAAC | 2614 | AAUCGC | 2714 | AACGGA | 2814 | CAUCCG | 2914 | AGUCCG |
2515 | CGCCUC | 2615 | AAAGCG | 2715 | GCACGA | 2815 | ACCCGU | 2915 | UCGCAA |
2516 | CUAGUC | 2616 | CGGGAA | 2716 | ACGCAC | 2816 | CUUCGA | 2916 | GCGUCA |
2517 | GAUACC | 2617 | CGGUGA | 2717 | ACGAUG | 2817 | UCGGAA | 2917 | ACGACU |
2518 | GCCCUA | 2618 | CGUGGC | 2718 | AGGACG | 2818 | ACGCAA | 2918 | AACCGG |
2519 | GGUAAC | 2619 | CGCUGC | 2719 | AACGCA | 2819 | AUUGCG | 2919 | CGGUCC |
2520 | GAUAGC | 2620 | ACGAAG | 2720 | CGCUUC | 2820 | ACGAGU | 2920 | CGGGUA |
2521 | AGACGG | 2621 | ACGUGC | 2721 | CGUCCC | 2821 | GAACGC | 2921 | ACGGAC |
2522 | GGCUAC | 2622 | CCAGCG | 2722 | AAGCGG | 2822 | ACCCGA | 2922 | CGACCC |
2523 | CGUCUC | 2623 | AGUUCG | 2723 | AGGCGA | 2823 | AUUCGG | 2923 | UCGACA |
2524 | ACUAGC | 2624 | CGCACC | 2724 | ACACGA | 2824 | UCGGCA | 2924 | CGACAC |
2525 | GCAUAC | 2625 | CGUGGA | 2725 | ACGGCA | 2825 | AAUGCG | 2925 | ACGAAC |
2526 | GGUUAC | 2626 | CGACAG | 2726 | CCUCGA | 2826 | CCGACC | 2926 | GCUCGA |
2527 | GAGUAC | 2627 | CGGCAG | 2727 | ACGUCA | 2827 | CCGUUC | 2927 | CUACGA |
2528 | CGAGAC | 2628 | CCGCAG | 2728 | CCGCUC | 2828 | AUGCCG | 2928 | CCGGUC |
2529 | GUAGAC | 2629 | CGAGUA | 2729 | CAUGCG | 2829 | AUCGCC | 2929 | CGAAUC |
2530 | AGGCCG | 2630 | GUUCGA | 2730 | AAGCCG | 2830 | ACCGAA | 2930 | CAACGC |
2531 | GCCUAC | 2631 | AACGGG | 2731 | AACGAG | 2831 | AACCGA | 2931 | AGCGAC |
2532 | GCUACC | 2632 | CGUGCA | 2732 | CCGGCA | 2832 | UCCGAA | 2932 | CCGUAG |
2533 | CGCCCA | 2633 | ACGCUG | 2733 | AAGCGC | 2833 | ACCGCU | 2933 | ACUCGC |
2534 | GCGUGA | 2634 | CAGACG | 2734 | GAGCGC | 2834 | CGUAAG | 2934 | AUCGGG |
2535 | GAGCUC | 2635 | CCAACG | 2735 | AAACGC | 2835 | ACUCGA | 2935 | CGGUAA |
2536 | CCUAGG | 2636 | GCGGGA | 2736 | ACGUUC | 2836 | CGUUGA | 2936 | AACGAC |
2537 | ACGCCU | 2637 | CAGCGG | 2737 | ACCGAG | 2837 | AACCGU | 2937 | AGUCGA |
2538 | CCGAGG | 2638 | CGGAGC | 2738 | CGCUGA | 2838 | GCGUCC | 2938 | AUCCGG |
2539 | GGCGGA | 2639 | AGCGUG | 2739 | CCGAGC | 2839 | CUCGCA | 2939 | CCCGUA |
2540 | CGCCAC | 2640 | CGCUCC | 2740 | CCGUCC | 2840 | GCGGAA | 2940 | ACGCUA |
2541 | GGGUAC | 2641 | CUGCGC | 2741 | CGCUCA | 2841 | CGGCAA | 2941 | CAACCG |
2542 | CGUGAG | 2642 | AUCGUG | 2742 | GCGAAA | 2842 | CGAAGC | 2942 | ACGGUC |
2543 | ACCACG | 2643 | CCGUGC | 2743 | GCGGCA | 2843 | GCCCGA | 2943 | GACGUA |
2544 | GCAUGC | 2644 | CCUGCG | 2744 | CCGAAG | 2844 | ACGCUC | 2944 | AUAGCG |
2545 | CCACCG | 2645 | ACCGCA | 2745 | AACGCU | 2845 | AGCGUC | 2945 | CGACCA |
2546 | CCACGC | 2646 | ACGGAA | 2746 | ACACCG | 2846 | GUGCGA | 2946 | CAAUCG |
2547 | CCGAGA | 2647 | CACGGC | 2747 | AGCGGC | 2847 | CGGACA | 2947 | CGGAAC |
2548 | CCCGAG | 2648 | AGCCCG | 2748 | CGAAAG | 2848 | AACGGU | 2948 | CGGUAG |
2549 | CGGCUC | 2649 | CACGGG | 2749 | CUCGGA | 2849 | CGAACA | 2949 | CUCGUA |
2550 | CCGGGA | 2650 | CACGGA | 2750 | CGUGUA | 2850 | ACGGAU | 2950 | AUCCGA |
2551 | UCGAGA | 2651 | CAACGA | 2751 | AGCGAA | 2851 | GACGCA | 2951 | GACCGA |
2552 | GUGCAC | 2652 | CACGUA | 2752 | CCAUCG | 2852 | CUUCGC | 2952 | ACCGGA |
2553 | CGAGGC | 2653 | AGCGGG | 2753 | CCCGAC | 2853 | AGUGCG | 2953 | CGCAUA |
2554 | CCUCCG | 2654 | CGGAAG | 2754 | AGCGCC | 2854 | CCGUAA | 2954 | AUACGC |
2555 | GGCCGA | 2655 | CGAGAA | 2755 | CGUUCC | 2855 | CGGGUC | 2955 | AGCGUA |
2556 | CGGGCA | 2656 | CGCACA | 2756 | AUGACG | 2856 | CGUAGA | 2956 | GACCGC |
2557 | ACCCGG | 2657 | AGAACG | 2757 | CGAGCC | 2857 | CGUUGC | 2957 | CGCUUA |
2558 | AGCCGA | 2658 | CGCAGC | 2758 | CACUCG | 2858 | CGCCAA | 2958 | CGCUAA |
2559 | CUCCGC | 2659 | CAAACG | 2759 | CUGCGA | 2859 | AGCGCU | 2959 | CCGUUA |
2560 | AUCUCG | 2660 | ACGCAG | 2760 | CUCGUC | 2860 | GACGAA | 2960 | AUUCGC |
2561 | CCCGUC | 2661 | AAGACG | 2761 | AAGCGU | 2861 | GACGCC | 2961 | CGUAGC |
2562 | CGUGCC | 2662 | GGUACC | 2762 | ACAACG | 2862 | CGAGUC | 2962 | UAGCGA |
2563 | AUCACG | 2663 | CCGGAG | 2763 | GCCGCA | 2863 | ACCGUA | 2963 | CGCAAC |
2564 | AGCCGG | 2664 | CGAGGA | 2764 | AACUCG | 2864 | CGAUCC | 2964 | CGGACC |
2565 | CACACG | 2665 | GAUCGC | 2765 | CCGAAA | 2865 | GCCGAA | 2965 | AUCGGA |
2566 | CACCGC | 2666 | ACCCGC | 2766 | CGUCCA | 2866 | AUACGG | 2966 | CGUAAC |
2567 | UCCCGA | 2667 | CACGUG | 2767 | CUCCGA | 2867 | CGAUCA | 2967 | CGAUAG |
2568 | AGAUCG | 2668 | GCUAGC | 2768 | ACGAUC | 2868 | CGCAAG | 2968 | GCCGAC |
2569 | CACCCG | 2669 | ACACGC | 2769 | ACGUCC | 2869 | GCGAGC | 2969 | CUCGAG |
2570 | CGUUUC | 2670 | AAGGCG | 2770 | ACCGGG | 2870 | AAGUCG | 2970 | ACCGAU |
2571 | ACCUCG | 2671 | CGGCUA | 2771 | CACCGG | 2871 | CACGAC | 2971 | AUACCG |
2572 | ACGUGG | 2672 | ACUGCG | 2772 | CGGCAC | 2872 | CCGACA | 2972 | CUACGC |
SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 |
2973 | AGUACG | 2990 | GACGAC | 3007 | AUCGAC | 3024 | GACGUC | 3041 | ACGACG |
2974 | GUCGAA | 2991 | CGCUAC | 3008 | GCGGUA | 3025 | CGAGCG | 3042 | AACGCG |
2975 | GGCGUA | 2992 | GCGACC | 3009 | GCGCUA | 3026 | CGGACG | 3043 | ACGUCG |
2976 | GCGGAC | 2993 | CGGUUA | 3010 | CACGCG | 3027 | ACGCCG | 3044 | CGCGAC |
2977 | UACCGA | 2994 | CCGAAC | 3011 | GUACGA | 3028 | ACGCGC | 3045 | CGAACG |
2978 | CCGCUA | 2995 | GUCGGA | 3012 | UGCGCA | 3029 | GCGUAC | 3046 | CGACCG |
2979 | GGUCGA | 2996 | GUCGCA | 3013 | GUCGUA | 3030 | CGCGAG | 3047 | ACGCGA |
2980 | GCGAUA | 2997 | GCCGUA | 3014 | CGACUA | 3031 | CGCGGA | 3048 | CGCGAA |
2981 | ACGACC | 2998 | CCGGUA | 3015 | CCGUAC | 3032 | CGCGUC | 3049 | CGACGA |
2982 | AGUCGC | 2999 | CGUACC | 3016 | CGAUAC | 3033 | CGGCGA | 3050 | GUCGAC |
2983 | GCGCGA | 3000 | ACCGAC | 3017 | CGGUAC | 3034 | CCGCGA | 3051 | CGUCGA |
2984 | CGUUAC | 3001 | CCGAUC | 3018 | CGCACG | 3035 | CGCCGA | 3052 | CGCGUA |
2985 | AUCGGC | 3002 | AUCGCG | 3019 | GCGAAC | 3036 | ACCGGU | 3053 | ACGCGU |
2986 | CGGAUA | 3003 | CGCUAG | 3020 | CGCGCA | 3037 | CCGACG | 3054 | UCGCGA |
2987 | GCGUAA | 3004 | GUCCGA | 3021 | AGCGCG | 3038 | CCGUCG | 3055 | CGAUCG |
2988 | CGAACC | 3005 | UCCGGA | 3022 | ACGCGG | 3039 | CGUCGC | 3056 | CGUACG |
2989 | GCGUUA | 3006 | CCGAUA | 3023 | ACGGCG | 3040 | CGACGC |
SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 |
3057 | CCCAG | 3157 | CAGAC | 3257 | CGTCC | 3357 | GCCCA | 3457 | CCGTC |
3058 | TCCCA | 3158 | CTTGC | 3258 | ACGTC | 3358 | ACTCC | 3458 | CGTGC |
3059 | CAGAG | 3159 | CTGAC | 3259 | CCGAA | 3359 | AAGGG | 3459 | ACCCG |
3060 | CCAGG | 3160 | AACCC | 3260 | ATCCG | 3360 | GGTGA | 3460 | CGCAG |
3061 | AGGAG | 3161 | AGACC | 3261 | ACGGC | 3361 | CACTC | 3461 | AAGCG |
3062 | CAGGA | 3162 | AGCCC | 3262 | ATGCG | 3362 | AGAGC | 3462 | CACGA |
3063 | CCTCC | 3163 | ACCCT | 3263 | TCGCA | 3363 | GTGGA | 3463 | CCCGA |
3064 | CTCAG | 3164 | ACACC | 3264 | CGAGC | 3364 | ATGGG | 3464 | CTCGA |
3065 | CCAGC | 3165 | CAAGC | 3265 | CGCAA | 3365 | GCACA | 3465 | ACGGA |
3066 | AGGCA | 3166 | CCAAC | 3266 | AACGC | 3366 | CCCTC | 3466 | GCGGA |
3067 | CTGCA | 3167 | GACCA | 3267 | AACCG | 3367 | ACCAG | 3467 | CGCTC |
3068 | CAGCC | 3168 | CAGTC | 3268 | CGAAC | 3368 | ACCAC | 3468 | ACGAG |
3069 | CACAG | 3169 | AGGGC | 3269 | GACGA | 3369 | GGGCA | 3469 | CCGCA |
3070 | CAGCA | 3170 | AGGAC | 3270 | ACCGA | 3370 | GCCAC | 3470 | CTCGC |
3071 | CACTG | 3171 | GGTCA | 3271 | TCCGA | 3371 | AGGCC | 3471 | ATCGC |
3072 | CTCCA | 3172 | GCTCC | 3272 | CGTAG | 3372 | GAGCA | 3472 | ACGCA |
3073 | CTCCC | 3173 | AGGTC | 3273 | GCGAA | 3373 | ACTGG | 3473 | ACTCG |
3074 | CAGGC | 3174 | GGCAC | 3274 | ACCGG | 3374 | CATGC | 3474 | CGAAG |
3075 | AGCCT | 3175 | CAACC | 3275 | GACGC | 3375 | ACAGC | 3475 | GGCGA |
3076 | CACAC | 3176 | AGTCC | 3276 | AGTCG | 3376 | GTGCA | 3476 | ACCGT |
3077 | CCTCA | 3177 | GACAC | 3277 | CCGTA | 3377 | GCCAA | 3477 | AGCGG |
3078 | AGCCA | 3178 | CCTAG | 3278 | CCGAC | 3378 | CACCC | 3478 | AACGG |
3079 | CTGGA | 3179 | GGAAC | 3279 | GCGAC | 3379 | AGCAC | 3479 | CGGCA |
3080 | GGAGA | 3180 | GTCCA | 3280 | CGGTC | 3380 | ATCCC | 3480 | CAACG |
3081 | CTTCC | 3181 | GTCAC | 3281 | CGACC | 3381 | AAGGC | 3481 | CGGAA |
3082 | AGCTG | 3182 | GCAAC | 3282 | CGGAC | 3382 | AGCTC | 3482 | CGCAC |
3083 | CACCA | 3183 | GACTC | 3283 | ACGAC | 3383 | GGCAA | 3483 | ACGCT |
3084 | GAGGC | 3184 | GAACC | 3284 | ATCGG | 3384 | GAGCC | 3484 | AGCGC |
3085 | AGAGG | 3185 | GGGAC | 3285 | CGGTA | 3385 | AGTGC | 3485 | ACCGC |
3086 | AGCAG | 3186 | GCACC | 3286 | CGCTA | 3386 | ATGCC | 3486 | GCGCA |
3087 | CTCTC | 3187 | GGCTA | 3287 | GCGTA | 3387 | GCAGC | 3487 | CGATC |
3088 | CTGCC | 3188 | GATGC | 3288 | GTCGA | 3388 | GAAGC | 3488 | CGTTC |
3089 | ACAGG | 3189 | CCCTA | 3289 | CGTAC | 3389 | ATGGC | 3489 | CGTCA |
3090 | AGGGA | 3190 | CTACC | 3290 | CGCGA | 3390 | AAGCC | 3490 | CCGGA |
3091 | CCTGA | 3191 | GATCC | 3291 | ACGCG | 3391 | CATCC | 3491 | CGACA |
3092 | CCACA | 3192 | GCTAC | 3292 | CGACG | 3392 | GGACA | 3492 | CATCG |
3093 | CCACC | 3193 | GCCTA | 3293 | CCCAG | 3393 | CAGAC | 3493 | CGTCC |
3094 | GAGGA | 3194 | CCTAC | 3294 | TCCCA | 3394 | CTTGC | 3494 | ACGTC |
3095 | GGGAA | 3195 | GACCC | 3295 | CAGAG | 3395 | CTGAC | 3495 | CCGAA |
3096 | GCAGA | 3196 | GGGTA | 3296 | CCAGG | 3396 | AACCC | 3496 | ATCCG |
3097 | CCAGA | 3197 | CTAGC | 3297 | AGGAG | 3397 | AGACC | 3497 | ACGGC |
3098 | AGGTG | 3198 | GGACC | 3298 | CAGGA | 3398 | AGCCC | 3498 | ATGCG |
3099 | CTCAC | 3199 | GGTAC | 3299 | CCTCC | 3399 | ACCCT | 3499 | TCGCA |
3100 | TGCCA | 3200 | AGGCG | 3300 | CTCAG | 3400 | ACACC | 3500 | CGAGC |
3101 | CAGGG | 3201 | CCGAG | 3301 | CCAGC | 3401 | CAAGC | 3501 | CGCAA |
3102 | CCTTC | 3202 | CACGC | 3302 | AGGCA | 3402 | CCAAC | 3502 | AACGC |
3103 | AGTGG | 3203 | CGAGA | 3303 | CTGCA | 3403 | GACCA | 3503 | AACCG |
3104 | CCCAA | 3204 | CGGGA | 3304 | CAGCC | 3404 | CAGTC | 3504 | CGAAC |
3105 | GCTGA | 3205 | CGTGA | 3305 | CACAG | 3405 | AGGGC | 3505 | GACGA |
3106 | CATGG | 3206 | CCACG | 3306 | CAGCA | 3406 | AGGAC | 3506 | ACCGA |
3107 | CCTGC | 3207 | ACGTG | 3307 | CACTG | 3407 | GGTCA | 3507 | TCCGA |
3108 | ACCTG | 3208 | CCTCG | 3308 | CTCCA | 3408 | GCTCC | 3508 | CGTAG |
3109 | CTGGC | 3209 | AGACG | 3309 | CTCCC | 3409 | AGGTC | 3509 | GCGAA |
3110 | GAGAC | 3210 | CGCCA | 3310 | CAGGC | 3410 | GGCAC | 3510 | ACCGG |
3111 | CTGTC | 3211 | CGGAG | 3311 | AGCCT | 3411 | CAACC | 3511 | GACGC |
3112 | CCAAG | 3212 | AGCCG | 3312 | CACAC | 3412 | AGTCC | 3512 | AGTCG |
3113 | GCTCA | 3213 | ACGCC | 3313 | CCTCA | 3413 | GACAC | 3513 | CCGTA |
3114 | ACCCA | 3214 | CACGG | 3314 | AGCCA | 3414 | CCTAG | 3514 | CCGAC |
3115 | ACTGC | 3215 | CACCG | 3315 | CTGGA | 3415 | GGAAC | 3515 | GCGAC |
3116 | ACCTC | 3216 | ACACG | 3316 | GGAGA | 3416 | GTCCA | 3516 | CGGTC |
3117 | GGCCA | 3217 | ACGGG | 3317 | CTTCC | 3417 | GTCAC | 3517 | CGACC |
3118 | CCCAC | 3218 | GCCGA | 3318 | AGCTG | 3418 | GCAAC | 3518 | CGGAC |
3119 | CCATC | 3219 | AGCGA | 3319 | CACCA | 3419 | GACTC | 3519 | ACGAC |
3120 | CAAGG | 3220 | CAGCG | 3320 | GAGGC | 3420 | GAACC | 3520 | ATCGG |
3121 | GCCCA | 3221 | CCGTC | 3321 | AGAGG | 3421 | GGGAC | 3521 | CGGTA |
3122 | ACTCC | 3222 | CGTGC | 3322 | AGCAG | 3422 | GCACC | 3522 | CGCTA |
3123 | AAGGG | 3223 | ACCCG | 3323 | CTCTC | 3423 | GGCTA | 3523 | GCGTA |
3124 | GGTGA | 3224 | CGCAG | 3324 | CTGCC | 3424 | GATGC | 3524 | GTCGA |
3125 | CACTC | 3225 | AAGCG | 3325 | ACAGG | 3425 | CCCTA | 3525 | CGTAC |
3126 | AGAGC | 3226 | CACGA | 3326 | AGGGA | 3426 | CTACC | 3526 | CGCGA |
3127 | GTGGA | 3227 | CCCGA | 3327 | CCTGA | 3427 | GATCC | 3527 | ACGCG |
3128 | ATGGG | 3228 | CTCGA | 3328 | CCACA | 3428 | GCTAC | 3528 | CGACG |
3129 | GCACA | 3229 | ACGGA | 3329 | CCACC | 3429 | GCCTA | ||
3130 | CCCTC | 3230 | GCGGA | 3330 | GAGGA | 3430 | CCTAC | ||
3131 | ACCAG | 3231 | CGCTC | 3331 | GGGAA | 3431 | GACCC | ||
3132 | ACCAC | 3232 | ACGAG | 3332 | GCAGA | 3432 | GGGTA | ||
3133 | GGGCA | 3233 | CCGCA | 3333 | CCAGA | 3433 | CTAGC | ||
3134 | GCCAC | 3234 | CTCGC | 3334 | AGGTG | 3434 | GGACC | ||
3135 | AGGCC | 3235 | ATCGC | 3335 | CTCAC | 3435 | GGTAC | ||
3136 | GAGCA | 3236 | ACGCA | 3336 | TGCCA | 3436 | AGGCG | ||
3137 | ACTGG | 3237 | ACTCG | 3337 | CAGGG | 3437 | CCGAG | ||
3138 | CATGC | 3238 | CGAAG | 3338 | CCTTC | 3438 | CACGC | ||
3139 | ACAGC | 3239 | GGCGA | 3339 | AGTGG | 3439 | CGAGA | ||
3140 | GTGCA | 3240 | ACCGT | 3340 | CCCAA | 3440 | CGGGA | ||
3141 | GCCAA | 3241 | AGCGG | 3341 | GCTGA | 3441 | CGTGA | ||
3142 | CACCC | 3242 | AACGG | 3342 | CATGG | 3442 | CCACG | ||
3143 | AGCAC | 3243 | CGGCA | 3343 | CCTGC | 3443 | ACGTG | ||
3144 | ATCCC | 3244 | CAACG | 3344 | ACCTG | 3444 | CCTCG | ||
3145 | AAGGC | 3245 | CGGAA | 3345 | CTGGC | 3445 | AGACG | ||
3146 | AGCTC | 3246 | CGCAC | 3346 | GAGAC | 3446 | CGCCA | ||
3147 | GGCAA | 3247 | ACGCT | 3347 | CTGTC | 3447 | CGGAG | ||
3148 | GAGCC | 3248 | AGCGC | 3348 | CCAAG | 3448 | AGCCG | ||
3149 | AGTGC | 3249 | ACCGC | 3349 | GCTCA | 3449 | ACGCC | ||
3150 | ATGCC | 3250 | GCGCA | 3350 | ACCCA | 3450 | CACGG | ||
3151 | GCAGC | 3251 | CGATC | 3351 | ACTGC | 3451 | CACCG | ||
3152 | GAAGC | 3252 | CGTTC | 3352 | ACCTC | 3452 | ACACG | ||
3153 | ATGGC | 3253 | CGTCA | 3353 | GGCCA | 3453 | ACGGG | ||
3154 | AAGCC | 3254 | CCGGA | 3354 | CCCAC | 3454 | GCCGA | ||
3155 | CATCC | 3255 | CGACA | 3355 | CCATC | 3455 | AGCGA | ||
3156 | GGACA | 3256 | CATCG | 3356 | CAAGG | 3456 | CAGCG |
SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 | SEQ ID NO. | 序列 |
3529 | AGGCTG | 4049 | GTGCAA | 4569 | GCGCAC | 5089 | CCACAA | 5609 | CGAGGC |
3530 | CACACA | 4050 | TAGGGA | 4570 | ACATCG | 5090 | GGCCAA | 5610 | CCTCCG |
3531 | CCTCCC | 4051 | GGCCCA | 4571 | GCCGGA | 5091 | ACACCA | 5611 | GGCCGA |
3532 | CAGGAG | 4052 | AGGGAC | 4572 | CATCGC | 5092 | CTGGCA | 5612 | CGGGCA |
3533 | CTGGGA | 4053 | GGACAA | 4573 | TCCGCA | 5093 | GTGTGA | 5613 | ACCCGG |
3534 | CCCAGC | 4054 | AGGTAG | 4574 | CGGGAC | 5094 | TGGCAA | 5614 | AGCCGA |
3535 | ACACAC | 4055 | ACTGCC | 4575 | CATCGA | 5095 | AGCCAT | 5615 | CTCCGC |
3536 | CTCCCA | 4056 | ACTGTC | 4576 | ACCGCC | 5096 | CCAAGG | 5616 | ATCTCG |
3537 | CCCAGG | 4057 | GGGCCA | 4577 | ATTCCG | 5097 | ACCAGC | 5617 | CCCGTC |
3538 | AGGCAG | 4058 | AGAACC | 4578 | CATCCG | 5098 | ATCCTG | 5618 | CGTGCC |
3539 | ACAGAG | 4059 | CCTAGA | 4579 | ACCCGT | 5099 | CATCAC | 5619 | ATCACG |
3540 | AGAGAG | 4060 | AGCAAC | 4580 | CTTCGA | 5100 | CCCTGC | 5620 | AGCCGG |
3541 | CCAGGC | 4061 | ACTCCC | 4581 | TCGGAA | 5101 | ATGAGG | 5621 | CACACG |
3542 | GCCTCC | 4062 | GAGAGC | 4582 | ACGCAA | 5102 | CAGCCC | 5622 | CACCGC |
3543 | CCAGCC | 4063 | GATGCA | 4583 | ATTGCG | 5103 | CATGCA | 5623 | TCCCGA |
3544 | AGGAAG | 4064 | AGACCC | 4584 | ACGAGT | 5104 | GGCACA | 5624 | AGATCG |
3545 | AGGAGA | 4065 | ACCCAT | 4585 | GAACGC | 5105 | AGAGGC | 5625 | CACCCG |
3546 | CCTCAG | 4066 | AAGTCC | 4586 | ACCCGA | 5106 | CCCTTC | 5626 | CGTTTC |
3547 | GAGAGA | 4067 | AAGCCC | 4587 | ATTCGG | 5107 | AGTGTG | 5627 | ACCTCG |
3548 | AGCCTG | 4068 | CCTCTA | 4588 | TCGGCA | 5108 | AACCTG | 5628 | ACGTGG |
3549 | GGAGAA | 4069 | GCCCAC | 4589 | AATGCG | 5109 | AGACAC | 5629 | ACGGTG |
3550 | CAGAGA | 4070 | AACACC | 4590 | CCGACC | 5110 | AAAGGC | 5630 | ACGGAG |
3551 | ACTGCA | 4071 | AGGCCC | 4591 | CCGTTC | 5111 | CCACAC | 5631 | AAGCGA |
3552 | CTCAGC | 4072 | ATCAGC | 4592 | ATGCCG | 5112 | GCAAGA | 5632 | AAACGG |
3553 | AGACAG | 4073 | GTCTGA | 4593 | ATCGCC | 5113 | CCCATC | 5633 | AGCGAG |
3554 | CACTGC | 4074 | ACTTGC | 4594 | ACCGAA | 5114 | CTGTGC | 5634 | AGGCGC |
3555 | AGGAGG | 4075 | ACATCC | 4595 | AACCGA | 5115 | ACCCTG | 5635 | CAAGCG |
3556 | CCCAAA | 4076 | CTAGAG | 4596 | TCCGAA | 5116 | AAAGCC | 5636 | CTCGAA |
3557 | CTGAGA | 4077 | CCAAGC | 4597 | ACCGCT | 5117 | CTCTAC | 5637 | ACTCGG |
3558 | CTCCAG | 4078 | GATTCC | 4598 | CGTAAG | 5118 | ACAGGT | 5638 | ACCGTG |
3559 | CAGGCA | 4079 | CTGGAC | 4599 | ACTCGA | 5119 | ACTGGA | 5639 | AGAGCG |
3560 | AGCTGG | 4080 | GATCCA | 4600 | CGTTGA | 5120 | ACAGCT | 5640 | AGCGAT |
3561 | AGTGAG | 4081 | GTGTCA | 4601 | AACCGT | 5121 | CATCCA | 5641 | CCGCCA |
3562 | CACAGA | 4082 | GAACCC | 4602 | GCGTCC | 5122 | ACTGGG | 5642 | CACGAG |
3563 | TCAGGA | 4083 | CAAGTC | 4603 | CTCGCA | 5123 | CACTCA | 5643 | ACACGT |
3564 | CAGGAA | 4084 | GCATCA | 4604 | GCGGAA | 5124 | ATCCAG | 5644 | ATGGCG |
3565 | CCACCA | 4085 | ATGCTC | 4605 | CGGCAA | 5125 | CTGTTC | 5645 | AACGTG |
3566 | CCTGCC | 4086 | GGCAAC | 4606 | CGAAGC | 5126 | ATCTCC | 5646 | CCCACG |
3567 | CAGTGA | 4087 | GGAGCC | 4607 | GCCCGA | 5127 | CCTGTC | 5647 | CGTGAA |
3568 | CTGGGC | 4088 | ACAGTC | 4608 | ACGCTC | 5128 | CTACAG | 5648 | ACACGG |
3569 | CCTGGC | 4089 | GCTCCC | 4609 | AGCGTC | 5129 | AGTGGG | 5649 | ACGAGG |
3570 | TCCCAA | 4090 | GGTGAC | 4610 | GTGCGA | 5130 | GGTTCA | 5650 | AACACG |
3571 | CCAGGA | 4091 | CATTGG | 4611 | CGGACA | 5131 | ACTTCC | 5651 | GCGCCA |
3572 | CAGAAG | 4092 | GACTCC | 4612 | AACGGT | 5132 | AGCATG | 5652 | ACGCCA |
3573 | CCAAAG | 4093 | CTCAAC | 4613 | CGAACA | 5133 | AGGGCA | 5653 | TCACGA |
3574 | CCAGCA | 4094 | GCAACC | 4614 | ACGGAT | 5134 | TAGCCA | 5654 | GGATCC |
3575 | GAGGCA | 4095 | AGTGTC | 4615 | GACGCA | 5135 | CTGACC | 5655 | GCGAGA |
3576 | ATCCCA | 4096 | CACAAC | 4616 | CTTCGC | 5136 | GAGACC | 5656 | AACCCG |
3577 | AGCCTC | 4097 | AGCACC | 4617 | AGTGCG | 5137 | TGGACA | 5657 | CAGCCG |
3578 | CAGTGG | 4098 | ACTGGC | 4618 | CCGTAA | 5138 | AAGGCT | 5658 | ACGTGA |
3579 | GGCTCA | 4099 | CCAGTA | 4619 | CGGGTC | 5139 | CACTTC | 5659 | ACGCCC |
3580 | GACAGA | 4100 | ACACCC | 4620 | CGTAGA | 5140 | AATGGC | 5660 | GAGCGA |
3581 | TGGGAA | 4101 | AAGGGT | 4621 | CGTTGC | 5141 | CATCAG | 5661 | CCACGG |
3582 | GGAAGA | 4102 | ACCCTC | 4622 | CGCCAA | 5142 | CACTGG | 5662 | GACGGA |
3583 | AGGGAA | 4103 | GAGGGC | 4623 | AGCGCT | 5143 | CTGAGC | 5663 | CGATTC |
3584 | GGGAAA | 4104 | GGTAGA | 4624 | GACGAA | 5144 | ATCCTC | 5664 | ACGGGA |
3585 | CTGGAA | 4105 | ACCAAC | 4625 | GACGCC | 5145 | CAGGCC | 5665 | CGGCCA |
3586 | TCTCCA | 4106 | AAGGGC | 4626 | CGAGTC | 5146 | AACAGG | 5666 | GGCGCA |
3587 | GAGGAA | 4107 | AGGCTA | 4627 | ACCGTA | 5147 | CAGAAC | 5667 | ACTCCG |
3588 | CACCTG | 4108 | ATGGCC | 4628 | CGATCC | 5148 | ATCTGC | 5668 | CACGCA |
3589 | GAAGGA | 4109 | ACCAGT | 4629 | GCCGAA | 5149 | ACTTGG | 5669 | GGGCGA |
3590 | ACACAG | 4110 | AGGATC | 4630 | ATACGG | 5150 | CAAGAC | 5670 | AATCGC |
3591 | GGCTGA | 4111 | CCCAAC | 4631 | CGATCA | 5151 | CTTGGA | 5671 | AAAGCG |
3592 | GCCTCA | 4112 | AGGGCC | 4632 | CGCAAG | 5152 | AGCTAC | 5672 | CGGGAA |
3593 | AGAGGA | 4113 | CAAGCC | 4633 | GCGAGC | 5153 | AGCTTC | 5673 | CGGTGA |
3594 | GAGACA | 4114 | AAGGTC | 4634 | AAGTCG | 5154 | GCAACA | 5674 | CGTGGC |
3595 | GCTGGA | 4115 | GACCAA | 4635 | CACGAC | 5155 | ACACCT | 5675 | CGCTGC |
3596 | CTTTCC | 4116 | CCTACA | 4636 | CCGACA | 5156 | ACCTGA | 5676 | ACGAAG |
3597 | CTGCAA | 4117 | ATTGCC | 4637 | AACGCC | 5157 | GAGCAA | 5677 | ACGTGC |
3598 | CTTCTC | 4118 | CAGACC | 4638 | ACGGTA | 5158 | GCCAAA | 5678 | CCAGCG |
3599 | CCTGAG | 4119 | ACAAGC | 4639 | TACGCA | 5159 | GAAAGC | 5679 | AGTTCG |
3600 | CCTGTA | 4120 | CAGTCC | 4640 | AGTCGG | 5160 | CACCAA | 5680 | CGCACC |
3601 | CAGAGG | 4121 | GGACAC | 4641 | ACTACG | 5161 | CCCTGA | 5681 | CGTGGA |
3602 | AGATGG | 4122 | GCCAAC | 4642 | CGGTTC | 5162 | AACTGG | 5682 | CGACAG |
3603 | ATGGTG | 4123 | GCTGTA | 4643 | ATGCGC | 5163 | CCATCC | 5683 | CGGCAG |
3604 | CACCAC | 4124 | CTGGTA | 4644 | ACCGCG | 5164 | CTTGCA | 5684 | CCGCAG |
3605 | ACTCCA | 4125 | GGCCAC | 4645 | AATCCG | 5165 | CAGGGC | 5685 | CGAGTA |
3606 | ACCCAG | 4126 | GATGGC | 4646 | GACGGC | 5166 | GGAACA | 5686 | GTTCGA |
3607 | TGCCCA | 4127 | CAATGC | 4647 | ACCGTC | 5167 | CTTCAC | 5687 | AACGGG |
3608 | AGAAGG | 4128 | CACCTA | 4648 | CAGTCG | 5168 | ACCACT | 5688 | CGTGCA |
3609 | CTTCCA | 4129 | GATTGC | 4649 | CGCCTA | 5169 | CTGACA | 5689 | ACGCTG |
3610 | AGCCAG | 4130 | AGTGCC | 4650 | CGTCTA | 5170 | GCAGCC | 5690 | CAGACG |
3611 | CCTTCC | 4131 | CATGAC | 4651 | ACGTAC | 5171 | CCATGA | 5691 | CCAACG |
3612 | GGAGGA | 4132 | GACCCA | 4652 | CGCATC | 5172 | AAGGTG | 5692 | GCGGGA |
3613 | AGGGAG | 4133 | GAGGAC | 4653 | CGGTCA | 5173 | CACCAG | 5693 | CAGCGG |
3614 | CTGTGA | 4134 | CAGCTG | 4654 | CGTACA | 5174 | ACAGAC | 5694 | CGGAGC |
3615 | ACTCTG | 4135 | CCCTAA | 4655 | CAACGG | 5175 | GTGACA | 5695 | AGCGTG |
3616 | CAGCAG | 4136 | CAATCC | 4656 | TGCGAA | 5176 | GCTTCC | 5696 | CGCTCC |
3617 | CCAGAA | 4137 | GTGAAC | 4657 | CGATGC | 5177 | GAACTC | 5697 | CTGCGC |
3618 | GGCAGA | 4138 | CCAACC | 4658 | ATGTCG | 5178 | AGACTC | 5698 | ATCGTG |
3619 | CTCAGA | 4139 | ACTGAC | 4659 | CGACTC | 5179 | AGTCAG | 5699 | CCGTGC |
3620 | TCTGCA | 4140 | CAGGTC | 4660 | CCTACG | 5180 | AAGAGC | 5700 | CCTGCG |
3621 | GTCTCA | 4141 | AGCCTA | 4661 | GGACGA | 5181 | CCCTCA | 5701 | ACCGCA |
3622 | CTCTGC | 4142 | GAATCC | 4662 | ACCGGC | 5182 | CACATC | 5702 | ACGGAA |
3623 | AAGGAG | 4143 | AGGGTC | 4663 | CGACAA | 5183 | GCCACA | 5703 | CACGGC |
3624 | GAGCCA | 4144 | GACAGC | 4664 | TACGGA | 5184 | AAGCCT | 5704 | AGCCCG |
3625 | AGGTGG | 4145 | CTAGCA | 4665 | CCGGAC | 5185 | AGTAGC | 5705 | CACGGG |
3626 | CATCTC | 4146 | AGTAGG | 4666 | AACGGC | 5186 | AGTCTG | 5706 | CACGGA |
3627 | AGCAGA | 4147 | GAGGTA | 4667 | CGTCAA | 5187 | CTGGTC | 5707 | CAACGA |
3628 | ACAGGC | 4148 | ATGGAC | 4668 | CGTATC | 5188 | GGGCAA | 5708 | CACGTA |
3629 | AAGCAG | 4149 | GCCCAA | 4669 | AACCGC | 5189 | ATGTGC | 5709 | AGCGGG |
3630 | CTTCCC | 4150 | ATTGGG | 4670 | CATCGG | 5190 | GATCAC | 5710 | CGGAAG |
3631 | CCTTTC | 4151 | ATGGGC | 4671 | CGTTAG | 5191 | CCTCAC | 5711 | CGAGAA |
3632 | AATCCC | 4152 | CATAGG | 4672 | ATGCGA | 5192 | GCATGA | 5712 | CGCACA |
3633 | AGAGCA | 4153 | GTGGTA | 4673 | GCGCAA | 5193 | CCTTGA | 5713 | AGAACG |
3634 | GCAGGA | 4154 | CCTAAG | 4674 | AATCGG | 5194 | TGCCAA | 5714 | CGCAGC |
3635 | GCAGAA | 4155 | GGGCAC | 4675 | ACGAGC | 5195 | CCATGC | 5715 | CAAACG |
3636 | TCCTCA | 4156 | ACAACC | 4676 | ATCGTC | 5196 | AACCAG | 5716 | ACGCAG |
3637 | CCCACC | 4157 | CTGTAC | 4677 | CTCGAC | 5197 | GCTTCA | 5717 | AAGACG |
3638 | CTCTTC | 4158 | CCACTA | 4678 | AGTCCG | 5198 | ACAAGG | 5718 | GGTACC |
3639 | CCTCCA | 4159 | GGCACC | 4679 | TCGCAA | 5199 | GTGCCA | 5719 | CCGGAG |
3640 | CAGCCA | 4160 | AGCTAG | 4680 | GCGTCA | 5200 | CTCATC | 5720 | CGAGGA |
3641 | AAGGGA | 4161 | GGGAAC | 4681 | ACGACT | 5201 | CTCACC | 5721 | GATCGC |
3642 | CTCACA | 4162 | CTGATC | 4682 | AACCGG | 5202 | AGGCAC | 5722 | ACCCGC |
3643 | AAGGCA | 4163 | GCAGAC | 4683 | CGGTCC | 5203 | AGCTGC | 5723 | CACGTG |
3644 | AGAGAC | 4164 | ATGGTC | 4684 | CGGGTA | 5204 | AGCTCC | 5724 | GCTAGC |
3645 | CAGGGA | 4165 | ATTGGC | 4685 | ACGGAC | 5205 | GCTTGA | 5725 | ACACGC |
3646 | CAGCAC | 4166 | GGGTCA | 4686 | CGACCC | 5206 | ATTCCC | 5726 | AAGGCG |
3647 | ACAGCA | 4167 | CAACCC | 4687 | TCGACA | 5207 | AACAGC | 5727 | CGGCTA |
3648 | ACATGG | 4168 | AGATCC | 4688 | CGACAC | 5208 | CCAAAC | 5728 | ACTGCG |
3649 | CTGGCC | 4169 | CTTGAC | 4689 | ACGAAC | 5209 | GAGAAC | 5729 | ACGTCT |
3650 | TCACCA | 4170 | GGACTA | 4690 | GCTCGA | 5210 | AGCCCT | 5730 | CAGCGA |
3651 | ACAGTG | 4171 | CCTTAG | 4691 | CTACGA | 5211 | CAGTCA | 5731 | CACGTC |
3652 | AAGAGG | 4172 | GCAGTA | 4692 | CCGGTC | 5212 | AGGAGC | 5732 | ACGTTG |
3653 | CACCCA | 4173 | CCCATA | 4693 | CGAATC | 5213 | ATCTGG | 5733 | GCGACA |
3654 | CTCTGA | 4174 | GAGCTA | 4694 | CAACGC | 5214 | CAATGG | 5734 | ATCCCG |
3655 | GGGAGA | 4175 | GATGAC | 4695 | AGCGAC | 5215 | CACAAG | 5735 | AGGGCG |
3656 | AGACCA | 4176 | GGTTGA | 4696 | CCGTAG | 5216 | AGGGAT | 5736 | CCTCGC |
3657 | AGCCAC | 4177 | GCTACA | 4697 | ACTCGC | 5217 | GAATGC | 5737 | CGGAGA |
3658 | AGCACT | 4178 | GCACCC | 4698 | ATCGGG | 5218 | ACCAGA | 5738 | CGCCAG |
3659 | ACCACA | 4179 | GGCTTA | 4699 | CGGTAA | 5219 | ATCCAC | 5739 | CCGTGA |
3660 | CACATG | 4180 | GGGATA | 4700 | AACGAC | 5220 | GTCCCA | 5740 | ACGAGA |
3661 | CTCCTC | 4181 | GGTCAA | 4701 | AGTCGA | 5221 | GCCTGA | 5741 | ACAGCG |
3662 | CAGAGC | 4182 | AGGGTA | 4702 | ATCCGG | 5222 | GCCAGA | 5742 | AGCACG |
3663 | CAGCAA | 4183 | ATGACC | 4703 | CCCGTA | 5223 | GACCTC | 5743 | ATCCGC |
3664 | AAGCCA | 4184 | ACCTAG | 4704 | ACGCTA | 5224 | AGGAAC | 5744 | TCGCCA |
3665 | CCCAGA | 4185 | GTAGGA | 4705 | CAACCG | 5225 | CATGGC | 5745 | CTCGCC |
3666 | CCACAG | 4186 | GCTAGA | 4706 | ACGGTC | 5226 | ACCTTG | 5746 | CCTTCG |
3667 | CTGAAG | 4187 | CATAGC | 4707 | GACGTA | 5227 | GAGTGC | 5747 | CCACGA |
3668 | CAGCTA | 4188 | GTCCAA | 4708 | ATAGCG | 5228 | AACTGC | 5748 | CAGCGC |
3669 | GCTCAC | 4189 | AGTTGC | 4709 | CGACCA | 5229 | ACATGC | 5749 | CCCTCG |
3670 | CTCTCC | 4190 | GGTACA | 4710 | CAATCG | 5230 | ACCCAA | 5750 | CCCGGA |
3671 | AGGCAT | 4191 | GAGCAC | 4711 | CGGAAC | 5231 | GGATCA | 5751 | CGAGAG |
3672 | ACCTCA | 4192 | GCCATA | 4712 | CGGTAG | 5232 | ACCACC | 5752 | GGCGAC |
3673 | CCCTCC | 4193 | CCATAG | 4713 | CTCGTA | 5233 | AAGACC | 5753 | CCCGCA |
3674 | CCTGGA | 4194 | CTTAGC | 4714 | ATCCGA | 5234 | CAAACC | 5754 | CACGAA |
3675 | ACCATG | 4195 | GATGCC | 4715 | GACCGA | 5235 | GGGTGA | 5755 | AGACGA |
3676 | CAGACA | 4196 | GCTCTA | 4716 | ACCGGA | 5236 | GGCTAA | 5756 | CGAAGA |
3677 | CCTCTC | 4197 | AGGACC | 4717 | CGCATA | 5237 | ACCAGG | 5757 | AGCCGC |
3678 | TCCAGA | 4198 | CCCTTA | 4718 | ATACGC | 5238 | AGGGTG | 5758 | CGGAAA |
3679 | AGCTGA | 4199 | ATAGGC | 4719 | AGCGTA | 5239 | CAGTTC | 5759 | ATCGAG |
3680 | CAAAGG | 4200 | CACGCC | 4720 | GACCGC | 5240 | GAGATC | 5760 | CGCAGA |
3681 | ATGGAG | 4201 | GGCATA | 4721 | CGCTTA | 5241 | GAAGAC | 5761 | CGGATC |
3682 | AGAGTG | 4202 | GCATCC | 4722 | CGCTAA | 5242 | ACAGCC | 5762 | CCGCAC |
3683 | GTGAGA | 4203 | GTGCTA | 4723 | CCGTTA | 5243 | ATCACC | 5763 | CGAAAC |
3684 | AGGCCA | 4204 | CCAATC | 4724 | ATTCGC | 5244 | CAAGGC | 5764 | ATCGCA |
3685 | CTGCAC | 4205 | GACATC | 4725 | CGTAGC | 5245 | ACCATC | 5765 | AAACCG |
3686 | ACTCCT | 4206 | CAGGCG | 4726 | TAGCGA | 5246 | AATGCC | 5766 | GCACGC |
3687 | AAACCC | 4207 | GTAGCA | 4727 | CGCAAC | 5247 | ACCTGC | 5767 | CATTCG |
3688 | AAAGGG | 4208 | GGACCA | 4728 | CGGACC | 5248 | GAAGGC | 5768 | CGTGTC |
3689 | TCAGCA | 4209 | GACTGC | 4729 | ATCGGA | 5249 | AACCAC | 5769 | CGTTCA |
3690 | CCAGAG | 4210 | GGGTAA | 4730 | CGTAAC | 5250 | GCTCCA | 5770 | AACGGA |
3691 | CCAACA | 4211 | CTAGGC | 4731 | CGATAG | 5251 | AACCCT | 5771 | GCACGA |
3692 | AGCCAA | 4212 | GCAAGC | 4732 | GCCGAC | 5252 | CATTGC | 5772 | ACGCAC |
3693 | GAGGGA | 4213 | AGGCCT | 4733 | CTCGAG | 5253 | CTGTCC | 5773 | ACGATG |
3694 | GAAGCA | 4214 | GGAGTA | 4734 | ACCGAT | 5254 | GGATGA | 5774 | AGGACG |
3695 | CAGATG | 4215 | GACCAC | 4735 | ATACCG | 5255 | GTTGCA | 5775 | AACGCA |
3696 | GAGGCC | 4216 | GGAACC | 4736 | CTACGC | 5256 | CATGGG | 5776 | CGCTTC |
3697 | ACTGTG | 4217 | ACCCTA | 4737 | AGTACG | 5257 | GCTCAA | 5777 | CGTCCC |
3698 | CATGCC | 4218 | GAGTCC | 4738 | GTCGAA | 5258 | CAACTC | 5778 | AAGCGG |
3699 | CCTGAA | 4219 | GCTGAC | 4739 | GGCGTA | 5259 | GCAGGC | 5779 | AGGCGA |
3700 | CCAAGA | 4220 | AGGTCC | 4740 | GCGGAC | 5260 | GGAGCA | 5780 | ACACGA |
3701 | CTCTCA | 4221 | CCTACC | 4741 | TACCGA | 5261 | ACCAAG | 5781 | ACGGCA |
3702 | TGCACA | 4222 | GGTCAC | 4742 | CCGCTA | 5262 | CTACTC | 5782 | CCTCGA |
3703 | ATGCTG | 4223 | GCCTTA | 4743 | GGTCGA | 5263 | AGCTTG | 5783 | ACGTCA |
3704 | CCTCAA | 4224 | GTACCA | 4744 | GCGATA | 5264 | ATGAGC | 5784 | CCGCTC |
3705 | AACTCC | 4225 | CTTACC | 4745 | ACGACC | 5265 | AGAGCC | 5785 | CATGCG |
3706 | CTGCCA | 4226 | GACTAC | 4746 | AGTCGC | 5266 | AGGACT | 5786 | AAGCCG |
3707 | CACTCC | 4227 | CTATGC | 4747 | GCGCGA | 5267 | ACTCAC | 5787 | AACGAG |
3708 | AGGTGA | 4228 | ACCTAC | 4748 | CGTTAC | 5268 | CATCCC | 5788 | CCGGCA |
3709 | CACAGG | 4229 | CTACAC | 4749 | ATCGGC | 5269 | AAGGAC | 5789 | AAGCGC |
3710 | AGCAAG | 4230 | CTAGAC | 4750 | CGGATA | 5270 | GTTCCA | 5790 | GAGCGC |
3711 | AAGCTG | 4231 | ATACCC | 4751 | GCGTAA | 5271 | GGAGAC | 5791 | AAACGC |
3712 | ACAGGA | 4232 | GACACC | 4752 | CGAACC | 5272 | GCTGCC | 5792 | ACGTTC |
3713 | CACCTC | 4233 | CACTAC | 4753 | GCGTTA | 5273 | AGTCCC | 5793 | ACCGAG |
3714 | AGCAGG | 4234 | ATAGGG | 4754 | GACGAC | 5274 | GGGACA | 5794 | CGCTGA |
3715 | AGGTCA | 4235 | GGGACC | 4755 | CGCTAC | 5275 | TGACCA | 5795 | CCGAGC |
3716 | GCCACC | 4236 | CTAAGC | 4756 | GCGACC | 5276 | CCACTC | 5796 | CCGTCC |
3717 | AGTGCA | 4237 | CCCTAG | 4757 | CGGTTA | 5277 | GTCACA | 5797 | CGCTCA |
3718 | AGAAGC | 4238 | ATAGCC | 4758 | CCGAAC | 5278 | CATGTC | 5798 | GCGAAA |
3719 | AGGCAA | 4239 | CATACC | 4759 | GTCGGA | 5279 | ATGTCC | 5799 | GCGGCA |
3720 | ACACTG | 4240 | GCCTAA | 4760 | GTCGCA | 5280 | AAGCAC | 5800 | CCGAAG |
3721 | CCATTC | 4241 | CCTTAC | 4761 | GCCGTA | 5281 | CAACAC | 5801 | AACGCT |
3722 | CACAGC | 4242 | GGTCCA | 4762 | CCGGTA | 5282 | GAAGCC | 5802 | ACACCG |
3723 | CTGCCC | 4243 | CTATCC | 4763 | CGTACC | 5283 | TACCCA | 5803 | AGCGGC |
3724 | CTCAAG | 4244 | CCTAGC | 4764 | ACCGAC | 5284 | GCACCA | 5804 | CGAAAG |
3725 | ACTCAG | 4245 | ACTAGG | 4765 | CCGATC | 5285 | AGATGC | 5805 | CTCGGA |
3726 | CTGCTC | 4246 | GACAAC | 4766 | ATCGCG | 5286 | ACACTC | 5806 | CGTGTA |
3727 | TCCACA | 4247 | CAGTAC | 4767 | CGCTAG | 5287 | CAGTGC | 5807 | AGCGAA |
3728 | ATGGGA | 4248 | CTAGCC | 4768 | GTCCGA | 5288 | CTCCTA | 5808 | CCATCG |
3729 | CAAGTG | 4249 | CCTAAC | 4769 | TCCGGA | 5289 | AGAGTC | 5809 | CCCGAC |
3730 | GGAAAC | 4250 | GGTGTA | 4770 | CCGATA | 5290 | ACCCAC | 5810 | AGCGCC |
3731 | AGGACA | 4251 | AGGTAC | 4771 | ATCGAC | 5291 | AAGCTC | 5811 | CGTTCC |
3732 | CAGCTC | 4252 | CGGGAG | 4772 | GCGGTA | 5292 | GTCAGA | 5812 | ATGACG |
3733 | CAAGGA | 4253 | CACTAG | 4773 | GCGCTA | 5293 | ACTCTC | 5813 | CGAGCC |
3734 | GAAACC | 4254 | GTCCAC | 4774 | CACGCG | 5294 | GCACAC | 5814 | CACTCG |
3735 | ATGGCA | 4255 | GATCCC | 4775 | GTACGA | 5295 | AGACCT | 5815 | CTGCGA |
3736 | CCTTCA | 4256 | AGGCGG | 4776 | TGCGCA | 5296 | CAGGTA | 5816 | CTCGTC |
3737 | AGCTCA | 4257 | GGACCC | 4777 | GTCGTA | 5297 | ACCTTC | 5817 | AAGCGT |
3738 | CTGTCA | 4258 | CTACCC | 4778 | CGACTA | 5298 | CTTGCC | 5818 | ACAACG |
3739 | CATGAG | 4259 | CTCGGC | 4779 | CCGTAC | 5299 | CTGCAG | 5819 | GCCGCA |
3740 | CACACC | 4260 | CCTATC | 4780 | CGATAC | 5300 | GAACCA | 5820 | AACTCG |
3741 | CTCCAA | 4261 | CCATAC | 4781 | CGGTAC | 5301 | TAGGCA | 5821 | CCGAAA |
3742 | GACACA | 4262 | GGCCTA | 4782 | CGCACG | 5302 | AGTCCA | 5822 | CGTCCA |
3743 | ACCTGG | 4263 | CCCTAC | 4783 | GCGAAC | 5303 | CTAGGA | 5823 | CTCCGA |
3744 | CACTGA | 4264 | CCATGG | 4784 | CGCGCA | 5304 | CAACCA | 5824 | ACGATC |
3745 | AAGTGG | 4265 | GGGTTA | 4785 | AGCGCG | 5305 | AGTTCC | 5825 | ACGTCC |
3746 | CAAGAG | 4266 | ACTACC | 4786 | ACGCGG | 5306 | AGTCAC | 5826 | ACCGGG |
3747 | ATGTGG | 4267 | GTCCTA | 4787 | ACGGCG | 5307 | AGGCTC | 5827 | CACCGG |
3748 | AGGATG | 4268 | GCACTA | 4788 | GACGTC | 5308 | GAAGTC | 5828 | CGGCAC |
3749 | ACCTCC | 4269 | GCTAAC | 4789 | CGAGCG | 5309 | GAGCCC | 5829 | AACGTC |
3750 | GATGGA | 4270 | GTACAC | 4790 | CGGACG | 5310 | ATCAGG | 5830 | AGACGC |
3751 | AGAGGG | 4271 | GACCTA | 4791 | ACGCCG | 5311 | AGCATC | 5831 | CCGGAA |
3752 | CCACCC | 4272 | AGTACC | 4792 | ACGCGC | 5312 | TGGCCA | 5832 | CGTCAG |
3753 | CCAGGG | 4273 | CTAACC | 4793 | GCGTAC | 5313 | CAGGAC | 5833 | ACTTCG |
3754 | CATGGA | 4274 | GGTCTA | 4794 | CGCGAG | 5314 | GGTGCA | 5834 | ACGGCT |
3755 | ACCTCT | 4275 | GGATAC | 4795 | CGCGGA | 5315 | CCAGAC | 5835 | CACCGA |
3756 | GTGGGA | 4276 | GCTTAC | 4796 | CGCGTC | 5316 | AAGGCC | 5836 | AGCGGA |
3757 | GTGGCA | 4277 | GGGCTA | 4797 | CGGCGA | 5317 | GTTGGA | 5837 | CGTGAC |
3758 | CATTCC | 4278 | GTCAAC | 4798 | CCGCGA | 5318 | GCAAAC | 5838 | CGCAAA |
3759 | ACTGAG | 4279 | CGCCTC | 4799 | CGCCGA | 5319 | CAACTG | 5839 | AGGTCG |
3760 | AGTGGC | 4280 | CTAGTC | 4800 | ACCGGT | 5320 | CTGAAC | 5840 | CGATGA |
3761 | AGCACA | 4281 | GATACC | 4801 | CCGACG | 5321 | GAGTCA | 5841 | ACGTAG |
3762 | CCATCA | 4282 | GCCCTA | 4802 | CCGTCG | 5322 | ATGCAC | 5842 | CGTCAC |
3763 | ATGCAG | 4283 | GGTAAC | 4803 | CGTCGC | 5323 | GCACAA | 5843 | CCCGAA |
3764 | AAGTGC | 4284 | GATAGC | 4804 | CGACGC | 5324 | CAAGGG | 5844 | GATCGA |
3765 | CAAAGC | 4285 | AGACGG | 4805 | ACGACG | 5325 | CAGATC | 5845 | CGAGCA |
3766 | CTTTGC | 4286 | GGCTAC | 4806 | AACGCG | 5326 | CTGCTA | 5846 | CGGTGC |
3767 | GGTGGA | 4287 | CGTCTC | 4807 | ACGTCG | 5327 | GCCAGC | 5847 | AGCGCA |
3768 | GTGGAA | 4288 | ACTAGC | 4808 | CGCGAC | 5328 | AGGTGC | 5848 | ATGCGG |
3769 | AGAGCT | 4289 | GCATAC | 4809 | CGAACG | 5329 | CCAGTC | 5849 | CATACG |
3770 | CAACAG | 4290 | GGTTAC | 4810 | CGACCG | 5330 | CTACCA | 5850 | CCGTCA |
3771 | CCCACA | 4291 | GAGTAC | 4811 | ACGCGA | 5331 | AGTTGG | 5851 | AGACCG |
3772 | GGTGAA | 4292 | CGAGAC | 4812 | CGCGAA | 5332 | CCTTGC | 5852 | TCGTCA |
3773 | ACTGCT | 4293 | GTAGAC | 4813 | CGACGA | 5333 | CTTGTC | 5853 | ACGCAT |
3774 | AGTCTC | 4294 | AGGCCG | 4814 | GTCGAC | 5334 | AGTGAC | 5854 | ACGGGC |
3775 | GGCAAA | 4295 | GCCTAC | 4815 | CGTCGA | 5335 | GACTGA | 5855 | GGCGAA |
3776 | CCTGCA | 4296 | GCTACC | 4816 | CGCGTA | 5336 | AGGTTC | 5856 | GAACGA |
3777 | AGGTTG | 4297 | CGCCCA | 4817 | ACGCGT | 5337 | GAACAC | 5857 | AGCTCG |
3778 | GCTGCA | 4298 | GCGTGA | 4818 | TCGCGA | 5338 | GACTCA | 5858 | ACGACA |
3779 | TGAGCA | 4299 | GAGCTC | 4819 | CGATCG | 5339 | ATGCCC | 5859 | CCGCAA |
3780 | AGTGGA | 4300 | CCTAGG | 4820 | CGTACG | 5340 | CAGTAG | 5860 | ACGGCC |
3781 | AGACTG | 4301 | ACGCCT | 4821 | AGGCTG | 5341 | GTGCAA | 5861 | GCGCAC |
3782 | AGCCCA | 4302 | CCGAGG | 4822 | CACACA | 5342 | TAGGGA | 5862 | ACATCG |
3783 | AACCTC | 4303 | GGCGGA | 4823 | CCTCCC | 5343 | GGCCCA | 5863 | GCCGGA |
3784 | ATGCCA | 4304 | CGCCAC | 4824 | CAGGAG | 5344 | AGGGAC | 5864 | CATCGC |
3785 | CAAGCA | 4305 | GGGTAC | 4825 | CTGGGA | 5345 | GGACAA | 5865 | TCCGCA |
3786 | AACCCA | 4306 | CGTGAG | 4826 | CCCAGC | 5346 | AGGTAG | 5866 | CGGGAC |
3787 | GCAGCA | 4307 | ACCACG | 4827 | ACACAC | 5347 | ACTGCC | 5867 | CATCGA |
3788 | ACAGGG | 4308 | GCATGC | 4828 | CTCCCA | 5348 | ACTGTC | 5868 | ACCGCC |
3789 | CTCCAC | 4309 | CCACCG | 4829 | CCCAGG | 5349 | GGGCCA | 5869 | ATTCCG |
3790 | GAGTGA | 4310 | CCACGC | 4830 | AGGCAG | 5350 | AGAACC | 5870 | CATCCG |
3791 | AGCAGC | 4311 | CCGAGA | 4831 | ACAGAG | 5351 | CCTAGA | 5871 | ACCCGT |
3792 | CCCAAG | 4312 | CCCGAG | 4832 | AGAGAG | 5352 | AGCAAC | 5872 | CTTCGA |
3793 | GCTGAA | 4313 | CGGCTC | 4833 | CCAGGC | 5353 | ACTCCC | 5873 | TCGGAA |
3794 | CTTGGC | 4314 | CCGGGA | 4834 | GCCTCC | 5354 | GAGAGC | 5874 | ACGCAA |
3795 | AATGGG | 4315 | TCGAGA | 4835 | CCAGCC | 5355 | GATGCA | 5875 | ATTGCG |
3796 | CCTGAC | 4316 | GTGCAC | 4836 | AGGAAG | 5356 | AGACCC | 5876 | ACGAGT |
3797 | CCACAA | 4317 | CGAGGC | 4837 | AGGAGA | 5357 | ACCCAT | 5877 | GAACGC |
3798 | GGCCAA | 4318 | CCTCCG | 4838 | CCTCAG | 5358 | AAGTCC | 5878 | ACCCGA |
3799 | ACACCA | 4319 | GGCCGA | 4839 | GAGAGA | 5359 | AAGCCC | 5879 | ATTCGG |
3800 | CTGGCA | 4320 | CGGGCA | 4840 | AGCCTG | 5360 | CCTCTA | 5880 | TCGGCA |
3801 | GTGTGA | 4321 | ACCCGG | 4841 | GGAGAA | 5361 | GCCCAC | 5881 | AATGCG |
3802 | TGGCAA | 4322 | AGCCGA | 4842 | CAGAGA | 5362 | AACACC | 5882 | CCGACC |
3803 | AGCCAT | 4323 | CTCCGC | 4843 | ACTGCA | 5363 | AGGCCC | 5883 | CCGTTC |
3804 | CCAAGG | 4324 | ATCTCG | 4844 | CTCAGC | 5364 | ATCAGC | 5884 | ATGCCG |
3805 | ACCAGC | 4325 | CCCGTC | 4845 | AGACAG | 5365 | GTCTGA | 5885 | ATCGCC |
3806 | ATCCTG | 4326 | CGTGCC | 4846 | CACTGC | 5366 | ACTTGC | 5886 | ACCGAA |
3807 | CATCAC | 4327 | ATCACG | 4847 | AGGAGG | 5367 | ACATCC | 5887 | AACCGA |
3808 | CCCTGC | 4328 | AGCCGG | 4848 | CCCAAA | 5368 | CTAGAG | 5888 | TCCGAA |
3809 | ATGAGG | 4329 | CACACG | 4849 | CTGAGA | 5369 | CCAAGC | 5889 | ACCGCT |
3810 | CAGCCC | 4330 | CACCGC | 4850 | CTCCAG | 5370 | GATTCC | 5890 | CGTAAG |
3811 | CATGCA | 4331 | TCCCGA | 4851 | CAGGCA | 5371 | CTGGAC | 5891 | ACTCGA |
3812 | GGCACA | 4332 | AGATCG | 4852 | AGCTGG | 5372 | GATCCA | 5892 | CGTTGA |
3813 | AGAGGC | 4333 | CACCCG | 4853 | AGTGAG | 5373 | GTGTCA | 5893 | AACCGT |
3814 | CCCTTC | 4334 | CGTTTC | 4854 | CACAGA | 5374 | GAACCC | 5894 | GCGTCC |
3815 | AGTGTG | 4335 | ACCTCG | 4855 | TCAGGA | 5375 | CAAGTC | 5895 | CTCGCA |
3816 | AACCTG | 4336 | ACGTGG | 4856 | CAGGAA | 5376 | GCATCA | 5896 | GCGGAA |
3817 | AGACAC | 4337 | ACGGTG | 4857 | CCACCA | 5377 | ATGCTC | 5897 | CGGCAA |
3818 | AAAGGC | 4338 | ACGGAG | 4858 | CCTGCC | 5378 | GGCAAC | 5898 | CGAAGC |
3819 | CCACAC | 4339 | AAGCGA | 4859 | CAGTGA | 5379 | GGAGCC | 5899 | GCCCGA |
3820 | GCAAGA | 4340 | AAACGG | 4860 | CTGGGC | 5380 | ACAGTC | 5900 | ACGCTC |
3821 | CCCATC | 4341 | AGCGAG | 4861 | CCTGGC | 5381 | GCTCCC | 5901 | AGCGTC |
3822 | CTGTGC | 4342 | AGGCGC | 4862 | TCCCAA | 5382 | GGTGAC | 5902 | GTGCGA |
3823 | ACCCTG | 4343 | CAAGCG | 4863 | CCAGGA | 5383 | CATTGG | 5903 | CGGACA |
3824 | AAAGCC | 4344 | CTCGAA | 4864 | CAGAAG | 5384 | GACTCC | 5904 | AACGGT |
3825 | CTCTAC | 4345 | ACTCGG | 4865 | CCAAAG | 5385 | CTCAAC | 5905 | CGAACA |
3826 | ACAGGT | 4346 | ACCGTG | 4866 | CCAGCA | 5386 | GCAACC | 5906 | ACGGAT |
3827 | ACTGGA | 4347 | AGAGCG | 4867 | GAGGCA | 5387 | AGTGTC | 5907 | GACGCA |
3828 | ACAGCT | 4348 | AGCGAT | 4868 | ATCCCA | 5388 | CACAAC | 5908 | CTTCGC |
3829 | CATCCA | 4349 | CCGCCA | 4869 | AGCCTC | 5389 | AGCACC | 5909 | AGTGCG |
3830 | ACTGGG | 4350 | CACGAG | 4870 | CAGTGG | 5390 | ACTGGC | 5910 | CCGTAA |
3831 | CACTCA | 4351 | ACACGT | 4871 | GGCTCA | 5391 | CCAGTA | 5911 | CGGGTC |
3832 | ATCCAG | 4352 | ATGGCG | 4872 | GACAGA | 5392 | ACACCC | 5912 | CGTAGA |
3833 | CTGTTC | 4353 | AACGTG | 4873 | TGGGAA | 5393 | AAGGGT | 5913 | CGTTGC |
3834 | ATCTCC | 4354 | CCCACG | 4874 | GGAAGA | 5394 | ACCCTC | 5914 | CGCCAA |
3835 | CCTGTC | 4355 | CGTGAA | 4875 | AGGGAA | 5395 | GAGGGC | 5915 | AGCGCT |
3836 | CTACAG | 4356 | ACACGG | 4876 | GGGAAA | 5396 | GGTAGA | 5916 | GACGAA |
3837 | AGTGGG | 4357 | ACGAGG | 4877 | CTGGAA | 5397 | ACCAAC | 5917 | GACGCC |
3838 | GGTTCA | 4358 | AACACG | 4878 | TCTCCA | 5398 | AAGGGC | 5918 | CGAGTC |
3839 | ACTTCC | 4359 | GCGCCA | 4879 | GAGGAA | 5399 | AGGCTA | 5919 | ACCGTA |
3840 | AGCATG | 4360 | ACGCCA | 4880 | CACCTG | 5400 | ATGGCC | 5920 | CGATCC |
3841 | AGGGCA | 4361 | TCACGA | 4881 | GAAGGA | 5401 | ACCAGT | 5921 | GCCGAA |
3842 | TAGCCA | 4362 | GGATCC | 4882 | ACACAG | 5402 | AGGATC | 5922 | ATACGG |
3843 | CTGACC | 4363 | GCGAGA | 4883 | GGCTGA | 5403 | CCCAAC | 5923 | CGATCA |
3844 | GAGACC | 4364 | AACCCG | 4884 | GCCTCA | 5404 | AGGGCC | 5924 | CGCAAG |
3845 | TGGACA | 4365 | CAGCCG | 4885 | AGAGGA | 5405 | CAAGCC | 5925 | GCGAGC |
3846 | AAGGCT | 4366 | ACGTGA | 4886 | GAGACA | 5406 | AAGGTC | 5926 | AAGTCG |
3847 | CACTTC | 4367 | ACGCCC | 4887 | GCTGGA | 5407 | GACCAA | 5927 | CACGAC |
3848 | AATGGC | 4368 | GAGCGA | 4888 | CTTTCC | 5408 | CCTACA | 5928 | CCGACA |
3849 | CATCAG | 4369 | CCACGG | 4889 | CTGCAA | 5409 | ATTGCC | 5929 | AACGCC |
3850 | CACTGG | 4370 | GACGGA | 4890 | CTTCTC | 5410 | CAGACC | 5930 | ACGGTA |
3851 | CTGAGC | 4371 | CGATTC | 4891 | CCTGAG | 5411 | ACAAGC | 5931 | TACGCA |
3852 | ATCCTC | 4372 | ACGGGA | 4892 | CCTGTA | 5412 | CAGTCC | 5932 | AGTCGG |
3853 | CAGGCC | 4373 | CGGCCA | 4893 | CAGAGG | 5413 | GGACAC | 5933 | ACTACG |
3854 | AACAGG | 4374 | GGCGCA | 4894 | AGATGG | 5414 | GCCAAC | 5934 | CGGTTC |
3855 | CAGAAC | 4375 | ACTCCG | 4895 | ATGGTG | 5415 | GCTGTA | 5935 | ATGCGC |
3856 | ATCTGC | 4376 | CACGCA | 4896 | CACCAC | 5416 | CTGGTA | 5936 | ACCGCG |
3857 | ACTTGG | 4377 | GGGCGA | 4897 | ACTCCA | 5417 | GGCCAC | 5937 | AATCCG |
3858 | CAAGAC | 4378 | AATCGC | 4898 | ACCCAG | 5418 | GATGGC | 5938 | GACGGC |
3859 | CTTGGA | 4379 | AAAGCG | 4899 | TGCCCA | 5419 | CAATGC | 5939 | ACCGTC |
3860 | AGCTAC | 4380 | CGGGAA | 4900 | AGAAGG | 5420 | CACCTA | 5940 | CAGTCG |
3861 | AGCTTC | 4381 | CGGTGA | 4901 | CTTCCA | 5421 | GATTGC | 5941 | CGCCTA |
3862 | GCAACA | 4382 | CGTGGC | 4902 | AGCCAG | 5422 | AGTGCC | 5942 | CGTCTA |
3863 | ACACCT | 4383 | CGCTGC | 4903 | CCTTCC | 5423 | CATGAC | 5943 | ACGTAC |
3864 | ACCTGA | 4384 | ACGAAG | 4904 | GGAGGA | 5424 | GACCCA | 5944 | CGCATC |
3865 | GAGCAA | 4385 | ACGTGC | 4905 | AGGGAG | 5425 | GAGGAC | 5945 | CGGTCA |
3866 | GCCAAA | 4386 | CCAGCG | 4906 | CTGTGA | 5426 | CAGCTG | 5946 | CGTACA |
3867 | GAAAGC | 4387 | AGTTCG | 4907 | ACTCTG | 5427 | CCCTAA | 5947 | CAACGG |
3868 | CACCAA | 4388 | CGCACC | 4908 | CAGCAG | 5428 | CAATCC | 5948 | TGCGAA |
3869 | CCCTGA | 4389 | CGTGGA | 4909 | CCAGAA | 5429 | GTGAAC | 5949 | CGATGC |
3870 | AACTGG | 4390 | CGACAG | 4910 | GGCAGA | 5430 | CCAACC | 5950 | ATGTCG |
3871 | CCATCC | 4391 | CGGCAG | 4911 | CTCAGA | 5431 | ACTGAC | 5951 | CGACTC |
3872 | CTTGCA | 4392 | CCGCAG | 4912 | TCTGCA | 5432 | CAGGTC | 5952 | CCTACG |
3873 | CAGGGC | 4393 | CGAGTA | 4913 | GTCTCA | 5433 | AGCCTA | 5953 | GGACGA |
3874 | GGAACA | 4394 | GTTCGA | 4914 | CTCTGC | 5434 | GAATCC | 5954 | ACCGGC |
3875 | CTTCAC | 4395 | AACGGG | 4915 | AAGGAG | 5435 | AGGGTC | 5955 | CGACAA |
3876 | ACCACT | 4396 | CGTGCA | 4916 | GAGCCA | 5436 | GACAGC | 5956 | TACGGA |
3877 | CTGACA | 4397 | ACGCTG | 4917 | AGGTGG | 5437 | CTAGCA | 5957 | CCGGAC |
3878 | GCAGCC | 4398 | CAGACG | 4918 | CATCTC | 5438 | AGTAGG | 5958 | AACGGC |
3879 | CCATGA | 4399 | CCAACG | 4919 | AGCAGA | 5439 | GAGGTA | 5959 | CGTCAA |
3880 | AAGGTG | 4400 | GCGGGA | 4920 | ACAGGC | 5440 | ATGGAC | 5960 | CGTATC |
3881 | CACCAG | 4401 | CAGCGG | 4921 | AAGCAG | 5441 | GCCCAA | 5961 | AACCGC |
3882 | ACAGAC | 4402 | CGGAGC | 4922 | CTTCCC | 5442 | ATTGGG | 5962 | CATCGG |
3883 | GTGACA | 4403 | AGCGTG | 4923 | CCTTTC | 5443 | ATGGGC | 5963 | CGTTAG |
3884 | GCTTCC | 4404 | CGCTCC | 4924 | AATCCC | 5444 | CATAGG | 5964 | ATGCGA |
3885 | GAACTC | 4405 | CTGCGC | 4925 | AGAGCA | 5445 | GTGGTA | 5965 | GCGCAA |
3886 | AGACTC | 4406 | ATCGTG | 4926 | GCAGGA | 5446 | CCTAAG | 5966 | AATCGG |
3887 | AGTCAG | 4407 | CCGTGC | 4927 | GCAGAA | 5447 | GGGCAC | 5967 | ACGAGC |
3888 | AAGAGC | 4408 | CCTGCG | 4928 | TCCTCA | 5448 | ACAACC | 5968 | ATCGTC |
3889 | CCCTCA | 4409 | ACCGCA | 4929 | CCCACC | 5449 | CTGTAC | 5969 | CTCGAC |
3890 | CACATC | 4410 | ACGGAA | 4930 | CTCTTC | 5450 | CCACTA | 5970 | AGTCCG |
3891 | GCCACA | 4411 | CACGGC | 4931 | CCTCCA | 5451 | GGCACC | 5971 | TCGCAA |
3892 | AAGCCT | 4412 | AGCCCG | 4932 | CAGCCA | 5452 | AGCTAG | 5972 | GCGTCA |
3893 | AGTAGC | 4413 | CACGGG | 4933 | AAGGGA | 5453 | GGGAAC | 5973 | ACGACT |
3894 | AGTCTG | 4414 | CACGGA | 4934 | CTCACA | 5454 | CTGATC | 5974 | AACCGG |
3895 | CTGGTC | 4415 | CAACGA | 4935 | AAGGCA | 5455 | GCAGAC | 5975 | CGGTCC |
3896 | GGGCAA | 4416 | CACGTA | 4936 | AGAGAC | 5456 | ATGGTC | 5976 | CGGGTA |
3897 | ATGTGC | 4417 | AGCGGG | 4937 | CAGGGA | 5457 | ATTGGC | 5977 | ACGGAC |
3898 | GATCAC | 4418 | CGGAAG | 4938 | CAGCAC | 5458 | GGGTCA | 5978 | CGACCC |
3899 | CCTCAC | 4419 | CGAGAA | 4939 | ACAGCA | 5459 | CAACCC | 5979 | TCGACA |
3900 | GCATGA | 4420 | CGCACA | 4940 | ACATGG | 5460 | AGATCC | 5980 | CGACAC |
3901 | CCTTGA | 4421 | AGAACG | 4941 | CTGGCC | 5461 | CTTGAC | 5981 | ACGAAC |
3902 | TGCCAA | 4422 | CGCAGC | 4942 | TCACCA | 5462 | GGACTA | 5982 | GCTCGA |
3903 | CCATGC | 4423 | CAAACG | 4943 | ACAGTG | 5463 | CCTTAG | 5983 | CTACGA |
3904 | AACCAG | 4424 | ACGCAG | 4944 | AAGAGG | 5464 | GCAGTA | 5984 | CCGGTC |
3905 | GCTTCA | 4425 | AAGACG | 4945 | CACCCA | 5465 | CCCATA | 5985 | CGAATC |
3906 | ACAAGG | 4426 | GGTACC | 4946 | CTCTGA | 5466 | GAGCTA | 5986 | CAACGC |
3907 | GTGCCA | 4427 | CCGGAG | 4947 | GGGAGA | 5467 | GATGAC | 5987 | AGCGAC |
3908 | CTCATC | 4428 | CGAGGA | 4948 | AGACCA | 5468 | GGTTGA | 5988 | CCGTAG |
3909 | CTCACC | 4429 | GATCGC | 4949 | AGCCAC | 5469 | GCTACA | 5989 | ACTCGC |
3910 | AGGCAC | 4430 | ACCCGC | 4950 | AGCACT | 5470 | GCACCC | 5990 | ATCGGG |
3911 | AGCTGC | 4431 | CACGTG | 4951 | ACCACA | 5471 | GGCTTA | 5991 | CGGTAA |
3912 | AGCTCC | 4432 | GCTAGC | 4952 | CACATG | 5472 | GGGATA | 5992 | AACGAC |
3913 | GCTTGA | 4433 | ACACGC | 4953 | CTCCTC | 5473 | GGTCAA | 5993 | AGTCGA |
3914 | ATTCCC | 4434 | AAGGCG | 4954 | CAGAGC | 5474 | AGGGTA | 5994 | ATCCGG |
3915 | AACAGC | 4435 | CGGCTA | 4955 | CAGCAA | 5475 | ATGACC | 5995 | CCCGTA |
3916 | CCAAAC | 4436 | ACTGCG | 4956 | AAGCCA | 5476 | ACCTAG | 5996 | ACGCTA |
3917 | GAGAAC | 4437 | ACGTCT | 4957 | CCCAGA | 5477 | GTAGGA | 5997 | CAACCG |
3918 | AGCCCT | 4438 | CAGCGA | 4958 | CCACAG | 5478 | GCTAGA | 5998 | ACGGTC |
3919 | CAGTCA | 4439 | CACGTC | 4959 | CTGAAG | 5479 | CATAGC | 5999 | GACGTA |
3920 | AGGAGC | 4440 | ACGTTG | 4960 | CAGCTA | 5480 | GTCCAA | 6000 | ATAGCG |
3921 | ATCTGG | 4441 | GCGACA | 4961 | GCTCAC | 5481 | AGTTGC | 6001 | CGACCA |
3922 | CAATGG | 4442 | ATCCCG | 4962 | CTCTCC | 5482 | GGTACA | 6002 | CAATCG |
3923 | CACAAG | 4443 | AGGGCG | 4963 | AGGCAT | 5483 | GAGCAC | 6003 | CGGAAC |
3924 | AGGGAT | 4444 | CCTCGC | 4964 | ACCTCA | 5484 | GCCATA | 6004 | CGGTAG |
3925 | GAATGC | 4445 | CGGAGA | 4965 | CCCTCC | 5485 | CCATAG | 6005 | CTCGTA |
3926 | ACCAGA | 4446 | CGCCAG | 4966 | CCTGGA | 5486 | CTTAGC | 6006 | ATCCGA |
3927 | ATCCAC | 4447 | CCGTGA | 4967 | ACCATG | 5487 | GATGCC | 6007 | GACCGA |
3928 | GTCCCA | 4448 | ACGAGA | 4968 | CAGACA | 5488 | GCTCTA | 6008 | ACCGGA |
3929 | GCCTGA | 4449 | ACAGCG | 4969 | CCTCTC | 5489 | AGGACC | 6009 | CGCATA |
3930 | GCCAGA | 4450 | AGCACG | 4970 | TCCAGA | 5490 | CCCTTA | 6010 | ATACGC |
3931 | GACCTC | 4451 | ATCCGC | 4971 | AGCTGA | 5491 | ATAGGC | 6011 | AGCGTA |
3932 | AGGAAC | 4452 | TCGCCA | 4972 | CAAAGG | 5492 | CACGCC | 6012 | GACCGC |
3933 | CATGGC | 4453 | CTCGCC | 4973 | ATGGAG | 5493 | GGCATA | 6013 | CGCTTA |
3934 | ACCTTG | 4454 | CCTTCG | 4974 | AGAGTG | 5494 | GCATCC | 6014 | CGCTAA |
3935 | GAGTGC | 4455 | CCACGA | 4975 | GTGAGA | 5495 | GTGCTA | 6015 | CCGTTA |
3936 | AACTGC | 4456 | CAGCGC | 4976 | AGGCCA | 5496 | CCAATC | 6016 | ATTCGC |
3937 | ACATGC | 4457 | CCCTCG | 4977 | CTGCAC | 5497 | GACATC | 6017 | CGTAGC |
3938 | ACCCAA | 4458 | CCCGGA | 4978 | ACTCCT | 5498 | CAGGCG | 6018 | TAGCGA |
3939 | GGATCA | 4459 | CGAGAG | 4979 | AAACCC | 5499 | GTAGCA | 6019 | CGCAAC |
3940 | ACCACC | 4460 | GGCGAC | 4980 | AAAGGG | 5500 | GGACCA | 6020 | CGGACC |
3941 | AAGACC | 4461 | CCCGCA | 4981 | TCAGCA | 5501 | GACTGC | 6021 | ATCGGA |
3942 | CAAACC | 4462 | CACGAA | 4982 | CCAGAG | 5502 | GGGTAA | 6022 | CGTAAC |
3943 | GGGTGA | 4463 | AGACGA | 4983 | CCAACA | 5503 | CTAGGC | 6023 | CGATAG |
3944 | GGCTAA | 4464 | CGAAGA | 4984 | AGCCAA | 5504 | GCAAGC | 6024 | GCCGAC |
3945 | ACCAGG | 4465 | AGCCGC | 4985 | GAGGGA | 5505 | AGGCCT | 6025 | CTCGAG |
3946 | AGGGTG | 4466 | CGGAAA | 4986 | GAAGCA | 5506 | GGAGTA | 6026 | ACCGAT |
3947 | CAGTTC | 4467 | ATCGAG | 4987 | CAGATG | 5507 | GACCAC | 6027 | ATACCG |
3948 | GAGATC | 4468 | CGCAGA | 4988 | GAGGCC | 5508 | GGAACC | 6028 | CTACGC |
3949 | GAAGAC | 4469 | CGGATC | 4989 | ACTGTG | 5509 | ACCCTA | 6029 | AGTACG |
3950 | ACAGCC | 4470 | CCGCAC | 4990 | CATGCC | 5510 | GAGTCC | 6030 | GTCGAA |
3951 | ATCACC | 4471 | CGAAAC | 4991 | CCTGAA | 5511 | GCTGAC | 6031 | GGCGTA |
3952 | CAAGGC | 4472 | ATCGCA | 4992 | CCAAGA | 5512 | AGGTCC | 6032 | GCGGAC |
3953 | ACCATC | 4473 | AAACCG | 4993 | CTCTCA | 5513 | CCTACC | 6033 | TACCGA |
3954 | AATGCC | 4474 | GCACGC | 4994 | TGCACA | 5514 | GGTCAC | 6034 | CCGCTA |
3955 | ACCTGC | 4475 | CATTCG | 4995 | ATGCTG | 5515 | GCCTTA | 6035 | GGTCGA |
3956 | GAAGGC | 4476 | CGTGTC | 4996 | CCTCAA | 5516 | GTACCA | 6036 | GCGATA |
3957 | AACCAC | 4477 | CGTTCA | 4997 | AACTCC | 5517 | CTTACC | 6037 | ACGACC |
3958 | GCTCCA | 4478 | AACGGA | 4998 | CTGCCA | 5518 | GACTAC | 6038 | AGTCGC |
3959 | AACCCT | 4479 | GCACGA | 4999 | CACTCC | 5519 | CTATGC | 6039 | GCGCGA |
3960 | CATTGC | 4480 | ACGCAC | 5000 | AGGTGA | 5520 | ACCTAC | 6040 | CGTTAC |
3961 | CTGTCC | 4481 | ACGATG | 5001 | CACAGG | 5521 | CTACAC | 6041 | ATCGGC |
3962 | GGATGA | 4482 | AGGACG | 5002 | AGCAAG | 5522 | CTAGAC | 6042 | CGGATA |
3963 | GTTGCA | 4483 | AACGCA | 5003 | AAGCTG | 5523 | ATACCC | 6043 | GCGTAA |
3964 | CATGGG | 4484 | CGCTTC | 5004 | ACAGGA | 5524 | GACACC | 6044 | CGAACC |
3965 | GCTCAA | 4485 | CGTCCC | 5005 | CACCTC | 5525 | CACTAC | 6045 | GCGTTA |
3966 | CAACTC | 4486 | AAGCGG | 5006 | AGCAGG | 5526 | ATAGGG | 6046 | GACGAC |
3967 | GCAGGC | 4487 | AGGCGA | 5007 | AGGTCA | 5527 | GGGACC | 6047 | CGCTAC |
3968 | GGAGCA | 4488 | ACACGA | 5008 | GCCACC | 5528 | CTAAGC | 6048 | GCGACC |
3969 | ACCAAG | 4489 | ACGGCA | 5009 | AGTGCA | 5529 | CCCTAG | 6049 | CGGTTA |
3970 | CTACTC | 4490 | CCTCGA | 5010 | AGAAGC | 5530 | ATAGCC | 6050 | CCGAAC |
3971 | AGCTTG | 4491 | ACGTCA | 5011 | AGGCAA | 5531 | CATACC | 6051 | GTCGGA |
3972 | ATGAGC | 4492 | CCGCTC | 5012 | ACACTG | 5532 | GCCTAA | 6052 | GTCGCA |
3973 | AGAGCC | 4493 | CATGCG | 5013 | CCATTC | 5533 | CCTTAC | 6053 | GCCGTA |
3974 | AGGACT | 4494 | AAGCCG | 5014 | CACAGC | 5534 | GGTCCA | 6054 | CCGGTA |
3975 | ACTCAC | 4495 | AACGAG | 5015 | CTGCCC | 5535 | CTATCC | 6055 | CGTACC |
3976 | CATCCC | 4496 | CCGGCA | 5016 | CTCAAG | 5536 | CCTAGC | 6056 | ACCGAC |
3977 | AAGGAC | 4497 | AAGCGC | 5017 | ACTCAG | 5537 | ACTAGG | 6057 | CCGATC |
3978 | GTTCCA | 4498 | GAGCGC | 5018 | CTGCTC | 5538 | GACAAC | 6058 | ATCGCG |
3979 | GGAGAC | 4499 | AAACGC | 5019 | TCCACA | 5539 | CAGTAC | 6059 | CGCTAG |
3980 | GCTGCC | 4500 | ACGTTC | 5020 | ATGGGA | 5540 | CTAGCC | 6060 | GTCCGA |
3981 | AGTCCC | 4501 | ACCGAG | 5021 | CAAGTG | 5541 | CCTAAC | 6061 | TCCGGA |
3982 | GGGACA | 4502 | CGCTGA | 5022 | GGAAAC | 5542 | GGTGTA | 6062 | CCGATA |
3983 | TGACCA | 4503 | CCGAGC | 5023 | AGGACA | 5543 | AGGTAC | 6063 | ATCGAC |
3984 | CCACTC | 4504 | CCGTCC | 5024 | CAGCTC | 5544 | CGGGAG | 6064 | GCGGTA |
3985 | GTCACA | 4505 | CGCTCA | 5025 | CAAGGA | 5545 | CACTAG | 6065 | GCGCTA |
3986 | CATGTC | 4506 | GCGAAA | 5026 | GAAACC | 5546 | GTCCAC | 6066 | CACGCG |
3987 | ATGTCC | 4507 | GCGGCA | 5027 | ATGGCA | 5547 | GATCCC | 6067 | GTACGA |
3988 | AAGCAC | 4508 | CCGAAG | 5028 | CCTTCA | 5548 | AGGCGG | 6068 | TGCGCA |
3989 | CAACAC | 4509 | AACGCT | 5029 | AGCTCA | 5549 | GGACCC | 6069 | GTCGTA |
3990 | GAAGCC | 4510 | ACACCG | 5030 | CTGTCA | 5550 | CTACCC | 6070 | CGACTA |
3991 | TACCCA | 4511 | AGCGGC | 5031 | CATGAG | 5551 | CTCGGC | 6071 | CCGTAC |
3992 | GCACCA | 4512 | CGAAAG | 5032 | CACACC | 5552 | CCTATC | 6072 | CGATAC |
3993 | AGATGC | 4513 | CTCGGA | 5033 | CTCCAA | 5553 | CCATAC | 6073 | CGGTAC |
3994 | ACACTC | 4514 | CGTGTA | 5034 | GACACA | 5554 | GGCCTA | 6074 | CGCACG |
3995 | CAGTGC | 4515 | AGCGAA | 5035 | ACCTGG | 5555 | CCCTAC | 6075 | GCGAAC |
3996 | CTCCTA | 4516 | CCATCG | 5036 | CACTGA | 5556 | CCATGG | 6076 | CGCGCA |
3997 | AGAGTC | 4517 | CCCGAC | 5037 | AAGTGG | 5557 | GGGTTA | 6077 | AGCGCG |
3998 | ACCCAC | 4518 | AGCGCC | 5038 | CAAGAG | 5558 | ACTACC | 6078 | ACGCGG |
3999 | AAGCTC | 4519 | CGTTCC | 5039 | ATGTGG | 5559 | GTCCTA | 6079 | ACGGCG |
4000 | GTCAGA | 4520 | ATGACG | 5040 | AGGATG | 5560 | GCACTA | 6080 | GACGTC |
4001 | ACTCTC | 4521 | CGAGCC | 5041 | ACCTCC | 5561 | GCTAAC | 6081 | CGAGCG |
4002 | GCACAC | 4522 | CACTCG | 5042 | GATGGA | 5562 | GTACAC | 6082 | CGGACG |
4003 | AGACCT | 4523 | CTGCGA | 5043 | AGAGGG | 5563 | GACCTA | 6083 | ACGCCG |
4004 | CAGGTA | 4524 | CTCGTC | 5044 | CCACCC | 5564 | AGTACC | 6084 | ACGCGC |
4005 | ACCTTC | 4525 | AAGCGT | 5045 | CCAGGG | 5565 | CTAACC | 6085 | GCGTAC |
4006 | CTTGCC | 4526 | ACAACG | 5046 | CATGGA | 5566 | GGTCTA | 6086 | CGCGAG |
4007 | CTGCAG | 4527 | GCCGCA | 5047 | ACCTCT | 5567 | GGATAC | 6087 | CGCGGA |
4008 | GAACCA | 4528 | AACTCG | 5048 | GTGGGA | 5568 | GCTTAC | 6088 | CGCGTC |
4009 | TAGGCA | 4529 | CCGAAA | 5049 | GTGGCA | 5569 | GGGCTA | 6089 | CGGCGA |
4010 | AGTCCA | 4530 | CGTCCA | 5050 | CATTCC | 5570 | GTCAAC | 6090 | CCGCGA |
4011 | CTAGGA | 4531 | CTCCGA | 5051 | ACTGAG | 5571 | CGCCTC | 6091 | CGCCGA |
4012 | CAACCA | 4532 | ACGATC | 5052 | AGTGGC | 5572 | CTAGTC | 6092 | ACCGGT |
4013 | AGTTCC | 4533 | ACGTCC | 5053 | AGCACA | 5573 | GATACC | 6093 | CCGACG |
4014 | AGTCAC | 4534 | ACCGGG | 5054 | CCATCA | 5574 | GCCCTA | 6094 | CCGTCG |
4015 | AGGCTC | 4535 | CACCGG | 5055 | ATGCAG | 5575 | GGTAAC | 6095 | CGTCGC |
4016 | GAAGTC | 4536 | CGGCAC | 5056 | AAGTGC | 5576 | GATAGC | 6096 | CGACGC |
4017 | GAGCCC | 4537 | AACGTC | 5057 | CAAAGC | 5577 | AGACGG | 6097 | ACGACG |
4018 | ATCAGG | 4538 | AGACGC | 5058 | CTTTGC | 5578 | GGCTAC | 6098 | AACGCG |
4019 | AGCATC | 4539 | CCGGAA | 5059 | GGTGGA | 5579 | CGTCTC | 6099 | ACGTCG |
4020 | TGGCCA | 4540 | CGTCAG | 5060 | GTGGAA | 5580 | ACTAGC | 6100 | CGCGAC |
4021 | CAGGAC | 4541 | ACTTCG | 5061 | AGAGCT | 5581 | GCATAC | 6101 | CGAACG |
4022 | GGTGCA | 4542 | ACGGCT | 5062 | CAACAG | 5582 | GGTTAC | 6102 | CGACCG |
4023 | CCAGAC | 4543 | CACCGA | 5063 | CCCACA | 5583 | GAGTAC | 6103 | ACGCGA |
4024 | AAGGCC | 4544 | AGCGGA | 5064 | GGTGAA | 5584 | CGAGAC | 6104 | CGCGAA |
4025 | GTTGGA | 4545 | CGTGAC | 5065 | ACTGCT | 5585 | GTAGAC | 6105 | CGACGA |
4026 | GCAAAC | 4546 | CGCAAA | 5066 | AGTCTC | 5586 | AGGCCG | 6106 | GTCGAC |
4027 | CAACTG | 4547 | AGGTCG | 5067 | GGCAAA | 5587 | GCCTAC | 6107 | CGTCGA |
4028 | CTGAAC | 4548 | CGATGA | 5068 | CCTGCA | 5588 | GCTACC | 6108 | CGCGTA |
4029 | GAGTCA | 4549 | ACGTAG | 5069 | AGGTTG | 5589 | CGCCCA | 6109 | ACGCGT |
4030 | ATGCAC | 4550 | CGTCAC | 5070 | GCTGCA | 5590 | GCGTGA | 6110 | TCGCGA |
4031 | GCACAA | 4551 | CCCGAA | 5071 | TGAGCA | 5591 | GAGCTC | 6111 | CGATCG |
4032 | CAAGGG | 4552 | GATCGA | 5072 | AGTGGA | 5592 | CCTAGG | 6112 | CGTACG |
4033 | CAGATC | 4553 | CGAGCA | 5073 | AGACTG | 5593 | ACGCCT | ||
4034 | CTGCTA | 4554 | CGGTGC | 5074 | AGCCCA | 5594 | CCGAGG | ||
4035 | GCCAGC | 4555 | AGCGCA | 5075 | AACCTC | 5595 | GGCGGA | ||
4036 | AGGTGC | 4556 | ATGCGG | 5076 | ATGCCA | 5596 | CGCCAC | ||
4037 | CCAGTC | 4557 | CATACG | 5077 | CAAGCA | 5597 | GGGTAC | ||
4038 | CTACCA | 4558 | CCGTCA | 5078 | AACCCA | 5598 | CGTGAG | ||
4039 | AGTTGG | 4559 | AGACCG | 5079 | GCAGCA | 5599 | ACCACG | ||
4040 | CCTTGC | 4560 | TCGTCA | 5080 | ACAGGG | 5600 | GCATGC | ||
4041 | CTTGTC | 4561 | ACGCAT | 5081 | CTCCAC | 5601 | CCACCG | ||
4042 | AGTGAC | 4562 | ACGGGC | 5082 | GAGTGA | 5602 | CCACGC | ||
4043 | GACTGA | 4563 | GGCGAA | 5083 | AGCAGC | 5603 | CCGAGA | ||
4044 | AGGTTC | 4564 | GAACGA | 5084 | CCCAAG | 5604 | CCCGAG | ||
4045 | GAACAC | 4565 | AGCTCG | 5085 | GCTGAA | 5605 | CGGCTC | ||
4046 | GACTCA | 4566 | ACGACA | 5086 | CTTGGC | 5606 | CCGGGA | ||
4047 | ATGCCC | 4567 | CCGCAA | 5087 | AATGGG | 5607 | TCGAGA | ||
4048 | CAGTAG | 4568 | ACGGCC | 5088 | CCTGAC | 5608 | GTGCAC |
在一些實施例中,核苷酸序列(連接子)經設計以處於供體DNA上之一或多個結合區段之間。
在一些實施例中,連接子為約1至30個核苷酸長。在其他實施例中,連接子為約10至25個核苷酸長。在一些實施例中,連接子為至少5個核苷酸長。在一些實施例中,連接子為至少10個核苷酸長。在一些實施例中,連接子為至少15個核苷酸長。在一些實施例中,連接子為至少20個核苷酸長。在一些實施例中,連接子為至少25個核苷酸長。在一些實施例中,連接子為約5個核苷酸長。在一些實施例中,連接子為約10個核苷酸長。在一些實施例中,連接子為約15個核苷酸長。在一些實施例中,連接子為約20個核苷酸長。在一些實施例中,連接子為約25個核苷酸長。在一些實施例中,連接子為約30個核苷酸長。
在一些實施例中,連接子為去氧腺苷、去氧鳥苷、胸苷、去氧胞苷或其任何組合之序列。在一些特定實施例中,連接子為聚去氧腺苷之序列。在其他特定實施例中,連接子為聚胸苷之序列。在其他特定實施例中,連接子為去氧腺苷及胸苷之序列。
(f)
相關序列 (SOI)
在一些實施例中,依本文所描述之供體DNA之SOI包含具有一或多個核苷酸取代、一或多個核苷酸插入、一或多個核苷酸缺失或其任何組合之目標序列。
在一些特定實施例中,依本文所描述之供體DNA之SOI包含具有1至100個核苷酸之核苷酸插入的目標序列。在其他特定實施例中,依本文所描述之供體DNA之SOI包含具有1至50個核苷酸之核苷酸插入的目標序列。在其他特定實施例中,依本文所描述之供體DNA之SOI包含具有2至10個核苷酸之核苷酸插入的目標序列。在其他特定實施例中,依本文所描述之供體DNA之SOI包含具有至少2個、至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個或至少10個核苷酸之核苷酸插入的目標序列。在其他特定實施例中,依本文所描述之供體DNA之SOI包含具有至少11個、至少12個、至少13個、至少14個、至少15個、至少16個、至少17個、至少18個、至少19個或至少20個核苷酸之核苷酸插入的目標序列。在其他特定實施例中,依本文所描述之供體DNA之SOI包含具有至少50、至少100、至少1,000、至少10,000或至少100,000個核苷酸之核苷酸插入的目標序列。
在一些特定實施例中,本文所描述之供體DNA之SOI包含具有1至50個核苷酸之核苷酸缺失的目標序列。在其他特定實施例中,依本文中所描述之供體DNA之SOI包含具有1至10個核苷酸之核苷酸缺失的目標序列。在其他特定實施例中,依本文所描述之供體DNA之SOI包含具有至少2個、至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個或至少10個核苷酸之核苷酸缺失的目標序列。在其他特定實施例中,依本文所描述之供體DNA之SOI包含具有至少11個、至少12個、至少13個、至少14個、至少15個、至少16個、至少17個、至少18個、至少19個或至少20個核苷酸之核苷酸缺失的目標序列。
在一些特定實施例中,本文所描述之供體DNA之SOI包含具有1至50個核苷酸之核苷酸取代的目標序列。在其他特定實施例中,依本文所描述之供體DNA之SOI包含具有1至10個核苷酸之核苷酸取代的目標序列。在其他特定實施例中,依本文所描述之供體DNA之SOI包含具有至少2個、至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個或至少10個核苷酸之核苷酸取代的目標序列。在其他特定實施例中,依本文所描述之供體DNA之SOI包含具有至少11個、至少12個、至少13個、至少14個、至少15個、至少16個、至少17個、至少18個、至少19個或至少20個核苷酸之核苷酸取代的目標序列。
此外,依本文所描述之供體DNA之SOI用作在嚮導RNA-藥用核酸酶切割後進行同源重組之模板,因此在一些實施例中,供體DNA之第二部分進一步包含上游及/或下游同源臂。
在一些實施例中,本文所描述之上游同源臂為約10至1,000個核苷酸長。在其他實施例中,本文所描述之上游同源臂為約10至80個核苷酸長。在一些實施例中,本文所描述之上游同源臂為至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少55、至少60、至少65或至少70個鹼基長。在一些特定實施例中,本文所描述之上游同源臂為約20個核苷酸長。在一些特定實施例中,本文所描述之上游同源臂為約25個核苷酸長。在一些特定實施例中,本文所描述之上游同源臂為約30個核苷酸長。在一些特定實施例中,本文所描述之上游同源臂為約35個核苷酸長。
在一些實施例中,本文所描述之下游同源臂為約10至1,000個核苷酸長。在其他實施例中,本文所描述之下游同源臂為約10至80個核苷酸長。在一些實施例中,本文所描述之下游同源臂為至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少55、至少60、至少65或至少70個鹼基長。在一些特定實施例中,本文所描述之下游同源臂為約20個核苷酸長。在一些特定實施例中,本文所描述之下游同源臂為約25個核苷酸長。在一些特定實施例中,本文所描述之下游同源臂為約30個核苷酸長。在一些特定實施例中,本文所描述之下游同源臂為約35個核苷酸長。
在一些實施例中,供體DNA之第二部分進一步包含遠端及/或近端同源臂。在一些實施例中,遠端同源臂為約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80個核苷酸長。在一些實施例中,近端同源臂為約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80個核苷酸長。
在一些特定實施例中,本文所描述之供體DNA之SOI經最佳化以避免系統中使用之CRISPR核酸酶的任何PAM序列。例如,在一些實施例中,本文所描述之供體DNA之SOI藉由沉默突變最佳化以避免系統中使用之CRISPR核酸酶的任何PAM序列,而不改變SOI中之胺基酸的含量。
(g)
供體 DNA 之其他特徵
依本文所描述之供體DNA,依
圖 3A-
圖 3E所示作為非限制性實例,可呈多種設計形式。在一些實施例中,供體DNA為單股。在其他實施例中,供體DNA之第一部分為單股且供體DNA之第二部分為完全雙股。在其他實施例中,供體DNA之第一部分為單股且供體DNA之第二部分為部分雙股。在一些實施例中,供體DNA在其3'端封閉。在一些實施例中,供體DNA在其5'端封閉。在一些實施例中,供體DNA在其3'及5'端封閉。在一些特定實施例中,供體DNA形成髮夾之二級結構,其中一或多個結合區段位於髮夾之環內。在一些特定實施例中,供體DNA形成具有啞鈴形狀之二級結構,其中一或多個結合區段位於啞鈴之一個環內。在一些特定實施例中,本文所描述之供體DNA為環狀DNA。在一些特定實施例中,本文所描述之供體DNA形成具有部分啞鈴形狀之二級結構,其中一或多個結合區段位於啞鈴之一個環內。
此外,包含一或多個結合區段的依本文所描述之供體DNA之第一部分可被設計為供體DNA之不同位置,依
圖 4及
圖 5中所測試。在一些實施例中,供體DNA之第一部分在供體DNA之第二部分之5'處。在其他實施例中,供體DNA之第一部分在供體DNA之第二部分之3'處。
(h)
Cas 蛋白
在一些實施例中,本文所描述之系統進一步包含CRISPR核酸酶。在一些特定實施例中,CRISPR核酸酶為DNA核酸酶。
在一些實施例中,CRISPR核酸酶為I類CRISPR核酸酶。在其他實施例中,CRISPR核酸酶為II類CRISPR核酸酶。
在一些實施例中,CRISPR核酸酶為I型CRISPR核酸酶。在一些特定實施例中,CRISPR核酸酶為I-A型、I-B型、I-C、I-D、I-E、I-F或I-U CRISPR核酸酶。在其他實施例中,CRISPR核酸酶為II型CRISPR核酸酶。在一些特定實施例中,CRISPR核酸酶為II-A型、II-B型或II-C型CRISPR核酸酶。在一些實施例中,CRISPR核酸酶為III型CRISPR核酸酶。在一些特定實施例中,CRISPR核酸酶為III-A型、III-B型、III-C型或III-D型CRISPR核酸酶。在一些實施例中,CRISPR核酸酶為IV型CRISPR核酸酶。在其他實施例中,CRISPR核酸酶為V型CRISPR核酸酶。在一些特定實施例中,CRISPR核酸酶為V-A型、V-B或V-C CRISPR核酸酶。
在一些實施例中,本文所描述之DNA核酸酶為Cas1、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Cas12、Cas14、CasΦ、Casm或Cmr。在一些特定實施例中,當DNA核酸酶為Cas 9時,DNA核酸酶為高保真Cas9或eCas9。在一些特定實施例中,當DNA核酸酶為Cas 12時,DNA核酸酶為Cas12a (Cpf1)、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、Cas12i、Cas12j或Cas12k。
在一個態樣中,本文提供一種套組,其包含本文所描述之供體DNA及本文所描述之經修飾之sgRNA。在一些實施例中,套組包含本文所描述之供體DNA、本文所描述之經修飾之sgRNA及本文所描述之CRISPR核酸酶。
在一個態樣中,本文提供一種醫藥組合物,其包含本文所描述之供體DNA、本文所描述之經修飾之sgRNA及其醫藥學上可接受之鹽或衍生物。在一些實施例中,套組包含本文所描述之供體DNA、本文所描述之經修飾之sgRNA、本文所描述之CRISPR核酸酶及其醫藥學上可接受之鹽或衍生物。
2. 使用本文所描述之系統的方法
在一個態樣中,本文提供一種修飾細胞之方法,其中該方法包含將依本文所描述之系統轉運至細胞。
在一些實施例中,轉運包含(a)培育本文所描述之CRISPR核酸酶及本文所描述之經修飾之sgRNA以形成核糖核蛋白(RNP)複合物;(b)將供體DNA施用於RNP複合物;及(c)將來自(b)之RNP複合物-供體DNA輸送至該細胞。在一些特定實施例中,RNP複合物在步驟(a)中活體外形成。在一些實施例中,本文所描述之CRISPR核酸酶使用相關質體表現及純化。在一些實施例中,經修飾之sgRNA活體外自對應ssDNA轉錄。在一些非限制性例示性實施例中,在步驟(a)中CRISPR核酸酶與經修飾之sgRNA的比率為約1:0.5至約1:10。在其他非限制性例示性實施例中,在步驟(a)中CRISPR核酸酶與經修飾之sgRNA的比率為約1:1至約1:1.2。在其他非限制性例示性實施例中,步驟(a)中之CRISPR核酸酶與經修飾之sgRNA的比率為約1:0.6、約1:1.2、約1:2或約1:5。在一些特定實施例中,在步驟(b)中將供體DNA施用於RNP複合物係活體外進行。在一些特定實施例中,將來自(b)之RNP複合物-供體DNA輸送至細胞係藉由病毒載體、脂質體及/或脂質奈米粒子實現。在其他特定實施例中,將來自(b)之RNP複合物-供體DNA輸送至細胞係藉由電穿孔實現。在一個實施例中,將來自(b)之RNP複合物-供體DNA輸送至細胞係藉由核轉染實現(參見例如,Distler等人, Exp Dermatol 2005年4月;14(4):315-20)。在其他特定實施例中,將來自(b)之RNP複合物-供體DNA輸送至細胞係藉由聚乙二醇(PEG)介導之轉染來實現。在其他特定實施例中,將來自(b)之RNP複合物-供體DNA輸送至細胞係藉由基因槍實現。
在一些實施例中,轉運包含(a)提供包含編碼本文所描述之CRISPR核酸酶之核苷酸序列及編碼本文所描述之經修飾之gRNA之核苷酸序列的一或多種載體;(b)將(a)之一或多種載體輸送至細胞;及(c)將本文所描述之供體DNA輸送至細胞。在一些較佳實施例中,步驟(c)在步驟(b)之後約6至48小時進行。在其他較佳實施例中,步驟(c)在步驟(b)之後至少6小時進行。在其他較佳實施例中,步驟(c)在步驟(b)之後至少12小時進行。在其他較佳實施例中,步驟(c)在步驟(b)之後至少18小時進行。在其他較佳實施例中,步驟(c)在步驟(b)之後至少24小時進行。在其他較佳實施例中,步驟(c)在步驟(b)之後至少30小時進行。在其他較佳實施例中,步驟(c)在步驟(b)之後至少36小時進行。在其他較佳實施例中,步驟(c)在步驟(b)之後至少42小時進行。在其他較佳實施例中,步驟(c)在步驟(b)之後至少48小時進行。在一些特定實施例中,將(a)之一或多種載體輸送至細胞係藉由病毒載體、脂質體及/或脂質奈米粒子實現。在一些特定實施例中,將供體DNA輸送至細胞係藉由病毒載體、脂質體及/或脂質奈米粒子實現。
在一些實施例中,本文中經修飾之細胞為免疫細胞。在一些特定實施例中,本文中經修飾之細胞為T細胞。在一些特定實施例中,本文中經修飾之細胞為B細胞。在一些特定實施例中,本文中經修飾之細胞為NK細胞。在一些特定實施例中,本文中經修飾之細胞為造血幹細胞。
在一些實施例中,本文所描述之方法係活體外進行。在其他實施例中,本文所描述之方法係離體進行。在其他實施例中,本文所描述之方法係活體內進行。
因為本文中所描述之核酸酶的裂解效率相對較高且同源定向修復(HDR)之效率相對較低,所以大部分核酸酶誘導之雙股斷裂(DSB)可經由NHEJ修復。換言之,所得細胞群可能含有野生型對偶基因、經NHEJ修復之對偶基因及/或基於本文所描述之供體DNA之SOI設計的所需編輯對偶基因之某一組合。鑒於所需編輯之較高百分比、低脫靶率及/或低易位率、大插入率或大缺失率,使用本文所描述之系統修飾細胞的方法為有利的。
在一些實施例中,使用本文所描述之方法的所需編輯之百分比比不含包含結合至經修飾之sgRNA之第一部分之供體DNA及/或不含經修飾之sgRNA的類似系統高至少10%、至少50%、至少100%或至少200%。在其他實施例中,本文所描述之方法之脫靶率比不含包含結合至修飾之sgRNA之第一部分之供體DNA及/或不含修飾之sgRNA的類似系統低至少10%、至少50%或至少100%。在其他實施例中,方法之易位率、大插入率或大缺失率比不含包含結合至經修飾之sgRNA之第一部分之供體DNA及/或不含經修飾之sgRNA的類似系統低至少10%、至少50%或至少100%。
為了進一步增加HDR速率,在一些實施例中,本文所描述之方法進一步包含使細胞同步至S期。在其他實施例中,本文所描述之方法進一步包含使細胞同步至G2期。在其他實施例中,本文所描述之方法進一步包含抑制參與NHEJ路徑之基因。在其他實施例中,本文所描述之方法進一步包含抑制參與錯配-修復路徑之基因。在其他實施例中,本文所描述之方法進一步包含使ctIP (參與雙股斷裂切除之蛋白)與CRISPR核酸酶融合。在其他實施例中,本文所描述之方法進一步包含使單股黏接蛋白與CRISPR核酸酶融合。
在另一態樣中,本文提供一種治療遺傳病症之方法,其中該方法包含向個體投與有效量之本文所描述之系統。在一些實施例中,SOI包含逆轉或緩解遺傳病症之序列。
實例
以下為用於研究之各種方法及材料的描述,且經提出以向一般熟習此項技術者提供如何製造及使用本發明之完全揭示及描述,且不意欲限制本發明人視為其揭示內容之範疇,亦不意欲表示以下實驗已進行且為所有可進行之實驗。已努力確保關於所用數量(例如量、百分比等)的精確度,但應考慮存在一些實驗性誤差及偏差。
實例 1 : 「融合 - 寡核苷酸設計」及「末端錨設計」經證實為功能異常
「融合-寡核苷酸設計」被稱為供體DNA與嚮導RNA融合之系統(參見
圖 1A)。簡言之,測試下表5中所列之具有不同長度供體DNA之嚮導RNA-供體DNA融合物。依
圖 1B及
圖 1C所示,「融合-寡核苷酸設計」相比於陽性對照顯示可忽略的編輯效率。
表 5. 嚮導 RNA- 供體 DNA 融合物之序列
表 6 「末端錨設計」中之供體 DNA 序列
*表示硫代磷酸酯鍵聯
SEQ ID NO. | 序列 | 註釋 |
6113 | rArGrCrArUrArGrCrArArGrUrUrArArArArUrArArGrGrCrUrArGrUrCrCrGrUrUrArUrCrArArCrUrUrGrArArArArArGrUrGrGrCrArCrCrGrArGrUrCrGrGrUrGrCrUrUrUctttcctctgccatcaaagcgtgctcagtctgg | 圖 1B/1C中之「長度14nt」 |
6114 | rArGrCrArUrArGrCrArArGrUrUrArArArArUrArArGrGrCrUrArGrUrCrCrGrUrUrArUrCrArArCrUrUrGrArArArArArGrUrGrGrCrArCrCrGrArGrUrCrGrGrUrGrCrUrUrUctttcctctgccatcaaagcgtgctcagtctgggcc | 圖 1B/1C中之「長度17nt」 |
6115 | rArGrCrArUrArGrCrArArGrUrUrArArArArUrArArGrGrCrUrArGrUrCrCrGrUrUrArUrCrArArCrUrUrGrArArArArArGrUrGrGrCrArCrCrGrArGrUrCrGrGrUrGrCrUrUrUctttcctctgccatcaaagcgtgctcagtctgggcccca | 圖 1B/1C中之「長度20nt」 |
6116 | rArGrCrArUrArGrCrArArGrUrUrArArArArUrArArGrGrCrUrArGrUrCrCrGrUrUrArUrCrArArCrUrUrGrArArArArArGrUrGrGrCrArCrCrGrArGrUrCrGrGrUrGrCrUrUrUctttcctctgccatcaaagcgtgctcagtctgggccccaagg | 圖 1B/1C中之「長度23nt」 |
SEQ ID NO. | 序列 | 註釋 |
6117 | C*T*TTCCTCTGCCATCAAAGCGTGCTCAGTCTGGGCCC*C*A | 圖 2B/2C中之「尾0」 |
6118 | C*C*ACTTTCCTCTGCCATCAAAGCGTGCTCAGTCTGGGCCC*C*A | 圖 2B/2C中之「尾03」 |
6119 | C*T*CCACTTTCCTCTGCCATCAAAGCGTGCTCAGTCTGGGCCC*C*A | 圖 2B/2C中之「尾05」 |
6120 | T*C*CTCCACTTTCCTCTGCCATCAAAGCGTGCTCAGTCTGGGCCC*C*A | 圖 2B/2C中之「尾07」 |
6121 | G*T*GTCCTCCACTTTCCTCTGCCATCAAAGCGTGCTCAGTCTGGGCCC*C*A | 圖 2B/2C中之「尾10」 |
6122 | G*T*CGTGTCCTCCACTTTCCTCTGCCATCAAAGCGTGCTCAGTCTGGGCCC*C*A | 圖 2B/2C中之「尾13」 |
單獨地,亦測試「末端錨設計」。「末端錨設計」被稱為包含與供體DNA部分互補之嚮導RNA的系統,且互補序列位於嚮導RNA之末端(參見
圖 2A)。簡言之,測試上表6中所列之具有與嚮導RNA之3'端不同長度之互補序列的供體DNA。依
圖 2B及
圖 2C所示,「融合-寡核苷酸設計」未提高所需編輯效率。
基於以上驚人且意外的觀測結果,可得出供體DNA與嚮導RNA之間連接的類型及位置實質上影響編輯效率的結論。供體DNA與嚮導RNA之末端融合或雜交並未產生令人滿意的編輯效率。
實例 2 : 用於「內部錨設計」之供體 DNA 及嚮導 RNA 之各種設計
「內部錨設計」被稱為包含與供體DNA部分互補之嚮導RNA的系統,且互補序列位於嚮導RNA之內部(參見
圖 3A)。亦設計各種不同供體構築體(參見
圖 3B-3E)。
使用內部錨CRISPR系統,首先評估與嚮導RNA互補之供體DNA片段(「尾」)的不同位置對HEK293T細胞中所需基因編輯(目標基因座之「CTT」插入)效率的影響。不同DNA供體設計包括:無尾供體DNA之習知設計(在
圖 4中表示為「0」),與嚮導RNA互補之DNA序列位於供體DNA之3'端(在
圖 4中表示為「R」),一個DNA尾位於供體DNA之3'端且第二個尾位於供體DNA之5'端(在
圖 4中表示為「RL」),一個DNA尾位於供體DNA之5'端(在
圖 4中表示為「L」),且「L」設計之後為十個去氧腺苷及第二個「L」(在
圖 4中表示為「L10aL」)。不添加Cas9之一種情況包括為陰性對照(
圖 4中之最後一行)。結果顯示,相比於習知DNA供體,「R」及「RL」設計顯示所需編輯效率較低。相比之下,當與習知DNA供體進行比較時,「L」及「L10aL」顯示統計學上顯著更高的所需編輯效率(參見
圖 4)。
接著,測試供體DNA之尾序列與嚮導RNA之內部錨(IA)序列匹配或不匹配對編輯效率之影響。依所預期,陰性對照樣品(無嚮導RNA、無供體DNA或無Cas9,在「嚮導」、「供體尾」、或「Cas9」類別下顯示為「-」,)未顯示可觀測到的CTT插入(參見
圖 5)。此外,有三種其他條件:(1)不含IA序列之WT嚮導RNA及無尾供體(「嚮導:WT」及「供體尾:0」);(2)無IA序列之WT嚮導RNA及具有模擬尾之供體(「嚮導:WT」及「供體尾:nonM」);及(3)具有IA序列之嚮導RNA及不匹配供體尾(「嚮導:IA」及「供體尾:nonM」),其含有與嚮導IA不匹配之模擬5個核苷酸序列,顯示約5%-6%的類似CTT插入效率。相比之下,具有IA序列之嚮導RNA以及尾設計為「L」或「L10aL」之供體DNA (「嚮導:IA」及「供體尾:L」)及(「嚮導:IA」及「供體尾:L10aL」)均使CTT插入效率增加約2倍(參見
圖 5)。
實例 3 :嚮導 RNA 與 Cas9 之比率
使用兩個尾設計(「L」及「L10aL」,依實例1中以類似方式標記)測試兩者之不同比率(範圍在1:0.6至1:10)。依
圖 6中所示,所需(在此非限制性實例中,目標基因座之「CTT」插入)及非所需(其他插入/缺失)基因編輯之效率顯示1:1.2及1:2比率相較於其他比率具有最高效率。然而,較高量之RNA嚮導(1:5或1:10比率)導致所需編輯效率顯著降低,而諸如由非同源DNA末端連接(NHEJ)路徑引起之其他插入/缺失則不受影響(參見
圖 6)。因此,Cas9與嚮導RNA之相對量會影響編輯效率。
實例 4 :供體 DNA 上之兩個結合區段之間的內鏈長度
在HEK293T細胞中,使用內部錨CRISPR系統檢測供體DNA之尾-尾內序列長度(0、5、10、15、20、25及30個去氧腺苷;
圖 7)對所需(目標基因座之「CTT」插入)及非所需(其他插入/缺失)基因編輯效率的影響。與其他長度之供體DNA相比,十個去氧腺苷(「L10aL」)之長度顯示最高的所需CTT插入。相應地,L10aL設計中非所需其他插入/缺失比例最低,表示經由NHEJ路徑之非所需編輯副產物實質上被L10aL設計抑制。
實例 5 :同源臂之長度
研究DNA供體同源臂之長度對HDR編輯效率之影響。依
圖 8中所示,測試在相對於切割位置之遠端(D)及近端(P)具有不同長度之供體。當與具有中等長度(20至36個鹼基)之供體相比時,短(<20個鹼基)及長(>36個鹼基)同源臂均顯示較低CTT插入效率。對於具有D20P30及D20P36同源臂之供體,CTT插入讀段之比例高於相同樣品中非所需插入/缺失讀段之數目。
實例 6 :脫靶率、易位率、大插入率及大缺失率
當使用具有各種元件之內部錨CRISPR系統靶向HEK3位點時,評估全基因體脫靶型態:(1)不同嚮導(「WT」表示不含內部錨之嚮導RNA,且「IA」表示含有內部錨之嚮導RNA);(2)供體DNA尾(「0」表示不含與嚮導RNA互補之尾/結合區段的供體DNA,且「L10aL」表示兩個DNA尾/結合區段位於供體DNA之5'端,兩者之間存在十個去氧腺苷);(3)同源臂(「D20P16」表示具有20個核苷酸長之遠端同源臂及16個核苷酸長之近端臂的供體DNA;「D20P36」表示具有20個核苷酸長之遠端同源臂及36個核苷酸長之近端臂的供體DNA);及(4)三個SpCas9(WT、HiFi及eCas9)。依所預期,高保真Cas9s顯示脫靶位點數目減少(參見
圖 9B及
圖 9D),表明內部錨CRISPR系統與高保真Cas核酸酶相容。有趣的是,相較於正常CRISPR系統,當使用內部錨CRISPR系統時全部GUIDE-seq讀段之數目較低(參見
圖 9E)。因為全部GUIDE-seq讀段之數目在具有目標雙股斷裂(DSB)之dsODN整合期間與NHEJ效率相關,作為GUIDE-seq協定之部分,結果表面內部錨CRISPR系統很大程度上抑制非所需NHEJ路徑。
實例 7 : HEK3 中長片段缺失
為使HEK3中之長片段缺失,雙重修飾之sgRNA (亦即
圖 10C中之leg1及leg2)在位於第一髮夾之上莖頂部的環中包含內部錨(SEQ ID.: legRNA_Int_Anc) (經修飾之sgRNA亦稱為「先導編輯嚮導RNA」,簡稱legRNA),其經設計以靶向HEK3上相隔991bp的2個不同基因座(
圖 10A),以及SpCas9及錨ssDNA (asODN)供體模板,其由缺失位點上游及下游之36個鹼基同源臂及legRNA錨尾組成(
圖 10B)。設計且測試三種asODN-legRNA方法(
圖 10C),設計A1:asODN1 (SEQ ID.: HEK3_A1_asODN1)、asODN2 (SEQ ID.: HEK3_A1_asODN2)、legRNA1 (SEQ ID: A1_HEK3_legRNA1)及legRNA2 (SEQ ID: A1_HEK3_legRNA2),靶向不同股;設計A2:asODN3 (SEQ ID: HEK3_A2_asODN)以及legRNA3 (SEQ ID: A2_HEK3_legRNA1)及legRNA4 (SEQ ID: A2_HEK3_legRNA2)兩者靶向相同上股;設計A2p:legRNA5 (SEQ ID: A2p_HEK3_legRNA1)及legRNA6 (SEQ ID: A2p_HEK3_legRNA2)兩者靶向相同下股,而asODN4 (SEQ ID: HEK3_A2p_asODN)靶向其他股。
實驗程序
LegRNA產生。legRNA藉由活體外轉錄(IVT)產生。簡言之,構築legRNA之DNA模板且藉由PCR擴增。隨後,使用T7聚合酶將DNA轉錄為RNA,接著用DNA酶I處理以移除樣品中之剩餘DNA模板。
Cas9-legRNA核糖核蛋白(RNP)轉染。將HEK293T細胞在轉染前一天接種於24孔盤中。首先,將legRNA與cas9蛋白組裝以形成核糖核蛋白複合物(RNP)。接下來,添加asODN以形成RNP-asODN複合物。使用脂染胺(lipofectamine)將RNP-asODN複合物轉染至細胞中。轉染後2-3天,自細胞提取DNA。
PCR及凝膠電泳。PCR及凝膠電泳用於觀測1kb缺失。PCR反應中使用1個正向引子及2個反向引子,使得可同時在凝膠上擴增及觀測WT產物及缺失產物。
擴增子定序。擴增子定序庫係使用目標位點特異性引子及索引引子藉由2步PCR生成。該庫係藉由illumine Nextseq500或iSeq定序系統進行定序。
結果
使用不同asODN-legRNA設計之結果顯示
圖 11中。設計A1產生之缺失產物約為WT產物之30%,亦即約23% (= 30% / (100% + 30%))缺失效率(
圖 11A及
圖 11B),缺失藉由定序確認(
圖 11C)。
實例 8 : HPRT1 中之長片段缺失
類似地,如同實例1,測試
HPRT1中之長片段(1075-bp)缺失。使用與設計A1類似之雙asODN-legRNA系統(asODN5: SEQ ID: HPRT_A1_asODN1;asODN6: SEQ ID: HPRT_A1_asODN2;legRNA7: SEQ ID: HPRT_legRNA1;及legRNA8: SEQ ID: HPRT_legRNA2),且結果顯示於
圖 12中。雙asODN-legRNA顯示大約至多86%之缺失效率(
圖 12A及
圖 12B),但藉由凝膠強度分析之缺失效率可能被高估,因為擴增更傾向於短擴增子而非長擴增子。缺失藉由定序確認(
圖 12C)。
實例 9 : GAPDH 中之大片段插入
為測試1734個鹼基的大片段插入
GAPDH,使用cas9及具有環化錨-ssODN (casODN),cas800HA (SEQ ID: casODN_800HA,內部錨序列:ACATTGTTCTCACTT)之legRNA (SEQ ID: GAPDH_legRNA) (
圖 13A)。casODN用作含有錨序列、左同源臂、IRES、綠色螢光蛋白(ZsGreen)編碼序列、聚A及右同源臂的插入模板(
圖 13A)。使用與實例1類似之轉染實驗條件,不同之處在於使用兩種形式之cas9,核糖核苷酸(RNP)及質體(用於比較)。亦包括常規雙股DNA模板(dsONA),ds500HA (SEQ ID: dsODN_500HA)用於比較。結果顯示RNP-casODN處理產生比無cas9對照更強的插入產物(
圖 13B)。無cas9對照中之低級產物(
圖 13B,泳道3)可能由於經典同源定向重組。當使用雙股模板時,亦觀測到1734個鹼基之插入,但其無cas對照亦顯示實質性插入(
圖 13B,泳道4及5)。當cas9由質體表現時,觀測到與RNP類似之結果(
圖 13B,泳道7至12)。來自RNP-casODN處理之編輯細胞顯示ZsGreen蛋白在處理細胞中之明顯功能性插入,而無cas9對照細胞未顯示明顯綠色信號(
圖 13C)。
表 7. 用於實例 7-9 中之核酸序列
legRNA_Int_Anc | UGGAG |
A1_HEK3_legRNA1 | GGCCCAGACUGAGCACGUGAGUUUUAGAGCUAGUGGAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC |
A1_HEK3_legRNA2 | UGAUCACCUGCCCAAAUGUGGUUUUAGAGCUAGUGGAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC |
A2_HEK3_legRNA1 | CUGCCAUCACGUGCUCAGUCGUUUUAGAGCUAGUGGAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC |
A2_HEK3_legRNA2 | UGAUCACCUGCCCAAAUGUGGUUUUAGAGCUAGUGGAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC |
A2p_HEK3_legRNA1 | GGCCCAGACUGAGCACGUGAGUUUUAGAGCUAGUGGAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC |
A2p_HEK3_legRNA2 | UGGGCAGGUGAUCAATGCUGUUUUAGAGCUAGUGGAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC |
HEK3_A1_asODN1 | c*t*ccaGGAGATGCTCCCTAAGCATTGATCACCTGCCCAAATCGTGCTCAGTCTGGGCCCCAAGGATTGACCCAGG*C*C |
HEK3_A1_asODN2 | c*t*ccaGGCCTGGGTCAATCCTTGGGGCCCAGACTGAGCACGATTTGGGCAGGTGATCAATGCTTAGGGAGCATCT*C*C |
HEK3_A2_asODN | c*t*ccaCCAGCCCTGGCCTGGGTCAATCCTTGGGGCCCAGACATTTGGGCAGGTGATCAATGCTTAGGGAGCATCT*C*C |
HEK3_A2p_asODN | c*t*ccaCAAATCCTCGCATTTGGGCAGGAGATGCTCCCTAAGCGTGCTCAGTCTGGGCCCCAAGGATTGACCCAGG*C*C |
HPRT1 | |
HPRT_legRNA1 | GCCUGCAAACUGGUAGGCGCGUUUUAGAGCUAGUGGAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC |
HPRT_legRNA2 | AAGCAUGAUCAGAACGGUUGGUUUUAGAGCUAGUGGAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC |
HPRT_A1_asODN1 | C*T*CCAGGGTTTTGACTATTTTAGCAAGCATGATCAGAACGGCCTACCAGTTTGCAGGCTCACTAGGTAGCCGTGG*G*A |
HPRT_A1_asODN2 | C*T*CCATCCCACGGCTACCTAGTGAGCCTGCAAACTGGTAGGCCGTTCTGATCATGCTTGCTAAAATAGTCAAAAC*C*C |
GAPDH_legRNA | AGCCCCAGCAAGAGCACAAGGUUUUAGAGCUAGAAGUGAGAACAAUGUAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC |
casODN_800HA | ACATTGTTCTCACTTgggaatgggactgaggctcccacctttctcatccaagactggctcctccctgccggggctgcgtgcaaccctggggttgggggttctggggactggctttcccataatttcctttcaaggtggggagggaggtagaggggtgatgtggggagtacgctgcagggcctcactccttttgcagaccacagtccatgccatcactgccacccagaagactgtggatggcccctccgggaaactgtggcgtgatggccgcggggctctccagaacatcatccctgcctctactggcgctgccaaggctgtgggcaaggtcatccctgagctgaacgggaagctcactggcatggccttccgtgtccccactgccaacgtgtcagtggtggacctgacctgccgtctagaaaaacctgccaaatatgatgacatcaagaaggtggtgaagcaggcgtcggagggccccctcaagggcatcctgggctacactgagcaccaggtggtctcctctgacttcaacagcgacacccactcctccacctttgacgctggggctggcattgccctcaacgaccactttgtcaagctcatttcctggtatgtggctggggccagagactggctcttaaaaagtgcagggtctggcgccctctggtggctggctcagaaaaagggccctgacaactcttttcatcttctaggtatgacaacgaatttggctacagcaacagggtggtggacctcatggcccacatggcctccaaggagtaagacccctggaccaccagccccagcaagagcacacgttactggccgaagccgcttggaataaggccggtgtgcgtttgtctatatgttattttccaccatattgccgtcttttggcaatgtgagggcccggaaacctggccctgtcttcttgacgagcattcctaggggtctttcccctctcgccaaaggaatgcaaggtctgttgaatgtcgtgaaggaagcagttcctctggaagcttcttgaagacaaacaacgtctgtagcgaccctttgcaggcagcggaaccccccacctggcgacaggtgcctctgcggccaaaagccacgtgtataagatacacctgcaaaggcggcacaaccccagtgccacgttgtgagttggatagttgtggaaagagtcaaatggctctcctcaagcgtattcaacaaggggctgaaggatgcccagaaggtaccccattgtatgggatctgatctggggcctcggtgcacatgctttacatgtgtttagtcgaggttaaaaaaacgtctaggccccccgaaccacggggacgtggttttcctttgaaaaacacgatgataataatggcccagtccaagcacggcctgaccaaggagatgaccatgaagtaccgcatggagggctgcgtggacggccacaagttcgtgatcaccggcgagggcatcggctaccccttcaagggcaagcaggccatcaacctgtgcgtggtggagggcggccccttgcccttcgccgaggacatcttgtccgccgccttcatgtacggcaaccgcgtgttcaccgagtacccccaggacatcgtcgactacttcaagaactcctgccccgccggctacacctgggaccgctccttcctgttcgaggacggcgccgtgtgcatctgcaacgccgacatcaccgtgagcgtggaggagaactgcatgtaccacgagtccaagttctacggcgtgaacttccccgccgacggccccgtgatgaagaagatgaccgacaactgggagccctcctgcgagaagatcatccccgtgcccaagcagggcatcttgaagggcgacgtgagcatgtacctgctgctgaaggacggtggccgcttgcgctgccagttcgacaccgtgtacaaggccaagtccgtgccccgcaagatgcccgactggcacttcatccagcacaagctgacccgcgaggaccgcagcgacgccaagaaccagaagtggcacctgaccgagcacgccatcgcctccggctccgccttgccctaaagatctacgggtggcatccctgtgacccctccccagtgcctctcctggccctggaagttgccactccagtgcccaccagccttgtcctaataaaattaagttgcatcattttgtctgactaggtgtccttctataatattatggggtggaggggggtggtatggagcaaggggcaagttgggaagacaacctgtagggcctgcggggtctattgggaaccaagctggagtgcagtggcacaatcttggctcactgcaatctccgcctcctgggttcaagcgattctcctgcctcagcctcccgagttgttgggattccaggcatgcatgaccaggctcagctaatttttgtttttttggtagagacggggtttcaccatattggccaggctggtctccaactcctaatctcaggtgatctacccaccttggcctcccaaattgctgggattacaggcgtgaaccactgctcccttccctgtccttaagaggaagagagagaccctcactgctggggagtccctgccacactcagtcccccaccacactgaatctcccctcctcacagttgccatgtagaccccttgaagaggggaggggcctagggagccgcaccttgtcatgtaccatcaataaagtaccctgtgctcaaccagttacttgtcctgtcttattctagggtctggggcagaggggagggaagctgggcttgtgtcaaggtgagacattcttgctggggagggacctggtatgttctcctcagactgagggtagggcctccaaacagccttgcttgcttcgagaaccatttgcttcccgctcagacgtcttgagtgctacaggaagctggcaccactacttcagagaacaaggccttttcctctcctcgctccagtcctaggctatctgctgttggccaaacatggaagaagctattctgtgggcagccccagggaggctgacaggtggaggaagtcagggctcgcactgggctctgacgctgactggttagtggagctcagcctggagctgagctgcagcgggcaattccagcttggcctccgcagctgtgaggtcttgagcacgtgctctattgctttctgtgccctcgtgtcttatctgaggacatcgtggccagcccctaaggtcttcaagcaggattcatctaggtaaaccaagtacctaaaaccatgcccaaggcggtaaggactatataatgtttaaaaatcggtaaaaatgcccacctcgcatagttttgaggaagatgaactgagatgtgtcagggt |
dsODN_500HA | ggctgtgggcaaggtcatccctgagctgaacgggaagctcactggcatggccttccgtgtccccactgccaacgtgtcagtggtggacctgacctgccgtctagaaaaacctgccaaatatgatgacatcaagaaggtggtgaagcaggcgtcggagggccccctcaagggcatcctgggctacactgagcaccaggtggtctcctctgacttcaacagcgacacccactcctccacctttgacgctggggctggcattgccctcaacgaccactttgtcaagctcatttcctggtatgtggctggggccagagactggctcttaaaaagtgcagggtctggcgccctctggtggctggctcagaaaaagggccctgacaactcttttcatcttctaggtatgacaacgaatttggctacagcaacagggtggtggacctcatggcccacatggcctccaaggagtaagacccctggaccaccagccccagcaagagcacACGTTACTGGCCGAAGCCGCTTGGAATAAGGCCGGTGTGCGTTTGTCTATATGTTATTTTCCACCATATTGCCGTCTTTTGGCAATGTGAGGGCCCGGAAACCTGGCCCTGTCTTCTTGACGAGCATTCCTAGGGGTCTTTCCCCTCTCGCCAAAGGAATGCAAGGTCTGTTGAATGTCGTGAAGGAAGCAGTTCCTCTGGAAGCTTCTTGAAGACAAACAACGTCTGTAGCGACCCTTTGCAGGCAGCGGAACCCCCCACCTGGCGACAGGTGCCTCTGCGGCCAAAAGCCACGTGTATAAGATACACCTGCAAAGGCGGCACAACCCCAGTGCCACGTTGTGAGTTGGATAGTTGTGGAAAGAGTCAAATGGCTCTCCTCAAGCGTATTCAACAAGGGGCTGAAGGATGCCCAGAAGGTACCCCATTGTATGGGATCTGATCTGGGGCCTCGGTGCACATGCTTTACATGTGTTTAGTCGAGGTTAAAAAAACGTCTAGGCCCCCCGAACCACGGGGACGTGGTTTTCCTTTGAAAAACACGATGATAATAATGGCCCAGTCCAAGCACGGCCTGACCAAGGAGATGACCATGAAGTACCGCATGGAGGGCTGCGTGGACGGCCACAAGTTCGTGATCACCGGCGAGGGCATCGGCTACCCCTTCAAGGGCAAGCAGGCCATCAACCTGTGCGTGGTGGAGGGCGGCCCCTTGCCCTTCGCCGAGGACATCTTGTCCGCCGCCTTCATGTACGGCAACCGCGTGTTCACCGAGTACCCCCAGGACATCGTCGACTACTTCAAGAACTCCTGCCCCGCCGGCTACACCTGGGACCGCTCCTTCCTGTTCGAGGACGGCGCCGTGTGCATCTGCAACGCCGACATCACCGTGAGCGTGGAGGAGAACTGCATGTACCACGAGTCCAAGTTCTACGGCGTGAACTTCCCCGCCGACGGCCCCGTGATGAAGAAGATGACCGACAACTGGGAGCCCTCCTGCGAGAAGATCATCCCCGTGCCCAAGCAGGGCATCTTGAAGGGCGACGTGAGCATGTACCTGCTGCTGAAGGACGGTGGCCGCTTGCGCTGCCAGTTCGACACCGTGTACAAGGCCAAGTCCGTGCCCCGCAAGATGCCCGACTGGCACTTCATCCAGCACAAGCTGACCCGCGAGGACCGCAGCGACGCCAAGAACCAGAAGTGGCACCTGACCGAGCACGCCATCGCCTCCGGCTCCGCCTTGCCCTAAAGATCTACgggtggcatccctgtgacccctccccagtgcctctcctggccctggaagttgccactccagtgcccaccagccttgtcctaataaaattaagttgcatcattttgtctgactaggtgtccttctataatattatggggtggaggggggtggtatggagcaaggggcaagttgggaagacaacctgtagggcctgcggggtctattgggaaccaagctggagtgcagtggcacaatcttggctcactgcaatctccgcctcctgggttcaagcgattctcctgcctcagcctcccgagttgttgggattccaggcatgcatgaccaggctcagctaatttttgtttttttggtagagacggggtttcaccatattggccaggctggtctccaactcctaatctcaggtgatctacccaccttggcctcccaaattgctgggattacaggcgtgaaccactgctcccttccctgtccttaagaggaagagagagaccctcactgctggggagtccctgccacactcagtcccccaccacactgaatctcccctcctcacagttgccatgtagaccccttgaagaggggaggggcctagggagccgcaccttgtcatgtaccatcaataaagtaccctgtgctcaaccagttacttgtcctgtcttattctagggtctggggcagaggggagggaagctgggcttgtgtcaaggtgagacattcttgctggggagggacctggtatgttctcctcagactgagggtagggcctccaaacagccttgcttgcttcgagaaccatttgcttcccgctcagacgtcttgagtgctacaggaagctggcaccactacttcagagaacaaggccttttcctctcctcgctccagtcctaggctatctgctgttggccaaacatggaagaagctattctgtgggcagccccagggaggctgacaggtggaggaagtcagggctcgc |
雖然已在本文中展示並描述本發明之較佳實施例,但對於熟習此項技術者應顯而易見,此等實施例僅以舉例方式提供。本發明並不意欲受說明書中所提供之特定實例的限制。儘管已參考前述說明書描述本發明,但本文實施例之描述及說明並不意欲以限制性意義來解釋。熟習此項技術者現將在不背離本發明之情況下想到許多變化、改變及取代。此外,應理解,本發明之所有態樣不限於本文所闡述之取決於各種條件及變數之具體描繪、組態或相對比例。應理解,本文中所描述的本發明之實施例之各種替代例可在實踐本發明時使用。因此,預期本發明亦應涵蓋任何此類替代方案、修改、變化或等效方案。預期以下申請專利範圍界定本發明之範疇,且因此涵蓋在此等申請專利範圍及其等效方案之範疇內的方法及結構。
專利或申請案文件含有至少一個彩製圖式。在申請且支付必要費用後,專利局將提供附有彩圖之此專利或專利申請公開案之複本。
本發明之新穎特徵細緻闡述於隨附申請專利範圍中。將參考以下闡述利用本發明原理之說明性實施例的詳細描述及附圖(在本文中亦為「圖(Figure)」及「圖(FIG.)」)來獲得對本發明之特徵及優勢的較佳理解,其中:
圖 1A-1C展示以RNA-DNA融合-寡核苷酸設計作為單一嚮導(稱為「融合-寡核苷酸設計」)的CRISPR Cas9系統之可忽略的編輯效率。(
圖 1A)融合-寡核苷酸設計之示意圖。呈黃色之Cas9與目標雙股DNA一起定位,其中兩股含有代表Cas9之正常編輯結果的帶切口的缺口。RNA-DNA融合寡核苷酸含有與底部目標DNA股互補之5'部分RNA間隔序列、含有反式活化RNA (tracrRNA)序列之中間區(RNA部分亦稱為單嚮導RNA [sgRNA],呈紅色),及以藍色粗線著色之供體DNA之3'部分用作同源定向修復之模板(HDR;含有「AAG」插入,用於目標DNA上之所需「CTT」插入)。(
圖 1B)三個實驗組之所需編輯結果(目標基因座之「CTT」插入)的效率:先前研發之Prime Editor 2 (PE2;購自AddGene 132775之質體,藉由Andrew V. Anzalone, Nature, 2019 [PMID: 31634902])用作比較組,融合RNA-DNA嚮導設計(「測試」組具有不同長度之供體DNA,14、17及20nt)以及具有融合RNA-DNA嚮導設計之無Cas9對照組(N.C.組具有不同長度之供體DNA,14、17、20及23nt)。(
圖 1C)所有編輯之效率,包括與(
圖 1B)中相同的三個實驗組之所需(目標基因座之「CTT」插入)及非所需(其他插入及缺失)。
圖 2A-2C繪示CRISPR Cas9系統之基因編輯效率,其中華生-克里克鹼基配對位於sgRNA末端之RNA尾部與供體DNA模板一端之DNA尾部之間(稱為「末端錨設計」)。(
圖 2A)末端錨設計之示意圖。呈黃色之Cas9與目標雙股DNA一起定位,其中兩股含有代表Cas9之正常編輯結果的帶切口的缺口。呈紅色之sgRNA含有與供體DNA互補之延伸3'部分及供體DNA之5'部分。(
圖 2B)不同實驗組之所需編輯結果(目標基因座之「CTT」插入)的效率:無Cas9對照與末端錨設計sgRNA(「陰性」組中之前4個樣品具有不同長度之供體DNA尾:3、7、10及13個鹼基);無Cas9及無sgRNA(「陰性」組中之第5個至第7個樣品具有不同長度之供體DNA尾:7、10及13個鹼基);測試組使用末端錨設計及長度為0、3、5、7、10及13個鹼基之華生-克里克鹼基配對)。(
圖 2C)所有編輯之效率,包括與(
圖 2B)中相同的實驗組之所需(目標基因座之「CTT」插入)及非所需(其他插入及缺失)。
圖 3A-3E展示供體DNA之各種設計及其與目標DNA及嚮導RNA之相對位置。(
圖 3A) CRISPR基因編輯系統之示意圖,該CRISPR基因編輯系統在位於嚮導RNA之內部的RNA序列與作為供體DNA模板之一部分的DNA部分之間進行華生-克里克鹼基配對(稱為「內部錨設計」)。呈黃色之Cas9與目標雙股DNA一起定位,其中兩股含有代表Cas9之正常編輯結果的帶切口的缺口。呈紅色之單嚮導RNA (sgRNA)含有與供體DNA中之一部分DNA序列互補的內部3'部分。(
圖 3B)內部錨設計具有部分雙股DNA供體及與sgRNA之內部互補的單股部分。具有此類設計之例示性供體序列呈現如下。(
圖 3C)內部錨設計具有封閉的部分雙股DNA供體及與sgRNA之內部互補的單股部分。具有此類設計之例示性供體序列呈現如下。(
圖 3D)內部錨設計具有封閉的部分單股DNA供體及與sgRNA之內部互補的單股部分。具有此類設計之例示性供體序列呈現如下。(
圖 3E)內部錨設計具有(多個)髮夾單股DNA供體及與sgRNA之內部互補的單股部分。具有此類設計之例示性供體序列呈現如下。
圖 4顯示與內部錨CRISPR系統之嚮導RNA(下文稱為「尾」)互補的供體DNA片段之不同位置對HEK293T細胞中所需基因編輯效率(在此非限制性實例中,目標基因座之「CTT」插入)的影響,且藉由下一代定序來量測。CRISPR編輯系統由與供體DNA部分互補的嚮導RNA組成。RNA嚮導中之互補序列位於嚮導之內部(內部錨設計)。供體DNA之尾的不同設計為:「0」指示使用無尾供體;「R」指示尾位於供體DNA之3'端;「RL」指示一個DNA尾位於供體DNA之3'端,且第二個尾位於供體DNA之5'端;「L」指示一個DNA尾位於供體DNA之5'端;且「L10aL」指示依上文所描述之「L」設計之後為十個去氧腺苷及第二個「L」。最後一個樣品使用嚮導及「L10aL」供體DNA,但不添加cas9作為陰性對照。
圖 5繪示使用左尾(5'端)之內部錨CRISPR系統的供體尾序列(與嚮導RNA之內部錨序列匹配或不匹配)對HEK293T細胞中所需基因編輯效率的影響,且藉由下一代定序來量測。在嚮導下,「WT」指示不插入內部錨(IA)之野生型嚮導RNA。「IA」指示插入IA之嚮導RNA,其中供體DNA中之尾於與嚮導RNA結合。供體DNA之尾(例如「L」及「L10aL」)的不同設計與
圖 4中之以類似方式標記。
圖 6顯示Cas9與嚮導之比率(範圍在1:0.6至1:10)及尾設計(「L」及「L10aL」,依
圖 4中以類似方式標記)對HEK293T細胞中使用內部錨CRISPR系統之所需(目標基因座之「CTT」插入)及非所需(其他插入/缺失)基因編輯效率的影響,且藉由下一代定序來量測。
圖 7顯示供體DNA之尾-尾內序列長度(0、5、10、15、20、25及30個去氧腺苷)對HEK293T細胞中使用內部錨CRISPR系統之所需(目標基因座之「CTT」插入)及非所需(其他插入/缺失)基因編輯效率的影響,且藉由下一代定序來量測。
圖 8繪示遠端(D)及近端(P)相對於「原間隔區相鄰模體」(PAM)位置之同源臂長度對HEK293T細胞中使用內部錨CRISPR系統之所需(目標基因座之「CTT」插入)及非所需(其他插入/缺失)基因編輯效率的影響,且藉由下一代定序來量測。
圖 9A-9E顯示使用一些示例性組態及「內部錨設計」的脫靶效應和易位機率:(
圖 9A)當使用具有不同嚮導(WT及IA)、供體DNA尾(0及L10aL)及同源臂(D20P16及D20P36)及SpCas9 (WT)的內部錨CRISPR系統靶向HEK3位點時的全基因體目標分析。(
圖 9B)當使用具有不同嚮導(WT及IA)、供體DNA尾(0及L10aL)及同源臂(D20P16及D20P36)及SpCas9 (HiFi)的內部錨CRISPR系統靶向HEK3位點時的全基因體目標分析。(
圖 9C)當使用具有不同嚮導(WT及IA)、供體DNA尾(0及L10aL)及同源臂(D20P16及D20P36)及SpCas9 (eCas9)的內部錨CRISPR系統靶向HEK3位點時的全基因體目標分析。(
圖 9D)不同實驗條件組下之脫靶位點的數目。(
圖 9E)在實驗條件組下讀取的全部GUIDE-seq的數目。
圖 10A-C繪示HEK3上缺失約1kb片段的設計。(縮寫:asODN,錨單股DNA;legRNA,先導編輯嚮導RNA)。
圖 11A-C繪示使用不同asODN-legRNA設計之缺失結果。
圖 11A:不同設計之PCR擴增產物。預期缺失產物尺寸為288bp (箭頭)且WT產物為175bp (箭頭)。
圖 11B:設計A1之288bp (缺失)與175bp (WT)之譜帶強度比。
圖 11C:HEK3基因座上缺失產物比對之IGV觀測。
圖 12A-C繪示使用不同asODN-legRNA設計之缺失結果。
圖 12A:不同設計之PCR擴增產物。預期缺失產物尺寸為172bp且WT產物為1236bp。
圖 12B:設計A1之缺失與WT之譜帶強度比,一式三份。
圖 12C:HPRT1基因座上缺失產物比對之IGV觀測。
圖 13A-C繪示1734 bp片段在
GAPDH位點之插入。
Claims (91)
- 一種用於改變目標序列之系統,其包含經修飾之單嚮導RNA (sgRNA)及供體DNA,其中該經修飾之sgRNA包含CRISPR RNA (crRNA)及反式活性RNA (tracrRNA),其中該經修飾之sgRNA包含距離該經修飾之sgRNA之3'及5'端至少5個核苷酸的一或多個內部錨,其中該供體DNA包含第一部分及第二部分,其中該第一部分包含能夠經由非共價鍵結合至該一或多個內部錨之內部錨的一或多個結合區段,且該第二部分包含相關序列(SOI)。
- 如請求項1之系統,其中該非共價鍵係華生-克里克相互作用(Watson-Crick interaction)。
- 如請求項1或2之系統,其中該經修飾之sgRNA包含連結(nexus)、第一髮夾及該tracrRNA與該crRNA之間的單股區。
- 如請求項3之系統,其中該經修飾之sgRNA進一步包含突出區(bulge region)。
- 如請求項3或4之系統,其中該經修飾之sgRNA進一步包含第二髮夾。
- 如前述請求項中任一項之系統,其中該一或多個內部錨之內部錨位於該經修飾之sgRNA之單股區中。
- 如前述請求項中任一項之系統,其中該一或多個內部錨之內部錨位於該tracrRNA與該crRNA之間的單股區中。
- 如前述請求項中任一項之系統,其中該一或多個內部錨之內部錨位於該第一髮夾內之單股區中。
- 如前述請求項中任一項之系統,其中該一或多個內部錨之內部錨位於該連結與該第一髮夾之間的單股區中。
- 如前述請求項中任一項之系統,其中該經修飾之sgRNA進一步包含第二髮夾,且其中該一或多個內部錨之內部錨位於該第二髮夾內之單股區中。
- 如前述請求項中任一項之系統,其中該一或多個內部錨中之各者或該一或多個結合區段中之各者為3個核苷酸至100個核苷酸長。
- 如請求項11之系統,其中該一或多個內部錨中之各者或該一或多個結合區段中之各者為3個核苷酸至20個核苷酸長。
- 如請求項12之系統,其中該一或多個內部錨中之各者或該一或多個結合區段中之各者為約5個核苷酸長。
- 如前述請求項中任一項之系統,其中該一或多個內部錨中之各者包含來自表1之SEQ ID NO 1至SEQ ID NO 472的序列。
- 如請求項1至14中任一項之系統,其中該一或多個內部錨中之各者包含來自表2之SEQ ID NO 473至SEQ ID NO 3056的序列。
- 如請求項1至14中任一項之系統,其中該一或多個結合區段中之各者包含來自表3之SEQ ID NO 3057至SEQ ID NO 3528的序列。
- 如請求項1至14中任一項之系統,其中該一或多個結合區段中之各者包含來自表4之SEQ ID NO 3529至SEQ ID NO 6112的序列。
- 如前述請求項中任一項之系統,其中該一或多個結合區段係藉由連接子連接。
- 如請求項18之系統,其中該連接子為約1至30個核苷酸長。
- 如請求項19之系統,其中該連接子為約10至25個核苷酸長。
- 如請求項18至20中任一項之系統,其中該連接子為聚去氧腺苷之序列。
- 如前述請求項中任一項之系統,其中該SOI包含具有一或多個核苷酸取代、一或多個核苷酸插入、一或多個核苷酸缺失或其任何組合之目標序列。
- 如請求項22之系統,其中該一或多個核苷酸插入包含1至100個核苷酸、101至1000個核苷酸、1001至10,000個核苷酸或10,001至100,000個核苷酸。
- 如請求項23之系統,其中該一或多個核苷酸插入包含2至10個隨機核苷酸。
- 如請求項22之系統,其中該一或多個核苷酸缺失包含1至50個核苷酸。
- 如前述請求項中任一項之系統,其中該供體DNA之該第二部分進一步包含上游及/或下游同源臂。
- 如請求項26之系統,其中該上游同源臂為5至1000個核苷酸長。
- 如請求項26或27之系統,其中該下游同源臂為約10至1000個核苷酸長。
- 如前述請求項中任一項之系統,其中該供體DNA之該第一部分在該供體DNA之該第二部分之5'處。
- 如請求項1至28中任一項之系統,其中該供體DNA之該第一部分在該供體DNA之該第二部分之3'處。
- 如前述請求項中任一項之系統,其中該供體DNA為單股。
- 如請求項1至30中任一項之系統,其中該供體DNA之該第一部分為單股且該供體DNA之該第二部分為完全或部分雙股。
- 如前述請求項中任一項之系統,其中該供體DNA在3'及/或5'端封閉。
- 如前述請求項中任一項之系統,其中該系統進一步包含CRISPR核酸酶。
- 如請求項34之系統,其中該CRISPR核酸酶為DNA核酸酶。
- 如請求項35之系統,其中該DNA核酸酶為Cas9、Cas12、Cas14或CasΦ。
- 一種包含供體DNA及兩個經修飾之單嚮導RNA (sgRNA)的系統,其用於切割第一染色體上之第一基因座及第二染色體上之第二基因座,其中該等經修飾之sgRNA中之各者包含CRISPR RNA (crRNA)及反式活性RNA (tracrRNA),其中該等經修飾之sgRNA中之各者包含距離該等經修飾之sgRNA中之各者之3'及5'端至少5個核苷酸的一或多個內部錨,其中該供體DNA包含第一部分及第二部分,其中該第一部分包含能夠經由非共價鍵結合至該一或多個內部錨之內部錨的一或多個結合區段,且該第二部分包含相關序列(SOI),其中該供體DNA包含上游同源臂及/或下游同源臂。
- 如請求項37之系統,其中該第一染色體與該第二染色體相同。
- 如請求項37或38之系統,其中該第一基因座在該第二基因座之5'處。
- 如請求項37之系統,其中該第一染色體與該第二染色體不同。
- 如請求項37至40中任一項之系統,其中該第一基因座及該第二基因座相隔至少50、100、1,000、10,000或100,000個核苷酸。
- 如請求項37至41中任一項之系統,其中該上游同源臂側接該第一基因座之5'端。
- 如請求項37至42中任一項之系統,其中該下游同源臂側接該第二基因座之3'端。
- 如請求項37至43中任一項之系統,其中該非共價鍵係華生-克里克相互作用。
- 如請求項37至44中任一項之系統,其中該經修飾之sgRNA包含連結、第一髮夾及該tracrRNA與該crRNA之間的單股區。
- 如請求項45之系統,其中該經修飾之sgRNA進一步包含突出區。
- 如請求項45或46之系統,其中該經修飾之sgRNA進一步包含第二髮夾。
- 如請求項37至47中任一項之系統,其中該一或多個內部錨之內部錨位於該經修飾之sgRNA之單股區中。
- 如請求項37至48中任一項之系統,其中該一或多個內部錨之內部錨位於該tracrRNA與該crRNA之間的單股區中。
- 如請求項37至49中任一項之系統,其中該一或多個內部錨之內部錨位於該第一髮夾內之單股區中。
- 如請求項37至50中任一項之系統,其中該一或多個內部錨之內部錨位於該連結與該第一髮夾之間的單股區中。
- 如請求項37至51中任一項之系統,其中該經修飾之sgRNA進一步包含第二髮夾,且其中該一或多個內部錨之內部錨位於該第二髮夾內之單股區中。
- 如請求項37至52中任一項之系統,其中該一或多個內部錨中之各者或該一或多個結合區段中之各者為3個核苷酸至100個核苷酸長。
- 如請求項53之系統,其中該一或多個內部錨中之各者或該一或多個結合區段中之各者為3個核苷酸至20個核苷酸長。
- 如請求項54之系統,其中該一或多個內部錨中之各者或該一或多個結合區段中之各者為約5個核苷酸長。
- 如請求項37至55中任一項之系統,其中該一或多個內部錨中之各者包含來自表1之SEQ ID NO 1至SEQ ID NO 472的序列。
- 如請求項37至55中任一項之系統,其中該一或多個內部錨中之各者包含來自表2之SEQ ID NO 473至SEQ ID NO 3056的序列。
- 如請求項37至55中任一項之系統,其中該一或多個結合區段中之各者包含來自表3之SEQ ID NO 3057至SEQ ID NO 3528的序列。
- 如請求項37至55中任一項之系統,其中該一或多個結合區段中之各者包含來自表4之SEQ ID NO 3529至SEQ ID NO 6112的序列。
- 如請求項37至59中任一項之系統,其中該一或多個結合區段係藉由連接子連接。
- 如請求項60之系統,其中該連接子為約1至30個核苷酸長。
- 如請求項61之系統,其中該連接子為約10至25個核苷酸長。
- 如請求項60至62中任一項之系統,其中該連接子為聚去氧腺苷之序列。
- 如請求項37至63中任一項之系統,其中該SOI包含該第一基因座與該第二基因座之間的具有一或多個核苷酸取代、一或多個核苷酸插入、一或多個核苷酸缺失或其任何組合的區域。
- 如請求項22之系統,其中該一或多個核苷酸插入包含1至100個核苷酸、101至1000個核苷酸、1001至10,000個核苷酸或10,001至100,000個核苷酸。
- 如請求項22之系統,其中該一或多個核苷酸缺失包含1至100個核苷酸、101至1000個核苷酸、1001至10,000個核苷酸或10,001至100,000個核苷酸。
- 如請求項37至66中任一項之系統,其中該上游同源臂為5至1000個核苷酸長。
- 如請求項37至67中任一項之系統,其中該下游同源臂為約10至1000個核苷酸長。
- 如請求項37至68中任一項之系統,其中該供體DNA之該第一部分在該供體DNA之該第二部分之5'處。
- 如請求項37至68中任一項之系統,其中該供體DNA之該第一部分在該供體DNA之該第二部分之3'處。
- 如請求項37至70中任一項之系統,其中該供體DNA為單股。
- 如請求項37至70中任一項之系統,其中該供體DNA之該第一部分為單股且該供體DNA之該第二部分為完全或部分雙股。
- 如請求項37至72中任一項之系統,其中該供體DNA在3'及/或5'端封閉。
- 如請求項37至73中任一項之系統,其中該系統進一步包含CRISPR核酸酶。
- 如請求項74之系統,其中該CRISPR核酸酶為DNA核酸酶。
- 如請求項75之系統,其中該DNA核酸酶為Cas9、Cas12、Cas14或CasΦ。
- 一種修飾細胞之方法,其中該方法包含將如請求項1至76中任一項之系統轉運至該細胞中。
- 如請求項77之方法,其中該轉運包含: a. 培育該CRISPR核酸酶及該經修飾之sgRNA以形成核糖核蛋白(RNP)複合物; b. 將該供體DNA施用於該RNP複合物;及 c. 將來自(b)之該RNP複合物-供體DNA輸送至該細胞。
- 如請求項78之方法,其中在步驟(a)中該CRISPR核酸酶與該經修飾之sgRNA的比率為約1:0.5至約1:10。
- 如請求項78之方法,其中在步驟(a)中該CRISPR核酸酶與該經修飾之sgRNA的比率為約1:1至1:2。
- 如請求項77之方法,其中該轉運包含: a. 提供包含編碼該CRISPR核酸酶之核苷酸序列及編碼該經修飾之gRNA之核苷酸序列的一或多種載體; b. 將(a)之該一或多種載體輸送至該細胞;及 c. 將該供體DNA輸送至該細胞。
- 如請求項81之方法,其中步驟(c)在步驟(b)之後約6至48小時進行。
- 如請求項77至82中任一項之方法,其中該輸送係藉由病毒載體、脂質體、脂質奈米粒子或電穿孔達成。
- 如請求項77至83中任一項之方法,其中該細胞為免疫細胞。
- 如請求項84之方法,其中該免疫細胞為T細胞、B細胞、NK細胞或造血幹細胞。
- 如請求項77至85中任一項之方法,其中該方法離體或活體內進行。
- 如請求項77至86中任一項之方法,其中所需編輯之百分比比不含包含結合至該經修飾之sgRNA之該第一部分之該供體DNA及/或不含含有該一或多個內部錨之該經修飾之sgRNA的類似系統高至少10%、至少50%、至少100%或至少200%。
- 如請求項77至87中任一項之方法,其中該方法之脫靶率比不含包含結合至該經修飾之sgRNA之該第一部分之該供體DNA及/或不含含有該一或多個內部錨之該經修飾之sgRNA的類似系統低至少10%、至少50%或至少100%。
- 如請求項77至88中任一項之方法,其中該方法之易位率、大插入率或大缺失率比不含包含結合至該經修飾之sgRNA之該第一部分之該供體DNA及/或不含含有該一或多個內部錨之該經修飾之sgRNA的類似系統低至少10%、至少50%或至少100%。
- 一種治療遺傳病症之方法,其中該方法包含向個體投與有效量之如請求項1至76之系統。
- 如請求項90之方法,其中該SOI包含逆轉或緩解該遺傳病症之序列。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202263318362P | 2022-03-09 | 2022-03-09 | |
US63/318,362 | 2022-03-09 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202342069A true TW202342069A (zh) | 2023-11-01 |
Family
ID=87936063
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW112108604A TW202342069A (zh) | 2022-03-09 | 2023-03-08 | 經修飾之基於crispr之基因編輯系統及使用方法 |
Country Status (2)
Country | Link |
---|---|
TW (1) | TW202342069A (zh) |
WO (1) | WO2023169482A1 (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3294879A4 (en) * | 2015-05-14 | 2019-02-20 | University of Southern California | OPTIMIZED GENETIZATION WITH A RECOMBINANT ENDONUCLEASE SYSTEM |
EP3699281A1 (en) * | 2016-03-11 | 2020-08-26 | Pioneer Hi-Bred International, Inc. | Novel cas9 systems and methods of use |
CA3097963A1 (en) * | 2018-05-07 | 2019-11-14 | Pioneer Hi-Bred International, Inc. | Methods and compositions for homology-directed repair of cas endonuclease mediated double strand breaks |
US20220307006A1 (en) * | 2019-07-23 | 2022-09-29 | Pioneer Hi-Bred International, Inc. | Donor design strategy for crispr-cas9 genome editing |
-
2023
- 2023-03-08 TW TW112108604A patent/TW202342069A/zh unknown
- 2023-03-08 WO PCT/CN2023/080356 patent/WO2023169482A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
WO2023169482A1 (en) | 2023-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210207130A1 (en) | Methods and compositions for the making and using of guide nucleic acids | |
CA3174537A1 (en) | Methods and compositions for modulating a genome | |
CA3109953A1 (en) | Methods and compositions for modulating a genome | |
Spies et al. | Properties of RNA polymerase activity associated with infectious bursal disease virus and characterization of its reaction products | |
Phillips et al. | Nucleotide sequence of the 5′-terminus of Newcastle disease virus and assembly of the complete genomic sequence: agreement with the “rule of six” | |
CN110612353A (zh) | 经由抑制性tRNAs和脱氨酶对突变进行RNA靶向 | |
JP2022530432A (ja) | 核酸構築物およびその製造方法 | |
WO2021080922A1 (en) | Methods of performing rna templated genome editing | |
CN111748637B (zh) | 一种用于亲缘关系分析鉴定的snp分子标记组合、多重复合扩增引物组、试剂盒及方法 | |
CA3131319A1 (en) | Compositions comprising modified circular polyribonucleotides and uses thereof | |
CA2077135A1 (en) | A method of dna amplification | |
CA3102037A1 (en) | Gene targeting | |
WO2020214609A1 (en) | Aav vector-mediated deletion of large mutational hotspot for treatment of duchenne muscular dystrophy | |
TW202342069A (zh) | 經修飾之基於crispr之基因編輯系統及使用方法 | |
CN113862339B (zh) | 核酸组合产品、检测试剂盒和扩增靶核酸的方法 | |
CA2974559C (fr) | Procede de fabrication de vecteurs d'adn a partir de briques moleculaires contenant des sequences d'interet | |
CA3207601A1 (en) | Rna adeno-associated virus (raav) vector and uses thereof | |
US6468749B1 (en) | Sequence-dependent gene sorting techniques | |
CN116716349B (zh) | 一种dll4人源化小鼠模型的构建方法及其应用 | |
EA018564B1 (ru) | Новый способ получения рнк-вируса | |
CA3218780A1 (en) | Methods and compositions for genomic integration | |
Lian et al. | Recovery of infectious type Asia1 foot-and-mouth disease virus from suckling mice directly inoculated with an RNA polymerase I/II-driven unidirectional transcription plasmid | |
CA3239069A1 (en) | Modified prime editing guide rnas | |
WO2012064739A2 (en) | Microbial enrichment primers | |
CN103305475A (zh) | 肠道病毒71基因修饰系统的建立及其应用 |