JP2023018093A - 標的核酸の改変のための改善された方法 - Google Patents
標的核酸の改変のための改善された方法 Download PDFInfo
- Publication number
- JP2023018093A JP2023018093A JP2022187824A JP2022187824A JP2023018093A JP 2023018093 A JP2023018093 A JP 2023018093A JP 2022187824 A JP2022187824 A JP 2022187824A JP 2022187824 A JP2022187824 A JP 2022187824A JP 2023018093 A JP2023018093 A JP 2023018093A
- Authority
- JP
- Japan
- Prior art keywords
- molecule
- nucleic acid
- lys
- leu
- glu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 234
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 206
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 206
- 238000000034 method Methods 0.000 title claims abstract description 74
- 230000004048 modification Effects 0.000 title description 17
- 238000012986 modification Methods 0.000 title description 17
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 67
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 66
- 229920001184 polypeptide Polymers 0.000 claims abstract description 65
- 230000004927 fusion Effects 0.000 claims abstract description 59
- 238000002744 homologous recombination Methods 0.000 claims abstract description 24
- 230000006801 homologous recombination Effects 0.000 claims abstract description 24
- 102000053602 DNA Human genes 0.000 claims description 138
- 108020004414 DNA Proteins 0.000 claims description 138
- 239000013598 vector Substances 0.000 claims description 109
- 230000014509 gene expression Effects 0.000 claims description 74
- 230000000295 complement effect Effects 0.000 claims description 67
- 125000006850 spacer group Chemical group 0.000 claims description 61
- 239000000203 mixture Substances 0.000 claims description 21
- -1 spacer nucleic acid Chemical class 0.000 claims description 8
- 241000282414 Homo sapiens Species 0.000 claims description 7
- 230000000813 microbial effect Effects 0.000 claims description 4
- 241001465754 Metazoa Species 0.000 claims description 3
- 230000006798 recombination Effects 0.000 abstract description 11
- 238000005215 recombination Methods 0.000 abstract description 11
- 210000004027 cell Anatomy 0.000 description 109
- 108090000623 proteins and genes Proteins 0.000 description 88
- 239000013612 plasmid Substances 0.000 description 65
- 108091028043 Nucleic acid sequence Proteins 0.000 description 46
- 239000002773 nucleotide Substances 0.000 description 43
- 125000003729 nucleotide group Chemical group 0.000 description 43
- 108091033409 CRISPR Proteins 0.000 description 38
- 108091034117 Oligonucleotide Proteins 0.000 description 38
- 229920002477 rna polymer Polymers 0.000 description 36
- 108020005004 Guide RNA Proteins 0.000 description 34
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 31
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 31
- 230000008439 repair process Effects 0.000 description 29
- 239000012634 fragment Substances 0.000 description 28
- 102100039556 Galectin-4 Human genes 0.000 description 27
- 102000004169 proteins and genes Human genes 0.000 description 24
- 241000196324 Embryophyta Species 0.000 description 23
- 241000588724 Escherichia coli Species 0.000 description 23
- 101000608765 Homo sapiens Galectin-4 Proteins 0.000 description 22
- 240000007594 Oryza sativa Species 0.000 description 20
- 235000007164 Oryza sativa Nutrition 0.000 description 19
- 244000005700 microbiome Species 0.000 description 19
- 230000035772 mutation Effects 0.000 description 18
- 101100162670 Bacillus subtilis (strain 168) amyE gene Proteins 0.000 description 17
- 235000014469 Bacillus subtilis Nutrition 0.000 description 16
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 16
- 244000063299 Bacillus subtilis Species 0.000 description 15
- 101710163270 Nuclease Proteins 0.000 description 15
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 15
- 238000013518 transcription Methods 0.000 description 15
- 230000035897 transcription Effects 0.000 description 15
- 235000009566 rice Nutrition 0.000 description 14
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 13
- 238000009396 hybridization Methods 0.000 description 13
- 239000002609 medium Substances 0.000 description 13
- 108091026890 Coding region Proteins 0.000 description 12
- 150000001413 amino acids Chemical class 0.000 description 12
- 101150105363 amyE gene Proteins 0.000 description 12
- 108010092854 aspartyllysine Proteins 0.000 description 12
- 108020004999 messenger RNA Proteins 0.000 description 12
- 241000193830 Bacillus <bacterium> Species 0.000 description 11
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 11
- 230000001580 bacterial effect Effects 0.000 description 11
- 238000012217 deletion Methods 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- 108010034529 leucyl-lysine Proteins 0.000 description 11
- 239000003550 marker Substances 0.000 description 11
- 230000009466 transformation Effects 0.000 description 11
- 108010065511 Amylases Proteins 0.000 description 10
- 102000012410 DNA Ligases Human genes 0.000 description 10
- 108010061982 DNA Ligases Proteins 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 238000010362 genome editing Methods 0.000 description 10
- 108010050848 glycylleucine Proteins 0.000 description 10
- 108010054155 lysyllysine Proteins 0.000 description 10
- 230000006780 non-homologous end joining Effects 0.000 description 10
- 230000001105 regulatory effect Effects 0.000 description 10
- 108010001515 Galectin 4 Proteins 0.000 description 9
- 108010055016 Rec A Recombinases Proteins 0.000 description 9
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 230000037431 insertion Effects 0.000 description 9
- 230000008685 targeting Effects 0.000 description 9
- 108020004705 Codon Proteins 0.000 description 8
- 101150009006 HIS3 gene Proteins 0.000 description 8
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 8
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 8
- 108010062796 arginyllysine Proteins 0.000 description 8
- 238000012937 correction Methods 0.000 description 8
- 230000002068 genetic effect Effects 0.000 description 8
- 230000001965 increasing effect Effects 0.000 description 8
- 238000011534 incubation Methods 0.000 description 8
- 230000010076 replication Effects 0.000 description 8
- 239000004382 Amylase Substances 0.000 description 7
- 102000013142 Amylases Human genes 0.000 description 7
- 241000894006 Bacteria Species 0.000 description 7
- 238000010453 CRISPR/Cas method Methods 0.000 description 7
- 101001124887 Homo sapiens Histone-lysine N-methyltransferase PRDM9 Proteins 0.000 description 7
- 206010020649 Hyperkeratosis Diseases 0.000 description 7
- 102000001218 Rec A Recombinases Human genes 0.000 description 7
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 7
- 235000019418 amylase Nutrition 0.000 description 7
- 230000005782 double-strand break Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 7
- 101150066555 lacZ gene Proteins 0.000 description 7
- 238000012163 sequencing technique Methods 0.000 description 7
- 241000589158 Agrobacterium Species 0.000 description 6
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 6
- 241000186216 Corynebacterium Species 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 6
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 6
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000003776 cleavage reaction Methods 0.000 description 6
- 238000010367 cloning Methods 0.000 description 6
- 229940088598 enzyme Drugs 0.000 description 6
- 108010025306 histidylleucine Proteins 0.000 description 6
- 230000006698 induction Effects 0.000 description 6
- 108010057821 leucylproline Proteins 0.000 description 6
- 239000011541 reaction mixture Substances 0.000 description 6
- 241000894007 species Species 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- 108010073969 valyllysine Proteins 0.000 description 6
- OPIFSICVWOWJMJ-AEOCFKNESA-N 5-bromo-4-chloro-3-indolyl beta-D-galactoside Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1OC1=CNC2=CC=C(Br)C(Cl)=C12 OPIFSICVWOWJMJ-AEOCFKNESA-N 0.000 description 5
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 5
- 102100029144 Histone-lysine N-methyltransferase PRDM9 Human genes 0.000 description 5
- 108020001991 Protoporphyrinogen Oxidase Proteins 0.000 description 5
- 102000005135 Protoporphyrinogen oxidase Human genes 0.000 description 5
- 240000008042 Zea mays Species 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 229960005091 chloramphenicol Drugs 0.000 description 5
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 230000012010 growth Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 229920000642 polymer Polymers 0.000 description 5
- 230000007017 scission Effects 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 4
- KLSJWNVTNUYHDU-UHFFFAOYSA-N Amitrole Chemical compound NC1=NC=NN1 KLSJWNVTNUYHDU-UHFFFAOYSA-N 0.000 description 4
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 4
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 4
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 4
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 4
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 4
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 4
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 4
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 4
- 101150077230 GAL4 gene Proteins 0.000 description 4
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 4
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 4
- 241000880493 Leptailurus serval Species 0.000 description 4
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 4
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 4
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 4
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 4
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 4
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 4
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 4
- 108010047562 NGR peptide Proteins 0.000 description 4
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 4
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 4
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 4
- 108091028113 Trans-activating crRNA Proteins 0.000 description 4
- 108700019146 Transgenes Proteins 0.000 description 4
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 4
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 4
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 230000027455 binding Effects 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 4
- 238000003209 gene knockout Methods 0.000 description 4
- 108010018006 histidylserine Proteins 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- 108010064235 lysylglycine Proteins 0.000 description 4
- 108010017391 lysylvaline Proteins 0.000 description 4
- 235000009973 maize Nutrition 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000002703 mutagenesis Methods 0.000 description 4
- 231100000350 mutagenesis Toxicity 0.000 description 4
- 108010051242 phenylalanylserine Proteins 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- GNHDVXLWBQYPJE-UHFFFAOYSA-N saflufenacil Chemical compound C1=C(Cl)C(C(=O)NS(=O)(=O)N(C)C(C)C)=CC(N2C(N(C)C(=CC2=O)C(F)(F)F)=O)=C1F GNHDVXLWBQYPJE-UHFFFAOYSA-N 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 235000000346 sugar Nutrition 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000009261 transgenic effect Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 108010051110 tyrosyl-lysine Proteins 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- 102000000452 Acetyl-CoA carboxylase Human genes 0.000 description 3
- 108010016219 Acetyl-CoA carboxylase Proteins 0.000 description 3
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 3
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 3
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 3
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 3
- 241000194108 Bacillus licheniformis Species 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 241000186226 Corynebacterium glutamicum Species 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- 102100021579 Enhancer of filamentation 1 Human genes 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 3
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 3
- 101000898310 Homo sapiens Enhancer of filamentation 1 Proteins 0.000 description 3
- 108010065920 Insulin Lispro Proteins 0.000 description 3
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 3
- 241000186660 Lactobacillus Species 0.000 description 3
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 3
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 3
- 108091005461 Nucleic proteins Proteins 0.000 description 3
- 241000235648 Pichia Species 0.000 description 3
- 241000235070 Saccharomyces Species 0.000 description 3
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 3
- 102000039471 Small Nuclear RNA Human genes 0.000 description 3
- 108020004688 Small Nuclear RNA Proteins 0.000 description 3
- 241000193996 Streptococcus pyogenes Species 0.000 description 3
- 241000187747 Streptomyces Species 0.000 description 3
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 3
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 3
- 101150050575 URA3 gene Proteins 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 230000004075 alteration Effects 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 229940041514 candida albicans extract Drugs 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 238000000855 fermentation Methods 0.000 description 3
- 230000004151 fermentation Effects 0.000 description 3
- 238000012224 gene deletion Methods 0.000 description 3
- 238000012239 gene modification Methods 0.000 description 3
- 238000010353 genetic engineering Methods 0.000 description 3
- 230000005017 genetic modification Effects 0.000 description 3
- 235000013617 genetically modified food Nutrition 0.000 description 3
- 230000002779 inactivation Effects 0.000 description 3
- 229940039696 lactobacillus Drugs 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 101150054546 ppo gene Proteins 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 230000004083 survival effect Effects 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 150000003648 triterpenes Chemical class 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 210000005253 yeast cell Anatomy 0.000 description 3
- 239000012138 yeast extract Substances 0.000 description 3
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 2
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 2
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 2
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 2
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 2
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 2
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 2
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 2
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 2
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 2
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 2
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 2
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 2
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 2
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 2
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 2
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 2
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 2
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 2
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 2
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 2
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 2
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 2
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 2
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 2
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 2
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 2
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 2
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 2
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 2
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 2
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 2
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 2
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 2
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 2
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 2
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 2
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 2
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 2
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 2
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 2
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 2
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 2
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 2
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 2
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 2
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 2
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 2
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 2
- LVHMEJJWEXBMKK-GMOBBJLQSA-N Asn-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N LVHMEJJWEXBMKK-GMOBBJLQSA-N 0.000 description 2
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 2
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 2
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 2
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 2
- FTNRWCPWDWRPAV-BZSNNMDCSA-N Asn-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CC(N)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FTNRWCPWDWRPAV-BZSNNMDCSA-N 0.000 description 2
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 2
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 2
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 2
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 2
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 2
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 2
- SDHFVYLZFBDSQT-DCAQKATOSA-N Asp-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N SDHFVYLZFBDSQT-DCAQKATOSA-N 0.000 description 2
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 2
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 2
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 2
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 2
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 2
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 2
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 2
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 2
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 2
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 2
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 2
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 2
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 2
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 2
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 2
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 2
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 2
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 2
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 2
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 2
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 2
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 2
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 2
- 241000193422 Bacillus lentus Species 0.000 description 2
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 2
- 240000002791 Brassica napus Species 0.000 description 2
- 235000006008 Brassica napus var napus Nutrition 0.000 description 2
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 2
- 244000188595 Brassica sinapistrum Species 0.000 description 2
- 241000186146 Brevibacterium Species 0.000 description 2
- 241000193403 Clostridium Species 0.000 description 2
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 2
- 230000033616 DNA repair Effects 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- 102220518659 Enhancer of filamentation 1_D10A_mutation Human genes 0.000 description 2
- 101150094690 GAL1 gene Proteins 0.000 description 2
- 102100028501 Galanin peptides Human genes 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 2
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 2
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 2
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 2
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 2
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 2
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 2
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 2
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 2
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 2
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 2
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 2
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 2
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 2
- ININBLZFFVOQIO-JHEQGTHGSA-N Gln-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O ININBLZFFVOQIO-JHEQGTHGSA-N 0.000 description 2
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 2
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 2
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 2
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 2
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 2
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 2
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 2
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 2
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 2
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 2
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 2
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 2
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 2
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 2
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 2
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 2
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 2
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 2
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 2
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 2
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 2
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 2
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 2
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 2
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 2
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 2
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 2
- 241000589236 Gluconobacter Species 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 2
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 2
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 2
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 2
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 2
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 2
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 2
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 2
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 2
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 2
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 2
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 2
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 2
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 2
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 2
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 2
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 2
- 244000068988 Glycine max Species 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 2
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 2
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 2
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 2
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 2
- XMENRVZYPBKBIL-AVGNSLFASA-N His-Glu-His Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XMENRVZYPBKBIL-AVGNSLFASA-N 0.000 description 2
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 2
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 2
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 2
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 2
- 101100121078 Homo sapiens GAL gene Proteins 0.000 description 2
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 2
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 2
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 2
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 2
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 2
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 2
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 2
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 2
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 2
- HYLIOBDWPQNLKI-HVTMNAMFSA-N Ile-His-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HYLIOBDWPQNLKI-HVTMNAMFSA-N 0.000 description 2
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 2
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 2
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 2
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 2
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 2
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 2
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 2
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 2
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 2
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 2
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 2
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 2
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 2
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 2
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 2
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 2
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 2
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 2
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 2
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 2
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 2
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 2
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 2
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 2
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 2
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 2
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 2
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 2
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 2
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 2
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 2
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 2
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 2
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 2
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 2
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 2
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 2
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 2
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 2
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 2
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 2
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 2
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 2
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 2
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 2
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 2
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 2
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 2
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 2
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 2
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 2
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 2
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 2
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 2
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 2
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 2
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 2
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 2
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 2
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 2
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 2
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 2
- SPCHLZUWJTYZFC-IHRRRGAJSA-N Lys-His-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O SPCHLZUWJTYZFC-IHRRRGAJSA-N 0.000 description 2
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 2
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 2
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 2
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 2
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 2
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 2
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 2
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 2
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 2
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 2
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 2
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 2
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 2
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 2
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 2
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 2
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 2
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 2
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 2
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 2
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 2
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 2
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 2
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 2
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 2
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 2
- 241000218922 Magnoliophyta Species 0.000 description 2
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 2
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 2
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 2
- FZUNSVYYPYJYAP-NAKRPEOUSA-N Met-Ile-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O FZUNSVYYPYJYAP-NAKRPEOUSA-N 0.000 description 2
- QGRJTULYDZUBAY-ZPFDUUQYSA-N Met-Ile-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGRJTULYDZUBAY-ZPFDUUQYSA-N 0.000 description 2
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 2
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 2
- QEDGNYFHLXXIDC-DCAQKATOSA-N Met-Pro-Gln Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O QEDGNYFHLXXIDC-DCAQKATOSA-N 0.000 description 2
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 2
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical compound CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 2
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 2
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 2
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 2
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 2
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 2
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 2
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 2
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 2
- DSXPMZMSJHOKKK-HJOGWXRNSA-N Phe-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DSXPMZMSJHOKKK-HJOGWXRNSA-N 0.000 description 2
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 2
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 2
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 2
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 2
- 208000020584 Polyploidy Diseases 0.000 description 2
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 2
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 2
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 2
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 2
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 2
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 2
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 2
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 2
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 2
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 2
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 2
- 108010003201 RGH 0205 Proteins 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 241001123650 Schwanniomyces occidentalis Species 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 2
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 2
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 2
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 2
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 2
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 2
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 2
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 2
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 2
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 2
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 2
- QJKPECIAWNNKIT-KKUMJFAQSA-N Ser-Lys-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QJKPECIAWNNKIT-KKUMJFAQSA-N 0.000 description 2
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 2
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 2
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 2
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 2
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 2
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 244000061456 Solanum tuberosum Species 0.000 description 2
- 235000002595 Solanum tuberosum Nutrition 0.000 description 2
- 241000194017 Streptococcus Species 0.000 description 2
- 108700005078 Synthetic Genes Proteins 0.000 description 2
- 101150006914 TRP1 gene Proteins 0.000 description 2
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 2
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 2
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 2
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 2
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 2
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 2
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 2
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 2
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 2
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 2
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 2
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 2
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 2
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 2
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 2
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 2
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 2
- ABCLYRRGTZNIFU-BWAGICSOSA-N Thr-Tyr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O ABCLYRRGTZNIFU-BWAGICSOSA-N 0.000 description 2
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 2
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 244000098338 Triticum aestivum Species 0.000 description 2
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 2
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 2
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 2
- SLCSPPCQWUHPPO-JYJNAYRXSA-N Tyr-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SLCSPPCQWUHPPO-JYJNAYRXSA-N 0.000 description 2
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 2
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 2
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 2
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 2
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 2
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 2
- LMKKMCGTDANZTR-BZSNNMDCSA-N Tyr-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LMKKMCGTDANZTR-BZSNNMDCSA-N 0.000 description 2
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 2
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 2
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 2
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 2
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 2
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 2
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 2
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 2
- LIQJSDDOULTANC-QSFUFRPTSA-N Val-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LIQJSDDOULTANC-QSFUFRPTSA-N 0.000 description 2
- QGFPYRPIUXBYGR-YDHLFZDLSA-N Val-Asn-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N QGFPYRPIUXBYGR-YDHLFZDLSA-N 0.000 description 2
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 2
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 2
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 2
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 2
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 2
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 2
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 2
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 2
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 2
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 2
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 2
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 2
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 2
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 2
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 2
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 2
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 2
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 2
- SUGRIIAOLCDLBD-ZOBUZTSGSA-N Val-Trp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SUGRIIAOLCDLBD-ZOBUZTSGSA-N 0.000 description 2
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 2
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 2
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 2
- 241000193453 [Clostridium] cellulolyticum Species 0.000 description 2
- 108010081404 acein-2 Proteins 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000000246 agarose gel electrophoresis Methods 0.000 description 2
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 2
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 2
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 101150102092 ccdB gene Proteins 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 239000013611 chromosomal DNA Substances 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000012411 cloning technique Methods 0.000 description 2
- 239000013599 cloning vector Substances 0.000 description 2
- 230000004186 co-expression Effects 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- OILAIQUEIWYQPH-UHFFFAOYSA-N cyclohexane-1,2-dione Chemical compound O=C1CCCCC1=O OILAIQUEIWYQPH-UHFFFAOYSA-N 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 239000012847 fine chemical Substances 0.000 description 2
- 230000037433 frameshift Effects 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 238000010363 gene targeting Methods 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010079547 glutamylmethionine Proteins 0.000 description 2
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 2
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 2
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 125000001475 halogen functional group Chemical group 0.000 description 2
- 239000004009 herbicide Substances 0.000 description 2
- 108010028295 histidylhistidine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 108010027338 isoleucylcysteine Proteins 0.000 description 2
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 2
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 108010058731 nopaline synthase Proteins 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 150000004713 phosphodiesters Chemical class 0.000 description 2
- 108010025488 pinealon Proteins 0.000 description 2
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 238000003127 radioimmunoassay Methods 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 239000006152 selective media Substances 0.000 description 2
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 208000007056 sickle cell anemia Diseases 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 239000012137 tryptone Substances 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 108010012567 tyrosyl-glycyl-glycyl-phenylalanyl Proteins 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 2
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- IHPYMWDTONKSCO-UHFFFAOYSA-N 2,2'-piperazine-1,4-diylbisethanesulfonic acid Chemical compound OS(=O)(=O)CCN1CCN(CCS(O)(=O)=O)CC1 IHPYMWDTONKSCO-UHFFFAOYSA-N 0.000 description 1
- 239000005631 2,4-Dichlorophenoxyacetic acid Substances 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- NKDFYOWSKOHCCO-YPVLXUMRSA-N 20-hydroxyecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@](C)(O)[C@H](O)CCC(C)(O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 NKDFYOWSKOHCCO-YPVLXUMRSA-N 0.000 description 1
- 108020005065 3' Flanking Region Proteins 0.000 description 1
- 108020005029 5' Flanking Region Proteins 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical class BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 1
- 241000589220 Acetobacter Species 0.000 description 1
- 244000283763 Acetobacter aceti Species 0.000 description 1
- 235000007847 Acetobacter aceti Nutrition 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- DAEFQZCYZKRTLR-ZLUOBGJFSA-N Ala-Cys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O DAEFQZCYZKRTLR-ZLUOBGJFSA-N 0.000 description 1
- KMGOBAQSCKTBGD-DLOVCJGASA-N Ala-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CN=CN1 KMGOBAQSCKTBGD-DLOVCJGASA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- IAUSCRHURCZUJP-CIUDSAMLSA-N Ala-Lys-Cys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CS)C(O)=O IAUSCRHURCZUJP-CIUDSAMLSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- QHUOOCKNNURZSL-IHRRRGAJSA-N Arg-Tyr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O QHUOOCKNNURZSL-IHRRRGAJSA-N 0.000 description 1
- 241001523626 Arxula Species 0.000 description 1
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 1
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 1
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 1
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- 241000726103 Atta Species 0.000 description 1
- 229930192334 Auxin Natural products 0.000 description 1
- 241000193752 Bacillus circulans Species 0.000 description 1
- 241001328122 Bacillus clausii Species 0.000 description 1
- 241000193749 Bacillus coagulans Species 0.000 description 1
- 241000193747 Bacillus firmus Species 0.000 description 1
- 241000194107 Bacillus megaterium Species 0.000 description 1
- 241000194103 Bacillus pumilus Species 0.000 description 1
- 241000193388 Bacillus thuringiensis Species 0.000 description 1
- 241000195096 Basfia succiniciproducens Species 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 241000680806 Blastobotrys adeninivorans Species 0.000 description 1
- 241000743774 Brachypodium Species 0.000 description 1
- 241000193764 Brevibacillus brevis Species 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 241000589876 Campylobacter Species 0.000 description 1
- 241000907717 Candida freyschussii Species 0.000 description 1
- 108091092236 Chimeric RNA Proteins 0.000 description 1
- 241000193401 Clostridium acetobutylicum Species 0.000 description 1
- 241000193454 Clostridium beijerinckii Species 0.000 description 1
- 241000429427 Clostridium saccharobutylicum Species 0.000 description 1
- 108091033380 Coding strand Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 241000218631 Coniferophyta Species 0.000 description 1
- 241001517047 Corynebacterium acetoacidophilum Species 0.000 description 1
- 241000186145 Corynebacterium ammoniagenes Species 0.000 description 1
- 241000186248 Corynebacterium callunae Species 0.000 description 1
- 241000446654 Corynebacterium deserti Species 0.000 description 1
- 241001644925 Corynebacterium efficiens Species 0.000 description 1
- 241000337023 Corynebacterium thermoaminogenes Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 241000235646 Cyberlindnera jadinii Species 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 230000007023 DNA restriction-modification system Effects 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 241000194033 Enterococcus Species 0.000 description 1
- 241001646716 Escherichia coli K-12 Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 241000589565 Flavobacterium Species 0.000 description 1
- 108010058643 Fungal Proteins Proteins 0.000 description 1
- 241000605909 Fusobacterium Species 0.000 description 1
- 238000012357 Gap analysis Methods 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 229940123611 Genome editing Drugs 0.000 description 1
- 229930182566 Gentamicin Natural products 0.000 description 1
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 1
- 241000626621 Geobacillus Species 0.000 description 1
- WOACHWLUOFZLGJ-GUBZILKMSA-N Gln-Arg-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O WOACHWLUOFZLGJ-GUBZILKMSA-N 0.000 description 1
- CRRFJBGUGNNOCS-PEFMBERDSA-N Gln-Asp-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CRRFJBGUGNNOCS-PEFMBERDSA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- UXXIVIQGOODKQC-NUMRIWBASA-N Gln-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UXXIVIQGOODKQC-NUMRIWBASA-N 0.000 description 1
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- CHDWDBPJOZVZSE-KKUMJFAQSA-N Glu-Phe-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CHDWDBPJOZVZSE-KKUMJFAQSA-N 0.000 description 1
- WIKMTDVSCUJIPJ-CIUDSAMLSA-N Glu-Ser-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WIKMTDVSCUJIPJ-CIUDSAMLSA-N 0.000 description 1
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 1
- 241001594094 Gluconobacter morbifer Species 0.000 description 1
- 241000589232 Gluconobacter oxydans Species 0.000 description 1
- 241001403124 Gluconobacter thailandicus Species 0.000 description 1
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- 244000299507 Gossypium hirsutum Species 0.000 description 1
- 241000589989 Helicobacter Species 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- JBJNKUOMNZGQIM-PYJNHQTQSA-N His-Arg-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JBJNKUOMNZGQIM-PYJNHQTQSA-N 0.000 description 1
- WZOGEMJIZBNFBK-CIUDSAMLSA-N His-Asp-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O WZOGEMJIZBNFBK-CIUDSAMLSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 1
- SJIGTGZVQGLMGG-NAKRPEOUSA-N Ile-Cys-Arg Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O SJIGTGZVQGLMGG-NAKRPEOUSA-N 0.000 description 1
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 1
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 1
- FHPZJWJWTWZKNA-LLLHUVSDSA-N Ile-Phe-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N FHPZJWJWTWZKNA-LLLHUVSDSA-N 0.000 description 1
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 102000011781 Karyopherins Human genes 0.000 description 1
- 108010062228 Karyopherins Proteins 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 241000588747 Klebsiella pneumoniae Species 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 1
- 241001138401 Kluyveromyces lactis Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 101150007280 LEU2 gene Proteins 0.000 description 1
- 240000001046 Lactobacillus acidophilus Species 0.000 description 1
- 235000013956 Lactobacillus acidophilus Nutrition 0.000 description 1
- 241000186606 Lactobacillus gasseri Species 0.000 description 1
- 240000006024 Lactobacillus plantarum Species 0.000 description 1
- 235000013965 Lactobacillus plantarum Nutrition 0.000 description 1
- 241000194036 Lactococcus Species 0.000 description 1
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 1
- XVSJMWYYLHPDKY-DCAQKATOSA-N Leu-Asp-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O XVSJMWYYLHPDKY-DCAQKATOSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- MPSBSKHOWJQHBS-IHRRRGAJSA-N Leu-His-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N MPSBSKHOWJQHBS-IHRRRGAJSA-N 0.000 description 1
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- VVQJGYPTIYOFBR-IHRRRGAJSA-N Leu-Lys-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N VVQJGYPTIYOFBR-IHRRRGAJSA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 240000006240 Linum usitatissimum Species 0.000 description 1
- 235000004431 Linum usitatissimum Nutrition 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 1
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 1
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 1
- BYEBKXRNDLTGFW-CIUDSAMLSA-N Lys-Cys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O BYEBKXRNDLTGFW-CIUDSAMLSA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 1
- UYAKZHGIPRCGPF-CIUDSAMLSA-N Met-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N UYAKZHGIPRCGPF-CIUDSAMLSA-N 0.000 description 1
- HSJIGJRZYUADSS-IHRRRGAJSA-N Met-Lys-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HSJIGJRZYUADSS-IHRRRGAJSA-N 0.000 description 1
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 1
- 240000003433 Miscanthus floridulus Species 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 241000234295 Musa Species 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 241001072230 Oceanobacillus Species 0.000 description 1
- 241001112159 Ogataea Species 0.000 description 1
- 241000320412 Ogataea angusta Species 0.000 description 1
- 241001452677 Ogataea methanolica Species 0.000 description 1
- 241001489174 Ogataea minuta Species 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 240000002582 Oryza sativa Indica Group Species 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 239000007990 PIPES buffer Substances 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241000194109 Paenibacillus lautus Species 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- HTKNPQZCMLBOTQ-XVSYOHENSA-N Phe-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O HTKNPQZCMLBOTQ-XVSYOHENSA-N 0.000 description 1
- ZENDEDYRYVHBEG-SRVKXCTJSA-N Phe-Asp-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZENDEDYRYVHBEG-SRVKXCTJSA-N 0.000 description 1
- HGNGAMWHGGANAU-WHOFXGATSA-N Phe-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HGNGAMWHGGANAU-WHOFXGATSA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- YOFKMVUAZGPFCF-IHRRRGAJSA-N Phe-Met-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O YOFKMVUAZGPFCF-IHRRRGAJSA-N 0.000 description 1
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 1
- KUSYCSMTTHSZOA-DZKIICNBSA-N Phe-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N KUSYCSMTTHSZOA-DZKIICNBSA-N 0.000 description 1
- 108010068086 Polyubiquitin Proteins 0.000 description 1
- 102100037935 Polyubiquitin-C Human genes 0.000 description 1
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 1
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 1
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- YAZNFQUKPUASKB-DCAQKATOSA-N Pro-Lys-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O YAZNFQUKPUASKB-DCAQKATOSA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- WFIVLLFYUZZWOD-RHYQMDGZSA-N Pro-Lys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WFIVLLFYUZZWOD-RHYQMDGZSA-N 0.000 description 1
- GFHOSBYCLACKEK-GUBZILKMSA-N Pro-Pro-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GFHOSBYCLACKEK-GUBZILKMSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 241000589776 Pseudomonas putida Species 0.000 description 1
- 241000589615 Pseudomonas syringae Species 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 102000014450 RNA Polymerase III Human genes 0.000 description 1
- 108010078067 RNA Polymerase III Proteins 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 244000253911 Saccharomyces fragilis Species 0.000 description 1
- 235000018368 Saccharomyces fragilis Nutrition 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 241000311088 Schwanniomyces Species 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 1
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 1
- VBKBDLMWICBSCY-IMJSIDKUSA-N Ser-Asp Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O VBKBDLMWICBSCY-IMJSIDKUSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 1
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 1
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 1
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 1
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 1
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- 241000872198 Serjania polyphylla Species 0.000 description 1
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 1
- 108091027568 Single-stranded nucleotide Proteins 0.000 description 1
- 239000005708 Sodium hypochlorite Substances 0.000 description 1
- 240000006394 Sorghum bicolor Species 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241000264435 Streptococcus dysgalactiae subsp. equisimilis Species 0.000 description 1
- 241000194048 Streptococcus equi Species 0.000 description 1
- 241000194054 Streptococcus uberis Species 0.000 description 1
- 241000187759 Streptomyces albus Species 0.000 description 1
- 241001468227 Streptomyces avermitilis Species 0.000 description 1
- 241000187432 Streptomyces coelicolor Species 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 235000012308 Tagetes Nutrition 0.000 description 1
- 241000736851 Tagetes Species 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- APIQKJYZDWVOCE-VEVYYDQMSA-N Thr-Asp-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O APIQKJYZDWVOCE-VEVYYDQMSA-N 0.000 description 1
- UBDDORVPVLEECX-FJXKBIBVSA-N Thr-Gly-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UBDDORVPVLEECX-FJXKBIBVSA-N 0.000 description 1
- PJCYRZVSACOYSN-ZJDVBMNYSA-N Thr-Thr-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O PJCYRZVSACOYSN-ZJDVBMNYSA-N 0.000 description 1
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- JWGRSJCYCXEIKH-QEJZJMRPSA-N Trp-Glu-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N JWGRSJCYCXEIKH-QEJZJMRPSA-N 0.000 description 1
- DDHFMBDACJYSKW-AQZXSJQPSA-N Trp-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O DDHFMBDACJYSKW-AQZXSJQPSA-N 0.000 description 1
- DKKHULUSOSWGHS-UWJYBYFXSA-N Tyr-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N DKKHULUSOSWGHS-UWJYBYFXSA-N 0.000 description 1
- NSTPFWRAIDTNGH-BZSNNMDCSA-N Tyr-Asn-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NSTPFWRAIDTNGH-BZSNNMDCSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 241000235029 Zygosaccharomyces bailii Species 0.000 description 1
- 241000235033 Zygosaccharomyces rouxii Species 0.000 description 1
- 241000319304 [Brevibacterium] flavum Species 0.000 description 1
- 241000222124 [Candida] boidinii Species 0.000 description 1
- 241000222126 [Candida] glabrata Species 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- POODSGUMUCVRTR-IEXPHMLFSA-N acryloyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C=C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 POODSGUMUCVRTR-IEXPHMLFSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010021908 aspartyl-aspartyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 239000002363 auxin Substances 0.000 description 1
- 229940054340 bacillus coagulans Drugs 0.000 description 1
- 229940005348 bacillus firmus Drugs 0.000 description 1
- 229940097012 bacillus thuringiensis Drugs 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- LLSDKQJKOVVTOJ-UHFFFAOYSA-L calcium chloride dihydrate Chemical compound O.O.[Cl-].[Cl-].[Ca+2] LLSDKQJKOVVTOJ-UHFFFAOYSA-L 0.000 description 1
- 208000032343 candida glabrata infection Diseases 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 238000002659 cell therapy Methods 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000008260 defense mechanism Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000000326 densiometry Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 210000001840 diploid cell Anatomy 0.000 description 1
- 235000021186 dishes Nutrition 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003596 drug target Substances 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 230000000408 embryogenic effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 235000004426 flaxseed Nutrition 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 229960002518 gentamicin Drugs 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 210000005256 gram-negative cell Anatomy 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- XLYOFNOQVPJJNP-ZSJDYOACSA-N heavy water Substances [2H]O[2H] XLYOFNOQVPJJNP-ZSJDYOACSA-N 0.000 description 1
- 230000002363 herbicidal effect Effects 0.000 description 1
- 239000008240 homogeneous mixture Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 1
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- 239000011630 iodine Substances 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229940031154 kluyveromyces marxianus Drugs 0.000 description 1
- 229940039695 lactobacillus acidophilus Drugs 0.000 description 1
- 229940072205 lactobacillus plantarum Drugs 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 101150009250 manP gene Proteins 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical compound CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 238000013048 microbiological method Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000007479 molecular analysis Methods 0.000 description 1
- 230000004001 molecular interaction Effects 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 238000001821 nucleic acid purification Methods 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000009438 off-target cleavage Effects 0.000 description 1
- 238000000424 optical density measurement Methods 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 210000002706 plastid Anatomy 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 210000001850 polyploid cell Anatomy 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000002731 protein assay Methods 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- RYVMUASDIZQXAA-UHFFFAOYSA-N pyranoside Natural products O1C2(OCC(C)C(OC3C(C(O)C(O)C(CO)O3)O)C2)C(C)C(C2(CCC3C4(C)CC5O)C)C1CC2C3CC=C4CC5OC(C(C1O)O)OC(CO)C1OC(C1OC2C(C(OC3C(C(O)C(O)C(CO)O3)O)C(O)C(CO)O2)O)OC(CO)C(O)C1OC1OCC(O)C(O)C1O RYVMUASDIZQXAA-UHFFFAOYSA-N 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000008263 repair mechanism Effects 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000005204 segregation Methods 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 1
- SUKJFIGYRHOWBL-UHFFFAOYSA-N sodium hypochlorite Chemical compound [Na+].Cl[O-] SUKJFIGYRHOWBL-UHFFFAOYSA-N 0.000 description 1
- RWVGQQGBQSJDQV-UHFFFAOYSA-M sodium;3-[[4-[(e)-[4-(4-ethoxyanilino)phenyl]-[4-[ethyl-[(3-sulfonatophenyl)methyl]azaniumylidene]-2-methylcyclohexa-2,5-dien-1-ylidene]methyl]-n-ethyl-3-methylanilino]methyl]benzenesulfonate Chemical compound [Na+].C1=CC(OCC)=CC=C1NC1=CC=C(C(=C2C(=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C)C=2C(=CC(=CC=2)N(CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C)C=C1 RWVGQQGBQSJDQV-UHFFFAOYSA-M 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 229940115922 streptococcus uberis Drugs 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012250 transgenic expression Methods 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/75—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8274—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/8509—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/905—Stable introduction of foreign DNA into chromosome using homologous recombination in yeast
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Abstract
【課題】標的核酸を改変するための方法を提供する。
【解決手段】細胞中の標的核酸(標的NA)分子を改変するための方法であって、a.少なくとも1つのドナー核酸(doNA)分子に共有結合により連結されたガイド核酸(gNA)分子を含む組換え融合核酸(fuNA)分子を用意する工程、及び、b.前記fuNA分子を、標的NA分子を含む1つ以上の細胞に導入する工程、及び、c.部位特異的核酸改変ポリペプチドを前記1つ以上の細胞に導入する工程、及び、d.前記1つ以上の細胞を、前記1つ以上の細胞において相同組換えを可能にする条件下でインキュベートする工程、及び場合によって、e.相同組換えが起きた1つ以上の細胞を単離する工程を含み、fuNAはRNAからなる、方法を提供する。
【選択図】図1
【解決手段】細胞中の標的核酸(標的NA)分子を改変するための方法であって、a.少なくとも1つのドナー核酸(doNA)分子に共有結合により連結されたガイド核酸(gNA)分子を含む組換え融合核酸(fuNA)分子を用意する工程、及び、b.前記fuNA分子を、標的NA分子を含む1つ以上の細胞に導入する工程、及び、c.部位特異的核酸改変ポリペプチドを前記1つ以上の細胞に導入する工程、及び、d.前記1つ以上の細胞を、前記1つ以上の細胞において相同組換えを可能にする条件下でインキュベートする工程、及び場合によって、e.相同組換えが起きた1つ以上の細胞を単離する工程を含み、fuNAはRNAからなる、方法を提供する。
【選択図】図1
Description
本発明は、標的核酸の改変のための改善された方法に関する。
CRISPR(クラスター化され、規則的に間隔を置いて配置された短いパリンドローム反復配列)システムは、当初、連鎖球菌属(Streptococcus)に属する細菌の適応防御機構として同定された(WO2007/025097)。これらの細菌性CRISPRシステムは、侵入ウイルスのDNA内に存在する相補的配列の分解を指向する切断タンパク質と複合したガイドRNA(gRNA)に依存する。CRISPR/Casシステムの最初に同定されたタンパク質であるCas9は、2つの非コードRNA:crRNA及びトランス活性化crRNA(tracrRNA)の複合体によってPAM(プロトスペーサー隣接モチーフ)配列モチーフに隣接するDNA標的配列にガイドされる大きなモノマーDNAヌクレアーゼである。その後、crRNAをtracrRNAと融合させて作製した合成RNAキメラ(単一ガイドRNA又はgRNA)が同様に機能的であることが示された(Jinekら、2012)。
いくつかの研究グループが、CRISPR切断特性は、これまでにない容易さで、ほとんど全ての生物のゲノム中の遺伝子を破壊するために使用することができることを見出している(Mali Pら(2013) Science 339(6121):819~823頁; Cong Lら(2013) Science 339(6121))。最近、CRISPRを強力な遺伝子編集ツールに変換して、ほぼ任意の部位においてほとんど任意の所望の配列でゲノム編集を可能にする修復のためのテンプレートが得られることが明らかになった(WO2014/150624、WO2014/204728)。
遺伝子標的化とは、相同組換え(HR)による核酸の欠失、挿入又は置き換えによる部位特異的遺伝子改変を指す。標的化効率は、ゲノム標的中の二本鎖切断(DSB)によって高く促進される。また、染色体DNAのDSB後の相同性の直接的な存在は、相同組換えに有利な非相同末端結合(NHEJ)修復をほぼ排除するようである。
本発明は、核酸改変ポリペプチド(少なくとも1つのドナー核酸(doNA)分子に共有結合により連結されたガイド核酸(gNA)分子を含む融合核酸(fuNA)分子)と相互作用するHR修復のための適切なドナーに融合されたガイド核酸を提供する。ヌクレアーゼ切断部位に隣接する標的DNAに対する相同性を有するドナー核酸の送達を改善するために、ドナー核酸(doNA)がCRISPR成分に共有結合により連結される遺伝子標的化戦略が提示される。このように、遺伝子編集複合体は、必要な認識及び切断ツールだけでなく、改変のための鋳型も含む。ガイド核酸(gNA)によって認識されると、ヌクレアーゼは標的領域を切断し、入ってくるドナーの即時かつ同時の存在はすると、HRプロセスを促進し、そのことにより遺伝子修復効力が増加する。
多くの微生物系は、効率的なNHEJシステムを欠いている[Standage-Beier K、Zhang Q、Wang X (2015) Targeted Large-Scale Deletion of Bacterial Genomes Using CRISPR-Nickases. ACS Synth Biol. 4(11): 1217~1225頁]。例えば、バイオエネルギー研究にとって重要なクロストリジウム・セルロリティクム(Clostridium cellulolyticum)は、CRISPR/Cas9を用いて容易に工学的に操作することができず[Xu T、Li Y、Shi Z、Hemme CL、Li Y、Zhu Y、Van Nostrand JD、He Z、Zhou J (2015) Efficient Genome Editing in Clostridium cellulolyticum via CRISPR-Cas9 Nickase. Appl Environ Microbiol. 81(13):4423~31頁]、DSBを導入して遺伝子をノックアウトする試みは細胞死をもたらす。別の例は、DSB修復についての相同組換え(HR)にも依存する大腸菌(Escherichia coli)である。このような生物におけるゲノム編集についての現在の技術は、CRISPR/Cas9-ベースのニッカーゼの使用と、それに続く非融合核酸ドナーを介した非効率的な修復、ヌクレアーゼ作用と協調するCRISPR/Casの誘導発現、及びカスタムDNA配列に対応する柔軟性をもたない核酸ドナー又はリコンビナーゼの導入に焦点を合わせている。
fuNA分子を含むCRISPR/Cas又はCRISPR/Cas様システムの提供及び/又は適用であるFusionCRISPR技術の適用により、以前はハイスループット標的化を受けにくかった多種多様な微生物種におけるノックアウトの作製が単純化される。二本鎖切断(DSB)の誘導時に迅速にドナー核酸を提供することにより、HR修復機構は、切断を付随する鋳型に首尾よくライゲーションすることになる。FusionCRISPRの導入は、ニッキングバージョンのCRISPR/Cas9、リコンビナーゼ又は任意の他の目的の(トランス)遺伝子の導入のために他の方法で使用される一般的な技術を用いて行われる。これらの技術には、プラスミドのエレクトロポレーション/熱ショック、ウイルス形質導入及びコンジュゲーションが含まれるが、これらに限定されない。
効率的なNHEJを有する生物中の遺伝子は、CRISPR/Cas9を導入することによってノックアウトすることができる(ここでガイドRNAは、(1)標的遺伝子とマッチするスペーサー(2)~99ヌクレオチドの典型的な長さを有する正しいガイドRNAフォールディングのための必須配列(tracrRNA:単一のガイドRNA(sgRNA)に共通して組み合わされたcrRNA)からなる)一方で、DSB感受性微生物におけるノックアウトは、以下の組成:(1)スペーサー(2)正しい二次構造のための必須配列(3)標的とマッチする少なくとも15ヌクレオチド(4)第1の標的とマッチする第一の少なくとも15ヌクレオチドから1つ以上の塩基下流の標的とマッチする少なくとも15ヌクレオチド、をもたらすRNAの単純な適応によって達成することができる。ノックアウトFusionCRISPRカセットを表す2つの相補的なssDNAオリゴヌクレオチドは、任意のオリゴ合成会社から商業的に容易に購入することができる。或いは、それはdsDNAとして合成することができる。FusionCRISPRノックアウトカセットのクローニングは、タイプIIS制限酵素を有する通常のCRISPRカセット中の意図した標的のための20ヌクレオチドスペーサーのクローニングのための最も一般的な方法と同じように進めることができる。したがって、FusionCRISPRによる制御された遺伝子ノックアウトのアクセス、柔軟性及び使い易さは、通常のCRISPR/Cas9に匹敵し、本発明は、ハイスループットノックアウトをNHEJが非効率的又は存在しない標的種にまで拡張する。
FusionCRISPRは、任意の生物のノックインにも使用できる。標準導入技術及び標準発現ビヒクル、例えば単純なプラスミドをを用いて、選択マーカーをノックインすることができる。これは、選択の容易さを提供しながらも、内因性遺伝子を遮断しノックアウトすることができる。
ヒト及び他の細胞におけるゲノム規模のノックアウトは、疾患、薬物応答及び正常な生物学的プロセスに関与する遺伝子の発見及び疾患モデルの作製を可能にする[Shalem O、Sanjana NE、Hartenian E、Shi X、Scott DA、Mikkelsen TS、Heckl D、Ebert BL、Root DE、Doench JG、Zhang F (2014) Genome-scale CRISPR-Cas9 knockout screening in human cells. Science; 343(6166):84~7頁]。ノックアウトは、典型的には、特定の標的のためのCRISPR/Cas9の導入及びNHEJに依存して問題の遺伝子について「ヌル」を作製することによって生成される。3つの主要な問題がこの方法において生じる:(1)NHEJ修復がフレームシフトをもたらさない(又は別の下流の開始コドンが使用されて切断された遺伝子産物が生じる)ため、ノックアウトがしばしば作製されない、(2)結果、すなわち正確な一次DNA配列が知られておらず、各DNA改変「事象」について決定する必要があり、費用と時間がかかる、(3)二倍体又は倍数体生物において、各染色体上のNHEJ修復は別々に起き、最初に全ての利用可能な「基質」がうまく標的化を達成したとしても、複雑な分子分析及び/又は一倍体モデルシステムへの強制的な切り替えを招く[Wade M (2015) High-throughput silencing using the CRISPR-Cas9 system:A review of the benefits and challenges. Journal of Biomolecular Screening、第20巻(8):1027~39頁]。FusionCRISPRは、上記のように欠失の制御が可能であり、予測可能な結果をもたらす。二倍体及び倍数体細胞系では、各染色体上に導入された任意の改変の大部分は同一である。欠失は、別の転写の可能性が低くなるように十分に大きく設計することができ、欠失を3で割ることができない数の塩基からなるように設計することにより、単に短いストレッチのアミノ酸を欠損した機能的なタンパク質がなお作製される危険を排除することとなる。
任意の細胞システムにおけるノックアウトを制御するために設計されたFusionCRISPR構成の導入方法は、ノックアウトの作製のためのCRISPR/Cas9の導入とそれに続くNHEJ修復に使用される方法と同一である。これには、昆虫細胞のバキュロウイルス発現システムに対するヒト細胞のためのAAV及びレンチウイルスベクターの使用が含まれるが、これに限定されない。現在の方法へのさらなる適応は、上記のようなガイドRNAの短い伸長以外には、必要ではない。
ゲノム編集は、様々な遺伝的障害を治療するために使用することができる。多くの遺伝的障害は、必要な補正を含有する補正核酸鋳型と共に部位特異的ヌクレアーゼを提供することによって潜在的に補正され得る点突然変異を含む。1つの例は、β-グロビン遺伝子の6番目のコドンにおける単一のDNA塩基変異(A>T)から生じる鎌状赤血球疾患である[Li C、Ding L、Sun CW、Wu LC、Zhou D、Pawlik KM、Khodadadi-Jamayran A、Westin E、Goldman FD、Townes TM(2016)Novel HDAd/EBV Reprogramming Vector and Highly Efficient Ad/CRISPR-Cas Sickle Cell Disease Gene Correction. Sci Rep. 6:30422]。ヌクレアーゼ及び補正鋳型を別々に提供することによる細胞の変異の補正は、しばしば、非協調的な最初のDNA切断及びHDR修復のための補正鋳型の局所的な到達をもたらす。時間的/空間的強調の欠如を補うために、ヌクレアーゼ及び補正鋳型の濃度を比較的高くする必要がある。より高いヌクレアーゼ濃度は、否定的結果(患者のリスクがより高い、及び/又は分子分析におけるコストがより高い)を伴うより高いオフターゲット切断をもたらす可能性がある。FusionCRISPRははるかに低い濃度で正しい遺伝子補正を達成する。FusionCRISPRを適用する方法は、当技術分野における現在の標準と同一であり[Maeder ML、Gersbach CA (2016) Genome-editing Technologies for Gene and Cell Therapy. Mol Ther. 24(3):430~46頁]、唯一の相違点は所望の補正を含むわずかに長いsgRNAである。
FusionCRISPRは、種々の異なる生物における種々の酵素の基質又は生成物の特異性を変えるために使用することができる。例えば、単一のアミノ酸は、トリテルペンシンターゼ基質及び種々の植物種における産物特異性の主要な決定因子であることが見出されている[Salmon M、Thimmappa RB、Minto RE、Melton RE、Hughes RK、O'Maille PE、Hemmings AM、Osbourn A (2016) A conserved amino acid residue critical for product and substrate specificity in plant triterpene synthases. Proc Natl Acad Sci U S A. 113(30):E4407-14]。トリテルペンは、薬学及びバイオテクノロジーにおける用途を有する天然産物の多様な群であり、産物の特異性に影響を及ぼす能力は、目的の植物における新規の生体分子又はより多量の生体分子の合成への扉を開く。FusionCRISPRは、特異性に影響する酵素の基質ポケット又は他のドメインにおける重要なアミノ酸の改変を可能にする。所望のアミノ酸は、ゲノム中で置き換える必要のあるコドンに隣接する配列と相同性を有するヌクレオチド配列が隣接する融合鋳型に対応するコドンを含めることによって導入される。FusionCRISPR構築物の導入の一例は、T-DNAが選択マーカーを含むアグロバクテリウム媒介T-DNA形質転換による、(1)RNAポリメラーゼIIIプロモーター、(2)意図した標的コドン又はそれに隣接する配列にマッチするスペーサー(最も近いPAMを見つける)、(3)ガイドの正しい二次構造のための必須配列、(4)切断に隣接する一つの領域に一致するホモロジーアーム、(5)酵素の特異性に影響を及ぼすアミノ酸にマッチする新規コドン、(6)切断の反対側のホモロジーアーム、及び(7)ターミネーターのそれぞれからなる強力なプロモーター及びFusionCRISPR構築物によって駆動されるCas9である。カットされる場所によって、ドナーにPAM配列が有ることを避けるためにサイレント突然変異を含ませなければならないかもしれない。ホモロジーアーム、意図された変化及び意図された変化の間の配列は、ドナーの継ぎ目のない取り込みのために連続している。選択可能なマーカーは、安定して組み込まれたT-DNAを有する植物細胞を得るために使用される。これらの細胞では、形質転換植物の維持及び再生を通して、FusionCRISPR成分は、意図された標的でゲノムを変更する機会を有する。これらの変更によって生殖細胞系へと進むことができ、T-DNAの新規な内因性配列及び分離について次の世代の実生をスクリーニングすることができる。
FusionCRISPRにより、任意の生物においてエピトープ又は他のタグを内因性遺伝子に挿入することが可能となる。タグは、細胞レベル及び細胞内レベルでの内因性遺伝子産物の追跡、タンパク質-タンパク質相互作用の同定、ChIP及び他の分子相互作用並びにタンパク質精製のために使用することができる。ほとんどの応用は、経路の発見と薬物標的の同定となる。FusionCRISPR構築物は、置換の導入のため、上記と同様な相同性のストレッチ間のペイロードとしてタグをコードする核酸を有することになる。DNAとしての又は一時的なFusionCRISPRの導入は、目的の生物における通常のCRISPR/Cas9に現在使用されているものと同じプロトコールに従う。
本発明者らの酵母実験は、FusionCRISPRのペイロードがヌクレアーゼの完全な機能に影響を与えずに少なくとも731ヌクレオチドであり得ることを示した。この配列又は潜在的により大きいサイズの配列は、強力なプロモーター又は天然プロモーターと比較して異なる組織又は環境キュー(cue)特異的活性を有するプロモーターを含むことができる。FusionCRISPRは、内因性プロモーターに潜在的にとって代わることができ、上方調節を含む遺伝子調節の代替法が可能となる。
Jinekら、2012
Mali Pら(2013) Science 339(6121):819~823頁
Cong Lら(2013) Science 339(6121)
Standage-Beier K、Zhang Q、Wang X (2015) ACS Synth Biol. 4(11): 1217~1225頁
Xu T、Li Y、Shi Z、Hemme CL、Li Y、Zhu Y、Van Nostrand JD、He Z、Zhou J (2015) Appl Environ Microbiol. 81(13):4423~31頁
Shalem O、Sanjana NE、Hartenian E、Shi X、Scott DA、Mikkelsen TS、Heckl D、Ebert BL、Root DE、Doench JG、Zhang F (2014) Science; 343(6166):84~7頁
Wade M (2015) Journal of Biomolecular Screening、第20巻(8):1027~39頁
Li C、Ding L、Sun CW、Wu LC、Zhou D、Pawlik KM、Khodadadi-Jamayran A、Westin E、Goldman FD、Townes TM(2016) Sci Rep. 6:30422
Maeder ML、Gersbach CA (2016) Mol Ther. 24(3):430~46頁
Salmon M、Thimmappa RB、Minto RE、Melton RE、Hughes RK、O'Maille PE、Hemmings AM、Osbourn A (2016) Proc Natl Acad Sci U S A. 113(30):E4407-14
本発明の1つの目的は、CRISPR/Cas DNA修復システム又はCRISPR/Cas様DNA修復システムの適用を単純化することである。
本発明のさらなる目的は、DNA切断修復中の標的核酸における相同組換えの効率を高めることである。
驚くべきことに、これは、ドナー核酸分子及びガイド核酸分子を共有結合させることにより達成され、後者はCRISPR/Cas DNA修復システム又はCRISPR/Cas様DNA修復システムの要素として部位特異的核酸改変ポリペプチドと相互作用する。
本発明の一実施形態は、細胞又は組成物中の標的核酸(標的NA)分子を改変するための方法であって、以下の工程
a.少なくとも1つのドナー核酸(doNA)分子に共有結合により連結されたガイド核酸(gNA)分子を含む組換え融合核酸(fuNA)分子を用意する工程、及び
b.前記fuNA分子を、標的NA分子を含む1つ以上の細胞又は組成物に導入する工程、及び
c.部位特異的核酸改変ポリペプチドを前記1つ以上の細胞又は組成物に導入する工程、及び
d.前記1つ以上の細胞又は組成物を、前記1つ以上の細胞又は組成物において相同組換えを可能にする条件下でインキュベートする工程、及び場合によって
e.相同組換えが起こった1つ以上の細胞を単離する工程を含む方法である。
a.少なくとも1つのドナー核酸(doNA)分子に共有結合により連結されたガイド核酸(gNA)分子を含む組換え融合核酸(fuNA)分子を用意する工程、及び
b.前記fuNA分子を、標的NA分子を含む1つ以上の細胞又は組成物に導入する工程、及び
c.部位特異的核酸改変ポリペプチドを前記1つ以上の細胞又は組成物に導入する工程、及び
d.前記1つ以上の細胞又は組成物を、前記1つ以上の細胞又は組成物において相同組換えを可能にする条件下でインキュベートする工程、及び場合によって
e.相同組換えが起こった1つ以上の細胞を単離する工程を含む方法である。
本発明による融合核酸分子の様々な好ましい構造を図1~12に示す。最も好ましい構造を図1に示す。
標的核酸は、導入される核酸分子が標的核酸に対して異種である核酸分子を標的核酸に導入することによって改変され得る。ドナー核酸分子のホモロジーアーム1とホモロジーアーム2との間の配列は、この場合、標的核酸に導入されることが想定され、ホモロジーアームに相補的である標的核酸内の領域の間には存在しない核酸分子を含む。
標的核酸はまた、標的核酸から少なくとも1塩基を欠失させることによって改変させてもよい。この場合、ドナー核酸分子のホモロジーアーム1とホモロジーアーム2との間の配列は、標的核酸と比較して少なくとも1塩基を欠く標的核酸分子に相補的な配列を含む。
標的核酸は、標的核酸の少なくとも1塩基を標的核酸と異種の1つ以上の塩基で置換することによってさらに改変されてもよい。この場合、ドナー核酸のホモロジーアーム1と2との間の配列は、標的核酸中の相補領域と比較して少なくとも1つのミスマッチを含む。
標的核酸は、正しい標的部位の同定及び結合のためにいくつかの部位特異的核酸改変ポリペプチドに必要となる、標的核酸分子中の標的配列に隣接する「プロトスペーサー隣接モチーフ」(PAM)配列を含んでもよい。PAMの配列は、種々の部位特異的核酸改変ポリペプチドに特異的であり(Doudna及びCharpentier、2014、Science 346(6213):1258096)、当業者に公知である。
本発明の方法は、好ましくは、生存細胞における標的核酸改変に適用されるが、インビトロシステムで適用されてもよい。
標的核酸分子は、RNA又はDNAであってもよく、一本鎖又は二本鎖であってもよい。好ましくは、標的核酸分子はDNAであり、より好ましくは、標的核酸分子は二本鎖DNAである。
部位特異的核酸改変ポリペプチドは、ポリペプチドとして細胞又は組成物に導入されるか、又は前記部位特異的核酸改変ポリペプチドをコードするRNA分子の導入によるか又は前記部位特異的核酸改変ポリペプチドを発現する発現構築物の導入によって導入されてもよく、ここで、発現構築物は、前記部位特異的核酸改変ポリペプチドをコードする遺伝子に機能的に連結されたそれぞれの細胞又は組成物において機能的なプロモーターを含む。このような部位特異的核酸改変ポリペプチドの例を表1に示す。さらに、そのような部位特異的核酸改変ポリペプチドの機能的等価物を本発明の方法に用いることができる。
部位特異的核酸改変ポリペプチドは、二本鎖核酸切断機能を有していてもよく、又は二本鎖核酸分子の一本鎖のみをカットするニッカーゼ機能を有していてもよい。部位特異的核酸改変ポリペプチドの核酸制限又はニッカーゼ能力もまた不活性化されてもよく、組換え部位特異的核酸改変ポリペプチドは、FokIのDNA制限領域又はホーミングエンドヌクレアーゼのような他の官能基に連結されてもよい。そのような組換え部位特異的核酸改変ポリペプチドは、例えばTsaiら(2014;Nat Biotechnol. 2014 32(6):569~76頁)又はGuilingerら(2014;Nat Biotechnol. 2014 32(6):577-82頁)に記載されている。
gNA分子は、標的NA分子に対して100%相補的な少なくとも12塩基を含むスペーサー核酸(スペーサーNA)分子を含む。好ましくは、標的NA分子に相補的な少なくとも13塩基、少なくとも14塩基又は少なくとも15塩基を含む。より好ましくは、標的NA分子に相補的な少なくとも16塩基、少なくとも17塩基又は少なくとも18塩基を含む。さらにより好ましくは、標的NAに相補的な少なくとも19塩基又は少なくとも20塩基を含む。
gNA分子は、スキャフォールド核酸(スキャフォールドNA)分子をさらに含む。
スキャフォールドNAは、互いに相補的であり、ハイブリダイズしてヘアピン構造を形成することができる少なくとも8塩基を各々含む2つの領域を含む、1つの核酸分子からなり得る。スキャフォールドNAは、ハイブリダイズして二本鎖構造を形成することができる、互いに相補的な少なくとも8塩基の少なくとも1つの領域を各々含む、2つの核酸分子からなり得る。前記領域が8個を超える相補的塩基を含む場合、各領域は、他の領域の少なくとも8塩基に相補的な少なくとも8塩基を含む。
好ましくは、スキャフォールドNAは1分子からなる。
スキャフォールドNA分子は、スペーサーNA分子に共有結合により連結している。その場合、スキャフォールドNA分子は2つの独立した分子からなり、スキャフォールドNAのこれらの分子の少なくとも1つはスペーサーNA分子に共有結合により連結している。
互いに相補的である少なくとも8塩基を含む2つの領域に加えて、スキャフォールドNA分子は、少なくとも1つのヘアピン、好ましくは少なくとも2つのヘアピンを含む二次構造を形成するさらなる領域を含む。
ドナーNA分子は、2つのホモロジーアームを含む。ドナーNA分子の各々のホモロジーアームは、少なくとも15塩基を含み、ホモロジーアームを隔てる付加的なNA領域のサイズの少なくとも5%、好ましくは少なくとも10%、より好ましくは少なくとも15%、最も好ましくは少なくとも20%である。ホモロジーアーム1及び2は、同じ長さ又は異なる長さを有していてもよい。
ホモロジーアームはそれぞれ、標的NA分子中の同じ数の連続する塩基と100%相補的である少なくとも15塩基を含む。ホモロジーアームが15塩基より大きい場合、ホモロジーアームは、標的NA分子に対して、好ましくは少なくとも60%、好ましくは少なくとも70%、より好ましくは少なくとも75%、より好ましくは80%、より好ましくは少なくとも85%、より好ましくは少なくとも90%、さらにより好ましくは少なくとも95%、さらにより好ましくは少なくとも98%、さらにより好ましくは少なくとも99%相補的である。最も好ましくは、各々のホモロジーアームは、標的NA分子に対して100%相補的である。
本発明の方法は、標的NA分子を含む細胞又は組成物に適用してもよい。好ましくは、この方法は、細胞が微生物、動物、ヒト又は植物細胞である細胞に適用され、より好ましくは、この方法は酵母又は植物細胞に適用される。
本発明の方法は、任意の植物細胞、例えば裸子植物又は被子植物、好ましくは被子植物、例えば双子葉植物又は単子葉植物細胞に適用してもよい。好ましい単子葉植物細胞は、例えば、トウモロコシ、コムギ、イネ、オオムギ、ソルガム、ムサ(musa)、サトウキビ、ススキ(miscanthus)及びヤマカモジグサ(brachypodium)であり、特に好ましい単子葉植物細胞はトウモロコシ、コムギ及びイネである。好ましい双子葉植物細胞は、例えばダイズ、ナタネ、キャノーラ、アマニ、ワタ、ジャガイモ、サトウダイコン、タゲテス(tagetes)及びシロイヌナズナ(Arabidopsis)であり、特に好ましい双子葉植物細胞はダイズ、ナタネ、キャノーラ及びジャガイモである。
本発明の方法はまた、任意の微生物に適用することができる。微生物は細菌であってもよく、細菌細胞は任意のグラム陽性細菌又はグラム陰性細菌であってもよい。グラム陽性細菌には、バチルス(Bacillus)、ブレビバクテリウム(Brevibacterium)、コリネバクテリウム(Corynebacterium)、連鎖状球菌(Streptococcus)、ストレプトマイセス(Streptomyces)、ブドウ球菌(Staphylococcus)、腸球菌(Enterococcus)、ラクトバチルス(Lactobacillus)、乳酸球菌(Lactococcus)、クロストリジウム(Clostridium)、ジオバチルス(Geobacillus)及びオセアノバチルス(Oceanobacillus)が含まれるが、これらに限定されない。
グラム陰性細菌には、大腸菌、シュードモナス(Pseudomonas)、サルモネラ(Salmonella)、カンピロバクター(Campylobacter)、ヘリコバクター(Helicobacter)、酢酸金(Acetobacter)、フラボバクテリウム(Flavobacterium)、フソバクテリウム(Fusobacterium)、グルコノバクター(Gluconobacter)が含まれるが、これらに限定されない。好ましくは、グラム陰性細胞は大腸菌細胞である。
本発明の方法において、細菌細胞は、任意のバチルス細胞であり得る。本発明の実施に有用なバチルス細胞には、バチルス・アルカロフィルス(Bacillus alkalophilus)、バチルス・アミロリケファシエンス(Bacillus amyloliquefaciens)、バチルス・ブレビス(Bacillus brevis)、バチルス・シルクランス(Bacillus circulans)、バチルス・クラウシイ(Bacillus clausii)、バチルス・コアグランス(Bacillus coagulans)、バチルス・フィルムス(Bacillus firmus)、バチルス・ラウトゥス(Bacillus lautus)、バチルス・レントゥス(Bacillus lentus)、バチルス・リケニフォルミス(Bacillus licheniformis)、バチルス・メガテリウム(Bacillus megaterium)、バチルス・プミルス(Bacillus pumilus)、バチルス・ステアロテルモフィルス(Bacillus stearothermophilus)、枯草菌(Bacillus subtilis)及びバチルス・チューリンギエンシス(Bacillus thuringiensis)細胞が挙げられるが、これらに限定されない。好ましい態様において、細菌細胞は、バチルス・アミロリケファシエンス、バチルス・レントゥス、バチルス・リケニフォルミス、バチルス・ステアロテルモフィルス又は枯草菌細胞である。より好ましい態様において、細菌細胞はバチルス・リケニフォルミス細胞又は枯草菌細胞、好ましくは枯草菌細胞である。
本発明の方法においては、細菌宿主細胞は、ラクトバチルス・アシドフィルス(Lactobacillus acidophilus)、ラクトバチルス・プランタルム(Lactobacillus plantarum)、ラクトバチルス・ガセリ(Lactobacillus gasseri)、ラクトバチルス・ブルガリクス(Lactobacillus bulgaricusk)、ラクトバチルス・レウテリ(Lactobacillus reuteri)、黄色ブドウ球菌(Staphylococcus aureus)、コリネバクテリウム(Corynebacterium)、特にコリネバクテリウム・グルタミクム(Corynebacterium glutamicum)、コリネバクテリウム・アセトグルタミクム(Corynebacterium acetoglutamicum)、コリネバクテリウム・アセトアシドフィルム(Corynebacterium acetoacidophilum)、コリネバクテリウム・カルナエ(Corynebacterium callunae)、コリネバクテリウム・アンモニアゲネス(Corynebacterium ammoniagenes)、コリネバクテリウム・テルモアミノゲネス(Corynebacterium thermoaminogenes)、コリネバクテリウム・メラセコラ(Corynebacterium melassecola)及びコリネバクテリウム・エフィジエンス(Corynebacterium effiziens)の種、コリネバクテリウム・エフィシエンス(Corynebacterium efficiens)、コリネバクテリウム・デセルティ(Corynebacterium deserti)、ブレビバクテリウム・フラブム(Brevibacterium flavum)、ブレビバクテリウム・ラクトフェルメントゥム(Brevibacterium lactofermentum)、ブレビバクテリウム・ディバリカトゥム(Brevibacterium divarecatum)、シュードモナス・プティダ(Pseudomonas putida)、シュードモナス・シリンガエ(Pseudomonas syringae)、ストレプトマイセス、特にストレプトマイセス・コエリコロル(Streptomyces coelicolor)、ストレプトマイセス・リビダンス(Streptomyces lividans)、ストレプトマイセス・アルブス(Streptomyces albus)、ストレプトマイセス・アベルミティリス(Streptomyces avermitilis)の種、グルコノバクター・オキシダンス(Gluconobacter oxydans)、グルコノバクター・モルビフェル(Gluconobacter morbifer)、グルコノバクター・タイランディクス(Gluconobacter thailandicus)、アセトバクター・アセティ(Acetobacter aceti)、クロストリジウム・アセトブチリクム(Clostridium acetobutylicum)、クロストリジウム・サッカロブチリクム(Clostridium saccharobutylicum)、クロストリジウム・ベイジェリンキイ(Clostridium beijerinckii)、ストレプトコッカス・エキシミリス(Streptococcus equisimilis)、化膿連鎖球菌(Streptococcus pyogenes)、ストレプトコッカス・ウベリス(Streptococcus uberis)、及び腺疫菌(Streptococcus equi subsp. Zooepidemicus)であってよい。別の好ましい細菌はバスフィア・スクシニシプロドゥセン(Basfia succiniciproducens)である。
微生物は、真核細胞であってもよい。適切な真核細胞としては、酵母細胞、例えばサッカロマイセス・セレビシアエ(Saccharomyces cerevisiae)のようなサッカロマイセス属種、ハンゼヌラ酵母(Hansenula polymorpha)のようなハンゼヌラ属種、分裂酵母(Schizosaccharomyces pombe)のようなシゾサッカロマイセス属種、クルイベロマイセス・ラクティス(Kluyveromyces lactis)及びクルイベロマイセス・マルクシアヌス(Kluyveromyces marxianus)のようなクルイベロマイセス属種、ヤロウィア・リポリティカ(Yarrowia lipolytica)のようなヤロウィア属種、ピキア・メタノリカ(Pichia methanolica)、ピキア・スティピテス(Pichia stipites)及びピキア・パストリス(Pichia pastoris)のようなピキア属種、チゴサッカロマイセス・ロウクシイ(Zygosaccharomyces rouxii)及びチゴサッカロマイセス・バイリー(Zygosaccharomyces bailii)のようなチゴサッカロマイセス属種、カンジダ・ボイディニイ(Candida boidinii)、カンジダ・ウティリス(Candida utilis)、カンジダ・フレイシュッシイ(Candida freyschussii)、カンジダ・グラブラタ(Candida glabrata)のようなカンジダ属種、シュワニオミセス・オッキデンタリス(Schwanniomyces occidentalis)のようなシュワニオミセス属種、アルクスラ・アデニニボランス(Arxula adeninivorans)のようなアルクスラ属種、オガタエア・ミヌタ(Ogataea minuta)のようなオガタエア属種、クレブシエラ肺炎桿菌(Klebsiella pneumonia)のようなクレブシエラ属種などが挙げられる。
標的核酸分子は、細胞に対して内因性であってもよく、又は例えばトランスジーン若しくはウイルス核酸分子のように細胞に対して異種であってもよい。
doNA分子及びgNA分子は、互いに共有結合して、融合核酸(融合NA)分子を形成する。ドナーNA分子は、gNA分子のスペーサーNA部分又はgNA分子のスキャフォールドNA部分に共有結合していてもよい。好ましい実施形態において、ドナーNAは、gNA分子のスキャフォールドNA部分に共有結合により連結している。
最も好ましくは、融合NA分子は、全ての要素(gNA、スキャフォールドNA及びdoNA)が共有結合により連結している、1つの分子、好ましくは1つの連続したRNA分子である。
doNA分子及びガイドNA分子は、RNA、DNA、PNAからなってもよい。好ましくは、それらはRNA又はDNAからなる。より好ましくは、doNA分子はDNAからなり、ガイドNA分子はRNAからなる。
最も好ましい実施形態では、ガイド及びドナーNAの両方がRNAからなり、少なくともdoNA及びgNAが互いに共有結合により連結して、融合リボ核酸分子(fuRNA)を形成する。
fuRNA分子は、RNA分子として、又は前記fuRNA分子をコードする1つ以上の発現構築物として、標的NA分子を含む細胞又は組成物に導入してもよい。
別の実施形態において、doNA分子及びgNA分子は、DNAからなってもよく、ここで、doNA及びgNAは、互いに共有結合により連結して、融合デオキシリボ核酸分子(fuDNA)を形成する。
fuDNA分子は、例えばトランスフェクション、遺伝子銃、エレクトロポレーション、フォトポレーション、ウィスカー(whiskers)、超音波処理、ナノボディ又はマイクロ流体のような様々な方法によってDNA分子として標的NA分子を含む細胞又は組成物に導入することができる。これは、T-DNA分子を細胞に移すことができるが前記T-DNA分子の標的細胞のゲノムDNAへの組込みを媒介することができないビヒクルとしてアグロバクテリウムを用いて導入することもできる。T-DNAは、fuDNA分子を含むか又はそれからなるだろう。
本発明のさらなる実施形態は、gNA分子に共有結合により連結したdoNA分子を含む組換えfuNA分子、例えばfuRNA又はfuDNA分子である。
本発明の別の実施形態は、本発明のfuNA分子をコードするDNA分子に機能的に連結されたプロモーターを含む発現構築物を含むベクターである。
本発明のさらなる実施形態は、本発明のfuNA分子及び核酸改変ポリペプチドを含む細胞である。
本発明のさらなる実施形態は、
a.本発明のfuNA分子をコードするDNA分子に機能的に連結されたプロモーターを含む発現構築物を含む第1のベクター、及び
b.部位特異的核酸改変ポリペプチドをコードする第2のベクター、及び場合により
c.スキャフォールドNA分子の一部分をコードする第3のベクターを含むベクターシステムである。
a.本発明のfuNA分子をコードするDNA分子に機能的に連結されたプロモーターを含む発現構築物を含む第1のベクター、及び
b.部位特異的核酸改変ポリペプチドをコードする第2のベクター、及び場合により
c.スキャフォールドNA分子の一部分をコードする第3のベクターを含むベクターシステムである。
好ましい実施形態では、a.におけるベクターは、スペーサーNA、スキャフォールドNA及びdoNAを含むfuNA分子をコードする発現構築物を含む。
スキャフォールドNAが2つの分子からなり、aにおけるベクターがスキャフォールドNA分子の1分子のみを含む融合NA分子をコードし、スキャフォールドNA分子の第2分子をコードしない場合には、cにおけるベクターが必要であり、本発明のベクターシステムの一部となる。
細胞内の標的NAを改変するためのシステムであって、
A.本発明のfuNA分子をコードするDNA分子に機能的に連結されたプロモーターを含む発現構築物を含む第1のベクター、及び
B.部位特異的核酸改変ポリペプチドをコードする第2のベクター及び
C.標的NA分子を含む細胞、及び場合により
D.スキャフォールドNA分子の一部分をコードする第3のベクターを含む、システムが本発明の別の実施形態である。好ましい実施形態では、Aにおけるベクターは、スペーサーNA、スキャフォールドNA及びdoNAを含むfuNA分子をコードする発現構築物を含む。スキャフォールドNAが2つの分子からなり、AにおけるベクターがスキャフォールドNA分子の1つの分子のみを含む融合NA分子をコードし、かつスキャフォールドNA分子の第2の分子をコードしていない場合は、Dにおけるベクターが必要であり、本発明のシステムの一部である。
A.本発明のfuNA分子をコードするDNA分子に機能的に連結されたプロモーターを含む発現構築物を含む第1のベクター、及び
B.部位特異的核酸改変ポリペプチドをコードする第2のベクター及び
C.標的NA分子を含む細胞、及び場合により
D.スキャフォールドNA分子の一部分をコードする第3のベクターを含む、システムが本発明の別の実施形態である。好ましい実施形態では、Aにおけるベクターは、スペーサーNA、スキャフォールドNA及びdoNAを含むfuNA分子をコードする発現構築物を含む。スキャフォールドNAが2つの分子からなり、AにおけるベクターがスキャフォールドNA分子の1つの分子のみを含む融合NA分子をコードし、かつスキャフォールドNA分子の第2の分子をコードしていない場合は、Dにおけるベクターが必要であり、本発明のシステムの一部である。
本発明の別の実施形態は、
a.本発明のfuNA分子をコードするDNA分子に機能的に連結されたプロモーターを含む発現構築物を含む第1のベクター、及び
b.部位特異的核酸改変ポリペプチドをコードする第2のベクター、及び
c.標的NA分子を含む細胞、及び場合によって、
d.スキャフォールドNA分子の一部分をコードする第3のベクターを含む、組成物である。
a.本発明のfuNA分子をコードするDNA分子に機能的に連結されたプロモーターを含む発現構築物を含む第1のベクター、及び
b.部位特異的核酸改変ポリペプチドをコードする第2のベクター、及び
c.標的NA分子を含む細胞、及び場合によって、
d.スキャフォールドNA分子の一部分をコードする第3のベクターを含む、組成物である。
好ましい実施形態では、aにおけるベクターは、スペーサーNA、スキャフォールドNA及びdoNAを含むfuNA分子をコードする発現構築物を含む。スキャフォールドNAが2つの分子からなり、aにおけるベクターがスキャフォールドNA分子の1分子のみを含む融合NA分子をコードし、スキャフォールドNA分子の第2分子をコードしない場合、dにおけるベクターが必要となり、本発明の組成物の一部となる。
細胞又は組成物中の標的NA分子を改変するための、本発明のベクター、本発明のベクターシステム、本発明のシステム及び/又は本発明の組成物の使用もまた本発明の実施形態である。
定義
本発明は、特定の方法又はプロトコールに限定されないことを理解されたい。本明細書で使用する用語は、特定の実施形態を単に説明するためのものあり、添付の特許請求の範囲によってのみ限定される本発明の範囲を限定するものではないことも理解されたい。本明細書及び添付の特許請求の範囲で使用される単数形「1つの(a)」、「及び(and)」及び「その(the)」は、文脈において他に明確に指示されない場合に複数形を含むことに留意されたい。したがって、例えば、「ベクター」への言及は、1つ以上のベクターへの言及であり、当業者に公知であるその等価物を含む、などである。「約(about)」という用語は、本明細書では、およそ(approximately)、おおよそ(roughly)、~辺り(around)、又はその領域にある(in the region of)ことを意味するために使用される。「約」という用語が数値範囲と共に使用される場合、その数値範囲の上及び下の境界を拡げることによってその範囲を改変させる。一般に、「約」という用語は、20%、好ましくは10%の上下(より高い又はより低い)の分散によって示された値の上下の数値を改変させるために本明細書で使用される。本明細書で使用する「又は(or)」という語は、特定のリストの任意の1つのメンバーを意味し、またそのリストのメンバーの任意の組み合わせを含む。本明細書及び下記の特許請求の範囲で使用される場合、「含む(comprise)」、「含むこと(comprising)」、「含む(include)」、「含むこと(including)」、「含む(includes)」という語は、1つ以上の記載された特徴、整数、成分、又は工程の存在を特定することを意図しており、1つ以上の他の特徴、整数、構成要素、工程又はそれらのグループの存在又は追加を排除するものではない。明確化のために、本明細書で使用される特定の用語は、以下のように定義され、使用される:
本発明は、特定の方法又はプロトコールに限定されないことを理解されたい。本明細書で使用する用語は、特定の実施形態を単に説明するためのものあり、添付の特許請求の範囲によってのみ限定される本発明の範囲を限定するものではないことも理解されたい。本明細書及び添付の特許請求の範囲で使用される単数形「1つの(a)」、「及び(and)」及び「その(the)」は、文脈において他に明確に指示されない場合に複数形を含むことに留意されたい。したがって、例えば、「ベクター」への言及は、1つ以上のベクターへの言及であり、当業者に公知であるその等価物を含む、などである。「約(about)」という用語は、本明細書では、およそ(approximately)、おおよそ(roughly)、~辺り(around)、又はその領域にある(in the region of)ことを意味するために使用される。「約」という用語が数値範囲と共に使用される場合、その数値範囲の上及び下の境界を拡げることによってその範囲を改変させる。一般に、「約」という用語は、20%、好ましくは10%の上下(より高い又はより低い)の分散によって示された値の上下の数値を改変させるために本明細書で使用される。本明細書で使用する「又は(or)」という語は、特定のリストの任意の1つのメンバーを意味し、またそのリストのメンバーの任意の組み合わせを含む。本明細書及び下記の特許請求の範囲で使用される場合、「含む(comprise)」、「含むこと(comprising)」、「含む(include)」、「含むこと(including)」、「含む(includes)」という語は、1つ以上の記載された特徴、整数、成分、又は工程の存在を特定することを意図しており、1つ以上の他の特徴、整数、構成要素、工程又はそれらのグループの存在又は追加を排除するものではない。明確化のために、本明細書で使用される特定の用語は、以下のように定義され、使用される:
ドナーNA:「ドナーNA」又は「doNA」という用語は、標的NAの少なくとも15連続塩基の2つの異なるエリアに相補的な少なくとも15塩基をそれぞれ含む2つのホモロジーアームを含む核酸を意味し、前記2つのホモロジーアームは互いに隣接しているか、又は1つ以上の追加の塩基によって分離されている。
ホモロジーアームが相補的である標的NAの2つの異なるエリアは、互いに直接隣接していてもよく、又は20kbまで、好ましくは10kbまで、好ましくは5kbまで、より好ましくは3kbまで、より好ましくは2.5kbまで、より好ましくは2kbまでの追加の塩基により分離されていてもよい。
ホモロジーアームが15を超える塩基を含む場合、標的NAに対して100%相補的であるか、又は少なくとも75%相補的であるか、好ましくは少なくとも80%相補的であるか、より好ましくは少なくとも85%相補的であるか、より好ましくは少なくとも90%相補的であるか、より好ましくは少なくとも95%相補的であるか、より好ましくは少なくとも98%標的NAに対して相補的であってもよく、ここで、ホモロジーアームは、標的NA中の同数の連続した塩基のストレッチに対して100%相補的である少なくとも15塩基の少なくとも1つのストレッチを含み、好ましくは、ホモロジーアームは、標的NA中の同数の連続した塩基のストレッチに対して100%相補的である少なくとも18塩基の少なくとも1つのストレッチを含み、より好ましくは、ホモロジーアームは、標的NA中の同数の連続した塩基のストレッチに対して100%相補的である少なくとも20塩基の少なくとも1つのストレッチを含み、さらにより好ましくは、ホモロジーアームは、標的NA中の同数の連続した塩基のストレッチに対して100%相補的である少なくとも25塩基の少なくとも1つのストレッチを含み、さらにより好ましくは、ホモロジーアームは、標的NA中の同数の連続した塩基のストレッチに対して100%相補的である少なくとも50塩基の少なくとも1つのストレッチを含む。
ホモロジーアームは、標的NAに対して同じ長さ及び/若しくは同程度の相補性を有してもよく、又は標的NAに対して異なる長さ及び/若しくは異なる程度の相補性を有してもよい。
ホモロジーアームは、互いに直接隣接していてもよく、ホモロジーアームに相補的な標的核酸中の領域の間に存在しない少なくとも1塩基を含む核酸分子によって分離されていてもよい。
スペーサーNA:用語「スペーサー核酸」又は「スペーサーNA」は、標的NAに対して100%相補的な少なくとも12塩基を含む核酸を意味する。
スペーサーNAが12を超える塩基を含む場合、それは標的NAに対して少なくとも75%相補的であるか、好ましくは少なくとも80%相補的であるか、より好ましくは少なくとも85%相補的であるか、より好ましくは少なくとも90%相補的であるか、より好ましくは少なくとも95%相補的であるか、より好ましくは少なくとも98%相補的であるか、最も好ましくは、それは標的NAに対して100%相補的であり、ここで、スペーサーNAは、標的NA中の同じ数の連続塩基のストレッチに対して100%相補的である少なくとも12塩基の少なくとも1つのストレッチを含み、好ましくは、スペーサーNAは、標的NA中の同じ数の連続塩基のストレッチに対して100%相補的である少なくとも15塩基の少なくとも1つのストレッチを含み、好ましくは、スペーサーNAは、標的NA中の同じ数の連続塩基のストレッチに対して100%相補的である少なくとも18塩基の少なくとも1つのストレッチを含み、より好ましくは、スペーサーNAは、標的NA中の同じ数の連続塩基のストレッチに対して100%相補的である少なくとも20塩基の少なくとも1つのストレッチを含み、さらにより好ましくは、スペーサーNAは、標的NA中の同じ数の連続塩基のストレッチに対して100%相補的である少なくとも25塩基の少なくとも1つのストレッチを含み、さらにより好ましくは、スペーサーNAは、標的NA中の同じ数の連続塩基のストレッチに対して100%相補的である少なくとも50塩基の少なくとも1つのストレッチを含む。
スペーサーNAはスキャフォールドNAに共有結合により連結している。スキャフォールドNAが2つの核酸分子からなる場合、スペーサーはスキャフォールドNAの1つの分子に共有結合により連結する。
スキャフォールドNA:スキャフォールド核酸又はスキャフォールドNAは、部位特異的核酸改変ポリペプチドによって結合される少なくとも1つのヘアピン、好ましくは少なくとも2つのヘアピン及び/又は配列を含む二次構造を形成する核酸を含む。そのような部位特異的核酸改変ポリペプチドは、当該技術分野において、例えばWO2014/150624;WO2014/204728において知られている。スキャフォールドNAは、それぞれが互いに相補的である少なくとも8塩基を含む2つの領域をさらに含み、したがって二本鎖構造を形成するようにハイブリダイズすることができる。互いに相補的な少なくとも8塩基の前記領域が8を超える塩基を含む場合、各領域は他の領域の少なくとも8塩基に相補的な少なくとも8塩基を含む。
スキャフォールドNAの2つの相補的領域は、ヘアピン構造を形成するリンカー分子を介して互いに共有結合により連結していてもよく、又は2つの独立した核酸分子からなっていてもよい。
ガイドNA:ガイド核酸又はガイドNA又はgNAは、スペーサー核酸及びスキャフォールド核酸を含み、ここで、スペーサーNA及びスキャフォールドNAは互いに共有結合により連結している。スキャフォールドNAが2つの分子からなる場合、スペーサーNAはスキャフォールドNAの1つの分子に共有結合により連結しているのに対して、スキャフォールドNA分子の他の分子は第1のスキャフォールドNA分子にハイブリダイズする。したがって、ガイドNA分子は、1つの核酸分子からなっていてもよく、又は2つの核酸分子からなっていてもよい。好ましくは、ガイドNAは1分子からなる。
融合NA:融合核酸は、ドナーNA及びガイドNAを含み、ここで、ガイドNA及びドナーNAは、互いに共有結合により連結している。
部位特異的核酸改変ポリペプチド:「部位特異的核酸改変ポリペプチド」「核酸結合部位特異的核酸改変ポリペプチド」又は「部位特異的ポリペプチド」とは、核酸に結合し、特異的核酸配列に標的化されるポリペプチドのことを意味する。本明細書に記載の部位特異的核酸改変ポリペプチドは、ポリペプチドに固有の機構又は好ましくはそれが結合する核酸分子のいずれかによって標的核酸中の特定の核酸配列に標的化される。ポリペプチドによって結合された核酸分子は、標的核酸内の標的配列に相補的な配列を含み、したがって、結合したポリペプチドを標的核酸(標的配列)内の特定の位置に標的化する。
ほとんどの部位特異的核酸改変ポリペプチドはdsDNA切断を導入するが、ニッキング活性のみを有するように改変されてもよく、又はヌクレアーゼ活性が不活性化されてもよい。部位特異的核酸改変ポリペプチドは、蛍光又はFokIポリペプチドのヌクレアーゼ活性又はI-SceIのようなホーミングエンドヌクレアーゼポリペプチドのようなヌクレアーゼ活性などの活性を有するさらなるポリペプチドに結合されてもよい。
コード領域:本発明で使用する用語「コード領域」は、構造遺伝子を言及して用いる場合、mRNA分子の翻訳の結果として新生ポリペプチドに見出されるアミノ酸をコードするヌクレオチド配列を意味する。コード領域は、真核生物においては、5'側にヌクレオチドトリプレット「ATG」(イニシエーターのメチオニンをコードする)と結合し、原核生物は、開始コドンとしてトリプレット「GTG」及び「TTG」も利用する。3'側に、終止コドンを表す3つのトリプレット(すなわち、TAA、TAG、TGA)の1つが結合されている。さらに、遺伝子はまた、RNA転写物に存在する配列の5'と3'末端の両方に位置する配列も含みうる。これらの配列は、「隣接(flanking)」配列又は領域と呼ばれる(これらの隣接する領域はmRNA転写物に存在する非翻訳配列に対して5'若しくは3'に位置する)。5'隣接領域は、調節配列、例えば、遺伝子の転写を制御又は影響するプロモーター及びエンハンサーを含有しうる。3'隣接領域は、転写の終結、転写後の切断及びポリアデニル化を指令する配列を含有しうる。
相補性:「相補的」又は「相補性」は、アンチパラレルなヌクレオチド配列の相補的塩基残基間で水素結合が形成されると(塩基対合規則により)お互いに対合することができるアンチパラレルなヌクレオチド配列を含むものである、2つのヌクレオチド配列を意味する。例えば、配列 5'-AGT-3'は配列 5'-ACT-3'と相補的である。相補性は「部分的」であっても又は「全体」であってもよい。「部分的」相補性は、1以上の核酸塩基が塩基対合規則によってマッチしない場合である。核酸分子間の「全体」又は「完全」相補性は、それぞれ及び全ての核酸塩基が他の塩基と、塩基対合規則のもとでマッチする場合である。核酸分子鎖間の相補性の程度は、核酸分子鎖間のハイブリダイゼーションの効率と強度に有意な影響を及ぼす。本明細書で使用する核酸配列の「相補体」は、その核酸分子が核酸配列の核酸分子に対して全体相補性を示すヌクレオチド配列を意味する。
内因性:「内因性」ヌクレオチド配列は、野生型微生物のゲノム中に存在するヌクレオチド配列を意味する。
発現の増強:微生物中の核酸分子の発現の「増強」又は「増大」を本明細書では同じ意味で使用し、微生物における核酸分子の発現のレベルが、参照微生物、例えば野生型と比較して高いことを意味する。本明細書で使用する用語「増強」又は「増大」は、ここでは発現される核酸分子のより高い、好ましくは有意に高い発現を意味する。本明細書で使用する、作用物質、例えばタンパク質、mRNA又はRNAのレベルの「増強」又は「増大」は、実質的に同一条件のもとで増殖させた実質的に同一の微生物と比較して、そのレベルが増大したことを意味する。本明細書で使用する、標的遺伝子により発現された作用物質、例えばpreRNA、mRNA、rRNA、tRNAなど及び/又はそれがコードするタンパク質産物のレベルの「増強」又は「増大」は、そのレベルが好適な参照微生物と比較して、50%以上、例えば100%以上、好ましくは200%以上、より好ましくは5倍以上、さらにより好ましくは10倍以上、最も好ましくは20倍以上、例えば50倍増大することを意味する。その増強又は増大は、当業者が精通する方法により測定することができる。従って、核酸又はタンパク質の量の増強又は増大はタンパク質の免疫学的検出により測定することができる。さらに、タンパク質アッセイ、蛍光、ノーザンハイブリダイゼーション、ゲルにおける核酸濃度の濃度測定、ヌクレアーゼ保護アッセイ、逆転写(定量RT-PCR)、ELISA(酵素結合免疫吸着アッセイ)、ウェスタンブロット、ラジオイムノアッセイ(RIA)又は他のイムノアッセイ及び蛍光活性化細胞分析(FACS)などの技法を使って微生物中の特定のタンパク質又はRNAを測定することができる。誘導されるタンパク質産物の種類に応じて、微生物の表現型に与えるその活性又は効果を測定してもよい。タンパク質の量を測定する方法は当業者に公知である。記載しうる例には次のものがある:マイクロ-ビウレット法(Goa J (1953) Scand J Clin Lab Invest 5:218-222)、フォーリン-チオカルト法(Lowry OH ら (1951) J Biol Chem 193:265-275) 又は CBB G-250の吸収を測定する方法(Bradford MM (1976) Analyt Biochem 72:248-254)。
発現:「発現」は、細胞における、遺伝子産物の生合成、好ましくは、ヌクレオチド配列、例えば、内因性遺伝子又は異種遺伝子の転写及び/又は翻訳を意味する。例えば、構造遺伝子の場合には、発現は構造遺伝子のmRNAへの転写及び、場合によっては、引き続いてmRNAの1以上のポリペプチドへの翻訳を含む。他の場合では、発現はRNA分子を保持するDNAの転写だけに関わりうる。
外来:用語「外来」は、細胞中に実験操作により導入された任意の核酸分子(例えば、遺伝子配列)を意味し、導入された配列がいくつかの改変(例えば、点突然変異、選択マーカー遺伝子の存在など)を含み、したがって天然の配列とは異なる限り、その細胞中に見出される配列を含み得る。
機能的断片:用語「機能的断片」は、本発明の全長核酸及び/又は全長ポリペプチドの一部のみを含むが、依然として同じ機能、すなわち、アクリロイルCoA及びブタノールからn-BA及びCoAへの反応を触媒するAAT酵素の機能をもたらす任意の核酸及び/又はタンパク質を指す。好ましくは、断片はそれが由来する配列の少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%を含む。好ましくは、機能的断片は、機能的断片が由来する核酸及び/又はタンパク質の連続した核酸又はアミノ酸を含む。タンパク質をコードする核酸分子の機能的断片は、タンパク質の機能的断片をコードする核酸分子の断片を意味する。
機能的連結:用語「機能的連結(functional linkage)」又は「機能的に連結した(functionally linked)」は、用語「機能可能な連結(operable linkage)」又は「機能可能に連結した(operably linked)」と同等であり、調節エレメント(例えば、プロモーター)の発現対象の核酸配列との、及び、適宜、さらなる調節エレメント(例えば、ターミネーターなど)との配列の配置であって、それぞれの調節エレメントがその意図する機能を完遂して前記核酸配列の発現を可能にし、改変し、促進し又はさもなくば影響を与え得る前記配列の配置を意味すると理解される。同義語として、表現「機能可能な連結」又は「機能可能に連結した」を使用してもよい。発現は、核酸配列のセンス又はアンチセンスRNAと関係した配置に依存してもたらされうる。この目的にとって、化学的意味の直接連結は必ずしも必要でない。例えば、エンハンサー配列などの遺伝子制御配列は、さらに離れた位置から、又は他のDNA分子からでも、標的配列に対するその機能を果たしうる。好ましい配置は、発現対象の核酸配列が組換えによってプロモーターとして作用する配列の後方に位置し、2つの配列が互いに共有結合で連結される配置である。好ましい実施形態においては、転写開始が本発明のキメラRNAの所望の開始と同一であるように、転写される核酸配列をプロモーターの後ろに配置する。機能的連結、及び発現構築物は、記載された通例の組換え及びクローニング技法を用いて作製することができる(例えば、Sambrook J, Fritsch EF and Maniatis T (1989);Silhavy et al. (1984) Expeiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor (NY);Ausubel et al., (1987) Current Protocols in Molecular Biology, Greene Publishing Assoc. and Wiley Interscience;Gelvin et al., (Eds) (1990) Plant Molecular Biology Manual; Kluwer Academic Publisher, Dordrecht, The Netherlands)。しかし、例えば、制限酵素に対する特異的切断部位をもつリンカーとして、又はシグナルペプチドとして作用するさらなる配列も2つの配列の間に配置することができる。配列の挿入はまた、融合タンパク質の発現をもたらしうる。好ましくは、調節領域、例えばプロモーター及び発現対象の核酸配列の連結から成る発現構築物をベクターに組込まれた形で存在させてもよく、又は例えば、形質転換によりゲノム中に挿入することができる。
遺伝子:用語「遺伝子」は、遺伝子産物(例えば、ポリペプチド又は機能性RNA)の発現をいくつかの方式で調節することができる適当な調節配列と機能可能に連結された領域を意味する。遺伝子は、コード領域(オープンリーディングフレーム、ORF)に先行する(上流の)及び後続する(下流の)DNAの非翻訳調節領域(例えば、プロモーター、エンハンサー、リプレッサーなど)を含む。本明細書で使用する用語「構造遺伝子」は、mRNAに転写され、次いで特定のポリペプチドの特徴であるアミノ酸の配列に翻訳されるDNA配列を意味することを意図している。
ゲノムとゲノムDNA:用語「ゲノム」又は「ゲノムDNA」は、宿主生物の遺伝性の遺伝子情報を意味する。前記ゲノムDNAは核様体のDNAを含むが、自己複製プラスミドのDNAも含む。
異種:核酸分子又はDNAに関する用語「異種」は、天然では機能可能に連結されてない又は天然では異なる位置で機能可能に連結された第2の核酸分子と、機能可能に連結された、又は機能可能に連結されるように遺伝子操作された核酸分子を意味する。核酸分子及びそれと連結された1以上の調節核酸分子(プロモーター又は転写終結シグナルなど)を含む異種発現構築物は、例えば、実験遺伝子操作に由来する構築物であって、(a)前記核酸分子、又は(b)前記調節核酸分子、又は(c)両方(すなわち(a)と(b))がその天然(生来)の遺伝環境に位置しないか、又は、実験遺伝子操作により改変されている(改変の例は1以上のヌクレオチド残基の置換、付加、欠失、逆位又は挿入である)前記構築物である。天然の遺伝環境は、起源の生物における天然のゲノム遺伝子座、又はゲノムライブラリー中の存在を意味する。ゲノムライブラリーの場合、核酸分子の配列の天然の遺伝環境は好ましくは、少なくとも部分において保持される。前記環境は核酸配列に少なくとも1つの側において隣接し、そして少なくとも50bp、好ましくは少なくとも500bp、とりわけ好ましくは少なくとも1,000bp、非常にとりわけ好ましくは少なくとも5,000bpの長さの配列を有する。天然の発現構築物(例えば、プロモーターと対応する遺伝子との天然の組み合わせ)は、非天然、合成の「人工的」方法、例えば変異誘発により改変されると、トランスジェニック発現構築物になる。かかる方法は記載されている(米国特許第5,565,350号;WO 00/15815号)。例えば、この分子の生来のものでないプロモーターと機能可能に連結されたタンパク質をコードする核酸分子は、プロモーターについて異種であるとみなされる。好ましくは、異種DNAは、それを導入した細胞に対して内因性でないか又は天然で関連しないが、他の細胞から得られたか又は合成されたものである。異種DNAはまた、いくつかの改変、非天然、多コピーの内因性DNA配列、又はそれに物理的に連結された他のDNA配列と天然で関連しないDNA配列を含む内因性DNA配列を含む。一般に、必ずではないが、異種DNAはそれが発現される細胞により通常産生されないRNA又はタンパク質をコードする。
ハイブリダイゼーション:本明細書で使用する用語「ハイブリダイゼーション」は「核酸分子の1つの鎖が塩基対合を介して相補鎖に参加する任意のプロセス」を含む(J. Coombs (1994) Dictionary of Biotechnology, Stockton Press, New York)。ハイブリダイゼーション及びハイブリダイゼーションの強度(すなわち、核酸分子間の会合の強度)は、核酸分子間の相補性の程度、関わる条件のストリンジェンシー、形成されるハイブリッドのTm、及び核酸分子内のG:C比などの因子の影響を受ける。本明細書で使用する用語「Tm」は「融点」の意味で使用される。融点は二本鎖の核酸分子の集団が半分に解離して一本鎖になる温度である。核酸分子のTmを計算する式は当技術分野において周知である。標準の参考文献に示されるように、核酸分子が1M NaClの水溶液中に含まれる場合、Tm値の単純な計算は式:Tm=81.5+0.41(% G+C)により計算することができる[例えば、Anderson and Young, Quantitative Filter Hybridization, in Nucleic Acid Hybridization (1985)を参照]。他の参考文献は、構造並びに配列の特徴を考慮に入れてTmを計算するさらに複雑な計算を含む。ストリンジェントな条件は、当業者に公知であり、Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6に記載されている。
好適なハイブリダイゼーション条件は、例えば、配列の相補体の少なくとも50、好ましくは少なくとも100、より好ましくは少なくとも150、よりさらに好ましくは少なくとも200、最も好ましくは少なくとも250個の連続するヌクレオチドを含む核酸分子に対して、50℃における7%ドデシル硫酸ナトリウム(SDS)、0.5M NaPO4、1mM EDTA中でのハイブリダイゼーションと50℃における2X SSC、0.1%SDS中での洗浄に等しい条件下でハイブリダイズするもの(低ストリンジェンシー)である。他の好適なハイブリダイゼーション条件は、配列の相補体の少なくとも50、好ましくは少なくとも100、より好ましくは少なくとも150、よりさらに好ましくは少なくとも200、最も好ましくは少なくとも250個の連続するヌクレオチドを含む核酸分子に対して、50℃における7%ドデシル硫酸ナトリウム(SDS)、0.5M NaPO4、1mM EDTA中でのハイブリダイゼーションと50℃(中程度ストリンジェンシー)又は65℃(高ストリンジェンシー)における1X SSC、0.1%SDS中での洗浄である。他の好適なハイブリダイゼーション条件は、配列の相補体の少なくとも50、好ましくは少なくとも100、より好ましくは少なくとも150、よりさらに好ましくは少なくとも200、最も好ましくは少なくとも250個の連続するヌクレオチドを含む核酸分子に対して、50℃における7%ドデシル硫酸ナトリウム(SDS)、0.5M NaPO4、1mM EDTA中でのハイブリダイゼーションと65℃における0.1X SSC、0.1%SDS中での洗浄である(非常に高度なストリンジェンシー)。
「同一性」:「同一性」は、2以上の核酸又はアミノ酸分子の比較について使用する場合、前記分子の配列がある特定の程度の配列類似性を共有し、配列が部分的に同一であることを意味する。
2以上のアミノ酸又は2以上のヌクレオチド配列のパーセント同一性を確認するために、いくつかのコンピューターソフトウエアプログラムが開発されている。2以上の配列の同一性は、例えば、ソフトウエアfastaを用いて計算することができ、これは現在バージョンfasta 3が使用されている(W. R. Pearson and D. J. Lipman, PNAS 85, 2444(1988);W. R. Pearson, Methods in Enzymology 183, 63 (1990);W. R. Pearson and D. J. Lipman, PNAS 85, 2444 (1988);W. R. Pearson, Enzymology 183, 63 (1990))。異なる配列の同一性を計算する他の有用なプログラムは標準blastプログラムであって、これはBiomax pedantソフトウエアに含まれている(Biomax、Munich、Federal Republic of Germany)。このソフトウエアは残念ながら、 blastが主題及びクエリの完全な配列を常に含まないので、最適性の劣る結果をもたらすことがある。それにも関わらず、このプログラムは非常に効率的であるので、膨大な数の配列を比較するために用いることができる。以下の設定は、配列のかかる比較のための典型的に使用されるものである。
-p プログラム名 [文字列]; -d データベース [文字列]; デフォルト = nr; -i クエリーファイル[File In]; デフォルト = stdin; -e 期待値 (E) [実数]; デフォルト = 10.0; -m アラインメントビューオプション: 0 = ペアワイズ; 1 = 同一性を示すクエリー-アンカー; 2 = 同一性を示さないクエリー-アンカー; 3 = フラットクエリー-アンカー、同一性を示す; 4 = フラットクエリー-アンカー、同一性を示さない; 5 = フラットクエリー-アンカー、同一性を示さない、かつ平滑末端; 6 = フラットクエリー-アンカー、同一性を示さない、かつ平滑末端; 7 = XML Blast出力; 8 = 表形式; 9 コメントラインを含む表形式[整数]; デフォルト = 0; -o BLASTリポート出力ファイル[File Out] オプション; デフォルト = stdout; -F フィルタークエリー配列(blastnを用いるDUST、他を用いるSEG) [文字列]; デフォルト = T; -G ギャップを開くためのコスト(0はデフォルト行動を引き起こす) [整数]; デフォルト = 0; -E ギャップを拡張するためのコスト(0はデフォルト行動を引き起こす) [整数]; デフォルト = 0; -X ギャップ付加されたアラインメントに関するX下落値(ビット) (0はデフォルト行動を引き起こす); blastn 30、megablast 20、tblastx 0、他の全部15 [整数]; デフォルト = 0; -I デフラインにGIを示す[T/F]; デフォルト = F; -q ヌクレオチド不一致に関するペナルティ(blastnのみ) [整数]; デフォルト = -3; -r ヌクレオチド一致に関する報酬(blastnのみ) [整数]; デフォルト = 1; -v (V)に関する1行記述を示すデータベース配列の数 [整数]; デフォルト = 500; -b (B)に関するアラインメントを示すデータベース配列の数 [整数]; デフォルト = 250; -f 拡張ヒットに関する閾値、デフォルト 0の場合; blastp 11、blastn 0、blastx 12、tblastn 13; tblastx 13、megablast 0 [整数]; デフォルト = 0; -g ギャップ付加アラインメントを実行(tblastxでは利用不可) [T/F]; デフォルト = T; -Q 使用するクエリー遺伝子コード[整数]; デフォルト = 1; -D DB遺伝子コード(tblast[nx]についてのみ) [整数]; デフォルト = 1; -a 使用するプロセッサーの数[整数]; デフォルト = 1; -O SeqAlignファイル[File Out] オプション; -J クエリーデフラインを信じる[T/F]; デフォルト = F; -M マトリックス[文字列]; デフォルト = BLOSUM62; -W ワードサイズ、デフォルト 0の場合 (blastn 11、megablast 28、他の全部 3) [整数]; デフォルト = 0; -z データベースの有効長さ(実際のサイズについては0を使用する) [実数]; デフォルト = 0; -K 保持する領域から得られる最良のヒットの数(デフォルトにより除去、使用する場合、100の値が推奨される) [整数]; デフォルト = 0; -P 複数ヒットについては0、単一ヒットについては1[整数]; デフォルト = 0; -Y 検索スペースの有効長さ(実際のサイズについては0を使用する) [実数]; デフォルト = 0; -S データベースに対して検索するためのクエリー・ストランド(blast[nx]、及びtblastxについて); 3は両方、1は上、2は下である[整数]; デフォルト = 3; -T HTML出力を作製 [T/F]; デフォルト = F; -l GIの一覧に対するデータベースの限定的検索 [文字列] オプション; -U FASTA配列のフィルタリングには小文字を使用する [T/F] オプション; デフォルト = F; -y ビットで示される非ギャップ付加拡張のためのX下落値(0.0はデフォルト行動を引き起こす); blastn 20、megablast 10、他の全部 7 [実数]; デフォルト = 0.0; -Z ビットで示される最終的なギャップ付加アラインメントに関するX下落値(0.0はデフォルト行動を引き起こす); blastn/megablast 50、tblastx 0、他の全部 25 [整数]; デフォルト = 0; -R PSI-TBLASTN チェックポイントファイル[File In] オプション; -n MegaBlast検索 [T/F]; デフォルト = F; -L クエリー配列上の位置[文字列] オプション; -A 複数ヒットウィンドウサイズ、デフォルト 0の場合(blastn/megablast 0、他の全部 40 [整数]; デフォルト = 0; -w フレームシフトペナルティ(blastxに関するOOFアルゴリズム) [整数]; デフォルト = 0; -t HSPsを連結するためにtblastnにおいて許容される最大のイントロンの長さ (0は連結不可) [整数]; デフォルト = 0。
Needleman及びWunsch、又はSmith及びWatermanのアルゴリズムを用いることにより、高品質の結果が達成される。従って、前記アルゴリズムに基づくプログラムが好ましい。有利には、配列の比較を、プログラムPileUp(J. Mol. Evolution., 25, 351 (1987)、Higgins et al., CABIOS 5, 151 (1989))又は、好ましくは、プログラム「Gap」及び「BestFit」(両方とも、Needleman及びWunsch(J. Mol. Biol. 48; 443-453 (1970)のアルゴリズムに基づく)並びに「BestFit」(Smith及びWaterman(Adv. Appl. Math. 2; 482-489 (1981))のアルゴリズムに基づく)を用いて行うことができる。「Gap」及び「Needle」はGCGソフトウェアパッケージ [Genetics Computer Group, 575 Science Drive, Madison, Wisconsin, USA 53711 (1991); Altschul ら(1997) Nucleic Acids Res. 25:3389 (1997)]の一部であり、「Needle」はThe European Molecular Biology Open Software Suite (EMBOSS)(Trends in Genetics 16 (6), 276 (2000))の一部である。従って、好ましくは、配列同一性のパーセントを決定する計算を、配列の全範囲にわたりプログラム「Gap」又は「Needle」を用いて行う。核酸配列の比較のための以下の標準的な調整を「Needle」について用いた: マトリックス: EDNAFULL, ギャップ_ペナルティ: 10.0、 拡張_ペナルティ: 0.5。核酸配列の比較のための以下の標準的な調整を「Gap」について用いた:ギャップウエイト:50、長さウエイト:3、平均マッチ:10.000、平均ミスマッチ:0.000。
例えば、核酸レベルで配列番号1の配列と80%同一性を有するといわれる配列は、配列番号1により表される配列と上記プログラム「Needle」により上記パラメーターセットを用いて比較すると80%同一性を有する配列を意味すると理解される。好ましくは、同一性はクエリー配列、例えば配列番号1の全長に基づいて計算する。
単離された:本明細書で使用する用語「単離された」は、材料が人手により取り出されていて、その元来の、生来の環境から離れて存在し、それ故に天然の産物でないことを意味する。単離された材料又は分子(DNA分子又は酵素など)は精製された形態で存在しうるし又は例えば、トランスジェニック宿主細胞などの非生来の環境で存在しうる。例えば、生細胞中に存在する天然の核酸分子又はポリペプチドは単離されてないが、天然の系で共存する材料のいくつか又は全てから分離された同じ核酸分子又はポリペプチドは単離されている。かかる核酸分子はベクターの一部でありうるし及び/又はかかる核酸分子若しくはポリペプチドは組成物の一部でありうるのであって、かかるベクター若しくは組成物が元来の環境の部分でないという点では単離されているであろう。好ましくは、核酸分子に関係して、「単離された核酸配列」のように使用される場合の「単離された」は、同定され、天然源で元来関連している少なくとも1つの夾雑核酸分子から分離された核酸配列を意味する。単離された核酸分子は、天然で見出されるのとは異なる形態又は設定で存在する核酸分子である。対照的に、単離されてない核酸分子は、それらが天然で存在する状態で見出されたDNA及びRNAなどの核酸分子である。例えば、所与のDNA配列(例えば、遺伝子)は宿主細胞染色体において、隣接する遺伝子の近位で見出され;RNA配列、例えば、特定のタンパク質をコードする特定のmRNA配列は細胞において、多数のタンパク質をコードする数多くの他のmRNAとの混合物として見出される。しかし、例えば配列番号1を含む単離された核酸配列は、例として挙げれば、配列番号1を通常含有する細胞中のかかる核酸配列であって、その核酸配列が天然の細胞とは異なるゲノム若しくはプラスミドの位置にあるか、又は、さもなくば、天然に見出されるのとは異なる核酸配列が隣接する前記核酸配列を含むものである。単離された核酸配列は一本鎖又は二本鎖の形態で存在しうる。単離された核酸配列をタンパク質を発現するために利用する場合、その核酸配列は最小限、少なくともセンス又はコード鎖の部分を含有してもよい(すなわち、核酸配列は一本鎖であってもよい)。あるいは、センスとアンチセンス鎖の両方を含有してもよい(すなわち、核酸配列は二本鎖であってもよい)。
非コード:用語「非コード」は、発現されるタンパク質の一部若しくは全てをコードしない核酸分子の配列を意味する。非コード配列は、限定されるものでないが、エンハンサー、プロモーター領域、3'非翻訳領域、及び5'非翻訳領域を含む。
核酸及びヌクレオチド:用語「核酸」及び「ヌクレオチド」は天然又は合成又は人工の核酸又はヌクレオチドを意味する。用語「核酸」及び「ヌクレオチド」はデオキシリボヌクレオチド又はリボヌクレオチド又は任意のヌクレオチド類似体及びポリマー又はそれらのハイブリッドを、一本鎖若しくは二本鎖のセンス又はアンチセンス型で含む。特に断らない限り、特定の核酸配列はまた、暗示的に保存的に改変されたそれらの変異体(例えば、縮重コドン置換)及び相補配列、並びに明確に示した配列を包含する。用語「核酸」は、「遺伝子」、「cDNA」、「mRNA」、「オリゴヌクレオチド」、「核酸分子」と本明細書では互換的に使用される。ヌクレオチド類似体は、塩基、糖及び/又はリン酸塩の化学構造に改変を有するヌクレオチドを含み、前記改変には、限定されるものでないが、5-位置ピリミジン改変、8-位置プリン改変、シトシン環外アミン類における改変、5-ブロモ-ウラシルの置換など;及び限定されるものでないが、2'-位置糖改変(2'-OHがH、OR、R、ハロ、SH、SR、NH2、NHR、NR2、又はCNから選択される基により置換された糖改変を含む)されたリボヌクレオチドが含まれる。ショートヘアピンRNA(shRNA)はまた、非天然エレメント、例えば、非天然塩基、例えばイオノシン及びキサンチン、非天然糖、例えば2'-メトキシリボース、又は非天然リン酸ジエステル結合、例えばメチルホスホネート、ホスホロチオアート及びペプチドを含みうる。
核酸配列:表現「核酸配列」は、5'から3'末端へ読まれたデオキシリボヌクレオチド又はリボヌクレオチド塩基の一本鎖又は二本鎖のポリマーを意味する。核酸配列は染色体のDNA、自己複製プラスミド、DNA又はRNAの感染性ポリマー及び主に構造的役割を果たすDNA又はRNAを含む。「核酸配列」はまた、ヌクレオチドを表す略語、文字、記号又は言語の継続的列挙を意味する。一実施形態において、核酸は長さが通常100ヌクレオチド未満の比較的短い核酸である「プローブ」であってもよい。核酸プローブは長さが約50ヌクレオチド~長さが約10ヌクレオチドであることが多い。核酸の「標的領域」は目的のものであると同定された核酸の一部分である。核酸の「コード領域」は、適当な調節配列の制御下に置かれると、配列特異的な方式で転写されかつ翻訳され、特別なポリペプチド又はタンパク質を産生する核酸の部分である。コード領域はかかるポリペプチド又はタンパク質をコードすると言われる。
オリゴヌクレオチド:用語「オリゴヌクレオチド」はリボ核酸(RNA)又はデオキシリボ核酸(DNA)又はそれらの模倣体のオリゴマー又はポリマー、並びに同様に機能する非天然部分を有するオリゴヌクレオチドを意味する。かかる改変された又は置換されたオリゴヌクレオチドは、所望の特性、例えば、細胞取込みの増強、核酸標的に対する親和性の増強及びヌクレアーゼの存在のもとでの安定性の増強故に、しばしば、生来の形態よりも好ましい。オリゴヌクレオチドは、好ましくは、結合(例えば、リン酸ジエステル)又は代わる結合により互いに共役結合された2以上のヌクレオモノマーを含む。
オーバーハング:「オーバーハング」は、二本鎖のオリゴヌクレオチド分子の5'-又は3'-ヒドロキシル末端の比較的短い一本鎖ヌクレオチド配列である(「伸長」「突出末端」又は「粘着性末端」とも呼ばれる)。
ポリペプチド: 用語「ポリペプチド」、「ペプチド」、「オリゴペプチド」、「ポリペプチド」、「遺伝子産物」、「発現産物」及び「タンパク質」は本明細書では互換的に使用されていて、連続するアミノ酸残基のポリマー又はオリゴマーを意味する。
プロモーター:用語「プロモーター」又は「プロモーター配列」は等価であり、本明細書で使用する場合、目的のヌクレオチド配列に機能可能に連結されると目的のヌクレオチド配列のRNAへの転写を制御することができるDNA配列を意味する。プロモーターは、目的のヌクレオチド配列(mRNAへのその転写を制御する)の転写開始部位の5'(すなわち、上流)の近位に位置し、そして転写開始のためのRNAポリメラーゼ及び他の転写因子による特異的結合のための部位を提供する。プロモーターはコード領域又は5'非翻訳領域を含まない。プロモーターはそれぞれの細胞に対して異種又は相同性であってもよい。核酸分子配列は、もし外来種に由来するか、又はもし同じ種由来であってその元来の形態から改変されていれば、生物又は第2の核酸分子配列に対して「異種」である。例えば、異種コード配列と機能可能に連結されたプロモーターという場合、そのコード配列は、そのプロモーターが由来する種と異なる種由来のコード配列、又は、もし同じ種由来であれば、そのプロモーターに天然では関連しないコード配列(例えば、遺伝子操作で作られたコード配列又は異なるエコタイプ若しくは変種からの対立遺伝子)を意味する。好適なプロモーターは、発現が起こるべき宿主細胞の遺伝子から又は宿主に対する病原体から誘導することができる。
精製された:本明細書で使用する用語「精製された」は、その天然環境から取り出され、単離され又は分離された分子、核酸若しくはアミノ酸配列を意味する。「実質的に精製された」分子は、それが天然で関連する他成分の少なくとも60%を含有しない、好ましくは少なくとも75%を含有しない、そしてより好ましくは少なくとも90%を含有しない。精製された核酸配列は単離された核酸配列であってもよい。
有意な増大:測定技法に固有の誤差限界より大きい、例えば酵素活性、遺伝子発現、特定の産物の生産性又は収量の増大、好ましくは、対照細胞における対照酵素の活性、発現、生産性若しくは収量又は発現、対照細胞の生産性若しくは収量の約10%又は25%、好ましくは50%又は75%、より好ましくは2倍若しくは5倍又はそれ以上の増大、より好ましくは、約10倍以上の増大を意味する。
有意な低減:測定技法に固有の誤差限界より大きい、例えば酵素活性、遺伝子発現、特定の産物の生産性又は収量の低減、好ましくは、少なくとも5%又は10%、好ましくは少なくとも20%又は25%、より好ましくは少なくとも約50%又は75%、よりさらに好ましくは少なくとも約80%又は85%、最も好ましくは少なくとも約90%、95%、97%、98%又は99%の低減を意味する。
実質的に相補的な:その最も広い意味で、用語「実質的に相補的な」は、参照又は標的ヌクレオチド配列と比較してヌクレオチド配列について本明細書で使用する場合、前記参照又は標的ヌクレオチド配列の実質的に相補的なヌクレオチド配列と正確に相補的な配列の間のパーセント同一性は少なくとも60%、より望ましくは少なくとも70%、より望ましくは少なくとも80%又は85%、好ましくは少なくとも90%、より好ましくは少なくとも93%、さらにより好ましくは少なくとも95%又は96%、なおさらにより好ましくは少なくとも97%又は98%、またさらにより好ましくは少なくとも99%又は最も好ましくは100%(最後の場合、この文脈では用語「同一」と等しい)であるヌクレオチド配列を意味する。(以下で特に断らなければ)好ましくは、同一性を核酸配列の少なくとも19ヌクレオチド、好ましくは少なくとも50ヌクレオチド、より好ましくは全長にわたり前記参照配列に対して評価する。配列比較は、デフォールトGAP分析を用いて、GAPのSEQWEBアプリケーション(University of Wisconsin GCG)により、Needleman及びWunsch(Needleman and Wunsch (1970) J Mol. Biol. 48: 443-453;先に定義した通り)のアルゴリズムに基づいて実施する。参照ヌクレオチド配列に「実質的に相補的な」ヌクレオチド配列は参照ヌクレオチド配列と低度ストリンジェンシー条件、好ましくは中程度ストリンジェンシー条件、最も好ましくは高度ストリンジェンシー条件(先に定義した通り)のもとでハイブリダイズする。
トランスジーン:本明細書で使用する用語「トランスジーン」は、実験遺伝子操作により細胞のゲノム中に導入される任意の核酸配列を意味する。トランスジーンは「内因性DNA配列」又は「異種DNA配列」(すなわち「外来のDNA」)であってもよい。用語「内因性DNA配列」は、天然の配列に関係して何らかの改変(例えば、点突然変異、選択マーカー遺伝子の存在など)のない限り、導入される細胞において天然で見出されるヌクレオチド配列を意味する。
トランスジェニック:生物に言及する場合、用語「トランスジェニック」は、少なくとも1つの組換え核酸分子によって、形質転換された、好ましくは安定して形質転換されたことを意味する。
ベクター:本明細書で使用する用語「ベクター」は、連結されている他の核酸分子を輸送することができる核酸分子を意味する。ベクターの1つのタイプはゲノム組み込み型ベクター、すなわち、宿主細胞のゲノムDNA中に組み込むことができる「組み込みベクター」である。ベクターの他のタイプはエピソームベクター、すなわち、染色体外複製の能力があるプラスミド又は核酸分子である。機能可能に連結された遺伝子の発現を指令する能力のあるベクターを本明細書では「発現ベクター」と呼ぶ。本明細書においては、文脈からそうでないことが明らかでない限り、「プラスミド」と「ベクター」を互換的に使用する。
野生型:用語「野生型」、「天然の」又は「天然の起源」は、生物に関する場合、その生物が人為的に改変、変異又はさもなくば操作が行われていないことを意味する。ポリペプチド又は核酸配列に関する場合、そのポリペプチド又は核酸配列が天然であるか、又は人為的に改変、変異若しくはさもなくば操作が行われていない少なくとも1つの天然の生物において入手できるものを意味する。
微生物の野生型とは、ある遺伝子の遺伝的改変を導入する前の場合と同様の状況でゲノムが存在する微生物を指す。遺伝的改変は、例えば、遺伝子若しくはその一部の欠失、又は点変異、又は遺伝子の導入とすることができる。
「生産」又は「生産性」の用語は当技術分野で認識され、所定時間内に所定の発酵体積で形成された発酵産物(例えばdsRNA)の濃度(例えば産物kg/時/L)が含まれる。「生産の効率」という用語には、特定のレベルの生産が達成されるのに必要な時間(例えば、細胞がファインケミカルの出力の特定の速度を獲得するために要する時間)が含まれる。
「収量」又は「産物/炭素収量」の用語は当技術分野で認識され、産物(すなわちファインケミカル)への炭素源の変換の効率が含まれる。これは一般的に、例えば炭素源1kg当たりの産物kgとして記載される。化合物の収量又は生産を増大させることにより、所定の時間量における所定の培養量における化合物の回収される分子又は有用な回収分子の量が増大する。
「組換え微生物」という用語には、それが由来する野生型微生物と比較して改変された又は異なる遺伝子型及び/又は表現型を示すように遺伝的に改変された微生物(例えば、遺伝的改変が微生物のコード核酸配列に影響を及ぼす場合)が含まれる。組換え微生物は、少なくとも1つの組換え核酸分子を含む。
核酸分子に関する用語「組換え体」は、組換え核酸技法を使用して人為的に作製された核酸分子を指す。この用語は、それ自体は天然には存在しないか、核酸分子が由来する生物に存在しないが、人為的に改変、変化、変異又は操作された核酸分子を含む。好ましくは、「組換え核酸分子」は、少なくとも1つの核酸によって天然に存在する核酸分子と配列が異なる、非天然の核酸分子である。「組換え核酸分子」は、好ましくは機能可能に連結させた、その順序で天然に存在しない核酸分子の配列を含む「組換え構築物」を含むこともできる。前記組換え核酸分子を作製する好ましい方法は、クローニング技法、定方向若しくは非定方向変異誘発、遺伝子合成又は組換え技法を含むことができる。
そのような組換え核酸分子の例は、異種DNA配列が挿入されたプラスミド、あるいはその組換え核酸分子が由来する遺伝子又はプロモーターと比較して変異されている遺伝子又はプロモーターである。変異は、当技術分野で公知の定方向変異誘発技法により、又はランダム変異誘発技術(例えば、化学剤、UV光若しくはx線変異誘発により)、あるいは定方向進化技法によって導入することができる。
用語「定方向進化」は、本明細書において用語「代謝進化」と同義に用いられ、目的の形質を有する突然変異体の増殖を選択する選択圧をかけることを含む。選択圧は、種々の培養条件、ATP及び増殖連結選択、並びに酸化還元関連選択に基づき得る。選択圧は、連続移動接種を行うバッチ発酵又は同じ圧での連続培養を用いて実施することができる。
用語「発現」又は「遺伝子発現」は、特定の遺伝子(複数可)又は特定の遺伝子ベクター構築物の転写を意味する。用語「発現」又は「遺伝子発現」は、特に、遺伝子(複数可)又は遺伝子ベクター構築物のmRNAへの転写を意味する。このプロセスは、DNAの転写を含み、生じたRNA産物のプロセシングを含み得る。用語「発現」又は「遺伝子発現」は、mRNAの翻訳及びそれとともにコードされるタンパク質の合成、すなわちタンパク質発現を含むこともできる。
本発明はまた、以下に関する。
[項目1]
細胞中の標的核酸(標的NA)分子を改変するための方法であって、
a.少なくとも1つのドナー核酸(doNA)分子に共有結合により連結されたガイド核酸(gNA)分子を含む組換え融合核酸(fuNA)分子を用意する工程、及び
b.前記fuNA分子を、標的NA分子を含む1つ以上の細胞に導入する工程、及び
c.部位特異的核酸改変ポリペプチドを前記1つ以上の細胞に導入する工程、及び
d.前記1つ以上の細胞を、前記1つ以上の細胞において相同組換えを可能にする条件下でインキュベートする工程、及び場合によって
e.相同組換えが起きた1つ以上の細胞を単離する工程
を含み、
fuNAはRNAからなる、方法。
[項目2]
gNA分子が、標的NA分子の同数の連続する塩基と相補的な少なくとも12塩基を含むスペーサー核酸(スペーサーNA)分子を含む、項目1に記載の方法。
[項目3]
gNA分子がスキャフォールド核酸(スキャフォールドNA)分子をさらに含む、項目2に記載の方法。
[項目4]
スキャフォールドNA分子がgNA分子に共有結合している、項目3に記載の方法。
[項目5]
細胞が、微生物、動物、ヒト又は植物細胞である、項目1~4のいずれか一項に記載の方法。
[項目6]
部位特異的核酸改変ポリペプチドが、核酸にガイドされた核酸改変ポリペプチド又はその機能的等価物である、項目1~5のいずれか一項に記載の方法。
[項目7]
fuNA分子が、前記fuNA分子をコードする1つ以上の発現構築物として導入される、項目1~6のいずれか一項に記載の方法。
[項目8]
gNA分子に共有結合により連結したdoNA分子を含む組換えfuNA分子であって、fuNAがRNAからなる、fuNA分子。
[項目9]
項目8に記載のfuNA分子をコードするDNA分子に機能的に連結されたプロモーターを含む発現構築物を含むベクター。
[項目10]
a.項目9に記載のベクター、及び
b.部位特異的核酸改変ポリペプチドをコードするベクター、及び場合により
c.スキャフォールドNA分子をコードするベクター
を含む、ベクターシステム。
[項目11]
細胞内の標的NAを改変するためのシステムであって、
a.項目9に記載のベクター、及び
b.部位特異的核酸改変ポリペプチドをコードするベクター、及び
c.標的NA分子を含む細胞、及び場合により
d.スキャフォールドNA分子をコードするベクター
を含む、システム。
[項目12]
a.項目9に記載のベクター、及び
b.部位特異的核酸改変ポリペプチドをコードするベクター、及び
c.標的NA分子を含む細胞、並びに場合により
d.スキャフォールドNA分子をコードするベクター
を含む、組成物。
[項目13]
細胞内の標的NA分子を改変するための、項目9に記載のベクター、項目10に記載のベクターシステム、項目11に記載のシステム又は項目12に記載の組成物の使用。
本発明はまた、以下に関する。
[項目1]
細胞中の標的核酸(標的NA)分子を改変するための方法であって、
a.少なくとも1つのドナー核酸(doNA)分子に共有結合により連結されたガイド核酸(gNA)分子を含む組換え融合核酸(fuNA)分子を用意する工程、及び
b.前記fuNA分子を、標的NA分子を含む1つ以上の細胞に導入する工程、及び
c.部位特異的核酸改変ポリペプチドを前記1つ以上の細胞に導入する工程、及び
d.前記1つ以上の細胞を、前記1つ以上の細胞において相同組換えを可能にする条件下でインキュベートする工程、及び場合によって
e.相同組換えが起きた1つ以上の細胞を単離する工程
を含み、
fuNAはRNAからなる、方法。
[項目2]
gNA分子が、標的NA分子の同数の連続する塩基と相補的な少なくとも12塩基を含むスペーサー核酸(スペーサーNA)分子を含む、項目1に記載の方法。
[項目3]
gNA分子がスキャフォールド核酸(スキャフォールドNA)分子をさらに含む、項目2に記載の方法。
[項目4]
スキャフォールドNA分子がgNA分子に共有結合している、項目3に記載の方法。
[項目5]
細胞が、微生物、動物、ヒト又は植物細胞である、項目1~4のいずれか一項に記載の方法。
[項目6]
部位特異的核酸改変ポリペプチドが、核酸にガイドされた核酸改変ポリペプチド又はその機能的等価物である、項目1~5のいずれか一項に記載の方法。
[項目7]
fuNA分子が、前記fuNA分子をコードする1つ以上の発現構築物として導入される、項目1~6のいずれか一項に記載の方法。
[項目8]
gNA分子に共有結合により連結したdoNA分子を含む組換えfuNA分子であって、fuNAがRNAからなる、fuNA分子。
[項目9]
項目8に記載のfuNA分子をコードするDNA分子に機能的に連結されたプロモーターを含む発現構築物を含むベクター。
[項目10]
a.項目9に記載のベクター、及び
b.部位特異的核酸改変ポリペプチドをコードするベクター、及び場合により
c.スキャフォールドNA分子をコードするベクター
を含む、ベクターシステム。
[項目11]
細胞内の標的NAを改変するためのシステムであって、
a.項目9に記載のベクター、及び
b.部位特異的核酸改変ポリペプチドをコードするベクター、及び
c.標的NA分子を含む細胞、及び場合により
d.スキャフォールドNA分子をコードするベクター
を含む、システム。
[項目12]
a.項目9に記載のベクター、及び
b.部位特異的核酸改変ポリペプチドをコードするベクター、及び
c.標的NA分子を含む細胞、並びに場合により
d.スキャフォールドNA分子をコードするベクター
を含む、組成物。
[項目13]
細胞内の標的NA分子を改変するための、項目9に記載のベクター、項目10に記載のベクターシステム、項目11に記載のシステム又は項目12に記載の組成物の使用。
図1~12は、本発明の融合核酸分子の好ましい構造を示す。部位特異的核酸改変ポリペプチドは、ドナーNAに融合されたガイドNA(共にfuNA分子を形成する)によって標的二本鎖核酸内の標的配列に向けられる。
化学薬品及び一般的な方法
他に示されない限り、制限消化、アガロースゲル電気泳動、核酸の精製、核酸のライゲーション、形質転換、細菌細胞の選択及び培養を含む本発明の目的のために行われるクローニング手順は、記載されるように実施される(Sambrook J、Fritsch EF及びManiatis T(1989))。Sanger技術(Sangerら、1977)を用いて、レーザー蛍光DNAシーケンサー(Applied Biosystems、Foster City、CA、USA)を用いて、組換えDNAの配列分析を行う。他に記載がない限り、化学薬品及び試薬はSigma Aldrich(Sigma Aldrich、St. Louis、USA)から、Promega(Madison、WI、USA)、Duchefa(Haarlem、Netherland)又はInvitrogen(Carlsbad、CA、USA)から得られる。制限エンドヌクレアーゼは、New England Biolabs(Ipswich、MA、USA)又はRoche Diagnostics GmbH(Penzberg、Germany)からである。オリゴヌクレオチドは、Eurofins MWG Operon(Ebersberg、Germany)によって合成される。
他に示されない限り、制限消化、アガロースゲル電気泳動、核酸の精製、核酸のライゲーション、形質転換、細菌細胞の選択及び培養を含む本発明の目的のために行われるクローニング手順は、記載されるように実施される(Sambrook J、Fritsch EF及びManiatis T(1989))。Sanger技術(Sangerら、1977)を用いて、レーザー蛍光DNAシーケンサー(Applied Biosystems、Foster City、CA、USA)を用いて、組換えDNAの配列分析を行う。他に記載がない限り、化学薬品及び試薬はSigma Aldrich(Sigma Aldrich、St. Louis、USA)から、Promega(Madison、WI、USA)、Duchefa(Haarlem、Netherland)又はInvitrogen(Carlsbad、CA、USA)から得られる。制限エンドヌクレアーゼは、New England Biolabs(Ipswich、MA、USA)又はRoche Diagnostics GmbH(Penzberg、Germany)からである。オリゴヌクレオチドは、Eurofins MWG Operon(Ebersberg、Germany)によって合成される。
実験手順の導入
C末端SV40核局在化シグナルを有するCas9タンパク質の酵母コドン最適化バージョン(配列番号1)を合成し、酵母発現ベクターにクローニングした。同ベクターは、サッカロマイセス・セレビシエSNR52ポリメラーゼIIIプロモーターから発現された1つ以上のガイドRNA(gRNA)を含んでいた。
C末端SV40核局在化シグナルを有するCas9タンパク質の酵母コドン最適化バージョン(配列番号1)を合成し、酵母発現ベクターにクローニングした。同ベクターは、サッカロマイセス・セレビシエSNR52ポリメラーゼIIIプロモーターから発現された1つ以上のガイドRNA(gRNA)を含んでいた。
Cas9は、正しいプロトスペーサー-隣接モチーフ(PAM)が3'末端に存在する場合にのみ、gRNAによる標的配列の認識の際にDNAに結合し、両方の鎖を切断する。理論的には、GN20GG型の任意の配列を標的とすることができる。そこで、設計されたCRISPRシステムによって標的とされるレポーターシステム(GAL4-UAS(配列番号7))の酵母における同時発現のために第2のベクターを構築した。いくつかの非機能的Gal4標的(配列番号9~15)を標的化及び修復するために、gRNAドナー融合体(融合NA)を使用した。
Gal4(配列番号8)は、N末端に位置するDNA結合ドメイン及びC末端での転写活性化のための領域の2成分からなる酵母転写活性化因子である。Gal4は、酵母ゲノム中のマーカー遺伝子の特異的認識配列UAS(upstream activating sequence;上流活性化配列)に結合し、それらの転写を活性化する。MaV203酵母株は、酵母ゲノム中の異なる遺伝子座に安定に組み込まれた3つのレポーター遺伝子(HIS3、URA3及びlacZ)のそれぞれの単一のコピーを含有する。URA3、HIS3及びlacZのプロモーター領域は無関係である(GAL4結合部位の存在を除いて)。
いくつかの非機能的(欠失及び/又は停止コドン挿入することによる破壊)バージョンのGal4を合成し(配列番号9~15)、同時発現させたCRISPR機構によって標的化及び修復することができるように、酵母細胞に形質転換した。CRISPR成分を備えた適切な修復ドナー配列を用いた相同組換え(HR)による完全長Gal4の修復は、lacZ及びHIS3レポーター遺伝子の活性化をもたらす。Gal4遺伝子の修復及びそれに伴う転写活性化は、ヒスチジンを欠くプレート上での細胞増殖によってモニターすることができるが、X-gal(5-ブロモ-4-クロロ-3-インドリル-β- D-ガラクトピラノシド)を用いてアッセイするとlacZ遺伝子の誘導により青色となる。
使用される酵母株は、両方の発現構築物の選択を可能にするために、2つのさらなる栄養要求性突然変異(leu2及びtrp1)を含有する。
本明細書に開示される融合システムの修復効率の増加を検証するために、全ての実験を、ドナー及びガイドRNAが別々に転写される非融合カセットと並行して行った。
酵母株、培地及び培養条件
記載された実施例において使用されるサッカロマイセス・セレビシエ株は、MaV203(MATα、leu2~3,112、trp1-901、his3Δ200、ade2-101、gal4Δ、gal80Δ、SPAL10::URA3、GAL1::lacZ、HIS3UAS GAL1::HIS3@LYS2、can1R、cyh2R)であり、Life Technologiesによって市販されている。酵母は、2%グルコースを補充し、適切な栄養要求性化合物(ForMedium、英国)を欠く酵母窒素原ベースに基づく合成最小培地(SD Media)で増殖させた。培養は30℃で、振とう器又はインキュベーションオーブンのいずれかで行った。
記載された実施例において使用されるサッカロマイセス・セレビシエ株は、MaV203(MATα、leu2~3,112、trp1-901、his3Δ200、ade2-101、gal4Δ、gal80Δ、SPAL10::URA3、GAL1::lacZ、HIS3UAS GAL1::HIS3@LYS2、can1R、cyh2R)であり、Life Technologiesによって市販されている。酵母は、2%グルコースを補充し、適切な栄養要求性化合物(ForMedium、英国)を欠く酵母窒素原ベースに基づく合成最小培地(SD Media)で増殖させた。培養は30℃で、振とう器又はインキュベーションオーブンのいずれかで行った。
大腸菌は、本発明者らの実験で使用された全てのプラスミドのための増殖微生物として、並びに改変された標的のさらなる増殖及び維持のために使用された。大腸菌を、標準的な微生物学的手法(Molecular Cloning:A Laboratory Manual、第3版、1,2及び3巻 J.F. Sambrook及びD.W. Russell編、Cold Spring Harbor Laboratory Press、2001)に従って増殖させた。Cas9、ガイドRNA及びドナーNAを含有するプラスミドは、大腸菌における複製及び維持のためのpUCベースの複製起点及びアンピシリン耐性遺伝子を含んでいた。一方、GAL4標的プラスミドはゲンタマイシン耐性遺伝子(Gmr)を含有した。
[実施例1]
プラスミドの構築
Cas9遺伝子は、真核細胞の発現のために元来構築されたストレプトコッカス・パイオゲネスCas9の酵母コドン最適化バージョンであった(SpCas9; WO2007/025097)(Maliら(2013)Science 339(6121); Congら(2013)Science 339(6121))。このCas9遺伝子は、両端においてSV40核局在化シグナルでタグ付けされ、合成された。また、gRNA及びインビボRNA合成のためのSNR52プロモーターを含有するドナー発現カセットを合成した。
プラスミドの構築
Cas9遺伝子は、真核細胞の発現のために元来構築されたストレプトコッカス・パイオゲネスCas9の酵母コドン最適化バージョンであった(SpCas9; WO2007/025097)(Maliら(2013)Science 339(6121); Congら(2013)Science 339(6121))。このCas9遺伝子は、両端においてSV40核局在化シグナルでタグ付けされ、合成された。また、gRNA及びインビボRNA合成のためのSNR52プロモーターを含有するドナー発現カセットを合成した。
pDEST22(Life Technologies)のGAL4-ADコード配列を、シームレスクローニング(Life Technologies)を介して合成Cas9に置き換えた。このベクターは、酵母における発現のための酵母アルコールデヒドロゲナーゼ遺伝子(ADH1)の構成的中強度プロモーター及び転写ターミネーター並びにトリプトファンを欠く培地上の酵母における選択のためのTRP1遺伝子を含有する。
同ベクターは、設計されたgRNA及びドナー発現カセット(融合又は二重分子として)を、Gatewayクローニング(ライフテクノロジーズ)を介して同じ発現ベクターに導入することを可能にする、クロラムフェニコール耐性遺伝子(Cmr)及びccdB遺伝子に隣接するattR1及びattR2の2つの組換え部位を含有する。LR組換え反応の後、Cmr及びccdB遺伝子を融合NAカセット又は非融合ドナー及びガイド発現カセットにより置換した。
酵母におけるCRISPR修復の標的として使用される改変GAL4コード配列を合成した。酵母における発現のためのpDEST32プラスミド(Life Technologies)をHindIII及びSacIIでカットし、ADH1プロモーター及びターミネーターを含有するバックボーンをゲル精製した。GAL4合成インサートを、シームレスクローニングを用いてベクターに組み入れた。このベクターは、酵母においてトリプトファンを欠く培地上で選択するためのLEU2遺伝子を含んでいた。
GAL4配列中のCas9による認識のための標的部位は、GAL4遺伝子内の潜在的なPAM(NGG)配列に先行する20mer領域を選択することによって経験的に選択された(Sternbergら(2014);Nature 507(7490))。
Cas9の結合及びRループの形成を容易にするために、Jinekら((2012) Science、337(6096))によって最初に設計されたように、ダングリングスペーサー、伸長ヘアピン領域及び長い3'末端を含有する二次構造を有する単一のガイドRNAデザインを選択した。
[実施例2]
酵母形質転換
CRISPR編集ツール(Cas9酵素及び融合NA発現カセット)及びGAL4標的プラスミドの同時形質転換を、製造元のプロトコール(Life Technologies)に記載されているように熱ショックにより行い、導入したプラスミドによって補完される栄養要求性化合物(ロイシン及びトリプトファン)を欠く適切な合成完全(SC)培地中で増殖させた。形質転換された細胞を一晩増殖させ、100mMの3-アミノ-1,2,4-トリアゾール(3-AT; ForMedium、UK)を有するヒスチジンを欠く合成完全(SC)培地を含有する固体プレートに等量の形質転換体(OD測定による)を移した。HIS3の発現(ヒスチジンを含まない培地中で酵母を増殖させるため)はGAL4依存性であり、したがって形質転換体はGAL4修復が起こった場合にのみ増殖することができる。さらに3-ATはHIS3遺伝子産物の競合阻害剤であり、HIS3に依存してヒスチジンを産生する酵母形質転換体に3-ATを適用することにより、酵母細胞が生き残るためにHIS3発現のレベルの増大が必要となる。
酵母形質転換
CRISPR編集ツール(Cas9酵素及び融合NA発現カセット)及びGAL4標的プラスミドの同時形質転換を、製造元のプロトコール(Life Technologies)に記載されているように熱ショックにより行い、導入したプラスミドによって補完される栄養要求性化合物(ロイシン及びトリプトファン)を欠く適切な合成完全(SC)培地中で増殖させた。形質転換された細胞を一晩増殖させ、100mMの3-アミノ-1,2,4-トリアゾール(3-AT; ForMedium、UK)を有するヒスチジンを欠く合成完全(SC)培地を含有する固体プレートに等量の形質転換体(OD測定による)を移した。HIS3の発現(ヒスチジンを含まない培地中で酵母を増殖させるため)はGAL4依存性であり、したがって形質転換体はGAL4修復が起こった場合にのみ増殖することができる。さらに3-ATはHIS3遺伝子産物の競合阻害剤であり、HIS3に依存してヒスチジンを産生する酵母形質転換体に3-ATを適用することにより、酵母細胞が生き残るためにHIS3発現のレベルの増大が必要となる。
さらに、使用した酵母株はGAL4の制御下にlacZマーカー遺伝子を含有し、GAL4修復形質転換体のブルー/ホワイト選択が可能となる。lacZ遺伝子が誘導されると、X-gal(5-ブロモ-4-クロロ-3-インドリル-β-D-ガラクトピラノシド)でアッセイした場合に青色となる。
[実施例3]
X-galアッセイ
ヒスチジンを欠くプレートで増殖する形質転換体を、YPAD培地(ペプトン、酵母エキス及びグルコースの均一混合物を含有する複合酵母培地;ForMedium、英国)を有するプレートの表面に置かれたニトロセルロース膜(Hybond、GE Healthcare)の上にレプリカプレーティングした。膜を含有するYPADプレートの18~24時間のインキュベーション後にアッセイを行った。各膜については、5mgのX-galを50μlのDMFに溶解し、30μlの2-メルカプトエタノール及び5mlのZ緩衝液と混合した。この溶液を用いて、15cmのペトリ皿中の2つの丸い濾紙(Whatman 541)を飽和させた。鉗子を用いて、膜をYPADプレートの表面から注意深く除去し、約20秒間液体窒素に完全に浸漬した。浸したWhatmanフィルターの上に凍結膜を置いた(コロニー側を上にして)。プレートをしっかりと覆い、37℃でインキュベートする。青色の外観を24時間後にモニターした。
X-galアッセイ
ヒスチジンを欠くプレートで増殖する形質転換体を、YPAD培地(ペプトン、酵母エキス及びグルコースの均一混合物を含有する複合酵母培地;ForMedium、英国)を有するプレートの表面に置かれたニトロセルロース膜(Hybond、GE Healthcare)の上にレプリカプレーティングした。膜を含有するYPADプレートの18~24時間のインキュベーション後にアッセイを行った。各膜については、5mgのX-galを50μlのDMFに溶解し、30μlの2-メルカプトエタノール及び5mlのZ緩衝液と混合した。この溶液を用いて、15cmのペトリ皿中の2つの丸い濾紙(Whatman 541)を飽和させた。鉗子を用いて、膜をYPADプレートの表面から注意深く除去し、約20秒間液体窒素に完全に浸漬した。浸したWhatmanフィルターの上に凍結膜を置いた(コロニー側を上にして)。プレートをしっかりと覆い、37℃でインキュベートする。青色の外観を24時間後にモニターした。
[実施例4]
標的(CRISPR修復)プラスミドの配列決定
4つの各実験、少なくとも8つのGAL4修復陽性形質転換体(ヒスチジンを含まない培地で増殖可能なコロニー)を液体培地で一晩、継代培養し、GAL4含有プラスミドを単離した(Zymoprep Yeast Plasmid Miniprep II、Zymo Researchを使用)。単離したプラスミドをさらなる増殖及び商業的配列決定のために大腸菌に導入した。GAL4配列決定により、ドナー分子による配列修復及びアセンブリの確認が可能となった。
標的(CRISPR修復)プラスミドの配列決定
4つの各実験、少なくとも8つのGAL4修復陽性形質転換体(ヒスチジンを含まない培地で増殖可能なコロニー)を液体培地で一晩、継代培養し、GAL4含有プラスミドを単離した(Zymoprep Yeast Plasmid Miniprep II、Zymo Researchを使用)。単離したプラスミドをさらなる増殖及び商業的配列決定のために大腸菌に導入した。GAL4配列決定により、ドナー分子による配列修復及びアセンブリの確認が可能となった。
陽性クローン中のGal4遺伝子のサンガー配列決定は、この標的化プロセスの配列特異性をさらに検証し、融合NAで形質転換された細胞がHRイベントではるかに高い成功数を示したとしても、融合体又は非融合体としてのドナー及びgRNAを発現する細胞の修復において違いを示さなかった。
[実施例5]
15bpのホモロジーアームを用いた1ntの欠失
ガイドRNAにドナー(ドナー1;配列番号26)を融合すると、修復された形質転換体(ヒスチジンを欠く培地で増殖することができる)をもたらしたが、非融合ガイド及びドナーRNAを用いた形質転換体については、増殖は観察されなかった。遺伝子修復の効率の低さは、相同組換えのために利用可能な配列オーバーラップの減少と一致している。
15bpのホモロジーアームを用いた1ntの欠失
ガイドRNAにドナー(ドナー1;配列番号26)を融合すると、修復された形質転換体(ヒスチジンを欠く培地で増殖することができる)をもたらしたが、非融合ガイド及びドナーRNAを用いた形質転換体については、増殖は観察されなかった。遺伝子修復の効率の低さは、相同組換えのために利用可能な配列オーバーラップの減少と一致している。
[実施例6]
50bpのホモロジーアームを用いた1ntの欠失
ドナー(ドナー2;配列番号27)をガイドRNAに融合すると、非融合ドナー及びガイドNAよりも少なくとも50倍多くの形質転換体が得られた。
50bpのホモロジーアームを用いた1ntの欠失
ドナー(ドナー2;配列番号27)をガイドRNAに融合すると、非融合ドナー及びガイドNAよりも少なくとも50倍多くの形質転換体が得られた。
陽性クローン中のGal4遺伝子の配列決定は、HRからのみ、又はほとんどHRから修復結果を示した(全ての配列決定されたクローンについてNHEJの証拠がない)。
[実施例7]
50/26bpのホモロジーアームを用いた20ntの挿入
上記と同じ融合NAを使用して、20ntが除去された同様の標的(標的3;配列番号11)を修復し、結果として1つのホモロジーアームが減少した。融合により、非融合ドナー及びガイドNAよりも約5倍の形質転換体が得られた。陽性クローン中のGal4遺伝子の配列決定により、相同組換えのみからの修復結果が示された。
50/26bpのホモロジーアームを用いた20ntの挿入
上記と同じ融合NAを使用して、20ntが除去された同様の標的(標的3;配列番号11)を修復し、結果として1つのホモロジーアームが減少した。融合により、非融合ドナー及びガイドNAよりも約5倍の形質転換体が得られた。陽性クローン中のGal4遺伝子の配列決定により、相同組換えのみからの修復結果が示された。
[実施例8]
(3nt離れた2つの標的配列を試験する間の)50bpのホモロジーアームを用いた失われた400bpの挿入
互いに近接して位置する(2つの20nt標的の間が3ntギャップ)2つの配列(スペーサー2及びスペーサー3;配列番号20及び21)を、独立及び一緒に(多重標的化)、同時標的化することについて試験した。多重融合カセットは、2つのgRNA及び修復鋳型で構成される単一の分子の産生をもたらす、2つのタンデム融合NA配列が続くプロモーターからなっていた。本発明者らの実験は、融合NAが2つの配列を同時に標的とすることもできることを明確に示した。
(3nt離れた2つの標的配列を試験する間の)50bpのホモロジーアームを用いた失われた400bpの挿入
互いに近接して位置する(2つの20nt標的の間が3ntギャップ)2つの配列(スペーサー2及びスペーサー3;配列番号20及び21)を、独立及び一緒に(多重標的化)、同時標的化することについて試験した。多重融合カセットは、2つのgRNA及び修復鋳型で構成される単一の分子の産生をもたらす、2つのタンデム融合NA配列が続くプロモーターからなっていた。本発明者らの実験は、融合NAが2つの配列を同時に標的とすることもできることを明確に示した。
両方の標的について、ドナーガイド融合の存在下での修復は非融合バージョンよりもはるかに効率的であった(スペース2での標的化については最大10倍以上、スペーサー3については5倍以上)。
[実施例9]
120bpのホモロジーアームを用いたHR末端を除く完全GAL4遺伝子(960bp)の挿入
融合CRISPRが全長コード配列の導入に有効であるかどうかを試験するために、全長GAL4遺伝子(配列番号7)の導入を試験した。例として、本発明者らは、実施例4において既に有効であることが判明しているドナー/ホモロジーアームの長さの比率を維持するように、120bpのホモロジーアームを選択した。完全長GAL4遺伝子の挿入は、融合構築物で約4倍有効である。
120bpのホモロジーアームを用いたHR末端を除く完全GAL4遺伝子(960bp)の挿入
融合CRISPRが全長コード配列の導入に有効であるかどうかを試験するために、全長GAL4遺伝子(配列番号7)の導入を試験した。例として、本発明者らは、実施例4において既に有効であることが判明しているドナー/ホモロジーアームの長さの比率を維持するように、120bpのホモロジーアームを選択した。完全長GAL4遺伝子の挿入は、融合構築物で約4倍有効である。
本発明者らの結果は、修復ドナー配列がgRNAに融合された場合、標的化された編集が少なくとも50倍効率的であることを示す。行われた実験は、単一塩基除去から完全な遺伝子挿入までの幅広い融合関連の有効性を改善させることを示す。報告された実施例は、このCRISPR融合システムが、ガイドRNAに融合された比較的大きなドナー分子を運ぶことに適していることを示している。
[実施例10a]
イネにおける発現のための構築物
アグロバクテリウム媒介植物形質転換にCRISPR/Casシステムを適合させるために、GatewayバイナリーT-DNAベクターをCas9ヌクレアーゼ及びガイドRNAドナー発現カセット(単一又は二重RNA分子のいずれかとして)の共発現のために設計した。両端のSV40核局在化シグナル(NLS)(配列番号6)に結合したイネ(Oryza sativa)における発現のためにコドン最適化されたストレプトコッカス・パイオゲネスCas9(SpCas9)のバージョンを合成した。合成されたカセットは、Cas9の上流に位置する構成的発現のためのトウモロコシポリユビキチン(Ubi)プロモーター(配列番号32)、及び3'末端にノパリン合成酵素(nos)ターミネーター(配列番号33)を含む。この遺伝子カセットは、Seamlessを介してベクターにクローニングされており、T-DNA境界内に機能的要素として:植物選択マーカー;スクリーニング可能なマーカー発現カセット;及びエントリークローン中のgRNA-ドナー発現カセットとのLR組換えを意図したGatewayカセットを含有していた。
イネにおける発現のための構築物
アグロバクテリウム媒介植物形質転換にCRISPR/Casシステムを適合させるために、GatewayバイナリーT-DNAベクターをCas9ヌクレアーゼ及びガイドRNAドナー発現カセット(単一又は二重RNA分子のいずれかとして)の共発現のために設計した。両端のSV40核局在化シグナル(NLS)(配列番号6)に結合したイネ(Oryza sativa)における発現のためにコドン最適化されたストレプトコッカス・パイオゲネスCas9(SpCas9)のバージョンを合成した。合成されたカセットは、Cas9の上流に位置する構成的発現のためのトウモロコシポリユビキチン(Ubi)プロモーター(配列番号32)、及び3'末端にノパリン合成酵素(nos)ターミネーター(配列番号33)を含む。この遺伝子カセットは、Seamlessを介してベクターにクローニングされており、T-DNA境界内に機能的要素として:植物選択マーカー;スクリーニング可能なマーカー発現カセット;及びエントリークローン中のgRNA-ドナー発現カセットとのLR組換えを意図したGatewayカセットを含有していた。
選択された標的部位でゲノム二本鎖切断をもたらす、イネプロトポルフィリノーゲンオキシダーゼ(PPO)遺伝子(WO2015/092706;WO2015/022640(配列番号35))を標的化した3つのgRNAが設計された(スペーサー8、スペーサー9及びスペーサー10(配列番号36、37及び38))。修飾は、以前にサフルフェナシル生存の潜在的なホットスポットとして同定された2つのアミノ酸置換(L419F、F442V;単一部位突然変異及び二重部位突然変異)を目的とする。
融合又は非融合NAのいずれかを含有するRNA発現カセット(PPO遺伝子の選択された位置のための遺伝子特異的スペーサー配列を含む)を合成し、エントリーベクターにクローニングし、CAS9発現カセットを含有する目的ベクターに(Gatewayを介して)クローニングした。gRNAとドナーのRNA発現は、U3 snRNAのpol III型プロモーターによって駆動される。
LR組換え工程の後、得られた発現ベクターを、当技術分野で周知の方法に従ってアグロバクテリウム株LBA4044に形質転換する。
[実施例10b]
イネにおける発現のための構築
SV40に由来するNLSを、N末端で植物核局在化シグナル(NLS)(MSERKRREKL、配列番号71)及びC末端でインポーチン(importin) NLS(KRPAATKKAGQAKKKK 配列番号:72)で置換した以外は、実施例10aに記載したものと同一のベクターを合成し、gRNA及びドナーのRNA発現を促進するプロモーターはU3 snRNA(配列番号:73)のイネpol III型プロモーターであった。
イネにおける発現のための構築
SV40に由来するNLSを、N末端で植物核局在化シグナル(NLS)(MSERKRREKL、配列番号71)及びC末端でインポーチン(importin) NLS(KRPAATKKAGQAKKKK 配列番号:72)で置換した以外は、実施例10aに記載したものと同一のベクターを合成し、gRNA及びドナーのRNA発現を促進するプロモーターはU3 snRNA(配列番号:73)のイネpol III型プロモーターであった。
融合又は非融合NAのいずれかを含有するRNA発現カセット(PPO遺伝子内の選択された位置の遺伝子特異的スペーサー配列を含む)を合成し、エントリーベクターにクローニングし、CAS9発現カセットを含有する目的ベクターに(Gatewayを介して)クローニングした。
非融合対照として使用したベクターには、PRO0231::U3 RNA pol IIIプロモーター::スペーサー::sgRNAスキャフォールド::TTTTTTTTターミネーター::U3 RNA pol IIIプロモーター::テンプレート::TTTTTTTTターミネーターが含有される。
LR組換え工程の後、得られた発現ベクターを、当技術分野で周知の方法に従ってアグロバクテリウム株LBA4044に形質転換する。
[実施例11]
イネ形質転換及び除草剤耐性カルスの選択
発現ベクターを含有するアグロバクテリウムは、インディカイネ(Oryza sativa L.)の胚盤由来カルスを形質転換するために使用される。成熟種子の滅菌は、70%エタノール中で1分間インキュベートし、続いて6%次亜塩素酸ナトリウム中で40分間インキュベートし、続いて滅菌MQ水で3~5回洗浄することによって行った。その後、滅菌した種子を2,4-D(カルス誘導培地)を含有する培地上で発芽させる。光の中で6日間インキュベートした後、胚盤由来のカルスを細菌溶液(OD600=0,1)中で90秒間インキュベートし、排水し、滅菌濾紙上で乾燥させ、次いで細菌と共に3日間、暗所において25℃で共培養する。共培養したカルスを、32℃の光の中で4週間、G418を含有する選択培地に移す。抗生物質耐性カルス片を、32℃の光の中で2週間、25又は50μMのサフルフェナシル(saflufenacil;Kixor(商標))を含有する選択培地に移す。これらの除草剤選択条件は、サフルフェナシルを用いた殺傷曲線における組織生存の分析によって確立されている。除草剤耐性材料を再生培地に移し、光でインキュベーションした後、胚形成可能性が解放され、次の4~5週間でシュートが発達する。シュートをカルスから切除し、シュートが土壌への移行のためによく根づくまで、オーキシン含有培地で2~3週間インキュベートする。硬化したシュートは、温室内で高湿度及び短日間栽培される。
イネ形質転換及び除草剤耐性カルスの選択
発現ベクターを含有するアグロバクテリウムは、インディカイネ(Oryza sativa L.)の胚盤由来カルスを形質転換するために使用される。成熟種子の滅菌は、70%エタノール中で1分間インキュベートし、続いて6%次亜塩素酸ナトリウム中で40分間インキュベートし、続いて滅菌MQ水で3~5回洗浄することによって行った。その後、滅菌した種子を2,4-D(カルス誘導培地)を含有する培地上で発芽させる。光の中で6日間インキュベートした後、胚盤由来のカルスを細菌溶液(OD600=0,1)中で90秒間インキュベートし、排水し、滅菌濾紙上で乾燥させ、次いで細菌と共に3日間、暗所において25℃で共培養する。共培養したカルスを、32℃の光の中で4週間、G418を含有する選択培地に移す。抗生物質耐性カルス片を、32℃の光の中で2週間、25又は50μMのサフルフェナシル(saflufenacil;Kixor(商標))を含有する選択培地に移す。これらの除草剤選択条件は、サフルフェナシルを用いた殺傷曲線における組織生存の分析によって確立されている。除草剤耐性材料を再生培地に移し、光でインキュベーションした後、胚形成可能性が解放され、次の4~5週間でシュートが発達する。シュートをカルスから切除し、シュートが土壌への移行のためによく根づくまで、オーキシン含有培地で2~3週間インキュベートする。硬化したシュートは、温室内で高湿度及び短日間栽培される。
[実施例12]
除草剤耐性形質転換体の分子的特徴づけ
個々の植物形質転換体から回収された葉組織は、PPO遺伝子配列変異のコピー数分析及び分子的特徴づけのために使用される。ゲノムDNAを、Wizard 96マグネチックDNA植物システムキット(Promega、米国特許第6,027,945号及び6,368,800号)を製造業者の指示通りに用いて抽出する。単離されたDNAを、フォワード及びリバースプライマーと共に適切なプローブを用いてPCR増幅した。T-DNAインサートのコピー数を確認するためのこの定量的PCR分析の後、選択薬剤に対する耐性を示す低コピートランスジェニック植物のみをT1種子の収穫のために保持する。その後、種子は移植後3~5ヶ月で収穫される。
除草剤耐性形質転換体の分子的特徴づけ
個々の植物形質転換体から回収された葉組織は、PPO遺伝子配列変異のコピー数分析及び分子的特徴づけのために使用される。ゲノムDNAを、Wizard 96マグネチックDNA植物システムキット(Promega、米国特許第6,027,945号及び6,368,800号)を製造業者の指示通りに用いて抽出する。単離されたDNAを、フォワード及びリバースプライマーと共に適切なプローブを用いてPCR増幅した。T-DNAインサートのコピー数を確認するためのこの定量的PCR分析の後、選択薬剤に対する耐性を示す低コピートランスジェニック植物のみをT1種子の収穫のために保持する。その後、種子は移植後3~5ヶ月で収穫される。
PPOゲノム配列のPCR増幅は、以下のようにサーモサイクリングプログラムを使用して、Fusion Taq DNAポリメラーゼ(Thermo Scientific)を用いて行う:96℃で15分、続いて35サイクル(96℃、30秒; 58℃、30秒; 72℃、3分及び30秒)、72℃で10分。PCR産物を、アガロースゲル電気泳動によって濃度及び断片サイズについて検証し、PCRプライマーを用いた配列決定に送る。シーケンス分析は、代表的なクロマトグラムトレースファイル及び対応するAlignXアライメントを初期の設定で実行し、二次ピークを呼び出すように編集する。
配列情報に基づいて、いくつかの個体で同定された突然変異は、NAのCRISPR成分への融合を含む本発明に記載の技術が植物生物に適用可能であることを示す。提供されたドナーとの相同組換え修復は、サフルフェナシルに対する耐性を付与する(単一部位突然変異及び複数部位突然変異)。
[実施例13]
大腸菌における制御された遺伝子ノックアウト
この実施例において、FusionCRISPRは、大腸菌K-12株の亜株MG1655の標的遺伝子RecAをノックアウトするために使用されている。細菌株を100ml三角フラスコ中の10mlのSOBに接種し、37℃で一晩増殖する(SOB:2%バクト-トリプトン、0.5%酵母エキス、10mM NaCl、2.5mM KCl、10mM MgCl2、10mM MgSO4)。3mlの一晩培養液を1リットル三角フラスコ中の250mlのSOBに希釈し、OD660nmが0.6になるまで激しく振とう(200~250rpm)しながら18℃で増殖する。続いて、培養物を予め冷却した50mlチューブに移し、5000rpmで4℃、5分間遠心分離する。ペレットを元の容量の1/3の氷冷TB(TB:250mM KCl、10mM PIPES遊離酸、15mM CaCl2・2H2O、55mM MnCl2・2H2O)に再懸濁し、氷上で10分間インキュベートした。細胞を5000 rpmにて5分間4℃で遠心分離し、ペレットを元の容量の1/12の氷冷TBに再懸濁する。DMSOを、7%の最終濃度まで穏やかに混合しながら添加する。コンピテント細胞を200μlずつのアリコートに分け、液体窒素中で凍結する。コンピテント細胞の1つのアリコートを、pCas9に存在するクロラムフェニコール選択マーカー及びCas9発現カセット[Jiang W、Bikard D、Cox D、Zhang F、Marraffini L(2013)RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nat Biotechnol]並びに以下のFusionCRISPR配列及びRecAスペーサーを有する融合RNA発現のためのカセット[Zhao D、Yuan S、Xiong B、Sun H、Ye L、Li J、Zhang X、Bi C.(2016)Development of a fast and easy method for Escherichia coli genome editing with CRISPR/Cas9. Microb Cell Fact. 15(1):205]を含有する0.1~0.5μgのプラスミドと共に加える:
ここで、RecAを認識するスペーサーが強調表示され、sgRNAについての必須配列は下線でない大文字であり、RecAを有するホモロジーアーム1は二重下線であり、RecAを有するホモロジーアーム2は一重下線である。FusionCRISPR構築物及びCas9のプロモーター及びターミネーターは、http://parts.igem.org/Promoters/Catalog/Constitutive及びhttp://parts.igem.org/Terminators/Catalogから選択することができる。標的化RecA遺伝子は以下の配列を有する:
ここで、PAM配列はイタリック体であり、ホモロジーアーム1は二重下線であり、ホモロジーアーム2は一重下線であり、プロトスペーサーは強調されている。DNA及び細胞は、42℃で90秒間の熱ショックの前に30分間氷上に保持する。細胞及びDNAを氷に移し、1分後、1mlのLBを加える(LB:1%トリプトン、1%NaCl、0.5%酵母エキス、pH 7.0)。細胞を37℃で1時間回復させる。回復期は、FusionCRISPR構成要素がより多くの時間で大腸菌ゲノムを編集することが可能となるように、16時間まで延長することができる。プラスミドの損失を防ぐために、25μg/mlのクロラムフェニコールは1時間後に添加するべきである。細胞を25μg/mlのクロラムフェニコールを含むLB培地上にプレーティングし、37℃で1日間インキュベートする。単一のコロニーをプレートから選択し、クロラムフェニコール入りのLB中に37℃で一晩増殖させ、その後ゲノムDNAを抽出する[He、F.(2011)E. coli Genomic DNA Extraction. Bio-protocol Bio101:e97]。第1のホモロジーアームの上流のフォワードプライマー(ATGGCTATCGACGAAAACAAA)(配列番号44)及び第2のホモロジーアームの下流のリバースプライマー(CGTCAGCGTGGTTTTACCGGA)(配列番号45)を用いたPCRを実行し、RecA配列(配列番号43)において太字で示されている11ヌクレオチドがFusionCRISPR鋳型での相同組換え修復のためにもはや存在しないコロニーを同定する。PCR断片は、標準ゲル電気泳動後に遺伝子座の改変を確認するために、配列決定されるか(予想されるサイズ220bp)又は、この場合、AgeI切断(PAM周囲の欠失配列はAgeI認識部位ACCGGTを含有する)に供され得る。11ヌクレオチドの欠失は、オープンリーディングフレームの破壊を確実にする。
大腸菌における制御された遺伝子ノックアウト
この実施例において、FusionCRISPRは、大腸菌K-12株の亜株MG1655の標的遺伝子RecAをノックアウトするために使用されている。細菌株を100ml三角フラスコ中の10mlのSOBに接種し、37℃で一晩増殖する(SOB:2%バクト-トリプトン、0.5%酵母エキス、10mM NaCl、2.5mM KCl、10mM MgCl2、10mM MgSO4)。3mlの一晩培養液を1リットル三角フラスコ中の250mlのSOBに希釈し、OD660nmが0.6になるまで激しく振とう(200~250rpm)しながら18℃で増殖する。続いて、培養物を予め冷却した50mlチューブに移し、5000rpmで4℃、5分間遠心分離する。ペレットを元の容量の1/3の氷冷TB(TB:250mM KCl、10mM PIPES遊離酸、15mM CaCl2・2H2O、55mM MnCl2・2H2O)に再懸濁し、氷上で10分間インキュベートした。細胞を5000 rpmにて5分間4℃で遠心分離し、ペレットを元の容量の1/12の氷冷TBに再懸濁する。DMSOを、7%の最終濃度まで穏やかに混合しながら添加する。コンピテント細胞を200μlずつのアリコートに分け、液体窒素中で凍結する。コンピテント細胞の1つのアリコートを、pCas9に存在するクロラムフェニコール選択マーカー及びCas9発現カセット[Jiang W、Bikard D、Cox D、Zhang F、Marraffini L(2013)RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nat Biotechnol]並びに以下のFusionCRISPR配列及びRecAスペーサーを有する融合RNA発現のためのカセット[Zhao D、Yuan S、Xiong B、Sun H、Ye L、Li J、Zhang X、Bi C.(2016)Development of a fast and easy method for Escherichia coli genome editing with CRISPR/Cas9. Microb Cell Fact. 15(1):205]を含有する0.1~0.5μgのプラスミドと共に加える:
ここで、RecAを認識するスペーサーが強調表示され、sgRNAについての必須配列は下線でない大文字であり、RecAを有するホモロジーアーム1は二重下線であり、RecAを有するホモロジーアーム2は一重下線である。FusionCRISPR構築物及びCas9のプロモーター及びターミネーターは、http://parts.igem.org/Promoters/Catalog/Constitutive及びhttp://parts.igem.org/Terminators/Catalogから選択することができる。標的化RecA遺伝子は以下の配列を有する:
ここで、PAM配列はイタリック体であり、ホモロジーアーム1は二重下線であり、ホモロジーアーム2は一重下線であり、プロトスペーサーは強調されている。DNA及び細胞は、42℃で90秒間の熱ショックの前に30分間氷上に保持する。細胞及びDNAを氷に移し、1分後、1mlのLBを加える(LB:1%トリプトン、1%NaCl、0.5%酵母エキス、pH 7.0)。細胞を37℃で1時間回復させる。回復期は、FusionCRISPR構成要素がより多くの時間で大腸菌ゲノムを編集することが可能となるように、16時間まで延長することができる。プラスミドの損失を防ぐために、25μg/mlのクロラムフェニコールは1時間後に添加するべきである。細胞を25μg/mlのクロラムフェニコールを含むLB培地上にプレーティングし、37℃で1日間インキュベートする。単一のコロニーをプレートから選択し、クロラムフェニコール入りのLB中に37℃で一晩増殖させ、その後ゲノムDNAを抽出する[He、F.(2011)E. coli Genomic DNA Extraction. Bio-protocol Bio101:e97]。第1のホモロジーアームの上流のフォワードプライマー(ATGGCTATCGACGAAAACAAA)(配列番号44)及び第2のホモロジーアームの下流のリバースプライマー(CGTCAGCGTGGTTTTACCGGA)(配列番号45)を用いたPCRを実行し、RecA配列(配列番号43)において太字で示されている11ヌクレオチドがFusionCRISPR鋳型での相同組換え修復のためにもはや存在しないコロニーを同定する。PCR断片は、標準ゲル電気泳動後に遺伝子座の改変を確認するために、配列決定されるか(予想されるサイズ220bp)又は、この場合、AgeI切断(PAM周囲の欠失配列はAgeI認識部位ACCGGTを含有する)に供され得る。11ヌクレオチドの欠失は、オープンリーディングフレームの破壊を確実にする。
[実施例14]
ヒト誘導性多能性幹細胞(hiPSCs)及びHEK293細胞におけるPRDM9遺伝子の制御されたノックアウト
hiPSCs及びHEK293細胞における細胞培養維持、プラスミド構築、トランスフェクション方法及びゲノム編集の分子分析は、Yang L、Yang JL、Byrne S、Pan J、Church G(2014)CRISPR/Cas9-directed genome editing of cultured cells. Current Protocols in Molecular Biology 31.1.1~31.1.17に詳細に記載されている。PRDM9遺伝子のノックアウトについては、gRNAプラスミド設計のわずかな変更のみで、全ての工程をその文献に記載されるのに従う。合成されたgRNAは、以下の配列を有するべきである:
ここでU6プロモーターがイタリック体で示され、PRDM9エクソンENSE00001804383を認識するスペーサーが強調表示され、sgRNAに必須の配列は下線でもイタリック体でもない大文字であり、PRDM9とのホモロジーアーム1は二重下線であり、PRDM9とのホモロジーアーム2は一重下線であり、ターミネーターは小文字である。標的化されたPRDM9エクソンENSE00001804383は、以下の配列を有する:
ここで、PAM配列はイタリック体であり、ホモロジーアーム1は二重下線であり、ホモロジーアーム2は一重下線であり、プロトスペーサーが強調されている。太字で示されるヌクレオチドは、ゲノムDNAからそれぞれのゲノム領域を増幅するPCR及び結果として生じるPCR産物のシーケンシングを用いて示されるように、FusionCRISPR構築物との相同組換えの際に欠失され、フレームシフトを生じる。
ヒト誘導性多能性幹細胞(hiPSCs)及びHEK293細胞におけるPRDM9遺伝子の制御されたノックアウト
hiPSCs及びHEK293細胞における細胞培養維持、プラスミド構築、トランスフェクション方法及びゲノム編集の分子分析は、Yang L、Yang JL、Byrne S、Pan J、Church G(2014)CRISPR/Cas9-directed genome editing of cultured cells. Current Protocols in Molecular Biology 31.1.1~31.1.17に詳細に記載されている。PRDM9遺伝子のノックアウトについては、gRNAプラスミド設計のわずかな変更のみで、全ての工程をその文献に記載されるのに従う。合成されたgRNAは、以下の配列を有するべきである:
ここでU6プロモーターがイタリック体で示され、PRDM9エクソンENSE00001804383を認識するスペーサーが強調表示され、sgRNAに必須の配列は下線でもイタリック体でもない大文字であり、PRDM9とのホモロジーアーム1は二重下線であり、PRDM9とのホモロジーアーム2は一重下線であり、ターミネーターは小文字である。標的化されたPRDM9エクソンENSE00001804383は、以下の配列を有する:
ここで、PAM配列はイタリック体であり、ホモロジーアーム1は二重下線であり、ホモロジーアーム2は一重下線であり、プロトスペーサーが強調されている。太字で示されるヌクレオチドは、ゲノムDNAからそれぞれのゲノム領域を増幅するPCR及び結果として生じるPCR産物のシーケンシングを用いて示されるように、FusionCRISPR構築物との相同組換えの際に欠失され、フレームシフトを生じる。
[実施例15]
イネにおけるシクロヘキサンジオン(DIM)及び/又はアリルオキシフェノキシプロピオネート(FOP)をもたらすイネ植物における点突然変異の導入。
プラスチドアセチルコエンザイムAカルボキシラーゼ(ACCase)の突然変異I1781L及びG2096Sは、DIM及びFOP除草剤に対する耐性を付与することが知られている。これらの突然変異は、以下のベクターを用いて内因性ACCase遺伝子座に導入することができる。
イネにおけるシクロヘキサンジオン(DIM)及び/又はアリルオキシフェノキシプロピオネート(FOP)をもたらすイネ植物における点突然変異の導入。
プラスチドアセチルコエンザイムAカルボキシラーゼ(ACCase)の突然変異I1781L及びG2096Sは、DIM及びFOP除草剤に対する耐性を付与することが知られている。これらの突然変異は、以下のベクターを用いて内因性ACCase遺伝子座に導入することができる。
ベクターRLW137配列番号66
このベクターの骨格は、gatewayが可能となる構築物RLW121配列番号62である。
このベクターの骨格は、gatewayが可能となる構築物RLW121配列番号62である。
RLW137のENTRベクターは、ベクターCC003配列番号63(入ってくるT-DNAに対する選択マーカー)、CC018配列番号64(G2096に対応するDNAの上流をカットした後にG2096Sを標的とし導入するFusionCRISPR構築物を産生する)及びCC006配列番号65(Cas9を提供する)である。
CC018(CRISPRCas018の短縮形)は、入ってくるヌクレオチドに隣接する~300ntのホモロジーアーム(この場合、G2096Sをコードする)を含有する。さらなる突然変異は、T-DNA(突然変異したPAM、代替的に又は加えて、スペーサーには、存在する場合にはエクソンに対応しており、イントロン/エクソンの境界に影響を与えない部分において好ましくはサイレントである多くの突然変異を含むことができる)の自己切断及びホモロジーアーム又は入ってくるヌクレオチドのいずれかに存在するTの長いストレッチでの転写の早期終了を回避するために同時導入される。
ドナー分子がガイドRNAに連結されていない別個の分子として発現される以外は同一である対照ベクターが合成される。
ベクターRLW137及び対照ベクターは、上記のプロトコールを用いてイネに形質転換される。初期選択は、ZmAHAS A122T S553Nマーカーの存在について選択する。形質転換された植物の分析は、実施例12に記載したように実施する。
RLW137について上述した手順と同様に、RLW138は同じ変異を導入するが、今回は代替的な下流のプロトスペーサー部位を使用する。RLW138は、CC003、CC019(配列番号67)及びCC006を有するRLW121バックボーンからなる。
変異I1781Lは、RLW121、CC003、CC020(配列番号69)及びCC006からなるRLW139(配列番号70)によって導入される。
[実施例16]
バチルスにおける融合CRISPRの適用
エレクトロコンピテント枯草菌細胞及びエレクトロポレーション
枯草菌ATCC 6051へのDNAの形質転換は、エレクトロポレーションによって行う。エレクトロコンピテント枯草菌ATCC 6051細胞の調製及びDNAの形質転換は、以下の改変と共に、Xueら(Xue、G.-P.、1999、Journal of Microbiological Methods 34、183~191頁)によって、本質的に記載されるよう行われる:DNAの形質転換において、細胞を1mlのLBSPG緩衝液中に回収し、37℃で60分間インキュベートし(Vehmaanpera J., 1989, FEMS Microbio. Lett., 61:165~170頁)、その後、選択的LB-寒天プレート上にプレーティングする。温度感受性pE194複製起点を含有するプラスミドについては、細胞を33℃で3時間回収する。
バチルスにおける融合CRISPRの適用
エレクトロコンピテント枯草菌細胞及びエレクトロポレーション
枯草菌ATCC 6051へのDNAの形質転換は、エレクトロポレーションによって行う。エレクトロコンピテント枯草菌ATCC 6051細胞の調製及びDNAの形質転換は、以下の改変と共に、Xueら(Xue、G.-P.、1999、Journal of Microbiological Methods 34、183~191頁)によって、本質的に記載されるよう行われる:DNAの形質転換において、細胞を1mlのLBSPG緩衝液中に回収し、37℃で60分間インキュベートし(Vehmaanpera J., 1989, FEMS Microbio. Lett., 61:165~170頁)、その後、選択的LB-寒天プレート上にプレーティングする。温度感受性pE194複製起点を含有するプラスミドについては、細胞を33℃で3時間回収する。
プラスミドの単離
プラスミドDNAは、(Sambrook、J.及びRussell、D.W. Molecular Cloning. A laboratory manual、第3版、Cold Spring Harbor Laboratory Press、Cold Spring Harbor、NY. 2001年)に記載の標準的な分子生物学的方法又はアルカリ溶解法(Birnboim、H. C.、Doly、J.(1979)、Nucleic Acids Res 7(6):1513~1523頁)によってバチルス及び大腸菌細胞から単離した。バチルス細胞は、細胞溶解前に37℃で30分間、10mg/mlのリゾチームで処理した大腸菌と比較した。
プラスミドDNAは、(Sambrook、J.及びRussell、D.W. Molecular Cloning. A laboratory manual、第3版、Cold Spring Harbor Laboratory Press、Cold Spring Harbor、NY. 2001年)に記載の標準的な分子生物学的方法又はアルカリ溶解法(Birnboim、H. C.、Doly、J.(1979)、Nucleic Acids Res 7(6):1513~1523頁)によってバチルス及び大腸菌細胞から単離した。バチルス細胞は、細胞溶解前に37℃で30分間、10mg/mlのリゾチームで処理した大腸菌と比較した。
オリゴヌクレオチド二重鎖を形成するためのオリゴヌクレオチドのアニーリング。
オリゴヌクレオチドを水中で100μMの濃度に調整した。5μlのフォワード及び5μlの対応するリバースオリゴヌクレオチドを90μlの30mM Hepes緩衝液(pH 7.8)に添加した。反応混合液を95℃で5分間加熱し、続いて、反応温度を95℃から4℃まで0.1℃/secずつ下げる勾配によりアニーリングした(Cobb、R.E.、Wang、Y.、及びZhao, H. (2015). High-Efficiency Multiplex Genome Editing of Streptomyces Species Using an Engineered CRISPR/Cas System. ACS Synthetic Biology, 4(6), 723~728頁)。
オリゴヌクレオチドを水中で100μMの濃度に調整した。5μlのフォワード及び5μlの対応するリバースオリゴヌクレオチドを90μlの30mM Hepes緩衝液(pH 7.8)に添加した。反応混合液を95℃で5分間加熱し、続いて、反応温度を95℃から4℃まで0.1℃/secずつ下げる勾配によりアニーリングした(Cobb、R.E.、Wang、Y.、及びZhao, H. (2015). High-Efficiency Multiplex Genome Editing of Streptomyces Species Using an Engineered CRISPR/Cas System. ACS Synthetic Biology, 4(6), 723~728頁)。
分子生物学の方法と技術
プラスミドpJOE8999:
Altenbuchner J. 2016.Editing of the Bacillus subtilis genome by the CRISPR-Cas9 system. Appl Environ Microbiol 82:5421~5頁。
プラスミドpJOE8999:
Altenbuchner J. 2016.Editing of the Bacillus subtilis genome by the CRISPR-Cas9 system. Appl Environ Microbiol 82:5421~5頁。
プラスミドpCC001
標準的な大腸菌クローニングベクター(pUC誘導体)に提供されたpJOE8999及び合成遺伝子断片配列番号048をAvrII及びXbaIでカットし、その後、pJOE8999プラスミド骨格及び配列番号049のより小さいAvrII/XbaI断片を単離する。T4-DNAリガーゼ(NEB)を用いて2つの断片を連結し、その後、大腸菌XL1-Blueコンピテント細胞(Stratagene)へ形質転換する。正しいプラスミドが回収され、pCC001と命名された。
標準的な大腸菌クローニングベクター(pUC誘導体)に提供されたpJOE8999及び合成遺伝子断片配列番号048をAvrII及びXbaIでカットし、その後、pJOE8999プラスミド骨格及び配列番号049のより小さいAvrII/XbaI断片を単離する。T4-DNAリガーゼ(NEB)を用いて2つの断片を連結し、その後、大腸菌XL1-Blueコンピテント細胞(Stratagene)へ形質転換する。正しいプラスミドが回収され、pCC001と命名された。
プラスミドpCC002
標準的な大腸菌クローニングベクター(pUC誘導体)に提供されたpJOE8999及び合成遺伝子断片配列番号049をAvrII及びXbaIでカットし、その後、pJOE8999プラスミド骨格及び配列番号049のより小さいAvrII/XbaI断片を単離する。T4-DNAリガーゼ(NEB)を用いて2つの断片を連結し、その後、大腸菌XL1-Blueコンピテント細胞(Stratagene)へ形質転換する。正しいプラスミドが回収され、pCC002と命名された。
標準的な大腸菌クローニングベクター(pUC誘導体)に提供されたpJOE8999及び合成遺伝子断片配列番号049をAvrII及びXbaIでカットし、その後、pJOE8999プラスミド骨格及び配列番号049のより小さいAvrII/XbaI断片を単離する。T4-DNAリガーゼ(NEB)を用いて2つの断片を連結し、その後、大腸菌XL1-Blueコンピテント細胞(Stratagene)へ形質転換する。正しいプラスミドが回収され、pCC002と命名された。
プラスミドpCC003
5'リン酸化を有するオリゴヌクレオチド配列番号050及び配列番号051をアニールして、枯草菌ATCC6051のアミラーゼ遺伝子amyEを標的とするプロトスペーサー配列をコードするオリゴヌクレオチド二本鎖を形成させる。プラスミドpJOE8999をBsaIでカットして、その後、プラスミドpCC003を回収するためにオリゴヌクレオチド二本鎖をライゲーションする。
5'リン酸化を有するオリゴヌクレオチド配列番号050及び配列番号051をアニールして、枯草菌ATCC6051のアミラーゼ遺伝子amyEを標的とするプロトスペーサー配列をコードするオリゴヌクレオチド二本鎖を形成させる。プラスミドpJOE8999をBsaIでカットして、その後、プラスミドpCC003を回収するためにオリゴヌクレオチド二本鎖をライゲーションする。
プラスミドpCC004
枯草菌ATCC6051のアミラーゼamyE遺伝子に隣接する5'ホモロジー領域(HomAとも呼ばれる)及び3'相同性領域(HomBとも呼ばれる)を、それぞれオリゴヌクレオチド配列番号52、配列番号53及び配列番号54、配列番号55を用いて単離ゲノムDNA上でPCR増幅した。2つの相同性領域HomA及びHomBを、オリゴヌクレオチド配列番号52及び配列番号55とのオーバーラップPCRを用いて融合し、増幅して、amyE遺伝子の相同領域のHomAB PCR断片を回収した。プラスミドpCC003及びHomAB-amyE PCR断片をSfiIでカットし、その後、T4-DNAリガーゼ(NEB)を用いライゲーションした。反応混合物を大腸菌XL1-Blueコンピテント細胞(Stratagene)に形質転換した。amyEプロトスペーサー及びamyEのHomABを含有する正しいプラスミドを回収し、pCC004と命名した(図23)。
枯草菌ATCC6051のアミラーゼamyE遺伝子に隣接する5'ホモロジー領域(HomAとも呼ばれる)及び3'相同性領域(HomBとも呼ばれる)を、それぞれオリゴヌクレオチド配列番号52、配列番号53及び配列番号54、配列番号55を用いて単離ゲノムDNA上でPCR増幅した。2つの相同性領域HomA及びHomBを、オリゴヌクレオチド配列番号52及び配列番号55とのオーバーラップPCRを用いて融合し、増幅して、amyE遺伝子の相同領域のHomAB PCR断片を回収した。プラスミドpCC003及びHomAB-amyE PCR断片をSfiIでカットし、その後、T4-DNAリガーゼ(NEB)を用いライゲーションした。反応混合物を大腸菌XL1-Blueコンピテント細胞(Stratagene)に形質転換した。amyEプロトスペーサー及びamyEのHomABを含有する正しいプラスミドを回収し、pCC004と命名した(図23)。
プラスミドpCC005
プラスミドpCC001をBsaIでカットし、その後、pCC003について記載したように、amyEプロトスペーサーオリゴヌクレオチド二本鎖(配列番号050/配列番号051)のクローニングを行った。得られたプラスミド及びpCC004の構築において記載したamyE遺伝子の相同領域HomABのPCR断片をSfiIでカットし、その後、T4-DNAリガーゼ(NEB)を用いてライゲーションした。反応混合物を大腸菌XL1-Blueコンピテント細胞(Stratagene)に形質転換した。amyEプロトスペーサー及びamyEのHomABを含有する正しいプラスミドを回収し、pCC005と命名した。
プラスミドpCC001をBsaIでカットし、その後、pCC003について記載したように、amyEプロトスペーサーオリゴヌクレオチド二本鎖(配列番号050/配列番号051)のクローニングを行った。得られたプラスミド及びpCC004の構築において記載したamyE遺伝子の相同領域HomABのPCR断片をSfiIでカットし、その後、T4-DNAリガーゼ(NEB)を用いてライゲーションした。反応混合物を大腸菌XL1-Blueコンピテント細胞(Stratagene)に形質転換した。amyEプロトスペーサー及びamyEのHomABを含有する正しいプラスミドを回収し、pCC005と命名した。
プラスミドpCC006
枯草菌ATCC6051のアミラーゼamyE遺伝子に隣接する5'相同性領域(HomAとも呼ばれる)及び3'相同性領域(HomBとも呼ばれる)を、それぞれオリゴヌクレオチド配列番号56、配列番号57及び配列番号58、配列番号59を用いて単離されたゲノムDNA上でPCR増幅した。2つの相同性領域HomA及びHomBを、オリゴヌクレオチド配列番号56及び配列番号59とのオーバーラップPCRを用いて融合し、増幅して、amyE遺伝子の相同領域のHomAB PCR断片を回収した。pCC003について記載したように、プラスミドpCC001をBsaIでカットし、その後、amyEプロトスペーサーオリゴヌクレオチド二重鎖(配列番号50/配列番号51)をT4-DNAリガーゼ(NEB)を用いてライゲーションした。得られたプラスミド及びamyE遺伝子の相同領域HomABのPCR断片をSfiIでカットし、その後、T4-DNAリガーゼ(NEB)を用いてライゲーションした。反応混合物を大腸菌XL1-Blueコンピテント細胞(Stratagene)に形質転換した。amyEプロトスペーサー及びamyEのHomAB(pCC005と比較して逆方向の)を含有する正しいプラスミドを回収し、pCC006と命名した。
枯草菌ATCC6051のアミラーゼamyE遺伝子に隣接する5'相同性領域(HomAとも呼ばれる)及び3'相同性領域(HomBとも呼ばれる)を、それぞれオリゴヌクレオチド配列番号56、配列番号57及び配列番号58、配列番号59を用いて単離されたゲノムDNA上でPCR増幅した。2つの相同性領域HomA及びHomBを、オリゴヌクレオチド配列番号56及び配列番号59とのオーバーラップPCRを用いて融合し、増幅して、amyE遺伝子の相同領域のHomAB PCR断片を回収した。pCC003について記載したように、プラスミドpCC001をBsaIでカットし、その後、amyEプロトスペーサーオリゴヌクレオチド二重鎖(配列番号50/配列番号51)をT4-DNAリガーゼ(NEB)を用いてライゲーションした。得られたプラスミド及びamyE遺伝子の相同領域HomABのPCR断片をSfiIでカットし、その後、T4-DNAリガーゼ(NEB)を用いてライゲーションした。反応混合物を大腸菌XL1-Blueコンピテント細胞(Stratagene)に形質転換した。amyEプロトスペーサー及びamyEのHomAB(pCC005と比較して逆方向の)を含有する正しいプラスミドを回収し、pCC006と命名した。
プラスミドpCC007
pCC003について記載したように、プラスミドpCC002をBsaIでカットし、その後、amyEプロトスペーサーオリゴヌクレオチド二重鎖(配列番号50/配列番号51)をT4-DNAリガーゼ(NEB)を用いてライゲーションした。得られたプラスミド及びpCC004の構築において記載したamyE遺伝子の相同領域HomABのPCR断片をSfiIでカットし、その後、T4-DNAリガーゼ(NEB)を用いてライゲーションした。反応混合物を大腸菌XL1-Blueコンピテント細胞(Stratagene)に形質転換した。amyE遺伝子のHomAB及びamyEプロトスペーサーを含有する正しいプラスミドを回収し、pCC007と命名した。
pCC003について記載したように、プラスミドpCC002をBsaIでカットし、その後、amyEプロトスペーサーオリゴヌクレオチド二重鎖(配列番号50/配列番号51)をT4-DNAリガーゼ(NEB)を用いてライゲーションした。得られたプラスミド及びpCC004の構築において記載したamyE遺伝子の相同領域HomABのPCR断片をSfiIでカットし、その後、T4-DNAリガーゼ(NEB)を用いてライゲーションした。反応混合物を大腸菌XL1-Blueコンピテント細胞(Stratagene)に形質転換した。amyE遺伝子のHomAB及びamyEプロトスペーサーを含有する正しいプラスミドを回収し、pCC007と命名した。
プラスミドpCC008
pCC003について記載したように、プラスミドpCC002をBsaIでカットし、その後、amyEプロトスペーサーオリゴヌクレオチド二重鎖(配列番号50/配列番号51)をT4-DNAリガーゼ(NEB)を用いてライゲーションした。得られたプラスミド及びpCC006について記載したような配列番号56及び配列番号59のオリゴヌクレオチドを用いて増幅したamyEの相同領域HomABのPCR断片をSfiIでカットし、その後、T4-DNAリガーゼ(NEB)を用いてライゲーションした。反応混合物を大腸菌XL1-Blueコンピテント細胞(Stratagene)に形質転換した。pCC007及びamyEプロトスペーサーと比較して逆向きのamyEのHomABを含有する正しいプラスミドを回収し、pCC008と命名した。
pCC003について記載したように、プラスミドpCC002をBsaIでカットし、その後、amyEプロトスペーサーオリゴヌクレオチド二重鎖(配列番号50/配列番号51)をT4-DNAリガーゼ(NEB)を用いてライゲーションした。得られたプラスミド及びpCC006について記載したような配列番号56及び配列番号59のオリゴヌクレオチドを用いて増幅したamyEの相同領域HomABのPCR断片をSfiIでカットし、その後、T4-DNAリガーゼ(NEB)を用いてライゲーションした。反応混合物を大腸菌XL1-Blueコンピテント細胞(Stratagene)に形質転換した。pCC007及びamyEプロトスペーサーと比較して逆向きのamyEのHomABを含有する正しいプラスミドを回収し、pCC008と命名した。
Fusion-CRISPRを用いた遺伝子欠失。
エレクトロコンピテント枯草菌ATCC6051細胞を、下記の改変と共に、本質的にXueら(Xue, G.-P.、1999、Journal of Microbiological Methods 34、183~191頁)によって記載されるように、プラスミドpJOE8999、pCC004、pCC005、pCC006、pCC007、pCC008各々1μgを用いて形質転換した:DNAの形質転換時に、細胞を1mlのLBSPG緩衝液中に回収し、33℃で3時間インキュベートし(Vehmaanpera J.、1989、FEMS Microbio. Lett.、61:165~170頁)、その後、Cas9誘導のために20μg/mlのカナマイシン及び0.2%のD-マンノースを補充したLB-Lennoxプレート上にプレーティングした。各々のプラスミド形質転換から10クローンまでを採取し、新鮮な予熱したLB-Lennoxプレート上に移し、50℃で18時間インキュベートした。大きく増殖した各コロニーから、細胞を採取し、新鮮なLB-Lennoxプレート上で3ストロークを行い、45℃で7~8時間のインキュベーション後に単一のコロニーを得た。LB-Lennoxプレート及び20μg/mlカナマイシンを補充したLB-Lennoxプレート上に単一コロニーを移植し、30℃で16~18時間インキュベートした。プラスミド損失を示すカナマイシン感受性クローンを、1%可溶性デンプンを補充したLB-Lennoxプレート上にプレーティングし、30℃で20時間インキュベーションした。アミラーゼamyE遺伝子の不活性化は、プレートをヨウ素含有Lugols溶液で覆うことによって視覚化し、明るいハローの存在又は非存在について分析し、後者は、不活性化が成功したことを示す。
エレクトロコンピテント枯草菌ATCC6051細胞を、下記の改変と共に、本質的にXueら(Xue, G.-P.、1999、Journal of Microbiological Methods 34、183~191頁)によって記載されるように、プラスミドpJOE8999、pCC004、pCC005、pCC006、pCC007、pCC008各々1μgを用いて形質転換した:DNAの形質転換時に、細胞を1mlのLBSPG緩衝液中に回収し、33℃で3時間インキュベートし(Vehmaanpera J.、1989、FEMS Microbio. Lett.、61:165~170頁)、その後、Cas9誘導のために20μg/mlのカナマイシン及び0.2%のD-マンノースを補充したLB-Lennoxプレート上にプレーティングした。各々のプラスミド形質転換から10クローンまでを採取し、新鮮な予熱したLB-Lennoxプレート上に移し、50℃で18時間インキュベートした。大きく増殖した各コロニーから、細胞を採取し、新鮮なLB-Lennoxプレート上で3ストロークを行い、45℃で7~8時間のインキュベーション後に単一のコロニーを得た。LB-Lennoxプレート及び20μg/mlカナマイシンを補充したLB-Lennoxプレート上に単一コロニーを移植し、30℃で16~18時間インキュベートした。プラスミド損失を示すカナマイシン感受性クローンを、1%可溶性デンプンを補充したLB-Lennoxプレート上にプレーティングし、30℃で20時間インキュベーションした。アミラーゼamyE遺伝子の不活性化は、プレートをヨウ素含有Lugols溶液で覆うことによって視覚化し、明るいハローの存在又は非存在について分析し、後者は、不活性化が成功したことを示す。
表2は、プラスミド治癒(plasmid curing)後の全クローンの量、不活性化アミラーゼを有するクローンの量、全クローンに対する不活性化アミラーゼを有するクローンの百分率、及びpCC004に対する示されたプラスミドによる相対的ノックアウト効率を要約する(図25)。
SEQUENCE LISTING
<110> BASF Plant Science Company GmbH
<120> Improved methods for modification of target nucleic acids
<130> PA22-600
<150> EP16167773.7
<151> 2016-04-29
<150> EP16167774.5
<151> 2016-04-29
<150> EP17156018.8
<151> 2017-02-14
<160> 73
<170> BiSSAP 1.3
<210> 1
<211> 4140
<212> DNA
<213> Artificial Sequence
<220>
<223> Cas9 yeast
<400> 1
atggataaaa aatattctat tggtttggat attggtacta attctgttgg ttgggctgtt 60
attactgatg aatataaagt tccatctaaa aaatttaaag ttttgggtaa tactgataga 120
cattctatta aaaaaaattt gattggtgct ttgttgtttg attctggtga aactgctgaa 180
gctactagat tgaaaagaac tgctagaaga agatatacta gaagaaaaaa tagaatttgt 240
tatttgcaag aaattttttc taatgaaatg gctaaagttg atgattcttt ttttcataga 300
ttggaagaat cttttttggt tgaagaagat aaaaaacatg aaagacatcc aatttttggt 360
aatattgttg atgaagttgc ttatcatgaa aaatatccaa ctatttatca tttgagaaaa 420
aaattggttg attctactga taaagctgat ttgagattga tttatttggc tttggctcat 480
atgattaaat ttagaggtca ttttttgatt gaaggtgatt tgaatccaga taattctgat 540
gttgataaat tgtttattca attggttcaa acttataatc aattgtttga agaaaatcca 600
attaatgctt ctggtgttga tgctaaagct attttgtctg ctagattgtc taaatctaga 660
agattggaaa atttgattgc tcaattgcca ggtgaaaaaa aaaatggttt gtttggtaat 720
ttgattgctt tgtctttggg tttgactcca aattttaaat ctaattttga tttggctgaa 780
gatgctaaat tgcaattgtc taaagatact tatgatgatg atttggataa tttgttggct 840
caaattggtg atcaatatgc tgatttgttt ttggctgcta aaaatttgtc tgatgctatt 900
ttgttgtctg atattttgag agttaatact gaaattacta aagctccatt gtctgcttct 960
atgattaaaa gatatgatga acatcatcaa gatttgactt tgttgaaagc tttggttaga 1020
caacaattgc cagaaaaata taaagaaatt ttttttgatc aatctaaaaa tggttatgct 1080
ggttatattg atggtggtgc ttctcaagaa gaattttata aatttattaa accaattttg 1140
gaaaaaatgg atggtactga agaattgttg gttaaattga atagagaaga tttgttgaga 1200
aaacaaagaa cttttgataa tggttctatt ccacatcaaa ttcatttggg tgaattgcat 1260
gctattttga gaagacaaga agatttttat ccatttttga aagataatag agaaaaaatt 1320
gaaaaaattt tgacttttag aattccatat tatgttggtc cattggctag aggtaattct 1380
agatttgctt ggatgactag aaaatctgaa gaaactatta ctccatggaa ttttgaagaa 1440
gttgttgata aaggtgcttc tgctcaatct tttattgaaa gaatgactaa ttttgataaa 1500
aatttgccaa atgaaaaagt tttgccaaaa cattctttgt tgtatgaata ttttactgtt 1560
tataatgaat tgactaaagt taaatatgtt actgaaggta tgagaaaacc agcttttttg 1620
tctggtgaac aaaaaaaagc tattgttgat ttgttgttta aaactaatag aaaagttact 1680
gttaaacaat tgaaagaaga ttattttaaa aaaattgaat gttttgattc tgttgaaatt 1740
tctggtgttg aagatagatt taatgcttct ttgggtactt atcatgattt gttgaaaatt 1800
attaaagata aagatttttt ggataatgaa gaaaatgaag atattttgga agatattgtt 1860
ttgactttga ctttgtttga agatagagaa atgattgaag aaagattgaa aacttatgct 1920
catttgtttg atgataaagt tatgaaacaa ttgaaaagaa gaagatatac tggttggggt 1980
agattgtcta gaaaattgat taatggtatt agagataaac aatctggtaa aactattttg 2040
gattttttga aatctgatgg ttttgctaat agaaatttta tgcaattgat tcatgatgat 2100
tctttgactt ttaaagaaga tattcaaaaa gctcaagttt ctggtcaagg tgattctttg 2160
catgaacata ttgctaattt ggctggttct ccagctatta aaaaaggtat tttgcaaact 2220
gttaaagttg ttgatgaatt ggttaaagtt atgggtagac ataaaccaga aaatattgtt 2280
attgaaatgg ctagagaaaa tcaaactact caaaaaggtc aaaaaaattc tagagaaaga 2340
atgaaaagaa ttgaagaagg tattaaagaa ttgggttctc aaattttgaa agaacatcca 2400
gttgaaaata ctcaattgca aaatgaaaaa ttgtatttgt attatttgca aaatggtaga 2460
gatatgtatg ttgatcaaga attggatatt aatagattgt ctgattatga tgttgatcat 2520
attgttccac aatctttttt gaaagatgat tctattgata ataaagtttt gactagatct 2580
gataaaaata gaggtaaatc tgataatgtt ccatctgaag aagttgttaa aaaaatgaaa 2640
aattattgga gacaattgtt gaatgctaaa ttgattactc aaagaaaatt tgataatttg 2700
actaaagctg aaagaggtgg tttgtctgaa ttggataaag ctggttttat taaaagacaa 2760
ttggttgaaa ctagacaaat tactaaacat gttgctcaaa ttttggattc tagaatgaat 2820
actaaatatg atgaaaatga taaattgatt agagaagtta aagttattac tttgaaatct 2880
aaattggttt ctgattttag aaaagatttt caattttata aagttagaga aattaataat 2940
tatcatcatg ctcatgatgc ttatttgaat gctgttgttg gtactgcttt gattaaaaaa 3000
tatccaaaat tggaatctga atttgtttat ggtgattata aagtttatga tgttagaaaa 3060
atgattgcta aatctgaaca agaaattggt aaagctactg ctaaatattt tttttattct 3120
aatattatga atttttttaa aactgaaatt actttggcta atggtgaaat tagaaaaaga 3180
ccattgattg aaactaatgg tgaaactggt gaaattgttt gggataaagg tagagatttt 3240
gctactgtta gaaaagtttt gtctatgcca caagttaata ttgttaaaaa aactgaagtt 3300
caaactggtg gtttttctaa agaatctatt ttgccaaaaa gaaattctga taaattgatt 3360
gctagaaaaa aagattggga tccaaaaaaa tatggtggtt ttgattctcc aactgttgct 3420
tattctgttt tggttgttgc taaagttgaa aaaggtaaat ctaaaaaatt gaaatctgtt 3480
aaagaattgt tgggtattac tattatggaa agatcttctt ttgaaaaaaa tccaattgat 3540
tttttggaag ctaaaggtta taaagaagtt aaaaaagatt tgattattaa attgccaaaa 3600
tattctttgt ttgaattgga aaatggtaga aaaagaatgt tggcttctgc tggtgaattg 3660
caaaaaggta atgaattggc tttgccatct aaatatgtta attttttgta tttggcttct 3720
cattatgaaa aattgaaagg ttctccagaa gataatgaac aaaaacaatt gtttgttgaa 3780
caacataaac attatttgga tgaaattatt gaacaaattt ctgaattttc taaaagagtt 3840
attttggctg atgctaattt ggataaagtt ttgtctgctt ataataaaca tagagataaa 3900
ccaattagag aacaagctga aaatattatt catttgttta ctttgactaa tttgggtgct 3960
ccagctgctt ttaaatattt tgatactact attgatagaa aaagatatac ttctactaaa 4020
gaagttttgg atgctacttt gattcatcaa tctattactg gtttgtatga aactagaatt 4080
gatttgtctc aattgggtgg tgattctaga gctgatccaa aaaaaaaaag aaaagtttaa 4140
<210> 2
<211> 1379
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas9 yeast protein
<400> 2
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys
1365 1370 1375
Arg Lys Val
<210> 3
<211> 4140
<212> DNA
<213> Artificial Sequence
<220>
<223> Cas9 D10A H840A inactive
<400> 3
atggataaaa aatattctat tggtttggct attggtacta attctgttgg ttgggctgtt 60
attactgatg aatataaagt tccatctaaa aaatttaaag ttttgggtaa tactgataga 120
cattctatta aaaaaaattt gattggtgct ttgttgtttg attctggtga aactgctgaa 180
gctactagat tgaaaagaac tgctagaaga agatatacta gaagaaaaaa tagaatttgt 240
tatttgcaag aaattttttc taatgaaatg gctaaagttg atgattcttt ttttcataga 300
ttggaagaat cttttttggt tgaagaagat aaaaaacatg aaagacatcc aatttttggt 360
aatattgttg atgaagttgc ttatcatgaa aaatatccaa ctatttatca tttgagaaaa 420
aaattggttg attctactga taaagctgat ttgagattga tttatttggc tttggctcat 480
atgattaaat ttagaggtca ttttttgatt gaaggtgatt tgaatccaga taattctgat 540
gttgataaat tgtttattca attggttcaa acttataatc aattgtttga agaaaatcca 600
attaatgctt ctggtgttga tgctaaagct attttgtctg ctagattgtc taaatctaga 660
agattggaaa atttgattgc tcaattgcca ggtgaaaaaa aaaatggttt gtttggtaat 720
ttgattgctt tgtctttggg tttgactcca aattttaaat ctaattttga tttggctgaa 780
gatgctaaat tgcaattgtc taaagatact tatgatgatg atttggataa tttgttggct 840
caaattggtg atcaatatgc tgatttgttt ttggctgcta aaaatttgtc tgatgctatt 900
ttgttgtctg atattttgag agttaatact gaaattacta aagctccatt gtctgcttct 960
atgattaaaa gatatgatga acatcatcaa gatttgactt tgttgaaagc tttggttaga 1020
caacaattgc cagaaaaata taaagaaatt ttttttgatc aatctaaaaa tggttatgct 1080
ggttatattg atggtggtgc ttctcaagaa gaattttata aatttattaa accaattttg 1140
gaaaaaatgg atggtactga agaattgttg gttaaattga atagagaaga tttgttgaga 1200
aaacaaagaa cttttgataa tggttctatt ccacatcaaa ttcatttggg tgaattgcat 1260
gctattttga gaagacaaga agatttttat ccatttttga aagataatag agaaaaaatt 1320
gaaaaaattt tgacttttag aattccatat tatgttggtc cattggctag aggtaattct 1380
agatttgctt ggatgactag aaaatctgaa gaaactatta ctccatggaa ttttgaagaa 1440
gttgttgata aaggtgcttc tgctcaatct tttattgaaa gaatgactaa ttttgataaa 1500
aatttgccaa atgaaaaagt tttgccaaaa cattctttgt tgtatgaata ttttactgtt 1560
tataatgaat tgactaaagt taaatatgtt actgaaggta tgagaaaacc agcttttttg 1620
tctggtgaac aaaaaaaagc tattgttgat ttgttgttta aaactaatag aaaagttact 1680
gttaaacaat tgaaagaaga ttattttaaa aaaattgaat gttttgattc tgttgaaatt 1740
tctggtgttg aagatagatt taatgcttct ttgggtactt atcatgattt gttgaaaatt 1800
attaaagata aagatttttt ggataatgaa gaaaatgaag atattttgga agatattgtt 1860
ttgactttga ctttgtttga agatagagaa atgattgaag aaagattgaa aacttatgct 1920
catttgtttg atgataaagt tatgaaacaa ttgaaaagaa gaagatatac tggttggggt 1980
agattgtcta gaaaattgat taatggtatt agagataaac aatctggtaa aactattttg 2040
gattttttga aatctgatgg ttttgctaat agaaatttta tgcaattgat tcatgatgat 2100
tctttgactt ttaaagaaga tattcaaaaa gctcaagttt ctggtcaagg tgattctttg 2160
catgaacata ttgctaattt ggctggttct ccagctatta aaaaaggtat tttgcaaact 2220
gttaaagttg ttgatgaatt ggttaaagtt atgggtagac ataaaccaga aaatattgtt 2280
attgaaatgg ctagagaaaa tcaaactact caaaaaggtc aaaaaaattc tagagaaaga 2340
atgaaaagaa ttgaagaagg tattaaagaa ttgggttctc aaattttgaa agaacatcca 2400
gttgaaaata ctcaattgca aaatgaaaaa ttgtatttgt attatttgca aaatggtaga 2460
gatatgtatg ttgatcaaga attggatatt aatagattgt ctgattatga tgttgatgct 2520
attgttccac aatctttttt gaaagatgat tctattgata ataaagtttt gactagatct 2580
gataaaaata gaggtaaatc tgataatgtt ccatctgaag aagttgttaa aaaaatgaaa 2640
aattattgga gacaattgtt gaatgctaaa ttgattactc aaagaaaatt tgataatttg 2700
actaaagctg aaagaggtgg tttgtctgaa ttggataaag ctggttttat taaaagacaa 2760
ttggttgaaa ctagacaaat tactaaacat gttgctcaaa ttttggattc tagaatgaat 2820
actaaatatg atgaaaatga taaattgatt agagaagtta aagttattac tttgaaatct 2880
aaattggttt ctgattttag aaaagatttt caattttata aagttagaga aattaataat 2940
tatcatcatg ctcatgatgc ttatttgaat gctgttgttg gtactgcttt gattaaaaaa 3000
tatccaaaat tggaatctga atttgtttat ggtgattata aagtttatga tgttagaaaa 3060
atgattgcta aatctgaaca agaaattggt aaagctactg ctaaatattt tttttattct 3120
aatattatga atttttttaa aactgaaatt actttggcta atggtgaaat tagaaaaaga 3180
ccattgattg aaactaatgg tgaaactggt gaaattgttt gggataaagg tagagatttt 3240
gctactgtta gaaaagtttt gtctatgcca caagttaata ttgttaaaaa aactgaagtt 3300
caaactggtg gtttttctaa agaatctatt ttgccaaaaa gaaattctga taaattgatt 3360
gctagaaaaa aagattggga tccaaaaaaa tatggtggtt ttgattctcc aactgttgct 3420
tattctgttt tggttgttgc taaagttgaa aaaggtaaat ctaaaaaatt gaaatctgtt 3480
aaagaattgt tgggtattac tattatggaa agatcttctt ttgaaaaaaa tccaattgat 3540
tttttggaag ctaaaggtta taaagaagtt aaaaaagatt tgattattaa attgccaaaa 3600
tattctttgt ttgaattgga aaatggtaga aaaagaatgt tggcttctgc tggtgaattg 3660
caaaaaggta atgaattggc tttgccatct aaatatgtta attttttgta tttggcttct 3720
cattatgaaa aattgaaagg ttctccagaa gataatgaac aaaaacaatt gtttgttgaa 3780
caacataaac attatttgga tgaaattatt gaacaaattt ctgaattttc taaaagagtt 3840
attttggctg atgctaattt ggataaagtt ttgtctgctt ataataaaca tagagataaa 3900
ccaattagag aacaagctga aaatattatt catttgttta ctttgactaa tttgggtgct 3960
ccagctgctt ttaaatattt tgatactact attgatagaa aaagatatac ttctactaaa 4020
gaagttttgg atgctacttt gattcatcaa tctattactg gtttgtatga aactagaatt 4080
gatttgtctc aattgggtgg tgattctaga gctgatccaa aaaaaaaaag aaaagtttaa 4140
<210> 4
<211> 1379
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas9 D10A H840A inactive protein
<400> 4
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys
1365 1370 1375
Arg Lys Val
<210> 5
<211> 4155
<212> DNA
<213> Artificial Sequence
<220>
<223> Cas9 rice
<400> 5
atggacaaga agtatagtat tggtctggac attgggacga attccgttgg ctgggccgtg 60
atcaccgatg agtacaaggt cccttccaag aagtttaagg ttctggggaa caccgatcgg 120
cacagcatca agaagaatct cattggagcc ctcctgttcg actcaggcga gaccgccgaa 180
gcaacaaggc tcaagagaac cgcaaggaga cggtatacaa gaaggaagaa taggatctgc 240
tacctgcagg agattttcag caacgaaatg gcgaaggtgg acgattcgtt ctttcataga 300
ttggaggaga gtttcctcgt cgaggaagat aagaagcacg agaggcatcc tatctttggc 360
aacattgtcg acgaggttgc ctatcacgaa aagtacccca caatctatca tctgcggaag 420
aagcttgtgg actcgactga taaggcggac cttagattga tctacctcgc tctggcacac 480
atgattaagt tcaggggcca ttttctgatc gagggggatc ttaacccgga caatagcgat 540
gtggacaagt tgttcatcca gctcgtccaa acctacaatc agctctttga ggaaaaccca 600
attaatgctt caggcgtcga cgccaaggcg atcctgtctg cacgcctttc aaagtctcgc 660
cggcttgaga acttgatcgc tcaactcccg ggcgaaaaga agaacggctt gttcgggaat 720
ctcattgcac tttcgttggg gctcacacca aacttcaaga gtaattttga tctcgctgag 780
gacgcaaagc tgcagctttc caaggacact tatgacgatg acctggataa ccttttggcc 840
caaatcggcg atcagtacgc ggacttgttc ctcgccgcga agaatttgtc ggacgcgatc 900
ctcctgagtg atattctccg cgtgaacacc gagattacaa aggccccgct ctcggcgagt 960
atgatcaagc gctatgacga gcaccatcag gatctgaccc ttttgaaggc tttggtccgg 1020
cagcaactcc cagagaagta caaggaaatc ttctttgatc aatccaagaa cggctacgct 1080
ggttatattg acggcggggc atcgcaggag gaattctaca agtttatcaa gccaattctg 1140
gagaagatgg atggcacaga ggaactcctg gtgaagctca atagggagga ccttttgcgg 1200
aagcaaagaa ctttcgataa cggcagcatc cctcaccaga ttcatctcgg ggagctgcac 1260
gccatcctga gaaggcagga agacttctac ccctttctta aggataaccg ggagaagatc 1320
gaaaagattc tgacgttcag aattccgtac tatgtcggac cactcgcccg gggtaattcc 1380
agatttgcgt ggatgaccag aaagagcgag gaaaccatca caccttggaa cttcgaggaa 1440
gtggtcgata agggcgcttc cgcacagagc ttcattgagc gcatgacaaa ttttgacaag 1500
aacctgccta atgagaaggt ccttcccaag cattccctcc tgtacgagta tttcactgtt 1560
tataacgaac tcacgaaggt gaagtatgtg accgagggaa tgcgcaagcc cgccttcctg 1620
agcggcgagc aaaagaaggc gatcgtggac cttttgttta agaccaatcg gaaggtcaca 1680
gttaagcagc tcaaggagga ctacttcaag aagattgaat gcttcgattc cgttgagatc 1740
agcggcgtgg aagacaggtt taacgcgtca ctggggactt accacgatct cctgaagatc 1800
attaaggata aggacttctt ggacaacgag gaaaatgagg atatcctcga agacattgtc 1860
ctgactctta cgttgtttga ggatagggaa atgatcgagg aacgcttgaa gacgtatgcc 1920
catctcttcg atgacaaggt tatgaagcag ctcaagagaa gaagatacac cggatgggga 1980
aggctgtccc gcaagcttat caatggcatt agagacaagc aatcagggaa gacaatcctt 2040
gactttttga agtctgatgg cttcgcgaac aggaatttta tgcagctgat tcacgatgac 2100
tcacttactt tcaaggagga tatccagaag gctcaagtgt cgggacaagg tgacagtctg 2160
cacgagcata tcgccaacct tgcgggatct cctgcaatca agaagggtat tctgcagaca 2220
gtcaaggttg tggatgagct tgtgaaggtc atgggacggc ataagcccga gaacatcgtt 2280
attgagatgg ccagagaaaa tcagaccaca caaaagggtc agaagaactc gagggagcgc 2340
atgaagcgca tcgaggaagg cattaaggag ctggggagtc agatccttaa ggagcacccg 2400
gtggaaaaca cgcagttgca aaatgagaag ctctatctgt actatctgca aaatggcagg 2460
gatatgtatg tggaccagga gttggatatt aaccgcctct cggattacga cgtcgatcat 2520
atcgttcctc agtccttcct taaggatgac agcattgaca ataaggttct caccaggtcc 2580
gacaagaacc gcgggaagtc cgataatgtg cccagcgagg aagtcgttaa gaagatgaag 2640
aactactgga ggcaactttt gaatgccaag ttgatcacac agaggaagtt tgataacctc 2700
actaaggccg agcgcggagg tctcagcgaa ctggacaagg cgggcttcat taagcggcaa 2760
ctggttgaga ctagacagat cacgaagcac gtggcgcaga ttctcgattc acgcatgaac 2820
acgaagtacg atgagaatga caagctgatc cgggaagtga aggtcatcac cttgaagtca 2880
aagctcgttt ctgacttcag gaaggatttc caattttata aggtgcgcga gatcaacaat 2940
tatcaccatg ctcatgacgc atacctcaac gctgtggtcg gaacagcatt gattaagaag 3000
tacccgaagc tcgagtccga attcgtgtac ggtgactata aggtttacga tgtgcgcaag 3060
atgatcgcca agtcagagca ggaaattggc aaggccactg cgaagtattt cttttactct 3120
aacattatga atttctttaa gactgagatc acgctggcta atggcgaaat ccggaagaga 3180
ccacttattg agaccaacgg cgagacaggg gaaatcgtgt gggacaaggg gagggatttc 3240
gccacagtcc gcaaggttct ctctatgcct caagtgaata ttgtcaagaa gactgaagtc 3300
cagacgggcg ggttctcaaa ggaatctatt ctgcccaagc ggaactcgga taagcttatc 3360
gccagaaaga aggactggga cccgaagaag tatggaggtt tcgactcacc aacggtggct 3420
tactctgtcc tggttgtggc aaaggtggag aagggaaagt caaagaagct caagtctgtc 3480
aaggagctcc tgggtatcac cattatggag aggtccagct tcgaaaagaa tccgatcgat 3540
tttctcgagg cgaagggata taaggaagtg aagaaggacc tgatcattaa gcttccaaag 3600
tacagtcttt tcgagttgga aaacggcagg aagcgcatgt tggcttccgc aggagagctc 3660
cagaagggta acgagcttgc tttgccgtcc aagtatgtga acttcctcta tctggcatcc 3720
cactacgaga agctcaaggg cagcccagag gataacgaac agaagcaact gtttgtggag 3780
caacacaagc attatcttga cgagatcatt gaacagattt cggagttcag taagcgcgtc 3840
atcctcgccg acgcgaattt ggataaggtt ctctcagcct acaacaagca ccgggacaag 3900
cctatcagag agcaggcgga aaatatcatt catctcttca ccctgacaaa ccttggggct 3960
cccgctgcat tcaagtattt tgacactacg attgatcgga agagatacac ttctacgaag 4020
gaggtgctgg atgcaaccct tatccaccaa tcgattactg gcctctacga gacgcggatc 4080
gacttgagtc agctcggggg ggataagaga ccagcggcaa ccaagaaggc aggacaagcg 4140
aagaagaaga agtag 4155
<210> 6
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> SV40 Nuclear Localizaion Signal
<400> 6
cccaagaaga agcggaaggt ctcg 24
<210> 7
<211> 957
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4
<400> 7
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120
tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180
ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240
ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300
aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360
acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420
caaagacagt tgactgtatc gccggaattt gtaatacgac tcactatagg gcgagccgcc 480
atcatggagg agcagaagct gatctcagag gaggacctgc atatggccat ggaggccgaa 540
ttcatggata aagcggaatt aattcccgag cctccaaaaa agaagagaaa ggtcgaattg 600
ggtaccgccg ccaattttaa tcaaagtggg aatattgctg atagctcatt gtccttcact 660
ttcactaaca gtagcaacgg tccgaacctc ataacaactc aaacaaattc tcaagcgctt 720
tcacaaccaa ttgcctcctc taacgttcat gataacttca tgaataatga aatcacggct 780
agtaaaattg atgatggtaa taattcaaaa ccactgtcac ctggttggac ggaccaaact 840
gcgtataacg cgtttggaat cactacaggg atgtttaata ccactacaat ggatgatgta 900
tataactatc tattcgatga tgaagatacc ccaccaaacc caaaaaaaga gatttaa 957
<210> 8
<211> 318
<212> PRT
<213> Artificial Sequence
<220>
<223> GAL4 protein
<400> 8
Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Arg Leu
1 5 10 15
Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys Leu
20 25 30
Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser Pro
35 40 45
Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg Leu
50 55 60
Glu Gln Leu Phe Leu Leu Ile Phe Pro Arg Glu Asp Leu Asp Met Ile
65 70 75 80
Leu Lys Met Asp Ser Leu Gln Asp Ile Lys Ala Leu Leu Thr Gly Leu
85 90 95
Phe Val Gln Asp Asn Val Asn Lys Asp Ala Val Thr Asp Arg Leu Ala
100 105 110
Ser Val Glu Thr Asp Met Pro Leu Thr Leu Arg Gln His Arg Ile Ser
115 120 125
Ala Thr Ser Ser Ser Glu Glu Ser Ser Asn Lys Gly Gln Arg Gln Leu
130 135 140
Thr Val Ser Pro Glu Phe Val Ile Arg Leu Thr Ile Gly Arg Ala Ala
145 150 155 160
Ile Met Glu Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu His Met Ala
165 170 175
Met Glu Ala Glu Phe Met Asp Lys Ala Glu Leu Ile Pro Glu Pro Pro
180 185 190
Lys Lys Lys Arg Lys Val Glu Leu Gly Thr Ala Ala Asn Phe Asn Gln
195 200 205
Ser Gly Asn Ile Ala Asp Ser Ser Leu Ser Phe Thr Phe Thr Asn Ser
210 215 220
Ser Asn Gly Pro Asn Leu Ile Thr Thr Gln Thr Asn Ser Gln Ala Leu
225 230 235 240
Ser Gln Pro Ile Ala Ser Ser Asn Val His Asp Asn Phe Met Asn Asn
245 250 255
Glu Ile Thr Ala Ser Lys Ile Asp Asp Gly Asn Asn Ser Lys Pro Leu
260 265 270
Ser Pro Gly Trp Thr Asp Gln Thr Ala Tyr Asn Ala Phe Gly Ile Thr
275 280 285
Thr Gly Met Phe Asn Thr Thr Thr Met Asp Asp Val Tyr Asn Tyr Leu
290 295 300
Phe Asp Asp Glu Asp Thr Pro Pro Asn Pro Lys Lys Glu Ile
305 310 315
<210> 9
<211> 958
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 1
<400> 9
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga actaactggg agtgtcgcta 120
ctctcccaaa accaaaaggt ctccgctgac tagggcacat ctgacagaag tggaatcaag 180
gctagaaaga ctggaacagc tatttctact gatttttcct cgagaagacc ttgacatgat 240
tttgaaaatg gattctttac aggatataaa agcattgtta acaggattat ttgtacaaga 300
taatgtgaat aaagatgccg tcacagatag attggcttca gtggagactg atatgcctct 360
aacattgaga cagcatagaa taagtgcgac atcatcatcg gaagagagta gtaacaaagg 420
tcaaagacag ttgactgtat cgccggaatt tgtaatacga ctcactatag ggcgagccgc 480
catcatggag gagcagaagc tgatctcaga ggaggacctg catatggcca tggaggccga 540
attcatggat aaagcggaat taattcccga gcctccaaaa aagaagagaa aggtcgaatt 600
gggtaccgcc gccaatttta atcaaagtgg gaatattgct gatagctcat tgtccttcac 660
tttcactaac agtagcaacg gtccgaacct cataacaact caaacaaatt ctcaagcgct 720
ttcacaacca attgcctcct ctaacgttca tgataacttc atgaataatg aaatcacggc 780
tagtaaaatt gatgatggta ataattcaaa accactgtca cctggttgga cggaccaaac 840
tgcgtataac gcgtttggaa tcactacagg gatgtttaat accactacaa tggatgatgt 900
atataactat ctattcgatg atgaagatac cccaccaaac ccaaaaaaag agatttaa 958
<210> 10
<211> 938
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 2
<400> 10
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga actaactgga accaaaaggt 120
ctccgctgac tagggcacat ctgacagaag tggaatcaag gctagaaaga ctggaacagc 180
tatttctact gatttttcct cgagaagacc ttgacatgat tttgaaaatg gattctttac 240
aggatataaa agcattgtta acaggattat ttgtacaaga taatgtgaat aaagatgccg 300
tcacagatag attggcttca gtggagactg atatgcctct aacattgaga cagcatagaa 360
taagtgcgac atcatcatcg gaagagagta gtaacaaagg tcaaagacag ttgactgtat 420
cgccggaatt tgtaatacga ctcactatag ggcgagccgc catcatggag gagcagaagc 480
tgatctcaga ggaggacctg catatggcca tggaggccga attcatggat aaagcggaat 540
taattcccga gcctccaaaa aagaagagaa aggtcgaatt gggtaccgcc gccaatttta 600
atcaaagtgg gaatattgct gatagctcat tgtccttcac tttcactaac agtagcaacg 660
gtccgaacct cataacaact caaacaaatt ctcaagcgct ttcacaacca attgcctcct 720
ctaacgttca tgataacttc atgaataatg aaatcacggc tagtaaaatt gatgatggta 780
ataattcaaa accactgtca cctggttgga cggaccaaac tgcgtataac gcgtttggaa 840
tcactacagg gatgtttaat accactacaa tggatgatgt atataactat ctattcgatg 900
atgaagatac cccaccaaac ccaaaaaaag agatttaa 938
<210> 11
<211> 920
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 3
<400> 11
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaacaagtg tctgaagaac taactggaag gtctccgctg actagggcac 120
atctgacaga agtggaatca aggctagaaa gactggaaca gctatttcta ctgatttttc 180
ctcgagaaga ccttgacatg attttgaaaa tggattcttt acaggatata aaagcattgt 240
taacaggatt atttgtacaa gataatgtga ataaagatgc cgtcacagat agattggctt 300
cagtggagac tgatatgcct ctaacattga gacagcatag aataagtgcg acatcatcat 360
cggaagagag tagtaacaaa ggtcaaagac agttgactgt atcgccggaa tttgtaatac 420
gactcactat agggcgagcc gccatcatgg aggagcagaa gctgatctca gaggaggacc 480
tgcatatggc catggaggcc gaattcatgg ataaagcgga attaattccc gagcctccaa 540
aaaagaagag aaaggtcgaa ttgggtaccg ccgccaattt taatcaaagt gggaatattg 600
ctgatagctc attgtccttc actttcacta acagtagcaa cggtccgaac ctcataacaa 660
ctcaaacaaa ttctcaagcg ctttcacaac caattgcctc ctctaacgtt catgataact 720
tcatgaataa tgaaatcacg gctagtaaaa ttgatgatgg taataattca aaaccactgt 780
cacctggttg gacggaccaa actgcgtata acgcgtttgg aatcactaca gggatgttta 840
ataccactac aatggatgat gtatataact atctattcga tgatgaagat accccaccaa 900
acccaaaaaa agagatttaa 920
<210> 12
<211> 560
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 4
<400> 12
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120
tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180
ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240
ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300
aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360
acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420
caaagacagt tgactgtata acgccggaac gcgtttggaa tcacttaaca gggatgttta 480
ataccactac aatggatgat gtatataact atctattcga tgatgaagat accccaccaa 540
acccaaaaaa agagatttaa 560
<210> 13
<211> 708
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 5
<400> 13
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120
tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180
ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240
ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300
aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360
acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420
caaagacagt tgactgtatc gccggaattt gtaatacgac tcactatagg gcgagccgcc 480
atcatggagg agcagaagct gatctcagag gaggacctgc atatggccat ggaggccgaa 540
ttcatgtgat aaagcggaat taattcccca cctggttgga cggaccaaac tgcgtataac 600
gcgtttggaa tcactacagg gatgtttaat accactacaa tggatgatgt atataactat 660
ctattcgatg atgaagatac cccaccaaac ccaaaaaaag agatttaa 708
<210> 14
<211> 240
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 6
<400> 14
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga actaactgga ctgcgtccaa 120
actgcgtata acgcgtttgg aatcactaca gggatgttta ataccactac aatggatgat 180
gtatataact atctattcga tgatgaagat accccaccaa acccaaaaaa agagatttaa 240
<210> 15
<211> 356
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 7
<400> 15
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120
tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180
ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgactgattt 240
tgtataacgc gtttggaatc actacaggga tgtttaatac cactacaatg gatgatgtat 300
ataactatct attcgatgat gaagataccc caccaaaccc aaaaaaagag atttaa 356
<210> 16
<211> 268
<212> DNA
<213> Saccharomyces cerevisiae
<220>
<223> SNR52 promoter
<400> 16
ctttgaaaag ataatgtatg attatgcttt cactcatatt tatacagaaa cttgatgttt 60
tctttcgagt atatacaagg tgattacatg tacgtttgaa gtacaactct agattttgta 120
gtgccctctt gggctagcgg taaaggtgcg cattttttca caccctacaa tgttctgttc 180
aaaagatttt ggtcaaacgc tgtagaagtg aaagttggtg cgcatgtttc ggcgttcgaa 240
acttctccgc agtgaaagat aaatgatc 268
<210> 17
<211> 20
<212> DNA
<213> Saccharomyces cerevisiae
<220>
<223> SUP4 terminator
<400> 17
tttttttgtt ttttatgtct 20
<210> 18
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> scaffold guide RNA Cas9
<400> 18
ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg 60
gcaccgagtc ggtgc 75
<210> 19
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 1
<400> 19
caagtgtctg aagaactaac 20
<210> 20
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 2
<400> 20
gacagttgac tgtataacgc 20
<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 3
<400> 21
gcgtttggaa tcacttaaca 20
<210> 22
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 4
<400> 22
gcatatggcc atggaggccg 20
<210> 23
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 5
<400> 23
acgcgtttgg aatcactaca 20
<210> 24
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 6
<400> 24
atggtctcaa aacccttggt 20
<210> 25
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 7
<400> 25
acacgcttac tgcctgacta 20
<210> 26
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 1
<400> 26
cctcgagaag accttgacat gattttgaaa atggattctt taca 44
<210> 27
<211> 108
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 2
<400> 27
aaagactgga acagctattt ctactgattt ttcctcgaga agaccttgac atgattttga 60
aaatggattc tttacaggat ataaaagcat tgttaacagg attatttg 108
<210> 28
<211> 520
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 3
<400> 28
tcatcatcgg aagagagtag taacaaaggt caaagacagt tgactgtatc gccggaattt 60
gtaatacgac tcactatagg gcgagccgcc atcatggagg agcagaagct gatctcagag 120
gaggacctgc atatggccat ggaggccgaa ttcatggata aagcggaatt aattcccgag 180
cctccaaaaa agaagagaaa ggtcgaattg ggtaccgccg ccaattttaa tcaaagtggg 240
aatattgctg atagctcatt gtccttcact ttcactaaca gtagcaacgg tccgaacctc 300
ataacaactc aaacaaattc tcaagcgctt tcacaaccaa ttgcctcctc taacgttcat 360
gataacttca tgaataatga aatcacggct agtaaaattg atgatggtaa taattcaaaa 420
ccactgtcac ctggttggac ggaccaaact gcgtataacg cgtttggaat cactacaggg 480
atgtttaata ccactacaat ggatgatgta tataactatc 520
<210> 29
<211> 635
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 4
<400> 29
cagatagatt ggcttcagtg gagactgata tgcctctaac attgagacag catagaataa 60
gtgcgacatc atcatcggaa gagagtagta acaaaggtca aagacagttg actgtatcgc 120
cggaatttgt aatacgactc actatagggc gagccgccat catggaggag cagaagctga 180
tctcagagga ggacctgcat atggccatgg aggccgaatt catggataaa gcggaattaa 240
ttcccgagcc tccaaaaaag aagagaaagg tcgaattggg taccgccgcc aattttaatc 300
aaagtgggaa tattgctgat agctcattgt ccttcacttt cactaacagt agcaacggtc 360
cgaacctcat aacaactcaa acaaattctc aagcgctttc acaaccaatt gcctcctcta 420
acgttcatga taacttcatg aataatgaaa tcacggctag taaaattgat gatggtaata 480
attcaaaacc actgtcacct ggttggacgg accaaactgc gtataacgcg tttggaatca 540
ctacagggat gtttaatacc actacaatgg atgatgtata taactatcta ttcgatgatg 600
aagatacccc accaaaccca aaaaaagaga tttaa 635
<210> 30
<211> 957
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 5
<400> 30
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120
tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180
ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240
ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300
aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360
acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420
caaagacagt tgactgtatc gccggaattt gtaatacgac tcactatagg gcgagccgcc 480
atcatggagg agcagaagct gatctcagag gaggacctgc atatggccat ggaggccgaa 540
ttcatggata aagcggaatt aattcccgag cctccaaaaa agaagagaaa ggtcgaattg 600
ggtaccgccg ccaattttaa tcaaagtggg aatattgctg atagctcatt gtccttcact 660
ttcactaaca gtagcaacgg tccgaacctc ataacaactc aaacaaattc tcaagcgctt 720
tcacaaccaa ttgcctcctc taacgttcat gataacttca tgaataatga aatcacggct 780
agtaaaattg atgatggtaa taattcaaaa ccactgtcac ctggttggac ggaccaaact 840
gcgtataacg cgtttggaat cactacaggg atgtttaata ccactacaat ggatgatgta 900
tataactatc tattcgatga tgaagatacc ccaccaaacc caaaaaaaga gatttaa 957
<210> 31
<211> 4155
<212> DNA
<213> Artificial Sequence
<220>
<223> Cas9 rice codon-optimized
<400> 31
atggacaaga agtatagtat tggtctggac attgggacga attccgttgg ctgggccgtg 60
atcaccgatg agtacaaggt cccttccaag aagtttaagg ttctggggaa caccgatcgg 120
cacagcatca agaagaatct cattggagcc ctcctgttcg actcaggcga gaccgccgaa 180
gcaacaaggc tcaagagaac cgcaaggaga cggtatacaa gaaggaagaa taggatctgc 240
tacctgcagg agattttcag caacgaaatg gcgaaggtgg acgattcgtt ctttcataga 300
ttggaggaga gtttcctcgt cgaggaagat aagaagcacg agaggcatcc tatctttggc 360
aacattgtcg acgaggttgc ctatcacgaa aagtacccca caatctatca tctgcggaag 420
aagcttgtgg actcgactga taaggcggac cttagattga tctacctcgc tctggcacac 480
atgattaagt tcaggggcca ttttctgatc gagggggatc ttaacccgga caatagcgat 540
gtggacaagt tgttcatcca gctcgtccaa acctacaatc agctctttga ggaaaaccca 600
attaatgctt caggcgtcga cgccaaggcg atcctgtctg cacgcctttc aaagtctcgc 660
cggcttgaga acttgatcgc tcaactcccg ggcgaaaaga agaacggctt gttcgggaat 720
ctcattgcac tttcgttggg gctcacacca aacttcaaga gtaattttga tctcgctgag 780
gacgcaaagc tgcagctttc caaggacact tatgacgatg acctggataa ccttttggcc 840
caaatcggcg atcagtacgc ggacttgttc ctcgccgcga agaatttgtc ggacgcgatc 900
ctcctgagtg atattctccg cgtgaacacc gagattacaa aggccccgct ctcggcgagt 960
atgatcaagc gctatgacga gcaccatcag gatctgaccc ttttgaaggc tttggtccgg 1020
cagcaactcc cagagaagta caaggaaatc ttctttgatc aatccaagaa cggctacgct 1080
ggttatattg acggcggggc atcgcaggag gaattctaca agtttatcaa gccaattctg 1140
gagaagatgg atggcacaga ggaactcctg gtgaagctca atagggagga ccttttgcgg 1200
aagcaaagaa ctttcgataa cggcagcatc cctcaccaga ttcatctcgg ggagctgcac 1260
gccatcctga gaaggcagga agacttctac ccctttctta aggataaccg ggagaagatc 1320
gaaaagattc tgacgttcag aattccgtac tatgtcggac cactcgcccg gggtaattcc 1380
agatttgcgt ggatgaccag aaagagcgag gaaaccatca caccttggaa cttcgaggaa 1440
gtggtcgata agggcgcttc cgcacagagc ttcattgagc gcatgacaaa ttttgacaag 1500
aacctgccta atgagaaggt ccttcccaag cattccctcc tgtacgagta tttcactgtt 1560
tataacgaac tcacgaaggt gaagtatgtg accgagggaa tgcgcaagcc cgccttcctg 1620
agcggcgagc aaaagaaggc gatcgtggac cttttgttta agaccaatcg gaaggtcaca 1680
gttaagcagc tcaaggagga ctacttcaag aagattgaat gcttcgattc cgttgagatc 1740
agcggcgtgg aagacaggtt taacgcgtca ctggggactt accacgatct cctgaagatc 1800
attaaggata aggacttctt ggacaacgag gaaaatgagg atatcctcga agacattgtc 1860
ctgactctta cgttgtttga ggatagggaa atgatcgagg aacgcttgaa gacgtatgcc 1920
catctcttcg atgacaaggt tatgaagcag ctcaagagaa gaagatacac cggatgggga 1980
aggctgtccc gcaagcttat caatggcatt agagacaagc aatcagggaa gacaatcctt 2040
gactttttga agtctgatgg cttcgcgaac aggaatttta tgcagctgat tcacgatgac 2100
tcacttactt tcaaggagga tatccagaag gctcaagtgt cgggacaagg tgacagtctg 2160
cacgagcata tcgccaacct tgcgggatct cctgcaatca agaagggtat tctgcagaca 2220
gtcaaggttg tggatgagct tgtgaaggtc atgggacggc ataagcccga gaacatcgtt 2280
attgagatgg ccagagaaaa tcagaccaca caaaagggtc agaagaactc gagggagcgc 2340
atgaagcgca tcgaggaagg cattaaggag ctggggagtc agatccttaa ggagcacccg 2400
gtggaaaaca cgcagttgca aaatgagaag ctctatctgt actatctgca aaatggcagg 2460
gatatgtatg tggaccagga gttggatatt aaccgcctct cggattacga cgtcgatcat 2520
atcgttcctc agtccttcct taaggatgac agcattgaca ataaggttct caccaggtcc 2580
gacaagaacc gcgggaagtc cgataatgtg cccagcgagg aagtcgttaa gaagatgaag 2640
aactactgga ggcaactttt gaatgccaag ttgatcacac agaggaagtt tgataacctc 2700
actaaggccg agcgcggagg tctcagcgaa ctggacaagg cgggcttcat taagcggcaa 2760
ctggttgaga ctagacagat cacgaagcac gtggcgcaga ttctcgattc acgcatgaac 2820
acgaagtacg atgagaatga caagctgatc cgggaagtga aggtcatcac cttgaagtca 2880
aagctcgttt ctgacttcag gaaggatttc caattttata aggtgcgcga gatcaacaat 2940
tatcaccatg ctcatgacgc atacctcaac gctgtggtcg gaacagcatt gattaagaag 3000
tacccgaagc tcgagtccga attcgtgtac ggtgactata aggtttacga tgtgcgcaag 3060
atgatcgcca agtcagagca ggaaattggc aaggccactg cgaagtattt cttttactct 3120
aacattatga atttctttaa gactgagatc acgctggcta atggcgaaat ccggaagaga 3180
ccacttattg agaccaacgg cgagacaggg gaaatcgtgt gggacaaggg gagggatttc 3240
gccacagtcc gcaaggttct ctctatgcct caagtgaata ttgtcaagaa gactgaagtc 3300
cagacgggcg ggttctcaaa ggaatctatt ctgcccaagc ggaactcgga taagcttatc 3360
gccagaaaga aggactggga cccgaagaag tatggaggtt tcgactcacc aacggtggct 3420
tactctgtcc tggttgtggc aaaggtggag aagggaaagt caaagaagct caagtctgtc 3480
aaggagctcc tgggtatcac cattatggag aggtccagct tcgaaaagaa tccgatcgat 3540
tttctcgagg cgaagggata taaggaagtg aagaaggacc tgatcattaa gcttccaaag 3600
tacagtcttt tcgagttgga aaacggcagg aagcgcatgt tggcttccgc aggagagctc 3660
cagaagggta acgagcttgc tttgccgtcc aagtatgtga acttcctcta tctggcatcc 3720
cactacgaga agctcaaggg cagcccagag gataacgaac agaagcaact gtttgtggag 3780
caacacaagc attatcttga cgagatcatt gaacagattt cggagttcag taagcgcgtc 3840
atcctcgccg acgcgaattt ggataaggtt ctctcagcct acaacaagca ccgggacaag 3900
cctatcagag agcaggcgga aaatatcatt catctcttca ccctgacaaa ccttggggct 3960
cccgctgcat tcaagtattt tgacactacg attgatcgga agagatacac ttctacgaag 4020
gaggtgctgg atgcaaccct tatccaccaa tcgattactg gcctctacga gacgcggatc 4080
gacttgagtc agctcggggg ggataagaga ccagcggcaa ccaagaaggc aggacaagcg 4140
aagaagaaga agtag 4155
<210> 32
<211> 1995
<212> DNA
<213> Zea mays
<220>
<223> maize Ubi promoter containing MubG1 intron
<400> 32
tgcagtgcag cgtgacccgg tcgtgcccct ctctagagat aatgagcatt gcatgtctaa 60
gttataaaaa attaccacat attttttttg tcacacttgt ttgaagtgca gtttatctat 120
ctttatacat atatttaaac tttactctac gaataatata atctatagta ctacaataat 180
atcagtgttt tagagaatca tataaatgaa cagttagaca tggtctaaag gacaattgag 240
tattttgaca acaggactct acagttttat ctttttagtg tgcatgtgtt ctcctttttt 300
tttgcaaata gcttcaccta tataatactt catccatttt attagtacat ccatttaggg 360
tttagggtta atggttttta tagactaatt tttttagtac atctatttta ttctatttta 420
gcctctaaat taagaaaact aaaactctat tttagttttt ttatttaata gtttagatat 480
aaaatagaat aaaataaagt gactaaaaat taaacaaata ccctttaaga aattaaaaaa 540
actaaggaaa catttttctt gtttcgagta gataatgcca gcctgttaaa cgccgtcgac 600
gagtctaacg gacaccaacc agcgaaccag cagcgtcgcg tcgggccaag cgaagcagac 660
ggcacggcat ctctgtcgct gcctctggac ccctctcgag agttccgctc caccgttgga 720
cttgctccgc tgtcggcatc cagaaattgc gtggcggagc ggcagacgtg agccggcacg 780
gcaggcggcc tcctcctcct ctcacggcac cggcagctac gggggattcc tttcccaccg 840
ctccttcgct ttcccttcct cgcccgccgt aataaataga caccccctcc acaccctctt 900
tccccaacct cgtgttgttc ggagcgcaca cacacacaac cagatctccc ccaaatccac 960
ccgtcggcac ctccgcttca aggtacgccg ctcgtcctcc cccccccccc cccctctcta 1020
ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat 1080
gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 1140
acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 1200
gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 1260
atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 1320
tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 1380
tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 1440
tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 1500
ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 1560
ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 1620
tagagtactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 1680
atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 1740
atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 1800
gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttatttcgat 1860
cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 1920
ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 1980
gtgttacttc tgcag 1995
<210> 33
<211> 294
<212> DNA
<213> Agrobacterium tumefaciens
<220>
<223> nopaline synthase terminator (tnos)
<400> 33
agcggccgcc cggctgcaga tcgttcaaac atttggcaat aaagtttctt aagattgaat 60
cctgttgccg gtcttgcgat gattatcata taatttctgt tgaattacgt taagcatgta 120
ataattaaca tgtaatgcat gacgttattt atgagatggg tttttatgat tagagtcccg 180
caattataca tttaatacgc gatagaaaac aaaatatagc gcgcaaacta ggataaatta 240
tcgcgcgcgg tgtcatctat gttactagat ccgatgataa gctgtcaaac atga 294
<210> 34
<211> 377
<212> DNA
<213> Oryza sativa
<220>
<223> RNA pol III promoter promoter from the rice U3 small nucle ar RNA
gene (OsU3)
<400> 34
aagggatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaggaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtggagtaa gataaactgt aggagaaaag catttcgtag tgggccatga 240
agcctttcag gacatgtatt gcagtatggg ccggcccatt acgcaattgg acgacaacaa 300
agactagtat tagtaccacc tcggctatcc acatagatca aagctggttt aaaagagttg 360
tgcagatgat ccgtggc 377
<210> 35
<211> 7787
<212> DNA
<213> Oryza sativa
<220>
<223> rice Protoporphyrinogen Oxidase (PPO2)
<400> 35
atgctctctc ctgccaccac cttctcctcc tcctcctcct cctcgtcgcc gtcgcgcgcc 60
cacgctcgcg ctcccacccg cttcgcggtc gcagcatccg cgcgcgccgc acggttccgc 120
cccgcgcgcg ccatggccgc ctccgacgac ccccgcggcg ggaggtccgt cgccgtcgtc 180
ggcgccggcg tcaggtgggt ggggagccgc gcgcgctctc cgtgggttca gttctgccct 240
aggtttgggg tgccgtgtgc gtgtgagtgg ggaggttgtt ttttttgatg attgatgaaa 300
tggttgcctc tctgcagtgg gctcgcggcg gcgtacaggc tgaggaagcg cggcgtgcag 360
gtgacggtgt tcgaggcggc cgacagggcg ggtgggaaga tacggaccaa ctccgagggc 420
gggttcatct gggacgaagg ggccaacacc atggtgagcg cgctttggtg tgcctcgctg 480
cttctgtttg atcacaatct cgggctgtgt tggtctgcat tgctgcaaat gctgcttctg 540
tatgttttgg attgtggcgc actggcgctg ctgcggctat ttgagggctg gagcacacta 600
gcgagtagtg ctccttggtg cgcaggctga ggaaacttgt gtttgtgaac gaaatgcaag 660
ctgctcacta atgcagacag ttgttcctgc aaatggagaa gtgttttctt ctgcattcgt 720
atcccacaac agacgtgaac cctttctgct atgagcatca ttgaacaccg ttatgtaact 780
tatcatagcc tgattcgatt tcattcacca tgatctataa ctattatact taccatatta 840
gttactttgt actactctta gtaaaataaa taaattattt taatactcca ctgacaaaat 900
aggttaagat tgtttcattg cttgggcaca tgtgcaatac tagtcgcatt ttttttacct 960
gcgtgcaaat cttatcatgc ctgcttgatt caatttgccg ttctctctgt aatttaatta 1020
ttttgcctcc agacagagag tgaattggag gcaagcaggc ttattgacga tcttggccta 1080
caaggcaaac agcagtatgt atgtgctaat gttatctgtg atggttaact gctttgaatg 1140
tcttctgttt cataatttac actgatatgt ttaatatttc gatatccttt agcctaactc 1200
acaacacaag cgttacattg tcaaagatgg agcaccaaca ctggtaaata gacttttcat 1260
gatatgatgc attttgtttt gttcttccta tagtatgcct cacttttgaa tatatttttt 1320
tgtcacataa gattccctca gatcccattg cgctcatgaa aagcactgtt ctttctacaa 1380
aatcaaaggt atgtaagtta ttgagtgcta attgctacaa catatcatga cctcctgacc 1440
tatttgcaac aagttgcttg ttgtttccac ttgtcactga tggattaaaa ttcactagtg 1500
tagaaacaat catattaaac tgatcaccgt gacttgattt acttgttttc agttcactat 1560
tacaaatttg tacatttcct gatctttcgt gttcaagctg tgtgatcgac tgattgcaac 1620
cgtcatatta tattactgta ttgagtttag taaaacatgg tcttatcttt gcagctcaag 1680
ctatttctgg aaccatttct ctatgagaaa tctagcagaa ggacctcggg aaaagtgtct 1740
gatgaacatt taagtgagag gtgagccttc atactgatgt tattttgagt tgttgtaaac 1800
ttgaaccact gataatatag ttatatgttt ttttcctgtg ttcttccttc attctcatgc 1860
ccttgtgaaa tacaaatata tacttcatat cacacactcc ctttggtcat ttttcatgtc 1920
aaacttttaa aactttgtac ataaaatcag ttcaatattt agattgaacg catgagaaag 1980
tattttcata atattatgat tttaccattt ttttcatata cgttgcaaca gaatttagtg 2040
gtcaaagcta cactttgaag accttattga tgtcaaaaac agcatgtttt ctgaccagag 2100
agaatacatt tgcagtgtga tttttctgtg tatatgtaga gataatcagg tttctctttt 2160
gcagtgttgc aagtttcttt gaacgccact ttggaaaaga ggcaagttca tttttaatga 2220
agaaatttat ggattgttaa gtgaatacaa tcaacacttt gcaacttaca tgcccattat 2280
aatcagtaga gggtaagaat ttataacttt attacaggtt gttgattatc ttattgatcc 2340
atttgtggct ggaacaagcg gaggagatcc tgagtcatta tcagtaagtt attataacat 2400
gtctcactat ttgcattttc catatcagca cctttgcatt tctacagtaa attgtagtca 2460
taattatttt tatgtaaatt gtgcgtataa acaacatatg tgcttgactt tgtgatgtgt 2520
tcttggggat gataactgat acggctagaa cttttggggg ctaatctcct tgagccgtat 2580
cagtaagtca taacaattct cattcataat gatcaaaaca tatcaccttc ttgtgtagaa 2640
ctgttctggt tttgagtaat attttcttct gtgcagattc gtcatgcatt tccagcatta 2700
tggaatttgg agaataagta agtttgtagt agtttgtttg gagaataagt aagtttgtag 2760
tttgtgcatt gatgttcatt caagatttac cttatcaata attcacttgt ccacgtccat 2820
atgctcgtgc tatatcctgt ccattcaaat gtcaacaccg ccatgtgaat ttactgcata 2880
gtgcatttta atgatttcat ttatccttgt tgcttgcatc tcttttttgg gctcctgctg 2940
ttagcttgtt tttggttcct gctgttacct atttcttttc tatcattttt tcattggaca 3000
gatggtgctc tcagtcctta ctgcttatta tttgttaacc tgatatgcac ctacttgaag 3060
ttaatgttat gatttttagt attttatagt catggtatca ttaatactta tttttggcaa 3120
tcgaaattaa aaaaacatga tgtcaaaata aaaaatcatg gcagttgaat gcagtgggta 3180
tatgtatcaa gaatttaaga tcttgaacat aagtccaatt gctatatgtt caattcgttg 3240
gagcataaca tgatctaatt tgtaagttaa atttatctga taaacgatgg aaggaaattc 3300
tggtaccact catgcaacta tacaagcttc aaaggcttct tacatgtgga ccattggacc 3360
tagaatagaa tctaaattta ttcataagta tataattttt tttccttcat gggccatgat 3420
agttaactat atgagcttgt agagtcaaaa taggcataat tgcttctttg ggtttccact 3480
taatttaccc tacaacactt ctattgcaat aaatatggtc aacaacattt ctttacggtc 3540
cgtttggttg gagggagttt ttaggaggga ttgggagttt agagggatgg agctattaac 3600
tgttttgttt ggttgggaga gatgggaatt ttggtgggat ggagatgggg aattgaggaa 3660
ggaactccct ccttttcaat acctgggtag ggggtggtaa ttgggaggga attcctcctt 3720
tactttgcct aaacaaatct cagccatccg ttttcattaa tgacctaatc tccaactaaa 3780
cttcctgtca atttccacca cctctgccaa acaagatatt gggattaaaa atcaaattcc 3840
catcttaatc tcaccatcaa ttccctcgtg taaactccca atccccttcc ctcaagttgc 3900
caaacaagcc attagtgccc agttatgttc tttggtcatc ttcttcataa tttgttgctc 3960
catgcacttt caatgctcac aggtatggct ctgtcattgc tggtgccatc ttgtccaaac 4020
tatccactaa gggtgattca gtgaagacag gaggtgcttc gccagggaaa ggaaggaata 4080
aacgtgtgtc attttcattt catggtggaa tgcaggtact ccacagatgt cctgtagttt 4140
cttttgtcag tgtcaaagat atcaaagaca gtgataaacc ctgaacttta gtttgagcaa 4200
ttctacatgc cactaaaaaa tgccgaattc atatgttgtg aattgaagac ctgttatttt 4260
cctgcaacta ggacatatgt ttagtcggtg aaacttcatt gctgctttaa gaagtcttac 4320
aggccagaga aaactgtctt gttttttttt tttttgattt gatgtcctgc tttatattta 4380
tgatccagcc aagcttatcc atccatctgc accctgatcc tgccataatc atttttttta 4440
tcagcctgac atgagcttat tatgttgcat aagttaggtt gaagctagat cgaacaaaaa 4500
actcaaagct actgataagt acaggatatg caacagaagt atcacacgag ccaaatctgc 4560
tataagaata aaacatacca agagccttag acaccactaa atagtgtgaa tggtagtgat 4620
agcgaataat ctcagaagat gacattttgg gaaatattat cgtgtagtat actttattaa 4680
ttgggagttg cgatacttgc cctgcacgct aaacatgctg aaaagtttca cagttatact 4740
acataacatc tgggtgtgta aaggttttat gttgttcatt gcttttcagt cactaataga 4800
tgcacttcac aatgaagttg gagatggtaa cgtgaagctt ggtacagaag tgttgtcatt 4860
ggcatgttgc tgtgatggag tctcttcttc tggtggttgg tcaatttctg ttgattcaaa 4920
agatgctaaa gggaaagatc tcagaaagaa ccaatctttc gatgctgtta taatgactgt 4980
aagaaaaaaa ttatctgtat tcatctcttt agaagcttga tcatttgaca gccacaaatt 5040
aaaatatttt accgtgtttt tctttttgcc cctttaggct ccattgtcta atgtccagag 5100
gatgaagttt acaaaaggtg gagttccctt tgtgctagac tttcttccta aggtcaggtt 5160
agaatcactc ttttagattt aacaaatgca gtgttgcact agcatgttct tgagaaattt 5220
gtgctggggg aaattcctct taatccttca aattgcattt aatttcatcc attaggtcga 5280
tggatccatg tcacagaaaa tattttgttt atcttctaga tttctattat atatgtaaga 5340
ctgtctctta gtttgtgaat ttacaggagt caatcatcac tcccttgaat ctgagcatat 5400
cagcagttca tcagcaatat ggtttatttg agaaggcaac ggaaactatt gtttccaaag 5460
gccacttgtt tgaaactttc accactgttt tgaacagtgt attaaagtaa cagtcatttg 5520
tatagcagca cctggtgatt tttaagtaaa ttttccattc ccaatcaaaa caagtaacat 5580
tatatgttga acatgtactg aattgaatat ggaactttat gctggagatg ccagacttta 5640
ttttactggc atgaatacac aattattgta acaatggtat tattgcttgg ttacttctcc 5700
gctgtgaaga catacctttc gtcacctttt cttgtttccc atattctgca ccttatggga 5760
ttgtcttcca catgttaaga tgccttgtag taccagttcc cctattattt gaatgtgttc 5820
ttccttagat atatgtgcat ttggaacgtg attggaaata caacagcaaa ctggtattgt 5880
tagctgcttg cctgccacag cctacatatg ctgccatatt acagaattat gagataggtg 5940
gactttgatt tctgtcataa tgattaacta acttgatata ctcaaactat gcagctccta 6000
gctggtatcc ttagaattta tcgagtatgc atagaagtct actcttaatc catatctatt 6060
tgatgtactc aaacttgaaa ctatgcagct cctagctggg ctccttagaa ttatcaagta 6120
tgcatagaaa tcttaatcca tatttattta ttatatgcag gtcgattatc taccactatc 6180
tctcatggta acagctttta agaaggaaga tgtcaaaaaa ccattggaag gatttggtgc 6240
cttgataccc tataaggaac agcaaaagca tggtctcaaa acccttggta ggttaattca 6300
gctttacact tatattttat ccagcttgta gctgcttata ttttgatttg cgaattaaaa 6360
attattaaaa cagccttgaa agaagaaacc atgttcgctg tggagactag aaattcccac 6420
attaattggg gaaagagaaa tatttacacc ctatgatttt ggcaagtgca agttttaatg 6480
gttgagattg atggattgaa tatatatcat atttggactc agtatgaaca aataccagat 6540
acataaatag atagtactaa ttcaacatgg atctgaactg ttgatcagac caattgagca 6600
cttggttgta attgctcgcg gactacacgc ttactgcctg actagggttc catgatgata 6660
aggttcgatt ttctaaaata ctattacaac aagatgacta tttaataaaa tttaaagaga 6720
ataacgtata taaaaattta gataaatttg gtgcaccgcg caattgcgca ggtcaccctg 6780
ctagctgtat tgaactcaat atacaaatca accttgctac attgctctac tttttctcag 6840
gtcttattta ctctgatttc tatttattct aatctataca tgtcgtcttg tacagggacc 6900
ctcttctcct cgatgatgtt tccagatcga gctcctaatg atcaatatct atatacatct 6960
ttcattgggg ggagccataa tagagacctc gctggggctc caacgtatac ttccatatta 7020
tgatcattta tgttttggtt gttttttctt ttcttgctag atttttctga tatatatact 7080
tatgtagggc tattctgaaa caacttgtga cctctgacct aagaaagctc ttgggtgttg 7140
agggacaacc tacttttgtg aagtaagtga taagaaacta ctgccatggt ttagagtatc 7200
tatatgtttt ctcttgttgt gcttgtgtta tggttttcca tcactatgga gttttgagga 7260
ttcattcagg tttttgcact accacttgcg aattcaatat gatgttcttt tacacaggca 7320
tgtacattgg agaaatgctt ttcctttata tggccagaat tatgatctgg tactggaagc 7380
tatagcaaaa atggagaaca atcttccagg gttcttttac gcaggcaagt caatgaaggc 7440
acccctattg tacaaaagaa atcttagata tttgaaacat attcctgttg attgagtacg 7500
tgaataattt gctgtttcta gtaagtcaat ttggtatttc tcatgcaact tatggggctc 7560
cttgatttgc tgagaatgat gagtttccta gagcaagcca ggaactgtaa tcccagcatg 7620
taatacttta ccttgaaatt aacttcaaaa aaataattga agctttttct gtatctgtag 7680
gaaataacaa ggatgggttg gctgttggaa atgttatagc ttcaggaagc aaggctgctg 7740
accttgtgat ctcttatctt gaatcttgca cagatcagga caattag 7787
<210> 36
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 8
<400> 36
atggtctcaa aacccttggt 20
<210> 37
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 9
<400> 37
acacgcttac tgcctgacta 20
<210> 38
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 10
<400> 38
tatatacatc tttcattggg 20
<210> 39
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 6
<400> 39
gaaggatttg gtgccttgat accctataag gaacagcaaa agcatggtct caaaaccttt 60
ggtagattaa ttcagcttta cacttatatt ttatccagct tgtagctgct tatattttga 120
<210> 40
<211> 794
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 7
<400> 40
gaaggatttg gtgccttgat accctataag gaacagcaaa agcatggtct caaaaccttt 60
ggtaggttaa ttcagcttta cacttatatt ttatccagct tgtagctgct tatattttga 120
tttgcgaatt aaaaattatt aaaacagcct tgaaagaaga aaccatgttc gctgtggaga 180
ctagaaattc ccacattaat tggggaaaga gaaatattta caccctatga ttttggcaag 240
tgcaagtttt aatggttgag attgatggat tgaatatata tcatatttgg actcagtatg 300
aacaaatacc agatacataa atagatagta ctaattcaac atggatctga actgttgatc 360
agaccaattg agcacttggt tgtaattgct cgcggactac acgcttactg cctgactagc 420
gttccatgat gataaggttc gattttctaa aatactatta caacaagatg actatttaat 480
aaaatttaaa gagaataacg tatataaaaa tttagataaa tttggtgcac cgcgcaattg 540
cgcaggtcac cctgctagct gtattgaact caatatacaa atcaaccttg ctacattgct 600
ctactttttc tcaggtctta tttactctga tttctattta ttctaatcta tacatgtcgt 660
cttgtacagg gaccctcttc tcctcgatga tgtttccaga tcgagctcct aatgatcaat 720
atctatatac atctgtaatt ggggggagcc ataatagaga cctcgctggg gctccaacgt 780
atacttccat atta 794
<210> 41
<211> 800
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 8
<400> 41
atggatctga actgttgatc agaccaattg agcacttggt tgtaattgct cgcggactac 60
acgcttactg cctgactagg gttccatgat gataaggttc gattttctaa aatactatta 120
caacaagatg actatttaat aaaatttaaa gagaataacg tatataaaaa tttagataaa 180
tttggtgcac cgcgcaattg cgcaggtcac cctgctagct gtattgaact caatatacaa 240
atcaaccttg ctacattgct ctactttttc tcaggtctta tttactctga tttctattta 300
ttctaatcta tacatgtcgt cttgtacagg gaccttcttc tcctcgatga tgtttccaga 360
tcgagctcct aatgatcaat atctatatac atctgtaatt ggcggcagcc ataatagaga 420
cctcgctggg gctccaacgt atacttccat attatgatca tttatgtttt ggttgttttt 480
tcttttcttg ctagattttt ctgatatata tacttatgta gggctattct gaaacaactt 540
gtgacctctg acctaagaaa gctcttgggt gttgagggac aacctacttt tgtgaagtaa 600
gtgataagaa actactgcca tggtttagag tatctatatg ttttctcttg ttgtgcttgt 660
gttatggttt tccatcacta tggagttttg aggattcatt caggtttttg cactaccact 720
tgcgaattca atatgatgtt cttttacaca ggcatgtaca ttggagaaat gcttttcctt 780
tatatggcca gaattatgat 800
<210> 42
<211> 138
<212> DNA
<213> Artificial Sequence
<220>
<223> RecA FusionCRISPR
<400> 42
gatgtggaaa ccatctctac gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttc catggatgtg gaaaccatcg 120
ctttcactgg atatcgcg 138
<210> 43
<211> 1062
<212> DNA
<213> Escherichia coli
<220>
<223> RecA
<400> 43
atggctatcg acgaaaacaa acagaaagcg ttggcggcag cactgggcca gattgagaaa 60
caatttggta aaggctccat catgcgcctg ggtgaagacc gttccatgga tgtggaaacc 120
atctctaccg gttcgctttc actggatatc gcgcttgggg caggtggtct gccgatgggc 180
cgtatcgtcg aaatctacgg accggaatct tccggtaaaa ccacgctgac gctgcaggtg 240
atcgccgcag cgcagcgtga aggtaaaacc tgtgcgttta tcgatgctga acacgcgctg 300
gacccaatct acgcacgtaa actgggcgtc gatatcgaca acctgctgtg ctcccagccg 360
gacaccggcg agcaggcact ggaaatctgt gacgccctgg cgcgttctgg cgcagtagac 420
gttatcgtcg ttgactccgt ggcggcactg acgccgaaag cggaaatcga aggcgaaatc 480
ggcgactctc acatgggcct tgcggcacgt atgatgagcc aggcgatgcg taagctggcg 540
ggtaacctga agcagtccaa cacgctgctg atcttcatca accagatccg tatgaaaatt 600
ggtgtgatgt tcggtaaccc ggaaaccact accggtggta acgcgctgaa attctacgcc 660
tctgttcgtc tcgacatccg tcgtatcggc gcggtgaaag agggcgaaaa cgtggtgggt 720
agcgaaaccc gcgtgaaagt ggtgaagaac aaaatcgctg cgccgtttaa acaggctgaa 780
ttccagatcc tctacggcga aggtatcaac ttctacggcg aactggttga cctgggcgta 840
aaagagaagc tgatcgagaa agcaggcgcg tggtacagct acaaaggtga gaagatcggt 900
cagggtaaag cgaatgcgac tgcctggctg aaagataacc cggaaaccgc gaaagagatc 960
gagaagaaag tacgtgagtt gctgctgagc aacccgaact caacgccgga tttctctgta 1020
gatgatagcg aaggcgtagc agaaactaac gaagattttt aa 1062
<210> 44
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 44
atggctatcg acgaaaacaa a 21
<210> 45
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 45
cgtcagcgtg gttttaccgg a 21
<210> 46
<211> 461
<212> DNA
<213> Artificial Sequence
<220>
<223> Expression Cassette
<400> 46
tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60
gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120
gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180
tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240
gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300
tggaaaggac gaaacaccgg catccctcag gctgggctgt tttagagcta gaaatagcaa 360
gttaaaataa ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctggcca 420
tcaggcatcc ctcagtatgg aatgaggcat ctgatttttt t 461
<210> 47
<211> 275
<212> DNA
<213> Homo sapiens
<220>
<223> PRDM9 exon ENSE00001804383
<400> 47
attgtgagat gtgtcagaac ttcttcattg acagctgtgc tgcccatggg ccccctacat 60
ttgtaaagga cagtgcagtg gacaaggggc accccaaccg ttcagccctc agtctgcccc 120
cagggctgag aattgggcca tcaggcatcc ctcaggctgg gcttggagta tggaatgagg 180
catctgatct gccgctgggt ctgcactttg gcccttatga gggccgaatt acagaagacg 240
aagaggcagc caacaatgga tactcctggc tgtgg 275
<210> 48
<211> 783
<212> DNA
<213> Artificial Sequence
<220>
<223> Gene Fragment
<400> 48
cacctagggg ggaggtcgta gtacccccct atgttttctc ccctaaataa ccccaaaaat 60
ctaagaaaaa aagacctcaa aaaggtcttt aattaacatc tcaaatttcg catttattcc 120
aatttccttt ttgcgtgtga tgcgaattct tgaccgtgat tagagaattg agtaaaatgt 180
acctacgcga gacctcattc gccattcagg ctacgcaact gttgggaagg gcgatcggtg 240
cgggcctctt cgctattacg ccatgaggcg aaagggggat gtgctgcaag gcgattaagt 300
tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag actattcgta 360
atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 420
acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 480
aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctcgatta 540
atgaatcggt ctcagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat 600
caacttgaaa aagtggcacc gagtcggtgc tggccaacga ggcccgggcc aataaggcct 660
tttttactcc atctggattt gttcagaacg ctcggttgcc gccgggcgtt ttttatctaa 720
agcttaggcc cagtcgaaag actgggcctt tttaatacga ctcactatag ggtcgactct 780
aga 783
<210> 49
<211> 784
<212> DNA
<213> Artificial Sequence
<220>
<223> Gene Fragment
<400> 49
cacctagggg ggaggtcgta gtacccccct atgttttctc ccctaaataa ccccaaaaat 60
ctaagaaaaa aagacctcaa aaaggtcttt aattaacatc tcaaatttcg catttattcc 120
aatttccttt ttgcgtgtga tgcgaattct tgaccgtgat tagagaattg agtaaaatgt 180
acctacggcc aacgaggccc gggccaataa ggcctacgcg agacctcatt cgccattcag 240
gctacgcaac tgttgggaag ggcgatcggt gcgggcctct tcgctattac gccatgaggc 300
gaaaggggga tgtgctgcaa ggcgattaag ttgggtaacg ccagggtttt cccagtcacg 360
acgttgtaaa acgacggcca gactattcgt aatcatggtc atagctgttt cctgtgtgaa 420
attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct 480
ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg cccgctttcc 540
agtcgggaaa cctgtcgtgc cagctcgatt aatgaatcgg tctcagtttt agagctagaa 600
atagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg 660
ctttttactc catctggatt tgttcagaac gctcggttgc cgccgggcgt tttttatcta 720
aagcttaggc ccagtcgaaa gactgggcct ttttaatacg actcactata gggtcgactc 780
taga 784
<210> 50
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 50
tacgtgaaga tcaggctatc actg 24
<210> 51
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 51
aaaccagtga tagcctgatc ttca 24
<210> 52
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 52
gatcggccaa cgaggccgcg gcattatgtt tgaatttccg tttaaagaat gg 52
<210> 53
<211> 76
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 53
gatggtttct ttcggtaagt cccgtctagc cttgccctca tcttgacact ccttatttga 60
ttttttgaag acttac 76
<210> 54
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 54
tgagggcaag gctagacggg acttaccgaa agaaaccatc 40
<210> 55
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 55
gatcaggcct tattggcctt ggcaggccgc tgaatttcca tgttgcgtaa gtcagg 56
<210> 56
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 56
gatcggccaa cgaggccttg gcaggccgct gaatttccat gttgcgtaag tc 52
<210> 57
<211> 76
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 57
cgaagtaagt cttcaaaaaa tcaaataagg agtgtcaaga tgagggcaag gctagacggg 60
acttaccgaa agaaac 76
<210> 58
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 58
tcttgacact ccttatttga ttttttgaag acttacttcg 40
<210> 59
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 59
gatcggcctt attggccgcg gcattatgtt tgaatttccg tttaaagaat ggtctgc 57
<210> 60
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 60
gactttcagg cgtgaatgg 19
<210> 61
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 61
cgtgctctcc gataatatgc 20
<210> 62
<211> 6588
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector RLW121
<400> 62
ccgtttaaac ttagttacta atcagtgatc agattgtcgt ttcccgcctt cactttaaac 60
tatcagtgtt tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga 120
ataatcggat atttaaaagg gcgtgaaaag gtttatccgt tcgtccattt gtatgtcaat 180
attggggggg ggggaaagcc acgttgtgtc tcaaaatctc tgatgttaca ttgcacaaga 240
taaaaatata tcatcatgaa caataaaact gtctgcttac ataaacagta atacaagggg 300
tgttcgccac catgagccat atccagcgtg aaacctcgtg ctcccgcccg cgcctcaatt 360
ccaatatgga tgccgacctt tatggctaca agtgggcgcg cgacaacgtc ggccagtcgg 420
gcgcgaccat ttatcggctt tatggcaaac ccgatgcccc ggaactgttc ctgaagcacg 480
gcaaaggcag cgtcgcaaac gatgtcaccg atgagatggt ccgcctgaac tggcttaccg 540
agttcatgcc gctgccgacg attaagcatt tcatccgtac cccggacgat gcctggctct 600
tgaccacggc cattccgggc aaaacggcct ttcaggtcct tgaagagtac ccggactccg 660
gtgagaatat cgtggacgcc ctcgcggtct tcctccgccg tttgcatagc atccccgtgt 720
gcaactgccc cttcaactcg gaccgggttt tccgcctggc acaggcccag tcgcgcatga 780
ataacggcct cgttgacgcg agcgatttcg acgatgaacg gaatggctgg ccggtggaac 840
aggtttggaa ggaaatgcac aaactgcttc cgttctcgcc ggattcggtg gtcacgcatg 900
gtgatttttc cctggataat ctgatctttg acgagggcaa gctgatcggc tgcatcgacg 960
tgggtcgcgt cggtatcgcc gaccgctatc aggacctggc gatcttgtgg aattgcctcg 1020
gcgagttctc gccctcgctc cagaagcgcc tgttccagaa gtacggcatc gacaacccgg 1080
atatgaacaa gctccagttc cacctcatgc tggacgaatt tttttgaaca gaattggtta 1140
attggttgta acactggcag agcattacgc tgacttgacg ggacggcggc tttgttgaat 1200
aaatcgaact tttgctgagt tgaaggatcg atgagttgaa ggaccccgta gaaaagatca 1260
aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac 1320
caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg 1380
taactggctt cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag 1440
gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac 1500
cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt 1560
taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg 1620
agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc 1680
ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc 1740
gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc 1800
acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa 1860
acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt 1920
tctttcctgc gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg 1980
ataccgctcg ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag 2040
agcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcataggcc 2100
gcgataggcc gacgcgaagc ggcggggcgt agggagcgca gcgaccgaag ggtaggcgct 2160
ttttgcagct cttcggctgt gcgctggcca gacagttatg cacaggccag gcgggtttta 2220
agagttttaa taagttttaa agagttttag gcggaaaaat cgcctttttt ctcttttata 2280
tcagtcactt acatgtgtga ccggttccca atgtacggct ttgggttccc aatgtacggg 2340
ttccggttcc caatgtacgg ctttgggttc ccaatgtacg tgctatccac aggaaagaga 2400
ccttttcgac ctttttcccc tgctagggca atttgcccta gcatctgctc cgtacattag 2460
gaaccggcgg atgcttcgcc ctcgatcagg ttgcggtagc gcatgactag gatcgggcca 2520
gcctgccccg cctcctcctt caaatcgtac tccggcaggt catttgaccc gatcagcttg 2580
cgcacggtga aacagaactt cttgaactct ccggcgctgc cactgcgttc gtagatcgtc 2640
ttgaacaacc atctggcttc tgccttgcct gcggcgcggc gtgccaggcg gtagagaaaa 2700
cggccgatgc cggggtcgat caaaaagtaa tcggggtgaa ccgtcagcac gtccgggttc 2760
ttgccttctg tgatctcgcg gtacatccaa tcagcaagct cgatctcgat gtactccggc 2820
cgcccggttt cgctctttac gatcttgtag cggctaatca aggcttcacc ctcggatacc 2880
gtcaccaggc ggccgttctt ggccttcttg gtacgctgca tggcaacgtg cgtggtgttt 2940
aaccgaatgc aggtttctac caggtcgtct ttctgctttc cgccatcggc tcgccggcag 3000
aacttgagta cgtccgcaac gtgtggacgg aacacgcggc cgggcttgtc tcccttccct 3060
tcccggtatc ggttcatgga ttcggttaga tgggaaaccg ccatcagtac caggtcgtaa 3120
tcccacacac tggccatgcc ggcggggcct gcggaaacct ctacgtgccc gtctggaagc 3180
tcgtagcgga tcacctcgcc agctcgtcgg tcacgcttcg acagacggaa aacggccacg 3240
tccatgatgc tgcgactatc gcgggtgccc acgtcataga gcatcggaac gaaaaaatct 3300
ggttgctcgt cgcccttggg cggcttccta atcgacggcg caccggctgc cggcggttgc 3360
cgggattctt tgcggattcg atcagcggcc ccttgccacg attcaccggg gcgtgcttct 3420
gcctcgatgc gttgccgctg ggcggcctgc gcggccttca acttctccac caggtcatca 3480
cccagcgccg cgccgatttg taccgggccg gatggtttgc gaccgctcac gccgattcct 3540
cgggcttggg ggttccagtg ccattgcagg gccggcagac aacccagccg cttacgcctg 3600
gccaaccgcc cgttcctcca cacatggggc attccacggc gtcggtgcct ggttgttctt 3660
gattttccat gccgcctcct ttagccgcta aaattcatct actcatttat tcatttgctc 3720
atttactctg gtagctgcgc gatgtattca gatagcagct cggtaatggt cttgccttgg 3780
cgtaccgcgt acatcttcag cttggtgtga tcctccgccg gcaactgaaa gttgacccgc 3840
ttcatggctg gcgtgtctgc caggctggcc aacgttgcag ccttgctgct gcgtgcgctc 3900
ggacggccgg cacttagcgt gtttgtgctt ttgctcattt tctctttacc tcattaactc 3960
aaatgagttt tgatttaatt tcagcggcca gcgcctggac ctcgcgggca gcgtcgccct 4020
cgggttctga ttcaagaacg gttgtgccgg cggcggcagt gcctgggtag ctcacgcgct 4080
gcgtgatacg ggactcaaga atgggcagct cgtacccggc cagcgcctcg gcaacctcac 4140
cgccgatgcg cgtgcctttg atcgcccgcg acacgacaaa ggccgcttgt agccttccat 4200
ccgtgacctc aatgcgctgc ttaaccagct ccaccaggtc ggcggtggcc caaatgtcgt 4260
aagggcttgg ctgcaccgga atcagcacga agtcggctgc cttgatcgcg gacacagcca 4320
agtccgccgc ctggggcgct ccgtcgatca ctacgaagtc gcgccggccg atggccttca 4380
cgtcgcggtc aatcgtcggg cggtcgatgc cgacaacggt tagcggttga tcttcccgca 4440
cggccgccca atcgcgggca ctgccctggg gatcggaatc gactaacaga acatcggccc 4500
cggcgagttg cagggcgcgg gctagatggg ttgcgatggt cgtcttgcct gacccgcctt 4560
tctggttaag tacagcgata accttcatgc gttccccttg cgtatttgtt tatttactca 4620
tcgcatcata tacgcagcga ccgcatgacg caagctgttt tactcaaata cacatcacct 4680
ttttagatga tcagtgattt tgtgccgagc tgccggtcgg ggagctgttg gctggctggt 4740
ggcaggatat attgtggtgt aaacaaattg acgcttagac aacttaataa cacattgcgg 4800
acgtctttaa tgtactgaat ttagttactg atcactgatt aagtactgat aaatttaatt 4860
aacagatctc aactttgtat agaaaagttg aacgagaaac gtaaaatgat ataaatatca 4920
atatattaaa ttagattttg cataaaaaac agactacata atactgtaaa acacaacata 4980
tccagtcact atggtcgacc tgcagactgg ctgtgtataa gggagcctga catttatatt 5040
ccccagaaca tcaggttaat ggcgtttttg atgtcatttt cgcggtggct gagatcagcc 5100
acttcttccc cgataacgga gaccggcaca ctggccatat cggtggtcat catgcgccag 5160
ctttcatccc cgatatgcac caccgggtaa agttcacggg ggactttatc tgacagcaga 5220
cgtgcactgg ccagggggat caccatccgt cgcccgggcg tgtcaataat atcactctgt 5280
acatccacaa acagacgata acggctctct cttttatagg tgtaaacctt aaactgcatt 5340
tcaccagccc ctgttctcgt cggcaaaaga gccgttcatt tcaatgaacc gggcgacctc 5400
agccatccct tcctgatttt ccgctttcca gcgttcggca cgcagacgac gggcttcatt 5460
ctgcatggtt gtgcttaccg aaccggagat attgacatca tatatgcctt gagcaactga 5520
tagctgtcgc tgtcaactgt cactgtaata cgctgcttca tagcatacct ctttttgaca 5580
tacttcgggt atacatatca gtatatattc ttataccgca aaaatcagcg cgcaaatacg 5640
catactgtta tctggctttt agtaagccgg atcctctaga ttacgccccg cctgccactc 5700
atcgcagtac tgttgtaatt cattaagcat tctgccgaca tggaagccat cacaaacggc 5760
atgatgaacc tgaatcgcca gcggcatcag caccttgtcg ccttgcgtat aatatttgcc 5820
catggtgaaa acgggggcga agaagttgtc catattggcc acgtttaaat caaaactggt 5880
gaaactcacc cagggattgg ctgagacgaa aaacatattc tcaataaacc ctttagggaa 5940
ataggccagg ttttcaccgt aacacgccac atcttgcgaa tatatgtgta gaaactgccg 6000
gaaatcgtcg tggtattcac tccagagcga tgaaaacgtt tcagtttgct catggaaaac 6060
ggtgtaacaa gggtgaacac tatcccatat caccagctca ccgtctttca ttgccatacg 6120
gaattccgga tgagcattca tcaggcgggc aagaatgtga ataaaggccg gataaaactt 6180
gtgcttattt ttctttacgg tctttaaaaa ggccgtaata tccagctgaa cggtctggtt 6240
ataggtacat tgagcaactg actgaaatgc ctcaaaatgt tctttacgat gccattggga 6300
tatatcaacg gtggtatatc cagtgatttt tttctccatt ttagcttcct tagctcctga 6360
aaatctcgac ggatcctaac tcaaaatcca catattatac gagccggaag cataaagtgt 6420
aaagcctggg gtgcctaatg cggccgccat agtgactgga tatgttgtgt tttacagtat 6480
tatgtagtct gttttttatg caaaatctaa tttaatatat tgatatttat atcattttac 6540
gtttctcgtt caactttatt atacatagtt gataattcac tgggccgg 6588
<210> 63
<211> 7443
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector CC003
<400> 63
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcata aataatgatt ttattttgac tgatagtgac ctgttcgttg caacaaattg 420
ataagcaatg cttttttata atgccaactt tgtatagaaa agttgattta aatgaattca 480
agcttttaat taacttagcc actgcaacaa gttcttgaac cttagcacaa tcatattgtg 540
catgcacttg tttattgcaa agaatggtgc gtagggaaca cgcatgattt ttgaattgct 600
ggcacataat tttatcatta gaaactggaa tgcaacatgt accctttgtc atggtttctt 660
tccgagacat tgcactgttt tttttaatcc tatcattatc ataatgccaa gaactggtca 720
ccaaccagca ttttgcatca tggttagttg agctgtcccc atgtatcaat aggtgcattg 780
tattggtcca aaatataaat gcagtggatg caacctatct catggccgtc aacaaaagaa 840
atcaaaaggg aaatgcacca tcttatatct ccagtttata tgaacagatt ggataagatc 900
ataagatcaa gtggtttata ttattttgag gaatataaca tggattcatc ctaatcactc 960
gtctaggcag tatgtgtatt catgatggat atggtactat actacggagt tttttcttca 1020
caaaataacc tgttattttg acctccaacc aaacacgaat tataccaaaa attgggttat 1080
ttcatctata gtacaactct attataaaca tgcagtaaat tatcctacac atataccaaa 1140
attcaagtgt aataatccta atacacagac ttaaaaaaca aactatttcc tttttaagaa 1200
aaggaaaacc atttttttaa cggaaggaaa acaaattcgg gtcaaggcgg aagccagcgc 1260
gccaccccac gtcagcgaat acggaggcgc ggggttgacg gcgtcacccg gtcctaacgg 1320
cgaccaacaa accagccaga agaaattaca gtaaaaaaaa gtaaattgca ctttgatcca 1380
ccttttatta cccaagtttc aatttggacc acccttaaac ctatcttttc aaattgggcc 1440
gggttgtggt ttggactacc atgaacaact tttcgtcatg tctaacttcc ctttcggcaa 1500
acatatgaac catatataga ggagatcggc cgtatactag agctgatgtg tttaaggtcg 1560
ttgattgcac gagaaaaaaa aaatccaaat cgcaacaata gcaaatttat ctagttcaaa 1620
gtgaaaagat atgtttaaag gtagtccaaa gtaaaactta ggggctgttt ggttcccagc 1680
catactttac cattacttgc caacaaaagt tgccacacct tgtctaaggt gaggtgatca 1740
aattgttagc cacaacttac taagcctaag ggaatcttgc cacacttttt tgagccattg 1800
acacgtggga cttaatttgt tagagggaaa tcttgccaca actgtggcta caaccaaaca 1860
cctgtcaaat ttgcctaacc ttaggcgtgg caaactgtgg caaagtgtgg cttacaacca 1920
aacacaccct tagataataa aatgtggtcc aaagcgtaat tcactaaaaa aaaatcaacg 1980
agacgtgtac caaacggaga caaacggcat cttctcgaaa tttcccaacc gctcgctcgc 2040
ccgcctcgtc ttcccggaaa ccgcggtggt ttcagcgtgg cggattctcc aagcagacgg 2100
agacgtcacg gcacgggact cctcccacca cccaaccgcc ataaatacca gccccctcat 2160
ctcctctcct cgcatcagct ccacccccga aaaatttctc cccaatctcg cgaggctctc 2220
gtcgtcgaat cgaatcctct cgcgtcctca agcttggcat ccaggtacgg atccgcgtcc 2280
catctccctc accccccgtg ttcttcgtgc ctgcttctgg gtcagatctg ggtggattcg 2340
cggttgttgg atgtgggggg ctgtgtttat ttgtcggtgg atctggttgt ctggatctgc 2400
gttttctctg tcgtagttag cggatctgat gaaatgttta gtgttcgtgt atactggtat 2460
ggtggatctg gtcctaggat gcgtggaatg gatatatgta ggcgaattgg aggatttatt 2520
ttgtgaattt tgctgaaatg atagttctaa acactggatc tgacctcggg atgctgttaa 2580
atgtggaaat catggtcgat gctgtcatga acatggtgtt cttatggtag atctgagcaa 2640
tgtatgtttc aaaattgttt gtcacatgga aatgctatgg ttctagatgc aatagaatga 2700
tacatgccga gatcccctct agttgatatg atagatcatg atgttttaca gctatgtcat 2760
atgaatatgt tcatttgtta ccgatgtatt tggatctact taacatttcc aaagcacgcc 2820
gcgttctaat tctagatctg gtagtcatgt ttgtacacgt cacccaccta atacaaatac 2880
atatgtctag tgtttggtga cactgcccgt cagatctgtt ttttccagat ctgtggaaca 2940
aatactccac gcatgtatgg tagttttgaa acgatcttgt atcttccatt gttgtagtaa 3000
caactaaata aagtacaatt gttcaattat tgggaatcgt attttctgta gtgccgatgt 3060
acagcatatt catagatgtc tatttaggaa ctcaaatttt aaattgagga ctagttattt 3120
attgtgggtc agtcttttga attgtgttat cttgctgtac tggcgcgcca ccatggccac 3180
cgccgccgcc gcgtctaccg cgctcactgg cgccactacc gctgcgccca aggcgaggcg 3240
ccgggcgcac ctcctggcca cccgccgcgc cctcgccgcg cccatcaggt gctcagcggc 3300
gtcacccgcc atgccgatgg ctcccccggc caccccgctc cggccgtggg gccccaccga 3360
tccccgcaag ggcgccgaca tcctcgtcga gtccctcgag cgctgcggcg tccgcgacgt 3420
cttcgcctac cccggcggca cgtccatgga gatccaccag gcactcaccc gctcccccgt 3480
catcgccaac cacctcttcc gccacgagca aggggaggcc tttgcggcct ccggctacgc 3540
gcgctcctcg ggccgcgtcg gcgtctgcat cgccacctcc ggccccggcg ccaccaacct 3600
tgtctccgcg ctcgccgacg cgctgctcga ttccgtcccc atggtcgcca tcacgggaca 3660
ggtgccgcga cgcatgattg gcaccgacgc cttccaggag acgcccatcg tcgaggtcac 3720
ccgctccatc accaagcaca actacctggt cctcgacgtc gacgacatcc cccgcgtcgt 3780
gcaggaggct ttcttcctcg cctcctctgg tcgaccgggg ccggtgcttg tcgacatccc 3840
caaggacatc cagcagcaga tggcggtgcc tgtctgggac aagcccatga gtctgcctgg 3900
gtacattgcg cgccttccca agccccctgc gactgagttg cttgagcagg tgctgcgtct 3960
tgttggtgaa tcccggcgcc ctgttcttta tgttggcggt ggctgcgcag catctggtga 4020
ggagttgcga cgctttgtgg agctgactgg aatcccggtc acaactactc ttatgggcct 4080
cggcaacttc cccagcgacg acccactgtc tctgcgcatg ctaggtatgc atggcacggt 4140
gtatgcaaat tatgcagtgg ataaggccga tctgttgctt gcacttggtg tgcggtttga 4200
tgatcgtgtg acagggaaga ttgaggcttt tgcaagcagg gctaagattg tgcacgttga 4260
tattgatccg gctgagattg gcaagaacaa gcagccacat gtgtccatct gtgcagatgt 4320
taagcttgct ttgcagggca tgaatgctct tcttgaagga agcacatcaa agaagagctt 4380
tgactttggc tcatggaacg atgagttgga tcagcagaag agggaattcc cccttgggta 4440
taaaacatct aatgaggaga tccagccaca atatgctatt caggttcttg atgagctgac 4500
gaaaggcgag gccatcatcg gcacaggtgt tgggcagcac cagatgtggg cggcacagta 4560
ctacacttac aagcggccaa ggcagtggtt gtcttcagct ggtcttgggg ctatgggatt 4620
tggtttgccg gctgctgctg gtgcttctgt ggccaaccca ggtgttactg ttgttgacat 4680
cgatggagat ggtagctttc tcatgaacgt tcaggagcta gctatgatcc gaattgagaa 4740
cctcccggtg aaggtctttg tgctaaacaa ccagcacctg gggatggtgg tgcagtggga 4800
ggacaggttc tataaggcca acagagcgca cacatacttg ggaaacccag agaatgaaag 4860
tgagatatat ccagatttcg tgacgatcgc caaagggttc aacattccag cggtccgtgt 4920
gacaaagaag aacgaagtcc gcgcagcgat aaagaagatg ctcgagactc cagggccgta 4980
cctcttggat ataatcgtcc cacaccagga gcatgtgttg cctatgatcc ctaatggtgg 5040
ggctttcaag gatatgatcc tggatggtga tggcaggact gtgtactagc ctgcaggcct 5100
aggatcgttc aaacatttgg caataaagtt tcttaagatt gaatcctgtt gccggtcttg 5160
cgatgattat catataattt ctgttgaatt acgttaagca tgtaataatt aacatgtaat 5220
gcatgacgtt atttatgaga tgggttttta tgattagagt cccgcaatta tacatttaat 5280
acgcgataga aaacaaaata tagcgcgcaa actaggataa attatcgcgc gcggtgtcat 5340
ctatgttact agatcggccg gccgtttaaa cagcctgctt ttttgtacaa agttggcatt 5400
ataaaaaagc attgctcatc aatttgttgc aacgaacagg tcactatcag tcaaaataaa 5460
atcattattt gctgggcctc atgggccttc cgctcactgc ccgctttcca gtcgggaaac 5520
ctgtcgtgcc agctgcatta acatggtcat agctgtttcc ttgcgtattg ggcgctctcc 5580
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggg taaagcctgg ggtgcctaat 5640
gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 5700
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 5760
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 5820
ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 5880
cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 5940
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 6000
gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 6060
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 6120
acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 6180
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 6240
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 6300
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 6360
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 6420
tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 6480
ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 6540
taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagaac 6600
cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 6660
gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 6720
gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 6780
tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 6840
gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 6900
ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 6960
ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 7020
cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 7080
ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 7140
gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 7200
ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 7260
ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 7320
tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 7380
ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 7440
cac 7443
<210> 64
<211> 3734
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector CC018
<400> 64
cgcggatcat gaaccaacgg cctggctgta tttggtggtt gtgtagggag atggggagaa 60
gaaaagcccg attctcttcg ctgtgatggg ctggatgcat gcgggggagc gggaggccca 120
agtacgtgca cggtgagcgg cccacagggc gagtgtgagc gcgagaggcg ggaggaacag 180
tttagtacca cattgcccag ctaactcgaa cgcgaccaac ttataaaccc gcgcgctgtc 240
gcttgtgtgc attgagtgct atgctgaggt tttagagcta gaaatagcaa gttaaaataa 300
ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctctgtt cctcgtgctg 360
gacaagtgtg gtttccagat tctgcaacca agactgcgca ggcattgctg gacttcaacc 420
gtgaaggatt acctctgttc atcctcgcta actggagagg cttctctggt ggacaaagag 480
atctctttga aggaattctt caggctggct cgactattgt tgagaacctt aggacataca 540
atcagcctgc ctttgtctac attcccatgg ctgcagagct acgaggaggg gcttgggttg 600
tggttgatag caagataaac ccagaccgca ttgagtgcta tgctgagaga actgcaaaat 660
ccaatgttct ggaaccgcaa gggttaattg agatcaagtt caggtcagag gaactccagg 720
attgcatgag tcggcttgac ccaacattaa ttgatctgaa agcaaaactc gaagtagcaa 780
ataaaaatgg aagtgctgac acaaaatcgc ttcaagaaaa tatagaagct cgaacaaaac 840
agttgatgcc tctatatact cagattgcga tacggtttgc tgaattgcat gatacatccc 900
tcagaatggc tgcgaaaggt gtgattaaga aagttgtgga ctgggaagaa tcacgatctt 960
tctttttttt gcggccgccc cgggcctgca ggggatcccg atcgggccgg ccgtttaaac 1020
ccactttgta caagaaagtt gaacgagaaa cgtaaaatga tataaatatc aatatattaa 1080
attagatttt gcataaaaaa cagactacat aatactgtaa aacacaacat atgcagtcac 1140
tatgaaccaa ctacttagat ggtattagtg acctgtactg ggcctcatgg gccttccgct 1200
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaacat ggtcatagct 1260
gtttccttgc gtattgggcg ctctccgctt cctcgctcac tgactcgctg cgctcggtcg 1320
ttcgggtaaa gcctggggtg cctaatgagc aaaaggccag caaaaggcca ggaaccgtaa 1380
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 1440
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 1500
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 1560
cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 1620
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 1680
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 1740
gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 1800
agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg 1860
cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 1920
aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 1980
aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 2040
ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 2100
aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 2160
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 2220
agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 2280
cagtgctgca atgataccgc gagaaccacg ctcaccggct ccagatttat cagcaataaa 2340
ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 2400
gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 2460
cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 2520
cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 2580
ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 2640
catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 2700
tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 2760
ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 2820
catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 2880
cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 2940
cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 3000
acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 3060
ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 3120
tccgcgcaca tttccccgaa aagtgccacc taaattgtaa gcgttaatat tttgttaaaa 3180
ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa 3240
atcccttata aatcaaaaga atagaccgag atagggttga gtggccgcta cagggcgctc 3300
ccattcgcca ttcaggctgc gcaactgttg ggaagggcgt ttcggtgcgg gcctcttcgc 3360
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 3420
ggttttccca gtcacgacgt tgtaaaacga cggccagtga gcgcgacgta atacgactca 3480
ctatagggcg aattggcgga aggccgtcaa ggccgcatta caggtcacta ataccatcta 3540
agtagttggt tcatagtgac tgcatatgtt gtgttttaca gtattatgta gtctgttttt 3600
tatgcaaaat ctaatttaat atattgatat ttatatcatt ttacgtttct cgttcaactt 3660
ttttgtacaa acttgattta aatgaattca agcttttaat taagcatgcg agctcggcgc 3720
gccggtaccg cgat 3734
<210> 65
<211> 9506
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector CC006
<400> 65
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcatc aaataatgat tttattttga ctgatagtga cctgttcgtt gcaacaaatt 420
gataagcaat gctttcttat aatgccaact ttgtacaaga aagctgggta tttaaatgaa 480
ttcaagcttt taattaatgc agtgcagcgt gacccggtcg tgcccctctc tagagataat 540
gagcattgca tgtctaagtt ataaaaaatt accacatatt ttttttgtca cacttgtttg 600
aagtgcagtt tatctatctt tatacatata tttaaacttt actctacgaa taatataatc 660
tatagtacta caataatatc agtgttttag agaatcatat aaatgaacag ttagacatgg 720
tctaaaggac aattgagtat tttgacaaca ggactctaca gttttatctt tttagtgtgc 780
atgtgttctc cttttttttt gcaaatagct tcacctatat aatacttcat ccattttatt 840
agtacatcca tttagggttt agggttaatg gtttttatag actaattttt ttagtacatc 900
tattttattc tattttagcc tctaaattaa gaaaactaaa actctatttt agttttttta 960
tttaatagtt tagatataaa atagaataaa ataaagtgac taaaaattaa acaaataccc 1020
tttaagaaat taaaaaaact aaggaaacat ttttcttgtt tcgagtagat aatgccagcc 1080
tgttaaacgc cgtcgacgag tctaacggac accaaccagc gaaccagcag cgtcgcgtcg 1140
ggccaagcga agcagacggc acggcatctc tgtcgctgcc tctggacccc tctcgagagt 1200
tccgctccac cgttggactt gctccgctgt cggcatccag aaattgcgtg gcggagcggc 1260
agacgtgagc cggcacggca ggcggcctcc tcctcctctc acggcaccgg cagctacggg 1320
ggattccttt cccaccgctc cttcgctttc ccttcctcgc ccgccgtaat aaatagacac 1380
cccctccaca ccctctttcc ccaacctcgt gttgttcgga gcgcacacac acacaaccag 1440
atctccccca aatccacccg tcggcacctc cgcttcaagg tacgccgctc gtcctccccc 1500
cccccccccc tctctacctt ctctagatcg gcgttccggt ccatggttag ggcccggtag 1560
ttctacttct gttcatgttt gtgttagatc cgtgtttgtg ttagatccgt gctgctagcg 1620
ttcgtacacg gatgcgacct gtacgtcaga cacgttctga ttgctaactt gccagtgttt 1680
ctctttgggg aatcctggga tggctctagc cgttccgcag acgggatcga tttcatgatt 1740
ttttttgttt cgttgcatag ggtttggttt gcccttttcc tttatttcaa tatatgccgt 1800
gcacttgttt gtcgggtcat cttttcatgc ttttttttgt cttggttgtg atgatgtggt 1860
ctggttgggc ggtcgttcta gatcggagta gaattctgtt tcaaactacc tggtggattt 1920
attaattttg gatctgtatg tgtgtgccat acatattcat agttacgaat tgaagatgat 1980
ggatggaaat atcgatctag gataggtata catgttgatg cgggttttac tgatgcatat 2040
acagagatgc tttttgttcg cttggttgtg atgatgtggt gtggttgggc ggtcgttcat 2100
tcgttctaga tcggagtaga atactgtttc aaactacctg gtgtatttat taattttgga 2160
actgtatgtg tgtgtcatac atcttcatag ttacgagttt aagatggatg gaaatatcga 2220
tctaggatag gtatacatgt tgatgtgggt tttactgatg catatacatg atggcatatg 2280
cagcatctat tcatatgctc taaccttgag tacctatcta ttataataaa caagtatgtt 2340
ttataattat ttcgatcttg atatacttgg atgatggcat atgcagcagc tatatgtgga 2400
tttttttagc cctgccttca tacgctattt atttgcttgg tactgtttct tttgtcgatg 2460
ctcaccctgt tgtttggtgt tacttctgca gggcgcgcca ccatggctcc taagaagaag 2520
cggaaggttg gtattcacgg ggtgcctgcg gctgacaaga agtactccat cggcctcgac 2580
atcggcacca acagcgtcgg ctgggcggtg atcaccgacg agtacaaggt cccgtccaag 2640
aagttcaagg tcctgggcaa caccgaccgc cactccatca agaagaacct catcggcgcc 2700
ctcctcttcg actccggcga gacggcggag gcgacccgcc tcaagcgcac cgcccgccgc 2760
cgctacaccc gccgcaagaa ccgcatctgc tacctccagg agatcttctc caacgagatg 2820
gcgaaggtcg acgactcctt cttccaccgc ctcgaggagt ccttcctcgt ggaggaggac 2880
aagaagcacg agcgccaccc catcttcggc aacatcgtcg acgaggtcgc ctaccacgag 2940
aagtacccca ctatctacca ccttcgtaag aagcttgttg actctactga taaggctgat 3000
cttcgtctca tctaccttgc tctcgctcac atgatcaagt tccgtggtca cttccttatc 3060
gagggtgacc ttaaccctga taactccgac gtggacaagc tcttcatcca gctcgtccag 3120
acctacaacc agctcttcga ggagaaccct atcaacgctt ccggtgtcga cgctaaggcg 3180
atcctttccg ctaggctctc caagtccagg cgtctcgaga acctcatcgc ccagctccct 3240
ggtgagaaga agaacggtct tttcggtaac ctcatcgctc tctccctcgg tctgacccct 3300
aacttcaagt ccaacttcga cctcgctgag gacgctaagc ttcagctctc caaggatacc 3360
tacgacgatg atctcgacaa cctcctcgct cagattggag atcagtacgc tgatctcttc 3420
cttgctgcta agaacctctc cgatgctatc ctcctttcgg atatccttag ggttaacact 3480
gagatcacta aggctcctct ttctgcttcc atgatcaagc gctacgacga gcaccaccag 3540
gacctcaccc tcctcaaggc tcttgttcgt cagcagctcc ccgagaagta caaggagatc 3600
ttcttcgacc agtccaagaa cggctacgcc ggttacattg acggtggagc tagccaggag 3660
gagttctaca agttcatcaa gccaatcctt gagaagatgg atggtactga ggagcttctc 3720
gttaagctta accgtgagga cctccttagg aagcagagga ctttcgataa cggctctatc 3780
cctcaccaga tccaccttgg tgagcttcac gccatccttc gtaggcagga ggacttctac 3840
cctttcctca aggacaaccg tgagaagatc gagaagatcc ttactttccg tattccttac 3900
tacgttggtc ctcttgctcg tggtaactcc cgtttcgctt ggatgactag gaagtccgag 3960
gagactatca ccccttggaa cttcgaggag gttgttgaca agggtgcttc cgcccagtcc 4020
ttcatcgagc gcatgaccaa cttcgacaag aacctcccca acgagaaggt cctccccaag 4080
cactccctcc tctacgagta cttcacggtc tacaacgagc tcaccaaggt caagtacgtc 4140
accgagggta tgcgcaagcc tgccttcctc tccggcgagc agaagaaggc tatcgttgac 4200
ctcctcttca agaccaaccg caaggtcacc gtcaagcagc tcaaggagga ctacttcaag 4260
aagatcgagt gcttcgactc cgtcgagatc agcggcgttg aggaccgttt caacgcttct 4320
ctcggcacct accacgatct cctcaagatc atcaaggaca aggacttcct cgacaacgag 4380
gagaacgagg acatcctcga ggacatcgtc ctcactctta ctctcttcga ggatagggag 4440
atgatcgagg agaggctcaa gacttacgct catctcttcg atgacaaggt tatgaagcag 4500
ctcaagcgtc gccgttacac cggttggggt aggctctccc gcaagctcat caacggtatc 4560
agggataagc agagcggcaa gactatcctc gacttcctca agtctgatgg tttcgctaac 4620
aggaacttca tgcagctcat ccacgatgac tctcttacct tcaaggagga tattcagaag 4680
gctcaggtgt ccggtcaggg cgactctctc cacgagcaca ttgctaacct tgctggttcc 4740
cctgctatca agaagggcat ccttcagact gttaaggttg tcgatgagct tgtcaaggtt 4800
atgggtcgtc acaagcctga gaacatcgtc atcgagatgg ctcgtgagaa ccagactacc 4860
cagaagggtc agaagaactc gagggagcgc atgaagagga ttgaggaggg tatcaaggag 4920
cttggttctc agatccttaa ggagcaccct gtcgagaaca cccagctcca gaacgagaag 4980
ctctacctct actacctcca gaacggtagg gatatgtacg ttgaccagga gctcgacatc 5040
aacaggcttt ctgactacga cgtcgaccac attgttcctc agtctttcct taaggatgac 5100
tccatcgaca acaaggtcct cacgaggtcc gacaagaaca ggggtaagtc ggacaacgtc 5160
ccttccgagg aggttgtcaa gaagatgaag aactactgga ggcagcttct caacgctaag 5220
ctcattaccc agaggaagtt cgacaacctc acgaaggctg agaggggtgg cctttccgag 5280
cttgacaagg ctggtttcat caagaggcag cttgttgaga cgaggcagat taccaagcac 5340
gttgctcaga tcctcgattc taggatgaac accaagtacg acgagaacga caagctcatc 5400
cgcgaggtca aggtgatcac cctcaagtcc aagctcgtct ccgacttccg caaggacttc 5460
cagttctaca aggtccgcga gatcaacaac taccaccacg ctcacgatgc ttaccttaac 5520
gctgtcgttg gcaccgctct tatcaagaag taccctaagc ttgagtccga gttcgtctac 5580
ggtgactaca aggtctacga cgttcgtaag atgatcgcca agtccgagca ggagatcggc 5640
aaggccaccg ccaagtactt cttctactcc aacatcatga acttcttcaa gaccgagatc 5700
accctcgcca acggcgagat ccgcaagcgc cctcttatcg agacgaacgg tgagactggt 5760
gagatcgttt gggacaaggg tcgcgacttc gctactgttc gcaaggtcct ttctatgcct 5820
caggttaaca tcgtcaagaa gaccgaggtc cagaccggtg gcttctccaa ggagtctatc 5880
cttccaaaga gaaactcgga caagctcatc gctaggaaga aggattggga ccctaagaag 5940
tacggtggtt tcgactcccc tactgtcgcc tactccgtcc tcgtggtcgc caaggtggag 6000
aagggtaagt cgaagaagct caagtccgtc aaggagctcc tcggcatcac catcatggag 6060
cgctcctcct tcgagaagaa cccgatcgac ttcctcgagg ccaagggcta caaggaggtc 6120
aagaaggacc tcatcatcaa gctccccaag tactctcttt tcgagctcga gaacggtcgt 6180
aagaggatgc tggcttccgc tggtgagctc cagaagggta acgagcttgc tcttccttcc 6240
aagtacgtga acttcctcta cctcgcctcc cactacgaga agctcaaggg ttcccctgag 6300
gataacgagc agaagcagct cttcgtggag cagcacaagc actacctcga cgagatcatc 6360
gagcagatct ccgagttctc caagcgcgtc atcctcgctg acgctaacct cgacaaggtc 6420
ctctccgcct acaacaagca ccgcgacaag cccatccgcg agcaggccga gaacatcatc 6480
cacctcttca cgctcacgaa cctcggcgcc cctgctgctt tcaagtactt cgacaccacc 6540
atcgacagga agcgttacac gtccaccaag gaggttctcg acgctactct catccaccag 6600
tccatcaccg gtctttacga gactcgtatc gacctttccc agcttggtgg tgataagcgt 6660
cctgctgcca ccaaaaaggc cggacaggct aagaaaaaga agtagcctgc aggtcctgct 6720
ttaatgagat atgcgagacg cctatgatcg catgatattt gctttcaatt ctgttgtgca 6780
cgttgtaaaa aacctgagca tgtgtagctc agatccttac cgccggtttc ggttcattct 6840
aatgaatata tcacccgtta ctatcgtatt tttatgaata atattctccg ttcaatttac 6900
tgattgtacc ctactactta tatgtacaat attaaaatga aaacaatata ttgtgctgaa 6960
taggtttata gcgacatcta tgatagagcg ccacaataac aaacaattgc gttttattat 7020
tacaaatcca attttaaaaa aagcggcaga accggtcaaa cctaaaagac tgattacata 7080
aatcttattc aaatttcaaa agtgccccag gggctagtat ctacgacaca ccgagcggcg 7140
aactaataac gctcactgaa gggaactccg gttccccgcc ggcgcgcatg ggtgagattc 7200
cttgaagttg agtattggcc gtccgctcta ccgaaagtta cgggcaccat tcaacccggt 7260
ccagcacggc ggccgggtaa ccgacttgct gccccgagaa ttatgcagca tttttttggt 7320
gtatgtgggc cccaaatgaa gtgcaggtca aaccttgaca gtgacgacaa atcgttgggc 7380
gggtccaggg cgaattttgc gacaacatgt cgaggctcag caggccggcc gtttaaacca 7440
actttattat acaaagttgg cattataaaa aagcattgct tatcaatttg ttgcaacgaa 7500
caggtcacta tcagtcaaaa taaaatcatt atttctgggc ctcatgggcc ttccgctcac 7560
tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaacatggt catagctgtt 7620
tccttgcgta ttgggcgctc tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 7680
gggtaaagcc tggggtgcct aatgagcaaa aggccagcaa aaggccagga accgtaaaaa 7740
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 7800
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 7860
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 7920
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 7980
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 8040
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 8100
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 8160
gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 8220
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 8280
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 8340
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 8400
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 8460
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 8520
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 8580
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 8640
tgctgcaatg ataccgcgag aaccacgctc accggctcca gatttatcag caataaacca 8700
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 8760
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 8820
tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 8880
ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 8940
tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 9000
ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 9060
gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 9120
ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 9180
cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 9240
ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 9300
ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 9360
gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 9420
ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 9480
gcgcacattt ccccgaaaag tgccac 9506
<210> 66
<211> 17930
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector RLW137
<400> 66
ttatacatag ttgataattc actgggccgg ccgtttaaac ttagttacta atcagtgatc 60
agattgtcgt ttcccgcctt cactttaaac tatcagtgtt tgacaggata tattggcggg 120
taaacctaag agaaaagagc gtttattaga ataatcggat atttaaaagg gcgtgaaaag 180
gtttatccgt tcgtccattt gtatgtcaat attggggggg ggggaaagcc acgttgtgtc 240
tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa caataaaact 300
gtctgcttac ataaacagta atacaagggg tgttcgccac catgagccat atccagcgtg 360
aaacctcgtg ctcccgcccg cgcctcaatt ccaatatgga tgccgacctt tatggctaca 420
agtgggcgcg cgacaacgtc ggccagtcgg gcgcgaccat ttatcggctt tatggcaaac 480
ccgatgcccc ggaactgttc ctgaagcacg gcaaaggcag cgtcgcaaac gatgtcaccg 540
atgagatggt ccgcctgaac tggcttaccg agttcatgcc gctgccgacg attaagcatt 600
tcatccgtac cccggacgat gcctggctct tgaccacggc cattccgggc aaaacggcct 660
ttcaggtcct tgaagagtac ccggactccg gtgagaatat cgtggacgcc ctcgcggtct 720
tcctccgccg tttgcatagc atccccgtgt gcaactgccc cttcaactcg gaccgggttt 780
tccgcctggc acaggcccag tcgcgcatga ataacggcct cgttgacgcg agcgatttcg 840
acgatgaacg gaatggctgg ccggtggaac aggtttggaa ggaaatgcac aaactgcttc 900
cgttctcgcc ggattcggtg gtcacgcatg gtgatttttc cctggataat ctgatctttg 960
acgagggcaa gctgatcggc tgcatcgacg tgggtcgcgt cggtatcgcc gaccgctatc 1020
aggacctggc gatcttgtgg aattgcctcg gcgagttctc gccctcgctc cagaagcgcc 1080
tgttccagaa gtacggcatc gacaacccgg atatgaacaa gctccagttc cacctcatgc 1140
tggacgaatt tttttgaaca gaattggtta attggttgta acactggcag agcattacgc 1200
tgacttgacg ggacggcggc tttgttgaat aaatcgaact tttgctgagt tgaaggatcg 1260
atgagttgaa ggaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 1320
gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 1380
atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 1440
atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc 1500
ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 1560
gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 1620
cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 1680
tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 1740
cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 1800
ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 1860
gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 1920
tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg 1980
ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc 2040
gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc 2100
atctgtgcgg tatttcacac cgcataggcc gcgataggcc gacgcgaagc ggcggggcgt 2160
agggagcgca gcgaccgaag ggtaggcgct ttttgcagct cttcggctgt gcgctggcca 2220
gacagttatg cacaggccag gcgggtttta agagttttaa taagttttaa agagttttag 2280
gcggaaaaat cgcctttttt ctcttttata tcagtcactt acatgtgtga ccggttccca 2340
atgtacggct ttgggttccc aatgtacggg ttccggttcc caatgtacgg ctttgggttc 2400
ccaatgtacg tgctatccac aggaaagaga ccttttcgac ctttttcccc tgctagggca 2460
atttgcccta gcatctgctc cgtacattag gaaccggcgg atgcttcgcc ctcgatcagg 2520
ttgcggtagc gcatgactag gatcgggcca gcctgccccg cctcctcctt caaatcgtac 2580
tccggcaggt catttgaccc gatcagcttg cgcacggtga aacagaactt cttgaactct 2640
ccggcgctgc cactgcgttc gtagatcgtc ttgaacaacc atctggcttc tgccttgcct 2700
gcggcgcggc gtgccaggcg gtagagaaaa cggccgatgc cggggtcgat caaaaagtaa 2760
tcggggtgaa ccgtcagcac gtccgggttc ttgccttctg tgatctcgcg gtacatccaa 2820
tcagcaagct cgatctcgat gtactccggc cgcccggttt cgctctttac gatcttgtag 2880
cggctaatca aggcttcacc ctcggatacc gtcaccaggc ggccgttctt ggccttcttg 2940
gtacgctgca tggcaacgtg cgtggtgttt aaccgaatgc aggtttctac caggtcgtct 3000
ttctgctttc cgccatcggc tcgccggcag aacttgagta cgtccgcaac gtgtggacgg 3060
aacacgcggc cgggcttgtc tcccttccct tcccggtatc ggttcatgga ttcggttaga 3120
tgggaaaccg ccatcagtac caggtcgtaa tcccacacac tggccatgcc ggcggggcct 3180
gcggaaacct ctacgtgccc gtctggaagc tcgtagcgga tcacctcgcc agctcgtcgg 3240
tcacgcttcg acagacggaa aacggccacg tccatgatgc tgcgactatc gcgggtgccc 3300
acgtcataga gcatcggaac gaaaaaatct ggttgctcgt cgcccttggg cggcttccta 3360
atcgacggcg caccggctgc cggcggttgc cgggattctt tgcggattcg atcagcggcc 3420
ccttgccacg attcaccggg gcgtgcttct gcctcgatgc gttgccgctg ggcggcctgc 3480
gcggccttca acttctccac caggtcatca cccagcgccg cgccgatttg taccgggccg 3540
gatggtttgc gaccgctcac gccgattcct cgggcttggg ggttccagtg ccattgcagg 3600
gccggcagac aacccagccg cttacgcctg gccaaccgcc cgttcctcca cacatggggc 3660
attccacggc gtcggtgcct ggttgttctt gattttccat gccgcctcct ttagccgcta 3720
aaattcatct actcatttat tcatttgctc atttactctg gtagctgcgc gatgtattca 3780
gatagcagct cggtaatggt cttgccttgg cgtaccgcgt acatcttcag cttggtgtga 3840
tcctccgccg gcaactgaaa gttgacccgc ttcatggctg gcgtgtctgc caggctggcc 3900
aacgttgcag ccttgctgct gcgtgcgctc ggacggccgg cacttagcgt gtttgtgctt 3960
ttgctcattt tctctttacc tcattaactc aaatgagttt tgatttaatt tcagcggcca 4020
gcgcctggac ctcgcgggca gcgtcgccct cgggttctga ttcaagaacg gttgtgccgg 4080
cggcggcagt gcctgggtag ctcacgcgct gcgtgatacg ggactcaaga atgggcagct 4140
cgtacccggc cagcgcctcg gcaacctcac cgccgatgcg cgtgcctttg atcgcccgcg 4200
acacgacaaa ggccgcttgt agccttccat ccgtgacctc aatgcgctgc ttaaccagct 4260
ccaccaggtc ggcggtggcc caaatgtcgt aagggcttgg ctgcaccgga atcagcacga 4320
agtcggctgc cttgatcgcg gacacagcca agtccgccgc ctggggcgct ccgtcgatca 4380
ctacgaagtc gcgccggccg atggccttca cgtcgcggtc aatcgtcggg cggtcgatgc 4440
cgacaacggt tagcggttga tcttcccgca cggccgccca atcgcgggca ctgccctggg 4500
gatcggaatc gactaacaga acatcggccc cggcgagttg cagggcgcgg gctagatggg 4560
ttgcgatggt cgtcttgcct gacccgcctt tctggttaag tacagcgata accttcatgc 4620
gttccccttg cgtatttgtt tatttactca tcgcatcata tacgcagcga ccgcatgacg 4680
caagctgttt tactcaaata cacatcacct ttttagatga tcagtgattt tgtgccgagc 4740
tgccggtcgg ggagctgttg gctggctggt ggcaggatat attgtggtgt aaacaaattg 4800
acgcttagac aacttaataa cacattgcgg acgtctttaa tgtactgaat ttagttactg 4860
atcactgatt aagtactgat aaatttaatt aacagatctc aactttgtat agaaaagttg 4920
atttaaatga attcaagctt ttaattaact tagccactgc aacaagttct tgaaccttag 4980
cacaatcata ttgtgcatgc acttgtttat tgcaaagaat ggtgcgtagg gaacacgcat 5040
gatttttgaa ttgctggcac ataattttat cattagaaac tggaatgcaa catgtaccct 5100
ttgtcatggt ttctttccga gacattgcac tgtttttttt aatcctatca ttatcataat 5160
gccaagaact ggtcaccaac cagcattttg catcatggtt agttgagctg tccccatgta 5220
tcaataggtg cattgtattg gtccaaaata taaatgcagt ggatgcaacc tatctcatgg 5280
ccgtcaacaa aagaaatcaa aagggaaatg caccatctta tatctccagt ttatatgaac 5340
agattggata agatcataag atcaagtggt ttatattatt ttgaggaata taacatggat 5400
tcatcctaat cactcgtcta ggcagtatgt gtattcatga tggatatggt actatactac 5460
ggagtttttt cttcacaaaa taacctgtta ttttgacctc caaccaaaca cgaattatac 5520
caaaaattgg gttatttcat ctatagtaca actctattat aaacatgcag taaattatcc 5580
tacacatata ccaaaattca agtgtaataa tcctaataca cagacttaaa aaacaaacta 5640
tttccttttt aagaaaagga aaaccatttt tttaacggaa ggaaaacaaa ttcgggtcaa 5700
ggcggaagcc agcgcgccac cccacgtcag cgaatacgga ggcgcggggt tgacggcgtc 5760
acccggtcct aacggcgacc aacaaaccag ccagaagaaa ttacagtaaa aaaaagtaaa 5820
ttgcactttg atccaccttt tattacccaa gtttcaattt ggaccaccct taaacctatc 5880
ttttcaaatt gggccgggtt gtggtttgga ctaccatgaa caacttttcg tcatgtctaa 5940
cttccctttc ggcaaacata tgaaccatat atagaggaga tcggccgtat actagagctg 6000
atgtgtttaa ggtcgttgat tgcacgagaa aaaaaaaatc caaatcgcaa caatagcaaa 6060
tttatctagt tcaaagtgaa aagatatgtt taaaggtagt ccaaagtaaa acttaggggc 6120
tgtttggttc ccagccatac tttaccatta cttgccaaca aaagttgcca caccttgtct 6180
aaggtgaggt gatcaaattg ttagccacaa cttactaagc ctaagggaat cttgccacac 6240
ttttttgagc cattgacacg tgggacttaa tttgttagag ggaaatcttg ccacaactgt 6300
ggctacaacc aaacacctgt caaatttgcc taaccttagg cgtggcaaac tgtggcaaag 6360
tgtggcttac aaccaaacac acccttagat aataaaatgt ggtccaaagc gtaattcact 6420
aaaaaaaaat caacgagacg tgtaccaaac ggagacaaac ggcatcttct cgaaatttcc 6480
caaccgctcg ctcgcccgcc tcgtcttccc ggaaaccgcg gtggtttcag cgtggcggat 6540
tctccaagca gacggagacg tcacggcacg ggactcctcc caccacccaa ccgccataaa 6600
taccagcccc ctcatctcct ctcctcgcat cagctccacc cccgaaaaat ttctccccaa 6660
tctcgcgagg ctctcgtcgt cgaatcgaat cctctcgcgt cctcaagctt ggcatccagg 6720
tacggatccg cgtcccatct ccctcacccc ccgtgttctt cgtgcctgct tctgggtcag 6780
atctgggtgg attcgcggtt gttggatgtg gggggctgtg tttatttgtc ggtggatctg 6840
gttgtctgga tctgcgtttt ctctgtcgta gttagcggat ctgatgaaat gtttagtgtt 6900
cgtgtatact ggtatggtgg atctggtcct aggatgcgtg gaatggatat atgtaggcga 6960
attggaggat ttattttgtg aattttgctg aaatgatagt tctaaacact ggatctgacc 7020
tcgggatgct gttaaatgtg gaaatcatgg tcgatgctgt catgaacatg gtgttcttat 7080
ggtagatctg agcaatgtat gtttcaaaat tgtttgtcac atggaaatgc tatggttcta 7140
gatgcaatag aatgatacat gccgagatcc cctctagttg atatgataga tcatgatgtt 7200
ttacagctat gtcatatgaa tatgttcatt tgttaccgat gtatttggat ctacttaaca 7260
tttccaaagc acgccgcgtt ctaattctag atctggtagt catgtttgta cacgtcaccc 7320
acctaataca aatacatatg tctagtgttt ggtgacactg cccgtcagat ctgttttttc 7380
cagatctgtg gaacaaatac tccacgcatg tatggtagtt ttgaaacgat cttgtatctt 7440
ccattgttgt agtaacaact aaataaagta caattgttca attattggga atcgtatttt 7500
ctgtagtgcc gatgtacagc atattcatag atgtctattt aggaactcaa attttaaatt 7560
gaggactagt tatttattgt gggtcagtct tttgaattgt gttatcttgc tgtactggcg 7620
cgccaccatg gccaccgccg ccgccgcgtc taccgcgctc actggcgcca ctaccgctgc 7680
gcccaaggcg aggcgccggg cgcacctcct ggccacccgc cgcgccctcg ccgcgcccat 7740
caggtgctca gcggcgtcac ccgccatgcc gatggctccc ccggccaccc cgctccggcc 7800
gtggggcccc accgatcccc gcaagggcgc cgacatcctc gtcgagtccc tcgagcgctg 7860
cggcgtccgc gacgtcttcg cctaccccgg cggcacgtcc atggagatcc accaggcact 7920
cacccgctcc cccgtcatcg ccaaccacct cttccgccac gagcaagggg aggcctttgc 7980
ggcctccggc tacgcgcgct cctcgggccg cgtcggcgtc tgcatcgcca cctccggccc 8040
cggcgccacc aaccttgtct ccgcgctcgc cgacgcgctg ctcgattccg tccccatggt 8100
cgccatcacg ggacaggtgc cgcgacgcat gattggcacc gacgccttcc aggagacgcc 8160
catcgtcgag gtcacccgct ccatcaccaa gcacaactac ctggtcctcg acgtcgacga 8220
catcccccgc gtcgtgcagg aggctttctt cctcgcctcc tctggtcgac cggggccggt 8280
gcttgtcgac atccccaagg acatccagca gcagatggcg gtgcctgtct gggacaagcc 8340
catgagtctg cctgggtaca ttgcgcgcct tcccaagccc cctgcgactg agttgcttga 8400
gcaggtgctg cgtcttgttg gtgaatcccg gcgccctgtt ctttatgttg gcggtggctg 8460
cgcagcatct ggtgaggagt tgcgacgctt tgtggagctg actggaatcc cggtcacaac 8520
tactcttatg ggcctcggca acttccccag cgacgaccca ctgtctctgc gcatgctagg 8580
tatgcatggc acggtgtatg caaattatgc agtggataag gccgatctgt tgcttgcact 8640
tggtgtgcgg tttgatgatc gtgtgacagg gaagattgag gcttttgcaa gcagggctaa 8700
gattgtgcac gttgatattg atccggctga gattggcaag aacaagcagc cacatgtgtc 8760
catctgtgca gatgttaagc ttgctttgca gggcatgaat gctcttcttg aaggaagcac 8820
atcaaagaag agctttgact ttggctcatg gaacgatgag ttggatcagc agaagaggga 8880
attccccctt gggtataaaa catctaatga ggagatccag ccacaatatg ctattcaggt 8940
tcttgatgag ctgacgaaag gcgaggccat catcggcaca ggtgttgggc agcaccagat 9000
gtgggcggca cagtactaca cttacaagcg gccaaggcag tggttgtctt cagctggtct 9060
tggggctatg ggatttggtt tgccggctgc tgctggtgct tctgtggcca acccaggtgt 9120
tactgttgtt gacatcgatg gagatggtag ctttctcatg aacgttcagg agctagctat 9180
gatccgaatt gagaacctcc cggtgaaggt ctttgtgcta aacaaccagc acctggggat 9240
ggtggtgcag tgggaggaca ggttctataa ggccaacaga gcgcacacat acttgggaaa 9300
cccagagaat gaaagtgaga tatatccaga tttcgtgacg atcgccaaag ggttcaacat 9360
tccagcggtc cgtgtgacaa agaagaacga agtccgcgca gcgataaaga agatgctcga 9420
gactccaggg ccgtacctct tggatataat cgtcccacac caggagcatg tgttgcctat 9480
gatccctaat ggtggggctt tcaaggatat gatcctggat ggtgatggca ggactgtgta 9540
ctagcctgca ggcctaggat cgttcaaaca tttggcaata aagtttctta agattgaatc 9600
ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt aagcatgtaa 9660
taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt agagtcccgc 9720
aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag gataaattat 9780
cgcgcgcggt gtcatctatg ttactagatc ggccggccgt ttaaacagcc tgcttttttg 9840
tacaaacttg atttaaatga attcaagctt ttaattaagc atgcgagctc ggcgcgccgg 9900
taccgcgatc gcggatcatg aaccaacggc ctggctgtat ttggtggttg tgtagggaga 9960
tggggagaag aaaagcccga ttctcttcgc tgtgatgggc tggatgcatg cgggggagcg 10020
ggaggcccaa gtacgtgcac ggtgagcggc ccacagggcg agtgtgagcg cgagaggcgg 10080
gaggaacagt ttagtaccac attgcccagc taactcgaac gcgaccaact tataaacccg 10140
cgcgctgtcg cttgtgtgca ttgagtgcta tgctgaggtt ttagagctag aaatagcaag 10200
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgctctgttc 10260
ctcgtgctgg acaagtgtgg tttccagatt ctgcaaccaa gactgcgcag gcattgctgg 10320
acttcaaccg tgaaggatta cctctgttca tcctcgctaa ctggagaggc ttctctggtg 10380
gacaaagaga tctctttgaa ggaattcttc aggctggctc gactattgtt gagaacctta 10440
ggacatacaa tcagcctgcc tttgtctaca ttcccatggc tgcagagcta cgaggagggg 10500
cttgggttgt ggttgatagc aagataaacc cagaccgcat tgagtgctat gctgagagaa 10560
ctgcaaaatc caatgttctg gaaccgcaag ggttaattga gatcaagttc aggtcagagg 10620
aactccagga ttgcatgagt cggcttgacc caacattaat tgatctgaaa gcaaaactcg 10680
aagtagcaaa taaaaatgga agtgctgaca caaaatcgct tcaagaaaat atagaagctc 10740
gaacaaaaca gttgatgcct ctatatactc agattgcgat acggtttgct gaattgcatg 10800
atacatccct cagaatggct gcgaaaggtg tgattaagaa agttgtggac tgggaagaat 10860
cacgatcttt cttttttttg cggccgcccc gggcctgcag gggatcccga tcgggccggc 10920
cgtttaaacc cactttgtac aagaaagctg ggtatttaaa tgaattcaag cttttaatta 10980
atgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat tgcatgtcta 11040
agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta 11100
tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt actacaataa 11160
tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga 11220
gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt 11280
ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca tccatttagg 11340
gtttagggtt aatggttttt atagactaat ttttttagta catctatttt attctatttt 11400
agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat agtttagata 11460
taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa 11520
aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga 11580
cgagtctaac ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga 11640
cggcacggca tctctgtcgc tgcctctgga cccctctcga gagttccgct ccaccgttgg 11700
acttgctccg ctgtcggcat ccagaaattg cgtggcggag cggcagacgt gagccggcac 11760
ggcaggcggc ctcctcctcc tctcacggca ccggcagcta cgggggattc ctttcccacc 11820
gctccttcgc tttcccttcc tcgcccgccg taataaatag acaccccctc cacaccctct 11880
ttccccaacc tcgtgttgtt cggagcgcac acacacacaa ccagatctcc cccaaatcca 11940
cccgtcggca cctccgcttc aaggtacgcc gctcgtcctc cccccccccc cccctctcta 12000
ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat 12060
gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 12120
acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 12180
gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 12240
atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 12300
tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 12360
tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 12420
tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 12480
ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 12540
ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 12600
tagaatactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 12660
atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 12720
atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 12780
gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttatttcgat 12840
cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 12900
ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 12960
gtgttacttc tgcagggcgc gccaccatgg ctcctaagaa gaagcggaag gttggtattc 13020
acggggtgcc tgcggctgac aagaagtact ccatcggcct cgacatcggc accaacagcg 13080
tcggctgggc ggtgatcacc gacgagtaca aggtcccgtc caagaagttc aaggtcctgg 13140
gcaacaccga ccgccactcc atcaagaaga acctcatcgg cgccctcctc ttcgactccg 13200
gcgagacggc ggaggcgacc cgcctcaagc gcaccgcccg ccgccgctac acccgccgca 13260
agaaccgcat ctgctacctc caggagatct tctccaacga gatggcgaag gtcgacgact 13320
ccttcttcca ccgcctcgag gagtccttcc tcgtggagga ggacaagaag cacgagcgcc 13380
accccatctt cggcaacatc gtcgacgagg tcgcctacca cgagaagtac cccactatct 13440
accaccttcg taagaagctt gttgactcta ctgataaggc tgatcttcgt ctcatctacc 13500
ttgctctcgc tcacatgatc aagttccgtg gtcacttcct tatcgagggt gaccttaacc 13560
ctgataactc cgacgtggac aagctcttca tccagctcgt ccagacctac aaccagctct 13620
tcgaggagaa ccctatcaac gcttccggtg tcgacgctaa ggcgatcctt tccgctaggc 13680
tctccaagtc caggcgtctc gagaacctca tcgcccagct ccctggtgag aagaagaacg 13740
gtcttttcgg taacctcatc gctctctccc tcggtctgac ccctaacttc aagtccaact 13800
tcgacctcgc tgaggacgct aagcttcagc tctccaagga tacctacgac gatgatctcg 13860
acaacctcct cgctcagatt ggagatcagt acgctgatct cttccttgct gctaagaacc 13920
tctccgatgc tatcctcctt tcggatatcc ttagggttaa cactgagatc actaaggctc 13980
ctctttctgc ttccatgatc aagcgctacg acgagcacca ccaggacctc accctcctca 14040
aggctcttgt tcgtcagcag ctccccgaga agtacaagga gatcttcttc gaccagtcca 14100
agaacggcta cgccggttac attgacggtg gagctagcca ggaggagttc tacaagttca 14160
tcaagccaat ccttgagaag atggatggta ctgaggagct tctcgttaag cttaaccgtg 14220
aggacctcct taggaagcag aggactttcg ataacggctc tatccctcac cagatccacc 14280
ttggtgagct tcacgccatc cttcgtaggc aggaggactt ctaccctttc ctcaaggaca 14340
accgtgagaa gatcgagaag atccttactt tccgtattcc ttactacgtt ggtcctcttg 14400
ctcgtggtaa ctcccgtttc gcttggatga ctaggaagtc cgaggagact atcacccctt 14460
ggaacttcga ggaggttgtt gacaagggtg cttccgccca gtccttcatc gagcgcatga 14520
ccaacttcga caagaacctc cccaacgaga aggtcctccc caagcactcc ctcctctacg 14580
agtacttcac ggtctacaac gagctcacca aggtcaagta cgtcaccgag ggtatgcgca 14640
agcctgcctt cctctccggc gagcagaaga aggctatcgt tgacctcctc ttcaagacca 14700
accgcaaggt caccgtcaag cagctcaagg aggactactt caagaagatc gagtgcttcg 14760
actccgtcga gatcagcggc gttgaggacc gtttcaacgc ttctctcggc acctaccacg 14820
atctcctcaa gatcatcaag gacaaggact tcctcgacaa cgaggagaac gaggacatcc 14880
tcgaggacat cgtcctcact cttactctct tcgaggatag ggagatgatc gaggagaggc 14940
tcaagactta cgctcatctc ttcgatgaca aggttatgaa gcagctcaag cgtcgccgtt 15000
acaccggttg gggtaggctc tcccgcaagc tcatcaacgg tatcagggat aagcagagcg 15060
gcaagactat cctcgacttc ctcaagtctg atggtttcgc taacaggaac ttcatgcagc 15120
tcatccacga tgactctctt accttcaagg aggatattca gaaggctcag gtgtccggtc 15180
agggcgactc tctccacgag cacattgcta accttgctgg ttcccctgct atcaagaagg 15240
gcatccttca gactgttaag gttgtcgatg agcttgtcaa ggttatgggt cgtcacaagc 15300
ctgagaacat cgtcatcgag atggctcgtg agaaccagac tacccagaag ggtcagaaga 15360
actcgaggga gcgcatgaag aggattgagg agggtatcaa ggagcttggt tctcagatcc 15420
ttaaggagca ccctgtcgag aacacccagc tccagaacga gaagctctac ctctactacc 15480
tccagaacgg tagggatatg tacgttgacc aggagctcga catcaacagg ctttctgact 15540
acgacgtcga ccacattgtt cctcagtctt tccttaagga tgactccatc gacaacaagg 15600
tcctcacgag gtccgacaag aacaggggta agtcggacaa cgtcccttcc gaggaggttg 15660
tcaagaagat gaagaactac tggaggcagc ttctcaacgc taagctcatt acccagagga 15720
agttcgacaa cctcacgaag gctgagaggg gtggcctttc cgagcttgac aaggctggtt 15780
tcatcaagag gcagcttgtt gagacgaggc agattaccaa gcacgttgct cagatcctcg 15840
attctaggat gaacaccaag tacgacgaga acgacaagct catccgcgag gtcaaggtga 15900
tcaccctcaa gtccaagctc gtctccgact tccgcaagga cttccagttc tacaaggtcc 15960
gcgagatcaa caactaccac cacgctcacg atgcttacct taacgctgtc gttggcaccg 16020
ctcttatcaa gaagtaccct aagcttgagt ccgagttcgt ctacggtgac tacaaggtct 16080
acgacgttcg taagatgatc gccaagtccg agcaggagat cggcaaggcc accgccaagt 16140
acttcttcta ctccaacatc atgaacttct tcaagaccga gatcaccctc gccaacggcg 16200
agatccgcaa gcgccctctt atcgagacga acggtgagac tggtgagatc gtttgggaca 16260
agggtcgcga cttcgctact gttcgcaagg tcctttctat gcctcaggtt aacatcgtca 16320
agaagaccga ggtccagacc ggtggcttct ccaaggagtc tatccttcca aagagaaact 16380
cggacaagct catcgctagg aagaaggatt gggaccctaa gaagtacggt ggtttcgact 16440
cccctactgt cgcctactcc gtcctcgtgg tcgccaaggt ggagaagggt aagtcgaaga 16500
agctcaagtc cgtcaaggag ctcctcggca tcaccatcat ggagcgctcc tccttcgaga 16560
agaacccgat cgacttcctc gaggccaagg gctacaagga ggtcaagaag gacctcatca 16620
tcaagctccc caagtactct cttttcgagc tcgagaacgg tcgtaagagg atgctggctt 16680
ccgctggtga gctccagaag ggtaacgagc ttgctcttcc ttccaagtac gtgaacttcc 16740
tctacctcgc ctcccactac gagaagctca agggttcccc tgaggataac gagcagaagc 16800
agctcttcgt ggagcagcac aagcactacc tcgacgagat catcgagcag atctccgagt 16860
tctccaagcg cgtcatcctc gctgacgcta acctcgacaa ggtcctctcc gcctacaaca 16920
agcaccgcga caagcccatc cgcgagcagg ccgagaacat catccacctc ttcacgctca 16980
cgaacctcgg cgcccctgct gctttcaagt acttcgacac caccatcgac aggaagcgtt 17040
acacgtccac caaggaggtt ctcgacgcta ctctcatcca ccagtccatc accggtcttt 17100
acgagactcg tatcgacctt tcccagcttg gtggtgataa gcgtcctgct gccaccaaaa 17160
aggccggaca ggctaagaaa aagaagtagc ctgcaggtcc tgctttaatg agatatgcga 17220
gacgcctatg atcgcatgat atttgctttc aattctgttg tgcacgttgt aaaaaacctg 17280
agcatgtgta gctcagatcc ttaccgccgg tttcggttca ttctaatgaa tatatcaccc 17340
gttactatcg tatttttatg aataatattc tccgttcaat ttactgattg taccctacta 17400
cttatatgta caatattaaa atgaaaacaa tatattgtgc tgaataggtt tatagcgaca 17460
tctatgatag agcgccacaa taacaaacaa ttgcgtttta ttattacaaa tccaatttta 17520
aaaaaagcgg cagaaccggt caaacctaaa agactgatta cataaatctt attcaaattt 17580
caaaagtgcc ccaggggcta gtatctacga cacaccgagc ggcgaactaa taacgctcac 17640
tgaagggaac tccggttccc cgccggcgcg catgggtgag attccttgaa gttgagtatt 17700
ggccgtccgc tctaccgaaa gttacgggca ccattcaacc cggtccagca cggcggccgg 17760
gtaaccgact tgctgccccg agaattatgc agcatttttt tggtgtatgt gggccccaaa 17820
tgaagtgcag gtcaaacctt gacagtgacg acaaatcgtt gggcgggtcc agggcgaatt 17880
ttgcgacaac atgtcgaggc tcagcaggcc ggccgtttaa accaacttta 17930
<210> 67
<211> 3734
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector CC019
<400> 67
cgcggatcat gaaccaacgg cctggctgta tttggtggtt gtgtagggag atggggagaa 60
gaaaagcccg attctcttcg ctgtgatggg ctggatgcat gcgggggagc gggaggccca 120
agtacgtgca cggtgagcgg cccacagggc gagtgtgagc gcgagaggcg ggaggaacag 180
tttagtacca cattgcccag ctaactcgaa cgcgaccaac ttataaaccc gcgcgctgtc 240
gcttgtgtga ctgcaaaagg caatgttcgt tttagagcta gaaatagcaa gttaaaataa 300
ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctctgtt cctcgtgctg 360
gacaagtgtg gtttccagat tctgcaacca agactgcgca ggcattgctg gacttcaacc 420
gtgaaggatt acctctgttc atcctcgcta actggagagg cttctctggt ggacaaagag 480
atctctttga aggaattctt caggctggct cgactattgt tgagaacctt aggacataca 540
atcagcctgc ctttgtctac attcccatgg ctgcagagct acgaggaggg gcttgggttg 600
tggttgatag caagataaac ccagaccgca ttgagtgcta tgctgagagg actgcaaaat 660
ccaatgttct cgaaccgcaa gggttaattg agatcaagtt caggtcagag gaactccagg 720
attgcatgag tcggcttgac ccaacattaa ttgatctgaa agcaaaactc gaagtagcaa 780
ataaaaatgg aagtgctgac acaaaatcgc ttcaagaaaa tatagaagct cgaacaaaac 840
agttgatgcc tctatatact cagattgcga tacggtttgc tgaattgcat gatacatccc 900
tcagaatggc tgcgaaaggt gtgattaaga aagttgtgga ctgggaagaa tcacgatctt 960
tctttttttt gcggccgccc cgggcctgca ggggatcccg atcgggccgg ccgtttaaac 1020
ccactttgta caagaaagtt gaacgagaaa cgtaaaatga tataaatatc aatatattaa 1080
attagatttt gcataaaaaa cagactacat aatactgtaa aacacaacat atgcagtcac 1140
tatgaaccaa ctacttagat ggtattagtg acctgtactg ggcctcatgg gccttccgct 1200
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaacat ggtcatagct 1260
gtttccttgc gtattgggcg ctctccgctt cctcgctcac tgactcgctg cgctcggtcg 1320
ttcgggtaaa gcctggggtg cctaatgagc aaaaggccag caaaaggcca ggaaccgtaa 1380
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 1440
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 1500
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 1560
cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 1620
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 1680
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 1740
gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 1800
agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg 1860
cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 1920
aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 1980
aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 2040
ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 2100
aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 2160
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 2220
agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 2280
cagtgctgca atgataccgc gagaaccacg ctcaccggct ccagatttat cagcaataaa 2340
ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 2400
gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 2460
cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 2520
cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 2580
ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 2640
catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 2700
tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 2760
ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 2820
catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 2880
cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 2940
cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 3000
acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 3060
ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 3120
tccgcgcaca tttccccgaa aagtgccacc taaattgtaa gcgttaatat tttgttaaaa 3180
ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa 3240
atcccttata aatcaaaaga atagaccgag atagggttga gtggccgcta cagggcgctc 3300
ccattcgcca ttcaggctgc gcaactgttg ggaagggcgt ttcggtgcgg gcctcttcgc 3360
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 3420
ggttttccca gtcacgacgt tgtaaaacga cggccagtga gcgcgacgta atacgactca 3480
ctatagggcg aattggcgga aggccgtcaa ggccgcatta caggtcacta ataccatcta 3540
agtagttggt tcatagtgac tgcatatgtt gtgttttaca gtattatgta gtctgttttt 3600
tatgcaaaat ctaatttaat atattgatat ttatatcatt ttacgtttct cgttcaactt 3660
ttttgtacaa acttgattta aatgaattca agcttttaat taagcatgcg agctcggcgc 3720
gccggtaccg cgat 3734
<210> 68
<211> 17930
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector RLW138
<400> 68
ttatacatag ttgataattc actgggccgg ccgtttaaac ttagttacta atcagtgatc 60
agattgtcgt ttcccgcctt cactttaaac tatcagtgtt tgacaggata tattggcggg 120
taaacctaag agaaaagagc gtttattaga ataatcggat atttaaaagg gcgtgaaaag 180
gtttatccgt tcgtccattt gtatgtcaat attggggggg ggggaaagcc acgttgtgtc 240
tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa caataaaact 300
gtctgcttac ataaacagta atacaagggg tgttcgccac catgagccat atccagcgtg 360
aaacctcgtg ctcccgcccg cgcctcaatt ccaatatgga tgccgacctt tatggctaca 420
agtgggcgcg cgacaacgtc ggccagtcgg gcgcgaccat ttatcggctt tatggcaaac 480
ccgatgcccc ggaactgttc ctgaagcacg gcaaaggcag cgtcgcaaac gatgtcaccg 540
atgagatggt ccgcctgaac tggcttaccg agttcatgcc gctgccgacg attaagcatt 600
tcatccgtac cccggacgat gcctggctct tgaccacggc cattccgggc aaaacggcct 660
ttcaggtcct tgaagagtac ccggactccg gtgagaatat cgtggacgcc ctcgcggtct 720
tcctccgccg tttgcatagc atccccgtgt gcaactgccc cttcaactcg gaccgggttt 780
tccgcctggc acaggcccag tcgcgcatga ataacggcct cgttgacgcg agcgatttcg 840
acgatgaacg gaatggctgg ccggtggaac aggtttggaa ggaaatgcac aaactgcttc 900
cgttctcgcc ggattcggtg gtcacgcatg gtgatttttc cctggataat ctgatctttg 960
acgagggcaa gctgatcggc tgcatcgacg tgggtcgcgt cggtatcgcc gaccgctatc 1020
aggacctggc gatcttgtgg aattgcctcg gcgagttctc gccctcgctc cagaagcgcc 1080
tgttccagaa gtacggcatc gacaacccgg atatgaacaa gctccagttc cacctcatgc 1140
tggacgaatt tttttgaaca gaattggtta attggttgta acactggcag agcattacgc 1200
tgacttgacg ggacggcggc tttgttgaat aaatcgaact tttgctgagt tgaaggatcg 1260
atgagttgaa ggaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 1320
gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 1380
atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 1440
atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc 1500
ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 1560
gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 1620
cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 1680
tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 1740
cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 1800
ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 1860
gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 1920
tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg 1980
ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc 2040
gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc 2100
atctgtgcgg tatttcacac cgcataggcc gcgataggcc gacgcgaagc ggcggggcgt 2160
agggagcgca gcgaccgaag ggtaggcgct ttttgcagct cttcggctgt gcgctggcca 2220
gacagttatg cacaggccag gcgggtttta agagttttaa taagttttaa agagttttag 2280
gcggaaaaat cgcctttttt ctcttttata tcagtcactt acatgtgtga ccggttccca 2340
atgtacggct ttgggttccc aatgtacggg ttccggttcc caatgtacgg ctttgggttc 2400
ccaatgtacg tgctatccac aggaaagaga ccttttcgac ctttttcccc tgctagggca 2460
atttgcccta gcatctgctc cgtacattag gaaccggcgg atgcttcgcc ctcgatcagg 2520
ttgcggtagc gcatgactag gatcgggcca gcctgccccg cctcctcctt caaatcgtac 2580
tccggcaggt catttgaccc gatcagcttg cgcacggtga aacagaactt cttgaactct 2640
ccggcgctgc cactgcgttc gtagatcgtc ttgaacaacc atctggcttc tgccttgcct 2700
gcggcgcggc gtgccaggcg gtagagaaaa cggccgatgc cggggtcgat caaaaagtaa 2760
tcggggtgaa ccgtcagcac gtccgggttc ttgccttctg tgatctcgcg gtacatccaa 2820
tcagcaagct cgatctcgat gtactccggc cgcccggttt cgctctttac gatcttgtag 2880
cggctaatca aggcttcacc ctcggatacc gtcaccaggc ggccgttctt ggccttcttg 2940
gtacgctgca tggcaacgtg cgtggtgttt aaccgaatgc aggtttctac caggtcgtct 3000
ttctgctttc cgccatcggc tcgccggcag aacttgagta cgtccgcaac gtgtggacgg 3060
aacacgcggc cgggcttgtc tcccttccct tcccggtatc ggttcatgga ttcggttaga 3120
tgggaaaccg ccatcagtac caggtcgtaa tcccacacac tggccatgcc ggcggggcct 3180
gcggaaacct ctacgtgccc gtctggaagc tcgtagcgga tcacctcgcc agctcgtcgg 3240
tcacgcttcg acagacggaa aacggccacg tccatgatgc tgcgactatc gcgggtgccc 3300
acgtcataga gcatcggaac gaaaaaatct ggttgctcgt cgcccttggg cggcttccta 3360
atcgacggcg caccggctgc cggcggttgc cgggattctt tgcggattcg atcagcggcc 3420
ccttgccacg attcaccggg gcgtgcttct gcctcgatgc gttgccgctg ggcggcctgc 3480
gcggccttca acttctccac caggtcatca cccagcgccg cgccgatttg taccgggccg 3540
gatggtttgc gaccgctcac gccgattcct cgggcttggg ggttccagtg ccattgcagg 3600
gccggcagac aacccagccg cttacgcctg gccaaccgcc cgttcctcca cacatggggc 3660
attccacggc gtcggtgcct ggttgttctt gattttccat gccgcctcct ttagccgcta 3720
aaattcatct actcatttat tcatttgctc atttactctg gtagctgcgc gatgtattca 3780
gatagcagct cggtaatggt cttgccttgg cgtaccgcgt acatcttcag cttggtgtga 3840
tcctccgccg gcaactgaaa gttgacccgc ttcatggctg gcgtgtctgc caggctggcc 3900
aacgttgcag ccttgctgct gcgtgcgctc ggacggccgg cacttagcgt gtttgtgctt 3960
ttgctcattt tctctttacc tcattaactc aaatgagttt tgatttaatt tcagcggcca 4020
gcgcctggac ctcgcgggca gcgtcgccct cgggttctga ttcaagaacg gttgtgccgg 4080
cggcggcagt gcctgggtag ctcacgcgct gcgtgatacg ggactcaaga atgggcagct 4140
cgtacccggc cagcgcctcg gcaacctcac cgccgatgcg cgtgcctttg atcgcccgcg 4200
acacgacaaa ggccgcttgt agccttccat ccgtgacctc aatgcgctgc ttaaccagct 4260
ccaccaggtc ggcggtggcc caaatgtcgt aagggcttgg ctgcaccgga atcagcacga 4320
agtcggctgc cttgatcgcg gacacagcca agtccgccgc ctggggcgct ccgtcgatca 4380
ctacgaagtc gcgccggccg atggccttca cgtcgcggtc aatcgtcggg cggtcgatgc 4440
cgacaacggt tagcggttga tcttcccgca cggccgccca atcgcgggca ctgccctggg 4500
gatcggaatc gactaacaga acatcggccc cggcgagttg cagggcgcgg gctagatggg 4560
ttgcgatggt cgtcttgcct gacccgcctt tctggttaag tacagcgata accttcatgc 4620
gttccccttg cgtatttgtt tatttactca tcgcatcata tacgcagcga ccgcatgacg 4680
caagctgttt tactcaaata cacatcacct ttttagatga tcagtgattt tgtgccgagc 4740
tgccggtcgg ggagctgttg gctggctggt ggcaggatat attgtggtgt aaacaaattg 4800
acgcttagac aacttaataa cacattgcgg acgtctttaa tgtactgaat ttagttactg 4860
atcactgatt aagtactgat aaatttaatt aacagatctc aactttgtat agaaaagttg 4920
atttaaatga attcaagctt ttaattaact tagccactgc aacaagttct tgaaccttag 4980
cacaatcata ttgtgcatgc acttgtttat tgcaaagaat ggtgcgtagg gaacacgcat 5040
gatttttgaa ttgctggcac ataattttat cattagaaac tggaatgcaa catgtaccct 5100
ttgtcatggt ttctttccga gacattgcac tgtttttttt aatcctatca ttatcataat 5160
gccaagaact ggtcaccaac cagcattttg catcatggtt agttgagctg tccccatgta 5220
tcaataggtg cattgtattg gtccaaaata taaatgcagt ggatgcaacc tatctcatgg 5280
ccgtcaacaa aagaaatcaa aagggaaatg caccatctta tatctccagt ttatatgaac 5340
agattggata agatcataag atcaagtggt ttatattatt ttgaggaata taacatggat 5400
tcatcctaat cactcgtcta ggcagtatgt gtattcatga tggatatggt actatactac 5460
ggagtttttt cttcacaaaa taacctgtta ttttgacctc caaccaaaca cgaattatac 5520
caaaaattgg gttatttcat ctatagtaca actctattat aaacatgcag taaattatcc 5580
tacacatata ccaaaattca agtgtaataa tcctaataca cagacttaaa aaacaaacta 5640
tttccttttt aagaaaagga aaaccatttt tttaacggaa ggaaaacaaa ttcgggtcaa 5700
ggcggaagcc agcgcgccac cccacgtcag cgaatacgga ggcgcggggt tgacggcgtc 5760
acccggtcct aacggcgacc aacaaaccag ccagaagaaa ttacagtaaa aaaaagtaaa 5820
ttgcactttg atccaccttt tattacccaa gtttcaattt ggaccaccct taaacctatc 5880
ttttcaaatt gggccgggtt gtggtttgga ctaccatgaa caacttttcg tcatgtctaa 5940
cttccctttc ggcaaacata tgaaccatat atagaggaga tcggccgtat actagagctg 6000
atgtgtttaa ggtcgttgat tgcacgagaa aaaaaaaatc caaatcgcaa caatagcaaa 6060
tttatctagt tcaaagtgaa aagatatgtt taaaggtagt ccaaagtaaa acttaggggc 6120
tgtttggttc ccagccatac tttaccatta cttgccaaca aaagttgcca caccttgtct 6180
aaggtgaggt gatcaaattg ttagccacaa cttactaagc ctaagggaat cttgccacac 6240
ttttttgagc cattgacacg tgggacttaa tttgttagag ggaaatcttg ccacaactgt 6300
ggctacaacc aaacacctgt caaatttgcc taaccttagg cgtggcaaac tgtggcaaag 6360
tgtggcttac aaccaaacac acccttagat aataaaatgt ggtccaaagc gtaattcact 6420
aaaaaaaaat caacgagacg tgtaccaaac ggagacaaac ggcatcttct cgaaatttcc 6480
caaccgctcg ctcgcccgcc tcgtcttccc ggaaaccgcg gtggtttcag cgtggcggat 6540
tctccaagca gacggagacg tcacggcacg ggactcctcc caccacccaa ccgccataaa 6600
taccagcccc ctcatctcct ctcctcgcat cagctccacc cccgaaaaat ttctccccaa 6660
tctcgcgagg ctctcgtcgt cgaatcgaat cctctcgcgt cctcaagctt ggcatccagg 6720
tacggatccg cgtcccatct ccctcacccc ccgtgttctt cgtgcctgct tctgggtcag 6780
atctgggtgg attcgcggtt gttggatgtg gggggctgtg tttatttgtc ggtggatctg 6840
gttgtctgga tctgcgtttt ctctgtcgta gttagcggat ctgatgaaat gtttagtgtt 6900
cgtgtatact ggtatggtgg atctggtcct aggatgcgtg gaatggatat atgtaggcga 6960
attggaggat ttattttgtg aattttgctg aaatgatagt tctaaacact ggatctgacc 7020
tcgggatgct gttaaatgtg gaaatcatgg tcgatgctgt catgaacatg gtgttcttat 7080
ggtagatctg agcaatgtat gtttcaaaat tgtttgtcac atggaaatgc tatggttcta 7140
gatgcaatag aatgatacat gccgagatcc cctctagttg atatgataga tcatgatgtt 7200
ttacagctat gtcatatgaa tatgttcatt tgttaccgat gtatttggat ctacttaaca 7260
tttccaaagc acgccgcgtt ctaattctag atctggtagt catgtttgta cacgtcaccc 7320
acctaataca aatacatatg tctagtgttt ggtgacactg cccgtcagat ctgttttttc 7380
cagatctgtg gaacaaatac tccacgcatg tatggtagtt ttgaaacgat cttgtatctt 7440
ccattgttgt agtaacaact aaataaagta caattgttca attattggga atcgtatttt 7500
ctgtagtgcc gatgtacagc atattcatag atgtctattt aggaactcaa attttaaatt 7560
gaggactagt tatttattgt gggtcagtct tttgaattgt gttatcttgc tgtactggcg 7620
cgccaccatg gccaccgccg ccgccgcgtc taccgcgctc actggcgcca ctaccgctgc 7680
gcccaaggcg aggcgccggg cgcacctcct ggccacccgc cgcgccctcg ccgcgcccat 7740
caggtgctca gcggcgtcac ccgccatgcc gatggctccc ccggccaccc cgctccggcc 7800
gtggggcccc accgatcccc gcaagggcgc cgacatcctc gtcgagtccc tcgagcgctg 7860
cggcgtccgc gacgtcttcg cctaccccgg cggcacgtcc atggagatcc accaggcact 7920
cacccgctcc cccgtcatcg ccaaccacct cttccgccac gagcaagggg aggcctttgc 7980
ggcctccggc tacgcgcgct cctcgggccg cgtcggcgtc tgcatcgcca cctccggccc 8040
cggcgccacc aaccttgtct ccgcgctcgc cgacgcgctg ctcgattccg tccccatggt 8100
cgccatcacg ggacaggtgc cgcgacgcat gattggcacc gacgccttcc aggagacgcc 8160
catcgtcgag gtcacccgct ccatcaccaa gcacaactac ctggtcctcg acgtcgacga 8220
catcccccgc gtcgtgcagg aggctttctt cctcgcctcc tctggtcgac cggggccggt 8280
gcttgtcgac atccccaagg acatccagca gcagatggcg gtgcctgtct gggacaagcc 8340
catgagtctg cctgggtaca ttgcgcgcct tcccaagccc cctgcgactg agttgcttga 8400
gcaggtgctg cgtcttgttg gtgaatcccg gcgccctgtt ctttatgttg gcggtggctg 8460
cgcagcatct ggtgaggagt tgcgacgctt tgtggagctg actggaatcc cggtcacaac 8520
tactcttatg ggcctcggca acttccccag cgacgaccca ctgtctctgc gcatgctagg 8580
tatgcatggc acggtgtatg caaattatgc agtggataag gccgatctgt tgcttgcact 8640
tggtgtgcgg tttgatgatc gtgtgacagg gaagattgag gcttttgcaa gcagggctaa 8700
gattgtgcac gttgatattg atccggctga gattggcaag aacaagcagc cacatgtgtc 8760
catctgtgca gatgttaagc ttgctttgca gggcatgaat gctcttcttg aaggaagcac 8820
atcaaagaag agctttgact ttggctcatg gaacgatgag ttggatcagc agaagaggga 8880
attccccctt gggtataaaa catctaatga ggagatccag ccacaatatg ctattcaggt 8940
tcttgatgag ctgacgaaag gcgaggccat catcggcaca ggtgttgggc agcaccagat 9000
gtgggcggca cagtactaca cttacaagcg gccaaggcag tggttgtctt cagctggtct 9060
tggggctatg ggatttggtt tgccggctgc tgctggtgct tctgtggcca acccaggtgt 9120
tactgttgtt gacatcgatg gagatggtag ctttctcatg aacgttcagg agctagctat 9180
gatccgaatt gagaacctcc cggtgaaggt ctttgtgcta aacaaccagc acctggggat 9240
ggtggtgcag tgggaggaca ggttctataa ggccaacaga gcgcacacat acttgggaaa 9300
cccagagaat gaaagtgaga tatatccaga tttcgtgacg atcgccaaag ggttcaacat 9360
tccagcggtc cgtgtgacaa agaagaacga agtccgcgca gcgataaaga agatgctcga 9420
gactccaggg ccgtacctct tggatataat cgtcccacac caggagcatg tgttgcctat 9480
gatccctaat ggtggggctt tcaaggatat gatcctggat ggtgatggca ggactgtgta 9540
ctagcctgca ggcctaggat cgttcaaaca tttggcaata aagtttctta agattgaatc 9600
ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt aagcatgtaa 9660
taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt agagtcccgc 9720
aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag gataaattat 9780
cgcgcgcggt gtcatctatg ttactagatc ggccggccgt ttaaacagcc tgcttttttg 9840
tacaaacttg atttaaatga attcaagctt ttaattaagc atgcgagctc ggcgcgccgg 9900
taccgcgatc gcggatcatg aaccaacggc ctggctgtat ttggtggttg tgtagggaga 9960
tggggagaag aaaagcccga ttctcttcgc tgtgatgggc tggatgcatg cgggggagcg 10020
ggaggcccaa gtacgtgcac ggtgagcggc ccacagggcg agtgtgagcg cgagaggcgg 10080
gaggaacagt ttagtaccac attgcccagc taactcgaac gcgaccaact tataaacccg 10140
cgcgctgtcg cttgtgtgac tgcaaaaggc aatgttcgtt ttagagctag aaatagcaag 10200
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgctctgttc 10260
ctcgtgctgg acaagtgtgg tttccagatt ctgcaaccaa gactgcgcag gcattgctgg 10320
acttcaaccg tgaaggatta cctctgttca tcctcgctaa ctggagaggc ttctctggtg 10380
gacaaagaga tctctttgaa ggaattcttc aggctggctc gactattgtt gagaacctta 10440
ggacatacaa tcagcctgcc tttgtctaca ttcccatggc tgcagagcta cgaggagggg 10500
cttgggttgt ggttgatagc aagataaacc cagaccgcat tgagtgctat gctgagagga 10560
ctgcaaaatc caatgttctc gaaccgcaag ggttaattga gatcaagttc aggtcagagg 10620
aactccagga ttgcatgagt cggcttgacc caacattaat tgatctgaaa gcaaaactcg 10680
aagtagcaaa taaaaatgga agtgctgaca caaaatcgct tcaagaaaat atagaagctc 10740
gaacaaaaca gttgatgcct ctatatactc agattgcgat acggtttgct gaattgcatg 10800
atacatccct cagaatggct gcgaaaggtg tgattaagaa agttgtggac tgggaagaat 10860
cacgatcttt cttttttttg cggccgcccc gggcctgcag gggatcccga tcgggccggc 10920
cgtttaaacc cactttgtac aagaaagctg ggtatttaaa tgaattcaag cttttaatta 10980
atgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat tgcatgtcta 11040
agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta 11100
tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt actacaataa 11160
tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga 11220
gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt 11280
ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca tccatttagg 11340
gtttagggtt aatggttttt atagactaat ttttttagta catctatttt attctatttt 11400
agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat agtttagata 11460
taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa 11520
aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga 11580
cgagtctaac ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga 11640
cggcacggca tctctgtcgc tgcctctgga cccctctcga gagttccgct ccaccgttgg 11700
acttgctccg ctgtcggcat ccagaaattg cgtggcggag cggcagacgt gagccggcac 11760
ggcaggcggc ctcctcctcc tctcacggca ccggcagcta cgggggattc ctttcccacc 11820
gctccttcgc tttcccttcc tcgcccgccg taataaatag acaccccctc cacaccctct 11880
ttccccaacc tcgtgttgtt cggagcgcac acacacacaa ccagatctcc cccaaatcca 11940
cccgtcggca cctccgcttc aaggtacgcc gctcgtcctc cccccccccc cccctctcta 12000
ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat 12060
gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 12120
acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 12180
gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 12240
atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 12300
tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 12360
tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 12420
tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 12480
ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 12540
ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 12600
tagaatactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 12660
atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 12720
atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 12780
gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttatttcgat 12840
cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 12900
ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 12960
gtgttacttc tgcagggcgc gccaccatgg ctcctaagaa gaagcggaag gttggtattc 13020
acggggtgcc tgcggctgac aagaagtact ccatcggcct cgacatcggc accaacagcg 13080
tcggctgggc ggtgatcacc gacgagtaca aggtcccgtc caagaagttc aaggtcctgg 13140
gcaacaccga ccgccactcc atcaagaaga acctcatcgg cgccctcctc ttcgactccg 13200
gcgagacggc ggaggcgacc cgcctcaagc gcaccgcccg ccgccgctac acccgccgca 13260
agaaccgcat ctgctacctc caggagatct tctccaacga gatggcgaag gtcgacgact 13320
ccttcttcca ccgcctcgag gagtccttcc tcgtggagga ggacaagaag cacgagcgcc 13380
accccatctt cggcaacatc gtcgacgagg tcgcctacca cgagaagtac cccactatct 13440
accaccttcg taagaagctt gttgactcta ctgataaggc tgatcttcgt ctcatctacc 13500
ttgctctcgc tcacatgatc aagttccgtg gtcacttcct tatcgagggt gaccttaacc 13560
ctgataactc cgacgtggac aagctcttca tccagctcgt ccagacctac aaccagctct 13620
tcgaggagaa ccctatcaac gcttccggtg tcgacgctaa ggcgatcctt tccgctaggc 13680
tctccaagtc caggcgtctc gagaacctca tcgcccagct ccctggtgag aagaagaacg 13740
gtcttttcgg taacctcatc gctctctccc tcggtctgac ccctaacttc aagtccaact 13800
tcgacctcgc tgaggacgct aagcttcagc tctccaagga tacctacgac gatgatctcg 13860
acaacctcct cgctcagatt ggagatcagt acgctgatct cttccttgct gctaagaacc 13920
tctccgatgc tatcctcctt tcggatatcc ttagggttaa cactgagatc actaaggctc 13980
ctctttctgc ttccatgatc aagcgctacg acgagcacca ccaggacctc accctcctca 14040
aggctcttgt tcgtcagcag ctccccgaga agtacaagga gatcttcttc gaccagtcca 14100
agaacggcta cgccggttac attgacggtg gagctagcca ggaggagttc tacaagttca 14160
tcaagccaat ccttgagaag atggatggta ctgaggagct tctcgttaag cttaaccgtg 14220
aggacctcct taggaagcag aggactttcg ataacggctc tatccctcac cagatccacc 14280
ttggtgagct tcacgccatc cttcgtaggc aggaggactt ctaccctttc ctcaaggaca 14340
accgtgagaa gatcgagaag atccttactt tccgtattcc ttactacgtt ggtcctcttg 14400
ctcgtggtaa ctcccgtttc gcttggatga ctaggaagtc cgaggagact atcacccctt 14460
ggaacttcga ggaggttgtt gacaagggtg cttccgccca gtccttcatc gagcgcatga 14520
ccaacttcga caagaacctc cccaacgaga aggtcctccc caagcactcc ctcctctacg 14580
agtacttcac ggtctacaac gagctcacca aggtcaagta cgtcaccgag ggtatgcgca 14640
agcctgcctt cctctccggc gagcagaaga aggctatcgt tgacctcctc ttcaagacca 14700
accgcaaggt caccgtcaag cagctcaagg aggactactt caagaagatc gagtgcttcg 14760
actccgtcga gatcagcggc gttgaggacc gtttcaacgc ttctctcggc acctaccacg 14820
atctcctcaa gatcatcaag gacaaggact tcctcgacaa cgaggagaac gaggacatcc 14880
tcgaggacat cgtcctcact cttactctct tcgaggatag ggagatgatc gaggagaggc 14940
tcaagactta cgctcatctc ttcgatgaca aggttatgaa gcagctcaag cgtcgccgtt 15000
acaccggttg gggtaggctc tcccgcaagc tcatcaacgg tatcagggat aagcagagcg 15060
gcaagactat cctcgacttc ctcaagtctg atggtttcgc taacaggaac ttcatgcagc 15120
tcatccacga tgactctctt accttcaagg aggatattca gaaggctcag gtgtccggtc 15180
agggcgactc tctccacgag cacattgcta accttgctgg ttcccctgct atcaagaagg 15240
gcatccttca gactgttaag gttgtcgatg agcttgtcaa ggttatgggt cgtcacaagc 15300
ctgagaacat cgtcatcgag atggctcgtg agaaccagac tacccagaag ggtcagaaga 15360
actcgaggga gcgcatgaag aggattgagg agggtatcaa ggagcttggt tctcagatcc 15420
ttaaggagca ccctgtcgag aacacccagc tccagaacga gaagctctac ctctactacc 15480
tccagaacgg tagggatatg tacgttgacc aggagctcga catcaacagg ctttctgact 15540
acgacgtcga ccacattgtt cctcagtctt tccttaagga tgactccatc gacaacaagg 15600
tcctcacgag gtccgacaag aacaggggta agtcggacaa cgtcccttcc gaggaggttg 15660
tcaagaagat gaagaactac tggaggcagc ttctcaacgc taagctcatt acccagagga 15720
agttcgacaa cctcacgaag gctgagaggg gtggcctttc cgagcttgac aaggctggtt 15780
tcatcaagag gcagcttgtt gagacgaggc agattaccaa gcacgttgct cagatcctcg 15840
attctaggat gaacaccaag tacgacgaga acgacaagct catccgcgag gtcaaggtga 15900
tcaccctcaa gtccaagctc gtctccgact tccgcaagga cttccagttc tacaaggtcc 15960
gcgagatcaa caactaccac cacgctcacg atgcttacct taacgctgtc gttggcaccg 16020
ctcttatcaa gaagtaccct aagcttgagt ccgagttcgt ctacggtgac tacaaggtct 16080
acgacgttcg taagatgatc gccaagtccg agcaggagat cggcaaggcc accgccaagt 16140
acttcttcta ctccaacatc atgaacttct tcaagaccga gatcaccctc gccaacggcg 16200
agatccgcaa gcgccctctt atcgagacga acggtgagac tggtgagatc gtttgggaca 16260
agggtcgcga cttcgctact gttcgcaagg tcctttctat gcctcaggtt aacatcgtca 16320
agaagaccga ggtccagacc ggtggcttct ccaaggagtc tatccttcca aagagaaact 16380
cggacaagct catcgctagg aagaaggatt gggaccctaa gaagtacggt ggtttcgact 16440
cccctactgt cgcctactcc gtcctcgtgg tcgccaaggt ggagaagggt aagtcgaaga 16500
agctcaagtc cgtcaaggag ctcctcggca tcaccatcat ggagcgctcc tccttcgaga 16560
agaacccgat cgacttcctc gaggccaagg gctacaagga ggtcaagaag gacctcatca 16620
tcaagctccc caagtactct cttttcgagc tcgagaacgg tcgtaagagg atgctggctt 16680
ccgctggtga gctccagaag ggtaacgagc ttgctcttcc ttccaagtac gtgaacttcc 16740
tctacctcgc ctcccactac gagaagctca agggttcccc tgaggataac gagcagaagc 16800
agctcttcgt ggagcagcac aagcactacc tcgacgagat catcgagcag atctccgagt 16860
tctccaagcg cgtcatcctc gctgacgcta acctcgacaa ggtcctctcc gcctacaaca 16920
agcaccgcga caagcccatc cgcgagcagg ccgagaacat catccacctc ttcacgctca 16980
cgaacctcgg cgcccctgct gctttcaagt acttcgacac caccatcgac aggaagcgtt 17040
acacgtccac caaggaggtt ctcgacgcta ctctcatcca ccagtccatc accggtcttt 17100
acgagactcg tatcgacctt tcccagcttg gtggtgataa gcgtcctgct gccaccaaaa 17160
aggccggaca ggctaagaaa aagaagtagc ctgcaggtcc tgctttaatg agatatgcga 17220
gacgcctatg atcgcatgat atttgctttc aattctgttg tgcacgttgt aaaaaacctg 17280
agcatgtgta gctcagatcc ttaccgccgg tttcggttca ttctaatgaa tatatcaccc 17340
gttactatcg tatttttatg aataatattc tccgttcaat ttactgattg taccctacta 17400
cttatatgta caatattaaa atgaaaacaa tatattgtgc tgaataggtt tatagcgaca 17460
tctatgatag agcgccacaa taacaaacaa ttgcgtttta ttattacaaa tccaatttta 17520
aaaaaagcgg cagaaccggt caaacctaaa agactgatta cataaatctt attcaaattt 17580
caaaagtgcc ccaggggcta gtatctacga cacaccgagc ggcgaactaa taacgctcac 17640
tgaagggaac tccggttccc cgccggcgcg catgggtgag attccttgaa gttgagtatt 17700
ggccgtccgc tctaccgaaa gttacgggca ccattcaacc cggtccagca cggcggccgg 17760
gtaaccgact tgctgccccg agaattatgc agcatttttt tggtgtatgt gggccccaaa 17820
tgaagtgcag gtcaaacctt gacagtgacg acaaatcgtt gggcgggtcc agggcgaatt 17880
ttgcgacaac atgtcgaggc tcagcaggcc ggccgtttaa accaacttta 17930
<210> 69
<211> 3755
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector CC020
<400> 69
cgcggatcat gaaccaacgg cctggctgta tttggtggtt gtgtagggag atggggagaa 60
gaaaagcccg attctcttcg ctgtgatggg ctggatgcat gcgggggagc gggaggccca 120
agtacgtgca cggtgagcgg cccacagggc gagtgtgagc gcgagaggcg ggaggaacag 180
tttagtacca cattgcccag ctaactcgaa cgcgaccaac ttataaaccc gcgcgctgtc 240
gcttgtgtgt gggttattga ttctgttggt tttagagcta gaaatagcaa gttaaaataa 300
ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgcattacg ttcagagctg 360
gatcatttgg cccaagggaa gatgcattct ttgaagctgt taccaaccta gcctgtgaga 420
agaaacttcc tcttatttat ttggcagcaa attctggtgc tcgaattggc atagcagatg 480
aagtgaaatc ttgcttccgt gttgggtggt ctgatgatgg cagccctgaa cgtgggtttc 540
agtacattta tctaagcgaa gaagactatg ctcgtattgg cacttctgtc atagcacata 600
agatgcagct agacagtggt gaaattaggt gggttattga ttctgttgtc ggcaaggaag 660
atggacttgg tgtggagaat ctccatggaa gtgctgctat tgccagtgct tattctaggg 720
catataagga gacatttaca cttacatttg tgactggaag aactgttgga ataggagctt 780
atcttgctcg acttggcatc cggtgcatac agcgtcttga ccagcctatt attcttacag 840
gctattctgc actgaacaag cttcttgggc gggaagtgta cagctcccac atgcagttgg 900
gtggtcccaa aatcatggca actaatggtg ttgtccatct tactgtttca gatgaccttg 960
aaggcgtttc taatatattg aggttttttt tgcggccgcc ccgggcctgc aggggatccc 1020
gatcgggccg gccgtttaaa cccactttgt acaagaaagt tgaacgagaa acgtaaaatg 1080
atataaatat caatatatta aattagattt tgcataaaaa acagactaca taatactgta 1140
aaacacaaca tatgcagtca ctatgaacca actacttaga tggtattagt gacctgtact 1200
gggcctcatg ggccttccgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 1260
tgcattaaca tggtcatagc tgtttccttg cgtattgggc gctctccgct tcctcgctca 1320
ctgactcgct gcgctcggtc gttcgggtaa agcctggggt gcctaatgag caaaaggcca 1380
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 1440
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 1500
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 1560
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 1620
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 1680
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 1740
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 1800
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 1860
aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 1920
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 1980
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 2040
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 2100
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 2160
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 2220
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 2280
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagaaccac gctcaccggc 2340
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 2400
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 2460
gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 2520
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 2580
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 2640
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 2700
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 2760
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 2820
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 2880
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 2940
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 3000
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 3060
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 3120
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctaaattgta 3180
agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac 3240
caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg 3300
agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt gggaagggcg 3360
tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 3420
gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 3480
agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca aggccgcatt 3540
acaggtcact aataccatct aagtagttgg ttcatagtga ctgcatatgt tgtgttttac 3600
agtattatgt agtctgtttt ttatgcaaaa tctaatttaa tatattgata tttatatcat 3660
tttacgtttc tcgttcaact tttttgtaca aacttgattt aaatgaattc aagcttttaa 3720
ttaagcatgc gagctcggcg cgccggtacc gcgat 3755
<210> 70
<211> 17951
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector RLW139
<400> 70
ttatacatag ttgataattc actgggccgg ccgtttaaac ttagttacta atcagtgatc 60
agattgtcgt ttcccgcctt cactttaaac tatcagtgtt tgacaggata tattggcggg 120
taaacctaag agaaaagagc gtttattaga ataatcggat atttaaaagg gcgtgaaaag 180
gtttatccgt tcgtccattt gtatgtcaat attggggggg ggggaaagcc acgttgtgtc 240
tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa caataaaact 300
gtctgcttac ataaacagta atacaagggg tgttcgccac catgagccat atccagcgtg 360
aaacctcgtg ctcccgcccg cgcctcaatt ccaatatgga tgccgacctt tatggctaca 420
agtgggcgcg cgacaacgtc ggccagtcgg gcgcgaccat ttatcggctt tatggcaaac 480
ccgatgcccc ggaactgttc ctgaagcacg gcaaaggcag cgtcgcaaac gatgtcaccg 540
atgagatggt ccgcctgaac tggcttaccg agttcatgcc gctgccgacg attaagcatt 600
tcatccgtac cccggacgat gcctggctct tgaccacggc cattccgggc aaaacggcct 660
ttcaggtcct tgaagagtac ccggactccg gtgagaatat cgtggacgcc ctcgcggtct 720
tcctccgccg tttgcatagc atccccgtgt gcaactgccc cttcaactcg gaccgggttt 780
tccgcctggc acaggcccag tcgcgcatga ataacggcct cgttgacgcg agcgatttcg 840
acgatgaacg gaatggctgg ccggtggaac aggtttggaa ggaaatgcac aaactgcttc 900
cgttctcgcc ggattcggtg gtcacgcatg gtgatttttc cctggataat ctgatctttg 960
acgagggcaa gctgatcggc tgcatcgacg tgggtcgcgt cggtatcgcc gaccgctatc 1020
aggacctggc gatcttgtgg aattgcctcg gcgagttctc gccctcgctc cagaagcgcc 1080
tgttccagaa gtacggcatc gacaacccgg atatgaacaa gctccagttc cacctcatgc 1140
tggacgaatt tttttgaaca gaattggtta attggttgta acactggcag agcattacgc 1200
tgacttgacg ggacggcggc tttgttgaat aaatcgaact tttgctgagt tgaaggatcg 1260
atgagttgaa ggaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 1320
gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 1380
atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 1440
atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc 1500
ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 1560
gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 1620
cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 1680
tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 1740
cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 1800
ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 1860
gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 1920
tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg 1980
ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc 2040
gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc 2100
atctgtgcgg tatttcacac cgcataggcc gcgataggcc gacgcgaagc ggcggggcgt 2160
agggagcgca gcgaccgaag ggtaggcgct ttttgcagct cttcggctgt gcgctggcca 2220
gacagttatg cacaggccag gcgggtttta agagttttaa taagttttaa agagttttag 2280
gcggaaaaat cgcctttttt ctcttttata tcagtcactt acatgtgtga ccggttccca 2340
atgtacggct ttgggttccc aatgtacggg ttccggttcc caatgtacgg ctttgggttc 2400
ccaatgtacg tgctatccac aggaaagaga ccttttcgac ctttttcccc tgctagggca 2460
atttgcccta gcatctgctc cgtacattag gaaccggcgg atgcttcgcc ctcgatcagg 2520
ttgcggtagc gcatgactag gatcgggcca gcctgccccg cctcctcctt caaatcgtac 2580
tccggcaggt catttgaccc gatcagcttg cgcacggtga aacagaactt cttgaactct 2640
ccggcgctgc cactgcgttc gtagatcgtc ttgaacaacc atctggcttc tgccttgcct 2700
gcggcgcggc gtgccaggcg gtagagaaaa cggccgatgc cggggtcgat caaaaagtaa 2760
tcggggtgaa ccgtcagcac gtccgggttc ttgccttctg tgatctcgcg gtacatccaa 2820
tcagcaagct cgatctcgat gtactccggc cgcccggttt cgctctttac gatcttgtag 2880
cggctaatca aggcttcacc ctcggatacc gtcaccaggc ggccgttctt ggccttcttg 2940
gtacgctgca tggcaacgtg cgtggtgttt aaccgaatgc aggtttctac caggtcgtct 3000
ttctgctttc cgccatcggc tcgccggcag aacttgagta cgtccgcaac gtgtggacgg 3060
aacacgcggc cgggcttgtc tcccttccct tcccggtatc ggttcatgga ttcggttaga 3120
tgggaaaccg ccatcagtac caggtcgtaa tcccacacac tggccatgcc ggcggggcct 3180
gcggaaacct ctacgtgccc gtctggaagc tcgtagcgga tcacctcgcc agctcgtcgg 3240
tcacgcttcg acagacggaa aacggccacg tccatgatgc tgcgactatc gcgggtgccc 3300
acgtcataga gcatcggaac gaaaaaatct ggttgctcgt cgcccttggg cggcttccta 3360
atcgacggcg caccggctgc cggcggttgc cgggattctt tgcggattcg atcagcggcc 3420
ccttgccacg attcaccggg gcgtgcttct gcctcgatgc gttgccgctg ggcggcctgc 3480
gcggccttca acttctccac caggtcatca cccagcgccg cgccgatttg taccgggccg 3540
gatggtttgc gaccgctcac gccgattcct cgggcttggg ggttccagtg ccattgcagg 3600
gccggcagac aacccagccg cttacgcctg gccaaccgcc cgttcctcca cacatggggc 3660
attccacggc gtcggtgcct ggttgttctt gattttccat gccgcctcct ttagccgcta 3720
aaattcatct actcatttat tcatttgctc atttactctg gtagctgcgc gatgtattca 3780
gatagcagct cggtaatggt cttgccttgg cgtaccgcgt acatcttcag cttggtgtga 3840
tcctccgccg gcaactgaaa gttgacccgc ttcatggctg gcgtgtctgc caggctggcc 3900
aacgttgcag ccttgctgct gcgtgcgctc ggacggccgg cacttagcgt gtttgtgctt 3960
ttgctcattt tctctttacc tcattaactc aaatgagttt tgatttaatt tcagcggcca 4020
gcgcctggac ctcgcgggca gcgtcgccct cgggttctga ttcaagaacg gttgtgccgg 4080
cggcggcagt gcctgggtag ctcacgcgct gcgtgatacg ggactcaaga atgggcagct 4140
cgtacccggc cagcgcctcg gcaacctcac cgccgatgcg cgtgcctttg atcgcccgcg 4200
acacgacaaa ggccgcttgt agccttccat ccgtgacctc aatgcgctgc ttaaccagct 4260
ccaccaggtc ggcggtggcc caaatgtcgt aagggcttgg ctgcaccgga atcagcacga 4320
agtcggctgc cttgatcgcg gacacagcca agtccgccgc ctggggcgct ccgtcgatca 4380
ctacgaagtc gcgccggccg atggccttca cgtcgcggtc aatcgtcggg cggtcgatgc 4440
cgacaacggt tagcggttga tcttcccgca cggccgccca atcgcgggca ctgccctggg 4500
gatcggaatc gactaacaga acatcggccc cggcgagttg cagggcgcgg gctagatggg 4560
ttgcgatggt cgtcttgcct gacccgcctt tctggttaag tacagcgata accttcatgc 4620
gttccccttg cgtatttgtt tatttactca tcgcatcata tacgcagcga ccgcatgacg 4680
caagctgttt tactcaaata cacatcacct ttttagatga tcagtgattt tgtgccgagc 4740
tgccggtcgg ggagctgttg gctggctggt ggcaggatat attgtggtgt aaacaaattg 4800
acgcttagac aacttaataa cacattgcgg acgtctttaa tgtactgaat ttagttactg 4860
atcactgatt aagtactgat aaatttaatt aacagatctc aactttgtat agaaaagttg 4920
atttaaatga attcaagctt ttaattaact tagccactgc aacaagttct tgaaccttag 4980
cacaatcata ttgtgcatgc acttgtttat tgcaaagaat ggtgcgtagg gaacacgcat 5040
gatttttgaa ttgctggcac ataattttat cattagaaac tggaatgcaa catgtaccct 5100
ttgtcatggt ttctttccga gacattgcac tgtttttttt aatcctatca ttatcataat 5160
gccaagaact ggtcaccaac cagcattttg catcatggtt agttgagctg tccccatgta 5220
tcaataggtg cattgtattg gtccaaaata taaatgcagt ggatgcaacc tatctcatgg 5280
ccgtcaacaa aagaaatcaa aagggaaatg caccatctta tatctccagt ttatatgaac 5340
agattggata agatcataag atcaagtggt ttatattatt ttgaggaata taacatggat 5400
tcatcctaat cactcgtcta ggcagtatgt gtattcatga tggatatggt actatactac 5460
ggagtttttt cttcacaaaa taacctgtta ttttgacctc caaccaaaca cgaattatac 5520
caaaaattgg gttatttcat ctatagtaca actctattat aaacatgcag taaattatcc 5580
tacacatata ccaaaattca agtgtaataa tcctaataca cagacttaaa aaacaaacta 5640
tttccttttt aagaaaagga aaaccatttt tttaacggaa ggaaaacaaa ttcgggtcaa 5700
ggcggaagcc agcgcgccac cccacgtcag cgaatacgga ggcgcggggt tgacggcgtc 5760
acccggtcct aacggcgacc aacaaaccag ccagaagaaa ttacagtaaa aaaaagtaaa 5820
ttgcactttg atccaccttt tattacccaa gtttcaattt ggaccaccct taaacctatc 5880
ttttcaaatt gggccgggtt gtggtttgga ctaccatgaa caacttttcg tcatgtctaa 5940
cttccctttc ggcaaacata tgaaccatat atagaggaga tcggccgtat actagagctg 6000
atgtgtttaa ggtcgttgat tgcacgagaa aaaaaaaatc caaatcgcaa caatagcaaa 6060
tttatctagt tcaaagtgaa aagatatgtt taaaggtagt ccaaagtaaa acttaggggc 6120
tgtttggttc ccagccatac tttaccatta cttgccaaca aaagttgcca caccttgtct 6180
aaggtgaggt gatcaaattg ttagccacaa cttactaagc ctaagggaat cttgccacac 6240
ttttttgagc cattgacacg tgggacttaa tttgttagag ggaaatcttg ccacaactgt 6300
ggctacaacc aaacacctgt caaatttgcc taaccttagg cgtggcaaac tgtggcaaag 6360
tgtggcttac aaccaaacac acccttagat aataaaatgt ggtccaaagc gtaattcact 6420
aaaaaaaaat caacgagacg tgtaccaaac ggagacaaac ggcatcttct cgaaatttcc 6480
caaccgctcg ctcgcccgcc tcgtcttccc ggaaaccgcg gtggtttcag cgtggcggat 6540
tctccaagca gacggagacg tcacggcacg ggactcctcc caccacccaa ccgccataaa 6600
taccagcccc ctcatctcct ctcctcgcat cagctccacc cccgaaaaat ttctccccaa 6660
tctcgcgagg ctctcgtcgt cgaatcgaat cctctcgcgt cctcaagctt ggcatccagg 6720
tacggatccg cgtcccatct ccctcacccc ccgtgttctt cgtgcctgct tctgggtcag 6780
atctgggtgg attcgcggtt gttggatgtg gggggctgtg tttatttgtc ggtggatctg 6840
gttgtctgga tctgcgtttt ctctgtcgta gttagcggat ctgatgaaat gtttagtgtt 6900
cgtgtatact ggtatggtgg atctggtcct aggatgcgtg gaatggatat atgtaggcga 6960
attggaggat ttattttgtg aattttgctg aaatgatagt tctaaacact ggatctgacc 7020
tcgggatgct gttaaatgtg gaaatcatgg tcgatgctgt catgaacatg gtgttcttat 7080
ggtagatctg agcaatgtat gtttcaaaat tgtttgtcac atggaaatgc tatggttcta 7140
gatgcaatag aatgatacat gccgagatcc cctctagttg atatgataga tcatgatgtt 7200
ttacagctat gtcatatgaa tatgttcatt tgttaccgat gtatttggat ctacttaaca 7260
tttccaaagc acgccgcgtt ctaattctag atctggtagt catgtttgta cacgtcaccc 7320
acctaataca aatacatatg tctagtgttt ggtgacactg cccgtcagat ctgttttttc 7380
cagatctgtg gaacaaatac tccacgcatg tatggtagtt ttgaaacgat cttgtatctt 7440
ccattgttgt agtaacaact aaataaagta caattgttca attattggga atcgtatttt 7500
ctgtagtgcc gatgtacagc atattcatag atgtctattt aggaactcaa attttaaatt 7560
gaggactagt tatttattgt gggtcagtct tttgaattgt gttatcttgc tgtactggcg 7620
cgccaccatg gccaccgccg ccgccgcgtc taccgcgctc actggcgcca ctaccgctgc 7680
gcccaaggcg aggcgccggg cgcacctcct ggccacccgc cgcgccctcg ccgcgcccat 7740
caggtgctca gcggcgtcac ccgccatgcc gatggctccc ccggccaccc cgctccggcc 7800
gtggggcccc accgatcccc gcaagggcgc cgacatcctc gtcgagtccc tcgagcgctg 7860
cggcgtccgc gacgtcttcg cctaccccgg cggcacgtcc atggagatcc accaggcact 7920
cacccgctcc cccgtcatcg ccaaccacct cttccgccac gagcaagggg aggcctttgc 7980
ggcctccggc tacgcgcgct cctcgggccg cgtcggcgtc tgcatcgcca cctccggccc 8040
cggcgccacc aaccttgtct ccgcgctcgc cgacgcgctg ctcgattccg tccccatggt 8100
cgccatcacg ggacaggtgc cgcgacgcat gattggcacc gacgccttcc aggagacgcc 8160
catcgtcgag gtcacccgct ccatcaccaa gcacaactac ctggtcctcg acgtcgacga 8220
catcccccgc gtcgtgcagg aggctttctt cctcgcctcc tctggtcgac cggggccggt 8280
gcttgtcgac atccccaagg acatccagca gcagatggcg gtgcctgtct gggacaagcc 8340
catgagtctg cctgggtaca ttgcgcgcct tcccaagccc cctgcgactg agttgcttga 8400
gcaggtgctg cgtcttgttg gtgaatcccg gcgccctgtt ctttatgttg gcggtggctg 8460
cgcagcatct ggtgaggagt tgcgacgctt tgtggagctg actggaatcc cggtcacaac 8520
tactcttatg ggcctcggca acttccccag cgacgaccca ctgtctctgc gcatgctagg 8580
tatgcatggc acggtgtatg caaattatgc agtggataag gccgatctgt tgcttgcact 8640
tggtgtgcgg tttgatgatc gtgtgacagg gaagattgag gcttttgcaa gcagggctaa 8700
gattgtgcac gttgatattg atccggctga gattggcaag aacaagcagc cacatgtgtc 8760
catctgtgca gatgttaagc ttgctttgca gggcatgaat gctcttcttg aaggaagcac 8820
atcaaagaag agctttgact ttggctcatg gaacgatgag ttggatcagc agaagaggga 8880
attccccctt gggtataaaa catctaatga ggagatccag ccacaatatg ctattcaggt 8940
tcttgatgag ctgacgaaag gcgaggccat catcggcaca ggtgttgggc agcaccagat 9000
gtgggcggca cagtactaca cttacaagcg gccaaggcag tggttgtctt cagctggtct 9060
tggggctatg ggatttggtt tgccggctgc tgctggtgct tctgtggcca acccaggtgt 9120
tactgttgtt gacatcgatg gagatggtag ctttctcatg aacgttcagg agctagctat 9180
gatccgaatt gagaacctcc cggtgaaggt ctttgtgcta aacaaccagc acctggggat 9240
ggtggtgcag tgggaggaca ggttctataa ggccaacaga gcgcacacat acttgggaaa 9300
cccagagaat gaaagtgaga tatatccaga tttcgtgacg atcgccaaag ggttcaacat 9360
tccagcggtc cgtgtgacaa agaagaacga agtccgcgca gcgataaaga agatgctcga 9420
gactccaggg ccgtacctct tggatataat cgtcccacac caggagcatg tgttgcctat 9480
gatccctaat ggtggggctt tcaaggatat gatcctggat ggtgatggca ggactgtgta 9540
ctagcctgca ggcctaggat cgttcaaaca tttggcaata aagtttctta agattgaatc 9600
ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt aagcatgtaa 9660
taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt agagtcccgc 9720
aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag gataaattat 9780
cgcgcgcggt gtcatctatg ttactagatc ggccggccgt ttaaacagcc tgcttttttg 9840
tacaaacttg atttaaatga attcaagctt ttaattaagc atgcgagctc ggcgcgccgg 9900
taccgcgatc gcggatcatg aaccaacggc ctggctgtat ttggtggttg tgtagggaga 9960
tggggagaag aaaagcccga ttctcttcgc tgtgatgggc tggatgcatg cgggggagcg 10020
ggaggcccaa gtacgtgcac ggtgagcggc ccacagggcg agtgtgagcg cgagaggcgg 10080
gaggaacagt ttagtaccac attgcccagc taactcgaac gcgaccaact tataaacccg 10140
cgcgctgtcg cttgtgtgtg ggttattgat tctgttggtt ttagagctag aaatagcaag 10200
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcattacgt 10260
tcagagctgg atcatttggc ccaagggaag atgcattctt tgaagctgtt accaacctag 10320
cctgtgagaa gaaacttcct cttatttatt tggcagcaaa ttctggtgct cgaattggca 10380
tagcagatga agtgaaatct tgcttccgtg ttgggtggtc tgatgatggc agccctgaac 10440
gtgggtttca gtacatttat ctaagcgaag aagactatgc tcgtattggc acttctgtca 10500
tagcacataa gatgcagcta gacagtggtg aaattaggtg ggttattgat tctgttgtcg 10560
gcaaggaaga tggacttggt gtggagaatc tccatggaag tgctgctatt gccagtgctt 10620
attctagggc atataaggag acatttacac ttacatttgt gactggaaga actgttggaa 10680
taggagctta tcttgctcga cttggcatcc ggtgcataca gcgtcttgac cagcctatta 10740
ttcttacagg ctattctgca ctgaacaagc ttcttgggcg ggaagtgtac agctcccaca 10800
tgcagttggg tggtcccaaa atcatggcaa ctaatggtgt tgtccatctt actgtttcag 10860
atgaccttga aggcgtttct aatatattga ggtttttttt gcggccgccc cgggcctgca 10920
ggggatcccg atcgggccgg ccgtttaaac ccactttgta caagaaagct gggtatttaa 10980
atgaattcaa gcttttaatt aatgcagtgc agcgtgaccc ggtcgtgccc ctctctagag 11040
ataatgagca ttgcatgtct aagttataaa aaattaccac atattttttt tgtcacactt 11100
gtttgaagtg cagtttatct atctttatac atatatttaa actttactct acgaataata 11160
taatctatag tactacaata atatcagtgt tttagagaat catataaatg aacagttaga 11220
catggtctaa aggacaattg agtattttga caacaggact ctacagtttt atctttttag 11280
tgtgcatgtg ttctcctttt tttttgcaaa tagcttcacc tatataatac ttcatccatt 11340
ttattagtac atccatttag ggtttagggt taatggtttt tatagactaa tttttttagt 11400
acatctattt tattctattt tagcctctaa attaagaaaa ctaaaactct attttagttt 11460
ttttatttaa tagtttagat ataaaataga ataaaataaa gtgactaaaa attaaacaaa 11520
taccctttaa gaaattaaaa aaactaagga aacatttttc ttgtttcgag tagataatgc 11580
cagcctgtta aacgccgtcg acgagtctaa cggacaccaa ccagcgaacc agcagcgtcg 11640
cgtcgggcca agcgaagcag acggcacggc atctctgtcg ctgcctctgg acccctctcg 11700
agagttccgc tccaccgttg gacttgctcc gctgtcggca tccagaaatt gcgtggcgga 11760
gcggcagacg tgagccggca cggcaggcgg cctcctcctc ctctcacggc accggcagct 11820
acgggggatt cctttcccac cgctccttcg ctttcccttc ctcgcccgcc gtaataaata 11880
gacaccccct ccacaccctc tttccccaac ctcgtgttgt tcggagcgca cacacacaca 11940
accagatctc ccccaaatcc acccgtcggc acctccgctt caaggtacgc cgctcgtcct 12000
cccccccccc ccccctctct accttctcta gatcggcgtt ccggtccatg gttagggccc 12060
ggtagttcta cttctgttca tgtttgtgtt agatccgtgt ttgtgttaga tccgtgctgc 12120
tagcgttcgt acacggatgc gacctgtacg tcagacacgt tctgattgct aacttgccag 12180
tgtttctctt tggggaatcc tgggatggct ctagccgttc cgcagacggg atcgatttca 12240
tgattttttt tgtttcgttg catagggttt ggtttgccct tttcctttat ttcaatatat 12300
gccgtgcact tgtttgtcgg gtcatctttt catgcttttt tttgtcttgg ttgtgatgat 12360
gtggtctggt tgggcggtcg ttctagatcg gagtagaatt ctgtttcaaa ctacctggtg 12420
gatttattaa ttttggatct gtatgtgtgt gccatacata ttcatagtta cgaattgaag 12480
atgatggatg gaaatatcga tctaggatag gtatacatgt tgatgcgggt tttactgatg 12540
catatacaga gatgcttttt gttcgcttgg ttgtgatgat gtggtgtggt tgggcggtcg 12600
ttcattcgtt ctagatcgga gtagaatact gtttcaaact acctggtgta tttattaatt 12660
ttggaactgt atgtgtgtgt catacatctt catagttacg agtttaagat ggatggaaat 12720
atcgatctag gataggtata catgttgatg tgggttttac tgatgcatat acatgatggc 12780
atatgcagca tctattcata tgctctaacc ttgagtacct atctattata ataaacaagt 12840
atgttttata attatttcga tcttgatata cttggatgat ggcatatgca gcagctatat 12900
gtggattttt ttagccctgc cttcatacgc tatttatttg cttggtactg tttcttttgt 12960
cgatgctcac cctgttgttt ggtgttactt ctgcagggcg cgccaccatg gctcctaaga 13020
agaagcggaa ggttggtatt cacggggtgc ctgcggctga caagaagtac tccatcggcc 13080
tcgacatcgg caccaacagc gtcggctggg cggtgatcac cgacgagtac aaggtcccgt 13140
ccaagaagtt caaggtcctg ggcaacaccg accgccactc catcaagaag aacctcatcg 13200
gcgccctcct cttcgactcc ggcgagacgg cggaggcgac ccgcctcaag cgcaccgccc 13260
gccgccgcta cacccgccgc aagaaccgca tctgctacct ccaggagatc ttctccaacg 13320
agatggcgaa ggtcgacgac tccttcttcc accgcctcga ggagtccttc ctcgtggagg 13380
aggacaagaa gcacgagcgc caccccatct tcggcaacat cgtcgacgag gtcgcctacc 13440
acgagaagta ccccactatc taccaccttc gtaagaagct tgttgactct actgataagg 13500
ctgatcttcg tctcatctac cttgctctcg ctcacatgat caagttccgt ggtcacttcc 13560
ttatcgaggg tgaccttaac cctgataact ccgacgtgga caagctcttc atccagctcg 13620
tccagaccta caaccagctc ttcgaggaga accctatcaa cgcttccggt gtcgacgcta 13680
aggcgatcct ttccgctagg ctctccaagt ccaggcgtct cgagaacctc atcgcccagc 13740
tccctggtga gaagaagaac ggtcttttcg gtaacctcat cgctctctcc ctcggtctga 13800
cccctaactt caagtccaac ttcgacctcg ctgaggacgc taagcttcag ctctccaagg 13860
atacctacga cgatgatctc gacaacctcc tcgctcagat tggagatcag tacgctgatc 13920
tcttccttgc tgctaagaac ctctccgatg ctatcctcct ttcggatatc cttagggtta 13980
acactgagat cactaaggct cctctttctg cttccatgat caagcgctac gacgagcacc 14040
accaggacct caccctcctc aaggctcttg ttcgtcagca gctccccgag aagtacaagg 14100
agatcttctt cgaccagtcc aagaacggct acgccggtta cattgacggt ggagctagcc 14160
aggaggagtt ctacaagttc atcaagccaa tccttgagaa gatggatggt actgaggagc 14220
ttctcgttaa gcttaaccgt gaggacctcc ttaggaagca gaggactttc gataacggct 14280
ctatccctca ccagatccac cttggtgagc ttcacgccat ccttcgtagg caggaggact 14340
tctacccttt cctcaaggac aaccgtgaga agatcgagaa gatccttact ttccgtattc 14400
cttactacgt tggtcctctt gctcgtggta actcccgttt cgcttggatg actaggaagt 14460
ccgaggagac tatcacccct tggaacttcg aggaggttgt tgacaagggt gcttccgccc 14520
agtccttcat cgagcgcatg accaacttcg acaagaacct ccccaacgag aaggtcctcc 14580
ccaagcactc cctcctctac gagtacttca cggtctacaa cgagctcacc aaggtcaagt 14640
acgtcaccga gggtatgcgc aagcctgcct tcctctccgg cgagcagaag aaggctatcg 14700
ttgacctcct cttcaagacc aaccgcaagg tcaccgtcaa gcagctcaag gaggactact 14760
tcaagaagat cgagtgcttc gactccgtcg agatcagcgg cgttgaggac cgtttcaacg 14820
cttctctcgg cacctaccac gatctcctca agatcatcaa ggacaaggac ttcctcgaca 14880
acgaggagaa cgaggacatc ctcgaggaca tcgtcctcac tcttactctc ttcgaggata 14940
gggagatgat cgaggagagg ctcaagactt acgctcatct cttcgatgac aaggttatga 15000
agcagctcaa gcgtcgccgt tacaccggtt ggggtaggct ctcccgcaag ctcatcaacg 15060
gtatcaggga taagcagagc ggcaagacta tcctcgactt cctcaagtct gatggtttcg 15120
ctaacaggaa cttcatgcag ctcatccacg atgactctct taccttcaag gaggatattc 15180
agaaggctca ggtgtccggt cagggcgact ctctccacga gcacattgct aaccttgctg 15240
gttcccctgc tatcaagaag ggcatccttc agactgttaa ggttgtcgat gagcttgtca 15300
aggttatggg tcgtcacaag cctgagaaca tcgtcatcga gatggctcgt gagaaccaga 15360
ctacccagaa gggtcagaag aactcgaggg agcgcatgaa gaggattgag gagggtatca 15420
aggagcttgg ttctcagatc cttaaggagc accctgtcga gaacacccag ctccagaacg 15480
agaagctcta cctctactac ctccagaacg gtagggatat gtacgttgac caggagctcg 15540
acatcaacag gctttctgac tacgacgtcg accacattgt tcctcagtct ttccttaagg 15600
atgactccat cgacaacaag gtcctcacga ggtccgacaa gaacaggggt aagtcggaca 15660
acgtcccttc cgaggaggtt gtcaagaaga tgaagaacta ctggaggcag cttctcaacg 15720
ctaagctcat tacccagagg aagttcgaca acctcacgaa ggctgagagg ggtggccttt 15780
ccgagcttga caaggctggt ttcatcaaga ggcagcttgt tgagacgagg cagattacca 15840
agcacgttgc tcagatcctc gattctagga tgaacaccaa gtacgacgag aacgacaagc 15900
tcatccgcga ggtcaaggtg atcaccctca agtccaagct cgtctccgac ttccgcaagg 15960
acttccagtt ctacaaggtc cgcgagatca acaactacca ccacgctcac gatgcttacc 16020
ttaacgctgt cgttggcacc gctcttatca agaagtaccc taagcttgag tccgagttcg 16080
tctacggtga ctacaaggtc tacgacgttc gtaagatgat cgccaagtcc gagcaggaga 16140
tcggcaaggc caccgccaag tacttcttct actccaacat catgaacttc ttcaagaccg 16200
agatcaccct cgccaacggc gagatccgca agcgccctct tatcgagacg aacggtgaga 16260
ctggtgagat cgtttgggac aagggtcgcg acttcgctac tgttcgcaag gtcctttcta 16320
tgcctcaggt taacatcgtc aagaagaccg aggtccagac cggtggcttc tccaaggagt 16380
ctatccttcc aaagagaaac tcggacaagc tcatcgctag gaagaaggat tgggacccta 16440
agaagtacgg tggtttcgac tcccctactg tcgcctactc cgtcctcgtg gtcgccaagg 16500
tggagaaggg taagtcgaag aagctcaagt ccgtcaagga gctcctcggc atcaccatca 16560
tggagcgctc ctccttcgag aagaacccga tcgacttcct cgaggccaag ggctacaagg 16620
aggtcaagaa ggacctcatc atcaagctcc ccaagtactc tcttttcgag ctcgagaacg 16680
gtcgtaagag gatgctggct tccgctggtg agctccagaa gggtaacgag cttgctcttc 16740
cttccaagta cgtgaacttc ctctacctcg cctcccacta cgagaagctc aagggttccc 16800
ctgaggataa cgagcagaag cagctcttcg tggagcagca caagcactac ctcgacgaga 16860
tcatcgagca gatctccgag ttctccaagc gcgtcatcct cgctgacgct aacctcgaca 16920
aggtcctctc cgcctacaac aagcaccgcg acaagcccat ccgcgagcag gccgagaaca 16980
tcatccacct cttcacgctc acgaacctcg gcgcccctgc tgctttcaag tacttcgaca 17040
ccaccatcga caggaagcgt tacacgtcca ccaaggaggt tctcgacgct actctcatcc 17100
accagtccat caccggtctt tacgagactc gtatcgacct ttcccagctt ggtggtgata 17160
agcgtcctgc tgccaccaaa aaggccggac aggctaagaa aaagaagtag cctgcaggtc 17220
ctgctttaat gagatatgcg agacgcctat gatcgcatga tatttgcttt caattctgtt 17280
gtgcacgttg taaaaaacct gagcatgtgt agctcagatc cttaccgccg gtttcggttc 17340
attctaatga atatatcacc cgttactatc gtatttttat gaataatatt ctccgttcaa 17400
tttactgatt gtaccctact acttatatgt acaatattaa aatgaaaaca atatattgtg 17460
ctgaataggt ttatagcgac atctatgata gagcgccaca ataacaaaca attgcgtttt 17520
attattacaa atccaatttt aaaaaaagcg gcagaaccgg tcaaacctaa aagactgatt 17580
acataaatct tattcaaatt tcaaaagtgc cccaggggct agtatctacg acacaccgag 17640
cggcgaacta ataacgctca ctgaagggaa ctccggttcc ccgccggcgc gcatgggtga 17700
gattccttga agttgagtat tggccgtccg ctctaccgaa agttacgggc accattcaac 17760
ccggtccagc acggcggccg ggtaaccgac ttgctgcccc gagaattatg cagcattttt 17820
ttggtgtatg tgggccccaa atgaagtgca ggtcaaacct tgacagtgac gacaaatcgt 17880
tgggcgggtc cagggcgaat tttgcgacaa catgtcgagg ctcagcaggc cggccgttta 17940
aaccaacttt a 17951
<210> 71
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Signal
<400> 71
Met Ser Glu Arg Lys Arg Arg Glu Lys Leu
1 5 10
<210> 72
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Signal
<400> 72
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 73
<211> 377
<212> DNA
<213> Oryza sativa
<220>
<223> U3 snRNA promoter
<400> 73
aagggatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaggaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtggagtaa gataaactgt aggagaaaag catttcgtag tgggccatga 240
agcctttcag gacatgtatt gcagtatggg ccggcccatt acgcaattgg acgacaacaa 300
agactagtat tagtaccacc tcggctatcc acatagatca aagctggttt aaaagagttg 360
tgcagatgat ccgtggc 377
<110> BASF Plant Science Company GmbH
<120> Improved methods for modification of target nucleic acids
<130> PA22-600
<150> EP16167773.7
<151> 2016-04-29
<150> EP16167774.5
<151> 2016-04-29
<150> EP17156018.8
<151> 2017-02-14
<160> 73
<170> BiSSAP 1.3
<210> 1
<211> 4140
<212> DNA
<213> Artificial Sequence
<220>
<223> Cas9 yeast
<400> 1
atggataaaa aatattctat tggtttggat attggtacta attctgttgg ttgggctgtt 60
attactgatg aatataaagt tccatctaaa aaatttaaag ttttgggtaa tactgataga 120
cattctatta aaaaaaattt gattggtgct ttgttgtttg attctggtga aactgctgaa 180
gctactagat tgaaaagaac tgctagaaga agatatacta gaagaaaaaa tagaatttgt 240
tatttgcaag aaattttttc taatgaaatg gctaaagttg atgattcttt ttttcataga 300
ttggaagaat cttttttggt tgaagaagat aaaaaacatg aaagacatcc aatttttggt 360
aatattgttg atgaagttgc ttatcatgaa aaatatccaa ctatttatca tttgagaaaa 420
aaattggttg attctactga taaagctgat ttgagattga tttatttggc tttggctcat 480
atgattaaat ttagaggtca ttttttgatt gaaggtgatt tgaatccaga taattctgat 540
gttgataaat tgtttattca attggttcaa acttataatc aattgtttga agaaaatcca 600
attaatgctt ctggtgttga tgctaaagct attttgtctg ctagattgtc taaatctaga 660
agattggaaa atttgattgc tcaattgcca ggtgaaaaaa aaaatggttt gtttggtaat 720
ttgattgctt tgtctttggg tttgactcca aattttaaat ctaattttga tttggctgaa 780
gatgctaaat tgcaattgtc taaagatact tatgatgatg atttggataa tttgttggct 840
caaattggtg atcaatatgc tgatttgttt ttggctgcta aaaatttgtc tgatgctatt 900
ttgttgtctg atattttgag agttaatact gaaattacta aagctccatt gtctgcttct 960
atgattaaaa gatatgatga acatcatcaa gatttgactt tgttgaaagc tttggttaga 1020
caacaattgc cagaaaaata taaagaaatt ttttttgatc aatctaaaaa tggttatgct 1080
ggttatattg atggtggtgc ttctcaagaa gaattttata aatttattaa accaattttg 1140
gaaaaaatgg atggtactga agaattgttg gttaaattga atagagaaga tttgttgaga 1200
aaacaaagaa cttttgataa tggttctatt ccacatcaaa ttcatttggg tgaattgcat 1260
gctattttga gaagacaaga agatttttat ccatttttga aagataatag agaaaaaatt 1320
gaaaaaattt tgacttttag aattccatat tatgttggtc cattggctag aggtaattct 1380
agatttgctt ggatgactag aaaatctgaa gaaactatta ctccatggaa ttttgaagaa 1440
gttgttgata aaggtgcttc tgctcaatct tttattgaaa gaatgactaa ttttgataaa 1500
aatttgccaa atgaaaaagt tttgccaaaa cattctttgt tgtatgaata ttttactgtt 1560
tataatgaat tgactaaagt taaatatgtt actgaaggta tgagaaaacc agcttttttg 1620
tctggtgaac aaaaaaaagc tattgttgat ttgttgttta aaactaatag aaaagttact 1680
gttaaacaat tgaaagaaga ttattttaaa aaaattgaat gttttgattc tgttgaaatt 1740
tctggtgttg aagatagatt taatgcttct ttgggtactt atcatgattt gttgaaaatt 1800
attaaagata aagatttttt ggataatgaa gaaaatgaag atattttgga agatattgtt 1860
ttgactttga ctttgtttga agatagagaa atgattgaag aaagattgaa aacttatgct 1920
catttgtttg atgataaagt tatgaaacaa ttgaaaagaa gaagatatac tggttggggt 1980
agattgtcta gaaaattgat taatggtatt agagataaac aatctggtaa aactattttg 2040
gattttttga aatctgatgg ttttgctaat agaaatttta tgcaattgat tcatgatgat 2100
tctttgactt ttaaagaaga tattcaaaaa gctcaagttt ctggtcaagg tgattctttg 2160
catgaacata ttgctaattt ggctggttct ccagctatta aaaaaggtat tttgcaaact 2220
gttaaagttg ttgatgaatt ggttaaagtt atgggtagac ataaaccaga aaatattgtt 2280
attgaaatgg ctagagaaaa tcaaactact caaaaaggtc aaaaaaattc tagagaaaga 2340
atgaaaagaa ttgaagaagg tattaaagaa ttgggttctc aaattttgaa agaacatcca 2400
gttgaaaata ctcaattgca aaatgaaaaa ttgtatttgt attatttgca aaatggtaga 2460
gatatgtatg ttgatcaaga attggatatt aatagattgt ctgattatga tgttgatcat 2520
attgttccac aatctttttt gaaagatgat tctattgata ataaagtttt gactagatct 2580
gataaaaata gaggtaaatc tgataatgtt ccatctgaag aagttgttaa aaaaatgaaa 2640
aattattgga gacaattgtt gaatgctaaa ttgattactc aaagaaaatt tgataatttg 2700
actaaagctg aaagaggtgg tttgtctgaa ttggataaag ctggttttat taaaagacaa 2760
ttggttgaaa ctagacaaat tactaaacat gttgctcaaa ttttggattc tagaatgaat 2820
actaaatatg atgaaaatga taaattgatt agagaagtta aagttattac tttgaaatct 2880
aaattggttt ctgattttag aaaagatttt caattttata aagttagaga aattaataat 2940
tatcatcatg ctcatgatgc ttatttgaat gctgttgttg gtactgcttt gattaaaaaa 3000
tatccaaaat tggaatctga atttgtttat ggtgattata aagtttatga tgttagaaaa 3060
atgattgcta aatctgaaca agaaattggt aaagctactg ctaaatattt tttttattct 3120
aatattatga atttttttaa aactgaaatt actttggcta atggtgaaat tagaaaaaga 3180
ccattgattg aaactaatgg tgaaactggt gaaattgttt gggataaagg tagagatttt 3240
gctactgtta gaaaagtttt gtctatgcca caagttaata ttgttaaaaa aactgaagtt 3300
caaactggtg gtttttctaa agaatctatt ttgccaaaaa gaaattctga taaattgatt 3360
gctagaaaaa aagattggga tccaaaaaaa tatggtggtt ttgattctcc aactgttgct 3420
tattctgttt tggttgttgc taaagttgaa aaaggtaaat ctaaaaaatt gaaatctgtt 3480
aaagaattgt tgggtattac tattatggaa agatcttctt ttgaaaaaaa tccaattgat 3540
tttttggaag ctaaaggtta taaagaagtt aaaaaagatt tgattattaa attgccaaaa 3600
tattctttgt ttgaattgga aaatggtaga aaaagaatgt tggcttctgc tggtgaattg 3660
caaaaaggta atgaattggc tttgccatct aaatatgtta attttttgta tttggcttct 3720
cattatgaaa aattgaaagg ttctccagaa gataatgaac aaaaacaatt gtttgttgaa 3780
caacataaac attatttgga tgaaattatt gaacaaattt ctgaattttc taaaagagtt 3840
attttggctg atgctaattt ggataaagtt ttgtctgctt ataataaaca tagagataaa 3900
ccaattagag aacaagctga aaatattatt catttgttta ctttgactaa tttgggtgct 3960
ccagctgctt ttaaatattt tgatactact attgatagaa aaagatatac ttctactaaa 4020
gaagttttgg atgctacttt gattcatcaa tctattactg gtttgtatga aactagaatt 4080
gatttgtctc aattgggtgg tgattctaga gctgatccaa aaaaaaaaag aaaagtttaa 4140
<210> 2
<211> 1379
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas9 yeast protein
<400> 2
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys
1365 1370 1375
Arg Lys Val
<210> 3
<211> 4140
<212> DNA
<213> Artificial Sequence
<220>
<223> Cas9 D10A H840A inactive
<400> 3
atggataaaa aatattctat tggtttggct attggtacta attctgttgg ttgggctgtt 60
attactgatg aatataaagt tccatctaaa aaatttaaag ttttgggtaa tactgataga 120
cattctatta aaaaaaattt gattggtgct ttgttgtttg attctggtga aactgctgaa 180
gctactagat tgaaaagaac tgctagaaga agatatacta gaagaaaaaa tagaatttgt 240
tatttgcaag aaattttttc taatgaaatg gctaaagttg atgattcttt ttttcataga 300
ttggaagaat cttttttggt tgaagaagat aaaaaacatg aaagacatcc aatttttggt 360
aatattgttg atgaagttgc ttatcatgaa aaatatccaa ctatttatca tttgagaaaa 420
aaattggttg attctactga taaagctgat ttgagattga tttatttggc tttggctcat 480
atgattaaat ttagaggtca ttttttgatt gaaggtgatt tgaatccaga taattctgat 540
gttgataaat tgtttattca attggttcaa acttataatc aattgtttga agaaaatcca 600
attaatgctt ctggtgttga tgctaaagct attttgtctg ctagattgtc taaatctaga 660
agattggaaa atttgattgc tcaattgcca ggtgaaaaaa aaaatggttt gtttggtaat 720
ttgattgctt tgtctttggg tttgactcca aattttaaat ctaattttga tttggctgaa 780
gatgctaaat tgcaattgtc taaagatact tatgatgatg atttggataa tttgttggct 840
caaattggtg atcaatatgc tgatttgttt ttggctgcta aaaatttgtc tgatgctatt 900
ttgttgtctg atattttgag agttaatact gaaattacta aagctccatt gtctgcttct 960
atgattaaaa gatatgatga acatcatcaa gatttgactt tgttgaaagc tttggttaga 1020
caacaattgc cagaaaaata taaagaaatt ttttttgatc aatctaaaaa tggttatgct 1080
ggttatattg atggtggtgc ttctcaagaa gaattttata aatttattaa accaattttg 1140
gaaaaaatgg atggtactga agaattgttg gttaaattga atagagaaga tttgttgaga 1200
aaacaaagaa cttttgataa tggttctatt ccacatcaaa ttcatttggg tgaattgcat 1260
gctattttga gaagacaaga agatttttat ccatttttga aagataatag agaaaaaatt 1320
gaaaaaattt tgacttttag aattccatat tatgttggtc cattggctag aggtaattct 1380
agatttgctt ggatgactag aaaatctgaa gaaactatta ctccatggaa ttttgaagaa 1440
gttgttgata aaggtgcttc tgctcaatct tttattgaaa gaatgactaa ttttgataaa 1500
aatttgccaa atgaaaaagt tttgccaaaa cattctttgt tgtatgaata ttttactgtt 1560
tataatgaat tgactaaagt taaatatgtt actgaaggta tgagaaaacc agcttttttg 1620
tctggtgaac aaaaaaaagc tattgttgat ttgttgttta aaactaatag aaaagttact 1680
gttaaacaat tgaaagaaga ttattttaaa aaaattgaat gttttgattc tgttgaaatt 1740
tctggtgttg aagatagatt taatgcttct ttgggtactt atcatgattt gttgaaaatt 1800
attaaagata aagatttttt ggataatgaa gaaaatgaag atattttgga agatattgtt 1860
ttgactttga ctttgtttga agatagagaa atgattgaag aaagattgaa aacttatgct 1920
catttgtttg atgataaagt tatgaaacaa ttgaaaagaa gaagatatac tggttggggt 1980
agattgtcta gaaaattgat taatggtatt agagataaac aatctggtaa aactattttg 2040
gattttttga aatctgatgg ttttgctaat agaaatttta tgcaattgat tcatgatgat 2100
tctttgactt ttaaagaaga tattcaaaaa gctcaagttt ctggtcaagg tgattctttg 2160
catgaacata ttgctaattt ggctggttct ccagctatta aaaaaggtat tttgcaaact 2220
gttaaagttg ttgatgaatt ggttaaagtt atgggtagac ataaaccaga aaatattgtt 2280
attgaaatgg ctagagaaaa tcaaactact caaaaaggtc aaaaaaattc tagagaaaga 2340
atgaaaagaa ttgaagaagg tattaaagaa ttgggttctc aaattttgaa agaacatcca 2400
gttgaaaata ctcaattgca aaatgaaaaa ttgtatttgt attatttgca aaatggtaga 2460
gatatgtatg ttgatcaaga attggatatt aatagattgt ctgattatga tgttgatgct 2520
attgttccac aatctttttt gaaagatgat tctattgata ataaagtttt gactagatct 2580
gataaaaata gaggtaaatc tgataatgtt ccatctgaag aagttgttaa aaaaatgaaa 2640
aattattgga gacaattgtt gaatgctaaa ttgattactc aaagaaaatt tgataatttg 2700
actaaagctg aaagaggtgg tttgtctgaa ttggataaag ctggttttat taaaagacaa 2760
ttggttgaaa ctagacaaat tactaaacat gttgctcaaa ttttggattc tagaatgaat 2820
actaaatatg atgaaaatga taaattgatt agagaagtta aagttattac tttgaaatct 2880
aaattggttt ctgattttag aaaagatttt caattttata aagttagaga aattaataat 2940
tatcatcatg ctcatgatgc ttatttgaat gctgttgttg gtactgcttt gattaaaaaa 3000
tatccaaaat tggaatctga atttgtttat ggtgattata aagtttatga tgttagaaaa 3060
atgattgcta aatctgaaca agaaattggt aaagctactg ctaaatattt tttttattct 3120
aatattatga atttttttaa aactgaaatt actttggcta atggtgaaat tagaaaaaga 3180
ccattgattg aaactaatgg tgaaactggt gaaattgttt gggataaagg tagagatttt 3240
gctactgtta gaaaagtttt gtctatgcca caagttaata ttgttaaaaa aactgaagtt 3300
caaactggtg gtttttctaa agaatctatt ttgccaaaaa gaaattctga taaattgatt 3360
gctagaaaaa aagattggga tccaaaaaaa tatggtggtt ttgattctcc aactgttgct 3420
tattctgttt tggttgttgc taaagttgaa aaaggtaaat ctaaaaaatt gaaatctgtt 3480
aaagaattgt tgggtattac tattatggaa agatcttctt ttgaaaaaaa tccaattgat 3540
tttttggaag ctaaaggtta taaagaagtt aaaaaagatt tgattattaa attgccaaaa 3600
tattctttgt ttgaattgga aaatggtaga aaaagaatgt tggcttctgc tggtgaattg 3660
caaaaaggta atgaattggc tttgccatct aaatatgtta attttttgta tttggcttct 3720
cattatgaaa aattgaaagg ttctccagaa gataatgaac aaaaacaatt gtttgttgaa 3780
caacataaac attatttgga tgaaattatt gaacaaattt ctgaattttc taaaagagtt 3840
attttggctg atgctaattt ggataaagtt ttgtctgctt ataataaaca tagagataaa 3900
ccaattagag aacaagctga aaatattatt catttgttta ctttgactaa tttgggtgct 3960
ccagctgctt ttaaatattt tgatactact attgatagaa aaagatatac ttctactaaa 4020
gaagttttgg atgctacttt gattcatcaa tctattactg gtttgtatga aactagaatt 4080
gatttgtctc aattgggtgg tgattctaga gctgatccaa aaaaaaaaag aaaagtttaa 4140
<210> 4
<211> 1379
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas9 D10A H840A inactive protein
<400> 4
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys
1365 1370 1375
Arg Lys Val
<210> 5
<211> 4155
<212> DNA
<213> Artificial Sequence
<220>
<223> Cas9 rice
<400> 5
atggacaaga agtatagtat tggtctggac attgggacga attccgttgg ctgggccgtg 60
atcaccgatg agtacaaggt cccttccaag aagtttaagg ttctggggaa caccgatcgg 120
cacagcatca agaagaatct cattggagcc ctcctgttcg actcaggcga gaccgccgaa 180
gcaacaaggc tcaagagaac cgcaaggaga cggtatacaa gaaggaagaa taggatctgc 240
tacctgcagg agattttcag caacgaaatg gcgaaggtgg acgattcgtt ctttcataga 300
ttggaggaga gtttcctcgt cgaggaagat aagaagcacg agaggcatcc tatctttggc 360
aacattgtcg acgaggttgc ctatcacgaa aagtacccca caatctatca tctgcggaag 420
aagcttgtgg actcgactga taaggcggac cttagattga tctacctcgc tctggcacac 480
atgattaagt tcaggggcca ttttctgatc gagggggatc ttaacccgga caatagcgat 540
gtggacaagt tgttcatcca gctcgtccaa acctacaatc agctctttga ggaaaaccca 600
attaatgctt caggcgtcga cgccaaggcg atcctgtctg cacgcctttc aaagtctcgc 660
cggcttgaga acttgatcgc tcaactcccg ggcgaaaaga agaacggctt gttcgggaat 720
ctcattgcac tttcgttggg gctcacacca aacttcaaga gtaattttga tctcgctgag 780
gacgcaaagc tgcagctttc caaggacact tatgacgatg acctggataa ccttttggcc 840
caaatcggcg atcagtacgc ggacttgttc ctcgccgcga agaatttgtc ggacgcgatc 900
ctcctgagtg atattctccg cgtgaacacc gagattacaa aggccccgct ctcggcgagt 960
atgatcaagc gctatgacga gcaccatcag gatctgaccc ttttgaaggc tttggtccgg 1020
cagcaactcc cagagaagta caaggaaatc ttctttgatc aatccaagaa cggctacgct 1080
ggttatattg acggcggggc atcgcaggag gaattctaca agtttatcaa gccaattctg 1140
gagaagatgg atggcacaga ggaactcctg gtgaagctca atagggagga ccttttgcgg 1200
aagcaaagaa ctttcgataa cggcagcatc cctcaccaga ttcatctcgg ggagctgcac 1260
gccatcctga gaaggcagga agacttctac ccctttctta aggataaccg ggagaagatc 1320
gaaaagattc tgacgttcag aattccgtac tatgtcggac cactcgcccg gggtaattcc 1380
agatttgcgt ggatgaccag aaagagcgag gaaaccatca caccttggaa cttcgaggaa 1440
gtggtcgata agggcgcttc cgcacagagc ttcattgagc gcatgacaaa ttttgacaag 1500
aacctgccta atgagaaggt ccttcccaag cattccctcc tgtacgagta tttcactgtt 1560
tataacgaac tcacgaaggt gaagtatgtg accgagggaa tgcgcaagcc cgccttcctg 1620
agcggcgagc aaaagaaggc gatcgtggac cttttgttta agaccaatcg gaaggtcaca 1680
gttaagcagc tcaaggagga ctacttcaag aagattgaat gcttcgattc cgttgagatc 1740
agcggcgtgg aagacaggtt taacgcgtca ctggggactt accacgatct cctgaagatc 1800
attaaggata aggacttctt ggacaacgag gaaaatgagg atatcctcga agacattgtc 1860
ctgactctta cgttgtttga ggatagggaa atgatcgagg aacgcttgaa gacgtatgcc 1920
catctcttcg atgacaaggt tatgaagcag ctcaagagaa gaagatacac cggatgggga 1980
aggctgtccc gcaagcttat caatggcatt agagacaagc aatcagggaa gacaatcctt 2040
gactttttga agtctgatgg cttcgcgaac aggaatttta tgcagctgat tcacgatgac 2100
tcacttactt tcaaggagga tatccagaag gctcaagtgt cgggacaagg tgacagtctg 2160
cacgagcata tcgccaacct tgcgggatct cctgcaatca agaagggtat tctgcagaca 2220
gtcaaggttg tggatgagct tgtgaaggtc atgggacggc ataagcccga gaacatcgtt 2280
attgagatgg ccagagaaaa tcagaccaca caaaagggtc agaagaactc gagggagcgc 2340
atgaagcgca tcgaggaagg cattaaggag ctggggagtc agatccttaa ggagcacccg 2400
gtggaaaaca cgcagttgca aaatgagaag ctctatctgt actatctgca aaatggcagg 2460
gatatgtatg tggaccagga gttggatatt aaccgcctct cggattacga cgtcgatcat 2520
atcgttcctc agtccttcct taaggatgac agcattgaca ataaggttct caccaggtcc 2580
gacaagaacc gcgggaagtc cgataatgtg cccagcgagg aagtcgttaa gaagatgaag 2640
aactactgga ggcaactttt gaatgccaag ttgatcacac agaggaagtt tgataacctc 2700
actaaggccg agcgcggagg tctcagcgaa ctggacaagg cgggcttcat taagcggcaa 2760
ctggttgaga ctagacagat cacgaagcac gtggcgcaga ttctcgattc acgcatgaac 2820
acgaagtacg atgagaatga caagctgatc cgggaagtga aggtcatcac cttgaagtca 2880
aagctcgttt ctgacttcag gaaggatttc caattttata aggtgcgcga gatcaacaat 2940
tatcaccatg ctcatgacgc atacctcaac gctgtggtcg gaacagcatt gattaagaag 3000
tacccgaagc tcgagtccga attcgtgtac ggtgactata aggtttacga tgtgcgcaag 3060
atgatcgcca agtcagagca ggaaattggc aaggccactg cgaagtattt cttttactct 3120
aacattatga atttctttaa gactgagatc acgctggcta atggcgaaat ccggaagaga 3180
ccacttattg agaccaacgg cgagacaggg gaaatcgtgt gggacaaggg gagggatttc 3240
gccacagtcc gcaaggttct ctctatgcct caagtgaata ttgtcaagaa gactgaagtc 3300
cagacgggcg ggttctcaaa ggaatctatt ctgcccaagc ggaactcgga taagcttatc 3360
gccagaaaga aggactggga cccgaagaag tatggaggtt tcgactcacc aacggtggct 3420
tactctgtcc tggttgtggc aaaggtggag aagggaaagt caaagaagct caagtctgtc 3480
aaggagctcc tgggtatcac cattatggag aggtccagct tcgaaaagaa tccgatcgat 3540
tttctcgagg cgaagggata taaggaagtg aagaaggacc tgatcattaa gcttccaaag 3600
tacagtcttt tcgagttgga aaacggcagg aagcgcatgt tggcttccgc aggagagctc 3660
cagaagggta acgagcttgc tttgccgtcc aagtatgtga acttcctcta tctggcatcc 3720
cactacgaga agctcaaggg cagcccagag gataacgaac agaagcaact gtttgtggag 3780
caacacaagc attatcttga cgagatcatt gaacagattt cggagttcag taagcgcgtc 3840
atcctcgccg acgcgaattt ggataaggtt ctctcagcct acaacaagca ccgggacaag 3900
cctatcagag agcaggcgga aaatatcatt catctcttca ccctgacaaa ccttggggct 3960
cccgctgcat tcaagtattt tgacactacg attgatcgga agagatacac ttctacgaag 4020
gaggtgctgg atgcaaccct tatccaccaa tcgattactg gcctctacga gacgcggatc 4080
gacttgagtc agctcggggg ggataagaga ccagcggcaa ccaagaaggc aggacaagcg 4140
aagaagaaga agtag 4155
<210> 6
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> SV40 Nuclear Localizaion Signal
<400> 6
cccaagaaga agcggaaggt ctcg 24
<210> 7
<211> 957
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4
<400> 7
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120
tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180
ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240
ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300
aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360
acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420
caaagacagt tgactgtatc gccggaattt gtaatacgac tcactatagg gcgagccgcc 480
atcatggagg agcagaagct gatctcagag gaggacctgc atatggccat ggaggccgaa 540
ttcatggata aagcggaatt aattcccgag cctccaaaaa agaagagaaa ggtcgaattg 600
ggtaccgccg ccaattttaa tcaaagtggg aatattgctg atagctcatt gtccttcact 660
ttcactaaca gtagcaacgg tccgaacctc ataacaactc aaacaaattc tcaagcgctt 720
tcacaaccaa ttgcctcctc taacgttcat gataacttca tgaataatga aatcacggct 780
agtaaaattg atgatggtaa taattcaaaa ccactgtcac ctggttggac ggaccaaact 840
gcgtataacg cgtttggaat cactacaggg atgtttaata ccactacaat ggatgatgta 900
tataactatc tattcgatga tgaagatacc ccaccaaacc caaaaaaaga gatttaa 957
<210> 8
<211> 318
<212> PRT
<213> Artificial Sequence
<220>
<223> GAL4 protein
<400> 8
Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Arg Leu
1 5 10 15
Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys Leu
20 25 30
Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser Pro
35 40 45
Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg Leu
50 55 60
Glu Gln Leu Phe Leu Leu Ile Phe Pro Arg Glu Asp Leu Asp Met Ile
65 70 75 80
Leu Lys Met Asp Ser Leu Gln Asp Ile Lys Ala Leu Leu Thr Gly Leu
85 90 95
Phe Val Gln Asp Asn Val Asn Lys Asp Ala Val Thr Asp Arg Leu Ala
100 105 110
Ser Val Glu Thr Asp Met Pro Leu Thr Leu Arg Gln His Arg Ile Ser
115 120 125
Ala Thr Ser Ser Ser Glu Glu Ser Ser Asn Lys Gly Gln Arg Gln Leu
130 135 140
Thr Val Ser Pro Glu Phe Val Ile Arg Leu Thr Ile Gly Arg Ala Ala
145 150 155 160
Ile Met Glu Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu His Met Ala
165 170 175
Met Glu Ala Glu Phe Met Asp Lys Ala Glu Leu Ile Pro Glu Pro Pro
180 185 190
Lys Lys Lys Arg Lys Val Glu Leu Gly Thr Ala Ala Asn Phe Asn Gln
195 200 205
Ser Gly Asn Ile Ala Asp Ser Ser Leu Ser Phe Thr Phe Thr Asn Ser
210 215 220
Ser Asn Gly Pro Asn Leu Ile Thr Thr Gln Thr Asn Ser Gln Ala Leu
225 230 235 240
Ser Gln Pro Ile Ala Ser Ser Asn Val His Asp Asn Phe Met Asn Asn
245 250 255
Glu Ile Thr Ala Ser Lys Ile Asp Asp Gly Asn Asn Ser Lys Pro Leu
260 265 270
Ser Pro Gly Trp Thr Asp Gln Thr Ala Tyr Asn Ala Phe Gly Ile Thr
275 280 285
Thr Gly Met Phe Asn Thr Thr Thr Met Asp Asp Val Tyr Asn Tyr Leu
290 295 300
Phe Asp Asp Glu Asp Thr Pro Pro Asn Pro Lys Lys Glu Ile
305 310 315
<210> 9
<211> 958
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 1
<400> 9
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga actaactggg agtgtcgcta 120
ctctcccaaa accaaaaggt ctccgctgac tagggcacat ctgacagaag tggaatcaag 180
gctagaaaga ctggaacagc tatttctact gatttttcct cgagaagacc ttgacatgat 240
tttgaaaatg gattctttac aggatataaa agcattgtta acaggattat ttgtacaaga 300
taatgtgaat aaagatgccg tcacagatag attggcttca gtggagactg atatgcctct 360
aacattgaga cagcatagaa taagtgcgac atcatcatcg gaagagagta gtaacaaagg 420
tcaaagacag ttgactgtat cgccggaatt tgtaatacga ctcactatag ggcgagccgc 480
catcatggag gagcagaagc tgatctcaga ggaggacctg catatggcca tggaggccga 540
attcatggat aaagcggaat taattcccga gcctccaaaa aagaagagaa aggtcgaatt 600
gggtaccgcc gccaatttta atcaaagtgg gaatattgct gatagctcat tgtccttcac 660
tttcactaac agtagcaacg gtccgaacct cataacaact caaacaaatt ctcaagcgct 720
ttcacaacca attgcctcct ctaacgttca tgataacttc atgaataatg aaatcacggc 780
tagtaaaatt gatgatggta ataattcaaa accactgtca cctggttgga cggaccaaac 840
tgcgtataac gcgtttggaa tcactacagg gatgtttaat accactacaa tggatgatgt 900
atataactat ctattcgatg atgaagatac cccaccaaac ccaaaaaaag agatttaa 958
<210> 10
<211> 938
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 2
<400> 10
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga actaactgga accaaaaggt 120
ctccgctgac tagggcacat ctgacagaag tggaatcaag gctagaaaga ctggaacagc 180
tatttctact gatttttcct cgagaagacc ttgacatgat tttgaaaatg gattctttac 240
aggatataaa agcattgtta acaggattat ttgtacaaga taatgtgaat aaagatgccg 300
tcacagatag attggcttca gtggagactg atatgcctct aacattgaga cagcatagaa 360
taagtgcgac atcatcatcg gaagagagta gtaacaaagg tcaaagacag ttgactgtat 420
cgccggaatt tgtaatacga ctcactatag ggcgagccgc catcatggag gagcagaagc 480
tgatctcaga ggaggacctg catatggcca tggaggccga attcatggat aaagcggaat 540
taattcccga gcctccaaaa aagaagagaa aggtcgaatt gggtaccgcc gccaatttta 600
atcaaagtgg gaatattgct gatagctcat tgtccttcac tttcactaac agtagcaacg 660
gtccgaacct cataacaact caaacaaatt ctcaagcgct ttcacaacca attgcctcct 720
ctaacgttca tgataacttc atgaataatg aaatcacggc tagtaaaatt gatgatggta 780
ataattcaaa accactgtca cctggttgga cggaccaaac tgcgtataac gcgtttggaa 840
tcactacagg gatgtttaat accactacaa tggatgatgt atataactat ctattcgatg 900
atgaagatac cccaccaaac ccaaaaaaag agatttaa 938
<210> 11
<211> 920
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 3
<400> 11
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaacaagtg tctgaagaac taactggaag gtctccgctg actagggcac 120
atctgacaga agtggaatca aggctagaaa gactggaaca gctatttcta ctgatttttc 180
ctcgagaaga ccttgacatg attttgaaaa tggattcttt acaggatata aaagcattgt 240
taacaggatt atttgtacaa gataatgtga ataaagatgc cgtcacagat agattggctt 300
cagtggagac tgatatgcct ctaacattga gacagcatag aataagtgcg acatcatcat 360
cggaagagag tagtaacaaa ggtcaaagac agttgactgt atcgccggaa tttgtaatac 420
gactcactat agggcgagcc gccatcatgg aggagcagaa gctgatctca gaggaggacc 480
tgcatatggc catggaggcc gaattcatgg ataaagcgga attaattccc gagcctccaa 540
aaaagaagag aaaggtcgaa ttgggtaccg ccgccaattt taatcaaagt gggaatattg 600
ctgatagctc attgtccttc actttcacta acagtagcaa cggtccgaac ctcataacaa 660
ctcaaacaaa ttctcaagcg ctttcacaac caattgcctc ctctaacgtt catgataact 720
tcatgaataa tgaaatcacg gctagtaaaa ttgatgatgg taataattca aaaccactgt 780
cacctggttg gacggaccaa actgcgtata acgcgtttgg aatcactaca gggatgttta 840
ataccactac aatggatgat gtatataact atctattcga tgatgaagat accccaccaa 900
acccaaaaaa agagatttaa 920
<210> 12
<211> 560
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 4
<400> 12
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120
tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180
ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240
ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300
aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360
acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420
caaagacagt tgactgtata acgccggaac gcgtttggaa tcacttaaca gggatgttta 480
ataccactac aatggatgat gtatataact atctattcga tgatgaagat accccaccaa 540
acccaaaaaa agagatttaa 560
<210> 13
<211> 708
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 5
<400> 13
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120
tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180
ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240
ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300
aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360
acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420
caaagacagt tgactgtatc gccggaattt gtaatacgac tcactatagg gcgagccgcc 480
atcatggagg agcagaagct gatctcagag gaggacctgc atatggccat ggaggccgaa 540
ttcatgtgat aaagcggaat taattcccca cctggttgga cggaccaaac tgcgtataac 600
gcgtttggaa tcactacagg gatgtttaat accactacaa tggatgatgt atataactat 660
ctattcgatg atgaagatac cccaccaaac ccaaaaaaag agatttaa 708
<210> 14
<211> 240
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 6
<400> 14
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga actaactgga ctgcgtccaa 120
actgcgtata acgcgtttgg aatcactaca gggatgttta ataccactac aatggatgat 180
gtatataact atctattcga tgatgaagat accccaccaa acccaaaaaa agagatttaa 240
<210> 15
<211> 356
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 7
<400> 15
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120
tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180
ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgactgattt 240
tgtataacgc gtttggaatc actacaggga tgtttaatac cactacaatg gatgatgtat 300
ataactatct attcgatgat gaagataccc caccaaaccc aaaaaaagag atttaa 356
<210> 16
<211> 268
<212> DNA
<213> Saccharomyces cerevisiae
<220>
<223> SNR52 promoter
<400> 16
ctttgaaaag ataatgtatg attatgcttt cactcatatt tatacagaaa cttgatgttt 60
tctttcgagt atatacaagg tgattacatg tacgtttgaa gtacaactct agattttgta 120
gtgccctctt gggctagcgg taaaggtgcg cattttttca caccctacaa tgttctgttc 180
aaaagatttt ggtcaaacgc tgtagaagtg aaagttggtg cgcatgtttc ggcgttcgaa 240
acttctccgc agtgaaagat aaatgatc 268
<210> 17
<211> 20
<212> DNA
<213> Saccharomyces cerevisiae
<220>
<223> SUP4 terminator
<400> 17
tttttttgtt ttttatgtct 20
<210> 18
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> scaffold guide RNA Cas9
<400> 18
ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg 60
gcaccgagtc ggtgc 75
<210> 19
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 1
<400> 19
caagtgtctg aagaactaac 20
<210> 20
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 2
<400> 20
gacagttgac tgtataacgc 20
<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 3
<400> 21
gcgtttggaa tcacttaaca 20
<210> 22
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 4
<400> 22
gcatatggcc atggaggccg 20
<210> 23
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 5
<400> 23
acgcgtttgg aatcactaca 20
<210> 24
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 6
<400> 24
atggtctcaa aacccttggt 20
<210> 25
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 7
<400> 25
acacgcttac tgcctgacta 20
<210> 26
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 1
<400> 26
cctcgagaag accttgacat gattttgaaa atggattctt taca 44
<210> 27
<211> 108
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 2
<400> 27
aaagactgga acagctattt ctactgattt ttcctcgaga agaccttgac atgattttga 60
aaatggattc tttacaggat ataaaagcat tgttaacagg attatttg 108
<210> 28
<211> 520
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 3
<400> 28
tcatcatcgg aagagagtag taacaaaggt caaagacagt tgactgtatc gccggaattt 60
gtaatacgac tcactatagg gcgagccgcc atcatggagg agcagaagct gatctcagag 120
gaggacctgc atatggccat ggaggccgaa ttcatggata aagcggaatt aattcccgag 180
cctccaaaaa agaagagaaa ggtcgaattg ggtaccgccg ccaattttaa tcaaagtggg 240
aatattgctg atagctcatt gtccttcact ttcactaaca gtagcaacgg tccgaacctc 300
ataacaactc aaacaaattc tcaagcgctt tcacaaccaa ttgcctcctc taacgttcat 360
gataacttca tgaataatga aatcacggct agtaaaattg atgatggtaa taattcaaaa 420
ccactgtcac ctggttggac ggaccaaact gcgtataacg cgtttggaat cactacaggg 480
atgtttaata ccactacaat ggatgatgta tataactatc 520
<210> 29
<211> 635
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 4
<400> 29
cagatagatt ggcttcagtg gagactgata tgcctctaac attgagacag catagaataa 60
gtgcgacatc atcatcggaa gagagtagta acaaaggtca aagacagttg actgtatcgc 120
cggaatttgt aatacgactc actatagggc gagccgccat catggaggag cagaagctga 180
tctcagagga ggacctgcat atggccatgg aggccgaatt catggataaa gcggaattaa 240
ttcccgagcc tccaaaaaag aagagaaagg tcgaattggg taccgccgcc aattttaatc 300
aaagtgggaa tattgctgat agctcattgt ccttcacttt cactaacagt agcaacggtc 360
cgaacctcat aacaactcaa acaaattctc aagcgctttc acaaccaatt gcctcctcta 420
acgttcatga taacttcatg aataatgaaa tcacggctag taaaattgat gatggtaata 480
attcaaaacc actgtcacct ggttggacgg accaaactgc gtataacgcg tttggaatca 540
ctacagggat gtttaatacc actacaatgg atgatgtata taactatcta ttcgatgatg 600
aagatacccc accaaaccca aaaaaagaga tttaa 635
<210> 30
<211> 957
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 5
<400> 30
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120
tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180
ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240
ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300
aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360
acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420
caaagacagt tgactgtatc gccggaattt gtaatacgac tcactatagg gcgagccgcc 480
atcatggagg agcagaagct gatctcagag gaggacctgc atatggccat ggaggccgaa 540
ttcatggata aagcggaatt aattcccgag cctccaaaaa agaagagaaa ggtcgaattg 600
ggtaccgccg ccaattttaa tcaaagtggg aatattgctg atagctcatt gtccttcact 660
ttcactaaca gtagcaacgg tccgaacctc ataacaactc aaacaaattc tcaagcgctt 720
tcacaaccaa ttgcctcctc taacgttcat gataacttca tgaataatga aatcacggct 780
agtaaaattg atgatggtaa taattcaaaa ccactgtcac ctggttggac ggaccaaact 840
gcgtataacg cgtttggaat cactacaggg atgtttaata ccactacaat ggatgatgta 900
tataactatc tattcgatga tgaagatacc ccaccaaacc caaaaaaaga gatttaa 957
<210> 31
<211> 4155
<212> DNA
<213> Artificial Sequence
<220>
<223> Cas9 rice codon-optimized
<400> 31
atggacaaga agtatagtat tggtctggac attgggacga attccgttgg ctgggccgtg 60
atcaccgatg agtacaaggt cccttccaag aagtttaagg ttctggggaa caccgatcgg 120
cacagcatca agaagaatct cattggagcc ctcctgttcg actcaggcga gaccgccgaa 180
gcaacaaggc tcaagagaac cgcaaggaga cggtatacaa gaaggaagaa taggatctgc 240
tacctgcagg agattttcag caacgaaatg gcgaaggtgg acgattcgtt ctttcataga 300
ttggaggaga gtttcctcgt cgaggaagat aagaagcacg agaggcatcc tatctttggc 360
aacattgtcg acgaggttgc ctatcacgaa aagtacccca caatctatca tctgcggaag 420
aagcttgtgg actcgactga taaggcggac cttagattga tctacctcgc tctggcacac 480
atgattaagt tcaggggcca ttttctgatc gagggggatc ttaacccgga caatagcgat 540
gtggacaagt tgttcatcca gctcgtccaa acctacaatc agctctttga ggaaaaccca 600
attaatgctt caggcgtcga cgccaaggcg atcctgtctg cacgcctttc aaagtctcgc 660
cggcttgaga acttgatcgc tcaactcccg ggcgaaaaga agaacggctt gttcgggaat 720
ctcattgcac tttcgttggg gctcacacca aacttcaaga gtaattttga tctcgctgag 780
gacgcaaagc tgcagctttc caaggacact tatgacgatg acctggataa ccttttggcc 840
caaatcggcg atcagtacgc ggacttgttc ctcgccgcga agaatttgtc ggacgcgatc 900
ctcctgagtg atattctccg cgtgaacacc gagattacaa aggccccgct ctcggcgagt 960
atgatcaagc gctatgacga gcaccatcag gatctgaccc ttttgaaggc tttggtccgg 1020
cagcaactcc cagagaagta caaggaaatc ttctttgatc aatccaagaa cggctacgct 1080
ggttatattg acggcggggc atcgcaggag gaattctaca agtttatcaa gccaattctg 1140
gagaagatgg atggcacaga ggaactcctg gtgaagctca atagggagga ccttttgcgg 1200
aagcaaagaa ctttcgataa cggcagcatc cctcaccaga ttcatctcgg ggagctgcac 1260
gccatcctga gaaggcagga agacttctac ccctttctta aggataaccg ggagaagatc 1320
gaaaagattc tgacgttcag aattccgtac tatgtcggac cactcgcccg gggtaattcc 1380
agatttgcgt ggatgaccag aaagagcgag gaaaccatca caccttggaa cttcgaggaa 1440
gtggtcgata agggcgcttc cgcacagagc ttcattgagc gcatgacaaa ttttgacaag 1500
aacctgccta atgagaaggt ccttcccaag cattccctcc tgtacgagta tttcactgtt 1560
tataacgaac tcacgaaggt gaagtatgtg accgagggaa tgcgcaagcc cgccttcctg 1620
agcggcgagc aaaagaaggc gatcgtggac cttttgttta agaccaatcg gaaggtcaca 1680
gttaagcagc tcaaggagga ctacttcaag aagattgaat gcttcgattc cgttgagatc 1740
agcggcgtgg aagacaggtt taacgcgtca ctggggactt accacgatct cctgaagatc 1800
attaaggata aggacttctt ggacaacgag gaaaatgagg atatcctcga agacattgtc 1860
ctgactctta cgttgtttga ggatagggaa atgatcgagg aacgcttgaa gacgtatgcc 1920
catctcttcg atgacaaggt tatgaagcag ctcaagagaa gaagatacac cggatgggga 1980
aggctgtccc gcaagcttat caatggcatt agagacaagc aatcagggaa gacaatcctt 2040
gactttttga agtctgatgg cttcgcgaac aggaatttta tgcagctgat tcacgatgac 2100
tcacttactt tcaaggagga tatccagaag gctcaagtgt cgggacaagg tgacagtctg 2160
cacgagcata tcgccaacct tgcgggatct cctgcaatca agaagggtat tctgcagaca 2220
gtcaaggttg tggatgagct tgtgaaggtc atgggacggc ataagcccga gaacatcgtt 2280
attgagatgg ccagagaaaa tcagaccaca caaaagggtc agaagaactc gagggagcgc 2340
atgaagcgca tcgaggaagg cattaaggag ctggggagtc agatccttaa ggagcacccg 2400
gtggaaaaca cgcagttgca aaatgagaag ctctatctgt actatctgca aaatggcagg 2460
gatatgtatg tggaccagga gttggatatt aaccgcctct cggattacga cgtcgatcat 2520
atcgttcctc agtccttcct taaggatgac agcattgaca ataaggttct caccaggtcc 2580
gacaagaacc gcgggaagtc cgataatgtg cccagcgagg aagtcgttaa gaagatgaag 2640
aactactgga ggcaactttt gaatgccaag ttgatcacac agaggaagtt tgataacctc 2700
actaaggccg agcgcggagg tctcagcgaa ctggacaagg cgggcttcat taagcggcaa 2760
ctggttgaga ctagacagat cacgaagcac gtggcgcaga ttctcgattc acgcatgaac 2820
acgaagtacg atgagaatga caagctgatc cgggaagtga aggtcatcac cttgaagtca 2880
aagctcgttt ctgacttcag gaaggatttc caattttata aggtgcgcga gatcaacaat 2940
tatcaccatg ctcatgacgc atacctcaac gctgtggtcg gaacagcatt gattaagaag 3000
tacccgaagc tcgagtccga attcgtgtac ggtgactata aggtttacga tgtgcgcaag 3060
atgatcgcca agtcagagca ggaaattggc aaggccactg cgaagtattt cttttactct 3120
aacattatga atttctttaa gactgagatc acgctggcta atggcgaaat ccggaagaga 3180
ccacttattg agaccaacgg cgagacaggg gaaatcgtgt gggacaaggg gagggatttc 3240
gccacagtcc gcaaggttct ctctatgcct caagtgaata ttgtcaagaa gactgaagtc 3300
cagacgggcg ggttctcaaa ggaatctatt ctgcccaagc ggaactcgga taagcttatc 3360
gccagaaaga aggactggga cccgaagaag tatggaggtt tcgactcacc aacggtggct 3420
tactctgtcc tggttgtggc aaaggtggag aagggaaagt caaagaagct caagtctgtc 3480
aaggagctcc tgggtatcac cattatggag aggtccagct tcgaaaagaa tccgatcgat 3540
tttctcgagg cgaagggata taaggaagtg aagaaggacc tgatcattaa gcttccaaag 3600
tacagtcttt tcgagttgga aaacggcagg aagcgcatgt tggcttccgc aggagagctc 3660
cagaagggta acgagcttgc tttgccgtcc aagtatgtga acttcctcta tctggcatcc 3720
cactacgaga agctcaaggg cagcccagag gataacgaac agaagcaact gtttgtggag 3780
caacacaagc attatcttga cgagatcatt gaacagattt cggagttcag taagcgcgtc 3840
atcctcgccg acgcgaattt ggataaggtt ctctcagcct acaacaagca ccgggacaag 3900
cctatcagag agcaggcgga aaatatcatt catctcttca ccctgacaaa ccttggggct 3960
cccgctgcat tcaagtattt tgacactacg attgatcgga agagatacac ttctacgaag 4020
gaggtgctgg atgcaaccct tatccaccaa tcgattactg gcctctacga gacgcggatc 4080
gacttgagtc agctcggggg ggataagaga ccagcggcaa ccaagaaggc aggacaagcg 4140
aagaagaaga agtag 4155
<210> 32
<211> 1995
<212> DNA
<213> Zea mays
<220>
<223> maize Ubi promoter containing MubG1 intron
<400> 32
tgcagtgcag cgtgacccgg tcgtgcccct ctctagagat aatgagcatt gcatgtctaa 60
gttataaaaa attaccacat attttttttg tcacacttgt ttgaagtgca gtttatctat 120
ctttatacat atatttaaac tttactctac gaataatata atctatagta ctacaataat 180
atcagtgttt tagagaatca tataaatgaa cagttagaca tggtctaaag gacaattgag 240
tattttgaca acaggactct acagttttat ctttttagtg tgcatgtgtt ctcctttttt 300
tttgcaaata gcttcaccta tataatactt catccatttt attagtacat ccatttaggg 360
tttagggtta atggttttta tagactaatt tttttagtac atctatttta ttctatttta 420
gcctctaaat taagaaaact aaaactctat tttagttttt ttatttaata gtttagatat 480
aaaatagaat aaaataaagt gactaaaaat taaacaaata ccctttaaga aattaaaaaa 540
actaaggaaa catttttctt gtttcgagta gataatgcca gcctgttaaa cgccgtcgac 600
gagtctaacg gacaccaacc agcgaaccag cagcgtcgcg tcgggccaag cgaagcagac 660
ggcacggcat ctctgtcgct gcctctggac ccctctcgag agttccgctc caccgttgga 720
cttgctccgc tgtcggcatc cagaaattgc gtggcggagc ggcagacgtg agccggcacg 780
gcaggcggcc tcctcctcct ctcacggcac cggcagctac gggggattcc tttcccaccg 840
ctccttcgct ttcccttcct cgcccgccgt aataaataga caccccctcc acaccctctt 900
tccccaacct cgtgttgttc ggagcgcaca cacacacaac cagatctccc ccaaatccac 960
ccgtcggcac ctccgcttca aggtacgccg ctcgtcctcc cccccccccc cccctctcta 1020
ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat 1080
gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 1140
acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 1200
gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 1260
atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 1320
tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 1380
tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 1440
tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 1500
ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 1560
ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 1620
tagagtactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 1680
atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 1740
atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 1800
gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttatttcgat 1860
cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 1920
ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 1980
gtgttacttc tgcag 1995
<210> 33
<211> 294
<212> DNA
<213> Agrobacterium tumefaciens
<220>
<223> nopaline synthase terminator (tnos)
<400> 33
agcggccgcc cggctgcaga tcgttcaaac atttggcaat aaagtttctt aagattgaat 60
cctgttgccg gtcttgcgat gattatcata taatttctgt tgaattacgt taagcatgta 120
ataattaaca tgtaatgcat gacgttattt atgagatggg tttttatgat tagagtcccg 180
caattataca tttaatacgc gatagaaaac aaaatatagc gcgcaaacta ggataaatta 240
tcgcgcgcgg tgtcatctat gttactagat ccgatgataa gctgtcaaac atga 294
<210> 34
<211> 377
<212> DNA
<213> Oryza sativa
<220>
<223> RNA pol III promoter promoter from the rice U3 small nucle ar RNA
gene (OsU3)
<400> 34
aagggatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaggaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtggagtaa gataaactgt aggagaaaag catttcgtag tgggccatga 240
agcctttcag gacatgtatt gcagtatggg ccggcccatt acgcaattgg acgacaacaa 300
agactagtat tagtaccacc tcggctatcc acatagatca aagctggttt aaaagagttg 360
tgcagatgat ccgtggc 377
<210> 35
<211> 7787
<212> DNA
<213> Oryza sativa
<220>
<223> rice Protoporphyrinogen Oxidase (PPO2)
<400> 35
atgctctctc ctgccaccac cttctcctcc tcctcctcct cctcgtcgcc gtcgcgcgcc 60
cacgctcgcg ctcccacccg cttcgcggtc gcagcatccg cgcgcgccgc acggttccgc 120
cccgcgcgcg ccatggccgc ctccgacgac ccccgcggcg ggaggtccgt cgccgtcgtc 180
ggcgccggcg tcaggtgggt ggggagccgc gcgcgctctc cgtgggttca gttctgccct 240
aggtttgggg tgccgtgtgc gtgtgagtgg ggaggttgtt ttttttgatg attgatgaaa 300
tggttgcctc tctgcagtgg gctcgcggcg gcgtacaggc tgaggaagcg cggcgtgcag 360
gtgacggtgt tcgaggcggc cgacagggcg ggtgggaaga tacggaccaa ctccgagggc 420
gggttcatct gggacgaagg ggccaacacc atggtgagcg cgctttggtg tgcctcgctg 480
cttctgtttg atcacaatct cgggctgtgt tggtctgcat tgctgcaaat gctgcttctg 540
tatgttttgg attgtggcgc actggcgctg ctgcggctat ttgagggctg gagcacacta 600
gcgagtagtg ctccttggtg cgcaggctga ggaaacttgt gtttgtgaac gaaatgcaag 660
ctgctcacta atgcagacag ttgttcctgc aaatggagaa gtgttttctt ctgcattcgt 720
atcccacaac agacgtgaac cctttctgct atgagcatca ttgaacaccg ttatgtaact 780
tatcatagcc tgattcgatt tcattcacca tgatctataa ctattatact taccatatta 840
gttactttgt actactctta gtaaaataaa taaattattt taatactcca ctgacaaaat 900
aggttaagat tgtttcattg cttgggcaca tgtgcaatac tagtcgcatt ttttttacct 960
gcgtgcaaat cttatcatgc ctgcttgatt caatttgccg ttctctctgt aatttaatta 1020
ttttgcctcc agacagagag tgaattggag gcaagcaggc ttattgacga tcttggccta 1080
caaggcaaac agcagtatgt atgtgctaat gttatctgtg atggttaact gctttgaatg 1140
tcttctgttt cataatttac actgatatgt ttaatatttc gatatccttt agcctaactc 1200
acaacacaag cgttacattg tcaaagatgg agcaccaaca ctggtaaata gacttttcat 1260
gatatgatgc attttgtttt gttcttccta tagtatgcct cacttttgaa tatatttttt 1320
tgtcacataa gattccctca gatcccattg cgctcatgaa aagcactgtt ctttctacaa 1380
aatcaaaggt atgtaagtta ttgagtgcta attgctacaa catatcatga cctcctgacc 1440
tatttgcaac aagttgcttg ttgtttccac ttgtcactga tggattaaaa ttcactagtg 1500
tagaaacaat catattaaac tgatcaccgt gacttgattt acttgttttc agttcactat 1560
tacaaatttg tacatttcct gatctttcgt gttcaagctg tgtgatcgac tgattgcaac 1620
cgtcatatta tattactgta ttgagtttag taaaacatgg tcttatcttt gcagctcaag 1680
ctatttctgg aaccatttct ctatgagaaa tctagcagaa ggacctcggg aaaagtgtct 1740
gatgaacatt taagtgagag gtgagccttc atactgatgt tattttgagt tgttgtaaac 1800
ttgaaccact gataatatag ttatatgttt ttttcctgtg ttcttccttc attctcatgc 1860
ccttgtgaaa tacaaatata tacttcatat cacacactcc ctttggtcat ttttcatgtc 1920
aaacttttaa aactttgtac ataaaatcag ttcaatattt agattgaacg catgagaaag 1980
tattttcata atattatgat tttaccattt ttttcatata cgttgcaaca gaatttagtg 2040
gtcaaagcta cactttgaag accttattga tgtcaaaaac agcatgtttt ctgaccagag 2100
agaatacatt tgcagtgtga tttttctgtg tatatgtaga gataatcagg tttctctttt 2160
gcagtgttgc aagtttcttt gaacgccact ttggaaaaga ggcaagttca tttttaatga 2220
agaaatttat ggattgttaa gtgaatacaa tcaacacttt gcaacttaca tgcccattat 2280
aatcagtaga gggtaagaat ttataacttt attacaggtt gttgattatc ttattgatcc 2340
atttgtggct ggaacaagcg gaggagatcc tgagtcatta tcagtaagtt attataacat 2400
gtctcactat ttgcattttc catatcagca cctttgcatt tctacagtaa attgtagtca 2460
taattatttt tatgtaaatt gtgcgtataa acaacatatg tgcttgactt tgtgatgtgt 2520
tcttggggat gataactgat acggctagaa cttttggggg ctaatctcct tgagccgtat 2580
cagtaagtca taacaattct cattcataat gatcaaaaca tatcaccttc ttgtgtagaa 2640
ctgttctggt tttgagtaat attttcttct gtgcagattc gtcatgcatt tccagcatta 2700
tggaatttgg agaataagta agtttgtagt agtttgtttg gagaataagt aagtttgtag 2760
tttgtgcatt gatgttcatt caagatttac cttatcaata attcacttgt ccacgtccat 2820
atgctcgtgc tatatcctgt ccattcaaat gtcaacaccg ccatgtgaat ttactgcata 2880
gtgcatttta atgatttcat ttatccttgt tgcttgcatc tcttttttgg gctcctgctg 2940
ttagcttgtt tttggttcct gctgttacct atttcttttc tatcattttt tcattggaca 3000
gatggtgctc tcagtcctta ctgcttatta tttgttaacc tgatatgcac ctacttgaag 3060
ttaatgttat gatttttagt attttatagt catggtatca ttaatactta tttttggcaa 3120
tcgaaattaa aaaaacatga tgtcaaaata aaaaatcatg gcagttgaat gcagtgggta 3180
tatgtatcaa gaatttaaga tcttgaacat aagtccaatt gctatatgtt caattcgttg 3240
gagcataaca tgatctaatt tgtaagttaa atttatctga taaacgatgg aaggaaattc 3300
tggtaccact catgcaacta tacaagcttc aaaggcttct tacatgtgga ccattggacc 3360
tagaatagaa tctaaattta ttcataagta tataattttt tttccttcat gggccatgat 3420
agttaactat atgagcttgt agagtcaaaa taggcataat tgcttctttg ggtttccact 3480
taatttaccc tacaacactt ctattgcaat aaatatggtc aacaacattt ctttacggtc 3540
cgtttggttg gagggagttt ttaggaggga ttgggagttt agagggatgg agctattaac 3600
tgttttgttt ggttgggaga gatgggaatt ttggtgggat ggagatgggg aattgaggaa 3660
ggaactccct ccttttcaat acctgggtag ggggtggtaa ttgggaggga attcctcctt 3720
tactttgcct aaacaaatct cagccatccg ttttcattaa tgacctaatc tccaactaaa 3780
cttcctgtca atttccacca cctctgccaa acaagatatt gggattaaaa atcaaattcc 3840
catcttaatc tcaccatcaa ttccctcgtg taaactccca atccccttcc ctcaagttgc 3900
caaacaagcc attagtgccc agttatgttc tttggtcatc ttcttcataa tttgttgctc 3960
catgcacttt caatgctcac aggtatggct ctgtcattgc tggtgccatc ttgtccaaac 4020
tatccactaa gggtgattca gtgaagacag gaggtgcttc gccagggaaa ggaaggaata 4080
aacgtgtgtc attttcattt catggtggaa tgcaggtact ccacagatgt cctgtagttt 4140
cttttgtcag tgtcaaagat atcaaagaca gtgataaacc ctgaacttta gtttgagcaa 4200
ttctacatgc cactaaaaaa tgccgaattc atatgttgtg aattgaagac ctgttatttt 4260
cctgcaacta ggacatatgt ttagtcggtg aaacttcatt gctgctttaa gaagtcttac 4320
aggccagaga aaactgtctt gttttttttt tttttgattt gatgtcctgc tttatattta 4380
tgatccagcc aagcttatcc atccatctgc accctgatcc tgccataatc atttttttta 4440
tcagcctgac atgagcttat tatgttgcat aagttaggtt gaagctagat cgaacaaaaa 4500
actcaaagct actgataagt acaggatatg caacagaagt atcacacgag ccaaatctgc 4560
tataagaata aaacatacca agagccttag acaccactaa atagtgtgaa tggtagtgat 4620
agcgaataat ctcagaagat gacattttgg gaaatattat cgtgtagtat actttattaa 4680
ttgggagttg cgatacttgc cctgcacgct aaacatgctg aaaagtttca cagttatact 4740
acataacatc tgggtgtgta aaggttttat gttgttcatt gcttttcagt cactaataga 4800
tgcacttcac aatgaagttg gagatggtaa cgtgaagctt ggtacagaag tgttgtcatt 4860
ggcatgttgc tgtgatggag tctcttcttc tggtggttgg tcaatttctg ttgattcaaa 4920
agatgctaaa gggaaagatc tcagaaagaa ccaatctttc gatgctgtta taatgactgt 4980
aagaaaaaaa ttatctgtat tcatctcttt agaagcttga tcatttgaca gccacaaatt 5040
aaaatatttt accgtgtttt tctttttgcc cctttaggct ccattgtcta atgtccagag 5100
gatgaagttt acaaaaggtg gagttccctt tgtgctagac tttcttccta aggtcaggtt 5160
agaatcactc ttttagattt aacaaatgca gtgttgcact agcatgttct tgagaaattt 5220
gtgctggggg aaattcctct taatccttca aattgcattt aatttcatcc attaggtcga 5280
tggatccatg tcacagaaaa tattttgttt atcttctaga tttctattat atatgtaaga 5340
ctgtctctta gtttgtgaat ttacaggagt caatcatcac tcccttgaat ctgagcatat 5400
cagcagttca tcagcaatat ggtttatttg agaaggcaac ggaaactatt gtttccaaag 5460
gccacttgtt tgaaactttc accactgttt tgaacagtgt attaaagtaa cagtcatttg 5520
tatagcagca cctggtgatt tttaagtaaa ttttccattc ccaatcaaaa caagtaacat 5580
tatatgttga acatgtactg aattgaatat ggaactttat gctggagatg ccagacttta 5640
ttttactggc atgaatacac aattattgta acaatggtat tattgcttgg ttacttctcc 5700
gctgtgaaga catacctttc gtcacctttt cttgtttccc atattctgca ccttatggga 5760
ttgtcttcca catgttaaga tgccttgtag taccagttcc cctattattt gaatgtgttc 5820
ttccttagat atatgtgcat ttggaacgtg attggaaata caacagcaaa ctggtattgt 5880
tagctgcttg cctgccacag cctacatatg ctgccatatt acagaattat gagataggtg 5940
gactttgatt tctgtcataa tgattaacta acttgatata ctcaaactat gcagctccta 6000
gctggtatcc ttagaattta tcgagtatgc atagaagtct actcttaatc catatctatt 6060
tgatgtactc aaacttgaaa ctatgcagct cctagctggg ctccttagaa ttatcaagta 6120
tgcatagaaa tcttaatcca tatttattta ttatatgcag gtcgattatc taccactatc 6180
tctcatggta acagctttta agaaggaaga tgtcaaaaaa ccattggaag gatttggtgc 6240
cttgataccc tataaggaac agcaaaagca tggtctcaaa acccttggta ggttaattca 6300
gctttacact tatattttat ccagcttgta gctgcttata ttttgatttg cgaattaaaa 6360
attattaaaa cagccttgaa agaagaaacc atgttcgctg tggagactag aaattcccac 6420
attaattggg gaaagagaaa tatttacacc ctatgatttt ggcaagtgca agttttaatg 6480
gttgagattg atggattgaa tatatatcat atttggactc agtatgaaca aataccagat 6540
acataaatag atagtactaa ttcaacatgg atctgaactg ttgatcagac caattgagca 6600
cttggttgta attgctcgcg gactacacgc ttactgcctg actagggttc catgatgata 6660
aggttcgatt ttctaaaata ctattacaac aagatgacta tttaataaaa tttaaagaga 6720
ataacgtata taaaaattta gataaatttg gtgcaccgcg caattgcgca ggtcaccctg 6780
ctagctgtat tgaactcaat atacaaatca accttgctac attgctctac tttttctcag 6840
gtcttattta ctctgatttc tatttattct aatctataca tgtcgtcttg tacagggacc 6900
ctcttctcct cgatgatgtt tccagatcga gctcctaatg atcaatatct atatacatct 6960
ttcattgggg ggagccataa tagagacctc gctggggctc caacgtatac ttccatatta 7020
tgatcattta tgttttggtt gttttttctt ttcttgctag atttttctga tatatatact 7080
tatgtagggc tattctgaaa caacttgtga cctctgacct aagaaagctc ttgggtgttg 7140
agggacaacc tacttttgtg aagtaagtga taagaaacta ctgccatggt ttagagtatc 7200
tatatgtttt ctcttgttgt gcttgtgtta tggttttcca tcactatgga gttttgagga 7260
ttcattcagg tttttgcact accacttgcg aattcaatat gatgttcttt tacacaggca 7320
tgtacattgg agaaatgctt ttcctttata tggccagaat tatgatctgg tactggaagc 7380
tatagcaaaa atggagaaca atcttccagg gttcttttac gcaggcaagt caatgaaggc 7440
acccctattg tacaaaagaa atcttagata tttgaaacat attcctgttg attgagtacg 7500
tgaataattt gctgtttcta gtaagtcaat ttggtatttc tcatgcaact tatggggctc 7560
cttgatttgc tgagaatgat gagtttccta gagcaagcca ggaactgtaa tcccagcatg 7620
taatacttta ccttgaaatt aacttcaaaa aaataattga agctttttct gtatctgtag 7680
gaaataacaa ggatgggttg gctgttggaa atgttatagc ttcaggaagc aaggctgctg 7740
accttgtgat ctcttatctt gaatcttgca cagatcagga caattag 7787
<210> 36
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 8
<400> 36
atggtctcaa aacccttggt 20
<210> 37
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 9
<400> 37
acacgcttac tgcctgacta 20
<210> 38
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 10
<400> 38
tatatacatc tttcattggg 20
<210> 39
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 6
<400> 39
gaaggatttg gtgccttgat accctataag gaacagcaaa agcatggtct caaaaccttt 60
ggtagattaa ttcagcttta cacttatatt ttatccagct tgtagctgct tatattttga 120
<210> 40
<211> 794
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 7
<400> 40
gaaggatttg gtgccttgat accctataag gaacagcaaa agcatggtct caaaaccttt 60
ggtaggttaa ttcagcttta cacttatatt ttatccagct tgtagctgct tatattttga 120
tttgcgaatt aaaaattatt aaaacagcct tgaaagaaga aaccatgttc gctgtggaga 180
ctagaaattc ccacattaat tggggaaaga gaaatattta caccctatga ttttggcaag 240
tgcaagtttt aatggttgag attgatggat tgaatatata tcatatttgg actcagtatg 300
aacaaatacc agatacataa atagatagta ctaattcaac atggatctga actgttgatc 360
agaccaattg agcacttggt tgtaattgct cgcggactac acgcttactg cctgactagc 420
gttccatgat gataaggttc gattttctaa aatactatta caacaagatg actatttaat 480
aaaatttaaa gagaataacg tatataaaaa tttagataaa tttggtgcac cgcgcaattg 540
cgcaggtcac cctgctagct gtattgaact caatatacaa atcaaccttg ctacattgct 600
ctactttttc tcaggtctta tttactctga tttctattta ttctaatcta tacatgtcgt 660
cttgtacagg gaccctcttc tcctcgatga tgtttccaga tcgagctcct aatgatcaat 720
atctatatac atctgtaatt ggggggagcc ataatagaga cctcgctggg gctccaacgt 780
atacttccat atta 794
<210> 41
<211> 800
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 8
<400> 41
atggatctga actgttgatc agaccaattg agcacttggt tgtaattgct cgcggactac 60
acgcttactg cctgactagg gttccatgat gataaggttc gattttctaa aatactatta 120
caacaagatg actatttaat aaaatttaaa gagaataacg tatataaaaa tttagataaa 180
tttggtgcac cgcgcaattg cgcaggtcac cctgctagct gtattgaact caatatacaa 240
atcaaccttg ctacattgct ctactttttc tcaggtctta tttactctga tttctattta 300
ttctaatcta tacatgtcgt cttgtacagg gaccttcttc tcctcgatga tgtttccaga 360
tcgagctcct aatgatcaat atctatatac atctgtaatt ggcggcagcc ataatagaga 420
cctcgctggg gctccaacgt atacttccat attatgatca tttatgtttt ggttgttttt 480
tcttttcttg ctagattttt ctgatatata tacttatgta gggctattct gaaacaactt 540
gtgacctctg acctaagaaa gctcttgggt gttgagggac aacctacttt tgtgaagtaa 600
gtgataagaa actactgcca tggtttagag tatctatatg ttttctcttg ttgtgcttgt 660
gttatggttt tccatcacta tggagttttg aggattcatt caggtttttg cactaccact 720
tgcgaattca atatgatgtt cttttacaca ggcatgtaca ttggagaaat gcttttcctt 780
tatatggcca gaattatgat 800
<210> 42
<211> 138
<212> DNA
<213> Artificial Sequence
<220>
<223> RecA FusionCRISPR
<400> 42
gatgtggaaa ccatctctac gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttc catggatgtg gaaaccatcg 120
ctttcactgg atatcgcg 138
<210> 43
<211> 1062
<212> DNA
<213> Escherichia coli
<220>
<223> RecA
<400> 43
atggctatcg acgaaaacaa acagaaagcg ttggcggcag cactgggcca gattgagaaa 60
caatttggta aaggctccat catgcgcctg ggtgaagacc gttccatgga tgtggaaacc 120
atctctaccg gttcgctttc actggatatc gcgcttgggg caggtggtct gccgatgggc 180
cgtatcgtcg aaatctacgg accggaatct tccggtaaaa ccacgctgac gctgcaggtg 240
atcgccgcag cgcagcgtga aggtaaaacc tgtgcgttta tcgatgctga acacgcgctg 300
gacccaatct acgcacgtaa actgggcgtc gatatcgaca acctgctgtg ctcccagccg 360
gacaccggcg agcaggcact ggaaatctgt gacgccctgg cgcgttctgg cgcagtagac 420
gttatcgtcg ttgactccgt ggcggcactg acgccgaaag cggaaatcga aggcgaaatc 480
ggcgactctc acatgggcct tgcggcacgt atgatgagcc aggcgatgcg taagctggcg 540
ggtaacctga agcagtccaa cacgctgctg atcttcatca accagatccg tatgaaaatt 600
ggtgtgatgt tcggtaaccc ggaaaccact accggtggta acgcgctgaa attctacgcc 660
tctgttcgtc tcgacatccg tcgtatcggc gcggtgaaag agggcgaaaa cgtggtgggt 720
agcgaaaccc gcgtgaaagt ggtgaagaac aaaatcgctg cgccgtttaa acaggctgaa 780
ttccagatcc tctacggcga aggtatcaac ttctacggcg aactggttga cctgggcgta 840
aaagagaagc tgatcgagaa agcaggcgcg tggtacagct acaaaggtga gaagatcggt 900
cagggtaaag cgaatgcgac tgcctggctg aaagataacc cggaaaccgc gaaagagatc 960
gagaagaaag tacgtgagtt gctgctgagc aacccgaact caacgccgga tttctctgta 1020
gatgatagcg aaggcgtagc agaaactaac gaagattttt aa 1062
<210> 44
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 44
atggctatcg acgaaaacaa a 21
<210> 45
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 45
cgtcagcgtg gttttaccgg a 21
<210> 46
<211> 461
<212> DNA
<213> Artificial Sequence
<220>
<223> Expression Cassette
<400> 46
tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60
gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120
gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180
tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240
gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300
tggaaaggac gaaacaccgg catccctcag gctgggctgt tttagagcta gaaatagcaa 360
gttaaaataa ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctggcca 420
tcaggcatcc ctcagtatgg aatgaggcat ctgatttttt t 461
<210> 47
<211> 275
<212> DNA
<213> Homo sapiens
<220>
<223> PRDM9 exon ENSE00001804383
<400> 47
attgtgagat gtgtcagaac ttcttcattg acagctgtgc tgcccatggg ccccctacat 60
ttgtaaagga cagtgcagtg gacaaggggc accccaaccg ttcagccctc agtctgcccc 120
cagggctgag aattgggcca tcaggcatcc ctcaggctgg gcttggagta tggaatgagg 180
catctgatct gccgctgggt ctgcactttg gcccttatga gggccgaatt acagaagacg 240
aagaggcagc caacaatgga tactcctggc tgtgg 275
<210> 48
<211> 783
<212> DNA
<213> Artificial Sequence
<220>
<223> Gene Fragment
<400> 48
cacctagggg ggaggtcgta gtacccccct atgttttctc ccctaaataa ccccaaaaat 60
ctaagaaaaa aagacctcaa aaaggtcttt aattaacatc tcaaatttcg catttattcc 120
aatttccttt ttgcgtgtga tgcgaattct tgaccgtgat tagagaattg agtaaaatgt 180
acctacgcga gacctcattc gccattcagg ctacgcaact gttgggaagg gcgatcggtg 240
cgggcctctt cgctattacg ccatgaggcg aaagggggat gtgctgcaag gcgattaagt 300
tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag actattcgta 360
atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 420
acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 480
aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctcgatta 540
atgaatcggt ctcagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat 600
caacttgaaa aagtggcacc gagtcggtgc tggccaacga ggcccgggcc aataaggcct 660
tttttactcc atctggattt gttcagaacg ctcggttgcc gccgggcgtt ttttatctaa 720
agcttaggcc cagtcgaaag actgggcctt tttaatacga ctcactatag ggtcgactct 780
aga 783
<210> 49
<211> 784
<212> DNA
<213> Artificial Sequence
<220>
<223> Gene Fragment
<400> 49
cacctagggg ggaggtcgta gtacccccct atgttttctc ccctaaataa ccccaaaaat 60
ctaagaaaaa aagacctcaa aaaggtcttt aattaacatc tcaaatttcg catttattcc 120
aatttccttt ttgcgtgtga tgcgaattct tgaccgtgat tagagaattg agtaaaatgt 180
acctacggcc aacgaggccc gggccaataa ggcctacgcg agacctcatt cgccattcag 240
gctacgcaac tgttgggaag ggcgatcggt gcgggcctct tcgctattac gccatgaggc 300
gaaaggggga tgtgctgcaa ggcgattaag ttgggtaacg ccagggtttt cccagtcacg 360
acgttgtaaa acgacggcca gactattcgt aatcatggtc atagctgttt cctgtgtgaa 420
attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct 480
ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg cccgctttcc 540
agtcgggaaa cctgtcgtgc cagctcgatt aatgaatcgg tctcagtttt agagctagaa 600
atagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg 660
ctttttactc catctggatt tgttcagaac gctcggttgc cgccgggcgt tttttatcta 720
aagcttaggc ccagtcgaaa gactgggcct ttttaatacg actcactata gggtcgactc 780
taga 784
<210> 50
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 50
tacgtgaaga tcaggctatc actg 24
<210> 51
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 51
aaaccagtga tagcctgatc ttca 24
<210> 52
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 52
gatcggccaa cgaggccgcg gcattatgtt tgaatttccg tttaaagaat gg 52
<210> 53
<211> 76
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 53
gatggtttct ttcggtaagt cccgtctagc cttgccctca tcttgacact ccttatttga 60
ttttttgaag acttac 76
<210> 54
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 54
tgagggcaag gctagacggg acttaccgaa agaaaccatc 40
<210> 55
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 55
gatcaggcct tattggcctt ggcaggccgc tgaatttcca tgttgcgtaa gtcagg 56
<210> 56
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 56
gatcggccaa cgaggccttg gcaggccgct gaatttccat gttgcgtaag tc 52
<210> 57
<211> 76
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 57
cgaagtaagt cttcaaaaaa tcaaataagg agtgtcaaga tgagggcaag gctagacggg 60
acttaccgaa agaaac 76
<210> 58
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 58
tcttgacact ccttatttga ttttttgaag acttacttcg 40
<210> 59
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 59
gatcggcctt attggccgcg gcattatgtt tgaatttccg tttaaagaat ggtctgc 57
<210> 60
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 60
gactttcagg cgtgaatgg 19
<210> 61
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 61
cgtgctctcc gataatatgc 20
<210> 62
<211> 6588
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector RLW121
<400> 62
ccgtttaaac ttagttacta atcagtgatc agattgtcgt ttcccgcctt cactttaaac 60
tatcagtgtt tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga 120
ataatcggat atttaaaagg gcgtgaaaag gtttatccgt tcgtccattt gtatgtcaat 180
attggggggg ggggaaagcc acgttgtgtc tcaaaatctc tgatgttaca ttgcacaaga 240
taaaaatata tcatcatgaa caataaaact gtctgcttac ataaacagta atacaagggg 300
tgttcgccac catgagccat atccagcgtg aaacctcgtg ctcccgcccg cgcctcaatt 360
ccaatatgga tgccgacctt tatggctaca agtgggcgcg cgacaacgtc ggccagtcgg 420
gcgcgaccat ttatcggctt tatggcaaac ccgatgcccc ggaactgttc ctgaagcacg 480
gcaaaggcag cgtcgcaaac gatgtcaccg atgagatggt ccgcctgaac tggcttaccg 540
agttcatgcc gctgccgacg attaagcatt tcatccgtac cccggacgat gcctggctct 600
tgaccacggc cattccgggc aaaacggcct ttcaggtcct tgaagagtac ccggactccg 660
gtgagaatat cgtggacgcc ctcgcggtct tcctccgccg tttgcatagc atccccgtgt 720
gcaactgccc cttcaactcg gaccgggttt tccgcctggc acaggcccag tcgcgcatga 780
ataacggcct cgttgacgcg agcgatttcg acgatgaacg gaatggctgg ccggtggaac 840
aggtttggaa ggaaatgcac aaactgcttc cgttctcgcc ggattcggtg gtcacgcatg 900
gtgatttttc cctggataat ctgatctttg acgagggcaa gctgatcggc tgcatcgacg 960
tgggtcgcgt cggtatcgcc gaccgctatc aggacctggc gatcttgtgg aattgcctcg 1020
gcgagttctc gccctcgctc cagaagcgcc tgttccagaa gtacggcatc gacaacccgg 1080
atatgaacaa gctccagttc cacctcatgc tggacgaatt tttttgaaca gaattggtta 1140
attggttgta acactggcag agcattacgc tgacttgacg ggacggcggc tttgttgaat 1200
aaatcgaact tttgctgagt tgaaggatcg atgagttgaa ggaccccgta gaaaagatca 1260
aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac 1320
caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg 1380
taactggctt cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag 1440
gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac 1500
cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt 1560
taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg 1620
agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc 1680
ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc 1740
gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc 1800
acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa 1860
acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt 1920
tctttcctgc gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg 1980
ataccgctcg ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag 2040
agcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcataggcc 2100
gcgataggcc gacgcgaagc ggcggggcgt agggagcgca gcgaccgaag ggtaggcgct 2160
ttttgcagct cttcggctgt gcgctggcca gacagttatg cacaggccag gcgggtttta 2220
agagttttaa taagttttaa agagttttag gcggaaaaat cgcctttttt ctcttttata 2280
tcagtcactt acatgtgtga ccggttccca atgtacggct ttgggttccc aatgtacggg 2340
ttccggttcc caatgtacgg ctttgggttc ccaatgtacg tgctatccac aggaaagaga 2400
ccttttcgac ctttttcccc tgctagggca atttgcccta gcatctgctc cgtacattag 2460
gaaccggcgg atgcttcgcc ctcgatcagg ttgcggtagc gcatgactag gatcgggcca 2520
gcctgccccg cctcctcctt caaatcgtac tccggcaggt catttgaccc gatcagcttg 2580
cgcacggtga aacagaactt cttgaactct ccggcgctgc cactgcgttc gtagatcgtc 2640
ttgaacaacc atctggcttc tgccttgcct gcggcgcggc gtgccaggcg gtagagaaaa 2700
cggccgatgc cggggtcgat caaaaagtaa tcggggtgaa ccgtcagcac gtccgggttc 2760
ttgccttctg tgatctcgcg gtacatccaa tcagcaagct cgatctcgat gtactccggc 2820
cgcccggttt cgctctttac gatcttgtag cggctaatca aggcttcacc ctcggatacc 2880
gtcaccaggc ggccgttctt ggccttcttg gtacgctgca tggcaacgtg cgtggtgttt 2940
aaccgaatgc aggtttctac caggtcgtct ttctgctttc cgccatcggc tcgccggcag 3000
aacttgagta cgtccgcaac gtgtggacgg aacacgcggc cgggcttgtc tcccttccct 3060
tcccggtatc ggttcatgga ttcggttaga tgggaaaccg ccatcagtac caggtcgtaa 3120
tcccacacac tggccatgcc ggcggggcct gcggaaacct ctacgtgccc gtctggaagc 3180
tcgtagcgga tcacctcgcc agctcgtcgg tcacgcttcg acagacggaa aacggccacg 3240
tccatgatgc tgcgactatc gcgggtgccc acgtcataga gcatcggaac gaaaaaatct 3300
ggttgctcgt cgcccttggg cggcttccta atcgacggcg caccggctgc cggcggttgc 3360
cgggattctt tgcggattcg atcagcggcc ccttgccacg attcaccggg gcgtgcttct 3420
gcctcgatgc gttgccgctg ggcggcctgc gcggccttca acttctccac caggtcatca 3480
cccagcgccg cgccgatttg taccgggccg gatggtttgc gaccgctcac gccgattcct 3540
cgggcttggg ggttccagtg ccattgcagg gccggcagac aacccagccg cttacgcctg 3600
gccaaccgcc cgttcctcca cacatggggc attccacggc gtcggtgcct ggttgttctt 3660
gattttccat gccgcctcct ttagccgcta aaattcatct actcatttat tcatttgctc 3720
atttactctg gtagctgcgc gatgtattca gatagcagct cggtaatggt cttgccttgg 3780
cgtaccgcgt acatcttcag cttggtgtga tcctccgccg gcaactgaaa gttgacccgc 3840
ttcatggctg gcgtgtctgc caggctggcc aacgttgcag ccttgctgct gcgtgcgctc 3900
ggacggccgg cacttagcgt gtttgtgctt ttgctcattt tctctttacc tcattaactc 3960
aaatgagttt tgatttaatt tcagcggcca gcgcctggac ctcgcgggca gcgtcgccct 4020
cgggttctga ttcaagaacg gttgtgccgg cggcggcagt gcctgggtag ctcacgcgct 4080
gcgtgatacg ggactcaaga atgggcagct cgtacccggc cagcgcctcg gcaacctcac 4140
cgccgatgcg cgtgcctttg atcgcccgcg acacgacaaa ggccgcttgt agccttccat 4200
ccgtgacctc aatgcgctgc ttaaccagct ccaccaggtc ggcggtggcc caaatgtcgt 4260
aagggcttgg ctgcaccgga atcagcacga agtcggctgc cttgatcgcg gacacagcca 4320
agtccgccgc ctggggcgct ccgtcgatca ctacgaagtc gcgccggccg atggccttca 4380
cgtcgcggtc aatcgtcggg cggtcgatgc cgacaacggt tagcggttga tcttcccgca 4440
cggccgccca atcgcgggca ctgccctggg gatcggaatc gactaacaga acatcggccc 4500
cggcgagttg cagggcgcgg gctagatggg ttgcgatggt cgtcttgcct gacccgcctt 4560
tctggttaag tacagcgata accttcatgc gttccccttg cgtatttgtt tatttactca 4620
tcgcatcata tacgcagcga ccgcatgacg caagctgttt tactcaaata cacatcacct 4680
ttttagatga tcagtgattt tgtgccgagc tgccggtcgg ggagctgttg gctggctggt 4740
ggcaggatat attgtggtgt aaacaaattg acgcttagac aacttaataa cacattgcgg 4800
acgtctttaa tgtactgaat ttagttactg atcactgatt aagtactgat aaatttaatt 4860
aacagatctc aactttgtat agaaaagttg aacgagaaac gtaaaatgat ataaatatca 4920
atatattaaa ttagattttg cataaaaaac agactacata atactgtaaa acacaacata 4980
tccagtcact atggtcgacc tgcagactgg ctgtgtataa gggagcctga catttatatt 5040
ccccagaaca tcaggttaat ggcgtttttg atgtcatttt cgcggtggct gagatcagcc 5100
acttcttccc cgataacgga gaccggcaca ctggccatat cggtggtcat catgcgccag 5160
ctttcatccc cgatatgcac caccgggtaa agttcacggg ggactttatc tgacagcaga 5220
cgtgcactgg ccagggggat caccatccgt cgcccgggcg tgtcaataat atcactctgt 5280
acatccacaa acagacgata acggctctct cttttatagg tgtaaacctt aaactgcatt 5340
tcaccagccc ctgttctcgt cggcaaaaga gccgttcatt tcaatgaacc gggcgacctc 5400
agccatccct tcctgatttt ccgctttcca gcgttcggca cgcagacgac gggcttcatt 5460
ctgcatggtt gtgcttaccg aaccggagat attgacatca tatatgcctt gagcaactga 5520
tagctgtcgc tgtcaactgt cactgtaata cgctgcttca tagcatacct ctttttgaca 5580
tacttcgggt atacatatca gtatatattc ttataccgca aaaatcagcg cgcaaatacg 5640
catactgtta tctggctttt agtaagccgg atcctctaga ttacgccccg cctgccactc 5700
atcgcagtac tgttgtaatt cattaagcat tctgccgaca tggaagccat cacaaacggc 5760
atgatgaacc tgaatcgcca gcggcatcag caccttgtcg ccttgcgtat aatatttgcc 5820
catggtgaaa acgggggcga agaagttgtc catattggcc acgtttaaat caaaactggt 5880
gaaactcacc cagggattgg ctgagacgaa aaacatattc tcaataaacc ctttagggaa 5940
ataggccagg ttttcaccgt aacacgccac atcttgcgaa tatatgtgta gaaactgccg 6000
gaaatcgtcg tggtattcac tccagagcga tgaaaacgtt tcagtttgct catggaaaac 6060
ggtgtaacaa gggtgaacac tatcccatat caccagctca ccgtctttca ttgccatacg 6120
gaattccgga tgagcattca tcaggcgggc aagaatgtga ataaaggccg gataaaactt 6180
gtgcttattt ttctttacgg tctttaaaaa ggccgtaata tccagctgaa cggtctggtt 6240
ataggtacat tgagcaactg actgaaatgc ctcaaaatgt tctttacgat gccattggga 6300
tatatcaacg gtggtatatc cagtgatttt tttctccatt ttagcttcct tagctcctga 6360
aaatctcgac ggatcctaac tcaaaatcca catattatac gagccggaag cataaagtgt 6420
aaagcctggg gtgcctaatg cggccgccat agtgactgga tatgttgtgt tttacagtat 6480
tatgtagtct gttttttatg caaaatctaa tttaatatat tgatatttat atcattttac 6540
gtttctcgtt caactttatt atacatagtt gataattcac tgggccgg 6588
<210> 63
<211> 7443
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector CC003
<400> 63
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcata aataatgatt ttattttgac tgatagtgac ctgttcgttg caacaaattg 420
ataagcaatg cttttttata atgccaactt tgtatagaaa agttgattta aatgaattca 480
agcttttaat taacttagcc actgcaacaa gttcttgaac cttagcacaa tcatattgtg 540
catgcacttg tttattgcaa agaatggtgc gtagggaaca cgcatgattt ttgaattgct 600
ggcacataat tttatcatta gaaactggaa tgcaacatgt accctttgtc atggtttctt 660
tccgagacat tgcactgttt tttttaatcc tatcattatc ataatgccaa gaactggtca 720
ccaaccagca ttttgcatca tggttagttg agctgtcccc atgtatcaat aggtgcattg 780
tattggtcca aaatataaat gcagtggatg caacctatct catggccgtc aacaaaagaa 840
atcaaaaggg aaatgcacca tcttatatct ccagtttata tgaacagatt ggataagatc 900
ataagatcaa gtggtttata ttattttgag gaatataaca tggattcatc ctaatcactc 960
gtctaggcag tatgtgtatt catgatggat atggtactat actacggagt tttttcttca 1020
caaaataacc tgttattttg acctccaacc aaacacgaat tataccaaaa attgggttat 1080
ttcatctata gtacaactct attataaaca tgcagtaaat tatcctacac atataccaaa 1140
attcaagtgt aataatccta atacacagac ttaaaaaaca aactatttcc tttttaagaa 1200
aaggaaaacc atttttttaa cggaaggaaa acaaattcgg gtcaaggcgg aagccagcgc 1260
gccaccccac gtcagcgaat acggaggcgc ggggttgacg gcgtcacccg gtcctaacgg 1320
cgaccaacaa accagccaga agaaattaca gtaaaaaaaa gtaaattgca ctttgatcca 1380
ccttttatta cccaagtttc aatttggacc acccttaaac ctatcttttc aaattgggcc 1440
gggttgtggt ttggactacc atgaacaact tttcgtcatg tctaacttcc ctttcggcaa 1500
acatatgaac catatataga ggagatcggc cgtatactag agctgatgtg tttaaggtcg 1560
ttgattgcac gagaaaaaaa aaatccaaat cgcaacaata gcaaatttat ctagttcaaa 1620
gtgaaaagat atgtttaaag gtagtccaaa gtaaaactta ggggctgttt ggttcccagc 1680
catactttac cattacttgc caacaaaagt tgccacacct tgtctaaggt gaggtgatca 1740
aattgttagc cacaacttac taagcctaag ggaatcttgc cacacttttt tgagccattg 1800
acacgtggga cttaatttgt tagagggaaa tcttgccaca actgtggcta caaccaaaca 1860
cctgtcaaat ttgcctaacc ttaggcgtgg caaactgtgg caaagtgtgg cttacaacca 1920
aacacaccct tagataataa aatgtggtcc aaagcgtaat tcactaaaaa aaaatcaacg 1980
agacgtgtac caaacggaga caaacggcat cttctcgaaa tttcccaacc gctcgctcgc 2040
ccgcctcgtc ttcccggaaa ccgcggtggt ttcagcgtgg cggattctcc aagcagacgg 2100
agacgtcacg gcacgggact cctcccacca cccaaccgcc ataaatacca gccccctcat 2160
ctcctctcct cgcatcagct ccacccccga aaaatttctc cccaatctcg cgaggctctc 2220
gtcgtcgaat cgaatcctct cgcgtcctca agcttggcat ccaggtacgg atccgcgtcc 2280
catctccctc accccccgtg ttcttcgtgc ctgcttctgg gtcagatctg ggtggattcg 2340
cggttgttgg atgtgggggg ctgtgtttat ttgtcggtgg atctggttgt ctggatctgc 2400
gttttctctg tcgtagttag cggatctgat gaaatgttta gtgttcgtgt atactggtat 2460
ggtggatctg gtcctaggat gcgtggaatg gatatatgta ggcgaattgg aggatttatt 2520
ttgtgaattt tgctgaaatg atagttctaa acactggatc tgacctcggg atgctgttaa 2580
atgtggaaat catggtcgat gctgtcatga acatggtgtt cttatggtag atctgagcaa 2640
tgtatgtttc aaaattgttt gtcacatgga aatgctatgg ttctagatgc aatagaatga 2700
tacatgccga gatcccctct agttgatatg atagatcatg atgttttaca gctatgtcat 2760
atgaatatgt tcatttgtta ccgatgtatt tggatctact taacatttcc aaagcacgcc 2820
gcgttctaat tctagatctg gtagtcatgt ttgtacacgt cacccaccta atacaaatac 2880
atatgtctag tgtttggtga cactgcccgt cagatctgtt ttttccagat ctgtggaaca 2940
aatactccac gcatgtatgg tagttttgaa acgatcttgt atcttccatt gttgtagtaa 3000
caactaaata aagtacaatt gttcaattat tgggaatcgt attttctgta gtgccgatgt 3060
acagcatatt catagatgtc tatttaggaa ctcaaatttt aaattgagga ctagttattt 3120
attgtgggtc agtcttttga attgtgttat cttgctgtac tggcgcgcca ccatggccac 3180
cgccgccgcc gcgtctaccg cgctcactgg cgccactacc gctgcgccca aggcgaggcg 3240
ccgggcgcac ctcctggcca cccgccgcgc cctcgccgcg cccatcaggt gctcagcggc 3300
gtcacccgcc atgccgatgg ctcccccggc caccccgctc cggccgtggg gccccaccga 3360
tccccgcaag ggcgccgaca tcctcgtcga gtccctcgag cgctgcggcg tccgcgacgt 3420
cttcgcctac cccggcggca cgtccatgga gatccaccag gcactcaccc gctcccccgt 3480
catcgccaac cacctcttcc gccacgagca aggggaggcc tttgcggcct ccggctacgc 3540
gcgctcctcg ggccgcgtcg gcgtctgcat cgccacctcc ggccccggcg ccaccaacct 3600
tgtctccgcg ctcgccgacg cgctgctcga ttccgtcccc atggtcgcca tcacgggaca 3660
ggtgccgcga cgcatgattg gcaccgacgc cttccaggag acgcccatcg tcgaggtcac 3720
ccgctccatc accaagcaca actacctggt cctcgacgtc gacgacatcc cccgcgtcgt 3780
gcaggaggct ttcttcctcg cctcctctgg tcgaccgggg ccggtgcttg tcgacatccc 3840
caaggacatc cagcagcaga tggcggtgcc tgtctgggac aagcccatga gtctgcctgg 3900
gtacattgcg cgccttccca agccccctgc gactgagttg cttgagcagg tgctgcgtct 3960
tgttggtgaa tcccggcgcc ctgttcttta tgttggcggt ggctgcgcag catctggtga 4020
ggagttgcga cgctttgtgg agctgactgg aatcccggtc acaactactc ttatgggcct 4080
cggcaacttc cccagcgacg acccactgtc tctgcgcatg ctaggtatgc atggcacggt 4140
gtatgcaaat tatgcagtgg ataaggccga tctgttgctt gcacttggtg tgcggtttga 4200
tgatcgtgtg acagggaaga ttgaggcttt tgcaagcagg gctaagattg tgcacgttga 4260
tattgatccg gctgagattg gcaagaacaa gcagccacat gtgtccatct gtgcagatgt 4320
taagcttgct ttgcagggca tgaatgctct tcttgaagga agcacatcaa agaagagctt 4380
tgactttggc tcatggaacg atgagttgga tcagcagaag agggaattcc cccttgggta 4440
taaaacatct aatgaggaga tccagccaca atatgctatt caggttcttg atgagctgac 4500
gaaaggcgag gccatcatcg gcacaggtgt tgggcagcac cagatgtggg cggcacagta 4560
ctacacttac aagcggccaa ggcagtggtt gtcttcagct ggtcttgggg ctatgggatt 4620
tggtttgccg gctgctgctg gtgcttctgt ggccaaccca ggtgttactg ttgttgacat 4680
cgatggagat ggtagctttc tcatgaacgt tcaggagcta gctatgatcc gaattgagaa 4740
cctcccggtg aaggtctttg tgctaaacaa ccagcacctg gggatggtgg tgcagtggga 4800
ggacaggttc tataaggcca acagagcgca cacatacttg ggaaacccag agaatgaaag 4860
tgagatatat ccagatttcg tgacgatcgc caaagggttc aacattccag cggtccgtgt 4920
gacaaagaag aacgaagtcc gcgcagcgat aaagaagatg ctcgagactc cagggccgta 4980
cctcttggat ataatcgtcc cacaccagga gcatgtgttg cctatgatcc ctaatggtgg 5040
ggctttcaag gatatgatcc tggatggtga tggcaggact gtgtactagc ctgcaggcct 5100
aggatcgttc aaacatttgg caataaagtt tcttaagatt gaatcctgtt gccggtcttg 5160
cgatgattat catataattt ctgttgaatt acgttaagca tgtaataatt aacatgtaat 5220
gcatgacgtt atttatgaga tgggttttta tgattagagt cccgcaatta tacatttaat 5280
acgcgataga aaacaaaata tagcgcgcaa actaggataa attatcgcgc gcggtgtcat 5340
ctatgttact agatcggccg gccgtttaaa cagcctgctt ttttgtacaa agttggcatt 5400
ataaaaaagc attgctcatc aatttgttgc aacgaacagg tcactatcag tcaaaataaa 5460
atcattattt gctgggcctc atgggccttc cgctcactgc ccgctttcca gtcgggaaac 5520
ctgtcgtgcc agctgcatta acatggtcat agctgtttcc ttgcgtattg ggcgctctcc 5580
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggg taaagcctgg ggtgcctaat 5640
gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 5700
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 5760
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 5820
ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 5880
cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 5940
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 6000
gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 6060
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 6120
acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 6180
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 6240
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 6300
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 6360
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 6420
tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 6480
ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 6540
taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagaac 6600
cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 6660
gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 6720
gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 6780
tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 6840
gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 6900
ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 6960
ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 7020
cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 7080
ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 7140
gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 7200
ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 7260
ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 7320
tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 7380
ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 7440
cac 7443
<210> 64
<211> 3734
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector CC018
<400> 64
cgcggatcat gaaccaacgg cctggctgta tttggtggtt gtgtagggag atggggagaa 60
gaaaagcccg attctcttcg ctgtgatggg ctggatgcat gcgggggagc gggaggccca 120
agtacgtgca cggtgagcgg cccacagggc gagtgtgagc gcgagaggcg ggaggaacag 180
tttagtacca cattgcccag ctaactcgaa cgcgaccaac ttataaaccc gcgcgctgtc 240
gcttgtgtgc attgagtgct atgctgaggt tttagagcta gaaatagcaa gttaaaataa 300
ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctctgtt cctcgtgctg 360
gacaagtgtg gtttccagat tctgcaacca agactgcgca ggcattgctg gacttcaacc 420
gtgaaggatt acctctgttc atcctcgcta actggagagg cttctctggt ggacaaagag 480
atctctttga aggaattctt caggctggct cgactattgt tgagaacctt aggacataca 540
atcagcctgc ctttgtctac attcccatgg ctgcagagct acgaggaggg gcttgggttg 600
tggttgatag caagataaac ccagaccgca ttgagtgcta tgctgagaga actgcaaaat 660
ccaatgttct ggaaccgcaa gggttaattg agatcaagtt caggtcagag gaactccagg 720
attgcatgag tcggcttgac ccaacattaa ttgatctgaa agcaaaactc gaagtagcaa 780
ataaaaatgg aagtgctgac acaaaatcgc ttcaagaaaa tatagaagct cgaacaaaac 840
agttgatgcc tctatatact cagattgcga tacggtttgc tgaattgcat gatacatccc 900
tcagaatggc tgcgaaaggt gtgattaaga aagttgtgga ctgggaagaa tcacgatctt 960
tctttttttt gcggccgccc cgggcctgca ggggatcccg atcgggccgg ccgtttaaac 1020
ccactttgta caagaaagtt gaacgagaaa cgtaaaatga tataaatatc aatatattaa 1080
attagatttt gcataaaaaa cagactacat aatactgtaa aacacaacat atgcagtcac 1140
tatgaaccaa ctacttagat ggtattagtg acctgtactg ggcctcatgg gccttccgct 1200
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaacat ggtcatagct 1260
gtttccttgc gtattgggcg ctctccgctt cctcgctcac tgactcgctg cgctcggtcg 1320
ttcgggtaaa gcctggggtg cctaatgagc aaaaggccag caaaaggcca ggaaccgtaa 1380
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 1440
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 1500
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 1560
cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 1620
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 1680
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 1740
gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 1800
agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg 1860
cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 1920
aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 1980
aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 2040
ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 2100
aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 2160
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 2220
agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 2280
cagtgctgca atgataccgc gagaaccacg ctcaccggct ccagatttat cagcaataaa 2340
ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 2400
gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 2460
cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 2520
cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 2580
ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 2640
catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 2700
tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 2760
ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 2820
catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 2880
cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 2940
cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 3000
acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 3060
ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 3120
tccgcgcaca tttccccgaa aagtgccacc taaattgtaa gcgttaatat tttgttaaaa 3180
ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa 3240
atcccttata aatcaaaaga atagaccgag atagggttga gtggccgcta cagggcgctc 3300
ccattcgcca ttcaggctgc gcaactgttg ggaagggcgt ttcggtgcgg gcctcttcgc 3360
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 3420
ggttttccca gtcacgacgt tgtaaaacga cggccagtga gcgcgacgta atacgactca 3480
ctatagggcg aattggcgga aggccgtcaa ggccgcatta caggtcacta ataccatcta 3540
agtagttggt tcatagtgac tgcatatgtt gtgttttaca gtattatgta gtctgttttt 3600
tatgcaaaat ctaatttaat atattgatat ttatatcatt ttacgtttct cgttcaactt 3660
ttttgtacaa acttgattta aatgaattca agcttttaat taagcatgcg agctcggcgc 3720
gccggtaccg cgat 3734
<210> 65
<211> 9506
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector CC006
<400> 65
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcatc aaataatgat tttattttga ctgatagtga cctgttcgtt gcaacaaatt 420
gataagcaat gctttcttat aatgccaact ttgtacaaga aagctgggta tttaaatgaa 480
ttcaagcttt taattaatgc agtgcagcgt gacccggtcg tgcccctctc tagagataat 540
gagcattgca tgtctaagtt ataaaaaatt accacatatt ttttttgtca cacttgtttg 600
aagtgcagtt tatctatctt tatacatata tttaaacttt actctacgaa taatataatc 660
tatagtacta caataatatc agtgttttag agaatcatat aaatgaacag ttagacatgg 720
tctaaaggac aattgagtat tttgacaaca ggactctaca gttttatctt tttagtgtgc 780
atgtgttctc cttttttttt gcaaatagct tcacctatat aatacttcat ccattttatt 840
agtacatcca tttagggttt agggttaatg gtttttatag actaattttt ttagtacatc 900
tattttattc tattttagcc tctaaattaa gaaaactaaa actctatttt agttttttta 960
tttaatagtt tagatataaa atagaataaa ataaagtgac taaaaattaa acaaataccc 1020
tttaagaaat taaaaaaact aaggaaacat ttttcttgtt tcgagtagat aatgccagcc 1080
tgttaaacgc cgtcgacgag tctaacggac accaaccagc gaaccagcag cgtcgcgtcg 1140
ggccaagcga agcagacggc acggcatctc tgtcgctgcc tctggacccc tctcgagagt 1200
tccgctccac cgttggactt gctccgctgt cggcatccag aaattgcgtg gcggagcggc 1260
agacgtgagc cggcacggca ggcggcctcc tcctcctctc acggcaccgg cagctacggg 1320
ggattccttt cccaccgctc cttcgctttc ccttcctcgc ccgccgtaat aaatagacac 1380
cccctccaca ccctctttcc ccaacctcgt gttgttcgga gcgcacacac acacaaccag 1440
atctccccca aatccacccg tcggcacctc cgcttcaagg tacgccgctc gtcctccccc 1500
cccccccccc tctctacctt ctctagatcg gcgttccggt ccatggttag ggcccggtag 1560
ttctacttct gttcatgttt gtgttagatc cgtgtttgtg ttagatccgt gctgctagcg 1620
ttcgtacacg gatgcgacct gtacgtcaga cacgttctga ttgctaactt gccagtgttt 1680
ctctttgggg aatcctggga tggctctagc cgttccgcag acgggatcga tttcatgatt 1740
ttttttgttt cgttgcatag ggtttggttt gcccttttcc tttatttcaa tatatgccgt 1800
gcacttgttt gtcgggtcat cttttcatgc ttttttttgt cttggttgtg atgatgtggt 1860
ctggttgggc ggtcgttcta gatcggagta gaattctgtt tcaaactacc tggtggattt 1920
attaattttg gatctgtatg tgtgtgccat acatattcat agttacgaat tgaagatgat 1980
ggatggaaat atcgatctag gataggtata catgttgatg cgggttttac tgatgcatat 2040
acagagatgc tttttgttcg cttggttgtg atgatgtggt gtggttgggc ggtcgttcat 2100
tcgttctaga tcggagtaga atactgtttc aaactacctg gtgtatttat taattttgga 2160
actgtatgtg tgtgtcatac atcttcatag ttacgagttt aagatggatg gaaatatcga 2220
tctaggatag gtatacatgt tgatgtgggt tttactgatg catatacatg atggcatatg 2280
cagcatctat tcatatgctc taaccttgag tacctatcta ttataataaa caagtatgtt 2340
ttataattat ttcgatcttg atatacttgg atgatggcat atgcagcagc tatatgtgga 2400
tttttttagc cctgccttca tacgctattt atttgcttgg tactgtttct tttgtcgatg 2460
ctcaccctgt tgtttggtgt tacttctgca gggcgcgcca ccatggctcc taagaagaag 2520
cggaaggttg gtattcacgg ggtgcctgcg gctgacaaga agtactccat cggcctcgac 2580
atcggcacca acagcgtcgg ctgggcggtg atcaccgacg agtacaaggt cccgtccaag 2640
aagttcaagg tcctgggcaa caccgaccgc cactccatca agaagaacct catcggcgcc 2700
ctcctcttcg actccggcga gacggcggag gcgacccgcc tcaagcgcac cgcccgccgc 2760
cgctacaccc gccgcaagaa ccgcatctgc tacctccagg agatcttctc caacgagatg 2820
gcgaaggtcg acgactcctt cttccaccgc ctcgaggagt ccttcctcgt ggaggaggac 2880
aagaagcacg agcgccaccc catcttcggc aacatcgtcg acgaggtcgc ctaccacgag 2940
aagtacccca ctatctacca ccttcgtaag aagcttgttg actctactga taaggctgat 3000
cttcgtctca tctaccttgc tctcgctcac atgatcaagt tccgtggtca cttccttatc 3060
gagggtgacc ttaaccctga taactccgac gtggacaagc tcttcatcca gctcgtccag 3120
acctacaacc agctcttcga ggagaaccct atcaacgctt ccggtgtcga cgctaaggcg 3180
atcctttccg ctaggctctc caagtccagg cgtctcgaga acctcatcgc ccagctccct 3240
ggtgagaaga agaacggtct tttcggtaac ctcatcgctc tctccctcgg tctgacccct 3300
aacttcaagt ccaacttcga cctcgctgag gacgctaagc ttcagctctc caaggatacc 3360
tacgacgatg atctcgacaa cctcctcgct cagattggag atcagtacgc tgatctcttc 3420
cttgctgcta agaacctctc cgatgctatc ctcctttcgg atatccttag ggttaacact 3480
gagatcacta aggctcctct ttctgcttcc atgatcaagc gctacgacga gcaccaccag 3540
gacctcaccc tcctcaaggc tcttgttcgt cagcagctcc ccgagaagta caaggagatc 3600
ttcttcgacc agtccaagaa cggctacgcc ggttacattg acggtggagc tagccaggag 3660
gagttctaca agttcatcaa gccaatcctt gagaagatgg atggtactga ggagcttctc 3720
gttaagctta accgtgagga cctccttagg aagcagagga ctttcgataa cggctctatc 3780
cctcaccaga tccaccttgg tgagcttcac gccatccttc gtaggcagga ggacttctac 3840
cctttcctca aggacaaccg tgagaagatc gagaagatcc ttactttccg tattccttac 3900
tacgttggtc ctcttgctcg tggtaactcc cgtttcgctt ggatgactag gaagtccgag 3960
gagactatca ccccttggaa cttcgaggag gttgttgaca agggtgcttc cgcccagtcc 4020
ttcatcgagc gcatgaccaa cttcgacaag aacctcccca acgagaaggt cctccccaag 4080
cactccctcc tctacgagta cttcacggtc tacaacgagc tcaccaaggt caagtacgtc 4140
accgagggta tgcgcaagcc tgccttcctc tccggcgagc agaagaaggc tatcgttgac 4200
ctcctcttca agaccaaccg caaggtcacc gtcaagcagc tcaaggagga ctacttcaag 4260
aagatcgagt gcttcgactc cgtcgagatc agcggcgttg aggaccgttt caacgcttct 4320
ctcggcacct accacgatct cctcaagatc atcaaggaca aggacttcct cgacaacgag 4380
gagaacgagg acatcctcga ggacatcgtc ctcactctta ctctcttcga ggatagggag 4440
atgatcgagg agaggctcaa gacttacgct catctcttcg atgacaaggt tatgaagcag 4500
ctcaagcgtc gccgttacac cggttggggt aggctctccc gcaagctcat caacggtatc 4560
agggataagc agagcggcaa gactatcctc gacttcctca agtctgatgg tttcgctaac 4620
aggaacttca tgcagctcat ccacgatgac tctcttacct tcaaggagga tattcagaag 4680
gctcaggtgt ccggtcaggg cgactctctc cacgagcaca ttgctaacct tgctggttcc 4740
cctgctatca agaagggcat ccttcagact gttaaggttg tcgatgagct tgtcaaggtt 4800
atgggtcgtc acaagcctga gaacatcgtc atcgagatgg ctcgtgagaa ccagactacc 4860
cagaagggtc agaagaactc gagggagcgc atgaagagga ttgaggaggg tatcaaggag 4920
cttggttctc agatccttaa ggagcaccct gtcgagaaca cccagctcca gaacgagaag 4980
ctctacctct actacctcca gaacggtagg gatatgtacg ttgaccagga gctcgacatc 5040
aacaggcttt ctgactacga cgtcgaccac attgttcctc agtctttcct taaggatgac 5100
tccatcgaca acaaggtcct cacgaggtcc gacaagaaca ggggtaagtc ggacaacgtc 5160
ccttccgagg aggttgtcaa gaagatgaag aactactgga ggcagcttct caacgctaag 5220
ctcattaccc agaggaagtt cgacaacctc acgaaggctg agaggggtgg cctttccgag 5280
cttgacaagg ctggtttcat caagaggcag cttgttgaga cgaggcagat taccaagcac 5340
gttgctcaga tcctcgattc taggatgaac accaagtacg acgagaacga caagctcatc 5400
cgcgaggtca aggtgatcac cctcaagtcc aagctcgtct ccgacttccg caaggacttc 5460
cagttctaca aggtccgcga gatcaacaac taccaccacg ctcacgatgc ttaccttaac 5520
gctgtcgttg gcaccgctct tatcaagaag taccctaagc ttgagtccga gttcgtctac 5580
ggtgactaca aggtctacga cgttcgtaag atgatcgcca agtccgagca ggagatcggc 5640
aaggccaccg ccaagtactt cttctactcc aacatcatga acttcttcaa gaccgagatc 5700
accctcgcca acggcgagat ccgcaagcgc cctcttatcg agacgaacgg tgagactggt 5760
gagatcgttt gggacaaggg tcgcgacttc gctactgttc gcaaggtcct ttctatgcct 5820
caggttaaca tcgtcaagaa gaccgaggtc cagaccggtg gcttctccaa ggagtctatc 5880
cttccaaaga gaaactcgga caagctcatc gctaggaaga aggattggga ccctaagaag 5940
tacggtggtt tcgactcccc tactgtcgcc tactccgtcc tcgtggtcgc caaggtggag 6000
aagggtaagt cgaagaagct caagtccgtc aaggagctcc tcggcatcac catcatggag 6060
cgctcctcct tcgagaagaa cccgatcgac ttcctcgagg ccaagggcta caaggaggtc 6120
aagaaggacc tcatcatcaa gctccccaag tactctcttt tcgagctcga gaacggtcgt 6180
aagaggatgc tggcttccgc tggtgagctc cagaagggta acgagcttgc tcttccttcc 6240
aagtacgtga acttcctcta cctcgcctcc cactacgaga agctcaaggg ttcccctgag 6300
gataacgagc agaagcagct cttcgtggag cagcacaagc actacctcga cgagatcatc 6360
gagcagatct ccgagttctc caagcgcgtc atcctcgctg acgctaacct cgacaaggtc 6420
ctctccgcct acaacaagca ccgcgacaag cccatccgcg agcaggccga gaacatcatc 6480
cacctcttca cgctcacgaa cctcggcgcc cctgctgctt tcaagtactt cgacaccacc 6540
atcgacagga agcgttacac gtccaccaag gaggttctcg acgctactct catccaccag 6600
tccatcaccg gtctttacga gactcgtatc gacctttccc agcttggtgg tgataagcgt 6660
cctgctgcca ccaaaaaggc cggacaggct aagaaaaaga agtagcctgc aggtcctgct 6720
ttaatgagat atgcgagacg cctatgatcg catgatattt gctttcaatt ctgttgtgca 6780
cgttgtaaaa aacctgagca tgtgtagctc agatccttac cgccggtttc ggttcattct 6840
aatgaatata tcacccgtta ctatcgtatt tttatgaata atattctccg ttcaatttac 6900
tgattgtacc ctactactta tatgtacaat attaaaatga aaacaatata ttgtgctgaa 6960
taggtttata gcgacatcta tgatagagcg ccacaataac aaacaattgc gttttattat 7020
tacaaatcca attttaaaaa aagcggcaga accggtcaaa cctaaaagac tgattacata 7080
aatcttattc aaatttcaaa agtgccccag gggctagtat ctacgacaca ccgagcggcg 7140
aactaataac gctcactgaa gggaactccg gttccccgcc ggcgcgcatg ggtgagattc 7200
cttgaagttg agtattggcc gtccgctcta ccgaaagtta cgggcaccat tcaacccggt 7260
ccagcacggc ggccgggtaa ccgacttgct gccccgagaa ttatgcagca tttttttggt 7320
gtatgtgggc cccaaatgaa gtgcaggtca aaccttgaca gtgacgacaa atcgttgggc 7380
gggtccaggg cgaattttgc gacaacatgt cgaggctcag caggccggcc gtttaaacca 7440
actttattat acaaagttgg cattataaaa aagcattgct tatcaatttg ttgcaacgaa 7500
caggtcacta tcagtcaaaa taaaatcatt atttctgggc ctcatgggcc ttccgctcac 7560
tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaacatggt catagctgtt 7620
tccttgcgta ttgggcgctc tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 7680
gggtaaagcc tggggtgcct aatgagcaaa aggccagcaa aaggccagga accgtaaaaa 7740
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 7800
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 7860
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 7920
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 7980
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 8040
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 8100
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 8160
gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 8220
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 8280
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 8340
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 8400
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 8460
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 8520
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 8580
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 8640
tgctgcaatg ataccgcgag aaccacgctc accggctcca gatttatcag caataaacca 8700
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 8760
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 8820
tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 8880
ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 8940
tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 9000
ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 9060
gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 9120
ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 9180
cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 9240
ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 9300
ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 9360
gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 9420
ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 9480
gcgcacattt ccccgaaaag tgccac 9506
<210> 66
<211> 17930
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector RLW137
<400> 66
ttatacatag ttgataattc actgggccgg ccgtttaaac ttagttacta atcagtgatc 60
agattgtcgt ttcccgcctt cactttaaac tatcagtgtt tgacaggata tattggcggg 120
taaacctaag agaaaagagc gtttattaga ataatcggat atttaaaagg gcgtgaaaag 180
gtttatccgt tcgtccattt gtatgtcaat attggggggg ggggaaagcc acgttgtgtc 240
tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa caataaaact 300
gtctgcttac ataaacagta atacaagggg tgttcgccac catgagccat atccagcgtg 360
aaacctcgtg ctcccgcccg cgcctcaatt ccaatatgga tgccgacctt tatggctaca 420
agtgggcgcg cgacaacgtc ggccagtcgg gcgcgaccat ttatcggctt tatggcaaac 480
ccgatgcccc ggaactgttc ctgaagcacg gcaaaggcag cgtcgcaaac gatgtcaccg 540
atgagatggt ccgcctgaac tggcttaccg agttcatgcc gctgccgacg attaagcatt 600
tcatccgtac cccggacgat gcctggctct tgaccacggc cattccgggc aaaacggcct 660
ttcaggtcct tgaagagtac ccggactccg gtgagaatat cgtggacgcc ctcgcggtct 720
tcctccgccg tttgcatagc atccccgtgt gcaactgccc cttcaactcg gaccgggttt 780
tccgcctggc acaggcccag tcgcgcatga ataacggcct cgttgacgcg agcgatttcg 840
acgatgaacg gaatggctgg ccggtggaac aggtttggaa ggaaatgcac aaactgcttc 900
cgttctcgcc ggattcggtg gtcacgcatg gtgatttttc cctggataat ctgatctttg 960
acgagggcaa gctgatcggc tgcatcgacg tgggtcgcgt cggtatcgcc gaccgctatc 1020
aggacctggc gatcttgtgg aattgcctcg gcgagttctc gccctcgctc cagaagcgcc 1080
tgttccagaa gtacggcatc gacaacccgg atatgaacaa gctccagttc cacctcatgc 1140
tggacgaatt tttttgaaca gaattggtta attggttgta acactggcag agcattacgc 1200
tgacttgacg ggacggcggc tttgttgaat aaatcgaact tttgctgagt tgaaggatcg 1260
atgagttgaa ggaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 1320
gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 1380
atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 1440
atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc 1500
ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 1560
gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 1620
cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 1680
tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 1740
cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 1800
ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 1860
gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 1920
tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg 1980
ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc 2040
gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc 2100
atctgtgcgg tatttcacac cgcataggcc gcgataggcc gacgcgaagc ggcggggcgt 2160
agggagcgca gcgaccgaag ggtaggcgct ttttgcagct cttcggctgt gcgctggcca 2220
gacagttatg cacaggccag gcgggtttta agagttttaa taagttttaa agagttttag 2280
gcggaaaaat cgcctttttt ctcttttata tcagtcactt acatgtgtga ccggttccca 2340
atgtacggct ttgggttccc aatgtacggg ttccggttcc caatgtacgg ctttgggttc 2400
ccaatgtacg tgctatccac aggaaagaga ccttttcgac ctttttcccc tgctagggca 2460
atttgcccta gcatctgctc cgtacattag gaaccggcgg atgcttcgcc ctcgatcagg 2520
ttgcggtagc gcatgactag gatcgggcca gcctgccccg cctcctcctt caaatcgtac 2580
tccggcaggt catttgaccc gatcagcttg cgcacggtga aacagaactt cttgaactct 2640
ccggcgctgc cactgcgttc gtagatcgtc ttgaacaacc atctggcttc tgccttgcct 2700
gcggcgcggc gtgccaggcg gtagagaaaa cggccgatgc cggggtcgat caaaaagtaa 2760
tcggggtgaa ccgtcagcac gtccgggttc ttgccttctg tgatctcgcg gtacatccaa 2820
tcagcaagct cgatctcgat gtactccggc cgcccggttt cgctctttac gatcttgtag 2880
cggctaatca aggcttcacc ctcggatacc gtcaccaggc ggccgttctt ggccttcttg 2940
gtacgctgca tggcaacgtg cgtggtgttt aaccgaatgc aggtttctac caggtcgtct 3000
ttctgctttc cgccatcggc tcgccggcag aacttgagta cgtccgcaac gtgtggacgg 3060
aacacgcggc cgggcttgtc tcccttccct tcccggtatc ggttcatgga ttcggttaga 3120
tgggaaaccg ccatcagtac caggtcgtaa tcccacacac tggccatgcc ggcggggcct 3180
gcggaaacct ctacgtgccc gtctggaagc tcgtagcgga tcacctcgcc agctcgtcgg 3240
tcacgcttcg acagacggaa aacggccacg tccatgatgc tgcgactatc gcgggtgccc 3300
acgtcataga gcatcggaac gaaaaaatct ggttgctcgt cgcccttggg cggcttccta 3360
atcgacggcg caccggctgc cggcggttgc cgggattctt tgcggattcg atcagcggcc 3420
ccttgccacg attcaccggg gcgtgcttct gcctcgatgc gttgccgctg ggcggcctgc 3480
gcggccttca acttctccac caggtcatca cccagcgccg cgccgatttg taccgggccg 3540
gatggtttgc gaccgctcac gccgattcct cgggcttggg ggttccagtg ccattgcagg 3600
gccggcagac aacccagccg cttacgcctg gccaaccgcc cgttcctcca cacatggggc 3660
attccacggc gtcggtgcct ggttgttctt gattttccat gccgcctcct ttagccgcta 3720
aaattcatct actcatttat tcatttgctc atttactctg gtagctgcgc gatgtattca 3780
gatagcagct cggtaatggt cttgccttgg cgtaccgcgt acatcttcag cttggtgtga 3840
tcctccgccg gcaactgaaa gttgacccgc ttcatggctg gcgtgtctgc caggctggcc 3900
aacgttgcag ccttgctgct gcgtgcgctc ggacggccgg cacttagcgt gtttgtgctt 3960
ttgctcattt tctctttacc tcattaactc aaatgagttt tgatttaatt tcagcggcca 4020
gcgcctggac ctcgcgggca gcgtcgccct cgggttctga ttcaagaacg gttgtgccgg 4080
cggcggcagt gcctgggtag ctcacgcgct gcgtgatacg ggactcaaga atgggcagct 4140
cgtacccggc cagcgcctcg gcaacctcac cgccgatgcg cgtgcctttg atcgcccgcg 4200
acacgacaaa ggccgcttgt agccttccat ccgtgacctc aatgcgctgc ttaaccagct 4260
ccaccaggtc ggcggtggcc caaatgtcgt aagggcttgg ctgcaccgga atcagcacga 4320
agtcggctgc cttgatcgcg gacacagcca agtccgccgc ctggggcgct ccgtcgatca 4380
ctacgaagtc gcgccggccg atggccttca cgtcgcggtc aatcgtcggg cggtcgatgc 4440
cgacaacggt tagcggttga tcttcccgca cggccgccca atcgcgggca ctgccctggg 4500
gatcggaatc gactaacaga acatcggccc cggcgagttg cagggcgcgg gctagatggg 4560
ttgcgatggt cgtcttgcct gacccgcctt tctggttaag tacagcgata accttcatgc 4620
gttccccttg cgtatttgtt tatttactca tcgcatcata tacgcagcga ccgcatgacg 4680
caagctgttt tactcaaata cacatcacct ttttagatga tcagtgattt tgtgccgagc 4740
tgccggtcgg ggagctgttg gctggctggt ggcaggatat attgtggtgt aaacaaattg 4800
acgcttagac aacttaataa cacattgcgg acgtctttaa tgtactgaat ttagttactg 4860
atcactgatt aagtactgat aaatttaatt aacagatctc aactttgtat agaaaagttg 4920
atttaaatga attcaagctt ttaattaact tagccactgc aacaagttct tgaaccttag 4980
cacaatcata ttgtgcatgc acttgtttat tgcaaagaat ggtgcgtagg gaacacgcat 5040
gatttttgaa ttgctggcac ataattttat cattagaaac tggaatgcaa catgtaccct 5100
ttgtcatggt ttctttccga gacattgcac tgtttttttt aatcctatca ttatcataat 5160
gccaagaact ggtcaccaac cagcattttg catcatggtt agttgagctg tccccatgta 5220
tcaataggtg cattgtattg gtccaaaata taaatgcagt ggatgcaacc tatctcatgg 5280
ccgtcaacaa aagaaatcaa aagggaaatg caccatctta tatctccagt ttatatgaac 5340
agattggata agatcataag atcaagtggt ttatattatt ttgaggaata taacatggat 5400
tcatcctaat cactcgtcta ggcagtatgt gtattcatga tggatatggt actatactac 5460
ggagtttttt cttcacaaaa taacctgtta ttttgacctc caaccaaaca cgaattatac 5520
caaaaattgg gttatttcat ctatagtaca actctattat aaacatgcag taaattatcc 5580
tacacatata ccaaaattca agtgtaataa tcctaataca cagacttaaa aaacaaacta 5640
tttccttttt aagaaaagga aaaccatttt tttaacggaa ggaaaacaaa ttcgggtcaa 5700
ggcggaagcc agcgcgccac cccacgtcag cgaatacgga ggcgcggggt tgacggcgtc 5760
acccggtcct aacggcgacc aacaaaccag ccagaagaaa ttacagtaaa aaaaagtaaa 5820
ttgcactttg atccaccttt tattacccaa gtttcaattt ggaccaccct taaacctatc 5880
ttttcaaatt gggccgggtt gtggtttgga ctaccatgaa caacttttcg tcatgtctaa 5940
cttccctttc ggcaaacata tgaaccatat atagaggaga tcggccgtat actagagctg 6000
atgtgtttaa ggtcgttgat tgcacgagaa aaaaaaaatc caaatcgcaa caatagcaaa 6060
tttatctagt tcaaagtgaa aagatatgtt taaaggtagt ccaaagtaaa acttaggggc 6120
tgtttggttc ccagccatac tttaccatta cttgccaaca aaagttgcca caccttgtct 6180
aaggtgaggt gatcaaattg ttagccacaa cttactaagc ctaagggaat cttgccacac 6240
ttttttgagc cattgacacg tgggacttaa tttgttagag ggaaatcttg ccacaactgt 6300
ggctacaacc aaacacctgt caaatttgcc taaccttagg cgtggcaaac tgtggcaaag 6360
tgtggcttac aaccaaacac acccttagat aataaaatgt ggtccaaagc gtaattcact 6420
aaaaaaaaat caacgagacg tgtaccaaac ggagacaaac ggcatcttct cgaaatttcc 6480
caaccgctcg ctcgcccgcc tcgtcttccc ggaaaccgcg gtggtttcag cgtggcggat 6540
tctccaagca gacggagacg tcacggcacg ggactcctcc caccacccaa ccgccataaa 6600
taccagcccc ctcatctcct ctcctcgcat cagctccacc cccgaaaaat ttctccccaa 6660
tctcgcgagg ctctcgtcgt cgaatcgaat cctctcgcgt cctcaagctt ggcatccagg 6720
tacggatccg cgtcccatct ccctcacccc ccgtgttctt cgtgcctgct tctgggtcag 6780
atctgggtgg attcgcggtt gttggatgtg gggggctgtg tttatttgtc ggtggatctg 6840
gttgtctgga tctgcgtttt ctctgtcgta gttagcggat ctgatgaaat gtttagtgtt 6900
cgtgtatact ggtatggtgg atctggtcct aggatgcgtg gaatggatat atgtaggcga 6960
attggaggat ttattttgtg aattttgctg aaatgatagt tctaaacact ggatctgacc 7020
tcgggatgct gttaaatgtg gaaatcatgg tcgatgctgt catgaacatg gtgttcttat 7080
ggtagatctg agcaatgtat gtttcaaaat tgtttgtcac atggaaatgc tatggttcta 7140
gatgcaatag aatgatacat gccgagatcc cctctagttg atatgataga tcatgatgtt 7200
ttacagctat gtcatatgaa tatgttcatt tgttaccgat gtatttggat ctacttaaca 7260
tttccaaagc acgccgcgtt ctaattctag atctggtagt catgtttgta cacgtcaccc 7320
acctaataca aatacatatg tctagtgttt ggtgacactg cccgtcagat ctgttttttc 7380
cagatctgtg gaacaaatac tccacgcatg tatggtagtt ttgaaacgat cttgtatctt 7440
ccattgttgt agtaacaact aaataaagta caattgttca attattggga atcgtatttt 7500
ctgtagtgcc gatgtacagc atattcatag atgtctattt aggaactcaa attttaaatt 7560
gaggactagt tatttattgt gggtcagtct tttgaattgt gttatcttgc tgtactggcg 7620
cgccaccatg gccaccgccg ccgccgcgtc taccgcgctc actggcgcca ctaccgctgc 7680
gcccaaggcg aggcgccggg cgcacctcct ggccacccgc cgcgccctcg ccgcgcccat 7740
caggtgctca gcggcgtcac ccgccatgcc gatggctccc ccggccaccc cgctccggcc 7800
gtggggcccc accgatcccc gcaagggcgc cgacatcctc gtcgagtccc tcgagcgctg 7860
cggcgtccgc gacgtcttcg cctaccccgg cggcacgtcc atggagatcc accaggcact 7920
cacccgctcc cccgtcatcg ccaaccacct cttccgccac gagcaagggg aggcctttgc 7980
ggcctccggc tacgcgcgct cctcgggccg cgtcggcgtc tgcatcgcca cctccggccc 8040
cggcgccacc aaccttgtct ccgcgctcgc cgacgcgctg ctcgattccg tccccatggt 8100
cgccatcacg ggacaggtgc cgcgacgcat gattggcacc gacgccttcc aggagacgcc 8160
catcgtcgag gtcacccgct ccatcaccaa gcacaactac ctggtcctcg acgtcgacga 8220
catcccccgc gtcgtgcagg aggctttctt cctcgcctcc tctggtcgac cggggccggt 8280
gcttgtcgac atccccaagg acatccagca gcagatggcg gtgcctgtct gggacaagcc 8340
catgagtctg cctgggtaca ttgcgcgcct tcccaagccc cctgcgactg agttgcttga 8400
gcaggtgctg cgtcttgttg gtgaatcccg gcgccctgtt ctttatgttg gcggtggctg 8460
cgcagcatct ggtgaggagt tgcgacgctt tgtggagctg actggaatcc cggtcacaac 8520
tactcttatg ggcctcggca acttccccag cgacgaccca ctgtctctgc gcatgctagg 8580
tatgcatggc acggtgtatg caaattatgc agtggataag gccgatctgt tgcttgcact 8640
tggtgtgcgg tttgatgatc gtgtgacagg gaagattgag gcttttgcaa gcagggctaa 8700
gattgtgcac gttgatattg atccggctga gattggcaag aacaagcagc cacatgtgtc 8760
catctgtgca gatgttaagc ttgctttgca gggcatgaat gctcttcttg aaggaagcac 8820
atcaaagaag agctttgact ttggctcatg gaacgatgag ttggatcagc agaagaggga 8880
attccccctt gggtataaaa catctaatga ggagatccag ccacaatatg ctattcaggt 8940
tcttgatgag ctgacgaaag gcgaggccat catcggcaca ggtgttgggc agcaccagat 9000
gtgggcggca cagtactaca cttacaagcg gccaaggcag tggttgtctt cagctggtct 9060
tggggctatg ggatttggtt tgccggctgc tgctggtgct tctgtggcca acccaggtgt 9120
tactgttgtt gacatcgatg gagatggtag ctttctcatg aacgttcagg agctagctat 9180
gatccgaatt gagaacctcc cggtgaaggt ctttgtgcta aacaaccagc acctggggat 9240
ggtggtgcag tgggaggaca ggttctataa ggccaacaga gcgcacacat acttgggaaa 9300
cccagagaat gaaagtgaga tatatccaga tttcgtgacg atcgccaaag ggttcaacat 9360
tccagcggtc cgtgtgacaa agaagaacga agtccgcgca gcgataaaga agatgctcga 9420
gactccaggg ccgtacctct tggatataat cgtcccacac caggagcatg tgttgcctat 9480
gatccctaat ggtggggctt tcaaggatat gatcctggat ggtgatggca ggactgtgta 9540
ctagcctgca ggcctaggat cgttcaaaca tttggcaata aagtttctta agattgaatc 9600
ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt aagcatgtaa 9660
taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt agagtcccgc 9720
aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag gataaattat 9780
cgcgcgcggt gtcatctatg ttactagatc ggccggccgt ttaaacagcc tgcttttttg 9840
tacaaacttg atttaaatga attcaagctt ttaattaagc atgcgagctc ggcgcgccgg 9900
taccgcgatc gcggatcatg aaccaacggc ctggctgtat ttggtggttg tgtagggaga 9960
tggggagaag aaaagcccga ttctcttcgc tgtgatgggc tggatgcatg cgggggagcg 10020
ggaggcccaa gtacgtgcac ggtgagcggc ccacagggcg agtgtgagcg cgagaggcgg 10080
gaggaacagt ttagtaccac attgcccagc taactcgaac gcgaccaact tataaacccg 10140
cgcgctgtcg cttgtgtgca ttgagtgcta tgctgaggtt ttagagctag aaatagcaag 10200
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgctctgttc 10260
ctcgtgctgg acaagtgtgg tttccagatt ctgcaaccaa gactgcgcag gcattgctgg 10320
acttcaaccg tgaaggatta cctctgttca tcctcgctaa ctggagaggc ttctctggtg 10380
gacaaagaga tctctttgaa ggaattcttc aggctggctc gactattgtt gagaacctta 10440
ggacatacaa tcagcctgcc tttgtctaca ttcccatggc tgcagagcta cgaggagggg 10500
cttgggttgt ggttgatagc aagataaacc cagaccgcat tgagtgctat gctgagagaa 10560
ctgcaaaatc caatgttctg gaaccgcaag ggttaattga gatcaagttc aggtcagagg 10620
aactccagga ttgcatgagt cggcttgacc caacattaat tgatctgaaa gcaaaactcg 10680
aagtagcaaa taaaaatgga agtgctgaca caaaatcgct tcaagaaaat atagaagctc 10740
gaacaaaaca gttgatgcct ctatatactc agattgcgat acggtttgct gaattgcatg 10800
atacatccct cagaatggct gcgaaaggtg tgattaagaa agttgtggac tgggaagaat 10860
cacgatcttt cttttttttg cggccgcccc gggcctgcag gggatcccga tcgggccggc 10920
cgtttaaacc cactttgtac aagaaagctg ggtatttaaa tgaattcaag cttttaatta 10980
atgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat tgcatgtcta 11040
agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta 11100
tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt actacaataa 11160
tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga 11220
gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt 11280
ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca tccatttagg 11340
gtttagggtt aatggttttt atagactaat ttttttagta catctatttt attctatttt 11400
agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat agtttagata 11460
taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa 11520
aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga 11580
cgagtctaac ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga 11640
cggcacggca tctctgtcgc tgcctctgga cccctctcga gagttccgct ccaccgttgg 11700
acttgctccg ctgtcggcat ccagaaattg cgtggcggag cggcagacgt gagccggcac 11760
ggcaggcggc ctcctcctcc tctcacggca ccggcagcta cgggggattc ctttcccacc 11820
gctccttcgc tttcccttcc tcgcccgccg taataaatag acaccccctc cacaccctct 11880
ttccccaacc tcgtgttgtt cggagcgcac acacacacaa ccagatctcc cccaaatcca 11940
cccgtcggca cctccgcttc aaggtacgcc gctcgtcctc cccccccccc cccctctcta 12000
ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat 12060
gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 12120
acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 12180
gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 12240
atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 12300
tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 12360
tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 12420
tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 12480
ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 12540
ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 12600
tagaatactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 12660
atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 12720
atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 12780
gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttatttcgat 12840
cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 12900
ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 12960
gtgttacttc tgcagggcgc gccaccatgg ctcctaagaa gaagcggaag gttggtattc 13020
acggggtgcc tgcggctgac aagaagtact ccatcggcct cgacatcggc accaacagcg 13080
tcggctgggc ggtgatcacc gacgagtaca aggtcccgtc caagaagttc aaggtcctgg 13140
gcaacaccga ccgccactcc atcaagaaga acctcatcgg cgccctcctc ttcgactccg 13200
gcgagacggc ggaggcgacc cgcctcaagc gcaccgcccg ccgccgctac acccgccgca 13260
agaaccgcat ctgctacctc caggagatct tctccaacga gatggcgaag gtcgacgact 13320
ccttcttcca ccgcctcgag gagtccttcc tcgtggagga ggacaagaag cacgagcgcc 13380
accccatctt cggcaacatc gtcgacgagg tcgcctacca cgagaagtac cccactatct 13440
accaccttcg taagaagctt gttgactcta ctgataaggc tgatcttcgt ctcatctacc 13500
ttgctctcgc tcacatgatc aagttccgtg gtcacttcct tatcgagggt gaccttaacc 13560
ctgataactc cgacgtggac aagctcttca tccagctcgt ccagacctac aaccagctct 13620
tcgaggagaa ccctatcaac gcttccggtg tcgacgctaa ggcgatcctt tccgctaggc 13680
tctccaagtc caggcgtctc gagaacctca tcgcccagct ccctggtgag aagaagaacg 13740
gtcttttcgg taacctcatc gctctctccc tcggtctgac ccctaacttc aagtccaact 13800
tcgacctcgc tgaggacgct aagcttcagc tctccaagga tacctacgac gatgatctcg 13860
acaacctcct cgctcagatt ggagatcagt acgctgatct cttccttgct gctaagaacc 13920
tctccgatgc tatcctcctt tcggatatcc ttagggttaa cactgagatc actaaggctc 13980
ctctttctgc ttccatgatc aagcgctacg acgagcacca ccaggacctc accctcctca 14040
aggctcttgt tcgtcagcag ctccccgaga agtacaagga gatcttcttc gaccagtcca 14100
agaacggcta cgccggttac attgacggtg gagctagcca ggaggagttc tacaagttca 14160
tcaagccaat ccttgagaag atggatggta ctgaggagct tctcgttaag cttaaccgtg 14220
aggacctcct taggaagcag aggactttcg ataacggctc tatccctcac cagatccacc 14280
ttggtgagct tcacgccatc cttcgtaggc aggaggactt ctaccctttc ctcaaggaca 14340
accgtgagaa gatcgagaag atccttactt tccgtattcc ttactacgtt ggtcctcttg 14400
ctcgtggtaa ctcccgtttc gcttggatga ctaggaagtc cgaggagact atcacccctt 14460
ggaacttcga ggaggttgtt gacaagggtg cttccgccca gtccttcatc gagcgcatga 14520
ccaacttcga caagaacctc cccaacgaga aggtcctccc caagcactcc ctcctctacg 14580
agtacttcac ggtctacaac gagctcacca aggtcaagta cgtcaccgag ggtatgcgca 14640
agcctgcctt cctctccggc gagcagaaga aggctatcgt tgacctcctc ttcaagacca 14700
accgcaaggt caccgtcaag cagctcaagg aggactactt caagaagatc gagtgcttcg 14760
actccgtcga gatcagcggc gttgaggacc gtttcaacgc ttctctcggc acctaccacg 14820
atctcctcaa gatcatcaag gacaaggact tcctcgacaa cgaggagaac gaggacatcc 14880
tcgaggacat cgtcctcact cttactctct tcgaggatag ggagatgatc gaggagaggc 14940
tcaagactta cgctcatctc ttcgatgaca aggttatgaa gcagctcaag cgtcgccgtt 15000
acaccggttg gggtaggctc tcccgcaagc tcatcaacgg tatcagggat aagcagagcg 15060
gcaagactat cctcgacttc ctcaagtctg atggtttcgc taacaggaac ttcatgcagc 15120
tcatccacga tgactctctt accttcaagg aggatattca gaaggctcag gtgtccggtc 15180
agggcgactc tctccacgag cacattgcta accttgctgg ttcccctgct atcaagaagg 15240
gcatccttca gactgttaag gttgtcgatg agcttgtcaa ggttatgggt cgtcacaagc 15300
ctgagaacat cgtcatcgag atggctcgtg agaaccagac tacccagaag ggtcagaaga 15360
actcgaggga gcgcatgaag aggattgagg agggtatcaa ggagcttggt tctcagatcc 15420
ttaaggagca ccctgtcgag aacacccagc tccagaacga gaagctctac ctctactacc 15480
tccagaacgg tagggatatg tacgttgacc aggagctcga catcaacagg ctttctgact 15540
acgacgtcga ccacattgtt cctcagtctt tccttaagga tgactccatc gacaacaagg 15600
tcctcacgag gtccgacaag aacaggggta agtcggacaa cgtcccttcc gaggaggttg 15660
tcaagaagat gaagaactac tggaggcagc ttctcaacgc taagctcatt acccagagga 15720
agttcgacaa cctcacgaag gctgagaggg gtggcctttc cgagcttgac aaggctggtt 15780
tcatcaagag gcagcttgtt gagacgaggc agattaccaa gcacgttgct cagatcctcg 15840
attctaggat gaacaccaag tacgacgaga acgacaagct catccgcgag gtcaaggtga 15900
tcaccctcaa gtccaagctc gtctccgact tccgcaagga cttccagttc tacaaggtcc 15960
gcgagatcaa caactaccac cacgctcacg atgcttacct taacgctgtc gttggcaccg 16020
ctcttatcaa gaagtaccct aagcttgagt ccgagttcgt ctacggtgac tacaaggtct 16080
acgacgttcg taagatgatc gccaagtccg agcaggagat cggcaaggcc accgccaagt 16140
acttcttcta ctccaacatc atgaacttct tcaagaccga gatcaccctc gccaacggcg 16200
agatccgcaa gcgccctctt atcgagacga acggtgagac tggtgagatc gtttgggaca 16260
agggtcgcga cttcgctact gttcgcaagg tcctttctat gcctcaggtt aacatcgtca 16320
agaagaccga ggtccagacc ggtggcttct ccaaggagtc tatccttcca aagagaaact 16380
cggacaagct catcgctagg aagaaggatt gggaccctaa gaagtacggt ggtttcgact 16440
cccctactgt cgcctactcc gtcctcgtgg tcgccaaggt ggagaagggt aagtcgaaga 16500
agctcaagtc cgtcaaggag ctcctcggca tcaccatcat ggagcgctcc tccttcgaga 16560
agaacccgat cgacttcctc gaggccaagg gctacaagga ggtcaagaag gacctcatca 16620
tcaagctccc caagtactct cttttcgagc tcgagaacgg tcgtaagagg atgctggctt 16680
ccgctggtga gctccagaag ggtaacgagc ttgctcttcc ttccaagtac gtgaacttcc 16740
tctacctcgc ctcccactac gagaagctca agggttcccc tgaggataac gagcagaagc 16800
agctcttcgt ggagcagcac aagcactacc tcgacgagat catcgagcag atctccgagt 16860
tctccaagcg cgtcatcctc gctgacgcta acctcgacaa ggtcctctcc gcctacaaca 16920
agcaccgcga caagcccatc cgcgagcagg ccgagaacat catccacctc ttcacgctca 16980
cgaacctcgg cgcccctgct gctttcaagt acttcgacac caccatcgac aggaagcgtt 17040
acacgtccac caaggaggtt ctcgacgcta ctctcatcca ccagtccatc accggtcttt 17100
acgagactcg tatcgacctt tcccagcttg gtggtgataa gcgtcctgct gccaccaaaa 17160
aggccggaca ggctaagaaa aagaagtagc ctgcaggtcc tgctttaatg agatatgcga 17220
gacgcctatg atcgcatgat atttgctttc aattctgttg tgcacgttgt aaaaaacctg 17280
agcatgtgta gctcagatcc ttaccgccgg tttcggttca ttctaatgaa tatatcaccc 17340
gttactatcg tatttttatg aataatattc tccgttcaat ttactgattg taccctacta 17400
cttatatgta caatattaaa atgaaaacaa tatattgtgc tgaataggtt tatagcgaca 17460
tctatgatag agcgccacaa taacaaacaa ttgcgtttta ttattacaaa tccaatttta 17520
aaaaaagcgg cagaaccggt caaacctaaa agactgatta cataaatctt attcaaattt 17580
caaaagtgcc ccaggggcta gtatctacga cacaccgagc ggcgaactaa taacgctcac 17640
tgaagggaac tccggttccc cgccggcgcg catgggtgag attccttgaa gttgagtatt 17700
ggccgtccgc tctaccgaaa gttacgggca ccattcaacc cggtccagca cggcggccgg 17760
gtaaccgact tgctgccccg agaattatgc agcatttttt tggtgtatgt gggccccaaa 17820
tgaagtgcag gtcaaacctt gacagtgacg acaaatcgtt gggcgggtcc agggcgaatt 17880
ttgcgacaac atgtcgaggc tcagcaggcc ggccgtttaa accaacttta 17930
<210> 67
<211> 3734
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector CC019
<400> 67
cgcggatcat gaaccaacgg cctggctgta tttggtggtt gtgtagggag atggggagaa 60
gaaaagcccg attctcttcg ctgtgatggg ctggatgcat gcgggggagc gggaggccca 120
agtacgtgca cggtgagcgg cccacagggc gagtgtgagc gcgagaggcg ggaggaacag 180
tttagtacca cattgcccag ctaactcgaa cgcgaccaac ttataaaccc gcgcgctgtc 240
gcttgtgtga ctgcaaaagg caatgttcgt tttagagcta gaaatagcaa gttaaaataa 300
ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctctgtt cctcgtgctg 360
gacaagtgtg gtttccagat tctgcaacca agactgcgca ggcattgctg gacttcaacc 420
gtgaaggatt acctctgttc atcctcgcta actggagagg cttctctggt ggacaaagag 480
atctctttga aggaattctt caggctggct cgactattgt tgagaacctt aggacataca 540
atcagcctgc ctttgtctac attcccatgg ctgcagagct acgaggaggg gcttgggttg 600
tggttgatag caagataaac ccagaccgca ttgagtgcta tgctgagagg actgcaaaat 660
ccaatgttct cgaaccgcaa gggttaattg agatcaagtt caggtcagag gaactccagg 720
attgcatgag tcggcttgac ccaacattaa ttgatctgaa agcaaaactc gaagtagcaa 780
ataaaaatgg aagtgctgac acaaaatcgc ttcaagaaaa tatagaagct cgaacaaaac 840
agttgatgcc tctatatact cagattgcga tacggtttgc tgaattgcat gatacatccc 900
tcagaatggc tgcgaaaggt gtgattaaga aagttgtgga ctgggaagaa tcacgatctt 960
tctttttttt gcggccgccc cgggcctgca ggggatcccg atcgggccgg ccgtttaaac 1020
ccactttgta caagaaagtt gaacgagaaa cgtaaaatga tataaatatc aatatattaa 1080
attagatttt gcataaaaaa cagactacat aatactgtaa aacacaacat atgcagtcac 1140
tatgaaccaa ctacttagat ggtattagtg acctgtactg ggcctcatgg gccttccgct 1200
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaacat ggtcatagct 1260
gtttccttgc gtattgggcg ctctccgctt cctcgctcac tgactcgctg cgctcggtcg 1320
ttcgggtaaa gcctggggtg cctaatgagc aaaaggccag caaaaggcca ggaaccgtaa 1380
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 1440
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 1500
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 1560
cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 1620
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 1680
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 1740
gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 1800
agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg 1860
cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 1920
aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 1980
aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 2040
ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 2100
aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 2160
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 2220
agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 2280
cagtgctgca atgataccgc gagaaccacg ctcaccggct ccagatttat cagcaataaa 2340
ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 2400
gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 2460
cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 2520
cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 2580
ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 2640
catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 2700
tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 2760
ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 2820
catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 2880
cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 2940
cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 3000
acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 3060
ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 3120
tccgcgcaca tttccccgaa aagtgccacc taaattgtaa gcgttaatat tttgttaaaa 3180
ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa 3240
atcccttata aatcaaaaga atagaccgag atagggttga gtggccgcta cagggcgctc 3300
ccattcgcca ttcaggctgc gcaactgttg ggaagggcgt ttcggtgcgg gcctcttcgc 3360
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 3420
ggttttccca gtcacgacgt tgtaaaacga cggccagtga gcgcgacgta atacgactca 3480
ctatagggcg aattggcgga aggccgtcaa ggccgcatta caggtcacta ataccatcta 3540
agtagttggt tcatagtgac tgcatatgtt gtgttttaca gtattatgta gtctgttttt 3600
tatgcaaaat ctaatttaat atattgatat ttatatcatt ttacgtttct cgttcaactt 3660
ttttgtacaa acttgattta aatgaattca agcttttaat taagcatgcg agctcggcgc 3720
gccggtaccg cgat 3734
<210> 68
<211> 17930
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector RLW138
<400> 68
ttatacatag ttgataattc actgggccgg ccgtttaaac ttagttacta atcagtgatc 60
agattgtcgt ttcccgcctt cactttaaac tatcagtgtt tgacaggata tattggcggg 120
taaacctaag agaaaagagc gtttattaga ataatcggat atttaaaagg gcgtgaaaag 180
gtttatccgt tcgtccattt gtatgtcaat attggggggg ggggaaagcc acgttgtgtc 240
tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa caataaaact 300
gtctgcttac ataaacagta atacaagggg tgttcgccac catgagccat atccagcgtg 360
aaacctcgtg ctcccgcccg cgcctcaatt ccaatatgga tgccgacctt tatggctaca 420
agtgggcgcg cgacaacgtc ggccagtcgg gcgcgaccat ttatcggctt tatggcaaac 480
ccgatgcccc ggaactgttc ctgaagcacg gcaaaggcag cgtcgcaaac gatgtcaccg 540
atgagatggt ccgcctgaac tggcttaccg agttcatgcc gctgccgacg attaagcatt 600
tcatccgtac cccggacgat gcctggctct tgaccacggc cattccgggc aaaacggcct 660
ttcaggtcct tgaagagtac ccggactccg gtgagaatat cgtggacgcc ctcgcggtct 720
tcctccgccg tttgcatagc atccccgtgt gcaactgccc cttcaactcg gaccgggttt 780
tccgcctggc acaggcccag tcgcgcatga ataacggcct cgttgacgcg agcgatttcg 840
acgatgaacg gaatggctgg ccggtggaac aggtttggaa ggaaatgcac aaactgcttc 900
cgttctcgcc ggattcggtg gtcacgcatg gtgatttttc cctggataat ctgatctttg 960
acgagggcaa gctgatcggc tgcatcgacg tgggtcgcgt cggtatcgcc gaccgctatc 1020
aggacctggc gatcttgtgg aattgcctcg gcgagttctc gccctcgctc cagaagcgcc 1080
tgttccagaa gtacggcatc gacaacccgg atatgaacaa gctccagttc cacctcatgc 1140
tggacgaatt tttttgaaca gaattggtta attggttgta acactggcag agcattacgc 1200
tgacttgacg ggacggcggc tttgttgaat aaatcgaact tttgctgagt tgaaggatcg 1260
atgagttgaa ggaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 1320
gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 1380
atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 1440
atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc 1500
ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 1560
gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 1620
cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 1680
tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 1740
cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 1800
ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 1860
gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 1920
tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg 1980
ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc 2040
gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc 2100
atctgtgcgg tatttcacac cgcataggcc gcgataggcc gacgcgaagc ggcggggcgt 2160
agggagcgca gcgaccgaag ggtaggcgct ttttgcagct cttcggctgt gcgctggcca 2220
gacagttatg cacaggccag gcgggtttta agagttttaa taagttttaa agagttttag 2280
gcggaaaaat cgcctttttt ctcttttata tcagtcactt acatgtgtga ccggttccca 2340
atgtacggct ttgggttccc aatgtacggg ttccggttcc caatgtacgg ctttgggttc 2400
ccaatgtacg tgctatccac aggaaagaga ccttttcgac ctttttcccc tgctagggca 2460
atttgcccta gcatctgctc cgtacattag gaaccggcgg atgcttcgcc ctcgatcagg 2520
ttgcggtagc gcatgactag gatcgggcca gcctgccccg cctcctcctt caaatcgtac 2580
tccggcaggt catttgaccc gatcagcttg cgcacggtga aacagaactt cttgaactct 2640
ccggcgctgc cactgcgttc gtagatcgtc ttgaacaacc atctggcttc tgccttgcct 2700
gcggcgcggc gtgccaggcg gtagagaaaa cggccgatgc cggggtcgat caaaaagtaa 2760
tcggggtgaa ccgtcagcac gtccgggttc ttgccttctg tgatctcgcg gtacatccaa 2820
tcagcaagct cgatctcgat gtactccggc cgcccggttt cgctctttac gatcttgtag 2880
cggctaatca aggcttcacc ctcggatacc gtcaccaggc ggccgttctt ggccttcttg 2940
gtacgctgca tggcaacgtg cgtggtgttt aaccgaatgc aggtttctac caggtcgtct 3000
ttctgctttc cgccatcggc tcgccggcag aacttgagta cgtccgcaac gtgtggacgg 3060
aacacgcggc cgggcttgtc tcccttccct tcccggtatc ggttcatgga ttcggttaga 3120
tgggaaaccg ccatcagtac caggtcgtaa tcccacacac tggccatgcc ggcggggcct 3180
gcggaaacct ctacgtgccc gtctggaagc tcgtagcgga tcacctcgcc agctcgtcgg 3240
tcacgcttcg acagacggaa aacggccacg tccatgatgc tgcgactatc gcgggtgccc 3300
acgtcataga gcatcggaac gaaaaaatct ggttgctcgt cgcccttggg cggcttccta 3360
atcgacggcg caccggctgc cggcggttgc cgggattctt tgcggattcg atcagcggcc 3420
ccttgccacg attcaccggg gcgtgcttct gcctcgatgc gttgccgctg ggcggcctgc 3480
gcggccttca acttctccac caggtcatca cccagcgccg cgccgatttg taccgggccg 3540
gatggtttgc gaccgctcac gccgattcct cgggcttggg ggttccagtg ccattgcagg 3600
gccggcagac aacccagccg cttacgcctg gccaaccgcc cgttcctcca cacatggggc 3660
attccacggc gtcggtgcct ggttgttctt gattttccat gccgcctcct ttagccgcta 3720
aaattcatct actcatttat tcatttgctc atttactctg gtagctgcgc gatgtattca 3780
gatagcagct cggtaatggt cttgccttgg cgtaccgcgt acatcttcag cttggtgtga 3840
tcctccgccg gcaactgaaa gttgacccgc ttcatggctg gcgtgtctgc caggctggcc 3900
aacgttgcag ccttgctgct gcgtgcgctc ggacggccgg cacttagcgt gtttgtgctt 3960
ttgctcattt tctctttacc tcattaactc aaatgagttt tgatttaatt tcagcggcca 4020
gcgcctggac ctcgcgggca gcgtcgccct cgggttctga ttcaagaacg gttgtgccgg 4080
cggcggcagt gcctgggtag ctcacgcgct gcgtgatacg ggactcaaga atgggcagct 4140
cgtacccggc cagcgcctcg gcaacctcac cgccgatgcg cgtgcctttg atcgcccgcg 4200
acacgacaaa ggccgcttgt agccttccat ccgtgacctc aatgcgctgc ttaaccagct 4260
ccaccaggtc ggcggtggcc caaatgtcgt aagggcttgg ctgcaccgga atcagcacga 4320
agtcggctgc cttgatcgcg gacacagcca agtccgccgc ctggggcgct ccgtcgatca 4380
ctacgaagtc gcgccggccg atggccttca cgtcgcggtc aatcgtcggg cggtcgatgc 4440
cgacaacggt tagcggttga tcttcccgca cggccgccca atcgcgggca ctgccctggg 4500
gatcggaatc gactaacaga acatcggccc cggcgagttg cagggcgcgg gctagatggg 4560
ttgcgatggt cgtcttgcct gacccgcctt tctggttaag tacagcgata accttcatgc 4620
gttccccttg cgtatttgtt tatttactca tcgcatcata tacgcagcga ccgcatgacg 4680
caagctgttt tactcaaata cacatcacct ttttagatga tcagtgattt tgtgccgagc 4740
tgccggtcgg ggagctgttg gctggctggt ggcaggatat attgtggtgt aaacaaattg 4800
acgcttagac aacttaataa cacattgcgg acgtctttaa tgtactgaat ttagttactg 4860
atcactgatt aagtactgat aaatttaatt aacagatctc aactttgtat agaaaagttg 4920
atttaaatga attcaagctt ttaattaact tagccactgc aacaagttct tgaaccttag 4980
cacaatcata ttgtgcatgc acttgtttat tgcaaagaat ggtgcgtagg gaacacgcat 5040
gatttttgaa ttgctggcac ataattttat cattagaaac tggaatgcaa catgtaccct 5100
ttgtcatggt ttctttccga gacattgcac tgtttttttt aatcctatca ttatcataat 5160
gccaagaact ggtcaccaac cagcattttg catcatggtt agttgagctg tccccatgta 5220
tcaataggtg cattgtattg gtccaaaata taaatgcagt ggatgcaacc tatctcatgg 5280
ccgtcaacaa aagaaatcaa aagggaaatg caccatctta tatctccagt ttatatgaac 5340
agattggata agatcataag atcaagtggt ttatattatt ttgaggaata taacatggat 5400
tcatcctaat cactcgtcta ggcagtatgt gtattcatga tggatatggt actatactac 5460
ggagtttttt cttcacaaaa taacctgtta ttttgacctc caaccaaaca cgaattatac 5520
caaaaattgg gttatttcat ctatagtaca actctattat aaacatgcag taaattatcc 5580
tacacatata ccaaaattca agtgtaataa tcctaataca cagacttaaa aaacaaacta 5640
tttccttttt aagaaaagga aaaccatttt tttaacggaa ggaaaacaaa ttcgggtcaa 5700
ggcggaagcc agcgcgccac cccacgtcag cgaatacgga ggcgcggggt tgacggcgtc 5760
acccggtcct aacggcgacc aacaaaccag ccagaagaaa ttacagtaaa aaaaagtaaa 5820
ttgcactttg atccaccttt tattacccaa gtttcaattt ggaccaccct taaacctatc 5880
ttttcaaatt gggccgggtt gtggtttgga ctaccatgaa caacttttcg tcatgtctaa 5940
cttccctttc ggcaaacata tgaaccatat atagaggaga tcggccgtat actagagctg 6000
atgtgtttaa ggtcgttgat tgcacgagaa aaaaaaaatc caaatcgcaa caatagcaaa 6060
tttatctagt tcaaagtgaa aagatatgtt taaaggtagt ccaaagtaaa acttaggggc 6120
tgtttggttc ccagccatac tttaccatta cttgccaaca aaagttgcca caccttgtct 6180
aaggtgaggt gatcaaattg ttagccacaa cttactaagc ctaagggaat cttgccacac 6240
ttttttgagc cattgacacg tgggacttaa tttgttagag ggaaatcttg ccacaactgt 6300
ggctacaacc aaacacctgt caaatttgcc taaccttagg cgtggcaaac tgtggcaaag 6360
tgtggcttac aaccaaacac acccttagat aataaaatgt ggtccaaagc gtaattcact 6420
aaaaaaaaat caacgagacg tgtaccaaac ggagacaaac ggcatcttct cgaaatttcc 6480
caaccgctcg ctcgcccgcc tcgtcttccc ggaaaccgcg gtggtttcag cgtggcggat 6540
tctccaagca gacggagacg tcacggcacg ggactcctcc caccacccaa ccgccataaa 6600
taccagcccc ctcatctcct ctcctcgcat cagctccacc cccgaaaaat ttctccccaa 6660
tctcgcgagg ctctcgtcgt cgaatcgaat cctctcgcgt cctcaagctt ggcatccagg 6720
tacggatccg cgtcccatct ccctcacccc ccgtgttctt cgtgcctgct tctgggtcag 6780
atctgggtgg attcgcggtt gttggatgtg gggggctgtg tttatttgtc ggtggatctg 6840
gttgtctgga tctgcgtttt ctctgtcgta gttagcggat ctgatgaaat gtttagtgtt 6900
cgtgtatact ggtatggtgg atctggtcct aggatgcgtg gaatggatat atgtaggcga 6960
attggaggat ttattttgtg aattttgctg aaatgatagt tctaaacact ggatctgacc 7020
tcgggatgct gttaaatgtg gaaatcatgg tcgatgctgt catgaacatg gtgttcttat 7080
ggtagatctg agcaatgtat gtttcaaaat tgtttgtcac atggaaatgc tatggttcta 7140
gatgcaatag aatgatacat gccgagatcc cctctagttg atatgataga tcatgatgtt 7200
ttacagctat gtcatatgaa tatgttcatt tgttaccgat gtatttggat ctacttaaca 7260
tttccaaagc acgccgcgtt ctaattctag atctggtagt catgtttgta cacgtcaccc 7320
acctaataca aatacatatg tctagtgttt ggtgacactg cccgtcagat ctgttttttc 7380
cagatctgtg gaacaaatac tccacgcatg tatggtagtt ttgaaacgat cttgtatctt 7440
ccattgttgt agtaacaact aaataaagta caattgttca attattggga atcgtatttt 7500
ctgtagtgcc gatgtacagc atattcatag atgtctattt aggaactcaa attttaaatt 7560
gaggactagt tatttattgt gggtcagtct tttgaattgt gttatcttgc tgtactggcg 7620
cgccaccatg gccaccgccg ccgccgcgtc taccgcgctc actggcgcca ctaccgctgc 7680
gcccaaggcg aggcgccggg cgcacctcct ggccacccgc cgcgccctcg ccgcgcccat 7740
caggtgctca gcggcgtcac ccgccatgcc gatggctccc ccggccaccc cgctccggcc 7800
gtggggcccc accgatcccc gcaagggcgc cgacatcctc gtcgagtccc tcgagcgctg 7860
cggcgtccgc gacgtcttcg cctaccccgg cggcacgtcc atggagatcc accaggcact 7920
cacccgctcc cccgtcatcg ccaaccacct cttccgccac gagcaagggg aggcctttgc 7980
ggcctccggc tacgcgcgct cctcgggccg cgtcggcgtc tgcatcgcca cctccggccc 8040
cggcgccacc aaccttgtct ccgcgctcgc cgacgcgctg ctcgattccg tccccatggt 8100
cgccatcacg ggacaggtgc cgcgacgcat gattggcacc gacgccttcc aggagacgcc 8160
catcgtcgag gtcacccgct ccatcaccaa gcacaactac ctggtcctcg acgtcgacga 8220
catcccccgc gtcgtgcagg aggctttctt cctcgcctcc tctggtcgac cggggccggt 8280
gcttgtcgac atccccaagg acatccagca gcagatggcg gtgcctgtct gggacaagcc 8340
catgagtctg cctgggtaca ttgcgcgcct tcccaagccc cctgcgactg agttgcttga 8400
gcaggtgctg cgtcttgttg gtgaatcccg gcgccctgtt ctttatgttg gcggtggctg 8460
cgcagcatct ggtgaggagt tgcgacgctt tgtggagctg actggaatcc cggtcacaac 8520
tactcttatg ggcctcggca acttccccag cgacgaccca ctgtctctgc gcatgctagg 8580
tatgcatggc acggtgtatg caaattatgc agtggataag gccgatctgt tgcttgcact 8640
tggtgtgcgg tttgatgatc gtgtgacagg gaagattgag gcttttgcaa gcagggctaa 8700
gattgtgcac gttgatattg atccggctga gattggcaag aacaagcagc cacatgtgtc 8760
catctgtgca gatgttaagc ttgctttgca gggcatgaat gctcttcttg aaggaagcac 8820
atcaaagaag agctttgact ttggctcatg gaacgatgag ttggatcagc agaagaggga 8880
attccccctt gggtataaaa catctaatga ggagatccag ccacaatatg ctattcaggt 8940
tcttgatgag ctgacgaaag gcgaggccat catcggcaca ggtgttgggc agcaccagat 9000
gtgggcggca cagtactaca cttacaagcg gccaaggcag tggttgtctt cagctggtct 9060
tggggctatg ggatttggtt tgccggctgc tgctggtgct tctgtggcca acccaggtgt 9120
tactgttgtt gacatcgatg gagatggtag ctttctcatg aacgttcagg agctagctat 9180
gatccgaatt gagaacctcc cggtgaaggt ctttgtgcta aacaaccagc acctggggat 9240
ggtggtgcag tgggaggaca ggttctataa ggccaacaga gcgcacacat acttgggaaa 9300
cccagagaat gaaagtgaga tatatccaga tttcgtgacg atcgccaaag ggttcaacat 9360
tccagcggtc cgtgtgacaa agaagaacga agtccgcgca gcgataaaga agatgctcga 9420
gactccaggg ccgtacctct tggatataat cgtcccacac caggagcatg tgttgcctat 9480
gatccctaat ggtggggctt tcaaggatat gatcctggat ggtgatggca ggactgtgta 9540
ctagcctgca ggcctaggat cgttcaaaca tttggcaata aagtttctta agattgaatc 9600
ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt aagcatgtaa 9660
taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt agagtcccgc 9720
aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag gataaattat 9780
cgcgcgcggt gtcatctatg ttactagatc ggccggccgt ttaaacagcc tgcttttttg 9840
tacaaacttg atttaaatga attcaagctt ttaattaagc atgcgagctc ggcgcgccgg 9900
taccgcgatc gcggatcatg aaccaacggc ctggctgtat ttggtggttg tgtagggaga 9960
tggggagaag aaaagcccga ttctcttcgc tgtgatgggc tggatgcatg cgggggagcg 10020
ggaggcccaa gtacgtgcac ggtgagcggc ccacagggcg agtgtgagcg cgagaggcgg 10080
gaggaacagt ttagtaccac attgcccagc taactcgaac gcgaccaact tataaacccg 10140
cgcgctgtcg cttgtgtgac tgcaaaaggc aatgttcgtt ttagagctag aaatagcaag 10200
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgctctgttc 10260
ctcgtgctgg acaagtgtgg tttccagatt ctgcaaccaa gactgcgcag gcattgctgg 10320
acttcaaccg tgaaggatta cctctgttca tcctcgctaa ctggagaggc ttctctggtg 10380
gacaaagaga tctctttgaa ggaattcttc aggctggctc gactattgtt gagaacctta 10440
ggacatacaa tcagcctgcc tttgtctaca ttcccatggc tgcagagcta cgaggagggg 10500
cttgggttgt ggttgatagc aagataaacc cagaccgcat tgagtgctat gctgagagga 10560
ctgcaaaatc caatgttctc gaaccgcaag ggttaattga gatcaagttc aggtcagagg 10620
aactccagga ttgcatgagt cggcttgacc caacattaat tgatctgaaa gcaaaactcg 10680
aagtagcaaa taaaaatgga agtgctgaca caaaatcgct tcaagaaaat atagaagctc 10740
gaacaaaaca gttgatgcct ctatatactc agattgcgat acggtttgct gaattgcatg 10800
atacatccct cagaatggct gcgaaaggtg tgattaagaa agttgtggac tgggaagaat 10860
cacgatcttt cttttttttg cggccgcccc gggcctgcag gggatcccga tcgggccggc 10920
cgtttaaacc cactttgtac aagaaagctg ggtatttaaa tgaattcaag cttttaatta 10980
atgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat tgcatgtcta 11040
agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta 11100
tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt actacaataa 11160
tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga 11220
gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt 11280
ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca tccatttagg 11340
gtttagggtt aatggttttt atagactaat ttttttagta catctatttt attctatttt 11400
agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat agtttagata 11460
taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa 11520
aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga 11580
cgagtctaac ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga 11640
cggcacggca tctctgtcgc tgcctctgga cccctctcga gagttccgct ccaccgttgg 11700
acttgctccg ctgtcggcat ccagaaattg cgtggcggag cggcagacgt gagccggcac 11760
ggcaggcggc ctcctcctcc tctcacggca ccggcagcta cgggggattc ctttcccacc 11820
gctccttcgc tttcccttcc tcgcccgccg taataaatag acaccccctc cacaccctct 11880
ttccccaacc tcgtgttgtt cggagcgcac acacacacaa ccagatctcc cccaaatcca 11940
cccgtcggca cctccgcttc aaggtacgcc gctcgtcctc cccccccccc cccctctcta 12000
ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat 12060
gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 12120
acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 12180
gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 12240
atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 12300
tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 12360
tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 12420
tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 12480
ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 12540
ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 12600
tagaatactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 12660
atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 12720
atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 12780
gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttatttcgat 12840
cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 12900
ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 12960
gtgttacttc tgcagggcgc gccaccatgg ctcctaagaa gaagcggaag gttggtattc 13020
acggggtgcc tgcggctgac aagaagtact ccatcggcct cgacatcggc accaacagcg 13080
tcggctgggc ggtgatcacc gacgagtaca aggtcccgtc caagaagttc aaggtcctgg 13140
gcaacaccga ccgccactcc atcaagaaga acctcatcgg cgccctcctc ttcgactccg 13200
gcgagacggc ggaggcgacc cgcctcaagc gcaccgcccg ccgccgctac acccgccgca 13260
agaaccgcat ctgctacctc caggagatct tctccaacga gatggcgaag gtcgacgact 13320
ccttcttcca ccgcctcgag gagtccttcc tcgtggagga ggacaagaag cacgagcgcc 13380
accccatctt cggcaacatc gtcgacgagg tcgcctacca cgagaagtac cccactatct 13440
accaccttcg taagaagctt gttgactcta ctgataaggc tgatcttcgt ctcatctacc 13500
ttgctctcgc tcacatgatc aagttccgtg gtcacttcct tatcgagggt gaccttaacc 13560
ctgataactc cgacgtggac aagctcttca tccagctcgt ccagacctac aaccagctct 13620
tcgaggagaa ccctatcaac gcttccggtg tcgacgctaa ggcgatcctt tccgctaggc 13680
tctccaagtc caggcgtctc gagaacctca tcgcccagct ccctggtgag aagaagaacg 13740
gtcttttcgg taacctcatc gctctctccc tcggtctgac ccctaacttc aagtccaact 13800
tcgacctcgc tgaggacgct aagcttcagc tctccaagga tacctacgac gatgatctcg 13860
acaacctcct cgctcagatt ggagatcagt acgctgatct cttccttgct gctaagaacc 13920
tctccgatgc tatcctcctt tcggatatcc ttagggttaa cactgagatc actaaggctc 13980
ctctttctgc ttccatgatc aagcgctacg acgagcacca ccaggacctc accctcctca 14040
aggctcttgt tcgtcagcag ctccccgaga agtacaagga gatcttcttc gaccagtcca 14100
agaacggcta cgccggttac attgacggtg gagctagcca ggaggagttc tacaagttca 14160
tcaagccaat ccttgagaag atggatggta ctgaggagct tctcgttaag cttaaccgtg 14220
aggacctcct taggaagcag aggactttcg ataacggctc tatccctcac cagatccacc 14280
ttggtgagct tcacgccatc cttcgtaggc aggaggactt ctaccctttc ctcaaggaca 14340
accgtgagaa gatcgagaag atccttactt tccgtattcc ttactacgtt ggtcctcttg 14400
ctcgtggtaa ctcccgtttc gcttggatga ctaggaagtc cgaggagact atcacccctt 14460
ggaacttcga ggaggttgtt gacaagggtg cttccgccca gtccttcatc gagcgcatga 14520
ccaacttcga caagaacctc cccaacgaga aggtcctccc caagcactcc ctcctctacg 14580
agtacttcac ggtctacaac gagctcacca aggtcaagta cgtcaccgag ggtatgcgca 14640
agcctgcctt cctctccggc gagcagaaga aggctatcgt tgacctcctc ttcaagacca 14700
accgcaaggt caccgtcaag cagctcaagg aggactactt caagaagatc gagtgcttcg 14760
actccgtcga gatcagcggc gttgaggacc gtttcaacgc ttctctcggc acctaccacg 14820
atctcctcaa gatcatcaag gacaaggact tcctcgacaa cgaggagaac gaggacatcc 14880
tcgaggacat cgtcctcact cttactctct tcgaggatag ggagatgatc gaggagaggc 14940
tcaagactta cgctcatctc ttcgatgaca aggttatgaa gcagctcaag cgtcgccgtt 15000
acaccggttg gggtaggctc tcccgcaagc tcatcaacgg tatcagggat aagcagagcg 15060
gcaagactat cctcgacttc ctcaagtctg atggtttcgc taacaggaac ttcatgcagc 15120
tcatccacga tgactctctt accttcaagg aggatattca gaaggctcag gtgtccggtc 15180
agggcgactc tctccacgag cacattgcta accttgctgg ttcccctgct atcaagaagg 15240
gcatccttca gactgttaag gttgtcgatg agcttgtcaa ggttatgggt cgtcacaagc 15300
ctgagaacat cgtcatcgag atggctcgtg agaaccagac tacccagaag ggtcagaaga 15360
actcgaggga gcgcatgaag aggattgagg agggtatcaa ggagcttggt tctcagatcc 15420
ttaaggagca ccctgtcgag aacacccagc tccagaacga gaagctctac ctctactacc 15480
tccagaacgg tagggatatg tacgttgacc aggagctcga catcaacagg ctttctgact 15540
acgacgtcga ccacattgtt cctcagtctt tccttaagga tgactccatc gacaacaagg 15600
tcctcacgag gtccgacaag aacaggggta agtcggacaa cgtcccttcc gaggaggttg 15660
tcaagaagat gaagaactac tggaggcagc ttctcaacgc taagctcatt acccagagga 15720
agttcgacaa cctcacgaag gctgagaggg gtggcctttc cgagcttgac aaggctggtt 15780
tcatcaagag gcagcttgtt gagacgaggc agattaccaa gcacgttgct cagatcctcg 15840
attctaggat gaacaccaag tacgacgaga acgacaagct catccgcgag gtcaaggtga 15900
tcaccctcaa gtccaagctc gtctccgact tccgcaagga cttccagttc tacaaggtcc 15960
gcgagatcaa caactaccac cacgctcacg atgcttacct taacgctgtc gttggcaccg 16020
ctcttatcaa gaagtaccct aagcttgagt ccgagttcgt ctacggtgac tacaaggtct 16080
acgacgttcg taagatgatc gccaagtccg agcaggagat cggcaaggcc accgccaagt 16140
acttcttcta ctccaacatc atgaacttct tcaagaccga gatcaccctc gccaacggcg 16200
agatccgcaa gcgccctctt atcgagacga acggtgagac tggtgagatc gtttgggaca 16260
agggtcgcga cttcgctact gttcgcaagg tcctttctat gcctcaggtt aacatcgtca 16320
agaagaccga ggtccagacc ggtggcttct ccaaggagtc tatccttcca aagagaaact 16380
cggacaagct catcgctagg aagaaggatt gggaccctaa gaagtacggt ggtttcgact 16440
cccctactgt cgcctactcc gtcctcgtgg tcgccaaggt ggagaagggt aagtcgaaga 16500
agctcaagtc cgtcaaggag ctcctcggca tcaccatcat ggagcgctcc tccttcgaga 16560
agaacccgat cgacttcctc gaggccaagg gctacaagga ggtcaagaag gacctcatca 16620
tcaagctccc caagtactct cttttcgagc tcgagaacgg tcgtaagagg atgctggctt 16680
ccgctggtga gctccagaag ggtaacgagc ttgctcttcc ttccaagtac gtgaacttcc 16740
tctacctcgc ctcccactac gagaagctca agggttcccc tgaggataac gagcagaagc 16800
agctcttcgt ggagcagcac aagcactacc tcgacgagat catcgagcag atctccgagt 16860
tctccaagcg cgtcatcctc gctgacgcta acctcgacaa ggtcctctcc gcctacaaca 16920
agcaccgcga caagcccatc cgcgagcagg ccgagaacat catccacctc ttcacgctca 16980
cgaacctcgg cgcccctgct gctttcaagt acttcgacac caccatcgac aggaagcgtt 17040
acacgtccac caaggaggtt ctcgacgcta ctctcatcca ccagtccatc accggtcttt 17100
acgagactcg tatcgacctt tcccagcttg gtggtgataa gcgtcctgct gccaccaaaa 17160
aggccggaca ggctaagaaa aagaagtagc ctgcaggtcc tgctttaatg agatatgcga 17220
gacgcctatg atcgcatgat atttgctttc aattctgttg tgcacgttgt aaaaaacctg 17280
agcatgtgta gctcagatcc ttaccgccgg tttcggttca ttctaatgaa tatatcaccc 17340
gttactatcg tatttttatg aataatattc tccgttcaat ttactgattg taccctacta 17400
cttatatgta caatattaaa atgaaaacaa tatattgtgc tgaataggtt tatagcgaca 17460
tctatgatag agcgccacaa taacaaacaa ttgcgtttta ttattacaaa tccaatttta 17520
aaaaaagcgg cagaaccggt caaacctaaa agactgatta cataaatctt attcaaattt 17580
caaaagtgcc ccaggggcta gtatctacga cacaccgagc ggcgaactaa taacgctcac 17640
tgaagggaac tccggttccc cgccggcgcg catgggtgag attccttgaa gttgagtatt 17700
ggccgtccgc tctaccgaaa gttacgggca ccattcaacc cggtccagca cggcggccgg 17760
gtaaccgact tgctgccccg agaattatgc agcatttttt tggtgtatgt gggccccaaa 17820
tgaagtgcag gtcaaacctt gacagtgacg acaaatcgtt gggcgggtcc agggcgaatt 17880
ttgcgacaac atgtcgaggc tcagcaggcc ggccgtttaa accaacttta 17930
<210> 69
<211> 3755
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector CC020
<400> 69
cgcggatcat gaaccaacgg cctggctgta tttggtggtt gtgtagggag atggggagaa 60
gaaaagcccg attctcttcg ctgtgatggg ctggatgcat gcgggggagc gggaggccca 120
agtacgtgca cggtgagcgg cccacagggc gagtgtgagc gcgagaggcg ggaggaacag 180
tttagtacca cattgcccag ctaactcgaa cgcgaccaac ttataaaccc gcgcgctgtc 240
gcttgtgtgt gggttattga ttctgttggt tttagagcta gaaatagcaa gttaaaataa 300
ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgcattacg ttcagagctg 360
gatcatttgg cccaagggaa gatgcattct ttgaagctgt taccaaccta gcctgtgaga 420
agaaacttcc tcttatttat ttggcagcaa attctggtgc tcgaattggc atagcagatg 480
aagtgaaatc ttgcttccgt gttgggtggt ctgatgatgg cagccctgaa cgtgggtttc 540
agtacattta tctaagcgaa gaagactatg ctcgtattgg cacttctgtc atagcacata 600
agatgcagct agacagtggt gaaattaggt gggttattga ttctgttgtc ggcaaggaag 660
atggacttgg tgtggagaat ctccatggaa gtgctgctat tgccagtgct tattctaggg 720
catataagga gacatttaca cttacatttg tgactggaag aactgttgga ataggagctt 780
atcttgctcg acttggcatc cggtgcatac agcgtcttga ccagcctatt attcttacag 840
gctattctgc actgaacaag cttcttgggc gggaagtgta cagctcccac atgcagttgg 900
gtggtcccaa aatcatggca actaatggtg ttgtccatct tactgtttca gatgaccttg 960
aaggcgtttc taatatattg aggttttttt tgcggccgcc ccgggcctgc aggggatccc 1020
gatcgggccg gccgtttaaa cccactttgt acaagaaagt tgaacgagaa acgtaaaatg 1080
atataaatat caatatatta aattagattt tgcataaaaa acagactaca taatactgta 1140
aaacacaaca tatgcagtca ctatgaacca actacttaga tggtattagt gacctgtact 1200
gggcctcatg ggccttccgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 1260
tgcattaaca tggtcatagc tgtttccttg cgtattgggc gctctccgct tcctcgctca 1320
ctgactcgct gcgctcggtc gttcgggtaa agcctggggt gcctaatgag caaaaggcca 1380
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 1440
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 1500
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 1560
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 1620
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 1680
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 1740
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 1800
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 1860
aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 1920
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 1980
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 2040
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 2100
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 2160
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 2220
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 2280
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagaaccac gctcaccggc 2340
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 2400
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 2460
gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 2520
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 2580
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 2640
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 2700
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 2760
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 2820
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 2880
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 2940
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 3000
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 3060
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 3120
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctaaattgta 3180
agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac 3240
caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg 3300
agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt gggaagggcg 3360
tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 3420
gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 3480
agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca aggccgcatt 3540
acaggtcact aataccatct aagtagttgg ttcatagtga ctgcatatgt tgtgttttac 3600
agtattatgt agtctgtttt ttatgcaaaa tctaatttaa tatattgata tttatatcat 3660
tttacgtttc tcgttcaact tttttgtaca aacttgattt aaatgaattc aagcttttaa 3720
ttaagcatgc gagctcggcg cgccggtacc gcgat 3755
<210> 70
<211> 17951
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector RLW139
<400> 70
ttatacatag ttgataattc actgggccgg ccgtttaaac ttagttacta atcagtgatc 60
agattgtcgt ttcccgcctt cactttaaac tatcagtgtt tgacaggata tattggcggg 120
taaacctaag agaaaagagc gtttattaga ataatcggat atttaaaagg gcgtgaaaag 180
gtttatccgt tcgtccattt gtatgtcaat attggggggg ggggaaagcc acgttgtgtc 240
tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa caataaaact 300
gtctgcttac ataaacagta atacaagggg tgttcgccac catgagccat atccagcgtg 360
aaacctcgtg ctcccgcccg cgcctcaatt ccaatatgga tgccgacctt tatggctaca 420
agtgggcgcg cgacaacgtc ggccagtcgg gcgcgaccat ttatcggctt tatggcaaac 480
ccgatgcccc ggaactgttc ctgaagcacg gcaaaggcag cgtcgcaaac gatgtcaccg 540
atgagatggt ccgcctgaac tggcttaccg agttcatgcc gctgccgacg attaagcatt 600
tcatccgtac cccggacgat gcctggctct tgaccacggc cattccgggc aaaacggcct 660
ttcaggtcct tgaagagtac ccggactccg gtgagaatat cgtggacgcc ctcgcggtct 720
tcctccgccg tttgcatagc atccccgtgt gcaactgccc cttcaactcg gaccgggttt 780
tccgcctggc acaggcccag tcgcgcatga ataacggcct cgttgacgcg agcgatttcg 840
acgatgaacg gaatggctgg ccggtggaac aggtttggaa ggaaatgcac aaactgcttc 900
cgttctcgcc ggattcggtg gtcacgcatg gtgatttttc cctggataat ctgatctttg 960
acgagggcaa gctgatcggc tgcatcgacg tgggtcgcgt cggtatcgcc gaccgctatc 1020
aggacctggc gatcttgtgg aattgcctcg gcgagttctc gccctcgctc cagaagcgcc 1080
tgttccagaa gtacggcatc gacaacccgg atatgaacaa gctccagttc cacctcatgc 1140
tggacgaatt tttttgaaca gaattggtta attggttgta acactggcag agcattacgc 1200
tgacttgacg ggacggcggc tttgttgaat aaatcgaact tttgctgagt tgaaggatcg 1260
atgagttgaa ggaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 1320
gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 1380
atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 1440
atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc 1500
ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 1560
gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 1620
cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 1680
tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 1740
cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 1800
ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 1860
gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 1920
tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg 1980
ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc 2040
gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc 2100
atctgtgcgg tatttcacac cgcataggcc gcgataggcc gacgcgaagc ggcggggcgt 2160
agggagcgca gcgaccgaag ggtaggcgct ttttgcagct cttcggctgt gcgctggcca 2220
gacagttatg cacaggccag gcgggtttta agagttttaa taagttttaa agagttttag 2280
gcggaaaaat cgcctttttt ctcttttata tcagtcactt acatgtgtga ccggttccca 2340
atgtacggct ttgggttccc aatgtacggg ttccggttcc caatgtacgg ctttgggttc 2400
ccaatgtacg tgctatccac aggaaagaga ccttttcgac ctttttcccc tgctagggca 2460
atttgcccta gcatctgctc cgtacattag gaaccggcgg atgcttcgcc ctcgatcagg 2520
ttgcggtagc gcatgactag gatcgggcca gcctgccccg cctcctcctt caaatcgtac 2580
tccggcaggt catttgaccc gatcagcttg cgcacggtga aacagaactt cttgaactct 2640
ccggcgctgc cactgcgttc gtagatcgtc ttgaacaacc atctggcttc tgccttgcct 2700
gcggcgcggc gtgccaggcg gtagagaaaa cggccgatgc cggggtcgat caaaaagtaa 2760
tcggggtgaa ccgtcagcac gtccgggttc ttgccttctg tgatctcgcg gtacatccaa 2820
tcagcaagct cgatctcgat gtactccggc cgcccggttt cgctctttac gatcttgtag 2880
cggctaatca aggcttcacc ctcggatacc gtcaccaggc ggccgttctt ggccttcttg 2940
gtacgctgca tggcaacgtg cgtggtgttt aaccgaatgc aggtttctac caggtcgtct 3000
ttctgctttc cgccatcggc tcgccggcag aacttgagta cgtccgcaac gtgtggacgg 3060
aacacgcggc cgggcttgtc tcccttccct tcccggtatc ggttcatgga ttcggttaga 3120
tgggaaaccg ccatcagtac caggtcgtaa tcccacacac tggccatgcc ggcggggcct 3180
gcggaaacct ctacgtgccc gtctggaagc tcgtagcgga tcacctcgcc agctcgtcgg 3240
tcacgcttcg acagacggaa aacggccacg tccatgatgc tgcgactatc gcgggtgccc 3300
acgtcataga gcatcggaac gaaaaaatct ggttgctcgt cgcccttggg cggcttccta 3360
atcgacggcg caccggctgc cggcggttgc cgggattctt tgcggattcg atcagcggcc 3420
ccttgccacg attcaccggg gcgtgcttct gcctcgatgc gttgccgctg ggcggcctgc 3480
gcggccttca acttctccac caggtcatca cccagcgccg cgccgatttg taccgggccg 3540
gatggtttgc gaccgctcac gccgattcct cgggcttggg ggttccagtg ccattgcagg 3600
gccggcagac aacccagccg cttacgcctg gccaaccgcc cgttcctcca cacatggggc 3660
attccacggc gtcggtgcct ggttgttctt gattttccat gccgcctcct ttagccgcta 3720
aaattcatct actcatttat tcatttgctc atttactctg gtagctgcgc gatgtattca 3780
gatagcagct cggtaatggt cttgccttgg cgtaccgcgt acatcttcag cttggtgtga 3840
tcctccgccg gcaactgaaa gttgacccgc ttcatggctg gcgtgtctgc caggctggcc 3900
aacgttgcag ccttgctgct gcgtgcgctc ggacggccgg cacttagcgt gtttgtgctt 3960
ttgctcattt tctctttacc tcattaactc aaatgagttt tgatttaatt tcagcggcca 4020
gcgcctggac ctcgcgggca gcgtcgccct cgggttctga ttcaagaacg gttgtgccgg 4080
cggcggcagt gcctgggtag ctcacgcgct gcgtgatacg ggactcaaga atgggcagct 4140
cgtacccggc cagcgcctcg gcaacctcac cgccgatgcg cgtgcctttg atcgcccgcg 4200
acacgacaaa ggccgcttgt agccttccat ccgtgacctc aatgcgctgc ttaaccagct 4260
ccaccaggtc ggcggtggcc caaatgtcgt aagggcttgg ctgcaccgga atcagcacga 4320
agtcggctgc cttgatcgcg gacacagcca agtccgccgc ctggggcgct ccgtcgatca 4380
ctacgaagtc gcgccggccg atggccttca cgtcgcggtc aatcgtcggg cggtcgatgc 4440
cgacaacggt tagcggttga tcttcccgca cggccgccca atcgcgggca ctgccctggg 4500
gatcggaatc gactaacaga acatcggccc cggcgagttg cagggcgcgg gctagatggg 4560
ttgcgatggt cgtcttgcct gacccgcctt tctggttaag tacagcgata accttcatgc 4620
gttccccttg cgtatttgtt tatttactca tcgcatcata tacgcagcga ccgcatgacg 4680
caagctgttt tactcaaata cacatcacct ttttagatga tcagtgattt tgtgccgagc 4740
tgccggtcgg ggagctgttg gctggctggt ggcaggatat attgtggtgt aaacaaattg 4800
acgcttagac aacttaataa cacattgcgg acgtctttaa tgtactgaat ttagttactg 4860
atcactgatt aagtactgat aaatttaatt aacagatctc aactttgtat agaaaagttg 4920
atttaaatga attcaagctt ttaattaact tagccactgc aacaagttct tgaaccttag 4980
cacaatcata ttgtgcatgc acttgtttat tgcaaagaat ggtgcgtagg gaacacgcat 5040
gatttttgaa ttgctggcac ataattttat cattagaaac tggaatgcaa catgtaccct 5100
ttgtcatggt ttctttccga gacattgcac tgtttttttt aatcctatca ttatcataat 5160
gccaagaact ggtcaccaac cagcattttg catcatggtt agttgagctg tccccatgta 5220
tcaataggtg cattgtattg gtccaaaata taaatgcagt ggatgcaacc tatctcatgg 5280
ccgtcaacaa aagaaatcaa aagggaaatg caccatctta tatctccagt ttatatgaac 5340
agattggata agatcataag atcaagtggt ttatattatt ttgaggaata taacatggat 5400
tcatcctaat cactcgtcta ggcagtatgt gtattcatga tggatatggt actatactac 5460
ggagtttttt cttcacaaaa taacctgtta ttttgacctc caaccaaaca cgaattatac 5520
caaaaattgg gttatttcat ctatagtaca actctattat aaacatgcag taaattatcc 5580
tacacatata ccaaaattca agtgtaataa tcctaataca cagacttaaa aaacaaacta 5640
tttccttttt aagaaaagga aaaccatttt tttaacggaa ggaaaacaaa ttcgggtcaa 5700
ggcggaagcc agcgcgccac cccacgtcag cgaatacgga ggcgcggggt tgacggcgtc 5760
acccggtcct aacggcgacc aacaaaccag ccagaagaaa ttacagtaaa aaaaagtaaa 5820
ttgcactttg atccaccttt tattacccaa gtttcaattt ggaccaccct taaacctatc 5880
ttttcaaatt gggccgggtt gtggtttgga ctaccatgaa caacttttcg tcatgtctaa 5940
cttccctttc ggcaaacata tgaaccatat atagaggaga tcggccgtat actagagctg 6000
atgtgtttaa ggtcgttgat tgcacgagaa aaaaaaaatc caaatcgcaa caatagcaaa 6060
tttatctagt tcaaagtgaa aagatatgtt taaaggtagt ccaaagtaaa acttaggggc 6120
tgtttggttc ccagccatac tttaccatta cttgccaaca aaagttgcca caccttgtct 6180
aaggtgaggt gatcaaattg ttagccacaa cttactaagc ctaagggaat cttgccacac 6240
ttttttgagc cattgacacg tgggacttaa tttgttagag ggaaatcttg ccacaactgt 6300
ggctacaacc aaacacctgt caaatttgcc taaccttagg cgtggcaaac tgtggcaaag 6360
tgtggcttac aaccaaacac acccttagat aataaaatgt ggtccaaagc gtaattcact 6420
aaaaaaaaat caacgagacg tgtaccaaac ggagacaaac ggcatcttct cgaaatttcc 6480
caaccgctcg ctcgcccgcc tcgtcttccc ggaaaccgcg gtggtttcag cgtggcggat 6540
tctccaagca gacggagacg tcacggcacg ggactcctcc caccacccaa ccgccataaa 6600
taccagcccc ctcatctcct ctcctcgcat cagctccacc cccgaaaaat ttctccccaa 6660
tctcgcgagg ctctcgtcgt cgaatcgaat cctctcgcgt cctcaagctt ggcatccagg 6720
tacggatccg cgtcccatct ccctcacccc ccgtgttctt cgtgcctgct tctgggtcag 6780
atctgggtgg attcgcggtt gttggatgtg gggggctgtg tttatttgtc ggtggatctg 6840
gttgtctgga tctgcgtttt ctctgtcgta gttagcggat ctgatgaaat gtttagtgtt 6900
cgtgtatact ggtatggtgg atctggtcct aggatgcgtg gaatggatat atgtaggcga 6960
attggaggat ttattttgtg aattttgctg aaatgatagt tctaaacact ggatctgacc 7020
tcgggatgct gttaaatgtg gaaatcatgg tcgatgctgt catgaacatg gtgttcttat 7080
ggtagatctg agcaatgtat gtttcaaaat tgtttgtcac atggaaatgc tatggttcta 7140
gatgcaatag aatgatacat gccgagatcc cctctagttg atatgataga tcatgatgtt 7200
ttacagctat gtcatatgaa tatgttcatt tgttaccgat gtatttggat ctacttaaca 7260
tttccaaagc acgccgcgtt ctaattctag atctggtagt catgtttgta cacgtcaccc 7320
acctaataca aatacatatg tctagtgttt ggtgacactg cccgtcagat ctgttttttc 7380
cagatctgtg gaacaaatac tccacgcatg tatggtagtt ttgaaacgat cttgtatctt 7440
ccattgttgt agtaacaact aaataaagta caattgttca attattggga atcgtatttt 7500
ctgtagtgcc gatgtacagc atattcatag atgtctattt aggaactcaa attttaaatt 7560
gaggactagt tatttattgt gggtcagtct tttgaattgt gttatcttgc tgtactggcg 7620
cgccaccatg gccaccgccg ccgccgcgtc taccgcgctc actggcgcca ctaccgctgc 7680
gcccaaggcg aggcgccggg cgcacctcct ggccacccgc cgcgccctcg ccgcgcccat 7740
caggtgctca gcggcgtcac ccgccatgcc gatggctccc ccggccaccc cgctccggcc 7800
gtggggcccc accgatcccc gcaagggcgc cgacatcctc gtcgagtccc tcgagcgctg 7860
cggcgtccgc gacgtcttcg cctaccccgg cggcacgtcc atggagatcc accaggcact 7920
cacccgctcc cccgtcatcg ccaaccacct cttccgccac gagcaagggg aggcctttgc 7980
ggcctccggc tacgcgcgct cctcgggccg cgtcggcgtc tgcatcgcca cctccggccc 8040
cggcgccacc aaccttgtct ccgcgctcgc cgacgcgctg ctcgattccg tccccatggt 8100
cgccatcacg ggacaggtgc cgcgacgcat gattggcacc gacgccttcc aggagacgcc 8160
catcgtcgag gtcacccgct ccatcaccaa gcacaactac ctggtcctcg acgtcgacga 8220
catcccccgc gtcgtgcagg aggctttctt cctcgcctcc tctggtcgac cggggccggt 8280
gcttgtcgac atccccaagg acatccagca gcagatggcg gtgcctgtct gggacaagcc 8340
catgagtctg cctgggtaca ttgcgcgcct tcccaagccc cctgcgactg agttgcttga 8400
gcaggtgctg cgtcttgttg gtgaatcccg gcgccctgtt ctttatgttg gcggtggctg 8460
cgcagcatct ggtgaggagt tgcgacgctt tgtggagctg actggaatcc cggtcacaac 8520
tactcttatg ggcctcggca acttccccag cgacgaccca ctgtctctgc gcatgctagg 8580
tatgcatggc acggtgtatg caaattatgc agtggataag gccgatctgt tgcttgcact 8640
tggtgtgcgg tttgatgatc gtgtgacagg gaagattgag gcttttgcaa gcagggctaa 8700
gattgtgcac gttgatattg atccggctga gattggcaag aacaagcagc cacatgtgtc 8760
catctgtgca gatgttaagc ttgctttgca gggcatgaat gctcttcttg aaggaagcac 8820
atcaaagaag agctttgact ttggctcatg gaacgatgag ttggatcagc agaagaggga 8880
attccccctt gggtataaaa catctaatga ggagatccag ccacaatatg ctattcaggt 8940
tcttgatgag ctgacgaaag gcgaggccat catcggcaca ggtgttgggc agcaccagat 9000
gtgggcggca cagtactaca cttacaagcg gccaaggcag tggttgtctt cagctggtct 9060
tggggctatg ggatttggtt tgccggctgc tgctggtgct tctgtggcca acccaggtgt 9120
tactgttgtt gacatcgatg gagatggtag ctttctcatg aacgttcagg agctagctat 9180
gatccgaatt gagaacctcc cggtgaaggt ctttgtgcta aacaaccagc acctggggat 9240
ggtggtgcag tgggaggaca ggttctataa ggccaacaga gcgcacacat acttgggaaa 9300
cccagagaat gaaagtgaga tatatccaga tttcgtgacg atcgccaaag ggttcaacat 9360
tccagcggtc cgtgtgacaa agaagaacga agtccgcgca gcgataaaga agatgctcga 9420
gactccaggg ccgtacctct tggatataat cgtcccacac caggagcatg tgttgcctat 9480
gatccctaat ggtggggctt tcaaggatat gatcctggat ggtgatggca ggactgtgta 9540
ctagcctgca ggcctaggat cgttcaaaca tttggcaata aagtttctta agattgaatc 9600
ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt aagcatgtaa 9660
taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt agagtcccgc 9720
aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag gataaattat 9780
cgcgcgcggt gtcatctatg ttactagatc ggccggccgt ttaaacagcc tgcttttttg 9840
tacaaacttg atttaaatga attcaagctt ttaattaagc atgcgagctc ggcgcgccgg 9900
taccgcgatc gcggatcatg aaccaacggc ctggctgtat ttggtggttg tgtagggaga 9960
tggggagaag aaaagcccga ttctcttcgc tgtgatgggc tggatgcatg cgggggagcg 10020
ggaggcccaa gtacgtgcac ggtgagcggc ccacagggcg agtgtgagcg cgagaggcgg 10080
gaggaacagt ttagtaccac attgcccagc taactcgaac gcgaccaact tataaacccg 10140
cgcgctgtcg cttgtgtgtg ggttattgat tctgttggtt ttagagctag aaatagcaag 10200
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcattacgt 10260
tcagagctgg atcatttggc ccaagggaag atgcattctt tgaagctgtt accaacctag 10320
cctgtgagaa gaaacttcct cttatttatt tggcagcaaa ttctggtgct cgaattggca 10380
tagcagatga agtgaaatct tgcttccgtg ttgggtggtc tgatgatggc agccctgaac 10440
gtgggtttca gtacatttat ctaagcgaag aagactatgc tcgtattggc acttctgtca 10500
tagcacataa gatgcagcta gacagtggtg aaattaggtg ggttattgat tctgttgtcg 10560
gcaaggaaga tggacttggt gtggagaatc tccatggaag tgctgctatt gccagtgctt 10620
attctagggc atataaggag acatttacac ttacatttgt gactggaaga actgttggaa 10680
taggagctta tcttgctcga cttggcatcc ggtgcataca gcgtcttgac cagcctatta 10740
ttcttacagg ctattctgca ctgaacaagc ttcttgggcg ggaagtgtac agctcccaca 10800
tgcagttggg tggtcccaaa atcatggcaa ctaatggtgt tgtccatctt actgtttcag 10860
atgaccttga aggcgtttct aatatattga ggtttttttt gcggccgccc cgggcctgca 10920
ggggatcccg atcgggccgg ccgtttaaac ccactttgta caagaaagct gggtatttaa 10980
atgaattcaa gcttttaatt aatgcagtgc agcgtgaccc ggtcgtgccc ctctctagag 11040
ataatgagca ttgcatgtct aagttataaa aaattaccac atattttttt tgtcacactt 11100
gtttgaagtg cagtttatct atctttatac atatatttaa actttactct acgaataata 11160
taatctatag tactacaata atatcagtgt tttagagaat catataaatg aacagttaga 11220
catggtctaa aggacaattg agtattttga caacaggact ctacagtttt atctttttag 11280
tgtgcatgtg ttctcctttt tttttgcaaa tagcttcacc tatataatac ttcatccatt 11340
ttattagtac atccatttag ggtttagggt taatggtttt tatagactaa tttttttagt 11400
acatctattt tattctattt tagcctctaa attaagaaaa ctaaaactct attttagttt 11460
ttttatttaa tagtttagat ataaaataga ataaaataaa gtgactaaaa attaaacaaa 11520
taccctttaa gaaattaaaa aaactaagga aacatttttc ttgtttcgag tagataatgc 11580
cagcctgtta aacgccgtcg acgagtctaa cggacaccaa ccagcgaacc agcagcgtcg 11640
cgtcgggcca agcgaagcag acggcacggc atctctgtcg ctgcctctgg acccctctcg 11700
agagttccgc tccaccgttg gacttgctcc gctgtcggca tccagaaatt gcgtggcgga 11760
gcggcagacg tgagccggca cggcaggcgg cctcctcctc ctctcacggc accggcagct 11820
acgggggatt cctttcccac cgctccttcg ctttcccttc ctcgcccgcc gtaataaata 11880
gacaccccct ccacaccctc tttccccaac ctcgtgttgt tcggagcgca cacacacaca 11940
accagatctc ccccaaatcc acccgtcggc acctccgctt caaggtacgc cgctcgtcct 12000
cccccccccc ccccctctct accttctcta gatcggcgtt ccggtccatg gttagggccc 12060
ggtagttcta cttctgttca tgtttgtgtt agatccgtgt ttgtgttaga tccgtgctgc 12120
tagcgttcgt acacggatgc gacctgtacg tcagacacgt tctgattgct aacttgccag 12180
tgtttctctt tggggaatcc tgggatggct ctagccgttc cgcagacggg atcgatttca 12240
tgattttttt tgtttcgttg catagggttt ggtttgccct tttcctttat ttcaatatat 12300
gccgtgcact tgtttgtcgg gtcatctttt catgcttttt tttgtcttgg ttgtgatgat 12360
gtggtctggt tgggcggtcg ttctagatcg gagtagaatt ctgtttcaaa ctacctggtg 12420
gatttattaa ttttggatct gtatgtgtgt gccatacata ttcatagtta cgaattgaag 12480
atgatggatg gaaatatcga tctaggatag gtatacatgt tgatgcgggt tttactgatg 12540
catatacaga gatgcttttt gttcgcttgg ttgtgatgat gtggtgtggt tgggcggtcg 12600
ttcattcgtt ctagatcgga gtagaatact gtttcaaact acctggtgta tttattaatt 12660
ttggaactgt atgtgtgtgt catacatctt catagttacg agtttaagat ggatggaaat 12720
atcgatctag gataggtata catgttgatg tgggttttac tgatgcatat acatgatggc 12780
atatgcagca tctattcata tgctctaacc ttgagtacct atctattata ataaacaagt 12840
atgttttata attatttcga tcttgatata cttggatgat ggcatatgca gcagctatat 12900
gtggattttt ttagccctgc cttcatacgc tatttatttg cttggtactg tttcttttgt 12960
cgatgctcac cctgttgttt ggtgttactt ctgcagggcg cgccaccatg gctcctaaga 13020
agaagcggaa ggttggtatt cacggggtgc ctgcggctga caagaagtac tccatcggcc 13080
tcgacatcgg caccaacagc gtcggctggg cggtgatcac cgacgagtac aaggtcccgt 13140
ccaagaagtt caaggtcctg ggcaacaccg accgccactc catcaagaag aacctcatcg 13200
gcgccctcct cttcgactcc ggcgagacgg cggaggcgac ccgcctcaag cgcaccgccc 13260
gccgccgcta cacccgccgc aagaaccgca tctgctacct ccaggagatc ttctccaacg 13320
agatggcgaa ggtcgacgac tccttcttcc accgcctcga ggagtccttc ctcgtggagg 13380
aggacaagaa gcacgagcgc caccccatct tcggcaacat cgtcgacgag gtcgcctacc 13440
acgagaagta ccccactatc taccaccttc gtaagaagct tgttgactct actgataagg 13500
ctgatcttcg tctcatctac cttgctctcg ctcacatgat caagttccgt ggtcacttcc 13560
ttatcgaggg tgaccttaac cctgataact ccgacgtgga caagctcttc atccagctcg 13620
tccagaccta caaccagctc ttcgaggaga accctatcaa cgcttccggt gtcgacgcta 13680
aggcgatcct ttccgctagg ctctccaagt ccaggcgtct cgagaacctc atcgcccagc 13740
tccctggtga gaagaagaac ggtcttttcg gtaacctcat cgctctctcc ctcggtctga 13800
cccctaactt caagtccaac ttcgacctcg ctgaggacgc taagcttcag ctctccaagg 13860
atacctacga cgatgatctc gacaacctcc tcgctcagat tggagatcag tacgctgatc 13920
tcttccttgc tgctaagaac ctctccgatg ctatcctcct ttcggatatc cttagggtta 13980
acactgagat cactaaggct cctctttctg cttccatgat caagcgctac gacgagcacc 14040
accaggacct caccctcctc aaggctcttg ttcgtcagca gctccccgag aagtacaagg 14100
agatcttctt cgaccagtcc aagaacggct acgccggtta cattgacggt ggagctagcc 14160
aggaggagtt ctacaagttc atcaagccaa tccttgagaa gatggatggt actgaggagc 14220
ttctcgttaa gcttaaccgt gaggacctcc ttaggaagca gaggactttc gataacggct 14280
ctatccctca ccagatccac cttggtgagc ttcacgccat ccttcgtagg caggaggact 14340
tctacccttt cctcaaggac aaccgtgaga agatcgagaa gatccttact ttccgtattc 14400
cttactacgt tggtcctctt gctcgtggta actcccgttt cgcttggatg actaggaagt 14460
ccgaggagac tatcacccct tggaacttcg aggaggttgt tgacaagggt gcttccgccc 14520
agtccttcat cgagcgcatg accaacttcg acaagaacct ccccaacgag aaggtcctcc 14580
ccaagcactc cctcctctac gagtacttca cggtctacaa cgagctcacc aaggtcaagt 14640
acgtcaccga gggtatgcgc aagcctgcct tcctctccgg cgagcagaag aaggctatcg 14700
ttgacctcct cttcaagacc aaccgcaagg tcaccgtcaa gcagctcaag gaggactact 14760
tcaagaagat cgagtgcttc gactccgtcg agatcagcgg cgttgaggac cgtttcaacg 14820
cttctctcgg cacctaccac gatctcctca agatcatcaa ggacaaggac ttcctcgaca 14880
acgaggagaa cgaggacatc ctcgaggaca tcgtcctcac tcttactctc ttcgaggata 14940
gggagatgat cgaggagagg ctcaagactt acgctcatct cttcgatgac aaggttatga 15000
agcagctcaa gcgtcgccgt tacaccggtt ggggtaggct ctcccgcaag ctcatcaacg 15060
gtatcaggga taagcagagc ggcaagacta tcctcgactt cctcaagtct gatggtttcg 15120
ctaacaggaa cttcatgcag ctcatccacg atgactctct taccttcaag gaggatattc 15180
agaaggctca ggtgtccggt cagggcgact ctctccacga gcacattgct aaccttgctg 15240
gttcccctgc tatcaagaag ggcatccttc agactgttaa ggttgtcgat gagcttgtca 15300
aggttatggg tcgtcacaag cctgagaaca tcgtcatcga gatggctcgt gagaaccaga 15360
ctacccagaa gggtcagaag aactcgaggg agcgcatgaa gaggattgag gagggtatca 15420
aggagcttgg ttctcagatc cttaaggagc accctgtcga gaacacccag ctccagaacg 15480
agaagctcta cctctactac ctccagaacg gtagggatat gtacgttgac caggagctcg 15540
acatcaacag gctttctgac tacgacgtcg accacattgt tcctcagtct ttccttaagg 15600
atgactccat cgacaacaag gtcctcacga ggtccgacaa gaacaggggt aagtcggaca 15660
acgtcccttc cgaggaggtt gtcaagaaga tgaagaacta ctggaggcag cttctcaacg 15720
ctaagctcat tacccagagg aagttcgaca acctcacgaa ggctgagagg ggtggccttt 15780
ccgagcttga caaggctggt ttcatcaaga ggcagcttgt tgagacgagg cagattacca 15840
agcacgttgc tcagatcctc gattctagga tgaacaccaa gtacgacgag aacgacaagc 15900
tcatccgcga ggtcaaggtg atcaccctca agtccaagct cgtctccgac ttccgcaagg 15960
acttccagtt ctacaaggtc cgcgagatca acaactacca ccacgctcac gatgcttacc 16020
ttaacgctgt cgttggcacc gctcttatca agaagtaccc taagcttgag tccgagttcg 16080
tctacggtga ctacaaggtc tacgacgttc gtaagatgat cgccaagtcc gagcaggaga 16140
tcggcaaggc caccgccaag tacttcttct actccaacat catgaacttc ttcaagaccg 16200
agatcaccct cgccaacggc gagatccgca agcgccctct tatcgagacg aacggtgaga 16260
ctggtgagat cgtttgggac aagggtcgcg acttcgctac tgttcgcaag gtcctttcta 16320
tgcctcaggt taacatcgtc aagaagaccg aggtccagac cggtggcttc tccaaggagt 16380
ctatccttcc aaagagaaac tcggacaagc tcatcgctag gaagaaggat tgggacccta 16440
agaagtacgg tggtttcgac tcccctactg tcgcctactc cgtcctcgtg gtcgccaagg 16500
tggagaaggg taagtcgaag aagctcaagt ccgtcaagga gctcctcggc atcaccatca 16560
tggagcgctc ctccttcgag aagaacccga tcgacttcct cgaggccaag ggctacaagg 16620
aggtcaagaa ggacctcatc atcaagctcc ccaagtactc tcttttcgag ctcgagaacg 16680
gtcgtaagag gatgctggct tccgctggtg agctccagaa gggtaacgag cttgctcttc 16740
cttccaagta cgtgaacttc ctctacctcg cctcccacta cgagaagctc aagggttccc 16800
ctgaggataa cgagcagaag cagctcttcg tggagcagca caagcactac ctcgacgaga 16860
tcatcgagca gatctccgag ttctccaagc gcgtcatcct cgctgacgct aacctcgaca 16920
aggtcctctc cgcctacaac aagcaccgcg acaagcccat ccgcgagcag gccgagaaca 16980
tcatccacct cttcacgctc acgaacctcg gcgcccctgc tgctttcaag tacttcgaca 17040
ccaccatcga caggaagcgt tacacgtcca ccaaggaggt tctcgacgct actctcatcc 17100
accagtccat caccggtctt tacgagactc gtatcgacct ttcccagctt ggtggtgata 17160
agcgtcctgc tgccaccaaa aaggccggac aggctaagaa aaagaagtag cctgcaggtc 17220
ctgctttaat gagatatgcg agacgcctat gatcgcatga tatttgcttt caattctgtt 17280
gtgcacgttg taaaaaacct gagcatgtgt agctcagatc cttaccgccg gtttcggttc 17340
attctaatga atatatcacc cgttactatc gtatttttat gaataatatt ctccgttcaa 17400
tttactgatt gtaccctact acttatatgt acaatattaa aatgaaaaca atatattgtg 17460
ctgaataggt ttatagcgac atctatgata gagcgccaca ataacaaaca attgcgtttt 17520
attattacaa atccaatttt aaaaaaagcg gcagaaccgg tcaaacctaa aagactgatt 17580
acataaatct tattcaaatt tcaaaagtgc cccaggggct agtatctacg acacaccgag 17640
cggcgaacta ataacgctca ctgaagggaa ctccggttcc ccgccggcgc gcatgggtga 17700
gattccttga agttgagtat tggccgtccg ctctaccgaa agttacgggc accattcaac 17760
ccggtccagc acggcggccg ggtaaccgac ttgctgcccc gagaattatg cagcattttt 17820
ttggtgtatg tgggccccaa atgaagtgca ggtcaaacct tgacagtgac gacaaatcgt 17880
tgggcgggtc cagggcgaat tttgcgacaa catgtcgagg ctcagcaggc cggccgttta 17940
aaccaacttt a 17951
<210> 71
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Signal
<400> 71
Met Ser Glu Arg Lys Arg Arg Glu Lys Leu
1 5 10
<210> 72
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Signal
<400> 72
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 73
<211> 377
<212> DNA
<213> Oryza sativa
<220>
<223> U3 snRNA promoter
<400> 73
aagggatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaggaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtggagtaa gataaactgt aggagaaaag catttcgtag tgggccatga 240
agcctttcag gacatgtatt gcagtatggg ccggcccatt acgcaattgg acgacaacaa 300
agactagtat tagtaccacc tcggctatcc acatagatca aagctggttt aaaagagttg 360
tgcagatgat ccgtggc 377
Claims (13)
- 細胞中の標的核酸(標的NA)分子を改変するための方法であって、
a.少なくとも1つのドナー核酸(doNA)分子に共有結合により連結されたガイド核酸(gNA)分子を含む組換え融合核酸(fuNA)分子を用意する工程、及び
b.前記fuNA分子を、標的NA分子を含む1つ以上の細胞に導入する工程、及び
c.部位特異的核酸改変ポリペプチドを前記1つ以上の細胞に導入する工程、及び
d.前記1つ以上の細胞を、前記1つ以上の細胞において相同組換えを可能にする条件下でインキュベートする工程、及び場合によって
e.相同組換えが起きた1つ以上の細胞を単離する工程
を含み、
fuNAはRNAからなる、方法。 - gNA分子が、標的NA分子の同数の連続する塩基と相補的な少なくとも12塩基を含むスペーサー核酸(スペーサーNA)分子を含む、請求項1に記載の方法。
- gNA分子がスキャフォールド核酸(スキャフォールドNA)分子をさらに含む、請求項2に記載の方法。
- スキャフォールドNA分子がgNA分子に共有結合している、請求項3に記載の方法。
- 細胞が、微生物、動物、ヒト又は植物細胞である、請求項1~4のいずれか一項に記載の方法。
- 部位特異的核酸改変ポリペプチドが、核酸にガイドされた核酸改変ポリペプチド又はその機能的等価物である、請求項1~5のいずれか一項に記載の方法。
- fuNA分子が、前記fuNA分子をコードする1つ以上の発現構築物として導入される、請求項1~6のいずれか一項に記載の方法。
- gNA分子に共有結合により連結したdoNA分子を含み組換えfuNA分子であって、fuNAがRNAからなる、fuNA分子。
- 請求項8に記載のfuNA分子をコードするDNA分子に機能的に連結されたプロモーターを含む発現構築物を含むベクター。
- a.請求項9に記載のベクター及び
b.部位特異的核酸改変ポリペプチドをコードするベクター、及び場合により
c.スキャフォールドNA分子をコードするベクター
を含む、ベクターシステム。 - 細胞内の標的NAを改変するためのシステムであって、
a.請求項9に記載のベクター及び
b.部位特異的核酸改変ポリペプチドをコードするベクター、及び
c.標的NA分子を含む細胞、及び場合により
d.スキャフォールドNA分子をコードするベクター
を含む、システム。 - a.請求項9に記載のベクター及び
b.部位特異的核酸改変ポリペプチドをコードするベクター、及び
c.標的NA分子を含む細胞、並びに場合により
d.スキャフォールドNA分子をコードするベクター
を含む、組成物。 - 細胞内の標的NA分子を改変するための、請求項9に記載のベクター、請求項10に記載のベクターシステム、請求項11に記載のシステム又は請求項12に記載の組成物の使用。
Applications Claiming Priority (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16167774 | 2016-04-29 | ||
EP16167773.7 | 2016-04-29 | ||
EP16167774.5 | 2016-04-29 | ||
EP16167773 | 2016-04-29 | ||
EP17156018.8 | 2017-02-14 | ||
EP17156018 | 2017-02-14 | ||
JP2018555963A JP7184648B2 (ja) | 2016-04-29 | 2017-04-20 | 標的核酸の改変のための改善された方法 |
PCT/EP2017/059331 WO2017186550A1 (en) | 2016-04-29 | 2017-04-20 | Improved methods for modification of target nucleic acids |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018555963A Division JP7184648B2 (ja) | 2016-04-29 | 2017-04-20 | 標的核酸の改変のための改善された方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023018093A true JP2023018093A (ja) | 2023-02-07 |
Family
ID=58640844
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018555963A Active JP7184648B2 (ja) | 2016-04-29 | 2017-04-20 | 標的核酸の改変のための改善された方法 |
JP2022187824A Pending JP2023018093A (ja) | 2016-04-29 | 2022-11-24 | 標的核酸の改変のための改善された方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018555963A Active JP7184648B2 (ja) | 2016-04-29 | 2017-04-20 | 標的核酸の改変のための改善された方法 |
Country Status (13)
Country | Link |
---|---|
US (5) | US11608499B2 (ja) |
EP (5) | EP4166660A1 (ja) |
JP (2) | JP7184648B2 (ja) |
KR (3) | KR20230038804A (ja) |
CN (1) | CN109072207A (ja) |
AU (5) | AU2017256517B2 (ja) |
BR (1) | BR112018068934A2 (ja) |
CA (1) | CA3022475A1 (ja) |
CL (1) | CL2018003074A1 (ja) |
DK (1) | DK3448990T5 (ja) |
IL (1) | IL262409A (ja) |
MX (2) | MX2018013256A (ja) |
WO (1) | WO2017186550A1 (ja) |
Families Citing this family (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3613852A3 (en) | 2011-07-22 | 2020-04-22 | President and Fellows of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9737604B2 (en) | 2013-09-06 | 2017-08-22 | President And Fellows Of Harvard College | Use of cationic lipids to deliver CAS9 |
US9340799B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | MRNA-sensing switchable gRNAs |
US9322037B2 (en) | 2013-09-06 | 2016-04-26 | President And Fellows Of Harvard College | Cas9-FokI fusion proteins and uses thereof |
US20150166982A1 (en) | 2013-12-12 | 2015-06-18 | President And Fellows Of Harvard College | Methods for correcting pi3k point mutations |
WO2016022363A2 (en) | 2014-07-30 | 2016-02-11 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
WO2016073990A2 (en) | 2014-11-07 | 2016-05-12 | Editas Medicine, Inc. | Methods for improving crispr/cas-mediated genome-editing |
EP3786294A1 (en) | 2015-09-24 | 2021-03-03 | Editas Medicine, Inc. | Use of exonucleases to improve crispr/cas-mediated genome editing |
JP7109784B2 (ja) | 2015-10-23 | 2022-08-01 | プレジデント アンド フェローズ オブ ハーバード カレッジ | 遺伝子編集のための進化したCas9蛋白質 |
US11597924B2 (en) | 2016-03-25 | 2023-03-07 | Editas Medicine, Inc. | Genome editing systems comprising repair-modulating enzyme molecules and methods of their use |
WO2017180694A1 (en) | 2016-04-13 | 2017-10-19 | Editas Medicine, Inc. | Cas9 fusion molecules gene editing systems, and methods of use thereof |
WO2018027078A1 (en) | 2016-08-03 | 2018-02-08 | President And Fellows Of Harard College | Adenosine nucleobase editors and uses thereof |
US11661590B2 (en) | 2016-08-09 | 2023-05-30 | President And Fellows Of Harvard College | Programmable CAS9-recombinase fusion proteins and uses thereof |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
WO2018071663A1 (en) * | 2016-10-14 | 2018-04-19 | Emendobio Inc. | Rna compositions for genome editing |
WO2018071868A1 (en) | 2016-10-14 | 2018-04-19 | President And Fellows Of Harvard College | Aav delivery of nucleobase editors |
WO2018094356A2 (en) * | 2016-11-18 | 2018-05-24 | Genedit Inc. | Compositions and methods for target nucleic acid modification |
WO2018119359A1 (en) | 2016-12-23 | 2018-06-28 | President And Fellows Of Harvard College | Editing of ccr5 receptor gene to protect against hiv infection |
WO2018138385A1 (en) * | 2017-01-30 | 2018-08-02 | Kws Saat Se | Repair template linkage to endonucleases for genome engineering |
WO2018165504A1 (en) | 2017-03-09 | 2018-09-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
KR20190127797A (ko) | 2017-03-10 | 2019-11-13 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 시토신에서 구아닌으로의 염기 편집제 |
CA3057192A1 (en) | 2017-03-23 | 2018-09-27 | President And Fellows Of Harvard College | Nucleobase editors comprising nucleic acid programmable dna binding proteins |
US11560566B2 (en) | 2017-05-12 | 2023-01-24 | President And Fellows Of Harvard College | Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation |
CA3067382A1 (en) | 2017-06-15 | 2018-12-20 | The Regents Of The University Of California | Targeted non-viral dna insertions |
EP3652312A1 (en) | 2017-07-14 | 2020-05-20 | Editas Medicine, Inc. | Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites |
US11732274B2 (en) | 2017-07-28 | 2023-08-22 | President And Fellows Of Harvard College | Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE) |
US11319532B2 (en) | 2017-08-30 | 2022-05-03 | President And Fellows Of Harvard College | High efficiency base editors comprising Gam |
CA3082251A1 (en) | 2017-10-16 | 2019-04-25 | The Broad Institute, Inc. | Uses of adenosine base editors |
BR112020008201A2 (pt) | 2017-10-27 | 2020-10-06 | The Regents Of The University Of California | substituição-alvo de receptores de células t endógenos |
US11268092B2 (en) | 2018-01-12 | 2022-03-08 | GenEdit, Inc. | Structure-engineered guide RNA |
KR102298105B1 (ko) | 2019-01-08 | 2021-09-03 | 주식회사 엘지에너지솔루션 | 스웰링 게이지를 구비한 배터리 모듈 및 이를 포함하는 배터리 팩 |
MX2021011426A (es) | 2019-03-19 | 2022-03-11 | Broad Inst Inc | Metodos y composiciones para editar secuencias de nucleótidos. |
WO2021175759A1 (en) | 2020-03-04 | 2021-09-10 | Basf Se | Method for the production of constitutive bacterial promoters conferring low to medium expression |
WO2021175756A1 (en) | 2020-03-04 | 2021-09-10 | Basf Se | Shuttle vector for expression in e. coli and bacilli |
IL297761A (en) | 2020-05-08 | 2022-12-01 | Broad Inst Inc | Methods and compositions for simultaneously editing two helices of a designated double-helix nucleotide sequence |
CN112111505B (zh) * | 2020-09-17 | 2022-03-15 | 江南大学 | 一种氧化葡萄糖酸杆菌中基因敲除的方法 |
WO2022251179A1 (en) * | 2021-05-26 | 2022-12-01 | Inscripta, Inc. | Crispr editing in diploid genomes |
WO2023019164A2 (en) * | 2021-08-11 | 2023-02-16 | The Board Of Trustees Of The Leland Stanford Junior University | High-throughput precision genome editing in human cells |
WO2023114872A2 (en) * | 2021-12-14 | 2023-06-22 | The Broad Institute, Inc. | Reprogrammable fanzor polynucleotides and uses thereof |
TW202342756A (zh) | 2022-03-01 | 2023-11-01 | 美商巴斯夫農業解決方案種子美國有限責任公司 | Cas12a切口酶 |
CN114774420B (zh) * | 2022-04-27 | 2023-09-22 | 扬州大学 | 一种水稻增强子及基于CRISPR/Cas9技术评估水稻增强子活性的方法 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69425903T2 (de) | 1993-12-09 | 2001-02-15 | Thomas Jefferson University Ph | Verbindungen und verfahren zur ortsspezifischen mutation in eukaryotischen zellen |
US6027945A (en) | 1997-01-21 | 2000-02-22 | Promega Corporation | Methods of isolating biological target materials using silica magnetic particles |
US6555732B1 (en) | 1998-09-14 | 2003-04-29 | Pioneer Hi-Bred International, Inc. | Rac-like genes and methods of use |
EP1152058A1 (en) | 2000-05-03 | 2001-11-07 | Institut Curie | Methods and compositions for effecting homologous recombination |
PL2325332T3 (pl) | 2005-08-26 | 2013-03-29 | Dupont Nutrition Biosci Aps | Zastosowanie genów związanych z CRISPR (genów CAS) |
AU2014235794A1 (en) * | 2013-03-14 | 2015-10-22 | Caribou Biosciences, Inc. | Compositions and methods of nucleic acid-targeting nucleic acids |
RU2725502C2 (ru) | 2013-06-17 | 2020-07-02 | Те Брод Инститьют Инк. | Доставка, конструирование и оптимизация систем, способы и композиции для целенаправленного воздействия и моделирования заболеваний и нарушений постмитотических клеток |
US10563225B2 (en) * | 2013-07-26 | 2020-02-18 | President And Fellows Of Harvard College | Genome engineering |
BR112016002835A2 (pt) | 2013-08-12 | 2017-09-19 | Basf Agro Bv | Plantas, semente, células vegetais, produtos vegetais, prole ou planta descendente derivada de uma planta, método de controle de ervas, método de produção de planta, método de produção de plantas de prole, método de produção de produtos vegetais, método de cultivo da planta, combinação útil para controle de ervas, processos de preparação da combinação útil para controle de ervas e uso da combinação |
EP3083968A4 (en) | 2013-12-18 | 2017-10-11 | BASF Agro B.V. | Plants having increased tolerance to herbicides |
CA2951707A1 (en) | 2014-06-10 | 2015-12-17 | Massachusetts Institute Of Technology | Method for gene editing |
WO2016065364A1 (en) * | 2014-10-24 | 2016-04-28 | Life Technologies Corporation | Compositions and methods for enhancing homologous recombination |
EP3294879A4 (en) | 2015-05-14 | 2019-02-20 | University of Southern California | OPTIMIZED GENETIZATION WITH A RECOMBINANT ENDONUCLEASE SYSTEM |
WO2017024047A1 (en) | 2015-08-03 | 2017-02-09 | Emendobio Inc. | Compositions and methods for increasing nuclease induced recombination rate in cells |
CA2998287A1 (en) * | 2015-09-24 | 2017-04-20 | Crispr Therapeutics Ag | Novel family of rna-programmable endonucleases and their uses in genome editing and other applications |
EP3356520B1 (en) * | 2015-10-02 | 2022-03-23 | The U.S.A. as represented by the Secretary, Department of Health and Human Services | Lentiviral protein delivery system for rna-guided genome editing |
CN106811479B (zh) | 2015-11-30 | 2019-10-25 | 中国农业科学院作物科学研究所 | 利用CRISPR/Cas9系统定点修饰ALS基因获得抗除草剂水稻的系统及其应用 |
WO2017180711A1 (en) * | 2016-04-13 | 2017-10-19 | Editas Medicine, Inc. | Grna fusion molecules, gene editing systems, and methods of use thereof |
WO2018094356A2 (en) * | 2016-11-18 | 2018-05-24 | Genedit Inc. | Compositions and methods for target nucleic acid modification |
-
2017
- 2017-04-20 EP EP22193652.9A patent/EP4166660A1/en not_active Withdrawn
- 2017-04-20 EP EP22193659.4A patent/EP4166662A1/en not_active Withdrawn
- 2017-04-20 DK DK17720040.9T patent/DK3448990T5/da active
- 2017-04-20 EP EP21162462.2A patent/EP3868880A1/en active Pending
- 2017-04-20 KR KR1020237007132A patent/KR20230038804A/ko not_active Application Discontinuation
- 2017-04-20 CN CN201780025990.6A patent/CN109072207A/zh active Pending
- 2017-04-20 EP EP22193654.5A patent/EP4166661A1/en active Pending
- 2017-04-20 JP JP2018555963A patent/JP7184648B2/ja active Active
- 2017-04-20 EP EP17720040.9A patent/EP3448990B1/en not_active Revoked
- 2017-04-20 MX MX2018013256A patent/MX2018013256A/es unknown
- 2017-04-20 AU AU2017256517A patent/AU2017256517B2/en active Active
- 2017-04-20 WO PCT/EP2017/059331 patent/WO2017186550A1/en active Application Filing
- 2017-04-20 KR KR1020227006922A patent/KR102506185B1/ko active IP Right Grant
- 2017-04-20 CA CA3022475A patent/CA3022475A1/en active Pending
- 2017-04-20 KR KR1020187030717A patent/KR102370675B1/ko active IP Right Grant
- 2017-04-20 BR BR112018068934A patent/BR112018068934A2/pt unknown
- 2017-04-20 US US16/097,300 patent/US11608499B2/en active Active
-
2018
- 2018-10-16 IL IL262409A patent/IL262409A/en unknown
- 2018-10-29 MX MX2021009235A patent/MX2021009235A/es unknown
- 2018-10-29 CL CL2018003074A patent/CL2018003074A1/es unknown
-
2022
- 2022-09-16 US US17/933,005 patent/US20230183686A1/en active Pending
- 2022-09-16 US US17/933,003 patent/US20230024869A1/en active Pending
- 2022-09-16 US US17/933,015 patent/US20230049124A1/en active Pending
- 2022-09-16 US US17/933,023 patent/US20230107997A1/en active Pending
- 2022-11-04 AU AU2022100155A patent/AU2022100155A4/en active Active
- 2022-11-04 AU AU2022100157A patent/AU2022100157A4/en active Active
- 2022-11-04 AU AU2022100158A patent/AU2022100158A4/en active Active
- 2022-11-14 AU AU2022100170A patent/AU2022100170A4/en active Active
- 2022-11-24 JP JP2022187824A patent/JP2023018093A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102506185B1 (ko) | 표적 핵산의 변형을 위한 개선된 방법 | |
AU2023226754A1 (en) | Compositions and methods for modifying genomes | |
CN101939434B (zh) | 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因 | |
CN108026523B (zh) | 向导rna组装载体 | |
DK2087106T3 (en) | MUTATING DELTA8 DESATURATION GENES CONSTRUCTED BY TARGETED MUTAGENES AND USE THEREOF IN THE MANUFACTURE OF MULTI-Saturated FAT ACIDS | |
CN109563505A (zh) | 用于真核细胞的组装系统 | |
DK2576605T3 (en) | PREPARATION OF METABOLITES | |
CN101365788B (zh) | Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途 | |
KR20120099509A (ko) | 재조합 숙주 세포에서 육탄당 키나아제의 발현 | |
DK2087105T3 (da) | Delta 17-desaturase og anvendelse heraf ved fremstilling af flerumættede fedtsyrer | |
KR20130132405A (ko) | 형질전환 빈도를 증가시키기 위해 변형된 아그로박테리움 균주 | |
KR20180081618A (ko) | 유전자 편집에 의한 인간 디스트로핀 유전자의 교정을 위한 치료용 표적 및 사용 방법 | |
KR20070085669A (ko) | 고농도의 아라키돈산을 생성하는 야로위아 리폴리티카 균주 | |
KR20140092759A (ko) | 숙주 세포 및 아이소부탄올의 제조 방법 | |
KR20140099224A (ko) | 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법 | |
KR20100118973A (ko) | 이소프렌을 생성하기 위한 조성물 및 방법 | |
CN108779480A (zh) | 生产鞘氨醇碱和鞘脂类的方法 | |
KR20120034652A (ko) | 유전적으로 변형된 미생물을 발생시키는 방법 | |
KR20130138760A (ko) | 고농도의 에이코사펜타엔산 생성을 위한 재조합 미생물 숙주 세포 | |
CN109996874A (zh) | 10-甲基硬脂酸的异源性产生 | |
CN107868780B (zh) | 在大于10kb环状DNA分子上实现定点突变的方法 | |
CN115698297A (zh) | 多模块生物合成酶基因组合文库的制备方法 | |
US11001859B2 (en) | Recombinantly-modified adeno-associated virus helper vectors and their use to improve the packaging efficiency of recombinantly-modified adeno-associated virus | |
CN113518825A (zh) | Wiskott-aldrich综合征的造血干细胞基因疗法 | |
BRPI0616533A2 (pt) | polinucleotìdeo isolado, fragmento de ácido nucléico isolado, construções de dna recombinante, plantas, sementes, células vegetais, tecidos vegetais, método de isolamento de fragmentos de ácidos nucléico, método de mapeamento de variações genéticas, método de cultivo molecular, plantas de milho, métodos de alteração do transporte de nitrogênio das plantas e variantes de hat de plantas alteradas |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221221 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240311 |