KR20200018486A - 부화되지 않은 알에서 조류 배아의 성 감별을 위한 방법 및 이의 수단 - Google Patents
부화되지 않은 알에서 조류 배아의 성 감별을 위한 방법 및 이의 수단 Download PDFInfo
- Publication number
- KR20200018486A KR20200018486A KR1020197038050A KR20197038050A KR20200018486A KR 20200018486 A KR20200018486 A KR 20200018486A KR 1020197038050 A KR1020197038050 A KR 1020197038050A KR 20197038050 A KR20197038050 A KR 20197038050A KR 20200018486 A KR20200018486 A KR 20200018486A
- Authority
- KR
- South Korea
- Prior art keywords
- acid sequence
- reporter gene
- nucleic acid
- seq
- chromosome
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 162
- 241000271566 Aves Species 0.000 title claims abstract description 145
- 235000013601 eggs Nutrition 0.000 title abstract description 174
- 210000002257 embryonic structure Anatomy 0.000 title abstract description 46
- 230000032678 sex differentiation Effects 0.000 title description 2
- 108700008625 Reporter Genes Proteins 0.000 claims abstract description 332
- 230000009261 transgenic effect Effects 0.000 claims abstract description 157
- 210000003765 sex chromosome Anatomy 0.000 claims abstract description 79
- 150000007523 nucleic acids Chemical group 0.000 claims description 299
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 278
- 210000004027 cell Anatomy 0.000 claims description 224
- 210000000349 chromosome Anatomy 0.000 claims description 221
- 108091033409 CRISPR Proteins 0.000 claims description 174
- 108020005004 Guide RNA Proteins 0.000 claims description 144
- 108010054624 red fluorescent protein Proteins 0.000 claims description 116
- 238000010354 CRISPR gene editing Methods 0.000 claims description 74
- 210000001161 mammalian embryo Anatomy 0.000 claims description 64
- 108090000623 proteins and genes Proteins 0.000 claims description 62
- 230000010354 integration Effects 0.000 claims description 61
- 241001465754 Metazoa Species 0.000 claims description 50
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 37
- 230000014509 gene expression Effects 0.000 claims description 32
- 230000008685 targeting Effects 0.000 claims description 31
- 101710163270 Nuclease Proteins 0.000 claims description 25
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 claims description 25
- 210000004602 germ cell Anatomy 0.000 claims description 22
- 238000001514 detection method Methods 0.000 claims description 19
- 238000004519 manufacturing process Methods 0.000 claims description 15
- 230000001404 mediated effect Effects 0.000 claims description 11
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 10
- 108091092724 Noncoding DNA Proteins 0.000 claims description 10
- 230000002759 chromosomal effect Effects 0.000 claims description 8
- 230000001939 inductive effect Effects 0.000 claims description 7
- 108010042407 Endonucleases Proteins 0.000 claims description 6
- 230000003252 repetitive effect Effects 0.000 claims description 3
- 102000004533 Endonucleases Human genes 0.000 claims description 2
- 230000004720 fertilization Effects 0.000 abstract description 7
- 108020004414 DNA Proteins 0.000 description 149
- 239000013598 vector Substances 0.000 description 50
- 241000287828 Gallus gallus Species 0.000 description 49
- 102000034287 fluorescent proteins Human genes 0.000 description 47
- 108091006047 fluorescent proteins Proteins 0.000 description 47
- 235000013330 chicken meat Nutrition 0.000 description 46
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 43
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 43
- 210000001173 gonocyte Anatomy 0.000 description 43
- 239000005090 green fluorescent protein Substances 0.000 description 42
- 125000006850 spacer group Chemical group 0.000 description 38
- 102000004169 proteins and genes Human genes 0.000 description 35
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 34
- 235000018102 proteins Nutrition 0.000 description 33
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 30
- 238000010367 cloning Methods 0.000 description 29
- 230000005284 excitation Effects 0.000 description 25
- 102000039446 nucleic acids Human genes 0.000 description 25
- 108020004707 nucleic acids Proteins 0.000 description 25
- 125000003729 nucleotide group Chemical group 0.000 description 24
- 239000013612 plasmid Substances 0.000 description 24
- 235000001014 amino acid Nutrition 0.000 description 23
- 239000002773 nucleotide Substances 0.000 description 23
- 229940024606 amino acid Drugs 0.000 description 22
- 238000010348 incorporation Methods 0.000 description 22
- 150000001413 amino acids Chemical class 0.000 description 21
- 210000002149 gonad Anatomy 0.000 description 21
- 108090000765 processed proteins & peptides Proteins 0.000 description 20
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 19
- 238000010362 genome editing Methods 0.000 description 19
- 239000002953 phosphate buffered saline Substances 0.000 description 19
- 230000006870 function Effects 0.000 description 17
- 238000006467 substitution reaction Methods 0.000 description 16
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 15
- 108091079001 CRISPR RNA Proteins 0.000 description 15
- 230000012447 hatching Effects 0.000 description 15
- 102000004196 processed proteins & peptides Human genes 0.000 description 15
- 108700019146 Transgenes Proteins 0.000 description 14
- 239000000203 mixture Substances 0.000 description 14
- 239000000872 buffer Substances 0.000 description 13
- 238000002474 experimental method Methods 0.000 description 13
- 239000002609 medium Substances 0.000 description 13
- 229920001184 polypeptide Polymers 0.000 description 13
- 102000002322 Egg Proteins Human genes 0.000 description 12
- 108010000912 Egg Proteins Proteins 0.000 description 12
- 239000012091 fetal bovine serum Substances 0.000 description 12
- 102000053602 DNA Human genes 0.000 description 11
- 239000012634 fragment Substances 0.000 description 11
- 238000003780 insertion Methods 0.000 description 11
- 230000037431 insertion Effects 0.000 description 11
- 241000894007 species Species 0.000 description 11
- 210000004369 blood Anatomy 0.000 description 10
- 239000008280 blood Substances 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 238000002347 injection Methods 0.000 description 10
- 239000007924 injection Substances 0.000 description 10
- 239000012981 Hank's balanced salt solution Substances 0.000 description 9
- 241001125929 Trisopterus luscus Species 0.000 description 9
- 210000002969 egg yolk Anatomy 0.000 description 9
- 239000001963 growth medium Substances 0.000 description 9
- 108010034529 leucyl-lysine Proteins 0.000 description 9
- 238000002826 magnetic-activated cell sorting Methods 0.000 description 9
- 230000007017 scission Effects 0.000 description 9
- 210000004974 shell Anatomy 0.000 description 9
- 239000006228 supernatant Substances 0.000 description 9
- 238000001890 transfection Methods 0.000 description 9
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 9
- 241000195493 Cryptophyta Species 0.000 description 8
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 8
- 238000003776 cleavage reaction Methods 0.000 description 8
- 230000000295 complement effect Effects 0.000 description 8
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- 239000003623 enhancer Substances 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 8
- 239000000523 sample Substances 0.000 description 8
- 238000011144 upstream manufacturing Methods 0.000 description 8
- 235000014653 Carica parviflora Nutrition 0.000 description 7
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 7
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 7
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 7
- 125000000539 amino acid group Chemical group 0.000 description 7
- 238000013459 approach Methods 0.000 description 7
- 235000013345 egg yolk Nutrition 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 6
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- 239000012124 Opti-MEM Substances 0.000 description 6
- 238000003491 array Methods 0.000 description 6
- 230000027455 binding Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 239000000975 dye Substances 0.000 description 6
- 210000003278 egg shell Anatomy 0.000 description 6
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 238000011534 incubation Methods 0.000 description 6
- 238000002955 isolation Methods 0.000 description 6
- 230000008774 maternal effect Effects 0.000 description 6
- 229960004927 neomycin Drugs 0.000 description 6
- 244000144977 poultry Species 0.000 description 6
- 235000013594 poultry meat Nutrition 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 230000008439 repair process Effects 0.000 description 6
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 6
- 239000004475 Arginine Substances 0.000 description 5
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 5
- 241000243321 Cnidaria Species 0.000 description 5
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 5
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 5
- 241000006867 Discosoma Species 0.000 description 5
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 5
- 102100031780 Endonuclease Human genes 0.000 description 5
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 5
- 239000004472 Lysine Substances 0.000 description 5
- 229930193140 Neomycin Natural products 0.000 description 5
- 241000193996 Streptococcus pyogenes Species 0.000 description 5
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 5
- 108010076089 accutase Proteins 0.000 description 5
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 5
- 235000009582 asparagine Nutrition 0.000 description 5
- 229960001230 asparagine Drugs 0.000 description 5
- 108010092854 aspartyllysine Proteins 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 108091005948 blue fluorescent proteins Proteins 0.000 description 5
- 230000035558 fertility Effects 0.000 description 5
- 238000000799 fluorescence microscopy Methods 0.000 description 5
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 5
- 108010057821 leucylproline Proteins 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 235000013372 meat Nutrition 0.000 description 5
- 102000040430 polynucleotide Human genes 0.000 description 5
- 108091033319 polynucleotide Proteins 0.000 description 5
- -1 steroid compounds Chemical class 0.000 description 5
- 108010073969 valyllysine Proteins 0.000 description 5
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 4
- 238000010222 PCR analysis Methods 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 210000003323 beak Anatomy 0.000 description 4
- 210000002459 blastocyst Anatomy 0.000 description 4
- 210000000601 blood cell Anatomy 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 230000004069 differentiation Effects 0.000 description 4
- 230000013020 embryo development Effects 0.000 description 4
- 210000001671 embryonic stem cell Anatomy 0.000 description 4
- 210000000744 eyelid Anatomy 0.000 description 4
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 4
- 108010021843 fluorescent protein 583 Proteins 0.000 description 4
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 4
- 210000001654 germ layer Anatomy 0.000 description 4
- 239000011521 glass Substances 0.000 description 4
- 108010050848 glycylleucine Proteins 0.000 description 4
- 108010054155 lysyllysine Proteins 0.000 description 4
- 108010017391 lysylvaline Proteins 0.000 description 4
- 210000004962 mammalian cell Anatomy 0.000 description 4
- 230000008775 paternal effect Effects 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 239000002157 polynucleotide Substances 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 230000001850 reproductive effect Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 238000003307 slaughter Methods 0.000 description 4
- 210000001082 somatic cell Anatomy 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- 241001083548 Anemone Species 0.000 description 3
- 241000242757 Anthozoa Species 0.000 description 3
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 3
- 101710096438 DNA-binding protein Proteins 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- 229930182816 L-glutamine Natural products 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- 102000003960 Ligases Human genes 0.000 description 3
- 108090000364 Ligases Proteins 0.000 description 3
- 239000012097 Lipofectamine 2000 Substances 0.000 description 3
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 3
- 229930182555 Penicillin Natural products 0.000 description 3
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 3
- 241000286209 Phasianidae Species 0.000 description 3
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- 241000191967 Staphylococcus aureus Species 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 229940088710 antibiotic agent Drugs 0.000 description 3
- 108010062796 arginyllysine Proteins 0.000 description 3
- 235000003704 aspartic acid Nutrition 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 229940098773 bovine serum albumin Drugs 0.000 description 3
- 229910002091 carbon monoxide Inorganic materials 0.000 description 3
- 101150038500 cas9 gene Proteins 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 230000004087 circulation Effects 0.000 description 3
- 238000012761 co-transfection Methods 0.000 description 3
- 108010082025 cyan fluorescent protein Proteins 0.000 description 3
- 210000000969 egg white Anatomy 0.000 description 3
- 235000014103 egg white Nutrition 0.000 description 3
- 230000005670 electromagnetic radiation Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 210000003746 feather Anatomy 0.000 description 3
- 239000007850 fluorescent dye Substances 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- 238000010363 gene targeting Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 238000010353 genetic engineering Methods 0.000 description 3
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 3
- 210000003128 head Anatomy 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 230000003902 lesion Effects 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 229940049954 penicillin Drugs 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 230000001737 promoting effect Effects 0.000 description 3
- 102000005962 receptors Human genes 0.000 description 3
- 108020003175 receptors Proteins 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 210000000582 semen Anatomy 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 229960005322 streptomycin Drugs 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 238000002054 transplantation Methods 0.000 description 3
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 3
- 210000001325 yolk sac Anatomy 0.000 description 3
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 3
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 2
- QCVGEOXPDFCNHA-UHFFFAOYSA-N 5,5-dimethyl-2,4-dioxo-1,3-oxazolidine-3-carboxamide Chemical compound CC1(C)OC(=O)N(C(N)=O)C1=O QCVGEOXPDFCNHA-UHFFFAOYSA-N 0.000 description 2
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- 241000272517 Anseriformes Species 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- MMGCRPZQZWTZTA-IHRRRGAJSA-N Arg-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N MMGCRPZQZWTZTA-IHRRRGAJSA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 2
- VIINVRPKMUZYOI-DCAQKATOSA-N Arg-Met-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIINVRPKMUZYOI-DCAQKATOSA-N 0.000 description 2
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 2
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 2
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 2
- GWNMUVANAWDZTI-YUMQZZPRSA-N Asn-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GWNMUVANAWDZTI-YUMQZZPRSA-N 0.000 description 2
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 2
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 2
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 2
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 101150069031 CSN2 gene Proteins 0.000 description 2
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- 230000033616 DNA repair Effects 0.000 description 2
- 230000007018 DNA scission Effects 0.000 description 2
- 241000252212 Danio rerio Species 0.000 description 2
- 101100275895 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) csnB gene Proteins 0.000 description 2
- 101100219622 Escherichia coli (strain K12) casC gene Proteins 0.000 description 2
- 101100326871 Escherichia coli (strain K12) ygbF gene Proteins 0.000 description 2
- 101100438439 Escherichia coli (strain K12) ygbT gene Proteins 0.000 description 2
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 2
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 2
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 2
- 102100024785 Fibroblast growth factor 2 Human genes 0.000 description 2
- 102220566686 GDNF family receptor alpha-1_F46L_mutation Human genes 0.000 description 2
- 241000287826 Gallus Species 0.000 description 2
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 2
- CHDWDBPJOZVZSE-KKUMJFAQSA-N Glu-Phe-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CHDWDBPJOZVZSE-KKUMJFAQSA-N 0.000 description 2
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 2
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 2
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 2
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- KYMUEAZVLPRVAE-GUBZILKMSA-N His-Asn-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KYMUEAZVLPRVAE-GUBZILKMSA-N 0.000 description 2
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 2
- MHAJPDPJQMAIIY-UHFFFAOYSA-N Hydrogen peroxide Chemical compound OO MHAJPDPJQMAIIY-UHFFFAOYSA-N 0.000 description 2
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 2
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 2
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 2
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 2
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 2
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 2
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 2
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 2
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 2
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 2
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 2
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 2
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- 241000588650 Neisseria meningitidis Species 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 2
- ZUZINZIJHJFJRN-UBHSHLNASA-N Pro-Phe-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 ZUZINZIJHJFJRN-UBHSHLNASA-N 0.000 description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 2
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 2
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 2
- 241000194020 Streptococcus thermophilus Species 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- 101100329497 Thermoproteus tenax (strain ATCC 35583 / DSM 2078 / JCM 9277 / NBRC 100435 / Kra 1) cas2 gene Proteins 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 2
- RMRFSFXLFWWAJZ-HJOGWXRNSA-N Tyr-Tyr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 RMRFSFXLFWWAJZ-HJOGWXRNSA-N 0.000 description 2
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 2
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 2
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 2
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 108091005971 Wild-type GFP Proteins 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 210000000709 aorta Anatomy 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 235000008429 bread Nutrition 0.000 description 2
- 238000009395 breeding Methods 0.000 description 2
- 230000001488 breeding effect Effects 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 239000001110 calcium chloride Substances 0.000 description 2
- 229910001628 calcium chloride Inorganic materials 0.000 description 2
- 235000011148 calcium chloride Nutrition 0.000 description 2
- 101150000705 cas1 gene Proteins 0.000 description 2
- 101150117416 cas2 gene Proteins 0.000 description 2
- 101150111685 cas4 gene Proteins 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 239000003797 essential amino acid Substances 0.000 description 2
- 235000020776 essential amino acid Nutrition 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 238000000695 excitation spectrum Methods 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 210000002950 fibroblast Anatomy 0.000 description 2
- 229940126864 fibroblast growth factor Drugs 0.000 description 2
- 239000012737 fresh medium Substances 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 238000001476 gene delivery Methods 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 239000003292 glue Substances 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 238000000227 grinding Methods 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 210000000987 immune system Anatomy 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 229910001629 magnesium chloride Inorganic materials 0.000 description 2
- 230000013011 mating Effects 0.000 description 2
- 239000011325 microbead Substances 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 230000004660 morphological change Effects 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 210000000287 oocyte Anatomy 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 2
- 229940091258 selenium supplement Drugs 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 230000020509 sex determination Effects 0.000 description 2
- DAEPDZWVDSPTHF-UHFFFAOYSA-M sodium pyruvate Chemical compound [Na+].CC(=O)C([O-])=O DAEPDZWVDSPTHF-UHFFFAOYSA-M 0.000 description 2
- 108091035539 telomere Proteins 0.000 description 2
- 102000055501 telomere Human genes 0.000 description 2
- 210000003411 telomere Anatomy 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 239000012096 transfection reagent Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- APJYDQYYACXCRM-UHFFFAOYSA-N tryptamine Chemical compound C1=CC=C2C(CCN)=CNC2=C1 APJYDQYYACXCRM-UHFFFAOYSA-N 0.000 description 2
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- PSLCKQYQNVNTQI-BHFSHLQUSA-N (2s)-2-aminobutanedioic acid;(2s)-2-aminopentanedioic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O.OC(=O)[C@@H](N)CCC(O)=O PSLCKQYQNVNTQI-BHFSHLQUSA-N 0.000 description 1
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 description 1
- DQPMXYDFWRYWQV-UHFFFAOYSA-N 2-[[6-amino-2-[[2-[(2-amino-3-methylbutanoyl)amino]-3-hydroxybutanoyl]amino]hexanoyl]amino]acetic acid Chemical compound CC(C)C(N)C(=O)NC(C(C)O)C(=O)NC(CCCCN)C(=O)NCC(O)=O DQPMXYDFWRYWQV-UHFFFAOYSA-N 0.000 description 1
- 241000242759 Actiniaria Species 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241000242764 Aequorea victoria Species 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 241000242763 Anemonia Species 0.000 description 1
- 101710145634 Antigen 1 Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 1
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- VRZDJJWOFXMFRO-ZFWWWQNUSA-N Arg-Gly-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O VRZDJJWOFXMFRO-ZFWWWQNUSA-N 0.000 description 1
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 1
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 1
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 1
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 1
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 1
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- OWSMKCJUBAPHED-JYJNAYRXSA-N Arg-Pro-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OWSMKCJUBAPHED-JYJNAYRXSA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 1
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 1
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 1
- ZJIFRAPZHAGLGR-MELADBBJSA-N Asn-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZJIFRAPZHAGLGR-MELADBBJSA-N 0.000 description 1
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 1
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 1
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 1
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 1
- BIVYLQMZPHDUIH-WHFBIAKZSA-N Asp-Gly-Cys Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)C(=O)O BIVYLQMZPHDUIH-WHFBIAKZSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- 206010003497 Asphyxia Diseases 0.000 description 1
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- 102100035605 Cas scaffolding protein family member 4 Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108091005944 Cerulean Proteins 0.000 description 1
- 241000579895 Chlorostilbon Species 0.000 description 1
- 108091005960 Citrine Proteins 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- NDNZRWUDUMTITL-FXQIFTODSA-N Cys-Ser-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NDNZRWUDUMTITL-FXQIFTODSA-N 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 241000498633 Dendronephthya Species 0.000 description 1
- 241001512730 Discosoma striata Species 0.000 description 1
- 239000012591 Dulbecco’s Phosphate Buffered Saline Substances 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 206010015866 Extravasation Diseases 0.000 description 1
- 230000010337 G2 phase Effects 0.000 description 1
- 101000920865 Gallus gallus Estrogen receptor Proteins 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 1
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 1
- HHRAEXBUNGTOGZ-IHRRRGAJSA-N Gln-Phe-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O HHRAEXBUNGTOGZ-IHRRRGAJSA-N 0.000 description 1
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- CAVMESABQIKFKT-IUCAKERBSA-N Glu-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N CAVMESABQIKFKT-IUCAKERBSA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 1
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- BKRQSECBKKCCKW-HVTMNAMFSA-N Glu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N BKRQSECBKKCCKW-HVTMNAMFSA-N 0.000 description 1
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 1
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- SABZDFAAOJATBR-QWRGUYRKSA-N Gly-Cys-Phe Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SABZDFAAOJATBR-QWRGUYRKSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- YLEIWGJJBFBFHC-KBPBESRZSA-N Gly-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 YLEIWGJJBFBFHC-KBPBESRZSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 1
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 108060003760 HNH nuclease Proteins 0.000 description 1
- 102000029812 HNH nuclease Human genes 0.000 description 1
- 241000204988 Haloferax mediterranei Species 0.000 description 1
- 102100027685 Hemoglobin subunit alpha Human genes 0.000 description 1
- 108091005902 Hemoglobin subunit alpha Proteins 0.000 description 1
- 241000746758 Heteractis crispa Species 0.000 description 1
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 1
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 1
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 1
- DFHVLUKTTVTCKY-PBCZWWQYSA-N His-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N)O DFHVLUKTTVTCKY-PBCZWWQYSA-N 0.000 description 1
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 1
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 1
- XMENRVZYPBKBIL-AVGNSLFASA-N His-Glu-His Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XMENRVZYPBKBIL-AVGNSLFASA-N 0.000 description 1
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 1
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 1
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 1
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000947106 Homo sapiens Cas scaffolding protein family member 4 Proteins 0.000 description 1
- 239000004831 Hot glue Substances 0.000 description 1
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- HYLIOBDWPQNLKI-HVTMNAMFSA-N Ile-His-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HYLIOBDWPQNLKI-HVTMNAMFSA-N 0.000 description 1
- VUEXLJFLDONGKQ-PYJNHQTQSA-N Ile-His-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N VUEXLJFLDONGKQ-PYJNHQTQSA-N 0.000 description 1
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 1
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 1
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 1
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 1
- RVNOXPZHMUWCLW-GMOBBJLQSA-N Ile-Met-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVNOXPZHMUWCLW-GMOBBJLQSA-N 0.000 description 1
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 1
- RMJWFINHACYKJI-SIUGBPQLSA-N Ile-Tyr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RMJWFINHACYKJI-SIUGBPQLSA-N 0.000 description 1
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 1
- HODVZHLJUUWPKY-STECZYCISA-N Ile-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=C(O)C=C1 HODVZHLJUUWPKY-STECZYCISA-N 0.000 description 1
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 1
- SWNRZNLXMXRCJC-VKOGCVSHSA-N Ile-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 SWNRZNLXMXRCJC-VKOGCVSHSA-N 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 240000003978 Ipomoea coccinea Species 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 1
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- 241000205454 Lobophyllia hemprichii Species 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 1
- SPCHLZUWJTYZFC-IHRRRGAJSA-N Lys-His-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O SPCHLZUWJTYZFC-IHRRRGAJSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- ORVFEGYUJITPGI-IHRRRGAJSA-N Lys-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN ORVFEGYUJITPGI-IHRRRGAJSA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 1
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 1
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 1
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- XGZDDOKIHSYHTO-SZMVWBNQSA-N Lys-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 XGZDDOKIHSYHTO-SZMVWBNQSA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 1
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 1
- 241000282567 Macaca fascicularis Species 0.000 description 1
- 201000009906 Meningitis Diseases 0.000 description 1
- UAPZLLPGGOOCRO-IHRRRGAJSA-N Met-Asn-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N UAPZLLPGGOOCRO-IHRRRGAJSA-N 0.000 description 1
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 1
- FZUNSVYYPYJYAP-NAKRPEOUSA-N Met-Ile-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O FZUNSVYYPYJYAP-NAKRPEOUSA-N 0.000 description 1
- QGRJTULYDZUBAY-ZPFDUUQYSA-N Met-Ile-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGRJTULYDZUBAY-ZPFDUUQYSA-N 0.000 description 1
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 1
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 1
- WRXOPYNEKGZWAZ-FXQIFTODSA-N Met-Ser-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O WRXOPYNEKGZWAZ-FXQIFTODSA-N 0.000 description 1
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 1
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 1
- 241000203407 Methanocaldococcus jannaschii Species 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- 101000716728 Mus musculus Kit ligand Proteins 0.000 description 1
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 241001045988 Neogene Species 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 108010008164 PAX7 Transcription Factor Proteins 0.000 description 1
- 102000006989 PAX7 Transcription Factor Human genes 0.000 description 1
- 238000002944 PCR assay Methods 0.000 description 1
- 239000012807 PCR reagent Substances 0.000 description 1
- 101150010842 PGC gene Proteins 0.000 description 1
- 240000009164 Petroselinum crispum Species 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- IUVYJBMTHARMIP-PCBIJLKTSA-N Phe-Asp-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IUVYJBMTHARMIP-PCBIJLKTSA-N 0.000 description 1
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 1
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 1
- ABQFNJAFONNUTH-FHWLQOOXSA-N Phe-Gln-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N ABQFNJAFONNUTH-FHWLQOOXSA-N 0.000 description 1
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 1
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 1
- JQLQUPIYYJXZLJ-ZEWNOJEFSA-N Phe-Ile-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 JQLQUPIYYJXZLJ-ZEWNOJEFSA-N 0.000 description 1
- RFCVXVPWSPOMFJ-STQMWFEESA-N Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RFCVXVPWSPOMFJ-STQMWFEESA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- SCKXGHWQPPURGT-KKUMJFAQSA-N Phe-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O SCKXGHWQPPURGT-KKUMJFAQSA-N 0.000 description 1
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 1
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 1
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 1
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 1
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 1
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 1
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 1
- DEDANIDYQAPTFI-IHRRRGAJSA-N Pro-Asp-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DEDANIDYQAPTFI-IHRRRGAJSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 1
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 1
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 1
- XRGIDCGRSSWCKE-SRVKXCTJSA-N Pro-Val-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O XRGIDCGRSSWCKE-SRVKXCTJSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 241000700157 Rattus norvegicus Species 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000384920 Ricordea florida Species 0.000 description 1
- 230000018199 S phase Effects 0.000 description 1
- 241000242583 Scyphozoa Species 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- WEQAYODCJHZSJZ-KKUMJFAQSA-N Ser-His-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 WEQAYODCJHZSJZ-KKUMJFAQSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- MQQBBLVOUUJKLH-HJPIBITLSA-N Ser-Ile-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQQBBLVOUUJKLH-HJPIBITLSA-N 0.000 description 1
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 239000008049 TAE buffer Substances 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 241000204666 Thermotoga maritima Species 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- WLDUCKSCDRIVLJ-NUMRIWBASA-N Thr-Gln-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O WLDUCKSCDRIVLJ-NUMRIWBASA-N 0.000 description 1
- UHBPFYOQQPFKQR-JHEQGTHGSA-N Thr-Gln-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UHBPFYOQQPFKQR-JHEQGTHGSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- FHDLKMFZKRUQCE-HJGDQZAQSA-N Thr-Glu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHDLKMFZKRUQCE-HJGDQZAQSA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- JLNMFGCJODTXDH-WEDXCCLWSA-N Thr-Lys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O JLNMFGCJODTXDH-WEDXCCLWSA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- ABCLYRRGTZNIFU-BWAGICSOSA-N Thr-Tyr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O ABCLYRRGTZNIFU-BWAGICSOSA-N 0.000 description 1
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 1
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 1
- 241001487542 Trachyphyllia geoffroyi Species 0.000 description 1
- 108091028113 Trans-activating crRNA Proteins 0.000 description 1
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 1
- 241000589892 Treponema denticola Species 0.000 description 1
- DVAAUUVLDFKTAQ-VHWLVUOQSA-N Trp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DVAAUUVLDFKTAQ-VHWLVUOQSA-N 0.000 description 1
- PKUJMYZNJMRHEZ-XIRDDKMYSA-N Trp-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKUJMYZNJMRHEZ-XIRDDKMYSA-N 0.000 description 1
- GLNADSQYFUSGOU-GPTZEZBUSA-J Trypan blue Chemical compound [Na+].[Na+].[Na+].[Na+].C1=C(S([O-])(=O)=O)C=C2C=C(S([O-])(=O)=O)C(/N=N/C3=CC=C(C=C3C)C=3C=C(C(=CC=3)\N=N\C=3C(=CC4=CC(=CC(N)=C4C=3O)S([O-])(=O)=O)S([O-])(=O)=O)C)=C(O)C2=C1N GLNADSQYFUSGOU-GPTZEZBUSA-J 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- XQYHLZNPOTXRMQ-KKUMJFAQSA-N Tyr-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XQYHLZNPOTXRMQ-KKUMJFAQSA-N 0.000 description 1
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 1
- SLCSPPCQWUHPPO-JYJNAYRXSA-N Tyr-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SLCSPPCQWUHPPO-JYJNAYRXSA-N 0.000 description 1
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 1
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- CDKZJGMPZHPAJC-ULQDDVLXSA-N Tyr-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDKZJGMPZHPAJC-ULQDDVLXSA-N 0.000 description 1
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 1
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 1
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 1
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 1
- AUZADXNWQMBZOO-JYJNAYRXSA-N Tyr-Pro-Arg Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 AUZADXNWQMBZOO-JYJNAYRXSA-N 0.000 description 1
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- NZBSVMQZQMEUHI-WZLNRYEVSA-N Tyr-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NZBSVMQZQMEUHI-WZLNRYEVSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- JHDZONWZTCKTJR-KJEVXHAQSA-N Tyr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JHDZONWZTCKTJR-KJEVXHAQSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- LEHOTFFKMJEONL-UHFFFAOYSA-N Uric Acid Chemical compound N1C(=O)NC(=O)C2=C1NC(=O)N2 LEHOTFFKMJEONL-UHFFFAOYSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 1
- SVFRYKBZHUGKLP-QXEWZRGKSA-N Val-Met-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVFRYKBZHUGKLP-QXEWZRGKSA-N 0.000 description 1
- OFQGGTGZTOTLGH-NHCYSSNCSA-N Val-Met-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N OFQGGTGZTOTLGH-NHCYSSNCSA-N 0.000 description 1
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 1
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 1
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 1
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 1
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 1
- ZNGPROMGGGFOAA-JYJNAYRXSA-N Val-Tyr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 ZNGPROMGGGFOAA-JYJNAYRXSA-N 0.000 description 1
- 241000545067 Venus Species 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 241001512728 Zoanthus Species 0.000 description 1
- 101001059184 Zoanthus sp. GFP-like fluorescent chromoprotein FP538 Proteins 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- HGEVZDLYZYVYHD-UHFFFAOYSA-N acetic acid;2-amino-2-(hydroxymethyl)propane-1,3-diol;2-[2-[bis(carboxymethyl)amino]ethyl-(carboxymethyl)amino]acetic acid Chemical compound CC(O)=O.OCC(N)(CO)CO.OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O HGEVZDLYZYVYHD-UHFFFAOYSA-N 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 101150063416 add gene Proteins 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000003915 air pollution Methods 0.000 description 1
- 210000004712 air sac Anatomy 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000000843 anti-fungal effect Effects 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 210000000436 anus Anatomy 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 238000000149 argon plasma sintering Methods 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 230000008970 bacterial immunity Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 230000017531 blood circulation Effects 0.000 description 1
- 238000010504 bond cleavage reaction Methods 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 230000021523 carboxylation Effects 0.000 description 1
- 238000006473 carboxylation reaction Methods 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000003837 chick embryo Anatomy 0.000 description 1
- 239000011035 citrine Substances 0.000 description 1
- 210000000078 claw Anatomy 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000002967 competitive immunoassay Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 210000004087 cornea Anatomy 0.000 description 1
- 238000009402 cross-breeding Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 210000000613 ear canal Anatomy 0.000 description 1
- 230000008143 early embryonic development Effects 0.000 description 1
- 230000008144 egg development Effects 0.000 description 1
- 210000002308 embryonic cell Anatomy 0.000 description 1
- 239000010976 emerald Substances 0.000 description 1
- 229910052876 emerald Inorganic materials 0.000 description 1
- 238000000295 emission spectrum Methods 0.000 description 1
- 210000001900 endoderm Anatomy 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 1
- 229940011871 estrogen Drugs 0.000 description 1
- 239000000262 estrogen Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005281 excited state Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 230000036251 extravasation Effects 0.000 description 1
- 230000011512 eye pigmentation Effects 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 239000005357 flat glass Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000012921 fluorescence analysis Methods 0.000 description 1
- 238000002189 fluorescence spectrum Methods 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 210000001368 germline stem cell Anatomy 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 230000026109 gonad development Effects 0.000 description 1
- 239000005337 ground glass Substances 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 235000015220 hamburgers Nutrition 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000007455 ileostomy Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 210000000994 inner shell membrane Anatomy 0.000 description 1
- 230000009027 insemination Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 210000003716 mesoderm Anatomy 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000037323 metabolic rate Effects 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 101150091879 neo gene Proteins 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 230000017448 oviposition Effects 0.000 description 1
- 235000011197 perejil Nutrition 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- 108010025488 pinealon Proteins 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008263 repair mechanism Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 229910052594 sapphire Inorganic materials 0.000 description 1
- 239000010980 sapphire Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 229940054269 sodium pyruvate Drugs 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 210000004906 toe nail Anatomy 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 108010012567 tyrosyl-glycyl-glycyl-phenylalanyl Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 210000000626 ureter Anatomy 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 210000000543 ventral mesentery Anatomy 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6879—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for sex determination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
- A01K67/0275—Genetically modified vertebrates, e.g. transgenic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/07—Animals genetically altered by homologous recombination
- A01K2217/072—Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/30—Bird
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/01—Animal expressing industrially exogenous proteins
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/0393—Animal model comprising a reporter system for screening tests
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Chemical & Material Sciences (AREA)
- Biotechnology (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Environmental Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Animal Husbandry (AREA)
- Biodiversity & Conservation Biology (AREA)
- Mycology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 조류 대상체에서의 수정 및 성 감별 및 식별 방법에 관한 것이다. 보다 구체적으로, 본 발명은 적어도 하나의 성 염색체 Z 또는 W에 통합된 적어도 하나의 리포터 유전자, 구체적으로 RFP를 포함하는 유전자이식 조류 동물을 사용하는 비-침습적 방법을 제공한다. 본 발명의 유전자이식 조류 동물은 부화되지 않은 조류 알에서 배아의 성 감별 및 선택에 사용된다.
Description
본 발명은 조류 대상체에서 성 감별 및 식별의 방법에 관한 것이다. 보다 구체적으로, 본 발명은 부화되지 않은 조류 알에서 배아의 성 감별 및 선택을 위한 비-침습적 방법 및 유전자이식 조류 동물을 제공한다.
본원에 개시된 주제에 대한 배경으로서 관련된 것으로 간주되는 참고 문헌이 아래에 열거되어 있다:
·
WO 2010/103111
·
WO 2014/0296707
·
US 6244214
·
06124456A2
·
US2014069336A
·
WO16005539
·
WO 96/39505
·
WO 97/49806
·
Quansah, E., Long, J.A., Donovan, D.M., Becker, S.C., Telugu, B., Foster Frey, J.A., Urwin, N. (2014). Sperm-mediated transgenesis in chicken using a PiggyBac transposon system. Poultry Science Association Meeting Abstract. BARC Poster Day.
·
Jinek, M., Chylinski, K., Fonfara, I., Hauer, M., Doudna, J. A., & Charpentier, E. (2012). A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science, 337(6096), 816-821.
·
Cong, L., & Zhang, F. (2015). Genome engineering using CRISPR-Cas9 system. Chromosomal Mutagenesis, 197-217.
·
US 특허 6, 244,214.
·
WO 2014/0296707.
·
WO 06124456A2;
·
WO16005539.
·
Veron N., Qu Z., Kipen PA., Hirst CE., Marcelle C. (2015). CRISPR mediated somatic cell genome engineering in the chicken. Dev. Biol. 407(1):68-74. doi: 10.1016/j.ydbio.2015.08.007. Epub 2015 Aug 13.
·
CA2264450.
·
Niu, Y., B. Shen, Y. Cui, Y. Chen, J. Wang et al., (2014). Generation of genemodified cynomolgus monkey via cas9/rna-mediated gene targeting in one-cell embryos. Cell, 156(4): 836-843.
·
Hwang, W. Y., Y. Fu, D. Reyon, M. L. Maeder, S. Q. Tsai et al., (2013). Efficient genome editing in zebrafish using a CRISPR-Cas system. Nat. Biotechnol. 31(3): 227-229.
·
Nadege, V., Q. Zhengdong, P. A. S. Kipen, C. E. Hirst, M. Christophe et al., (2015). CRISPR mediated somatic cell genome engineering in the chicken. Dev. Biol. 407(1): 68-74.
·
Bai, Y., L. He, P. Li, K. Xu, S. Shao et al., (2016). Efficient genome editing in chicken DF-1 cells using the CRISPR/Cas9 system. G3 (Bethesda) pii: g3.116.027706.
·
Doran T. et al., (2016). Sex selection in layer chickens. ASAP Animal Production, Adelaide.
·
Tizard M. and Doran T. (2014). Precision genome engineering in the chicken: Th gap between science and market place. A presentation at IWRAB-II, in Brasilia.
본원에서 상기 참고문헌의 확인은 이들이 본원에 개시된 주제의 특허성과 어떠한 방식으로든 관련이 있음을 의미하는 것으로 해석되지 않아야 한다.
발명의 배경
식품 산업에서, 병아리는 질식 또는 분쇄를 통해 매일 수십억 마리가 도축된다. 수컷은 알을 낳거나 고기로 빵을 만드는데 유용하지 않기 때문에 폐기되고 약하거나 건강하지 못한 암컷도 폐기된다. 따라서 부화 전에 in-ovo, 또는 배아 성-감별을 위한 방법은 윤리적 및 경제적 고려사항 둘 다로 인해 매우 바람직하다.
구체적으로, 가금류 수정란을 육안으로 식별하는 것은 무정란을 제거하여 (무정란 부화를 방지함으로써) 부화 비용을 절약하고, 수정란과 함께 이러한 오염되기 쉬운 무정란의 배양의 지속에 관련된 생물보안 위험을 낮추는데 중요하다.
부화되지 않은 알 내부에 있는 동안 배아의 초기 단계에서 알 수정력을 육안으로 식별하는 것은 외부 광원 검란 (candling)을 수반하며 초기 배아 단계에서는 어렵고 사실상 불가능할 수 있다. 더 큰 도전은 배아의 성별을 식별하는 것이며, 수정이 된 부화되지 않은 알에서 수컷과 암컷을 구별하기 위한 이용 가능한 방법은 현재 없다. 그러나, 초기 배아 단계에서의 수정력의 확인 및 가금류의 성 감별은 조류사육, 과학적 연구, 및 보호를 위해 필수적이다. 형태학적 특징에 의한 어린 새에서의 성 감별은 대부분의 종에 대해 극히 어려운 일이다. 성별은 병아리에서 배설물을 손으로 짜냄을 포함하는 개별 항문 감별 (vent sexing)에 의해 감별될 수 있으며, 이것은 병아리의 항문을 약간 열어서, 병아리가 작은 "돌기(bump)"를 가지고 있는지 확인하며, 이 돌기는 병아리가 수컷임을 나타낸다. 그러나, 이 방법은 훈련된 개인에 의해 수동으로 수행하는 번거로운 작업과 함께 높은 조류 부상 위험 및 성 결정 실수를 나타낸다.
항문 감별 또는 병아리 감별은 통상적으로 병아리 감별사 또는 닭 감별사라고 불리는 숙련된 사람에 의해 닭 및 다른 부화유생의 성별을 구별하는 방법이다. 닭 감별은 주로 대형 상업적 부화장에 의해 실행되는데, 이들은 성별을 성별 그룹으로 분리하기 위해 및 원하는 그룹의 성장과 상업적 요구를 충족시키지 못하는 원치않는 그룹의 도축을 포함할 수 있는 다른 프로그램으로 이들을 가져오기 위해 성별의 차이를 알아야 한다. 예를 들어, 수컷은 에그 레이어 (egg layer) 상업 품종 라인에서 나온 알에서 부화하였다. 그 수컷은 육류 생산량이 많지 않고 알을 낳지 않으며, 따라서 암수감별 후에 도축될 것이다. 암수감별시, 관련 성별은 목적을 달성하는 과정을 계속하는 반면, 다른 성별 또는 이의 대부분은 산란과 관계없는 부화의 날짜 이내에 도축될 것이다.
알을 생산하는 농장에서, 수컷은 원치 않으며, 원치 않는 성별의 병아리는 사육자에 비용을 절감하기 위해 거의 즉시 죽는다. 병아리는 컨베이어 벨트 아래로 이동되며, 여기서 병아리 감별사가 수컷을 분리하여 이들을 활송장치(chute)로 던져 넣고, 여기서 이들은 통상적으로 산채로 고기 분쇄기에서 분쇄된다.
부화 전에 알의 수정력 및 알에서 배아의 성별을 확인하고 감별하면, 알에 있는 동안 무정란 및 원치 않는 유형의 배아를 제거할 수 있고, 따라서 (대기 오염 및 에너지 소비와 함께 에너지 및 효율 비용을 포함한) 부화 비용을 대단히 줄일 수 있을 것이다. 또한, 병아리의 고통은 멈추고 도축으로부터의 오염이 예방될 것이다. 자동 암수감별 장치는 병아리 감별사의 필요성을 제거함으로써 산란 비용을 절감할 뿐만 아니라 초기 단계에서 알의 50%가 공정에서 공제되어 감소되기 때문에 필요한 부화장의 크기를 줄이고, 따라서 이러한 알을 부화시키는 비용, 및 나중에 정교한 도살 절차에 대한 필요를 줄일 것이다.
육종, 산란, 또는 육 생산을 목적으로 한 모든 상업적 유형의 조류에서는, 수정력 및 배아의 성별을 감별해야 할 필요성이 있다. 에너지 절약, 생물보안 위험 감소, 쓰레기 처리, 감별 노동 비용 및 감별 오류, 도축 비용 및 처리, 및 동물 복지에 있어서 큰 경제적 수익이 있다.
제WO 2010/103111호는 그 중에서도 배아 상의 성별-특이 항원과 일치하도록 특별히 설계된 표지된 항체를 알에 도입하는 일련의 단계들을 포함하는 침습적 방법을 기술한다.
제WO 2014/0296707호는 새의 알에 주사되는 백신접종의 효율을 정량 또는 평가하기 위한 바이오마커로서 기능하도록 설계된 휘도 조성물을 기술한다. 본 개시내용에는 성 감별이 기술되거나 심지어 암시되지도 않는다. In-ovo 주사 장치 및 검출 방법은 미국 특허 제6,244,214호에 의해 개시되었다.
제WO 06124456A2호는 조류 알로부터의 배아 액 (예를 들어, 요막액 또는 혈액)의 샘플에서 에스트로겐 스테로이드 화합물의 존재를 결정함으로써 조류 배아의 in-ovo 성 감별의 침습적 방법을 개시한다. 화합물의 존재를 결정하는 것은 상기 조류 알로부터 수득된 샘플에서 분석물을 형광 현미경을 이용한 경쟁적 면역분석에 의해 측정함으로써 수행된다.
분광학적 접근법이 또한 기술되었으며, 이들 중에는 조류 배아 깃털 색을 스크리닝 (부하전)하고 깃털 색에 기초하여 조류 배아의 성별을 감별하는 것에 기반하는 제US2014069336A호, 또는 입사광 신호에 대한 껍질-특이 스펙트럼 반응을 수득하는 장치를 개시하는 제WO16005539호가 있다.
난내(in ovo) 암수감별을 해결하는 추가의 유전자 접근법은 새의 Z 및 W 염색체에 위치한 두 개의 특정 유전자를 검출하기 위한 수정란에서 얻은 DNA 샘플의 DNA 서열분석 (제WO 96/39505호), 또는 암컷 W 염색체의 특정 서열에 혼성화하는 올리고뉴클레오티드 프로브의 사용 (제WO 97/49806호)을 포함한다. 이러한 방법은 침습적이며 따라서 안전한 전략을 제공하지 않는다.
주기적으로 간격을 띠고 분포하는 짧은 회문구조 반복서열 (CRISPR)/CRISPR-연관된 (Cas) 시스템은 높은 성공률로 간단한 작제물 설계를 가능하게 하는 최신식 유전자 편집 시스템이다 (M. Jinek, 2012).
Niu 등 (2014)은 가이드 RNA (gRNA) 및 Cas9 RNA를 원숭이 난모세포에 주사하여 3개의 표적 유전자를 변형시켰고, Hwang 등 (2013)은 제브라피쉬 배아에서 drd3 및 gsk3b 유전자를 변형시켜 2-유전자좌(locus) 돌연변이체를 수득하였다. Cong 및 Zhang (2015)은 살아있는 세포에서 임의의 유전자를 편집하기 위해 CRISPR 시스템을 변형시켰다.
Veron 및 동료들 (2015)은 닭 배아에서 체세포의 발현 수준이 PAX7 전사 인자에 대해 지시된 CRISPR gRNA 플라스미드의 전기천공에 의해 변형되었음을 입증하였고 (Nadege et al. 2015), Bai 및 동료들은 PPAR-g, ATP 신타제 엡실론 서브유닛 (ATP5E)을 편집하였다.
Quansah, E. 등은 PiggyBac 트랜스포손 시스템을 사용하여 닭에서 정자 매개된 유전자이식을 개시하였다. 특히, 이들은 aGFP 플라스미드 및 리포펙타민 LTXTM 9LPX) 조합은 닭 정자의 생존성, 이동성 또는 수정력에 영향을 미치지 않았다고 개시한다.
제CA2264450호는 다능성 세포를 사용하여 생산된 세포 배아 및 유전자이식 동물에서 이종 성 염색체에 선택적으로 통합된 형광 단백질 마커를 암호화하는 핵산 서열을 포함하는 다능성 세포 및, 이러한 세포, 배아, 및 동물의 용도를 개시한다. 이 공보는 특히 포유동물 세포에서의 GFP에 관한 것이다.
Doran T. 등은 ASAP Animal Production 2016, Adelaide에서 생물학적 마커인 GFP 리포터 유전자(reporter gene)를 성 염색체에 부가함으로써 부화전 수컷과 암컷을 구별하는 전략을 일반적으로 기술한다. CRISPR 기술을 사용한 병아리의 성 염색체에의 GFP 리포터 유전자의 통합은 2014년 브라질리아의 IWRAB-II에서의 발표에서 기술되었다. 그러나, 이러한 일반 공보에서는 표지화된 염색체가 알을 UV 광선에 노출시킴으로써 난내 가시화된다고 개시하지만, 알의 자가-형광 (auto-fluorescence)으로 인해, 어떠한 검출 가능한 신호도 예상되지 않는다.
따라서, 병아리의 부화 이전에 알 단계 동안 성 식별을 위한 효과적이고 비침습적인 방법은 현재 이용 가능하지 않다. 따라서, 부화되지 않은 알에서 배아의 정확하고 안전한 성 식별을 가능하게 하는 방법이 오랫동안 필요한 것으로 느껴지고 있다.
본 발명의 제1 측면은 부화되지 않은 알, 특히 수정된 부화되지 않은 알에서 조류, 또는 조류 배아의 성 감별의 방법에 관한 것이다. 일부 특정 실시양태에서, 방법은 다음의 단계를 포함할 수 있다:
첫째, 단계 (a)에서, 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 위치 또는 장소 (본원에서는 유전자좌라고도 함)에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 적어도 하나의 유전자이식 조류 대상체 또는 동물을 제공하거나 수득하는 단계. 두 번째 단계 (b)에서, 유전자이식 조류 대상체 또는 이의 임의의 세포로부터 적어도 하나의 수정란을 수득하는 단계.
다음 단계 (c)는 적어도 하나의 검출 가능한 신호가 검출되는지 알에서 결정하는 단계를 포함한다. 보다 특정한 실시양태에서, 적어도 하나의 검출 가능한 신호의 검출은 상기 적어도 하나의 리포터 유전자의 발현을 나타내며, 이에 의해 조류 배아에서 W 염색체 또는 Z 염색체의 존재를 나타낸다. 일부 특정 실시양태에서, 통합된 리포터 유전자는 적색 형광 단백질 (RFP)을 암호화할 수 있다.
제2 측면에서, 본 발명은 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 위치 또는 장소에 통합된 적어도 하나의 외인성 리포터 유전자를, 이의 적어도 하나의 세포에, 포함하는 조류 유전자이식 동물에 관한 것이다. 일부 특정 실시양태에서, 통합된 리포터 유전자는 RFP를 암호화할 수 있다.
또 다른 측면에서, 본 발명은 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 위치 또는 장소에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 세포에 관한 것이다.
추가의 측면에서, 본 발명은 다음을 포함하는 키트(kit)를 제공한다:
(a) 적어도 하나의 Cas9 단백질 또는 이의 임의의 단편 또는 유도체, 또는 상기 적어도 하나의 Cas9 단백질을 암호화하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제1 핵산 서열; 및 성 염색체 Z 또는 W 내에 위치한 적어도 하나의 프로토스페이서(protospacer)를 표적화하는 적어도 하나의 가이드 RNA (gRNA)를 암호화하는 적어도 하나의 핵산 서열; 및 (b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제2 핵산 서열.
여전히 추가로, 본 발명은 부화되지 않은 알에서 수정을 감별 및 검출하는 방법을 제공한다. 보다 구체적으로, 이러한 방법은 다음의 단계를 포함한다:
첫째, 단계 (a)에서, 암컷 대상체의 경우에는 성 염색체 Z 및 W 둘 다에서 적어도 하나의 위치 또는 장소에 및 수컷에서는 성 염색체 Z 둘 다에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 적어도 하나의 유전자이식 조류 대상체 또는 동물을 제공하거나 수득하는 단계. 제2 단계 (b)에서 유전자이식 조류 대상체 또는 이의 임의의 세포로부터 적어도 하나의 수정란을 수득하는 단계. 다음 단계 (c)는 적어도 하나의 검출 가능한 신호가 검출되는지 알에서 결정하는 단계를 포함한다. 보다 특정한 실시양태에서, 적어도 하나의 검출 가능한 신호의 검출은 상기 적어도 하나의 리포터 유전자의 발현을 나타내며, 이에 의해 (암컷의 경우에 표지된 모계 W 염색체 또는 Z 염색체 또는 조류 배아에서 표지된 부계 Z 염색체의 존재를 나타낸다.
본 발명의 이들 및 추가의 실시양태는 다음의 도면에 의해 자명해질 것이다.
본원에 개시된 주제를 더 잘 이해하고 이것을 실제로 어떻게 수행할 수 있는지를 예시하기 위해, 실시양태들이 이하에서 첨부 도면을 참조하여 단지 비제한적인 예로서 기술될 것이며, 여기서:
도 1a-1b. 알의 형광을 평가하기 위한 전체 설정
도 1a는 난내 성 감별을 위해 본 발명의 방법에 의해 사용되는 장치의 사진을 보여준다. 전체 설정은 레이저 소스 (h), 레이저 소스 홀더 (g), 알을 위한 스탠드 (e), 알 (f), 렌즈 (d), 필터 (c), 검출기를 위한 스탠드 (b) 및 검출기 (a)로 구성된다. 다른 부품들이 견고한 지지대 (i) 상에 배치된다.
도 1b는 도 1a에 도시된 본 발명의 장치의 개략도를 보여준다. 장치는 레이저 소스 (h), 레이저 소스 홀더 (g), 알을 위한 스탠드 (e), 알 (f), 렌즈 (d), 필터 (c), 검출기를 위한 스탠드 (b) 및 검출기 (a)를 포함한다. 다른 부품들이 견고한 지지대 (i) 상에 배치된다.
도 2. 플루오레세인을 갖거나 갖지 않는 청색 레이저 ( 473 nm )를 사용한 형광 강도
완전한 알을 10μM 또는 1mM 플루오레세인 (fl)을 갖거나 갖지 않는 청색 레이저에 적용하였을 때 검출기에 수신된 형광 강도 [Pout], 강도는 광원 강도 [Pin]의 함수로 나타내어진다.
도 3. 로다민을 갖거나 갖지 않는 녹색 레이저 ( 532 nm )를 사용한 형광 강도
완전한 알을 로다민을 갖거나 갖지 않는 녹색 레이저에 적용하였을 때 검출기에 수신된 형광 강도 [Pout], 강도는 광원 강도 [Pin]의 함수로 나타내어진다.
도 4. dir을 갖거나 갖지 않는 녹색 레이저 ( 532 nm )를 사용한 형광 강도
완전한 알을 dir을 갖거나 갖지 않는 녹색 레이저에 적용하였을 때 검출기에 수신된 형광 강도 [Pout], 강도는 광원 강도 [Pin]의 함수로 나타내어진다.
도 5. dir을 갖거나 갖지 않는 적색 레이저 (632.8 nm)를 사용한 형광 강도
완전한 알을 dir을 갖거나 갖지 않는 적색 레이저에 적용하였을 때 검출기에 수신된 형광 강도 [Pout], 강도는 광원 강도 [Pin]의 함수로 나타내어진다.
도 6. GFP를 발현하는 세포
GFP를 발현하는 GFP-벡터로 형질감염된 HEK 세포의 형광 신호를 제공하는 그림.
도 7. RFP를 발현하는 세포
RFP를 발현하는 RFP-벡터로 형질감염된 HEK 세포의 형광 신호를 제공하는 그림.
도 8. 대조군 측정
알의 다른 위치에서 녹색 레이저 및 적색 필터를 사용한 형광 강도. 검출기에 수신된 형광 강도 [Pout]는 광원 강도 [Pin]의 함수로 나타내어진다.
도 9. RFP 측정
녹색 레이저 및 적색 필터를 사용한 상이한 농도의 RFP-발현 세포가 주사된 알의 형광 강도의 측정. 검출기에 수신된 형광 강도 [Pout]는 광원 강도 [Pin]의 함수로 나타내어진다.
도 10. RFP 각도
녹색 레이저 및 적색 필터를 사용한 알의 결정된 최적 위치에서의 여기된 알의 RFP 형광 강도 측정. 검출기에 수신된 형광 강도 [Pout]는 광원 강도 [Pin]의 함수로 나타내어진다.
도 11a-11b. PBS 또는 글리세롤과 RFP-발현 세포
도면은 녹색 레이저를 사용하여 PBS 또는 글리세롤과 상이한 농도의 RFP-발현 세포가 주사된 알의 형광 강도를 보여준다.
도 11a는 PBS에서 함께 상이한 농도의 RFP-발현 세포를 함유하는 알의 형광 강도를 보여준다. 도 11b는 글리세롤에서 상이한 농도의 RFP-발현 세포를 함유하는 알의 형광 강도를 보여준다. 검출기에 수신된 형광 강도 [Pout]는 광원 강도 [Pin]의 함수로 나타내어진다.
도 12. PBS 또는 글리세롤과 GFP-발현 세포
도면은 청색 레이저를 사용하여 PBS 또는 글리세롤과 30,000 GFP-발현 세포가 주사된 알의 형광 강도를 보여준다. 검출기에 수신된 형광 강도 [Pout]는 광원 강도 [Pin]의 함수로 나타내어진다.
도 13. RFP vs. GFP
도면은 GFP-발현 세포 또는 RFP-발현 세포로부터의 형광 단백질 강도 및 자가 형광 강도 사이의 비율을 보여준다.
형광과 자가 형광 사이의 비율을 설명하는 파라미터 R은 광원 강도 [Pin]의 함수로 나타내어진다.
도 14. 암컷 Z 염색체에의 RFP의 통합
도면은 닭 ChZ 좌측 & 우측 아암 및 CMV-hspCas9-H1-gRNA를 갖는 pDsRed를 사용한 RFP 형질감염된 암탉 세포주를 보여준다.
도 15a-15b. 암탉 세포주의 염색체 Z에 통합된 서열의 개략도
볼드체 서열은 Z 염색체의 측면 좌측 및 우측 아암을 나타내고 각각 서열 번호 60 및 서열 번호 61로 표시되며; 이탤릭체로 표시된 서열 (1017bp)은 서열 번호 62로 표시된 바와 같은 좌측 아암을 나타내고; 밑줄친 서열 (629bp)은 서열 번호 63으로 표시된 바와 같은 CMV 인핸서, 프로모터 및 MCS를 나타내고; 굵은 이탤릭체 서열 (714bp)은 서열 번호 64로 표시된 바와 같은 dsRED2 리포터 유전자를 나타내고; 중간색-3332bp를 갖는 서열은 dsRED 플라스미드 함량을 나타내고; 밑줄친 이탤릭체 서열 (1026bp)은 서열 번호 65로 표시된 바와 같은 우측 아암을 나타낸다. 서열의 좌측 부분은 서열 번호 66 (모든 부분은 벡터 서열에 5', 도 15a에 나타냄)로 표시되고 서열의 우측 부분은 서열 번호 67로 표시된다 (모든 부분은 벡터 서열에 3', 도 15b에 나타냄).
도 1a-1b. 알의 형광을 평가하기 위한 전체 설정
도 1a는 난내 성 감별을 위해 본 발명의 방법에 의해 사용되는 장치의 사진을 보여준다. 전체 설정은 레이저 소스 (h), 레이저 소스 홀더 (g), 알을 위한 스탠드 (e), 알 (f), 렌즈 (d), 필터 (c), 검출기를 위한 스탠드 (b) 및 검출기 (a)로 구성된다. 다른 부품들이 견고한 지지대 (i) 상에 배치된다.
도 1b는 도 1a에 도시된 본 발명의 장치의 개략도를 보여준다. 장치는 레이저 소스 (h), 레이저 소스 홀더 (g), 알을 위한 스탠드 (e), 알 (f), 렌즈 (d), 필터 (c), 검출기를 위한 스탠드 (b) 및 검출기 (a)를 포함한다. 다른 부품들이 견고한 지지대 (i) 상에 배치된다.
도 2. 플루오레세인을 갖거나 갖지 않는 청색 레이저 ( 473 nm )를 사용한 형광 강도
완전한 알을 10μM 또는 1mM 플루오레세인 (fl)을 갖거나 갖지 않는 청색 레이저에 적용하였을 때 검출기에 수신된 형광 강도 [Pout], 강도는 광원 강도 [Pin]의 함수로 나타내어진다.
도 3. 로다민을 갖거나 갖지 않는 녹색 레이저 ( 532 nm )를 사용한 형광 강도
완전한 알을 로다민을 갖거나 갖지 않는 녹색 레이저에 적용하였을 때 검출기에 수신된 형광 강도 [Pout], 강도는 광원 강도 [Pin]의 함수로 나타내어진다.
도 4. dir을 갖거나 갖지 않는 녹색 레이저 ( 532 nm )를 사용한 형광 강도
완전한 알을 dir을 갖거나 갖지 않는 녹색 레이저에 적용하였을 때 검출기에 수신된 형광 강도 [Pout], 강도는 광원 강도 [Pin]의 함수로 나타내어진다.
도 5. dir을 갖거나 갖지 않는 적색 레이저 (632.8 nm)를 사용한 형광 강도
완전한 알을 dir을 갖거나 갖지 않는 적색 레이저에 적용하였을 때 검출기에 수신된 형광 강도 [Pout], 강도는 광원 강도 [Pin]의 함수로 나타내어진다.
도 6. GFP를 발현하는 세포
GFP를 발현하는 GFP-벡터로 형질감염된 HEK 세포의 형광 신호를 제공하는 그림.
도 7. RFP를 발현하는 세포
RFP를 발현하는 RFP-벡터로 형질감염된 HEK 세포의 형광 신호를 제공하는 그림.
도 8. 대조군 측정
알의 다른 위치에서 녹색 레이저 및 적색 필터를 사용한 형광 강도. 검출기에 수신된 형광 강도 [Pout]는 광원 강도 [Pin]의 함수로 나타내어진다.
도 9. RFP 측정
녹색 레이저 및 적색 필터를 사용한 상이한 농도의 RFP-발현 세포가 주사된 알의 형광 강도의 측정. 검출기에 수신된 형광 강도 [Pout]는 광원 강도 [Pin]의 함수로 나타내어진다.
도 10. RFP 각도
녹색 레이저 및 적색 필터를 사용한 알의 결정된 최적 위치에서의 여기된 알의 RFP 형광 강도 측정. 검출기에 수신된 형광 강도 [Pout]는 광원 강도 [Pin]의 함수로 나타내어진다.
도 11a-11b. PBS 또는 글리세롤과 RFP-발현 세포
도면은 녹색 레이저를 사용하여 PBS 또는 글리세롤과 상이한 농도의 RFP-발현 세포가 주사된 알의 형광 강도를 보여준다.
도 11a는 PBS에서 함께 상이한 농도의 RFP-발현 세포를 함유하는 알의 형광 강도를 보여준다. 도 11b는 글리세롤에서 상이한 농도의 RFP-발현 세포를 함유하는 알의 형광 강도를 보여준다. 검출기에 수신된 형광 강도 [Pout]는 광원 강도 [Pin]의 함수로 나타내어진다.
도 12. PBS 또는 글리세롤과 GFP-발현 세포
도면은 청색 레이저를 사용하여 PBS 또는 글리세롤과 30,000 GFP-발현 세포가 주사된 알의 형광 강도를 보여준다. 검출기에 수신된 형광 강도 [Pout]는 광원 강도 [Pin]의 함수로 나타내어진다.
도 13. RFP vs. GFP
도면은 GFP-발현 세포 또는 RFP-발현 세포로부터의 형광 단백질 강도 및 자가 형광 강도 사이의 비율을 보여준다.
형광과 자가 형광 사이의 비율을 설명하는 파라미터 R은 광원 강도 [Pin]의 함수로 나타내어진다.
도 14. 암컷 Z 염색체에의 RFP의 통합
도면은 닭 ChZ 좌측 & 우측 아암 및 CMV-hspCas9-H1-gRNA를 갖는 pDsRed를 사용한 RFP 형질감염된 암탉 세포주를 보여준다.
도 15a-15b. 암탉 세포주의 염색체 Z에 통합된 서열의 개략도
볼드체 서열은 Z 염색체의 측면 좌측 및 우측 아암을 나타내고 각각 서열 번호 60 및 서열 번호 61로 표시되며; 이탤릭체로 표시된 서열 (1017bp)은 서열 번호 62로 표시된 바와 같은 좌측 아암을 나타내고; 밑줄친 서열 (629bp)은 서열 번호 63으로 표시된 바와 같은 CMV 인핸서, 프로모터 및 MCS를 나타내고; 굵은 이탤릭체 서열 (714bp)은 서열 번호 64로 표시된 바와 같은 dsRED2 리포터 유전자를 나타내고; 중간색-3332bp를 갖는 서열은 dsRED 플라스미드 함량을 나타내고; 밑줄친 이탤릭체 서열 (1026bp)은 서열 번호 65로 표시된 바와 같은 우측 아암을 나타낸다. 서열의 좌측 부분은 서열 번호 66 (모든 부분은 벡터 서열에 5', 도 15a에 나타냄)로 표시되고 서열의 우측 부분은 서열 번호 67로 표시된다 (모든 부분은 벡터 서열에 3', 도 15b에 나타냄).
매일, 수십억 마리의 수컷 병아리가 이들이 알을 낳거나 고기로 빵을 만드는데 유용하지 않기 때문에 질식 또는 분쇄를 통해 폐기되고 있다. 부화하기 전에 배아의 성별을 감별하는 능력은 윤리적으로나 재정적으로 매우 중요하다.
닭에서 성 염색체의 유전적 구성은 수컷의 경우 ZZ이고 암컷의 경우 ZW이다. 이는 W 염색체가 암컷의 성별을 결정한다는 것을 의미한다. 이것은 수컷 성별을 결정하는 것이 아버지로부터의 Y인 인간과는 다르다.
본 발명은 유전자이식 조류 대상체의 성 특이 염색체에 통합된 리포터 유전자를 사용하여 성을 감별하기 위한 비-침습적인 효율적 방법을 제공한다. 부화되지 않은 알의 배아에서의 이러한 리포터 유전자의 발현은 상기 배아의 성별을 명확하고 정확하게 식별한다.
따라서, 본 발명의 제1 측면은 부화되지 않은 알, 특히 수정된 부화되지 않은 알에서 조류, 또는 조류 배아의 성 감별 및 임의로 선택의 방법에 관한 것이다. 일부 특정 실시양태에서, 방법은 다음의 단계를 포함할 수 있다:
첫째, 단계 (a)에서, 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 위치 또는 장소에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 적어도 하나의 유전자이식 조류 대상체 또는 동물을 제공하거나 수득하는 단계. 제2 단계 (b)에서 유전자이식 조류 대상체, 특히 동물 또는 이의 임의의 세포로부터 적어도 하나의 수정란을 수득하는 단계.
다음 단계 (c)는 적어도 하나의 검출 가능한 신호가 검출되는지 알에서 결정하는 단계를 포함한다. 보다 특정한 실시양태에서, 적어도 하나의 검출 가능한 신호의 검출은 적어도 하나의 리포터 유전자의 발현을 나타내며, 이에 의해 조류 배아에서 W 염색체 또는 Z 염색체의 존재를 나타낸다. 따라서, 리포터 유전자가 암컷 유전자이식 조류의 Z 염색체에 통합된 경우에, 검사된 알에서 검출 가능한 신호의 식별은 그 안에 포함된 배아가 그 안에 통합된 리포터 유전자를 갖는 모계 Z 염색체를 갖고, 이에 의해 배아가 수컷으로 식별됨을 나타낸다. 일부 또 다른 실시양태에서, 리포터 유전자가 암컷 유전자이식 조류의 W 염색체에 통합된 경우에, 검사된 알에서 검출 가능한 신호의 식별은 그 안에 포함된 배아가 모계 W 염색체를 지니며 따라서 암컷으로 감별되며, 이에 의해 배아의 성 감별을 제공함을 나타낸다.
본 발명에 의해 제공된 유전자이식 조류는 이후에 본원에 보다 상세하게 기술되는 바와 같이 암컷 또는 수컷일 수 있음을 인지해야 한다. 일부 추가의 특정한 실시양태에서, 유전자이식 동물은 두 가지 상이한 성 염색체를 갖는 성별, 특히 이형배우자 대상체일 수 있다. 일부 특정 실시양태에서 이형배우자 동물은 암컷일 수 있다. 보다 특정한 실시양태에서, 유전자이식 조류 대상체가 암컷인 경우, 본 발명의 방법에 의해 확인된 알을 본 발명에 의해 제공된 유전자이식 암컷 조류가 낳는다. 보다 특정한 실시양태에서, 유전자이식 암컷은 유전자이식 수컷에 의해 또는 일부 다른 실시양태에서, 야생형 조류 수컷에 의해 수정될 수 있다. 여전히 추가로, 수정은 교배에 의해 또는 유전자이식 조류 암컷에게 유전자이식 또는 야생형 조류 수컷으로부터 얻은 정자를 정액주입함으로써 일어날 수 있다. 일부 다른 실시양태에서, 유전자이식 조류가 수컷인 경우, 본 발명의 방법에 의해 확인된 알을 본 발명에 의해 제공된 유전자이식 수컷과 교배되거나 이의 임의의 세포, 특히 이의 성 염색체에 통합된 본 발명의 외인성 리포터 유전자를 포함하는 정자 세포에 의해 정액주입된 야생형 또는 유전자이식 암컷이 낳을 수 있다.
따라서 본 발명은 부화되지 않은 수정란 내에서 조류 배아의 성별을 검출하는 방법을 제공한다. 본 발명의 방법은 조류 배아의 임의의 배아 단계의 부화되지 않은 알에 적용될 수 있음을 인지해야 한다.
본원에 사용된 "배아 발달 단계 또는 조류 배아의 단계"는 배반이 배반엽 단계에 있고 할강이 다크 링의 형상을 취하는 1일째의 단계; 첫 번째 홈이 배반엽의 중심에 나타나고 난황 막이 나타나는 2일째의 단계; 혈액 순환이 시작되고, 머리와 몸통이 구별될 수 있을 뿐만 아니라 뇌와 심장 구조가 박동하기 시작하는 3일째의 단계; 양막강이 배아를 둘러싸도록 발달하고 요막소낭이 나타나는 4일째의 단계; 배아가 C 형상을 취하고 사지가 뻗어나오는 5일째의 단계; 상지와 하지의 손가락이 뚜렷해지는 6일째의 단계; 목이 몸에서 머리를 명확하게 분리하고 부리가 형성되고 뇌가 두부 영역으로 점진적으로 들어가는 7일째의 단계; 눈 색소 침착이 쉽게 보이고, 날개와 다리가 구별되며 외이도가 열리는 8일째의 단계; 발톱이 나타나고 첫 번째 우포가 싹트는 9일째의 단계; 콧구멍이 생기고, 눈꺼풀이 자라며 난치(egg-tooth)가 나타나는 10일째의 단계; 안검열(palpebral aperture)이 타원 형상을 갖고 배아가 병아리의 양상을 갖는 11일째의 단계; 우포가 외이도를 둘러싸고 상부 눈꺼풀을 덮는 반면, 하부 눈꺼풀이 각막의 대부분을 덮는 12일째의 단계; 발톱과 다리 비늘이 뚜렷해지면서 요막이 장요막으로 되는 13일째의 단계; 전신이 빠르게 자라며, 난황 수축이 가속화되고 난백이 점차 사라지는 14일째 내지 16일째의 단계; 신장계가 요산염을 생성하고 부리가 기낭을 가리키고 난백이 완전히 재흡수되는 17일째의 단계; 난황이 내재화하고 양수의 양이 감소되는 18일째의 단계; 난황 재흡수가 가속화되고 부리가 내부 껍질 막을 뚫을 준비가 된 19일째의 단계; 난황이 완전히 재흡수되고, 배꼽이 닫히고, 병아리가 내부 껍질 막을 관통하고, 기낭으로 호흡하며 부화할 준비가 된 20일째의 단계; 병아리가 난치를 사용하여 껍질을 둥글게 뚫고, 12 내지 18시간 안에 껍질로부터 빠져나와 건조되게 하는 21일째의 단계를 가리키는 것으로 주지되어야 한다.
보다 구체적으로, 본 발명의 방법은 배아 발달 과정의 모든 단계에서 알 내부에서 in-ovo 조류 배아의 성별을 감별하는데 적용될 수 있다. 보다 구체적으로, 1일째부터, 2일째부터, 3일째부터, 4일째부터, 5일째부터, 6일째부터, 7일째부터, 8일째부터, 9일째부터, 10일째부터, 11일째부터, 12일째부터, 13일째부터, 14일째부터, 15일째부터, 16일째부터, 17일째부터, 18일째부터, 19일째부터, 20일째부터 및 21일째부터. 보다 구체적으로, 본 발명의 방법은 배아의 성별의 조기 검출, 특히 1일째 내지 10일째의 조기 검출을 위해 적용될 수 있다. 일부 실시양태에서 본 발명의 방법은 배아 발생의 첫날 배아의 성별을 감별할 수 있다. 일부 추가의 실시양태에서, 본 발명의 방법은 2일째에 배아의 성별을 감별할 수 있다. 일부 추가의 실시양태에서, 본 발명의 방법은 3일째에 배아의 성별을 감별할 수 있다. 추가의 실시양태에서, 본 발명의 방법은 4일째에 배아의 성별을 감별할 수 있다. 일부 추가의 실시양태에서, 본 발명의 방법은 5일째에 배아의 성별을 감별할 수 있다. 추가의 실시양태에서, 본 발명의 방법은 6일째에 배아의 성별을 감별할 수 있다. 추가의 실시양태에서, 본 발명의 방법은 7일째에 배아의 성별을 감별할 수 있다. 추가의 실시양태에서, 본 발명의 방법은 8일째에 배아의 성별을 감별할 수 있다. 일부 추가의 실시양태에서, 본 발명의 방법은 9일째에 배아의 성별을 감별할 수 있다. 일부 추가의 실시양태에서, 본 발명의 방법은 10일째에 배아의 성별을 감별할 수 있다. 몇몇 특정 실시양태에서, 본 발명의 방법은 배아 발생 1 내지 5일 사이에 배아의 성별을 감별할 수 있다.
상기 주지된 바와 같이, 본 발명의 방법은 부화되지 않은 수정란에 적용될 수 있다. 용어 "수정란"은 이하에서, 암탉이 2주 내에 수탉에 의해 교배되어 수컷 정자가 암컷 누두(infundibulum)에 침착하고 난소로부터 난자의 방출시 수정 이벤트가 발생하도록 하는 암탉에 의해 낳은 알을 가리킨다. 본원에서 사용되는 바와 같이 " 부화되지 않은 알"은 구조적으로 통합된 (깨지지 않은) 껍질 내에 배아를 함유하는 알 (본원에서는 수정란이라고도 함)과 관련된다.
본 발명의 방법은 검사된 알을 낳는 유전자이식 조류 암컷 또는 수컷의 특정 유전자좌에 통합된 리포터 유전자에 의해 형성된 검출 가능한 신호의 결정에 기초한다.
본원에서 사용되는 바와 같이 "외래 또는 외인성 DNA/유전자의 염색체로의 통합"은 이하에서, 유기체 염색체의 뉴클레오티드 서열의 영구 변형을 가리킨다. 이러한 변형은 세포 분열 동안 추가로 전달되며, 생식성 세포주에서 발생하는 경우 자손에게도 전달될 것이다. 이 경우, 통합된 리포터 유전자가 부화되지 않은 알 내에 배아로 전달될 수 있다. 본원에서 사용되는 용어 "외인성"은 예를 들면 특이적으로 조작된 벡터, 바이러스 또는 임의의 다른 비히클로의 형질전환 또는 형질감염에 의해 유기체로 도입된 유기체 외부로부터 유래하는 것을 가리킨다. 특정 실시양태에 따르는 통합된 외인성 유전자는 리포터 유전자일 수 있다. 용어 "리포터 유전자"는 발현이 다양한 공지된 검정에서 검출될 수 있고 검출된 신호의 수준이 상기 리포터의 존재를 나타내는 폴리펩타이드를 암호화하는 유전자와 관련된다.
상기 주지된 바와 같이, 외인성 리포터 유전자는 조류 성 염색체 Z 또는 W에 통합될 수 있다. 본원에서 사용되는 바와 같이 조류 " 성 염색체 Z 또는 W"는 닭에서 자손의 성별을 감별하는 염색체 시스템을 가리키며, 여기서 수컷은 동형배우자적 성 (ZZ)인 반면, 암컷은 이형배우자적 성 (ZW)이다. 난자에의 W 염색체의 존재는 자손의 성별을 결정하는 반면 Z 염색체는 더 크고 더 많은 유전자를 보유하는 것으로 알려져 있다.
본 발명의 방법은 리포터 유전자의 존재 및 이에 따른 특정 성 염색체의 존재를 나타내고 반영하는 검출 가능한 신호의 검출에 기초한다. "검출 가능한 신호"는 이하에서, 관찰에 의해 또는 방법을 써서 인식 가능한 변화를 가리킨다. 제한없이, 신호는 직접 검출될 수 있다. 일부 실시양태에서, 검출 가능한 응답은 광학 신호이다.
일부 특정 실시양태에서, 본 발명의 방법에 의해 제공된 적어도 하나의 유전자이식 조류 대상체는 적어도 두 개의 상이한 리포터 유전자를 포함할 수 있으며, 각 리포터 유전자는 성 염색체 Z 또는 W 중의 하나에서 적어도 하나의 위치 또는 장소에 통합될 수 있음을 인지해야 한다. 적어도 두 개의 상이한 리포터 유전자의 경우에, 일부 실시양태에서, 성 염색체 각각은 다르게 표지될 수 있다. 형성된 검출 가능한 신호의 평가는 검사된 배아의 성별을 나타낼 수 있다.
일부 특정 실시양태에서, 본 발명의 유전자이식 조류 내에 포함된 리포터 유전자는 적어도 하나의 형광 리포터 유전자일 수 있다. 따라서, 일부 실시양태에서, 발현된 폴리펩타이드는 형광 단백질이고 따라서 분석은 여기시, 특히 적절한 광원으로 여기시 방출된 광의 수준을 측정한다.
용어 "형광"은 흡수된 광 또는 다른 전자기 방사선이 조명된 물질에 의한 광 방출을 가리킨다. 이것은 발광의 한 형태, 즉 열에 의해 야기되지 않는 물질에 의한 광의 방출이다.
"형광 단백질"은 광에 노출될 때 밝은 형광을 나타내는 단백질을 가리킨다. 형광 단백질은 조명 여기 강도의 피크에 대한 특정 파장 및 형광 방출 강도의 피크에 대한 파장을 갖는다. 여기는 형광 단백질의 조명을 가리킨다. 일부 실시양태에서, 여기는 레이저에 의해 제공될 수 있다. 일부 실시양태에서, 신호는 적절한 광학 필터의 사용시 검출될 수 있다.
특정 실시양태에서, 형광 리포터 유전자는 적색 형광 단백질 (RFP), 청록색 형광 단백질 (CFP), 황색 형광 단백질 (YFP), 및 청색 형광 단백질 (BFP)을 포함한 자가-형광 단백질일 수 있다.
일부 추가의 특정 실시양태에서, 임의의 형광 단백질이 본 발명에서 적용 가능할 수 있음을 주지해야 한다. 보다 구체적으로, 원래의 에쿼리아 빅토리아 ( Aequorea victoria ) 해파리 녹색 형광 단백질에서의 돌연변이유발 노력이 청색에서 황색에 이르는 색상 범위의 새로운 형광 프로브를 초래하였으며, 이것이 본 발명에서 일부 실시양태에 따라 적용될 수 있다. 오렌지색 및 적색 스펙트럼 영역에서 방출되는 보다 긴 파장 형광 단백질은 해양 아네모네, 디스코소마 스트리아타 ( Discosoma striata ), 및 산호충 (Anthozoa) 부류에 속하는 암초 산호로부터 개발되었다. 청록색, 녹색, 황색, 오렌지색, 및 심홍색 형광 방출을 갖는 유사한 단백질을 생성하기 위해 여전히 또 다른 종이 채굴되었다.
일부 실시양태에서, 본 발명의 방법, 유전자이식 조류 대상체, 작제물, 세포 및 키트에 적용될 수 있는 리포터 유전자는 황색 형광 단백질일 수 있다. 보다 구체적으로, 녹색 형광 단백질의 결정 구조가 트레오닌 잔기 203 (Thr203)이 발색단 근처에 있음을 나타낸 후 황색 형광 단백질 계열이 개시되었다. 이 잔기의 티로신으로의 돌연변이를 도입하여 발색단의 여기 상태 쌍극자 모멘트를 안정화시키고 여기 및 방출 스펙트럼 둘 다에 대해 더 긴 파장으로 20-나노미터 이동을 야기하였다. 추가 개선으로 가장 밝고 가장 널리 사용되는 형광 단백질 중 하나인 강화된 황색 형광 단백질 (EYFP)이 개발되었다.
황색 형광 단백질의 시트린 (Citrine) 변이체는 EYFP에 비해 매우 밝으며 본 발명의 일부 실시양태에서 적용될 수 있다. 비너스 (Venus)라고 하는 또 다른 유도체가 가장 빨리 성숙하고 있으며 현재까지 개발된 가장 밝은 황색 변이체 중 하나이다. 인도양과 태평양에 고유한 조안투스( Zoanthus) 종으로부터 본래 복제된 산호초 단백질인 ZsYellow1은 진정한 황색 방출을 생성하며 본 발명에도 적용 가능하다.
일부 추가의 실시양태에서, 본 발명의 방법, 유전자이식 조류 대상체, 작제물, 세포 및 키트에 적용될 수 있는 리포터 유전자는 청색 형광 단백질일 수 있다. 녹색 형광 단백질의 청색 및 청록색 변이체는 천연 형광단의 위치 66 (Tyr66)에서 티로신 잔기의 직접 변형으로부터 야기되었다. 이 아미노산의 히스티딘으로의 전환은 450 나노미터에서 최대 파장을 갖는 청색 방출을 야기하는 반면, 트립타민으로의 전환은 약 500 나노미터에서 피크인 숄더와 함께 약 480 나노미터의 주요 형광 피크를 초래한다. 보다 구체적으로, 도입된 개선된 청록색 형광 단백질 중에서, AmCyan1, 및 Cerulean으로 명명된 강화된 청록색 변이체가 가장 큰 가능성을 보인다. 암초 산호, 아네모니아 마자노( Anemonia majano) 로부터 유래한 AmCyan1 형광 단백질 변이체가 또한 본 발명에 적용될 수 있다.
일부 특정 실시양태에서, 본 발명의 방법, 유전자이식 조류 대상체, 작제물, 세포 및 키트에 적용될 수 있는 리포터 유전자는 적색 형광 단백질일 수 있다. 광범위하게 이용되는 최초의 산호-유래 형광 단백질은 디스코소마 스트리아타로부터 유래되었으며 일반적으로 DsRed라고 한다. 일단 완전히 성숙되면, DsRed의 형광 방출 스펙트럼은 583 나노미터에서 피크를 특징으로 하는 반면 여기 스펙트럼은 558 나노미터에서 주요 피크를 가지며 약 500 나노미터에서 작은 피크를 갖는다. 여전히 추가로, 본 발명에 적용될 수 있는 또 다른 변이체는 DsRed2, DsRed -Express 및 RedStar를 포함하지만 이에 제한되지 않는다. 상당한 장래성을 보이는 몇몇 추가의 적색 형광 단백질이 암초 산호 유기체로부터 단리되었다. 본 발명에 적용될 수 있는 이러한 단백질 중 하나는 헤터랙티스 크리스파( Heteractis crispa) 로부터 단리되어 현재 상업적으로 이용 가능한 HcRed1일 수 있다. HcRed1은 돌연변이유발을 통해 적색 광을 흡수하여 588 나노미터에서 최대 흡수 및 618 나노미터의 최대 방출을 갖는 약한 형광 편성 이량체를 생성하는 비-형광 색소 단백질로부터 원래 유래되었다.
여전히 추가로, 일부 실시양태에서, 본 발명의 방법, 유전자이식 조류 대상체, 작제물, 세포 및 키트에 적용될 수 있는 리포터 유전자는 임의의 형광 단백질일 수 있으며, 단 이러한 단백질은 GFP가 아니며, 일부 보다 특정한 실시양태에서, 야생형 GFP가 아니다. 그러나, 일부 실시양태에서, 555 및 585nm에서 여기 및 방출 최대값을 갖는 적색-방출 스펙트럼 종을 형성하는 GFP의 몇몇 돌연변이체 및 변이체가 또한 본 발명에 적용될 수 있다. 일부 추가의 특정 실시양태에서, 이러한 돌연변이체 또는 변이체는 세린 65 및/또는 아스파라긴 68 잔기를 포함할 수 있다. 일부 추가의 실시양태에서, GFP의 이러한 돌연변이체 또는 변이체는 F46L, V163A 및 I167V 중 적어도 하나의 돌연변이를 포함할 수 있다. 일부 추가의 실시양태에서 변이체는 Ser65, Asn68, F46L, V163A 및 I167V의 임의의 조합을 포함할 수 있다.
일부 추가의 실시양태에서, 본 발명의 방법, 유전자이식 조류 대상체, 작제물, 세포 및 키트에 적용될 수 있는 리포터 유전자는 아래 본원의 표 1에 개시된 형광 단백질 중의 어느 것일 수 있음을 주지해야 한다. 일부 추가의 실시양태에서 본 발명의 방법, 유전자이식 조류 대상체, 작제물, 세포 및 키트에 적용될 수 있는 리포터 유전자는 표 1에 개시된 형광 단백질 중의 어느 것일 수 있으며, 단 상기 형광 단백질은 야생형 GFP가 아니다. 일부 또 다른 실시양태에서, 본 발명의 방법, 유전자이식 조류 대상체, 작제물, 세포 및 키트에 적용될 수 있는 리포터 유전자는 표 1에 개시된 형광 단백질 중의 어느 것일 수 있으며, 단 이러한 리포터 유전자는 표 1에 개시된 녹색 형광 단백질 중의 어느 것, 보다 구체적으로, EGFP, Emerald, Superfolder GFP, Azami Green, mWasabi, TagGFP, TurboGFP, AcGFP, ZsGreen, T-Sapphire 중의 어느 하나가 아니다.
놀랍게도 실시예 1 및 2에 의해 나타낸 바와 같이, 본 발명에 의해 밝혀진 알의 자가 형광 특성은 RFP를 발현하는 세포를 보유하는 배아의 검출만을 가능하게 한다.
따라서, 보다 특정한 실시양태에서, 리포터 유전자는 적색 형광 단백질 (RFP)일 수 있다. 용어 "적색 형광 단백질(Red Fluorescent Protein)" 또는 "RFP"는 이하에서, 산호충류 (산호) 및 아네모네로부터 단리된 오렌지색, 적색, 및 원-적색 형광을 방출하는 형광 단백질 뿐만 아니라 이의 임의의 변이체를 가리킨다. RFP 단백질에는 DsRed와 Kaede의 두 가지 주요 유형이 있다. DsRed-유사 RFP는 디스코소마 스트리아타로부터 유래하며 mCherry, zFP538, mKO, mOrange, mRouge, E2-Crimson, mNeptune, TagRFP657, Keima, mKate, mStrawberry, mBanana, mHoneydew, niTangerine, mRaspberry, mPlum, mRFPmars 및 mRFPruby를 포함하지만 이에 제한되지 않는다.
다른 한편으로, Kaede는 돌산호 트라키필라 지오프료이(Trachyphyllia geoffroyi)에서 발견되는 천연 형광 단백질이며, 이것은 ~400 nm에서 조사시 방출 파장을 녹색 (518 nm)에서 적색 (582 nm)으로 비가역적으로 변화시킨다. Kaede 계열 구성원은 예를 들면 산호 로보필리아 헤프리치(Lobophyllia hemprichii) , 덴드로프타야( Dendronephthya) , 모나스트레아 카버노사( Monastrea cavernosa) , 및 리코데아 플로리다(Ricordea florida)에서 각각 발견되는 EosFP, dendFP, mcavRFP, 및 rfloRFP를 포함한다.
당업계에 공지된 임의의 공급원의 본원에 기술된 RFP 중의 어느 것이 본 발명의 방법, 유전자이식 동물, 세포, 키트 및 장치에 적용될 수 있음을 인지해야 한다.
일부 특정 실시양태에서, 본 발명의 방법에 의해 사용될 수 있는 RFP는 포유류 세포에서 높은 발현을 위해 최적화된 (여기 최대 = 558 nm; 방출 최대 = 583 nm) 신규한 적색 형광 단백질 [RFP; [RFP; Matz, M. V., et al. (1999) Nature Biotech. 17:969-973]을 암호화하는 pDsRed1-N1에서 사용되는 RFP일 수 있다. RFP는 인도 태평양 말미잘-관련, Discosoma sp로부터 단리되었으며; DsRed1의 암호화 서열은 144개의 침묵 염기 쌍 변화를 함유하며, 이것은 포유동물 세포에서 높은 발현을 위한 인간 코돈-사용 선호도에 상응한다.
일부 실시양태에서, 본 발명의 방법 및 키트에 의해 사용되는 RFP는 서열 번호 20으로 표시되는 서열을 포함하는 핵산 서열에 의해 암호화될 수 있다. 일부 추가의 실시양태에서, 이러한 RFP는 서열 번호 21로 표시되는 아미노산 서열, 또는 이의 임의의 동족체, 변이체, 돌연변이체 또는 유도체를 포함할 수 있다.
일부 대안적인 특정 실시양태에서, 본 발명에 의해 사용되는 RFP는 GenBank: AAG16224.1로 표시되는 아미노산 서열을 갖는 GenBank: AF272711.1로 개시된 핵산 서열에 의해 암호화된 RFP일 수 있다. 일부 추가의 특정 실시양태에서, 본 발명의 방법 및 키트에 의해 사용되는 RFP는 서열 번호 22로 표시되는 서열을 포함하는 핵산 서열에 의해 암호화될 수 있다. 일부 추가의 실시양태에서, 이러한 RFP는 서열 번호 23으로 표시되는 아미노산 서열, 또는 이의 임의의 상동체, 돌연변이체 또는 유도체를 포함할 수 있다.
일부 실시양태에서, 본 발명의 방법에 의해 사용되는 리포터 유전자는 임의의 형광 단백질일 수 있으며, 단 상기 형광 단백질은 녹색 형광 단백질 (GFP)이 아님을 주지해야 한다. 즉, 일부 특정 실시양태에서, 본 발명의 방법에 의해 제공된 유전자이식 동물의 성 염색체에 통합된 리포터 유전자는 임의의 형광 단백질일 수 있으며 단 상기 형광 단백질은 GFP가 아니다.
여전히 추가로, 일부 특수한 특정 실시양태에서, 리포터 유전자가 RFP인 경우, 일부 실시양태에서, RFP의 여기 파장은 약 500-650 nm인 반면 방출 파장은 약 550-650 nm일 수 있음을 주지해야 한다.
일부 또 다른 실시양태에서, 본 발명의 방법에 의해 검출 가능한 신호를 검출하는 단계는 상기 알을 적절한 광원에 적용하는 단계를 추가로 포함할 수 있다. 일부 추가의 실시양태에서, 약 400 내지 약 650의 파장을 포함하는 적절한 광원에 알을 노출시킴. 일부 추가의 실시양태에서, 임의의 파장의 광이 사용될 수 있으며, 단 상기 광원은 자외선 (UV) 광 (파장 10 내지 400 nm)이 아니다.
일부 특정 실시양태에서, 상기 알을 광원에 적용하는 단계는 형광 단백질의 여기이다. 일부 특별한 실시양태에서, 여기 파장은 약 500 nm 내지 약 650 nm이다. 일부 추가의 실시양태에서, 여기 파장은 약 510, 515, 520, 525, 530, 535, 540, 545, 550, 555, 560, 565, 570, 575, 580, 585, 590, 595, 600, 605, 610, 615, 620, 625, 630, 635, 640 nm이다. 일부 보다 특정한 실시양태에서, 여기 파장은 약 515 내지 약 555 범위일 수 있다. 일부 추가의 실시양태에서, 파장은 532 nm일 수 있다. 일부 특정한 비제한적인 실시양태에서, 광원은 레이저에 의해 제공될 수 있다.
본원에서 사용되는 바와 같이, 용어 "레이저"는 방사선의 유도 방출 (stimulated emission)에 의해 증폭되는 임의의 주파수의 전자기 방사선을 가리킨다. 레이저는 또한 유도 방출이라고 불리는 과정을 통해 전자기 방사선을 방출하는 장치를 가리킨다. 레이저 광은 통상적으로 공간적으로 간섭성이며, 이것은 빛이 좁은 저-발산 빔으로 방출되거나 렌즈와 같은 광학 부품의 도움으로 빔으로 전환될 수 있음을 의미한다.
일부 또 다른 실시양태에서, 레이저는 청색 레이저, 또는 적색 레이저일 수 있다. 보다 특정한 실시양태에서, 광원은 녹색 레이저이다.
특정 실시양태에서, 레이저는 필터와 함께 사용될 수 있다.
본원에서 사용되는 용어 "필터"는 일반적으로 대량으로 염색되거나 간섭 코팅을 갖는 광로에서 평면 유리 또는 플라스틱 장치로서 구현되는, 상이한 파장의 광을 선택적으로 투과시키는 장치에 상응하는 "광학 필터"를 가리킨다.
일부 실시양태에서, 필터는 500 nm 이상을 투과하는 녹색 필터, 또는 540 nm 내지 580 nm를 투과하는 진녹색 필터, 또는 590 nm 내지 650 nm를 투과하는 적색 필터, 또는 650 nm 이상 또는 660 nm 이상을 투과하는 적색 필터일 수 있다.
일부 특별한 실시양태에서, 광원은 532 nm의 파장을 갖는 녹색 레이저일 수 있다. 일부 추가의 실시양태에서, 이러한 레이저는 650 nm 이상을 투과하는 적색 필터에 제공될 수 있다.
닭 생식선은 원시 생식 세포의 소집단으로부터 발달하여, 성선외 부위로부터 생식 융기로 이동하면서 능동 이동의 단계 뿐만 아니라 혈류에서의 수동 순환을 거치게 된다. PGC는 단계 X라고 하는 발달 단계인 갓 낳은 포란하지 않은 알의 중심에 위치한다. 포란(incubation) 동안 PGC는 전방으로 이동하고 혈관내 이물 주입 (intravasation)을 위한 주요 부위로 간주되는 10HH 배아 단계 (대략 33-38시간의 포란)의 생식 신월환(germinal crescent)에 축적된다. 나중에, PGC는 단계 12HH에서 17HH로의 순환 (대략 45-64시간의 포란)에서 발견될 수 있으며, 단계 14HH (약 50-53시간의 포란)에서 최고 농도에 도달할 수 있다. PGC는 중간 중배엽에서 생식선 원기 (gonad anlage)에 인접한 부위에서 순환을 떠나며, 여기서 이들은 단계 15HH (55-55시간의 포란)만큼 조기에 발견될 수 있다. PGC는 배측 장간막을 따라 능동 이동에 의해 생식 융기에 도달하고, 생식선 둘 다를 콜로니화하며, 여기서 이들은 나중에 정조세포 또는 난원세포로 분화된다.
배아는 난황 낭의 상부에 위치한다. 난황은 알에서 자유롭게 회전하며, 배아는 항상 난황의 윗면을 향하고 있다. 포란 동안, 알의 둔단 (기낭이 위치한 곳)이 위를 향하고 있고, 알은 때때로 90 ° 회전한다. 배아가 발달함에 따라, 배아외성 조직의 형성이 배아를 알껍질에서 멀어지게 하고, 배아는 덜 접근 가능해진다.
따라서, 일부 특정 실시양태에서, 알은 상기 광원에 노출된다. 일부 추가의 실시양태에서, 알은 광원에의 임의의 단계의 배아의 노출을 촉진시키는 위치에 배치된다. 일부 추가의 실시양태에서, 알의 단계 X에서 난황의 윗면을 함유하는 영역은 광원으로 여기된다.
일부 추가의 실시양태에서, 상기 알을 광원에 적용하는 상기 단계는 레이저 소스, 알을 위한 스탠드, 렌즈, 필터, 검출기용 스탠드 및 검출기를 포함할 수 있는 시스템, 장비 또는 장치에 의해 제공된다.
본원에서 사용되는 용어 "검출기"는 빛을 검출 및/또는 측정하는 임의 유형의 장치를 가리킨다. 일부 실시양태에서, 검출 가능한 신호, 특히, 형광 신호는 적합한 형광 수단을 사용하여 검출될 수 있음을 주지해야 한다. 일부 실시양태에서, RFP 리포터 유전자에 의해 형성된 검출 가능한 신호는 변형된 광학 현미경과 같은 감광성 장치 또는 고감도 광자 검출기인 전하 결합 소자 (CCD)에 의해 검출될 수 있다.
일부 추가의 실시양태에서, 본 발명의 방법은 적어도 하나의 광원, 적어도 하나의 검출기, 적어도 하나의 필터 및 상기 광원에의 본 발명의 리포터 유전자를 발현하는 세포의 노출을 촉진시키는 적절한 위치에 알을 배치하는 적어도 하나의 홀딩 아암 (holding arm)을 제공하는 임의의 장치, 장비 또는 시스템을 사용하여 수행될 수 있다. 일부 특별한 비제한적인 실시양태에서, 본 발명의 방법은 도 1에 예시된 바와 같은 장치를 사용할 수 있다. 일부 추가의 실시양태에서, 에그 홀더와 렌즈 및/또는 렌즈와 검출기 사이의 거리는 약 1 내지 100 cm의 범위, 특히, 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 및 100 cm, 특히 약 5 내지 25 cm, 보다 특히, 약 20 cm일 수 있다.
따라서, 일부 실시양태에서, 본 발명의 방법은, 예를 들면, 검사된 알에서 검출 가능한 신호의 존재를 결정하는데 적합한, 본원에 기술된 바와 같은 시스템 또는 장치를 제공하는 단계를 추가로 포함할 수 있음을 인지해야 한다. 특히, 레이저 소스, 알을 위한 스탠드, 렌즈, 필터, 검출기용 스탠드 및 검출기를 포함하는 장비 또는 장치. 상기 나타낸 바와 같이, 이러한 장치에 대한 일부 실시양태에서, 약 532nm의 여기 파장을 표시하는 녹색 레이저 소스가 사용될 수 있다. 일부 추가의 실시양태에서, 650nm 이상을 투과하는 필터, 특히 적색 필터가 사용될 수 있다.
여전히 추가의 실시양태에서, 본 발명의 방법에 의해 제공된 적어도 하나의 유전자이식 조류 대상체 또는 동물은 암컷 조류 대상체 또는 동물일 수 있다. 보다 특정한 실시양태에서, 적어도 하나의 리포터 유전자가 암컷 염색체 Z의 적어도 하나의 위치에 통합되는 경우, 검출 가능한 신호의 검출은 부화되지 않은 알의 배아가 수컷임을 나타낸다. 보다 특히, 부계 비표지된 Z 성 염색체를 함유하고 모계 표지된 Z 염색체를 추가로 함유하는 배아는 두 개의 Z 염색체를 함유하고 따라서 수컷이다.
일부 추가의 실시양태에서, 본 발명의 방법에 의해 제공된 적어도 하나의 유전자이식 조류 대상체 또는 동물은 암컷 조류 대상체 또는 동물일 수 있다. 일부 특정 실시양태에서, 적어도 하나의 리포터 유전자가 암컷 염색체 W의 적어도 하나의 위치에 통합되는 경우, 검출 가능한 신호의 검출은 부화되지 않은 알의 배아가 암컷임을 나타낸다. 보다 특히, 부계 비표지된 z 염색체 및 표지된 모계 W 염색체를 함유하는 배아는 암컷인 WZ 염색체를 함유하는 이형배우자적 배아이다.
일부 추가의 실시양태에서, 본 발명의 방법에 의해 제공된 유전자이식 동물은 이의 Z 염색체에 통합된 리포터 유전자를 갖는 수컷 대상체일 수 있다. 이러한 경우에, 이러한 유전자이식 수컷 또는 이의 임의의 정자에 의해 수정된 알에서 결정된 검출 가능한 신호는 배아가 유전자이식 리포터 유전자를 포함하는 부계 Z 염색체를 지니며, 따라서 수컷임을 나타낸다. 여전히 추가의 실시양태에서, 유전자이식 수컷 조류에 의해 수정된 유전자이식 암컷 조류 (둘 다 이의 Z 염색체에 통합된 본 발명의 리포터 유전자를 보유한다)가 낳은 알에서의 검출 가능한 신호의 검출은, 강력한 신호의 경우, 배아가 이의 암컷 및 수컷 Z 염색체에 통합된 리포터 유전자의 두 카피를 지닌다는 것을 나타낼 수 있다. 덜 강한 신호, 예를 들면, 약 50%의 감소된 강도를 갖는 신호의 경우. 알은 암컷으로 감별될 수 있다.
이전에 본원에 나타낸 바와 같이, 본 발명의 방법은 유전자이식 조류 동물의 제공을 포함한다. 유전자이식 조류 동물의 제조는 특정 유전자 편집 화합물 또는 성분을 사용할 수 있는 유전 공학 접근법의 사용을 필요로 한다. 유전자 편집 성분에 대한 비-제한적인 예는 일부 실시양태에서, 뉴클레아제의 사용을 포함할 수 있다.
일부 특정 실시양태에서, 본 발명의 방법에 적용 가능한 뉴클레아제는 RNA 유도 DNA 결합 단백질 뉴클레아제일 수 있다.
본원에 사용된 바와 같이, RNA 유도 DNA 결합 단백질 뉴클레아제(RNA guided DNA binding protein nuclease)는 RNA 분자에 의해 이의 절단 부위 (또는 대안적으로, 임의의 다른 대안적 활성을 위한 부위)로 안내되는 뉴클레아제이다. 이 RNA 분자를 가이드 RNA라고 한다.
따라서, 보다 특정한 실시양태에서, 적어도 하나의 리포터 유전자는 적어도 하나의 프로그램 가능한 조작된 뉴클레아제 (PEN)를 사용하여 본 발명의 방법에 의해 제공되는 유전자이식 조류 대상체 또는 동물의 성 염색체에 통합될 수 있다. 본원에서 사용되는 용어 "프로그램 가능한 조작된 뉴클레아제 (PEN)(programmable engineered nuclease)(PEN)"는 이중 가닥 DNA 병변의 DNA 복구에 관여하고 직접적인 게놈 편집을 가능하게 하는 자연 발생 뉴클레아제로부터 유래된 특정 DNA 서열을 절단하는 합성 효소를 가리킨다.
일부 보다 특정한 실시양태에서, 본 발명의 방법에 의해 사용되는 PEN은 주기적으로 간격을 띠고 분포하는 짧은 회문구조 반복서열 (CRISPR) 클래스 2 또는 클래스 1 시스템 중 어느 하나일 수 있다.
보다 특히, CRISPR(the Clustered Regularly Interspaced Short Palindromic Repeats) 타입 II 시스템은 게놈 공학을 위해 변형된 박테리아 면역 시스템이다.
그러나 모든 게놈 표적에 대한 특정 뉴클레아제-쌍의 설계 및 생성을 필요로 하는 맞춤형 DNA-결합 단백질 뉴클레아제의 사용에 의존하는 징크 핑거 뉴클레아제 (ZFN) 또는 전사-활성화제-유사 이펙터 뉴클레아제 (TALEN)와 같은 다른 게놈 공학 접근법이 또한 본원에 적용될 수 있는 것임을 인지해야 한다.
CRISPR - Cas 시스템은 두 개의 클래스로 분류된다. 클래스 1 시스템은 외래 핵산을 분해하기 위해 다수의 Cas 단백질의 복합체를 사용한다. 클래스 2 시스템은 동일한 목적을 위해 단일 대형 Cas 단백질을 사용한다. 보다 특히, 클래스 1은 타입 I, III, 및 IV로 나뉠 수 있고 클래스 2는 타입 II, V, 및 VI로 나뉠 수 있다.
본원에서 사용되는 바와 같이, SPIDR (Spacer Interspersed Direct Repeats)로도 알려진 CRISPR 어레이는 통상적으로 특정 박테리아 종에 특이적인 최근에 기술된 DNA 유전자좌의 패밀리를 구성한다. CRISPR 어레이는 이. 콜라이 (E. coli)에서 처음 인식된 산재성 짧은 서열 반복체 (SSR)의 또 다른 클래스이다. 이후 몇 년 동안, 유사한 CRISPR 어레이가 마이코박테리움 투베르쿨로시스(Mycobacterium tuberculosis), 할로페락스 메디테라네이(Haloferax mediterranei), 메타노칼도코커스 야나슈이(Methanocaldococcus jannaschii), 써모토가 마리티마(Thermotoga maritima) 및 기타 박테리아 및 고세균에서 발견되었다. 본 발명은 공지된 임의의 CRISPR 시스템, 특히 본원에 개시된 CRISPR 시스템의 사용을 고려하는 것으로 이해되어야 한다. CRISPR-Cas 시스템은 외래 DNA 또는 RNA를 표적으로 하여 파지 공격 및 바람직하지 않은 플라스미드 복제로부터 보호하기 위해 원핵생물에서 진화하였다. CRISPR-Cas 시스템은 반복체 사이에 존재하는 스페이서 (spacer)라고 불리는 짧은 상동 DNA 서열을 기반으로 하는 DNA 분자를 표적으로 한다. 이들 스페이서는 CRISPR-연관된 (Cas) 단백질을 후속적으로 절단되는 프로토-스페이서 (proto-spacers)라고 불리는 외래 DNA 내의 매칭 (및/또는 상보적) 서열로 안내한다. 스페이서는 임의의 DNA 서열을 표적으로 하도록 합리적으로 설계될 수 있다. 또한, 이러한 인식 요소는 임의의 원하는 표적을 인식하고 표적화하도록 별도로 설계될 수 있다. CRISPR 시스템과 관련하여, 당업계의 숙련가에 의해 인식되는 바와 같이, 자연 발생 CRISPR 유전자좌의 구조는 일반적으로 "반복체"라고 하는 다수의 짧은 반복 서열을 포함한다. 반복체는 클러스터로 발생하며 통상적으로 "스페이서"라고 하는 고유한 개재 서열에 의해 주기적으로 이격된다. 전형적으로, CRISPR 반복체는 길이가 약 24 내지 47개 염기 쌍 (bp)으로 다양하며 부분적으로 회문성 (palindromic)이다. 스페이서는 2개의 반복체 사이에 위치하며 전형적으로 각 스페이서는 길이가 약 20 bp 이하 내지 72 bp 이상의 고유한 서열을 갖는다. 따라서, 특정 실시양태에서 본 발명의 방법 및 키트의 적어도 하나의 gRNA를 암호화하는 서열에 사용된 CRISPR 스페이서는 각각 10 내지 75개의 뉴클레오티드 (nt)를 포함할 수 있다. 보다 특히, 약 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75개 또는 그 이상. 일부 특정 실시양태에서 스페이서는 약 20 내지 25개 뉴클레오티드, 보다 특히, 약 20개 핵염기를 포함한다.
적어도 하나의 반복체 및 적어도 하나의 스페이서 이외에, CRISPR 유전자좌는 또한 리더 서열 및 임의로, 적어도 하나의 tracrRNA를 암호화하는 서열을 포함한다. 리더 서열은 전형적으로 첫 번째 반복체의 5 '말단에 바로 인접한 최대 550 bp의 AT-풍부 서열이다.
일부 특정 실시양태에서, 본 발명의 방법에 의해 사용되는 PEN은 CRISPR 클래스 2 시스템일 수 있다. 일부 추가의 특정 실시양태에서, 이러한 클래스 2 시스템은 CRISPR 타입 II 시스템일 수 있다.
보다 특히, CRISPR-Cas 시스템의 세 가지 주요 타입이 기술된다: 타입 I, 타입 II 및 타입 III.
타입 II CRISPR - Cas 시스템은 'HNH'-타입 시스템 (스트렙토코커스-유사; 나이세리아 메닌지티디스 (Neisseria meningitidis) 혈청군 A str. Z2491, 또는 CASS4에 대해 Nmeni 서브타입으로도 알려짐)을 포함하며, 여기서 단일의 매우 큰 단백질인 Cas9는 유비쿼터스 Cas1 및 Cas2에 더하여 crRNA를 생성하고 표적 DNA를 절단하는데 충분한 것으로 보인다. Cas9는 적어도 2개의 뉴클레아제 도메인, 아미노 말단 근처의 RuvC-유사 뉴클레아제 도메인 및 단백질 중간에 있는 HNH (또는 McrA-유사) 뉴클레아제 도메인을 함유하지만, 이들 도메인의 기능은 여전히 규명되어야 한다. 그러나, HNH 뉴클레아제 도메인은 제한 효소가 풍부하고 표적 절단을 담당하는 엔도뉴클레아제 활성을 보유하기 때문이다.
타입 II 시스템은 tracrRNA와 pre-crRNA의 반복체의 일부 사이의 이중체(duplex) 형성을 포함하는 특이한 메커니즘을 통해 pre-crRNA를 절단한다; pre-crRNA 처리 경로에서의 첫 번째 절단이 이러한 반복 영역에서 후속적으로 일어난다. 여전히 추가로, 타입 II 시스템은 cas9 , cas1 , cas2 csn2 , 및 cas4 유전자 중의 적어도 하나를 포함한다는 것을 주지해야 한다. 임의의 타입 II CRISPR-Cas 시스템이 본 발명에 적용 가능할 수 있으며, 특히 타입 II-A 또는 B 중 어느 하나가 적용될 수 있음을 인지해야 한다.
따라서, 일부 추가의 대안적인 실시양태에서, 본 발명의 방법 및 키트에 사용되는 적어도 하나의 cas 유전자는 타입 II CRISPR 시스템 (타입II-A 또는 타입II-B)의 적어도 하나의 cas 유전자일 수 있다. 보다 특정한 실시양태에서, 본 발명의 방법 및 키트에 의해 사용되는 타입 II CRISPR 시스템의 적어도 하나의 cas 유전자는 cas9 유전자일 수 있다. 이러한 시스템은 cas1 , cas2 , csn2 및 cas4 유전자 중 적어도 하나를 추가로 포함할 수 있음을 인지해야 한다.
Cas9에 의한 이중-가닥 DNA (dsDNA) 절단은 " 타입 II CRISPR - Cas " 면역 시스템의 특징이다. CRISPR-연관된 단백질 Cas9는 RNA:DNA 상보성을 사용하여 서열-특이 이중 가닥 DNA (dsDNA) 절단을 위한 표적 부위를 식별하여 특정 표적 서열, 예를 들면, 조류 성 염색체 W 및 Z 내의 특정 표적으로 리포터 유전자를 통합시키는 HDR에 필요한 이중 가닥 브레이크 (DSB)를 생성하는 RNA 유도 DNA 엔도뉴클레아제이다. 표적화된 DNA 서열은 CRISPR 어레이에 의해 특정되며, 이것은 짧은 회문구조 반복체에 의해 분리된 일련의 약 30 내지 40 bp 스페이서이다. 어레이는 pre-crRNA로서 전사되고 프로토-스페이서로 알려진 상보적 DNA 서열을 표적화하기 위해 Cas 단백질 복합체와 연관되는 보다 짧은 crRNA로 가공된다. 이러한 프로토-스페이서 표적은 또한 표적 인식에 필요한 프로토-스페이서 인접 모티프 (PAM)로 알려진 추가의 이웃 서열을 가져야 한다. 결합 후, Cas 단백질 복합체는 표적에서 양쪽 가닥을 절단하기 위한 DNA 엔도뉴클레아제로서 작용하며 후속 DNA 분해는 엑소뉴클레아제 활성을 통해 일어난다.
본원에 사용된 바와 같은 CRISPR 타입 II 시스템은 2개의 필수 성분의 포함을 필요로 한다: "가이드" RNA (gRNA) 및 비-특이 CRISPR-연관 엔도뉴클레아제 (Cas9). gRNA는 Cas9-결합에 필요한 "스캐폴드" 서열 및 변형시키고자 하는 게놈 표적을 정의하는 약 20개 뉴클레오티드 길이의 "스페이서" 또는 "표적화" 서열로 구성된 짧은 합성 RNA이다. 따라서, gRNA에 존재하는 표적화 서열을 단순히 변화시킴으로써 Cas9의 게놈 표적을 변화시킬 수 있다. 본원에 사용되는 가이드 RNA (gRNA)는 Cas9 뉴클레아제에 대한 표적화 특이성 및 스캐폴딩/결합 능력 둘 다를 제공하는 내인성 박테리아 crRNA 및 tracrRNA의 합성 융합체를 가리킨다. "단일 가이드 RNA" 또는 "sgRNA"라고도 한다. CRISPR은 원래 다양한 세포 유형과 유기체에서 표적 유전자를 "녹아웃"하는데 사용되었지만, Cas9 효소의 변형이 표적 유전자를 "녹인"시키고, 표적 유전자를 선택적으로 활성화 또는 억제하며, DNA의 특정 영역을 정제하고, 심지어 형광 현미경을 사용하여 살아있는 세포에서 DNA를 이미지화하도록 CRISPR의 적용 범위를 넓혔다. 게다가, gRNA 생성의 용이성은 CRISPR을 가장 확장 가능한 게놈 편집 기술 중 하나로 만들며 최근에 게놈-와이드 스크린에 사용되어 왔다.
편집하고자 하는 게놈 내의 표적, 특히, 본 발명의 리포터 유전자가 통합될 성 염색체 Z 또는 W 내의 특정 표적 유전자좌는 프로토스페이서 인접 모티프 (PAM)의 바로 상류에 존재해야 한다.
PAM 서열은 표적 결합을 위해 절대적으로 필요하며 정확한 서열은 Cas9의 종 (스트렙토코커스 피오게네스 (Streptococcus pyogenes) Cas9의 경우 5 'NGG 3')에 의존한다. 특정 실시양태에서, S. 피오게네스로부터의 Cas9가 본 발명의 방법 및 키트에서 사용된다. 그럼에도 불구하고, 임의의 공지된 Cas9가 적용될 수 있음을 인지해야 한다. 본 개시내용에서 유용한 Cas9에 대한 비제한적인 예는 본원에서 SpCas9로도 나타내어진 스트렙토코커스 피오게네스 (Streptococcus pyogenes) (SP), 본원에서 SaCas9로도 나타내어진 스타필로코커스 아우레우스 (Staphylococcus aureus) (SA), 본원에서 NmCas9로도 나타내어진 나이세리아 메닌지티디스 (Neisseria meningitidis) (NM), 본원에서 StCas9로도 나타내어진 스트렙토코커스 써모필러스 (Streptococcus thermophilus) (ST), 및 본원에서 TdCas9로도 나타내어진 트레포네마 덴티콜라 (Treponema denticola) (TD)를 포함하지만 이에 제한되지 않는다. 일부 특정 실시양태에서, 스트렙토코커스 피오게네스 M1 GAS의 Cas9, 특히, 단백질 id: AAK33936.1의 Cas9가 본 발명의 방법 및 키트에서 적용될 수 있다. 일부 실시양태에서, Cas9 단백질은 서열 번호 24로 표시된 바와 같은 핵산 서열에 의해 암호화될 수 있다. 추가의 특정 비제한적인 실시양태에서, Cas9 단백질은 서열 번호 25로 표시된 바와 같은 아미노산 서열, 또는 이의 임의의 유도체, 돌연변이체 또는 변이체를 포함할 수 있다. 일단 발현되면, Cas9 단백질 및 gRNA는 gRNA "스캐폴드" 도메인과 Cas9 상의 표면-노출된 양으로 하전된 홈 사이의 상호작용을 통해 리보단백질 복합체를 형성한다. Cas9는 gRNA 결합시 분자를 비활성, 비-DNA 결합 형태에서 활성 DNA-결합 형태로 바꾸는 형태 변화를 겪는다. 중요하게는, gRNA의 "스페이서" 서열은 표적 DNA와 자유롭게 상호작용할 수 있다. Cas9-gRNA 복합체는 PAM과 임의의 게놈 서열에 결합하지만, gRNA 스페이서가 표적 DNA와 일치하는 정도가 Cas9가 절단될 것인지를 결정한다. 일단 Cas9-gRNA 복합체가 추정 DNA 표적에 결합하면, gRNA 표적화 서열의 3' 말단의 "시드" 서열이 표적 DNA에 어닐링되기 시작한다. 시드 및 표적 DNA 서열이 일치하는 경우, gRNA는 3'에서 5' 방향으로 표적 DNA에 계속 어닐링된다.
Cas9는 gRNA 스페이서와 표적 서열 사이에 충분한 상동성이 존재하는 경우에만 표적을 절단할 것이다. 여전히 추가로, Cas9 뉴클레아제는 두 개의 기능적 엔도뉴클레아제 도메인을 갖는다: RuvC 및 HNH. Cas9는 뉴클레아제 도메인을 표적 DNA의 반대 가닥을 절단하도록 위치시키는 표적 결합시 2차 형태 변화를 겪는다. Cas9-매개된 DNA 절단의 최종 결과는 PAM 서열의 상류에 약 3 내지 4개의 뉴클레오티드를 발생하는 표적 DNA 내의 이중 가닥 절단 (double strand break) (DSB)이다.
그후 생성된 DSB는 두 가지 일반적인 복구 경로, 효율적이지만 오류가 발생하기 쉬운 비상동성 말단 봉합 (NHEJ) 경로와 덜 효율적이지만 충실도가 높은 상동성 유도된 수선 (homology directed repair; HDR) 경로 중 하나에 의해 복구될 수 있다. 일부 실시양태에서, 성 염색체 W 또는 Z 내의 특정 표적 유전자좌에의 본 발명의 리포터 유전자의 특이적 통합을 초래하는 삽입은 Cas9에 의해 유발된 DSB의 복구의 결과이다. 일부 특정 실시양태에서, 본 발명의 리포터 유전자는 HDR에 의해 표적 유전자좌에 통합되거나 녹-인된다.
본원에서 사용되는 용어 "상동성 유도된 수선 ( HDR )"은 세포가 이중 가닥 DNA 병변을 복구하는 메카니즘을 가리킨다. HDR의 가장 일반적인 형태는 상동 재조합이다. HDR 복구 메커니즘은 주로 세포 주기의 G2 및 S 단계에서 핵에 존재하는 DNA의 상동체 조각이 있을 때만 세포에 의해 사용될 수 있다. 상동체 DNA 조각이 없는 경우, 비상동성 말단 봉합 (NHEJ)이라고 불리는 다른 과정이 대신 일어날 수 있다. 게놈 편집을 위한 프로그램 가능한 조작된 뉴클레아제 (PEN) 전략은 특정 이중 가닥 DNA 절단 후 HDR 메커니즘의 세포 활성화에 기반한다.
앞서 논의된 바와 같이, Cas9는 두 개의 뉴클레아제 도메인, RuvC 및 HNH의 결합된 활성을 통해 이중 가닥 절단 (DSB)을 생성한다. 엔도뉴클레아제 활성에 중요한 각각의 뉴클레아제 도메인 내의 정확한 아미노산 잔기가 공지되어 있으며 (S. 피오게네스 Cas9에서 HNH의 경우 D10A 및 RuvC의 경우 H840A) 단지 하나의 활성 촉매 도메인을 함유하는 Cas9 효소의 변형된 버전 ("Cas9 틈내기효소"라고 불림)이 생성되었다. Cas9 틈내기효소는 여전히 gRNA 특이성에 기초하여 DNA에 결합하지만, 틈내기효소는 DNA 가닥 중 하나만을 절단할 수 있어서 DSB 대신 "흠(nick)" 또는 단일 가닥 절단을 초래한다. DNA 흠은 손상되지 않은 상보적 DNA 가닥을 주형으로 사용하여 HDR (상동성 유도된 수선)에 의해 신속하게 복구된다. 따라서, 반대쪽 가닥을 표적화하는 두 개의 틈내기효소가 표적 DNA 내에서 DSB를 생성하는데 필요하다 (종종 "이중 흠" 또는 "이중 틈내기효소" CRISPR 시스템이라고 함). DSB를 유발할 수 있을 정도로 근접한 거리 내에 두 개의 부정확한 흠 (off-target nick)이 생성될 가능성이 낮기 때문에 이러한 요건은 표적 특이성을 크게 증가시킨다. 따라서, 본 발명은 특이성을 증가시키고 부정확한 효과를 감소시키기 위해 이중 흠-유도 DSB를 생성하기 위한 이중 틈내기효소 접근법의 사용을 추가로 포함하는 것으로 이해해야 한다.
따라서, 특정 실시양태에서, 적어도 하나의 리포터 유전자는 적어도 하나의 CRISPR/CRISPR-연관된 엔도뉴클레아제 9 (Cas9) 시스템에 의해 매개된 상동성 유도된 수선 (HDR)에 의해 유전자이식 조류 대상체, 특히 동물의 성 염색체에 통합될 수 있다.
상기 나타낸 바와 같이, CRISPR 타입 II 시스템은 적어도 두 개의 요소, 뉴클레아제, 특히, Cas9 및 가이드 RNA를 포함한다. 따라서, Cas9 또는 Cas9를 암호화하는 임의의 핵산 서열 이외에, 본 발명에 의해 사용된 리포터 유전자를 유전자이식 조류 대상체의 성 염색체에 삽입 및 통합시키기 위해, 본 발명은 Cas9를 특정 성 염색체 내의 표적 부위로 표적화하는 가이드 RNA 또는 이러한 gRNA를 암호화하는 임의의 핵산 서열을 추가로 제공한다. 일부 추가의 실시양태에서, 본 발명의 키트의 gRNA는 적어도 하나의 CRISPR RNA (crRNA) 및 적어도 하나의 전사-촉진 crRNA (tracrRNA)를 포함할 수 있다.
일부 대안적인 실시양태에서 본 발명의 키트는 적어도 하나의 gRNA를 암호화하는 핵산 서열을 포함할 수 있다. 이러한 핵산 서열은 표적화하는 적어도 하나의 스페이서 서열을 포함하는 CRISPR 어레이를 포함할 수 있으며 따라서 표적 게놈 DNA 서열에서의 적어도 하나의 프로토스페이서와 동일하다. 핵산 서열은 적어도 하나의 tracrRNA를 암호화하는 서열을 추가로 포함한다는 것을 주지해야 한다.
여전히 추가로, 일부 실시양태에서, 조류 대상체, 또는 동물의 적어도 하나의 세포 또는 조류 대상체, 또는 동물에 도입된 적어도 하나의 세포를 (a) CRISPR Cas9 시스템의 요소들, 특히, 적어도 하나의 Cas9 단백질 또는 상기 적어도 하나의 Cas9 단백질을 암호화하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제1 핵산 서열; 및 성 염색체 Z 또는 W 내에 프로토스페이서를 표적화하는 적어도 하나의 가이드 RNA (gRNA), 또는 상기 적어도 하나의 gRNA를 암호화하는 적어도 하나의 핵산 서열; 및 (b) 적어도 하나의 리포터 유전자를 포함하는 적어도 하나의 제2 핵산 서열과 접촉시키거나 공동-형질감염시킴으로써 적어도 하나의 리포터 유전자가 유전자이식 조류 대상체, 특히 동물의 성 염색체에 통합될 수 있다. 일부 실시양태에서, (a)의 CRISPR Cas9 시스템의 요소가 핵산 서열의 형태로 제공되는 경우에, 이들은 상이한 요소를 포함하는 하나의 핵산 분자 (본원에서 "제1 핵산 서열"이라고 함) 또는 둘 이상의 핵산 분자로 제공될 수 있으며, 각각은 상기 나타낸 요소들 중 하나, 특히 gRNA 및 Cas9를 암호화하는 서열을 포함한다는 것을 주지해야 한다.
따라서, 본 발명의 방법에 의해 사용되는 유전자이식 조류 동물의 제조를 위해, 적어도 두 개의 핵산 분자가 제공되어야 한다.
여전히 추가로, "gRNA" 또는 "표적화 RNA"는, 이것을 암호화하는 CRISPR 시스템의 일부로부터 전사되는 경우, 본원에서 프로토스페이서라고 하는 표적 게놈 DNA의 DNA 서열과 동일하거나 (RNA의 경우에 T를 U로 대체하는 것을 제외함) 또는 상보적인 (따라서 "표적") RNA 서열의 적어도 하나의 세그먼트를 포함하하는 RNA이다. 본 개시내용의 CRISPR 시스템은 임의로 하나 이상의 표적화 RNA를 암호화할 수 있고, 표적화 RNA는 게놈 DNA에서 하나 이상의 표적 서열에 지시될 수 있다. "프로토 -스페이서"는, 본원에서 사용되는 바와 같이, 표적 염색체 내의 표적 서열을 가리킨다. 이러한 프로토-스페이서는 본 발명의 방법 및 키트의 gRNA를 암호화하는 핵산 서열 내에 포함된 CRISPR 스페이서에 의해 암호화된 표적화 RNA에 대해 충분한 상보성을 갖는 핵산 서열을 포함한다.
본 발명의 방법, 뿐만 아니라 이하 본원에 기술된 키트는 핵산 서열을 제공한다. 본원에서 사용되는 바와 같이, "핵산 또는 핵산 분자"는 용어 "폴리뉴클레오티드(들)"와 상호교환 가능하며 이것은 일반적으로 변형되지 않은 RNA 또는 DNA 또는 변형된 RNA 또는 DNA 또는 이들의 임의의 조합일 수 있는 임의의 폴리리보뉴클레오티드 또는 폴리-데옥시리보뉴클레오티드를 가리킨다. "핵산"은, 제한함이 없이, 단일- 및 이중-가닥 핵산을 포함한다. 본원에서 사용되는 용어 "핵산(들)"은 또한 하나 이상의 변형된 염기를 함유하는 상기한 바와 같은 DNA 또는 RNA를 포함한다. 본원에서 사용되는 용어 "올리고뉴클레오티드"는 2개 이상의 데옥시리보뉴클레오티드 및/또는 리보뉴클레오티드, 및 바람직하게는 3개 이상으로 이루어진 분자로서 정의된다. 이의 정확한 크기는 많은 요인에 따라 좌우되며, 이러한 요인들은 올리고뉴클레오티드의 궁극적인 기능 및 사용에 따라 좌우된다. 올리고뉴클레오티드는 약 8 내지 약 1,000개의 뉴클레오티드 길이일 수 있다. 보다 특히, 본 발명의 키트에 의해 사용되는 올리고뉴클레오티드/들은 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000개 또는 그 이상의 염기의 길이 중의 하나를 포함할 수 있다.
핵산 분자는 자연 발생 뉴클레오티드인 단량체 (예를 들어 DNA 및 RNA), 또는 자연 발생 뉴클레오티드의 유사체 (예를 들어, 자연 발생 뉴클레오티드의 알파-거울상이성체 형태), 또는 변형된 뉴클레오티드 또는 이들의 임의의 조합으로 구성될 수 있다. 본원에서 이 용어는 또한 cDNA, 즉 역전사 효소 (RNA-의존적 DNA 폴리머라제)의 작용에 의해 RNA 주형으로부터 생성된 상보적 또는 카피 DNA를 포함한다.
이와 관련하여 "단리된 폴리뉴클레오티드"는 유기체의 게놈으로부터 분리된 핵산 분자이다. 예를 들면, 본 발명의 방법 및 키트에 의해 사용되는 리포터 유전자 또는 이의 임의의 유도체 또는 상동체, 뿐만 아니라 세포의 게놈 DNA로부터 분리된 본 발명의 방법 및 키트의 CRISPR/Cas9 및 gRNA를 암호화하는 서열을 암호화하는 DNA 분자는 단리된 DNA 분자이다. 단리된 핵산 분자의 또 다른 예는 유기체의 게놈에 통합되지 않은 화학적으로 합성된 핵산 분자이다. 특정 종으로부터 단리된 핵산 분자는 그 종으로부터의 염색체의 완전한 DNA 분자보다 작다.
일부 실시양태에서, 본 발명의 (본원에서 후술되는) 방법 및 키트에 의해 사용되는 핵산 서열, 특히, Cas9 및 gRNA, 또는 대안적으로 본 발명의 리포터 유전자를 암호화하는 서열을 포함하는 핵산 서열은 벡터, 카세트 또는 임의의 다른 비히클 내에서 작제되어 제공될 수 있다. 따라서 본 발명은 추가로, 본 발명의 폴리뉴클레오티드, 및 임의로, 본 발명의 핵산 서열에 작동 가능하게 연결된 프로모터, 조절 및 제어 요소, 번역, 발현 및 다른 신호와 같은 추가의 부가적인 요소를 포함하는 재조합 DNA 작제물에 관한 것이다. 본 발명에 의해 제공되는 벡터에 대한 비제한적인 예는 표적 성 염색체로의 리포터 유전자의 통합에 필요한 Cas9 및 특정 gRNA를 암호화하는 핵산 서열을 포함하는 임의의 벡터일 수 있다. 일부 특정 실시양태에서, 본 발명은 성 염색체 Z에 리포터 유전자를 표적화하는, 서열 번호 25로 표시되는 Cas9 및 서열 번호 26으로 표시되는 gRNA7를 암호화하는 핵산 서열을 포함하는 DNA 작제물 또는 벡터를 제공한다. 일부 추가의 실시양태에서 본 발명은 추가로, 본 발명의 리포터 유전자를 암호화하는 핵산 서열, 특히, 성 염색체, 특히, 성 염색체 Z 내의 표적 유전자좌 내로의 재조합 및 통합에 필요한 좌측 및 우측 아암이 측면에 배치되어있는 RFP를 포함하는 벡터 또는 임의의 DNA 작제물을 제공한다. 이러한 벡터에 대한 비제한적인 예는 도 15에 개시된 바와 같은 핵산 서열을 포함하는 벡터일 수 있다. 일부 추가의 실시양태에서, 서열 번호 66 및/또는 서열 번호 67 중의 적어도 하나로 표시되는 핵산 서열을 포함하는 핵산 서열.
여전히 추가로, 본 발명은 본 발명의 벡터 및 DNA 작제물, 특히 본 발명에 의해 기술된 벡터 중 어느 것을 포함하고/하거나 발현하는 임의의 숙주 세포를 추가로 포함한다.
본원에서 사용되는 용어 "재조합 DNA", "재조합 핵산 서열" 또는 "재조합 유전자"는 조류 염색체 Z 및/또는 W 내의 특정 유전자좌에서 상응하는 프로토스페이서에 Cas9를 표적화하는 본 발명의 gRNA와 함께 본 발명의 CRISPR 시스템 중 하나, 특히 CRISPR/Cas9 타입 II를 암호화하는 개방형 판독 프레임을 포함하는 핵산을 가리킨다. 일부 또 다른 실시양태에서, 본원에 사용된 바와 같은 재조합 DNA는 추가로, 본 발명의 리포터 유전자, 특히 이식유전자 (transgene)를 암호화하는 개방형 판독 프레임을 포함하는 핵산을 가리킨다.
본원에서 언급된 바와 같이, 용어 "유전자" 또는 "이식유전자"는 단백질 산물을 암호화하는 자연 발생 또는 합성 핵산을 의미한다. 용어 "핵산"은 뉴클레오티드 및 뉴클레오시드, 예를 들어, cDNA, 게놈 DNA (gDNA), mRNA 및 RNA, 올리고뉴클레오티드, 올리고뉴클레오시드, 및 이의 유도체의 천연 및/또는 합성 선형, 원형 및 순차적 어레이를 의미하는 것으로 의도된다.
어구 "작동 가능하게 연결된"은 이식유전자 전사를 허용하는 방식으로 부착됨을 의미하는 것으로 의도된다. 상기 주지된 바와 같이, 본 발명의 방법에 의해 사용되는 이식유전자는 성 염색체 Z 또는 W에 삽입하고자 하는 이식유전자, 특히, 리포터 유전자, 및 유전자 편집 시스템 (예를 들어, CRISP/Cas9 시스템)을 암호화하는 핵산 서열을 제공함으로써 제조된다. 용어 "암호화"는, 예를 들어, 대상체 핵산이 적합한 벡터 (예를 들어, 발현 벡터)에서 프로모터 및 인핸서 요소와 같은 적절한 제어 서열에 연결된 경우 및 벡터가 적절한 시스템 또는 세포에 도입된 경우 대상체 핵산이 적절한 발현 시스템에서 목적하는 폴리펩타이드 또는 대상체 단백질로 전사되고 번역될 수 있음을 의미하는 것으로 의도된다.
일부 실시양태에서, 본 발명의 방법 및 키트에 의해 제공되고 사용되는 제1 및 제2 핵산 서열 중의 적어도 하나는 벡터 내에 작제되고 포함될 수 있음을 인지해야 한다. "벡터" 또는 "비히클"은, 본원에서 사용되는 바와 같이, 플라스미드, 파지미드, 바이러스, 통합 가능한 DNA 단편, 및 기타 비히클과 같은 벡터를 포함하며, 이것은 숙주의 게놈으로의 DNA 단편의 통합을 가능하게 하거나, 또는 대안적으로, 통합되지 않은 유전자 요소의 발현을 가능하게 한다. 벡터는 전형적으로 목적하는 핵산 서열을 함유하는 자가-복제 DNA 또는 RNA 작제물, 및 적합한 숙주 세포에서 인식되고 원하는 스페이서의 번역을 수행하는 작동 가능하게 연결된 유전자 제어 요소이다. 일반적으로, 유전자 제어 요소는 원핵생물 프로모터 시스템 또는 진핵생물 프로모터 발현 제어 시스템을 포함할 수 있다. 이러한 시스템은 전형적으로 전사 프로모터, RNA 발현 수준을 높이기 위한 전사 인핸서를 포함한다. 벡터는 통상적으로 벡터가 숙주 세포와 무관하게 복제될 수 있게 하는 복제 기점을 함유한다. 일부 대안적인 실시양태에서, 본 발명에 의해 사용되는 발현 벡터는 본 발명의 원하는 리포터 유전자를 조류 성 특이 염색체 W 및/또는 Z로 통합하는데 필요한 요소를 포함할 수 있다.
따라서, 용어 "제어 및 조절 요소"는 프로모터, 종결자 및 다른 발현 제어 요소를 포함한다. 이러한 조절 요소는 문헌[Goeddel; [Goeddel., et al., Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, Calif. (1990)]에 기술되어 있다. 예를 들어, DNA 서열에 작동 가능하게 연결된 경우 DNA 서열의 발현을 제어하는 임의의 광범위한 발현 제어 서열이 본 발명의 방법을 사용하여 임의의 원하는 단백질을 암호화하는 DNA 서열을 발현시키기 위해 이들 벡터에서 사용될 수 있다.
벡터는 적절한 제한 부위, 항생제 내성 또는 벡터-함유 세포의 선택을 위한 다른 마커를 추가로 포함할 수 있다. 플라스미드가 가장 일반적으로 사용되는 벡터의 형태이지만, 동등한 기능을 제공하고 당업계에 공지되어 있거나 공지되는 다른 형태의 벡터가 본원에서 사용하기에 적합하다. 예를 들면, 본원에 참고로 포함된 문헌[Pouwels et al., Cloning Vectors: a Laboratory Manual (1985 and supplements), Elsevier, N.Y.; and Rodriquez, et al. (eds.) Vectors: a Survey of Molecular Cloning Vectors and their Uses, Buttersworth, Boston, Mass (1988)]을 참조한다.
본 발명의 방법에 의해 사용되는 유전자이식 조류 동물을 생성하기 위해, 성 염색체 Z 또는 W 내의 특정 유전자좌에 통합된 리포터 유전자를 포함하는 조류 세포를 제조해야 한다. 이러한 세포는 일부 실시양태에서, 조류 대상체의 세포 또는 상기 대상체에 도입된 임의의 세포를 본 발명의 방법 및 키트에 의해 제공된 제1 및 제2 핵산 서열 또는 이를 포함하는 임의의 작제물, 벡터, 비히클과 접촉, 도입 또는 공동-형질감염시킴으로써 제조될 수 있다. 일부 실시양태에서, 유전자 편집 요소를 암호화하는 핵산 서열, 및 표적화된 리포터 유전자, 특히 RFP를 암호화하는 핵산 서열. 본원에서 사용되는 "형질감염"은 DNA 및 이중 가닥 RNA와 같은 유전 물질을 포유동물 세포에 삽입하는 과정을 의미한다. 세포 내로의 DNA의 삽입은 세포 자체의 기구를 사용하여 단백질의 발현 또는 생산을 가능하게 한다. 따라서, 본원에 사용된 바와 같은 공동-형질감염은 적어도 2개의 상이한 핵산 분자 또는 이를 포함하는 임의의 벡터를 각각의 단일 세포에 동시 형질감염시킴을 가리킨다. 여전히 추가로, 형질감염시키고자 하는 핵산 서열은 단기간 동안 일시적으로 발현되거나, 게놈 DNA에 통합될 수 있으며, 여기서 변화는 세포가 분열함에 따라 세포에서 세포로 전달된다.
따라서, 본 발명은 리포터 유전자, 특히, 이의 성 염색체 (특히, Z 및/또는 W)에 통합된 적색 형광 단백질 (RFP)의 발현에 기초한 in- ovo 조류 배아의 in- ovo 성 감별을 위한 방법을 제공한다. "발현"은 일반적으로 유전자-암호화된 정보가 세포에 존재하고 작동하는 구조로 변환되는 과정을 가리킨다. 따라서, 본 발명에 따르면 리포터 유전자의 "발현"은 특히 폴리뉴클레오티드로의 전사, 단백질로의 번역, 또는 심지어 단백질의 번역후 변형을 가리킬 수 있다.
유전자이식 조류 대상체의 성 염색체 내의 특정 표적 유전자좌로의 리포터 유전자의 삽입 및 특이적 통합은 일부 실시양태에서 특정 gRNA 및 통합되어야 하는 리포터의 핵산의 핵산 서열을 포함하는 CRISPR/Cas9 시스템의 제공을 포함할 수 있다. 통합을 촉진하고 가능하게 하기 위해, 리포터 유전자는, 일부 실시양태에서, 표적화된 통합 부위 측면에 있는 서열과 상동이하고 이에 의해 재조합을 가능하게 할 수 있는 서열이 측면에 있어야 한다. 따라서, 일부 추가의 특정 실시양태에서, 제2 핵산 서열의 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 상동성 아암(homologous arm)이 측면에 있을 수 있다. 일부 실시양태에서, 이러한 아암이 필요하며 따라서 통합 부위에서 리포터 유전자의 HDR을 촉진시킨다는 것을 인지해야 한다.
보다 특정한 실시양태에서, 본 발명의 방법에 의해 사용된 제2 핵산 서열의 리포터 유전자는 HDR를 통한 특이 통합을 촉진시키기 위한 통합 부위로서 작용하는 성 염색체 Z 또는 W 내의 표적 유전자좌 내에 포함된 전부, 전체 또는 완전한 적어도 하나의 핵산 서열과 상동성이거나 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 상동성 또는 동일성을 보이는 2개의 아암이 측면에 있을 수 있다. 특정 실시양태에서, 표적 서열을 본원에서는, 본 발명에 의해 사용되는 gRNA의 일부인 "스페이서" 서열에 의해 인식되고 제1 핵산 서열에 의해 제공되는 적어도 하나의 "프로토-스페이서"라고 한다.
본원에서 사용되는 용어 "상동성 아암 (Homologous arms)"은 (어떠한 PEN이 사용되는지에 따라) 변형하고자 하는 표적 서열을 둘러싸는 일정량의 상동성을 보유하는, 유전자에의 새로운 요소의 특정 돌연변이 또는 삽입을 생성하는데 사용되는, 특정 벡터 또는 바이러스에 도입되는 HDR 주형을 가리킨다. 일부 추가의 특정 실시양태에서, CRISPR이 PEN로서 사용되는 경우, 아암 서열 (좌측, 상류 및 우측, 하류)은 약 10 내지 5000 bp, 특히 약 50 내지 1000 bp, 100 내지 500, 특히 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000bp를 포함할 수 있다.
일부 추가의 실시양태에서, 본 발명의 방법 및 키트에 의해 제공된 제1 핵산 서열에 의해 암호화된 gRNA 내의 표적화 서열은 본워에서 "스페이서" 서열이라고도 하며, 본원에서 "프로토-스페이서"라고 하는 성 염색체 Z 또는 W 내의 표적 유전자좌 내에 포함된 전체, 완전 또는 전부의 적어도 하나의 핵산 서열과 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 상동성 또는 동일성을 나타낸다.
일부 실시양태에서, 제2 핵산 서열의 적어도 하나의 리포터 유전자는 성 특이 프로모터, 배아 특이 프로모터 (예를 들면 α-글로빈 프로모터) 및 유도성 프로모터 (예를 들면 대두 SSU 유전자로부터 유래되거나 파슬리 칼콘 신타제 CHS 프로모터로부터 유래된 광-유도성 프로모터, 또는 청색 광으로 조명될 때 발현을 활성화시키는 박테리아성 광-산소-전압 단백질인 EL222의 조작된 버전) 중 어느 하나에 작동 가능하게 연결될 수 있다. 보다 특정한 실시양태에서, 리포터 유전자는 배아 프로모터의 제어하에 있을 수 있으며, 이에 의해 유전자이식 리포터 유전자의 발현을 배아 단계로 제한하고 성체 병아리에서는 발현되지 않게 한다. 이러한 실시양태에서, 리포터 이식유전자는 진단 목적으로 배아 단계에서만 사용되고 발현될 수 있다.
보다 구체적으로, 본원에서 사용되는 "프로모터"는 하류에 위치한 유전자의 발현을 제어하는 능력을 갖는 DNA의 특정 영역을 가리킨다. 따라서, "병아리에서 성에 특이적인 프로모터"는 이하에서 특정 병아리 성별 (즉, 수컷 또는 암컷)에서만 유전자의 발현을 활성화시키는 프로모터를 가리킨다. 여전히 추가로, "병아리에서 발달에 특이적인 프로모터"는 병아리 발달의 특정 단계에서만 유전자의 발현을 활성화시키는 프로모터를 가리킨다.
일부 특정 실시양태에서, 적어도 하나의 리포터 유전자가 삽입되고 이에 의해 표적 성 염색체의 적어도 하나의 비-암호화 영역(non-coding region)에 통합될 수 있다. 이러한 접근법은 부화되지 않은 배아의 발달 및 성숙에 필요할 수 있는 유전자의 파괴를 피한다.
본원에서 사용되는 "비-암호화 영역"은 단백질 서열을 암호화하지 않는 유기체의 DNA의 성분을 가리킨다. 일부 비암호화 DNA 영역은 기능적 비-암호화 RNA 분자로 전사되고, 비암호화 DNA 영역의 다른 기능은 단백질-암호화 서열, 스캐폴드 부착 영역, DNA 복제 기점, 동원체 및 텔로미어의 전사 및 번역 조절을 포함한다. 가정된 비-기능적 부분 (또는 기능이 알려지지 않은 DNA)은 종종 "정크 DNA (junk DNA)"라고 한다.
일부 특정 실시양태에서, 유전자이식 조류 동물을 제조하기 위해 본 발명의 방법에 의해 사용되는 적어도 하나의 리포터 유전자는 성 Z 염색체에서 적어도 하나의 부위에 통합될 수 있다. 보다 특정한 실시양태에서, Z 염색체의 특정 유전자좌는 암탉의 염색체 Z의 서열 번호 15로 표시된 영역 9156874-9161874, 서열 번호 16으로 표시된 27764943-27769943, 서열 번호 17로 표시된 42172748-42177748, 서열 번호 18로 표시된 63363656-63368656 및 서열 번호 19로 표시된 78777477-78782477 중의 어느 하나일 수 있다.
일부 특정 실시양태에서, 적어도 하나의 리포터 유전자는 특히 서열 번호 17로 표시된 성 Z 염색체 유전자좌 42172748-42177748에서의 적어도 하나의 부위에 통합될 수 있다. 일부 추가의 특정 실시양태에서, Z 염색체 내의 특정 유전자좌에 통합시키기에 적합한 gRNA 서열은 Z 염색체 유전자좌 chrZ_42174515_-1 내에 위치한 프로토스페이서에 지시된 gRNA7을 포함할 수 있지만 이에 제한되지 않는다. 일부 특정 실시양태에서, gRNA는 gRNA7로 명명된 gRNA일 수 있다. 보다 특정한 실시양태에서, 이러한 gRNA7은 서열 번호 26으로 또한 표시된 핵산 서열 GTAATACAGAGCTAAACCAG를 포함할 수 있다. 일부 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 본 발명에 의해 제공되는 리포터 유전자, 특히 RFP를 암호화하는 서열은 이의 5'에 좌측 아암이 측면에 있고 이의 3'에 우측 아암이 측면에 있을 수 있다. 일부 추가의 특정 실시양태에서, 좌측 아암은 서열 번호 31로 표시된 핵산 서열을 포함할 수 있고, 서열 번호 32로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 26의 gRNA7에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.
일부 추가의 특정 실시양태에서, 리포터 유전자를 Z 염색체 내의 이러한 특정 위치에 표적화하는데 필요한 적어도 하나의 gRNA는 서열 번호 11로 표시된 gRNA3: ACAGACCTATGATATGT; 서열 번호 12로 표시된 gRNA4: CGATTATCACTCACAAG; 서열 번호 13으로 표시된 gRNA5: CTGGTTAGCATGGGGAC; 서열 번호 14로 표시된 gRNA6: GTAAAGAGTCAGATACA 중의 어느 하나로 표시된 바와 같은 핵산 서열을 포함할 수 있다.
일부 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 41로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 42로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 11의 gRNA3에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 43으로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 44로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 12의 gRNA4에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 여전히 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 45로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 46으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 13의 gRNA5에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 일부 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 47로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 48로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 14의 gRNA6에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.
Z 염색체 내의 특정 유전자좌로의 통합을 위해 적합한 gRNA 서열에 대한 추가의 비제한적인 예는 서열 번호 27로도 표시되는 핵산 서열 ACAGACCTATGATATGTGAG를 포함하는 Z 염색체 유전자좌 chrZ_9157091_1의 gRNA8, 서열 번호 28로도 표시되는 핵산 서열 GAGCTTGTGAGTGATAATCG를 포함하는 Z 염색체 유전자좌 chrZ_27767602_-1의 gRNA9, 서열 번호 29로도 표시되는 핵산 서열 GTAAAGAGTCAGATACACAG를 포함하는 Z 염색체 유전자좌 chrZ_78779927_1의 gRNA10, 및 서열 번호 30으로도 표시되는 핵산 서열 CAGTGGGTACTGAAGCTGTG를 포함하는 Z 염색체 유전자좌 chrZ_63364946_-1의 gRNA11을 포함할 수 있지만 이에 제한되지 않는다.
추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 33으로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 34로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 27의 gRNA8에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 여전히 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 35로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 36으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 28의 gRNA9에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 37로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 38로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 29의 gRNA10에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 39로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 40으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 30의 gRNA11에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.
일부 대안적인 실시양태에서, 적어도 하나의 리포터 유전자는 성 W 염색체에서 적어도 하나의 부위에 통합될 수 있다. 보다 특정한 실시양태에서, W 염색체에서의 특정 유전자좌는 위치 1022859-1024215일 수 있다. 일부 특정 실시양태에서, 표적 유전자좌는 서열 번호 3으로 표시된 핵산 서열을 포함할 수 있다.
보다 특정한 실시양태에서, 리포터 유전자를 W 염색체 내의 이러한 특정 위치로 표적화하는데 필요한 적어도 하나의 gRNA는 서열 번호 1 및 2 중의 어느 하나로 표시된 핵산 서열을 포함할 수 있으며, 이들 gRNA를 본원에서는 각각 gRNA1 및 gRNA2라고 명명한다.
일부 보다 특정한 실시양태에서, 유전자이식 조류 암컷을 제조하기 위해 본 발명의 방법에 의해 사용되는 gRNA는 서열 번호 1로 표시된 핵산 서열 (gRNA1)을 포함할 수 있다. 이러한 경우에, 상기 제2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 W 염색체에서의 상기 특정 유전자좌로의 이의 통합을 촉진시키는, 각각 서열 번호 4 및 5로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어있을 수 있다. 이러한 아암을 또한 본원에서는 각각 좌측 및 우측 아암이라고 한다는 것을 인지해야 한다.
일부 대안적인 실시양태에서, 본 발명의 유전자이식 조류 암컷을 제조하기 위해 사용되는 gRNA는 서열 번호 2로 표시된 핵산 서열 (gRNA2)을 포함할 수 있다. 이러한 경우에 제2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 6 및 7로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어있을 수 있다. 이러한 아암을 또한 본원에서는 각각 좌측 및 우측 아암이라고 한다는 것을 인지해야 한다.
조류 숙주의 접합자 세포의 유전자좌가 외인성 서열, 특히, 본 발명에 의해 사용되는 리포터 유전자로 표적화 및/또는 형질감염된 경우, 이러한 세포를 사용하여 유전자이식 동물을 생성하는 것이 바람직할 수 있다. 이러한 절차를 위해, 표적화 작제물을 배아 줄기 (ES) 세포에 도입한 후, 세포를 적절한 배지, 예를 들면, 성장 인자 및 사이토킨, 태아 소 혈청 및 항생제가 보충된 DMEM에서 피더 층에 평판배양할 수 있다. 배아 줄기 세포는 단일 표적화된 유전자좌 (이형접합성) 또는 표적화된 유전자좌 둘 다 (동형접합성)를 가질 수 있다. 작제물을 함유하는 세포는 선택 배지를 사용함으로써 검출될 수 있고 콜로니가 성장하기에 충분한 시간 후에 콜로니를 선택하고 유전자 표적화의 발생에 대해 분석할 수 있다. 일부 특정 실시양태에서, 작제물 서열 내부 및 외부의 프라이머를 사용하여, 표적 유전자좌로의 원하는 외인성 서열의 통합을 확인하기 위해 PCR이 적용될 수 있다. 유전자 표적화를 보이는 콜로니가 그후 조류 배아에 주사하기 위해 사용될 수 있다. ES 세포를 그후 트립신화할 수 있고 변형된 세포를 알의 측면에서 만들어진 개구부를 통해 주입할 수 있다. 알을 밀봉한 후, 부화할 때까지 알을 적절한 조건에서 배양할 수 있다. 새로 부화한 조류는, 예를 들면 이의 생물학적 샘플, 예를 들어 혈액 샘플을 검사함으로써 표적 작제물 서열의 존재에 대해 시험할 수 있다. 조류가 성숙에 도달한 후, 이들은 새끼를 낳으며 이들의 자손을 외인성 통합 서열이 생식선을 통해 전달되는지 여부를 결정하기 위해 검사할 수 있다.
생식선을 통해 유전적 변형을 전달할 수 있는 변형된 배아 줄기 세포 또는 접합자 세포로부터 부분적으로 유래되는 키메라 조류가 생성된다. 외인성 서열, 특히 본 발명에 의해 사용되는 리포터 유전자, 또는 이의 일부를 함유하는 조류 품종을 조류 야생형 유전자좌, 또는 이의 일부가 회복된 품종과 교배하면 in- ovo 검출 가능한 성별을 나타내는 후대를 야기해야 한다.
여전히 추가로, 유전자이식 조류는 또한 다른 방법들에 의해 생산될 수 있으며, 이들 중 일부는 아래에 논의되어 있다. 유전자이식 동물을 생성하기 위한 형질전환에 적합한 조류 세포 중에는 원시 생식 세포 (PGC), 정자 세포 및 접합자 세포 (배아 줄기 세포 포함)가 있다. 정자 세포는 전기천공법, 미세입자 충격, 리포펙션 등을 포함하는 임의의 적합한 방법에 의해 DNA 작제물로 형질전환될 수 있다. 정자는 조류의 인공 수정에 사용될 수 있다. 수정된 조류의 후대를 상기 기술된 바와 같이 외인성 서열에 대해 검사할 수 있다.
대안적으로, 원시 생식 세포는 조류 알로부터 단리되고, 임의의 적절한 방법에 의해 본 발명의 외인성 리포터 유전자로 형질감염되고, 새로운 배아로 옮겨지거나 삽입될 수 있으며, 여기서 이들은 발달중인 생식선에 통합될 수 있다. 부화된 조류 및 이들의 후대를 본 발명에 의해 기술된 바와 같이 외인성 리포터 유전자 서열에 대해 검사할 수 있다.
또 다른 접근법에서, 알로부터 단리된 분산된 배반엽 세포는 외인성 리포터 유전자 서열 또는 이의 일부를 성 특이 염색체 Z 또는 W에 통합시킨 다음 무손상 알의 배하강에 주입하는 임의의 적절한 수단에 의해 형질감염시킬 수 있다. 부화된 조류 대상체 및 이들의 후대를 상기 기술된 바와 같이 외인성 리포터 유전자에 대해 검사할 수 있다.
닭 원시 생식 세포 (PGC)는 난자와 정자의 전구물질이다. 따라서, 이의 일부 실시양태에서, 본 발명은 리포터 유전자 작제물로 및 성 특이 염색체 및/또는 Z로의 리포터 유전자의 통합을 지시하는 CRISPR/Cas9 gRNA 작제물로 공동-형질감염된 PGC를 사용하는 생식선 전달 시스템을 통한 유전자이식 닭의 생산을 제공한다. PGC를 분류하고 생식선 전달을 위해 2.5일 수용자 배아의 혈류로 옮긴다.
PGC는 생식체 (gamete)의 전구물질이며 포유동물과 비교할 때 새에서 초기 배아발생 동안 독특한 이동 활성을 보인다. 조류 배아에서, PGC는 먼저 에피블라스트 (epiblast)에서 발생하고 배양 후 대략 18-19시간에 단계 4 (HH)에서 생식 신월환의 내배엽 (hypoblast)으로 이동한다. 단계 10 및 12 (HH) 사이에서, PGC는 생식 신월환에서 혈류로 이동하고, 이들이 생식 융기에 도달하고 발달하는 생식선을 콜로니화할 때까지 순환계를 통해 이동한다. 이것은 PGC가 배아 조직을 통해 이동하여 발달하는 생식선에 도달하는 포유동물과 대조된다. 혈류를 통한 조류 PGC 이동의 이러한 독특한 특징이 닭의 유전자 변형에서 주요한 진보를 촉진시켰다.
따라서, 일부 특정 실시양태에서, "유전자이식 조류 동물의 제조"는 게놈 변형으로 닭을 생산하기 위한 유전 공학 기술을 포함하는 다단계 방법을 가리키며 여기서 a) 원시 생식 세포 (PGC)를 2일령 병아리 배아의 혈액으로부터 단리하는 단계; b) 이식유전자 작제물을, 예를 들면, 렌티바이러스 시스템, Piggybac 트랜스포손 벡터, TALENS 또는 CRISPR/Cas9 기술을 사용함으로써 배양된 PGC에 삽입하는 단계; (c) 유전자이식 PGC를 확인하고 배아의 순환계로 주입하고 발달하는 생식선으로 이동시키는 단계; d) 수용자 배아를 부화할 때까지 37℃에서 배양하는 단계; (d) 부화된 수컷을 성적으로 성숙시켜 야생형 암탉과 교배하는 단계; (e) 자손을 선별하여 유전자이식 PGC로부터 유래된 것들을 식별하는 단계.
따라서, 제2 측면에서, 본 발명은 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 위치 또는 장소 (본원에서는 또한 유전자좌라고 함)에 통합된 적어도 하나의 외인성 리포터 유전자를, 이의 적어도 하나의 세포에, 포함하는 조류 유전자이식 동물 또는 대상체에 관한 것이다.
용어 "조류"는 깃털, 이가 없는 부리 턱, 껍질이 딱딱한 알의 산란, 높은 대사율, 4실의 심장, 및 경량이지만 강한 골격을 특징으로 하는 새로부터 유래한 임의의 종과 관련이 있다. 조류 종은, 제한함이 없이, 닭, 메추라기, 칠면조, 오리, 갈리나세아 종 (Gallinacea sp), 거위, 꿩 및 기타 가금류를 포함한다. 용어 "암탉"은 조류 종의 모든 암컷을 포함한다. "유전자이식 조류"는 일반적으로 이종 DNA 서열, 또는 조류의 생식 세포에 염색체에 의해 통합된 조류에 통상적으로 내인성인 하나 이상의 추가 DNA 서열 (총괄하여, 본원에서는 "이식유전자"라고 함)을 갖는 조류를 가리킨다. 이러한 전달 및 통합의 결과로, 전달된 서열은 생식 세포를 통해 유전자이식 조류의 자손에게 전달될 수 있다. 유전자이식 조류 (이의 후대 포함)는 또한 체세포의 성 염색체에 통합된 이식유전자를 갖는다.
일부 특정 실시양태에서, 본 발명의 적어도 하나의 유전자이식 동물은 적어도 두 개의 상이한 리포터 유전자를 포함할 수 있다. 이러한 경우에, 각각의 리포터 유전자가 성 염색체 Z 및/또는 W 중의 하나에서 적어도 하나의 위치 또는 장소에 통합될 수 있다. 일부 추가의 실시양태에서 각각의 리포터 유전자는 성 염색체 Z 및/또는 W 중의 하나에서 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개 또는 그 이상의 위치 또는 장소에 통합될 수 있다.
일부 추가의 실시양태에서, 본 발명의 유전자이식 동물 내에 포함된 리포터 유전자는 적어도 하나의 형광 리포터 유전자일 수 있다. 임의의 리포터 유전자 및 특히, 본 발명에 의해 개시된 임의의 형광 리포터 유전자, 특히 본 발명의 또 다른 측면과 관련하여 상기 본원의 표 1에 개시된 것들이 또한 본 발명에 의해 제공된 유전자이식 조류 대상체와 관련하여 적용될 수 있음을 인지해야 한다.
보다 특정한 실시양태에서, 이러한 형광 리포터 유전자는 적어도 하나의 적색 형광 단백질 (RFP)을 포함할 수 있거나 적어도 하나의 적색 형광 단백질 (RFP)일 수 있다. 그러나, 일부 실시양태에서, 본 발명의 유전자이식 조류 대상체에 의해 이식유전자로서 발현된 리포터 유전자는 임의의 형광 단백질, 예를 들어, RFP, YFP, BFP 등일 수 있으며, 단 상기 형광 단백질은 녹색 형광 단백질 (GFP)이 아님을 주지해야 한다. 즉, 일부 특정 실시양태에서 본 발명에 의해 제공된 유전자이식 동물의 성 염색체에 통합된 리포터 유전자는 임의의 형광 단백질 일 수 있으며 단 상기 형광 단백질은 GFP가 아니다.
특정 실시양태에서, 본 발명에 의해 제공된 적어도 하나의 유전자이식 조류 동물은 암컷일 수 있다. 보다 특정한 실시양태에서, 이러한 유전자이식 조류 암컷에서 적어도 하나의 리포터 유전자는 암컷 염색체 Z의 적어도 하나의 위치에 통합될 수 있다.
일부 대안적인 실시양태에서, 암컷 염색체 W의 적어도 하나의 위치에 통합된 적어도 하나의 리포터 유전자를 갖는 적어도 하나의 유전자이식 조류 동물은 암컷일 수 있다.
일부 추가의 대안적인 실시양태에서, 본 발명에 의해 제공된 유전자이식 동물은 이의 두 개의 성 Z 염색체 중의 적어도 하나에 통합된 이식유전자 리포터 유전자를 보유하는 유전자이식 수컷 대상체일 수 있다. 일부 추가의 실시양태에서, 본 발명에 의해 제공된 유전자이식 동물은 이의 두 개의 성 Z 대상체 중의 하나에 통합된 이식유전자 리포터 유전자를 보유하는 유전자이식 수컷 대상체일 수 있다. 추가의 대안적인 실시양태에서, 본 발명에 의해 제공된 유전자이식 동물은 이의 두 개의 성 Z 대상체 중의 두 개에 통합된 이식유전자 리포터 유전자를 보유하는 유전자이식 수컷 대상체일 수 있다.
일부 특정 실시양태에서, 적어도 하나의 리포터 유전자는 적어도 하나의 PEN을 사용하여 본 발명의 유전자이식 동물의 성 염색체에 통합될 수 있다. 본 발명의 방법과 관련하여 상기 주지된 바와 같이, 임의의 유전 공학 시스템 또는 임의의 PEN, 특히 임의의 RNA 유도 시스템, 예를 들면, CRISPR, TALEN, ZFN 등 중의 하나가 사용될 수 있다.
보다 특히, 이러한 PEN이 사용될 수 있고, 특정 실시양태에서, CRISPR 시스템이 사용될 수 있다. 보다 특정한 실시양태에서, CRISPR 클래스 2 시스템이 본 발명의 유전자이식 동물을 생성하는데 사용될 수 있다. 일부 추가의 특정 실시양태에서, CRISPR 타입 II 시스템이 사용될 수 있다.
보다 특정한 실시양태에서, 적어도 하나의 리포터 유전자는 적어도 하나의 CRISPR/Cas9 시스템에 의해 매개된 HDR에 의해 본 발명의 유전자이식 조류 동물의 성 염색체에 통합될 수 있다.
보다 특정한 실시양태에서, 적어도 하나의 리포터 유전자는 이러한 조류 동물/대상체의 적어도 하나의 세포, 또는 상기 조류 동물에 도입하고자 하는 적어도 하나의 세포를 적어도 두 개의 핵산 서열과 접촉시키거나 공동-형질감염시킴으로써 본 발명의 유전자이식 조류 동물의 성 염색체에 통합될 수 있다. 보다 구체적으로, 이러한 세포는 (a) 유전자 편집 시스템의 적어도 하나의 성분, 특히, 적어도 하나의 Cas9 단백질 또는 상기 적어도 하나의 Cas9 단백질을 암호화하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제1 핵산 서열; 및 적어도 하나의 성 염색체, Z 또는 W 내의 적어도 하나의 프로토스페이서를 표적화하는 적어도 하나의 gRNA, 또는 상기 적어도 하나의 gRNA를 암호화하여 CRISPR 매개된 통합을 제공하는 적어도 하나의 핵산 서열; 및 (b) 적어도 하나의 리포터 유전자를 포함하는 적어도 하나의 제2 핵산 서열 또는 이의 임의의 단편과 접촉하거나 공동-형질감염될 수 있다.
보다 특정한 실시양태에서, 제2 핵산 서열의 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 상동성 아암이 측면에 배치되어있을 수 있다. 이러한 아암은 표적 성 염색체 내의 통합 표적 부위와 상동성을 나타내어, 통합 부위에서 HDR을 촉진시킨다.
보다 특정한 실시양태에서, 제2 핵산 서열의 적어도 하나의 리포터 유전자는 성 특이 프로모터, 배아 특이 프로모터 및 유도성 프로모터 중의 어느 하나에 작동 가능하게 연결될 수 있다. 이러한 프로모터는, 일부 실시양태에서, 본 발명의 리포터 유전자의 발현을 특정의 원하는 성 (성 특이 프로모터의 경우), 특정의 배아 단계 (배아 특이 프로모터) 또는 특정 조건 (유도성 조건)에 제한할 수 있다.
일부 추가의 특정한 실시양태에서, 본 발명의 유전자이식 조류 동물 내에 포함된 적어도 하나의 리포터 유전자는 이의 성 염색체 중의 하나의 적어도 하나의 비-암호화 영역에 통합될 수 있다.
일부 추가의 대안적인 실시양태에서, 본 발명의 유전자이식 조류 동물은 성 Z 염색체에서 적어도 하나의 부위에 통합된 적어도 하나의 리포터 유전자를 포함할 수 있다. 일부 특정의 비제한적인 실시양태에서, 이러한 조류 유전자이식 동물은 Z 염색체에 통합된 유전자이식 리포터 유전자를 보유하는 암컷일 수 있다. 보다 특정한 실시양태에서, Z 염색체의 특정 유전자좌는 암탉의 염색체 Z의 서열 번호 15로 표시된 영역 9156874-9161874, 서열 번호 16으로 표시된 27764943-27769943, 서열 번호 17로 표시된 42172748-42177748, 서열 번호 18로 표시된 63363656-63368656 및 서열 번호 19로 표시된 78777477-78782477 중의 어느 하나일 수 있다.
일부 특정 실시양태에서, 적어도 하나의 리포터 유전자는 특히 서열 번호 17로 표시된 성 Z 염색체 유전자좌 42172748-42177748의 적어도 하나의 부위에 통합될 수 있다. 일부 추가의 특정 실시양태에서, Z 염색체 내의 특정 유전자좌에 통합시키기에 적합한 gRNA 서열은 Z 염색체 유전자좌 chrZ_42174515_-1 내에 위치한 프로토스페이서에 지시된 gRNA7을 포함할 수 있지만 이에 제한되지 않는다. 일부 특정 실시양태에서, gRNA는 gRNA7로 명명된 gRNA일 수 있다. 보다 특정한 실시양태에서, 이러한 gRNA7은 서열 번호 26으로 또한 표시된 핵산 서열 GTAATACAGAGCTAAACCAG를 포함할 수 있다. 일부 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 본 발명에 의해 제공되는 리포터 유전자, 특히 RFP를 암호화하는 서열은 이의 5'에 좌측 아암이 측면에 있고 이의 3'에 우측 아암이 측면에 있을 수 있다. 일부 추가의 특정 실시양태에서, 좌측 아암은 서열 번호 31로 표시된 핵산 서열을 포함할 수 있고, 서열 번호 32로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 26의 gRNA7에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.
일부 보다 특정한 실시양태에서, 리포터 유전자를 유전자이식 조류 대상체에서 Z 염색체 내의 이러한 특정 위치에 표적화하는데 필요한 적어도 하나의 gRNA는 서열 번호 11로 표시된 gRNA3: ACAGACCTATGATATGT; 서열 번호 12로 표시된 gRNA4: CGATTATCACTCACAAG; 서열 번호 13으로 표시된 gRNA5: CTGGTTAGCATGGGGAC; 서열 번호 14로 표시된 gRNA6: GTAAAGAGTCAGATACA 중의 어느 하나로 표시된 바와 같은 핵산 서열을 포함할 수 있다.
일부 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 41로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 42로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 11의 gRNA3에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 43으로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 44로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 유전자이식 조류 대상체의 리포터 유전자를 서열 번호 12의 gRNA4에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 여전히 추가의 실시양태에서, 본 발명의 리포터 유전자를 유전자이식 조류 대상체에서 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 45로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 46으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 13의 gRNA5에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 일부 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 47로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 48로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 14의 gRNA6에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.
본 발명의 유전자이식 조류 대상체의 Z 염색체 내의 특정 유전자좌로의 통합을 위해 적합한 gRNA 서열에 대한 추가의 비제한적인 예는 서열 번호 27로도 표시되는 핵산 서열 ACAGACCTATGATATGTGAG를 포함하는 Z 염색체 유전자좌 chrZ_9157091_1의 gRNA8, 서열 번호 28로도 표시되는 핵산 서열 GAGCTTGTGAGTGATAATCG를 포함하는 Z 염색체 유전자좌 chrZ_27767602_-1의 gRNA9, 서열 번호 29로도 표시되는 핵산 서열 GTAAAGAGTCAGATACACAG를 포함하는 Z 염색체 유전자좌 chrZ_78779927_1의 gRNA10, 및 서열 번호 30으로도 표시되는 핵산 서열 CAGTGGGTACTGAAGCTGTG를 포함하는 Z 염색체 유전자좌 chrZ_63364946_-1의 gRNA11을 포함할 수 있지만 이에 제한되지 않는다.
추가의 실시양태에서, 본 발명의 리포터 유전자를 본 발명의 유전자이식 조류 대상체의 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 33으로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 34로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 27의 gRNA8에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 여전히 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 35로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 36으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 28의 gRNA9에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 37로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 38로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 29의 gRNA10에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 39로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 40으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 30의 gRNA11에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.
일부 추가의 대안적인 실시양태에서, 적어도 하나의 리포터 유전자는 본 발명의 유전자이식 조류 대상체의 성 W 염색체에서 적어도 하나의 부위에 통합될 수 있다. 일부 특별한 실시양태에서, 통합 부위는 W 염색체에서 유전자좌 1022859-1024215, 특히 염색체 W:1022859-1024215의 galGal5_dna 범위에 위치할 수 있다. 일부 추가의 특정 실시양태에서, 이러한 유전자좌는 서열 번호 3으로 표시된 핵산 서열을 포함한다.
상기한 유전자좌 내의 임의의 위치에서의 본 발명의 리포터 유전자의 특이적 통합을 위해, 특정 gRNA가 필요할 수 있다. 따라서, 일부 특정의 비제한적인 실시양태에서, 본 발명의 유전자이식 조류 동물의 제조에 사용되는 적합한 gRNA는 서열 번호 1 및 2 중의 어느 하나로 표시된 핵산 서열을 포함할 수 있다. 일부 특정 실시양태에서, 이러한 gRNA를 본원에서 각각 gRNA1 및 gRNA2라고 한다.
일부 특별한 실시양태에서, 본 발명에 의해 제공된 유전자이식 조류 동물은 서열 번호 1로 표시된 핵산 서열을 포함하는 gRNA1을 사용하여 제조되었다. 이러한 특정 위치에서의 본 발명의 리포터 유전자의 통합을 가능하게 하기 위해, 통합되어야 하는 리포터 유전자는, 특정 실시양태에서, 사용된 gRNA에 의해 지시된 표적 통합 부위에서의 이의 삽입을 촉진시키는 특정 아암을 보유해야 한다. 따라서, 일부 특정 실시양태에서, 적어도 하나의 리포터 유전자는 제2 핵산 서열 내에 포함될 수 있으며, 여기서 이러한 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 4 및 5로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어있다.
일부 대안적인 실시양태에서, 본 발명에 의해 제공된 유전자이식 조류 동물은 서열 번호 2로 표시된 핵산 서열을 포함하는 gRNA2를 사용하여 제조될 수 있다. 이러한 경우에, 상기 gRNA2에 의해 인식된 특정 위치에서의 본 발명의 리포터 유전자의 통합을 가능하게 하기 위해, 제2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 특정 실시양태에 따르면 이의 5' 및 3'에 각각 서열 번호 6 및 7로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어있을 수 있다.
본 발명은 본 발명의 방법 중 어느 것, 특히 본원에 논의된 바와 같은 난내 성 감별을 위한 방법에서 사용하기 위한 본원에 기술된 바와 같은 임의의 유전자이식 조류 대상체를 추가로 포함함을 추가로 인지해야 한다.
일부 부가적인 실시양태에서, 본 발명은 본 발명의 방법 중 어느 것에서 사용하기 위한, 본 발명에 의해 제공된,특히 상기 논의된 바와 같은 임의의 유전자이식 조류 대상체가 낳은 임의의 알의 용도를 추가로 포함한다. 또 다른 측면에서, 본 발명은 성 염색체 Z 및 W 중의 적어도 하나에서 적어도 하나의 위치 또는 장소에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 세포에 관한 것이다.
일부 특정 실시양태에서, 본 발명에 의해 제공된 세포는 조류 세포일 수 있다.
일부 특별한 실시양태에서, 본 발명에 의해 제공된 조류 세포는 원시 생식 세포 (PGC)일 수 있다.
용어 "생식 세포"는 다른 생식 세포와 연합시 생식체로 발달하는 배아 세포를 가리킨다. 본원에서 사용되는 "원시 생식 세포 ( PGC )"는 생식체의 전구물질로서 기능하고 다능성 배아 줄기 세포를 발생시키는 생식계열 줄기 세포와 관련된다. 배아발생 동안 PGC가 되도록 신호를 보내는 원장형성 배아(gastrulating embryo)의 세포는 생식 융기로 이동하여 생식선이 되고 성숙한 생식체로 분화된다.
일부 실시양태에서, 본 발명의 세포의 적어도 하나의 성 염색체에 통합된 리포터 유전자는 형광 단백질, 특히 RFP, YFP, BFP, 등 또는 표 1에 개시된 임의의 형광 단백질일 수 있다. 일부 추가의 실시양태에서 본 발명의 세포에 통합된 리포터 유전자는 임의의 형광 단백질일 수 있으며, 단 상기 형광 단백질은 녹색 형광 단백질 (GFP)이 아니다. 즉, 일부 특정 실시양태에서 본 발명에 의해 제공된 유전자이식 세포의 성 염색체에 통합된 리포터 유전자는 임의의 형광 단백질일 수 있으며 단 상기 형광 단백질은 GFP가 아니다.
보다 특정한 실시양태에서, 적어도 하나의 리포터 유전자는 적어도 하나의 프로그램 가능한 조작된 뉴클레아제 (PEN)를 사용하여 본 발명의 세포에 의해 제공된 유전자이식 조류 대상체 또는 동물의 성 염색체에 통합될 수 있다. 본원에서 사용되는 용어 "프로그램 가능한 조작된 뉴클레아제 (PEN)"는 이중 가닥 DNA 병변의 DNA 복구에 관여하고 직접적인 게놈 편집을 가능하게 하는 자연 발생 뉴클레아제로부터 유래된 특정 DNA 서열을 절단하는 합성 효소를 가리킨다. 보다 특정한 실시양태에서, PEN은 주기적으로 간격을 띠고 분포하는 짧은 회문구조 반복서열 (CRISPR) 클래스 2, 특히 타입 II 시스템일 수 있다.
일부 추가의 실시양태에서, 본 발명에 의해 제공된 세포는 세포의 성 염색체에 통합된 적어도 하나의 리포터 유전자를 포함할 수 있다. 보다 특정한 실시양태에서, 리포터 유전자의 이러한 특이적 통합은 세포를 (a) 적어도 하나의 Cas9 단백질 또는 상기 적어도 하나의 Cas9 단백질을 암호화하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제1 핵산 서열; 및 적어도 하나의 성 염색체 Z 및/또는 W 내의 적어도 하나의 프로토스페이서를 표적화하는 적어도 하나의 gRNA, 또는 상기 적어도 하나의 gRNA를 암호화하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 유전자 편집 시스템; 및 (b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제2 핵산 서열과 접촉시키거나 공동-형질감염시킴으로써 가능해질 수 있다.
특정 실시양태에서, 본 발명의 세포에 공동-형질감염된 제2 핵산 서열의 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 통합 부위에서의 HDR을 위한 상동성 아암이 측면에 배치되어있을 수 있다.
일부 특정 실시양태에서, 본 발명에 의해 제공된 세포는 본 발명의 적어도 하나의 리포터 유전자를 세포의 Z 염색체에 통합시킴으로써 제조될 수 있다. 특정 실시양태에서, 본 발명의 세포를 제조하기 위해, 적어도 하나의 리포터 유전자는 성 Z 염색체에서 적어도 하나의 부위에 통합될 수 있다. 보다 특정한 실시양태에서, Z 염색체에서의 특정 유전자좌는 암탉의 암색체 Z의 서열 번호 15로 표시된 영역 9156874-9161874, 서열 번호 16으로 표시된 27764943-27769943, 서열 번호 17로 표시된 42172748-42177748, 서열 번호 18로 표시된 63363656-63368656 및 서열 번호 19로 표시된 78777477-78782477 중의 어느 하나일 수 있다.
일부 추가의 대안적인 실시양태에서, 본 발명에 의해 제공된 세포는 성 Z 염색체 유전자좌 42172748-42177748, 특히 서열 번호 17에서 적어도 하나의 부위에의 통합을 촉진시키는 gRNA를 사용함으로써 제조될 수 있다. 일부 추가의 특정 실시양태에서, Z 염색체 내의 특정 유전자좌로의 통합에 적합한 gRNA 서열은 서열 번호 26으로도 표시된 핵산 서열 GTAATACAGAGCTAAACCAG를 포함하는 Z 염색체 유전자좌 chrZ_42174515_-1의 gRNA7을 포함할 수 있지만 이에 제한되지 않는다. 일부 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 31로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 32로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 26의 gRNA7에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.
보다 특정한 실시양태에서, 리포터 유전자를 본 발명의 세포의 Z 염색체 내의 이러한 특정 위치에 표적화하는데 필요한 적어도 하나의 gRNA는 서열 번호 11로 표시된 gRNA3: ACAGACCTATGATATGT; 서열 번호 12로 표시된 gRNA4: CGATTATCACTCACAAG; 서열 번호 13으로 표시된 gRNA5: CTGGTTAGCATGGGGAC; 서열 번호 14로 표시된 gRNA6: GTAAAGAGTCAGATACA 중의 어느 하나로 표시된 바와 같은 핵산 서열을 포함할 수 있다.
일부 추가의 실시양태에서, 본 발명의 리포터 유전자를 본 발명의 세포의 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 41로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 42로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 11의 gRNA3에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 43으로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 44로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 12의 gRNA4에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 여전히 추가의 실시양태에서, 본 발명의 리포터 유전자를 본 발명의 세포의 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 45로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 46으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 13의 gRNA5에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 일부 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 47로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 48로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 14의 gRNA6에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.
Z 염색체 내의 특정 유전자좌로의 통합에 적합한 gRNA 서열에 대한 추가의 비제한적인 예는 서열 번호 27로도 표시된 핵산 서열 ACAGACCTATGATATGTGAG를 포함하는 Z 염색체 유전자좌 chrZ_9157091_1의 gRNA8, 서열 번호 28로도 표시된 핵산 서열 GAGCTTGTGAGTGATAATCG를 포함하는 Z 염색체 유전자좌 chrZ_27767602_-1의 gRNA9, 서열 번호 29로도 표시된 핵산 서열 GTAAAGAGTCAGATACACAG를 포함하는 Z 염색체 유전자좌 chrZ_78779927_1의 gRNA10, 및 서열 번호 30으로도 표시된 핵산 서열 CAGTGGGTACTGAAGCTGTG를 포함하는 Z 염색체 유전자좌 chrZ_63364946_-1의 gRNA11을 포함할 수 있지만 이에 제한되지 않는다.
추가의 실시양태에서, 본 발명의 리포터 유전자를 본 발명의 세포의 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 33으로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 34로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 27의 gRNA8에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 여전히 추가의 실시양태에서, 본 발명의 리포터 유전자를 본 발명의 세포의 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 35로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 36으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 28의 gRNA9에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 37로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 38로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 29의 gRNA10에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 39로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 40으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 30의 gRNA11에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.
일부 특별한 실시양태에서, 본 발명에 의해 제공된 세포의 염색체 W에의 리포터 유전자의 통합을 표적화하기 위해, 특정 gRNA가 사용되어야 한다. 추가의 특정 실시양태에서, gRNA는 본원에서 gRNA1이라고 하는 서열 번호 1로 표시된 핵산 서열을 포함할 수 있다. 이러한 경우에, 제2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 4 및 5로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어있을 수 있다.
일부 추가의 대안적인 실시양태에서, 본 발명에 의해 제공된 세포는 본원에서 gRNA2라고 하는 gRNA를 사용하여 제조될 수 있다. 특정 실시양태에서, gRNA2는 서열 번호 2로 표시된 핵산 서열을 포함할 수 있다. 이러한 특정 실시양태에서, 제2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 6 및 7로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어있을 수 있다.
여전히 추가로, 본 발명은 부화되지 않은 알의 수정을 검출하는 방법을 제공한다. 일부 특정 실시양태에서, 이러한 방법은 제공된 유전자이식 동물이 암컷 대상체인 경우에는 성 염색체 Z 및 W 둘 다에서 및 제공된 유전자이식 동물이 수컷인 경우에는 성 염색체 Z 둘 다에서 적어도 하나의 위치 또는 장소에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 적어도 하나의 유전자이식 조류 대상체 또는 동물을 제공하거나 수득하는 단계 (a)를 포함할 수 있다. 제2 단계 (b)에서 유전자이식 조류 대상체, 특히 동물 또는 이의 임의의 세포로부터 적어도 하나의 수정란을 수득하는 단계. 다음 단계 (c)는 적어도 하나의 검출 가능한 신호가 검출되는지 알에서 결정하는 단계를 포함한다. 보다 특정한 실시양태에서, 적어도 하나의 검출 가능한 신호의 검출은 상기 적어도 하나의 리포터 유전자의 발현을 나타내며, 이에 의해 (암컷의 경우 표지된 모계 W 염색체 또는 Z 염색체 또는 조류 배아에서 표지된 부계 Z 염색체의 존재를 나타낸다.
일부 추가의 실시양태에서, 본 발명의 방법에 의해 제공된 유전자이식 동물은 이의 Z 염색체 둘 다에 통합된 리포터 유전자를 갖는 수컷 대상체일 수 있다. 이러한 경우에, 이러한 유전자이식 수컷 또는 이의 임의의 정자에 의해 수정된 알에서 결정된 검출 가능한 신호는 배아가 유전자이식 리포터 유전자를 포함하는 부계 Z 염색체를 지님을 나타내며, 따라서 알은 수정된다. 여전히 추가의 실시양태에서, 본 발명의 방법에 의해 제공된 유전자이식 동물은 이의 Z 및 W 염색체 둘 다에 통합된 리포터 유전자를 갖는 암컷 대상체일 수 있다. 이러한 경우에, 이러한 유전자이식 암컷이 지닌 알에서 결정된 검출 가능한 신호는 배아가 유전자이식 리포터 유전자를 포함하는 모계 Z 또는 W 염색체를 보유함을 나타내며, 따라서 알은 수정된다. 추가의 실시양태에서, 수정란을 검출하기 위해, 리포터 유전자, 특히 RFP 유전자를 임의의 염색체의 두 카피에 삽입하여 동형접합성 유전자이식 조류 대상체, 특히 수컷 대상체를 생성할 수 있음을 인지해야 한다. 수정란은 RFP 리포터 유전자를 지니는 것으로 검출될 것이다.
추가의 측면에서, 본 발명은 다음을 포함하는 키트를 제공한다:
(a) 적어도 하나의 유전자 편집 시스템의 적어도 하나의 성분, 특히, 적어도 하나의 Cas9 단백질 또는 상기 적어도 하나의 Cas9 단백질을 암호화하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제1 핵산 서열을 포함할 수 있는 CRSPR/Cas9 시스템; 및 적어도 하나의 성 염색체 Z 및/또는 W 내의 적어도 하나의 프로토스페이서를 표적화하는 적어도 하나의 gRNA, 또는 상기 적어도 하나의 gRNA를 암호화하는 적어도 하나의 핵산 서열; 및 (b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제2 핵산 서열.
일부 추가의 실시양태에서, (이하 본원에 기술된) 본 발명의 방법 및 키트에 의해 사용되는 gRNA는 적어도 하나의 CRISPR RNA (crRNA) 및 적어도 하나의 전사-촉진 crRNA (tracrRNA)를 포함할 수 있다.
일부 대안적인 실시양태에서 본 발명의 키트는 적어도 하나의 gRNA를 암호화하는 핵산 서열을 포함할 수 있다. 이러한 핵산 서열은 표적화하는 적어도 하나의 스페이서 서열을 포함하는 CRISPR 어레이를 포함할 수 있으며 따라서 표적 게놈 DNA 서열에서의 적어도 하나의 프로토스페이서와 상동성이거나 동일하다. 핵산 서열은 적어도 하나의 tracrRNA를 암호화하는 서열을 추가로 포함할 수 있음을 주지해야 한다.
일부 실시양태에서 본 발명의 개시내용에 따르는 CRISPR 어레이는 적어도 하나의 스페이서 및 적어도 하나의 반복체를 포함한다. 또 다른 실시양태에서, 본 발명은 동일하거나 상이한 표적을 표적으로 할 수 있는 수 개의 최종 gRNA 산물로 가공될 수 있는 pre-crRNA를 제공하는 옵션을 추가로 포함한다.
일부 보다 특정한 실시양태에서, 본 발명의 gRNA 내에 포함된 crRNA는 표적 게놈 DNA 서열에 상보적인 단일-가닥 리보핵산 (ssRNA) 서열일 수 있다. 일부 특정 실시양태에서, 표적 게놈 DNA 서열은 프로토스페이서 인접 모티프 (PSA) 서열의 바로 상류에 및 더 나아가 위치할 수 있다.
본원에 나타낸 바와 같이, 본 발명의 키트 및 방법의 gRNA는 표적 게놈 DNA, 이 경우, 본원에서 "프로토스페이서"라고 하는 성 염색체 Z 또는 W 내의 표적 유전자좌에, 적어도 부분적으로, 상보적일 수 있다. 특정 실시양태에서, "상보성"은 자물쇠-열쇠 원리 (lock-and-key principle)를 따르는 두 구조 사이의 관계를 가리킨다. 사실상 상보성은 DNA 복제 및 전사의 기본 원리이며, 이는 두 DNA 또는 RNA 서열 사이에 공유되는 특성이므로 이들이 서로 역평행하게 정렬될 때 서열의 각 위치에서 뉴클레오티드 염기는 상보적이다 (예를 들어, A 및 T 또는 U, C 및 G).
상기 나타낸 바와 같이, 본 발명의 키트의 gRNA에 의해 표적화된 게놈 DNA 서열은 PAM 서열의 바로 상류에 위치한다. 일부 실시양태에서, 이러한 PAM 서열은 핵산 서열 NGG일 수 있다.
특정 실시양태에서, 본 발명에 의해 언급된 PAM 서열은 N, 즉 임의의 뉴클레오티드, 특히 아데닌 (A), 구아닌 (G), 시토신 (C) 또는 티민 (T) 중 어느 하나를 포함할 수 있다. 일부 추가의 실시양태에서 본 발명에 따르는 PAM 서열은 A, G, C, 또는 T 및 두 개의 구아닌으로 구성된다.
하나의 실시양태에 따르면, 본 발명의 gRNA를 암호화하는 뉴클레오티드는 적어도 하나의 스페이서 및 임의로, 적어도 하나의 반복체를 포함할 수 있다. 일부 추가의 실시양태에서 본 발명의 gRNA를 암호화하는 DNA는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100개 또는 그 이상, 특히 110, 120, 130, 140, 150, 160, 170, 180, 190, 200개 또는 그 이상의 스페이서를 포함할 수 있다. 일부 실시양태에서, 각 스페이서는 두 개의 반복체 사이에 위치한다. 본 발명의 gRNA를 암호화하는 핵산 서열의 스페이서는 동일하거나 상이한 스페이서일 수 있음을 추가로 이해해야 한다. 더 많은 실시양태에서, 이들 스페이서는 동일하거나 상이한 표적 게놈 DNA를 표적화할 수 있다. 일부 또 다른 실시양태에서, 이러한 스페이서는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100개 또는 그 이상의 표적 게놈 DNA 서열을 표적화할 수 있다. 이들 표적서열은 단일 유전자좌 또는 대안적으로, 여러 표적 유전자좌로부터 유래될 수 있다.
본원에서 사용되는 용어 "스페이서"는 특정 서열을 표적으로 하도록 설계되고 CRISPR 어레이의 다수의 짧은 직접 반복체 (즉, CRISPR 반복체) 사이에 위치하는 비-반복 스페이서 서열을 가리킨다. 일부 특정 실시양태에서, 스페이서는 약 15 내지 약 30개 뉴클레오티드, 특히 약 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30개 또는 그 이상의 뉴클레오티드. 보다 특히, 약 20-25개 뉴클레오티드를 포함할 수 있다.
본 발명의 CRISPR 시스템에 의해 암호화된 가이드 또는 표적화 RNA는 CRISPR RNA (crRNA) 및 전사 촉진 RNA (tracrRNA)를 포함할 수 있다. CRISPR 스페이서에 의해 암호화된 표적화 RNA의 서열은, 이것이 조류 게놈 DNA에서, 특히 본원에서 "프로토스페이서"라고도 하는 성 염색체 Z 또는 W 내의 표적 유전자좌에서 표적 서열에 대해 지시된다는 (즉, 이에 동일하거나 상보적인 세그먼트를 갖는) 요건을 제외하고는 특별히 제한되지 않는다. 이러한 프로토-스페이서는 본 발명의 방법 및 키트의 gRNA를 암호화하는 핵산 서열 내에 포함된 CRISPR 스페이서에 의해 암호화된 표적화 RNA에 대한 충분한 상보성을 갖는 핵산 서열을 포함한다.
일부 실시양태에서, crRNA는 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40 nt의 스페이서 (표적화) 서열에 이은 19-36 nt의 반복 서열을 포함하거나 이들로 구성될 수 있다. 특정의 비제한적인 실시양태에서, 표적화 스페이서는 대표적인 스페이서 서열이 본원에 나타내어져 있는 게놈 DNA 서열 중 어느 하나를 표적화하는 세그먼트를 포함하거나 이들로 구성될 수 있다.
일부 특정 실시양태에서, 본 발명의 CRISPR 시스템의 스페이서는 표적화 가이드 RNA (gRNA)를 암호화할 수 있음을 주지해야 한다. "gRNA" 또는 "표적화 RNA"는, 이것을 암호화하는 CRISPR 시스템의 일부로부터 전사될 때, 표적 게놈 DNA의 DNA 서열과 동일하거나 (RNA의 경우 T를 U로 대체하는 것을 제외함) 또는 상보적인 (따라서 "표적") RNA 서열의 적어도 하나의 세그먼트를 포함하는 RNA이다. 본 개시내용의 CRISPR 시스템은 임의로 하나 이상의 표적화 RNA를 암호화할 수 있고, 표적화 RNA는 게놈 DNA에서 하나 이상의 표적 서열에 지시될 수 있다.
일부 실시양태에서, 본 발명의 키트에 의해 제공된 Cas9 단백질은 서열 번호 24로 표시된 핵산 서열에 의해 암호화될 수 있다. 추가의 특정한 비제한적인 실시양태에서, Cas9 단백질은 서열 번호 25로 표시된 아미노산 서열, 또는 이의 임의의 유도체, 돌연변이체 또는 변이체를 포함할 수 있다.
"아미노산 서열" 또는 "펩타이드 서열"은 펩타이드 결합에 의해 연결된 아미노산 잔기가 펩타이드 및 단백질의 사슬에 존재하는 순서임을 주지해야 한다. 서열은 일반적으로 유리 아미노 그룹을 함유하는 N-말단에서 아미드를 함유하는 C- 말단까지 기록된다. 아미노산 서열은 이것이 단백질의 1차 구조를 나타내는 경우 종종 펩타이드, 단백질 서열로 불리지만, 단백질이 특정 3 차원 구조로 접힌 아미노산 서열로 정의되고 전형적으로 인산화, 아세틸화, 글리코실화, 마노실화, 아미드화, 카복실화, 설프하이드릴 결합 형성, 절단 등과 같은 번역후 변형을 겪기 때문에 "아미노산 서열" 또는 "펩타이드 서열"과 "단백질"이라는 용어를 구별해야 한다.
"단편 또는 펩타이드"란, 상기 Cas9 또는 RFP (이하 본원에 기술됨) 분자의 분획을 의미한다. 본 발명의 임의의 아미노산 서열과 같은 분자의 "단편"은 Cas9 또는 RFP 분자의 임의의 아미노산 서브세트를 가리키는 것을 의미한다. 이것은 또한 이의 "변이체" 또는 "유도체"를 포함할 수 있다. "펩타이드"는 기능적 활성을 갖는 특정 아미노산 서브세트를 가리키는 것을 의미한다. "기능적"이란, 예를 들면, Cas9와 같은 유전자 편집을 수행하는 능력을 갖거나 RFP와 같은 검출 가능한 신호를 생성하는 것과 같은 동일한 생물학적 기능을 갖는 것을 의미한다.
본 발명은 본 발명의 RFP 또는 Cas9 분자의 임의의 변이체 또는 유도체 및 실질적으로 동일하거나 상동성인 임의의 폴리펩타이드를 포함함을 인지해야 한다. 용어 " 유도체 "는 원래의 폴리펩타이드의 활성을 변화시키지 않는 아미노산 서열 (폴리펩타이드)에 대한 임의의 삽입, 결실, 치환 및 변형을 갖는 아미노산 서열 (폴리펩타이드)을 정의하는데 사용된다. 이와 관련하여, 본 발명의 Cas9 또는 RFP 분자의 유도체 또는 단편은 Cas9 또는 RFP 분자의 활성을 감소 또는 변경시키지 않는 특히 서열 번호 25, 21, 23으로 표시된 Cas9 또는 RFP 분자의 임의의 유도체 또는 단편일 수 있다. 용어 "유도체"란 또한 이의 동족체, 변이체 및 유사체를 가리킨다. 본 발명에 따르는 관심 단백질에 대한 서열 상동성 또는 동일성을 갖는 단백질 오르소로그 또는 호모로그는 특히 본 발명에 따르는 관심 단백질, 예를 들면, 서열 번호 25, 21, 23으로 표시된 아미노산 서열을 포함하는 임의의 단백질의 전체 서열에 비해 적어도 50%, 적어도 60% 및 특히 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 또는 그 이상을 공유할 수 있다. 특히, 서열 번호 21, 23, 25, 특히 서열 번호 21, 23, 25로 표시된 전체 서열과 적어도 50%, 적어도 60% 및 특히 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상으로 동일한 아미노산 서열을 포함하거나 이들로 구성된 호모로그.
일부 실시양태에서, 유도체는 아미노산 잔기의 삽입, 결실 또는 치환에 의해 본 발명에서 구체적으로 정의된 폴리펩타이드와는 상이한 폴리펩타이드를 가리킨다. 본원에서 사용되는 용어 "삽입/들", "결실/들" 또는 "치환/들"이란 본 발명에 의해 개시된 폴리펩타이드에의 아미노산 잔기, 1 내지 50개의 아미노산 잔기, 20 내지 1개의 아미노산 잔기, 특히 1 내지 10개의 아미노산 잔기의 임의의 첨가, 결실 또는 치환을 각각 의미한다는 것을 인지해야 한다. 보다 특히, 삽입/들, 결실/들 또는 치환/들은 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 아미노산 중의 어느 하나의 것일 수 있다. 본 발명에 의해 포함되는 삽입/들, 결실/들 또는 치환/들은 변형된 펩타이드의 임의의 위치에서 및 이의 N '또는 C'말단 중의 어느 것에서 일어날 수 있음을 주지해야 한다.
아미노산 서열과 관련하여, 당업자는 암호화된 서열에서 단일 아미노산 또는 소량의 아미노산을 변경, 첨가 또는 결실시키는 핵산, 펩타이드, 폴리펩타이드, 또는 단백질 서열에 대한 개별적인 치환, 결실 또는 첨가가 "보존적으로 변형된 변이체"이며, 여기서 변형은 화학적으로 유사한 아미노산으로의 아미노산의 치환을 야기한다. 기능적으로 유사한 아미노산을 제공하는 보존적 치환 표는 당업계에 잘 알려져 있다. 이러한 보존적으로 변형된 변이체는 이에 더하여 본 발명의 다형성 변이체, 이종간 호모로그 및 대립유전자를 배제하지 않는다.
예를 들면, 지방족 아미노산 (G, A, I, L 또는 V)을 그룹의 다른 구성원으로 치환시키는 치환, 또는 하나의 극성 잔기를 다른 잔기로 치환시키는, 예를 들어 리신을 아르기닌으로, 아스파라긴산을 글루탐산으로, 또는 아스파라긴을 글루타민으로 치환시키는 치환이 이루어질 수 있다. 다음의 8개의 그룹 각각은 서로 보존적 치환인 다른 예시적인 아미노산을 함유한다:
1) 알라닌 (A), 글리신 (G);
2) 아스파르트산 (D), 글루탐산 (E);
3) 아스파라긴 (N), 글루타민 (Q);
4) 아르기닌 (R), 리신 (K);
5) 이소류신 (I), 류신 (L), 메티오닌 (M), 발린 (V);
6) 페닐알라닌 (F), 티로신 (Y), 트립토판 (W);
7) 세린 (S), 트레오닌 (T); 및
8) 시스테인 (C), 메티오닌 (M).
따라서, 일부 실시양태에서, 본 발명은 Cas9 또는 RFP 분자 또는 이의 임의의 유도체, 특히 서열 번호 21, 23, 25 중의 어느 하나로 표시된 아미노산 서열에 대한 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상의 보존적 치환을 포함하는 유도체를 포함한다. 보다 특히, 아미노산 "치환"은 하나의 아미노산을 유사한 구조적 및/또는 화학적 특성을 갖는 다른 아미노산으로 대체, 즉 보존적 아미노산 대체의 결과이다. 아미노산 치환은 관련된 잔기의 극성, 전하, 용해도, 소수성, 친수성, 및/또는 양친매성의 유사성에 기초하여 이루어질 수 있다. 예를 들면, 비극성 " 소수성 " 아미노산은 발린 (V), 이소류신 (I), 류신 (L), 메티오닌 (M), 페닐알라닌 (F), 트립토판 (W), 시스테인 (C), 알라닌 (A), 티로신 (Y), 히스티딘 (H), 트레오닌 (T), 세린 (S), 프롤린 (P), 글리신 (G), 아르기닌 (R) 및 리신 (K)으로 이루어진 그룹으로부터 선택되고; " 극성 " 아미노산은 아르기닌 (R), 리신 (K), 아스파르트산 (D), 글루탐산 (E), 아스파라긴 (N), 글루타민 (Q)으로 이루어진 그룹으로부터 선택되며; " 양으로 하전된 " 아미노산은 아르기닌 (R), 리신 (K) 및 히스티딘 (H)으로 이루어진 그룹으로부터 선택되고 여기서 " 산성 " 아미노산은 아스파르트산 (D), 아스파라긴 (N), 글루탐산 (E) 및 글루타민 (Q)으로 이루어진 그룹으로부터 선택된다.
본 발명의 폴리펩타이드의 변이체는 본 발명의 다양한 폴리펩타이드와 같은 관심 단백질과 아미노산 수준에서 적어도 80% 서열 유사성 또는 동일성, 종종 적어도 85% 서열 유사성 또는 동일성, 90% 서열 유사성 또는 동일성, 또는 적어도 95%, 96%, 97%, 98%, 또는 99% 서열 유사성 또는 동일성을 가질 수 있다.
일부 실시양태에서, 본 발명의 키트 내에 포함된 제2 핵산 서열의 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 통합 부위에서의 HDR을 위한 상동성 아암이 측면에 배치되어있을 수 있다.
일부 추가의 특정 실시양태에서, 본 발명의 키트의 제2 핵산 서열의 적어도 하나의 리포터 유전자는 성 특이 프로모터, 배아 특이 프로모터 및 유도성 프로모터 중의 어느 하나에 작동 가능하게 연결될 수 있다.
일부 추가의 대안적인 실시양태에서, 적어도 하나의 리포터 유전자는 성 Z 염색체에서 적어도 하나의 부위에 통합될 수 있다. 보다 특정한 실시양태에서, Z 염색체에서 특정 유전자좌는 암탉의 염색체 Z의 서열 번호 15로 표시된 영역 9156874-9161874, 서열 번호 16으로 표시된 27764943-27769943, 서열 번호 17로 표시된 42172748-42177748, 서열 번호 18로 표시된 63363656-63368656 및 서열 번호 19로 표시된 78777477-78782477 중의 어느 하나일 수 있다.
일부 특정 실시양태에서, 적어도 하나의 리포터 유전자는 성 Z 염색체 유전자좌 42172748-42177748에서 적어도 하나의 부위에 통합될 수 있다. 본 발명의 키트의 제1 핵산 서열의 비제한적인 예는 서열 번호 26으로도 표시된 핵산 서열 GTAATACAGAGCTAAACCAG를 포함하는 Z 염색체 유전자좌 chrZ_42174515_-1의 gRNA7 중의 적어도 하나인 gRNA를 포함할 수 있다. 보다 특히, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 31로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 32로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 26의 gRNA7에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.
따라서, 보다 특정한 실시양태에서, 본 발명의 키트의 제1 핵산 서열은 서열 번호 11로 표시된 gRNA3: ACAGACCTATGATATGT; 서열 번호 12로 표시된 gRNA4: CGATTATCACTCACAAG; 서열 번호 13으로 표시된 gRNA5: CTGGTTAGCATGGGGAC; 서열 번호 14로 표시된 gRNA6: GTAAAGAGTCAGATACA 중의 적어도 하나인 gRNA를 포함할 수 있다.
추가의 실시양태에서, 본 발명의 키트의 제2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 서열 번호 41 내지 48 중의 어느 하나로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어있을 수 있다. 보다 특히, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 41로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 42로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자 서열 번호 11의 gRNA3에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 43으로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 44로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 12의 gRNA4에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 여전히 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 45로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 46으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 13의 gRNA5에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 일부 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 47로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 48로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 14의 gRNA6에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.
본 발명의 키트의 제1 핵산 서열의 추가의 비제한적인 예는 서열 번호 27로도 표시된 핵산 서열 ACAGACCTATGATATGTGAG를 포함하는 Z 염색체 유전자좌 chrZ_9157091_1의 gRNA8, 서열 번호 28로도 표시된 핵산 서열 GAGCTTGTGAGTGATAATCG를 포함하는 Z 염색체 유전자좌 chrZ_27767602_-1의 gRNA9, 서열 번호 29로도 표시된 핵산 서열 GTAAAGAGTCAGATACACAG를 포함하는 Z 염색체 유전자좌 chrZ_78779927_1의 gRNA10, 및 서열 번호 30으로도 표시된 핵산 서열 CAGTGGGTACTGAAGCTGTG를 포함하는 Z 염색체 유전자좌 chrZ_63364946_-1의 gRNA11 중의 적어도 하나인 gRNA를 포함할 수 있다.
추가의 실시양태에서, 본 발명의 키트의 제2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 서열 번호 31 내지 40 중의 적어도 하나로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어있을 수 있다. 보다 특히, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 33으로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 34로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 27의 gRNA8에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 여전히 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 35로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 36으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 28의 gRNA9에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 37로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 38로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 29의 gRNA10에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 39로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 40으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 30의 gRNA11에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.
특정 실시양태에서, 본 발명의 키트에 의해 제공된 적어도 하나의 리포터 유전자는 성 염색체의 적어도 하나의 비-암호화 영역에, 특히 염색체 W에 통합될 수 있다. 이러한 경우에, 본 발명의 키트의 제1 핵산 서열은 본원에서 각각 gRNA1 및 gRNA2라고도 하는 서열 번호 1 및 2 중의 적어도 하나로 표시된 핵산 서열을 포함하는 적어도 하나의 gRNA를 암호화할 수 있다.
일부 특정 실시양태에서, 본 발명의 키트의 제1 핵산 서열은 gRNA1인 gRNA를 포함할 수 있다. 일부 실시양태에서, 이러한 gRNA1은 서열 번호 1로 표시된 핵산 서열을 포함할 수 있다. 이러한 경우에, 본 발명의 키트의 상기 제2 핵산 서열 내에 포함된 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 4 및 5로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어있을 수 있다.
일부 추가의 대안적인 실시양태에서, 본 발명의 키트는 이의 제1 핵산 서열에 gRNA2를 암호화하는 서열을 포함할 수 있다. 일부 특정 실시양태에서, 이러한 서열은 서열 번호 2로 표시된 핵산 서열을 암호화한다. 일부 추가의 실시양태에서, 본 발명의 키트의 제2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 6 및 7로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어있을 수 있다.
일부 실시양태에서, 본 발명의 키트의 제2 핵산 서열 내에 포함된 리포터 유전자는 적어도 하나의 형광 리포터 유전자일 수 있다. 여전히 추가로, 일부 실시양태에서, 본 발명의 키트에 의해 제공된 리포터 유전자는 임의의 형광 단백질, 특히, RFP, YFP 및 본 발명에 의해 개시된 임의의 형광 단백질 또는 표 1에 개시된 임의의 형광 단백질일 수 있다. 일부 실시양태에서, 본 발명의 키트에 의해 사용된 리포터 유전자는 임의의 형광 단백질일 수 있으며, 단 상기 형광 단백질은 녹색 형광 단백질 (GFP)이 아니다. 즉, 일부 특정 실시양태에서 본 발명의 키트에 의해 제공된 유전자이식 동물의 성 염색체에 통합된 리포터 유전자는 임의의 형광 단백질일 수 있으며 단 상기 형광 단백질은 GFP가 아니다. 일부 추가의 실시양태에서, 리포터 유전자는 RFP일 수 있다. 보다 특정한 실시양태에서, 이러한 RFP는 서열 번호 21로 표시된 아미노산 서열, 또는 이의 임의의 상동체, 변이체, 돌연변이체 또는 유도체를 포함할 수 있다. 일부 대안적인 특정 실시양태에서, 본 발명에 의해 사용된 RFP는 서열 번호 23로 표시된 아미노산 서열, 또는 이의 임의의 상동체, 돌연변이체 또는 유도체를 포함할 수 있는 RFP일 수 있다.
일부 추가의 실시양태에서, 본 발명의 키트는 성 염색체 Z 및 W 중의 적어도 하나에서 적어도 하나의 위치 또는 장소에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 유전자이식 조류 동물의 제조에 사용하기에 적합할 수 있다.
일부 실시양태에서, 본 발명의 방법은 본원에 기술된 바와 같은 본 발명의 키트 중의 어느 것을 사용할 수 있다.
여전히 추가로, 본 발명의 키트는 본 발명의 유전자이식 조류 동물의 제조에 필요한 임의의 시약, 완충제, 배지 또는 물질을 추가로 포함할 수 있음을 인지해야 한다. 본 발명의 키트는 설명서 뿐만 아니라 이의 다른 성분을 위한 용기를 추가로 포함할 수 있다.
일부 실시양태에서, 본 발명의 키트는 본 발명에 따라 본 발명의 임의의 유전자이식 조류 대상체 또는 이의 임의의 세포의 제조에 사용될 수 있다. 일부 추가의 실시양태에서, 본 발명의 키트를 사용하여 제조된 유전자이식 조류 대상체 및 세포는 본원에 개시된 바와 같은 시스템 및 장치 중의 어느 것을 사용하여 본 발명의 방법들 중의 어느 것에 의해 사용될 수 있다. 여전히 추가로, 일부 실시양태에서, 본 발명의 키트는 본 발명의 방법에 의해 검사된 난내 배아 내의 리포터 유전자의 존재를 결정하는데 적합한 임의의 장비, 시스템, 및/또는 장치를 추가로 포함할 수 있다. 일부 특정 실시양태에서, 이러한 장비 또는 장치는 특히 도 1에 나타낸 바와 같이 본 발명에 의해 개시된 임의의 장치일 수 있다.
이의 또 다른 측면에서, 본 발명은 난내 배아 내의 리포터 유전자를 검출하는데 특별히 적합한 시스템, 장비 또는 장치를 제공한다. 일부 실시양태에서, 본 발명의 장치는 레이저 소스, 알을 위한 스탠드, 렌즈, 필터, 검출기를 위한 스탠드 및 검출기를 포함할 수 있다. 본 발명의 장치는 임의로, 일부 실시양태에서, 예를 들면, 도 1에 나타낸 바와 같은 본 발명의 시스템의 모든 요소를 유지하는 견고한 지지대를 포함한다. 본원에서 사용되는 용어 "검출기"는 빛을 검출 및/또는 측정하는 임의 유형의 장치를 가리킨다.
일부 실시양태에서, 검출 가능한 신호, 특히 형광 신호가 적합한 형광 수단을 사용하여 본 발명의 장치에 의해 검출될 수 있음을 주지해야 한다. 일부 실시양태에서, RFP 리포터 유전자에 의해 형성된 검출 가능한 신호는 변형된 광학 현미경과 같은 감광성 장치 또는 고감도 광자 검출기인 전하 결합 장치 (CCD)에 의해 검출될 수 있다.
일부 추가의 실시양태에서, 본 발명의 장치, 장비 또는 시스템은 적어도 하나의 광원, 적어도 하나의 검출기, 적어도 하나의 필터 및 상기 광원에의 본 발명의 리포터 유전자를 발현하는 세포의 노출을 촉진시키는 적절한 위치에 알을 배치하는 적어도 하나의 홀딩 아암을 포함할 수 있다. 일부 실시양태에서, 이러한 알은 수정된 부화되지 않은 조류 알일 수 있다. 일부 추가의 실시양태에서, 이러한 알은 본 발명의 임의의 유전자이식 조류 대상체가 낳을 수 있다. 일부 특정한 비제한적인 실시양태에서, 본 발명의 이러한 장치는 도 1에 예시된 바와 같을 수 있다. 일부 추가의 실시양태에서, 에그 홀더와 렌즈 및/또는 렌즈와 검출기 사이의 거리는 약 1 내지 100 cm의 범위, 특히, 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 및 100 cm, 특히 약 5 내지 25 cm, 보다 구체적으로, 약 20 cm일 수 있다.
따라서, 일부 실시양태에서, 본 발명의 시스템 또는 장치는 본 발명에 의해 개시된 방법 중의 어느 것을 수행하는데 적합할 수 있음을 인지해야 한다.
일부 특정 실시양태에서, 본 발명의 장치는 검사된 알에서 리포터 유전자의 검출을 가능하게 하는 적합한 광원을 포함할 수 있다. 일부 추가의 실시양태에서, 광원은 약 400 내지 약 650의 파장을 포함할 수 있다. 일부 추가의 실시양태에서, 임의의 파장의 광이 사용될 수 있으며 단 상기 광원은 자외선 (UV) 광 (파장 10-400 nm)이 아니다.
일부 특정 실시양태에서, 적합한 광원은 형광 단백질의 여기에 적합하다. 일부 특별한 실시양태에서, 여기 파장은 약 500 nm 내지 약 650 nm일 수 있다. 일부 추가의 실시양태에서, 여기 파장은 약 510, 515, 520, 525, 530, 535, 540, 545, 550, 555, 560, 565, 570, 575, 580, 585, 590, 595, 600, 605, 610, 615, 620, 625, 630, 635, 640 nm이다.
일부 보다 특정한 실시양태에서, 여기 파장은 약 515 내지 약 555의 범위일 수 있다. 일부 추가의 실시양태에서, 파장은 532 nm일 수 있다. 일부 특정 비제한적인 실시양태에서, 광원은 레이저에 의해 제공될 수 있다. 일부 또 다른 실시양태에서, 본 발명의 장치의 레이저는 청색 레이저, 또는 적색 레이저일 수 있다. 보다 특정한 실시양태에서, 광원은 녹색 레이저이다.
특정 실시양태에서, 레이저는 필터와 함께 사용될 수 있다. 일부 실시양태에서, 필터는 500nm 이상을 투과하는 녹색 필터, 또는 540 nm 내지 580 nm 사이를 투과하는 진녹색 필터, 또는 590 nm 내지 650 nm 사이를 투과하는 적색 필터, 또는 650 nm 이상 또는 660 nm 이상을 투과하는 적색 필터일 수 있다.
일부 특별한 실시양태에서, 광원은 532 nm의 파장을 갖는 녹색 레이저일 수 있다. 일부 추가의 실시양태에서, 이러한 레이저에는 650 nm 이상을 투과하는 적색 필터가 제공될 수 있다.
따라서, 본 발명은 본 발명의 임의의 방법, 특히 본 발명의 유전자이식 조류 대상체 중의 어느 것을 사용하여 본원에 논의된 바와 같은 난내 성 감별을 위한 방법에 사용하기 위한 본원에 기술된 바와 같은 장치를 추가로 포함한다는 것을 추가로 인지해야 한다.
특정 실시양태에서, 본 발명의 키트/들 및 방법/들에 의해 사용된 올리고뉴클레오티드/들 또는 뉴클레오티드/들은 단리된 및/또는 정제된 분자임을 인지해야 한다다. 본원에서 사용되는 바와 같이, "단리된" 또는 "정제된"은, 핵산과 관련하여 사용될 경우, 자연 발생 서열이 이의 정상 세포 (예를 들어, 염색체) 환경으로부터 제거되었거나 비-천연 환경에서 합성됨 (예를 들어, 인공적으로 합성됨)을 의미한다. 따라서, "단리된" 또는 "정제된" 서열은 세포-비함유 용액에 있거나 상이한 세포 환경에 배치될 수 있다. 용어 "정제된"은 서열이 존재하는 유일한 뉴클레오티드임을 의미하는 것이 아니라 이와 자연적으로 관련된 비-뉴클레오티드 물질을 본질적으로 함유하지 않음 (약 90-95% 순수)을 의미하며, 따라서 단리된 염색체와는 구별된다.
본원에서 사용된 모든 과학 및 기술 용어는 달리 명시되지 않는 한 당업계에서 일반적으로 사용되는 의미를 갖는다. 본원에 제공된 정의는 본원에서 자주 사용되는 특정 용어의 이해를 용이하게 하기 위한 것이며, 본 개시내용의 범위를 제한하려는 것은 아니다.
본 발명의 특정 측면 및 실시양태가 상세하게 설명되기 전에, 본 발명은 특정 방법, 및 기술된 실험 조건에 제한되지 않으며, 이러한 방법 및 조건은 달라질 수 있음을 이해해야 한다. 또한, 본원에서 사용된 용어는 특정 실시양태들만을 설명하기 위한 목적을 위한 것이며, 본 발명의 범위가 첨부된 청구범위에 의해서만 제한될 것이기 때문에 제한하려는 것이 아님을 이해해야 한다.
본 명세서 및 첨부된 청구범위에 사용된 바와 같이, 단수 형태 "a", "an" 및 "the"는 문맥상 명백하게 다르게 지시하지 않는 한 복수의 대상을 포함한다. 따라서, 예를 들면, "방법"에 대한 언급은 하나 이상의 방법, 및/또는 본원에 기술된 유형의 단계 및/또는 본 개시내용 등을 읽을 때 당업계의 숙련가들에게 자명해질 것을 포함한다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야의 통상의 숙련가에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본원에 기술된 것과 유사하거나 동등한 임의의 방법 및 재료가 본 발명의 실시 또는 시험에 사용될 수 있지만, 바람직한 방법 및 재료가 이하에서 기술된다.
문맥이 달리 요구하지 않는 한, 본 명세서 및 하기 청구범위에 걸쳐, 단어 "포함하다(comprise)" 및 "포함하다(comprises)" 및 "포함하는(comprising)"과 같은 변형은 언급된 정수 또는 단계 또는 정수 또는 단계의 그룹의 포함을 의미하지만 임의의 다른 정수 또는 단계 또는 정수 또는 단계의 그룹의 배제를 의미하지 않는 것으로 이해될 것이다. 보다 특히, 용어 "포함하다(comprises)", "포함하는(comprising)", "포함하다(includes)", "포함하는(including)", "갖는(having)" 및 이들의 활용형은 "포함하지만 이에 제한되지 않는"을 의미한다. 이 용어는 "구성되는" 및 "본질적으로 구성되는"이라는 용어를 포함한다. "본질적으로 구성되는"이라는 어구는 조성물 또는 방법이 추가 성분 및/또는 단계를 포함할 수 있지만, 추가 성분 및/또는 단계가 청구된 조성물 또는 방법의 기본 및 신규 특성을 실질적으로 변경시키지 않는 경우에만 포함한다.
본원에 사용된 용어 "약"은 언급된 값보다 최대 1%, 보다 특히 5%, 보다 특히 10%, 보다 특히 15%, 및 일부 경우 최대 20% 더 높거나 더 낮게 벗어나는 값, 정수 값을 포함하는 편차 범위, 및, 해당되는 경우, 연속 범위를 구성하는 비-정수 값을 나타낸다. 본원에서 사용되는 용어 "약"은 ±10%를 가리킨다.
본 발명의 다양한 실시양태는 범위 형식으로 제시될 수 있음을 주지해야 한다. 범위 형식의 설명은 단지 편의 및 간결성을 위한 것이며 본 발명의 범위에 대한 융통성있는 제한으로 해석되어서는 안된다는 것을 이해해야 한다. 따라서, 범위의 설명은 구체적으로 개시된 모든 가능한 하위 범위 뿐만 아니라 그 범위 내의 개별 수치를 갖는 것으로 간주되어야 한다. 예를 들면, 1 내지 6과 같은 범위의 설명은 1 내지 3, 1 내지 4, 1 내지 5, 2 내지 4, 2 내지 6, 3 내지 6 등과 같은 구체적으로 개시된 하위 범위 뿐만 아니라 그 범위 내의 개별 숫자, 예를 들면, 1, 2, 3, 4, 5 및 6을 갖는 것으로 간주되어야 한다. 이것은 범위의 폭에 관계없이 적용된다. 수치 범위가 본원에 지시될 때마다, 지시된 범위 내에 임의의 인용된 숫자 (분수 또는 정수)를 포함하는 것으로 의도된다. 어구 제1 지시 숫자와 제2 지시 숫자 "사이의 범위에 있는/범위의(ranging/ranges between)" 및 제1 지시 숫자에서 제2 지시 숫자까지의 "범위에 있는/범위의(ranging/ranges from~to)"는 본원에서 상호 교환적으로 사용되며 제1 및 제2 지시 번호 및 그 사이의 모든 분수 및 정수를 포함하는 것을 의미한다.
하기 실시예는 당업계의 통상의 숙련가들에게 본 발명의 방법 및 조성물을 제조 및 사용하는 방법에 대한 완전한 개시 및 설명을 제공하기 위해 제공되며, 본 발명자들이 이들의 발명으로 간주하는 범위를 제한하려는 것은 아니다. 사용된 수 (예를 들어, 양, 온도 등)와 관련하여 정확성을 보장하기 위해 노력했지만 일부 실험 오류 및 편차를 고려해야 한다. 달리 나타내지 않는 한, 부는 중량부이고, 분자량은 평균 분자량이고, 온도는 섭씨 온도이고, 압력은 대기압 또는 대기압 부근이다.
실시예는 본 발명의 측면들을 수행하는데 본 발명자들에 의해 사용된 기술을 대표한다. 이들 기술은 본 발명의 실시를 위한 바람직한 실시양태의 예시이지만, 본 개시내용에 비추어 당업계의 숙련가들은 본 발명의 취지 및 의도된 범위를 벗어나지 않으면서 수많은 변형이 이루어질 수 있음을 인식할 것임을 인지해야 한다.
명확성을 위해, 별도의 실시양태들과 관련하여 기술된 본 발명의 특정 특징들은 또한 단일 실시양태에서 조합하여 제공될 수 있는 것으로 인지된다. 반대로, 간결성을 위해, 단일 실시양태와 관련하여 기술된 본 발명의 다양한 특징들은 또한 별도로 또는 임의의 적절한 하위 조합으로 또는 본 발명의 임의의 다른 기술된 실시양태에서 적합한 것으로 제공될 수 있다. 다양한 실시양태들과 관련하여 기술된 특정 특징들은, 실시양태들이 이러한 요소들없이 동작하지 않는 한, 이들 실시양태들의 필수 특징으로 간주되지 않아야 한다.
상기 기술되고 하기 청구범위에서 청구된 바와 같은 본 발명의 다양한 실시양태 및 측면은 하기 실시예에서 실험적으로 뒷받침된다.
개시되고 기술된 바와 같이, 본 발명은 이러한 방법 단계 및 조성물이 다소 변할 수 있으므로 본원에 개시된 특정 실시예, 방법 단계, 및 조성물로 제한되지 않는 것으로 이해되어아 한다. 또한, 본원에서 사용된 용어는 특정 실시양태만을 설명하기 위한 목적으로 사용되며 본 발명의 범위는 첨부된 청구범위 및 그 등가물에 의해서만 제한될 것이기 때문에 제한하려는 것이 아님을 이해해야 한다.
본 명세서 및 첨부된 청구범위에 사용된 바와 같이, 단수 형태 "a", "an" 및 "the"는 그 내용이 명확하게 달리 지시하지 않는 한 복수의 대상을 포함함을 주지해야 한다.
실시예
추가의 상세 없이도, 당업계의 숙련가가 전술한 설명을 사용하여 본 발명을 최대한 활용할 수 있다고 여겨진다. 따라서, 다음의 바람직한 특정 실시양태는 단지 예시적이며 어떠한 방식으로든 청구된 발명을 제한하지 않는 것으로 해석되어야 한다.
본원에 구체적으로 기술되지 않은 당업계에 공지된 표준 분자 생물학 프로토콜을 본질적으로 문헌[Sambrook et al., Molecular cloning: A laboratory manual, Cold Springs Harbor Laboratory, New-York (1989,1992)] 및 문헌[Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, Maryland (1988)]]에서와 같이 일반적으로 따른다.
시약
동물:
상업용 백색 레그혼 (White Leghorn) 닭은 헨드릭스 ISA 및 미네소타로부터 입수된다.
마커 라인 (Marker Line) 닭은 캐나다 브리티시 컬럼비아 애거시의 퍼시픽 어그리푸드 리서치 센터 (Pacific Agri-Food Research Centre) 출신이다.
동물 실험은 IACUC 승인 프로토콜에 따라 Crystal Bioscience IACUC 위원회의 감독하에 엄격히 수행되었으며 실험 과정에서 동물이 질병이나 사망으로 고통받지 않도록 보장하였다.
벡터:
PrecisionX™ Cas9 SmartNuclease 벡터 시스템은 System Bioscience Inc., 카탈로그 번호 CAS8/9xx 시리즈에서 주문한다.
Clontech#6921-1로부터의 pDsRed1-N1.
GFP 플라스미드-FUGW-H1-GFP-네오마이신 (Addgene), 카탈로그 번호 37632.
세포주: 암컷 세포는 ATCC® 번호: CRL-12135™로부터 주문된 Gallus gallus, 림프아세포 암컷 세포주 Con A-C1-VICK의 세포이다. 닭 세포 배양 실험을 위해 ATCC로부터의 닭 섬유아세포 암컷 세포주 UMNSAH /DF-1 ( ATCC ® CRL -12203™)을 사용하였다. 수컷 세포는 ATCC® 번호: CRL-2118™로부터 주문된 Gallus gallus , 상피 수컷 세포주 LMH/2A의 세포이다.
원시 생식 세포주 (PGC).
인간 배아 신장 293 (HEK-293) 세포주 (ATTC).
조류 유전자이식 대상체를 제조하는데 필요한 시약 및 재료
PGC 단리
1. 미세전극 피펫 풀러 (Shutter Instrument Co.).
2. 미세 그라인더 (NARISHIGE).
3. 소직경 (25 μm) 유리 마이크로피펫.
4. 입구-조절 피펫 (Sigma-Aldrich).
5. CaCl2 또는 MgCl2 없는 1x 행크스 균형 염 용액 (HBSS) (Hyclone, Logan, UT).
6. Ca2 또는 Mg2 없는 1x 듈베코 인삼염-완충 염수 (PBS) (Hyclone).
7. 트립신/에틸렌디아민테트라아세트산 (EDTA) (Gibco).
8. 햄버거 및 해밀턴 (HH) 단계 14-17의 닭 배아.
9. 자기-활성화 세포 분류 (MACS) 완충액. 0.5% 소 혈청 알부민 (BSA) 및 2mM EDTA로 보충된 1x PBS.
10. MiniMACS 컬럼 (Miltenyi Biotec).
11. 단계-특이 배아 항원 1 (SSEA-1) 항체 (Santa Cruz Biotechnology, Santa Cruz, CA).
12. 항-마우스 IgM 마이크로비드 (Miltenyi Biotec).
PGC 배양
1. PBS (Hyclone).
2. HBSS (Hyclone).
3. PGC 배양 배지 (50 mL). 3.75 mL 태아 소 혈청 (FBS, Hyclone), 1.25 mL 닭 혈청 (Sigma-Aldrich, St. Louis, MO), 500 μL GlutaMAX-I 보충물 (100x, Invitrogen), 500 μL 뉴클레오시드 (100x,Millipore), 500 μL 항생제/항진균제 (ABAM; 100x, Invitrogen), 500 μL 인슐린-트랜스페린-셀레늄 보충물 (100x, Gibco), 500 μL 비필수 아미노산 (NEAA; 100x, Invitrogen), 50 μL β-머캅토에탄올 (1000x, Sigma-Aldrich), 10 μL의 50 ng/μL 인간 기본 섬유아세포 성장 인자 (bFGF, Sigma-Aldrich), 및 50 mL까지 녹아웃 듈베코 개질된 이글 배지 (DMEM; Invitrogen) 첨가. 4℃에서 저장
4. 아큐타제 (Millipore).
생식선 키메라 생산 및 유전자이식
닭 PGC로의 유전자 전달
1. 리포펙타민 2000 (Invitrogen).
2. Opti-MEM 배지 (Invitrogen).
3. 형질감염 배지 (ABAM이 없는 PGC 배양 배지; 50 mL): 3.75 mL FBS (Hyclone), 1.25 mL 닭 혈청 (Sigma-Aldrich), 500 μL GlutaMAX-I 보충물 (100x,Invitrogen), 500 μL 뉴클레오시드 (100x, Millipore), 500 μL 인슐린-트랜스페린-셀레늄 보충물 (100x, Gibco), 500 μL NEAA (100x, Invitrogen), 50 μL β-머캅토에탄올 (1000 x, Sigma-Aldrich), 및 10 μL의 50 ng/μL bFGF (Sigma-Aldrich), 및 50 mL까지 녹아웃 DMEM (Invitrogen) 첨가. 4℃에서 저장.
4. Ca2 또는 Mg2 없는 PBS.
5. Ca2 또는 Mg2 없는 HBSS.
6. 1 μg/μL에서 플라스미드 DNA 제조.
유전자이식 PGC의 시험관내 증식 및 선택
1. Ca2 또는 Mg2 없는 HBSS (Hyclone).
2. 혈구계.
3. 트리판 블루, 0.4% (Invitrogen).
4. 도립 형광 현미경 (Leica Microsystems).
5. 게네티신® 선택적 항생제 (Gibco).
수용자 알에의 PGC 이식
1. 소직경 (25 μm) 유리 마이크로피펫 (미세전극 피펫 풀러 (Shutter Instrument Co.) 및 미세 그라인더(NARISHIGE)로 만들어짐.
2. 입구-조절 피펫.
3. CaCl2 또는 MgCl2 없는 HBSS (Hyclone).
4. HH 단계 14-17의 수용자 닭 배아.
5. Ca2 또는 Mg2 없는 PBS (Hyclone).
6. 피펫 세척 용액. 오토클레이브 증류수 중의 0.1% 과산화수소 (Sigma-Aldrich).
7. 겸자.
8. 조명기가 달린 입체현미경.
9. 핫-멜트 접착제 스틱 및 글루건.
10. 파라필름.
11. HBSS에서 3_103 세포/μL로 제조된 기증자 PGC.
검정교배
1. 야생형 Korean Ogye (KO) 암탉.
2. 1 mL 시린지.
3. Ca2 또는 Mg2 없는 PBS (Hyclone).
기증자-유래 자손 및 유전자이식 닭 검증
1. DNeasy 혈액 & 조직 키트 (Qiagen).
2. 기증자 PGC-특이 프라이머 세트.
3. 이식유전자-특이 프라이머 세트.
4. PCR 기기.
5. PCR 시약: PCR 완충액, dNTP, Taq 폴리머라제.
6. 아가로스.
7. TAE 완충액.
8. 전기영동 기기.
실험 절차
형광 검정
실험의 전체 설정은 도 1에 예시된 바와 같이 레이저 소스, 상기 레이저 소스에 알 내의 리포트 유전자를 발현하는 세포를 노출시킬 수 있게 하는 적당한 위치에 알을 위치시킬 수 있는 홀더 또는 스탠드, 렌즈, 필터, 검출기를 위한 스탠드 및 검출기를 포함한다. 샘플과 렌즈 및 렌즈와 검출기 사이의 거리는 약 20cm이다. 렌즈의 초점면은 약 10cm이며 필터가 그곳에 놓여진다.
검출기 앞에 필터를 배치함으로써 및 산란광이 필터를 우회하지 않도록 보장하기 위해 검출기의 모든 주변 영역을 덮음으로써 최적 조건을 검출하였다.
세 가지 유형의 레이저가 사용되었으며, 초기 전력 I0 및 필터는 하기 표 2에 나타낸 바와 같다:
형질감염된 GFP 또는 RFP-발현 세포의 알에의 주사
HEK 세포를 1% L-글루타민, 10% 태아 소 혈청 (FBS), 및 1% PenStrep (페니실린 + 스트렙토마이신) (Biological industries, Israel)이 보충된 DMEM 배지에 유지시켰다. 세포를 37℃, 5% CO2에서 가습된 배양기에서 성장시켰다. 배지는 일주일에 2-3회 재생시켰으며, 세포 수는 1 x 105 내지 3 x 105개 세포/mL로 유지시켰다. 다음과 같이 세포를 계대배양하고 신선한 배지에 재현탁시켰다:
1. 세포가 플라스크 표면에 부착되도록 플라스크로부터 상청액을 제거하였다.
2. 제거된 세포를 5 mL의 새로운 배지에 재현탁시켰다.
2nd 계대배양 후, 세포를 제조사 프로토콜에 따라 PolyJetTM 시험관내 DNA 형질감염 시약 (SignaGen Laboratories, MD, USA)을 사용하여 2 μg DNA의 플라스미드로 형질감염시켰다. 두 개의 플라스미드를 별도로 세포 내로 형질감염시켰다; 상기 명시된 바와 같은 GFP 플라스미드 및 RFP 플라스미드.
그후, 형질감염된 세포 (RFP)를 106개 세포/ml의 농도로 제조하였다. 그후, 표 3 및 4에 따라, 총 용적 100 μl의 세포를 중심에서 신선한 달걀에 주사하였다.
두 번째 실험에서 세포는 전술한 바와 같이 성장 및 형질감염시켰다. 그후, 세포를 PBS 또는 50% 글리세롤 (분산을 제어하기 위해)로 옮기고 중심에서 신선한 달걀에 주사하였다. 상이한 주사된 알들이 표 4에 개시되어 있다.
수탉 세포주
수컷 세포, 특히, Gallus gallus, 닭 (간; 화학적으로 유도됨; 닭 에스트로겐 수용체 유전자로 형질감염됨)을 1% L-글루타민, 10% 태아 소 혈청 (FBS), 및 1% PenStrep (페니실린 + 스트렙토마이신) (Biological industries, Israel)로 보충된 waymouth의 MB 752/1 배지에서 성장시켰다. 배양 플라스크 (T25)를 0.1% 젤라틴으로 코팅시켰다). 배지는 3일마다 재생시켰다. 세포를 37℃, 5% CO2에서 가습된 배양기에서 성장시켰다.
암탉 세포주
ATCC로부터의 닭 섬유아세포 암컷 세포주 UMNSAH /DF-1 ( ATCC ® CRL -12203™)를 사용하였다. 세포에 대한 상세한 설명한 표 5에 제시되어 있다:
암컷 세포를 1% L-글루타민, 10% 태아 소 혈청 (FBS), 및 1% PenStrep (페니실린 + 스트렙토마이신) (Biological industries, Israel)로 보충된 DMEM 배지에서 성장시켰다. 세포를 37℃, 5% CO2에서 가습된 배양기에서 성장시켰다. 배지는 1주일에 2-3회 재생시켰다.
PGC 세포주
배아 생식선을 6.5일 배양의 백색 레그혼 (WL) 배아로부터 회수한 다음 회수된 생식선 세포를 총 배아 생식선 세포에서 PGC의 분리를 위해 자기 활성화 세포 분류기 (MACS)로 처리한다. PGC를 KO-DMEM (Life Technologies)에서 성장시키며, 이중 40%는 버팔로 래트 간 세포 (BRL, ATCC) 상에서 예비컨디셔닝시키고, 7.5% 태아 소 혈청 (Hyclone), 2.5% 조사된 닭 혈청, 1X 비필수 아미노산, 2mM 글루타민, 1mM 나트륨 피루베이트, 0.1mM β-머캅토에탄올 (모두 Life Technologies로부터 제조됨), 4ng/ml 재조합 인간 섬유아세포 성장 인자, 6ng/ml 재조합 마우스 줄기 세포 인자 (둘 다 R&D Systems로부터 제조됨)로 보충되며 BRL 세포의 조사된 피더 층에서 성장시킨다. 세포를 주당 3회 신선한 피더 층에 계대배양한다.
제한 없는 (Restriction-free; RF)
클로닝
Cas9-Smart뉴클레아제™ 벡터에의 gRNA의 삽입은 제한 없는 방법을 적용하여 수행한다 [Peleg Y et al., J. Struct. Biol. 172(1):34-44 (2010) 2010]. 프라이머는 Sigma-Genosys (Rehovot, Israel)로부터 주문하고, 후속적인 RF 반응은 Phusion 폴리머라제 (Thermo Scientific, NH, USA, USA)를 사용하여 수행하였다. 플라스미드 정제는 MEGAspin 키트 및 DNA-스핀 플라스미드 DNA 정제 키트 (Intron Biotechnology, Daejoen, South Korea)를 각각 사용하여 수행한다.
닭의 염색체 W 또는 Z에의 형질감염
세포는 제조사 프로토콜에 따라 PolyJet™ 시험관내 DNA 형질감염 시약 (SignaGen Laboratories, MD, USA)을 사용하여 각 플라스미드의 2 μg DNA로 공동-형질감염시킨다 (아래 세부사항 참조). 두 개의 플라스미드의 공동-형질감염은 다음과 같이 수행한다:
1. 닭 염색체 Z 좌측 우측 아암 또는 염색체 W 좌측 및 우측 아암 및 CMV-hspCas9-H1-gRNA를 갖는 pDsRed (검정용).
2. 닭 염색체 Z 좌측 & 우측 아암 또는 염색체 W 좌측 & 우측 아암 및 CMV-hspCas9-H1-gRNA를 갖는 pCMVGluc (대조용).
그후, 세포를 네오마이신-내성으로 평판배양하고 웰당 105개 세포의 밀도로 48-웰 플레이트에 접종한다. 3일 후, 40μg/ml 네오마이신을 첨가하여 리포터 유전자의 안정적인 통합을 갖는 세포를 선별한다.
염색체 Z 또는 W에의 통합을 위한 DNA 분석
염색체 통합의 검증을 위해, 다음 전략을 사용하였다. 세포를 단리하고 이들 중 절반의 DNA를 추출하여 한천 겔 (1%) 상에서 수행하였다. 게놈 DNA (플라스미드 DNA를 겔 상에 남김)를 절단하고 세척하였다. 하기 프라이머로 PCR 분석을 수행하였다. 생성물을 겔 상에서 분리한 다음 서열분석하였다. 삽입물이 PCR 분석에 의해 검출하기에는 너무 길기 때문에, 초기 PCR 산물에 대해 착수한 슬라이딩 윈도우 PCR 분석을 설계하였다.
a. 삽입물을 갖는 세포주에 대한 검정 (좌측 아암의 일부, CMV 인핸서, 프로모터 및 MCS 및 dsRED2의 일부를 포함함):
서열 번호 49로 표시된 좌측 프라이머-TTGGTGTGTGCTAATAGGCAGT; 서열 번호 50으로 표시된 우측 프라이머-TAGTCCTCGTTGTGGGAGGT, 생성물 크기: 1489bp.
b. 삽입물을 갖는 세포주에 대한 검정 ((아암에 대해) 측면 Z 염색체의 일부, 좌측 아암, 및 CMV 인핸서, 프로모터의 일부를 포함함):
서열 번호 51로 표시된 좌측 프라이머-GCATTGATCTGTCCAGTTGC, 서열 번호 52로 표시된 우측 프라이머-TACTGCCAAAACCGCATCAC, 생성물 크기: 1462bp.
유전자이식 닭의 제조
농축된 비히클 (약 107 MOI 역가의 렌티바이러스일 수 있음) 또는 플라스미드 DNA)을 새로 낳은 알의 25개 배아에 주사한다. 주사는 매주 3회 주사로 수행된다. 주사된 배아는 주사한지 3주 후에 부화시킨다. 이들은 G0 새이다. 부화 직후, 부화된 병아리의 CAM 샘플로부터 DNA를 추출하고 벡터 DNA의 존재/부재의 검출을 반-정량적 PCR에 의해 수행한다. 2-3주령의 G0 병아리에서 혈액을 샘플링하고 PCR 스크린을 반복한다. G0 새를 수컷의 경우 16-20주, 암컷의 경우 20-24주 동안 성적으로 성숙시킨다. 수 병아리를 대략 16주부터 정액 생산에 대해 시험한다.
암탉을 수정시키고, 수정란을 매일 수집한다. G1 병아리는 3주 후에 부화하고 각각의 개별 병아리에 날개 띠 (wing band)를 달고 병아리 장요막 (CAM) 샘플을 껍질로부터 채취한다. CAM 샘플로부터 DNA를 추출하고 단일 카피 수준인 것으로 예측되는 이식유전자의 존재에 대해 PCR 스크린을 수행한다. 2-3주 후에 혈액 샘플로부터 DNA를 확인하고 병아리 성별 감별을 위해 스크린을 반복한다.
몇 주령에 G1 새로부터 혈액 샘플을 채취하여 PCR 분석을 위한 게놈 DNA를 제조한다. G1 새를 G2 번식에 사용한다.
PGC 단리
1. 혈액 PGC 단리를 위해 신선한 달걀 (EGK 단계 X), 예를 들어 Korean Ogye (KO)를 37℃에서 50-54시간 동안 배양한다 (HH 단계 14-17). 배양된 알을 알 플레이트에 수평으로 놓고 70% 에탄올로 소독한 면을 사용하여 난각을 부드럽게 닦는다.
2. 날카로운 겸자를 사용하여, 전혈 세포의 단리를 위해 난각 (<1 cm 직경)을 조심스럽게 갈라준다.
3. 25 μm 얇게 분쇄된 유리 바늘과 마우스 피펫을 사용하여 배아 등 대동맥으로부터 약 2-3 μL 전혈 세포를 수집한다. 500 μL PBS와 혼합한다. PGC의 미세주사를 위해, 마우스 피펫 및 직경 20-25 μm의 유리 마이크로피펫을 사용할 수 있다. 유리 마이크로피펫은 미세전극 피펫 풀러 (Shutter Instrument Co.)로 만들어지며 미세 그라인더 (NARISHIGE)를 사용하여 25도에서 접지된다.
4. 전혈 세포를 1.5 mL 멸균 튜브로 옮기고, 원심분리하고 (250 x g, 5분), 상청액을 제거한다.
5. 생식선 PGC 단리를 위해, 신선한 달걀을 37℃에서 5.5일 동안 배양한다 (HH 20-26). 날카로운 겸자로 HH 단계 20-26의 배아로부터 배아 생식선을 추출하고, 37℃ 배양기에서 5분 동안 500 μL의 0.05% 트립신/EDTA와 함께 배양한다.
6. 불활성화를 위해 50 μL FBS를 첨가하고, 원심분리하고 (250 x g, 5분), 상청액을 제거한다.
7. 1mL PBS에 전혈 세포 또는 해리된 생식 세포를 재현탁시키고 1:200 희석으로 항-SSEA-1 항체 (Santa Cruz Biotechnology, SC-21702)를 적용한 다음 혼합물을 실온 (RT)에서 15분 동안 배양한다.
8. 107개의 총 세포 당 5 mL MACS 완충액 (PBS 중 0.5% BSA 및 2mM EDTA, pH 7.2)를 첨가함으로써 세포를 세척하여 비결합된 1차 항체를 제거하고 원심분리한다 (250 x g, 5분).
9. 상청액을 완전히 흡인하고 총 107개 세포당 80 μL MACS 완충액에 세포 펠렛을 재현탁시킨다.
10. 총 107개 세포당 20μL 쥐 항-마우스 IgM 마이크로비드 (Miltenyi Biotec. 130-047-301)를 첨가한다. 보다 많은 세포 수에 대해서는, 완충액 용적을 이에 따라 확장시킨다.
11. 2-8℃에서 20분 동안 세포를 항체와 함께 배양한다.
12. 총 107개 세포당 2 mL MACS 완충액을 첨가하여 세포를 세척하고 원심분리한다 (250 x g, 5분).
13. 상청액을 완전히 흡인하고 500 μL MACS 완충액에 총 108개 이하의 세포를 재현탁시킨다.
14. 적합한 MACS 분리기의 자기장에 컬럼을 배치한다.
15. 500 μL MACS 완충액으로 헹구어 컬럼을 준비한다.
16. 컬럼에 세포 현탁액을 적용하고, 500 μL 완충액으로 컬럼을 3회 세척한다. 컬럼 저장소가 비어있을 때 새 완충액을 추가한다.
17. 분리기에서 컬럼을 제거하고 이를 적절한 수집 튜브에 놓는다.
18. 1 mL MACS 완충액을 컬럼에 추가하고 플런저를 컬럼에 단단히 밀어 넣어 자기적으로 표지된 세포를 즉시 제거한다.
19. PGC를 함유하는 단리된 세포를 예열된 PGC 배양 배지 (1 x 105개 정제된 PGC 당 1 mL PGC 배지)로 옮긴다.
PGC 배양
1. PGC를 함유하는 단리된 세포를 예열된 PGC 배양 배지 (1 x 105개 정제된 PGC 당 1 mL PGC 배지)로 옮기고 37℃에서 배양한다.
2. 7-14일의 성장 후, 대부분의 1차 배양된 PGC는 콜로니를 형성하고 세포 콜로니 집합체를 상실한다.
3. 부유된 PGC 콜로니를 부드러운 피펫팅 및 원심분리 (200 x g, 5분) 후 배지로 부드럽게 회수할 수 있다.
4. 세포 펠렛을 아큐타제 (~5 x105 PGC개 PGC 당 1 mL 아큐타제 용액)로 분해한다.
5. 원심분리하고 (200 x g, 5분) 및 세포 펠렛을 PGC 배양 배지에 재현탁시킨다.
6. 12-웰 플레이트에 현탁된 PGC를 접종한다 (12-웰 플레이트의 웰당 1 mL PGC 배양 배지에서 1 x 105개 배양된 PGC).
7. PGC는 3-4일마다 정기적으로 계대배양할 수 있다.
닭
PGC로의
유전자 전달, 생식계열
키메라
생산, 및 형질전환
닭 PGC로의 유전자 전달
1. CAGG-PBase (pCyL43B)를 함유한 4μg 헬퍼 플라스미드 및 리포터 유전자 (RFP)를 함유한 6μg piggyBac 트랜스포손 (pCyL50) 및 임의로, 선택 마커 (예를 들어, 네오마이신 내성 유전자)를 100μL Opti-MEM (Gibco)과 혼합하고 RT에서 5분 동안 배양한다. CRISPR/Cas 형질감염을 위해, 2.5 μgCMVRFP 발현 플라스미드 벡터, 2.5 μg Cas9 및 가이드 RNA 발현 플라스미드 벡터를 100 μL Opti-MEM (Gibco)과 혼합하고 RT에서 5분 동안 배양한다.
2. 10 μL 리포펙타민 2000 시약 (Thermo Fisher-Invitrogen)을 100 μL Opti-MEM과 혼합하고 RT에서 5분 동안 배양한다.
3. Opti-MEM 및 리포펙타민 2000 시약을 갖는 플라스미드를 Opti-MEM과 혼합하고 RT에서 20분 동안 배양한다.
4. 배양 동안, 배양된 PGC를 수확하고 원심분리한다 (200 x g, 5분). 상청액은 버린다.
5. 수확된 PGC에 1 mL 아큐타제 (Millipore)를 첨가하고 37℃에서 10분 동안 배양한다.
6. 혈구계 (Marienfeld)를 사용하여 PGC 수를 결정하고 항생제가 없는 1 mL PGC 배양 배지를 갖는 12-웰 플레이트에서 5 x 105개 PGC를 접종한다.
7. DNA-리포펙타민 복합체를 PGC에 적용하고 CO2 배양기에서 37℃에서 1일 동안 배양한다.
8. 형질감염된 PGC를 수확하고 원심분리한다 (200 x g, 5분). 상청액을 제거한다.
9. 1 mL HBSS로 PGC를 3회 세척하고 이들을 항생제를 갖는 PGC 배양 배지로 현탁시킨다.
유전자이식 PGC의 시험관내 증식 및 선택
1. 형질감염한 다음날 100 μg/mL G418 (네오마이신 내성 유전자의 경우)을 함유하는 PGC 배양 배지에서 형질감염된 PGC를 선택한다.
2. 형광 현미경을 사용하여 리포터 유전자 발현을 모니터링한다.
3. 3-4 일마다 PGC를 계대배양한다. 전체 선택 기간은 최대 3주가 소요된다.
4. 형질감염된 플라스미드 벡터에 약물-선택 마커가 없는 경우, 형광 단백질을 발현하는 PGC를 FACS에 의해 분류할 수 있다.
수용자 알에의 PGC 이식
1. 60-70% 상대 습도의 공기 중에서 37℃에서 HH 단계 14-17까지 수용자 알을 배양한다.
2. 형질감염된 PGC를 수확하고 원심분리하고 (200 x g, 5분) 상청액을 제거한다.
3. 수확된 PGC에 1 mL 아큐타제 (Millipore)를 첨가하고 37℃에서 10분 동안 배양한다.
4. 원심분리한다 (200 x g, 5 min). 상청액은 버린다.
5. PGC를 HBSS (Hyclone)에 현탁시킨다.
6. 수용자 알의 뾰족한 끝에 작은 창을 만들고 마이크로피펫으로 3,000개 이상의 PGC를 함유하는 2 μL 분취액을 수용자 배아의 등 대동맥에 미세피펫팅한다.
7. 글루건을 사용하여 수용자 배아의 난창을 파라필름으로 밀봉하고, 상대 습도 60-70%의 공기 중에서 37℃에서 부화할 때까지 끝이 뾰족한 상태로 알을 배양한다.
배아 생식선에서의 유전자 변형된 PGC 모니터링
1. 60-70% 상대 습도의 공기 중에서 37℃에서 HH 단계 28-30까지 수용자 알을 배양한다.
2. 배아 6일째에 생식선을 절개한다.
3. 형광 현미경을 사용하여 배아 생식선에서 형광 단백질을 모니터링한다.
검정교배
1. 성적으로 성숙한 수용자 및 야생형 (WT) 닭으로부터 일주일에 두 번 정액을 수집한다.
2. 성숙한 수컷 수용자 및 WT 수탉으로부터의 50 μL 정액을 각각 WT 산란용 암탉 및 성숙한 암컷 수용자에게 도입한다.
3. 인공 수정한 다음날 WT 산란용 암탉 및 성숙한 암컷 수용자로부터 알을 수집하고, 60-70% 상대 습도의 공기에서 37℃에서 부화될 때까지 뾰족한 끝을 갖는 알을 배양한다.
실시예 1
가금류의 시각적 성 식별을 위한 상이한 컬러 레이저 및 필터를 사용한 형광 분석
광학 형광 시스템
In-ovo 가금류의 성별을 시각적으로 식별할 수 있는 가능성을 입증하기 위해, 청색 형광 또는 적색 형광 리포터 유전자에 비해 녹색 형광의 사용을 평가하였다.
완전한 알 또는 난백, 난황 및 껍질로 분리된 알의 자가형광은 청색 레이저, 녹색 레이저 또는 적색 레이저를 사용하여 결정하였다. 빈 알 (껍질)과 완전한 알의 비교는 자가형광 수준에 유의한 차이가 없음을 나타낸다 (데이터는 나타내지 않음).
상이한 성분 및 알의 일부에 의해 제공된 산란 및 자가형광 강도는 표 6에 기술되어 있다.
중요하게는, 배경 노이즈 (레이저 없음)는 약 4nW이지만, 레이저 (532nm)의 존재하에서는 필터 (660nm 이상을 통과하는 저주파 통과 필터)를 우회하는 광 산란으로 인해 약 12nW였음을 주지하였다.
완전한 알에 상이한 농도의 플루오레세인 (1μM, 10mM)을 첨가하거나 첨가하지 않고서 녹색 (+500 nm) 또는 적색 필터 (590-650 nm)와 함께 청색 레이저 (473nm)의 사용을 분석하였으며, 도 2에 요약되어 있다. 큰 녹색 자가형광이 있는 것으로 보이지만, 높은 플루오레세인 농도 사용시 형광 강도가 검출될 수 있다.
완전한 알에 로다민 B (10 μM)를 첨가하거나 첨가하지 않고서 진녹색 (540-580 nm) 또는 적색 필터 (+660 nm)와 함께 녹색 레이저 (532 nm)의 사용을 분석하였으며, 도 3에 요약되어 있다. 40mW 이상에서는, 염료의 형광 방출이 녹색 필터로 상당히 검출 가능한 것으로 보인다 (거의 2배 더 큼). 그러나, 적색 필터로는 차이를 관찰할 수 없었다.
완전한 알에 dir (10 μM)을 첨가하거나 첨가하지 않고서 적색 필터 A (590-650 nm) 또는 적색 필터 B (+660 nm)와 함께 녹색 레이저 (532 nm)의 사용을 분석하였으며, 도 4에 요약되어 있다. 80mW 이상에서는, 염료의 형광 방출이 적색 필터 A를 사용하여 검출 가능한 반면 적색 필터 B (+660nm)를 사용함으로써 약간의 차이만 관찰할 수 있는 것으로 보인다.
완전한 알에 dir (10 μM)을 첨가하거나 첨가하지 않고서 적색 필터 (+660 nm) 또는 녹색 필터 (540-580 nm)와 함께 적색 레이저 (632.8 nm)의 사용을 분석하였으며, 도 5에 요약되어 있다. 형광 염료의 유무에 따른 강도 차이는 거의 보이지 않았다.
알 껍질 만을 사용하여 모든 실험을 반복하였다. 유사한 결과가 관찰되었다 (데이터는 나타내지 않음).
이러한 관찰은 알 껍질을 통해 RFP를 검출할 수 있는 가능성을 입증한다.
실시예 2
알에의 RFP 또는
GFP
형질감염된 세포의 형광
배아에서 RFP 발현 세포의 in- ovo 검출의 가능성을 예시하기 위해, 본 발명자들은 다음으로 형광 단백질, 특히 RFP 또는 GFP로 형질감염된 세포가 완전한 알 내에 이의 주사시 검출될 수 있는지 검사하였다.
보다 특히, HEK 세포를 실험 절차에 기술된 바와 같이 GFP 또는 RFP 벡터로 형질감염시켰다. GFP 및 RFP 형질감염된 세포 둘 다의 형광을 여기 후 조사하였다. 도 6 (GFP) 및 도 7 (RFP)은 형질감염된 세포에 의해 GFP 및 RFP 둘 다가 발현되고 형광 신호가 관찰될 수 있음을 분명히 입증한다.
그 후, HEK 형질감염된 세포를 실험 절차에 기술된 바와 같이 신선한 알에 주사하고 알의 형광 강도를 분석하였다.
먼저, 적색 형광 단백질 RFP-발현 세포를 갖거나 갖지 않는 알의 형광 강도를 녹색 레이저 (532nm) 및 +650 nm의 적색 필터를 사용한 알의 여기에 의해 특성화하였다. 도 8은 알의 5가지 다른 위치로 측정된 RFP가 없는 알의 형광 강도가 매우 유사하다는 것을 보여준다. 도 9는 알이 중심에서 여기될 때 상이한 농도의 RFP-발현 세포를 사용하여 측정된 형광 강도를 보여준다. RFP 농도와 검출기에서의 강도 사이의 상관 관계가 명확하게 관찰되었다.
RFP 발현 세포의 존재하에서, 알의 위치, 즉 레이저에 의해 제공된 정확한 여기 장소가 형광 강도에 영향을 주는지 확인하기 위해 여러 시험을 수행하였다. 여기 동안 알의 위치에 따라 검출기에서의 강도가 크게 변한 것으로 보인다. 이것은 알에 RFP-발현 세포를 주사한 후 RFP가 균일하게 분포되지 않기 때문에 예상되었다. 도 10은 여기 동안의 알의 특정 위치에서 관찰된 최대 강도를 나타내며, 이것은 RFP-발현 세포의 농도가 가장 높은 위치에 해당한다. 이 도면은 최소량의 약 3000개의 세포가 검출될 수 있음을 입증한다.
배아에서, 성 세포, PGC는 알의 발달 단계 X에서 새로 낳은 알의 에피블라스트의 중심에 위치하는 것으로 당업계에 공지되어 있다. 배아는 항상 난황낭의 윗면을 향해 있음을 주지해야 한다.
상기 노출된 결과는 알에서 수 밀리미터 뒤에 및 난황 근처에 위치한 영역의 여기시 최대 RFP 방출이 검출될 수 있음을 시사한다.
RFP 발현 세포를 알에 주사한지 1주일 후에 실험을 반복하였다. 결과는 RFP 염료가 알 내부로 확산되지 않았다는 것을 유사하게 입증하였다.
RFP-발현 세포의 존재 또는 부재하에 녹색 레이저 (532 nm) 및 +650 nm의 적색 필터를 사용하여 알의 형광 강도에 대한 PBS 및 글리세롤의 영향을 조사하였다. 도 11A 및 11B에 예시된 바와 같이 글리세롤이나 PBS 어느 것도 알에의 RFP 발현 세포의 형광 강도 측정에 영향을 미치지 않는 것으로 보인다.
이어서, 청색 레이저 (483 nm) 및 +500 nm의 필터를 사용하여 알의 형광 강도에 대한 PBS 및 글리세롤의 영향을 GFP-발현 세포의 존재 또는 부재하에 조사하였다. 예를 들면 30,000개의 GFP 발현 세포를 갖는 도 12에 예시된 바와 같이, GFP-발현 세포는 임의의 주어진 농도 (1000, 3000 10,000 및 30,000개 세포)에서 검출될 수 없는 것으로 보인다. +500 nm, 530-550 nm 및 540-580 nm의 세 가지 상이한 필터를 사용하여 동일한 결과를 수득하였다.
RFP를 리포터 유전자로 사용하는 놀라운 이점을 추가로 평가하기 위해, GFP 및 RFP-발현 세포의 형광을 최종적으로 도 13에 예시된 바와 같이 비교하였다. 파라미터 R은 형광 단백질 (FP) 강도 (IFP)와 자가형광 강도 (I자가형광) 사이의 비를 나타내도록 정의되었다:
R 파라미터는 GFP 및 RFP 발현 세포 둘 다의 상이한 농도에 대해 계산되었다. 도면에 나타낸 바와 같이, GFP-발현 세포는 어떠한 주어진 농도 (도 13에 도시된 바와 같이 1000 및 30,000개 세포)에서도 검출할 수 없는 것으로 보인다.
다른 한편으로, RFP-발현 세포는 낮은 농도 (1000개 RFP-발현 세포)에서도 상당한 R 파라미터 값을 제공하였다. 고농도의 RFP-발현 세포 (30000개 RFP-발현 세포)에서, R 값은 3에 도달하며, 따라서 RFP 리포터 유전자가 여기된 알에서 쉽게 검출될 수 있음을 분명히 입증한다.
주요 조사결과가 아래에 요약되어 있다:
1. 청색에는 강한 자가형광이 있고 녹색 및 적색에서는 자가형광이 없다.
2. 주요 자가형광은 난각에서 비롯된다.
3. 시스템은 비교적 낮은 염료 농도 및 낮은 여기 전력으로 녹색 및 적색 형광 염료를 검출할 수 있다.
4. 자가형광으로 인해 청색 형광은 거의 검출되지 않는다 (mM 염료 농도에서만).
5. RFP는 알 내부에서 훨씬 쉽고 상당하게 검출될 수 있다.
6. 이 시스템에서 GFP 유형은 검출할 수 없다.
7. 알 내부의 RFP-발현 세포의 정확한 위치가 여기 영역을 정의하는데 중요하다.
8. RFP 염료는 주사 후 14일 동안 알로 확산되지 않았다.
9. PBS나 글리세롤 어느 것도 RFP 검출에 영향을 미치지 않는다.이러한 결과는 성 염색체에 통합된 RFP 유전자를 발현하는 배아가 약 1000개 세포가 RFP를 발현하는 초기 발달 단계에서 검출될 수 있음을 분명히 입증한다.
실시예 3
가이드 RNA 벡터의 설계
RFP 리포터 유전자를 성 염색체 W 또는 Z에 삽입하기 위해, CRISPR/Cas9 매개된 HDR 방법이 선택된다. 그후 성 염색체 둘 다로부터 관련 gRNA 부위를 찾는다.
암컷 Z 염색체 통합
암탉의 염색체 Z의 서열 번호 15로 표시된 영역 9156874-9161874, 서열 번호 16으로 표시된 27764943-27769943, 서열 번호 17로 표시된 42172748-42177748, 서열 번호 18로 표시된 63363656-63368656 및 서열 번호 19로 표시된 78777477-78782477을 가이드 RNA 설계를 위해 분석한다. 보다 구체적으로, Z 염색체에의 RFP의 통합을 지시하기 위해, 서열 번호 26으로도 표시된 핵산 서열 GTAATACAGAGCTAAACCAG을 포함하는 Z 염색체 유전자좌 chrZ_42174515_-1의 gRNA7로 명명된 gRNA를 다음으로 제조하였다.
절차는 "PrecisionV Cas9 SmartNuclease 벡터 시스템" 사용자 매뉴얼에 따라 수행하였다. 보다 구체적으로, 두 가지 프라이머가 클로닝을 위해 설계되었다:
ChZgRNA_정방향: TGTATGAGACCACGTAATACAGAGCTAAACCAG, 서열 번호 53로 표시됨, ChZgRNA_역방향: AAACCTGGTTTAGCTCTGTATTACGTGGTCTCA, 서열 번호 54로 표시됨.
프라이머를 어닐링하여 5μM의 각 프라이머를 함유하는 반응 혼합물에서 이중체를 생성하였다. 혼합물을 95℃에서 5분 동안 배양하여 제거하여 실온으로 냉각시켰다.
나중에, 이중체를 다음과 같이 설정된 결찰 반응에 의해 제공된 선형화 Cas9 벡터에 클로닝하였다: 1 μl의 선형화 벡터, 3 μl의 어닐링된 올리고 믹스, 1 μl의 결찰 완충액 및 0.25 μl의 신속 리가제. 혼합물을 25℃에서 5-7분 동안 배양하였다.
혼합물을 DH5α 적격 세포로 형질전환시키고, 세포를 50 μg/ml 카나마이신을 함유하는 LB 플레이트에서 배양하고 37℃에서 밤새 항온처리하였다.
다음날, 2개의 콜로니를 무작위로 채취하고 LB/카나마이신 배지에서 밤새 37℃에서 진탕하면서 성장시켰다.
다음날, Qiagen mini-prep 키트를 사용하여 플라스미드 DNA를 제조하고 제공된 서열분석 프라이머를 사용하여 서열분석하였다.
일부 추가의 실시양태에서, 제한 없는 클로닝 프로토콜에 의해 4개의 추가 가이드 RNA를 선택하고, 합성하고, 야생형 Cas9 뉴클레아제 (Horizon)를 함유하는 Cas9 SmartNuclease 벡터로 별도로 클로닝한다: 서열 번호 11로 표시된 gRNA3: ACAGACCTATGATATGT; 서열 번호 12로 표시된 gRNA4: CGATTATCACTCACAAG; 서열 번호 13으로 표시된 gRNA5: CTGGTTAGCATGGGGAC; 서열 번호 14로 표시된 gRNA6: GTAAAGAGTCAGATACA.
Z 염색체 내의 특정 유전자좌로의 통합에 적합한 gRNA 서열에 대한 추가의 비제한적인 예는 서열 번호 27로도 표시된 핵산 서열 ACAGACCTATGATATGTGAG를 포함하는 Z 염색체 유전자좌 chrZ_9157091_1의 gRNA8, 서열 번호 28로도 표시된 핵산 서열 GAGCTTGTGAGTGATAATCG를 포함하는 Z 염색체 유전자좌 chrZ_27767602_-1의 gRNA9, 서열 번호 29로도 표시된 핵산 서열 GTAAAGAGTCAGATACACAG를 포함하는 Z 염색체 유전자좌 chrZ_78779927_1의 gRNA10, 및 서열 번호 30으로도 표시된 핵산 서열 CAGTGGGTACTGAAGCTGTG를 포함하는 Z 염색체 유전자좌 chrZ_63364946_-1의 gRNA11을 포함할 수 있지만 이에 제한되지 않는다.
이들 gRNA는 예측된 부정확한 부위가 거의 없으며, 이들 중 어느 것도 알려진 암호화 서열에 있지 않았다.
암컷 W 염색체 통합
서열 번호 3으로 표시된 핵산 서열을 포함하는 암닭의 염색체 W의 영역 1022859-1024215를 가이드 RNA 설계를 위해 분석한다. 제한 없는 클로닝 프로토콜에 의해 2개의 가이드 RNA를 선택하고, 합성하고, 야생형 Cas9 뉴클레아제 (Horizon)를 함유하는 Cas9 SmartNuclease 벡터로 별도로 클로닝한다: 서열 번호 1로 표시된 gRNA1: GCACTAGGAACCAGCAGCAG, 및 서열 번호 2로 표시된 gRNA2: GTAGCCCCAAGAGGGCTAGG.
이러한 2개의 gRNA의 예측된 파라미터는 표 7에 제시되어 있다:
실시예 4
RFP 표적화 벡터의 설계
암컷 W 염색체 또는 암컷 Z 염색체 유전자좌의 상기에 나타낸 적절한 측면 서열과 상동성인 측면 서열을 RFP-발현 벡터, 구체적으로 pDsRed1-N1 플라스미드에 도입한다.
본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 31로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 32로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 26의 gRNA7에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.
보다 구체적으로, 본 발명의 리포터 유전자를 gRNA7, 구체적으로 서열 번호 26로 표시된 GTAATACAGAGCTAAACCAG에 의해 지시된 특정 유전자좌에 통합시키기 위해, '좌측 아암'의 클로닝을 RF 방법론을 사용하여 pDsRed1-N1 플라스미드에서 CMV 인핸서 상류에서 수행하였다.
다음의 프라이머가 사용되었다:
정방향 프라이머: ACGGGGTCATTAGTTCATAGCCCATATATGGTGAACGGATAGGCAGCAAGC, 서열 번호 55로 표시됨 (5' 좌측 아암 서열 및 플라스미드의 통합 부위의 30개 뉴클레오티드를 함유함).
역방향 프라이머: GGCGGGCCATTTACCGTAAGTTATGTAACGTGAGGAAGGGTCTGTTACTGGA, 서열 번호 56으로 표시됨.
우측 아암을 다음 프라이머를 사용하여 Neo 저항 유전자의 하류에 클로닝하였다.
정방향 프라이머: TTCTATCGCCTTCTTGACGAGTTCTTCTGAGTCATGTCGGTGGAGGAGAAA, 서열 번호 57로 표시됨 (녹색으로 표시된 3' Neo 내성 서열)
역방향 프라이머: GTGATGGCAGGTTGGGCGTCGCTTGGTCGGGCATGGGATGTTAAAGAGAAGCT, 서열 번호 58로 표시됨 (오렌지 벡터에서 Neo 유전자에 대한 서열 3').
적절한 통합을 보장하기 위해 서열분석에 의해 클로닝을 확인하였다.
통합 부위의 측면에 있는 인핸서 영역에서의 16개의 뉴클레오티드 (CGGTAAATGGCCCGCC, 서열 번호 59로 표시됨)의 반복으로 인해 CMV 인핸서로부터 193개 뉴클레오티드가 결실됨을 주지한다.
일부 추가의 실시양태에서, RFP 리포터 유전자는 서열 번호 11로 표시된 gRNA3, 서열 번호 12로 표시된 gRNA4, 서열 번호 13으로 표시된 gRNA5, 또는 서열 번호 14로 표시된 gRNA6을 사용하여 클로닝할 수 있다.
gRNA3을 사용한 클로닝을 위해, 서열 번호 41로 표시된 핵산 서열을 포함하는 "좌측 아암" 및 서열 번호 42로 표시된 핵산 서열을 포함하는 "우측 아암"이 제공된다. gRNA4를 사용한 클로닝을 위해, 서열 번호 43으로 표시된 핵산 서열을 포함하는 "좌측 아암" 및 서열 번호 44로 표시된 핵산 서열을 포함하는 "우측 아암"이 제공된다. gRNA5를 사용한 클로닝을 위해, 서열 번호 45로 표시된 핵산 서열을 포함하는 "좌측 아암" 및 서열 번호 46으로 표시된 핵산 서열을 포함하는 "우측 아암"이 제공된다. gRNA6을 사용한 클로닝을 위해, 서열 번호 47로 표시된 핵산 서열을 포함하는 "좌측 아암" 및 서열 번호 48로 표시된 핵산 서열을 포함하는 "우측 아암"이 제공된다.
추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 33으로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 34로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 27의 gRNA8에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 여전히 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 35로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 36으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 28의 gRNA8에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 37로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 38로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 29의 gRNA10에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다. 추가의 실시양태에서, 본 발명의 리포터 유전자를 Z 염색체 내의 특정 유전자좌에 통합시키기 위해, 서열 번호 39로 표시된 핵산 서열을 포함하는 좌측 아암 및 서열 번호 40으로 표시된 핵산 서열을 포함하는 우측 아암이 본 발명의 리포터 유전자를 서열 번호 30의 gRNA11에 의해 지시된 특정 유전자좌에 통합시키는데 사용될 수 있다.
암컷 W 염색체에 대해, 리포터 유전자, 특히 RFP를 서열 번호 1로 표시된 가이드 1 (gRNA1), 또는 서열 번호 2로 표시된 가이드 2 (gRNA2)를 사용하여 클로닝할 수 있다. gRNA1을 사용한 클로닝을 위해, 서열 번호 4로 표시된 핵산 서열을 포함하는 "좌측 아암" 및 서열 번호 5로 표시된 핵산 서열을 포함하는 "우측 아암"이 제공된다. gRNA2를 사용한 클로닝을 위해, 서열 번호 6으로 표시된 핵산 서열을 포함하는 "좌측 아암" 및 서열 번호 7로 표시된 핵산 서열을 포함하는 "우측 아암"이 제공된다.
여전히 추가로, CMV-프로모터의 상류의 영역에 대한 "좌측 아암"은 서열 번호 8로 표시된 핵산 서열을 포함하고, 네오마이신-저항 하류 영역에 대한 "우측 아암"은 polyA 부위 하류 영역에 대해 서열 번호 9, 또는 서열 번호 10으로 표시된 핵산 서열을 포함할 수 있다.
실시예 5
암탉 세포주의 Z 염색체에의 RFP 리포터 유전자의 통합
암탉 세포주를 실험 절차 섹션에 상세히 기술된 바와 같이 두 가지 플라스미드, 즉 닭 염색체 좌측 및 우측 아암을 함유하는 pDsRed 및 CMV-hspCas9-H1-gRNA를 함유하는 플라스미드로 공동-형질감염시켰다.
사용된 gRNA 서열은 서열 번호 26으로 표시된 gRNA 7이었다. 표 8은 사용 된 가이드 RNA에 대한 보다 상세한 설명을 제공한다.
그후, 형질감염된 세포를 적색 형광으로 여기시켰다. 도 14에서 알 수 있는 바와 같이, 형질감염은 양성이었다. 조명 세포 (illuminate cell)를 수집하고, 게놈 DNA를 추출하고 (실험 절차에 기술된 바와 같이) 슬라이딩 PCR 분석을 수행하였다. 그후, PCR 단편을 SANGER 서열분석을 위해 보내고, 도 15에 예시된 바와 같은 통합된 서열을 수득하였으며, 이것은 Z 염색체로의 RFP 유전자의 성공적인 통합을 입증한다.
결론적으로, 이러한 결과는 다음을 입증한다:
· 암탉 세포주의 성공적인 성장 절차가 확립되었다
· RFP 리포터 유전자 및 CRISPR Cas9 시스템의 암탉 세포주로의 성공적인 형질감염이 확립되었다
· 강한 형광 신호가 적색 여기에서 생성되었다
· Z 염색체에의 RFP 리포터 유전자의 성공적인 포인트 통합이 확립되었다
실시예 6
CRISPR
-처리된 세포의 생식선 전달
유전자이식 닭을 제조하기 위한 원시 생식 세포 (PGC)의 사용은 동물 생명공학 및 바이오모델링에 많은 이점을 갖는다. 닭 배아는 난생 (oviparous)이기 때문에, 초기 단계의 PGC는 쉽게 접근할 수 있으며 유전자 물질의 복원, 게놈 편집, 및 유전자이식 연구를 포함한 실제 응용을 위해 시험관내에서 조작할 수 있다. 상이한 배아 기원의 닭 PGC를 위한 배양 시스템을 구축하기 위해 상당한 노력이 이루어져 왔으며, 닭 PGC 만이 이들의 특성을 상실하지 않고 시험관내에서 무기한으로 유지될 수 있음이 입증되었다.
보다 구체적으로, 닭에서, PGC는 먼저 Eyal-Giladi 및 Kochav (EGK) 단계 X 배아의 에피블라스트에서 분리한 다음 명역 (area pellucida)의 내배엽 아래로 이동하고, 후속적으로 생식 신월환으로 이동하여 혈류로 들어간다. 순환계를 통해 이동한 후, 이들은 생식 융기에 도달한다.
생식선 발달에서의 이러한 독특한 특성은 이들을 수용자 알의 혈관에의 유전자 조작된 PGC의 주사를 통해 유전자이식 닭을 생산하는데 사용할 수 있게 한다.
상기 기술된 2개의 벡터, 구체적으로, gRNA/Cas9 및 리포터-유전자 벡터는 실험 절차에 상세히 기술된 바와 같이 PGC에 공동-형질감염시킨다. 안정적인 클론이 확인된 후, 세포를 확장하고 PCR에 의한 RFP 통합에 대해 확인한다. 확인된 클론을 단계 14-16 (H&H)에서 수용자 닭 배아에 주사한다. 주사된 배아를 대용 껍질로 옮기고 37℃에서 부화할 때까지 배양한다. 병아리의 성을 W- 또는 Z 염색체에 대한 PCR에 의해 부화 후 감별한다.
암컷과 수컷 키메라를 성적으로 성숙하도록 성장시키고 야생형 수컷과 암컷 닭으로 키운다. 부화한 병아리를 RFP의 발현에 대해 평가하고, 생식계열 자손은 표적화된 RFP를 지니는 것으로 PCR에 의해 확인된다.
SEQUENCE LISTING
<110> EGGXYT LTD
<120> METHODS FOR GENDER DETERMINATION OF AVIAN EMBRYOS
IN UNHATCHED EGGS AND MEANS THEREOF
<130> IPA191583-US
<150> US 62/510,921
<151> 2017-05-25
<160> 67
<170> PatentIn version 3.5
<210> 1
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Guide 1 for W chromosome
<400> 1
gcactaggaa ccagcagcag 20
<210> 2
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Guide 2 for W chromosome
<400> 2
gtagccccaa gagggctagg 20
<210> 3
<211> 1460
<212> DNA
<213> Artificial Sequence
<220>
<223> galGal5_dna range=chrW:1022859-1024215
<400> 3
tcgggctaac attagacccg ttgtgtctta atcctgccgt cgggtataca tatactaaaa 60
gaacctcctt tccctcctat aaatcggagc gagacaaggc attctttttt tattattatt 120
ttggttgcct gcccatcaga tgtaatgaaa gttgcacagg gtagggctaa gaaggtaaag 180
gagttaaatt cccccgggag gttagagatt ccctgtattg tggttgcctg cccattagac 240
gtaacaaaag ttgtgaaggg taggactaag gatccaggta aagaggttag tcccccaggg 300
ttagagtccc tcctcagaag taaatgtaaa acataaccac ggtaattgtc gttgagtgcg 360
cttgtttgat tgttaattgt ttgtgctgtt attgtatgct gattgtttgt gttgttatta 420
tacaaagagc tcacatgcat cgttaaaatg ggcattggat cacctagggg tgagggaatt 480
ttgaaaaagt cacttttggg ctgtgtttta agtcattgga aagaaatagc tggatcccct 540
ggtggggttg cacagaagga tgatttaagt acgatggatg cctttgaggc aggcactagg 600
aaccagcagc agtggcagat ttgtgatcat ggaaagaatt ggtgggagca tacggcacca 660
ggactcagat aagatagcta gctaaggtga tgaattgtag atggtgtcag ataacgaaag 720
aagaaaaaca aatgtaataa agtgttaaat gccaatatgt tttttataat gaggcaatat 780
cctgaatggc attagtgtgg gatcaatttg gcccagatga ccctctgatt ttaatggtag 840
aaaatgataa gagagagagg gagaaaggaa gagagtgtaa aacgtgttgt tcagcatgta 900
gtattggact gagatgcttc aagcgaaaca agaatgagca ggaggaggat ttagagatgc 960
tagtagcccc aagagggcta gggggcctca aaatcatgga acccaactcc ctggagtaga 1020
agggtcaggt aatgagtcca aaagagggac tataggaacc atgccagtaa cagagaggac 1080
tcacagccag catagggtcg tgctgtaagc cctgttgagg cagttggaaa tgacagttcg 1140
gtagtagtta aggtaccctt ttaaattaca gatttaaaca tttggaaagc agctgctggc 1200
agctaccgtg atgatcctaa acgggtagct aatgcttttg aaatgatgat taaaactcag 1260
gaactggata ggaaagatat ggaatttatt atgcacatgt tgtttgatag tacagaaaaa 1320
taaatgattc actagaccac acggacccaa gtggaggatc aggtaatggc aggggttttg 1380
cttggatgta atgctggaaa ggacaagagt cctttcctgt cctggggagg atttagaggt 1440
ggttagacct tggggaggag 1460
<210> 4
<211> 592
<212> DNA
<213> Artificial Sequence
<220>
<223> For cloning using the gRNA1, W chromosome, "Left arm"
<400> 4
tcgggctaac attagacccg ttgtgtctta atcctgccgt cgggtataca tatactaaaa 60
gaacctcctt tccctcctat aaatcggagc gagacaaggc attctttttt tattattatt 120
ttggttgcct gcccatcaga tgtaatgaaa gttgcacagg gtagggctaa gaaggtaaag 180
gagttaaatt cccccgggag gttagagatt ccctgtattg tggttgcctg cccattagac 240
gtaacaaaag ttgtgaaggg taggactaag gatccaggta aagaggttag tcccccaggg 300
ttagagtccc tcctcagaag taaatgtaaa acataaccac ggtaattgtc gttgagtgcg 360
cttgtttgat tgttaattgt ttgtgctgtt attgtatgct gattgtttgt gttgttatta 420
tacaaagagc tcacatgcat cgttaaaatg ggcattggat cacctagggg tgagggaatt 480
ttgaaaaagt cacttttggg ctgtgtttta agtcattgga aagaaatagc tggatcccct 540
ggtggggttg cacagaagga tgatttaagt acgatggatg cctttgaggc ag 592
<210> 5
<211> 848
<212> DNA
<213> Artificial Sequence
<220>
<223> For cloning using the gRNA1, W chromosome, "Right arm"
<400> 5
tggcagattt gtgatcatgg aaagaattgg tgggagcata cggcaccagg actcagataa 60
gatagctagc taaggtgatg aattgtagat ggtgtcagat aacgaaagaa gaaaaacaaa 120
tgtaataaag tgttaaatgc caatatgttt tttataatga ggcaatatcc tgaatggcat 180
tagtgtggga tcaatttggc ccagatgacc ctctgatttt aatggtagaa aatgataaga 240
gagagaggga gaaaggaaga gagtgtaaaa cgtgttgttc agcatgtagt attggactga 300
gatgcttcaa gcgaaacaag aatgagcagg aggaggattt agagatgcta gtagccccaa 360
gagggctagg gggcctcaaa atcatggaac ccaactccct ggagtagaag ggtcaggtaa 420
tgagtccaaa agagggacta taggaaccat gccagtaaca gagaggactc acagccagca 480
tagggtcgtg ctgtaagccc tgttgaggca gttggaaatg acagttcggt agtagttaag 540
gtaccctttt aaattacaga tttaaacatt tggaaagcag ctgctggcag ctaccgtgat 600
gatcctaaac gggtagctaa tgcttttgaa atgatgatta aaactcagga actggatagg 660
aaagatatgg aatttattat gcacatgttg tttgatagta cagaaaaata aatgattcac 720
tagaccacac ggacccaagt ggaggatcag gtaatggcag gggttttgct tggatgtaat 780
gctggaaagg acaagagtcc tttcctgtcc tggggaggat ttagaggtgg ttagaccttg 840
gggaggag 848
<210> 6
<211> 962
<212> DNA
<213> Artificial Sequence
<220>
<223> For cloning using the gRNA2, W chromosome, "Left arm"
<400> 6
tcgggctaac attagacccg ttgtgtctta atcctgccgt cgggtataca tatactaaaa 60
gaacctcctt tccctcctat aaatcggagc gagacaaggc attctttttt tattattatt 120
ttggttgcct gcccatcaga tgtaatgaaa gttgcacagg gtagggctaa gaaggtaaag 180
gagttaaatt cccccgggag gttagagatt ccctgtattg tggttgcctg cccattagac 240
gtaacaaaag ttgtgaaggg taggactaag gatccaggta aagaggttag tcccccaggg 300
ttagagtccc tcctcagaag taaatgtaaa acataaccac ggtaattgtc gttgagtgcg 360
cttgtttgat tgttaattgt ttgtgctgtt attgtatgct gattgtttgt gttgttatta 420
tacaaagagc tcacatgcat cgttaaaatg ggcattggat cacctagggg tgagggaatt 480
ttgaaaaagt cacttttggg ctgtgtttta agtcattgga aagaaatagc tggatcccct 540
ggtggggttg cacagaagga tgatttaagt acgatggatg cctttgaggc aggcactagg 600
aaccagcagc agtggcagat ttgtgatcat ggaaagaatt ggtgggagca tacggcacca 660
ggactcagat aagatagcta gctaaggtga tgaattgtag atggtgtcag ataacgaaag 720
aagaaaaaca aatgtaataa agtgttaaat gccaatatgt tttttataat gaggcaatat 780
cctgaatggc attagtgtgg gatcaatttg gcccagatga ccctctgatt ttaatggtag 840
aaaatgataa gagagagagg gagaaaggaa gagagtgtaa aacgtgttgt tcagcatgta 900
gtattggact gagatgcttc aagcgaaaca agaatgagca ggaggaggat ttagagatgc 960
ta 962
<210> 7
<211> 478
<212> DNA
<213> Artificial Sequence
<220>
<223> For cloning using the gRNA2, W chromosome, "Right arm"
<400> 7
gggcctcaaa atcatggaac ccaactccct ggagtagaag ggtcaggtaa tgagtccaaa 60
agagggacta taggaaccat gccagtaaca gagaggactc acagccagca tagggtcgtg 120
ctgtaagccc tgttgaggca gttggaaatg acagttcggt agtagttaag gtaccctttt 180
aaattacaga tttaaacatt tggaaagcag ctgctggcag ctaccgtgat gatcctaaac 240
gggtagctaa tgcttttgaa atgatgatta aaactcagga actggatagg aaagatatgg 300
aatttattat gcacatgttg tttgatagta cagaaaaata aatgattcac tagaccacac 360
ggacccaagt ggaggatcag gtaatggcag gggttttgct tggatgtaat gctggaaagg 420
acaagagtcc tttcctgtcc tggggaggat ttagaggtgg ttagaccttg gggaggag 478
<210> 8
<211> 669
<212> DNA
<213> Artificial Sequence
<220>
<223> A "left arm" for the region upstream to the CMV-promoter
<400> 8
aggcaaggct tgaccgacaa ttgcatgaag tcgggctaac attagacccg ttgtgtctta 60
atcctgccgt cgggtataca tatactaaaa gaacctcctt tccctcctat aaatcggagc 120
gagacaaggc attctttttt tattattatt ttggttgcct gcccatcaga tgtaatgaaa 180
gttgcacagg gtagggctaa gaaggtaaag gagttaaatt cccccgggag gttagagatt 240
ccctgtattg tggttgcctg cccattagac gtaacaaaag ttgtgaaggg taggactaag 300
gatccaggta aagaggttag tcccccaggg ttagagtccc tcctcagaag taaatgtaaa 360
acataaccac ggtaattgtc gttgagtgcg cttgtttgat tgttaattgt ttgtgctgtt 420
attgtatgct gattgtttgt gttgttatta tacaaagagc tcacatgcat cgttaaaatg 480
ggcattggat cacctagggg tgagggaatt ttgaaaaagt cacttttggg ctgtgtttta 540
agtcattgga aagaaatagc tggatcccct ggtggggttg cacagaagga tgatttaagt 600
acgatggatg cctttgaggc aggcactagg aaccagcagc gatgtacggg ccagatatac 660
gcgttgaca 669
<210> 9
<211> 911
<212> DNA
<213> Artificial Sequence
<220>
<223> A "right arm" for the region downstream the Neomycin-resistance
<400> 9
ttctatcgcc ttcttgacga gttcttctga cagtggcaga tttgtgatca tggaaagaat 60
tggtgggagc atacggcacc aggactcaga taagatagct agctaaggtg atgaattgta 120
gatggtgtca gataacgaaa gaagaaaaac aaatgtaata aagtgttaaa tgccaatatg 180
ttttttataa tgaggcaata tcctgaatgg cattagtgtg ggatcaattt ggcccagatg 240
accctctgat tttaatggta gaaaatgata agagagagag ggagaaagga agagagtgta 300
aaacgtgttg ttcagcatgt agtattggac tgagatgctt caagcgaaac aagaatgagc 360
aggaggagga tttagagatg ctagtagccc caagagggct agggggcctc aaaatcatgg 420
aacccaactc cctggagtag aagggtcagg taatgagtcc aaaagaggga ctataggaac 480
catgccagta acagagagga ctcacagcca gcatagggtc gtgctgtaag ccctgttgag 540
gcagttggaa atgacagttc ggtagtagtt aaggtaccct tttaaattac agatttaaac 600
atttggaaag cagctgctgg cagctaccgt gatgatccta aacgggtagc taatgctttt 660
gaaatgatga ttaaaactca ggaactggat aggaaagata tggaatttat tatgcacatg 720
ttgtttgata gtacagaaaa ataaatgatt cactagacca cacggaccca agtggaggat 780
caggtaatgg caggggtttt gcttggatgt aatgctggaa aggacaagag tcctttcctg 840
tcctggggag gatttagagg tggttagacc ttggggagga gggttcgaaa tgaccgacca 900
agcgacgccc a 911
<210> 10
<211> 911
<212> DNA
<213> Artificial Sequence
<220>
<223> A "right arm" for the region downstream the polyA site
<400> 10
atctgtgtgt tggttttttg tgtgtctaga cagtggcaga tttgtgatca tggaaagaat 60
tggtgggagc atacggcacc aggactcaga taagatagct agctaaggtg atgaattgta 120
gatggtgtca gataacgaaa gaagaaaaac aaatgtaata aagtgttaaa tgccaatatg 180
ttttttataa tgaggcaata tcctgaatgg cattagtgtg ggatcaattt ggcccagatg 240
accctctgat tttaatggta gaaaatgata agagagagag ggagaaagga agagagtgta 300
aaacgtgttg ttcagcatgt agtattggac tgagatgctt caagcgaaac aagaatgagc 360
aggaggagga tttagagatg ctagtagccc caagagggct agggggcctc aaaatcatgg 420
aacccaactc cctggagtag aagggtcagg taatgagtcc aaaagaggga ctataggaac 480
catgccagta acagagagga ctcacagcca gcatagggtc gtgctgtaag ccctgttgag 540
gcagttggaa atgacagttc ggtagtagtt aaggtaccct tttaaattac agatttaaac 600
atttggaaag cagctgctgg cagctaccgt gatgatccta aacgggtagc taatgctttt 660
gaaatgatga ttaaaactca ggaactggat aggaaagata tggaatttat tatgcacatg 720
ttgtttgata gtacagaaaa ataaatgatt cactagacca cacggaccca agtggaggat 780
caggtaatgg caggggtttt gcttggatgt aatgctggaa aggacaagag tcctttcctg 840
tcctggggag gatttagagg tggttagacc ttggggagga gcaagtaaga tgcttttctg 900
tgctgcaata g 911
<210> 11
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Guide 3 for Z chromosome
<400> 11
acagacctat gatatgt 17
<210> 12
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Guide 4 for Z chromosome
<400> 12
cgattatcac tcacaag 17
<210> 13
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Guide 5 for Z chromosome
<400> 13
ctggttagca tggggac 17
<210> 14
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Guide 6 for Z chromosome
<400> 14
gtaaagagtc agataca 17
<210> 15
<211> 4980
<212> DNA
<213> Artificial Sequence
<220>
<223> ENSGALG00000025945_ENSGALG00000023622|chrZ:9156874-9161874
<400> 15
cctgcaggac atgtggacac tctgccaggt actgggggag gatcccctcc actgctccct 60
gggagatggc aaacatctag agagggacac tgcagggatg ctgcatgaac acctccagcc 120
ttctgcaggc tgtgatgggg tcagggctga aggtcaacac aagcaatgac tgcttgctga 180
caatgtgggc attgccgacc acagacctat gatatgtgag tggtgagtgg ggccaggaga 240
gcaggacagg agtgtggact cggaggcgcg ggcagaggag gtagctcaga gcatgagata 300
tattcgccag gtgtcagtgg acttctggca gtgcatactg cagagagctt tggttgctgg 360
ccatctggat gatgacaaaa tctcagccac agaccatgtg ggttggaaga gtcctcagga 420
gatcaccttt ccacctcctg ctaaagcaca ttccctacag tatgtttcac atgacaccgt 480
gctggcagat ttttaatatc atcagagaat gacactccat atcctctctg ggcagccttt 540
ttcagtgctc tgtcacccac aaagtaaagt atttgctcat gttctaatgg aacttcctat 600
gttctagttt gtgaccattg aaccttgttc tgtcactgga cagtgctgaa ggagcctggc 660
cctatccact tgactcccac actttacata tttacaagca tcgataagac ccccctcagt 720
cttctccaga ctagatagcc ccaggtctcc caaccattcc ttttatggga gatgcttcag 780
gcccctcatc acctctgtgg ccctctgctg gactgcctgc agtagttcca ggtttttttt 840
tttgaactgg ggagcccaga acttgacacg gtattccaga tgtggcctca ccagcgcaga 900
ggagagggga aggctcacct ccctcgacct ggtggccatg ttttttttaa cagacctcag 960
gataccactg gccttcttgg cccaagggca cactgctggc tcatggccca tgggttggct 1020
tccaggactc tcaggtcctt ctccgtagag ctcctctcaa gcaggacaac cctcagcctg 1080
tactgatgtg tgcggtgcgg ttattcctcc ccacgtgcaa gactctacat ctgccattgt 1140
taaatctcat aagcttcctc tctgcccaac tctccactgt gtacgggcct tagtgaatgg 1200
cagcacagac ttctggtgtg aggatagcat tcagaacaag ctgctgtacc ttcccagtca 1260
cagaggtgag ggtgactggc ttgtactttc ccagctttgc cttcttgccc ttttggaaga 1320
ctggagcgac attggccttc tggaggaaac ggtcctcagg cacccctcct gttctccatg 1380
acctttgaaa gatgatcgag agcaccttgg cagtcacttc tgccagctcc ttcagcacgc 1440
atgagtgcat cccgccagtg cccatggatt tgtgttcatt gaattagcct aggtgacctc 1500
tgatcagatc cttcttgacc aaggggaaga cttcctttcc ccaggttctt atctccaggg 1560
cctgggattc ccaaggggca atcttagcag gaaaggatga agtaaaggag gtgtgcagtt 1620
acagtgcttt catggtgtcc tccattactc caatgaggtc acccacctca ttcagcagca 1680
gacatacatt ctcccagtct tcctttttct actgccatac taaagtagtc cttcatgttg 1740
tccttgactg aaggtcaccc aacttgattt ccagtgagcc ttagcattcc ttgtagcatt 1800
catgcatgtc ctgacaacat tcctattttc ttcccaagtg gccagagacc ttttccacac 1860
tccagaggct ttgttcttcc attactgcct ttccatgagc ttcttgctca tctctgcagg 1920
tctcatgcca cctttgcccg atttcttagt cttagagatg caccgatctt gaatttggaa 1980
gaagtggtgc ttgaatgaca accagctctc ttggtccccc ttgctttcca aagctctaac 2040
ccatggaatg cctccatgta tgtctgtgaa gaggtcaaag tcagctctcc tgaagtcgtg 2100
gttgcaatcc tacaaactgc ctgatttctc ccatgggaga tcccgaactc cactatctca 2160
cagtcactgc actcaaggct tcccccagcc ttcacatccc cagctacagg aagagaagag 2220
gctcgaggct acttgcagct gtctgcggaa ggcttctcca gcttcctcct cttcatcagg 2280
cggcctgttg taaacaccca caacagcgtc acccatcata gcctgtccct tagtcctcac 2340
ccataaactt tctactcatt catcatgcat cccttggcag agctctgtac attccagctg 2400
ttccctcaca taaagagcaa ctccaccacc tcacaccgac gtctgtctgt cctaaaaagt 2460
acagagccat ccctgagagc attccagtca tgcgagctgc cccaccacgt ccctctgctg 2520
atcgcactga gatcgcggcc ctacgaccat ccatggatct atgactcttc ctgtttactc 2580
cccgcactgt gtgtgatgtt acacaggcac ttcagagaag aaaagagagc acaggatgcc 2640
gatttccctt ggcaggaccc caggggccgc acgcagcccc cacctctatc agcaggtctg 2700
agcaggactg gagctgcagg cagagcacag ctcagccctg agacacctcc atgctgcctc 2760
ctgcacagcc tcggccccac agcccccggg aaggagagca cgggtggggt gccgggagcc 2820
acgctgcgct ctgacacact gcgtgtcccc tgctcccagc gcgagctgca gggcccgtgc 2880
aggaacgagc tgggccccaa cgtgaccctc ggccccggtc actgctgaac gacagcgttc 2940
agctctccag gctgcaaaga gcgagccgtg aaatggagca acacgcggga ttcccgggtg 3000
tgaattccta aacggattcg aaggtgccca acaggcagcc actgcgtccg cagctgtgct 3060
tcggtacctg gagacccgcg agcccgtctg ttcccaccag cctccagcag ccggtgctcg 3120
cggatcaaaa gaccgccgtg aaggccgcag ggccgtccct gggacggagc gccgcccgct 3180
tccgccgcca gccgcggctc cgccctcccc gccgagctga cgctggcagc gcgcagagcg 3240
cggagcggag ccgcggcgct ttccggcggc agcgcccgca cggggctcgc cgagggccgc 3300
gcagagcgct gtgcccggcg ggccgcgtcg ccgctccggc ggcaccgcga ttccggcacg 3360
gagcgcaacg agcgcccgct gcccggctgc aggacgcggt cggggccaca ccgcggcggg 3420
gccgcagcct gccttccgcg ggaccgcacg tccggcctcc ccgaatttgg ccccgcagcc 3480
cccgggctgt caccgtgctg tcaccgtgcc gttcacggtt tacgggctgg ttcggcccgg 3540
ttcggcccgg ttccgtgact ggcgggacag agggattcgt ggatccgcgc ctccgggaag 3600
ggaaacggga ccccgaataa ttaaaaacag cggccacgat ctgaggggtt acaaatgtac 3660
taaaacgtac taaaaacaaa cagctgctta acacctccta ttccaaaggc ccatcgacac 3720
cccttggcac cctcaaagta tccccttctg aggtaatggg taccaagaat gcacggagcc 3780
cctgggccag tcacagcagg gtgcttttgc cagtctgtac cggtgaggcc tatttcggcc 3840
acaaacacag tcaattcttg ggaaccccca ttcaccccat gaatataagt tgattctgtc 3900
ccttggtgac tcgagggcgt gacagtgcac tgtgcaccag ggtccaccag ggcctcgtat 3960
tcctgaggtt ctgatgtgcc acaccacgaa cccacacggt tcaatacact ccatcatcct 4020
ttccccccat ggtgggggca gggtccctct atttgttacc tctgtcgttc ttagagcggt 4080
tgccatgtcc tgcagcaatg ggagcgatca cctctttggg gattaatctt ggtggttaat 4140
ctgccttgta attattttac ctgtgcttga aaatgcccct ccaggtgaaa gcaaactgca 4200
gcctgcattc tgtggccaaa ggaatggaaa agaaggcgtt agcaatgcca gtggtggcat 4260
accacttggc ttcttttgac tccagttcat actggagttc taacatgtcc agaacagcag 4320
cgctcagtgg gggtgtgact tcattctggc catggtagtc tactgtcagc ctccattctg 4380
cactggcttt atgcactgga gcacagggct tatggggagc ggcggaggga gctgggatgg 4440
ttcagtctgc agatgaggag gctcagggga gaccttattg ctctctgtaa ctccatgaag 4500
ggaggttgta gtgagctggg ggtcggtctc ttctctcatg tgactagtgg taggactaga 4560
gggaatggcc tccagttgca gcaggggaga ttcaggctgg atgttaggaa atgggctgga 4620
gtgggctgcc cggggaggtg gtggagtcac cgaccctgga ggtgctcaag gaatgtttag 4680
acaccgtgtt tagggacatg gtatagtgag aactgttggt gatgggtgga cagttgggct 4740
ggatgatctt gtaggtcttt ttaaagcttg gtgattcttt gattcgataa gtgcaaagtg 4800
ttgcatttgg gtcagagcaa tctcacgggt gtgcacaggc tgggagaaga actcctggga 4860
gaagaagaga gcagccctgc agagaaggac ttgacatgaa agacttaacg tcagccagac 4920
tccctctgct ctgccctcat gagcctctcc tactctgtaa aggtttgggc ccccagcaca 4980
<210> 16
<211> 4980
<212> DNA
<213> Artificial Sequence
<220>
<223> ENSGALG00000015036_ENSGALG00000000438|chrZ:27764943-27769943
<400> 16
aggagtggct tctgaggctg gaaacaaggt gctcccctct tgtcaaacag ccaattccat 60
ctagctccaa cccatcctcc actggccaaa gctgagccca tcgctgatgg tgatagcatc 120
tgtaatagca tctcagaaag gctaaaagca ctgcgcagca gctgagagaa aagagtgagg 180
gaaaatggga cagaaacagc tctgcagccc tcagaggcaa tgcagaggag aggcaggagg 240
tgctccaggc atggagcatt agtttcttgc agtccaggag ttacaggtga tggtgcaggc 300
tctgtgcagc ccagtgatga ctgtttcagg atccatgctg cagcctgtgc cagagccagg 360
ggataggctt ggctgcttag tgcaggacgt ggagagccca tgctgagtgc aagctcccaa 420
aaggctagga cagaacaggt gtagtggagt agatcttgta ctgtggagca gtcttttcct 480
ggaggactaa cctgtgaaga ggaggactgc gctgaagcgg ttcatgaaga atgaaacctt 540
gtgggaggga ccccacactg aaaaaggaga aaaccacgat gaggaaggag cagcagagag 600
ctccccagcc ctgtgtgcac tgccaggaga gaaggaagta gaaaacgtgg gaatgtgcag 660
gtgtaaagct gagtctggga aaaaggtggg ggtggaataa aggtattttt agtcctatac 720
ctttctcatc aacctacttt aattgtagat tggccataaa ttaaatgttt tccccaggtc 780
aagtctgttt cttgcttgtg atggtggatg atctccctgt cctcatccca atcctgaagc 840
tatttcatca tatattctct ccctgccctg tttcaggaca gggagtgcaa gcagtttggc 900
agccagacga ggttaaccca gcaccagagg tttagtcaca tgcaagtgag agctattgcc 960
tcaacttaaa tgggagaaaa cattttagca ggttgagtct caccttgttt atccagatta 1020
tacagccatg ccagcacatg ggctgcatgc agcctggccc aacccatcct ctagccaccc 1080
cctgccccat actgaaaatg cagcggctct gccctgccaa gctgccaagc ctggctccag 1140
gcactcaccc attgcttaca aacaacaaaa cgtcagcgtg tgagcgcgcc ctgtgagctg 1200
caactggcat ggggagggca cagtcagcac aaatacatga cctgcaaatt ttcacatgga 1260
atgtatggag ttgcaatcag atactcagct caaaaaattt aatcatggct ccttacctgt 1320
ctttttttta acctttctct tagctcagag aggtatacct cacttcacaa tcatgccgta 1380
ttcatgtcat tgctttctgg cagtacgtac gtttgtgaac agctgttttc aagggtgatg 1440
cacaggaaga gtaaaatttc attaaaaaat ctccaaggag cacatggaga gctcactcag 1500
aagcctcacc gctgccactg aacaagactg atgcattagt ttcatgaaat caaggctatg 1560
tgtcccactg gtttcattat tttgttactc tttctttaaa acaaaaaaat tgttttattg 1620
cttatataca tcaactatgt tgttatatat tttccaaagg ccgctccaaa agtaatgcct 1680
cctgtttcat tctgttggcc caccgtgtca gaggcagatg gtggtacggc agtagagatg 1740
gaaccttccc accaatattc cattacatgt tgccatgtga tagacagcag cagatgggca 1800
ctctgacaga atggtatctg acatggaagc gtggatggag caaagttgtg tcactgaatt 1860
cctccataag gaaatgagca cccactaaca ttcactgatg cttgctgaac atttctggag 1920
accaaacagt ggatgtgagc acagtgaggt ggtgggtggt gcatttcagc agtggtgaca 1980
atgacgttgg gtcacctctg ctggtgcagg ttttgatgag tgcagcctgt gaggtcttgt 2040
tcatcaatgg agaaaatgca caactaatgg tggtgactgc tgaaaaatag tgttttgtag 2100
ctgagaattt tctctgtcaa acagtgctaa ttgtgctctt tgtatctgtt gtagtttcca 2160
tgggaataaa taggaggcat tacttgcaga ctgacctaca tatatgtggc cccaggcaag 2220
tcaacagctg tacgaaaagt ccatgcttcc tcattataaa cggaggaaaa aaagttgttt 2280
acagctgtaa tgggattata aaaggcaaat ggggatagta cagtggtgag aaccagatct 2340
atgaaggaaa agccctaaga aaaagagagt gcacagatac tcttaaccat ctaataactg 2400
tttcctccat cctacagctc agagttaaga cttacagagg actctagtac ttagtaagat 2460
gaatacgagc taatagtggc aaaaataatc ccagtgcctc aacactgacc tgggaaaaag 2520
gggcatgtat agaccttctg atattgtgat gctgtgtttg tacacttatt atctacattt 2580
tcagaaatta ggttaaactt cagaaaactg aagatctcca gggcttgtag cagaccctga 2640
ccaccagact ggtccccgat tatcactcac aagctctcaa accgattgtg gctgtttctc 2700
agaggcaact ctttgcgctc tagcccctct ataacatggg gcaacttccc ctgccccacc 2760
ttcccttcct gtatcttctg aaaagcttgt agccctcaat tgtcacgctc cagccatatg 2820
aatcatccca ccacgtccct gtgttcacaa ttaccttcta gtcttctaat tgcaccatgg 2880
cttccaattc ctcctgttta tcacccacgt tgcatccatt gatgtagagg cacttcagtc 2940
gggctatcag caatgttacc acctgtgagg agccctcttg agatctttta ggacaattta 3000
gaggttttcc ccactgtttc ctaaaattac agcattccct gtcccttctt agtgatatag 3060
aactccatcc ccttccacca tcaaacctag cttaagctct ggtaaatgat ccagccagtc 3120
tgcttcccaa aactcttgct cagttgcatt ctatctgatg cctacatgcc caacaccttc 3180
aaggcctgtc caagatcata gaacacaaag gcttgatcat gacaacatcc atgcagccaa 3240
tcattcacat gacccattcc tctcctcctt tccaggtccc aacggccaac tgagagttgt 3300
gctctgagct cttcagtgtc cttccgaggg atgtaaagtc ccttttaatg ttctgcattt 3360
tctttgtcac agccttctga gacccaactt gaatgtggag gagtggagag taatcatccc 3420
gctctgatta tcagatacat tagcctcttc ttggcacctc tggcagacag aagacttccc 3480
tggagagatt acctggatga taactggggg cctcagtgcc tcacagcagc aagtccccag 3540
ttactaagac tctacacctc tttggtggcg ctagttctga tgtagttctt cagttgctta 3600
acatgcttgt tgtttcccaa gatttgactg ctatctgcac cctccctttc ttccagcccc 3660
agagccttat atcatgagct gagaacattc tgtgttcaaa atacaagaca catttatgca 3720
atttcgtatt ctctacccat atttttgtga tagaaattag ggctacttat ttcccatagt 3780
gatttccatg ctgcctacca ggttctaagt caggtcaccc tgccagcttc ttccaaacca 3840
tgctcaggag tgcatcaaat cacacgcaga cccaaggaaa aaatgtacca aacaatatta 3900
ccacgcatgc aaactcctca gtagctctgt cccatatgct acaattaggt ctgtataggc 3960
ttgttagatc ttgtctactt gattagtgtt ttccagcagg cctacaatcc aacctaaact 4020
gaacagacat taaagacatg tttcactaat acaaaacaac tccacctagt tcaacagtct 4080
gctcttttgt gtatggtacc tgaaactctt ctgttcactg aacttatccc aacatttttc 4140
ctcctaatgc atactttttc tagacgtgat gtgaaagtac agtgttatac cctggtgctg 4200
cattaatttg cataaccaca gcacacaaag cataatcata acacacaaag gcctcctatg 4260
aaaacatctg cttaaagtca taggtcactt atttattctc cctctagtta tgtaccagaa 4320
tgatgtatgt taataaataa tagattatta aatccatcaa aaattaggga agagctctag 4380
cacaaaggca aagcaaagaa gctttgaaga agtgcaagta aaatgaatta tttccaaaca 4440
actagcttct cactgtccca ctaagaacaa agactattct tatgcactgc tgtccttaaa 4500
attatcagct gctttgtgtt tatttcatgg agtaacacat gcaatatttt ttacaagaaa 4560
taagaaacca cagcagcaga agacgaatct gcttttattg aacgcagaaa tagatggaca 4620
ctgaaacaac agaagtttct accatgtttt gctgctgtga gagcaaatct gctgttgatc 4680
aactattagt tttgaaaagt atatgcaact ctgctatcaa ctccttcccc acatcacatc 4740
tcgtttcaag gagaaccttc ctgtccaggc aactagccag ggattttaat tttaacattt 4800
gctatctcag ataatctttt aatatttcta ggccgtgcac ataacccaca tagccctaac 4860
tccagatgtt cccagcatca cttagcagta gttccacttg aagcataaat acagcactgg 4920
cacaacaaat gaagacaatt caagcacgcc tttaacaagc atacagaaca tacagtttta 4980
<210> 17
<211> 4980
<212> DNA
<213> Artificial Sequence
<220>
<223> ENSGALG00000012629_ENSGALG00000012628|chrZ:42172748-42177748
<400> 17
acaaattaaa tgtattttct cttgatacta ttttgattat aagctattaa cttgatttgt 60
aaaagcaccg atattatggt taatgtatgt atggtaactg ttgagtcaca gcctgaacct 120
ctgattgacc acctgcggaa aggtctgggt gagccctggg agcacaggca aaaacaattc 180
agttgtgcaa ctggaaggcc tctcttagac ctcatttaag ggctgactgt cactggggaa 240
ggatctgatt ctggagatcc cttattggtg aagctttccc ctgcaaacct agaatcttct 300
gatgcaagtg agcaatcttc ttcccttccc tagcagctct ctgttgcacc agtccttcca 360
tccttgcacc tttgttgtaa tgcttttccc atggcattga tctgtccagt tgctacagtg 420
tagaaacaag aaagtgtttt ctcaaaacat tatacatgct tactatcaga tcttacttaa 480
cattgataag aagtacacct ttcattacaa cagtgaacgg ataggcagca agcattcaga 540
acaatgaaaa agatctgcgt tctattgtaa agcaaacaaa ggtgatgacg gaacgtttat 600
ttgagataca ggcaccatag tacaagatat caaagaggaa ttaattcaac cctcccaaca 660
acagttggga aaaaaaaagg ataagctgag gaatgcagcc ttctccgatt tttactctgg 720
tgccggaagg aggaggagga gcgggggaaa acccagcgga ctcagactgc atacgcactc 780
tcggaagtac ctctgaggcg gggtgagagg aagggtggat ctaggctccc cccgctccac 840
acactcacgt gctcgtgtac tggttcaggc tgtgacttgg caactcctct acatctatcc 900
atctagttag actcaacaag accatcgtga ttcaggagtc tgaagatgct taactctctc 960
agaacgtcta gttctcctgg cctggtaaat gctatgtttc tcatactgcc tctctgaaga 1020
atgcttcgaa tgcttctagt gatgctctaa agttctaaac agaaaaatct ggagacagtt 1080
ctggtcttta gatagaaaaa atgccaacat gccaaaggat ggttacatcc ttcaagcaac 1140
cttgttgcat gctgtacaat agactcatgt aataacttag ccgtagtcat cgtatctctt 1200
atttacctgt tcgttattac attttcctgg tactgcttta tatttagtca gttgtccttt 1260
taagacaaat tttttggtgt gtgctaatag gcagttacca aatgttctag agggagggaa 1320
tataatcagt gagtatgtag atgtatatag atgtataacc agtaagtata cagagaagtt 1380
agggtggtct tttgagagca tatagctgga aagattatca catgggaaaa ggtaatcaga 1440
aataaatgga aaaatgctca ccagtgtcat aggctcacaa gaaaactccc caaggagcaa 1500
tctccagtaa cagacccttc ctcagtggca gtcagccctt aaatggcatc taggagaggt 1560
gtagccaggc accacccctt ctgtcacata ggtgaattgc cttcagctgt gctcctgcag 1620
ctgactcagt gttcacctca ggtgatcaat cagaggtcca gaccatgatt caacatttcc 1680
catgcggagg gagatgaaac aagactgtca tctcatcttc tgaagctgat aggagaatgg 1740
ttacaataag taggtcccct tccactggtt tagctctgta ttactcagtt taaaacttta 1800
tgtagttaat ggagttccat agaatcacat cgctggaaaa tgtatgtgat agctataccc 1860
aaaaagtgac acagcatcac agcctctacc aggtcctctg cctccagaca ggaccttgag 1920
ctgtgtgatc cctttgggat gtttctgttt aagacagggg acacttacac attaggaaac 1980
tggagtcatg tcggtggagg agaaagtggc tgtagaaaag gtaacggaca agaaatccct 2040
cactggctta gctgtaaagg tcagaggaaa atcatcttct gttctccata cacatctcct 2100
gtaattaggc acctgtgccc tttaaaaaag taaagtaatc aaagagtcat ttggtgaaaa 2160
tagaagccaa acagttacaa aatttagtta atattcaaag acaaaacaac tctggttcca 2220
aatataaaac cctttgtgta aacactgcgg gaaggtgcca aagagccacc tacacaaaga 2280
gatgccacag agtaatttgc gtaccccaac aataggatca tatatgggca aaccaaaaga 2340
ccaacaaaga ccccttgcaa taatcccttg attggcagaa gcaagtgcag cgttagattt 2400
agtatgtgtg acaattctga gaataggaag gaatttcact gaaactgtgt gaagatttgt 2460
atgttaaata catataatga gggttattta gctctggggt gtgcatgcta tgtggagaga 2520
tccccatgtg cccagcactg caatagacta atgtcagctt tttaaaccat catttggttt 2580
gaagagttta ttatgatttt cagaaacaga attatgtatt cagtgtctgt acattcttac 2640
aagcctgctg ttctgtacac atgaaaaagc tacttatggt gcaaatcagt atagagaagc 2700
agttttgaca tacagtggtc atgactgggt gatctgctgt cagaaggtaa gacactggta 2760
tacagaattg caaacgtgag atgaagacct caagtgcaac tctgtcatca taccacttct 2820
cttgctatta tctattcagt gtttgttcta aatattcagg cagaaggctt ggtttcacat 2880
caggtgttac atttaagtat tctttgccca ttttttgctg tttgtatgtg taacttcaga 2940
ttctcacatt gactgtgtag tgtaaatttg caaatagatg taacagcttc tctttaacat 3000
cccatgccaa acttttaatc actttcaatc aatgttggaa atctgcagta cataaatttt 3060
attttgattc attattcaga gaatcagaga aataaggact tttttagagg tttatgttta 3120
ttttagaaaa tataaataaa tcttgtatac atagatttcc aactagtaaa atttttagct 3180
atcgctgtag catttctatg aggagtttta ctttttactg tctcttatga aacttagtgg 3240
aaacaaagct aggtttcata aaacgtctaa tctcatattc atctctctcc aaaatatggt 3300
gaccttcaaa acaagaacag tttgcttatg taaacatttc ttacattgta ttctattaca 3360
ttatcatatt catgaagata ctttagaatt ttgttgctgt tagttctgtt gtgactggct 3420
gcttttctca gcttaagagc tctgcagaag tgatgataat atatattctc tttgctgagt 3480
tacaggaatt tcctgctttc ctctactgta cgttggagcc caggagatca gatccaacta 3540
ccagaatttt atatagctct ttgtgatcag tccttcctta gttgctgtta ttcctattga 3600
tgcaaaccta tttatggtgt attaaatgaa gaagatataa tgaggacagt ctaataatca 3660
aagttttttt ctgcagccag tagtacaggt agggtgacat gccttgcata aacagatcca 3720
gatgaaaggt gtgggtgagg caataagtct tcaggccctg ggctaaggca ggacctgttt 3780
tgtttcatga gatatgccta ggcctctcta tagacagggg gagatgtcag agaattctga 3840
agcatcagca gaggctatct tggttttcag gccctgtgct aagtatgaga ggaagttgag 3900
aacagataat gtgtgcaaca aagttagcaa catgcttttt caaaacagag gaaacgatcc 3960
ataaatactg gaacagaaca acctcacaga aatcactgac tgtccctttg ctggccatgg 4020
catcctgaag gttgtgctgg tagcactcat tgggttgctg tagctgataa ggcagtgcaa 4080
ggacattggg tctgcacctg ctatgaacag gcactggggc ctccaggagc tgctggtatt 4140
agtcatgggc atcagaggtg aagaaggcac ttgtagttct cacagctctg gcactgaccg 4200
atatttctgc tgtagttaat gggattattt gcatgtagtc aacagtttac aggctgattt 4260
ggctctgctc cgcaactagc aggacagagg gacccacaga tccatgtcct ggaaggggat 4320
aagggaaaag gatagagaga tgggcctaaa acaaaacaga agcaacgatc tgaggataaa 4380
caaagtaatt tactaaataa gatagtggaa tgcatgataa cacactatag tacaacataa 4440
tgcaatgtaa ttagaactgg agctaataaa tcaaatataa agagagtgtc tgaaagccaa 4500
aggccttact ctaatgctgt gatgagatgg cacccacaaa agagacgagc cagatgattg 4560
aaagggatgt atggtggtct accaaggcct gttatctgtt tgccctgagc agaaatgata 4620
gcagaacagc aaacagtcct ctggggaatg tagtagttct tctcttctgg gacaggtagc 4680
tggacctaga gcattaactc tttaaccccc agtacactac atgatgttat gatgtggaat 4740
accaataacc aaacatcata aaaccatgac atagtcttat gtcgctgtgt tgtaactgga 4800
agctgaggat ctccactcag tatttctgct gaatgaagca gatctttcag ttgaaggaga 4860
ccaacttaat catccacttc caacccctta ctatggacag gttcaccgtt cactagatca 4920
agctgcccag ggccccatcc aacctagcct tgaatgcctc cagggatgag gcatccacca 4980
<210> 18
<211> 4980
<212> DNA
<213> Artificial Sequence
<220>
<223> ENSGALG00000015617_ENSGALG00000027714|chrZ:63363656-63368656
<400> 18
gaaaatctct gccactgatt gttttgcagc ttagttgtct agttattcgt gagatgttga 60
ttcaaacctt tgctcagatc aggcacagaa gcagtgctga actttgtttt tccgtagcct 120
tgctagtgtt gtaactgctg tcttagtgaa aacctgctta tttgcatccc cttcccaact 180
ttgggaaagt tgctgtctgt gattccagaa ttaggactcc ctcggttgca acatgactca 240
gattttcaga ccttggcttc agaggcacag tggtctttgg tgcagagaaa aatgaggctg 300
agaagaccag ggccatgatg agtgaggaag atgcaacaga acaagataga gaagagggaa 360
gagtttttta ggagctccac cagacatact gtagaagcag tgtagatgca cagtaccagt 420
aatgtactcc agccaaccac tcggtgaaga cccatgaaaa cctaatgagg ttcagtaagg 480
ccaagtgcag ggtgctgtac ttgggtcggg gcaatcccag gtatttatac aaactagggg 540
aagatctcct tgagagcagc cctgcagaga aggacttggg ggtcctggtg gatgagaagc 600
tggacgtgag ccagcagtgt gcacctgcag cccggaaggc caactgtgtt ctgggctgca 660
ttaaagaagg ggtgaccagc agggagaggg aggtgattgt ccccctctac tcagctcttg 720
tgaggcccca tctggagtac tgcatccagg cctggagccc ccagtacagg aaggacgtgg 780
agctcttgga gcgggtccag aggaagacca ctaagatgat cagagggctg gagcacctct 840
cctatgagga aaggttgagg gaactgtcct tgtttagctt agagaagaga aggcttcagg 900
gaaacctcag tgcagctttc cagtacttgg aaggagcaca taaacaggaa ggggaatggc 960
tgtttacgag ggtggatagt gacaggataa gggggaatgg ttttaaactg agacgggaga 1020
gttttaggtt agatattagg aggaagtttt tcacacagag ggtggtgacg cactggaaca 1080
ggttgcccaa ggaggttgtg gatgccccat ccctggaggc attcaaggcc aggctggatg 1140
tggctctggg cagcctgctc tggtggctgg caaccctcca catagcaggg gggttgaaac 1200
tgcgtgatca ttgtagtctt tttcaaccca ggccattcta tgattccatg aagactctgt 1260
aaggacccca atgccatcag ctgtccccac agcttcagta cccactgcca ccacattttt 1320
actgagatag gtagtttggt agccttcctc ccatcttgga taggggaggg ttaactgctg 1380
gcatttttgt tctttcctgc aatatgtgtt ttctgcatgc attctctttt cacccaaaat 1440
tttaatgtgg acggactttg aggatattct gcatctgccc aatatttctt acagcctcac 1500
atctactgat ttatgcacag tatcttatat ataatgtata ttatattatg tatattatgc 1560
actgaatcac atctactgtg tatgcacagt aacttctcct atggtactgt aagcccagaa 1620
atcccagata tgtcactaca acgtgtctgc tatgtattgc ttctgtgaga cacagatgtg 1680
ataatcagag gctgtacaca gtagaaatgc atacatatcc tactgtgaaa tctctgaaat 1740
ctagccttaa tcttggaaca gaaatgaata tggtgacatc ttgatctgat agaattggtt 1800
gccagtagca cagctgtaat catccatgat atgaatcaaa ccaagcacag gtaaacaggt 1860
gagagaaatc atgaacaatt acatgcaaac ggaccagcta aaatgtgttt gtttgttgtt 1920
tttttttttt caggtgattc ttgattacag taagatcaga agctgctaca ttagcagacc 1980
agccactgca ctcaaggctg tgattcacag cttgcagacc tgacagcagt tctgtggaag 2040
aggcaggtcc ctgtcaacca gtttaatcaa taaatcagtc tcgtgtacac aaataatgtt 2100
atcctgcacc actgctggtg ttacactatt tcacccaagt ttatcaccag caaactgagt 2160
cttatcgttc ctactgtgct ttgcttttct tgcttagcaa aacatatcag aaaggttttc 2220
agttaaaaaa aaaaaaaaaa aaaaaggatt atactgcagc catcaaagag ttctgttaaa 2280
gaagttgtgg ttcatattct tttcaagttc tgaagacaat ctgacaatag aggagatgag 2340
ggtttagtgg aggtaaatgg agctgtttct gaaagtaggg caccgtcgtg aggtaatctc 2400
accactagat gttgctgtaa gcatgatgag gggagaagct ggagcacaaa aggtgtaaac 2460
ccaatggttg atcatgcgca ctcggacaga ggaaatcttc aaaatgggaa agttagcttt 2520
gaactgattt ggtgggttcc cattaaaaat gggggactta ctgccttatt gtctttatgt 2580
acccatttgg gggatagatg ccatacagaa acaccagagc ttacggtgtg aattcattgc 2640
acatcttatt agatcaacaa aatggaataa aagaatacag aagattacta ctccattggg 2700
catgtggacg ttttacaggc ctggataaat tagatcttaa aaacaaacaa acaaacaaac 2760
aaaaaaactc cttgcaaaga taatgttatg taatattagt tgcaagaagt aagcaaacac 2820
acagaactgg gagcagaagc aaagcactaa gttattaaag caagttgcac attttgagtt 2880
gcattttgcc actggtttta taaacatgtt tagcatgtct ggtcagaatt tgggcaccag 2940
gatgctttta agatgtctgt ctatggaacc tgtcagtgct caagaataac ttctgttatt 3000
tggatgctgc accaaagaat tcagaggaag acgagccaag ccagacgtta tcatagtcac 3060
tagtaaagtg gttctaagcc taattaagac atgtcagaac tatgtgttgt gcaaccaaat 3120
cctccaaaag agaaatcaga ggtgaacttg tgcaataaat atagaagaca cgtaaatcct 3180
gaggcagtta gctaaccata tgaagccaat catacctgac tgctggacgc aggagactga 3240
accttacaga ccctggagaa tcactgtttg gcctagttag gcctgaatgg aatttaccaa 3300
gattcatgac tttaacatgg atcaggtgca aagaaaagaa ggctcagtta gttcctacag 3360
gctaccagat ctttttccac ctctgctcag cctggagctg tgggctctac ctgcccctga 3420
agtgaagtgg catcaactgc aacacttttt gcagaggcaa aaatcatcaa gtcgtgcctc 3480
tgcattttaa ggtgatggat tccaagagat agattccaaa cccaacactg agattcctct 3540
ggtgatgcag atgactgctt actgggatcc ttctctctct atagcctaat cccatgcagc 3600
accaaaagtt gggcacctga atactatcta tcttcctcca tctgacctct gctgctggct 3660
catcacgcat ggctcctgag cctgacagag ccatggggaa agacatggcc tgaccttttc 3720
agacagcacg acttcctcca gtgtgctgca ctaacgacaa tattaaaaat aacactgcag 3780
gaaaacatgc tgttttctag caggctggag gaaaaaaaag gtgttcaagg tgagactcta 3840
taagatcact ctttccaaac acagcagtta actcttttct cacttgaagc tgaaattcat 3900
cttcagtagg tgacggttac aagcagctct ccaccggtaa gtgaaagttt gctgggtttt 3960
tttcaggcac ttcaagacac gaaggtaatt gctgcaacac cttcctagct cttcctgagt 4020
actcagccca aagctacact cttcagggct actctcctag cacggctctc tgtaattagc 4080
ctggctttct aacttatgaa ttaacgctgc agctactcaa cagggcagct ttgcagctat 4140
gaactttatg catacacttt ttattctggg tggtacaaat tcattgctaa gaaatcttat 4200
aaactctatg gaacactttt aaaagcctac atgtgattaa aaacaaaaaa acaaaaaaca 4260
ctgatatcac atgctatatt ctctagaaaa gagtattttg gaaacaattg taattcacag 4320
ctcaggagaa agagcaattg ttttcctttg tgctggagct ggaattctat gcagtataaa 4380
tacagatgtc caaacaaact cattaaatgg tagtcatagc aaatggagga aaaaaaaagg 4440
gggggggggg gggaactgaa gacactgaag aaattctgct gaaattcatg gagctgcaac 4500
aagaattgat attgattact tcaccatatt ccgctctaat taactagcac aacactgact 4560
gttgtgaaaa caagcatgtg atttgaccca ataagtgttt cttttagtaa ccaaaaccaa 4620
acaacaacaa accttctggc tgaccagatg gaggataaat tctaacctga tcattctgac 4680
acaaatgagg aattatgtag gttggaactg cattccaaag caaagcatgt ttttggctta 4740
gttgaacaca cagaattcat ttttcttgct gattcttgta actaagggca ggtatgaatt 4800
ggttccctta aaagaagtcc ccagaagcca tggtcctcaa caagtcttct cagattagca 4860
aggatgaacg actgagaaat caaaacccaa attcagatct aagagccttc aacagatttg 4920
ctaaatgaaa ctagcaaata ctgtagaagt taacttgatt ttgaaataaa acaggatttc 4980
<210> 19
<211> 4980
<212> DNA
<213> Artificial Sequence
<220>
<223> ENSGALG00000008188_ENSGALG00000008197|chrZ:78777477-78782477
<400> 19
aaaggagttt cttgcctgaa accccttaag attttgtgta ttgttgttgc cctggtttca 60
gctgggacag gactgatatc cttcacagta tctggtatga tgctgtgttt tggttttagg 120
agaaaaccag tgctgatggc acaccgaggt tgtagttgcg actgagcagt gctgcacaga 180
gccaaggatg tttcagctgc ccacactggc cttcctctaa gggggtgtga gggcacatgg 240
agctggaggg aaccaaaggg gtattccaca ccatatgtca ctgagcaaag acattgctgc 300
ccaggcagag aatacagtgg tagaaatacg tcacataggt gcccatctac cccagaactg 360
ggccagcgaa gaacatcaga acaacaagca tgcgaatcag gctgctcaga ttgatgtggc 420
tcaggtagat ctcaactgtc aactgtcacc cataaaatgg atgagacagg agcaaggcct 480
gcctgtccaa actgaccttg gggccccggg cacagctgct cccgagcaag gagaggcaga 540
gaattgtgga ggaaaccctc ttccacctag ctccaagggt gcacgctcaa tgcttggatg 600
aagattcaag ttctcaatga agaactgcat tcaaagacat ctttggaggt gacccagact 660
gcctctggga tgaatccaga acaaacagaa tcttcccagc aacacctttg tttatcatac 720
acgttcagaa atgcagtgcc tgcctggtat ttttttaaac tcatcacaga ggaatctctg 780
agtggagcag aggagtgttt cctcttgctt ttttcttccc cctttctgta agaaatgcat 840
atgccagttt ccccctaaat gttttcaaac tccaaattgt ttcctgctgg tgacattctc 900
ctctccagca ctgcctacac cccagctgcg tctgatagga aaagcaccca gtaccatgct 960
ggcatggcat ggtcagtgac acccactggt tagcatgggg acaaactgcc agagcagagg 1020
gctgctgaaa cgccgagtgc caactgacac tgttcagctg acagcctcac gagagtgctg 1080
cgagggttaa gtgaggcaac aaaatacaag tactcaaaaa tagaatggaa tggaatggaa 1140
taacagaggg aatggggaac aggctgcagt gagaaggaaa cccccgtgca ccgaccaacc 1200
cgctcccagt agcctggtcc ctaccttgcc ccactccagc agctccacga ggtactcgaa 1260
gtgcccatgt ccggccatcc ccagcatggc acagctgtca cctgggagca gcgggggtcc 1320
ggcaggcatc gccggcaccc acagcctggg ctgggctgag gatgggcttg gtgggcagct 1380
gggtgctgcc gtggcagctg agtgccgtcg tgcaggtggg ctcggtgctc tctgcagccc 1440
acggctcggg acccgtggtg ggcatactgc tgggcaaggg gacggctcgg atgtgcatcc 1500
cagagcaggg tgcatgatgt gtgcgcagcg gcacacagca gcgcacttgt ccccgaggca 1560
ccacccggtc tgatgaaatt ccaggttttg tttaagatga aaatgcatgt gggcatacat 1620
ttgcacatga gaacacctgc taatgaaaca cacagagttg tatgtgcagt ctccctggct 1680
ggtggcatgt ctgtgggggc agttaggcag gaagaaaagc tccaccatct gtttctgtgt 1740
cccgggcttg gtgctgccac tagagatggg atgcacacag catgcctgcg tgctgccgag 1800
gcagctcagt acctgctgct gggggagagc agccctcagg gagctgctgc aaagaccccg 1860
tgggatggct ggtgaacagt gctggagaca tggcagatgt cgcacccctg ctccacacca 1920
ccctccgctg cagctgcctg cacgatgcca tttcagcgtg ccacggcttg tttcttcctc 1980
ttgcagtctc aggttgccgc agcagcagct gcctgaggtc tggtggcaaa gggcagagca 2040
cccagcccac tgctctccat gagtgagcgg gtagggggca cgccgtgctt cgcttctggt 2100
atcgggtggc ctgtggagca catcacccct ggacagtgaa aacatgtcaa agggtgtttt 2160
ataacagtat agcatatccc tttgaggctg aatttcctga gcttatggat atggtagtaa 2220
tgctatacca ggctctctct gcaggttgct cactgaaaca atataccctt tctttctcaa 2280
gaaatgggac tcatgaatag ctaccaggcc tttctgctac tagatactgt agaattacat 2340
atatcagatg gctcattaat cacatagctt gttattggga cagaggcagg ttttcagcat 2400
ttcccacact gcttttctgc aaatggatta ggagtaaaga gtcagataca caggggacca 2460
tcactcactt cctaggccat gcttcgtagt ttaactccat gcaaggtatt ttcttgctct 2520
gatctaactc tagatcacta aatggcactt gtgcaggaca cttttccact gtcattttgg 2580
ggggtagaag tgtggtcaga gccagggagg cttgcagggc ccacaccagc tgtggcccaa 2640
gcagctgctg tacaatggct gtatggcagt atcgatgtga acttcctgat aataaacaga 2700
actcagcagc aaataaaccc agattgttct gatcagtaac gagaggctgt gcaaaaagct 2760
gagaaatgta cagcccttcc tgctcaccac tacagccctt catgcagcgg cctgctgcac 2820
tagggcctgc ttggccagag gcagggctgc agcttgagat acgcagcacc cagtacccca 2880
gcaggctgcc atgtgcttct gtcaggccat gaattgcaca agttggtata gttttataca 2940
gtgtcatgca gaagcacaac tcttaccttg gcacactgat atggaaagca aagtgtaaag 3000
gaactgtatg tttcttggct tgtgagttcc attggttctc ccaggacagc agtgacagct 3060
ctagattttc tggttgatct cttccatcta agtttttact tctgaataca tctgtgcagc 3120
aaagcctgat gctttttttt ttccccctcc cctgggatcg tgaaatatta ttttcccatc 3180
tccataatac agatgatcca ctcaaacatg catcctcagt cgcagtcctc agaagggcct 3240
tttcccacca tacacctaca cgctacacca gactttattg gtcaccatgc cttgagggat 3300
tctgcctaac acaggcacac aggaagggct gataccagta attcattgct gaggagagaa 3360
ggggcacttc ttttatagta gagccacaga atcaccagga ttggaaaaca cctccaagat 3420
catccaatcc aaccacccac ctaccaccag tatttcccac taaaccatgc cccttggtac 3480
cacatctaaa agcatcttct gcaccttcac agcttcattg cctttctcag gacgtgctcc 3540
agggccttgg tgtctttctt gtattgagtg gcccaaaatt gaacacaata ctcgaggtgc 3600
agcttcacca aagctgagtg cagaggggtg atcacctcta ctaggccttg ttttacccct 3660
tccccctgca tacctagttt aaagcccttt cagcgagccc taccagctcc tgggctagga 3720
tccatttccc cctttaagag aggtgaaacc cacccgcagg catcaggcca ggcactgagt 3780
taaactgctc catcagctaa ccaccccaat gccctgatgt cccttctgat agtcctcagg 3840
cttctctcag cgacttcatc actgccagcc tgagctatcc gtaatggata acaaccagag 3900
ggctgaacca gactagggag tctcctggta atgtccctaa gtaatgaatt catgggggaa 3960
atggatctgt gcagatgcac tgccatctca cagggctcaa ctgtcacaga cagttgtcac 4020
aaaccagagc agcagagaga gcagcaaagg agatatcata aatagtggaa aagggtgcca 4080
gtgtttgtta ttgactgctt cactgtgtgt ttggaaatca caaagaaaac aacaaaaaaa 4140
ccccacagaa tacacatttc caagcatgca tgcttcaggt aaggactgcg gcccgcttta 4200
attcccctgg aagcgtccag aggcctacac acaaatcagg ccacaacaaa caggttccgt 4260
gcaagcagtt tgtgagttgt atgaaaatag ctttcttcca taaagcgtgg cattgatggg 4320
aactgttact agcagatgaa aatctgccat gcacgacacc cttaatggtt ggagtggttc 4380
gactgagttt tgcattcctc attctgatgg atgctggcaa aaccaagatc acccaacacg 4440
taacactgaa tatagctcac caacagcaac gagccacacc agatactgag gcatctccaa 4500
ggctacgtct ggtggaaaga agagacagtc tcaccctgca gtgcaaaagc atcagggctt 4560
ctgcgtaagg tttattgatc ccaaagatag gcaagttaat attcatcagt ttaatagaca 4620
ggtactcaca ttactggaga tggcatgcca ggagagcctc tgccaagtgc tcactgccag 4680
tggcagccgg ccagtgcaca gcttcttggt gctgtggcca tctatataac agaaggaagc 4740
aattaagcat cacctatcaa gataagcaag atcattcaaa gagaataagg gtacttggtt 4800
agagctgcag agcacttcct cacgaatgag tttcttccag ctacatgcag atgttacagg 4860
cagtttgctt gtgttctagg gataacacaa acccctcctc atgggctagc tgcctgctca 4920
ggctgtggtc tgtatttttg cacgtgcact gctagccttt acttcacatt tccctttact 4980
<210> 20
<211> 681
<212> DNA
<213> Artificial Sequence
<220>
<223> pDsRed1
<400> 20
atggtgcgct cctccaagaa cgtcatcaag gagttcatgc gcttcaaggt gcgcatggag 60
ggcaccgtga acggccacga gttcgagatc gagggcgagg gcgagggccg cccctacgag 120
ggccacaaca ccgtgaagct gaaggtgacc aagggcggcc ccctgccctt cgcctgggac 180
atcctgtccc cccagttcca gtacggctcc aaggtgtacg tgaagcaccc cgccgacatc 240
cccgactaca agaagctgtc cttccccgag ggcttcaagt gggagcgcgt gatgaacttc 300
gaggacggcg gcgtggtgac cgtgacccag gactcctccc tgcaggacgg ctgcttcatc 360
tacaaggtga agttcatcgg cgtgaacttc ccctccgacg gccccgtaat gcagaagaag 420
accatgggct gggaggcctc caccgagcgc ctgtaccccc gcgacggcgt gctgaagggc 480
gagatccaca aggccctgaa gctgaaggac ggcggccact acctggtgga gttcaagtcc 540
atctacatgg ccaagaagcc cgtgcagctg cccggctact actacgtgga ctccaagctg 600
gacatcacct cccacaacga ggactacacc atcgtggagc agtacgagcg caccgagggc 660
cgccaccacc tgttcctgta g 681
<210> 21
<211> 226
<212> PRT
<213> Artificial Sequence
<220>
<223> pDsRed1
<400> 21
Met Val Arg Ser Ser Lys Asn Val Ile Lys Glu Phe Met Arg Phe Lys
1 5 10 15
Val Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu Ile Glu Gly
20 25 30
Glu Gly Glu Gly Arg Pro Tyr Glu Gly His Asn Thr Val Lys Leu Lys
35 40 45
Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro
50 55 60
Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile
65 70 75 80
Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg
85 90 95
Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser
100 105 110
Ser Leu Gln Asp Gly Cys Phe Ile Tyr Lys Val Lys Phe Ile Gly Val
115 120 125
Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp
130 135 140
Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly
145 150 155 160
Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val
165 170 175
Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly
180 185 190
Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu Asp
195 200 205
Tyr Thr Ile Val Glu Gln Tyr Glu Arg Thr Glu Gly Arg His His Leu
210 215 220
Phe Leu
225
<210> 22
<211> 876
<212> DNA
<213> Discosoma sp
<220>
<221> misc_feature
<222> (1)..(876)
<223> red fluorescent protein (FP593)
GenBank: AF272711.1
<400> 22
agtttcagcc agtgacaggg tgagctgcca ggtattctaa caagatgagt tgttccaaga 60
atgtgatcaa ggagttcatg aggttcaagg ttcgtatgga aggaacggtc aatgggcacg 120
agtttgaaat aaaaggcgaa ggtgaaggga ggccttacga aggtcactgt tccgtaaagc 180
ttatggtaac caagggtgga cctttgccat ttgcttttga tattttgtca ccacaatttc 240
agtatggaag caaggtatat gtcaaacacc ctgccgacat accagactat aaaaagctgt 300
catttcctga gggatttaaa tgggaaaggg tcatgaactt tgaagacggt ggcgtggtta 360
ctgtatccca agattccagt ttgaaagacg gctgtttcat ctacgaggtc aagttcattg 420
gggtgaactt tccttctgat ggacctgtta tgcagaggag gacacggggc tgggaagcca 480
gctctgagcg tttgtatcct cgtgatgggg tgctgaaagg agacatccat atggctctga 540
ggctggaagg aggcggccat tacctcgttg aattcaaaag tatttacatg gtaaagaagc 600
cttcagtgca gttgccaggc tactattatg ttgactccaa actggatatg acgagccaca 660
acgaagatta cacagtcgtt gagcagtatg aaaaaaccca gggacgccac catccgttca 720
ttaagcctct gcagtgaact cggctcagtc atggattagc ggtaatggcc acaaaaggca 780
cgatgatcgt tttttaggaa tgcagccaaa aattgaaggt tatgacagta gaaatacaag 840
caacaggctt tgcttattaa acatgtaatt gaaaac 876
<210> 23
<211> 230
<212> PRT
<213> Discosoma sp
<220>
<221> MISC_FEATURE
<222> (1)..(230)
<223> red fluorescent protein D. GenBank: AAG16224.1
<400> 23
Met Ser Cys Ser Lys Asn Val Ile Lys Glu Phe Met Arg Phe Lys Val
1 5 10 15
Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu Ile Lys Gly Glu
20 25 30
Gly Glu Gly Arg Pro Tyr Glu Gly His Cys Ser Val Lys Leu Met Val
35 40 45
Thr Lys Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ser Pro Gln
50 55 60
Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile Pro
65 70 75 80
Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg Val
85 90 95
Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Ser Gln Asp Ser Ser
100 105 110
Leu Lys Asp Gly Cys Phe Ile Tyr Glu Val Lys Phe Ile Gly Val Asn
115 120 125
Phe Pro Ser Asp Gly Pro Val Met Gln Arg Arg Thr Arg Gly Trp Glu
130 135 140
Ala Ser Ser Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly Asp
145 150 155 160
Ile His Met Ala Leu Arg Leu Glu Gly Gly Gly His Tyr Leu Val Glu
165 170 175
Phe Lys Ser Ile Tyr Met Val Lys Lys Pro Ser Val Gln Leu Pro Gly
180 185 190
Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Met Thr Ser His Asn Glu Asp
195 200 205
Tyr Thr Val Val Glu Gln Tyr Glu Lys Thr Gln Gly Arg His His Pro
210 215 220
Phe Ile Lys Pro Leu Gln
225 230
<210> 24
<211> 4107
<212> DNA
<213> Streptococcus pyogenes
<220>
<221> misc_feature
<222> (1)..(4107)
<223> M1 GAS
Cas9 protein id: AAK33936.1
<400> 24
atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60
atcactgatg aatataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120
cacagtatca aaaaaaatct tataggggct cttttatttg acagtggaga gacagcggaa 180
gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240
tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300
cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360
aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420
aaattggtag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480
atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540
gtggacaaac tatttatcca gttggtacaa acctacaatc aattatttga agaaaaccct 600
attaacgcaa gtggagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660
cgattagaaa atctcattgc tcagctcccc ggtgagaaga aaaatggctt atttgggaat 720
ctcattgctt tgtcattggg tttgacccct aattttaaat caaattttga tttggcagaa 780
gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840
caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900
ttactttcag atatcctaag agtaaatact gaaataacta aggctcccct atcagcttca 960
atgattaaac gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020
caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080
ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140
gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200
aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260
gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320
gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380
cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440
gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500
aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560
tataacgaat tgacaaaggt caaatatgtt actgaaggaa tgcgaaaacc agcatttctt 1620
tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680
gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740
tcaggagttg aagatagatt taatgcttca ttaggtacct accatgattt gctaaaaatt 1800
attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860
ttaacattga ccttatttga agatagggag atgattgagg aaagacttaa aacatatgct 1920
cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980
cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040
gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100
agtttgacat ttaaagaaga cattcaaaaa gcacaagtgt ctggacaagg cgatagttta 2160
catgaacata ttgcaaattt agctggtagc cctgctatta aaaaaggtat tttacagact 2220
gtaaaagttg ttgatgaatt ggtcaaagta atggggcggc ataagccaga aaatatcgtt 2280
attgaaatgg cacgtgaaaa tcagacaact caaaagggcc agaaaaattc gcgagagcgt 2340
atgaaacgaa tcgaagaagg tatcaaagaa ttaggaagtc agattcttaa agagcatcct 2400
gttgaaaata ctcaattgca aaatgaaaag ctctatctct attatctcca aaatggaaga 2460
gacatgtatg tggaccaaga attagatatt aatcgtttaa gtgattatga tgtcgatcac 2520
attgttccac aaagtttcct taaagacgat tcaatagaca ataaggtctt aacgcgttct 2580
gataaaaatc gtggtaaatc ggataacgtt ccaagtgaag aagtagtcaa aaagatgaaa 2640
aactattgga gacaacttct aaacgccaag ttaatcactc aacgtaagtt tgataattta 2700
acgaaagctg aacgtggagg tttgagtgaa cttgataaag ctggttttat caaacgccaa 2760
ttggttgaaa ctcgccaaat cactaagcat gtggcacaaa ttttggatag tcgcatgaat 2820
actaaatacg atgaaaatga taaacttatt cgagaggtta aagtgattac cttaaaatct 2880
aaattagttt ctgacttccg aaaagatttc caattctata aagtacgtga gattaacaat 2940
taccatcatg cccatgatgc gtatctaaat gccgtcgttg gaactgcttt gattaagaaa 3000
tatccaaaac ttgaatcgga gtttgtctat ggtgattata aagtttatga tgttcgtaaa 3060
atgattgcta agtctgagca agaaataggc aaagcaaccg caaaatattt cttttactct 3120
aatatcatga acttcttcaa aacagaaatt acacttgcaa atggagagat tcgcaaacgc 3180
cctctaatcg aaactaatgg ggaaactgga gaaattgtct gggataaagg gcgagatttt 3240
gccacagtgc gcaaagtatt gtccatgccc caagtcaata ttgtcaagaa aacagaagta 3300
cagacaggcg gattctccaa ggagtcaatt ttaccaaaaa gaaattcgga caagcttatt 3360
gctcgtaaaa aagactggga tccaaaaaaa tatggtggtt ttgatagtcc aacggtagct 3420
tattcagtcc tagtggttgc taaggtggaa aaagggaaat cgaagaagtt aaaatccgtt 3480
aaagagttac tagggatcac aattatggaa agaagttcct ttgaaaaaaa tccgattgac 3540
tttttagaag ctaaaggata taaggaagtt aaaaaagact taatcattaa actacctaaa 3600
tatagtcttt ttgagttaga aaacggtcgt aaacggatgc tggctagtgc cggagaatta 3660
caaaaaggaa atgagctggc tctgccaagc aaatatgtga attttttata tttagctagt 3720
cattatgaaa agttgaaggg tagtccagaa gataacgaac aaaaacaatt gtttgtggag 3780
cagcataagc attatttaga tgagattatt gagcaaatca gtgaattttc taagcgtgtt 3840
attttagcag atgccaattt agataaagtt cttagtgcat ataacaaaca tagagacaaa 3900
ccaatacgtg aacaagcaga aaatattatt catttattta cgttgacgaa tcttggagct 3960
cccgctgctt ttaaatattt tgatacaaca attgatcgta aacgatatac gtctacaaaa 4020
gaagttttag atgccactct tatccatcaa tccatcactg gtctttatga aacacgcatt 4080
gatttgagtc agctaggagg tgactga 4107
<210> 25
<211> 1368
<212> PRT
<213> Streptococcus pyogenes
<220>
<221> MISC_FEATURE
<222> (1)..(1368)
<223> M1 GAS
Cas9 protein id: AAK33936.1
<400> 25
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 26
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA7 for Z chromosome locus chrZ_42174515_-1
<400> 26
gtaatacaga gctaaaccag 20
<210> 27
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA8 for Z chromosome locus chrZ_9157091_1
<400> 27
acagacctat gatatgtgag 20
<210> 28
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA9 for Z chromosome locus chrZ_27767602_-1
<400> 28
gagcttgtga gtgataatcg 20
<210> 29
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA10 for Z chromosome locus chrZ_78779927_1
<400> 29
gtaaagagtc agatacacag 20
<210> 30
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA11 for Z chromosome locus chrZ_63364946_-1
<400> 30
cagtgggtac tgaagctgtg 20
<210> 31
<211> 1012
<212> DNA
<213> Artificial Sequence
<220>
<223> Left arm for gRNA7 integration to Chromosome Z
ZNF367_HABP4_ENSGALG00000012629_ENSGALG00000012628_chrZ_42174515_
-1
<400> 31
gtgaacggat aggcagcaag cattcagaac aatgaaaaag atctgcgttc tattgtaaag 60
caaacaaagg tgatgacgga acgtttattt gagatacagg caccatagta caagatatca 120
aagaggaatt aattcaaccc tcccaacaac agttgggaaa aaaaaaggat aagctgagga 180
atgcagcctt ctccgatttt tactctggtg ccggaaggag gaggaggagc gggggaaaac 240
ccagcggact cagactgcat acgcactctc ggaagtacct ctgaggcggg gtgagaggaa 300
gggtggatct aggctccccc cgctccacac actcacgtgc tcgtgtactg gttcaggctg 360
tgacttggca actcctctac atctatccat ctagttagac tcaacaagac catcgtgatt 420
caggagtctg aagatgctta actctctcag aacgtctagt tctcctggcc tggtaaatgc 480
tatgtttctc atactgcctc tctgaagaat gcttcgaatg cttctagtga tgctctaaag 540
ttctaaacag aaaaatctgg agacagttct ggtctttaga tagaaaaaat gccaacatgc 600
caaaggatgg ttacatcctt caagcaacct tgttgcatgc tgtacaatag actcatgtaa 660
taacttagcc gtagtcatcg tatctcttat ttacctgttc gttattacat tttcctggta 720
ctgctttata tttagtcagt tgtcctttta agacaaattt tttggtgtgt gctaataggc 780
agttaccaaa tgttctagag ggagggaata taatcagtga gtatgtagat gtatatagat 840
gtataaccag taagtataca gagaagttag ggtggtcttt tgagagcata tagctggaaa 900
gattatcaca tgggaaaagg taatcagaaa taaatggaaa aatgctcacc agtgtcatag 960
gctcacaaga aaactcccca aggagcaatc tccagtaaca gacccttcct ca 1012
<210> 32
<211> 1023
<212> DNA
<213> Artificial Sequence
<220>
<223> Right arm for gRNA7 integration to Chromosome Z
ZNF367_HABP4_ENSGALG00000012629_ENSGALG00000012628_chrZ_42174515_
-1
<400> 32
gtcatgtcgg tggaggagaa agtggctgta gaaaaggtaa cggacaagaa atccctcact 60
ggcttagctg taaaggtcag aggaaaatca tcttctgttc tccatacaca tctcctgtaa 120
ttaggcacct gtgcccttta aaaaagtaaa gtaatcaaag agtcatttgg tgaaaataga 180
agccaaacag ttacaaaatt tagttaatat tcaaagacaa aacaactctg gttccaaata 240
taaaaccctt tgtgtaaaca ctgcgggaag gtgccaaaga gccacctaca caaagagatg 300
ccacagagta atttgcgtac cccaacaata ggatcatata tgggcaaacc aaaagaccaa 360
caaagacccc ttgcaataat cccttgattg gcagaagcaa gtgcagcgtt agatttagta 420
tgtgtgacaa ttctgagaat aggaaggaat ttcactgaaa ctgtgtgaag atttgtatgt 480
taaatacata taatgagggt tatttagctc tggggtgtgc atgctatgtg gagagatccc 540
catgtgccca gcactgcaat agactaatgt cagcttttta aaccatcatt tggtttgaag 600
agtttattat gattttcaga aacagaatta tgtattcagt gtctgtacat tcttacaagc 660
ctgctgttct gtacacatga aaaagctact tatggtgcaa atcagtatag agaagcagtt 720
ttgacataca gtggtcatga ctgggtgatc tgctgtcaga aggtaagaca ctggtataca 780
gaattgcaaa cgtgagatga agacctcaag tgcaactctg tcatcatacc acttctcttg 840
ctattatcta ttcagtgttt gttctaaata ttcaggcaga aggcttggtt tcacatcagg 900
tgttacattt aagtattctt tgcccatttt ttgctgtttg tatgtgtaac ttcagattct 960
cacattgact gtgtagtgta aatttgcaaa tagatgtaac agcttctctt taacatccca 1020
tgc 1023
<210> 33
<211> 1014
<212> DNA
<213> Artificial Sequence
<220>
<223> Left arm for gRNA8 integration to Chromosome Z
ENSGALG00000025945_AVD_ENSGALG00000025945_ENSGALG00000023622_chrZ
_9157091_1
<400> 33
ctctgcatgg tcacaacggc cccaacagcc tcccatcccg atgtcaccaa tcagttcact 60
attactggtg agcaaccagt ccagcactgc atccccctgg tggggctgtc tgttacgtgg 120
ctcaggaagt tatcctcagt gcattccagg tgctcctgga tcgcctgtag ctcaccgtgc 180
tacttttcca gcaggtgtca gggtggtaga agtcccccag caggacgaga gcctgcgatt 240
gtgacagctt ctgtagctgg agggagaatg cttcatcaac aggctccgct tgatcagtgt 300
ccctgtactg ataccacaag gcttcttttg ctgctcccat cttaactctc accccatcgt 360
ggtgttatac gtgcataaca tcatgcagtg cactaagagt taaagagtta atgctccagt 420
tccgtcgatt gtcaataatt ccaggtgtac ctttctcaga agagaagaac tacaaatccc 480
ttaagatctt actgttccat tttcattctc cattcagaag gaaaggtaaa actgcagtgt 540
gtgctcccta gcattagagt aatttctccc ttagctcgtt gccaccattt tgtttttagg 600
cccacctcct taccttttcc ctacacccct cctgtgtctc tgagacgtgg gtccatgggt 660
ccctcaacca tagtagacac aaactcagat caaaccaagc cagagctttg acaaccccta 720
agctttcagc ttactcaggg ttgctctgca gggactgctc ttcacactct attccttcct 780
tgatatagag ggcaatgtct cctctcctcc ttccttacct gtccctcctc atctgcctgt 840
tgctgtcagt ggccacactt cagccatggg aatcatccca ccctgctttt gtgaaggaaa 900
ctacattatg gttctcaggt agcacagtgg cttccatcac ctcctgtttg cttcccaagc 960
tgtgtgtgtt ggtgtagagg cacttcagct gggcagctga agaactggac gcac 1014
<210> 34
<211> 1032
<212> DNA
<213> Artificial Sequence
<220>
<223> Right arm for gRNA8 integration to Chromosome Z
ENSGALG00000025945_AVD_ENSGALG00000025945_ENSGALG00000023622_chrZ
_9157091_1
<400> 34
cacctttcca cctcctgcta aagcacattc cctacagtat gtttcacatg acaccgtgct 60
ggcagatttt taatatcatc agagaatgac actccatatc ctctctgggc agcctttttc 120
agtgctctgt cacccacaaa gtaaagtatt tgctcatgtt ctaatggaac ttcctatgtt 180
ctagtttgtg accattgaac cttgttctgt cactggacag tgctgaagga gcctggccct 240
atccacttga ctcccacact ttacatattt acaagcatcg ataagacccc cctcagtctt 300
ctccagacta gatagcccca ggtctcccaa ccattccttt tatgggagat gcttcaggcc 360
cctcatcacc tctgtggccc tctgctggac tgcctgcagt agttccaggt tttttttttt 420
gaactgggga gcccagaact tgacacggta ttccagatgt ggcctcacca gcgcagagga 480
gaggggaagg ctcacctccc tcgacctggt ggccatgttt tttttaacag acctcaggat 540
accactggcc ttcttggccc aagggcacac tgctggctca tggcccatgg gttggcttcc 600
aggactctca ggtccttctc cgtagagctc ctctcaagca ggacaaccct cagcctgtac 660
tgatgtgtgc ggtgcggtta ttcctcccca cgtgcaagac tctacatctg ccattgttaa 720
atctcataag cttcctctct gcccaactct ccactgtgta cgggccttag tgaatggcag 780
cacagacttc tggtgtgagg atagcattca gaacaagctg ctgtaccttc ccagtcacag 840
aggtgagggt gactggcttg tactttccca gctttgcctt cttgcccttt tggaagactg 900
gagcgacatt ggccttctgg aggaaacggt cctcaggcac ccctcctgtt ctccatgacc 960
tttgaaagat gatcgagagc accttggcag tcacttctgc cagctccttc agcacgcatg 1020
agtgcatccc gc 1032
<210> 35
<211> 1025
<212> DNA
<213> Artificial Sequence
<220>
<223> Left arm for gRNA9 integration to Chromosome Z
RIC1_ERMP1_ENSGALG00000015036_ENSGALG00000000438_chrZ_27767602_-1
<400> 35
gcagtacgta cgtttgtgaa cagctgtttt caagggtgat gcacaggaag agtaaaattt 60
cattaaaaaa tctccaagga gcacatggag agctcactca gaagcctcac cgctgccact 120
gaacaagact gatgcattag tttcatgaaa tcaaggctat gtgtcccact ggtttcatta 180
ttttgttact ctttctttaa aacaaaaaaa ttgttttatt gcttatatac atcaactatg 240
ttgttatata ttttccaaag gccgctccaa aagtaatgcc tcctgtttca ttctgttggc 300
ccaccgtgtc agaggcagat ggtggtacgg cagtagagat ggaaccttcc caccaatatt 360
ccattacatg ttgccatgtg atagacagca gcagatgggc actctgacag aatggtatct 420
gacatggaag cgtggatgga gcaaagttgt gtcactgaat tcctccataa ggaaatgagc 480
acccactaac attcactgat gcttgctgaa catttctgga gaccaaacag tggatgtgag 540
cacagtgagg tggtgggtgg tgcatttcag cagtggtgac aatgacgttg ggtcacctct 600
gctggtgcag gttttgatga gtgcagcctg tgaggtcttg ttcatcaatg gagaaaatgc 660
acaactaatg gtggtgactg ctgaaaaata gtgttttgta gctgagaatt ttctctgtca 720
aacagtgcta attgtgctct ttgtatctgt tgtagtttcc atgggaataa ataggaggca 780
ttacttgcag actgacctac atatatgtgg ccccaggcaa gtcaacagct gtacgaaaag 840
tccatgcttc ctcattataa acggaggaaa aaaagttgtt tacagctgta atgggattat 900
aaaaggcaaa tggggatagt acagtggtga gaaccagatc tatgaaggaa aagccctaag 960
aaaaagagag tgcacagata ctcttaacca tctaataact gtttcctcca tcctacagct 1020
cagag 1025
<210> 36
<211> 1040
<212> DNA
<213> Artificial Sequence
<220>
<223> Right arm for gRNA9 integration to Chromosome Z
RIC1_ERMP1_ENSGALG00000015036_ENSGALG00000000438_chrZ_27767602_-1
<400> 36
tggcttccaa ttcctcctgt ttatcaccca cgttgcatcc attgatgtag aggcacttca 60
gtcgggctat cagcaatgtt accacctgtg aggagccctc ttgagatctt ttaggacaat 120
ttagaggttt tccccactgt ttcctaaaat tacagcattc cctgtccctt cttagtgata 180
tagaactcca tccccttcca ccatcaaacc tagcttaagc tctggtaaat gatccagcca 240
gtctgcttcc caaaactctt gctcagttgc attctatctg atgcctacat gcccaacacc 300
ttcaaggcct gtccaagatc atagaacaca aaggcttgat catgacaaca tccatgcagc 360
caatcattca catgacccat tcctctcctc ctttccaggt cccaacggcc aactgagagt 420
tgtgctctga gctcttcagt gtccttccga gggatgtaaa gtccctttta atgttctgca 480
ttttctttgt cacagccttc tgagacccaa cttgaatgtg gaggagtgga gagtaatcat 540
cccgctctga ttatcagata cattagcctc ttcttggcac ctctggcaga cagaagactt 600
ccctggagag attacctgga tgataactgg gggcctcagt gcctcacagc agcaagtccc 660
cagttactaa gactctacac ctctttggtg gcgctagttc tgatgtagtt cttcagttgc 720
ttaacatgct tgttgtttcc caagatttga ctgctatctg caccctccct ttcttccagc 780
cccagagcct tatatcatga gctgagaaca ttctgtgttc aaaatacaag acacatttat 840
gcaatttcgt attctctacc catatttttg tgatagaaat tagggctact tatttcccat 900
agtgatttcc atgctgccta ccaggttcta agtcaggtca ccctgccagc ttcttccaaa 960
ccatgctcag gagtgcatca aatcacacgc agacccaagg aaaaaatgta ccaaacaata 1020
ttaccacgca tgcaaactcc 1040
<210> 37
<211> 1024
<212> DNA
<213> Artificial Sequence
<220>
<223> Left arm for gRNA10 integration to Chromosome Z
TRIM36_PGGT1B_ENSGALG00000008188_ENSGALG00000008197_chrZ_78779927
_1Chromosome Z
<400> 37
ctaccttgcc ccactccagc agctccacga ggtactcgaa gtgcccatgt ccggccatcc 60
ccagcatggc acagctgtca cctgggagca gcgggggtcc ggcaggcatc gccggcaccc 120
acagcctggg ctgggctgag gatgggcttg gtgggcagct gggtgctgcc gtggcagctg 180
agtgccgtcg tgcaggtggg ctcggtgctc tctgcagccc acggctcggg acccgtggtg 240
ggcatactgc tgggcaaggg gacggctcgg atgtgcatcc cagagcaggg tgcatgatgt 300
gtgcgcagcg gcacacagca gcgcacttgt ccccgaggca ccacccggtc tgatgaaatt 360
ccaggttttg tttaagatga aaatgcatgt gggcatacat ttgcacatga gaacacctgc 420
taatgaaaca cacagagttg tatgtgcagt ctccctggct ggtggcatgt ctgtgggggc 480
agttaggcag gaagaaaagc tccaccatct gtttctgtgt cccgggcttg gtgctgccac 540
tagagatggg atgcacacag catgcctgcg tgctgccgag gcagctcagt acctgctgct 600
gggggagagc agccctcagg gagctgctgc aaagaccccg tgggatggct ggtgaacagt 660
gctggagaca tggcagatgt cgcacccctg ctccacacca ccctccgctg cagctgcctg 720
cacgatgcca tttcagcgtg ccacggcttg tttcttcctc ttgcagtctc aggttgccgc 780
agcagcagct gcctgaggtc tggtggcaaa gggcagagca cccagcccac tgctctccat 840
gagtgagcgg gtagggggca cgccgtgctt cgcttctggt atcgggtggc ctgtggagca 900
catcacccct ggacagtgaa aacatgtcaa agggtgtttt ataacagtat agcatatccc 960
tttgaggctg aatttcctga gcttatggat atggtagtaa tgctatacca ggctctctct 1020
gcag 1024
<210> 38
<211> 1022
<212> DNA
<213> Artificial Sequence
<220>
<223> Right arm for gRNA10 integration to Chromosome Z
TRIM36_PGGT1B_ENSGALG00000008188_ENSGALG00000008197_chrZ_78779927
_1Chromosome Z
<400> 38
cagctgctgt acaatggctg tatggcagta tcgatgtgaa cttcctgata ataaacagaa 60
ctcagcagca aataaaccca gattgttctg atcagtaacg agaggctgtg caaaaagctg 120
agaaatgtac agcccttcct gctcaccact acagcccttc atgcagcggc ctgctgcact 180
agggcctgct tggccagagg cagggctgca gcttgagata cgcagcaccc agtaccccag 240
caggctgcca tgtgcttctg tcaggccatg aattgcacaa gttggtatag ttttatacag 300
tgtcatgcag aagcacaact cttaccttgg cacactgata tggaaagcaa agtgtaaagg 360
aactgtatgt ttcttggctt gtgagttcca ttggttctcc caggacagca gtgacagctc 420
tagattttct ggttgatctc ttccatctaa gtttttactt ctgaatacat ctgtgcagca 480
aagcctgatg cttttttttt tccccctccc ctgggatcgt gaaatattat tttcccatct 540
ccataataca gatgatccac tcaaacatgc atcctcagtc gcagtcctca gaagggcctt 600
ttcccaccat acacctacac gctacaccag actttattgg tcaccatgcc ttgagggatt 660
ctgcctaaca caggcacaca ggaagggctg ataccagtaa ttcattgctg aggagagaag 720
gggcacttct tttatagtag agccacagaa tcaccaggat tggaaaacac ctccaagatc 780
atccaatcca accacccacc taccaccagt atttcccact aaaccatgcc ccttggtacc 840
acatctaaaa gcatcttctg caccttcaca gcttcattgc ctttctcagg acgtgctcca 900
gggccttggt gtctttcttg tattgagtgg cccaaaattg aacacaatac tcgaggtgca 960
gcttcaccaa agctgagtgc agaggggtga tcacctctac taggccttgt tttacccctt 1020
cc 1022
<210> 39
<211> 1003
<212> DNA
<213> Artificial Sequence
<220>
<223> Left arm for gRNA11 integration to Chromosome Z
RPS23_ATG10_ENSGALG00000015617_ENSGALG00000027714_chrZ_63364946_-
1
<400> 39
gggttgaaac tgcgtgatca ttgtagtctt tttcaaccca ggccattcta tgattccatg 60
aagactctgt aaggacccca atgccatcag ctgtccccac agcttcagta cccactgcca 120
ccacattttt actgagatag gtagtttggt agccttcctc ccatcttgga taggggaggg 180
ttaactgctg gcatttttgt tctttcctgc aatatgtgtt ttctgcatgc attctctttt 240
cacccaaaat tttaatgtgg acggactttg aggatattct gcatctgccc aatatttctt 300
acagcctcac atctactgat ttatgcacag tatcttatat ataatgtata ttatattatg 360
tatattatgc actgaatcac atctactgtg tatgcacagt aacttctcct atggtactgt 420
aagcccagaa atcccagata tgtcactaca acgtgtctgc tatgtattgc ttctgtgaga 480
cacagatgtg ataatcagag gctgtacaca gtagaaatgc atacatatcc tactgtgaaa 540
tctctgaaat ctagccttaa tcttggaaca gaaatgaata tggtgacatc ttgatctgat 600
agaattggtt gccagtagca cagctgtaat catccatgat atgaatcaaa ccaagcacag 660
gtaaacaggt gagagaaatc atgaacaatt acatgcaaac ggaccagcta aaatgtgttt 720
gtttgttgtt tttttttttt caggtgattc ttgattacag taagatcaga agctgctaca 780
ttagcagacc agccactgca ctcaaggctg tgattcacag cttgcagacc tgacagcagt 840
tctgtggaag aggcaggtcc ctgtcaacca gtttaatcaa taaatcagtc tcgtgtacac 900
aaataatgtt atcctgcacc actgctggtg ttacactatt tcacccaagt ttatcaccag 960
caaactgagt cttatcgttc ctactgtgct ttgcttttct tgc 1003
<210> 40
<211> 1003
<212> DNA
<213> Artificial Sequence
<220>
<223> Right arm for gRNA11 integration to Chromosome Z
RPS23_ATG10_ENSGALG00000015617_ENSGALG00000027714_chrZ_63364946_-
1
<400> 40
cagaaacacc agagcttacg gtgtgaattc attgcacatc ttattagatc aacaaaatgg 60
aataaaagaa tacagaagat tactactcca ttgggcatgt ggacgtttta caggcctgga 120
taaattagat cttaaaaaca aacaaacaaa caaacaaaaa aactccttgc aaagataatg 180
ttatgtaata ttagttgcaa gaagtaagca aacacacaga actgggagca gaagcaaagc 240
actaagttat taaagcaagt tgcacatttt gagttgcatt ttgccactgg ttttataaac 300
atgtttagca tgtctggtca gaatttgggc accaggatgc ttttaagatg tctgtctatg 360
gaacctgtca gtgctcaaga ataacttctg ttatttggat gctgcaccaa agaattcaga 420
ggaagacgag ccaagccaga cgttatcata gtcactagta aagtggttct aagcctaatt 480
aagacatgtc agaactatgt gttgtgcaac caaatcctcc aaaagagaaa tcagaggtga 540
acttgtgcaa taaatataga agacacgtaa atcctgaggc agttagctaa ccatatgaag 600
ccaatcatac ctgactgctg gacgcaggag actgaacctt acagaccctg gagaatcact 660
gtttggccta gttaggcctg aatggaattt accaagattc atgactttaa catggatcag 720
gtgcaaagaa aagaaggctc agttagttcc tacaggctac cagatctttt tccacctctg 780
ctcagcctgg agctgtgggc tctacctgcc cctgaagtga agtggcatca actgcaacac 840
tttttgcaga ggcaaaaatc atcaagtcgt gcctctgcat tttaaggtga tggattccaa 900
gagatagatt ccaaacccaa cactgagatt cctctggtga tgcagatgac tgcttactgg 960
gatccttctc tctctatagc ctaatcccat gcagcaccaa aag 1003
<210> 41
<211> 200
<212> DNA
<213> Artificial Sequence
<220>
<223> For cloning using the gRNA3, Z chromosome, "Left arm"
<400> 41
cctgcaggac atgtggacac tctgccaggt actgggggag gatcccctcc actgctccct 60
gggagatggc aaacatctag agagggacac tgcagggatg ctgcatgaac acctccagcc 120
ttctgcaggc tgtgatgggg tcagggctga aggtcaacac aagcaatgac tgcttgctga 180
caatgtgggc attgccgacc 200
<210> 42
<211> 258
<212> DNA
<213> Artificial Sequence
<220>
<223> For cloning using the gRNA3, Z chromosome, "Right arm"
<400> 42
tggtgagtgg ggccaggaga gcaggacagg agtgtggact cggaggcgcg ggcagaggag 60
gtagctcaga gcatgagata tattcgccag gtgtcagtgg acttctggca gtgcatactg 120
cagagagctt tggttgctgg ccatctggat gatgacaaaa tctcagccac agaccatgtg 180
ggttggaaga gtcctcagga gatcaccttt ccacctcctg ctaaagcaca ttccctacag 240
tatgtttcac atgacacc 258
<210> 43
<211> 436
<212> DNA
<213> Artificial Sequence
<220>
<223> For cloning using the gRNA4, Z chromosome, "Left arm"
<400> 43
tcaacagctg tacgaaaagt ccatgcttcc tcattataaa cggaggaaaa aaagttgttt 60
acagctgtaa tgggattata aaaggcaaat ggggatagta cagtggtgag aaccagatct 120
atgaaggaaa agccctaaga aaaagagagt gcacagatac tcttaaccat ctaataactg 180
tttcctccat cctacagctc agagttaaga cttacagagg actctagtac ttagtaagat 240
gaatacgagc taatagtggc aaaaataatc ccagtgcctc aacactgacc tgggaaaaag 300
gggcatgtat agaccttctg atattgtgat gctgtgtttg tacacttatt atctacattt 360
tcagaaatta ggttaaactt cagaaaactg aagatctcca gggcttgtag cagaccctga 420
ccaccagact ggtccc 436
<210> 44
<211> 521
<212> DNA
<213> Artificial Sequence
<220>
<223> For cloning using the gRNA4, Z chromosome, "Right arm"
<400> 44
tcaaaccgat tgtggctgtt tctcagaggc aactctttgc gctctagccc ctctataaca 60
tggggcaact tcccctgccc caccttccct tcctgtatct tctgaaaagc ttgtagccct 120
caattgtcac gctccagcca tatgaatcat cccaccacgt ccctgtgttc acaattacct 180
tctagtcttc taattgcacc atggcttcca attcctcctg tttatcaccc acgttgcatc 240
cattgatgta gaggcacttc agtcgggcta tcagcaatgt taccacctgt gaggagccct 300
cttgagatct tttaggacaa tttagaggtt ttccccactg tttcctaaaa ttacagcatt 360
ccctgtccct tcttagtgat atagaactcc atccccttcc accatcaaac ctagcttaag 420
ctctggtaaa tgatccagcc agtctgcttc ccaaaactct tgctcagttg cattctatct 480
gatgcctaca tgcccaacac cttcaaggcc tgtccaagat c 521
<210> 45
<211> 505
<212> DNA
<213> Artificial Sequence
<220>
<223> For cloning using the gRNA5, Z chromosome, "Left arm"
<400> 45
gcctgtccaa actgaccttg gggccccggg cacagctgct cccgagcaag gagaggcaga 60
gaattgtgga ggaaaccctc ttccacctag ctccaagggt gcacgctcaa tgcttggatg 120
aagattcaag ttctcaatga agaactgcat tcaaagacat ctttggaggt gacccagact 180
gcctctggga tgaatccaga acaaacagaa tcttcccagc aacacctttg tttatcatac 240
acgttcagaa atgcagtgcc tgcctggtat ttttttaaac tcatcacaga ggaatctctg 300
agtggagcag aggagtgttt cctcttgctt ttttcttccc cctttctgta agaaatgcat 360
atgccagttt ccccctaaat gttttcaaac tccaaattgt ttcctgctgg tgacattctc 420
ctctccagca ctgcctacac cccagctgcg tctgatagga aaagcaccca gtaccatgct 480
ggcatggcat ggtcagtgac accca 505
<210> 46
<211> 599
<212> DNA
<213> Artificial Sequence
<220>
<223> For cloning using the gRNA5, Z chromosome, "Right arm"
<400> 46
ctgccagagc agagggctgc tgaaacgccg agtgccaact gacactgttc agctgacagc 60
ctcacgagag tgctgcgagg gttaagtgag gcaacaaaat acaagtactc aaaaatagaa 120
tggaatggaa tggaataaca gagggaatgg ggaacaggct gcagtgagaa ggaaaccccc 180
gtgcaccgac caacccgctc ccagtagcct ggtccctacc ttgccccact ccagcagctc 240
cacgaggtac tcgaagtgcc catgtccggc catccccagc atggcacagc tgtcacctgg 300
gagcagcggg ggtccggcag gcatcgccgg cacccacagc ctgggctggg ctgaggatgg 360
gcttggtggg cagctgggtg ctgccgtggc agctgagtgc cgtcgtgcag gtgggctcgg 420
tgctctctgc agcccacggc tcgggacccg tggtgggcat actgctgggc aaggggacgg 480
ctcggatgtg catcccagag cagggtgcat gatgtgtgcg cagcggcaca cagcagcgca 540
cttgtccccg aggcaccacc cggtctgatg aaattccagg ttttgtttaa gatgaaaat 599
<210> 47
<211> 453
<212> DNA
<213> Artificial Sequence
<220>
<223> For cloning using the gRNA6, Z chromosome, "Left arm"
<400> 47
ttgcagtctc aggttgccgc agcagcagct gcctgaggtc tggtggcaaa gggcagagca 60
cccagcccac tgctctccat gagtgagcgg gtagggggca cgccgtgctt cgcttctggt 120
atcgggtggc ctgtggagca catcacccct ggacagtgaa aacatgtcaa agggtgtttt 180
ataacagtat agcatatccc tttgaggctg aatttcctga gcttatggat atggtagtaa 240
tgctatacca ggctctctct gcaggttgct cactgaaaca atataccctt tctttctcaa 300
gaaatgggac tcatgaatag ctaccaggcc tttctgctac tagatactgt agaattacat 360
atatcagatg gctcattaat cacatagctt gttattggga cagaggcagg ttttcagcat 420
ttcccacact gcttttctgc aaatggatta gga 453
<210> 48
<211> 439
<212> DNA
<213> Artificial Sequence
<220>
<223> For cloning using the gRNA6, Z chromosome, "Right arm"
<400> 48
gggaccatca ctcacttcct aggccatgct tcgtagttta actccatgca aggtattttc 60
ttgctctgat ctaactctag atcactaaat ggcacttgtg caggacactt ttccactgtc 120
attttggggg gtagaagtgt ggtcagagcc agggaggctt gcagggccca caccagctgt 180
ggcccaagca gctgctgtac aatggctgta tggcagtatc gatgtgaact tcctgataat 240
aaacagaact cagcagcaaa taaacccaga ttgttctgat cagtaacgag aggctgtgca 300
aaaagctgag aaatgtacag cccttcctgc tcaccactac agcccttcat gcagcggcct 360
gctgcactag ggcctgcttg gccagaggca gggctgcagc ttgagatacg cagcacccag 420
taccccagca ggctgccat 439
<210> 49
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> LEFT PRIMER
<400> 49
ttggtgtgtg ctaataggca gt 22
<210> 50
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> RIGHT PRIMER
<400> 50
tagtcctcgt tgtgggaggt 20
<210> 51
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> LEFT PRIMER
<400> 51
gcattgatct gtccagttgc 20
<210> 52
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> RIGHT PRIMER
<400> 52
tactgccaaa accgcatcac 20
<210> 53
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> ChZgRNA_FORWARD PRIMER
<400> 53
tgtatgagac cacgtaatac agagctaaac cag 33
<210> 54
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> ChZgRNA_Reverse PRIMER
<400> 54
aaacctggtt tagctctgta ttacgtggtc tca 33
<210> 55
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Forward for cloning of the 'Left arm' of gRNA 7
<400> 55
acggggtcat tagttcatag cccatatatg gtgaacggat aggcagcaag c 51
<210> 56
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Reverse for cloning of the 'Left arm' of gRNA 7
<400> 56
ggcgggccat ttaccgtaag ttatgtaacg tgaggaaggg tctgttactg ga 52
<210> 57
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Forward for cloning of the 'Right arm' of gRNA 7
<400> 57
ttctatcgcc ttcttgacga gttcttctga gtcatgtcgg tggaggagaa a 51
<210> 58
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Reverse for cloning of the 'Right arm' of gRNA 7
<400> 58
gtgatggcag gttgggcgtc gcttggtcgg gcatgggatg ttaaagagaa gct 53
<210> 59
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Repetition of 16 nucleotides
<400> 59
cggtaaatgg cccgcc 16
<210> 60
<211> 261
<212> DNA
<213> Artificial Sequence
<220>
<223> Flanking left arm of Z chromosome
<400> 60
tggagatccc ttattggtga agctttcccc tgcaaaccta gaatcttctg atgcaagtga 60
gcaatcttct tcccttccct agcagctctc tgttgcacca gtccttccat ccttgcacct 120
ttgttgtaat gcttttccca tggcattgat ctgtccagtt gctacagtgt agaaacaaga 180
aagtgttttc tcaaaacatt atacatgctt actatcagat cttacttaac attgataaga 240
agtacacctt tcattacaac a 261
<210> 61
<211> 245
<212> DNA
<213> Artificial Sequence
<220>
<223> Flanking right arm of Z chromosome
<400> 61
caaactttta atcactttca atcaatgttg gaaatctgca gtacataaat tttattttga 60
ttcattattc agagaatcag agaaataagg acttttttag aggtttatgt ttattttaga 120
aaatataaat aaatcttgta tacatagatt tccaactagt aaaattttta gctatcgctg 180
tagcatttct atgaggagtt ttacttttta ctgtctctta tgaaacttag tggaaacaaa 240
gctag 245
<210> 62
<211> 1014
<212> DNA
<213> Artificial Sequence
<220>
<223> Left arm of Z chromosome
<400> 62
gtgaacggat aggcagcaag cattcagaac aatgaaaaag atctgcgttc tattgtaaag 60
caaacaaagg tgatgacgga acgtttattt gagatacagg caccatagta caagatatca 120
aagaggaatt aattcaaccc tcccaacaac agttgggaaa aaaaaaggat aagctgagga 180
atgcagcctt ctccgatttt tactctggtg ccggaaggag gaggaggagc gggggaaaac 240
ccagcggact cagactgcat acgcactctc ggaagtacct ctgaggcggg gtgagaggaa 300
gggtggatct aggctccccc cgctccacac actcacgtgc tcgtgtactg gttcaggctg 360
tgacttggca actcctctac atctatccat ctagttagac tcaacaagac catcgtgatt 420
caggagtctg aagatgctta actctctcag aacgtctagt tctcctggcc tggtaaatgc 480
tatgtttctc atactgcctc tctgaagaat gcttcgaatg cttctagtga tgctctaaag 540
ttctaaacag aaaaatctgg agacagttct ggtctttaga tagaaaaaat gccaacatgc 600
caaaggatgg ttacatcctt caagcaacct tgttgcatgc tgtacaatag actcatgtaa 660
taacttagcc gtagtcatcg tatctcttat ttacctgttc gttattacat tttcctggta 720
ctgctttata tttagtcagt tgtcctttta agacaaattt tttggtgtgt gctaataggc 780
agttaccaaa tgttctagag ggagggaata taatcagtga gtatgtagat gtatatagat 840
gtataaccag taagtataca gagaagttag ggtggtcttt tgagagcata tagctggaaa 900
gattatcaca tgggaaaagg taatcagaaa taaatggaaa aatgctcacc agtgtcatag 960
gctcacaaga aaactcccca aggagcaatc tccagtaaca gacccttcct cagt 1014
<210> 63
<211> 629
<212> DNA
<213> Artificial Sequence
<220>
<223> CMV Enhancer
<400> 63
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 60
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 120
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 180
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 240
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 300
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 360
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 420
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 480
gtaggcgtgt acggtgggag gtctatataa gcagagctgg tttagtgaac cgtcagatcc 540
gctagcgcta ccggactcag atctcgagct caagcttcga attctgcagt cgacggtacc 600
gcgggcccgg gatccaccgg tcgccacca 629
<210> 64
<211> 714
<212> DNA
<213> Artificial Sequence
<220>
<223> dsRED2 reporter gene
<400> 64
tggcctcctc cgagaacgtc atcaccgagt tcatgcgctt caaggtgcgc atggagggca 60
ccgtgaacgg ccacgagttc gagatcgagg gcgagggcga gggccgcccc tacgagggcc 120
acaacaccgt gaagctgaag gtgaccaagg gcggccccct gcccttcgcc tgggacatcc 180
tgtcccccca gttccagtac ggctccaagg tgtacgtgaa gcaccccgcc gacatccccg 240
actacaagaa gctgtccttc cccgagggct tcaagtggga gcgcgtgatg aacttcgagg 300
acggcggcgt ggcgaccgtg acccaggact cctccctgca ggacggctgc ttcatctaca 360
aggtgaagtt catcggcgtg aacttcccct ccgacggccc cgtgatgcag aagaagacca 420
tgggctggga ggcctccacc gagcgcctgt acccccgcga cggcgtgctg aagggcgaga 480
cccacaaggc cctgaagctg aaggacggcg gccactacct ggtggagttc aagtccatct 540
acatggccaa gaagcccgtg cagctgcccg gctactacta cgtggacgcc aagctggaca 600
tcacctccca caacgaggac tacaccatcg tggagcagta cgagcgcacc gagggccgcc 660
accacctgtt cctgtagcgg ccgcgactct agatcataat cagccatacc acat 714
<210> 65
<211> 1026
<212> DNA
<213> Artificial Sequence
<220>
<223> Right arm of Z chromosome
<400> 65
gagtcatgtc ggtggaggag aaagtggctg tagaaaaggt aacggacaag aaatccctca 60
ctggcttagc tgtaaaggtc agaggaaaat catcttctgt tctccataca catctcctgt 120
aattaggcac ctgtgccctt taaaaaagta aagtaatcaa agagtcattt ggtgaaaata 180
gaagccaaac agttacaaaa tttagttaat attcaaagac aaaacaactc tggttccaaa 240
tataaaaccc tttgtgtaaa cactgcggga aggtgccaaa gagccaccta cacaaagaga 300
tgccacagag taatttgcgt accccaacaa taggatcata tatgggcaaa ccaaaagacc 360
aacaaagacc ccttgcaata atcccttgat tggcagaagc aagtgcagcg ttagatttag 420
tatgtgtgac aattctgaga ataggaagga atttcactga aactgtgtga agatttgtat 480
gttaaataca tataatgagg gttatttagc tctggggtgt gcatgctatg tggagagatc 540
cccatgtgcc cagcactgca atagactaat gtcagctttt taaaccatca tttggtttga 600
agagtttatt atgattttca gaaacagaat tatgtattca gtgtctgtac attcttacaa 660
gcctgctgtt ctgtacacat gaaaaagcta cttatggtgc aaatcagtat agagaagcag 720
ttttgacata cagtggtcat gactgggtga tctgctgtca gaaggtaaga cactggtata 780
cagaattgca aacgtgagat gaagacctca agtgcaactc tgtcatcata ccacttctct 840
tgctattatc tattcagtgt ttgttctaaa tattcaggca gaaggcttgg tttcacatca 900
ggtgttacat ttaagtattc tttgcccatt ttttgctgtt tgtatgtgta acttcagatt 960
ctcacattga ctgtgtagtg taaatttgca aatagatgta acagcttctc tttaacatcc 1020
catgca 1026
<210> 66
<211> 2618
<212> DNA
<213> Artificial Sequence
<220>
<223> Right arm of Z chromosome of Figure 15
<400> 66
tggagatccc ttattggtga agctttcccc tgcaaaccta gaatcttctg atgcaagtga 60
gcaatcttct tcccttccct agcagctctc tgttgcacca gtccttccat ccttgcacct 120
ttgttgtaat gcttttccca tggcattgat ctgtccagtt gctacagtgt agaaacaaga 180
aagtgttttc tcaaaacatt atacatgctt actatcagat cttacttaac attgataaga 240
agtacacctt tcattacaac agtgaacgga taggcagcaa gcattcagaa caatgaaaaa 300
gatctgcgtt ctattgtaaa gcaaacaaag gtgatgacgg aacgtttatt tgagatacag 360
gcaccatagt acaagatatc aaagaggaat taattcaacc ctcccaacaa cagttgggaa 420
aaaaaaagga taagctgagg aatgcagcct tctccgattt ttactctggt gccggaagga 480
ggaggaggag cgggggaaaa cccagcggac tcagactgca tacgcactct cggaagtacc 540
tctgaggcgg ggtgagagga agggtggatc taggctcccc ccgctccaca cactcacgtg 600
ctcgtgtact ggttcaggct gtgacttggc aactcctcta catctatcca tctagttaga 660
ctcaacaaga ccatcgtgat tcaggagtct gaagatgctt aactctctca gaacgtctag 720
ttctcctggc ctggtaaatg ctatgtttct catactgcct ctctgaagaa tgcttcgaat 780
gcttctagtg atgctctaaa gttctaaaca gaaaaatctg gagacagttc tggtctttag 840
atagaaaaaa tgccaacatg ccaaaggatg gttacatcct tcaagcaacc ttgttgcatg 900
ctgtacaata gactcatgta ataacttagc cgtagtcatc gtatctctta tttacctgtt 960
cgttattaca ttttcctggt actgctttat atttagtcag ttgtcctttt aagacaaatt 1020
ttttggtgtg tgctaatagg cagttaccaa atgttctaga gggagggaat ataatcagtg 1080
agtatgtaga tgtatataga tgtataacca gtaagtatac agagaagtta gggtggtctt 1140
ttgagagcat atagctggaa agattatcac atgggaaaag gtaatcagaa ataaatggaa 1200
aaatgctcac cagtgtcata ggctcacaag aaaactcccc aaggagcaat ctccagtaac 1260
agacccttcc tcagttggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 1320
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 1380
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 1440
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 1500
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 1560
tctacgtatt agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc 1620
gtggatagcg gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga 1680
gtttgttttg gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat 1740
tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctggtttag 1800
tgaaccgtca gatccgctag cgctaccgga ctcagatctc gagctcaagc ttcgaattct 1860
gcagtcgacg gtaccgcggg cccgggatcc accggtcgcc accatggcct cctccgagaa 1920
cgtcatcacc gagttcatgc gcttcaaggt gcgcatggag ggcaccgtga acggccacga 1980
gttcgagatc gagggcgagg gcgagggccg cccctacgag ggccacaaca ccgtgaagct 2040
gaaggtgacc aagggcggcc ccctgccctt cgcctgggac atcctgtccc cccagttcca 2100
gtacggctcc aaggtgtacg tgaagcaccc cgccgacatc cccgactaca agaagctgtc 2160
cttccccgag ggcttcaagt gggagcgcgt gatgaacttc gaggacggcg gcgtggcgac 2220
cgtgacccag gactcctccc tgcaggacgg ctgcttcatc tacaaggtga agttcatcgg 2280
cgtgaacttc ccctccgacg gccccgtgat gcagaagaag accatgggct gggaggcctc 2340
caccgagcgc ctgtaccccc gcgacggcgt gctgaagggc gagacccaca aggccctgaa 2400
gctgaaggac ggcggccact acctggtgga gttcaagtcc atctacatgg ccaagaagcc 2460
cgtgcagctg cccggctact actacgtgga cgccaagctg gacatcacct cccacaacga 2520
ggactacacc atcgtggagc agtacgagcg caccgagggc cgccaccacc tgttcctgta 2580
gcggccgcga ctctagatca taatcagcca taccacat 2618
<210> 67
<211> 1271
<212> DNA
<213> Artificial Sequence
<220>
<223> Left arm of Z chromosome of Figure 15
<400> 67
gagtcatgtc ggtggaggag aaagtggctg tagaaaaggt aacggacaag aaatccctca 60
ctggcttagc tgtaaaggtc agaggaaaat catcttctgt tctccataca catctcctgt 120
aattaggcac ctgtgccctt taaaaaagta aagtaatcaa agagtcattt ggtgaaaata 180
gaagccaaac agttacaaaa tttagttaat attcaaagac aaaacaactc tggttccaaa 240
tataaaaccc tttgtgtaaa cactgcggga aggtgccaaa gagccaccta cacaaagaga 300
tgccacagag taatttgcgt accccaacaa taggatcata tatgggcaaa ccaaaagacc 360
aacaaagacc ccttgcaata atcccttgat tggcagaagc aagtgcagcg ttagatttag 420
tatgtgtgac aattctgaga ataggaagga atttcactga aactgtgtga agatttgtat 480
gttaaataca tataatgagg gttatttagc tctggggtgt gcatgctatg tggagagatc 540
cccatgtgcc cagcactgca atagactaat gtcagctttt taaaccatca tttggtttga 600
agagtttatt atgattttca gaaacagaat tatgtattca gtgtctgtac attcttacaa 660
gcctgctgtt ctgtacacat gaaaaagcta cttatggtgc aaatcagtat agagaagcag 720
ttttgacata cagtggtcat gactgggtga tctgctgtca gaaggtaaga cactggtata 780
cagaattgca aacgtgagat gaagacctca agtgcaactc tgtcatcata ccacttctct 840
tgctattatc tattcagtgt ttgttctaaa tattcaggca gaaggcttgg tttcacatca 900
ggtgttacat ttaagtattc tttgcccatt ttttgctgtt tgtatgtgta acttcagatt 960
ctcacattga ctgtgtagtg taaatttgca aatagatgta acagcttctc tttaacatcc 1020
catgcacaaa cttttaatca ctttcaatca atgttggaaa tctgcagtac ataaatttta 1080
ttttgattca ttattcagag aatcagagaa ataaggactt ttttagaggt ttatgtttat 1140
tttagaaaat ataaataaat cttgtataca tagatttcca actagtaaaa tttttagcta 1200
tcgctgtagc atttctatga ggagttttac tttttactgt ctcttatgaa acttagtgga 1260
aacaaagcta g 1271
Claims (48)
- (a) 성 염색체 Z 및 W 중 적어도 하나에서 적어도 하나의 위치 또는 장소에 통합된 적어도 하나의 외인성 리포터 유전자(reporter gene)를 포함하는 적어도 하나의 유전자이식 조류 대상체를 제공하는 단계;
(b) 상기 유전자이식 조류 대상체, 또는 이의 임의의 세포로부터 적어도 하나의 수정란을 수득하는 단계;
(c) 적어도 하나의 검출 가능한 신호가 검출되는지 상기 알에서 결정하는 단계로서, 여기서 상기 적어도 하나의 검출 가능한 신호의 검출은 상기 적어도 하나의 리포터 유전자의 발현을 나타내며, 이에 의해 상기 수정된 부화되지 않은 알 내에 포함된 조류 배아에서 상기 W 염색체 또는 Z 염색체의 존재를 나타내는 단계를 포함하는, 조류의 수정된 부화되지 않은 알의 성 감별 방법. - 제1항에 있어서, 상기 리포터 유전자가 적어도 하나의 형광 리포터 유전자인 방법.
- 제2항에 있어서, 상기 리포터 유전자가 적색 형광 단백질 (RFP)인 방법.
- 제2항 또는 제3항에 있어서, 검출 가능한 신호가 검출되는지 결정하는 단계가 상기 알을 광원에 적용하는 단계를 포함하는 방법.
- 제1항 내지 제4항 중의 어느 한 항에 있어서, 상기 적어도 하나의 유전자이식 조류 대상체가 암컷 조류 대상체이고, 상기 적어도 하나의 리포터 유전자가 암컷 염색체 Z의 적어도 하나의 위치에 통합됨으로써, 검출 가능한 신호의 검출이 상기 부화되지 않은 알에서 상기 배아가 수컷임을 나타내는 방법.
- 제1항 내지 제4항 중의 어느 한 항에 있어서, 상기 적어도 하나의 유전자이식 조류 대상체가 암컷 조류 대상체이고, 상기 적어도 하나의 리포터 유전자가 암컷 염색체 W의 적어도 하나의 위치에 통합됨으로써, 검출 가능한 신호의 검출이 상기 부화되지 않은 알에서 상기 배아가 암컷임을 나타내는 방법.
- 제1항 내지 제6항 중의 어느 한 항에 있어서, 상기 적어도 하나의 리포터 유전자가 적어도 하나의 프로그램 가능한 조작된 뉴클레아제 (PEN)를 사용하여 상기 유전자이식 조류 동물의 상기 성 염색체에 통합되는 방법.
- 제7항에 있어서, 상기 PEN이 주기적으로 간격을 띠고 분포하는 짧은 회문구조 반복서열 (CRISPR) 타입 II 시스템인 방법.
- 제8항에 있어서, 상기 적어도 하나의 리포터 유전자가 적어도 하나의 CRISPR/CRISPR-연관된 엔도뉴클레아제 9 (Cas9) 시스템에 의해 매개된 상동성 유도된 수선 (homology directed repair; HDR)에 의해 상기 유전자이식 조류 대상체의 상기 성 염색체에 통합되는 방법.
- 제9항에 있어서, 상기 적어도 하나의 리포터 유전자가, 상기 조류 대상체의 적어도 하나의 세포 또는 상기 조류 동물에 도입된 적어도 하나의 세포를
(a) 적어도 하나의 Cas9 단백질 또는 상기 적어도 하나의 Cas9 단백질을 암호화하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제1 핵산 서열; 및 적어도 하나의 성 염색체 Z 및/또는 W 내의 적어도 하나의 프로토스페이서(protospacer)를 표적화하는 가이드 RNA (gRNA), 또는 상기 적어도 하나의 gRNA를 암호화하는 적어도 하나의 핵산 서열; 및
(b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제2 핵산 서열과 접촉시키거나 공동-형질감염시킴으로써 상기 유전자이식 조류 대상체의 성 염색체에 통합되는 방법. - 제10항에 있어서, 상기 제2 핵산 서열의 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 통합 부위에서의 HDR을 위한 상동성 아암(homologous arm)이 측면에 있는 방법.
- 제10항 또는 제11항에 있어서, 상기 제2 핵산 서열의 상기 적어도 하나의 리포터 유전자가 성 특이 프로모터, 배아 특이 프로모터 및 유도성 프로모터 중의 어느 하나에 작동 가능하게 연결되는 방법.
- 제10항 내지 제12항 중의 어느 한 항에 있어서, 상기 적어도 하나의 리포터 유전자가 상기 성 염색체의 적어도 하나의 비-암호화 영역(non-coding region)에 통합되는 방법.
- 제13항에 있어서, 상기 적어도 하나의 리포터 유전자가 성 Z 염색체 유전자좌(locus) 42172748-42177748에서 적어도 하나의 부위에 통합되는 방법.
- 제10항 또는 제14항에 있어서, 상기 적어도 하나의 gRNA가 서열 번호 26으로 표시된 핵산 서열을 포함하는 방법.
- 제15항에 있어서, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 31 및 32로 표시된 핵산 서열을 포함하는 상동성 아암이 측면에 배치되어 있는 방법.
- 제13항에 있어서, 상기 적어도 하나의 리포터 유전자가 성 W 염색체 유전자좌 1022859-1024215에서 적어도 하나의 부위에 통합되고, 여기서 다음 중의 적어도 하나:
(a) 상기 gRNA가 서열 번호 1로 표시된 핵산 서열을 포함하고, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 4 및 5로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있으며;
(b) 상기 gRNA가 서열 번호 2로 표시된 핵산 서열을 포함하고, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 6 및 7로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있는 방법. - 성 염색체 Z 및 W 중의 적어도 하나에서 적어도 하나의 유전자좌에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 조류 유전자이식 대상체.
- 제18항에 있어서, 상기 리포터 유전자가 적어도 하나의 형광 리포터 유전자인 조류 유전자이식 대상체.
- 제19항에 있어서, 상기 리포터 유전자가 적색 형광 단백질 (RFP)인 조류 유전자이식 대상체.
- 제18항 내지 제20항 중의 어느 한 항에 있어서, 상기 적어도 하나의 유전자이식 조류 동물이 암컷이고, 상기 적어도 하나의 리포터 유전자가 암컷 염색체 Z의 적어도 하나의 위치에 통합되는 조류 유전자이식 대상체.
- 제18항 내지 제20항 중의 어느 한 항에 있어서, 상기 적어도 하나의 유전자이식 조류 동물이 암컷이고, 상기 적어도 하나의 리포터 유전자가 암컷 염색체 W의 적어도 하나의 위치에 통합되는 조류 유전자이식 대상체.
- 제18항 내지 제20항 중의 어느 한 항에 있어서, 상기 적어도 하나의 리포터 유전자가 적어도 하나의 PEN을 사용하여 상기 유전자이식 동물의 상기 성 염색체에 통합되는 조류 유전자이식 대상체.
- 제23항에 있어서, 상기 PEN이 CRISPR 타입 II 시스템인 조류 유전자이식 대상체.
- 제24항에 있어서, 상기 적어도 하나의 리포터 유전자가 적어도 하나의 CRISPR/Cas9 시스템에 의해 매개된 HDR에 의해 상기 유전자이식 조류 대상체의 상기 성 염색체에 통합되는 조류 유전자이식 대상체.
- 제25항에 있어서, 상기 적어도 하나의 리포터 유전자가, 상기 조류 동물의 적어도 하나의 세포 또는 상기 조류 대상체에 도입된 적어도 하나의 세포를
(a) 적어도 하나의 Cas9 단백질 또는 상기 적어도 하나의 Cas9 단백질을 암호화하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제1 핵산 서열; 및 적어도 하나의 성 염색체 Z 및/또는 W 내의 적어도 하나의 프로토스페이서를 표적화하는 적어도 하나의 gRNA, 또는 상기 적어도 하나의 gRNA를 암호화하는 적어도 하나의 핵산 서열; 및
(b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제2 핵산 서열과 접촉시키거나 공동-형질감염시킴으로써 상기 유전자이식 조류 대상체의 성 염색체에 통합되는 조류 유전자이식 대상체. - 제26항에 있어서, 상기 제2 핵산 서열의 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 통합 부위에서의 HDR을 위한 상동성 아암이 측면에 배치되어 있는 조류 유전자이식 대상체.
- 제26항 또는 제27항에 있어서, 상기 제2 핵산 서열의 적어도 하나의 리포터 유전자가 성 특이 프로모터, 배아 특이 프로모터 및 유도성 프로모터 중의 어느 하나에 작동 가능하게 연결되는 조류 유전자이식 대상체.
- 제26항 내지 제28항 중의 어느 한 항에 있어서, 상기 적어도 하나의 리포터 유전자가 상기 성 염색체의 적어도 하나의 비-암호화 영역에 통합되는 조류 유전자이식 대상체.
- 제29항에 있어서, 상기 적어도 하나의 리포터 유전자가 성 Z 염색체 유전자좌 42172748-42177748에서 적어도 하나의 부위에 통합되는 유전자이식 동물.
- 제26항 내지 제30항 중의 어느 한 항에 있어서, 상기 적어도 하나의 gRNA가 서열 번호 26으로 표시된 핵산 서열을 포함하는 조류 유전자이식 대상체.
- 제31항에 있어서, 상기 제2 핵산 서열 내에 포함된 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 31 및 32로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있는 조류 유전자이식 대상체.
- 제26항 내지 제29항 중의 어느 한 항에 있어서, 상기 적어도 하나의 리포터 유전자가 성 W 염색체 유전자좌 1022859-1024215에서 적어도 하나의 부위에 통합되고, 여기서 다음 중의 적어도 하나:
(a) 상기 gRNA가 서열 번호 1로 표시된 핵산 서열을 포함하고, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 4 및 5로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있으며;
(b) 상기 gRNA가 서열 번호 2로 표시된 핵산 서열을 포함하고, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 6 및 7로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있는 조류 유전자이식 대상체. - 성 염색체 Z 및 W 중의 적어도 하나에서 적어도 하나의 유전자좌에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 세포.
- 제34항에 있어서, 상기 세포가 조류 세포인 세포.
- 제35항에 있어서, 상기 조류 세포가 원시 생식 세포 (PGC)인 세포.
- 제34항 내지 제36항 중의 어느 한 항에 있어서, 상기 적어도 하나의 리포터 유전자가, 상기 세포를
(a) 적어도 하나의 Cas9 단백질 또는 상기 적어도 하나의 Cas9 단백질을 암호화하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제1 핵산 서열; 및 적어도 하나의 성 염색체 Z 및/또는 W 내의 적어도 하나의 프로토스페이서를 표적화하는 적어도 하나의 gRNA, 또는 상기 적어도 하나의 gRNA를 암호화하는 적어도 하나의 핵산 서열; 및
(b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제2 핵산 서열과 접촉시키거나 공동-형질감염시킴으로써 상기 세포의 성 염색체에 통합되는 세포. - 제37항에 있어서, 상기 제2 핵산 서열의 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 통합 부위에서의 HDR을 위한 상동성 아암이 측면에 배치되어 있는 세포.
- 제37항 또는 제38항에 있어서, 상기 gRNA가 서열 번호 26으로 표시된 핵산 서열을 포함하고, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 31 및 32로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있는 세포.
- 제37항 또는 제38항에 있어서, 다음 중의 적어도 하나:
(a) 상기 gRNA가 서열 번호 1로 표시된 핵산 서열을 포함하고, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 4 및 5로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있으며;
(b) 상기 gRNA가 서열 번호 2로 표시된 핵산 서열을 포함하고, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 6 및 7로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있는 세포. - (a) 적어도 하나의 Cas9 단백질 또는 상기 적어도 하나의 Cas9 단백질을 암호화하는 적어도 하나의 핵산 서열을 포함하는 적어도 하나의 제1 핵산 서열; 및 적어도 하나의 성 염색체 Z 및/또는 W 내의 적어도 하나의 프로토스페이서를 표적화하는 적어도 하나의 gRNA, 또는 상기 적어도 하나의 gRNA를 암호화하는 핵산 서열; 및
(b) 적어도 하나의 상기 리포터 유전자를 포함하는 적어도 하나의 제2 핵산 서열을 포함하는 키트(kit). - 제41항에 있어서, 상기 제2 핵산 서열의 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 통합 부위에서의 HDR을 위한 상동성 아암이 측면에 배치되어 있는 키트.
- 제41항 또는 제42항에 있어서, 상기 제2 핵산 서열의 상기 적어도 하나의 리포터 유전자가 성 특이 프로모터, 배아 특이 프로모터 및 유도성 프로모터 중의 어느 하나에 작동 가능하게 연결되는 키트.
- 제41항 내지 제43항 중의 어느 한 항에 있어서, 상기 적어도 하나의 리포터 유전자가 상기 성 염색체의 적어도 하나의 비-암호화 영역으로의 통합을 위해 조정되는 키트.
- 제44항에 있어서, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 31 및 32로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있고, 상기 적어도 하나의 gRNA가 서열 번호 26으로 표시된 핵산 서열을 포함하는 키트.
- 제41항 내지 제43항 중의 어느 한 항에 있어서, 다음 중의 적어도 하나:
(a) 상기 gRNA가 서열 번호 1로 표시된 핵산 서열을 포함하고, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 4 및 5로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있으며;
(b) 상기 gRNA가 서열 번호 2로 표시된 핵산 서열을 포함하고, 상기 제2 핵산 서열 내에 포함된 상기 적어도 하나의 리포터 유전자는 이의 5' 및 3'에 각각 서열 번호 6 및 7로 표시된 아미노산 서열을 포함하는 상동성 아암이 측면에 배치되어 있는 키트. - 제41항 내지 제46항 중의 어느 한 항에 있어서, 상기 리포터 유전자가 적어도 하나의 형광 리포터 유전자인 키트.
- 제41항 내지 제47항 중의 어느 한 항에 있어서, 성 염색체 Z 및 W 중의 적어도 하나에서 적어도 하나의 유전자좌에 통합된 적어도 하나의 외인성 리포터 유전자를 포함하는 적어도 하나의 유전자이식 조류 동물의 제조에 사용하기 위한 키트.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762510921P | 2017-05-25 | 2017-05-25 | |
US62/510,921 | 2017-05-25 | ||
PCT/IL2018/050573 WO2018216022A1 (en) | 2017-05-25 | 2018-05-24 | Methods for gender determination of avian embryos in unhatched eggs and means thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20200018486A true KR20200018486A (ko) | 2020-02-19 |
Family
ID=62716101
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197038050A KR20200018486A (ko) | 2017-05-25 | 2018-05-24 | 부화되지 않은 알에서 조류 배아의 성 감별을 위한 방법 및 이의 수단 |
Country Status (23)
Country | Link |
---|---|
US (1) | US20200283849A1 (ko) |
EP (1) | EP3629719B1 (ko) |
JP (1) | JP7179776B2 (ko) |
KR (1) | KR20200018486A (ko) |
CN (2) | CN110891418B (ko) |
AU (1) | AU2018274769B2 (ko) |
BR (1) | BR112019024642A2 (ko) |
CA (1) | CA3064825A1 (ko) |
CL (1) | CL2019003414A1 (ko) |
CO (1) | CO2019014075A2 (ko) |
CR (1) | CR20190569A (ko) |
CU (1) | CU20190094A7 (ko) |
DO (1) | DOP2019000298A (ko) |
EA (1) | EA201992582A1 (ko) |
EC (1) | ECSP19087406A (ko) |
IL (1) | IL270903B1 (ko) |
MA (1) | MA48783A (ko) |
NI (1) | NI201900121A (ko) |
PE (1) | PE20200692A1 (ko) |
PH (1) | PH12019502663A1 (ko) |
PL (1) | PL3629719T3 (ko) |
SG (1) | SG11201911686YA (ko) |
WO (1) | WO2018216022A1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112522315B (zh) * | 2020-12-08 | 2023-04-11 | 广东省农业科学院动物科学研究所 | 一种鸡原始生殖细胞转染方法 |
CN112956427B (zh) * | 2021-01-29 | 2022-06-24 | 四川省畜牧科学研究院 | 一种便捷式雏禽性别鉴定肛笔 |
CN114568343B (zh) * | 2022-03-11 | 2023-04-07 | 成都合拓创展生物科技有限公司 | 制备眼病模型的头具及其应用 |
CN114793988B (zh) * | 2022-04-19 | 2023-01-17 | 中国科学院海洋研究所 | 一种基于形态学鉴定孔鳐受精卵的方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9511439D0 (en) | 1995-06-06 | 1995-08-02 | Isis Innovation | Gene product and method |
AUPO060996A0 (en) | 1996-06-21 | 1996-07-18 | University Of Melbourne, The | Sexing gene |
CA2264450A1 (en) * | 1998-03-05 | 1999-09-05 | Andras Nagy | Methods for monitoring heterologous sex chromosomes |
US6244214B1 (en) | 1999-01-06 | 2001-06-12 | Embrex, Inc. | Concurrent in ovo injection and detection method and apparatus |
EP1590435B1 (en) * | 2003-01-16 | 2008-03-19 | North Carolina State University | Depletion of endogenous primordial germ cels in avian species |
BRPI0608805A2 (pt) | 2005-05-11 | 2010-11-30 | Embrex Inc | métodos para detectar a presença de um analito em uma amostra e para determinar o sexo de um embrião de ave em um ovo |
WO2010103111A1 (en) | 2009-03-13 | 2010-09-16 | Van De Ven Beheer B.V. | Method for avian sex determination |
FR2969497B1 (fr) | 2010-12-27 | 2013-06-28 | Ceva Sante Animale | Composition luminescente comme biomarqueur dans un oeuf aviaire, dispositif et procede correspondants. |
AU2013204327B2 (en) * | 2012-04-20 | 2016-09-01 | Aviagen | Cell transfection method |
WO2014033544A2 (en) | 2012-08-31 | 2014-03-06 | Mat Malta Advanced Technologies Limited | Spectrophotometric analysis of embryonic chick feather color |
PT3080279T (pt) * | 2013-12-11 | 2018-12-17 | Regeneron Pharma | Métodos e composições para a modificação direcionada de um genoma |
FR3023617B1 (fr) | 2014-07-11 | 2018-06-15 | Tronico | Dispositif non invasif de determination de la fertilite et/ou du sexe d’un oeuf, et procede correspondant. |
CN108474034A (zh) * | 2015-12-03 | 2018-08-31 | 艾吉伊特有限公司 | 对未孵化卵中的禽类胚胎进行性别确定的方法及其用具 |
-
2018
- 2018-05-24 CR CR20190569A patent/CR20190569A/es unknown
- 2018-05-24 EP EP18733952.8A patent/EP3629719B1/en active Active
- 2018-05-24 CN CN201880042292.1A patent/CN110891418B/zh active Active
- 2018-05-24 SG SG11201911686YA patent/SG11201911686YA/en unknown
- 2018-05-24 JP JP2019564948A patent/JP7179776B2/ja active Active
- 2018-05-24 EA EA201992582A patent/EA201992582A1/ru unknown
- 2018-05-24 KR KR1020197038050A patent/KR20200018486A/ko not_active Application Discontinuation
- 2018-05-24 IL IL270903A patent/IL270903B1/en unknown
- 2018-05-24 WO PCT/IL2018/050573 patent/WO2018216022A1/en active Application Filing
- 2018-05-24 PE PE2019002466A patent/PE20200692A1/es unknown
- 2018-05-24 US US16/616,858 patent/US20200283849A1/en active Pending
- 2018-05-24 PL PL18733952.8T patent/PL3629719T3/pl unknown
- 2018-05-24 MA MA048783A patent/MA48783A/fr unknown
- 2018-05-24 CU CU2019000094A patent/CU20190094A7/es unknown
- 2018-05-24 BR BR112019024642-8A patent/BR112019024642A2/pt unknown
- 2018-05-24 CA CA3064825A patent/CA3064825A1/en active Pending
- 2018-05-24 AU AU2018274769A patent/AU2018274769B2/en active Active
- 2018-05-24 CN CN202210492538.3A patent/CN114836475A/zh active Pending
-
2019
- 2019-11-22 CL CL2019003414A patent/CL2019003414A1/es unknown
- 2019-11-25 PH PH12019502663A patent/PH12019502663A1/en unknown
- 2019-11-25 DO DO2019000298A patent/DOP2019000298A/es unknown
- 2019-11-25 NI NI201900121A patent/NI201900121A/es unknown
- 2019-12-10 EC ECSENADI201987406A patent/ECSP19087406A/es unknown
- 2019-12-13 CO CONC2019/0014075A patent/CO2019014075A2/es unknown
Also Published As
Publication number | Publication date |
---|---|
CN114836475A (zh) | 2022-08-02 |
CN110891418B (zh) | 2022-05-27 |
MA48783A (fr) | 2020-04-08 |
AU2018274769B2 (en) | 2024-05-02 |
CU20190094A7 (es) | 2020-10-20 |
BR112019024642A2 (pt) | 2020-06-23 |
AU2018274769A1 (en) | 2019-12-19 |
EP3629719C0 (en) | 2023-08-23 |
PL3629719T3 (pl) | 2023-11-27 |
WO2018216022A1 (en) | 2018-11-29 |
CN110891418A (zh) | 2020-03-17 |
JP2020520669A (ja) | 2020-07-16 |
JP7179776B2 (ja) | 2022-11-29 |
CA3064825A1 (en) | 2018-11-29 |
PH12019502663A1 (en) | 2020-09-28 |
SG11201911686YA (en) | 2020-01-30 |
US20200283849A1 (en) | 2020-09-10 |
CL2019003414A1 (es) | 2020-08-07 |
CR20190569A (es) | 2020-04-19 |
ECSP19087406A (es) | 2020-01-31 |
DOP2019000298A (es) | 2020-09-30 |
EA201992582A1 (ru) | 2020-05-19 |
IL270903A (en) | 2020-01-30 |
NI201900121A (es) | 2020-02-14 |
PE20200692A1 (es) | 2020-06-11 |
EP3629719B1 (en) | 2023-08-23 |
EP3629719A1 (en) | 2020-04-08 |
CO2019014075A2 (es) | 2020-04-01 |
IL270903B1 (en) | 2024-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110891418B (zh) | 对未孵化卵中的禽类胚胎进行性别确定的方法及其用具 | |
US7145057B2 (en) | Chimeric bird from embryonic stem cells | |
CN108486152B (zh) | 转基因猪的培育方法和应用 | |
KR20180099704A (ko) | 부화되지 않은 알에서 조류 배아의 성별 결정 방법 및 이의 수단 | |
JP2014064584A (ja) | トランスジェニックニワトリにおける外因性タンパク質の組織特異的発現 | |
CN101861391A (zh) | 通过翻译调控基因表达系统检测和调节细胞死亡的组合物和方法 | |
CN110295149B (zh) | 一种突变株3型鸭甲肝病毒ch-p60-117c株及构建方法 | |
WO2015199225A1 (ja) | 家禽始原生殖細胞の遺伝子改変方法、遺伝子改変された家禽始原生殖細胞、遺伝子改変家禽の生産方法及び家禽卵 | |
JPWO2005003342A1 (ja) | メチル化を利用したトランスジェニック生物を作製する方法およびシステム | |
RU2739593C2 (ru) | Система презентации пептидов на клеточной поверхности | |
CA2620294A1 (en) | Ocular gene therapy using avalanche-mediated transfection | |
US20200149063A1 (en) | Methods for gender determination and selection of avian embryos in unhatched eggs | |
CN110295180B (zh) | 一种3型鸭甲肝病毒突变基因isa-a117c-c4334a及构建方法 | |
CN110684781B (zh) | 一种3型鸭甲肝病毒突变基因isa-a117c-t1142a及构建方法 | |
TW202307213A (zh) | 血管收縮素轉化酶ii(ace2)基因轉殖動物及其用途 | |
CN114395017A (zh) | SARS-CoV-2病毒样颗粒的制备方法及其应用 | |
OA19682A (en) | Methods for gender determination of avian embryos in unhatched eggs and means thereof. | |
KR102427400B1 (ko) | 알러지 주요유전자 Fel d 1 타켓 고양이 셀라인 구축 | |
US7332647B2 (en) | Fish produced by nuclear transfer from cultured cells | |
KR101202996B1 (ko) | 적색 형광단백질을 발현하는 형질전환 고양이 및 그 생산방법 | |
CN110431227A (zh) | 新型整合位点及其用途 | |
Liew | Construction of a chicken embryo heart primordia cDNA library |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |