KR20230142740A - Omni-103 crispr 뉴클레아제 - Google Patents
Omni-103 crispr 뉴클레아제 Download PDFInfo
- Publication number
- KR20230142740A KR20230142740A KR1020237028527A KR20237028527A KR20230142740A KR 20230142740 A KR20230142740 A KR 20230142740A KR 1020237028527 A KR1020237028527 A KR 1020237028527A KR 20237028527 A KR20237028527 A KR 20237028527A KR 20230142740 A KR20230142740 A KR 20230142740A
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- composition
- rna
- seq
- tracrrna
- Prior art date
Links
- 101710163270 Nuclease Proteins 0.000 title claims abstract description 374
- 108091033409 CRISPR Proteins 0.000 title claims abstract description 29
- 238000010354 CRISPR gene editing Methods 0.000 title claims abstract 24
- 239000000203 mixture Substances 0.000 claims abstract description 157
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 79
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 69
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 69
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 393
- 210000004027 cell Anatomy 0.000 claims description 239
- 125000003729 nucleotide group Chemical group 0.000 claims description 169
- 239000002773 nucleotide Substances 0.000 claims description 165
- 238000000034 method Methods 0.000 claims description 112
- 108020004414 DNA Proteins 0.000 claims description 109
- 235000001014 amino acid Nutrition 0.000 claims description 92
- 108091079001 CRISPR RNA Proteins 0.000 claims description 84
- 150000001413 amino acids Chemical group 0.000 claims description 83
- 230000008685 targeting Effects 0.000 claims description 54
- 238000006467 substitution reaction Methods 0.000 claims description 51
- 102000040430 polynucleotide Human genes 0.000 claims description 36
- 108091033319 polynucleotide Proteins 0.000 claims description 36
- 239000002157 polynucleotide Substances 0.000 claims description 36
- 238000000338 in vitro Methods 0.000 claims description 30
- 230000000295 complement effect Effects 0.000 claims description 25
- 102100035971 Molybdopterin molybdenumtransferase Human genes 0.000 claims description 24
- 101710119577 Molybdopterin molybdenumtransferase Proteins 0.000 claims description 24
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims description 19
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims description 19
- 210000004962 mammalian cell Anatomy 0.000 claims description 18
- -1 domain F Proteins 0.000 claims description 16
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 16
- 210000005260 human cell Anatomy 0.000 claims description 15
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 12
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 11
- 210000004671 cell-free system Anatomy 0.000 claims description 11
- 235000003704 aspartic acid Nutrition 0.000 claims description 10
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 10
- 235000013922 glutamic acid Nutrition 0.000 claims description 10
- 239000004220 glutamic acid Substances 0.000 claims description 10
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 9
- 125000000291 glutamic acid group Chemical class N[C@@H](CCC(O)=O)C(=O)* 0.000 claims description 8
- 231100001074 DNA strand break Toxicity 0.000 claims description 6
- 239000003795 chemical substances by application Substances 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 3
- 238000002515 oligonucleotide synthesis Methods 0.000 claims description 2
- 239000007790 solid phase Substances 0.000 claims description 2
- 238000013518 transcription Methods 0.000 claims description 2
- 230000035897 transcription Effects 0.000 claims description 2
- 101800004910 Nuclease A Proteins 0.000 claims 2
- 125000003275 alpha amino acid group Chemical group 0.000 abstract description 73
- 108090000623 proteins and genes Proteins 0.000 description 73
- 108091028043 Nucleic acid sequence Proteins 0.000 description 62
- 230000000694 effects Effects 0.000 description 49
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 39
- 125000006850 spacer group Chemical group 0.000 description 33
- 102000004169 proteins and genes Human genes 0.000 description 32
- 108020005004 Guide RNA Proteins 0.000 description 30
- 239000013598 vector Substances 0.000 description 29
- 235000018102 proteins Nutrition 0.000 description 26
- 230000027455 binding Effects 0.000 description 25
- 102000004389 Ribonucleoproteins Human genes 0.000 description 23
- 108010081734 Ribonucleoproteins Proteins 0.000 description 23
- 201000010099 disease Diseases 0.000 description 22
- 238000007481 next generation sequencing Methods 0.000 description 22
- 108090000765 processed proteins & peptides Proteins 0.000 description 21
- 230000035772 mutation Effects 0.000 description 19
- 102000053602 DNA Human genes 0.000 description 17
- 102100040678 Programmed cell death protein 1 Human genes 0.000 description 17
- 208000035475 disorder Diseases 0.000 description 17
- 230000036961 partial effect Effects 0.000 description 17
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 15
- 238000012217 deletion Methods 0.000 description 14
- 230000037430 deletion Effects 0.000 description 14
- 230000005782 double-strand break Effects 0.000 description 14
- 102000004196 processed proteins & peptides Human genes 0.000 description 14
- 241000713666 Lentivirus Species 0.000 description 13
- 238000003776 cleavage reaction Methods 0.000 description 13
- 238000009396 hybridization Methods 0.000 description 13
- 238000001727 in vivo Methods 0.000 description 13
- 108020004999 messenger RNA Proteins 0.000 description 13
- 239000013612 plasmid Substances 0.000 description 13
- 230000007017 scission Effects 0.000 description 13
- 101000611936 Homo sapiens Programmed cell death protein 1 Proteins 0.000 description 12
- 238000001415 gene therapy Methods 0.000 description 12
- 241000702421 Dependoparvovirus Species 0.000 description 11
- 241000700605 Viruses Species 0.000 description 11
- 238000004520 electroporation Methods 0.000 description 11
- 238000010362 genome editing Methods 0.000 description 11
- 229920001184 polypeptide Polymers 0.000 description 11
- 108700028369 Alleles Proteins 0.000 description 10
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 10
- 108700026244 Open Reading Frames Proteins 0.000 description 10
- 238000003780 insertion Methods 0.000 description 10
- 230000037431 insertion Effects 0.000 description 10
- 239000002245 particle Substances 0.000 description 10
- 210000001519 tissue Anatomy 0.000 description 10
- 239000013603 viral vector Substances 0.000 description 10
- 230000003612 virological effect Effects 0.000 description 10
- 241000196324 Embryophyta Species 0.000 description 9
- 210000001744 T-lymphocyte Anatomy 0.000 description 9
- 108700019146 Transgenes Proteins 0.000 description 9
- 108091034117 Oligonucleotide Proteins 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 238000013461 design Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 108010034529 leucyl-lysine Proteins 0.000 description 8
- 238000002156 mixing Methods 0.000 description 8
- 239000003981 vehicle Substances 0.000 description 8
- 108020004705 Codon Proteins 0.000 description 7
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 7
- 239000003623 enhancer Substances 0.000 description 7
- 230000000670 limiting effect Effects 0.000 description 7
- 239000002502 liposome Substances 0.000 description 7
- 238000004806 packaging method and process Methods 0.000 description 7
- 238000001890 transfection Methods 0.000 description 7
- 108091093088 Amplicon Proteins 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 230000004570 RNA-binding Effects 0.000 description 6
- 208000037765 diseases and disorders Diseases 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 230000030648 nucleus localization Effects 0.000 description 6
- 210000004986 primary T-cell Anatomy 0.000 description 6
- 230000008439 repair process Effects 0.000 description 6
- 210000000130 stem cell Anatomy 0.000 description 6
- 101710089372 Programmed cell death protein 1 Proteins 0.000 description 5
- 108091027544 Subgenomic mRNA Proteins 0.000 description 5
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 210000004899 c-terminal region Anatomy 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 5
- 239000003937 drug carrier Substances 0.000 description 5
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 5
- 238000011534 incubation Methods 0.000 description 5
- 108010054155 lysyllysine Proteins 0.000 description 5
- 230000000869 mutational effect Effects 0.000 description 5
- 230000001177 retroviral effect Effects 0.000 description 5
- 239000004055 small Interfering RNA Substances 0.000 description 5
- 238000010361 transduction Methods 0.000 description 5
- 230000026683 transduction Effects 0.000 description 5
- 238000011282 treatment Methods 0.000 description 5
- 241000701161 unidentified adenovirus Species 0.000 description 5
- 241001430294 unidentified retrovirus Species 0.000 description 5
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 230000005778 DNA damage Effects 0.000 description 4
- 231100000277 DNA damage Toxicity 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000013613 expression plasmid Substances 0.000 description 4
- 230000008826 genomic mutation Effects 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 150000002632 lipids Chemical class 0.000 description 4
- 238000001638 lipofection Methods 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 229920001983 poloxamer Polymers 0.000 description 4
- 239000011347 resin Substances 0.000 description 4
- 229920005989 resin Polymers 0.000 description 4
- 125000002652 ribonucleotide group Chemical group 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 230000001225 therapeutic effect Effects 0.000 description 4
- 108010061238 threonyl-glycine Proteins 0.000 description 4
- 108010073969 valyllysine Proteins 0.000 description 4
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 3
- 102100022976 B-cell lymphoma/leukemia 11A Human genes 0.000 description 3
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 3
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 230000007035 DNA breakage Effects 0.000 description 3
- 230000007018 DNA scission Effects 0.000 description 3
- 108091092566 Extrachromosomal DNA Proteins 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- 101000903703 Homo sapiens B-cell lymphoma/leukemia 11A Proteins 0.000 description 3
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 3
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 3
- RVGRUAULSDPKGF-UHFFFAOYSA-N Poloxamer Chemical compound C1CO1.CC1CO1 RVGRUAULSDPKGF-UHFFFAOYSA-N 0.000 description 3
- 108091028664 Ribonucleotide Proteins 0.000 description 3
- 108020004459 Small interfering RNA Proteins 0.000 description 3
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 3
- 230000004075 alteration Effects 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 3
- 108010008355 arginyl-glutamine Proteins 0.000 description 3
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000007385 chemical modification Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000013611 chromosomal DNA Substances 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 108010081551 glycylphenylalanine Proteins 0.000 description 3
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 3
- 239000003446 ligand Substances 0.000 description 3
- 108010038320 lysylphenylalanine Proteins 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 239000002679 microRNA Substances 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 208000004235 neutropenia Diseases 0.000 description 3
- 230000006780 non-homologous end joining Effects 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 230000009437 off-target effect Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000001717 pathogenic effect Effects 0.000 description 3
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 3
- 229960000502 poloxamer Drugs 0.000 description 3
- 208000012584 pre-descemet corneal dystrophy Diseases 0.000 description 3
- 102000005962 receptors Human genes 0.000 description 3
- 108020003175 receptors Proteins 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 239000002336 ribonucleotide Substances 0.000 description 3
- 208000007056 sickle cell anemia Diseases 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 239000013607 AAV vector Substances 0.000 description 2
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 2
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 2
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 2
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 2
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 2
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 102100031650 C-X-C chemokine receptor type 4 Human genes 0.000 description 2
- 108010077544 Chromatin Proteins 0.000 description 2
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 2
- 230000033616 DNA repair Effects 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- ZJICFHQSPWFBKP-AVGNSLFASA-N Glu-Asn-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZJICFHQSPWFBKP-AVGNSLFASA-N 0.000 description 2
- XHWLNISLUFEWNS-CIUDSAMLSA-N Glu-Gln-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XHWLNISLUFEWNS-CIUDSAMLSA-N 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 2
- 208000031886 HIV Infections Diseases 0.000 description 2
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 2
- 101000922348 Homo sapiens C-X-C chemokine receptor type 4 Proteins 0.000 description 2
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 2
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 2
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 2
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 2
- 206010061218 Inflammation Diseases 0.000 description 2
- 102100034349 Integrase Human genes 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- SHZGCJCMOBCMKK-JFNONXLTSA-N L-rhamnopyranose Chemical compound C[C@@H]1OC(O)[C@H](O)[C@H](O)[C@H]1O SHZGCJCMOBCMKK-JFNONXLTSA-N 0.000 description 2
- PNNNRSAQSRJVSB-UHFFFAOYSA-N L-rhamnose Natural products CC(O)C(O)C(O)C(O)C=O PNNNRSAQSRJVSB-UHFFFAOYSA-N 0.000 description 2
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 2
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 2
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 2
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 2
- 241000714177 Murine leukemia virus Species 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 108091005461 Nucleic proteins Proteins 0.000 description 2
- 208000022873 Ocular disease Diseases 0.000 description 2
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 2
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 2
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 2
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 2
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 2
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 2
- 241000713311 Simian immunodeficiency virus Species 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 239000012505 Superdex™ Substances 0.000 description 2
- 230000006044 T cell activation Effects 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 2
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 2
- GOPQNCQSXBJAII-ULQDDVLXSA-N Tyr-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GOPQNCQSXBJAII-ULQDDVLXSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 2
- 208000005980 beta thalassemia Diseases 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 210000003483 chromatin Anatomy 0.000 description 2
- 230000000536 complexating effect Effects 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 230000009089 cytolysis Effects 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000002716 delivery method Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 238000000684 flow cytometry Methods 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 238000001476 gene delivery Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 2
- 210000002865 immune cell Anatomy 0.000 description 2
- 238000000099 in vitro assay Methods 0.000 description 2
- 230000000415 inactivating effect Effects 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 230000004054 inflammatory process Effects 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000000926 neurological effect Effects 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 210000000633 nuclear envelope Anatomy 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- 150000003833 nucleoside derivatives Chemical class 0.000 description 2
- 239000012071 phase Substances 0.000 description 2
- 238000001742 protein purification Methods 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 208000017520 skin disease Diseases 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000000699 topical effect Effects 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 108010020532 tyrosyl-proline Proteins 0.000 description 2
- ALNDFFUAQIVVPG-NGJCXOISSA-N (2r,3r,4r)-3,4,5-trihydroxy-2-methoxypentanal Chemical compound CO[C@@H](C=O)[C@H](O)[C@H](O)CO ALNDFFUAQIVVPG-NGJCXOISSA-N 0.000 description 1
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 1
- OPCHFPHZPIURNA-MFERNQICSA-N (2s)-2,5-bis(3-aminopropylamino)-n-[2-(dioctadecylamino)acetyl]pentanamide Chemical compound CCCCCCCCCCCCCCCCCCN(CC(=O)NC(=O)[C@H](CCCNCCCN)NCCCN)CCCCCCCCCCCCCCCCCC OPCHFPHZPIURNA-MFERNQICSA-N 0.000 description 1
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- UVBYMVOUBXYSFV-UHFFFAOYSA-N 1-methylpseudouridine Natural products O=C1NC(=O)N(C)C=C1C1C(O)C(O)C(CO)O1 UVBYMVOUBXYSFV-UHFFFAOYSA-N 0.000 description 1
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- WQVYAWIMAWTGMW-ZLUOBGJFSA-N Ala-Asp-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WQVYAWIMAWTGMW-ZLUOBGJFSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- BGNLUHXLSAQYRQ-FXQIFTODSA-N Ala-Glu-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BGNLUHXLSAQYRQ-FXQIFTODSA-N 0.000 description 1
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 1
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- UWIQWPWWZUHBAO-ZLIFDBKOSA-N Ala-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)CC(C)C)C(O)=O)=CNC2=C1 UWIQWPWWZUHBAO-ZLIFDBKOSA-N 0.000 description 1
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- 102000002659 Amyloid Precursor Protein Secretases Human genes 0.000 description 1
- 108010043324 Amyloid Precursor Protein Secretases Proteins 0.000 description 1
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 1
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- ZTKHZAXGTFXUDD-VEVYYDQMSA-N Arg-Asn-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZTKHZAXGTFXUDD-VEVYYDQMSA-N 0.000 description 1
- ALOVURZCXKYKJC-NAKRPEOUSA-N Arg-Asp-Gln-Ser Chemical compound N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O ALOVURZCXKYKJC-NAKRPEOUSA-N 0.000 description 1
- YFBGNGASPGRWEM-DCAQKATOSA-N Arg-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFBGNGASPGRWEM-DCAQKATOSA-N 0.000 description 1
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- JAYIQMNQDMOBFY-KKUMJFAQSA-N Arg-Glu-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JAYIQMNQDMOBFY-KKUMJFAQSA-N 0.000 description 1
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 1
- CRCCTGPNZUCAHE-DCAQKATOSA-N Arg-His-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 CRCCTGPNZUCAHE-DCAQKATOSA-N 0.000 description 1
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 1
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 1
- FNXCAFKDGBROCU-STECZYCISA-N Arg-Ile-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FNXCAFKDGBROCU-STECZYCISA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 1
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 1
- YLVGUOGAFAJMKP-JYJNAYRXSA-N Arg-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YLVGUOGAFAJMKP-JYJNAYRXSA-N 0.000 description 1
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 1
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 1
- YHZQOSXDTFRZKU-WDSOQIARSA-N Arg-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 YHZQOSXDTFRZKU-WDSOQIARSA-N 0.000 description 1
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 1
- WHLDJYNHXOMGMU-JYJNAYRXSA-N Arg-Val-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WHLDJYNHXOMGMU-JYJNAYRXSA-N 0.000 description 1
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 1
- PFOYSEIHFVKHNF-FXQIFTODSA-N Asn-Ala-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PFOYSEIHFVKHNF-FXQIFTODSA-N 0.000 description 1
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 1
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 1
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 1
- QHBMKQWOIYJYMI-BYULHYEWSA-N Asn-Asn-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QHBMKQWOIYJYMI-BYULHYEWSA-N 0.000 description 1
- HLTLEIXYIJDFOY-ZLUOBGJFSA-N Asn-Cys-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O HLTLEIXYIJDFOY-ZLUOBGJFSA-N 0.000 description 1
- FGYUMGXLCZYNQG-UBHSHLNASA-N Asn-Cys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CS)NC(=O)[C@H](CC(N)=O)N)C(O)=O)=CNC2=C1 FGYUMGXLCZYNQG-UBHSHLNASA-N 0.000 description 1
- QGNXYDHVERJIAY-ACZMJKKPSA-N Asn-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N QGNXYDHVERJIAY-ACZMJKKPSA-N 0.000 description 1
- UEONJSPBTSWKOI-CIUDSAMLSA-N Asn-Gln-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O UEONJSPBTSWKOI-CIUDSAMLSA-N 0.000 description 1
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 1
- VOGCFWDZYYTEOY-DCAQKATOSA-N Asn-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N VOGCFWDZYYTEOY-DCAQKATOSA-N 0.000 description 1
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 1
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 1
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 1
- AWXDRZJQCVHCIT-DCAQKATOSA-N Asn-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O AWXDRZJQCVHCIT-DCAQKATOSA-N 0.000 description 1
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 1
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 1
- LRCIOEVFVGXZKB-BZSNNMDCSA-N Asn-Tyr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LRCIOEVFVGXZKB-BZSNNMDCSA-N 0.000 description 1
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 1
- LMIWYCWRJVMAIQ-NHCYSSNCSA-N Asn-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N LMIWYCWRJVMAIQ-NHCYSSNCSA-N 0.000 description 1
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 1
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 1
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 1
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 1
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 1
- SCQIQCWLOMOEFP-DCAQKATOSA-N Asp-Leu-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SCQIQCWLOMOEFP-DCAQKATOSA-N 0.000 description 1
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 1
- AKKUDRZKFZWPBH-SRVKXCTJSA-N Asp-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N AKKUDRZKFZWPBH-SRVKXCTJSA-N 0.000 description 1
- NONWUQAWAANERO-BZSNNMDCSA-N Asp-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 NONWUQAWAANERO-BZSNNMDCSA-N 0.000 description 1
- HICVMZCGVFKTPM-BQBZGAKWSA-N Asp-Pro-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HICVMZCGVFKTPM-BQBZGAKWSA-N 0.000 description 1
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 1
- 108010083946 Asp-Tyr-Leu-Lys Proteins 0.000 description 1
- BPAUXFVCSYQDQX-JRQIVUDYSA-N Asp-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)O)N)O BPAUXFVCSYQDQX-JRQIVUDYSA-N 0.000 description 1
- ALMIMUZAWTUNIO-BZSNNMDCSA-N Asp-Tyr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ALMIMUZAWTUNIO-BZSNNMDCSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- 206010003805 Autism Diseases 0.000 description 1
- 208000020706 Autistic disease Diseases 0.000 description 1
- 206010061692 Benign muscle neoplasm Diseases 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 108700031361 Brachyury Proteins 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 238000011357 CAR T-cell therapy Methods 0.000 description 1
- 101150017501 CCR5 gene Proteins 0.000 description 1
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- 101150066398 CXCR4 gene Proteins 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 102000000844 Cell Surface Receptors Human genes 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- KKZHXOOZHFABQQ-UWJYBYFXSA-N Cys-Ala-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKZHXOOZHFABQQ-UWJYBYFXSA-N 0.000 description 1
- YZFCGHIBLBDZDA-ZLUOBGJFSA-N Cys-Asp-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YZFCGHIBLBDZDA-ZLUOBGJFSA-N 0.000 description 1
- XMVZMBGFIOQONW-GARJFASQSA-N Cys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N)C(=O)O XMVZMBGFIOQONW-GARJFASQSA-N 0.000 description 1
- ALTQTAKGRFLRLR-GUBZILKMSA-N Cys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N ALTQTAKGRFLRLR-GUBZILKMSA-N 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 206010012335 Dependence Diseases 0.000 description 1
- 238000009007 Diagnostic Kit Methods 0.000 description 1
- 101800001467 Envelope glycoprotein E2 Proteins 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000724791 Filamentous phage Species 0.000 description 1
- 238000012413 Fluorescence activated cell sorting analysis Methods 0.000 description 1
- 208000001914 Fragile X syndrome Diseases 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 241000713813 Gibbon ape leukemia virus Species 0.000 description 1
- WQWMZOIPXWSZNE-WDSKDSINSA-N Gln-Asp-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O WQWMZOIPXWSZNE-WDSKDSINSA-N 0.000 description 1
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 1
- BLOXULLYFRGYKZ-GUBZILKMSA-N Gln-Glu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BLOXULLYFRGYKZ-GUBZILKMSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- ZNTDJIMJKNNSLR-RWRJDSDZSA-N Gln-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZNTDJIMJKNNSLR-RWRJDSDZSA-N 0.000 description 1
- HHQCBFGKQDMWSP-GUBZILKMSA-N Gln-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HHQCBFGKQDMWSP-GUBZILKMSA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- WEAVZFWWIPIANL-SRVKXCTJSA-N Gln-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N WEAVZFWWIPIANL-SRVKXCTJSA-N 0.000 description 1
- DQLVHRFFBQOWFL-JYJNAYRXSA-N Gln-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)O DQLVHRFFBQOWFL-JYJNAYRXSA-N 0.000 description 1
- KLKYKPXITJBSNI-CIUDSAMLSA-N Gln-Met-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O KLKYKPXITJBSNI-CIUDSAMLSA-N 0.000 description 1
- UESYBOXFJWJVSB-AVGNSLFASA-N Gln-Phe-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O UESYBOXFJWJVSB-AVGNSLFASA-N 0.000 description 1
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 1
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 1
- MFORDNZDKAVNSR-SRVKXCTJSA-N Gln-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O MFORDNZDKAVNSR-SRVKXCTJSA-N 0.000 description 1
- SXFPZRRVWSUYII-KBIXCLLPSA-N Gln-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N SXFPZRRVWSUYII-KBIXCLLPSA-N 0.000 description 1
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 1
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 1
- RONJIBWTGKVKFY-HTUGSXCWSA-N Gln-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O RONJIBWTGKVKFY-HTUGSXCWSA-N 0.000 description 1
- CMFBOXUBWMZZMD-BPUTZDHNSA-N Gln-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N CMFBOXUBWMZZMD-BPUTZDHNSA-N 0.000 description 1
- WIMVKDYAKRAUCG-IHRRRGAJSA-N Gln-Tyr-Glu Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O WIMVKDYAKRAUCG-IHRRRGAJSA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 1
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 1
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 1
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 1
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 1
- ZXLZWUQBRYGDNS-CIUDSAMLSA-N Glu-Cys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXLZWUQBRYGDNS-CIUDSAMLSA-N 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- NUSWUSKZRCGFEX-FXQIFTODSA-N Glu-Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O NUSWUSKZRCGFEX-FXQIFTODSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- UHVIQGKBMXEVGN-WDSKDSINSA-N Glu-Gly-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UHVIQGKBMXEVGN-WDSKDSINSA-N 0.000 description 1
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 1
- DRLVXRQFROIYTD-GUBZILKMSA-N Glu-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N DRLVXRQFROIYTD-GUBZILKMSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- YVYVMJNUENBOOL-KBIXCLLPSA-N Glu-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N YVYVMJNUENBOOL-KBIXCLLPSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- PDLGMYVCPJOYAR-DKIMLUQUSA-N Glu-Leu-Phe-Ala Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 PDLGMYVCPJOYAR-DKIMLUQUSA-N 0.000 description 1
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 1
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 1
- CHDWDBPJOZVZSE-KKUMJFAQSA-N Glu-Phe-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CHDWDBPJOZVZSE-KKUMJFAQSA-N 0.000 description 1
- MIIGESVJEBDJMP-FHWLQOOXSA-N Glu-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 MIIGESVJEBDJMP-FHWLQOOXSA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 1
- QVXWAFZDWRLXTI-NWLDYVSISA-N Glu-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QVXWAFZDWRLXTI-NWLDYVSISA-N 0.000 description 1
- QOOFKCCZZWTCEP-AVGNSLFASA-N Glu-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QOOFKCCZZWTCEP-AVGNSLFASA-N 0.000 description 1
- XOEKMEAOMXMURD-JYJNAYRXSA-N Glu-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O XOEKMEAOMXMURD-JYJNAYRXSA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- QIZJOTQTCAGKPU-KWQFWETISA-N Gly-Ala-Tyr Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 QIZJOTQTCAGKPU-KWQFWETISA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 1
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- VUUOMYFPWDYETE-WDSKDSINSA-N Gly-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN VUUOMYFPWDYETE-WDSKDSINSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- ORXZVPZCPMKHNR-IUCAKERBSA-N Gly-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 ORXZVPZCPMKHNR-IUCAKERBSA-N 0.000 description 1
- HPAIKDPJURGQLN-KBPBESRZSA-N Gly-His-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 HPAIKDPJURGQLN-KBPBESRZSA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- VLIJYPMATZSOLL-YUMQZZPRSA-N Gly-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN VLIJYPMATZSOLL-YUMQZZPRSA-N 0.000 description 1
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 1
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 1
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 1
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 1
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 102000004457 Granulocyte-Macrophage Colony-Stimulating Factor Human genes 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- KYMUEAZVLPRVAE-GUBZILKMSA-N His-Asn-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KYMUEAZVLPRVAE-GUBZILKMSA-N 0.000 description 1
- OEROYDLRVAYIMQ-YUMQZZPRSA-N His-Gly-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O OEROYDLRVAYIMQ-YUMQZZPRSA-N 0.000 description 1
- LBQAHBIVXQSBIR-HVTMNAMFSA-N His-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N LBQAHBIVXQSBIR-HVTMNAMFSA-N 0.000 description 1
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 1
- MJUUWJJEUOBDGW-IHRRRGAJSA-N His-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 MJUUWJJEUOBDGW-IHRRRGAJSA-N 0.000 description 1
- NBWATNYAUVSAEQ-ZEILLAHLSA-N His-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O NBWATNYAUVSAEQ-ZEILLAHLSA-N 0.000 description 1
- LPBWRHRHEIYAIP-KKUMJFAQSA-N His-Tyr-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LPBWRHRHEIYAIP-KKUMJFAQSA-N 0.000 description 1
- 101100118646 Homo sapiens ELANE gene Proteins 0.000 description 1
- 101000851181 Homo sapiens Epidermal growth factor receptor Proteins 0.000 description 1
- 101001057504 Homo sapiens Interferon-stimulated gene 20 kDa protein Proteins 0.000 description 1
- 101001055144 Homo sapiens Interleukin-2 receptor subunit alpha Proteins 0.000 description 1
- 101000851058 Homo sapiens Neutrophil elastase Proteins 0.000 description 1
- 101001109800 Homo sapiens Pro-neuregulin-1, membrane-bound isoform Proteins 0.000 description 1
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 1
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 1
- 101000595467 Homo sapiens T-complex protein 1 subunit gamma Proteins 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 1
- FJWYJQRCVNGEAQ-ZPFDUUQYSA-N Ile-Asn-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N FJWYJQRCVNGEAQ-ZPFDUUQYSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 1
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 1
- BEWFWZRGBDVXRP-PEFMBERDSA-N Ile-Glu-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BEWFWZRGBDVXRP-PEFMBERDSA-N 0.000 description 1
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 1
- YKLOMBNBQUTJDT-HVTMNAMFSA-N Ile-His-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YKLOMBNBQUTJDT-HVTMNAMFSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- RQQCJTLBSJMVCR-DSYPUSFNSA-N Ile-Leu-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N RQQCJTLBSJMVCR-DSYPUSFNSA-N 0.000 description 1
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 1
- RFMDODRWJZHZCR-BJDJZHNGSA-N Ile-Lys-Cys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(O)=O RFMDODRWJZHZCR-BJDJZHNGSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- OWSWUWDMSNXTNE-GMOBBJLQSA-N Ile-Pro-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N OWSWUWDMSNXTNE-GMOBBJLQSA-N 0.000 description 1
- VISRCHQHQCLODA-NAKRPEOUSA-N Ile-Pro-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N VISRCHQHQCLODA-NAKRPEOUSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 1
- DGTOKVBDZXJHNZ-WZLNRYEVSA-N Ile-Thr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N DGTOKVBDZXJHNZ-WZLNRYEVSA-N 0.000 description 1
- VBGCPJBKUXRYDA-DSYPUSFNSA-N Ile-Trp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N VBGCPJBKUXRYDA-DSYPUSFNSA-N 0.000 description 1
- NSPNUMNLZNOPAQ-SJWGOKEGSA-N Ile-Tyr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N NSPNUMNLZNOPAQ-SJWGOKEGSA-N 0.000 description 1
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 1
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 1
- YHFPHRUWZMEOIX-CYDGBPFRSA-N Ile-Val-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)O)N YHFPHRUWZMEOIX-CYDGBPFRSA-N 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 102100037850 Interferon gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 102100027268 Interferon-stimulated gene 20 kDa protein Human genes 0.000 description 1
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 1
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- RFUBXQQFJFGJFV-GUBZILKMSA-N Leu-Asn-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RFUBXQQFJFGJFV-GUBZILKMSA-N 0.000 description 1
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 1
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- UCNNZELZXFXXJQ-BZSNNMDCSA-N Leu-Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCNNZELZXFXXJQ-BZSNNMDCSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- KQFZKDITNUEVFJ-JYJNAYRXSA-N Leu-Phe-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CC=CC=C1 KQFZKDITNUEVFJ-JYJNAYRXSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 1
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 1
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 1
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 1
- ZTPWXNOOKAXPPE-DCAQKATOSA-N Lys-Arg-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N ZTPWXNOOKAXPPE-DCAQKATOSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 1
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- SSJBMGCZZXCGJJ-DCAQKATOSA-N Lys-Asp-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O SSJBMGCZZXCGJJ-DCAQKATOSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- PAMDBWYMLWOELY-SDDRHHMPSA-N Lys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O PAMDBWYMLWOELY-SDDRHHMPSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- KNKJPYAZQUFLQK-IHRRRGAJSA-N Lys-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCCCN)N KNKJPYAZQUFLQK-IHRRRGAJSA-N 0.000 description 1
- OIYWBDBHEGAVST-BZSNNMDCSA-N Lys-His-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OIYWBDBHEGAVST-BZSNNMDCSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 1
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- YXPJCVNIDDKGOE-MELADBBJSA-N Lys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N)C(=O)O YXPJCVNIDDKGOE-MELADBBJSA-N 0.000 description 1
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 1
- UDXSLGLHFUBRRM-OEAJRASXSA-N Lys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCCN)N)O UDXSLGLHFUBRRM-OEAJRASXSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 1
- XGZDDOKIHSYHTO-SZMVWBNQSA-N Lys-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 XGZDDOKIHSYHTO-SZMVWBNQSA-N 0.000 description 1
- XYLSGAWRCZECIQ-JYJNAYRXSA-N Lys-Tyr-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 XYLSGAWRCZECIQ-JYJNAYRXSA-N 0.000 description 1
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 1
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 1
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 1
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 1
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 1
- BWECSLVQIWEMSC-IHRRRGAJSA-N Lys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BWECSLVQIWEMSC-IHRRRGAJSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 1
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000589195 Mesorhizobium loti Species 0.000 description 1
- QGQGAIBGTUJRBR-NAKRPEOUSA-N Met-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCSC QGQGAIBGTUJRBR-NAKRPEOUSA-N 0.000 description 1
- OBVHKUFUDCPZDW-JYJNAYRXSA-N Met-Arg-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OBVHKUFUDCPZDW-JYJNAYRXSA-N 0.000 description 1
- VOOINLQYUZOREH-SRVKXCTJSA-N Met-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N VOOINLQYUZOREH-SRVKXCTJSA-N 0.000 description 1
- NCVJJAJVWILAGI-SRVKXCTJSA-N Met-Gln-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NCVJJAJVWILAGI-SRVKXCTJSA-N 0.000 description 1
- YORIKIDJCPKBON-YUMQZZPRSA-N Met-Glu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YORIKIDJCPKBON-YUMQZZPRSA-N 0.000 description 1
- TZHFJXDKXGZHEN-IHRRRGAJSA-N Met-His-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O TZHFJXDKXGZHEN-IHRRRGAJSA-N 0.000 description 1
- DBXMFHGGHMXYHY-DCAQKATOSA-N Met-Leu-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O DBXMFHGGHMXYHY-DCAQKATOSA-N 0.000 description 1
- CNAGWYQWQDMUGC-IHRRRGAJSA-N Met-Phe-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CNAGWYQWQDMUGC-IHRRRGAJSA-N 0.000 description 1
- SMVTWPOATVIXTN-NAKRPEOUSA-N Met-Ser-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SMVTWPOATVIXTN-NAKRPEOUSA-N 0.000 description 1
- CULGJGUDIJATIP-STQMWFEESA-N Met-Tyr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 CULGJGUDIJATIP-STQMWFEESA-N 0.000 description 1
- JHVNNUIQXOGAHI-KJEVXHAQSA-N Met-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N)O JHVNNUIQXOGAHI-KJEVXHAQSA-N 0.000 description 1
- LBSWWNKMVPAXOI-GUBZILKMSA-N Met-Val-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O LBSWWNKMVPAXOI-GUBZILKMSA-N 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 241000713869 Moloney murine leukemia virus Species 0.000 description 1
- 208000016285 Movement disease Diseases 0.000 description 1
- 101100078999 Mus musculus Mx1 gene Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 201000004458 Myoma Diseases 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 102100033174 Neutrophil elastase Human genes 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 102000002488 Nucleoplasmin Human genes 0.000 description 1
- 240000007019 Oxalis corniculata Species 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 1
- NEHSHYOUIWBYSA-DCPHZVHLSA-N Phe-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=CC=C3)N NEHSHYOUIWBYSA-DCPHZVHLSA-N 0.000 description 1
- LZDIENNKWVXJMX-JYJNAYRXSA-N Phe-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CC=CC=C1 LZDIENNKWVXJMX-JYJNAYRXSA-N 0.000 description 1
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 1
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 1
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 1
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 1
- LLGTYVHITPVGKR-RYUDHWBXSA-N Phe-Gln-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O LLGTYVHITPVGKR-RYUDHWBXSA-N 0.000 description 1
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 1
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 1
- PMKIMKUGCSVFSV-CQDKDKBSSA-N Phe-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N PMKIMKUGCSVFSV-CQDKDKBSSA-N 0.000 description 1
- ISYSEOWLRQKQEQ-JYJNAYRXSA-N Phe-His-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISYSEOWLRQKQEQ-JYJNAYRXSA-N 0.000 description 1
- FXPZZKBHNOMLGA-HJWJTTGWSA-N Phe-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FXPZZKBHNOMLGA-HJWJTTGWSA-N 0.000 description 1
- DNAXXTQSTKOHFO-QEJZJMRPSA-N Phe-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DNAXXTQSTKOHFO-QEJZJMRPSA-N 0.000 description 1
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- RTUWVJVJSMOGPL-KKUMJFAQSA-N Phe-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RTUWVJVJSMOGPL-KKUMJFAQSA-N 0.000 description 1
- ACJULKNZOCRWEI-ULQDDVLXSA-N Phe-Met-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O ACJULKNZOCRWEI-ULQDDVLXSA-N 0.000 description 1
- ROOQMPCUFLDOSB-FHWLQOOXSA-N Phe-Phe-Gln Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CC=CC=C1 ROOQMPCUFLDOSB-FHWLQOOXSA-N 0.000 description 1
- GPLWGAYGROGDEN-BZSNNMDCSA-N Phe-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GPLWGAYGROGDEN-BZSNNMDCSA-N 0.000 description 1
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- 102000012338 Poly(ADP-ribose) Polymerases Human genes 0.000 description 1
- 108010061844 Poly(ADP-ribose) Polymerases Proteins 0.000 description 1
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 1
- 102000029797 Prion Human genes 0.000 description 1
- 108091000054 Prion Proteins 0.000 description 1
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 1
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 1
- KIGGUSRFHJCIEJ-DCAQKATOSA-N Pro-Asp-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O KIGGUSRFHJCIEJ-DCAQKATOSA-N 0.000 description 1
- LQZZPNDMYNZPFT-KKUMJFAQSA-N Pro-Gln-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LQZZPNDMYNZPFT-KKUMJFAQSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 1
- RNEFESSBTOQSAC-DCAQKATOSA-N Pro-Ser-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O RNEFESSBTOQSAC-DCAQKATOSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- IURWWZYKYPEANQ-HJGDQZAQSA-N Pro-Thr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IURWWZYKYPEANQ-HJGDQZAQSA-N 0.000 description 1
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 1
- RSTWKJFWBKFOFC-JYJNAYRXSA-N Pro-Trp-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O RSTWKJFWBKFOFC-JYJNAYRXSA-N 0.000 description 1
- FZXSYIPVAFVYBH-KKUMJFAQSA-N Pro-Tyr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O FZXSYIPVAFVYBH-KKUMJFAQSA-N 0.000 description 1
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- 241000169446 Promethis Species 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 235000011449 Rosa Nutrition 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 241001326539 Schizosaccharomycetes Species 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- GRSLLFZTTLBOQX-CIUDSAMLSA-N Ser-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N GRSLLFZTTLBOQX-CIUDSAMLSA-N 0.000 description 1
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 1
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 1
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 241000589127 Sinorhizobium fredii NGR234 Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 101800001271 Surface protein Proteins 0.000 description 1
- 102100036049 T-complex protein 1 subunit gamma Human genes 0.000 description 1
- 101150088517 TCTA gene Proteins 0.000 description 1
- 208000002903 Thalassemia Diseases 0.000 description 1
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 1
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 1
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 1
- WLDUCKSCDRIVLJ-NUMRIWBASA-N Thr-Gln-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O WLDUCKSCDRIVLJ-NUMRIWBASA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 1
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 1
- AHOLTQCAVBSUDP-PPCPHDFISA-N Thr-Ile-Lys Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)[C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O AHOLTQCAVBSUDP-PPCPHDFISA-N 0.000 description 1
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 1
- WKGAAMOJPMBBMC-IXOXFDKPSA-N Thr-Ser-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WKGAAMOJPMBBMC-IXOXFDKPSA-N 0.000 description 1
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 1
- SBYQHZCMVSPQCS-RCWTZXSCSA-N Thr-Val-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O SBYQHZCMVSPQCS-RCWTZXSCSA-N 0.000 description 1
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 1
- 241000723873 Tobacco mosaic virus Species 0.000 description 1
- 101710183280 Topoisomerase Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- MJBBMTOGSOSAKJ-HJXMPXNTSA-N Trp-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MJBBMTOGSOSAKJ-HJXMPXNTSA-N 0.000 description 1
- BIJDDZBDSJLWJY-PJODQICGSA-N Trp-Ala-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O BIJDDZBDSJLWJY-PJODQICGSA-N 0.000 description 1
- VTHNLRXALGUDBS-BPUTZDHNSA-N Trp-Gln-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VTHNLRXALGUDBS-BPUTZDHNSA-N 0.000 description 1
- GWQUSADRQCTMHN-NWLDYVSISA-N Trp-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O GWQUSADRQCTMHN-NWLDYVSISA-N 0.000 description 1
- NXJZCPKZIKTYLX-XEGUGMAKSA-N Trp-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NXJZCPKZIKTYLX-XEGUGMAKSA-N 0.000 description 1
- HJXOFWKCWLHYIJ-SZMVWBNQSA-N Trp-Lys-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HJXOFWKCWLHYIJ-SZMVWBNQSA-N 0.000 description 1
- KWTRGSQOQHZKIA-PMVMPFDFSA-N Trp-Lys-Tyr Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)CCCCN)C(O)=O)C1=CC=C(O)C=C1 KWTRGSQOQHZKIA-PMVMPFDFSA-N 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 1
- KLGFILUOTCBNLJ-IHRRRGAJSA-N Tyr-Cys-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O KLGFILUOTCBNLJ-IHRRRGAJSA-N 0.000 description 1
- CRHFOYCJGVJPLE-AVGNSLFASA-N Tyr-Gln-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CRHFOYCJGVJPLE-AVGNSLFASA-N 0.000 description 1
- FJKXUIJOMUWCDD-FHWLQOOXSA-N Tyr-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N)O FJKXUIJOMUWCDD-FHWLQOOXSA-N 0.000 description 1
- KEHKBBUYZWAMHL-DZKIICNBSA-N Tyr-Gln-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O KEHKBBUYZWAMHL-DZKIICNBSA-N 0.000 description 1
- AKLNEFNQWLHIGY-QWRGUYRKSA-N Tyr-Gly-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N)O AKLNEFNQWLHIGY-QWRGUYRKSA-N 0.000 description 1
- LFCQXIXJQXWZJI-BZSNNMDCSA-N Tyr-His-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N)O LFCQXIXJQXWZJI-BZSNNMDCSA-N 0.000 description 1
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 1
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 1
- OLYXUGBVBGSZDN-ACRUOGEOSA-N Tyr-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 OLYXUGBVBGSZDN-ACRUOGEOSA-N 0.000 description 1
- JAGGEZACYAAMIL-CQDKDKBSSA-N Tyr-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JAGGEZACYAAMIL-CQDKDKBSSA-N 0.000 description 1
- ZOBLBMGJKVJVEV-BZSNNMDCSA-N Tyr-Lys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O ZOBLBMGJKVJVEV-BZSNNMDCSA-N 0.000 description 1
- PGEFRHBWGOJPJT-KKUMJFAQSA-N Tyr-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O PGEFRHBWGOJPJT-KKUMJFAQSA-N 0.000 description 1
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 1
- SCZJKZLFSSPJDP-ACRUOGEOSA-N Tyr-Phe-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SCZJKZLFSSPJDP-ACRUOGEOSA-N 0.000 description 1
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 1
- KSGKJSFPWSMJHK-JNPHEJMOSA-N Tyr-Tyr-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSGKJSFPWSMJHK-JNPHEJMOSA-N 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- NMANTMWGQZASQN-QXEWZRGKSA-N Val-Arg-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N NMANTMWGQZASQN-QXEWZRGKSA-N 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 1
- MHAHQDBEIDPFQS-NHCYSSNCSA-N Val-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C MHAHQDBEIDPFQS-NHCYSSNCSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 1
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 1
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- SVFRYKBZHUGKLP-QXEWZRGKSA-N Val-Met-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVFRYKBZHUGKLP-QXEWZRGKSA-N 0.000 description 1
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- SUGRIIAOLCDLBD-ZOBUZTSGSA-N Val-Trp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SUGRIIAOLCDLBD-ZOBUZTSGSA-N 0.000 description 1
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 1
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- HMNZFMSWFCAGGW-XPWSMXQVSA-N [3-[hydroxy(2-hydroxyethoxy)phosphoryl]oxy-2-[(e)-octadec-9-enoyl]oxypropyl] (e)-octadec-9-enoate Chemical compound CCCCCCCC\C=C\CCCCCCCC(=O)OCC(COP(O)(=O)OCCO)OC(=O)CCCCCCC\C=C\CCCCCCCC HMNZFMSWFCAGGW-XPWSMXQVSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000000516 activation analysis Methods 0.000 description 1
- 230000004721 adaptive immunity Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 206010064930 age-related macular degeneration Diseases 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010039538 alanyl-glycyl-aspartyl-valine Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 102000009899 alpha Karyopherins Human genes 0.000 description 1
- 108010077099 alpha Karyopherins Proteins 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 210000000612 antigen-presenting cell Anatomy 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 235000009697 arginine Nutrition 0.000 description 1
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 238000012742 biochemical analysis Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 238000010504 bond cleavage reaction Methods 0.000 description 1
- 210000002798 bone marrow cell Anatomy 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 210000004413 cardiac myocyte Anatomy 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 230000008482 dysregulation Effects 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 210000001671 embryonic stem cell Anatomy 0.000 description 1
- 230000012202 endocytosis Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- 101150025688 ggact gene Proteins 0.000 description 1
- 108060003196 globin Proteins 0.000 description 1
- 102000018146 globin Human genes 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 210000003714 granulocyte Anatomy 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 210000002443 helper t lymphocyte Anatomy 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 102000048122 human MX1 Human genes 0.000 description 1
- 102000055650 human NRG1 Human genes 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 229960004717 insulin aspart Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007917 intracranial administration Methods 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 108010077158 leucinyl-arginyl-tryptophan Proteins 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 235000018977 lysine Nutrition 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 208000002780 macular degeneration Diseases 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 210000000066 myeloid cell Anatomy 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 230000001613 neoplastic effect Effects 0.000 description 1
- 210000001178 neural stem cell Anatomy 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 230000000626 neurodegenerative effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- VOMXSOIBEJBQNF-UTTRGDHVSA-N novorapid Chemical compound C([C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CS)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O)C1=CC=C(O)C=C1.C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 VOMXSOIBEJBQNF-UTTRGDHVSA-N 0.000 description 1
- 230000005937 nuclear translocation Effects 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 108060005597 nucleoplasmin Proteins 0.000 description 1
- 230000009438 off-target cleavage Effects 0.000 description 1
- 238000012235 off-target genome editing Methods 0.000 description 1
- 229940046166 oligodeoxynucleotide Drugs 0.000 description 1
- 230000000771 oncological effect Effects 0.000 description 1
- 238000011275 oncology therapy Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000004409 osteocyte Anatomy 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 239000000816 peptidomimetic Substances 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 1
- 108010025488 pinealon Proteins 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 238000012514 protein characterization Methods 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000007347 radical substitution reaction Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 150000003290 ribose derivatives Chemical class 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 201000000980 schizophrenia Diseases 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 208000010648 susceptibility to HIV infection Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 108700029760 synthetic LTSP Proteins 0.000 description 1
- 238000007910 systemic administration Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 230000005909 tumor killing Effects 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241000712461 unidentified influenza virus Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
본 발명은 서열번호 1의 아미노산 서열과 적어도 95% 동일성을 갖는 서열을 포함하는 CRISPR 뉴클레아제, 또는 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 핵산 분자를 포함하는 비-자연 발생 조성물을 제공한다.
Description
본 출원은 2021년 12월 6일자로 출원된 미국 가출원 제63/286,855호, 2021년 6월 24일자로 출원된 미국 가출원 제63/214,506호, 및 2021년 2월 8일자로 출원된 미국 가출원 제63/147,166호의 이익을 주장하며, 이의 각각의 내용은 본 명세서에 참조에 의해 원용된다.
본 출원 전반에 걸쳐, 괄호 안에 언급된 것을 포함하여, 다양한 간행물이 언급된다. 본 출원에 전문이 언급된 모든 간행물의 개시내용은 본 발명이 속하는 기술 분야 및 본 발명과 함께 이용될 수 있는 당업계의 특징에 대한 추가적인 설명을 제공하기 위해 본 출원에 전문이 참조에 의해 본 명세서에 원용된다.
서열 목록에 대한 참조
본 출원은 파일의 크기가 86 킬로바이트이고, MS-윈도우와 운영 체제가 호환되는 IBM-PC 머신 형식으로 2022년 2월 6일자로 형성된, 명칭이 "220207_91677-A-PCT_Sequence_Listing_AWG.txt"인 파일에 존재하는 뉴클레오타이드 서열을 참조에 의해 원용하며, 이는 본 출원의 일부로 2022년 2월 7일자로 제출된 텍스트 파일에 포함되어 있다.
본 발명의 분야
본 발명은 특히 게놈 편집을 위한 조성물 및 방법에 관한 것이다.
박테리아 및 고세균 적응 면역의 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복 서열(Clustered Regularly Interspaced Short Palindromic Repeat; CRISPR) 시스템은 단백질 조성 및 게놈 유전자좌 아키텍처의 매우 다양한 다양성을 나타낸다. CRISPR 시스템은 연구 및 게놈 조작을 위한 중요한 도구가 되었다. 그럼에도 불구하고, CRISPR 시스템의 많은 세부사항이 결정되지 않았으며, CRISPR 뉴클레아제의 적용 가능성은 서열 특이성 요건, 발현, 또는 전달 문제에 의해 제한될 수 있다. 상이한 CRISPR 뉴클레아제는 크기, PAM 부위, 표적내(on target) 활성, 특이성, 절단 패턴(예를 들어, 블런트(blunt), 엇갈린(staggered) 말단), 및 절단 후 삽입결실(indel) 형성의 두드러진 패턴과 같은 다양한 특성을 갖는다. 상이한 특성 세트가 상이한 적용에 유용할 수 있다. 예를 들어, 일부 CRISPR 뉴클레아제는 PAM 부위의 제한으로 인해 다른 CRISPR 뉴클레아제가 할 수 없는 특정 게놈 유전자좌를 표적화할 수 있다. 추가적으로, 현재 사용 중인 일부 CRISPR 뉴클레아제는 생체 내 적용 가능성을 제한할 수 있는 사전 면역(pre-immunity)을 나타낸다. 문헌[Charlesworth et al., Nature Medicine (2019) 및 Wagner et al., Nature Medicine (2019)]을 참조한다. 따라서, 신규 CRISPR 뉴클레아제의 발현, 조작 및 개선이 중요하다.
게놈 조작, 후생학적 조작, 게놈 표적화, 세포의 게놈 편집, 및/또는 시험관내 진단에 이용될 수 있는 조성물 및 방법이 본 명세서에 개시되어 있다.
개시된 조성물은 게놈 DNA 서열을 변형시키는 데 이용될 수 있다. 본 명세서에서 사용되는 바와 같이, 게놈 DNA는 관심이 있는 세포 또는 세포들에 존재하는 선형 및/또는 염색체 DNA 및/또는 플라스미드 또는 다른 염색체외 DNA 서열을 지칭한다. 일부 실시형태에서, 관심이 있는 세포는 진핵 세포이다. 일부 실시형태에서, 관심이 있는 세포는 원핵 세포이다. 일부 실시형태에서, 방법은 게놈 DNA 서열의 미리 결정된 표적 부위에서 이중-가닥 파손(DSB)을 생성하여, 게놈의 표적 부위(들)에서 DNA 서열의 돌연변이, 삽입, 및/또는 결실을 초래한다.
따라서, 일부 실시형태에서, 조성물은 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복 서열(CRISPR) 뉴클레아제를 포함한다. 일부 실시형태에서, CRISPR 뉴클레아제는 CRISPR-연관 단백질이다.
OMNI-103 CRISPR 뉴클레아제
본 발명의 구현예는 표 1에 제공된 바와 같이 "OMNI-103" 뉴클레아제로 명명된 CRISPR 뉴클레아제를 제공한다.
본 발명은 (i) 서열번호 1의 아미노산 서열과 적어도 95% 동일성을 갖는 CRISPR 뉴클레아제 또는 서열이 서열번호 2 내지 3의 핵산 서열과 적어도 95% 동일성을 갖는 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 핵산 분자를 포함하는 조성물 및 (ii) 표적 DNA의 서열에 상보적인 뉴클레오타이드 서열을 포함하는, DNA-표적화 RNA 분자, 또는 DNA-표적화 RNA 분자를 인코딩하는 DNA 폴리뉴클레오타이드를 세포에 도입하는 단계를 포함하는, 포유동물 세포의 게놈 내의 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법을 제공한다.
본 발명은 또한,
a) 직접 반복 서열에 연결된 가이드 서열 부분을 포함하는 하나 이상의 RNA 분자(여기서, 가이드 서열은 표적 서열열과 혼성화할 수 있음), 또는 하나 이상의 RNA 분자를 인코딩하는 하나 이상의 뉴클레오타이드 서열; 및
b) 서열번호 1의 아미노산 서열과 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는 CRISPR 뉴클레아제 또는 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 핵산 분자
를 포함하는 CRISPR 연관 시스템을 포함하는 비-자연 발생 조성물을 제공하며, 여기서 하나 이상의 RNA 분자는 표적 서열에 혼성화하고, 표적 서열은 프로토스페이서 인접 모티프(Protospacer Adjacent Motif: PAM)의 상보적 서열에 인접하며, 하나 이상의 RNA 분자는 RNA-가이드 뉴클레아제와 복합체를 형성한다.
본 발명은 또한
a) 서열번호 1의 아미노산 서열과 적어도 95% 동일성을 갖는 서열을 포함하는 CRISPR 뉴클레아제 또는 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 핵산 분자; 및
b)
i) CRISPR 뉴클레아제와 상호작용할 수 있는/CRISPR 뉴클레아제에 결합할 수 있는 뉴클레아제-결합 RNA 뉴클레오타이드 서열; 및
ii) 표적 DNA 서열의 서열에 상보적인 서열을 포함하는 DNA-표적화 RNA 뉴클레오타이드 서열
중 적어도 하나를 포함하는, 하나 이상의 RNA 분자, 또는 하나 이상의 RNA 분자를 인코딩하는 하나 이상의 DNA 폴리뉴클레오타이드
를 포함하는 비-자연 발생 조성물을 제공하며, 여기서 CRISPR 뉴클레아제는 하나 이상의 RNA 분자와 복합체화하여 표적 DNA 서열과 혼성화할 수 있는 복합체를 형성할 수 있다.
OMNI-103 CRISPR 뉴클레아제-RNA 복합체
본 발명은 또한 비-자연 발생 RNA 분자를 포함하는 조성물을 제공하며, RNA 분자는 crRNA 반복 서열 부분 및 가이드 서열 부분을 포함하되, RNA 분자는 tracrRNA 서열의 존재 하에 OMNI-103 뉴클레아제와 복합체를 형성하고 상기 뉴클레아제를 DNA 표적 부위에 대해 표적화하며, tracrRNA 서열은 RNA 분자의 tracrRNA 부분 또는 제2 RNA 분자의 tracrRNA 부분에 의해 인코딩된다.
본 발명은 또한 비-자연 발생 RNA 분자를 포함하는 조성물을 제공하며, RNA 분자는 RNA 스캐폴드 부분을 포함하고, RNA 스캐폴드 부분은 다음 구조를 가지며:
crRNA 반복 서열 부분 - tracrRNA 부분;
여기서 RNA 스캐폴드 부분은 OMNI-103 CRISPR 뉴클레아제와 복합체를 형성하고 상기 뉴클레아제를 RNA 분자의 가이드 서열 부분에 대해 상보성을 갖는 DNA 표적 부위에 대해 표적화한다.
OMNI-103 CRISPR 뉴클레아제 및 OMNI-103 CRISPR 뉴클레아제에 특이적으로 결합하고 이를 활성화시킬 수 있는 스캐폴드 부분을 포함하는 비-자연 발생 RNA를 사용하여 RNA 분자의 가이드 서열 부분(또한 RNA 스페이서 부분으로도 지칭됨)에 기반한 DNA 표적 부위를 표적화하는 게놈 조작, 후생학적 조작, 게놈 표적화, 세포의 게놈 편집, 및/또는 시험관내 진단에 이용될 수 있는 조성물 및 방법이 본 명세서에 개시되어 있다.
개시된 조성물은 게놈 DNA 서열을 변형시키는 데 이용될 수 있다. 본 명세서에서 사용되는 바와 같이, 게놈 DNA는 관심이 있는 세포 또는 세포들에 존재하는 선형 및/또는 염색체 DNA 및/또는 플라스미드 또는 다른 염색체외 DNA 서열을 지칭한다. 일부 실시형태에서, 관심이 있는 세포는 진핵 세포이다. 일부 실시형태에서, 관심이 있는 세포는 원핵 세포이다. 일부 실시형태에서, 방법은 게놈 DNA 서열의 미리 결정된 표적 부위에서 이중-가닥 파손(DSB)을 생성하여, 게놈의 표적 부위(들)에서 DNA 서열의 돌연변이, 삽입, 및/또는 결실을 초래한다.
도 1a 내지 도 1b: OMNI-103과 호환되는 단일 가이드 RNA(sgRNA)(crRNA-tracrRNA)인 sgRNA12의 예측된 2차 구조. 도 1a: 언급된 sgRNA의 crRNA 및 tracrRNA 부분을 갖는 OMNI-103 V1(도 1a) 및 V2(도 1b)에 대한 crRNA-tracrRNA 이중나선(duplex)의 표시(표 2 참조).
도 2a 내지 도 2c: U2OS 세포에서 RNP로서 OMNI-103 활성 및 스페이서 최적화. OMNI-103 뉴클레아제를 과발현시키고 정제하였다. 정제된 단백질을 합성 sgRNA와 복합체화하여 RNP를 형성하였다. (도 2a) 시험관내 분석의 경우, 스페이서 길이가 20 내지 25 bp인 감소량의 RNP(4, 2, 1 및 0.5 pmol)(표 6에 열거됨)를 40 ng PDCD1 DNA 표적 주형과 함께 인큐베이션하였다. 선형 주형을 절단하는 능력에 의해 활성을 검증하였다. (도 2b 내지 도 2c) 시험관내 분석에서(도 2b) 스페이서 길이(20 내지 25개 뉴클레오타이드)의 PDCD1 S40을 갖는 RNP를 U2OS 세포주에 전기천공하고 편집 수준(삽입결실)을 NGS로 측정하였다. (도 2c) U2OS 세포에서 RNP로서 OMNI-103에 대한 활성 분석: PDCD1S40, TRACS35, TRACS33 및 B2M S12(22 bp 스페이서 길이, 표 6)를 갖는 RNP를 U2OS 세포주에 전기천공하고 편집 수준(삽입결실)을 차세대 염기서열 분석기법(next generation sequencing: NGS)으로 측정하였다.
도 3a 내지 도 3b. 비편향 생화학적 분석(가이드-seq)에 의한 OMNI-103 표적외 분석. PDCD1 S40 및 TRAC S35 가이드 분자를 갖는 RNP(표 6)를 dsODN과 혼합하고 U2OS 세포주에 전기천공하였다. (도 3a) 편집 수준(삽입결실) 및 dsODN 통합을 NGS로 측정하였다. (도 3b) 가이드 seq 분석은 PDCD1 S40 부위(서열번호 133) 또는 TRAC S35 부위(서열번호 134)에서 어떠한 비표적(off-target)도 나타내지 않았다.
도 4a 내지 도 4b: OMNI 뉴클레아제에 대한 시험관내 TXTL PAM 고갈 결과. PAM 로고는 고갈된 부위의 비율의 도식적 표현이다(상단 패널). PAM 플라스미드 라이브러리로부터 특정 PAM 서열(하단 패널, 좌측)의 고갈률(하단 패널, 우측)을 TXTL 반응의 NGS에 따라 계산하였다. 각각의 OMNI에 대한 계산은 PAM 라이브러리의 8 bp 서열에 따라 4N 창을 기반으로 한다. 반응 조건 하에서 테스트된 OMNI의 필요한 PAM 및 뉴클레아제 활성 수준은 고갈률로부터 유추된다. 다음에 대한 시험관내 PAM 고갈 결과: 도 4a: sgRNA 12를 갖는 OMNI-103. 도 4b: sgRNA 32를 갖는 OMNI-103.
도 5a 내지 도 5c: OMNI-103 sgRNA 버전은 HeLa 세포에서의 편집을 나타낸다. OMNI-103에 대한 sgRNA를 단축하기 위해, 스캐폴드의 4가지 상이한 버전을 테스트하였다. 이들 버전은 상부 줄기 및/또는 말단 헤어핀에서 결실을 포함하였다. 도 5a: OMNI-103용으로 설계된 상이한 sgRNA의 다중 서열 정렬. 구체적으로, OMNI-103 sgRNA v2 스캐폴드(107개 뉴클레오타이드, 서열번호 16으로 열거된 RNA)와 더 짧은 sgRNA 스캐폴드 버전 OMNI-103.1(101개 뉴클레오타이드, 서열번호 33으로 열거된 RNA), OMNI-103.2(85 뉴클레오타이드, 서열번호 34로 열거된 RNA), OMNI-103.3(79개 뉴클레오타이드, 서열번호 35로 열거된 RNA), 및 OMNI-103.4(95개 뉴클레오타이드, 서열번호 36으로 열거된 RNA)의 정렬. 도 5b: 더 짧은 버전을 형성하는 주형으로 사용된 sgRNA 103.v2의 예측된 구조(더 짧은 버전을 형성하는 데 사용된 결실이 표시되어 있음). 도 5c: 차세대 염기서열 분석기법(NGS)에 의해 결정된 바와 같이 상이한 스캐폴드를 갖는 OMNI-103 CRISPR 뉴클레아제의 편집 활성. 2개 부위는 테스트한 TRAC S91 및 PDCD S40이었다. 형질감염 효율을 플라스미드가 리포터 형광 단백질(mCherry)을 발현함에 따라 FACS에 의해 결정하였다.
도 6a 내지 도 6f. 표 3에 열거된 sgRNA의 예측된 2차 구조. 도 6a: 스캐폴드 V2. 도 6b: 스캐폴드 V2.1. 도 6c: 스캐폴드 V2.2. 도 6d: 스캐폴드 V2.3. 도 6e: 스캐폴드 V2.4. 도 6f: 스캐폴드 V2.5.
도 7. 상이한 sgRNA 스캐폴드를 갖는 HeLa 세포에서의 OMNI-103 편집 활성(표 3). HeLa 세포를 TRAC-S91 또는 PDCD-S40을 표적화하는 sgRNA 플라스미드 및 OMNI-103으로 형질감염시켰다. 편집 활성을 차세대 염기서열 분석기법 결과(막대)를 기반으로 계산하였고, 형질감염 효율을 mCherry 발현의 FACS 분석을 기반으로 하였다. 3개 기술 복제물의 평균 및 표준 편차가 제시되어 있다.
도 8. U2OS에서의 활성. U2OS 세포를 TRAC S35 및 B2M S12를 표적화하는 sgRNA(RNP) 및 OMNI-103으로 전기천공하였다. 편집 활성을 차세대 염기서열 분석기법(NGS) 결과를 기반으로 계산하였다. 3개 기술 복제물의 평균 및 표준 편차가 제시되어 있다.
도 9. 1차 T 세포에서의 활성. 1차 T 세포를 제조업체의 프로토콜에 따라 PBMC로부터 단리하고 활성화시켰다(Miltenyi #130-096-535, #130-091-441). 활성화된 T 세포를 TRAC-s35 및 B2M-s12를 표적화하는 sgRNA(RNP) 및 OMNI-103으로 전기천공하였다. 팔(8)일 후, 세포를 TCR 및 B2M 발현 수준에 대해 유세포 분석으로 측정하였다. 분석을 위해, 살아있는 세포 및 CD3-양성 세포만을 계수하였다. 제시된 결과는 대표적인 것이고 모두 유사한 결과를 나타낸 3개 T 세포 공여체 중 하나이다.
도 10. T 세포 활성화 분석. 절단 활성 분석에 사용된 공여체 샘플 세포를 72시간 동안 비드로 활성화시켰고, FACS로 측정된 바와 같이 85% 1차 T 세포 활성화를 나타내었다(CD3+CD25+ 세포).
도 11. RNA 스캐폴드의 대표적인 예. 예시적인 RNA 스캐폴드 부분은 테트라루프(tetraloop)에 의해 tracrRNA 부분에 연결된 crRNA 부분을 포함한다. crRNA 부분은 crRNA 반복 서열을 포함한다. tracrRNA 부분은 tracrRNA 항-반복 서열 및 추가적인 tracrRNA 절편을 포함한다. RNA 분자는, RNA 분자가 단일-가이드 RNA 분자로서 기능하도록, crRNA 반복 서열에 연결된 가이드 서열 부분(즉, RNA 스페이서)을 더 포함할 수 있다.
도 2a 내지 도 2c: U2OS 세포에서 RNP로서 OMNI-103 활성 및 스페이서 최적화. OMNI-103 뉴클레아제를 과발현시키고 정제하였다. 정제된 단백질을 합성 sgRNA와 복합체화하여 RNP를 형성하였다. (도 2a) 시험관내 분석의 경우, 스페이서 길이가 20 내지 25 bp인 감소량의 RNP(4, 2, 1 및 0.5 pmol)(표 6에 열거됨)를 40 ng PDCD1 DNA 표적 주형과 함께 인큐베이션하였다. 선형 주형을 절단하는 능력에 의해 활성을 검증하였다. (도 2b 내지 도 2c) 시험관내 분석에서(도 2b) 스페이서 길이(20 내지 25개 뉴클레오타이드)의 PDCD1 S40을 갖는 RNP를 U2OS 세포주에 전기천공하고 편집 수준(삽입결실)을 NGS로 측정하였다. (도 2c) U2OS 세포에서 RNP로서 OMNI-103에 대한 활성 분석: PDCD1S40, TRACS35, TRACS33 및 B2M S12(22 bp 스페이서 길이, 표 6)를 갖는 RNP를 U2OS 세포주에 전기천공하고 편집 수준(삽입결실)을 차세대 염기서열 분석기법(next generation sequencing: NGS)으로 측정하였다.
도 3a 내지 도 3b. 비편향 생화학적 분석(가이드-seq)에 의한 OMNI-103 표적외 분석. PDCD1 S40 및 TRAC S35 가이드 분자를 갖는 RNP(표 6)를 dsODN과 혼합하고 U2OS 세포주에 전기천공하였다. (도 3a) 편집 수준(삽입결실) 및 dsODN 통합을 NGS로 측정하였다. (도 3b) 가이드 seq 분석은 PDCD1 S40 부위(서열번호 133) 또는 TRAC S35 부위(서열번호 134)에서 어떠한 비표적(off-target)도 나타내지 않았다.
도 4a 내지 도 4b: OMNI 뉴클레아제에 대한 시험관내 TXTL PAM 고갈 결과. PAM 로고는 고갈된 부위의 비율의 도식적 표현이다(상단 패널). PAM 플라스미드 라이브러리로부터 특정 PAM 서열(하단 패널, 좌측)의 고갈률(하단 패널, 우측)을 TXTL 반응의 NGS에 따라 계산하였다. 각각의 OMNI에 대한 계산은 PAM 라이브러리의 8 bp 서열에 따라 4N 창을 기반으로 한다. 반응 조건 하에서 테스트된 OMNI의 필요한 PAM 및 뉴클레아제 활성 수준은 고갈률로부터 유추된다. 다음에 대한 시험관내 PAM 고갈 결과: 도 4a: sgRNA 12를 갖는 OMNI-103. 도 4b: sgRNA 32를 갖는 OMNI-103.
도 5a 내지 도 5c: OMNI-103 sgRNA 버전은 HeLa 세포에서의 편집을 나타낸다. OMNI-103에 대한 sgRNA를 단축하기 위해, 스캐폴드의 4가지 상이한 버전을 테스트하였다. 이들 버전은 상부 줄기 및/또는 말단 헤어핀에서 결실을 포함하였다. 도 5a: OMNI-103용으로 설계된 상이한 sgRNA의 다중 서열 정렬. 구체적으로, OMNI-103 sgRNA v2 스캐폴드(107개 뉴클레오타이드, 서열번호 16으로 열거된 RNA)와 더 짧은 sgRNA 스캐폴드 버전 OMNI-103.1(101개 뉴클레오타이드, 서열번호 33으로 열거된 RNA), OMNI-103.2(85 뉴클레오타이드, 서열번호 34로 열거된 RNA), OMNI-103.3(79개 뉴클레오타이드, 서열번호 35로 열거된 RNA), 및 OMNI-103.4(95개 뉴클레오타이드, 서열번호 36으로 열거된 RNA)의 정렬. 도 5b: 더 짧은 버전을 형성하는 주형으로 사용된 sgRNA 103.v2의 예측된 구조(더 짧은 버전을 형성하는 데 사용된 결실이 표시되어 있음). 도 5c: 차세대 염기서열 분석기법(NGS)에 의해 결정된 바와 같이 상이한 스캐폴드를 갖는 OMNI-103 CRISPR 뉴클레아제의 편집 활성. 2개 부위는 테스트한 TRAC S91 및 PDCD S40이었다. 형질감염 효율을 플라스미드가 리포터 형광 단백질(mCherry)을 발현함에 따라 FACS에 의해 결정하였다.
도 6a 내지 도 6f. 표 3에 열거된 sgRNA의 예측된 2차 구조. 도 6a: 스캐폴드 V2. 도 6b: 스캐폴드 V2.1. 도 6c: 스캐폴드 V2.2. 도 6d: 스캐폴드 V2.3. 도 6e: 스캐폴드 V2.4. 도 6f: 스캐폴드 V2.5.
도 7. 상이한 sgRNA 스캐폴드를 갖는 HeLa 세포에서의 OMNI-103 편집 활성(표 3). HeLa 세포를 TRAC-S91 또는 PDCD-S40을 표적화하는 sgRNA 플라스미드 및 OMNI-103으로 형질감염시켰다. 편집 활성을 차세대 염기서열 분석기법 결과(막대)를 기반으로 계산하였고, 형질감염 효율을 mCherry 발현의 FACS 분석을 기반으로 하였다. 3개 기술 복제물의 평균 및 표준 편차가 제시되어 있다.
도 8. U2OS에서의 활성. U2OS 세포를 TRAC S35 및 B2M S12를 표적화하는 sgRNA(RNP) 및 OMNI-103으로 전기천공하였다. 편집 활성을 차세대 염기서열 분석기법(NGS) 결과를 기반으로 계산하였다. 3개 기술 복제물의 평균 및 표준 편차가 제시되어 있다.
도 9. 1차 T 세포에서의 활성. 1차 T 세포를 제조업체의 프로토콜에 따라 PBMC로부터 단리하고 활성화시켰다(Miltenyi #130-096-535, #130-091-441). 활성화된 T 세포를 TRAC-s35 및 B2M-s12를 표적화하는 sgRNA(RNP) 및 OMNI-103으로 전기천공하였다. 팔(8)일 후, 세포를 TCR 및 B2M 발현 수준에 대해 유세포 분석으로 측정하였다. 분석을 위해, 살아있는 세포 및 CD3-양성 세포만을 계수하였다. 제시된 결과는 대표적인 것이고 모두 유사한 결과를 나타낸 3개 T 세포 공여체 중 하나이다.
도 10. T 세포 활성화 분석. 절단 활성 분석에 사용된 공여체 샘플 세포를 72시간 동안 비드로 활성화시켰고, FACS로 측정된 바와 같이 85% 1차 T 세포 활성화를 나타내었다(CD3+CD25+ 세포).
도 11. RNA 스캐폴드의 대표적인 예. 예시적인 RNA 스캐폴드 부분은 테트라루프(tetraloop)에 의해 tracrRNA 부분에 연결된 crRNA 부분을 포함한다. crRNA 부분은 crRNA 반복 서열을 포함한다. tracrRNA 부분은 tracrRNA 항-반복 서열 및 추가적인 tracrRNA 절편을 포함한다. RNA 분자는, RNA 분자가 단일-가이드 RNA 분자로서 기능하도록, crRNA 반복 서열에 연결된 가이드 서열 부분(즉, RNA 스페이서)을 더 포함할 수 있다.
본 발명의 일부 양태에 따르면, 개시된 조성물은 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복 서열(CRISPR) 뉴클레아제 및/또는 이를 인코딩하는 서열을 포함하는 핵산 분자를 포함한다.
표 1은 신규 CRISPR 뉴클레아제뿐만 아니라, 뉴클레아제를 닉카제(nickase) 또는 촉매적으로 사멸된(catalytically dead) 뉴클레아제로 전환시키는 각각의 뉴클레아제 내의 하나 이상의 위치에서의 치환을 열거한다.
표 2는 각각 열거된 CRISPR 뉴클레아제와 호환 가능한, crRNA, tracrRNA, 및 단일-가이드 RNA(sgRNA) 서열, 및 crRNA, tracrRNA, 및 sgRNA 서열의 부분을 제공한다. 따라서, crRNA:tracrRNA 복합체의 일부로서 표 2에 열거된 OMNI 뉴클레아제에 결합하고 이를 표적화할 수 있는 crRNA 분자는 표 2에 열거된 임의의 crRNA 서열을 포함할 수 있다. 유사하게, crRNA:tracrRNA 복합체의 일부로서 표 2에 열거된 OMNI 뉴클레아제에 결합하고 이를 표적화할 수 있는 tracrRNA 분자는 표 2에 열거된 임의의 tracrRNA 서열을 포함할 수 있다. 또한, 표 2에 열거된 OMNI 뉴클레아제에 결합하고 이를 표적화할 수 있는 단일-가이드 RNA 분자는 표 2에 열거된 임의의 서열을 포함할 수 있다.
예를 들어, OMNI-103 뉴클레아제의 crRNA 분자(서열번호 1)는 서열번호 4 내지 7 및 18 내지 21 중 어느 하나의 서열을 포함할 수 있고; OMNI-103 뉴클레아제의 tracrRNA 분자는 서열번호 8 내지 14, 17, 22 내지 28 및 32 중 어느 하나의 서열을 포함할 수 있으며; OMNI-103 뉴클레아제의 sgRNA 분자는 서열번호 4 내지 36 중 어느 하나의 서열을 포함할 수 있다. 각각의 OMNI 뉴클레아제에 대한 다른 crRNA 분자, tracrRNA 분자, 또는 sgRNA 분자는 동일한 방식으로 표 2에 열거된 서열로부터 유래될 수 있다.
본 발명은 서열번호 1의 아미노산 서열과 적어도 90% 동일성을 갖는 서열을 포함하는 CRISPR 뉴클레아제, 또는 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 핵산 분자를 포함하는 비-자연 발생 조성물을 제공한다. 핵산 분자는, 예를 들어 DNA 분자 또는 RNA 분자일 수 있다.
일부 실시형태에서, CRISPR 뉴클레아제는 완전한 촉매 활성을 갖거나, 닉카제이거나, 촉매적으로 불활성이고, DNA-상호활성 또는 변형 단백질에 융합된다. 예를 들어, CRISPR 뉴클레아제는 염기 편집 방법에서 사용하기 위해 데아미나제 단백질에 융합될 수 있다. 또 다른 예에서, CRISPR 뉴클레아제는 프라임(prime) 편집 방법에서 사용하기 위해 역전사효소에 융합될 수 있다.
일부 실시형태에서, 조성물은 하나 이상의 RNA 분자, 또는 하나 이상의 RNA 분자 중 어느 하나를 인코딩하는 DNA 폴리뉴클레오타이드를 더 포함하며, 여기서 하나 이상의 RNA 분자 및 CRISPR 뉴클레아제는 자연적으로 함께 발생하지 않고 하나 이상의 RNA 분자는 CRISPR 뉴클레아제와 복합체를 형성하고/하거나 복합체를 표적 부위에 대해 표적화하도록 구성된다.
일부 실시형태에서, CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열과 적어도 90% 동일성을 갖는 서열을 포함하고 적어도 하나의 RNA 분자는 서열번호 4 내지 36으로 이루어진 군으로부터 선택되는 서열을 포함한다.
일부 실시형태에서, CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열과 적어도 90% 동일성을 갖는 서열을 포함하고 적어도 하나의 RNA 분자는 서열번호 4 내지 7 및 18 내지 21로 이루어진 군으로부터 선택되는 서열 및 가이드 서열 부분을 포함하는 CRISPR RNA(crRNA) 분자이다.
일부 실시형태에서, 조성물은 서열번호 8 내지 14, 17, 22 내지 28 및 32로 이루어진 군에 제시된 서열을 포함하는 전사활성화(transactivating) CRISPR RNA(tracrRNA) 분자를 더 포함한다.
일부 실시형태에서, CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열과 적어도 90% 동일성을 갖는 서열을 포함하고 적어도 하나의 RNA 분자는 가이드 서열 부분 및 서열번호 4 내지 36으로 이루어진 군으로부터 선택되는 서열을 포함하는 단일-가이드 RNA(sgRNA) 분자이다.
일부 실시형태에서, CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열과 적어도 90% 동일성을 갖는 서열을 포함하고 적어도 하나의 RNA 분자는 가이드 서열 부분 및 길이가 적어도 79개 뉴클레오타이드인 스캐폴드 부분을 포함하는 단일-가이드 RNA(sgRNA) 분자이다.
일부 실시형태에서, CRISPR 뉴클레아제는 표 1의 칼럼 5에서 CRISPR 뉴클레아제에 대해 제공된 위치에서 아미노산 치환에 의해 형성된 불활성화된 RuvC 도메인을 갖는 닉카제이다.
일부 실시형태에서, CRISPR 뉴클레아제는 표 1의 칼럼 6에서 CRISPR 뉴클레아제에 대해 제공된 위치에서 아미노산 치환에 의해 형성된 불활성화된 HNH 도메인을 갖는 닉카제이다.
일부 실시형태에서, CRISPR 뉴클레아제는 표 1의 칼럼 7에서 CRISPR 뉴클레아제에 대해 제공된 위치에서 치환에 의해 형성된 불활성화된 RuvC 도메인 및 불활성화된 HNH 도메인을 갖는 촉매적으로 사멸된 뉴클레아제이다.
예를 들어, OMNI-103의 아미노산 서열(서열번호 1)의 위치 12에서 아스파트산 잔기(D)를 또 다른 아미노산, 예를 들어 알라닌(A)으로 치환함으로써 RuvC 도메인을 불활성화시킴으로써 OMNI-103 뉴클레아제에 대한 닉카제가 생성될 수 있다. 아스파트산(D)에서 글루탐산(E) 또는 글루탐산(E) 또는 아스파트산(D)으로의 치환 이외의 임의의 치환이 불활성화를 초래하는 것을 나타내는 별표가 아미노산 위치에 있는 경우를 제외하고, 임의의 다른 아미노산으로의 치환은 표 1의 칼럼 5 내지 7에 표시된 아미노산 위치의 각각에 대해 허용 가능하다. 예를 들어, OMNI-103의 아미노산 서열(서열번호 1)의 위치 856에서 아스파트산(D)을 글루탐산 잔기(E) 이외의 아미노산, 예를 들어 알라닌(A)으로 치환함으로써 HNH 도메인을 불활성화시킴으로써 OMNI-103 뉴클레아제에 대한 닉카제가 생성될 수 있다. 다른 닉카제 또는 촉매적으로 사멸된 뉴클레아제는 표 1의 동일한 표기법을 사용하여 생성될 수 있다.
일부 실시형태에서, CRISPR 뉴클레아제는 위치 D12, E776, H988 또는 D991에서 아미노산 치환에 의해 형성되는 닉카제이다.
일부 실시형태에서, CRISPR 뉴클레아제는 위치 D856, H857 또는 N880에서 아미노산 치환에 의해 형성되는 닉카제이며, 여기서 위치 D856에서 아미노산 치환은 아스파트산(D) 이외의 글루탐산(E)으로의 치환이다.
일부 실시형태에서, CRISPR 뉴클레아제는 위치 D12, E776, H988 또는 D991 중 어느 하나에서의 아미노산 치환 및 D856, H857 또는 N880 중 어느 하나에서의 아미노산 치환에 의해 형성된 촉매적으로 사멸된 뉴클레아제이며, 여기서 위치 D856에서의 아미노산 치환은 아스파트산(D) 이외의 글루탐산(E)으로의 치환이다.
일부 실시형태에서, CRISPR 뉴클레아제는 표 3의 칼럼 2 또는 칼럼 3에서 CRISPR 뉴클레아제에 대해 제공된 프로토스페이서 인접 모티프(PAM) 서열을 이용한다.
본 발명은 또한 상기 기재된 조성물 중 어느 하나를 세포에 도입하는 단계를 포함하는, 무세포 시스템 또는 세포의 게놈 내 DNA 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법을 제공한다. 일부 실시형태에서, 조성물은 CRISPR 뉴클레아제 및 crRNA:tracrRNA 복합체 또는 sgRNA 분자를 포함한다.
일부 실시형태에서, CRISPR 뉴클레아제는 표 3의 칼럼 2 또는 칼럼 3에서 CRISPR 뉴클레아제에 대해 제공된 프로토스페이서 인접 모티프(PAM) 서열에 인접한 DNA 가닥에 DNA 파손을 초래하고, PAM 서열에 상보적인 서열에 인접한 DNA 가닥에 DNA 파손을 초래한다. 예를 들어, 적절한 표적화 sgRNA 또는 crRNA:tracrRNA 복합체를 갖는 OMNI-103 뉴클레아제는 NNRRHY, NNRACT, 또는 NNRVCT 서열에 인접한 가닥 및 NNRRHY, NNRACT, 또는 NNRVCT 서열에 상보적인 서열에 인접한 DNA 가닥에서 DNA 파손을 형성할 수 있다. 일부 실시형태에서, DNA 가닥은 세포의 핵 내에 있다.
일부 실시형태에서, CRISPR 뉴클레아제는 표 1의 칼럼 5에서 CRISPR 뉴클레아제에 대해 제공된 위치에서 아미노산 치환에 의해 형성된 불활성화된 RuvC 도메인을 갖는 닉카제이며, PAM 서열에 상보적인 서열에 인접한 DNA 가닥에서 DNA 파손을 초래한다.
일부 실시형태에서, CRISPR 뉴클레아제는 표 1의 칼럼 6에서 CRISPR 뉴클레아제에 대해 제공된 위치에서 아미노산 치환에 의해 형성된 불활성화된 HNH 도메인을 갖는 닉카제이며, PAM 서열에 인접한 DNA 가닥에서 DNA 파손을 초래한다.
일부 실시형태에서, CRISPR 뉴클레아제는 표 1의 칼럼 7에서 CRISPR 뉴클레아제에 대해 제공된 위치에서 치환에 의해 형성된 불활성화된 RuvC 도메인 및 불활성화된 HNH 도메인을 갖는 촉매적으로 사멸된 뉴클레아제이며, PAM 서열에 인접한 DNA 가닥에서 DNA 파손을 초래한다.
본 발명은 또한 본 명세서에서 제공된 조성물 중 어느 하나를 세포에 도입하는 단계를 포함하는, 무세포 시스템 또는 세포의 게놈 내 DNA 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법을 제공한다.
일부 실시형태에서, CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열에 적어도 90% 동일성을 갖는 서열을 포함하며, 여기서 CRISPR 뉴클레아제는 NNRRHY, NNRACT, 또는 NNRVCT 프로토스페이서 인접 모티프(PAM) 서열에 인접한 DNA 가닥 파손을 초래하고/하거나 PAM 서열에 상보적인 서열에 인접한 DNA 가닥 파손을 초래한다.
일부 실시형태에서, CRISPR 뉴클레아제는 위치 D12, E776, H988 또는 D991에서 아미노산 치환에 의해 형성되는 닉카제이며, PAM 서열에 인접한 DNA 가닥 파손을 초래한다.
일부 실시형태에서, CRISPR 뉴클레아제는 위치 D856, H857 또는 N880에서 아미노산 치환에 의해 형성되는 닉카제이고, PAM 서열에 상보적인 서열에 인접한 DNA 가닥 파손을 초래하며, 위치 D856에서 아미노산 치환은 아스파트산(D) 이외의 글루탐산(E)으로의 치환이다.
일부 실시형태에서, 세포는 진핵 세포 또는 원핵 세포이다.
일부 실시형태에서, 세포는 포유동물 세포이다.
일부 실시형태에서, 세포는 인간 세포이다.
일부 실시형태에서, CRISPR 뉴클레아제는 서열번호 1인 CRISPR 뉴클레아제와 적어도 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 또는 82% 아미노산 서열 동일성을 갖는 아미노산 서열을 포함한다. 일 실시형태에서, CRISPR 뉴클레아제를 인코딩하는 서열은 서열번호 2 내지 3으로 이루어진 군으로부터 선택되는 핵산 서열과 적어도 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 또는 82% 동일성을 갖는다.
본 발명은 또한 CRISPR 뉴클레아제를 포함하는 비-자연 발생 조성물을 제공하며, 여기서 CRISPR 뉴클레아제는 서열번호 1의 도메인 A, 도메인 B, 도메인 C, 도메인 D, 도메인 E, 도메인 F, 도메인 G, 도메인 H, 도메인 I, 또는 도메인 J 중 적어도 하나의 아미노산 서열에 상응하는 아미노산 서열을 포함하고,
a) 도메인 A는 서열번호 1의 아미노산 1 내지 45와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
b) 도메인 B는 서열번호 1의 아미노산 46 내지 83과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
c) 도메인 C는 서열번호 1의 아미노산 84 내지 158과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
d) 도메인 D는 서열번호 1의 아미노산 159 내지 302와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
e) 도메인 E는 서열번호 1의 아미노산 303 내지 515와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
f) 도메인 F는 서열번호 1의 아미노산 516 내지 727과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
g) 도메인 G는 서열번호 1의 아미노산 728 내지 778과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
h) 도메인 H는 서열번호 1의 아미노산 779 내지 923과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
i) 도메인 I는 서열번호 1의 아미노산 924 내지 1068과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
j) 도메인 J는 서열번호 1의 아미노산 1069 내지 1348과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함한다.
본 발명의 일부 양태에 따르면, 개시된 조성물은 CRISPR 뉴클레아제 또는 변이체 CRISPR 뉴클레아제를 인코딩하는 뉴클레오타이드 서열을 포함하는 DNA 작제물 또는 벡터 시스템을 포함한다. 일부 실시형태에서, CRISPR 뉴클레아제 또는 변이체 CRISPR 뉴클레아제를 인코딩하는 뉴클레오타이드 서열은 관심이 있는 세포에서 작동 가능한 프로모터에 작동 가능하게 연결된다. 일부 실시형태에서, 관심이 있는 세포는 진핵 세포이다. 일부 실시형태에서, 관심이 있는 세포는 포유동물 세포이다. 일부 실시형태에서, 조작된 CRISPR 뉴클레아제를 인코딩하는 핵산 서열은 특정 유기체 유래의 세포에서 사용하기 위해 코돈 최적화된다. 일부 실시형태에서, 뉴클레아제를 인코딩하는 핵산 서열은 이. 콜라이(E. coli)에 대해 코돈 최적화된다. 일부 실시형태에서, 뉴클레아제를 인코딩하는 핵산 서열은 진핵 세포에 대해 코돈 최적화된다. 일부 실시형태에서, 뉴클레아제를 인코딩하는 핵산 서열은 포유동물 세포에 대해 코돈 최적화된다.
일부 실시형태에서, 조성물은 서열번호 1과 적어도 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90% 동일성을 갖는 CRISPR 효소를 인코딩하는 폴리뉴클레오타이드에 작동 가능하게 연결된 이종 프로모터를 포함하는, 재조합 핵산을 포함한다. 각각의 가능성은 별개의 실시형태를 나타낸다.
조성물의 일 실시형태에서, CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열과 적어도 75%, 80%, 85, 90%, 95% 또는 97% 동일성을 갖거나 CRISPR 뉴클레아제를 인코딩하는 서열은 서열번호 2 및 3으로 이루어진 군으로부터 선택되는 뉴클레오타이드 서열과 적어도 75%, 80%, 85, 90%, 95% 또는 97% 서열 동일성을 갖는다.
일부 실시형태에 따르면, 서열번호 1의 아미노산 서열과 적어도 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 85%, 80% 동일성을 갖는 서열을 포함하는 CRISPR 뉴클레아제 또는 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 핵산 분자를 포함하는 조작되거나 비-자연 발생 조성물이 제공된다. 각각의 가능성은 별개의 실시형태를 나타낸다.
일 실시형태에서, CRISPR 뉴클레아제는 조작되거나 비-자연 발생인 것이다. CRISPR 뉴클레아제는 또한 재조합일 수 있다. 이러한 CRISPR 뉴클레아제는 실험실 방법(예를 들어, 분자 클로닝)을 사용하여 생산되어 다수 공급원 유래의 유전 물질을 합하여, 그렇지 않으면 생물학적 유기체에서 찾을 수 없는 서열을 형성한다.
일 실시형태에서, CRISPR 뉴클레아제는 DNA-표적화 RNA 분자(gRNA)와 상호작용할 수 있는 RNA-결합 부분 및 부위-지정 효소 활성을 나타내는 활성 부분을 더 포함한다.
일 실시형태에서, 조성물은 DNA-표적화 RNA 분자 또는 DNA-표적화 RNA 분자를 인코딩하는 DNA 폴리뉴클레오타이드를 더 포함하며, DNA-표적화 RNA 분자는 가이드 서열 부분, 즉 표적 영역에서 서열에 상보적인 뉴클레오타이드 서열을 포함하고, DNA-표적화 RNA 분자 및 CRISPR 뉴클레아제는 자연적으로 함께 발생하지 않는다.
일 실시형태에서, DNA-표적화 RNA 분자는 CRISPR 뉴클레아제와 복합체를 형성할 수 있는 뉴클레오타이드 서열을 더 포함한다.
본 발명은 또한,
a) 직접 반복 서열에 연결된 가이드 서열 부분을 포함하는 하나 이상의 RNA 분자(여기서, 가이드 서열은 표적 서열열과 혼성화할 수 있음), 또는 하나 이상의 RNA 분자를 인코딩하는 하나 이상의 뉴클레오타이드 서열; 및
b) 서열번호 1의 아미노산 서열과 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는 CRISPR 뉴클레아제 또는 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 핵산 분자
를 포함하는 CRISPR 연관 시스템을 포함하는 비-자연 발생 조성물을 제공하며, 여기서 하나 이상의 RNA 분자는 표적 서열에 혼성화하고, 표적 서열은 프로토스페이서 인접 모티프(PAM)에 인접하며, 하나 이상의 RNA 분자는 RNA-가이드 뉴클레아제와 복합체를 형성한다.
일 실시형태에서, 조성물은 CRISPR 뉴클레아제와 복합체를 형성할 수 있는 뉴클레오타이드 서열을 포함하는 RNA 분자(예를 들어, tracrRNA 분자) 또는 CRISPR 뉴클레아제와 복합체를 형성할 수 있는 RNA 분자를 인코딩하는 서열을 포함하는 DNA 폴리뉴클레오타이드를 더 포함한다.
일 실시형태에서, 조성물은 상동성 지정 복구(homology directed repair; HDR)를 위한 공여체 주형을 더 포함한다.
일 실시형태에서, 조성물은 세포의 게놈에서 표적 영역을 편집할 수 있다.
일부 실시형태에 따르면,
(a)
RNA-결합 부분; 및
부위-지정 효소 활성을 나타내는 활성 부분
을 포함하는, CRISPR 뉴클레아제, 또는 CRISPR 뉴클레아제를 인코딩하는 폴리뉴클레오타이드로서, CRISPR 뉴클레아제는 서열번호 1과 적어도 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 85%, 80% 동일성을 갖는, CRISPR 뉴클레아제, 또는 CRISPR 뉴클레아제를 인코딩하는 폴리뉴클레오타이드; 및
(b)
i) 표적 DNA 서열의 서열에 상보적인 뉴클레오타이드 서열을 포함하는 DNA-표적화 RNA 서열; 및
ii) CRISPR 뉴클레아제의 RNA-결합 부분과 상호작용할 수 있는 단백질-결합 RNA 서열
을 포함하는, 하나 이상의 RNA 분자, 또는 하나 이상의 RNA 분자를 인코딩하는 DNA 폴리뉴클레오타이드
를 포함하는 비-자연 발생 조성물이 제공되며, 여기서 DNA 표적화 RNA 서열 및 CRISPR 뉴클레아제는 자연적으로 함께 발생하지 않는다. 각각의 가능성은 별개의 실시형태를 나타낸다.
일부 실시형태에서, DNA-표적화 RNA 서열 및 단백질-결합 RNA 서열을 포함하는 단일 RNA 분자가 제공되며, 여기서 RNA 분자는 CRISPR 뉴클레아제와 복합체를 형성하고 DNA 표적화 모듈의 역할을 할 수 있다. 일부 실시형태에서, RNA 분자는 길이가 최대 1000개 염기, 900개 염기, 800개 염기, 700개 염기, 600개 염기, 500개 염기, 400개 염기, 300개 염기, 200개 염기, 100개 염기, 50개 염기이다. 각각의 가능성은 별개의 실시형태를 나타낸다. 일부 실시형태에서, DNA-표적화 RNA 서열을 포함하는 제1 RNA 분자 및 단백질-결합 RNA 서열을 포함하는 제2 RNA 분자는 염기쌍 형성에 의해 상호작용하거나 대안적으로 함께 융합되어 CRISPR 뉴클레아제와 복합체화하고 DNA 표적화 모듈의 역할을 하는 하나 이상의 RNA 분자를 형성한다.
본 발명은 또한
a) 서열번호 1의 아미노산 서열과 적어도 95% 동일성을 갖는 서열을 포함하는 CRISPR 뉴클레아제 또는 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 핵산 분자; 및
b)
i) CRISPR 뉴클레아제와 상호작용할 수 있는/CRISPR 뉴클레아제에 결합할 수 있는 뉴클레아제-결합 RNA 뉴클레오타이드 서열; 및
ii) 표적 DNA 서열의 서열에 상보적인 서열을 포함하는 DNA-표적화 RNA 뉴클레오타이드 서열
중 적어도 하나를 포함하는, 하나 이상의 RNA 분자, 또는 하나 이상의 RNA 분자를 인코딩하는 하나 이상의 DNA 폴리뉴클레오타이드
를 포함하는 비-자연 발생 조성물을 제공하며, 여기서 CRISPR 뉴클레아제는 하나 이상의 RNA 분자와 복합체화하여 표적 DNA 서열과 혼성화할 수 있는 복합체를 형성할 수 있다.
일 실시형태에서, CRISPR 뉴클레아제 및 하나 이상의 RNA 분자는 표적 DNA 서열에 결합할 수 있는 CRISPR 복합체를 형성하여 표적 DNA 서열의 절단을 초래한다.
일 실시형태에서, CRISPR 뉴클레아제 및 하나 이상의 RNA 분자 중 적어도 하나는 자연적으로 함께 발생하지 않는다.
일 실시형태에서:
a) CRISPR 뉴클레아제는 RNA-결합 부분 및 부위-지정 효소 활성을 나타내는 활성 부분을 포함하고;
b) DNA-표적화 RNA 뉴클레오타이드 서열은 표적 DNA 서열의 서열에 상보적인 뉴클레오타이드 서열을 포함하고;
c) 뉴클레아제-결합 RNA 뉴클레오타이드 서열은 CRISPR 뉴클레아제의 RNA-결합 부분과 상호작용하는 서열을 포함한다.
일 실시형태에서, 뉴클레아제-결합 RNA 뉴클레오타이드 서열 및 DNA-표적화 RNA 뉴클레오타이드 서열은 단일 가이드 RNA 분자(sgRNA) 상에 있으며, 여기서 sgRNA 분자는 CRISPR 뉴클레아제와 복합체를 형성하고 DNA 표적화 모듈의 역할을 할 수 있다.
일 실시형태에서, 뉴클레아제-결합 RNA 뉴클레오타이드 서열은 제1 RNA 분자 상에 있고 DNA-표적화 RNA 뉴클레오타이드 서열은 제2 RNA 분자 상에 있으며, 제1 및 제2 RNA 분자는 염기쌍 형성에 의해 상호작용하거나 함께 융합되어 CRISPR 뉴클레아제와 복합체를 형성하고 DNA 표적화 모듈의 역할을 하는 sgRNA 또는 RNA 복합체를 형성한다.
일 실시형태에서, sgRNA는 길이가 최대 1000개 염기, 900개 염기, 800개 염기, 700개 염기, 600개 염기, 500개 염기, 400개 염기, 300개 염기, 200개 염기, 100개 염기, 50개 염기이다.
일 실시형태에서, 조성물은 상동성 지정 복구(HDR)를 위한 공여체 주형을 더 포함한다.
일 실시형태에서, CRISPR 뉴클레아제는 비-자연 발생인 것이다.
일 실시형태에서, CRISPR 뉴클레아제는 조작되거나 비천연 또는 합성 아미노산을 포함한다.
일 실시형태에서, CRISPR 뉴클레아제는 조작되고 핵 국재화 서열(NLS), 세포 침투 펩타이드 서열, 및/또는 친화성 태그 중 하나 이상을 포함한다.
일 실시형태에서, CRISPR 뉴클레아제는 진핵 세포의 핵에서 검출 가능한 양으로 CRISPR 뉴클레아제를 포함하는 CRISPR 복합체의 축적을 구동하기에 충분한 강도의 하나 이상의 핵 국재화 서열을 포함한다.
본 발명은 또한 본 발명의 조성물 중 임의의 것을 세포에 도입하는 단계를 포함하는, 무세포 시스템 또는 세포의 게놈 내 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법을 제공한다.
일 실시형태에서, 세포는 진핵 세포이다.
또 다른 실시형태에서, 세포는 원핵 세포이다.
일부 실시형태에서, 하나 이상의 RNA 분자는 RNA 뉴클레아제(tracrRNA)와 복합체를 형성할 수 있는 뉴클레오타이드 분자를 포함하는 RNA 서열 또는 CRISPR 뉴클레아제와 복합체를 형성할 수 있는 뉴클레오타이드 서열을 포함하는 RNA 분자를 인코딩하는 DNA 폴리뉴클레오타이드를 더 포함한다.
일 실시형태에서, CRISPR 뉴클레아제는 아미노-말단에 또는 그 근처에 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 이상의 NLS, 카복시-말단에 또는 그 근처에 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 이상의 NLS, 또는 아미노-말단에 또는 그 근처에 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 이상의 NLS와 카복시-말단에 또는 그 근처에 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 이상의 NLS의 조합을 포함한다. 일 실시형태에서, 1 내지 4개 NLS는 CRISPR 뉴클레아제와 융합된다. 일 실시형태에서, NLS는 CRISPR 뉴클레아제의 오픈-리딩 프레임(ORF) 내에 위치한다.
아미노-말단에 또는 그 근처에, 카복시-말단에 또는 그 근처에, 또는 발현된 단백질의 ORF 내에 NLS를 융합시키는 방법은 당업계에 잘 알려져 있다. 일 예로서, CRISPR 뉴클레아제의 아미노-말단에 NLS를 융합시키기 위해, NLS의 핵산 서열은 NLS-융합 CRISPR 뉴클레아제를 인코딩하는 핵산 상에서 CRISPR 뉴클레아제의 시작 코돈 바로 뒤에 위치한다. 반대로, CRISPR 뉴클레아제의 카복시-말단에 NLS를 융합시키기 위해, NLS의 핵산 서열은 CRISPR 뉴클레아제의 마지막 아미노산을 인코딩하는 코돈 뒤와 정지 코돈 앞에 위치한다.
CRISPR 뉴클레아제의 ORF를 따라 임의의 위치에서 NLS, 세포 침투 펩타이드 서열, 및/또는 친화성 태그의 임의의 조합이 본 발명에서 고려된다.
본 명세서에서 제공되는 CRISPR 뉴클레아제의 아미노산 서열 및 핵산 서열은 CRISPR 뉴클레아제의 인접한 아미노산 또는 핵산 서열을 방해하도록 삽입된 NLS 및/또는 TAG를 포함할 수 있다.
일 실시형태에서, 하나 이상의 NLS는 탠덤 반복으로 존재한다.
일 실시형태에서, 하나 이상의 NLS는 NLS의 가장 가까운 아미노산이 N- 또는 C-말단으로부터 폴리펩타이드 사슬을 따라 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50개, 또는 그 이상의 아미노산 내에 있을 때 N- 또는 C-말단에 근접한 것으로 간주된다.
논의된 바와 같이, CRISPR 뉴클레아제는 핵 국재화 서열(NLS), 세포 침투 펩타이드 서열, 및/또는 친화성 태그 중 하나 이상을 포함하도록 조작될 수 있다.
일 실시형태에서, 조성물은 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 뉴클레오타이드 산 분자에 작동 가능하게 연결된 이종 프로모터를 포함하는 재조합 핵산 분자를 더 포함한다.
일 실시형태에서, CRISPR 뉴클레아제 또는 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 핵산 분자는 비-자연 발생이거나 조작된다.
본 발명은 또한 본 발명의 CRISPR 뉴클레아제 중 임의의 것을 인코딩하는 서열을 포함하는 핵산 분자를 포함하는 벡터 시스템을 포함하는 비-자연 발생 또는 조작된 조성물을 제공한다.
본 발명은 또한 대상체의 게놈내의 표적 부위에서 뉴클레오타이드 서열을 변형시키는 것을 포함하는, 게놈 돌연변이와 연관된 질환을 앓고 있는 대상체의 치료를 위한 본 발명의 조성물 중 임의의 것의 용도를 제공한다.
본 발명은 (i) 서열번호 1의 아미노산 서열과 적어도 95% 동일성을 갖는 CRISPR 뉴클레아제 또는 서열이 서열번호 2 내지 3의 핵산 서열과 적어도 95% 동일성을 갖는 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 핵산 분자를 포함하는 조성물 및 (ii) 표적 DNA의 서열에 상보적인 뉴클레오타이드 서열을 포함하는, DNA-표적화 RNA 분자, 또는 DNA-표적화 RNA 분자를 인코딩하는 DNA 폴리뉴클레오타이드를 세포에 도입하는 단계를 포함하는, 포유동물 세포의 게놈 내의 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법을 제공한다.
일부 실시형태에서, 방법은 생체외에서 수행된다. 일부 실시형태에서, 방법은 생체내에서 수행된다. 일부 실시형태에서, 본 방법의 일부 단계는 생체외에서 수행되고 일부 단계는 생체내에서 수행된다. 일부 실시형태에서, 포유동물 세포는 인간 세포이다.
일 실시형태에서, 방법은 세포에 (iii) tracrRNA 서열을 포함하는 RNA 분자 또는 tracrRNA 서열을 포함하는 RNA 분자를 인코딩하는 DNA 폴리뉴클레오타이드를 도입하는 단계를 더 포함한다.
일 실시형태에서, DNA-표적화 RNA 분자는 crRNA 반복 서열을 포함한다.
일 실시형태에서, tracrRNA 서열을 포함하는 RNA 분자는 DNA-표적화 RNA 분자에 결합할 수 있다.
일 실시형태에서, DNA-표적화 RNA 분자 및 tracrRNA 서열을 포함하는 RNA 분자는 상호작용하여 RNA 복합체를 형성하고, RNA 복합체는 CRISPR 뉴클레아제와 활성 복합체를 형성할 수 있다.
일 실시형태에서, DNA-표적화 RNA 분자 및 뉴클레아제-결합 RNA 서열을 포함하는 RNA 분자는 CRISPR 뉴클레아제와 활성 복합체를 형성하기에 적합한 단일 가이드 RNA 분자의 형태로 융합된다.
일 실시형태에서, 가이드 서열 부분은 프로토스페이서 서열에 상보적인 서열을 포함한다.
일 실시형태에서, CRISPR 뉴클레아제는 DNA-표적화 RNA 분자와 복합체를 형성하고 프로토스페이서 인접 모티프(PAM)의 3' 또는 5'인 영역에서 이중 가닥 파손을 초래한다.
본 명세서에 기재된 방법 중 임의의 것의 일 실시형태에서, 방법은 대상체의 게놈내의 표적 부위에서 뉴클레오타이드 서열을 변형시키는 것을 포함하는, 게놈 돌연변이와 연관된 질환을 앓고 있는 대상체를 치료하기 위한 것이다.
일 실시형태에서, 방법은 먼저 게놈 돌연변이와 연관된 질환을 앓고 있는 대상체를 선택하는 단계 및 대상체로부터 세포를 수득하는 단계를 포함한다.
본 발명은 또한 본 명세서에 기재된 방법 중 임의의 것에 의해 수득되는 변형된 세포 또는 세포들을 제공한다. 일 실시형태에서 이러한 변형된 세포 또는 세포들은 자손 세포를 발생시킬 수 있다. 일 실시형태에서 이러한 변형된 세포 또는 세포들은 생착 후 자손 세포를 발생시킬 수 있다.
본 발명은 또한 이러한 변형된 세포 및 약제학적으로 허용 가능한 담체를 포함하는 조성물을 제공한다. 또한 세포를 약제학적으로 허용 가능한 담체와 혼합하는 단계를 포함하는, 이를 제조하는 시험관내 또는 생체외 방법이 제공된다.
본 발명은 또한 비-자연 발생 RNA 분자를 포함하는 조성물을 제공하며, RNA 분자는 crRNA 반복 서열 부분 및 가이드 서열 부분을 포함하되, RNA 분자는 tracrRNA 서열의 존재 하에 OMNI-103 뉴클레아제와 복합체를 형성하고 상기 뉴클레아제를 DNA 표적 부위에 대해 표적화하며, tracrRNA 서열은 RNA 분자의 tracrRNA 부분 또는 제2 RNA 분자의 tracrRNA 부분에 의해 인코딩된다.
일부 실시형태에서, crRNA 반복 서열 부분은 길이가 최대 17개 뉴클레오타이드, 바람직하게는 길이가 14 내지 17개 뉴클레오타이드이다.
일부 실시형태에서, crRNA 반복 서열 부분은 서열번호 114 또는 115와 적어도 60 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는다.
일부 실시형태에서, crRNA 반복 서열 부분은 서열번호 114 또는 115 중 어느 하나와 적어도 95% 서열 동일성을 갖는다.
일부 실시형태에서, crRNA 반복 서열은 서열번호 115 이외의 것이다.
일부 실시형태에서, crRNA 반복 서열 부분 및 가이드 서열 부분을 포함하는 RNA 분자는 tracrRNA 부분을 더 포함한다.
일부 실시형태에서, crRNA 반복 서열 부분은 폴리뉴클레오타이드 링커 부분에 의해 tracrRNA 부분에 공유로 연결된다.
일부 실시형태에서, 조성물은 tracrRNA 부분을 포함하는 제2 RNA 분자를 포함한다.
일부 실시형태에서, OMNI-103 뉴클레아제는 서열번호 1의 아미노산 서열과 적어도 95% 서열 동일성을 갖는다.
일부 실시형태에서, 가이드 서열 부분은 길이가 17 내지 30개 뉴클레오타이드, 바람직하게는 길이가 22개 뉴클레오타이드이다.
본 발명은 또한 비-자연 발생 RNA 분자를 포함하는 조성물을 제공하되, RNA 분자는 tracrRNA 부분을 포함하며, 여기서 RNA 분자는 crRNA 반복 서열 부분 및 가이드 서열 부분의 존재 하에 OMNI-103 뉴클레아제와 복합체를 형성하고 상기 뉴클레아제를 DNA 표적 부위에 대해 표적화하고, crRNA 반복 서열 부분 및 가이드 서열 부분은 RNA 분자 및 제2 RNA 분자에 의해 인코딩된다.
일부 실시형태에서, tracrRNA 부분은 길이가 85개 미만의 뉴클레오타이드, 바람직하게는 길이가 84 내지 80, 79 내지 75, 74 내지 70, 69 내지 65, 또는 64 내지 60개 뉴클레오타이드이다.
일부 실시형태에서, tracrRNA 부분은 서열번호 109 내지 113 중 어느 하나의 tracrRNA 부분과 적어도 30 내지 40%, 41 내지 50%, 51 내지 60%, 61 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는다.
일부 실시형태에서, tracrRNA 부분은 서열번호 109 내지 113 중 어느 하나의 tracrRNA 부분과 적어도 95% 서열 동일성을 갖는다.
일부 실시형태에서, tracrRNA 부분은 서열번호 15 또는 16의 tracr 부분 이외의 것이다.
일부 실시형태에서, tracrRNA 부분은 길이가 최대 19개 뉴클레오타이드, 바람직하게는 길이가 16 내지 19개 뉴클레오타이드인 tracrRNA 항-반복 서열 부분을 포함한다.
일부 실시형태에서, tracrRNA 부분은 서열번호 116 또는 117 중 어느 하나와 적어도 60 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는 tracrRNA 항-반복 서열 부분을 포함한다.
일부 실시형태에서, tracrRNA 부분은 서열번호 116 또는 117 중 어느 하나와 적어도 95% 서열 동일성을 갖는 tracrRNA 항-반복 서열 부분을 포함한다.
일부 실시형태에서, tracrRNA 부분은 서열번호 117 이외의 서열을 갖는 tracrRNA 항-반복 서열 부분을 포함한다.
일부 실시형태에서, RNA 분자는 tracrRNA 부분을 포함하고 crRNA 반복 서열 부분 및 가이드 서열 부분을 더 포함한다.
일부 실시형태에서, tracrRNA 부분은 폴리뉴클레오타이드 링커 부분에 의해 crRNA 반복 서열에 공유로 연결된다.
일부 실시형태에서, 폴리뉴클레오타이드 링커 부분은 길이가 4 내지 10개 뉴클레오타이드이다.
일부 실시형태에서, 폴리뉴클레오타이드 링커는 GAAA의 서열을 갖는다.
일부 실시형태에서, 조성물은 crRNA 반복 서열 부분 및 가이드 서열 부분을 포함하는 제2 RNA 분자를 더 포함한다.
일부 실시형태에서, OMNI-103 뉴클레아제는 서열번호 1의 아미노산 서열과 적어도 95% 서열 동일성을 갖는다.
일부 실시형태에서, 가이드 서열 부분은 길이가 17 내지 30개 뉴클레오타이드, 바람직하게는 길이가 22개 뉴클레오타이드이다.
본 발명은 또한 비-자연 발생 RNA 분자를 포함하는 조성물을 제공하되, RNA 분자는 RNA 스캐폴드 부분을 포함하고, RNA 스캐폴드 부분은 다음 구조를 가지며:
crRNA 반복 서열 부분 - tracrRNA 부분;
여기서 RNA 스캐폴드 부분은 OMNI-103 CRISPR 뉴클레아제와 복합체를 형성하고 상기 뉴클레아제를 RNA 분자의 가이드 서열 부분에 대해 상보성을 갖는 DNA 표적 부위에 대해 표적화한다.
일부 실시형태에서, OMNI-103 뉴클레아제는 서열번호 1의 아미노산 서열과 적어도 95% 서열 동일성을 갖는다.
일부 실시형태에서, RNA 스캐폴드 부분은 길이가 110 내지 105, 104 내지 100, 99 내지 95, 94 내지 90, 89 내지 85, 84 내지 80, 79 내지 75, 또는 74 내지 70개 뉴클레오타이드이다.
일부 실시형태에서, RNA 스캐폴드 부분은 길이가 107, 101, 95, 85, 또는 79개 뉴클레오타이드이다.
일부 실시형태에서, RNA 스캐폴드 부분은 서열번호 109 내지 113 중 어느 하나와 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 서열 동일성을 갖는다.
일부 실시형태에서, crRNA 반복 서열 부분은 길이가 최대 17개 뉴클레오타이드, 바람직하게는 길이가 14 내지 17개 뉴클레오타이드이다.
일부 실시형태에서, crRNA 반복 서열 부분은 서열번호 114 또는 115와 적어도 60 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는다.
일부 실시형태에서, crRNA 반복 서열 부분은 서열번호 114 또는 115 중 어느 하나와 적어도 95% 서열 동일성을 갖는다.
일부 실시형태에서, crRNA 반복 서열은 서열번호 23 이외의 것이다.
일부 실시형태에서, tracrRNA 부분은 길이가 85개 미만의 뉴클레오타이드, 바람직하게는 길이가 84 내지 80, 79 내지 75, 74 내지 70, 69 내지 65, 또는 64 내지 60개 뉴클레오타이드이다.
일부 실시형태에서, tracrRNA 부분은 서열번호 109 내지 113 중 어느 하나의 tracrRNA 부분과 적어도 30 내지 40%, 41 내지 50%, 51 내지 60%, 61 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는다.
일부 실시형태에서, tracrRNA 부분은 서열번호 109 내지 113 중 어느 하나의 tracrRNA 부분과 적어도 95% 서열 동일성을 갖는다.
일부 실시형태에서, tracrRNA 부분은 서열번호 15 또는 16의 tracrRNA 부분 이외의 것이다.
일부 실시형태에서, RNA 스캐폴드 부분은 RNA 스캐폴드가 다음 구조를 갖도록 crRNA 반복 서열 부분과 tracrRNA 부분 사이에 링커 부분을 더 포함한다:
crRNA 반복 서열 부분 - 링커 부분 - tracrRNA 부분.
일부 실시형태에서, tracrRNA 부분은 tracrRNA 항-반복 서열 부분을 포함하며, 여기서 crRNA 반복 서열 및 tracrRNA 항-반복 서열 부분은 링커 부분에 의해 공유로 연결된다.
일부 실시형태에서, 링커 부분은 길이가 4 내지 10개 뉴클레오타이드인 폴리뉴클레오타이드 링커이다.
일부 실시형태에서, 폴리뉴클레오타이드 링커는 GAAA의 서열을 갖는다.
일부 실시형태에서, tracrRNA 부분은 길이가 최대 19개 뉴클레오타이드, 바람직하게는 길이가 16 내지 19개 뉴클레오타이드인 tracrRNA 항-반복 서열 부분을 포함한다.
일부 실시형태에서, tracrRNA 부분은 서열번호 116 또는 117 중 어느 하나와 적어도 60 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는 tracrRNA 항-반복 서열 부분을 포함한다.
일부 실시형태에서, tracrRNA 부분은 서열번호 116 또는 117 중 어느 하나와 적어도 95% 서열 동일성을 갖는 tracrRNA 항-반복 서열 부분을 포함한다.
일부 실시형태에서, tracrRNA 항-반복 서열은 서열번호 117 이외의 것이다.
일부 실시형태에서, tracrRNA 부분은 tracrRNA 항-반복 부분에 연결된 뉴클레오타이드의 제1 절편을 포함하고, 뉴클레오타이드의 제1 절편은 서열번호 118 내지 120 중 어느 하나와 적어도 95% 서열 동일성을 갖는다.
일부 실시형태에서, tracrRNA 부분은 뉴클레오타이드의 제1 절편에 연결된 뉴클레오타이드의 제2 섹션을 포함하고, 뉴클레오타이드의 제2 섹션은 서열번호 121 내지 124 중 어느 하나와 적어도 95% 서열 동일성을 갖는다.
일부 실시형태에서, RNA 스캐폴드 부분은 서열번호 109 내지 113 중 어느 하나의 뉴클레오타이드 서열과 적어도 95% 동일성을 갖는다.
일부 실시형태에서, RNA 스캐폴드 부분은 V2, V2.1, V2.2, V2.3, V2.4 또는 V2.5 RNA 스캐폴드 중 어느 하나의 예측된 구조를 갖는다.
일부 실시형태에서, RNA 스캐폴드 부분은 서열번호 15 또는 16 이외의 서열을 갖는다.
일부 실시형태에서, 가이드 서열 부분은 RNA 분자의 crRNA 반복 서열 부분에 공유로 연결되어, 다음 구조를 갖는 단일-가이드 RNA 분자를 형성한다:
가이드 서열 부분 - crRNA 반복 서열 부분 - tracrRNA 부분.
일부 실시형태에서, 가이드 서열 부분은 길이가 17 내지 30개 뉴클레오타이드, 더 바람직하게는 20 내지 23개 뉴클레오타이드, 더 바람직하게는 22개 뉴클레오타이드이다.
일부 실시형태에서, 조성물은 OMNI-103 CRISPR 뉴클레아제를 더 포함하며, 여기서 OMNI-103 CRISPR 뉴클레아제는 서열번호 1의 아미노산 서열과 적어도 95% 동일성을 갖는다.
일부 실시형태에서, RNA 분자는 시험관내 전사(IVT) 또는 고상 인공 올리고뉴클레오타이드 합성에 의해 형성된다.
일부 실시형태에서, RNA 분자는 변형된 뉴클레오타이드를 포함한다.
본 발명은 또한 상기 실시형태 중 어느 하나의 RNA 분자를 인코딩하는 폴리뉴클레오타이드 분자를 제공한다.
본 발명은 또한 본 명세서에 제시된 RNA 분자 중 어느 하나 및 서열번호 1의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 CRISPR 뉴클레아제를 시스템 또는 세포에 도입하는 단계를 포함하는, 무세포 시스템 또는 세포의 게놈 내 DNA 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법을 제공한다.
일부 실시형태에서, 세포는 진핵 세포 또는 원핵 세포이다.
일부 실시형태에서, 진핵 세포는 인간 세포 또는 식물 세포이다.
본 발명은 또한 상기 실시형태 중 어느 하나의 조성물, 서열번호 1의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 CRISPR 뉴클레아제를 시스템 또는 세포에 도입하는 것, 및 RNA 분자 및 CRISPR 뉴클레아제를 세포에 전달하기 위한 지침을 포함하는, 무세포 시스템 또는 세포의 게놈 내 DNA 표적 부위에서 뉴클레오타이드 서열을 변형시키기 위한 키트를 제공한다.
본 발명의 실시형태에서, 비-자연 발생 RNA 분자는 "스페이서" 또는 "가이드 서열" 부분을 포함한다. RNA 분자의 "스페이서 부분" 또는 "가이드 서열 부분"은 특정 표적 DNA 서열에 혼성화할 수 있는 뉴클레오타이드 서열을 지칭하고, 예를 들어 가이드 서열 부분은 가이드 서열 부분의 길이에 따라 표적화되는 DNA 서열에 완전히 상보적인 뉴클레오타이드 서열을 갖는다. 일부 실시형태에서, 가이드 서열 부분은 길이가 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개 뉴클레오타이드, 또는 길이가 대략 17 내지 30, 17 내지 29, 17 내지 28, 17 내지 27, 17 내지 26, 17 내지 25, 17 내지 24, 18 내지 22, 19 내지 22, 18 내지 20, 17 내지 20, 또는 21 내지 22개 뉴클레오타이드이다. 바람직하게는, 가이드 서열 부분의 전체 길이는 가이드 서열 부분의 길이를 따라 표적화된 DNA 서열에 완전히 상보적이다. 가이드 서열 부분은 CRISPR 뉴클레아제와 복합체를 형성하고 CRISPR 뉴클레아제를 활성화시킬 수 있는 "스캐폴드 부분"을 갖는 RNA 분자의 일부일 수 있으며, RNA 분자의 가이드 서열 부분은 CRISPR 복합체의 DNA 표적화 부분의 역할을 한다. 스캐폴드 부분 및 가이드 서열 부분을 갖는 RNA 분자가 CRISPR 분자와 동시에 존재하는 경우, RNA 분자는 특정 표적 DNA 서열에 대해 CRISPR 뉴클레아제를 표적화할 수 있다. 각각의 가능성은 별개의 실시형태를 나타낸다. RNA 분자 스페이서 부분은 임의의 원하는 서열을 표적화하도록 맞춤 설계될 수 있다.
일 실시형태에서, 뉴클레아제-결합 RNA 뉴클레오타이드 서열 및 DNA-표적화 RNA 뉴클레오타이드 서열(예를 들어, 스페이서 또는 가이드 서열 부분)은 단일-가이드 RNA 분자(sgRNA) 상에 있으며, 여기서 sgRNA 분자는 OMNI-103 CRISPR 뉴클레아제와 복합체를 형성하고 DNA 표적화 모듈의 역할을 할 수 있다.
일 실시형태에서, 뉴클레아제-결합 RNA 뉴클레오타이드 서열은 제1 RNA 분자 상에 있고 DNA-표적화 RNA 뉴클레오타이드 서열은 제2 RNA 분자 상에 있으며, 제1 및 제2 RNA 분자는 염기쌍 형성에 의해 상호작용하거나 CRISPR 뉴클레아제와 복합체를 형성하고 표적화 모듈의 역할을 한다.
본 발명의 일부 양태에 따르면, 개시된 방법은 본 명세서에 기재된 실시형태 중 어느 하나의 조성물을 세포에 도입하는 단계를 포함하는, 무세포 시스템 또는 세포의 게놈 내 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법을 포함한다.
본 발명은 또한 세포의 DNA 표적 부위에서 뉴클레오타이드 서열을 변형시키기 위한 본 발명의 조성물 또는 방법 중 임의의 것의 용도를 제공한다.
본 발명은 진핵 세포의 게놈의 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법을 제공한다.
본 발명은 포유동물 세포의 게놈의 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법을 제공한다. 일부 실시형태에서, 포유동물 세포는 인간 세포이다.
본 발명은 식물 세포의 게놈의 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법을 제공한다.
일부 실시형태에서, 방법은 생체외에서 수행된다. 일부 실시형태에서, 방법은 생체내에서 수행된다. 일부 실시형태에서, 본 방법의 일부 단계는 생체외에서 수행되고 일부 단계는 생체내에서 수행된다. 일부 실시형태에서, 포유동물 세포는 인간 세포이다.
본 발명은 또한 본 명세서에 기재된 방법 중 임의의 것에 의해 수득되는 변형된 세포 또는 세포들을 제공한다. 일 실시형태에서 이러한 변형된 세포 또는 세포들은 자손 세포를 발생시킬 수 있다. 일 실시형태에서 이러한 변형된 세포 또는 세포들은 생착 후 자손 세포를 발생시킬 수 있다.
본 발명은 또한 이러한 변형된 세포 및 약제학적으로 허용 가능한 담체를 포함하는 조성물을 제공한다. 또한 세포를 약제학적으로 허용 가능한 담체와 혼합하는 단계를 포함하는, 이를 제조하는 시험관내 또는 생체외 방법이 제공된다.
본 발명은 또한 서열번호 1의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 CRISPR 뉴클레아제, CRISPR 뉴클레아제와 복합체를 형성하고/하거나 표적 부위에 대해 복합체를 표적화하도록 구성된 하나 이상의 RNA 분자를 시스템 또는 세포에 도입하는 것, 및 RNA 분자 및 CRISPR 뉴클레아제를 세포에 전달하기 위한 지침을 포함하는, 무세포 시스템 또는 세포의 게놈 내 DNA 표적 부위에서 뉴클레오타이드 서열을 변형시키기 위한 키트를 제공한다. 예를 들어, 키트는 세포 또는 시험관 내 뉴클레오타이드 분자에서 표적 부위(예를 들어, DNA 서열)의 존재를 검출하기 위한 진단 키트로서 사용될 수 있다.
DNA-표적화 RNA 분자
RNA 분자의 "가이드 서열 부분"은 특정 표적 DNA 서열에 혼성화할 수 있는 뉴클레오타이드 서열을 지칭하고, 예를 들어 가이드 서열 부분은 가이드 서열 부분의 길이에 따라 표적화되는 DNA 서열에 부분적으로 또는 완전히 상보적인 뉴클레오타이드 서열을 갖는다. 일부 실시형태에서, 가이드 서열 부분은 길이가 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개 뉴클레오타이드, 또는 길이가 대략 17 내지 50, 17 내지 49, 17 내지 48, 17 내지 47, 17 내지 46, 17 내지 45, 17 내지 44, 17 내지 43, 17 내지 42, 17 내지 41, 17 내지 40, 17 내지 39, 17 내지 38, 17 내지 37, 17 내지 36, 17 내지 35, 17 내지 34, 17 내지 33, 17 내지 31, 17 내지 30, 17 내지 29, 17 내지 28, 17 내지 27, 17 내지 26, 17 내지 25, 17 내지 24, 17 내지 22, 17 내지 21, 18 내지 25, 18 내지 24, 18 내지 23, 18 내지 22, 18 내지 21, 19 내지 25, 19 내지 24, 19 내지 23, 19 내지 22, 19 내지 21, 19 내지 20, 20 내지 22, 18 내지 20, 20 내지 21, 21 내지 22, 또는 17 내지 20개 뉴클레오타이드이다. 가이드 서열 부분의 전체 길이는 가이드 서열 부분의 길이를 따라 표적화된 DNA 서열에 완전히 상보적이다. 가이드 서열 부분은 CRISPR 뉴클레아제와 복합체를 형성할 수 있는 RNA 분자의 일부일 수 있으며, 가이드 서열 부분은 CRISPR 복합체의 DNA 표적화 부분의 역할을 한다. 가이드 서열 부분을 갖는 DNA 분자가 CRISPR 분자와 동시에 존재하는 경우, RNA 분자는 특정 표적 DNA 서열에 대해 CRISPR 뉴클레아제를 표적화할 수 있다. 각각의 가능성은 별개의 실시형태를 나타낸다. RNA 분자는 임의의 원하는 서열을 표적화하도록 맞춤 설계될 수 있다. 따라서, "가이드 서열 부분"을 포함하는 분자는 표적화 분자의 한 유형이다. 본 출원 전체에 걸쳐, 용어 "가이드 분자", "RNA 가이드 분자", "가이드 RNA 분자", 및 "gRNA 분자"는 가이드 서열 부분을 포함하는 분자와 동의어이고, 용어 "스페이서"는 "가이드 서열 부분"과 동의어이다.
본 발명의 실시형태에서, CRISPR 뉴클레아제는 17, 18, 19 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개 뉴클레오타이드를 갖는 가이드 서열 부분을 포함하는 RNA 분자와 함께 사용될 때 가장 큰 절단 활성을 갖는다.
단일-가이드 RNA(sgRNA) 분자는 CRISPR 뉴클레아제를 원하는 표적 부위로 유도하는 데 사용될 수 있다. 단일-가이드 RNA는 가이드 서열 부분뿐만 아니라 스캐폴드 부분을 포함한다. 스캐폴드 부분은 CRISPR 뉴클레아제와 상호작용하고, 가이드 서열 부분과 함께 CRISPR 뉴클레아제를 활성화시키고 CRISPR 뉴클레아제를 원하는 표적 부위로 표적화한다. 스캐폴드 부분은, 예를 들어 감소된 크기를 갖도록, 추가로 조작될 수 있다. 예를 들어, OMNI-103 CRIPSR 뉴클레아제는 길이가 단지 79개 뉴클레오타이드인 조작된 스캐폴드 부분을 갖는 sgRNA 분자로 표적내 뉴클레아제 활성을 나타낸다.
본 발명의 일부 양태에 따르면, 개시된 방법은 본 명세서에 기재된 실시형태 중 어느 하나의 조성물을 세포에 도입하는 단계를 포함하는, 무세포 시스템 또는 세포의 게놈 내 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법을 포함한다.
일부 실시형태에서, 세포는 진핵 세포, 바람직하게는 포유동물 세포 또는 식물 세포이다.
본 발명의 일부 양태에 따르면, 개시된 방법은 대상체의 게놈내의 표적 부위에서 뉴클레오타이드 서열을 변형시키는 것을 포함하는, 게놈 돌연변이와 연관된 질환을 앓고 있는 대상체의 치료를 위한 본 명세서에 기재된 조성물 중 어느 하나의 용도를 포함한다.
본 발명의 일부 양태에 따르면, 개시된 방법은 본 명세서에 기재된 조성물 중 어느 하나를 돌연변이 장애와 연관된 대립유전자에 대해 표적화하는 단계를 포함하는, 돌연변이 장애를 갖는 대상체를 치료하는 방법을 포함한다.
일부 실시형태에서, 돌연변이 장애는 신생물, 연령-관련 황반 변성, 조현병, 신경학적, 신경변성, 또는 운동 장애, 취약 X 증후군, 세크레타제-관련 장애, 프리온-관련 장애, ALS, 중독, 자폐증, 알츠하이머병, 호중구감소증, 염증-관련 장애, 파킨슨병, 혈액 및 응고 질환 및 장애, 베타 지중해빈혈, 겸상 적혈구 빈혈, 세포 조절장애 및 종양학 질환과 장애, 염증 및 면역-관련 질환과 장애, 대사, 간, 신장 및 단백질 질환과 장애, 근육 및 골격 질환과 장애, 피부 질환과 장애, 신경학적 및 신경 질환과 장애, 및 안구 질환과 장애 중 임의의 것으로부터 선택되는 질환 또는 장애와 관련된다.
OMNI CRISPR 뉴클레아제 도메인
CRISPR 뉴클레아제의 특징적인 표적화 뉴클레아제 활성은 특정 도메인의 다양한 기능에 의해 부여된다. 본 출원에서, OMNI-103 CRISPR 뉴클레아제 도메인은 도메인 A, 도메인 B, 도메인 C, 도메인 D, 도메인 E, 도메인 F, 도메인 G, 도메인 H, 도메인 I, 및 도메인 J로 정의된다.
각각의 OMNI-103 CRISPR 뉴클레아제 도메인의 활성이 본 명세서에 기재되어 있으며, 각각의 도메인 활성은 뉴클레아제의 유리한 특징의 양태를 제공한다.
구체적으로, 도메인 A, 도메인 G, 및 도메인 I는 OMNI CRISPR 뉴클레아제의 구조 단위를 형성하며, 이는 DNA 가닥 절단에 참여하는 뉴클레아제 활성 부위를 포함한다. 도메인 A, 도메인 G, 및 도메인 I에 의해 형성되는 구조 단위는 이중-가닥 DNA 표적 부위에서 결합하는 가이드 RNA 분자에 의해 대체된 DNA 가닥을 절단한다.
도메인 B는 표적 DNA 부위에 대한 OMNI CRISPR 뉴클레아제의 결합 시 DNA 절단 활성을 개시하는 데 관여한다.
도메인 C, 도메인 D, 도메인 E, 및 도메인 F는 가이드 RNA 분자에 결합하고 표적 부위 인식을 위한 특이성을 제공하는 데 참여한다.
도메은 H는 DNA 가닥 절단에 참여하는 뉴클레아제 활성 부위를 포함한다. 도메인 H는 가이드 RNA 분자가 DNA 표적 부위에 결합하는 DNA 가닥을 절단한다.
도메인 J는 PAM 부위 조사 및 인식의 양태를 포함하여, OMNI CRISPR 뉴클레아제에 대한 PAM 부위 특이성을 제공하는 데 관여한다. 도메인 J는 또한 토포아이소머라제 활성을 수행한다.
다른 CRISPR 뉴클레아제 도메인 및 이들의 일반 기능에 대한 추가 설명은 특히 본 명세서에 참조에 의해 원용되는 문헌[Mir et al., ACS Chem. Biol. (2019), Palermo et al., Quarterly Reviews of Biophysics (2018), Jiang and Doudna, Annual Review of Biophysics (2017), Nishimasu et al., Cell (2014) 및 Nishimasu et al., Cell (2015)]에서 확인할 수 있다.
본 발명의 일 양태에서, OMNI CRISPR 뉴클레아제 도메인에 대한 유사성을 갖는 아미노산 서열은, 펩타이드가 OMNI CRISPR 뉴클레아제 도메인 활성의 유리한 특징을 나타내도록, 비-자연 발생 펩타이드, 예를 들어 CRISPR 뉴클레아제의 설계 및 제조에서 이용될 수 있다.
일 실시형태에서, 이러한 펩타이드, 예를 들어 CRISPR 뉴클레아제는 OMNI-103 CRISPR 뉴클레아제의 도메인 A, 도메인 B, 도메인 C, 도메인 D, 도메인 E, 도메인 F, 도메인 G, 도메인 H, 도메인 I, 또는 도메인 J 중 적어도 하나의 아미노산 서열과 적어도 100%, 99.5%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 82%, 81%, 80%, 79%, 78%, 77%, 76%, 75%, 74%, 73%, 72%, 71%, 또는 70% 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 펩타이드는 OMNI-103 CRISPR 뉴클레아제의 도메인 A, 도메인 B, 도메인 C, 도메인 D, 도메인 E, 도메인 F, 도메인 G, 도메인 H, 도메인 I, 및 도메인 J 중 아미노산 서열과 적어도 100%, 99.5%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 82%, 81%, 80%, 79%, 78%, 77%, 76%, 75%, 74%, 73%, 72%, 71% 또는 70% 동일성을 갖는 아미노산 서열로부터 선택되는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 또는 적어도 11개 아미노산 서열을 포함한다. 각각의 가능성은 별개의 실시형태를 나타낸다. 일 실시형태에서, 펩타이드는 OMNI-103 CRISPR 뉴클레아제의 도메인 A, 도메인 B, 도메인 C, 도메인 D, 도메인 E, 도메인 F, 도메인 G, 도메인 H, 도메인 I, 또는 도메인 J 중 적어도 하나의 아미노산 서열과 적어도 100%, 99.5%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 82%, 81%, 80%, 79%, 78%, 77%, 76%, 75%, 74%, 73%, 72%, 71%, 또는 70% 동일성을 갖는 아미노산 서열 외부의 전장 OMNI-103 CRISPR 뉴클레아제 아미노산 서열에 비해 광범위한 아미노산 가변성을 나타낸다. 일 실시형태에서, 펩타이드는 2개 도메인 서열 사이에 개재 아미노산 서열을 포함한다. 일 실시형태에서, 개재 아미노산 서열은 길이가 1 내지 10, 10 내지 20, 20 내지 40, 40 내지 50, 50 내지 60, 80 내지 100, 100 내지 150, 150 내지 200, 200 내지 250, 최대 100, 최대 200 또는 최대 300개 아미노산이다. 각각의 가능성은 별개의 실시형태를 나타낸다. 일 실시형태에서, 개재 서열은 링커 서열이다. 일 실시형태에서, CRISPR 뉴클레아제는 OMNI CRISPR 뉴클레아제 유래의 다수 도메인을 포함하고, 도메인은 바람직하게는 CRISPR 뉴클레아제의 N-말단에서 C-말단으로 알파벳 순서로 구성된다. 예를 들어, OMNI-103의 도메인 A, 도메인 E, 및 도메인 I를 포함하는 CRISPR 뉴클레아제는 CRISPR 뉴클레아제 서열에서 해당 도메인의 순서가 도메인 A, 도메인 E, 및 마지막으로 도메인 I일 것이며, 각각의 도메인의 한쪽 말단 또는 양쪽 말단에서 개재 서열의 가능성이 있다.
본 발명의 일 양태에서, 본 명세서에 기재된 OMNI CRISPR 뉴클레아제의 도메인 중 어느 하나를 인코딩하는 아미노산 서열은 원래 OMNI CRISPR 뉴클레아제 도메인 서열에 비해 하나 이상의 아미노산 치환을 포함할 수 있다. 아미노산 치환은 보존적 치환, 즉 원래 아미노산과 유사한 화학적 특성을 갖는 아미노산에 대한 치환일 수 있다. 예를 들어, 양으로 하전된 아미노산은 대안적인 양으로 하전된 아미노산으로 치환될 수 있으며, 예를 들어 아르기닌 잔기는 라이신 잔기로 치환될 수 있거나, 극성 아미노산은 상이한 극성 아미노산으로 치환될 수 있다. 보존적 치환은 더 용인 가능하며, OMNI CRISPR 뉴클레아제의 도메인 중 어느 하나를 인코딩하는 아미노산 서열은 이러한 치환의 10% 정도만큼을 포함할 수 있다. 아미노산 치환은 라디칼 치환, 즉 원래 아미노산과 상이한 화학적 특성을 갖는 아미노산으로의 치환일 수 있다. 예를 들어, 양으로 하전된 아미노산은 음으로 하전된 아미노산으로 치환될 수 있으며, 예를 들어 아르기닌 잔기는 글루탐산 잔기로 치환될 수 있거나, 극성 아미노산은 비-극성 아미노산으로 치환될 수 있다. 아미노산 치환은 반-보존적 치환일 수 있거나, 아미노산 치환은 임의의 다른 아미노산으로의 것일 수 있다. 치환은 원래 OMNI CRISPR 뉴클레아제 도메인 기능에 대해 활성을 변경시킬 수 있고, 예를 들어 촉매 뉴클레아제 활성을 감소시킬 수 있다.
본 발명의 일부 양태에 따르면, 개시된 조성물은 CRISPR 뉴클레아제를 포함하는 비-자연 발생 조성물을 제공하며, 여기서 CRISPR 뉴클레아제는 OMNI-103 CRISPR 뉴클레아제의 도메인 A, 도메인 B, 도메인 C, 도메인 D, 도메인 E, 도메인 F, 도메인 G, 도메인 H, 도메인 I, 또는 도메인 J 중 적어도 하나의 아미노산 서열에 상응하는 아미노산 서열을 포함한다. 각각의 OMNI CRISPR 뉴클레아제 아미노산 서열 내 각각의 도메인의 아미노산 범위는 보충 표 1에 제공되어 있다. 본 발명의 일부 실시형태에서, CRISPR 뉴클레아제는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개 아미노산 서열을 포함하며, 각각의 아미노산 서열은 OMNI-103 CRISPR 뉴클레아제의 아미노산 서열 도메인 A, 도메인 B, 도메인 C, 도메인 D, 도메인 E, 도메인 F, 도메인 G, 도메인 H, 도메인 I, 또는 도메인 J 중 어느 하나에 상응한다. 따라서, CRISPR 뉴클레아제는 OMNI CRISPR 뉴클레아제의 도메인 A, 도메인 B, 도메인 C, 도메인 D, 도메인 E, 도메인 F, 도메인 G, 도메인 H, 도메인 I, 또는 도메인 J 중 임의의 것에 상응하는 아미노산 서열의 임의의 조합을 포함할 수 있다. 일부 실시형태에서, 아미노산 서열은 길이가 적어도 100 내지 250, 250 내지 500, 500 내지 1000, 1000 내지 1500, 1000 내지 1700, 또는 1000 내지 2000개 아미노산이다.
질환 및 치료법
본 발명의 특정 실시형태는 유전자 편집, 치료 방법, 또는 치료법의 형태로서 질환 또는 장애와 연관된 특정 유전자좌에 대해 뉴클레아제를 표적화한다. 예를 들어, 유전자의 편집 또는 녹아웃을 유도하기 위해, 본 명세서에 개시된 신규 뉴클레아제는 맞춤 설계된 가이드 RNA 분자를 사용하여 유전자의 병원성 돌연변이 대립유전자에 대해 특이적으로 표적화될 수 있다. 가이드 RNA 분자는 바람직하게는 먼저 뉴클레아제의 PAM 요건을 고려함으로써 설계되며, 이는 또한 본 명세서에 나타낸 바와 같이 유전자 편집이 수행되는 시스템에 따라 달라진다. 예를 들어, 표적 부위에 대해 OMNI-103 뉴클레아제를 표적화하도록 설계된 가이드 RNA 분자는 OMNI-103 PAM 서열, 예를 들어 "NNRRHY" 또는 "NNRACT' 또는 "NNRVCT"에 이웃하는 DNA 이중-가닥 영역의 DNA 가닥에 상보적인 스페이서 영역을 포함하도록 설계된다. 가이드 RNA 분자는 바람직하게는 뉴클레아제의 특정 활성을 증가시키고 표적외 효과를 감소시키기 위해 충분하고 바람직하게는 최적의 길이의 스페이서 영역(즉, 표적 유전자좌에 대해 상보성을 갖는 가이드 RNA 분자의 영역)을 포함하도록 추가로 설계된다.
비-제한적인 예로서, 가이드 RNA 분자는 뉴클레아제에 의해 유발되는 DNA 손상 시 비-상동성 말단 연결(non-homologous end joining; NHEJ) 경로가 유도되고 프레임시프트 돌연변이의 유도에 의해 돌연변이 대립유전자의 침묵을 야기하도록, 예를 들어 시작 코돈 근처에서, 돌연변이 대립유전자의 특정 영역에 대해 뉴클레아제를 표적화하도록 설계될 수 있다. 가이드 RNA 분자 설계에 대한 이러한 접근법은 우성 음성 돌연변이의 효과를 변경하고 이에 의해 대상체를 치료하는 데 특히 유용하다. 별개의 비-제한적 예로서, 가이드 RNA 분자는, 뉴클레아제에 의해 유발된 DNA 손상 시 상동성 지정 복구(HDR) 경로가 유도되고 돌연변이 대립유전자의 주형 매개 교정을 야기하도록, 돌연변이된 대립유전자의 특정 병원성 돌연변이를 표적화하도록 설계될 수 있다. 가이드 RNA 분자 설계에 대한 이러한 접근법은 돌연변이된 대립유전자의 반가불충분성(haploinsufficiency) 효과를 변경하고 이에 의해 대상체를 치료하는 데 특히 유용하다.
질환 또는 장애를 치료하기 위한 변경을 위해 표적화될 수 있는 특정 유전자의 비-제한적 예는 본 명세서에서 하기에 제시되어 있다. 돌연변이 장애를 유도하는 특정 질환-연관 유전자 및 돌연변이는 문헌에 기재되어 있다. 이러한 돌연변이는 질환 연관 유전자의 대립유전자에 대해 CRISPR 조성물을 표적화하기 위해 DNA-표적화 RNA 분자를 설계하는 데 사용될 수 있으며, 여기서 CRISPR 조성물은 DNA 손상을 유발하고 DNA 복구 경로를 유도하여 대립유전자를 변경하고 이에 의해 돌연변이 장애를 치료한다.
ELANE 유전자의 돌연변이는 호중구감소증과 연관된다. 따라서, 제한 없이, ELANE를 표적화하는 본 발명의 실시형태는 호중구감소증을 앓고 있는 대상체를 치료하는 방법에서 사용될 수 있다.
CXCR4는 인간 면역결핍 바이러스 1형(HIV-1) 감염에 대한 공동 수용체이다. 따라서, 제한 없이, CXCR4를 표적화하는 본 발명의 실시형태는 HIV-1를 앓고 있는 대상체를 치료하고 대상체에서 HIV-1 감염에 대한 저항성을 부여하는 방법에서 사용될 수 있다.
프로그래밍된 세포 사멸 단백질 1(PD-1) 파괴는 종양 세포의 CAR-T 세포 매개 사멸을 향상시키고 PD-1은 다른 암 치료법에서 표적일 수 있다. 따라서, 제한 없이, PD-1을 표적화하는 본 발명의 실시형태는 암을 앓고 있는 대상체를 치료하는 방법에서 사용될 수 있다. 일 실시형태에서, 치료는 PD-1 결핍이 되도록 본 발명에 따라 변형된 T 세포를 이용한 CAR-T 세포 요법이다.
추가적으로, BCL11A는 헤모글로빈 생산의 억제에서 역할을 하는 유전자이다. 글로빈 생산은 BCL11A를 억제함으로써 지중해빈혈 또는 겸상 적혈구 빈혈과 같은 질환을 치료하기 위해 증가될 수 있다. 예를 들어, PCT 국제 공개 WO 2017/077394A2; 미국 공개 제US2011/0182867A1호; 문헌[Humbert et al. Sci. Transl. Med. (2019); 및 Canver et al. Nature (2015)]을 참조한다. 따라서, 제한 없이, BCL11A의 인핸서를 표적화하는 본 발명의 실시형태는 베타 지중해빈혈 또는 겸상 적혈구 빈혈을 앓고 있는 대상체를 치료하는 방법에서 사용될 수 있다.
본 발명의 실시형태는 또한, 하기 표 A 또는 표 B에 열거된 질환 또는 장애 중 임의의 것을 연구, 변경, 또는 치료하기 위해 임의의 질환-연관 유전자를 표적화하는 데 사용될 수 있다. 실제로, 유전자좌와 연관된 임의의 질환은 본 명세서에 개시된 뉴클레아제를 사용하여 적절한 질환-연관 유전자, 예를 들어 미국 공개 제2018/0282762A1호 및 유럽 특허 제EP3079726B1호에 열거된 것을 표적화함으로써 연구, 변경, 또는 치료될 수 있다.
표 A - 질환, 장애 및 이의 연관 유전자
표 B - 질환, 장애 및 이의 연관 유전자
달리 정의되지 않는 한, 본 명세서에 사용되는 모든 기술 및/또는 과학 용어는 본 발명이 속하는 업계의 당업자에 의해 일반적으로 이해되는 바와 동일한 의미를 갖는다. 본 명세서에 기재된 것과 유사하거나 동등한 방법 및 물질이 본 발명의 실시형태의 실시 또는 테스트에 사용될 수 있지만, 예시적인 방법 및/또는 물질이 본 명세서 하기에 기재되어 있다. 상충하는 경우, 정의를 포함하여 본 명세서가 우선할 것이다. 추가적으로, 물질, 방법 및 실시예는 단지 예시적인 것일 뿐이며, 반드시 제한하려는 것이 아니다.
본 논의에서 달리 언급되지 않는 한, 본 발명의 실시형태의 특징 또는 특징들의 특징적인 조건 또는 관계를 수식하는 "실질적으로" 및 "약"과 같은 형용사는 조건 또는 특성이 의도된 적용에 대한 실시형태의 작동에 허용 가능한 허용 오차 내에서 정의됨을 의미하는 것으로 이해된다. 달리 나타내지 않는 한, 명세서 및 청구범위에서 단어 "또는"은 배타적인 "또는"이 아닌 포괄적인 "또는"인 것으로 간주되며, 결합하는 항목 중 적어도 하나 및 임의의 조합을 나타낸다.
본 명세서에서 상기 및 다른 곳에 사용되는 바와 같이 용어 "하나("a" 및 "an")"는 열거된 구성요소 중 "하나 이상"을 지칭하는 것으로 이해되어야 한다. 구체적으로 달리 언급되지 않는 한, 단수의 사용은 복수를 포함한다는 것이 당업자에게 명백할 것이다. 따라서, 용어 "하나" 및 "적어도 하나"는 본 출원에서 호환 가능하게 사용된다.
달리 나타내지 않는 한, 본 교시를 더 잘 이해하기 위한 목적 및 교시의 범주를 제한하지 않는 목적으로, 양, 백분율 또는 비율을 표현하는 모든 숫자, 및 본 명세서 및 청구범위에서 사용되는 다른 수치는 모든 경우에 용어 "약"으로 수식되는 것으로 이해되어야 한다. 따라서, 반대로 표시되지 않는 한, 이하 명세서 및 첨부된 청구범위에 제시된 수치 매개변수는 얻고자 하는 원하는 특성에 따라 변할 수 있는 근사치이다. 적어도, 각각의 수치 매개변수는 적어도 보고된 유효 숫자의 수에 비추어 그리고 반올림 기법을 적용하여 해석되어야 한다.
본 명세서에서 수치 범위가 인용되는 경우, 달리 언급되지 않는 한, 본 발명은 상한과 하한을 포함하여 이들 사이의 각각의 정수를 고려하는 것으로 이해된다.
본 출원의 설명 및 청구범위에서, 동사 "포함하다(comprise)", "포함하다(include)" 및 "갖다" 각각 및 이들의 활용어는 동사의 목적어 또는 목적어들이 반드시 동사의 주어 또는 주어들의 구성요소, 요소 또는 부분의 완전한 열거일 필요가 없음을 나타내는 데 사용된다. 본 명세서에서 사용되는 바와 같이 다른 용어는 당업계에 잘 알려진 의미로 정의되는 것을 의미한다.
용어 "폴리뉴클레오타이드", "뉴클레오타이드", "뉴클레오타이드 서열", "핵산" 및 "올리고뉴클레오타이드"는 호환 가능하게 사용된다. 이들 용어는 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 중 어느 하나, 또는 이의 유사체인 임의의 길이의 뉴클레오타이드의 중합체 형태를 지칭한다. 폴리뉴클레오타이드는 임의의 3차원 구조를 가질 수 있고, 알려지거나 알려지지 않은 임의의 기능을 수행할 수 있다. 폴리뉴클레오타이드의 비-제한적인 예로는 유전자 또는 유전자 단편의 코딩 또는 비-코딩 영역, 연결 분석으로부터 정의된 유전자좌, 엑손, 인트론, 전령 RNA(mRNA), 전달 RNA, 리보솜 RNA, 작은 간섭 RNA(siRNA), 작은-헤어핀 RNA(shRNA), 마이크로-RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오타이드, 분지형 폴리뉴클레오타이드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 핵산 프로브, 및 프라이머가 있다. 폴리뉴클레오타이드는 하나 이상의 변형된 뉴클레오타이드, 예컨대, 메틸화된 뉴클레오타이드 및 뉴클레오타이드 유사체를 포함할 수 있다. 존재하는 경우, 뉴클레오타이드 구조에 대한 변형은 중합체의 회합 전 또는 후에 부여될 수 있다. 뉴클레오타이드 서열은 비-뉴클레오타이드 구성요소에 의해 중단될 수 있다. 폴리뉴클레오타이드는 중합 후에, 예컨대, 표지화 구성요소와의 접합에 의해 추가로 변형될 수 있다.
용어 "뉴클레오타이드 유사체" 또는 "변형된 뉴클레오타이드"는 뉴클레오사이드의 질소 함유 염기(예를 들어, 사이토신(C), 티민(T) 또는 우라실(U), 아데닌(A) 또는 구아닌(G))에 또는 그 상에, 뉴클레오사이드의 당 모이어티(예를 들어, 리보스, 데옥시리보스, 변형된 리보스, 변형된 데옥시리보스, 6원 당 유사체, 또는 개방 사슬 당 유사체)에 또는 그 상에, 또는 인산염에 하나 이상의 화학적 변형(예를 들어, 치환)을 포함하는 뉴클레오타이드를 지칭한다. 본 명세서에 기재된 RNA 서열 각각은 하나 이상의 뉴클레오타이드 유사체를 포함할 수 있다.
본 명세서에서 사용되는 바와 같이, 다음 뉴클레오타이드 식별자가 언급된 뉴클레오타이드 염기(들)를 나타내는 데 사용된다:
본 명세서에서 사용되는 바와 같이, 용어 "표적화 서열" 또는 "표적화 분자"는 특정 표적 서열에 혼성화할 수 있는 뉴클레오타이드 서열을 포함하는 뉴클레오타이드 서열 또는 분자를 지칭하고, 예를 들어 표적화 서열은 표적화 서열의 길이에 따라 표적화되는 서열에 적어도 부분적으로 상보적인 뉴클레오타이드 서열을 갖는다. 표적화 서열 또는 표적화 분자는 CRISPR 뉴클레아제와 복합체를 형성할 수 있는 표적화 RNA 분자의 일부일 수 있으며, 표적화 서열은 CRISPR 복합체의 표적화 부분의 역할을 한다. 표적화 서열을 갖는 분자가 CRISPR 분자와 동시에 존재하는 경우, RNA 분자는 특정 표적 서열에 대해 CRISPR 뉴클레아제를 표적화할 수 있다. 각각의 가능성은 별개의 실시형태를 나타낸다. 표적화 RNA 분자는 임의의 원하는 서열을 표적화하도록 맞춤 설계될 수 있다.
본 명세서에서 사용되는 바와 같이 용어 "표적화"는 표적화된 뉴클레오타이드 서열을 갖는 핵산에 대한 표적화 서열 또는 표적화 분자의 우선적인 혼성화를 지칭한다. 용어 "표적화"는 표적화된 뉴클레오타이드 서열을 갖는 핵산의 우선적인 표적화가 존재하지만, 표적내 혼성화에 추가적으로 의도하지 않은 표적외 혼성화가 또한 일어날 수 있도록, 가변 혼성화 효율을 포함하는 것으로 이해된다. RNA 분자가 서열을 표적화하는 경우, RNA 분자 및 CRISPR 뉴클레아제 분자의 복합체는 뉴클레아제 활성을 위해 서열을 표적화하는 것으로 이해된다.
복수의 세포에 존재하는 DNA 서열을 표적화하는 맥락에서, 표적화는 하나 이상의 세포에서 RNA 분자의 가이드 서열 부분과 서열의 혼성화를 포함하고, 또한 복수의 세포에서 모든 세포보다 적은 수의 세포에서 RNA 분자와 표적 서열의 혼성화를 포함하는 것으로 이해된다. 따라서, RNA 분자가 복수의 세포에서 서열을 표적화하는 경우, RNA 분자와 CRISPR 뉴클레아제의 복합체는 하나 이상의 세포에서 표적 서열과 혼성화하는 것으로 이해되고, 또한 모든 세포보다 적은 수의 세포에서 표적 서열과 혼성화할 수 있는 것으로 이해된다. 따라서, RNA 분자와 CRISPR 뉴클레아제의 복합체는 하나 이상의 세포에서 표적 서열과의 혼성화와 관련하여 이중 가닥 파손을 도입하고 또한 모든 세포보다 적은 수의 세포에서 표적 서열과의 혼성화와 관련하여 이중 가닥 파손을 도입할 수 있는 것으로 이해된다. 본 명세서에서 사용되는 바와 같이, 용어 "변형된 세포"는 이중 가닥 파손이 표적 서열과의 혼성화, 즉 표적내 혼성화의 결과로서 RNA 분자와 CRISPR 뉴클레아제의 복합체에 의해 영향을 받는 세포를 지칭한다.
본 명세서에서 사용되는 바와 같이, 용어 "야생형"은 당업자에 의해 이해되는 당업계의 용어이며 돌연변이체 또는 변이체 형태와 구별되는 자연에서 발생하는 유기체, 균주, 유전자 또는 특징의 전형적인 형태를 의미한다. 따라서, 본 명세서에서 사용되는 바와 같이, 아미노산 또는 뉴클레오타이드의 서열이 야생형 서열을 지칭하는 경우, 변이체는, 예를 들어 치환, 결실, 삽입을 포함하는, 해당 서열의 변이체를 지칭한다, 본 발명의 실시형태에서, 조작된 CRISPR 뉴클레아제는 표 1에 표시된 CRISPR 뉴클레아제 중 임의의 것의 CRISPR 뉴클레아제와 비교하여 적어도 하나의 아미노산 변형(예를 들어, 치환, 결실, 및/또는 삽입)을 포함하는 변이체 CRISPR 뉴클레아제이다.
용어 "비-자연 발생" 또는 "조작된"은 호환 가능하게 사용되며 인간 조작을 나타낸다. 핵산 분자 또는 폴리펩타이드를 지칭할 때 상기 용어는 핵산 분자 또는 폴리펩타이드에는 자연에서 자연적으로 회합되고 자연에서 발견되는 바와 같은 적어도 하나의 다른 구성요소가 적어도 실질적으로 없다는 것을 의미할 수 있다.
본 명세서에서 사용되는 바와 같이 용어 "아미노산"은 글리신 및 D 또는 I를 둘 다 포함하는 천연 및/또는 비천연 또는 합성 아미노산, 광학 이성질체, 및 아미노산 유사체 및 펩타이드유사체(peptidomimetic)를 포함한다.
본 명세서에서 사용되는 바와 같이, "게놈 DNA"는 관심이 있는 세포 또는 세포들에 존재하는 선형 및/또는 염색체 DNA 및/또는 플라스미드 또는 다른 염색체외 DNA 서열을 지칭한다. 일부 실시형태에서, 관심이 있는 세포는 진핵 세포이다. 일부 실시형태에서, 관심이 있는 세포는 원핵 세포이다. 일부 실시형태에서, 방법은 게놈 DNA 서열의 미리 결정된 표적 부위에서 이중-가닥 파손(DSB)을 생성하여, 게놈의 표적 부위(들)에서 DNA 서열의 돌연변이, 삽입, 및/또는 결실을 초래한다.
"진핵" 세포는 진균 세포(예컨대, 효모), 식물 세포, 동물 세포, 포유동물 세포 및 인간 세포를 포함하지만 이에 제한되지 않는다.
본 명세서에서 사용되는 바와 같이 용어 "뉴클레아제"는 핵산의 뉴클레오타이드 서브유닛 사이에서 포스포다이에스터 결합을 절단할 수 있는 효소를 지칭한다. 뉴클레아제는 천연 공급원으로부터 단리되거나 유래될 수 있다. 천연 공급원은 임의의 살아있는 유기체일 수 있다. 대안적으로, 뉴클레아제는 포스포다이에스터 결합 절단 활성을 유지하는 변형된 또는 합성 단백질일 수 있다.
본 명세서에서 사용되는 바와 같이 용어 "PAM"은 표적화된 DNA 서열에 근접하게 위치하고 CRISPR 뉴클레아제에 의해 인식되는 표적 DNA의 뉴클레오타이드 서열을 지칭한다. PAM 서열은 뉴클레아제 동일성에 따라 다를 수 있다.
본 명세서에서 사용되는 바와 같이 용어 "돌연변이 장애" 또는 "돌연변이 질환"은 돌연변이에 의해 유발된 유전자의 기능장애와 관련된 임의의 장애 또는 질환을 지칭한다. 돌연변이 장애로서 나타나는 기능장애 유전자는 이의 대립유전자의 적어도 하나에 돌연변이를 포함하고 "질환-연관 유전자"로 지칭된다. 돌연변이는 질환-연관 유전자의 임의의 부분에, 예를 들어 조절, 코딩, 또는 비-코딩 부분에 있을 수 있다. 돌연변이는 돌연변이의 임의의 부류, 예컨대, 치환, 삽입, 또는 결실일 수 있다. 질환-연관 유전자의 돌연변이는 임의의 유형의 돌연변이, 예컨대, 열성, 우성 음성, 기능 획득, 기능 손실, 또는 유전자 산물의 반가불충분성을 야기하는 돌연변이의 메커니즘에 따라 장애 또는 질환으로 나타날 수 있다.
숙련된 기술자는 본 발명의 실시형태가, 예컨대, 프로토스페이서 인접 모티프(PAM) 옆에 관심이 있는 표적 게놈 DNA 서열과 회합하도록, 뉴클레아제, 예를 들어 CRISPR 뉴클레아제와 복합체화할 수 있는 RNA 분자를 개시한다는 것을 인식할 것이다. 그 다음 뉴클레아제는 표적 DNA의 절단을 매개하여 프로토스페이서 내에서 이중-가닥 파손을 형성한다.
본 발명의 실시형태에서, CRISPR 뉴클레아제 및 표적화 분자는 표적 DNA 서열에 결합하여 표적 DNA 서열의 절단을 초래하는 CRISPR 복합체를 형성한다. CRISPR 뉴클레아제는 추가적인 별개의 tracrRNA 분자 없이 CRISPR 뉴클레아제 및 RNA 분자를 포함하는 CRISPR 복합체를 형성할 수 있다. 대안적으로, CRISPR 뉴클레아제는 CRISPR 뉴클레아제, RNA 분자, 및 tracrRNA 분자 사이에 CRISPR 복합체를 형성할 수 있다.
용어 "단백질 결합 서열" 또는 "뉴클레아제 결합 서열"은 CRISPR 뉴클레아제와 결합하여 CRISPR 복합체를 형성할 수 있는 서열을 지칭한다. 숙련된 기술자는 CRISPR 뉴클레아제와 결합하여 CRISPR 복합체를 형성할 수 있는 tracrRNA는 단백질 또는 뉴클레아제 결합 서열을 포함한다는 것을 이해할 것이다.
CRISPR 뉴클레아제의 "RNA 결합 부분"은 RNA 분자에 결합하여 CRISPR 복합체를 형성할 수 있는 CRISPR 뉴클레아제의 부분, 예를 들어 tracrRNA 분자의 뉴클레아제 결합 서열을 지칭한다. CRISPR 뉴클레아제의 "활성 부분" 또는 "활성적인 부분"은, 예를 들어 DNA-표적화 RNA 분자와 복합체를 형성할 때, DNA 분자에서 이중 가닥 파손을 초래하는 CRISPR 뉴클레아제의 부분을 지칭한다.
RNA 분자는 염기쌍 형성을 통해 tracrRNA에 혼성화하고 CRISPR 복합체의 형성을 촉진시키기 위해 tracrRNA 분자에 충분히 상보적인 서열을 포함할 수 있다. (미국 특허 제8,906,616호 참조). 본 발명의 실시형태에서, RNA 분자는 tracr 메이트(mate) 서열을 갖는 부분을 더 포함할 수 있다.
본 발명의 실시형태에서, 표적화 분자는 tracrRNA 분자의 서열을 더 포함할 수 있다. 이러한 실시형태는 함께 단일 가이드 RNA(sgRNA)를 형성하는, RNA 분자의 가이드 부분(gRNA 또는 crRNA) 및 전사활성화 crRNA(tracrRNA)의 합성 융합체로서 설계될 수 있다. (문헌[Jinek et al., Science (2012)] 참조). 본 발명의 실시형태는 또한 별개의 tracrRNA 분자 및 가이드 서열 부분을 포함하는 별개의 RNA 분자를 이용하는 CRISPR 복합체를 형성할 수 있다. 이러한 실시형태에서, tracrRNA 분자는 염기 쌍형성을 통해 RNA 분자와 혼성화할 수 있고 본 명세서에 기재된 본 발명의 특정 적용에서 유리할 수 있다.
본 발명의 실시형태에서, RNA 분자는 RNA 분자의 구조를 추가로 한정할 수 있는 "넥서스(nexus)" 영역 및/또는 "헤어핀" 영역을 포함할 수 있다. (문헌[Briner et al., Molecular Cell (2014)] 참조).
본 명세서에서 사용되는 바와 같이, 용어 "직접 반복 서열"은 뉴클레오타이드 서열의 특정 아미노산 서열의 2개 이상의 반복부를 지칭한다.
본 명세서에서 사용되는 바와 같이, CRISPR 뉴클레아제와 "상호작용"하거나 CRISPR 뉴클레아제와 "결합"할 수 있는 RNA 서열 또는 분자는 CRISPR 뉴클레아제와 CRISPR 복합체를 형성하는 RNA 서열 또는 분자 능력을 지칭한다.
본 명세서에서 사용되는 바와 같이, 용어 "작동 가능하게 연결된"은 의도된 방식으로 기능할 수 있게 하는 2개의 서열 또는 분자 사이의 관계(즉, 융합, 혼성화)를 지칭한다. 본 발명의 실시형태에서, RNA 분자가 프로모터에 작동 가능하게 연결될 때, RNA 분자 및 프로모터는 둘 다 의도된 방식으로 기능하도록 허용된다.
본 명세서에서 사용되는 바와 같이, 용어 "이종 프로모터"는 촉진되는 분자 또는 경로와 함께 자연적으로 발생하지 않는 프로모터를 지칭한다.
본 명세서에서 사용되는 바와 같이, 서열 또는 분자는 분자의 서열 사이의 염기 또는 아미노산의 X%가 동일하고 동일한 상대 위치에 있는 경우 또 다른 서열 또는 분자에 대해 X% "서열 동일성"을 갖는다. 예를 들어, 제2 뉴클레오타이드 서열과 적어도 95% 서열 동일성을 갖는 제1 뉴클레오타이드 서열은 동일한 상대 위치에서 다른 서열과 동일한, 적어도 95%의 염기를 가질 것이다.
핵 국재화 서열
용어 "핵 국재화 서열" 및 "NLS"는 핵 외피 장벽을 가로질러 세포의 세포질로부터 연관된 단백질의 수송을 지시하는 아미노산 서열/펩타이드를 나타내기 위해 호환 가능하게 사용된다. 용어 "NLS"는 특정 펩타이드의 핵 국재화 서열뿐만 아니라 핵 외피 장벽을 가로질러 세포질 폴리펩타이드의 전좌를 지시할 수 있는 이의 유도체를 포함하는 것으로 의도된다. NLS는 폴리펩타이드의 N-말단, C-말단, 또는 N-말단과 C-말단 둘 다에 부착될 때 폴리펩타이드의 핵 전좌를 지시할 수 있다. 추가적으로, N-말단 또는 C-말단에 의해 폴리펩타이드의 아미노산 서열을 따라 무작위로 위치한 아미노산 측쇄에 대해 커플링된 NLS를 갖는 폴리펩타이드는 전좌될 것이다. 전형적으로, NLS는 단백질 표면에 노출된 양으로 하전된 라이신 또는 아르기닌의 하나 이상의 짧은 서열로 이루어지지만, 다른 유형의 NLS가 알려져 있다. NLS의 비-제한적인 예는 SV40 바이러스 거대 T-항원, 뉴클레오플라스민, c-myc, hRNPAl M9 NLS, 임포틴-알파 유래 IBB, 근종 T 단백질, 인간 p53, 마우스 c-abl IV, 인플루엔자 바이러스 NS1, 간염 바이러스 델타 항원, 마우스 Mx1 단백질, 인간 폴리(ADP-리보스) 중합효소, 및 스테로이드 호르몬 수용체(인간) 글루코코르티코이드로부터 유래된 NLS 서열을 포함한다.
전달
본 명세서에 기재된 CRISPR 뉴클레아제 또는 CRISPR 조성물은 단백질, DNA 분자, RNA 분자, 리보핵단백질(RNP), 핵산 벡터, 또는 이들의 임의의 조합으로서 전달될 수 있다. 일부 실시형태에서, RNA 분자는 화학적 변형을 포함한다. 적합한 화학적 변형의 비-제한적인 예는 2'-0-메틸(M), 2'-0-메틸, 3'포스포로티오에이트(MS) 또는 2'-0-메틸, 3'티오PACE(MSP), 슈도우리딘, 및 1-메틸 슈도-우리딘을 포함한다. 각각의 가능성은 본 발명의 별개의 실시형태를 나타낸다.
본 명세서에 기재된 CRISPR 뉴클레아제 및/또는 이를 인코딩하는 폴리뉴클레오타이드, 및 선택적으로 추가적인 단백질(예를 들어, ZFP, TALEN, 전사 인자, 제한 효소) 및/또는 가이드 RNA와 같은 뉴클레오타이드 분자는 임의의 적합한 수단에 의해 표적 세포로 전달될 수 있다. 표적 서열은 임의의 환경에서, 예를 들어 단리되거나 단리되지 않은, 배양물, 시험관내, 생체외, 생체내 또는 식물내에서 유지되는, 임의의 유형의 세포, 예를 들어 진핵 또는 원핵 세포일 수 있다.
일부 실시형태에서, 전달될 조성물은 뉴클레아제의 mRNA 및 가이드의 RNA를 포함한다. 일부 실시형태에서, 전달될 조성물은 뉴클레아제의 mRNA, 가이드의 RNA 및 공여체 주형을 포함한다. 일부 실시형태에서, 전달될 조성물은 CRISPR 뉴클레아제 및 가이드 RNA를 포함한다. 일부 실시형태에서, 전달될 조성물은 CRISPR 뉴클레아제, 가이드 RNA, 그리고, 예를 들어 상동성 지정 복구를 통해 유전자 편집을 위한 공여체 주형을 포함한다. 일부 실시형태에서, 전달될 조성물은 뉴클레아제의 mRNA, DNA-표적화 RNA 및 tracrRNA를 포함한다. 일부 실시형태에서, 전달될 조성물은 뉴클레아제의 mRNA, DNA-표적화 RNA 및 tracrRNA 및 공여체 주형을 포함한다. 일부 실시형태에서, 전달될 조성물은 CRISPR 뉴클레아제, DNA-표적화 RNA 및 tracrRNA를 포함한다. 일부 실시형태에서, 전달될 조성물은 CRISPR 뉴클레아제, DNA-표적화 RNA 및 tracrRNA, 그리고, 예를 들어 상동성 지정 복구를 통해 유전자 편집을 위한 공여체 주형을 포함한다.
임의의 적합한 바이러스 벡터 시스템이 RNA 조성물을 전달하는 데 사용될 수 있다. 통상적인 바이러스 및 비-바이러스 기반 유전자 전달 방법이 세포(예를 들어, 포유동물 세포, 식물 세포 등) 및 표적 조직에서 핵산 및/또는 CRISPR 뉴클레아제를 도입하는 데 사용될 수 있다. 이러한 방법은 또한 CRISPR 뉴클레아제 단백질을 인코딩하는 핵산 및/또는 CRISPR 뉴클레아제 단백질을 시험관내에서 세포에 투여하는 데 사용될 수 있다. 특정 실시형태에서, 핵산 및/또는 CRISPR 뉴클레아제는 생체내 또는 생체외 유전자 치료법 용도를 위해 투여된다. 비-바이러스 벡터 전달 시스템은 네이키드(naked) 핵산, 및 리포솜 또는 폴록사머와 같은 전달 비히클과 복합체화된 핵산을 포함한다. 유전자 치료법 절차에 대한 검토를 위해, 문헌[Anderson, Science (1992); Nabel and Felgner, TIBTECH (1993); Mitani and Caskey, TIBTECH (1993); Dillon, TIBTECH (1993); Miller, Nature (1992); Van Brunt, Biotechnology (1988); Vigne et al., Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer and Perricaudet, British Medical Bulletin (1995); Haddada et al., Current Topics in Microbiology and Immunology (1995); 및 Yu et al., Gene Therapy 1:13-26 (1994)]을 참조한다.
핵산 및/또는 단백질의 비-바이러스 전달의 방법은 전기천공, 리포펙션, 미세주사, 바이오리스틱(biolistic), 입자 총 가속화, 바이로좀, 리포솜, 면역리포솜, 지질 나노입자(LNP), 다중양이온 또는 지질:핵산 접합체, 인공비리온, 및 핵산의 작용체-증강 흡수를 포함하거나 박테리아 또는 바이러스(예를 들어, 아그로박테리움(Agrobacterium), 리조비움 종 NGR234(Rhizobium sp. NGR234), 시노리조보이움멜리로티(Sinorhizoboiummeliloti), 메조리조비움 로티(Mesorhizobium loti), 담배 모자이크 바이러스, 감자 바이러스 X, 컬리플라워 모자이크 바이러스 및 카싸바 베인 모자이크 바이러스에 의해 식물 세포로 전달될 수 있다. 예를 들어, 문헌[Chung et al. Trends Plant Sci. (2006)]을 참조한다. 예를 들어, Sonitron 2000 시스템(Rich-Mar)을 사용하는 초음파천공(sonoporation)이 또한 핵산의 전달에 사용될 수 있다. 단백질 및/또는 핵산의 양이온성-지질 매개 전달이 또한 생체내, 생체외, 또는 시험관내 전달 방법으로서 고려된다. 문헌[Zuris et al., Nat. Biotechnol. (2015), Coelho et al., N. Engl. J. Med. (2013); Judge et al., Mol. Ther. (2006); 및 Basha et al., Mol. Ther. (2011)]을 참조한다.
비-바이러스 벡터, 예컨대, 트랜스포존-기반 시스템, 예를 들어 재조합 Sleeping Beauty 트랜스포존 시스템 또는 재조합 PiggyBac 트랜스포좀 시스템은 또한 표적 세포로 전달될 수 있고 표적 세포에서 조성물의 분자의 폴리뉴클레오타이드 서열 또는 조성물의 분자를 인코딩하는 폴리뉴클레오타이드 서열의 전위에 이용될 수 있다.
추가적인 예시적 핵산 전달 시스템은 Amaxa® Biosystems(독일 쾰른 소재), Maxcyte, Inc.(미국 메릴랜드주 록빌 소재), BTX Molecular Delivery Systems(미국 매사추세츠주 홀리스턴 소재) 및 Copernicus Therapeutics Inc.,(예를 들어, 미국 특허 제6,008,336호 참조)에 의해 제공되는 것을 포함한다. 리포펙션은, 예를 들어 미국 특허 제5,049,386호, 미국 특허 제4,946,787호; 및 미국 특허 제4,897,355호에 기재되어 있으며 리포펙션 시약은 상업적으로 판매된다(예를 들어, Transfectam.TM., Lipofectin.TM. 및 Lipofectamine.TM. RNAiMAX). 폴리뉴클레오타이드의 효율적인 수용체-인식 리포펙션에 적합한 양이온성 및 중성 지질은 PCT 국제 공개 WO/1991/017424 및 WO/1991/016024에 개시된 것을 포함한다. 전달은 세포(생체외 투여) 또는 표적 조직(생체내 투여)에 대한 것일 수 있다.
면역지질 복합체와 같은 표적화된 리포솜을 포함하는, 지질:핵산 복합체의 제조는 당업자에게 잘 알려져 있다(예를 들어, 문헌[Crystal, Science (1995); Blaese et al., Cancer Gene Ther. (1995); Behr et al., Bioconjugate Chem. (1994); Remy et al., Bioconjugate Chem. (1994); Gao and Huang, Gene Therapy (1995); Ahmad and Allen, Cancer Res., (1992)]; 미국 특허 제4,186,183호; 제4,217,344호; 제4,235,871호; 제4,261,975호; 제4,485,054호; 제4,501,728호; 제4,774,085호; 제4,837,028호; 및 제4,946,787호 참조).
추가적인 전달 방법은 EnGeneIC 전달 비히클(EDV) 내로 전달될 핵산 패키징의 사용을 포함한다. 이들 EDV는 이중특이적 항체를 사용하여 표적 조직으로 특이적으로 전달되며, 여기서 항체의 하나의 아암(arm)은 표적 조직에 대한 특이성을 가지고 다른 아암은 EDV에 대한 특이성을 갖는다. 항체는 EDV를 표적 세포 표면으로 가져간 다음, EDV가 엔도시토시스에 의해 세포 내로 들어간다. 일단 세포 안에 들어가면, 내용물이 방출된다(문헌[MacDiamid et al., Nature Biotechnology (2009)] 참조).
전달 비히클은, 예를 들어 "유전자총"을 통해 세포 내로 발사되는 금 입자에 대한 조성물의 부착, 당업계에 알려진 다른 전달 비히클 중에서, 렌티바이러스, AAV, 및 레트로바이러스를 포함하지만 이에 제한되지 않는 바이러스 비히클, 바이러스-유사 입자(VLP), 대형 VLP(LVLP), 렌티바이러스-유사 입자, 트랜스포존, 바이러스 벡터, 네이키드 벡터, DNA, 또는 RNA에 의해, 박테리아, 바람직하게는 비-병원성, 비히클, 나노입자, 엑소좀, 미세소포, 유전자총 전달을 포함하지만 이에 제한되지 않는다.
CRISPR 뉴클레아제 및/또는 CRISPR 뉴클레아제를 인코딩하는 폴리뉴클레오타이드, 및 선택적으로 추가적인 뉴클레오타이드 분자 및/또는 추가적인 단백질 또는 펩타이드의 전달은 단일 전달 비히클 또는 방법 또는 상이한 전달 비히클 또는 방법의 조합을 이용함으로써 수행될 수 있다. 예를 들어, CRISPR 뉴클레아제는 LNP를 이용하여 세포에 전달될 수 있고, crRNA 분자 및 tracrRNA 분자는 AAV를 이용하여 세포에 전달될 수 있다. 대안적으로, CRISPR 뉴클레아제는 AAV 입자를 이용하여 세포에 전달될 수 있고, crRNA 분자 및 tracrRNA 분자는 별개의 AAV 입자를 이용하여 세포에 전달될 수 있으며, 이는 크기 제한으로 인해 유리할 수 있다.
핵산의 전달을 위한 RNA 또는 DNA 바이러스 기반 시스템의 사용은 신체의 특정 세포에 바이러스를 표적화하고 바이러스 페이로드를 핵으로 수송하기 위한 고도로 진화된 공정을 이용한다. 바이러스 벡터는 환자에게 직접 투여될 수 있거나(생체내) 시험관내에서 세포를 치료하는 데 사용될 수 있고 변형된 세포는 환자에게 투여된다(생체외). 핵산의 전달을 위한 종래 바이러스 기반 시스템은 유전자 전달을 위한 재조합 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관, 백시니아 및 단순 헤르페스 바이러스 벡터를 포함하지만 이에 제한되지 않는다. 그러나, 본 명세서에 기재된 RNA 조성물의 전달을 위해서는 RNA 바이러스가 바람직하다. 추가적으로, 높은 형질도입 효율이 많은 다양한 세포 유형 및 표적 조직에서 관찰되었다. 본 발명의 핵산은 비-통합 렌티바이러스에 의해 전달될 수 있다. 선택적으로, 렌티바이러스를 이용한 RNA 전달이 사용된다. 선택적으로 렌티바이러스는 뉴클레아제의 mRNA, 가이드의 RNA를 포함한다. 선택적으로 렌티바이러스는 뉴클레아제의 mRNA, 가이드의 RNA 및 공여체 주형을 포함한다. 선택적으로, 렌티바이러스는 뉴클레아제 단백질, 가이드 RNA를 포함한다. 선택적으로, 렌티바이러스는 뉴클레아제 단백질, 가이드 RNA 및/또는, 예를 들어 상동성 지정 복구를 통해 유전자 편집을 위한 공여체 주형을 포함한다. 선택적으로, 렌티바이러스는 뉴클레아제의 mRNA, DNA-표적화 RNA 및 tracrRNA를 포함한다. 선택적으로, 렌티바이러스는 뉴클레아제의 mRNA, DNA-표적화 RNA 및 tracrRNA, 및 공여체 주형을 포함한다. 선택적으로, 렌티바이러스는 뉴클레아제 단백질, DNA-표적화 RNA 및 tracrRNA를 포함한다. 선택적으로, 렌티바이러스는 뉴클레아제 단백질, DNA-표적화 RNA, 및 tracrRNA, 및, 예를 들어 상동성 지정 복구를 통해 유전자 편집을 위한 공여체 주형을 포함한다.
상기 언급된 바와 같이, 본 명세서에 기재된 조성물은 비-통합 렌티바이러스 입자 방법, 예를 들어 LentiFlash®시스템을 사용하여 표적 세포로 전달될 수 있다. 이러한 방법은 표적 세포로의 RNA의 전달이 표적 세포 내부에서 본 명세서에 기재된 조성물의 회합을 초래하도록, 표적 세포 내로 mRNA 또는 다른 유형의 RNA를 전달하는 데 사용될 수 있다. 또한 PCT 국제 공개 번호 WO2013/014537, WO2014/016690, WO2016185125, WO2017194902, 및 WO2017194903을 참조한다.
레트로바이러스의 향성은 외래 외피 단백질을 포함시킴으로써 변경되어, 표적 세포의 잠재적 표적 집단을 확장시킬 수 있다. 렌티바이러스 벡터는 비-분열 세포를 형질도입하거나 감염시킬 수 있는 레트로바이러스 벡터이고 전형적으로 높은 바이러스 역가를 생산한다. 레트로바이러스 유전자 전달 시스템의 선택은 표적 조직에 따라 다르다. 레트로바이러스 벡터는 최대 6 내지 10 kb의 외래 서열에 대한 패키징 능력을 갖는 시스-작용 장형 말단 반복부로 구성된다. 최소 시스-작용 LTR이 벡터의 복제 및 패키징에 충분하며, 그 다음 이는 표적 세포 내로 치료용 유전자를 통합시켜 영구적인 이식유전자 발현을 제공하기 위해 사용된다. 널리 사용되는 레트로바이러스 벡터는 뮤린 백혈병 바이러스(MuLV), 긴팔 원숭이 백혈병 바이러스(GaLV), 유인원 면역결핍 바이러스(SIV), 인간 면역결핍 바이러스(HIV), 및 이의 조합에 기반한 것을 포함된다(예를 들어, 문헌[Buchscher Panganiban, J. Virol. (1992); Johann et al., J. Virol. (1992); Sommerfelt et al., Virol. (1990); Wilson et al., J. Virol. (1989); Miller et al., J. Virol. (1991)]; PCT 국제 공개 WO/1994/026877A1 참조).
적어도 6개의 바이러스 벡터 접근법이 현재 임상 시험에서 유전자 전달을 위해 이용 가능하며, 이는 형질도입 작용제를 생성하기 위해 헬퍼 세포주 내로 삽입된 유전자에 의한 결함 벡터의 보완이 연루되는 접근법을 이용한다.
pLASN 및 MFG-S는 임상 시험에서 사용된 레트로바이러스 벡터의 예이다(Dunbar et al., Blood (1995); Kohn et al., Nat. Med. (1995); Malech et al., PNAS (1997)). PA317/pLASN은 유전자 치료법 시험에서 사용된 최초의 치료용 벡터이었다. (Blaese et al., Science (1995)). 50% 이상의 형질도입 효율이 MFG-S 패키징된 벡터에서 관찰되었다. (Ellem et al., Immunol Immunother. (1997); Dranoff et al., Hum. Gene Ther. (1997)).
패키징 세포는 숙주 세포를 감염시킬 수 있는 바이러스 입자를 형성하는 데 사용된다. 이러한 세포는 아데노바이러스, AAV를 패키징하는 293 세포, 및 레트로바이러스를 패키징하는 psi.2 세포 또는 PA317 세포를 포함한다. 유전자 치료법에서 사용되는 바이러스 벡터는 보통 바이러스 입자 내로 핵산 벡터를 패키징하는 생산체 세포주에 의해 생성된다. 벡터는 전형적으로 패키징 및 숙주 내로의 후속 통합(적용 가능한 경우)을 위해 요구되는 최소 바이러스 서열을 포함하며, 다른 바이러스 서열은 발현될 단백질을 인코딩하는 발현 카세트에 의해 대체된다. 누락된 바이러스 기능은 패키징 세포주에 의해 트랜스로 공급된다. 예를 들어, 유전자 치료법에서 사용되는 AAV 벡터는 전형적으로 패키징 및 숙주 게놈 내로의 통합을 위해 요구되는 AAV 게놈으로부터의 역방위 말단 반복부(ITR) 서열만을 보유한다. 바이러스 DNA는 세포주에서 패키징되며, 이는 다른 AAV 유전자, 즉 rep 및 cap을 인코딩하지만, ITR 서열은 없는 헬퍼 플라스미드를 함유한다. 세포주는 또한 헬퍼로서 아데노바이러스로 감염된다. 헬퍼 바이러스는 헬퍼 플라스미드로부터 AAV 벡터의 복제 및 AAV 유전자의 발현을 촉진시킨다. 헬퍼 플라스미드는 ITR 서열의 부재로 인해 유의한 양으로 패키징되지 않는다. 아데노바이러스로의 오염은, 예를 들어 아데노바이러스가 AAV보다 더 민감한 열 처리에 의해 감소될 수 있다. 추가적으로, AAV는 배큘로바이러스 시스템을 사용하여 임상 규모로 생산될 수 있다(미국 특허 번호 제7,479,554호 참조).
여러 유전자 치료법 적용에서, 유전자 치료법 벡터는 특정 조직 유형으로 높은 정도의 특이성을 가지고 전달되는 것이 바람직하다. 따라서, 바이러스 벡터는 리간드를 바이러스의 외부 표면 상의 바이러스 코트 단백질과의 융합 단백질로서 발현시킴으로써 주어진 세포 유형에 대해 특이성을 갖도록 변형될 수 있다. 리간드는 관심이 있는 세포 유형의 세포 상에 존재하는 것으로 알려진 수용체에 대해 친화도를 갖도록 선택된다. 예를 들어, 문헌[Han et al., Proc. Natl. Acad. Sci. USA (1995)]은 몰로니 뮤린 백혈병 바이러스가 gp70에 융합된 인간 헤레귤린(heregulin)을 발현하도록 변형될 수 있고, 재조합 바이러스가 인간 표피 성장 인자 수용체를 발현하는 특정 인간 유방암 세포를 감염시킨다는 것을 보고하였다. 상기 원리는 다른 바이러스-표적 세포 쌍으로 연장될 수 있고, 여기서 표적 세포는 수용체를 발현하고 바이러스는 세포-표면 수용체에 대한 리간드를 포함하는 융합 단백질을 발현한다. 예를 들어, 필라멘트성 파지는 실질적으로 임의의 선택된 세포성 수용체에 대해 특이적 결합 친화도를 갖는 항체 단편(예를 들어, FAB 또는 Fv)을 나타내도록 조작될 수 있다. 상기 기재는 주로 바이러스 벡터에 적용되지만, 동일한 원리가 비-바이러스 벡터에 적용될 수 있다. 이러한 벡터는 특정 표적 세포에 의한 섭취를 선호하는 특정 섭취 서열을 포함하도록 조작될 수 있다.
유전자 치료법 벡터는 하기 기재된 바와 같이, 전형적으로 전신 투여(예를 들어, 정맥내, 복강내, 근육내, 진피하, 또는 두개내 주입) 또는 국소 적용에 의해, 개별 환자에 대한 투여에 의해 생체내 전달될 수 있다. 대안적으로, 벡터는 개별 환자로부터 외식된 세포(예를 들어, 림프구, 골수 흡입물, 조직 생검)와 같은 생체외 세포 또는 범용 공여체 조혈 줄기 세포로 전달된 후, 보통 벡터를 포함한 세포에 대한 선택 후에, 환자 내로의 세포의 재이식이 이어질 수 있다. 일부 실시형태에서, 생체내 및 생체외 mRNA의 전달, 및 RNP 전달이 이용될 수 있다.
진단, 연구, 또는 유전자 치료법을 위한 생체외 세포 형질감염(예를 들어, 숙주 유기체 내로의 형질감염된 세포의 재주입을 통한)은 당업자에게 잘 알려져 있다. 바람직한 구현예에서, 세포는 대상 유기체로부터 단리되고, RNA 조성물로 형질감염되며, 대상 유기체(예를 들어, 환자) 내로 다시 재주입된다. 생체외 형질감염에 적합한 다양한 세포 유형은 당업자에게 잘 알려져 있다(예를 들어, 환자로부터 세포를 어떻게 단리하고 배양하는지의 논의에 대해, 문헌[Freshney, "Culture of Animal Cells, A Manual of Basic Technique and Specialized Applications (6th edition, 2010)] 및 여기서 인용된 참조문헌 참조).
적합한 세포는 진핵 및 원핵 세포 및/또는 세포주를 포함하지만 이에 제한되지 않는다. 이러한 세포 또는 이러한 세포로부터 생성된 세포주의 비-제한적 예는 COS, CHO(예를 들어, CHO--S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NSO, SP2/0-Ag14, HeLa, HEK293(예를 들어, HEK293-F, HEK293-H, HEK293-T), 및 perC6 세포, 임의의 식물 세포(분화 또는 미분화)뿐만 아니라, 곤충 세포, 예컨대, 스포돕테라푸기페르다(Spodopterafugiperda(Sf)), 또는 진균 세포, 예컨대, 사카로마이세스(Saccharomyces), 피치아(Pichia) 및 스키조사카로마이세스(Schizosaccharomyces)를 포함한다. 특정 실시형태에서, 세포주는 CHO-K1, MDCK 또는 HEK293 세포주이다. 추가적으로, 1차 세포가 단리되고 뉴클레아제(예를 들어, ZFN 또는 TALEN) 또는 뉴클레아제 시스템(예를 들어, CRISPR)으로의 처리 후 치료받을 대상체 내로의 재도입을 위해 생체외에서 사용될 수 있다. 적합한 1차 세포는 말초혈 단핵 세포(PBMC), 및 CD4+ T 세포 또는 CD8+ T 세포와 같은 다른 혈액 세포 하위세트(이에 제한되지 않음)를 포함한다. 적합한 세포는 또한 예로서, 배아 줄기 세포, 유도된 다능성 줄기 세포, 조혈 줄기 세포(CD34+), 신경 줄기 세포 및 중간엽 줄기 세포와 같은 줄기 세포를 포함한다.
일 실시형태에서, 줄기 세포는 세포 형질감염 및 유전자 치료법을 위한 생체외 절차에서 사용된다. 줄기 세포를 사용하는 장점은 줄기 세포가 시험관내에서 다른 세포 유형으로 분화될 수 있거나 골수에 생착될 포유동물(예컨대, 세포의 공여체) 내로 도입될 수 있다는 것이다. 시험관내 CD34+ 세포를 GM-CSF, IFN-감마 및 TNF-알파와 같은 사이토카인을 사용하여 임상적으로 중요한 면역 세포 유형으로 분화시키는 방법이 알려져 있다(비제한적인 예로서, 문헌[Inaba et al., J. Exp. Med. (1992)] 참조).
줄기 세포는 알려진 방법을 사용하여 형질도입 및 분화를 위해 단리된다. 예를 들어, 줄기 세포는 원치 않는 세포, 예컨대, CD4+ 및 CD8+(T 세포), CD45+(범 B 세포), GR-1(과립구), 및 Iad(분화 항원 제시 세포)에 결합하는 항체로 골수 세포를 패닝(panning)함으로써 골수 세포로부터 단리된다(비제한적 예로서, 문헌[Inaba et al., J. Exp. Med. (1992)] 참조). 변형된 줄기 세포가 또한 일부 실시형태에서 사용될 수 있다.
특히, 본 명세서에 기재된 CRISPR 뉴클레아제 중 임의의 하나는 유사분열-후 세포 또는 활발히 분열 중이 아닌 임의의 세포, 예를 들어 정지된 세포에서 게놈 편집에 적합할 수 있다. 본 발명의 CRISPR 뉴클레아제를 사용하여 편집될 수 있는 유사분열-후 세포의 예는 근육세포, 심근세포, 간세포, 골세포 및 신경세포를 포함하지만 이에 제한되지 않는다.
치료 RNA 조성물을 포함하는 벡터(예를 들어, 레트로바이러스, 리포솜 등)가 또한 생체내에서 세포의 형질도입을 위해 유기체에 직접 투여될 수 있다. 대안적으로, 네이키드 RNA 또는 mRNA가 투여될 수 있다. 투여는 주사, 주입, 국소 적용 및 전기천공을 포함하지만 이에 제한되지 않는, 분자를 혈액 또는 조직 세포와의 궁극적 접촉으로 도입하기 위해 보통 사용되는 임의의 경로에 의한다. 이러한 핵산을 투여하는 적합한 방법이 이용 가능하고 당업자에게 잘 알려져 있으며, 하나 초과의 경로가 특정 조성물을 투여하는 데 사용될 수 있지만, 특정 경로가 종종 또 다른 경로보다 더 즉각적이고 더 효과적인 반응을 제공할 수 있다.
면역 세포(예를 들어, T-세포) 내로의 이식유전자의 도입에 적합한 벡터는 비-통합 렌티바이러스 벡터를 포함한다. 예를 들어, 미국 특허 공개 제2009/0117617호를 참조한다.
약제학적으로 허용 가능한 담체는 부분적으로 투여되는 특정 조성물뿐만 아니라 조성물을 투여하는 데 사용되는 특정 방법에 의해 결정된다. 따라서, 하기 기재된 바와 같이, 약제학적 조성물의 매우 다양한 적합한 제형물이 이용 가능하다(예를 들어, 문헌[Remington's Pharmaceutical Sciences, 17th ed., 1989] 참조).
상동 재조합에 의한 DNA 복구
용어 "상동성 지정 복구" 또는 "HDR"은, 예를 들어 DNA에서 이중-가닥 및 단일-가닥 파손의 복구 동안, 세포 내에서 DNA 손상을 복구하기 위한 메커니즘을 지칭한다. HDR은 뉴클레오타이드 서열 상동성을 필요로 하며 이중-가닥 또는 단일 파손이 일어난 서열(예를 들어, DNA 표적 서열)을 복구하기 위해 "핵산 주형"(핵산 주형 또는 공여체 주형은 본 명세서에서 호환 가능하게 사용됨)을 사용한다. 이는, 예를 들어 핵산 주형으로부터 DNA 표적 서열로 유전 정보의 전달을 초래한다. HDR은 핵산 주형 서열이 DNA 표적 서열과 상이하고 핵산 주형 폴리뉴클레오타이드 또는 올리고뉴클레오타이드의 일부 또는 전부가 DNA 표적 서열 내로 포함되는 경우, DNA 표적 서열의 변경(예를 들어, 삽입, 결실, 돌연변이)을 초래할 수 있다. 일부 실시형태에서, 전체 핵산 주형 폴리뉴클레오타이드, 핵산 주형 폴리뉴클레오타이드의 일부, 또는 핵산 주형의 카피가 DNA 표적 서열 부위에서 통합된다.
용어 "핵산 주형" 및 "공여체"는 게놈 내로 삽입되거나 카피되는 뉴클레오타이드 서열을 지칭한다. 핵산 주형은, 예를 들어 하나 이상의 뉴클레오타이드의, 뉴클레오타이드 서열을 포함하며, 이는 표적 핵산에서 주형에 부가될 것이거나 변화의 주형이 될 것이거나 표적 서열을 변형하기 위해 사용될 수 있다. 핵산 주형 서열은 임의의 길이, 예를 들어 2 내지 10,000개 뉴클레오타이드 길이(또는 그 사이 또는 초과의 임의의 정수 값), 바람직하게는 약 100 내지 1,000개 뉴클레오타이드 길이(또는 그 사이의 임의의 정수), 더 바람직하게는 약 200 내지 500개 뉴클레오타이드 길이일 수 있다. 핵산 주형은 단일 가닥 핵산, 이중 가닥 핵산일 수 있다. 일부 실시형태에서, 핵산 주형은, 예를 들어 하나 이상의 뉴클레오타이드의, 뉴클레오타이드 서열을 포함하며, 이는, 예를 들어 표적 위치의, 표적 핵산의 야생형 서열에 상응한다. 일부 실시형태에서, 핵산 주형은, 예를 들어 하나 이상의 리보뉴클레오타이드의, 리보뉴클레오타이드 서열을 포함하며, 이는, 예를 들어 표적 위치의, 표적 핵산의 야생형 서열에 상응한다. 일부 실시형태에서, 핵산 주형은 변형된 리보뉴클레오타이드를 포함한다.
예를 들어, 돌연변이체 유전자의 교정을 위한 또는 야생형 유전자의 증가된 발현을 위한, 외인성 서열(또한 "공여체 서열", "공여체 주형" 또는 "공여체"로도 불림)의 삽입이 또한 수행될 수 있다. 공여체 서열은 전형적으로 이것이 배치되는 게놈 서열과 동일하지 않음은 용이하게 명백할 것이다. 공여체 서열은 관심이 있는 위치에서 효율적인 HDR을 가능하게 하기 위해 상동성인 2개 영역에 측접하는 비-상동성 영역을 포함할 수 있다. 추가적으로, 공여체 서열은 세포 염색질 내 관심이 있는 영역과 상동성이 아닌 서열을 포함하는 벡터 분자를 포함할 수 있다. 공여체 분자는 세포 염색질과 상동성인 몇몇, 불연속 영역을 포함할 수 있다. 예를 들어, 보통 관심이 있는 영역에 존재하지 않는 서열의 표적화된 삽입을 위해, 상기 서열은 공여체 핵산 분자에 존재하고 관심이 있는 영역 내 서열과 상동성인 영역에 측접할 수 있다.
공여체 폴리뉴클레오타이드는 DNA 또는 RNA, 단일-가닥 및/또는 이중-가닥일 수 있고 선형 또는 원형 형태로 세포 내에 도입될 수 있다. 예를 들어, 미국 특허 공개 제2010/0047805호; 제2011/0281361호; 제2011/0207221호; 및 제2019/0330620호를 참조한다. 선형 형태로 도입되는 경우, 공여체 서열의 말단은 당업자에게 알려진 방법에 의해 (예를 들어, 핵산말단 분해로부터) 보호될 수 있다. 예를 들어, 하나 이상의 디데옥시뉴클레오타이드 잔기는 선형 분자의 3' 말단에 부가되고/되거나 자가-상보성 올리고뉴클레오타이드가 한쪽 또는 양쪽 말단에 결찰된다. 예를 들어, 문헌[Chang and Wilson, Proc. Natl. Acad. Sci. USA (1987); Nehls et al., Science (1996)]을 참조한다. 분해로부터 외인성 폴리뉴클레오타이드를 보호하기 위한 추가적인 방법은 말단 아미노기(들)의 부가 및, 예를 들어 포스포로티오에이트, 포스포르아미데이트, 및 O-메틸 리보스 또는 데옥시리보스 잔기와 같은 변형된 뉴클레오타이드간 연결의 사용을 포함하지만 이에 제한되지 않는다.
따라서, 복구를 위해 공여체 주형을 사용하는 본 발명의 실시형태는 선형 또는 원형 형태로 세포 내에 도입될 수 있는 DNA 또는 RNA, 단일-가닥 및/또는 이중-가닥 공여체 주형을 사용할 수 있다. 본 발명의 실시형태에서 유전자-편집 조성물은 (1) 복구 전에 유전자에서 이중 가닥 파손에 영향을 미치는 가이드 서열을 포함하는 RNA 분자 및 (2) 복구를 위한 공여체 RNA 주형을 포함하며, 가이드 서열을 포함하는 RNA 분자는 제1 RNA 분자이고 공여체 RNA 주형은 제2 RNA 분자이다. 일부 실시형태예에서, 가이드 RNA 분자 및 주형 RNA 분자는 단일 분자의 일부로서 연결된다.
공여체 서열은 또한 올리고뉴클레오타이드일 수 있고 내인성 서열의 유전자 교정 또는 표적화된 변경에 사용될 수 있다. 올리고뉴클레오타이드는 벡터 상에서 세포로 도입될 수 있거나, 세포 내에 전기천공될 수 있거나, 당업계에 알려진 다른 방법을 통해 도입될 수 있다. 올리고뉴클레오타이드는 내인성 유전자 내의 돌연변이된 서열(예를 들어, 베타 글로빈 내 겸상(sickle) 돌연변이)을 '교정'하는 데 사용될 수 있거나, 내인성 유전자좌 내로 원하는 목적을 갖는 서열을 삽입하는 데 사용될 수 있다.
폴리뉴클레오타이드는, 예를 들어 복제 기원, 프로모터 및 항생제 내성을 인코딩하는 유전자와 같은 추가적인 서열을 갖는 벡터 분자의 일부로서 세포 내로 도입될 수 있다. 더욱이, 공여체 폴리뉴클레오타이드는 네이키드 핵산으로서, 리포솜 또는 폴록사머와 같은 작용제와 복합체화된 핵산으로서 도입될 수 있거나, 재조합 바이러스(예를 들어, 아데노바이러스, AAV, 헤르페스바이러스, 레트로바이러스, 렌티바이러스 및 인테그라제 결함 렌티바이러스(IDLV))에 의해 전달될 수 있다.
공여체는 일반적으로 그 발현이 통합 부위에서 내인성 프로모터, 즉 공여체가 삽입되는 내인성 유전자의 발현을 구동하는 프로모터에 의해 구동되도록 삽입된다. 그러나, 공여체가 프로모터 및/또는 인핸서, 예를 들어 구성적 프로모터 또는 유도성 또는 조직 특이적 프로모터를 포함할 수 있음이 명백할 것이다.
공여체 분자는 내인성 유전자의 전부, 일부가 발현되거나 전혀 발현되지 않도록 내인성 유전자 내로 삽입될 수 있다. 예를 들어, 본 명세서에 기재된 바와 같은 이식유전자는, 예를 들어 이식유전자와의 융합체로서, 내인성 서열의 일부(이식유전자에 대해 N-말단 및/또는 C-말단)가 발현되거나 전혀 발현되지 않도록, 내인성 유전자좌 내로 삽입될 수 있다. 다른 실시형태에서, 이식유전자(예를 들어, 내인성 유전자와 같은 추가적인 코딩 서열을 갖거나 갖지 않음)는 임의의 내인성 유전자좌, 예를 들어 세이프-하버(safe-harbor) 유전자좌, 예를 들어 CCR5 유전자, CXCR4 유전자, PPP1R12c(또한 AAVS1로도 알려짐) 유전자, 알부민 유전자 또는 Rosa 유전자 내로 통합된다. 예를 들어, 미국 특허 제7,951,925호 및 제8,110,379호; 미국 공개 제2008/0159996호; 제20100/0218264호; 제2010/0291048호; 제2012/0017290호; 제2011/0265198호; 제2013/0137104호; 제2013/0122591호; 제2013/0177983호 및 제2013/0177960호 및 미국 가출원 제61/823,689호를 참조한다.
내인성 서열(내인성 또는 이식유전자의 일부)이 이식유전자와 함께 발현되는 경우, 내인성 서열은 전장 서열(야생형 또는 돌연변이체) 또는 부분적 서열일 수 있다. 바람직하게는 내인성 서열은 기능적이다. 이들 전장 또는 부분적 서열의 기능의 비-제한적 예는 이식유전자(예를 들어, 치료용 유전자)에 의해 발현되는 폴리펩타이드의 혈청 반감기 증가 및/또는 담체로서의 작용을 포함한다.
또한, 발현을 위해 요구되지는 않지만, 외인성 서열은 또한 전사 또는 번역 조절 서열, 예를 들어 프로모터, 인핸서, 인슐레이터(insulator), 내부 리보솜 진입 부위, 2A 펩타이드를 인코딩하는 서열 및/또는 폴리아데닐화 신호를 포함할 수 있다.
특정 실시형태에서, 공여체 분자는 단백질을 인코딩하는 유전자(예를 들어, 세포에 또는 개체에 부재하는 단백질을 인코딩하는 코딩 서열 또는 단백질을 인코딩하는 유전자의 대안적 버전), 조절 서열 및/또는 마이크로RNA 또는 siRNA와 같은 구조적 핵산을 인코딩하는 서열로 이루어진 군으로부터 선택되는 서열을 포함한다.
상기 실시형태에 있어서, 본 명세서에 개시된 각각의 실시형태는 각각의 다른 개시된 실시형태에 적용 가능한 것으로 고려된다. 예를 들어, 본 발명의 임의의 RNA 분자 또는 조성물이 본 발명의 임의의 방법에서 이용될 수 있음이 이해된다.
본 명세서에서 사용되는 바와 같이, 모든 제목은 단순히 구성을 위한 것이며 어떠한 방식으로든 본 개시내용을 제한하는 것으로 의도되지 않는다. 임의의 개별 섹션의 내용은 모든 섹션에 동일하게 적용 가능할 수 있다.
본 발명의 추가적인 목적, 장점, 및 신규한 특징은 하기 실시예의 조사 시 당업자에게 명백해질 것이며, 이는 제한하는 것으로 의도되지 않는다. 추가적으로, 본 명세서의 위에서 상세히 기술된 바와 같으며 하기 청구범위 섹션에서 청구된 바와 같은 본 발명의 각각의 다양한 실시형태 및 양태는 하기 실시예에서 실험적 뒷받침이 확인된다.
명확성을 위해 별도 실시형태의 맥락에서 기재되는, 본 발명의 특정 특징이 또한 단일 실시형태에서 조합되어 제공될 수 있음이 이해된다. 반대로, 간결성을 위해, 단일 실시형태의 맥락에서 기재되는 본 발명의 다양한 특징은 또한 별도로 또는 임의의 적합한 하위-조합으로 또는 본 발명의 임의의 다른 기재된 실시형태에서 적합한 바와 같이 제공될 수 있다. 다양한 실시형태의 맥락에서 기재되는 특정 특징은 실시형태가 이들 요소 없이 작동되지 않는 경우가 아닌 한, 이들 실시형태의 필수적 특징으로 간주되어서는 안 된다.
일반적으로, 본 명세서에서 사용되는 명명법, 및 본 발명에서 이용되는 실험실 절차는 분자, 생화학, 미생물학 및 재조합 DNA 기법을 포함한다. 이러한 기법은 문헌에서 철저하게 설명되어 있다. 예를 들어, 문헌[Sambrook et al., "Molecular Cloning: A laboratory Manual" (1989); Ausubel, R. M. (Ed.), "Current Protocols in Molecular Biology" Volumes I-III (1994); Ausubel et al., "Current Protocols in Molecular Biology", John Wiley and Sons, Baltimore, Maryland (1989); Perbal, "A Practical Guide to Molecular Cloning", John Wiley & Sons, New York (1988); Watson et al., "Recombinant DNA", Scientific American Books, New York; Birren et al. (Eds.), "Genome Analysis: A Laboratory Manual Series", Vols. 1-4, Cold Spring Harbor Laboratory Press, New York (1998); 미국 특허 제4,666,828호; 제4,683,202호; 제4,801,531호; 제5,192,659호 및 제5,272,057호에 제시된 바와 같은 방법론; Cellis, J. E. (Ed.), "Cell Biology: A Laboratory Handbook", Volumes I-III (1994); Freshney, "Culture of Animal Cells - A Manual of Basic Technique" Third Edition, Wiley-Liss, N. Y. (1994); Coligan J. E. (Ed.), "Current Protocols in Immunology" Volumes I-III (1994); Stites et al. (Eds.), "Basic and Clinical Immunology" (8th Edition), Appleton & Lange, Norwalk, CT (1994); Mishell and Shiigi (Eds.), "Strategies for Protein Purification and Characterization - A Laboratory Course Manual" CSHL Press (1996); Clokie and Kropinski (Eds.), "Bacteriophage Methods and Protocols", Volume 1: Isolation, Characterization, and Interactions (2009)]을 참조하며, 이들 모두 참조에 의해 원용된다. 다른 일반 참조문헌이 본 문헌 전체를 통해 제공된다.
본 발명의 보다 완전한 이해를 촉진하기 위해 실시예가 하기에 제공된다. 하기 실시예는 본 발명의 제조 및 실시의 예시적 방식을 예시한다. 그러나, 본 발명의 범주는 이들 실시예에 개시된 특정 실시형태에 제한되지 않으며, 이는 단지 예시 목적을 위한 것이다.
실험 상세사항
본 발명의 보다 완전한 이해를 촉진하기 위해 실시예가 하기에 제공된다. 하기 실시예는 본 발명의 제조 및 실시의 예시적 방식을 설명한다. 그러나, 본 발명의 범주는 이들 실시예에 개시된 특정 실시형태에 제한되지 않으며, 이는 단지 예시 목적을 위한 것이다.
실시예 1: OMNI-103 CRISPR 뉴클레아제
CRISPR 반복부(crRNA), 전사활성화 RNA(tracrRNA), 뉴클레아제 폴리펩타이드(OMNI), 및 프로토스페이서 인접 모티프(PAM) 서열을 환경 샘플의 상이한 메타게놈 서열 데이터베이스로부터 예측하였다.
OMNI 뉴클레아제 폴리펩타이드의 작제
신규 뉴클레아제 폴리펩타이드(OMNI)의 작제를 위해, 여러 가지 확인된 OMNI의 오픈 리딩 프레임을 인간 세포주 발현을 위해 코돈 최적화하였다. ORF를 박테리아 발현 플라스미드 pET9a 내로 및 포유동물 발현 플라스미드 pmOMNI 내로 클로닝하였다(표 4).
sgRNA의 예측 및 작제
각각의 OMNI에 있어서, 단일 가이드 RNA(sgRNA)를 각각의 박테리아 게놈 내 CRISPR 반복부 어레이 서열 및 tracrRNA의 검출에 의해 예측하였다. 천연 성숙-전 crRNA 및 tracrRNA 서열을 인실리코로(in silico) 테트라-루프 'gaaa' 서열과 연결하고 이중나선의 2차 구조 요소를 RNA 2차 구조 예측 도구를 사용함으로써 예측하였다.
전체 이중나선 RNA 요소(crRNA-tracrRNA 키메라)의 예측된 2차 구조를 sgRNA의 설계를 위한 가능한 tracrRNA 서열의 확인을 위해 사용하였다. 상이한 위치에서 상부 줄기에서의 이중나선을 단축시킴으로써 여러 가능한 sgRNA 스캐폴드 버전을 작제하였다(OMNI-103 sgRNA 설계는 표 2에 열거되어 있음). 추가적으로, 잠재적인 전사 및 구조적 제약을 극복하고 인간 세포 환경 맥락에서 sgRNA 스캐폴드의 가소성을 평가하기 위해, 일부 경우에서 가능한 sgRNA의 뉴클레오타이드 서열의 작은 변화를 만들었다(도 1, 표 2). 마지막으로, 각각의 OMNI에 대해 가능한 설계된 스캐폴드의 최대 3가지 버전을 합성하고 22-뉴클레오타이드 범용 고유 스페이서 서열(T2, 서열번호 135)의 하류에 연결한 다음, 포유동물 발현에 대한 U6 프로모터와 조합된 유도성 T7 프로모터 하에 박테리아 발현 플라스미드 내로 클로닝하였다(pShuttleGuide, 표 4).
T2 - GGAAGAGCAGAGCCTTGGTCTC (서열번호 135)
TXTL에 의한 시험관내 결실 분석
시험관내 PAM 서열의 결실을 문헌[Maxwell et al, Methods. 2018]에 기재된 바에 따라 수행하였다. 간략하게, T7 프로모터 하에 OMNI 뉴클레아제 및 sgRNA를 발현하는 선형 DNA를 T7 중합효소를 발현하는 선형 작제물과 함께 무세포 전사-번역 시험관내 시스템(TXTL 혼합물, Arbor Bioscience)에 첨가하였다. TXTL 혼합물에 의한 RNA 발현 및 단백질 번역은 리보핵단백질(RNP) 복합체의 형성을 초래한다. 선형 DNA를 사용하였으므로, Chi6 DNA 서열을 TXTL 반응 혼합물에 첨가하여 RecBCD의 엑소뉴클레아제 활성을 저해하고, 이에 의해 선형 DNA를 분해로부터 보호하였다. sgRNA 스페이서를 잠재적 PAM 서열의 8N 무작위화 세트가 측접된 표적 프로토스페이서를 포함하는 플라스미드 라이브러리(pbPOS T2 라이브러리, 표 4)를 표적화하도록 설계한다. 절단된 라이브러리 및 비-표적화 gRNA를 발현하는 대조군 라이브러리 둘 다에 대해 필요한 어댑터 및 지표를 부가하기 위해 PCR을 사용하여 고속대량(high-throughput) 서열분석에 의해 라이브러리로부터의 PAM 서열의 결실을 측정하였다. 심층 서열분석 후, 대조군에서의 발생 대비 동일한 PAM 서열을 갖는 결실된 서열의 분율에 의해 시험관내 활성을 확인하였으며, 이는 OMNI 뉴클레아제에 의한 기능적 DNA 절단을 나타낸다(도 4a 내지 도 4b 및 표 3).
내인성 게놈 표적에 대한 인간 세포에서의 활성
OMNI-103을 인간 세포 내 특정 게놈 위치 상에서 편집을 촉진시키는 능력에 대해 분석하였다. OMNI-103의 인간 게놈 표적에 대한 편집 활성을 OMNI-103 뉴클레아제 및 각각 상이한 게놈 위치를 표적화하도록 설계된 고유 sgRNA 분자의 패널로 공동 형질감염된 HeLa 세포에 대한 NGS 절단 분석으로 평가하였다. 이를 위해, 인간 최적화된 OMNI-103 뉴클레아제를 인-프레임(in-frame)-P2A-mCherry 발현 벡터(pmOMNI, 표 4) 내로 클로닝하고 OMNI-103 sgRNA 분자 서열 각각을 셔틀-가이드(shuttle-guide) 벡터(pShuttle Guide, 표 4) 내로 클로닝하였다. sgRNA 분자를 상응하는 OMNI-103 PAM 선호도에 따라 인간 게놈의 특정 위치를 표적화하는 22-뉴클레오타이드 가이드 서열 부분(표 5)에 이어서 TXTL에 의해 발견된 바와 같은 sgRNA 스캐폴드 서열(표 3)을 포함하도록 설계하였다. 형질감염 72시간 후, 세포를 수확하였다. 마커로서 mCherry 형광을 사용하여 FACS에 의한 OMNI-103 뉴클레아제 발현의 정량화에 수확된 세포의 절반을 사용하였다. 세포의 나머지를 용해시키고, 이의 게놈 DNA 내용물을 추출하여 상응하는 게놈 표적의 PCR 증폭을 위한 주형으로서 사용하였다. 앰플리콘에 차세대 염기서열 분석기법(NGS)을 수행한 다음 생성 판독물을 사용하여 각각의 표적 부위에서 편집 사건의 백분율을 계산하였다. 절단 부위 주위의 짧은 삽입 또는 결실(삽입결실)은 뉴클레아제-유도 DNA 절단 후 DNA 말단 복구의 전형적인 결과이다. 편집%의 계산을 각각의 앰플리콘 내 총 정렬된 판독물 대비 삽입결실 판독물의 분율로부터 추정하였다. 표 5(칼럼 5, "편집%")에서 알 수 있는 바와 같이, OMNI-103 뉴클레아제는 대부분의 게놈 부위에서 높고 유의한 편집 수준을 나타내었다.
OMNI-103 뉴클레아제의 단백질 정제
RNP 회합에서 사용하기 위한 뉴클레아제 단백질 생산 및 합성 가이드 생산을 위한 발현 방법은 미국 가출원 제63/286,855호에 기재되었다. 간략하게, OMNI-103 뉴클레아제 오픈 리딩 프레임을 박테리아에 대해 코돈 최적화하고(표 1), SV40 NLS - 박테리아 최적화된 OMNI-103 ORF(2번째 아미노산으로부터) - HA 태그 - SV40 NLS - 8 His-태그의 요소와 함께 변형된 pET9a 플라스미드 내로 클로닝하였다(표 4). KRX 세포(PROMEGA)에서 OMNI-103 작제물을 발현시켰다. 6.66mM 람노스(0.5M 스톡, 26.4 ㎖), 및 0.05% 글루코스(0.5M, 2 ㎖)를 첨가한 TB + 0.4% 글리세롤에서 세포를 성장시키고, 온도를 20℃까지 낮추고 4시간 동안 중간 대수기에서 발현시켰다. 화학적 용해를 사용하여 세포를 용해시키고 정화시킨 용해물을 Ni-NTA 수지 상에서 정제하였다. Ni-NTA 용리 분획을 CEX(SO3 fractogel) 수지 상에서 정제한 후, Superdex® 200 Increase 10/300 GL, AKTA Pure(GE Healthcare Life Sciences) 상에서 SEC 정제를 수행하였다. OMNI-103 단백질을 포함하는 분획을 풀링하고 30 ㎎/㎖ 스톡으로 농축시킨 다음 액체 질소에서 급속 동결하고 -80℃에서 보관하였다.
시험관내에서 RNP의 OMNI-103 절단 활성
OMNI-103의 합성 sgRNA를 3' 및 5' 말단에서 3개의 2'-O-메틸 3'-포스포로티오에이트와 함께 합성하였다(Agilent).
가이드 PDCD1 S40과 동일한 표적 부위를 표적화하는 상이한 스페이서 길이(20 내지 25개 뉴클레오타이드)를 갖는 가이드 분자를 이용하여 OMNI-103 RNP의 활성을 시험관내에서 분석하였다(표 6, 도 2a). 간략하게, 10 pmol의 OMNI-103 뉴클레아제를 20 pmol의 합성 가이드와 혼합하였다. 실온에서 10분 인큐베이션 후, RNP 복합체를 4, 2, 1, 0.5 pmol로 연속 희석하고, 추출된 게놈 DNA로부터 PDCD1 S40 표적 부위의 증폭에 의해 제조된 선형 DNA 주형 40 ng과 반응시켰다. 모든 스페이서 길이(20 내지 25개 뉴클레오타이드)는 모든 RNP 농도에서 PDCD1 주형의 전체 절단을 나타내었으며, 이는 높은 절단 활성을 나타낸다(도 2a).
U2OS 세포에서 RNP의 편집 활성을 측정함으로써 OMNI-103 뉴클레아제에 대한 가이드 최적화
스페이서 길이 최적화를 또한 포유동물 세포 맥락에서 테스트하였다. 100 uM OMNI-103 뉴클레아제를 상이한 스페이서 길이(20 내지 25 뉴클레오타이드, 표 6)의 120 uM의 합성 가이드 및 100 uM Cas9 전기천공 인핸서(IDT)와 혼합함으로써 RNP를 회합하였다. 실온에서 10분 인큐베이션 후, RNP 복합체를 200,000 사전-세척 U2OS 세포와 혼합하고 제조업체의 프로토콜에 따라, DN100과 함께 Lonza SE Cell Line 4D-NucleofectorTM X 키트를 사용하여 전기천공하였다. 72시간 전기천공 후, 세포를 용해시키고, 이의 게놈 DNA 내용물을 추출하였다. 그 다음 PCR에 의해 상응하는 게놈 표적 부위를 증폭시켰다. 앰플리콘에 NGS를 수행하고 생성 서열을 사용하여 편집 사건의 백분율을 계산하였다. 도 2b 및 표 7에서 알 수 있는 바와 같이, 22개 뉴클레오타이드의 스페이서 길이는 가장 높은 편집 수준을 나타내었다.
인간 세포에서 OMNI-103 RNP 편집 활성
포유동물 세포에서 RNP로서 OMNI-103 단백질의 활성이 U2OS에서 관찰되었고(표 7, 도 2c) 비슷한 활성이 또한 T 세포에서 관찰되었다(표 8). 100 uM 뉴클레아제를 120 uM의 합성 가이드(표 6) 및 100 uM Cas9 전기천공 인핸서(IDT)와 혼합함으로써 RNP를 회합하였다. 실온에서 10분 인큐베이션 후, RNP 복합체를 200,000 U2OS 세포와 혼합하고 제조업체의 프로토콜에 따라, DN100과 함께 Lonza SE Cell Line 4D-NucleofectorTM X 키트를 사용하여 전기천공하였다. 72시간 전기천공 후, 세포를 용해시키고, 이의 게놈 DNA 내용물을 추출하였다. 그 다음 PCR에 의해 상응하는 게놈 표적 부위를 증폭시켰다. 앰플리콘에 NGS를 수행하고 생성 서열을 사용하여 편집 사건의 백분율을 계산하였다. PDCD1 S40, TRAC S35, TRAC S36 및 B2M S12 가이드를 이용하여 OMNI-103 RNP를 테스트하였다. 테스트한 네(4) 가지 가이드 모두 70 내지 90% 편집 수준을 나타내었다(도 2c).
가이드-seq 비편향 분석 방법을 사용한 표적외 효과의 평가
가이드-seq는 살아있는 세포에서 CRISPR 뉴클레아제에 의해 유발된 표적외 게놈 편집 사건의 비편향 시험관내 검출을 가능하게 한다. 살아있는 인간 세포의 게놈에서 블런트-말단 CRISPR RNA-가이드 뉴클레아제(RGN) 유도 DSB는 NHEJ와 일치하는 말단-연결 공정을 통해 이들 파손에서 블런트 이중-가닥 올리고데옥시뉴클레오타이드(dsODN)의 통합에 의해 태깅된다. 게놈 DNA에서 dsODN 통합 부위를 비편향 증폭 및 심층 NGS를 사용하여 뉴클레오타이드 수준에서 정확하게 맵핑한다. 게놈 DNA 초음파 처리 및 일련의 어댑터 결찰 후, 올리고뉴클레오타이드-포함 라이브러리에 고속대량 DNA 서열분석을 수행하고 출력물을 디폴트 가이드-seq 소프트웨어로 처리하여 올리고뉴클레오타이드 캡처 부위를 확인한다.
OMNI-103 뉴클레아제의 특이성을 평가하기 위해, PDCD1 S40 및 TRAC S35 부위를 사용하여 인간 U2OS 세포의 게놈에 걸쳐 표적외 절단의 비편향 조사를 생성하기 위해 가이드-seq를 사용하였다(표 6).
100 uM 뉴클레아제를 120 uM의 합성 가이드 및 100 uM Cas9 전기천공 인핸서(IDT)와 혼합함으로써 RNP를 회합하였다. 실온에서 10분 인큐베이션 후, RNP 복합체를 100 uM dsODN 및 200,000 사전-세척 U2OS 세포와 혼합하였다. 세포를 제조업체의 프로토콜에 따라, DN100과 함께 Lonza SE Cell Line 4D-NucleofectorTM X 키트를 사용하여 전기천공하였다. 72시간 전기천공 후, 세포를 용해시키고, 이의 게놈 DNA 내용물을 추출하였다. 그 다음 PCR에 의해 상응하는 게놈 표적 부위를 증폭시켰다. 앰플리콘에 NGS를 수행한 다음 생성 서열을 사용하여 편집 사건 및 dsODN 통합의 백분율을 계산하였다(도 3a). OMNI-103은 PDCD1 S40 및 TRAC S35 부위에서 어떠한 표적외 효과도 나타내지 않았다(도 3b).
표 1. OMNI 뉴클레아제 서열: 표 1은 OMNI 명칭, 이의 상응하는 뉴클레아제 단백질 서열, 이의 DNA 서열, 이의 인간 최적화된 DNA 서열, 불활성화된 RuvC 도메인을 갖는 닉카제를 생성하기 위해 치환될 대안적인 위치, 불활성화된 HNH 도메인을 갖는 닉카제를 생성하기 위해 치환될 대안적인 위치, 및 불활성화된 RuvC 및 NHN 도메인을 갖는 촉매적으로 사멸된 뉴클레아제를 생성하기 위해 치환될 대안적인 위치를 열거한다. 아스파트산(D)에서 글루탐산(E) 또는 글루탐산(E)에서 아스파트산(D)으로의 치환 이외의 임의의 치환이 불활성화를 초래하는 것을 나타내는 별표가 있는 경우를 제외하고, 임의의 다른 아미노산으로의 치환은 칼럼 5 내지 7에 표시된 아미노산 위치의 각각에 대해 허용 가능하다.
보충 표 1 - OMNI-103 도메인
보충 표 1. OMNI 도메인: 보충 표 1은 OMNI CRISPR 뉴클레아제에 대해 확인된 각각의 도메인의 아미노산 범위를 열거한다. 예를 들어, OMNI-103의 도메인 G는 서열번호 1의 아미노산 728 내지 778에 의해 확인된다. 열거된 아미노산 범위는 스미스-워터맨(Smith-Waterman) 알고리즘을 사용하여 생성된 국소 정렬의 바람직한 분석을 기반으로 하지만, 각각의 도메인 범위의 시작 또는 끝은 최대 5개의 아미노산까지 증가하거나 감소할 수 있다.
표 2(계속) - OMNI 가이드 RNA 및 스캐폴드 RNA 서열
표 4 부록 - 작제물 요소의 상세사항
표 5. 포유동물 세포의 내인성 맥락에서 뉴클레아제 활성: sgRNA 발현 플라스미드와 함께 DNA 형질감염에 의해 포유동물 세포 시스템(HeLa)에서 OMNI-103 뉴클레아제를 발현시켰다. 부위 특이적 게놈 DNA 증폭 및 NGS에 세포 용해물을 사용하였다. 삽입결실의 백분율을 측정하고 분석하여 편집 수준을 결정하였다.
표 7. OMNI-103 RNP를 합성 sgRNA(Agilent)와 회합하고 U2OS 세포에 전기청공하였다. NGS로 측정되는 편집 수준(삽입결실%) 다음에 유전자 명칭, 스페이서 서열, 및 스페이서 길이가 나타나 있다.
표 8. TRAC 또는 B2M을 표적화하는 특정 합성 sgRNA 분자(Agilent)로 OMNI-103을 전기천공한 3일 후, 1차 T 세포에서 TCR 및 B2M의 단백질 발현 수준.
실시예 2: 대안적인 OMNI-103 CRISPR 뉴클레아제-RNA 복합체
방법
OMNI-103 단백질 발현
간략하게, 그리고 상기 기재된 단백질 발현 방법과 유사하게, 뉴클레아제 오픈 리딩 프레임을 인간 세포에 대해 코돈 최적화하고, SV40 NLS - OMNI-103 ORF(인간 최적화된 2번째 아미노산으로부터) - HA 태그 - SV40 NLS - 8 His-태그의 요소와 함께 변형된 pET9a 플라스미드 내로 클로닝하였다. 이 서열은 표 4에서 확인할 수 있다. KRX 세포(Promega)에서 OMNI-103 작제물을 발현시켰다. 6.66mM 람노스(0.5M 스톡, 26.4 ㎖), 및 0.05% 글루코스(0.5M, 2 ㎖)를 첨가한 TB + 0.4% 글리세롤에서 세포를 성장시켰다. 온도를 20℃까지 낮추고 4시간 동안 중간 대수기에서 단백질을 발현시켰다. 화학적 용해를 사용하여 세포를 용해시키고 정화시킨 용해물을 Ni-NTA 수지 상에서 정제하였다. Ni-NTA 용리 분획을 CEX(SO3 fractogel) 수지 상에서 정제한 후, Superdex 200 Increase 10/300 GL, AKTA Pure(GE Healthcare Life Sciences) 상에서 SEC 정제를 수행하였다. OMNI-103 단백질을 포함하는 분획을 풀링하고 30 ㎎/㎖ 스톡으로 농축시킨 다음 액체 질소에서 급속 동결하고 -80℃에서 보관하였다.
사용된 합성 sgRNA
OMNI-103의 모든 합성 sgRNA를 3' 및 5' 말단에서 3개의 2'-O-메틸 3'-포스포로티오에이트와 함께 합성하였다(Agilent 또는 Synthego).
포유동물 세포주에서의 활성
더 짧은 sgRNA 버전으로 편집을 촉진시키는 OMNI-103의 능력을 인간 세포에서 특정 게놈 위치에서 테스트하였다(표 10). HeLa 세포의 경우, OMNI-103-P2A-mCherry 발현 벡터(pmOMNI, 표 4)를 sgRNA(pShuttle 가이드 - 표 4, 스페이서 서열 - 표 10)와 함께 형질감염시켰다.
U2OS 세포의 경우, 100 uM 뉴클레아제를 120 uM의 합성 가이드 및 100 uM Cas9 전기천공 인핸서(IDT)와 혼합함으로써 RNP를 회합하였다. 실온에서 10분 인큐베이션 후, RNP 복합체를 200,000 사전-세척 U2OS 세포와 혼합하고 제조업체의 프로토콜에 따라, DN100 프로그램과 함께 Lonza SE Cell Line 4D-Nucleofector™ X 키트를 사용하여 전기천공하였다. 72시간째에 세포를 용해시키고, 이의 게놈 DNA 내용물을 상응하는 추정 게놈 표적을 증폭시키는 PCR 반응에서 사용하였다. 앰플리콘에 NGS를 수행한 다음 생성 서열을 사용하여 편집 사건의 백분율을 계산하였다.
T 세포의 경우, 113 uM 뉴클레아제 및 160 uM의 합성 가이드를 혼합하고 실온에서 10분 동안 인큐베이션함으로써 RNP를 회합하고, RNP 복합체를 200,000 1차 활성화 T 세포와 혼합한 다음, EH-115 펄스 코드로 P3 Primary Cell 4D-Nucleofector TM X 키트를 사용하여 전기천공하였다. 삼(3)일 및 팔(8)일 후 세포를 수집하고, CD3 및 편집된 단백질 발현을 유세포 분석으로 측정하였다.
결과
게놈 부위 및 세포 유형에 걸친 짧은 가이드의 활성
더 짧은 sgRNA 스캐폴드와 함께 사용하기 위해 OMNI-103 뉴클레아제 활성을 최적화하였다. 테트라 루프 "GAAA" 및 종결자 영역 주위에 최대 4개의 결실을 포함하는 'V2' 이중나선 버전에 기반하여 다섯(5) 개 짧은 sgRNA 스캐폴드를 설계하였다(표 9, 도 6a 내지 도 6f). 설계된 V2 스패폴드로 표시되는 OMNI-103의 활성 수준을 테스트하기 위해, "TRAC-s91" 또는 "PDCD-s40"의 가이드 서열 부분을 갖는 sgRNA를 HeLa 세포로 형질감염시켰다. 편집 활성을 NGS 결과를 기반으로 계산하였다(도 7). 모든 경우에, 설계된 sgRNA는 편집 활성을 가능하게 하였다. 다음 단계는 U2OS 및 1차 T 세포에서 RNP로서 OMNI-103 활성을 테스트하는 것이었다. OMNI-103을 V2, V2.2 또는 V2.3 스캐폴드를 갖고 "TRAC-s35" 또는 "B2M-s12"의 가이드 서열 부분을 갖는 sgRNA로 전기천공하였다. 편집 활성을 NGS 결과를 기반으로 계산하였고, 입증된 바와 같이 OMNI-103 활성 수준은 스캐폴드 변이체 중 임의의 것과 함께 사용될 때 손상되지 않았다(도 8). 1차 T 세포에서, 짧은 스캐폴드 변이체를 이용할 때, 개선된 활성이 입증되었다.
표 9(계속) - OMNI-103 설계 스캐폴드 서열
표 9(계속) - OMNI-103 설계 스캐폴드 서열
참고문헌
SEQUENCE LISTING
<110> EmendoBio Inc.
<120> OMNI-103 CRISPR NUCLEASE
<130> 91677-A-PCT/GJG/AWG
<150> 63/286,855
<151> 2021-12-09
<150> 63/214,506
<151> 2021-06-24
<150> 63/147,166
<151> 2021-02-08
<160> 135
<170> PatentIn version 3.5
<210> 1
<211> 1348
<212> PRT
<213> Unknown
<220>
<223> OMNI-103
<400> 1
Met Ser Ile Lys Ser Asp Tyr Phe Leu Gly Leu Asp Ile Gly Thr Asp
1 5 10 15
Ser Ile Gly Trp Ala Val Thr Asp Pro Glu Tyr His Ile Leu Arg Arg
20 25 30
Lys Gly Lys Ala Leu Trp Gly Ile Arg Leu Phe Asp Ala Ala Asn Thr
35 40 45
Ala Ala Glu Arg Arg Thr Phe Arg Thr Ser Arg Arg Arg Ile Gln Arg
50 55 60
Arg Arg Gln Arg Ile Arg Leu Leu Gln Glu Leu Phe Ala Glu Glu Met
65 70 75 80
Val Lys Leu Asp Pro Gly Phe Phe Gln Arg Leu Ser Asp Ser Ala Phe
85 90 95
Trp Gln Glu Asp Lys Gln Glu Gln Gln Ile Tyr Ser Leu Phe Thr Cys
100 105 110
Glu Asn Tyr Thr Asp Val Asp Tyr Tyr Arg Glu Tyr Pro Thr Ile Tyr
115 120 125
His Leu Arg Ser Ala Leu Ile Gln Glu Lys Lys Glu Phe Asp Leu Arg
130 135 140
Leu Leu Tyr Leu Ala Leu His His Leu Met Lys His Arg Gly His Phe
145 150 155 160
Leu Phe Asn Gly Ser Ile Asn Asn Val Thr Ser Phe His Thr Thr Phe
165 170 175
Gln Thr Phe Ala Asp Cys Leu Tyr Asp Glu Phe Asp Ile Glu Leu Glu
180 185 190
Cys Asp Ser Glu Asp Arg Phe Ala Glu Ile Leu Lys Asp Lys His Ala
195 200 205
Arg Lys Thr Gly Lys Cys Ser Glu Leu Glu Ile Ile Cys His Ile Glu
210 215 220
Lys Ser Asn Lys Gln Leu Lys Glu Leu Phe Lys Leu Ile Thr Gly Met
225 230 235 240
Lys Ala Ser Leu Ser Val Val Phe Gly Asp Asp Glu Leu Ala Glu Ile
245 250 255
Glu His Asn Lys Ile Ser Phe Ser Glu Ser Ser Tyr Asp Glu Val Arg
260 265 270
Leu Ala Leu Glu Asp Glu Ile Gln Glu Arg Thr Gly Ile Leu Asp Ile
275 280 285
Phe His Ala Val Tyr Ser Trp Ala Ile Leu Ala Asp Ile Leu Glu Gly
290 295 300
Gly Glu Tyr Glu Gly Asn Ser Tyr Leu Ser Val Ala Lys Val Ser Thr
305 310 315 320
Tyr Lys Lys His Gly Asp Asp Leu Arg Leu Leu Arg Thr Leu Val Arg
325 330 335
Glu Tyr Cys Pro Asp His Tyr Lys Ser Phe Phe Ser Val Ser Gly Lys
340 345 350
Glu Asn Tyr Cys Ala Tyr Ala Gly Thr Leu Lys Lys Asn Gly Lys Lys
355 360 365
Gln Pro Ile Lys Arg Cys Ser Gln Glu Asp Phe Tyr Lys Ala Leu Lys
370 375 380
Lys Leu Leu Asn Gln Met Pro Thr Glu Gln Pro Glu Val Lys Asp Ile
385 390 395 400
Phe Ile Glu Ile Glu Asn Gly Thr Phe Leu Pro Leu Gln Val Ser Lys
405 410 415
Asp Asn Gly Val Ile Pro Tyr Gln Val Asn Lys Met Glu Leu Glu Lys
420 425 430
Ile Leu Gln Asn Ala Glu Glu Tyr Leu Pro Phe Leu Lys Asn Ile Asp
435 440 445
Glu Glu Cys Gly Lys Thr Val Ser Lys Lys Ile Ile Asp Leu Phe Glu
450 455 460
Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Asn Thr Ala Lys Gly Glu
465 470 475 480
Asn Cys Trp Met Val Arg Lys Glu Ala Gly Arg Ile Tyr Pro Trp Asn
485 490 495
Phe Asp Glu Lys Val Asp Arg Asp Gln Ser Ala Glu Lys Phe Ile Arg
500 505 510
Arg Met Thr Asn Gln Cys Thr Tyr Leu Ile His Glu Asp Val Val Pro
515 520 525
Lys Asn Ser Leu Leu Tyr Ser Glu Phe Met Val Leu Asn Glu Leu Asn
530 535 540
Asn Val Lys Ile Arg Ser Glu Lys Leu Pro Val Glu Leu Lys Gln Ala
545 550 555 560
Ile Val Leu Asp Leu Phe Lys Lys Gln Lys Gln Ile Thr Gly Lys Lys
565 570 575
Leu Leu Asn Tyr Leu Asn Ala Asn Gly Tyr Asp Val Lys Lys Glu Asp
580 585 590
Leu Ser Gly Phe Asp Gly Asn Phe Lys Ser Ser Leu Ser Ser Tyr Leu
595 600 605
Thr Leu Lys Lys Val Phe Gly Glu Glu Leu Asp Lys Tyr Ser Val Gln
610 615 620
Gln Met Ala Glu Asp Ile Ile Leu Trp Ile Thr Leu Tyr Gly Asp Asp
625 630 635 640
Gln Lys Met Leu Arg Arg Val Ile Arg Lys His Tyr Glu Gln Gln Leu
645 650 655
Ser Glu Glu Gln Ile Leu Ser Leu Ser Lys Leu Lys Phe Gln Gly Trp
660 665 670
Gly Arg Leu Ser Arg Arg Leu Leu Ser Glu Met Glu Gly Val Asp Cys
675 680 685
Glu Thr Gly Glu Cys Met Thr Val Met Gln Gly Leu Arg Asn Thr Gln
690 695 700
Asn Asn Leu Met Gln Leu Leu Ser Gln Gln Phe Ser Phe Met Glu Leu
705 710 715 720
Ile Glu Glu Glu Asn Gly Asn Tyr Tyr Val Asp Glu Ile Thr Tyr Asp
725 730 735
Asn Leu Val Lys Asp Met Val Ile Ser Pro Ser Val Lys Arg Ala Val
740 745 750
Trp Gln Thr Val Gln Ile Val Glu Glu Ile Lys Gly Val Met Gly Cys
755 760 765
Gln Pro Lys Lys Ile Phe Val Glu Met Ala Arg Ser Asp Glu Glu Lys
770 775 780
Lys Arg Thr Val Ser Arg Lys Asp Arg Leu Leu Glu Ala Tyr Asp Ala
785 790 795 800
Ile Lys Asp Glu Ala Arg Gln Trp Gln Glu Glu Leu Gln Lys Tyr Ser
805 810 815
Asp Gly Asp Phe Lys Ala Ile Lys Leu Tyr Leu Tyr Tyr Thr Gln Met
820 825 830
Gly Gln Cys Met Tyr Thr Gly Arg Lys Ile Asp Leu Ser Gln Leu Asn
835 840 845
Asp Ala Thr Val Trp Asp Arg Asp His Ile Tyr Pro Gln Ser Lys Thr
850 855 860
Lys Asp Asp Ser Leu Asp Asn Leu Val Leu Val Asp Arg Ser Val Asn
865 870 875 880
Ala Lys Lys Ser Asp Gly Met Leu Ser Pro Glu Ile Gln Gln Arg Met
885 890 895
Arg Ala Thr Trp Lys Tyr Leu Lys Glu Lys Lys Leu Ile Ser Glu Lys
900 905 910
Lys Tyr Glu Arg Leu Thr Arg Val Ser Pro Leu Thr Asp Glu Glu Leu
915 920 925
Ala Gly Phe Ile Asn Arg Gln Leu Val Glu Thr Arg Gln Ser Ser Lys
930 935 940
Ala Val Ala Thr Leu Leu Lys Arg Val Tyr Asp Glu Ala Glu Ile Val
945 950 955 960
Tyr Val Lys Ala Glu Ala Val Ser Asn Phe Arg Arg Asp Asn Leu Asp
965 970 975
Tyr Ile Lys Val Arg Asp Leu Asn Asp Tyr His His Ala Lys Asp Ala
980 985 990
Tyr Gln Asn Ile Val Val Gly Asn Val Phe His Glu Lys Phe Thr Ser
995 1000 1005
Asn Pro Leu Arg Trp Leu Lys Asn Asn Pro Asn Thr Lys Tyr Ser
1010 1015 1020
Leu Asn Gln Met Phe Asn Phe Asp Leu Glu Lys Asn Gly Val Val
1025 1030 1035
Ile Trp Lys Arg Gly Lys Ala Gly Ser Ile Lys Cys Val Glu Glu
1040 1045 1050
Thr Leu Lys Arg Asn Asp Ile Leu Phe Thr Arg Tyr Ala Phe Cys
1055 1060 1065
Asn Lys Gly Gly Phe Phe Asn Gln Met Leu Thr Ala Ala Pro Glu
1070 1075 1080
Asp Lys Thr Lys Ala Lys Gly Leu Val Pro Ile Lys Lys Gly Met
1085 1090 1095
Glu Thr Trp Lys Tyr Gly Gly Tyr Thr Ser Val Thr Pro Ser His
1100 1105 1110
Phe Met Leu Val Ala Ser Lys Asp Lys Lys Gly Lys Glu Ile Arg
1115 1120 1125
Thr Ile Glu Thr Val Pro Leu Tyr Arg Trp Lys Glu Phe Lys Glu
1130 1135 1140
Asn Pro Asp Ala Leu Leu Gln Tyr Cys Arg Glu Phe Tyr Gly Leu
1145 1150 1155
Lys Glu Pro Lys Val Leu Ile Pro Cys Ile Lys Lys Asn Ala Arg
1160 1165 1170
Leu Val Val Asn Gly Phe Pro Met His Leu Lys Gly Ser Thr Gly
1175 1180 1185
Lys Gln Leu Ile Leu Gln Gly Ala Val Gln Leu Cys Leu Asn Asn
1190 1195 1200
Glu Asn Ile Lys Tyr Leu Lys Lys Val Thr Lys Tyr Leu Glu Tyr
1205 1210 1215
Asn Ala Gln Arg Arg Asp Lys Arg Thr Leu Leu Glu Val Arg Glu
1220 1225 1230
Val Thr Gly Ile Asn Lys Glu Glu Asn Ile Gln Leu Tyr Asp Val
1235 1240 1245
Phe Val Asp Lys Leu Ser Asn Thr Ile Tyr Gln Tyr Arg Pro Ala
1250 1255 1260
Asn Pro Lys Asp Asn Leu Ile Lys Gly Arg Glu Lys Phe Ile Glu
1265 1270 1275
Leu Gly Leu Ala Glu Gln Cys Val Val Leu Gly Glu Val Leu His
1280 1285 1290
Leu Phe Gln Cys Lys Pro Leu Thr Ser Asp Leu Thr Leu Ile Gly
1295 1300 1305
Gly Ser Pro Asn Thr Gly Thr Ile Lys Ile Thr Lys Thr Ile Ser
1310 1315 1320
Asn Cys Asn Val Val Lys Leu Leu Ser Gln Ser Ile Ala Gly Val
1325 1330 1335
Lys Val Arg Glu Ile Asn Leu Leu Ile Ile
1340 1345
<210> 2
<211> 4047
<212> DNA
<213> Unknown
<220>
<223> OMNI-103
<400> 2
atgagcataa aaagtgatta ttttttagga cttgatattg gtacggattc tattggatgg 60
gcggtaaccg acccagaata tcacatattg agacgaaaag gtaaagcatt atggggaata 120
agattatttg atgcggccaa tacagcggca gaacggcgaa catttaggac aagccgaaga 180
aggattcaga gaagacgaca gagaattcgg ttattgcaag aattatttgc agaagaaatg 240
gtaaaattag acccaggatt ttttcagagg ttgtcagaca gcgcattttg gcaggaggat 300
aagcaagagc agcaaattta ttcacttttt acttgtgaaa attatacaga tgttgattat 360
tacagagaat atcctactat ttatcatttg agaagtgcat tgattcagga aaagaaggaa 420
tttgatcttc gtcttctata tcttgctctt caccatttga tgaagcacag gggacatttc 480
ctgtttaatg ggagtattaa taatgtgacg tcatttcata cgacgtttca gacgtttgca 540
gattgtcttt atgatgagtt tgatatagaa ctggaatgtg attccgaaga tagatttgca 600
gaaattttaa aggataaaca tgccagaaaa acaggaaaat gttctgaatt agagataatc 660
tgtcatatag aaaaatcaaa taagcagcta aaagaacttt ttaaattaat tacaggaatg 720
aaagctagtt tgagtgttgt gtttggtgat gatgagttag cggaaataga acataataag 780
attagttttt cagagagtag ttatgatgaa gtacgtcttg cattggagga tgagattcag 840
gagaggactg gtatactgga tatctttcat gcagtttata gttgggcgat tctcgcggat 900
attttagaag gcggagaata tgaggggaat tcttatctaa gcgttgcgaa ggtaagcact 960
tataaaaagc atggtgatga tttgcggttg ctaagaacac tggttcggga atattgtcct 1020
gatcattaca aatctttctt ttccgtatca gggaaggaga attattgtgc atatgcgggt 1080
actttaaaaa agaatggaaa aaaacagccg attaaacgtt gcagccagga agatttttat 1140
aaagcgttaa agaaattgct gaatcagatg ccgacagaac aaccagaagt gaaagacatc 1200
ttcatcgaaa ttgaaaatgg tacttttttg ccgttgcagg taagtaagga taatggagtg 1260
ataccttatc aggtaaataa gatggaatta gaaaaaatcc tgcagaatgc agaggaatat 1320
ttgccatttc taaaaaatat agatgaagaa tgtggaaaaa cggttagtaa gaagattata 1380
gatctctttg agtttagaat accatattat gtagggccgc ttaataccgc taaaggagaa 1440
aactgttgga tggtcagaaa agaagcgggg agaatatatc cgtggaattt tgatgaaaag 1500
gtagacagag atcaatcagc agaaaaattt atccgtagaa tgacgaatca gtgtacatat 1560
ttaatacatg aggatgttgt acctaaaaat tctttgcttt attcggagtt tatggtgctt 1620
aatgaattaa ataatgtaaa gatccggtct gagaagctgc cggtggagtt aaaacaggca 1680
atagtattgg atttgtttaa gaaacaaaag cagataacag gaaaaaaact tcttaattac 1740
ttgaatgcaa atggatatga tgtaaaaaaa gaagatttgt cagggtttga cggaaacttt 1800
aaatcatctc tgtcatcata tcttactttg aaaaaagtat ttggtgaaga attagataaa 1860
tatagtgtgc agcagatggc agaggatatt atcttgtgga tcactctgta tggagatgat 1920
cagaagatgt tgcgcagggt aattcgaaaa cattatgaac agcaattgag tgaagaacag 1980
attctttcct tatcgaaatt gaaattccaa ggctggggaa gattatccag acgacttttg 2040
agtgaaatgg aaggcgttga ttgtgagact ggtgagtgta tgacggtcat gcaaggactt 2100
cgtaatactc agaataatct gatgcagctt ctaagtcagc agttttcatt tatggaattg 2160
attgaggaag aaaatgggaa ttattatgta gatgagatta catacgataa tcttgtgaaa 2220
gatatggtta tatctccgtc agtgaagaga gcagtctggc agacagttca gattgtggag 2280
gagattaagg gggtaatggg ctgtcagcct aagaagatat ttgtcgagat ggcgcgaagc 2340
gatgaagaga aaaagcgtac tgtatctagg aaagacaggt tattagaagc atatgatgcg 2400
atcaaggatg aggctcgtca atggcaggaa gagttgcaaa agtattcaga tggtgatttt 2460
aaggctatta aactttatct gtattatacg cagatggggc aatgtatgta tactggaaga 2520
aagatagatc tgtcacaatt aaatgatgcg acggtatggg acagagatca tatatatcca 2580
cagtccaaaa caaaagatga tagtctggat aatctggtat tggtagaccg gagcgtgaac 2640
gctaagaaaa gtgatgggat gctatcacct gagattcagc agagaatgcg ggctacttgg 2700
aaatacttaa aagagaaaaa gttgatttca gagaagaaat atgagcgttt gactagggtc 2760
tcaccactta cagatgagga attggcaggt tttattaatc gacagttagt tgaaacacgt 2820
cagtcttcga aagcagtagc aacacttttg aaacgagtat atgatgaagc ggagattgtc 2880
tatgtaaaag cggaagctgt ttcaaatttt agaagagata atttggatta tattaaggtg 2940
cgtgatctga atgattatca tcatgctaaa gatgcatatc agaatattgt agtggggaat 3000
gtttttcatg agaaatttac cagcaatccg cttcgttggc tgaaaaacaa tcctaatacg 3060
aaatatagtt taaatcagat gtttaacttt gatttagaga aaaatggggt ggtaatatgg 3120
aaaaggggga aggctggaag tattaaatgt gttgaagaaa cattgaaaag aaatgatatt 3180
ctttttacac gatatgcttt ttgtaataaa ggtggttttt ttaaccagat gttaacggca 3240
gctccagaag ataaaacgaa agcaaaggga cttgtaccaa taaaaaaagg tatggaaaca 3300
tggaaatacg ggggatatac atcagtaact ccgtcacatt ttatgttggt tgcttcgaaa 3360
gataagaaag gaaaggagat aagaacgatt gagacagttc cgttgtatag gtggaaagag 3420
ttcaaagaaa atccagatgc attactccaa tattgtagag agttctatgg tttgaaagag 3480
cccaaggtgt tgataccatg catcaagaag aatgccagat tagtcgttaa tggatttcca 3540
atgcatttga aagggagtac aggaaaacaa ttgattttgc agggagcggt tcaattatgt 3600
ctgaataatg aaaatataaa gtatttgaaa aaagtcacaa aatatttgga atataatgca 3660
cagagaagag ataaaagaac actgctggaa gtaagagagg ttacaggaat taacaaagag 3720
gaaaatatac agttatatga tgtgtttgtt gataaattga gtaacacaat atatcagtat 3780
cgtccggcca atccaaagga caatcttata aaaggaagag agaagtttat agaattaggg 3840
ttggcagaac aatgtgttgt gttaggtgaa gtattgcatt tgttccaatg taaaccactc 3900
acgtctgatt tgactttgat tggaggttca ccgaatacag ggacaataaa aataacaaag 3960
acaattagta attgtaatgt tgtaaagttg ttaagccaat ctattgcagg tgttaaagtg 4020
agagaaatta atttgttaat aatatga 4047
<210> 3
<211> 4047
<212> DNA
<213> Artificial Sequence
<220>
<223> OMNI-103 human optimized DNA sequence
<400> 3
atgtctatca agagcgacta cttcctgggc ctcgacatcg gcacagattc tatcggatgg 60
gccgtgacag accccgagta ccacatcctg agaagaaagg gcaaagccct gtggggcatc 120
agactgttcg atgccgccaa tactgccgcc gagagaagaa ccttccggac cagcagaaga 180
agaatccagc ggcggagaca gcggatcaga ctgctgcaag agctgttcgc cgaggaaatg 240
gttaagctgg accccggctt cttccagaga ctgagcgata gcgccttctg gcaagaggac 300
aagcaagagc agcagatcta cagcctgttt acctgcgaga actacaccga cgtggactac 360
tacagagagt accccaccat ctaccacctg agaagcgccc tgatccaaga gaaaaaagag 420
ttcgacctgc ggctgctgta tctggccctg caccatctga tgaagcaccg gggccacttt 480
ctgttcaacg gcagcatcaa caacgtgacc agcttccaca ccaccttcca gaccttcgcc 540
gactgcctgt acgacgagtt cgacatcgag ctggaatgcg acagcgagga cagattcgcc 600
gagatcctga aggataagca cgccagaaag accggcaagt gctctgagct ggaaatcatc 660
tgccacatcg agaagtccaa caagcagctg aaagaactgt tcaagctgat caccggcatg 720
aaggccagcc tgagcgtggt gtttggagat gatgagctgg ccgagatcga gcacaacaag 780
atcagcttca gcgagagcag ctacgacgaa gtgcggctgg ccctggaaga tgagattcaa 840
gagagaaccg gcatcctgga catcttccac gccgtgtatt cttgggccat cctggccgat 900
attctggaag gcggcgagta cgagggcaac agctatctgt ctgtggccaa ggtgtccacc 960
tacaagaagc acggcgacga cctgagactg ctgagaacac tcgtgcgcga gtactgcccc 1020
gaccactaca agagcttttt cagcgtgtcc ggcaaagaga actactgcgc ctacgccggc 1080
acactgaaga agaacggcaa gaagcagccc atcaagcggt gcagccaaga ggacttctac 1140
aaggccctga agaaactgct gaaccagatg cctaccgagc agcccgaagt gaaggatatc 1200
ttcatcgaga ttgagaacgg caccttcctg cctctgcaag tgtccaagga caacggcgtg 1260
atcccctacc aagtgaacaa gatggaactc gagaagatcc tgcagaacgc cgaagagtac 1320
ctgcctttcc tgaagaacat cgacgaggaa tgcggcaaga ccgtgtccaa gaagatcatc 1380
gacctgttcg agttcagaat cccctactac gtgggccctc tgaataccgc caagggcgag 1440
aattgctgga tggttcgaaa agaggccggc agaatctacc cctggaactt cgatgagaag 1500
gtggacagag atcagagcgc cgagaagttc atcagacgga tgaccaacca gtgcacctac 1560
ctgatccacg aggacgtggt gcctaagaac agcctgctgt actccgagtt catggtgctg 1620
aacgagctga acaatgtgaa gattcggagc gagaagctgc ccgtggaact gaagcaggcc 1680
atcgtgctgg acctgtttaa gaagcagaag cagatcacag ggaagaagct gctcaactac 1740
ctgaacgcca acggctacga cgtgaagaaa gaggacctga gcggcttcga cggcaacttc 1800
aagtccagcc tgtccagcta cctgactctg aagaaggtgt tcggagagga actggacaag 1860
tacagcgtgc agcagatggc cgaggacatc atcctgtgga tcaccctgta tggcgacgat 1920
cagaaaatgc tgcggagagt gatccggaag cactacgagc agcagctgtc tgaggaacag 1980
atcctgagcc tgagcaagct gaagttccaa ggctggggca gactgtctag acggctgctc 2040
tctgaaatgg aaggcgtgga ctgtgaaacc ggcgagtgca tgacagtgat gcagggcctg 2100
agaaacaccc agaacaacct gatgcagctg ctgagccagc agttcagctt catggaactg 2160
atcgaggaag agaacgggaa ctactacgtc gacgagatca cctacgacaa cctggtcaag 2220
gacatggtca tcagccctag cgtgaaaagg gccgtgtggc agacagtgca gatcgtggaa 2280
gaaatcaagg gcgtgatggg atgccagcct aagaaaatct tcgtggaaat ggcccgcagc 2340
gacgaagaga agaaacggac cgtgtctcgg aaggatcggc tgctggaagc ctacgacgcc 2400
atcaaggatg aggcccggca atggcaagaa gaactgcaga aatactccga cggcgatttc 2460
aaggccatca agctgtacct gtactacacc cagatgggcc agtgcatgta caccggcaga 2520
aaaatcgatc tgtcccagct gaacgacgcc accgtgtggg atagagatca catctaccct 2580
cagagcaaga ccaaggacga cagcctggac aatctggtgc tggtggatag atccgtgaat 2640
gccaagaaaa gcgacggcat gctgagcccc gagatccagc agagaatgag agccacctgg 2700
aagtacctga aagaaaagaa gctcatcagc gagaagaagt acgagcggct gaccagagtg 2760
tcccctctga cagatgaaga actggccggc ttcatcaacc ggcagctggt ggaaacaaga 2820
cagagcagca aagccgtggc cacactgctg aagagggtgt acgatgaggc cgagattgtg 2880
tatgtgaagg ccgaggccgt gtctaacttc cggcgggata acctggacta catcaaagtg 2940
cgggacctga acgactacca ccacgccaag gacgcctacc agaacatcgt cgtgggcaac 3000
gtgttccacg agaagtttac cagcaatccc ctgcggtggc tgaaaaacaa ccccaacacc 3060
aagtactccc tcaaccagat gttcaacttc gacctggaaa agaacggcgt ggtcatctgg 3120
aagagaggca aggccggctc cattaagtgt gtggaagaga cactgaagcg gaacgacatc 3180
ctgttcacca gatacgcttt ctgcaacaaa ggcggcttct ttaatcagat gctgaccgcc 3240
gctccagagg ataagacaaa ggccaaaggc ctggtgccta tcaagaaagg catggaaacc 3300
tggaaatacg gcggctacac cagcgtgacc cctagccact ttatgctggt ggccagcaag 3360
gacaagaagg gaaaagagat ccggaccatc gagacagtgc ccctgtaccg gtggaaagag 3420
ttcaaagaga atcccgacgc tctgctccag tactgcagag agttctacgg cctgaaagag 3480
cccaaggttc tgatcccttg catcaagaag aatgcccggc tggtcgtgaa cggcttccct 3540
atgcacctga agggcagcac cggaaaacag ctgattctgc agggtgccgt gcagctgtgc 3600
ctgaacaacg agaacatcaa gtacctcaag aaagtgacga agtacctcga gtacaacgcc 3660
cagcggagag acaagagaac cctgctcgaa gttcgggaag tgaccggaat caacaaagag 3720
gaaaacatcc agctgtacga tgtgttcgtg gacaagctga gcaacacaat ctaccagtac 3780
agacccgcca atcctaagga caacctcatc aagggccgcg agaaattcat cgagcttggc 3840
ctggctgagc agtgcgtggt gctgggagaa gtgctgcatc tgttccagtg caagcccctg 3900
accagcgatc tgacactgat cggcggaagc cctaacaccg gcaccatcaa gatcaccaag 3960
accatcagca actgcaacgt ggtcaagctg ctgtcccagt ctatcgccgg cgtgaaagtc 4020
cgcgagatca acctgctgat catctga 4047
<210> 4
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 12 crRNA repeat
<400> 4
guuugagagu aguguaa 17
<210> 5
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 12 Partial crRNA 1
<400> 5
guuugagagu agugu 15
<210> 6
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 12 Partial crRNA 2
<400> 6
guuugagagu ag 12
<210> 7
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 12 Partial crRNA 3
<400> 7
guuugagagu 10
<210> 8
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 12 tracrRNA antirepeat
<400> 8
uuacacuaca aguucaaau 19
<210> 9
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 12 partial tracrRNA 1
<400> 9
acacuacaag uucaaau 17
<210> 10
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 12 partial tracrRNA 2
<400> 10
cuacaaguuc aaau 14
<210> 11
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 12 partial tracrRNA 3
<400> 11
acaaguucaa au 12
<210> 12
<211> 41
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 12 tracrRNA portion 1
<400> 12
aaaaauuuau ucaaauccuu uugcuacauu guguagaauu u 41
<210> 13
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 12 tracrRNA portion 2
<400> 13
aaagaucugg caacagaucu uuuuuu 26
<210> 14
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 12 tracrRNA portion 2 polyT
<400> 14
aaagaucugg caacagauc 19
<210> 15
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 12 V1
<400> 15
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccuu 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 16
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 12 V2
<400> 16
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 17
<211> 41
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 12 V2 Modified tracrRNA
<400> 17
aaaaauuuau ucaaauccau uugcuacauu guguagaauu u 41
<210> 18
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 32 crRNA repeat
<400> 18
guuugagagu aguguaa 17
<210> 19
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 32 Partial crRNA 1
<400> 19
guuugagagu agugu 15
<210> 20
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 32 Partial crRNA 2
<400> 20
guuugagagu ag 12
<210> 21
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 32 Partial crRNA 3
<400> 21
guuugagagu 10
<210> 22
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 32 tracrRNA antirepeat
<400> 22
uuacacuaca aguucaaau 19
<210> 23
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 32 Partial tracrRNA 1
<400> 23
acacuacaag uucaaau 17
<210> 24
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 32 Partial tracrRNA 2
<400> 24
cuacaaguuc aaau 14
<210> 25
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 32 Partial tracrRNA 3
<400> 25
acaaguucaa au 12
<210> 26
<211> 41
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 32 tracrRNA portion 1
<400> 26
aaaaauuuau ucaaauccuu uugcuacauu guguagaauu u 41
<210> 27
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 32 tracrRNA portion 2
<400> 27
aaagaucugg caacagaucu uuuuuauuuu uu 32
<210> 28
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 32 tracrRNA portion 2 polyT
<400> 28
aaagaucugg caacagaucu uuuuua 26
<210> 29
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 32 V1
<400> 29
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccuu 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuauuu uuu 113
<210> 30
<211> 106
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 32 V2
<400> 30
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccuu 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuu 106
<210> 31
<211> 106
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 32 V3
<400> 31
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuu 106
<210> 32
<211> 41
<212> RNA
<213> Artificial Sequence
<220>
<223> sgRNA 32 V3 modified tracrRNA
<400> 32
aaaaauuuau ucaaauccau uugcuacauu guguagaauu u 41
<210> 33
<211> 101
<212> RNA
<213> Artificial Sequence
<220>
<223> V2.1
<400> 33
guuugagagu aguggaaaca cuacaaguuc aaauaaaaau uuauucaaau ccauuugcua 60
cauuguguag aauuuaaaga ucuggcaaca gaucuuuuuu u 101
<210> 34
<211> 85
<212> RNA
<213> Artificial Sequence
<220>
<223> V2.2
<400> 34
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uuuuu 85
<210> 35
<211> 79
<212> RNA
<213> Artificial Sequence
<220>
<223> V2.3
<400> 35
guuugagagu aguggaaaca cuacaaguuc aaauaaaaau uuauucaaau ccauuugcua 60
cauuguguag aauuuuuuu 79
<210> 36
<211> 95
<212> RNA
<213> Artificial Sequence
<220>
<223> V2.4
<400> 36
guuugagagu aguggaaaca cuacaaguuc aaauaaaaau uuauucaaau ccauuugcua 60
cauuguguag aauuuaaaga ugcaaaucuu uuuuu 95
<210> 37
<211> 6373
<212> DNA
<213> Artificial Sequence
<220>
<223> pET9a OMNI-103
<400> 37
taatacgact cactataggg agaccacaac ggtttccctc tagagagaca ataaccctga 60
taatgcttca ataatattga aaaaggaaga gtatgcctaa gaagaagaga aaggtgggta 120
cctctatcaa gagcgactac ttcctgggcc tcgacatcgg cacagattct atcggatggg 180
ccgtgacaga ccccgagtac cacatcctga gaagaaaggg caaagccctg tggggcatca 240
gactgttcga tgccgccaat actgccgccg agagaagaac cttccggacc agcagaagaa 300
gaatccagcg gcggagacag cggatcagac tgctgcaaga gctgttcgcc gaggaaatgg 360
ttaagctgga ccccggcttc ttccagagac tgagcgatag cgccttctgg caagaggaca 420
agcaagagca gcagatctac agcctgttta cctgcgagaa ctacaccgac gtggactact 480
acagagagta ccccaccatc taccacctga gaagcgccct gatccaagag aaaaaagagt 540
tcgacctgcg gctgctgtat ctggccctgc accatctgat gaagcaccgg ggccactttc 600
tgttcaacgg cagcatcaac aacgtgacca gcttccacac caccttccag accttcgccg 660
actgcctgta cgacgagttc gacatcgagc tggaatgcga cagcgaggac agattcgccg 720
agatcctgaa ggataagcac gccagaaaga ccggcaagtg ctctgagctg gaaatcatct 780
gccacatcga gaagtccaac aagcagctga aagaactgtt caagctgatc accggcatga 840
aggccagcct gagcgtggtg tttggagatg atgagctggc cgagatcgag cacaacaaga 900
tcagcttcag cgagagcagc tacgacgaag tgcggctggc cctggaagat gagattcaag 960
agagaaccgg catcctggac atcttccacg ccgtgtattc ttgggccatc ctggccgata 1020
ttctggaagg cggcgagtac gagggcaaca gctatctgtc tgtggccaag gtgtccacct 1080
acaagaagca cggcgacgac ctgagactgc tgagaacact cgtgcgcgag tactgccccg 1140
accactacaa gagctttttc agcgtgtccg gcaaagagaa ctactgcgcc tacgccggca 1200
cactgaagaa gaacggcaag aagcagccca tcaagcggtg cagccaagag gacttctaca 1260
aggccctgaa gaaactgctg aaccagatgc ctaccgagca gcccgaagtg aaggatatct 1320
tcatcgagat tgagaacggc accttcctgc ctctgcaagt gtccaaggac aacggcgtga 1380
tcccctacca agtgaacaag atggaactcg agaagatcct gcagaacgcc gaagagtacc 1440
tgcctttcct gaagaacatc gacgaggaat gcggcaagac cgtgtccaag aagatcatcg 1500
acctgttcga gttcagaatc ccctactacg tgggccctct gaataccgcc aagggcgaga 1560
attgctggat ggttcgaaaa gaggccggca gaatctaccc ctggaacttc gatgagaagg 1620
tggacagaga tcagagcgcc gagaagttca tcagacggat gaccaaccag tgcacctacc 1680
tgatccacga ggacgtggtg cctaagaaca gcctgctgta ctccgagttc atggtgctga 1740
acgagctgaa caatgtgaag attcggagcg agaagctgcc cgtggaactg aagcaggcca 1800
tcgtgctgga cctgtttaag aagcagaagc agatcacagg gaagaagctg ctcaactacc 1860
tgaacgccaa cggctacgac gtgaagaaag aggacctgag cggcttcgac ggcaacttca 1920
agtccagcct gtccagctac ctgactctga agaaggtgtt cggagaggaa ctggacaagt 1980
acagcgtgca gcagatggcc gaggacatca tcctgtggat caccctgtat ggcgacgatc 2040
agaaaatgct gcggagagtg atccggaagc actacgagca gcagctgtct gaggaacaga 2100
tcctgagcct gagcaagctg aagttccaag gctggggcag actgtctaga cggctgctct 2160
ctgaaatgga aggcgtggac tgtgaaaccg gcgagtgcat gacagtgatg cagggcctga 2220
gaaacaccca gaacaacctg atgcagctgc tgagccagca gttcagcttc atggaactga 2280
tcgaggaaga gaacgggaac tactacgtcg acgagatcac ctacgacaac ctggtcaagg 2340
acatggtcat cagccctagc gtgaaaaggg ccgtgtggca gacagtgcag atcgtggaag 2400
aaatcaaggg cgtgatggga tgccagccta agaaaatctt cgtggaaatg gcccgcagcg 2460
acgaagagaa gaaacggacc gtgtctcgga aggatcggct gctggaagcc tacgacgcca 2520
tcaaggatga ggcccggcaa tggcaagaag aactgcagaa atactccgac ggcgatttca 2580
aggccatcaa gctgtacctg tactacaccc agatgggcca gtgcatgtac accggcagaa 2640
aaatcgatct gtcccagctg aacgacgcca ccgtgtggga tagagatcac atctaccctc 2700
agagcaagac caaggacgac agcctggaca atctggtgct ggtggataga tccgtgaatg 2760
ccaagaaaag cgacggcatg ctgagccccg agatccagca gagaatgaga gccacctgga 2820
agtacctgaa agaaaagaag ctcatcagcg agaagaagta cgagcggctg accagagtgt 2880
cccctctgac agatgaagaa ctggccggct tcatcaaccg gcagctggtg gaaacaagac 2940
agagcagcaa agccgtggcc acactgctga agagggtgta cgatgaggcc gagattgtgt 3000
atgtgaaggc cgaggccgtg tctaacttcc ggcgggataa cctggactac atcaaagtgc 3060
gggacctgaa cgactaccac cacgccaagg acgcctacca gaacatcgtc gtgggcaacg 3120
tgttccacga gaagtttacc agcaatcccc tgcggtggct gaaaaacaac cccaacacca 3180
agtactccct caaccagatg ttcaacttcg acctggaaaa gaacggcgtg gtcatctgga 3240
agagaggcaa ggccggctcc attaagtgtg tggaagagac actgaagcgg aacgacatcc 3300
tgttcaccag atacgctttc tgcaacaaag gcggcttctt taatcagatg ctgaccgccg 3360
ctccagagga taagacaaag gccaaaggcc tggtgcctat caagaaaggc atggaaacct 3420
ggaaatacgg cggctacacc agcgtgaccc ctagccactt tatgctggtg gccagcaagg 3480
acaagaaggg aaaagagatc cggaccatcg agacagtgcc cctgtaccgg tggaaagagt 3540
tcaaagagaa tcccgacgct ctgctccagt actgcagaga gttctacggc ctgaaagagc 3600
ccaaggttct gatcccttgc atcaagaaga atgcccggct ggtcgtgaac ggcttcccta 3660
tgcacctgaa gggcagcacc ggaaaacagc tgattctgca gggtgccgtg cagctgtgcc 3720
tgaacaacga gaacatcaag tacctcaaga aagtgacgaa gtacctcgag tacaacgccc 3780
agcggagaga caagagaacc ctgctcgaag ttcgggaagt gaccggaatc aacaaagagg 3840
aaaacatcca gctgtacgat gtgttcgtgg acaagctgag caacacaatc taccagtaca 3900
gacccgccaa tcctaaggac aacctcatca agggccgcga gaaattcatc gagcttggcc 3960
tggctgagca gtgcgtggtg ctgggagaag tgctgcatct gttccagtgc aagcccctga 4020
ccagcgatct gacactgatc ggcggaagcc ctaacaccgg caccatcaag atcaccaaga 4080
ccatcagcaa ctgcaacgtg gtcaagctgc tgtcccagtc tatcgccggc gtgaaagtcc 4140
gcgagatcaa cctgctgatc atcggatcct acccatacga tgttccagat tacgcggccg 4200
ctccaaaaaa gaaaagaaaa gttgcggcta gccatcatca ccatcaccat catcattaag 4260
gctgctaaca aagcccgaaa ggaagctgag ttggctgctg ccaccgctga gcaataacta 4320
gcataacccc ttggggcctc taaacgggtc ttgaggggtt ttttgctgaa aggaggaact 4380
atatccggat atccacagga cgggtgtggt cgccatgatc gcgtagtcga tagtggctcc 4440
aagtagcgaa gcgagcagga ctgggcggcg gccaaagcgg tcggacagtg ctccgagaac 4500
gggtgcgcat agaaattgca tcaacgcata tagcgctagc agcacgccat agtgactggc 4560
gatgctgtcg gaatggacga tatcccgcaa gaggcccggc agtaccggca taaccaagcc 4620
tatgcctaca gcatccaggg tgacggtgcc gaggatgacg atgagcgcat tgttagattt 4680
catacacggt gcctgactgc gttagcaatt taactgtgat aaactaccgc attaaagctt 4740
atcgatgata agctgtcaaa catgagaatt cttagaaaaa ctcatcgagc atcaaatgaa 4800
actgcaattt attcatatca ggattatcaa taccatattt ttgaaaaagc cgtttctgta 4860
atgaaggaga aaactcaccg aggcagttcc ataggatggc aagatcctgg tatcggtctg 4920
cgattccgac tcgtccaaca tcaatacaac ctattaattt cccctcgtca aaaataaggt 4980
tatcaagtga gaaatcacca tgagtgacga ctgaatccgg tgagaatggc aaaagcttat 5040
gcatttcttt ccagacttgt tcaacaggcc agccattacg ctcgtcatca aaatcactcg 5100
catcaaccaa accgttattc attcgtgatt gcgcctgagc gagacgaaat acgcgatcgc 5160
tgttaaaagg acaattacaa acaggaatcg aatgcaaccg gcgcaggaac actgccagcg 5220
catcaacaat attttcacct gaatcaggat attcttctaa tacctggaat gctgttttcc 5280
cggggatcgc agtggtgagt aaccatgcat catcaggagt acggataaaa tgcttgatgg 5340
tcggaagagg cataaattcc gtcagccagt ttagtctgac catctcatct gtaacatcat 5400
tggcaacgct acctttgcca tgtttcagaa acaactctgg cgcatcgggc ttcccataca 5460
atcgatagat tgtcgcacct gattgcccga cattatcgcg agcccattta tacccatata 5520
aatcagcatc catgttggaa tttaatcgcg gcctcgagca agacgtttcc cgttgaatat 5580
ggctcataac accccttgta ttactgttta tgtaagcaga cagttttatt gttcatgacc 5640
aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa 5700
ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca 5760
ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta 5820
actggcttca gcagagcgca gataccaaat actgtccttc tagtgtagcc gtagttaggc 5880
caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca 5940
gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta 6000
ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag 6060
cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt 6120
cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc 6180
acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac 6240
ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac 6300
gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc 6360
gatcccgcga aat 6373
<210> 38
<211> 2783
<212> DNA
<213> Artificial Sequence
<220>
<223> pShuttle Guide OMNI-103 V2
<400> 38
tacacggtgc ctgactgcgt tagcaattta actgtgataa actaccgcat taaagcttat 60
cgatgataag ctgtcaacac atttccccga aaagtgccac ctgacgtcct cgagtcccgc 120
ataatcgaaa tgagggccta tttcccatga ttccttcata tttgcatata cgatacaagg 180
ctgttagaga gataattaga attaatttga ctgtaaacac aaagatatta gtacaaaata 240
cgtgacgtag aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa 300
tggactatca tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct 360
tgctaatacg actcactata ggaagagcag agccttggtc tcgtttgaga gtagtgtaag 420
aaattacact acaagttcaa ataaaaattt attcaaatcc atttgctaca ttgtgtagaa 480
tttaaagatc tggcaacaga tctttttttg aattctctag cataacccct tggggcctct 540
aaacgggtct tgaggggttt tttgacctag gctaggggat atattccggg taccccgctt 600
cctcgctcac tgactcgcta cgctcggtcg ttcgactgcg gcgagcggaa atggcttacg 660
aacggggcgg agatttcctg gaagatgcca ggaagatact taacagggaa gtgagagggc 720
cgcggcaaag ccgtttttcc ataggctccg cccccctgac aagcatcacg aaatctgacg 780
ctcaaatcag tggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 840
cggctccctc gtgcgctctc ctgttcctgc ctttcggttt accggtgtca ttccgctgtt 900
atggccgcgt ttgtctcatt ccacgcctga cactcagttc cgggtaggca gttcgctcca 960
agctggactg tatgcacgaa ccccccgttc agtccgaccg ctgcgcctta tccggtaact 1020
atcgtcttga gtccaacccg gaaagacatg caaaagcacc actggcagca gccactggta 1080
attgatttag aggagttagt cttgaagtca tgcgccggtt aaggctaaac tgaaaggaca 1140
agttttggtg actgcgctcc tccaagccag ttacctcggt tcaaagagtt ggtagctcag 1200
agaaccttcg aaaaaccgcc ctgcaaggcg gttttttcgt tttcagagca agagattacg 1260
cgcagaccaa aacgatctca agaagatcat cttattaatc agataaaata tttctagatt 1320
tcagtgcaat ttatctcttc aaatgtagca cctgaagtca gccccatacg atataagttg 1380
ttactagtgc ttggattctc accaataaaa aacgcccggc ggcaaccgag cgttctgaac 1440
aaatccagat ggagttctga ggtcattact ggatctatca acaggagtcc aagcgagaag 1500
ggttggtttg cgcattcaca gttctccgca agaattgatt ggctccaatt cttggagtgg 1560
tgaatccgtt agcgaggtgc cgccggcttc cattcaggtc gaggtggccc ggctccatgc 1620
accgcgacgc aacgcgggga ggcagacaag gtatagggcg gcgcctacaa tccatgccaa 1680
cccgttccat gtgctcgccg aggcggcata aatcgccgtg acgatcagcg gtccaatgat 1740
cgaagttagg ctggtaagag ccgcgagcga tccttgaagc tgtccctgat ggtcgtcatc 1800
tacctgcctg gacagcatgg cctgcaacgc gggcatcccg atgccgccgg aagcgagaag 1860
aatcataatg gggaaggcca tccagcctcg cgtcgcgaac gccagcaaga cgtagcccag 1920
cgcgtcggcc gccatgccgg cgataatggc ctgcttctcg ccgaaacgtt tggtggcggg 1980
accagtgacg aaggcttgag cgagggcgtg caagattccg aataccgcaa gcgacaggcc 2040
gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa atgacccaga gcgctgccgg 2100
cacctgtcct acgagttgca tgataaagaa gacagtcata agtgcggcga cgatagtcat 2160
gccccgcgcc caccggaagg agctgactgg gttgaaggct ctcaagggca tcggtcgacg 2220
ctctccctta tgcgactcct gcattaggaa gcagcccagt agtaggttga ggccgttgag 2280
caccgccgcc gcaaggaatg gtgcatgcaa ggagatggcg cccaacagtc ccccggccac 2340
ggggcctgcc accataccca cgccgaaaca agcgctcatg agcccgaagt ggcgagcccg 2400
atcttcccca tcggtgatgt cggcgatata ggcgccagca accgcacctg tggcgccggt 2460
gatgccggcc acgatgcgtc cggcgtagag gatccacagg acgggtgtgg tcgccatgat 2520
cgcgtagtcg atagtggctc caagtagcga agcgagcagg actgggcggc ggccaaagcg 2580
gtcggacagt gctccgagaa cgggtgcgca tagaaattgc atcaacgcat atagcgctag 2640
cagcacgcca tagtgactgg cgatgctgtc ggaatggacg atatcccgca agaggcccgg 2700
cagtaccggc ataaccaagc ctatgcctac agcatccagg gtgacggtgc cgaggatgac 2760
gatgagcgca ttgttagatt tca 2783
<210> 39
<211> 5009
<212> DNA
<213> Artificial Sequence
<220>
<223> pbPOS T2 library
<220>
<221> misc_feature
<222> (3040)..(3047)
<223> n is a, c, g, or t
<400> 39
tcgagtcttt acactttatg cttccggctc gtatgttgtg tggaattgtg agcggataac 60
aatttcacac atgattacgg attcaacgtc gtgactggta aaacccgggc gttacccaac 120
ttaatcgcct tgcagcacat ccccctttcg ccagcaggcg taataaggaa aggattcatg 180
tactatttga aaaacacaaa cttttggatg ttcggtttat tctttttctt ttactttttt 240
atcatgggag cctacttccc gtttttcccg atttggctac atgatatcaa ccatatcagc 300
aaaagtgata cgggtattat ttttgccgct atttctctgt tctcgctatt attccaaccg 360
ctgtttggtc tgctttctga caaactcggt ctacgcaaat acctgctgtg gattattacc 420
ggcatgttag tgatgtttgc gccgttcttt atttttatct tcgggccact gctgcagtac 480
aacattttag tagggtcgat tgttggtggt atttatctag gctttagttt taacgccggt 540
gcgccagcag tagaggcatt tattgagaaa gtcagccggc gcagtaattt cgaatttggt 600
cgcgcgcgga tgtttggcag tgttggctgg gcgctggttg cctcgattgt cgggatcatg 660
ttcaccatta ataatcagtt tgttttctgg ctgggctctg gcagttgtct catcctcgcc 720
gttttactct ttttcgccaa aacggacgcg ccctcaagtg ccacggttgc caatgcggta 780
ggtgccaacc attcggcatt tagccttaag ctggcactgg aactgttcag acagccaaaa 840
ctgtggtttt tgtcactgta tgttattggc gtttcctcca cctacgatgt ttttgaccaa 900
cagtttgcta atttctttac ttcgttcttt gctaccggtg aacagggtac ccgcgtattt 960
ggctacgtaa cgacaatggg cgaattactt aacgcctcga ttatgttctt tgcgccactg 1020
atcattaatc gcatcggtgg gaagaatgcc ctgctgctgg ctggcactat tatgtctgta 1080
cgtattattg gctcatcgtt cgccacctca gcgctggaag tggttattct gaaaacgctg 1140
catatgtttg aagtaccgtt cctgctggtg ggctccttta aatatattac tagtcagttt 1200
gaagtgcgtt tttcagcgac gatttatctg gtcagtttca gcttctttaa gcaactggcg 1260
atgattttta tgtctgtact ggcgggcaat atgtatgaaa gcataggttt ccaaggcgct 1320
tatctggtgc tgggtctggt ggcgctgggc ttcaccttaa tttccgtgtt cacgcttagc 1380
ggcccgggcc cgctttccct gctgcgtcgt caggtgaatg aagtcgctta aaggcctcga 1440
tgcagctagc atgctaatct gattcgttac caattatgac aacttgacgg ctacatcatt 1500
cactttttct tcacaaccgg cacggaactc gctcgggctg gccccggtgc attttttaaa 1560
tacccgcgag aaatagagtt gatcgtcaaa accaacattg cgaccgacgg tggcgatagg 1620
catccgggtg gtgctcaaaa gcagcttcgc ctggctgata cgttggtcct cgcgccagct 1680
taagacgcta atccctaact gctggcggaa aagatgtgac agacgcgacg gcgacaagca 1740
aacatgctgt gcgacgctgg cgatatcaaa attgctgtct gccaggtgat cgctgatgta 1800
ctgacaagcc tcgcgtaccc gattatccat cggtggatgg agcgactcgt taatcgcttc 1860
catgcgccgc agtaacaatt gctcaagcag atttatcgcc agcagctccg aatagcgccc 1920
ttccccttgc ccggcgttaa tgatttgccc aaacaggtcg ctgaaatgcg gctggtgcgc 1980
ttcatccggg cgaaagaacc ccgtattggc aaatattgac ggccagttaa gccattcatg 2040
ccagtaggcg cgcggacgaa agtaaaccca ctggtgatac cattcgcgag cctccggatg 2100
acgaccgtag tgatgaatct ctcctggcgg gaacagcaaa atatcacccg gtcggcaaac 2160
aaattctcgt ccctgatttt tcaccacccc ctgaccgcga atggtgagat tgagaatata 2220
acctttcatt cccagcggtc ggtcgataaa aaaatcgaga taaccgttgg cctcaatcgg 2280
cgttaaaccc gccaccagat gggcattaaa cgagtatccc ggcagcaggg gatcattttg 2340
cgcttcagcc atacttttca tactcccgcc attcagagaa gaaaccaatt gtccatattg 2400
catcagacat tgccgtcact gcgtctttta ctggctcttc tcgctaacca aaccggtaac 2460
cccgcttatt aaaagcattc tgtaacaaag cgggaccaaa gccatgacaa aaacgcgtaa 2520
caaaagtgtc tataatcacg gcagaaaagt ccacattgat tatttgcacg gcgtcacact 2580
ttgctatgcc atagcatttt tatccataag attagcggat cctacctgac gctttttatc 2640
gcaactctct actgtttctc catacccgtt tttttggggt agcgattgaa aacgatgcag 2700
tttaaggttt acacctataa aagagagagc cgttatcgtc tgtttgtgga tgtacagagt 2760
gatattattg acacgcccgg gcgacggatg gtgatccccc tggccagtgc acgtctgctg 2820
tcagataaag tctcccgtga actttacccg gtggtgcata tcggggatga aagctggcgc 2880
atgatgacca ccgatatggc cagtgtgccg gtctccgtta tcggggaaga agtggctgat 2940
ctcagccacc gcgaaaatga catcaaaaac gccattaacc tgatgttttg gggaatataa 3000
tcttctagac atacaatgga agagcagagc cttggtctcn nnnnnnnaag cttgatatcg 3060
aattcctgca gcccggggga tcccatggta cgcgtgctag aggcatcaaa taaaacgaaa 3120
ggctcagtcg aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcct 3180
gagtaggaca aatccgccgc cctagaccta ggcgttcggc tgcggcgagc ggtatcagct 3240
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 3300
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 3360
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 3420
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 3480
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 3540
gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 3600
ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 3660
cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 3720
aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 3780
tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 3840
ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 3900
tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 3960
ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 4020
actagtgctt ggattctcac caataaaaaa cgcccggcgg caaccgagcg ttctgaacaa 4080
atccagatgg agttctgagg tcattactgg atctatcaac aggagtccaa gcgagctcga 4140
tatcaaatta cgccccgccc tgccactcat cgcagtactg ttgtaattca ttaagcattc 4200
tgccgacatg gaagccatca cagacggcat gatgaacctg aatcgccagc ggcatcagca 4260
ccttgtcgcc ttgcgtataa tatttgccca tggtgaaaac gggggcgaag aagttgtcca 4320
tattggccac gtttaaatca aaactggtga aactcaccca gggattggct gagacgaaaa 4380
acatattctc aataaaccct ttagggaaat aggccaggtt ttcaccgtaa cacgccacat 4440
cttgcgaata tatgtgtaga aactgccgga aatcgtcgtg gtattcactc cagagcgatg 4500
aaaacgtttc agtttgctca tggaaaacgg tgtaacaagg gtgaacacta tcccatatca 4560
ccagctcacc gtctttcatt gccatacgga attccggatg agcattcatc aggcgggcaa 4620
gaatgtgaat aaaggccgga taaaacttgt gcttattttt ctttacggtc tttaaaaagg 4680
ccgtaatatc cagctgaacg gtctggttat aggtacattg agcaactgac tgaaatgcct 4740
caaaatgttc tttacgatgc cattgggata tatcaacggt ggtatatcca gtgatttttt 4800
tctccatttt agcttcctta gctcctgaaa atctcgataa ctcaaaaaat acgcccggta 4860
gtgatcttat ttcattatgg tgaaagttgg aacctcttac gtgccgatca acgtctcatt 4920
ttcgccagat atcgacgtct aagaaaccat tattatcatg acattaacct ataaaaatag 4980
gcgtatcacg aggccctttc gtcttcacc 5009
<210> 40
<211> 10286
<212> DNA
<213> Artificial Sequence
<220>
<223> pmOMNI OMNI-103
<400> 40
gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60
ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120
cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180
ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780
gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840
ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900
gtttaaactt aagcttgcca ccatgcctaa gaagaagaga aaggtgggta cctctatcaa 960
gagcgactac ttcctgggcc tcgacatcgg cacagattct atcggatggg ccgtgacaga 1020
ccccgagtac cacatcctga gaagaaaggg caaagccctg tggggcatca gactgttcga 1080
tgccgccaat actgccgccg agagaagaac cttccggacc agcagaagaa gaatccagcg 1140
gcggagacag cggatcagac tgctgcaaga gctgttcgcc gaggaaatgg ttaagctgga 1200
ccccggcttc ttccagagac tgagcgatag cgccttctgg caagaggaca agcaagagca 1260
gcagatctac agcctgttta cctgcgagaa ctacaccgac gtggactact acagagagta 1320
ccccaccatc taccacctga gaagcgccct gatccaagag aaaaaagagt tcgacctgcg 1380
gctgctgtat ctggccctgc accatctgat gaagcaccgg ggccactttc tgttcaacgg 1440
cagcatcaac aacgtgacca gcttccacac caccttccag accttcgccg actgcctgta 1500
cgacgagttc gacatcgagc tggaatgcga cagcgaggac agattcgccg agatcctgaa 1560
ggataagcac gccagaaaga ccggcaagtg ctctgagctg gaaatcatct gccacatcga 1620
gaagtccaac aagcagctga aagaactgtt caagctgatc accggcatga aggccagcct 1680
gagcgtggtg tttggagatg atgagctggc cgagatcgag cacaacaaga tcagcttcag 1740
cgagagcagc tacgacgaag tgcggctggc cctggaagat gagattcaag agagaaccgg 1800
catcctggac atcttccacg ccgtgtattc ttgggccatc ctggccgata ttctggaagg 1860
cggcgagtac gagggcaaca gctatctgtc tgtggccaag gtgtccacct acaagaagca 1920
cggcgacgac ctgagactgc tgagaacact cgtgcgcgag tactgccccg accactacaa 1980
gagctttttc agcgtgtccg gcaaagagaa ctactgcgcc tacgccggca cactgaagaa 2040
gaacggcaag aagcagccca tcaagcggtg cagccaagag gacttctaca aggccctgaa 2100
gaaactgctg aaccagatgc ctaccgagca gcccgaagtg aaggatatct tcatcgagat 2160
tgagaacggc accttcctgc ctctgcaagt gtccaaggac aacggcgtga tcccctacca 2220
agtgaacaag atggaactcg agaagatcct gcagaacgcc gaagagtacc tgcctttcct 2280
gaagaacatc gacgaggaat gcggcaagac cgtgtccaag aagatcatcg acctgttcga 2340
gttcagaatc ccctactacg tgggccctct gaataccgcc aagggcgaga attgctggat 2400
ggttcgaaaa gaggccggca gaatctaccc ctggaacttc gatgagaagg tggacagaga 2460
tcagagcgcc gagaagttca tcagacggat gaccaaccag tgcacctacc tgatccacga 2520
ggacgtggtg cctaagaaca gcctgctgta ctccgagttc atggtgctga acgagctgaa 2580
caatgtgaag attcggagcg agaagctgcc cgtggaactg aagcaggcca tcgtgctgga 2640
cctgtttaag aagcagaagc agatcacagg gaagaagctg ctcaactacc tgaacgccaa 2700
cggctacgac gtgaagaaag aggacctgag cggcttcgac ggcaacttca agtccagcct 2760
gtccagctac ctgactctga agaaggtgtt cggagaggaa ctggacaagt acagcgtgca 2820
gcagatggcc gaggacatca tcctgtggat caccctgtat ggcgacgatc agaaaatgct 2880
gcggagagtg atccggaagc actacgagca gcagctgtct gaggaacaga tcctgagcct 2940
gagcaagctg aagttccaag gctggggcag actgtctaga cggctgctct ctgaaatgga 3000
aggcgtggac tgtgaaaccg gcgagtgcat gacagtgatg cagggcctga gaaacaccca 3060
gaacaacctg atgcagctgc tgagccagca gttcagcttc atggaactga tcgaggaaga 3120
gaacgggaac tactacgtcg acgagatcac ctacgacaac ctggtcaagg acatggtcat 3180
cagccctagc gtgaaaaggg ccgtgtggca gacagtgcag atcgtggaag aaatcaaggg 3240
cgtgatggga tgccagccta agaaaatctt cgtggaaatg gcccgcagcg acgaagagaa 3300
gaaacggacc gtgtctcgga aggatcggct gctggaagcc tacgacgcca tcaaggatga 3360
ggcccggcaa tggcaagaag aactgcagaa atactccgac ggcgatttca aggccatcaa 3420
gctgtacctg tactacaccc agatgggcca gtgcatgtac accggcagaa aaatcgatct 3480
gtcccagctg aacgacgcca ccgtgtggga tagagatcac atctaccctc agagcaagac 3540
caaggacgac agcctggaca atctggtgct ggtggataga tccgtgaatg ccaagaaaag 3600
cgacggcatg ctgagccccg agatccagca gagaatgaga gccacctgga agtacctgaa 3660
agaaaagaag ctcatcagcg agaagaagta cgagcggctg accagagtgt cccctctgac 3720
agatgaagaa ctggccggct tcatcaaccg gcagctggtg gaaacaagac agagcagcaa 3780
agccgtggcc acactgctga agagggtgta cgatgaggcc gagattgtgt atgtgaaggc 3840
cgaggccgtg tctaacttcc ggcgggataa cctggactac atcaaagtgc gggacctgaa 3900
cgactaccac cacgccaagg acgcctacca gaacatcgtc gtgggcaacg tgttccacga 3960
gaagtttacc agcaatcccc tgcggtggct gaaaaacaac cccaacacca agtactccct 4020
caaccagatg ttcaacttcg acctggaaaa gaacggcgtg gtcatctgga agagaggcaa 4080
ggccggctcc attaagtgtg tggaagagac actgaagcgg aacgacatcc tgttcaccag 4140
atacgctttc tgcaacaaag gcggcttctt taatcagatg ctgaccgccg ctccagagga 4200
taagacaaag gccaaaggcc tggtgcctat caagaaaggc atggaaacct ggaaatacgg 4260
cggctacacc agcgtgaccc ctagccactt tatgctggtg gccagcaagg acaagaaggg 4320
aaaagagatc cggaccatcg agacagtgcc cctgtaccgg tggaaagagt tcaaagagaa 4380
tcccgacgct ctgctccagt actgcagaga gttctacggc ctgaaagagc ccaaggttct 4440
gatcccttgc atcaagaaga atgcccggct ggtcgtgaac ggcttcccta tgcacctgaa 4500
gggcagcacc ggaaaacagc tgattctgca gggtgccgtg cagctgtgcc tgaacaacga 4560
gaacatcaag tacctcaaga aagtgacgaa gtacctcgag tacaacgccc agcggagaga 4620
caagagaacc ctgctcgaag ttcgggaagt gaccggaatc aacaaagagg aaaacatcca 4680
gctgtacgat gtgttcgtgg acaagctgag caacacaatc taccagtaca gacccgccaa 4740
tcctaaggac aacctcatca agggccgcga gaaattcatc gagcttggcc tggctgagca 4800
gtgcgtggtg ctgggagaag tgctgcatct gttccagtgc aagcccctga ccagcgatct 4860
gacactgatc ggcggaagcc ctaacaccgg caccatcaag atcaccaaga ccatcagcaa 4920
ctgcaacgtg gtcaagctgc tgtcccagtc tatcgccggc gtgaaagtcc gcgagatcaa 4980
cctgctgatc atcggatcct acccatacga tgttccagat tacgcggccg ctccaaaaaa 5040
gaaaagaaaa gttgaattcg gcggcagcgg cgccaccaac ttcagcctgc tgaagcaggc 5100
cggcgacgtg gaggagaacc ccggccccat ggtgagcaag ggcgaggagg ataacatggc 5160
catcatcaag gagttcatgc gcttcaaggt gcacatggag ggctccgtga acggccacga 5220
gttcgagatc gagggcgagg gcgagggccg cccctacgag ggcacccaga ccgccaagct 5280
gaaggtgacc aagggtggcc ccctgccctt cgcctgggac atcctgtccc ctcagttcat 5340
gtacggctcc aaggcctacg tgaagcaccc cgccgacatc cccgactact tgaagctgtc 5400
cttccccgag ggcttcaagt gggagcgcgt gatgaacttc gaggacggcg gcgtggtgac 5460
cgtgacccag gactcctccc tgcaggacgg cgagttcatc tacaaggtga agctgcgcgg 5520
caccaacttc ccctccgacg gccccgtaat gcagaagaag accatgggct gggaggcctc 5580
ctccgagcgg atgtaccccg aggacggcgc cctgaagggc gagatcaagc agaggctgaa 5640
gctgaaggac ggcggccact acgacgctga ggtcaagacc acctacaagg ccaagaagcc 5700
cgtgcagctg cccggcgcct acaacgtcaa catcaagttg gacatcacct cccacaacga 5760
ggactacacc atcgtggaac agtacgaacg cgccgagggc cgccactcca ccggcggcat 5820
ggacgagctg tacaagtagc tcgagtctag agggcccgtt taaacccgct gatcagcctc 5880
gactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac 5940
cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg 6000
tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga 6060
ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctt ctgaggcgga 6120
aagaaccagc tggggctcta gggggtatcc ccacgcgccc tgtagcggcg cattaagcgc 6180
ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 6240
tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 6300
aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 6360
acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 6420
tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 6480
caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg 6540
gttaaaaaat gagctgattt aacaaaaatt taacgcgaat taattctgtg gaatgtgtgt 6600
cagttagggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 6660
ctcaattagt cagcaaccag gtgtggaaag tccccaggct ccccagcagg cagaagtatg 6720
caaagcatgc atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg 6780
cccctaactc cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt 6840
tatgcagagg ccgaggccgc ctctgcctct gagctattcc agaagtagtg aggaggcttt 6900
tttggaggcc taggcttttg caaaaagctc ccgggagctt gtatatccat tttcggatct 6960
gatcaagaga caggatgagg atcgtttcgc atgattgaac aagatggatt gcacgcaggt 7020
tctccggccg cttgggtgga gaggctattc ggctatgact gggcacaaca gacaatcggc 7080
tgctctgatg ccgccgtgtt ccggctgtca gcgcaggggc gcccggttct ttttgtcaag 7140
accgacctgt ccggtgccct gaatgaactg caggacgagg cagcgcggct atcgtggctg 7200
gccacgacgg gcgttccttg cgcagctgtg ctcgacgttg tcactgaagc gggaagggac 7260
tggctgctat tgggcgaagt gccggggcag gatctcctgt catctcacct tgctcctgcc 7320
gagaaagtat ccatcatggc tgatgcaatg cggcggctgc atacgcttga tccggctacc 7380
tgcccattcg accaccaagc gaaacatcgc atcgagcgag cacgtactcg gatggaagcc 7440
ggtcttgtcg atcaggatga tctggacgaa gagcatcagg ggctcgcgcc agccgaactg 7500
ttcgccaggc tcaaggcgcg catgcccgac ggcgaggatc tcgtcgtgac ccatggcgat 7560
gcctgcttgc cgaatatcat ggtggaaaat ggccgctttt ctggattcat cgactgtggc 7620
cggctgggtg tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa 7680
gagcttggcg gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat 7740
tcgcagcgca tcgccttcta tcgccttctt gacgagttct tctgagcggg actctggggt 7800
tcgaaatgac cgaccaagcg acgcccaacc tgccatcacg agatttcgat tccaccgccg 7860
ccttctatga aaggttgggc ttcggaatcg ttttccggga cgccggctgg atgatcctcc 7920
agcgcgggga tctcatgctg gagttcttcg cccaccccaa cttgtttatt gcagcttata 7980
atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc 8040
attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgt ataccgtcga 8100
cctctagcta gagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc 8160
cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct 8220
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 8280
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 8340
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 8400
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 8460
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 8520
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 8580
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 8640
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 8700
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 8760
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 8820
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 8880
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 8940
agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga 9000
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 9060
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 9120
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 9180
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 9240
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 9300
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 9360
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 9420
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 9480
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 9540
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 9600
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 9660
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 9720
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 9780
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 9840
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 9900
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 9960
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 10020
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 10080
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 10140
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 10200
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 10260
ttccccgaaa agtgccacct gacgtc 10286
<210> 41
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> HA Tag amino acid sequence
<400> 41
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1 5
<210> 42
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> SV40 NLS amino acid sequence
<400> 42
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 43
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> P2A amino acid sequence
<400> 43
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 44
<211> 236
<212> PRT
<213> Artificial Sequence
<220>
<223> mCherry amino acid sequence
<400> 44
Met Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe
1 5 10 15
Met Arg Phe Lys Val His Met Glu Gly Ser Val Asn Gly His Glu Phe
20 25 30
Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr
35 40 45
Ala Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp
50 55 60
Ile Leu Ser Pro Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His
65 70 75 80
Pro Ala Asp Ile Pro Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe
85 90 95
Lys Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val
100 105 110
Thr Gln Asp Ser Ser Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys
115 120 125
Leu Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys
130 135 140
Thr Met Gly Trp Glu Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly
145 150 155 160
Ala Leu Lys Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly
165 170 175
His Tyr Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val
180 185 190
Gln Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser
195 200 205
His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly
210 215 220
Arg His Ser Thr Gly Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 45
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> HA Tag DNA sequence
<400> 45
tacccatacg atgttccaga ttacgct 27
<210> 46
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> SV40 NLS DNA sequence
<400> 46
ccaaaaaaga aaagaaaagt t 21
<210> 47
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> P2A DNA sequence
<400> 47
gccaccaact tcagcctgct gaagcaggcc ggcgacgtgg aggagaaccc cggcccc 57
<210> 48
<211> 711
<212> DNA
<213> Artificial Sequence
<220>
<223> mCherry DNA sequence
<400> 48
atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat gcgcttcaag 60
gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga gggcgagggc 120
cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg ccccctgccc 180
ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta cgtgaagcac 240
cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa gtgggagcgc 300
gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc cctgcaggac 360
ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga cggccccgta 420
atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc cgaggacggc 480
gccctgaagg gcgagatcaa gcagaggctg aagctgaagg acggcggcca ctacgacgct 540
gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc ctacaacgtc 600
aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga acagtacgaa 660
cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaagta g 711
<210> 49
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_B2M_s11-ref
<400> 49
ggaccagagc gggaggguag ga 22
<210> 50
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_B2M_s12-ref
<400> 50
guaugccugc cgugugaacc au 22
<210> 51
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_B2M_S26 -ref
<400> 51
ucucucucca uucuucagua ag 22
<210> 52
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_B2M_S27 -ref
<400> 52
agaauugaaa aaguggagca uu 22
<210> 53
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_B2M_S40 -ref
<400> 53
aagaauguaa gacuuacccc ac 22
<210> 54
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_B2M_S41 -ref
<400> 54
ucagcagcuu acaaaagaau gu 22
<210> 55
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_B2M_S48 -ref
<400> 55
cgucgcgcug gcgggcauuc cu 22
<210> 56
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_B2M_S49 -ref
<400> 56
agacaucucg gcccgaaugc ug 22
<210> 57
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_CXCR4_S35-ref
<400> 57
cuggagugaa aacuugaaga cu 22
<210> 58
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_CXCR4_s93-ref
<400> 58
gggguucaga caacagugga ag 22
<210> 59
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_ELANE_g114-ref
<400> 59
gguguuaugg ucacagcggg ug 22
<210> 60
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_ELANE_g115-alt
<400> 60
ugggaauccc auucccgcag cu 22
<210> 61
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_ELANE_g128-ref
<400> 61
ugcuccccac ccgcucccag cc 22
<210> 62
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_PDCD1_S40-ref
<400> 62
aacacaucgg agagcuucgu gc 22
<210> 63
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_PDCD1_S92-ref
<400> 63
gaggaccgca gccagcccgg cc 22
<210> 64
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_SAMD9_g34-ref
<400> 64
gccaagaccc uuuaaacaga cc 22
<210> 65
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_SAMD9_g36-ref
<400> 65
guaauaccag agugaagauu au 22
<210> 66
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_SAMD9L_g133-alt
<400> 66
aggaacaaag agccuuuggu gc 22
<210> 67
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_SAMD9L_g79-alt
<400> 67
ugacuucugu cuacgcuaca ga 22
<210> 68
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_SAMD9L_g80-alt
<400> 68
gcauucuaga gccuggaauu ua 22
<210> 69
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_SARM1_g42-ref
<400> 69
cgcgcggccu gcacacgcgu cu 22
<210> 70
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_SARM1_g43-ref
<400> 70
cgccacugcg cgcuggcgcu gg 22
<210> 71
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_SARM1_g44-ref
<400> 71
gugucugagc agcagcugcu gg 22
<210> 72
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_SARM1_g45-ref
<400> 72
gaugucuuca ucagcuaccg cc 22
<210> 73
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_TRAC_S124 -ref
<400> 73
ucucgaccag cuugacauca ca 22
<210> 74
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_TRAC_S141 -ref
<400> 74
cuugguuuua cagauacgaa cc 22
<210> 75
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_TRAC_S142 -ref
<400> 75
cgucaugagc agauuaaacc cg 22
<210> 76
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_TRAC_S24-ref
<400> 76
acugugcuag acaugagguc ua 22
<210> 77
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_TRAC_S35-ref
<400> 77
gacccugccg uguaccagcu ga 22
<210> 78
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_TRAC_S36-ref
<400> 78
ucaaaaucgg ugaauaggca ga 22
<210> 79
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_TRAC_S58-ref
<400> 79
agaacccuga cccugccgug ua 22
<210> 80
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_TRAC_s90-ref
<400> 80
uucugaugug uauaucacag ac 22
<210> 81
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_TRAC_S91-ref
<400> 81
gcuguggccu ggagcaacaa au 22
<210> 82
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_B2M_S12 spacer
<400> 82
guaugccugc cgugugaacc au 22
<210> 83
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_TRAC_S36 spacer
<400> 83
ucaaaaucgg ugaauaggca ga 22
<210> 84
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_TRAC_S35 spacer
<400> 84
gacccugccg uguaccagcu ga 22
<210> 85
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_PDCD1_S40 25nt spacer
<400> 85
uccaacacau cggagagcuu cgugc 25
<210> 86
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_PDCD1_S40 24nt spacer
<400> 86
ccaacacauc ggagagcuuc gugc 24
<210> 87
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_PDCD1_S40 23nt spacer
<400> 87
caacacaucg gagagcuucg ugc 23
<210> 88
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_PDCD1_S40 22nt spacer
<400> 88
aacacaucgg agagcuucgu gc 22
<210> 89
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_PDCD1_S40 21nt spacer
<400> 89
acacaucgga gagcuucgug c 21
<210> 90
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_PDCD1_S40 20nt spacer
<400> 90
cacaucggag agcuucgugc 20
<210> 91
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_B2M_S12 with sgRNA 12 V2 scaffold
<400> 91
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 92
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_TRAC_S36 with sgRNA 12 V2 scaffold
<400> 92
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 93
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_TRAC_S35 with sgRNA 12 V2 scaffold
<400> 93
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 94
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_PDCD1_S40 25nt with sgRNA 12 V2 scaffold
<400> 94
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 95
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_PDCD1_S40 24nt with sgRNA 12 V2 scaffold
<400> 95
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 96
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_PDCD1_S40 23nt with sgRNA 12 V2 scaffold
<400> 96
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 97
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_PDCD1_S40 22nt with sgRNA 12 V2 scaffold
<400> 97
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 98
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_PDCD1_S40 21nt with sgRNA 12 V2 scaffold
<400> 98
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 99
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_PDCD1_S40 20nt with sgRNA 12 V2 scaffold
<400> 99
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 100
<211> 129
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_B2M_S12 full sgRNA
<400> 100
guaugccugc cgugugaacc auguuugaga guaguguaag aaauuacacu acaaguucaa 60
auaaaaauuu auucaaaucc auuugcuaca uuguguagaa uuuaaagauc uggcaacaga 120
ucuuuuuuu 129
<210> 101
<211> 129
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_TRAC_S36 full sgRNA
<400> 101
ucaaaaucgg ugaauaggca gaguuugaga guaguguaag aaauuacacu acaaguucaa 60
auaaaaauuu auucaaaucc auuugcuaca uuguguagaa uuuaaagauc uggcaacaga 120
ucuuuuuuu 129
<210> 102
<211> 129
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_TRAC_S35 full sgRNA
<400> 102
gacccugccg uguaccagcu gaguuugaga guaguguaag aaauuacacu acaaguucaa 60
auaaaaauuu auucaaaucc auuugcuaca uuguguagaa uuuaaagauc uggcaacaga 120
ucuuuuuuu 129
<210> 103
<211> 132
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_PDCD1_S40 25nt full sgRNA
<400> 103
uccaacacau cggagagcuu cgugcguuug agaguagugu aagaaauuac acuacaaguu 60
caaauaaaaa uuuauucaaa uccauuugcu acauugugua gaauuuaaag aucuggcaac 120
agaucuuuuu uu 132
<210> 104
<211> 131
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_PDCD1_S40 24nt full sgRNA
<400> 104
ccaacacauc ggagagcuuc gugcguuuga gaguagugua agaaauuaca cuacaaguuc 60
aaauaaaaau uuauucaaau ccauuugcua cauuguguag aauuuaaaga ucuggcaaca 120
gaucuuuuuu u 131
<210> 105
<211> 130
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_PDCD1_S40 23nt full sgRNA
<400> 105
caacacaucg gagagcuucg ugcguuugag aguaguguaa gaaauuacac uacaaguuca 60
aauaaaaauu uauucaaauc cauuugcuac auuguguaga auuuaaagau cuggcaacag 120
aucuuuuuuu 130
<210> 106
<211> 129
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_PDCD1_S40 22nt full sgRNA
<400> 106
aacacaucgg agagcuucgu gcguuugaga guaguguaag aaauuacacu acaaguucaa 60
auaaaaauuu auucaaaucc auuugcuaca uuguguagaa uuuaaagauc uggcaacaga 120
ucuuuuuuu 129
<210> 107
<211> 128
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_PDCD1_S40 21nt full sgRNA
<400> 107
acacaucgga gagcuucgug cguuugagag uaguguaaga aauuacacua caaguucaaa 60
uaaaaauuua uucaaaucca uuugcuacau uguguagaau uuaaagaucu ggcaacagau 120
cuuuuuuu 128
<210> 108
<211> 127
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103_PDCD1_S40 20nt full sgRNA
<400> 108
cacaucggag agcuucgugc guuugagagu aguguaagaa auuacacuac aaguucaaau 60
aaaaauuuau ucaaauccau uugcuacauu guguagaauu uaaagaucug gcaacagauc 120
uuuuuuu 127
<210> 109
<211> 101
<212> RNA
<213> Artificial Sequence
<220>
<223> V2.1 scaffold
<400> 109
guuugagagu aguggaaaca cuacaaguuc aaauaaaaau uuauucaaau ccauuugcua 60
cauuguguag aauuuaaaga ucuggcaaca gaucuuuuuu u 101
<210> 110
<211> 85
<212> RNA
<213> Artificial Sequence
<220>
<223> V2.2 scaffold
<400> 110
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uuuuu 85
<210> 111
<211> 79
<212> RNA
<213> Artificial Sequence
<220>
<223> V2.3 scaffold
<400> 111
guuugagagu aguggaaaca cuacaaguuc aaauaaaaau uuauucaaau ccauuugcua 60
cauuguguag aauuuuuuu 79
<210> 112
<211> 95
<212> RNA
<213> Artificial Sequence
<220>
<223> V2.4 scaffold
<400> 112
guuugagagu aguggaaaca cuacaaguuc aaauaaaaau uuauucaaau ccauuugcua 60
cauuguguag aauuuaaaga ugcaaaucuu uuuuu 95
<210> 113
<211> 101
<212> RNA
<213> Artificial Sequence
<220>
<223> V2.5 scaffold
<400> 113
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaugca aaucuuuuuu u 101
<210> 114
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> crRNA Repeat sequence A
<400> 114
guuugagagu agug 14
<210> 115
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> crRNA Repeat sequence B
<400> 115
guuugagagu aguguaa 17
<210> 116
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> tracrRNA antiepeat sequence A
<400> 116
cacuacaagu ucaaau 16
<210> 117
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> tracrRNA antiepeat sequence B
<400> 117
uuacacuaca aguucaaau 19
<210> 118
<211> 41
<212> RNA
<213> Artificial Sequence
<220>
<223> tracrRNA Portion 1 sequence A
<400> 118
aaaaauuuau ucaaauccau uugcuacauu guguagaauu u 41
<210> 119
<211> 45
<212> RNA
<213> Artificial Sequence
<220>
<223> tracrRNA Portion 1 sequence B
<400> 119
aaaaauuuau ucaaauccau uugcuacauu guguagaauu uuuuu 45
<210> 120
<211> 38
<212> RNA
<213> Artificial Sequence
<220>
<223> tracrRNA Portion 1 partial sequence
<400> 120
aaaaauuuau ucaaauccau uugcuacauu guguagaa 38
<210> 121
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> tracrRNA Portion 2 sequence A
<400> 121
aaagaucugg caacagaucu uuuuuu 26
<210> 122
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> tracrRNA Portion 2 sequence B
<400> 122
aaagaugcaa aucuuuuuuu 20
<210> 123
<211> 17
<212> RNA
<213> Artificial Sequence
<220>
<223> tracrRNA Portion 2 - partial sequence A
<400> 123
aaagaucugg caacaga 17
<210> 124
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> tracrRNA Portion 2 - partial sequence B
<400> 124
aaagaugcaa auc 13
<210> 125
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> TRAC s91 spacer
<400> 125
gcuguggccu ggagcaacaa au 22
<210> 126
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> PDCD1 s40 spacer
<400> 126
aacacaucgg agagcuucgu gc 22
<210> 127
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> B2M s12 spacer
<400> 127
guaugccugc cgugugaacc au 22
<210> 128
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> TRAC s35 spacer
<400> 128
gacccugccg uguaccagcu ga 22
<210> 129
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103 v2.2 TRAC S35 sgRNA
<400> 129
gacccugccg uguaccagcu gaguuugaga guaguguaag aaauuacacu acaaguucaa 60
auaaaaauuu auucaaaucc auuugcuaca uuguguagaa uuuuuuu 107
<210> 130
<211> 101
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103 v2.3 TRAC S35 sgRNA
<400> 130
gacccugccg uguaccagcu gaguuugaga guaguggaaa cacuacaagu ucaaauaaaa 60
auuuauucaa auccauuugc uacauugugu agaauuuuuu u 101
<210> 131
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103 v2.2 B2M S12 sgRNA
<400> 131
guaugccugc cgugugaacc auguuugaga guaguguaag aaauuacacu acaaguucaa 60
auaaaaauuu auucaaaucc auuugcuaca uuguguagaa uuuuuuu 107
<210> 132
<211> 101
<212> RNA
<213> Artificial Sequence
<220>
<223> OMNI-103 v2.3 B2M S12 sgRNA
<400> 132
guaugccugc cgugugaacc auguuugaga guaguggaaa cacuacaagu ucaaauaaaa 60
auuuauucaa auccauuugc uacauugugu agaauuuuuu u 101
<210> 133
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> PDCD1 S40 site
<220>
<221> misc_feature
<222> (23)..(24)
<223> n is a, c, g, or t
<400> 133
gaccctgccg tgtaccagct gannract 28
<210> 134
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> TRAC S35 site
<220>
<221> misc_feature
<222> (23)..(24)
<223> n is a, c, g, or t
<400> 134
aacacatcgg agagcttcgt gcnnract 28
<210> 135
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> T2 sequence
<400> 135
ggaagagcag agccttggtc tc 22
Claims (81)
- 서열번호 1의 아미노산 서열과 적어도 90% 동일성을 갖는 서열을 포함하는 CRISPR 뉴클레아제, 또는 CRISPR 뉴클레아제를 인코딩하는 서열을 포함하는 핵산 분자를 포함하는, 비-자연 발생 조성물.
- 제1항에 있어서, 하나 이상의 RNA 분자, 또는 하나 이상의 RNA 분자 중 어느 하나를 인코딩하는 DNA 폴리뉴클레오타이드를 더 포함하되, 상기 하나 이상의 RNA 분자 및 상기 CRISPR 뉴클레아제는 자연적으로 함께 발생하지 않고, 상기 하나 이상의 RNA 분자는 상기 CRISPR 뉴클레아제와 복합체를 형성하고/하거나 상기 복합체를 표적 부위에 표적화하도록 구성되는, 조성물.
- 제2항에 있어서, 상기 CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열과 적어도 90% 동일성을 갖는 서열을 포함하고, 적어도 하나의 RNA 분자는 서열번호 4 내지 36으로 이루어진 군으로부터 선택되는 서열을 포함하는, 조성물.
- 제3항에 있어서, 상기 CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열과 적어도 90% 동일성을 갖는 서열을 포함하고, 적어도 하나의 RNA 분자는 서열번호 4 내지 7 및 18 내지 21로 이루어진 군으로부터 선택되는 서열 및 가이드 서열 부분을 포함하는 CRISPR RNA(crRNA) 분자인, 조성물.
- 제4항에 있어서, 서열번호 8 내지 14, 17, 22 내지 28 및 32로 이루어진 군에 제시된 서열을 포함하는 전사활성화(transactivating) CRISPR RNA(tracrRNA) 분자를 더 포함하는, 조성물.
- 제2항에 있어서, 상기 CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열과 적어도 90% 동일성을 갖는 서열을 포함하고, 적어도 하나의 RNA 분자는 서열번호 4 내지 36으로 이루어진 군으로부터 선택되는 서열 및 가이드 서열 부분을 포함하는 단일-가이드 RNA(sgRNA) 분자인, 조성물.
- 제2항에 있어서, 상기 CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열과 적어도 90% 동일성을 갖는 서열을 포함하고, 적어도 하나의 RNA 분자는 가이드 서열 부분 및 길이가 적어도 79개 뉴클레오타이드인 스캐폴드 부분을 포함하는 단일-가이드 RNA(sgRNA) 분자인, 조성물.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 CRISPR 뉴클레아제는 위치 D12, E776, H988 또는 D991에서 아미노산 치환에 의해 형성되는 닉카제(nickase)인, 조성물.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 CRISPR 뉴클레아제는 위치 D856, H857 또는 N880에서 아미노산 치환에 의해 형성되는 닉카제이며, 위치 D856에서 아미노산 치환은 아스파트산(D) 이외의 글루탐산(E)으로의 치환인, 조성물.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 CRISPR 뉴클레아제는 위치 D12, E776, H988 또는 D991 중 어느 하나에서의 아미노산 치환 및 D856, H857 또는 N880 중 어느 하나에서의 아미노산 치환에 의해 형성된 촉매적으로 사멸된 뉴클레아제이되, 위치 D856에서의 아미노산 치환은 아스파트산(D) 이외의 글루탐산(E)으로의 치환인, 조성물.
- CRISPR 뉴클레아제를 포함하는 비-자연 발생 조성물로서, 상기 CRISPR 뉴클레아제는 서열번호 1의 도메인 A, 도메인 B, 도메인 C, 도메인 D, 도메인 E, 도메인 F, 도메인 G, 도메인 H, 도메인 I, 또는 도메인 J 중 적어도 하나의 아미노산 서열에 상응하는 아미노산 서열을 포함하고,
a) 도메인 A는 서열번호 1의 아미노산 1 내지 45와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
b) 도메인 B는 서열번호 1의 아미노산 46 내지 83과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
c) 도메인 C는 서열번호 1의 아미노산 84 내지 158과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
d) 도메인 D는 서열번호 1의 아미노산 159 내지 302와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
e) 도메인 E는 서열번호 1의 아미노산 303 내지 515와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
f) 도메인 F는 서열번호 1의 아미노산 516 내지 727과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
g) 도메인 G는 서열번호 1의 아미노산 728 내지 778과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
h) 도메인 H는 서열번호 1의 아미노산 779 내지 923과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
i) 도메인 I는 서열번호 1의 아미노산 924 내지 1068과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하고;
j) 도메인 J는 서열번호 1의 아미노산 1069 내지 1348과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하는, 조성물. - 무세포 시스템 또는 세포의 게놈 내 DNA 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법으로서, 제1항 내지 제11항 중 어느 한 항의 조성물을 상기 세포에 도입하는 단계를 포함하는, 방법.
- 제12항에 있어서, 상기 CRISPR 뉴클레아제는 서열번호 1에 제시된 아미노산 서열에 적어도 90% 동일성을 갖는 서열을 포함하되, 상기 CRISPR 뉴클레아제는 NNRRHY, NNRACT, 또는 NNRVCT 프로토스페이서 인접 모티프(PAM) 서열에 인접한 DNA 가닥 파손을 초래하고/하거나 PAM 서열에 상보적인 서열에 인접한 DNA 가닥 파손을 초래하는, 방법.
- 제12항에 있어서, 상기 CRISPR 뉴클레아제는 위치 D12, E776, H988 또는 D991에서 아미노산 치환에 의해 형성되는 닉카제이며, 상기 PAM 서열에 인접한 DNA 가닥 파손을 초래하는, 방법.
- 제12항에 있어서, 상기 CRISPR 뉴클레아제는 위치 D856, H857 또는 N880에서 아미노산 치환에 의해 형성되는 닉카제이고, 상기 PAM 서열에 상보적인 서열에 인접한 DNA 가닥 파손을 초래하며, 위치 D856에서 아미노산 치환은 아스파트산(D) 이외의 글루탐산(E)으로의 치환인, 방법.
- 제12항 내지 제15항 중 어느 한 항에 있어서, 상기 세포는 진핵 세포 또는 원핵 세포인, 방법.
- 제16항에 있어서, 상기 세포는 포유동물 세포인, 방법.
- 제17항에 있어서, 상기 세포는 인간 세포인, 방법.
- 비-자연 발생 RNA 분자를 포함하는 조성물로서, 상기 RNA 분자는 crRNA 반복 서열 부분 및 가이드 서열 부분을 포함하고, 상기 RNA 분자는 tracrRNA 서열의 존재 하에 OMNI-103 뉴클레아제와 복합체를 형성하고 상기 뉴클레아제를 DNA 표적 부위에 대해 표적화하고, 상기 tracrRNA 서열은 상기 RNA 분자의 tracrRNA 부분 또는 제2 RNA 분자의 tracrRNA 부분에 의해 인코딩되는, 조성물.
- 제19항에 있어서, 상기 crRNA 반복 서열 부분은 길이가 최대 17개 뉴클레오타이드, 바람직하게는 길이가 14 내지 17개 뉴클레오타이드인, 조성물.
- 제19항 또는 제20항에 있어서, 상기 crRNA 반복 서열 부분은 서열번호 114 또는 115와 적어도 60 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는, 조성물.
- 제19항 내지 제21항 중 어느 한 항에 있어서, 상기 crRNA 반복 서열 부분은 서열번호 114 또는 115 중 어느 하나와 적어도 95% 서열 동일성을 갖는, 조성물.
- 제19항 내지 제22항 중 어느 한 항에 있어서, 상기 crRNA 반복 서열은 서열번호 115 이외의 것인, 조성물.
- 제19항 내지 제23항 중 어느 한 항에 있어서, 상기 crRNA 반복 서열 부분 및 상기 가이드 서열 부분을 포함하는 상기 RNA 분자는 tracrRNA 부분을 더 포함하는, 조성물.
- 제24항에 있어서, 상기 crRNA 반복 서열 부분은 폴리뉴클레오타이드 링커 부분에 의해 상기 tracrRNA 부분에 공유로 연결되는, 조성물.
- 제19항 내지 제23항 중 어느 한 항에 있어서, 상기 조성물은 상기 tracrRNA 부분을 포함하는 제2 RNA 분자를 포함하는, 조성물.
- 제19항 내지 제26항 중 어느 한 항에 있어서, 상기 OMNI-103 뉴클레아제는 서열번호 1의 아미노산 서열과 적어도 95% 서열 동일성을 갖는, 조성물.
- 제19항 내지 제27항 중 어느 한 항에 있어서, 상기 가이드 서열 부분은 길이가 17 내지 30개 뉴클레오타이드, 바람직하게는 길이가 22개 뉴클레오타이드인, 조성물.
- 비-자연 발생 RNA 분자를 포함하는 조성물로서, 상기 RNA 분자는 tracrRNA 부분을 포함하고, 상기 RNA 분자는 crRNA 반복 서열 및 가이드 서열 부분의 존재 하에 OMNI-103 뉴클레아제와 복합체를 형성하고 상기 뉴클레아제를 DNA 표적 부위에 대해 표적화하고, 상기 crRNA 반복 서열 부분 및 상기 가이드 서열 부분은 상기 RNA 분자 및 제2 RNA 분자에 의해 인코딩되는, 조성물.
- 제29항에 있어서, 상기 tracrRNA 부분은 길이가 85개 미만의 뉴클레오타이드, 바람직하게는 길이가 84 내지 80, 79 내지 75, 74 내지 70, 69 내지 65, 또는 64 내지 60개 뉴클레오타이드인, 조성물.
- 제29항 또는 제30항에 있어서, 상기 tracrRNA 부분은 서열번호 109 내지 113 중 어느 하나의 tracrRNA 부분과 적어도 30 내지 40%, 41 내지 50%, 51 내지 60%, 61 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는, 조성물.
- 제29항 내지 제31항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 서열번호 109 내지 113 중 어느 하나의 tracrRNA 부분과 적어도 95% 서열 동일성을 갖는, 조성물.
- 제29항 내지 제32항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 서열번호 15 또는 16의 tracr 부분 이외의 것인, 조성물.
- 제29항 내지 제33항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 길이가 최대 19개 뉴클레오타이드, 바람직하게는 길이가 16 내지 19개 뉴클레오타이드인 tracrRNA 항-반복 서열 부분을 포함하는, 조성물.
- 제29항 내지 제34항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 서열번호 116 또는 117 중 어느 하나와 적어도 60 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는 tracrRNA 항-반복 서열 부분을 포함하는, 조성물.
- 제29항 내지 제35항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 서열번호 116 또는 117 중 어느 하나와 적어도 95% 서열 동일성을 갖는 tracrRNA 항-반복 서열 부분을 포함하는, 조성물.
- 제29항 내지 제36항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 서열번호 117 이외의 서열을 갖는 tracrRNA 항-반복 서열 부분을 포함하는, 조성물.
- 제29항 내지 제37항 중 어느 한 항에 있어서, 상기 RNA 분자는 tracrRNA 부분을 포함하고 crRNA 반복 서열 부분 및 가이드 서열 부분을 더 포함하는, 조성물.
- 제29항 내지 제38항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 폴리뉴클레오타이드 링커 부분에 의해 crRNA 반복 서열에 공유로 연결되는, 조성물.
- 제39항에 있어서, 상기 폴리뉴클레오타이드 링커 부분은 길이가 4 내지 10개 뉴클레오타이드인, 조성물.
- 제40항에 있어서, 상기 폴리뉴클레오타이드 링커는 GAAA의 서열을 갖는, 조성물.
- 제29항 내지 제37항 중 어느 한 항에 있어서, 상기 조성물은 crRNA 반복 서열 부분 및 가이드 서열 부분을 포함하는 제2 RNA 분자를 더 포함하는, 조성물.
- 제29항 내지 제42항 중 어느 한 항에 있어서, 상기 OMNI-103 뉴클레아제는 서열번호 1의 아미노산 서열과 적어도 95% 서열 동일성을 갖는, 조성물.
- 제29항 내지 제43항 중 어느 한 항에 있어서, 상기 가이드 서열 부분은 길이가 17 내지 30개 뉴클레오타이드, 바람직하게는 길이가 22개 뉴클레오타이드인, 조성물.
- 비-자연 발생 RNA 분자를 포함하는 조성물로서, 상기 RNA 분자는 RNA 스캐폴드 부분을 포함하고, 상기 RNA 스캐폴드 부분은 다음 구조:
crRNA 반복 서열 부분 - tracrRNA 부분
를 갖되, 상기 RNA 스캐폴드 부분은 OMNI-103 CRISPR 뉴클레아제와 복합체를 형성하고 상기 뉴클레아제를 상기 RNA 분자의 가이드 서열 부분에 대해 상보성을 갖는 DNA 표적 부위에 대해 표적화하는, 조성물. - 제45항에 있어서, 상기 OMNI-103 뉴클레아제는 서열번호 1의 아미노산 서열과 적어도 95% 서열 동일성을 갖는, 조성물.
- 제45항 또는 제46항에 있어서, 상기 RNA 스캐폴드 부분은 길이가 110 내지 105, 104 내지 100, 99 내지 95, 94 내지 90, 89 내지 85, 84 내지 80, 79 내지 75, 또는 74 내지 70개 뉴클레오타이드인, 조성물.
- 제45항 내지 제47항 중 어느 한 항에 있어서, 상기 RNA 스캐폴드 부분은 길이가 107, 101, 95, 85, 또는 79개 뉴클레오타이드인, 조성물.
- 제45항 내지 제48항 중 어느 한 항에 있어서, 상기 RNA 스캐폴드 부분은 서열번호 109 내지 113 중 어느 하나와 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 서열 동일성을 갖는, 조성물.
- 제45항 내지 제49항 중 어느 한 항에 있어서, 상기 crRNA 반복 서열 부분은 길이가 최대 17개 뉴클레오타이드, 바람직하게는 길이가 14 내지 17개 뉴클레오타이드인, 조성물.
- 제45항 내지 제50항 중 어느 한 항에 있어서, 상기 crRNA 반복 서열 부분은 서열번호 114 또는 115와 적어도 60 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는, 조성물.
- 제45항 내지 제51항 중 어느 한 항에 있어서, 상기 crRNA 반복 서열 부분은 서열번호 114 또는 115 중 어느 하나와 적어도 95% 서열 동일성을 갖는, 조성물.
- 제45항 내지 제52항 중 어느 한 항에 있어서, 상기 crRNA 반복 서열은 서열번호 115 이외의 것인, 조성물.
- 제45항 내지 제53항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 길이가 85개 미만의 뉴클레오타이드, 바람직하게는 길이가 84 내지 80, 79 내지 75, 74 내지 70, 69 내지 65, 또는 64 내지 60개 뉴클레오타이드인, 조성물.
- 제45항 내지 제54항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 서열번호 109 내지 113 중 어느 하나의 tracrRNA 부분과 적어도 30 내지 40%, 41 내지 50%, 51 내지 60%, 61 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는, 조성물.
- 제45항 내지 제55항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 서열번호 109 내지 113 중 어느 하나의 tracrRNA 부분과 적어도 95% 서열 동일성을 갖는, 조성물.
- 제45항 내지 제56항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 서열번호 15 또는 16의 tracrRNA 부분 이외의 것인, 조성물.
- 제45항 내지 제57항 중 어느 한 항에 있어서, 상기 RNA 스캐폴드 부분은 RNA 스캐폴드가 다음 구조를 갖도록 상기 crRNA 반복 서열 부분과 상기 tracrRNA 부분 사이에 링커 부분을 더 포함하는, 조성물:
crRNA 반복 서열 부분 - 링커 부분 - tracrRNA 부분. - 제45항 내지 제58항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 tracrRNA 항-반복 서열 부분을 포함하고, 상기 crRNA 반복 서열과 상기 tracrRNA 항-반복 서열 부분은 링커 부분에 의해 공유로 연결되는, 조성물.
- 제59항에 있어서, 상기 링커 부분은 길이가 4 내지 10개 뉴클레오타이드인 폴리뉴클레오타이드 링커인, 조성물.
- 제60항에 있어서, 상기 폴리뉴클레오타이드 링커는 GAAA의 서열을 갖는, 조성물.
- 제45항 내지 제61항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 길이가 최대 19개 뉴클레오타이드, 바람직하게는 길이가 16 내지 19개 뉴클레오타이드인 tracrRNA 항-반복 서열 부분을 포함하는, 조성물.
- 제45항 내지 제62항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 서열번호 116 또는 117 중 어느 하나와 적어도 60 내지 70%, 71 내지 80%, 81 내지 90%, 91 내지 95%, 또는 96 내지 99% 서열 동일성을 갖는 tracrRNA 항-반복 서열 부분을 포함하는, 조성물.
- 제45항 내지 제63항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 서열번호 116 또는 117 중 어느 하나와 적어도 95% 서열 동일성을 갖는 tracrRNA 항-반복 서열 부분을 포함하는, 조성물.
- 제45항 내지 제64항 중 어느 한 항에 있어서, 상기 tracrRNA 항-반복 서열은 서열번호 117 이외의 것인, 조성물.
- 제45항 내지 제65항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 tracrRNA 항-반복 부분에 연결된 뉴클레오타이드의 제1 절편을 포함하고, 뉴클레오타이드의 제1 절편은 서열번호 118 내지 120 중 어느 하나와 적어도 95% 서열 동일성을 갖는, 조성물.
- 제45항 내지 제66항 중 어느 한 항에 있어서, 상기 tracrRNA 부분은 뉴클레오타이드의 제1 절편에 연결된 뉴클레오타이드의 제2 섹션을 포함하고, 상기 뉴클레오타이드의 제2 섹션은 서열번호 121 내지 124 중 어느 하나와 적어도 95% 서열 동일성을 갖는, 조성물.
- 제45항 내지 제67항 중 어느 한 항에 있어서, 상기 RNA 스캐폴드 부분은 서열번호 109 내지 113 중 어느 하나의 뉴클레오타이드 서열과 적어도 95% 동일성을 갖는, 조성물.
- 제45항 내지 제68항 중 어느 한 항에 있어서, 상기 RNA 스캐폴드 부분은 V2, V2.1, V2.2, V2.3, V2.4 또는 V2.5 RNA 스캐폴드 중 어느 하나의 예측된 구조를 갖는, 조성물.
- 제45항 내지 제69항 중 어느 한 항에 있어서, 상기 RNA 스캐폴드 부분은 서열번호 15 또는 16 이외의 서열을 갖는, 조성물.
- 제45항 내지 제70항 중 어느 한 항에 있어서, 가이드 서열 부분이 상기 RNA 분자의 상기 crRNA 반복 서열 부분에 공유로 연결되어, 다음 구조를 갖는 단일-가이드 RNA 분자를 형성하는, 조성물:
가이드 서열 부분 - crRNA 반복 서열 부분 - tracrRNA 부분. - 제45항 내지 제71항 중 어느 한 항에 있어서, 상기 가이드 서열 부분은 길이가 17 내지 30개 뉴클레오타이드, 더 바람직하게는 20 내지 23개 뉴클레오타이드, 더 바람직하게는 22개 뉴클레오타이드인, 조성물.
- 제45항 내지 제72항 중 어느 한 항에 있어서, OMNI-103 CRISPR 뉴클레아제를 더 포함하되, 상기 OMNI-103 CRISPR 뉴클레아제는 서열번호 1의 아미노산 서열과 적어도 95% 동일성을 갖는, 조성물.
- 제1항 내지 제73항 중 어느 한 항에 있어서, 상기 RNA 분자는 시험관내 전사(IVT) 또는 고상 인공 올리고뉴클레오타이드 합성에 의해 형성되는, 조성물.
- 제74항에 있어서, 상기 RNA 분자는 변형된 뉴클레오타이드를 포함하는, 조성물.
- 제1항 내지 제75항 중 어느 한 항의 RNA 분자를 인코딩하는 폴리뉴클레오타이드 분자.
- 무세포 시스템 또는 세포의 게놈 내 DNA 표적 부위에서 뉴클레오타이드 서열을 변형시키는 방법으로서, 제1항 내지 제75항 중 어느 한 항의 조성물을 상기 시스템 또는 상기 세포에 도입하는 단계를 포함하는, 방법.
- 제77항에 있어서, 상기 세포는 진핵 세포 또는 원핵 세포인, 방법.
- 제78항에 있어서, 상기 진핵 세포는 인간 세포 또는 식물 세포인, 방법.
- 무세포 시스템 또는 세포의 게놈 내 DNA 표적 부위에서 뉴클레오타이드 서열을 변형시키기 위한 키트로서, 제2항 내지 제75항 중 어느 한 항의 조성물, 서열번호 1의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 CRISPR 뉴클레아제를 상기 시스템 또는 상기 세포에 도입하는 것, 및 상기 RNA 분자 및 상기 CRISPR 뉴클레아제를 상기 세포에 전달하기 위한 지침을 포함하는, 키트.
- 본 출원에 개시된 하나 이상의 요소를 특징으로 하는 조성물, 방법, 제품, 과정, 시스템, 키트 또는 용도.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163147166P | 2021-02-08 | 2021-02-08 | |
US63/147,166 | 2021-02-08 | ||
US202163214506P | 2021-06-24 | 2021-06-24 | |
US63/214,506 | 2021-06-24 | ||
US202163286855P | 2021-12-07 | 2021-12-07 | |
US63/286,855 | 2021-12-07 | ||
PCT/US2022/015504 WO2022170199A2 (en) | 2021-02-08 | 2022-02-07 | Omni-103 crispr nuclease |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230142740A true KR20230142740A (ko) | 2023-10-11 |
Family
ID=82742542
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237028527A KR20230142740A (ko) | 2021-02-08 | 2022-02-07 | Omni-103 crispr 뉴클레아제 |
Country Status (7)
Country | Link |
---|---|
EP (1) | EP4288085A2 (ko) |
JP (1) | JP2024506608A (ko) |
KR (1) | KR20230142740A (ko) |
AU (1) | AU2022216642A1 (ko) |
CA (1) | CA3206576A1 (ko) |
IL (1) | IL305036A (ko) |
WO (1) | WO2022170199A2 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12091688B2 (en) | 2021-02-08 | 2024-09-17 | Emendobio Inc. | OMNI-103 CRISPR nuclease |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3026055A1 (en) * | 2016-04-19 | 2017-10-26 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
US11739335B2 (en) * | 2017-03-24 | 2023-08-29 | CureVac SE | Nucleic acids encoding CRISPR-associated proteins and uses thereof |
KR20200124702A (ko) * | 2018-02-23 | 2020-11-03 | 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드 | 신규한 cas9 오르소로그 |
EP3963061A4 (en) * | 2019-04-30 | 2023-02-08 | Emendobio Inc. | NEW CRISPR OMNI-50 NUCLEASE |
-
2022
- 2022-02-07 KR KR1020237028527A patent/KR20230142740A/ko unknown
- 2022-02-07 JP JP2023547664A patent/JP2024506608A/ja active Pending
- 2022-02-07 WO PCT/US2022/015504 patent/WO2022170199A2/en active Application Filing
- 2022-02-07 AU AU2022216642A patent/AU2022216642A1/en active Pending
- 2022-02-07 IL IL305036A patent/IL305036A/en unknown
- 2022-02-07 EP EP22750539.3A patent/EP4288085A2/en active Pending
- 2022-02-07 CA CA3206576A patent/CA3206576A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2024506608A (ja) | 2024-02-14 |
WO2022170199A3 (en) | 2022-12-15 |
AU2022216642A9 (en) | 2023-10-12 |
IL305036A (en) | 2023-10-01 |
CA3206576A1 (en) | 2022-08-11 |
EP4288085A2 (en) | 2023-12-13 |
WO2022170199A2 (en) | 2022-08-11 |
AU2022216642A1 (en) | 2023-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2021250992B2 (en) | Compositions and methods for directing proteins to specific loci in the genome | |
KR102021982B1 (ko) | Mnd 프로모터 키메라 항원 수용체 | |
KR20210056329A (ko) | 신규 cas12b 효소 및 시스템 | |
KR20230065381A (ko) | 유도 dna 결합 단백질 및 게놈 교란 도구 및 이의 적용 | |
WO2021248016A2 (en) | Novel omni-59, 61, 67, 76, 79, 80, 81, and 82 crispr nucleases | |
KR20240021218A (ko) | 신규 유형 v rna 프로그래밍가능 엔도뉴클레아제 시스템 | |
CN115968300A (zh) | 用于体内转导的载体和方法 | |
AU2022215636A1 (en) | Omni 90-99, 101, 104-110, 114, 116, 118-123, 125, 126, 128, 129, and 131-138 crispr nucleases | |
WO2008144052A2 (en) | Bioluminescent imaging of stem cells | |
KR20230142740A (ko) | Omni-103 crispr 뉴클레아제 | |
CN116887854A (zh) | Omni-103 crispr核酸酶 | |
CN108531458A (zh) | 治疗肿瘤的基因工程自然杀伤细胞产品 | |
EP4433585A2 (en) | Novel omni crispr nucleases | |
CN113355325B (zh) | 人源化ace2基因改造小鼠胚胎干细胞模型制备方法及应用 | |
CN111727244B (zh) | 循环肿瘤细胞的通用检测探针 | |
KR102624831B1 (ko) | 근육 특이적 pck1 과발현 형질전환 개 생산 | |
EP4232573A1 (en) | Novel omni 56, 58, 65, 68, 71, 75, 78, and 84 crispr nucleases | |
CN107384921B (zh) | miR216a用于抑制骨肉瘤细胞的增殖、侵袭和迁移 | |
KR20240021211A (ko) | Klk2-gpi 융합 단백질에 대한 핵산 코딩, 재조합 세포 및 이의 용도 | |
KR102468650B1 (ko) | T7 RNA 중합효소 및 mRNA 캡핑 효소를 유도 발현하는 재조합 벡터 및 이의 용도 | |
CN115044617B (zh) | Car t细胞的制备方法、car t细胞及其应用 | |
CN113736741A (zh) | 一种用于测定特立帕肽生物学活性的克隆化细胞株 | |
JP2001299336A (ja) | ワクチン及び診断用抗原としての安定で毒性のないフラビウイルス様粒子の作製 | |
JP2003024078A (ja) | 三量体型g蛋白質の活性モニター分子 | |
CN115161345A (zh) | 高表达FRα的重组载体、重组细胞及其构建方法和用途 |