JP2024059823A - 操作された細菌ユビキチンリガーゼ模倣物を用いる、幅広い範囲にわたるプロテオーム編集 - Google Patents
操作された細菌ユビキチンリガーゼ模倣物を用いる、幅広い範囲にわたるプロテオーム編集 Download PDFInfo
- Publication number
- JP2024059823A JP2024059823A JP2024026317A JP2024026317A JP2024059823A JP 2024059823 A JP2024059823 A JP 2024059823A JP 2024026317 A JP2024026317 A JP 2024026317A JP 2024026317 A JP2024026317 A JP 2024026317A JP 2024059823 A JP2024059823 A JP 2024059823A
- Authority
- JP
- Japan
- Prior art keywords
- leu
- glu
- ser
- proteins
- ala
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102000006275 Ubiquitin-Protein Ligases Human genes 0.000 title claims abstract description 218
- 108010083111 Ubiquitin-Protein Ligases Proteins 0.000 title claims abstract description 218
- 230000001580 bacterial effect Effects 0.000 title description 22
- 108010026552 Proteome Proteins 0.000 title description 20
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 234
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 209
- 230000015556 catabolic process Effects 0.000 claims abstract description 135
- 238000006731 degradation reaction Methods 0.000 claims abstract description 135
- 238000000034 method Methods 0.000 claims abstract description 127
- 239000000758 substrate Substances 0.000 claims abstract description 122
- 230000008685 targeting Effects 0.000 claims abstract description 91
- 201000010099 disease Diseases 0.000 claims abstract description 78
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 78
- 239000000203 mixture Substances 0.000 claims abstract description 56
- 239000003795 chemical substances by application Substances 0.000 claims abstract description 39
- 230000030279 gene silencing Effects 0.000 claims abstract description 32
- 239000000090 biomarker Substances 0.000 claims abstract description 25
- 230000001225 therapeutic effect Effects 0.000 claims abstract description 25
- 210000004027 cell Anatomy 0.000 claims description 165
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 91
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 73
- 229920001184 polypeptide Polymers 0.000 claims description 68
- 239000005090 green fluorescent protein Substances 0.000 claims description 58
- 230000027455 binding Effects 0.000 claims description 50
- 108020004999 messenger RNA Proteins 0.000 claims description 50
- 108090000848 Ubiquitin Proteins 0.000 claims description 49
- 102000044159 Ubiquitin Human genes 0.000 claims description 49
- 102000016943 Muramidase Human genes 0.000 claims description 48
- 108010014251 Muramidase Proteins 0.000 claims description 48
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 claims description 48
- 239000004325 lysozyme Substances 0.000 claims description 48
- 229960000274 lysozyme Drugs 0.000 claims description 48
- 235000010335 lysozyme Nutrition 0.000 claims description 48
- 108010043121 Green Fluorescent Proteins Proteins 0.000 claims description 46
- 102000004144 Green Fluorescent Proteins Human genes 0.000 claims description 46
- 230000014509 gene expression Effects 0.000 claims description 37
- 102000002090 Fibronectin type III Human genes 0.000 claims description 32
- 108050009401 Fibronectin type III Proteins 0.000 claims description 32
- -1 MBP Proteins 0.000 claims description 32
- 241000607762 Shigella flexneri Species 0.000 claims description 32
- 241000283973 Oryctolagus cuniculus Species 0.000 claims description 31
- 102000004389 Ribonucleoproteins Human genes 0.000 claims description 31
- 108010081734 Ribonucleoproteins Proteins 0.000 claims description 31
- 239000000427 antigen Substances 0.000 claims description 30
- 108091007433 antigens Proteins 0.000 claims description 29
- 102000036639 antigens Human genes 0.000 claims description 29
- 102000004190 Enzymes Human genes 0.000 claims description 28
- 108090000790 Enzymes Proteins 0.000 claims description 28
- 229940088598 enzyme Drugs 0.000 claims description 28
- 241000607768 Shigella Species 0.000 claims description 27
- 102100026090 Polyadenylate-binding protein 1 Human genes 0.000 claims description 25
- 101710103012 Polyadenylate-binding protein, cytoplasmic and nuclear Proteins 0.000 claims description 25
- 101000996822 Mus musculus Cell surface A33 antigen Proteins 0.000 claims description 24
- 102000034287 fluorescent proteins Human genes 0.000 claims description 24
- 108091006047 fluorescent proteins Proteins 0.000 claims description 24
- 102000014914 Carrier Proteins Human genes 0.000 claims description 23
- 108091008324 binding proteins Proteins 0.000 claims description 23
- 239000003446 ligand Substances 0.000 claims description 23
- 238000012360 testing method Methods 0.000 claims description 22
- 241000283707 Capra Species 0.000 claims description 21
- 244000052616 bacterial pathogen Species 0.000 claims description 21
- 206010028980 Neoplasm Diseases 0.000 claims description 20
- 230000017854 proteolysis Effects 0.000 claims description 18
- 201000011510 cancer Diseases 0.000 claims description 17
- 150000003384 small molecules Chemical class 0.000 claims description 17
- 101000851007 Homo sapiens Vascular endothelial growth factor receptor 2 Proteins 0.000 claims description 16
- 102100033177 Vascular endothelial growth factor receptor 2 Human genes 0.000 claims description 16
- 230000004048 modification Effects 0.000 claims description 15
- 238000012986 modification Methods 0.000 claims description 15
- 210000001519 tissue Anatomy 0.000 claims description 15
- 102000008394 Immunoglobulin Fragments Human genes 0.000 claims description 14
- 108010021625 Immunoglobulin Fragments Proteins 0.000 claims description 14
- 101150117869 Hras gene Proteins 0.000 claims description 13
- 102000003960 Ligases Human genes 0.000 claims description 13
- 108090000364 Ligases Proteins 0.000 claims description 13
- 108010047041 Complementarity Determining Regions Proteins 0.000 claims description 12
- 102100023272 Dual specificity mitogen-activated protein kinase kinase 5 Human genes 0.000 claims description 12
- 101000809261 Homo sapiens Ubiquitin carboxyl-terminal hydrolase 11 Proteins 0.000 claims description 12
- 108010068305 MAP Kinase Kinase 5 Proteins 0.000 claims description 12
- 108060008682 Tumor Necrosis Factor Proteins 0.000 claims description 12
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 claims description 12
- 102100038462 Ubiquitin carboxyl-terminal hydrolase 11 Human genes 0.000 claims description 12
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims description 11
- 230000015572 biosynthetic process Effects 0.000 claims description 11
- 239000003112 inhibitor Substances 0.000 claims description 11
- 230000001717 pathogenic effect Effects 0.000 claims description 11
- 208000001072 type 2 diabetes mellitus Diseases 0.000 claims description 10
- 102100021824 COP9 signalosome complex subunit 5 Human genes 0.000 claims description 8
- 241000606161 Chlamydia Species 0.000 claims description 8
- 101000896048 Homo sapiens COP9 signalosome complex subunit 5 Proteins 0.000 claims description 8
- 101000576802 Homo sapiens Mesothelin Proteins 0.000 claims description 8
- 101000707546 Homo sapiens Splicing factor 3A subunit 1 Proteins 0.000 claims description 8
- 101000808784 Homo sapiens Ubiquitin-conjugating enzyme E2 R1 Proteins 0.000 claims description 8
- 102100025096 Mesothelin Human genes 0.000 claims description 8
- 102100031713 Splicing factor 3A subunit 1 Human genes 0.000 claims description 8
- 102100038466 Ubiquitin-conjugating enzyme E2 R1 Human genes 0.000 claims description 8
- 238000012217 deletion Methods 0.000 claims description 8
- 230000037430 deletion Effects 0.000 claims description 8
- 239000003937 drug carrier Substances 0.000 claims description 8
- 102000006495 integrins Human genes 0.000 claims description 8
- 108010044426 integrins Proteins 0.000 claims description 8
- 230000003612 virological effect Effects 0.000 claims description 8
- 108700022150 Designed Ankyrin Repeat Proteins Proteins 0.000 claims description 7
- 208000006011 Stroke Diseases 0.000 claims description 7
- 101000976659 Xenopus laevis Zinc finger protein ZIC 1 Proteins 0.000 claims description 7
- 230000002503 metabolic effect Effects 0.000 claims description 7
- 230000035772 mutation Effects 0.000 claims description 7
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 claims description 6
- 208000035143 Bacterial infection Diseases 0.000 claims description 6
- 108091005944 Cerulean Proteins 0.000 claims description 6
- 241000579895 Chlorostilbon Species 0.000 claims description 6
- 208000026350 Inborn Genetic disease Diseases 0.000 claims description 6
- 241000607142 Salmonella Species 0.000 claims description 6
- 241000545067 Venus Species 0.000 claims description 6
- 206010003246 arthritis Diseases 0.000 claims description 6
- 208000022362 bacterial infectious disease Diseases 0.000 claims description 6
- 230000007812 deficiency Effects 0.000 claims description 6
- 229910052876 emerald Inorganic materials 0.000 claims description 6
- 239000010976 emerald Substances 0.000 claims description 6
- 108010045262 enhanced cyan fluorescent protein Proteins 0.000 claims description 6
- 208000016361 genetic disease Diseases 0.000 claims description 6
- 210000004408 hybridoma Anatomy 0.000 claims description 6
- 230000001965 increasing effect Effects 0.000 claims description 6
- 208000028867 ischemia Diseases 0.000 claims description 6
- 102000027450 oncoproteins Human genes 0.000 claims description 6
- 108091008819 oncoproteins Proteins 0.000 claims description 6
- 102000005962 receptors Human genes 0.000 claims description 6
- 108020003175 receptors Proteins 0.000 claims description 6
- 210000000130 stem cell Anatomy 0.000 claims description 6
- 208000022309 Alcoholic Liver disease Diseases 0.000 claims description 5
- 208000024827 Alzheimer disease Diseases 0.000 claims description 5
- 208000032467 Aplastic anaemia Diseases 0.000 claims description 5
- 201000001320 Atherosclerosis Diseases 0.000 claims description 5
- 101100507655 Canis lupus familiaris HSPA1 gene Proteins 0.000 claims description 5
- 208000029767 Congenital, Hereditary, and Neonatal Diseases and Abnormalities Diseases 0.000 claims description 5
- 208000032928 Dyslipidaemia Diseases 0.000 claims description 5
- 206010016654 Fibrosis Diseases 0.000 claims description 5
- 241000606790 Haemophilus Species 0.000 claims description 5
- 241000589989 Helicobacter Species 0.000 claims description 5
- 208000035150 Hypercholesterolemia Diseases 0.000 claims description 5
- 206010022489 Insulin Resistance Diseases 0.000 claims description 5
- 102000016267 Leptin Human genes 0.000 claims description 5
- 108010092277 Leptin Proteins 0.000 claims description 5
- 208000017170 Lipid metabolism disease Diseases 0.000 claims description 5
- 206010049287 Lipodystrophy acquired Diseases 0.000 claims description 5
- 208000001145 Metabolic Syndrome Diseases 0.000 claims description 5
- 208000031888 Mycoses Diseases 0.000 claims description 5
- 208000008589 Obesity Diseases 0.000 claims description 5
- 206010033307 Overweight Diseases 0.000 claims description 5
- 208000030852 Parasitic disease Diseases 0.000 claims description 5
- 208000018737 Parkinson disease Diseases 0.000 claims description 5
- 208000018262 Peripheral vascular disease Diseases 0.000 claims description 5
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 claims description 5
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 claims description 5
- 208000024777 Prion disease Diseases 0.000 claims description 5
- 241000589516 Pseudomonas Species 0.000 claims description 5
- 206010067584 Type 1 diabetes mellitus Diseases 0.000 claims description 5
- 201000000690 abdominal obesity-metabolic syndrome Diseases 0.000 claims description 5
- 239000002671 adjuvant Substances 0.000 claims description 5
- 208000007502 anemia Diseases 0.000 claims description 5
- 230000007882 cirrhosis Effects 0.000 claims description 5
- 208000019425 cirrhosis of liver Diseases 0.000 claims description 5
- 206010012601 diabetes mellitus Diseases 0.000 claims description 5
- 210000002919 epithelial cell Anatomy 0.000 claims description 5
- 208000004104 gestational diabetes Diseases 0.000 claims description 5
- 208000006454 hepatitis Diseases 0.000 claims description 5
- 201000001421 hyperglycemia Diseases 0.000 claims description 5
- 208000006575 hypertriglyceridemia Diseases 0.000 claims description 5
- 208000036260 idiopathic disease Diseases 0.000 claims description 5
- 230000002163 immunogen Effects 0.000 claims description 5
- 208000027866 inflammatory disease Diseases 0.000 claims description 5
- NRYBAZVQPHGZNS-ZSOCWYAHSA-N leptin Chemical compound O=C([C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)CCSC)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CS)C(O)=O NRYBAZVQPHGZNS-ZSOCWYAHSA-N 0.000 claims description 5
- 229940039781 leptin Drugs 0.000 claims description 5
- 208000006132 lipodystrophy Diseases 0.000 claims description 5
- 208000037819 metastatic cancer Diseases 0.000 claims description 5
- 208000011575 metastatic malignant neoplasm Diseases 0.000 claims description 5
- 239000006225 natural substrate Substances 0.000 claims description 5
- 208000008338 non-alcoholic fatty liver disease Diseases 0.000 claims description 5
- 235000020824 obesity Nutrition 0.000 claims description 5
- 208000024335 physical disease Diseases 0.000 claims description 5
- 230000035755 proliferation Effects 0.000 claims description 5
- 208000011580 syndromic disease Diseases 0.000 claims description 5
- 208000019553 vascular disease Diseases 0.000 claims description 5
- 230000029663 wound healing Effects 0.000 claims description 5
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 4
- 108010077805 Bacterial Proteins Proteins 0.000 claims description 4
- 241000606660 Bartonella Species 0.000 claims description 4
- 241000588807 Bordetella Species 0.000 claims description 4
- 241000589968 Borrelia Species 0.000 claims description 4
- 241000589562 Brucella Species 0.000 claims description 4
- 241000589876 Campylobacter Species 0.000 claims description 4
- 108010031896 Cell Cycle Proteins Proteins 0.000 claims description 4
- 102000005483 Cell Cycle Proteins Human genes 0.000 claims description 4
- 241000193403 Clostridium Species 0.000 claims description 4
- 102100027591 Copper-transporting ATPase 2 Human genes 0.000 claims description 4
- 241000186216 Corynebacterium Species 0.000 claims description 4
- 201000003883 Cystic fibrosis Diseases 0.000 claims description 4
- 108010025905 Cystine-Knot Miniproteins Proteins 0.000 claims description 4
- 102000052510 DNA-Binding Proteins Human genes 0.000 claims description 4
- 108700020911 DNA-Binding Proteins Proteins 0.000 claims description 4
- 241000194033 Enterococcus Species 0.000 claims description 4
- 241000588722 Escherichia Species 0.000 claims description 4
- 101000597227 Escherichia phage Mu Probable terminase, small subunit gp27 Proteins 0.000 claims description 4
- 101001041701 Escherichia phage lambda Capsid decoration protein Proteins 0.000 claims description 4
- 102000009123 Fibrin Human genes 0.000 claims description 4
- 108010073385 Fibrin Proteins 0.000 claims description 4
- BWGVNKXGVNDBDI-UHFFFAOYSA-N Fibrin monomer Chemical compound CNC(=O)CNC(=O)CN BWGVNKXGVNDBDI-UHFFFAOYSA-N 0.000 claims description 4
- 241000589601 Francisella Species 0.000 claims description 4
- 108010058643 Fungal Proteins Proteins 0.000 claims description 4
- 102000048988 Hemochromatosis Human genes 0.000 claims description 4
- 108700022944 Hemochromatosis Proteins 0.000 claims description 4
- 101150065637 Hfe gene Proteins 0.000 claims description 4
- 102100039869 Histone H2B type F-S Human genes 0.000 claims description 4
- 101000936280 Homo sapiens Copper-transporting ATPase 2 Proteins 0.000 claims description 4
- 101001035372 Homo sapiens Histone H2B type F-S Proteins 0.000 claims description 4
- 101000623901 Homo sapiens Mucin-16 Proteins 0.000 claims description 4
- 241000589248 Legionella Species 0.000 claims description 4
- 208000007764 Legionnaires' Disease Diseases 0.000 claims description 4
- 241000589902 Leptospira Species 0.000 claims description 4
- 241000186781 Listeria Species 0.000 claims description 4
- 208000016604 Lyme disease Diseases 0.000 claims description 4
- 102100023123 Mucin-16 Human genes 0.000 claims description 4
- 101100269838 Mus musculus Ank2 gene Proteins 0.000 claims description 4
- 241000186359 Mycobacterium Species 0.000 claims description 4
- 241000204031 Mycoplasma Species 0.000 claims description 4
- 241000588653 Neisseria Species 0.000 claims description 4
- 102000029797 Prion Human genes 0.000 claims description 4
- 108091000054 Prion Proteins 0.000 claims description 4
- 241000606701 Rickettsia Species 0.000 claims description 4
- 241000191940 Staphylococcus Species 0.000 claims description 4
- 241000194017 Streptococcus Species 0.000 claims description 4
- 101710172711 Structural protein Proteins 0.000 claims description 4
- 241000589886 Treponema Species 0.000 claims description 4
- 241000202898 Ureaplasma Species 0.000 claims description 4
- 241000607598 Vibrio Species 0.000 claims description 4
- 108010067390 Viral Proteins Proteins 0.000 claims description 4
- 241000607734 Yersinia <bacteria> Species 0.000 claims description 4
- 239000003524 antilipemic agent Substances 0.000 claims description 4
- 230000001357 autoimmunogenic effect Effects 0.000 claims description 4
- 108010005774 beta-Galactosidase Proteins 0.000 claims description 4
- 210000001612 chondrocyte Anatomy 0.000 claims description 4
- 229950003499 fibrin Drugs 0.000 claims description 4
- 102000034356 gene-regulatory proteins Human genes 0.000 claims description 4
- 108091006104 gene-regulatory proteins Proteins 0.000 claims description 4
- 231100000283 hepatitis Toxicity 0.000 claims description 4
- 230000003071 parasitic effect Effects 0.000 claims description 4
- 102000035123 post-translationally modified proteins Human genes 0.000 claims description 4
- 108091005626 post-translationally modified proteins Proteins 0.000 claims description 4
- 210000005167 vascular cell Anatomy 0.000 claims description 4
- 101000844752 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) DNA-binding protein 7d Proteins 0.000 claims description 3
- 239000003242 anti bacterial agent Substances 0.000 claims description 3
- 229940121363 anti-inflammatory agent Drugs 0.000 claims description 3
- 239000002260 anti-inflammatory agent Substances 0.000 claims description 3
- 229940088710 antibiotic agent Drugs 0.000 claims description 3
- 239000003472 antidiabetic agent Substances 0.000 claims description 3
- 229940125708 antidiabetic agent Drugs 0.000 claims description 3
- 239000002246 antineoplastic agent Substances 0.000 claims description 3
- 229940045988 antineoplastic drug protein kinase inhibitors Drugs 0.000 claims description 3
- 239000003443 antiviral agent Substances 0.000 claims description 3
- 230000001640 apoptogenic effect Effects 0.000 claims description 3
- 229940127089 cytotoxic agent Drugs 0.000 claims description 3
- 210000004698 lymphocyte Anatomy 0.000 claims description 3
- 239000003909 protein kinase inhibitor Substances 0.000 claims description 3
- 210000001082 somatic cell Anatomy 0.000 claims description 3
- 210000001789 adipocyte Anatomy 0.000 claims description 2
- 210000005058 airway cell Anatomy 0.000 claims description 2
- 210000002449 bone cell Anatomy 0.000 claims description 2
- 210000004271 bone marrow stromal cell Anatomy 0.000 claims description 2
- 210000000481 breast Anatomy 0.000 claims description 2
- 210000004413 cardiac myocyte Anatomy 0.000 claims description 2
- 210000002889 endothelial cell Anatomy 0.000 claims description 2
- 210000001339 epidermal cell Anatomy 0.000 claims description 2
- 210000003743 erythrocyte Anatomy 0.000 claims description 2
- 210000002950 fibroblast Anatomy 0.000 claims description 2
- 210000003494 hepatocyte Anatomy 0.000 claims description 2
- 238000002513 implantation Methods 0.000 claims description 2
- 210000004153 islets of langerhan Anatomy 0.000 claims description 2
- 210000002510 keratinocyte Anatomy 0.000 claims description 2
- 210000003292 kidney cell Anatomy 0.000 claims description 2
- 210000002752 melanocyte Anatomy 0.000 claims description 2
- 210000004400 mucous membrane Anatomy 0.000 claims description 2
- 210000000663 muscle cell Anatomy 0.000 claims description 2
- 210000003757 neuroblast Anatomy 0.000 claims description 2
- 210000004498 neuroglial cell Anatomy 0.000 claims description 2
- 210000000963 osteoblast Anatomy 0.000 claims description 2
- 230000003239 periodontal effect Effects 0.000 claims description 2
- 230000003169 placental effect Effects 0.000 claims description 2
- 210000004927 skin cell Anatomy 0.000 claims description 2
- 102000005936 beta-Galactosidase Human genes 0.000 claims 3
- 230000003372 organotropic effect Effects 0.000 claims 1
- 230000002062 proliferating effect Effects 0.000 claims 1
- 238000012216 screening Methods 0.000 abstract description 19
- 235000018102 proteins Nutrition 0.000 description 163
- 235000001014 amino acid Nutrition 0.000 description 61
- 229940024606 amino acid Drugs 0.000 description 55
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 53
- 150000001413 amino acids Chemical class 0.000 description 50
- 239000013612 plasmid Substances 0.000 description 43
- 230000000694 effects Effects 0.000 description 42
- 125000005647 linker group Chemical group 0.000 description 29
- 239000012636 effector Substances 0.000 description 28
- 230000004927 fusion Effects 0.000 description 28
- 239000002773 nucleotide Substances 0.000 description 28
- 125000003729 nucleotide group Chemical group 0.000 description 28
- 125000003275 alpha amino acid group Chemical group 0.000 description 27
- 241000588724 Escherichia coli Species 0.000 description 23
- 102000018700 F-Box Proteins Human genes 0.000 description 23
- 230000006870 function Effects 0.000 description 23
- 102200006531 rs121913529 Human genes 0.000 description 23
- 108010066805 F-Box Proteins Proteins 0.000 description 22
- 239000000523 sample Substances 0.000 description 21
- 230000001404 mediated effect Effects 0.000 description 20
- 238000011865 proteolysis targeting chimera technique Methods 0.000 description 20
- 108010026668 snake venom protein C activator Proteins 0.000 description 20
- 108020004414 DNA Proteins 0.000 description 19
- 102100039641 Protein MFI Human genes 0.000 description 19
- 230000034512 ubiquitination Effects 0.000 description 19
- 238000010798 ubiquitination Methods 0.000 description 18
- 239000003814 drug Substances 0.000 description 17
- 238000001890 transfection Methods 0.000 description 17
- 239000000047 product Substances 0.000 description 16
- 238000011002 quantification Methods 0.000 description 16
- 239000012634 fragment Substances 0.000 description 15
- 238000001727 in vivo Methods 0.000 description 15
- 108010057821 leucylproline Proteins 0.000 description 15
- 102000001301 EGF receptor Human genes 0.000 description 14
- 108060006698 EGF receptor Proteins 0.000 description 14
- 238000002474 experimental method Methods 0.000 description 14
- 230000003834 intracellular effect Effects 0.000 description 14
- 210000004962 mammalian cell Anatomy 0.000 description 14
- 239000007787 solid Substances 0.000 description 14
- 239000013598 vector Substances 0.000 description 14
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 13
- 241000699670 Mus sp. Species 0.000 description 13
- 108010013835 arginine glutamate Proteins 0.000 description 13
- 238000003556 assay Methods 0.000 description 13
- 230000003197 catalytic effect Effects 0.000 description 13
- 230000001743 silencing effect Effects 0.000 description 13
- 239000000243 solution Substances 0.000 description 13
- 239000000126 substance Substances 0.000 description 13
- 238000006467 substitution reaction Methods 0.000 description 13
- 238000013459 approach Methods 0.000 description 12
- 230000001413 cellular effect Effects 0.000 description 12
- 239000003153 chemical reaction reagent Substances 0.000 description 12
- 150000001875 compounds Chemical class 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 12
- 238000000338 in vitro Methods 0.000 description 12
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 12
- 229920000768 polyamine Polymers 0.000 description 12
- 238000012546 transfer Methods 0.000 description 12
- 238000002965 ELISA Methods 0.000 description 11
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 11
- 238000000684 flow cytometry Methods 0.000 description 11
- 239000002953 phosphate buffered saline Substances 0.000 description 11
- 238000011282 treatment Methods 0.000 description 11
- 241001465754 Metazoa Species 0.000 description 10
- 238000001514 detection method Methods 0.000 description 10
- 229940079593 drug Drugs 0.000 description 10
- 108020001507 fusion proteins Proteins 0.000 description 10
- 239000008194 pharmaceutical composition Substances 0.000 description 10
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 9
- 239000013604 expression vector Substances 0.000 description 9
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 9
- 238000003018 immunoassay Methods 0.000 description 9
- 101150105104 Kras gene Proteins 0.000 description 8
- 241000589242 Legionella pneumophila Species 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 8
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 8
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 8
- 239000007788 liquid Substances 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- 229920000642 polymer Polymers 0.000 description 8
- 102000016914 ras Proteins Human genes 0.000 description 8
- 108010014186 ras Proteins Proteins 0.000 description 8
- 239000003381 stabilizer Substances 0.000 description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 7
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 7
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 7
- 102000004245 Proteasome Endopeptidase Complex Human genes 0.000 description 7
- 108090000708 Proteasome Endopeptidase Complex Proteins 0.000 description 7
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 7
- 238000010459 TALEN Methods 0.000 description 7
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 7
- 108010041407 alanylaspartic acid Proteins 0.000 description 7
- 210000004899 c-terminal region Anatomy 0.000 description 7
- 238000011161 development Methods 0.000 description 7
- 230000009368 gene silencing by RNA Effects 0.000 description 7
- 238000010362 genome editing Methods 0.000 description 7
- 230000003993 interaction Effects 0.000 description 7
- 230000009545 invasion Effects 0.000 description 7
- 238000004949 mass spectrometry Methods 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 238000000746 purification Methods 0.000 description 7
- 210000002966 serum Anatomy 0.000 description 7
- 230000014616 translation Effects 0.000 description 7
- 108010029384 tryptophyl-histidine Proteins 0.000 description 7
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 6
- 108091033409 CRISPR Proteins 0.000 description 6
- 238000010354 CRISPR gene editing Methods 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 6
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 6
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 6
- 241000124008 Mammalia Species 0.000 description 6
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 6
- SECXISVLQFMRJM-UHFFFAOYSA-N N-Methylpyrrolidone Chemical compound CN1CCCC1=O SECXISVLQFMRJM-UHFFFAOYSA-N 0.000 description 6
- 102100022219 NF-kappa-B essential modulator Human genes 0.000 description 6
- 101710090077 NF-kappa-B essential modulator Proteins 0.000 description 6
- 108091030071 RNAI Proteins 0.000 description 6
- 230000001588 bifunctional effect Effects 0.000 description 6
- 125000002091 cationic group Chemical group 0.000 description 6
- 239000006185 dispersion Substances 0.000 description 6
- 229940115932 legionella pneumophila Drugs 0.000 description 6
- 210000004379 membrane Anatomy 0.000 description 6
- 239000012528 membrane Substances 0.000 description 6
- 230000000813 microbial effect Effects 0.000 description 6
- 244000052769 pathogen Species 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 5
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 5
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 5
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 5
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 5
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 5
- 239000004971 Cross linker Substances 0.000 description 5
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 5
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 5
- 108060003951 Immunoglobulin Proteins 0.000 description 5
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 5
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 5
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 5
- 102100036422 Speckle-type POZ protein Human genes 0.000 description 5
- 101710181896 Speckle-type POZ protein Proteins 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 239000011324 bead Substances 0.000 description 5
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 5
- 102000037865 fusion proteins Human genes 0.000 description 5
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 5
- 238000012226 gene silencing method Methods 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- 102000018358 immunoglobulin Human genes 0.000 description 5
- 238000002347 injection Methods 0.000 description 5
- 239000007924 injection Substances 0.000 description 5
- 238000001698 laser desorption ionisation Methods 0.000 description 5
- 210000004901 leucine-rich repeat Anatomy 0.000 description 5
- 108010034529 leucyl-lysine Proteins 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 230000003278 mimic effect Effects 0.000 description 5
- 238000002703 mutagenesis Methods 0.000 description 5
- 231100000350 mutagenesis Toxicity 0.000 description 5
- 239000002105 nanoparticle Substances 0.000 description 5
- 108010025488 pinealon Proteins 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000004850 protein–protein interaction Effects 0.000 description 5
- 230000004063 proteosomal degradation Effects 0.000 description 5
- 229920005989 resin Polymers 0.000 description 5
- 239000011347 resin Substances 0.000 description 5
- 230000001052 transient effect Effects 0.000 description 5
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 4
- ZKEHTYWGPMMGBC-XUXIUFHCSA-N Ala-Leu-Leu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O ZKEHTYWGPMMGBC-XUXIUFHCSA-N 0.000 description 4
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 4
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 4
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 4
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 4
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 4
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 4
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 4
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 4
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 4
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 4
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 4
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 4
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 4
- TYRMVTKPOWPZBC-SXNHZJKMSA-N Gln-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N TYRMVTKPOWPZBC-SXNHZJKMSA-N 0.000 description 4
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 4
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 4
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 4
- XEKAJTCACGEBOK-KKUMJFAQSA-N Glu-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XEKAJTCACGEBOK-KKUMJFAQSA-N 0.000 description 4
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 4
- FLUVGKKRRMLNPU-CQDKDKBSSA-N His-Ala-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FLUVGKKRRMLNPU-CQDKDKBSSA-N 0.000 description 4
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 4
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 4
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 4
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 4
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 4
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 4
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 4
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 4
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 4
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 4
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 4
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 4
- 241000699666 Mus <mouse, genus> Species 0.000 description 4
- 239000012124 Opti-MEM Substances 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 4
- 241000589615 Pseudomonas syringae Species 0.000 description 4
- 102000036366 SCF complex Human genes 0.000 description 4
- 108091007047 SCF complex Proteins 0.000 description 4
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 4
- WTPKKLMBNBCCNL-ACZMJKKPSA-N Ser-Cys-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N WTPKKLMBNBCCNL-ACZMJKKPSA-N 0.000 description 4
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 4
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 4
- NFMPFBCXABPALN-OWLDWWDNSA-N Thr-Ala-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O NFMPFBCXABPALN-OWLDWWDNSA-N 0.000 description 4
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 4
- 102000012275 Ubiquitin domains Human genes 0.000 description 4
- 108050002897 Ubiquitin domains Proteins 0.000 description 4
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 4
- 238000012867 alanine scanning Methods 0.000 description 4
- 238000010171 animal model Methods 0.000 description 4
- 108010008355 arginyl-glutamine Proteins 0.000 description 4
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 102000000472 beta-Transducin Repeat-Containing Proteins Human genes 0.000 description 4
- 108010080842 beta-Transducin Repeat-Containing Proteins Proteins 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 239000002775 capsule Substances 0.000 description 4
- 210000000170 cell membrane Anatomy 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 239000012530 fluid Substances 0.000 description 4
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 4
- 230000028709 inflammatory response Effects 0.000 description 4
- HQKMJHAJHXVSDF-UHFFFAOYSA-L magnesium stearate Chemical compound [Mg+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O HQKMJHAJHXVSDF-UHFFFAOYSA-L 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 229930182817 methionine Natural products 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 108010012581 phenylalanylglutamate Proteins 0.000 description 4
- 229920001223 polyethylene glycol Chemical group 0.000 description 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 4
- 230000004853 protein function Effects 0.000 description 4
- 238000003127 radioimmunoassay Methods 0.000 description 4
- 230000028327 secretion Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 230000004960 subcellular localization Effects 0.000 description 4
- 239000000725 suspension Substances 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- 238000001262 western blot Methods 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 3
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 3
- GFBLJMHGHAXGNY-ZLUOBGJFSA-N Ala-Asn-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GFBLJMHGHAXGNY-ZLUOBGJFSA-N 0.000 description 3
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 3
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 3
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 3
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 3
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 3
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 3
- COUZKSSMBFADSB-AVGNSLFASA-N Asn-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N COUZKSSMBFADSB-AVGNSLFASA-N 0.000 description 3
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 3
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 3
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 3
- 229920002261 Corn starch Polymers 0.000 description 3
- 102000036364 Cullin Ring E3 Ligases Human genes 0.000 description 3
- 108091007045 Cullin Ring E3 Ligases Proteins 0.000 description 3
- 101710165576 Extracellular signal-regulated kinase 2 Proteins 0.000 description 3
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 3
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 3
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 3
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- ISSDODCYBOWWIP-GJZGRUSLSA-N Gly-Pro-Trp Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISSDODCYBOWWIP-GJZGRUSLSA-N 0.000 description 3
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 3
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 3
- MJNWEIMBXKKCSF-XVYDVKMFSA-N His-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N MJNWEIMBXKKCSF-XVYDVKMFSA-N 0.000 description 3
- HXKZJLWGSWQKEA-LSJOCFKGSA-N His-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 HXKZJLWGSWQKEA-LSJOCFKGSA-N 0.000 description 3
- VDHOMPFVSABJKU-ULQDDVLXSA-N His-Phe-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N VDHOMPFVSABJKU-ULQDDVLXSA-N 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 101001125496 Homo sapiens Pre-mRNA-processing factor 19 Proteins 0.000 description 3
- HQLSBZFLOUHQJK-STECZYCISA-N Ile-Tyr-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HQLSBZFLOUHQJK-STECZYCISA-N 0.000 description 3
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 3
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 3
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 3
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 3
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 3
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 3
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 3
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 3
- CTVJSFRHUOSCQQ-DCAQKATOSA-N Met-Arg-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CTVJSFRHUOSCQQ-DCAQKATOSA-N 0.000 description 3
- 102100024193 Mitogen-activated protein kinase 1 Human genes 0.000 description 3
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- 108700020796 Oncogene Proteins 0.000 description 3
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 3
- GKRCCTYAGQPMMP-IHRRRGAJSA-N Phe-Ser-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GKRCCTYAGQPMMP-IHRRRGAJSA-N 0.000 description 3
- 239000002202 Polyethylene glycol Chemical group 0.000 description 3
- 102100029522 Pre-mRNA-processing factor 19 Human genes 0.000 description 3
- DEDANIDYQAPTFI-IHRRRGAJSA-N Pro-Asp-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DEDANIDYQAPTFI-IHRRRGAJSA-N 0.000 description 3
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 3
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 3
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- 108091028664 Ribonucleotide Proteins 0.000 description 3
- 102000014400 SH2 domains Human genes 0.000 description 3
- 108050003452 SH2 domains Proteins 0.000 description 3
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 3
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 3
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 3
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 3
- 108020004459 Small interfering RNA Proteins 0.000 description 3
- VUKVQVNKIIZBPO-HOUAVDHOSA-N Thr-Asp-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VUKVQVNKIIZBPO-HOUAVDHOSA-N 0.000 description 3
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 3
- XNTVWRJTUIOGQO-RHYQMDGZSA-N Thr-Met-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNTVWRJTUIOGQO-RHYQMDGZSA-N 0.000 description 3
- 108700019146 Transgenes Proteins 0.000 description 3
- 108010069584 Type III Secretion Systems Proteins 0.000 description 3
- FMOSEWZYZPMJAL-KKUMJFAQSA-N Tyr-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N FMOSEWZYZPMJAL-KKUMJFAQSA-N 0.000 description 3
- 102000003431 Ubiquitin-Conjugating Enzyme Human genes 0.000 description 3
- 108060008747 Ubiquitin-Conjugating Enzyme Proteins 0.000 description 3
- 102100030434 Ubiquitin-protein ligase E3A Human genes 0.000 description 3
- DNOOLPROHJWCSQ-RCWTZXSCSA-N Val-Arg-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DNOOLPROHJWCSQ-RCWTZXSCSA-N 0.000 description 3
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 3
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 239000000443 aerosol Substances 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 108010087924 alanylproline Proteins 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 108010060035 arginylproline Proteins 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 3
- 239000011230 binding agent Substances 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 238000006555 catalytic reaction Methods 0.000 description 3
- 210000003855 cell nucleus Anatomy 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 239000008120 corn starch Substances 0.000 description 3
- 235000018417 cysteine Nutrition 0.000 description 3
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 3
- 210000000805 cytoplasm Anatomy 0.000 description 3
- 230000001086 cytosolic effect Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000000539 dimer Substances 0.000 description 3
- 238000012377 drug delivery Methods 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 238000000799 fluorescence microscopy Methods 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 108010079547 glutamylmethionine Proteins 0.000 description 3
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 3
- 108010050848 glycylleucine Proteins 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 235000013336 milk Nutrition 0.000 description 3
- 239000008267 milk Substances 0.000 description 3
- 210000004080 milk Anatomy 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 230000004770 neurodegeneration Effects 0.000 description 3
- 231100000252 nontoxic Toxicity 0.000 description 3
- 230000003000 nontoxic effect Effects 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 230000009437 off-target effect Effects 0.000 description 3
- 239000003921 oil Substances 0.000 description 3
- 235000019198 oils Nutrition 0.000 description 3
- 201000002528 pancreatic cancer Diseases 0.000 description 3
- 208000008443 pancreatic carcinoma Diseases 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 238000002823 phage display Methods 0.000 description 3
- 239000000546 pharmaceutical excipient Substances 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 102000028499 poly(A) binding Human genes 0.000 description 3
- 108091023021 poly(A) binding Proteins 0.000 description 3
- 230000001323 posttranslational effect Effects 0.000 description 3
- 230000003389 potentiating effect Effects 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 238000010814 radioimmunoprecipitation assay Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 239000002336 ribonucleotide Substances 0.000 description 3
- 125000002652 ribonucleotide group Chemical group 0.000 description 3
- 102200006538 rs121913530 Human genes 0.000 description 3
- 239000002904 solvent Substances 0.000 description 3
- 238000003756 stirring Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 231100000331 toxic Toxicity 0.000 description 3
- 230000002588 toxic effect Effects 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical group N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 108020005345 3' Untranslated Regions Proteins 0.000 description 2
- WEVYNIUIFUYDGI-UHFFFAOYSA-N 3-[6-[4-(trifluoromethoxy)anilino]-4-pyrimidinyl]benzamide Chemical compound NC(=O)C1=CC=CC(C=2N=CN=C(NC=3C=CC(OC(F)(F)F)=CC=3)C=2)=C1 WEVYNIUIFUYDGI-UHFFFAOYSA-N 0.000 description 2
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 2
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 2
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 2
- YXXPVUOMPSZURS-ZLIFDBKOSA-N Ala-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 YXXPVUOMPSZURS-ZLIFDBKOSA-N 0.000 description 2
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 2
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 2
- 108010032595 Antibody Binding Sites Proteins 0.000 description 2
- 244000105975 Antidesma platyphyllum Species 0.000 description 2
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 2
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 2
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 2
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 2
- UIUXXFIKWQVMEX-UFYCRDLUSA-N Arg-Phe-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UIUXXFIKWQVMEX-UFYCRDLUSA-N 0.000 description 2
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 2
- DRDWXKWUSIKKOB-PJODQICGSA-N Arg-Trp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O DRDWXKWUSIKKOB-PJODQICGSA-N 0.000 description 2
- XEOXPCNONWHHSW-AVGNSLFASA-N Arg-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N XEOXPCNONWHHSW-AVGNSLFASA-N 0.000 description 2
- HAJWYALLJIATCX-FXQIFTODSA-N Asn-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N HAJWYALLJIATCX-FXQIFTODSA-N 0.000 description 2
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 2
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 2
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 2
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 2
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 2
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 2
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 2
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 2
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 2
- 241000416162 Astragalus gummifer Species 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- 101150005585 E3 gene Proteins 0.000 description 2
- 102100026620 E3 ubiquitin ligase TRAF3IP2 Human genes 0.000 description 2
- 108010003751 Elongin Proteins 0.000 description 2
- 102000004662 Elongin Human genes 0.000 description 2
- 102000009024 Epidermal Growth Factor Human genes 0.000 description 2
- 241000283073 Equus caballus Species 0.000 description 2
- 102000016621 Focal Adhesion Protein-Tyrosine Kinases Human genes 0.000 description 2
- 108010067715 Focal Adhesion Protein-Tyrosine Kinases Proteins 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 102100030708 GTPase KRas Human genes 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- 108010010803 Gelatin Proteins 0.000 description 2
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 2
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 2
- AJDMYLOISOCHHC-YVNDNENWSA-N Gln-Gln-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AJDMYLOISOCHHC-YVNDNENWSA-N 0.000 description 2
- ZNTDJIMJKNNSLR-RWRJDSDZSA-N Gln-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZNTDJIMJKNNSLR-RWRJDSDZSA-N 0.000 description 2
- JKGHMESJHRTHIC-SIUGBPQLSA-N Gln-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JKGHMESJHRTHIC-SIUGBPQLSA-N 0.000 description 2
- HUWSBFYAGXCXKC-CIUDSAMLSA-N Glu-Ala-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O HUWSBFYAGXCXKC-CIUDSAMLSA-N 0.000 description 2
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 2
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 2
- XHWLNISLUFEWNS-CIUDSAMLSA-N Glu-Gln-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XHWLNISLUFEWNS-CIUDSAMLSA-N 0.000 description 2
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 2
- JGHNIWVNCAOVRO-DCAQKATOSA-N Glu-His-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGHNIWVNCAOVRO-DCAQKATOSA-N 0.000 description 2
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 2
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- XLYOFNOQVPJJNP-ZSJDYOACSA-N Heavy water Chemical compound [2H]O[2H] XLYOFNOQVPJJNP-ZSJDYOACSA-N 0.000 description 2
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 2
- JBJNKUOMNZGQIM-PYJNHQTQSA-N His-Arg-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JBJNKUOMNZGQIM-PYJNHQTQSA-N 0.000 description 2
- TXLQHACKRLWYCM-DCAQKATOSA-N His-Glu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O TXLQHACKRLWYCM-DCAQKATOSA-N 0.000 description 2
- ZUPVLBAXUUGKKN-VHSXEESVSA-N His-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CN=CN2)N)C(=O)O ZUPVLBAXUUGKKN-VHSXEESVSA-N 0.000 description 2
- 101000879619 Homo sapiens E3 ubiquitin-protein ligase CHIP Proteins 0.000 description 2
- 101000574242 Homo sapiens RING-type E3 ubiquitin-protein ligase PPIL2 Proteins 0.000 description 2
- 101100155061 Homo sapiens UBE3A gene Proteins 0.000 description 2
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 2
- PPSQSIDMOVPKPI-BJDJZHNGSA-N Ile-Cys-Leu Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O PPSQSIDMOVPKPI-BJDJZHNGSA-N 0.000 description 2
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 2
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 2
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 2
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 2
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 2
- 206010061216 Infarction Diseases 0.000 description 2
- 102000004310 Ion Channels Human genes 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical group CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 2
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 2
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 2
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 2
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 2
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 2
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 2
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 2
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 2
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 2
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 2
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 2
- RNYLNYTYMXACRI-VFAJRCTISA-N Leu-Thr-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O RNYLNYTYMXACRI-VFAJRCTISA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- IRVONVRHHJXWTK-RWMBFGLXSA-N Met-Lys-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N IRVONVRHHJXWTK-RWMBFGLXSA-N 0.000 description 2
- 108010008707 Mucin-1 Proteins 0.000 description 2
- 102000007298 Mucin-1 Human genes 0.000 description 2
- 102000007474 Multiprotein Complexes Human genes 0.000 description 2
- 108010085220 Multiprotein Complexes Proteins 0.000 description 2
- 241000699660 Mus musculus Species 0.000 description 2
- 101100155062 Mus musculus Ube3a gene Proteins 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 2
- 102000007999 Nuclear Proteins Human genes 0.000 description 2
- 108010089610 Nuclear Proteins Proteins 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 102000012643 PPIL2 Human genes 0.000 description 2
- 102000018546 Paxillin Human genes 0.000 description 2
- ACNHBCIZLNNLRS-UHFFFAOYSA-N Paxilline 1 Natural products N1C2=CC=CC=C2C2=C1C1(C)C3(C)CCC4OC(C(C)(O)C)C(=O)C=C4C3(O)CCC1C2 ACNHBCIZLNNLRS-UHFFFAOYSA-N 0.000 description 2
- 235000019483 Peanut oil Nutrition 0.000 description 2
- 229930182555 Penicillin Natural products 0.000 description 2
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- JEGFCFLCRSJCMA-IHRRRGAJSA-N Phe-Arg-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N JEGFCFLCRSJCMA-IHRRRGAJSA-N 0.000 description 2
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 2
- 108091036407 Polyadenylation Proteins 0.000 description 2
- 102000015623 Polynucleotide Adenylyltransferase Human genes 0.000 description 2
- 108010024055 Polynucleotide adenylyltransferase Proteins 0.000 description 2
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 2
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 2
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 2
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 2
- ZVEQWRWMRFIVSD-HRCADAONSA-N Pro-Phe-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N3CCC[C@@H]3C(=O)O ZVEQWRWMRFIVSD-HRCADAONSA-N 0.000 description 2
- ATUOYWHBWRKTHZ-UHFFFAOYSA-N Propane Chemical compound CCC ATUOYWHBWRKTHZ-UHFFFAOYSA-N 0.000 description 2
- 108010029485 Protein Isoforms Proteins 0.000 description 2
- 102000001708 Protein Isoforms Human genes 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 2
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 2
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 2
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 2
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 2
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 2
- GVIGVIOEYBOTCB-XIRDDKMYSA-N Ser-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC(C)C)C(O)=O)=CNC2=C1 GVIGVIOEYBOTCB-XIRDDKMYSA-N 0.000 description 2
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 2
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 2
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 108700031954 Tgfb1i1/Leupaxin/TGFB1I1 Proteins 0.000 description 2
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 2
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 2
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 2
- 229920001615 Tragacanth Polymers 0.000 description 2
- DTQVDTLACAAQTR-UHFFFAOYSA-N Trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-N 0.000 description 2
- YEGMNOHLZNGOCG-UBHSHLNASA-N Trp-Asn-Asn Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YEGMNOHLZNGOCG-UBHSHLNASA-N 0.000 description 2
- IEWKKXZRJLTIOV-AVGNSLFASA-N Tyr-Ser-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O IEWKKXZRJLTIOV-AVGNSLFASA-N 0.000 description 2
- 102000018478 Ubiquitin-Activating Enzymes Human genes 0.000 description 2
- 108010091546 Ubiquitin-Activating Enzymes Proteins 0.000 description 2
- SDSCOOZQQGUQFC-GVXVVHGQSA-N Val-His-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N SDSCOOZQQGUQFC-GVXVVHGQSA-N 0.000 description 2
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 2
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 2
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 102000003970 Vinculin Human genes 0.000 description 2
- 108090000384 Vinculin Proteins 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 241000589636 Xanthomonas campestris Species 0.000 description 2
- 241000021375 Xenogenes Species 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Chemical class Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 239000000783 alginic acid Substances 0.000 description 2
- 235000010443 alginic acid Nutrition 0.000 description 2
- 229920000615 alginic acid Polymers 0.000 description 2
- 229960001126 alginic acid Drugs 0.000 description 2
- 150000004781 alginic acids Chemical class 0.000 description 2
- 125000003282 alkyl amino group Chemical group 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 125000003368 amide group Chemical group 0.000 description 2
- 229960003942 amphotericin b Drugs 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000009833 antibody interaction Effects 0.000 description 2
- 230000010056 antibody-dependent cellular cytotoxicity Effects 0.000 description 2
- 238000012230 antisense oligonucleotides Methods 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 239000012472 biological sample Substances 0.000 description 2
- 238000001574 biopsy Methods 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 108020001778 catalytic domains Proteins 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 239000013592 cell lysate Substances 0.000 description 2
- 230000010307 cell transformation Effects 0.000 description 2
- 230000033077 cellular process Effects 0.000 description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 2
- 235000013330 chicken meat Nutrition 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000010668 complexation reaction Methods 0.000 description 2
- 238000000942 confocal micrograph Methods 0.000 description 2
- 238000004132 cross linking Methods 0.000 description 2
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000007123 defense Effects 0.000 description 2
- 230000000593 degrading effect Effects 0.000 description 2
- UQLDLKMNUJERMK-UHFFFAOYSA-L di(octadecanoyloxy)lead Chemical compound [Pb+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O UQLDLKMNUJERMK-UHFFFAOYSA-L 0.000 description 2
- 229960005156 digoxin Drugs 0.000 description 2
- 239000002612 dispersion medium Substances 0.000 description 2
- 238000002224 dissection Methods 0.000 description 2
- 238000007876 drug discovery Methods 0.000 description 2
- 230000005014 ectopic expression Effects 0.000 description 2
- 238000002330 electrospray ionisation mass spectrometry Methods 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 235000019441 ethanol Nutrition 0.000 description 2
- MMXKVMNBHPAILY-UHFFFAOYSA-N ethyl laurate Chemical compound CCCCCCCCCCCC(=O)OCC MMXKVMNBHPAILY-UHFFFAOYSA-N 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 235000003599 food sweetener Nutrition 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 239000008273 gelatin Substances 0.000 description 2
- 229920000159 gelatin Polymers 0.000 description 2
- 235000019322 gelatine Nutrition 0.000 description 2
- 235000011852 gelatine desserts Nutrition 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 150000002334 glycols Chemical class 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 2
- 238000011194 good manufacturing practice Methods 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 235000009424 haa Nutrition 0.000 description 2
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- JYGXADMDTFJGBT-VWUMJDOOSA-N hydrocortisone Chemical compound O=C1CC[C@]2(C)[C@H]3[C@@H](O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 JYGXADMDTFJGBT-VWUMJDOOSA-N 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 125000004356 hydroxy functional group Chemical group O* 0.000 description 2
- 230000001900 immune effect Effects 0.000 description 2
- 238000010166 immunofluorescence Methods 0.000 description 2
- 229940072221 immunoglobulins Drugs 0.000 description 2
- 238000003364 immunohistochemistry Methods 0.000 description 2
- 239000000677 immunologic agent Substances 0.000 description 2
- 229940124541 immunological agent Drugs 0.000 description 2
- 230000007574 infarction Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- NNPPMTNAJDCUHE-UHFFFAOYSA-N isobutane Chemical compound CC(C)C NNPPMTNAJDCUHE-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 2
- 208000032839 leukemia Diseases 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 239000000314 lubricant Substances 0.000 description 2
- 210000002751 lymph Anatomy 0.000 description 2
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 235000019359 magnesium stearate Nutrition 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- 108010022588 methionyl-lysyl-proline Proteins 0.000 description 2
- 208000010125 myocardial infarction Diseases 0.000 description 2
- 239000002086 nanomaterial Substances 0.000 description 2
- 208000015122 neurodegenerative disease Diseases 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000010899 nucleation Methods 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000000972 organotrophic effect Effects 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- ACNHBCIZLNNLRS-UBGQALKQSA-N paxilline Chemical compound N1C2=CC=CC=C2C2=C1[C@]1(C)[C@@]3(C)CC[C@@H]4O[C@H](C(C)(O)C)C(=O)C=C4[C@]3(O)CC[C@H]1C2 ACNHBCIZLNNLRS-UBGQALKQSA-N 0.000 description 2
- 239000000312 peanut oil Substances 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 229940049954 penicillin Drugs 0.000 description 2
- 230000035699 permeability Effects 0.000 description 2
- 230000000144 pharmacologic effect Effects 0.000 description 2
- 108010018625 phenylalanylarginine Proteins 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 210000002381 plasma Anatomy 0.000 description 2
- 229920000867 polyelectrolyte Polymers 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 229920001592 potato starch Polymers 0.000 description 2
- 239000003755 preservative agent Substances 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 239000003380 propellant Substances 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- 229940124823 proteolysis targeting chimeric molecule Drugs 0.000 description 2
- 230000005180 public health Effects 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 102200006539 rs121913529 Human genes 0.000 description 2
- 230000008684 selective degradation Effects 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 239000003549 soybean oil Substances 0.000 description 2
- 235000012424 soybean oil Nutrition 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 239000011593 sulfur Substances 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 239000003765 sweetening agent Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 229940124597 therapeutic agent Drugs 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 239000000196 tragacanth Substances 0.000 description 2
- 235000010487 tragacanth Nutrition 0.000 description 2
- 229940116362 tragacanth Drugs 0.000 description 2
- 238000011830 transgenic mouse model Methods 0.000 description 2
- 230000010474 transient expression Effects 0.000 description 2
- 102000035160 transmembrane proteins Human genes 0.000 description 2
- 108091005703 transmembrane proteins Proteins 0.000 description 2
- 201000007905 transthyretin amyloidosis Diseases 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 230000005740 tumor formation Effects 0.000 description 2
- 230000006663 ubiquitin-proteasome pathway Effects 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- 230000001018 virulence Effects 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- UKAUYVFTDYCKQA-UHFFFAOYSA-N -2-Amino-4-hydroxybutanoic acid Natural products OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- 238000005160 1H NMR spectroscopy Methods 0.000 description 1
- AMBKWKJGMIHTJR-UHFFFAOYSA-N 2-[2-[2-[(2-azaniumyl-3-methylbutanoyl)amino]propanoylamino]propanoylamino]-3-phenylpropanoate Chemical compound CC(C)C(N)C(=O)NC(C)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=CC=C1 AMBKWKJGMIHTJR-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- UAIUNKRWKOVEES-UHFFFAOYSA-N 3,3',5,5'-tetramethylbenzidine Chemical compound CC1=C(N)C(C)=CC(C=2C=C(C)C(N)=C(C)C=2)=C1 UAIUNKRWKOVEES-UHFFFAOYSA-N 0.000 description 1
- KIUMMUBSPKGMOY-UHFFFAOYSA-N 3,3'-Dithiobis(6-nitrobenzoic acid) Chemical compound C1=C([N+]([O-])=O)C(C(=O)O)=CC(SSC=2C=C(C(=CC=2)[N+]([O-])=O)C(O)=O)=C1 KIUMMUBSPKGMOY-UHFFFAOYSA-N 0.000 description 1
- MLLFHKLSIHJGEL-UHFFFAOYSA-N 3-amino-2-(2-nitrophenyl)propanoic acid Chemical compound NCC(C(O)=O)C1=CC=CC=C1[N+]([O-])=O MLLFHKLSIHJGEL-UHFFFAOYSA-N 0.000 description 1
- XXBOYULKNZTOMN-UHFFFAOYSA-N 3-azaniumyl-3-(2-nitrophenyl)propanoate Chemical compound OC(=O)CC(N)C1=CC=CC=C1[N+]([O-])=O XXBOYULKNZTOMN-UHFFFAOYSA-N 0.000 description 1
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 1
- 108010036211 5-HT-moduline Proteins 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- 102000010825 Actinin Human genes 0.000 description 1
- 108010063503 Actinin Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 1
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 1
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 1
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 1
- CSAHOYQKNHGDHX-ACZMJKKPSA-N Ala-Gln-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CSAHOYQKNHGDHX-ACZMJKKPSA-N 0.000 description 1
- JPGBXANAQYHTLA-DRZSPHRISA-N Ala-Gln-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JPGBXANAQYHTLA-DRZSPHRISA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 1
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 1
- IVKWMMGFLAMMKJ-XVYDVKMFSA-N Ala-His-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IVKWMMGFLAMMKJ-XVYDVKMFSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 1
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 1
- NLOMBWNGESDVJU-GUBZILKMSA-N Ala-Met-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLOMBWNGESDVJU-GUBZILKMSA-N 0.000 description 1
- PEIBBAXIKUAYGN-UBHSHLNASA-N Ala-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 PEIBBAXIKUAYGN-UBHSHLNASA-N 0.000 description 1
- CJQAEJMHBAOQHA-DLOVCJGASA-N Ala-Phe-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CJQAEJMHBAOQHA-DLOVCJGASA-N 0.000 description 1
- IHMCQESUJVZTKW-UBHSHLNASA-N Ala-Phe-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 IHMCQESUJVZTKW-UBHSHLNASA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 1
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 1
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 102100026882 Alpha-synuclein Human genes 0.000 description 1
- 206010002091 Anaesthesia Diseases 0.000 description 1
- 102000005446 Anaphase-Promoting Complex-Cyclosome Human genes 0.000 description 1
- 108010031677 Anaphase-Promoting Complex-Cyclosome Proteins 0.000 description 1
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 101000879615 Arabidopsis thaliana E3 ubiquitin-protein ligase CHIP Proteins 0.000 description 1
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 1
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 1
- QEKBCDODJBBWHV-GUBZILKMSA-N Arg-Arg-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O QEKBCDODJBBWHV-GUBZILKMSA-N 0.000 description 1
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 1
- USNSOPDIZILSJP-FXQIFTODSA-N Arg-Asn-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O USNSOPDIZILSJP-FXQIFTODSA-N 0.000 description 1
- QPOARHANPULOTM-GMOBBJLQSA-N Arg-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N QPOARHANPULOTM-GMOBBJLQSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- RYRQZJVFDVWURI-SRVKXCTJSA-N Arg-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N RYRQZJVFDVWURI-SRVKXCTJSA-N 0.000 description 1
- OBFTYSPXDRROQO-SRVKXCTJSA-N Arg-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCN=C(N)N OBFTYSPXDRROQO-SRVKXCTJSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- DGFXIWKPTDKBLF-AVGNSLFASA-N Arg-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N DGFXIWKPTDKBLF-AVGNSLFASA-N 0.000 description 1
- FRMQITGHXMUNDF-GMOBBJLQSA-N Arg-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FRMQITGHXMUNDF-GMOBBJLQSA-N 0.000 description 1
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 1
- FNXCAFKDGBROCU-STECZYCISA-N Arg-Ile-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FNXCAFKDGBROCU-STECZYCISA-N 0.000 description 1
- NOZYDJOPOGKUSR-AVGNSLFASA-N Arg-Leu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O NOZYDJOPOGKUSR-AVGNSLFASA-N 0.000 description 1
- OISWSORSLQOGFV-AVGNSLFASA-N Arg-Met-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N OISWSORSLQOGFV-AVGNSLFASA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 1
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 1
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- LYJXHXGPWDTLKW-HJGDQZAQSA-N Arg-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O LYJXHXGPWDTLKW-HJGDQZAQSA-N 0.000 description 1
- AUZAXCPWMDBWEE-HJGDQZAQSA-N Arg-Thr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O AUZAXCPWMDBWEE-HJGDQZAQSA-N 0.000 description 1
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 1
- QQEWINYJRFBLNN-DLOVCJGASA-N Asn-Ala-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QQEWINYJRFBLNN-DLOVCJGASA-N 0.000 description 1
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 1
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 1
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 1
- IOTKDTZEEBZNCM-UGYAYLCHSA-N Asn-Asn-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOTKDTZEEBZNCM-UGYAYLCHSA-N 0.000 description 1
- QHBMKQWOIYJYMI-BYULHYEWSA-N Asn-Asn-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QHBMKQWOIYJYMI-BYULHYEWSA-N 0.000 description 1
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 1
- XWFPGQVLOVGSLU-CIUDSAMLSA-N Asn-Gln-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XWFPGQVLOVGSLU-CIUDSAMLSA-N 0.000 description 1
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 1
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 1
- JZDZLBJVYWIIQU-AVGNSLFASA-N Asn-Glu-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JZDZLBJVYWIIQU-AVGNSLFASA-N 0.000 description 1
- YGHCVNQOZZMHRZ-DJFWLOJKSA-N Asn-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)N)N YGHCVNQOZZMHRZ-DJFWLOJKSA-N 0.000 description 1
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 1
- YYSYDIYQTUPNQQ-SXTJYALSSA-N Asn-Ile-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YYSYDIYQTUPNQQ-SXTJYALSSA-N 0.000 description 1
- XLZCLJRGGMBKLR-PCBIJLKTSA-N Asn-Ile-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XLZCLJRGGMBKLR-PCBIJLKTSA-N 0.000 description 1
- JQBCANGGAVVERB-CFMVVWHZSA-N Asn-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N JQBCANGGAVVERB-CFMVVWHZSA-N 0.000 description 1
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- LZLCLRQMUQWUHJ-GUBZILKMSA-N Asn-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N LZLCLRQMUQWUHJ-GUBZILKMSA-N 0.000 description 1
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 1
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 1
- AEZCCDMZZJOGII-DCAQKATOSA-N Asn-Met-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O AEZCCDMZZJOGII-DCAQKATOSA-N 0.000 description 1
- MVXJBVVLACEGCG-PCBIJLKTSA-N Asn-Phe-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVXJBVVLACEGCG-PCBIJLKTSA-N 0.000 description 1
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 1
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 1
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 1
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 1
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 1
- ZAESWDKAMDVHLL-RCOVLWMOSA-N Asn-Val-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O ZAESWDKAMDVHLL-RCOVLWMOSA-N 0.000 description 1
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 1
- HTOZUYZQPICRAP-BPUTZDHNSA-N Asp-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N HTOZUYZQPICRAP-BPUTZDHNSA-N 0.000 description 1
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 1
- JDHOJQJMWBKHDB-CIUDSAMLSA-N Asp-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N JDHOJQJMWBKHDB-CIUDSAMLSA-N 0.000 description 1
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 1
- WYOSXGYAKZQPGF-SRVKXCTJSA-N Asp-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N WYOSXGYAKZQPGF-SRVKXCTJSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 1
- MJJIHRWNWSQTOI-VEVYYDQMSA-N Asp-Thr-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MJJIHRWNWSQTOI-VEVYYDQMSA-N 0.000 description 1
- KNDCWFXCFKSEBM-AVGNSLFASA-N Asp-Tyr-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KNDCWFXCFKSEBM-AVGNSLFASA-N 0.000 description 1
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- NOWKCMXCCJGMRR-UHFFFAOYSA-N Aziridine Chemical group C1CN1 NOWKCMXCCJGMRR-UHFFFAOYSA-N 0.000 description 1
- 208000004429 Bacillary Dysentery Diseases 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 241000589173 Bradyrhizobium Species 0.000 description 1
- 208000003174 Brain Neoplasms Diseases 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 108091007381 CBL proteins Proteins 0.000 description 1
- 108010084313 CD58 Antigens Proteins 0.000 description 1
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 1
- 102100033620 Calponin-1 Human genes 0.000 description 1
- 241000282832 Camelidae Species 0.000 description 1
- 241000282836 Camelus dromedarius Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- 206010007559 Cardiac failure congestive Diseases 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 241000700199 Cavia porcellus Species 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 102000009016 Cholera Toxin Human genes 0.000 description 1
- 108010049048 Cholera Toxin Proteins 0.000 description 1
- 206010008909 Chronic Hepatitis Diseases 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- XMTDCXXLDZKAGI-ACZMJKKPSA-N Cys-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N XMTDCXXLDZKAGI-ACZMJKKPSA-N 0.000 description 1
- KLLFLHBKSJAUMZ-ACZMJKKPSA-N Cys-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N KLLFLHBKSJAUMZ-ACZMJKKPSA-N 0.000 description 1
- KABHAOSDMIYXTR-GUBZILKMSA-N Cys-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N KABHAOSDMIYXTR-GUBZILKMSA-N 0.000 description 1
- HKALUUKHYNEDRS-GUBZILKMSA-N Cys-Leu-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HKALUUKHYNEDRS-GUBZILKMSA-N 0.000 description 1
- KCPOQGRVVXYLAC-KKUMJFAQSA-N Cys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N KCPOQGRVVXYLAC-KKUMJFAQSA-N 0.000 description 1
- ABLQPNMKLMFDQU-BIIVOSGPSA-N Cys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CS)N)C(=O)O ABLQPNMKLMFDQU-BIIVOSGPSA-N 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 235000019739 Dicalciumphosphate Nutrition 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 108010016626 Dipeptides Proteins 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- 101710201734 E3 protein Proteins 0.000 description 1
- 102100037334 E3 ubiquitin-protein ligase CHIP Human genes 0.000 description 1
- 102100039503 E3 ubiquitin-protein ligase RNF31 Human genes 0.000 description 1
- 101710109262 E3 ubiquitin-protein ligase RNF31 Proteins 0.000 description 1
- 241000607473 Edwardsiella <enterobacteria> Species 0.000 description 1
- LVGKNOAMLMIIKO-UHFFFAOYSA-N Elaidinsaeure-aethylester Natural products CCCCCCCCC=CCCCCCCCC(=O)OCC LVGKNOAMLMIIKO-UHFFFAOYSA-N 0.000 description 1
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- 108010013369 Enteropeptidase Proteins 0.000 description 1
- 102100029727 Enteropeptidase Human genes 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 239000001856 Ethyl cellulose Substances 0.000 description 1
- ZZSNKZQZMQGXPY-UHFFFAOYSA-N Ethyl cellulose Chemical compound CCOCC1OC(OC)C(OCC)C(OCC)C1OC1C(O)C(O)C(OC)C(CO)O1 ZZSNKZQZMQGXPY-UHFFFAOYSA-N 0.000 description 1
- 108091072033 F-box protein family Proteins 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 102100029974 GTPase HRas Human genes 0.000 description 1
- 102100021736 Galectin-1 Human genes 0.000 description 1
- 102100021023 Gamma-glutamyl hydrolase Human genes 0.000 description 1
- 229940123611 Genome editing Drugs 0.000 description 1
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 1
- UWZLBXOBVKRUFE-HGNGGELXSA-N Gln-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N UWZLBXOBVKRUFE-HGNGGELXSA-N 0.000 description 1
- DLOHWQXXGMEZDW-CIUDSAMLSA-N Gln-Arg-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DLOHWQXXGMEZDW-CIUDSAMLSA-N 0.000 description 1
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 1
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 1
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 1
- QQAPDATZKKTBIY-YUMQZZPRSA-N Gln-Gly-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O QQAPDATZKKTBIY-YUMQZZPRSA-N 0.000 description 1
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 1
- KHGGWBRVRPHFMH-PEFMBERDSA-N Gln-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHGGWBRVRPHFMH-PEFMBERDSA-N 0.000 description 1
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- VUVKKXPCKILIBD-AVGNSLFASA-N Gln-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VUVKKXPCKILIBD-AVGNSLFASA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- DQLVHRFFBQOWFL-JYJNAYRXSA-N Gln-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)O DQLVHRFFBQOWFL-JYJNAYRXSA-N 0.000 description 1
- AQPZYBSRDRZBAG-AVGNSLFASA-N Gln-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N AQPZYBSRDRZBAG-AVGNSLFASA-N 0.000 description 1
- UESYBOXFJWJVSB-AVGNSLFASA-N Gln-Phe-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O UESYBOXFJWJVSB-AVGNSLFASA-N 0.000 description 1
- UTOQQOMEJDPDMX-ACZMJKKPSA-N Gln-Ser-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O UTOQQOMEJDPDMX-ACZMJKKPSA-N 0.000 description 1
- ZGHMRONFHDVXEF-AVGNSLFASA-N Gln-Ser-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZGHMRONFHDVXEF-AVGNSLFASA-N 0.000 description 1
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 1
- 102100025894 Glomulin Human genes 0.000 description 1
- 101710088083 Glomulin Proteins 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 1
- GLWXKFRTOHKGIT-ACZMJKKPSA-N Glu-Asn-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GLWXKFRTOHKGIT-ACZMJKKPSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 1
- ALCAUWPAMLVUDB-FXQIFTODSA-N Glu-Gln-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ALCAUWPAMLVUDB-FXQIFTODSA-N 0.000 description 1
- XMVLTPMCUJTJQP-FXQIFTODSA-N Glu-Gln-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N XMVLTPMCUJTJQP-FXQIFTODSA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 1
- APHGWLWMOXGZRL-DCAQKATOSA-N Glu-Glu-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O APHGWLWMOXGZRL-DCAQKATOSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- UHVIQGKBMXEVGN-WDSKDSINSA-N Glu-Gly-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UHVIQGKBMXEVGN-WDSKDSINSA-N 0.000 description 1
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 1
- VXQOONWNIWFOCS-HGNGGELXSA-N Glu-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N VXQOONWNIWFOCS-HGNGGELXSA-N 0.000 description 1
- WVTIBGWZUMJBFY-GUBZILKMSA-N Glu-His-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O WVTIBGWZUMJBFY-GUBZILKMSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- NWOUBJNMZDDGDT-AVGNSLFASA-N Glu-Leu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NWOUBJNMZDDGDT-AVGNSLFASA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 1
- AOCARQDSFTWWFT-DCAQKATOSA-N Glu-Met-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AOCARQDSFTWWFT-DCAQKATOSA-N 0.000 description 1
- MIIGESVJEBDJMP-FHWLQOOXSA-N Glu-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 MIIGESVJEBDJMP-FHWLQOOXSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- HGJREIGJLUQBTJ-SZMVWBNQSA-N Glu-Trp-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O HGJREIGJLUQBTJ-SZMVWBNQSA-N 0.000 description 1
- VXEFAWJTFAUDJK-AVGNSLFASA-N Glu-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O VXEFAWJTFAUDJK-AVGNSLFASA-N 0.000 description 1
- LSYFGBRDBIQYAQ-FHWLQOOXSA-N Glu-Tyr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LSYFGBRDBIQYAQ-FHWLQOOXSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- LEGMTEAZGRRIMY-ZKWXMUAHSA-N Gly-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN LEGMTEAZGRRIMY-ZKWXMUAHSA-N 0.000 description 1
- HFXJIZNEXNIZIJ-BQBZGAKWSA-N Gly-Glu-Gln Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFXJIZNEXNIZIJ-BQBZGAKWSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- ZOTGXWMKUFSKEU-QXEWZRGKSA-N Gly-Ile-Met Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O ZOTGXWMKUFSKEU-QXEWZRGKSA-N 0.000 description 1
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 1
- JYPCXBJRLBHWME-IUCAKERBSA-N Gly-Pro-Arg Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JYPCXBJRLBHWME-IUCAKERBSA-N 0.000 description 1
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 1
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 102000012215 HSC70 Heat-Shock Proteins Human genes 0.000 description 1
- 108010036652 HSC70 Heat-Shock Proteins Proteins 0.000 description 1
- 206010019280 Heart failures Diseases 0.000 description 1
- 102100034051 Heat shock protein HSP 90-alpha Human genes 0.000 description 1
- 108091005902 Hemoglobin subunit alpha Proteins 0.000 description 1
- 102100027685 Hemoglobin subunit alpha Human genes 0.000 description 1
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 1
- QIVPRLJQQVXCIY-HGNGGELXSA-N His-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](CCC(N)=O)C(O)=O QIVPRLJQQVXCIY-HGNGGELXSA-N 0.000 description 1
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 1
- MPXGJGBXCRQQJE-MXAVVETBSA-N His-Ile-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O MPXGJGBXCRQQJE-MXAVVETBSA-N 0.000 description 1
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 1
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 1
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 1
- KYFGGRHWLFZXPU-KKUMJFAQSA-N His-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N KYFGGRHWLFZXPU-KKUMJFAQSA-N 0.000 description 1
- ABCCKUZDWMERKT-AVGNSLFASA-N His-Pro-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O ABCCKUZDWMERKT-AVGNSLFASA-N 0.000 description 1
- IAYPZSHNZQHQNO-KKUMJFAQSA-N His-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N IAYPZSHNZQHQNO-KKUMJFAQSA-N 0.000 description 1
- FCPSGEVYIVXPPO-QTKMDUPCSA-N His-Thr-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FCPSGEVYIVXPPO-QTKMDUPCSA-N 0.000 description 1
- XHQYFGPIRUHQIB-PBCZWWQYSA-N His-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CN=CN1 XHQYFGPIRUHQIB-PBCZWWQYSA-N 0.000 description 1
- AHEBIAHEZWQVHB-QTKMDUPCSA-N His-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O AHEBIAHEZWQVHB-QTKMDUPCSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- 108091006054 His-tagged proteins Proteins 0.000 description 1
- 101710103773 Histone H2B Proteins 0.000 description 1
- 102100021639 Histone H2B type 1-K Human genes 0.000 description 1
- 101000945318 Homo sapiens Calponin-1 Proteins 0.000 description 1
- 101000914324 Homo sapiens Carcinoembryonic antigen-related cell adhesion molecule 5 Proteins 0.000 description 1
- 101000914321 Homo sapiens Carcinoembryonic antigen-related cell adhesion molecule 7 Proteins 0.000 description 1
- 101000913784 Homo sapiens E3 ubiquitin ligase TRAF3IP2 Proteins 0.000 description 1
- 101000584633 Homo sapiens GTPase HRas Proteins 0.000 description 1
- 101001016865 Homo sapiens Heat shock protein HSP 90-alpha Proteins 0.000 description 1
- 101001009007 Homo sapiens Hemoglobin subunit alpha Proteins 0.000 description 1
- 101000617725 Homo sapiens Pregnancy-specific beta-1-glycoprotein 2 Proteins 0.000 description 1
- 101000692686 Homo sapiens RING finger protein 37 Proteins 0.000 description 1
- 101000652736 Homo sapiens Transgelin Proteins 0.000 description 1
- 101000808654 Homo sapiens Ubiquitin conjugation factor E4 A Proteins 0.000 description 1
- 101000809046 Homo sapiens Ubiquitin conjugation factor E4 B Proteins 0.000 description 1
- 101000772888 Homo sapiens Ubiquitin-protein ligase E3A Proteins 0.000 description 1
- 101000650167 Homo sapiens WD repeat, SAM and U-box domain-containing protein 1 Proteins 0.000 description 1
- 102100027037 Hsc70-interacting protein Human genes 0.000 description 1
- 101710109065 Hsc70-interacting protein Proteins 0.000 description 1
- 241000701109 Human adenovirus 2 Species 0.000 description 1
- 241000341655 Human papillomavirus type 16 Species 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- 229920002153 Hydroxypropyl cellulose Polymers 0.000 description 1
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 1
- DPTBVFUDCPINIP-JURCDPSOSA-N Ile-Ala-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DPTBVFUDCPINIP-JURCDPSOSA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 1
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- VQUCKIAECLVLAD-SVSWQMSJSA-N Ile-Cys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VQUCKIAECLVLAD-SVSWQMSJSA-N 0.000 description 1
- ZDNORQNHCJUVOV-KBIXCLLPSA-N Ile-Gln-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O ZDNORQNHCJUVOV-KBIXCLLPSA-N 0.000 description 1
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- JLWLMGADIQFKRD-QSFUFRPTSA-N Ile-His-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CN=CN1 JLWLMGADIQFKRD-QSFUFRPTSA-N 0.000 description 1
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 1
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 1
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 1
- ZDNNDIJTUHQCAM-MXAVVETBSA-N Ile-Ser-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ZDNNDIJTUHQCAM-MXAVVETBSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 1
- FXJLRZFMKGHYJP-CFMVVWHZSA-N Ile-Tyr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FXJLRZFMKGHYJP-CFMVVWHZSA-N 0.000 description 1
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 1
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 1
- 206010061598 Immunodeficiency Diseases 0.000 description 1
- 208000029462 Immunodeficiency disease Diseases 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- 229930182816 L-glutamine Natural products 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- UKAUYVFTDYCKQA-VKHMYHEASA-N L-homoserine Chemical group OC(=O)[C@@H](N)CCO UKAUYVFTDYCKQA-VKHMYHEASA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- QEFRNWWLZKMPFJ-ZXPFJRLXSA-N L-methionine (R)-S-oxide Chemical group C[S@@](=O)CC[C@H]([NH3+])C([O-])=O QEFRNWWLZKMPFJ-ZXPFJRLXSA-N 0.000 description 1
- QEFRNWWLZKMPFJ-UHFFFAOYSA-N L-methionine sulphoxide Chemical group CS(=O)CCC(N)C(O)=O QEFRNWWLZKMPFJ-UHFFFAOYSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- DQPQTXMIRBUWKO-DCAQKATOSA-N Leu-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N DQPQTXMIRBUWKO-DCAQKATOSA-N 0.000 description 1
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 1
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 1
- QUAAUWNLWMLERT-IHRRRGAJSA-N Leu-Arg-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O QUAAUWNLWMLERT-IHRRRGAJSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 1
- IASQBRJGRVXNJI-YUMQZZPRSA-N Leu-Cys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)NCC(O)=O IASQBRJGRVXNJI-YUMQZZPRSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 1
- XQXGNBFMAXWIGI-MXAVVETBSA-N Leu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 XQXGNBFMAXWIGI-MXAVVETBSA-N 0.000 description 1
- XBCWOTOCBXXJDG-BZSNNMDCSA-N Leu-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XBCWOTOCBXXJDG-BZSNNMDCSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 1
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- RRVCZCNFXIFGRA-DCAQKATOSA-N Leu-Pro-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RRVCZCNFXIFGRA-DCAQKATOSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 1
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- QONKWXNJRRNTBV-AVGNSLFASA-N Leu-Pro-Met Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N QONKWXNJRRNTBV-AVGNSLFASA-N 0.000 description 1
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- KIZIOFNVSOSKJI-CIUDSAMLSA-N Leu-Ser-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N KIZIOFNVSOSKJI-CIUDSAMLSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 1
- LINKCQUOMUDLKN-KATARQTJSA-N Leu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N)O LINKCQUOMUDLKN-KATARQTJSA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- HOMFINRJHIIZNJ-HOCLYGCPSA-N Leu-Trp-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O HOMFINRJHIIZNJ-HOCLYGCPSA-N 0.000 description 1
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 1
- ARNIBBOXIAWUOP-MGHWNKPDSA-N Leu-Tyr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ARNIBBOXIAWUOP-MGHWNKPDSA-N 0.000 description 1
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- 235000010643 Leucaena leucocephala Nutrition 0.000 description 1
- 240000007472 Leucaena leucocephala Species 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- WOEDRPCHKPSFDT-MXAVVETBSA-N Lys-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N WOEDRPCHKPSFDT-MXAVVETBSA-N 0.000 description 1
- XDPLZVNMYQOFQZ-BJDJZHNGSA-N Lys-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N XDPLZVNMYQOFQZ-BJDJZHNGSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 1
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- 102000043136 MAP kinase family Human genes 0.000 description 1
- 108091054455 MAP kinase family Proteins 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 1
- OBVHKUFUDCPZDW-JYJNAYRXSA-N Met-Arg-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OBVHKUFUDCPZDW-JYJNAYRXSA-N 0.000 description 1
- SBSIKVMCCJUCBZ-GUBZILKMSA-N Met-Asn-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N SBSIKVMCCJUCBZ-GUBZILKMSA-N 0.000 description 1
- ACYHZNZHIZWLQF-BQBZGAKWSA-N Met-Asn-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ACYHZNZHIZWLQF-BQBZGAKWSA-N 0.000 description 1
- FBQMBZLJHOQAIH-GUBZILKMSA-N Met-Asp-Met Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O FBQMBZLJHOQAIH-GUBZILKMSA-N 0.000 description 1
- OXHSZBRPUGNMKW-DCAQKATOSA-N Met-Gln-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OXHSZBRPUGNMKW-DCAQKATOSA-N 0.000 description 1
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 1
- CFRRIZLGFGJEDB-SRVKXCTJSA-N Met-His-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O CFRRIZLGFGJEDB-SRVKXCTJSA-N 0.000 description 1
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 1
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 1
- HGAJNEWOUHDUMZ-SRVKXCTJSA-N Met-Leu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O HGAJNEWOUHDUMZ-SRVKXCTJSA-N 0.000 description 1
- OSZTUONKUMCWEP-XUXIUFHCSA-N Met-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC OSZTUONKUMCWEP-XUXIUFHCSA-N 0.000 description 1
- LNXGEYIEEUZGGH-JYJNAYRXSA-N Met-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=CC=C1 LNXGEYIEEUZGGH-JYJNAYRXSA-N 0.000 description 1
- JQHYVIKEFYETEW-IHRRRGAJSA-N Met-Phe-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=CC=C1 JQHYVIKEFYETEW-IHRRRGAJSA-N 0.000 description 1
- 108010006519 Molecular Chaperones Proteins 0.000 description 1
- 102000005431 Molecular Chaperones Human genes 0.000 description 1
- 208000010718 Multiple Organ Failure Diseases 0.000 description 1
- 101100084052 Mus musculus Ppil2 gene Proteins 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010057466 NF-kappa B Proteins 0.000 description 1
- 102000003945 NF-kappa B Human genes 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 101150073096 NRAS gene Proteins 0.000 description 1
- 108091007491 NSP3 Papain-like protease domains Proteins 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 239000002033 PVDF binder Substances 0.000 description 1
- 229930040373 Paraformaldehyde Natural products 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- ALHULIGNEXGFRM-QWRGUYRKSA-N Phe-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=CC=C1 ALHULIGNEXGFRM-QWRGUYRKSA-N 0.000 description 1
- UMKYAYXCMYYNHI-AVGNSLFASA-N Phe-Gln-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N UMKYAYXCMYYNHI-AVGNSLFASA-N 0.000 description 1
- NKLDZIPTGKBDBB-HTUGSXCWSA-N Phe-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O NKLDZIPTGKBDBB-HTUGSXCWSA-N 0.000 description 1
- AKJAKCBHLJGRBU-JYJNAYRXSA-N Phe-Glu-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N AKJAKCBHLJGRBU-JYJNAYRXSA-N 0.000 description 1
- RFEXGCASCQGGHZ-STQMWFEESA-N Phe-Gly-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O RFEXGCASCQGGHZ-STQMWFEESA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- METZZBCMDXHFMK-BZSNNMDCSA-N Phe-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N METZZBCMDXHFMK-BZSNNMDCSA-N 0.000 description 1
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 1
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 1
- GPLWGAYGROGDEN-BZSNNMDCSA-N Phe-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GPLWGAYGROGDEN-BZSNNMDCSA-N 0.000 description 1
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 1
- AAERWTUHZKLDLC-IHRRRGAJSA-N Phe-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O AAERWTUHZKLDLC-IHRRRGAJSA-N 0.000 description 1
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 1
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- GCFNFKNPCMBHNT-IRXDYDNUSA-N Phe-Tyr-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)NCC(=O)O)N GCFNFKNPCMBHNT-IRXDYDNUSA-N 0.000 description 1
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 108010068086 Polyubiquitin Proteins 0.000 description 1
- 102100037935 Polyubiquitin-C Human genes 0.000 description 1
- 102100022019 Pregnancy-specific beta-1-glycoprotein 2 Human genes 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 1
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 1
- GRIRJQGZZJVANI-CYDGBPFRSA-N Pro-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 GRIRJQGZZJVANI-CYDGBPFRSA-N 0.000 description 1
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 1
- ORPZXBQTEHINPB-SRVKXCTJSA-N Pro-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1)C(O)=O ORPZXBQTEHINPB-SRVKXCTJSA-N 0.000 description 1
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 1
- ODPIUQVTULPQEP-CIUDSAMLSA-N Pro-Gln-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ODPIUQVTULPQEP-CIUDSAMLSA-N 0.000 description 1
- LQZZPNDMYNZPFT-KKUMJFAQSA-N Pro-Gln-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LQZZPNDMYNZPFT-KKUMJFAQSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- VPFGPKIWSDVTOY-SRVKXCTJSA-N Pro-Glu-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O VPFGPKIWSDVTOY-SRVKXCTJSA-N 0.000 description 1
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 1
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 1
- SOACYAXADBWDDT-CYDGBPFRSA-N Pro-Ile-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SOACYAXADBWDDT-CYDGBPFRSA-N 0.000 description 1
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 1
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 1
- MZNUJZBYRWXWLQ-AVGNSLFASA-N Pro-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 MZNUJZBYRWXWLQ-AVGNSLFASA-N 0.000 description 1
- RPLMFKUKFZOTER-AVGNSLFASA-N Pro-Met-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 RPLMFKUKFZOTER-AVGNSLFASA-N 0.000 description 1
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 1
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 1
- SVXXJYJCRNKDDE-AVGNSLFASA-N Pro-Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CN=CN1 SVXXJYJCRNKDDE-AVGNSLFASA-N 0.000 description 1
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 1
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 1
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 1
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 1
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 1
- RJTUIDFUUHPJMP-FHWLQOOXSA-N Pro-Trp-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CC4=CN=CN4)C(=O)O RJTUIDFUUHPJMP-FHWLQOOXSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- 101710093543 Probable non-specific lipid-transfer protein Proteins 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 241000169446 Promethis Species 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 102000055251 Proto-Oncogene Proteins c-cbl Human genes 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 102100026249 RING finger protein 37 Human genes 0.000 description 1
- 102000034442 RING-type E3 ubiquitin transferases Human genes 0.000 description 1
- 108030001238 RING-type E3 ubiquitin transferases Proteins 0.000 description 1
- 102100025781 RING-type E3 ubiquitin-protein ligase PPIL2 Human genes 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- 108050002653 Retinoblastoma protein Proteins 0.000 description 1
- 241000589180 Rhizobium Species 0.000 description 1
- 102000000341 S-Phase Kinase-Associated Proteins Human genes 0.000 description 1
- 108010055623 S-Phase Kinase-Associated Proteins Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 235000019485 Safflower oil Nutrition 0.000 description 1
- 101710184528 Scaffolding protein Proteins 0.000 description 1
- 206010040070 Septic Shock Diseases 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 1
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 1
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 1
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 1
- ZHYMUFQVKGJNRM-ZLUOBGJFSA-N Ser-Cys-Asn Chemical compound OC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(N)=O ZHYMUFQVKGJNRM-ZLUOBGJFSA-N 0.000 description 1
- INCNPLPRPOYTJI-JBDRJPRFSA-N Ser-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N INCNPLPRPOYTJI-JBDRJPRFSA-N 0.000 description 1
- RNMRYWZYFHHOEV-CIUDSAMLSA-N Ser-Gln-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RNMRYWZYFHHOEV-CIUDSAMLSA-N 0.000 description 1
- MAWSJXHRLWVJEZ-ACZMJKKPSA-N Ser-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N MAWSJXHRLWVJEZ-ACZMJKKPSA-N 0.000 description 1
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- YMDNFPNTIPQMJP-NAKRPEOUSA-N Ser-Ile-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O YMDNFPNTIPQMJP-NAKRPEOUSA-N 0.000 description 1
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 1
- AMRRYKHCILPAKD-FXQIFTODSA-N Ser-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N AMRRYKHCILPAKD-FXQIFTODSA-N 0.000 description 1
- VXYQOFXBIXKPCX-BQBZGAKWSA-N Ser-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N VXYQOFXBIXKPCX-BQBZGAKWSA-N 0.000 description 1
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 1
- WNDUPCKKKGSKIQ-CIUDSAMLSA-N Ser-Pro-Gln Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O WNDUPCKKKGSKIQ-CIUDSAMLSA-N 0.000 description 1
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 1
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 1
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 1
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 1
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 1
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 1
- 206010040550 Shigella infections Diseases 0.000 description 1
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 208000018359 Systemic autoimmune disease Diseases 0.000 description 1
- 239000006180 TBST buffer Substances 0.000 description 1
- 108090000925 TNF receptor-associated factor 2 Proteins 0.000 description 1
- 102100034779 TRAF family member-associated NF-kappa-B activator Human genes 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 1
- CTONFVDJYCAMQM-IUKAMOBKSA-N Thr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)N CTONFVDJYCAMQM-IUKAMOBKSA-N 0.000 description 1
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 1
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 1
- XDARBNMYXKUFOJ-GSSVUCPTSA-N Thr-Asp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDARBNMYXKUFOJ-GSSVUCPTSA-N 0.000 description 1
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- AYCQVUUPIJHJTA-IXOXFDKPSA-N Thr-His-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O AYCQVUUPIJHJTA-IXOXFDKPSA-N 0.000 description 1
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 1
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 1
- XIULAFZYEKSGAJ-IXOXFDKPSA-N Thr-Leu-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XIULAFZYEKSGAJ-IXOXFDKPSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- OHDXOXIZXSFCDN-RCWTZXSCSA-N Thr-Met-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OHDXOXIZXSFCDN-RCWTZXSCSA-N 0.000 description 1
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 1
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 1
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 1
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 1
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- IJKNKFJZOJCKRR-GBALPHGKSA-N Thr-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 IJKNKFJZOJCKRR-GBALPHGKSA-N 0.000 description 1
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- QAXCHNZDPLSFPC-PJODQICGSA-N Trp-Ala-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QAXCHNZDPLSFPC-PJODQICGSA-N 0.000 description 1
- WFZYXGSAPWKTHR-XEGUGMAKSA-N Trp-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WFZYXGSAPWKTHR-XEGUGMAKSA-N 0.000 description 1
- HYVLNORXQGKONN-NUTKFTJISA-N Trp-Ala-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 HYVLNORXQGKONN-NUTKFTJISA-N 0.000 description 1
- IQGJAHMZWBTRIF-UBHSHLNASA-N Trp-Asp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IQGJAHMZWBTRIF-UBHSHLNASA-N 0.000 description 1
- VEYXZZGMIBKXCN-UBHSHLNASA-N Trp-Asp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VEYXZZGMIBKXCN-UBHSHLNASA-N 0.000 description 1
- ORQGVWIUHICVKE-KCTSRDHCSA-N Trp-His-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O ORQGVWIUHICVKE-KCTSRDHCSA-N 0.000 description 1
- CSOBBJWWODOYGW-ILWGZMRPSA-N Trp-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N)C(=O)O CSOBBJWWODOYGW-ILWGZMRPSA-N 0.000 description 1
- GIAMKIPJSRZVJB-IHPCNDPISA-N Trp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GIAMKIPJSRZVJB-IHPCNDPISA-N 0.000 description 1
- UIRPULWLRODAEQ-QEJZJMRPSA-N Trp-Ser-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 UIRPULWLRODAEQ-QEJZJMRPSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 206010053614 Type III immune complex mediated reaction Diseases 0.000 description 1
- HKIUVWMZYFBIHG-KKUMJFAQSA-N Tyr-Arg-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O HKIUVWMZYFBIHG-KKUMJFAQSA-N 0.000 description 1
- MVYRJYISVJWKSX-KBPBESRZSA-N Tyr-His-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)NCC(=O)O)N)O MVYRJYISVJWKSX-KBPBESRZSA-N 0.000 description 1
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- FGVFBDZSGQTYQX-UFYCRDLUSA-N Tyr-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O FGVFBDZSGQTYQX-UFYCRDLUSA-N 0.000 description 1
- ARMNWLJYHCOSHE-KKUMJFAQSA-N Tyr-Pro-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O ARMNWLJYHCOSHE-KKUMJFAQSA-N 0.000 description 1
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 1
- 101710117021 Tyrosine-protein phosphatase YopH Proteins 0.000 description 1
- 102000036382 U-box-type E3 ubiquitin tranferases Human genes 0.000 description 1
- 108091007057 U-box-type E3 ubiquitin tranferases Proteins 0.000 description 1
- 102100038532 Ubiquitin conjugation factor E4 A Human genes 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- 101150117115 V gene Proteins 0.000 description 1
- 102000006108 VHL Human genes 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 1
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 1
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- IWZYXFRGWKEKBJ-GVXVVHGQSA-N Val-Gln-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N IWZYXFRGWKEKBJ-GVXVVHGQSA-N 0.000 description 1
- AGKDVLSDNSTLFA-UMNHJUIQSA-N Val-Gln-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N AGKDVLSDNSTLFA-UMNHJUIQSA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 1
- PYXQBKJPHNCTNW-CYDGBPFRSA-N Val-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N PYXQBKJPHNCTNW-CYDGBPFRSA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- OJPRSVJGNCAKQX-SRVKXCTJSA-N Val-Met-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OJPRSVJGNCAKQX-SRVKXCTJSA-N 0.000 description 1
- WSUWDIVCPOJFCX-TUAOUCFPSA-N Val-Met-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N WSUWDIVCPOJFCX-TUAOUCFPSA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 1
- TVGWMCTYUFBXAP-QTKMDUPCSA-N Val-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N)O TVGWMCTYUFBXAP-QTKMDUPCSA-N 0.000 description 1
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 1
- OWFGFHQMSBTKLX-UFYCRDLUSA-N Val-Tyr-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N OWFGFHQMSBTKLX-UFYCRDLUSA-N 0.000 description 1
- 238000005411 Van der Waals force Methods 0.000 description 1
- 101150046474 Vhl gene Proteins 0.000 description 1
- 102100027553 WD repeat, SAM and U-box domain-containing protein 1 Human genes 0.000 description 1
- 239000003875 Wang resin Substances 0.000 description 1
- 238000002441 X-ray diffraction Methods 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- NERFNHBZJXXFGY-UHFFFAOYSA-N [4-[(4-methylphenyl)methoxy]phenyl]methanol Chemical compound C1=CC(C)=CC=C1COC1=CC=C(CO)C=C1 NERFNHBZJXXFGY-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 238000011360 adjunctive therapy Methods 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 125000004450 alkenylene group Chemical group 0.000 description 1
- 125000002947 alkylene group Chemical group 0.000 description 1
- 125000004419 alkynylene group Chemical group 0.000 description 1
- 108090000185 alpha-Synuclein Proteins 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 150000001408 amides Chemical group 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 229920003180 amino resin Polymers 0.000 description 1
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 1
- 230000037005 anaesthesia Effects 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 125000000129 anionic group Chemical group 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 230000000843 anti-fungal effect Effects 0.000 description 1
- 210000000628 antibody-producing cell Anatomy 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- 102000025171 antigen binding proteins Human genes 0.000 description 1
- 108091000831 antigen binding proteins Proteins 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010066119 arginyl-leucyl-aspartyl-serine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 238000002820 assay format Methods 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 238000012984 biological imaging Methods 0.000 description 1
- 230000009141 biological interaction Effects 0.000 description 1
- 239000011616 biotin Chemical group 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 210000000621 bronchi Anatomy 0.000 description 1
- 239000001273 butane Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- UHBYWPGGCSDKFX-UHFFFAOYSA-N carboxyglutamic acid Chemical compound OC(=O)C(N)CC(C(O)=O)C(O)=O UHBYWPGGCSDKFX-UHFFFAOYSA-N 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 210000005056 cell body Anatomy 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000006727 cell loss Effects 0.000 description 1
- 239000008004 cell lysis buffer Substances 0.000 description 1
- 230000006800 cellular catabolic process Effects 0.000 description 1
- 230000008614 cellular interaction Effects 0.000 description 1
- 230000005754 cellular signaling Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 229920002301 cellulose acetate Polymers 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000012707 chemical precursor Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 229940110456 cocoa butter Drugs 0.000 description 1
- 235000019868 cocoa butter Nutrition 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000002153 concerted effect Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 235000005687 corn oil Nutrition 0.000 description 1
- 239000002285 corn oil Substances 0.000 description 1
- 235000012343 cottonseed oil Nutrition 0.000 description 1
- 239000002385 cottonseed oil Substances 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 239000001064 degrader Substances 0.000 description 1
- 210000004443 dendritic cell Anatomy 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- NEFBYIFKOOEVPA-UHFFFAOYSA-K dicalcium phosphate Chemical compound [Ca+2].[Ca+2].[O-]P([O-])([O-])=O NEFBYIFKOOEVPA-UHFFFAOYSA-K 0.000 description 1
- 229910000390 dicalcium phosphate Inorganic materials 0.000 description 1
- 229940038472 dicalcium phosphate Drugs 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000000378 dietary effect Effects 0.000 description 1
- 238000002349 difference gel electrophoresis Methods 0.000 description 1
- 238000000113 differential scanning calorimetry Methods 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 229960003722 doxycycline Drugs 0.000 description 1
- XQTWDDCIUJNLTR-CVHRZJFOSA-N doxycycline monohydrate Chemical compound O.O=C1C2=C(O)C=CC=C2[C@H](C)[C@@H]2C1=C(O)[C@]1(O)C(=O)C(C(N)=O)=C(O)[C@@H](N(C)C)[C@@H]1[C@H]2O XQTWDDCIUJNLTR-CVHRZJFOSA-N 0.000 description 1
- 229940000406 drug candidate Drugs 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 239000003596 drug target Substances 0.000 description 1
- 238000002651 drug therapy Methods 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 125000003500 enol ether group Chemical group 0.000 description 1
- 239000006167 equilibration buffer Substances 0.000 description 1
- 235000019325 ethyl cellulose Nutrition 0.000 description 1
- 229920001249 ethyl cellulose Polymers 0.000 description 1
- LVGKNOAMLMIIKO-QXMHVHEDSA-N ethyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC LVGKNOAMLMIIKO-QXMHVHEDSA-N 0.000 description 1
- 229940093471 ethyl oleate Drugs 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 125000004030 farnesyl group Chemical group [H]C([*])([H])C([H])=C(C([H])([H])[H])C([H])([H])C([H])([H])C([H])=C(C([H])([H])[H])C([H])([H])C([H])([H])C([H])=C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 239000010685 fatty oil Substances 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 150000002211 flavins Chemical group 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 238000002376 fluorescence recovery after photobleaching Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000019253 formic acid Nutrition 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 108010062699 gamma-Glutamyl Hydrolase Proteins 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 108091005896 globular proteins Proteins 0.000 description 1
- 102000034238 globular proteins Human genes 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 150000002337 glycosamines Chemical group 0.000 description 1
- 229930004094 glycosylphosphatidylinositol Natural products 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 1
- 239000007887 hard shell capsule Substances 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 230000005745 host immune response Effects 0.000 description 1
- 102000053230 human STUB1 Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 244000052637 human pathogen Species 0.000 description 1
- 150000007857 hydrazones Chemical class 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 229960000890 hydrocortisone Drugs 0.000 description 1
- 239000000017 hydrogel Substances 0.000 description 1
- 125000004435 hydrogen atom Chemical class [H]* 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 239000001863 hydroxypropyl cellulose Substances 0.000 description 1
- 235000010977 hydroxypropyl cellulose Nutrition 0.000 description 1
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 1
- 229940097277 hygromycin b Drugs 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 150000002466 imines Chemical class 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 210000001822 immobilized cell Anatomy 0.000 description 1
- 230000016178 immune complex formation Effects 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 230000007813 immunodeficiency Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 239000012133 immunoprecipitate Substances 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 238000012744 immunostaining Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000099 in vitro assay Methods 0.000 description 1
- 238000005462 in vivo assay Methods 0.000 description 1
- 238000011503 in vivo imaging Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000003701 inert diluent Substances 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000015788 innate immune response Effects 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 239000001282 iso-butane Substances 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 1
- 108010087810 leucyl-seryl-glutamyl-leucine Proteins 0.000 description 1
- 150000002632 lipids Chemical group 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 230000001926 lymphatic effect Effects 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 230000002101 lytic effect Effects 0.000 description 1
- VTHJTEIRLNZDEV-UHFFFAOYSA-L magnesium dihydroxide Chemical compound [OH-].[OH-].[Mg+2] VTHJTEIRLNZDEV-UHFFFAOYSA-L 0.000 description 1
- 239000000347 magnesium hydroxide Substances 0.000 description 1
- 229910001862 magnesium hydroxide Inorganic materials 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- HZVOZRGWRWCICA-UHFFFAOYSA-N methanediyl Chemical compound [CH2] HZVOZRGWRWCICA-UHFFFAOYSA-N 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- LSDPWZHWYPCBBB-UHFFFAOYSA-O methylsulfide anion Chemical compound [SH2+]C LSDPWZHWYPCBBB-UHFFFAOYSA-O 0.000 description 1
- 244000000010 microbial pathogen Species 0.000 description 1
- 238000007431 microscopic evaluation Methods 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 239000002480 mineral oil Substances 0.000 description 1
- 235000010446 mineral oil Nutrition 0.000 description 1
- 108091005601 modified peptides Chemical group 0.000 description 1
- 239000002062 molecular scaffold Substances 0.000 description 1
- 230000004660 morphological change Effects 0.000 description 1
- 210000004877 mucosa Anatomy 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 208000029744 multiple organ dysfunction syndrome Diseases 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- IJDNQMDRQITEOD-UHFFFAOYSA-N n-butane Chemical compound CCCC IJDNQMDRQITEOD-UHFFFAOYSA-N 0.000 description 1
- OFBQJSOFQDEBGM-UHFFFAOYSA-N n-pentane Natural products CCCCC OFBQJSOFQDEBGM-UHFFFAOYSA-N 0.000 description 1
- 239000006199 nebulizer Substances 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 238000007857 nested PCR Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 1
- 230000036963 noncompetitive effect Effects 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 230000006849 nucleocytoplasmic transport Effects 0.000 description 1
- 230000000269 nucleophilic effect Effects 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 239000004006 olive oil Substances 0.000 description 1
- 235000008390 olive oil Nutrition 0.000 description 1
- 231100000590 oncogenic Toxicity 0.000 description 1
- 230000002246 oncogenic effect Effects 0.000 description 1
- 238000011275 oncology therapy Methods 0.000 description 1
- 150000002923 oximes Chemical class 0.000 description 1
- 125000000636 p-nitrophenyl group Chemical group [H]C1=C([H])C(=C([H])C([H])=C1*)[N+]([O-])=O 0.000 description 1
- 229920002866 paraformaldehyde Polymers 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 229950005564 patisiran Drugs 0.000 description 1
- 108010087558 pectate lyase Proteins 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 239000002304 perfume Substances 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 239000002831 pharmacologic agent Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 244000000003 plant pathogen Species 0.000 description 1
- 229920000729 poly(L-lysine) polymer Polymers 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 1
- 230000006555 post-translational control Effects 0.000 description 1
- 230000013823 prenylation Effects 0.000 description 1
- 230000002335 preservative effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 239000001294 propane Substances 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 238000003498 protein array Methods 0.000 description 1
- 238000000159 protein binding assay Methods 0.000 description 1
- 238000000734 protein sequencing Methods 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- 238000000425 proton nuclear magnetic resonance spectrum Methods 0.000 description 1
- 230000005588 protonation Effects 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 102000027426 receptor tyrosine kinases Human genes 0.000 description 1
- 108091008598 receptor tyrosine kinases Proteins 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 239000004627 regenerated cellulose Substances 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 206010039073 rheumatoid arthritis Diseases 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- CVHZOJJKTDOEJC-UHFFFAOYSA-N saccharin Chemical compound C1=CC=C2C(=O)NS(=O)(=O)C2=C1 CVHZOJJKTDOEJC-UHFFFAOYSA-N 0.000 description 1
- 229940081974 saccharin Drugs 0.000 description 1
- 235000019204 saccharin Nutrition 0.000 description 1
- 239000000901 saccharin and its Na,K and Ca salt Substances 0.000 description 1
- 235000005713 safflower oil Nutrition 0.000 description 1
- 239000003813 safflower oil Substances 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000004626 scanning electron microscopy Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000012106 screening analysis Methods 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000002805 secondary assay Methods 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 150000007659 semicarbazones Chemical class 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000036303 septic shock Effects 0.000 description 1
- 238000013207 serial dilution Methods 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 239000008159 sesame oil Substances 0.000 description 1
- 235000011803 sesame oil Nutrition 0.000 description 1
- 201000005113 shigellosis Diseases 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 1
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 1
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 1
- 239000007886 soft shell capsule Substances 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 210000004989 spleen cell Anatomy 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 230000010473 stable expression Effects 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 239000007929 subcutaneous injection Substances 0.000 description 1
- 238000010254 subcutaneous injection Methods 0.000 description 1
- JJAHTWIKCUJRDK-UHFFFAOYSA-N succinimidyl 4-(N-maleimidomethyl)cyclohexane-1-carboxylate Chemical compound C1CC(CN2C(C=CC2=O)=O)CCC1C(=O)ON1C(=O)CCC1=O JJAHTWIKCUJRDK-UHFFFAOYSA-N 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 235000011149 sulphuric acid Nutrition 0.000 description 1
- 239000000829 suppository Substances 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 238000000756 surface-enhanced laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 1
- 230000004654 survival pathway Effects 0.000 description 1
- 239000006188 syrup Substances 0.000 description 1
- 235000020357 syrup Nutrition 0.000 description 1
- 238000007910 systemic administration Methods 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 239000000454 talc Substances 0.000 description 1
- 229910052623 talc Inorganic materials 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- FAGUFWYHJQFNRV-UHFFFAOYSA-N tetraethylenepentamine Chemical compound NCCNCCNCCNCCN FAGUFWYHJQFNRV-UHFFFAOYSA-N 0.000 description 1
- 229940124598 therapeutic candidate Drugs 0.000 description 1
- 231100001274 therapeutic index Toxicity 0.000 description 1
- 238000011285 therapeutic regimen Methods 0.000 description 1
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 230000008733 trauma Effects 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- 125000002221 trityl group Chemical group [H]C1=C([H])C([H])=C([H])C([H])=C1C([*])(C1=C(C(=C(C(=C1[H])[H])[H])[H])[H])C1=C([H])C([H])=C([H])C([H])=C1[H] 0.000 description 1
- 230000001228 trophic effect Effects 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 238000010396 two-hybrid screening Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 1
- 108010077037 tyrosyl-tyrosyl-phenylalanine Proteins 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
- 238000001086 yeast two-hybrid system Methods 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K45/00—Medicinal preparations containing active ingredients not provided for in groups A61K31/00 - A61K41/00
- A61K45/06—Mixtures of active ingredients without chemical characterisation, e.g. antiphlogistics and cardiaca
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/104—Aminoacyltransferases (2.3.2)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
- C07K16/28—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
- C07K16/2863—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against receptors for growth factors, growth regulators
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/34—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving hydrolase
- C12Q1/37—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving hydrolase involving peptidase or proteinase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/48—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving transferase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/02—Aminoacyltransferases (2.3.2)
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/5005—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/46—Hybrid immunoglobulins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/50—Immunoglobulins specific features characterized by immunoglobulin fragments
- C07K2317/56—Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
- C07K2317/569—Single domain, e.g. dAb, sdAb, VHH, VNAR or nanobody®
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2318/00—Antibody mimetics or scaffolds
- C07K2318/20—Antigen-binding scaffold molecules wherein the scaffold is not an immunoglobulin variable region or antibody mimetics
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/95—Fusion polypeptide containing a motif/fusion for degradation (ubiquitin fusions, PEST sequence)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Abstract
【課題】目的となる標的に結合するタンパク質に遺伝子融合される、新規のE3ユビキチンリガーゼモチーフを提供する。【解決手段】本願は、E3ユビキチンリガーゼ(E3)モチーフを含む分解ドメインと、該分解ドメインを基質へと特異的に方向付けることができる標的指向ドメインとを含む単離されたキメラ分子に関し、ここで、標的指向ドメインは、分解ドメインに対して異種である。リンカーは、分解ドメインを標的指向ドメインに結合させる。また、組成物、ならびに疾患を治療する方法、基質サイレンシングの方法、疾患に対する治療有効性について薬剤をスクリーニングする方法、および疾患バイオマーカーについてスクリーニングする方法も開示される。【選択図】なし
Description
本願は、2018年3月16日に出願された米国仮特許出願第62/644,055号の優先権の利益を主張し、これは参照によりその全体が本明細書に組み込まれる。
分野
本願は、概して、操作された細菌ユビキチンリガーゼ模倣物を用いる、幅広い範囲にわたるプロテオーム編集に関する。
本願は、概して、操作された細菌ユビキチンリガーゼ模倣物を用いる、幅広い範囲にわたるプロテオーム編集に関する。
背景
タンパク質機能は、従来、タンパク質をコードする標的遺伝子の発現を破壊すること、および得られた表現型の結果を分析することによって調べられてきた。そのような機能喪失実験は、現在、アンチセンスオリゴヌクレオチド(「ASO」)、RNA干渉(「RNAi」)、亜鉛フィンガーヌクレアーゼ(「ZFN」)、転写活性化因子様エフェクターヌクレアーゼ(「TALEN」)、およびクラスター化された、規則的に間隔をあけた、短い回文反復(「CRISPR」)-Cas系等の遺伝子サイレンシングおよびゲノム編集技術を使用して、日常的に実施されている。McManus et al.,“Gene Silencing in Mammals by Small Interfering RNAs,”Nat.Rev.Genet.3(10):737-47(2002);Deleavey et al.,“Designing Chemically Modified Oligonucleotides for Targeted Gene Silencing,”Chemistry&Biology 19(8):937-54(2012);Boettcher et al.,“Choosing the Right Tool for the Job:RNAi,TALEN,or CRISPR,”Mol.Cell 58(4):575-85(2015);and Gaj et al.,“TALEN,and CRISPR/Cas-Based Methods for Genome Engineering,”Trends Biotechnol.31(7):397-405(2013)。これらの方法は、基礎研究において広く使用され、遺伝的障害を治療するために有望なものである。Gaj et al.,“TALEN,and CRISPR/Cas-Based Methods for Genome Engineering,”Trends Biotechnol.31(7):397-405(2013);Cox et al.,“Therapeutic Genome Editing:Prospects and Challenges,”Nat.Med.21(2):121-31(2015);Soutschek et al.,“Therapeutic Silencing of an Endogenous Gene by Systemic Administration of Modified siRNAs,”Nature 432(7014)173-78(2004);Bumcrot et al.,“RNAi Therapeutics:A Potential New Class of Pharmaceutical Drugs,”Nat.Chem.Biol.2(12):711-19(2006);and Wang et al.,“Non-Viral Delivery of Genome-Editing Nucleases for Gene Therapy,”Gene Ther.24(3):144-50(2017)。しかし、時間的制御の欠如、予測不可能なオフターゲット効果、ゲノム編集の場合において必須遺伝子を除去することが不可能であること、およびそのようなノックアウトの不可逆的な性質、ならびに遺伝子サイレンシングの場合には細胞内に既に存在するタンパク質のレベルを低下させることが不可能であり、それによって安定した長寿命のタンパク質は影響されないままであることを含む、いくつかの課題が残っている。
タンパク質機能は、従来、タンパク質をコードする標的遺伝子の発現を破壊すること、および得られた表現型の結果を分析することによって調べられてきた。そのような機能喪失実験は、現在、アンチセンスオリゴヌクレオチド(「ASO」)、RNA干渉(「RNAi」)、亜鉛フィンガーヌクレアーゼ(「ZFN」)、転写活性化因子様エフェクターヌクレアーゼ(「TALEN」)、およびクラスター化された、規則的に間隔をあけた、短い回文反復(「CRISPR」)-Cas系等の遺伝子サイレンシングおよびゲノム編集技術を使用して、日常的に実施されている。McManus et al.,“Gene Silencing in Mammals by Small Interfering RNAs,”Nat.Rev.Genet.3(10):737-47(2002);Deleavey et al.,“Designing Chemically Modified Oligonucleotides for Targeted Gene Silencing,”Chemistry&Biology 19(8):937-54(2012);Boettcher et al.,“Choosing the Right Tool for the Job:RNAi,TALEN,or CRISPR,”Mol.Cell 58(4):575-85(2015);and Gaj et al.,“TALEN,and CRISPR/Cas-Based Methods for Genome Engineering,”Trends Biotechnol.31(7):397-405(2013)。これらの方法は、基礎研究において広く使用され、遺伝的障害を治療するために有望なものである。Gaj et al.,“TALEN,and CRISPR/Cas-Based Methods for Genome Engineering,”Trends Biotechnol.31(7):397-405(2013);Cox et al.,“Therapeutic Genome Editing:Prospects and Challenges,”Nat.Med.21(2):121-31(2015);Soutschek et al.,“Therapeutic Silencing of an Endogenous Gene by Systemic Administration of Modified siRNAs,”Nature 432(7014)173-78(2004);Bumcrot et al.,“RNAi Therapeutics:A Potential New Class of Pharmaceutical Drugs,”Nat.Chem.Biol.2(12):711-19(2006);and Wang et al.,“Non-Viral Delivery of Genome-Editing Nucleases for Gene Therapy,”Gene Ther.24(3):144-50(2017)。しかし、時間的制御の欠如、予測不可能なオフターゲット効果、ゲノム編集の場合において必須遺伝子を除去することが不可能であること、およびそのようなノックアウトの不可逆的な性質、ならびに遺伝子サイレンシングの場合には細胞内に既に存在するタンパク質のレベルを低下させることが不可能であり、それによって安定した長寿命のタンパク質は影響されないままであることを含む、いくつかの課題が残っている。
プロテオーム編集技術は、翻訳後レベルで作動する、タンパク質機能を研究するための直交的アプローチを表し、DNAまたはRNAを標的とし、翻訳後精度を有する方法よりも高い分解能で複雑なタンパク質機能を詳細に分析する潜在能力がある。最も顕著な方法の1つは、「分解による阻害」を伴い、それによって、細胞ユビキチン-プロテアソーム経路(「UPP」)の機構は、目的となるタンパク質を特異的に分解するためにハイジャックされる。古典的ユビキチン化カスケードは、3つの酵素-ユビキチン活性化酵素(E1)、ユビキチン結合酵素(E2)、およびユビキチンリガーゼ(E3)の活性を必要とし、これらは、エネルギー依存的な様式で、リジン残基へのポリユビキチン鎖の共有結合を通じて、分解のためにタンパク質に順次タグ付けするように作用する。
E3は、UPPにおいて最も不均一なクラスの酵素であり(ヒトにおいて>600種のE3が存在する)、特徴的ドメインの存在および基質タンパク質へのユビキチン転移の機構に依存して、HECT(E6AP C末端と相同である)、RING(実に興味深い新しい遺伝子)、およびRBR(RING-between-RING)として分類され得る。Buetow et al.,“Structural Insights into the Catalysis and Regulation of E3 Ubiquitin Ligases,”Nat.Rev.Mol.Cell Biol.17(10):626-42(2016)。それらが基質特異性を媒介し、一般に顕著な柔軟性を示すため、E3ユビキチンリガーゼは、これまでに記載されたプロテオーム編集戦略において最も頻繁に利用される成分である。例えば、化学的ノックダウンは、タンパク質分解標的指向キメラ、すなわちPROTACと呼ばれる小分子を使用して達成されており(Neklesa et al.,“Targeted Protein Degradation by PROTACs,”Pharmacol.Ther.17:4138-144(2017)およびDeshaies,R.J.,“Protein Degradation:(Neklesa et al.,“Targeted Protein Degradation by PROTACs,”Pharmacol.Biol.11(9):634-35(2015))、これらは、E3ユビキチンリガーゼのための1つのリガンド、分解されるタンパク質のための別のリガンド、および2つを接続するリンカーを含有するヘテロ二官能性分子である。これらの分子は、E3および標的の両方に結合し、標的ポリユビキチン化、続いてそのプロテアソーム分解を誘発する三元複合体の形成を促進する。細胞およびマウスにおいて化学的ノックアウトを可能にするペプチドベースおよび小分子ベースのPROTACが多数報告されている。Schneekloth et al.,“Chemical Genetic Control of Protein Levels:Selective In Vivo Targeted Degradation,”J.Am.Chem.Soc.126(12):3748-54(2004);Hines et al.,“Posttranslational Protein Knockdown Coupled to Receptor Tyrosine Kinase Activation with PhosphoPROTACs,”Proc.Natl.Acad.Sci.USA 110(22):8942-47(2013);Schneekloth et al.,“Targeted Intracellular Protein Degradation Induced by a Small Molecule:En Route to Chemical Proteomics,”Bioorganic Med.Chem.Lett.18(22):5904-08(2008);Bondeson et al.,“Catalytic In Vivo Protein Knockdown by Small-Molecule PROTACs,”Nat.Chem.Biol.11(8):611-17(2015)、およびSakamoto et al.,“Protacs:Chimeric Molecules that Target Proteins to the Skp1-Cullin-F Box Complex for Ubiquitination and Degradation,”Proc.Natl.Acad.Sci.USA 98(15):8554-59(2001)。これらの化合物の魅力的な特徴は、細胞透過性を含む薬物様特性であるが、多くのペプチドおよび小分子ベースのPROTACは、十分な分解を誘導するためにしばしば最大25μMの濃度を必要とする、低い有効性に悩まされており(Buckley et al.,“Small-Molecule Control of Intracellular Protein Levels Through Modulation of the Ubiquitin Proteasome System,”Angew Chem.Int.Ed.Engl.53(9):2312-30(2014))、カスタムPROTACの生成は、E3ユビキチンリガーゼと所望のタンパク質標的の両方について利用可能なリガンドの相対的な欠如によって、ならびに、このようなリガンドを新たに作製することに関連する技術的課題によって制限されている(Osherovich,L.,“Degradation From Within,”Science-Business Exchange 7:10-11(2014))。
これらの問題を回避するために、タンパク質ベースのキメラが開発され、ここでは、E3ユビキチンリガーゼは、目的となる標的に結合するタンパク質に遺伝子融合される。細胞内での異所性発現の後、操作されたタンパク質キメラは、E3を標的タンパク質に動員し、そのポリユビキチン化およびその後のプロテアソームによる分解をもたらす。最も初期の例では、タンパク質ノックアウトは、網膜芽細胞腫タンパク質pRBと相互作用することが知られているヒトパピローマウイルス16型によってコードされるE7タンパク質に由来するペプチドに、β-TrCPが融合された、Fボックスキメラを作製することによって達成された(Zhou et al.,“Harnessing the Ubiquitination Machinery to Target the Degradation of Specific Cellular Proteins,”Mol.Cell 6(3):751-56(2000)and Zhang et al.,“Exploring the Functional Complexity of Cellular Proteins by Protein Knockout,”Proc.Natl.Acad.Sci.USA 100(24):14127-32(2003))。異所性発現後、操作されたFボックスは、ユビキチン化および破壊のために、cullin-RINGリガーゼ(「CRL」)スーパーファミリーからの多タンパク質E3複合体であるSkp1-Cul1-Fボックス(「SCF」)機構にpRBを動員した。少数の他の研究は、同様に天然タンパク質-タンパク質相互作用を活用しており、それにより、1つの相互作用タンパク質をE3に融合させることにより、細胞およびマウスにおける発現後に対応する結合パートナーをサイレンシングするキメラを産生した。Hatakeyama et al.,“Targeted Destruction of C-Myc by an Engineered Ubiquitin Ligase Suppresses Cell Transformation and Tumor Formation,”Cancer Res.65(17):7874-79(2005);Ma et al.,“Targeted Degradation of KRAS by an Engineered Ubiquitin Ligase Suppresses Pancreatic Cancer Cell Growth In Vitro and In Vivo,”Mol.Cancer Ther.12(3):286-94(2013);and Kong et al.,“Engineering a Single Ubiquitin Ligase for the Selective Degradation of all Activated ErbB Receptor Tyrosine Kinases,”Oncogene 33(8):986-95(2014)。
より最近、ユニバーサルプロテオーム編集技術が、天然に存在する結合パートナーを超えて拡張され得ることが示された。このアプローチは、E3を、一本鎖抗体フラグメント(「scFv」)、設計されたアンキリン反復タンパク質(「DARPin」)、またはフィブロネクチンIII型(「FN3」)モノボディ等の合成結合タンパク質に融合することを伴った。Portnoff et al.,“Ubiquibodies,Synthetic E3 Ubiquitin Ligases Endowed With Unnatural Substrate Specificity for Targeted Protein Silencing,”J.Biol.Chem.289(11):7844-55(2014)。「ユビキボディ」(「uAb」)と呼ばれるこれらの二官能性キメラは、ヒトRING/Uボックス型E3-CHIP(Hsc70相互作用タンパク質のカルボキシル末端)のフレキシブルなユビキチンタグ付け能力を、合成結合タンパク質の操作可能な親和性および特異性と組み合わせた。結果は、生物学的機能または相互作用に依存しない分解のために、そうでなければ安定しているタンパク質をUPPへと効率的に方向付けるための、カスタマイズ可能な技術である。確かに、uAbの最大の利点の1つは、それらの高度なモジュラー構造であり、単に合成結合タンパク質を交換することによって、異なる基質タンパク質を特異的に標的とする新しいuAbを生成することができ(Caussinus et al.,“Fluorescent Fusion Protein Knockout Mediated by Anti-GFP Nanobody,”Nat.Struct.Mol.Biol.19(1):117-21(2011);Fulcher et al.,“Targeting Endogenous Proteins For Degradation Through the Affinity-Directed Protein Missile System,”Open Biol.7(5):170066(2017);Fulcher et al.,“An Affinity-Directed Protein Missile System for Targeted Proteolysis,”Open Biol 6(10):160255(2016);Shin et al.,“Nanobody-Targeted E3-Ubiquitin Ligase Complex Degrades Nuclear Proteins,”Sci.Rep.5:14269(2015);およびKanner et al.,“Sculpting Ion Channel Functional Expression with Engineered Ubiquitin Ligases,”Elife 6:e29744(2017))、一方、E3ドメインを交換することで、ユビキチン転移の動態または機構を変更することができる。さらに、特定のタンパク質状態(例えば、活性コンフォメーション対不活性コンフォメーション、変異体対野生型、翻訳後修飾)を認識する合成結合タンパク質を組み込むことによって、他のタンパク質を残しながら、特定のタンパク質亜集団を枯渇させることが可能になる。Zhang et al.,“Exploring the Functional Complexity of Cellular Proteins by Protein Knockout,”Proc.Natl.Acad.Sci.USA 100(24):14127-32(2003)およびBaltz et al.,“ Design and Functional Characterization of Synthetic E3 Ubiquitin Ligases for Targeted Protein Depletion,”Curr.Prot.Chem.Biol.10(1):72-90(2018)。しかし、現在、uAbの開発は、比較的限られたセットの哺乳動物E3、最も顕著には、多タンパク質E3リガーゼ複合体の「単独」E3 CHIPまたはCRLスーパーファミリーのメンバーを中心としている。
本願は、タンパク質ベースのキメラにおける専門知識を統合し、それによって、新規のE3ユビキチンリガーゼモチーフは、上記の課題に対処しかつ当該技術分野におけるこれらおよび他の欠陥を克服すべく、目的となる標的に結合するタンパク質に遺伝子融合される。
概要
本願の第1の態様は、単離されたキメラ分子に関する。単離されたキメラ分子は、E3ユビキチンリガーゼ(E3)モチーフを含む分解ドメインと、上記分解ドメインを基質へと特異的に方向付けることができる標的指向ドメインであって、上記分解ドメインに対して異種である、標的指向ドメインと、上記分解ドメインを上記標的指向ドメインに結合させるリンカーとを含む。
本願の第1の態様は、単離されたキメラ分子に関する。単離されたキメラ分子は、E3ユビキチンリガーゼ(E3)モチーフを含む分解ドメインと、上記分解ドメインを基質へと特異的に方向付けることができる標的指向ドメインであって、上記分解ドメインに対して異種である、標的指向ドメインと、上記分解ドメインを上記標的指向ドメインに結合させるリンカーとを含む。
本願の第2の態様は、リボヌクレオタンパク質を形成する方法に関する。本方法は、本明細書に記載の単離されたキメラ分子をコードするmRNAを提供することと、1つ以上のポリアデノシン結合タンパク質(「PABP」)を提供することと、上記mRNAおよび上記1つ以上のPABPからリボヌクレオタンパク質複合体をアセンブルすることとを含む。
本願の第3の態様は、本明細書に記載されるキメラ分子と、薬学的に許容される担体とを含む組成物に関する。
本願の第4の態様は、疾患を治療する方法に関する。本方法は、疾患を有する対象を選択することと、本明細書に記載の組成物を上記対象に投与して、上記対象に、疾患に罹患していない対象と比較して、基質の増加した発現レベルを与えることとを含む。
本願の第5の態様は、基質サイレンシングのための方法に関する。本方法は、サイレンシングさせる基質を選択することと、本明細書に記載のキメラ分子を提供することと、基質-分子複合体の形成を可能にするのに有効な条件下で上記基質をキメラ分子と接触させることとを含み、上記複合体は、サイレンシングさせる基質の分解を媒介する。
本願の第6の態様は、疾患に対する治療有効性について薬剤をスクリーニングする方法に関する。本方法は、その存在が疾患状態を媒介する生体分子を提供することと、(i)E3ユビキチンリガーゼ(E3)モチーフを含む分解ドメインと、(ii)上記分解ドメインを生体分子へと特異的に方向付けることができる標的指向ドメインであって、上記分解ドメインに対して異種である、標的指向ドメインと、(iii)上記分解ドメインを上記標的指向ドメインに結合させるリンカーとを含む試験剤を提供することと、試験剤が生体分子の分解を促進するのに有効な条件下で、生体分子を試験剤と接触させることと、接触の結果としての生体分子のレベルを決定することと、決定に基づいて、生体分子のレベルを低下させる試験剤を、疾患に対する治療有効性の候補であるとして同定することとを含む。
本願の第7の態様は、疾患バイオマーカーについてスクリーニングする方法に関する。本方法は、1つ以上のリガンドを発現する疾患細胞の試料を提供することと、(i)E3ユビキチンリガーゼ(E3)モチーフを含む分解ドメインと、(ii)上記分解ドメインを1つ以上のリガンドへと特異的に方向付けることができる標的指向ドメインであって、上記分解ドメインに対して異種である、標的指向ドメインと、(iii)上記分解ドメインを上記標的指向ドメインに結合させるリンカーとを含む複数のキメラ分子を提供することと、上記疾患細胞がキメラ分子の非存在下で増殖することに失敗するのに有効な条件下で、上記試料を複数のキメラ分子と接触させることと、上記キメラ分子のうちのどれが上記疾患細胞の増殖を可能にするかを決定することと、決定に基づいて、上記キメラ分子に結合しかつ上記疾患細胞の増殖を可能にするリガンドを、上記疾患のバイオマーカーとして同定することとを含む。
細胞タンパク質の標的サイレンシングを達成するためのユビキチンプロテアソーム経路の操作は、哺乳動物プロテオームを再構築するための信頼性が高くかつカスタマイズ可能な戦略として現れてきている。1つのこのようなアプローチは、E3ユビキチンリガーゼに融合した合成結合タンパク質から構成されるユビキボディと呼ばれる二官能性タンパク質を操作することを伴い、したがって、翻訳後のユビキチン化およびその機能に依存しない標的タンパク質の分解を可能にする。ここでは、目的となるタンパク質の選択的除去のために哺乳動物プロテアソーム分解機構と効果的に整合させることが可能な細菌病原体由来のE3ユビキチンリガーゼ模倣物に基づいて、新しいユビキボディのパネルを設計した。これらのうちの1つ、緑色蛍光タンパク質(GFP)を特異的に認識するフィブロネクチンIII型(FN3)モノボディに融合したシゲラ・フレックスネリ(Shigella flexneri)エフェクタータンパク質IpaH9.8は、GFPおよびそのスペクトル誘導体、ならびにサイズ(27~179kDa)および細胞下局在(細胞質、核、膜結合、および膜貫通)が変化した15種の異なるFPタグ付き哺乳動物タンパク質を強力に排除することが観察された。治療に関連するユビキボディの送達を実証するために、GFP特異的ユビキボディをコードする合成mRNAをポリA結合タンパク質と共アセンブルし、カチオン性アミン側基を保有する生体適合性の構造的に定義されたポリポリペプチドを使用してナノサイズの複合体にパッケージングする、バイオインスパイアード分子アセンブリ法が利用された。得られたナノプレックスは、GFPを安定的に発現する培養哺乳動物細胞、ならびにGFPを普遍的に発現するトランスジェニックマウスにおいて効率的な標的枯渇を引き起こす様式で、ユビキボディmRNAを送達した。全体として、ここで提示される結果は、IpaH9.8ベースのユビキボディが、疾患を引き起こすタンパク質を薬理学的に調節する可能性がある高度にモジュール化されたプロテオーム編集技術であることを示唆している。
したがって、本願は、キメラ分子、組成物、治療、医薬組成物、タンパク質サイレンシング技術、治療剤の解明、および新規クラスのキメラ分子に基づく標的スクリーニング技術に関する。本明細書で「ユビキボディ」と称されるこのようなキメラは、E3ユビキチン酵素のリガーゼ機能をインポートして、標的特異性を保有する分子を生成する。このような操作されたキメラは、さもなければプロテアソームに結合しないかもしれない特定の基質標的の再方向付けおよびタンパク質分解を容易にする。
この点において、このような特定の基質、例えば、細胞内タンパク質の、標的とされた排除は、広範な科学的および臨床的適応症を、本明細書に提供されるキメラ分子、組成物、治療、薬学的組成物、タンパク質サイレンシング技術、治療剤の解明、およびスクリーニング技術に帰属させる。したがって、本願は、ユビキチン化を介した、異常発現遺伝子のタンパク質分解に基づいて、特定の予後予測用途および治療用途を採用および開発するための様々な貴重なツールを付与する。
ここでは、二官能性uAbキメラとして機能的に再プログラムすることができるE3の範囲を広げることを追求した。しかし、哺乳動物E3を伴う以前の取り組みからの顕著な逸脱においては、代わりに、宿主E3ユビキチンリガーゼを模倣し、感染中に先天性免疫応答を減衰させるためにUPP機構をハイジャックする微生物病原体由来のエフェクタータンパク質のセットに焦点を当てた。Maculins et al.,“Bacteria-Host Relationship:Ubiquitin Ligases as Weapons of Invasion.Cell Res.26(4):499-510(2016)and Lin et al.,“Exploitation of the Host Cell Ubiquitin Machinery by Microbial Effector Proteins,”J.Cell Sci.130(12):1985-96(2017)、これらは、参照によりそれらの全体が本明細書に組み込まれる。これらの酵素の固有の柔軟性により、細菌性E3は、哺乳動物の対応物と同様に、標的タンパク質分解のために操作可能であるという仮説が生じた。実際に、堅牢な標的サイレンシングは、シゲラ・フレックスネリE3リガーゼIpaH9.8からなるuAbで達成され、これは、真核HECT型E3と類似性を示すが、任意の真核E3との配列および構造的相同性の非存在のために、新規のE3リガーゼ(「NEL」)として分類される。Maculins et al.,“Bacteria-Host Relationship:Ubiquitin Ligases as Weapons of Invasion.Cell Res.26(4):499-510(2016);Lin et al.,“Exploitation of the Host Cell Ubiquitin Machinery by Microbial Effector Proteins,”J.Cell Sci.130(12):1985-96(2017);Zhu et al.,“Structure of a Shigella Effector Reveals a New Class of Ubiquitin Ligases,”Nat.Struct.Mol.Biol.15(12):1302-08(2008);Singer et al.,“A Pathogen Type III Effector With a Novel E3 Ubiquitin Ligase Architecture,”PLoS Pathogens 9(1):e1003121(2013);and Rohde et al.,“Type III Secretion Effectors of the IpaH Family are E3 Ubiquitin Ligases,”Cell Host Microbe 1(1):77-83(2007)、これらは、それらの全体が参照により本明細書に組み込まれる。IpaH9.8のC末端触媒NELドメインが、緑色蛍光タンパク質(「GFP」)を特異的に認識するGFP特異的FN3モノボディGS2に融合されたとき、培養哺乳動物細胞における一過性発現および安定発現の両方の後のEGFPの強力な分解が観察された。さらに、GS2-IpaH9.8キメラはまた、エメラルド、ビーナス、およびセルリアンを含むEGFP、ならびにサイズが27~179kDaまでの範囲であり、細胞質、核、および細胞膜を含む異なる細胞下区画に局在する15種の異なるFPタグ付き哺乳動物タンパク質のスペクトル誘導体の分解を加速させることができた。これらの標的のうちの2つであるSHP2およびRasについて、IpaH9.8がSHP2特異的またはRas特異的FN3ドメインに融合されたときに、効率的なサイレンシングもまた達成され、これは、IpaHベースのuAbが再構成され得る容易さを強調する。
先に述べたように、uAbの治療的開発のための主要な障壁は、細胞内送達である。Osherovich,L.,“Degradation From Within,”Science-Business Exchange 7:10-11(2014)、これは、参照によりその全体が本明細書に組み込まれる。細胞透過性のために設計することができるより小さいPROTACとは異なり(Buckley et al.,“Small-Molecule Control of Intracellular Protein Levels Through Modulation of the Ubiquitin Proteasome System,”Angew Chem.Int.Ed.Engl.53(9):2312-30(2014)、これは、参照によりその全体が本明細書に組み込まれる)、uAbは、細胞膜を効果的に貫通しない比較的嵩高いタンパク質である。この問題を修正するために、バイオインスパイアードmRNA送達戦略を実施し、それによって、追加の3’末端ポリアデノシン(「ポリA」)テールを伴うGS2-IpaHをコードするmRNAは、mRNA安定性を改善しかつ真核細胞内でmRNA翻訳を刺激するように働くポリA結合タンパク質(「PABP」)と化学量論的に複合体化された(Li et al.,“Polyamine-Mediated Stoichiometric Assembly of Ribonucleoproteins for Enhanced mRNA Delivery,”Angew Chem.Int.Ed.Engl.56(44):13709-12(2017)、これは、参照によりその全体が本明細書に組み込まれる)。得られたリボヌクレオタンパク質(「RNP」)をカチオン性ポリペプチドで安定化して、mRNAを分解から保護し、細胞によるその取り込みを可能にし、そのエンドソームエスケープを促進した。重要なことに、これらの共アセンブルしたナノプレックスは、GFPを安定的に発現する培養哺乳動物細胞への導入後、およびGFPを普遍的に発現するトランスジェニックマウスへの投与後に効率的なGFPサイレンシングを引き起こす様式で、GS2-IpaH9.8mRNAを送達した。まとめると、本明細書に記載される結果は、uAb媒介性プロテオーム編集が、細胞およびマウスにおけるタンパク質の標的分解のための効果的な戦略であることを実証し、それによって、uAbのステージを、薬物発見のためのツールとして、およびいわゆる「新薬の開発につながらない(undruggable)」標的を薬理学的にヒットする可能性を有する治療候補として設定する。
詳細な説明
本発明の技術の実質的な理解を提供するために、本願の特定の態様、様式、バリエーションおよび特徴が様々な詳細なレベルで以下に記載されることが理解されるべきである。本明細書で使用される特定の用語の定義を以下に提供する。別段の定義されない限り、本明細書で使用される全ての技術用語および科学用語は、一般に、本願が属する分野の当業者によって一般的に理解される意味と同じ意味を有する。
本発明の技術の実質的な理解を提供するために、本願の特定の態様、様式、バリエーションおよび特徴が様々な詳細なレベルで以下に記載されることが理解されるべきである。本明細書で使用される特定の用語の定義を以下に提供する。別段の定義されない限り、本明細書で使用される全ての技術用語および科学用語は、一般に、本願が属する分野の当業者によって一般的に理解される意味と同じ意味を有する。
本願の主題を実施する際に、分子生物学、タンパク質生化学、細胞生物学、免疫学、微生物学、および組換えDNAにおける多くの従来の技法が使用される。これらの技術は周知であり、例えば、Current Protocols in Molecular Biology,Vols.I-III,Ausubel,Ed.(1997);Sambrook et al.,Molecular Cloning:A Laboratory Manual,Second Ed.(Cold Spring Harbor Laboratory Press,Cold Spring Harbor,New York(1989));DNA Cloning:A Practical Approach,Vols.I and II,Glover,Ed.(1985);Oligonucleotide Synthesis,Gait,Ed.(1984);Nucleic Acid Hybridization,Hames&Higgins,Eds.(1985);Transcription and Translation,Hames&Higgins,Eds.(1984);Animal Cell Culture,Freshney,Ed.(1986);Immobilized Cells and Enzymes(IRL Press,1986);Perbal,A Practical Guide to Molecular Cloning;the series,Meth.Enzymol.,(Academic Press,Inc.,1984)、Gene Transfer Vectors for Mammalian Cells,Miller&Calos,Eds.(Cold Spring Harbor Laboratory,New York(1987));and Meth.Enzymol.,Vols.154 and 155,Wu&Grossman,and Wu,Eds.において記載されており、これらのすべては、それぞれ、参照によりそれらの全体が本明細書に組み込まれる。ポリペプチド遺伝子発現産物のレベル、すなわち遺伝子翻訳レベルを検出および測定する方法は、当該技術分野において周知であり、抗体検出および定量化技術等のポリペプチド検出方法の使用を含む。Strachan&Read,Human Molecular Genetics,Second Edition.(John Wiley and Sons,Inc.,New York(1999)もまた参照のこと。これは、参照によりその全体が本明細書に組み込まれる。
本願の第1の態様は、単離されたキメラ分子に関する。単離されたキメラ分子は、E3ユビキチンリガーゼ(E3)モチーフを含む分解ドメインと、上記分解ドメインを基質へと特異的に方向付けることが可能な標的指向ドメインであって、上記分解ドメインに対して異種である、標的指向ドメインと、上記分解ドメインを上記標的指向ドメインに結合するリンカーとを含む。
本明細書で使用される場合、「キメラ分子」、「キメラポリペプチド」、および「キメラタンパク質」という用語は、第1のタンパク質またはポリペプチド配列の全長配列の少なくとも一部、ならびに第2のタンパク質またはポリペプチド配列の全長配列の少なくとも一部を含む配列を有する分子を包含し、ここで、第1および第2のタンパク質またはポリペプチドは、異なるタンパク質またはポリペプチドである。キメラ分子はまた、同じタンパク質またはポリペプチドに由来する2つ以上の非連続部分を含むタンパク質またはポリペプチドを包含する。キメラ分子はまた、少なくとも1つの置換を有するタンパク質またはポリペプチドも包含し、このキメラ分子は、第1のタンパク質またはポリペプチド配列の一部が第2のタンパク質またはポリペプチド配列の一部によって置換された第1のタンパク質またはポリペプチド配列を含む。本明細書で使用される場合、「キメラ分子」という用語は、本明細書で例示されるように、分解ドメインおよび標的領域を保有する分子をさらに指す。分解ドメインおよび標的領域は、当該技術分野で既知の方法で結合され得る。例えば、それらは、本明細書に例示されるリンカー分子を介して連結されてもよく、融合されてもよく、共有結合されてもよく、共有結合以外で結合されてもよい等である。さらに、分解ドメインおよび標的領域は、直接的に結合されていなくてもよく、および/または結合は一過性であってもよく、例えば、リンカーが使用される場合、リンカーは、切断可能であっても、切断不可能であってもよい。
本明細書で使用される場合、「ユビキチン化」という用語は、タンパク質ユビキチンの、他の分子のリジン残基への結合を指す。ペプチドまたはタンパク質等の分子のユビキチン化は、その急速な細胞分解、およびプロテアソーム複合体への標的指向化のためのシグナルとして作用し得る。
本明細書で使用される場合、「ユビキボディ」および「キメラ分子」という用語は、互換的に使用され、本明細書に例示されるように、リンカー領域によって連結された、少なくとも分解ドメインおよび標的領域を有する分子を指す。
本明細書で使用される場合、「標的ドメイン」または「標的指向ドメイン」または「標的指向部分」という用語は、キメラ分子内の第2の領域に共有結合したかまたは共有結合以外で結合したポリペプチド領域を意味し、これは、周囲の位置、細胞、および/または組織と比較して、標的の細胞下位置、細胞、または組織におけるキメラ分子または組成物の濃度を増強させる。
したがって、本願のキメラ分子は、基質結合のためにアクセス可能である、標的指向ドメインに結合した新規のE3リガーゼモチーフ(本明細書では、例えば、「E3リガーゼ(EL)」として参照される)ユビキチン領域を保有する。いくつかの実施形態において、基質は細胞内基質である。しかし、汎用性を容易にするために、標的指向ドメインは、モノボディ(例えば、フィブロネクチンIII型ドメイン(「FN3」))、抗体、ポリクローナル抗体、モノクローナル抗体、組換え抗体、抗体フラグメント、Fab’、F(ab’)2、Fv、scFv、tascFv、ビス-scFv、sdAb、VH、VL、Vnar、scFvD10、scFv13R4、scFvD10、ヒト化抗体、キメラ抗体、相補性決定領域(CDR)、IgA抗体、IgD抗体、IgE抗体、IgG抗体、IgM抗体、ナノボディ、イントラボディ、ユニボディ、ミニボディ、PROTAC、アプタマードメイン、ユビキチン結合ドメイン配列、E3結合ドメイン、非抗体タンパク質骨格、アドネクチン、アフィボディおよびそれらの2ヘリックス変異体、アンチカリン、ラクダ科抗体(例えば、VHH)、ノッチン(knottin)、DARPin、および/またはSso7dに由来する。
当業者は、いくつかの実施形態において、このような標的指向ドメインが、本明細書に記載される新規のE3リガーゼモチーフ領域に従って細胞/組織特異性を保有することを容易に理解する。一実施形態において、標的指向ドメインは非天然基質に結合する。
本明細書で使用される場合、モノボディという用語は、例えば、FN3およびDARPin、または、基質等に特異的に結合するか、もしくはそれと反応する結合部位を含有するポリペプチドを含む、非免疫グロブリン分子の任意の結合部分を含み得る。本願によるモノボディには、フィブロネクチンIII型ドメイン(「FN3」)を分子骨格として使用して構築される合成結合タンパク質が含まれる。モノボディは、標的結合タンパク質を作製するための抗体の単純かつ堅牢な代替物である。モノボディは、天然抗体分子の欠点を克服することを目的とする抗体模倣物(mimics)(または抗体模倣物(mimetics))および代替骨格と総称される分子のクラスに属する。従来の抗体を超えたモノボディの主な利点は、モノボディが、遺伝子コードされた細胞内阻害物質として容易に使用することができ、すなわち、モノボディ阻害物質は、細胞にモノボディ発現ベクターをトランスフェクションすることによって選択される細胞において発現され得ることである。これは、FN3骨格の基礎となる特徴、小さな(約90個の残基)、安定した、産生しやすい、および細胞質および核の還元環境を含む細胞環境の酸化還元電位にかかわらず機能的モノボディを産生することを可能にするジスルフィド結合の欠如に起因する。一実施形態において、標的指向ドメインはモノボディである。モノボディは、GS2、Nsa5、およびRasInIIからなる群から選択されるフィブロネクチンIII型ドメイン(FN3)モノボディであり得る。GS2モノボディは、例えば、緑色蛍光タンパク質(「GFP」)を認識することができる。NSa5モノボディは、例えば、SHP2のSrc相同2(SH2)ドメイン(Sha et al.,“Dissection of the BCR-ABL Signaling Network Using Highly Specific Monobody Inhibitors to the SHP2 SH2 Domains,”Proc.Natl.Acad.Sci.USA 110(37):14924-29(2013)、これは、参照によりその全体が本明細書に組み込まれる)、ならびにHRas、KRas、およびG12V変異体に特異的なRasInIIの各々(Cetin et al.,“RasIns:Genetically Encoded Intrabodies of Activated Ras Proteins,”J.Mol.Biol.429(4):562-573(2017)、これは、参照によりその全体が本明細書に組み込まれる)に特異的であり得る。
モノボディである標的指向ドメインは、例えば、フィブロネクチンIII型ドメイン(FN3)モノボディであってもよい。FN3モノボディの例としては、限定されないが以下(括弧内に標的抗原を示す)が挙げられる:GS2(GFP)、Nsa5(SHP2)、RasInI(HRas/KRas)、およびRasInII(HRas/KRas)、1D10(CDC34)、1D7(COPS5)、1C4(MAP2K5)、2C12(MAP2K5)、1E2(SF3A1)、1C2(USP11)、1A9(USP11)、Ubi4(ユビキチン)、EI1.4.1(EGFR)、EI2.4.6(EGFR)、EI3.4.3(EGFR)、EI4.2.1(EGFR)、EI4.4.2(EGFR)、EI6.2.6(EGFR)、EI6.2.10(EGFR)、E246(EGFR)、C743(CEA)、IIIa8.2.6(FcγIIa)、IIIa6.2.6(FcγIIIa)、hA2.2.1(hA33)、hA2.2.2(hA33)、hA3.2.1(hA33)、hA3.2.3(hA33)、mA3.2.1(mA33)、mA3.2.2(mA33)、mA3.2.3(mA33)、mA3.2.4(mA33)、mA3.2.5(mA33)、Alb3.2.1(hAlb)、mI2.2.1(mIgG)、HA4(AblSH2)、HA10(AblSH2)、HA16(AblSH2)、HA18(AblSH2)、159(vEGFR)、MUC16(MSLN)、E2#3(ERα/EF)、E2#4(ERα/EF)、E2#5(ERα/EF)、E2#6(ERα/EF)、E2#7(ERα/EF)、E2#8(ERα/EF)、E2#9(ERα/EF)、E2#10(ERα/EF)、E2#11(ERα/EF)、E2#23(ERα/EF)、E3#2(ERα/EF)、E3#6(ERα/EF)、OHT#31(ERα/EF)、OHT#32(ERα/EF)、OHT#33(ERα/EF)、AB7-A1(ERα/EF)、AB7-B1(ERα/EF)、MBP-74(MBP)、MBP-76(MBP)、MBP-79(MBP)、hSUMO4-33(hSUMO4)、hSUMO-39(hSUMO4)、ySUMO-53(ySUMO)、ySUMO-56(ySUMO)、ySUMO-57(ySUMO)、T14.25(TNFα)、T14.20(TNFα)、FNfn10-3JCL14(avβ3インテグリン)、1C9(Src SH3)、1F11(Src SH3)、1F10(Src SH3)、2G10(Src SH3)、2B2(Src SH3)、1E3(Src SH3)、E18(VEGFR2)、E19(VEGFR2)、E26(VEGFR2)、E29(VEGFR2)、FG4.2(リゾチーム)、FG4.1(リゾチーム)、2L4.1(リゾチーム)、BF4.1(リゾチーム)、BF4.9(リゾチーム)、BF4.4(リゾチーム)、BFs1c4.01(リゾチーム)、BFs1c4.07(リゾチーム)、BFs3_4.02(リゾチーム)、BFs3_4.06(リゾチーム)、BFs3_8.01(リゾチーム)、10C17C25(ホスホ-IκBα)、Fn-N22(SARS N)、Fn-N17(SARS N)、FN-N10(SARS N)、gI2.5.3T88I(ヤギIgG)、gI2.5.2(ヤギIgG)、gI2.5.4(ヤギIgG)、rI4.5.4(ウサギIgG)、rI4.3.1(ウサギIgG)、rI3.6.6(ウサギIgG)、rI4.3.4(ウサギIgG)、rI3.6.4(ウサギIgG)、およびrI4.3.3(ウサギIgG)。
本明細書で使用される場合、抗体という用語は、免疫グロブリン、および免疫グロブリン、例えば、IgG、IgD、IgA、IgM、およびIgEの任意の抗原結合部分、または抗原結合部位を含有するポリペプチドを含み得、これは、免疫原、抗原、基質等に特異的にまたは「免疫特異的に結合する」、または「免疫反応する」。抗体は、少なくとも1つの重(H)鎖および少なくとも1つのジスルフィド結合によって相互接続された少なくとも1つの軽(L)鎖を含むことができる。用語「VH」は、抗体の重鎖可変領域を指す。用語「VL」は、抗体の軽鎖可変領域を指す。いくつかの実施形態において、用語「抗体」はモノクローナル抗体およびポリクローナル抗体を特異的に包含する。「ポリクローナル抗体」は、抗原(単数または複数)で免疫化された動物の血清に由来する抗体を指す。「モノクローナル抗体」は、ハイブリドーマ細胞の単一クローンによって産生される抗体を指す。
本願の標的指向ドメインとして有用な抗体関連分子、ドメイン、フラグメント、部分等としては、例えば、Fab、Fab’およびF(ab’)2、Fd、一本鎖Fv(scFv)、一本鎖抗体、ジスルフィド連結Fv(sdFv)、ならびにVLまたはVHドメインのいずれかを含むフラグメントが挙げられるが、これらに限定されない。例としては、(i)VL、VH、CLおよびCH1ドメインからなる一価のフラグメントである、Fabフラグメント、(ii)ヒンジ領域でジスルフィド架橋により連結された2つのFabフラグメントを含む二価のフラグメントである、F(ab’)2フラグメント、(iii)VHおよびCH1ドメインからなるFdフラグメント、(iv)抗体の単一アームのVLおよびVHドメインからなるFvフラグメント、(v)VHドメインからなる、dAbフラグメント(Ward et al.,“Binding Activities of a Repertoire of Single Immunoglobulin Variable Domains Secreted From Escherichia coli,”Nature 341:544-46(1989)、これは参照によりその全体が本明細書に組み込まれる)、ならびに(vi)単離された相補的決定領域(CDR)が挙げられる。そのような「抗体フラグメント」は、全長抗体の一部、概してその抗原結合または可変領域を含むことができる。抗体フラグメントの例としては、Fab、Fab’、F(ab’)2、およびFvフラグメント、ダイアボディ、直鎖抗体、一本鎖抗体分子、ならびに抗体フラグメントから形成される多重特異性抗体が挙げられる。一本鎖抗体分子は、いくつかの個々の分子、例えば、二量体、三量体、または他のポリマーを有するポリマーを含んでもよい。
本明細書で使用される「モノクローナル抗体」という用語は、実質的に均質な抗体の集団から得られる抗体を含んでもよく、すなわち、その集団を含む個々の抗体は、少量で存在し得る可能性のある天然に存在する変異を除いて同一である。しかし、本願に従って使用されるモノクローナル抗体は、参照によりその全体が本明細書に組み込まれる、Kohler et al.,“Continuous Cultures of Fused Cells Secreting Antibody of Predefined Specificity”Nature 256:495(1975)によって最初に記載されたハイブリドーマ法によって作製され得るか、または組換えDNA法によって作製され得る。例えば、参照によりその全体が本明細書に組み込まれる、米国特許第4,816,567号を参照のこと。「モノクローナル抗体」はまた、参照によりそれらの全体が本明細書に組み込まれる、Clackson et al.,“Making Antibody Fragments Using Phage Display Libraries”Nature 352:624-28(1991)およびMarks et al.,“By-Passing Immunization.Human Antibodies From V-Gene Libraries Displayed on Phage”J.Mol.Biol.222:581-97(1991)に記載された技術を使用してファージ抗体ライブラリから単離することができる。
本明細書で使用される場合、「ポリクローナル抗体」という用語は、例えば、少なくとも2つの異なる抗体産生細胞株に由来する抗体の調製物を含む。この用語の使用は、抗原の異なるエピトープまたは領域に特異的に結合する抗体を含有する少なくとも2つの抗体の調製物を含む。
本明細書で使用される場合、用語「一本鎖抗体」または「一本鎖Fv(scFv)」は、Fvフラグメント、VLおよびVHの2つのドメインの抗体融合分子を指し得る。Fvフラグメントの2つのドメインであるVLおよびVHは、別個の遺伝子によってコードされるが、それらは、組換え方法を使用して、VLおよびVH領域が対合して一価の分子(一本鎖Fv(scFv)として知られる)を形成する単一のタンパク質鎖としてそれらを作製することを可能にする合成リンカーによって結合することができる。例えば、Bird et al.,“Single-Chain Antigen-Binding Proteins,”Science 242:423-26(1988)and Huston et al.,“Protein Engineering of Antibody Binding Sites:Recovery of Specific Activity in an Anti-Digoxin Single-Chain Fv Analogue Produced in Escherichia coli,”Proc.Natl.Acad.Sci.USA 85:5879-83(1988)を参照のこと。これらは、参照によりそれらの全体が本明細書に組み込まれる。このような一本鎖抗体は、「抗体」フラグメントという用語への参照によって含まれ、組換え技法またはインタクトな抗体の酵素的もしくは化学的切断によって調製することができる。
本明細書で使用される場合、「可変」という用語は、例えば、可変ドメインの特定のセグメントが、抗体間で配列が大きく異なるという事実を指し得る。Vドメインは、抗原結合を媒介し、その特定の抗原に対する特定の抗体の特異性を規定する。しかし、可変性は、可変ドメインのアミノ酸スパンにわたって均等に分布しているわけではない。代わりに、V領域は、15~30個のアミノ酸のフレームワーク領域(FR)と呼ばれる比較的不変の伸長からなり、これは、それぞれ9~12個のアミノ酸の長さである「超可変領域」と呼ばれる極めて可変性の短い領域によって分離されている。天然の重鎖および軽鎖の可変ドメインは、それぞれ、βシート構造を接続し、場合によってはβシート構造の一部を形成するループを形成する3つの超可変領域によって接続されたβシート構成を主に採用した4つのFRを含む。各鎖内の超可変領域は、FRによって密接に一緒に保持され、他方の鎖からの超可変領域と共に、抗体の抗原結合部位の形成に寄与する。Kabat et al.,Sequences of Proteins of Immunological Interest,5 th Ed.Public Health Service,National Institutes of Health,Bethesda,MD.(1991)を参照のこと。これは、参照によりその全体が本明細書に組み込まれる。定常ドメインは、抗体の抗原への結合に直接関与しないが、抗体の抗体依存性細胞毒性(「ADCC」)への関与等の様々なエフェクター機能を示す。
本願の標的指向ドメインは、例えば、単一特異性、二重特異性、三重特異性、またはより大きな多重特異性であり得る。多重特異性標的指向ドメインは、基質の異なるエピトープに特異的であり得、または本願の基質ポリペプチドおよび異種組成物、例えば、異種ポリペプチドまたは固体支持体材料の両方に特異的であり得る。例えば、WO 93/17715;WO 92/08802;WO 91/00360;WO 92/05793;Tutt et al.,“Trispecific F(ab’)3 Derivatives That Use Cooperative Signaling Via the TCR/CD3 Complex and CD2 to Activate and Redirect Resting Cytotoxic T Cells,”J.Immunol.147:60-69(1991)、米国特許第5,573,920号、第4,474,893号、第5,601,819号、第4,714,681号、第4,925,648号、第6,106,835号、Kostelny et al.,“Formation of a Bispecific Antibody by the Use of Leucine Zippers,”J.Immunol.148:1547-53(1992)を参照のこと。これらは、参照によりそれらの全体が本明細書に組み込まれる。本願の標的指向ドメインは、鳥類および哺乳動物を含む任意の動物起源に由来することができる。例えば、標的指向ドメインは、ヒト、海洋動物、ウサギ、ヤギ、モルモット、ラクダ、ウマ、またはニワトリ由来であってもよい。
標的基質へと方向付けられる標的指向ドメインを生成するための技術は、当業者には周知である。そのような技術の例は、限定されないが、例えば、ディスプレイライブラリ、ゼノ(xeno)マウスまたはhumabマウス、ハイブリドーマ等を伴うものを含む。本願の範囲内において標的指向ドメインが誘導される標的ポリペプチドとしては、抗原性を示すことができる任意のポリペプチドまたはポリペプチド誘導体が挙げられる。例として、限定されないが、基質およびそのフラグメントが挙げられる。いくつかの実施形態において、標的指向ドメインは一本鎖抗体である。
一本鎖抗体(「scFv」)は、フレキシブル領域によって軽鎖の可変ドメインに結合した、アミノ末端にある重鎖の可変ドメインからなる遺伝子操作抗体である。いくつかの実施形態において、scFvは、既知の標的特異性を有するモノクローナル抗体(mAb)を発現するハイブリドーマ細胞株からPCRによって生成されるか、またはそれらは、脾臓細胞もしくはリンパ球から単離されたライブラリからファージディスプレイによって選択され、親抗体の親和性を保持する。細胞内基質を同定するためのプロトコルを利用して、酵母2ハイブリッド技術は候補scFv-タンパク質相互作用を同定する役割を果たす。そのようなシステムは、インビボでscFvがその標的基質を認識することができるかどうかを予測するのに有用である。Portner-Taaliana et al.,“Identification of Protein Single chain Antibody Interactions In Vivo Using Two-Hybrid Protocols,”Protein-Protein Interactions:A Molecular Cloning Manual,Cold Spring Harbor Laboratory Press,Chapter 24((著作権)2002)を参照のこと。これらは、参照によりその全体が本明細書に組み込まれる。
典型的には、ディスプレイベクターにクローニングされているscFv、ハイブリッド抗体またはハイブリッド抗体フラグメントは、抗体または抗体フラグメントがファージまたはファージミド粒子の表面に存在するため、良好な結合活性を維持した変異体を同定するために適切な抗原に対して選択することができる。例えば、参照によりその全体が本明細書に組み込まれる、Barbas III et al.,Phage Display,A Laboratory Manual(Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,2001)を参照のこと。しかし、選択および/またはスクリーニングのために抗体フラグメントライブラリを溶解ファージベクター(修飾T7またはLambda Zap系)にクローニングする等の、他のベクターフォーマットを、このプロセスのために使用することができる。
一般に、組換えDNA技術において有用な発現ベクターは、プラスミド形態であることが多い。しかし、本願は、等価な機能を果たすウイルスベクター、例えば、複製欠損レトロウイルス、アデノウイルス、およびアデノ関連ウイルス等の技術的にプラスミドではないそのような他の形態の発現ベクターを含むことが意図される。このようなウイルスベクターは、対象の感染および化合物のその対象における発現を可能にする。発現制御配列は、典型的には、真核宿主細胞の形質転換またはトランスフェクションが可能なベクターにおける真核プロモーター系である。一旦ベクターが適切な宿主に組み込まれると、宿主は、標的指向ドメインをコードするヌクレオチド配列の高レベル発現のために、ならびに基質結合物質、例えば、交差反応抗基質抗体の収集および精製のために好適な条件下で、維持される。一般に、参照によりその全体が本明細書に組み込まれる、米国特許公開第2002/0199213号を参照のこと。ベクターはまた、細胞外抗体フラグメントの分泌を方向付けるのに有用なシグナルペプチド、例えば、ペクチン酸リアーゼをコードすることができる。参照によりその全体が本明細書に組み込まれる米国特許第5,576,195号を参照のこと。
本明細書で使用される場合、「分解ドメイン」または「分解領域」という用語は、基質のユビキチン化を促進することができるキメラ分子の一部を含む。分解ドメインは、天然結合タンパク質(native binding protein)との相互作用のための第2の「結合」領域を有し得る。結合領域は、1つ以上の変異、置換、欠失を保有するように修飾され得るか、または完全に欠失され得る。
分解ドメインは、HECT型、RINGまたはUボックス(RING/Uボックス)型、およびFボックスドメイン等の真核生物E3に類似した折り畳みを有するE3模倣物、ならびにNEL、XLボックス含有、およびSidC等の任意の他の真核生物E3とは異なる折り畳みを有する非従来的なE3を含んでもよい。分解ドメインは、1つ以上のユビキチン分子および/またはユビキチン様分子を基質に結合させることによって基質を修飾することができるポリペプチドまたはポリペプチド領域に関する。この点において、このような領域は、E1、E2、およびE3酵素の協調作用を伴う周知のユビキチン化カスケードに適合し、これは、ユビキチンを活性化し、それに付随して基質にユビキチンを結合させるように機能する。いくつかの実施形態において、モチーフは新規のE3リガーゼまたはそのフラグメントからなるユビキチン領域であり、これは基質特異的な様式でユビキチンの転移を触媒する。Qian et al.,“Engineering a Ubiquitin Ligase Reveals Conformational Flexibility Required for Ubiquitin Transfer,”J.Biol.Chem.284(39):26797-802(2009)を参照のこと。これは、参照によりその全体が本明細書に組み込まれる。
本明細書で使用される場合、ポリペプチド、タンパク質、領域、ドメイン等の「修飾(複数可)」または「アミノ酸修飾」という用語は、所望の残基の欠失、付加または変異等の天然配列の変化を指す。このような修飾ポリペプチドは、抗体核酸に適切なヌクレオチド変化を導入することによって、またはペプチド合成によって調製される。目的の抗体を得るために、得られる抗体が所望の特性を保有する限り、欠失、挿入、および置換の任意の組み合わせが行なわれる。修飾はまた、タンパク質のグリコシル化パターンの変化も含む。突然変異誘発のための好ましい位置の特定のための有用な方法は、参照によりその全体が本明細書に組み込まれる、Cunningham and Wells,“High-Resolution Epitope Mapping of hGH-Receptor Interactions by Alanine-Scanning Mutagenesis,”Science 244:1081-85(1989)によって記載されたように、「アラニンスキャニング突然変異誘発」と呼ばれる。次いで、変異抗体が所望の活性についてスクリーニングされる。
用語「ポリペプチド」、「タンパク質」、および「ペプチド」は、アミノ酸残基がペプチド結合または修飾ペプチド結合によって連結されているアミノ酸鎖を指すために本明細書において互換的に使用される。アミノ酸鎖は、2個のアミノ酸を超える任意の長さであり得る。別途指定されない限り、用語「ポリペプチド」、「タンパク質」、および「ペプチド」は、その様々な修飾型も包含する。このような修飾型は、天然に存在する修飾型または化学的に修飾された型であり得る。修飾型の例として、限定されないが、グリコシル化型、リン酸化型、ミリストイル化型、パルミトイル化型、リボシル化型、アセチル化型、ユビキチン化型等が挙げられる。修飾はまた、脂質、フラビン、ビオチン、ポリエチレングリコールまたはその誘導体等の様々な部分への分子内架橋および共有結合を含み、加えて、修飾はまた、環化、分岐および架橋を含んでもよい。さらに、遺伝子によってコードされる従来の20種のアミノ酸以外のアミノ酸もまたポリペプチドに含まれてもよい。一実施形態において、本明細書においてELまたはNELとも称されるE3ユビキチンリガーゼモチーフ(E3)は、修飾結合領域を有しない上記E3モチーフと比較して、上記基質への結合を阻害または減少させる修飾結合領域を含む。別の実施形態において、修飾は、結合領域における変異または欠失である。
本明細書で使用される場合、「変異体(variant)」または「変異体(mutant)」という用語は、天然に存在するタンパク質またはペプチドへの修飾によって、天然に存在するタンパク質またはペプチド、すなわち「プロトタイプ」または「野生型」タンパク質とは異なるが、天然に存在する型の塩基性タンパク質および側鎖構造を維持するタンパク質またはペプチドを指すために使用される。このような変化としては、限定されないが、1つ、少数、またはいくつかのアミノ酸側鎖における変化;欠失、例えば、タンパク質またはペプチドの切断型バージョン、挿入および/または置換を含む、1つ、少数、またはいくつかのアミノ酸における変化;1つまたはいくつかの原子の立体化学における変化;ならびに/またはメチル化、グリコシル化、リン酸化、アセチル化、ミリストイル化、プレニル化、パルミチン酸化、アミド化、および/またはグリコシルホスファチジルイノシトールの添加を含むが、これらに限定されない軽微な誘導体化が挙げられる。「変異体(variant)」または「変異体(mutant)」は、天然に存在するタンパク質またはペプチドと比較して、増強された、減少された、変化した、または実質的に類似した特性を有することができる。
いくつかの実施形態において、キメラ分子の分解ドメインは内因性基質認識領域、すなわち天然(natural)または天然結合(native binding)パートナーと相互作用するポリペプチドの一部を欠く。分解ドメインのE3モチーフは、修飾結合領域を有しないE3モチーフと比較して、基質への結合を阻害または減少させる修飾結合ドメインを保有し得る。それにもかかわらず、E3モチーフは、いくつかの実施形態において基質のタンパク質分解を可能にする。いくつかの実施形態において、修飾は、結合領域の変異、置換、または欠失である。置換は、保存的または非保存的アミノ酸置換等のアミノ酸置換であり得る。
E3モチーフの非保存的アミノ酸置換は、アルキルアミノ酸が配列中のアルキルアミノ酸以外のアミノ酸に置換され、芳香族アミノ酸がE3モチーフ中の芳香族アミノ酸以外のアミノ酸に置換され、硫黄含有アミノ酸がE3モチーフ中の硫黄含有アミノ酸以外のアミノ酸に置換され、ヒドロキシ含有アミノ酸がE3モチーフ中のヒドロキシ含有アミノ酸以外のアミノ酸に置換され、酸性アミノ酸がE3モチーフ中の酸性アミノ酸以外のアミノ酸に置換され、塩基性アミノ酸がE3モチーフ中の塩基性アミノ酸以外のアミノ酸に置換され、または二塩基性モノカルボキシルアミノ酸がE3モチーフ中の二塩基性モノカルボキシルアミノ酸以外のアミノ酸に置換される置換である。
一般的なアミノ酸のうち、例えば、「非保存的アミノ酸置換」は、以下の群のうちの1つからのアミノ酸を、以下のように、同じ群ではないアミノ酸で置換することによって例証される。(1)グリシン、アラニン、(2)バリン、ロイシン、およびイソロイシン、(3)フェニルアラニン、チロシン、およびトリプトファン、(4)システインおよびメチオニン、(5)セリンおよびトレオニン、(6)アスパラギン酸およびグルタミン酸、(7)グルタミンおよびアスパラギン、ならびに(8)リジン、アルギニン、およびヒスチジン。
例えば、E3モチーフにおける保存的または非保存的アミノ酸変化は、そのような領域をコードするヌクレオチドに対して適切なヌクレオチドを置換することによって導入することができる。これらの修飾は、例えば、オリゴヌクレオチド指定突然変異誘発、リンカースキャニング突然変異誘発、ポリメラーゼ連鎖反応を使用する突然変異誘発等によって得ることができる。Ausubel et al.(eds.)、Short Protocols in Molecular Biology,5th Edition,John Wiley&Sons,Inc.(2002)、概して、McPherson(ed.),Directed Mutagenesis:A Practical Approach,IRL Press(1991)を参照されたい、これは、参照によりそれらの全体が本明細書に組み込まれる。配列バリエーションのための位置を同定するための有用な方法は、参照によりその全体が本明細書に組み込まれる、Cunningham and Wells “Protein Engineering of Antibody Binding Sites:Recovery of Specific Activity in an Anti-Digoxin Single-Chain Fv Analogue Produced in Escherichia coli,”Science 244:1081-85(1989)によって記述された「アラニンスキャニング変異誘発」と呼ばれる。
ユビキチンリガーゼファミリーには、E2コンジュガーゼから基質へのユビキチンの転移に関するE6関連タンパク質C末端(「HECT」)ドメインリガーゼ、E2に結合し、E2-E3複合体における酵素活性を媒介し得る、実に興味深い新たな遺伝子(「RING」)ドメインリガーゼ、およびZn2+結合リガンドの完全な相補体を有しない修飾RINGモチーフリガーゼファミリーを構成するUボックスユビキチンリガーゼファミリー(「UUL」)が含まれるが、これらに限定されない。Colas et al.,“Targeted Modification and Transportation of Cellular Proteins.”Proc.Natl.Acad.Sci.USA 97(25):13720-25(2005)を参照のこと。これは、参照によりその全体が本明細書に組み込まれる。
Uボックスユビキチンリガーゼ(「ULL」)は、多くの他のユビキチンリガーゼに典型的なタンパク質ドメインである、RINGフィンガーに構造的に関連するUボックスを有するとして特徴付けられる。ヒトにおいては、UULコード遺伝子としては、限定されないが、UBE4AおよびUBE4B遺伝子(それぞれ、UFD2bおよびUFD2aとも称される)、CHIP(STUB1とも称される)、UIP5(Uボックス5とも称される)、PRP19(PRPF19またはSNEVとも称される)、CYC4(PPIL2またはCyp-60とも称される)、WDSUB1、およびACT1(TRAF3IP2とも称される)が挙げられる。Marin,I.,“Ancient Origin of Animal U-box Ubiquitin Ligases.”BMC Evolutionary Biology 10:331,pp.1-15(2010)を参照のこと。これは、参照によりその全体が本明細書に組み込まれる。
HECT E3リガーゼは、ユビキチン化中の触媒作用に直接的な役割を有するが、RINGおよびUボックスE3タンパク質は、基質ユビキチン化を促進するためにE2および基質分子を動員するアダプター分子として作用することによって、タンパク質ユビキチン化を容易にする。MDM2(マウスダブル微小クローン2腫瘍性タンパク質)およびc-Cbl等の多くのRING型E3リガーゼは、単独で作用し得るが、他のリガーゼは、アナフェーズ促進複合体(「APC」)等のはるかに大きな多タンパク質複合体の成分として見出される。まとめると、これらの多面的な特性および相互作用により、E3酵素は、真核生物の全ての細胞内のタンパク質クリアランスのための強力かつ特異的な機構を提供することが可能になる。Ardley et al.,“E3 Ubiquitin Ligases.”Essays Biochem.41:15-30(2005)、これは、参照によりその全体が本明細書に組み込まれる。
それでも、E3遺伝子産物に関する機能情報は変化しやすい。Uボックスタンパク質CHIPは、コ-シャペロンとして、例えば、Hsc70、Hsp70およびHsp90等のシャペロンと共に、ユビキチンリガーゼとして、単独で、または他のE3タンパク質を含み得る複合体の一部としての両方として作用する。同文献を参照のこと。しかし、特定の基質に対するユビキチンプロテアソームシステムの選択性は、ユビキチン結合酵素、例えば、E2とユビキチンタンパク質リガーゼとの間の相互作用に依存する。タンパク質基質の翻訳後修飾、例えば、リン酸化またはヒドロキシル化等は、ユビキチン化の前にしばしば必要とされる。このようにして、特定の基質に対する正確な空間時間的標的指向化および分解を達成することができる。
本明細書に開示される分解ドメインのE3モチーフは、天然結合パートナーからの立体破壊なしに基質をユビキチン化することができる機能性E3リガーゼを保有する。E3モチーフに加えて、いくつかの実施形態において、分解ドメインは、HECT型、RING型またはUボックス(RING/Uボックス)型、およびFボックス型ドメイン等の真核生物E3に類似した折り畳みを有するE3模倣物であるリガーゼ、ならびにNEL、XLボックス含有、およびSidC等の任意の他の真核生物E3とは異なる折り畳みを保有する非従来的なE3を有する。このようなドメインは、細胞または組織特異性を保有し得る。
一実施形態では、キメラ分子のE3モチーフは、限定されないが、皮膚細胞、筋肉細胞、上皮細胞、内皮細胞、幹細胞、臍帯血管細胞、角膜細胞、心筋細胞、大動脈細胞、角膜上皮細胞、体細胞、線維芽細胞、ケラチノサイト、メラノサイト、脂肪細胞、骨細胞、骨芽細胞、気道細胞、微小血管細胞、乳房細胞、血管細胞、軟骨細胞、胎盤細胞、肝細胞、膠細胞、表皮細胞、角膜輪部幹細胞、歯周幹細胞、骨髄間質細胞、ハイブリドーマ細胞、腎臓細胞、膵島、関節軟骨細胞、神経芽細胞、リンパ球、および赤血球、ならびに/またはそれらの任意の組み合わせに関する細胞型特異的または組織特異的リガーゼ機能を保有し得る。
一実施形態において、分解ドメインは細菌病原体由来であり、この病原体は、シゲラ(Shigella)、サルモネラ(Salmonella)、バチルス(Bacillus)、バルトネラ(Bartonella)、ボルデテラ(Bordetella)、ボレリア(Borrelia)、ブルセラ(Brucella)、カンピロバクター(Campylobacter)、クラミジア(Chlamydia)およびクラミドフィラ(Chlamydophila)、クロストリジウム(Clostridium)、コリネバクテリウム(Corynebacterium)、エンテロコッカス(Enterococcus)、エシェリキア(Escherichia)、フランシセラ(Francisella)、ヘモフィルス(Haemophilus)、ヘリコバクター(Helicobacter)、レジオネラ(Legionella)、レプトスピラ(Leptospira)、リステリア(Listeria)、マイコバクテリウム(Mycobacterium)、マイコプラズマ(Mycoplasma)、ナイセリア(Neisseria)、シュードモナス(Pseudomonas)、リケッチア(Rickettsia)、スタフィロコッカス(Staphylococcus)、ストレプトコッカス(Streptococcus)、トレポネーマ(Treponema)、ウレアプラズマ(Ureaplasma)、ビブリオ(Vibrio)、ならびにエルシニア(Yersinia)からなる群から任意に選択される。より具体的には、別の実施形態において、細菌病原体はシゲラ・フレックスネリである。任意の細菌に由来し得る分解ドメインは、例えば、シゲラ・フレックスネリE3リガーゼ、SspH1、SspH2、SlrP、AvrPtoB、LubX、NLeG5-1、NleG5-1、NleG2-3、LegU1、LegAU13、NIeL、SopA、SidC、XopL、GobX、VirF、GALA、AnkB、および/またはSidEに由来し得る。
一実施形態において、分解ドメインは、シゲラIpaHタンパク質ファミリーのメンバーであり、IpaH9.8、IpaH1.4、IpaH2.5、IpaH4.5、IpaH7.8、IpaH0887、IpaH1389、IpaH2022、IpaH2202、IpaH2610、および/またはIpaH0722であり得る。シゲラ属の種は、細菌性赤痢(シゲローシス)を引き起こす高度に適応されたヒト病原体である。III型分泌系(T3SS)を介して、シゲラは、発熱、上皮細胞の侵入、細胞内生存、および宿主免疫応答の回避を含む機能を有する、病原性を担う毒性タンパク質(エフェクター)のサブセットを送達する。
シゲラは、大きなプラスミドと染色体の両方に存在する12個のipaH遺伝子を保有している。例えば、Ashida&Sasakawa,“Shigella IpaH Family Effectors as a Versatile Model for Study Pathogenic Bacteria,”Front.Cell.Infect.Microbiol.5:100(2016)を参照のこと。これは、参照によりその全体が本明細書に組み込まれる。IpaHファミリータンパク質は、N末端ロイシンリッチ反復(LRR)を含有し、それらの保存されたC末端領域にE3ユビキチンリガーゼ活性を有する(Rohde et al.,“Type III Secretion Effectors of the IpaH Family are E3 Ubiquitin Ligase,”Cell Host Microbe.1:77-83(2007)およびAshida et al.,“Exploitation of the Host Ubiquitin System by Human Bacterial Pathogens,”Nat.Rev.Microbiol.12:399-413(2014)、これらの両方は、参照によりそれらの全体が本明細書に組み込まれる)。ユビキチン化は、多酵素カスケード、E1(ユビキチン活性化酵素)、E2(ユビキチン結合酵素)、およびE3(ユビキチンリガーゼ)によって触媒される一連の反応を介して達成される。Ashida&Sasakawa,“Shigella IpaH Family Effectors as a Versatile Model for Study Pathogenic Bacteria”Front.Cell.Infect.Microbiol.5:100(2016)、これは、参照によりその全体が本明細書に組み込まれる。ユビキチン化カスケードは、ユビキチンのカルボキシル末端GlyとE1のCysとの間のチオエステル結合の形成を介したユビキチンのATP依存的活性化から開始する。同文献。活性化ユビキチンは、E2の活性部位Cysに移され、最終的にはE3リガーゼは、E2から特定の基質タンパク質へのユビキチンの転移を媒介する(主に基質Lys残基を介して)。同文献。E3リガーゼは、それらの構造および機能に基づいて、2つの群に分類することができる。HECT(E6-APカルボキシル末端に相同)型およびRING(実に興味深い新しい遺伝子)/ Uボックス型。同文献。HECT型E3リガーゼは、その触媒システイン残基とのチオエステル結合の形成を介してE2からユビキチンを受け入れ、次いでそれらの標的基質にユビキチンを移すことによって、ユビキチン転移を触媒する。同文献。一方、RING/Uボックス型E3リガーゼは、骨格分子として作用してE2-ユビキチン複合体に結合し、動員し、次いでE2からE3結合基質にユビキチンを直接転移させることによって、直接ユビキチン転移を触媒する。同文献。
IpaHファミリータンパク質は、シゲラ(IpaH)、サルモネラ(SspH1、SspH2、およびSlrP)、エドワージエラ(Edwardsiella)、ブラディリゾビウム(Bradyrhizobium)、リゾビウム(Rhizobium)、およびいくつかのシュードモナス属の種を含む動物および植物病原体の間で広く保存され、細菌感染におけるこれらのエフェクターの重要性を例証する。同文献。IpaHファミリータンパク質はE3ユビキチンリガーゼ活性を有し、それらのC末端ドメインは、HECT型リガーゼのそれと同様のCys-ユビキチン中間体を形成する単一の保存Cysを含有するが、IpaHファミリーメンバーの触媒ドメインは、配列および構造レベルが真核E3ユビキチンリガーゼと異なる。同文献。したがって、IpaHファミリータンパク質は、E3ユビキチンリガーゼの典型的なRING型およびHECT型とは異なる新しいクラスのE3ユビキチンリガーゼ、NEL(新規なE3リガーゼ)を構成すると考えられる(Singer et al.,“Structure of the Shigella T3SS effector IpaH Defines a New Class of E3 Ubiquitin Ligases,”Nat.Struct.Mol.Biol.15:1293-1301(2008);Zhu et al.,“Structure of a Shigella Effector Reveals a New Class of Ubiquitin Ligases,”Nat.Struct.Mol.Biol.15:1302-08(2008);Quezada et al.,“A Family of Salmonella Virulence Factors Functions as a Distinct Class of Autoregulated E3 Ubiquitin Ligases,”Proc.Natl.Acad.Sci.USA 106:4864-69(2009)、これらのすべてが、参照によりそれらの全体が本明細書に組み込まれる。IpaHファミリータンパク質は互いに高度に類似しているが、基質認識部位とみなされるそれらのLRR領域の配列、および細胞下局在(例えば、核、細胞質、または形質膜)は異なる。Ashida&Sasakawa,“Shigella IpaH Family Effectors as a Versatile Model for Study Pathogenic Bacteria”Front.Cell.Infect.Microbiol.5:100(2016)に記載され、これは、参照によりその全体が本明細書に組み込まれる。
ユビキチンリガーゼファミリーには、Skp1-Cullin1-Fボックス(「SCF」)タンパク質複合体にあるような「Fボックス」リガーゼも含まれ、このリガーゼは、ユビキチン化基質、例えば、Cdc4に結合し、これはその後、Clnに結合するSic1またはGrr1等の標的タンパク質と相互作用する。Bai et al.,“SKP 1 Connects Cell Cycle Regulators to the Ubiquitin Proteolysis Machinery through a Novel Motif,the F-Box”Cell 86(2):263-74(1997)を参照のこと。これは参照によりその全体が本明細書に組み込まれる。
Fボックスは、タンパク質-タンパク質相互作用の部位として機能する約50個のアミノ酸のタンパク質モチーフである。例えば、Kipreos et al.,“The F-box Protein family.”Genome Biol.1(5)(2000)を参照のこと。これは、その全体が参照により本明細書に組み込まれる。Fボックスタンパク質は、最初に、SCFユビキチンリガーゼ複合体の成分として特徴付けられたものであり、これらは、ユビキチン媒介タンパク質分解のために基質に結合する。Fボックスモチーフは、コアSCF成分Skp Iに結合することによって、Fボックスタンパク質をSCF複合体の他の成分に連結する。Fボックスタンパク質は、様々な細胞機能において非SCFタンパク質複合体を介して機能することがごく最近発見されている。同文献を参照のこと。Fボックスタンパク質は、多くの場合、タンパク質-タンパク質相互作用が可能な追加のカルボキシ末端モチーフを含み、酵母およびヒトFボックスタンパク質において最も一般的な二次モチーフは、WD反復およびロイシンリッチ反復であり、これらの両方は、SCF複合体にリン酸化基質を結合することが見出されている。同文献を参照のこと。Fボックスタンパク質の大部分は、他の関連するモチーフを有し、これらのタンパク質の大部分の機能はまだ定義されていない。同文献を参照のこと。
Fボックスモチーフ内の最小変異体位置は、8位(コンセンサスのために使用される234個のFボックスタンパク質の92%がロイシンまたはメチオニンを有する)、9位(92%プロリン)、16位(86%イソロイシンまたはバリン)、20位(81%ロイシンまたはメチオニン)、および32位(92%セリンまたはシステイン)を含む。同文献。この厳密なコンセンサスの欠如は、当業者がFボックス配列を検出するために複数の検索アルゴリズムを用いることの指針となる。例えば、2つのアルゴリズムは、PrositeデータベースおよびPfamデータベースに見出すことができる。時折、あるデータベースが所与のタンパク質中のFボックスに有意なスコアを与えることがあるため、他のデータベースがそれを検出しない場合は、両方のデータベースを検索する必要がある。同文献。
原核生物における本願のキメラ分子の発現は、融合ポリペプチドまたは非融合ポリペプチドのいずれかの発現を方向付ける構成的プロモーターまたは誘導性プロモーターを含有するベクターを用いて大腸菌において最も多く行われる。融合ベクターは、その中においてコードされるポリペプチドに、通常は組換えポリペプチドのアミノ末端に、一定の数のアミノ酸を付加する。このような融合ベクターは、典型的には、3つの目的、(i)発現を増加させるため、(ii)溶解度を増加させるため、および(iii)親和性精製においてリガンドとして作用することによって精製を補助するために働く。多くの場合、融合発現ベクターにおいて、融合部分と組換えポリペプチドとの接合部にタンパク質分解切断部位が導入され、融合ポリペプチドの精製後に融合部分からの組換えポリペプチドの分離を可能にする。このような酵素、およびそれらの内因性認識配列は、第Xa因子、トロンビン、およびエンテロキナーゼを含む。典型的な融合発現ベクターとしては、pGEX(Smith and Johnson,“Single-Step Purification of Polypeptides Expressed in Escherichia coli as Fusions With Glutathione S-Transferase,”Gene 67:31-40(1988),これは参照によりその全体が本明細書に組み込まれる)、pMAL(New England Biolabs,Beverly,Mass.)、およびpRIT5(Pharmacia,Piscataway,N.J.)が挙げられ、これらはそれぞれ、標的組換えポリペプチドにグルタチオンS-トランスフェラーゼ(「GST」)、マルトースE結合ポリペプチド、またはポリペプチドAを融合させる。
好適な誘導性非融合大腸菌発現ベクターの例としては、pTrc(Amrann et al.,“Tightly Regulated tac Promoter Vectors Useful for the Expression of Unfused and Fused Proteins in Escherichia coli,”Gene 69:301-15(1988)およびpET11d(Studier et al.,Gene Expression Technology:Methods In Enzymology 185,Academic Press,San Diego,Calif.60-89(1990))が挙げられ、これらは、それらの全体が本明細書に組み込まれる。ポリペプチド融合を介して多官能性ポリペプチドを得るための異なる活性ペプチドまたはタンパク質ドメインの標的アセンブリのための方法は、Packら、米国特許第6,294,353号、同第6,692,935号によって記載されており、これらは、参照によりそれらの全体が本明細書に組み込まれる。大腸菌における組換えポリペプチド、例えば、本願のキメラ分子の発現を最大化するための1つの戦略は、組換えキメラをタンパク質分解的に切断する能力が損なわれた宿主細菌においてポリペプチドを発現することである。例えば、Gottesman,Gene Expression Technology:Methods In Enzymology 185,Academic Press,San Diego,Calif.119-128(1990)を参照のこと。これは、参照によりその全体が本明細書に組み込まれる。
いくつかの実施形態において、分解ドメインおよび標的領域を含む本願のキメラ分子をコードする核酸は、哺乳動物発現ベクターを使用して哺乳動物細胞において発現される。哺乳動物発現ベクターの例として、例えば、限定されないが、pcDNA3、pCDM8(Seed,“An LFA-3 cDNA Encodes a Phospholipid-Linked Membrane Protein Homologous to its Receptor CD2,”Nature 329:840(1987),これは、参照によりその全体が本明細書に組み込まれる)、およびpMT2PCが挙げられる。哺乳動物細胞で使用される場合、発現ベクターの制御機能は、多くの場合、ウイルス調節エレメントによって提供される。例えば、一般に使用されるプロモーターは、ポリオーマ、アデノウイルス2、サイトメガロウイルス、およびシミアンウイルス40に由来する。キメラ分子の標的指向ドメイン、分解ドメインの発現に有用な原核細胞と真核細胞の両方のための他の好適な発現系について。例えば、Sambrook et al.,Molecular Cloning:A Laboratory Manual.2nd ed.,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,(1989)の第16章および第17章を参照のこと。これは、参照によりその全体が本明細書に組み込まれる。
キメラ分子E3分解ドメインおよび標的指向ドメイン発現にもかかわらず、このようなドメイン/領域の機能は、本願の特異性を付与する。既知または未知の基質は、分解ドメインを介した後続のユビキチン化のために標的指向ドメインによって結合される。いくつかの実施形態において、基質は、限定されないが、細胞内基質、細胞外基質、修飾基質、グリコシル化基質、ファルネシル化基質、翻訳後修飾基質、リン酸化基質、および当該技術分野で既知の他の修飾を含む。
いくつかの実施形態では、基質としては、限定されないが、蛍光タンパク質、ヒストンタンパク質、核局在化シグナル(NLS)、H-Rasタンパク質、Src相同2ドメイン含有ホスファターゼ2(SHP2)、β-ガラクトシダーゼ、gpD、Hsp70、MBP、CDC34、COPS5、MAP2K5、SF3A1、USP11、ユビキチン、EGFR、CEA、FcγIIa、FcγIIIa、hA33、mA33、hAlb、mIgG、AblSH2、vEGFR、MSLN、ERα/EF、hSUMO4、ySUMO、TNFα、avβ3インテグリン、SrcSH3、リゾチーム、ホスホ-IκBα、SARS N、ヤギIgG、ウサギIgG、翻訳後修飾タンパク質、フィブリン、ハンチンチン、腫瘍形成タンパク質、p53、Rb、接着タンパク質、受容体、細胞周期タンパク質、チェックポイントタンパク質、HFE、ATP7B、プリオンタンパク質、ウイルスタンパク質、細菌タンパク質、寄生生物タンパク質、真菌タンパク質、DNA結合タンパク質、代謝タンパク質、調節タンパク質、構造タンパク質、酵素、免疫原性タンパク質、自己免疫原性タンパク質、免疫原、抗原、および病原性タンパク質等が挙げられる。一実施形態において、基質は、蛍光タンパク質、例えば、緑色蛍光タンパク質、エメラルド蛍光タンパク質、ビーナス蛍光タンパク質、セルリアン蛍光タンパク質、および増強シアン蛍光タンパク質である。
本明細書で使用される場合、「アミノ酸」という用語は、天然に存在するアミノ酸、L-アミノ酸、D-アミノ酸、および合成アミノ酸、ならびに天然に存在するアミノ酸と同様の様式で機能するアミノ酸類似体およびアミノ酸模倣物を含む。天然アミノ酸は、遺伝コードによってコードされるアミノ酸、ならびに後で修飾されるアミノ酸、例えば、ヒドロキシプロリン、γ-カルボキシグルタミン酸塩、およびO-ホスホセリンである。アミノ酸類似体は、天然に存在するアミノ酸と同じ基本化学構造、例えば、水素、カルボキシル基、アミノ基、およびR基に結合したα炭素を有する化合物、例えば、ホモセリン、ノルロイシン、メチオニンスルホキシド、メチオニンメチルスルホニウムを指す。このような類似体は、修飾R基、例えば、ノルロイシン、または修飾ペプチド骨格を有するが、天然に存在するアミノ酸と同じ基本化学構造を保持している。アミノ酸模倣物とは、アミノ酸の一般的な化学構造とは異なる構造を有するが、天然に存在するアミノ酸と同様の様式で機能する化学化合物を指す。アミノ酸は、本明細書において、それらの一般的に知られている3文字記号またはIUPAC-IUB生化学的命名委員会によって推奨される1文字記号のいずれかによって言及され得る。
本願による分解ドメインとして有用な例示的なE3リガーゼとしては、シュードモナス・シリンゲ(Pseudomonas syringae)由来の、UボックスモチーフであるE3ユビキチンリガーゼAvrPtoBが挙げられ、これは配列番号1のアミノ酸配列を有する。
本願による分解ドメインとして有用なさらなる例示的なE3ユビキチンリガーゼとしては、配列番号3のアミノ酸配列を有するシゲラ・フレックスネリ由来の新規のE3リガーゼ(本明細書においてNELまたはELとも称される)であるE3ユビキチンリガーゼIpaH0722が挙げられる。
本願による分解ドメインとして有用なさらなる例示的なE3リガーゼとしては、シゲラ・フレックスネリ由来の新規E3リガーゼであるE3ユビキチンリガーゼIpaH1.4が挙げられ、これは、以下のように配列番号5のアミノ酸配列を有する。
本願による分解ドメインとして有用なさらなる例示的なE3ユビキチンリガーゼとしては、配列番号7のアミノ酸配列を有するシゲラ・フレックスネリ由来の新規のE3リガーゼであるE3ユビキチンリガーゼIpaH2.5が挙げられる。
本願による分解ドメインとして有用な更なる例示的なE3ユビキチンリガーゼとしては、シゲラ・フレックスネリ由来であり、配列番号9のアミノ酸配列を有する、新規のE3リガーゼであるE3ユビキチンリガーゼIpaH4.5が挙げられる。
本願による分解ドメインとして有用なさらなる例示的なE3ユビキチンリガーゼとしては、新規のE3リガーゼであるE3ユビキチンリガーゼIpaH7.8(シゲラ・フレックスネリ由来であり、配列番号11のアミノ酸配列を有する)が挙げられる。
本願による分解ドメインとして有用なさらなる例示的なE3ユビキチンリガーゼとしては、新規のE3リガーゼであり、シゲラ・フレックスネリ由来であり、配列番号13のアミノ酸配列を有する、E3ユビキチンリガーゼIpaH9.8が挙げられる。
本願による分解ドメインとして有用なさらなる例示的なE3ユビキチンリガーゼとしては、Fボックスモチーフであり、レジオネラ・ニューモフィラ(Legionella pneumophila)由来であり、配列番号15のアミノ酸配列を有する、E3ユビキチンリガーゼLegAU13が挙げられる。
本願による分解ドメインとして有用なさらなる例示的なE3ユビキチンリガーゼとしては、Fボックスモチーフであり、レジオネラ・ニューモフィラ由来であり、配列番号17のアミノ酸配列を有するE3ユビキチンリガーゼLegU1が挙げられる。
本願による分解ドメインとして有用なさらなる例示的なE3ユビキチンリガーゼとしては、Uボックスモチーフであり、レジオネラ・ニューモフィラ由来であり、配列番号19のアミノ酸配列を有するE3ユビキチンリガーゼLubXが挙げられる。
本願による分解ドメインとして有用なさらなる例示的なE3ユビキチンリガーゼとしては、Uボックスモチーフであり、腸管出血性大腸菌(Enterohemorrhagic Escherichia coli)(EHEC)O157:H7であり、配列番号21のアミノ酸配列を有するE3ユビキチンリガーゼNleG2-3が挙げられる。
本願による分解ドメインとして有用なさらなる例示的なE3ユビキチンリガーゼとしては、Uボックスモチーフであり、腸管出血性大腸菌(「EHEC」)O157:H7由来であり、配列番号23のアミノ酸配列を有する、E3ユビキチンリガーゼNleG5-1が挙げられる。
本願による分解ドメインとして有用なさらなる例示的なE3ユビキチンリガーゼとしては、HECTモチーフであり、腸管出血性大腸菌(「EHEC」)O157:H7由来であり、配列番号25のアミノ酸配列を有する、E3ユビキチンリガーゼNleLが挙げられる。
本願による分解ドメインとして有用なさらなる例示的なE3ユビキチンリガーゼとしては、HECTモチーフであり、腸管出血性大腸菌(「EHEC」)O157:H7由来であり、配列番号26のヌクレオチド配列を有するE3ユビキチンリガーゼNleLが挙げられる。
本願による分解ドメインとして有用なさらなる例示的なE3ユビキチンリガーゼとしては、非従来的なモチーフであり、L.ニューモフィラ由来であり、配列番号27のアミノ酸配列を有するE3ユビキチンリガーゼSidCが挙げられる。
本願による分解ドメインとして有用なさらなる例示的なE3ユビキチンリガーゼとしては、NELモチーフであり、EHEC O157:H7由来であり、配列番号29のアミノ酸配列を有するE3ユビキチンリガーゼSlrPが挙げられる。
本願による分解ドメインとして有用なさらなる例示的なE3ユビキチンリガーゼとしては、HECTモチーフであり、サルモネラ・ティフィムリウム(Salmonella typhimurium)由来であり、配列番号31のアミノ酸配列を有するE3ユビキチンリガーゼSopAが挙げられる。
本願による分解ドメインとして有用なさらなる例示的なE3ユビキチンリガーゼとしては、新規なE3リガーゼモチーフであり、サルモネラ・ティフィムリウム由来であり、配列番号33のアミノ酸配列を有するE3ユビキチンリガーゼSspH1が挙げられる。
本願による分解ドメインとして有用なさらなる例示的なE3ユビキチンリガーゼとしては、新規なE3リガーゼモチーフであり、サルモネラ・ティフィムリウム由来であり、配列番号35のアミノ酸配列を有するE3ユビキチンリガーゼSspH2が挙げられる。
本願による分解ドメインとして有用なさらなる例示的なE3ユビキチンリガーゼとしては、非従来的なモチーフであり、キサントモナス・カンペストリス(Xanthomonas campestris)由来であり、配列番号37のアミノ酸配列を有するE3ユビキチンリガーゼXopLが挙げられる。
標的指向ドメインは、固有の結合相互作用、例えば、二次、三次、または四次フレキシビリティを保有するが、E3モチーフユビキチン領域との会合に関して依然としてフレキシビリティが存在しなければならない。この点に関して、適切な間隔がない場合、E3モチーフが基質-標的指向ドメイン相互作用を立体的に妨げることがあり得る。したがって、本願は、いくつかの実施形態において、標的指向ドメインと基質との間の結合の立体破壊を防止するのに十分な長さのポリペプチドリンカーを用いる。
いくつかの実施形態において、標的指向ドメインは、生理学的条件下で切断可能であっても切断不可能であってもよいリンカーを介してユビキチン領域に共有結合する。リンカーは、ユビキチン領域剤への標的指向ドメインへの共有結合を可能にする求核性または求電子性反応基を含む有機部分を含み得る。いくつかの実施形態において、リンカーはエノールエーテル、ケタール、イミン、オキシム、ヒドラゾン、セミカルバゾン、アシルイミド、またはメチレンラジカルである。いくつかの実施形態において、リンカーは、酸切断可能リンカー、加水分解可能リンカー、または酵素切断可能リンカーであってもよい。
ペプチドベースの連結基は、細胞におけるペプチダーゼおよびプロテアーゼ等の酵素によって切断される。ペプチドベースの切断可能な連結基は、オリゴペプチド、例えば、ジペプチド、トリペプチド、およびポリペプチドを得るためにアミノ酸間で形成されるペプチド結合である。ペプチドベースの切断可能基は、アミド基(-C(O)NH-)を含まない。アミド基は、任意のアルキレン、アルケニレンまたはアルキネレンの間に形成することができる。ペプチド結合は、アミノ酸間で形成され、ペプチドおよびタンパク質を得るための特別なタイプのアミド結合である。ペプチドベースの切断基は、一般に、アミノ酸間で形成されるペプチド結合、すなわちアミド結合に限定され、ペプチドおよびタンパク質が得られ、アミド官能基全体が含まれない。ペプチド切断可能な連結基は、一般式-NHCHR1C(O)NHCHR2C(O)-を有し、式中、R1およびR2は、2つの隣接アミノ酸のR基である。これらの候補は、上述のものと類似の方法を使用して評価することができる。
インビトロ用途のために、ポリペプチドを固体支持体に結合させるための使用のための架橋剤であり得る適切なリンカーには、支持体の表面上に存在する官能基と反応することができるか、またはポリペプチドと反応することができるか、またはその両方である様々な薬剤が含まれる。架橋剤として有用な試薬としては、ホモ二官能性試薬、および特にヘテロ二官能性試薬が挙げられる。有用な二官能性架橋剤としては、限定されないが、N-SIAB、ジマレイミド、DTNB、N-SATA、N-SPDP、SMCC、および6-HYNICが挙げられる。架橋剤を選択して、ポリペプチドと固体支持体との間で選択的に切断可能な結合を提供することができる。例えば、ポリペプチドを固体支持体から切断するための手段として、3-アミノ-(2-ニトロフェニル)プロピオン酸等の光不安定性架橋剤を用いることができる。Brown et al.,“A Single-Bead Decode Strategy Using Electrospray Ionization Mass Spectrometry and a New Photolabile Linker:3-amino-3-(2-nitrophenyl)propionic Acid,”Mol.Divers 4-12(1995)および米国特許第5,643,722号を参照のこと。これらは、参照によりそれらの全体が本明細書に組み込まれる。
抗体、ポリペプチド、またはそのフラグメント、例えば標的指向ドメインは、カルボキシル基官能化ビーズとポリペプチドのアミノ末端との間に形成される共有アミド結合を介して、または逆に、アミノ基官能化ビーズとポリペプチドのカルボキシル末端との間に形成される共有アミド結合を介して、ビーズ等の固体支持体上に固定化され得る。さらに、二官能性トリチルリンカーは、アミノ樹脂を介して樹脂上のアミノ基またはカルボキシル基を通して、支持体に、例えば、Wang樹脂等の樹脂上の4-ニトロフェニル活性エステルに結合することができる。二官能性トリチルアプローチを使用して、固体支持体は、ポリペプチドが切断され、除去され得ることを確実にするために、ギ酸またはトリフルオロ酢酸等の揮発性酸を用いる処理を必要とすることができる。そのような場合、ポリペプチドは、固体支持体のウェルの底部または固体支持体の平坦な表面上にビーズレスパッチとして堆積することができる。マトリックス溶液を添加した後、ポリペプチドはMSに堆積することができる。
当業者には、上述の方法および技術が、上記のように、その構成部分、例えば、分解ドメイン、ユビキチン領域、標的領域、およびそれらの修飾、ならびにリンカー分子を含む、本願のキメラ分子のために利用され得ることが容易に明らかになる。
本願の第2の態様は、リボヌクレオタンパク質を形成する方法に関する。本方法は、本明細書に記載の単離されたキメラ分子をコードするmRNAを提供することと、1つ以上のポリアデノシン結合タンパク質(「PABP」)を提供することと、mRNAおよび1つ以上のPABPからリボヌクレオタンパク質複合体をアセンブルすることとを含む。一実施形態において、mRNAは3’末端ポリアデノシン(ポリA)テールを含む。
本態様に記載されるキメラ分子は、本願の前述の態様に従って行われる。
本明細書に記載のポリアデノシン結合タンパク質(「PABP」)(ポリ(A)結合タンパク質とも称される)は、mRNAのポリ(A)テールに結合するRNA結合タンパク質を指す。ポリ(A)テールは、mRNAの3’末端に位置し、200~250ヌクレオチド長である。結合タンパク質はまた、ポリアデニル酸ポリメラーゼが翻訳の前にポリ(A)ヌクレオチドテールをプレmRNAに付加することを補助することによって、mRNA前駆体にも関与する。核アイソフォームは、約50個のヌクレオチドに選択的に結合し、RNAに対するその親和性を増加させることによってポリアデニル酸ポリメラーゼの活性を刺激する。ポリ(A)結合タンパク質はまた、ナンセンス媒介性分解および核細胞質トラフィッキングを含むmRNA代謝の段階の間に存在する。ポリ(A)結合タンパク質はまた、テールを分解から保護し、mRNA産生を調節し得る。
本明細書においてナノプレックスとも称されるリボヌクレオタンパク質は、一実施形態において、ナノ粒子であり得る。好ましい実施形態において、ナノプレックスは、ナノ粒子を含む。リボヌクレオタンパク質またはナノプレックスは、反対に荷電したポリ電解質を有する薬物ナノ粒子によって形成される複合体である。カチオン性薬物およびアニオン性薬物の両方は、反対に荷電したポリ電解質と複合体を形成する。他のナノ構造と比較して、ナノプレックスの収率は概して高く、錯体形成効率は概して良好である。ナノプレックスは、他のナノ構造と比較して調製することも容易である。本願によるリボヌクレオタンパク質またはナノプレックス製剤は、走査型電子顕微鏡、示差走査熱量測定、X線回折および透析研究を使用した、生成収率、錯体化効率、薬物負荷、粒径およびゼータ電位によって特徴付けられる。ナノプレックスは、癌治療、遺伝子薬物送達、脳への薬物送達、ならびにタンパク質およびペプチド薬物送達等の様々な分野において幅広い用途を有する。
リボヌクレオタンパク質またはナノプレックスは、任意の好適なサイズを有することができる。少なくとも1つの実施形態において、リボヌクレオタンパク質またはナノプレックスは、直径が約200nm未満、直径が約100nm未満、直径が約95nm未満、約90nm未満、約85nm未満、約80nm未満、約75nm未満、約70nm未満、約65nm未満、約60nm未満、約55nm未満、約50nm未満、約45nm未満、約40nm未満、約35nm未満、約30nm未満、約25nm未満、約20nm未満、約15nm未満、約10nm未満、約9nm未満、約8nm未満、約7nm未満、約6nm未満、約5nm未満、約4nm、約3nm未満、約2nm未満、または約1nm未満である。約100nm、約95nm、約90nm、約85nm、約80nm、約75nm、約70nm、約65nm、約60nm、約55nm、約50nm、約45nm、約40nm、約35nm、約30nm、約25nm、約20nm、約15nm、約10nm、約9nm、約8nm、約7nm、約6nm、約5nm、約4nm、約3nm、または約2nmの上限、および約95nm、約90nm、約85nm、約80nm、約75nm、約70nm、約65nm、約60nm、約55nm、約50nm、約45nm、約40nm、約35nm、約30nm、約25nm、約20nm、約15nm、約10nm、約9nm、約8nm、約7nm、約6nm、約5nm、約4nm、約3nm、約2nm、または約1nmの下限、およびこれらの任意の組み合わせ、を有する範囲の直径を有するナノ粒子もまた企図される。本願は、ある特定の実施形態において、ナノプレックスのサイズが約50nm~約200nmまたは約10nm~約100nmの範囲であることをさらに提供する。ある特定の実施形態において、ナノプレックスのサイズは、約50nm ~約150nmである。他の実施形態において、ナノプレックスのサイズは、約50nm、約75nm、または約100nmであり得る。
リボヌクレオタンパク質および/またはナノプレックスのサイズは、対象内の特定の位置に局在化するように最適化され得る。例えば、リボヌクレオタンパク質および/またはナノプレックスは、対象の様々な器官に移動することができるように最適化されてもよい。
一実施形態において、リボヌクレオタンパク質および/またはナノプレックスは有機ゲルを含有する。
本願のリボヌクレオタンパク質および/またはナノプレックスは、任意の適切な形状を有することができる。例えば、本発明のリボヌクレオタンパク質および/またはナノプレックスは、メッシュ、球体、正方形、長方形、三角形、円形ディスク、立方体様形状、立方体、直方体(立方体状)、円錐、円筒、プリズム、多面体、ピラミッド型、直角円筒、ロッド、分岐円筒形、ならびに他の規則的または不規則な形状の形状を有し得る。リボヌクレオタンパク質および/またはナノプレックスのポリマーマトリックスは、一実施形態において、絡まった共有結合ポリマーを含有し得る。一実施形態において、マトリックスはヒドロゲルである。
一実施形態において、リボヌクレオタンパク質および/またはナノプレックスマトリックス中のポリマー単位の数は、ポリマー単位から形成される各粒子について10~5000、例えば20~400の範囲である。別の実施形態において、ポリマー単位の数は、10,000~200,000、例えば15,000~200,000のポリマー単位の範囲である。
本願によるリボヌクレオタンパク質および/またはナノプレックスは、官能基化表面を含み得る。一実施形態において、リボヌクレオタンパク質および/またはナノプレックスは負に官能基化される。代替として、リボヌクレオタンパク質および/またはナノプレックスは、正に官能基化されてもよい。他の実施形態において、リボヌクレオタンパク質および/またはナノプレックスは、電荷を有しないか、または中性である。
一実施形態において、リボヌクレオタンパク質および/またはナノプレックスは生分解性である。別の実施形態において、リボヌクレオタンパク質および/またはナノプレックスは非毒性である。
一実施形態において、リボヌクレオタンパク質および/またはナノプレックスは、少なくとも1つの安定剤をさらに含み得る。安定剤は、リボヌクレオタンパク質および/またはナノプレックスの表面上に吸着され得る。リボヌクレオタンパク質および/またはナノプレックスは、液体培地中に分散され得、安定剤は、分散プロセス中の個々のリボヌクレオタンパク質および/またはナノプレックスの分離を補助するためのアジュバントとして使用され得る。個々のリボヌクレオタンパク質および/またはナノプレックスの分離を補助する安定剤の能力は、安定剤を含有する組成物と、安定剤を含まない対照組成物の分散プロセスを比較することによって決定され得る。個々のナノ粒子の分離を補助する安定剤の能力は、より短い分散時間によって示され得る。あるいは、安定剤は、液体培地、好ましくは水性培地中の分散されたナノプレックスの安定性を促進するために使用され得る。
本願の第3の態様は、本明細書に記載されるキメラ分子と、薬学的に許容される担体とを含む組成物に関する。
本願の方法によれば、キメラ分子は、投与のために好適な薬学的組成物に組み込むことができる。本明細書で使用される場合、「薬学的に許容される担体」という用語は、薬学的投与と適合する任意のおよびすべての溶媒、分散培地、コーティング、抗菌および抗真菌化合物、等張および吸収遅延化合物等を含むことが意図される。
本態様において記載されるキメラ分子は、本願の前述の態様に従って行われる。
薬学的組成物は、一般に、組換えまたは実質的に精製されたキメラ分子、および対象への投与に好適な形態の薬学的に許容される担体を伴う。薬学的に許容される担体は、投与される特定の組成物、ならびに組成物を投与するために使用される特定の方法によって部分的に決定される。したがって、タンパク質組成物を投与するための医薬組成物の多種多様な好適な製剤が存在する。例えば、参照によりその全体が本明細書に組み込まれる、Remington’s Pharmaceutical Sciences,Mack Publishing Co.,Easton,PA 18th ed.(1990)を参照のこと。薬学的組成物は、一般に、無菌で実質的に等張性であり、米国食品医薬品局のすべての良好な製造慣行(GMP)規制に完全に準拠して製剤化される。
本明細書で使用される場合、薬学的に許容される担体という用語は、例えば、任意のタイプの非毒性、不活性固体、半固体または液体充填剤、希釈剤、封入材料または製剤補助剤を含む。参照によりその全体が本明細書に組み込まれる、Remington’s Pharmaceutical Sciences Ed.by Gennaro,Mack Publishing,Easton,Pa.,1995は、薬学的組成物の製剤化に使用される様々な担体およびその調製のための既知の技術を開示している。薬学的に許容される担体として機能することができる材料のいくつかの例としては、限定されないが、ラクトース、グルコース、およびスクロース等の糖;トウモロコシデンプンおよびジャガイモデンプン等のデンプン;カルボキシメチルセルロースナトリウム、エチルセルロース、および酢酸セルロース等のセルロースおよびその誘導体;粉末トラガカント;麦芽;ゼラチン;タルク;カカオバターおよび坐剤ワックス等の賦形剤;ピーナッツ油、綿実油、紅花油、ゴマ油、オリーブ油、トウモロコシ油および大豆油等の油;プロピレングリコール等のグリコール;オレイン酸エチルおよびラウリン酸エチル等のエステル;寒天;TWEEN(商標)80等の洗剤;水酸化マグネシウムおよび水酸化アルミニウム等の緩衝剤;アルギン酸;パイロジェンフリー水;等張生理食塩水;リンガー溶液;エチルアルコール;およびリン酸緩衝溶液、ならびにラウリル硫酸ナトリウムおよびステアリン酸マグネシウム等の他の非毒性適合性潤滑剤が挙げられる。着色剤、放出剤、コーティング剤、甘味剤、香味剤および香料剤、防腐剤、および/または抗酸化剤もまた、製剤者の判断に従って組成物中に存在することができる。
本願の化合物は、経口、非経口、例えば、皮下、静脈内、筋肉内、腹腔内、鼻腔内滴下によって、または鼻、のど、および気管支等の粘膜への適用によって投与することができる。それらは、単独で、または好適な薬学的担体と共に投与され得、錠剤、カプセル、粉末、溶液、懸濁液、またはエマルション等の固体形態または液体形態であり得る。
本願の組成物は、例えば、不活性希釈剤と共に、または同化可能な食用担体と共に経口投与されてもよく、またはそれらは、硬質もしくは軟質シェルカプセルに封入されてもよく、錠剤に圧縮されてもよく、またはそれらは、食事の食物と直接組み込まれてもよい。経口治療投与のために、これらの組成物には、賦形剤が組み込まれ、錠剤、カプセル剤、エリキシル剤、懸濁液、シロップ等の形態で使用され得る。このような組成物および調製物は、少なくとも0.1%の活性化合物を含有するべきである。これらの組成物中の組成物の割合は、もちろん変化してもよく、好都合には、単位の重量の約2%~約60%であり得る。経口投与単位が約1~250mgの活性化合物を含有するように、本願による好ましい組成物が調製される。
錠剤、カプセル等はまた、トラガカントガム、アカシア、トウモロコシデンプン、またはゼラチン等の結合剤、リン酸二カルシウム等の賦形剤、トウモロコシデンプン、ジャガイモデンプン、アルギン酸等の崩壊剤、ステアリン酸マグネシウム等の潤滑剤、およびスクロース、ラクトース、またはサッカリン等の甘味剤を含んでもよい。投薬単位形態がカプセルである場合、上記の種類の材料に加えて、脂肪油等の液体担体を含有してもよい。
これらの組成物は、非経口投与することもできる。本組成物の溶液または懸濁液は、ヒドロキシプロピルセルロース等の界面活性剤と好適に混合した水中で調製することができる。分散体はまた、油中のグリセロール、液体ポリエチレングリコール、およびそれらの混合物中で調製することができる。例示的な油は、石油、動物、植物、または合成由来の油、例えば、ピーナッツ油、大豆油、または鉱物油である。一般に、水、食塩水、デキストロース水溶液および関連糖溶液、ならびにプロピレングリコールまたはポリエチレングリコール等のグリコールは、特に注射用溶液のための好ましい液体担体である。通常の保存および使用のための条件下では、これらの調製物は、微生物の増殖を防ぐための防腐剤を含有する。
注射液のために適した薬学的形態は、無菌水溶液、または無菌注射液もしくは分散液の即時調製のための分散液および無菌粉末を含む。すべての場合、剤型は無菌である必要があり、易注射性が存在する程度まで流体でなくてはならない。これは、製造および保存条件下で安定でなければならず、また、細菌および真菌等の微生物の汚染作用から保護されなければならない。担体は、水、エタノール、ポリオール(例えば、グリセロール、プロピレングリコール、および液体ポリエチレングリコール)、それらの好適な混合物、および植物油を含有する溶媒または分散媒であってもよい。
本願の組成物はまた、エアゾール形態で気道に直接投与されてもよい。エアゾールとしての使用のために、溶液または懸濁液中の本願の組成物は、従来のアジュバントと共に、好適な推進剤、例えば、プロパン、ブタン、またはイソブタン等の炭化水素推進剤と共に加圧エアゾール容器にパッケージングされてもよい。本願の材料はまた、吸入器または噴霧器等の非加圧形態で投与されてもよい。
本願の組成物は、いくつかの実施形態において、任意に、全不活性生物、ペプチド、タンパク質、糖タンパク質、炭水化物、またはそれらの組み合わせの形態で、抗炎症剤、抗糖尿病剤、脂質低下剤(hpyolipidemic agents)、化学療法剤、抗ウイルス剤、抗生物質、代謝剤、小分子阻害剤、プロテインキナーゼ阻害剤、アジュバント、アポトーシス剤、増殖剤、有機栄養標的指向剤、免疫学的薬剤、ウイルス、細菌、真菌および寄生生物等の病原体由来の抗原の非限定的な群から選択される第2の薬剤または薬学的組成物、上記のカテゴリに該当し、公開文献に見い出され得るヒト使用のために承認されている薬理学的または免疫学的薬剤の任意の例、任意の他の生物活性成分、またはこれらの任意の組み合わせをさらに含有する。
いくつかの実施形態において、第2の薬剤または薬学的組成物は、抗炎症剤、抗糖尿病剤、脂質低下剤(hpyolipidemic agents)、化学療法剤、抗ウイルス剤、抗生物質、代謝剤、小分子阻害剤、プロテインキナーゼ阻害剤、アジュバント、アポトーシス剤、増殖剤、有機栄養標的指向剤の非限定的な群から選択される。
E3ユビキチンリガーゼおよびその機能ドメインの重要性は、それらが調節する正常な細胞プロセスの数によって強調され、機能喪失または不適切な標的指向化に関連する付随する疾患の根底にある。Ardley et al.,“E3 Ubiquitin Ligases.Essays Biochem.”41:15-30(2005)を参照のこと。これは、参照によりその全体が本明細書に組み込まれる。
本願の第4の態様は、疾患を治療する方法に関する。方法は、疾患を有する対象を選択することと、本明細書に記載の組成物を対象に投与して、該対象に、疾患に罹患していない対象と比較して、基質の増加した発現レベルを与えることとを含む。
本態様において記載されるキメラ分子は、本願の前述の態様に従って行われる。
本明細書で使用される場合、「対象」という用語は、ヒト等の哺乳動物を指すが、家畜(例えば、イヌ、ネコ等)、農場動物(例えば、ウシ、ヒツジ、ブタ、ウマ等)または実験動物(例えば、サル、ラット、マウス、ウサギ、モルモット等)等の別の動物であり得る。用語「患者」は、疾患または状態に罹患しているか、または罹患している疑いのある「対象」を指す。
この方法は、対象に組成物を投与することを含み得、疾患は測定可能な表現型を保有する。疾患の表現型は、いくつかの実施形態において、疾患に罹患していない対象からの表現型と比較して、基質の発現レベルの増加を伴う。この点において、本願の医薬組成物に含まれるキメラ分子は、疾患に罹患していない対象からの表現型と比較して、1つ以上の基質の発現レベルの表現型増加を特徴とする疾患からの症状を治療または緩和するのに有効である。
本願の文脈で治療または予防することができる疾患の非限定的な例としては、癌、転移性癌、固形癌、浸潤性癌、播種性癌、乳癌、肺癌、NSCLC癌、肝臓癌、前立腺癌、脳癌、膵臓癌、リンパ癌、卵巣癌、子宮内膜癌、子宮頸癌、および当該技術分野で既知の他の固形癌、血液細胞悪性腫瘍、リンパ腫、白血病、骨髄腫、脳卒中、虚血、心筋梗塞(myocardial infarction)、うっ血性心不全、脳卒中、虚血、末梢血管疾患、アルコール性肝疾患、肝硬変、パーキンソン病、アルツハイマー病、糖尿病、癌、関節炎、ALS、病原性疾患、特発性疾患、ウイルス性疾患、細菌性疾患、プリオン性疾患、真菌性疾患、寄生生物性疾患、関節炎、創傷治癒、免疫不全、炎症性疾患、再生不良性貧血、貧血、遺伝性障害、先天性障害、1型糖尿病、2型糖尿病、妊娠糖尿病、高血糖症、代謝症候群、リポジストロフィー症候群、脂質異常症、インスリン抵抗性、レプチン抵抗性、アテローム性動脈硬化症、血管疾患、高コレステロール血症、高トリグリセリド血症、非アルコール性脂肪性肝疾患、敗血症性ショック、多臓器機能不全症候群、関節リウマチ、外傷、脳卒中、心筋梗塞(heart infarction)、全身性自己免疫疾患、慢性肝炎、体重過多、および/または肥満、またはこれらの任意の組み合わせが挙げられる。
いくつかの実施形態において、疾患は、癌、転移性癌、脳卒中、虚血、末梢血管疾患、アルコール性肝疾患、肝炎、肝硬変、パーキンソン病、アルツハイマー病、嚢胞性線維症糖尿病、ALS、病原性疾患、特発性疾患、ウイルス性疾患、細菌性疾患、プリオン性疾患、真菌性疾患、寄生生物性疾患、関節炎、創傷治癒、免疫不全、炎症性疾患、再生不良性貧血、貧血、遺伝性障害、先天性障害、1型糖尿病、2型糖尿病、妊娠糖尿病、高血糖症、代謝症候群、リポジストロフィー症候群、脂質異常症、インスリン抵抗性、レプチン抵抗性、アテローム性動脈硬化症、血管疾患、高コレステロール血症、高トリグリセリド血症、非アルコール性脂肪性肝疾患、体重過多または肥満、およびそれらの任意の組み合わせである。
治療のためにインビボで使用される場合、組成物は、有効量、すなわち、所望の治療効果を有する量で対象に投与される。用量および投薬量レジメンは、対象における疾患の程度、使用される特定のペプチドの特徴、例えば、その治療指標、対象、および対象の病歴に依存する。有効量は、医師および臨床医によく知られている方法によって、前臨床試験および臨床試験中に決定することができる。これらの方法において有用な有効量のペプチドは、薬学的化合物を投与するための多くの周知の方法のいずれかによってそれを必要とする哺乳動物に投与され得る。
組成物の投薬量、毒性、および治療有効性は、例えば、LD50(集団の50%に対する致死的な用量)およびED50(集団の50%における治療的に有効な用量)を決定するための、細胞培養または実験動物における標準的な薬学的手順によって決定され得る。毒性効果と治療効果との間の用量比率は、治療指標であり、LD50/ED50の比率として表すことができる。高い治療指標を示す化合物が望ましい場合がある。毒性の副作用を示す組成物が使用され得るが、感染していない細胞への潜在的な損傷を最小限に抑え、それによって副作用を低減するために、このような組成物を罹患した組織の部位に標的指向させる送達システムを設計するための注意が必要である。
いくつかの実施形態において、本願の組成物は、経口的に、非経口的に、皮下に、静脈内に、筋肉内に、腹腔内に、鼻腔内滴下により、移植により、腔内もしくは膀胱内滴下により、眼内に、動脈内に、病変内に、経皮的に、または粘膜への適用により投与される。
本願の第5の態様は、基質サイレンシングのための方法に関する。この方法は、サイレンシングさせる基質を選択することと、本明細書に記載のキメラ分子を提供することと、基質-分子複合体の形成を可能にするのに有効な条件下で基質をキメラ分子と接触させることとを含み、この複合体は、サイレンシングさせる基質の分解を媒介する。
本態様において記載されるキメラ分子は、本願の前述の態様に従って行われる。
本願の第6の態様は、疾患に対する治療有効性について薬剤をスクリーニングする方法に関する。本方法は、疾患状態を媒介する生体分子を提供することと、(i)E3ユビキチンリガーゼ(E3)モチーフを含む分解ドメインと、(ii)上記分解ドメインを生体分子へと特異的に方向付けることができる標的指向ドメインであって、上記分解ドメインに対して異種である、標的指向ドメインと、(iii)上記分解ドメインを上記標的指向ドメインに結合させるリンカーとを含む試験剤を提供することと、試験剤が生体分子の分解を促進するのに有効な条件下で、生体分子を試験剤と接触させることと、接触の結果としての生体分子のレベルを決定することと、上記決定に基づいて、生体分子のレベルを低下させる試験剤を、疾患に対する治療有効性の候補であるとして同定することとを含む。
本態様において記載されるキメラ分子は、本願の前述の態様に従って行われる。
本明細書で使用される場合、「参照レベル」または「対照レベル」という用語は、比較目的で関心がある場合があるバイオマーカー(または生体分子、リガンド、基質等)の量または濃度を指す。いくつかの実施形態において、参照レベルは、健康な対象の対照集団またはタンパク質もしくは基質の異常発現を保有する疾患集団から採取された少なくとも1つのバイオマーカーのレベルの平均として発現される少なくとも1つのバイオマーカーのレベルであってもよい。別の実施形態において、参照レベルは、より早い時期、すなわち、本アッセイの前の同じ対象における少なくとも1つのバイオマーカーのレベルであってもよい。さらに別の実施形態において、参照レベルは、治療レジメンを受ける前の対象における少なくとも1つのバイオマーカーのレベルであり得る。
本明細書で使用される場合、「試料」という用語は、限定されないが、血液(または血漿もしくは血清等の血液の画分)、リンパ液、粘液、涙液、唾液、痰、尿、精液、便、CSF、腹水、または全血等の身体組織または体液を含み得、体内組織の生検試料を含む。試料は、対象からの試料から増殖させた微生物のインビトロ培養も含み得る。試料は、任意の対象、例えば、疾患または疾患を特徴とする状態を有するか、または有する疑いのある対象/患者から得ることができる。
本明細書で使用される場合、「スクリーニング」という用語は、キメラ分子または組成物が、本明細書に記載される標的病理学的状態、すなわち、特定の疾患における欠損によって特徴付けられる疾患または状態を予防または減速させる(減少させる)能力または特徴を有するかどうかを決定することを意味する。
本明細書で使用される場合、キメラ分子または組成物の「有効量」または「治療有効量」という用語は、所望の治療および/または予防効果を達成するのに十分な量、例えば、治療されている疾患に関連する症状の予防または軽減をもたらす量である。対象に投与される化合物の量は、疾患の種類および重症度、ならびに一般的な健康状態、年齢、性別、体重、および薬物に対する耐性等の個体の特徴に依存する。これはまた、疾患の程度、重症度、または段階にも依存する。当業者は、これらおよび他の要因に応じて適切な用量を決定することができる。
本明細書で使用される「酵素結合免疫吸着アッセイ」(ELISA)という用語は、検出可能なシグナルを産生する酵素反応を介して目的の抗原の検出が達成される抗体ベースのアッセイを含む。ELISAは、競合形式または非競合形式で実行することができる。ELISAはまた、抗原を捕捉するための1つの抗体、および捕捉された抗体-抗原複合体を検出するための酵素または他の検出可能な標識で標識された1つの抗体である、抗原に対する2つの抗体が使用される2部位または「サンドイッチ」アッセイも含む。典型的な2部位ELISAにおいて、抗原は、非標識抗体および酵素結合抗体が高親和性で結合することができる少なくとも1つのエピトープを有する。したがって、抗原は、親和性捕捉され、酵素結合抗体を使用して検出することができる。選択される典型的な酵素としては、アルカリホスファターゼまたは西洋ワサビペルオキシダーゼが挙げられ、これらの両方は、適切な基質と接触すると検出可能な産物を生成する。
本明細書で使用される場合、「エピトープ」という用語は、抗体に特異的に結合することができるタンパク質決定基を含む。エピトープは、通常、アミノ酸または糖側鎖等の分子の化学的に活性な表面基からなり、通常、特定の三次元構造特性、ならびに特定の電荷特性を有する。コンフォメーションエピトープおよび非コンフォメーションエピトープは、前者への結合が変性溶媒の存在下で失われるが、後者への結合が失われないという点で区別される。典型的には、エピトープは、1つ以上の標的指向ドメインによって認識され得る基質を形成する決定基領域である。
エピトープを保有する標的指向ドメインまたは基質についてスクリーニングするために、参照によりその全体が本明細書に組み込まれる、Antibodies,A Laboratory Manual,Cold Spring Harbor Laboratory,Ed Harlow and David Lane(1988)に記載されるもの等の日常的な交差ブロッキングアッセイを実行することができる。このアッセイを使用して、標的指向ドメインが、異なる標的指向ドメイン、抗体、抗体フラグメント等と同じ基質の部位またはエピトープに結合するかどうかを決定することができる。代替的または追加的に、エピトープマッピングは、当該技術分野で既知の方法によって実行することができる。例えば、抗体配列は、接触残基を同定するために、例えば、アラニンスキャニングによって変異誘発することができる。異なる方法では、基質の異なる領域に対応するペプチドは、試験標的指向ドメインとの競合アッセイ、または試験抗体および標的指向ドメインまたは特徴付けられたエピトープを有する抗体との競合アッセイにおいて使用することができる。
本明細書で使用される場合、「超可変領域」という用語は、抗原結合の原因である抗体のアミノ酸残基を指す。超可変領域は、一般に、「相補性決定領域」または「CDR」由来のアミノ酸残基、例えば、VL中の約24~34(L1)、50~56(L2)および89~97(L3)残基の周り、ならびにVH中の約31~35B(H1)、50~65(H2)および95~102(H3)残基の周り(Kabat et al.,Sequences of Proteins of Immunological Interest,5th Ed.Public Health Service,National Institutes of Health,Bethesda,MD.(1991)、これは、参照によりその全体が本明細書に組み込まれる)、および/または「超可変ループ」由来のそれらの残基(例えば、VLにおける残基26~32(L1)、50~52(L2)および91~96(L3)、ならびにVHにおける26~32(H1)、52A~55(H2)および96~101(H3))(参照によりその全体が本明細書に組み込まれる、Chothia and Lesk,“Canonical Structures for the Hypervariable Regions of Immunoglobulins,”J.Mol.Biol.196:901-17(1987))を含む。
本明細書で使用される場合、「単離された」または「精製された」ポリペプチド、ペプチド、分子、またはキメラ分子という用語は、薬剤が由来する細胞もしくは組織源からの細胞材料または他の汚染ポリペプチドを実質的に含まないか、または化学合成されたときに化学前駆体または他の化学物質を実質的に含まない。例えば、キメラ分子は、そのような分子の意図される機能、診断または治療用途と干渉する材料を含まない。このような干渉物質は、キメラ分子、酵素、ホルモン、ならびに他のタンパク質性および非タンパク質性溶質に包含される物質以外のタンパク質またはフラグメントを含み得る。
一実施形態において、同定は、疾患に罹患していない対象における標準生体分子レベルに関して行われる。同定は、いくつかの実施形態において、接触がない生体分子レベルに関してもまた行われ得る。この点において、対照レベルを用いて、試料中の生体分子のレベルと比較することができる。いくつかの実施形態において、対照レベルは、疾患に罹患していない対象由来の生体分子のレベルである。基質レベルに影響を及ぼす疾患または状態を有すると疑われる対象から得られる試料中の生体分子の過剰存在は、健康な対象から得られる試料と比較して、試験される対象における生体分子関連の疾患または状態を示す。
ある特定の基質生体分子の過剰存在の程度によって、対象が疾患に罹患しているか、または疾患を発症する可能性があるかが示されることが知られている、無数の疾患が存在する。例えば、参照によりその全体が本明細書に組み込まれる、Anderson et al.,“Discovering Robust Protein Biomarkers for Disease from Relative Expression Reversals in 2-D DIGE Data,”Proteomics 7:1197-1207(2007)を参照のこと。対照対象と比較して生体分子が増加する状態の例としては、上述の疾患が挙げられる。
したがって、本願のキメラ分子および組成物は、治療を必要とする対象に投与される。E3モチーフをコードするE3遺伝子産物等のE3ユビキチンリガーゼは、上述され、本明細書に開示されるキメラ分子の有効性を決定するための本スクリーニング方法において使用することができる。いくつかの実施形態において、好適なインビトロアッセイまたはインビボアッセイを実施して、本願のキメラ分子および組成物の効果、ならびに投与が治療のために適応されるかどうかを決定する。治療における使用のための組成物は、限定されないが、ラット、マウス、ニワトリ、ウシ、サル、ウサギ等を含む好適な動物モデル系において、ヒト対象における試験の前に試験することができる。同様に、インビボ試験のために、当該技術分野で既知の動物モデル系のいずれも、ヒト対象への投与の前に使用することができる。
細胞、臓器、または組織を組成物と接触させるための当業者に既知の任意の方法が用いられ得る。インビボ方法は、典型的には、哺乳動物、好適には、上記のもの等のヒトへのキメラ分子または組成物の投与を含む。治療のためにインビボで使用される場合、キメラ分子または組成物は、本明細書に記載されるように、対象に有効量で投与される。結果は、本明細書に記載の方法の開始時に示される経験的変数に従って確認することができる。
インビトロ方法は、典型的には、試料または抽出物に対する、上記のもの等のキメラ分子または組成物の効果をアッセイすることを含む。いくつかの実施形態において、キメラ分子の有効性は、基質分解に対する影響、すなわち、キメラ分子および組成物が試料中の表現型変化をもたらす能力を評価することによって決定することができる。そのような方法には、限定されないが、免疫組織化学、免疫蛍光、ELISPOT、ELISA、またはRIAが含まれる。種々の有用な免疫検出方法の工程は、例えば、Nakamura et al.,Enzyme Immunoassays:Heterogeneous and Homogeneous Systems,Handbook of Experimental Immunology,Vol.1:Immunochemistry 27.1-27.20(1986)などの科学文献に記載され、これらの各々は参照によりその全体が本明細書に組み込まれ、具体的には免疫検出方法に関するその教示のために組み込まれる。
イムノアッセイは、それらの最も単純かつ直接的な意味において、抗体と抗原との間の結合を伴う結合アッセイである。多くの種類および形式のイムノアッセイが既知であり、全てが開示されたバイオマーカーの検出に適している。イムノアッセイの例は、酵素結合免疫吸着アッセイ(ELISA)、酵素結合免疫スポットアッセイ(ELISPOT)、ラジオイムノアッセイ(RIA)、ラジオイムノ沈殿アッセイ(RIPA)、免疫ビーズ捕捉アッセイ、ウェスタンブロッティング、ドットブロッティング、ゲルシフトアッセイ、フローサイトメトリー、免疫組織化学、蛍光顕微鏡、タンパク質アレイ、多重ビーズアレイ、磁気捕捉、インビボイメージング、蛍光共鳴エネルギー伝達(FRET)、および光退色後の蛍光回復/局在化(FRAP/FLAP)である。
一般に、イムノアッセイは、目的となる分子(開示される生体分子)を含有する疑いのある試料を、目的となる分子に対する抗体と接触させるか、場合によっては、免疫複合体の形成を可能にするのに有効な条件下で、目的となる分子に対する抗体(開示される生体分子に対する抗体等)を、抗体によって結合することができる分子と接触させることを含む。この点において、当業者は、所与の試料中の特定の生体分子の存在およびまたはレベルを評価することができる。続いて、本願のキメラ分子組成物をアッセイに添加する。その後、本明細書に記載のイムノアッセイを使用して、治療後の表現型効果を決定するために、生体分子のレベル、すなわち、その存在またはレベルを評価することができる。
イムノアッセイは、試料中の目的となる生体分子の量を検出または定量するための方法を含み得、この方法は、一般に、結合プロセス中に形成される任意の免疫複合体の検出または定量を伴う。一般に、免疫複合体形成の検出は当該技術分野で周知であり、多数のアプローチの適用によって達成され得る。これらの方法は、概して、任意の放射性、蛍光性、生物学的もしくは酵素的タグ、または任意の他の既知の標識等の標識またはマーカーの検出に基づく。例えば、各々は参照によりその全体が本明細書に組み込まれ、具体的には免疫検出方法および標識に関する教示のために組み込まれる、米国特許第3,817,837号、同第3,850,752号、同第3,939,350号、同第3,996,345号、同第4,277,437号、同第4,275,149号、および同第4,366,241号を参照されたい。
本願の治療方法は、上述のように、標的指向ドメインに結合したユビキチン領域を保有する。いくつかの実施形態において、標的指向ドメインは、上述の細胞内生体分子に結合する。同様に、本願の治療方法は、標的指向ドメインと基質との間の結合の立体破壊を防止するのに十分な長さのポリペプチドリンカーを使用する。いくつかの実施形態において、生体分子は上述の疾患と関連付けられる。
一実施形態において、この方法は複数の試験剤を用いて行われる。
本願の第7の態様は、疾患バイオマーカーについてスクリーニングする方法に関する。本方法は、1つ以上のリガンドを発現する疾患細胞の試料を提供することと、(i)E3ユビキチンリガーゼ(E3)モチーフを含む分解ドメインと、(ii)上記分解ドメインを1つ以上のリガンドへと特異的に方向付けることができる標的指向ドメインであって、上記分解ドメインに対して異種である、標的指向ドメインと、(iii)上記分解ドメインを上記標的指向ドメインに結合させるリンカーとを含む複数のキメラ分子を提供することと、疾患細胞がキメラ分子の非存在下で増殖することに失敗するのに有効な条件下で、試料を複数のキメラ分子と接触させることと、キメラ分子のうちのどれが疾患細胞の増殖を可能にするかを決定することと、決定に基づいて、キメラ分子に結合しかつ疾患細胞の増殖を可能にするリガンドを、疾患のバイオマーカーとして同定することとを含む。
本態様において記載されるキメラ分子は、本願の前述の態様に従って行われる。
本明細書で使用される場合、「バイオマーカー」または「生体分子」または「分子」という用語は、対照対象または対照対象集団から採取された同等の試料と比較して、疾患を有する患者から採取された試料中に示差的に存在するポリペプチド(特定の発現レベルのもの)を指す。
本明細書で使用される場合、「リガンド」または「基質」という用語は、タンパク質、分子、キメラ分子、リガンド(二量体)、基質(二量体)、第2の基質、第2のリガンド、標的ドメイン、領域、部分、およびそれらのフラグメント、ユビキチンまたはE3モチーフ領域、ドメイン、またはそれらの部分、生体分子、バイオマーカー等に結合し、それらと一過性または安定な複合体を形成し、生物学的目的、例えば、酵素反応のプロセスで酵素と相互作用する基質を供給することができる物質を指す。リガンドはまた、イオン結合、水素結合、およびファンデルワールス力等の分子間力によって標的タンパク質上の部位に結合するシグナル誘発分子を含む。いくつかの実施形態において、基質はリガンドに結合する、および/またはリガンドは基質に結合する。
すべての疾患ではないにしても、多くは複雑で多因子である。例えば、神経変性を考慮する場合、実質的な神経細胞損失は、病理学的提示の前に生じる。神経変性疾患を治療するためのこのような薬物のスクリーニングおよび開発は、症状を改善する補助療法によってさらに妨害される。したがって、標的検出は、事前の治療投与によって曖昧にされ、これは、次いで、疾患の進行を遅くし、治療レジメンをさらに混乱させ得る。このようにして、本願は、表現型スクリーニング分析を用いることによる疾患バイオマーカーの解明のための新しい発明的スクリーニング方法を提供する。例えば、Pruss,R.M.,“Phenotypic Screening Strategies for Neurodegenerative Diseases:A Pathway to Discover Novel Drug Candidates and Potential Disease Targets or Mechanisms.”CNS&Neurological Disorders-Drug Targets,9,693-700(2010)を参照のこと。これは、参照によりその全体が本明細書に組み込まれる。
表現型スクリーニングは、疾患に罹患している患者からの適切な試料、例えば、細胞のクラス、細胞抽出物、ニューロン、組織等を使用し、試料を本明細書に記載の1つ以上のキメラ分子に供することを伴う。その後、試料は、疾患細胞の生存率、増殖、細胞プロセスおよび/または表現型特徴、例えば、収縮、膜電位の喪失、形態変化等についてスクリーニングされる。画像解析ソフトウェアを使用すると、細胞体または他のオブジェクトが結果を経験的に評価することができる。スクリーニングからのヒットは、生存経路を刺激すること、栄養因子を模倣すること、またはデスシグナル伝達を阻害することによって細胞生存を維持することができる。次いで、標的指向性二次アッセイにおけるより高いコンテンツスクリーニングおよびプロファイリングを使用して、有望なヒットの標的および作用機序を特定することができる。
バイオマーカースクリーニング分析を実行することができる疾患状態の例としては、上記の疾患が挙げられる。いくつかの実施形態において、疾患バイオマーカーについてスクリーニングする方法は複数の分子を含み、分子は上述のE3モチーフを保有する。いくつかの実施形態において、バイオマーカースクリーニング方法は、上述の標的指向ドメインを保有する分子を含む。本願のスクリーニング方法は、標的指向ドメインと生体分子および/またはリガンドとの間の結合の立体破壊を防止するのに十分な長さのポリペプチドリンカーを使用する。
キメラ分子が治療指標を提供すると決定されると、バイオマーカーは、標的指向ドメイン領域(またはキメラ分子全体)を使用して単離され、試料からバイオマーカーを免疫沈降させ、これは、その後、当該技術分野で周知の方法を使用して同定される。バイオマーカー単離および精製方法には、限定されないが、例えば、サイズ排除または親和性ベースのカラム樹脂を使用したHPLCまたはFPLCクロマトグラフィーが含まれる。例えば、参照によりその全体が本明細書に組み込まれる、Sambrook et al.1989,Cold Spring Harbor Laboratory Pressを参照されたい。
本願のポリペプチドの活性フラグメント、誘導体、または変異体は、例えば、ポリペプチドの特性、二次構造、および生物学的活性に最小限の影響を与えるアミノ酸の欠失または付加によって認識され得る。例えば、ポリペプチドは、タンパク質の細胞下または細胞外局在化を翻訳と同時にまたは翻訳後に方向付けるタンパク質のN末端のシグナル(またはリーダー)配列に連結され得る。
次いで、バイオマーカーは、当該技術分野で既知の技法を使用して解明され得る。いくつかの実施形態において、バイオマーカーの同一性の決定は、MALDI-TOF、質量分析、質量スペクトロスコピー、タンパク質配列決定、抗体相互作用、ウェスタンブロット、イムノアッセイ、ELISA、クロマトグラフィー技術、逆プロテオミクス、免疫沈降、ラジオイムノアッセイ、および免疫蛍光、またはこれらの任意の組み合わせを使用して行われる。
タンパク質の研究および同定のための好適な質量分析技術としては、レーザー脱離イオン化質量分析およびエレクトロスプレーイオン化質量分析が挙げられる。レーザー脱離イオン化(LDI)質量分析(MS)のカテゴリ内では、マトリックス補助LDI(MALDI)と表面補助LDI(SELDI)飛行時間(TOF)MSの両方が用いられ得る。SELDI TOF-MSは、アトモル感度の分析、低豊富タンパク質(pg-ng/ml)の定量化、および高度に再現可能な結果を提供するため、本方法における使用のために特に適している。
本明細書に記載の方法は、例えば、過剰発現基質、生体分子、またはバイオマーカーを伴う疾患または病気の症状を呈する対象を治療するために、例えば臨床環境において好都合に使用することができる、少なくとも1つの試薬、例えば、本明細書に記載のキメラ分子または組成物を含む予めパッケージングされたキットを利用することによって実行することができる。さらに、本願のキメラ分子を発現させることができる任意の細胞型または組織は、本明細書に記載のキットにおける使用のために好適である。
本願の別の態様において、本願のキメラ分子および組成物を使用するためのキットまたは試薬システム。このようなキットは、本明細書に開示される方法に従ってアッセイを行うために必要な特定の要素を含む試薬の組み合わせを含有する。試薬システムは、試薬の適合性が、試験デバイス構成において、またはより典型的には、試験キットとして、すなわち、必要な試薬を保持する1つ以上の容器、デバイス等のパッケージングされた組み合わせを可能にする組成物または混合物として、市販のパッケージングされた形態で提示され、好ましくは、アッセイの実施のための書面による説明書を含む。このキットは、アッセイの任意の構成に適合され得、本明細書に記載の様々なアッセイ形式のいずれかを実行するための組成物を含み得る。
開示される方法に有用な試薬は、溶液中に貯蔵することができるか、または凍結乾燥することができる。凍結乾燥されると、試薬の一部または全ては、溶解後に容易に使用するために、マイクロタイタープレートウェルに容易に貯蔵することができる。当該技術分野で既知の試薬を凍結乾燥させるための任意の方法が、開示される方法に有用な乾燥試薬を調製するために好適であることが企図される。
また、本願の範囲内には、本願のキメラ分子/組成物および第2の薬剤、ならびに使用説明書を含むキットがある。キットは、例えば、限定されないが、血清、血漿、リンパ液、嚢胞性流体、尿、便、脳脊髄液、腹水(acitic fluid)、または血液を含む任意の体液、および体内組織の生検試料を含む、生物学的試料中、基質の存在を検出するのに有用である。例えば、キットは、生体試料中の基質に結合することができる標的指向ドメインに連結されたE3モチーフユビキチン領域から構成される1つ以上のキメラ分子を含むことができる。
以下の実施例は、本願の実施形態を例証するために提供されるが、それらはその範囲を限定することを決して意図するものではない。
以下の実施例は、本願の例示的な実施形態を実証するために含まれる。当業者には、以下の実施例に開示される技法は、本願の実施において良好に機能するために発明者によって発見された技法を表し、したがって、その実施のための好ましいモードを構成すると見なすことができることが理解されるべきである。しかし、当業者は、本願に照らして、本願の技術思想および範囲から逸脱することなく、開示され、依然として同様のまたは類似の結果を得る特定の実施形態において多くの変更が行われ得ることを理解すべきである。
実験方法
プラスミド。本研究で使用されるすべてのプラスミドが、表1に提供される。
プラスミド。本研究で使用されるすべてのプラスミドが、表1に提供される。
大腸菌(E.coli)株DH5αを、すべてのプラスミドの構築および増殖に使用した。PcDNA3-EGFPを構築するために、5’Kozak配列を導入したプライマーを使用してEGFPをPCR増幅し、得られたPCR産物をpcDNA3にライゲーションした。5’Kozak配列を導入したプライマーによるオーバーラップエクステンションPCRを使用したERK2およびEGFPの遺伝子アセンブリ、続いて、pCDH1へのライゲーションによって、プラスミドpCDH1-ERK2-EGFPを作製した。5’Kozak配列および3’SV40 NLS配列を付加したプライマーを用いたEGFPのPCR増幅、次いでpcDNA3中へのPCR産物のライゲーションによって、プラスミドpcDNA3-EGFP-NLSを作製した。5’Kozak配列によるSHP2のPCR増幅、続いてpcDNA3-EGFPへのライゲーションによって、プラスミドpcDNA3-SHP2-EGFPを作製した。プラスミドmEGFP-HRasG12VからのEGFP-HRasG12VのPCR増幅、その後、pCDH1へのPCR産物のライゲーションによって、プラスミドpcDNA3-EGFP-HRasG12Vを生成した。
GFP指向性uAbの作製のために、上流Kozak、6×His、およびFLAG配列を導入したプライマーを使用したpHFT2-GS2からのGS2のPCR増幅(Koide et al.,“Teaching an Old Scaffold New Tricks:Monobodies Constructed Using Alternative Surfaces of the FN3 Scaffold,”J.Mol.Biol.415(2):393-405(2012)、これは、参照によりその全体が本明細書に組み込まれる)、続いてpcDNA3へのライゲーションによって、プラスミドpcDNA3-HF-GS2を構築し、BamHIおよびEcoRI制限部位が、N末端融合物を生成するためにGS2の上流で利用可能であるようにした。C末端融合物については、上流Kozak配列ならびに下流NheIおよびSbfI制限部位を導入したプライマーを用いてGS2をPCR増幅することによって、続いて、pcDNA3へのライゲーションを行って、プラスミドpcDNA3-GS2-FHを作製した。AvrPtoB、IpaH9.8、NleG2-3、NleG5-1、NleL、SlrP、SopA、SPOP、SspH1、SspH2、およびXopLをコードする遺伝子を、NheIおよびSbfI部位を導入するプライマーでPCR増幅し、その後、得られたPCR産物をpcDNA3-GS2-FH中にライゲーションした。LegAU13、LegU1、およびSidCをコードする遺伝子を、BamHIおよびEcoRI部位を導入するプライマーでPCR増幅し、その後、得られたPCR産物をpcDNA3-HF-GS2中にライゲーションした。プラスミドpcDNA3-GS2-CHIPは、上流HindIIIおよびKozak配列ならびに下流NheI部位を導入したプライマーを使用してpHFT2-GS2からGS2をPCR増幅し、続いてscFvR4の代わりにpcDNA3-R4-CHIPΔTPR中にライゲーションすることによって作製した。プラスミドpcDNA3-VHL-GS2およびpcDNA3-βTrCP-GS2は、HindIIおよびXhoI(VHL)またはBamHIおよびXhoI(βTrCP)部位を導入したプライマーを用いてVHLおよびβTrCPをコードする遺伝子をPCR増幅し、その後、得られたPCR産物を、NSlmbの代わりにpcDNA3-NSlmb-GS2中にライゲーションすることによって作製した。プラスミドpcDNA3-GS2-IpaH9.8C337A、pcDNA3-GS2-IpaH0722、pcDNA3-GS2-IpaH1.4、pcDNA3-GS2-IpaH2.5、pcDNA3-GS2-IpaH4.5、およびpcDNA3-GS2-IpaH7.8は、pcDNA3-GS2-IpaH9.8の部位特異的変異誘発によって作製した。以下の遺伝子を購入した:SspH1(Twist Biosciences)、IpaH9.8(Twist Biosciences)、VHL(GenScript、Ohu23297D)、LubX(Twist Biosciences)、LegU1(IDT)およびLegAU13(IDT)。他の全ては、実験室在庫中の既存のプラスミドまたはゲノムDNAから増幅した。
プラスミドpET24d-GS2-IpaH9.8およびpET24d-IpaH9.8ΔLRRは、NcoIおよびNotI(GS2-IpaH9.8)またはNheIおよびNotI(IpaH9.8ΔLRR)部位を導入したプライマーを用いて、全長GS2-IpaH9.8および切断型IpaH9.8ΔLRRをそれぞれPCR増幅し、その後、得られたPCR産物をpET24d(+)にライゲーションすることによって作製した。プラスミドpET28a-GS2は、上流NcoI部位ならびに下流FLAG、6×His、およびHindIII配列を導入したプライマーを使用してpHFT2-GS2からGS2をPCR増幅し、その後、得られたPCR産物をpET28a(+)にライゲーションすることによって作製した。プラスミドpTriEx-3-GS2-IpaH9.8C337Aは、EcoRVおよびHindIII部位を導入したプライマーを用いてpcDNA3-GS2-IpaH9.8C337AからGS2-IpaH9.8C337AをPCR増幅し、その後、得られたPCR産物をpTriEx-3にライゲーションすることによって作製した。プラスミドpET28a-EGFPは、C末端6×Hisタグを付加するプライマーを用いてGFPをPCR増幅し、その後、得られたPCR産物をpET28a(+)中にライゲーションすることによって作製した。すべてのプラスミドを、コーネルバイオテクノロジーリソースセンター(BRC)でのDNA配列決定によって検証した。
細胞株、培養およびトランスフェクション。本研究で使用されるすべての細胞株が、表1に提供される。簡潔に述べると、HEK293TおよびHeLa細胞はATCCから得、HeLa H2B-EGFP細胞はElena Niggにより恵与され、MCF10A rtTA細胞はMatthew Paszekにより恵与された。HEK293T、HeLa、およびHeLa H2B-EGFP細胞は、10%FetalCloneI(VWR)および1%ペニシリンストレプトマイシン-アンフォテリシンB(ThermoFisher)が補充された4.5g/LグルコースおよびL-グルタミン(VWR)を有するDMEM中で培養し、MCF-10a細胞は、5%ウマ血清(ThermoFisher)、20ng/mL EGF(Peprotech)、0.5mg/mLヒドロコルチゾン(Sigma)、100ng/mLコレラ毒素(Sigma)、10μg/mLインスリン(Sigma)、および1%ペニシリンストレプトマイシン-アンフォテリシン B(ThermoFisher)が補充されたDMEM/F 12培地(ThermoFisher)中で培養した。全ての細胞を、37℃、5%CO2、および90%の相対湿度(RH)で維持した。
PiggyBacトランスポザーゼの高活性バージョンの発現プラスミドであるNucleofection Kit V(Lonza)およびHyPBaseを使用して、安定したMCF10A rtTA細胞株を生成した。MCF10 A rtTA細胞の転位を行って、以下の安定した株を生成した:MCF10A EGFP-HRasG12V、MCF10A EGFP-HRasG12V:GS2-IpaH9.8、MCF10A EGFP-HRasG12V:GS2-IpaH9.8C337A、およびMCF10A GS2-IpaH9.8。200μg/mLのハイグロマイシンB(ThermoFisher)を使用して、安定した細胞株を選択した。
EGFP、EGFP-HRasG12V、ERK2-EGFP、d2EGFPを発現する安定したHEK293T細胞株をレンチウイルス形質転換によって作製した。具体的には、pLV IRES eGFP、pcDH1 eGFP-HRasG12V、pcDH 1ERK2-EGFP、またはpHIV-d2EGFPを、psPAX2およびpMD2.Gと共にHEK293T細胞にリン酸カルシウムトランスフェクトによってトランスフェクトした。培地を約16時間後に置き換え、続いてウイルス産生を可能にするために48時間のインキュベーションを行った。ウイルス上清を除去し、ポリブレン(Sigma-Aldrich)を8μg/mLの最終濃度まで添加し、続いて、2,000rpmで5分間遠心分離することによって細胞デブリを除去した。得られた上清を細胞培地で1:6で希釈し、安定した組み込みのために、事前にプレーティングされたHEK293T細胞に添加した。HEK293T EGFおよびHEK293T ERK2-EGFP細胞株を蛍光活性化細胞選別(BD FACSAria)によって選択した。HEK293T EGFP-HRasG12V細胞株を、1μg/mLのピューロマイシン(Sigma-Aldrich)を使用して選択した。
ウェスタンブロット分析。HEK293T細胞を10,000細胞/cm2で播種し、上述のようにトランスフェクトした後、RIPA溶解緩衝液(Thermo Fisher)で溶解した。MCF10A細胞を20,000細胞/cm2で播種し、0.2μg/mLのドキシサイクリンで24時間誘導した後、細胞溶解緩衝液で溶解した。溶解物を任意のkDのポリアクリルアミドゲル(Bio-Rad)上で分離し、PVDF膜に移した。α-HIS-HRP(Abcam)、α-GFP(Krackeler)およびα-GAPDH(Millipore)抗体を1:5,000で、TBST+1%ミルクに希釈し、室温で1時間インキュベートした。HRP結合(Promega)を有する二次抗体ヤギ抗マウスIgGを1:2,500で希釈し、必要に応じて使用した。
フローサイトメトリー分析。細胞を12ウェルプレートに10,000細胞/cm2で播いた。播種から16~24時間後、DNA:jetPrime(Polyplus Transfection)比1:2で1μgの総DNAを細胞に一過性にトランスフェクトした。細胞に0.05μgの標的、0.25μgのユビキボディまたは対照をトランスフェクトし、空のpcDNA3ベクターでバランスを取った。トランスフェクションの4~6時間後に培養培地を交換した。次いで、トランスフェクションの24時間後に、細胞を回収し、FACS CaliburまたはFACSAria融合物(BD Biosciences)を使用して分析するためにリン酸緩衝食塩水(PBS)中に再懸濁した。FlowJo Version 10を使用して、10,000の事象から決定された幾何平均蛍光によって試料を分析した。
顕微鏡検査。細胞を、ポリ-L-リジン(Sigma-Aldrich)で前処理したガラス底12ウェルプレート上に10,000細胞/cm2で播種した。播種から16~24時間後、DNA:jetPrime(Polyplus Transfection)比1:2で1μgの総DNAを細胞にトランスフェクトした。細胞に0.05μgの標的、0.25μgのユビキボディまたは対照をトランスフェクトし、空のpcDNA3ベクターでバランスを取った。トランスフェクションの4~6時間後に培養培地を交換した。次いで、トランスフェクションの24時間後に、細胞を4%パラホルムアルデヒドで固定した。EGFR-EGFP試料について、PBS中の5%正常ヤギ血清で2時間細胞をブロックした。抗EGFR抗体(Cell Signalling #4267)をPBS中の5%正常ヤギ血清中で1:200に希釈し、4℃で一晩インキュベートした。細胞をPBSで3回洗浄し、次いで、PBS中の5%正常ヤギ血清中で1:200に希釈された抗ウサギ-AF647と共に室温で1時間インキュベートした。細胞をPBSで3回洗浄した。細胞核を、PBS中で1:10,000で希釈したHoeschtで10分間染色し、次いでPBS中で3回洗浄した。40倍水中浸漬対物レンズを用いて、試料を反転Zeiss LSM88焦点/マルチフォトン顕微鏡(i880)上で撮像した。画像をFIJIで分析した。
タンパク質発現および精製。精製タンパク質は、所望のタンパク質をコードするpET28aベースのプラスミドを含有する大腸菌BL21(DE3)細胞、またはpTriEx-3ベースのプラスミドを含有するRosetta(DE3)細胞を、ルリア-ベルタニ(LB)培地200mL中で37℃で増殖させることによって得た。培養密度(Abs600)が0.6~0.8に達したとき、発現を0.1mMのIPTGで誘導し、30℃で6時間成長を続けさせた。培養物を4℃で30分間、4,000×gで遠心分離することによって回収した。細胞ペレットを-20℃で一晩保存した。解凍したペレットを10mL平衡緩衝液(25mMのTris-HCl、pH7.4、500mMのNaClおよび20mMのイミダゾール)中に再懸濁し、高圧ホモジナイザー(Avestin Emulsi-Flex C5)で溶解した。不溶性画分を、4℃で30分間、12,000×gで遠心分離することによって除去した。Hisタグ付きタンパク質を、500μLのHisPur Ni-NTA樹脂(ThermoFisher)を使用して重力流によって精製した。可溶性画分を樹脂に通し、その後、樹脂を3mLの洗浄緩衝液(25mMのTris-HCl、pH7.4、500mMのNaCl、および50mMのイミダゾール)で洗浄した。タンパク質を1.5mLの溶出緩衝液(25mMのTris-HCl、pH7.4、500mMのNaCl、および250mMのイミダゾール)で溶出した。精製画分を脱塩し、濃縮した(Pierce PESタンパク質濃縮器)。
ELISA。96ウェル酵素イムノアッセイプレートを、0.05MのNaCO3緩衝液(pH 9.6)中、10μg/mLのEGFP 100μLで、4℃で一晩コーティングした。次いで、プレートをウェル当たり200μLのPBST(1×PBS+0.1% Tween 20)で3回洗浄し、ウェル当たり250μLの3%ミルクを含むPBSで、室温で3時間ブロックし、ゆっくりと混合した。プレートをさらに3回洗浄し、ウェル当たり60μLのブロッキング緩衝液中の精製タンパク質の連続希釈物の添加を行った。プレートを室温でインキュベートし、1時間ゆっくりと混合した。プレートを3回洗浄して、結合していないタンパク質を除去し、次いで、PBST+1%ミルク中で1:10,000に希釈された西洋ワサビペルオキシダーゼ(HRP)結合抗FLAG(DDDYK)抗体(50μL/ウェル)とともに1時間インキュベートした。プレートを3回洗浄してから、50μL/ウェルのワンステップウルトラTMB(3,3’,5,5’-テトラメチルベンジジン)(ThermoFisher)を添加した。反応物をゆっくりと混合しながらインキュベートし、次いで、50μL/ウェルの3NH2SO4でクエンチした。次いで、クエンチしたプレートを450nmで読み取った。
カチオン性ポリペプチドの合成および特徴付け。N4(TEP)ポリアミンを、Uchidaおよび共同研究者らの修正された手順に従って、最近記載された本群の研究者として合成した(Li et al.,“Polyamine-Mediated Stoichiometric Assembly of Ribonucleoproteins for Enhanced mRNA Delivery,”Angew Chem.Int.Ed.Engl.56(44):13709-12(2017)、これは参照によりその全体が本明細書に組み込まれる)。Uchida et al.,“Modulated Protonation of Side Chain Aminoethylene Repeats in N-Substituted Polyaspartamides Promotes mRNA Transfection,”J.Amer.Chem.Soc.136(35):12396-405(2014)、これは、その全体が参照により本明細書に組み込まれる。簡潔に述べると、N-メチル-2-ピロリドン(NMP)(Sigma)(2mL)中のポリ(β-ベンジル-L-アスパラギン酸塩)の冷却溶液に、NMPで2倍に希釈した50当量のテトラエチレンペンタミン(Sigma)を撹拌しながら滴下した。0℃で2時間撹拌した後、pHを冷却6N HClを撹拌しながら滴下添加して1に調節した。得られた溶液を、再生セルロース膜バッグ(Spectrum Laboratories、1kDa MWCO)から0.01N HClに対して、続いて蒸留水に対して透析し、凍結乾燥させて白色の粉末を得た。本研究で使用したポリアミンを、25℃でBruker Avance 400MHz NMR分光計を用いて、重水素酸化物中の1H NMRスペクトル(Cambridge Isotope Laboratories)によって特徴付けた。1H NMR(400MHz,D2O)δ4.72(s,1H),3.64-3.39(m,9H),3.37-3.05(m,5H),3.00-2.62(m,4H)。
インビトロ転写によるmRNAの調製。uAbをコードするcDNAは、GFPフラグメントをXbaIおよびNotI部位に置き換えることによってpGEM4Z/GFP/A64にクローニングした。加えて、ヒトα-グロビン3’UTR配列を、NotIおよびEcoRIを使用してcDNAとポリAテールとの間に配置してmRNA翻訳を改善した。SpeIによる直線化、続いてHiScribe(商標)T7高収率RNA合成キット(NEB)によるインビトロ転写(IVT)により、64ヌクレオチドのベクター由来配列、コード配列、α-グロビン3’UTR、および64A残基を含有する転写産物を得た。典型的な20μl反応において、以下のヌクレオチドを調製した:ATP(10mM)、プソイド-UTP(10mM)、メチル-CTP(10mM)、GTP(2mM)、抗逆方向Cap類似体(8mM,NEB)。RNAをRNeasy精製キット(Qiagen,Hilden,Germany)によって精製した。1%アガロースゲルに供することによってRNAの品質を確認した。濃度は、Abs260によって決定した。
ナノプレックストランスフェクション。ポリアミンを10mMのHEPES緩衝液(pH7.4)中に溶解させた。96ウェルプレートの各ウェルについて、5μlのOptiMEM(Thermo Fisher)中で希釈した200ng mRNAを、5μlのPABPを含有するOptiMEM(mRNA:PABP重量比=1:5)と室温で10分間混合した。その後、5μLのOptiMEM含有ポリアミンを添加し、室温で15分間インキュベートした後、HEK293Tにトランスフェクションし、d2EGFPを安定的に発現させた。ポリアミンを調整して、トランスフェクションのための50対1(N/P)比を達成した。EGFP発現を、トランスフェクション後の異なる時点でBD FACSCelesta(Becton Dickinson)によって測定した。
動物実験。マウスの管理および実験手順は、確立された施設ガイドラインおよびMIT学科(MIT Division)の比較医学部門から承認されたプロトコルに従って、病原体のない条件下で実施した。C57BL/6-Tg(UBC-GFP)30Scha/JマウスをJackson Laboratoryから購入した。8~10週齢のマウスに、25μlの体積のOptiMEM中、N4(TEP)ポリアミンとともにパッケージングされた5μgのmRNAおよび25μgのPABPを、麻酔下で耳に皮下注射した。蛍光撮像は、軽量標本箱(Xenogen)に取り付けられたCCDカメラを用いて行った。曝露時間は1秒であった。シグナルのイメージングおよび定量化は、Living Image取得および分析ソフトウェア(Xenogen)によって制御された。
実施例1-操作されたIpaH9.8は、哺乳動物細胞においてGFPを潜在的にサイレンシングする。
非天然標的のサイレンシングのために病原性細菌由来のE3ユビキチンリガーゼ模倣物を再設計することができるかどうかを決定するために、これまでの細菌において見出されたE3の主要クラスを表す14種の候補酵素のパネルに焦点を当てた(以下、表2)。Maculins et al.,“Bacteria-Host Relationship:Ubiquitin Ligases as Weapons of Invasion.Cell Res.26(4):499-510(2016)およびLin et al.,“Exploitation of the Host Cell Ubiquitin Machinery by Microbial Effector Proteins,”J.Cell Sci.130(12):1985-96(2017)、これは参照によりその全体が本明細書に組み込まれる。
非天然標的のサイレンシングのために病原性細菌由来のE3ユビキチンリガーゼ模倣物を再設計することができるかどうかを決定するために、これまでの細菌において見出されたE3の主要クラスを表す14種の候補酵素のパネルに焦点を当てた(以下、表2)。Maculins et al.,“Bacteria-Host Relationship:Ubiquitin Ligases as Weapons of Invasion.Cell Res.26(4):499-510(2016)およびLin et al.,“Exploitation of the Host Cell Ubiquitin Machinery by Microbial Effector Proteins,”J.Cell Sci.130(12):1985-96(2017)、これは参照によりその全体が本明細書に組み込まれる。
(表2)本研究で評価した細菌性E3ユビキチンリガーゼ
1表2に列挙される参照文献は、各E3ユビキチンリガーゼの触媒ドメインの明確な証明または注釈を提供する。
表2中の略語:NEL、新規E3リガーゼ;HECT、E6AP C末端に相同;SCF、Skp1/Cdc53またはCullen-1/Fボックスタンパク質;SPOP、スペックル型POZタンパク質;VHL、フォンヒッペル・リンダウ(von Hippel-Lindau);ECV、Elongin B/C、Cullen-2、VHL
1表2に列挙される参照文献は、各E3ユビキチンリガーゼの触媒ドメインの明確な証明または注釈を提供する。
表2中の略語:NEL、新規E3リガーゼ;HECT、E6AP C末端に相同;SCF、Skp1/Cdc53またはCullen-1/Fボックスタンパク質;SPOP、スペックル型POZタンパク質;VHL、フォンヒッペル・リンダウ(von Hippel-Lindau);ECV、Elongin B/C、Cullen-2、VHL
このパネルには、HECT型、RING型またはUボックス(RING/Uボックス)型、およびFボックスドメイン等の真核生物E3に類似した折り畳みを有するE3模倣物、ならびに新規のE3リガーゼ(NEL)、XLボックス含有、およびSidC等の任意の他の真核生物E3とは異なる折り畳みを有する非従来的なE3が含まれた。一般に、uAbは、各E3模倣物から天然基質結合ドメインを除去することと、それをヒトCHIPに基づいて以前に設計されたuAbと同様の合成結合タンパク質(図1A)で置き換えることによって操作された。Portnoff et al.,“Ubiquibodies,Synthetic E3 Ubiquitin Ligases Endowed With Unnatural Substrate Specificity for Targeted Protein Silencing,”J.Biol.Chem.289(11):7844-55(2014)、これは、その全体が参照により本明細書に組み込まれる。例えば、S.フレックスネリIpaH9.8は、NF-κB必須調節物質(NEMO)等の天然基質タンパク質への結合および特異性を媒介する8つの20残基のロイシンリッチ反復(LRR)を有するN末端ドメイン(Ashida et al.,“A Bacterial E3 Ubiquitin Ligase IpaH9.8 Targets NEMO/IKKgamma to Dampen the Host NF-KapPab-Mediated Inflammatory Response,”Nat Cell Biol.12(1):66-73,sup.pp.1-9(2010)、これは、参照によりその全体が本明細書に組み込まれる)およびグアニル酸結合タンパク質(GBP)(Li et al.,“Ubiquitination and Degradation of GBPs by a Shigella Effector to Suppress Host Defence,”Nature 551(7680):378-83(2017)、これは、参照によりその全体が本明細書に組み込まれる)からなり、一方、C末端ドメインは新規のE3ユビキチンリガーゼアーキテクチャを採用する。Zhu et al.,“Structure of a Shigella Effector Reveals a New Class of Ubiquitin Ligases,”Nat.Struct.Mol.Biol.15(12):1302-08(2008)およびSinger et al.,“A Pathogen Type III Effector With a Novel E3 Ubiquitin Ligase Architecture,”PLoS Pathogens 9(1):e1003121(2013)、これらは、参照によりそれらの全体が本明細書に組み込まれる。したがって、IpaH9.8のN末端LRRドメインを、GFPにナノモルの親和性(Kd=31nM)で結合するFN3モノボディであるGS2に置き換えた。Koide et al.,“Teaching an Old Scaffold New Tricks:Monobodies Constructed Using Alternative Surfaces of the FN3 Scaffold,”J.Mol.Biol.415(2):393-405(2012)、これは、参照によりその全体が本明細書に組み込まれる。これらの酵素の天然基質認識機能をGS2モノボディと交換することにより、GFPを標的とし、そのプロテアソーム分解を促進すると仮定した合成E3リガーゼを作製した。この仮説を試験するために、異なるGS2-E3キメラを哺乳動物細胞において増強GFP(EGFP)と共に一過性に共発現させ、蛍光活性をフローサイトメトリー分析によってモニタリングした。これまでに、EGFPの最も顕著な枯渇は、GS2-IpaH9.8で達成され、これは、EGFPの蛍光をほぼバックグラウンドレベルに低下させた(図1Bおよび図6A~6B)。ここで試験した条件下で、他の全てのuAbは比較的弱いサイレンシング活性を示した。GS2-NleG5-1、GS2-SspH1、SidC-GS2、およびGS2-SopAがこれらの中で最も活性であり、EGFP蛍光を約20~40%低減させた(図1Bおよび図6A~6B)。
この堅牢なサイレンシング活動に照らして、GS2-IpaH9.8に注目を向けた。このキメラを発現する細胞において、EGFPの除去は効率的であり、最大90%の蛍光活性を除去し(図2Aおよび2B)、細胞溶解物中に検出可能なEGFPタンパク質はなかった(図2C)。重要なことに、IpaH9.8の触媒システイン(Rohde et al.,“Type III Secretion Effectors of the IpaH Family are E3 Ubiquitin Ligases,”Cell Host Microbe 1(1):77-83(2007)、これは参照によりその全体が本明細書に組み込まれる)をアラニンに変異させ(GS2-IpaH9.8C337A)たとき、およびAblSH2ドメインに特異的である非同種のFN3モノボディAS15(Koide et al.,“High-Affinity Single-Domain Binding Proteins with a Binary-Code Interface,”Proc.Natl.Acad.Sci.USA 104(16):6632-37(2007)、これは、参照によりその全体が本明細書に組み込まれる)でGS2を置換したときに、サイレンシング活性が完全に無効にされ(図2A~2C)、これは、標的分解が両方のuAbドメインの協同作用に依存していたことを示した。GS2-IpaH9.8C337Aの場合、哺乳動物細胞における発現およびインビトロでのEGFP結合活性はアラニン置換の影響を受けず(図7A~7B)、サイレンシング活性の喪失が、触媒不活性化に起因していたことを確認した。また、切断されていない全長IpaH9.8へのGS2の直接融合が、測定可能なサイレンシング活性をもたらさなかったことから、LRRドメインの除去はノックダウン活性に不可欠であったことに留意するべきである。興味深いことに、S.フレックスネリ株のゲノム配列は、いくつかのIpaHファミリーメンバー、すなわち、IpaH1.4、IpaH2.5、IpaH4.5、IpaH7.8、およびIpaH9.8が、220-kbの毒性プラスミドpWR100上にコードされている一方で、7つの追加のipaH同族遺伝子が染色体上に存在することを示す。Maculins et al.,“Bacteria-Host Relationship:Ubiquitin Ligases as Weapons of Invasion.Cell Res.26(4):499-510(2016)、これは、参照によりその全体が本明細書に組み込まれる。これらのファミリーメンバーが、uAbの文脈におけるEGFPの分解についてIpaH9.8と同様に優れていたかどうかを判断するために、GS2と、pWR100にコードされたIpaHファミリーメンバーの各々に由来する、ならびに染色体にコードされた1メンバー、IpaH0722に由来する触媒ドメインとの間でキメラを生成した。培養細胞において異所的に発現させた場合、全てのIpaHベースのuAbは、哺乳動物細胞において効率的な(約90%以上)EGFPノックダウンが可能であった(図2D)。この結果は、異なる触媒ドメインによって共有される高い相同性を考慮すると、必ずしも驚くべきものではなかった。実際、異なるIpaHファミリーメンバーは、IpaH9.8と全体では約70%しか類似していなかったが、触媒ドメインでは、はるかに類似しており(>99%)、1~3個のアミノ酸置換だけ、ならびにIpaH1.4およびIpaH4.5の場合、わずかなC末端の切断だけであった(表2)。
本発明の操作細菌リガーゼの効力をベンチマークするために、GS2-IpaH9.8によって触媒されるGFPサイレンシング活性を、標的タンパク質分解のために以前に再構成された真核E3機構に基づく他の合成リガーゼのものと比較した。Zhou et al.,“Harnessing the Ubiquitination Machinery to Target the Degradation of Specific Cellular Proteins,”Mol.Cell 6(3):751-56(2000);Zhang et al.,“Exploring the Functional Complexity of Cellular Proteins by Protein Knockout,”Proc.Natl.Acad.Sci.USA 100(24):14127-32(2003);Hatakeyama et al.,“Targeted Destruction of C-Myc by an Engineered Ubiquitin Ligase Suppresses Cell Transformation and Tumor Formation,”Cancer Res.65(17):7874-79(2005);Ma et al.,“Targeted Degradation of KRAS by an Engineered Ubiquitin Ligase Suppresses Pancreatic Cancer Cell Growth In Vitro and In Vivo,”Mol.Cancer Ther.12(3):286-94(2013);Kong et al.,“Engineering a Single Ubiquitin Ligase for the Selective Degradation of all Activated ErbB Receptor Tyrosine Kinases,”Oncogene 33(8):986-95(2014);Caussinus et al.,“Fluorescent Fusion Protein Knockout Mediated by Anti-GFP Nanobody,”Nat.Struct.Mol.Biol.19(1):117-21(2011);Fulcher et al.,“Targeting Endogenous Proteins For Degradation Through the Affinity-Directed Protein Missile System,”Open Biol.7(5):170066(2017);Fulcher et al.,“An Affinity-Directed Protein Missile System for Targeted Proteolysis,”Open Biol 6(10):160255(2016);Shin et al.,“Nanobody-Targeted E3-Ubiquitin Ligase Complex Degrades Nuclear Proteins,”Sci.Rep.5:14269(2015);and Kanner et al.,“Sculpting Ion Channel Functional Expression with Engineered Ubiquitin Ligases,”Elife 6:e29744(2017)、これらは、参照によりそれらの全体が本明細書に組み込まれる。具体的には、ヒト由来のいくつかの真核生物E3ユビキチンリガーゼの天然基質結合ドメイン(Hsc70相互作用タンパク質(CHIP)、スペックル型POZタンパク質(SPOP)、βトランスデューシング(Transducing)リピート含有タンパク質(βTrCP)、およびフォンヒッペル・リンダウタンパク質(VHL)のカルボキシル末端を含む)、ならびにキイロショウジョウバエ(Drosophila melanogaster)過剰肢(Slmb)タンパク質を、GS2モノボディで置き換え、GS2-IpaH9.8に類似した合成リガーゼのパネルを得た。得られたGFP特異的uAbのパネルが哺乳動物細胞においてEGFPと一過性に共発現したとき、全てが、ある程度EGFPレベルを低下させることができたが、ここで試験した条件下では、それぞれのサイレンシング活性は比較的非効率的であり(約25~45%)(図1Cおよび図6A~6B)、未融合GFPレベルを低下させることにおいて同様に無効であったSlmb-ナノボディキメラを用いた以前の結果を連想させる。Caussinus et al.,“Fluorescent Fusion Protein Knockout Mediated by Anti-GFP Nanobody,”Nat.Struct.Mol.Biol.19(1):117-21(2011)、これは、その全体が参照により本明細書に組み込まれる。Slmb-GS2についてここで観察された弱いEGFPノックダウンは、実際には、Slmbと、未融合GFPの分解を促進することができなかったGFP特異的VHHナノボディcAbGFP4との間のキメラで得られた以前の結果と比較して改善された。Caussinus et al.,“Fluorescent Fusion Protein Knockout Mediated by Anti-GFP Nanobody,”Nat.Struct.Mol.Biol.19(1):117-21(2011)、これは、その全体が参照により本明細書に組み込まれる。しかし、Slmb-cAbGFP4融合物は、より大きなGFP融合タンパク質に関連する蛍光を排除し、本明細書に報告されるデータが必ずしもuAb機能障害を示すとは限らないが、代わりに、基質選好性/適合性またはユビキチン装飾の程度の違いを反映し得ることを示唆することに留意されたい。それにもかかわらず、真核生物E3を伴う操作キメラのいずれもが、細胞蛍光の90~95%を再現可能に分解したGS2-IpaH9.8の有効性および頑健性を示さなかった。
実施例2-広範囲の基質タンパク質が、GS2-IpaH9.8によって分解される。
基質適合性の問題をより深く探究するために、様々な範囲の基質を分解するGS2-IpaH9.8の能力を試験した。多数のGFP由来蛍光タンパク質(FP)が、長年にわたって開発および最適化され、生物学的イメージングのための新しいツールの多様なコレクションを提供している。Tsien,R.Y.,“The Green Fluorescent Protein,”Ann.Rev.Biochem.67:509-44(1998)and Shaner et al.,“A Guide to Choosing Fluorescent Proteins,”Nat.Methods 2(12):905-09(2005)、これは、参照によりそれらの全体が本明細書に組み込まれる。異なるFP標的がどの程度分解され得るかを決定するために、GS2-IpaH9.8を、エメラルド、ビーナス、およびセルリアンの単量体バージョン、ならびに強化シアン蛍光タンパク質(ECFP)とともに哺乳動物細胞において一過性に共発現させた。FPの各々に関連する細胞蛍光活性のおよそ65~85%がGS2-IpaH9.8によって除去されたが、構造的に無関係なmCherryタンパク質はGS2-IpaH9.8によって標的とされず、GFPの折り畳みに対するGS2の特異性を与えたことが予想された(図8A)。興味深いことに、急速な折り畳みおよび堅牢に安定なEGFPの変異体であるスーパーフォルダGFP(sfGFP)の蛍光活性は、sfGFPがプロテアソーム分解に耐性であるという最近の発見と一致して、GS2-IpaH9.8の影響を受けなかった。Khmelinskii et al.,“Incomplete Proteasomal Degradation of Green Fluorescent Proteins in the Context of Tandem Fluorescent Protein Timers,”Mol.Biol.Cell 27(2):360-70(2016)、これは、参照によりその全体が本明細書に組み込まれる。
基質適合性の問題をより深く探究するために、様々な範囲の基質を分解するGS2-IpaH9.8の能力を試験した。多数のGFP由来蛍光タンパク質(FP)が、長年にわたって開発および最適化され、生物学的イメージングのための新しいツールの多様なコレクションを提供している。Tsien,R.Y.,“The Green Fluorescent Protein,”Ann.Rev.Biochem.67:509-44(1998)and Shaner et al.,“A Guide to Choosing Fluorescent Proteins,”Nat.Methods 2(12):905-09(2005)、これは、参照によりそれらの全体が本明細書に組み込まれる。異なるFP標的がどの程度分解され得るかを決定するために、GS2-IpaH9.8を、エメラルド、ビーナス、およびセルリアンの単量体バージョン、ならびに強化シアン蛍光タンパク質(ECFP)とともに哺乳動物細胞において一過性に共発現させた。FPの各々に関連する細胞蛍光活性のおよそ65~85%がGS2-IpaH9.8によって除去されたが、構造的に無関係なmCherryタンパク質はGS2-IpaH9.8によって標的とされず、GFPの折り畳みに対するGS2の特異性を与えたことが予想された(図8A)。興味深いことに、急速な折り畳みおよび堅牢に安定なEGFPの変異体であるスーパーフォルダGFP(sfGFP)の蛍光活性は、sfGFPがプロテアソーム分解に耐性であるという最近の発見と一致して、GS2-IpaH9.8の影響を受けなかった。Khmelinskii et al.,“Incomplete Proteasomal Degradation of Green Fluorescent Proteins in the Context of Tandem Fluorescent Protein Timers,”Mol.Biol.Cell 27(2):360-70(2016)、これは、参照によりその全体が本明細書に組み込まれる。
異なるFPを分解するGS2-IpaH9.8の能力による後押しを受けて、次に、構造的に多様な、FPタグ付き基質タンパク質を分解するGS2-IpaH9.8の能力を評価した。GS2-IpaH9.8は、それらの分子量(27~179kDa)および細胞下局在(すなわち、細胞質、核、膜結合、および膜貫通)に関して変化した15種の独自の標的タンパク質をうまく分解した(図3Aおよび図8B)。例えば、GS2-IpaH9.8は、フローサイトメトリー分析によって決定されるように、細胞質タンパク質α-アクチニン、α-シヌクレイン(α-syn)、細胞外シグナル制御キナーゼ2(ERK2)、局所接着キナーゼ(FAK)、F-トラクチン、パキシリン(PXN)、およびビンキュリン(VCL)を含むFP融合物に関連する蛍光活性の80~92%の分解を誘発した(図3Aおよび図8B)。同様に、ヒストンH2B、およびSV40LargeT抗原に由来する核局在化シグナル(NLS)を伴う、核標的FP融合物;発癌性G12V変異を有するHarveyラット肉腫ウイルス癌遺伝子ホモログ(HRasG12V)、Src相同2ドメイン含有ホスファターゼ2(SHP2)、およびHRasに由来するファルネシル配列を伴う、膜結合FP融合物;ならびに上皮成長因子受容体(EGFR)、トリ赤血球性白血病ウイルス癌遺伝子ホモログ2(ErbB2)、およびムチン1(MUC1)を伴う、膜貫通FP融合物についても同様に堅牢なサイレンシングが観察された(図3Aおよび図8B)。代表的な基質タンパク質α-アクチニン-mEmerald、EGFP-NLS、ファルネシル-mEmerald、およびEGFR-mEmeraldの顕微鏡分析により、各融合物の予想細胞下局在化が確認され、フローサイトメトリー分析によって測定された効率的な分解活性が裏付けられた(図3B)。膜貫通タンパク質EGFR-mEmeraldを、EGFRの細胞外ドメインに特異的な抗体でイムノラベリングすることによって検査した。重要なことに、α-EGFRシグナルは、GFP消失と同時に減少し(図3B)、膜貫通タンパク質全体の分解が達成されたことを示す。まとめると、これらの結果により、いくつかの異なる細胞下位置にまたがる広範囲の基質をサイレンシングすることができる堅牢なプロテオーム編集ツールとしてのGS2-IpaH9.8が確証される。
実施例3-GS2-IpaH9.8媒介性プロテオーム編集は、フレキシブルであり、モジュラー性である。
UAbの魅力的な特徴は、それらの高度なモジュラーアーキテクチャであり、E3触媒ドメインおよび合成結合タンパク質ドメインは、活性および特異性を再プログラムするために交換することができる。実際、上記の結果は、異なる細菌および真核E3ドメインをキメラ化して機能性uAbを形成することができる容易さを明らかにした。IpaH9.8ベースのuAbにおける合成結合タンパク質ドメインの互換性を調査するために、GS2をまず、FN3モノボディGS5(Kd=62nM)(Koide et al.,“Teaching an Old Scaffold New Tricks:Monobodies Constructed Using Alternative Surfaces of the FN3 Scaffold,”J.Mol.Biol.415(2):393-405(2012)、これは、参照によりその全体が本明細書に組み込まれる)またはcAbGFP4(Kd=0.32nM)(Saerens et al.,“Identification of a Universal VHH Framework to Graft Non-Canonical Antigen-Binding Loops of Camel Single-Domain Antibodies,”J.Mol.Biol.352(3):597-607(2005)、これは参照によりその全体が本明細書に組み込まれる)等の他の高親和性GFP結合タンパク質と置き換えた。これらの構築物について、GS2モノボディに見られるものに匹敵する効率的なEGFPサイレンシング活性が観察された(図9A)。興味深いことに、より低い親和性(約200~500nM)のFN3モノボディの導入(Koide et al.,“Teaching an Old Scaffold New Tricks:Monobodies Constructed Using Alternative Surfaces of the FN3 Scaffold,”J.Mol.Biol.415(2):393-405(2012)、これは、参照によりその全体が本明細書に組み込まれる)は、効率的ではないEGFP排除をもたらし(図9A)、サイレンシング活性が標的タンパク質に対する親和性の関数であり得ることを示唆している。しかし、空間配置および表面相補性は、ユビキチン化のためのリジン部位を優先するため(Buetow et al.,“Structural Insights into the Catalysis and Regulation of E3 Ubiquitin Ligases,”Nat.Rev.Mol.Cell Biol.17(10):626-42(2016)、これは、参照によりその全体が本明細書に組み込まれる)、これらの所見のための同様に合理的な説明としては、様々なFN3ドメインは、基質がユビキチン化される様式に影響を及ぼすように、GFPに関してuAbを差異的に指向させ得るというものである。
UAbの魅力的な特徴は、それらの高度なモジュラーアーキテクチャであり、E3触媒ドメインおよび合成結合タンパク質ドメインは、活性および特異性を再プログラムするために交換することができる。実際、上記の結果は、異なる細菌および真核E3ドメインをキメラ化して機能性uAbを形成することができる容易さを明らかにした。IpaH9.8ベースのuAbにおける合成結合タンパク質ドメインの互換性を調査するために、GS2をまず、FN3モノボディGS5(Kd=62nM)(Koide et al.,“Teaching an Old Scaffold New Tricks:Monobodies Constructed Using Alternative Surfaces of the FN3 Scaffold,”J.Mol.Biol.415(2):393-405(2012)、これは、参照によりその全体が本明細書に組み込まれる)またはcAbGFP4(Kd=0.32nM)(Saerens et al.,“Identification of a Universal VHH Framework to Graft Non-Canonical Antigen-Binding Loops of Camel Single-Domain Antibodies,”J.Mol.Biol.352(3):597-607(2005)、これは参照によりその全体が本明細書に組み込まれる)等の他の高親和性GFP結合タンパク質と置き換えた。これらの構築物について、GS2モノボディに見られるものに匹敵する効率的なEGFPサイレンシング活性が観察された(図9A)。興味深いことに、より低い親和性(約200~500nM)のFN3モノボディの導入(Koide et al.,“Teaching an Old Scaffold New Tricks:Monobodies Constructed Using Alternative Surfaces of the FN3 Scaffold,”J.Mol.Biol.415(2):393-405(2012)、これは、参照によりその全体が本明細書に組み込まれる)は、効率的ではないEGFP排除をもたらし(図9A)、サイレンシング活性が標的タンパク質に対する親和性の関数であり得ることを示唆している。しかし、空間配置および表面相補性は、ユビキチン化のためのリジン部位を優先するため(Buetow et al.,“Structural Insights into the Catalysis and Regulation of E3 Ubiquitin Ligases,”Nat.Rev.Mol.Cell Biol.17(10):626-42(2016)、これは、参照によりその全体が本明細書に組み込まれる)、これらの所見のための同様に合理的な説明としては、様々なFN3ドメインは、基質がユビキチン化される様式に影響を及ぼすように、GFPに関してuAbを差異的に指向させ得るというものである。
次に、IpaH9.8触媒ドメインと2つの異なるFN3モノボディとの適合性を調査した:SHP2のSrc相同2(SH2)ドメインに特異的なNSa5(Sha et al.,“Dissection of the BCR-ABL Signaling Network Using Highly Specific Monobody Inhibitors to the SHP2 SH2 Domains,”Proc.Natl.Acad.Sci.USA 110(37):14924-29(2013)、これは、参照によりその全体が本明細書に組み込まれる)および、それぞれHRas、KRas、およびそれらのG12V変異体に特異的なRasInII(Cetin et al.,“RasIns:Genetically Encoded Intrabodies of Activated Ras Proteins,”J.Mol.Biol.429(4):562-573(2017)、これは、参照によりその全体が本明細書に組み込まれる)。得られたNSa5-IpaH9.8およびRasInII-IpaH9.8キメラを、フローサイトメトリー分析によって、SHP2-EGFPおよびEGFP-HRasG12Vをそれぞれサイレンシングする能力について試験した。どちらも強力なサイレンシング活性を示し、GFP指向性GS2-IpaH9.8とほぼ同等の効率でそれらのEGFPタグ標的を分解した(図4Aおよび4B)。興味深いことに、RasInII-IpaH9.8は、野生型RasアイソフォームよりもG12V変異体に対するその選択性に沿って、EGFP-KRasG12Cおよび他のKRas変異体(例えば、G12C、G12D)をEGFP-KRas(図4C)よりも効率的に分解し(参照により全体が本明細書に組み込まれる、Cetin et al.,“RasIns:Genetically Encoded Intrabodies of Activated Ras Proteins,”J.Mol.Biol.429(4):562-573(2017))、それにより、Rasの変異体選択的サイレンシングのための潜在的な経路が提供される。まとめて、これらの結果は、IpaH9.8に対する顕著な柔軟性を明らかにし、一過性かつ安定的にトランスフェクトされた細胞株における多様な標的タンパク質の「全てに適合する」分解性物質(degrader)としてのその使用を可能にする。
上記の全ての実験において、GS2-IpaH9.8およびその対応する標的を一過性に発現させたときに、効率的なノックダウンが達成された。しかしながら、実験的な時間尺度、正確な発現プロファイルの必要性、または不応性哺乳動物細胞株の使用のために、一過性発現は必ずしも選択肢ではない。したがって、GS2-IpaH9.8媒介サイレンシングのフレキシビリティを実証するために、分解活性を、安定的に組み込まれた導入遺伝子として発現された標的タンパク質に対して評価した。具体的には、EGFPを安定して共発現させた細胞においてGS2-IpaH9.8を一過性に発現させた場合、蛍光活性の低下は、EGFPを一過性に発現させた場合に観察されたものと実質的に同一であった(図9B)。ERK2-EGFP、H2B-EGFP、およびEGFP-HRasG12Vについても、それらの発現様式にかかわらず、堅牢な分解が観察された(図9B)。uAbおよび標的の両方が安定した導入遺伝子として発現し、それによってトランスフェクションの必要性を完全に排除したとき、強力なサイレンシング活性は、GS2-IpaH9.8について再び観察されたが、その不活性GS2-IpaH9.8C337A対応物については観察されなかった(図9C)。
実施例4-GS2-IpaH9.8をコードするmRNAの送達は、マウスにおけるプロテオーム編集を可能にする。
治療の観点から、uAb等のタンパク質ベースの技術に直面する最大の課題の1つは、細胞内送達である。Osherovich,L.,“Degradation From Within,”Science-Business Exchange 7:10-11(2014)、これは、参照によりその全体が本明細書に組み込まれる。本群の研究者らは、ポリAテール、PABP、および生体適合性カチオン性ポリペプチド(図5A)を含有する合成mRNAからなる共アセンブルしたナノプレックスが、インビトロおよびマウスにおけるmRNA発現を大幅に向上させたことを以前に示した。Li et al.,“Polyamine-Mediated Stoichiometric Assembly of Ribonucleoproteins for Enhanced mRNA Delivery,”Angew Chem.Int.Ed.Engl.56(44):13709-12(2017)、これは、その全体が参照により本明細書に組み込まれる。ここで、GS2-IpaH9.8 mRNA/PABPナノプレックスの哺乳動物細胞への送達は、HEK293T細胞における同じポリアミンによるmRNAトランスフェクション単独と比較して有意に大きなuAb発現をもたらし、それによって強力なタンパク質分解をもたらすと仮定した。この仮説を試験するために、GS2-IpaH9.8mRNA/PABPナノプレックス送達を、まず、HEK293T細胞において安定導入遺伝子として発現された不安定化GFP変異体であるd2EGFPの分解を定量化することによってインビトロで評価した。予想通り、カチオン性ナノプレックスが活性標的特異的GS2-IpaH9.8 mRNAおよびPABPを含有した場合にのみ、堅牢なd2EGFP分解が達成された(図5B)。触媒不活性GS2-IpaH9.8C337A mRNA/PABPナノプレックス、非特異的AS15-IpaH9.8ナノプレックス、およびPABPなしで送達された裸のGS2-IpaH 9.8 mRNAを含む全ての他の対照は、ほとんどまたは全くサイレンシング活性を示さなかった(図5B)。処理後24時間で、GS2-IpaH9.8 mRNA/PABPナノプレックスを受けたHEK293Td2EGFP細胞は、蛍光活性の85%の減少を示し、これは、上述のDNAトランスフェクション後に達成されたノックダウン活性と直接的に同等であった。
治療の観点から、uAb等のタンパク質ベースの技術に直面する最大の課題の1つは、細胞内送達である。Osherovich,L.,“Degradation From Within,”Science-Business Exchange 7:10-11(2014)、これは、参照によりその全体が本明細書に組み込まれる。本群の研究者らは、ポリAテール、PABP、および生体適合性カチオン性ポリペプチド(図5A)を含有する合成mRNAからなる共アセンブルしたナノプレックスが、インビトロおよびマウスにおけるmRNA発現を大幅に向上させたことを以前に示した。Li et al.,“Polyamine-Mediated Stoichiometric Assembly of Ribonucleoproteins for Enhanced mRNA Delivery,”Angew Chem.Int.Ed.Engl.56(44):13709-12(2017)、これは、その全体が参照により本明細書に組み込まれる。ここで、GS2-IpaH9.8 mRNA/PABPナノプレックスの哺乳動物細胞への送達は、HEK293T細胞における同じポリアミンによるmRNAトランスフェクション単独と比較して有意に大きなuAb発現をもたらし、それによって強力なタンパク質分解をもたらすと仮定した。この仮説を試験するために、GS2-IpaH9.8mRNA/PABPナノプレックス送達を、まず、HEK293T細胞において安定導入遺伝子として発現された不安定化GFP変異体であるd2EGFPの分解を定量化することによってインビトロで評価した。予想通り、カチオン性ナノプレックスが活性標的特異的GS2-IpaH9.8 mRNAおよびPABPを含有した場合にのみ、堅牢なd2EGFP分解が達成された(図5B)。触媒不活性GS2-IpaH9.8C337A mRNA/PABPナノプレックス、非特異的AS15-IpaH9.8ナノプレックス、およびPABPなしで送達された裸のGS2-IpaH 9.8 mRNAを含む全ての他の対照は、ほとんどまたは全くサイレンシング活性を示さなかった(図5B)。処理後24時間で、GS2-IpaH9.8 mRNA/PABPナノプレックスを受けたHEK293Td2EGFP細胞は、蛍光活性の85%の減少を示し、これは、上述のDNAトランスフェクション後に達成されたノックダウン活性と直接的に同等であった。
これらの結果による後押しを受けて、次に、インビボでのuAbナノプレックス媒介送達およびサイレンシング活性を評価した。全ての組織においてEGFPを構成的に発現するトランスジェニックUBI-GFP/BL6マウス(Schaefer et al.,“Observation of Antigen-Dependent CD8+ T-Cell/ Dendritic Cell Interactions In Vivo,”Cell Immunol.214(2):110-22(2001)、これは、参照によりその全体が本明細書に組み込まれる)の耳内に、GS2-IpaH9.8mRNA/PABPナノプレックスの皮下注射を与えた。このマウス系統は、EGFPを普遍的に発現するが、蛍光は、毛で覆われた領域においては吸収され、検出されないことに留意されたい。注射後24時間における蛍光撮像は、GS2-IpaH9.8 mRNA/PABPナノプレックス注射を受けた左耳のEGFP蛍光が、耳蛍光の70%の低下で強力に除去されたことを明らかにした(図5Cおよび5D)。対照的に、触媒不活性GS2-IpaH9.8C337Aまたは非特異的AS15-IpaH9.8ナノプレックス注射のいずれかを受けた右耳の蛍光は影響を受けなかった(図5Cおよび5D)。重要なことに、これらの結果は、癌および他のヒト疾患における異常発現タンパク質を翻訳後にサイレンシングするための実行可能な戦略として、uAbの治療的送達のステージを設定した。
実施例5-実施例1~4の考察
ユビキボディは、体細胞内の、そうでなければ安定しているタンパク質の選択的除去を可能にする比較的新しいプロテオーム編集モダリティであり(Portnoff et al.,“Ubiquibodies,Synthetic E3 Ubiquitin Ligases Endowed With Unnatural Substrate Specificity for Targeted Protein Silencing,”J.Biol.Chem.289(11):7844-55(2014)、これは参照によりその全体が本明細書に組み込まれる)、基礎研究、薬物の発見、および治療における潜在的な用途を有する。本研究では、細菌性E3ユビキチンリガーゼを特徴とする新しいクラスのuAbを作製し、それによって、uAbの開発のための、これまで利用されていないユビキチン化活性源への扉を開いた。具体的には、宿主細胞E3リガーゼを模倣してユビキチン化経路を利用する、発展しているクラスのエフェクタータンパク質に属する14種の細菌性E3リガーゼを評価した。Maculins et al.,“Bacteria-Host Relationship:Ubiquitin Ligases as Weapons of Invasion.Cell Res.26(4):499-510(2016)およびLin et al.,“Exploitation of the Host Cell Ubiquitin Machinery by Microbial Effector Proteins,”J.Cell Sci.130(12):1985-96(2017)、これらは、参照によりそれらの全体が本明細書に組み込まれる。これらの中で最も顕著なのは、S.フレックスネリ由来のIpaH9.8であり、これは、遺伝子融合合成結合ドメインを介して標的基質に向けられたときに、タンパク質のターンオーバーの顕著な触媒であることが証明された。このサイレンシング活性は、基質の細胞下局在(すなわち、細胞質、核、形質膜)または発現様式(すなわち、一過性対安定)とは独立していることが見出された。同等に機能した他のE3リガーゼは、S.フレックスネリのpWR100毒性プラスミド上または染色体上のいずれかに見られるIpaH9.8のホモログのみであった。Maculins et al.,“Bacteria-Host Relationship:Ubiquitin Ligases as Weapons of Invasion.Cell Res.26(4):499-510(2016)、これは、参照によりその全体が本明細書に組み込まれる。これらの酵素のN末端触媒NELドメインは、顕著な相同性(99~100%)を共有し、これは、uAbの文脈におけるそれらの類似の性能を説明する。したがって、次に機能する最良の細菌性E3ユビキチンリガーゼは、S.ティフィムリウムSspH1であり、これもまた、NELドメイン内のIpaH9.8全体に対する38%の同一性および42%の同一性を有するNEL型酵素である。Norkowski et al.,The Species-Spanning Family of LPX-Motif Harbouring Effector Proteins,”Cell Microbiol.20(11):e12945(2018)、これは、参照によりその全体が本明細書に組み込まれる。また、ここで試験した条件下で、EGFPレベルを60%未満に低下させることができた哺乳動物E3ユビキチンリガーゼはなかったことにも注目されたい。その理由は完全には明確ではないが、これらの異なるE3リガーゼについて以前にuAbフォーマットで報告された成功したノックダウン結果を考えると(Portnoff et al.,“Ubiquibodies,Synthetic E3 Ubiquitin Ligases Endowed With Unnatural Substrate Specificity for Targeted Protein Silencing,”J.Biol.Chem.289(11):7844-55(2014);Caussinus et al.,“Fluorescent Fusion Protein Knockout Mediated by Anti-GFP Nanobody,”Nat.Struct.Mol.Biol.19(1):117-21(2011);Fulcher et al.,“Targeting Endogenous Proteins For Degradation Through the Affinity-Directed Protein Missile System,”Open Biol.7(5):170066(2017);Fulcher et al.,“An Affinity-Directed Protein Missile System for Targeted Proteolysis,”Open Biol 6(10):160255(2016);Shin et al.,“Nanobody-Targeted E3-Ubiquitin Ligase Complex Degrades Nuclear Proteins,”Sci.Rep.5:14269(2015)、およびKanner et al.,“Sculpting Ion Channel Functional Expression with Engineered Ubiquitin Ligases,”Elife 6:e29744(2017)、それらの全てが参照によりそれらの全体が本明細書に組み込まれる)、EGFPが、これらの操作されたキメラにとっての不良な基質を意味し得ることが疑われる。
ユビキボディは、体細胞内の、そうでなければ安定しているタンパク質の選択的除去を可能にする比較的新しいプロテオーム編集モダリティであり(Portnoff et al.,“Ubiquibodies,Synthetic E3 Ubiquitin Ligases Endowed With Unnatural Substrate Specificity for Targeted Protein Silencing,”J.Biol.Chem.289(11):7844-55(2014)、これは参照によりその全体が本明細書に組み込まれる)、基礎研究、薬物の発見、および治療における潜在的な用途を有する。本研究では、細菌性E3ユビキチンリガーゼを特徴とする新しいクラスのuAbを作製し、それによって、uAbの開発のための、これまで利用されていないユビキチン化活性源への扉を開いた。具体的には、宿主細胞E3リガーゼを模倣してユビキチン化経路を利用する、発展しているクラスのエフェクタータンパク質に属する14種の細菌性E3リガーゼを評価した。Maculins et al.,“Bacteria-Host Relationship:Ubiquitin Ligases as Weapons of Invasion.Cell Res.26(4):499-510(2016)およびLin et al.,“Exploitation of the Host Cell Ubiquitin Machinery by Microbial Effector Proteins,”J.Cell Sci.130(12):1985-96(2017)、これらは、参照によりそれらの全体が本明細書に組み込まれる。これらの中で最も顕著なのは、S.フレックスネリ由来のIpaH9.8であり、これは、遺伝子融合合成結合ドメインを介して標的基質に向けられたときに、タンパク質のターンオーバーの顕著な触媒であることが証明された。このサイレンシング活性は、基質の細胞下局在(すなわち、細胞質、核、形質膜)または発現様式(すなわち、一過性対安定)とは独立していることが見出された。同等に機能した他のE3リガーゼは、S.フレックスネリのpWR100毒性プラスミド上または染色体上のいずれかに見られるIpaH9.8のホモログのみであった。Maculins et al.,“Bacteria-Host Relationship:Ubiquitin Ligases as Weapons of Invasion.Cell Res.26(4):499-510(2016)、これは、参照によりその全体が本明細書に組み込まれる。これらの酵素のN末端触媒NELドメインは、顕著な相同性(99~100%)を共有し、これは、uAbの文脈におけるそれらの類似の性能を説明する。したがって、次に機能する最良の細菌性E3ユビキチンリガーゼは、S.ティフィムリウムSspH1であり、これもまた、NELドメイン内のIpaH9.8全体に対する38%の同一性および42%の同一性を有するNEL型酵素である。Norkowski et al.,The Species-Spanning Family of LPX-Motif Harbouring Effector Proteins,”Cell Microbiol.20(11):e12945(2018)、これは、参照によりその全体が本明細書に組み込まれる。また、ここで試験した条件下で、EGFPレベルを60%未満に低下させることができた哺乳動物E3ユビキチンリガーゼはなかったことにも注目されたい。その理由は完全には明確ではないが、これらの異なるE3リガーゼについて以前にuAbフォーマットで報告された成功したノックダウン結果を考えると(Portnoff et al.,“Ubiquibodies,Synthetic E3 Ubiquitin Ligases Endowed With Unnatural Substrate Specificity for Targeted Protein Silencing,”J.Biol.Chem.289(11):7844-55(2014);Caussinus et al.,“Fluorescent Fusion Protein Knockout Mediated by Anti-GFP Nanobody,”Nat.Struct.Mol.Biol.19(1):117-21(2011);Fulcher et al.,“Targeting Endogenous Proteins For Degradation Through the Affinity-Directed Protein Missile System,”Open Biol.7(5):170066(2017);Fulcher et al.,“An Affinity-Directed Protein Missile System for Targeted Proteolysis,”Open Biol 6(10):160255(2016);Shin et al.,“Nanobody-Targeted E3-Ubiquitin Ligase Complex Degrades Nuclear Proteins,”Sci.Rep.5:14269(2015)、およびKanner et al.,“Sculpting Ion Channel Functional Expression with Engineered Ubiquitin Ligases,”Elife 6:e29744(2017)、それらの全てが参照によりそれらの全体が本明細書に組み込まれる)、EGFPが、これらの操作されたキメラにとっての不良な基質を意味し得ることが疑われる。
ここでの作業は、主にFPおよびFPタグ付き基質のサイレンシングに焦点を当てたが、HRasを含む疾患関連標的を強力に分解したIpaH9.8ベースのuAbが設計され、これは、KRasおよびNRasと共に、癌において最も一般的に変異した癌タンパク質、ならびにRas/MAPKシグナル伝達経路の調節因子であるSHP2を含む。重要なことに、これらの臨床的に重要な標的を他の全てのFP融合物と一緒に枯渇させる能力は、uAb技術の驚くべきモジュラリティを強調する役割を果たす。E3ユビキチンリガーゼの天然基質結合ドメインを単純に交換することで、異なる基質タンパク質に対する特異性を有するオーダーメイドuAbを生成することができる。興味深いことに、シゲラは、感染中に宿主防御を破壊するための同様の戦略を進化させ、それによって、プラスミドおよび染色体にコードされたIpaHタンパク質は、NF-κB関連タンパク質のプロテアソーム分解を媒介することによって宿主の炎症応答を抑制する上で重要な役割を果たす。Ashida et al.,“A Bacterial E3 Ubiquitin Ligase IpaH9.8 Targets NEMO/IKKgamma to Dampen the Host NF-KapPab-Mediated Inflammatory Response,”Nat Cell Biol.12(1):66-73,sup.pp.1-9(2010)and Ashida et al.,“Shigella IpaH Family Effectors as a Versatile Model for Studying Pathogenic Bacteria,”Front Cell Infect.Microbiol.5:100(2015)、これは、参照によりそれらの全体が本明細書に組み込まれる。具体的には、約50%の類似性のみを共有する異なるLRRドメインを用いることによって(Norkowski et al.,“The Species-Spanning Family of LPX-Motif Harboring Effector Proteins,”Cell Microbial.e12945(2018)、これは、参照によりそれらの全体が本明細書に組み込まれる)、シゲラは、実質的に同一の触媒NELドメインを、宿主タンパク質のアレイに再方向付けすることができる(例えば、IpaH9.8についてはNEMO、U2AF53;IpaH7.8についてはグロムリン;IpaH4.5についてはp65;IpaH2.5およびIpaH1.4についてはHOIP;IpaH0722についてはTRAF2)。Maculins et al.,“Bacteria-Host Relationship:Ubiquitin Ligases as Weapons of Invasion.Cell Res.26(4):499-510(2016);Lin et al.,“Exploitation of the Host Cell Ubiquitin Machinery by Microbial Effector Proteins,”J.Cell Sci.130(12):1985-96(2017);およびAshida et al.,“Shigella IpaH Family Effectors as a Versatile Model for Studying Pathogenic Bacteria,”Front Cell Infect.Microbiol.5:100(2015)、これらの全ては参照によりそれらの全体が本明細書に組み込まれる。これらの構造的に多様な基質をユビキチン化するために必要な固有の立体構造上のフレキシビリティは、カスタマイズ可能な標的分解に対するNELモチーフの顕著な能力を説明するために役立つと考えられる。また、ここでの作業は、以前に確認されたE3ユビキチンリガーゼを活用したが、新規のE3リガーゼを同定するためのGS2ベースのuAbを作製するために類似のスワッピング戦略を使用することができることも注目されるべきである。このようなアプローチは、E3リガーゼの体系的な同定を可能にし得るものであり、ヒトゲノムが600を超える推定E3リガーゼをコードすること(Metzger et al.,“HECT and RING Finger Families of E3 Ubiquitin Ligases at a Glance,”J.Cell Sci.125(Pt 3):531-37(2012)、これは、参照によりその全体が本明細書に組み込まれる)、および細菌ゲノムが他の数百個をコードする可能性が高く、これらの多くがユビキチン転移の触媒として検証されるべきものとして残っていることを考慮すると、これは重要な目標である。
薬剤開発の観点から、遺伝子産物の薬理学的制御は、従来、小分子が密接に結合している明確に定義された疎水性ポケットを有する酵素および受容体を標的とする小分子阻害剤を使用して達成されてきた。残念ながら、ヒトプロテオームの大部分(約80~85%)は、薬理学的に阻害され得ず、したがって「新薬の開発につながらない」と見なされている転写因子、骨格タンパク質、および非酵素タンパク質等の扱いにくい標的から構成される。Crews,C.M.,“Targeting the Undruggable Proteome:The Small Molecules of My Dreams,”Chem.Biol.17(6):551-55(2010)and Arkin et al.,“Small-Molecule Inhibitors of Protein-Protein Interactions:Progressing Towards The Dream,”Nat.Rev.Drug Discov.3(4):301-17(2004)に記載され、これは、その全体が参照により本明細書に組み込まれる。代替として、DNAまたはRNAレベルでタンパク質をサイレンシングするためのいくつかの技術、例えば、CRISPR、RNAi、TALEN、およびZFNが現在利用可能であり、第1のRNAi療法であるパチスランは、遺伝性トランスサイレチンアミロイドーシスについて2018年に承認を得ている。Adams et al.,“Patisiran,An RNAi Therapeutic,For Hereditary Transthyretin Amyloidosis,”N.Engl.J.Med.379(1):11-21(2018)、これは、参照によりその全体が本明細書に組み込まれる。それにもかかわらず、タンパク質サイレンシングに対する時間的および翻訳後制御を提供するuAbおよび関連するPROTAC技術等の新しい適応可能な技術は、特に、不可逆性、時間的制御の欠如、およびオフターゲット効果等の核酸標的指向化ベースのアプローチに関連するいくつかの制限を克服する可能性があるため、望ましい。Deleavey et al.,“Designing Chemically Modified Oligonucleotides for Targeted Gene Silencing,”Chemistry&Biology 19(8):937-54(2012);Gaj et al.,“TALEN,and CRISPR/Cas-Based Methods for Genome Engineering,”Trends Biotechnol.31(7):397-405(2013);Fu et al.,“High-Frequency Off-Target Mutagenesis Induced by CRISPR-Cas Nucleases in Human Cells,”Nat.Biotechnol.31(9):822-26(2013)、およびFedorov et al.,“Off-Target Effects by siRNA Can Induce Toxic Phenotype,”RNA 12(7):1188-96(2006)、これは、参照によりその全体が本明細書に組み込まれる。原則として、uAbおよびPROTACの両方は、タンパク質の機能にかかわらず、現在新薬の開発につながっていないプロテオームを含むタンパク質を分解することができる。さらに、従来の「占有ベース」の治療薬とは異なり、uAbおよびPROTACは触媒的に作用し、それらが構築される標的結合抗体模倣物および小分子阻害剤よりもそれぞれ実質的に強力になる。
uAbの主な利点は、合成結合タンパク質の大規模な既存のレパートリー、ならびにヒトプロテオームに対してタンパク質結合剤を新たに生成および検証するための系統的なゲノムワイドな取り組みを活用する、それらの組換えモジュラー設計に起因して、それらが様々な細胞内標的にヒットするように迅速に適合することができることである。Colwill et at.,“A Roadmap to Generate Renewable Protein Binders to the Human Proteome,”Nat.Methods 8(7):551-58(2011)、これは、参照によりその全体が本明細書に組み込まれる。標的に対して高い特異性および親和性で結合する抗体模倣物を得ることは、同じ特性を有する小分子を得るよりも容易であるべきであるため、カスタム設計されたPROTACを作製することは、はるかに困難な作業である可能性が高い。Osherovich,L.,“Degradation From Within,”Science-Business Exchange 7:10-11(2014)、これは、参照によりその全体が本明細書に組み込まれる。それにもかかわらず、PROTACは、細胞に入る確率が高い小分子に基づくため、治療アプローチとして非常に有望である。実際、印象的な前臨床インビトロデータおよびインビボデータは、2013年にArvinas、2016年にC4 Therapeuticsが設立されたことによって証明されるように、臨床的に実行可能なPROTACの開発を進ませている。しかしながら、PROTACの経口バイオアベイラビリティ、薬物動態学、ならびに吸収、分布、代謝、排泄および毒性(ADMET)特性を改善するためには、従来の薬学的アプローチが必要であることが指摘されるべきである。Neklesa et al.,“Targeted Protein Degradation by PROTACs,”Pharmacol.Ther.17:4138-144(2017)およびDeshaies,R.J.,“Protein Degradation:Prime Time for PROTACs,”Nat.Chem.Biol.11(9):634-35(2015)、これは、参照によりそれらの全体が本明細書に組み込まれる。PROTACと比較して、uAbベースの治療薬の細胞内送達は、比較的大きなサイズおよび生化学的特性のために、ほとんどの球状タンパク質薬物が自発的に形質膜を横切らないため、はるかに大きなハードルである。Osherovich,L.,“Degradation From Within,”Science-Business Exchange 7:10-11(2014)、これは、参照によりその全体が本明細書に組み込まれる。本明細書で調査される1つの考えられる解決策は、インビボでの治療用遺伝子産物の供給源としてのmRNAの使用である。近年、その不安定性および免疫原性を含むmRNAの使用に対する障害は、構造修飾によって大きく克服されている一方で、送達およびタンパク質発現プロファイルに関連する問題は、ナノテクノロジーおよび材料科学の進歩によって対処されている。Guan et al.,“Nanotechnologies in Delivery of mRNA Therapeutics Using Nonviral Vector-Based Delivery Systems,”Gene Ther.24(3):133-43(2017)に記載され、これは、その全体が参照により本明細書に組み込まれる。ここでは、第一種の治療用uAb送達戦略を作製するためのこの独自のアプローチが利用され、この方法は、送達のために事前に形成されたタンパク質-RNA複合体を安定化するための静電学の最近実証された戦略を伴った。Li et al.,“Polyamine-Mediated Stoichiometric Assembly of Ribonucleoproteins for Enhanced mRNA Delivery,”Angew Chem.Int.Ed.Engl.56(44):13709-12(2017)に記載され、その全体が参照により本明細書に組み込まれる。ここで、GFP指向性GS2-IpaH9.8キメラをコードする合成mRNAをPABPと共アセンブルし、アセンブルしたリボヌクレオタンパク質を、カチオン性アミノ化側基を有する構造的に定義されたポリペプチドを使用してナノサイズの複合体にパッケージングした。得られたナノプレックスは、インビトロおよびインビボでGFPの非常に効率的なサイレンシングを達成し、それによって、新しいプロテオーム編集パラダイムを実証し、uAbベースの治療薬の臨床移行への扉を開く。
好ましい実施形態は、本明細書に詳細に示され、説明されてきたが、様々な修正、追加、置換等が、本願の趣旨から逸脱することなく行われ得ることは、当業者には明白である。したがって、これらは、添付の特許請求の範囲に定義されるように、本願の範囲内にあると見なされる。
配列情報
SEQUENCE LISTING
<110> Cornell University
Massachusetts Institute of Technology
<120> BROAD-SPECTRUM PROTEOME EDITING WITH AN ENGINEERED BACTERIAL
UBIQUITIN LIGASE MIMIC
<150> US 62/644,055
<151> 2018-03-16
<160> 38
<170> PatentIn version 3.5
<210> 1
<211> 553
<212> PRT
<213> Artificial
<220>
<223> AvrPtoB U-box motif from Pseudomonas syringae
<400> 1
Met Ala Gly Ile Asn Arg Ala Gly Pro Ser Gly Ala Tyr Phe Val Gly
1 5 10 15
His Thr Asp Pro Glu Pro Val Ser Gly Gln Ala His Gly Ser Gly Ser
20 25 30
Gly Ala Ser Ser Ser Asn Ser Pro Gln Val Gln Pro Arg Pro Ser Asn
35 40 45
Thr Pro Pro Ser Asn Ala Pro Ala Pro Pro Pro Thr Gly Arg Glu Arg
50 55 60
Leu Ser Arg Ser Thr Ala Leu Ser Arg Gln Thr Arg Glu Trp Leu Glu
65 70 75 80
Gln Gly Met Pro Thr Ala Glu Asp Ala Ser Val Arg Arg Arg Pro Gln
85 90 95
Val Thr Ala Asp Ala Ala Thr Pro Arg Ala Glu Ala Arg Arg Thr Pro
100 105 110
Glu Ala Thr Ala Asp Ala Ser Ala Pro Arg Arg Gly Ala Val Ala His
115 120 125
Ala Asn Ser Ile Val Gln Gln Leu Val Ser Glu Gly Ala Asp Ile Ser
130 135 140
His Thr Arg Asn Met Leu Arg Asn Ala Met Asn Gly Asp Ala Val Ala
145 150 155 160
Phe Ser Arg Val Glu Gln Asn Ile Phe Arg Gln His Phe Pro Asn Met
165 170 175
Pro Met His Gly Ile Ser Arg Asp Ser Glu Leu Ala Ile Glu Leu Arg
180 185 190
Gly Ala Leu Arg Arg Ala Val His Gln Gln Ala Ala Ser Ala Pro Val
195 200 205
Arg Ser Pro Thr Pro Thr Pro Ala Ser Pro Ala Ala Ser Ser Ser Gly
210 215 220
Ser Ser Gln Arg Ser Leu Phe Gly Arg Phe Ala Arg Leu Met Ala Pro
225 230 235 240
Asn Gln Gly Arg Ser Ser Asn Thr Ala Ala Ser Gln Thr Pro Val Asp
245 250 255
Arg Ser Pro Pro Arg Val Asn Gln Arg Pro Ile Arg Val Asp Arg Ala
260 265 270
Ala Met Arg Asn Arg Gly Asn Asp Glu Ala Asp Ala Ala Leu Arg Gly
275 280 285
Leu Val Gln Gln Gly Val Asn Leu Glu His Leu Arg Thr Ala Leu Glu
290 295 300
Arg His Val Met Gln Arg Leu Pro Ile Pro Leu Asp Ile Gly Ser Ala
305 310 315 320
Leu Gln Asn Val Gly Ile Asn Pro Ser Ile Asp Leu Gly Glu Ser Leu
325 330 335
Val Gln His Pro Leu Leu Asn Leu Asn Val Ala Leu Asn Arg Met Leu
340 345 350
Gly Leu Arg Pro Ser Ala Glu Arg Ala Pro Arg Pro Ala Val Pro Val
355 360 365
Ala Pro Ala Thr Ala Ser Arg Arg Pro Asp Gly Thr Arg Ala Thr Arg
370 375 380
Leu Arg Val Met Pro Glu Arg Glu Asp Tyr Glu Asn Asn Val Ala Tyr
385 390 395 400
Gly Val Arg Leu Leu Asn Leu Asn Pro Gly Val Gly Val Arg Gln Ala
405 410 415
Val Ala Ala Phe Val Thr Asp Arg Ala Glu Arg Pro Ala Val Val Ala
420 425 430
Asn Ile Arg Ala Ala Leu Asp Pro Ile Ala Ser Gln Phe Ser Gln Leu
435 440 445
Arg Thr Ile Ser Lys Ala Asp Ala Glu Ser Glu Glu Leu Gly Phe Lys
450 455 460
Asp Ala Ala Asp His His Thr Asp Asp Val Thr His Cys Leu Phe Gly
465 470 475 480
Gly Glu Leu Ser Leu Ser Asn Pro Asp Gln Gln Val Ile Gly Leu Ala
485 490 495
Gly Asn Pro Thr Asp Thr Ser Gln Pro Tyr Ser Gln Glu Gly Asn Lys
500 505 510
Asp Leu Ala Phe Met Asp Met Lys Lys Leu Ala Gln Phe Leu Ala Gly
515 520 525
Lys Pro Glu His Pro Met Thr Arg Glu Thr Leu Asn Ala Glu Asn Ile
530 535 540
Ala Lys Tyr Ala Phe Arg Ile Val Pro
545 550
<210> 2
<211> 1659
<212> DNA
<213> Artificial
<220>
<223> AvrPtoB U-box motif from Pseudomonas syringae
<400> 2
atggcgggta tcaatagagc gggaccatcg ggcgcttatt ttgttggcca cacagacccc 60
gagccagtat cggggcaagc acacggatcc ggcagcggcg ccagctcctc gaacagtccg 120
caggttcagc cgcgaccctc gaatactccc ccgtcgaacg cgcccgcacc gccgccaacc 180
ggacgtgaga ggctttcacg atccacggcg ctgtcgcgcc aaaccaggga gtggctggag 240
cagggtatgc ctacagcgga ggatgccagc gtgcgtcgta ggccacaggt gactgccgat 300
gccgcaacgc cgcgtgcaga ggcaagacgc acgccggagg caactgccga tgccagcgca 360
ccgcgtagag gggcggttgc acacgccaac agtatcgttc agcaattggt cagtgagggc 420
gctgatattt cgcatactcg taacatgctc cgcaatgcaa tgaatggcga cgcagtcgct 480
ttttctcgag tagaacagaa catatttcgc cagcatttcc cgaacatgcc catgcatgga 540
atcagccgag attcggaact cgctatcgag ctccgtgggg cgcttcgtcg agcggttcac 600
caacaggcgg cgtcagcgcc agtgaggtcg cccacgccaa caccggccag ccctgcggca 660
tcatcatcgg gcagcagtca gcgttcttta tttggacggt ttgcccgttt gatggcgcca 720
aaccagggac ggtcgtcgaa cactgccgcc tctcagacgc cggtcgacag gagcccgcca 780
cgcgtcaacc aaagacccat acgcgtcgac agggctgcga tgcgtaatcg tggcaatgac 840
gaggcggacg ccgcgctgcg ggggttagta caacaggggg tcaatttaga gcacctgcgc 900
acggcccttg aaagacatgt aatgcagcgc ctccctatcc ccctcgatat aggcagcgcg 960
ttgcagaatg tgggaattaa cccaagtatc gacttggggg aaagccttgt gcaacatccc 1020
ctgctgaatt tgaatgtagc gttgaatcgc atgctggggc tgcgtcccag cgctgaaaga 1080
gcgcctcgtc cagccgtccc cgtggctccc gcgaccgcct ccaggcgacc ggatggtacg 1140
cgtgcaacac gattgcgggt gatgccggag cgggaggatt acgaaaataa tgtggcttat 1200
ggagtgcgct tgcttaacct gaacccgggg gtgggggtaa ggcaggctgt tgcggccttt 1260
gtaaccgacc gggctgagcg gccagcagtg gtggctaata tccgggcagc cctggaccct 1320
atcgcgtcac aattcagtca gctgcgcaca atttcgaagg ccgatgctga atctgaagag 1380
ctgggtttta aggatgcggc agatcatcac acggatgacg tgacgcactg tctttttggc 1440
ggagaattgt cgctgagtaa tccggatcag caggtgatcg gtttggcggg taatccgacg 1500
gacacgtcgc agccttacag ccaagaggga aataaggacc tggcgttcat ggatatgaaa 1560
aaacttgccc aattcctcgc aggcaagcct gagcatccga tgaccagaga aacgcttaac 1620
gccgaaaata tcgccaagta tgcttttaga atagtcccc 1659
<210> 3
<211> 587
<212> PRT
<213> Artificial
<220>
<223> IpaH0722 novel E3 ligase from Shigella flexneri
<400> 3
Met Lys Pro Ala His Asn Pro Ser Phe Phe Arg Ser Phe Cys Gly Leu
1 5 10 15
Gly Cys Ile Ser Arg Leu Ser Val Glu Glu Gln Asn Ile Thr Asp Tyr
20 25 30
His Arg Ile Trp Asp Asn Trp Ala Lys Glu Gly Ala Ala Thr Glu Asp
35 40 45
Arg Thr Gln Ala Val Arg Leu Leu Lys Ile Cys Leu Ala Phe Gln Glu
50 55 60
Pro Ala Leu Asn Leu Ser Leu Leu Arg Leu Arg Ser Leu Pro Tyr Leu
65 70 75 80
Pro Pro His Ile Gln Glu Leu Asn Ile Ser Ser Asn Glu Leu Arg Ser
85 90 95
Leu Pro Glu Leu Pro Pro Ser Leu Thr Val Leu Lys Ala Ser Asp Asn
100 105 110
Arg Leu Ser Arg Leu Pro Ala Leu Pro Pro His Leu Val Ala Leu Asp
115 120 125
Val Ser Leu Asn Arg Val Leu Thr Cys Leu Pro Ser Leu Pro Ser Ser
130 135 140
Leu Gln Ser Leu Ser Ala Leu Leu Asn Ser Leu Glu Thr Leu Pro Asp
145 150 155 160
Leu Pro Pro Ala Leu Gln Lys Leu Ser Val Gly Asn Asn Gln Leu Thr
165 170 175
Ala Leu Pro Glu Leu Pro Cys Glu Leu Gln Glu Leu Ser Ala Phe Asp
180 185 190
Asn Arg Leu Gln Glu Leu Pro Pro Leu Pro Gln Asn Leu Arg Leu Leu
195 200 205
Asn Val Gly Glu Asn Gln Leu His Arg Leu Pro Glu Leu Pro Gln Arg
210 215 220
Leu Gln Ser Leu Tyr Ile Pro Asn Asn Gln Leu Asn Thr Leu Pro Asp
225 230 235 240
Ser Ile Met Asn Leu His Ile Tyr Ala Asp Val Asn Ile Tyr Asn Asn
245 250 255
Pro Leu Ser Thr Arg Thr Leu Gln Ala Leu Gln Arg Leu Thr Ser Ser
260 265 270
Pro Asp Tyr His Gly Pro Arg Ile Tyr Phe Ser Met Ser Asp Gly Gln
275 280 285
Gln Asn Thr Leu His Arg Pro Leu Ala Asp Ala Val Thr Ala Trp Phe
290 295 300
Pro Glu Asn Lys Gln Ser Asp Val Ser Gln Ile Trp His Ala Phe Glu
305 310 315 320
His Glu Glu His Ala Asn Thr Phe Ser Ala Phe Leu Asp Arg Leu Ser
325 330 335
Asp Thr Val Ser Ala Arg Asn Thr Ser Gly Phe Arg Glu Gln Val Ala
340 345 350
Ala Trp Leu Glu Lys Leu Ser Ala Ser Ala Glu Leu Arg Gln Gln Ser
355 360 365
Phe Ala Val Ala Ala Asp Ala Thr Glu Ser Cys Glu Asp Arg Val Ala
370 375 380
Leu Thr Trp Asn Asn Leu Arg Lys Thr Leu Leu Val His Gln Ala Ser
385 390 395 400
Glu Gly Leu Phe Asp Asn Asp Thr Gly Ala Leu Leu Ser Leu Gly Arg
405 410 415
Glu Met Phe Arg Leu Glu Ile Leu Glu Asp Ile Ala Arg Asp Lys Val
420 425 430
Arg Thr Leu His Phe Val Asp Glu Ile Glu Val Tyr Leu Ala Phe Gln
435 440 445
Thr Met Leu Ala Glu Lys Leu Gln Leu Ser Thr Ala Val Lys Glu Met
450 455 460
Arg Phe Tyr Gly Val Ser Gly Val Thr Ala Asn Asp Leu Arg Thr Ala
465 470 475 480
Glu Ala Met Val Arg Ser Arg Glu Glu Asn Glu Phe Thr Asp Trp Phe
485 490 495
Ser Leu Trp Gly Pro Trp His Ala Val Leu Lys Arg Thr Glu Ala Asp
500 505 510
Arg Trp Ala Leu Ala Glu Glu Gln Lys Tyr Glu Met Leu Glu Asn Glu
515 520 525
Tyr Pro Gln Arg Val Ala Asp Arg Leu Lys Ala Ser Gly Leu Ser Gly
530 535 540
Asp Ala Asp Ala Glu Arg Glu Ala Gly Ala Gln Val Met Arg Glu Thr
545 550 555 560
Glu Gln Gln Ile Tyr Arg Gln Leu Thr Asp Glu Val Leu Ala Leu Arg
565 570 575
Leu Pro Glu Asn Gly Ser Gln Leu His His Ser
580 585
<210> 4
<211> 1764
<212> DNA
<213> Artificial
<220>
<223> IpaH0722 novel E3 ligase from Shigella flexneri
<400> 4
atgaaacctg cccacaatcc ttcttttttc cgctcctttt gtggtttagg atgtatatcc 60
cgtttatccg tagaagagca aaatatcacg gattatcacc gcatctggga taactgggcc 120
aaggaaggtg ctgcaacaga agaccgaaca caggcagttc gattactgaa aatatgtctg 180
gcttttcaag agccagccct caatttaagt ttactcagat tacgctctct cccatacctg 240
cccccgcaca tacaagaact taacatctct agcaatgagc tacgctctct gccagaactc 300
cctccgtcct taactgtact taaagccagc gataacagac tgagcaggct cccggctctt 360
ccgcctcacc tggtcgctct tgatgtttca cttaacagag ttttaacatg tttgccttct 420
cttccatctt ccttgcagtc actctcagcc cttctcaata gcctggagac gctacctgat 480
cttcccccgg ctctacaaaa actttctgtt ggcaacaacc agcttactgc cttaccagaa 540
ttaccatgtg aactacagga actaagtgct tttgataaca gattacaaga gctaccgccc 600
cttcctcaaa atctgaggct tttaaacgtt ggggaaaacc aactacacag actgcccgaa 660
cttccacaac gtctgcaatc actatatatc cctaacaatc agctgaacac attgccagac 720
agtatcatga atctgcacat ttatgcagat gttaatattt ataacaatcc attgtcgact 780
cgcactctgc aagccctgca aagattaacc tcttcgccgg actaccacgg cccacggatt 840
tacttctcca tgagtgacgg acaacagaat acactccatc gccccctggc tgatgccgtg 900
acagcatggt tcccggaaaa caaacaatct gatgtatcac agatatggca tgcttttgaa 960
catgaagagc atgccaacac cttttccgcg ttccttgacc gcctttccga taccgtctct 1020
gcacgcaata cctccggatt ccgtgaacag gtcgctgcat ggctggaaaa actcagtgcc 1080
tctgcggagc ttcgacagca gtctttcgct gttgctgctg atgccactga gagctgtgag 1140
gaccgtgtcg cgctcacatg gaacaatctc cggaaaaccc tcctggtcca tcaggcatca 1200
gaaggccttt tcgataatga taccggcgct ctgctctccc tgggcaggga aatgttccgc 1260
ctcgaaattc tggaggacat tgcccgggat aaagtcagaa ctctccattt tgtggatgag 1320
atagaagtct acctggcctt ccagaccatg ctcgcagaga aacttcagct ctctactgcc 1380
gtgaaggaaa tgcgtttcta tggcgtgtcg ggagtgacag caaatgacct ccgcactgcc 1440
gaagccatgg tcagaagccg tgaagagaat gaatttacgg actggttctc cctctgggga 1500
ccatggcatg ctgtactgaa gcgtacggaa gctgaccgct gggcgctggc agaagagcag 1560
aaatatgaga tgctggagaa tgagtaccct cagagggtgg ctgaccggct gaaagcatca 1620
ggtctgagcg gtgatgcgga tgcggagagg gaagccggtg cacaggtgat gcgtgagact 1680
gaacagcaga tttaccgtca gctgactgac gaggtactgg ccctgcgatt gcctgaaaac 1740
ggctcacaac tgcaccattc ataa 1764
<210> 5
<211> 575
<212> PRT
<213> Artificial
<220>
<223> IpaH1.4 novel E3 ligase from Shigella flexneri
<400> 5
Met Ile Lys Ser Thr Asn Ile Gln Ala Ile Gly Ser Gly Ile Met His
1 5 10 15
Gln Ile Asn Asn Ile Tyr Ser Leu Thr Pro Phe Pro Leu Pro Met Glu
20 25 30
Leu Thr Pro Ser Cys Asn Glu Phe Tyr Leu Lys Ala Trp Ser Glu Trp
35 40 45
Glu Lys Asn Gly Thr Pro Gly Glu Gln Arg Asn Ile Ala Phe Asn Arg
50 55 60
Leu Lys Ile Cys Leu Gln Asn Gln Glu Ala Glu Leu Asn Leu Ser Glu
65 70 75 80
Leu Asp Leu Lys Thr Leu Pro Asp Leu Pro Pro Gln Ile Thr Thr Leu
85 90 95
Glu Ile Arg Lys Asn Leu Leu Thr His Leu Pro Asp Leu Pro Pro Met
100 105 110
Leu Lys Val Ile His Ala Gln Phe Asn Gln Leu Glu Ser Leu Pro Ala
115 120 125
Leu Pro Glu Thr Leu Glu Glu Leu Asn Ala Gly Asp Asn Lys Ile Lys
130 135 140
Glu Leu Pro Phe Leu Pro Glu Asn Leu Thr His Leu Arg Val His Asn
145 150 155 160
Asn Arg Leu His Ile Leu Pro Leu Leu Pro Pro Glu Leu Lys Leu Leu
165 170 175
Val Val Ser Gly Asn Arg Leu Asp Ser Ile Pro Pro Phe Pro Asp Lys
180 185 190
Leu Glu Gly Leu Ala Met Ala Asn Asn Phe Ile Glu Gln Leu Pro Glu
195 200 205
Leu Pro Phe Ser Met Asn Arg Ala Val Leu Met Asn Asn Asn Leu Thr
210 215 220
Thr Leu Pro Glu Ser Val Leu Arg Leu Ala Gln Asn Ala Phe Val Asn
225 230 235 240
Val Ala Gly Asn Pro Leu Ser Gly His Thr Met Arg Thr Leu Gln Gln
245 250 255
Ile Thr Thr Gly Pro Asp Tyr Ser Gly Pro Arg Ile Phe Phe Ser Met
260 265 270
Gly Asn Ser Ala Thr Ile Ser Ala Pro Glu His Ser Leu Ala Asp Ala
275 280 285
Val Thr Ala Trp Phe Pro Glu Asn Lys Gln Ser Asp Val Ser Gln Ile
290 295 300
Trp His Ala Phe Glu His Glu Glu His Ala Asn Thr Phe Ser Ala Phe
305 310 315 320
Leu Asp Arg Leu Ser Asp Thr Val Ser Ala Arg Asn Thr Ser Gly Phe
325 330 335
Arg Glu Gln Val Ala Ala Trp Leu Glu Lys Leu Ser Ala Ser Ala Glu
340 345 350
Leu Arg Gln Gln Ser Phe Ala Val Ala Ala Asp Ala Thr Glu Ser Cys
355 360 365
Glu Asp Arg Val Ala Leu Thr Trp Asn Asn Leu Arg Lys Thr Leu Leu
370 375 380
Val His Gln Ala Ser Glu Gly Leu Phe Asp Asn Asp Thr Gly Ala Leu
385 390 395 400
Leu Ser Leu Gly Arg Glu Met Phe Arg Leu Glu Ile Leu Glu Asp Ile
405 410 415
Ala Arg Asp Lys Val Arg Thr Leu His Phe Val Asp Glu Ile Glu Val
420 425 430
Tyr Leu Ala Phe Gln Thr Met Leu Ala Glu Lys Leu Gln Leu Ser Thr
435 440 445
Ala Val Lys Glu Met Arg Phe Tyr Gly Val Ser Gly Val Thr Ala Asn
450 455 460
Asp Leu Arg Thr Ala Glu Ala Met Val Arg Ser Arg Glu Glu Asn Glu
465 470 475 480
Phe Lys Asp Trp Phe Ser Leu Trp Gly Pro Trp His Ala Val Leu Lys
485 490 495
Arg Thr Glu Ala Asp Arg Trp Ala Gln Ala Glu Glu Gln Lys Tyr Glu
500 505 510
Met Leu Glu Asn Glu Tyr Ser Gln Arg Val Ala Asp Arg Leu Lys Ala
515 520 525
Ser Gly Leu Ser Gly Asp Thr Asp Ala Glu Arg Glu Ala Gly Ala Gln
530 535 540
Val Met Arg Glu Thr Glu Gln Gln Ile Tyr Arg Gln Leu Thr Asp Glu
545 550 555 560
Val Leu Ala Leu Arg Leu Ser Glu Asn Gly Ser Asn His Ile Ala
565 570 575
<210> 6
<211> 1728
<212> DNA
<213> Artificial
<220>
<223> IpaH1.4 novel E3 ligase from Shigella flexneri
<400> 6
atgattaaat caaccaatat acaggcaatc ggttctggta ttatgcatca aataaacaat 60
atatactcgt taactccatt tcctttacct atggaactga ctccatcttg taatgaattt 120
tatttaaaag cctggagtga atgggaaaag aacggtaccc caggcgagca acgcaatatc 180
gccttcaata ggctgaaaat atgtttacaa aatcaagagg cagaattaaa tttatctgag 240
ttagatttaa aaacattacc agatttaccg cctcagataa caacactgga aataagaaaa 300
aacctattaa cacatctccc tgatttacca ccaatgctta aggtaataca tgctcaattt 360
aatcaactgg aaagcttacc tgccttaccc gagacgttag aagagcttaa tgcgggtgat 420
aacaagataa aagaattacc atttcttcct gaaaatctaa ctcatttacg ggttcataat 480
aaccgattgc atattctgcc actattgcca ccggaactaa aattactggt agtttctgga 540
aacagattag acagcattcc cccctttcca gataagcttg aagggctggc tatggctaat 600
aattttatag aacaactacc ggaattacct tttagtatga acagggctgt gctaatgaat 660
aataatctga caacacttcc ggaaagtgtc ctgagattag ctcagaatgc cttcgtaaat 720
gttgcaggta atccactgtc tggccatacc atgcgtacac tacaacaaat aaccaccgga 780
ccagattatt ctggtcctcg aatatttttc tctatgggaa attctgccac aatttccgct 840
ccagaacact ccctggctga tgccgtgaca gcatggttcc cggaaaacaa acaatctgat 900
gtatcacaga tatggcatgc ttttgaacat gaagagcacg ccaacacctt ttccgcgttc 960
cttgaccgcc tttccgatac cgtctctgca cgcaatacct ccggattccg tgaacaggtc 1020
gctgcatggc tggaaaaact cagtgcctct gcggagcttc gacagcagtc tttcgctgtt 1080
gctgctgatg ccactgagag ctgtgaggac cgtgtcgcgc tcacatggaa caatctccgg 1140
aaaaccctcc tggtccatca ggcatcagaa ggccttttcg ataatgatac cggcgctctg 1200
ctctccctgg gcagggaaat gttccgcctc gaaattctgg aggacattgc ccgggataaa 1260
gtcagaactc tccattttgt ggatgagata gaagtctacc tggccttcca gaccatgctc 1320
gcagagaaac ttcagctctc cactgccgtg aaggaaatgc gtttctatgg cgtgtcggga 1380
gtgacagcaa atgacctccg cactgccgaa gccatggtca gaagccgtga agagaatgaa 1440
tttaaggact ggttctccct ctggggacca tggcatgctg tactgaagcg tacggaagct 1500
gaccgctggg cgcaggcaga agagcagaag tatgagatgc tggagaatga gtactctcag 1560
agggtggctg accggctgaa agcatcaggt ctgagcggtg atacggatgc ggagagggaa 1620
gccggtgcac aggtgatgcg tgagactgaa cagcagattt accgtcagtt gactgacgag 1680
gtactggccc tgcgattgtc tgaaaacggc tcaaatcata tcgcataa 1728
<210> 7
<211> 571
<212> PRT
<213> Artificial
<220>
<223> IpaH2.5 novel E3 ligase from Shigella flexneri
<400> 7
Met Leu Ile Arg Ile Leu Val Ile Met Ile Lys Ser Thr Asn Ile Gln
1 5 10 15
Ala Ile Gly Ser Gly Ile Met His Gln Ile Asn Asn Val Tyr Ser Leu
20 25 30
Thr Pro Leu Ser Leu Pro Met Glu Leu Thr Pro Ser Cys Asn Glu Phe
35 40 45
Tyr Leu Lys Thr Trp Ser Glu Trp Glu Lys Asn Gly Thr Pro Gly Glu
50 55 60
Gln Arg Asn Ile Ala Phe Asn Arg Leu Lys Ile Cys Leu Gln Asn Gln
65 70 75 80
Glu Ala Glu Leu Asn Leu Ser Glu Leu Asp Leu Lys Thr Leu Pro Asp
85 90 95
Leu Pro Pro Gln Ile Thr Thr Leu Glu Ile Arg Lys Asn Leu Leu Thr
100 105 110
His Leu Pro Asp Leu Pro Pro Met Leu Lys Val Ile His Ala Gln Phe
115 120 125
Asn Gln Leu Glu Ser Leu Pro Ala Leu Pro Glu Thr Leu Glu Glu Leu
130 135 140
Asn Ala Gly Asp Asn Lys Ile Lys Glu Leu Pro Phe Leu Pro Glu Asn
145 150 155 160
Leu Thr His Leu Arg Val His Asn Asn Arg Leu His Ile Leu Pro Leu
165 170 175
Leu Pro Pro Glu Leu Lys Leu Leu Val Val Ser Gly Asn Arg Leu Asp
180 185 190
Ser Ile Pro Pro Phe Pro Asp Lys Leu Glu Gly Leu Ala Leu Ala Asn
195 200 205
Asn Phe Ile Glu Gln Leu Pro Glu Leu Pro Phe Ser Met Asn Arg Ala
210 215 220
Val Leu Met Asn Asn Asn Leu Thr Thr Leu Pro Glu Ser Val Leu Arg
225 230 235 240
Leu Ala Gln Asn Ala Phe Val Asn Val Ala Gly Asn Pro Leu Ser Gly
245 250 255
His Thr Met Arg Thr Leu Gln Gln Ile Thr Thr Gly Pro Asp Tyr Ser
260 265 270
Gly Pro Arg Ile Phe Phe Ser Met Gly Asn Ser Ala Thr Ile Ser Ala
275 280 285
Pro Glu His Ser Leu Ala Asp Ala Val Thr Ala Trp Phe Pro Glu Asn
290 295 300
Lys Gln Ser Asp Val Ser Gln Ile Trp His Ala Phe Glu His Glu Glu
305 310 315 320
His Ala Asn Thr Phe Ser Ala Phe Leu Asp Arg Leu Ser Asp Thr Val
325 330 335
Ser Ala Arg Asn Thr Ser Gly Phe Arg Glu Gln Val Ala Ala Trp Leu
340 345 350
Glu Lys Leu Ser Ala Ser Ala Glu Leu Arg Gln Gln Ser Phe Ala Val
355 360 365
Ala Ala Asp Ala Thr Glu Ser Cys Glu Asp Arg Val Ala Leu Thr Trp
370 375 380
Asn Asn Leu Arg Lys Thr Leu Leu Val His Gln Ala Ser Glu Gly Leu
385 390 395 400
Phe Asp Asn Asp Thr Gly Ala Leu Leu Ser Leu Gly Arg Glu Met Phe
405 410 415
Arg Leu Glu Ile Leu Glu Asp Ile Ala Arg Asp Lys Val Arg Thr Leu
420 425 430
His Phe Val Asp Glu Ile Glu Val Tyr Leu Ala Phe Gln Thr Met Leu
435 440 445
Ala Glu Lys Leu Gln Leu Ser Thr Ala Val Lys Glu Met Arg Phe Tyr
450 455 460
Gly Val Ser Gly Val Thr Ala Asn Asp Leu Arg Thr Ala Glu Ala Met
465 470 475 480
Val Arg Ser Arg Glu Glu Asn Glu Phe Thr Asp Trp Phe Ser Leu Trp
485 490 495
Gly Pro Trp His Ala Val Leu Lys Arg Thr Glu Ala Asp Arg Trp Ala
500 505 510
Gln Ala Glu Glu Gln Lys Tyr Glu Met Leu Glu Asn Glu Tyr Ser Gln
515 520 525
Arg Val Ala Asp Arg Leu Lys Ala Ser Gly Leu Ser Gly Asp Ala Asp
530 535 540
Ala Glu Arg Glu Ala Gly Ala Gln Val Met Arg Glu Thr Glu Gln Gln
545 550 555 560
Ile Tyr Arg Gln Leu Thr Asp Glu Val Leu Ala
565 570
<210> 8
<211> 1716
<212> DNA
<213> Artificial
<220>
<223> IpaH2.5 novel E3 ligase from Shigella flexneri
<400> 8
atgttgataa gaattctagt tataatgatt aaatcaacca atatacaggc aatcggttct 60
ggcattatgc atcaaataaa caatgtatac tcgttaactc cattatcttt acctatggaa 120
ctgactccat cttgtaatga attttattta aaaacctgga gcgaatggga aaagaacggt 180
accccaggcg agcaacgcaa tatcgccttc aataggctga aaatatgttt acaaaatcaa 240
gaggcagaat taaatttatc tgagttagat ttaaaaacat taccagattt accgcctcag 300
ataacaacac tggaaataag aaaaaaccta ttaacacatc tccctgattt accaccaatg 360
cttaaggtaa tacatgctca atttaatcaa ctggaaagct tacctgcctt acccgagacg 420
ttagaagagc ttaatgcggg tgataacaag ataaaagaat taccatttct tcctgaaaat 480
ctaactcatt tacgggttca taataaccga ttgcatattc tgccactatt gccaccggaa 540
ctaaaattac tggtagtttc tggaaacaga ttagacagca ttcccccctt tccagataag 600
cttgaagggc tggctctggc taataatttt atagaacaac taccggaatt accttttagt 660
atgaacaggg ctgtgctaat gaataataat ctgacaacac ttccggaaag tgtcctgaga 720
ttagctcaga atgccttcgt aaatgttgca ggtaatccat tgtctggcca taccatgcgt 780
acactacaac aaataaccac cggaccagat tattctggtc ctcgaatatt tttctctatg 840
ggaaattctg ccacaatttc cgctccagaa cactccctgg ctgatgccgt gacagcatgg 900
ttcccggaaa acaaacaatc tgatgtatca cagatatggc atgcttttga acatgaagag 960
catgccaaca ccttttccgc gttccttgac cgcctttccg ataccgtctc tgcacgcaat 1020
acctccggat tccgtgaaca ggtcgctgca tggctggaaa aactcagtgc ctctgcggag 1080
cttcgacagc agtctttcgc tgttgctgct gatgccactg agagctgtga ggaccgtgtc 1140
gcgctcacat ggaacaatct ccggaaaacc ctcctggtcc atcaggcatc agaaggcctt 1200
ttcgataatg ataccggcgc tctgctctcc ctgggcaggg aaatgttccg cctcgaaatt 1260
ctggaggata ttgcccggga taaagtcaga actctccatt ttgtggatga gatagaagtc 1320
tacctggcct tccagaccat gctcgcagag aaacttcagc tctctactgc cgtgaaggaa 1380
atgcgtttct atggcgtgtc gggagtgaca gcaaatgacc tccgcactgc cgaagccatg 1440
gtcagaagcc gtgaagagaa tgaatttacg gactggttct ccctctgggg accatggcat 1500
gctgtactga agcgtacgga agctgaccgc tgggcgcagg cagaagagca gaagtatgag 1560
atgctggaga atgagtactc tcagagggtg gctgaccggc tgaaagcatc aggtctgagc 1620
ggtgatgcgg atgcggagag ggaagccggt gcacaggtga tgcgtgagac tgaacagcag 1680
atttaccgtc agttgactga cgaggtactg gcctga 1716
<210> 9
<211> 574
<212> PRT
<213> Artificial
<220>
<223> IpaH4.5 novel E3 ligase from Shigella flexneri
<400> 9
Met Lys Pro Ile Asn Asn His Ser Phe Phe Arg Ser Leu Cys Gly Leu
1 5 10 15
Ser Cys Ile Ser Arg Leu Ser Val Glu Glu Gln Cys Thr Arg Asp Tyr
20 25 30
His Arg Ile Trp Asp Asp Trp Ala Arg Glu Gly Thr Thr Thr Glu Asn
35 40 45
Arg Ile Gln Ala Val Arg Leu Leu Lys Ile Cys Leu Asp Thr Arg Glu
50 55 60
Pro Val Leu Asn Leu Ser Leu Leu Lys Leu Arg Ser Leu Pro Pro Leu
65 70 75 80
Pro Leu His Ile Arg Glu Leu Asn Ile Ser Asn Asn Glu Leu Ile Ser
85 90 95
Leu Pro Glu Asn Ser Pro Leu Leu Thr Glu Leu His Val Asn Gly Asn
100 105 110
Asn Leu Asn Ile Leu Pro Thr Leu Pro Ser Gln Leu Ile Lys Leu Asn
115 120 125
Ile Ser Phe Asn Arg Asn Leu Ser Cys Leu Pro Ser Leu Pro Pro Tyr
130 135 140
Leu Gln Ser Leu Ser Ala Arg Phe Asn Ser Leu Glu Thr Leu Pro Glu
145 150 155 160
Leu Pro Ser Thr Leu Thr Ile Leu Arg Ile Glu Gly Asn Arg Leu Thr
165 170 175
Val Leu Pro Glu Leu Pro His Arg Leu Gln Glu Leu Phe Val Ser Gly
180 185 190
Asn Arg Leu Gln Glu Leu Pro Glu Phe Pro Gln Ser Leu Lys Tyr Leu
195 200 205
Lys Val Gly Glu Asn Gln Leu Arg Arg Leu Ser Arg Leu Pro Gln Glu
210 215 220
Leu Leu Ala Leu Asp Val Ser Asn Asn Leu Leu Thr Ser Leu Pro Glu
225 230 235 240
Asn Ile Ile Thr Leu Pro Ile Cys Thr Asn Val Asn Ile Ser Gly Asn
245 250 255
Pro Leu Ser Thr Arg Val Leu Gln Ser Leu Gln Arg Leu Thr Ser Ser
260 265 270
Pro Asp Tyr His Gly Pro Gln Ile Tyr Phe Ser Met Ser Asp Gly Gln
275 280 285
Gln Asn Thr Leu His Arg Pro Leu Ala Asp Ala Val Thr Ala Trp Phe
290 295 300
Pro Glu Asn Lys Gln Ser Asp Val Ser Gln Ile Trp His Ala Phe Glu
305 310 315 320
His Glu Glu His Ala Asn Thr Phe Ser Ala Phe Leu Asp Arg Leu Ser
325 330 335
Asp Thr Val Ser Ala Arg Asn Thr Ser Gly Phe Arg Glu Gln Val Ala
340 345 350
Ala Trp Leu Glu Lys Leu Ser Ala Ser Ala Glu Leu Arg Gln Gln Ser
355 360 365
Phe Ala Val Ala Ala Asp Ala Thr Glu Ser Cys Glu Asp Arg Val Ala
370 375 380
Leu Thr Trp Asn Asn Leu Arg Lys Thr Leu Leu Val His Gln Ala Ser
385 390 395 400
Glu Gly Leu Phe Asp Asn Asp Thr Gly Ala Leu Leu Ser Leu Gly Arg
405 410 415
Glu Met Phe Arg Leu Glu Ile Leu Glu Asp Ile Ala Arg Asp Lys Val
420 425 430
Arg Thr Leu His Phe Val Asp Glu Ile Glu Val Tyr Leu Ala Phe Gln
435 440 445
Thr Met Leu Ala Glu Lys Leu Gln Leu Ser Thr Ala Val Lys Glu Met
450 455 460
Arg Phe Tyr Gly Val Ser Gly Val Thr Ala Asn Asp Leu Arg Thr Ala
465 470 475 480
Glu Ala Met Val Arg Ser Arg Glu Glu Asn Glu Phe Thr Asp Trp Phe
485 490 495
Ser Leu Trp Gly Pro Trp His Ala Val Leu Lys Arg Thr Glu Ala Asp
500 505 510
Arg Trp Ala Gln Ala Glu Glu Gln Lys Tyr Glu Met Leu Glu Asn Glu
515 520 525
Tyr Ser Gln Arg Val Ala Asp Arg Leu Lys Ala Ser Gly Leu Ser Gly
530 535 540
Asp Ala Asp Ala Gln Arg Glu Ala Gly Ala Gln Val Met Arg Glu Thr
545 550 555 560
Glu Gln Gln Ile Tyr Arg Gln Leu Thr Asp Glu Val Leu Ala
565 570
<210> 10
<211> 1725
<212> DNA
<213> Artificial
<220>
<223> IpaH4.5 novel E3 ligase from Shigella flexneri
<400> 10
atgaaaccga tcaacaatca ttcttttttt cgttcccttt gtggcttatc atgtatatct 60
cgtttatcgg tagaagaaca gtgtaccaga gattaccacc gcatctggga tgactgggct 120
agggaaggaa caacaacaga aaatcgcatc caggcggttc gattattgaa aatatgtctg 180
gatacccggg agcctgttct caatttaagc ttactgaaac tacgttcttt accaccactc 240
cctttgcata tacgtgaact taatatttcc aacaatgagt taatctccct acctgaaaat 300
tctccgcttt tgacagaact tcatgtaaat ggtaacaact tgaatatact cccgacactt 360
ccatctcaac tgattaagct taatatttca ttcaatcgaa atttgtcatg tctgccatca 420
ttaccaccat atttacaatc actctcggca cgttttaata gtctggagac gttaccagag 480
cttccatcaa cgctaacaat attacgtatt gaaggtaatc gccttactgt cttgcctgaa 540
ttgcctcata gactacaaga actctttgtt tccggcaaca gactacagga actaccagaa 600
tttcctcaga gcttaaaata tttgaaggta ggtgaaaatc aactacgcag attatccaga 660
ttaccgcaag aactattggc tctggatgtt tccaataacc tactaacttc attacccgaa 720
aatataatca cattgcccat ttgtacgaat gttaacattt cagggaatcc attgtcgact 780
cgcgttctgc aatccctgca aagattaacc tcttcgccgg actaccacgg cccgcagatt 840
tacttctcca tgagtgacgg acaacagaat acactccatc gccccctggc tgatgccgtg 900
acagcatggt tcccggaaaa caaacaatct gatgtatcac agatatggca tgcttttgaa 960
catgaagagc atgccaacac cttttccgcg ttccttgacc gcctttccga taccgtctct 1020
gcacgcaata cctccggatt ccgtgaacag gtcgctgcat ggctggaaaa actcagtgcc 1080
tctgcggagc ttcgacagca gtctttcgct gttgctgctg atgccactga gagctgtgag 1140
gaccgtgtcg cgctcacatg gaacaatctc cggaaaaccc tcctggtcca tcaggcatca 1200
gaaggccttt tcgataatga taccggcgct ctgctctccc tgggcaggga aatgttccgc 1260
ctcgaaattc tggaggacat tgcccgggat aaagtcagaa ctctccattt tgtggatgag 1320
atagaagtct acctggcctt ccagaccatg ctcgcagaga aacttcagct ctccactgcc 1380
gtgaaggaaa tgcgtttcta tggcgtgtcg ggagtgacag caaatgacct ccgcactgcc 1440
gaagctatgg tcagaagccg tgaagagaat gaatttacgg actggttctc cctctgggga 1500
ccatggcatg ctgtactgaa gcgtacggaa gctgaccgct gggcgcaggc agaagagcag 1560
aagtatgaga tgctggagaa tgagtactct cagagggtgg ctgaccggct gaaagcatca 1620
ggtctgagcg gtgatgcgga tgcgcagagg gaagccggtg cacaggtgat gcgtgagact 1680
gaacagcaga tttaccgtca gctgactgac gaggtactgg cctga 1725
<210> 11
<211> 565
<212> PRT
<213> Artificial
<220>
<223> IpaH7.8 novel E3 ligase from Shigella flexneri
<400> 11
Met Phe Ser Val Asn Asn Thr His Ser Ser Val Ser Cys Ser Pro Ser
1 5 10 15
Ile Asn Ser Asn Ser Thr Ser Asn Glu His Tyr Leu Arg Ile Leu Thr
20 25 30
Glu Trp Glu Lys Asn Ser Ser Pro Gly Glu Glu Arg Gly Ile Ala Phe
35 40 45
Asn Arg Leu Ser Gln Cys Phe Gln Asn Gln Glu Ala Val Leu Asn Leu
50 55 60
Ser Asp Leu Asn Leu Thr Ser Leu Pro Glu Leu Pro Lys His Ile Ser
65 70 75 80
Ala Leu Ile Val Glu Asn Asn Lys Leu Thr Ser Leu Pro Lys Leu Pro
85 90 95
Ala Phe Leu Lys Glu Leu Asn Ala Asp Asn Asn Arg Leu Ser Val Ile
100 105 110
Pro Glu Leu Pro Glu Ser Leu Thr Thr Leu Ser Val Arg Ser Asn Gln
115 120 125
Leu Glu Asn Leu Pro Val Leu Pro Asn His Leu Thr Ser Leu Phe Val
130 135 140
Glu Asn Asn Arg Leu Tyr Asn Leu Pro Ala Leu Pro Glu Lys Leu Lys
145 150 155 160
Phe Leu His Val Tyr Tyr Asn Arg Leu Thr Thr Leu Pro Asp Leu Pro
165 170 175
Asp Lys Leu Glu Ile Leu Cys Ala Gln Arg Asn Asn Leu Val Thr Phe
180 185 190
Pro Gln Phe Ser Asp Arg Asn Asn Ile Arg Gln Lys Glu Tyr Tyr Phe
195 200 205
His Phe Asn Gln Ile Thr Thr Leu Pro Glu Ser Phe Ser Gln Leu Asp
210 215 220
Ser Ser Tyr Arg Ile Asn Ile Ser Gly Asn Pro Leu Ser Thr Arg Val
225 230 235 240
Leu Gln Ser Leu Gln Arg Leu Thr Ser Ser Pro Asp Tyr His Gly Pro
245 250 255
Gln Ile Tyr Phe Ser Met Ser Asp Gly Gln Gln Asn Thr Leu His Arg
260 265 270
Pro Leu Ala Asp Ala Val Thr Ala Trp Phe Pro Glu Asn Lys Gln Ser
275 280 285
Asp Val Ser Gln Ile Trp His Ala Phe Glu His Glu Glu His Ala Asn
290 295 300
Thr Phe Ser Ala Phe Leu Asp Arg Leu Ser Asp Thr Val Ser Ala Arg
305 310 315 320
Asn Thr Ser Gly Phe Arg Glu Gln Val Ala Ala Trp Leu Glu Lys Leu
325 330 335
Ser Ala Ser Ala Glu Leu Arg Gln Gln Ser Phe Ala Val Ala Ala Asp
340 345 350
Ala Thr Glu Ser Cys Glu Asp Arg Val Ala Leu Thr Trp Asn Asn Leu
355 360 365
Arg Lys Thr Leu Leu Val His Gln Ala Ser Glu Gly Leu Phe Asp Asn
370 375 380
Asp Thr Gly Ala Leu Leu Ser Leu Gly Arg Glu Met Phe Arg Leu Glu
385 390 395 400
Ile Leu Glu Asp Ile Ala Arg Asp Lys Val Arg Thr Leu His Phe Val
405 410 415
Asp Glu Ile Glu Val Tyr Leu Ala Phe Gln Thr Met Leu Ala Glu Lys
420 425 430
Leu Gln Leu Ser Thr Ala Val Lys Glu Met Arg Phe Tyr Gly Val Ser
435 440 445
Gly Val Thr Ala Asn Asp Leu Arg Thr Ala Glu Ala Met Val Arg Ser
450 455 460
Arg Glu Glu Asn Glu Phe Thr Asp Trp Phe Ser Leu Trp Gly Pro Trp
465 470 475 480
His Ala Val Leu Lys Arg Thr Glu Ala Asp Arg Trp Ala Gln Ala Glu
485 490 495
Glu Gln Lys Tyr Glu Met Leu Glu Asn Glu Tyr Ser Gln Arg Val Ala
500 505 510
Asp Arg Leu Lys Ala Ser Gly Leu Ser Gly Asp Ala Asp Ala Glu Arg
515 520 525
Glu Ala Gly Ala Gln Val Met Arg Glu Thr Glu Gln Gln Ile Tyr Arg
530 535 540
Gln Leu Thr Asp Glu Val Leu Ala Leu Arg Leu Ser Glu Asn Gly Ser
545 550 555 560
Arg Leu His His Ser
565
<210> 12
<211> 1698
<212> DNA
<213> Artificial
<220>
<223> IpaH7.8 novel E3 ligase from Shigella flexneri
<400> 12
atgttctctg taaataatac acactcatca gtttcttgct ccccctctat taactcaaac 60
tcaaccagta atgaacatta tctgagaatc ctgactgaat gggaaaagaa ctcttctccc 120
ggggaagagc gaggcattgc ttttaacaga ctctcccagt gctttcagaa tcaagaagca 180
gtattaaatt tatcagacct aaatttgacg tctcttcccg aattaccaaa gcatatttct 240
gctttgattg tagaaaataa taaattaaca tcattgccaa agctgcctgc atttcttaaa 300
gaacttaatg ctgataataa caggctttct gtgataccag aacttcctga gtcattaaca 360
actttaagtg ttcgttctaa tcaactggaa aaccttcctg ttttgccaaa ccatttaaca 420
tcattatttg ttgaaaataa caggctatat aacttaccgg ctcttcccga aaaattgaaa 480
tttttacatg tttattataa caggctgaca acattacccg acttaccgga taaactggaa 540
attctctgtg ctcagcgcaa taatctggtt acttttcctc aattttctga tagaaacaat 600
atcagacaaa aggaatatta ttttcatttt aatcagataa ccactcttcc ggagagtttt 660
tcacaattag attcaagtta caggattaat atttcaggga atccattgtc gactcgcgtt 720
ctgcaatccc tgcaaagatt aacctcttcg ccggactacc acggcccaca gatttacttc 780
tccatgagtg acggacaaca gaatacactc catcgccccc tggctgatgc cgtgacagca 840
tggttcccgg aaaacaaaca atctgatgta tcacagatat ggcatgcttt tgaacatgaa 900
gagcatgcca acaccttttc cgcgttcctt gaccgccttt ccgataccgt ctctgcacgc 960
aatacctccg gattccgtga acaggtcgct gcatggctgg aaaaactcag tgcctctgcg 1020
gagcttcgac agcagtcttt cgctgttgct gctgatgcca ctgagagctg tgaggaccgt 1080
gtcgcgctca catggaacaa tctccggaaa accctcctgg tccatcaggc atcagaaggc 1140
cttttcgata atgataccgg cgctctgctc tccctgggca gggaaatgtt ccgcctcgaa 1200
attctggagg acattgcccg ggataaagtc agaactctcc attttgtgga tgagatagaa 1260
gtctacctgg ccttccagac catgctcgca gagaaacttc agctctctac tgccgtgaag 1320
gaaatgcgtt tctatggcgt gtcgggagtg acagcaaatg acctccgcac tgccgaagcc 1380
atggtcagaa gccgtgaaga gaatgaattt acggactggt tctccctctg gggaccatgg 1440
catgctgtac tgaagcgtac ggaagctgac cgctgggcgc aggcagaaga gcagaagtat 1500
gagatgctgg agaatgagta ctctcagagg gtggctgacc ggctgaaagc atcaggtctg 1560
agcggtgatg cggatgcgga gagggaagcc ggtgcacagg tgatgcgtga gactgaacag 1620
cagatttacc gtcagttgac tgacgaggta ctggccctgc gattgtctga aaacggctca 1680
cgactgcacc attcataa 1698
<210> 13
<211> 545
<212> PRT
<213> Artificial
<220>
<223> IpaH9.8 novel E3 ligase from Shigella flexneri
<400> 13
Met Leu Pro Ile Asn Asn Asn Phe Ser Leu Pro Gln Asn Ser Phe Tyr
1 5 10 15
Asn Thr Ile Ser Gly Thr Tyr Ala Asp Tyr Phe Ser Ala Trp Asp Lys
20 25 30
Trp Glu Lys Gln Ala Leu Pro Gly Glu Glu Arg Asp Glu Ala Val Ser
35 40 45
Arg Leu Lys Glu Cys Leu Ile Asn Asn Ser Asp Glu Leu Arg Leu Asp
50 55 60
Arg Leu Asn Leu Ser Ser Leu Pro Asp Asn Leu Pro Ala Gln Ile Thr
65 70 75 80
Leu Leu Asn Val Ser Tyr Asn Gln Leu Thr Asn Leu Pro Glu Leu Pro
85 90 95
Val Thr Leu Lys Lys Leu Tyr Ser Ala Ser Asn Lys Leu Ser Glu Leu
100 105 110
Pro Val Leu Pro Pro Ala Leu Glu Ser Leu Gln Val Gln His Asn Glu
115 120 125
Leu Glu Asn Leu Pro Ala Leu Pro Asp Ser Leu Leu Thr Met Asn Ile
130 135 140
Ser Tyr Asn Glu Ile Val Ser Leu Pro Ser Leu Pro Gln Ala Leu Lys
145 150 155 160
Asn Leu Arg Ala Thr Arg Asn Phe Leu Thr Glu Leu Pro Ala Phe Ser
165 170 175
Glu Gly Asn Asn Pro Val Val Arg Glu Tyr Phe Phe Asp Arg Asn Gln
180 185 190
Ile Ser His Ile Pro Glu Ser Ile Leu Asn Leu Arg Asn Glu Cys Ser
195 200 205
Ile His Ile Ser Asp Asn Pro Leu Ser Ser His Ala Leu Gln Ala Leu
210 215 220
Gln Arg Leu Thr Ser Ser Pro Asp Tyr His Gly Pro Arg Ile Tyr Phe
225 230 235 240
Ser Met Ser Asp Gly Gln Gln Asn Thr Leu His Arg Pro Leu Ala Asp
245 250 255
Ala Val Thr Ala Trp Phe Pro Glu Asn Lys Gln Ser Asp Val Ser Gln
260 265 270
Ile Trp His Ala Phe Glu His Glu Glu His Ala Asn Thr Phe Ser Ala
275 280 285
Phe Leu Asp Arg Leu Ser Asp Thr Val Ser Ala Arg Asn Thr Ser Gly
290 295 300
Phe Arg Glu Gln Val Ala Ala Trp Leu Glu Lys Leu Ser Ala Ser Ala
305 310 315 320
Glu Leu Arg Gln Gln Ser Phe Ala Val Ala Ala Asp Ala Thr Glu Ser
325 330 335
Cys Glu Asp Arg Val Ala Leu Thr Trp Asn Asn Leu Arg Lys Thr Leu
340 345 350
Leu Val His Gln Ala Ser Glu Gly Leu Phe Asp Asn Asp Thr Gly Ala
355 360 365
Leu Leu Ser Leu Gly Arg Glu Met Phe Arg Leu Glu Ile Leu Glu Asp
370 375 380
Ile Ala Arg Asp Lys Val Arg Thr Leu His Phe Val Asp Glu Ile Glu
385 390 395 400
Val Tyr Leu Ala Phe Gln Thr Met Leu Ala Glu Lys Leu Gln Leu Ser
405 410 415
Thr Ala Val Lys Glu Met Arg Phe Tyr Gly Val Ser Gly Val Thr Ala
420 425 430
Asn Asp Leu Arg Thr Ala Glu Ala Met Val Arg Ser Arg Glu Glu Asn
435 440 445
Glu Phe Thr Asp Trp Phe Ser Leu Trp Gly Pro Trp His Ala Val Leu
450 455 460
Lys Arg Thr Glu Ala Asp Arg Trp Ala Gln Ala Glu Glu Gln Lys Tyr
465 470 475 480
Glu Met Leu Glu Asn Glu Tyr Pro Gln Arg Val Ala Asp Arg Leu Lys
485 490 495
Ala Ser Gly Leu Ser Gly Asp Ala Asp Ala Glu Arg Glu Ala Gly Ala
500 505 510
Gln Val Met Arg Glu Thr Glu Gln Gln Ile Tyr Arg Gln Leu Thr Asp
515 520 525
Glu Val Leu Ala Leu Arg Leu Ser Glu Asn Gly Ser Gln Leu His His
530 535 540
Ser
545
<210> 14
<211> 1638
<212> DNA
<213> Artificial
<220>
<223> IpaH9.8 novel E3 ligase from Shigella flexneri
<400> 14
atgttaccga taaataataa cttttcattg ccccaaaatt ctttttataa cactatttcc 60
ggtacatatg ctgattactt ttcagcatgg gataaatggg aaaaacaagc gctccccggt 120
gaagagcgtg atgaggctgt ctcccgactt aaagaatgtc ttatcaataa ttccgatgaa 180
cttcgactgg accgtttaaa tctgtcctcg ctacctgaca acttaccagc tcagataacg 240
ctgctcaatg tatcatataa tcaattaact aacctacctg aactgcctgt tacgctaaaa 300
aaattatatt ccgccagcaa taaattatca gaattgcccg tgctacctcc tgcgctggag 360
tcacttcagg tacaacacaa tgagctggaa aacctgccag ctttacccga ttcgttattg 420
actatgaata tcagctataa cgaaatagtc tccttaccat cgctcccaca ggctcttaaa 480
aatctcagag cgacccgtaa tttcctcact gagctaccag cattttctga gggaaataat 540
cccgttgtca gagagtattt ttttgataga aatcagataa gtcatatccc ggaaagcatt 600
cttaatctga ggaatgaatg ttcaatacat attagtgata acccattatc atcccatgct 660
ctgcaagccc tgcaaagatt aacctcttcg ccggactacc acggcccacg gatttacttc 720
tccatgagtg acggacaaca gaatacactc catcgccccc tggctgatgc cgtgacagca 780
tggttcccgg aaaacaaaca atctgatgta tcacagatat ggcatgcttt tgaacatgaa 840
gagcatgcca acaccttttc cgcgttcctt gaccgccttt ccgataccgt ctctgcacgc 900
aatacctccg gattccgtga acaggtcgct gcatggctgg aaaaactcag tgcctctgcg 960
gagcttcgac agcagtcttt cgctgttgct gctgatgcca ctgagagctg tgaggaccgt 1020
gtcgcgctca catggaacaa tctccggaaa accctcctgg tccatcaggc atcagaaggc 1080
cttttcgata atgataccgg cgctctgctc tccctgggca gggaaatgtt ccgcctcgaa 1140
attctggagg atattgcccg ggataaagtc agaactctcc attttgtgga tgagatagaa 1200
gtctacctgg ccttccagac catgctcgca gagaaacttc agctctccac tgccgtgaag 1260
gaaatgcgtt tctatggcgt gtcgggagtg acagcaaatg acctccgcac tgccgaagcc 1320
atggtcagaa gccgtgaaga gaatgaattt acggactggt tctccctctg gggaccatgg 1380
catgctgtac tgaagcgtac ggaagctgac cgctgggcgc aggcagaaga gcagaaatat 1440
gagatgctgg agaatgagta ccctcagagg gtggctgacc ggctgaaagc atcaggtctg 1500
agcggtgatg cggatgcgga gagggaagcc ggtgcacagg tgatgcgtga gactgaacag 1560
cagatttacc gtcagctgac tgacgaggta ctggccctgc gattgtctga aaacggctca 1620
caactgcacc attcataa 1638
<210> 15
<211> 172
<212> PRT
<213> Artificial
<220>
<223> LegAU13 F-box motif from Legionella pneumophila
<400> 15
Met Lys Lys Asn Phe Phe Ser Asp Leu Pro Glu Glu Thr Ile Val Asn
1 5 10 15
Thr Leu Ser Phe Leu Lys Ala Asn Thr Leu Ala Arg Ile Ala Gln Thr
20 25 30
Cys Gln Phe Phe Asn Arg Leu Ala Asn Asp Lys His Leu Glu Leu His
35 40 45
Gln Leu Arg Gln Gln His Ile Lys Arg Glu Leu Trp Gly Asn Leu Met
50 55 60
Val Ala Ala Arg Ser Asn Asn Leu Glu Glu Val Lys Lys Ile Leu Lys
65 70 75 80
Lys Gly Ile Asp Pro Thr Gln Thr Asn Ser Tyr His Leu Asn Arg Thr
85 90 95
Pro Leu Leu Ala Ala Ile Glu Gly Lys Ala Tyr Gln Thr Ala Asn Tyr
100 105 110
Leu Trp Arg Lys Tyr Thr Phe Asp Pro Asn Phe Lys Asp Asn Tyr Gly
115 120 125
Asp Ser Pro Ile Ser Leu Leu Lys Lys Gln Leu Ala Asn Pro Ala Phe
130 135 140
Lys Asp Lys Glu Lys Lys Gln Ile Arg Ala Leu Ile Arg Gly Met Gln
145 150 155 160
Glu Glu Lys Ile Ala Gln Ser Lys Cys Leu Val Cys
165 170
<210> 16
<211> 519
<212> DNA
<213> Artificial
<220>
<223> LegAU13 F-box motif from Legionella pneumophila
<400> 16
atgaaaaaga attttttttc tgatcttcct gaggaaacaa ttgtcaatac attgagtttc 60
ttaaaagcaa acacactagc tcgtatagct cagacatgtc aattttttaa tcgcttggct 120
aatgataaac atctggagct gcatcaacta agacaacagc atataaagcg agagctatgg 180
ggaaatctta tggtggcggc aagaagcaat aacctggaag aggtcaaaaa gattctaaaa 240
aaaggaatcg atccaaccca gaccaatagc taccacttaa atagaacgcc tttacttgca 300
gctatcgaag gaaaagcata tcaaactgca aattacctct ggagaaaata cactttcgat 360
cccaatttta aagataacta tggtgattca cctatctctc ttcttaaaaa gcaactggca 420
aatccagcct tcaaggataa ggaaaaaaaa caaatacgcg ccttaattag gggaatgcaa 480
gaagaaaaaa tagcacagag caagtgcctt gtttgttaa 519
<210> 17
<211> 188
<212> PRT
<213> Artificial
<220>
<223> LegU1 F-box motif from Legionella pneumophila
<400> 17
Met Lys Ala Lys Tyr Asp Pro Thr Lys Pro Gly Leu Gln Lys Leu Pro
1 5 10 15
Pro Glu Ile Lys Val Met Ile Leu Glu Phe Leu Asp Ala Lys Ser Lys
20 25 30
Leu Ala Leu Ser Gln Thr Asn Tyr Gly Trp Arg Asp Leu Ile Leu Asp
35 40 45
Arg Pro Glu Tyr Thr Lys Glu Ile Thr Asn Thr Leu Phe Arg Leu Asp
50 55 60
Lys Lys Arg His Arg Gln Ala Ile Ala Gln Met Met Ser Gly Arg Val
65 70 75 80
Thr Ala Ser Ser Met Ala Lys Leu Phe Glu Glu Leu Leu Cys Phe Ser
85 90 95
Ile Pro Ser Ser Tyr Val Phe Leu Ile Phe Phe Ala Ser Gln Lys Ser
100 105 110
Val Ala Leu Ile Glu Val Leu Thr Val Ile Leu Val Phe Ala Ala Ile
115 120 125
Thr Ser Leu Ala His Asp Leu Val Asp Tyr Phe Ile Glu Ser Asp Thr
130 135 140
Lys Ala Glu Lys Gln His Ala His Arg Arg Ala Phe Gln Phe Phe Ala
145 150 155 160
Gln Pro Ser Gln Ser Ala Ala Gln Gln Asn Leu Glu Glu Glu Asn Leu
165 170 175
Ser Ala Asp Pro Lys Ala Cys Gln Cys Glu Pro Leu
180 185
<210> 18
<211> 567
<212> DNA
<213> Artificial
<220>
<223> LegU1 F-box motif from Legionella pneumophila
<400> 18
atgaaagcaa aatacgaccc cacaaagcct ggactccaaa agttacctcc tgaaatcaag 60
gtaatgattc ttgagtttct tgatgccaaa tcaaaactag ctctttcaca gacaaattat 120
ggttggcgtg atttaattct agaccggcca gaatatacca aagaaataac gaatacatta 180
tttcgtcttg ataaaaaacg ccatcgtcaa gcaatagcac aaatgatgtc aggaagagtt 240
acagcaagtt ctatggctaa gctatttgaa gaattactat gttttagcat accttcgtcc 300
tatgtgtttt taatcttttt cgcatcgcaa aaatctgtgg cgcttataga agtcttaacc 360
gtaatccttg tgtttgctgc aataacctct ctcgcccatg atctggtgga ttattttatt 420
gaaagtgata caaaagctga gaaacagcat gcacatcgcc gtgcttttca attctttgcc 480
caacccagtc aaagcgctgc acaacaaaac ttggaggaag agaatttaag tgctgatccc 540
aaggcctgcc aatgtgagcc attgtag 567
<210> 19
<211> 240
<212> PRT
<213> Artificial
<220>
<223> LubX U-box motif from Legionella pneumophila
<400> 19
Met Ala Thr Arg Asn Pro Phe Asp Ile Asp His Lys Ser Lys Tyr Leu
1 5 10 15
Arg Glu Ala Ala Leu Glu Ala Asn Leu Ser His Pro Glu Thr Thr Pro
20 25 30
Thr Met Leu Thr Cys Pro Ile Asp Ser Gly Phe Leu Lys Asp Pro Val
35 40 45
Ile Thr Pro Glu Gly Phe Val Tyr Asn Lys Ser Ser Ile Leu Lys Trp
50 55 60
Leu Glu Thr Lys Lys Glu Asp Pro Gln Ser Arg Lys Pro Leu Thr Ala
65 70 75 80
Lys Asp Leu Gln Pro Phe Pro Glu Leu Leu Ile Ile Val Asn Arg Phe
85 90 95
Val Glu Thr Gln Thr Asn Tyr Glu Lys Leu Lys Asn Arg Leu Val Gln
100 105 110
Asn Ala Arg Val Ala Ala Arg Gln Lys Glu Tyr Thr Glu Ile Pro Asp
115 120 125
Ile Phe Leu Cys Pro Ile Ser Lys Thr Leu Ile Lys Thr Pro Val Ile
130 135 140
Thr Ala Gln Gly Lys Val Tyr Asp Gln Glu Ala Leu Ser Asn Phe Leu
145 150 155 160
Ile Ala Thr Gly Asn Lys Asp Glu Thr Gly Lys Lys Leu Ser Ile Asp
165 170 175
Asp Val Val Val Phe Asp Glu Leu Tyr Gln Gln Ile Lys Val Tyr Asn
180 185 190
Phe Tyr Arg Lys Arg Glu Val Gln Lys Asn Gln Ile Gln Pro Ser Val
195 200 205
Ser Asn Gly Phe Gly Phe Phe Ser Leu Asn Phe Leu Thr Ser Trp Leu
210 215 220
Trp Gly Thr Glu Glu Lys Lys Glu Lys Thr Ser Ser Asp Met Thr Tyr
225 230 235 240
<210> 20
<211> 723
<212> DNA
<213> Artificial
<220>
<223> LubX U-box motif from Legionella pneumophila
<400> 20
atggcgacgc gaaatccttt tgatattgat cataaaagta aatacttaag agaagcagca 60
ttagaagcca atttatctca tccagaaaca acaccaacaa tgctgacttg ccctattgac 120
agcggatttc taaaagatcc cgtgatcaca cctgaaggtt ttgtttataa taaatcctct 180
attttaaaat ggttagaaac gaaaaaagaa gacccacaaa gccgtaaacc cttaacggct 240
aaagatttgc aaccattccc cgagttattg attatagtca atagatttgt tgagacacaa 300
acgaactatg aaaaattaaa aaacagatta gtgcaaaatg ctcgggttgc tgcacgccaa 360
aaagaataca ctgaaattcc ggatatattt ctttgcccaa taagtaaaac gcttatcaaa 420
acacctgtca ttactgccca agggaaagta tatgatcaag aagcattaag taactttctt 480
atcgcaacgg gtaataaaga tgaaacaggc aaaaaattat ccattgatga tgtagtggtg 540
tttgatgaac tctatcaaca gataaaagtt tataattttt accgcaaacg cgaagtgcaa 600
aaaaatcaaa ttcaaccttc agtaagtaat ggttttggct tttttagctt gaattttctc 660
acctcatggt tatggggaac tgaggagaaa aaagaaaaga catcatctga tatgacgtac 720
taa 723
<210> 21
<211> 191
<212> PRT
<213> Artificial
<220>
<223> NleG2-3 U-box motif from Enterohemorrhagic Escherichia coli
(EHEC) O157:H7
<400> 21
Met Pro Leu Thr Ser Asp Ile Arg Ser His Ser Phe Asn Leu Gly Val
1 5 10 15
Glu Val Val Arg Ala Arg Ile Val Ala Asn Gly Arg Gly Asp Ile Thr
20 25 30
Val Gly Gly Glu Thr Val Ser Ile Val Tyr Asp Ser Thr Asn Gly Arg
35 40 45
Phe Ser Ser Ser Gly Gly Asn Gly Gly Leu Leu Ser Glu Leu Leu Leu
50 55 60
Leu Gly Phe Asn Ser Gly Pro Arg Ala Leu Gly Glu Arg Met Leu Ser
65 70 75 80
Met Leu Ser Asp Ser Gly Glu Ala Gln Ser Gln Glu Ser Ile Gln Asn
85 90 95
Lys Ile Ser Gln Cys Lys Phe Ser Val Cys Pro Glu Arg Leu Gln Cys
100 105 110
Pro Leu Glu Ala Ile Gln Cys Pro Ile Thr Leu Glu Gln Pro Glu Lys
115 120 125
Gly Ile Phe Val Lys Asn Ser Asp Gly Ser Asp Val Cys Thr Leu Phe
130 135 140
Asp Ala Ala Ala Phe Ser Arg Leu Val Gly Glu Gly Leu Pro His Pro
145 150 155 160
Leu Thr Arg Glu Pro Ile Thr Ala Ser Ile Ile Val Lys His Glu Glu
165 170 175
Cys Ile Tyr Asp Asp Thr Arg Gly Asn Phe Ile Ile Lys Gly Asn
180 185 190
<210> 22
<211> 576
<212> DNA
<213> Artificial
<220>
<223> NleG2-3 U-box motif from Enterohemorrhagic Escherichia coli
(EHEC) O157:H7
<400> 22
atgccattaa cctcagatat tagatcacat tcatttaatc ttggggtgga ggttgttcgt 60
gcccgaattg tagccaatgg gcgcggagat attacagtcg gtggtgaaac tgtcagtatt 120
gtgtatgatt ctactaatgg gcgcttttca tccagtggcg gtaatggcgg attgctttct 180
gagttattgc ttttgggatt taatagtggt cctcgagccc ttggtgagag aatgctaagt 240
atgctttcgg actcaggtga agcacaatcg caagagagta ttcagaacaa aatatctcaa 300
tgtaagtttt ctgtttgtcc agagagactt cagtgcccgc ttgaggctat tcagtgtcca 360
attacactgg agcagcctga aaaaggtatt tttgtgaaga attcagatgg ttcagatgta 420
tgtactttat ttgatgccgc tgcattttct cgtttggttg gtgaaggctt accccaccca 480
ctgacccggg aaccaataac ggcatcaata attgtaaaac atgaagaatg catttatgac 540
gataccagag gaaacttcat tataaagggt aattga 576
<210> 23
<211> 213
<212> PRT
<213> Artificial
<220>
<223> NleG5-1 U-box motif from Enterohemorrhagic Escherichia coli
(EHEC) O157:H7
<400> 23
Met Pro Val Asp Leu Thr Pro Tyr Ile Leu Pro Gly Val Ser Phe Leu
1 5 10 15
Ser Asp Ile Pro Gln Glu Thr Leu Ser Glu Ile Arg Asn Gln Thr Ile
20 25 30
Arg Gly Glu Ala Gln Ile Arg Leu Gly Glu Leu Met Val Ser Ile Arg
35 40 45
Pro Met Gln Val Asn Gly Tyr Phe Met Gly Ser Leu Asn Gln Asp Gly
50 55 60
Leu Ser Asn Asp Asn Ile Gln Ile Gly Leu Gln Tyr Ile Glu His Ile
65 70 75 80
Glu Arg Thr Leu Asn His Gly Ser Leu Thr Ser Arg Glu Val Thr Val
85 90 95
Leu Arg Glu Ile Glu Met Leu Glu Asn Met Asp Leu Leu Ser Asn Tyr
100 105 110
Gln Leu Glu Glu Leu Leu Asp Lys Ile Glu Val Cys Ala Phe Asn Val
115 120 125
Glu His Ala Gln Leu Gln Val Pro Glu Ser Leu Arg Thr Cys Pro Val
130 135 140
Thr Leu Cys Glu Pro Glu Asp Gly Val Phe Met Arg Asn Ser Met Asn
145 150 155 160
Ser Asn Val Cys Met Leu Tyr Asp Lys Met Ala Leu Ile His Leu Val
165 170 175
Lys Thr Arg Ala Ala His Pro Leu Ser Arg Glu Ser Ile Ala Val Ser
180 185 190
Met Ile Val Gly Arg Asp Asn Cys Ala Phe Asp Pro Asp Arg Gly Asn
195 200 205
Phe Val Leu Lys Asn
210
<210> 24
<211> 642
<212> DNA
<213> Artificial
<220>
<223> NleG5-1 U-box motif from Enterohemorrhagic Escherichia coli
(EHEC) O157:H7
<400> 24
atgcctgtag atttaacgcc ttatatttta cctggggtta gttttttgtc tgacattcct 60
caagaaacct tgtctgagat acgtaatcag actattcgtg gagaagctca aataagactg 120
ggtgagttga tggtgtcaat acgacctatg caggtaaatg gatattttat gggaagtctt 180
aaccaggatg gtttatcgaa tgataatatc cagattggcc ttcaatatat agaacatatt 240
gaacgtacac ttaatcatgg tagtttgaca agccgtgaag ttacagtact gcgtgaaatt 300
gagatgctcg aaaatatgga tttgctttct aactaccagt tagaggagtt gttagataaa 360
attgaagtat gtgcatttaa tgtggagcat gcacaattgc aagtgccaga gagcttacga 420
acatgccctg ttacattatg tgaaccagaa gatggggtat ttatgaggaa ttcaatgaat 480
tcaaatgttt gtatgttgta tgataaaatg gcattaatac atcttgttaa aacaagggcg 540
gctcatcctt tgagcaggga atcaatcgca gtttcaatga ttgtaggaag agataattgt 600
gcttttgacc ctgacagagg taacttcgtt ttaaaaaatt aa 642
<210> 25
<211> 782
<212> PRT
<213> Artificial
<220>
<223> NleL HECT motif from Enterohemorrhagic Escherichia coli (EHEC)
O157:H7
<400> 25
Met Leu Pro Thr Thr Asn Ile Ser Val Asn Ser Gly Val Ile Ser Phe
1 5 10 15
Glu Ser Pro Val Asp Ser Pro Ser Asn Glu Asp Val Glu Val Ala Leu
20 25 30
Glu Lys Trp Cys Ala Glu Gly Glu Phe Ser Glu Asn Arg His Glu Val
35 40 45
Ala Ser Lys Ile Leu Asp Val Ile Ser Thr Asn Gly Glu Thr Leu Ser
50 55 60
Ile Ser Glu Pro Ile Thr Thr Leu Pro Asp Leu Leu Pro Gly Ser Leu
65 70 75 80
Lys Glu Leu Val Leu Asn Gly Cys Thr Glu Leu Lys Ser Ile Asn Cys
85 90 95
Leu Pro Pro Asn Leu Ser Ser Leu Ser Met Val Gly Cys Ser Ser Leu
100 105 110
Glu Val Ile Asn Cys Ser Ile Pro Glu Asn Val Ile Asn Leu Ser Leu
115 120 125
Cys His Cys Ser Ser Leu Lys His Ile Glu Gly Ser Phe Pro Glu Ala
130 135 140
Leu Arg Asn Ser Val Tyr Leu Asn Gly Cys Asn Ser Leu Asn Glu Ser
145 150 155 160
Gln Cys Gln Phe Leu Ala Tyr Asp Val Ser Gln Gly Arg Ala Cys Leu
165 170 175
Ser Lys Ala Glu Leu Thr Ala Asp Leu Ile Trp Leu Ser Ala Asn Arg
180 185 190
Thr Gly Glu Glu Ser Ala Glu Glu Leu Asn Tyr Ser Gly Cys Asp Leu
195 200 205
Ser Gly Leu Ser Leu Val Gly Leu Asn Leu Ser Ser Val Asn Phe Ser
210 215 220
Gly Ala Val Leu Asp Asp Thr Asp Leu Arg Met Ser Asp Leu Ser Gln
225 230 235 240
Ala Val Leu Glu Asn Cys Ser Phe Lys Asn Ser Ile Leu Asn Glu Cys
245 250 255
Asn Phe Cys Tyr Ala Asn Leu Ser Asn Cys Ile Ile Arg Ala Leu Phe
260 265 270
Glu Asn Ser Asn Phe Ser Asn Ser Asn Leu Lys Asn Ala Ser Phe Lys
275 280 285
Gly Ser Ser Tyr Ile Gln Tyr Pro Pro Ile Leu Asn Glu Ala Asp Leu
290 295 300
Thr Gly Ala Ile Ile Ile Pro Gly Met Val Leu Ser Gly Ala Ile Leu
305 310 315 320
Gly Asp Val Lys Glu Leu Phe Ser Glu Lys Ser Asn Thr Ile Asn Leu
325 330 335
Gly Gly Cys Tyr Ile Asp Leu Ser Asp Ile Gln Glu Asn Ile Leu Ser
340 345 350
Val Leu Asp Asn Tyr Thr Lys Ser Asn Lys Ser Ile Leu Leu Thr Met
355 360 365
Asn Thr Ser Asp Asp Lys Tyr Asn His Asp Lys Val Arg Ala Ala Glu
370 375 380
Glu Leu Ile Lys Lys Ile Ser Leu Asp Glu Leu Ala Ala Phe Arg Pro
385 390 395 400
Tyr Val Lys Met Ser Leu Ala Asp Ser Phe Ser Ile His Pro Tyr Leu
405 410 415
Asn Asn Ala Asn Ile Gln Gln Trp Leu Glu Pro Ile Cys Asp Asp Phe
420 425 430
Phe Asp Thr Ile Met Ser Trp Phe Asn Asn Ser Ile Met Met Tyr Met
435 440 445
Glu Asn Gly Ser Leu Leu Gln Ala Gly Met Tyr Phe Glu Arg His Pro
450 455 460
Gly Ala Met Val Ser Tyr Asn Ser Ser Phe Ile Gln Ile Val Met Asn
465 470 475 480
Gly Ser Arg Arg Asp Gly Met Gln Glu Arg Phe Arg Glu Leu Tyr Glu
485 490 495
Val Tyr Leu Lys Asn Glu Lys Val Tyr Pro Val Thr Gln Gln Ser Asp
500 505 510
Phe Gly Leu Cys Asp Gly Ser Gly Lys Pro Asp Trp Asp Asp Asp Ser
515 520 525
Asp Leu Ala Tyr Asn Trp Val Leu Leu Ser Ser Gln Asp Asp Gly Met
530 535 540
Ala Met Met Cys Ser Leu Ser His Met Val Asp Met Leu Ser Pro Asn
545 550 555 560
Thr Ser Thr Asn Trp Met Ser Phe Phe Leu Tyr Lys Asp Gly Glu Val
565 570 575
Gln Asn Thr Phe Gly Tyr Ser Leu Ser Asn Leu Phe Ser Glu Ser Phe
580 585 590
Pro Ile Phe Ser Ile Pro Tyr His Lys Ala Phe Ser Gln Asn Phe Val
595 600 605
Ser Gly Ile Leu Asp Ile Leu Ile Ser Asp Asn Glu Leu Lys Glu Arg
610 615 620
Phe Ile Glu Ala Leu Asn Ser Asn Lys Ser Asp Tyr Lys Met Ile Ala
625 630 635 640
Asp Asp Gln Gln Arg Lys Leu Ala Cys Val Trp Asn Pro Phe Leu Asp
645 650 655
Gly Trp Glu Leu Asn Ala Gln His Val Asp Met Ile Met Gly Ser His
660 665 670
Val Leu Lys Asp Met Pro Leu Arg Lys Gln Ala Glu Ile Leu Phe Cys
675 680 685
Leu Gly Gly Val Phe Cys Lys Tyr Ser Ser Ser Asp Met Phe Gly Thr
690 695 700
Glu Tyr Asp Ser Pro Glu Ile Leu Arg Arg Tyr Ala Asn Gly Leu Ile
705 710 715 720
Glu Gln Ala Tyr Lys Thr Asp Pro Gln Val Phe Gly Ser Val Tyr Tyr
725 730 735
Tyr Asn Asp Ile Leu Asp Arg Leu Gln Gly Arg Asn Asn Val Phe Thr
740 745 750
Cys Thr Ala Val Leu Thr Asp Met Leu Thr Glu His Ala Lys Glu Ser
755 760 765
Phe Pro Glu Ile Phe Ser Leu Tyr Tyr Pro Val Ala Trp Arg
770 775 780
<210> 26
<211> 2349
<212> DNA
<213> Artificial
<220>
<223> NleL HECT motif from Enterohemorrhagic Escherichia coli (EHEC)
O157:H7
<400> 26
atgctgccca ctacaaatat ctctgtaaat tctggagtaa tatcttttga aagtcctgta 60
gattcaccat ctaacgagga tgttgaagtt gccctcgaaa agtggtgtgc tgagggagaa 120
tttagcgaaa atcgtcatga ggttgcatca aaaatacttg atgttataag tactaatgga 180
gagactttat caatcagtga gccaataaca acattaccag acttgcttcc aggttctctg 240
aaagaactgg ttttgaatgg atgtacagag cttaaatcaa taaactgctt accccccaac 300
ttatcttcat taagtatggt tggatgctca tcattagagg ttataaattg cagcatacct 360
gaaaatgtca ttaatttatc tttatgccat tgtagttctt tgaaacatat agaaggttcc 420
tttcctgagg cactcagaaa ttccgtatat ttaaatggct gtaattcatt aaatgaatcg 480
caatgtcaat tccttgcata tgatgtcagt caaggccgtg cctgcctgag caaagctgag 540
cttactgctg acttaatttg gttgtcagct aaccgaacgg gtgaagagtc tgctgaagaa 600
ttgaattact ctggatgtga cttgtcaggt ctaagtcttg tagggctgaa tttatcatca 660
gtaaattttt ctggagcagt gcttgatgat acagatctca ggatgagtga tttgtctcag 720
gctgtattgg aaaactgttc ttttaaaaac tcgattttga atgaatgtaa tttttgttat 780
gctaatttat ctaattgtat tattagggct ttgtttgaaa actctaattt cagcaattcc 840
aatcttaaaa atgcatcatt taaaggatct tcatatatac aatatcctcc aattttgaac 900
gaggctgatt taacaggagc tattataatt cctggaatgg ttttaagtgg tgctatctta 960
ggtgatgtaa aggagctctt tagtgaaaaa agtaatacca ttaatctagg agggtgttac 1020
atagatctat ctgacataca ggaaaatata ttatctgtgt tggataacta tacaaaatca 1080
aataaatcaa ttttattgac tatgaataca tctgatgata agtataacca tgataaagta 1140
agggccgctg aagaacttat caaaaaaata tctcttgacg aattagcggc gttccggccc 1200
tatgttaaga tgtctttggc tgattcattt agtattcatc cttatttgaa caacgcaaat 1260
atacagcaat ggctcgagcc tatatgtgat gacttttttg atactataat gtcttggttt 1320
aataattcaa taatgatgta tatggagaat ggtagtttat tgcaggcagg gatgtatttt 1380
gagcgacatc caggtgcgat ggtatcttat aatagttcct ttatacaaat tgtaatgaat 1440
ggttcacggc gtgatggaat gcaggaacga tttagggaac tctatgaagt atatttaaaa 1500
aatgaaaaag tttatcctgt cacacagcag agtgattttg gattgtgcga tggctctggg 1560
aagcctgact gggatgatga ttccgatttg gcttataact gggttttgtt atcatcacag 1620
gatgatggta tggcaatgat gtgttctttg agtcatatgg ttgatatgtt atctcctaat 1680
acatcaacta attggatgtc ctttttttta tataaggatg gagaagttca aaatacattt 1740
gggtattcat tgagcaatct tttttctgaa tcatttccaa ttttcagtat tccttatcat 1800
aaagcttttt cccagaattt cgtttctggt attctggata tactcatttc tgataatgaa 1860
ctcaaagaga gatttattga ggcacttaat tccaataaat cagattataa aatgattgct 1920
gatgatcagc aaaggaaact tgcctgtgtc tggaatccct ttcttgatgg ttgggaactg 1980
aacgctcagc atgtagatat gattatgggg agccatgtat tgaaagatat gccactaaga 2040
aaacaggctg aaatattatt ttgtttaggg ggggttttct gtaaatactc atcgagtgat 2100
atgtttggta cagagtatga ttctcctgag attctacgga gatatgcaaa tggattgatt 2160
gaacaagctt ataaaacaga tcctcaggta tttggctcag tttattatta caatgatatt 2220
ttagacaggc tacaaggaag aaataatgtt tttacttgta ccgctgtgct gactgatatg 2280
ctaacggagc atgcaaaaga atcttttcct gaaatatttt cattgtatta tcctgttgcg 2340
tggcgttga 2349
<210> 27
<211> 917
<212> PRT
<213> Artificial
<220>
<223> SidC unconventional motif from Legionella pneumophila
<400> 27
Met Val Ile Asn Met Val Asp Val Ile Lys Phe Lys Glu Pro Glu Arg
1 5 10 15
Cys Asp Tyr Leu Tyr Val Asp Glu Asn Asn Lys Val His Ile Leu Leu
20 25 30
Pro Ile Val Gly Gly Asp Glu Ile Gly Leu Asp Asn Thr Cys Gln Thr
35 40 45
Ala Val Glu Leu Ile Thr Phe Phe Tyr Gly Ser Ala His Ser Gly Val
50 55 60
Thr Lys Tyr Ser Ala Glu His Gln Leu Ser Glu Tyr Lys Arg Gln Leu
65 70 75 80
Glu Glu Asp Ile Lys Ala Ile Asn Ser Gln Lys Lys Ile Ser Pro His
85 90 95
Ala Tyr Asp Asp Leu Leu Lys Glu Lys Ile Glu Arg Leu Gln Gln Ile
100 105 110
Glu Lys Tyr Ile Glu Leu Ile Gln Val Leu Lys Lys Gln Tyr Asp Glu
115 120 125
Gln Asn Asp Ile Arg Gln Leu Arg Thr Gly Gly Ile Pro Gln Leu Pro
130 135 140
Ser Gly Val Lys Glu Ile Ile Lys Ser Ser Glu Asn Ala Phe Ala Val
145 150 155 160
Arg Leu Ser Pro Tyr Asp Asn Asp Lys Phe Thr Arg Phe Asp Asp Pro
165 170 175
Leu Phe Asn Val Lys Arg Asn Ile Ser Lys Tyr Asp Thr Pro Ser Arg
180 185 190
Gln Ala Pro Ile Pro Ile Tyr Glu Gly Leu Gly Tyr Arg Leu Arg Ser
195 200 205
Thr Leu Phe Pro Glu Asp Lys Thr Pro Thr Pro Ile Asn Lys Lys Ser
210 215 220
Leu Arg Asp Lys Val Lys Ser Thr Val Leu Ser His Tyr Lys Asp Glu
225 230 235 240
Asp Arg Ile Asp Gly Glu Lys Lys Asp Glu Lys Leu Asn Glu Leu Ile
245 250 255
Thr Asn Leu Gln Asn Glu Leu Val Lys Glu Leu Val Lys Ser Asp Pro
260 265 270
Gln Tyr Ser Lys Leu Ser Leu Ser Lys Asp Pro Arg Gly Lys Glu Ile
275 280 285
Asn Tyr Asp Tyr Leu Val Asn Ser Leu Met Leu Val Asp Asn Asp Ser
290 295 300
Glu Ile Gly Asp Trp Ile Asp Thr Ile Leu Asp Ala Thr Val Asp Ser
305 310 315 320
Thr Val Trp Val Ala Gln Ala Ser Ser Pro Phe Tyr Asp Gly Ala Lys
325 330 335
Glu Ile Ser Ser Asp Arg Asp Ala Asp Lys Ile Ser Ile Arg Val Gln
340 345 350
Tyr Leu Leu Ala Glu Ala Asn Ile Tyr Cys Lys Thr Asn Lys Leu Ser
355 360 365
Asp Ala Asn Phe Gly Glu Phe Phe Asp Lys Glu Pro His Ala Thr Glu
370 375 380
Ile Ala Lys Arg Val Lys Glu Gly Phe Thr Gln Gly Ala Asp Ile Glu
385 390 395 400
Pro Ile Ile Tyr Asp Tyr Ile Asn Ser Asn His Ala Glu Leu Gly Leu
405 410 415
Lys Ser Pro Leu Thr Gly Lys Gln Gln Gln Glu Ile Thr Asp Lys Phe
420 425 430
Thr Lys His Tyr Asn Thr Ile Lys Glu Ser Pro His Phe Asp Glu Phe
435 440 445
Phe Val Ala Asp Pro Asp Lys Lys Gly Asn Ile Phe Ser His Gln Gly
450 455 460
Arg Ile Ser Cys His Phe Leu Asp Phe Phe Thr Arg Gln Thr Lys Gly
465 470 475 480
Lys His Pro Leu Gly Asp Leu Ala Ser His Gln Glu Ala Leu Gln Glu
485 490 495
Gly Thr Ser Asn Arg Leu His His Lys Asn Glu Val Val Ala Gln Gly
500 505 510
Tyr Glu Lys Leu Asp Gln Phe Lys Lys Glu Val Val Lys Leu Leu Ala
515 520 525
Glu Asn Lys Pro Lys Glu Leu Leu Asp Tyr Leu Val Ala Thr Ser Pro
530 535 540
Thr Gly Val Pro Asn Tyr Ser Met Leu Ser Lys Glu Thr Gln Asn Tyr
545 550 555 560
Ile Ala Tyr Asn Arg Asn Trp Pro Ala Ile Gln Lys Glu Leu Glu Lys
565 570 575
Ala Thr Ser Ile Pro Glu Ser Gln Lys Gln Asp Leu Ser Arg Leu Leu
580 585 590
Ser Arg Asp Asn Leu Gln His Asp Asn Leu Ser Ala Ile Thr Trp Ser
595 600 605
Lys Tyr Ser Ser Lys Pro Leu Leu Asp Val Glu Leu Asn Lys Ile Ala
610 615 620
Glu Gly Leu Glu Leu Thr Ala Lys Ile Tyr Asn Glu Lys Arg Gly Arg
625 630 635 640
Glu Trp Trp Phe Lys Gly Ser Arg Asn Glu Ala Arg Lys Thr Gln Cys
645 650 655
Glu Glu Leu Gln Arg Val Ser Lys Glu Ile Asn Thr Leu Leu Gln Ser
660 665 670
Glu Ser Leu Thr Lys Ser Gln Val Leu Glu Lys Val Leu Asn Ser Ile
675 680 685
Glu Thr Leu Asp Lys Ile Asp Arg Asp Ile Ser Ala Glu Ser Asn Trp
690 695 700
Phe Gln Ser Thr Leu Gln Lys Glu Val Arg Leu Phe Arg Asp Gln Leu
705 710 715 720
Lys Asp Ile Cys Gln Leu Asp Lys Tyr Ala Phe Lys Ser Thr Lys Leu
725 730 735
Asp Glu Ile Ile Ser Leu Glu Met Glu Glu Gln Phe Gln Lys Ile Gln
740 745 750
Asp Pro Ala Val Gln Gln Ile Val Arg Asp Leu Pro Ser His Cys His
755 760 765
Asn Asp Glu Ala Ile Glu Phe Phe Lys Thr Leu Asn Pro Glu Glu Ala
770 775 780
Ala Lys Val Ala Ser Tyr Leu Ser Leu Glu Tyr Arg Glu Ile Asn Lys
785 790 795 800
Ser Thr Asp Lys Lys Thr Leu Leu Glu Gln Asp Ile Pro Arg Leu Phe
805 810 815
Lys Glu Val Asn Thr Gln Leu Leu Ser Lys Leu Lys Glu Glu Lys Ala
820 825 830
Ile Asp Glu Gln Val His Glu Lys Leu Ser Gln Leu Ala Asp Lys Ile
835 840 845
Ala Pro Glu His Phe Thr Arg Asn Asn Ile Ile Lys Trp Ser Thr Asn
850 855 860
Pro Glu Lys Leu Glu Glu Ser Asn Leu Asn Glu Pro Ile Lys Ser Val
865 870 875 880
Gln Ser Pro Thr Thr Lys Gln Thr Ser Lys Gln Phe Arg Glu Ala Met
885 890 895
Gly Glu Ile Thr Gly Arg Asn Glu Pro Pro Thr Asp Thr Leu Tyr Thr
900 905 910
Gly Ile Ile Lys Lys
915
<210> 28
<211> 2754
<212> DNA
<213> Artificial
<220>
<223> SidC unconventional motif from Legionella pneumophila
<400> 28
atggtgataa acatggttga cgtaatcaaa ttcaaagagc cggaacgttg tgattatcta 60
tatgttgatg aaaacaacaa agttcatatc cttttaccga ttgtaggagg agatgaaata 120
ggcctggata atacctgtca aacagcagtt gagttgatca catttttcta tggtagtgcg 180
cacagtggtg tgactaaata ttctgctgaa caccaactca gtgaatacaa aaggcaattg 240
gaagaagaca tcaaagccat caatagtcaa aagaaaattt cacctcatgc ttatgacgat 300
ttattaaaag agaaaataga acgcttacag caaattgaaa aatacattga attaattcaa 360
gtactaaaaa aacaatatga tgaacaaaat gatatcaggc aacttcgtac tggagggatt 420
ccgcaattac cctctggggt aaaggaaatc attaaatcct ctgaaaatgc tttcgctgtg 480
agactttctc catatgacaa cgataaattc actcgctttg atgacccttt attcaatgtc 540
aaaagaaaca tctcaaaata tgacacgccc tcaagacaag ctcctattcc aatatacgag 600
ggattaggtt atcgcctgcg ttcaacactg ttcccggaag ataaaacacc aactccaatt 660
aataaaaaat cacttaggga taaagttaaa agcactgttc ttagtcatta taaagatgaa 720
gatagaattg atggagaaaa aaaagatgaa aaattaaacg aactaattac taatcttcaa 780
aacgaacttg taaaagagtt agtaaaaagt gatcctcaat attcgaaact atctttatct 840
aaagatccaa gaggaaaaga aataaattac gattatttag taaatagttt gatgcttgta 900
gataacgact ctgaaattgg tgattggatt gatactattc tcgacgctac agtagattcc 960
actgtctggg tagctcaggc atccagccct ttctatgatg gtgctaaaga aatatcatca 1020
gaccgcgatg cggacaagat atccatcaga gttcagtacc tgttggccga agccaatatt 1080
tactgtaaaa caaacaaatt atcggatgct aactttggag aatttttcga caaagagcct 1140
catgctactg aaattgcgaa aagagtaaag gaaggattta cgcaaggtgc agatatagaa 1200
ccaattatat acgactatat taacagcaac catgccgagc tgggattaaa atctccgtta 1260
accggcaaac aacaacaaga aatcactgat aaatttacaa aacattataa tacgattaaa 1320
gaatctccac attttgatga gttttttgtc gctgatccgg ataaaaaagg caatatcttt 1380
tctcatcaag gcagaatcag ttgtcatttt ctggatttct ttactcgaca aaccaaaggc 1440
aaacatcctc ttggtgatct tgcaagtcat caggaagctc tccaggaagg aacctccaat 1500
cgcttacatc acaagaatga ggtagtagcc caggggtacg aaaaactgga tcaattcaag 1560
aaagaggttg tcaaactgct ggctgagaat aaaccaaaag aattattgga ttatttggtt 1620
gctacctcac ctacaggtgt tccaaattac tccatgcttt cgaaggaaac tcaaaattac 1680
attgcttata atcgtaactg gccagccatt caaaaagagc tggaaaaggc taccagcatc 1740
ccggagagtc aaaaacaaga tctttcaaga ttgctttctc gtgataattt acaacacgat 1800
aatctaagcg caattacctg gtcaaaatat tcctccaagc cattattgga tgtggaatta 1860
aataaaatcg ctgaaggatt agaactcact gcaaaaattt acaatgaaaa gagaggacgc 1920
gaatggtggt ttaaaggttc aagaaatgaa gctcgtaaga cccaatgtga agaattgcaa 1980
agagtatcca aagaaatcaa tactcttctg caaagtgaat ctttaacgaa aagccaggta 2040
cttgaaaagg ttttaaattc tatagaaaca ttagataaaa ttgacagaga catttctgcc 2100
gaatccaatt ggtttcaaag tactctgcaa aaggaagtca ggttatttcg agatcaattg 2160
aaagatattt gccaattgga caagtatgcc tttaaatcaa caaaacttga tgaaatcatc 2220
tctctggaaa tggaagaaca atttcaaaag atacaagatc ctgctgttca acaaattgtc 2280
agggacttgc cttctcattg ccacaatgat gaagcaattg aattctttaa gacattgaac 2340
cctgaagagg cagcaaaagt agctagctat ttaagcctgg aatacaggga aattaataaa 2400
tcaaccgata agaaaactct cctagaacaa gatattccca gactgtttaa agaagtcaat 2460
acgcagttac tctccaaact caaagaagaa aaagctattg atgagcaagt tcatgaaaaa 2520
ctcagtcaac tggctgacaa aattgcccct gagcatttta caagaaataa cattataaaa 2580
tggtctacca accctgaaaa gcttgaggaa tcaaatctta atgagccaat caaatcagtc 2640
caaagcccta ctactaaaca aacatcaaaa caattcaggg aagcgatggg tgaaatcact 2700
ggaagaaatg agcctcctac agacactttg tacacgggaa ttataaagaa atag 2754
<210> 29
<211> 765
<212> PRT
<213> Artificial
<220>
<223> SlrP novel E3 ligase from Enterohemorrhagic Escherichia coli
("EHEC") O157:H7
<400> 29
Met Phe Asn Ile Thr Asn Ile Gln Ser Thr Ala Arg His Gln Ser Ile
1 5 10 15
Ser Asn Glu Ala Ser Thr Glu Val Pro Leu Lys Glu Glu Ile Trp Asn
20 25 30
Lys Ile Ser Ala Phe Phe Ser Ser Glu His Gln Val Glu Ala Gln Asn
35 40 45
Cys Ile Ala Tyr Leu Cys His Pro Pro Glu Thr Ala Ser Pro Glu Glu
50 55 60
Ile Lys Ser Lys Phe Glu Cys Leu Arg Met Leu Ala Phe Pro Ala Tyr
65 70 75 80
Ala Asp Asn Ile Gln Tyr Ser Arg Gly Gly Ala Asp Gln Tyr Cys Ile
85 90 95
Leu Ser Glu Asn Ser Gln Glu Ile Leu Ser Ile Val Phe Asn Thr Glu
100 105 110
Gly Tyr Thr Val Glu Gly Gly Gly Lys Ser Val Thr Tyr Thr Arg Val
115 120 125
Thr Glu Ser Glu Gln Ala Ser Ser Ala Ser Gly Ser Lys Asp Ala Val
130 135 140
Asn Tyr Glu Leu Ile Trp Ser Glu Trp Val Lys Glu Ala Pro Ala Lys
145 150 155 160
Glu Ala Ala Asn Arg Glu Glu Pro Val Gln Arg Met Arg Asp Cys Leu
165 170 175
Lys Asn Asn Lys Thr Glu Leu Arg Leu Lys Ile Leu Gly Leu Thr Thr
180 185 190
Ile Pro Ala Tyr Ile Pro Glu Gln Ile Thr Thr Leu Ile Leu Asp Asn
195 200 205
Asn Glu Leu Lys Ser Leu Pro Glu Asn Leu Gln Gly Asn Ile Lys Thr
210 215 220
Leu Tyr Ala Asn Ser Asn Gln Leu Thr Ser Ile Pro Ala Thr Leu Pro
225 230 235 240
Asp Thr Ile Gln Glu Met Glu Leu Ser Ile Asn Arg Ile Thr Glu Leu
245 250 255
Pro Glu Arg Leu Pro Ser Ala Leu Gln Ser Leu Asp Leu Phe His Asn
260 265 270
Lys Ile Ser Cys Leu Pro Glu Asn Leu Pro Glu Glu Leu Arg Tyr Leu
275 280 285
Ser Val Tyr Asp Asn Ser Ile Arg Thr Leu Pro Ala His Leu Pro Ser
290 295 300
Glu Ile Thr His Leu Asn Val Gln Ser Asn Ser Leu Thr Ala Leu Pro
305 310 315 320
Glu Thr Leu Pro Pro Gly Leu Lys Thr Leu Glu Ala Gly Glu Asn Ala
325 330 335
Leu Thr Ser Leu Pro Ala Ser Leu Pro Pro Glu Leu Gln Val Leu Asp
340 345 350
Val Ser Lys Asn Gln Ile Thr Val Leu Pro Glu Thr Leu Pro Pro Thr
355 360 365
Ile Thr Thr Leu Asp Val Ser Arg Asn Ala Leu Thr Asn Leu Pro Glu
370 375 380
Asn Leu Pro Ala Ala Leu Gln Ile Met Gln Ala Ser Arg Asn Asn Leu
385 390 395 400
Val Arg Leu Pro Glu Ser Leu Pro His Phe Arg Gly Glu Gly Pro Gln
405 410 415
Pro Thr Arg Ile Ile Val Glu Tyr Asn Pro Phe Ser Glu Arg Thr Ile
420 425 430
Gln Asn Met Gln Arg Leu Met Ser Ser Val Asp Tyr Gln Gly Pro Arg
435 440 445
Val Leu Val Ala Met Gly Asp Phe Ser Ile Val Arg Val Thr Arg Pro
450 455 460
Leu His Gln Ala Val Gln Gly Trp Leu Thr Ser Leu Glu Glu Glu Asp
465 470 475 480
Val Asn Gln Trp Arg Ala Phe Glu Ala Glu Ala Asn Ala Ala Ala Phe
485 490 495
Ser Gly Phe Leu Asp Tyr Leu Gly Asp Thr Gln Asn Thr Arg His Pro
500 505 510
Asp Phe Lys Glu Gln Val Ser Ala Trp Leu Met Arg Leu Ala Glu Asp
515 520 525
Ser Ala Leu Arg Glu Thr Val Phe Ile Ile Ala Met Asn Ala Thr Ile
530 535 540
Ser Cys Glu Asp Arg Val Thr Leu Ala Tyr His Gln Met Gln Glu Ala
545 550 555 560
Thr Leu Val His Asp Ala Glu Arg Gly Ala Phe Asp Ser His Leu Ala
565 570 575
Glu Leu Ile Met Ala Gly Arg Glu Ile Phe Arg Leu Glu Gln Ile Glu
580 585 590
Ser Leu Ala Arg Glu Lys Val Lys Arg Leu Phe Phe Ile Asp Glu Val
595 600 605
Glu Val Phe Leu Gly Phe Gln Asn Gln Leu Arg Glu Ser Leu Ser Leu
610 615 620
Thr Thr Met Thr Arg Asp Met Arg Phe Tyr Asn Val Ser Gly Ile Thr
625 630 635 640
Glu Ser Asp Leu Asp Glu Ala Glu Ile Arg Ile Lys Met Ala Glu Asn
645 650 655
Arg Asp Phe His Lys Trp Phe Ala Leu Trp Gly Pro Trp His Lys Val
660 665 670
Leu Glu Arg Ile Ala Pro Glu Glu Trp Arg Glu Met Met Ala Lys Arg
675 680 685
Asp Glu Cys Ile Glu Thr Asp Glu Tyr Gln Ser Arg Val Asn Ala Glu
690 695 700
Leu Glu Asp Leu Arg Ile Ala Asp Asp Ser Asp Ala Glu Arg Thr Thr
705 710 715 720
Glu Val Gln Met Asp Ala Glu Arg Ala Ile Gly Ile Lys Ile Met Glu
725 730 735
Glu Ile Asn Gln Thr Leu Phe Thr Glu Ile Met Glu Asn Ile Leu Leu
740 745 750
Lys Lys Glu Val Ser Ser Leu Met Ser Ala Tyr Trp Arg
755 760 765
<210> 30
<211> 2298
<212> DNA
<213> Artificial
<220>
<223> SlrP novel E3 ligase from Enterohemorrhagic Escherichia coli
("EHEC") O157:H7
<400> 30
atgtttaata ttactaatat acaatctacg gcaaggcatc aaagtattag caatgaggcc 60
tcaacagagg tgcctttaaa agaagagata tggaataaaa taagtgcctt tttctcttca 120
gaacatcagg ttgaagcaca aaactgcatc gcttatcttt gtcatccacc tgaaaccgcc 180
tcgccagaag agatcaaaag caagtttgaa tgtttaagga tgttagcttt cccggcgtat 240
gcggataata ttcagtatag tagaggaggg gcagaccaat actgtatttt gagtgaaaat 300
agtcaggaaa ttctgtctat agtttttaat acagagggct ataccgttga gggaggggga 360
aagtcagtca cctatacccg tgtgacagaa agcgagcagg cgagtagcgc ttccggctcc 420
aaagatgctg tgaattatga gttaatctgg tctgagtggg taaaagaggc gccagcgaaa 480
gaggcagcaa atcgtgaaga acccgtacaa cggatgcgtg actgcctgaa aaataataag 540
acggaacttc gtctgaaaat attaggactt accactatac ctgcctatat tcctgagcag 600
ataactactc tgatactcga taacaatgaa ctgaaaagtt tgccggaaaa tttacaggga 660
aatataaaga ccctgtatgc caacagtaat cagctaacca gtatccctgc cacgttaccg 720
gataccatac aggaaatgga gctgagcatt aaccgtatta ctgaattgcc ggaacgtttg 780
ccttcagcgc ttcaatcgct ggatcttttc cataataaaa ttagttgctt acctgaaaat 840
ctacctgagg aacttcggta cctgagcgtt tatgataaca gcataaggac actgccagca 900
catcttccgt cagagattac ccatttgaat gtgcagagta attcgttaac cgctttgcct 960
gaaacattgc cgccgggcct gaagactctg gaggccggcg aaaatgcctt aaccagtctg 1020
cccgcatcgt taccaccaga attacaggtc ctggatgtaa gtaaaaatca gattacggtt 1080
ctgcctgaaa cacttcctcc cacgataaca acgctggatg tttcccgtaa cgcattgact 1140
aatctaccgg aaaacctccc ggcggcatta caaataatgc aggcctctcg caataacctg 1200
gtccgtctcc cggagtcgtt accccatttt cgtggtgaag gacctcaacc tacaagaata 1260
atcgtagaat ataatccttt ttcagaacga acaatacaga atatgcagcg gctaatgtcc 1320
tctgtagatt atcagggacc ccgggtattg gttgccatgg gcgacttttc aattgttcgg 1380
gtaactcgac cactgcatca agctgtccag gggtggctaa ccagtctcga ggaggaagac 1440
gtcaaccaat ggcgggcgtt tgaggcagag gcaaacgcgg cggctttcag cggattcctg 1500
gactatcttg gtgatacgca gaatacccga cacccggatt ttaaggaaca agtctccgcc 1560
tggctaatgc gcctggctga agatagcgca ctaagagaaa ccgtatttat tatagcgatg 1620
aatgcaacga taagctgtga agatcgggtc acactggcat accaccaaat gcaggaagcg 1680
acgttggttc atgatgctga aagaggcgcc tttgatagcc acttagcgga actgattatg 1740
gcggggcgtg aaatctttcg gctggagcaa atagaatcgc tcgccagaga aaaggtaaaa 1800
cggctgtttt ttattgacga agtcgaagta tttctggggt ttcagaatca gttacgagag 1860
tcgctgtcgc tgacaacaat gacccgggat atgcgatttt ataacgtttc gggtatcact 1920
gagtctgacc tggacgaggc ggaaataagg ataaaaatgg ctgaaaatag ggattttcac 1980
aaatggtttg cgctgtgggg gccgtggcat aaagtgctgg agcgcatagc gccagaagag 2040
tggcgtgaaa tgatggctaa aagggatgag tgtattgaaa cggatgagta tcagagccgg 2100
gtcaatgctg aactggaaga tttaagaata gcagacgact ctgacgcaga gcgtactact 2160
gaggtacaga tggatgcaga gcgtgctatt gggataaaaa taatggaaga gatcaatcag 2220
accctcttta ctgagatcat ggagaatata ttgctgaaaa aagaggtgag ctcgctcatg 2280
agcgcctact ggcgatag 2298
<210> 31
<211> 782
<212> PRT
<213> Artificial
<220>
<223> SopA HECT motif from Salmonella typhimurium
<400> 31
Met Lys Ile Ser Ser Gly Ala Ile Asn Phe Ser Thr Ile Pro Asn Gln
1 5 10 15
Val Lys Lys Leu Ile Thr Ser Ile Arg Glu His Thr Lys Asn Gly Leu
20 25 30
Thr Ser Lys Ile Thr Ser Val Lys Asn Thr His Thr Ser Leu Asn Glu
35 40 45
Lys Phe Lys Thr Gly Lys Asp Ser Pro Ile Glu Phe Ala Leu Pro Gln
50 55 60
Lys Ile Lys Asp Phe Phe Gln Pro Lys Asp Lys Asn Thr Leu Asn Lys
65 70 75 80
Thr Leu Ile Thr Val Lys Asn Ile Lys Asp Thr Asn Asn Ala Gly Lys
85 90 95
Lys Asn Ile Ser Ala Glu Asp Val Ser Lys Met Asn Ala Ala Phe Met
100 105 110
Arg Lys His Ile Ala Asn Gln Thr Cys Asp Tyr Asn Tyr Arg Met Thr
115 120 125
Gly Ala Ala Pro Leu Pro Gly Gly Val Ser Val Ser Ala Asn Asn Arg
130 135 140
Pro Thr Val Ser Glu Gly Arg Thr Pro Pro Val Ser Pro Ser Leu Ser
145 150 155 160
Leu Gln Ala Thr Ser Ser Pro Ser Ser Pro Ala Asp Trp Ala Lys Lys
165 170 175
Leu Thr Asp Ala Val Leu Arg Gln Lys Ala Gly Glu Thr Leu Thr Ala
180 185 190
Ala Asp Arg Asp Phe Ser Asn Ala Asp Phe Arg Asn Ile Thr Phe Ser
195 200 205
Lys Ile Leu Pro Pro Ser Phe Met Glu Arg Asp Gly Asp Ile Ile Lys
210 215 220
Gly Phe Asn Phe Ser Asn Ser Lys Phe Thr Tyr Ser Asp Ile Ser His
225 230 235 240
Leu His Phe Asp Glu Cys Arg Phe Thr Tyr Ser Thr Leu Ser Asp Val
245 250 255
Val Cys Ser Asn Thr Lys Phe Ser Asn Ser Asp Met Asn Glu Val Phe
260 265 270
Leu Gln Tyr Ser Ile Thr Thr Gln Gln Gln Pro Ser Phe Ile Asp Thr
275 280 285
Thr Leu Lys Asn Thr Leu Ile Arg His Lys Ala Asn Leu Ser Gly Val
290 295 300
Ile Leu Asn Glu Pro Asp Asn Ser Ser Pro Pro Ser Val Ser Gly Gly
305 310 315 320
Gly Asn Phe Ile Arg Leu Gly Asp Ile Trp Leu Gln Met Pro Leu Leu
325 330 335
Trp Thr Glu Asn Ala Val Asp Gly Phe Leu Asn His Glu His Asn Asn
340 345 350
Gly Lys Ser Ile Leu Met Thr Ile Asp Ser Leu Pro Asp Lys Tyr Ser
355 360 365
Gln Glu Lys Val Gln Ala Met Glu Asp Leu Val Lys Ser Leu Arg Gly
370 375 380
Gly Arg Leu Thr Glu Ala Cys Ile Arg Pro Val Glu Ser Ser Leu Val
385 390 395 400
Ser Val Leu Ala His Pro Pro Tyr Thr Gln Ser Ala Leu Ile Ser Glu
405 410 415
Trp Leu Gly Pro Val Gln Glu Arg Phe Phe Ala His Gln Cys Gln Thr
420 425 430
Tyr Asn Asp Val Pro Leu Pro Ala Pro Asp Thr Tyr Tyr Gln Gln Arg
435 440 445
Ile Leu Pro Val Leu Leu Asp Ser Phe Asp Arg Asn Ser Ala Ala Met
450 455 460
Thr Thr His Ser Gly Leu Phe Asn Gln Val Ile Leu His Cys Met Thr
465 470 475 480
Gly Val Asp Cys Thr Asp Gly Thr Arg Gln Lys Ala Ala Ala Leu Tyr
485 490 495
Glu Gln Tyr Leu Ala His Pro Ala Val Ser Pro His Ile His Asn Gly
500 505 510
Leu Phe Gly Asn Tyr Asp Gly Ser Pro Asp Trp Thr Thr Arg Ala Ala
515 520 525
Asp Asn Phe Leu Leu Leu Ser Ser Gln Asp Ser Asp Thr Ala Met Met
530 535 540
Leu Ser Thr Asp Thr Leu Leu Thr Met Leu Asn Pro Thr Pro Asp Thr
545 550 555 560
Ala Trp Asp Asn Phe Tyr Leu Leu Arg Ala Gly Glu Asn Val Ser Thr
565 570 575
Ala Gln Ile Ser Pro Val Glu Leu Phe Arg His Asp Phe Pro Val Phe
580 585 590
Leu Ala Ala Phe Asn Gln Gln Ala Thr Gln Arg Arg Phe Gly Glu Leu
595 600 605
Ile Asp Ile Ile Leu Ser Thr Glu Glu His Gly Glu Leu Asn Gln Gln
610 615 620
Phe Leu Ala Ala Thr Asn Gln Lys His Ser Thr Val Lys Leu Ile Asp
625 630 635 640
Asp Ala Ser Val Ser Arg Leu Ala Thr Ile Phe Asp Pro Leu Leu Pro
645 650 655
Glu Gly Lys Leu Ser Pro Ala His Tyr Gln His Ile Leu Ser Ala Tyr
660 665 670
His Leu Thr Asp Ala Thr Pro Gln Lys Gln Ala Glu Thr Leu Phe Cys
675 680 685
Leu Ser Thr Ala Phe Ala Arg Tyr Ser Ser Ser Ala Ile Phe Gly Thr
690 695 700
Glu His Asp Ser Pro Pro Ala Leu Arg Gly Tyr Ala Glu Ala Leu Met
705 710 715 720
Gln Lys Ala Trp Glu Leu Ser Pro Ala Ile Phe Pro Ser Ser Glu Gln
725 730 735
Phe Thr Glu Trp Ser Asp Arg Phe His Gly Leu His Gly Ala Phe Thr
740 745 750
Cys Thr Ser Val Val Ala Asp Ser Met Gln Arg His Ala Arg Lys Tyr
755 760 765
Phe Pro Ser Val Leu Ser Ser Ile Leu Pro Leu Ala Trp Ala
770 775 780
<210> 32
<211> 2349
<212> DNA
<213> Artificial
<220>
<223> SopA HECT motif from Salmonella typhimurium
<400> 32
atgaagatat catcaggcgc aattaatttt tctactattc ctaaccaggt taaaaaatta 60
attacctcta ttcgtgaaca tacgaaaaac gggctcacct caaaaataac cagtgttaaa 120
aacacgcata catctttaaa tgaaaaattt aaaacaggaa aggactcacc gattgagttc 180
gcgttaccac aaaaaataaa agacttcttt cagccgaaag ataaaaacac cttaaacaaa 240
acattgatta ctgttaaaaa tattaaagat acaaataatg caggcaagaa aaatatttca 300
gcagaagatg tctcaaaaat gaatgcagca ttcatgcgta agcatattgc aaatcaaaca 360
tgtgattata attacagaat gacaggtgcg gccccgctcc ccggtggagt ctctgtatca 420
gccaataaca ggcccacggt ttctgaaggt agaacaccac cagtatcccc ctccctctca 480
cttcaggcta cctcttcccc gtcatcacct gccgactggg ctaagaaact cacggatgca 540
gttttacgac agaaagccgg agaaaccctt acggccgcag atcgcgattt ttcaaacgca 600
gatttccgta atattacatt cagcaaaata ttgcccccca gcttcatgga gcgagacggc 660
gatattatta aggggttcaa cttttcaaat tcaaaattta cttattctga tatatctcat 720
ttacattttg acgaatgccg attcacttat tcgacactga gtgatgtagt ctgcagtaat 780
acgaaattta gtaattcaga catgaatgaa gtgtttttac agtattcaat tactacacaa 840
caacagccct cgtttattga tacaacatta aaaaatacgc ttatacgtca caaagccaac 900
ctctctggcg ttattttaaa tgaaccggat aattcatcac ctccgtcagt gtcagggggc 960
ggaaatttta ttcgtctagg tgatatctgg ctgcaaatgc cactcctttg gactgagaac 1020
gctgtggatg gatttttaaa tcatgagcac aataatggta aaagtattct gatgaccatt 1080
gacagcctgc ccgataaata cagtcaggaa aaagtccagg caatggaaga cctggttaag 1140
tcattgcggg gtggccgctt aacagaggca tgtatccggc cagttgaaag ttcgctggta 1200
agcgtactgg cccacccccc ctatacgcaa agtgcgctta tcagcgagtg gctcgggcct 1260
gttcaggaac gtttttttgc ccaccagtgc cagacctata atgacgttcc cctgccggct 1320
cctgacacat attatcagca gcgcatactg cctgtgttgc tggattcgtt tgacaggaac 1380
agcgccgcca tgaccactca cagcggactc tttaatcagg tgattttaca ctgtatgaca 1440
ggcgtggact gcactgatgg cacccgccag aaagctgcag cgctttatga acagtatctt 1500
gctcacccgg cggtgtctcc ccacatccat aatgggctct tcggcaatta tgatggcagc 1560
ccggactgga caacccgcgc tgcagataat ttcctgctgc tttcctccca agattcagac 1620
acggcgatga tgctctccac tgacacgctg ttaacaatgc taaaccctac tcctgacact 1680
gcatgggaca acttttacct gctgcgagcc ggagagaacg tttccaccgc gcaaatctct 1740
ccggtagagt tattccgtca tgactttccg gtgtttctcg ccgcatttaa tcagcaggcc 1800
acgcagcgac gctttgggga gctgattgat atcatcctca gcactgaaga gcacggggag 1860
ctgaaccagc agtttcttgc cgccacgaac cagaaacatt ccaccgtgaa gttgattgat 1920
gatgcctcag tgtcgcgtct ggccaccatt tttgacccct tgcttcctga aggcaaactc 1980
agcccggcac actaccagca catcctcagt gcttatcacc tgacggacgc caccccacag 2040
aagcaggcgg aaaccctgtt ctgtctcagt accgcattcg cacgctattc ctccagcgcc 2100
attttcggca ctgagcatga ctctccgccg gccctgagag gctatgcgga ggcgctgatg 2160
cagaaagcct gggagctgtc tccggcgata ttcccatcca gcgaacagtt taccgagtgg 2220
tccgaccgtt ttcacggcct ccatggcgcc tttacctgta ccagcgttgt ggcggatagt 2280
atgcaacgtc atgccagaaa atatttcccg agtgttctgt catccatcct gccactggcc 2340
tgggcgtaa 2349
<210> 33
<211> 700
<212> PRT
<213> Artificial
<220>
<223> SspH1 novel E3 ligase from Salmonella typhimurium
<400> 33
Met Phe Asn Ile Arg Asn Thr Gln Pro Ser Val Ser Met Gln Ala Ile
1 5 10 15
Ala Gly Ala Ala Ala Pro Glu Ala Ser Pro Glu Glu Ile Val Trp Glu
20 25 30
Lys Ile Gln Val Phe Phe Pro Gln Glu Asn Tyr Glu Glu Ala Gln Gln
35 40 45
Cys Leu Ala Glu Leu Cys His Pro Ala Arg Gly Met Leu Pro Asp His
50 55 60
Ile Ser Ser Gln Phe Ala Arg Leu Lys Ala Leu Thr Phe Pro Ala Trp
65 70 75 80
Glu Glu Asn Ile Gln Cys Asn Arg Asp Gly Ile Asn Gln Phe Cys Ile
85 90 95
Leu Asp Ala Gly Ser Lys Glu Ile Leu Ser Ile Thr Leu Asp Asp Ala
100 105 110
Gly Asn Tyr Thr Val Asn Cys Gln Gly Tyr Ser Glu Ala His Asp Phe
115 120 125
Ile Met Asp Thr Glu Pro Gly Glu Glu Cys Thr Glu Phe Ala Glu Gly
130 135 140
Ala Ser Gly Thr Ser Leu Arg Pro Ala Thr Thr Val Ser Gln Lys Ala
145 150 155 160
Ala Glu Tyr Asp Ala Val Trp Ser Lys Trp Glu Arg Asp Ala Pro Ala
165 170 175
Gly Glu Ser Pro Gly Arg Ala Ala Val Val Gln Glu Met Arg Asp Cys
180 185 190
Leu Asn Asn Gly Asn Pro Val Leu Asn Val Gly Ala Ser Gly Leu Thr
195 200 205
Thr Leu Pro Asp Arg Leu Pro Pro His Ile Thr Thr Leu Val Ile Pro
210 215 220
Asp Asn Asn Leu Thr Ser Leu Pro Glu Leu Pro Glu Gly Leu Arg Glu
225 230 235 240
Leu Glu Val Ser Gly Asn Leu Gln Leu Thr Ser Leu Pro Ser Leu Pro
245 250 255
Gln Gly Leu Gln Lys Leu Trp Ala Tyr Asn Asn Trp Leu Ala Ser Leu
260 265 270
Pro Thr Leu Pro Pro Gly Leu Gly Asp Leu Ala Val Ser Asn Asn Gln
275 280 285
Leu Thr Ser Leu Pro Glu Met Pro Pro Ala Leu Arg Glu Leu Arg Val
290 295 300
Ser Gly Asn Asn Leu Thr Ser Leu Pro Ala Leu Pro Ser Gly Leu Gln
305 310 315 320
Lys Leu Trp Ala Tyr Asn Asn Arg Leu Thr Ser Leu Pro Glu Met Ser
325 330 335
Pro Gly Leu Gln Glu Leu Asp Val Ser His Asn Gln Leu Thr Arg Leu
340 345 350
Pro Gln Ser Leu Thr Gly Leu Ser Ser Ala Ala Arg Val Tyr Leu Asp
355 360 365
Gly Asn Pro Leu Ser Val Arg Thr Leu Gln Ala Leu Arg Asp Ile Ile
370 375 380
Gly His Ser Gly Ile Arg Ile His Phe Asp Met Ala Gly Pro Ser Val
385 390 395 400
Pro Arg Glu Ala Arg Ala Leu His Leu Ala Val Ala Asp Trp Leu Thr
405 410 415
Ser Ala Arg Glu Gly Glu Ala Ala Gln Ala Asp Arg Trp Gln Ala Phe
420 425 430
Gly Leu Glu Asp Asn Ala Ala Ala Phe Ser Leu Val Leu Asp Arg Leu
435 440 445
Arg Glu Thr Glu Asn Phe Lys Lys Asp Ala Gly Phe Lys Ala Gln Ile
450 455 460
Ser Ser Trp Leu Thr Gln Leu Ala Glu Asp Ala Ala Leu Arg Ala Lys
465 470 475 480
Thr Phe Ala Met Ala Thr Glu Ala Thr Ser Thr Cys Glu Asp Arg Val
485 490 495
Thr His Ala Leu His Gln Met Asn Asn Val Gln Leu Val His Asn Ala
500 505 510
Glu Lys Gly Glu Tyr Asp Asn Asn Leu Gln Gly Leu Val Ser Thr Gly
515 520 525
Arg Glu Met Phe Arg Leu Ala Thr Leu Glu Gln Ile Ala Arg Glu Lys
530 535 540
Ala Gly Thr Leu Ala Leu Val Asp Asp Val Glu Val Tyr Leu Ala Phe
545 550 555 560
Gln Asn Lys Leu Lys Glu Ser Leu Glu Leu Thr Ser Val Thr Ser Glu
565 570 575
Met Arg Phe Phe Asp Val Ser Gly Val Thr Val Ser Asp Leu Gln Ala
580 585 590
Ala Glu Leu Gln Val Lys Thr Ala Glu Asn Ser Gly Phe Ser Lys Trp
595 600 605
Ile Leu Gln Trp Gly Pro Leu His Ser Val Leu Glu Arg Lys Val Pro
610 615 620
Glu Arg Phe Asn Ala Leu Arg Glu Lys Gln Ile Ser Asp Tyr Glu Asp
625 630 635 640
Thr Tyr Arg Lys Leu Tyr Asp Glu Val Leu Lys Ser Ser Gly Leu Val
645 650 655
Asp Asp Thr Asp Ala Glu Arg Thr Ile Gly Val Ser Ala Met Asp Ser
660 665 670
Ala Lys Lys Glu Phe Leu Asp Gly Leu Arg Ala Leu Val Asp Glu Val
675 680 685
Leu Gly Ser Tyr Leu Thr Ala Arg Trp Arg Leu Asn
690 695 700
<210> 34
<211> 2103
<212> DNA
<213> Artificial
<220>
<223> SspH1 novel E3 ligase from Salmonella typhimurium
<400> 34
atgtttaata tccgcaatac acaaccttct gtaagtatgc aggctattgc tggtgcagcg 60
gcaccagagg catctccgga agaaattgta tgggaaaaaa ttcaggtttt tttcccgcag 120
gaaaattacg aagaagcgca acagtgtctc gctgaacttt gccatccggc ccggggaatg 180
ttgcctgatc atatcagcag ccagtttgcg cgtttaaaag cgcttacctt ccccgcgtgg 240
gaggagaata ttcagtgtaa cagggatggt ataaatcagt tttgtattct ggatgcaggc 300
agcaaggaga tattgtcaat cactcttgat gatgccggga actataccgt gaattgtcag 360
gggtacagtg aagcacatga cttcatcatg gacacagaac cgggagagga atgcacagaa 420
ttcgcggagg gggcatccgg gacatccctc cgccctgcca caacggtttc acagaaggca 480
gcagagtatg atgctgtctg gtcaaaatgg gaaagggatg caccagcagg agagtcaccc 540
ggccgcgcag cagtggtaca ggaaatgcgt gattgcctga ataacggcaa tccagtgctt 600
aacgtgggag cgtcaggtct taccacctta ccagaccgtt taccaccgca tattacaaca 660
ctggttattc ctgataataa tctgaccagc ctgccggagt tgccggaagg actacgggag 720
ctggaggtct ctggtaacct acaactgacc agcctgccat cgctgccgca gggactacag 780
aagctgtggg cctataataa ttggctggcc agcctgccga cgttgccgcc aggactaggg 840
gatctggcgg tctctaataa ccagctgacc agcctgccgg agatgccgcc agcactacgg 900
gagctgaggg tctctggtaa caacctgacc agcctgccgg cgctgccgtc aggactacag 960
aagctgtggg cctataataa tcggctgacc agcctgccgg agatgtcgcc aggactacag 1020
gagctggatg tctctcataa ccagctgacc cgcctgccgc aaagcctcac gggtctgtct 1080
tcagcggcac gcgtatatct ggacgggaat ccactgtctg tacgcactct gcaggctctg 1140
cgggacatca ttggccattc aggcatcagg atacacttcg atatggcggg gccttccgtc 1200
ccccgggaag cccgggcact gcacctggcg gtcgctgact ggctgacgtc tgcacgggag 1260
ggggaagcgg cccaggcaga cagatggcag gcgttcggac tggaagataa cgccgccgcc 1320
ttcagcctgg tcctggacag actgcgtgag acggaaaact tcaaaaaaga cgcgggcttt 1380
aaggcacaga tatcatcctg gctgacacaa ctggctgaag atgctgcgct gagagcaaaa 1440
acctttgcca tggcaacaga ggcaacatca acctgcgagg accgggtcac acatgccctg 1500
caccagatga ataacgtaca actggtacat aatgcagaaa aaggggaata cgacaacaat 1560
ctccaggggc tggtttccac ggggcgtgag atgttccgcc tggcaacact ggaacagatt 1620
gcccgggaaa aagccggaac actggcttta gtcgatgacg ttgaggtcta tctggcgttc 1680
cagaataagc tgaaggaatc acttgagctg accagcgtga cgtcagaaat gcgtttcttt 1740
gacgtttccg gcgtgacggt ttcagacctt caggctgcgg agcttcaggt gaaaaccgct 1800
gaaaacagcg ggttcagtaa atggatactg cagtgggggc cgttacacag cgtgctggaa 1860
cgcaaagtgc cggaacgctt taacgcgctt cgtgaaaagc aaatatcgga ttatgaagac 1920
acgtaccgga agctgtatga cgaagtgctg aaatcgtccg ggctggtcga cgataccgat 1980
gcagaacgta ctatcggagt aagtgcgatg gatagtgcga aaaaagaatt tctggatggc 2040
ctgcgcgctc ttgtggatga ggtgctgggt agctatctga cagcccggtg gcgtcttaac 2100
taa 2103
<210> 35
<211> 788
<212> PRT
<213> Artificial
<220>
<223> SspH2 novel E3 ligase from Salmonella typhimurium
<400> 35
Met Pro Phe His Ile Gly Ser Gly Cys Leu Pro Ala Thr Ile Ser Asn
1 5 10 15
Arg Arg Ile Tyr Arg Ile Ala Trp Ser Asp Thr Pro Pro Glu Met Ser
20 25 30
Ser Trp Glu Lys Met Lys Glu Phe Phe Cys Ser Thr His Gln Thr Glu
35 40 45
Ala Leu Glu Cys Ile Trp Thr Ile Cys His Pro Pro Ala Gly Thr Thr
50 55 60
Arg Glu Asp Val Ile Asn Arg Phe Glu Leu Leu Arg Thr Leu Ala Tyr
65 70 75 80
Ala Gly Trp Glu Glu Ser Ile His Ser Gly Gln His Gly Glu Asn Tyr
85 90 95
Phe Cys Ile Leu Asp Glu Asp Ser Gln Glu Ile Leu Ser Val Thr Leu
100 105 110
Asp Asp Ala Gly Asn Tyr Thr Val Asn Cys Gln Gly Tyr Ser Glu Thr
115 120 125
His Arg Leu Thr Leu Asp Thr Ala Gln Gly Glu Glu Gly Thr Gly His
130 135 140
Ala Glu Gly Ala Ser Gly Thr Phe Arg Thr Ser Phe Leu Pro Ala Thr
145 150 155 160
Thr Ala Pro Gln Thr Pro Ala Glu Tyr Asp Ala Val Trp Ser Ala Trp
165 170 175
Arg Arg Ala Ala Pro Ala Glu Glu Ser Arg Gly Arg Ala Ala Val Val
180 185 190
Gln Lys Met Arg Ala Cys Leu Asn Asn Gly Asn Ala Val Leu Asn Val
195 200 205
Gly Glu Ser Gly Leu Thr Thr Leu Pro Asp Cys Leu Pro Ala His Ile
210 215 220
Thr Thr Leu Val Ile Pro Asp Asn Asn Leu Thr Ser Leu Pro Ala Leu
225 230 235 240
Pro Pro Glu Leu Arg Thr Leu Glu Val Ser Gly Asn Gln Leu Thr Ser
245 250 255
Leu Pro Val Leu Pro Pro Gly Leu Leu Glu Leu Ser Ile Phe Ser Asn
260 265 270
Pro Leu Thr His Leu Pro Ala Leu Pro Ser Gly Leu Cys Lys Leu Trp
275 280 285
Ile Phe Gly Asn Gln Leu Thr Ser Leu Pro Val Leu Pro Pro Gly Leu
290 295 300
Gln Glu Leu Ser Val Ser Asp Asn Gln Leu Ala Ser Leu Pro Ala Leu
305 310 315 320
Pro Ser Glu Leu Cys Lys Leu Trp Ala Tyr Asn Asn Gln Leu Thr Ser
325 330 335
Leu Pro Met Leu Pro Ser Gly Leu Gln Glu Leu Ser Val Ser Asp Asn
340 345 350
Gln Leu Ala Ser Leu Pro Thr Leu Pro Ser Glu Leu Tyr Lys Leu Trp
355 360 365
Ala Tyr Asn Asn Arg Leu Thr Ser Leu Pro Ala Leu Pro Ser Gly Leu
370 375 380
Lys Glu Leu Ile Val Ser Gly Asn Arg Leu Thr Ser Leu Pro Val Leu
385 390 395 400
Pro Ser Glu Leu Lys Glu Leu Met Val Ser Gly Asn Arg Leu Thr Ser
405 410 415
Leu Pro Met Leu Pro Ser Gly Leu Leu Ser Leu Ser Val Tyr Arg Asn
420 425 430
Gln Leu Thr Arg Leu Pro Glu Ser Leu Ile His Leu Ser Ser Glu Thr
435 440 445
Thr Val Asn Leu Glu Gly Asn Pro Leu Ser Glu Arg Thr Leu Gln Ala
450 455 460
Leu Arg Glu Ile Thr Ser Ala Pro Gly Tyr Ser Gly Pro Ile Ile Arg
465 470 475 480
Phe Asp Met Ala Gly Ala Ser Ala Pro Arg Glu Thr Arg Ala Leu His
485 490 495
Leu Ala Ala Ala Asp Trp Leu Val Pro Ala Arg Glu Gly Glu Pro Ala
500 505 510
Pro Ala Asp Arg Trp His Met Phe Gly Gln Glu Asp Asn Ala Asp Ala
515 520 525
Phe Ser Leu Phe Leu Asp Arg Leu Ser Glu Thr Glu Asn Phe Ile Lys
530 535 540
Asp Ala Gly Phe Lys Ala Gln Ile Ser Ser Trp Leu Ala Gln Leu Ala
545 550 555 560
Glu Asp Glu Ala Leu Arg Ala Asn Thr Phe Ala Met Ala Thr Glu Ala
565 570 575
Thr Ser Ser Cys Glu Asp Arg Val Thr Phe Phe Leu His Gln Met Lys
580 585 590
Asn Val Gln Leu Val His Asn Ala Glu Lys Gly Gln Tyr Asp Asn Asp
595 600 605
Leu Ala Ala Leu Val Ala Thr Gly Arg Glu Met Phe Arg Leu Gly Lys
610 615 620
Leu Glu Gln Ile Ala Arg Glu Lys Val Arg Thr Leu Ala Leu Val Asp
625 630 635 640
Glu Ile Glu Val Trp Leu Ala Tyr Gln Asn Lys Leu Lys Lys Ser Leu
645 650 655
Gly Leu Thr Ser Val Thr Ser Glu Met Arg Phe Phe Asp Val Ser Gly
660 665 670
Val Thr Val Thr Asp Leu Gln Asp Ala Glu Leu Gln Val Lys Ala Ala
675 680 685
Glu Lys Ser Glu Phe Arg Glu Trp Ile Leu Gln Trp Gly Pro Leu His
690 695 700
Arg Val Leu Glu Arg Lys Ala Pro Glu Arg Val Asn Ala Leu Arg Glu
705 710 715 720
Lys Gln Ile Ser Asp Tyr Glu Glu Thr Tyr Arg Met Leu Ser Asp Thr
725 730 735
Glu Leu Arg Pro Ser Gly Leu Val Gly Asn Thr Asp Ala Glu Arg Thr
740 745 750
Ile Gly Ala Arg Ala Met Glu Ser Ala Lys Lys Thr Phe Leu Asp Gly
755 760 765
Leu Arg Pro Leu Val Glu Glu Met Leu Gly Ser Tyr Leu Asn Val Gln
770 775 780
Trp Arg Arg Asn
785
<210> 36
<211> 2367
<212> DNA
<213> Artificial
<220>
<223> SspH2 novel E3 ligase from Salmonella typhimurium
<400> 36
atgccctttc atattggaag cggatgtctt cccgccacca tcagtaatcg ccgcatttat 60
cgtattgcct ggtctgatac cccccctgaa atgagttcct gggaaaaaat gaaggaattt 120
ttttgctcaa cgcaccagac tgaagcgctg gagtgcatct ggacgatttg tcacccgccg 180
gccggaacga cgcgggagga tgtgatcaac agatttgaac tgctcaggac gctcgcgtat 240
gccggatggg aggaaagcat tcattccggc cagcacgggg aaaattactt ctgtattctg 300
gatgaagaca gtcaggagat attgtcagtc acccttgatg atgccgggaa ctataccgta 360
aattgccagg ggtacagtga aacacatcgc ctcaccctgg acacagcaca gggtgaggag 420
ggcacaggac acgcggaagg ggcatccggg acattcagga catccttcct ccctgccaca 480
acggctccac agacgccagc agagtatgat gctgtctggt cagcgtggag aagggctgca 540
cccgcagaag agtcacgcgg ccgtgcagca gtggtacaga aaatgcgtgc ctgcctgaat 600
aatggcaatg cagtgcttaa cgtgggagaa tcaggtctta ccaccttgcc agactgttta 660
cccgcgcata ttaccacact ggttattcct gataataatc tgaccagcct gccggcgctg 720
ccgccagaac tgcggacgct ggaggtctct ggtaaccagc tgactagcct gccggtgctg 780
ccgccaggac tactggaact gtcgatcttt agtaacccgc tgacccacct gccggcgctg 840
ccgtcaggac tatgtaagct gtggatcttt ggtaatcaac tgaccagcct gccggtgttg 900
ccgccagggc tacaggagct gtcggtatct gataaccaac tggccagcct gccggcgctg 960
ccgtcagaat tatgtaagct gtgggcctat aataaccagc tgaccagcct gccgatgttg 1020
ccgtcagggc tacaggagct gtcggtatct gataaccaac tggccagcct gccgacgctg 1080
ccgtcagaat tatataagct gtgggcctat aataatcggc tgaccagcct gccggcgttg 1140
ccgtcaggac tgaaggagct gattgtatct ggtaaccggc tgaccagtct gccggtgctg 1200
ccgtcagaac tgaaggagct gatggtatct ggtaaccggc tgaccagcct gccgatgctg 1260
ccgtcaggac tactgtcgct gtcggtctat cgtaaccagc tgacccgcct gccggaaagt 1320
ctcattcatc tgtcttcaga gacaaccgta aatctggaag ggaacccact gtctgaacgt 1380
actttgcagg cgctgcggga gatcaccagc gcgcctggct attcaggccc cataatacga 1440
ttcgatatgg cgggagcctc cgccccccgg gaaactcggg cactgcacct ggcggccgct 1500
gactggctgg tgcctgcccg ggagggggaa ccggctcctg cagacagatg gcatatgttc 1560
ggacaggaag ataacgccga cgcattcagc ctcttcctgg acagactgag tgagacggaa 1620
aacttcataa aggacgcggg gtttaaggca cagatatcgt cctggctggc acaactggct 1680
gaagatgagg cgttaagagc aaacaccttt gctatggcaa cagaggcaac ctcaagctgc 1740
gaggaccggg tcacattttt tttgcaccag atgaagaacg tacagctggt acataatgca 1800
gaaaaagggc aatacgataa cgatctcgcg gcgctggttg ccacggggcg tgagatgttc 1860
cgtctgggaa aactggaaca gattgcccgg gaaaaggtca gaacgctggc tctcgttgat 1920
gaaattgagg tctggctggc gtatcagaat aagctgaaga aatcactcgg gctgaccagc 1980
gtgacgtcag aaatgcgttt ctttgacgta tccggcgtga cggttacaga ccttcaggac 2040
gcggagcttc aggtgaaagc cgctgaaaaa agcgagttca gggagtggat actgcagtgg 2100
gggccgttac acagagtgct ggagcgcaaa gcgccggaac gcgttaacgc gcttcgtgaa 2160
aagcaaatat cggattatga ggaaacgtac cggatgctgt ctgacacaga gctgagaccg 2220
tctgggctgg tcggtaatac cgatgcagag cgcactatcg gagcaagagc gatggagagc 2280
gcgaaaaaga catttttgga tggcctgcga cctcttgtgg aggagatgct ggggagctat 2340
ctgaacgttc agtggcgtcg taactga 2367
<210> 37
<211> 660
<212> PRT
<213> Artificial
<220>
<223> XopL unconventional motif from Xanthomonas campestris
<400> 37
Met Arg Arg Val Asp Gln Pro Arg Pro Pro Gly Thr Pro Phe Gly Leu
1 5 10 15
Arg Glu Gln Thr Thr Ser Asn Ala Asp Ala Pro Ala Arg Thr Ala Pro
20 25 30
Pro Ala His Pro Ala Pro Glu Arg Pro Thr Gly Met Leu Gly Gly Leu
35 40 45
Thr Arg Tyr Val Pro Gly Asp Arg Ser Gly Arg Pro Pro Ala Met Pro
50 55 60
Ala Ala Ala Glu Thr Ser Arg Arg Pro Thr Thr Ser Ala Arg Pro Leu
65 70 75 80
Pro Tyr Gly Gly Ser Gly Ser Ala Ala Arg Met Asn Glu Ala Ala Gly
85 90 95
His Pro Leu Arg Met Pro Gln Leu Pro Gln Leu Ser Asp Ile Glu Arg
100 105 110
Ala Arg Phe His Ser Val Thr Thr Asp Ser Gln His Leu Arg Pro Val
115 120 125
Arg Pro Arg Met Pro Pro Pro Val Gly Ala Ser Pro Leu Arg Arg Ser
130 135 140
Thr Ala Leu Arg Pro Tyr His Asp Val Leu Ser Gln Trp Gln Arg His
145 150 155 160
Tyr Asn Ala Asp Arg Asn Arg Trp His Ser Ala Trp Arg Gln Ala Asn
165 170 175
Ser Asn Asn Pro Gln Ile Glu Thr Arg Thr Gly Arg Ala Leu Lys Ala
180 185 190
Thr Ala Asp Leu Leu Glu Asp Ala Thr Gln Pro Gly Arg Val Ala Leu
195 200 205
Glu Leu Arg Ser Val Pro Leu Pro Gln Phe Pro Asp Gln Ala Phe Arg
210 215 220
Leu Ser His Leu Gln His Met Thr Ile Asp Ala Ala Gly Leu Met Glu
225 230 235 240
Leu Pro Asp Thr Met Gln Gln Phe Ala Gly Leu Glu Thr Leu Thr Leu
245 250 255
Ala Arg Asn Pro Leu Arg Ala Leu Pro Ala Ser Ile Ala Ser Leu Asn
260 265 270
Arg Leu Arg Glu Leu Ser Ile Arg Ala Cys Pro Glu Leu Thr Glu Leu
275 280 285
Pro Glu Pro Leu Ala Ser Thr Asp Ala Ser Gly Glu His Gln Gly Leu
290 295 300
Val Asn Leu Gln Ser Leu Arg Leu Glu Trp Thr Gly Ile Arg Ser Leu
305 310 315 320
Pro Ala Ser Ile Ala Asn Leu Gln Asn Leu Lys Ser Leu Lys Ile Arg
325 330 335
Asn Ser Pro Leu Ser Ala Leu Gly Pro Ala Ile His His Leu Pro Lys
340 345 350
Leu Glu Glu Leu Asp Leu Arg Gly Cys Thr Ala Leu Arg Asn Tyr Pro
355 360 365
Pro Ile Phe Gly Gly Arg Ala Pro Leu Lys Arg Leu Ile Leu Lys Asp
370 375 380
Cys Ser Asn Leu Leu Thr Leu Pro Leu Asp Ile His Arg Leu Thr Gln
385 390 395 400
Leu Glu Lys Leu Asp Leu Arg Gly Cys Val Asn Leu Ser Arg Leu Pro
405 410 415
Ser Leu Ile Ala Gln Leu Pro Ala Asn Cys Ile Ile Leu Val Pro Pro
420 425 430
His Leu Gln Ala Gln Leu Asp Gln His Arg Pro Val Ala Arg Pro Ala
435 440 445
Glu Pro Gly Arg Thr Gly Pro Thr Thr Pro Ala Leu Ser Pro Ser Ala
450 455 460
Ala Gly Asp Arg Ala Gly Pro Ser Ser Ser Ala Thr Ala Ser Glu Leu
465 470 475 480
Leu Leu Thr Ala Ala Leu Glu Arg Ile Glu Asp Thr Ala Gln Ala Met
485 490 495
Leu Ser Thr Val Ile Asp Glu Glu Arg Asn Pro Phe Leu Glu Gly Ala
500 505 510
Pro Ser Tyr Leu Pro Gly Lys Arg Pro Thr Asp Val Thr Thr Phe Gly
515 520 525
Gln Val Pro Ala Leu Arg Asp Met Leu Ala Glu Ser Arg Asp Leu Glu
530 535 540
Phe Leu Gln Arg Val Ser Asp Met Ala Gly Pro Ser Pro Arg Ile Glu
545 550 555 560
Asp Pro Ser Glu Glu Gly Leu Ala Arg His Tyr Thr Asn Val Ser Asn
565 570 575
Trp Lys Ala Gln Lys Ser Ala His Leu Gly Ile Val Asp His Leu Gly
580 585 590
Gln Phe Val Tyr His Glu Gly Ser Pro Leu Asp Val Ala Thr Leu Ala
595 600 605
Lys Ala Val Gln Met Trp Lys Thr Arg Glu Leu Ile Val His Ala His
610 615 620
Pro Gln Asp Arg Ala Arg Phe Pro Glu Leu Ala Val His Ile Pro Glu
625 630 635 640
Gln Val Ser Asp Asp Ser Asp Ser Glu Gln Gln Thr Ser Pro Glu Pro
645 650 655
Ser Gly His Gln
660
<210> 38
<211> 1983
<212> DNA
<213> Artificial
<220>
<223> XopL unconventional motif from Xanthomonas campestris
<400> 38
atgcgacgcg tcgatcaacc acgcccgccg ggcacgcctt tcggactgcg ggagcagact 60
acgtccaatg cggatgcgcc cgcgcgcact gccccacccg cacaccccgc gcccgagcgc 120
cctaccggca tgctcggcgg actgaccaga tatgtgcctg gcgatcggtc cgggcgaccg 180
ccagcaatgc ctgccgctgc cgagacctct cgccggccaa ccacctccgc ccgcccgctt 240
ccctacggcg gatccggcag cgccgcgcgg atgaacgagg cggctggaca tcctttgcgg 300
atgccgcaat tgccacagct cagcgacata gaacgcgctc gcttccactc cgtcaccacc 360
gactcgcaac acttgcggcc ggtgcgcccc cgtatgccac cgcccgtggg cgcttcaccc 420
ttacggcgct ccacagcgct gcgcccgtac cacgacgtgc tgtcgcaatg gcaacgccac 480
tacaacgcag atcgcaatcg ctggcacagc gcatggcgcc aggccaacag caacaacccg 540
cagatcgaga ctcgcacagg ccgggcgctg aaggcgacag ccgacctgct ggaggacgca 600
acccaaccgg gccgggtcgc gctggagctg cgctcagttc cgctgccgca atttcccgac 660
caggcattcc gtctttcgca tctgcagcac atgacgatcg acgcggcagg gttgatggag 720
ctcccggaca ccatgcagca atttgcgggc ctggaaacac tcacgctcgc acgcaatccg 780
cttcgcgcgc taccggcatc catcgcaagc ctcaaccgat tacgcgagct ctccatccgc 840
gcctgcccgg aattgacgga acttcccgaa cccctggcaa gcaccgatgc atccggcgag 900
caccagggct tggtcaacct gcagagccta cggctggaat ggaccgggat cagatcgctt 960
ccggcgtcca tcgccaacct gcaaaatctg aaaagcctga agatacgcaa ctcgccgctg 1020
tccgcccttg gcccggccat ccatcacctg ccaaagttgg aggagcttga tttgcggggc 1080
tgtaccgcgc tgcgcaacta tccgccgatt ttcggcggcc gtgcgccact gaagcgactg 1140
attctgaaag actgcagcaa cctgctcacg ctgccactgg acattcaccg cctgacgcag 1200
ctggaaaaac tcgatctgcg aggttgcgtc aacctttcca gactgccctc gttgatcgcc 1260
caattacctg ccaattgcat catcctggtg ccgccgcatc tccaagcgca gctcgaccag 1320
catcgtccag ttgcgcgccc cgccgaacca gggcggaccg gaccgaccac cccagctctc 1380
tcgccctctg ctgccggcga ccgcgccggg ccatcctctt cggcgaccgc cagcgaactg 1440
cttcttaccg ctgcgctcga acgcatcgaa gacaccgcac aggccatgct gagcacggtc 1500
atcgatgaag aaagaaatcc ctttctggaa ggtgctccat cctatctccc aggaaaacgc 1560
cctaccgatg tcaccacctt cggccaagtt ccggcattgc gggacatgct ggcagaaagc 1620
agggatcttg agttcctgca acgggtaagc gacatggcag gcccatcccc cagaatcgaa 1680
gacccgagcg aggaaggcct cgcccgccac tacacgaacg tcagcaactg gaaggcgcag 1740
aagagcgcac acctgggcat cgtcgatcat ctcgggcagt tcgtttatca cgaaggaagc 1800
ccgctcgacg tagcgacatt ggccaaggca gtgcagatgt ggaagacccg tgagctgatc 1860
gtccacgcac acccgcaaga ccgcgcgcgc tttcccgagc tcgctgtgca cattcccgag 1920
caggtcagcg acgactctga tagcgaacag cagacaagcc cggaaccttc aggccatcag 1980
tag 1983
SEQUENCE LISTING
<110> Cornell University
Massachusetts Institute of Technology
<120> BROAD-SPECTRUM PROTEOME EDITING WITH AN ENGINEERED BACTERIAL
UBIQUITIN LIGASE MIMIC
<150> US 62/644,055
<151> 2018-03-16
<160> 38
<170> PatentIn version 3.5
<210> 1
<211> 553
<212> PRT
<213> Artificial
<220>
<223> AvrPtoB U-box motif from Pseudomonas syringae
<400> 1
Met Ala Gly Ile Asn Arg Ala Gly Pro Ser Gly Ala Tyr Phe Val Gly
1 5 10 15
His Thr Asp Pro Glu Pro Val Ser Gly Gln Ala His Gly Ser Gly Ser
20 25 30
Gly Ala Ser Ser Ser Asn Ser Pro Gln Val Gln Pro Arg Pro Ser Asn
35 40 45
Thr Pro Pro Ser Asn Ala Pro Ala Pro Pro Pro Thr Gly Arg Glu Arg
50 55 60
Leu Ser Arg Ser Thr Ala Leu Ser Arg Gln Thr Arg Glu Trp Leu Glu
65 70 75 80
Gln Gly Met Pro Thr Ala Glu Asp Ala Ser Val Arg Arg Arg Pro Gln
85 90 95
Val Thr Ala Asp Ala Ala Thr Pro Arg Ala Glu Ala Arg Arg Thr Pro
100 105 110
Glu Ala Thr Ala Asp Ala Ser Ala Pro Arg Arg Gly Ala Val Ala His
115 120 125
Ala Asn Ser Ile Val Gln Gln Leu Val Ser Glu Gly Ala Asp Ile Ser
130 135 140
His Thr Arg Asn Met Leu Arg Asn Ala Met Asn Gly Asp Ala Val Ala
145 150 155 160
Phe Ser Arg Val Glu Gln Asn Ile Phe Arg Gln His Phe Pro Asn Met
165 170 175
Pro Met His Gly Ile Ser Arg Asp Ser Glu Leu Ala Ile Glu Leu Arg
180 185 190
Gly Ala Leu Arg Arg Ala Val His Gln Gln Ala Ala Ser Ala Pro Val
195 200 205
Arg Ser Pro Thr Pro Thr Pro Ala Ser Pro Ala Ala Ser Ser Ser Gly
210 215 220
Ser Ser Gln Arg Ser Leu Phe Gly Arg Phe Ala Arg Leu Met Ala Pro
225 230 235 240
Asn Gln Gly Arg Ser Ser Asn Thr Ala Ala Ser Gln Thr Pro Val Asp
245 250 255
Arg Ser Pro Pro Arg Val Asn Gln Arg Pro Ile Arg Val Asp Arg Ala
260 265 270
Ala Met Arg Asn Arg Gly Asn Asp Glu Ala Asp Ala Ala Leu Arg Gly
275 280 285
Leu Val Gln Gln Gly Val Asn Leu Glu His Leu Arg Thr Ala Leu Glu
290 295 300
Arg His Val Met Gln Arg Leu Pro Ile Pro Leu Asp Ile Gly Ser Ala
305 310 315 320
Leu Gln Asn Val Gly Ile Asn Pro Ser Ile Asp Leu Gly Glu Ser Leu
325 330 335
Val Gln His Pro Leu Leu Asn Leu Asn Val Ala Leu Asn Arg Met Leu
340 345 350
Gly Leu Arg Pro Ser Ala Glu Arg Ala Pro Arg Pro Ala Val Pro Val
355 360 365
Ala Pro Ala Thr Ala Ser Arg Arg Pro Asp Gly Thr Arg Ala Thr Arg
370 375 380
Leu Arg Val Met Pro Glu Arg Glu Asp Tyr Glu Asn Asn Val Ala Tyr
385 390 395 400
Gly Val Arg Leu Leu Asn Leu Asn Pro Gly Val Gly Val Arg Gln Ala
405 410 415
Val Ala Ala Phe Val Thr Asp Arg Ala Glu Arg Pro Ala Val Val Ala
420 425 430
Asn Ile Arg Ala Ala Leu Asp Pro Ile Ala Ser Gln Phe Ser Gln Leu
435 440 445
Arg Thr Ile Ser Lys Ala Asp Ala Glu Ser Glu Glu Leu Gly Phe Lys
450 455 460
Asp Ala Ala Asp His His Thr Asp Asp Val Thr His Cys Leu Phe Gly
465 470 475 480
Gly Glu Leu Ser Leu Ser Asn Pro Asp Gln Gln Val Ile Gly Leu Ala
485 490 495
Gly Asn Pro Thr Asp Thr Ser Gln Pro Tyr Ser Gln Glu Gly Asn Lys
500 505 510
Asp Leu Ala Phe Met Asp Met Lys Lys Leu Ala Gln Phe Leu Ala Gly
515 520 525
Lys Pro Glu His Pro Met Thr Arg Glu Thr Leu Asn Ala Glu Asn Ile
530 535 540
Ala Lys Tyr Ala Phe Arg Ile Val Pro
545 550
<210> 2
<211> 1659
<212> DNA
<213> Artificial
<220>
<223> AvrPtoB U-box motif from Pseudomonas syringae
<400> 2
atggcgggta tcaatagagc gggaccatcg ggcgcttatt ttgttggcca cacagacccc 60
gagccagtat cggggcaagc acacggatcc ggcagcggcg ccagctcctc gaacagtccg 120
caggttcagc cgcgaccctc gaatactccc ccgtcgaacg cgcccgcacc gccgccaacc 180
ggacgtgaga ggctttcacg atccacggcg ctgtcgcgcc aaaccaggga gtggctggag 240
cagggtatgc ctacagcgga ggatgccagc gtgcgtcgta ggccacaggt gactgccgat 300
gccgcaacgc cgcgtgcaga ggcaagacgc acgccggagg caactgccga tgccagcgca 360
ccgcgtagag gggcggttgc acacgccaac agtatcgttc agcaattggt cagtgagggc 420
gctgatattt cgcatactcg taacatgctc cgcaatgcaa tgaatggcga cgcagtcgct 480
ttttctcgag tagaacagaa catatttcgc cagcatttcc cgaacatgcc catgcatgga 540
atcagccgag attcggaact cgctatcgag ctccgtgggg cgcttcgtcg agcggttcac 600
caacaggcgg cgtcagcgcc agtgaggtcg cccacgccaa caccggccag ccctgcggca 660
tcatcatcgg gcagcagtca gcgttcttta tttggacggt ttgcccgttt gatggcgcca 720
aaccagggac ggtcgtcgaa cactgccgcc tctcagacgc cggtcgacag gagcccgcca 780
cgcgtcaacc aaagacccat acgcgtcgac agggctgcga tgcgtaatcg tggcaatgac 840
gaggcggacg ccgcgctgcg ggggttagta caacaggggg tcaatttaga gcacctgcgc 900
acggcccttg aaagacatgt aatgcagcgc ctccctatcc ccctcgatat aggcagcgcg 960
ttgcagaatg tgggaattaa cccaagtatc gacttggggg aaagccttgt gcaacatccc 1020
ctgctgaatt tgaatgtagc gttgaatcgc atgctggggc tgcgtcccag cgctgaaaga 1080
gcgcctcgtc cagccgtccc cgtggctccc gcgaccgcct ccaggcgacc ggatggtacg 1140
cgtgcaacac gattgcgggt gatgccggag cgggaggatt acgaaaataa tgtggcttat 1200
ggagtgcgct tgcttaacct gaacccgggg gtgggggtaa ggcaggctgt tgcggccttt 1260
gtaaccgacc gggctgagcg gccagcagtg gtggctaata tccgggcagc cctggaccct 1320
atcgcgtcac aattcagtca gctgcgcaca atttcgaagg ccgatgctga atctgaagag 1380
ctgggtttta aggatgcggc agatcatcac acggatgacg tgacgcactg tctttttggc 1440
ggagaattgt cgctgagtaa tccggatcag caggtgatcg gtttggcggg taatccgacg 1500
gacacgtcgc agccttacag ccaagaggga aataaggacc tggcgttcat ggatatgaaa 1560
aaacttgccc aattcctcgc aggcaagcct gagcatccga tgaccagaga aacgcttaac 1620
gccgaaaata tcgccaagta tgcttttaga atagtcccc 1659
<210> 3
<211> 587
<212> PRT
<213> Artificial
<220>
<223> IpaH0722 novel E3 ligase from Shigella flexneri
<400> 3
Met Lys Pro Ala His Asn Pro Ser Phe Phe Arg Ser Phe Cys Gly Leu
1 5 10 15
Gly Cys Ile Ser Arg Leu Ser Val Glu Glu Gln Asn Ile Thr Asp Tyr
20 25 30
His Arg Ile Trp Asp Asn Trp Ala Lys Glu Gly Ala Ala Thr Glu Asp
35 40 45
Arg Thr Gln Ala Val Arg Leu Leu Lys Ile Cys Leu Ala Phe Gln Glu
50 55 60
Pro Ala Leu Asn Leu Ser Leu Leu Arg Leu Arg Ser Leu Pro Tyr Leu
65 70 75 80
Pro Pro His Ile Gln Glu Leu Asn Ile Ser Ser Asn Glu Leu Arg Ser
85 90 95
Leu Pro Glu Leu Pro Pro Ser Leu Thr Val Leu Lys Ala Ser Asp Asn
100 105 110
Arg Leu Ser Arg Leu Pro Ala Leu Pro Pro His Leu Val Ala Leu Asp
115 120 125
Val Ser Leu Asn Arg Val Leu Thr Cys Leu Pro Ser Leu Pro Ser Ser
130 135 140
Leu Gln Ser Leu Ser Ala Leu Leu Asn Ser Leu Glu Thr Leu Pro Asp
145 150 155 160
Leu Pro Pro Ala Leu Gln Lys Leu Ser Val Gly Asn Asn Gln Leu Thr
165 170 175
Ala Leu Pro Glu Leu Pro Cys Glu Leu Gln Glu Leu Ser Ala Phe Asp
180 185 190
Asn Arg Leu Gln Glu Leu Pro Pro Leu Pro Gln Asn Leu Arg Leu Leu
195 200 205
Asn Val Gly Glu Asn Gln Leu His Arg Leu Pro Glu Leu Pro Gln Arg
210 215 220
Leu Gln Ser Leu Tyr Ile Pro Asn Asn Gln Leu Asn Thr Leu Pro Asp
225 230 235 240
Ser Ile Met Asn Leu His Ile Tyr Ala Asp Val Asn Ile Tyr Asn Asn
245 250 255
Pro Leu Ser Thr Arg Thr Leu Gln Ala Leu Gln Arg Leu Thr Ser Ser
260 265 270
Pro Asp Tyr His Gly Pro Arg Ile Tyr Phe Ser Met Ser Asp Gly Gln
275 280 285
Gln Asn Thr Leu His Arg Pro Leu Ala Asp Ala Val Thr Ala Trp Phe
290 295 300
Pro Glu Asn Lys Gln Ser Asp Val Ser Gln Ile Trp His Ala Phe Glu
305 310 315 320
His Glu Glu His Ala Asn Thr Phe Ser Ala Phe Leu Asp Arg Leu Ser
325 330 335
Asp Thr Val Ser Ala Arg Asn Thr Ser Gly Phe Arg Glu Gln Val Ala
340 345 350
Ala Trp Leu Glu Lys Leu Ser Ala Ser Ala Glu Leu Arg Gln Gln Ser
355 360 365
Phe Ala Val Ala Ala Asp Ala Thr Glu Ser Cys Glu Asp Arg Val Ala
370 375 380
Leu Thr Trp Asn Asn Leu Arg Lys Thr Leu Leu Val His Gln Ala Ser
385 390 395 400
Glu Gly Leu Phe Asp Asn Asp Thr Gly Ala Leu Leu Ser Leu Gly Arg
405 410 415
Glu Met Phe Arg Leu Glu Ile Leu Glu Asp Ile Ala Arg Asp Lys Val
420 425 430
Arg Thr Leu His Phe Val Asp Glu Ile Glu Val Tyr Leu Ala Phe Gln
435 440 445
Thr Met Leu Ala Glu Lys Leu Gln Leu Ser Thr Ala Val Lys Glu Met
450 455 460
Arg Phe Tyr Gly Val Ser Gly Val Thr Ala Asn Asp Leu Arg Thr Ala
465 470 475 480
Glu Ala Met Val Arg Ser Arg Glu Glu Asn Glu Phe Thr Asp Trp Phe
485 490 495
Ser Leu Trp Gly Pro Trp His Ala Val Leu Lys Arg Thr Glu Ala Asp
500 505 510
Arg Trp Ala Leu Ala Glu Glu Gln Lys Tyr Glu Met Leu Glu Asn Glu
515 520 525
Tyr Pro Gln Arg Val Ala Asp Arg Leu Lys Ala Ser Gly Leu Ser Gly
530 535 540
Asp Ala Asp Ala Glu Arg Glu Ala Gly Ala Gln Val Met Arg Glu Thr
545 550 555 560
Glu Gln Gln Ile Tyr Arg Gln Leu Thr Asp Glu Val Leu Ala Leu Arg
565 570 575
Leu Pro Glu Asn Gly Ser Gln Leu His His Ser
580 585
<210> 4
<211> 1764
<212> DNA
<213> Artificial
<220>
<223> IpaH0722 novel E3 ligase from Shigella flexneri
<400> 4
atgaaacctg cccacaatcc ttcttttttc cgctcctttt gtggtttagg atgtatatcc 60
cgtttatccg tagaagagca aaatatcacg gattatcacc gcatctggga taactgggcc 120
aaggaaggtg ctgcaacaga agaccgaaca caggcagttc gattactgaa aatatgtctg 180
gcttttcaag agccagccct caatttaagt ttactcagat tacgctctct cccatacctg 240
cccccgcaca tacaagaact taacatctct agcaatgagc tacgctctct gccagaactc 300
cctccgtcct taactgtact taaagccagc gataacagac tgagcaggct cccggctctt 360
ccgcctcacc tggtcgctct tgatgtttca cttaacagag ttttaacatg tttgccttct 420
cttccatctt ccttgcagtc actctcagcc cttctcaata gcctggagac gctacctgat 480
cttcccccgg ctctacaaaa actttctgtt ggcaacaacc agcttactgc cttaccagaa 540
ttaccatgtg aactacagga actaagtgct tttgataaca gattacaaga gctaccgccc 600
cttcctcaaa atctgaggct tttaaacgtt ggggaaaacc aactacacag actgcccgaa 660
cttccacaac gtctgcaatc actatatatc cctaacaatc agctgaacac attgccagac 720
agtatcatga atctgcacat ttatgcagat gttaatattt ataacaatcc attgtcgact 780
cgcactctgc aagccctgca aagattaacc tcttcgccgg actaccacgg cccacggatt 840
tacttctcca tgagtgacgg acaacagaat acactccatc gccccctggc tgatgccgtg 900
acagcatggt tcccggaaaa caaacaatct gatgtatcac agatatggca tgcttttgaa 960
catgaagagc atgccaacac cttttccgcg ttccttgacc gcctttccga taccgtctct 1020
gcacgcaata cctccggatt ccgtgaacag gtcgctgcat ggctggaaaa actcagtgcc 1080
tctgcggagc ttcgacagca gtctttcgct gttgctgctg atgccactga gagctgtgag 1140
gaccgtgtcg cgctcacatg gaacaatctc cggaaaaccc tcctggtcca tcaggcatca 1200
gaaggccttt tcgataatga taccggcgct ctgctctccc tgggcaggga aatgttccgc 1260
ctcgaaattc tggaggacat tgcccgggat aaagtcagaa ctctccattt tgtggatgag 1320
atagaagtct acctggcctt ccagaccatg ctcgcagaga aacttcagct ctctactgcc 1380
gtgaaggaaa tgcgtttcta tggcgtgtcg ggagtgacag caaatgacct ccgcactgcc 1440
gaagccatgg tcagaagccg tgaagagaat gaatttacgg actggttctc cctctgggga 1500
ccatggcatg ctgtactgaa gcgtacggaa gctgaccgct gggcgctggc agaagagcag 1560
aaatatgaga tgctggagaa tgagtaccct cagagggtgg ctgaccggct gaaagcatca 1620
ggtctgagcg gtgatgcgga tgcggagagg gaagccggtg cacaggtgat gcgtgagact 1680
gaacagcaga tttaccgtca gctgactgac gaggtactgg ccctgcgatt gcctgaaaac 1740
ggctcacaac tgcaccattc ataa 1764
<210> 5
<211> 575
<212> PRT
<213> Artificial
<220>
<223> IpaH1.4 novel E3 ligase from Shigella flexneri
<400> 5
Met Ile Lys Ser Thr Asn Ile Gln Ala Ile Gly Ser Gly Ile Met His
1 5 10 15
Gln Ile Asn Asn Ile Tyr Ser Leu Thr Pro Phe Pro Leu Pro Met Glu
20 25 30
Leu Thr Pro Ser Cys Asn Glu Phe Tyr Leu Lys Ala Trp Ser Glu Trp
35 40 45
Glu Lys Asn Gly Thr Pro Gly Glu Gln Arg Asn Ile Ala Phe Asn Arg
50 55 60
Leu Lys Ile Cys Leu Gln Asn Gln Glu Ala Glu Leu Asn Leu Ser Glu
65 70 75 80
Leu Asp Leu Lys Thr Leu Pro Asp Leu Pro Pro Gln Ile Thr Thr Leu
85 90 95
Glu Ile Arg Lys Asn Leu Leu Thr His Leu Pro Asp Leu Pro Pro Met
100 105 110
Leu Lys Val Ile His Ala Gln Phe Asn Gln Leu Glu Ser Leu Pro Ala
115 120 125
Leu Pro Glu Thr Leu Glu Glu Leu Asn Ala Gly Asp Asn Lys Ile Lys
130 135 140
Glu Leu Pro Phe Leu Pro Glu Asn Leu Thr His Leu Arg Val His Asn
145 150 155 160
Asn Arg Leu His Ile Leu Pro Leu Leu Pro Pro Glu Leu Lys Leu Leu
165 170 175
Val Val Ser Gly Asn Arg Leu Asp Ser Ile Pro Pro Phe Pro Asp Lys
180 185 190
Leu Glu Gly Leu Ala Met Ala Asn Asn Phe Ile Glu Gln Leu Pro Glu
195 200 205
Leu Pro Phe Ser Met Asn Arg Ala Val Leu Met Asn Asn Asn Leu Thr
210 215 220
Thr Leu Pro Glu Ser Val Leu Arg Leu Ala Gln Asn Ala Phe Val Asn
225 230 235 240
Val Ala Gly Asn Pro Leu Ser Gly His Thr Met Arg Thr Leu Gln Gln
245 250 255
Ile Thr Thr Gly Pro Asp Tyr Ser Gly Pro Arg Ile Phe Phe Ser Met
260 265 270
Gly Asn Ser Ala Thr Ile Ser Ala Pro Glu His Ser Leu Ala Asp Ala
275 280 285
Val Thr Ala Trp Phe Pro Glu Asn Lys Gln Ser Asp Val Ser Gln Ile
290 295 300
Trp His Ala Phe Glu His Glu Glu His Ala Asn Thr Phe Ser Ala Phe
305 310 315 320
Leu Asp Arg Leu Ser Asp Thr Val Ser Ala Arg Asn Thr Ser Gly Phe
325 330 335
Arg Glu Gln Val Ala Ala Trp Leu Glu Lys Leu Ser Ala Ser Ala Glu
340 345 350
Leu Arg Gln Gln Ser Phe Ala Val Ala Ala Asp Ala Thr Glu Ser Cys
355 360 365
Glu Asp Arg Val Ala Leu Thr Trp Asn Asn Leu Arg Lys Thr Leu Leu
370 375 380
Val His Gln Ala Ser Glu Gly Leu Phe Asp Asn Asp Thr Gly Ala Leu
385 390 395 400
Leu Ser Leu Gly Arg Glu Met Phe Arg Leu Glu Ile Leu Glu Asp Ile
405 410 415
Ala Arg Asp Lys Val Arg Thr Leu His Phe Val Asp Glu Ile Glu Val
420 425 430
Tyr Leu Ala Phe Gln Thr Met Leu Ala Glu Lys Leu Gln Leu Ser Thr
435 440 445
Ala Val Lys Glu Met Arg Phe Tyr Gly Val Ser Gly Val Thr Ala Asn
450 455 460
Asp Leu Arg Thr Ala Glu Ala Met Val Arg Ser Arg Glu Glu Asn Glu
465 470 475 480
Phe Lys Asp Trp Phe Ser Leu Trp Gly Pro Trp His Ala Val Leu Lys
485 490 495
Arg Thr Glu Ala Asp Arg Trp Ala Gln Ala Glu Glu Gln Lys Tyr Glu
500 505 510
Met Leu Glu Asn Glu Tyr Ser Gln Arg Val Ala Asp Arg Leu Lys Ala
515 520 525
Ser Gly Leu Ser Gly Asp Thr Asp Ala Glu Arg Glu Ala Gly Ala Gln
530 535 540
Val Met Arg Glu Thr Glu Gln Gln Ile Tyr Arg Gln Leu Thr Asp Glu
545 550 555 560
Val Leu Ala Leu Arg Leu Ser Glu Asn Gly Ser Asn His Ile Ala
565 570 575
<210> 6
<211> 1728
<212> DNA
<213> Artificial
<220>
<223> IpaH1.4 novel E3 ligase from Shigella flexneri
<400> 6
atgattaaat caaccaatat acaggcaatc ggttctggta ttatgcatca aataaacaat 60
atatactcgt taactccatt tcctttacct atggaactga ctccatcttg taatgaattt 120
tatttaaaag cctggagtga atgggaaaag aacggtaccc caggcgagca acgcaatatc 180
gccttcaata ggctgaaaat atgtttacaa aatcaagagg cagaattaaa tttatctgag 240
ttagatttaa aaacattacc agatttaccg cctcagataa caacactgga aataagaaaa 300
aacctattaa cacatctccc tgatttacca ccaatgctta aggtaataca tgctcaattt 360
aatcaactgg aaagcttacc tgccttaccc gagacgttag aagagcttaa tgcgggtgat 420
aacaagataa aagaattacc atttcttcct gaaaatctaa ctcatttacg ggttcataat 480
aaccgattgc atattctgcc actattgcca ccggaactaa aattactggt agtttctgga 540
aacagattag acagcattcc cccctttcca gataagcttg aagggctggc tatggctaat 600
aattttatag aacaactacc ggaattacct tttagtatga acagggctgt gctaatgaat 660
aataatctga caacacttcc ggaaagtgtc ctgagattag ctcagaatgc cttcgtaaat 720
gttgcaggta atccactgtc tggccatacc atgcgtacac tacaacaaat aaccaccgga 780
ccagattatt ctggtcctcg aatatttttc tctatgggaa attctgccac aatttccgct 840
ccagaacact ccctggctga tgccgtgaca gcatggttcc cggaaaacaa acaatctgat 900
gtatcacaga tatggcatgc ttttgaacat gaagagcacg ccaacacctt ttccgcgttc 960
cttgaccgcc tttccgatac cgtctctgca cgcaatacct ccggattccg tgaacaggtc 1020
gctgcatggc tggaaaaact cagtgcctct gcggagcttc gacagcagtc tttcgctgtt 1080
gctgctgatg ccactgagag ctgtgaggac cgtgtcgcgc tcacatggaa caatctccgg 1140
aaaaccctcc tggtccatca ggcatcagaa ggccttttcg ataatgatac cggcgctctg 1200
ctctccctgg gcagggaaat gttccgcctc gaaattctgg aggacattgc ccgggataaa 1260
gtcagaactc tccattttgt ggatgagata gaagtctacc tggccttcca gaccatgctc 1320
gcagagaaac ttcagctctc cactgccgtg aaggaaatgc gtttctatgg cgtgtcggga 1380
gtgacagcaa atgacctccg cactgccgaa gccatggtca gaagccgtga agagaatgaa 1440
tttaaggact ggttctccct ctggggacca tggcatgctg tactgaagcg tacggaagct 1500
gaccgctggg cgcaggcaga agagcagaag tatgagatgc tggagaatga gtactctcag 1560
agggtggctg accggctgaa agcatcaggt ctgagcggtg atacggatgc ggagagggaa 1620
gccggtgcac aggtgatgcg tgagactgaa cagcagattt accgtcagtt gactgacgag 1680
gtactggccc tgcgattgtc tgaaaacggc tcaaatcata tcgcataa 1728
<210> 7
<211> 571
<212> PRT
<213> Artificial
<220>
<223> IpaH2.5 novel E3 ligase from Shigella flexneri
<400> 7
Met Leu Ile Arg Ile Leu Val Ile Met Ile Lys Ser Thr Asn Ile Gln
1 5 10 15
Ala Ile Gly Ser Gly Ile Met His Gln Ile Asn Asn Val Tyr Ser Leu
20 25 30
Thr Pro Leu Ser Leu Pro Met Glu Leu Thr Pro Ser Cys Asn Glu Phe
35 40 45
Tyr Leu Lys Thr Trp Ser Glu Trp Glu Lys Asn Gly Thr Pro Gly Glu
50 55 60
Gln Arg Asn Ile Ala Phe Asn Arg Leu Lys Ile Cys Leu Gln Asn Gln
65 70 75 80
Glu Ala Glu Leu Asn Leu Ser Glu Leu Asp Leu Lys Thr Leu Pro Asp
85 90 95
Leu Pro Pro Gln Ile Thr Thr Leu Glu Ile Arg Lys Asn Leu Leu Thr
100 105 110
His Leu Pro Asp Leu Pro Pro Met Leu Lys Val Ile His Ala Gln Phe
115 120 125
Asn Gln Leu Glu Ser Leu Pro Ala Leu Pro Glu Thr Leu Glu Glu Leu
130 135 140
Asn Ala Gly Asp Asn Lys Ile Lys Glu Leu Pro Phe Leu Pro Glu Asn
145 150 155 160
Leu Thr His Leu Arg Val His Asn Asn Arg Leu His Ile Leu Pro Leu
165 170 175
Leu Pro Pro Glu Leu Lys Leu Leu Val Val Ser Gly Asn Arg Leu Asp
180 185 190
Ser Ile Pro Pro Phe Pro Asp Lys Leu Glu Gly Leu Ala Leu Ala Asn
195 200 205
Asn Phe Ile Glu Gln Leu Pro Glu Leu Pro Phe Ser Met Asn Arg Ala
210 215 220
Val Leu Met Asn Asn Asn Leu Thr Thr Leu Pro Glu Ser Val Leu Arg
225 230 235 240
Leu Ala Gln Asn Ala Phe Val Asn Val Ala Gly Asn Pro Leu Ser Gly
245 250 255
His Thr Met Arg Thr Leu Gln Gln Ile Thr Thr Gly Pro Asp Tyr Ser
260 265 270
Gly Pro Arg Ile Phe Phe Ser Met Gly Asn Ser Ala Thr Ile Ser Ala
275 280 285
Pro Glu His Ser Leu Ala Asp Ala Val Thr Ala Trp Phe Pro Glu Asn
290 295 300
Lys Gln Ser Asp Val Ser Gln Ile Trp His Ala Phe Glu His Glu Glu
305 310 315 320
His Ala Asn Thr Phe Ser Ala Phe Leu Asp Arg Leu Ser Asp Thr Val
325 330 335
Ser Ala Arg Asn Thr Ser Gly Phe Arg Glu Gln Val Ala Ala Trp Leu
340 345 350
Glu Lys Leu Ser Ala Ser Ala Glu Leu Arg Gln Gln Ser Phe Ala Val
355 360 365
Ala Ala Asp Ala Thr Glu Ser Cys Glu Asp Arg Val Ala Leu Thr Trp
370 375 380
Asn Asn Leu Arg Lys Thr Leu Leu Val His Gln Ala Ser Glu Gly Leu
385 390 395 400
Phe Asp Asn Asp Thr Gly Ala Leu Leu Ser Leu Gly Arg Glu Met Phe
405 410 415
Arg Leu Glu Ile Leu Glu Asp Ile Ala Arg Asp Lys Val Arg Thr Leu
420 425 430
His Phe Val Asp Glu Ile Glu Val Tyr Leu Ala Phe Gln Thr Met Leu
435 440 445
Ala Glu Lys Leu Gln Leu Ser Thr Ala Val Lys Glu Met Arg Phe Tyr
450 455 460
Gly Val Ser Gly Val Thr Ala Asn Asp Leu Arg Thr Ala Glu Ala Met
465 470 475 480
Val Arg Ser Arg Glu Glu Asn Glu Phe Thr Asp Trp Phe Ser Leu Trp
485 490 495
Gly Pro Trp His Ala Val Leu Lys Arg Thr Glu Ala Asp Arg Trp Ala
500 505 510
Gln Ala Glu Glu Gln Lys Tyr Glu Met Leu Glu Asn Glu Tyr Ser Gln
515 520 525
Arg Val Ala Asp Arg Leu Lys Ala Ser Gly Leu Ser Gly Asp Ala Asp
530 535 540
Ala Glu Arg Glu Ala Gly Ala Gln Val Met Arg Glu Thr Glu Gln Gln
545 550 555 560
Ile Tyr Arg Gln Leu Thr Asp Glu Val Leu Ala
565 570
<210> 8
<211> 1716
<212> DNA
<213> Artificial
<220>
<223> IpaH2.5 novel E3 ligase from Shigella flexneri
<400> 8
atgttgataa gaattctagt tataatgatt aaatcaacca atatacaggc aatcggttct 60
ggcattatgc atcaaataaa caatgtatac tcgttaactc cattatcttt acctatggaa 120
ctgactccat cttgtaatga attttattta aaaacctgga gcgaatggga aaagaacggt 180
accccaggcg agcaacgcaa tatcgccttc aataggctga aaatatgttt acaaaatcaa 240
gaggcagaat taaatttatc tgagttagat ttaaaaacat taccagattt accgcctcag 300
ataacaacac tggaaataag aaaaaaccta ttaacacatc tccctgattt accaccaatg 360
cttaaggtaa tacatgctca atttaatcaa ctggaaagct tacctgcctt acccgagacg 420
ttagaagagc ttaatgcggg tgataacaag ataaaagaat taccatttct tcctgaaaat 480
ctaactcatt tacgggttca taataaccga ttgcatattc tgccactatt gccaccggaa 540
ctaaaattac tggtagtttc tggaaacaga ttagacagca ttcccccctt tccagataag 600
cttgaagggc tggctctggc taataatttt atagaacaac taccggaatt accttttagt 660
atgaacaggg ctgtgctaat gaataataat ctgacaacac ttccggaaag tgtcctgaga 720
ttagctcaga atgccttcgt aaatgttgca ggtaatccat tgtctggcca taccatgcgt 780
acactacaac aaataaccac cggaccagat tattctggtc ctcgaatatt tttctctatg 840
ggaaattctg ccacaatttc cgctccagaa cactccctgg ctgatgccgt gacagcatgg 900
ttcccggaaa acaaacaatc tgatgtatca cagatatggc atgcttttga acatgaagag 960
catgccaaca ccttttccgc gttccttgac cgcctttccg ataccgtctc tgcacgcaat 1020
acctccggat tccgtgaaca ggtcgctgca tggctggaaa aactcagtgc ctctgcggag 1080
cttcgacagc agtctttcgc tgttgctgct gatgccactg agagctgtga ggaccgtgtc 1140
gcgctcacat ggaacaatct ccggaaaacc ctcctggtcc atcaggcatc agaaggcctt 1200
ttcgataatg ataccggcgc tctgctctcc ctgggcaggg aaatgttccg cctcgaaatt 1260
ctggaggata ttgcccggga taaagtcaga actctccatt ttgtggatga gatagaagtc 1320
tacctggcct tccagaccat gctcgcagag aaacttcagc tctctactgc cgtgaaggaa 1380
atgcgtttct atggcgtgtc gggagtgaca gcaaatgacc tccgcactgc cgaagccatg 1440
gtcagaagcc gtgaagagaa tgaatttacg gactggttct ccctctgggg accatggcat 1500
gctgtactga agcgtacgga agctgaccgc tgggcgcagg cagaagagca gaagtatgag 1560
atgctggaga atgagtactc tcagagggtg gctgaccggc tgaaagcatc aggtctgagc 1620
ggtgatgcgg atgcggagag ggaagccggt gcacaggtga tgcgtgagac tgaacagcag 1680
atttaccgtc agttgactga cgaggtactg gcctga 1716
<210> 9
<211> 574
<212> PRT
<213> Artificial
<220>
<223> IpaH4.5 novel E3 ligase from Shigella flexneri
<400> 9
Met Lys Pro Ile Asn Asn His Ser Phe Phe Arg Ser Leu Cys Gly Leu
1 5 10 15
Ser Cys Ile Ser Arg Leu Ser Val Glu Glu Gln Cys Thr Arg Asp Tyr
20 25 30
His Arg Ile Trp Asp Asp Trp Ala Arg Glu Gly Thr Thr Thr Glu Asn
35 40 45
Arg Ile Gln Ala Val Arg Leu Leu Lys Ile Cys Leu Asp Thr Arg Glu
50 55 60
Pro Val Leu Asn Leu Ser Leu Leu Lys Leu Arg Ser Leu Pro Pro Leu
65 70 75 80
Pro Leu His Ile Arg Glu Leu Asn Ile Ser Asn Asn Glu Leu Ile Ser
85 90 95
Leu Pro Glu Asn Ser Pro Leu Leu Thr Glu Leu His Val Asn Gly Asn
100 105 110
Asn Leu Asn Ile Leu Pro Thr Leu Pro Ser Gln Leu Ile Lys Leu Asn
115 120 125
Ile Ser Phe Asn Arg Asn Leu Ser Cys Leu Pro Ser Leu Pro Pro Tyr
130 135 140
Leu Gln Ser Leu Ser Ala Arg Phe Asn Ser Leu Glu Thr Leu Pro Glu
145 150 155 160
Leu Pro Ser Thr Leu Thr Ile Leu Arg Ile Glu Gly Asn Arg Leu Thr
165 170 175
Val Leu Pro Glu Leu Pro His Arg Leu Gln Glu Leu Phe Val Ser Gly
180 185 190
Asn Arg Leu Gln Glu Leu Pro Glu Phe Pro Gln Ser Leu Lys Tyr Leu
195 200 205
Lys Val Gly Glu Asn Gln Leu Arg Arg Leu Ser Arg Leu Pro Gln Glu
210 215 220
Leu Leu Ala Leu Asp Val Ser Asn Asn Leu Leu Thr Ser Leu Pro Glu
225 230 235 240
Asn Ile Ile Thr Leu Pro Ile Cys Thr Asn Val Asn Ile Ser Gly Asn
245 250 255
Pro Leu Ser Thr Arg Val Leu Gln Ser Leu Gln Arg Leu Thr Ser Ser
260 265 270
Pro Asp Tyr His Gly Pro Gln Ile Tyr Phe Ser Met Ser Asp Gly Gln
275 280 285
Gln Asn Thr Leu His Arg Pro Leu Ala Asp Ala Val Thr Ala Trp Phe
290 295 300
Pro Glu Asn Lys Gln Ser Asp Val Ser Gln Ile Trp His Ala Phe Glu
305 310 315 320
His Glu Glu His Ala Asn Thr Phe Ser Ala Phe Leu Asp Arg Leu Ser
325 330 335
Asp Thr Val Ser Ala Arg Asn Thr Ser Gly Phe Arg Glu Gln Val Ala
340 345 350
Ala Trp Leu Glu Lys Leu Ser Ala Ser Ala Glu Leu Arg Gln Gln Ser
355 360 365
Phe Ala Val Ala Ala Asp Ala Thr Glu Ser Cys Glu Asp Arg Val Ala
370 375 380
Leu Thr Trp Asn Asn Leu Arg Lys Thr Leu Leu Val His Gln Ala Ser
385 390 395 400
Glu Gly Leu Phe Asp Asn Asp Thr Gly Ala Leu Leu Ser Leu Gly Arg
405 410 415
Glu Met Phe Arg Leu Glu Ile Leu Glu Asp Ile Ala Arg Asp Lys Val
420 425 430
Arg Thr Leu His Phe Val Asp Glu Ile Glu Val Tyr Leu Ala Phe Gln
435 440 445
Thr Met Leu Ala Glu Lys Leu Gln Leu Ser Thr Ala Val Lys Glu Met
450 455 460
Arg Phe Tyr Gly Val Ser Gly Val Thr Ala Asn Asp Leu Arg Thr Ala
465 470 475 480
Glu Ala Met Val Arg Ser Arg Glu Glu Asn Glu Phe Thr Asp Trp Phe
485 490 495
Ser Leu Trp Gly Pro Trp His Ala Val Leu Lys Arg Thr Glu Ala Asp
500 505 510
Arg Trp Ala Gln Ala Glu Glu Gln Lys Tyr Glu Met Leu Glu Asn Glu
515 520 525
Tyr Ser Gln Arg Val Ala Asp Arg Leu Lys Ala Ser Gly Leu Ser Gly
530 535 540
Asp Ala Asp Ala Gln Arg Glu Ala Gly Ala Gln Val Met Arg Glu Thr
545 550 555 560
Glu Gln Gln Ile Tyr Arg Gln Leu Thr Asp Glu Val Leu Ala
565 570
<210> 10
<211> 1725
<212> DNA
<213> Artificial
<220>
<223> IpaH4.5 novel E3 ligase from Shigella flexneri
<400> 10
atgaaaccga tcaacaatca ttcttttttt cgttcccttt gtggcttatc atgtatatct 60
cgtttatcgg tagaagaaca gtgtaccaga gattaccacc gcatctggga tgactgggct 120
agggaaggaa caacaacaga aaatcgcatc caggcggttc gattattgaa aatatgtctg 180
gatacccggg agcctgttct caatttaagc ttactgaaac tacgttcttt accaccactc 240
cctttgcata tacgtgaact taatatttcc aacaatgagt taatctccct acctgaaaat 300
tctccgcttt tgacagaact tcatgtaaat ggtaacaact tgaatatact cccgacactt 360
ccatctcaac tgattaagct taatatttca ttcaatcgaa atttgtcatg tctgccatca 420
ttaccaccat atttacaatc actctcggca cgttttaata gtctggagac gttaccagag 480
cttccatcaa cgctaacaat attacgtatt gaaggtaatc gccttactgt cttgcctgaa 540
ttgcctcata gactacaaga actctttgtt tccggcaaca gactacagga actaccagaa 600
tttcctcaga gcttaaaata tttgaaggta ggtgaaaatc aactacgcag attatccaga 660
ttaccgcaag aactattggc tctggatgtt tccaataacc tactaacttc attacccgaa 720
aatataatca cattgcccat ttgtacgaat gttaacattt cagggaatcc attgtcgact 780
cgcgttctgc aatccctgca aagattaacc tcttcgccgg actaccacgg cccgcagatt 840
tacttctcca tgagtgacgg acaacagaat acactccatc gccccctggc tgatgccgtg 900
acagcatggt tcccggaaaa caaacaatct gatgtatcac agatatggca tgcttttgaa 960
catgaagagc atgccaacac cttttccgcg ttccttgacc gcctttccga taccgtctct 1020
gcacgcaata cctccggatt ccgtgaacag gtcgctgcat ggctggaaaa actcagtgcc 1080
tctgcggagc ttcgacagca gtctttcgct gttgctgctg atgccactga gagctgtgag 1140
gaccgtgtcg cgctcacatg gaacaatctc cggaaaaccc tcctggtcca tcaggcatca 1200
gaaggccttt tcgataatga taccggcgct ctgctctccc tgggcaggga aatgttccgc 1260
ctcgaaattc tggaggacat tgcccgggat aaagtcagaa ctctccattt tgtggatgag 1320
atagaagtct acctggcctt ccagaccatg ctcgcagaga aacttcagct ctccactgcc 1380
gtgaaggaaa tgcgtttcta tggcgtgtcg ggagtgacag caaatgacct ccgcactgcc 1440
gaagctatgg tcagaagccg tgaagagaat gaatttacgg actggttctc cctctgggga 1500
ccatggcatg ctgtactgaa gcgtacggaa gctgaccgct gggcgcaggc agaagagcag 1560
aagtatgaga tgctggagaa tgagtactct cagagggtgg ctgaccggct gaaagcatca 1620
ggtctgagcg gtgatgcgga tgcgcagagg gaagccggtg cacaggtgat gcgtgagact 1680
gaacagcaga tttaccgtca gctgactgac gaggtactgg cctga 1725
<210> 11
<211> 565
<212> PRT
<213> Artificial
<220>
<223> IpaH7.8 novel E3 ligase from Shigella flexneri
<400> 11
Met Phe Ser Val Asn Asn Thr His Ser Ser Val Ser Cys Ser Pro Ser
1 5 10 15
Ile Asn Ser Asn Ser Thr Ser Asn Glu His Tyr Leu Arg Ile Leu Thr
20 25 30
Glu Trp Glu Lys Asn Ser Ser Pro Gly Glu Glu Arg Gly Ile Ala Phe
35 40 45
Asn Arg Leu Ser Gln Cys Phe Gln Asn Gln Glu Ala Val Leu Asn Leu
50 55 60
Ser Asp Leu Asn Leu Thr Ser Leu Pro Glu Leu Pro Lys His Ile Ser
65 70 75 80
Ala Leu Ile Val Glu Asn Asn Lys Leu Thr Ser Leu Pro Lys Leu Pro
85 90 95
Ala Phe Leu Lys Glu Leu Asn Ala Asp Asn Asn Arg Leu Ser Val Ile
100 105 110
Pro Glu Leu Pro Glu Ser Leu Thr Thr Leu Ser Val Arg Ser Asn Gln
115 120 125
Leu Glu Asn Leu Pro Val Leu Pro Asn His Leu Thr Ser Leu Phe Val
130 135 140
Glu Asn Asn Arg Leu Tyr Asn Leu Pro Ala Leu Pro Glu Lys Leu Lys
145 150 155 160
Phe Leu His Val Tyr Tyr Asn Arg Leu Thr Thr Leu Pro Asp Leu Pro
165 170 175
Asp Lys Leu Glu Ile Leu Cys Ala Gln Arg Asn Asn Leu Val Thr Phe
180 185 190
Pro Gln Phe Ser Asp Arg Asn Asn Ile Arg Gln Lys Glu Tyr Tyr Phe
195 200 205
His Phe Asn Gln Ile Thr Thr Leu Pro Glu Ser Phe Ser Gln Leu Asp
210 215 220
Ser Ser Tyr Arg Ile Asn Ile Ser Gly Asn Pro Leu Ser Thr Arg Val
225 230 235 240
Leu Gln Ser Leu Gln Arg Leu Thr Ser Ser Pro Asp Tyr His Gly Pro
245 250 255
Gln Ile Tyr Phe Ser Met Ser Asp Gly Gln Gln Asn Thr Leu His Arg
260 265 270
Pro Leu Ala Asp Ala Val Thr Ala Trp Phe Pro Glu Asn Lys Gln Ser
275 280 285
Asp Val Ser Gln Ile Trp His Ala Phe Glu His Glu Glu His Ala Asn
290 295 300
Thr Phe Ser Ala Phe Leu Asp Arg Leu Ser Asp Thr Val Ser Ala Arg
305 310 315 320
Asn Thr Ser Gly Phe Arg Glu Gln Val Ala Ala Trp Leu Glu Lys Leu
325 330 335
Ser Ala Ser Ala Glu Leu Arg Gln Gln Ser Phe Ala Val Ala Ala Asp
340 345 350
Ala Thr Glu Ser Cys Glu Asp Arg Val Ala Leu Thr Trp Asn Asn Leu
355 360 365
Arg Lys Thr Leu Leu Val His Gln Ala Ser Glu Gly Leu Phe Asp Asn
370 375 380
Asp Thr Gly Ala Leu Leu Ser Leu Gly Arg Glu Met Phe Arg Leu Glu
385 390 395 400
Ile Leu Glu Asp Ile Ala Arg Asp Lys Val Arg Thr Leu His Phe Val
405 410 415
Asp Glu Ile Glu Val Tyr Leu Ala Phe Gln Thr Met Leu Ala Glu Lys
420 425 430
Leu Gln Leu Ser Thr Ala Val Lys Glu Met Arg Phe Tyr Gly Val Ser
435 440 445
Gly Val Thr Ala Asn Asp Leu Arg Thr Ala Glu Ala Met Val Arg Ser
450 455 460
Arg Glu Glu Asn Glu Phe Thr Asp Trp Phe Ser Leu Trp Gly Pro Trp
465 470 475 480
His Ala Val Leu Lys Arg Thr Glu Ala Asp Arg Trp Ala Gln Ala Glu
485 490 495
Glu Gln Lys Tyr Glu Met Leu Glu Asn Glu Tyr Ser Gln Arg Val Ala
500 505 510
Asp Arg Leu Lys Ala Ser Gly Leu Ser Gly Asp Ala Asp Ala Glu Arg
515 520 525
Glu Ala Gly Ala Gln Val Met Arg Glu Thr Glu Gln Gln Ile Tyr Arg
530 535 540
Gln Leu Thr Asp Glu Val Leu Ala Leu Arg Leu Ser Glu Asn Gly Ser
545 550 555 560
Arg Leu His His Ser
565
<210> 12
<211> 1698
<212> DNA
<213> Artificial
<220>
<223> IpaH7.8 novel E3 ligase from Shigella flexneri
<400> 12
atgttctctg taaataatac acactcatca gtttcttgct ccccctctat taactcaaac 60
tcaaccagta atgaacatta tctgagaatc ctgactgaat gggaaaagaa ctcttctccc 120
ggggaagagc gaggcattgc ttttaacaga ctctcccagt gctttcagaa tcaagaagca 180
gtattaaatt tatcagacct aaatttgacg tctcttcccg aattaccaaa gcatatttct 240
gctttgattg tagaaaataa taaattaaca tcattgccaa agctgcctgc atttcttaaa 300
gaacttaatg ctgataataa caggctttct gtgataccag aacttcctga gtcattaaca 360
actttaagtg ttcgttctaa tcaactggaa aaccttcctg ttttgccaaa ccatttaaca 420
tcattatttg ttgaaaataa caggctatat aacttaccgg ctcttcccga aaaattgaaa 480
tttttacatg tttattataa caggctgaca acattacccg acttaccgga taaactggaa 540
attctctgtg ctcagcgcaa taatctggtt acttttcctc aattttctga tagaaacaat 600
atcagacaaa aggaatatta ttttcatttt aatcagataa ccactcttcc ggagagtttt 660
tcacaattag attcaagtta caggattaat atttcaggga atccattgtc gactcgcgtt 720
ctgcaatccc tgcaaagatt aacctcttcg ccggactacc acggcccaca gatttacttc 780
tccatgagtg acggacaaca gaatacactc catcgccccc tggctgatgc cgtgacagca 840
tggttcccgg aaaacaaaca atctgatgta tcacagatat ggcatgcttt tgaacatgaa 900
gagcatgcca acaccttttc cgcgttcctt gaccgccttt ccgataccgt ctctgcacgc 960
aatacctccg gattccgtga acaggtcgct gcatggctgg aaaaactcag tgcctctgcg 1020
gagcttcgac agcagtcttt cgctgttgct gctgatgcca ctgagagctg tgaggaccgt 1080
gtcgcgctca catggaacaa tctccggaaa accctcctgg tccatcaggc atcagaaggc 1140
cttttcgata atgataccgg cgctctgctc tccctgggca gggaaatgtt ccgcctcgaa 1200
attctggagg acattgcccg ggataaagtc agaactctcc attttgtgga tgagatagaa 1260
gtctacctgg ccttccagac catgctcgca gagaaacttc agctctctac tgccgtgaag 1320
gaaatgcgtt tctatggcgt gtcgggagtg acagcaaatg acctccgcac tgccgaagcc 1380
atggtcagaa gccgtgaaga gaatgaattt acggactggt tctccctctg gggaccatgg 1440
catgctgtac tgaagcgtac ggaagctgac cgctgggcgc aggcagaaga gcagaagtat 1500
gagatgctgg agaatgagta ctctcagagg gtggctgacc ggctgaaagc atcaggtctg 1560
agcggtgatg cggatgcgga gagggaagcc ggtgcacagg tgatgcgtga gactgaacag 1620
cagatttacc gtcagttgac tgacgaggta ctggccctgc gattgtctga aaacggctca 1680
cgactgcacc attcataa 1698
<210> 13
<211> 545
<212> PRT
<213> Artificial
<220>
<223> IpaH9.8 novel E3 ligase from Shigella flexneri
<400> 13
Met Leu Pro Ile Asn Asn Asn Phe Ser Leu Pro Gln Asn Ser Phe Tyr
1 5 10 15
Asn Thr Ile Ser Gly Thr Tyr Ala Asp Tyr Phe Ser Ala Trp Asp Lys
20 25 30
Trp Glu Lys Gln Ala Leu Pro Gly Glu Glu Arg Asp Glu Ala Val Ser
35 40 45
Arg Leu Lys Glu Cys Leu Ile Asn Asn Ser Asp Glu Leu Arg Leu Asp
50 55 60
Arg Leu Asn Leu Ser Ser Leu Pro Asp Asn Leu Pro Ala Gln Ile Thr
65 70 75 80
Leu Leu Asn Val Ser Tyr Asn Gln Leu Thr Asn Leu Pro Glu Leu Pro
85 90 95
Val Thr Leu Lys Lys Leu Tyr Ser Ala Ser Asn Lys Leu Ser Glu Leu
100 105 110
Pro Val Leu Pro Pro Ala Leu Glu Ser Leu Gln Val Gln His Asn Glu
115 120 125
Leu Glu Asn Leu Pro Ala Leu Pro Asp Ser Leu Leu Thr Met Asn Ile
130 135 140
Ser Tyr Asn Glu Ile Val Ser Leu Pro Ser Leu Pro Gln Ala Leu Lys
145 150 155 160
Asn Leu Arg Ala Thr Arg Asn Phe Leu Thr Glu Leu Pro Ala Phe Ser
165 170 175
Glu Gly Asn Asn Pro Val Val Arg Glu Tyr Phe Phe Asp Arg Asn Gln
180 185 190
Ile Ser His Ile Pro Glu Ser Ile Leu Asn Leu Arg Asn Glu Cys Ser
195 200 205
Ile His Ile Ser Asp Asn Pro Leu Ser Ser His Ala Leu Gln Ala Leu
210 215 220
Gln Arg Leu Thr Ser Ser Pro Asp Tyr His Gly Pro Arg Ile Tyr Phe
225 230 235 240
Ser Met Ser Asp Gly Gln Gln Asn Thr Leu His Arg Pro Leu Ala Asp
245 250 255
Ala Val Thr Ala Trp Phe Pro Glu Asn Lys Gln Ser Asp Val Ser Gln
260 265 270
Ile Trp His Ala Phe Glu His Glu Glu His Ala Asn Thr Phe Ser Ala
275 280 285
Phe Leu Asp Arg Leu Ser Asp Thr Val Ser Ala Arg Asn Thr Ser Gly
290 295 300
Phe Arg Glu Gln Val Ala Ala Trp Leu Glu Lys Leu Ser Ala Ser Ala
305 310 315 320
Glu Leu Arg Gln Gln Ser Phe Ala Val Ala Ala Asp Ala Thr Glu Ser
325 330 335
Cys Glu Asp Arg Val Ala Leu Thr Trp Asn Asn Leu Arg Lys Thr Leu
340 345 350
Leu Val His Gln Ala Ser Glu Gly Leu Phe Asp Asn Asp Thr Gly Ala
355 360 365
Leu Leu Ser Leu Gly Arg Glu Met Phe Arg Leu Glu Ile Leu Glu Asp
370 375 380
Ile Ala Arg Asp Lys Val Arg Thr Leu His Phe Val Asp Glu Ile Glu
385 390 395 400
Val Tyr Leu Ala Phe Gln Thr Met Leu Ala Glu Lys Leu Gln Leu Ser
405 410 415
Thr Ala Val Lys Glu Met Arg Phe Tyr Gly Val Ser Gly Val Thr Ala
420 425 430
Asn Asp Leu Arg Thr Ala Glu Ala Met Val Arg Ser Arg Glu Glu Asn
435 440 445
Glu Phe Thr Asp Trp Phe Ser Leu Trp Gly Pro Trp His Ala Val Leu
450 455 460
Lys Arg Thr Glu Ala Asp Arg Trp Ala Gln Ala Glu Glu Gln Lys Tyr
465 470 475 480
Glu Met Leu Glu Asn Glu Tyr Pro Gln Arg Val Ala Asp Arg Leu Lys
485 490 495
Ala Ser Gly Leu Ser Gly Asp Ala Asp Ala Glu Arg Glu Ala Gly Ala
500 505 510
Gln Val Met Arg Glu Thr Glu Gln Gln Ile Tyr Arg Gln Leu Thr Asp
515 520 525
Glu Val Leu Ala Leu Arg Leu Ser Glu Asn Gly Ser Gln Leu His His
530 535 540
Ser
545
<210> 14
<211> 1638
<212> DNA
<213> Artificial
<220>
<223> IpaH9.8 novel E3 ligase from Shigella flexneri
<400> 14
atgttaccga taaataataa cttttcattg ccccaaaatt ctttttataa cactatttcc 60
ggtacatatg ctgattactt ttcagcatgg gataaatggg aaaaacaagc gctccccggt 120
gaagagcgtg atgaggctgt ctcccgactt aaagaatgtc ttatcaataa ttccgatgaa 180
cttcgactgg accgtttaaa tctgtcctcg ctacctgaca acttaccagc tcagataacg 240
ctgctcaatg tatcatataa tcaattaact aacctacctg aactgcctgt tacgctaaaa 300
aaattatatt ccgccagcaa taaattatca gaattgcccg tgctacctcc tgcgctggag 360
tcacttcagg tacaacacaa tgagctggaa aacctgccag ctttacccga ttcgttattg 420
actatgaata tcagctataa cgaaatagtc tccttaccat cgctcccaca ggctcttaaa 480
aatctcagag cgacccgtaa tttcctcact gagctaccag cattttctga gggaaataat 540
cccgttgtca gagagtattt ttttgataga aatcagataa gtcatatccc ggaaagcatt 600
cttaatctga ggaatgaatg ttcaatacat attagtgata acccattatc atcccatgct 660
ctgcaagccc tgcaaagatt aacctcttcg ccggactacc acggcccacg gatttacttc 720
tccatgagtg acggacaaca gaatacactc catcgccccc tggctgatgc cgtgacagca 780
tggttcccgg aaaacaaaca atctgatgta tcacagatat ggcatgcttt tgaacatgaa 840
gagcatgcca acaccttttc cgcgttcctt gaccgccttt ccgataccgt ctctgcacgc 900
aatacctccg gattccgtga acaggtcgct gcatggctgg aaaaactcag tgcctctgcg 960
gagcttcgac agcagtcttt cgctgttgct gctgatgcca ctgagagctg tgaggaccgt 1020
gtcgcgctca catggaacaa tctccggaaa accctcctgg tccatcaggc atcagaaggc 1080
cttttcgata atgataccgg cgctctgctc tccctgggca gggaaatgtt ccgcctcgaa 1140
attctggagg atattgcccg ggataaagtc agaactctcc attttgtgga tgagatagaa 1200
gtctacctgg ccttccagac catgctcgca gagaaacttc agctctccac tgccgtgaag 1260
gaaatgcgtt tctatggcgt gtcgggagtg acagcaaatg acctccgcac tgccgaagcc 1320
atggtcagaa gccgtgaaga gaatgaattt acggactggt tctccctctg gggaccatgg 1380
catgctgtac tgaagcgtac ggaagctgac cgctgggcgc aggcagaaga gcagaaatat 1440
gagatgctgg agaatgagta ccctcagagg gtggctgacc ggctgaaagc atcaggtctg 1500
agcggtgatg cggatgcgga gagggaagcc ggtgcacagg tgatgcgtga gactgaacag 1560
cagatttacc gtcagctgac tgacgaggta ctggccctgc gattgtctga aaacggctca 1620
caactgcacc attcataa 1638
<210> 15
<211> 172
<212> PRT
<213> Artificial
<220>
<223> LegAU13 F-box motif from Legionella pneumophila
<400> 15
Met Lys Lys Asn Phe Phe Ser Asp Leu Pro Glu Glu Thr Ile Val Asn
1 5 10 15
Thr Leu Ser Phe Leu Lys Ala Asn Thr Leu Ala Arg Ile Ala Gln Thr
20 25 30
Cys Gln Phe Phe Asn Arg Leu Ala Asn Asp Lys His Leu Glu Leu His
35 40 45
Gln Leu Arg Gln Gln His Ile Lys Arg Glu Leu Trp Gly Asn Leu Met
50 55 60
Val Ala Ala Arg Ser Asn Asn Leu Glu Glu Val Lys Lys Ile Leu Lys
65 70 75 80
Lys Gly Ile Asp Pro Thr Gln Thr Asn Ser Tyr His Leu Asn Arg Thr
85 90 95
Pro Leu Leu Ala Ala Ile Glu Gly Lys Ala Tyr Gln Thr Ala Asn Tyr
100 105 110
Leu Trp Arg Lys Tyr Thr Phe Asp Pro Asn Phe Lys Asp Asn Tyr Gly
115 120 125
Asp Ser Pro Ile Ser Leu Leu Lys Lys Gln Leu Ala Asn Pro Ala Phe
130 135 140
Lys Asp Lys Glu Lys Lys Gln Ile Arg Ala Leu Ile Arg Gly Met Gln
145 150 155 160
Glu Glu Lys Ile Ala Gln Ser Lys Cys Leu Val Cys
165 170
<210> 16
<211> 519
<212> DNA
<213> Artificial
<220>
<223> LegAU13 F-box motif from Legionella pneumophila
<400> 16
atgaaaaaga attttttttc tgatcttcct gaggaaacaa ttgtcaatac attgagtttc 60
ttaaaagcaa acacactagc tcgtatagct cagacatgtc aattttttaa tcgcttggct 120
aatgataaac atctggagct gcatcaacta agacaacagc atataaagcg agagctatgg 180
ggaaatctta tggtggcggc aagaagcaat aacctggaag aggtcaaaaa gattctaaaa 240
aaaggaatcg atccaaccca gaccaatagc taccacttaa atagaacgcc tttacttgca 300
gctatcgaag gaaaagcata tcaaactgca aattacctct ggagaaaata cactttcgat 360
cccaatttta aagataacta tggtgattca cctatctctc ttcttaaaaa gcaactggca 420
aatccagcct tcaaggataa ggaaaaaaaa caaatacgcg ccttaattag gggaatgcaa 480
gaagaaaaaa tagcacagag caagtgcctt gtttgttaa 519
<210> 17
<211> 188
<212> PRT
<213> Artificial
<220>
<223> LegU1 F-box motif from Legionella pneumophila
<400> 17
Met Lys Ala Lys Tyr Asp Pro Thr Lys Pro Gly Leu Gln Lys Leu Pro
1 5 10 15
Pro Glu Ile Lys Val Met Ile Leu Glu Phe Leu Asp Ala Lys Ser Lys
20 25 30
Leu Ala Leu Ser Gln Thr Asn Tyr Gly Trp Arg Asp Leu Ile Leu Asp
35 40 45
Arg Pro Glu Tyr Thr Lys Glu Ile Thr Asn Thr Leu Phe Arg Leu Asp
50 55 60
Lys Lys Arg His Arg Gln Ala Ile Ala Gln Met Met Ser Gly Arg Val
65 70 75 80
Thr Ala Ser Ser Met Ala Lys Leu Phe Glu Glu Leu Leu Cys Phe Ser
85 90 95
Ile Pro Ser Ser Tyr Val Phe Leu Ile Phe Phe Ala Ser Gln Lys Ser
100 105 110
Val Ala Leu Ile Glu Val Leu Thr Val Ile Leu Val Phe Ala Ala Ile
115 120 125
Thr Ser Leu Ala His Asp Leu Val Asp Tyr Phe Ile Glu Ser Asp Thr
130 135 140
Lys Ala Glu Lys Gln His Ala His Arg Arg Ala Phe Gln Phe Phe Ala
145 150 155 160
Gln Pro Ser Gln Ser Ala Ala Gln Gln Asn Leu Glu Glu Glu Asn Leu
165 170 175
Ser Ala Asp Pro Lys Ala Cys Gln Cys Glu Pro Leu
180 185
<210> 18
<211> 567
<212> DNA
<213> Artificial
<220>
<223> LegU1 F-box motif from Legionella pneumophila
<400> 18
atgaaagcaa aatacgaccc cacaaagcct ggactccaaa agttacctcc tgaaatcaag 60
gtaatgattc ttgagtttct tgatgccaaa tcaaaactag ctctttcaca gacaaattat 120
ggttggcgtg atttaattct agaccggcca gaatatacca aagaaataac gaatacatta 180
tttcgtcttg ataaaaaacg ccatcgtcaa gcaatagcac aaatgatgtc aggaagagtt 240
acagcaagtt ctatggctaa gctatttgaa gaattactat gttttagcat accttcgtcc 300
tatgtgtttt taatcttttt cgcatcgcaa aaatctgtgg cgcttataga agtcttaacc 360
gtaatccttg tgtttgctgc aataacctct ctcgcccatg atctggtgga ttattttatt 420
gaaagtgata caaaagctga gaaacagcat gcacatcgcc gtgcttttca attctttgcc 480
caacccagtc aaagcgctgc acaacaaaac ttggaggaag agaatttaag tgctgatccc 540
aaggcctgcc aatgtgagcc attgtag 567
<210> 19
<211> 240
<212> PRT
<213> Artificial
<220>
<223> LubX U-box motif from Legionella pneumophila
<400> 19
Met Ala Thr Arg Asn Pro Phe Asp Ile Asp His Lys Ser Lys Tyr Leu
1 5 10 15
Arg Glu Ala Ala Leu Glu Ala Asn Leu Ser His Pro Glu Thr Thr Pro
20 25 30
Thr Met Leu Thr Cys Pro Ile Asp Ser Gly Phe Leu Lys Asp Pro Val
35 40 45
Ile Thr Pro Glu Gly Phe Val Tyr Asn Lys Ser Ser Ile Leu Lys Trp
50 55 60
Leu Glu Thr Lys Lys Glu Asp Pro Gln Ser Arg Lys Pro Leu Thr Ala
65 70 75 80
Lys Asp Leu Gln Pro Phe Pro Glu Leu Leu Ile Ile Val Asn Arg Phe
85 90 95
Val Glu Thr Gln Thr Asn Tyr Glu Lys Leu Lys Asn Arg Leu Val Gln
100 105 110
Asn Ala Arg Val Ala Ala Arg Gln Lys Glu Tyr Thr Glu Ile Pro Asp
115 120 125
Ile Phe Leu Cys Pro Ile Ser Lys Thr Leu Ile Lys Thr Pro Val Ile
130 135 140
Thr Ala Gln Gly Lys Val Tyr Asp Gln Glu Ala Leu Ser Asn Phe Leu
145 150 155 160
Ile Ala Thr Gly Asn Lys Asp Glu Thr Gly Lys Lys Leu Ser Ile Asp
165 170 175
Asp Val Val Val Phe Asp Glu Leu Tyr Gln Gln Ile Lys Val Tyr Asn
180 185 190
Phe Tyr Arg Lys Arg Glu Val Gln Lys Asn Gln Ile Gln Pro Ser Val
195 200 205
Ser Asn Gly Phe Gly Phe Phe Ser Leu Asn Phe Leu Thr Ser Trp Leu
210 215 220
Trp Gly Thr Glu Glu Lys Lys Glu Lys Thr Ser Ser Asp Met Thr Tyr
225 230 235 240
<210> 20
<211> 723
<212> DNA
<213> Artificial
<220>
<223> LubX U-box motif from Legionella pneumophila
<400> 20
atggcgacgc gaaatccttt tgatattgat cataaaagta aatacttaag agaagcagca 60
ttagaagcca atttatctca tccagaaaca acaccaacaa tgctgacttg ccctattgac 120
agcggatttc taaaagatcc cgtgatcaca cctgaaggtt ttgtttataa taaatcctct 180
attttaaaat ggttagaaac gaaaaaagaa gacccacaaa gccgtaaacc cttaacggct 240
aaagatttgc aaccattccc cgagttattg attatagtca atagatttgt tgagacacaa 300
acgaactatg aaaaattaaa aaacagatta gtgcaaaatg ctcgggttgc tgcacgccaa 360
aaagaataca ctgaaattcc ggatatattt ctttgcccaa taagtaaaac gcttatcaaa 420
acacctgtca ttactgccca agggaaagta tatgatcaag aagcattaag taactttctt 480
atcgcaacgg gtaataaaga tgaaacaggc aaaaaattat ccattgatga tgtagtggtg 540
tttgatgaac tctatcaaca gataaaagtt tataattttt accgcaaacg cgaagtgcaa 600
aaaaatcaaa ttcaaccttc agtaagtaat ggttttggct tttttagctt gaattttctc 660
acctcatggt tatggggaac tgaggagaaa aaagaaaaga catcatctga tatgacgtac 720
taa 723
<210> 21
<211> 191
<212> PRT
<213> Artificial
<220>
<223> NleG2-3 U-box motif from Enterohemorrhagic Escherichia coli
(EHEC) O157:H7
<400> 21
Met Pro Leu Thr Ser Asp Ile Arg Ser His Ser Phe Asn Leu Gly Val
1 5 10 15
Glu Val Val Arg Ala Arg Ile Val Ala Asn Gly Arg Gly Asp Ile Thr
20 25 30
Val Gly Gly Glu Thr Val Ser Ile Val Tyr Asp Ser Thr Asn Gly Arg
35 40 45
Phe Ser Ser Ser Gly Gly Asn Gly Gly Leu Leu Ser Glu Leu Leu Leu
50 55 60
Leu Gly Phe Asn Ser Gly Pro Arg Ala Leu Gly Glu Arg Met Leu Ser
65 70 75 80
Met Leu Ser Asp Ser Gly Glu Ala Gln Ser Gln Glu Ser Ile Gln Asn
85 90 95
Lys Ile Ser Gln Cys Lys Phe Ser Val Cys Pro Glu Arg Leu Gln Cys
100 105 110
Pro Leu Glu Ala Ile Gln Cys Pro Ile Thr Leu Glu Gln Pro Glu Lys
115 120 125
Gly Ile Phe Val Lys Asn Ser Asp Gly Ser Asp Val Cys Thr Leu Phe
130 135 140
Asp Ala Ala Ala Phe Ser Arg Leu Val Gly Glu Gly Leu Pro His Pro
145 150 155 160
Leu Thr Arg Glu Pro Ile Thr Ala Ser Ile Ile Val Lys His Glu Glu
165 170 175
Cys Ile Tyr Asp Asp Thr Arg Gly Asn Phe Ile Ile Lys Gly Asn
180 185 190
<210> 22
<211> 576
<212> DNA
<213> Artificial
<220>
<223> NleG2-3 U-box motif from Enterohemorrhagic Escherichia coli
(EHEC) O157:H7
<400> 22
atgccattaa cctcagatat tagatcacat tcatttaatc ttggggtgga ggttgttcgt 60
gcccgaattg tagccaatgg gcgcggagat attacagtcg gtggtgaaac tgtcagtatt 120
gtgtatgatt ctactaatgg gcgcttttca tccagtggcg gtaatggcgg attgctttct 180
gagttattgc ttttgggatt taatagtggt cctcgagccc ttggtgagag aatgctaagt 240
atgctttcgg actcaggtga agcacaatcg caagagagta ttcagaacaa aatatctcaa 300
tgtaagtttt ctgtttgtcc agagagactt cagtgcccgc ttgaggctat tcagtgtcca 360
attacactgg agcagcctga aaaaggtatt tttgtgaaga attcagatgg ttcagatgta 420
tgtactttat ttgatgccgc tgcattttct cgtttggttg gtgaaggctt accccaccca 480
ctgacccggg aaccaataac ggcatcaata attgtaaaac atgaagaatg catttatgac 540
gataccagag gaaacttcat tataaagggt aattga 576
<210> 23
<211> 213
<212> PRT
<213> Artificial
<220>
<223> NleG5-1 U-box motif from Enterohemorrhagic Escherichia coli
(EHEC) O157:H7
<400> 23
Met Pro Val Asp Leu Thr Pro Tyr Ile Leu Pro Gly Val Ser Phe Leu
1 5 10 15
Ser Asp Ile Pro Gln Glu Thr Leu Ser Glu Ile Arg Asn Gln Thr Ile
20 25 30
Arg Gly Glu Ala Gln Ile Arg Leu Gly Glu Leu Met Val Ser Ile Arg
35 40 45
Pro Met Gln Val Asn Gly Tyr Phe Met Gly Ser Leu Asn Gln Asp Gly
50 55 60
Leu Ser Asn Asp Asn Ile Gln Ile Gly Leu Gln Tyr Ile Glu His Ile
65 70 75 80
Glu Arg Thr Leu Asn His Gly Ser Leu Thr Ser Arg Glu Val Thr Val
85 90 95
Leu Arg Glu Ile Glu Met Leu Glu Asn Met Asp Leu Leu Ser Asn Tyr
100 105 110
Gln Leu Glu Glu Leu Leu Asp Lys Ile Glu Val Cys Ala Phe Asn Val
115 120 125
Glu His Ala Gln Leu Gln Val Pro Glu Ser Leu Arg Thr Cys Pro Val
130 135 140
Thr Leu Cys Glu Pro Glu Asp Gly Val Phe Met Arg Asn Ser Met Asn
145 150 155 160
Ser Asn Val Cys Met Leu Tyr Asp Lys Met Ala Leu Ile His Leu Val
165 170 175
Lys Thr Arg Ala Ala His Pro Leu Ser Arg Glu Ser Ile Ala Val Ser
180 185 190
Met Ile Val Gly Arg Asp Asn Cys Ala Phe Asp Pro Asp Arg Gly Asn
195 200 205
Phe Val Leu Lys Asn
210
<210> 24
<211> 642
<212> DNA
<213> Artificial
<220>
<223> NleG5-1 U-box motif from Enterohemorrhagic Escherichia coli
(EHEC) O157:H7
<400> 24
atgcctgtag atttaacgcc ttatatttta cctggggtta gttttttgtc tgacattcct 60
caagaaacct tgtctgagat acgtaatcag actattcgtg gagaagctca aataagactg 120
ggtgagttga tggtgtcaat acgacctatg caggtaaatg gatattttat gggaagtctt 180
aaccaggatg gtttatcgaa tgataatatc cagattggcc ttcaatatat agaacatatt 240
gaacgtacac ttaatcatgg tagtttgaca agccgtgaag ttacagtact gcgtgaaatt 300
gagatgctcg aaaatatgga tttgctttct aactaccagt tagaggagtt gttagataaa 360
attgaagtat gtgcatttaa tgtggagcat gcacaattgc aagtgccaga gagcttacga 420
acatgccctg ttacattatg tgaaccagaa gatggggtat ttatgaggaa ttcaatgaat 480
tcaaatgttt gtatgttgta tgataaaatg gcattaatac atcttgttaa aacaagggcg 540
gctcatcctt tgagcaggga atcaatcgca gtttcaatga ttgtaggaag agataattgt 600
gcttttgacc ctgacagagg taacttcgtt ttaaaaaatt aa 642
<210> 25
<211> 782
<212> PRT
<213> Artificial
<220>
<223> NleL HECT motif from Enterohemorrhagic Escherichia coli (EHEC)
O157:H7
<400> 25
Met Leu Pro Thr Thr Asn Ile Ser Val Asn Ser Gly Val Ile Ser Phe
1 5 10 15
Glu Ser Pro Val Asp Ser Pro Ser Asn Glu Asp Val Glu Val Ala Leu
20 25 30
Glu Lys Trp Cys Ala Glu Gly Glu Phe Ser Glu Asn Arg His Glu Val
35 40 45
Ala Ser Lys Ile Leu Asp Val Ile Ser Thr Asn Gly Glu Thr Leu Ser
50 55 60
Ile Ser Glu Pro Ile Thr Thr Leu Pro Asp Leu Leu Pro Gly Ser Leu
65 70 75 80
Lys Glu Leu Val Leu Asn Gly Cys Thr Glu Leu Lys Ser Ile Asn Cys
85 90 95
Leu Pro Pro Asn Leu Ser Ser Leu Ser Met Val Gly Cys Ser Ser Leu
100 105 110
Glu Val Ile Asn Cys Ser Ile Pro Glu Asn Val Ile Asn Leu Ser Leu
115 120 125
Cys His Cys Ser Ser Leu Lys His Ile Glu Gly Ser Phe Pro Glu Ala
130 135 140
Leu Arg Asn Ser Val Tyr Leu Asn Gly Cys Asn Ser Leu Asn Glu Ser
145 150 155 160
Gln Cys Gln Phe Leu Ala Tyr Asp Val Ser Gln Gly Arg Ala Cys Leu
165 170 175
Ser Lys Ala Glu Leu Thr Ala Asp Leu Ile Trp Leu Ser Ala Asn Arg
180 185 190
Thr Gly Glu Glu Ser Ala Glu Glu Leu Asn Tyr Ser Gly Cys Asp Leu
195 200 205
Ser Gly Leu Ser Leu Val Gly Leu Asn Leu Ser Ser Val Asn Phe Ser
210 215 220
Gly Ala Val Leu Asp Asp Thr Asp Leu Arg Met Ser Asp Leu Ser Gln
225 230 235 240
Ala Val Leu Glu Asn Cys Ser Phe Lys Asn Ser Ile Leu Asn Glu Cys
245 250 255
Asn Phe Cys Tyr Ala Asn Leu Ser Asn Cys Ile Ile Arg Ala Leu Phe
260 265 270
Glu Asn Ser Asn Phe Ser Asn Ser Asn Leu Lys Asn Ala Ser Phe Lys
275 280 285
Gly Ser Ser Tyr Ile Gln Tyr Pro Pro Ile Leu Asn Glu Ala Asp Leu
290 295 300
Thr Gly Ala Ile Ile Ile Pro Gly Met Val Leu Ser Gly Ala Ile Leu
305 310 315 320
Gly Asp Val Lys Glu Leu Phe Ser Glu Lys Ser Asn Thr Ile Asn Leu
325 330 335
Gly Gly Cys Tyr Ile Asp Leu Ser Asp Ile Gln Glu Asn Ile Leu Ser
340 345 350
Val Leu Asp Asn Tyr Thr Lys Ser Asn Lys Ser Ile Leu Leu Thr Met
355 360 365
Asn Thr Ser Asp Asp Lys Tyr Asn His Asp Lys Val Arg Ala Ala Glu
370 375 380
Glu Leu Ile Lys Lys Ile Ser Leu Asp Glu Leu Ala Ala Phe Arg Pro
385 390 395 400
Tyr Val Lys Met Ser Leu Ala Asp Ser Phe Ser Ile His Pro Tyr Leu
405 410 415
Asn Asn Ala Asn Ile Gln Gln Trp Leu Glu Pro Ile Cys Asp Asp Phe
420 425 430
Phe Asp Thr Ile Met Ser Trp Phe Asn Asn Ser Ile Met Met Tyr Met
435 440 445
Glu Asn Gly Ser Leu Leu Gln Ala Gly Met Tyr Phe Glu Arg His Pro
450 455 460
Gly Ala Met Val Ser Tyr Asn Ser Ser Phe Ile Gln Ile Val Met Asn
465 470 475 480
Gly Ser Arg Arg Asp Gly Met Gln Glu Arg Phe Arg Glu Leu Tyr Glu
485 490 495
Val Tyr Leu Lys Asn Glu Lys Val Tyr Pro Val Thr Gln Gln Ser Asp
500 505 510
Phe Gly Leu Cys Asp Gly Ser Gly Lys Pro Asp Trp Asp Asp Asp Ser
515 520 525
Asp Leu Ala Tyr Asn Trp Val Leu Leu Ser Ser Gln Asp Asp Gly Met
530 535 540
Ala Met Met Cys Ser Leu Ser His Met Val Asp Met Leu Ser Pro Asn
545 550 555 560
Thr Ser Thr Asn Trp Met Ser Phe Phe Leu Tyr Lys Asp Gly Glu Val
565 570 575
Gln Asn Thr Phe Gly Tyr Ser Leu Ser Asn Leu Phe Ser Glu Ser Phe
580 585 590
Pro Ile Phe Ser Ile Pro Tyr His Lys Ala Phe Ser Gln Asn Phe Val
595 600 605
Ser Gly Ile Leu Asp Ile Leu Ile Ser Asp Asn Glu Leu Lys Glu Arg
610 615 620
Phe Ile Glu Ala Leu Asn Ser Asn Lys Ser Asp Tyr Lys Met Ile Ala
625 630 635 640
Asp Asp Gln Gln Arg Lys Leu Ala Cys Val Trp Asn Pro Phe Leu Asp
645 650 655
Gly Trp Glu Leu Asn Ala Gln His Val Asp Met Ile Met Gly Ser His
660 665 670
Val Leu Lys Asp Met Pro Leu Arg Lys Gln Ala Glu Ile Leu Phe Cys
675 680 685
Leu Gly Gly Val Phe Cys Lys Tyr Ser Ser Ser Asp Met Phe Gly Thr
690 695 700
Glu Tyr Asp Ser Pro Glu Ile Leu Arg Arg Tyr Ala Asn Gly Leu Ile
705 710 715 720
Glu Gln Ala Tyr Lys Thr Asp Pro Gln Val Phe Gly Ser Val Tyr Tyr
725 730 735
Tyr Asn Asp Ile Leu Asp Arg Leu Gln Gly Arg Asn Asn Val Phe Thr
740 745 750
Cys Thr Ala Val Leu Thr Asp Met Leu Thr Glu His Ala Lys Glu Ser
755 760 765
Phe Pro Glu Ile Phe Ser Leu Tyr Tyr Pro Val Ala Trp Arg
770 775 780
<210> 26
<211> 2349
<212> DNA
<213> Artificial
<220>
<223> NleL HECT motif from Enterohemorrhagic Escherichia coli (EHEC)
O157:H7
<400> 26
atgctgccca ctacaaatat ctctgtaaat tctggagtaa tatcttttga aagtcctgta 60
gattcaccat ctaacgagga tgttgaagtt gccctcgaaa agtggtgtgc tgagggagaa 120
tttagcgaaa atcgtcatga ggttgcatca aaaatacttg atgttataag tactaatgga 180
gagactttat caatcagtga gccaataaca acattaccag acttgcttcc aggttctctg 240
aaagaactgg ttttgaatgg atgtacagag cttaaatcaa taaactgctt accccccaac 300
ttatcttcat taagtatggt tggatgctca tcattagagg ttataaattg cagcatacct 360
gaaaatgtca ttaatttatc tttatgccat tgtagttctt tgaaacatat agaaggttcc 420
tttcctgagg cactcagaaa ttccgtatat ttaaatggct gtaattcatt aaatgaatcg 480
caatgtcaat tccttgcata tgatgtcagt caaggccgtg cctgcctgag caaagctgag 540
cttactgctg acttaatttg gttgtcagct aaccgaacgg gtgaagagtc tgctgaagaa 600
ttgaattact ctggatgtga cttgtcaggt ctaagtcttg tagggctgaa tttatcatca 660
gtaaattttt ctggagcagt gcttgatgat acagatctca ggatgagtga tttgtctcag 720
gctgtattgg aaaactgttc ttttaaaaac tcgattttga atgaatgtaa tttttgttat 780
gctaatttat ctaattgtat tattagggct ttgtttgaaa actctaattt cagcaattcc 840
aatcttaaaa atgcatcatt taaaggatct tcatatatac aatatcctcc aattttgaac 900
gaggctgatt taacaggagc tattataatt cctggaatgg ttttaagtgg tgctatctta 960
ggtgatgtaa aggagctctt tagtgaaaaa agtaatacca ttaatctagg agggtgttac 1020
atagatctat ctgacataca ggaaaatata ttatctgtgt tggataacta tacaaaatca 1080
aataaatcaa ttttattgac tatgaataca tctgatgata agtataacca tgataaagta 1140
agggccgctg aagaacttat caaaaaaata tctcttgacg aattagcggc gttccggccc 1200
tatgttaaga tgtctttggc tgattcattt agtattcatc cttatttgaa caacgcaaat 1260
atacagcaat ggctcgagcc tatatgtgat gacttttttg atactataat gtcttggttt 1320
aataattcaa taatgatgta tatggagaat ggtagtttat tgcaggcagg gatgtatttt 1380
gagcgacatc caggtgcgat ggtatcttat aatagttcct ttatacaaat tgtaatgaat 1440
ggttcacggc gtgatggaat gcaggaacga tttagggaac tctatgaagt atatttaaaa 1500
aatgaaaaag tttatcctgt cacacagcag agtgattttg gattgtgcga tggctctggg 1560
aagcctgact gggatgatga ttccgatttg gcttataact gggttttgtt atcatcacag 1620
gatgatggta tggcaatgat gtgttctttg agtcatatgg ttgatatgtt atctcctaat 1680
acatcaacta attggatgtc ctttttttta tataaggatg gagaagttca aaatacattt 1740
gggtattcat tgagcaatct tttttctgaa tcatttccaa ttttcagtat tccttatcat 1800
aaagcttttt cccagaattt cgtttctggt attctggata tactcatttc tgataatgaa 1860
ctcaaagaga gatttattga ggcacttaat tccaataaat cagattataa aatgattgct 1920
gatgatcagc aaaggaaact tgcctgtgtc tggaatccct ttcttgatgg ttgggaactg 1980
aacgctcagc atgtagatat gattatgggg agccatgtat tgaaagatat gccactaaga 2040
aaacaggctg aaatattatt ttgtttaggg ggggttttct gtaaatactc atcgagtgat 2100
atgtttggta cagagtatga ttctcctgag attctacgga gatatgcaaa tggattgatt 2160
gaacaagctt ataaaacaga tcctcaggta tttggctcag tttattatta caatgatatt 2220
ttagacaggc tacaaggaag aaataatgtt tttacttgta ccgctgtgct gactgatatg 2280
ctaacggagc atgcaaaaga atcttttcct gaaatatttt cattgtatta tcctgttgcg 2340
tggcgttga 2349
<210> 27
<211> 917
<212> PRT
<213> Artificial
<220>
<223> SidC unconventional motif from Legionella pneumophila
<400> 27
Met Val Ile Asn Met Val Asp Val Ile Lys Phe Lys Glu Pro Glu Arg
1 5 10 15
Cys Asp Tyr Leu Tyr Val Asp Glu Asn Asn Lys Val His Ile Leu Leu
20 25 30
Pro Ile Val Gly Gly Asp Glu Ile Gly Leu Asp Asn Thr Cys Gln Thr
35 40 45
Ala Val Glu Leu Ile Thr Phe Phe Tyr Gly Ser Ala His Ser Gly Val
50 55 60
Thr Lys Tyr Ser Ala Glu His Gln Leu Ser Glu Tyr Lys Arg Gln Leu
65 70 75 80
Glu Glu Asp Ile Lys Ala Ile Asn Ser Gln Lys Lys Ile Ser Pro His
85 90 95
Ala Tyr Asp Asp Leu Leu Lys Glu Lys Ile Glu Arg Leu Gln Gln Ile
100 105 110
Glu Lys Tyr Ile Glu Leu Ile Gln Val Leu Lys Lys Gln Tyr Asp Glu
115 120 125
Gln Asn Asp Ile Arg Gln Leu Arg Thr Gly Gly Ile Pro Gln Leu Pro
130 135 140
Ser Gly Val Lys Glu Ile Ile Lys Ser Ser Glu Asn Ala Phe Ala Val
145 150 155 160
Arg Leu Ser Pro Tyr Asp Asn Asp Lys Phe Thr Arg Phe Asp Asp Pro
165 170 175
Leu Phe Asn Val Lys Arg Asn Ile Ser Lys Tyr Asp Thr Pro Ser Arg
180 185 190
Gln Ala Pro Ile Pro Ile Tyr Glu Gly Leu Gly Tyr Arg Leu Arg Ser
195 200 205
Thr Leu Phe Pro Glu Asp Lys Thr Pro Thr Pro Ile Asn Lys Lys Ser
210 215 220
Leu Arg Asp Lys Val Lys Ser Thr Val Leu Ser His Tyr Lys Asp Glu
225 230 235 240
Asp Arg Ile Asp Gly Glu Lys Lys Asp Glu Lys Leu Asn Glu Leu Ile
245 250 255
Thr Asn Leu Gln Asn Glu Leu Val Lys Glu Leu Val Lys Ser Asp Pro
260 265 270
Gln Tyr Ser Lys Leu Ser Leu Ser Lys Asp Pro Arg Gly Lys Glu Ile
275 280 285
Asn Tyr Asp Tyr Leu Val Asn Ser Leu Met Leu Val Asp Asn Asp Ser
290 295 300
Glu Ile Gly Asp Trp Ile Asp Thr Ile Leu Asp Ala Thr Val Asp Ser
305 310 315 320
Thr Val Trp Val Ala Gln Ala Ser Ser Pro Phe Tyr Asp Gly Ala Lys
325 330 335
Glu Ile Ser Ser Asp Arg Asp Ala Asp Lys Ile Ser Ile Arg Val Gln
340 345 350
Tyr Leu Leu Ala Glu Ala Asn Ile Tyr Cys Lys Thr Asn Lys Leu Ser
355 360 365
Asp Ala Asn Phe Gly Glu Phe Phe Asp Lys Glu Pro His Ala Thr Glu
370 375 380
Ile Ala Lys Arg Val Lys Glu Gly Phe Thr Gln Gly Ala Asp Ile Glu
385 390 395 400
Pro Ile Ile Tyr Asp Tyr Ile Asn Ser Asn His Ala Glu Leu Gly Leu
405 410 415
Lys Ser Pro Leu Thr Gly Lys Gln Gln Gln Glu Ile Thr Asp Lys Phe
420 425 430
Thr Lys His Tyr Asn Thr Ile Lys Glu Ser Pro His Phe Asp Glu Phe
435 440 445
Phe Val Ala Asp Pro Asp Lys Lys Gly Asn Ile Phe Ser His Gln Gly
450 455 460
Arg Ile Ser Cys His Phe Leu Asp Phe Phe Thr Arg Gln Thr Lys Gly
465 470 475 480
Lys His Pro Leu Gly Asp Leu Ala Ser His Gln Glu Ala Leu Gln Glu
485 490 495
Gly Thr Ser Asn Arg Leu His His Lys Asn Glu Val Val Ala Gln Gly
500 505 510
Tyr Glu Lys Leu Asp Gln Phe Lys Lys Glu Val Val Lys Leu Leu Ala
515 520 525
Glu Asn Lys Pro Lys Glu Leu Leu Asp Tyr Leu Val Ala Thr Ser Pro
530 535 540
Thr Gly Val Pro Asn Tyr Ser Met Leu Ser Lys Glu Thr Gln Asn Tyr
545 550 555 560
Ile Ala Tyr Asn Arg Asn Trp Pro Ala Ile Gln Lys Glu Leu Glu Lys
565 570 575
Ala Thr Ser Ile Pro Glu Ser Gln Lys Gln Asp Leu Ser Arg Leu Leu
580 585 590
Ser Arg Asp Asn Leu Gln His Asp Asn Leu Ser Ala Ile Thr Trp Ser
595 600 605
Lys Tyr Ser Ser Lys Pro Leu Leu Asp Val Glu Leu Asn Lys Ile Ala
610 615 620
Glu Gly Leu Glu Leu Thr Ala Lys Ile Tyr Asn Glu Lys Arg Gly Arg
625 630 635 640
Glu Trp Trp Phe Lys Gly Ser Arg Asn Glu Ala Arg Lys Thr Gln Cys
645 650 655
Glu Glu Leu Gln Arg Val Ser Lys Glu Ile Asn Thr Leu Leu Gln Ser
660 665 670
Glu Ser Leu Thr Lys Ser Gln Val Leu Glu Lys Val Leu Asn Ser Ile
675 680 685
Glu Thr Leu Asp Lys Ile Asp Arg Asp Ile Ser Ala Glu Ser Asn Trp
690 695 700
Phe Gln Ser Thr Leu Gln Lys Glu Val Arg Leu Phe Arg Asp Gln Leu
705 710 715 720
Lys Asp Ile Cys Gln Leu Asp Lys Tyr Ala Phe Lys Ser Thr Lys Leu
725 730 735
Asp Glu Ile Ile Ser Leu Glu Met Glu Glu Gln Phe Gln Lys Ile Gln
740 745 750
Asp Pro Ala Val Gln Gln Ile Val Arg Asp Leu Pro Ser His Cys His
755 760 765
Asn Asp Glu Ala Ile Glu Phe Phe Lys Thr Leu Asn Pro Glu Glu Ala
770 775 780
Ala Lys Val Ala Ser Tyr Leu Ser Leu Glu Tyr Arg Glu Ile Asn Lys
785 790 795 800
Ser Thr Asp Lys Lys Thr Leu Leu Glu Gln Asp Ile Pro Arg Leu Phe
805 810 815
Lys Glu Val Asn Thr Gln Leu Leu Ser Lys Leu Lys Glu Glu Lys Ala
820 825 830
Ile Asp Glu Gln Val His Glu Lys Leu Ser Gln Leu Ala Asp Lys Ile
835 840 845
Ala Pro Glu His Phe Thr Arg Asn Asn Ile Ile Lys Trp Ser Thr Asn
850 855 860
Pro Glu Lys Leu Glu Glu Ser Asn Leu Asn Glu Pro Ile Lys Ser Val
865 870 875 880
Gln Ser Pro Thr Thr Lys Gln Thr Ser Lys Gln Phe Arg Glu Ala Met
885 890 895
Gly Glu Ile Thr Gly Arg Asn Glu Pro Pro Thr Asp Thr Leu Tyr Thr
900 905 910
Gly Ile Ile Lys Lys
915
<210> 28
<211> 2754
<212> DNA
<213> Artificial
<220>
<223> SidC unconventional motif from Legionella pneumophila
<400> 28
atggtgataa acatggttga cgtaatcaaa ttcaaagagc cggaacgttg tgattatcta 60
tatgttgatg aaaacaacaa agttcatatc cttttaccga ttgtaggagg agatgaaata 120
ggcctggata atacctgtca aacagcagtt gagttgatca catttttcta tggtagtgcg 180
cacagtggtg tgactaaata ttctgctgaa caccaactca gtgaatacaa aaggcaattg 240
gaagaagaca tcaaagccat caatagtcaa aagaaaattt cacctcatgc ttatgacgat 300
ttattaaaag agaaaataga acgcttacag caaattgaaa aatacattga attaattcaa 360
gtactaaaaa aacaatatga tgaacaaaat gatatcaggc aacttcgtac tggagggatt 420
ccgcaattac cctctggggt aaaggaaatc attaaatcct ctgaaaatgc tttcgctgtg 480
agactttctc catatgacaa cgataaattc actcgctttg atgacccttt attcaatgtc 540
aaaagaaaca tctcaaaata tgacacgccc tcaagacaag ctcctattcc aatatacgag 600
ggattaggtt atcgcctgcg ttcaacactg ttcccggaag ataaaacacc aactccaatt 660
aataaaaaat cacttaggga taaagttaaa agcactgttc ttagtcatta taaagatgaa 720
gatagaattg atggagaaaa aaaagatgaa aaattaaacg aactaattac taatcttcaa 780
aacgaacttg taaaagagtt agtaaaaagt gatcctcaat attcgaaact atctttatct 840
aaagatccaa gaggaaaaga aataaattac gattatttag taaatagttt gatgcttgta 900
gataacgact ctgaaattgg tgattggatt gatactattc tcgacgctac agtagattcc 960
actgtctggg tagctcaggc atccagccct ttctatgatg gtgctaaaga aatatcatca 1020
gaccgcgatg cggacaagat atccatcaga gttcagtacc tgttggccga agccaatatt 1080
tactgtaaaa caaacaaatt atcggatgct aactttggag aatttttcga caaagagcct 1140
catgctactg aaattgcgaa aagagtaaag gaaggattta cgcaaggtgc agatatagaa 1200
ccaattatat acgactatat taacagcaac catgccgagc tgggattaaa atctccgtta 1260
accggcaaac aacaacaaga aatcactgat aaatttacaa aacattataa tacgattaaa 1320
gaatctccac attttgatga gttttttgtc gctgatccgg ataaaaaagg caatatcttt 1380
tctcatcaag gcagaatcag ttgtcatttt ctggatttct ttactcgaca aaccaaaggc 1440
aaacatcctc ttggtgatct tgcaagtcat caggaagctc tccaggaagg aacctccaat 1500
cgcttacatc acaagaatga ggtagtagcc caggggtacg aaaaactgga tcaattcaag 1560
aaagaggttg tcaaactgct ggctgagaat aaaccaaaag aattattgga ttatttggtt 1620
gctacctcac ctacaggtgt tccaaattac tccatgcttt cgaaggaaac tcaaaattac 1680
attgcttata atcgtaactg gccagccatt caaaaagagc tggaaaaggc taccagcatc 1740
ccggagagtc aaaaacaaga tctttcaaga ttgctttctc gtgataattt acaacacgat 1800
aatctaagcg caattacctg gtcaaaatat tcctccaagc cattattgga tgtggaatta 1860
aataaaatcg ctgaaggatt agaactcact gcaaaaattt acaatgaaaa gagaggacgc 1920
gaatggtggt ttaaaggttc aagaaatgaa gctcgtaaga cccaatgtga agaattgcaa 1980
agagtatcca aagaaatcaa tactcttctg caaagtgaat ctttaacgaa aagccaggta 2040
cttgaaaagg ttttaaattc tatagaaaca ttagataaaa ttgacagaga catttctgcc 2100
gaatccaatt ggtttcaaag tactctgcaa aaggaagtca ggttatttcg agatcaattg 2160
aaagatattt gccaattgga caagtatgcc tttaaatcaa caaaacttga tgaaatcatc 2220
tctctggaaa tggaagaaca atttcaaaag atacaagatc ctgctgttca acaaattgtc 2280
agggacttgc cttctcattg ccacaatgat gaagcaattg aattctttaa gacattgaac 2340
cctgaagagg cagcaaaagt agctagctat ttaagcctgg aatacaggga aattaataaa 2400
tcaaccgata agaaaactct cctagaacaa gatattccca gactgtttaa agaagtcaat 2460
acgcagttac tctccaaact caaagaagaa aaagctattg atgagcaagt tcatgaaaaa 2520
ctcagtcaac tggctgacaa aattgcccct gagcatttta caagaaataa cattataaaa 2580
tggtctacca accctgaaaa gcttgaggaa tcaaatctta atgagccaat caaatcagtc 2640
caaagcccta ctactaaaca aacatcaaaa caattcaggg aagcgatggg tgaaatcact 2700
ggaagaaatg agcctcctac agacactttg tacacgggaa ttataaagaa atag 2754
<210> 29
<211> 765
<212> PRT
<213> Artificial
<220>
<223> SlrP novel E3 ligase from Enterohemorrhagic Escherichia coli
("EHEC") O157:H7
<400> 29
Met Phe Asn Ile Thr Asn Ile Gln Ser Thr Ala Arg His Gln Ser Ile
1 5 10 15
Ser Asn Glu Ala Ser Thr Glu Val Pro Leu Lys Glu Glu Ile Trp Asn
20 25 30
Lys Ile Ser Ala Phe Phe Ser Ser Glu His Gln Val Glu Ala Gln Asn
35 40 45
Cys Ile Ala Tyr Leu Cys His Pro Pro Glu Thr Ala Ser Pro Glu Glu
50 55 60
Ile Lys Ser Lys Phe Glu Cys Leu Arg Met Leu Ala Phe Pro Ala Tyr
65 70 75 80
Ala Asp Asn Ile Gln Tyr Ser Arg Gly Gly Ala Asp Gln Tyr Cys Ile
85 90 95
Leu Ser Glu Asn Ser Gln Glu Ile Leu Ser Ile Val Phe Asn Thr Glu
100 105 110
Gly Tyr Thr Val Glu Gly Gly Gly Lys Ser Val Thr Tyr Thr Arg Val
115 120 125
Thr Glu Ser Glu Gln Ala Ser Ser Ala Ser Gly Ser Lys Asp Ala Val
130 135 140
Asn Tyr Glu Leu Ile Trp Ser Glu Trp Val Lys Glu Ala Pro Ala Lys
145 150 155 160
Glu Ala Ala Asn Arg Glu Glu Pro Val Gln Arg Met Arg Asp Cys Leu
165 170 175
Lys Asn Asn Lys Thr Glu Leu Arg Leu Lys Ile Leu Gly Leu Thr Thr
180 185 190
Ile Pro Ala Tyr Ile Pro Glu Gln Ile Thr Thr Leu Ile Leu Asp Asn
195 200 205
Asn Glu Leu Lys Ser Leu Pro Glu Asn Leu Gln Gly Asn Ile Lys Thr
210 215 220
Leu Tyr Ala Asn Ser Asn Gln Leu Thr Ser Ile Pro Ala Thr Leu Pro
225 230 235 240
Asp Thr Ile Gln Glu Met Glu Leu Ser Ile Asn Arg Ile Thr Glu Leu
245 250 255
Pro Glu Arg Leu Pro Ser Ala Leu Gln Ser Leu Asp Leu Phe His Asn
260 265 270
Lys Ile Ser Cys Leu Pro Glu Asn Leu Pro Glu Glu Leu Arg Tyr Leu
275 280 285
Ser Val Tyr Asp Asn Ser Ile Arg Thr Leu Pro Ala His Leu Pro Ser
290 295 300
Glu Ile Thr His Leu Asn Val Gln Ser Asn Ser Leu Thr Ala Leu Pro
305 310 315 320
Glu Thr Leu Pro Pro Gly Leu Lys Thr Leu Glu Ala Gly Glu Asn Ala
325 330 335
Leu Thr Ser Leu Pro Ala Ser Leu Pro Pro Glu Leu Gln Val Leu Asp
340 345 350
Val Ser Lys Asn Gln Ile Thr Val Leu Pro Glu Thr Leu Pro Pro Thr
355 360 365
Ile Thr Thr Leu Asp Val Ser Arg Asn Ala Leu Thr Asn Leu Pro Glu
370 375 380
Asn Leu Pro Ala Ala Leu Gln Ile Met Gln Ala Ser Arg Asn Asn Leu
385 390 395 400
Val Arg Leu Pro Glu Ser Leu Pro His Phe Arg Gly Glu Gly Pro Gln
405 410 415
Pro Thr Arg Ile Ile Val Glu Tyr Asn Pro Phe Ser Glu Arg Thr Ile
420 425 430
Gln Asn Met Gln Arg Leu Met Ser Ser Val Asp Tyr Gln Gly Pro Arg
435 440 445
Val Leu Val Ala Met Gly Asp Phe Ser Ile Val Arg Val Thr Arg Pro
450 455 460
Leu His Gln Ala Val Gln Gly Trp Leu Thr Ser Leu Glu Glu Glu Asp
465 470 475 480
Val Asn Gln Trp Arg Ala Phe Glu Ala Glu Ala Asn Ala Ala Ala Phe
485 490 495
Ser Gly Phe Leu Asp Tyr Leu Gly Asp Thr Gln Asn Thr Arg His Pro
500 505 510
Asp Phe Lys Glu Gln Val Ser Ala Trp Leu Met Arg Leu Ala Glu Asp
515 520 525
Ser Ala Leu Arg Glu Thr Val Phe Ile Ile Ala Met Asn Ala Thr Ile
530 535 540
Ser Cys Glu Asp Arg Val Thr Leu Ala Tyr His Gln Met Gln Glu Ala
545 550 555 560
Thr Leu Val His Asp Ala Glu Arg Gly Ala Phe Asp Ser His Leu Ala
565 570 575
Glu Leu Ile Met Ala Gly Arg Glu Ile Phe Arg Leu Glu Gln Ile Glu
580 585 590
Ser Leu Ala Arg Glu Lys Val Lys Arg Leu Phe Phe Ile Asp Glu Val
595 600 605
Glu Val Phe Leu Gly Phe Gln Asn Gln Leu Arg Glu Ser Leu Ser Leu
610 615 620
Thr Thr Met Thr Arg Asp Met Arg Phe Tyr Asn Val Ser Gly Ile Thr
625 630 635 640
Glu Ser Asp Leu Asp Glu Ala Glu Ile Arg Ile Lys Met Ala Glu Asn
645 650 655
Arg Asp Phe His Lys Trp Phe Ala Leu Trp Gly Pro Trp His Lys Val
660 665 670
Leu Glu Arg Ile Ala Pro Glu Glu Trp Arg Glu Met Met Ala Lys Arg
675 680 685
Asp Glu Cys Ile Glu Thr Asp Glu Tyr Gln Ser Arg Val Asn Ala Glu
690 695 700
Leu Glu Asp Leu Arg Ile Ala Asp Asp Ser Asp Ala Glu Arg Thr Thr
705 710 715 720
Glu Val Gln Met Asp Ala Glu Arg Ala Ile Gly Ile Lys Ile Met Glu
725 730 735
Glu Ile Asn Gln Thr Leu Phe Thr Glu Ile Met Glu Asn Ile Leu Leu
740 745 750
Lys Lys Glu Val Ser Ser Leu Met Ser Ala Tyr Trp Arg
755 760 765
<210> 30
<211> 2298
<212> DNA
<213> Artificial
<220>
<223> SlrP novel E3 ligase from Enterohemorrhagic Escherichia coli
("EHEC") O157:H7
<400> 30
atgtttaata ttactaatat acaatctacg gcaaggcatc aaagtattag caatgaggcc 60
tcaacagagg tgcctttaaa agaagagata tggaataaaa taagtgcctt tttctcttca 120
gaacatcagg ttgaagcaca aaactgcatc gcttatcttt gtcatccacc tgaaaccgcc 180
tcgccagaag agatcaaaag caagtttgaa tgtttaagga tgttagcttt cccggcgtat 240
gcggataata ttcagtatag tagaggaggg gcagaccaat actgtatttt gagtgaaaat 300
agtcaggaaa ttctgtctat agtttttaat acagagggct ataccgttga gggaggggga 360
aagtcagtca cctatacccg tgtgacagaa agcgagcagg cgagtagcgc ttccggctcc 420
aaagatgctg tgaattatga gttaatctgg tctgagtggg taaaagaggc gccagcgaaa 480
gaggcagcaa atcgtgaaga acccgtacaa cggatgcgtg actgcctgaa aaataataag 540
acggaacttc gtctgaaaat attaggactt accactatac ctgcctatat tcctgagcag 600
ataactactc tgatactcga taacaatgaa ctgaaaagtt tgccggaaaa tttacaggga 660
aatataaaga ccctgtatgc caacagtaat cagctaacca gtatccctgc cacgttaccg 720
gataccatac aggaaatgga gctgagcatt aaccgtatta ctgaattgcc ggaacgtttg 780
ccttcagcgc ttcaatcgct ggatcttttc cataataaaa ttagttgctt acctgaaaat 840
ctacctgagg aacttcggta cctgagcgtt tatgataaca gcataaggac actgccagca 900
catcttccgt cagagattac ccatttgaat gtgcagagta attcgttaac cgctttgcct 960
gaaacattgc cgccgggcct gaagactctg gaggccggcg aaaatgcctt aaccagtctg 1020
cccgcatcgt taccaccaga attacaggtc ctggatgtaa gtaaaaatca gattacggtt 1080
ctgcctgaaa cacttcctcc cacgataaca acgctggatg tttcccgtaa cgcattgact 1140
aatctaccgg aaaacctccc ggcggcatta caaataatgc aggcctctcg caataacctg 1200
gtccgtctcc cggagtcgtt accccatttt cgtggtgaag gacctcaacc tacaagaata 1260
atcgtagaat ataatccttt ttcagaacga acaatacaga atatgcagcg gctaatgtcc 1320
tctgtagatt atcagggacc ccgggtattg gttgccatgg gcgacttttc aattgttcgg 1380
gtaactcgac cactgcatca agctgtccag gggtggctaa ccagtctcga ggaggaagac 1440
gtcaaccaat ggcgggcgtt tgaggcagag gcaaacgcgg cggctttcag cggattcctg 1500
gactatcttg gtgatacgca gaatacccga cacccggatt ttaaggaaca agtctccgcc 1560
tggctaatgc gcctggctga agatagcgca ctaagagaaa ccgtatttat tatagcgatg 1620
aatgcaacga taagctgtga agatcgggtc acactggcat accaccaaat gcaggaagcg 1680
acgttggttc atgatgctga aagaggcgcc tttgatagcc acttagcgga actgattatg 1740
gcggggcgtg aaatctttcg gctggagcaa atagaatcgc tcgccagaga aaaggtaaaa 1800
cggctgtttt ttattgacga agtcgaagta tttctggggt ttcagaatca gttacgagag 1860
tcgctgtcgc tgacaacaat gacccgggat atgcgatttt ataacgtttc gggtatcact 1920
gagtctgacc tggacgaggc ggaaataagg ataaaaatgg ctgaaaatag ggattttcac 1980
aaatggtttg cgctgtgggg gccgtggcat aaagtgctgg agcgcatagc gccagaagag 2040
tggcgtgaaa tgatggctaa aagggatgag tgtattgaaa cggatgagta tcagagccgg 2100
gtcaatgctg aactggaaga tttaagaata gcagacgact ctgacgcaga gcgtactact 2160
gaggtacaga tggatgcaga gcgtgctatt gggataaaaa taatggaaga gatcaatcag 2220
accctcttta ctgagatcat ggagaatata ttgctgaaaa aagaggtgag ctcgctcatg 2280
agcgcctact ggcgatag 2298
<210> 31
<211> 782
<212> PRT
<213> Artificial
<220>
<223> SopA HECT motif from Salmonella typhimurium
<400> 31
Met Lys Ile Ser Ser Gly Ala Ile Asn Phe Ser Thr Ile Pro Asn Gln
1 5 10 15
Val Lys Lys Leu Ile Thr Ser Ile Arg Glu His Thr Lys Asn Gly Leu
20 25 30
Thr Ser Lys Ile Thr Ser Val Lys Asn Thr His Thr Ser Leu Asn Glu
35 40 45
Lys Phe Lys Thr Gly Lys Asp Ser Pro Ile Glu Phe Ala Leu Pro Gln
50 55 60
Lys Ile Lys Asp Phe Phe Gln Pro Lys Asp Lys Asn Thr Leu Asn Lys
65 70 75 80
Thr Leu Ile Thr Val Lys Asn Ile Lys Asp Thr Asn Asn Ala Gly Lys
85 90 95
Lys Asn Ile Ser Ala Glu Asp Val Ser Lys Met Asn Ala Ala Phe Met
100 105 110
Arg Lys His Ile Ala Asn Gln Thr Cys Asp Tyr Asn Tyr Arg Met Thr
115 120 125
Gly Ala Ala Pro Leu Pro Gly Gly Val Ser Val Ser Ala Asn Asn Arg
130 135 140
Pro Thr Val Ser Glu Gly Arg Thr Pro Pro Val Ser Pro Ser Leu Ser
145 150 155 160
Leu Gln Ala Thr Ser Ser Pro Ser Ser Pro Ala Asp Trp Ala Lys Lys
165 170 175
Leu Thr Asp Ala Val Leu Arg Gln Lys Ala Gly Glu Thr Leu Thr Ala
180 185 190
Ala Asp Arg Asp Phe Ser Asn Ala Asp Phe Arg Asn Ile Thr Phe Ser
195 200 205
Lys Ile Leu Pro Pro Ser Phe Met Glu Arg Asp Gly Asp Ile Ile Lys
210 215 220
Gly Phe Asn Phe Ser Asn Ser Lys Phe Thr Tyr Ser Asp Ile Ser His
225 230 235 240
Leu His Phe Asp Glu Cys Arg Phe Thr Tyr Ser Thr Leu Ser Asp Val
245 250 255
Val Cys Ser Asn Thr Lys Phe Ser Asn Ser Asp Met Asn Glu Val Phe
260 265 270
Leu Gln Tyr Ser Ile Thr Thr Gln Gln Gln Pro Ser Phe Ile Asp Thr
275 280 285
Thr Leu Lys Asn Thr Leu Ile Arg His Lys Ala Asn Leu Ser Gly Val
290 295 300
Ile Leu Asn Glu Pro Asp Asn Ser Ser Pro Pro Ser Val Ser Gly Gly
305 310 315 320
Gly Asn Phe Ile Arg Leu Gly Asp Ile Trp Leu Gln Met Pro Leu Leu
325 330 335
Trp Thr Glu Asn Ala Val Asp Gly Phe Leu Asn His Glu His Asn Asn
340 345 350
Gly Lys Ser Ile Leu Met Thr Ile Asp Ser Leu Pro Asp Lys Tyr Ser
355 360 365
Gln Glu Lys Val Gln Ala Met Glu Asp Leu Val Lys Ser Leu Arg Gly
370 375 380
Gly Arg Leu Thr Glu Ala Cys Ile Arg Pro Val Glu Ser Ser Leu Val
385 390 395 400
Ser Val Leu Ala His Pro Pro Tyr Thr Gln Ser Ala Leu Ile Ser Glu
405 410 415
Trp Leu Gly Pro Val Gln Glu Arg Phe Phe Ala His Gln Cys Gln Thr
420 425 430
Tyr Asn Asp Val Pro Leu Pro Ala Pro Asp Thr Tyr Tyr Gln Gln Arg
435 440 445
Ile Leu Pro Val Leu Leu Asp Ser Phe Asp Arg Asn Ser Ala Ala Met
450 455 460
Thr Thr His Ser Gly Leu Phe Asn Gln Val Ile Leu His Cys Met Thr
465 470 475 480
Gly Val Asp Cys Thr Asp Gly Thr Arg Gln Lys Ala Ala Ala Leu Tyr
485 490 495
Glu Gln Tyr Leu Ala His Pro Ala Val Ser Pro His Ile His Asn Gly
500 505 510
Leu Phe Gly Asn Tyr Asp Gly Ser Pro Asp Trp Thr Thr Arg Ala Ala
515 520 525
Asp Asn Phe Leu Leu Leu Ser Ser Gln Asp Ser Asp Thr Ala Met Met
530 535 540
Leu Ser Thr Asp Thr Leu Leu Thr Met Leu Asn Pro Thr Pro Asp Thr
545 550 555 560
Ala Trp Asp Asn Phe Tyr Leu Leu Arg Ala Gly Glu Asn Val Ser Thr
565 570 575
Ala Gln Ile Ser Pro Val Glu Leu Phe Arg His Asp Phe Pro Val Phe
580 585 590
Leu Ala Ala Phe Asn Gln Gln Ala Thr Gln Arg Arg Phe Gly Glu Leu
595 600 605
Ile Asp Ile Ile Leu Ser Thr Glu Glu His Gly Glu Leu Asn Gln Gln
610 615 620
Phe Leu Ala Ala Thr Asn Gln Lys His Ser Thr Val Lys Leu Ile Asp
625 630 635 640
Asp Ala Ser Val Ser Arg Leu Ala Thr Ile Phe Asp Pro Leu Leu Pro
645 650 655
Glu Gly Lys Leu Ser Pro Ala His Tyr Gln His Ile Leu Ser Ala Tyr
660 665 670
His Leu Thr Asp Ala Thr Pro Gln Lys Gln Ala Glu Thr Leu Phe Cys
675 680 685
Leu Ser Thr Ala Phe Ala Arg Tyr Ser Ser Ser Ala Ile Phe Gly Thr
690 695 700
Glu His Asp Ser Pro Pro Ala Leu Arg Gly Tyr Ala Glu Ala Leu Met
705 710 715 720
Gln Lys Ala Trp Glu Leu Ser Pro Ala Ile Phe Pro Ser Ser Glu Gln
725 730 735
Phe Thr Glu Trp Ser Asp Arg Phe His Gly Leu His Gly Ala Phe Thr
740 745 750
Cys Thr Ser Val Val Ala Asp Ser Met Gln Arg His Ala Arg Lys Tyr
755 760 765
Phe Pro Ser Val Leu Ser Ser Ile Leu Pro Leu Ala Trp Ala
770 775 780
<210> 32
<211> 2349
<212> DNA
<213> Artificial
<220>
<223> SopA HECT motif from Salmonella typhimurium
<400> 32
atgaagatat catcaggcgc aattaatttt tctactattc ctaaccaggt taaaaaatta 60
attacctcta ttcgtgaaca tacgaaaaac gggctcacct caaaaataac cagtgttaaa 120
aacacgcata catctttaaa tgaaaaattt aaaacaggaa aggactcacc gattgagttc 180
gcgttaccac aaaaaataaa agacttcttt cagccgaaag ataaaaacac cttaaacaaa 240
acattgatta ctgttaaaaa tattaaagat acaaataatg caggcaagaa aaatatttca 300
gcagaagatg tctcaaaaat gaatgcagca ttcatgcgta agcatattgc aaatcaaaca 360
tgtgattata attacagaat gacaggtgcg gccccgctcc ccggtggagt ctctgtatca 420
gccaataaca ggcccacggt ttctgaaggt agaacaccac cagtatcccc ctccctctca 480
cttcaggcta cctcttcccc gtcatcacct gccgactggg ctaagaaact cacggatgca 540
gttttacgac agaaagccgg agaaaccctt acggccgcag atcgcgattt ttcaaacgca 600
gatttccgta atattacatt cagcaaaata ttgcccccca gcttcatgga gcgagacggc 660
gatattatta aggggttcaa cttttcaaat tcaaaattta cttattctga tatatctcat 720
ttacattttg acgaatgccg attcacttat tcgacactga gtgatgtagt ctgcagtaat 780
acgaaattta gtaattcaga catgaatgaa gtgtttttac agtattcaat tactacacaa 840
caacagccct cgtttattga tacaacatta aaaaatacgc ttatacgtca caaagccaac 900
ctctctggcg ttattttaaa tgaaccggat aattcatcac ctccgtcagt gtcagggggc 960
ggaaatttta ttcgtctagg tgatatctgg ctgcaaatgc cactcctttg gactgagaac 1020
gctgtggatg gatttttaaa tcatgagcac aataatggta aaagtattct gatgaccatt 1080
gacagcctgc ccgataaata cagtcaggaa aaagtccagg caatggaaga cctggttaag 1140
tcattgcggg gtggccgctt aacagaggca tgtatccggc cagttgaaag ttcgctggta 1200
agcgtactgg cccacccccc ctatacgcaa agtgcgctta tcagcgagtg gctcgggcct 1260
gttcaggaac gtttttttgc ccaccagtgc cagacctata atgacgttcc cctgccggct 1320
cctgacacat attatcagca gcgcatactg cctgtgttgc tggattcgtt tgacaggaac 1380
agcgccgcca tgaccactca cagcggactc tttaatcagg tgattttaca ctgtatgaca 1440
ggcgtggact gcactgatgg cacccgccag aaagctgcag cgctttatga acagtatctt 1500
gctcacccgg cggtgtctcc ccacatccat aatgggctct tcggcaatta tgatggcagc 1560
ccggactgga caacccgcgc tgcagataat ttcctgctgc tttcctccca agattcagac 1620
acggcgatga tgctctccac tgacacgctg ttaacaatgc taaaccctac tcctgacact 1680
gcatgggaca acttttacct gctgcgagcc ggagagaacg tttccaccgc gcaaatctct 1740
ccggtagagt tattccgtca tgactttccg gtgtttctcg ccgcatttaa tcagcaggcc 1800
acgcagcgac gctttgggga gctgattgat atcatcctca gcactgaaga gcacggggag 1860
ctgaaccagc agtttcttgc cgccacgaac cagaaacatt ccaccgtgaa gttgattgat 1920
gatgcctcag tgtcgcgtct ggccaccatt tttgacccct tgcttcctga aggcaaactc 1980
agcccggcac actaccagca catcctcagt gcttatcacc tgacggacgc caccccacag 2040
aagcaggcgg aaaccctgtt ctgtctcagt accgcattcg cacgctattc ctccagcgcc 2100
attttcggca ctgagcatga ctctccgccg gccctgagag gctatgcgga ggcgctgatg 2160
cagaaagcct gggagctgtc tccggcgata ttcccatcca gcgaacagtt taccgagtgg 2220
tccgaccgtt ttcacggcct ccatggcgcc tttacctgta ccagcgttgt ggcggatagt 2280
atgcaacgtc atgccagaaa atatttcccg agtgttctgt catccatcct gccactggcc 2340
tgggcgtaa 2349
<210> 33
<211> 700
<212> PRT
<213> Artificial
<220>
<223> SspH1 novel E3 ligase from Salmonella typhimurium
<400> 33
Met Phe Asn Ile Arg Asn Thr Gln Pro Ser Val Ser Met Gln Ala Ile
1 5 10 15
Ala Gly Ala Ala Ala Pro Glu Ala Ser Pro Glu Glu Ile Val Trp Glu
20 25 30
Lys Ile Gln Val Phe Phe Pro Gln Glu Asn Tyr Glu Glu Ala Gln Gln
35 40 45
Cys Leu Ala Glu Leu Cys His Pro Ala Arg Gly Met Leu Pro Asp His
50 55 60
Ile Ser Ser Gln Phe Ala Arg Leu Lys Ala Leu Thr Phe Pro Ala Trp
65 70 75 80
Glu Glu Asn Ile Gln Cys Asn Arg Asp Gly Ile Asn Gln Phe Cys Ile
85 90 95
Leu Asp Ala Gly Ser Lys Glu Ile Leu Ser Ile Thr Leu Asp Asp Ala
100 105 110
Gly Asn Tyr Thr Val Asn Cys Gln Gly Tyr Ser Glu Ala His Asp Phe
115 120 125
Ile Met Asp Thr Glu Pro Gly Glu Glu Cys Thr Glu Phe Ala Glu Gly
130 135 140
Ala Ser Gly Thr Ser Leu Arg Pro Ala Thr Thr Val Ser Gln Lys Ala
145 150 155 160
Ala Glu Tyr Asp Ala Val Trp Ser Lys Trp Glu Arg Asp Ala Pro Ala
165 170 175
Gly Glu Ser Pro Gly Arg Ala Ala Val Val Gln Glu Met Arg Asp Cys
180 185 190
Leu Asn Asn Gly Asn Pro Val Leu Asn Val Gly Ala Ser Gly Leu Thr
195 200 205
Thr Leu Pro Asp Arg Leu Pro Pro His Ile Thr Thr Leu Val Ile Pro
210 215 220
Asp Asn Asn Leu Thr Ser Leu Pro Glu Leu Pro Glu Gly Leu Arg Glu
225 230 235 240
Leu Glu Val Ser Gly Asn Leu Gln Leu Thr Ser Leu Pro Ser Leu Pro
245 250 255
Gln Gly Leu Gln Lys Leu Trp Ala Tyr Asn Asn Trp Leu Ala Ser Leu
260 265 270
Pro Thr Leu Pro Pro Gly Leu Gly Asp Leu Ala Val Ser Asn Asn Gln
275 280 285
Leu Thr Ser Leu Pro Glu Met Pro Pro Ala Leu Arg Glu Leu Arg Val
290 295 300
Ser Gly Asn Asn Leu Thr Ser Leu Pro Ala Leu Pro Ser Gly Leu Gln
305 310 315 320
Lys Leu Trp Ala Tyr Asn Asn Arg Leu Thr Ser Leu Pro Glu Met Ser
325 330 335
Pro Gly Leu Gln Glu Leu Asp Val Ser His Asn Gln Leu Thr Arg Leu
340 345 350
Pro Gln Ser Leu Thr Gly Leu Ser Ser Ala Ala Arg Val Tyr Leu Asp
355 360 365
Gly Asn Pro Leu Ser Val Arg Thr Leu Gln Ala Leu Arg Asp Ile Ile
370 375 380
Gly His Ser Gly Ile Arg Ile His Phe Asp Met Ala Gly Pro Ser Val
385 390 395 400
Pro Arg Glu Ala Arg Ala Leu His Leu Ala Val Ala Asp Trp Leu Thr
405 410 415
Ser Ala Arg Glu Gly Glu Ala Ala Gln Ala Asp Arg Trp Gln Ala Phe
420 425 430
Gly Leu Glu Asp Asn Ala Ala Ala Phe Ser Leu Val Leu Asp Arg Leu
435 440 445
Arg Glu Thr Glu Asn Phe Lys Lys Asp Ala Gly Phe Lys Ala Gln Ile
450 455 460
Ser Ser Trp Leu Thr Gln Leu Ala Glu Asp Ala Ala Leu Arg Ala Lys
465 470 475 480
Thr Phe Ala Met Ala Thr Glu Ala Thr Ser Thr Cys Glu Asp Arg Val
485 490 495
Thr His Ala Leu His Gln Met Asn Asn Val Gln Leu Val His Asn Ala
500 505 510
Glu Lys Gly Glu Tyr Asp Asn Asn Leu Gln Gly Leu Val Ser Thr Gly
515 520 525
Arg Glu Met Phe Arg Leu Ala Thr Leu Glu Gln Ile Ala Arg Glu Lys
530 535 540
Ala Gly Thr Leu Ala Leu Val Asp Asp Val Glu Val Tyr Leu Ala Phe
545 550 555 560
Gln Asn Lys Leu Lys Glu Ser Leu Glu Leu Thr Ser Val Thr Ser Glu
565 570 575
Met Arg Phe Phe Asp Val Ser Gly Val Thr Val Ser Asp Leu Gln Ala
580 585 590
Ala Glu Leu Gln Val Lys Thr Ala Glu Asn Ser Gly Phe Ser Lys Trp
595 600 605
Ile Leu Gln Trp Gly Pro Leu His Ser Val Leu Glu Arg Lys Val Pro
610 615 620
Glu Arg Phe Asn Ala Leu Arg Glu Lys Gln Ile Ser Asp Tyr Glu Asp
625 630 635 640
Thr Tyr Arg Lys Leu Tyr Asp Glu Val Leu Lys Ser Ser Gly Leu Val
645 650 655
Asp Asp Thr Asp Ala Glu Arg Thr Ile Gly Val Ser Ala Met Asp Ser
660 665 670
Ala Lys Lys Glu Phe Leu Asp Gly Leu Arg Ala Leu Val Asp Glu Val
675 680 685
Leu Gly Ser Tyr Leu Thr Ala Arg Trp Arg Leu Asn
690 695 700
<210> 34
<211> 2103
<212> DNA
<213> Artificial
<220>
<223> SspH1 novel E3 ligase from Salmonella typhimurium
<400> 34
atgtttaata tccgcaatac acaaccttct gtaagtatgc aggctattgc tggtgcagcg 60
gcaccagagg catctccgga agaaattgta tgggaaaaaa ttcaggtttt tttcccgcag 120
gaaaattacg aagaagcgca acagtgtctc gctgaacttt gccatccggc ccggggaatg 180
ttgcctgatc atatcagcag ccagtttgcg cgtttaaaag cgcttacctt ccccgcgtgg 240
gaggagaata ttcagtgtaa cagggatggt ataaatcagt tttgtattct ggatgcaggc 300
agcaaggaga tattgtcaat cactcttgat gatgccggga actataccgt gaattgtcag 360
gggtacagtg aagcacatga cttcatcatg gacacagaac cgggagagga atgcacagaa 420
ttcgcggagg gggcatccgg gacatccctc cgccctgcca caacggtttc acagaaggca 480
gcagagtatg atgctgtctg gtcaaaatgg gaaagggatg caccagcagg agagtcaccc 540
ggccgcgcag cagtggtaca ggaaatgcgt gattgcctga ataacggcaa tccagtgctt 600
aacgtgggag cgtcaggtct taccacctta ccagaccgtt taccaccgca tattacaaca 660
ctggttattc ctgataataa tctgaccagc ctgccggagt tgccggaagg actacgggag 720
ctggaggtct ctggtaacct acaactgacc agcctgccat cgctgccgca gggactacag 780
aagctgtggg cctataataa ttggctggcc agcctgccga cgttgccgcc aggactaggg 840
gatctggcgg tctctaataa ccagctgacc agcctgccgg agatgccgcc agcactacgg 900
gagctgaggg tctctggtaa caacctgacc agcctgccgg cgctgccgtc aggactacag 960
aagctgtggg cctataataa tcggctgacc agcctgccgg agatgtcgcc aggactacag 1020
gagctggatg tctctcataa ccagctgacc cgcctgccgc aaagcctcac gggtctgtct 1080
tcagcggcac gcgtatatct ggacgggaat ccactgtctg tacgcactct gcaggctctg 1140
cgggacatca ttggccattc aggcatcagg atacacttcg atatggcggg gccttccgtc 1200
ccccgggaag cccgggcact gcacctggcg gtcgctgact ggctgacgtc tgcacgggag 1260
ggggaagcgg cccaggcaga cagatggcag gcgttcggac tggaagataa cgccgccgcc 1320
ttcagcctgg tcctggacag actgcgtgag acggaaaact tcaaaaaaga cgcgggcttt 1380
aaggcacaga tatcatcctg gctgacacaa ctggctgaag atgctgcgct gagagcaaaa 1440
acctttgcca tggcaacaga ggcaacatca acctgcgagg accgggtcac acatgccctg 1500
caccagatga ataacgtaca actggtacat aatgcagaaa aaggggaata cgacaacaat 1560
ctccaggggc tggtttccac ggggcgtgag atgttccgcc tggcaacact ggaacagatt 1620
gcccgggaaa aagccggaac actggcttta gtcgatgacg ttgaggtcta tctggcgttc 1680
cagaataagc tgaaggaatc acttgagctg accagcgtga cgtcagaaat gcgtttcttt 1740
gacgtttccg gcgtgacggt ttcagacctt caggctgcgg agcttcaggt gaaaaccgct 1800
gaaaacagcg ggttcagtaa atggatactg cagtgggggc cgttacacag cgtgctggaa 1860
cgcaaagtgc cggaacgctt taacgcgctt cgtgaaaagc aaatatcgga ttatgaagac 1920
acgtaccgga agctgtatga cgaagtgctg aaatcgtccg ggctggtcga cgataccgat 1980
gcagaacgta ctatcggagt aagtgcgatg gatagtgcga aaaaagaatt tctggatggc 2040
ctgcgcgctc ttgtggatga ggtgctgggt agctatctga cagcccggtg gcgtcttaac 2100
taa 2103
<210> 35
<211> 788
<212> PRT
<213> Artificial
<220>
<223> SspH2 novel E3 ligase from Salmonella typhimurium
<400> 35
Met Pro Phe His Ile Gly Ser Gly Cys Leu Pro Ala Thr Ile Ser Asn
1 5 10 15
Arg Arg Ile Tyr Arg Ile Ala Trp Ser Asp Thr Pro Pro Glu Met Ser
20 25 30
Ser Trp Glu Lys Met Lys Glu Phe Phe Cys Ser Thr His Gln Thr Glu
35 40 45
Ala Leu Glu Cys Ile Trp Thr Ile Cys His Pro Pro Ala Gly Thr Thr
50 55 60
Arg Glu Asp Val Ile Asn Arg Phe Glu Leu Leu Arg Thr Leu Ala Tyr
65 70 75 80
Ala Gly Trp Glu Glu Ser Ile His Ser Gly Gln His Gly Glu Asn Tyr
85 90 95
Phe Cys Ile Leu Asp Glu Asp Ser Gln Glu Ile Leu Ser Val Thr Leu
100 105 110
Asp Asp Ala Gly Asn Tyr Thr Val Asn Cys Gln Gly Tyr Ser Glu Thr
115 120 125
His Arg Leu Thr Leu Asp Thr Ala Gln Gly Glu Glu Gly Thr Gly His
130 135 140
Ala Glu Gly Ala Ser Gly Thr Phe Arg Thr Ser Phe Leu Pro Ala Thr
145 150 155 160
Thr Ala Pro Gln Thr Pro Ala Glu Tyr Asp Ala Val Trp Ser Ala Trp
165 170 175
Arg Arg Ala Ala Pro Ala Glu Glu Ser Arg Gly Arg Ala Ala Val Val
180 185 190
Gln Lys Met Arg Ala Cys Leu Asn Asn Gly Asn Ala Val Leu Asn Val
195 200 205
Gly Glu Ser Gly Leu Thr Thr Leu Pro Asp Cys Leu Pro Ala His Ile
210 215 220
Thr Thr Leu Val Ile Pro Asp Asn Asn Leu Thr Ser Leu Pro Ala Leu
225 230 235 240
Pro Pro Glu Leu Arg Thr Leu Glu Val Ser Gly Asn Gln Leu Thr Ser
245 250 255
Leu Pro Val Leu Pro Pro Gly Leu Leu Glu Leu Ser Ile Phe Ser Asn
260 265 270
Pro Leu Thr His Leu Pro Ala Leu Pro Ser Gly Leu Cys Lys Leu Trp
275 280 285
Ile Phe Gly Asn Gln Leu Thr Ser Leu Pro Val Leu Pro Pro Gly Leu
290 295 300
Gln Glu Leu Ser Val Ser Asp Asn Gln Leu Ala Ser Leu Pro Ala Leu
305 310 315 320
Pro Ser Glu Leu Cys Lys Leu Trp Ala Tyr Asn Asn Gln Leu Thr Ser
325 330 335
Leu Pro Met Leu Pro Ser Gly Leu Gln Glu Leu Ser Val Ser Asp Asn
340 345 350
Gln Leu Ala Ser Leu Pro Thr Leu Pro Ser Glu Leu Tyr Lys Leu Trp
355 360 365
Ala Tyr Asn Asn Arg Leu Thr Ser Leu Pro Ala Leu Pro Ser Gly Leu
370 375 380
Lys Glu Leu Ile Val Ser Gly Asn Arg Leu Thr Ser Leu Pro Val Leu
385 390 395 400
Pro Ser Glu Leu Lys Glu Leu Met Val Ser Gly Asn Arg Leu Thr Ser
405 410 415
Leu Pro Met Leu Pro Ser Gly Leu Leu Ser Leu Ser Val Tyr Arg Asn
420 425 430
Gln Leu Thr Arg Leu Pro Glu Ser Leu Ile His Leu Ser Ser Glu Thr
435 440 445
Thr Val Asn Leu Glu Gly Asn Pro Leu Ser Glu Arg Thr Leu Gln Ala
450 455 460
Leu Arg Glu Ile Thr Ser Ala Pro Gly Tyr Ser Gly Pro Ile Ile Arg
465 470 475 480
Phe Asp Met Ala Gly Ala Ser Ala Pro Arg Glu Thr Arg Ala Leu His
485 490 495
Leu Ala Ala Ala Asp Trp Leu Val Pro Ala Arg Glu Gly Glu Pro Ala
500 505 510
Pro Ala Asp Arg Trp His Met Phe Gly Gln Glu Asp Asn Ala Asp Ala
515 520 525
Phe Ser Leu Phe Leu Asp Arg Leu Ser Glu Thr Glu Asn Phe Ile Lys
530 535 540
Asp Ala Gly Phe Lys Ala Gln Ile Ser Ser Trp Leu Ala Gln Leu Ala
545 550 555 560
Glu Asp Glu Ala Leu Arg Ala Asn Thr Phe Ala Met Ala Thr Glu Ala
565 570 575
Thr Ser Ser Cys Glu Asp Arg Val Thr Phe Phe Leu His Gln Met Lys
580 585 590
Asn Val Gln Leu Val His Asn Ala Glu Lys Gly Gln Tyr Asp Asn Asp
595 600 605
Leu Ala Ala Leu Val Ala Thr Gly Arg Glu Met Phe Arg Leu Gly Lys
610 615 620
Leu Glu Gln Ile Ala Arg Glu Lys Val Arg Thr Leu Ala Leu Val Asp
625 630 635 640
Glu Ile Glu Val Trp Leu Ala Tyr Gln Asn Lys Leu Lys Lys Ser Leu
645 650 655
Gly Leu Thr Ser Val Thr Ser Glu Met Arg Phe Phe Asp Val Ser Gly
660 665 670
Val Thr Val Thr Asp Leu Gln Asp Ala Glu Leu Gln Val Lys Ala Ala
675 680 685
Glu Lys Ser Glu Phe Arg Glu Trp Ile Leu Gln Trp Gly Pro Leu His
690 695 700
Arg Val Leu Glu Arg Lys Ala Pro Glu Arg Val Asn Ala Leu Arg Glu
705 710 715 720
Lys Gln Ile Ser Asp Tyr Glu Glu Thr Tyr Arg Met Leu Ser Asp Thr
725 730 735
Glu Leu Arg Pro Ser Gly Leu Val Gly Asn Thr Asp Ala Glu Arg Thr
740 745 750
Ile Gly Ala Arg Ala Met Glu Ser Ala Lys Lys Thr Phe Leu Asp Gly
755 760 765
Leu Arg Pro Leu Val Glu Glu Met Leu Gly Ser Tyr Leu Asn Val Gln
770 775 780
Trp Arg Arg Asn
785
<210> 36
<211> 2367
<212> DNA
<213> Artificial
<220>
<223> SspH2 novel E3 ligase from Salmonella typhimurium
<400> 36
atgccctttc atattggaag cggatgtctt cccgccacca tcagtaatcg ccgcatttat 60
cgtattgcct ggtctgatac cccccctgaa atgagttcct gggaaaaaat gaaggaattt 120
ttttgctcaa cgcaccagac tgaagcgctg gagtgcatct ggacgatttg tcacccgccg 180
gccggaacga cgcgggagga tgtgatcaac agatttgaac tgctcaggac gctcgcgtat 240
gccggatggg aggaaagcat tcattccggc cagcacgggg aaaattactt ctgtattctg 300
gatgaagaca gtcaggagat attgtcagtc acccttgatg atgccgggaa ctataccgta 360
aattgccagg ggtacagtga aacacatcgc ctcaccctgg acacagcaca gggtgaggag 420
ggcacaggac acgcggaagg ggcatccggg acattcagga catccttcct ccctgccaca 480
acggctccac agacgccagc agagtatgat gctgtctggt cagcgtggag aagggctgca 540
cccgcagaag agtcacgcgg ccgtgcagca gtggtacaga aaatgcgtgc ctgcctgaat 600
aatggcaatg cagtgcttaa cgtgggagaa tcaggtctta ccaccttgcc agactgttta 660
cccgcgcata ttaccacact ggttattcct gataataatc tgaccagcct gccggcgctg 720
ccgccagaac tgcggacgct ggaggtctct ggtaaccagc tgactagcct gccggtgctg 780
ccgccaggac tactggaact gtcgatcttt agtaacccgc tgacccacct gccggcgctg 840
ccgtcaggac tatgtaagct gtggatcttt ggtaatcaac tgaccagcct gccggtgttg 900
ccgccagggc tacaggagct gtcggtatct gataaccaac tggccagcct gccggcgctg 960
ccgtcagaat tatgtaagct gtgggcctat aataaccagc tgaccagcct gccgatgttg 1020
ccgtcagggc tacaggagct gtcggtatct gataaccaac tggccagcct gccgacgctg 1080
ccgtcagaat tatataagct gtgggcctat aataatcggc tgaccagcct gccggcgttg 1140
ccgtcaggac tgaaggagct gattgtatct ggtaaccggc tgaccagtct gccggtgctg 1200
ccgtcagaac tgaaggagct gatggtatct ggtaaccggc tgaccagcct gccgatgctg 1260
ccgtcaggac tactgtcgct gtcggtctat cgtaaccagc tgacccgcct gccggaaagt 1320
ctcattcatc tgtcttcaga gacaaccgta aatctggaag ggaacccact gtctgaacgt 1380
actttgcagg cgctgcggga gatcaccagc gcgcctggct attcaggccc cataatacga 1440
ttcgatatgg cgggagcctc cgccccccgg gaaactcggg cactgcacct ggcggccgct 1500
gactggctgg tgcctgcccg ggagggggaa ccggctcctg cagacagatg gcatatgttc 1560
ggacaggaag ataacgccga cgcattcagc ctcttcctgg acagactgag tgagacggaa 1620
aacttcataa aggacgcggg gtttaaggca cagatatcgt cctggctggc acaactggct 1680
gaagatgagg cgttaagagc aaacaccttt gctatggcaa cagaggcaac ctcaagctgc 1740
gaggaccggg tcacattttt tttgcaccag atgaagaacg tacagctggt acataatgca 1800
gaaaaagggc aatacgataa cgatctcgcg gcgctggttg ccacggggcg tgagatgttc 1860
cgtctgggaa aactggaaca gattgcccgg gaaaaggtca gaacgctggc tctcgttgat 1920
gaaattgagg tctggctggc gtatcagaat aagctgaaga aatcactcgg gctgaccagc 1980
gtgacgtcag aaatgcgttt ctttgacgta tccggcgtga cggttacaga ccttcaggac 2040
gcggagcttc aggtgaaagc cgctgaaaaa agcgagttca gggagtggat actgcagtgg 2100
gggccgttac acagagtgct ggagcgcaaa gcgccggaac gcgttaacgc gcttcgtgaa 2160
aagcaaatat cggattatga ggaaacgtac cggatgctgt ctgacacaga gctgagaccg 2220
tctgggctgg tcggtaatac cgatgcagag cgcactatcg gagcaagagc gatggagagc 2280
gcgaaaaaga catttttgga tggcctgcga cctcttgtgg aggagatgct ggggagctat 2340
ctgaacgttc agtggcgtcg taactga 2367
<210> 37
<211> 660
<212> PRT
<213> Artificial
<220>
<223> XopL unconventional motif from Xanthomonas campestris
<400> 37
Met Arg Arg Val Asp Gln Pro Arg Pro Pro Gly Thr Pro Phe Gly Leu
1 5 10 15
Arg Glu Gln Thr Thr Ser Asn Ala Asp Ala Pro Ala Arg Thr Ala Pro
20 25 30
Pro Ala His Pro Ala Pro Glu Arg Pro Thr Gly Met Leu Gly Gly Leu
35 40 45
Thr Arg Tyr Val Pro Gly Asp Arg Ser Gly Arg Pro Pro Ala Met Pro
50 55 60
Ala Ala Ala Glu Thr Ser Arg Arg Pro Thr Thr Ser Ala Arg Pro Leu
65 70 75 80
Pro Tyr Gly Gly Ser Gly Ser Ala Ala Arg Met Asn Glu Ala Ala Gly
85 90 95
His Pro Leu Arg Met Pro Gln Leu Pro Gln Leu Ser Asp Ile Glu Arg
100 105 110
Ala Arg Phe His Ser Val Thr Thr Asp Ser Gln His Leu Arg Pro Val
115 120 125
Arg Pro Arg Met Pro Pro Pro Val Gly Ala Ser Pro Leu Arg Arg Ser
130 135 140
Thr Ala Leu Arg Pro Tyr His Asp Val Leu Ser Gln Trp Gln Arg His
145 150 155 160
Tyr Asn Ala Asp Arg Asn Arg Trp His Ser Ala Trp Arg Gln Ala Asn
165 170 175
Ser Asn Asn Pro Gln Ile Glu Thr Arg Thr Gly Arg Ala Leu Lys Ala
180 185 190
Thr Ala Asp Leu Leu Glu Asp Ala Thr Gln Pro Gly Arg Val Ala Leu
195 200 205
Glu Leu Arg Ser Val Pro Leu Pro Gln Phe Pro Asp Gln Ala Phe Arg
210 215 220
Leu Ser His Leu Gln His Met Thr Ile Asp Ala Ala Gly Leu Met Glu
225 230 235 240
Leu Pro Asp Thr Met Gln Gln Phe Ala Gly Leu Glu Thr Leu Thr Leu
245 250 255
Ala Arg Asn Pro Leu Arg Ala Leu Pro Ala Ser Ile Ala Ser Leu Asn
260 265 270
Arg Leu Arg Glu Leu Ser Ile Arg Ala Cys Pro Glu Leu Thr Glu Leu
275 280 285
Pro Glu Pro Leu Ala Ser Thr Asp Ala Ser Gly Glu His Gln Gly Leu
290 295 300
Val Asn Leu Gln Ser Leu Arg Leu Glu Trp Thr Gly Ile Arg Ser Leu
305 310 315 320
Pro Ala Ser Ile Ala Asn Leu Gln Asn Leu Lys Ser Leu Lys Ile Arg
325 330 335
Asn Ser Pro Leu Ser Ala Leu Gly Pro Ala Ile His His Leu Pro Lys
340 345 350
Leu Glu Glu Leu Asp Leu Arg Gly Cys Thr Ala Leu Arg Asn Tyr Pro
355 360 365
Pro Ile Phe Gly Gly Arg Ala Pro Leu Lys Arg Leu Ile Leu Lys Asp
370 375 380
Cys Ser Asn Leu Leu Thr Leu Pro Leu Asp Ile His Arg Leu Thr Gln
385 390 395 400
Leu Glu Lys Leu Asp Leu Arg Gly Cys Val Asn Leu Ser Arg Leu Pro
405 410 415
Ser Leu Ile Ala Gln Leu Pro Ala Asn Cys Ile Ile Leu Val Pro Pro
420 425 430
His Leu Gln Ala Gln Leu Asp Gln His Arg Pro Val Ala Arg Pro Ala
435 440 445
Glu Pro Gly Arg Thr Gly Pro Thr Thr Pro Ala Leu Ser Pro Ser Ala
450 455 460
Ala Gly Asp Arg Ala Gly Pro Ser Ser Ser Ala Thr Ala Ser Glu Leu
465 470 475 480
Leu Leu Thr Ala Ala Leu Glu Arg Ile Glu Asp Thr Ala Gln Ala Met
485 490 495
Leu Ser Thr Val Ile Asp Glu Glu Arg Asn Pro Phe Leu Glu Gly Ala
500 505 510
Pro Ser Tyr Leu Pro Gly Lys Arg Pro Thr Asp Val Thr Thr Phe Gly
515 520 525
Gln Val Pro Ala Leu Arg Asp Met Leu Ala Glu Ser Arg Asp Leu Glu
530 535 540
Phe Leu Gln Arg Val Ser Asp Met Ala Gly Pro Ser Pro Arg Ile Glu
545 550 555 560
Asp Pro Ser Glu Glu Gly Leu Ala Arg His Tyr Thr Asn Val Ser Asn
565 570 575
Trp Lys Ala Gln Lys Ser Ala His Leu Gly Ile Val Asp His Leu Gly
580 585 590
Gln Phe Val Tyr His Glu Gly Ser Pro Leu Asp Val Ala Thr Leu Ala
595 600 605
Lys Ala Val Gln Met Trp Lys Thr Arg Glu Leu Ile Val His Ala His
610 615 620
Pro Gln Asp Arg Ala Arg Phe Pro Glu Leu Ala Val His Ile Pro Glu
625 630 635 640
Gln Val Ser Asp Asp Ser Asp Ser Glu Gln Gln Thr Ser Pro Glu Pro
645 650 655
Ser Gly His Gln
660
<210> 38
<211> 1983
<212> DNA
<213> Artificial
<220>
<223> XopL unconventional motif from Xanthomonas campestris
<400> 38
atgcgacgcg tcgatcaacc acgcccgccg ggcacgcctt tcggactgcg ggagcagact 60
acgtccaatg cggatgcgcc cgcgcgcact gccccacccg cacaccccgc gcccgagcgc 120
cctaccggca tgctcggcgg actgaccaga tatgtgcctg gcgatcggtc cgggcgaccg 180
ccagcaatgc ctgccgctgc cgagacctct cgccggccaa ccacctccgc ccgcccgctt 240
ccctacggcg gatccggcag cgccgcgcgg atgaacgagg cggctggaca tcctttgcgg 300
atgccgcaat tgccacagct cagcgacata gaacgcgctc gcttccactc cgtcaccacc 360
gactcgcaac acttgcggcc ggtgcgcccc cgtatgccac cgcccgtggg cgcttcaccc 420
ttacggcgct ccacagcgct gcgcccgtac cacgacgtgc tgtcgcaatg gcaacgccac 480
tacaacgcag atcgcaatcg ctggcacagc gcatggcgcc aggccaacag caacaacccg 540
cagatcgaga ctcgcacagg ccgggcgctg aaggcgacag ccgacctgct ggaggacgca 600
acccaaccgg gccgggtcgc gctggagctg cgctcagttc cgctgccgca atttcccgac 660
caggcattcc gtctttcgca tctgcagcac atgacgatcg acgcggcagg gttgatggag 720
ctcccggaca ccatgcagca atttgcgggc ctggaaacac tcacgctcgc acgcaatccg 780
cttcgcgcgc taccggcatc catcgcaagc ctcaaccgat tacgcgagct ctccatccgc 840
gcctgcccgg aattgacgga acttcccgaa cccctggcaa gcaccgatgc atccggcgag 900
caccagggct tggtcaacct gcagagccta cggctggaat ggaccgggat cagatcgctt 960
ccggcgtcca tcgccaacct gcaaaatctg aaaagcctga agatacgcaa ctcgccgctg 1020
tccgcccttg gcccggccat ccatcacctg ccaaagttgg aggagcttga tttgcggggc 1080
tgtaccgcgc tgcgcaacta tccgccgatt ttcggcggcc gtgcgccact gaagcgactg 1140
attctgaaag actgcagcaa cctgctcacg ctgccactgg acattcaccg cctgacgcag 1200
ctggaaaaac tcgatctgcg aggttgcgtc aacctttcca gactgccctc gttgatcgcc 1260
caattacctg ccaattgcat catcctggtg ccgccgcatc tccaagcgca gctcgaccag 1320
catcgtccag ttgcgcgccc cgccgaacca gggcggaccg gaccgaccac cccagctctc 1380
tcgccctctg ctgccggcga ccgcgccggg ccatcctctt cggcgaccgc cagcgaactg 1440
cttcttaccg ctgcgctcga acgcatcgaa gacaccgcac aggccatgct gagcacggtc 1500
atcgatgaag aaagaaatcc ctttctggaa ggtgctccat cctatctccc aggaaaacgc 1560
cctaccgatg tcaccacctt cggccaagtt ccggcattgc gggacatgct ggcagaaagc 1620
agggatcttg agttcctgca acgggtaagc gacatggcag gcccatcccc cagaatcgaa 1680
gacccgagcg aggaaggcct cgcccgccac tacacgaacg tcagcaactg gaaggcgcag 1740
aagagcgcac acctgggcat cgtcgatcat ctcgggcagt tcgtttatca cgaaggaagc 1800
ccgctcgacg tagcgacatt ggccaaggca gtgcagatgt ggaagacccg tgagctgatc 1860
gtccacgcac acccgcaaga ccgcgcgcgc tttcccgagc tcgctgtgca cattcccgag 1920
caggtcagcg acgactctga tagcgaacag cagacaagcc cggaaccttc aggccatcag 1980
tag 1983
先に述べたように、uAbの治療的開発のための主要な障壁は、細胞内送達である。Osherovich,L.,“Degradation From Within,”Science-Business Exchange 7:10-11(2014)、これは、参照によりその全体が本明細書に組み込まれる。細胞透過性のために設計することができるより小さいPROTACとは異なり(Buckley et al.,“Small-Molecule Control of Intracellular Protein Levels Through Modulation of the Ubiquitin Proteasome System,”Angew Chem.Int.Ed.Engl.53(9):2312-30(2014)、これは、参照によりその全体が本明細書に組み込まれる)、uAbは、細胞膜を効果的に貫通しない比較的嵩高いタンパク質である。この問題を修正するために、バイオインスパイアードmRNA送達戦略を実施し、それによって、追加の3’末端ポリアデノシン(「ポリA」)テールを伴うGS2-IpaHをコードするmRNAは、mRNA安定性を改善しかつ真核細胞内でmRNA翻訳を刺激するように働くポリA結合タンパク質(「PABP」)と化学量論的に複合体化された(Li et al.,“Polyamine-Mediated Stoichiometric Assembly of Ribonucleoproteins for Enhanced mRNA Delivery,”Angew Chem.Int.Ed.Engl.56(44):13709-12(2017)、これは、参照によりその全体が本明細書に組み込まれる)。得られたリボヌクレオタンパク質(「RNP」)をカチオン性ポリペプチドで安定化して、mRNAを分解から保護し、細胞によるその取り込みを可能にし、そのエンドソームエスケープを促進した。重要なことに、これらの共アセンブルしたナノプレックスは、GFPを安定的に発現する培養哺乳動物細胞への導入後、およびGFPを普遍的に発現するトランスジェニックマウスへの投与後に効率的なGFPサイレンシングを引き起こす様式で、GS2-IpaH9.8mRNAを送達した。まとめると、本明細書に記載される結果は、uAb媒介性プロテオーム編集が、細胞およびマウスにおけるタンパク質の標的分解のための効果的な戦略であることを実証し、それによって、uAbのステージを、薬物発見のためのツールとして、およびいわゆる「新薬の開発につながらない(undruggable)」標的を薬理学的にヒットする可能性を有する治療候補として設定する。
[本発明1001]
E3ユビキチンリガーゼ(E3)モチーフを含む分解ドメインと、
前記分解ドメインを基質へと特異的に方向付けることができる標的指向ドメインであって、前記分解ドメインに対して異種である、標的指向ドメインと、
前記分解ドメインを前記標的指向ドメインに結合させるリンカーと
を含む、単離されたキメラ分子。
[本発明1002]
前記E3モチーフが、修飾結合領域を有しない前記E3モチーフと比較して前記基質への結合を阻害するまたは減少させる修飾結合領域を含む、本発明1001のキメラ分子。
[本発明1003]
前記修飾が、前記結合領域における変異または欠失である、本発明1002のキメラ分子。
[本発明1004]
前記E3モチーフが、前記基質のタンパク質分解を可能にする、本発明1001のキメラ分子。
[本発明1005]
前記E3モチーフが、細胞型特異的または組織特異的リガーゼ機能を保有する、本発明1001のキメラ分子。
[本発明1006]
前記リガーゼ機能が、細胞型特異的であり、前記細胞型は、皮膚細胞、筋肉細胞、上皮細胞、内皮細胞、幹細胞、臍帯血管細胞、角膜細胞、心筋細胞、大動脈細胞、角膜上皮細胞、体細胞、線維芽細胞、ケラチノサイト、メラノサイト、脂肪細胞、骨細胞、骨芽細胞、気道細胞、微小血管細胞、乳房細胞、血管細胞、軟骨細胞、胎盤細胞、肝細胞、膠細胞、表皮細胞、角膜輪部幹細胞、歯周幹細胞、骨髄間質細胞、ハイブリドーマ細胞、腎臓細胞、膵島、関節軟骨細胞、神経芽細胞、リンパ球、および赤血球からなる群から選択される、本発明1005のキメラ分子。
[本発明1007]
前記分解ドメインが細菌病原体由来である、本発明1001のキメラ分子。
[本発明1008]
前記細菌病原体が、シゲラ(Shigella)、サルモネラ(Salmonella)、バチルス(Bacillus)、バルトネラ(Bartonella)、ボルデテラ(Bordetella)、ボレリア(Borrelia)、ブルセラ(Brucella)、カンピロバクター(Campylobacter)、クラミジア(Chlamydia)およびクラミドフィラ(Chlamydophila)、クロストリジウム(Clostridium)、コリネバクテリウム(Corynebacterium)、エンテロコッカス(Enterococcus)、エシェリキア(Escherichia)、フランシセラ(Francisella)、ヘモフィルス(Haemophilus)、ヘリコバクター(Helicobacter)、レジオネラ(Legionella)、レプトスピラ(Leptospira)、リステリア(Listeria)、マイコバクテリウム(Mycobacterium)、マイコプラズマ(Mycoplasma)、ナイセリア(Neisseria)、シュードモナス(Pseudomonas)、リケッチア(Rickettsia)、スタフィロコッカス(Staphylococcus)、ストレプトコッカス(Streptococcus)、トレポネーマ(Treponema)、ウレアプラズマ(Ureaplasma)、ビブリオ(Vibrio)、ならびにエルシニア(Yersinia)からなる群から選択される、本発明1007のキメラ分子。
[本発明1009]
前記分解ドメインが、細菌病原体由来であり、かつシゲラ・フレックスネリ(Shigella flexneri)E3リガーゼ、SspH1、SspH2、SlrP、AvrPtoB、LubX、NleG5-1、NleG2-3、LegU1、LegAU13、NIeL、SopA、SidC、XopL、GobX、VirF、GALA、AnkB、またはSidEを含む、本発明1007のキメラ分子。
[本発明1010]
前記分解ドメインが、シゲラIpaHタンパク質である、本発明1001のキメラ分子。
[本発明1011]
前記シゲラIpaHタンパク質が、IpaH9.8、IpaH1.4、IpaH2.5、IpaH4.5、IpaH7.8、IpaH0887、IpaH1389、IpaH2022、IpaH2202、IpaH2610、およびIpaH0722からなる群から選択される、本発明1010のキメラ分子。
[本発明1012]
前記細菌病原体がシゲラ・フレックスネリである場合である、本発明1007のキメラ分子。
[本発明1013]
前記標的指向ドメインが、モノボディ、フィブロネクチンIII型ドメイン(FN3)抗体、ポリクローナル抗体、モノクローナル抗体、組換え抗体、抗体フラグメント、Fab’、F(ab’)2、Fv、scFv、tascFv、ビス-scFv、sdAb、VH、VL、Vnar、scFvD10、scFv13R4、scFvD10、ヒト化抗体、キメラ抗体、相補性決定領域(CDR)、IgA抗体、IgD抗体、IgE抗体、IgG抗体、IgM抗体、ナノボディ、イントラボディ、ユニボディ、ミニボディ、非抗体タンパク質骨格、アドネクチン、アフィボディおよびそれらの2ヘリックス変異体、アンチカリン、ラクダ科抗体、V H H、ノッチン(knottin)、DARPin、またはSso7dである、本発明1001のキメラ分子。
[本発明1014]
前記標的指向ドメインがモノボディであり、前記モノボディが、以下(括弧内に標的抗原を示す):
GS2(GFP)、Nsa5(SHP2)、RasInI(HRas/KRas)、およびRasInII(HRas/KRas)、1D10(CDC34)、1D7(COPS5)、1C4(MAP2K5)、2C12(MAP2K5)、1E2(SF3A1)、1C2(USP11)、1A9(USP11)、Ubi4(ユビキチン)、EI1.4.1(EGFR)、EI2.4.6(EGFR)、EI3.4.3(EGFR)、EI4.2.1(EGFR)、EI4.4.2(EGFR)、EI6.2.6(EGFR)、EI6.2.10(EGFR)、E246(EGFR)、C743(CEA)、IIIa8.2.6(FcγIIa)、IIIa6.2.6(FcγIIIa)、hA2.2.1(hA33)、hA2.2.2(hA33)、hA3.2.1(hA33)、hA3.2.3(hA33)、mA3.2.1(mA33)、mA3.2.2(mA33)、mA3.2.3(mA33)、mA3.2.4(mA33)、mA3.2.5(mA33)、Alb3.2.1(hAlb)、mI2.2.1(mIgG)、HA4(AblSH2)、HA10(AblSH2)、HA16(AblSH2)、HA18(AblSH2)、159(vEGFR)、MUC16(MSLN)、E2#3(ERα/EF)、E2#4(ERα/EF)、E2#5(ERα/EF)、E2#6(ERα/EF)、E2#7(ERα/EF)、E2#8(ERα/EF)、E2#9(ERα/EF)、E2#10(ERα/EF)、E2#11(ERα/EF)、E2#23(ERα/EF)、E3#2(ERα/EF)、E3#6(ERα/EF)、OHT#31(ERα/EF)、OHT#32(ERα/EF)、OHT#33(ERα/EF)、AB7-A1(ERα/EF)、AB7-B1(ERα/EF)、MBP-74(MBP)、MBP-76(MBP)、MBP-79(MBP)、hSUMO4-33(hSUMO4)、hSUMO-39(hSUMO4)、ySUMO-53(ySUMO)、ySUMO-56(ySUMO)、ySUMO-57(ySUMO)、T14.25(TNFα)、T14.20(TNFα)、FNfn10-3JCL14(avβ3インテグリン)、1C9(Src SH3)、1F11(Src SH3)、1F10(Src SH3)、2G10(Src SH3)、2B2(Src SH3)、1E3(Src SH3)、E18(VEGFR2)、E19(VEGFR2)、E26(VEGFR2)、E29(VEGFR2)、FG4.2(リゾチーム)、FG4.1(リゾチーム)、2L4.1(リゾチーム)、BF4.1(リゾチーム)、BF4.9(リゾチーム)、BF4.4(リゾチーム)、BFs1c4.01(リゾチーム)、BFs1c4.07(リゾチーム)、BFs3_4.02(リゾチーム)、BFs3_4.06(リゾチーム)、BFs3_8.01(リゾチーム)、10C17C25(ホスホ-IκBα)、Fn-N22(SARS N)、Fn-N17(SARS N)、FN-N10(SARS N)、gI2.5.3T88I(ヤギIgG)、gI2.5.2(ヤギIgG)、gI2.5.4(ヤギIgG)、rI4.5.4(ウサギIgG)、rI4.3.1(ウサギIgG)、rI3.6.6(ウサギIgG)、rI4.3.4(ウサギIgG)、rI3.6.4(ウサギIgG)、およびrI4.3.3(ウサギIgG)
からなる群から選択されるフィブロネクチンIII型ドメイン(FN3)モノボディである、本発明1013のキメラ分子。
[本発明1015]
前記基質が、蛍光タンパク質、ヒストンタンパク質、核局在化シグナル(NLS)、H-Rasタンパク質、Src相同2ドメイン含有ホスファターゼ2(SHP2)、β-ガラクトシダーゼ、gpD、Hsp70、MBP、CDC34、COPS5、MAP2K5、SF3A1、USP11、ユビキチン、EGFR、CEA、FcγIIa、FcγIIIa、hA33、mA33、hAlb、mIgG、AblSH2、vEGFR、MSLN、ERα/EF、hSUMO4、ySUMO、TNFα、avβ3インテグリン、SrcSH3、リゾチーム、ホスホ-IκBα、SARS N、ヤギIgG、ウサギIgG、翻訳後修飾タンパク質、フィブリン、ハンチンチン、腫瘍形成タンパク質、p53、Rb、接着タンパク質、受容体、細胞周期タンパク質、チェックポイントタンパク質、HFE、ATP7B、プリオンタンパク質、ウイルスタンパク質、細菌タンパク質、寄生生物タンパク質、真菌タンパク質、DNA結合タンパク質、代謝タンパク質、調節タンパク質、構造タンパク質、酵素、免疫原性タンパク質、自己免疫原性タンパク質、免疫原、抗原、および病原性タンパク質からなる群から選択される、本発明1001のキメラ分子。
[本発明1016]
前記基質が、緑色蛍光タンパク質、エメラルド蛍光タンパク質、ビーナス蛍光タンパク質、セルリアン蛍光タンパク質、および増強シアン蛍光タンパク質からなる群から選択される蛍光タンパク質である、本発明1001のキメラ分子。
[本発明1017]
前記標的指向ドメインが、非天然基質に結合する、本発明1001のキメラ分子。
[本発明1018]
本発明1001の単離されたキメラ分子をコードするmRNAを提供することと、
1つ以上のポリアデノシン結合タンパク質(「PABP」)を提供することと、
前記mRNAおよび前記1つ以上のPABPからリボヌクレオタンパク質複合体をアセンブルすることと
を含む、リボヌクレオタンパク質を形成する方法。
[本発明1019]
前記mRNAが、3’末端ポリアデノシン(ポリA)テールを含む、本発明1018の方法。
[本発明1020]
本発明1001のキメラ分子と、
薬学的に許容される担体と
を含む、組成物。
[本発明1021]
抗炎症剤、抗糖尿病剤、脂質低下剤、化学療法剤、抗ウイルス剤、抗生物質、代謝剤、小分子阻害剤、プロテインキナーゼ阻害剤、アジュバント、アポトーシス剤、増殖剤、および臓器親和性標的指向剤、ならびにこれらの任意の組み合わせからなる群から選択される第2の薬剤をさらに含む、本発明1020の組成物。
[本発明1022]
疾患を有する対象を選択することと、
本発明1020の組成物を前記対象に投与して、前記対象に、前記疾患に罹患していない対象と比較して、前記基質の増加した発現レベルを与えることと
を含む、疾患を治療する方法。
[本発明1023]
前記疾患が、癌、転移性癌、脳卒中、虚血、末梢血管疾患、アルコール性肝疾患、肝炎、肝硬変、パーキンソン病、アルツハイマー病、嚢胞性線維症糖尿病、ALS、病原性疾患、特発性疾患、ウイルス性疾患、細菌性疾患、プリオン性疾患、真菌性疾患、寄生生物性疾患、関節炎、創傷治癒、免疫不全、炎症性疾患、再生不良性貧血、貧血、遺伝性障害、先天性障害、1型糖尿病、2型糖尿病、妊娠性糖尿病、高血糖症、代謝症候群、リポジストロフィー症候群、脂質異常症、インスリン抵抗性、レプチン抵抗性、アテローム性動脈硬化症、血管疾患、高コレステロール血症、高トリグリセリド血症、非アルコール性脂肪性肝疾患、体重過多、および肥満からなる群から選択される、本発明1022の方法。
[本発明1024]
前記投与が、経口的に、非経口的に、皮下に、静脈内に、筋肉内に、腹腔内に、鼻腔内滴下により、移植により、腔内もしくは膀胱内滴下により、眼内に、動脈内に、病変内に、経皮的に、または粘膜への適用により行われる、本発明1022の方法。
[本発明1025]
サイレンシングさせる基質を選択することと、
本発明1001のキメラ分子を提供することと、
基質-分子複合体の形成を可能にするのに有効な条件下で、前記基質を前記キメラ分子と接触させることであって、前記複合体が、前記サイレンシングさせる基質の分解を媒介する、接触させることと
を含む、基質サイレンシングのための方法。
[本発明1026]
前記基質が、蛍光タンパク質、ヒストンタンパク質、核局在化シグナル(NLS)、H-Rasタンパク質、SHP2タンパク質、Src相同2ドメイン含有ホスファターゼ2(SHP2)、β-ガラクトシダーゼ、gpD、Hsp70、MBP、CDC34、COPS5、MAP2K5、SF3A1、USP11、ユビキチン、EGFR、CEA、FcγIIa、FcγIIIa、hA33、mA33、hAlb、mIgG、AblSH2、vEGFR、MSLN、ERα/EF、hSUMO4、ySUMO、TNFα、avβ3インテグリン、SrcSH3、リゾチーム、ホスホ-IκBα、SARS N、ヤギIgG、ウサギIgG、翻訳後修飾タンパク質、フィブリン、ハンチンチン、腫瘍形成タンパク質、p53、Rb、接着タンパク質、受容体、細胞周期タンパク質、チェックポイントタンパク質、HFE、ATP7B、プリオンタンパク質、ウイルスタンパク質、細菌タンパク質、寄生生物タンパク質、真菌タンパク質、DNA結合タンパク質、代謝タンパク質、調節タンパク質、構造タンパク質、酵素、免疫原性タンパク質、自己免疫原性タンパク質、免疫原、抗原、および病原性タンパク質からなる群から選択される、本発明1025の方法。
[本発明1027]
前記基質が、緑色蛍光タンパク質、エメラルド蛍光タンパク質、ビーナス蛍光タンパク質、セルリアン蛍光タンパク質、および増強シアン蛍光タンパク質からなる群から選択される蛍光タンパク質である、本発明1025の方法。
[本発明1028]
その存在が疾患状態を媒介する生体分子を提供することと、
(i)E3ユビキチンリガーゼ(E3)モチーフを含む分解ドメインと、(ii)前記分解ドメインを前記生体分子へと特異的に方向付けることができる標的指向ドメインであって、前記分解ドメインに対して異種である、標的指向ドメインと、(iii)前記分解ドメインを前記標的指向ドメインに結合させるリンカーとを含む試験剤を提供することと、
前記試験剤が前記生体分子の分解を促進するのに有効な条件下で、前記生体分子を前記試験剤と接触させることと、
前記接触の結果としての前記生体分子のレベルを決定することと、
前記決定に基づいて、前記生体分子のレベルを低下させる前記試験剤を、前記疾患に対する治療有効性の候補であるとして同定することと
を含む、疾患に対する治療有効性について薬剤をスクリーニングする方法。
[本発明1029]
前記同定が、前記疾患に罹患していない対象における標準生体分子レベルに関して行われる、本発明1028の方法。
[本発明1030]
前記同定が、前記接触がない前記生体分子レベルに関して行われる、本発明1028の方法。
[本発明1031]
複数の試験剤を用いて行われる、本発明1028の方法。
[本発明1032]
前記分解ドメインが細菌病原体である、本発明1028の方法。
[本発明1033]
前記細菌病原体が、シゲラ、サルモネラ、バチルス、バルトネラ、ボルデテラ、ボレリア、ブルセラ、カンピロバクター、クラミジアおよびクラミドフィラ、クロストリジウム、コリネバクテリウム、エンテロコッカス、エシェリキア、フランシセラ、ヘモフィルス、ヘリコバクター、レジオネラ、レプトスピラ、リステリア、マイコバクテリウム、マイコプラズマ、ナイセリア、シュードモナス、リケッチア、スタフィロコッカス、ストレプトコッカス、トレポネーマ、ウレアプラズマ、ビブリオ、ならびにエルシニアからなる群から選択される、本発明1032の方法。
[本発明1034]
前記分解ドメインが、細菌病原体由来であり、かつシゲラ・フレックスネリE3リガーゼ、SspH1、SspH2、SlrP、AvrPtoB、LubX、NleG5-1、NleG2-3、LegU1、LegAU13、NIeL、SopA、SidC、XopL、GobX、VirF、GALA、AnkB、またはSidEを含む、本発明1032の方法。
[本発明1035]
前記分解ドメインが、シゲラIpaHタンパク質である、本発明1028の方法。
[本発明1036]
前記シゲラIpaHタンパク質が、IpaH9.8、IpaH1.4、IpaH2.5、IpaH4.5、IpaH7.8、IpaH0887、IpaH1389、IpaH2022、IpaH2202、IpaH2610、およびIpaH0722からなる群から選択される、本発明1035の方法。
[本発明1037]
前記細菌病原体が、シゲラ・フレックスネリである場合である、本発明1032の方法。
[本発明1038]
前記標的指向ドメインが、モノボディ、フィブロネクチンIII型ドメイン(FN3)、抗体、ポリクローナル抗体、モノクローナル抗体、組換え抗体、抗体フラグメント、Fab’、F(ab’)2、Fv、scFv、tascFv、ビス-scFv、sdAb、VH、VL、Vnar、scFvD10、scFv13R4、scFvD10、ヒト化抗体、キメラ抗体、相補性決定領域(CDR)、IgA抗体、IgD抗体、IgE抗体、IgG抗体、IgM抗体、ナノボディ、イントラボディ、ユニボディ、ミニボディ、非抗体タンパク質骨格、アドネクチン、アフィボディおよびそれらの2ヘリックス変異体、アンチカリン、ラクダ科抗体、V H H、ノッチン、DARPin、またはSso7dである、本発明1028の方法。
[本発明1039]
前記標的指向ドメインがモノボディであり、前記モノボディが、以下(括弧内に標的抗原を示す):
GS2(GFP)、Nsa5(SHP2)、RasInI(HRas/KRas)、およびRasInII(HRas/KRas)、1D10(CDC34)、1D7(COPS5)、1C4(MAP2K5)、2C12(MAP2K5)、1E2(SF3A1)、1C2(USP11)、1A9(USP11)、Ubi4(ユビキチン)、EI1.4.1(EGFR)、EI2.4.6(EGFR)、EI3.4.3(EGFR)、EI4.2.1(EGFR)、EI4.4.2(EGFR)、EI6.2.6(EGFR)、EI6.2.10(EGFR)、E246(EGFR)、C743(CEA)、IIIa8.2.6(FcγIIa)、IIIa6.2.6(FcγIIIa)、hA2.2.1(hA33)、hA2.2.2(hA33)、hA3.2.1(hA33)、hA3.2.3(hA33)、mA3.2.1(mA33)、mA3.2.2(mA33)、mA3.2.3(mA33)、mA3.2.4(mA33)、mA3.2.5(mA33)、Alb3.2.1(hAlb)、mI2.2.1(mIgG)、HA4(AblSH2)、HA10(AblSH2)、HA16(AblSH2)、HA18(AblSH2)、159(vEGFR)、MUC16(MSLN)、E2#3(ERα/EF)、E2#4(ERα/EF)、E2#5(ERα/EF)、E2#6(ERα/EF)、E2#7(ERα/EF)、E2#8(ERα/EF)、E2#9(ERα/EF)、E2#10(ERα/EF)、E2#11(ERα/EF)、E2#23(ERα/EF)、E3#2(ERα/EF)、E3#6(ERα/EF)、OHT#31(ERα/EF)、OHT#32(ERα/EF)、OHT#33(ERα/EF)、AB7-A1(ERα/EF)、AB7-B1(ERα/EF)、MBP-74(MBP)、MBP-76(MBP)、MBP-79(MBP)、hSUMO4-33(hSUMO4)、hSUMO-39(hSUMO4)、ySUMO-53(ySUMO)、ySUMO-56(ySUMO)、ySUMO-57(ySUMO)、T14.25(TNFα)、T14.20(TNFα)、FNfn10-3JCL14(avβ3インテグリン)、1C9(Src SH3)、1F11(Src SH3)、1F10(Src SH3)、2G10(Src SH3)、2B2(Src SH3)、1E3(Src SH3)、E18(VEGFR2)、E19(VEGFR2)、E26(VEGFR2)、E29(VEGFR2)、FG4.2(リゾチーム)、FG4.1(リゾチーム)、2L4.1(リゾチーム)、BF4.1(リゾチーム)、BF4.9(リゾチーム)、BF4.4(リゾチーム)、BFs1c4.01(リゾチーム)、BFs1c4.07(リゾチーム)、BFs3_4.02(リゾチーム)、BFs3_4.06(リゾチーム)、BFs3_8.01(リゾチーム)、10C17C25(ホスホ-IκBα)、Fn-N22(SARS N)、Fn-N17(SARS N)、FN-N10(SARS N)、gI2.5.3T88I(ヤギIgG)、gI2.5.2(ヤギIgG)、gI2.5.4(ヤギIgG)、rI4.5.4(ウサギIgG)、rI4.3.1(ウサギIgG)、rI3.6.6(ウサギIgG)、rI4.3.4(ウサギIgG)、rI3.6.4(ウサギIgG)、およびrI4.3.3(ウサギIgG)
からなる群から選択されるフィブロネクチンIII型ドメイン(FN3)モノボディである、本発明1038の方法。
[本発明1040]
前記基質が、蛍光タンパク質、ヒストンタンパク質、核局在化シグナル(NLS)、H-Rasタンパク質、SHP2タンパク質、Src相同2ドメイン含有ホスファターゼ2(SHP2)、β-ガラクトシダーゼ、gpD、Hsp70、MBP、CDC34、COPS5、MAP2K5、SF3A1、USP11、ユビキチン、EGFR、CEA、FcγIIa、FcγIIIa、hA33、mA33、hAlb、mIgG、AblSH2、vEGFR、MSLN、ERα/EF、hSUMO4、ySUMO、TNFα、avβ3インテグリン、Src SH3、リゾチーム、ホスホ-IκBα、SARS N、ヤギIgG、ウサギIgG、翻訳後修飾タンパク質、フィブリン、ハンチンチン、腫瘍形成タンパク質、p53、Rb、接着タンパク質、受容体、細胞周期タンパク質、チェックポイントタンパク質、HFE、ATP7B、プリオンタンパク質、ウイルスタンパク質、細菌タンパク質、寄生生物タンパク質、真菌タンパク質、DNA結合タンパク質、代謝タンパク質、調節タンパク質、構造タンパク質、酵素、免疫原性タンパク質、自己免疫原性タンパク質、免疫原、抗原、および病原性タンパク質からなる群から選択される、本発明1028の方法。
[本発明1041]
前記基質が、緑色蛍光タンパク質、エメラルド蛍光タンパク質、ビーナス蛍光タンパク質、セルリアン蛍光タンパク質、および増強シアン蛍光タンパク質からなる群から選択される蛍光タンパク質である、本発明1028の方法。
[本発明1042]
前記リンカーが、前記標的指向ドメインと前記生体分子との間の結合の立体破壊を防止するのに十分な長さのポリペプチドリンカーである、本発明1028の方法。
[本発明1043]
前記生体分子が、癌、転移性癌、脳卒中、虚血、末梢血管疾患、アルコール性肝疾患、肝炎、肝硬変、パーキンソン病、アルツハイマー病、嚢胞性線維症糖尿病、ALS、病原性疾患、特発性疾患、ウイルス性疾患、細菌性疾患、プリオン性疾患、真菌性疾患、寄生生物性疾患、関節炎、創傷治癒、免疫不全、炎症性疾患、再生不良性貧血、貧血、遺伝性障害、先天性障害、1型糖尿病、2型糖尿病、妊娠性糖尿病、高血糖症、代謝症候群、リポジストロフィー症候群、脂質異常症、インスリン抵抗性、レプチン抵抗性、アテローム性動脈硬化症、血管疾患、高コレステロール血症、高トリグリセリド血症、非アルコール性脂肪性肝疾患、体重過多、または肥満、ならびにこれらの任意の組み合わせに関連する、本発明1028の方法。
[本発明1044]
1つ以上のリガンドを発現する疾患細胞の試料を提供することと、
(i)E3ユビキチンリガーゼ(E3)モチーフを含む分解ドメインと、(ii)前記分解ドメインを前記1つ以上のリガンドへと特異的に方向付けることができる標的指向ドメインであって、前記分解ドメインに対して異種である、標的指向ドメインと、(iii)前記分解ドメインを前記標的指向ドメインに結合させるリンカーとを含む複数のキメラ分子を提供することと、
前記疾患細胞が前記キメラ分子の非存在下で増殖することに失敗するのに有効な条件下で、前記試料を前記複数のキメラ分子と接触させることと、
前記キメラ分子のうちのどれが前記疾患細胞の増殖を可能にするかを決定することと、
前記決定に基づいて、前記キメラ分子に結合しかつ前記疾患細胞の増殖を可能にするリガンドを、前記疾患のバイオマーカーとして同定することと
を含む、疾患バイオマーカーについてスクリーニングする方法。
[本発明1045]
前記疾患が、癌、転移性癌、脳卒中、虚血、末梢血管疾患、アルコール性肝疾患、肝炎、肝硬変、パーキンソン病、アルツハイマー病、嚢胞性線維症糖尿病、ALS、病原性疾患、特発性疾患、ウイルス性疾患、細菌性疾患、プリオン性疾患、真菌性疾患、寄生生物性疾患、関節炎、創傷治癒、免疫不全、炎症性疾患、再生不良性貧血、貧血、遺伝性障害、先天性障害、1型糖尿病、2型糖尿病、妊娠性糖尿病、高血糖症、代謝症候群、リポジストロフィー症候群、脂質異常症、インスリン抵抗性、レプチン抵抗性、アテローム性動脈硬化症、血管疾患、高コレステロール血症、高トリグリセリド血症、非アルコール性脂肪性肝疾患、体重過多、および肥満からなる群から選択される、本発明1044の方法。
[本発明1046]
前記分解ドメインが、細菌病原体である、本発明1044の方法。
[本発明1047]
前記細菌病原体が、シゲラ、サルモネラ、バチルス、バルトネラ、ボルデテラ、ボレリア、ブルセラ、カンピロバクター、クラミジアおよびクラミドフィラ、クロストリジウム、コリネバクテリウム、エンテロコッカス、エシェリキア、フランシセラ、ヘモフィルス、ヘリコバクター、レジオネラ、レプトスピラ、リステリア、マイコバクテリウム、マイコプラズマ、ナイセリア、シュードモナス、リケッチア、スタフィロコッカス、ストレプトコッカス、トレポネーマ、ウレアプラズマ、ビブリオ、ならびにエルシニアからなる群から選択される、本発明1046の方法。
[本発明1048]
前記分解ドメインが、細菌病原体由来であり、かつシゲラ・フレックスネリE3リガーゼ、SspH1、SspH2、SlrP、AvrPtoB、LubX、NleG5-1、NleG2-3、LegU1、LegAU13、NIeL、SopA、SidC、XopL、GobX、VirF、GALA、AnkB、またはSidEを含む、本発明1046の方法。
[本発明1049]
前記分解ドメインが、シゲラIpaHタンパク質である、本発明1044の方法。
[本発明1050]
前記シゲラIpaHタンパク質が、IpaH9.8、IpaH1.4、IpaH2.5、IpaH4.5、IpaH7.8、IpaH0887、IpaH1389、IpaH2022、IpaH2202、IpaH2610、およびIpaH0722からなる群から選択される、本発明1049の方法。
[本発明1051]
前記細菌病原体が、シゲラ・フレックスネリである場合である、本発明1046の方法。
[本発明1052]
前記標的指向ドメインが、モノボディ、フィブロネクチンIII型ドメイン(FN3)、抗体、ポリクローナル抗体、モノクローナル抗体、組換え抗体、抗体フラグメント、Fab’、F(ab’)2、Fv、scFv、tascFv、ビス-scFv、sdAb、VH、VL、Vnar、scFvD10、scFv13R4、scFvD10、ヒト化抗体、キメラ抗体、相補決定領域(CDR)、IgA抗体、IgD抗体、IgE抗体、IgG抗体、IgM抗体、ナノボディ、イントラボディ、ユニボディ、ミニボディ、非抗体タンパク質骨格、アドネクチン、アフィボディおよびそれらの2ヘリックス変異体、アンチカリン、ラクダ科抗体、V H H、ノッチン、DARPin、またはSsod7dである、本発明1044の方法。
[本発明1053]
前記標的指向ドメインがモノボディであり、前記モノボディが、以下(括弧内に標的抗原を示す):
GS2(GFP)、Nsa5(SHP2)、RasInI(HRas/KRas)、およびRasInII(HRas/KRas)、1D10(CDC34)、1D7(COPS5)、1C4(MAP2K5)、2C12(MAP2K5)、1E2(SF3A1)、1C2(USP11)、1A9(USP11)、Ubi4(ユビキチン)、EI1.4.1(EGFR)、EI2.4.6(EGFR)、EI3.4.3(EGFR)、EI4.2.1(EGFR)、EI4.4.2(EGFR)、EI6.2.6(EGFR)、EI6.2.10(EGFR)、E246(EGFR)、C743(CEA)、IIIa8.2.6(FcγIIa)、IIIa6.2.6(FcγIIIa)、hA2.2.1(hA33)、hA2.2.2(hA33)、hA3.2.1(hA33)、hA3.2.3(hA33)、mA3.2.1(mA33)、mA3.2.2(mA33)、mA3.2.3(mA33)、mA3.2.4(mA33)、mA3.2.5(mA33)、Alb3.2.1(hAlb)、mI2.2.1(mIgG)、HA4(AblSH2)、HA10(AblSH2)、HA16(AblSH2)、HA18(AblSH2)、159(vEGFR)、MUC16(MSLN)、E2#3(ERα/EF)、E2#4(ERα/EF)、E2#5(ERα/EF)、E2#6(ERα/EF)、E2#7(ERα/EF)、E2#8(ERα/EF)、E2#9(ERα/EF)、E2#10(ERα/EF)、E2#11(ERα/EF)、E2#23(ERα/EF)、E3#2(ERα/EF)、E3#6(ERα/EF)、OHT#31(ERα/EF)、OHT#32(ERα/EF)、OHT#33(ERα/EF)、AB7-A1(ERα/EF)、AB7-B1(ERα/EF)、MBP-74(MBP)、MBP-76(MBP)、MBP-79(MBP)、hSUMO4-33(hSUMO4)、hSUMO-39(hSUMO4)、ySUMO-53(ySUMO)、ySUMO-56(ySUMO)、ySUMO-57(ySUMO)、T14.25(TNFα)、T14.20(TNFα)、FNfn10-3JCL14(avβ3インテグリン)、1C9(Src SH3)、1F11(Src SH3)、1F10(Src SH3)、2G10(Src SH3)、2B2(Src SH3)、1E3(Src SH3)、E18(VEGFR2)、E19(VEGFR2)、E26(VEGFR2)、E29(VEGFR2)、FG4.2(リゾチーム)、FG4.1(リゾチーム)、2L4.1(リゾチーム)、BF4.1(リゾチーム)、BF4.9(リゾチーム)、BF4.4(リゾチーム)、BFs1c4.01(リゾチーム)、BFs1c4.07(リゾチーム)、BFs3_4.02(リゾチーム)、BFs3_4.06(リゾチーム)、BFs3_8.01(リゾチーム)、10C17C25(ホスホ-IκBα)、Fn-N22(SARS N)、Fn-N17(SARS N)、FN-N10(SARS N)、gI2.5.3T88I(ヤギIgG)、gI2.5.2(ヤギIgG)、gI2.5.4(ヤギIgG)、rI4.5.4(ウサギIgG)、rI4.3.1(ウサギIgG)、rI3.6.6(ウサギIgG)、rI4.3.4(ウサギIgG)、rI3.6.4(ウサギIgG)、およびrI4.3.3(ウサギIgG)
からなる群から選択されるフィブロネクチンIII型ドメイン(FN3)モノボディである、本発明1050の方法。
[本発明1001]
E3ユビキチンリガーゼ(E3)モチーフを含む分解ドメインと、
前記分解ドメインを基質へと特異的に方向付けることができる標的指向ドメインであって、前記分解ドメインに対して異種である、標的指向ドメインと、
前記分解ドメインを前記標的指向ドメインに結合させるリンカーと
を含む、単離されたキメラ分子。
[本発明1002]
前記E3モチーフが、修飾結合領域を有しない前記E3モチーフと比較して前記基質への結合を阻害するまたは減少させる修飾結合領域を含む、本発明1001のキメラ分子。
[本発明1003]
前記修飾が、前記結合領域における変異または欠失である、本発明1002のキメラ分子。
[本発明1004]
前記E3モチーフが、前記基質のタンパク質分解を可能にする、本発明1001のキメラ分子。
[本発明1005]
前記E3モチーフが、細胞型特異的または組織特異的リガーゼ機能を保有する、本発明1001のキメラ分子。
[本発明1006]
前記リガーゼ機能が、細胞型特異的であり、前記細胞型は、皮膚細胞、筋肉細胞、上皮細胞、内皮細胞、幹細胞、臍帯血管細胞、角膜細胞、心筋細胞、大動脈細胞、角膜上皮細胞、体細胞、線維芽細胞、ケラチノサイト、メラノサイト、脂肪細胞、骨細胞、骨芽細胞、気道細胞、微小血管細胞、乳房細胞、血管細胞、軟骨細胞、胎盤細胞、肝細胞、膠細胞、表皮細胞、角膜輪部幹細胞、歯周幹細胞、骨髄間質細胞、ハイブリドーマ細胞、腎臓細胞、膵島、関節軟骨細胞、神経芽細胞、リンパ球、および赤血球からなる群から選択される、本発明1005のキメラ分子。
[本発明1007]
前記分解ドメインが細菌病原体由来である、本発明1001のキメラ分子。
[本発明1008]
前記細菌病原体が、シゲラ(Shigella)、サルモネラ(Salmonella)、バチルス(Bacillus)、バルトネラ(Bartonella)、ボルデテラ(Bordetella)、ボレリア(Borrelia)、ブルセラ(Brucella)、カンピロバクター(Campylobacter)、クラミジア(Chlamydia)およびクラミドフィラ(Chlamydophila)、クロストリジウム(Clostridium)、コリネバクテリウム(Corynebacterium)、エンテロコッカス(Enterococcus)、エシェリキア(Escherichia)、フランシセラ(Francisella)、ヘモフィルス(Haemophilus)、ヘリコバクター(Helicobacter)、レジオネラ(Legionella)、レプトスピラ(Leptospira)、リステリア(Listeria)、マイコバクテリウム(Mycobacterium)、マイコプラズマ(Mycoplasma)、ナイセリア(Neisseria)、シュードモナス(Pseudomonas)、リケッチア(Rickettsia)、スタフィロコッカス(Staphylococcus)、ストレプトコッカス(Streptococcus)、トレポネーマ(Treponema)、ウレアプラズマ(Ureaplasma)、ビブリオ(Vibrio)、ならびにエルシニア(Yersinia)からなる群から選択される、本発明1007のキメラ分子。
[本発明1009]
前記分解ドメインが、細菌病原体由来であり、かつシゲラ・フレックスネリ(Shigella flexneri)E3リガーゼ、SspH1、SspH2、SlrP、AvrPtoB、LubX、NleG5-1、NleG2-3、LegU1、LegAU13、NIeL、SopA、SidC、XopL、GobX、VirF、GALA、AnkB、またはSidEを含む、本発明1007のキメラ分子。
[本発明1010]
前記分解ドメインが、シゲラIpaHタンパク質である、本発明1001のキメラ分子。
[本発明1011]
前記シゲラIpaHタンパク質が、IpaH9.8、IpaH1.4、IpaH2.5、IpaH4.5、IpaH7.8、IpaH0887、IpaH1389、IpaH2022、IpaH2202、IpaH2610、およびIpaH0722からなる群から選択される、本発明1010のキメラ分子。
[本発明1012]
前記細菌病原体がシゲラ・フレックスネリである場合である、本発明1007のキメラ分子。
[本発明1013]
前記標的指向ドメインが、モノボディ、フィブロネクチンIII型ドメイン(FN3)抗体、ポリクローナル抗体、モノクローナル抗体、組換え抗体、抗体フラグメント、Fab’、F(ab’)2、Fv、scFv、tascFv、ビス-scFv、sdAb、VH、VL、Vnar、scFvD10、scFv13R4、scFvD10、ヒト化抗体、キメラ抗体、相補性決定領域(CDR)、IgA抗体、IgD抗体、IgE抗体、IgG抗体、IgM抗体、ナノボディ、イントラボディ、ユニボディ、ミニボディ、非抗体タンパク質骨格、アドネクチン、アフィボディおよびそれらの2ヘリックス変異体、アンチカリン、ラクダ科抗体、V H H、ノッチン(knottin)、DARPin、またはSso7dである、本発明1001のキメラ分子。
[本発明1014]
前記標的指向ドメインがモノボディであり、前記モノボディが、以下(括弧内に標的抗原を示す):
GS2(GFP)、Nsa5(SHP2)、RasInI(HRas/KRas)、およびRasInII(HRas/KRas)、1D10(CDC34)、1D7(COPS5)、1C4(MAP2K5)、2C12(MAP2K5)、1E2(SF3A1)、1C2(USP11)、1A9(USP11)、Ubi4(ユビキチン)、EI1.4.1(EGFR)、EI2.4.6(EGFR)、EI3.4.3(EGFR)、EI4.2.1(EGFR)、EI4.4.2(EGFR)、EI6.2.6(EGFR)、EI6.2.10(EGFR)、E246(EGFR)、C743(CEA)、IIIa8.2.6(FcγIIa)、IIIa6.2.6(FcγIIIa)、hA2.2.1(hA33)、hA2.2.2(hA33)、hA3.2.1(hA33)、hA3.2.3(hA33)、mA3.2.1(mA33)、mA3.2.2(mA33)、mA3.2.3(mA33)、mA3.2.4(mA33)、mA3.2.5(mA33)、Alb3.2.1(hAlb)、mI2.2.1(mIgG)、HA4(AblSH2)、HA10(AblSH2)、HA16(AblSH2)、HA18(AblSH2)、159(vEGFR)、MUC16(MSLN)、E2#3(ERα/EF)、E2#4(ERα/EF)、E2#5(ERα/EF)、E2#6(ERα/EF)、E2#7(ERα/EF)、E2#8(ERα/EF)、E2#9(ERα/EF)、E2#10(ERα/EF)、E2#11(ERα/EF)、E2#23(ERα/EF)、E3#2(ERα/EF)、E3#6(ERα/EF)、OHT#31(ERα/EF)、OHT#32(ERα/EF)、OHT#33(ERα/EF)、AB7-A1(ERα/EF)、AB7-B1(ERα/EF)、MBP-74(MBP)、MBP-76(MBP)、MBP-79(MBP)、hSUMO4-33(hSUMO4)、hSUMO-39(hSUMO4)、ySUMO-53(ySUMO)、ySUMO-56(ySUMO)、ySUMO-57(ySUMO)、T14.25(TNFα)、T14.20(TNFα)、FNfn10-3JCL14(avβ3インテグリン)、1C9(Src SH3)、1F11(Src SH3)、1F10(Src SH3)、2G10(Src SH3)、2B2(Src SH3)、1E3(Src SH3)、E18(VEGFR2)、E19(VEGFR2)、E26(VEGFR2)、E29(VEGFR2)、FG4.2(リゾチーム)、FG4.1(リゾチーム)、2L4.1(リゾチーム)、BF4.1(リゾチーム)、BF4.9(リゾチーム)、BF4.4(リゾチーム)、BFs1c4.01(リゾチーム)、BFs1c4.07(リゾチーム)、BFs3_4.02(リゾチーム)、BFs3_4.06(リゾチーム)、BFs3_8.01(リゾチーム)、10C17C25(ホスホ-IκBα)、Fn-N22(SARS N)、Fn-N17(SARS N)、FN-N10(SARS N)、gI2.5.3T88I(ヤギIgG)、gI2.5.2(ヤギIgG)、gI2.5.4(ヤギIgG)、rI4.5.4(ウサギIgG)、rI4.3.1(ウサギIgG)、rI3.6.6(ウサギIgG)、rI4.3.4(ウサギIgG)、rI3.6.4(ウサギIgG)、およびrI4.3.3(ウサギIgG)
からなる群から選択されるフィブロネクチンIII型ドメイン(FN3)モノボディである、本発明1013のキメラ分子。
[本発明1015]
前記基質が、蛍光タンパク質、ヒストンタンパク質、核局在化シグナル(NLS)、H-Rasタンパク質、Src相同2ドメイン含有ホスファターゼ2(SHP2)、β-ガラクトシダーゼ、gpD、Hsp70、MBP、CDC34、COPS5、MAP2K5、SF3A1、USP11、ユビキチン、EGFR、CEA、FcγIIa、FcγIIIa、hA33、mA33、hAlb、mIgG、AblSH2、vEGFR、MSLN、ERα/EF、hSUMO4、ySUMO、TNFα、avβ3インテグリン、SrcSH3、リゾチーム、ホスホ-IκBα、SARS N、ヤギIgG、ウサギIgG、翻訳後修飾タンパク質、フィブリン、ハンチンチン、腫瘍形成タンパク質、p53、Rb、接着タンパク質、受容体、細胞周期タンパク質、チェックポイントタンパク質、HFE、ATP7B、プリオンタンパク質、ウイルスタンパク質、細菌タンパク質、寄生生物タンパク質、真菌タンパク質、DNA結合タンパク質、代謝タンパク質、調節タンパク質、構造タンパク質、酵素、免疫原性タンパク質、自己免疫原性タンパク質、免疫原、抗原、および病原性タンパク質からなる群から選択される、本発明1001のキメラ分子。
[本発明1016]
前記基質が、緑色蛍光タンパク質、エメラルド蛍光タンパク質、ビーナス蛍光タンパク質、セルリアン蛍光タンパク質、および増強シアン蛍光タンパク質からなる群から選択される蛍光タンパク質である、本発明1001のキメラ分子。
[本発明1017]
前記標的指向ドメインが、非天然基質に結合する、本発明1001のキメラ分子。
[本発明1018]
本発明1001の単離されたキメラ分子をコードするmRNAを提供することと、
1つ以上のポリアデノシン結合タンパク質(「PABP」)を提供することと、
前記mRNAおよび前記1つ以上のPABPからリボヌクレオタンパク質複合体をアセンブルすることと
を含む、リボヌクレオタンパク質を形成する方法。
[本発明1019]
前記mRNAが、3’末端ポリアデノシン(ポリA)テールを含む、本発明1018の方法。
[本発明1020]
本発明1001のキメラ分子と、
薬学的に許容される担体と
を含む、組成物。
[本発明1021]
抗炎症剤、抗糖尿病剤、脂質低下剤、化学療法剤、抗ウイルス剤、抗生物質、代謝剤、小分子阻害剤、プロテインキナーゼ阻害剤、アジュバント、アポトーシス剤、増殖剤、および臓器親和性標的指向剤、ならびにこれらの任意の組み合わせからなる群から選択される第2の薬剤をさらに含む、本発明1020の組成物。
[本発明1022]
疾患を有する対象を選択することと、
本発明1020の組成物を前記対象に投与して、前記対象に、前記疾患に罹患していない対象と比較して、前記基質の増加した発現レベルを与えることと
を含む、疾患を治療する方法。
[本発明1023]
前記疾患が、癌、転移性癌、脳卒中、虚血、末梢血管疾患、アルコール性肝疾患、肝炎、肝硬変、パーキンソン病、アルツハイマー病、嚢胞性線維症糖尿病、ALS、病原性疾患、特発性疾患、ウイルス性疾患、細菌性疾患、プリオン性疾患、真菌性疾患、寄生生物性疾患、関節炎、創傷治癒、免疫不全、炎症性疾患、再生不良性貧血、貧血、遺伝性障害、先天性障害、1型糖尿病、2型糖尿病、妊娠性糖尿病、高血糖症、代謝症候群、リポジストロフィー症候群、脂質異常症、インスリン抵抗性、レプチン抵抗性、アテローム性動脈硬化症、血管疾患、高コレステロール血症、高トリグリセリド血症、非アルコール性脂肪性肝疾患、体重過多、および肥満からなる群から選択される、本発明1022の方法。
[本発明1024]
前記投与が、経口的に、非経口的に、皮下に、静脈内に、筋肉内に、腹腔内に、鼻腔内滴下により、移植により、腔内もしくは膀胱内滴下により、眼内に、動脈内に、病変内に、経皮的に、または粘膜への適用により行われる、本発明1022の方法。
[本発明1025]
サイレンシングさせる基質を選択することと、
本発明1001のキメラ分子を提供することと、
基質-分子複合体の形成を可能にするのに有効な条件下で、前記基質を前記キメラ分子と接触させることであって、前記複合体が、前記サイレンシングさせる基質の分解を媒介する、接触させることと
を含む、基質サイレンシングのための方法。
[本発明1026]
前記基質が、蛍光タンパク質、ヒストンタンパク質、核局在化シグナル(NLS)、H-Rasタンパク質、SHP2タンパク質、Src相同2ドメイン含有ホスファターゼ2(SHP2)、β-ガラクトシダーゼ、gpD、Hsp70、MBP、CDC34、COPS5、MAP2K5、SF3A1、USP11、ユビキチン、EGFR、CEA、FcγIIa、FcγIIIa、hA33、mA33、hAlb、mIgG、AblSH2、vEGFR、MSLN、ERα/EF、hSUMO4、ySUMO、TNFα、avβ3インテグリン、SrcSH3、リゾチーム、ホスホ-IκBα、SARS N、ヤギIgG、ウサギIgG、翻訳後修飾タンパク質、フィブリン、ハンチンチン、腫瘍形成タンパク質、p53、Rb、接着タンパク質、受容体、細胞周期タンパク質、チェックポイントタンパク質、HFE、ATP7B、プリオンタンパク質、ウイルスタンパク質、細菌タンパク質、寄生生物タンパク質、真菌タンパク質、DNA結合タンパク質、代謝タンパク質、調節タンパク質、構造タンパク質、酵素、免疫原性タンパク質、自己免疫原性タンパク質、免疫原、抗原、および病原性タンパク質からなる群から選択される、本発明1025の方法。
[本発明1027]
前記基質が、緑色蛍光タンパク質、エメラルド蛍光タンパク質、ビーナス蛍光タンパク質、セルリアン蛍光タンパク質、および増強シアン蛍光タンパク質からなる群から選択される蛍光タンパク質である、本発明1025の方法。
[本発明1028]
その存在が疾患状態を媒介する生体分子を提供することと、
(i)E3ユビキチンリガーゼ(E3)モチーフを含む分解ドメインと、(ii)前記分解ドメインを前記生体分子へと特異的に方向付けることができる標的指向ドメインであって、前記分解ドメインに対して異種である、標的指向ドメインと、(iii)前記分解ドメインを前記標的指向ドメインに結合させるリンカーとを含む試験剤を提供することと、
前記試験剤が前記生体分子の分解を促進するのに有効な条件下で、前記生体分子を前記試験剤と接触させることと、
前記接触の結果としての前記生体分子のレベルを決定することと、
前記決定に基づいて、前記生体分子のレベルを低下させる前記試験剤を、前記疾患に対する治療有効性の候補であるとして同定することと
を含む、疾患に対する治療有効性について薬剤をスクリーニングする方法。
[本発明1029]
前記同定が、前記疾患に罹患していない対象における標準生体分子レベルに関して行われる、本発明1028の方法。
[本発明1030]
前記同定が、前記接触がない前記生体分子レベルに関して行われる、本発明1028の方法。
[本発明1031]
複数の試験剤を用いて行われる、本発明1028の方法。
[本発明1032]
前記分解ドメインが細菌病原体である、本発明1028の方法。
[本発明1033]
前記細菌病原体が、シゲラ、サルモネラ、バチルス、バルトネラ、ボルデテラ、ボレリア、ブルセラ、カンピロバクター、クラミジアおよびクラミドフィラ、クロストリジウム、コリネバクテリウム、エンテロコッカス、エシェリキア、フランシセラ、ヘモフィルス、ヘリコバクター、レジオネラ、レプトスピラ、リステリア、マイコバクテリウム、マイコプラズマ、ナイセリア、シュードモナス、リケッチア、スタフィロコッカス、ストレプトコッカス、トレポネーマ、ウレアプラズマ、ビブリオ、ならびにエルシニアからなる群から選択される、本発明1032の方法。
[本発明1034]
前記分解ドメインが、細菌病原体由来であり、かつシゲラ・フレックスネリE3リガーゼ、SspH1、SspH2、SlrP、AvrPtoB、LubX、NleG5-1、NleG2-3、LegU1、LegAU13、NIeL、SopA、SidC、XopL、GobX、VirF、GALA、AnkB、またはSidEを含む、本発明1032の方法。
[本発明1035]
前記分解ドメインが、シゲラIpaHタンパク質である、本発明1028の方法。
[本発明1036]
前記シゲラIpaHタンパク質が、IpaH9.8、IpaH1.4、IpaH2.5、IpaH4.5、IpaH7.8、IpaH0887、IpaH1389、IpaH2022、IpaH2202、IpaH2610、およびIpaH0722からなる群から選択される、本発明1035の方法。
[本発明1037]
前記細菌病原体が、シゲラ・フレックスネリである場合である、本発明1032の方法。
[本発明1038]
前記標的指向ドメインが、モノボディ、フィブロネクチンIII型ドメイン(FN3)、抗体、ポリクローナル抗体、モノクローナル抗体、組換え抗体、抗体フラグメント、Fab’、F(ab’)2、Fv、scFv、tascFv、ビス-scFv、sdAb、VH、VL、Vnar、scFvD10、scFv13R4、scFvD10、ヒト化抗体、キメラ抗体、相補性決定領域(CDR)、IgA抗体、IgD抗体、IgE抗体、IgG抗体、IgM抗体、ナノボディ、イントラボディ、ユニボディ、ミニボディ、非抗体タンパク質骨格、アドネクチン、アフィボディおよびそれらの2ヘリックス変異体、アンチカリン、ラクダ科抗体、V H H、ノッチン、DARPin、またはSso7dである、本発明1028の方法。
[本発明1039]
前記標的指向ドメインがモノボディであり、前記モノボディが、以下(括弧内に標的抗原を示す):
GS2(GFP)、Nsa5(SHP2)、RasInI(HRas/KRas)、およびRasInII(HRas/KRas)、1D10(CDC34)、1D7(COPS5)、1C4(MAP2K5)、2C12(MAP2K5)、1E2(SF3A1)、1C2(USP11)、1A9(USP11)、Ubi4(ユビキチン)、EI1.4.1(EGFR)、EI2.4.6(EGFR)、EI3.4.3(EGFR)、EI4.2.1(EGFR)、EI4.4.2(EGFR)、EI6.2.6(EGFR)、EI6.2.10(EGFR)、E246(EGFR)、C743(CEA)、IIIa8.2.6(FcγIIa)、IIIa6.2.6(FcγIIIa)、hA2.2.1(hA33)、hA2.2.2(hA33)、hA3.2.1(hA33)、hA3.2.3(hA33)、mA3.2.1(mA33)、mA3.2.2(mA33)、mA3.2.3(mA33)、mA3.2.4(mA33)、mA3.2.5(mA33)、Alb3.2.1(hAlb)、mI2.2.1(mIgG)、HA4(AblSH2)、HA10(AblSH2)、HA16(AblSH2)、HA18(AblSH2)、159(vEGFR)、MUC16(MSLN)、E2#3(ERα/EF)、E2#4(ERα/EF)、E2#5(ERα/EF)、E2#6(ERα/EF)、E2#7(ERα/EF)、E2#8(ERα/EF)、E2#9(ERα/EF)、E2#10(ERα/EF)、E2#11(ERα/EF)、E2#23(ERα/EF)、E3#2(ERα/EF)、E3#6(ERα/EF)、OHT#31(ERα/EF)、OHT#32(ERα/EF)、OHT#33(ERα/EF)、AB7-A1(ERα/EF)、AB7-B1(ERα/EF)、MBP-74(MBP)、MBP-76(MBP)、MBP-79(MBP)、hSUMO4-33(hSUMO4)、hSUMO-39(hSUMO4)、ySUMO-53(ySUMO)、ySUMO-56(ySUMO)、ySUMO-57(ySUMO)、T14.25(TNFα)、T14.20(TNFα)、FNfn10-3JCL14(avβ3インテグリン)、1C9(Src SH3)、1F11(Src SH3)、1F10(Src SH3)、2G10(Src SH3)、2B2(Src SH3)、1E3(Src SH3)、E18(VEGFR2)、E19(VEGFR2)、E26(VEGFR2)、E29(VEGFR2)、FG4.2(リゾチーム)、FG4.1(リゾチーム)、2L4.1(リゾチーム)、BF4.1(リゾチーム)、BF4.9(リゾチーム)、BF4.4(リゾチーム)、BFs1c4.01(リゾチーム)、BFs1c4.07(リゾチーム)、BFs3_4.02(リゾチーム)、BFs3_4.06(リゾチーム)、BFs3_8.01(リゾチーム)、10C17C25(ホスホ-IκBα)、Fn-N22(SARS N)、Fn-N17(SARS N)、FN-N10(SARS N)、gI2.5.3T88I(ヤギIgG)、gI2.5.2(ヤギIgG)、gI2.5.4(ヤギIgG)、rI4.5.4(ウサギIgG)、rI4.3.1(ウサギIgG)、rI3.6.6(ウサギIgG)、rI4.3.4(ウサギIgG)、rI3.6.4(ウサギIgG)、およびrI4.3.3(ウサギIgG)
からなる群から選択されるフィブロネクチンIII型ドメイン(FN3)モノボディである、本発明1038の方法。
[本発明1040]
前記基質が、蛍光タンパク質、ヒストンタンパク質、核局在化シグナル(NLS)、H-Rasタンパク質、SHP2タンパク質、Src相同2ドメイン含有ホスファターゼ2(SHP2)、β-ガラクトシダーゼ、gpD、Hsp70、MBP、CDC34、COPS5、MAP2K5、SF3A1、USP11、ユビキチン、EGFR、CEA、FcγIIa、FcγIIIa、hA33、mA33、hAlb、mIgG、AblSH2、vEGFR、MSLN、ERα/EF、hSUMO4、ySUMO、TNFα、avβ3インテグリン、Src SH3、リゾチーム、ホスホ-IκBα、SARS N、ヤギIgG、ウサギIgG、翻訳後修飾タンパク質、フィブリン、ハンチンチン、腫瘍形成タンパク質、p53、Rb、接着タンパク質、受容体、細胞周期タンパク質、チェックポイントタンパク質、HFE、ATP7B、プリオンタンパク質、ウイルスタンパク質、細菌タンパク質、寄生生物タンパク質、真菌タンパク質、DNA結合タンパク質、代謝タンパク質、調節タンパク質、構造タンパク質、酵素、免疫原性タンパク質、自己免疫原性タンパク質、免疫原、抗原、および病原性タンパク質からなる群から選択される、本発明1028の方法。
[本発明1041]
前記基質が、緑色蛍光タンパク質、エメラルド蛍光タンパク質、ビーナス蛍光タンパク質、セルリアン蛍光タンパク質、および増強シアン蛍光タンパク質からなる群から選択される蛍光タンパク質である、本発明1028の方法。
[本発明1042]
前記リンカーが、前記標的指向ドメインと前記生体分子との間の結合の立体破壊を防止するのに十分な長さのポリペプチドリンカーである、本発明1028の方法。
[本発明1043]
前記生体分子が、癌、転移性癌、脳卒中、虚血、末梢血管疾患、アルコール性肝疾患、肝炎、肝硬変、パーキンソン病、アルツハイマー病、嚢胞性線維症糖尿病、ALS、病原性疾患、特発性疾患、ウイルス性疾患、細菌性疾患、プリオン性疾患、真菌性疾患、寄生生物性疾患、関節炎、創傷治癒、免疫不全、炎症性疾患、再生不良性貧血、貧血、遺伝性障害、先天性障害、1型糖尿病、2型糖尿病、妊娠性糖尿病、高血糖症、代謝症候群、リポジストロフィー症候群、脂質異常症、インスリン抵抗性、レプチン抵抗性、アテローム性動脈硬化症、血管疾患、高コレステロール血症、高トリグリセリド血症、非アルコール性脂肪性肝疾患、体重過多、または肥満、ならびにこれらの任意の組み合わせに関連する、本発明1028の方法。
[本発明1044]
1つ以上のリガンドを発現する疾患細胞の試料を提供することと、
(i)E3ユビキチンリガーゼ(E3)モチーフを含む分解ドメインと、(ii)前記分解ドメインを前記1つ以上のリガンドへと特異的に方向付けることができる標的指向ドメインであって、前記分解ドメインに対して異種である、標的指向ドメインと、(iii)前記分解ドメインを前記標的指向ドメインに結合させるリンカーとを含む複数のキメラ分子を提供することと、
前記疾患細胞が前記キメラ分子の非存在下で増殖することに失敗するのに有効な条件下で、前記試料を前記複数のキメラ分子と接触させることと、
前記キメラ分子のうちのどれが前記疾患細胞の増殖を可能にするかを決定することと、
前記決定に基づいて、前記キメラ分子に結合しかつ前記疾患細胞の増殖を可能にするリガンドを、前記疾患のバイオマーカーとして同定することと
を含む、疾患バイオマーカーについてスクリーニングする方法。
[本発明1045]
前記疾患が、癌、転移性癌、脳卒中、虚血、末梢血管疾患、アルコール性肝疾患、肝炎、肝硬変、パーキンソン病、アルツハイマー病、嚢胞性線維症糖尿病、ALS、病原性疾患、特発性疾患、ウイルス性疾患、細菌性疾患、プリオン性疾患、真菌性疾患、寄生生物性疾患、関節炎、創傷治癒、免疫不全、炎症性疾患、再生不良性貧血、貧血、遺伝性障害、先天性障害、1型糖尿病、2型糖尿病、妊娠性糖尿病、高血糖症、代謝症候群、リポジストロフィー症候群、脂質異常症、インスリン抵抗性、レプチン抵抗性、アテローム性動脈硬化症、血管疾患、高コレステロール血症、高トリグリセリド血症、非アルコール性脂肪性肝疾患、体重過多、および肥満からなる群から選択される、本発明1044の方法。
[本発明1046]
前記分解ドメインが、細菌病原体である、本発明1044の方法。
[本発明1047]
前記細菌病原体が、シゲラ、サルモネラ、バチルス、バルトネラ、ボルデテラ、ボレリア、ブルセラ、カンピロバクター、クラミジアおよびクラミドフィラ、クロストリジウム、コリネバクテリウム、エンテロコッカス、エシェリキア、フランシセラ、ヘモフィルス、ヘリコバクター、レジオネラ、レプトスピラ、リステリア、マイコバクテリウム、マイコプラズマ、ナイセリア、シュードモナス、リケッチア、スタフィロコッカス、ストレプトコッカス、トレポネーマ、ウレアプラズマ、ビブリオ、ならびにエルシニアからなる群から選択される、本発明1046の方法。
[本発明1048]
前記分解ドメインが、細菌病原体由来であり、かつシゲラ・フレックスネリE3リガーゼ、SspH1、SspH2、SlrP、AvrPtoB、LubX、NleG5-1、NleG2-3、LegU1、LegAU13、NIeL、SopA、SidC、XopL、GobX、VirF、GALA、AnkB、またはSidEを含む、本発明1046の方法。
[本発明1049]
前記分解ドメインが、シゲラIpaHタンパク質である、本発明1044の方法。
[本発明1050]
前記シゲラIpaHタンパク質が、IpaH9.8、IpaH1.4、IpaH2.5、IpaH4.5、IpaH7.8、IpaH0887、IpaH1389、IpaH2022、IpaH2202、IpaH2610、およびIpaH0722からなる群から選択される、本発明1049の方法。
[本発明1051]
前記細菌病原体が、シゲラ・フレックスネリである場合である、本発明1046の方法。
[本発明1052]
前記標的指向ドメインが、モノボディ、フィブロネクチンIII型ドメイン(FN3)、抗体、ポリクローナル抗体、モノクローナル抗体、組換え抗体、抗体フラグメント、Fab’、F(ab’)2、Fv、scFv、tascFv、ビス-scFv、sdAb、VH、VL、Vnar、scFvD10、scFv13R4、scFvD10、ヒト化抗体、キメラ抗体、相補決定領域(CDR)、IgA抗体、IgD抗体、IgE抗体、IgG抗体、IgM抗体、ナノボディ、イントラボディ、ユニボディ、ミニボディ、非抗体タンパク質骨格、アドネクチン、アフィボディおよびそれらの2ヘリックス変異体、アンチカリン、ラクダ科抗体、V H H、ノッチン、DARPin、またはSsod7dである、本発明1044の方法。
[本発明1053]
前記標的指向ドメインがモノボディであり、前記モノボディが、以下(括弧内に標的抗原を示す):
GS2(GFP)、Nsa5(SHP2)、RasInI(HRas/KRas)、およびRasInII(HRas/KRas)、1D10(CDC34)、1D7(COPS5)、1C4(MAP2K5)、2C12(MAP2K5)、1E2(SF3A1)、1C2(USP11)、1A9(USP11)、Ubi4(ユビキチン)、EI1.4.1(EGFR)、EI2.4.6(EGFR)、EI3.4.3(EGFR)、EI4.2.1(EGFR)、EI4.4.2(EGFR)、EI6.2.6(EGFR)、EI6.2.10(EGFR)、E246(EGFR)、C743(CEA)、IIIa8.2.6(FcγIIa)、IIIa6.2.6(FcγIIIa)、hA2.2.1(hA33)、hA2.2.2(hA33)、hA3.2.1(hA33)、hA3.2.3(hA33)、mA3.2.1(mA33)、mA3.2.2(mA33)、mA3.2.3(mA33)、mA3.2.4(mA33)、mA3.2.5(mA33)、Alb3.2.1(hAlb)、mI2.2.1(mIgG)、HA4(AblSH2)、HA10(AblSH2)、HA16(AblSH2)、HA18(AblSH2)、159(vEGFR)、MUC16(MSLN)、E2#3(ERα/EF)、E2#4(ERα/EF)、E2#5(ERα/EF)、E2#6(ERα/EF)、E2#7(ERα/EF)、E2#8(ERα/EF)、E2#9(ERα/EF)、E2#10(ERα/EF)、E2#11(ERα/EF)、E2#23(ERα/EF)、E3#2(ERα/EF)、E3#6(ERα/EF)、OHT#31(ERα/EF)、OHT#32(ERα/EF)、OHT#33(ERα/EF)、AB7-A1(ERα/EF)、AB7-B1(ERα/EF)、MBP-74(MBP)、MBP-76(MBP)、MBP-79(MBP)、hSUMO4-33(hSUMO4)、hSUMO-39(hSUMO4)、ySUMO-53(ySUMO)、ySUMO-56(ySUMO)、ySUMO-57(ySUMO)、T14.25(TNFα)、T14.20(TNFα)、FNfn10-3JCL14(avβ3インテグリン)、1C9(Src SH3)、1F11(Src SH3)、1F10(Src SH3)、2G10(Src SH3)、2B2(Src SH3)、1E3(Src SH3)、E18(VEGFR2)、E19(VEGFR2)、E26(VEGFR2)、E29(VEGFR2)、FG4.2(リゾチーム)、FG4.1(リゾチーム)、2L4.1(リゾチーム)、BF4.1(リゾチーム)、BF4.9(リゾチーム)、BF4.4(リゾチーム)、BFs1c4.01(リゾチーム)、BFs1c4.07(リゾチーム)、BFs3_4.02(リゾチーム)、BFs3_4.06(リゾチーム)、BFs3_8.01(リゾチーム)、10C17C25(ホスホ-IκBα)、Fn-N22(SARS N)、Fn-N17(SARS N)、FN-N10(SARS N)、gI2.5.3T88I(ヤギIgG)、gI2.5.2(ヤギIgG)、gI2.5.4(ヤギIgG)、rI4.5.4(ウサギIgG)、rI4.3.1(ウサギIgG)、rI3.6.6(ウサギIgG)、rI4.3.4(ウサギIgG)、rI3.6.4(ウサギIgG)、およびrI4.3.3(ウサギIgG)
からなる群から選択されるフィブロネクチンIII型ドメイン(FN3)モノボディである、本発明1050の方法。
Claims (53)
- E3ユビキチンリガーゼ(E3)モチーフを含む分解ドメインと、
前記分解ドメインを基質へと特異的に方向付けることができる標的指向ドメインであって、前記分解ドメインに対して異種である、標的指向ドメインと、
前記分解ドメインを前記標的指向ドメインに結合させるリンカーと
を含む、単離されたキメラ分子。 - 前記E3モチーフが、修飾結合領域を有しない前記E3モチーフと比較して前記基質への結合を阻害するまたは減少させる修飾結合領域を含む、請求項1に記載のキメラ分子。
- 前記修飾が、前記結合領域における変異または欠失である、請求項2に記載のキメラ分子。
- 前記E3モチーフが、前記基質のタンパク質分解を可能にする、請求項1に記載のキメラ分子。
- 前記E3モチーフが、細胞型特異的または組織特異的リガーゼ機能を保有する、請求項1に記載のキメラ分子。
- 前記リガーゼ機能が、細胞型特異的であり、前記細胞型は、皮膚細胞、筋肉細胞、上皮細胞、内皮細胞、幹細胞、臍帯血管細胞、角膜細胞、心筋細胞、大動脈細胞、角膜上皮細胞、体細胞、線維芽細胞、ケラチノサイト、メラノサイト、脂肪細胞、骨細胞、骨芽細胞、気道細胞、微小血管細胞、乳房細胞、血管細胞、軟骨細胞、胎盤細胞、肝細胞、膠細胞、表皮細胞、角膜輪部幹細胞、歯周幹細胞、骨髄間質細胞、ハイブリドーマ細胞、腎臓細胞、膵島、関節軟骨細胞、神経芽細胞、リンパ球、および赤血球からなる群から選択される、請求項5に記載のキメラ分子。
- 前記分解ドメインが細菌病原体由来である、請求項1に記載のキメラ分子。
- 前記細菌病原体が、シゲラ(Shigella)、サルモネラ(Salmonella)、バチルス(Bacillus)、バルトネラ(Bartonella)、ボルデテラ(Bordetella)、ボレリア(Borrelia)、ブルセラ(Brucella)、カンピロバクター(Campylobacter)、クラミジア(Chlamydia)およびクラミドフィラ(Chlamydophila)、クロストリジウム(Clostridium)、コリネバクテリウム(Corynebacterium)、エンテロコッカス(Enterococcus)、エシェリキア(Escherichia)、フランシセラ(Francisella)、ヘモフィルス(Haemophilus)、ヘリコバクター(Helicobacter)、レジオネラ(Legionella)、レプトスピラ(Leptospira)、リステリア(Listeria)、マイコバクテリウム(Mycobacterium)、マイコプラズマ(Mycoplasma)、ナイセリア(Neisseria)、シュードモナス(Pseudomonas)、リケッチア(Rickettsia)、スタフィロコッカス(Staphylococcus)、ストレプトコッカス(Streptococcus)、トレポネーマ(Treponema)、ウレアプラズマ(Ureaplasma)、ビブリオ(Vibrio)、ならびにエルシニア(Yersinia)からなる群から選択される、請求項7に記載のキメラ分子。
- 前記分解ドメインが、細菌病原体由来であり、かつシゲラ・フレックスネリ(Shigella flexneri)E3リガーゼ、SspH1、SspH2、SlrP、AvrPtoB、LubX、NleG5-1、NleG2-3、LegU1、LegAU13、NIeL、SopA、SidC、XopL、GobX、VirF、GALA、AnkB、またはSidEを含む、請求項7に記載のキメラ分子。
- 前記分解ドメインが、シゲラIpaHタンパク質である、請求項1に記載のキメラ分子。
- 前記シゲラIpaHタンパク質が、IpaH9.8、IpaH1.4、IpaH2.5、IpaH4.5、IpaH7.8、IpaH0887、IpaH1389、IpaH2022、IpaH2202、IpaH2610、およびIpaH0722からなる群から選択される、請求項10に記載のキメラ分子。
- 前記細菌病原体がシゲラ・フレックスネリである場合である、請求項7に記載のキメラ分子。
- 前記標的指向ドメインが、モノボディ、フィブロネクチンIII型ドメイン(FN3)抗体、ポリクローナル抗体、モノクローナル抗体、組換え抗体、抗体フラグメント、Fab’、F(ab’)2、Fv、scFv、tascFv、ビス-scFv、sdAb、VH、VL、Vnar、scFvD10、scFv13R4、scFvD10、ヒト化抗体、キメラ抗体、相補性決定領域(CDR)、IgA抗体、IgD抗体、IgE抗体、IgG抗体、IgM抗体、ナノボディ、イントラボディ、ユニボディ、ミニボディ、非抗体タンパク質骨格、アドネクチン、アフィボディおよびそれらの2ヘリックス変異体、アンチカリン、ラクダ科抗体、VHH、ノッチン(knottin)、DARPin、またはSso7dである、請求項1に記載のキメラ分子。
- 前記標的指向ドメインがモノボディであり、前記モノボディが、以下(括弧内に標的抗原を示す):
GS2(GFP)、Nsa5(SHP2)、RasInI(HRas/KRas)、およびRasInII(HRas/KRas)、1D10(CDC34)、1D7(COPS5)、1C4(MAP2K5)、2C12(MAP2K5)、1E2(SF3A1)、1C2(USP11)、1A9(USP11)、Ubi4(ユビキチン)、EI1.4.1(EGFR)、EI2.4.6(EGFR)、EI3.4.3(EGFR)、EI4.2.1(EGFR)、EI4.4.2(EGFR)、EI6.2.6(EGFR)、EI6.2.10(EGFR)、E246(EGFR)、C743(CEA)、IIIa8.2.6(FcγIIa)、IIIa6.2.6(FcγIIIa)、hA2.2.1(hA33)、hA2.2.2(hA33)、hA3.2.1(hA33)、hA3.2.3(hA33)、mA3.2.1(mA33)、mA3.2.2(mA33)、mA3.2.3(mA33)、mA3.2.4(mA33)、mA3.2.5(mA33)、Alb3.2.1(hAlb)、mI2.2.1(mIgG)、HA4(AblSH2)、HA10(AblSH2)、HA16(AblSH2)、HA18(AblSH2)、159(vEGFR)、MUC16(MSLN)、E2#3(ERα/EF)、E2#4(ERα/EF)、E2#5(ERα/EF)、E2#6(ERα/EF)、E2#7(ERα/EF)、E2#8(ERα/EF)、E2#9(ERα/EF)、E2#10(ERα/EF)、E2#11(ERα/EF)、E2#23(ERα/EF)、E3#2(ERα/EF)、E3#6(ERα/EF)、OHT#31(ERα/EF)、OHT#32(ERα/EF)、OHT#33(ERα/EF)、AB7-A1(ERα/EF)、AB7-B1(ERα/EF)、MBP-74(MBP)、MBP-76(MBP)、MBP-79(MBP)、hSUMO4-33(hSUMO4)、hSUMO-39(hSUMO4)、ySUMO-53(ySUMO)、ySUMO-56(ySUMO)、ySUMO-57(ySUMO)、T14.25(TNFα)、T14.20(TNFα)、FNfn10-3JCL14(avβ3インテグリン)、1C9(Src SH3)、1F11(Src SH3)、1F10(Src SH3)、2G10(Src SH3)、2B2(Src SH3)、1E3(Src SH3)、E18(VEGFR2)、E19(VEGFR2)、E26(VEGFR2)、E29(VEGFR2)、FG4.2(リゾチーム)、FG4.1(リゾチーム)、2L4.1(リゾチーム)、BF4.1(リゾチーム)、BF4.9(リゾチーム)、BF4.4(リゾチーム)、BFs1c4.01(リゾチーム)、BFs1c4.07(リゾチーム)、BFs3_4.02(リゾチーム)、BFs3_4.06(リゾチーム)、BFs3_8.01(リゾチーム)、10C17C25(ホスホ-IκBα)、Fn-N22(SARS N)、Fn-N17(SARS N)、FN-N10(SARS N)、gI2.5.3T88I(ヤギIgG)、gI2.5.2(ヤギIgG)、gI2.5.4(ヤギIgG)、rI4.5.4(ウサギIgG)、rI4.3.1(ウサギIgG)、rI3.6.6(ウサギIgG)、rI4.3.4(ウサギIgG)、rI3.6.4(ウサギIgG)、およびrI4.3.3(ウサギIgG)
からなる群から選択されるフィブロネクチンIII型ドメイン(FN3)モノボディである、請求項13に記載のキメラ分子。 - 前記基質が、蛍光タンパク質、ヒストンタンパク質、核局在化シグナル(NLS)、H-Rasタンパク質、Src相同2ドメイン含有ホスファターゼ2(SHP2)、β-ガラクトシダーゼ、gpD、Hsp70、MBP、CDC34、COPS5、MAP2K5、SF3A1、USP11、ユビキチン、EGFR、CEA、FcγIIa、FcγIIIa、hA33、mA33、hAlb、mIgG、AblSH2、vEGFR、MSLN、ERα/EF、hSUMO4、ySUMO、TNFα、avβ3インテグリン、SrcSH3、リゾチーム、ホスホ-IκBα、SARS N、ヤギIgG、ウサギIgG、翻訳後修飾タンパク質、フィブリン、ハンチンチン、腫瘍形成タンパク質、p53、Rb、接着タンパク質、受容体、細胞周期タンパク質、チェックポイントタンパク質、HFE、ATP7B、プリオンタンパク質、ウイルスタンパク質、細菌タンパク質、寄生生物タンパク質、真菌タンパク質、DNA結合タンパク質、代謝タンパク質、調節タンパク質、構造タンパク質、酵素、免疫原性タンパク質、自己免疫原性タンパク質、免疫原、抗原、および病原性タンパク質からなる群から選択される、請求項1に記載のキメラ分子。
- 前記基質が、緑色蛍光タンパク質、エメラルド蛍光タンパク質、ビーナス蛍光タンパク質、セルリアン蛍光タンパク質、および増強シアン蛍光タンパク質からなる群から選択される蛍光タンパク質である、請求項1に記載のキメラ分子。
- 前記標的指向ドメインが、非天然基質に結合する、請求項1に記載のキメラ分子。
- 請求項1に記載の単離されたキメラ分子をコードするmRNAを提供することと、
1つ以上のポリアデノシン結合タンパク質(「PABP」)を提供することと、
前記mRNAおよび前記1つ以上のPABPからリボヌクレオタンパク質複合体をアセンブルすることと
を含む、リボヌクレオタンパク質を形成する方法。 - 前記mRNAが、3’末端ポリアデノシン(ポリA)テールを含む、請求項18に記載の方法。
- 請求項1に記載のキメラ分子と、
薬学的に許容される担体と
を含む、組成物。 - 抗炎症剤、抗糖尿病剤、脂質低下剤、化学療法剤、抗ウイルス剤、抗生物質、代謝剤、小分子阻害剤、プロテインキナーゼ阻害剤、アジュバント、アポトーシス剤、増殖剤、および臓器親和性標的指向剤、ならびにこれらの任意の組み合わせからなる群から選択される第2の薬剤をさらに含む、請求項20に記載の組成物。
- 疾患を有する対象を選択することと、
請求項20に記載の組成物を前記対象に投与して、前記対象に、前記疾患に罹患していない対象と比較して、前記基質の増加した発現レベルを与えることと
を含む、疾患を治療する方法。 - 前記疾患が、癌、転移性癌、脳卒中、虚血、末梢血管疾患、アルコール性肝疾患、肝炎、肝硬変、パーキンソン病、アルツハイマー病、嚢胞性線維症糖尿病、ALS、病原性疾患、特発性疾患、ウイルス性疾患、細菌性疾患、プリオン性疾患、真菌性疾患、寄生生物性疾患、関節炎、創傷治癒、免疫不全、炎症性疾患、再生不良性貧血、貧血、遺伝性障害、先天性障害、1型糖尿病、2型糖尿病、妊娠性糖尿病、高血糖症、代謝症候群、リポジストロフィー症候群、脂質異常症、インスリン抵抗性、レプチン抵抗性、アテローム性動脈硬化症、血管疾患、高コレステロール血症、高トリグリセリド血症、非アルコール性脂肪性肝疾患、体重過多、および肥満からなる群から選択される、請求項22に記載の方法。
- 前記投与が、経口的に、非経口的に、皮下に、静脈内に、筋肉内に、腹腔内に、鼻腔内滴下により、移植により、腔内もしくは膀胱内滴下により、眼内に、動脈内に、病変内に、経皮的に、または粘膜への適用により行われる、請求項22に記載の方法。
- サイレンシングさせる基質を選択することと、
請求項1に記載のキメラ分子を提供することと、
基質-分子複合体の形成を可能にするのに有効な条件下で、前記基質を前記キメラ分子と接触させることであって、前記複合体が、前記サイレンシングさせる基質の分解を媒介する、接触させることと
を含む、基質サイレンシングのための方法。 - 前記基質が、蛍光タンパク質、ヒストンタンパク質、核局在化シグナル(NLS)、H-Rasタンパク質、SHP2タンパク質、Src相同2ドメイン含有ホスファターゼ2(SHP2)、β-ガラクトシダーゼ、gpD、Hsp70、MBP、CDC34、COPS5、MAP2K5、SF3A1、USP11、ユビキチン、EGFR、CEA、FcγIIa、FcγIIIa、hA33、mA33、hAlb、mIgG、AblSH2、vEGFR、MSLN、ERα/EF、hSUMO4、ySUMO、TNFα、avβ3インテグリン、SrcSH3、リゾチーム、ホスホ-IκBα、SARS N、ヤギIgG、ウサギIgG、翻訳後修飾タンパク質、フィブリン、ハンチンチン、腫瘍形成タンパク質、p53、Rb、接着タンパク質、受容体、細胞周期タンパク質、チェックポイントタンパク質、HFE、ATP7B、プリオンタンパク質、ウイルスタンパク質、細菌タンパク質、寄生生物タンパク質、真菌タンパク質、DNA結合タンパク質、代謝タンパク質、調節タンパク質、構造タンパク質、酵素、免疫原性タンパク質、自己免疫原性タンパク質、免疫原、抗原、および病原性タンパク質からなる群から選択される、請求項25に記載の方法。
- 前記基質が、緑色蛍光タンパク質、エメラルド蛍光タンパク質、ビーナス蛍光タンパク質、セルリアン蛍光タンパク質、および増強シアン蛍光タンパク質からなる群から選択される蛍光タンパク質である、請求項25に記載の方法。
- その存在が疾患状態を媒介する生体分子を提供することと、
(i)E3ユビキチンリガーゼ(E3)モチーフを含む分解ドメインと、(ii)前記分解ドメインを前記生体分子へと特異的に方向付けることができる標的指向ドメインであって、前記分解ドメインに対して異種である、標的指向ドメインと、(iii)前記分解ドメインを前記標的指向ドメインに結合させるリンカーとを含む試験剤を提供することと、
前記試験剤が前記生体分子の分解を促進するのに有効な条件下で、前記生体分子を前記試験剤と接触させることと、
前記接触の結果としての前記生体分子のレベルを決定することと、
前記決定に基づいて、前記生体分子のレベルを低下させる前記試験剤を、前記疾患に対する治療有効性の候補であるとして同定することと
を含む、疾患に対する治療有効性について薬剤をスクリーニングする方法。 - 前記同定が、前記疾患に罹患していない対象における標準生体分子レベルに関して行われる、請求項28に記載の方法。
- 前記同定が、前記接触がない前記生体分子レベルに関して行われる、請求項28に記載の方法。
- 複数の試験剤を用いて行われる、請求項28に記載の方法。
- 前記分解ドメインが細菌病原体である、請求項28に記載の方法。
- 前記細菌病原体が、シゲラ、サルモネラ、バチルス、バルトネラ、ボルデテラ、ボレリア、ブルセラ、カンピロバクター、クラミジアおよびクラミドフィラ、クロストリジウム、コリネバクテリウム、エンテロコッカス、エシェリキア、フランシセラ、ヘモフィルス、ヘリコバクター、レジオネラ、レプトスピラ、リステリア、マイコバクテリウム、マイコプラズマ、ナイセリア、シュードモナス、リケッチア、スタフィロコッカス、ストレプトコッカス、トレポネーマ、ウレアプラズマ、ビブリオ、ならびにエルシニアからなる群から選択される、請求項32に記載の方法。
- 前記分解ドメインが、細菌病原体由来であり、かつシゲラ・フレックスネリE3リガーゼ、SspH1、SspH2、SlrP、AvrPtoB、LubX、NleG5-1、NleG2-3、LegU1、LegAU13、NIeL、SopA、SidC、XopL、GobX、VirF、GALA、AnkB、またはSidEを含む、請求項32に記載の方法。
- 前記分解ドメインが、シゲラIpaHタンパク質である、請求項28に記載の方法。
- 前記シゲラIpaHタンパク質が、IpaH9.8、IpaH1.4、IpaH2.5、IpaH4.5、IpaH7.8、IpaH0887、IpaH1389、IpaH2022、IpaH2202、IpaH2610、およびIpaH0722からなる群から選択される、請求項35に記載の方法。
- 前記細菌病原体が、シゲラ・フレックスネリである場合である、請求項32に記載の方法。
- 前記標的指向ドメインが、モノボディ、フィブロネクチンIII型ドメイン(FN3)、抗体、ポリクローナル抗体、モノクローナル抗体、組換え抗体、抗体フラグメント、Fab’、F(ab’)2、Fv、scFv、tascFv、ビス-scFv、sdAb、VH、VL、Vnar、scFvD10、scFv13R4、scFvD10、ヒト化抗体、キメラ抗体、相補性決定領域(CDR)、IgA抗体、IgD抗体、IgE抗体、IgG抗体、IgM抗体、ナノボディ、イントラボディ、ユニボディ、ミニボディ、非抗体タンパク質骨格、アドネクチン、アフィボディおよびそれらの2ヘリックス変異体、アンチカリン、ラクダ科抗体、VHH、ノッチン、DARPin、またはSso7dである、請求項28に記載の方法。
- 前記標的指向ドメインがモノボディであり、前記モノボディが、以下(括弧内に標的抗原を示す):
GS2(GFP)、Nsa5(SHP2)、RasInI(HRas/KRas)、およびRasInII(HRas/KRas)、1D10(CDC34)、1D7(COPS5)、1C4(MAP2K5)、2C12(MAP2K5)、1E2(SF3A1)、1C2(USP11)、1A9(USP11)、Ubi4(ユビキチン)、EI1.4.1(EGFR)、EI2.4.6(EGFR)、EI3.4.3(EGFR)、EI4.2.1(EGFR)、EI4.4.2(EGFR)、EI6.2.6(EGFR)、EI6.2.10(EGFR)、E246(EGFR)、C743(CEA)、IIIa8.2.6(FcγIIa)、IIIa6.2.6(FcγIIIa)、hA2.2.1(hA33)、hA2.2.2(hA33)、hA3.2.1(hA33)、hA3.2.3(hA33)、mA3.2.1(mA33)、mA3.2.2(mA33)、mA3.2.3(mA33)、mA3.2.4(mA33)、mA3.2.5(mA33)、Alb3.2.1(hAlb)、mI2.2.1(mIgG)、HA4(AblSH2)、HA10(AblSH2)、HA16(AblSH2)、HA18(AblSH2)、159(vEGFR)、MUC16(MSLN)、E2#3(ERα/EF)、E2#4(ERα/EF)、E2#5(ERα/EF)、E2#6(ERα/EF)、E2#7(ERα/EF)、E2#8(ERα/EF)、E2#9(ERα/EF)、E2#10(ERα/EF)、E2#11(ERα/EF)、E2#23(ERα/EF)、E3#2(ERα/EF)、E3#6(ERα/EF)、OHT#31(ERα/EF)、OHT#32(ERα/EF)、OHT#33(ERα/EF)、AB7-A1(ERα/EF)、AB7-B1(ERα/EF)、MBP-74(MBP)、MBP-76(MBP)、MBP-79(MBP)、hSUMO4-33(hSUMO4)、hSUMO-39(hSUMO4)、ySUMO-53(ySUMO)、ySUMO-56(ySUMO)、ySUMO-57(ySUMO)、T14.25(TNFα)、T14.20(TNFα)、FNfn10-3JCL14(avβ3インテグリン)、1C9(Src SH3)、1F11(Src SH3)、1F10(Src SH3)、2G10(Src SH3)、2B2(Src SH3)、1E3(Src SH3)、E18(VEGFR2)、E19(VEGFR2)、E26(VEGFR2)、E29(VEGFR2)、FG4.2(リゾチーム)、FG4.1(リゾチーム)、2L4.1(リゾチーム)、BF4.1(リゾチーム)、BF4.9(リゾチーム)、BF4.4(リゾチーム)、BFs1c4.01(リゾチーム)、BFs1c4.07(リゾチーム)、BFs3_4.02(リゾチーム)、BFs3_4.06(リゾチーム)、BFs3_8.01(リゾチーム)、10C17C25(ホスホ-IκBα)、Fn-N22(SARS N)、Fn-N17(SARS N)、FN-N10(SARS N)、gI2.5.3T88I(ヤギIgG)、gI2.5.2(ヤギIgG)、gI2.5.4(ヤギIgG)、rI4.5.4(ウサギIgG)、rI4.3.1(ウサギIgG)、rI3.6.6(ウサギIgG)、rI4.3.4(ウサギIgG)、rI3.6.4(ウサギIgG)、およびrI4.3.3(ウサギIgG)
からなる群から選択されるフィブロネクチンIII型ドメイン(FN3)モノボディである、請求項38に記載の方法。 - 前記基質が、蛍光タンパク質、ヒストンタンパク質、核局在化シグナル(NLS)、H-Rasタンパク質、SHP2タンパク質、Src相同2ドメイン含有ホスファターゼ2(SHP2)、β-ガラクトシダーゼ、gpD、Hsp70、MBP、CDC34、COPS5、MAP2K5、SF3A1、USP11、ユビキチン、EGFR、CEA、FcγIIa、FcγIIIa、hA33、mA33、hAlb、mIgG、AblSH2、vEGFR、MSLN、ERα/EF、hSUMO4、ySUMO、TNFα、avβ3インテグリン、Src SH3、リゾチーム、ホスホ-IκBα、SARS N、ヤギIgG、ウサギIgG、翻訳後修飾タンパク質、フィブリン、ハンチンチン、腫瘍形成タンパク質、p53、Rb、接着タンパク質、受容体、細胞周期タンパク質、チェックポイントタンパク質、HFE、ATP7B、プリオンタンパク質、ウイルスタンパク質、細菌タンパク質、寄生生物タンパク質、真菌タンパク質、DNA結合タンパク質、代謝タンパク質、調節タンパク質、構造タンパク質、酵素、免疫原性タンパク質、自己免疫原性タンパク質、免疫原、抗原、および病原性タンパク質からなる群から選択される、請求項28に記載の方法。
- 前記基質が、緑色蛍光タンパク質、エメラルド蛍光タンパク質、ビーナス蛍光タンパク質、セルリアン蛍光タンパク質、および増強シアン蛍光タンパク質からなる群から選択される蛍光タンパク質である、請求項28に記載の方法。
- 前記リンカーが、前記標的指向ドメインと前記生体分子との間の結合の立体破壊を防止するのに十分な長さのポリペプチドリンカーである、請求項28に記載の方法。
- 前記生体分子が、癌、転移性癌、脳卒中、虚血、末梢血管疾患、アルコール性肝疾患、肝炎、肝硬変、パーキンソン病、アルツハイマー病、嚢胞性線維症糖尿病、ALS、病原性疾患、特発性疾患、ウイルス性疾患、細菌性疾患、プリオン性疾患、真菌性疾患、寄生生物性疾患、関節炎、創傷治癒、免疫不全、炎症性疾患、再生不良性貧血、貧血、遺伝性障害、先天性障害、1型糖尿病、2型糖尿病、妊娠性糖尿病、高血糖症、代謝症候群、リポジストロフィー症候群、脂質異常症、インスリン抵抗性、レプチン抵抗性、アテローム性動脈硬化症、血管疾患、高コレステロール血症、高トリグリセリド血症、非アルコール性脂肪性肝疾患、体重過多、または肥満、ならびにこれらの任意の組み合わせに関連する、請求項28に記載の方法。
- 1つ以上のリガンドを発現する疾患細胞の試料を提供することと、
(i)E3ユビキチンリガーゼ(E3)モチーフを含む分解ドメインと、(ii)前記分解ドメインを前記1つ以上のリガンドへと特異的に方向付けることができる標的指向ドメインであって、前記分解ドメインに対して異種である、標的指向ドメインと、(iii)前記分解ドメインを前記標的指向ドメインに結合させるリンカーとを含む複数のキメラ分子を提供することと、
前記疾患細胞が前記キメラ分子の非存在下で増殖することに失敗するのに有効な条件下で、前記試料を前記複数のキメラ分子と接触させることと、
前記キメラ分子のうちのどれが前記疾患細胞の増殖を可能にするかを決定することと、
前記決定に基づいて、前記キメラ分子に結合しかつ前記疾患細胞の増殖を可能にするリガンドを、前記疾患のバイオマーカーとして同定することと
を含む、疾患バイオマーカーについてスクリーニングする方法。 - 前記疾患が、癌、転移性癌、脳卒中、虚血、末梢血管疾患、アルコール性肝疾患、肝炎、肝硬変、パーキンソン病、アルツハイマー病、嚢胞性線維症糖尿病、ALS、病原性疾患、特発性疾患、ウイルス性疾患、細菌性疾患、プリオン性疾患、真菌性疾患、寄生生物性疾患、関節炎、創傷治癒、免疫不全、炎症性疾患、再生不良性貧血、貧血、遺伝性障害、先天性障害、1型糖尿病、2型糖尿病、妊娠性糖尿病、高血糖症、代謝症候群、リポジストロフィー症候群、脂質異常症、インスリン抵抗性、レプチン抵抗性、アテローム性動脈硬化症、血管疾患、高コレステロール血症、高トリグリセリド血症、非アルコール性脂肪性肝疾患、体重過多、および肥満からなる群から選択される、請求項44に記載の方法。
- 前記分解ドメインが、細菌病原体である、請求項44に記載の方法。
- 前記細菌病原体が、シゲラ、サルモネラ、バチルス、バルトネラ、ボルデテラ、ボレリア、ブルセラ、カンピロバクター、クラミジアおよびクラミドフィラ、クロストリジウム、コリネバクテリウム、エンテロコッカス、エシェリキア、フランシセラ、ヘモフィルス、ヘリコバクター、レジオネラ、レプトスピラ、リステリア、マイコバクテリウム、マイコプラズマ、ナイセリア、シュードモナス、リケッチア、スタフィロコッカス、ストレプトコッカス、トレポネーマ、ウレアプラズマ、ビブリオ、ならびにエルシニアからなる群から選択される、請求項46に記載の方法。
- 前記分解ドメインが、細菌病原体由来であり、かつシゲラ・フレックスネリE3リガーゼ、SspH1、SspH2、SlrP、AvrPtoB、LubX、NleG5-1、NleG2-3、LegU1、LegAU13、NIeL、SopA、SidC、XopL、GobX、VirF、GALA、AnkB、またはSidEを含む、請求項46に記載の方法。
- 前記分解ドメインが、シゲラIpaHタンパク質である、請求項44に記載の方法。
- 前記シゲラIpaHタンパク質が、IpaH9.8、IpaH1.4、IpaH2.5、IpaH4.5、IpaH7.8、IpaH0887、IpaH1389、IpaH2022、IpaH2202、IpaH2610、およびIpaH0722からなる群から選択される、請求項49に記載の方法。
- 前記細菌病原体が、シゲラ・フレックスネリである場合である、請求項46に記載の方法。
- 前記標的指向ドメインが、モノボディ、フィブロネクチンIII型ドメイン(FN3)、抗体、ポリクローナル抗体、モノクローナル抗体、組換え抗体、抗体フラグメント、Fab’、F(ab’)2、Fv、scFv、tascFv、ビス-scFv、sdAb、VH、VL、Vnar、scFvD10、scFv13R4、scFvD10、ヒト化抗体、キメラ抗体、相補決定領域(CDR)、IgA抗体、IgD抗体、IgE抗体、IgG抗体、IgM抗体、ナノボディ、イントラボディ、ユニボディ、ミニボディ、非抗体タンパク質骨格、アドネクチン、アフィボディおよびそれらの2ヘリックス変異体、アンチカリン、ラクダ科抗体、VHH、ノッチン、DARPin、またはSsod7dである、請求項44に記載の方法。
- 前記標的指向ドメインがモノボディであり、前記モノボディが、以下(括弧内に標的抗原を示す):
GS2(GFP)、Nsa5(SHP2)、RasInI(HRas/KRas)、およびRasInII(HRas/KRas)、1D10(CDC34)、1D7(COPS5)、1C4(MAP2K5)、2C12(MAP2K5)、1E2(SF3A1)、1C2(USP11)、1A9(USP11)、Ubi4(ユビキチン)、EI1.4.1(EGFR)、EI2.4.6(EGFR)、EI3.4.3(EGFR)、EI4.2.1(EGFR)、EI4.4.2(EGFR)、EI6.2.6(EGFR)、EI6.2.10(EGFR)、E246(EGFR)、C743(CEA)、IIIa8.2.6(FcγIIa)、IIIa6.2.6(FcγIIIa)、hA2.2.1(hA33)、hA2.2.2(hA33)、hA3.2.1(hA33)、hA3.2.3(hA33)、mA3.2.1(mA33)、mA3.2.2(mA33)、mA3.2.3(mA33)、mA3.2.4(mA33)、mA3.2.5(mA33)、Alb3.2.1(hAlb)、mI2.2.1(mIgG)、HA4(AblSH2)、HA10(AblSH2)、HA16(AblSH2)、HA18(AblSH2)、159(vEGFR)、MUC16(MSLN)、E2#3(ERα/EF)、E2#4(ERα/EF)、E2#5(ERα/EF)、E2#6(ERα/EF)、E2#7(ERα/EF)、E2#8(ERα/EF)、E2#9(ERα/EF)、E2#10(ERα/EF)、E2#11(ERα/EF)、E2#23(ERα/EF)、E3#2(ERα/EF)、E3#6(ERα/EF)、OHT#31(ERα/EF)、OHT#32(ERα/EF)、OHT#33(ERα/EF)、AB7-A1(ERα/EF)、AB7-B1(ERα/EF)、MBP-74(MBP)、MBP-76(MBP)、MBP-79(MBP)、hSUMO4-33(hSUMO4)、hSUMO-39(hSUMO4)、ySUMO-53(ySUMO)、ySUMO-56(ySUMO)、ySUMO-57(ySUMO)、T14.25(TNFα)、T14.20(TNFα)、FNfn10-3JCL14(avβ3インテグリン)、1C9(Src SH3)、1F11(Src SH3)、1F10(Src SH3)、2G10(Src SH3)、2B2(Src SH3)、1E3(Src SH3)、E18(VEGFR2)、E19(VEGFR2)、E26(VEGFR2)、E29(VEGFR2)、FG4.2(リゾチーム)、FG4.1(リゾチーム)、2L4.1(リゾチーム)、BF4.1(リゾチーム)、BF4.9(リゾチーム)、BF4.4(リゾチーム)、BFs1c4.01(リゾチーム)、BFs1c4.07(リゾチーム)、BFs3_4.02(リゾチーム)、BFs3_4.06(リゾチーム)、BFs3_8.01(リゾチーム)、10C17C25(ホスホ-IκBα)、Fn-N22(SARS N)、Fn-N17(SARS N)、FN-N10(SARS N)、gI2.5.3T88I(ヤギIgG)、gI2.5.2(ヤギIgG)、gI2.5.4(ヤギIgG)、rI4.5.4(ウサギIgG)、rI4.3.1(ウサギIgG)、rI3.6.6(ウサギIgG)、rI4.3.4(ウサギIgG)、rI3.6.4(ウサギIgG)、およびrI4.3.3(ウサギIgG)
からなる群から選択されるフィブロネクチンIII型ドメイン(FN3)モノボディである、請求項50に記載の方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862644055P | 2018-03-16 | 2018-03-16 | |
US62/644,055 | 2018-03-16 | ||
PCT/US2019/022783 WO2019178604A1 (en) | 2018-03-16 | 2019-03-18 | Broad-spectrum proteome editing with an engineered bacterial ubiquitin ligase mimic |
JP2020549556A JP2021515582A (ja) | 2018-03-16 | 2019-03-18 | 操作された細菌ユビキチンリガーゼ模倣物を用いる、幅広い範囲にわたるプロテオーム編集 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020549556A Division JP2021515582A (ja) | 2018-03-16 | 2019-03-18 | 操作された細菌ユビキチンリガーゼ模倣物を用いる、幅広い範囲にわたるプロテオーム編集 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024059823A true JP2024059823A (ja) | 2024-05-01 |
Family
ID=67908087
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020549556A Pending JP2021515582A (ja) | 2018-03-16 | 2019-03-18 | 操作された細菌ユビキチンリガーゼ模倣物を用いる、幅広い範囲にわたるプロテオーム編集 |
JP2024026317A Pending JP2024059823A (ja) | 2018-03-16 | 2024-02-26 | 操作された細菌ユビキチンリガーゼ模倣物を用いる、幅広い範囲にわたるプロテオーム編集 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020549556A Pending JP2021515582A (ja) | 2018-03-16 | 2019-03-18 | 操作された細菌ユビキチンリガーゼ模倣物を用いる、幅広い範囲にわたるプロテオーム編集 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210017503A1 (ja) |
EP (1) | EP3765604A4 (ja) |
JP (2) | JP2021515582A (ja) |
CN (1) | CN112189051A (ja) |
WO (1) | WO2019178604A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115279418A (zh) * | 2019-10-21 | 2022-11-01 | 川斯勒佰尔公司 | 信使rna的组合物、方法和用途 |
EP4114854A1 (en) * | 2020-03-05 | 2023-01-11 | UMC Utrecht Holding B.V. | Membrane ubiquitin ligases to target protein degradation |
AU2021291235A1 (en) * | 2020-06-18 | 2022-12-22 | Umc Utrecht Holding B.V. | Screening method for effective target - E3 ligase combinations |
CN112266404A (zh) * | 2020-10-28 | 2021-01-26 | 北京大学深圳研究生院 | 选择性修饰靶标蛋白的基团转移方法及其应用 |
CN114645052B (zh) * | 2021-07-01 | 2023-05-26 | 中国医学科学院医学生物学研究所 | 一种全脑过表达核易位人源α-突触核蛋白转基因鼠的高效构建方法 |
CN113549621B (zh) * | 2021-07-14 | 2022-07-19 | 山西大学 | 一种增强细菌中外源蛋白活性和表达的最小启动子 |
CN113461790B (zh) * | 2021-07-14 | 2022-09-23 | 山西大学 | 一种增强细菌中外源蛋白活性和表达的前导稳定元件 |
CN114591986A (zh) * | 2021-07-29 | 2022-06-07 | 苏州科锐迈德生物医药科技有限公司 | 环状rna分子及其在目标蛋白的靶向降解中的应用 |
CN114057861B (zh) * | 2021-11-22 | 2023-11-21 | 深圳湾实验室坪山生物医药研发转化中心 | 一种靶向UBE2C的bio-PROTAC人工蛋白 |
CN114395582A (zh) * | 2022-02-09 | 2022-04-26 | 中国农业科学院烟草研究所(中国烟草总公司青州烟草研究所) | 一种烟草瞬时表达方法及其检测方法 |
WO2023173094A2 (en) * | 2022-03-10 | 2023-09-14 | Cornell University | Lysine-free ubiquibody variants for long-lived intracellular protein silencing |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4107836B2 (ja) * | 2001-12-07 | 2008-06-25 | 独立行政法人科学技術振興機構 | タンパク質分解排除酵素とその用途 |
US7892772B2 (en) * | 2007-03-12 | 2011-02-22 | Iti Scotland Limited | Targeted ubiquitination of proteins and screening methods using a new class of ubiquitin ligase proteins |
MX345300B (es) * | 2010-07-30 | 2017-01-24 | Novartis Ag * | Moléculas andamio de fibronectina y bibliotecas de las mismas. |
US9746475B2 (en) * | 2011-03-14 | 2017-08-29 | University Of Southern California | Antibody and antibody mimetic for visualization and ablation of endogenous proteins |
US20140112922A1 (en) * | 2011-03-28 | 2014-04-24 | Cornell University | Targeted protein silencing using chimeras between antibodies and ubiquitination enzymes |
US8980864B2 (en) * | 2013-03-15 | 2015-03-17 | Moderna Therapeutics, Inc. | Compositions and methods of altering cholesterol levels |
WO2017079723A1 (en) * | 2015-11-07 | 2017-05-11 | Board Of Regents, The University Of Texas System | Targeting proteins for degradation |
-
2019
- 2019-03-18 CN CN201980032476.4A patent/CN112189051A/zh active Pending
- 2019-03-18 JP JP2020549556A patent/JP2021515582A/ja active Pending
- 2019-03-18 WO PCT/US2019/022783 patent/WO2019178604A1/en active Application Filing
- 2019-03-18 US US16/981,626 patent/US20210017503A1/en active Pending
- 2019-03-18 EP EP19767389.0A patent/EP3765604A4/en active Pending
-
2024
- 2024-02-26 JP JP2024026317A patent/JP2024059823A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2019178604A1 (en) | 2019-09-19 |
CN112189051A (zh) | 2021-01-05 |
US20210017503A1 (en) | 2021-01-21 |
JP2021515582A (ja) | 2021-06-24 |
EP3765604A4 (en) | 2022-01-05 |
EP3765604A1 (en) | 2021-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2024059823A (ja) | 操作された細菌ユビキチンリガーゼ模倣物を用いる、幅広い範囲にわたるプロテオーム編集 | |
US11008372B2 (en) | Targeting proteins for degradation | |
AU2018274932B2 (en) | Cancer cell-specific antibody, anticancer drug and cancer testing method | |
JP6346159B2 (ja) | 所定の標的に対して親和性を有するヒトリポカリン2(Lcn2、hNGAL)の突然変異タンパク質 | |
O'Connor et al. | Ubiquitin‐Activated Interaction Traps (UBAIT s) identify E3 ligase binding partners | |
Vasu et al. | Novel vertebrate nucleoporins Nup133 and Nup160 play a role in mRNA export | |
US8591893B2 (en) | Paratope and epitope of anti-mortalin antibody | |
Ludwicki et al. | Broad-spectrum proteome editing with an engineered bacterial ubiquitin ligase mimic | |
Keren-Kaplan et al. | RUFY3 and RUFY4 are ARL8 effectors that promote coupling of endolysosomes to dynein-dynactin | |
EP1560847A2 (en) | Acetylated hmgb1 protein | |
JP6871866B2 (ja) | 抗rho gtpaseコンホーメーションシングルドメイン抗体及びその使用 | |
US20220065850A1 (en) | Intrabodies targeting post-translational modifications of native proteins and method for obtaining them | |
JP2024507867A (ja) | 2つのringドメインを含む融合タンパク質 | |
WO2007066809A1 (ja) | タンパク質重合体の重合核となりうるタンパク質又はその重合体が導入された細胞及びその製造法 | |
Yu et al. | Harnessing the lysosomal sorting signals of the cation-independent mannose-6-phosphate receptor for targeted degradation of membrane proteins | |
US20100080799A1 (en) | Wstf regulates the dna damage response of h2a.x via novel tyrosine kinase activity | |
WO2012082069A1 (en) | Protein aptamers based on unstructured scaffold proteins | |
WO2023173094A2 (en) | Lysine-free ubiquibody variants for long-lived intracellular protein silencing | |
CN113528569B (zh) | 一种利用isPLA高通量筛选单域抗体的方法及其应用 | |
JP2023550743A (ja) | E2ユビキチン又はユビキチン様コンジュゲートドメインを含む融合タンパク質並びに特定のタンパク質分解のためのドメインの標的化 | |
Zhang | Legionella pneumophila Control of Tubular Endoplasmic Reticulum and Translation Initiation during Early Infection | |
Beghein | Nanobody technology: expanding the toolbox for fundamental research | |
EP4110794A1 (en) | Leucine-rich repeat kinase 2 allosteric modulators | |
WO2023141361A2 (en) | Anti-b7-h3 compounds and methods of use | |
CN115594757A (zh) | 抗新型冠状病毒的中和抗体及其制备方法、制剂和用途 |