KR20150123803A - 향상된 이식유전자 발현 및 가공 - Google Patents
향상된 이식유전자 발현 및 가공 Download PDFInfo
- Publication number
- KR20150123803A KR20150123803A KR1020157022393A KR20157022393A KR20150123803A KR 20150123803 A KR20150123803 A KR 20150123803A KR 1020157022393 A KR1020157022393 A KR 1020157022393A KR 20157022393 A KR20157022393 A KR 20157022393A KR 20150123803 A KR20150123803 A KR 20150123803A
- Authority
- KR
- South Korea
- Prior art keywords
- mar
- nucleic acid
- protein
- seq
- leu
- Prior art date
Links
- 230000014509 gene expression Effects 0.000 title claims abstract description 213
- 108700019146 Transgenes Proteins 0.000 title claims description 126
- 238000012545 processing Methods 0.000 title claims description 32
- 238000000034 method Methods 0.000 claims abstract description 69
- 108090000623 proteins and genes Proteins 0.000 claims description 327
- 210000004027 cell Anatomy 0.000 claims description 288
- 102000004169 proteins and genes Human genes 0.000 claims description 214
- 239000013598 vector Substances 0.000 claims description 131
- 150000007523 nucleic acids Chemical class 0.000 claims description 118
- 108020004414 DNA Proteins 0.000 claims description 94
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 91
- 102000039446 nucleic acids Human genes 0.000 claims description 83
- 108020004707 nucleic acids Proteins 0.000 claims description 83
- 241000282414 Homo sapiens Species 0.000 claims description 71
- 101710089523 Signal recognition particle 14 kDa protein Proteins 0.000 claims description 69
- 102100037082 Signal recognition particle 14 kDa protein Human genes 0.000 claims description 69
- 108020004459 Small interfering RNA Proteins 0.000 claims description 63
- 210000004962 mammalian cell Anatomy 0.000 claims description 59
- 238000002744 homologous recombination Methods 0.000 claims description 56
- 230000006801 homologous recombination Effects 0.000 claims description 56
- 239000002924 silencing RNA Substances 0.000 claims description 52
- 230000037361 pathway Effects 0.000 claims description 51
- 230000028327 secretion Effects 0.000 claims description 46
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 43
- 108060003951 Immunoglobulin Proteins 0.000 claims description 38
- 108091027967 Small hairpin RNA Proteins 0.000 claims description 38
- 102000018358 immunoglobulin Human genes 0.000 claims description 38
- 230000010354 integration Effects 0.000 claims description 37
- 239000004055 small Interfering RNA Substances 0.000 claims description 37
- 239000013604 expression vector Substances 0.000 claims description 36
- 238000001890 transfection Methods 0.000 claims description 36
- 230000008439 repair process Effects 0.000 claims description 33
- 239000002773 nucleotide Substances 0.000 claims description 30
- 125000003729 nucleotide group Chemical group 0.000 claims description 30
- 230000001965 increasing effect Effects 0.000 claims description 29
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 29
- 238000011144 upstream manufacturing Methods 0.000 claims description 28
- 101100300807 Drosophila melanogaster spn-A gene Proteins 0.000 claims description 27
- 229920001184 polypeptide Polymers 0.000 claims description 25
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 25
- 239000003623 enhancer Substances 0.000 claims description 24
- 108020004999 messenger RNA Proteins 0.000 claims description 24
- 230000003248 secreting effect Effects 0.000 claims description 24
- 108700031762 Rad52 DNA Repair and Recombination Proteins 0.000 claims description 22
- 102100033934 DNA repair protein RAD51 homolog 2 Human genes 0.000 claims description 21
- 102000053062 Rad52 DNA Repair and Recombination Human genes 0.000 claims description 21
- -1 Rad54 Proteins 0.000 claims description 21
- 230000027455 binding Effects 0.000 claims description 21
- 230000006798 recombination Effects 0.000 claims description 21
- 238000005215 recombination Methods 0.000 claims description 21
- 101150008921 Brca2 gene Proteins 0.000 claims description 20
- 230000003115 biocidal effect Effects 0.000 claims description 20
- 101150072950 BRCA1 gene Proteins 0.000 claims description 19
- 230000001404 mediated effect Effects 0.000 claims description 18
- 230000008488 polyadenylation Effects 0.000 claims description 17
- 108010006519 Molecular Chaperones Proteins 0.000 claims description 15
- 230000002503 metabolic effect Effects 0.000 claims description 15
- 101150071637 mre11 gene Proteins 0.000 claims description 15
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 claims description 14
- 102100034107 TP53-binding protein 1 Human genes 0.000 claims description 14
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 claims description 14
- 101150059668 Bard1 gene Proteins 0.000 claims description 13
- 108010058546 Cyclin D1 Proteins 0.000 claims description 13
- 102100024165 G1/S-specific cyclin-D1 Human genes 0.000 claims description 13
- 101100226013 Mus musculus Ercc1 gene Proteins 0.000 claims description 13
- 101710187184 Signal recognition particle 54 kDa protein Proteins 0.000 claims description 13
- 102100031877 Signal recognition particle 54 kDa protein Human genes 0.000 claims description 13
- 101710150385 Signal recognition particle 54 kDa protein 1 Proteins 0.000 claims description 13
- 101710150383 Signal recognition particle 54 kDa protein 2 Proteins 0.000 claims description 13
- 101710150391 Signal recognition particle 54 kDa protein 3 Proteins 0.000 claims description 13
- 101710128823 Signal recognition particle 54 kDa protein homolog Proteins 0.000 claims description 13
- 230000000295 complement effect Effects 0.000 claims description 13
- 230000004927 fusion Effects 0.000 claims description 13
- 239000002679 microRNA Substances 0.000 claims description 13
- 230000020978 protein processing Effects 0.000 claims description 13
- 230000001225 therapeutic effect Effects 0.000 claims description 13
- 238000013519 translation Methods 0.000 claims description 13
- 108010078791 Carrier Proteins Proteins 0.000 claims description 12
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims description 12
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims description 12
- 102100025401 Breast cancer type 1 susceptibility protein Human genes 0.000 claims description 11
- 230000033616 DNA repair Effects 0.000 claims description 11
- 101710131307 Signal recognition particle 9 kDa protein Proteins 0.000 claims description 11
- 102100022055 Signal recognition particle 9 kDa protein Human genes 0.000 claims description 11
- 102000040650 (ribonucleotides)n+m Human genes 0.000 claims description 10
- 108700020463 BRCA1 Proteins 0.000 claims description 10
- 102000008579 Transposases Human genes 0.000 claims description 10
- 108010020764 Transposases Proteins 0.000 claims description 10
- 101150106864 HR gene Proteins 0.000 claims description 9
- 101001048454 Homo sapiens Protein Hook homolog 1 Proteins 0.000 claims description 9
- 102100023602 Protein Hook homolog 1 Human genes 0.000 claims description 9
- 108091070501 miRNA Proteins 0.000 claims description 9
- 241000699800 Cricetinae Species 0.000 claims description 8
- 101150112743 HSPA5 gene Proteins 0.000 claims description 8
- 239000003550 marker Substances 0.000 claims description 8
- 230000001105 regulatory effect Effects 0.000 claims description 8
- 230000009962 secretion pathway Effects 0.000 claims description 8
- 241000699802 Cricetulus griseus Species 0.000 claims description 7
- 102100027421 Heat shock cognate 71 kDa protein Human genes 0.000 claims description 7
- 101001080568 Homo sapiens Heat shock cognate 71 kDa protein Proteins 0.000 claims description 7
- 230000007547 defect Effects 0.000 claims description 7
- 238000002054 transplantation Methods 0.000 claims description 7
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 6
- 102100025399 Breast cancer type 2 susceptibility protein Human genes 0.000 claims description 6
- 101100355599 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) mus-11 gene Proteins 0.000 claims description 6
- 101150006234 RAD52 gene Proteins 0.000 claims description 6
- 239000003242 anti bacterial agent Substances 0.000 claims description 6
- 238000012761 co-transfection Methods 0.000 claims description 6
- 230000004481 post-translational protein modification Effects 0.000 claims description 6
- 108091005753 BiP proteins Proteins 0.000 claims description 5
- 101000904868 Homo sapiens Transcriptional regulator ATRX Proteins 0.000 claims description 5
- 102100023931 Transcriptional regulator ATRX Human genes 0.000 claims description 5
- 239000003795 chemical substances by application Substances 0.000 claims description 5
- 239000001963 growth medium Substances 0.000 claims description 5
- 108020005544 Antisense RNA Proteins 0.000 claims description 4
- 102000016943 Muramidase Human genes 0.000 claims description 4
- 108010014251 Muramidase Proteins 0.000 claims description 4
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 claims description 4
- 241000283984 Rodentia Species 0.000 claims description 4
- 238000012258 culturing Methods 0.000 claims description 4
- 230000013595 glycosylation Effects 0.000 claims description 4
- 238000006206 glycosylation reaction Methods 0.000 claims description 4
- 239000003102 growth factor Substances 0.000 claims description 4
- 229940088597 hormone Drugs 0.000 claims description 4
- 239000005556 hormone Substances 0.000 claims description 4
- 229960000274 lysozyme Drugs 0.000 claims description 4
- 239000004325 lysozyme Substances 0.000 claims description 4
- 235000010335 lysozyme Nutrition 0.000 claims description 4
- 101150090152 Lig1 gene Proteins 0.000 claims description 3
- 101100155034 Mus musculus Ubap2 gene Proteins 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000021121 meiosis Effects 0.000 claims description 3
- 210000001672 ovary Anatomy 0.000 claims description 3
- 102000016917 Complement C1 Human genes 0.000 claims description 2
- 108010028774 Complement C1 Proteins 0.000 claims description 2
- 102000004127 Cytokines Human genes 0.000 claims description 2
- 108090000695 Cytokines Proteins 0.000 claims description 2
- 101710118189 DNA repair protein RAD51 Proteins 0.000 claims description 2
- 102100034484 DNA repair protein RAD51 homolog 3 Human genes 0.000 claims description 2
- 101710136585 DNA repair protein RAD51 homolog 3 Proteins 0.000 claims description 2
- 102100034483 DNA repair protein RAD51 homolog 4 Human genes 0.000 claims description 2
- 101710136587 DNA repair protein RAD51 homolog 4 Proteins 0.000 claims description 2
- 102000003951 Erythropoietin Human genes 0.000 claims description 2
- 108090000394 Erythropoietin Proteins 0.000 claims description 2
- 101000934870 Homo sapiens Breast cancer type 1 susceptibility protein Proteins 0.000 claims description 2
- 101000934858 Homo sapiens Breast cancer type 2 susceptibility protein Proteins 0.000 claims description 2
- 108090000301 Membrane transport proteins Proteins 0.000 claims description 2
- 102000003939 Membrane transport proteins Human genes 0.000 claims description 2
- 240000007019 Oxalis corniculata Species 0.000 claims description 2
- 101710018890 RAD51B Proteins 0.000 claims description 2
- 101710156963 TP53-binding protein 1 Proteins 0.000 claims description 2
- 102000044209 Tumor Suppressor Genes Human genes 0.000 claims description 2
- 108700025716 Tumor Suppressor Genes Proteins 0.000 claims description 2
- 229940105423 erythropoietin Drugs 0.000 claims description 2
- 230000006846 excision repair Effects 0.000 claims description 2
- 239000003446 ligand Substances 0.000 claims description 2
- 230000009061 membrane transport Effects 0.000 claims description 2
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 claims description 2
- 210000000130 stem cell Anatomy 0.000 claims description 2
- 101000581326 Homo sapiens Mediator of DNA damage checkpoint protein 1 Proteins 0.000 claims 7
- 102100027643 Mediator of DNA damage checkpoint protein 1 Human genes 0.000 claims 7
- 241000426682 Salinispora Species 0.000 claims 3
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 claims 2
- 102000036365 BRCA1 Human genes 0.000 claims 1
- 101100514311 Caenorhabditis elegans mre-11 gene Proteins 0.000 claims 1
- 108020004511 Recombinant DNA Proteins 0.000 claims 1
- 125000003275 alpha amino acid group Chemical group 0.000 claims 1
- 241000288906 Primates Species 0.000 abstract description 6
- 230000010435 extracellular transport Effects 0.000 abstract 1
- 235000018102 proteins Nutrition 0.000 description 178
- 239000005090 green fluorescent protein Substances 0.000 description 92
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 89
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 87
- 239000013612 plasmid Substances 0.000 description 48
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 48
- 230000006780 non-homologous end joining Effects 0.000 description 47
- 230000000694 effects Effects 0.000 description 43
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 29
- 229960000598 infliximab Drugs 0.000 description 25
- 229950010131 puromycin Drugs 0.000 description 24
- 108010000633 signal peptide receptor Proteins 0.000 description 24
- 108010076504 Protein Sorting Signals Proteins 0.000 description 23
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 23
- 230000005782 double-strand break Effects 0.000 description 21
- 108010050848 glycylleucine Proteins 0.000 description 20
- 238000004458 analytical method Methods 0.000 description 19
- 238000003197 gene knockdown Methods 0.000 description 18
- 230000002829 reductive effect Effects 0.000 description 18
- 230000008569 process Effects 0.000 description 17
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 16
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 16
- 230000015572 biosynthetic process Effects 0.000 description 15
- 230000007246 mechanism Effects 0.000 description 15
- 239000000047 product Substances 0.000 description 15
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 14
- 150000001413 amino acids Chemical group 0.000 description 14
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 14
- 241000701022 Cytomegalovirus Species 0.000 description 13
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 13
- 230000002018 overexpression Effects 0.000 description 13
- 230000014616 translation Effects 0.000 description 13
- 108010073969 valyllysine Proteins 0.000 description 13
- 238000002474 experimental method Methods 0.000 description 12
- 108010015792 glycyllysine Proteins 0.000 description 12
- 108010034529 leucyl-lysine Proteins 0.000 description 12
- 238000004519 manufacturing process Methods 0.000 description 12
- 238000003753 real-time PCR Methods 0.000 description 12
- 108091026890 Coding region Proteins 0.000 description 11
- 108010047495 alanylglycine Proteins 0.000 description 11
- 108010047857 aspartylglycine Proteins 0.000 description 11
- 230000035772 mutation Effects 0.000 description 11
- 229960000575 trastuzumab Drugs 0.000 description 11
- 101001066129 Homo sapiens Glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 10
- 238000007792 addition Methods 0.000 description 10
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 10
- 108010049041 glutamylalanine Proteins 0.000 description 10
- 102000047486 human GAPDH Human genes 0.000 description 10
- 102100039524 DNA endonuclease RBBP8 Human genes 0.000 description 9
- 108050008316 DNA endonuclease RBBP8 Proteins 0.000 description 9
- 241000880493 Leptailurus serval Species 0.000 description 9
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 9
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 9
- 108010005233 alanylglutamic acid Proteins 0.000 description 9
- 108010087924 alanylproline Proteins 0.000 description 9
- 210000000349 chromosome Anatomy 0.000 description 9
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 230000009368 gene silencing by RNA Effects 0.000 description 9
- 108010064235 lysylglycine Proteins 0.000 description 9
- 239000002953 phosphate buffered saline Substances 0.000 description 9
- 108010070643 prolylglutamic acid Proteins 0.000 description 9
- 102000053602 DNA Human genes 0.000 description 8
- 101000663158 Homo sapiens Signal recognition particle 14 kDa protein Proteins 0.000 description 8
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 8
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 8
- 108010092854 aspartyllysine Proteins 0.000 description 8
- 238000004113 cell culture Methods 0.000 description 8
- YPHMISFOHDHNIV-FSZOTQKASA-N cycloheximide Chemical compound C1[C@@H](C)C[C@H](C)C(=O)[C@@H]1[C@H](O)CC1CC(=O)NC(=O)C1 YPHMISFOHDHNIV-FSZOTQKASA-N 0.000 description 8
- 230000030279 gene silencing Effects 0.000 description 8
- 102000052851 human SRP14 Human genes 0.000 description 8
- 108010057821 leucylproline Proteins 0.000 description 8
- 108010054155 lysyllysine Proteins 0.000 description 8
- 108010017391 lysylvaline Proteins 0.000 description 8
- 239000002609 medium Substances 0.000 description 8
- 239000012528 membrane Substances 0.000 description 8
- 238000013518 transcription Methods 0.000 description 8
- 230000035897 transcription Effects 0.000 description 8
- 102100022204 DNA-dependent protein kinase catalytic subunit Human genes 0.000 description 7
- 101710157074 DNA-dependent protein kinase catalytic subunit Proteins 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 7
- 108090000790 Enzymes Proteins 0.000 description 7
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 7
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 7
- 108010038633 aspartylglutamate Proteins 0.000 description 7
- 239000000872 buffer Substances 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 7
- 229940088598 enzyme Drugs 0.000 description 7
- 238000010353 genetic engineering Methods 0.000 description 7
- 108010025306 histidylleucine Proteins 0.000 description 7
- 238000011534 incubation Methods 0.000 description 7
- 230000003993 interaction Effects 0.000 description 7
- 239000000543 intermediate Substances 0.000 description 7
- 108010009298 lysylglutamic acid Proteins 0.000 description 7
- 108010056582 methionylglutamic acid Proteins 0.000 description 7
- 239000013600 plasmid vector Substances 0.000 description 7
- 102000040430 polynucleotide Human genes 0.000 description 7
- 108091033319 polynucleotide Proteins 0.000 description 7
- 239000002157 polynucleotide Substances 0.000 description 7
- 108010026333 seryl-proline Proteins 0.000 description 7
- 230000002269 spontaneous effect Effects 0.000 description 7
- 239000013603 viral vector Substances 0.000 description 7
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 6
- 108010077544 Chromatin Proteins 0.000 description 6
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 6
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 6
- 102000003960 Ligases Human genes 0.000 description 6
- 108090000364 Ligases Proteins 0.000 description 6
- 102100028156 Non-homologous end-joining factor 1 Human genes 0.000 description 6
- 108091058545 Secretory proteins Proteins 0.000 description 6
- 102000040739 Secretory proteins Human genes 0.000 description 6
- 102000040945 Transcription factor Human genes 0.000 description 6
- 108091023040 Transcription factor Proteins 0.000 description 6
- 108010044940 alanylglutamine Proteins 0.000 description 6
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 230000022131 cell cycle Effects 0.000 description 6
- 210000000170 cell membrane Anatomy 0.000 description 6
- 210000003483 chromatin Anatomy 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 239000013613 expression plasmid Substances 0.000 description 6
- 108010077515 glycylproline Proteins 0.000 description 6
- 108010037850 glycylvaline Proteins 0.000 description 6
- 229940072221 immunoglobulins Drugs 0.000 description 6
- 230000001976 improved effect Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 108010061238 threonyl-glycine Proteins 0.000 description 6
- 108700023863 Gene Components Proteins 0.000 description 5
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 5
- 102100028967 HLA class I histocompatibility antigen, alpha chain G Human genes 0.000 description 5
- 101710197836 HLA class I histocompatibility antigen, alpha chain G Proteins 0.000 description 5
- 101000578059 Homo sapiens Non-homologous end-joining factor 1 Proteins 0.000 description 5
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 5
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 5
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 5
- 229930193140 Neomycin Natural products 0.000 description 5
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 5
- 102000006010 Protein Disulfide-Isomerase Human genes 0.000 description 5
- 102000001195 RAD51 Human genes 0.000 description 5
- 108010068097 Rad51 Recombinase Proteins 0.000 description 5
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 5
- 239000013504 Triton X-100 Substances 0.000 description 5
- 229920004890 Triton X-100 Polymers 0.000 description 5
- 102100036976 X-ray repair cross-complementing protein 6 Human genes 0.000 description 5
- 101710124907 X-ray repair cross-complementing protein 6 Proteins 0.000 description 5
- 230000004913 activation Effects 0.000 description 5
- 108010013835 arginine glutamate Proteins 0.000 description 5
- 108010008355 arginyl-glutamine Proteins 0.000 description 5
- 108010062796 arginyllysine Proteins 0.000 description 5
- 108010093581 aspartyl-proline Proteins 0.000 description 5
- 108010068265 aspartyltyrosine Proteins 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 239000012228 culture supernatant Substances 0.000 description 5
- 238000004520 electroporation Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 5
- 108010078144 glutaminyl-glycine Proteins 0.000 description 5
- 108010081551 glycylphenylalanine Proteins 0.000 description 5
- 108010092114 histidylphenylalanine Proteins 0.000 description 5
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 5
- 108010000761 leucylarginine Proteins 0.000 description 5
- 108010003700 lysyl aspartic acid Proteins 0.000 description 5
- 108010038320 lysylphenylalanine Proteins 0.000 description 5
- 238000003032 molecular docking Methods 0.000 description 5
- 229960004927 neomycin Drugs 0.000 description 5
- 108010012581 phenylalanylglutamate Proteins 0.000 description 5
- 108010031719 prolyl-serine Proteins 0.000 description 5
- 108020003519 protein disulfide isomerase Proteins 0.000 description 5
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 230000032258 transport Effects 0.000 description 5
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 4
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 4
- 238000012413 Fluorescence activated cell sorting analysis Methods 0.000 description 4
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 4
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 4
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 4
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 4
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 4
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 4
- 101000981336 Homo sapiens Nibrin Proteins 0.000 description 4
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 4
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 4
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 4
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 4
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 4
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 4
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 4
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 4
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 4
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 4
- 108700011259 MicroRNAs Proteins 0.000 description 4
- 102000005431 Molecular Chaperones Human genes 0.000 description 4
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 4
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 4
- 230000018199 S phase Effects 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 4
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 4
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 4
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 4
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 4
- 238000004220 aggregation Methods 0.000 description 4
- 229940088710 antibiotic agent Drugs 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 239000011324 bead Substances 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 239000000470 constituent Substances 0.000 description 4
- 230000001086 cytosolic effect Effects 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 108010054812 diprotin A Proteins 0.000 description 4
- 238000000684 flow cytometry Methods 0.000 description 4
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 4
- 108010079547 glutamylmethionine Proteins 0.000 description 4
- 108010089804 glycyl-threonine Proteins 0.000 description 4
- 108010020688 glycylhistidine Proteins 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 108010085325 histidylproline Proteins 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 4
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 239000008188 pellet Substances 0.000 description 4
- 108010018625 phenylalanylarginine Proteins 0.000 description 4
- 239000002243 precursor Substances 0.000 description 4
- 108010053725 prolylvaline Proteins 0.000 description 4
- 230000022558 protein metabolic process Effects 0.000 description 4
- 230000008263 repair mechanism Effects 0.000 description 4
- 108010071207 serylmethionine Proteins 0.000 description 4
- 125000006850 spacer group Chemical group 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 230000010473 stable expression Effects 0.000 description 4
- AYEKOFBPNLCAJY-UHFFFAOYSA-O thiamine pyrophosphate Chemical compound CC1=C(CCOP(O)(=O)OP(O)(O)=O)SC=[N+]1CC1=CN=C(C)N=C1N AYEKOFBPNLCAJY-UHFFFAOYSA-O 0.000 description 4
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 4
- 230000002103 transcriptional effect Effects 0.000 description 4
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 4
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 3
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 3
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 3
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 3
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 3
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 3
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 3
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 3
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 3
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 3
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 3
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 3
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 3
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 3
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 3
- 102000014914 Carrier Proteins Human genes 0.000 description 3
- 108020004635 Complementary DNA Proteins 0.000 description 3
- 108010060248 DNA Ligase ATP Proteins 0.000 description 3
- 102100033195 DNA ligase 4 Human genes 0.000 description 3
- 238000012270 DNA recombination Methods 0.000 description 3
- 102100033996 Double-strand break repair protein MRE11 Human genes 0.000 description 3
- 108700022810 Drosophila Hsc70-3 Proteins 0.000 description 3
- 101150066002 GFP gene Proteins 0.000 description 3
- 241000287828 Gallus gallus Species 0.000 description 3
- QXQDADBVIBLBHN-FHWLQOOXSA-N Gln-Tyr-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QXQDADBVIBLBHN-FHWLQOOXSA-N 0.000 description 3
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 3
- PBFGQTGPSKWHJA-QEJZJMRPSA-N Glu-Asp-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PBFGQTGPSKWHJA-QEJZJMRPSA-N 0.000 description 3
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 3
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 3
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 3
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 3
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 3
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 3
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 3
- YZPVGIVFMZLQMM-YUMQZZPRSA-N Gly-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN YZPVGIVFMZLQMM-YUMQZZPRSA-N 0.000 description 3
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 3
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 3
- FEUPVVCGQLNXNP-IRXDYDNUSA-N Gly-Phe-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FEUPVVCGQLNXNP-IRXDYDNUSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 3
- 101000591400 Homo sapiens Double-strand break repair protein MRE11 Proteins 0.000 description 3
- 101001002317 Homo sapiens Gastrin Proteins 0.000 description 3
- 101000641111 Homo sapiens Protein transport protein Sec61 subunit alpha isoform 1 Proteins 0.000 description 3
- 101001093116 Homo sapiens Protein transport protein Sec61 subunit beta Proteins 0.000 description 3
- 101000629635 Homo sapiens Signal recognition particle receptor subunit alpha Proteins 0.000 description 3
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 3
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 3
- 108010065920 Insulin Lispro Proteins 0.000 description 3
- 229930182816 L-glutamine Natural products 0.000 description 3
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 3
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 3
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 3
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 3
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 3
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 3
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 3
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 3
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 3
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 3
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 3
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 3
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 3
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 3
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 3
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 3
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 3
- WGILOYIKJVQUPT-DCAQKATOSA-N Lys-Pro-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WGILOYIKJVQUPT-DCAQKATOSA-N 0.000 description 3
- LECIJRIRMVOFMH-ULQDDVLXSA-N Lys-Pro-Phe Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LECIJRIRMVOFMH-ULQDDVLXSA-N 0.000 description 3
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 3
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 3
- YORIKIDJCPKBON-YUMQZZPRSA-N Met-Glu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YORIKIDJCPKBON-YUMQZZPRSA-N 0.000 description 3
- PZUUMQPMHBJJKE-AVGNSLFASA-N Met-Leu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCNC(N)=N PZUUMQPMHBJJKE-AVGNSLFASA-N 0.000 description 3
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 3
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 3
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 3
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 3
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 3
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 3
- 102100034271 Protein transport protein Sec61 subunit alpha isoform 1 Human genes 0.000 description 3
- 102100036308 Protein transport protein Sec61 subunit beta Human genes 0.000 description 3
- 102000000574 RNA-Induced Silencing Complex Human genes 0.000 description 3
- 108010016790 RNA-Induced Silencing Complex Proteins 0.000 description 3
- 230000021194 SRP-dependent cotranslational protein targeting to membrane Effects 0.000 description 3
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 3
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 3
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 3
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 3
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 3
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 3
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 3
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 3
- UAJAYRMZGNQILN-BQBZGAKWSA-N Ser-Gly-Met Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UAJAYRMZGNQILN-BQBZGAKWSA-N 0.000 description 3
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 3
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 3
- 102100026900 Signal recognition particle receptor subunit alpha Human genes 0.000 description 3
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 3
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 3
- 108091023045 Untranslated Region Proteins 0.000 description 3
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 3
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 3
- IEBGHUMBJXIXHM-AVGNSLFASA-N Val-Lys-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N IEBGHUMBJXIXHM-AVGNSLFASA-N 0.000 description 3
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 3
- QPPZEDOTPZOSEC-RCWTZXSCSA-N Val-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N)O QPPZEDOTPZOSEC-RCWTZXSCSA-N 0.000 description 3
- MJOUSKQHAIARKI-JYJNAYRXSA-N Val-Phe-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 MJOUSKQHAIARKI-JYJNAYRXSA-N 0.000 description 3
- 102100036973 X-ray repair cross-complementing protein 5 Human genes 0.000 description 3
- 101710124921 X-ray repair cross-complementing protein 5 Proteins 0.000 description 3
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 3
- 108010066875 alanyl-prolyl-tryptophyl-cysteine Proteins 0.000 description 3
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 3
- 108010041407 alanylaspartic acid Proteins 0.000 description 3
- 238000000137 annealing Methods 0.000 description 3
- 230000000692 anti-sense effect Effects 0.000 description 3
- 238000000429 assembly Methods 0.000 description 3
- 230000000712 assembly Effects 0.000 description 3
- 108091008324 binding proteins Proteins 0.000 description 3
- 230000019522 cellular metabolic process Effects 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 210000000172 cytosol Anatomy 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 3
- 238000005538 encapsulation Methods 0.000 description 3
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 3
- 230000002349 favourable effect Effects 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 3
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 3
- 108010010147 glycylglutamine Proteins 0.000 description 3
- 210000005260 human cell Anatomy 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 230000009545 invasion Effects 0.000 description 3
- 108010078274 isoleucylvaline Proteins 0.000 description 3
- 210000003734 kidney Anatomy 0.000 description 3
- 108010053037 kyotorphin Proteins 0.000 description 3
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 3
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 3
- 230000037353 metabolic pathway Effects 0.000 description 3
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 3
- 108010005942 methionylglycine Proteins 0.000 description 3
- 108010004914 prolylarginine Proteins 0.000 description 3
- 108010029020 prolylglycine Proteins 0.000 description 3
- 230000008707 rearrangement Effects 0.000 description 3
- 210000003705 ribosome Anatomy 0.000 description 3
- 238000003118 sandwich ELISA Methods 0.000 description 3
- 239000012679 serum free medium Substances 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 3
- 230000009261 transgenic effect Effects 0.000 description 3
- 230000005945 translocation Effects 0.000 description 3
- FXYPGCIGRDZWNR-UHFFFAOYSA-N (2,5-dioxopyrrolidin-1-yl) 3-[[3-(2,5-dioxopyrrolidin-1-yl)oxy-3-oxopropyl]disulfanyl]propanoate Chemical compound O=C1CCC(=O)N1OC(=O)CCSSCCC(=O)ON1C(=O)CCC1=O FXYPGCIGRDZWNR-UHFFFAOYSA-N 0.000 description 2
- WOJJIRYPFAZEPF-YFKPBYRVSA-N 2-[[(2s)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]propanoyl]amino]acetate Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)CN WOJJIRYPFAZEPF-YFKPBYRVSA-N 0.000 description 2
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 2
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 2
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 2
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 2
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 2
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 2
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 2
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 2
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 2
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 2
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 2
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 2
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 2
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 2
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 2
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 2
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 2
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 2
- BFMIRJBURUXDRG-DLOVCJGASA-N Ala-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 BFMIRJBURUXDRG-DLOVCJGASA-N 0.000 description 2
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 2
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 2
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 2
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 2
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 2
- MUGAESARFRGOTQ-IGNZVWTISA-N Ala-Tyr-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N MUGAESARFRGOTQ-IGNZVWTISA-N 0.000 description 2
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 2
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 2
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 2
- YFBGNGASPGRWEM-DCAQKATOSA-N Arg-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFBGNGASPGRWEM-DCAQKATOSA-N 0.000 description 2
- VDBKFYYIBLXEIF-GUBZILKMSA-N Arg-Gln-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VDBKFYYIBLXEIF-GUBZILKMSA-N 0.000 description 2
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 2
- YNSGXDWWPCGGQS-YUMQZZPRSA-N Arg-Gly-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O YNSGXDWWPCGGQS-YUMQZZPRSA-N 0.000 description 2
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 2
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 2
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 2
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 2
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 2
- OWSMKCJUBAPHED-JYJNAYRXSA-N Arg-Pro-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OWSMKCJUBAPHED-JYJNAYRXSA-N 0.000 description 2
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 2
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 2
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 2
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 2
- CTQIOCMSIJATNX-WHFBIAKZSA-N Asn-Gly-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O CTQIOCMSIJATNX-WHFBIAKZSA-N 0.000 description 2
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 2
- GJFYPBDMUGGLFR-NKWVEPMBSA-N Asn-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC(=O)N)N)C(=O)O GJFYPBDMUGGLFR-NKWVEPMBSA-N 0.000 description 2
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 2
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 2
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 2
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 2
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 2
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 2
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 2
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 2
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 2
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 2
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 2
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 2
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 2
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 2
- JXGJJQJHXHXJQF-CIUDSAMLSA-N Asp-Met-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O JXGJJQJHXHXJQF-CIUDSAMLSA-N 0.000 description 2
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 2
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 2
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 2
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 2
- GXHDGYOXPNQCKM-XVSYOHENSA-N Asp-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GXHDGYOXPNQCKM-XVSYOHENSA-N 0.000 description 2
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 2
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 2
- 108700020462 BRCA2 Proteins 0.000 description 2
- 102100021277 Beta-secretase 2 Human genes 0.000 description 2
- 101710150190 Beta-secretase 2 Proteins 0.000 description 2
- 101710089613 Breast cancer type 2 susceptibility protein Proteins 0.000 description 2
- 102100029968 Calreticulin Human genes 0.000 description 2
- 108090000549 Calreticulin Proteins 0.000 description 2
- RWAZRMXTVSIVJR-YUMQZZPRSA-N Cys-Gly-His Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC1=CNC=N1)C(O)=O RWAZRMXTVSIVJR-YUMQZZPRSA-N 0.000 description 2
- BLGNLNRBABWDST-CIUDSAMLSA-N Cys-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BLGNLNRBABWDST-CIUDSAMLSA-N 0.000 description 2
- NXQCSPVUPLUTJH-WHFBIAKZSA-N Cys-Ser-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O NXQCSPVUPLUTJH-WHFBIAKZSA-N 0.000 description 2
- YNJBLTDKTMKEET-ZLUOBGJFSA-N Cys-Ser-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O YNJBLTDKTMKEET-ZLUOBGJFSA-N 0.000 description 2
- PCRVDEANNSYGTA-IHRRRGAJSA-N Cys-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CS)CC1=CC=C(O)C=C1 PCRVDEANNSYGTA-IHRRRGAJSA-N 0.000 description 2
- 102100035186 DNA excision repair protein ERCC-1 Human genes 0.000 description 2
- 102100039116 DNA repair protein RAD50 Human genes 0.000 description 2
- 102100032881 DNA-binding protein SATB1 Human genes 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 230000010337 G2 phase Effects 0.000 description 2
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 2
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 2
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 2
- NMYFPKCIGUJMIK-GUBZILKMSA-N Gln-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NMYFPKCIGUJMIK-GUBZILKMSA-N 0.000 description 2
- RWQCWSGOOOEGPB-FXQIFTODSA-N Gln-Ser-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O RWQCWSGOOOEGPB-FXQIFTODSA-N 0.000 description 2
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 2
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 2
- XHUCVVHRLNPZSZ-CIUDSAMLSA-N Glu-Gln-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XHUCVVHRLNPZSZ-CIUDSAMLSA-N 0.000 description 2
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 2
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 2
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 2
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 2
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 2
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 2
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 2
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 2
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 2
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 2
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 2
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 2
- SOEPMWQCTJITPZ-SRVKXCTJSA-N Glu-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N SOEPMWQCTJITPZ-SRVKXCTJSA-N 0.000 description 2
- MIIGESVJEBDJMP-FHWLQOOXSA-N Glu-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 MIIGESVJEBDJMP-FHWLQOOXSA-N 0.000 description 2
- BIYNPVYAZOUVFQ-CIUDSAMLSA-N Glu-Pro-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O BIYNPVYAZOUVFQ-CIUDSAMLSA-N 0.000 description 2
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 2
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 2
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 2
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 2
- ZTNHPMZHAILHRB-JSGCOSHPSA-N Glu-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)NCC(O)=O)=CNC2=C1 ZTNHPMZHAILHRB-JSGCOSHPSA-N 0.000 description 2
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 2
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 2
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 2
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 2
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 2
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 2
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 2
- NMROINAYXCACKF-WHFBIAKZSA-N Gly-Cys-Cys Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O NMROINAYXCACKF-WHFBIAKZSA-N 0.000 description 2
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 2
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 2
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 2
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 2
- YIFUFYZELCMPJP-YUMQZZPRSA-N Gly-Leu-Cys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O YIFUFYZELCMPJP-YUMQZZPRSA-N 0.000 description 2
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 2
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 2
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 2
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 2
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 2
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 2
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 2
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 2
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 2
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 2
- BXDLTKLPPKBVEL-FJXKBIBVSA-N Gly-Thr-Met Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O BXDLTKLPPKBVEL-FJXKBIBVSA-N 0.000 description 2
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 2
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 2
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 2
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 2
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 2
- VCDNHBNNPCDBKV-DLOVCJGASA-N His-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VCDNHBNNPCDBKV-DLOVCJGASA-N 0.000 description 2
- HXKZJLWGSWQKEA-LSJOCFKGSA-N His-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 HXKZJLWGSWQKEA-LSJOCFKGSA-N 0.000 description 2
- QSLKWWDKIXMWJV-SRVKXCTJSA-N His-Cys-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N QSLKWWDKIXMWJV-SRVKXCTJSA-N 0.000 description 2
- PMWSGVRIMIFXQH-KKUMJFAQSA-N His-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 PMWSGVRIMIFXQH-KKUMJFAQSA-N 0.000 description 2
- DYKZGTLPSNOFHU-DEQVHRJGSA-N His-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N DYKZGTLPSNOFHU-DEQVHRJGSA-N 0.000 description 2
- 108090000353 Histone deacetylase Proteins 0.000 description 2
- 102000003964 Histone deacetylase Human genes 0.000 description 2
- 101000785776 Homo sapiens Artemin Proteins 0.000 description 2
- 101000876529 Homo sapiens DNA excision repair protein ERCC-1 Proteins 0.000 description 2
- 101000743929 Homo sapiens DNA repair protein RAD50 Proteins 0.000 description 2
- 101000655234 Homo sapiens DNA-binding protein SATB1 Proteins 0.000 description 2
- 101001128138 Homo sapiens NACHT, LRR and PYD domains-containing protein 2 Proteins 0.000 description 2
- 101001113483 Homo sapiens Poly [ADP-ribose] polymerase 1 Proteins 0.000 description 2
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 2
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 2
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 2
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 2
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 2
- IPYVXYDYLHVWHU-GMOBBJLQSA-N Ile-Asn-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N IPYVXYDYLHVWHU-GMOBBJLQSA-N 0.000 description 2
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 2
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 2
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 2
- GECLQMBTZCPAFY-PEFMBERDSA-N Ile-Gln-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GECLQMBTZCPAFY-PEFMBERDSA-N 0.000 description 2
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 2
- BEWFWZRGBDVXRP-PEFMBERDSA-N Ile-Glu-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BEWFWZRGBDVXRP-PEFMBERDSA-N 0.000 description 2
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 2
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 2
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 2
- IGJWJGIHUFQANP-LAEOZQHASA-N Ile-Gly-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N IGJWJGIHUFQANP-LAEOZQHASA-N 0.000 description 2
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 2
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 2
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 2
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 2
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 2
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 2
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 2
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 2
- JUWJEAPUNARGCF-DCAQKATOSA-N Leu-Arg-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JUWJEAPUNARGCF-DCAQKATOSA-N 0.000 description 2
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 2
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 2
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 2
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 2
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 2
- RRSLQOLASISYTB-CIUDSAMLSA-N Leu-Cys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O RRSLQOLASISYTB-CIUDSAMLSA-N 0.000 description 2
- IASQBRJGRVXNJI-YUMQZZPRSA-N Leu-Cys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)NCC(O)=O IASQBRJGRVXNJI-YUMQZZPRSA-N 0.000 description 2
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 2
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 2
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 2
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 2
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 2
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 2
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 2
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 2
- QPXBPQUGXHURGP-UWVGGRQHSA-N Leu-Gly-Met Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N QPXBPQUGXHURGP-UWVGGRQHSA-N 0.000 description 2
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 2
- BTNXKBVLWJBTNR-SRVKXCTJSA-N Leu-His-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O BTNXKBVLWJBTNR-SRVKXCTJSA-N 0.000 description 2
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 2
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 2
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 2
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 2
- IBSGMIPRBMPMHE-IHRRRGAJSA-N Leu-Met-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O IBSGMIPRBMPMHE-IHRRRGAJSA-N 0.000 description 2
- YESNGRDJQWDYLH-KKUMJFAQSA-N Leu-Phe-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YESNGRDJQWDYLH-KKUMJFAQSA-N 0.000 description 2
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 2
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 2
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 2
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 2
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 2
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 2
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 2
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 2
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 2
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 2
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 2
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 2
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 2
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 2
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 2
- YIBOAHAOAWACDK-QEJZJMRPSA-N Lys-Ala-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YIBOAHAOAWACDK-QEJZJMRPSA-N 0.000 description 2
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 2
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 2
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 2
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 2
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 2
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 2
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 2
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 2
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 2
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 2
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 2
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 2
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 2
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 2
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 2
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 2
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 2
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 2
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 2
- PYFNONMJYNJENN-AVGNSLFASA-N Lys-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PYFNONMJYNJENN-AVGNSLFASA-N 0.000 description 2
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 2
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 2
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 2
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 2
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 2
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 2
- ZVZRQKJOQQAFCF-ULQDDVLXSA-N Lys-Tyr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZVZRQKJOQQAFCF-ULQDDVLXSA-N 0.000 description 2
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 2
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 2
- WDTLNWHPIPCMMP-AVGNSLFASA-N Met-Arg-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O WDTLNWHPIPCMMP-AVGNSLFASA-N 0.000 description 2
- UZVWDRPUTHXQAM-FXQIFTODSA-N Met-Asp-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O UZVWDRPUTHXQAM-FXQIFTODSA-N 0.000 description 2
- UOENBSHXYCHSAU-YUMQZZPRSA-N Met-Gln-Gly Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UOENBSHXYCHSAU-YUMQZZPRSA-N 0.000 description 2
- VZBXCMCHIHEPBL-SRVKXCTJSA-N Met-Glu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN VZBXCMCHIHEPBL-SRVKXCTJSA-N 0.000 description 2
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 2
- JKXVPNCSAMWUEJ-GUBZILKMSA-N Met-Met-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O JKXVPNCSAMWUEJ-GUBZILKMSA-N 0.000 description 2
- ILKCLLLOGPDNIP-RCWTZXSCSA-N Met-Met-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ILKCLLLOGPDNIP-RCWTZXSCSA-N 0.000 description 2
- WSPQHZOMTFFWGH-XGEHTFHBSA-N Met-Thr-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(O)=O WSPQHZOMTFFWGH-XGEHTFHBSA-N 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- 102100031897 NACHT, LRR and PYD domains-containing protein 2 Human genes 0.000 description 2
- 102100024403 Nibrin Human genes 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- KIAWKQJTSGRCSA-AVGNSLFASA-N Phe-Asn-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KIAWKQJTSGRCSA-AVGNSLFASA-N 0.000 description 2
- UMKYAYXCMYYNHI-AVGNSLFASA-N Phe-Gln-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N UMKYAYXCMYYNHI-AVGNSLFASA-N 0.000 description 2
- WYPVCIACUMJRIB-JYJNAYRXSA-N Phe-Gln-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N WYPVCIACUMJRIB-JYJNAYRXSA-N 0.000 description 2
- CSDMCMITJLKBAH-SOUVJXGZSA-N Phe-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O CSDMCMITJLKBAH-SOUVJXGZSA-N 0.000 description 2
- VJLLEKDQJSMHRU-STQMWFEESA-N Phe-Gly-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O VJLLEKDQJSMHRU-STQMWFEESA-N 0.000 description 2
- DVOCGBNHAUHKHJ-DKIMLUQUSA-N Phe-Ile-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O DVOCGBNHAUHKHJ-DKIMLUQUSA-N 0.000 description 2
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 2
- ZLAKUZDMKVKFAI-JYJNAYRXSA-N Phe-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O ZLAKUZDMKVKFAI-JYJNAYRXSA-N 0.000 description 2
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 2
- GLJZDMZJHFXJQG-BZSNNMDCSA-N Phe-Ser-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLJZDMZJHFXJQG-BZSNNMDCSA-N 0.000 description 2
- APMXLWHMIVWLLR-BZSNNMDCSA-N Phe-Tyr-Ser Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 APMXLWHMIVWLLR-BZSNNMDCSA-N 0.000 description 2
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 102100023712 Poly [ADP-ribose] polymerase 1 Human genes 0.000 description 2
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 2
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 2
- 229920001213 Polysorbate 20 Polymers 0.000 description 2
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 2
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 2
- INXAPZFIOVGHSV-CIUDSAMLSA-N Pro-Asn-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 INXAPZFIOVGHSV-CIUDSAMLSA-N 0.000 description 2
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 2
- DIZLUAZLNDFDPR-CIUDSAMLSA-N Pro-Cys-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 DIZLUAZLNDFDPR-CIUDSAMLSA-N 0.000 description 2
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 2
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 2
- WSRWHZRUOCACLJ-UWVGGRQHSA-N Pro-Gly-His Chemical compound C([C@@H](C(=O)O)NC(=O)CNC(=O)[C@H]1NCCC1)C1=CN=CN1 WSRWHZRUOCACLJ-UWVGGRQHSA-N 0.000 description 2
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 2
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 2
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 2
- HOTVCUAVDQHUDB-UFYCRDLUSA-N Pro-Phe-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 HOTVCUAVDQHUDB-UFYCRDLUSA-N 0.000 description 2
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 2
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 2
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 2
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 2
- 102000001253 Protein Kinase Human genes 0.000 description 2
- 241000508269 Psidium Species 0.000 description 2
- 108091081021 Sense strand Proteins 0.000 description 2
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 2
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 2
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 2
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 2
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 2
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 2
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 2
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 2
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 2
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 2
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 2
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 2
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 2
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 2
- GVIGVIOEYBOTCB-XIRDDKMYSA-N Ser-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC(C)C)C(O)=O)=CNC2=C1 GVIGVIOEYBOTCB-XIRDDKMYSA-N 0.000 description 2
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 2
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 2
- JUTGONBTALQWMK-NAKRPEOUSA-N Ser-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N JUTGONBTALQWMK-NAKRPEOUSA-N 0.000 description 2
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 2
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 2
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 2
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 2
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 2
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 2
- 238000000692 Student's t-test Methods 0.000 description 2
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 2
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 2
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 2
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 2
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 2
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 2
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 2
- ZSPQUTWLWGWTPS-HJGDQZAQSA-N Thr-Lys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZSPQUTWLWGWTPS-HJGDQZAQSA-N 0.000 description 2
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 2
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 2
- OLFOOYQTTQSSRK-UNQGMJICSA-N Thr-Pro-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLFOOYQTTQSSRK-UNQGMJICSA-N 0.000 description 2
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 2
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 2
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 2
- ZEJBJDHSQPOVJV-UAXMHLISSA-N Thr-Trp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZEJBJDHSQPOVJV-UAXMHLISSA-N 0.000 description 2
- CJEHCEOXPLASCK-MEYUZBJRSA-N Thr-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=C(O)C=C1 CJEHCEOXPLASCK-MEYUZBJRSA-N 0.000 description 2
- 108091036066 Three prime untranslated region Proteins 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- HJTYJQVRIQXMHM-XIRDDKMYSA-N Trp-Asp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N HJTYJQVRIQXMHM-XIRDDKMYSA-N 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- 102000007537 Type II DNA Topoisomerases Human genes 0.000 description 2
- 108010046308 Type II DNA Topoisomerases Proteins 0.000 description 2
- OOEUVMFKKZYSRX-LEWSCRJBSA-N Tyr-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OOEUVMFKKZYSRX-LEWSCRJBSA-N 0.000 description 2
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 2
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 2
- HVPPEXXUDXAPOM-MGHWNKPDSA-N Tyr-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HVPPEXXUDXAPOM-MGHWNKPDSA-N 0.000 description 2
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 2
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 2
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 2
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 2
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 2
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 2
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 2
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 2
- WJVLTYSHNXRCLT-NHCYSSNCSA-N Val-His-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WJVLTYSHNXRCLT-NHCYSSNCSA-N 0.000 description 2
- RHYOAUJXSRWVJT-GVXVVHGQSA-N Val-His-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RHYOAUJXSRWVJT-GVXVVHGQSA-N 0.000 description 2
- PTFPUAXGIKTVNN-ONGXEEELSA-N Val-His-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N PTFPUAXGIKTVNN-ONGXEEELSA-N 0.000 description 2
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 2
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 2
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 2
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 2
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 2
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 2
- ZEBRMWPTJNHXAJ-JYJNAYRXSA-N Val-Phe-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O)N ZEBRMWPTJNHXAJ-JYJNAYRXSA-N 0.000 description 2
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 2
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 2
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 2
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 2
- DOBHJKVVACOQTN-DZKIICNBSA-N Val-Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 DOBHJKVVACOQTN-DZKIICNBSA-N 0.000 description 2
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 2
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 2
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 235000001014 amino acid Nutrition 0.000 description 2
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 2
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 2
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 2
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 238000005452 bending Methods 0.000 description 2
- 230000001851 biosynthetic effect Effects 0.000 description 2
- 238000002659 cell therapy Methods 0.000 description 2
- 230000003833 cell viability Effects 0.000 description 2
- 230000005754 cellular signaling Effects 0.000 description 2
- 230000019113 chromatin silencing Effects 0.000 description 2
- 210000000078 claw Anatomy 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000004132 cross linking Methods 0.000 description 2
- 108010004073 cysteinylcysteine Proteins 0.000 description 2
- 108010060199 cysteinylproline Proteins 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000002939 deleterious effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000012361 double-strand break repair Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 239000012091 fetal bovine serum Substances 0.000 description 2
- 238000001415 gene therapy Methods 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 2
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 2
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 2
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 108010028295 histidylhistidine Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 239000012212 insulator Substances 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 108010060857 isoleucyl-valyl-tyrosine Proteins 0.000 description 2
- 108010027338 isoleucylcysteine Proteins 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010087810 leucyl-seryl-glutamyl-leucine Proteins 0.000 description 2
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000013011 mating Effects 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 2
- 108010085203 methionylmethionine Proteins 0.000 description 2
- 108010068488 methionylphenylalanine Proteins 0.000 description 2
- 230000002025 microglial effect Effects 0.000 description 2
- 230000000394 mitotic effect Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 229910052754 neon Inorganic materials 0.000 description 2
- GKAOGPIIYCISHV-UHFFFAOYSA-N neon atom Chemical compound [Ne] GKAOGPIIYCISHV-UHFFFAOYSA-N 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 2
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 2
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 2
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 2
- 150000003906 phosphoinositides Chemical class 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 108010025488 pinealon Proteins 0.000 description 2
- 230000008092 positive effect Effects 0.000 description 2
- 230000001323 posttranslational effect Effects 0.000 description 2
- 230000003389 potentiating effect Effects 0.000 description 2
- 108060006633 protein kinase Proteins 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000028617 response to DNA damage stimulus Effects 0.000 description 2
- 230000001177 retroviral effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 210000002955 secretory cell Anatomy 0.000 description 2
- 210000004739 secretory vesicle Anatomy 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 230000000087 stabilizing effect Effects 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 108700004896 tripeptide FEG Proteins 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 230000035899 viability Effects 0.000 description 2
- 230000003442 weekly effect Effects 0.000 description 2
- JNTMAZFVYNDPLB-PEDHHIEDSA-N (2S,3S)-2-[[[(2S)-1-[(2S,3S)-2-amino-3-methyl-1-oxopentyl]-2-pyrrolidinyl]-oxomethyl]amino]-3-methylpentanoic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNTMAZFVYNDPLB-PEDHHIEDSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- DQVAZKGVGKHQDS-UHFFFAOYSA-N 2-[[1-[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(O)=O DQVAZKGVGKHQDS-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- RBTBFTRPCNLSDE-UHFFFAOYSA-N 3,7-bis(dimethylamino)phenothiazin-5-ium Chemical compound C1=CC(N(C)C)=CC2=[S+]C3=CC(N(C)C)=CC=C3N=C21 RBTBFTRPCNLSDE-UHFFFAOYSA-N 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- 108010036211 5-HT-moduline Proteins 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 1
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- SKHCUBQVZJHOFM-NAKRPEOUSA-N Ala-Arg-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SKHCUBQVZJHOFM-NAKRPEOUSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- PXKLCFFSVLKOJM-ACZMJKKPSA-N Ala-Asn-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXKLCFFSVLKOJM-ACZMJKKPSA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- XQJAFSDFQZPYCU-UWJYBYFXSA-N Ala-Asn-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N XQJAFSDFQZPYCU-UWJYBYFXSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 1
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- LZRNYBIJOSKKRJ-XVYDVKMFSA-N Ala-Asp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LZRNYBIJOSKKRJ-XVYDVKMFSA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- WCBVQNZTOKJWJS-ACZMJKKPSA-N Ala-Cys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O WCBVQNZTOKJWJS-ACZMJKKPSA-N 0.000 description 1
- CVHJIWVKTFNGHT-ACZMJKKPSA-N Ala-Gln-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N CVHJIWVKTFNGHT-ACZMJKKPSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 1
- UHMQKOBNPRAZGB-CIUDSAMLSA-N Ala-Glu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N UHMQKOBNPRAZGB-CIUDSAMLSA-N 0.000 description 1
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 1
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- CWEAKSWWKHGTRJ-BQBZGAKWSA-N Ala-Gly-Met Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O CWEAKSWWKHGTRJ-BQBZGAKWSA-N 0.000 description 1
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 1
- FDAZDMAFZYTHGS-XVYDVKMFSA-N Ala-His-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O FDAZDMAFZYTHGS-XVYDVKMFSA-N 0.000 description 1
- ANGAOPNEPIDLPO-XVYDVKMFSA-N Ala-His-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CS)C(=O)O)N ANGAOPNEPIDLPO-XVYDVKMFSA-N 0.000 description 1
- JEPNLGMEZMCFEX-QSFUFRPTSA-N Ala-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N JEPNLGMEZMCFEX-QSFUFRPTSA-N 0.000 description 1
- KMGOBAQSCKTBGD-DLOVCJGASA-N Ala-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CN=CN1 KMGOBAQSCKTBGD-DLOVCJGASA-N 0.000 description 1
- HUUOZYZWNCXTFK-INTQDDNPSA-N Ala-His-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N HUUOZYZWNCXTFK-INTQDDNPSA-N 0.000 description 1
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 1
- XCZXVTHYGSMQGH-NAKRPEOUSA-N Ala-Ile-Met Chemical compound C[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C([O-])=O XCZXVTHYGSMQGH-NAKRPEOUSA-N 0.000 description 1
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- QQACQIHVWCVBBR-GVARAGBVSA-N Ala-Ile-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QQACQIHVWCVBBR-GVARAGBVSA-N 0.000 description 1
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 1
- RUQBGIMJQUWXPP-CYDGBPFRSA-N Ala-Leu-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O RUQBGIMJQUWXPP-CYDGBPFRSA-N 0.000 description 1
- NOGFDULFCFXBHB-CIUDSAMLSA-N Ala-Leu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NOGFDULFCFXBHB-CIUDSAMLSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- RGQCNKIDEQJEBT-CQDKDKBSSA-N Ala-Leu-Tyr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RGQCNKIDEQJEBT-CQDKDKBSSA-N 0.000 description 1
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 1
- PIXQDIGKDNNOOV-GUBZILKMSA-N Ala-Lys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O PIXQDIGKDNNOOV-GUBZILKMSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- FUKFQILQFQKHLE-DCAQKATOSA-N Ala-Lys-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O FUKFQILQFQKHLE-DCAQKATOSA-N 0.000 description 1
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 1
- VHEVVUZDDUCAKU-FXQIFTODSA-N Ala-Met-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O VHEVVUZDDUCAKU-FXQIFTODSA-N 0.000 description 1
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 1
- CJQAEJMHBAOQHA-DLOVCJGASA-N Ala-Phe-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CJQAEJMHBAOQHA-DLOVCJGASA-N 0.000 description 1
- BDQNLQSWRAPHGU-DLOVCJGASA-N Ala-Phe-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N BDQNLQSWRAPHGU-DLOVCJGASA-N 0.000 description 1
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 1
- MAZZQZWCCYJQGZ-GUBZILKMSA-N Ala-Pro-Arg Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MAZZQZWCCYJQGZ-GUBZILKMSA-N 0.000 description 1
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- IPWKGIFRRBGCJO-IMJSIDKUSA-N Ala-Ser Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O IPWKGIFRRBGCJO-IMJSIDKUSA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- YNOCMHZSWJMGBB-GCJQMDKQSA-N Ala-Thr-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YNOCMHZSWJMGBB-GCJQMDKQSA-N 0.000 description 1
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 1
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 1
- LTTLSZVJTDSACD-OWLDWWDNSA-N Ala-Thr-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O LTTLSZVJTDSACD-OWLDWWDNSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- SFPRJVVDZNLUTG-OWLDWWDNSA-N Ala-Trp-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFPRJVVDZNLUTG-OWLDWWDNSA-N 0.000 description 1
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 1
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 1
- VYMJAWXRWHJIMS-LKTVYLICSA-N Ala-Tyr-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VYMJAWXRWHJIMS-LKTVYLICSA-N 0.000 description 1
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 1
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 1
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 1
- OIRCZHKOHJUHAC-SIUGBPQLSA-N Ala-Val-Asp-Tyr Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OIRCZHKOHJUHAC-SIUGBPQLSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 101000935491 Arabidopsis thaliana Heat shock 70 kDa protein BIP1 Proteins 0.000 description 1
- MCYJBCKCAPERSE-FXQIFTODSA-N Arg-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N MCYJBCKCAPERSE-FXQIFTODSA-N 0.000 description 1
- PEFFAAKJGBZBKL-NAKRPEOUSA-N Arg-Ala-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PEFFAAKJGBZBKL-NAKRPEOUSA-N 0.000 description 1
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 1
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 1
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 1
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 1
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- WOPFJPHVBWKZJH-SRVKXCTJSA-N Arg-Arg-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O WOPFJPHVBWKZJH-SRVKXCTJSA-N 0.000 description 1
- CPSHGRGUPZBMOK-CIUDSAMLSA-N Arg-Asn-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CPSHGRGUPZBMOK-CIUDSAMLSA-N 0.000 description 1
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 1
- QPOARHANPULOTM-GMOBBJLQSA-N Arg-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N QPOARHANPULOTM-GMOBBJLQSA-N 0.000 description 1
- DPNHSNLIULPOBH-GUBZILKMSA-N Arg-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DPNHSNLIULPOBH-GUBZILKMSA-N 0.000 description 1
- GHNDBBVSWOWYII-LPEHRKFASA-N Arg-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GHNDBBVSWOWYII-LPEHRKFASA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 1
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 1
- DQNLFLGFZAUIOW-FXQIFTODSA-N Arg-Cys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DQNLFLGFZAUIOW-FXQIFTODSA-N 0.000 description 1
- GDVDRMUYICMNFJ-CIUDSAMLSA-N Arg-Cys-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O GDVDRMUYICMNFJ-CIUDSAMLSA-N 0.000 description 1
- OANWAFQRNQEDSY-DCAQKATOSA-N Arg-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N OANWAFQRNQEDSY-DCAQKATOSA-N 0.000 description 1
- VSPLYCLMFAUZRF-GUBZILKMSA-N Arg-Cys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N VSPLYCLMFAUZRF-GUBZILKMSA-N 0.000 description 1
- DGFGDPVSDQPANQ-XGEHTFHBSA-N Arg-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N)O DGFGDPVSDQPANQ-XGEHTFHBSA-N 0.000 description 1
- PTVGLOCPAVYPFG-CIUDSAMLSA-N Arg-Gln-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PTVGLOCPAVYPFG-CIUDSAMLSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- OBFTYSPXDRROQO-SRVKXCTJSA-N Arg-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCN=C(N)N OBFTYSPXDRROQO-SRVKXCTJSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 1
- 108010010777 Arg-Gly-Asp-Gly Proteins 0.000 description 1
- SYAUZLVLXCDRSH-IUCAKERBSA-N Arg-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N SYAUZLVLXCDRSH-IUCAKERBSA-N 0.000 description 1
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 1
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 1
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 1
- CRCCTGPNZUCAHE-DCAQKATOSA-N Arg-His-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 CRCCTGPNZUCAHE-DCAQKATOSA-N 0.000 description 1
- CVKOQHYVDVYJSI-QTKMDUPCSA-N Arg-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N)O CVKOQHYVDVYJSI-QTKMDUPCSA-N 0.000 description 1
- DGFXIWKPTDKBLF-AVGNSLFASA-N Arg-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N DGFXIWKPTDKBLF-AVGNSLFASA-N 0.000 description 1
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 1
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 1
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 1
- RIIVUOJDDQXHRV-SRVKXCTJSA-N Arg-Lys-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O RIIVUOJDDQXHRV-SRVKXCTJSA-N 0.000 description 1
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 1
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 1
- OMKZPCPZEFMBIT-SRVKXCTJSA-N Arg-Met-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OMKZPCPZEFMBIT-SRVKXCTJSA-N 0.000 description 1
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 1
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 1
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 1
- LXMKTIZAGIBQRX-HRCADAONSA-N Arg-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O LXMKTIZAGIBQRX-HRCADAONSA-N 0.000 description 1
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 1
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 1
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 1
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 1
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- AUZAXCPWMDBWEE-HJGDQZAQSA-N Arg-Thr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O AUZAXCPWMDBWEE-HJGDQZAQSA-N 0.000 description 1
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 1
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 1
- JKRPBTQDPJSQIT-RCWTZXSCSA-N Arg-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O JKRPBTQDPJSQIT-RCWTZXSCSA-N 0.000 description 1
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 1
- ZPWMEWYQBWSGAO-ZJDVBMNYSA-N Arg-Thr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZPWMEWYQBWSGAO-ZJDVBMNYSA-N 0.000 description 1
- YHZQOSXDTFRZKU-WDSOQIARSA-N Arg-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 YHZQOSXDTFRZKU-WDSOQIARSA-N 0.000 description 1
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 1
- XRLOBFSLPCHYLQ-ULQDDVLXSA-N Arg-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O XRLOBFSLPCHYLQ-ULQDDVLXSA-N 0.000 description 1
- LLQIAIUAKGNOSE-NHCYSSNCSA-N Arg-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N LLQIAIUAKGNOSE-NHCYSSNCSA-N 0.000 description 1
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 1
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 1
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 1
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- ORXCYAFUCSTQGY-FXQIFTODSA-N Asn-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N ORXCYAFUCSTQGY-FXQIFTODSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 1
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 1
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 1
- DQTIWTULBGLJBL-DCAQKATOSA-N Asn-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N DQTIWTULBGLJBL-DCAQKATOSA-N 0.000 description 1
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 1
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 1
- BGINHSZTXRJIPP-FXQIFTODSA-N Asn-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BGINHSZTXRJIPP-FXQIFTODSA-N 0.000 description 1
- VYLVOMUVLMGCRF-ZLUOBGJFSA-N Asn-Asp-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VYLVOMUVLMGCRF-ZLUOBGJFSA-N 0.000 description 1
- WQSCVMQDZYTFQU-FXQIFTODSA-N Asn-Cys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WQSCVMQDZYTFQU-FXQIFTODSA-N 0.000 description 1
- SPIPSJXLZVTXJL-ZLUOBGJFSA-N Asn-Cys-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O SPIPSJXLZVTXJL-ZLUOBGJFSA-N 0.000 description 1
- XWFPGQVLOVGSLU-CIUDSAMLSA-N Asn-Gln-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XWFPGQVLOVGSLU-CIUDSAMLSA-N 0.000 description 1
- IIFDPDVJAHQFSR-WHFBIAKZSA-N Asn-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O IIFDPDVJAHQFSR-WHFBIAKZSA-N 0.000 description 1
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 1
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 1
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 1
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- JQSWHKKUZMTOIH-QWRGUYRKSA-N Asn-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N JQSWHKKUZMTOIH-QWRGUYRKSA-N 0.000 description 1
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 1
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 1
- YGHCVNQOZZMHRZ-DJFWLOJKSA-N Asn-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)N)N YGHCVNQOZZMHRZ-DJFWLOJKSA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 1
- FVKHEKVYFTZWDX-GHCJXIJMSA-N Asn-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FVKHEKVYFTZWDX-GHCJXIJMSA-N 0.000 description 1
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 1
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 1
- LVHMEJJWEXBMKK-GMOBBJLQSA-N Asn-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N LVHMEJJWEXBMKK-GMOBBJLQSA-N 0.000 description 1
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- UBGGJTMETLEXJD-DCAQKATOSA-N Asn-Leu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O UBGGJTMETLEXJD-DCAQKATOSA-N 0.000 description 1
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 1
- LZLCLRQMUQWUHJ-GUBZILKMSA-N Asn-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N LZLCLRQMUQWUHJ-GUBZILKMSA-N 0.000 description 1
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 1
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 1
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 1
- MDDXKBHIMYYJLW-FXQIFTODSA-N Asn-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N MDDXKBHIMYYJLW-FXQIFTODSA-N 0.000 description 1
- CDGHMJJJHYKMPA-DLOVCJGASA-N Asn-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC(=O)N)N CDGHMJJJHYKMPA-DLOVCJGASA-N 0.000 description 1
- OROMFUQQTSWUTI-IHRRRGAJSA-N Asn-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OROMFUQQTSWUTI-IHRRRGAJSA-N 0.000 description 1
- ZVUMKOMKQCANOM-AVGNSLFASA-N Asn-Phe-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVUMKOMKQCANOM-AVGNSLFASA-N 0.000 description 1
- FTNRWCPWDWRPAV-BZSNNMDCSA-N Asn-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CC(N)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FTNRWCPWDWRPAV-BZSNNMDCSA-N 0.000 description 1
- QXOPPIDJKPEKCW-GUBZILKMSA-N Asn-Pro-Arg Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O QXOPPIDJKPEKCW-GUBZILKMSA-N 0.000 description 1
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 1
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 1
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 1
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 1
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 1
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 1
- CPYHLXSGDBDULY-IHPCNDPISA-N Asn-Trp-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CPYHLXSGDBDULY-IHPCNDPISA-N 0.000 description 1
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 1
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 1
- CBWCQCANJSGUOH-ZKWXMUAHSA-N Asn-Val-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O CBWCQCANJSGUOH-ZKWXMUAHSA-N 0.000 description 1
- ZAESWDKAMDVHLL-RCOVLWMOSA-N Asn-Val-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O ZAESWDKAMDVHLL-RCOVLWMOSA-N 0.000 description 1
- LMIWYCWRJVMAIQ-NHCYSSNCSA-N Asn-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N LMIWYCWRJVMAIQ-NHCYSSNCSA-N 0.000 description 1
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 1
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 1
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 1
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 1
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- DBWYWXNMZZYIRY-LPEHRKFASA-N Asp-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O DBWYWXNMZZYIRY-LPEHRKFASA-N 0.000 description 1
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 1
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 1
- BUVNWKQBMZLCDW-UGYAYLCHSA-N Asp-Asn-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BUVNWKQBMZLCDW-UGYAYLCHSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- JDHOJQJMWBKHDB-CIUDSAMLSA-N Asp-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N JDHOJQJMWBKHDB-CIUDSAMLSA-N 0.000 description 1
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 1
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 1
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 1
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 1
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 1
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 1
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 1
- FMWHSNJMHUNLAG-FXQIFTODSA-N Asp-Cys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FMWHSNJMHUNLAG-FXQIFTODSA-N 0.000 description 1
- YBMUFUWSMIKJQA-GUBZILKMSA-N Asp-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N YBMUFUWSMIKJQA-GUBZILKMSA-N 0.000 description 1
- OEUQMKNNOWJREN-AVGNSLFASA-N Asp-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N OEUQMKNNOWJREN-AVGNSLFASA-N 0.000 description 1
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 1
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 1
- ZSJFGGSPCCHMNE-LAEOZQHASA-N Asp-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N ZSJFGGSPCCHMNE-LAEOZQHASA-N 0.000 description 1
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 1
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 1
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 1
- QCLHLXDWRKOHRR-GUBZILKMSA-N Asp-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N QCLHLXDWRKOHRR-GUBZILKMSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- ZEDBMCPXPIYJLW-XHNCKOQMSA-N Asp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O ZEDBMCPXPIYJLW-XHNCKOQMSA-N 0.000 description 1
- GISFCCXBVJKGEO-QEJZJMRPSA-N Asp-Glu-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GISFCCXBVJKGEO-QEJZJMRPSA-N 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 1
- PSLSTUMPZILTAH-BYULHYEWSA-N Asp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PSLSTUMPZILTAH-BYULHYEWSA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 1
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 1
- KQBVNNAPIURMPD-PEFMBERDSA-N Asp-Ile-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KQBVNNAPIURMPD-PEFMBERDSA-N 0.000 description 1
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 1
- SCQIQCWLOMOEFP-DCAQKATOSA-N Asp-Leu-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SCQIQCWLOMOEFP-DCAQKATOSA-N 0.000 description 1
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 1
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 1
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 1
- FQHBAQLBIXLWAG-DCAQKATOSA-N Asp-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N FQHBAQLBIXLWAG-DCAQKATOSA-N 0.000 description 1
- NZWDWXSWUQCNMG-GARJFASQSA-N Asp-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)C(=O)O NZWDWXSWUQCNMG-GARJFASQSA-N 0.000 description 1
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 1
- SARSTIZOZFBDOM-FXQIFTODSA-N Asp-Met-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O SARSTIZOZFBDOM-FXQIFTODSA-N 0.000 description 1
- HXVILZUZXFLVEN-DCAQKATOSA-N Asp-Met-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HXVILZUZXFLVEN-DCAQKATOSA-N 0.000 description 1
- IOXWDLNHXZOXQP-FXQIFTODSA-N Asp-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N IOXWDLNHXZOXQP-FXQIFTODSA-N 0.000 description 1
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 1
- PWAIZUBWHRHYKS-MELADBBJSA-N Asp-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)O)N)C(=O)O PWAIZUBWHRHYKS-MELADBBJSA-N 0.000 description 1
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 1
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 1
- QTIZKMMLNUMHHU-DCAQKATOSA-N Asp-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QTIZKMMLNUMHHU-DCAQKATOSA-N 0.000 description 1
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 1
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 1
- FIAKNCXQFFKSSI-ZLUOBGJFSA-N Asp-Ser-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O FIAKNCXQFFKSSI-ZLUOBGJFSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- QOCFFCUFZGDHTP-NUMRIWBASA-N Asp-Thr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QOCFFCUFZGDHTP-NUMRIWBASA-N 0.000 description 1
- NAAAPCLFJPURAM-HJGDQZAQSA-N Asp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O NAAAPCLFJPURAM-HJGDQZAQSA-N 0.000 description 1
- PDIYGFYAMZZFCW-JIOCBJNQSA-N Asp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N)O PDIYGFYAMZZFCW-JIOCBJNQSA-N 0.000 description 1
- XOASPVGNFAMYBD-WFBYXXMGSA-N Asp-Trp-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O XOASPVGNFAMYBD-WFBYXXMGSA-N 0.000 description 1
- USENATHVGFXRNO-SRVKXCTJSA-N Asp-Tyr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 USENATHVGFXRNO-SRVKXCTJSA-N 0.000 description 1
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 1
- CZIVKMOEXPILDK-SRVKXCTJSA-N Asp-Tyr-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O CZIVKMOEXPILDK-SRVKXCTJSA-N 0.000 description 1
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 1
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 1
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- 101150076800 B2M gene Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 101000929194 Brassica napus Defensin-like protein 4 Proteins 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 206010010099 Combined immunodeficiency Diseases 0.000 description 1
- PLBJMUUEGBBHRH-ZLUOBGJFSA-N Cys-Ala-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLBJMUUEGBBHRH-ZLUOBGJFSA-N 0.000 description 1
- ZOLXQKZHYOHHMD-DLOVCJGASA-N Cys-Ala-Phe Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N ZOLXQKZHYOHHMD-DLOVCJGASA-N 0.000 description 1
- RRIJEABIXPKSGP-FXQIFTODSA-N Cys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CS RRIJEABIXPKSGP-FXQIFTODSA-N 0.000 description 1
- BYALSSDCQYHKMY-XGEHTFHBSA-N Cys-Arg-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N)O BYALSSDCQYHKMY-XGEHTFHBSA-N 0.000 description 1
- QDFBJJABJKOLTD-FXQIFTODSA-N Cys-Asn-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QDFBJJABJKOLTD-FXQIFTODSA-N 0.000 description 1
- JIVJXVJMOBVCJF-ZLUOBGJFSA-N Cys-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)C(=O)N JIVJXVJMOBVCJF-ZLUOBGJFSA-N 0.000 description 1
- KIHRUISMQZVCNO-ZLUOBGJFSA-N Cys-Asp-Asp Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KIHRUISMQZVCNO-ZLUOBGJFSA-N 0.000 description 1
- XABFFGOGKOORCG-CIUDSAMLSA-N Cys-Asp-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XABFFGOGKOORCG-CIUDSAMLSA-N 0.000 description 1
- YMBAVNPKBWHDAW-CIUDSAMLSA-N Cys-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N YMBAVNPKBWHDAW-CIUDSAMLSA-N 0.000 description 1
- HIPHJNWPLMUBQQ-ACZMJKKPSA-N Cys-Cys-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCC(N)=O HIPHJNWPLMUBQQ-ACZMJKKPSA-N 0.000 description 1
- BVFQOPGFOQVZTE-ACZMJKKPSA-N Cys-Gln-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O BVFQOPGFOQVZTE-ACZMJKKPSA-N 0.000 description 1
- ZEXHDOQQYZKOIB-ACZMJKKPSA-N Cys-Glu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZEXHDOQQYZKOIB-ACZMJKKPSA-N 0.000 description 1
- DZSICRGTVPDCRN-YUMQZZPRSA-N Cys-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N DZSICRGTVPDCRN-YUMQZZPRSA-N 0.000 description 1
- OXOQBEVULIBOSH-ZDLURKLDSA-N Cys-Gly-Thr Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O OXOQBEVULIBOSH-ZDLURKLDSA-N 0.000 description 1
- UXIYYUMGFNSGBK-XPUUQOCRSA-N Cys-Gly-Val Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O UXIYYUMGFNSGBK-XPUUQOCRSA-N 0.000 description 1
- ANPADMNVVOOYKW-DCAQKATOSA-N Cys-His-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ANPADMNVVOOYKW-DCAQKATOSA-N 0.000 description 1
- MRVSLWQRNWEROS-SVSWQMSJSA-N Cys-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CS)N MRVSLWQRNWEROS-SVSWQMSJSA-N 0.000 description 1
- SSNJZBGOMNLSLA-CIUDSAMLSA-N Cys-Leu-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O SSNJZBGOMNLSLA-CIUDSAMLSA-N 0.000 description 1
- VPQZSNQICFCCSO-BJDJZHNGSA-N Cys-Leu-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VPQZSNQICFCCSO-BJDJZHNGSA-N 0.000 description 1
- WVLZTXGTNGHPBO-SRVKXCTJSA-N Cys-Leu-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O WVLZTXGTNGHPBO-SRVKXCTJSA-N 0.000 description 1
- PGBLJHDDKCVSTC-CIUDSAMLSA-N Cys-Met-Gln Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O PGBLJHDDKCVSTC-CIUDSAMLSA-N 0.000 description 1
- BBQIWFFTTQTNOC-AVGNSLFASA-N Cys-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N BBQIWFFTTQTNOC-AVGNSLFASA-N 0.000 description 1
- OZSBRCONEMXYOJ-AVGNSLFASA-N Cys-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N OZSBRCONEMXYOJ-AVGNSLFASA-N 0.000 description 1
- ZGERHCJBLPQPGV-ACZMJKKPSA-N Cys-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N ZGERHCJBLPQPGV-ACZMJKKPSA-N 0.000 description 1
- NRVQLLDIJJEIIZ-VZFHVOOUSA-N Cys-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CS)N)O NRVQLLDIJJEIIZ-VZFHVOOUSA-N 0.000 description 1
- JAHCWGSVNZXHRR-SVSWQMSJSA-N Cys-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)N JAHCWGSVNZXHRR-SVSWQMSJSA-N 0.000 description 1
- AZDQAZRURQMSQD-XPUUQOCRSA-N Cys-Val-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AZDQAZRURQMSQD-XPUUQOCRSA-N 0.000 description 1
- NGOIQDYZMIKCOK-NAKRPEOUSA-N Cys-Val-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NGOIQDYZMIKCOK-NAKRPEOUSA-N 0.000 description 1
- YQEHNIKPAOPBNH-DCAQKATOSA-N Cys-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N YQEHNIKPAOPBNH-DCAQKATOSA-N 0.000 description 1
- 108010090461 DFG peptide Proteins 0.000 description 1
- 230000012746 DNA damage checkpoint Effects 0.000 description 1
- 230000005971 DNA damage repair Effects 0.000 description 1
- 102100029995 DNA ligase 1 Human genes 0.000 description 1
- 101710148291 DNA ligase 1 Proteins 0.000 description 1
- 102100029766 DNA polymerase theta Human genes 0.000 description 1
- 108010093204 DNA polymerase theta Proteins 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 108010006124 DNA-Activated Protein Kinase Proteins 0.000 description 1
- 102000005768 DNA-Activated Protein Kinase Human genes 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 101100125027 Dictyostelium discoideum mhsp70 gene Proteins 0.000 description 1
- 108010089072 Dolichyl-diphosphooligosaccharide-protein glycotransferase Proteins 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 206010058314 Dysplasia Diseases 0.000 description 1
- 101150044894 ER gene Proteins 0.000 description 1
- 108700041152 Endoplasmic Reticulum Chaperone BiP Proteins 0.000 description 1
- 102100021451 Endoplasmic reticulum chaperone BiP Human genes 0.000 description 1
- 241000283074 Equus asinus Species 0.000 description 1
- 102000001690 Factor VIII Human genes 0.000 description 1
- 108010054218 Factor VIII Proteins 0.000 description 1
- 108091006020 Fc-tagged proteins Proteins 0.000 description 1
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 1
- 102000013446 GTP Phosphohydrolases Human genes 0.000 description 1
- 108091006109 GTPases Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 229930182566 Gentamicin Natural products 0.000 description 1
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 1
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 1
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 1
- XXLBHPPXDUWYAG-XQXXSGGOSA-N Gln-Ala-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XXLBHPPXDUWYAG-XQXXSGGOSA-N 0.000 description 1
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 1
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 1
- LTLXPHKSQQILNF-CIUDSAMLSA-N Gln-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N LTLXPHKSQQILNF-CIUDSAMLSA-N 0.000 description 1
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 1
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 1
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 1
- LLVXTGUTDYMJLY-GUBZILKMSA-N Gln-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N LLVXTGUTDYMJLY-GUBZILKMSA-N 0.000 description 1
- WMOMPXKOKASNBK-PEFMBERDSA-N Gln-Asn-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WMOMPXKOKASNBK-PEFMBERDSA-N 0.000 description 1
- RMOCFPBLHAOTDU-ACZMJKKPSA-N Gln-Asn-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RMOCFPBLHAOTDU-ACZMJKKPSA-N 0.000 description 1
- LMPBBFWHCRURJD-LAEOZQHASA-N Gln-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N LMPBBFWHCRURJD-LAEOZQHASA-N 0.000 description 1
- IKDOHQHEFPPGJG-FXQIFTODSA-N Gln-Asp-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IKDOHQHEFPPGJG-FXQIFTODSA-N 0.000 description 1
- SXIJQMBEVYWAQT-GUBZILKMSA-N Gln-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXIJQMBEVYWAQT-GUBZILKMSA-N 0.000 description 1
- CRRFJBGUGNNOCS-PEFMBERDSA-N Gln-Asp-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CRRFJBGUGNNOCS-PEFMBERDSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 1
- UICOTGULOUGGLC-NUMRIWBASA-N Gln-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UICOTGULOUGGLC-NUMRIWBASA-N 0.000 description 1
- IXFVOPOHSRKJNG-LAEOZQHASA-N Gln-Asp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IXFVOPOHSRKJNG-LAEOZQHASA-N 0.000 description 1
- UVAOVENCIONMJP-GUBZILKMSA-N Gln-Cys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O UVAOVENCIONMJP-GUBZILKMSA-N 0.000 description 1
- NVEASDQHBRZPSU-BQBZGAKWSA-N Gln-Gln-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O NVEASDQHBRZPSU-BQBZGAKWSA-N 0.000 description 1
- GHYJGDCPHMSFEJ-GUBZILKMSA-N Gln-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GHYJGDCPHMSFEJ-GUBZILKMSA-N 0.000 description 1
- RBWKVOSARCFSQQ-FXQIFTODSA-N Gln-Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O RBWKVOSARCFSQQ-FXQIFTODSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- MAGNEQBFSBREJL-DCAQKATOSA-N Gln-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N MAGNEQBFSBREJL-DCAQKATOSA-N 0.000 description 1
- LFIVHGMKWFGUGK-IHRRRGAJSA-N Gln-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LFIVHGMKWFGUGK-IHRRRGAJSA-N 0.000 description 1
- NSNUZSPSADIMJQ-WDSKDSINSA-N Gln-Gly-Asp Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NSNUZSPSADIMJQ-WDSKDSINSA-N 0.000 description 1
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 1
- KQOPMGBHNQBCEL-HVTMNAMFSA-N Gln-His-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KQOPMGBHNQBCEL-HVTMNAMFSA-N 0.000 description 1
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 1
- XWIBVSAEUCAAKF-GVXVVHGQSA-N Gln-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)N)N XWIBVSAEUCAAKF-GVXVVHGQSA-N 0.000 description 1
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 1
- MTCXQQINVAFZKW-MNXVOIDGSA-N Gln-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MTCXQQINVAFZKW-MNXVOIDGSA-N 0.000 description 1
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- OAOOXBSVCJEIFY-QAETUUGQSA-N Gln-Leu-Leu-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O OAOOXBSVCJEIFY-QAETUUGQSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 1
- FKXCBKCOSVIGCT-AVGNSLFASA-N Gln-Lys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FKXCBKCOSVIGCT-AVGNSLFASA-N 0.000 description 1
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 1
- XZLLTYBONVKGLO-SDDRHHMPSA-N Gln-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XZLLTYBONVKGLO-SDDRHHMPSA-N 0.000 description 1
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 1
- KLKYKPXITJBSNI-CIUDSAMLSA-N Gln-Met-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O KLKYKPXITJBSNI-CIUDSAMLSA-N 0.000 description 1
- XUZQMPGBGFQJMY-SRVKXCTJSA-N Gln-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N XUZQMPGBGFQJMY-SRVKXCTJSA-N 0.000 description 1
- DOMHVQBSRJNNKD-ZPFDUUQYSA-N Gln-Met-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DOMHVQBSRJNNKD-ZPFDUUQYSA-N 0.000 description 1
- GQTNWYFWSUFFRA-KKUMJFAQSA-N Gln-Met-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GQTNWYFWSUFFRA-KKUMJFAQSA-N 0.000 description 1
- RWCBJYUPAUTWJD-NHCYSSNCSA-N Gln-Met-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O RWCBJYUPAUTWJD-NHCYSSNCSA-N 0.000 description 1
- BZULIEARJFRINC-IHRRRGAJSA-N Gln-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N BZULIEARJFRINC-IHRRRGAJSA-N 0.000 description 1
- QBEWLBKBGXVVPD-RYUDHWBXSA-N Gln-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N QBEWLBKBGXVVPD-RYUDHWBXSA-N 0.000 description 1
- FTTHLXOMDMLKKW-FHWLQOOXSA-N Gln-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FTTHLXOMDMLKKW-FHWLQOOXSA-N 0.000 description 1
- UESYBOXFJWJVSB-AVGNSLFASA-N Gln-Phe-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O UESYBOXFJWJVSB-AVGNSLFASA-N 0.000 description 1
- QFXNFFZTMFHPST-DZKIICNBSA-N Gln-Phe-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)N)N QFXNFFZTMFHPST-DZKIICNBSA-N 0.000 description 1
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 1
- PIUPHASDUFSHTF-CIUDSAMLSA-N Gln-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O PIUPHASDUFSHTF-CIUDSAMLSA-N 0.000 description 1
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 1
- DCWNCMRZIZSZBL-KKUMJFAQSA-N Gln-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O DCWNCMRZIZSZBL-KKUMJFAQSA-N 0.000 description 1
- UTOQQOMEJDPDMX-ACZMJKKPSA-N Gln-Ser-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O UTOQQOMEJDPDMX-ACZMJKKPSA-N 0.000 description 1
- LGWNISYVKDNJRP-FXQIFTODSA-N Gln-Ser-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGWNISYVKDNJRP-FXQIFTODSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- OKQLXOYFUPVEHI-CIUDSAMLSA-N Gln-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N OKQLXOYFUPVEHI-CIUDSAMLSA-N 0.000 description 1
- BYKZWDGMJLNFJY-XKBZYTNZSA-N Gln-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)O BYKZWDGMJLNFJY-XKBZYTNZSA-N 0.000 description 1
- VLOLPWWCNKWRNB-LOKLDPHHSA-N Gln-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VLOLPWWCNKWRNB-LOKLDPHHSA-N 0.000 description 1
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 1
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 1
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 1
- DITJVHONFRJKJW-BPUTZDHNSA-N Gln-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DITJVHONFRJKJW-BPUTZDHNSA-N 0.000 description 1
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 1
- UQKVUFGUSVYJMQ-IRIUXVKKSA-N Gln-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N)O UQKVUFGUSVYJMQ-IRIUXVKKSA-N 0.000 description 1
- VDMABHYXBULDGN-LAEOZQHASA-N Gln-Val-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VDMABHYXBULDGN-LAEOZQHASA-N 0.000 description 1
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 1
- FTMLQFPULNGION-ZVZYQTTQSA-N Gln-Val-Trp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O FTMLQFPULNGION-ZVZYQTTQSA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 1
- HUWSBFYAGXCXKC-CIUDSAMLSA-N Glu-Ala-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O HUWSBFYAGXCXKC-CIUDSAMLSA-N 0.000 description 1
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 1
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 1
- OJGLIOXAKGFFDW-SRVKXCTJSA-N Glu-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N OJGLIOXAKGFFDW-SRVKXCTJSA-N 0.000 description 1
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 1
- GLWXKFRTOHKGIT-ACZMJKKPSA-N Glu-Asn-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GLWXKFRTOHKGIT-ACZMJKKPSA-N 0.000 description 1
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 1
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 1
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 1
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 1
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 1
- VAIWPXWHWAPYDF-FXQIFTODSA-N Glu-Asp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O VAIWPXWHWAPYDF-FXQIFTODSA-N 0.000 description 1
- RTOOAKXIJADOLL-GUBZILKMSA-N Glu-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N RTOOAKXIJADOLL-GUBZILKMSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 1
- CYHBMLHCQXXCCT-AVGNSLFASA-N Glu-Asp-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CYHBMLHCQXXCCT-AVGNSLFASA-N 0.000 description 1
- RQNYYRHRKSVKAB-GUBZILKMSA-N Glu-Cys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O RQNYYRHRKSVKAB-GUBZILKMSA-N 0.000 description 1
- OWVURWCRZZMAOZ-XHNCKOQMSA-N Glu-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)C(=O)O OWVURWCRZZMAOZ-XHNCKOQMSA-N 0.000 description 1
- CJWANNXUTOATSJ-DCAQKATOSA-N Glu-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N CJWANNXUTOATSJ-DCAQKATOSA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- RFDHKPSHTXZKLL-IHRRRGAJSA-N Glu-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N RFDHKPSHTXZKLL-IHRRRGAJSA-N 0.000 description 1
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 1
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 1
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 1
- GGJOGFJIPPGNRK-JSGCOSHPSA-N Glu-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 GGJOGFJIPPGNRK-JSGCOSHPSA-N 0.000 description 1
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 1
- WVYJNPCWJYBHJG-YVNDNENWSA-N Glu-Ile-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O WVYJNPCWJYBHJG-YVNDNENWSA-N 0.000 description 1
- GRHXUHCFENOCOS-ZPFDUUQYSA-N Glu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N GRHXUHCFENOCOS-ZPFDUUQYSA-N 0.000 description 1
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 1
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 1
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 1
- OHWJUIXZHVIXJJ-GUBZILKMSA-N Glu-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N OHWJUIXZHVIXJJ-GUBZILKMSA-N 0.000 description 1
- UJMNFCAHLYKWOZ-DCAQKATOSA-N Glu-Lys-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UJMNFCAHLYKWOZ-DCAQKATOSA-N 0.000 description 1
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 1
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 1
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 1
- BHXSLRDWXIFKTP-SRVKXCTJSA-N Glu-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N BHXSLRDWXIFKTP-SRVKXCTJSA-N 0.000 description 1
- HQOGXFLBAKJUMH-CIUDSAMLSA-N Glu-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N HQOGXFLBAKJUMH-CIUDSAMLSA-N 0.000 description 1
- UERORLSAFUHDGU-AVGNSLFASA-N Glu-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UERORLSAFUHDGU-AVGNSLFASA-N 0.000 description 1
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 1
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 1
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- SWDNPSMMEWRNOH-HJGDQZAQSA-N Glu-Pro-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWDNPSMMEWRNOH-HJGDQZAQSA-N 0.000 description 1
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 1
- QVXWAFZDWRLXTI-NWLDYVSISA-N Glu-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QVXWAFZDWRLXTI-NWLDYVSISA-N 0.000 description 1
- VHPVBPCCWVDGJL-IRIUXVKKSA-N Glu-Thr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VHPVBPCCWVDGJL-IRIUXVKKSA-N 0.000 description 1
- HGJREIGJLUQBTJ-SZMVWBNQSA-N Glu-Trp-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O HGJREIGJLUQBTJ-SZMVWBNQSA-N 0.000 description 1
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 1
- RXJFSLQVMGYQEL-IHRRRGAJSA-N Glu-Tyr-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 RXJFSLQVMGYQEL-IHRRRGAJSA-N 0.000 description 1
- KXRORHJIRAOQPG-SOUVJXGZSA-N Glu-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KXRORHJIRAOQPG-SOUVJXGZSA-N 0.000 description 1
- VXEFAWJTFAUDJK-AVGNSLFASA-N Glu-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O VXEFAWJTFAUDJK-AVGNSLFASA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 1
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 1
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 1
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 1
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- JPXNYFOHTHSREU-UWVGGRQHSA-N Gly-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN JPXNYFOHTHSREU-UWVGGRQHSA-N 0.000 description 1
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 1
- MXXXVOYFNVJHMA-IUCAKERBSA-N Gly-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN MXXXVOYFNVJHMA-IUCAKERBSA-N 0.000 description 1
- KRRMJKMGWWXWDW-STQMWFEESA-N Gly-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KRRMJKMGWWXWDW-STQMWFEESA-N 0.000 description 1
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 1
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- FMVLWTYYODVFRG-BQBZGAKWSA-N Gly-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN FMVLWTYYODVFRG-BQBZGAKWSA-N 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- XEJTYSCIXKYSHR-WDSKDSINSA-N Gly-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN XEJTYSCIXKYSHR-WDSKDSINSA-N 0.000 description 1
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 1
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 1
- ZRZILYKEJBMFHY-BQBZGAKWSA-N Gly-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN ZRZILYKEJBMFHY-BQBZGAKWSA-N 0.000 description 1
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 1
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 1
- CEXINUGNTZFNRY-BYPYZUCNSA-N Gly-Cys-Gly Chemical compound [NH3+]CC(=O)N[C@@H](CS)C(=O)NCC([O-])=O CEXINUGNTZFNRY-BYPYZUCNSA-N 0.000 description 1
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 1
- JMQFHZWESBGPFC-WDSKDSINSA-N Gly-Gln-Asp Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JMQFHZWESBGPFC-WDSKDSINSA-N 0.000 description 1
- JUGQPPOVWXSPKJ-RYUDHWBXSA-N Gly-Gln-Phe Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JUGQPPOVWXSPKJ-RYUDHWBXSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- JUBDONGMHASUCN-IUCAKERBSA-N Gly-Glu-His Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O JUBDONGMHASUCN-IUCAKERBSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- LHRXAHLCRMQBGJ-RYUDHWBXSA-N Gly-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN LHRXAHLCRMQBGJ-RYUDHWBXSA-N 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- VAXIVIPMCTYSHI-YUMQZZPRSA-N Gly-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN VAXIVIPMCTYSHI-YUMQZZPRSA-N 0.000 description 1
- QSVMIMFAAZPCAQ-PMVVWTBXSA-N Gly-His-Thr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QSVMIMFAAZPCAQ-PMVVWTBXSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 1
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 1
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 1
- ZOTGXWMKUFSKEU-QXEWZRGKSA-N Gly-Ile-Met Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O ZOTGXWMKUFSKEU-QXEWZRGKSA-N 0.000 description 1
- XVYKMNXXJXQKME-XEGUGMAKSA-N Gly-Ile-Tyr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XVYKMNXXJXQKME-XEGUGMAKSA-N 0.000 description 1
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 1
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 1
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 1
- IUKIDFVOUHZRAK-QWRGUYRKSA-N Gly-Lys-His Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IUKIDFVOUHZRAK-QWRGUYRKSA-N 0.000 description 1
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- YKJUITHASJAGHO-HOTGVXAUSA-N Gly-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN YKJUITHASJAGHO-HOTGVXAUSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- LPHQAFLNEHWKFF-QXEWZRGKSA-N Gly-Met-Ile Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LPHQAFLNEHWKFF-QXEWZRGKSA-N 0.000 description 1
- YHYDTTUSJXGTQK-UWVGGRQHSA-N Gly-Met-Leu Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(C)C)C(O)=O YHYDTTUSJXGTQK-UWVGGRQHSA-N 0.000 description 1
- RUDRIZRGOLQSMX-IUCAKERBSA-N Gly-Met-Met Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O RUDRIZRGOLQSMX-IUCAKERBSA-N 0.000 description 1
- MDKCBHZLQJZOCJ-STQMWFEESA-N Gly-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)CN MDKCBHZLQJZOCJ-STQMWFEESA-N 0.000 description 1
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 1
- MTBIKIMYHUWBRX-QWRGUYRKSA-N Gly-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN MTBIKIMYHUWBRX-QWRGUYRKSA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- YYXJFBMCOUSYSF-RYUDHWBXSA-N Gly-Phe-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYXJFBMCOUSYSF-RYUDHWBXSA-N 0.000 description 1
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 1
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 1
- YLEIWGJJBFBFHC-KBPBESRZSA-N Gly-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 YLEIWGJJBFBFHC-KBPBESRZSA-N 0.000 description 1
- MXIULRKNFSCJHT-STQMWFEESA-N Gly-Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 MXIULRKNFSCJHT-STQMWFEESA-N 0.000 description 1
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 1
- JYPCXBJRLBHWME-IUCAKERBSA-N Gly-Pro-Arg Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JYPCXBJRLBHWME-IUCAKERBSA-N 0.000 description 1
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 1
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 1
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 1
- GAAHQHNCMIAYEX-UWVGGRQHSA-N Gly-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GAAHQHNCMIAYEX-UWVGGRQHSA-N 0.000 description 1
- IXHQLZIWBCQBLQ-STQMWFEESA-N Gly-Pro-Phe Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IXHQLZIWBCQBLQ-STQMWFEESA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 1
- NIOPEYHPOBWLQO-KBPBESRZSA-N Gly-Trp-Glu Chemical compound NCC(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOPEYHPOBWLQO-KBPBESRZSA-N 0.000 description 1
- LKJCZEPXHOIAIW-HOTGVXAUSA-N Gly-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN LKJCZEPXHOIAIW-HOTGVXAUSA-N 0.000 description 1
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 1
- UVTSZKIATYSKIR-RYUDHWBXSA-N Gly-Tyr-Glu Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O UVTSZKIATYSKIR-RYUDHWBXSA-N 0.000 description 1
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 1
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 1
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 1
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 108700023372 Glycosyltransferases Proteins 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 101150031823 HSP70 gene Proteins 0.000 description 1
- 108091027305 Heteroduplex Proteins 0.000 description 1
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 1
- YXBRCTXAEYSCHS-XVYDVKMFSA-N His-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N YXBRCTXAEYSCHS-XVYDVKMFSA-N 0.000 description 1
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 1
- YPLYIXGKCRQZGW-SRVKXCTJSA-N His-Arg-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YPLYIXGKCRQZGW-SRVKXCTJSA-N 0.000 description 1
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 1
- MWAJSVTZZOUOBU-IHRRRGAJSA-N His-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 MWAJSVTZZOUOBU-IHRRRGAJSA-N 0.000 description 1
- FPNWKONEZAVQJF-GUBZILKMSA-N His-Asn-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N FPNWKONEZAVQJF-GUBZILKMSA-N 0.000 description 1
- VOEGKUNRHYKYSU-XVYDVKMFSA-N His-Asp-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O VOEGKUNRHYKYSU-XVYDVKMFSA-N 0.000 description 1
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 1
- JFFAPRNXXLRINI-NHCYSSNCSA-N His-Asp-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JFFAPRNXXLRINI-NHCYSSNCSA-N 0.000 description 1
- LIEIYPBMQJLASB-SRVKXCTJSA-N His-Gln-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 LIEIYPBMQJLASB-SRVKXCTJSA-N 0.000 description 1
- NWGXCPUKPVISSJ-AVGNSLFASA-N His-Gln-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NWGXCPUKPVISSJ-AVGNSLFASA-N 0.000 description 1
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 1
- TVRMJKNELJKNRS-GUBZILKMSA-N His-Glu-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N TVRMJKNELJKNRS-GUBZILKMSA-N 0.000 description 1
- XMENRVZYPBKBIL-AVGNSLFASA-N His-Glu-His Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XMENRVZYPBKBIL-AVGNSLFASA-N 0.000 description 1
- PYNUBZSXKQKAHL-UWVGGRQHSA-N His-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O PYNUBZSXKQKAHL-UWVGGRQHSA-N 0.000 description 1
- CHZRWFUGWRTUOD-IUCAKERBSA-N His-Gly-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N CHZRWFUGWRTUOD-IUCAKERBSA-N 0.000 description 1
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 1
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 1
- JJHWJUYYTWYXPL-PYJNHQTQSA-N His-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CN=CN1 JJHWJUYYTWYXPL-PYJNHQTQSA-N 0.000 description 1
- VTZYMXGGXOFBMX-DJFWLOJKSA-N His-Ile-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O VTZYMXGGXOFBMX-DJFWLOJKSA-N 0.000 description 1
- MLZVJIREOKTDAR-SIGLWIIPSA-N His-Ile-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MLZVJIREOKTDAR-SIGLWIIPSA-N 0.000 description 1
- MFQVZYSPCIZFMR-MGHWNKPDSA-N His-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N MFQVZYSPCIZFMR-MGHWNKPDSA-N 0.000 description 1
- IWXMHXYOACDSIA-PYJNHQTQSA-N His-Ile-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O IWXMHXYOACDSIA-PYJNHQTQSA-N 0.000 description 1
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 1
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 1
- SLFSYFJKSIVSON-SRVKXCTJSA-N His-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N SLFSYFJKSIVSON-SRVKXCTJSA-N 0.000 description 1
- RLAOTFTXBFQJDV-KKUMJFAQSA-N His-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CN=CN1 RLAOTFTXBFQJDV-KKUMJFAQSA-N 0.000 description 1
- XJFITURPHAKKAI-SRVKXCTJSA-N His-Pro-Gln Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CN=CN1 XJFITURPHAKKAI-SRVKXCTJSA-N 0.000 description 1
- XIGFLVCAVQQGNS-IHRRRGAJSA-N His-Pro-His Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 XIGFLVCAVQQGNS-IHRRRGAJSA-N 0.000 description 1
- KAXZXLSXFWSNNZ-XVYDVKMFSA-N His-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KAXZXLSXFWSNNZ-XVYDVKMFSA-N 0.000 description 1
- STGQSBKUYSPPIG-CIUDSAMLSA-N His-Ser-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 STGQSBKUYSPPIG-CIUDSAMLSA-N 0.000 description 1
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 1
- JGFWUKYIQAEYAH-DCAQKATOSA-N His-Ser-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JGFWUKYIQAEYAH-DCAQKATOSA-N 0.000 description 1
- FCPSGEVYIVXPPO-QTKMDUPCSA-N His-Thr-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FCPSGEVYIVXPPO-QTKMDUPCSA-N 0.000 description 1
- XHQYFGPIRUHQIB-PBCZWWQYSA-N His-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CN=CN1 XHQYFGPIRUHQIB-PBCZWWQYSA-N 0.000 description 1
- DQZCEKQPSOBNMJ-NKIYYHGXSA-N His-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DQZCEKQPSOBNMJ-NKIYYHGXSA-N 0.000 description 1
- LPBWRHRHEIYAIP-KKUMJFAQSA-N His-Tyr-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LPBWRHRHEIYAIP-KKUMJFAQSA-N 0.000 description 1
- PZUZIHRPOVVHOT-KBPBESRZSA-N His-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CN=CN1 PZUZIHRPOVVHOT-KBPBESRZSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- KFQDSSNYWKZFOO-LSJOCFKGSA-N His-Val-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KFQDSSNYWKZFOO-LSJOCFKGSA-N 0.000 description 1
- FFYYUUWROYYKFY-IHRRRGAJSA-N His-Val-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O FFYYUUWROYYKFY-IHRRRGAJSA-N 0.000 description 1
- PUFNQIPSRXVLQJ-IHRRRGAJSA-N His-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N PUFNQIPSRXVLQJ-IHRRRGAJSA-N 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 108091064358 Holliday junction Proteins 0.000 description 1
- 102000039011 Holliday junction Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101001093143 Homo sapiens Protein transport protein Sec61 subunit gamma Proteins 0.000 description 1
- 101000704147 Homo sapiens Signal recognition particle 54 kDa protein Proteins 0.000 description 1
- 101000824014 Homo sapiens Signal recognition particle 9 kDa protein Proteins 0.000 description 1
- 101000939384 Homo sapiens Urocortin-2 Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 101150102264 IE gene Proteins 0.000 description 1
- RCFDOSNHHZGBOY-ACZMJKKPSA-N Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(O)=O RCFDOSNHHZGBOY-ACZMJKKPSA-N 0.000 description 1
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 1
- CISBRYJZMFWOHJ-JBDRJPRFSA-N Ile-Ala-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O)N CISBRYJZMFWOHJ-JBDRJPRFSA-N 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 1
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 1
- WUEIUSDAECDLQO-NAKRPEOUSA-N Ile-Ala-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)O)N WUEIUSDAECDLQO-NAKRPEOUSA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- DXUJSRIVSWEOAG-NAKRPEOUSA-N Ile-Arg-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N DXUJSRIVSWEOAG-NAKRPEOUSA-N 0.000 description 1
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 1
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 1
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 1
- AQTWDZDISVGCAC-CFMVVWHZSA-N Ile-Asp-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AQTWDZDISVGCAC-CFMVVWHZSA-N 0.000 description 1
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 1
- LOXMWQOKYBGCHF-JBDRJPRFSA-N Ile-Cys-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O LOXMWQOKYBGCHF-JBDRJPRFSA-N 0.000 description 1
- BSWLQVGEVFYGIM-ZPFDUUQYSA-N Ile-Gln-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BSWLQVGEVFYGIM-ZPFDUUQYSA-N 0.000 description 1
- LJKDGRWXYUTRSH-YVNDNENWSA-N Ile-Gln-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LJKDGRWXYUTRSH-YVNDNENWSA-N 0.000 description 1
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 1
- BALLIXFZYSECCF-QEWYBTABSA-N Ile-Gln-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N BALLIXFZYSECCF-QEWYBTABSA-N 0.000 description 1
- OVPYIUNCVSOVNF-KQXIARHKSA-N Ile-Gln-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N OVPYIUNCVSOVNF-KQXIARHKSA-N 0.000 description 1
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 1
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 1
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 1
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- KIAOPHMUNPPGEN-PEXQALLHSA-N Ile-Gly-His Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KIAOPHMUNPPGEN-PEXQALLHSA-N 0.000 description 1
- ODPKZZLRDNXTJZ-WHOFXGATSA-N Ile-Gly-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ODPKZZLRDNXTJZ-WHOFXGATSA-N 0.000 description 1
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 1
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 1
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 1
- AFERFBZLVUFWRA-HTFCKZLJSA-N Ile-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)O)N AFERFBZLVUFWRA-HTFCKZLJSA-N 0.000 description 1
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 1
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 1
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 1
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 1
- DMSVBUWGDLYNLC-IAVJCBSLSA-N Ile-Ile-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DMSVBUWGDLYNLC-IAVJCBSLSA-N 0.000 description 1
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 1
- KBAPKNDWAGVGTH-IGISWZIWSA-N Ile-Ile-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KBAPKNDWAGVGTH-IGISWZIWSA-N 0.000 description 1
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 1
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 1
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 1
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 1
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 1
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 1
- WVUDHMBJNBWZBU-XUXIUFHCSA-N Ile-Lys-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N WVUDHMBJNBWZBU-XUXIUFHCSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- UFRXVQGGPNSJRY-CYDGBPFRSA-N Ile-Met-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N UFRXVQGGPNSJRY-CYDGBPFRSA-N 0.000 description 1
- IALVDKNUFSTICJ-GMOBBJLQSA-N Ile-Met-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IALVDKNUFSTICJ-GMOBBJLQSA-N 0.000 description 1
- IMRKCLXPYOIHIF-ZPFDUUQYSA-N Ile-Met-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IMRKCLXPYOIHIF-ZPFDUUQYSA-N 0.000 description 1
- NNVXABCGXOLIEB-PYJNHQTQSA-N Ile-Met-His Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NNVXABCGXOLIEB-PYJNHQTQSA-N 0.000 description 1
- BKPPWVSPSIUXHZ-OSUNSFLBSA-N Ile-Met-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N BKPPWVSPSIUXHZ-OSUNSFLBSA-N 0.000 description 1
- HQEPKOFULQTSFV-JURCDPSOSA-N Ile-Phe-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)O)N HQEPKOFULQTSFV-JURCDPSOSA-N 0.000 description 1
- KTTMFLSBTNBAHL-MXAVVETBSA-N Ile-Phe-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N KTTMFLSBTNBAHL-MXAVVETBSA-N 0.000 description 1
- SAVXZJYTTQQQDD-QEWYBTABSA-N Ile-Phe-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SAVXZJYTTQQQDD-QEWYBTABSA-N 0.000 description 1
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 1
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- FGBRXCZYVRFNKQ-MXAVVETBSA-N Ile-Phe-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N FGBRXCZYVRFNKQ-MXAVVETBSA-N 0.000 description 1
- OWSWUWDMSNXTNE-GMOBBJLQSA-N Ile-Pro-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N OWSWUWDMSNXTNE-GMOBBJLQSA-N 0.000 description 1
- VISRCHQHQCLODA-NAKRPEOUSA-N Ile-Pro-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N VISRCHQHQCLODA-NAKRPEOUSA-N 0.000 description 1
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 1
- CIJLNXXMDUOFPH-HJWJTTGWSA-N Ile-Pro-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CIJLNXXMDUOFPH-HJWJTTGWSA-N 0.000 description 1
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 1
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 1
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 1
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 1
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 1
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 1
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 1
- BLFXHAFTNYZEQE-VKOGCVSHSA-N Ile-Trp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BLFXHAFTNYZEQE-VKOGCVSHSA-N 0.000 description 1
- RMJWFINHACYKJI-SIUGBPQLSA-N Ile-Tyr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RMJWFINHACYKJI-SIUGBPQLSA-N 0.000 description 1
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 1
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 1
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 1
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 1
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 1
- WIYDLTIBHZSPKY-HJWJTTGWSA-N Ile-Val-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WIYDLTIBHZSPKY-HJWJTTGWSA-N 0.000 description 1
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 1
- QSXSHZIRKTUXNG-STECZYCISA-N Ile-Val-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QSXSHZIRKTUXNG-STECZYCISA-N 0.000 description 1
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- 102000015335 Ku Autoantigen Human genes 0.000 description 1
- 108010025026 Ku Autoantigen Proteins 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 1
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 1
- QUAAUWNLWMLERT-IHRRRGAJSA-N Leu-Arg-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O QUAAUWNLWMLERT-IHRRRGAJSA-N 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- RFUBXQQFJFGJFV-GUBZILKMSA-N Leu-Asn-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RFUBXQQFJFGJFV-GUBZILKMSA-N 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- VIWUBXKCYJGNCL-SRVKXCTJSA-N Leu-Asn-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 VIWUBXKCYJGNCL-SRVKXCTJSA-N 0.000 description 1
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 1
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- ZDSNOSQHMJBRQN-SRVKXCTJSA-N Leu-Asp-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZDSNOSQHMJBRQN-SRVKXCTJSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- QLQHWWCSCLZUMA-KKUMJFAQSA-N Leu-Asp-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QLQHWWCSCLZUMA-KKUMJFAQSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- IIKJNQWOQIWWMR-CIUDSAMLSA-N Leu-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N IIKJNQWOQIWWMR-CIUDSAMLSA-N 0.000 description 1
- NFHJQETXTSDZSI-DCAQKATOSA-N Leu-Cys-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NFHJQETXTSDZSI-DCAQKATOSA-N 0.000 description 1
- NHHKSOGJYNQENP-SRVKXCTJSA-N Leu-Cys-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N NHHKSOGJYNQENP-SRVKXCTJSA-N 0.000 description 1
- VFQOCUQGMUXTJR-DCAQKATOSA-N Leu-Cys-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCSC)C(=O)O)N VFQOCUQGMUXTJR-DCAQKATOSA-N 0.000 description 1
- PNUCWVAGVNLUMW-CIUDSAMLSA-N Leu-Cys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O PNUCWVAGVNLUMW-CIUDSAMLSA-N 0.000 description 1
- HQPHMEPBNUHPKD-XIRDDKMYSA-N Leu-Cys-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N HQPHMEPBNUHPKD-XIRDDKMYSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- DXYBNWJZJVSZAE-GUBZILKMSA-N Leu-Gln-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N DXYBNWJZJVSZAE-GUBZILKMSA-N 0.000 description 1
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 1
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 1
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- WMTOVWLLDGQGCV-GUBZILKMSA-N Leu-Glu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WMTOVWLLDGQGCV-GUBZILKMSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- AOFYPTOHESIBFZ-KKUMJFAQSA-N Leu-His-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O AOFYPTOHESIBFZ-KKUMJFAQSA-N 0.000 description 1
- XQXGNBFMAXWIGI-MXAVVETBSA-N Leu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 XQXGNBFMAXWIGI-MXAVVETBSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 1
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 1
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 1
- CPONGMJGVIAWEH-DCAQKATOSA-N Leu-Met-Ala Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O CPONGMJGVIAWEH-DCAQKATOSA-N 0.000 description 1
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 1
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 1
- JVTYXRRFZCEPPK-RHYQMDGZSA-N Leu-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)N)O JVTYXRRFZCEPPK-RHYQMDGZSA-N 0.000 description 1
- KQFZKDITNUEVFJ-JYJNAYRXSA-N Leu-Phe-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CC=CC=C1 KQFZKDITNUEVFJ-JYJNAYRXSA-N 0.000 description 1
- KTOIECMYZZGVSI-BZSNNMDCSA-N Leu-Phe-His Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KTOIECMYZZGVSI-BZSNNMDCSA-N 0.000 description 1
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 1
- WXDRGWBQZIMJDE-ULQDDVLXSA-N Leu-Phe-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O WXDRGWBQZIMJDE-ULQDDVLXSA-N 0.000 description 1
- MJWVXZABPOKJJF-ACRUOGEOSA-N Leu-Phe-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MJWVXZABPOKJJF-ACRUOGEOSA-N 0.000 description 1
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- CNWDWAMPKVYJJB-NUTKFTJISA-N Leu-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CNWDWAMPKVYJJB-NUTKFTJISA-N 0.000 description 1
- IDGRADDMTTWOQC-WDSOQIARSA-N Leu-Trp-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IDGRADDMTTWOQC-WDSOQIARSA-N 0.000 description 1
- LSLUTXRANSUGFY-XIRDDKMYSA-N Leu-Trp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O LSLUTXRANSUGFY-XIRDDKMYSA-N 0.000 description 1
- WBRJVRXEGQIDRK-XIRDDKMYSA-N Leu-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 WBRJVRXEGQIDRK-XIRDDKMYSA-N 0.000 description 1
- SUYRAPCRSCCPAK-VFAJRCTISA-N Leu-Trp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUYRAPCRSCCPAK-VFAJRCTISA-N 0.000 description 1
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 1
- SXOFUVGLPHCPRQ-KKUMJFAQSA-N Leu-Tyr-Cys Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(O)=O SXOFUVGLPHCPRQ-KKUMJFAQSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 1
- VQHUBNVKFFLWRP-ULQDDVLXSA-N Leu-Tyr-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 VQHUBNVKFFLWRP-ULQDDVLXSA-N 0.000 description 1
- TUIOUEWKFFVNLH-DCAQKATOSA-N Leu-Val-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O TUIOUEWKFFVNLH-DCAQKATOSA-N 0.000 description 1
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 1
- FMFNIDICDKEMOE-XUXIUFHCSA-N Leu-Val-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMFNIDICDKEMOE-XUXIUFHCSA-N 0.000 description 1
- XOEDPXDZJHBQIX-ULQDDVLXSA-N Leu-Val-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XOEDPXDZJHBQIX-ULQDDVLXSA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 1
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 1
- CKSXSQUVEYCDIW-AVGNSLFASA-N Lys-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N CKSXSQUVEYCDIW-AVGNSLFASA-N 0.000 description 1
- QYOXSYXPHUHOJR-GUBZILKMSA-N Lys-Asn-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYOXSYXPHUHOJR-GUBZILKMSA-N 0.000 description 1
- HGZHSNBZDOLMLH-DCAQKATOSA-N Lys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N HGZHSNBZDOLMLH-DCAQKATOSA-N 0.000 description 1
- YVSHZSUKQHNDHD-KKUMJFAQSA-N Lys-Asn-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N YVSHZSUKQHNDHD-KKUMJFAQSA-N 0.000 description 1
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- SSJBMGCZZXCGJJ-DCAQKATOSA-N Lys-Asp-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O SSJBMGCZZXCGJJ-DCAQKATOSA-N 0.000 description 1
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 1
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 1
- RLZDUFRBMQNYIJ-YUMQZZPRSA-N Lys-Cys-Gly Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N RLZDUFRBMQNYIJ-YUMQZZPRSA-N 0.000 description 1
- SSYOBDBNBQBSQE-SRVKXCTJSA-N Lys-Cys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O SSYOBDBNBQBSQE-SRVKXCTJSA-N 0.000 description 1
- XFBBBRDEQIPGNR-KATARQTJSA-N Lys-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)O XFBBBRDEQIPGNR-KATARQTJSA-N 0.000 description 1
- YFGWNAROEYWGNL-GUBZILKMSA-N Lys-Gln-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YFGWNAROEYWGNL-GUBZILKMSA-N 0.000 description 1
- GGNOBVSOZPHLCE-GUBZILKMSA-N Lys-Gln-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GGNOBVSOZPHLCE-GUBZILKMSA-N 0.000 description 1
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 1
- PGBPWPTUOSCNLE-JYJNAYRXSA-N Lys-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N PGBPWPTUOSCNLE-JYJNAYRXSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 1
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 1
- FGMHXLULNHTPID-KKUMJFAQSA-N Lys-His-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CN=CN1 FGMHXLULNHTPID-KKUMJFAQSA-N 0.000 description 1
- PGLGNCVOWIORQE-SRVKXCTJSA-N Lys-His-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O PGLGNCVOWIORQE-SRVKXCTJSA-N 0.000 description 1
- OIYWBDBHEGAVST-BZSNNMDCSA-N Lys-His-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OIYWBDBHEGAVST-BZSNNMDCSA-N 0.000 description 1
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 1
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 1
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 1
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 1
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 1
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 1
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- DAHQKYYIXPBESV-UWVGGRQHSA-N Lys-Met-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O DAHQKYYIXPBESV-UWVGGRQHSA-N 0.000 description 1
- WWEWGPOLIJXGNX-XUXIUFHCSA-N Lys-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)N WWEWGPOLIJXGNX-XUXIUFHCSA-N 0.000 description 1
- KFSALEZVQJYHCE-AVGNSLFASA-N Lys-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)N KFSALEZVQJYHCE-AVGNSLFASA-N 0.000 description 1
- ALEVUGKHINJNIF-QEJZJMRPSA-N Lys-Phe-Ala Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ALEVUGKHINJNIF-QEJZJMRPSA-N 0.000 description 1
- ODTZHNZPINULEU-KKUMJFAQSA-N Lys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N ODTZHNZPINULEU-KKUMJFAQSA-N 0.000 description 1
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 1
- ZJSZPXISKMDJKQ-JYJNAYRXSA-N Lys-Phe-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=CC=C1 ZJSZPXISKMDJKQ-JYJNAYRXSA-N 0.000 description 1
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 1
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 1
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 1
- UIJVKVHLCQSPOJ-XIRDDKMYSA-N Lys-Ser-Trp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O UIJVKVHLCQSPOJ-XIRDDKMYSA-N 0.000 description 1
- YRNRVKTYDSLKMD-KKUMJFAQSA-N Lys-Ser-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YRNRVKTYDSLKMD-KKUMJFAQSA-N 0.000 description 1
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 1
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 1
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 1
- CNXOBMMOYZPPGS-NUTKFTJISA-N Lys-Trp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O CNXOBMMOYZPPGS-NUTKFTJISA-N 0.000 description 1
- XGZDDOKIHSYHTO-SZMVWBNQSA-N Lys-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 XGZDDOKIHSYHTO-SZMVWBNQSA-N 0.000 description 1
- KXYLFJIQDIMURW-IHPCNDPISA-N Lys-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCCN)=CNC2=C1 KXYLFJIQDIMURW-IHPCNDPISA-N 0.000 description 1
- ZFNYWKHYUMEZDZ-WDSOQIARSA-N Lys-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCCN)N ZFNYWKHYUMEZDZ-WDSOQIARSA-N 0.000 description 1
- SUZVLFWOCKHWET-CQDKDKBSSA-N Lys-Tyr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O SUZVLFWOCKHWET-CQDKDKBSSA-N 0.000 description 1
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 1
- WINFHLHJTRGLCV-BZSNNMDCSA-N Lys-Tyr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 WINFHLHJTRGLCV-BZSNNMDCSA-N 0.000 description 1
- LMMBAXJRYSXCOQ-ACRUOGEOSA-N Lys-Tyr-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O LMMBAXJRYSXCOQ-ACRUOGEOSA-N 0.000 description 1
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- BWECSLVQIWEMSC-IHRRRGAJSA-N Lys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BWECSLVQIWEMSC-IHRRRGAJSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- MVQGZYIOMXAFQG-GUBZILKMSA-N Met-Ala-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCNC(N)=N MVQGZYIOMXAFQG-GUBZILKMSA-N 0.000 description 1
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 1
- KUQWVNFMZLHAPA-CIUDSAMLSA-N Met-Ala-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O KUQWVNFMZLHAPA-CIUDSAMLSA-N 0.000 description 1
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 1
- QGQGAIBGTUJRBR-NAKRPEOUSA-N Met-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCSC QGQGAIBGTUJRBR-NAKRPEOUSA-N 0.000 description 1
- WYEXWKAWMNJKPN-UBHSHLNASA-N Met-Ala-Phe Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCSC)N WYEXWKAWMNJKPN-UBHSHLNASA-N 0.000 description 1
- BVXXDMUMHMXFER-BPNCWPANSA-N Met-Ala-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVXXDMUMHMXFER-BPNCWPANSA-N 0.000 description 1
- IIPHCNKHEZYSNE-DCAQKATOSA-N Met-Arg-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O IIPHCNKHEZYSNE-DCAQKATOSA-N 0.000 description 1
- DSWOTZCVCBEPOU-IUCAKERBSA-N Met-Arg-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCNC(N)=N DSWOTZCVCBEPOU-IUCAKERBSA-N 0.000 description 1
- OLWAOWXIADGIJG-AVGNSLFASA-N Met-Arg-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(O)=O OLWAOWXIADGIJG-AVGNSLFASA-N 0.000 description 1
- NSGXXVIHCIAISP-CIUDSAMLSA-N Met-Asn-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O NSGXXVIHCIAISP-CIUDSAMLSA-N 0.000 description 1
- DRXODWRPPUFIAY-DCAQKATOSA-N Met-Asn-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN DRXODWRPPUFIAY-DCAQKATOSA-N 0.000 description 1
- JQECLVNLAZGHRQ-CIUDSAMLSA-N Met-Asp-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O JQECLVNLAZGHRQ-CIUDSAMLSA-N 0.000 description 1
- FJVJLMZUIGMFFU-BQBZGAKWSA-N Met-Asp-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FJVJLMZUIGMFFU-BQBZGAKWSA-N 0.000 description 1
- OSOLWRWQADPDIQ-DCAQKATOSA-N Met-Asp-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OSOLWRWQADPDIQ-DCAQKATOSA-N 0.000 description 1
- MCNGIXXCMJAURZ-VEVYYDQMSA-N Met-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCSC)N)O MCNGIXXCMJAURZ-VEVYYDQMSA-N 0.000 description 1
- HLYIDXAXQIJYIG-CIUDSAMLSA-N Met-Gln-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HLYIDXAXQIJYIG-CIUDSAMLSA-N 0.000 description 1
- JYCQGAGDJQYEDB-GUBZILKMSA-N Met-Gln-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O JYCQGAGDJQYEDB-GUBZILKMSA-N 0.000 description 1
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 1
- DGNZGCQSVGGYJS-BQBZGAKWSA-N Met-Gly-Asp Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O DGNZGCQSVGGYJS-BQBZGAKWSA-N 0.000 description 1
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 1
- SLQDSYZHHOKQSR-QXEWZRGKSA-N Met-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCSC SLQDSYZHHOKQSR-QXEWZRGKSA-N 0.000 description 1
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 1
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 1
- SXWQMBGNFXAGAT-FJXKBIBVSA-N Met-Gly-Thr Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SXWQMBGNFXAGAT-FJXKBIBVSA-N 0.000 description 1
- RXWPLVRJQNWXRQ-IHRRRGAJSA-N Met-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 RXWPLVRJQNWXRQ-IHRRRGAJSA-N 0.000 description 1
- FZUNSVYYPYJYAP-NAKRPEOUSA-N Met-Ile-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O FZUNSVYYPYJYAP-NAKRPEOUSA-N 0.000 description 1
- RVYDCISQIGHAFC-ZPFDUUQYSA-N Met-Ile-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O RVYDCISQIGHAFC-ZPFDUUQYSA-N 0.000 description 1
- NLHSFJQUHGCWSD-PYJNHQTQSA-N Met-Ile-His Chemical compound N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O NLHSFJQUHGCWSD-PYJNHQTQSA-N 0.000 description 1
- PPHLBTXVBJNKOB-FDARSICLSA-N Met-Ile-Trp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PPHLBTXVBJNKOB-FDARSICLSA-N 0.000 description 1
- QZPXMHVKPHJNTR-DCAQKATOSA-N Met-Leu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O QZPXMHVKPHJNTR-DCAQKATOSA-N 0.000 description 1
- UROWNMBTQGGTHB-DCAQKATOSA-N Met-Leu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UROWNMBTQGGTHB-DCAQKATOSA-N 0.000 description 1
- ZIIMORLEZLVRIP-SRVKXCTJSA-N Met-Leu-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZIIMORLEZLVRIP-SRVKXCTJSA-N 0.000 description 1
- CHDYFPCQVUOJEB-ULQDDVLXSA-N Met-Leu-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CHDYFPCQVUOJEB-ULQDDVLXSA-N 0.000 description 1
- DBXMFHGGHMXYHY-DCAQKATOSA-N Met-Leu-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O DBXMFHGGHMXYHY-DCAQKATOSA-N 0.000 description 1
- UNPGTBHYKJOCCZ-DCAQKATOSA-N Met-Lys-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O UNPGTBHYKJOCCZ-DCAQKATOSA-N 0.000 description 1
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 1
- VBGGTAPDGFQMKF-AVGNSLFASA-N Met-Lys-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O VBGGTAPDGFQMKF-AVGNSLFASA-N 0.000 description 1
- FMYLZGQFKPHXHI-GUBZILKMSA-N Met-Met-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O FMYLZGQFKPHXHI-GUBZILKMSA-N 0.000 description 1
- XOFDBXYPKZUAAM-GUBZILKMSA-N Met-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N XOFDBXYPKZUAAM-GUBZILKMSA-N 0.000 description 1
- QTMIXEQWGNIPBL-JYJNAYRXSA-N Met-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N QTMIXEQWGNIPBL-JYJNAYRXSA-N 0.000 description 1
- QEDGNYFHLXXIDC-DCAQKATOSA-N Met-Pro-Gln Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O QEDGNYFHLXXIDC-DCAQKATOSA-N 0.000 description 1
- VSJAPSMRFYUOKS-IUCAKERBSA-N Met-Pro-Gly Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O VSJAPSMRFYUOKS-IUCAKERBSA-N 0.000 description 1
- YLDSJJOGQNEQJK-AVGNSLFASA-N Met-Pro-Leu Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YLDSJJOGQNEQJK-AVGNSLFASA-N 0.000 description 1
- XPVCDCMPKCERFT-GUBZILKMSA-N Met-Ser-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XPVCDCMPKCERFT-GUBZILKMSA-N 0.000 description 1
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 1
- ZDJICAUBMUKVEJ-CIUDSAMLSA-N Met-Ser-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O ZDJICAUBMUKVEJ-CIUDSAMLSA-N 0.000 description 1
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 1
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 1
- GMMLGMFBYCFCCX-KZVJFYERSA-N Met-Thr-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMMLGMFBYCFCCX-KZVJFYERSA-N 0.000 description 1
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 1
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 1
- YIGCDRZMZNDENK-UNQGMJICSA-N Met-Thr-Phe Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YIGCDRZMZNDENK-UNQGMJICSA-N 0.000 description 1
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 1
- NSMXRFMGZYTFEX-KJEVXHAQSA-N Met-Thr-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCSC)N)O NSMXRFMGZYTFEX-KJEVXHAQSA-N 0.000 description 1
- UZBQXELAFPCGRV-SZMVWBNQSA-N Met-Trp-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZBQXELAFPCGRV-SZMVWBNQSA-N 0.000 description 1
- HOTNHEUETJELDL-BPNCWPANSA-N Met-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N HOTNHEUETJELDL-BPNCWPANSA-N 0.000 description 1
- FSTWDRPCQQUJIT-NHCYSSNCSA-N Met-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N FSTWDRPCQQUJIT-NHCYSSNCSA-N 0.000 description 1
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 1
- JACMWNXOOUYXCD-JYJNAYRXSA-N Met-Val-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JACMWNXOOUYXCD-JYJNAYRXSA-N 0.000 description 1
- LBSWWNKMVPAXOI-GUBZILKMSA-N Met-Val-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O LBSWWNKMVPAXOI-GUBZILKMSA-N 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 108010001212 Munc18 Proteins Proteins 0.000 description 1
- 102000002069 Munc18 Proteins Human genes 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 101150081841 NBN gene Proteins 0.000 description 1
- 101100439689 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) chs-4 gene Proteins 0.000 description 1
- 101100476756 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) sec-61 gene Proteins 0.000 description 1
- 208000004485 Nijmegen breakage syndrome Diseases 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 101710127639 Non-homologous end-joining factor 1 Proteins 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108010035916 Nuclear Matrix-Associated Proteins Proteins 0.000 description 1
- 102000008297 Nuclear Matrix-Associated Proteins Human genes 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- LSXGADJXBDFXQU-DLOVCJGASA-N Phe-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 1
- AJOKKVTWEMXZHC-DRZSPHRISA-N Phe-Ala-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 AJOKKVTWEMXZHC-DRZSPHRISA-N 0.000 description 1
- DFEVBOYEUQJGER-JURCDPSOSA-N Phe-Ala-Ile Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O DFEVBOYEUQJGER-JURCDPSOSA-N 0.000 description 1
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 1
- VHWOBXIWBDWZHK-IHRRRGAJSA-N Phe-Arg-Asp Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 VHWOBXIWBDWZHK-IHRRRGAJSA-N 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 1
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 1
- WGXOKDLDIWSOCV-MELADBBJSA-N Phe-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O WGXOKDLDIWSOCV-MELADBBJSA-N 0.000 description 1
- HTKNPQZCMLBOTQ-XVSYOHENSA-N Phe-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O HTKNPQZCMLBOTQ-XVSYOHENSA-N 0.000 description 1
- ZENDEDYRYVHBEG-SRVKXCTJSA-N Phe-Asp-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZENDEDYRYVHBEG-SRVKXCTJSA-N 0.000 description 1
- UEEVBGHEGJMDDV-AVGNSLFASA-N Phe-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEEVBGHEGJMDDV-AVGNSLFASA-N 0.000 description 1
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 1
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 1
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 1
- ALHULIGNEXGFRM-QWRGUYRKSA-N Phe-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=CC=C1 ALHULIGNEXGFRM-QWRGUYRKSA-N 0.000 description 1
- IILUKIJNFMUBNF-IHRRRGAJSA-N Phe-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O IILUKIJNFMUBNF-IHRRRGAJSA-N 0.000 description 1
- YEEFZOKPYOUXMX-KKUMJFAQSA-N Phe-Gln-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YEEFZOKPYOUXMX-KKUMJFAQSA-N 0.000 description 1
- ABQFNJAFONNUTH-FHWLQOOXSA-N Phe-Gln-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N ABQFNJAFONNUTH-FHWLQOOXSA-N 0.000 description 1
- MFQXSDWKUXTOPZ-DZKIICNBSA-N Phe-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N MFQXSDWKUXTOPZ-DZKIICNBSA-N 0.000 description 1
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 1
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 1
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- JWQWPTLEOFNCGX-AVGNSLFASA-N Phe-Glu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWQWPTLEOFNCGX-AVGNSLFASA-N 0.000 description 1
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 1
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 1
- SWCOXQLDICUYOL-ULQDDVLXSA-N Phe-His-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SWCOXQLDICUYOL-ULQDDVLXSA-N 0.000 description 1
- FXYXBEZMRACDDR-KKUMJFAQSA-N Phe-His-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O FXYXBEZMRACDDR-KKUMJFAQSA-N 0.000 description 1
- VADLTGVIOIOKGM-BZSNNMDCSA-N Phe-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CN=CN1 VADLTGVIOIOKGM-BZSNNMDCSA-N 0.000 description 1
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 1
- DZVXMMSUWWUIQE-ACRUOGEOSA-N Phe-His-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N DZVXMMSUWWUIQE-ACRUOGEOSA-N 0.000 description 1
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 1
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 1
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 1
- BWTKUQPNOMMKMA-FIRPJDEBSA-N Phe-Ile-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BWTKUQPNOMMKMA-FIRPJDEBSA-N 0.000 description 1
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 1
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 1
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 1
- KNYPNEYICHHLQL-ACRUOGEOSA-N Phe-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 KNYPNEYICHHLQL-ACRUOGEOSA-N 0.000 description 1
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 1
- AUJWXNGCAQWLEI-KBPBESRZSA-N Phe-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AUJWXNGCAQWLEI-KBPBESRZSA-N 0.000 description 1
- SCKXGHWQPPURGT-KKUMJFAQSA-N Phe-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O SCKXGHWQPPURGT-KKUMJFAQSA-N 0.000 description 1
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 1
- QRUOLOPKCOEZKU-HJWJTTGWSA-N Phe-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N QRUOLOPKCOEZKU-HJWJTTGWSA-N 0.000 description 1
- FQUUYTNBMIBOHS-IHRRRGAJSA-N Phe-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FQUUYTNBMIBOHS-IHRRRGAJSA-N 0.000 description 1
- OXKJSGGTHFMGDT-UFYCRDLUSA-N Phe-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C1=CC=CC=C1 OXKJSGGTHFMGDT-UFYCRDLUSA-N 0.000 description 1
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 1
- RYQWALWYQWBUKN-FHWLQOOXSA-N Phe-Phe-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RYQWALWYQWBUKN-FHWLQOOXSA-N 0.000 description 1
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 1
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 1
- GRVMHFCZUIYNKQ-UFYCRDLUSA-N Phe-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GRVMHFCZUIYNKQ-UFYCRDLUSA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 1
- XOHJOMKCRLHGCY-UNQGMJICSA-N Phe-Pro-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOHJOMKCRLHGCY-UNQGMJICSA-N 0.000 description 1
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 1
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 1
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 1
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 1
- XNQMZHLAYFWSGJ-HTUGSXCWSA-N Phe-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XNQMZHLAYFWSGJ-HTUGSXCWSA-N 0.000 description 1
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 1
- APECKGGXAXNFLL-RNXOBYDBSA-N Phe-Trp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 APECKGGXAXNFLL-RNXOBYDBSA-N 0.000 description 1
- QTDBZORPVYTRJU-KKXDTOCCSA-N Phe-Tyr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O QTDBZORPVYTRJU-KKXDTOCCSA-N 0.000 description 1
- ZYNBEWGJFXTBDU-ACRUOGEOSA-N Phe-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N ZYNBEWGJFXTBDU-ACRUOGEOSA-N 0.000 description 1
- ZTVSVSFBHUVYIN-UFYCRDLUSA-N Phe-Tyr-Met Chemical compound C([C@@H](C(=O)N[C@@H](CCSC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=C(O)C=C1 ZTVSVSFBHUVYIN-UFYCRDLUSA-N 0.000 description 1
- MHNBYYFXWDUGBW-RPTUDFQQSA-N Phe-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O MHNBYYFXWDUGBW-RPTUDFQQSA-N 0.000 description 1
- CDHURCQGUDNBMA-UBHSHLNASA-N Phe-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDHURCQGUDNBMA-UBHSHLNASA-N 0.000 description 1
- GLUYKHMBGKQBHE-JYJNAYRXSA-N Phe-Val-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 GLUYKHMBGKQBHE-JYJNAYRXSA-N 0.000 description 1
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 1
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 1
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 1
- VDTYRPWRWRCROL-UFYCRDLUSA-N Phe-Val-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VDTYRPWRWRCROL-UFYCRDLUSA-N 0.000 description 1
- VIIRRNQMMIHYHQ-XHSDSOJGSA-N Phe-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N VIIRRNQMMIHYHQ-XHSDSOJGSA-N 0.000 description 1
- APZNYJFGVAGFCF-JYJNAYRXSA-N Phe-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccccc1)C(C)C)C(O)=O APZNYJFGVAGFCF-JYJNAYRXSA-N 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 108010061844 Poly(ADP-ribose) Polymerases Proteins 0.000 description 1
- 102000012338 Poly(ADP-ribose) Polymerases Human genes 0.000 description 1
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 1
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 1
- AJLVKXCNXIJHDV-CIUDSAMLSA-N Pro-Ala-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O AJLVKXCNXIJHDV-CIUDSAMLSA-N 0.000 description 1
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 1
- ONPFOYPPPOHMNH-UVBJJODRSA-N Pro-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@@H]3CCCN3 ONPFOYPPPOHMNH-UVBJJODRSA-N 0.000 description 1
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 1
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 1
- KDIIENQUNVNWHR-JYJNAYRXSA-N Pro-Arg-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KDIIENQUNVNWHR-JYJNAYRXSA-N 0.000 description 1
- ORPZXBQTEHINPB-SRVKXCTJSA-N Pro-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1)C(O)=O ORPZXBQTEHINPB-SRVKXCTJSA-N 0.000 description 1
- SMCHPSMKAFIERP-FXQIFTODSA-N Pro-Asn-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 SMCHPSMKAFIERP-FXQIFTODSA-N 0.000 description 1
- AHXPYZRZRMQOAU-QXEWZRGKSA-N Pro-Asn-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1)C(O)=O AHXPYZRZRMQOAU-QXEWZRGKSA-N 0.000 description 1
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 1
- ILMLVTGTUJPQFP-FXQIFTODSA-N Pro-Asp-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ILMLVTGTUJPQFP-FXQIFTODSA-N 0.000 description 1
- GDXZRWYXJSGWIV-GMOBBJLQSA-N Pro-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 GDXZRWYXJSGWIV-GMOBBJLQSA-N 0.000 description 1
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 1
- YKQNVTOIYFQMLW-IHRRRGAJSA-N Pro-Cys-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 YKQNVTOIYFQMLW-IHRRRGAJSA-N 0.000 description 1
- ODPIUQVTULPQEP-CIUDSAMLSA-N Pro-Gln-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ODPIUQVTULPQEP-CIUDSAMLSA-N 0.000 description 1
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 1
- DRIJZWBRGMJCDD-DCAQKATOSA-N Pro-Gln-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O DRIJZWBRGMJCDD-DCAQKATOSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 1
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 1
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- FFSLAIOXRMOFIZ-GJZGRUSLSA-N Pro-Gly-Trp Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)O)C(=O)CNC(=O)[C@@H]1CCCN1 FFSLAIOXRMOFIZ-GJZGRUSLSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 1
- XQHGISDMVBTGAL-ULQDDVLXSA-N Pro-His-Phe Chemical compound C([C@@H](C(=O)[O-])NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H]1[NH2+]CCC1)C1=CC=CC=C1 XQHGISDMVBTGAL-ULQDDVLXSA-N 0.000 description 1
- LXLFEIHKWGHJJB-XUXIUFHCSA-N Pro-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 LXLFEIHKWGHJJB-XUXIUFHCSA-N 0.000 description 1
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 1
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 1
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 1
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 1
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 1
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 1
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 1
- YAZNFQUKPUASKB-DCAQKATOSA-N Pro-Lys-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O YAZNFQUKPUASKB-DCAQKATOSA-N 0.000 description 1
- WFIVLLFYUZZWOD-RHYQMDGZSA-N Pro-Lys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WFIVLLFYUZZWOD-RHYQMDGZSA-N 0.000 description 1
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 1
- LGMBKOAPPTYKLC-JYJNAYRXSA-N Pro-Phe-Arg Chemical compound C([C@@H](C(=O)N[C@@H](CCCNC(=N)N)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 LGMBKOAPPTYKLC-JYJNAYRXSA-N 0.000 description 1
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 1
- MHBSUKYVBZVQRW-HJWJTTGWSA-N Pro-Phe-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MHBSUKYVBZVQRW-HJWJTTGWSA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- ZVEQWRWMRFIVSD-HRCADAONSA-N Pro-Phe-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N3CCC[C@@H]3C(=O)O ZVEQWRWMRFIVSD-HRCADAONSA-N 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- QAAYIXYLEMRULP-SRVKXCTJSA-N Pro-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 QAAYIXYLEMRULP-SRVKXCTJSA-N 0.000 description 1
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 1
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 1
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 1
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 1
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 1
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- XSXABUHLKPUVLX-JYJNAYRXSA-N Pro-Ser-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O XSXABUHLKPUVLX-JYJNAYRXSA-N 0.000 description 1
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 1
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 1
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 1
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 1
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 1
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 1
- GNFHQWNCSSPOBT-ULQDDVLXSA-N Pro-Trp-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCC(=O)N)C(=O)O GNFHQWNCSSPOBT-ULQDDVLXSA-N 0.000 description 1
- VGFFUEVZKRNRHT-ULQDDVLXSA-N Pro-Trp-Glu Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCC(=O)O)C(=O)O VGFFUEVZKRNRHT-ULQDDVLXSA-N 0.000 description 1
- YIPFBJGBRCJJJD-FHWLQOOXSA-N Pro-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 YIPFBJGBRCJJJD-FHWLQOOXSA-N 0.000 description 1
- VPBQDHMASPJHGY-JYJNAYRXSA-N Pro-Trp-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CO)C(=O)O VPBQDHMASPJHGY-JYJNAYRXSA-N 0.000 description 1
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 1
- WWXNZNWZNZPDIF-SRVKXCTJSA-N Pro-Val-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 WWXNZNWZNZPDIF-SRVKXCTJSA-N 0.000 description 1
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 1
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 1
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 1
- 102100037097 Protein disulfide-isomerase A3 Human genes 0.000 description 1
- 101710106224 Protein disulfide-isomerase A3 Proteins 0.000 description 1
- 102000016227 Protein disulphide isomerases Human genes 0.000 description 1
- 108050004742 Protein disulphide isomerases Proteins 0.000 description 1
- 102100036306 Protein transport protein Sec61 subunit gamma Human genes 0.000 description 1
- 238000001190 Q-PCR Methods 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 1
- 241000700157 Rattus norvegicus Species 0.000 description 1
- 101710197208 Regulatory protein cro Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 108010091732 SEC Translocation Channels Proteins 0.000 description 1
- 102000018673 SEC Translocation Channels Human genes 0.000 description 1
- CGNLCCVKSWNSDG-UHFFFAOYSA-N SYBR Green I Chemical compound CN(C)CCCN(CCC)C1=CC(C=C2N(C3=CC=CC=C3S2)C)=C2C=CC=CC2=[N+]1C1=CC=CC=C1 CGNLCCVKSWNSDG-UHFFFAOYSA-N 0.000 description 1
- 101100111629 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) KAR2 gene Proteins 0.000 description 1
- 101150084362 Sec61a1 gene Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- BKOKTRCZXRIQPX-ZLUOBGJFSA-N Ser-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N BKOKTRCZXRIQPX-ZLUOBGJFSA-N 0.000 description 1
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 1
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- INCNPLPRPOYTJI-JBDRJPRFSA-N Ser-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N INCNPLPRPOYTJI-JBDRJPRFSA-N 0.000 description 1
- DSSOYPJWSWFOLK-CIUDSAMLSA-N Ser-Cys-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O DSSOYPJWSWFOLK-CIUDSAMLSA-N 0.000 description 1
- RFBKULCUBJAQFT-BIIVOSGPSA-N Ser-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CO)N)C(=O)O RFBKULCUBJAQFT-BIIVOSGPSA-N 0.000 description 1
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 1
- XWCYBVBLJRWOFR-WDSKDSINSA-N Ser-Gln-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O XWCYBVBLJRWOFR-WDSKDSINSA-N 0.000 description 1
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 1
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 1
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 1
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 1
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- GRSLLFZTTLBOQX-CIUDSAMLSA-N Ser-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N GRSLLFZTTLBOQX-CIUDSAMLSA-N 0.000 description 1
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- SVWQEIRZHHNBIO-WHFBIAKZSA-N Ser-Gly-Cys Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CS)C(O)=O SVWQEIRZHHNBIO-WHFBIAKZSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- CXBFHZLODKPIJY-AAEUAGOBSA-N Ser-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N CXBFHZLODKPIJY-AAEUAGOBSA-N 0.000 description 1
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 1
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 1
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 1
- AMRRYKHCILPAKD-FXQIFTODSA-N Ser-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N AMRRYKHCILPAKD-FXQIFTODSA-N 0.000 description 1
- NIOYDASGXWLHEZ-CIUDSAMLSA-N Ser-Met-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOYDASGXWLHEZ-CIUDSAMLSA-N 0.000 description 1
- IFLVBVIYADZIQO-DCAQKATOSA-N Ser-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N IFLVBVIYADZIQO-DCAQKATOSA-N 0.000 description 1
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 1
- ASGYVPAVFNDZMA-GUBZILKMSA-N Ser-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N ASGYVPAVFNDZMA-GUBZILKMSA-N 0.000 description 1
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 1
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 1
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 1
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 1
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 1
- MHVXPTAMDHLTHB-IHPCNDPISA-N Ser-Phe-Trp Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 MHVXPTAMDHLTHB-IHPCNDPISA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 1
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 1
- NMZXJDSKEGFDLJ-DCAQKATOSA-N Ser-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CCCCN)C(=O)O NMZXJDSKEGFDLJ-DCAQKATOSA-N 0.000 description 1
- QUGRFWPMPVIAPW-IHRRRGAJSA-N Ser-Pro-Phe Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QUGRFWPMPVIAPW-IHRRRGAJSA-N 0.000 description 1
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 1
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 1
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 1
- HKHCTNFKZXAMIF-KKUMJFAQSA-N Ser-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=C(O)C=C1 HKHCTNFKZXAMIF-KKUMJFAQSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 1
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 1
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 1
- LSHUNRICNSEEAN-BPUTZDHNSA-N Ser-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CO)N LSHUNRICNSEEAN-BPUTZDHNSA-N 0.000 description 1
- ODRUTDLAONAVDV-IHRRRGAJSA-N Ser-Val-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ODRUTDLAONAVDV-IHRRRGAJSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- 102000003838 Sialyltransferases Human genes 0.000 description 1
- 108090000141 Sialyltransferases Proteins 0.000 description 1
- 108091061750 Signal recognition particle RNA Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 101150006914 TRP1 gene Proteins 0.000 description 1
- 241000255588 Tephritidae Species 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- DFTCYYILCSQGIZ-GCJQMDKQSA-N Thr-Ala-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFTCYYILCSQGIZ-GCJQMDKQSA-N 0.000 description 1
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 1
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 1
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 1
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 1
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 1
- XDARBNMYXKUFOJ-GSSVUCPTSA-N Thr-Asp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDARBNMYXKUFOJ-GSSVUCPTSA-N 0.000 description 1
- ASJDFGOPDCVXTG-KATARQTJSA-N Thr-Cys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ASJDFGOPDCVXTG-KATARQTJSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 1
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 1
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 1
- BIENEHRYNODTLP-HJGDQZAQSA-N Thr-Glu-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N)O BIENEHRYNODTLP-HJGDQZAQSA-N 0.000 description 1
- OQCXTUQTKQFDCX-HTUGSXCWSA-N Thr-Glu-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O OQCXTUQTKQFDCX-HTUGSXCWSA-N 0.000 description 1
- VULNJDORNLBPNG-SWRJLBSHSA-N Thr-Glu-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VULNJDORNLBPNG-SWRJLBSHSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- VUSAEKOXGNEYNE-PBCZWWQYSA-N Thr-His-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VUSAEKOXGNEYNE-PBCZWWQYSA-N 0.000 description 1
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 1
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- WPAKPLPGQNUXGN-OSUNSFLBSA-N Thr-Ile-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WPAKPLPGQNUXGN-OSUNSFLBSA-N 0.000 description 1
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 1
- LCCSEJSPBWKBNT-OSUNSFLBSA-N Thr-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N LCCSEJSPBWKBNT-OSUNSFLBSA-N 0.000 description 1
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 1
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- JLNMFGCJODTXDH-WEDXCCLWSA-N Thr-Lys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O JLNMFGCJODTXDH-WEDXCCLWSA-N 0.000 description 1
- ZXIHABSKUITPTN-IXOXFDKPSA-N Thr-Lys-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O ZXIHABSKUITPTN-IXOXFDKPSA-N 0.000 description 1
- WFAUDCSNCWJJAA-KXNHARMFSA-N Thr-Lys-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(O)=O WFAUDCSNCWJJAA-KXNHARMFSA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 1
- XNTVWRJTUIOGQO-RHYQMDGZSA-N Thr-Met-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNTVWRJTUIOGQO-RHYQMDGZSA-N 0.000 description 1
- KDGBLMDAPJTQIW-RHYQMDGZSA-N Thr-Met-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N)O KDGBLMDAPJTQIW-RHYQMDGZSA-N 0.000 description 1
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 1
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 1
- JMBRNXUOLJFURW-BEAPCOKYSA-N Thr-Phe-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N)O JMBRNXUOLJFURW-BEAPCOKYSA-N 0.000 description 1
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 1
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 1
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 1
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 1
- YGZWVPBHYABGLT-KJEVXHAQSA-N Thr-Pro-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YGZWVPBHYABGLT-KJEVXHAQSA-N 0.000 description 1
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 1
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 1
- XZUBGOYOGDRYFC-XGEHTFHBSA-N Thr-Ser-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O XZUBGOYOGDRYFC-XGEHTFHBSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- TZQWJCGVCIJDMU-HEIBUPTGSA-N Thr-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)O)N)O TZQWJCGVCIJDMU-HEIBUPTGSA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- PJCYRZVSACOYSN-ZJDVBMNYSA-N Thr-Thr-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O PJCYRZVSACOYSN-ZJDVBMNYSA-N 0.000 description 1
- GRIUMVXCJDKVPI-IZPVPAKOSA-N Thr-Thr-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GRIUMVXCJDKVPI-IZPVPAKOSA-N 0.000 description 1
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 1
- GJOBRAHDRIDAPT-NGTWOADLSA-N Thr-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H]([C@@H](C)O)N GJOBRAHDRIDAPT-NGTWOADLSA-N 0.000 description 1
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 1
- ABCLYRRGTZNIFU-BWAGICSOSA-N Thr-Tyr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O ABCLYRRGTZNIFU-BWAGICSOSA-N 0.000 description 1
- XVHAUVJXBFGUPC-RPTUDFQQSA-N Thr-Tyr-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XVHAUVJXBFGUPC-RPTUDFQQSA-N 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 1
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 1
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 1
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 1
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- VKMOGXREKGVZAF-QEJZJMRPSA-N Trp-Asp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VKMOGXREKGVZAF-QEJZJMRPSA-N 0.000 description 1
- WQYPAGQDXAJNED-AAEUAGOBSA-N Trp-Cys-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N WQYPAGQDXAJNED-AAEUAGOBSA-N 0.000 description 1
- PFCQMGDEHBTIIM-JYBASQMISA-N Trp-Cys-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@H](O)C)C(O)=O)=CNC2=C1 PFCQMGDEHBTIIM-JYBASQMISA-N 0.000 description 1
- XZLHHHYSWIYXHD-XIRDDKMYSA-N Trp-Gln-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XZLHHHYSWIYXHD-XIRDDKMYSA-N 0.000 description 1
- WPSYJHFHZYJXMW-JSGCOSHPSA-N Trp-Gln-Gly Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O WPSYJHFHZYJXMW-JSGCOSHPSA-N 0.000 description 1
- CZWIHKFGHICAJX-BPUTZDHNSA-N Trp-Glu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 CZWIHKFGHICAJX-BPUTZDHNSA-N 0.000 description 1
- DZIKVMCFXIIETR-JSGCOSHPSA-N Trp-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O DZIKVMCFXIIETR-JSGCOSHPSA-N 0.000 description 1
- RPVDDQYNBOVWLR-HOCLYGCPSA-N Trp-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RPVDDQYNBOVWLR-HOCLYGCPSA-N 0.000 description 1
- WLBZWXXGSOLJBA-HOCLYGCPSA-N Trp-Gly-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 WLBZWXXGSOLJBA-HOCLYGCPSA-N 0.000 description 1
- CXPJPTFWKXNDKV-NUTKFTJISA-N Trp-Leu-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CXPJPTFWKXNDKV-NUTKFTJISA-N 0.000 description 1
- OGZRZMJASKKMJZ-XIRDDKMYSA-N Trp-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N OGZRZMJASKKMJZ-XIRDDKMYSA-N 0.000 description 1
- IQXWAJUIAQLZNX-IHPCNDPISA-N Trp-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N IQXWAJUIAQLZNX-IHPCNDPISA-N 0.000 description 1
- YLGQHMHKAASRGJ-WDSOQIARSA-N Trp-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N YLGQHMHKAASRGJ-WDSOQIARSA-N 0.000 description 1
- RWAYYYOZMHMEGD-XIRDDKMYSA-N Trp-Leu-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 RWAYYYOZMHMEGD-XIRDDKMYSA-N 0.000 description 1
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 1
- NLLARHRWSFNEMH-NUTKFTJISA-N Trp-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NLLARHRWSFNEMH-NUTKFTJISA-N 0.000 description 1
- OSYOKZZRVGUDMO-HSCHXYMDSA-N Trp-Lys-Ile Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OSYOKZZRVGUDMO-HSCHXYMDSA-N 0.000 description 1
- VDUJEEQMRQCLHB-YTQUADARSA-N Trp-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O VDUJEEQMRQCLHB-YTQUADARSA-N 0.000 description 1
- WKQNLTQSCYXKQK-VFAJRCTISA-N Trp-Lys-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WKQNLTQSCYXKQK-VFAJRCTISA-N 0.000 description 1
- TUUXFNQXSFNFLX-XIRDDKMYSA-N Trp-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N TUUXFNQXSFNFLX-XIRDDKMYSA-N 0.000 description 1
- PWPJLBWYRTVYQS-PMVMPFDFSA-N Trp-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PWPJLBWYRTVYQS-PMVMPFDFSA-N 0.000 description 1
- UQHPXCFAHVTWFU-BVSLBCMMSA-N Trp-Phe-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UQHPXCFAHVTWFU-BVSLBCMMSA-N 0.000 description 1
- UHXOYRWHIQZAKV-SZMVWBNQSA-N Trp-Pro-Arg Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O UHXOYRWHIQZAKV-SZMVWBNQSA-N 0.000 description 1
- RNDWCRUOGGQDKN-UBHSHLNASA-N Trp-Ser-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RNDWCRUOGGQDKN-UBHSHLNASA-N 0.000 description 1
- PKZIWSHDJYIPRH-JBACZVJFSA-N Trp-Tyr-Gln Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKZIWSHDJYIPRH-JBACZVJFSA-N 0.000 description 1
- JYLWCVVMDGNZGD-WIRXVTQYSA-N Trp-Tyr-Trp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JYLWCVVMDGNZGD-WIRXVTQYSA-N 0.000 description 1
- PALLCTDPFINNMM-JQHSSLGASA-N Trp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N PALLCTDPFINNMM-JQHSSLGASA-N 0.000 description 1
- BABINGWMZBWXIX-BPUTZDHNSA-N Trp-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N BABINGWMZBWXIX-BPUTZDHNSA-N 0.000 description 1
- MXKUGFHWYYKVDV-SZMVWBNQSA-N Trp-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(C)C)C(O)=O MXKUGFHWYYKVDV-SZMVWBNQSA-N 0.000 description 1
- HKIUVWMZYFBIHG-KKUMJFAQSA-N Tyr-Arg-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O HKIUVWMZYFBIHG-KKUMJFAQSA-N 0.000 description 1
- AKXBNSZMYAOGLS-STQMWFEESA-N Tyr-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AKXBNSZMYAOGLS-STQMWFEESA-N 0.000 description 1
- DYEGCOJHFNJBKB-UFYCRDLUSA-N Tyr-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 DYEGCOJHFNJBKB-UFYCRDLUSA-N 0.000 description 1
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 1
- ZNFPUOSTMUMUDR-JRQIVUDYSA-N Tyr-Asn-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZNFPUOSTMUMUDR-JRQIVUDYSA-N 0.000 description 1
- NSTPFWRAIDTNGH-BZSNNMDCSA-N Tyr-Asn-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NSTPFWRAIDTNGH-BZSNNMDCSA-N 0.000 description 1
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 1
- NRFTYDWKWGJLAR-MELADBBJSA-N Tyr-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O NRFTYDWKWGJLAR-MELADBBJSA-N 0.000 description 1
- ARPONUQDNWLXOZ-KKUMJFAQSA-N Tyr-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ARPONUQDNWLXOZ-KKUMJFAQSA-N 0.000 description 1
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 1
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 1
- MPKPIWFFDWVJGC-IRIUXVKKSA-N Tyr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O MPKPIWFFDWVJGC-IRIUXVKKSA-N 0.000 description 1
- WAPFQMXRSDEGOE-IHRRRGAJSA-N Tyr-Glu-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O WAPFQMXRSDEGOE-IHRRRGAJSA-N 0.000 description 1
- LMLBOGIOLHZXOT-JYJNAYRXSA-N Tyr-Glu-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O LMLBOGIOLHZXOT-JYJNAYRXSA-N 0.000 description 1
- NZFCWALTLNFHHC-JYJNAYRXSA-N Tyr-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NZFCWALTLNFHHC-JYJNAYRXSA-N 0.000 description 1
- SLCSPPCQWUHPPO-JYJNAYRXSA-N Tyr-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SLCSPPCQWUHPPO-JYJNAYRXSA-N 0.000 description 1
- FMOSEWZYZPMJAL-KKUMJFAQSA-N Tyr-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N FMOSEWZYZPMJAL-KKUMJFAQSA-N 0.000 description 1
- LHTGRUZSZOIAKM-SOUVJXGZSA-N Tyr-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O LHTGRUZSZOIAKM-SOUVJXGZSA-N 0.000 description 1
- GIOBXJSONRQHKQ-RYUDHWBXSA-N Tyr-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GIOBXJSONRQHKQ-RYUDHWBXSA-N 0.000 description 1
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 1
- ADECJAKCRKPSOR-ULQDDVLXSA-N Tyr-His-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O ADECJAKCRKPSOR-ULQDDVLXSA-N 0.000 description 1
- FBHBVXUBTYVCRU-BZSNNMDCSA-N Tyr-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CN=CN1 FBHBVXUBTYVCRU-BZSNNMDCSA-N 0.000 description 1
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 1
- HFJJDMOFTCQGEI-STECZYCISA-N Tyr-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HFJJDMOFTCQGEI-STECZYCISA-N 0.000 description 1
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 1
- WDGDKHLSDIOXQC-ACRUOGEOSA-N Tyr-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WDGDKHLSDIOXQC-ACRUOGEOSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- OLYXUGBVBGSZDN-ACRUOGEOSA-N Tyr-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 OLYXUGBVBGSZDN-ACRUOGEOSA-N 0.000 description 1
- CDKZJGMPZHPAJC-ULQDDVLXSA-N Tyr-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDKZJGMPZHPAJC-ULQDDVLXSA-N 0.000 description 1
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 1
- KGSDLCMCDFETHU-YESZJQIVSA-N Tyr-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O KGSDLCMCDFETHU-YESZJQIVSA-N 0.000 description 1
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 1
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 1
- OGPKMBOPMDTEDM-IHRRRGAJSA-N Tyr-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N OGPKMBOPMDTEDM-IHRRRGAJSA-N 0.000 description 1
- FDKDGFGTHGJKNV-FHWLQOOXSA-N Tyr-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FDKDGFGTHGJKNV-FHWLQOOXSA-N 0.000 description 1
- LRHBBGDMBLFYGL-FHWLQOOXSA-N Tyr-Phe-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LRHBBGDMBLFYGL-FHWLQOOXSA-N 0.000 description 1
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 1
- NVZVJIUDICCMHZ-BZSNNMDCSA-N Tyr-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O NVZVJIUDICCMHZ-BZSNNMDCSA-N 0.000 description 1
- SOEGLGLDSUHWTI-STECZYCISA-N Tyr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 SOEGLGLDSUHWTI-STECZYCISA-N 0.000 description 1
- BIWVVOHTKDLRMP-ULQDDVLXSA-N Tyr-Pro-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BIWVVOHTKDLRMP-ULQDDVLXSA-N 0.000 description 1
- RWOKVQUCENPXGE-IHRRRGAJSA-N Tyr-Ser-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RWOKVQUCENPXGE-IHRRRGAJSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 1
- XUIOBCQESNDTDE-FQPOAREZSA-N Tyr-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XUIOBCQESNDTDE-FQPOAREZSA-N 0.000 description 1
- UUBKSZNKJUJQEJ-JRQIVUDYSA-N Tyr-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UUBKSZNKJUJQEJ-JRQIVUDYSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- AFWXOGHZEKARFH-ACRUOGEOSA-N Tyr-Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=C(O)C=C1 AFWXOGHZEKARFH-ACRUOGEOSA-N 0.000 description 1
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 1
- TYGHOWWWMTWVKM-HJOGWXRNSA-N Tyr-Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 TYGHOWWWMTWVKM-HJOGWXRNSA-N 0.000 description 1
- UUJHRSTVQCFDPA-UFYCRDLUSA-N Tyr-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 UUJHRSTVQCFDPA-UFYCRDLUSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- NWEGIYMHTZXVBP-JSGCOSHPSA-N Tyr-Val-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O NWEGIYMHTZXVBP-JSGCOSHPSA-N 0.000 description 1
- VKYDVKAKGDNZED-STECZYCISA-N Tyr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N VKYDVKAKGDNZED-STECZYCISA-N 0.000 description 1
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 1
- GOPQNCQSXBJAII-ULQDDVLXSA-N Tyr-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GOPQNCQSXBJAII-ULQDDVLXSA-N 0.000 description 1
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 1
- JFAWZADYPRMRCO-UBHSHLNASA-N Val-Ala-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JFAWZADYPRMRCO-UBHSHLNASA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- PFNZJEPSCBAVGX-CYDGBPFRSA-N Val-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N PFNZJEPSCBAVGX-CYDGBPFRSA-N 0.000 description 1
- IVXJODPZRWHCCR-JYJNAYRXSA-N Val-Arg-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IVXJODPZRWHCCR-JYJNAYRXSA-N 0.000 description 1
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 1
- DNOOLPROHJWCSQ-RCWTZXSCSA-N Val-Arg-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DNOOLPROHJWCSQ-RCWTZXSCSA-N 0.000 description 1
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- GNWUWQAVVJQREM-NHCYSSNCSA-N Val-Asn-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GNWUWQAVVJQREM-NHCYSSNCSA-N 0.000 description 1
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 1
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 1
- CJDZKZFMAXGUOJ-IHRRRGAJSA-N Val-Cys-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CJDZKZFMAXGUOJ-IHRRRGAJSA-N 0.000 description 1
- OUUBKKIJQIAPRI-LAEOZQHASA-N Val-Gln-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OUUBKKIJQIAPRI-LAEOZQHASA-N 0.000 description 1
- QHFQQRKNGCXTHL-AUTRQRHGSA-N Val-Gln-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QHFQQRKNGCXTHL-AUTRQRHGSA-N 0.000 description 1
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 1
- AGKDVLSDNSTLFA-UMNHJUIQSA-N Val-Gln-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N AGKDVLSDNSTLFA-UMNHJUIQSA-N 0.000 description 1
- AAOPYWQQBXHINJ-DZKIICNBSA-N Val-Gln-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AAOPYWQQBXHINJ-DZKIICNBSA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 1
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 1
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 1
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 1
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- WFENBJPLZMPVAX-XVKPBYJWSA-N Val-Gly-Glu Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O WFENBJPLZMPVAX-XVKPBYJWSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 1
- DHINLYMWMXQGMQ-IHRRRGAJSA-N Val-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 DHINLYMWMXQGMQ-IHRRRGAJSA-N 0.000 description 1
- HQYVQDRYODWONX-DCAQKATOSA-N Val-His-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N HQYVQDRYODWONX-DCAQKATOSA-N 0.000 description 1
- PYPZMFDMCCWNST-NAKRPEOUSA-N Val-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N PYPZMFDMCCWNST-NAKRPEOUSA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- PYXQBKJPHNCTNW-CYDGBPFRSA-N Val-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N PYXQBKJPHNCTNW-CYDGBPFRSA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- ZZGPVSZDZQRJQY-ULQDDVLXSA-N Val-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZZGPVSZDZQRJQY-ULQDDVLXSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- RFKJNTRMXGCKFE-FHWLQOOXSA-N Val-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC(C)C)C(O)=O)=CNC2=C1 RFKJNTRMXGCKFE-FHWLQOOXSA-N 0.000 description 1
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 1
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 1
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 1
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 1
- OFQGGTGZTOTLGH-NHCYSSNCSA-N Val-Met-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N OFQGGTGZTOTLGH-NHCYSSNCSA-N 0.000 description 1
- YDVDTCJGBBJGRT-GUBZILKMSA-N Val-Met-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N YDVDTCJGBBJGRT-GUBZILKMSA-N 0.000 description 1
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 1
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- JMCOXFSCTGKLLB-FKBYEOEOSA-N Val-Phe-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JMCOXFSCTGKLLB-FKBYEOEOSA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- DLLRRUDLMSJTMB-GUBZILKMSA-N Val-Ser-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N DLLRRUDLMSJTMB-GUBZILKMSA-N 0.000 description 1
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 1
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 1
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 1
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 1
- YLBNZCJFSVJDRJ-KJEVXHAQSA-N Val-Thr-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O YLBNZCJFSVJDRJ-KJEVXHAQSA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- SUGRIIAOLCDLBD-ZOBUZTSGSA-N Val-Trp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SUGRIIAOLCDLBD-ZOBUZTSGSA-N 0.000 description 1
- UFCHCOKFAGOQSF-BQFCYCMXSA-N Val-Trp-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N UFCHCOKFAGOQSF-BQFCYCMXSA-N 0.000 description 1
- QTXGUIMEHKCPBH-FHWLQOOXSA-N Val-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 QTXGUIMEHKCPBH-FHWLQOOXSA-N 0.000 description 1
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 1
- CFIBZQOLUDURST-IHRRRGAJSA-N Val-Tyr-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CS)C(=O)O)N CFIBZQOLUDURST-IHRRRGAJSA-N 0.000 description 1
- GTACFKZDQFTVAI-STECZYCISA-N Val-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 GTACFKZDQFTVAI-STECZYCISA-N 0.000 description 1
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 1
- PGBMPFKFKXYROZ-UFYCRDLUSA-N Val-Tyr-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N PGBMPFKFKXYROZ-UFYCRDLUSA-N 0.000 description 1
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 1
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 1
- ZNGPROMGGGFOAA-JYJNAYRXSA-N Val-Tyr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 ZNGPROMGGGFOAA-JYJNAYRXSA-N 0.000 description 1
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 1
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- YKZVPMUGEJXEOR-JYJNAYRXSA-N Val-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N YKZVPMUGEJXEOR-JYJNAYRXSA-N 0.000 description 1
- 101150056418 XBP1 gene Proteins 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- 101150042435 Xrcc1 gene Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- MGSKVZWGBWPBTF-UHFFFAOYSA-N aebsf Chemical compound NCCC1=CC=C(S(F)(=O)=O)C=C1 MGSKVZWGBWPBTF-UHFFFAOYSA-N 0.000 description 1
- 238000005273 aeration Methods 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 108010081355 beta 2-Microglobulin Proteins 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 238000012742 biochemical analysis Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000001045 blue dye Substances 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- UDSAIICHUKSCKT-UHFFFAOYSA-N bromophenol blue Chemical compound C1=C(Br)C(O)=C(Br)C=C1C1(C=2C=C(Br)C(O)=C(Br)C=2)C2=CC=CC=C2S(=O)(=O)O1 UDSAIICHUKSCKT-UHFFFAOYSA-N 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000012820 cell cycle checkpoint Effects 0.000 description 1
- 230000018486 cell cycle phase Effects 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 230000007960 cellular response to stress Effects 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 230000001876 chaperonelike Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 229960004630 chlorambucil Drugs 0.000 description 1
- JCKYGMPEJWAADB-UHFFFAOYSA-N chlorambucil Chemical compound OC(=O)CCCC1=CC=C(N(CCCl)CCCl)C=C1 JCKYGMPEJWAADB-UHFFFAOYSA-N 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 239000012459 cleaning agent Substances 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 229940105778 coagulation factor viii Drugs 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000003271 compound fluorescence assay Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 101150052825 dnaK gene Proteins 0.000 description 1
- 235000012489 doughnuts Nutrition 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000008029 eradication Effects 0.000 description 1
- 238000011066 ex-situ storage Methods 0.000 description 1
- 230000028023 exocytosis Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 102000035175 foldases Human genes 0.000 description 1
- 108091005749 foldases Proteins 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- SDUQYLNIPVEERB-QPPQHZFASA-N gemcitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1C(F)(F)[C@H](O)[C@@H](CO)O1 SDUQYLNIPVEERB-QPPQHZFASA-N 0.000 description 1
- 229960005277 gemcitabine Drugs 0.000 description 1
- 230000004545 gene duplication Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 238000012637 gene transfection Methods 0.000 description 1
- 102000054766 genetic haplotypes Human genes 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 1
- 102000045442 glycosyltransferase activity proteins Human genes 0.000 description 1
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 1
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010019407 glycyl-arginyl-glycyl-aspartic acid Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 210000002288 golgi apparatus Anatomy 0.000 description 1
- 101150028578 grp78 gene Proteins 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 102000051705 human SRP54 Human genes 0.000 description 1
- 102000046342 human SRP9 Human genes 0.000 description 1
- 102000056288 human UCN2 Human genes 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000012002 interactive response technology Methods 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 108010077158 leucinyl-arginyl-tryptophan Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000005923 long-lasting effect Effects 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 108010056787 lysyl-arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010053062 lysyl-arginyl-phenylalanyl-lysine Proteins 0.000 description 1
- 108010012988 lysyl-glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 108060004734 metallo-beta-lactamase Proteins 0.000 description 1
- 102000020235 metallo-beta-lactamase Human genes 0.000 description 1
- 108700023046 methionyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010034507 methionyltryptophan Proteins 0.000 description 1
- 229960000907 methylthioninium chloride Drugs 0.000 description 1
- 239000011325 microbead Substances 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000009456 molecular mechanism Effects 0.000 description 1
- 229940126619 mouse monoclonal antibody Drugs 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 230000001254 nonsecretory effect Effects 0.000 description 1
- 210000000299 nuclear matrix Anatomy 0.000 description 1
- 239000012038 nucleophile Substances 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 229920002866 paraformaldehyde Polymers 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 210000002729 polyribosome Anatomy 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000013258 positive regulation by symbiont of host defense-related programmed cell death Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 1
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 1
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000000751 protein extraction Methods 0.000 description 1
- 101150010682 rad50 gene Proteins 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 229960000160 recombinant therapeutic protein Drugs 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 230000000246 remedial effect Effects 0.000 description 1
- 229940116176 remicade Drugs 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 230000003938 response to stress Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 108010074916 ribophorin Proteins 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000012807 shake-flask culturing Methods 0.000 description 1
- 125000005630 sialyl group Chemical group 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 108010068698 spleen exonuclease Proteins 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 238000003153 stable transfection Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 230000002311 subsequent effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000012134 supernatant fraction Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 238000001931 thermography Methods 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 238000004454 trace mineral analysis Methods 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 230000024540 transposon integration Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- GPRLSGONYQIRFK-MNYXATJNSA-N triton Chemical compound [3H+] GPRLSGONYQIRFK-MNYXATJNSA-N 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 108010087967 type I signal peptidase Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 108010077037 tyrosyl-tyrosyl-phenylalanine Proteins 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 238000012762 unpaired Student’s t-test Methods 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
- C07K16/24—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against cytokines, lymphokines or interferons
- C07K16/241—Tumor Necrosis Factors
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
- C07K16/32—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against translation products of oncogenes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/10—Immunoglobulins specific features characterized by their source of isolation or production
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/20—Immunoglobulins specific features characterized by taxonomic origin
- C07K2317/24—Immunoglobulins specific features characterized by taxonomic origin containing regions, domains or residues from different species, e.g. chimeric, humanized or veneered
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2500/00—Specific components of cell culture medium
- C12N2500/90—Serum-free medium, which may still contain naturally-sourced components
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/106—Plasmid DNA for vertebrates
- C12N2800/107—Plasmid DNA for vertebrates for mammalian
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/90—Vectors containing a transposable element
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/46—Vector systems having a special element relevant for transcription elements influencing chromatin structure, e.g. scaffold/matrix attachment region, methylation free island
Abstract
발현의 고안정성을 포함하는 발현의 양 및 품질, 적절하다면 발현 산물의 세포 밖으로의 수송에 관해 이점을 나타내는 특히 비-영장류 진핵 숙주 세포에서 관심 대상 DNA를 발현시키기 위한 작제물 및 방법이 개시된다.
Description
본 발명은 세포 대사를 매개하거나 또는 영향을 미치는 대사 경로, 예를 들어, ER 막에 걸친 전위 및/또는 세포질 막에 걸친 분비에 연루되거나 대사 경로 상에서 작용하는 작제물 및 단백질을 제공하는 것뿐만 아니라 세포 대사에 영향을 미치는 방법에 관한 것이다. 본 발명은 또한 예를 들어, 매우 다양한 비상동 단백질(이식유전자 발현 산물)의 전위/분비가 변용되는 재조합 포유류 세포의 생성 및 용도에 관한 것이다. 상기 방법, 핵산 작제물은 일반적으로 이식유전자 발현을 개선시키도록 설계된다.
치료적 단백질뿐만 아니라 유전자의 생명공학적 생성 및 세포 요법은 진핵 세포 내로 도입되는 이식유전자의 성공적인 발현에 의존한다. 성공적인 이식유전자 발현은 일반적으로 숙주 염색체 내로 이식유전자의 도입을 필요로 하며, 특히, 통합된 이식유전자 복제물의 수에 의해 그리고 낮은 또는 불안정한 전사 및/또는 높은 클론 가변성을 야기할 수 있는 후성적 효과에 의해 제한된다. 세포 밖의 이식유전자 발현 산물의 실패한 또는 감소된 수송은 또한 치료적 단백질뿐만 아니라 유전자 및 세포 요법의 생성을 제한한다.
본 발명을 설명하기 위해, 특히 실행에 관한 추가적인 상세한 설명을 제공하기 위해 본 명세서에서 사용되는 특허, 특허출원 및 등록번호를 포함하는 간행물 및 기타 매체는 그의 전문이 본 명세서에 참고로 포함된다.
포유류 세포에서 이식유전자 발현을 증가 및 안정화시키기 위해, 후성적 조절제는 음성 위치 효과(negative position effect)로부터 이식유전자를 보호하는데 점점 더 사용되고 있다(Bell and Felsenfeld, 1999). 이들 후성적 조절제는 경계 또는 절연 구성요소, 자리조절영역(locus control region: LCR), 안정화 및 항억제인자(stabilizing and antirepressor: STAR) 구성요소, 편재하여 작용하는 염색질 개구부(ubiquitously acting chromatin opening: UCOE) 구성요소 및 앞서 언급한 기질 부착 영역(matrix attachment region: MAR)을 포함한다. 모든 이들 후성적 조절제는 포유류 세포주에서 재조합 단백질 생성을 위해(Zahn-Zabal et al., 2001; Kim et al., 2004) 그리고 유전자 치료를 위해(Agarwal et al., 1998; Allen et al., 1996; Castilla et al., 1998) 사용되었다.
이식유전자 발현 산물은 종종 세포 밖의 가공 및 수송 동안 상이한 병목현상과 맞닥뜨리며: 그의 본래의 단백질을 가공 및 수송하기 위한 기작을 단지 구비한 세포는, 특히 그들이 종종 요망된다면 비정상적으로 고수준에서 생성될 때, 특정 유형의 이식 유전자 발현 산물의 수송에 의해 용이하게 과부화되어 세포 내에서 산물을 응집시키고/시키거나, 예를 들어 기능성 단백질 산물의 적절한 폴딩을 방지할 수 있다.
수송 및 가공 병목현상을 극복하기 위해 상이한 접근이 추구되었다. 예를 들어, 개선된 분비 특성을 지니는 CHO 세포는 막 소포 수송체의 조절제로서 작용하고 이런 이유로 분비 단백질 외포작용(exocytosis)으로서 작용하는 SM 단백질 Munc18c 또는 Sly1의 발현에 의해 유전자 조작되었다(미국 특허 공개 제20090247609호). X-박스-결합 단백질 1(Xbp1), 분비 세포 분화 및 ER 유지 및 팽창을 조절하는 전사 인자, 또는 다양한 단백질 이황화물 이성질화효소(protein disulfide isomerase: PDI)는 ER 스트레스를 감소시키고 단백질 분비를 증가시키기 위해 사용되었다(Mohan et al. 2007). 단백질 분비를 증가시키기 위한 다른 시도는 CHO 세포 내에 샤페론(chaperone) ERp57, 칼넥신, 칼레티쿨린 및 BiP1을 포함하였다(Chung et al., 2004). 저온 충격-유도 단백질, 특히, 저온-유도성 RNA-결합 단백질(CIRP)의 발현은 재조합 γ-인터페론의 수율을 증가시키는 것으로 나타났다. 또한 분비 복합체의 단백질을 과발현시키기 위한 시도가 있었다. 그러나, 예를 들어, 문헌[Lakkaraju et al. (2008)]은 WT 인간 세포에서(예를 들어, 낮은 SRP14 수준을 발현시키도록 유전자 조작되지 않은 세포에서) 외인성 SRP14 발현은 분비된 알칼린 포스파타제 단백질의 분비 효율을 개선시키지 않았다는 것을 보고하였다.
따라서, 효율적이고, 믿을 만한 이식유전자 발현, 예를 들어 재조합 단백질 생성을 위하고, 유전자 요법을 위한 필요가 있다. 또한 이식유전자 발현 산물을 세포 밖으로 성공적으로 수송하기 위한 필요가 있다.
당업계에서 이런 및 다른 필요는 본 발명의 실시형태에 의해 처리된다.
본 발명은 일 실시형태에서,
(a) 5' 및 3' 트랜스포존-특이적 역위 말단 반복부(transposon-specific inverted terminal repeat)(ITR),
(b) 5' ITR과 3' ITR 사이에 위치되고, 프로모터의 제어 하에 있는 이식유전자 발현 가공(transgene expression processing: TEP) 단백질 또는 TEP 기능성 RNA를 암호화하는 적어도 하나의 핵산 서열, 및
(c) 선택적으로 또한 5' ITR과 3' ITR 사이에 위치되고 이식유전자 프로모터의 제어 하에 있는 적어도 하나의 이식유전자
를 포함하는 재조합 핵산 분자에 관한 것이되, 상기 핵산 분자는 선택적으로 벡터의 부분이다.
재조합 핵산 분자는 적어도 하나의 후성적 조절 구성요소, 특히 적어도 하나의 MAR(기질 부착 영역) 구성요소를 포함할 수 있다.
MAR 구성요소는 5' ITR과 3' ITR 사이에 위치될 수 있다. 선택적으로 추가 프로모터의 제어 하에 이식유전자, 예컨대 항생물질 내성 유전자 또는 면역글로불린을 암호화하는 유전자는 5' ITR과 3' ITR 사이에, 예컨대 5' ITR과 MAR 사이에 위치될 수 있다.
TEP 단백질 또는 TEP 기능성 RNA는 게놈 내로 핵산 서열의 통합, 이식 유전자 RNA 산물의 가공 또는 번역에 직접적으로 또는 간접적으로 수반되거나, 또는 ER 전위, 분비, 가공, 폴딩, ER-골지-혈장막 수송, 글라이코실화 및/또는 이식유전자 발현 산물과 같은 단백질의 다른 번역 후 변형에 수반된 단백질 또는 기능성 RNA일 수 있다.
TEP 단백질은 단백질 분비 경로의 단백질, DNA 재조합 또는 수복 경로의 단백질, BiP와 같은 샤페론을 포함하는 단백질 가공 또는 대사 단백질, 또는 이들의 조합일 수 있다.
TEP 단백질은 단백질 분비 경로의 다음의 단백질: hSRP14, hSec61α1, hSec61β, hSec61γ, hSRP54, hSRP9, hSRPRα, hSRPβ 및 hCANX 중 하나 이상일 수 있다.
TEP 단백질은 또한 단백질 분비 경로의 다음의 아미노산 서열의 단백질: 서열번호 13을 갖는 hSRP14, 서열번호 15를 갖는 hSec61α1, 서열번호 17을 갖는 hSec61β, 서열번호 19를 갖는 hSec61γ, 서열번호 21을 갖는 hSRP54, 서열번호 23을 갖는 hSRP9, 서열번호 25를 갖는 hSRPRα, 서열번호 27을 갖는 hSRPβ 및 서열번호 29를 갖는 hCANX 중 하나 이상에 대응할 수 있고/있거나 구체화된 서열과 80%, 90%, 95% 또는 98% 초과의 서열 동일성을 갖는 아미노산 서열에 대응할 수 있다.
TEP 단백질은 다음의 단백질 가공 또는 대사 단백질: hUCP4, hCMPSAT, rST6Gal1, hCOMSC, hT-신타제, hP4HA1, hP4HB, hGILZ, hCyPB, hNRF2, hHK1, hPDI, hPIN1, hSEPW1, hCALR, hDDOST, hHSP40, hATP5A1, hSERCA2, hPDIA4, hHSC70 /HSPA8, hHYOU1, hCMP-SAS, hBeclin-1, hERdj3, CHO-AGE, hWip1, hRTP4, hREEP2, hDPM1 및 hDRiP78 중 하나 이상일 수 있다.
TEP 단백질은 또한 단백질 가공 또는 대사 다음의 아미노산 서열의 단백질의 단백질: 서열번호 31을 갖는 hUCP4, 서열번호 33을 갖는 hCMPSAT, 서열번호 35를 갖는 rST6Gal1, 서열번호 37을 갖는 hCOMSC, 서열번호 39을 갖는 hT-신타제, 서열번호 41을 갖는 hP4HA1, 서열번호 43을 갖는 hP4HB, 서열번호 45를 갖는 hGILZ, 서열번호 47을 갖는 hCyPB, 서열번호 49를 갖는 hNRF2, 서열번호 51을 갖는 hHK1, 서열번호 53을 갖는 hPDI, 서열번호 55를 갖는 hPIN1, 서열번호 57을 갖는 hSEPW1, 서열번호 59을 갖는 hCALR, 서열번호 62를 갖는 hDDOST, 서열번호 64를 갖는 hHSP40, 서열번호 66을 갖는 hATP5A1, 서열번호 68을 갖는 hSERCA2, 서열번호 70을 갖는 hPDIA4, 서열번호 72를 갖는 hHSC70/HSPA8, 서열번호 74를 갖는 hHYOU1, 서열번호 76을 갖는 hCMP-SAS, 서열번호 78을 갖는 hBeclin-1, 서열번호 80을 갖는 hERdj3, 서열번호 82를 갖는 CHO-AGE, 서열번호 84를 갖는 hWip1, 서열번호 86을 갖는 hRTP4, 서열번호 88을 갖는 hREEP2, 서열번호 90을 갖는 hDPM1 및 서열번호 92를 갖는 hDRiP78 중 하나 이상에 대응할 수 있고/있거나 구체화된 서열과 80%, 90%, 95% 또는 98% 초과의 서열 동일성을 갖는 아미노산 서열에 대응할 수 있다.
TEP 단백질은 서열번호 60과의 80%, 90%, 95% 또는 100% 서열 동일성을 갖는 샤페론, 특히, BiP 단백질, 더 특별하게는, 변형된 초파리 BIP 단백질 유도체(DroBiP)일 수 있다.
MAR 구성요소는 서열번호 1(MAR 1-68), 2(MAR 1_6), 3(MAR X_S29), 4(MAR S4), 5(닭 라이소자임 MAR)로부터 선택될 수 있거나, 또는 바람직하게는 유전자 조작된, 특히 재배열된 상대이고/이거나 서열번호 1 내지 5 중 임의의 하나와 또는 서열번호 6 내지 10 중 임의의 하나와 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 가진다.
상기 세포 내에서 TEP 기능성 RNA는 DNA 재조합 또는 수복 경로의 적어도 하나의 단백질, 예컨대, 이하로 제한되는 것은 아니지만, Rad51, Rad51B, Rad51C, Rad51D, Xrcc2, Xrcc3, Rad52, Rad54, Brca1, Brca2, 사이클린 D1, Ercc, MDC1, Bard1, 리가제 1, Mre11 및/또는 53BP1의 발현을 방해하는 기능성 RNA, 바람직하게는 miRNA 또는 shRNA를 암호화하는 핵산 서열을 포함할/이루어질 수 있다.
TEP 기능성 RNA는 또한 서열번호 93을 갖는 Rad51, 서열번호 94를 갖는 Rad51B, 서열번호 95를 갖는 Rad51C, 서열번호 96을 갖는 Rad51D, 서열번호 99를 갖는 Xrcc2, 서열번호 100을 갖는 Xrcc3, 서열번호 97을 갖는 Rad52, 서열번호 98을 갖는 Rad54, 서열번호 101을 갖는 Brca1, 서열번호 102를 갖는 Brca2, 서열번호 103을 갖는 사이클린 D1, 서열번호 104를 갖는 Ercc1, 서열번호 105를 갖는 MDC1, 서열번호 106을 갖는 Bard1, 서열번호 107을 갖는 리가제 1, 서열번호 108을 갖는 Mre11 및/또는 서열번호 109를 갖는 53BP1과 적어도 80%, 90%, 95%, 98% 또는 100% 서열 동일성을 갖는 유전자의 발현을 방해할 수 있다.
재조합 핵산 분자는 적어도 5000, 6000, 7000, 8000, 90000 또는 10000bp 길이일 수 있다.
5' 및 3' ITR은 슬리핑 뷰티(Sleeping Beauty) 또는 바람직하게는 피기백(PiggyBac) 트랜스포존의 5' 및 3' ITR일 수 있다.
재조합 핵산 분자 중 하나의 제1 형질감염 및 이식 유전자를 함유하는 재조합 핵산 분자의 포유류 세포 내로 제2의 후속적 형질감염 시, 이식유전자 통합 및/또는 발현은 상기 제1 형질감염을 받지 않은 세포에 비해 상기 세포에서 증가될 수 있다.
본 명세서에 언급된 TEP 암호 서열 또는 TEP 기능성 RNA는 발현 벡터를 포함하는 벡터의 부분일 수 있다. 벡터는 단일 MAR 구성요소, 2 이상의 MAR 구성요소를 포함할 수 있되, 상기 구성요소(들)는 5' ITR과 3' ITR 사이에 위치될 수 있다.
예를 들어, 벡터는 2개의 MAR 구성요소를 포함할 수 있다. 제1 MAR 구성요소는 TEP 또는 TEP 기능성 RNA의 상류에 위치될 수 있고, 제2 MAR 구성요소는 TEP 또는 TEP 기능성 RNA의 하류에 위치될 수 있되, 제1 MAR 구성요소는 MAR 1_6 구성요소 및/또는 서열번호 2와 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소, 특히 MAR 1-6에 기반한 재배열된 MAR, 더 구체적으로는 서열번호 8과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소(MAR 1_6R2)를 포함할 수 있고, 제2 MAR 구성요소는 MAR 1-68 구성요소 및/또는 서열번호 1과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소를 포함할 수 있다.
벡터는 또한 단일 MAR 구성요소를 포함할 수 있다. 단일 MAR 구성요소는 TEP 또는 TEP 기능성 RNA의 하류에 위치될 수 있되, 단일 MAR 구성요소는 MAR 1-68 또는 MAR X-29 구성요소 및/또는 서열번호 1 또는 3과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소, 특히, MAR 1-68 또는 MAR X-29에 기반한 재배열된 MAR, 특히 서열번호 6, 7 또는 10(MAR 1_68R, 1_68R2 또는 X_29R3) 또는 9와 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소일 수 있고, 바람직하게는 MAR X-29 구성요소 및/또는 서열번호 3과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소일 수 있다.
TEP 또는 TEP 기능성 RNA는 EF1 알파 프로모터의 제어하에 있을 수 있고, 선택적으로 이후에 BGH 폴리A 신호가 있다.
벡터는 프로모터(들) 및/또는 인핸서(들) 또는 이들의 융합물, 예컨대 GAPDH, SV40p, CMV, CHO EF1 알파, CHO Actb 및/또는 CHO Hspa5, 또는 이들의 유전자 조작된 융합물, 예컨대 CGAPDH를 포함할 수 있다.
벡터의 부분인 프로모터는 서열번호 111을 갖는 GAPDH, 서열번호 114를 갖는 SV40p, 서열번호 113을 갖는 CMVp, 서열번호 112를 갖는 CHO Ef1 알파, 서열번호 115를 갖는 CHO Actb, 서열번호 116을 갖는 CHO Hspa5 및/또는 이들의 융합물, 예컨대 서열번호 11을 갖는 CGAPDH일 수 있거나, 또는 구체화된 서열과 80%, 90%, 95% 또는 98% 초과의 서열 동일성을 갖는 핵산 서열을 가질 수 있다.
본 발명은 또한:
이식유전자를 포함하는 재조합 포유류 세포를 제공하는 단계를 포함하는 TEP 또는 TEP 기능성 RNA를 발현시키기 위한 방법에 관한 것이고, 벡터는 TEP 또는 TEP 기능성 RNA를 발현시키는 발현 벡터이되, 상기 벡터를 통해 발현된 TEP 또는 TEP 기능성 RNA는 상기 포유류 세포 내 이식 유전자의 발현을 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60% 또는 적어도 70%만큼 선택적으로 증가시킨다.
벡터는 단일 MAR X-29 구성요소 및/또는 서열번호 3과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하되, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14주 초과로 배양한 후에, 상기 벡터를 통해 발현되는 TEP 또는 TEP 기능성 RNA는 관심 대상 유전자의 발현을 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60% 또는 적어도 70%만큼 증가시킬 수 있다.
본 발명은 또한 재조합 핵산 분자, 바람직하게는 단일 복제물로서 세포의 게놈 내로 통합된 20, 15, 10 또는 5개 이하의 재조합 핵산 분자를 포함하는 재조합 포유류 세포에 관한 것이다.
상기 언급한 바와 같이, TEP 단백질은 단백질 분비 경로의 다음의 단백질: hSRP14, hSec61α1, hSec61β, hSec61γ, hSRP54, hSRP9, hSRPRα, hSRPβ 및 hCANX 중 하나 이상일 수 있다.
TEP 단백질은 또한 단백질 분비 경로의 다음의 아미노산 서열의 단백질: 서열번호 13을 갖는 hSRP14, 서열번호 15를 갖는 hSec61α1, 서열번호 17을 갖는 hSec61β, 서열번호 19를 갖는 hSec61γ, 서열번호 21을 갖는 hSRP54, 서열번호 23을 갖는 hSRP9, 서열번호 25를 갖는 hSRPRα, 서열번호 27을 갖는 hSRPβ, 및 서열번호 29를 갖는 hCANX 중 하나 이상에 대응할 수 있고/있거나 구체화된 서열과 80%, 90%, 95% 또는 98% 초과의 서열 동일성을 갖는 아미노산 서열에 대응할 수 있다.
TEP 단백질은 다음의 단백질 가공 또는 대사 단백질: hUCP4, hCMPSAT, rST6Gal1, hCOMSC, hT-신타제, hP4HA1, hP4HB, hGILZ, hCyPB, hNRF2, hHK1, hPDI, hPIN1, hSEPW1, hCALR, hDDOST, hHSP40, hATP5A1, hSERCA2, hPDIA4, hHSC70 /HSPA8, hHYOU1, hCMP-SAS, hBeclin-1, hERdj3, CHO-AGE, hWip1, hRTP4, hREEP2, hDPM1 및 hDRiP78 중 하나 이상일 수 있다.
TEP 단백질은 또한 단백질 가공 또는 대사 다음의 아미노산 서열의 단백질: 서열번호 31을 갖는 hUCP4, 서열번호 33을 갖는 hCMPSAT, 서열번호 35를 갖는 rST6Gal1, 서열번호 37을 갖는 hCOMSC, 서열번호 39을 갖는 hT-신타제, 서열번호 41을 갖는 hP4HA1, 서열번호 43을 갖는 hP4HB, 서열번호 45를 갖는 hGILZ, 서열번호 47을 갖는 hCyPB, 서열번호 49를 갖는 hNRF2, 서열번호 51을 갖는 hHK1, 서열번호 53을 갖는 hPDI, 서열번호 55를 갖는 hPIN1, 서열번호 57을 갖는 hSEPW1, 서열번호 59을 갖는 hCALR, 서열번호 62를 갖는 hDDOST, 서열번호 64를 갖는 hHSP40, 서열번호 66을 갖는 hATP5A1, 서열번호 68을 갖는 hSERCA2, 서열번호 70을 갖는 hPDIA4, 서열번호 72를 갖는 hHSC70/HSPA8, 서열번호 74를 갖는 hHYOU1, 서열번호 76을 갖는 hCMP-SAS, 서열번호 78을 갖는 hBeclin-1, 서열번호 80을 갖는 hERdj3, 서열번호 82를 갖는 CHO-AGE, 서열번호 84를 갖는 hWip1, 서열번호 86을 갖는 hRTP4, 서열번호 88을 갖는 hREEP2, 서열번호 90을 갖는 hDPM1 및 서열번호 92를 갖는 hDRiP78 중 하나 이상에 대응할 수 있고/있거나 구체화된 서열과 80%, 90%, 95% 또는 98% 초과의 서열 동일성을 갖는 아미노산 서열에 대응할 수 있다.
TEP 단백질은 서열번호: 60과 80%, 90%, 95% 또는 100% 서열 동일성을 갖는 샤페론, 특히, BiP 단백질, 더 특히, 유전자 조작된 초파리 BIP 단백질 유도체(DroBiP)일 수 있다.
재조합 포유류 세포 내의 TEP 기능성 RNA는 적어도 하나의 재조합 단백질, 바람직하게는 HR 유전자, 예컨대, 이하로 제한되는 것은 아니지만, Rad51, Rad51B, Rad51C, Rad51D, Xrcc2, Xrcc3, Rad52, Rad54, Brca1, Brca2, 사이클린 D1, Ercc1, MDC1, Bard1, 리가제 1, Mre11 및/또는 53BP1의 발현을 방해하는 기능성 RNA, 바람직하게는 miRNA 또는 shRNA를 암호화하는 핵산 서열(들)을 포함할/이루어질 수 있다. 핵산은 서열번호 93을 갖는 Rad51, 서열번호 94를 갖는 Rad51B, 서열번호 95를 갖는 Rad51C, 서열번호 96을 갖는 Rad51D, 서열번호 99를 갖는 Xrcc2, 서열번호 100을 갖는 Xrcc3, 서열번호 97을 갖는 Rad52, 서열번호 98을 갖는 Rad54, 서열번호 101을 갖는 Brca1, 서열번호 102를 갖는 Brca2, 서열번호 103을 갖는 사이클린 D1, 서열번호 104를 갖는 Ercc1, 서열번호 105를 갖는 MDC1, 서열번호 106을 갖는 Bard1, 서열번호 107을 갖는 리가제 1, 서열번호 108을 갖는 Mre11 및/또는 서열번호 109를 갖는 53BP1과 적어도 80%, 90%, 95%, 98% 또는 100% 서열 동일성을 가질 수 있다.
재조합 포유류 세포는 1차 줄기 세포, 햄스터, 예를 들어, CHO(중국 햄스터 난소), 세포 또는 인간, 예를 들어, HEK293 세포일 수 있다.
본 발명은 또한
a) 적어도 하나의 TEP 기능성 RNA 및/또는 TEP 단백질을 암호화하거나 또는 TEP 기능성 RNA를 암호화하는 적어도 하나의 재조합 핵산 서열,
및
b) 재조합 핵산 분자를 포함하는, 재조합 포유류 세포에 관한 것이되,
상기 재조합 핵산 분자는
(i) 적어도 하나의 관심 대상 이식유전자, 및
(ii) 선택적으로, MAR 구성요소를 포함한다.
상기 언급한 바와 같이, TEP 단백질은 단백질 분비 경로의 다음의 단백질: hSRP14, hSec61α1, hSec61β, hSec61γ, hSRP54, hSRP9, hSRPRα, hSRPβ 및 hCANX 중 하나 이상일 수 있다.
TEP 단백질은 또한 단백질 분비 경로의 다음의 아미노산 서열의 단백질: 서열번호 13을 갖는 hSRP14, 서열번호 15를 갖는 hSec61α1, 서열번호 17을 갖는 hSec61β, 서열번호 19를 갖는 hSec61γ, 서열번호 21을 갖는 hSRP54, 서열번호 23을 갖는 hSRP9, 서열번호 25를 갖는 hSRPRα, 서열번호 27을 갖는 hSRPβ 및 서열번호 29를 갖는 hCANX 중 하나 이상에 대응할 수 있고/있거나 구체화된 서열과 80%, 90%, 95% 또는 98% 초과의 서열 동일성을 갖는 아미노산 서열에 대응할 수 있다.
TEP 단백질은 다음의 단백질 가공 또는 대사 단백질: hUCP4, hCMPSAT, rST6Gal1, hCOMSC, hT-신타제, hP4HA1, hP4HB, hGILZ, hCyPB, hNRF2, hHK1, hPDI, hPIN1, hSEPW1, hCALR, hDDOST, hHSP40, hATP5A1, hSERCA2, hPDIA4, hHSC70 /HSPA8, hHYOU1, hCMP-SAS, hBeclin-1, hERdj3, CHO-AGE, hWip1, hRTP4, hREEP2, hDPM1 및 hDRiP78 중 하나 이상일 수 있다.
TEP 단백질은 또한 단백질 가공 또는 대사 다음의 아미노산 서열의 단백질: 서열번호 31을 갖는 hUCP4, 서열번호 33을 갖는 hCMPSAT, 서열번호 35를 갖는 rST6Gal1, 서열번호 37을 갖는 hCOMSC, 서열번호 39을 갖는 hT-신타제, 서열번호 41을 갖는 hP4HA1, 서열번호 43을 갖는 hP4HB, 서열번호 45를 갖는 hGILZ, 서열번호 47을 갖는 hCyPB, 서열번호 49를 갖는 hNRF2, 서열번호 51을 갖는 hHK1, 서열번호 53을 갖는 hPDI, 서열번호 55를 갖는 hPIN1, 서열번호 57을 갖는 hSEPW1, 서열번호 59을 갖는 hCALR, 서열번호 62를 갖는 hDDOST, 서열번호 64를 갖는 hHSP40, 서열번호 66을 갖는 hATP5A1, 서열번호 68을 갖는 hSERCA2, 서열번호 70을 갖는 hPDIA4, 서열번호 72를 갖는 hHSC70/HSPA8, 서열번호 74를 갖는 hHYOU1, 서열번호 76을 갖는 hCMP-SAS, 서열번호 78을 갖는 hBeclin-1, 서열번호 80을 갖는 hERdj3, 서열번호 82를 갖는 CHO-AGE, 서열번호 84를 갖는 hWip1, 서열번호 86을 갖는 hRTP4, 서열번호 88을 갖는 hREEP2, 서열번호 90을 갖는 hDPM1 및 서열번호 92를 갖는 hDRiP78 중 하나 이상에 대응할 수 있고/있거나 구체화된 서열과 80%, 90%, 95% 또는 98% 초과의 서열 동일성을 갖는 아미노산 서열에 대응할 수 있다.
TEP 단백질은 서열번호 60과 80%, 90%, 95% 또는 100% 서열 동일성을 갖는 샤페론, 특히, BiP 단백질, 더 특별하게는, 합성 초파리 BIP 단백질 유도체(DroBiP)일 수 있다.
기능성 RNA는 일시적으로 형질감염된 siRNA 또는 상기 적어도 하나의 단리된 핵산 서열로부터 전사된 shRNA일 수 있되, siRNA 또는 가공된 shRNA는 NHEJ(비상동성 말단-결합), HR(상동성 재조합), MMEJ(마이크로 상동체(Microhomolgoy) 매개 말단 결합) 재조합 경로의 부분이거나 또는 MDC1(DNA-손상 검사점 1의 매개자)과 같은 DNA 수선 단백질인 적어도 하나의 표적 유전자의 mRNA의 20, 21, 22, 23, 24 또는 25 연속적 뉴클레오타이드에 대해 완전히 상보성인 20, 21, 22, 23, 24 또는 25개의 염기쌍 길이의 안티센스 RNA이다.
하기의 부분일 수 있는 적어도 하나의 표적 유전자는:
- DNA 수선 및 NHEJ는
53BP1(종양 억제유전자 p53-결합 단백질 1)이고,
- HR은
Rad51(DNA 수선 단백질 RAD51), Rad51B(DNA 수선 단백질 RAD51 상동체 2), Rad51C(DNA 수선 단백질 RAD51 상동체 3),
Rad51D(DNA 수선 단백질 RAD51 상동체 4), Rad52(DNA 수선 단백질 RAD52), Rad54(DNA 수선 및 재조합 단백질 RAD54),
Xrcc2(중국 햄스터 세포 2에서 X-선 수선 보완 결함 수선),
Xrcc3(중국 햄스터 세포 3에서 X-선 수선 보완 결함 수선),
Brca1(유방암 1, 조기 개시),
Brca2(유방암 2, 조기 개시),
Bard1(BRCA1 관련 RING 도메인 1)이며,
- MMEJ는
Ercc1(절제 수선 교차-보완(excision repair cross-complementing) 설치류 수선 결함, 상보군 1),
Mre11(감수분열 재조합 11),
리가제1(DNA 리가제 1),이고/이거나
DNA 수선 단백질 MDC1이다.
표적 유전자는 서열번호 93을 갖는 Rad51, 서열번호 94를 갖는 Rad51B, 서열번호 95를 갖는 Rad51C, 서열번호 96을 갖는 Rad51D, 서열번호 99를 갖는 Xrcc2, 서열번호 100을 갖는 Xrcc3, 서열번호 97을 갖는 Rad52, 서열번호 98을 갖는 Rad54, 서열번호 101을 갖는 Brca1, 서열번호 102를 갖는 Brca2, 서열번호 103을 갖는 사이클린 D1, 서열번호 104를 갖는 Ercc1, 서열번호 105를 갖는 MDC1, 서열번호 106을 갖는 Bard1, 서열번호 107을 갖는 리가제 1, 서열번호 108을 갖는 Mre11 및/또는 서열번호 109를 갖는 53BP1와 적어도 80%, 90%, 95%, 98% 또는 100% 서열 동일성을 갖는 핵산일 수 있다.
적어도 하나의 이식유전자는 치료적 단백질, 예컨대 면역글로불린, 호르몬, 예컨대 에리스로포이에틴 또는 성장인자를 발현시킬 수 있되, 선택적으로 재조합 포유류 세포에서 이식유전자 통합 및/또는 발현은 상기 재조합 핵산 분자(들)를 포함하지 않는 세포에 비해 증가된다.
재조합 포유류 세포는 적어도 2개의 TEP 기능성 RNA를 포함할 수 있되, TEP RNA 중 하나 또는 둘 다는 일시적으로 형질감염된 siRNA이거나, 또는 TEP 기능성 RNA를 암호화하는 상기 단리된 핵산 서열(들)에 의해 발현된다.
재조합 포유류 세포는 MAR 구성요소를 포함할 수 있다.
본 발명은 또한 하기:
선택적으로 제1 형질감염에서, 상기 포유류 세포를
(i) 제1항 내지 제13항 중 어느 한 항의 상기 재조합 핵산 분자 중 적어도 하나 및/또는
(ii) 선택적으로 5' 및 3' ITR을 인식하는 트랜스포사제(transposase)를 발현시키는 단리된 핵산 또는 mRNA와 함께 선택적으로, 제2, 후속 형질감염에서 선택적으로 형질감염되는 재조합 핵산 분자의 부분인 적어도 하나의 단리된 TEP 기능성 RNA 및 적어도 하나의 이식유전자
로 형질감염시키는 단계를 포함하는, 포유류 세포, 특히 햄스터 세포를 형질감염시키는 방법에 관한 것이다.
재조합 포유류 세포는 다음의 hSRP14, hSec61α1, hSec61β, hSec61γ, hSRP54, hSRP9, hSRPRα, hSRPβ 및 hCANX 중 1, 2 또는 3개를 암호화하는 상기 재조합 핵산 분자 중 적어도 2, 적어도 3 또는 적어도 4개를 포함하는 하나 이상으로 형질감염될 수 있다.
I은 또한 서열번호 13을 갖는 hSRP14, 서열번호 15를 갖는 hSec61α1, 서열번호 17을 갖는 hSec61β, 서열번호 19를 갖는 hSec61γ, 서열번호 21을 갖는 hSRP54, 서열번호 23을 갖는 hSRP9, 서열번호 25를 갖는 hSRPRα, 서열번호 27을 갖는 hSRPβ, 및 서열번호 29를 갖는 hCANX로 및/또는 구체화된 서열과 80%, 90%, 95% 또는 98% 초과의 서열 동일성을 갖는 아미노산 서열로 형질감염될 수 있다.
임의의 재조합 핵산 분자는 벡터의 부분일 수 있되, 벡터는 공동 형질감염될 수 있다.
몇몇 TEP 단백질을 암호화하는 벡터의 공동-형질감염, 바람직하게는 단백질 SRP14, SRP9 및 SRP54를 암호화하는 재조합 핵산 분자의 공동-형질감염은 이러한 공동-형질감염을 받지 않은 세포에 비해 상기 세포에서 이식유전자 통합 및/또는 발현을 증가시킬 수 있다. 핵산 서열을 포함하는 벡터의 공동-형질감염은 적어도 80%, 90%, 95%, 98% 또는 100%의 서열번호 12, 서열번호 22, 서열번호 20을 가지고, 또한 본 발명의 범주 내에 있다.
재조합 포유류 세포를 얻기 위해 상기 TEP 단백질 또는 TEP 기능성 RNA를 안정하게 발현시키는 다수의 상기 포유류 세포가 얻어질 수 있되, 상기 재조합 포유류 세포의 수는 상기 MAR 구성요소의 존재로부터 독립적일 수 있다. 포유류 세포는 두번째 및 선택적으로 세번째로 형질감염될 수 있다.
바람직하게는, 상기 포유류 세포의 적어도 30%, 40% 또는 45%는 재조합 포유류 세포일 수 있고, 상기 이식유전자를 발현시킬 수 있다.
포유류 세포는 선택적으로 5' 및 3' ITR을 인식하는 트랜스포사제를 발현시키는 단리된 핵산 또는 mRNA와 함께, 상기 적어도 하나의 단리된 TEP 기능성 RNA 및 상기 적어도 하나의 이식유전자를 포함하는 벡터 및 선택적으로 상기 적어도 하나의 이식유전자에 측접하는 3' ITR 및 5' ITR로 형질감염될 수 있다.
이식유전자는 치료적 단백질, 예컨대 면역글로불린, 호르몬, 사이토카인 또는 성장인자일 수 있다.
재조합 핵산 분자는 선택적으로 선택 마커를 포함할 수 있되, 적어도 하나의 이식유전자는,
(a) 상기 마커에 대한 선택 없이, 또는
(b) 상기 마커, 예를 들어 배양 배지에 함유된 선택제를 통해, 상기 마커에 대한 선택과 함께, 그리고
(c) 트랜스포사제 없이, 또는
(d)
트랜스포사제의 존재 하에, 발현된다.
TEP 기능성 RNA는 shRNA 또는 miRNA를 암호화하는 재조합 핵산 서열에 의해 암호화될 수 있거나, 또는 적어도 하나의 HR 유전자, 예컨대, 이하로 제한되는 것은 아니지만, Rad51, Rad51B, Rad51C, Rad51D, Xrcc2, Xrcc3, Rad52, Rad54, Brca1, Brca2, 사이클린 D1, Ercc1, MDC1, Bard1, 리가제 1, Mre11 및/또는 53BP1의 발현을 방해하는 siRNA를 포함할/이루어질 수 있다.
TEP 기능성 RNA는 또한 서열번호 93을 갖는 Rad51, 서열번호 94를 갖는 Rad51B, 서열번호 95를 갖는 Rad51C, 서열번호 96을 갖는 Rad51D, 서열번호 99를 갖는 Xrcc2, 서열번호 100을 갖는 Xrcc3, 서열번호 97을 갖는 Rad52, 서열번호 98을 갖는 Rad54, 서열번호 101을 갖는 Brca1, 서열번호 102를 갖는 Brca2, 서열번호 103을 갖는 사이클린 D1, 서열번호 104를 갖는 Ercc1, 서열번호 105를 갖는 MDC1, 서열번호 106을 갖는 Bard1, 서열번호 107을 갖는 리가제 1, 서열번호 108을 갖는 Mre11 및/또는 서열번호 109를 갖는 53BP1과 적어도 80%, 90%, 95%, 98% 또는 100% 서열 동일성을 갖는 유전자의 발현을 방해할 수 있다.
이식유전자 통합 및/또는 발현은 상기 단리된 핵산 분자 및/또는 상기 단리된 TEP 기능성 RNA 중 상기 적어도 하나로 형질감염되지 않은 세포에 비해 이러한 세포에서 증가될 수 있다.
본 발명은 또한 하나의 용기에서 제1항 내지 제13항에 따른 재조합 핵산 분자 중 임의의 하나를 포함하는 적어도 하나의 벡터를 포함하고, 제2 선택적 용기에서 양립 가능한 트랜스포사제를 암호화하는 벡터를 포함하며, 추가 용기에서 벡터 또는 벡터들을 사용하는 방법의 설명서를 포함하는, 키트에 관한 것이다.
키트는 상기 언급되었고, 하나 초과의 벡터가 하나 이상의 용기에서 제공되며, TEP 단백질은 다음의: 샤페론, SRP14, SRP9, SRP54, SR 또는 트랜스로콘(translocon) 중 적어도 둘이다.
키트는 상기 언급되었고, 상기 벡터(들) 내의 TEP 기능성 RNA(들)는 적어도 하나의 HR 유전자, 예컨대, 이하로 제한되는 것은 아니지만, Rad51, Rad51B, Rad51C, Rad51D, Xrcc2, Xrcc3, Rad52, Rad54, Brca1, Brca2 사이클린 D1, Ercc1, MDC1, Bard1, 리가제 1, Mre11 및/또는 53BP1의 발현을 방해하는 miRNA, siRNA 또는 shRNA를 암호화하는 핵산 서열, 및 바람직하게는 추가 용기에서 적어도 하나의 다른 HR 유전자, 예컨대, 이하로 제한되는 것은 아니지만, Rad51, Rad51B, Rad51C, Rad51D, Xrcc2, Xrcc3, Rad52, Rad54, Brca1, Brca2, 사이클린 D1, Ercc1, MDC1, Bard1, 리가제 1, Mre11 및/또는 53BP1의 발현을 방해하는 siRNA(들)를 포함한다/이루어진다.
HR 유전자는 서열번호 93을 갖는 Rad51, 서열번호 94를 갖는 Rad51B, 서열번호 95를 갖는 Rad51C, 서열번호 96을 갖는 Rad51D, 서열번호 99를 갖는 Xrcc2, 서열번호 100을 갖는 Xrcc3, 서열번호 97을 갖는 Rad52, 서열번호 98을 갖는 Rad54, 서열번호 101을 갖는 Brca1, 서열번호 102를 갖는 Brca2, 서열번호 103을 갖는 사이클린 D1, 서열번호 104를 갖는 Ercc1, 서열번호 105를 갖는 MDC1, 서열번호 106을 갖는 Bard1, 서열번호 107을 갖는 리가제 1, 서열번호 108을 갖는 Mre 11 및/또는 서열번호 109를 갖는 53BP1과 적어도 80%, 90%, 95%, 98% 또는 100% 서열 동일성을 갖는 핵산에 대응할 수 있다.
본 발명은 또한 바람직하게는 이식유전자 통합 및/또는 발현을 증가시키기 위한 본 명세서에 개시된 재조합 핵산 및/또는 본 명세서에 개시된 재조합 포유류 세포의 용도에 관한 것이다.
본 발명은 또한 하기를 포함하는 발현 벡터에 관한 것이다:
(a) 프로모터에 의해 상류에 그리고 폴리아데닐화 신호에 의해 하류에 측접된 이식유전자,
(b) 폴리아데닐화 신호의 하류의 단일 MAR 구성요소, 또는
(c) 관심 대상 이식유전자의 상류의 제1 MAR 구성요소 및 상기 이식유전자 통합 부위의 하류의 제2 MAR 구성요소.
단일 또는 제1 및 제2 MAR 구성요소는 서열번호 1, 2, 3, 6, 7, 8, 9 또는 10과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 MAR 구성요소 1_68, 1_6, 1_6R2, 1_68R, 1_68R2, X_29R3 또는 X_29 또는 구성요소로부터 선택될 수 있다.
단일 또는 제1 및 제2 MAR(들)은 재배열된 MAR 구성요소 1_6R2, 1_68R, 1_68R2 또는 X_29R3 또는 서열번호 6, 7, 8 또는 10과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소로부터 선택될 수 있되, 선택적으로, MAR 구성요소(들)는 그들의 비-재배열된 상대에 비해 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60% 또는 적어도 70%만큼 관심 대상 이식유전자의 발현을 증가시킨다.
프로모터는 EF1 알파 프로모터일 수 있고, 폴리아데닐화 신호는 BGH 폴리A 신호이다.
벡터는 프로모터(들) 및/또는 인핸서(들) 또는 이들의 융합물, 예컨대 GAPDH, CGAPD, CSV40p, CMVp, CHO Ef1알파, CHO Actb 또는 CHO Hspa5를 포함할 수 있다.
프로모터는 서열번호 111을 갖는 GAPDH, 서열번호 11을 갖는 CGAPDH, 서열번호 114를 갖는 SV40p, 서열번호 113을 갖는 CMVp, 서열번호 112를 갖는 CHO EF1 알파, 서열번호 115를 갖는 CHO Actb 및/또는 서열번호 116을 갖는 CHO Hspa5 및 구체화된 서열과 80%, 90%, 95% 또는 98% 초과의 서열 동일성을 갖는 핵산 서열일 수 있다.
프로모터는 GAPDH 프로모터일 수 있고, CMV 인핸서를 포함한다.
제1 및/또는 제2 MAR, 인핸서, 프로모터, 관심 대상 이식유전자 및 폴리아데닐화 신호는 5' ITR과 3' ITR 사이에 위치될 수 있다.
특정 실시형태에서, 발현 벡터는 하기를 포함할 수 있다:
(a) 폴리아데닐화 신호 하류의 단일 MAR 구성요소로서, 상기 단일 MAR 구성요소는 바람직하게는 MAR 1-68 또는 MARX-29 구성요소 및/또는 서열번호 1 또는 3과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소, 특히 MAR 1-68 또는 MAR X-29에 기반한 재배열된 MAR, 특히, 서열번호 6, 7 또는 10(MAR 1_68R, 1_68R2 또는 X_29R3) 또는 서열번호 9와 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 가지고, 바람직하게는 MAR X-29 구성요소이고/이거나 서열번호 3과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소인, 폴리아데닐화 신호 하류의 단일 MAR 구성요소, 또는
(b) 관심 대상 이식유전자의 상류의 제1 MAR 구성요소 및 상기 관심 대상 이식유전자의 하류의 제2 MAR 구성요소로서, 바람직하게는 1_6 구성요소를 포함하고/하거나 서열번호 2와, 특히 MAR 1-6에 기반한 재배열된 MAR과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 제1 MAR 구성요소, 특히 서열번호 8과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소(MAR 1_6R2) 및 바람직하게는 MAR 1-68 구성요소를 포함하고/하거나 서열번호 1과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 제2 MAR 구성요소.
발현 벡터는 단일 MAR 구성요소를 포함할 수 있고, 단일 MAR 구성요소는 폴리아데닐화 부위의 하류에 위치될 수 있으며 MAR 1-68 또는 MAR X-29이고/이거나 서열번호 1 또는 3과, 특히 MAR 1-68 또는 MAR X-29에 기반한 재배열된 MAR과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 가질 수 있고, 특히 서열번호 6, 7 또는 10(MAR 1_68R, 1_68R2 또는 X_29R3) 또는 9와 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 지니는 구성요소이고, 바람직하게는 MAR X-29-유래 구성요소일 수 있고/있거나 서열번호 3과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 가진다.
제1 MAR 구성요소는 관심 대상의 이식유전자의 상류에 있을 수 있고, 제2 MAR 구성요소는 상기 관심 대상 이식유전자의 하류에 있을 수 있되, 제1 MAR 구성요소는 MAR 1_6 구성요소를 포함할 수 있고/있거나 서열번호 2와 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 가질 수 있고, 제2 MAR 구성요소는 MAR 1_68 구성요소를 포함할 수 있고/있거나 서열번호 1과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 가질 수 있다.
본 발명은 또한 상기 이식유전자를 포함하는 상기 언급된 벡터 중 하나를 포함하는 재조합 포유류 세포를 제공하는 단계 및 이식유전자를 발현시키는 단계를 포함하는 이식유전자를 발현시키기 위한 방법에 관한 것이되, 상기 MAR 구성요소(들)는 바람직하게는 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60% 또는 적어도 70%만큼 이식유전자의 발현을 증가시킬 수 있다. 벡터는 서열번호 3과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 가질 수 있는 단일 MAR X_29 구성요소 및/또는 핵산을 포함할 수 있되, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14주 초과의 배양 후에, MAR 구성요소는 관심 대상 이식유전자의 발현을 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60% 또는 적어도 70%만큼 증가시킬 수 있다.
도 1. 트랜스포존 벡터 구성을 도시한 도면
PB(피기백) 트랜스포존에 MAR 구성요소를 첨가할지 여부를 시험하는 것은 전위 효율 및 이식유전자 발현에 영향을 미칠 수 있고, 작제물 내 MAR의 위치가 이들 효과에 임의의 영향을 미치는지 여부를 평가하기 위해, GFP 및 퓨로마이신 내성(퓨로(퓨로)) 유전자를 함유하는 일련의 트랜스포존 공여체 작제물을 설계하였는데, 이때 MAR 1_68 또는 제어 중성 스페이서 DNA 서열을 플라스미드 내 상이한 위치에 삽입하였다. MAR 또는 스페이서 서열 첨가의 효과에 비해 증가된 트랜스포존 크기의 영향을 구별하기 위해 삽입물이 없는 모 퓨로-GFP 트랜스포존 플라스미드를 전위의 대조군으로서 사용하였다.
도 2 트랜스포존 벡터: 전위 효율을 도시한 도면
다양한 트랜스포존 작제물의 전위 효율을 (A) 형질감염시키고 항생물질 선택이 없이 배양하고서 3주 후에 GFP-발현 세포의 백분율을 평가하고 (B) 퓨로마이신-내성을 계수화함으로써 측정하였다.
도 3 트랜스포존 벡터: 발현 수준을 도시한 도면
발현 수준의 분석은 GFP-양성 세포 단독의 형광을 고려하여 (A) 형질감염 후 퓨로마이신 내성에 대한 분비가 없는 배양 또는 (B) 형질감염 후 퓨로마이신 내성에 대한 분비가 있는 배양의 3주 후 CHO 세포의 GFP 형광 수준을 프로빙함으로써 트랜스포사제 발현 플라스미드가 있거나(+PB) 또는 없이(-PB) 형질감염된 상이한 트랜스포존 벡터에 의해 허용한다.
도 4 이식유전자 게놈 통합에 대한 MAR 및 트랜스포사제의 효과를 도시한 도면
qPCR을 이용하여 통합된 GFP 이식유전자 복제물의 수를 결정하고, 도 1 내지 도 3에 대한 범례에 기재한 바와 같이 생성된 비선택 CHO 세포(A), 또는 퓨로마이신-내성 세포 (B)로부터 단리한 게놈 DNA를 이용하여, 세포 B2M 유전자에 대해 값을 정규화시켰다. 값은 평균 ± SEM(n=3)을 나타낸다. *P<0,05.
도 5 이식유전자 당 이식유전자 발현을 도시한 도면
(A) 퓨로마이신 선택이 없는 게놈 및 (B) 퓨로마이신 선택이 있는 게놈 내에 통합을 위한 벡터의 성향과 독립적인, 벡터의 고유한 발현 가능성의 평가.
도 6 재조합 단백질(이식유전자) 발현에 대한 전위성 및 플라스미드 벡터로부터의 분비 단백질의 발현 효과를 도시한 도면. 전위성 또는 규칙적 플라스미드 벡터를 분비 단백질 SRP9, SRP14, SRP54, SRP 수용체 알파 및 베타 서브유닛(SR), 또는 트랜스로콘(Translocon)을 발현시키도록 구성하였다. 전위성 벡터를 피기백 트랜스포사제 벡터(우측 패널)로 형질감염시킨 반면, 본 명세서에 기재한 바와 같은 인플릭시맙(인플릭시맙) 항체를 발현시키는 세포 클론에서, 비-전위성 플라스미드 벡터를 단독으로 형질감염시켰다(좌측 패널). 선택이 있는(좌측 패널) 또는 선택이 없는(우측 패널) 배양의 3주 후에, 분비된 인플릭시맙 항체의 수준을 세포 배양 상청액으로부터 분석하였다. 알 수 있는 바와 같이, 구체적 생산성, 즉, 이식유전자 발현 가공(TEP) 단백질 또는 TEP 기능성 RNA를 암호화하는 서열을 함유하는 세포의 상대적 발현은 TEP가 없는 모 세포에 비해 트랜스포존 벡터를 이용할 때 각각 0.25 내지 1.5로부터 1 내지 2.5까지 증가되었다.
도 7: 전기천공된 CHO -M 세포 현탁액으로부터의 재조합 단백질 발현을 도시한 도면
(A) 피기백(piggyBac) 트랜스포사제의 존재(+PB) 또는 부재(-PB)에서 X-29-보유 GFP-발현 트랜스포존 벡터와 함께 1회 또는 2회 전기천공된 CHO-M 세포. 선택이 없을 때 수행한 배양의 3주 후에 안정한 GFP-발현 세포의 백분율을 나타낸다.
(B) GFP-양성 세포의 GFP 형광의 평균.
(C) 베바시주맙(Beva), 아달리무맙(Adal) 및 리툭시맙(Ritu) 항체의 면역글로불린 경쇄 및 중쇄를 암호화하는 cDNA를 GFP 대신 MAR X29-함유 트랜스포존 플라스미드에 도입하였다. 경쇄 및 중쇄 트랜스포존 작제물을 CHO-M 세포에서 피기백 트랜스포사제 발현 벡터와 12일 간격으로 3회 전기천공하였다. 선택이 없이 성장시킨 다클론성 세포 풀의 배양 상청액에서 분비된 면역글로불린의 수준을 나타낸다(열린 막대). 대안적으로, 비선택 다클론성 세포 집단을 자기 마이크로-비드를 이용하여 그들의 표면에서 면역글로불린을 제시하는 세포를 패닝(panning)함으로써 분류하였다: 비분류 집단에 대해 분비된 면역글로불린의 수준을 나타낸다(닫힌 막대).
(D) 면역글로불린-발현 콜로니를 콜로니-피킹(picking) 장치를 이용하여 형질감염 세포 집단으로부터 분류하였고, 각각 3개의 면역글로불린을 발현시키는 2개 클론을 스핀-관 생물반응기 내에서 유가배양으로 성장시켰다. 분비된 면역글로불린의 수준을 나타내고, 패널 (C)에 대해 결정하였다.
도 8 SRP14의 비상동 발현은 트라스투주맙 분비를 개선시키고 , 인플릭시맙 분비를 회복시킨다는 것을 도시한 도면
트라스투주맙(A) 또는 인플릭시맙(B) 면역글로불린을 발현시키는 CHO-K1 HP 및 LP 클론을 가장 높게 얻어진 수준에서 SRP14 발현 벡터 및 단클론성 집단으로 안정하게 재형질감염시키고, 단리시켰다. 유래된 서브클론, 표지된 A 내지 E를 배취 배양 조건에서 세포 성장 및 생성에 대해 평가하였다. 세포 밀도(세포/㎖) 및 IgG 역가(㎍/㎖)를 배양의 7일 내내 각각의 샘플링 일자에 대해 플롯팅하였다. (C) 모 HP 및 LP 클론(-)에 비해 SRP14 발현 벡터(레인 S)로 형질감염 후 트라스투주맙(HP) 및 인플릭시맙(LP) 서브클론의 구체적 생산성 분포. (D) SRP14 mRNA의 상대적 수준을 5개 개개 SRP14-LP A 내지 E 서브클론 및 모 대조군 LP 클론에 대해 결정하고 나서, 그들을 4회 배양 실행으로부터의 특이적 IgG 생산성에 대해 플롯팅하였다. mRNA 및 구체적 생산성 평균 및 표준 편차값을 LP 대조군 클론 이상의 배수적 증가로서 표현한다.
도 9는 SRP14의 비상동 발현이 생성 방법에서 발현이 어려운 면역글로불린의 고수율을 매개한다는 것을 도시한 도면
도 8에서 분석한 바와 같이 SRP14 벡터-형질감염된 트라스투주맙 HP 서브클론 B(A) 및 인플릭시맙 LP 서브클론 E(B)를 유가배양에서 25㎖의 작업 용적으로 125㎖ 통기 진탕 플라스크 용기에서 배양시키고 나서, 살아있는 세포 밀도 및 IgG 역가를 11일 시간 과정 동안 결정하였다.
도 10은 SRP14 발현이 CHO 세포 클론에 의한 경쇄 응집을 없앤다는 것을 도시한 도면
(A) LP-유래 SRP14-LP 서브클론 E 및 HP-유래 SRP14-HP 서브클론 B(레인 S)에 대해, 또는 대조군 GFP 단백질을 발현시키는 CHO 서브클론(레인 G)에 대해 원심분리에 의해 수집한 Tx100-침투 세포의 상청액 및 펠렛을 Tx-100 가용성 및 Tx-100 불용성 표지 패널 각각에 의해 도시한 바와 같이 SDS-PAGE에 의해 분석하였다. 화살촉은 오가공된(misprocessed) 유리 LC 및 응집된(응집) LC를 나타낸다. (B) SRP14-LP 클론 E 및 LP-대조군 클론 E에 의해 생성된 다양한 LC, HC 및 IgG 조립체 중간체의 추적 분석을 수행하였고, 결과를 나타낸다.
도 11 면역글로불린 분비에 대한 SRP , SR 및 트랜스로콘 서브유닛의 조합된 발현의 효과를 도시한 도면
(A) 인플릭시맙 LP 클론 E을 SRP, SR 및 트랜스로콘 전위성 발현 벡터의 다양한 조합으로 재형질감염시켰다. 이어서, 얻어진 세포 풀의 구체적 생산성을 배취(batch) 배양에서 평가하였고, LP-대조군 세포 pcd 값의 a%로서 나타낸다. 박스-플롯은 독립적 배양 실행의 제3일에 결정한 정규화된 구체적 생산성의 중간, 상한 사분위수 및 하한 사분위수를 나타낸다. (B) SRP14-발현 인플릭시맙 생성 세포 서브클론 E를 다양한 SR 및 트랜스로콘 전위성 발현 벡터 조합으로 재형질감염시켰다. 세포 풀의 구체적 생산성을 패널 A에 대해 나타낸다.
도 12 SRP14 -발현 클론으로부터 인플릭시맙 분비의 구조(rescue)를 위한 모델을 도시한 도면
SRP/트랜스로콘 서브유닛 과발현 전(A) 및 후 (B)에 낮은 생산자 클론에 의한 IgG 폴딩 및 분비의 모델. 데이터는 낮은 생성자 클론에 의해 생성된 신합성된 LC가 부적절한 가공 및 폴딩 상태를 나타낸다는 것을 나타낸다. 인플릭시맙 LC의 신호 펩타이드 오가공은 ER 공번역 전위 기작의 포화를 야기할 수 있다(패널 A, 1번). IgG 조립체-부적격 응집 LC 형태 내의 ER에서 그것의 응집(패널 A, 2번)은 ER 스트레스를 유도하고, 자가소화포(autophagosome)-유사 구조의 형성(패널 A, 3번)을 촉발한다. SRP14 및 다른 SRP/트랜스로콘 구성성분 단백질의 과발현은 인플릭시맙 IgG의 가공 및 분비를 완전히 구하였다(패널 B). SRP14 신장은 활성을 막고 그의 mRNA의 번역 동안 LC ER 전위를 가능하게 지연시킨다(패널 B, 1번). 이는 결국 LC의 정확한 가공 및 ER 폴딩 샤페론과의 그의 적절한 상호작용을 돕는다(패널 B, 2번). 따라서 IgG 조립체-적격에서 신합성된 LC의 유지는 완전히-조립된 항체의 고수율 분비를 회복한다(패널 B, 3번).
도 13 발현에 대한 HR 및 NHEJ의 si -RNA 넉다운의 효과를 도시한 도면
비처리 세포(모의), 음성 siRNA(siNeg)로 처리한 세포, 음성 siRNA(siNeg)로 처리한 세포, NHEJ 인자(siKu70+80+DNA-PKcs)에 대한 siRNA 및 항-HR siRNA (siRad51)에서 재조합 사건의 빈도를 나타내는 GFP-양성 세포(본 명세서에서 1.0으로서 나타낸 GFP 대조군 플라스미드로 형질감염된 세포에 대해)의 백분율에서 배수 차이. GFP 레인은 GFP 발현 세포의 양성 대조군을 나타낸다. HR 비분해 및 NHEJ 비분해 - 표지한 레인은 음성 대조군 세포, 즉, 원형 HR 및 NHEJ 리포트 플라스미드로 형질감염된 세포를 나타낸다. HR I-Scel 및 NHEJ I-Scel-표지 레인은 각각 상동성 재조합 또는 비-상동성 말단 결합에 의한 DNA 절단 수선 시 GFP 발현을 회복하는 Scel-절단 수송체 플라스미드로 형질감염된 세포를 나타낸다. 도면은 GFP-양성 세포의 백분율로서 나타낸 바와 같이 dsRed-양성 세포의 백분율에 대해 정규화되고 GFP 대조군 세포의 백분율 이상의 배수 변화로서 표현되며, 1로 설정된 HR 또는 NHEJ를 저해하기 위한 siRNA의 효능을 나타낸다. 3회 실험의 평균, 오차막대(error bar)는 평균의 표준오차를 나타낸다. 비대응 스튜던트 t-검정(unpaired Student's t-test)에 의해 통계학적 유의도를 결정하였다; 유의 수준 p<0.05 (*) 및 p<0.01 (**).
도 14 NHEJ의 siRNA 넉다운에서 MAR의 효과를 도시한 도면
NHEJ 인자에 대해 siRNA로 처리하고 GFP 또는 MAR-GFP 플라스미드로 재형질감염시킨 GFP 발현 및 통합 CHO 세포에서의 배수적 증가를 나타낸다. 평균 GFP 형광, 복제수 및 GFP 복제물 당 형광을 GFP 플라스미드로 형질감염시킨 비처리 세포('모의'로서 표시함)로부터 얻은 결과에 걸쳐 배수적 증가로서 나타낸다. A) 유세포 분석 결과, B) qPCR에 의한 게놈에서 GFP 복제수의 분석, C) 각각의 통합된 GFP 유전자의 평균 형광(발현과 복제수 간의 비로서 각각의 실험에 대해 계산). 3회 이상의 실험의 평균; 비대응 스튜던트 t-검정에 의해 결정한 통계학적 유의도. 별표는 siRNA-처리된 샘플과 대응하는 비처리 대조군 간의 유의한 차이를 나타낸다; 유의 수준: p<0.05 (*), p<0.01 (**); 오차 막대는 평균의 표준 오차를 나타낸다.
도 15 HR의 siRNA 넉다운에서 MAR의 효과를 도시한 도면
HR 인자에 대해 siRNA로 처리하고 GFP 또는 MAR-GFP 플라스미드로 재형질감염시킨 GFP 발현 및 통합 CHO 세포에서 배수적 증가. 평균 GFP 형광, 복제수 및 GFP 복제물 당 형광을 GFP 플라스미드로 형질감염시킨 비처리 세포('모의'로서 표시)로부터 얻은 결과에 대해 배수적 증가로서 나타낸다. A) 유세포분석 결과, B) qPCR에 의해 게놈 내 GFP 복제수의 분석, C) 각각의 통합된 GFP 유전자의 평균 형광(발현과 복제수 간의 비로서 각각의 실험에 대해 계산함). 3회 이상의 실험의 평균; 통계학적 유의도를 비대응 스튜던트 t-검정에 의해 결정하였다. 별표는 siRNA-처리 샘플과 대응하는 비처리 대조군 간의 유의한 차이를 나타낸다; 유의 수준: p<0.05 (*), p<0.01 (**); 오차 막대는 평균의 표준 오차를 나타낸다.
도 16은 MMEJ의 siRNA 넉다운의 MAR의 효과를 도시한 도면
MMEJ 인자(및 일부 HR 인자)에 대해 siRNA로 처리하고 GFP(A) 또는 MAR-GFP 플라스미드(B)로 재형질감염시킨 GFP 발현 및 통합 CHO 세포를 나타낸다. GFP 복제물 당 평균 GFP 형광, 복제수 및 형광을 GFP 플라스미드로 형질감염시킨 비처리 세포('모의'로서 표시)로부터 얻은 결과에 대해 배수적 증가로서 나타낸다. 도면은 유세포분석기 결과를 나타낸다. 하부에 표시한 실험 수의 평균을 나타낸다. siMDC로 형질감염시키지 않은 세포보다 11.8배 더 높은 비율로 세포를 siMDC1로 형질감염시키고 나서, 심지어 MAR 없이 GFP를 발현시켰다. 또한 MAR, 즉, siBard1 및 siLigl을 함유하는 특정 플라스미드로 특히 양호한 결과를 달성할 수 있었다.
도 17 HR 단백질의 si -RNA-매개 넉다운의 효과를 도시한 도면
도면은 더 높은 GFP 및 면역글로불린 발현이 Rad51-관련 shRNA를 안정하게 발현시키는 CHO-M 세포로부터 달성될 수 있다는 것을 나타낸다. CHO-M 세포를 피기백-유래 전위성 Rad51 shRNA 발현 벡터로 형질감염시켰고, 다클론성 세포뿐만 아니라 이의 유래된 세포 클론을 모 CHO-M 세포와 함께 GFP 발현 플라스미드로 재형질감염시켰다. Rad51-shRNA 발현 세포 풀의 그리고 유래된 클론의 모 CHO-M의 GFP 형광을 GFP 및 퓨로마이신 내성 유전자의 안정한 발현을 위한 선택 후 10일에 평가하였다. 가장 형광인 클론 중 둘의 형광 프로파일은 패널 A에서 수평 막대 표지한 1, 2 및 3에 의해 도시한 바와 같이 세포 풀 및 모 세포의 프로파일(A)뿐만 아니라 퓨로마이신 내성의 선택 후 10일에 M1, M2 및 M3 섹터에서 세포의 백분율(B) 다음에 나타낸다. 모 CHO_M 세포 (C)와 비교할 때 shRNA-발현 세포 클론으로부터 더 높고 더 안정한 발현이 얻어질 수 있다는 것을 나타내기 위해 선택 없이 68일의 추가 배양 동안 고도로 발현된 M3 세포의 비율을 따랐다. 대안적으로, 인플릭시맙 항체의 경쇄 및 중쇄를 암호화하는 발현 플라스미드를 대표적인 클론에 형질감염시키고 나서, 항생물질이 없는 추가 배양의 3주 동안 선택 후에 분비된 면역글로불린의 구체적 생산성을 평가하였다.
도 18 두 MAR 작제물에서 FACS 분석에 의해 GFP 형광에 대해 평가한 바와 같이 높은 그리고 매우 높은 생성자 세포의 백분율( % M3/M2)에 대한 다양한 인간 재조합 상류 MAR의 효과를 도시한 도면. (A) MAR 구성요소는 작제물의 명칭에 표시된 바와 같이 MAR X-29(X_29R2(서열번호 9), X_29R3(서열번호 10), MAR 1-42(1_42R2Bis, 1_42R3), MAR 1-6(1_6R2(서열번호 8), 1_6R3) 또는 MAR 1-68(1_68R2(서열번호 7)의 재배열된 유도체였다. (B) 최고의 상류 MAR 구성요소(MAR 1_68R(서열번호 6))에 대해 얻은 전형적인 FACS 프로파일.
도 19 두 MAR 벡터에서 발현의 안정성을 도시한 도면
1_68R2, 1_6R2 및 X_29R3 MAR 유도체를 함유하는 벡터로부터 구성한 다클론성 집단을 선택 없이 배양의 5주 기간에 걸쳐 시험하고 나서, GFP 형광을 이 기간에 걸쳐 매주 평가하였다. M3 하위집단의 백분율을 평가하였다: 상류의 MAR로서 1_6R2 구성요소 및 하류의 MAR로서 비재배열된 MAR 1-68은 두 MAR과 벡터의 최상의 시험 조합이었다. M1 및 M2 하위집단을 또한 나타낸다.
도 20 단일 유전자 구성요소를 함유하는 발현 벡터를 도시한 도면
MAR 1_68 및 X_29를 시험하고 LmnB2 복제자와 조합하여 사용하였다. MAR를 이식유전자 발현 카세트의 하류에 위치시키고 나서, 2개월의 기간에 걸쳐 이식유전자 형질감염 분석에서 평가하였다. 안정하게 형질감염된 세포의 다클론성 집단을 2주 동안 항생물질 내성에 대해 선택하고 나서, 7주 동안 형광-활성화 세포 분류기(fluorescence-activated cell sorter: FACS) 분석을 시험하였다. 고 생성자 M3 세포의 비율을 (A)에 나타내는 한편, 전형적인 FACS 프로파일을 (B)에 나타낸다.
도 21 단일 유전자 구성요소를 함유하는 발현벡터: X-29를 도시한 도면
X_29 벡터의 안정성 분석: 발현 카세트 하류의 단일 X_29를 함유하는 발현 벡터는 안정하고 배양의 14주(27회 계대) 후조차 M2 및 M3 하위 집단의 매우 높은 백분율을 제공한다는 것을 나타낸다.
도 22 항생물질 선택의 24주 후에 안정하게 형질감염시킨 CHO 집단의 비교 분석
발현 카세트(퓨로_CGAPD_GFP_가스트린_X29) 하류의 단일 X_29 MAR을 지니는 벡터는 높은 GFP 발현 세포의 발생률을 증가시키고, 또한 시간에 따른 발현 안정성을 상류의 MAR로서 1_6R2 및 하류의 MAR로서 1_68(퓨로_1_6R2_CGAPD_GFP_가스트린_1_68)의 두 MAR을 지니는 벡터와 비교한다.
PB(피기백) 트랜스포존에 MAR 구성요소를 첨가할지 여부를 시험하는 것은 전위 효율 및 이식유전자 발현에 영향을 미칠 수 있고, 작제물 내 MAR의 위치가 이들 효과에 임의의 영향을 미치는지 여부를 평가하기 위해, GFP 및 퓨로마이신 내성(퓨로(퓨로)) 유전자를 함유하는 일련의 트랜스포존 공여체 작제물을 설계하였는데, 이때 MAR 1_68 또는 제어 중성 스페이서 DNA 서열을 플라스미드 내 상이한 위치에 삽입하였다. MAR 또는 스페이서 서열 첨가의 효과에 비해 증가된 트랜스포존 크기의 영향을 구별하기 위해 삽입물이 없는 모 퓨로-GFP 트랜스포존 플라스미드를 전위의 대조군으로서 사용하였다.
도 2 트랜스포존 벡터: 전위 효율을 도시한 도면
다양한 트랜스포존 작제물의 전위 효율을 (A) 형질감염시키고 항생물질 선택이 없이 배양하고서 3주 후에 GFP-발현 세포의 백분율을 평가하고 (B) 퓨로마이신-내성을 계수화함으로써 측정하였다.
도 3 트랜스포존 벡터: 발현 수준을 도시한 도면
발현 수준의 분석은 GFP-양성 세포 단독의 형광을 고려하여 (A) 형질감염 후 퓨로마이신 내성에 대한 분비가 없는 배양 또는 (B) 형질감염 후 퓨로마이신 내성에 대한 분비가 있는 배양의 3주 후 CHO 세포의 GFP 형광 수준을 프로빙함으로써 트랜스포사제 발현 플라스미드가 있거나(+PB) 또는 없이(-PB) 형질감염된 상이한 트랜스포존 벡터에 의해 허용한다.
도 4 이식유전자 게놈 통합에 대한 MAR 및 트랜스포사제의 효과를 도시한 도면
qPCR을 이용하여 통합된 GFP 이식유전자 복제물의 수를 결정하고, 도 1 내지 도 3에 대한 범례에 기재한 바와 같이 생성된 비선택 CHO 세포(A), 또는 퓨로마이신-내성 세포 (B)로부터 단리한 게놈 DNA를 이용하여, 세포 B2M 유전자에 대해 값을 정규화시켰다. 값은 평균 ± SEM(n=3)을 나타낸다. *P<0,05.
도 5 이식유전자 당 이식유전자 발현을 도시한 도면
(A) 퓨로마이신 선택이 없는 게놈 및 (B) 퓨로마이신 선택이 있는 게놈 내에 통합을 위한 벡터의 성향과 독립적인, 벡터의 고유한 발현 가능성의 평가.
도 6 재조합 단백질(이식유전자) 발현에 대한 전위성 및 플라스미드 벡터로부터의 분비 단백질의 발현 효과를 도시한 도면. 전위성 또는 규칙적 플라스미드 벡터를 분비 단백질 SRP9, SRP14, SRP54, SRP 수용체 알파 및 베타 서브유닛(SR), 또는 트랜스로콘(Translocon)을 발현시키도록 구성하였다. 전위성 벡터를 피기백 트랜스포사제 벡터(우측 패널)로 형질감염시킨 반면, 본 명세서에 기재한 바와 같은 인플릭시맙(인플릭시맙) 항체를 발현시키는 세포 클론에서, 비-전위성 플라스미드 벡터를 단독으로 형질감염시켰다(좌측 패널). 선택이 있는(좌측 패널) 또는 선택이 없는(우측 패널) 배양의 3주 후에, 분비된 인플릭시맙 항체의 수준을 세포 배양 상청액으로부터 분석하였다. 알 수 있는 바와 같이, 구체적 생산성, 즉, 이식유전자 발현 가공(TEP) 단백질 또는 TEP 기능성 RNA를 암호화하는 서열을 함유하는 세포의 상대적 발현은 TEP가 없는 모 세포에 비해 트랜스포존 벡터를 이용할 때 각각 0.25 내지 1.5로부터 1 내지 2.5까지 증가되었다.
도 7: 전기천공된 CHO -M 세포 현탁액으로부터의 재조합 단백질 발현을 도시한 도면
(A) 피기백(piggyBac) 트랜스포사제의 존재(+PB) 또는 부재(-PB)에서 X-29-보유 GFP-발현 트랜스포존 벡터와 함께 1회 또는 2회 전기천공된 CHO-M 세포. 선택이 없을 때 수행한 배양의 3주 후에 안정한 GFP-발현 세포의 백분율을 나타낸다.
(B) GFP-양성 세포의 GFP 형광의 평균.
(C) 베바시주맙(Beva), 아달리무맙(Adal) 및 리툭시맙(Ritu) 항체의 면역글로불린 경쇄 및 중쇄를 암호화하는 cDNA를 GFP 대신 MAR X29-함유 트랜스포존 플라스미드에 도입하였다. 경쇄 및 중쇄 트랜스포존 작제물을 CHO-M 세포에서 피기백 트랜스포사제 발현 벡터와 12일 간격으로 3회 전기천공하였다. 선택이 없이 성장시킨 다클론성 세포 풀의 배양 상청액에서 분비된 면역글로불린의 수준을 나타낸다(열린 막대). 대안적으로, 비선택 다클론성 세포 집단을 자기 마이크로-비드를 이용하여 그들의 표면에서 면역글로불린을 제시하는 세포를 패닝(panning)함으로써 분류하였다: 비분류 집단에 대해 분비된 면역글로불린의 수준을 나타낸다(닫힌 막대).
(D) 면역글로불린-발현 콜로니를 콜로니-피킹(picking) 장치를 이용하여 형질감염 세포 집단으로부터 분류하였고, 각각 3개의 면역글로불린을 발현시키는 2개 클론을 스핀-관 생물반응기 내에서 유가배양으로 성장시켰다. 분비된 면역글로불린의 수준을 나타내고, 패널 (C)에 대해 결정하였다.
도 8 SRP14의 비상동 발현은 트라스투주맙 분비를 개선시키고 , 인플릭시맙 분비를 회복시킨다는 것을 도시한 도면
트라스투주맙(A) 또는 인플릭시맙(B) 면역글로불린을 발현시키는 CHO-K1 HP 및 LP 클론을 가장 높게 얻어진 수준에서 SRP14 발현 벡터 및 단클론성 집단으로 안정하게 재형질감염시키고, 단리시켰다. 유래된 서브클론, 표지된 A 내지 E를 배취 배양 조건에서 세포 성장 및 생성에 대해 평가하였다. 세포 밀도(세포/㎖) 및 IgG 역가(㎍/㎖)를 배양의 7일 내내 각각의 샘플링 일자에 대해 플롯팅하였다. (C) 모 HP 및 LP 클론(-)에 비해 SRP14 발현 벡터(레인 S)로 형질감염 후 트라스투주맙(HP) 및 인플릭시맙(LP) 서브클론의 구체적 생산성 분포. (D) SRP14 mRNA의 상대적 수준을 5개 개개 SRP14-LP A 내지 E 서브클론 및 모 대조군 LP 클론에 대해 결정하고 나서, 그들을 4회 배양 실행으로부터의 특이적 IgG 생산성에 대해 플롯팅하였다. mRNA 및 구체적 생산성 평균 및 표준 편차값을 LP 대조군 클론 이상의 배수적 증가로서 표현한다.
도 9는 SRP14의 비상동 발현이 생성 방법에서 발현이 어려운 면역글로불린의 고수율을 매개한다는 것을 도시한 도면
도 8에서 분석한 바와 같이 SRP14 벡터-형질감염된 트라스투주맙 HP 서브클론 B(A) 및 인플릭시맙 LP 서브클론 E(B)를 유가배양에서 25㎖의 작업 용적으로 125㎖ 통기 진탕 플라스크 용기에서 배양시키고 나서, 살아있는 세포 밀도 및 IgG 역가를 11일 시간 과정 동안 결정하였다.
도 10은 SRP14 발현이 CHO 세포 클론에 의한 경쇄 응집을 없앤다는 것을 도시한 도면
(A) LP-유래 SRP14-LP 서브클론 E 및 HP-유래 SRP14-HP 서브클론 B(레인 S)에 대해, 또는 대조군 GFP 단백질을 발현시키는 CHO 서브클론(레인 G)에 대해 원심분리에 의해 수집한 Tx100-침투 세포의 상청액 및 펠렛을 Tx-100 가용성 및 Tx-100 불용성 표지 패널 각각에 의해 도시한 바와 같이 SDS-PAGE에 의해 분석하였다. 화살촉은 오가공된(misprocessed) 유리 LC 및 응집된(응집) LC를 나타낸다. (B) SRP14-LP 클론 E 및 LP-대조군 클론 E에 의해 생성된 다양한 LC, HC 및 IgG 조립체 중간체의 추적 분석을 수행하였고, 결과를 나타낸다.
도 11 면역글로불린 분비에 대한 SRP , SR 및 트랜스로콘 서브유닛의 조합된 발현의 효과를 도시한 도면
(A) 인플릭시맙 LP 클론 E을 SRP, SR 및 트랜스로콘 전위성 발현 벡터의 다양한 조합으로 재형질감염시켰다. 이어서, 얻어진 세포 풀의 구체적 생산성을 배취(batch) 배양에서 평가하였고, LP-대조군 세포 pcd 값의 a%로서 나타낸다. 박스-플롯은 독립적 배양 실행의 제3일에 결정한 정규화된 구체적 생산성의 중간, 상한 사분위수 및 하한 사분위수를 나타낸다. (B) SRP14-발현 인플릭시맙 생성 세포 서브클론 E를 다양한 SR 및 트랜스로콘 전위성 발현 벡터 조합으로 재형질감염시켰다. 세포 풀의 구체적 생산성을 패널 A에 대해 나타낸다.
도 12 SRP14 -발현 클론으로부터 인플릭시맙 분비의 구조(rescue)를 위한 모델을 도시한 도면
SRP/트랜스로콘 서브유닛 과발현 전(A) 및 후 (B)에 낮은 생산자 클론에 의한 IgG 폴딩 및 분비의 모델. 데이터는 낮은 생성자 클론에 의해 생성된 신합성된 LC가 부적절한 가공 및 폴딩 상태를 나타낸다는 것을 나타낸다. 인플릭시맙 LC의 신호 펩타이드 오가공은 ER 공번역 전위 기작의 포화를 야기할 수 있다(패널 A, 1번). IgG 조립체-부적격 응집 LC 형태 내의 ER에서 그것의 응집(패널 A, 2번)은 ER 스트레스를 유도하고, 자가소화포(autophagosome)-유사 구조의 형성(패널 A, 3번)을 촉발한다. SRP14 및 다른 SRP/트랜스로콘 구성성분 단백질의 과발현은 인플릭시맙 IgG의 가공 및 분비를 완전히 구하였다(패널 B). SRP14 신장은 활성을 막고 그의 mRNA의 번역 동안 LC ER 전위를 가능하게 지연시킨다(패널 B, 1번). 이는 결국 LC의 정확한 가공 및 ER 폴딩 샤페론과의 그의 적절한 상호작용을 돕는다(패널 B, 2번). 따라서 IgG 조립체-적격에서 신합성된 LC의 유지는 완전히-조립된 항체의 고수율 분비를 회복한다(패널 B, 3번).
도 13 발현에 대한 HR 및 NHEJ의 si -RNA 넉다운의 효과를 도시한 도면
비처리 세포(모의), 음성 siRNA(siNeg)로 처리한 세포, 음성 siRNA(siNeg)로 처리한 세포, NHEJ 인자(siKu70+80+DNA-PKcs)에 대한 siRNA 및 항-HR siRNA (siRad51)에서 재조합 사건의 빈도를 나타내는 GFP-양성 세포(본 명세서에서 1.0으로서 나타낸 GFP 대조군 플라스미드로 형질감염된 세포에 대해)의 백분율에서 배수 차이. GFP 레인은 GFP 발현 세포의 양성 대조군을 나타낸다. HR 비분해 및 NHEJ 비분해 - 표지한 레인은 음성 대조군 세포, 즉, 원형 HR 및 NHEJ 리포트 플라스미드로 형질감염된 세포를 나타낸다. HR I-Scel 및 NHEJ I-Scel-표지 레인은 각각 상동성 재조합 또는 비-상동성 말단 결합에 의한 DNA 절단 수선 시 GFP 발현을 회복하는 Scel-절단 수송체 플라스미드로 형질감염된 세포를 나타낸다. 도면은 GFP-양성 세포의 백분율로서 나타낸 바와 같이 dsRed-양성 세포의 백분율에 대해 정규화되고 GFP 대조군 세포의 백분율 이상의 배수 변화로서 표현되며, 1로 설정된 HR 또는 NHEJ를 저해하기 위한 siRNA의 효능을 나타낸다. 3회 실험의 평균, 오차막대(error bar)는 평균의 표준오차를 나타낸다. 비대응 스튜던트 t-검정(unpaired Student's t-test)에 의해 통계학적 유의도를 결정하였다; 유의 수준 p<0.05 (*) 및 p<0.01 (**).
도 14 NHEJ의 siRNA 넉다운에서 MAR의 효과를 도시한 도면
NHEJ 인자에 대해 siRNA로 처리하고 GFP 또는 MAR-GFP 플라스미드로 재형질감염시킨 GFP 발현 및 통합 CHO 세포에서의 배수적 증가를 나타낸다. 평균 GFP 형광, 복제수 및 GFP 복제물 당 형광을 GFP 플라스미드로 형질감염시킨 비처리 세포('모의'로서 표시함)로부터 얻은 결과에 걸쳐 배수적 증가로서 나타낸다. A) 유세포 분석 결과, B) qPCR에 의한 게놈에서 GFP 복제수의 분석, C) 각각의 통합된 GFP 유전자의 평균 형광(발현과 복제수 간의 비로서 각각의 실험에 대해 계산). 3회 이상의 실험의 평균; 비대응 스튜던트 t-검정에 의해 결정한 통계학적 유의도. 별표는 siRNA-처리된 샘플과 대응하는 비처리 대조군 간의 유의한 차이를 나타낸다; 유의 수준: p<0.05 (*), p<0.01 (**); 오차 막대는 평균의 표준 오차를 나타낸다.
도 15 HR의 siRNA 넉다운에서 MAR의 효과를 도시한 도면
HR 인자에 대해 siRNA로 처리하고 GFP 또는 MAR-GFP 플라스미드로 재형질감염시킨 GFP 발현 및 통합 CHO 세포에서 배수적 증가. 평균 GFP 형광, 복제수 및 GFP 복제물 당 형광을 GFP 플라스미드로 형질감염시킨 비처리 세포('모의'로서 표시)로부터 얻은 결과에 대해 배수적 증가로서 나타낸다. A) 유세포분석 결과, B) qPCR에 의해 게놈 내 GFP 복제수의 분석, C) 각각의 통합된 GFP 유전자의 평균 형광(발현과 복제수 간의 비로서 각각의 실험에 대해 계산함). 3회 이상의 실험의 평균; 통계학적 유의도를 비대응 스튜던트 t-검정에 의해 결정하였다. 별표는 siRNA-처리 샘플과 대응하는 비처리 대조군 간의 유의한 차이를 나타낸다; 유의 수준: p<0.05 (*), p<0.01 (**); 오차 막대는 평균의 표준 오차를 나타낸다.
도 16은 MMEJ의 siRNA 넉다운의 MAR의 효과를 도시한 도면
MMEJ 인자(및 일부 HR 인자)에 대해 siRNA로 처리하고 GFP(A) 또는 MAR-GFP 플라스미드(B)로 재형질감염시킨 GFP 발현 및 통합 CHO 세포를 나타낸다. GFP 복제물 당 평균 GFP 형광, 복제수 및 형광을 GFP 플라스미드로 형질감염시킨 비처리 세포('모의'로서 표시)로부터 얻은 결과에 대해 배수적 증가로서 나타낸다. 도면은 유세포분석기 결과를 나타낸다. 하부에 표시한 실험 수의 평균을 나타낸다. siMDC로 형질감염시키지 않은 세포보다 11.8배 더 높은 비율로 세포를 siMDC1로 형질감염시키고 나서, 심지어 MAR 없이 GFP를 발현시켰다. 또한 MAR, 즉, siBard1 및 siLigl을 함유하는 특정 플라스미드로 특히 양호한 결과를 달성할 수 있었다.
도 17 HR 단백질의 si -RNA-매개 넉다운의 효과를 도시한 도면
도면은 더 높은 GFP 및 면역글로불린 발현이 Rad51-관련 shRNA를 안정하게 발현시키는 CHO-M 세포로부터 달성될 수 있다는 것을 나타낸다. CHO-M 세포를 피기백-유래 전위성 Rad51 shRNA 발현 벡터로 형질감염시켰고, 다클론성 세포뿐만 아니라 이의 유래된 세포 클론을 모 CHO-M 세포와 함께 GFP 발현 플라스미드로 재형질감염시켰다. Rad51-shRNA 발현 세포 풀의 그리고 유래된 클론의 모 CHO-M의 GFP 형광을 GFP 및 퓨로마이신 내성 유전자의 안정한 발현을 위한 선택 후 10일에 평가하였다. 가장 형광인 클론 중 둘의 형광 프로파일은 패널 A에서 수평 막대 표지한 1, 2 및 3에 의해 도시한 바와 같이 세포 풀 및 모 세포의 프로파일(A)뿐만 아니라 퓨로마이신 내성의 선택 후 10일에 M1, M2 및 M3 섹터에서 세포의 백분율(B) 다음에 나타낸다. 모 CHO_M 세포 (C)와 비교할 때 shRNA-발현 세포 클론으로부터 더 높고 더 안정한 발현이 얻어질 수 있다는 것을 나타내기 위해 선택 없이 68일의 추가 배양 동안 고도로 발현된 M3 세포의 비율을 따랐다. 대안적으로, 인플릭시맙 항체의 경쇄 및 중쇄를 암호화하는 발현 플라스미드를 대표적인 클론에 형질감염시키고 나서, 항생물질이 없는 추가 배양의 3주 동안 선택 후에 분비된 면역글로불린의 구체적 생산성을 평가하였다.
도 18 두 MAR 작제물에서 FACS 분석에 의해 GFP 형광에 대해 평가한 바와 같이 높은 그리고 매우 높은 생성자 세포의 백분율( % M3/M2)에 대한 다양한 인간 재조합 상류 MAR의 효과를 도시한 도면. (A) MAR 구성요소는 작제물의 명칭에 표시된 바와 같이 MAR X-29(X_29R2(서열번호 9), X_29R3(서열번호 10), MAR 1-42(1_42R2Bis, 1_42R3), MAR 1-6(1_6R2(서열번호 8), 1_6R3) 또는 MAR 1-68(1_68R2(서열번호 7)의 재배열된 유도체였다. (B) 최고의 상류 MAR 구성요소(MAR 1_68R(서열번호 6))에 대해 얻은 전형적인 FACS 프로파일.
도 19 두 MAR 벡터에서 발현의 안정성을 도시한 도면
1_68R2, 1_6R2 및 X_29R3 MAR 유도체를 함유하는 벡터로부터 구성한 다클론성 집단을 선택 없이 배양의 5주 기간에 걸쳐 시험하고 나서, GFP 형광을 이 기간에 걸쳐 매주 평가하였다. M3 하위집단의 백분율을 평가하였다: 상류의 MAR로서 1_6R2 구성요소 및 하류의 MAR로서 비재배열된 MAR 1-68은 두 MAR과 벡터의 최상의 시험 조합이었다. M1 및 M2 하위집단을 또한 나타낸다.
도 20 단일 유전자 구성요소를 함유하는 발현 벡터를 도시한 도면
MAR 1_68 및 X_29를 시험하고 LmnB2 복제자와 조합하여 사용하였다. MAR를 이식유전자 발현 카세트의 하류에 위치시키고 나서, 2개월의 기간에 걸쳐 이식유전자 형질감염 분석에서 평가하였다. 안정하게 형질감염된 세포의 다클론성 집단을 2주 동안 항생물질 내성에 대해 선택하고 나서, 7주 동안 형광-활성화 세포 분류기(fluorescence-activated cell sorter: FACS) 분석을 시험하였다. 고 생성자 M3 세포의 비율을 (A)에 나타내는 한편, 전형적인 FACS 프로파일을 (B)에 나타낸다.
도 21 단일 유전자 구성요소를 함유하는 발현벡터: X-29를 도시한 도면
X_29 벡터의 안정성 분석: 발현 카세트 하류의 단일 X_29를 함유하는 발현 벡터는 안정하고 배양의 14주(27회 계대) 후조차 M2 및 M3 하위 집단의 매우 높은 백분율을 제공한다는 것을 나타낸다.
도 22 항생물질 선택의 24주 후에 안정하게 형질감염시킨 CHO 집단의 비교 분석
발현 카세트(퓨로_CGAPD_GFP_가스트린_X29) 하류의 단일 X_29 MAR을 지니는 벡터는 높은 GFP 발현 세포의 발생률을 증가시키고, 또한 시간에 따른 발현 안정성을 상류의 MAR로서 1_6R2 및 하류의 MAR로서 1_68(퓨로_1_6R2_CGAPD_GFP_가스트린_1_68)의 두 MAR을 지니는 벡터와 비교한다.
본 발명의 내용에서 사용되는 바와 같은 이식유전자는 주어진 성숙 단백질에 대해(또한 본 명세서에서 단백질을 암호화하는 DNA로서 지칭됨), 전구체 단백질에 대해 또는 단백질을 암호화하지 않는 기능성 RNA(비-암호 RNA)에 대해 단리된 데옥시리보뉴클레오타이드(DNA) 서열이다. 이식유전자는 이식유전자 산물을 생성하기 위해 단리되고 세포 내로 도입된다. 본 발명에 따른 일부 바람직한 이식유전자는 면역글로불린(Ig) 및 Fc-융합 단백질 및 기타 단백질, 특히 치료적 활성을 지니는 단백질("생물학적 치료제")을 암호화하는 이식유전자이다. 예를 들어, 특정 면역글로불린, 예컨대 인플릭시맙(레미카드(Remicade)) 또는 다른 분비된 단백질, 예컨대 응고 인자 VIII는 대부분 특성규명되지 않은 세포 병목현상 때문에 발현이 현저하게 어렵다. 본 발명의 재조합 핵산 분자, 벡터 및 방법 덕분에, 이들 병목현상은 동정 및/또는 개방될 수 있다. 이들은 일반적으로 생성될 수 있는 치료적 단백질의 양 및/또는 그들의 품질, 예컨대 그들의 가공, 및 글라이코실화와 같은 번역 후 변형의 균질성을 증가시킨다.
본 명세서에서 사용되는 바와 같은 용어 이식유전자는 단백질을 암호화하는 DNA와 관련하여, 비전사 측접 영역, 예컨대 RNA 전사 개시 신호, 폴리아데닐화 첨가 부위, 프로모터 또는 인핸서를 포함하지 않을 것이다. 다른 바람직한 이식유전자는 기능성 RNA를 암호화하는 DNA 서열을 포함한다. 따라서, 용어 이식유전자는 형질감염(이는 또한 본 발명의 내용에서 형질도입, 즉, 바이러스 벡터를 통한 도입을 포함함)을 통해 진핵 숙주 세포와 같은 세포 내로 도입되고, 또한 "이식유전자 발현 산물", 예를 들어, "비상동 단백질"로서 본 명세서에서 지칭되는 관심 대상 산물을 암호화하는 DNA 서열을 지칭할 때 본 발명에서 사용된다. 이식유전자는 신호 펩타이드를 암호화하는 신호 펩타이드 암호 서열에 기능적으로 부착될 수 있는데, 이는 결국 전위 및/또는 소포체 및/또는 세포질 막에 걸친 분비를 매개하고/하거나 용이하게 하고, 분비 전에 또는 분비 동안 제거된다.
짧은 간섭 RNA( siRNA )는 상보적 뉴클레오타이드 서열을 지니는 특이적 유전자의 발현을 간섭함으로써 RNA 간섭(RNAi)에서 어떤 역할을 하는 이중 가닥 RNA 분자, 일반적으로 20 내지 25개 염기쌍 길이이다. siRNA는 세포 내로 직접 도입될 수 있거나 또는 벡터를 통해 세포 내에서 발현될 수 있다. 본 명세서에서 지칭되는 바와 같은 단리된 TEP siRNA는 보통 세포 내로 직접, 즉, 세포 내로 도입된 핵산을 통해 발현되는 일 없이 도입되는 이러한 20 내지 25개 염기쌍 길이 siRNA이다.
작은/짧은 헤어핀 RNA( shRNA )는 RNAi를 통해 표적 유전자 발현을 침묵시키기 위해 사용될 수 있는 단단한 헤어핀 턴(hairpin turn)을 만드는 RNA 서열이다. 세포에서 shRNA의 발현은 전형적으로 플라스미드 또는 바이러스 벡터, 예컨대 레트로바이러스 벡터의 전달에 의해 수행된다. shRNA를 생성하기 위해, siRNA 서열은 보통 siRNA의 두 가닥 사이에 짧은 루프를 도입하도록 변형된다. 이어서, shRNA를 암호화하는 핵산은 벡터를 통해 세포 내로 전달되고, 짧은 헤어핀 RNA(shRNA)로 전사되는데, 이는 다이세린(Dicerin)에 의해 그의 보통의 방식으로 기능성 siRNA로 가공될 수 있다.
si/shRNA는 표적 유전자를 발현을 서열-특이적으로 감소시킬 수 있다. shRNA는 표적 유전자의 산물을 암호화하는 mRNA 전사체의 영역에 혼성화될 수 있고, 이에 의해 RNA 간섭을 통해 표적 유전자 발현을 저해한다. 2-기능성 shRNA는 하나 이상의 표적, 예를 들어 암호 영역뿐만 아니라 mRNA의 특정 비번역 영역을 가진다. 세포 게놈 내로 통합은 자손 세포로 전달될 수 있는 장기 지속적 또는 구성적 유전자를 용이하게 한다.
마이크로RNA(miRNA)는 작은 RNA 분자, 예를 들어, 20 내지 24, 특히 22개 뉴클레오타이드 길이이고, mRNA 내의 상보적 서열과 짝짓기를 통해 유전자 발현의 전사 및 번역 후 조절에서 작용한다. 유전자 침묵은 이식유전자 전사 저해, mRNA 분해 또는 mRNA가 번역되는 것의 방지를 통해 일어날 수 있다. miRNA는 플라스미드 또는 바이러스 벡터, 예컨대 레트로바이러스 벡터의 전달에 의해 발현될 수 있다. 대안적으로, miRNA를 저해 또는 모방하는 RNA 분자는 합성되고 세포에서 직접 형질감염될 수 있다.
"이식유전자 발현 가공( TEP ) 단백질 또는 TEP 기능성 RNA를 암호화하는 서열"은 그것의 세포 내로 전달 후에 주어진 TEP 단백질을 발현시키거나 또는 발현을 증가시키는 반면, 비암호 기능성 RNA를 암호화하는 서열은 각각 세포 단백질의 발현을 저해한다. TEP 단백질은 세포 단백질과 동일 또는 유사할 수 있거나, 또는 그들은 별개의 세포 또는 종으로부터의 단백질일 수 있다. 발현이, 예를 들어 기능성 RNA에 의해 저해되는 세포 단백질은 기능성 RNA가 도입되는 세포의 구성성분 단백질이다. TEP 단백질은 또한 다른 세포 단백질의 발현을 보충할 수 있고, 그 결과, 바람직하게는, 이식유전자의 발현을 향상시킨다. 단백질은 재조합에; mRNA 번역 과정에; 폴리펩타이드의 ER 전위, 분비, 가공 또는 폴딩에, ER-골지-혈장막 수송, 글라이코실화 및/또는 다른 번역 후 변형에 연루될 수 있다. 기능성 RNA는, 예를 들어, siRNA, shRNA, 마이크로RNA, 레리어트(lariat)-형태 스플라이싱 RNA, 짧은-일시적 센스 RNA(stRNA), 안티센스 RNA(aRNA), 리보자임 RNA 및 다른 RNA, 특히 넉다운 표적 유전자 발현을 넉다운 시킬 수 있는 것을 포함한다. 특정 바람직한 실시형태에서, 이들 단백질은 "단백질 분비 경로"에서 또는 "재조합 경로"에 수반될 뿐만 아니라 이하에 기재되는 바와 같은 특정 단백질 가공 또는 대사 단백질을 포함한다.
TEP 기능성 RNA는 상기 기재한 바와 같은 핵산 서열로부터 발현될 수 있을 뿐만 아니라 세포 내로 직접 도입될 수 있다. 이는, 특히 단리된 TEP siRNA에 대해 그러하다.
용어 "단리된 핵산 분자"는 본 발명과 관련되며, "재조합 핵산 분자", 즉, 이 형태가 천연에서 존재하지 않지만, 자연에서 존재하는 부분으로부터 출발해서 구성된 핵산 분자와 동등하다.
핵산 서열, 예컨대 DNA 또는 RNA는, 예를 들어 2개의 단일 가닥 DNA 가닥 또는 2개의 단일 가닥 RNA 가닥이 안정한 수소 결합, 예컨대 구아닌(G)과 사이토신(C) 사이의 수소 결합을 형성할 수 있다면, 다른 DNA 또는 RNA에 대해 상보적이다. 세포에서, 상보적 염기쌍은, 예를 들어, 세포가 한 세대로부터 다른 세대로 정보를 복제하게 한다. RNA 간섭(RNAi)에서 상보적 염기쌍은 특정 표적 유전자의 침묵 또는 완전한 넉아웃을 허용한다. 본질적으로, siRNA, shRNA 또는 miRNA 서열은 RNA, 특히 숙주 세포의 mRNA에 맞추어 조정되는 단일 RNA 가닥(예를 들어, siRNA에서 안티센스 가닥)을 가짐으로써 표적 유전자의 발현을 특이적으로 감소 또는 넉아웃시킨다. 두 핵산 가닥 간의 상보성 정도는 완전한 상보성(각각의 뉴클레오타이드가 그의 맞은편에 있음)으로부터 부분적 상보성(50%, 60%, 70%, 80%, 90% 또는 95%)으로 다를 수 있다. 상보성 정도는 복합체의 안정성을 결정하고, 이에 따라 유전자가 성공적으로, 예를 들어, 넉아웃될 수 있는 방법을 결정한다. 따라서 완전한 또는 적어도 95% 상보성이 바람직하다.
RNAi에서 siRNA의 활성은 RNA-유도 침묵 복합체(RISC)에 대한 그의 결합 능력에 크게 의존한다. RISC에 대한 듀플렉스 siRNA의 결합은 이후에 풀어지고 엔도뉴클레아제에 의해 센스 가닥이 절단된다. 이어서, 남아있는 안티센스 가닥-RISC 복합체는 전사 침묵을 개시하기 위해 표적 mRNA에 결합할 수 있다.
본 발명의 내용 내에서, 상기 정의한 바와 같은 이식유전자는 일반적으로, 예를 들어 약제학적 용도를 위해 더 다량으로 생성이 요망되는 단백질을 발현시키는 한편, TEP 단백질/기능성 RNA, 또는 기능성 RNA 그 자체를 암호화하는 서열은 직접적으로 또는 간접적으로 이러한 이식유전자를 발현시키도록 설계된다. "트랜스포존 벡터를 사용하여 발현된 TEP 단백질의 예시적 목록"을 표 A에 열거한다. 당업자가 인식할 바와 같이, 대다수의 이들 단백질은 당업계에 개시되었고, 표 A는 각각의 단백질뿐만 아니라 그를 암호화하는 핵산 서열에 대한 NCBI 기준 서열 수를 둘 다 개시한다. 마지막 열은 특정의 해당 서열에 대한 서열 식별자를 제공한다. 당업자는 이어서 80%, 90%, 95% 또는 98% 초과의 서열 동일성을 지니는 서열과 마찬가지로 단백질의 변이체가 본 발명의 부분이라는 것을 인식할 것이다.
"예를 들어, 특이적 피기백 트랜스포존 벡터를 이용하여 발현되는 shRNA의 예시적 목록"을 표 B에 열거한다. 당업자가 인식할 바와 같이, 이러한 shRNA는 표적 유전자가 선택되었을 때 용이하게 구성될 수 있다. 예를 들어, 재조합 경로의 공지된 유전자 중 임의의 하나는 준비된 표적 유전자이다. 그러나, 다른 유전자, 예컨대 표 A에 제시된 단백질에 대한 유전자는 해당 shRNA로부터 생성된 siRNA에 대해 준비된 표적일 수 있다. 표 C는 siRNA의 예(센스 가닥) 및 대응하는 siRNA로부터 생성된 shRNA의 예이다. siRNA의 안티센스 가닥은 궁극적으로 세포 mRNA의 분해를 차단 및/또는 유발하기 위해 사용된다. 이는 일반적으로 mRNA에 의해 암호화된 단백질의 감소된 수준을 야기한다.
동일성은 전체 및 완전한 서열과 같은 두 줄의 이러한 서열 간의 매칭의 동일성에 의해 결정되는 바와 같은 두 뉴클레오타이드 서열 간의 서열 관련성 정도를 의미한다. 동일성은 용이하게 계산될 수 있다. 두 뉴클레오타이드 서열 간의 동일성을 측정하기 위한 다수의 방법이 존재하지만, 용어 "동일성"은 당업자에게 잘 공지되어 있다(Computational Molecular Biology, Lesk, A. M., ed., Oxford University Press, New York, 1988; Biocomputing: Informatics and Genome Projects, Smith, D. W., ed., Academic Press, New York, 1993; Computer Analysis of Sequence Data, Part I, Griffin, A. M., and Griffin, H. G., eds., Humana Press, New Jersey, 1994; Sequence Analysis in Molecular Biology, von Heinje, G., Academic Press, 1987; 및 Sequence Analysis Primer, Gribskov, M. and Devereux, J., eds., M Stockton Press, New York, 1991). 두 서열 간의 동일성을 결정하기 위해 통상적으로 사용되는 방법은 문헌[Guide to Huge Computers, Martin J. Bishop, ed., Academic Press, San Diego, 1994, 및 Carillo, H., and Lipman, D., SIAM J Applied Math. 48: 1073 (1988)]에 개시된 것을 포함하지만, 이들로 제한되지 않는다. 동일성을 결정하기 위한 바람직한 방법은 시험한 두 서열 간에 가장 큰 매치를 제공하도록 설계된다. 이러한 방법은 컴퓨터 프로그램에서 정리된다. 두 서열 간의 동일성을 결정하기 위한 바람직한 컴퓨터 프로그램 방법은 GCG(Genetics Computer Group, Madison Wis.) 프로그램 패키지(Devereux, J., et al., Nucleic Acids Research 12(1). 387 (1984)), BLASTP, BLASTN, FASTA(Altschul et al. (1990); Altschul et al. (1997))를 포함하지만, 이들로 제한되지 않는다. 동일성을 결정하기 위해 잘 공지된 스미스 워터만(Smith Waterman) 알고리즘이 또한 사용될 수 있다.
예시로서, 기준 뉴클레오타이드 서열과 적어도, 예를 들어, 95% "동일성"을 갖는 뉴클레오타이드 서열을 포함하는 핵산은 핵산의 뉴클레오타이드 서열이 기준 뉴클레오타이드 서열의 각각 100개 뉴클레오타이드 당 5개 까지의 점 돌연변이를 포함할 수 있다는 것을 제외하고 기준 서열과 동일하다는 것을 의미한다. 다시 말해서, 기준 뉴클레오타이드 서열에 대해 적어도 95% 동일한 뉴클레오타이드 서열을 갖는 뉴클레오타이드를 얻기 위해, 기준 서열 내 뉴클레오타이드의 5%까지는 결실되거나 또는 다른 뉴클레오타이드로 치환될 수 있고, 또는 기준 서열 내 총 뉴클레오타이드의 5%까지의 뉴클레오타이드의 수는 기준 서열 내로 삽입될 수 있다. 기준 서열의 이들 돌연변이는 기준 뉴클레오타이드 서열의 5' 또는 3' 말단 위치 또는 말단 위치 사이의 어떤 곳에서 생길 수 있고, 기준 서열 내 뉴클레오타이드 중에서 개별적으로 또는 기준 서열 내의 하나 이상의 연속적 기에 배치된다. 본 명세서에 개시된 임의의 서열에 대해 약 60%, 약 70%, 약 75%, 약 85% 또는 약 90% 초과의 서열 동일성(예를 들어, 서열번호에 의해 및/또는 등록번호에 의해)이 또한 본 발명의 범주 내에 있다.
다른 핵산 서열에 대해 실질적 동일성을 갖는 핵산 서열은 기재된 각각의 방법에 대해 영향이 전혀 없거나 또는 미미한 영향이 있으며 종종 100bp에서 1, 2, 3 또는 4개의 돌연변이에 의해 반영되는 그의 서열 내에 점 돌연변이, 결실 또는 첨가를 갖는 서열을 지칭된다.
본 발명은 폴리뉴클레오타이드와 폴리펩타이드 변이체 둘 다에 관한 것이다. "변 이체"는 개시된 폴리뉴클레오타이드 또는 폴리펩타이드와 상이하지만, 이의 본질적 특성을 보유하는 폴리뉴클레오타이드 또는 폴리펩타이드를 지칭한다. 일반적으로, 변이체는 전반적으로 밀접하게 유사하고, 다수의 영역에서, 본 발명의 폴리뉴클레오타이드 또는 폴리펩타이드와 동일하다. 변이체는 암호 영역, 비-암호 영역 또는 둘 다에서 변용을 함유할 수 있다. 침묵 치환, 첨가 또는 결실을 생성하지만 암호화된 폴리펩타이드의 특성 또는 활성을 변용하지 않는 변용을 함유하는 폴리뉴클레오타이드 변이체가 특히 바람직하다. 유전자 암호의 축퇴에 기인하는 침묵 치환에 의해 생성된 뉴클레오타이드 변이체가 바람직하다. 게다가, 본 명세서에 개시된 5 내지 10, 1 내지 5 또는 1 내지 2개 아미노산이 임의의 조합에서 치환, 결실 또는 첨가되는 변이체가 또한 바람직하다. 본 발명은 또한 상기 폴리뉴클레오타이드의 대립유전자 변이체를 포함한다. 대립유전자 변이체는 동일한 염색체 자리를 점유하는 유전자의 임의의 둘 이상의 대안의 형태를 정의한다. 대립유전자 변이는 돌연변이를 통해 자연적으로 일어나며, 집단 내의 다형성을 초래할 수 있다. 유전자 돌연변이는 침묵(암호화된 폴리펩타이드에서 변화 없음)일 수 있거나, 또는 변용된 아미노산 서열을 갖는 폴리펩타이드를 암호화할 수 있다. 폴리펩타이드의 대립유전자 변이체는 유전자의 대립유전자 변이체에 의해 암호화된 폴리펩타이드이다. 본 명세서에 개시된 임의의 핵산 분자의 변이체는 본 발명의 부분이다.
프로모터 서열 또는 단지 프로모터는 특이적 핵산 서열의 발현을 위한 숙주 세포에 의해 인식되는 핵산 서열이다. 프로모터 서열은 폴리뉴클레오타이드의 발현을 조절하는 전사 대조군 서열을 함유한다. 프로모터는 돌연변이체, 절단 및 혼성 프로모터를 포함하는 선택의 숙주 세포에서 전사 활성을 나타내는 임의의 핵산 서열일 수 있고, 숙주 세포에 대해 상동성 또는 비상동성인 세포밖 또는 세포내 폴리펩타이드를 암호화하는 유전자로부터 얻어질 수 있다. 본 발명에 따른 프로모터는 유도성 및 비유도성 프로모터를 포함한다. 핵산 서열은 프로모터의 제어 하에 있고, 프로모터는 상기 핵산에 대한 그의 기능을 발휘한다.
CGAPDH (또한 본 명세서에서 C_ GAPDH 로서 지칭됨)는 인간 GAPDH 프로모터 및 인간 CMV 전초기유전자 인핸서를 포함하는, 인핸서-프로모터 융합이다. 일 실시형태에서, 그것을 생성하기 위해, 인간 GAPDH 프로모터 및 그의 5'UTR은 인간 HEK293 세포 게놈 DNA로부터 증폭된 PCR이었다. 산물은 인간 CMV 전초기유전자 인핸서의 하류에 위치된다. 대표적 서열에 대해 서열번호 11 참조. 서열번호 11과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열은 또한 본 발명의 범주 내에 있다. 다른 바람직한 프로모터(들) 및/또는 인핸서(들) 또는 이들의 융합물은 CMV IE 인핸서, 인간 GAPDH 프로모터, 인간 Ef1 알파 프로모터, CMV 프로모터, SV40 프로모터, CHO Actb 프로모터 또는 CHO Hspa5 프로모터를 포함하지만, 이들로 제한되지 않는다. 이들 구성요소는 당업계에 잘 공지되어 있고, 샘플 서열은 서열번호 110 내지 116 하에 열거되어 있다. 당업자가 이해할 바와 같이, 이들의 변이체는 또한 본 발명의 부분이고, 또한 서열번호 110 내지 116 중 임의의 하나와 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소이다.
"트랜스포존"은 "잘라 붙이기(cut and paste)" 또는 "복제해서 붙이기(copy and paste)" 메커니즘을 통해 벡터와 염색체 사이에서 효율적으로 자리를 바꾸는 이동 유전자 구성요소이다. 전위 동안, 트랜스포사제(예를 들어, 피기백 트랜스포존 시스템 내 PB 트랜스포사제)는 트랜스포존의 양 말단 상에 위치된 트랜스포존-특이적 역위 말단 반복부 서열(ITR)(임의의 트랜스포존 시스템에 대해 5'- 및 3' ITR이 있음)을 인식하고, 내용물을 본래의 부위로부터 이동시키며, 그들을 염색체 부위, 예컨대 TTAA 염색체 부위 내로 통합시킨다. 피기백 트랜스포존 시스템의 강력한 활성은 두 ITR 사이의 관심 대사의 유전자가 표적 게놈 내로 용이하게 이동되게 할 수 있다. 피기백 트랜스포존 시스템은, 예를 들어, 전문이 본 명세서에 참고로 포함된 2010/0154070호에서 기재된다.
MAR 구성요소(MAR 작제물, MAR 서열, S/MAR 또는 단지 MAR)은 경계 또는 절연체 구성요소, 예컨대 cHS4, 자리 조절영역(LCR), 안정화 및 항억제인자(STAR) 구성요소, 편재하여 작용하는 염색질 개구부(ubiquitously acting chromatin opening: UCOE) 구성요소 또는 히스톤 변형제, 예컨대 히스톤 데아세틸라제(HDAC)를 또한 포함하는 넓은 그룹의 후성적 조절제 구성요소에 속한다 .
MAR 구성요소는 동정된 MAR에 기반하여 정의될 수 있으며, 그들은 주로 하기에 기반한다: 따라서, MAR S4 작제물은 대다수의 뉴클레오타이드(50%를 더함, 바람직하게는 60%, 70% 또는 80%)가 MAR S4에 기반하는 MAR 구성요소이다. A 및 T 함량이 높은 몇몇 단순한 서열 모티프는 종종 MAR 내에서 발견되었다. 통상적으로 발견되는 다른 모티프는 척추동물 또는 초파리에 대한 A-박스, T-박스, DNA 풀림 모티프, SATB1 결합 부위(H-박스, A/T/C25) 및 공통 토포이성질화 효소 II 부위이다.
MAR은 일반적으로 핵 기질이 부착된 진핵 염색체의 DNA에서 서열로서 특성규명된다. MAR의 특성은 그들의 1차 구조에 의해 단지 부분적으로 정의된다. 예를 들어, AT 풍부 영역과 같은 MAR 구성요소에서 발견되는 전형적인 1차 구조는 3차 구조, 즉 MAR의 기능을 정하는 특정 굽음을 초래하는 것으로 알려져 있다. 따라서, MAR은 종종 그들의 1차 구조뿐만 아니라 그들의 2차, 3차 구조, 예를 들어 굽음 정도 및/또는 물리적 특성, 예컨대 융점에 의해 정해진다.
MAR 구성요소에서 통상적으로 발견되는 바와 같이 AT/TA-다이뉴클레오타이드가 풍부한 구부러진 DNA 영역(본 명세서에서 이후에 "AT-풍부 영역"으로서 지칭됨)은 매우 다수의 A 및 T를, 특히 다이뉴클레오타이드 AT 및 TA의 형태로 포함하는 구부러진 DNA 영역이다. 바람직한 실시형태에서, 이는 100개의 연속적 염기쌍의 신장에 대해 적어도 10%의 다이뉴클레오타이드 TA, 및/또는 적어도 12%의 다이뉴클 레오타이드 AT를 함유하고, 바람직하게는 100개의 연속적 염기쌍의 신장에 대해 적어도 33%의 다이뉴클레오타이드 TA, 및/또는 적어도 33%의 다이뉴클레오타이드 AT(또는 AT-풍부 영역이 더 짧은 길이를 가질 때 각각의 더 짧은 신장에 대해)를 함유하는 한편, 구부러진 2차 구조를 가진다. 그러나, "AT-풍부 영역"은 약 30개 이하의 뉴클레오타이드 만큼 짧을 수 있지만, 바람직하게는 약 50개 뉴클레오타이드, 약 75개 뉴클레오타이드, 약 100개 뉴클레오타이드, 약 150, 약 200, 약 250, 약 300, 약 350 또는 약 400개 이상의 뉴클레오타이드 길이이다.
일부 결합 부위는 또한 종종 상대적으로 높은 A 및 T 함량, 예컨대 SATB1 결합 부위(H-박스, A/T/C25) 및 척추동물(RNYNNCNNGYNGKTNYNY) 또는 초파리(GTNWAYATTNATNNR)에 대한 공통 토포이성질화 효소 II 부위를 가진다. 그러나, 결합 부위 영역(모듈), 특히 결합 부위의 클러스터를 포함하는 TFBS 영역은 영역의 굽힘 패턴의 비교에 의해 A 및 T 함량이 높은 MAR 구성요소로부터 AT 및 TA 다이뉴클레오타이드 풍부 영역("AT-풍부 영역")과 용이하게 구별될 수 있다. 예를 들어, 인간 MAR 1_68에 대해, 후자는 약 3.8 또는 약 4.0을 초과하는 평균 만곡도를 가질 수 있는 반면, TFBS 영역은 약 3.5 또는 약 3.3 미만의 평균 만곡도를 가질 수 있다. 동정된 MAR의 영역은 또한 본 명세서의 다른 곳에 기재된 바와 같은 대안의 수단, 예컨대, 이하로 제한되는 것은 아니지만, 상대적 융점에 의해 확인될 수 있다. 그러나, 이러한 값은 종 특이적이고, 따라서 종 간에 다를 수 있으며, 예를 들어, 더 낮을 수 있다. 따라서, 각각의 AT 및 TA 다이뉴클레오타이드 풍부 영역은 약 3.2 내지 약 3.4 또는 약 3.4 내지 약 3.6 또는 약 3.6 내지 약 3.8과 같은 더 낮은 만곡도를 가질 수 있고, TFBS 영역은 비례해서 더 낮은 만곡도, 예컨대 약 2.7 미만, 약 2.9 미만, 약 3.1 미만, 약 3.3 미만을 가질 수 있다. SMAR 스캔 II에서, 각각 더 낮은 윈도 크기는 당업자에 의해 선택될 것이다.
본 발명에 따른 MAR 구성요소, MAR 작제물, MAR 서열, S/MAR 또는 단지 MAR은 자연적으로 생기는 " SAR " 또는 "MAR"과 상기 기재한 것과 같은 하나 이상의(예컨대 2, 3 또는 4) 특징을 공유하는 뉴클레오타이드 서열이다. 바람직하게는, 이러한 MAR 구성요소, MAR 작제물, MAR 서열, S/MAR 또는 단지 MAR은 상기 MAR에 의해 영향받는 임의의 유전자의 단백질 발현을 용이하게 하는 적어도 하나의 특성을 가진다. MAR 구성요소는 일반적으로 또한 단리된 및/또는 정제된 핵산이 바람직하게는 MAR 활성을 나타내고, 특히 전사 조절, 바람직하게는 향상 활성을 나타낼 뿐만 아니라, 예를 들어, 발현 안정화 활성 및/또는 다른 활성을 나타내는 특징을 가진다.
용어 MAR 구성요소, MAR 작제물, MAR 서열, S/MAR 또는 단지 MAR은 또한, 특정 실시형태에서, 본 발명에 따른 MAR 작제물이 기반한 자연적으로 발생하는 및/또는 동정된 MAR 이상으로 향상을 구성하는 특성을 갖는 향상된 MAR 작제물을 포함한다. 이러한 특성은 전장 자연적으로 생기는 및/또는 동정된 MAR에 비해 감소된 길이, 유전자 발현/전사 향상, 발현의 안정성 향상, 조직 특이성, 유도성 또는 이들의 조합을 포함하지만, 이들로 제한되지 않는다. 따라서, 향상된 MAR 구성요소는, 예를 들어, 동정된 MAR 서열의 뉴클레오타이드 수의 약 90% 미만, 바람직하게는 약 80% 미만, 훨씬 더 바람직하게는 약 70% 미만, 약 60% 미만, 또는 약 50% 미만을 포함할 수 있다. MAR 구성요소는 상기 작제물에 의해 적절한 세포의 형질전환 시 유전자 발현 및/또는 이식유전자의 전사를 향상시킬 수 있다.
MAR 구성요소는 바람직하게는 관심 대상 유전자가 작동가능하게 연결되거나 또는 연결될 수 있는 프로모터 영역의 상류에 삽입된다. 그러나, 특정 실시형태에서, MAR 구성요소는 관심 대상 유전자/뉴클레오타이드 산 서열의 상류뿐만 아니라 하류 또는 단지 하류에 위치되는 것이 유리하다. 시스 및/또는 트랜스 둘 다에서 다른 다수 MAR 배열은 또한 본 발명의 범주 내에 있다.
MAR 구성요소와 관련하여 사용될 때 합성은 동정된 MAR 또는 그에 기반한 MAR의 서열/영역 또는 부분적 영역의 간단한 재셔플링, 중복 및/또는 결실 이상으로 설계가 연루된 MAR을 지칭한다. 특히, 합성 MAR/MAR 구성요소는 일반적으로 하나 이상의, 바람직하게는 하나의 동정된 MAR의 영역을 포함하는데, 그러나, 이는 특정 실시형태에서 합성 또는 변형될 수 있을 뿐만 아니라 특이적으로 설계되고, 잘 특성규명된 구성요소, 예컨대 바람직한 실시형태에서 합성적으로 생성된 단일 또는 일련의 TFBS이다. 이들 설계 구성요소는 다수의 실시형태에서 상대적으로 짤고, 특히, 그들은 일반적으로 약 300 이하 bp 길이, 바람직하게는 약 100, 약 50, 약 40, 약 30, 약 20 또는 약 10 이하의 bp 길이이다. 이들 구성요소는, 특정 실시형태에서, 다합체화될 수 있다. 이러한 합성 MAR 구성요소는 또한 본 발명의 부분이고, 본 설명은 "MAR 구성요소"가 합성 MAR 구성요소에 동일하게 적용되는 것으로 언급되는 어떤 것을 이해할 수 있다는 것이 이해되어야 한다.
동정된 MAR 구성요소의 뉴클레오타이드 서열의 기능적 단편은 또한 그들이 상기 기재한 바와 같은 MAR 구성요소의 기능을 유지하는 한 포함된다.
일부 바람직한 동정된 MAR 구성요소는 이들 및 다른 MAR 구성요소의 서열의 개시내용에 대해 본 출원에 참고문헌으로써 구체적으로 포함되는 WO2005040377호 및 미국 특허 공개 제20070178469호에 개시된 바와 같은 MAR 1_68, MAR X_29, MAR 1_6, MAR S4, MAR S46(그들의 모든 순열을 포함)을 포함하지만, 이들로 제한되지 않는다. 닭 라이소자임 MAR은 또한 바람직한 실시형태이다(미국 특허 제7,129,062호 참조, 또한 그것의 MAR 구성요소의 개시내용에 대해 본 명세서에 구체적으로 포함됨).
벡터가 단일 MAR를 포함하는 것으로 언급된다면, 이는 이 벡터에서 동일 또는 상이한 유형 또는 구조 중 하나의 벡터 내에서 하나의 MAR이 있고 다른 MAR이 없다는 것을 의미한다.
본 발명의 특정 실시형태에서, 동일 또는 상이한 유형 또는 구조일 수 있고 관심 대상 유전자의 하류에 모두 위치될 수 있는 다수 MAR이 있다. 이는 단일 MAR 클러스터로 불린다.
폴리펩타이드를 안정하게 발현시키는 다수의 세포와 같은 것이, 예를 들어, 서열의 존재와 "독립적"인 것으로 언급된다면, 서열은 임의의 통계학적으로 유의한 정도로 (예를 들어, 폴리펩타이드를 안정하게 발현시키는 세포의 수에) 영향을 미치지 않는다.
본 발명의 이식유전자 또는 이식유전자 발현 가공 단백질 또는 기능성 RNA를 암호화하는 서열은 종종 벡터의 부분이다.
본 발명에 따른 벡터는 다른 핵산, 예컨대 이 벡터에 의해 발현되고, 그것이 연결되고, 일반적으로 그것이 통합되는 이식 유전자를 수송할 수 있는 핵산 분자이다. 예를 들어, 플라스미드는 벡터의 유형이며, 레트로바이러스 또는 렌티바이러스는 다른 유형의 벡터이다. 본 발명의 바람직한 실시형태에서, 벡터는 형질감염 전에 선형화된다. 발현 벡터는 조절 구성요소를 포함하거나 또는 발현 벡터에 의해 운반되는 핵산 서열의 전사 및/또는 발현을 추가하도록 설계된 그러한 조절 구성요소의 제어 하에 있다. 조절 구성요소는 인핸서 및/또는 프로모터뿐만 아니라, 본 명세서에 기재된 다양한 다른 구성요소(또한 "벡터 설계"를 참조)를 포함한다.
벡터의 벡터 서열은 이식유전자와 같은 임의의 "다른" 핵산뿐만 아니라 MAR 구성요소와 같은 유전자 구성요소를 제외하는 벡터의 DNA 또는 RNA 서열이다.
본 발명에 따른 포유류 세포, 예컨대 재조합 포유류 세포/ 진핵 숙주 세포를 포함하는 진핵생물은 세포 배양 조건 하에 유지될 수 있다. 이 유형의 세포의 비제한적 예는 비-영장류 진핵 숙주 세포, 예컨대 중국 햄스터 난소(CHO) 세포 및 새끼 햄스터 신장 세포(BHK, ATCC CCL 10)이다. 영장류 진핵 숙주 세포는, 예를 들어, 인간 자궁경부암 세포(HELA, ATCC CCL 2) 및 SV40으로 형질전환된 원숭이 신장 CV1 계통(COS-7, ATCC CRL-1587)을 포함한다. 재조합 진핵 숙주 세포 또는 재조합 포유류 세포는, 예를 들어 이식유전자 서열로, 예를 들어 형질감염에 의해 및/또는 돌연변이에 의해 변형된 세포를 의미한다. 진핵 숙주 세포 또는 재조합 포유류 세포는 상기 세포에 의해 발현된 단백질의 번역 후 변형을 수행할 수 있다. 본 발명의 특정 실시형태에서, 진핵(예를 들어, 비-영장류) 숙주 세포의 세포 상대는 완전히 기능성이고, 즉, 예를 들어 돌연변이에 의해 불활성화되지 않았다. 오히려 이식유전자 서열(예를 들어, 영장류)이 그의 세포 상대(예를 들어, 비-영장류)에 더하여 발현된다.
본 발명에 따른 형질감염은, 일반적으로 비-바이러스 벡터(벡터 매개 형질감염)를 통한 또는 다수 양이온 지질을 수반하는 것을 포함하는 화학적 수단을 통한 예컨대, 전기천공법, 리포펙션에 의한 수용 진핵 세포 내로 핵산의 도입이지만, 이들로 제한되지 않는다. 비 벡터 매개 형질감염은 세포 내로 단리된 TEP siRNA의 직접 도입을 포함한다. 일시적으로 형질감염된 세포에서, 예를 들어, siRNA는 단지 일시적으로 남아있다. 본 발명과 관련하여, 이식유전자 발현 가공(TEP) 단백질 또는 TEP 기능성 RNA를 암호화하는 서열을 지니는 적어도 하나의 핵산 분자에 의해 또는 대안적으로 TEP 기능성 RNA(예를 들어, siRNA)에 의해 직접적으로 제1 형질감염 및 이식유전자를 암호화하는 핵산에 의한 제2의 후속적 형질감염에 의할 수 있다. 제1 형질감염과 제2 형질감염은 둘 다 반복될 수 있다. 예를 들어, siRNA는 제1 형질감염 동안 도입되고, 작용하며, 특히, 재조합 단백질(형질감염된 세포에서 재조합 사건에 수반된 단백질)을 저해한다. 이후에 이식유전자는 제2의 후속 형질감염 동안 도입된다.
전사는 DNA 주형으로부터의 RNA의 합성을 의미한다. "전사적으로 활성인"은, 예를 들어, 전사되고 있는 이식유전자를 지칭한다. 번역은 RNA가 단백질을 생성하는 과정이다.
분비의 향상은 각각의 이식유전자 서열을 포함하지 않는 대조군 세포로부터 얻어진 값에 대해 측정된다. 대조군 값에 대한 임의의 통계학적으로 유의한 향상은 증진으로서 자격을 얻는다.
선택 마커는 산물에 선택제 항생물질(예를 들어, 클로람부실, 암피실린, 겐타마이신, 스트렙토마이신, 테트라사이클린, 카나마이신, 네오마이신, 퓨로마이신)에 대한 내성 또는 선택 배지(예를 들어, DHFR(다이하이드로폴레이트 환원효소)) 상에서 성장하는 능력을 부여하는 유전자를 함유하는 핵산이다.
샤페론으로서 알려진 단백질의 부류는 다른 단백질의 달리 불안정한 형태이성질체에 결합하고 안정화시키는 단백질로서 정의되며, 제어된 결합 및 방출에 의해 그의 정확한 생체내 운명을 촉진하며, 그것을 올리고머 조립체로 폴딩하고, 특정 아세포 구획으로 수송하거나, 또는 분해에 의해 처리한다. BiP(또한 효모에서 GRP78, Ig 중쇄 결합 단백질 및 Kar2p로서 알려짐)는 소포체(ER) 내에 체류하는 hsp 70 패밀리의 흔한 약 70 kDa 샤페론인데, 이는 특히 분비계에서 수송을 보조하는 역할을 하며, 단백질을 폴딩한다. 단백질 이황화물 이성질화 효소(Protein disulphide isomerase: PDI)는 단백질의 번역 후 가공 동안 이황화 결합 형성의 촉매 작용에 수반된 ER에 체류하는 샤페론 단백질이다.
세포의 대사적 유전자 조작
세포의 대사적 유전자 조작에서, 예를 들어, 발현 세포에서 고유한 과정이 변용된다. 예를 들어, 분비 경로의 특정 단백질은, 예를 들어 과발현된다. 대안적으로, 재조합 사건은 재조합 경로에 영향을 미침으로써 변용된다.
단백질 분비 경로
단백질의 분비는 모두 3가지 계의 유기체에 대해 통상적인 과정이다. 이 복잡한 분비 경로는 세포의 세포질 막에 거쳐 사이토졸로부터의 단백질 전위를 가장 현저하게 필요로 한다. 단백질이 그의 최종 목적지에 도달하는데 다수 단계 및 다양한 인자가 필요로 된다. 포유류 세포에서, 이 분비 경로는 2개의 주요 거대분자 조립체, 즉, 신호 인식 입자(signal recognition particle: SRP) 및 분비 복합체(Sec-복합체 또는 트랜스로콘)을 수반한다. SRP는 9, 14, 19, 54, 68 및 72kDa의 질량을 지니는 6개 단백질 및 7S RNA로 구성되며, 트랜스로콘은 Sec61αβγ, Sec62 및 Sec63으로 구성된 도넛형 입자이다. 일부 이들 단백질의 인간 형태에 대한 등록번호(괄호)는 다음과 같다: hSRP14(등록번호 X73459.1); hSRP9(NM_001130440); hSRP54(NM_003136); hSRPRα(NM_003139); hSRPRβ(NM_021203); hSEC61α1(NM_013336); hSEC61 β(L25085.1); hSEC61 γ(AK311845.1).
단백질 분비에서 제1 단계는 신호 펩타이드에 의존하는데, 이는 막을 거쳐서 그리고 소포체(ER)의 내강 내로 초기 단백질의 전위를 매개하고 폴리펩타이드의 아미노-말단에서 특이적 펩타이드 서열을 포함한다. 이 단계 동안, 리보솜의 선두적 번역으로부터 생기는 신호 펩타이드는 신호 펩타이드, 즉, SRP54를 인식하는 SRP 입자의 서브유닛과 상호작용한다. 신호 펩타이드에 대한 SRP 결합은 번역 저지를 초래하는 초기 폴리펩타이드의 추가적인 신장을 차단한다. 신장 저지를 위해 SRP9 및 -14 단백질이 필요하다(Walter and Blobel 1981). 제2 단계에서, 리보솜-초기 폴리펩타이드-SRP 복합체는 SRP 수용체와 SRP54의 상호작용을 통해 ER 막에 도킹된다(Gilmore, Blobel et al. 1982; Pool, Stumm et al. 2002). SR은 GTP 분해효소 활성을 나타내는 두 단백질, 즉, SRα 및 SRβ를 함유하는 이형이합체 복합체이다(Gilmore, Walter et al. 1982). SRP54와 SR의 상호작용은 GTP의 결합에 의존한다(Connolly, Rapiejko et al. 1991). SR은 리보솜-초기 폴리펩타이드 복합체로부터 SRP의 방출 및 Sec61 복합체(트랜스로콘)을 지니는 리보솜의 출구 부위를 배위한다. 성장하는 초기 폴리펩타이드는 트랜스로콘 통로를 통해 ER로 유입되며, 번역은 그의 정상 속도로 재개된다. 번역이 완료될 때, 트랜스로콘의 세포질 면에 결합된 리보솜이 유지된다. 리보솜에 추가로, 트랜스로콘은 세포질면 상의 리보포린과 그리고 샤페론, 예컨대 칼레티쿨린 및 칼넥신, 및 단백질 이황화물 이성질화효소(PDI) 및 내강면 상의 올리고사카릴 트랜스퍼라제와 가깝게 결합된다. ER의 내강 내로 성장하는 초기 폴리펩타이드의 분출 후에, 신호 펩타이드는 신호 펩티다제로 불리는 효소에 의해 전-단백질로부터 절단되고, 이에 의해 ER 내로 성숙 단백질을 방출시킨다. 번역 후 변형 후에, 정확한 폴딩 및 다합체화, 단백질은 ER을 이탈하며, 골지 장치로 이동하고, 이어서 분비 소포로 이동한다. 혈장막과 분비 소포의 융합은 세포밖 환경에서 소포의 내용물을 방출한다.
현저하게, 분비된 단백질은 세포막에 걸친 그 자체의 전위에 상당히 적합한 특정 신호 서열에 의해 진화되었다. 별개의 신호 펩타이드로서 발견된 다양한 서열은 독특한 방법으로 분비 장치와 상호작용할 수 있다. 신호 서열은 자연에서 우세하게 소수성인데, 이는 초기 펩타이드를 분비 단백질에 보내는데 수반될 수 있는 특징이다. 아미노산의 소수성 신장에 추가로, 다수의 흔한 서열 특징은 대다수의 포유류 분비 신호에 의해 공유된다. 상이한 신호 펩타이드는 그들이 비상동 단백질의 분비를 지시하는 효율이 다르지만, 비상동 재조합 단백질의 분비를 지시하기 위해 사용될 수 있는 몇몇 분비 신호 펩타이드(즉, 인터류킨-, 면역글로불린-, 조직적합성 수용체-신호 서열 등의 분비 신호 펩타이드)가 동정되었다. 유사성에도 불구하고, 천연 신호 펩타이드가 본래의 상황 밖에서 제대로 기능하지 않을 수도 있고, 또는 숙주 세포와 관련되거나 또는 분비 과정과 관련된 차이 때문에, 이들 서열은 발현되기 어려운 일부 단백질의 효율적인 분비를 촉진하는데 최적이 아니다. 비상동 단백질의 효율적인 분비를 위한 적절한 신호 서열의 선택은 성숙 단백질의 다른 부분과 절단된 신호 펩타이드 내의 서열의 상호작용에 의해 더 복잡하게 될 수 있다(Johansson, Nilsson et al. 1993).
재조합 경로
DNA 재조합 경로로서도 알려진 재조합 경로는 DNA 손상 수선, 예컨대 이중-가닥 파손 후에 DNA 분자 말단의 결합, 및 염색체와 비-염색체 DNA 분자 간의 DNA 서열의 교환 또는 융합, 예컨대 감수분열에서 염색체의 교차 또는 림프구 세포에서 면역글로불린 유전자의 재배열을 야기하는 세포 경로이다. 3가지 주된 재조합 경로는 상동성 재조합 경로(HR), 비-상동성 말단-결합 경로(NHEJ) 및 미소상동체(microhomology)-매개 말단-결합(MMEJ) 및 대안의 말단-결합(Alt-EJ) 경로이다.
상동성 재조합(HR), 비-상동성 말단-결합(NHEJ) 및 마이크로상동성 매개 말단 결합(MMEJ)의 메커니즘
이식유전자는 이중 가닥
파단에서
숙주 게놈 내로 통합하기 위한 재조합 메커니즘을 사용한다.
이중-가닥 파손(DSB)은 세포사 또는 매우 다양한 유전자 재배열을 잠재적으로 야기하는 생물학적으로 가장 해로운 유형의 게놈 손상이다. 정확한 수선은 유전자 정보의 성공적인 유지 및 증식에 필수적이다.
두 가지의 주된 DSB 수선 메커니즘이 있다: 비-상동성 말단 결합(NHEJ) 및 상동성 재조합(HR). 마이크로상동성-매개 말단 결합(MMEJ)으로 불리는 세번째 메커니즘은 종종 두 가지 주된 DSB 수선 메커니즘이 실패했을 때 효과를 발휘하기 시작한다. 상동성 재조합은 상동성을 공유하고 세포 주기의 S/G2 기 동안 우세하게 영향을 미치는 DNA 서열 간의 유전자 교환을 위한 과정인 반면, NHEJ는 보통 서열 상동성이 없는 두 파손된 DNA 말단을 함께 단순히 연결하고, 그것은 모든 기의 세포 주기에서 기능하지만 유사분열 세포의 G0-G1 및 초기 S-기 동안 특히 중요성을 가진다(Wong and Capecchi, 1985; Delacote and Lopez, 2008). 척추동물에서, HR, NHEJ 및 MMEJ는 DSB의 특성 및 세포주기의 단계에 의존하여 DSB 수선에 차별적으로 기여한다(Takata et al., 1998).
NHEJ
: 기본 메커니즘
개념적으로, NHEJ 과정의 분자 메커니즘은 단순한 것으로 보인다: 1) 효소의 세트가 파손된 DNA 분자를 포획됨, 2) 2개의 DNA 말단을 가져오는 분자 브릿지가 형성됨 및 3) 파손된 분자가 재결찰됨. 이러한 반응을 수행하기 위해, 포유류 세포에서 NHEJ 메커니즘은 2개의 단백질 복합체, 즉, DNA-PKcs(DNA-의존적 단백질 키나제의 촉매적 서브유닛)와 결합된 이형이합체 Ku80/Ku70 및 DNA 리가제 IV와 그의 보인자(co-factor) XRCC4(X-선-보완 중국 햄스터 유전자 4) 및 다수의 단백질 인자, 예컨대 아르테미스(Artemis) 및 XLF(XRCC4-유사 인자; 또는 세르눈노스(Cernunnos))를 수반한다(Delacote et al., 2002). NHEJ는 그것이 보통 서열 상동성이 없는 2개의 파손된 DNA 말단을 함께 단순히 연결하고 그것이 작은 삽입 및 결실을 생성하기 때문에 오류유발 DSB 수선으로서 빈번하게 고려된다(Moore and Haber, 1996; Wilson et al., 1999). NHEJ는 세포 주기 전체적으로 DSB의 수선을 위한 메커니즘을 제공하지만, 유사분열 세포의 G0-G1 및 초기 S-기 동안 특히 중요성을 가진다(Takata et al., 1998; Delacote and Lopez, 2008). NHEJ에 의한 DSB의 수선은 박테리아로부터 포유류까지의 범위의 유기체에서 관찰되는데, 이는 진화 동안 보존되었다는 것을 나타낸다.
DSB 형성 후에, NHEJ 수선 경로에서 중요한 단계는 파손된 DNA 말단의 물리적 병치이다. NHEJ는 포획을 위해 파손된 DNA 분자의 말단 둘 다에 대해 Ku70/80 이형이합체 단백질 복합체의 결합에 의해 개시되고, 말단을 함께 묶고, 다른 NHEJ 중요 인자의 조립체에 대해 스캐폴드를 생성한다. DNA-결합된 Ku 이형이합체 복합체는 PIKK(단백질 키나제의 포스포이노시타이드 3-키나제-유사 패밀리)에 속하는 460kDa 단백질인 DSB에 대해 DNA-PKcs를 동원하고(Gottlieb and Jackson, 1993) 그의 세린/트레오닌 키나제 기능을 활성화한다(Yaneva et al., 1997). 2개의 DNA-PKcs 분자는 DSB에 걸쳐 함께 상호작용하며, 따라서 파손된 DNA 말단 둘 다의 사이에 분자 브릿지를 형성하고, 그들의 분해를 저해한다(DeFazio et al., 2002). 이어서, DSB로부터 생성된 대다수의 말단이 결찰 전에 적절하게 가공되어야 하지만, DNA 말단은 직접 결찰될 수 있다(Nikjoo et al., 1998). 파손의 특성에 따라서, 가공 효소의 상이한 조합의 작용은 갭을 채우고, 손상된 DNA 또는 파손 주위의 2차 구조를 제거함으로써 적격의 돌출부를 생성하는데 필요로 될 수 있다. NHEJ 과정에서 이 단계는 NHEJ 수선과 관련된 뉴클레오타이드의 가끔씩의 상실을 초래하는 것으로 고려된다. 포유류 NHEJ에서 하나의 중요한 말단-가공 효소는 효소의 메탈로-β-락타마제 슈퍼패밀리의 구성원인 아르테미스인데, 이는 대다수의 방사선 감수성 중증 합병성 면역결핍 장애(severe combined immunodeficiency: SCID) 환자에서 돌연변이된 유전자로서 발견되었다(Moshous et al., 2001). 아르테미스는 5'→3' 엑소뉴클레아제 활성과 DNA-함유 ds-ss 전이 및 DNA 헤어핀에 대한 DNA-PKcs-의존적 엔도뉴클레아제 활성을 둘 다 가진다(Ma et al., 2002). 그의 활성은 또한 ATM에 의해 조절된다. 따라서, 아르테미스는 다수 DNA-손상 반응에 연루될 가능성이 있는 것으로 보인다. 그러나, DNA 병변의 서브세트만이 아르테미스에 의해 수선되는 것으로 보이는데, DSB 수선에서의 주된 결함이 아르테미스-결여 세포에서 관찰되지 않았기 때문이다(Wang et al., 2005, Darroudi et al., 2007).
DNA 갭은 수선을 가능하게 하기 위해 채워져야 한다. DSB에 대한 뉴클레오타이드의 첨가는 폴리머라제 μ 및 λ로 제한된다(Lee et al., 2004; Capp et al., 2007). XRCC4와의 상호작용에 의해, 폴리뉴클레오타이드 키나제(PNK)는 또한 DNA 중합 및 결찰을 둘 다 허용하는 DNA 말단에 동원된다(Koch et al., 2004). 최종적으로, NHEJ는 XRCC4, DNA 리가제 IV 및 XLF을 함유하는 복합체에 의해 수행되는 단계인 DNA 말단의 결찰에 의해 완료된다(Grawunder et al., 1997). 다른 리가제는 DNA 리가제 IV를 부분적으로 치환할 수 있는데, NHEJ가 XRCC4 및 리가제 IV 없이 일어날 수 있기 때문이다(Yan et al., 2008). 더 나아가, 연구는 XRCC4 및 리가제 IV가 NHEJ 밖에서 어떤 역할도 하지 않는 반면, 대조적으로, KU는 전사, 세포자멸사, 및 미세환경에 대한 반응과 같은 다른 과정에서 작용한다는 것을 나타내었다(Monferran et al., 2004; Muller et al., 2005; Downs and Jackson, 2004).
NHEJ는 상이한 방법에서 감소 또는 정지될 수 있는데, 이들 중 대다수는 상기 언급한 단백질(예를 들어, 이형이합체 Ku80/Ku70, DNA-PKcs, 그러나 특히 DNA 리가제 IV, XRCC4, 아르테미스 및 XLF(XRCC4-유사 인자; 또는 케르눈노스(Cernunnos)), PIKK(단백질 키나제의 포스포이노시타이드 3-키나제-유사 패밀리)에 직접적으로 영향을 미친다.
HR: 기본 메커니즘
상동성 재조합(HR)은 매우 정확한 수선 메커니즘이다. 상동성 염색분체는 파손된 가닥의 수선을 위한 주형으로서 작용한다. 딸 염색분체가 이용가능할 때 HR은 세포 주기의 S 및 G2기 동안 일어난다. 고전적 HR은 주로 3단계를 특징으로 한다: 1) 파손된 말단의 5'의 절제, 2) 가닥 침범 및 상동성 DNA 듀플렉스와 교환, 및 3) 재조합 중간체의 분해. 가닥 침범을 수행하기 위한 능력에 따라서 상이한 경로는 완전한 DSB 수선을 완료할 수 있으며, 합성-의존적 가닥-어닐링(SDSA) 경로, 고전적 이중-가닥 파손 수선(DSBR)(Szostak et al, 1983), 파손-유도 복제(BIR), 및 대안적으로, 단일-가닥 어닐링(SSA) 경로를 포함한다. 모든 HR 메커니즘은 상호관련되며, 다수의 효소적 단계를 공유한다.
모든 HR 반응의 제1 단계는 MRN 복합체(MRE11, RAD50, NBN(앞에서 NBS1, 네이메헌 파손 증후군 1(Nijmegen breakage syndrome 1)에 대해)) 및 CtIP(CtBP-상호작용 단백질)의 도움으로 뉴클레아제에 의해 5'-말단 파손 DNA 가닥의 절제에 대응한다(Sun et al., 1991; White and Haber, 1990). 3' 단일-가닥 DSB의 얻어진 생성은 상동성 서열을 찾을 수 있다. 상동성 듀플렉스의 침범은 RAD51 재조합효소 단백질로 코팅된 3'ss-DNA로 구성된 뉴클레오필라멘트에 의해 수행된다(Benson et al., 1994). 진핵생물에서 ssDNA에 연결된 DNA 대사 과정에 수반된 이형삼합체 ssDNA-결합 단백질인 복제 단백질 A(RPA)의 동원(Wold, 1997)은 RAD51-필라멘트의 조립에 필요하다(Song and sung, 2000). 이어서, RAD51은 RPA 분자를 대체하고 RAD51 부하를 용이하게 하는(Song and sung, 2000) 고리-유사 구조를 갖는 RAD52와 상호작용한다(Shen et al., 1996). Rad52는 효모에서 재조합 과정에 대해 중요하다(Symington, 2002). 그러나, 척추동물에서, RAD52보다 오히려 BRCA2(유방암 2형 감수성 단백질)는 가닥 침범 및 교환에서 중요한 역할을 하는 것으로 보인다(Davies and Pellegrini, 2007; Esashi et al., 2007). RAD51/RAD52 상호작용은 RAD54의 결합에 의해 안정화된다. RAD54는 또한 D-루프 형성 후에 재조합 중간체의 성숙에서 어떤 역할을 한다(Bugreev et al., 2007). 다른 한편으로, BRCA1(유방암 1)은 BARD1(BRCA1 관련 RING 도메인 1) 및 BACH1(BTB 및 CNC 상동성 1)과 상호작용하여 각각 리가제 및 헬리카제 DSB 수선 활성을 수행한다(Greenberg et al., 2006). BRCA1은 또한 CDK-의존적 방식으로 CtIP와 상호작용하며, DNA 손상에 반응하여 유비퀴틴화(ubiquitination)를 겪는다(Limbo et al., 2007). 결과로서, BRCA1, CtIP 및 MRN 복합체는 세포 주기의 S 및 G2기에서 DNA의 HR-매개 수선의 활성화에서 어떤 역할을 한다.
뉴클레오필라멘트의 침범은 대치고리(displacement-loop: D-loop)로 불리는 헤테로듀플렉스의 형성을 초래하고, 침범 가닥에 의한 듀플렉스 중 한 가닥의 대치 및 다른 것과의 짝짓기를 수반한다. 이어서, 몇몇 HR 경로는 DSB를 둘러싸는 서열을 대체하기 위한 주형으로서 상동성 서열을 사용하여 수선을 완료할 수 있다. 사용되는 메커니즘에 따라서, 상동성 주형과 파손된 DNA 분자 사이의 상호간의 교환(교차)은 HR 수선과 관련될 수도 있고 관련되지 않을 수도 있다. 교차는 중요한 유전적 결과, 예컨대 게놈 재배열 또는 이형접합성의 상실을 가질 수 있다.
5개의 Rad51 파라로그가 또한 상동성 재조합에 수반된다: Xrcc2, Xrcc3, Rad51B, Rad51C, Rad51D(Suwaki et al., 2011). Rad51 파라로그는 두 유형의 복합체를 형성한다: BCDX2로 칭해지는 하나는 Rad51B, Rad51C, Rad51D 및 Xrcc2를 포함하고; 다른 하나는 Rad51C 및 Xrcc3(CX3)을 함유한다(Masson et al., 2001). 제1 복합체는 Rad51-DNA 복합체의 형성 및/또는 안정화에 참여하는 것으로 제안되었다(Masson et al., 2001). 제2 복합체의 역할은 홀리데이 접합(Holliday junction)의 분지 이동 및 분해인 것으로 보인다(Liu et al., 2007).
앞서 보고한 바와 같이, NHEJ에 대해 HR이 증가하는 것(미국 특허 공개 제20120231449호, 그의 전문이 본 명세서에 참고로 포함됨)은 이식유전자 발현을 향상시키고/시키거나 용이하게 하기 위해 사용될 수 있다.
본 발명은 HR을 감소 또는 중단시키는데 중점을 둔다. HR은 상이한 방법으로 감소 또는 중단될 수 있는데, 이 중 다수는 상기 언급한 단백질에 직접적으로 영향을 미친다(예를 들어, MRN 복합체의 단백질(MRE11, RAD50, NBN(앞에서 NBS1, 네이메헌 파손 증후군 1에 대해)) 및 CtIP(CtBP-상호작용 단백질), RAD51, 복제 단백질 A(RPA), Rad52, BRCA2(유방암 2형 감수성 단백질), RAD54, BRCA1(유방암 1)은 BARD1(BRCA1 관련 RING 도메인 1), BACH1(BTB 및 CNC 상동성 1)과 상호작용한다). 본 발명은 이 목표를 수행하기 위해 siRNA와 같은 RNA의 생성에 중점을 둔다.
마이크로상동체
-매개 말단 결합(
MMEJ
)
다른 재조합 경로가 실패하거나 또는 활성이 아닐 때, DSB는 마이크로상동성-매개 말단 결합(MMEJ)으로 불리는 다른 오류유발 수선 메커니즘에 의해 수선될 수 있다. 이 경로는 여전히 완전히 특성규명될 필요가 있으며, 이들 두 과정이 동일한 메커니즘에 기반하는지 여부는 불명확하지만, 때때로 또한 대안의 말단-결합(alt-EJ)으로서 지칭된다. 그것을 NHEJ와 구별하는 이 경로의 가장 특징적 특징은 파손된 DNA 가닥의 배열 동안 5 내지 25 bp 마이크로상동체의 사용이다(McVey and Lee, 2008).
MMEJ는 세포 주기의 임의의 시간에 일어날 수 있고, 코어 NHEJ 및 HR 인자, 즉, Ku70, 리가제 IV 및 Rad52 유전자와 독립적이다(Boboila et al., 2010; Yu and McVey, 2010; Lee and Lee, 2007; Ma et al., 2003). 대신에 MMEJ 개시는 단백질의 그 자체의 세트에 의존하며, 가장 중요한 것은 HR의 제1 단계에 또한 연루된 Mre11, Rad50 및 Nbs1(효모에서 Xrs2)을 포함하는 MRN 복합체(효모에서 MRX)의 구성성분이다(Ma et al., 2003). MRN 복합체와 별도로, 다수의 다른 인자는 MMEJ, 예를 들어 CTBP-상호작용 단백질(CtIP; Yun and Hiom, 2009), 폴리(ADP-리보스) 폴리머라제 1(PARP1), 리가제 III/ Xrcc1 복합체, 리가제 I(Audebert et al., 2004), DNA 폴리머라제 θ(Yu and McVey, 2010), 및 ERCC1/XPF 복합체(Ma et al., 2003)에 참여하도록 제안되었다. 그러나, 다수의 더 많은 단백질이 이 과정에 참여한다.
다른 DNA-말단 결합 단백질(예컨대 Ku 또는 Rad51) 없이, DSB는 PARP1에 의해 인식되고, 이어서 MMEJ를 통해 그들의 수선을 개시한다는 것이 시사되었다(McVey and Lee, 2008). HR과 유사하게 수선 과정은 5'에서 3' 말단 절단으로 시작하는데, 이는 파손의 각각의 측면 상에서 상동체의 짧은 영역을 노출시킨다. 이 가공 단계는 MRN 복합체에 의해 수행되고, CtIP에 의해 조절된다(Mladenov and Iliakis, 2011). 함께 상보적 영역(3' ssDNA 단편에 존재) 쌍 그리고 비-상보적 세그먼트(플랩)는 아마도 ERCC1/XPF 복합체에 의해 제거된다(Yu and McVey, 2010). 이어서, 갭(만약에 있다면)은 폴리머라제(예를 들어 DNA 폴리머라제 θ 또는 δ(Yu and McVey, 2010; Lee and Lee, 2007))에 의해 채워지고, 파손은 리가제 I 또는 리가제 III/Xrcc1 복합체에 의해 이어진다.
DNA 말단에서 즉각적인 마이크로상동성 영역이 없을 때(대부분의 경우임), 수선된 분자의 더 원위의 단편은 정확한 DNA 폴리머라제(예를 들어 폴리머라제 θ)를 이용하여 복제될 수 있다. 이어서, 이 중복된 영역은 생성된 접합에서 삽입을 초래하는 DNA 말단의 배열에 참여한다. 마이크로상동성-매개 수선의 이런 더 복잡한 변이체는 합성-의존적 MMEJ(SD-MMEJ)로 칭해졌다(Yu and McVey, 2010).
MMEJ는 대안의 재조합 수선 경로로서 작용하는 것으로 생각되었지만, 이는 B 림프구에서 IgH 부류 전환 재조합의 과정에서 매우 효율적인 것으로 나타났는데(Boboila et al., 2010), 이는 백업 메커니즘보다 많을 수 있다는 것을 시사한다. 또한 일부 DSB, 예를 들어 부적격 돌출부 또는 평활말단불량한 NHEJ 및/또는 HR 표적임)은 MMEJ에 의해 더 효율적일 수 있다는 가능성이 있다(Zhang and Paull, 2005).
표 D는 3가지 경로 각각에서 일부 중요한 유전자를 열거하는데, 이는 따라서 또한 3가지 경로의 각각에 영향을 미치기 위한 중요한 표적이다(또한 미국 특허 공개 제20120231449호 참조, 본 명세서에 그의 전문이 참고로 포함됨). 또한 MDC1 및 MHS2와 같은 DNA 수선 단백질이 표에 포함된다. MDC1은 DNA 손상에 반응하여 S기 내 및 G2/M기 세포주기 검사점을 활성화하기 위해 필요로 된다. 그러나, MDC1은 또한 염색질에서 Rad51을 고정시킴으로써 Rad51-매개 상동성 재조합에서 기능한다.
본 발명의 내용에서 "넉다운"은 표적 유전자의 발현이 예컨대 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 이상만큼 감소된다는 것을 전달한다. 완전한 넉다운은 표적 유전자의 검출가능한 발현이 더 이상 없다는 것을 의미한다. 표 D는 또한 특정 넉다운 표적에 의해 얻어진 결과를 나타낸다. 당업자가 인식할 바와 같이, 표적의 핵선 서열의 변이가 있고, 따라서, 유전자의 변이체, 특히 80%, 90% 또는 95%의 서열 동일성을 나타내는 변이체는 본 발명의 부분이다.
단백질 가공 및 대사 단백질
세포의 대사 유전자 조작을 위해 사용될 수 있는 단백질의 이런 범주는 단백질 분비 경로에도 재조합 경로에도 속하지 않지만, 다르게는 발현 세포에서 고유한 과정에 영향을 미친다.
단백질 가공 또는 대사 단백질은 종종 효소, 예컨대 샤페론(상기 샤페론의 정의), 단백질 이성질화효소, 당 첨가 효소(예를 들어, 시알릴 또는 글라이코실 트랜스퍼라제) 또는 포스파타제이거나, 또는 세포 에너지 수준 또는 미토콘드리아 기능을 제어한다.
표 A는 부표제 "단백질 가공 및 대사 단백질" 하에서 발현된(exp) 및/또는 발현이 "넉다운"(KD)된 단백질의 목록을 제시한다.
벡터 설계
비-바이러스 벡터 중에서, 트랜스포존은 숙주 게놈 내의 다수 자리에서 높은 빈도로 DNA 서열의 단일 복제물을 통합하는 그들의 능력 때문에 특히 매력적이다. 바이러스 벡터와 달리, 일부 트랜스포존은 세포의 유전자에 가깝게 우선적으로 통합되지 않는 것으로 보고되었고, 따라서 그들은 해로운 돌연변이를 도입할 가능성이 더 적다. 게다가, 일반적으로 역위 반복 서열에 측접한 화물 DNA(cargo DNA)를 함유하는 트랜스포존 공여체 플라스미드 및 트랜스포사제-발현 헬퍼 플라스미드 또는 mRNA를 포함하는 트랜스포존은 용이하게 생성되고 조작된다. 몇몇 트랜스포존 시스템은 내인성 트랜스포존 복제물을 간섭하는 일 없이 다양한 세포주에서 DNA를 이동시키기 위해 개발되었다. 예를 들어, 본래 남방은무늬밤나방으로부터 단리된 피기백(PB) 트랜스포존은 화물 DNA를 다양한 포유류 세포 내로 효율적으로 옮긴다.
후성적 조절 구성요소는 플라스미드 벡터 상에서 이식유전자 근처에 위치될 때 원치않는 후성적 효과로부터 화물 DNA를 보호하기 위해 사용될 수 있다. 예를 들어, 기질 부착 영역(matrix attachment region: MAR)으로 불리는 구성요소는 화물 DNA 게놈 통합 및 전사를 증가시키는 한편, 강한 인간 MAR 1-68에 의해 예시되는 바와 같이 이질염색질 침묵을 방지하는 것으로 제안되었다. 그들은 또한 절연체로서 작용할 수 있고, 이에 의해 이웃하는 세포 유전자의 활성화를 방지할 수 있다. 따라서 MAR 구성요소는 플라스미드 또는 바이러스 벡터와 관련하여 고발현 및 지속된 발현을 매개하기 위해 사용되었다.
본 명세서에 나타내는 바와 같이, 적절한 벡터 설계에 의해, 후성적 조절자, 특히 MAR 구성요소의 바람직한 특성은 전위성 벡터의 특성과 조합될 수 있다.
본 발명의 트랜스포존 및 트랜스포존 기반 벡터는, 예를 들어, 본 명세서에 기재된 상이한 분비 경로의 분비 단백질을 발현시키기 위해 세포의 대사적 유전자 조작에서 사용될 수 있다. 그들은 또한 다회의 화물 DNA 도입이 필요할 때 특히 유용하다. 이는 다수 벡터의 형질감염 및/또는 다수 성공적 형질감염 주기가 이용가능한 항생물질 또는 다른 선택 방법을 다 써 버릴 수 있는 경우, 세포 분비 경로의 다수 단백질을 시험할 때 확인되었다. 예를 들어 다수 치료적 단백질 후보가 선별 목적을 위해 발현되어야 할 때, 항생물질 선택에 대한 필요 없이 치료적 단백질을 빠르게 발현시키는 능력에 또한 특정 관심 대상이 있는데, 상당한 양의 단백질이 형질감염의 2 내지 3주에 비선택 세포 집단으로부터 얻어질 수 있기 때문이다. 특히, MAR-함유 트랜스포존 벡터는 따라서 발현 벡터의 현재 입수가능한 병기에 대한 촉망되는 첨가이다.
선택된 실험 접근은 (항생물질 기반 분석에 의존하는 접근과 반대로) (1) 화물 DNA 복제수에 기반한 효과와 (2) 화물 DNA 발현 수준에 기반한 효과 간의 차이를 허용하였다.
MAR 1-68은 피기백 트랜스포존의 IRT 사이의 중앙에 위치될 때 특히 효율적이었는데, 그것이 전위 효율을 감소시키지 않기 때문이다. MAR X-29는 또한 전위 효율 또는 발현을 감소시키는 일 없이 트랜스포존의 가장자리에서 잘 작용한다.
흥미롭게도, 전위된 유전자의 MAR-매개 활성화 정도는 자발적 플라스미드 통합의 활성화 정도에 비교할 때 감소되었다. 더 나아가, 발현 수준은, 예를 들어 이식유전자 복제물에 대해 정규화될 때, 트랜스포사제가 없는 플라스미드의 자발적 통합으로부터 얻어진 것보다 트랜스포존로부터 더 높았다. 이 효과는 작제물의 크기, MAR의 존재 또는 프로모터 강도에 상관없이 관찰되었다. 이는 상대적으로 발현에 관대한 게놈 자리에서 전위가 종종 일어날 수 있는지 여부를 예상하였는데, 예를 들어, 개방 염색질 구조는 트랜스포사제와 전사 인자 둘 다에 대해 더 접근가능할 수 있기 때문이다. 이와 관련하여, 이전의 연구는 이것이 논쟁 대상으로 남아있기는 하지만, 트랜스포존이 유전자 인트로 내에서, 프로모터에서 또는 게놈 자리에서 침묵에 대한 더 낮은 성향을 지니고 우선적으로 통합될 수 있다는 것을 시사하였다. 대안적으로, 자발적 통합 사건에 의해 유발된 바와 같은 동일한 게놈 자리에서 다수의 플라스미드 복제물의 공동통합은 이질염색질의 형성 및 MAR이 마주하는 반복적 서열의 침묵을 야기할 수 있는 반면, 단일-복제물 트랜스포존 통합은 이러한 염색질-매개 침묵에 대한 경향이 더 적을 수 있다. 추가로, 다수의 독립적 게놈 자리에서 트랜스포존의 통합은 적어도 하나의 복제물이 바람직한 게놈 환경에 도착하고 발현되는 것을 가능하게 하는 반면, 플라스미드 통합은 단지 하나의 게놈 자리에서 우세하게 생기는 것이 발견되었다.
화물 DNA 당 가장 높은 발현 수준, 예를 들어, 이식유전자/TER은 강한 프로모터에 결합될 때 MAR-함유 트랜스포존로부터 얻어진다. 고발현 수준이 소수의, 예를 들어 20, 15, 10 또는 5 이하의 전위된 화물 DNA 복제물로부터 얻어질 수 있었다는 것을 발견한 것은 놀라웠다. 그럼에도 불구하고 고생산성이 얻어질 수 있다면, 더 소수의 통합된, 예를 들어, 화물 DNA 복제물이 유리한데, 그것이 자발적 돌연변이유발 사건으로부터 유발되는 것과 같이 이식유전자 중 하나에서 또는 서브세트에서 점 돌연변이 발생 확률을 감소시키기 때문이다. 추가로, 트랜스포사제-매개 통합 사건은 부적격 또는 재배열 이식유전자 복제물을 야기할 수 있는 자발적 플라스미드 통합에 수반된 DNA 수선 및 재조합 메커니즘보다 돌연변이를 덜 유발한다.
피기백(PB) 트랜스포존에 의한 고효율의 게놈 통합은 또한 표적 세포의 양이, 예를 들어, 세포기반 요법 또는 재생의료를 위해 클론 집단을 생성하기 위해, 예를 들어 1차 줄기 세포 내로 치료적 유전자의 비-바이러스 전달을 위해 제한될 때 바람직하다. 이와 관련하여, 이런 이유로 항생물질 선택에 대한 필요를 제거한 소수의 전위된 화물 DNA 복제물로부터의 생리학적 발현 수준 및 전위 사건의 빈번한 발생은 유리한데, 항생물질 내성 유전자의 사용 및/또는 믿을 수 없는, 예를 들어 이식유전자 발현은 안전성 문제를 상승시킬 수 있기 때문이다.
전위 효율에 대한 MAR 봉입의 효과
항생물질 내성이 효율적인 이식유전자 발현을 반드시 반영하지는 않기 때문에, 강한 GAPDH 세포 프로모터 유도체로부터 발현된 녹색 형광 단백질(green fluorescent protein: GFP)이 지표로서 사용되었다. PB 트랜스포존에 MAR 구성요소를 첨가하는 것이 전위 효율 및 이식유전자 발현에 영향을 미칠 수 있는지 여부를 시험하기 위해, 그리고 작제물 내 MAR의 위치가 이들 효과에 임의의 영향을 가지는지 여부를 평가하기 위해, GFP 및 퓨로마이신 내성(퓨로) 유전자를 함유하는 일련의 트랜스포존 공여체 작제물을 설계하였고, 이때 MAR 1-68 또는 대조군 중성 스페이서 DNA 서열을 플라스미드 내 상이한 위치에 삽입하였다(도 1). MAR 또는 스페이서 서열 첨가의 효과에 비해 증가된 트랜스포존 크기의 영향을 구별하기 위하여 삽입이 없는 모 퓨로-GFP 트랜스포존 플라스미드를 전위의 대조군으로서 사용하였다.
트랜스포사제의 존재에서, MAR이 중앙에 위치될 때, 그러나 MAR이 GFP 암호 서열의 하류에 위치되지도 않고 예상한 바와 같이 전위된 서열 밖에 삽입되지도 않을 때, 비선택 세포로부터의 가장 높은 GFP 발현을 관찰하였다(도 3A). 퓨로마이신 선택의 존재에서, MAR-매개 활성화는 트랜스포사제와 함께 또는 트랜스포사제 없이 감소된 반면, GFP 발현 평균은 10배만큼 증가되었다(도 3B). 이는 퓨로마이신 선택이 전위 사건의 정량화로부터 상기 제안된 바와 같이 가장 높은 발현 수준을 나타내는 대다수의 세포만을 수득하였다는 것을 확인하였다. 추가로 중앙에 위치된 MAR을 함유하는 전위성 벡터는 트랜스포사제 없이 형질감염된 그들의 플라스미드 상대와 비교할 때 유사한 발현 수준을 수득하였다는 것을 추가로 나타내었다.
통합된 트랜스포존의 복제수에 대한 MAR 봉입의 효과
더 높은 GFP 형광 수준은 이식유전자의 증가된 전사로부터 및/또는 더 많은 이식유전자 복제물에 의해 초래될 수 있다. 이는 다양한 유형의 벡터로부터 초래되는 게놈-통합된 이식유전자 복제물의 수를 정량화함으로써 평가되었다. 비선택 집단으로부터 형광 세포의 세포형광 분류 후에 또는 퓨로마이신 내성에 대한 선택 후에 총 게놈 DNA는 세포의 풀링된 집단으로부터 단리되었다. 이식유전자 복제수는 세포의 β2-마이크로글로불린(B2M) 유전자에 대한 GFP 암호 서열의 정량적 폴리머라제 연쇄반응(qPCR) 분석에 의해 결정되었다. 항생물질 선택 없이, 트랜스포사제 또는 세포의 재조합 효소에 의해 통합된 이식유전자의 평균수는 게놈 당 약 1 내지 6개 복제물로 유사하였고, 그들은 MAR 또는 제어서열에 의해 상당하게 영향받지 않았다(도 4A). 그러나, MAR이 트랜스포존 가장자리에 포함되었을 때 가장 낮은 복제수가 얻어졌고, 이는 그것이 이 위치에서 전위를 감소시킨다는 본 발명자들의 더 앞선 결론을 뒷받침한다. 퓨로마이신과 함께 세포를 고도로 발현시키기 위한 선택 후에, 전위된 이식유전자의 수는 유사한 2 내지 7개 복제 범위에 있었다(도 4B). 그러나, 트랜스포사제 없이 통합된 이식유전자 복제물의 수는 6 내지 14개 복제물의 범위로 일반적으로 상당히 더 높았다. 이는 자발적 통합이 보통 단일 게놈 자리에서 다수 플라스미드 복제물의 연쇄동일순서의 통합을 야기하고(결과 미제시) 더 높은 이식유전자 복제수는 침묵 효과를 받은 세포가 항생물질 선택에 의해 제거되었을 때 더 높은 발현 수준을 야기하여야 한다는 사실에 의해 용이하게 설명될 수 있다. 항생물질 선택이 고도로 발현된 세포를 우선적으로 수득한다는 이전의 결과와 함께, 이는 또한 자발적 플라스미드 통합이 전위성 벡터보다 더 가변적 수의 이식유전자 복제물을 초래한다는 것을 나타내었다.
이어서, GFP 발현은 게놈 내에서 통합하기 위한 그들의 성향과 독립적으로 벡터의 고유한 발현 잠재력을 평가하기 위하여 유전자 복제수에 대해 정규화되었다. 전반적으로, 이식유전자 복제물 당 더 낮은 발현이 비선택 세포로부터 또는 트랜스포사제 또는 중앙에 위치된 MAR 없이 형질감염된 항생물질-선택 세포로부터 얻어졌는데, 이는 이식유전자 발현이 후성적 조절 구성요소의 봉입에 의해 그리고 이식유전자 통합 방식에 의해 영향받는다는 것을 나타낸다(도 5). 유전자 복제물 당 발현은 다양한 벡터 및 구성요소의 조합으로부터 평가될 때 일반적으로 트랜스포사제에 의해 증가되었고, 이는 항생물질 선택에 의해 또는 항생물질 선택 없이 관찰되었다. 트랜스포사제의 존재에서 중앙에 위치된 MAR 구성요소를 함유하는 트랜스포존 벡터에 의해 생성된 세포로부터 항생물질 선택 후에 이식유전자 복제물 당 가장 높은 수준의 발현이 얻어졌다. GFP 암호 서열 바로 하류의 MAR의 봉입은 발현의 절대 수준에 대해 더 앞서 언급된 바와 같이 상당하게 이식유전자 발현을 증가시키지 않았다.
최종적으로, 발현에 대한 MAR 1-68의 바람직한 효과가 본 명세서에서 사용되는 강한 인간 GAPDH 프로모터에 대해 특이적일 수 있는지 여부, 또는 그것이 다른 프로모터에 의해 일어나는지 여부를 평가하였다. 따라서, 본 발명자들은 GFP 발현을 구동시키는 인간 GAPDH 프로모터를 더 약한 유인원 바이러스 40(SV40) 초기 프로모터에 의해 대체하였다. 더 약한 프로모터의 사용은 비슷한 수의 GFP-양성 세포 및 통합된 이식유전자를 수득하였는데, 이는 전위 효율이 이식유전자 발현에 의해 변용되지 않는다는 것을 나타낸다(결과 미제시, 도 2A 및 도 4B). 그러나, 발현의 절대 수준은 SV40 프로모터에 의해 더 낮아졌다(미제시 대 도 3B). 추가로, 트랜스포존 복제수에 대해 정규화된 발현은 MAR이 없는 SV40 프로모터의 사용에 의해 4.6배만큼, 그리고 MAR 1-68에 의해 3.1배만큼 감소되었다(결과 미제시). 이는 MAR이 트랜스포사제의 존재에서조차 더 약한 프로모터의 사용으로부처 초래되는 발현을 완전히는 아니지만 부분적으로 방지할 수 있었다는 것을 나타내었다. 전반적으로, 소수의 통합된 복제물은 트랜스포존로부터 높은 이식유전자 발현을 얻는데 충분하고, 이와 관련하여 MAR-68이 강한 프로모터의 상류에 위치될 때 이식유전자 당 가장 높은 발현이 얻어진다는 것을 나타낼 수 있었다.
CHO-M 세포는 이식유전자 MAR X_29-함유 전위성 벡터를 이용하여 1회 또는 2회 전기천공되었다. 전위 효율은 전기천공법 후에 가장 높았다(30% 내지 45%의 세포는 안정한 발현을 나타내었다). 그러나, 이식유전자 발현 수준은 더 낮은 양성 세포를 나타내고, 따라서 더 낮은 전위 효율을 나타내는 화학적 형질감염과 유사하였다. 도 7은 1 내지 8㎍/㎖의 범위에 있는 표제 및 MAR X_29 상류에 삽입된 치료적 면역글로불린의 경쇄 및 중쇄에 의한 결과가 얻어졌음을 나타낸다. 발현 세포를 분류함으로써 수준을 23 내지 55㎍/㎖까지 추가로 증가시켰다(도 7C).
이식유전자의 발현은 또한 구체적 벡터 설계에 의해, 특히 이식유전자에 대한 특이적 위치에서 특이적 MAR 구성요소(들) 및 바람직하게는 프로모터, 인핸서 또는 이들의 융합물과 해당 MAR 구성요소(들)의 조합의 사용에 의해 트랜스포존의 사용과 종종 독립적으로 실질적으로 증가될 수 있다.
각각의 벡터는 이식유전자 발현 카세트에 측접하는 MAR을 함유할 수 있다. 예를 들어, 벡터는, 예를 들어, 상류의 MAR(하나 이상의) 및 하류의 MAR(하나 이상의), 예를 들어, 이식유전자 발현 카세트 상류에 위치된 하나의 MAR 및 하류에 위치된 하나의 MAR을 함유할 수 있다(도 18A, 도 18B, 도 19). 벡터는 SV40 프로모터의 제어 하에 통합된 퓨로마이신 내성 유전자를 함유할 수 있다. 이식유전자는 인간 사이토메갈로바이러스(CMV) 전초기 유전자 인핸서(특히 상기 논의한 바와 같은 CGAPD 융합 프로모터)에 융합된 인간 GAPDH 프로모터의 제어 하에 있을 수 있다.
FACS 분석 및 최소 가변성에 의해 GFP 형광에 대해 평가한 바와 같이 가장 높은 백분율의 높은 및 매우 높은 생성자 세포(% M3/M2)가 상류의 MAR로서 1_6R2, 1_68R2 및 X_29R3을 사용하여 얻어질 수 있었다(80% 초과, 80% 및 80% 초과). 따라서, 70% 초과 75% 또는 80% 초과의 높은 및 매우 높은 생성자 세포의 백분율(% M3/M2)은 제대로 본 발명의 범주 내이다. 당업자가 이해할 바와 같이, 이들 MAR의 구체적 서열로부터의 특정 편차는 허용된다. 따라서, 서열번호 6, 7, 8, 9 및 10과 80%, 85%, 90%, 95% 초과의 서열 동일성을 갖는 핵산 서열을 함유하는 벡터는 본 발명의 범주 내에 있다(도 18A, 도 18B).
생물반응기 내에서 및/또는 선택 압력 없이 발현의 상실은 종종 관심 대상 단백질의 회수를 제한한다. 상류의 MAR로서 1_68R2, 1_6R2 및 X_29R3 MAR 유도체를 함유하는 벡터를 선택 없이 배양의 5주 기간에 걸쳐 시험하였고, GFP 형광을 이 기간에 걸쳐 매주 평가하였다. M3 하위집단의 백분율을 고려할 때, 상류의 MAR로서 1_6R2 구성요소 및 하류의 MAR로서 재배열되지 않은 MAR 1-68은 적어도 하나의 상류 및 하나의 하류의 2개 MAR를 지니는 벡터에서 가장 잘 시험된 조합이라는 것을 발견하였다(2, 3, 4주 초과 후에 80%보다 훨씬 초과)(도 19 참조).
유사하게 설계된 벡터는 또한, 예를 들어, 단지 하류의 MAR(하나 이상), 예를 들어, 이식유전자 발현 카세트 하류에 위치된 하나의 MAR(도 20A, 20B, 21 및 22)를 함유하고 상류의 MAR을 함유하지 않을 수 있다. 벡터는 또한 이 경우에 SV40 프로모터의 제어 하에서 통합된 퓨로마이신 내성 유전자를 함유할 수 있다. 이식유전자는 인간 사이토메갈로바이러스(CMV) 전초기 유전자 인핸서에 융합된 인간 GAPDH 프로모터의 제어 하에 있을 수 있다. 예를 들어, 서열번호 11은 80%, 85%, 90% 또는 95% 초과의 서열 동일성을 갖는 다른 것임을 참조한다. MAR로서 X_29를 지니는 이러한 단일 MAR 무리에서 우수한 결과가 달성되었다. 높은 GFP 발현 세포의 백분율(상기와 같이 결정됨) 및 또한 시간에 따른 발현 안정성(상기와 같이 결정)은 MAR이 이식유전자 발현 카세트에 측접한 고성능 벡터, 즉, 상류의 MAR 1_6R2 및 하류의 재배열되지 않은 MAR 1-68을 포함하는 벡터보다 더 양호하다(도 22 참조). 이 발견은 MAR이 이식유전자에 측접할 때 가장 효과적이라는 잘 확립된 추측과 대조적이다(미국 특허 제5,731,178호 참조). 발현의 안정성은 관심 대상 DNA, 예를 들어 이식유전자가 특정 시간 기간 후, 예를 들어 비슷한 속도로(20% 이하, 10% 또는 5% 미만) 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14주 초과 후조차 그리고 특히 발현 개시의 2주까지 훨씬 더 높게 세포 집단에 의해 발현된다는 것을 의미한다. 종종 안정한 발현은 높은 백분율(예를 들어, 80% 초과) 또는 고도로 발현되는 세포의 하위집단과 관련된다.
세포의 대사 유전자 조작: 분비 단백질
IgG와 같은 비상동 단백질의 분비는 CHO 세포와 같은 배양 세포에서 부적절한 폴리펩타이드 가공 및 낮은 IgG 생성에 의해 작아진다.
스트레스-유도 샤페론 유사 Bip의 발현이 유도되고 샤페론은 ER 내에서 정확하게 국소화되며 IgG 전구체 쇄와 상호작용할 수 있다는 것이 관찰되었다. 그러나, 인플릭시맙에서 발견된 것과 같은 특정 가변 서열을 함유하는 IgG는 그럼에도 불구하고 부정확하게 가공 및 조립되는데, 이는 불량한 분비를 야기한다. 따라서, 이들 세포에서 UPR 반응의 활성화는 상당한 수준의 면역글로불린을 동원함에 있어 비효과적으로 남아있다.
SRP14는 외인성 단백질을 과발현시키는 CHO 세포에서 제한되는 분비 경로의 분자 단계에 연루된 것으로 나타났다. 흥미롭게도, 이 제한 단계는 또한 높은 발현자 클론을 용이하게 야기하는 발현이 쉬운 트라스투주맙에 대해 또한 일어난다. 이 결론은 인간 SRP14의 발현이 LP 클론의 발현을 용이하게 회복하였지만, 이는 또한 용이하게 발현된 IgG의 분비를 증가시켰다는 발견에 따랐다. SRP14 발현은 LC 및 HC 전구체의 가공 및 이용가능성을 증가시키고, IgG의 유형 둘 다에 대해 비슷한 수준의 분비를 수득한 것이 발견되었다. 전반적으로, SRP14는 IgG와 같은 분비된 단백질이 CHO 세포에서 과발현될 때 일반적으로 제한될 수 있는 것으로 입증되었다.
이 연구에서 관찰된 바와 같은 CHO 세포에서 SRP14의 발현으로부터 얻어진 강한 효과는 예상되지 않았고, SRP14가 생성이 어려운 IgG 생성자 클론에서 LC 신장의 지연을 연장시킨다는 것을 시사하였다(도 12B, 1 지점).
이전의 작업은 번역 리보솜으로부터 나온 신호 펩타이드가 SRP 입자의 SRP54 서브유닛과 처음 상호작용하는 한편, SRP9 및 SRP14와의 결합은 초기 폴리펩타이드의 추가 신장을 차단하여 번역 중단을 야기할 수 있다는 것을 나타내었다(Walter and Blobel 1981). 제2 단계에서, 리보솜-초기 폴리펩타이드-SRP 복합체는 SR 수용체와 그의 상호작용을 통해 ER 막에 도킹한다(Gilmore et al., 1982; Walter et al., 1982). 이어서, SR은 리보솜-초기 폴리펩타이드 복합체로부터의 SRP의 방출 및 성장하는 초기 폴리펩타이드가 ER로 유입되는 트랜스로콘 통로를 지니는 리보솜 부위의 결합을 조정할 수 있다(Lakkaraju et al., 2008). 이어서, 번역-결합된 전위는 신호 펩타이드의 제거 및 적절하게 가공되고 분비된 폴리펩타이드의 합성을 야기하도록 재개될 수 있다.
발현이 어려운 IgG의 적절한 가공은 초기 펩타이드의 바람직하지 않은 구조 때문에 ER에 대한 도킹의 역학이 IgG 가변 도메인과 신호 펩타이드 서열의 특정 조합에 대해 더 느려질 수 있다면, 대단히 긴 번역 정지를 필요로 할 수 있다. 따라서, 외인성 인간 SRP14 구성성분의 발현에 의한 번역 중단 역학의 조절은 결국 전-LC의 적절한 ER 도킹 및 전위를 개선시키고, 따라서 신호 펩타이드의 효율적인 가공을 회복하는 것으로 고려되었다(도 12B, 2 지점). 일치되게, 인간 세포에서 SRP14 수준을 낮추는 것은 폴리솜에서 번역 신장 지연의 결여를 야기하는데, 이는 결정적 길이 이상의 초기 폴리펩타이드의 과발현을 초래할 수 있고, 이후에 SRP는 분비된 단백질을 ER에 대해 더 이상 적절하게 표적화하지 않을 수도 있다. 따라서, CHO 세포 SRP14, 및 가능하게는 또한 SRP54는 비상동 인간 인플릭시맙 단백질의 신호 서열에 대해 감소된 친화도를 가져서 부정확한 ER 도킹 및/또는 적절한 도킹 전의 초기 펩타이드의 신장이 일어나는 것을 야기한다. 이는 ER 게이트에서 생기는 과발현된 IgG 단백질의 '분자잼(molecular jam)'에도 불구하고 정지된 리보솜-SRP 복합체가 ER에 대해 적절하게 조직화된 도킹 부위를 찾을 수 있는 시간 기간 동안의 늘이기를 인간 SRP14의 과발현에 의해 수정한다.
일치되게, 전위에 관하여 ER 능력을 증가시킬 수 있는 SR 및 트랜스로콘의 과발현은 또한 인간 SRP14 과발현이 없을 때 조차 분비의 개선을 야기하였다. 최종적으로, 인간 SRP, 트랜스로콘 및 SR 서브유닛의 조합의 과발현에 의한 분비 경로의 대사 유전자 조작은 단백질 분비 세포 능력의 추가 개선을 야기하여 심지어 더 높은 분비 수준을 수득한다는 것을 입증하였다. 전반적으로, SRP 단백질, 그의 수용체 및 트랜스로콘은 인간 면역글로불린과 같은 분비된 단백질이 CHO 세포에 의해 과발현될 때 일반적으로 제한될 수 있다는 결론이 내려졌다.
상이한 세포 유형에서 분비된 단백질 및 리보솜에 대한 SRP 및 ER 막 구성성분의 대략의 존재비는 거의 알려져 있지 않지만, 생각건대 다량의 재조합 단백질을 발현시키는 세포에서 전위 결합이 일어날 수 있다. 예를 들어, SR 및/또는 트랜스로콘은 분비된 단백질이 비정상적으로 고수준에서 발현될 때 제한될 수 있거나, 또는 SRP14은 다른 SRP 서브유닛에 대해 CHO 세포에서 하위-화학량론적 수준에서 생길 수 있다. 일치되게, SRP9 및 SRP14은 영장류 세포에서 다른 SRP 단백질 이상으로 20배 과량으로 존재하지만, 마우스 세포에서는 그렇지 않고, 정상 인간 세포 내 인간 SRP14의 과발현은 알칼린 포스파타젠의 분비 효율을 증가사키지 않았다. 더 나아가, 인간 SRP14는 그의 설치류 상대보다 더 큰데, 그것이 설치류 SRP14에서 발견되지 않은 그의 C-말단에서 알라닌-풍부 꼬리를 함유하기 때문이다. 따라서, CHO SRP 내 더 큰 인간 SRP14의 혼입은 우세한-긍정적 효과에서 더 높은 활성의 기능성 SRP 키메라 형성을 야기할 수 있다.
SRP14와 같은 사이토졸 SRP 구성성분의 발현이 CHO 세포에서 과발현된 단백질의 효율적인 가공 및 분비를 야기한다는 발견은 재조합 단백질 수율을 개선시키기 위해 사용될 수 있는 병목현상을 시사한다. 이 병목현상은 별개의 그리고 관련없는 IgG의 발현 및 가능하게는 또한 재조합 치료적 단백질의 훨씬 가장 흔한 부류를 구성하는 수많은 다른 단클론성 항체 및 유도체의 발현을 제한한다.
분비 중간체 및 가능한 세포 스트레스 반응의 분석 다음에 이러한 스트레스 반응을 야기하는 상류의 제한 활성의 체계적 검색, 및 이어서, CHO 세포 분비 메커니즘의 유전자 조작에 의한 마무리는 이들 세포의 대사적 제한의 더 양호한 이해 및 그들을 처리하는 방법을 야기하였다.
SRP14의 비상동 발현은
분비 및 LC 가공을
회복한다
IgG의 HP(고 생성자) 및 LP(저 생성자) 클론은 SRP의 SRP14 구성요소를 암호화하는 벡터로 그리고 네오마이신 내성 플라스미드로 공동 형질감염되었다. 네오마이신-내성 풀에서 개개 세포는 희석을 제한하고 후속적으로 진탕 배양 접시 배취에서 성장 및 면역글로불린 분비에 대해 시험함으로써 분리되었다. SRP14-발현 LP-유래 서브클론은 배양 내내 그들의 모 상대보다 상당히 더 많은 양의 항체를 분비하였고, 그들은 HP SRP14-발현 서브클론과 유사한 면역글로불린 역가를 수득하였다(도 8A 및 도 8B, 좌측 패널).
SRP14의 발현은 세포 생존 능력에 영향을 미치지 않았지만, 유사한 세포 밀도까지 HP 세포 배양물의 성장을 늦추고 연장시키는 것으로 나타났다(도 8A 및 도 8B, 우측 패널). 다양한 서브클론의 배양 상청액을 수집하고 나서 항체 농도에 대해 분석하였다. 도 8C에 나타낸 바와 같이, SRP14 발현은 LP 세포로부터의 분비를 향상시켰는데, 이는 IgG 구체적 생산성의 7배 증가를 야기하였다. 게다가, SRP14의 외인성 발현은 또한 HP 서브클론으로부터의 IgG 분비를 개선시켰는데, 이는 구체적 생산성의 30% 증가를 야기하였다. 흥미롭게도, SRP14를 발현시키는 개개 서브클론은 본질적으로 동일한 평균 속도로 발현이 어려운 IgG와 발현이 쉬운 IgG를 분비하였고, 중앙값 특이성 생산성은 세포 당 그리고 1일 당(pcd) 30 피코그램을 초과한다. 이런 매우 높은 IgG 분비 수준을 6개월 초과의 배양 동안 유지하였는데, 이는 SRP14-발현 세포의 안정한 특성을 나타낸다.
SRP14 발현과 IgG 생산성 간의 관계를 추가로 조사하기 위해, 5개 개개 SRP14-발현 LP 서브클론의 SRP14 mRNA 수준을 상대적 정량적 PCR에 의해 분석하였다. 도 8D에 나타낸 바와 같이, 서브클론은 내인성 CHO 세포 SRP14 mRNA의 50 내지 거의 200배 범위의 수준에서 SRP14를 과발현시켰다. 이는 LP 대조군 세포 클론에 비해 4 내지 6배의 IgG 분비 향상을 수반하였다. 흥미롭게도, 가장 높은 구체적 생산성은 CHO 세포 내인성 SRP14 mRNA(SRP14-LP 서브클론 E, 제시하지 않음)의 대략 100배 이상의 중간 수준에서 SRP14를 과발현시키는 서브클론으로부터 얻어졌다. 이는 내인성 발현 수준보다 100배 증가에 대응하는 SRP14의 역치값까지 SRP14 과발현 및 IgG 구체적 생산성 수준의 상호의존성을 나타내었다. 이는 분비 경로의 다른 구성성분이 결국 매우 고수준의 SRP14를 제한할 수 있고, 경로 구성성분의 균형 잡힌 발현이 최적의 IgG 발현에 필요로 될 수 있다는 것을 시사하였다.
클론의 세포주 평가 동안 얻은 증가된 구체적 생산성이 생성 과정에 적용될 수 있는지 여부를 시험하기 위해, 최상의 HP 및 LP SRP14-발현 서브클론을 유가식 조건에서 진탕 배양 접시 내에서 시험하였다(즉, 도 8의 LP 서브클론 E 및 HP 서브클론 B). SRP14-발현 LP 서브클론은 최대 8x106개 세포/㎖ 및 생성 실행의 마지막에 리터 당 2g 초과를 지니는 SRP14-발현 HP 서브클론보다 유사하게 높은 수의 살아있는 세포 및 면역글로불린 역가를 수득하였다(도 9A 및 도 9B).
이들 두 서브클론에 대한 면역글로불린 합성에 대한 SRP14 과발현의 영향을 다음에 시험하였다. 이는 LP-유래 서브클론에서 인간 SRP14의 발현이 폴딩 및 IgG 조립체에 대해 정상적 가공 및 성숙 LC 적격을 야기한다는 것을 나타내었다(도 10A, LP 레인 S 대 레인 -). 유리 HC의 이동은 영향받지 않았는데, 이는 SRP14 발현이, 발현이 어려운 단백질의 오가공된 LC에 대해 특이적으로 작동되었다는 것을 나타낸다. 현저하게, SRP14 발현은 트리톤 X-불용성 분획에서 응집화된 LC의 축적을 완전히 없앴다(도 9A, 하부 패널). 대조군 GFP 단백질의 발현은 단백질 용해도를 개선시키지도 않았고, LC의 적절한 가공을 회복하지도 않았다(도 10A, LP 세포의 레인 G). SRP14의 발현은 HP 서브클론으로부터 얻은 HC 및 LC 이동 패턴에 대해 효과가 없었고, 대조군과 비교할 때 유리 쇄 및 완전히 조립된 IgG의 양에 대한 효과는 거의 관찰되지 않았다(도 10A, HP 세포의 레인 G).
IgG 폴딩 및 조립체 역학뿐만 아니라 SRP14-발현 인플릭시맙 생성자 서브클론에서 IgG 응집물의 운명을 조사하기 위해 사이클로헥스이미드 기반 추적 분석을 수행하였다. IgG 조립체에 대해 응집된 LC 부적격을 나타내는 모 LP 세포와 대조적으로, SRP14-발현 LP 서브클론은 Tx-100 불용성 LC를 더 이상 축적하지 않았다(도 9B, 하부 패널). 그러나, 또한 유리 HP 세포에 대해 언급한 바와 같이, 유리 LC는 유리 HC에 비해 소량으로 남아있었는데, 이는 그것이 HC-LC 이합체 및 성숙 IgG 내로 빠르게 혼입되고, 그것이 IgG 조립체를 제한할 수 있다는 것을 나타낸다(도 9A 및 도 9B). 종합적으로, 이들 결과는 SRP14가 LP 세포에 의해 LC 가공에서 필수적 역할을 할 수 있고, 추가적인 SRP 단백질 발현이 유사한 수준까지 발현이 어려운 IgG 및 발현이 쉬운 IgG의 분비를 개선시킬 수 있었다는 것을 나타내었다.
ER 전위의 유전자 조작은 재조합 IgG 분비를 개선시킨다
비상동 SRP14의 과발현이 주어진 역치까지 IgG 분비를 증가시켰다는 것을 고려해볼 때, SRP14와 직접적으로 또는 간접적으로 상호작용하는 분비 경로의 다른 구성성분은 SRP14-LP 서브클론에서 제한적이 될 수 있다는 것이 추론되었다. 따라서, 본 발명자들은 분비 경로의 다른 구성성분의 과발현이 또한 단독으로 또는 SRP14와 조합하여 IgG 발현을 개선시킬 수 있는지 여부를 탐구하였다. 이들은 SRP14와 함께 SRP 복합체를 구성하는 인간 SRP9 및 SRP54 단백질, 및 SRP 수용체(SRP receptor: SR)의 서브유닛 및 트랜스로콘의 Sec61α, β 및 γ 서브유닛을 포함하였다.
실험의 제1 세트에서, 최고로 성능의 LP 클론, 즉, 도 1의 LP 클론 E는 단독으로 또는 조합으로 SRP 단백질 또는 트랜스로콘 단백질을 암호화하는 발현 벡터로 형질감염되었다. 이어서, 얻어진 LP 다클론성 세포 풀은 배취 배양에서 IgG 생성에 대해 평가되었다. SRP 구성성분의 발현 또는 트랜스로콘 단백질의 발현은 이들 재형질감염된 LP 다클론성 세포 풀로부터 면역글로불린 분비를 증가시켰다(도 11A 및 데이터 미제시). SRP14 발현 단독과 비교하여, SRP 단백질 조합의 과발현 또는 트랜스로콘의 과발현은 추가적인 20% 내지 40%까지 형질감염된-LP 다클론성 세포 풀의 구체적 생산성을 개선시켰다(도 11A, 중앙값의 비교). 이들 결과는 3개 SRP 폴리펩타이드 및 그의 수용체(SR)의 발현 또는 SR과 트랜스로콘의 공동 발현으로 이루어진 것과 같은 특정 조합이 SRP14 발현 단독보다 인플릭시맙 분비를 회복하는데 더 강력하였다는 것을 명확히 나타내었다(도 11A).
SRP14-발현 LP 서브클론 E가 SR 및/또는 트랜스로콘 조합의 발현에 의해 추가로 최적화될 수 있는지 여부가 또한 평가되었다. SRP14-LP 서브클론 E의 30 pcd에 비해, 다클론성 세포 풀은 SR 단백질에 의한 형질감염 후에 선택되었고, 트랜스로콘은 발현이 어려운 면역글로불린에 대해 60 pcd 초과로 구체적 생산성을 수득하였다(도 10B). SR 단백질 및 트랜스로콘 발현 벡터는 또한 SRP14-LP 클론 E에 비해 증가된 구체적 생산성을 지니는 클론을 생성하기 위해 사용될 수 있고, 일련의 연속된 형질감염 및 선택 주기에 기반한 접근이 성공적으로 적용될 수 있다는 결론을 내렸다.
세포의 대사적 유전자 조작: TEP 및 TEP 기능성 RNA의 재조합 경로 및 발현의
넉다운
재조합에 영향을 미치기 위해, 중요한 DNA 재조합 유전자는 침묵이 될 수 있다. 넉다운을 위한 표적은 포유류에서 특정 재조합 수복 경로에 대해 중요한 문헌으로부터 공지된 유전자이다(표 D). 대부분의 이들 유전자가 세포 생존 및 발생에 필수적이기 때문에, 그들의 영구적인 침묵은 감소된 세포 생존능력을 야기할 수 있다. 따라서, RNA 간섭(RNAi)을 이용하여 일시적으로 이들 표적 유전자를 침묵시키는 것이 바람직하다.
NHEJ의 제1 단계에 수반된 인자, 즉, Ku 70, Ku80 및 DNA-PKcs(단백질 당 하나의 siRNA 듀플렉스)에 대한 siRNA의 혼합에 의해 처리된 세포에서, NHEJ 사건의 빈도는 비처리 세포에서 상당히 더 낮았다. 대신에 HR은 이들 세포에서 더 효율적이었는데, 이는 감소된 NHEJ 대 HR 비(2.7:1 내지 1.3:1)를 야기하였다. 대조적으로, 본래의 HR 인자 - Rad51에 대해 표적화된 siRNA로 처리한 세포에서, HR-의존적 GFP 재구성은 거의 완전히 없어졌는데, 이는 NHEJ:HR 비를 5:1로 증가시켰다. 이들 결과는 HR 및 NHEJ 리포터 분석이 염색체 밖 형태에서 사용되기에 충분히 민감하다는 것을 나타내는 것으로 보인다. 그들은 또한 이전에 사용된 CHO 돌연변이체 세포주의 신뢰성에 추가로 도전한다(특히, 51D1 세포, 본래 HR-음성 세포로서 공개되었지만, 겉보기에는 이 분석에 따라 HR을 수행할 수 있음 - 데이터 미제시).
MAR의 존재에서 GFP 발현 및 통합의 증가. 병행 실험에서, 상이한 항-HR 또는 항-NHEJ siRNA로 처리한 CHO 세포는 GFP 또는 MAR-GFP 함유 플라스미드로 형질감염되었다. 항생물질 선택의 2주 후에, 세포는 각각 FACS 및 qPCR에 의해 GFP 발현 및 통합에 대해 분석되었다. 시험한 모든 조건에서, MAR의 첨가는 MAR이 없는 플라스미드로 형질감염된 세포에 비해 GFP 발현의 4 내지 5배 증가를 초래하였는데(도 13, 도 14A), 이는 이전의 보고와 비슷하다(Grandjean et al., 2011). 이 증가는 MAR이 없는 벡터를 받은 세포에 비해 MAR-GFP 플라스미드로 형질감염된 세포에서 통합된 GFP 복제수의 대략 3배 증가를 수반하였다(도 13, 도 14B). 또한 가능하게는 통합 부위의 더 바람직한 국소화에 기인하여(예를 들어, 진정염색질이 풍부한 영역에서) 유전자 복제물 당 평균 GFP 형광에서 2배 증가가 있었다(도 13, 도 14C). 따라서, MAR 구성요소가 유전자 발현을 허용하는 게놈 자리에 유전자를 보내는 능력을 갖는다는 가설을 세울 수 있었다. 항HR siRNA와 MAR의 조합(siRNA: RAD51, Rad51C 및 Brca1)은 상기 11의 평규 GFP 발현에서 배수적 변화를 야기한 반면, 단일 항HR-siRNA(si:RNA: Rad51은 9 미만의 배수적 변화를 야기하였다. MAR과 siMMEJ siRNA의 조합과 같은 다른 조합은 단일 siRNA에 비해 개선된 발현을 야기하였다(데이터 미제시). 따라서, 동일 또는 상이한 대사 경로, 특히 재조합 경로에서 표적과 상이한 siRNA의 조합(2, 3, 4, 5, 6, 8, 9, 10)은 본 발명의 범주 내이다.
이식유전자 발현 및 통합에 대한 NHEJ 유전자 넉다운의 효과 없음. NHEJ 단백질에 대한 siRNA로 처리는 안정한 이식유전자 발현에 상당히 영향을 미치는 것으로 보이지 않았다. 또한 비처리 세포에 비해 게놈에서 GFP 복제수의 상당한 변화가 없었다(-53BP1 siRNA로 처리한 세포는 제외하지만, 단지 MAR이 없을 때, 항비처리 세포 경로에 의한 재조합과 달리 가능하게 효과를 나타냄).
HR 인자가 없을 때 이식유전자 발현 및 통합의 증가. NHEJ 인자의 넉다운과 대조적으로, HR 단백질에 대한 siRNA의 존재는 비처리 세포에 비해 안정한 GFP 발현의 상당한 증가를 종종 야기하였다(Brca2를 제외, 이에 대해 상당한 감소가 있었지만, 또한 단지 MAR이 없음)(도 15A). NHEJ 유전자의 침묵이 있는 경우와 같이, MAR의 존재는 증가된 안정한 GFP 발현 및 통합뿐만 아니라 유전자 복제물 당 발현을 야기하였다. 그러나 이번에는 HR 인자의 침묵은 5 내지 7배만큼 효과를 향상시켰는데(가장 두드러진 것은 Rad51의 넉다운이 7.4배 더 높은 GFP 발현 수준에 도달하는 것임)(도 15A), 이는 HR 단백질이 이식유전자 발현에 p대한 MAR 구성요소의 긍정적 효과에 대응한다는 것을 나타낼 수 있었다. MAR에 없을 때, GFP 발현의 증가는 게놈에서 상승된 GFP 복제수와 관련되었다(결과 미제시). 놀랍게도, 이는 MAR이 존재하는 경우는 아니며, 복제수에서 MAR-매개 증가는 HR 단백질 넉다운에 의해 영향받지 않는다는 것을 나타낸다(Rad51D siRNA를 제외함). 이는 기능성 HR 수선 경로의 부재가 MAR에 의해 촉진된 재조합 사건의 수를 향상시키지 않는다는 것을 시사하는 것으로 보인다. 대신에, 그것의 더 효율적인 발현을 고려하는 더 바람직한 자리에서 MAR 및 이식유전자의 통합을 자극할 수 있다. 이 관점은 또한 항-HR siRNA로 처리한 세포에서 MAR의 존재 하에 개개 GFP 복제물의 상승된 발현에 의해 지지된다(도 14C). 다른 가능성은 게놈 내로 통합된 플라스미드 복제물의 수가 대조군 세포에서 이미 그의 최대값에 있고(여기서 사용되는 플라스미드 DNA의 양에 의함) MAR에 대해 더 유리한 조건에서조차 추가로 증가될 수 없다는 것이다.
이들 결과는 함께 NHEJ의 구성성분의 넉다운이 통합 또는 발현에 대해 효과를 갖지 않기 때문에 NHEJ의 가능성이 없다고 해도, MAR-매개 이식유전자 통합의 과정이 상동성 재조합과 반대되는 경로에 의해 우선적으로 매개된다는 것을 시사한다. 이 대안의 경로는 기능성 HR 경로의 존재에서 덜 활성이지만 HR이 망가진다면 더 중요하게 되는 것으로 가설을 세울 수 있었다.
치료적 단백질의 발현을 증가시키기 위한 항-HR
shRNA의
발현
3개의 siRNA 표적화 Rad51을 헤어핀 구조를 형성하는 shRNA 서열로 전환하고 나서, shRNA 암호 서열을 GAPDH 인핸서 및 CMV 프로모터 융합의 제어 하에 피기백 트랜스포존 벡터 다음에 MAR X-29 내로 삽입하였지만, 항생물질 선택 유전자는 없었다. 현탁액-적합 CHO-M 세포를 트랜스포존 공여체 플라스미드 및 트랜스포사제 발현 벡터로 3회 형질감염시키고, 이후에 30개의 개개 세포 클론을 클론픽스(ClonePix) 장치를 이용하여 무작위로 집었다. 모 세포뿐만 아니라 shRNA-발현 세포 풀 및 클론의 풀을 GFP 발현 플라스미드(즉, 퓨로-GFP-MAR X_29 작제물)로 재형질감염시키고, 이후에 GFP-발현 세포의 다클론성 풀의 퓨로마이신 선택을 하였다. GFP 형광 프로파일의 비교는 고도로 형광성인 세포(M2 세포 집단) 또는 매우 고도로 형광성인 세포(M3 세포 집단)에 대해 더 높은 비율의 배지를 모 CHO-M 세포와 비교하여 shRNA 벡터로 형질감염된 세포 풀로부터 얻어졌다는 것을 나타내었다(도 17A).
몇몇 shRNA-발현 클론은 매우 높은 GFP 수준을 매개하였으며, 클론 16 및 클론 26에 예시한 바와 같이 80% 이상의 항생물질 내성 세포가 형질감염 10일 후에 고도로 형광성인 M3 하위 집단에 있었다(도 17A 및 도 17B). 고수준의 GFP 형광을 선택 없이 추가 배양의 35일 후에 이들 두 클론에서 유지하였다(도 17C). 대조적으로, 클론 17은 제10일에 매우 고수준의 GFP를 발현시키지 않았고, GFP 발현은 불안정하게 되는 것으로 나타났다(도 17B 및 도 17C). 클론 8 및 클론 22로부터 중간체 발현 수준 및 안정성을 얻었다. 이들 클론을 또한 발현이 어려운 인플릭시맙 치료 항체의 경쇄 및 중쇄를 암호화하는 발현 플라스미드로 형질감염시켰다. 전과 같이, 클론 16 및 26 다음에 클론 8 및 22는 가장 고수준의 항체를 생성한 반면, 클론 17은 모 CHO-M 세포로부터 얻은 0.5 내지 1 pcd와 유사한 양의 면역글로불린을 발현시켰다(도 17D, 데이터 미제시). 가장 유의하게 감소된 Rad51 mRNA 수준을 나타내는 세포 클론은 GFP와 인플릭시맙 면역글로불린 둘 다의 고발현을 수득하였는데, 이는 증가된 이식유전자 발현이 재조합 단백질의 감소된 발현으로부터 초래된다는 것을 나타낸다(결과 미제시).
따라서, 인플릭시맙과 같은 분비된 치료적 단백질의 더 높고 더 안정한 생성 수준은 Rad51-표적화 shRNA를 발현시키는 세포로부터 또는 Rad51-표적화 siRNA와 같은 siRNA에 의해 일시적으로 형질감염된 세포로부터 달성될 수 있다.
재료 및 방법
플라스미드 및 DNA 벡터
PB 트랜스포사제 발현 벡터 pCS2+U5V5PBU3은 아프리카발톱개구리(Xenopus laevis) β-글로빈 유전자의 5' 및 3' 미번역 말단 영역(UTR)에 의해 둘러싸인 PB 트랜스포사제 암호 서열을 함유한다. 이 플라스미드는 다음과 같이 구성되었다: pBSSK/SB10(Dr S. Ivics에 의해 기꺼이 제공됨)으로부터의 3' UTR 317 bp 단편을 pCS2+U5(영국 페이즐리에 소재한 인비트로젠/라이프 테크놀로지즈(Invitrogen/Life Technologies)) 내로 삽입하여 pCS2+U5U3을 수득하였다. PB 트랜스포사제 암호 서열(2067 bp, 젠뱅크 등록번호: EF587698)을 ATG:바이오신쎄틱(ATG:biosynthetic)(독일 메르츠하우젠에 소재)에 의해 합성하고 나서, 두 UTR 사이의 pCS2+U5U3 백본에 클로닝시켰다. PB 대조군 벡터는 비변형 pCS2+U5 플라스미드에 대응한다(도 1, 좌측 패널).
이 연구에서 사용되는 상이한 트랜스포존 벡터는 PB 235 bp 3' 및 310 bp 5' 역위 말단 반복부(ITR)를 도입함으로써 생성되었고, ATG:바이오신쎄틱(독일 메르츠하우젠에 소재)에 의해 pBluescript SK-플라스미드(pBSK ITR3'-ITR5', 도 1, 우측 패널) 내로 합성되었다. 이어서, pRc/RSV 플라스미드(인비트로젠/라이프 테크놀로지즈)로부터 SV40 프로모터의 제어 하에서 퓨로마이신 내성 유전자(퓨로(Puro)(등록상표))를 두 ITR 사이에 삽입하였다. 이 연구에서 사용되는 퓨로마이신 내성 및 GFP 유전자인 MAR 1-68 및 MAR X-29 구성요소는 앞서 기재한 바와 같았다. 면역글로불린 발현 벡터 및 SRP9, SRP14, SRP54, SRPR알파, SRPR베타, SEC61A1, SEC61B 및 SEC61G 암호 서열은 르 푸르(Le Fourn) 등(Metab. Eng., Epub 2013 Feb 1)에 의해 기재된 바와 같았다.
GFP, 면역글로불린 또는 분비 단백질은 암호 서열 상류의 인간 CMV 인핸서 및 인간 GAPDH 프로모터 다음에 SV40 폴리아데닐화 신호, 인간 가스트린 종결자 및 SV40 인핸서로 구성된 진핵 발현 카세트를 이용하여 발현시켰다(문헌[Le Fourn et al., 2013] 참조). 발현 카세트 및/또는 MAR 구성요소를 표준 클로닝 방법을 이용하여 ITR 서열 사이에 또는 도 1 및 도면 범례에 도시한 바와 같은 박테리아 벡터 벡본 내에 삽입하였다.
세포 배양 및 형질감염 분석
CHO DG44 세포주를 하이포잔틴/티미딘(HT, 깁코(Gibco)) 및 10% 소태아혈청(FBS, 깁코)로 보충한 DMEM: F12(깁코) 중에서 배양시켰다. 제조업자의 설명서에 따라 PEI(제트프라임(JetPRIME), 폴리플러스 트랜스펙션(Polyplus Transfection))를 이용하여 형질감염을 수행하였다. 300 ng의 PB 트랜스포사제 발현 플라스미드와 300 ng의 트랜스포존 공여체 플라스미드의 최적의 비를 이용하여 역가 실험 또는 공동 형질감염을 위해 PB 트랜스포사제의 pDNA 공급원의 다양한 양(0 내지 1500 ng의 범위)으로 세포를 형질감염시켰다. 형질감염의 2일 후에, 세포를 실험에 따라서 몇몇 페트리 접시에 옮겼다. 비선택 형질감염 CHO 세포의 분석을 위해, 세포를 3주 동안 항생물질 선택 없이 재플레이팅하고, 형광 세포의 백분율 및 GFP 양성 세포의 형광강도를 CyAn ADP 유세포분석기를 이용하여 FACS 분석에 의해 결정하였다(벡크만 쿨터(Beckman Coulter)). 비선택 세포의 유전자 복제수 분석을 위해, 안정한 GFP 양성 CHO 세포를 FACSAriaII를 이용하여 분류하였다. 항생물질 내성 콜로니-계수 분석을 위해, 50,000개의 형질감염 세포를 100㎜ 플레이트 내에 파종하고 나서, 5㎍/㎖ 퓨로마이신으로 2주 동안 선택하였다. 이어서, 내성 콜로니를 고정시키고 나서, 10분 동안 70% EtOH 0,7% 메틸렌 블루(Methylene Blue) 중에 염색시키고, 직경이 0.5㎜ 초과인 콜로니를 계수화하였다. GFP 발현 연구를 위해, 세포를 2주 동안 선택한 후 상기 기재한 바와 같이 GFP 형광 FACS 분석을 하였다.
CHO-M 세포를 습한 공기에서 37℃, 5% CO2에서 L-글루타민(호주 PAA) 및 HT 보충물(깁코, 인비트로젠 라이프 사이언스)로 보충한 SFM4CHO 하이클론(Hyclone) 무혈청 배지(써모사이언티픽(ThermoScientific)) 중의 현탁 배양물에서 유지하였다. 트랜스포존 공여체 플라스미드를 제조업자(네온 디바이스(Neon devices), 인비트로젠)의 권고에 따라 전기천공법에 의해 이들 세포에 옮겼다. 앞서 기재한 바와 같이 배취 배양물로부터 면역글로불린 분비의 정량화를 수행하였다(문헌[Le Fourn et al., 2013] 참조). 간략하게, 면역글로불린을 발현시키는 세포 집단을 37℃, 5% CO2 습한 인큐베이터에서 7일 동안 50㎖ 미니생물반응기 관(스위스에 소재한 TPP) 내로의 배취 배양에서 평가하였다. 세포 배양 상청액 중의 면역글로불린 농도를 샌드위치 ELISA에 의해 측정하였다.
qPCR
유전자 복제수 분석
제조업자의 프로토콜에 따라 DNeasy 조직 키트(독일 힐덴에 소재한 퀴아젠(Qiagen))를 이용하여 다음의 전위 분석 후에 CHO 안정 세포 풀로부터 총 DNA를 단리시켰다. 유로겐테크 인코포레이티드(Eurogentec Inc) 및 ABI 프리즘 7700 PCR 기기(어플라이드 바이오시스템즈(Applied Biosystems))를 이용하여 정량적 PCR에 의해 6 ng의 게놈 DNA를 이용하여 게놈-통합된 이식유전자의 복제수를 평가하였다. GFP-전방: ACATTATGCCGGACAAAGCC 및 GFP-후방: TTGTTTGGTAATGATCAGCAAGTTG 프라이머를 사용하여 GFP 유전자를 정량화하는 한편, 프라이머 B2M-전방: ACCACTCTGAAGGAGCCCA 및 B2M-후방: GGAAGCTCTATCTGTGTCAA를 사용하여 베타-2 마이크로글로불린 유전자를 증폭시켰다. B2M 프라이머에 의해 생성한 앰플리콘에 대해, NCBI BLAST 소프트웨어를 이용하는 본 발명자들의 CHO 게놈 조립에 대한 정렬 후에 CHO 반수체 게놈 당 하나의 히트를 발견하였다. CHO가 거의-이배체 세포이기 때문에, B2M은 게놈 당 2개의 복제물로 존재하는 것으로 평가되었다. GFP 표적 유전자 복제수의 비를 앞서 기재한 바와 같이 B2M 기준 유전자의 복제수에 대해 계산하였다.
면역글로불린-발현 세포의 분류 및 분석
IgG-발현 세포를 자기적으로 분류하기 위해, 형질감염된 CHO-M 세포를 8mM L-글루타민 및 1x HT 보충물(둘 다 깁코사제)로 보충한 SFM4CHO 배지(써모 사이언티픽)에서 3x105개 세포/㎖의 세포 밀도에서 파종하고 나서, 완전 배지로서 지칭하였다. 배양의 4일 후에, 2x106개 세포를 세척하고 나서, PBS 중에 재현탁시키고, 실온에서 30분 동안 회전 휠 상에서 3㎍/㎖의 최종 농도로 바이오티닐화한 인간 IgG(KPL216-1006)와 사전 세척한 MyOne T1 스트렙타비딘-코팅 다이나비즈(Dynabeads)(인비트로젠) 30㎕와 함께 인큐베이션하였다. 이어서, 세포와 비드 혼합물을 자석 상에 두어서 비-표지 세포로부터 표제 세포를 분리시켰다. 비드를 인산염 완충 식염수(phosphate buffer saline: PBS) 용액으로 4회 세척하였다. 최종 PBS 세척 후에, 비드 및 세포를 사전-가온 완전 배지 500㎕ 중에서 재현탁시키고 나서, 24웰 플레이트에 옮기고, 37℃에서 5% CO2와 함께 인큐베이션시켰다. 24시간 후에, 자기-분류된 다클론성 세포를 비드로부터 분리시키고 나서, 세포가 50㎖ TPP 회전관 생물반응기(스위스에 소재한 테크노 플라스틱 프로덕츠 아게(TECHNO PLASTIC PRODUCTS AG)) 내에서 팽창을 위해 충분한 밀도를 가질 때까지 인큐베이션을 계속하였다.
대안적으로, 2개의 클론을 클론픽스(ClonePix) 장치를 이용하여 각각 3개의 IgG를 발현시키는 비-분류 및 비-선택 집단으로부터 단리시켰다. 간략하게, 반고체 배지를 사용하여 단일 세포를 사멸시키고 나서, 다량의 IgG를 분비하는 콜로니를 포매 후 10일에 골라내었다. 이들 세포주를 180rpm에서 오비탈 진탕하면서 37℃ 및 5% CO2에서 유지한 습한 인큐베이터 내에서 펩톤-함유 성장 배지(8mM 글루타민으로 보충한 하이클론 SFM4CHO)에서 3x105개 세포/㎖에서 회전관 생물반응기 내에서 3 내지 4일마다 계대시켰다.
1x 105개 세포/㎖의 세포 밀도에서 파종한 세포로부터 IgG 역가를 결정하고 나서, 다클론성 세포 집단을 평가할 때 50㎖ 회전관 생물반응기 내 5㎖의 완전 배지에서 6일 동안 성장시켰다. 대안적으로, 클론 집단의 진탕 플라스크 배양물을 3x105개 세포/㎖의 밀도에서 SFM4CHO 배지 내로 접종하여 유가배양 생성 과정을 개시하였다. 150rpm에서 진탕하면서(125㎖ 진탕 플라스크 및 회전관) 37℃ 및 5% CO2에서 유지한 습한 인큐베이터에서 125㎖ 진탕 플라스크 내 25㎖의 배양 용적 또는 50㎖ TPP 배양관 내 5㎖에서 유가배양 생성 분석을 수행하였다. 제0일, 제3일 및 제6일 내지 제8일에 화학적으로 정한 농축 공급물(하이클론, 셀 부스트(Cell Boost) 5, 52 g/ℓ)의 초기 배양 용적의 16%를 공급함으로써 10일 동안 생성을 수행하였다. 글루타민 및 글루코스 공급물을 배양 실행동안 적용하지 않았다. 배양물의 생존력 및 살아있는 세포 밀도(VCD)를 GUAVA 기기(밀리포어(Millipore))를 이용하여 매일 측정하였다. 이중 샌드위치 ELISA 분석을 사용하여 배양 배지 내로 분비한 MAb 농도를 결정하였다.
플라스미드 및 상대적 정량적 PCR 분석
이 연구에서 사용한 클로닝 벡터는 셀렉시스(Selexis) 포유류 발현 벡터 SLX플라스미드_082이다. pGL3-대조군 벡터(프로메가(Promega))의 루시퍼라제 서열을 EGFP 암호 서열 상류의 인간 CMV 인핸서 및 인간 GAPDH 프로모터 다음에 SV40 폴리아데닐화 신호, 인간 가스트린 종결자 및 SV40 인핸서로 구성된 진핵 발현 카세트에 의해 대체하였다. 2개의 인간 MAR-유래 유전자 구성요소는 발현 카세트 및 SV40 프로모터로부터 발현된 퓨로마이신 내성 유전자에 측접하는 반면, SLX플라스미드_082는 발현 카세트 상류에 위치된 MAR 구성요소의 유형과 다르다(hMAR 1-68 및 hMAR X-29; Girod et al., 2007) .
트라스투주맙 및 인플릭시맙 중쇄 및 경쇄 cDNA를 EGFP를 대체하기 위해 발현 벡터 중에서 클로닝하였다. 각각의 IgG의 중쇄 발현 카세트와 경쇄 발현 카세트를 둘 다 운반하는 벡터는 하나의 플라스미드 벡터 상에서 함께 중쇄 발현 카세트와 경쇄 발현 카세트를 조합함으로써 제조하였다. 모든 중쇄 및 경쇄의 신호 펩타이드 서열은 동일하며, 경쇄의 불변 부분과 같다. 중쇄의 불변 부분은 몇몇 아미노산 위치에서 상이하다(DEL 대 EEM 변이체).
SRP9, SRP14, SRP54, SRPR알파, SRPR베타, SEC61A1 및 SEC61B cDNA의 PCR 증폭 프라이머 및 젠뱅크 등록번호를 본 명세서의 다른 곳에 열거한다. 분비 단백질을 암호화하는 PCR 산물을 벡터 내에 클로닝하여 EGFP 서열을 대체하였다. 다수 분비 단백질을 공동발현시켰을 때, 피기백 트랜스포존의 역위 말단 서열을 벡터 내로 통합하여 발현 카세트에 함께 묶었고, 얻어진 벡터를 피기백 트랜스포사제 발현 벡터로 공동형질감염시켜 이식유전자 통합을 개선시키고 항생물질 선택에 대한 필요를 제거하였다.
전형적인 PB 트랜스포사제 발현 벡터는 아프리카발톱개구리 β-글로빈 유전자의 5' 및 3' 미번역 말단 영역(UTR)에 의해 둘러싸인 PB 트랜스포사제 암호 서열을 함유하는 pCS2+U5V5PBU3이며 관련 실험에서 사용하였다. 이 플라스미드를 다음과 같이 구성하였다: pBSSK/SB10으로부터의 3' UTR 317 bp 단편을 pCS2+U5(인비트로젠/라이프 테크놀로지즈, 영국 페이즐리에 소재) 내로 삽입하여 pCS2+U5U3을 수득하였다. PB 트랜스포사제 암호 서열(2067 bp, 젠뱅크 등록 번호: EF587698)을 ATG:바이오신쎄틱(독일 메르츠하우젠에 소재)에 의해 합성하고 나서, 두 UTR 사이의 pCS2+U5U3 백본에 클로닝시켰다. PB 대조군 벡터는 비변형 pCS2+U5 플라스미드에 대응한다.
상이한 트랜스포존 벡터는 PB 235 bp 3' 및 310 bp 5' 역위 말단 반복부(ITR)를 도입함으로써 생성되었고, ATG:바이오신쎄틱(독일 메르츠하우젠에 소재)에 의해 pBluescript SK-플라스미드(pBSK ITR3'-ITR5') 내로 합성되었다. 이어서, pRc/RSV 플라스미드(인비트로젠/라이프 테크놀로지즈)로부터 SV40 프로모터의 제어 하에서 네오마이신 내성 유전자(네오(Neo)(등록상표))를 두 ITR 사이에 삽입하였다. 이 연구에서 사용되는 퓨로마이신 내성 및 GFP 유전자인 MAR 1-68 및 MAR X-29 구성요소는 앞서 기재한 바와 같았다(Girod et al. 2007; Grandjean et al. 2011; Hart and Laemmli 1998). 면역글로불린 발현 벡터 및 SRP9, SRP14, SRP54, SRPR알파, SRPRbeta, SEC61A1 및 SEC61B 암호 서열은 본 명세서에 기재된다. 암호 서열 상류의 인간 CMV 인핸서 및 인간 GAPDH 프로모터 다음에 SV40 폴리아데닐화 신호, 인간 가스트린 종결자 및 SV40 인핸서로 구성되는 진핵 발현 카세트를 이용하여 분비 단백질을 발현시켰다. 발현 카세트 및/또는 MAR 구성요소를 표준 클로닝 방법을 이용하여 ITR 서열 사이에 또는 박테리아 벡터 백본에 삽입하였다.
적절한 3' 및 5' ITR뿐만 아니라 트랜스포사제를 포함하는 피기백 트랜스포존 시스템은, 예를 들어 시스템 바이오사이언스(SYSTEM BIOSCIENCE)로부터 입수가능하다.
상대적 정량적 PCR 분석을 위해, 총 RNA를 1 x 105개 세포로부터 추출하고, 제조업자의 설명서에 따라 패스트레인 셀 cDNA 키트(FastLane Cell cDNA Kit)(퀴아젠(Qiagen))를 이용하여 cDNA로 역전사시켰다. SRP14 및 GAPDH의 발현을 보충하는 표 S1에 열거한 프라이머를 이용하는 로터 진 큐(Rotor Gene Q)(퀴아젠) 및 라이트사이클러(LightCycler)(등록상표)480 SYBR 그린 I 마스터(로슈(Roche))를 이용하여 qPCR에 의해 정량화하였다. SRP14의 전령 RNA 수준을 로터-진 Q 시리즈 소프트웨어(퀴아젠)를 이용하여 GAPDH에 대해 정규화시켰다.
CHO 세포주의 세포 배양물, 안정한 형질감염 및 서브클로닝
현탁액 중국 햄스터 난소 세포(CHO-K1)를 습한 공기 중에서 37℃, 5% CO2에서 L-글루타민(호주 PAA) 및 HT 보충물(깁코, 인비트로젠 라이프 사이언스)로 보충한 SFM4CHO하이클론 무혈청 배지(써모사이언티픽)에서 유지하였다. CHO-K1 세포를 제조업자의 권고(네온 디바이스, 인비트로젠)에 따라 전기천공법에 의해 퓨로마이신 내성 유전자를 함유하는 트라스투주맙 또는 인플릭시맙 중쇄 및 경쇄 발현 벡터로 형질감염시켰다. 2일 후에, 세포를 10㎍/㎖의 퓨로마이신을 함유하는 배지에서 T75 플레이트에 옮기고 나서, 세포를 2주 동안 선택 하에 추가로 배양시켰다. 이어서, 트라스투주맙 및 인플릭시맙 IgG를 발현시키는 안정한 개개 세포 클론을 희석을 제한함으로써 생성하고 나서, 확장시키고 성장 성능 및 IgG 생성 수준에 대해 분석하였다. 가장 높은 IgG 수준을 발현시키는 트라스투주맙 및 인플릭시맙 IgG-생성 세포 클론을 추가 생화학적 실험을 위해 선택하였다. 이어서, 일부 이들 클론을 전기천공법에 의해 SRP14 발현 벡터 및 네오마이신 내성 유전자를 함유하는 플라스미드로 공동형질감염시켰다. 이어서, 세포를 상기 기재한 바와 같이 2주 동안 300㎍/㎖의 G418을 함유하는 배지에서 배양시켰다. 안정한 클론을 제한 희석에 의해 단리시키고 나서, SRP14 발현을 Q-PCR 분석에 의해 확인한 후에 생화학적 분석을 위해 배양을 확장시켰다.
배취 및 유가배양
트라스투주맙 및 인플릭시맙을 발현시키는 개개 클론의 성장 및 생성 성능을 5% CO2 습한 인큐베이터 내 37℃에서 7일 동안 50㎖ 미니생물반응기(스위스에 소재한 TPP) 내로 유가 배양에서 평가하였다. 세포 배양의 제3일, 제4일 및 제7일에, 세포 밀도 및 생존력을 구아바 이지사이트(Guava EasyCyte) 유세포 분석 시스템(밀리포어(Millipore))을 이용하여 결정하였다. 세포 배양 상청액 내 IgG 역가를 샌드위치 ELISA에 의해 측정하였다. 세포 밀도(Cv.㎖-1) 및 IgG 역가값(㎍.㎖-1)을 표시한 공정 시간 샘플링일에 플롯팅하였다. 클론을 발현시키는 트라스투주맙 및 인플릭시맙의 구체적 IgG 생산성을 제3일 내지 제7일(생성기)에 계산한 살아있는 세포의 전체수(integral number of viable cell: IVCD)에 대한 IgG 농도의 기울기로서 결정하고, 세포 및 일 당 pg(pcd)로서 표현하였다.
유가배양 생성 배양물에 대해, 세포를 25㎖의 SFM4CHO 하이클론 무혈청 배지 내 125㎖ 진탕 플라스크 내로 0.3x106개 세포/㎖에서 파종하였다. 배양물을 교반 하에 37℃ 및 5% CO2에서 유지하였다. 배양물을 상업적 하이클론 공급물(써모사이언티픽)에 기반하여 매일 공급하였다. 세포 밀도 및 IgG 생성을 매일 평가하였다.
단백질 발현 및 응집 분석
프로테아제 저해제 칵테일(로슈 인코포레이티드)의 존재에서 PBS 완충제 중의 1% 트리톤 X-100과 함께 세포를 투과시킴으로써 가용성 세포질 단백질을 추출하였다. 얼음 상에서 30분 인큐베이션 후에, 세포를 14,000 rpm에서 10분 동안 원심분리시켰다. 상청액을 "가용성 사이토졸 및 ER 단백질" 분획으로서 지칭하였다. 펠렛을 유레아 라엠믈리(Laemmli) 완충제(62.5mM 트리스, 2% SDS, 8M 유레아, 5% 글라이세롤, 브로모페놀 블루 염료) 중에서 초음파처리에 의해 용해시켜, 응집된 소포 불용성 단백질 분획을 수득하였다. 이어서, 가용성 및 불용성 분획을 2-머캅토에탄올을 함유하거나 함유하지 않는 라엠믈리 완충제 중에서 조정하였고, 8분 동안 95℃에서 비등시켰다. 환원 및 비환원 샘플을 도데실황산나트륨 폴리아크릴아마이드 유전자 전기영동(SDS-PAGE)에 의해 각각 10% 또는 4 내지 10% 구배 아크릴아마이드 겔 상에서 분리시켰다.
이어서, 단백질을 나이트로셀룰로스 막 상에 블롯팅하였다. TBS-트윈(20mM 트위스, 0.5M NaCl, 0.1% 트윈 20) 중에서 희석시킨 5% 우유 중에서 차단시킨 후에, 다음의 1차 항체를 사용하여 상이한 단백질에 대해 막을 분석하였다: 항-인간 IgG(H+L)-HRP 컨쥬게이트된 당나귀 항체(JK 이뮤노리서치(immunoresearch), #709 035 149, 1:5000), 항-인간 BiP 토끼 다클론성 항체(셀 시그널링(Cell signaling), BiP, C50B12, 1:2000), 항-인간 CHOP 마우스 단클론성 항체(Cell signaling, CHOP, L63F7, 1:500), 항-인간 GAPDH 염소 다클론성 항체. 4℃에서 밤새 인큐베이션한 후에, 각각의 블롯을 HRP 컨쥬게이트된 항-토끼 IgG 또는 항-마우스 IgG(Cell signaling, 1:20000)로 프로빙하였다. 각각의 항체에 의해 인식되는 구체적 단백질을 ECL 시약 및 ECL 필름(아머샴 바이오사이언스(Amersham Biosciences))에 대한 노출을 이용하여 검출하였다.
사이클로헥시마이드-기반 단백질 추적 실험
사이클로헥시마이드-기반 추척 실험을 높은(HP) 및 낮은(LP) IgG-생성자 CHO-K1 클론에 대해 수행하였다. 동일한 수의 세포를 100μM의 사이클로헥시마이드(시그마(Sigma))로 보충한 완전 배양 배지에서 6-웰 플레이트 내로 플레이팅하였다. 다양한 시점에, 세포를 채취하고 나서, PBS, 1% 트리톤 X-100 중에 용해시켰다. 이어서, Tx-가용성 및 불용성 분획을 4 내지 10% 아크릴아마이드 비-환원 SDS-PAGE 상에 재용해시키고 나서, 항-인간 IgG 항체로 면역블롯팅하였다.
차별적 세정제 분획 분석
막 단백질로부터의 사이토졸의 분획을 세포 펠렛의 차별적 세정제 추출에 의해 수행하였다. 세포를 1㎖ PBS 중에서 처음 세척하고 나서, Hp 및 LP 세포의 혈장막을 1%의 트리톤 X-100의 존재 하에 또는 없이 0.01% 디기토닌(시그마)을 함유하는 KHM 완충제(110mM KAc, 20mM HEPES, 2mM MgCl2, pH 7.2) 중에서 10분 동안 투과시켰다. 반투과된 세포를 KHM 완충제 중에서 1회 세척하고 나서, 트립신을 실온에서 10분 동안 50㎍/㎖로 첨가하여 가용성 단백질을 분해시켰다. 1mM PMSF 및 4mM AEBSF의 첨가에 의해 트립신 분해를 중단시켰다. 세포를 원심분리에 의해 수집하고 나서, 가용성 단백질을 부문 2.4에서 기재한 바와 같이 트리톤 X-100 및 프로테아제 저해제의 존재 하에 추출하였다. 2-머캅토에탄올을 함유하는 환원 라엠믈리 완충제를 펠렛 및 상청액 분획에 첨가하였고, 이후에 8% SDS-PAGE를 실시하였다. IgG 및 BiP 단백질을 검출하기 위해 면역블롯팅을 수행하였다.
단백질의 가교 및 웨스턴 블롯팅 분석
인플릭시맙 LP 세포를 PBS 중에서 1회 세척하고 나서, 1mM의 디티오비스(숙신이미딜 프로피오네이트)(DSP) 가교링커(써모사이언티픽)와 함께 또는 없이 30분 동안 얼음 상에서 인큐베이션시켰다. 가교-연결을 10분 동안 50mM의 트리스-HCl(pH 7.4)의 첨가에 의해 퀀칭시킨 후에, 1% 트리톤 X-100 함유 PBS 완충제 중에서 단백질 추출하였다. 마이크로퓨지(microfuge) 내 14,000 rpm에서 10분 원심분리시킨 후에, 트리톤 X-100 불용성 분획 또는 전체 단백질 추출물을 환원 조건 하에 SDS-PAGE에 의해 분석하고 나서, 면역블롯팅하고, 항-BiP 및 항-LC 항체로 프로빙하였다. 동일한 양의 Tx-불용성 분획 단백질을 병행해서 분석하였다.
본 발명의 방법 및 조성물은 다양한 실시형태로 포함될 수 있고, 이중 소수많이 본 명세서에 개시되어 있다는 것을 인식할 것이다. 다른 실시형태가 존재하고 본 발명의 정신으로부터 벗어나지 않는다는 것이 당업자에게 명백할 것이다. 따라서, 기재된 실시형태는 예시적인 것이며, 제한으로서 해석되어서는 안 된다.
(표 A)
(표 B)
(표 C)
(표 D)
SEQUENCE LISTING
<110> SELEXIS S.A.
<120> ENHANCED TRANSGENE EXPRESSION AND PROCESSING
<130> WO/2014/118619
<140> PCT/IB2014/000100
<141> 2014-01-02
<150> US 61/759,802
<151> 2013-02-01
<150> US 61/800,244
<151> 2013-03-15
<150> US 61/806,634
<151> 2013-03-29
<160> 116
<170> PatentIn version 2.0
<210> 1
<211> 3616
<212> DNA
<213> Homo sapiens
<220>
<221> MISC_BINDING
<222> (1)..(320)
<223> MAR 1_68 OF CHROMOSOME 1
<400> 1
gactctagat tataccaacc tcataaaata agagcatata taaaagcaaa tgctcttatc 60
ttgcagatcc ctgaactgag gaggcaagat cagtttggca gttgaagcag ctggaatctg 120
caattcagag aatctaagaa aagacaaccc tgaagagaga gacccagaaa cctagcagga 180
gtttctccaa acattcaagg ctgagggata aatgttacat gcacagggtg agcctccaga 240
ggcttgtcca ttagcaactg ctacagtttc attatctcag ggatcacaga ttgtgctacc 300
tattgcctac catctgaaaa cagttgcttc ctatatttca tccagtttaa tatttattta 360
aaccaagaag gttaatctgg caccagctat tccgttgtga gtggatgtga aagtaccaat 420
tccattctgt tttactatta actatccttt gccttaatat gtatcagtag gtggcttgtt 480
gctaggaaat attaaatgaa tggcatgttt cataggttgt gtttaaagtt gttttttgag 540
ttaaatcttt ctttaataat actttctgat gtcaaaaaca cttagaagtc atggtgttga 600
acatctatat agggttggat ctaaaatagc ttcttaacct ttcctaacca ctgtttttgt 660
ttgtttgttt ttaactaagc atccagtttg ggaaattctg aattagggga atcataaaag 720
gtttcatttt agctgggcca cataaggaaa gtaagatatc aaattgtaaa aatcgttaag 780
aacttctatc ccatctgaag tgtgggttag gtgcctcttc tctgtgctcc cttaacatcc 840
tattttatct gtatatatat atattcttcc aaatatccat gcatgggaaa aaaaatctga 900
tcataaaaat attttaggct gggagtggtg gctcacgcct gtaatcccag cactttggga 960
ggctgaggtg ggcggatcat gaggtcaaga gatcgagacc atcctgacca atatggtgaa 1020
accccatctc tactaaagat acaaaactat tagctggacg tggtggcacg tgcctgtagt 1080
cccagctact cgggaggctg aggcaggaga acggcttgaa cccaggaggt ggaggttgca 1140
gtgagctgag atcgcgccac tgcactccag cctgggcgac agagcgagac tctgtctcaa 1200
aaaaaaaata tatatatata tatatataca catatatata taaaatatat atatatacac 1260
acatatatat ataaaatata tatatataca cacatatata taaaatatat atatatacac 1320
acatatatat aaaatatata tatacacaca tatatataaa atatatatat acacacatat 1380
atataaaata tatatataca cacatatata taaaatatat atatacacac atatatataa 1440
aatatatata tacacacata tatataaaat atatatatac acacatatat ataaaatata 1500
tatatacaca catatatata aaatatatat atacacacat atatataaaa tatatatata 1560
cacacatata tataaaatat atatatacac acatatataa aatatatata tacacacata 1620
tataaaatat atatatacac atatatataa aatatatata tacacatata tataaaatat 1680
atatacacac atatatataa aatatatata tacacacata tatataaaat atatatatac 1740
acatatatat aaaatatata tatacacata tatataaaat atatatatat acacatatat 1800
ataaaatata tatacacaca tatatataaa gtatatatat acacacatat atataaaata 1860
tatatataca catatatata aaatatatat atacacatat atataaaata tatatataca 1920
catatatata aaaatatata tatatatttt ttaaaatatt ccaattgtct cactttgtgg 1980
atgagaaaaa gaagtagtta gaggtcaagt aacttggcct acatcttttc tcaagattgt 2040
aaactcctag tgagcaataa ccacatcttc attttctttg tataaaacaa gaaagtttag 2100
catgaaaaag gtactcaatt acaaatgtgt tggattgaat tgaagaccct tggaagggga 2160
ttttgtacct gaggatctct ttcttttggc catattgttc aatggacaaa atttagcctt 2220
cgaaggcagg ccgatttgag gttaatacta cctttaccac ttgatagcta tgtgaccttg 2280
gccatgtggt ttcaacagtc tgaacctcat tttctctgtg tatgtgtggt cctccttaca 2340
agtttgtgaa aaatgtgaag tccttagcca tgatagccca atataacagg ctaaatgata 2400
ataggtttat gttcttttcc tttatattct cagataagca ctgtccaagt ttgaggtgtt 2460
ttgaggtctc gcctgatttg gattgtttga gtttatgcta ttctttgaat tctttgagct 2520
gttctgaagc agtgtatcat gaacaaaaac atccccagtt cagtccaaac ccctggttac 2580
atatcattct tatgccatgt tataaccagt ttgagagtgt tccctctgtt attgcattta 2640
agtttcagcc tcacacagaa attcagcagc caatttctaa gccctaagca taaaatctgg 2700
ggtggggggg ggggatggcc tgaagagcag cattatgaat agcaccatta taattaatga 2760
tctctcagga agatttacaa tcacaggtag cagataaaac aaatagtact gcttctgcac 2820
ttcccctcct tttattcgct atgaaatttt atgggaaatc agtccagtga aaaatgtaag 2880
ctcttaatct ttcccagaaa tcctacctca tttgatgaat actttgaggg aatgaattag 2940
agcatttttt tcttttatag tctacttcgc atttacgaag tgaggacggt agcttaggct 3000
gcctggccaa ctgatgagaa ggtcagaggc atttttagag acctctgttg tctttcattc 3060
atgttcattt tccacaaggc aagtaatttc caacaaatca gtgtcttcat tagtaataag 3120
attattaaca acaataatag tcatagtaac tattcagtga gagtccatta tatatcaggc 3180
attctacaag gtactttata tacatctgag taaacctcac acaattctac agggaggtat 3240
ttctatcccc atttaacaaa taaggaaacg aagtccaagt aaattaactt gcccaaggtc 3300
acacagatag tacctggcag aacaggaatt taaacctaaa tttgtccaac tccaaaagca 3360
gccttctatt tgttataaat gctgcctctc attatcacat attttattat taacaacaac 3420
aaacatacca attagcttaa gatacaatac aaccagataa tcatgatgac aacagtaatt 3480
gttatactat tataataaaa tagatgtttt gtatgttact ataatcttga atttgaatag 3540
aaatttgcat ttctgaaagc atgttcctgt catctaatat gattctgtat ctattaaaat 3600
agtactacat ctagag 3616
<210> 2
<211> 4624
<212> DNA
<213> Homo sapiens
<220>
<221> MISC_BINDING
<222> (1)..(4624)
<223> MAR 1_6 OF CHROMOSOME 1
<400> 2
ggatcttaaa tctattttat ttatttattt ttcatgtggc caataccctc cacccccttc 60
ttctgtctct ttcaacttat tgtggttacc ttgaggctac ctgagacagt aggcttgggt 120
ggggaagtat gcattctaag tgtaaagttt gatgagcttt gacaaatgtc aacccatgta 180
ccagaacatt ttcatcaccc ataaaatctc ccttgtgtca cttgccagtc agtgtctatt 240
ctagtatcca actcctggct ccaagaaacc attgaactgt tttctgtcac tataaattag 300
atttgtcttt tctagagttt catgtaaatg gaatcataca ctaagtactc tttgtgcctg 360
gcttctgctc agcataatgt ttttgagaat cattcatgct gctgcatgtt ttcagtagtt 420
cattttttta aataggtgaa ttgtaactca ttctgtgaat ataccatatt ctgtcttcca 480
tttatctgtt agtggatctt taggtcgttt ctagttttgg gctattgcaa ataaagctgc 540
tgtaaatatt aatgcacaag ttttccatgt tcatatgttt catttcactt aggaaaatac 600
ctaagagagg aattgcacat attaaaaaaa ttttaaaaac tactaagctg ttctccaaaa 660
tggttgtaca atttttattc ccaagagcaa tatgagtgtt taattgctcc acattctcac 720
caacacttgg tgcttgttag ttttattttc attgttttca ttgttatgtc tgtgaggcag 780
cattgatgtg catgtctctg agtgtcatct tagcggtgat gctgagcatc agttcacgtc 840
cttataggcc gtttgtatat ctgctttgtg aaatgtctgt tcaaatcttt tgcctatttt 900
aaattgagtt gtgttcgtct tcttaggatt aagtaatgag ttaaaaatat ttctgataca 960
aatctttcat tatatatttc taatgctttc tcatctatag tttattttct catattcttt 1020
aactgtatct tttgaagagc aaattttact tttgattatg cccaatttat caagttttta 1080
tatggctctt ttgattatgc ccataatcac attagacttt gcctaaccca agtttgcaga 1140
gattttttct tttatgcttt tatctagaaa ttttgtagtt ttaggtttta aaaaagttta 1200
atttatttat ttgagacagg gtattgctct ttacatatac tggagtgcag tgatgcaatc 1260
atggctcact gcagcctcaa cctcttgggc tcaagcggtt ctcccatctc agagtcctga 1320
gtagctggcc aggtgcatgc cagcttcaat gtgtttttca tttgcatttc cctgataatt 1380
attgacgttg agcatttttt tcatatatca gttagctatt tgtacgtctt cttttgagaa 1440
acatctattc gggtcttttg cccattttaa agtcagatgg tttgtttgtc agctattgag 1500
ttgtttgagt tccttgtata ttctggatat taccatcttg tcagatgcac agtttgcaaa 1560
tttttttttt ctattttgta ggttgtctct ttctctgttg tttcctccgg tatgcagaag 1620
ttttttagtg tgatgtaatt tcatttgtct gtttttgctt ttgttgcctg tactttctta 1680
ttcttatcca aaaaatcttt atctagatca atgtcacgaa gagtttctcc tctgttttct 1740
tcgagtagtt ttttataatt ttgggtatac atttaagtct ttaatctatt tggaattgat 1800
ttttgcatat ggtgagagat cagagtctaa tttcatactt ttggatgtgg aaagctagtt 1860
ttttcagcac catttattga agagactgtc tcttctccaa tgtgtgttct ttgtgccttc 1920
gtcaaaaatc agttggctgt gcgtggattt atttctgtgt tctctatttt gttccattgg 1980
tctagtttta gccttaaatt taggtctgca attttttttt ttttgtatat ggtgtgaagt 2040
aagagtcaaa gttcattatt tttcatatgg atatgtaatt actccagtac catcatttag 2100
tttgaatgga ctgtcctttc tccatggaat tacatgggca tcttttgtct gaaaccaatt 2160
atgtatgttt acgtatgtgt atgtttatgc atatgttata ggtttaatat atattaatat 2220
atataatata taatatataa atattaatat gtattatata atatatatta atatattata 2280
ttatattact atataaataa tattaatata ttatattaaa atattaataa atatatcata 2340
ttaaatatta tattaattaa atattaataa atatattata ttaatatatt tatatattaa 2400
acctataaca tatgcatata cttatttata tataacatgc atgtacttat ttatatatac 2460
aatatatatt tatatattat ataatatatt atatgtattt atatattata tatcatatat 2520
tatatgtatt tatatattat atatcatata atatatatat ttatattata tatattatat 2580
gatatataat attatataat gtattaatat atattaaacc tatatttata attctggact 2640
cactattttg tttcattggt gtctgtgtgt atctaaccct atgccaataa tgtactatct 2700
taattaccat agctttatag taagctttga aatcagatag tgtatttttt atcattgttt 2760
tttaaaataa tagtttatct ttttatttga atttgtaatc agctagtcag tttctgcaaa 2820
aagcttactg ggattttgct tggaattatg ttacatctgt agcatgtact atccaatatt 2880
ctagccttta tccacatgtg gctattaagg tttaaattaa ttaaattaaa atttaattaa 2940
ttaaaattaa aacttaataa ttggttcctc attcacacta ccatatgtca agtgttcaat 3000
agccacatat ggtcaatgtc ttggaaaagt caatacagta catttccatt attgcagtaa 3060
gttctgtcaa acagcactat cgtagaccga ttaggagaga actgacttaa cagtattgga 3120
tgctccagtc aatgaacatc tttttttttt tcatttattt cagtagtctc tgcagtatat 3180
tatagatttc agtttacata ttttgcatat attttattaa atgtataacg gtagaagtac 3240
tattattgga tgatgtgttc tatagatgta ttttaggtca agtttgttga tagtgttgtt 3300
taaatctcgt atacctcttg atttttttat ttacttgttc tttgaattac tgagacagga 3360
atgttatatc cttaactata tttgtgaatt tattcacttc ttccttcagt tctgttaact 3420
tttgcttagg tgctttttaa aaatgaaact ttcaatctct gccttttaat tgtagcattt 3480
agaccattta cattcaatgt aattatcaat atcagtttat ttaagtctga agttgtgcaa 3540
tttttcctct acctatatta taaatctttc tatatacaaa acacatgcta tgttttctgc 3600
atatgtttta aatgacaccc ggaaagcatt gacactattt ttgctttagg ttatctttca 3660
aagatgttaa aaatgagaaa gaaatattct gcatttatcc atacacttat tatttgcaaa 3720
ggttttttta aatacctttg tgtagatttc agttaccaac ttgtatttcc ttcagcttga 3780
agaacttaca atttcttgta ggacaggtct ctgacaacaa attatctcag cttttctttg 3840
tctaaaaaag ttattgcctt tatttttaaa atatattttc actggatatt gaattttagg 3900
tgataatctt tttttttttg ttagcacttt aaatatgtct tctaatgtcc tcttgctttc 3960
atagtttctg atgagaagtc tactgttatt agtatctctt tgtgtgtgtc tctctttttt 4020
ccctctctgc tattatggct attttttttt tttttttttt ttttggtcac tggtgtcagc 4080
aatttaatta tggtgtgcct tggtatgttt tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 4140
tgtgtgtgtg tagctgatgt tctttgagct ttagaatctg tgagtttgta gttttcatca 4200
attatttttt cttttcattc cttttattta ctcatgttcg tgttttattt tatattttta 4260
agaattttgt gcgtatttgt aataactgtt taaatgtcat ttgtgaattc cattgcttct 4320
aggtaggatt ctattgacag atattttttc cctgacgaga ggtcatactt tccttattct 4380
tcatgtatct agtggttttt ggttgaatac tggatatttt gaattttatg ggagtgctga 4440
attctacaat attccttaaa aatgtgttgg attttgtttt agcagatagc tatcttactt 4500
gaagatcaat ttcatatttt ttgatgttca ttttttcatt tattaaagaa taggtccatg 4560
gtagagttta ctgatatcaa cctttctggt gtctctaata aatgcaacat attcaataag 4620
atcc 4624
<210> 3
<211> 3354
<212> DNA
<213> Homo sapiens
<220>
<221> MISC_BINDING
<222> (1)..(3354)
<223> MAR X_S29 OF CHROMOSOME X
<400> 3
gatcccttta taaaaccaca atataatgga gtgctataat ttcaaacagt gtttggtctg 60
ctggcagagt ggtcattcta acagcagtca cagtagagta gaaataagac tgcagtatat 120
ctaaggcaaa aagctgaggt ttcaggagct tgaaggtaaa gaggaagaaa gaaatgggaa 180
tgggaattgg aaagacaaat atcgttaaga gaaaattgct tttaggagag gggaaagaat 240
ctatgtgtac ttaagactat ggaatcaatc ccatttaagc tgggaaacta gtttcatata 300
taactaataa attttattta cagaatatct atttacctga tctaggcttc aagccaaagg 360
gactgtgtga aaaaccatca gttctgtcat attcctaaaa aaaaattaaa aagttaaaaa 420
taaataaata ataaaacttc ttttctttca aaataatcaa ggtgcttatt cacatccatt 480
ccaatttggg gaaatactta ttttcctatg attagcgaag agaaaagtaa cttgcatttc 540
aattcaagtt gatacatgtc acttttaaga ggtcaactaa tatttgctag ttgagctaac 600
catataggct ttaaatactt tcatagtaga aagaaaatga aaatcattag tgaactgtat 660
aaaatagatc atactttttg aaagaatcag actgaagttt ccgaaaaaaa gaagtaagct 720
tcaatgaaaa ggtaagtgaa tttagcattt actcagcatc tactatggac ttaacaccta 780
acagtagata atctgaaggc aaacatattt gtatagggac tgcagaatga tagatgataa 840
atatcatctc ttctatttga atgaatattt tttcaaatct ttcacacaca gtggtttgct 900
atggaaagat ttgtagtaca ttaaacaaat ctgaagatgg agttagaaag cttaggctat 960
gttttgagca caacatataa tttctctgtg attgtttctt catctttcaa atgaggttac 1020
tgtgaagatt aaatgagata actaaatgat gataaaataa tgtaatctta gcagcacctt 1080
atttaatctg tgcaacaact ctgtgaagtg agtagggctc agcttcagtc acttctctgc 1140
catttattaa ctaagatagt ttggaaagtt acccatctct tcagctgtaa aatgatgagg 1200
atcataccta ttttatgggg ctgcttttag gtacaaatat acaggcaagc actttgttaa 1260
tactaaagca ttacaccaat tagttttact cttttccatt cacacatgaa attaatgtaa 1320
tcagaattct gtagattacc taaatcttct gttaacacgt gatatgcagt tcaggttaaa 1380
tgtcagttga gttaccaaag cacatacata ctcaccaccc tatccaaatc tacaagcctc 1440
ccagtttgtc ttcactattt tggttaaatt aatatgaatt cctagatgaa aatttcactg 1500
atccaaatga aataaaaaat atattacaaa actcacacct gtaatctcaa cattttggga 1560
ggccaaggca ggtagatcac ttgaggccag gagttcaaga ccagcctgat caacatggtg 1620
aaaccctgtc tctactaaaa atacaaaaat tagccaggtg tggtggcatg tgcctgtagt 1680
cctacctact cgggaggctg aggcacaaga atcgcttgaa tgtgggaggt ggaggttgca 1740
gtgacctgag atcgtgccac tgcactccag cctaggcaac agagtgagat catgtgtcat 1800
atatatatat atatatatat atatatatat atatatatac acacacacac acatatatat 1860
atacacatat atatacgtat atatatatat gtatatatat acatatatat acatatatat 1920
atatacgtat atatatacgt atatatatat caatgtaaat tatttgggaa atttggtatg 1980
aatagtcttc cctgtgaaca cagatcataa aatcatatat caagcagaca aataagtagt 2040
agtcacttat atgcttatac ttgtaactta aagtaaaaga attacaaaag catatgacaa 2100
agactaattt taagatatcc taatttaaat tgttttctaa aagtgtgtat accattttac 2160
ctatcatatg aataatttag aaacatgttt ataaaattaa tgtccaaatc cattcaaaag 2220
ttttgtaatg cagatcaccc acaacaacaa agaatcctag cctattaaaa aagcaacacc 2280
acctacatat aatgaaatat tagcagcatc tatgtaacca aagttacaca gtgaatttgg 2340
gccatccaac actttgagca aagtgttgaa ttcatcaaat gaatgtgtaa tcatttactt 2400
actaatgcca atacacttta aggtaatctt aagtagaaga gatagagttt agaatttttt 2460
aaatttatct cttgttgtaa agcaatagac ttgaataaat aaattagaag aatcagtcat 2520
tcaagccacc agagtatttg atcgagattt cacaaactct aactttctga tacccattct 2580
cccaaaaacg tgtaacctcc tgtcgatagg aacaacccac tgcagggatg tttctcgtgg 2640
aaaaaggaaa tttcttttgc attggtttca gacctaactg gttacaagaa aaaccaaagg 2700
ccattgcaca atgctgaagt acttttttca aatttaaaat ttgaaagttg ttcttaaaat 2760
ctatcattta ttttaaaata cggatgaatg agaaagcata gatttgataa agtgaattct 2820
tttctgcaat ctacagacac ttccaaaaat cactacagac actacagaca ctacagaaaa 2880
tcataaataa acaagtgcta gtatcaatat ttttaccaaa aaatggcatt cttagaattt 2940
tttataggct agaaggtttg tacaaactaa tctgccacgg attttaaaat atgagtgaat 3000
aaattatatt gcaaaaaaaa tcaggttaca gagaactggc aaggaagact cttatgtaaa 3060
acacagaaaa catacaaaac gtatttttaa gacaaataaa aacagaactt gtacctcaga 3120
tgatactgga gattgtgttg acatattagc attatcactg tcttgctaaa acataaaaat 3180
aaaaagatgg aagatgaaat tacaatacaa atgatgattt aaacatataa aaggaaaata 3240
aaaattgttc tgaccaacta ctaaaggaag acctactaaa gatatgccat ccagcacatt 3300
gccactctac atgtggtctg taaaccagca gcatagggat cctctagcta gagt 3354
<210> 4
<211> 5463
<212> DNA
<213> Mus musculus
<220>
<221> MISC_FEATURE
<223> S4_1-703_2328-5457 CONSTRUCT WITH FULL AVAI SITES
<400> 4
ctcgaggtct caagataaga atgactgctg taactcaaat ccaccaaagc tatttgtgtt 60
agaatgcttt cctttggtaa taacataata ccacagagtg agtgaatgta tcaagcaaag 120
tactcactca taatctctcc acccaaatga ctttgtcttc taaaattaaa cccttcccag 180
aggcctctcc ccttaatacc atattgggct cttcacactt cttccaacat cgccttccat 240
cctggccctt ccaacctccc ttctgtttgt gctaggaaca gctcaaggcc tcctatctac 300
cacagagtta catggcttgc cccttgccaa ccccccagta ccacacagtg agtgcaaaat 360
ctcaccacat tcagaaccca gtcactattc aaatcatatt ttaacctttg cagtactgac 420
tacttttgat tcatctaaac attactgaac tttattctag aaaacattta agaaatttgt 480
agttaggttc atcctttgag accttacatt taatttcttt ctatgtaaac ggaaagcatt 540
gttcagtccc acgctcatta tggcaaccca cttccaagta cttcgtttac tacgtgggct 600
ggaatcatac agttttctgt tgtgcttgtg ggagcagatc cccctaacct ctgctgattt 660
ttctcaccac ttatcataca tttattacat gcatgcactg ctgtgtgagt ttctaaatac 720
ttgggtagca attctctact attactttaa ttttcctact tgtctgcaaa tacgaaaagt 780
agcttgaaag aacttcagat ctttgttgtt atctgttgca aacactccat ttttctgttg 840
tagcaaaaaa aaaaaaaaag acatccatag ttgtcaatga gaatgcaaga tacatacatt 900
ctgcacctgt gtgctaacat aagtggctgc cctgtgactc agagattgct tgtccttctc 960
ctaagcctat ccttttttgt tactttggat acttttgttc aatgaatcca gaaaaagtgt 1020
ttttcagatt caccatgtga ccctcattta aaacctgtaa tccccctatg gttaagttcc 1080
tgcttttgtt tctgttttct ttctttcagt aaaaggaatt gaacccagtc cttccactta 1140
ctatctgagc atatggctct tttagattat gatgttggtg gtgttcattg gtctcaccaa 1200
aatgctaaag aagccttcat cttctacttg tgggtagtct ttacattcat tactgcaagt 1260
ttagtttatg tggtagtacc agatcctttg cttcttttga cttcatgcct acctaacagc 1320
agctctttcc tttagttaag cttatgaaat agtgtttctc tcatgtttcc tctatattct 1380
ctcttttgcc ttcctgtttc ttcctgttga ttccatccca ttggagtgaa atcttatgat 1440
cttttggcat caacaaagtg atctgcatcc aaataattcc acatctcatt ccatgttgac 1500
tgtggatcta tatatatata tatgtatata tgtatatatg tatatatgta tatatgtata 1560
tatgtatata tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg 1620
tatatatgta tatatgtata tatgtatata tgtatatatg tatatatgta tatatgtata 1680
tatgtatata tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg 1740
tatatatgta tatatgtata tatgtatata tgtatatatg tatatacgta tatatgcata 1800
tacgtatata tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg 1860
tatatatgta tatatgtatg tatgtatgta tgtatgtata tatgtatata tgtatgtatg 1920
tatgtatgta tgtatgtatg tatatatgta tatatatatg tatgtatgta tgtatgtatg 1980
tatgtatatg tgtatatgtg tatatgtgta tatgtgtata tgtgtatata tgtatatatg 2040
tatatatgta tatatgtata tgtgtatatg tgtatatgtg tatatatgta tatatgtata 2100
tatgtatata tgtatatata taacatagta ttaaattata tatacatata taagtgaaat 2160
gtcacaatct tctagaactt gctctgtatg tccacttaac atggtagagt gagctatgtc 2220
agcattttct atttcctgtg aatcattctg tgtgttgcca agaagaaata tgatatattc 2280
tgaggttatg aaatgatatt ttggtcatca tgtttctcat cctattttca tattacctaa 2340
atacttttgc ttttaaaatt attattatta ataataatat aattatttat acaataatat 2400
ttaaataata tatttattta atataattat tatatttcac ataaaagcaa tagttccagt 2460
gttacaaatt gtaggcaact gggctgttct gattatctaa gttgggccca ggatatgtgc 2520
tgaatagtta aagcacatgc ccagcatgta tgagggtaaa aggatgggtg gatgtagtga 2580
cccatttgta atttaagcct tagcaggcag aggtgtgacc catagtgcaa agtacatagt 2640
cattataagg tcatctatat cacaatctct ggattagatt gattgaacct gctcagtgac 2700
caatgtgtta gcaatataca ggaggatgat aacatcaacg tcagaagaca cattgaaggg 2760
cttacaaata gtgcccattt actttaatac agaaaaattc aatgtaccct ctaggcaatt 2820
tcaactttta gtctcttggt aggatagtct acatttagaa tggctaattc ataaattaga 2880
aagcttcttc accccctact tttctggtta tttctctatg aatgtggtag gcatgagtta 2940
gtacacatgt ttccatgtac atgtgtttct atgtgtctgc atgcatatgg tagaatgtac 3000
tcatattcta tgtacagtta gaacaatatt tatattgtca aagaaatcaa aaggagtatt 3060
ataagcttca gaaataagga taagtttgaa atattcattg ttttattttt tacagtattt 3120
tttcctttga gaattctatg taaagtactt tgaacatatt tgccttcaac tcctccctca 3180
ctttcaccct ctcttcattc ctccctttcc tttccactca aagttgagat tcctttattt 3240
atttatttat ccttcaaata tcactggtac tatccacatg atctcaggat tgaggtctgc 3300
tctgacgtgt catcctgctt tcatgcaatg gccttatagg tggaacaaca ttatgaacta 3360
accagtaccc cggagctctt gactctagct gcatatatat caaaagatgg cctagtcggc 3420
catcactgga aagagaggct cattggactt gcaaacttta tatgccccag tacaggggaa 3480
caccagggcc aaaaaggggg agtgggtggg caggggagtg ggggtgggtg gatatggggg 3540
acttttggta tagcattgga aatgtaaatg agttaaatac ctaataaaaa atggaaaaaa 3600
aaagtttcta atgtgtgttt ctagaaactt cctctcttaa agcaacaaca tgtccatgag 3660
caatatagaa ttgaagatca ccatcaaatc ctctttattc ctcattgttt ccatcatgta 3720
ctaccagacc tctttaaagt gtagtacagt gtgttaggaa atgagcagat tatcctgggt 3780
atgtgctaaa ttagctactg agtcaaaata cattttttgc tgaacattaa gtgtttggtc 3840
atttctgggc aaaagaaaga aagaaagaaa gaaaagaaag aaagaaagga aggaaggaag 3900
gaaggaagga aggaaggaag gaaagaagga aggaaagaaa aaatggatgt aaattgttct 3960
gacagcatct gtctgagtca ggcagtggaa tgaaggagga atcctagaga atgcacagga 4020
aagcagccca aggagagtgt gggctgaaag gcatcatgtt agaaacatgc actcgatgac 4080
agaaccttga gaaaaaggaa ctcaagcaaa agcacttatt taaaattgta aaacgcactt 4140
tattcatagc catgggggat gtcaatattc caagcataag aatgatcagt ttccaatcac 4200
tgtgaacccc caaaacacaa agtgaaaacc cactacttta tttgatgaga tttggggttg 4260
ctctattaat ttataaaatc agagtaagac acgatataaa tgaaacgatt gtagttctaa 4320
agcagcggca cttccctgaa cagtgtcatt ttgacaagta actgctaaca tcttcaggtc 4380
acagcgactg aagaaaaagt agggaaagaa ggctggctgt gctgtttgac attttctttt 4440
cttatctggt gacatgaaga gaagctctgg gtccccctac tcttgttcat atatctgttg 4500
cttttatgct gcatcctgag gtttgaagaa atgcatttgg cactgagaaa agatgaggag 4560
agaatgcctt ggacatggtc ctaacatgct ttggtactga gaaaagagag cagaggagat 4620
gacatagaat aggagagata atttggccta ttttggcctt catctgagtg atagatttta 4680
cttaacaaat agaaacaaag ttttacttat aaacagaacc aatgacctgt gtcatctctg 4740
atatattgag ctttgaattc agtgaaatta tgaactaaat atatcactcc ataattttct 4800
aagagggcta tttgtatagt ttcagtgata gtgtgacaaa gtgtaatcta aatttctaaa 4860
aagtaaaata agtagataaa atagtaggta gaatagtata ataatagaat aagtataggt 4920
atggactaga ataaatagac aaaatagtag ataaaatgct aatgattttg ttgacagggt 4980
aatcatgaat atttttatta tttagctaaa gaaccaatgt tcatgtactc aagaagtgta 5040
ttgaggaact taggaaatta gtctgaacag gtgagagggt gcgccagaga acctgacagc 5100
ttctggaaca ggcggaagca cagaggcact gaggcagcac cctgtgtggg ccggggacag 5160
ccggccacct tccggaccgg aggacaggtg cccgcccggc tggggaggcg acctaagcca 5220
cagcagcagc ggtcgccatc ttggtccggg acccgccgaa cttaggaaat tagtctgaac 5280
aggtgagagg gtgcgccaga gaacctgaca gcttctggaa caggcagaag cacagaggcg 5340
ctgaggcagc accctgtgtg ggccggggac agccggccac cttccggacc ggaggacagg 5400
tgcccacccg gctggggagg cggcctaagc cacagcagca gcggtcgcca tcttggtccc 5460
ggg 5463
<210> 5
<211> 2957
<212> DNA
<213> Chicken Lysozyme
<400> 5
tctagaaaac aatatatttc caaatgaaaa aaaaatctga taaaaagttg actttaaaaa 60
agtatcaata aatgtatgca tttctcacta gccttaaact ctgcatgaag tgtttgatga 120
gcagatgaag acaacatcat ttctagtttc agaaataata acagcatcaa aaccgcagct 180
gtaactccac tgagctcacg ttaagttttg atgtgtgaat atctgacaga actgacataa 240
tgagcactgc aaggatatca gacaagtcaa aatgaagaca gacaaaagta ttttttaata 300
taaaaatggt ctttatttct tcaatacaag gtaaactact attgcagttt aagaccaaca 360
caaaagttgg acagcaaatt gcttaacagt ctcctaaagg ctgaaaaaaa ggaacccatg 420
aaagctaaaa gttatgcagt atttcaagta taacatctaa aaatgatgaa acgatcccta 480
aaggtagaga ttaactaagt acttctgctg aaaatgtatt aaaatccgca gttgctagga 540
taccatctta ccttgttgag aaatacaggt ctccggcaac gcaacattca gcagactctt 600
tggcctgctg gaatcaggaa actgcttact atatacacat ataaatcctt tggagttggg 660
cattctgaga gacatccatt tcctgacatt ttgcagtgca actctgcatt ccaactcaga 720
caagctccca tgctgtattt caaagccatt tcttgaatag tttacccaga catccttgtg 780
caaattggga atgaggaaat gcaatggtac aggaagacaa tacagcctta tgtttagaaa 840
gtcagcagcg ctggtaatct tcataaaaat gtaactgttt tccaaatagg aatgtatttc 900
acttgtaaaa cacctggtcc tttttatatt actttttttt ttttttaagg acacctgcac 960
taatttgcaa tcacttgtat ttataaaagc acacgcactc ctcattttct tacatttgaa 1020
gatcagcaga atgtctcttt cataatgtaa taatcatatg cacagtttaa aatattttct 1080
attacaaaat acagtacaca agagggtgag gccaaagtct attacttgaa tatattccaa 1140
agtgtcagca ctgggggtgt aaaattacat tacatggtat gaataggcgg aattctttta 1200
caactgaaat gctcgatttc attgggatca aaggtaagta ctgtttacta tcttcaagag 1260
acttcaatca agtcggtgta tttccaaaga agcttaaaag attgaagcac agacacaggc 1320
cacaccagag cctacacctg ctgcaataag tggtgctata gaaaggattc aggaactaac 1380
aagtgcataa tttacaaata gagatgcttt atcatacttt gcccaacatg ggaaaaaaga 1440
catcccatga gaatatccaa ctgaggaact tctctgtttc atagtaactc atctactact 1500
gctaagatgg tttgaaaagt acccagcagg tgagatatgt tcgggaggtg gctgtgtggc 1560
agcgtgtccc aacacgacac aaagcacccc acccctatct gcaatgctca ctgcaaggca 1620
gtgccgtaaa cagctgcaac aggcatcact tctgcataaa tgctgtgact cgttagcatg 1680
ctgcaactgt gtttaaaacc tatgcactcc gttaccaaaa taatttaagt cccaaataaa 1740
tccatgcagc ttgcttccta tgccaacata ttttagaaag tattcattct tctttaagaa 1800
tatgcacgtg gatctacact tcctgggatc tgaagcgatt tatacctcag ttgcagaagc 1860
agtttagtgt cctggatctg ggaaggcagc agcaaacgtg cccgttttac atttgaaccc 1920
atgtgacaac ccgccttact gagcatcgct ctaggaaatt taaggctgta tccttacaac 1980
acaagaacca acgacagact gcatataaaa ttctataaat aaaaatagga gtgaagtctg 2040
tttgacctgt acacacagag catagagata aaaaaaaaag gaaatcagga attacgtatt 2100
tctataaatg ccatatattt ttactagaaa cacagatgac aagtatatac aacatgtaaa 2160
tccgaagtta tcaacatgtt aactaggaaa acatttacaa gcatttgggt atgcaactag 2220
atcatcaggt aaaaaatccc attagaaaaa tctaagcctc gccagtttca aaggaaaaaa 2280
accagagaac gctcactact tcaaaggaaa aaaaataaag catcaagctg gcctaaactt 2340
aataaggtat ctcatgtaac aacagctatc caagctttca agccacacta taaataaaaa 2400
cctcaagttc cgatcaacgt tttccataat gcaatcagaa ccaaaggcat tggcacagaa 2460
agcaaaaagg gaatgaaaga aaagggctgt acagtttcca aaaggttctt cttttgaaga 2520
aatgtttctg acctgtcaaa acatacagtc cagtagaaat tttactaaga aaaaagaaca 2580
ccttacttaa aaaaaaaaaa caacaaaaaa aacaggcaaa aaaacctctc ctgtcactga 2640
gctgccacca cccaaccacc acctgctgtg ggctttgtct cccaagacaa aggacacaca 2700
gccttatcca atattcaaca ttacttataa aaacgctgat cagaagaaat accaagtatt 2760
tcctcagaga ctgttatatc ctttcatcgg caacaagaga tgaaatacaa cagagtgaat 2820
atcaaagaag gcggcaggag ccaccgtggc accatcaccg ggcagtgcag tgcccaactg 2880
ccgttttctg agcacgcata ggaagccgtc agtcacatgt aataaaccaa aacctggtac 2940
agttatatta tggatcc 2957
<210> 6
<211> 3659
<212> DNA
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> 1_68R(NcoI+XbaI filled)
<400> 6
gtacccccaa aagaaagaga tcctcaggta caaaatcccc ttccaagggt cttcaattca 60
atccaacaca tttgtaattg agtacctttt tcatgctaaa ctttcttgtt ttatacaaag 120
aaaatgaaga tgtggttatt gctcactagg agtttacaat cttgagaaaa gatgtaggcc 180
aagttacttg acctctaact acttcttttt ctcatccaca aagtgagaca attggaatat 240
tttaaaaaat atatatatat atttttatat atatgtgtat atatatattt tatatatatg 300
tgtatatata tattttatat atatgtgtat atatatattt tatatatatg tgtgtatata 360
tatactttat atatatgtgt gtatatatat tttatatata tgtgtatata tatatatttt 420
atatatatgt gtatatatat attttatata tatgtgtata tatatatttt atatatatgt 480
gtgtatatat atattttata tatatgtgtg tatatatatt ttatatatat gtgtatatat 540
atattttata tatatgtgta tatatatatt ttatatatgt gtgtatatat atattttata 600
tatgtgtgta tatatatatt ttatatatat gtgtgtatat atatatttta tatatatgtg 660
tgtatatata tattttatat atatgtgtgt atatatatat tttatatata tgtgtgtata 720
tatatatttt atatatatgt gtgtatatat atattttata tatatgtgtg tatatatata 780
ttttatatat atgtgtgtat atatatattt tatatatatg tgtgtatata tatattttat 840
atatatgtgt gtatatatat attttatata tatgtgtgta tatatatata ttttatatat 900
atgtgtgtat atatatatat tttatatata tatgtgtgta tatatatata ttttatatat 960
atatgtgtat atatatatat atatatattt tttttttgag acagagtctc gctctgtcgc 1020
ccaggctgga gtgcagtggc gcgatctcag ctcactgcaa cctccacctc ctgggttcaa 1080
gccgttctcc tgcctcagcc tcccgagtag ctgggactac aggcacgtgc caccacgtcc 1140
agctaatagt tttgtatctt tagtagagat ggggtttcac catattggtc aggatggtct 1200
cgatctcttg acctcatgat ccgcccacct cagcctccca aagtgctggg attacaggcg 1260
tgagccacca ctcccagcct aaaatatttt tatgatcaga ttttttttcc catgcatgga 1320
tatttggaag aatatatata tatacagata aaataggatg ttaagggagc acagagaaga 1380
ggcacctaac ccacacttca gatgggatag aagttcttaa cgatttttac aatttgatat 1440
cttactttcc ttatgtggcc cagctaaaat gaaacctttt atgattcccc taattcagaa 1500
tttcccaaac tggatgctta gttaaaaaca aacaaacaaa aacagtggtt aggaaaggtt 1560
aagaagctat tttagatcca accctatata gatgttcaac accatgactt ctaagtgttt 1620
ttgacatcag aaagtattat taaagaaaga tttaactcaa aaaacaactt taaacacaac 1680
ctatgaaaca tgccattcat ttaatatttc ctagcaacaa gccacctact gatacatatt 1740
aaggcaaagg atagttaata gtaaaacaga atggaattgg tactttcaca tccactcaca 1800
acggaatagc tggtgccaga ttaaccttct tggtttaaat aaatattaaa ctggatgaaa 1860
tataggaagc aactgttttc agatggtagg caataggtag cacaatctgt gatccctgag 1920
ataatgaaac tgtagcagtt gctaatggac aagcctctgg aggctcaccc tgtgcatgta 1980
acatttatcc ctcagccttg aatgtttgga gaaactcctg ctaggtttct gggtctctct 2040
cttcagggtt gtcttttctt agattctctg aattgcagat tccagctgct tcaactgcca 2100
aactgatctt gcctcctcag ttcagggatc tgcaagataa gagcatttgc ttttatatat 2160
gctcttattt tatgaggttg gtataatcta gctagagtcg agatctttgg ccatattgtt 2220
caatggacaa aatttagcct tcgaaggcag gccgatttga ggttaatact acctttacca 2280
cttgatagct atgtgacctt ggccatgtgg tttcaacagt ctgaacctca ttttctctgt 2340
gtatgtgtgg tcctccttac aagtttgtga aaaatgtgaa gtccttagcc atgatagccc 2400
aatataacag gctaaatgat aataggttta tgttcttttc ctttatattc tcagataagc 2460
actgtccaag tttgaggtgt tttgaggtct cgcctgattt ggattgtttg agtttatgct 2520
attctttgaa ttctttgagc tgttctgaag cagtgtatca tgaacaaaaa catccccagt 2580
tcagtccaaa cccctggtta catatcattc ttatgccatg ttataaccag tttgagagtg 2640
ttccctctgt tattgcattt aagtttcagc ctcacacaga aattcagcag ccaatttcta 2700
agccctaagc ataaaatctg gggtgggggg gggggatggc ctgaagagca gcattatgaa 2760
tagcaccatt ataattaatg atctctcagg aagatttaca atcacaggta gcagataaaa 2820
caaatagtac tgcttctgca cttcccctcc ttttattcgc tatgaaattt tatgggaaat 2880
cagtccagtg aaaaatgtaa gctcttaatc tttcccagaa atcctacctc atttgatgaa 2940
tactttgagg gaatgaatta gagcattttt ttcttttata gtctacttcg catttacgaa 3000
gtgaggacgg tagcttaggc tgcctggcca actgatgaga aggtcagagg catttttaga 3060
gacctctgtt gtctttcatt catgttcatt ttccacaagg caagtaattt ccaacaaatc 3120
agtgtcttca ttagtaataa gattattaac aacaataata gtcatagtaa ctattcagtg 3180
agagtccatt atatatcagg cattctacaa ggtactttat atacatctga gtaaacctca 3240
cacaattcta cagggaggta tttctatccc catttaacaa ataaggaaac gaagtccaag 3300
taaattaact tgcccaaggt cacacagata gtacctggca gaacaggaat ttaaacctaa 3360
atttgtccaa ctccaaaagc agccttctat ttgttataaa tgctgcctct cattatcaca 3420
tattttatta ttaacaacaa caaacatacc aattagctta agatacaata caaccagata 3480
atcatgatga caacagtaat tgttatacta ttataataaa atagatgttt tgtatgttac 3540
tataatcttg aatttgaata gaaatttgca tttctgaaag catgttcctg tcatctaata 3600
tgattctgta tctattaaaa tagtactaca tctagcccgg gctcgacatt gattattga 3659
<210> 7
<211> 2751
<212> DNA
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> 1_68R2 (NcoI + XbaI filled)
<400> 7
gtacccccaa aagaaagaga tcctcaggta caaaatcccc ttccaagggt cttcaattca 60
atccaacaca tttgtaattg agtacctttt tcatgctaaa ctttcttgtt ttatacaaag 120
aaaatgaaga tgtggttatt gctcactagg agtttacaat cttgagaaaa gatgtaggcc 180
aagttacttg acctctaact acttcttttt ctcatccaca aagtgagaca attggaatat 240
tttaaaaaat atatatatat atttttatat atatgtgtat atatatattt tatatatatg 300
tgtatatata tattttatat atatgtgtat atatatattt tatatatatg tgtgtatata 360
tatactttat atatatgtgt gtatatatat tttatatata tgtgtatata tatatatttt 420
atatatatgt gtatatatat attttatata tatgtgtata tatatatttt atatatatgt 480
gtgtatatat atattttata tatatgtgtg tatatatatt ttatatatat gtgtatatat 540
atattttata tatatgtgta tatatatatt ttatatatgt gtgtatatat atattttata 600
tatgtgtgta tatatatatt ttatatatat gtgtgtatat atatatttta tatatatgtg 660
tgtatatata tattttatat atatgtgtgt atatatatat tttatatata tgtgtgtata 720
tatatatttt atatatatgt gtgtatatat atattttata tatatgtgtg tatatatata 780
ttttatatat atgtgtgtat atatatattt tatatatatg tgtgtatata tatattttat 840
atatatgtgt gtatatatat attttatata tatgtgtgta tatatatata ttttatatat 900
atgtgtgtat atatatatat tttatatata tatgtgtgta tatatatata ttttatatat 960
atatgtgtat atatatatat atatatattt tttttttgag acagagtctc gctctgtcgc 1020
ccaggctgga gtgcagtggc gcgatctcag ctcactgcaa cctccacctc ctgggttcaa 1080
gccgttctcc tgcctcagcc tcccgagtag ctgggactac aggcacgtgc caccacgtcc 1140
agctaatagt tttgtatctt tagtagagat ggggtttcac catattggtc aggatggtct 1200
cgatctcttg acctcatgat ccgcccacct cagcctccca aagtgctggg attacaggcg 1260
tgagccacca ctcccagcct aaaatatttt tatgatcttt ggccatattg ttcaatggac 1320
aaaatttagc cttcgaaggc aggccgattt gaggttaata ctacctttac cacttgatag 1380
ctatgtgacc ttggccatgt ggtttcaaca gtctgaacct cattttctct gtgtatgtgt 1440
ggtcctcctt acaagtttgt gaaaaatgtg aagtccttag ccatgatagc ccaatataac 1500
aggctaaatg ataataggtt tatgttcttt tcctttatat tctcagataa gcactgtcca 1560
agtttgaggt gttttgaggt ctcgcctgat ttggattgtt tgagtttatg ctattctttg 1620
aattctttga gctgttctga agcagtgtat catgaacaaa aacatcccca gttcagtcca 1680
aacccctggt tacatatcat tcttatgcca tgttataacc agtttgagag tgttccctct 1740
gttattgcat ttaagtttca gcctcacaca gaaattcagc agccaatttc taagccctaa 1800
gcataaaatc tggggtgggg gggggggatg gcctgaagag cagcattatg aatagcacca 1860
ttataattaa tgatctctca ggaagattta caatcacagg tagcagataa aacaaatagt 1920
actgcttctg cacttcccct ccttttattc gctatgaaat tttatgggaa atcagtccag 1980
tgaaaaatgt aagctcttaa tctttcccag aaatcctacc tcatttgatg aatactttga 2040
gggaatgaat tagagcattt ttttctttta tagtctactt cgcatttacg aagtgaggac 2100
ggtagcttag gctgcctggc caactgatga gaaggtcaga ggcattttta gagacctctg 2160
ttgtctttca ttcatgttca ttttccacaa ggcaagtaat ttccaacaaa tcagtgtctt 2220
cattagtaat aagattatta acaacaataa tagtcatagt aactattcag tgagagtcca 2280
ttatatatca ggcattctac aaggtacttt atatacatct gagtaaacct cacacaattc 2340
tacagggagg tatttctatc cccatttaac aaataaggaa acgaagtcca agtaaattaa 2400
cttgcccaag gtcacacaga tagtacctgg cagaacagga atttaaacct aaatttgtcc 2460
aactccaaaa gcagccttct atttgttata aatgctgcct ctcattatca catattttat 2520
tattaacaac aacaaacata ccaattagct taagatacaa tacaaccaga taatcatgat 2580
gacaacagta attgttatac tattataata aaatagatgt tttgtatgtt actataatct 2640
tgaatttgaa tagaaatttg catttctgaa agcatgttcc tgtcatctaa tatgattctg 2700
tatctattaa aatagtacta catctagccc gggctcgaca ttgattattg a 2751
<210> 8
<211> 2082
<212> DNA
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> 1_6R2(HindIII filled)
<400> 8
tcgacatgga attacatggg catcttttgt ctgaaaccaa ttatgtatgt ttacgtatgt 60
gtatgtttat gcatatgtta taggtttaat atatattaat atatataata tataatatat 120
aaatattaat atgtattata taatatatat taatatatta tattatatta ctatataaat 180
aatattaata tattatatta aaatattaat aaatatatca tattaaatat tatattaatt 240
aaatattaat aaatatatta tattaatata tttatatatt aaacctataa catatgcata 300
tacttattta tatataacat gcatgtactt atttatatat acaatatata tttatatatt 360
atataatata ttatatgtat ttatatatta tatatcatat attatatgta tttatatatt 420
atatatcata taatatatat atttatatta tatatattat atgatatata atattatata 480
atgtattaat atatattaaa cctatattta taattctgga ctcactattt tgtttcattg 540
gtgtctgtgt gtatctaacc ctatgccaat aatgtactat cttaattacc atagctttat 600
agtaagctag cttgatatcg aattcctgca gcccggggga tccactagat ttggccatat 660
tgttcaatgg acaaaattta gccttcgaag gcaggccgat ttgaggttaa tactaccttt 720
accacttgat agctatgtga ccttggccat gtggtttcaa cagtctgaac ctcattttct 780
ctgtgtatgt gtggtcctcc ttacaagttt gtgaaaaatg tgaagtcctt agccatgata 840
gcccaatata acaggctaaa tgataatagg tttatgttct tttcctttat attctcagat 900
aagcactgtc caagtttgag gtgttttgag gtctcgcctg atttggattg tttgagttta 960
tgctattctt tgaattcttt gagctgttct gaagcagtgt atcatgaaca aaaacatccc 1020
cagttcagtc caaacccctg gttacatatc attcttatgc catgttataa ccagtttgag 1080
agtgttccct ctgttattgc atttaagttt cagcctcaca cagaaattca gcagccaatt 1140
tctaagccct aagcataaaa tctggggtgg ggggggggga tggcctgaag agcagcatta 1200
tgaatagcac cattataatt aatgatctct caggaagatt tacaatcaca ggtagcagat 1260
aaaacaaata gtactgcttc tgcacttccc ctccttttat tcgctatgaa attttatggg 1320
aaatcagtcc agtgaaaaat gtaagctctt aatctttccc agaaatccta cctcatttga 1380
tgaatacttt gagggaatga attagagcat ttttttcttt tatagtctac ttcgcattta 1440
cgaagtgagg acggtagctt aggctgcctg gccaactgat gagaaggtca gaggcatttt 1500
tagagacctc tgttgtcttt cattcatgtt cattttccac aaggcaagta atttccaaca 1560
aatcagtgtc ttcattagta ataagattat taacaacaat aatagtcata gtaactattc 1620
agtgagagtc cattatatat caggcattct acaaggtact ttatatacat ctgagtaaac 1680
ctcacacaat tctacaggga ggtatttcta tccccattta acaaataagg aaacgaagtc 1740
caagtaaatt aacttgccca aggtcacaca gatagtacct ggcagaacag gaatttaaac 1800
ctaaatttgt ccaactccaa aagcagcctt ctatttgtta taaatgctgc ctctcattat 1860
cacatatttt attattaaca acaacaaaca taccaattag cttaagatac aatacaacca 1920
gataatcatg atgacaacag taattgttat actattataa taaaatagat gttttgtatg 1980
ttactataat cttgaatttg aatagaaatt tgcatttctg aaagcatgtt cctgtcatct 2040
aatatgattc tgtatctatt aaaatagtac tacatctagc cc 2082
<210> 9
<211> 3345
<212> DNA
<213> Homo sapiens
<220>
<221> X_S29(2*HindIII, SalI filled)
<222> (1)..(3345)
<220>
<221> misc_feature
<222> (1)..(3345)
<400> 9
gatcccttta taaaaccaca atataatgga gtgctataat ttcaaacagt gtttggtctg 60
ctggcagagt ggtcattcta acagcagtca cagtagagta gaaataagac tgcagtatat 120
ctaaggcaaa aagctgaggt ttcaggagct tgaaggtaaa gaggaagaaa gaaatgggaa 180
tgggaattgg aaagacaaat atcgttaaga gaaaattgct tttaggagag gggaaagaat 240
ctatgtgtac ttaagactat ggaatcaatc ccatttaagc tgggaaacta gtttcatata 300
taactaataa attttattta cagaatatct atttacctga tctaggcttc aagccaaagg 360
gactgtgtga aaaaccatca gttctgtcat attcctaaaa aaaaattaaa aagttaaaaa 420
taaataaata ataaaacttc ttttctttca aaataatcaa ggtgcttatt cacatccatt 480
ccaatttggg gaaatactta ttttcctatg attagcgaag agaaaagtaa cttgcatttc 540
aattcaagtt gatacatgtc acttttaaga ggtcaactaa tatttgctag ttgagctaac 600
catataggct ttaaatactt tcatagtaga aagaaaatga aaatcattag tgaactgtat 660
aaaatagatc atactttttg aaagaatcag actgaagttt ccgaaaaaaa gaagtaagct 720
agcttcaatg aaaaggtaag tgaatttagc atttactcag catctactat ggacttaaca 780
cctaacagta gataatctga aggcaaacat atttgtatag ggactgcaga atgatagatg 840
ataaatatca tctcttctat ttgaatgaat attttttcaa atctttcaca cacagtggtt 900
tgctatggaa agatttgtag tacattaaac aaatctgaag atggagttag aaagctagct 960
taggctatgt tttgagcaca acatataatt tctctgtgat tgtttcttca tctttcaaat 1020
gaggttactg tgaagattaa atgagataac taaatgatga taaaataatg taatcttagc 1080
agcaccttat ttaatctgtg caacaactct gtgaagtgag tagggctcag cttcagtcac 1140
ttctctgcca tttattaact aagatagttt ggaaagttac ccatctcttc agctgtaaaa 1200
tgatgaggat catacctatt ttatggggct gcttttaggt acaaatatac aggcaagcac 1260
tttgttaata ctaaagcatt acaccaatta gttttactct tttccattca cacatgaaat 1320
taatgtaatc agaattctgt agattaccta aatcttctgt taacacgtga tatgcagttc 1380
aggttaaatg tcagttgagt taccaaagca catacatact caccacccta tccaaatcta 1440
caagcctccc agtttgtctt cactattttg gttaaattaa tatgaattcc tagatgaaaa 1500
tttcactgat ccaaatgaaa taaaaaatat attacaaaac tcacacctgt aatctcaaca 1560
ttttgggagg ccaaggcagg tagatcactt gaggccagga gttcaagacc agcctgatca 1620
acatggtgaa accctgtctc tactaaaaat acaaaaatta gccaggtgtg gtggcatgtg 1680
cctgtagtcc tacctactcg ggaggctgag gcacaagaat cgcttgaatg tgggaggtgg 1740
aggttgcagt gacctgagat cgtgccactg cactccagcc taggcaacag agtgagatca 1800
tgtgtcatat atatatatat atatatatat atatatatat atatatacac acacacacac 1860
atatatatat acacatatat atacgtatat atatatatgt atatatatac atatatatac 1920
atatatatat atacgtatat atatacgtat atatatatca atgtaaatta tttgggaaat 1980
ttggtatgaa tagtcttccc tgtgaacaca gatcataaaa tcatatatca agcagacaaa 2040
taagtagtag tcacttatat gcttatactt gtaacttaaa gtaaaagaat tacaaaagca 2100
tatgacaaag actaatttta agatatccta atttaaattg ttttctaaaa gtgtgtatac 2160
cattttacct atcatatgaa taatttagaa acatgtttat aaaattaatg tccaaatcca 2220
ttcaaaagtt ttgtaatgca gatcacccac aacaacaaag aatcctagcc tattaaaaaa 2280
gcaacaccac ctacatataa tgaaatatta gcagcatcta tgtaaccaaa gttacacagt 2340
gaatttgggc catccaacac tttgagcaaa gtgttgaatt catcaaatga atgtgtaatc 2400
atttacttac taatgccaat acactttaag gtaatcttaa gtagaagaga tagagtttag 2460
aattttttaa atttatctct tgttgtaaag caatagactt gaataaataa attagaagaa 2520
tcagtcattc aagccaccag agtatttgat cgagatttca caaactctaa ctttctgata 2580
cccattctcc caaaaacgtg taacctcctg tcgataggaa caacccactg cagggatgtt 2640
tctcgtggaa aaaggaaatt tcttttgcat tggtttcaga cctaactggt tacaagaaaa 2700
accaaaggcc attgcacaat gctgaagtac ttttttcaaa tttaaaattt gaaagttgtt 2760
cttaaaatct atcatttatt ttaaaatacg gatgaatgag aaagcataga tttgataaag 2820
tgaattcttt tctgcaatct acagacactt ccaaaaatca ctacagacac tacagacact 2880
acagaaaatc ataaataaac aagtgctagt atcaatattt ttaccaaaaa atggcattct 2940
tagaattttt tataggctag aaggtttgta caaactaatc tgccacggat tttaaaatat 3000
gagtgaataa attatattgc aaaaaaaatc aggttacaga gaactggcaa ggaagactct 3060
tatgtaaaac acagaaaaca tacaaaacgt atttttaaga caaataaaaa cagaacttgt 3120
acctcagatg atactggaga ttgtgttgac atattagcat tatcactgtc ttgctaaaac 3180
ataaaaataa aaagatggaa gatgaaatta caatacaaat gatgatttaa acatataaaa 3240
ggaaaataaa aattgttctg accaactact aaaggaagac ctactaaaga tatgccatcc 3300
agcacattgc cactctacat gtggtctgta aaccagcagc atagg 3345
<210> 10
<211> 892
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (1)..(892)
<223> X_S29R3
<400> 10
aattcaacac tttgctcaaa gtgttggatg gcccaaattc actgtgtaac tttggttaca 60
tagatgctgc taatatttca ttatatgtag gtggtgttgc ttttttaata ggctaggatt 120
ctttgttgtt gtgggtgatc tgcattacaa aacttttgaa tggatttgga cattaatttt 180
ataaacatgt ttctaaatta ttcatatgat aggtaaaatg gtatacacac ttttagaaaa 240
caatttaaat taggatatct taaaattagt ctttgtcata tgcttttgta attcttttac 300
tttaagttac aagtataagc atataagtga ctactactta tttgtctgct tgatatatga 360
ttttatgatc tgtgttcaca gggaagacta ttcataccaa atttcccaaa taatttacat 420
tgatatatat atacgtatat atatacgtat atatatatat gtatatatat gtatatatat 480
acatatatat atatacgtat atatatgtgt atatatatat gtgtgtgtgt gtgtatatat 540
atatatatat atatatatat atatatatat atatgacaca tgatctcact ctgttgccta 600
ggctggagtg cagtggcacg atctcaggtc actgcaacct ccacctccca cattcaagcg 660
attcttgtgc ctcagcctcc cgagtaggta ggactacagg cacatgccac cacacctggc 720
taatttttgt atttttagta gagacagggt ttcaccatgt tgatcaggct ggtcttgaac 780
tcctggcctc aagtgatcta cctgccttgg cctcccaaaa tgttgagatt acaggtgtga 840
gttttgtaat atatttttta tttcatttgg atcagtgaaa ttttcatcta gg 892
<210> 11
<211> 1173
<212> DNA
<213> Homo sapiens
<220>
<221> C_GAPDH promoter
<222> (1)..(363)
<223> Human CMV IE gene enhancer
<400> 11
ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 60
gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 120
tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 180
aatgggtgga ctatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 240
caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 300
acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 360
ccatgacctc gaggagaagt tccccaactt tcccgcctct cagcctttga aagaaagaaa 420
ggggaggggg caggccgcgt gcagccgcga gcggtgctgg gctccggctc caattcccca 480
tctcagtcgt tcccaaagtc ctcctgtttc atccaagcgt gtaagggtcc ccgtccttga 540
ctccctagtg tcctgctgcc cacagtccag tcctgggaac cagcaccgat cacctcccat 600
cgggccaatc tcagtccctt cccccctacg tcggggccca cacgctcggt gcgtgcccag 660
ttgaaccagg cggctgcgga aaaaaaaaag cggggagaaa gtagggcccg gctactagcg 720
gttttacggg cgcacgtagc tcaggcctca agaccttggg ctgggactgg ctgagcctgg 780
cgggaggcgg ggtccgagtc accgcctgcc gccgcgcccc cggtttctat aaattgagcc 840
cgcagcctcc cgcttcgctc tctgctcctc ctgttcgaca gtcagccgca tcttcttttg 900
cgtcgccagg tgaagacggg cggagagaaa cccgggaggc tagggacggc ctgaaggcgg 960
caggggcggg cgcaggccgg atgtgttcgc gccgctgcgg ggtgggcccg ggcggcctcc 1020
gcattgcagg ggcgggcgga ggacgtgatg cggcgcgggc tgggcatgga ggcctggtgg 1080
gggaggggag gggaggcgtg tgtgtcggcc ggggccacta ggcgctcact gttctctccc 1140
tccgcgcagc cgagccacat cgctcagaca cca 1173
<210> 12
<211> 411
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hSRP14
<400> 12
atggtgttgt tggagagcga gcagttcctg acggagctga ccagactttt ccagaagtgc 60
cggacgtcgg gcagcgtcta tatcaccttg aagaagtatg acggtcgaac caaacccatt 120
ccaaagaagg gtactgtgga gggctttgag cccgcagaca acaagtgtct gttaagagct 180
accgatggga agaagaagat cagcactgtg gtgagctcca aggaagtgaa taagtttcag 240
atggcttatt caaacctcct tagagctaac atggatgggc tgaagaagag agacaaaaag 300
aacaaaacta agaagaccaa agcagcagca gcagcagcag cagcagcacc tgccgcagca 360
gcaacagcac caacaacagc agcaacaaca gcagcaacag cagcacagta a 411
<210> 13
<211> 136
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hSRP14
<400> 13
Met Val Leu Leu Glu Ser Glu Gln Phe Leu Thr Glu Leu Thr Arg Leu
1 5 10 15
Phe Gln Lys Cys Arg Thr Ser Gly Ser Val Tyr Ile Thr Leu Lys Lys
20 25 30
Tyr Asp Gly Arg Thr Lys Pro Ile Pro Lys Lys Gly Thr Val Glu Gly
35 40 45
Phe Glu Pro Ala Asp Asn Lys Cys Leu Leu Arg Ala Thr Asp Gly Lys
50 55 60
Lys Lys Ile Ser Thr Val Val Ser Ser Lys Glu Val Asn Lys Phe Gln
65 70 75 80
Met Ala Tyr Ser Asn Leu Leu Arg Ala Asn Met Asp Gly Leu Lys Lys
85 90 95
Arg Asp Lys Lys Asn Lys Thr Lys Lys Thr Lys Ala Ala Ala Ala Ala
100 105 110
Ala Ala Ala Ala Pro Ala Ala Ala Ala Thr Ala Pro Thr Thr Ala Ala
115 120 125
Thr Thr Ala Ala Thr Ala Ala Gln
130 135
<210> 14
<211> 1431
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hSEC61A1
<400> 14
atggcaatca aatttctgga agtcatcaag cccttctgtg tcatcctgcc ggaaattcag 60
aagccagaga ggaagattca gtttaaggag aaagtgctgt ggaccgctat caccctcttt 120
atcttcttag tgtgctgcca gattcccctg tttgggatca tgtcttcaga ttcagctgac 180
cctttctatt ggatgagagt gattctagcc tctaacagag gcacattgat ggagctaggg 240
atctctccta ttgtcacgtc tggccttata atgcaactct tggctggcgc caagataatt 300
gaagttggtg acaccccaaa agaccgagct ctcttcaacg gagcccaaaa gttatttggc 360
atgatcatta ctatcggcca gtctatcgtg tatgtgatga ccgggatgta tggggaccct 420
tctgaaatgg gtgctggaat ttgcctgcta atcaccattc agctctttgt tgctggctta 480
attgtcctac ttttggatga actcctgcaa aaaggatatg gccttggctc tggtatttct 540
ctcttcattg caactaacat ctgtgaaacc atcgtatgga aggcattcag ccccactact 600
gtcaacactg gccgaggaat ggaatttgaa ggtgctatca tcgcactttt ccatctgctg 660
gccacacgca cagacaaggt ccgagccctt cgggaggcgt tctaccgcca gaatcttccc 720
aacctcatga atctcatcgc caccatcttt gtctttgcag tggtcatcta tttccagggc 780
ttccgagtgg acctgccaat caagtcggcc cgctaccgtg gccagtacaa cacctatccc 840
atcaagctct tctatacgtc caacatcccc atcatcctgc agtctgccct ggtgtccaac 900
ctttatgtca tctcccaaat gctctcagct cgcttcagtg gcaacttgct ggtcagcctg 960
ctgggcacct ggtcggacac gtcttctggg ggcccagcac gtgcttatcc agttggtggc 1020
ctttgctatt acctgtcccc tccagaatct tttggctccg tgttagaaga cccggtccat 1080
gcagttgtat acatagtgtt catgctgggc tcctgtgcat tcttctccaa aacgtggatt 1140
gaggtctcag gttcctctgc caaagatgtt gcaaagcagc tgaaggagca gcagatggtg 1200
atgagaggcc accgagagac ctccatggtc catgaactca accggtacat ccccacagcc 1260
gcggcctttg gtgggctgtg catcggggcc ctctcggtcc tggctgactt cctaggcgcc 1320
attgggtctg gaaccgggat cctgctcgca gtcacaatca tctaccagta ctttgagatc 1380
ttcgttaagg agcaaagcga ggttggcagc atgggggccc tgctcttctg a 1431
<210> 15
<211> 476
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hSEC61A1
<400> 15
Met Ala Ile Lys Phe Leu Glu Val Ile Lys Pro Phe Cys Val Ile Leu
1 5 10 15
Pro Glu Ile Gln Lys Pro Glu Arg Lys Ile Gln Phe Lys Glu Lys Val
20 25 30
Leu Trp Thr Ala Ile Thr Leu Phe Ile Phe Leu Val Cys Cys Gln Ile
35 40 45
Pro Leu Phe Gly Ile Met Ser Ser Asp Ser Ala Asp Pro Phe Tyr Trp
50 55 60
Met Arg Val Ile Leu Ala Ser Asn Arg Gly Thr Leu Met Glu Leu Gly
65 70 75 80
Ile Ser Pro Ile Val Thr Ser Gly Leu Ile Met Gln Leu Leu Ala Gly
85 90 95
Ala Lys Ile Ile Glu Val Gly Asp Thr Pro Lys Asp Arg Ala Leu Phe
100 105 110
Asn Gly Ala Gln Lys Leu Phe Gly Met Ile Ile Thr Ile Gly Gln Ser
115 120 125
Ile Val Tyr Val Met Thr Gly Met Tyr Gly Asp Pro Ser Glu Met Gly
130 135 140
Ala Gly Ile Cys Leu Leu Ile Thr Ile Gln Leu Phe Val Ala Gly Leu
145 150 155 160
Ile Val Leu Leu Leu Asp Glu Leu Leu Gln Lys Gly Tyr Gly Leu Gly
165 170 175
Ser Gly Ile Ser Leu Phe Ile Ala Thr Asn Ile Cys Glu Thr Ile Val
180 185 190
Trp Lys Ala Phe Ser Pro Thr Thr Val Asn Thr Gly Arg Gly Met Glu
195 200 205
Phe Glu Gly Ala Ile Ile Ala Leu Phe His Leu Leu Ala Thr Arg Thr
210 215 220
Asp Lys Val Arg Ala Leu Arg Glu Ala Phe Tyr Arg Gln Asn Leu Pro
225 230 235 240
Asn Leu Met Asn Leu Ile Ala Thr Ile Phe Val Phe Ala Val Val Ile
245 250 255
Tyr Phe Gln Gly Phe Arg Val Asp Leu Pro Ile Lys Ser Ala Arg Tyr
260 265 270
Arg Gly Gln Tyr Asn Thr Tyr Pro Ile Lys Leu Phe Tyr Thr Ser Asn
275 280 285
Ile Pro Ile Ile Leu Gln Ser Ala Leu Val Ser Asn Leu Tyr Val Ile
290 295 300
Ser Gln Met Leu Ser Ala Arg Phe Ser Gly Asn Leu Leu Val Ser Leu
305 310 315 320
Leu Gly Thr Trp Ser Asp Thr Ser Ser Gly Gly Pro Ala Arg Ala Tyr
325 330 335
Pro Val Gly Gly Leu Cys Tyr Tyr Leu Ser Pro Pro Glu Ser Phe Gly
340 345 350
Ser Val Leu Glu Asp Pro Val His Ala Val Val Tyr Ile Val Phe Met
355 360 365
Leu Gly Ser Cys Ala Phe Phe Ser Lys Thr Trp Ile Glu Val Ser Gly
370 375 380
Ser Ser Ala Lys Asp Val Ala Lys Gln Leu Lys Glu Gln Gln Met Val
385 390 395 400
Met Arg Gly His Arg Glu Thr Ser Met Val His Glu Leu Asn Arg Tyr
405 410 415
Ile Pro Thr Ala Ala Ala Phe Gly Gly Leu Cys Ile Gly Ala Leu Ser
420 425 430
Val Leu Ala Asp Phe Leu Gly Ala Ile Gly Ser Gly Thr Gly Ile Leu
435 440 445
Leu Ala Val Thr Ile Ile Tyr Gln Tyr Phe Glu Ile Phe Val Lys Glu
450 455 460
Gln Ser Glu Val Gly Ser Met Gly Ala Leu Leu Phe
465 470 475
<210> 16
<211> 291
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hSEC61B
<400> 16
atgcctggtc cgacccccag tggcactaac gtgggatcct cagggcgctc tcccagcaaa 60
gcagtggccg cccgggcggc gggatccact gtccggcaga ggaaaaatgc cagctgtggg 120
acaaggagtg caggccgcac aacctcggca ggcaccgggg ggatgtggcg attctacaca 180
gaagattcac ctgggctcaa agttggccct gttccagtat tggttatgag tcttctgttc 240
atcgcttctg tatttatgtt gcacatttgg ggcaagtaca ctcgttcgta g 291
<210> 17
<211> 96
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hSEC61B
<400> 17
Met Pro Gly Pro Thr Pro Ser Gly Thr Asn Val Gly Ser Ser Gly Arg
1 5 10 15
Ser Pro Ser Lys Ala Val Ala Ala Arg Ala Ala Gly Ser Thr Val Arg
20 25 30
Gln Arg Lys Asn Ala Ser Cys Gly Thr Arg Ser Ala Gly Arg Thr Thr
35 40 45
Ser Ala Gly Thr Gly Gly Met Trp Arg Phe Tyr Thr Glu Asp Ser Pro
50 55 60
Gly Leu Lys Val Gly Pro Val Pro Val Leu Val Met Ser Leu Leu Phe
65 70 75 80
Ile Ala Ser Val Phe Met Leu His Ile Trp Gly Lys Tyr Thr Arg Ser
85 90 95
<210> 18
<211> 207
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hSEC61G
<400> 18
atggatcagg taatgcagtt tgttgagcca agtcggcagt ttgtaaagga ctccattcgg 60
ctggttaaaa gatgcactaa acctgataga aaagaattcc agaagattgc catggcaaca 120
gcaataggat ttgctataat gggattcatt ggcttctttg tgaaattgat ccatattcct 180
attaataaca tcattgttgg tggctga 207
<210> 19
<211> 68
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hSEC61G
<400> 19
Met Asp Gln Val Met Gln Phe Val Glu Pro Ser Arg Gln Phe Val Lys
1 5 10 15
Asp Ser Ile Arg Leu Val Lys Arg Cys Thr Lys Pro Asp Arg Lys Glu
20 25 30
Phe Gln Lys Ile Ala Met Ala Thr Ala Ile Gly Phe Ala Ile Met Gly
35 40 45
Phe Ile Gly Phe Phe Val Lys Leu Ile His Ile Pro Ile Asn Asn Ile
50 55 60
Ile Val Gly Gly
65
<210> 20
<211> 1515
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hSRP54
<400> 20
atggttctag cagaccttgg aagaaaaata acatcagcat tacgctcgtt gagcaatgcc 60
accattatca atgaagaggt attgaatgct atgctaaaag aagtctgtac cgctttgttg 120
gaagcagatg ttaatattaa actagtgaag caactaagag aaaatgttaa gtctgctatt 180
gatcttgaag agatggcatc tggtcttaac aaaagaaaaa tgattcagca tgctgtattt 240
aaagaacttg tgaagcttgt agaccctgga gttaaggcat ggacacccac taaaggaaaa 300
caaaatgtga ttatgtttgt tggattgcaa gggagtggta aaacaacaac atgttcaaag 360
ctagcatatt attaccagag gaaaggttgg aagacctgtt taatatgtgc agacacattc 420
agagcagggg cttttgacca actaaaacag aatgctacca aagcaagaat tccattttat 480
ggaagctata cagaaatgga tcctgtcatc attgcttctg aaggagtaga gaaatttaaa 540
aatgaaaatt ttgaaattat tattgttgat acaagtggcc gccacaaaca agaagactct 600
ttgtttgaag aaatgcttca agttgctaat gctatacaac ctgataacat tgtttatgtg 660
atggatgcct ccattgggca ggcttgtgaa gcccaggcta aggcttttaa agataaagta 720
gatgtagcct cagtaatagt gacaaaactt gatggccatg caaaaggagg tggtgcactc 780
agtgcagtcg ctgccacaaa aagtccgatt attttcattg gtacagggga acatatagat 840
gactttgaac ctttcaaaac acagcctttt attagcaaac ttcttggtat gggcgacatt 900
gaaggactga tagataaagt caacgagttg aagttggatg acaatgaagc acttatagag 960
aagttgaaac atggtcagtt tacgttgcga gacatgtatg agcaatttca aaatatcatg 1020
aaaatgggcc ccttcagtca gatcttgggg atgatccctg gttttgggac agattttatg 1080
agcaaaggaa atgaacagga gtcaatggca aggctaaaga aattaatgac aataatggat 1140
agtatgaatg atcaagaact agacagtacg gatggtgcca aagtttttag taaacaacca 1200
ggaagaatcc aaagagtagc aagaggatcg ggtgtatcaa caagagatgt tcaagaactt 1260
ttgacacaat ataccaagtt tgcacagatg gtaaaaaaga tgggaggtat caaaggactt 1320
ttcaaaggtg gcgacatgtc taagaatgtg agccagtcac agatggcaaa attgaaccaa 1380
caaatggcca aaatgatgga tcctagggtt cttcatcaca tgggtggtat ggcaggactt 1440
cagtcaatga tgaggcagtt tcaacagggt gctgctggca acatgaaagg catgatggga 1500
ttcaataata tgtaa 1515
<210> 21
<211> 504
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hSRP54
<400> 21
Met Val Leu Ala Asp Leu Gly Arg Lys Ile Thr Ser Ala Leu Arg Ser
1 5 10 15
Leu Ser Asn Ala Thr Ile Ile Asn Glu Glu Val Leu Asn Ala Met Leu
20 25 30
Lys Glu Val Cys Thr Ala Leu Leu Glu Ala Asp Val Asn Ile Lys Leu
35 40 45
Val Lys Gln Leu Arg Glu Asn Val Lys Ser Ala Ile Asp Leu Glu Glu
50 55 60
Met Ala Ser Gly Leu Asn Lys Arg Lys Met Ile Gln His Ala Val Phe
65 70 75 80
Lys Glu Leu Val Lys Leu Val Asp Pro Gly Val Lys Ala Trp Thr Pro
85 90 95
Thr Lys Gly Lys Gln Asn Val Ile Met Phe Val Gly Leu Gln Gly Ser
100 105 110
Gly Lys Thr Thr Thr Cys Ser Lys Leu Ala Tyr Tyr Tyr Gln Arg Lys
115 120 125
Gly Trp Lys Thr Cys Leu Ile Cys Ala Asp Thr Phe Arg Ala Gly Ala
130 135 140
Phe Asp Gln Leu Lys Gln Asn Ala Thr Lys Ala Arg Ile Pro Phe Tyr
145 150 155 160
Gly Ser Tyr Thr Glu Met Asp Pro Val Ile Ile Ala Ser Glu Gly Val
165 170 175
Glu Lys Phe Lys Asn Glu Asn Phe Glu Ile Ile Ile Val Asp Thr Ser
180 185 190
Gly Arg His Lys Gln Glu Asp Ser Leu Phe Glu Glu Met Leu Gln Val
195 200 205
Ala Asn Ala Ile Gln Pro Asp Asn Ile Val Tyr Val Met Asp Ala Ser
210 215 220
Ile Gly Gln Ala Cys Glu Ala Gln Ala Lys Ala Phe Lys Asp Lys Val
225 230 235 240
Asp Val Ala Ser Val Ile Val Thr Lys Leu Asp Gly His Ala Lys Gly
245 250 255
Gly Gly Ala Leu Ser Ala Val Ala Ala Thr Lys Ser Pro Ile Ile Phe
260 265 270
Ile Gly Thr Gly Glu His Ile Asp Asp Phe Glu Pro Phe Lys Thr Gln
275 280 285
Pro Phe Ile Ser Lys Leu Leu Gly Met Gly Asp Ile Glu Gly Leu Ile
290 295 300
Asp Lys Val Asn Glu Leu Lys Leu Asp Asp Asn Glu Ala Leu Ile Glu
305 310 315 320
Lys Leu Lys His Gly Gln Phe Thr Leu Arg Asp Met Tyr Glu Gln Phe
325 330 335
Gln Asn Ile Met Lys Met Gly Pro Phe Ser Gln Ile Leu Gly Met Ile
340 345 350
Pro Gly Phe Gly Thr Asp Phe Met Ser Lys Gly Asn Glu Gln Glu Ser
355 360 365
Met Ala Arg Leu Lys Lys Leu Met Thr Ile Met Asp Ser Met Asn Asp
370 375 380
Gln Glu Leu Asp Ser Thr Asp Gly Ala Lys Val Phe Ser Lys Gln Pro
385 390 395 400
Gly Arg Ile Gln Arg Val Ala Arg Gly Ser Gly Val Ser Thr Arg Asp
405 410 415
Val Gln Glu Leu Leu Thr Gln Tyr Thr Lys Phe Ala Gln Met Val Lys
420 425 430
Lys Met Gly Gly Ile Lys Gly Leu Phe Lys Gly Gly Asp Met Ser Lys
435 440 445
Asn Val Ser Gln Ser Gln Met Ala Lys Leu Asn Gln Gln Met Ala Lys
450 455 460
Met Met Asp Pro Arg Val Leu His His Met Gly Gly Met Ala Gly Leu
465 470 475 480
Gln Ser Met Met Arg Gln Phe Gln Gln Gly Ala Ala Gly Asn Met Lys
485 490 495
Gly Met Met Gly Phe Asn Asn Met
500
<210> 22
<211> 249
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hSRP9
<400> 22
atgccgcagt accagacctg ggaggagttc agccgcgctg ccgagaagct ttacctcgct 60
gaccctatga aggcacgtgt ggttctcaaa tataggcatt ctgatgggaa cttgtgtgtt 120
aaagtaacag atgatttagt tagacagtgt cttgctctat tgctcaggct gcagtgcagt 180
ggcatgatca tagctcactg catcctcgac ctcctgggct caagcggtcc tcttgcttca 240
gcctcctga 249
<210> 23
<211> 82
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hSRP9
<400> 23
Met Pro Gln Tyr Gln Thr Trp Glu Glu Phe Ser Arg Ala Ala Glu Lys
1 5 10 15
Leu Tyr Leu Ala Asp Pro Met Lys Ala Arg Val Val Leu Lys Tyr Arg
20 25 30
His Ser Asp Gly Asn Leu Cys Val Lys Val Thr Asp Asp Leu Val Arg
35 40 45
Gln Cys Leu Ala Leu Leu Leu Arg Leu Gln Cys Ser Gly Met Ile Ile
50 55 60
Ala His Cys Ile Leu Asp Leu Leu Gly Ser Ser Gly Pro Leu Ala Ser
65 70 75 80
Ala Ser
<210> 24
<211> 1917
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hSRPRalpha
<400> 24
atgctcgact tcttcaccat tttctccaag ggcgggcttg tgctctggtg cttccagggc 60
gttagcgact catgcaccgg acccgttaac gcgttgattc gttccgtgct gctgcaggaa 120
cggggaggta acaactcctt cacccatgag gcactcacac tcaagtataa actggacaac 180
cagtttgagc tggtgtttgt ggttggtttt cagaagatcc tgacactgac atatgtagac 240
aaattgatag atgacgtgca tcggctgttt cgggacaagt accgcacaga gatccaacag 300
caaagtgctt taagtttatt aaatggcact tttgatttcc aaaatgactt cctgcggctc 360
cttcgtgaag cagaggagag cagtaagatc cgtgctccca ctaccatgaa gaaatttgaa 420
gattctgaaa aggccaagaa acctgtgagg tccatgattg agacacgggg ggaaaagccc 480
aaggaaaaag caaagaatag caaaaaaaag ggggccaaga aggaaggttc tgatggtcct 540
ttggctacca gcaaaccagt ccctgcagaa aagtcaggtc ttccagtggg tcctgagaac 600
ggagtagaac tttccaaaga ggagctgatc cgcaggaagc gcgaggagtt cattcagaag 660
catgggaggg gtatggagaa gtccaacaag tccacgaagt cagatgctcc aaaggagaag 720
ggcaaaaaag caccccgggt gtgggaactg ggtggctgtg ctaacaaaga agtgttggat 780
tacagtactc ccaccaccaa tggaacccct gaggctgcct tgtctgagga catcaacctg 840
attcgaggga ctgggtctgg ggggcagctt caggatctgg actgcagcag ctctgatgac 900
gaaggggctg ctcaaaactc taccaaacct agtgcgacca agggaacact gggtggcatg 960
tttggtatgc tgaagggcct tgtgggttca aagagcttga gtcgtgaaga catggaatct 1020
gtgctggaca agatgcgtga tcatctcatt gctaagaacg tggctgcaga cattgccgtc 1080
cagctctgtg aatctgttgc caacaagttg gaagggaagg tgatggggac gttcagcacg 1140
gtgacttcca cagtaaagca agccctacag gagtccctgg tgcagattct gcagccacag 1200
cgtcgtgtag acatgctccg ggacatcatg gatgcccagc gtcgccagcg cccttatgtc 1260
gtcaccttct gcggcgttaa tggagtgggg aaatctacta atcttgccaa gatttccttc 1320
tggttgttag agaatggctt cagtgtcctc attgctgcct gtgatacatt tcgtgctggg 1380
gccgtggagc agctgcgtac acacacccgg cgtttgagtg ccctacaccc tccagagaag 1440
catggtggcc gcaccatggt gcagttgttt gaaaagggct atggcaagga tgctgctggc 1500
attgccatgg aagccattgc ttttgcacgt aaccaaggct ttgacgtggt gctggtggac 1560
acggcaggcc gcatgcaaga caatgcccct ctgatgactg ccctggccaa actcattact 1620
gtcaatacac ctgatttggt gctgtttgta ggagaagcct tagtaggcaa tgaagccgtg 1680
gaccagctgg tcaagttcaa cagagccttg gctgaccatt ctatggctca gacacctcgg 1740
ctcattgatg gcattgttct taccaaattt gataccattg atgacaaggt gggagctgct 1800
atttctatga cgtacatcac aagcaaaccc atcgtctttg tgggcaccgg ccagacctac 1860
tgtgacctac gcagcctcaa tgccaaggct gtggtggctg ccctcatgaa ggcttaa 1917
<210> 25
<211> 638
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hSRPRalpha
<400> 25
Met Leu Asp Phe Phe Thr Ile Phe Ser Lys Gly Gly Leu Val Leu Trp
1 5 10 15
Cys Phe Gln Gly Val Ser Asp Ser Cys Thr Gly Pro Val Asn Ala Leu
20 25 30
Ile Arg Ser Val Leu Leu Gln Glu Arg Gly Gly Asn Asn Ser Phe Thr
35 40 45
His Glu Ala Leu Thr Leu Lys Tyr Lys Leu Asp Asn Gln Phe Glu Leu
50 55 60
Val Phe Val Val Gly Phe Gln Lys Ile Leu Thr Leu Thr Tyr Val Asp
65 70 75 80
Lys Leu Ile Asp Asp Val His Arg Leu Phe Arg Asp Lys Tyr Arg Thr
85 90 95
Glu Ile Gln Gln Gln Ser Ala Leu Ser Leu Leu Asn Gly Thr Phe Asp
100 105 110
Phe Gln Asn Asp Phe Leu Arg Leu Leu Arg Glu Ala Glu Glu Ser Ser
115 120 125
Lys Ile Arg Ala Pro Thr Thr Met Lys Lys Phe Glu Asp Ser Glu Lys
130 135 140
Ala Lys Lys Pro Val Arg Ser Met Ile Glu Thr Arg Gly Glu Lys Pro
145 150 155 160
Lys Glu Lys Ala Lys Asn Ser Lys Lys Lys Gly Ala Lys Lys Glu Gly
165 170 175
Ser Asp Gly Pro Leu Ala Thr Ser Lys Pro Val Pro Ala Glu Lys Ser
180 185 190
Gly Leu Pro Val Gly Pro Glu Asn Gly Val Glu Leu Ser Lys Glu Glu
195 200 205
Leu Ile Arg Arg Lys Arg Glu Glu Phe Ile Gln Lys His Gly Arg Gly
210 215 220
Met Glu Lys Ser Asn Lys Ser Thr Lys Ser Asp Ala Pro Lys Glu Lys
225 230 235 240
Gly Lys Lys Ala Pro Arg Val Trp Glu Leu Gly Gly Cys Ala Asn Lys
245 250 255
Glu Val Leu Asp Tyr Ser Thr Pro Thr Thr Asn Gly Thr Pro Glu Ala
260 265 270
Ala Leu Ser Glu Asp Ile Asn Leu Ile Arg Gly Thr Gly Ser Gly Gly
275 280 285
Gln Leu Gln Asp Leu Asp Cys Ser Ser Ser Asp Asp Glu Gly Ala Ala
290 295 300
Gln Asn Ser Thr Lys Pro Ser Ala Thr Lys Gly Thr Leu Gly Gly Met
305 310 315 320
Phe Gly Met Leu Lys Gly Leu Val Gly Ser Lys Ser Leu Ser Arg Glu
325 330 335
Asp Met Glu Ser Val Leu Asp Lys Met Arg Asp His Leu Ile Ala Lys
340 345 350
Asn Val Ala Ala Asp Ile Ala Val Gln Leu Cys Glu Ser Val Ala Asn
355 360 365
Lys Leu Glu Gly Lys Val Met Gly Thr Phe Ser Thr Val Thr Ser Thr
370 375 380
Val Lys Gln Ala Leu Gln Glu Ser Leu Val Gln Ile Leu Gln Pro Gln
385 390 395 400
Arg Arg Val Asp Met Leu Arg Asp Ile Met Asp Ala Gln Arg Arg Gln
405 410 415
Arg Pro Tyr Val Val Thr Phe Cys Gly Val Asn Gly Val Gly Lys Ser
420 425 430
Thr Asn Leu Ala Lys Ile Ser Phe Trp Leu Leu Glu Asn Gly Phe Ser
435 440 445
Val Leu Ile Ala Ala Cys Asp Thr Phe Arg Ala Gly Ala Val Glu Gln
450 455 460
Leu Arg Thr His Thr Arg Arg Leu Ser Ala Leu His Pro Pro Glu Lys
465 470 475 480
His Gly Gly Arg Thr Met Val Gln Leu Phe Glu Lys Gly Tyr Gly Lys
485 490 495
Asp Ala Ala Gly Ile Ala Met Glu Ala Ile Ala Phe Ala Arg Asn Gln
500 505 510
Gly Phe Asp Val Val Leu Val Asp Thr Ala Gly Arg Met Gln Asp Asn
515 520 525
Ala Pro Leu Met Thr Ala Leu Ala Lys Leu Ile Thr Val Asn Thr Pro
530 535 540
Asp Leu Val Leu Phe Val Gly Glu Ala Leu Val Gly Asn Glu Ala Val
545 550 555 560
Asp Gln Leu Val Lys Phe Asn Arg Ala Leu Ala Asp His Ser Met Ala
565 570 575
Gln Thr Pro Arg Leu Ile Asp Gly Ile Val Leu Thr Lys Phe Asp Thr
580 585 590
Ile Asp Asp Lys Val Gly Ala Ala Ile Ser Met Thr Tyr Ile Thr Ser
595 600 605
Lys Pro Ile Val Phe Val Gly Thr Gly Gln Thr Tyr Cys Asp Leu Arg
610 615 620
Ser Leu Asn Ala Lys Ala Val Val Ala Ala Leu Met Lys Ala
625 630 635
<210> 26
<211> 816
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hSRPRbeta
<400> 26
atggcttccg cggactcgcg ccgggtggca gatggcggcg gtgccggggg caccttccag 60
ccctacctag acaccttgcg gcaggagctg cagcagacgg acccaacgct gttgtcagta 120
gtggtggcgg ttcttgcggt gctgctgacg ctagtcttct ggaagttaat ccggagcaga 180
aggagcagtc agagagctgt tcttcttgtt ggcctttgtg attccgggaa aacgttgctc 240
tttgtcaggt tgttaacagg cctttataga gacactcaga cgtccattac tgacagctgt 300
gctgtataca gagtcaacaa taacaggggc aatagtctga ccttgattga ccttcccggc 360
catgagagtt tgaggcttca gttcttagag cggtttaagt cttcagccag ggctattgtg 420
tttgttgtgg atagtgcagc attccagcga gaggtgaaag atgtggctga gtttctgtat 480
caagtcctca ttgacagtat gggtctgaag aatacaccat cattcttaat agcctgcaat 540
aagcaagata ttgcaatggc aaaatcagca aagttaattc aacagcagct ggagaaagaa 600
ctcaacacct tacgagttac ccgttctgct gcccccagca cactggacag ttccagcact 660
gcccctgctc agctggggaa gaaaggcaaa gagtttgaat tctcacagtt gcccctcaaa 720
gtggagttcc tggagtgcag tgccaagggt ggaagagggg acgtgggctc tgctgacatc 780
caggacttgg agaaatggct ggctaaaatt gcctga 816
<210> 27
<211> 271
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hSRPRbeta
<400> 27
Met Ala Ser Ala Asp Ser Arg Arg Val Ala Asp Gly Gly Gly Ala Gly
1 5 10 15
Gly Thr Phe Gln Pro Tyr Leu Asp Thr Leu Arg Gln Glu Leu Gln Gln
20 25 30
Thr Asp Pro Thr Leu Leu Ser Val Val Val Ala Val Leu Ala Val Leu
35 40 45
Leu Thr Leu Val Phe Trp Lys Leu Ile Arg Ser Arg Arg Ser Ser Gln
50 55 60
Arg Ala Val Leu Leu Val Gly Leu Cys Asp Ser Gly Lys Thr Leu Leu
65 70 75 80
Phe Val Arg Leu Leu Thr Gly Leu Tyr Arg Asp Thr Gln Thr Ser Ile
85 90 95
Thr Asp Ser Cys Ala Val Tyr Arg Val Asn Asn Asn Arg Gly Asn Ser
100 105 110
Leu Thr Leu Ile Asp Leu Pro Gly His Glu Ser Leu Arg Leu Gln Phe
115 120 125
Leu Glu Arg Phe Lys Ser Ser Ala Arg Ala Ile Val Phe Val Val Asp
130 135 140
Ser Ala Ala Phe Gln Arg Glu Val Lys Asp Val Ala Glu Phe Leu Tyr
145 150 155 160
Gln Val Leu Ile Asp Ser Met Gly Leu Lys Asn Thr Pro Ser Phe Leu
165 170 175
Ile Ala Cys Asn Lys Gln Asp Ile Ala Met Ala Lys Ser Ala Lys Leu
180 185 190
Ile Gln Gln Gln Leu Glu Lys Glu Leu Asn Thr Leu Arg Val Thr Arg
195 200 205
Ser Ala Ala Pro Ser Thr Leu Asp Ser Ser Ser Thr Ala Pro Ala Gln
210 215 220
Leu Gly Lys Lys Gly Lys Glu Phe Glu Phe Ser Gln Leu Pro Leu Lys
225 230 235 240
Val Glu Phe Leu Glu Cys Ser Ala Lys Gly Gly Arg Gly Asp Val Gly
245 250 255
Ser Ala Asp Ile Gln Asp Leu Glu Lys Trp Leu Ala Lys Ile Ala
260 265 270
<210> 28
<211> 1779
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hCANX
<400> 28
atggaaggga agtggttgct gtgtatgtta ctggtgcttg gaactgctat tgttgaggct 60
catgatggac atgatgatga tgtgattgat attgaggatg accttgacga tgtcattgaa 120
gaggtagaag actcaaaacc agataccact gctcctcctt catctcccaa ggttacttac 180
aaagctccag ttccaacagg ggaagtatat tttgctgatt cttttgacag aggaactctg 240
tcagggtgga ttttatccaa agccaagaaa gacgataccg atgatgaaat tgccaaatat 300
gatggaaagt gggaggtaga ggaaatgaag gagtcaaagc ttccaggtga taaaggactt 360
gtgttgatgt ctcgggccaa gcatcatgcc atctctgcta aactgaacaa gcccttcctg 420
tttgacacca agcctctcat tgttcagtat gaggttaatt tccaaaatgg aatagaatgt 480
ggtggtgcct atgtgaaact gctttctaaa acaccagaac tcaacctgga tcagttccat 540
gacaagaccc cttatacgat tatgtttggt ccagataaat gtggagagga ctataaactg 600
cacttcatct tccgacacaa aaaccccaaa acgggtatct atgaagaaaa acatgctaag 660
aggccagatg cagatctgaa gacctatttt actgataaga aaacacatct ttacacacta 720
atcttgaatc cagataatag ttttgaaata ctggttgacc aatctgtggt gaatagtgga 780
aatctgctca atgacatgac tcctcctgta aatccttcac gtgaaattga ggacccagaa 840
gaccggaagc ccgaggattg ggatgaaaga ccaaaaatcc cagatccaga agctgtcaag 900
ccagatgact gggatgaaga tgcccctgct aagattccag atgaagaggc cacaaaaccc 960
gaaggctggt tagatgatga gcctgagtac gtacctgatc cagacgcaga gaaacctgag 1020
gattgggatg aagacatgga tggagaatgg gaggctcctc agattgccaa ccctagatgt 1080
gagtcagctc ctggatgtgg tgtctggcag cgacctgtga ttgacaaccc caattataaa 1140
ggcaaatgga agcctcctat gattgacaat cccagttacc agggaatctg gaaacccagg 1200
aaaataccaa atccagattt ctttgaagat ctggaacctt tcagaatgac tccttttagt 1260
gctattggtt tggagctgtg gtccatgacc tctgacattt tttttgacaa ctttatcatt 1320
tgtgctgatc gaagaatagt tgatgattgg gccaatgatg gatggggcct gaagaaagct 1380
gctgatgggg ctgctgagcc aggcgttgtg gggcagatga tcgaggcagc tgaagagcgc 1440
ccgtggctgt gggtagtcta tattctaact gtagcccttc ctgtgttcct ggttatcctc 1500
ttctgctgtt ctggaaagaa acagaccagt ggtatggagt ataagaaaac tgatgcacct 1560
caaccggatg tgaaggaaga ggaagaagag aaggaagagg aaaaggacaa gggagatgag 1620
gaggaggaag gagaagagaa acttgaagag aaacagaaaa gtgatgctga agaagatggt 1680
ggcactgtca gtcaagagga ggaagacaga aaacctaaag cagaggagga tgaaattttg 1740
aacagatcac caagaaacag aaagccacga agagagtga 1779
<210> 29
<211> 592
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hCANX
<400> 29
Met Glu Gly Lys Trp Leu Leu Cys Met Leu Leu Val Leu Gly Thr Ala
1 5 10 15
Ile Val Glu Ala His Asp Gly His Asp Asp Asp Val Ile Asp Ile Glu
20 25 30
Asp Asp Leu Asp Asp Val Ile Glu Glu Val Glu Asp Ser Lys Pro Asp
35 40 45
Thr Thr Ala Pro Pro Ser Ser Pro Lys Val Thr Tyr Lys Ala Pro Val
50 55 60
Pro Thr Gly Glu Val Tyr Phe Ala Asp Ser Phe Asp Arg Gly Thr Leu
65 70 75 80
Ser Gly Trp Ile Leu Ser Lys Ala Lys Lys Asp Asp Thr Asp Asp Glu
85 90 95
Ile Ala Lys Tyr Asp Gly Lys Trp Glu Val Glu Glu Met Lys Glu Ser
100 105 110
Lys Leu Pro Gly Asp Lys Gly Leu Val Leu Met Ser Arg Ala Lys His
115 120 125
His Ala Ile Ser Ala Lys Leu Asn Lys Pro Phe Leu Phe Asp Thr Lys
130 135 140
Pro Leu Ile Val Gln Tyr Glu Val Asn Phe Gln Asn Gly Ile Glu Cys
145 150 155 160
Gly Gly Ala Tyr Val Lys Leu Leu Ser Lys Thr Pro Glu Leu Asn Leu
165 170 175
Asp Gln Phe His Asp Lys Thr Pro Tyr Thr Ile Met Phe Gly Pro Asp
180 185 190
Lys Cys Gly Glu Asp Tyr Lys Leu His Phe Ile Phe Arg His Lys Asn
195 200 205
Pro Lys Thr Gly Ile Tyr Glu Glu Lys His Ala Lys Arg Pro Asp Ala
210 215 220
Asp Leu Lys Thr Tyr Phe Thr Asp Lys Lys Thr His Leu Tyr Thr Leu
225 230 235 240
Ile Leu Asn Pro Asp Asn Ser Phe Glu Ile Leu Val Asp Gln Ser Val
245 250 255
Val Asn Ser Gly Asn Leu Leu Asn Asp Met Thr Pro Pro Val Asn Pro
260 265 270
Ser Arg Glu Ile Glu Asp Pro Glu Asp Arg Lys Pro Glu Asp Trp Asp
275 280 285
Glu Arg Pro Lys Ile Pro Asp Pro Glu Ala Val Lys Pro Asp Asp Trp
290 295 300
Asp Glu Asp Ala Pro Ala Lys Ile Pro Asp Glu Glu Ala Thr Lys Pro
305 310 315 320
Glu Gly Trp Leu Asp Asp Glu Pro Glu Tyr Val Pro Asp Pro Asp Ala
325 330 335
Glu Lys Pro Glu Asp Trp Asp Glu Asp Met Asp Gly Glu Trp Glu Ala
340 345 350
Pro Gln Ile Ala Asn Pro Arg Cys Glu Ser Ala Pro Gly Cys Gly Val
355 360 365
Trp Gln Arg Pro Val Ile Asp Asn Pro Asn Tyr Lys Gly Lys Trp Lys
370 375 380
Pro Pro Met Ile Asp Asn Pro Ser Tyr Gln Gly Ile Trp Lys Pro Arg
385 390 395 400
Lys Ile Pro Asn Pro Asp Phe Phe Glu Asp Leu Glu Pro Phe Arg Met
405 410 415
Thr Pro Phe Ser Ala Ile Gly Leu Glu Leu Trp Ser Met Thr Ser Asp
420 425 430
Ile Phe Phe Asp Asn Phe Ile Ile Cys Ala Asp Arg Arg Ile Val Asp
435 440 445
Asp Trp Ala Asn Asp Gly Trp Gly Leu Lys Lys Ala Ala Asp Gly Ala
450 455 460
Ala Glu Pro Gly Val Val Gly Gln Met Ile Glu Ala Ala Glu Glu Arg
465 470 475 480
Pro Trp Leu Trp Val Val Tyr Ile Leu Thr Val Ala Leu Pro Val Phe
485 490 495
Leu Val Ile Leu Phe Cys Cys Ser Gly Lys Lys Gln Thr Ser Gly Met
500 505 510
Glu Tyr Lys Lys Thr Asp Ala Pro Gln Pro Asp Val Lys Glu Glu Glu
515 520 525
Glu Glu Lys Glu Glu Glu Lys Asp Lys Gly Asp Glu Glu Glu Glu Gly
530 535 540
Glu Glu Lys Leu Glu Glu Lys Gln Lys Ser Asp Ala Glu Glu Asp Gly
545 550 555 560
Gly Thr Val Ser Gln Glu Glu Glu Asp Arg Lys Pro Lys Ala Glu Glu
565 570 575
Asp Glu Ile Leu Asn Arg Ser Pro Arg Asn Arg Lys Pro Arg Arg Glu
580 585 590
<210> 30
<211> 972
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hUCP4
<400> 30
atgtccgtcc cggaggagga ggagaggctt ttgccgctga cccagagatg gccccgagcg 60
agcaaattcc tactgtccgg ctgcgcggct accgtggccg agctagcaac ctttcccctg 120
gatctcacaa aaactcgact ccaaatgcaa ggagaagcag ctcttgctcg gttgggagac 180
ggtgcaagag aatctgcccc ctatagggga atggtgcgca cagccctagg gatcattgaa 240
gaggaaggct ttctaaagct ttggcaagga gtgacacccg ccatttacag acacgtagtg 300
tattctggag gtcgaatggt cacatatgaa catctccgag aggttgtgtt tggcaaaagt 360
gaagatgagc attatcccct ttggaaatca gtcattggag ggatgatggc tggtgttatt 420
ggccagtttt tagccaatcc aactgaccta gtgaaggttc agatgcaaat ggaaggaaaa 480
aggaaactgg aaggaaaacc attgcgattt cgtggtgtac atcatgcatt tgcaaaaatc 540
ttagctgaag gaggaatacg agggctttgg gcaggctggg tacccaatat acaaagagca 600
gcactggtga atatgggaga tttaaccact tatgatacag tgaaacacta cttggtattg 660
aatacaccac ttgaggacaa tatcatgact cacggtttat caagtttatg ttctggactg 720
gtagcttcta ttctgggaac accagccgat gtcatcaaaa gcagaataat gaatcaacca 780
cgagataaac aaggaagggg acttttgtat aaatcatcga ctgactgctt gattcaggct 840
gttcaaggtg aaggattcat gagtctatat aaaggctttt taccatcttg gctgagaatg 900
accccttggt caatggtgtt ctggcttact tatgaaaaaa tcagagagat gagtggagtc 960
agtccatttt aa 972
<210> 31
<211> 323
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hUCP4
<400> 31
Met Ser Val Pro Glu Glu Glu Glu Arg Leu Leu Pro Leu Thr Gln Arg
1 5 10 15
Trp Pro Arg Ala Ser Lys Phe Leu Leu Ser Gly Cys Ala Ala Thr Val
20 25 30
Ala Glu Leu Ala Thr Phe Pro Leu Asp Leu Thr Lys Thr Arg Leu Gln
35 40 45
Met Gln Gly Glu Ala Ala Leu Ala Arg Leu Gly Asp Gly Ala Arg Glu
50 55 60
Ser Ala Pro Tyr Arg Gly Met Val Arg Thr Ala Leu Gly Ile Ile Glu
65 70 75 80
Glu Glu Gly Phe Leu Lys Leu Trp Gln Gly Val Thr Pro Ala Ile Tyr
85 90 95
Arg His Val Val Tyr Ser Gly Gly Arg Met Val Thr Tyr Glu His Leu
100 105 110
Arg Glu Val Val Phe Gly Lys Ser Glu Asp Glu His Tyr Pro Leu Trp
115 120 125
Lys Ser Val Ile Gly Gly Met Met Ala Gly Val Ile Gly Gln Phe Leu
130 135 140
Ala Asn Pro Thr Asp Leu Val Lys Val Gln Met Gln Met Glu Gly Lys
145 150 155 160
Arg Lys Leu Glu Gly Lys Pro Leu Arg Phe Arg Gly Val His His Ala
165 170 175
Phe Ala Lys Ile Leu Ala Glu Gly Gly Ile Arg Gly Leu Trp Ala Gly
180 185 190
Trp Val Pro Asn Ile Gln Arg Ala Ala Leu Val Asn Met Gly Asp Leu
195 200 205
Thr Thr Tyr Asp Thr Val Lys His Tyr Leu Val Leu Asn Thr Pro Leu
210 215 220
Glu Asp Asn Ile Met Thr His Gly Leu Ser Ser Leu Cys Ser Gly Leu
225 230 235 240
Val Ala Ser Ile Leu Gly Thr Pro Ala Asp Val Ile Lys Ser Arg Ile
245 250 255
Met Asn Gln Pro Arg Asp Lys Gln Gly Arg Gly Leu Leu Tyr Lys Ser
260 265 270
Ser Thr Asp Cys Leu Ile Gln Ala Val Gln Gly Glu Gly Phe Met Ser
275 280 285
Leu Tyr Lys Gly Phe Leu Pro Ser Trp Leu Arg Met Thr Pro Trp Ser
290 295 300
Met Val Phe Trp Leu Thr Tyr Glu Lys Ile Arg Glu Met Ser Gly Val
305 310 315 320
Ser Pro Phe
<210> 32
<211> 1014
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hCMPSAT
<400> 32
atggctgccc cgagagacaa tgtcacttta ttattcaagt tatactgctt ggcagtgatg 60
accctgatgg ctgcagtcta taccatagct ttaagataca caaggacatc agacaaagaa 120
ctctactttt caaccacagc cgtgtgtatc acagaagtta taaagttatt gctaagtgtg 180
ggaattttag ctaaagaaac tggtagtctg ggtagattca aagcatcttt aagagaaaat 240
gtcttgggga gccccaagga actgttgaag ttaagtgtgc catcgttagt gtatgctgtt 300
cagaacaaca tggctttcct agctcttagc aatctggatg cagcagtgta ccaggtgacc 360
taccagttga agattccgtg tactgcttta tgcactgttt taatgttaaa ccggacactc 420
agcaaattac agtgggtttc agtttttatg ctgtgtgctg gagttacgct tgtacagtgg 480
aaaccagccc aagctacaaa agtggtggtg gaacaaaatc cattattagg gtttggcgct 540
atagctattg ctgtattgtg ctcaggattt gcaggagtat attttgaaaa agttttaaag 600
agttcagata cttctctttg ggtgagaaac attcaaatgt atctatcagg gattattgtg 660
acattagctg gcgtctactt gtcagatgga gctgaaatta aagaaaaagg atttttctat 720
ggttacacat attatgtctg gtttgtcatc tttcttgcaa gtgttggtgg cctctacact 780
tctgttgtgg ttaagtacac agacaacatc atgaaaggct tttctgcagc agcggccatt 840
gtcctttcca ccattgcttc agtaatgctg tttggattac agataacact cacctttgcc 900
ctgggtactc ttcttgtatg tgtttccata tatctctatg gattacccag acaagacact 960
acatccatcc aacaaggaga aacagcttca aaggagagag ttattggtgt gtga 1014
<210> 33
<211> 337
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hCMPSAT
<400> 33
Met Ala Ala Pro Arg Asp Asn Val Thr Leu Leu Phe Lys Leu Tyr Cys
1 5 10 15
Leu Ala Val Met Thr Leu Met Ala Ala Val Tyr Thr Ile Ala Leu Arg
20 25 30
Tyr Thr Arg Thr Ser Asp Lys Glu Leu Tyr Phe Ser Thr Thr Ala Val
35 40 45
Cys Ile Thr Glu Val Ile Lys Leu Leu Leu Ser Val Gly Ile Leu Ala
50 55 60
Lys Glu Thr Gly Ser Leu Gly Arg Phe Lys Ala Ser Leu Arg Glu Asn
65 70 75 80
Val Leu Gly Ser Pro Lys Glu Leu Leu Lys Leu Ser Val Pro Ser Leu
85 90 95
Val Tyr Ala Val Gln Asn Asn Met Ala Phe Leu Ala Leu Ser Asn Leu
100 105 110
Asp Ala Ala Val Tyr Gln Val Thr Tyr Gln Leu Lys Ile Pro Cys Thr
115 120 125
Ala Leu Cys Thr Val Leu Met Leu Asn Arg Thr Leu Ser Lys Leu Gln
130 135 140
Trp Val Ser Val Phe Met Leu Cys Ala Gly Val Thr Leu Val Gln Trp
145 150 155 160
Lys Pro Ala Gln Ala Thr Lys Val Val Val Glu Gln Asn Pro Leu Leu
165 170 175
Gly Phe Gly Ala Ile Ala Ile Ala Val Leu Cys Ser Gly Phe Ala Gly
180 185 190
Val Tyr Phe Glu Lys Val Leu Lys Ser Ser Asp Thr Ser Leu Trp Val
195 200 205
Arg Asn Ile Gln Met Tyr Leu Ser Gly Ile Ile Val Thr Leu Ala Gly
210 215 220
Val Tyr Leu Ser Asp Gly Ala Glu Ile Lys Glu Lys Gly Phe Phe Tyr
225 230 235 240
Gly Tyr Thr Tyr Tyr Val Trp Phe Val Ile Phe Leu Ala Ser Val Gly
245 250 255
Gly Leu Tyr Thr Ser Val Val Val Lys Tyr Thr Asp Asn Ile Met Lys
260 265 270
Gly Phe Ser Ala Ala Ala Ala Ile Val Leu Ser Thr Ile Ala Ser Val
275 280 285
Met Leu Phe Gly Leu Gln Ile Thr Leu Thr Phe Ala Leu Gly Thr Leu
290 295 300
Leu Val Cys Val Ser Ile Tyr Leu Tyr Gly Leu Pro Arg Gln Asp Thr
305 310 315 320
Thr Ser Ile Gln Gln Gly Glu Thr Ala Ser Lys Glu Arg Val Ile Gly
325 330 335
Val
<210> 34
<211> 1212
<212> DNA
<213> Artificial Sequence
<220>
<223> Optimized Sequence
<220>
<221> misc_feature
<223> rST6Gal1
<400> 34
atgatccaca ccaacctgaa gaagaagttc tccctgttca tcctggtgtt tctgctgttc 60
gccgtgatct gcgtgtggaa gaagggctcc gactacgagg ctctgaccct gcaggccaaa 120
gaattccaga tgcccaagtc ccaagaaaag gtggcaatgg gctccgccag ccaggtggtg 180
ttctccaact ccaagcagga ccctaaagag gacatcccta tcctgtccta ccacagagtg 240
accgccaaag tgaagcctca gcctagcttc caggtctggg acaaggactc cacctacagc 300
aagctgaacc ctcggctgct gaagatctgg cggaactacc tgaacatgaa caagtacaag 360
gtgtcctaca agggccctgg ccctggcgtg aagttctccg tggaggccct gaggtgccac 420
ctgagggacc acgtgaacgt gtccatgatc gaggccaccg acttcccatt caacaccacc 480
gagtgggagg gctacctgcc taaagagaac ttccggacca aagtgggccc ttggcagaga 540
tgcgccgtgg tgtcctccgc cggctccctg aagaactctc agctgggccg ggagatcgac 600
aaccacgacg ccgtgctgag gttcaacggc gctcctaccg acaacttcca gcaggacgtg 660
ggctccaaga ccaccatcag actgatgaac agccagctgg tgaccaccga gaagcggttt 720
ctgaaggact ccctgtacac cgagggcatc ctgatcgtgt gggacccttc cgtgtaccac 780
gccgacatcc ctaagtggta tcagaagccc gactacaact tcttcgagac atacaagtcc 840
taccggcggc tgaacccttc ccagcctttc tacatcctga agccccagat gccttgggag 900
ctgtgggaca tcatccagga aatctccgcc gacctgatcc agcctaaccc tccttcctcc 960
ggcatgctgg gcatcatcat catgatgacc ctgtgcgacc aggtggacat ctacgagttt 1020
ctgccttcca agagaaagac cgacgtgtgc tactaccacc agaagttctt cgactccgcc 1080
tgcacaatgg gcgcctacca ccccctgctg ttcgagaaga acatggtgaa gcacctgaac 1140
gagggcaccg acgaggacat ctacctgttc ggcaaggcca ccctgtccgg cttccggaac 1200
atccggtgct ga 1212
<210> 35
<211> 403
<212> PRT
<213> Rattus norvegicus
<220>
<221> MISC_FEATURE
<223> rST6Gal1
<400> 35
Met Ile His Thr Asn Leu Lys Lys Lys Phe Ser Leu Phe Ile Leu Val
1 5 10 15
Phe Leu Leu Phe Ala Val Ile Cys Val Trp Lys Lys Gly Ser Asp Tyr
20 25 30
Glu Ala Leu Thr Leu Gln Ala Lys Glu Phe Gln Met Pro Lys Ser Gln
35 40 45
Glu Lys Val Ala Met Gly Ser Ala Ser Gln Val Val Phe Ser Asn Ser
50 55 60
Lys Gln Asp Pro Lys Glu Asp Ile Pro Ile Leu Ser Tyr His Arg Val
65 70 75 80
Thr Ala Lys Val Lys Pro Gln Pro Ser Phe Gln Val Trp Asp Lys Asp
85 90 95
Ser Thr Tyr Ser Lys Leu Asn Pro Arg Leu Leu Lys Ile Trp Arg Asn
100 105 110
Tyr Leu Asn Met Asn Lys Tyr Lys Val Ser Tyr Lys Gly Pro Gly Pro
115 120 125
Gly Val Lys Phe Ser Val Glu Ala Leu Arg Cys His Leu Arg Asp His
130 135 140
Val Asn Val Ser Met Ile Glu Ala Thr Asp Phe Pro Phe Asn Thr Thr
145 150 155 160
Glu Trp Glu Gly Tyr Leu Pro Lys Glu Asn Phe Arg Thr Lys Val Gly
165 170 175
Pro Trp Gln Arg Cys Ala Val Val Ser Ser Ala Gly Ser Leu Lys Asn
180 185 190
Ser Gln Leu Gly Arg Glu Ile Asp Asn His Asp Ala Val Leu Arg Phe
195 200 205
Asn Gly Ala Pro Thr Asp Asn Phe Gln Gln Asp Val Gly Ser Lys Thr
210 215 220
Thr Ile Arg Leu Met Asn Ser Gln Leu Val Thr Thr Glu Lys Arg Phe
225 230 235 240
Leu Lys Asp Ser Leu Tyr Thr Glu Gly Ile Leu Ile Val Trp Asp Pro
245 250 255
Ser Val Tyr His Ala Asp Ile Pro Lys Trp Tyr Gln Lys Pro Asp Tyr
260 265 270
Asn Phe Phe Glu Thr Tyr Lys Ser Tyr Arg Arg Leu Asn Pro Ser Gln
275 280 285
Pro Phe Tyr Ile Leu Lys Pro Gln Met Pro Trp Glu Leu Trp Asp Ile
290 295 300
Ile Gln Glu Ile Ser Ala Asp Leu Ile Gln Pro Asn Pro Pro Ser Ser
305 310 315 320
Gly Met Leu Gly Ile Ile Ile Met Met Thr Leu Cys Asp Gln Val Asp
325 330 335
Ile Tyr Glu Phe Leu Pro Ser Lys Arg Lys Thr Asp Val Cys Tyr Tyr
340 345 350
His Gln Lys Phe Phe Asp Ser Ala Cys Thr Met Gly Ala Tyr His Pro
355 360 365
Leu Leu Phe Glu Lys Asn Met Val Lys His Leu Asn Glu Gly Thr Asp
370 375 380
Glu Asp Ile Tyr Leu Phe Gly Lys Ala Thr Leu Ser Gly Phe Arg Asn
385 390 395 400
Ile Arg Cys
<210> 36
<211> 957
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hCOMSC
<400> 36
atgctttctg aaagcagctc ctttttgaag ggtgtgatgc ttggaagcat tttctgtgct 60
ttgatcacta tgctaggaca cattaggatt ggtcatggaa atagaatgca ccaccatgag 120
catcatcacc tacaagctcc taacaaagaa gatatcttga aaatttcaga ggatgagcgc 180
atggagctca gtaagagctt tcgagtatac tgtattatcc ttgtaaaacc caaagatgtg 240
agtctttggg ctgcagtaaa ggagacttgg accaaacact gtgacaaagc agagttcttc 300
agttctgaaa atgttaaagt gtttgagtca attaatatgg acacaaatga catgtggtta 360
atgatgagaa aagcttacaa atacgccttt gataagtata gagaccaata caactggttc 420
ttccttgcac gccccactac gtttgctatc attgaaaacc taaagtattt tttgttaaaa 480
aaggatccat cacagccttt ctatctaggc cacactataa aatctggaga ccttgaatat 540
gtgggtatgg aaggaggaat tgtcttaagt gtagaatcaa tgaaaagact taacagcctt 600
ctcaatatcc cagaaaagtg tcctgaacag ggagggatga tttggaagat atctgaagat 660
aaacagctag cagtttgcct gaaatatgct ggagtatttg cagaaaatgc agaagatgct 720
gatggaaaag atgtatttaa taccaaatct gttgggcttt ctattaaaga ggcaatgact 780
tatcacccca accaggtagt agaaggctgt tgttcagata tggctgttac ttttaatgga 840
ctgactccaa atcagatgca tgtgatgatg tatggggtat accgccttag ggcatttggg 900
catattttca atgatgcatt ggttttctta cctccaaatg gttctgacaa tgactga 957
<210> 37
<211> 318
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hCOMSC
<400> 37
Met Leu Ser Glu Ser Ser Ser Phe Leu Lys Gly Val Met Leu Gly Ser
1 5 10 15
Ile Phe Cys Ala Leu Ile Thr Met Leu Gly His Ile Arg Ile Gly His
20 25 30
Gly Asn Arg Met His His His Glu His His His Leu Gln Ala Pro Asn
35 40 45
Lys Glu Asp Ile Leu Lys Ile Ser Glu Asp Glu Arg Met Glu Leu Ser
50 55 60
Lys Ser Phe Arg Val Tyr Cys Ile Ile Leu Val Lys Pro Lys Asp Val
65 70 75 80
Ser Leu Trp Ala Ala Val Lys Glu Thr Trp Thr Lys His Cys Asp Lys
85 90 95
Ala Glu Phe Phe Ser Ser Glu Asn Val Lys Val Phe Glu Ser Ile Asn
100 105 110
Met Asp Thr Asn Asp Met Trp Leu Met Met Arg Lys Ala Tyr Lys Tyr
115 120 125
Ala Phe Asp Lys Tyr Arg Asp Gln Tyr Asn Trp Phe Phe Leu Ala Arg
130 135 140
Pro Thr Thr Phe Ala Ile Ile Glu Asn Leu Lys Tyr Phe Leu Leu Lys
145 150 155 160
Lys Asp Pro Ser Gln Pro Phe Tyr Leu Gly His Thr Ile Lys Ser Gly
165 170 175
Asp Leu Glu Tyr Val Gly Met Glu Gly Gly Ile Val Leu Ser Val Glu
180 185 190
Ser Met Lys Arg Leu Asn Ser Leu Leu Asn Ile Pro Glu Lys Cys Pro
195 200 205
Glu Gln Gly Gly Met Ile Trp Lys Ile Ser Glu Asp Lys Gln Leu Ala
210 215 220
Val Cys Leu Lys Tyr Ala Gly Val Phe Ala Glu Asn Ala Glu Asp Ala
225 230 235 240
Asp Gly Lys Asp Val Phe Asn Thr Lys Ser Val Gly Leu Ser Ile Lys
245 250 255
Glu Ala Met Thr Tyr His Pro Asn Gln Val Val Glu Gly Cys Cys Ser
260 265 270
Asp Met Ala Val Thr Phe Asn Gly Leu Thr Pro Asn Gln Met His Val
275 280 285
Met Met Tyr Gly Val Tyr Arg Leu Arg Ala Phe Gly His Ile Phe Asn
290 295 300
Asp Ala Leu Val Phe Leu Pro Pro Asn Gly Ser Asp Asn Asp
305 310 315
<210> 38
<211> 1092
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hT-Synthase
<400> 38
atggcctcta aatcctggct gaatttttta accttcctct gtggatcagc aataggattt 60
cttttatgtt ctcagctatt tagtattttg ttgggagaaa aggttgacac ccagcctaat 120
gttcttcata atgatcctca tgcaaggcat tcagatgata atggacagaa tcatctagaa 180
ggacaaatga acttcaatgc agattctagc caacataaag atgagaacac agacattgct 240
gaaaacctct atcagaaagt tagaattctt tgctgggtta tgaccggccc tcaaaaccta 300
gagaaaaagg ccaaacacgt caaagctact tgggcccagc gttgtaacaa agtgttgttt 360
atgagttcag aagaaaataa agacttccct gctgtgggac tgaaaaccaa agaaggcaga 420
gatcaactat actggaaaac aattaaagct tttcagtatg ttcatgaaca ttatttagaa 480
gatgctgatt ggtttttgaa agcagatgat gacacgtatg tcatactaga caatttgagg 540
tggcttcttt caaaatacga ccctgaagaa cccatttact ttgggagaag atttaagcct 600
tatgtaaagc agggctacat gagtggagga gcaggatatg tactaagcaa agaagccttg 660
aaaagatttg ttgatgcatt taaaacagac aagtgtacac atagttcctc cattgaagac 720
ttagcactgg ggagatgcat ggaaattatg aatgtagaag caggagattc cagagatacc 780
attggaaaag aaacttttca tccctttgtg ccagaacacc atttaattaa aggttatcta 840
cctagaacgt tttggtactg gaattacaac tattatcctc ctgtagaggg tcctggttgc 900
tgctctgatc ttgcagtttc ttttcactat gttgattcta caaccatgta tgagttagaa 960
tacctcgttt atcatcttcg tccatatggt tatttataca gatatcaacc taccttacct 1020
gaacgtatac taaaggaaat tagtcaagca aacaaaaatg aagatacaaa agtgaagtta 1080
ggaaatcctt ga 1092
<210> 39
<211> 363
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hT-Synthase
<400> 39
Met Ala Ser Lys Ser Trp Leu Asn Phe Leu Thr Phe Leu Cys Gly Ser
1 5 10 15
Ala Ile Gly Phe Leu Leu Cys Ser Gln Leu Phe Ser Ile Leu Leu Gly
20 25 30
Glu Lys Val Asp Thr Gln Pro Asn Val Leu His Asn Asp Pro His Ala
35 40 45
Arg His Ser Asp Asp Asn Gly Gln Asn His Leu Glu Gly Gln Met Asn
50 55 60
Phe Asn Ala Asp Ser Ser Gln His Lys Asp Glu Asn Thr Asp Ile Ala
65 70 75 80
Glu Asn Leu Tyr Gln Lys Val Arg Ile Leu Cys Trp Val Met Thr Gly
85 90 95
Pro Gln Asn Leu Glu Lys Lys Ala Lys His Val Lys Ala Thr Trp Ala
100 105 110
Gln Arg Cys Asn Lys Val Leu Phe Met Ser Ser Glu Glu Asn Lys Asp
115 120 125
Phe Pro Ala Val Gly Leu Lys Thr Lys Glu Gly Arg Asp Gln Leu Tyr
130 135 140
Trp Lys Thr Ile Lys Ala Phe Gln Tyr Val His Glu His Tyr Leu Glu
145 150 155 160
Asp Ala Asp Trp Phe Leu Lys Ala Asp Asp Asp Thr Tyr Val Ile Leu
165 170 175
Asp Asn Leu Arg Trp Leu Leu Ser Lys Tyr Asp Pro Glu Glu Pro Ile
180 185 190
Tyr Phe Gly Arg Arg Phe Lys Pro Tyr Val Lys Gln Gly Tyr Met Ser
195 200 205
Gly Gly Ala Gly Tyr Val Leu Ser Lys Glu Ala Leu Lys Arg Phe Val
210 215 220
Asp Ala Phe Lys Thr Asp Lys Cys Thr His Ser Ser Ser Ile Glu Asp
225 230 235 240
Leu Ala Leu Gly Arg Cys Met Glu Ile Met Asn Val Glu Ala Gly Asp
245 250 255
Ser Arg Asp Thr Ile Gly Lys Glu Thr Phe His Pro Phe Val Pro Glu
260 265 270
His His Leu Ile Lys Gly Tyr Leu Pro Arg Thr Phe Trp Tyr Trp Asn
275 280 285
Tyr Asn Tyr Tyr Pro Pro Val Glu Gly Pro Gly Cys Cys Ser Asp Leu
290 295 300
Ala Val Ser Phe His Tyr Val Asp Ser Thr Thr Met Tyr Glu Leu Glu
305 310 315 320
Tyr Leu Val Tyr His Leu Arg Pro Tyr Gly Tyr Leu Tyr Arg Tyr Gln
325 330 335
Pro Thr Leu Pro Glu Arg Ile Leu Lys Glu Ile Ser Gln Ala Asn Lys
340 345 350
Asn Glu Asp Thr Lys Val Lys Leu Gly Asn Pro
355 360
<210> 40
<211> 1605
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hP4HA1
<400> 40
atgatctggt atatattaat tataggaatt ctgcttcccc agtctttggc tcatccaggc 60
ttttttactt caattggtca gatgactgat ttgatccata ctgagaaaga tctggtgact 120
tctctgaaag attatattaa ggcagaagag gacaagttag aacaaataaa aaaatgggca 180
gagaagttag atcggctaac tagtacagcg acaaaagatc cagaaggatt tgttgggcat 240
ccagtaaatg cattcaaatt aatgaaacgt ctgaatactg agtggagtga gttggagaat 300
ctggtcctta aggatatgtc agatggcttt atctctaacc taaccattca gagacagtac 360
tttcctaatg atgaagatca ggttggggca gccaaagctc tgttacgtct ccaggatacc 420
tacaatttgg atacagatac catctcaaag ggtaatcttc caggagtgaa acacaaatct 480
tttctaacgg ctgaggactg ctttgagttg ggcaaagtgg cctatacaga agcagattat 540
taccatacgg aactgtggat ggaacaagcc ctaaggcaac tggatgaagg cgagatttct 600
accatagata aagtctctgt tctagattat ttgagctatg cggtatatca gcagggagac 660
ctggataagg cacttttgct cacaaagaag cttcttgaac tagatcctga acatcagaga 720
gctaatggta acttaaaata ttttgagtat ataatggcta aagaaaaaga tgtcaataag 780
tctgcttcag atgaccaatc tgatcagaaa actacaccaa agaaaaaagg ggttgctgtg 840
gattacctgc cagagagaca gaagtacgaa atgctgtgcc gtggggaggg tatcaaaatg 900
acccctcgga gacagaaaaa actcttttgc cgctaccatg atggaaaccg taatcctaaa 960
tttattctgg ctccagctaa acaggaggat gaatgggaca agcctcgtat tattcgcttc 1020
catgatatta tttctgatgc agaaattgaa atcgtcaaag acctagcaaa accaaggctg 1080
agccgagcta cagtacatga ccctgagact ggaaaattga ccacagcaca gtacagagta 1140
tctaagagtg cctggctctc tggctatgaa aatcctgtgg tgtctcgaat taatatgaga 1200
atacaagatc taacaggact agatgtttcc acagcagagg aattacaggt agcaaattat 1260
ggagttggag gacagtatga accccatttt gactttgcac ggaaagatga gccagatgct 1320
ttcaaagagc tggggacagg aaatagaatt gctacatggc tgttttatat gagtgatgtg 1380
tctgcaggag gagccactgt ttttcctgaa gttggagcta gtgtttggcc caaaaaagga 1440
actgctgttt tctggtataa tctgtttgcc agtggagaag gagattatag tacacggcat 1500
gcagcctgtc cagtgctagt tggcaacaaa tgggtatcca ataaatggct ccatgaacgt 1560
ggacaagaat ttcgaagacc ttgtacgttg tcagaattgg aatga 1605
<210> 41
<211> 534
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hP4HA1
<400> 41
Met Ile Trp Tyr Ile Leu Ile Ile Gly Ile Leu Leu Pro Gln Ser Leu
1 5 10 15
Ala His Pro Gly Phe Phe Thr Ser Ile Gly Gln Met Thr Asp Leu Ile
20 25 30
His Thr Glu Lys Asp Leu Val Thr Ser Leu Lys Asp Tyr Ile Lys Ala
35 40 45
Glu Glu Asp Lys Leu Glu Gln Ile Lys Lys Trp Ala Glu Lys Leu Asp
50 55 60
Arg Leu Thr Ser Thr Ala Thr Lys Asp Pro Glu Gly Phe Val Gly His
65 70 75 80
Pro Val Asn Ala Phe Lys Leu Met Lys Arg Leu Asn Thr Glu Trp Ser
85 90 95
Glu Leu Glu Asn Leu Val Leu Lys Asp Met Ser Asp Gly Phe Ile Ser
100 105 110
Asn Leu Thr Ile Gln Arg Gln Tyr Phe Pro Asn Asp Glu Asp Gln Val
115 120 125
Gly Ala Ala Lys Ala Leu Leu Arg Leu Gln Asp Thr Tyr Asn Leu Asp
130 135 140
Thr Asp Thr Ile Ser Lys Gly Asn Leu Pro Gly Val Lys His Lys Ser
145 150 155 160
Phe Leu Thr Ala Glu Asp Cys Phe Glu Leu Gly Lys Val Ala Tyr Thr
165 170 175
Glu Ala Asp Tyr Tyr His Thr Glu Leu Trp Met Glu Gln Ala Leu Arg
180 185 190
Gln Leu Asp Glu Gly Glu Ile Ser Thr Ile Asp Lys Val Ser Val Leu
195 200 205
Asp Tyr Leu Ser Tyr Ala Val Tyr Gln Gln Gly Asp Leu Asp Lys Ala
210 215 220
Leu Leu Leu Thr Lys Lys Leu Leu Glu Leu Asp Pro Glu His Gln Arg
225 230 235 240
Ala Asn Gly Asn Leu Lys Tyr Phe Glu Tyr Ile Met Ala Lys Glu Lys
245 250 255
Asp Val Asn Lys Ser Ala Ser Asp Asp Gln Ser Asp Gln Lys Thr Thr
260 265 270
Pro Lys Lys Lys Gly Val Ala Val Asp Tyr Leu Pro Glu Arg Gln Lys
275 280 285
Tyr Glu Met Leu Cys Arg Gly Glu Gly Ile Lys Met Thr Pro Arg Arg
290 295 300
Gln Lys Lys Leu Phe Cys Arg Tyr His Asp Gly Asn Arg Asn Pro Lys
305 310 315 320
Phe Ile Leu Ala Pro Ala Lys Gln Glu Asp Glu Trp Asp Lys Pro Arg
325 330 335
Ile Ile Arg Phe His Asp Ile Ile Ser Asp Ala Glu Ile Glu Ile Val
340 345 350
Lys Asp Leu Ala Lys Pro Arg Leu Ser Arg Ala Thr Val His Asp Pro
355 360 365
Glu Thr Gly Lys Leu Thr Thr Ala Gln Tyr Arg Val Ser Lys Ser Ala
370 375 380
Trp Leu Ser Gly Tyr Glu Asn Pro Val Val Ser Arg Ile Asn Met Arg
385 390 395 400
Ile Gln Asp Leu Thr Gly Leu Asp Val Ser Thr Ala Glu Glu Leu Gln
405 410 415
Val Ala Asn Tyr Gly Val Gly Gly Gln Tyr Glu Pro His Phe Asp Phe
420 425 430
Ala Arg Lys Asp Glu Pro Asp Ala Phe Lys Glu Leu Gly Thr Gly Asn
435 440 445
Arg Ile Ala Thr Trp Leu Phe Tyr Met Ser Asp Val Ser Ala Gly Gly
450 455 460
Ala Thr Val Phe Pro Glu Val Gly Ala Ser Val Trp Pro Lys Lys Gly
465 470 475 480
Thr Ala Val Phe Trp Tyr Asn Leu Phe Ala Ser Gly Glu Gly Asp Tyr
485 490 495
Ser Thr Arg His Ala Ala Cys Pro Val Leu Val Gly Asn Lys Trp Val
500 505 510
Ser Asn Lys Trp Leu His Glu Arg Gly Gln Glu Phe Arg Arg Pro Cys
515 520 525
Thr Leu Ser Glu Leu Glu
530
<210> 42
<211> 1527
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hP4HB
<400> 42
atgctgcgcc gcgctctgct gtgcctggcc gtggccgccc tggtgcgcgc cgacgccccc 60
gaggaggagg accacgtcct ggtgctgcgg aaaagcaact tcgcggaggc gctggcggcc 120
cacaagtacc tgctggtgga gttctatgcc ccttggtgtg gccactgcaa ggctctggcc 180
cctgagtatg ccaaagccgc tgggaagctg aaggcagaag gttccgagat caggttggcc 240
aaggtggacg ccacggagga gtctgacctg gcccagcagt acggcgtgcg cggctatccc 300
accatcaagt tcttcaggaa tggagacacg gcttccccca aggaatatac agctggcaga 360
gaggctgatg acatcgtgaa ctggctgaag aagcgcacgg gcccggctgc caccaccctg 420
cctgacggcg cagctgcaga gtccttggtg gagtccagcg aggtggctgt catcggcttc 480
ttcaaggacg tggagtcgga ctctgccaag cagtttttgc aggcagcaga ggccatcgat 540
gacataccat ttgggatcac ttccaacagt gacgtgttct ccaaatacca gctcgacaaa 600
gatggggttg tcctctttaa gaagtttgat gaaggccgga acaactttga aggggaggtc 660
accaaggaga acctgctgga ctttatcaaa cacaaccagc tgccccttgt catcgagttc 720
accgagcaga cagccccgaa gatttttgga ggtgaaatca agactcacat cctgctgttc 780
ttgcccaaga gtgtgtctga ctatgacggc aaactgagca acttcaaaac agcagccgag 840
agcttcaagg gcaagatcct gttcatcttc atcgacagcg accacaccga caaccagcgc 900
atcctcgagt tctttggcct gaagaaggaa gagtgcccgg ccgtgcgcct catcaccctg 960
gaggaggaga tgaccaagta caagcccgaa tcggaggagc tgacggcaga gaggatcaca 1020
gagttctgcc accgcttcct ggagggcaaa atcaagcccc acctgatgag ccaggagctg 1080
ccggaggact gggacaagca gcctgtcaag gtgcttgttg ggaagaactt tgaagacgtg 1140
gcttttgatg agaaaaaaaa cgtctttgtg gagttctatg ccccatggtg tggtcactgc 1200
aaacagttgg ctcccatttg ggataaactg ggagagacgt acaaggacca tgagaacatc 1260
gtcatcgcca agatggactc gactgccaac gaggtggagg ccgtcaaagt gcacagcttc 1320
cccacactca agttctttcc tgccagtgcc gacaggacgg tcattgatta caacggggaa 1380
cgcacgctgg atggttttaa gaaattcctg gagagcggtg gccaggatgg ggcaggggat 1440
gatgacgatc tcgaggacct ggaagaagca gaggagccag acatggagga agacgatgat 1500
cagaaagctg tgaaagatga actgtaa 1527
<210> 43
<211> 508
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hP4HB
<400> 43
Met Leu Arg Arg Ala Leu Leu Cys Leu Ala Val Ala Ala Leu Val Arg
1 5 10 15
Ala Asp Ala Pro Glu Glu Glu Asp His Val Leu Val Leu Arg Lys Ser
20 25 30
Asn Phe Ala Glu Ala Leu Ala Ala His Lys Tyr Leu Leu Val Glu Phe
35 40 45
Tyr Ala Pro Trp Cys Gly His Cys Lys Ala Leu Ala Pro Glu Tyr Ala
50 55 60
Lys Ala Ala Gly Lys Leu Lys Ala Glu Gly Ser Glu Ile Arg Leu Ala
65 70 75 80
Lys Val Asp Ala Thr Glu Glu Ser Asp Leu Ala Gln Gln Tyr Gly Val
85 90 95
Arg Gly Tyr Pro Thr Ile Lys Phe Phe Arg Asn Gly Asp Thr Ala Ser
100 105 110
Pro Lys Glu Tyr Thr Ala Gly Arg Glu Ala Asp Asp Ile Val Asn Trp
115 120 125
Leu Lys Lys Arg Thr Gly Pro Ala Ala Thr Thr Leu Pro Asp Gly Ala
130 135 140
Ala Ala Glu Ser Leu Val Glu Ser Ser Glu Val Ala Val Ile Gly Phe
145 150 155 160
Phe Lys Asp Val Glu Ser Asp Ser Ala Lys Gln Phe Leu Gln Ala Ala
165 170 175
Glu Ala Ile Asp Asp Ile Pro Phe Gly Ile Thr Ser Asn Ser Asp Val
180 185 190
Phe Ser Lys Tyr Gln Leu Asp Lys Asp Gly Val Val Leu Phe Lys Lys
195 200 205
Phe Asp Glu Gly Arg Asn Asn Phe Glu Gly Glu Val Thr Lys Glu Asn
210 215 220
Leu Leu Asp Phe Ile Lys His Asn Gln Leu Pro Leu Val Ile Glu Phe
225 230 235 240
Thr Glu Gln Thr Ala Pro Lys Ile Phe Gly Gly Glu Ile Lys Thr His
245 250 255
Ile Leu Leu Phe Leu Pro Lys Ser Val Ser Asp Tyr Asp Gly Lys Leu
260 265 270
Ser Asn Phe Lys Thr Ala Ala Glu Ser Phe Lys Gly Lys Ile Leu Phe
275 280 285
Ile Phe Ile Asp Ser Asp His Thr Asp Asn Gln Arg Ile Leu Glu Phe
290 295 300
Phe Gly Leu Lys Lys Glu Glu Cys Pro Ala Val Arg Leu Ile Thr Leu
305 310 315 320
Glu Glu Glu Met Thr Lys Tyr Lys Pro Glu Ser Glu Glu Leu Thr Ala
325 330 335
Glu Arg Ile Thr Glu Phe Cys His Arg Phe Leu Glu Gly Lys Ile Lys
340 345 350
Pro His Leu Met Ser Gln Glu Leu Pro Glu Asp Trp Asp Lys Gln Pro
355 360 365
Val Lys Val Leu Val Gly Lys Asn Phe Glu Asp Val Ala Phe Asp Glu
370 375 380
Lys Lys Asn Val Phe Val Glu Phe Tyr Ala Pro Trp Cys Gly His Cys
385 390 395 400
Lys Gln Leu Ala Pro Ile Trp Asp Lys Leu Gly Glu Thr Tyr Lys Asp
405 410 415
His Glu Asn Ile Val Ile Ala Lys Met Asp Ser Thr Ala Asn Glu Val
420 425 430
Glu Ala Val Lys Val His Ser Phe Pro Thr Leu Lys Phe Phe Pro Ala
435 440 445
Ser Ala Asp Arg Thr Val Ile Asp Tyr Asn Gly Glu Arg Thr Leu Asp
450 455 460
Gly Phe Lys Lys Phe Leu Glu Ser Gly Gly Gln Asp Gly Ala Gly Asp
465 470 475 480
Asp Asp Asp Leu Glu Asp Leu Glu Glu Ala Glu Glu Pro Asp Met Glu
485 490 495
Glu Asp Asp Asp Gln Lys Ala Val Lys Asp Glu Leu
500 505
<210> 44
<211> 603
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hGILZ
<400> 44
atggcccagt ccaagctcga ttgccgctca cctgtcggcc tcgactgctg caactgctgc 60
ctggacctgg cccatcggag tgggctccag cgaggcagca gcggggagaa caacaacccg 120
ggcagcccta cagtgagcaa ctttcggcag ctgcaggaaa agctggtctt tgagaacctc 180
aataccgaca agctcaacag cataatgcgg caggattcgc tagagccggt gctgcgggac 240
ccctgctacc tgatcaacga gggcatctgc aaccgcaaca tcgaccagac catgctctcc 300
atcctgctct tcttccacag tgcctccgga gccagcgtgg tggccataga caacaagatc 360
gaacaggcca tggatctggt gaagaatcat ctgatgtatg ctgtgagaga ggaggtggag 420
atcctgaagg agcagatccg agagctggtg gagaagaact cccagctaga gcgtgagaac 480
accctgttga agaccctggc aagcccagag cagctggaga agttccagtc ctgtctgagc 540
cctgaagagc cagctcccga atccccacaa gtgcccgagg cccctggtgg ttctgcggtg 600
taa 603
<210> 45
<211> 200
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hGILZ
<400> 45
Met Ala Gln Ser Lys Leu Asp Cys Arg Ser Pro Val Gly Leu Asp Cys
1 5 10 15
Cys Asn Cys Cys Leu Asp Leu Ala His Arg Ser Gly Leu Gln Arg Gly
20 25 30
Ser Ser Gly Glu Asn Asn Asn Pro Gly Ser Pro Thr Val Ser Asn Phe
35 40 45
Arg Gln Leu Gln Glu Lys Leu Val Phe Glu Asn Leu Asn Thr Asp Lys
50 55 60
Leu Asn Ser Ile Met Arg Gln Asp Ser Leu Glu Pro Val Leu Arg Asp
65 70 75 80
Pro Cys Tyr Leu Ile Asn Glu Gly Ile Cys Asn Arg Asn Ile Asp Gln
85 90 95
Thr Met Leu Ser Ile Leu Leu Phe Phe His Ser Ala Ser Gly Ala Ser
100 105 110
Val Val Ala Ile Asp Asn Lys Ile Glu Gln Ala Met Asp Leu Val Lys
115 120 125
Asn His Leu Met Tyr Ala Val Arg Glu Glu Val Glu Ile Leu Lys Glu
130 135 140
Gln Ile Arg Glu Leu Val Glu Lys Asn Ser Gln Leu Glu Arg Glu Asn
145 150 155 160
Thr Leu Leu Lys Thr Leu Ala Ser Pro Glu Gln Leu Glu Lys Phe Gln
165 170 175
Ser Cys Leu Ser Pro Glu Glu Pro Ala Pro Glu Ser Pro Gln Val Pro
180 185 190
Glu Ala Pro Gly Gly Ser Ala Val
195 200
<210> 46
<211> 651
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hCyPB
<400> 46
atgctgcgcc tctccgaacg caacatgaag gtgctccttg ccgccgccct catcgcgggg 60
tccgtcttct tcctgctgct gccgggacct tctgcggccg atgagaagaa gaaggggccc 120
aaagtcaccg tcaaggtgta ttttgaccta cgaattggag atgaagatgt aggccgggtg 180
atctttggtc tcttcggaaa gactgttcca aaaacagtgg ataattttgt ggccttagct 240
acaggagaga aaggatttgg ctacaaaaac agcaaattcc atcgtgtaat caaggacttc 300
atgatccagg gcggagactt caccagggga gatggcacag gaggaaagag catctacggt 360
gagcgcttcc ccgatgagaa cttcaaactg aagcactacg ggcctggctg ggtgagcatg 420
gccaacgcag gcaaagacac caacggctcc cagttcttca tcacgacagt caagacagcc 480
tggctagatg gcaagcatgt ggtgtttggc aaagttctag agggcatgga ggtggtgcgg 540
aaggtggaga gcaccaagac agacagccgg gataaacccc tgaaggatgt gatcatcgca 600
gactgcggca agatcgaggt ggagaagccc tttgccatcg ccaaggagta g 651
<210> 47
<211> 216
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hCyPB
<400> 47
Met Leu Arg Leu Ser Glu Arg Asn Met Lys Val Leu Leu Ala Ala Ala
1 5 10 15
Leu Ile Ala Gly Ser Val Phe Phe Leu Leu Leu Pro Gly Pro Ser Ala
20 25 30
Ala Asp Glu Lys Lys Lys Gly Pro Lys Val Thr Val Lys Val Tyr Phe
35 40 45
Asp Leu Arg Ile Gly Asp Glu Asp Val Gly Arg Val Ile Phe Gly Leu
50 55 60
Phe Gly Lys Thr Val Pro Lys Thr Val Asp Asn Phe Val Ala Leu Ala
65 70 75 80
Thr Gly Glu Lys Gly Phe Gly Tyr Lys Asn Ser Lys Phe His Arg Val
85 90 95
Ile Lys Asp Phe Met Ile Gln Gly Gly Asp Phe Thr Arg Gly Asp Gly
100 105 110
Thr Gly Gly Lys Ser Ile Tyr Gly Glu Arg Phe Pro Asp Glu Asn Phe
115 120 125
Lys Leu Lys His Tyr Gly Pro Gly Trp Val Ser Met Ala Asn Ala Gly
130 135 140
Lys Asp Thr Asn Gly Ser Gln Phe Phe Ile Thr Thr Val Lys Thr Ala
145 150 155 160
Trp Leu Asp Gly Lys His Val Val Phe Gly Lys Val Leu Glu Gly Met
165 170 175
Glu Val Val Arg Lys Val Glu Ser Thr Lys Thr Asp Ser Arg Asp Lys
180 185 190
Pro Leu Lys Asp Val Ile Ile Ala Asp Cys Gly Lys Ile Glu Val Glu
195 200 205
Lys Pro Phe Ala Ile Ala Lys Glu
210 215
<210> 48
<211> 1818
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hNRF2
<400> 48
atgatggact tggagctgcc gccgccggga ctcccgtccc agcaggacat ggatttgatt 60
gacatacttt ggaggcaaga tatagatctt ggagtaagtc gagaagtatt tgacttcagt 120
cagcgacgga aagagtatga gctggaaaaa cagaaaaaac ttgaaaagga aagacaagaa 180
caactccaaa aggagcaaga gaaagccttt ttcgctcagt tacaactaga tgaagagaca 240
ggtgaatttc tcccaattca gccagcccag cacatccagt cagaaaccag tggatctgcc 300
aactactccc aggttgccca cattcccaaa tcagatgctt tgtactttga tgactgcatg 360
cagcttttgg cgcagacatt cccgtttgta gatgacaatg aggtttcttc ggctacgttt 420
cagtcacttg ttcctgatat tcccggtcac atcgagagcc cagtcttcat tgctactaat 480
caggctcagt cacctgaaac ttctgttgct caggtagccc ctgttgattt agacggtatg 540
caacaggaca ttgagcaagt ttgggaggag ctattatcca ttcctgagtt acagtgtctt 600
aatattgaaa atgacaagct ggttgagact accatggttc caagtccaga agccaaactg 660
acagaagttg acaattatca tttttactca tctataccct caatggaaaa agaagtaggt 720
aactgtagtc cacattttct taatgctttt gaggattcct tcagcagcat cctctccaca 780
gaagacccca accagttgac agtgaactca ttaaattcag atgccacagt caacacagat 840
tttggtgatg aattttattc tgctttcata gctgagccca gtatcagcaa cagcatgccc 900
tcacctgcta ctttaagcca ttcactctct gaacttctaa atgggcccat tgatgtttct 960
gatctatcac tttgcaaagc tttcaaccaa aaccaccctg aaagcacagc agaattcaat 1020
gattctgact ccggcatttc actaaacaca agtcccagtg tggcatcacc agaacactca 1080
gtggaatctt ccagctatgg agacacacta cttggcctca gtgattctga agtggaagag 1140
ctagatagtg cccctggaag tgtcaaacag aatggtccta aaacaccagt acattcttct 1200
ggggatatgg tacaaccctt gtcaccatct caggggcaga gcactcacgt gcatgatgcc 1260
caatgtgaga acacaccaga gaaagaattg cctgtaagtc ctggtcatcg gaaaacccca 1320
ttcacaaaag acaaacattc aagccgcttg gaggctcatc tcacaagaga tgaacttagg 1380
gcaaaagctc tccatatccc attccctgta gaaaaaatca ttaacctccc tgttgttgac 1440
ttcaacgaaa tgatgtccaa agagcagttc aatgaagctc aacttgcatt aattcgggat 1500
atacgtagga ggggtaagaa taaagtggct gctcagaatt gcagaaaaag aaaactggaa 1560
aatatagtag aactagagca agatttagat catttgaaag atgaaaaaga aaaattgctc 1620
aaagaaaaag gagaaaatga caaaagcctt cacctactga aaaaacaact cagcacctta 1680
tatctcgaag ttttcagcat gctacgtgat gaagatggaa aaccttattc tcctagtgaa 1740
tactccctgc agcaaacaag agatggcaat gttttccttg ttcccaaaag taagaagcca 1800
gatgttaaga aaaactag 1818
<210> 49
<211> 605
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hNRF2
<400> 49
Met Met Asp Leu Glu Leu Pro Pro Pro Gly Leu Pro Ser Gln Gln Asp
1 5 10 15
Met Asp Leu Ile Asp Ile Leu Trp Arg Gln Asp Ile Asp Leu Gly Val
20 25 30
Ser Arg Glu Val Phe Asp Phe Ser Gln Arg Arg Lys Glu Tyr Glu Leu
35 40 45
Glu Lys Gln Lys Lys Leu Glu Lys Glu Arg Gln Glu Gln Leu Gln Lys
50 55 60
Glu Gln Glu Lys Ala Phe Phe Ala Gln Leu Gln Leu Asp Glu Glu Thr
65 70 75 80
Gly Glu Phe Leu Pro Ile Gln Pro Ala Gln His Ile Gln Ser Glu Thr
85 90 95
Ser Gly Ser Ala Asn Tyr Ser Gln Val Ala His Ile Pro Lys Ser Asp
100 105 110
Ala Leu Tyr Phe Asp Asp Cys Met Gln Leu Leu Ala Gln Thr Phe Pro
115 120 125
Phe Val Asp Asp Asn Glu Val Ser Ser Ala Thr Phe Gln Ser Leu Val
130 135 140
Pro Asp Ile Pro Gly His Ile Glu Ser Pro Val Phe Ile Ala Thr Asn
145 150 155 160
Gln Ala Gln Ser Pro Glu Thr Ser Val Ala Gln Val Ala Pro Val Asp
165 170 175
Leu Asp Gly Met Gln Gln Asp Ile Glu Gln Val Trp Glu Glu Leu Leu
180 185 190
Ser Ile Pro Glu Leu Gln Cys Leu Asn Ile Glu Asn Asp Lys Leu Val
195 200 205
Glu Thr Thr Met Val Pro Ser Pro Glu Ala Lys Leu Thr Glu Val Asp
210 215 220
Asn Tyr His Phe Tyr Ser Ser Ile Pro Ser Met Glu Lys Glu Val Gly
225 230 235 240
Asn Cys Ser Pro His Phe Leu Asn Ala Phe Glu Asp Ser Phe Ser Ser
245 250 255
Ile Leu Ser Thr Glu Asp Pro Asn Gln Leu Thr Val Asn Ser Leu Asn
260 265 270
Ser Asp Ala Thr Val Asn Thr Asp Phe Gly Asp Glu Phe Tyr Ser Ala
275 280 285
Phe Ile Ala Glu Pro Ser Ile Ser Asn Ser Met Pro Ser Pro Ala Thr
290 295 300
Leu Ser His Ser Leu Ser Glu Leu Leu Asn Gly Pro Ile Asp Val Ser
305 310 315 320
Asp Leu Ser Leu Cys Lys Ala Phe Asn Gln Asn His Pro Glu Ser Thr
325 330 335
Ala Glu Phe Asn Asp Ser Asp Ser Gly Ile Ser Leu Asn Thr Ser Pro
340 345 350
Ser Val Ala Ser Pro Glu His Ser Val Glu Ser Ser Ser Tyr Gly Asp
355 360 365
Thr Leu Leu Gly Leu Ser Asp Ser Glu Val Glu Glu Leu Asp Ser Ala
370 375 380
Pro Gly Ser Val Lys Gln Asn Gly Pro Lys Thr Pro Val His Ser Ser
385 390 395 400
Gly Asp Met Val Gln Pro Leu Ser Pro Ser Gln Gly Gln Ser Thr His
405 410 415
Val His Asp Ala Gln Cys Glu Asn Thr Pro Glu Lys Glu Leu Pro Val
420 425 430
Ser Pro Gly His Arg Lys Thr Pro Phe Thr Lys Asp Lys His Ser Ser
435 440 445
Arg Leu Glu Ala His Leu Thr Arg Asp Glu Leu Arg Ala Lys Ala Leu
450 455 460
His Ile Pro Phe Pro Val Glu Lys Ile Ile Asn Leu Pro Val Val Asp
465 470 475 480
Phe Asn Glu Met Met Ser Lys Glu Gln Phe Asn Glu Ala Gln Leu Ala
485 490 495
Leu Ile Arg Asp Ile Arg Arg Arg Gly Lys Asn Lys Val Ala Ala Gln
500 505 510
Asn Cys Arg Lys Arg Lys Leu Glu Asn Ile Val Glu Leu Glu Gln Asp
515 520 525
Leu Asp His Leu Lys Asp Glu Lys Glu Lys Leu Leu Lys Glu Lys Gly
530 535 540
Glu Asn Asp Lys Ser Leu His Leu Leu Lys Lys Gln Leu Ser Thr Leu
545 550 555 560
Tyr Leu Glu Val Phe Ser Met Leu Arg Asp Glu Asp Gly Lys Pro Tyr
565 570 575
Ser Pro Ser Glu Tyr Ser Leu Gln Gln Thr Arg Asp Gly Asn Val Phe
580 585 590
Leu Val Pro Lys Ser Lys Lys Pro Asp Val Lys Lys Asn
595 600 605
<210> 50
<211> 2754
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hHK1
<400> 50
atgatcgccg cgcagctcct ggcctattac ttcacggagc tgaaggatga ccaggtcaaa 60
aagattgaca agtatctcta tgccatgcgg ctctccgatg aaactctcat agatatcatg 120
actcgcttca ggaaggagat gaagaatggc ctctcccggg attttaatcc aacagccaca 180
gtcaagatgt tgccaacatt cgtaaggtcc attcctgatg gctctgaaaa gggagatttc 240
attgccctgg atcttggtgg gtcttccttt cgaattctgc gggtgcaagt gaatcatgag 300
aaaaaccaga atgttcacat ggagtccgag gtttatgaca ccccagagaa catcgtgcac 360
ggcagtggaa gccagctttt tgatcatgtt gctgagtgcc tgggagattt catggagaaa 420
aggaagatca aggacaagaa gttacctgtg ggattcacgt tttcttttcc ttgccaacaa 480
tccaaaatag atgaggccat cctgatcacc tggacaaagc gatttaaagc gagcggagtg 540
gaaggagcag atgtggtcaa actgcttaac aaagccatca aaaagcgagg ggactatgat 600
gccaacatcg tagctgtggt gaatgacaca gtgggcacca tgatgacctg tggctatgac 660
gaccagcact gtgaagtcgg cctgatcatc ggcactggca ccaatgcttg ctacatggag 720
gaactgaggc acattgatct ggtggaagga gacgagggga ggatgtgtat caatacagaa 780
tggggagcct ttggagacga tggatcatta gaagacatcc ggacagagtt tgacagggag 840
atagaccggg gatccctcaa ccctggaaaa cagctgtttg agaagatggt cagtggcatg 900
tacttgggag agctggttcg actgatccta gtcaagatgg ccaaggaggg cctcttattt 960
gaagggcgga tcaccccgga gctgctcacc cgagggaagt ttaacaccag tgatgtgtca 1020
gccatcgaaa agaataagga aggcctccac aatgccaaag aaatcctgac ccgcctggga 1080
gtggagccgt ccgatgatga ctgtgtctca gtccagcacg tttgcaccat tgtctcattt 1140
cgctcagcca acttggtggc tgccacactg ggcgccatct tgaaccgcct gcgtgataac 1200
aagggcacac ccaggctgcg gaccacggtt ggtgtcgacg gatctcttta caagacgcac 1260
ccacagtatt cccggcgttt ccacaagact ctaaggcgct tggtgccaga ctccgatgtg 1320
cgcttcctcc tctcggagag tggcagcggc aagggggctg ccatggtgac ggcggtggcc 1380
taccgcttgg ccgagcagca ccggcagata gaggagaccc tggctcattt ccacctcacc 1440
aaggacatgc tgctggaggt gaagaagagg atgcgggccg agatggagct ggggctgagg 1500
aagcagacgc acaacaatgc cgtggttaag atgctgccct ccttcgtccg gagaactccc 1560
gacgggaccg agaatggtga cttcttggcc ctggatcttg gaggaaccaa tttccgtgtg 1620
ctgctggtga aaatccgtag tgggaaaaag agaacggtgg aaatgcacaa caagatctac 1680
gccattccta ttgaaatcat gcagggcact ggggaagagc tgtttgatca cattgtctcc 1740
tgcatctctg acttcttgga ctacatgggg atcaaaggcc ccaggatgcc tctgggcttc 1800
acgttctcat ttccctgcca gcagacgagt ctggacgcgg gaatcttgat cacgtggaca 1860
aagggtttta aggcaacaga ctgcgtgggc cacgatgtag tcaccttact aagggatgcg 1920
ataaaaagga gagaggaatt tgacctggac gtggtggctg tggtcaacga cacagtgggc 1980
accatgatga cctgtgctta tgaggagccc acctgtgagg ttggactcat tgttgggacc 2040
ggcagcaatg cctgctacat ggaggagatg aagaacgtgg agatggtgga gggggaccag 2100
gggcagatgt gcatcaacat ggagtggggg gcctttgggg acaacgggtg tctggatgat 2160
atcaggacac actacgacag actggtggac gaatattccc taaatgctgg gaaacaaagg 2220
tatgagaaga tgatcagtgg tatgtacctg ggtgaaatcg tccgcaacat cttaatcgac 2280
ttcaccaaga agggattcct cttccgaggg cagatctctg agacgctgaa gacccggggc 2340
atctttgaga ccaagtttct ctctcagatc gagagtgacc gattagcact gctccaggtc 2400
cgggctatcc tccagcagct aggtctgaat agcacctgcg atgacagtat cctcgtcaag 2460
acagtgtgcg gggtggtgtc caggagggcc gcacagctgt gtggcgcagg catggctgcg 2520
gttgtggata agatccgcga gaacagagga ctggaccgtc tgaatgtgac tgtgggagtg 2580
gacgggacac tctacaagct tcatccacac ttctccagaa tcatgcacca gacggtgaag 2640
gaactgtcac caaaatgtaa cgtgtccttc ctcctgtctg aggatggcag cggcaagggg 2700
gccgccctca tcacggccgt gggcgtgcgg ttacgcacag aggcaagcag ctaa 2754
<210> 51
<211> 917
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hHK1
<400> 51
Met Ile Ala Ala Gln Leu Leu Ala Tyr Tyr Phe Thr Glu Leu Lys Asp
1 5 10 15
Asp Gln Val Lys Lys Ile Asp Lys Tyr Leu Tyr Ala Met Arg Leu Ser
20 25 30
Asp Glu Thr Leu Ile Asp Ile Met Thr Arg Phe Arg Lys Glu Met Lys
35 40 45
Asn Gly Leu Ser Arg Asp Phe Asn Pro Thr Ala Thr Val Lys Met Leu
50 55 60
Pro Thr Phe Val Arg Ser Ile Pro Asp Gly Ser Glu Lys Gly Asp Phe
65 70 75 80
Ile Ala Leu Asp Leu Gly Gly Ser Ser Phe Arg Ile Leu Arg Val Gln
85 90 95
Val Asn His Glu Lys Asn Gln Asn Val His Met Glu Ser Glu Val Tyr
100 105 110
Asp Thr Pro Glu Asn Ile Val His Gly Ser Gly Ser Gln Leu Phe Asp
115 120 125
His Val Ala Glu Cys Leu Gly Asp Phe Met Glu Lys Arg Lys Ile Lys
130 135 140
Asp Lys Lys Leu Pro Val Gly Phe Thr Phe Ser Phe Pro Cys Gln Gln
145 150 155 160
Ser Lys Ile Asp Glu Ala Ile Leu Ile Thr Trp Thr Lys Arg Phe Lys
165 170 175
Ala Ser Gly Val Glu Gly Ala Asp Val Val Lys Leu Leu Asn Lys Ala
180 185 190
Ile Lys Lys Arg Gly Asp Tyr Asp Ala Asn Ile Val Ala Val Val Asn
195 200 205
Asp Thr Val Gly Thr Met Met Thr Cys Gly Tyr Asp Asp Gln His Cys
210 215 220
Glu Val Gly Leu Ile Ile Gly Thr Gly Thr Asn Ala Cys Tyr Met Glu
225 230 235 240
Glu Leu Arg His Ile Asp Leu Val Glu Gly Asp Glu Gly Arg Met Cys
245 250 255
Ile Asn Thr Glu Trp Gly Ala Phe Gly Asp Asp Gly Ser Leu Glu Asp
260 265 270
Ile Arg Thr Glu Phe Asp Arg Glu Ile Asp Arg Gly Ser Leu Asn Pro
275 280 285
Gly Lys Gln Leu Phe Glu Lys Met Val Ser Gly Met Tyr Leu Gly Glu
290 295 300
Leu Val Arg Leu Ile Leu Val Lys Met Ala Lys Glu Gly Leu Leu Phe
305 310 315 320
Glu Gly Arg Ile Thr Pro Glu Leu Leu Thr Arg Gly Lys Phe Asn Thr
325 330 335
Ser Asp Val Ser Ala Ile Glu Lys Asn Lys Glu Gly Leu His Asn Ala
340 345 350
Lys Glu Ile Leu Thr Arg Leu Gly Val Glu Pro Ser Asp Asp Asp Cys
355 360 365
Val Ser Val Gln His Val Cys Thr Ile Val Ser Phe Arg Ser Ala Asn
370 375 380
Leu Val Ala Ala Thr Leu Gly Ala Ile Leu Asn Arg Leu Arg Asp Asn
385 390 395 400
Lys Gly Thr Pro Arg Leu Arg Thr Thr Val Gly Val Asp Gly Ser Leu
405 410 415
Tyr Lys Thr His Pro Gln Tyr Ser Arg Arg Phe His Lys Thr Leu Arg
420 425 430
Arg Leu Val Pro Asp Ser Asp Val Arg Phe Leu Leu Ser Glu Ser Gly
435 440 445
Ser Gly Lys Gly Ala Ala Met Val Thr Ala Val Ala Tyr Arg Leu Ala
450 455 460
Glu Gln His Arg Gln Ile Glu Glu Thr Leu Ala His Phe His Leu Thr
465 470 475 480
Lys Asp Met Leu Leu Glu Val Lys Lys Arg Met Arg Ala Glu Met Glu
485 490 495
Leu Gly Leu Arg Lys Gln Thr His Asn Asn Ala Val Val Lys Met Leu
500 505 510
Pro Ser Phe Val Arg Arg Thr Pro Asp Gly Thr Glu Asn Gly Asp Phe
515 520 525
Leu Ala Leu Asp Leu Gly Gly Thr Asn Phe Arg Val Leu Leu Val Lys
530 535 540
Ile Arg Ser Gly Lys Lys Arg Thr Val Glu Met His Asn Lys Ile Tyr
545 550 555 560
Ala Ile Pro Ile Glu Ile Met Gln Gly Thr Gly Glu Glu Leu Phe Asp
565 570 575
His Ile Val Ser Cys Ile Ser Asp Phe Leu Asp Tyr Met Gly Ile Lys
580 585 590
Gly Pro Arg Met Pro Leu Gly Phe Thr Phe Ser Phe Pro Cys Gln Gln
595 600 605
Thr Ser Leu Asp Ala Gly Ile Leu Ile Thr Trp Thr Lys Gly Phe Lys
610 615 620
Ala Thr Asp Cys Val Gly His Asp Val Val Thr Leu Leu Arg Asp Ala
625 630 635 640
Ile Lys Arg Arg Glu Glu Phe Asp Leu Asp Val Val Ala Val Val Asn
645 650 655
Asp Thr Val Gly Thr Met Met Thr Cys Ala Tyr Glu Glu Pro Thr Cys
660 665 670
Glu Val Gly Leu Ile Val Gly Thr Gly Ser Asn Ala Cys Tyr Met Glu
675 680 685
Glu Met Lys Asn Val Glu Met Val Glu Gly Asp Gln Gly Gln Met Cys
690 695 700
Ile Asn Met Glu Trp Gly Ala Phe Gly Asp Asn Gly Cys Leu Asp Asp
705 710 715 720
Ile Arg Thr His Tyr Asp Arg Leu Val Asp Glu Tyr Ser Leu Asn Ala
725 730 735
Gly Lys Gln Arg Tyr Glu Lys Met Ile Ser Gly Met Tyr Leu Gly Glu
740 745 750
Ile Val Arg Asn Ile Leu Ile Asp Phe Thr Lys Lys Gly Phe Leu Phe
755 760 765
Arg Gly Gln Ile Ser Glu Thr Leu Lys Thr Arg Gly Ile Phe Glu Thr
770 775 780
Lys Phe Leu Ser Gln Ile Glu Ser Asp Arg Leu Ala Leu Leu Gln Val
785 790 795 800
Arg Ala Ile Leu Gln Gln Leu Gly Leu Asn Ser Thr Cys Asp Asp Ser
805 810 815
Ile Leu Val Lys Thr Val Cys Gly Val Val Ser Arg Arg Ala Ala Gln
820 825 830
Leu Cys Gly Ala Gly Met Ala Ala Val Val Asp Lys Ile Arg Glu Asn
835 840 845
Arg Gly Leu Asp Arg Leu Asn Val Thr Val Gly Val Asp Gly Thr Leu
850 855 860
Tyr Lys Leu His Pro His Phe Ser Arg Ile Met His Gln Thr Val Lys
865 870 875 880
Glu Leu Ser Pro Lys Cys Asn Val Ser Phe Leu Leu Ser Glu Asp Gly
885 890 895
Ser Gly Lys Gly Ala Ala Leu Ile Thr Ala Val Gly Val Arg Leu Arg
900 905 910
Thr Glu Ala Ser Ser
915
<210> 52
<211> 1578
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hPDI
<400> 52
atgagccgcc agcttctgcc tgtactgctg ctgctgctgc tcagggcttc gtgcccatgg 60
ggtcaggaac agggagcgag gagcccctcg gaggagcctc cagaggagga aatccccaag 120
gaggatggga tcttggtgct gagccgccac accctgggcc tggccctgcg ggagcaccct 180
gccctgctgg tggaattcta tgccccgtgg tgtgggcact gccaggccct ggcccccgag 240
tacagcaagg cagctgccgt gctcgcggcc gagtcaatgg tggtcacgct ggccaaggtg 300
gatgggcccg cgcagcgcga gctggctgag gagtttggtg tgacggagta ccctacgctc 360
aagttcttcc gcaatgggaa ccgcacgcac ccggaggagt acacaggacc acgggacgct 420
gagggcattg ccgagtggct gcgacggcgg gtggggccca gtgccatgcg gctggaggac 480
gaggcggccg cccaggcgct gatcggtggc cgggacctag tggtcattgg cttcttccag 540
gacctgcagg acgaggacgt ggccaccttc ttggccttgg cccaggacgc cctggacatg 600
acctttggcc tcacagaccg gccgcggctc tttcagcagt ttggcctcac caaggacact 660
gtggttctct tcaagaagtt tgatgagggg cgggcagact tccccgtgga cgaggagctt 720
ggcctggacc tgggggatct gtcgcgcttc ctggtcacac acagcatgcg cctggtcacg 780
gagttcaaca gccagacgtc tgccaagatc ttcgcggcca ggatcctcaa ccacctgctg 840
ctgtttgtca accagacgct ggctgcgcac cgggagctcc tagcgggctt tggggaggca 900
gctccccgct tccgggggca ggtgctgttc gtggtggtgg acgtggcggc cgacaatgag 960
cacgtgctgc agtactttgg actcaaggct gaggcagccc ccactctgcg cttggtcaac 1020
cttgaaacca ctaagaagta tgcgcctgtg gatgggggcc ctgtcaccgc agcgtccatc 1080
actgctttct gccatgcagt cctcaacggc caagtcaagc cctatctcct gagccaggag 1140
ataccccctg attgggatca gcggccagtt aagaccctcg tgggcaagaa ttttgagcag 1200
gtggcttttg acgaaaccaa gaatgtgttt gtcaagttct atgccccgtg gtgcacccac 1260
tgcaaggaga tggcccctgc ctgggaggca ttggctgaga agtaccaaga ccacgaggac 1320
atcatcattg ctgagctgga tgccacggcc aacgagctgg atgccttcgc tgtgcacggc 1380
ttccctactc tcaagtactt cccagcaggg ccaggtcgga aggtgattga atacaaaagc 1440
accagggacc tggagacttt ctccaagttc ctggacaacg ggggcgtgct gcccacggag 1500
gagcccccgg aggagccagc agccccgttc ccggagccac cggccaactc cactatgggg 1560
tccaaggagg aactgtag 1578
<210> 53
<211> 525
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hPDI
<400> 53
Met Ser Arg Gln Leu Leu Pro Val Leu Leu Leu Leu Leu Leu Arg Ala
1 5 10 15
Ser Cys Pro Trp Gly Gln Glu Gln Gly Ala Arg Ser Pro Ser Glu Glu
20 25 30
Pro Pro Glu Glu Glu Ile Pro Lys Glu Asp Gly Ile Leu Val Leu Ser
35 40 45
Arg His Thr Leu Gly Leu Ala Leu Arg Glu His Pro Ala Leu Leu Val
50 55 60
Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Gln Ala Leu Ala Pro Glu
65 70 75 80
Tyr Ser Lys Ala Ala Ala Val Leu Ala Ala Glu Ser Met Val Val Thr
85 90 95
Leu Ala Lys Val Asp Gly Pro Ala Gln Arg Glu Leu Ala Glu Glu Phe
100 105 110
Gly Val Thr Glu Tyr Pro Thr Leu Lys Phe Phe Arg Asn Gly Asn Arg
115 120 125
Thr His Pro Glu Glu Tyr Thr Gly Pro Arg Asp Ala Glu Gly Ile Ala
130 135 140
Glu Trp Leu Arg Arg Arg Val Gly Pro Ser Ala Met Arg Leu Glu Asp
145 150 155 160
Glu Ala Ala Ala Gln Ala Leu Ile Gly Gly Arg Asp Leu Val Val Ile
165 170 175
Gly Phe Phe Gln Asp Leu Gln Asp Glu Asp Val Ala Thr Phe Leu Ala
180 185 190
Leu Ala Gln Asp Ala Leu Asp Met Thr Phe Gly Leu Thr Asp Arg Pro
195 200 205
Arg Leu Phe Gln Gln Phe Gly Leu Thr Lys Asp Thr Val Val Leu Phe
210 215 220
Lys Lys Phe Asp Glu Gly Arg Ala Asp Phe Pro Val Asp Glu Glu Leu
225 230 235 240
Gly Leu Asp Leu Gly Asp Leu Ser Arg Phe Leu Val Thr His Ser Met
245 250 255
Arg Leu Val Thr Glu Phe Asn Ser Gln Thr Ser Ala Lys Ile Phe Ala
260 265 270
Ala Arg Ile Leu Asn His Leu Leu Leu Phe Val Asn Gln Thr Leu Ala
275 280 285
Ala His Arg Glu Leu Leu Ala Gly Phe Gly Glu Ala Ala Pro Arg Phe
290 295 300
Arg Gly Gln Val Leu Phe Val Val Val Asp Val Ala Ala Asp Asn Glu
305 310 315 320
His Val Leu Gln Tyr Phe Gly Leu Lys Ala Glu Ala Ala Pro Thr Leu
325 330 335
Arg Leu Val Asn Leu Glu Thr Thr Lys Lys Tyr Ala Pro Val Asp Gly
340 345 350
Gly Pro Val Thr Ala Ala Ser Ile Thr Ala Phe Cys His Ala Val Leu
355 360 365
Asn Gly Gln Val Lys Pro Tyr Leu Leu Ser Gln Glu Ile Pro Pro Asp
370 375 380
Trp Asp Gln Arg Pro Val Lys Thr Leu Val Gly Lys Asn Phe Glu Gln
385 390 395 400
Val Ala Phe Asp Glu Thr Lys Asn Val Phe Val Lys Phe Tyr Ala Pro
405 410 415
Trp Cys Thr His Cys Lys Glu Met Ala Pro Ala Trp Glu Ala Leu Ala
420 425 430
Glu Lys Tyr Gln Asp His Glu Asp Ile Ile Ile Ala Glu Leu Asp Ala
435 440 445
Thr Ala Asn Glu Leu Asp Ala Phe Ala Val His Gly Phe Pro Thr Leu
450 455 460
Lys Tyr Phe Pro Ala Gly Pro Gly Arg Lys Val Ile Glu Tyr Lys Ser
465 470 475 480
Thr Arg Asp Leu Glu Thr Phe Ser Lys Phe Leu Asp Asn Gly Gly Val
485 490 495
Leu Pro Thr Glu Glu Pro Pro Glu Glu Pro Ala Ala Pro Phe Pro Glu
500 505 510
Pro Pro Ala Asn Ser Thr Met Gly Ser Lys Glu Glu Leu
515 520 525
<210> 54
<211> 492
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hPIN1
<400> 54
atggcggacg aggagaagct gccgcccggc tgggagaagc gcatgagccg cagctcaggc 60
cgagtgtact acttcaacca catcactaac gccagccagt gggagcggcc cagcggcaac 120
agcagcagtg gtggcaaaaa cgggcagggg gagcctgcca gggtccgctg ctcgcacctg 180
ctggtgaagc acagccagtc acggcggccc tcgtcctggc ggcaggagaa gatcacccgg 240
accaaggagg aggccctgga gctgatcaac ggctacatcc agaagatcaa gtcgggagag 300
gaggactttg agtctctggc ctcacagttc agcgactgca gctcagccaa ggccagggga 360
gacctgggtg ccttcagcag aggtcagatg cagaagccat ttgaagacgc ctcgtttgcg 420
ctgcggacgg gggagatgag cgggcccgtg ttcacggatt ccggcatcca catcatcctc 480
cgcactgagt ga 492
<210> 55
<211> 163
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hPIN1
<400> 55
Met Ala Asp Glu Glu Lys Leu Pro Pro Gly Trp Glu Lys Arg Met Ser
1 5 10 15
Arg Ser Ser Gly Arg Val Tyr Tyr Phe Asn His Ile Thr Asn Ala Ser
20 25 30
Gln Trp Glu Arg Pro Ser Gly Asn Ser Ser Ser Gly Gly Lys Asn Gly
35 40 45
Gln Gly Glu Pro Ala Arg Val Arg Cys Ser His Leu Leu Val Lys His
50 55 60
Ser Gln Ser Arg Arg Pro Ser Ser Trp Arg Gln Glu Lys Ile Thr Arg
65 70 75 80
Thr Lys Glu Glu Ala Leu Glu Leu Ile Asn Gly Tyr Ile Gln Lys Ile
85 90 95
Lys Ser Gly Glu Glu Asp Phe Glu Ser Leu Ala Ser Gln Phe Ser Asp
100 105 110
Cys Ser Ser Ala Lys Ala Arg Gly Asp Leu Gly Ala Phe Ser Arg Gly
115 120 125
Gln Met Gln Lys Pro Phe Glu Asp Ala Ser Phe Ala Leu Arg Thr Gly
130 135 140
Glu Met Ser Gly Pro Val Phe Thr Asp Ser Gly Ile His Ile Ile Leu
145 150 155 160
Arg Thr Glu
<210> 56
<211> 264
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hSEPW1
<400> 56
atggctctcg ccgtccgagt cgtttattgt ggcgcttgag gctacaagtc caagtatctt 60
cagctcaaga agaagttaga agatgagttc cccggccgcc tggacatctg cggcgaggga 120
actccccagg ccaccgggtt ctttgaagtg atggtagccg ggaagttgat tcactctaag 180
aagaaaggcg atggctacgt ggacacagaa agcaagtttc tgaagttggt ggccgccatc 240
aaagccgcct tggctcaggg ctaa 264
<210> 57
<211> 87
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hSEPW1
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> Special amino acid selenocysteine (U)
<400> 57
Met Ala Leu Ala Val Arg Val Val Tyr Cys Gly Ala Xaa Gly Tyr Lys
1 5 10 15
Ser Lys Tyr Leu Gln Leu Lys Lys Lys Leu Glu Asp Glu Phe Pro Gly
20 25 30
Arg Leu Asp Ile Cys Gly Glu Gly Thr Pro Gln Ala Thr Gly Phe Phe
35 40 45
Glu Val Met Val Ala Gly Lys Leu Ile His Ser Lys Lys Lys Gly Asp
50 55 60
Gly Tyr Val Asp Thr Glu Ser Lys Phe Leu Lys Leu Val Ala Ala Ile
65 70 75 80
Lys Ala Ala Leu Ala Gln Gly
85
<210> 58
<211> 1254
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hCALR
<400> 58
atgctgctat ccgtgccgct gctgctcggc ctcctcggcc tggccgtcgc cgagcctgcc 60
gtctacttca aggagcagtt tctggacgga gacgggtgga cttcccgctg gatcgaatcc 120
aaacacaagt cagattttgg caaattcgtt ctcagttccg gcaagttcta cggtgacgag 180
gagaaagata aaggtttgca gacaagccag gatgcacgct tttatgctct gtcggccagt 240
ttcgagcctt tcagcaacaa aggccagacg ctggtggtgc agttcacggt gaaacatgag 300
cagaacatcg actgtggggg cggctatgtg aagctgtttc ctaatagttt ggaccagaca 360
gacatgcacg gagactcaga atacaacatc atgtttggtc ccgacatctg tggccctggc 420
accaagaagg ttcatgtcat cttcaactac aagggcaaga acgtgctgat caacaaggac 480
atccgttgca aggatgatga gtttacacac ctgtacacac tgattgtgcg gccagacaac 540
acctatgagg tgaagattga caacagccag gtggagtccg gctccttgga agacgattgg 600
gacttcctgc cacccaagaa gataaaggat cctgatgctt caaaaccgga agactgggat 660
gagcgggcca agatcgatga tcccacagac tccaagcctg aggactggga caagcccgag 720
catatccctg accctgatgc taagaagccc gaggactggg atgaagagat ggacggagag 780
tgggaacccc cagtgattca gaaccctgag tacaagggtg agtggaagcc ccggcagatc 840
gacaacccag attacaaggg cacttggatc cacccagaaa ttgacaaccc cgagtattct 900
cccgatccca gtatctatgc ctatgataac tttggcgtgc tgggcctgga cctctggcag 960
gtcaagtctg gcaccatctt tgacaacttc ctcatcacca acgatgaggc atacgctgag 1020
gagtttggca acgagacgtg gggcgtaaca aaggcagcag agaaacaaat gaaggacaaa 1080
caggacgagg agcagaggct taaggaggag gaagaagaca agaaacgcaa agaggaggag 1140
gaggcagagg acaaggagga tgatgaggac aaagatgagg atgaggagga tgaggaggac 1200
aaggaggaag atgaggagga agatgtcccc ggccaggcca aggacgagct gtag 1254
<210> 59
<211> 417
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hCALR
<400> 59
Met Leu Leu Ser Val Pro Leu Leu Leu Gly Leu Leu Gly Leu Ala Val
1 5 10 15
Ala Glu Pro Ala Val Tyr Phe Lys Glu Gln Phe Leu Asp Gly Asp Gly
20 25 30
Trp Thr Ser Arg Trp Ile Glu Ser Lys His Lys Ser Asp Phe Gly Lys
35 40 45
Phe Val Leu Ser Ser Gly Lys Phe Tyr Gly Asp Glu Glu Lys Asp Lys
50 55 60
Gly Leu Gln Thr Ser Gln Asp Ala Arg Phe Tyr Ala Leu Ser Ala Ser
65 70 75 80
Phe Glu Pro Phe Ser Asn Lys Gly Gln Thr Leu Val Val Gln Phe Thr
85 90 95
Val Lys His Glu Gln Asn Ile Asp Cys Gly Gly Gly Tyr Val Lys Leu
100 105 110
Phe Pro Asn Ser Leu Asp Gln Thr Asp Met His Gly Asp Ser Glu Tyr
115 120 125
Asn Ile Met Phe Gly Pro Asp Ile Cys Gly Pro Gly Thr Lys Lys Val
130 135 140
His Val Ile Phe Asn Tyr Lys Gly Lys Asn Val Leu Ile Asn Lys Asp
145 150 155 160
Ile Arg Cys Lys Asp Asp Glu Phe Thr His Leu Tyr Thr Leu Ile Val
165 170 175
Arg Pro Asp Asn Thr Tyr Glu Val Lys Ile Asp Asn Ser Gln Val Glu
180 185 190
Ser Gly Ser Leu Glu Asp Asp Trp Asp Phe Leu Pro Pro Lys Lys Ile
195 200 205
Lys Asp Pro Asp Ala Ser Lys Pro Glu Asp Trp Asp Glu Arg Ala Lys
210 215 220
Ile Asp Asp Pro Thr Asp Ser Lys Pro Glu Asp Trp Asp Lys Pro Glu
225 230 235 240
His Ile Pro Asp Pro Asp Ala Lys Lys Pro Glu Asp Trp Asp Glu Glu
245 250 255
Met Asp Gly Glu Trp Glu Pro Pro Val Ile Gln Asn Pro Glu Tyr Lys
260 265 270
Gly Glu Trp Lys Pro Arg Gln Ile Asp Asn Pro Asp Tyr Lys Gly Thr
275 280 285
Trp Ile His Pro Glu Ile Asp Asn Pro Glu Tyr Ser Pro Asp Pro Ser
290 295 300
Ile Tyr Ala Tyr Asp Asn Phe Gly Val Leu Gly Leu Asp Leu Trp Gln
305 310 315 320
Val Lys Ser Gly Thr Ile Phe Asp Asn Phe Leu Ile Thr Asn Asp Glu
325 330 335
Ala Tyr Ala Glu Glu Phe Gly Asn Glu Thr Trp Gly Val Thr Lys Ala
340 345 350
Ala Glu Lys Gln Met Lys Asp Lys Gln Asp Glu Glu Gln Arg Leu Lys
355 360 365
Glu Glu Glu Glu Asp Lys Lys Arg Lys Glu Glu Glu Glu Ala Glu Asp
370 375 380
Lys Glu Asp Asp Glu Asp Lys Asp Glu Asp Glu Glu Asp Glu Glu Asp
385 390 395 400
Lys Glu Glu Asp Glu Glu Glu Asp Val Pro Gly Gln Ala Lys Asp Glu
405 410 415
Leu
<210> 60
<211> 656
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> DroBiP
<400> 60
Met Lys Phe Pro Met Val Ala Ala Ala Leu Leu Leu Leu Cys Ala Val
1 5 10 15
Arg Ala Glu Glu Lys Lys Glu Lys Asp Lys Glu Leu Gly Thr Val Ile
20 25 30
Gly Ile Asp Leu Gly Thr Thr Tyr Ser Cys Val Gly Val Tyr Lys Asn
35 40 45
Gly Arg Val Glu Ile Ile Ala Asn Asp Gln Gly Asn Arg Ile Thr Pro
50 55 60
Ser Tyr Val Ala Phe Thr Ala Asp Gly Glu Arg Leu Ile Gly Asp Ala
65 70 75 80
Ala Lys Asn Gln Leu Thr Thr Asn Pro Glu Asn Thr Val Phe Asp Ala
85 90 95
Lys Arg Leu Ile Gly Arg Glu Trp Ser Asp Thr Asn Val Gln His Asp
100 105 110
Ile Lys Phe Phe Pro Phe Lys Val Val Glu Lys Asn Ser Lys Pro His
115 120 125
Ile Ser Val Asp Thr Ser Gln Gly Ala Lys Val Phe Ala Pro Glu Glu
130 135 140
Ile Ser Ala Met Val Leu Gly Lys Met Lys Glu Thr Ala Glu Ala Tyr
145 150 155 160
Leu Gly Lys Lys Val Thr His Ala Val Val Thr Val Pro Ala Tyr Phe
165 170 175
Asn Asp Ala Gln Arg Gln Ala Thr Lys Asp Ala Gly Val Ile Ala Gly
180 185 190
Leu Gln Val Met Arg Ile Ile Asn Glu Pro Thr Ala Ala Ala Ile Ala
195 200 205
Tyr Gly Leu Asp Lys Lys Glu Gly Glu Lys Asn Val Leu Val Phe Asp
210 215 220
Leu Gly Gly Gly Thr Phe Asp Val Ser Leu Leu Thr Ile Asp Asn Gly
225 230 235 240
Val Phe Glu Val Val Ala Thr Asn Gly Asp Thr His Leu Gly Gly Glu
245 250 255
Asp Phe Asp Gln Arg Val Met Asp His Phe Ile Lys Leu Tyr Lys Lys
260 265 270
Lys Lys Gly Lys Asp Ile Arg Lys Asp Asn Arg Ala Val Gln Lys Leu
275 280 285
Arg Arg Glu Val Glu Lys Ala Lys Arg Ala Leu Ser Gly Ser His Gln
290 295 300
Val Arg Ile Glu Ile Glu Ser Phe Phe Glu Gly Asp Asp Phe Ser Glu
305 310 315 320
Thr Leu Thr Arg Ala Lys Phe Glu Glu Leu Asn Leu Asp Leu Phe Arg
325 330 335
Ser Thr Leu Lys Pro Val Gln Lys Val Leu Glu Asp Ala Asp Met Asn
340 345 350
Lys Lys Asp Val His Glu Ile Val Leu Val Gly Gly Ser Thr Arg Ile
355 360 365
Pro Lys Val Gln Gln Leu Val Lys Asp Phe Phe Gly Gly Lys Glu Pro
370 375 380
Ser Arg Gly Ile Asn Pro Asp Glu Ala Val Ala Tyr Gly Ala Ala Val
385 390 395 400
Gln Ala Gly Val Leu Ser Gly Glu Gln Asp Thr Asp Ala Ile Val Leu
405 410 415
Leu Asp Val Asn Pro Leu Thr Met Gly Ile Glu Thr Val Gly Gly Val
420 425 430
Met Thr Lys Leu Ile Pro Arg Asn Thr Val Ile Pro Thr Lys Lys Ser
435 440 445
Gln Val Phe Ser Thr Ala Ser Asp Asn Gln His Thr Val Thr Ile Gln
450 455 460
Val Tyr Glu Gly Glu Arg Pro Met Thr Lys Asp Asn His Leu Leu Gly
465 470 475 480
Lys Phe Asp Leu Thr Gly Ile Pro Pro Ala Pro Arg Gly Ile Pro Gln
485 490 495
Ile Glu Val Ser Phe Glu Ile Asp Ala Asn Gly Ile Leu Gln Val Ser
500 505 510
Ala Glu Asp Lys Gly Thr Gly Asn Lys Glu Lys Ile Val Ile Thr Asn
515 520 525
Asp Gln Asn Arg Leu Thr Pro Glu Asp Ile Asp Arg Met Ile Arg Asp
530 535 540
Ala Glu Lys Phe Ala Asp Glu Asp Lys Lys Leu Lys Glu Arg Val Glu
545 550 555 560
Ser Arg Asn Glu Leu Glu Ser Tyr Ala Tyr Ser Leu Lys Asn Gln Ile
565 570 575
Gly Asp Lys Asp Lys Leu Gly Ala Lys Leu Ser Asp Asp Glu Lys Asn
580 585 590
Lys Leu Glu Ser Ala Ile Asp Glu Ser Ile Lys Trp Leu Glu Gln Asn
595 600 605
Pro Asp Ala Asp Pro Glu Glu Tyr Lys Lys Gln Lys Lys Asp Leu Glu
610 615 620
Ala Ile Val Gln Pro Val Ile Ala Lys Leu Tyr Gln Gly Ala Gly Gly
625 630 635 640
Ala Pro Pro Pro Glu Gly Gly Asp Asp Ala Asp Leu Lys Asp Glu Leu
645 650 655
<210> 61
<211> 1371
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hDDOST
<400> 61
atggggtact tccggtgtgc aggtgctggg tccttcggca ggaggaggaa gatggagccc 60
agcaccgcgg cccgggcttg ggccctcttt tggttgctgc tgcccttgct tggcgcggtt 120
tgcgccagcg gaccccgcac cttagtgctg ctggacaacc tcaacgtgcg ggagactcat 180
tcgcttttct tccggagcct gaaggaccgg ggctttgagc tcacattcaa gaccgctgat 240
gaccccagcc tgtctctcat aaagtatggg gaattcctct atgacaatct catcattttc 300
tccccttcgg tagaagattt tggaggcaac atcaacgtgg agaccatcag tgcctttatt 360
gacggcggag gcagtgtgct ggtagctgcc agctccgaca ttggtgaccc tcttcgagag 420
ctgggcagtg agtgcgggat tgagtttgac gaggagaaaa cggctgtcat tgaccatcac 480
aactatgaca tctcagacct tggccagcat acgctcatcg tggctgacac tgagaacctg 540
ctgaaggccc caaccatcgt tgggaaatca tctctaaatc ccatcctctt tcgaggtgtt 600
gggatggtgg ccgatcctga taaccctttg gtgctggaca tcctgacggg ctcttccacc 660
tcttactcct tcttcccgga caagcctatc acccagtatc cacatgcggt ggggaagaac 720
accctcctca ttgctgggct ccaggccagg aacaatgccc gcgtcatctt cagcggctcc 780
ctcgacttct tcagcgactc cttcttcaac tcagcagtgc agaaggcggc gcccggctcc 840
cagaggtatt cccagacagg caactatgaa ctagctgtgg ccctctcccg ctgggtgttc 900
aaggaggagg gtgtcctccg tgtggggcct gtgtcccatc atcgggtggg cgagacagcc 960
ccacccaatg cctacactgt cactgaccta gtggagtata gcatcgtgat ccagcagctc 1020
tcaaatggca aatgggtccc ctttgatggc gatgacattc agctggagtt tgtccgcatt 1080
gatccttttg tgaggacctt cctgaagaag aaaggtggca aatacagtgt tcagttcaag 1140
ttgcccgacg tgtatggtgt attccagttt aaagtggatt acaaccggct aggctacaca 1200
cacctgtact cttccactca ggtatccgtg cggccactcc agcacacgca gtatgagcgc 1260
ttcatcccct cggcctaccc ctactacgcc agcgccttct ccatgatgct ggggctcttc 1320
atcttcagca tcgtcttctt gcacatgaag gagaaggaga agtccgactg a 1371
<210> 62
<211> 456
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hDDOST
<400> 62
Met Gly Tyr Phe Arg Cys Ala Gly Ala Gly Ser Phe Gly Arg Arg Arg
1 5 10 15
Lys Met Glu Pro Ser Thr Ala Ala Arg Ala Trp Ala Leu Phe Trp Leu
20 25 30
Leu Leu Pro Leu Leu Gly Ala Val Cys Ala Ser Gly Pro Arg Thr Leu
35 40 45
Val Leu Leu Asp Asn Leu Asn Val Arg Glu Thr His Ser Leu Phe Phe
50 55 60
Arg Ser Leu Lys Asp Arg Gly Phe Glu Leu Thr Phe Lys Thr Ala Asp
65 70 75 80
Asp Pro Ser Leu Ser Leu Ile Lys Tyr Gly Glu Phe Leu Tyr Asp Asn
85 90 95
Leu Ile Ile Phe Ser Pro Ser Val Glu Asp Phe Gly Gly Asn Ile Asn
100 105 110
Val Glu Thr Ile Ser Ala Phe Ile Asp Gly Gly Gly Ser Val Leu Val
115 120 125
Ala Ala Ser Ser Asp Ile Gly Asp Pro Leu Arg Glu Leu Gly Ser Glu
130 135 140
Cys Gly Ile Glu Phe Asp Glu Glu Lys Thr Ala Val Ile Asp His His
145 150 155 160
Asn Tyr Asp Ile Ser Asp Leu Gly Gln His Thr Leu Ile Val Ala Asp
165 170 175
Thr Glu Asn Leu Leu Lys Ala Pro Thr Ile Val Gly Lys Ser Ser Leu
180 185 190
Asn Pro Ile Leu Phe Arg Gly Val Gly Met Val Ala Asp Pro Asp Asn
195 200 205
Pro Leu Val Leu Asp Ile Leu Thr Gly Ser Ser Thr Ser Tyr Ser Phe
210 215 220
Phe Pro Asp Lys Pro Ile Thr Gln Tyr Pro His Ala Val Gly Lys Asn
225 230 235 240
Thr Leu Leu Ile Ala Gly Leu Gln Ala Arg Asn Asn Ala Arg Val Ile
245 250 255
Phe Ser Gly Ser Leu Asp Phe Phe Ser Asp Ser Phe Phe Asn Ser Ala
260 265 270
Val Gln Lys Ala Ala Pro Gly Ser Gln Arg Tyr Ser Gln Thr Gly Asn
275 280 285
Tyr Glu Leu Ala Val Ala Leu Ser Arg Trp Val Phe Lys Glu Glu Gly
290 295 300
Val Leu Arg Val Gly Pro Val Ser His His Arg Val Gly Glu Thr Ala
305 310 315 320
Pro Pro Asn Ala Tyr Thr Val Thr Asp Leu Val Glu Tyr Ser Ile Val
325 330 335
Ile Gln Gln Leu Ser Asn Gly Lys Trp Val Pro Phe Asp Gly Asp Asp
340 345 350
Ile Gln Leu Glu Phe Val Arg Ile Asp Pro Phe Val Arg Thr Phe Leu
355 360 365
Lys Lys Lys Gly Gly Lys Tyr Ser Val Gln Phe Lys Leu Pro Asp Val
370 375 380
Tyr Gly Val Phe Gln Phe Lys Val Asp Tyr Asn Arg Leu Gly Tyr Thr
385 390 395 400
His Leu Tyr Ser Ser Thr Gln Val Ser Val Arg Pro Leu Gln His Thr
405 410 415
Gln Tyr Glu Arg Phe Ile Pro Ser Ala Tyr Pro Tyr Tyr Ala Ser Ala
420 425 430
Phe Ser Met Met Leu Gly Leu Phe Ile Phe Ser Ile Val Phe Leu His
435 440 445
Met Lys Glu Lys Glu Lys Ser Asp
450 455
<210> 63
<211> 1023
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hHSP40
<400> 63
atgggtaaag actactacca gacgttgggc ctggcccgcg gcgcgtcgga cgaggagatc 60
aagcgggcct accgccgcca ggcgctgcgc taccacccgg acaagaacaa ggagcccggc 120
gccgaggaga agttcaagga gatcgctgag gcctacgacg tgctcagcga cccgcgcaag 180
cgcgagatct tcgaccgcta cggggaggaa ggcctaaagg ggagtggccc cagtggcggt 240
agcggcggtg gtgccaatgg tacctctttc agctacacat tccatggaga ccctcatgcc 300
atgtttgctg agttcttcgg tggcagaaat ccctttgaca ccttttttgg gcagcggaac 360
ggggaggaag gcatggacat tgatgaccca ttctctggct tccctatggg catgggtggc 420
ttcaccaacg tgaactttgg ccgctcccgc tctgcccaag agcccgcccg aaagaagcaa 480
gatcccccag tcacccacga ccttcgagtc tcccttgaag agatctacag cggctgtacc 540
aagaagatga aaatctccca caagcggcta aaccccgacg gaaagagcat tcgaaacgaa 600
gacaaaatat tgaccatcga agtgaagaag gggtggaaag aaggaaccaa aatcactttc 660
cccaaggaag gagaccagac ctccaacaac attccagctg atatcgtctt tgttttaaag 720
gacaagcccc acaatatctt taagagagat ggctctgatg tcatttatcc tgccaggatc 780
agcctccggg aggctctgtg tggctgcaca gtgaacgtcc ccactctgga cggcaggacg 840
atacccgtcg tattcaaaga tgttatcagg cctggcatgc ggcgaaaagt tcctggagaa 900
ggcctccccc tccccaaaac acccgagaaa cgtggggacc tcattattga gtttgaagtg 960
atcttccccg aaaggattcc ccagacatca agaaccgtac ttgagcaggt tcttccaata 1020
tag 1023
<210> 64
<211> 340
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hHSP40
<400> 64
Met Gly Lys Asp Tyr Tyr Gln Thr Leu Gly Leu Ala Arg Gly Ala Ser
1 5 10 15
Asp Glu Glu Ile Lys Arg Ala Tyr Arg Arg Gln Ala Leu Arg Tyr His
20 25 30
Pro Asp Lys Asn Lys Glu Pro Gly Ala Glu Glu Lys Phe Lys Glu Ile
35 40 45
Ala Glu Ala Tyr Asp Val Leu Ser Asp Pro Arg Lys Arg Glu Ile Phe
50 55 60
Asp Arg Tyr Gly Glu Glu Gly Leu Lys Gly Ser Gly Pro Ser Gly Gly
65 70 75 80
Ser Gly Gly Gly Ala Asn Gly Thr Ser Phe Ser Tyr Thr Phe His Gly
85 90 95
Asp Pro His Ala Met Phe Ala Glu Phe Phe Gly Gly Arg Asn Pro Phe
100 105 110
Asp Thr Phe Phe Gly Gln Arg Asn Gly Glu Glu Gly Met Asp Ile Asp
115 120 125
Asp Pro Phe Ser Gly Phe Pro Met Gly Met Gly Gly Phe Thr Asn Val
130 135 140
Asn Phe Gly Arg Ser Arg Ser Ala Gln Glu Pro Ala Arg Lys Lys Gln
145 150 155 160
Asp Pro Pro Val Thr His Asp Leu Arg Val Ser Leu Glu Glu Ile Tyr
165 170 175
Ser Gly Cys Thr Lys Lys Met Lys Ile Ser His Lys Arg Leu Asn Pro
180 185 190
Asp Gly Lys Ser Ile Arg Asn Glu Asp Lys Ile Leu Thr Ile Glu Val
195 200 205
Lys Lys Gly Trp Lys Glu Gly Thr Lys Ile Thr Phe Pro Lys Glu Gly
210 215 220
Asp Gln Thr Ser Asn Asn Ile Pro Ala Asp Ile Val Phe Val Leu Lys
225 230 235 240
Asp Lys Pro His Asn Ile Phe Lys Arg Asp Gly Ser Asp Val Ile Tyr
245 250 255
Pro Ala Arg Ile Ser Leu Arg Glu Ala Leu Cys Gly Cys Thr Val Asn
260 265 270
Val Pro Thr Leu Asp Gly Arg Thr Ile Pro Val Val Phe Lys Asp Val
275 280 285
Ile Arg Pro Gly Met Arg Arg Lys Val Pro Gly Glu Gly Leu Pro Leu
290 295 300
Pro Lys Thr Pro Glu Lys Arg Gly Asp Leu Ile Ile Glu Phe Glu Val
305 310 315 320
Ile Phe Pro Glu Arg Ile Pro Gln Thr Ser Arg Thr Val Leu Glu Gln
325 330 335
Val Leu Pro Ile
340
<210> 65
<211> 1662
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hATP5A1
<400> 65
atgctgtccg tgcgcgttgc tgcggccgtg gtccgcgccc ttcctcggcg ggccggactg 60
gtctccagaa atgctttggg ttcatctttc attgctgcaa ggaacttcca tgcctctaac 120
actcatcttc aaaagactgg gactgctgag atgtcctcta ttcttgaaga gcgtattctt 180
ggagctgata cctctgttga tcttgaagaa actgggcgtg tcttaagtat tggtgatggt 240
attgcccgcg tacatgggct gaggaatgtt caagcagaag aaatggtaga gttttcttca 300
ggcttaaagg gtatgtcctt gaacttggaa cctgacaatg ttggtgttgt cgtgtttgga 360
aatgataaac taattaagga aggagatata gtgaagagga caggagccat tgtggacgtt 420
ccagttggtg aggagctgtt gggtcgtgta gttgatgccc ttggtaatgc tattgatgga 480
aagggtccaa ttggttccaa gacgcgtagg cgagttggtc tgaaagcccc cggtatcatt 540
cctcgaattt cagtgcggga accaatgcag actggcatta aggctgtgga tagcttggtg 600
ccaattggtc gtggtcagcg tgaactgatt attggtgacc gacagactgg gaaaacctca 660
attgctattg acacaatcat taaccagaaa cgtttcaatg atggatctga tgaaaagaag 720
aagctgtact gtatttatgt tgctattggt caaaagagat ccactgttgc ccagttggtg 780
aagagactta cagatgcaga tgccatgaag tacaccattg tggtgtcggc tacggcctcg 840
gatgctgccc cacttcagta cctggctcct tactctggct gttccatggg agagtatttt 900
agagacaatg gcaaacatgc tttgatcatc tatgacgact tatccaaaca ggctgttgct 960
taccgtcaga tgtctctgtt gctccgccga ccccctggtc gtgaggccta tcctggtgat 1020
gtgttctacc tacactcccg gttgctggag agagcagcca aaatgaacga tgcttttggt 1080
ggtggctcct tgactgcttt gccagtcata gaaacacagg ctggtgatgt gtctgcttac 1140
attccaacaa atgtcatttc catcactgac ggacagatct tcttggaaac agaattgttc 1200
tacaaaggta tccgccctgc aattaacgtt ggtctgtctg tatctcgtgt cggatccgct 1260
gcccaaacca gggctatgaa gcaggtagca ggtaccatga agctggaatt ggctcagtat 1320
cgtgaggttg ctgcttttgc ccagttcggt tctgacctcg atgctgccac tcaacaactt 1380
ttgagtcgtg gcgtgcgtct aactgagttg ctgaagcaag gacagtattc tcccatggct 1440
attgaagaac aagtggctgt tatctatgcg ggtgtaaggg gatatcttga taaactggag 1500
cccagcaaga ttacaaagtt tgagaatgct ttcttgtctc atgtcgtcag ccagcaccaa 1560
gccttgttgg gcactatcag ggctgatgga aagatctcag aacaatcaga tgcaaagctg 1620
aaagagattg taacaaattt cttggctgga tttgaagctt aa 1662
<210> 66
<211> 553
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hATP5A1
<400> 66
Met Leu Ser Val Arg Val Ala Ala Ala Val Val Arg Ala Leu Pro Arg
1 5 10 15
Arg Ala Gly Leu Val Ser Arg Asn Ala Leu Gly Ser Ser Phe Ile Ala
20 25 30
Ala Arg Asn Phe His Ala Ser Asn Thr His Leu Gln Lys Thr Gly Thr
35 40 45
Ala Glu Met Ser Ser Ile Leu Glu Glu Arg Ile Leu Gly Ala Asp Thr
50 55 60
Ser Val Asp Leu Glu Glu Thr Gly Arg Val Leu Ser Ile Gly Asp Gly
65 70 75 80
Ile Ala Arg Val His Gly Leu Arg Asn Val Gln Ala Glu Glu Met Val
85 90 95
Glu Phe Ser Ser Gly Leu Lys Gly Met Ser Leu Asn Leu Glu Pro Asp
100 105 110
Asn Val Gly Val Val Val Phe Gly Asn Asp Lys Leu Ile Lys Glu Gly
115 120 125
Asp Ile Val Lys Arg Thr Gly Ala Ile Val Asp Val Pro Val Gly Glu
130 135 140
Glu Leu Leu Gly Arg Val Val Asp Ala Leu Gly Asn Ala Ile Asp Gly
145 150 155 160
Lys Gly Pro Ile Gly Ser Lys Thr Arg Arg Arg Val Gly Leu Lys Ala
165 170 175
Pro Gly Ile Ile Pro Arg Ile Ser Val Arg Glu Pro Met Gln Thr Gly
180 185 190
Ile Lys Ala Val Asp Ser Leu Val Pro Ile Gly Arg Gly Gln Arg Glu
195 200 205
Leu Ile Ile Gly Asp Arg Gln Thr Gly Lys Thr Ser Ile Ala Ile Asp
210 215 220
Thr Ile Ile Asn Gln Lys Arg Phe Asn Asp Gly Ser Asp Glu Lys Lys
225 230 235 240
Lys Leu Tyr Cys Ile Tyr Val Ala Ile Gly Gln Lys Arg Ser Thr Val
245 250 255
Ala Gln Leu Val Lys Arg Leu Thr Asp Ala Asp Ala Met Lys Tyr Thr
260 265 270
Ile Val Val Ser Ala Thr Ala Ser Asp Ala Ala Pro Leu Gln Tyr Leu
275 280 285
Ala Pro Tyr Ser Gly Cys Ser Met Gly Glu Tyr Phe Arg Asp Asn Gly
290 295 300
Lys His Ala Leu Ile Ile Tyr Asp Asp Leu Ser Lys Gln Ala Val Ala
305 310 315 320
Tyr Arg Gln Met Ser Leu Leu Leu Arg Arg Pro Pro Gly Arg Glu Ala
325 330 335
Tyr Pro Gly Asp Val Phe Tyr Leu His Ser Arg Leu Leu Glu Arg Ala
340 345 350
Ala Lys Met Asn Asp Ala Phe Gly Gly Gly Ser Leu Thr Ala Leu Pro
355 360 365
Val Ile Glu Thr Gln Ala Gly Asp Val Ser Ala Tyr Ile Pro Thr Asn
370 375 380
Val Ile Ser Ile Thr Asp Gly Gln Ile Phe Leu Glu Thr Glu Leu Phe
385 390 395 400
Tyr Lys Gly Ile Arg Pro Ala Ile Asn Val Gly Leu Ser Val Ser Arg
405 410 415
Val Gly Ser Ala Ala Gln Thr Arg Ala Met Lys Gln Val Ala Gly Thr
420 425 430
Met Lys Leu Glu Leu Ala Gln Tyr Arg Glu Val Ala Ala Phe Ala Gln
435 440 445
Phe Gly Ser Asp Leu Asp Ala Ala Thr Gln Gln Leu Leu Ser Arg Gly
450 455 460
Val Arg Leu Thr Glu Leu Leu Lys Gln Gly Gln Tyr Ser Pro Met Ala
465 470 475 480
Ile Glu Glu Gln Val Ala Val Ile Tyr Ala Gly Val Arg Gly Tyr Leu
485 490 495
Asp Lys Leu Glu Pro Ser Lys Ile Thr Lys Phe Glu Asn Ala Phe Leu
500 505 510
Ser His Val Val Ser Gln His Gln Ala Leu Leu Gly Thr Ile Arg Ala
515 520 525
Asp Gly Lys Ile Ser Glu Gln Ser Asp Ala Lys Leu Lys Glu Ile Val
530 535 540
Thr Asn Phe Leu Ala Gly Phe Glu Ala
545 550
<210> 67
<211> 3129
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hSERCA2
<400> 67
atggagaacg cgcacaccaa gacggtggag gaggtgctgg gccacttcgg cgtcaacgag 60
agtacggggc tgagcctgga acaggtcaag aagcttaagg agagatgggg ctccaacgag 120
ttaccggctg aagaaggaaa aaccttgctg gaacttgtga ttgagcagtt tgaagacttg 180
ctagttagga ttttattact ggcagcatgt atatcttttg ttttggcttg gtttgaagaa 240
ggtgaagaaa caattacagc ctttgtagaa ccttttgtaa ttttactcat attagtagcc 300
aatgcaattg tgggtgtatg gcaggaaaga aatgctgaaa atgccatcga agcccttaag 360
gaatatgagc ctgaaatggg caaagtgtat cgacaggaca gaaagagtgt gcagcggatt 420
aaagctaaag acatagttcc tggtgatatt gtagaaattg ctgttggtga caaagttcct 480
gctgatataa ggttaacttc catcaaatct accacactaa gagttgacca gtcaattctc 540
acaggtgaat ctgtctctgt catcaagcac actgatcccg tccctgaccc acgagctgtc 600
aaccaagata aaaagaacat gctgttttct ggtacaaaca ttgctgctgg gaaagctatg 660
ggagtggtgg tagcaactgg agttaacacc gaaattggca agatccggga tgaaatggtg 720
gcaacagaac aggagagaac accccttcag caaaaactag atgaatttgg ggaacagctt 780
tccaaagtca tctcccttat ttgcattgca gtctggatca taaatattgg gcacttcaat 840
gacccggttc atggagggtc ctggatcaga ggtgctattt actactttaa aattgcagtg 900
gccctggctg tagcagccat tcctgaaggt ctgcctgcag tcatcaccac ctgcctggct 960
cttggaactc gcagaatggc aaagaaaaat gccattgttc gaagcctccc gtctgtggaa 1020
acccttggtt gtacttctgt tatctgctca gacaagactg gtacacttac aacaaaccag 1080
atgtcagtct gcaggatgtt cattctggac agagtggaag gtgatacttg ttcccttaat 1140
gagtttacca taactggatc aacttatgca cctattggag aagtgcataa agatgataaa 1200
ccagtgaatt gtcaccagta tgatggtctg gtagaattag caacaatttg tgctctttgt 1260
aatgactctg ctttggatta caatgaggca aagggtgtgt atgaaaaagt tggagaagct 1320
acagagactg ctctcacttg cctagtagag aagatgaatg tatttgatac cgaattgaag 1380
ggtctttcta aaatagaacg tgcaaatgcc tgcaactcag tcattaaaca gctgatgaaa 1440
aaggaattca ctctagagtt ttcacgtgac agaaagtcaa tgtcggttta ctgtacacca 1500
aataaaccaa gcaggacatc aatgagcaag atgtttgtga agggtgctcc tgaaggtgtc 1560
attgacaggt gcacccacat tcgagttgga agtactaagg ttcctatgac ctctggagtc 1620
aaacagaaga tcatgtctgt cattcgagag tggggtagtg gcagcgacac actgcgatgc 1680
ctggccctgg ccactcatga caacccactg agaagagaag aaatgcacct tgaggactct 1740
gccaacttta ttaaatatga gaccaatctg accttcgttg gctgcgtggg catgctggat 1800
cctccgagaa tcgaggtggc ctcctccgtg aagctgtgcc ggcaagcagg catccgggtc 1860
atcatgatca ctggggacaa caagggcact gctgtggcca tctgtcgccg catcggcatc 1920
ttcgggcagg atgaggacgt gacgtcaaaa gctttcacag gccgggagtt tgatgaactc 1980
aacccctccg cccagcgaga cgcctgcctg aacgcccgct gttttgctcg agttgaaccc 2040
tcccacaagt ctaaaatcgt agaatttctt cagtcttttg atgagattac agctatgact 2100
ggcgatggcg tgaacgatgc tcctgctctg aagaaagccg agattggcat tgctatgggc 2160
tctggcactg cggtggctaa aaccgcctct gagatggtcc tggcggatga caacttctcc 2220
accattgtgg ctgccgttga ggaggggcgg gcaatctaca acaacatgaa acagttcatc 2280
cgctacctca tctcgtccaa cgtcggggaa gttgtctgta ttttcctgac agcagccctt 2340
ggatttcccg aggctttgat tcctgttcag ctgctctggg tcaatctggt gacagatggc 2400
ctgcctgcca ctgcactggg gttcaaccct cctgatctgg acatcatgaa taaacctccc 2460
cggaacccaa aggaaccatt gatcagcggg tggctctttt tccgttactt ggctattggc 2520
tgttacgtcg gcgctgctac cgtgggtgct gctgcatggt ggttcattgc tgctgacggt 2580
ggtccaagag tgtccttcta ccagctgagt catttcctac agtgtaaaga ggacaacccg 2640
gactttgaag gcgtggattg tgcaatcttt gaatccccat acccgatgac aatggcgctc 2700
tctgttctag taactataga aatgtgtaac gccctcaaca gcttgtccga aaaccagtcc 2760
ttgctgagga tgcccccctg ggagaacatc tggctcgtgg gctccatctg cctgtccatg 2820
tcactccact tcctgatcct ctatgtcgaa cccttgccac tcatcttcca gatcacaccg 2880
ctgaacgtga cccagtggct gatggtgctg aaaatctcct tgcccgtgat tctcatggat 2940
gagacgctca agtttgtggc ccgcaactac ctggaacctg gtaaagagtg tgtgcagcct 3000
gccaccaaat cctgctcgtt ctcggcatgc accgatggga tttcctggcc gtttgtgctg 3060
ctcataatgc ccctggtgat ctgggtctat agcacagaca ctaactttag cgatatgttc 3120
tggtcttga 3129
<210> 68
<211> 1042
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hSERCA2
<400> 68
Met Glu Asn Ala His Thr Lys Thr Val Glu Glu Val Leu Gly His Phe
1 5 10 15
Gly Val Asn Glu Ser Thr Gly Leu Ser Leu Glu Gln Val Lys Lys Leu
20 25 30
Lys Glu Arg Trp Gly Ser Asn Glu Leu Pro Ala Glu Glu Gly Lys Thr
35 40 45
Leu Leu Glu Leu Val Ile Glu Gln Phe Glu Asp Leu Leu Val Arg Ile
50 55 60
Leu Leu Leu Ala Ala Cys Ile Ser Phe Val Leu Ala Trp Phe Glu Glu
65 70 75 80
Gly Glu Glu Thr Ile Thr Ala Phe Val Glu Pro Phe Val Ile Leu Leu
85 90 95
Ile Leu Val Ala Asn Ala Ile Val Gly Val Trp Gln Glu Arg Asn Ala
100 105 110
Glu Asn Ala Ile Glu Ala Leu Lys Glu Tyr Glu Pro Glu Met Gly Lys
115 120 125
Val Tyr Arg Gln Asp Arg Lys Ser Val Gln Arg Ile Lys Ala Lys Asp
130 135 140
Ile Val Pro Gly Asp Ile Val Glu Ile Ala Val Gly Asp Lys Val Pro
145 150 155 160
Ala Asp Ile Arg Leu Thr Ser Ile Lys Ser Thr Thr Leu Arg Val Asp
165 170 175
Gln Ser Ile Leu Thr Gly Glu Ser Val Ser Val Ile Lys His Thr Asp
180 185 190
Pro Val Pro Asp Pro Arg Ala Val Asn Gln Asp Lys Lys Asn Met Leu
195 200 205
Phe Ser Gly Thr Asn Ile Ala Ala Gly Lys Ala Met Gly Val Val Val
210 215 220
Ala Thr Gly Val Asn Thr Glu Ile Gly Lys Ile Arg Asp Glu Met Val
225 230 235 240
Ala Thr Glu Gln Glu Arg Thr Pro Leu Gln Gln Lys Leu Asp Glu Phe
245 250 255
Gly Glu Gln Leu Ser Lys Val Ile Ser Leu Ile Cys Ile Ala Val Trp
260 265 270
Ile Ile Asn Ile Gly His Phe Asn Asp Pro Val His Gly Gly Ser Trp
275 280 285
Ile Arg Gly Ala Ile Tyr Tyr Phe Lys Ile Ala Val Ala Leu Ala Val
290 295 300
Ala Ala Ile Pro Glu Gly Leu Pro Ala Val Ile Thr Thr Cys Leu Ala
305 310 315 320
Leu Gly Thr Arg Arg Met Ala Lys Lys Asn Ala Ile Val Arg Ser Leu
325 330 335
Pro Ser Val Glu Thr Leu Gly Cys Thr Ser Val Ile Cys Ser Asp Lys
340 345 350
Thr Gly Thr Leu Thr Thr Asn Gln Met Ser Val Cys Arg Met Phe Ile
355 360 365
Leu Asp Arg Val Glu Gly Asp Thr Cys Ser Leu Asn Glu Phe Thr Ile
370 375 380
Thr Gly Ser Thr Tyr Ala Pro Ile Gly Glu Val His Lys Asp Asp Lys
385 390 395 400
Pro Val Asn Cys His Gln Tyr Asp Gly Leu Val Glu Leu Ala Thr Ile
405 410 415
Cys Ala Leu Cys Asn Asp Ser Ala Leu Asp Tyr Asn Glu Ala Lys Gly
420 425 430
Val Tyr Glu Lys Val Gly Glu Ala Thr Glu Thr Ala Leu Thr Cys Leu
435 440 445
Val Glu Lys Met Asn Val Phe Asp Thr Glu Leu Lys Gly Leu Ser Lys
450 455 460
Ile Glu Arg Ala Asn Ala Cys Asn Ser Val Ile Lys Gln Leu Met Lys
465 470 475 480
Lys Glu Phe Thr Leu Glu Phe Ser Arg Asp Arg Lys Ser Met Ser Val
485 490 495
Tyr Cys Thr Pro Asn Lys Pro Ser Arg Thr Ser Met Ser Lys Met Phe
500 505 510
Val Lys Gly Ala Pro Glu Gly Val Ile Asp Arg Cys Thr His Ile Arg
515 520 525
Val Gly Ser Thr Lys Val Pro Met Thr Ser Gly Val Lys Gln Lys Ile
530 535 540
Met Ser Val Ile Arg Glu Trp Gly Ser Gly Ser Asp Thr Leu Arg Cys
545 550 555 560
Leu Ala Leu Ala Thr His Asp Asn Pro Leu Arg Arg Glu Glu Met His
565 570 575
Leu Glu Asp Ser Ala Asn Phe Ile Lys Tyr Glu Thr Asn Leu Thr Phe
580 585 590
Val Gly Cys Val Gly Met Leu Asp Pro Pro Arg Ile Glu Val Ala Ser
595 600 605
Ser Val Lys Leu Cys Arg Gln Ala Gly Ile Arg Val Ile Met Ile Thr
610 615 620
Gly Asp Asn Lys Gly Thr Ala Val Ala Ile Cys Arg Arg Ile Gly Ile
625 630 635 640
Phe Gly Gln Asp Glu Asp Val Thr Ser Lys Ala Phe Thr Gly Arg Glu
645 650 655
Phe Asp Glu Leu Asn Pro Ser Ala Gln Arg Asp Ala Cys Leu Asn Ala
660 665 670
Arg Cys Phe Ala Arg Val Glu Pro Ser His Lys Ser Lys Ile Val Glu
675 680 685
Phe Leu Gln Ser Phe Asp Glu Ile Thr Ala Met Thr Gly Asp Gly Val
690 695 700
Asn Asp Ala Pro Ala Leu Lys Lys Ala Glu Ile Gly Ile Ala Met Gly
705 710 715 720
Ser Gly Thr Ala Val Ala Lys Thr Ala Ser Glu Met Val Leu Ala Asp
725 730 735
Asp Asn Phe Ser Thr Ile Val Ala Ala Val Glu Glu Gly Arg Ala Ile
740 745 750
Tyr Asn Asn Met Lys Gln Phe Ile Arg Tyr Leu Ile Ser Ser Asn Val
755 760 765
Gly Glu Val Val Cys Ile Phe Leu Thr Ala Ala Leu Gly Phe Pro Glu
770 775 780
Ala Leu Ile Pro Val Gln Leu Leu Trp Val Asn Leu Val Thr Asp Gly
785 790 795 800
Leu Pro Ala Thr Ala Leu Gly Phe Asn Pro Pro Asp Leu Asp Ile Met
805 810 815
Asn Lys Pro Pro Arg Asn Pro Lys Glu Pro Leu Ile Ser Gly Trp Leu
820 825 830
Phe Phe Arg Tyr Leu Ala Ile Gly Cys Tyr Val Gly Ala Ala Thr Val
835 840 845
Gly Ala Ala Ala Trp Trp Phe Ile Ala Ala Asp Gly Gly Pro Arg Val
850 855 860
Ser Phe Tyr Gln Leu Ser His Phe Leu Gln Cys Lys Glu Asp Asn Pro
865 870 875 880
Asp Phe Glu Gly Val Asp Cys Ala Ile Phe Glu Ser Pro Tyr Pro Met
885 890 895
Thr Met Ala Leu Ser Val Leu Val Thr Ile Glu Met Cys Asn Ala Leu
900 905 910
Asn Ser Leu Ser Glu Asn Gln Ser Leu Leu Arg Met Pro Pro Trp Glu
915 920 925
Asn Ile Trp Leu Val Gly Ser Ile Cys Leu Ser Met Ser Leu His Phe
930 935 940
Leu Ile Leu Tyr Val Glu Pro Leu Pro Leu Ile Phe Gln Ile Thr Pro
945 950 955 960
Leu Asn Val Thr Gln Trp Leu Met Val Leu Lys Ile Ser Leu Pro Val
965 970 975
Ile Leu Met Asp Glu Thr Leu Lys Phe Val Ala Arg Asn Tyr Leu Glu
980 985 990
Pro Gly Lys Glu Cys Val Gln Pro Ala Thr Lys Ser Cys Ser Phe Ser
995 1000 1005
Ala Cys Thr Asp Gly Ile Ser Trp Pro Phe Val Leu Leu Ile Met
1010 1015 1020
Pro Leu Val Ile Trp Val Tyr Ser Thr Asp Thr Asn Phe Ser Asp
1025 1030 1035
Met Phe Trp Ser
1040
<210> 69
<211> 1938
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hPDIA4
<400> 69
atgaggcccc ggaaagcctt cctgctcctg ctgctcttgg ggctggtgca gctgctggcc 60
gtggcgggtg ccgagggccc ggacgaggat tcttctaaca gagaaaatgc cattgaggat 120
gaagaggagg aggaggagga agatgatgat gaggaagaag acgacttgga agttaaggaa 180
gaaaatggag tcttggtcct aaatgatgca aactttgata attttgtggc tgacaaagac 240
acagtgctgc tggagtttta tgctccatgg tgtggacatt gcaagcagtt tgctccggaa 300
tatgaaaaaa ttgccaacat attaaaggat aaagatcctc ccattcctgt tgccaagatc 360
gatgcaacct cagcgtctgt gctggccagc aggtttgatg tgagtggcta ccccaccatc 420
aagatcctta agaaggggca ggctgtagac tacgagggct ccagaaccca ggaagaaatt 480
gttgccaagg tcagagaagt ctcccagccc gactggacgc ctccaccaga agtcacgctt 540
gtgttgacca aagagaactt tgatgaagtt gtgaatgatg cagatatcat tctggtggag 600
ttttatgccc catggtgtgg acactgcaag aaacttgccc ccgagtatga gaaggccgcc 660
aaggagctca gcaagcgttc tcctccaatt cccctggcaa aggtcgacgc caccgcagaa 720
acagacctgg ccaagaggtt tgatgtctct ggctatccca ccctgaaaat tttccgcaaa 780
ggaaggcctt atgactacaa cggcccacga gaaaaatatg gaatcgttga ttacatgatc 840
gagcagtccg ggcctccctc caaggagatt ctgaccctga agcaggtcca ggagttcctg 900
aaggatggag acgatgtcat catcatcggg gtctttaagg gggagagtga cccagcctac 960
cagcaatacc aggatgccgc taacaacctg agagaagatt acaaatttca ccacactttc 1020
agcacagaaa tagcaaagtt cttgaaagtc tcccaggggc agttggttgt aatgcagcct 1080
gagaaattcc agtccaagta tgagccccgg agccacatga tggacgtcca gggctccacc 1140
caggactcgg ccatcaagga cttcgtgctg aagtacgccc tgcccctggt tggccaccgc 1200
aaggtgtcaa acgatgctaa gcgctacacc aggcgccccc tggtggtcgt ctactacagt 1260
gtggacttca gctttgatta cagagctgca actcagtttt ggcggagcaa agtcctagag 1320
gtggccaagg acttccctga gtacaccttt gccattgcgg acgaagagga ctatgctggg 1380
gaggtgaagg acctggggct cagcgagagt ggggaggatg tcaatgccgc catcctggac 1440
gagagtggga agaagttcgc catggagcca gaggagtttg actctgacac cctccgcgag 1500
tttgtcactg ctttcaaaaa aggaaaactg aagccagtca tcaaatccca gccagtgccc 1560
aagaacaaca agggacccgt caaggtcgtg gtgggaaaga cctttgactc cattgtgatg 1620
gaccccaaga aggacgtcct catcgagttc tacgcgccat ggtgcgggca ctgcaagcag 1680
ctagagcccg tgtacaacag cctggccaag aagtacaagg gccaaaaggg cctggtcatc 1740
gccaagatgg acgccactgc caacgacgtc cccagcgacc gctataaggt ggagggcttc 1800
cccaccatct acttcgcccc cagtggggac aaaaagaacc cagttaaatt tgagggtgga 1860
gacagagatc tggagcattt gagcaagttt atagaagaac atgccacaaa actgagcagg 1920
accaaggaag agctttga 1938
<210> 70
<211> 645
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hPDIA4
<400> 70
Met Arg Pro Arg Lys Ala Phe Leu Leu Leu Leu Leu Leu Gly Leu Val
1 5 10 15
Gln Leu Leu Ala Val Ala Gly Ala Glu Gly Pro Asp Glu Asp Ser Ser
20 25 30
Asn Arg Glu Asn Ala Ile Glu Asp Glu Glu Glu Glu Glu Glu Glu Asp
35 40 45
Asp Asp Glu Glu Glu Asp Asp Leu Glu Val Lys Glu Glu Asn Gly Val
50 55 60
Leu Val Leu Asn Asp Ala Asn Phe Asp Asn Phe Val Ala Asp Lys Asp
65 70 75 80
Thr Val Leu Leu Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Gln
85 90 95
Phe Ala Pro Glu Tyr Glu Lys Ile Ala Asn Ile Leu Lys Asp Lys Asp
100 105 110
Pro Pro Ile Pro Val Ala Lys Ile Asp Ala Thr Ser Ala Ser Val Leu
115 120 125
Ala Ser Arg Phe Asp Val Ser Gly Tyr Pro Thr Ile Lys Ile Leu Lys
130 135 140
Lys Gly Gln Ala Val Asp Tyr Glu Gly Ser Arg Thr Gln Glu Glu Ile
145 150 155 160
Val Ala Lys Val Arg Glu Val Ser Gln Pro Asp Trp Thr Pro Pro Pro
165 170 175
Glu Val Thr Leu Val Leu Thr Lys Glu Asn Phe Asp Glu Val Val Asn
180 185 190
Asp Ala Asp Ile Ile Leu Val Glu Phe Tyr Ala Pro Trp Cys Gly His
195 200 205
Cys Lys Lys Leu Ala Pro Glu Tyr Glu Lys Ala Ala Lys Glu Leu Ser
210 215 220
Lys Arg Ser Pro Pro Ile Pro Leu Ala Lys Val Asp Ala Thr Ala Glu
225 230 235 240
Thr Asp Leu Ala Lys Arg Phe Asp Val Ser Gly Tyr Pro Thr Leu Lys
245 250 255
Ile Phe Arg Lys Gly Arg Pro Tyr Asp Tyr Asn Gly Pro Arg Glu Lys
260 265 270
Tyr Gly Ile Val Asp Tyr Met Ile Glu Gln Ser Gly Pro Pro Ser Lys
275 280 285
Glu Ile Leu Thr Leu Lys Gln Val Gln Glu Phe Leu Lys Asp Gly Asp
290 295 300
Asp Val Ile Ile Ile Gly Val Phe Lys Gly Glu Ser Asp Pro Ala Tyr
305 310 315 320
Gln Gln Tyr Gln Asp Ala Ala Asn Asn Leu Arg Glu Asp Tyr Lys Phe
325 330 335
His His Thr Phe Ser Thr Glu Ile Ala Lys Phe Leu Lys Val Ser Gln
340 345 350
Gly Gln Leu Val Val Met Gln Pro Glu Lys Phe Gln Ser Lys Tyr Glu
355 360 365
Pro Arg Ser His Met Met Asp Val Gln Gly Ser Thr Gln Asp Ser Ala
370 375 380
Ile Lys Asp Phe Val Leu Lys Tyr Ala Leu Pro Leu Val Gly His Arg
385 390 395 400
Lys Val Ser Asn Asp Ala Lys Arg Tyr Thr Arg Arg Pro Leu Val Val
405 410 415
Val Tyr Tyr Ser Val Asp Phe Ser Phe Asp Tyr Arg Ala Ala Thr Gln
420 425 430
Phe Trp Arg Ser Lys Val Leu Glu Val Ala Lys Asp Phe Pro Glu Tyr
435 440 445
Thr Phe Ala Ile Ala Asp Glu Glu Asp Tyr Ala Gly Glu Val Lys Asp
450 455 460
Leu Gly Leu Ser Glu Ser Gly Glu Asp Val Asn Ala Ala Ile Leu Asp
465 470 475 480
Glu Ser Gly Lys Lys Phe Ala Met Glu Pro Glu Glu Phe Asp Ser Asp
485 490 495
Thr Leu Arg Glu Phe Val Thr Ala Phe Lys Lys Gly Lys Leu Lys Pro
500 505 510
Val Ile Lys Ser Gln Pro Val Pro Lys Asn Asn Lys Gly Pro Val Lys
515 520 525
Val Val Val Gly Lys Thr Phe Asp Ser Ile Val Met Asp Pro Lys Lys
530 535 540
Asp Val Leu Ile Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Gln
545 550 555 560
Leu Glu Pro Val Tyr Asn Ser Leu Ala Lys Lys Tyr Lys Gly Gln Lys
565 570 575
Gly Leu Val Ile Ala Lys Met Asp Ala Thr Ala Asn Asp Val Pro Ser
580 585 590
Asp Arg Tyr Lys Val Glu Gly Phe Pro Thr Ile Tyr Phe Ala Pro Ser
595 600 605
Gly Asp Lys Lys Asn Pro Val Lys Phe Glu Gly Gly Asp Arg Asp Leu
610 615 620
Glu His Leu Ser Lys Phe Ile Glu Glu His Ala Thr Lys Leu Ser Arg
625 630 635 640
Thr Lys Glu Glu Leu
645
<210> 71
<211> 1941
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hHSC70 /HSPA8
<400> 71
atgtccaagg gacctgcagt tggtattgat cttggcacca cctactcttg tgtgggtgtt 60
ttccagcacg gaaaagtcga gataattgcc aatgatcagg gaaaccgaac cactccaagc 120
tatgtcgcct ttacggacac tgaacggttg atcggtgatg ccgcaaagaa tcaagttgca 180
atgaacccca ccaacacagt ttttgatgcc aaacgtctga ttggacgcag atttgatgat 240
gctgttgtcc agtctgatat gaaacattgg ccctttatgg tggtgaatga tgctggcagg 300
cccaaggtcc aagtagaata caagggagag accaaaagct tctatccaga ggaggtgtct 360
tctatggttc tgacaaagat gaaggaaatt gcagaagcct accttgggaa gactgttacc 420
aatgctgtgg tcacagtgcc agcttacttt aatgactctc agcgtcaggc taccaaagat 480
gctggaacta ttgctggtct caatgtactt agaattatta atgagccaac tgctgctgct 540
attgcttacg gcttagacaa aaaggttgga gcagaaagaa acgtgctcat ctttgacctg 600
ggaggtggca cttttgatgt gtcaatcctc actattgagg atggaatctt tgaggtcaag 660
tctacagctg gagacaccca cttgggtgga gaagattttg acaaccgaat ggtcaaccat 720
tttattgctg agtttaagcg caagcataag aaggacatca gtgagaacaa gagagctgta 780
agacgcctcc gtactgcttg tgaacgtgct aagcgtaccc tctcttccag cacccaggcc 840
agtattgaga tcgattctct ctatgaagga atcgacttct atacctccat tacccgtgcc 900
cgatttgaag aactgaatgc tgacctgttc cgtggcaccc tggacccagt agagaaagcc 960
cttcgagatg ccaaactaga caagtcacag attcatgata ttgtcctggt tggtggttct 1020
actcgtatcc ccaagattca gaagcttctc caagacttct tcaatggaaa agaactgaat 1080
aagagcatca accctgatga agctgttgct tatggtgcag ctgtccaggc agccatcttg 1140
tctggagaca agtctgagaa tgttcaagat ttgctgctct tggatgtcac tcctctttcc 1200
cttggtattg aaactgctgg tggagtcatg actgtcctca tcaagcgtaa taccaccatt 1260
cctaccaagc agacacagac cttcactacc tattctgaca accagcctgg tgtgcttatt 1320
caggtttatg aaggcgagcg tgccatgaca aaggataaca acctgcttgg caagtttgaa 1380
ctcacaggca tacctcctgc accccgaggt gttcctcaga ttgaagtcac ttttgacatt 1440
gatgccaatg gtatactcaa tgtctctgct gtggacaaga gtacgggaaa agagaacaag 1500
attactatca ctaatgacaa gggccgtttg agcaaggaag acattgaacg tatggtccag 1560
gaagctgaga agtacaaagc tgaagatgag aagcagaggg acaaggtgtc atccaagaat 1620
tcacttgagt cctatgcctt caacatgaaa gcaactgttg aagatgagaa acttcaaggc 1680
aagattaacg atgaggacaa acagaagatt ctggacaagt gtaatgaaat tatcaactgg 1740
cttgataaga atcagactgc tgagaaggaa gaatttgaac atcaacagaa agagctggag 1800
aaagtttgca accccatcat caccaagctg taccagagtg caggaggcat gccaggagga 1860
atgcctgggg gatttcctgg tggtggagct cctccctctg gtggtgcttc ctcagggccc 1920
accattgaag aggttgatta a 1941
<210> 72
<211> 646
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hHSC70 /HSPA8
<400> 72
Met Ser Lys Gly Pro Ala Val Gly Ile Asp Leu Gly Thr Thr Tyr Ser
1 5 10 15
Cys Val Gly Val Phe Gln His Gly Lys Val Glu Ile Ile Ala Asn Asp
20 25 30
Gln Gly Asn Arg Thr Thr Pro Ser Tyr Val Ala Phe Thr Asp Thr Glu
35 40 45
Arg Leu Ile Gly Asp Ala Ala Lys Asn Gln Val Ala Met Asn Pro Thr
50 55 60
Asn Thr Val Phe Asp Ala Lys Arg Leu Ile Gly Arg Arg Phe Asp Asp
65 70 75 80
Ala Val Val Gln Ser Asp Met Lys His Trp Pro Phe Met Val Val Asn
85 90 95
Asp Ala Gly Arg Pro Lys Val Gln Val Glu Tyr Lys Gly Glu Thr Lys
100 105 110
Ser Phe Tyr Pro Glu Glu Val Ser Ser Met Val Leu Thr Lys Met Lys
115 120 125
Glu Ile Ala Glu Ala Tyr Leu Gly Lys Thr Val Thr Asn Ala Val Val
130 135 140
Thr Val Pro Ala Tyr Phe Asn Asp Ser Gln Arg Gln Ala Thr Lys Asp
145 150 155 160
Ala Gly Thr Ile Ala Gly Leu Asn Val Leu Arg Ile Ile Asn Glu Pro
165 170 175
Thr Ala Ala Ala Ile Ala Tyr Gly Leu Asp Lys Lys Val Gly Ala Glu
180 185 190
Arg Asn Val Leu Ile Phe Asp Leu Gly Gly Gly Thr Phe Asp Val Ser
195 200 205
Ile Leu Thr Ile Glu Asp Gly Ile Phe Glu Val Lys Ser Thr Ala Gly
210 215 220
Asp Thr His Leu Gly Gly Glu Asp Phe Asp Asn Arg Met Val Asn His
225 230 235 240
Phe Ile Ala Glu Phe Lys Arg Lys His Lys Lys Asp Ile Ser Glu Asn
245 250 255
Lys Arg Ala Val Arg Arg Leu Arg Thr Ala Cys Glu Arg Ala Lys Arg
260 265 270
Thr Leu Ser Ser Ser Thr Gln Ala Ser Ile Glu Ile Asp Ser Leu Tyr
275 280 285
Glu Gly Ile Asp Phe Tyr Thr Ser Ile Thr Arg Ala Arg Phe Glu Glu
290 295 300
Leu Asn Ala Asp Leu Phe Arg Gly Thr Leu Asp Pro Val Glu Lys Ala
305 310 315 320
Leu Arg Asp Ala Lys Leu Asp Lys Ser Gln Ile His Asp Ile Val Leu
325 330 335
Val Gly Gly Ser Thr Arg Ile Pro Lys Ile Gln Lys Leu Leu Gln Asp
340 345 350
Phe Phe Asn Gly Lys Glu Leu Asn Lys Ser Ile Asn Pro Asp Glu Ala
355 360 365
Val Ala Tyr Gly Ala Ala Val Gln Ala Ala Ile Leu Ser Gly Asp Lys
370 375 380
Ser Glu Asn Val Gln Asp Leu Leu Leu Leu Asp Val Thr Pro Leu Ser
385 390 395 400
Leu Gly Ile Glu Thr Ala Gly Gly Val Met Thr Val Leu Ile Lys Arg
405 410 415
Asn Thr Thr Ile Pro Thr Lys Gln Thr Gln Thr Phe Thr Thr Tyr Ser
420 425 430
Asp Asn Gln Pro Gly Val Leu Ile Gln Val Tyr Glu Gly Glu Arg Ala
435 440 445
Met Thr Lys Asp Asn Asn Leu Leu Gly Lys Phe Glu Leu Thr Gly Ile
450 455 460
Pro Pro Ala Pro Arg Gly Val Pro Gln Ile Glu Val Thr Phe Asp Ile
465 470 475 480
Asp Ala Asn Gly Ile Leu Asn Val Ser Ala Val Asp Lys Ser Thr Gly
485 490 495
Lys Glu Asn Lys Ile Thr Ile Thr Asn Asp Lys Gly Arg Leu Ser Lys
500 505 510
Glu Asp Ile Glu Arg Met Val Gln Glu Ala Glu Lys Tyr Lys Ala Glu
515 520 525
Asp Glu Lys Gln Arg Asp Lys Val Ser Ser Lys Asn Ser Leu Glu Ser
530 535 540
Tyr Ala Phe Asn Met Lys Ala Thr Val Glu Asp Glu Lys Leu Gln Gly
545 550 555 560
Lys Ile Asn Asp Glu Asp Lys Gln Lys Ile Leu Asp Lys Cys Asn Glu
565 570 575
Ile Ile Asn Trp Leu Asp Lys Asn Gln Thr Ala Glu Lys Glu Glu Phe
580 585 590
Glu His Gln Gln Lys Glu Leu Glu Lys Val Cys Asn Pro Ile Ile Thr
595 600 605
Lys Leu Tyr Gln Ser Ala Gly Gly Met Pro Gly Gly Met Pro Gly Gly
610 615 620
Phe Pro Gly Gly Gly Ala Pro Pro Ser Gly Gly Ala Ser Ser Gly Pro
625 630 635 640
Thr Ile Glu Glu Val Asp
645
<210> 73
<211> 3000
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hHYOU1
<400> 73
atggcagaca aagttaggag gcagaggccg aggaggcgag tctgttgggc cttggtggct 60
gtgctcttgg cagacctgtt ggcactgagt gatacactgg cagtgatgtc tgtggacctg 120
ggcagtgagt ccatgaaggt ggccattgtc aaacctggag tgcccatgga aattgtcttg 180
aataaggaat ctcggaggaa aacaccggtg atcgtgaccc tgaaagaaaa tgaaagattc 240
tttggagaca gtgcagcaag catggcgatt aagaatccaa aggctacgct acgttacttc 300
cagcacctcc tggggaagca ggcagataac ccccatgtag ctctttacca ggcccgcttc 360
ccggagcacg agctgacttt cgacccacag aggcagactg tgcactttca gatcagctcg 420
cagctgcagt tctcacctga ggaagtgttg ggcatggttc tcaattattc tcgttctcta 480
gctgaagatt ttgcagagca gcccatcaag gatgcagtga tcaccgtgcc agtcttcttc 540
aaccaggccg agcgccgagc tgtgctgcag gctgctcgta tggctggcct caaagtgctg 600
cagctcatca atgacaacac cgccactgcc ctcagctatg gtgtcttccg ccggaaagat 660
attaacacca ctgcccagaa tatcatgttc tatgacatgg gctcaggcag caccgtatgc 720
accattgtga cctaccagat ggtgaagact aaggaagctg ggatgcagcc acagctgcag 780
atccggggag taggatttga ccgtaccctg gggggcctgg agatggagct ccggcttcga 840
gaacgcctgg ctgggctttt caatgagcag cgcaagggtc agagagcaaa ggatgtgcgg 900
gagaacccgc gtgccatggc caagctgctg cgtgaggcta atcggctcaa aaccgtcctc 960
agtgccaacg ctgaccacat ggcacagatt gaaggcctga tggatgatgt ggacttcaag 1020
gcaaaagtga ctcgtgtgga atttgaggag ttgtgtgcag acttgtttga gcgggtgcct 1080
gggcctgtac agcaggccct ccagagtgcc gaaatgagtc tggatgagat tgagcaggtg 1140
atcctggtgg gtggggccac tcgggtcccc agagttcagg aggtgctgct gaaggccgtg 1200
ggcaaggagg agctggggaa gaacatcaat gcagatgaag cagccgccat gggggcagtg 1260
taccaggcag ctgcgctcag caaagccttt aaagtgaagc catttgtcgt ccgagatgca 1320
gtggtctacc ccatcctggt ggagttcacg agggaggtgg aggaggagcc tgggattcac 1380
agcctgaagc acaataaacg ggtactcttc tctcggatgg ggccctaccc tcaacgcaaa 1440
gtcatcacct ttaaccgcta cagccatgat ttcaacttcc acatcaacta cggcgacctg 1500
ggcttcctgg ggcctgaaga tcttcgggta tttggctccc agaatctgac cacagtgaag 1560
ctaaaagggg tgggtgacag cttcaagaag tatcctgact acgagtccaa gggcatcaag 1620
gctcacttca acctggatga gagtggcgtg ctcagtctag acagggtgga gtctgtattt 1680
gagacactgg tagaggacag cgcagaagag gaatctactc tcaccaaact tggcaacacc 1740
atttccagcc tgtttggagg cggtaccaca ccagatgcca aggagaatgg tactgatact 1800
gtccaggagg aagaggagag ccctgcagag gggagcaagg acgagcctgg ggagcaggtg 1860
gagctcaagg aggaagctga ggccccagtg gaggatggct ctcagccccc accccctgaa 1920
cctaagggag atgcaacccc tgagggagaa aaggccacag aaaaagaaaa tggggacaag 1980
tctgaggccc agaaaccaag tgagaaggca gaggcagggc ctgagggcgt cgctccagcc 2040
ccagagggag agaagaagca gaagcccgcc aggaagcggc gaatggtaga ggagatcggg 2100
gtggagctgg ttgttctgga cctgcctgac ttgccagagg ataagctggc tcagtcggtg 2160
cagaaacttc aggacttgac actccgagac ctggagaagc aggaacggga aaaagctgcc 2220
aacagcttgg aagcattcat atttgagacc caggacaagc tgtaccagcc cgagtaccag 2280
gaagtgtcca cagaggagca gcgtgaggag atctctggga agctcagcgc cgcatccacc 2340
tggctggagg atgagggtgt tggagccacc acagtgatgt tgaaggagaa gctggctgag 2400
ctgaggaagc tgtgccaagg gctgtttttt cgggtagagg agcgcaagaa gtggcccgaa 2460
cggctgtctg ccctcgataa tctcctcaac cattccagca tgttcctcaa gggggcccgg 2520
ctcatcccag agatggacca gatcttcact gaggtggaga tgacaacgtt agagaaagtc 2580
atcaatgaga cctgggcctg gaagaatgca actctggccg agcaggctaa gctgcccgcc 2640
acagagaagc ctgtgttgct ctcaaaagac attgaagcta agatgatggc cctggaccga 2700
gaggtgcagt atctgctcaa taaggccaag tttaccaagc cccggccccg gcctaaggac 2760
aagaatggga cccgggcaga gccacccctc aatgccagtg ccagtgacca gggggagaag 2820
gtcatccctc cagcaggcca gactgaagat gcagagccca tttcagaacc tgagaaagta 2880
gagactggat ccgagccagg agacactgag cctttggagt taggaggtcc tggagcagaa 2940
cctgaacaga aagaacaatc gacaggacag aagcggcctt tgaagaacga cgaactataa 3000
<210> 74
<211> 999
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hHYOU1
<400> 74
Met Ala Asp Lys Val Arg Arg Gln Arg Pro Arg Arg Arg Val Cys Trp
1 5 10 15
Ala Leu Val Ala Val Leu Leu Ala Asp Leu Leu Ala Leu Ser Asp Thr
20 25 30
Leu Ala Val Met Ser Val Asp Leu Gly Ser Glu Ser Met Lys Val Ala
35 40 45
Ile Val Lys Pro Gly Val Pro Met Glu Ile Val Leu Asn Lys Glu Ser
50 55 60
Arg Arg Lys Thr Pro Val Ile Val Thr Leu Lys Glu Asn Glu Arg Phe
65 70 75 80
Phe Gly Asp Ser Ala Ala Ser Met Ala Ile Lys Asn Pro Lys Ala Thr
85 90 95
Leu Arg Tyr Phe Gln His Leu Leu Gly Lys Gln Ala Asp Asn Pro His
100 105 110
Val Ala Leu Tyr Gln Ala Arg Phe Pro Glu His Glu Leu Thr Phe Asp
115 120 125
Pro Gln Arg Gln Thr Val His Phe Gln Ile Ser Ser Gln Leu Gln Phe
130 135 140
Ser Pro Glu Glu Val Leu Gly Met Val Leu Asn Tyr Ser Arg Ser Leu
145 150 155 160
Ala Glu Asp Phe Ala Glu Gln Pro Ile Lys Asp Ala Val Ile Thr Val
165 170 175
Pro Val Phe Phe Asn Gln Ala Glu Arg Arg Ala Val Leu Gln Ala Ala
180 185 190
Arg Met Ala Gly Leu Lys Val Leu Gln Leu Ile Asn Asp Asn Thr Ala
195 200 205
Thr Ala Leu Ser Tyr Gly Val Phe Arg Arg Lys Asp Ile Asn Thr Thr
210 215 220
Ala Gln Asn Ile Met Phe Tyr Asp Met Gly Ser Gly Ser Thr Val Cys
225 230 235 240
Thr Ile Val Thr Tyr Gln Met Val Lys Thr Lys Glu Ala Gly Met Gln
245 250 255
Pro Gln Leu Gln Ile Arg Gly Val Gly Phe Asp Arg Thr Leu Gly Gly
260 265 270
Leu Glu Met Glu Leu Arg Leu Arg Glu Arg Leu Ala Gly Leu Phe Asn
275 280 285
Glu Gln Arg Lys Gly Gln Arg Ala Lys Asp Val Arg Glu Asn Pro Arg
290 295 300
Ala Met Ala Lys Leu Leu Arg Glu Ala Asn Arg Leu Lys Thr Val Leu
305 310 315 320
Ser Ala Asn Ala Asp His Met Ala Gln Ile Glu Gly Leu Met Asp Asp
325 330 335
Val Asp Phe Lys Ala Lys Val Thr Arg Val Glu Phe Glu Glu Leu Cys
340 345 350
Ala Asp Leu Phe Glu Arg Val Pro Gly Pro Val Gln Gln Ala Leu Gln
355 360 365
Ser Ala Glu Met Ser Leu Asp Glu Ile Glu Gln Val Ile Leu Val Gly
370 375 380
Gly Ala Thr Arg Val Pro Arg Val Gln Glu Val Leu Leu Lys Ala Val
385 390 395 400
Gly Lys Glu Glu Leu Gly Lys Asn Ile Asn Ala Asp Glu Ala Ala Ala
405 410 415
Met Gly Ala Val Tyr Gln Ala Ala Ala Leu Ser Lys Ala Phe Lys Val
420 425 430
Lys Pro Phe Val Val Arg Asp Ala Val Val Tyr Pro Ile Leu Val Glu
435 440 445
Phe Thr Arg Glu Val Glu Glu Glu Pro Gly Ile His Ser Leu Lys His
450 455 460
Asn Lys Arg Val Leu Phe Ser Arg Met Gly Pro Tyr Pro Gln Arg Lys
465 470 475 480
Val Ile Thr Phe Asn Arg Tyr Ser His Asp Phe Asn Phe His Ile Asn
485 490 495
Tyr Gly Asp Leu Gly Phe Leu Gly Pro Glu Asp Leu Arg Val Phe Gly
500 505 510
Ser Gln Asn Leu Thr Thr Val Lys Leu Lys Gly Val Gly Asp Ser Phe
515 520 525
Lys Lys Tyr Pro Asp Tyr Glu Ser Lys Gly Ile Lys Ala His Phe Asn
530 535 540
Leu Asp Glu Ser Gly Val Leu Ser Leu Asp Arg Val Glu Ser Val Phe
545 550 555 560
Glu Thr Leu Val Glu Asp Ser Ala Glu Glu Glu Ser Thr Leu Thr Lys
565 570 575
Leu Gly Asn Thr Ile Ser Ser Leu Phe Gly Gly Gly Thr Thr Pro Asp
580 585 590
Ala Lys Glu Asn Gly Thr Asp Thr Val Gln Glu Glu Glu Glu Ser Pro
595 600 605
Ala Glu Gly Ser Lys Asp Glu Pro Gly Glu Gln Val Glu Leu Lys Glu
610 615 620
Glu Ala Glu Ala Pro Val Glu Asp Gly Ser Gln Pro Pro Pro Pro Glu
625 630 635 640
Pro Lys Gly Asp Ala Thr Pro Glu Gly Glu Lys Ala Thr Glu Lys Glu
645 650 655
Asn Gly Asp Lys Ser Glu Ala Gln Lys Pro Ser Glu Lys Ala Glu Ala
660 665 670
Gly Pro Glu Gly Val Ala Pro Ala Pro Glu Gly Glu Lys Lys Gln Lys
675 680 685
Pro Ala Arg Lys Arg Arg Met Val Glu Glu Ile Gly Val Glu Leu Val
690 695 700
Val Leu Asp Leu Pro Asp Leu Pro Glu Asp Lys Leu Ala Gln Ser Val
705 710 715 720
Gln Lys Leu Gln Asp Leu Thr Leu Arg Asp Leu Glu Lys Gln Glu Arg
725 730 735
Glu Lys Ala Ala Asn Ser Leu Glu Ala Phe Ile Phe Glu Thr Gln Asp
740 745 750
Lys Leu Tyr Gln Pro Glu Tyr Gln Glu Val Ser Thr Glu Glu Gln Arg
755 760 765
Glu Glu Ile Ser Gly Lys Leu Ser Ala Ala Ser Thr Trp Leu Glu Asp
770 775 780
Glu Gly Val Gly Ala Thr Thr Val Met Leu Lys Glu Lys Leu Ala Glu
785 790 795 800
Leu Arg Lys Leu Cys Gln Gly Leu Phe Phe Arg Val Glu Glu Arg Lys
805 810 815
Lys Trp Pro Glu Arg Leu Ser Ala Leu Asp Asn Leu Leu Asn His Ser
820 825 830
Ser Met Phe Leu Lys Gly Ala Arg Leu Ile Pro Glu Met Asp Gln Ile
835 840 845
Phe Thr Glu Val Glu Met Thr Thr Leu Glu Lys Val Ile Asn Glu Thr
850 855 860
Trp Ala Trp Lys Asn Ala Thr Leu Ala Glu Gln Ala Lys Leu Pro Ala
865 870 875 880
Thr Glu Lys Pro Val Leu Leu Ser Lys Asp Ile Glu Ala Lys Met Met
885 890 895
Ala Leu Asp Arg Glu Val Gln Tyr Leu Leu Asn Lys Ala Lys Phe Thr
900 905 910
Lys Pro Arg Pro Arg Pro Lys Asp Lys Asn Gly Thr Arg Ala Glu Pro
915 920 925
Pro Leu Asn Ala Ser Ala Ser Asp Gln Gly Glu Lys Val Ile Pro Pro
930 935 940
Ala Gly Gln Thr Glu Asp Ala Glu Pro Ile Ser Glu Pro Glu Lys Val
945 950 955 960
Glu Thr Gly Ser Glu Pro Gly Asp Thr Glu Pro Leu Glu Leu Gly Gly
965 970 975
Pro Gly Ala Glu Pro Glu Gln Lys Glu Gln Ser Thr Gly Gln Lys Arg
980 985 990
Pro Leu Lys Asn Asp Glu Leu
995
<210> 75
<211> 1305
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hCMP-SAS
<400> 75
atggactcgg tggagaaggg ggccgccacc tccgtctcca acccgcgggg gcgaccgtcc 60
cggggccggc cgccgaagct gcagcgcaac tctcgcggcg gccagggccg aggtgtggag 120
aagcccccgc acctggcagc cctaattctg gcccggggag gcagcaaagg catccccctg 180
aagaacatta agcacctggc gggggtcccg ctcattggct gggtcctgcg tgcggccctg 240
gattcagggg ccttccagag tgtatgggtt tcgacagacc atgatgaaat tgagaatgtg 300
gccaaacaat ttggtgcaca agttcatcga agaagttctg aagtttcaaa agacagctct 360
acctcactag atgccatcat agaatttctt aattatcata atgaggttga cattgtagga 420
aatattcaag ctacttctcc atgtttacat cctactgatc ttcaaaaagt tgcagaaatg 480
attcgagaag aaggatatga ttctgttttc tctgttgtga gacgccatca gtttcgatgg 540
agtgaaattc agaaaggagt tcgtgaagtg accgaacctc tgaatttaaa tccagctaaa 600
cggcctcgtc gacaagactg ggatggagaa ttatatgaaa atggctcatt ttattttgct 660
aaaagacatt tgatagagat gggttacttg cagggtggaa aaatggcata ctacgaaatg 720
cgagctgaac atagtgtgga tatagatgtg gatattgatt ggcctattgc agagcaaaga 780
gtattaagat atggctattt tggcaaagag aagcttaagg aaataaaact tttggtttgc 840
aatattgatg gatgtctcac caatggccac atttatgtat caggagacca aaaagaaata 900
atatcttatg atgtaaaaga tgctattggg ataagtttat taaagaaaag tggtattgag 960
gtgaggctaa tctcagaaag ggcctgttca aagcagacgc tgtcttcttt aaaactggat 1020
tgcaaaatgg aagtcagtgt atcagacaag ctagcagttg tagatgaatg gagaaaagaa 1080
atgggcctgt gctggaaaga agtggcatat cttggaaatg aagtgtctga tgaagagtgc 1140
ttgaagagag tgggcctaag tggcgctcct gctgatgcct gttctactgc ccagaaggct 1200
gttggataca tttgcaaatg taatggtggc cgtggtgcca tccgagaatt tgcagagcac 1260
atttgcctac taatggaaaa ggttaataat tcatgccaaa aatag 1305
<210> 76
<211> 434
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hCMP-SAS
<400> 76
Met Asp Ser Val Glu Lys Gly Ala Ala Thr Ser Val Ser Asn Pro Arg
1 5 10 15
Gly Arg Pro Ser Arg Gly Arg Pro Pro Lys Leu Gln Arg Asn Ser Arg
20 25 30
Gly Gly Gln Gly Arg Gly Val Glu Lys Pro Pro His Leu Ala Ala Leu
35 40 45
Ile Leu Ala Arg Gly Gly Ser Lys Gly Ile Pro Leu Lys Asn Ile Lys
50 55 60
His Leu Ala Gly Val Pro Leu Ile Gly Trp Val Leu Arg Ala Ala Leu
65 70 75 80
Asp Ser Gly Ala Phe Gln Ser Val Trp Val Ser Thr Asp His Asp Glu
85 90 95
Ile Glu Asn Val Ala Lys Gln Phe Gly Ala Gln Val His Arg Arg Ser
100 105 110
Ser Glu Val Ser Lys Asp Ser Ser Thr Ser Leu Asp Ala Ile Ile Glu
115 120 125
Phe Leu Asn Tyr His Asn Glu Val Asp Ile Val Gly Asn Ile Gln Ala
130 135 140
Thr Ser Pro Cys Leu His Pro Thr Asp Leu Gln Lys Val Ala Glu Met
145 150 155 160
Ile Arg Glu Glu Gly Tyr Asp Ser Val Phe Ser Val Val Arg Arg His
165 170 175
Gln Phe Arg Trp Ser Glu Ile Gln Lys Gly Val Arg Glu Val Thr Glu
180 185 190
Pro Leu Asn Leu Asn Pro Ala Lys Arg Pro Arg Arg Gln Asp Trp Asp
195 200 205
Gly Glu Leu Tyr Glu Asn Gly Ser Phe Tyr Phe Ala Lys Arg His Leu
210 215 220
Ile Glu Met Gly Tyr Leu Gln Gly Gly Lys Met Ala Tyr Tyr Glu Met
225 230 235 240
Arg Ala Glu His Ser Val Asp Ile Asp Val Asp Ile Asp Trp Pro Ile
245 250 255
Ala Glu Gln Arg Val Leu Arg Tyr Gly Tyr Phe Gly Lys Glu Lys Leu
260 265 270
Lys Glu Ile Lys Leu Leu Val Cys Asn Ile Asp Gly Cys Leu Thr Asn
275 280 285
Gly His Ile Tyr Val Ser Gly Asp Gln Lys Glu Ile Ile Ser Tyr Asp
290 295 300
Val Lys Asp Ala Ile Gly Ile Ser Leu Leu Lys Lys Ser Gly Ile Glu
305 310 315 320
Val Arg Leu Ile Ser Glu Arg Ala Cys Ser Lys Gln Thr Leu Ser Ser
325 330 335
Leu Lys Leu Asp Cys Lys Met Glu Val Ser Val Ser Asp Lys Leu Ala
340 345 350
Val Val Asp Glu Trp Arg Lys Glu Met Gly Leu Cys Trp Lys Glu Val
355 360 365
Ala Tyr Leu Gly Asn Glu Val Ser Asp Glu Glu Cys Leu Lys Arg Val
370 375 380
Gly Leu Ser Gly Ala Pro Ala Asp Ala Cys Ser Thr Ala Gln Lys Ala
385 390 395 400
Val Gly Tyr Ile Cys Lys Cys Asn Gly Gly Arg Gly Ala Ile Arg Glu
405 410 415
Phe Ala Glu His Ile Cys Leu Leu Met Glu Lys Val Asn Asn Ser Cys
420 425 430
Gln Lys
<210> 77
<211> 1353
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hBeclin-1
<400> 77
atggaagggt ctaagacgtc caacaacagc accatgcagg tgagcttcgt gtgccagcgc 60
tgcagccagc ccctgaaact ggacacgagt ttcaagatcc tggaccgtgt caccatccag 120
gaactcacag ctccattact taccacagcc caggcgaaac caggagagac ccaggaggaa 180
gagactaact caggagagga gccatttatt gaaactcctc gccaggatgg tgtctctcgc 240
agattcatcc ccccagccag gatgatgtcc acagaaagtg ccaacagctt cactctgatt 300
ggggaggcat ctgatggcgg caccatggag aacctcagcc gaagactgaa ggtcactggg 360
gacctttttg acatcatgtc gggccagaca gatgtggatc acccactctg tgaggaatgc 420
acagatactc ttttagacca gctggacact cagctcaacg tcactgaaaa tgagtgtcag 480
aactacaaac gctgtttgga gatcttagag caaatgaatg aggatgacag tgaacagtta 540
cagatggagc taaaggagct ggcactagag gaggagaggc tgatccagga gctggaagac 600
gtggaaaaga accgcaagat agtggcagaa aatctcgaga aggtccaggc tgaggctgag 660
agactggatc aggaggaagc tcagtatcag agagaataca gtgaatttaa acgacagcag 720
ctggagctgg atgatgagct gaagagtgtt gaaaaccaga tgcgttatgc ccagacgcag 780
ctggataagc tgaagaaaac caacgtcttt aatgcaacct tccacatctg gcacagtgga 840
cagtttggca caatcaataa cttcaggctg ggtcgcctgc ccagtgttcc cgtggaatgg 900
aatgagatta atgctgcttg gggccagact gtgttgctgc tccatgctct ggccaataag 960
atgggtctga aatttcagag ataccgactt gttccttacg gaaaccattc atatctggag 1020
tctctgacag acaaatctaa ggagctgccg ttatactgtt ctggggggtt gcggtttttc 1080
tgggacaaca agtttgacca tgcaatggtg gctttcctgg actgtgtgca gcagttcaaa 1140
gaagaggttg agaaaggcga gacacgtttt tgtcttccct acaggatgga tgtggagaaa 1200
ggcaagattg aagacacagg aggcagtggc ggctcctatt ccatcaaaac ccagtttaac 1260
tctgaggagc agtggacaaa agctctcaag ttcatgctga cgaatcttaa gtggggtctt 1320
gcttgggtgt cctcacaatt ttataacaaa tga 1353
<210> 78
<211> 450
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hBeclin-1
<400> 78
Met Glu Gly Ser Lys Thr Ser Asn Asn Ser Thr Met Gln Val Ser Phe
1 5 10 15
Val Cys Gln Arg Cys Ser Gln Pro Leu Lys Leu Asp Thr Ser Phe Lys
20 25 30
Ile Leu Asp Arg Val Thr Ile Gln Glu Leu Thr Ala Pro Leu Leu Thr
35 40 45
Thr Ala Gln Ala Lys Pro Gly Glu Thr Gln Glu Glu Glu Thr Asn Ser
50 55 60
Gly Glu Glu Pro Phe Ile Glu Thr Pro Arg Gln Asp Gly Val Ser Arg
65 70 75 80
Arg Phe Ile Pro Pro Ala Arg Met Met Ser Thr Glu Ser Ala Asn Ser
85 90 95
Phe Thr Leu Ile Gly Glu Ala Ser Asp Gly Gly Thr Met Glu Asn Leu
100 105 110
Ser Arg Arg Leu Lys Val Thr Gly Asp Leu Phe Asp Ile Met Ser Gly
115 120 125
Gln Thr Asp Val Asp His Pro Leu Cys Glu Glu Cys Thr Asp Thr Leu
130 135 140
Leu Asp Gln Leu Asp Thr Gln Leu Asn Val Thr Glu Asn Glu Cys Gln
145 150 155 160
Asn Tyr Lys Arg Cys Leu Glu Ile Leu Glu Gln Met Asn Glu Asp Asp
165 170 175
Ser Glu Gln Leu Gln Met Glu Leu Lys Glu Leu Ala Leu Glu Glu Glu
180 185 190
Arg Leu Ile Gln Glu Leu Glu Asp Val Glu Lys Asn Arg Lys Ile Val
195 200 205
Ala Glu Asn Leu Glu Lys Val Gln Ala Glu Ala Glu Arg Leu Asp Gln
210 215 220
Glu Glu Ala Gln Tyr Gln Arg Glu Tyr Ser Glu Phe Lys Arg Gln Gln
225 230 235 240
Leu Glu Leu Asp Asp Glu Leu Lys Ser Val Glu Asn Gln Met Arg Tyr
245 250 255
Ala Gln Thr Gln Leu Asp Lys Leu Lys Lys Thr Asn Val Phe Asn Ala
260 265 270
Thr Phe His Ile Trp His Ser Gly Gln Phe Gly Thr Ile Asn Asn Phe
275 280 285
Arg Leu Gly Arg Leu Pro Ser Val Pro Val Glu Trp Asn Glu Ile Asn
290 295 300
Ala Ala Trp Gly Gln Thr Val Leu Leu Leu His Ala Leu Ala Asn Lys
305 310 315 320
Met Gly Leu Lys Phe Gln Arg Tyr Arg Leu Val Pro Tyr Gly Asn His
325 330 335
Ser Tyr Leu Glu Ser Leu Thr Asp Lys Ser Lys Glu Leu Pro Leu Tyr
340 345 350
Cys Ser Gly Gly Leu Arg Phe Phe Trp Asp Asn Lys Phe Asp His Ala
355 360 365
Met Val Ala Phe Leu Asp Cys Val Gln Gln Phe Lys Glu Glu Val Glu
370 375 380
Lys Gly Glu Thr Arg Phe Cys Leu Pro Tyr Arg Met Asp Val Glu Lys
385 390 395 400
Gly Lys Ile Glu Asp Thr Gly Gly Ser Gly Gly Ser Tyr Ser Ile Lys
405 410 415
Thr Gln Phe Asn Ser Glu Glu Gln Trp Thr Lys Ala Leu Lys Phe Met
420 425 430
Leu Thr Asn Leu Lys Trp Gly Leu Ala Trp Val Ser Ser Gln Phe Tyr
435 440 445
Asn Lys
450
<210> 79
<211> 1077
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hERdj3
<400> 79
atggctccgc agaacctgag caccttttgc ctgttgctgc tatacctcat cggggcggtg 60
attgccggac gagatttcta taagatcttg ggggtgcctc gaagtgcctc tataaaggat 120
attaaaaagg cctataggaa actagccctg cagcttcatc ccgaccggaa ccctgatgat 180
ccacaagccc aggagaaatt ccaggatctg ggtgctgctt atgaggttct gtcagatagt 240
gagaaacgga aacagtacga tacttatggt gaagaaggat taaaagatgg tcatcagagc 300
tcccatggag acattttttc acacttcttt ggggattttg gtttcatgtt tggaggaacc 360
cctcgtcagc aagacagaaa tattccaaga ggaagtgata ttattgtaga tctagaagtc 420
actttggaag aagtatatgc aggaaatttt gtggaagtag ttagaaacaa acctgtggca 480
aggcaggctc ctggcaaacg gaagtgcaat tgtcggcaag agatgcggac cacccagctg 540
ggccctgggc gcttccaaat gacccaggag gtggtctgcg acgaatgccc taatgtcaaa 600
ctagtgaatg aagaacgaac gctggaagta gaaatagagc ctggggtgag agacggcatg 660
gagtacccct ttattggaga aggtgagcct cacgtggatg gggagcctgg agatttacgg 720
ttccgaatca aagttgtcaa gcacccaata tttgaaagga gaggagatga tttgtacaca 780
aatgtgacaa tctcattagt tgagtcactg gttggctttg agatggatat tactcacttg 840
gatggtcaca aggtacatat ttcccgggat aagatcacca ggccaggagc gaagctatgg 900
aagaaagggg aagggctccc caactttgac aacaacaata tcaagggctc tttgataatc 960
acttttgatg tggattttcc aaaagaacag ttaacagagg aagcgagaga aggtatcaaa 1020
cagctactga aacaagggtc agtgcagaag gtatacaatg gactgcaagg atattga 1077
<210> 80
<211> 358
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hERdj3
<400> 80
Met Ala Pro Gln Asn Leu Ser Thr Phe Cys Leu Leu Leu Leu Tyr Leu
1 5 10 15
Ile Gly Ala Val Ile Ala Gly Arg Asp Phe Tyr Lys Ile Leu Gly Val
20 25 30
Pro Arg Ser Ala Ser Ile Lys Asp Ile Lys Lys Ala Tyr Arg Lys Leu
35 40 45
Ala Leu Gln Leu His Pro Asp Arg Asn Pro Asp Asp Pro Gln Ala Gln
50 55 60
Glu Lys Phe Gln Asp Leu Gly Ala Ala Tyr Glu Val Leu Ser Asp Ser
65 70 75 80
Glu Lys Arg Lys Gln Tyr Asp Thr Tyr Gly Glu Glu Gly Leu Lys Asp
85 90 95
Gly His Gln Ser Ser His Gly Asp Ile Phe Ser His Phe Phe Gly Asp
100 105 110
Phe Gly Phe Met Phe Gly Gly Thr Pro Arg Gln Gln Asp Arg Asn Ile
115 120 125
Pro Arg Gly Ser Asp Ile Ile Val Asp Leu Glu Val Thr Leu Glu Glu
130 135 140
Val Tyr Ala Gly Asn Phe Val Glu Val Val Arg Asn Lys Pro Val Ala
145 150 155 160
Arg Gln Ala Pro Gly Lys Arg Lys Cys Asn Cys Arg Gln Glu Met Arg
165 170 175
Thr Thr Gln Leu Gly Pro Gly Arg Phe Gln Met Thr Gln Glu Val Val
180 185 190
Cys Asp Glu Cys Pro Asn Val Lys Leu Val Asn Glu Glu Arg Thr Leu
195 200 205
Glu Val Glu Ile Glu Pro Gly Val Arg Asp Gly Met Glu Tyr Pro Phe
210 215 220
Ile Gly Glu Gly Glu Pro His Val Asp Gly Glu Pro Gly Asp Leu Arg
225 230 235 240
Phe Arg Ile Lys Val Val Lys His Pro Ile Phe Glu Arg Arg Gly Asp
245 250 255
Asp Leu Tyr Thr Asn Val Thr Ile Ser Leu Val Glu Ser Leu Val Gly
260 265 270
Phe Glu Met Asp Ile Thr His Leu Asp Gly His Lys Val His Ile Ser
275 280 285
Arg Asp Lys Ile Thr Arg Pro Gly Ala Lys Leu Trp Lys Lys Gly Glu
290 295 300
Gly Leu Pro Asn Phe Asp Asn Asn Asn Ile Lys Gly Ser Leu Ile Ile
305 310 315 320
Thr Phe Asp Val Asp Phe Pro Lys Glu Gln Leu Thr Glu Glu Ala Arg
325 330 335
Glu Gly Ile Lys Gln Leu Leu Lys Gln Gly Ser Val Gln Lys Val Tyr
340 345 350
Asn Gly Leu Gln Gly Tyr
355
<210> 81
<211> 1764
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<223> CHO_AGE
<400> 81
atgaaaggaa ttctgtgggg agcgttttgt gggaaagcta atgagctgag gcagcgcctg 60
gagctgaaag aaaagggcag gcacgtggtg ctggaggcca cagagaatga ggtggagggc 120
aaaggcggca tgcttctgag ctcaggacag gcctgttgtg aggagaaggg cctggatgct 180
gaggacggtg gtggggacag caatgacctc agcagcgtca gcgagaccac agacagcaca 240
gatgtcaaag acagctcaga gacctctctg actctgcctc ctagagcctc accctgccct 300
gcaggctttt ggattcttga aactggagct agccaaagac agtttcaggc ctggtttact 360
gcggaggagg gtccgctgcc accttcgcct ccttttggcc ctgaactgac ttgcagatgg 420
agcagtctag aacagctaaa ggacatcttg gcgctcggag cacagcctca ctgggtccac 480
aagctccaag gcttctggtt tgttgaggtt atcttgtcag caaaaagatt acaggacatg 540
gagaaggagc gggcttcact gcaggcctgg aaggatcgtg tggcaaagga acttgacagc 600
gtggtcgctt tctggctgca gcactcccat gatcaggaac acgggggttt cttcacatgc 660
cttgcccgca atgggcaggt ctatgatgac cttaaatata tctggctgca ggggagacag 720
gtatggatgt attgtcgctt gtaccgcaat tttgagcgct tccgccgcgc tgagcttcta 780
gatgctgcaa aagcaggtgg tgagtttttg ctgcgttttg cacgggtggc accgcctgcc 840
aagaagtgtg cctttgtgtt gactcgggac ggccgtccag tgaaggtgca gcggaccatt 900
ttcagcgagt gtttctacac cattgctatg aatgagcttt ggagagtaac aaaggaatca 960
cgttaccaga atgaagctgt ggagatgatg gaccagattg tccactgggt acgggaagac 1020
ccagctgggc taggccggcc tcagctctca gggaccccgg atgcagagtc catggcagtg 1080
cccatgatgc tgatgaatct ggtggaccag ctttccgagg aagatgaggc actgacaaag 1140
aaatatgcag agctatggga ctggtgtgcc cagaggattc ttcagcatgt gcagagggat 1200
ggaaaagcta tactagagaa tgtatctcat gatggcaagg aactcactgg ttgccttgga 1260
agacatcaga acccaggcca cgcaatagag gctggctggt tcctgctcca gtatgcccgc 1320
aagaaaggtg acgccaaact tcgtgcacac atcatcgaca agtttctctt gttgcctttc 1380
cgctctggat gggacgctga gcatgggggc ctcttctact tccaggatgt tgatggtttc 1440
tgccccaccc agctggagtg ggacatgaag ctgtggtggc cacacaatga agccatgatt 1500
tccttcctaa tgggttacag ggacagtggt gacccagcct tgctacaaat cttcaatcag 1560
gtggctgagt acaccttcaa gcattttcat gatcccgaga acggcgaatg gttcggctat 1620
ctgaaccgag agggcaaggt ggccctcaac tttaagggag gcccatttaa aggctgcttc 1680
cacgtgccgc ggtgcctggc catgtgcgag aagatgttgg gagacctgct ccaccgtggg 1740
agcgcccctg ctggctcgaa ataa 1764
<210> 82
<211> 587
<212> PRT
<213> Cricetulus griseus
<220>
<221> MISC_FEATURE
<223> CHO_AGE
<400> 82
Met Lys Gly Ile Leu Trp Gly Ala Phe Cys Gly Lys Ala Asn Glu Leu
1 5 10 15
Arg Gln Arg Leu Glu Leu Lys Glu Lys Gly Arg His Val Val Leu Glu
20 25 30
Ala Thr Glu Asn Glu Val Glu Gly Lys Gly Gly Met Leu Leu Ser Ser
35 40 45
Gly Gln Ala Cys Cys Glu Glu Lys Gly Leu Asp Ala Glu Asp Gly Gly
50 55 60
Gly Asp Ser Asn Asp Leu Ser Ser Val Ser Glu Thr Thr Asp Ser Thr
65 70 75 80
Asp Val Lys Asp Ser Ser Glu Thr Ser Leu Thr Leu Pro Pro Arg Ala
85 90 95
Ser Pro Cys Pro Ala Gly Phe Trp Ile Leu Glu Thr Gly Ala Ser Gln
100 105 110
Arg Gln Phe Gln Ala Trp Phe Thr Ala Glu Glu Gly Pro Leu Pro Pro
115 120 125
Ser Pro Pro Phe Gly Pro Glu Leu Thr Cys Arg Trp Ser Ser Leu Glu
130 135 140
Gln Leu Lys Asp Ile Leu Ala Leu Gly Ala Gln Pro His Trp Val His
145 150 155 160
Lys Leu Gln Gly Phe Trp Phe Val Glu Val Ile Leu Ser Ala Lys Arg
165 170 175
Leu Gln Asp Met Glu Lys Glu Arg Ala Ser Leu Gln Ala Trp Lys Asp
180 185 190
Arg Val Ala Lys Glu Leu Asp Ser Val Val Ala Phe Trp Leu Gln His
195 200 205
Ser His Asp Gln Glu His Gly Gly Phe Phe Thr Cys Leu Ala Arg Asn
210 215 220
Gly Gln Val Tyr Asp Asp Leu Lys Tyr Ile Trp Leu Gln Gly Arg Gln
225 230 235 240
Val Trp Met Tyr Cys Arg Leu Tyr Arg Asn Phe Glu Arg Phe Arg Arg
245 250 255
Ala Glu Leu Leu Asp Ala Ala Lys Ala Gly Gly Glu Phe Leu Leu Arg
260 265 270
Phe Ala Arg Val Ala Pro Pro Ala Lys Lys Cys Ala Phe Val Leu Thr
275 280 285
Arg Asp Gly Arg Pro Val Lys Val Gln Arg Thr Ile Phe Ser Glu Cys
290 295 300
Phe Tyr Thr Ile Ala Met Asn Glu Leu Trp Arg Val Thr Lys Glu Ser
305 310 315 320
Arg Tyr Gln Asn Glu Ala Val Glu Met Met Asp Gln Ile Val His Trp
325 330 335
Val Arg Glu Asp Pro Ala Gly Leu Gly Arg Pro Gln Leu Ser Gly Thr
340 345 350
Pro Asp Ala Glu Ser Met Ala Val Pro Met Met Leu Met Asn Leu Val
355 360 365
Asp Gln Leu Ser Glu Glu Asp Glu Ala Leu Thr Lys Lys Tyr Ala Glu
370 375 380
Leu Trp Asp Trp Cys Ala Gln Arg Ile Leu Gln His Val Gln Arg Asp
385 390 395 400
Gly Lys Ala Ile Leu Glu Asn Val Ser His Asp Gly Lys Glu Leu Thr
405 410 415
Gly Cys Leu Gly Arg His Gln Asn Pro Gly His Ala Ile Glu Ala Gly
420 425 430
Trp Phe Leu Leu Gln Tyr Ala Arg Lys Lys Gly Asp Ala Lys Leu Arg
435 440 445
Ala His Ile Ile Asp Lys Phe Leu Leu Leu Pro Phe Arg Ser Gly Trp
450 455 460
Asp Ala Glu His Gly Gly Leu Phe Tyr Phe Gln Asp Val Asp Gly Phe
465 470 475 480
Cys Pro Thr Gln Leu Glu Trp Asp Met Lys Leu Trp Trp Pro His Asn
485 490 495
Glu Ala Met Ile Ser Phe Leu Met Gly Tyr Arg Asp Ser Gly Asp Pro
500 505 510
Ala Leu Leu Gln Ile Phe Asn Gln Val Ala Glu Tyr Thr Phe Lys His
515 520 525
Phe His Asp Pro Glu Asn Gly Glu Trp Phe Gly Tyr Leu Asn Arg Glu
530 535 540
Gly Lys Val Ala Leu Asn Phe Lys Gly Gly Pro Phe Lys Gly Cys Phe
545 550 555 560
His Val Pro Arg Cys Leu Ala Met Cys Glu Lys Met Leu Gly Asp Leu
565 570 575
Leu His Arg Gly Ser Ala Pro Ala Gly Ser Lys
580 585
<210> 83
<211> 1818
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hWip1
<400> 83
atggcggggc tgtactcgct gggagtgagc gtcttctccg accagggcgg gaggaagtac 60
atggaggacg ttactcaaat cgttgtggag cccgaaccga cggctgaaga aaagccctcg 120
ccgcggcggt cgctgtctca gccgttgcct ccgcggccgt cgccggccgc ccttcccggc 180
ggcgaagtct cggggaaagg cccagcggtg gcagcccgag aggctcgcga ccctctcccg 240
gacgccgggg cctcgccggc acctagccgc tgctgccgcc gccgttcctc cgtggccttt 300
ttcgccgtgt gcgacgggca cggcgggcgg gaggcggcac agtttgcccg ggagcacttg 360
tggggtttca tcaagaagca gaagggtttc acctcgtccg agccggctaa ggtttgcgct 420
gccatccgca aaggctttct cgcttgtcac cttgccatgt ggaagaaact ggcggaatgg 480
ccaaagacta tgacgggtct tcctagcaca tcagggacaa ctgccagtgt ggtcatcatt 540
cggggcatga agatgtatgt agctcacgta ggtgactcag gggtggttct tggaattcag 600
gatgacccga aggatgactt tgtcagagct gtggaggtga cacaggacca taagccagaa 660
cttcccaagg aaagagaacg aatcgaagga cttggtggga gtgtaatgaa caagtctggg 720
gtgaatcgtg tagtttggaa acgacctcga ctcactcaca atggacctgt tagaaggagc 780
acagttattg accagattcc ttttctggca gtagcaagag cacttggtga tttgtggagc 840
tatgatttct tcagtggtga atttgtggtg tcacctgaac cagacacaag tgtccacact 900
cttgaccctc agaagcacaa gtatattata ttggggagtg atggactttg gaatatgatt 960
ccaccacaag atgccatctc aatgtgccag gaccaagagg agaaaaaata cctgatgggt 1020
gagcatggac aatcttgtgc caaaatgctt gtgaatcgag cattgggccg ctggaggcag 1080
cgtatgctcc gagcagataa cactagtgcc atagtaatct gcatctctcc agaagtggac 1140
aatcagggaa actttaccaa tgaagatgag ttatacctga acctgactga cagcccttcc 1200
tataatagtc aagaaacctg tgtgatgact ccttccccat gttctacacc accagtcaag 1260
tcactggagg aggatccatg gccaagggtg aattctaagg accatatacc tgccctggtt 1320
cgtagcaatg ccttctcaga gaatttttta gaggtttcag ctgagatagc tcgagagaat 1380
gtccaaggtg tagtcatacc ctcaaaagat ccagaaccac ttgaagaaaa ttgcgctaaa 1440
gccctgactt taaggataca tgattctttg aataatagcc ttccaattgg ccttgtgcct 1500
actaattcaa caaacactgt catggaccaa aaaaatttga agatgtcaac tcctggccaa 1560
atgaaagccc aagaaattga aagaacccct ccaacaaact ttaaaaggac attagaagag 1620
tccaattctg gccccctgat gaagaagcat agacgaaatg gcttaagtcg aagtagtggt 1680
gctcagcctg caagtctccc cacaacctca cagcgaaaga actctgttaa actcaccatg 1740
cgacgcagac ttaggggcca gaagaaaatt ggaaatcctt tacttcatca acacaggaaa 1800
actgtttgtg tttgctga 1818
<210> 84
<211> 605
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hWip1
<400> 84
Met Ala Gly Leu Tyr Ser Leu Gly Val Ser Val Phe Ser Asp Gln Gly
1 5 10 15
Gly Arg Lys Tyr Met Glu Asp Val Thr Gln Ile Val Val Glu Pro Glu
20 25 30
Pro Thr Ala Glu Glu Lys Pro Ser Pro Arg Arg Ser Leu Ser Gln Pro
35 40 45
Leu Pro Pro Arg Pro Ser Pro Ala Ala Leu Pro Gly Gly Glu Val Ser
50 55 60
Gly Lys Gly Pro Ala Val Ala Ala Arg Glu Ala Arg Asp Pro Leu Pro
65 70 75 80
Asp Ala Gly Ala Ser Pro Ala Pro Ser Arg Cys Cys Arg Arg Arg Ser
85 90 95
Ser Val Ala Phe Phe Ala Val Cys Asp Gly His Gly Gly Arg Glu Ala
100 105 110
Ala Gln Phe Ala Arg Glu His Leu Trp Gly Phe Ile Lys Lys Gln Lys
115 120 125
Gly Phe Thr Ser Ser Glu Pro Ala Lys Val Cys Ala Ala Ile Arg Lys
130 135 140
Gly Phe Leu Ala Cys His Leu Ala Met Trp Lys Lys Leu Ala Glu Trp
145 150 155 160
Pro Lys Thr Met Thr Gly Leu Pro Ser Thr Ser Gly Thr Thr Ala Ser
165 170 175
Val Val Ile Ile Arg Gly Met Lys Met Tyr Val Ala His Val Gly Asp
180 185 190
Ser Gly Val Val Leu Gly Ile Gln Asp Asp Pro Lys Asp Asp Phe Val
195 200 205
Arg Ala Val Glu Val Thr Gln Asp His Lys Pro Glu Leu Pro Lys Glu
210 215 220
Arg Glu Arg Ile Glu Gly Leu Gly Gly Ser Val Met Asn Lys Ser Gly
225 230 235 240
Val Asn Arg Val Val Trp Lys Arg Pro Arg Leu Thr His Asn Gly Pro
245 250 255
Val Arg Arg Ser Thr Val Ile Asp Gln Ile Pro Phe Leu Ala Val Ala
260 265 270
Arg Ala Leu Gly Asp Leu Trp Ser Tyr Asp Phe Phe Ser Gly Glu Phe
275 280 285
Val Val Ser Pro Glu Pro Asp Thr Ser Val His Thr Leu Asp Pro Gln
290 295 300
Lys His Lys Tyr Ile Ile Leu Gly Ser Asp Gly Leu Trp Asn Met Ile
305 310 315 320
Pro Pro Gln Asp Ala Ile Ser Met Cys Gln Asp Gln Glu Glu Lys Lys
325 330 335
Tyr Leu Met Gly Glu His Gly Gln Ser Cys Ala Lys Met Leu Val Asn
340 345 350
Arg Ala Leu Gly Arg Trp Arg Gln Arg Met Leu Arg Ala Asp Asn Thr
355 360 365
Ser Ala Ile Val Ile Cys Ile Ser Pro Glu Val Asp Asn Gln Gly Asn
370 375 380
Phe Thr Asn Glu Asp Glu Leu Tyr Leu Asn Leu Thr Asp Ser Pro Ser
385 390 395 400
Tyr Asn Ser Gln Glu Thr Cys Val Met Thr Pro Ser Pro Cys Ser Thr
405 410 415
Pro Pro Val Lys Ser Leu Glu Glu Asp Pro Trp Pro Arg Val Asn Ser
420 425 430
Lys Asp His Ile Pro Ala Leu Val Arg Ser Asn Ala Phe Ser Glu Asn
435 440 445
Phe Leu Glu Val Ser Ala Glu Ile Ala Arg Glu Asn Val Gln Gly Val
450 455 460
Val Ile Pro Ser Lys Asp Pro Glu Pro Leu Glu Glu Asn Cys Ala Lys
465 470 475 480
Ala Leu Thr Leu Arg Ile His Asp Ser Leu Asn Asn Ser Leu Pro Ile
485 490 495
Gly Leu Val Pro Thr Asn Ser Thr Asn Thr Val Met Asp Gln Lys Asn
500 505 510
Leu Lys Met Ser Thr Pro Gly Gln Met Lys Ala Gln Glu Ile Glu Arg
515 520 525
Thr Pro Pro Thr Asn Phe Lys Arg Thr Leu Glu Glu Ser Asn Ser Gly
530 535 540
Pro Leu Met Lys Lys His Arg Arg Asn Gly Leu Ser Arg Ser Ser Gly
545 550 555 560
Ala Gln Pro Ala Ser Leu Pro Thr Thr Ser Gln Arg Lys Asn Ser Val
565 570 575
Lys Leu Thr Met Arg Arg Arg Leu Arg Gly Gln Lys Lys Ile Gly Asn
580 585 590
Pro Leu Leu His Gln His Arg Lys Thr Val Cys Val Cys
595 600 605
<210> 85
<211> 741
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hRTP4
<400> 85
atggttgtag atttctggac ttgggagcag acatttcaag aactaatcca agaggcaaaa 60
ccccgggcca catggacgct gaagttggat ggcaaccttc agctagactg cctggctcaa 120
gggtggaagc aataccaaca gagagcattt ggctggttcc ggtgttcctc ctgccagcga 180
agttgggctt ccgcccaagt gcagattctg tgccacacgt actgggagca ctggacatcc 240
cagggtcagg tgcgtatgag gctctttggc caaaggtgcc agaagtgctc ctggtcccaa 300
tatgagatgc ctgagttctc ctcggatagc accatgagga ttctgagcaa cctggtgcag 360
catatactga agaaatacta tggaaatggc acgaggaagt ctccagaaat gccagtaatc 420
ctggaagtgt ccctggaagg atcccatgac acagccaatt gtgaggcatg cactttgggc 480
atctgtggac agggcttaaa aagctgcatg acaaagccgt ccaaatccct actcccccac 540
ctaaagactg ggaattcctc acctggaatt ggtgctgtgt acctcgcaaa ccaagccaag 600
aaccagtcag ctgaggcaaa agaggctaag gggagtgggt atgagaaatt agggcccagt 660
cgagacccag atccactgaa catctgtgtc tttattttgc tgcttgtatt tattgtagtc 720
aaatgcttta catcagaatg a 741
<210> 86
<211> 246
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hRTP4
<400> 86
Met Val Val Asp Phe Trp Thr Trp Glu Gln Thr Phe Gln Glu Leu Ile
1 5 10 15
Gln Glu Ala Lys Pro Arg Ala Thr Trp Thr Leu Lys Leu Asp Gly Asn
20 25 30
Leu Gln Leu Asp Cys Leu Ala Gln Gly Trp Lys Gln Tyr Gln Gln Arg
35 40 45
Ala Phe Gly Trp Phe Arg Cys Ser Ser Cys Gln Arg Ser Trp Ala Ser
50 55 60
Ala Gln Val Gln Ile Leu Cys His Thr Tyr Trp Glu His Trp Thr Ser
65 70 75 80
Gln Gly Gln Val Arg Met Arg Leu Phe Gly Gln Arg Cys Gln Lys Cys
85 90 95
Ser Trp Ser Gln Tyr Glu Met Pro Glu Phe Ser Ser Asp Ser Thr Met
100 105 110
Arg Ile Leu Ser Asn Leu Val Gln His Ile Leu Lys Lys Tyr Tyr Gly
115 120 125
Asn Gly Thr Arg Lys Ser Pro Glu Met Pro Val Ile Leu Glu Val Ser
130 135 140
Leu Glu Gly Ser His Asp Thr Ala Asn Cys Glu Ala Cys Thr Leu Gly
145 150 155 160
Ile Cys Gly Gln Gly Leu Lys Ser Cys Met Thr Lys Pro Ser Lys Ser
165 170 175
Leu Leu Pro His Leu Lys Thr Gly Asn Ser Ser Pro Gly Ile Gly Ala
180 185 190
Val Tyr Leu Ala Asn Gln Ala Lys Asn Gln Ser Ala Glu Ala Lys Glu
195 200 205
Ala Lys Gly Ser Gly Tyr Glu Lys Leu Gly Pro Ser Arg Asp Pro Asp
210 215 220
Pro Leu Asn Ile Cys Val Phe Ile Leu Leu Leu Val Phe Ile Val Val
225 230 235 240
Lys Cys Phe Thr Ser Glu
245
<210> 87
<211> 765
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hREEP2
<400> 87
atggtgtcct ggatcatctc tcgcctggtg gtgctcatct ttggcaccct gtacccagcc 60
tattcttcct acaaggccgt gaagacaaaa aacgtgaagg aatatgtgaa atggatgatg 120
tactggatcg tctttgcctt cttcaccacg gccgagacgc tcacggatat agtgctctcc 180
tggttcccct tctactttga actgaagatc gccttcgtga tatggctgct gtccccttac 240
accaagggct ccagcgtgct ctaccgcaag ttcgtgcacc caacgctgtc caacaaggag 300
aaggagatcg acgagtacat cacgcaggcc cgagacaaga gctatgagac catgatgagg 360
gtgggcaaga ggggcctgaa ccttgccgcc aatgctgcag tcacagctgc cgccaagggc 420
cagggggtgc tgtcagagaa gctccgcagc ttcagcatgc aggacctgac cctgatccgg 480
gacgaggacg cactgcccct gcagaggcct gacggccgcc tccgacccag ccctggcagc 540
ctcctggaca ccatcgagga cttaggagat gaccctgccc tgagtctaag gtccagcaca 600
aacccggcag attcccggac agaggcttct gaggatgaca tgggagacaa agctcccaag 660
agggccaaac ccatcaaaaa agcgcccaaa gctgagccac tggcttccaa gacactgaag 720
acccggccca agaagaagac ctctggcggg ggcgactcag cttga 765
<210> 88
<211> 254
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hREEP2
<400> 88
Met Val Ser Trp Ile Ile Ser Arg Leu Val Val Leu Ile Phe Gly Thr
1 5 10 15
Leu Tyr Pro Ala Tyr Ser Ser Tyr Lys Ala Val Lys Thr Lys Asn Val
20 25 30
Lys Glu Tyr Val Lys Trp Met Met Tyr Trp Ile Val Phe Ala Phe Phe
35 40 45
Thr Thr Ala Glu Thr Leu Thr Asp Ile Val Leu Ser Trp Phe Pro Phe
50 55 60
Tyr Phe Glu Leu Lys Ile Ala Phe Val Ile Trp Leu Leu Ser Pro Tyr
65 70 75 80
Thr Lys Gly Ser Ser Val Leu Tyr Arg Lys Phe Val His Pro Thr Leu
85 90 95
Ser Asn Lys Glu Lys Glu Ile Asp Glu Tyr Ile Thr Gln Ala Arg Asp
100 105 110
Lys Ser Tyr Glu Thr Met Met Arg Val Gly Lys Arg Gly Leu Asn Leu
115 120 125
Ala Ala Asn Ala Ala Val Thr Ala Ala Ala Lys Gly Gln Gly Val Leu
130 135 140
Ser Glu Lys Leu Arg Ser Phe Ser Met Gln Asp Leu Thr Leu Ile Arg
145 150 155 160
Asp Glu Asp Ala Leu Pro Leu Gln Arg Pro Asp Gly Arg Leu Arg Pro
165 170 175
Ser Pro Gly Ser Leu Leu Asp Thr Ile Glu Asp Leu Gly Asp Asp Pro
180 185 190
Ala Leu Ser Leu Arg Ser Ser Thr Asn Pro Ala Asp Ser Arg Thr Glu
195 200 205
Ala Ser Glu Asp Asp Met Gly Asp Lys Ala Pro Lys Arg Ala Lys Pro
210 215 220
Ile Lys Lys Ala Pro Lys Ala Glu Pro Leu Ala Ser Lys Thr Leu Lys
225 230 235 240
Thr Arg Pro Lys Lys Lys Thr Ser Gly Gly Gly Asp Ser Ala
245 250
<210> 89
<211> 783
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hDPM1
<400> 89
atggcctcct tggaagtcag tcgtagtcct cgcaggtctc ggcgggagct ggaagtgcgc 60
agtccacgac agaacaaata ttcggtgctt ttacctacct acaacgagcg cgagaacctg 120
ccgctcatcg tgtggctgct ggtgaaaagc ttctccgaga gtggaatcaa ctatgaaatt 180
ataatcatag atgatggaag cccagatgga acaagggatg ttgctgaaca gttggagaag 240
atctatgggt cagacagaat tcttctaaga ccacgagaga aaaagttggg actaggaact 300
gcatatattc atggaatgaa acatgccaca ggaaactaca tcattattat ggatgctgat 360
ctctcacacc atccaaaatt tattcctgaa tttattagga agcaaaagga gggtaatttt 420
gatattgtct ctggaactcg ctacaaagga aatggaggtg tatatggctg ggatttgaaa 480
agaaaaataa tcagccgtgg ggccaatttt ttaactcaga tcttgctgag accaggagca 540
tctgatttaa caggaagttt cagattatac cgaaaagaag ttctagagaa attaatagaa 600
aaatgtgttt ctaaaggcta cgtcttccag atggagatga ttgttcgggc aagacagttg 660
aattatacta ttggcgaggt tccaatatca tttgtggatc gtgtttatgg tgaatccaag 720
ttgggaggaa atgaaatagt atctttcttg aaaggattat tgactctttt tgctactaca 780
taa 783
<210> 90
<211> 260
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hDPM1
<400> 90
Met Ala Ser Leu Glu Val Ser Arg Ser Pro Arg Arg Ser Arg Arg Glu
1 5 10 15
Leu Glu Val Arg Ser Pro Arg Gln Asn Lys Tyr Ser Val Leu Leu Pro
20 25 30
Thr Tyr Asn Glu Arg Glu Asn Leu Pro Leu Ile Val Trp Leu Leu Val
35 40 45
Lys Ser Phe Ser Glu Ser Gly Ile Asn Tyr Glu Ile Ile Ile Ile Asp
50 55 60
Asp Gly Ser Pro Asp Gly Thr Arg Asp Val Ala Glu Gln Leu Glu Lys
65 70 75 80
Ile Tyr Gly Ser Asp Arg Ile Leu Leu Arg Pro Arg Glu Lys Lys Leu
85 90 95
Gly Leu Gly Thr Ala Tyr Ile His Gly Met Lys His Ala Thr Gly Asn
100 105 110
Tyr Ile Ile Ile Met Asp Ala Asp Leu Ser His His Pro Lys Phe Ile
115 120 125
Pro Glu Phe Ile Arg Lys Gln Lys Glu Gly Asn Phe Asp Ile Val Ser
130 135 140
Gly Thr Arg Tyr Lys Gly Asn Gly Gly Val Tyr Gly Trp Asp Leu Lys
145 150 155 160
Arg Lys Ile Ile Ser Arg Gly Ala Asn Phe Leu Thr Gln Ile Leu Leu
165 170 175
Arg Pro Gly Ala Ser Asp Leu Thr Gly Ser Phe Arg Leu Tyr Arg Lys
180 185 190
Glu Val Leu Glu Lys Leu Ile Glu Lys Cys Val Ser Lys Gly Tyr Val
195 200 205
Phe Gln Met Glu Met Ile Val Arg Ala Arg Gln Leu Asn Tyr Thr Ile
210 215 220
Gly Glu Val Pro Ile Ser Phe Val Asp Arg Val Tyr Gly Glu Ser Lys
225 230 235 240
Leu Gly Gly Asn Glu Ile Val Ser Phe Leu Lys Gly Leu Leu Thr Leu
245 250 255
Phe Ala Thr Thr
260
<210> 91
<211> 2109
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> hDRiP78
<400> 91
atggcccaga agcaccccgg agaaagaggg ttgtatggag cccaccacag tggtggtgcc 60
tccctcagga ctttaggacc ctccgtggac cctgaaatac cttcattctc aggactcagg 120
gactcagcag ggactgctcc taatggtacc cgctgcctca cagagcactc tggtcctaag 180
cacacacagc acccaaaccc agcccattgg ttggacccaa gccatggccc cccagggggt 240
ccaggaccac ctagagatgc agaggaccct gatcagagtg agacgtcttc agaagaagaa 300
tcaggagtgg accaggaact ctcaaaagaa aacgagactg ggaaccagaa ggatgggaac 360
tcttttcttt ccattccatc tgcttgcaac tgccagggaa cacctggaat tccagaaggg 420
ccttactctg agggaggaaa tggttcttct agcaactttt gccaccactg tacctctcca 480
gctttggggg aagatgagtt ggaagaggaa tatgatgatg aagaatctct caagttcccc 540
agtgattttt cacgtgtgtc cagcggaaag aaacccccat cccggagaca gcggcaccgc 600
tttccaacga aggaggatac tcgggagggt ggacgtaggg atcccaggtc ccctggtcga 660
catcggctgg gtcggaaacg aagtcaggca gataagcgca aaggcctggg attgtgggga 720
gccgaggaac tatgtcaact tggacaggca ggcttttggt ggctgattga actgctggta 780
ttggtgggag agtacgtaga aacttgtggc catctcatct atgcctgcag gcaactgaaa 840
agcagtgatt tggacctttt tcgagtttgg atgggagtgt ggacagggcg gttagggggc 900
tgggcccagg tcatgtttca gtttctaagc caggggtttt actgtggagt aggactgttt 960
actcgttttc ttaagctgct gggtgctttg ctgctcctgg ctctggccct ctttttgggc 1020
tttctacagt tgggatggcg gtttctggtg ggactaggtg accggttagg ctggagggat 1080
aaggctacct ggctcttctc ttggctggat tctccagcct tgcagcgttg cttgactctg 1140
ctgagagata gcaggccatg gcagcggctg gtaagaatag ttcagtgggg ctggctggag 1200
ttgccttggg tcaagcagaa tattaatagg caggggaatg cacctgtagc tagtgggcgc 1260
tactgccagc ctgaagagga agtggctcga ctcttgacca tggctggggt tcctgaggat 1320
gagctaaacc ctttccatgt actgggggtt gaggccacag catcagatgt tgaactgaag 1380
aaggcctata gacagctggc agtgatggtt catcctgaca aaaatcatca tccccgggct 1440
gaggaggcct tcaaggtttt gcgagcagct tgggacattg tcagcaatgc tgaaaagcga 1500
aaggagtatg agatgaaacg aatggcagag aatgagctga gccggtcagt aaatgagttt 1560
ctgtccaagc tgcaagatga cctcaaggag gcaatgaata ctatgatgtg tagccgatgc 1620
caaggaaagc ataggaggtt tgaaatggac cgggaaccta agagtgccag atactgtgct 1680
gagtgtaata ggctgcatcc tgctgaggaa ggagactttt gggcagagtc aagcatgttg 1740
ggcctcaaga tcacctactt tgcactgatg gatggaaagg tgtatgacat cacagagtgg 1800
gctggatgcc agcgtgtagg tatctcccca gatacccaca gagtccccta tcacatctca 1860
tttggttctc ggattccagg caccagaggg cggcagagag ccaccccaga tgcccctcct 1920
gctgatcttc aggatttctt gagtcggatc tttcaagtac ccccagggca gatgcccaat 1980
gggaacttct ttgcagctcc tcagcctgcc cctggagccg ctgcagcctc taagcccaac 2040
agcacagtac ccaagggaga agccaaacct aagcggcgga agaaagtgag gaggcccttc 2100
caacgttga 2109
<210> 92
<211> 702
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> hDRiP78
<400> 92
Met Ala Gln Lys His Pro Gly Glu Arg Gly Leu Tyr Gly Ala His His
1 5 10 15
Ser Gly Gly Ala Ser Leu Arg Thr Leu Gly Pro Ser Val Asp Pro Glu
20 25 30
Ile Pro Ser Phe Ser Gly Leu Arg Asp Ser Ala Gly Thr Ala Pro Asn
35 40 45
Gly Thr Arg Cys Leu Thr Glu His Ser Gly Pro Lys His Thr Gln His
50 55 60
Pro Asn Pro Ala His Trp Leu Asp Pro Ser His Gly Pro Pro Gly Gly
65 70 75 80
Pro Gly Pro Pro Arg Asp Ala Glu Asp Pro Asp Gln Ser Glu Thr Ser
85 90 95
Ser Glu Glu Glu Ser Gly Val Asp Gln Glu Leu Ser Lys Glu Asn Glu
100 105 110
Thr Gly Asn Gln Lys Asp Gly Asn Ser Phe Leu Ser Ile Pro Ser Ala
115 120 125
Cys Asn Cys Gln Gly Thr Pro Gly Ile Pro Glu Gly Pro Tyr Ser Glu
130 135 140
Gly Gly Asn Gly Ser Ser Ser Asn Phe Cys His His Cys Thr Ser Pro
145 150 155 160
Ala Leu Gly Glu Asp Glu Leu Glu Glu Glu Tyr Asp Asp Glu Glu Ser
165 170 175
Leu Lys Phe Pro Ser Asp Phe Ser Arg Val Ser Ser Gly Lys Lys Pro
180 185 190
Pro Ser Arg Arg Gln Arg His Arg Phe Pro Thr Lys Glu Asp Thr Arg
195 200 205
Glu Gly Gly Arg Arg Asp Pro Arg Ser Pro Gly Arg His Arg Leu Gly
210 215 220
Arg Lys Arg Ser Gln Ala Asp Lys Arg Lys Gly Leu Gly Leu Trp Gly
225 230 235 240
Ala Glu Glu Leu Cys Gln Leu Gly Gln Ala Gly Phe Trp Trp Leu Ile
245 250 255
Glu Leu Leu Val Leu Val Gly Glu Tyr Val Glu Thr Cys Gly His Leu
260 265 270
Ile Tyr Ala Cys Arg Gln Leu Lys Ser Ser Asp Leu Asp Leu Phe Arg
275 280 285
Val Trp Met Gly Val Trp Thr Gly Arg Leu Gly Gly Trp Ala Gln Val
290 295 300
Met Phe Gln Phe Leu Ser Gln Gly Phe Tyr Cys Gly Val Gly Leu Phe
305 310 315 320
Thr Arg Phe Leu Lys Leu Leu Gly Ala Leu Leu Leu Leu Ala Leu Ala
325 330 335
Leu Phe Leu Gly Phe Leu Gln Leu Gly Trp Arg Phe Leu Val Gly Leu
340 345 350
Gly Asp Arg Leu Gly Trp Arg Asp Lys Ala Thr Trp Leu Phe Ser Trp
355 360 365
Leu Asp Ser Pro Ala Leu Gln Arg Cys Leu Thr Leu Leu Arg Asp Ser
370 375 380
Arg Pro Trp Gln Arg Leu Val Arg Ile Val Gln Trp Gly Trp Leu Glu
385 390 395 400
Leu Pro Trp Val Lys Gln Asn Ile Asn Arg Gln Gly Asn Ala Pro Val
405 410 415
Ala Ser Gly Arg Tyr Cys Gln Pro Glu Glu Glu Val Ala Arg Leu Leu
420 425 430
Thr Met Ala Gly Val Pro Glu Asp Glu Leu Asn Pro Phe His Val Leu
435 440 445
Gly Val Glu Ala Thr Ala Ser Asp Val Glu Leu Lys Lys Ala Tyr Arg
450 455 460
Gln Leu Ala Val Met Val His Pro Asp Lys Asn His His Pro Arg Ala
465 470 475 480
Glu Glu Ala Phe Lys Val Leu Arg Ala Ala Trp Asp Ile Val Ser Asn
485 490 495
Ala Glu Lys Arg Lys Glu Tyr Glu Met Lys Arg Met Ala Glu Asn Glu
500 505 510
Leu Ser Arg Ser Val Asn Glu Phe Leu Ser Lys Leu Gln Asp Asp Leu
515 520 525
Lys Glu Ala Met Asn Thr Met Met Cys Ser Arg Cys Gln Gly Lys His
530 535 540
Arg Arg Phe Glu Met Asp Arg Glu Pro Lys Ser Ala Arg Tyr Cys Ala
545 550 555 560
Glu Cys Asn Arg Leu His Pro Ala Glu Glu Gly Asp Phe Trp Ala Glu
565 570 575
Ser Ser Met Leu Gly Leu Lys Ile Thr Tyr Phe Ala Leu Met Asp Gly
580 585 590
Lys Val Tyr Asp Ile Thr Glu Trp Ala Gly Cys Gln Arg Val Gly Ile
595 600 605
Ser Pro Asp Thr His Arg Val Pro Tyr His Ile Ser Phe Gly Ser Arg
610 615 620
Ile Pro Gly Thr Arg Gly Arg Gln Arg Ala Thr Pro Asp Ala Pro Pro
625 630 635 640
Ala Asp Leu Gln Asp Phe Leu Ser Arg Ile Phe Gln Val Pro Pro Gly
645 650 655
Gln Met Pro Asn Gly Asn Phe Phe Ala Ala Pro Gln Pro Ala Pro Gly
660 665 670
Ala Ala Ala Ala Ser Lys Pro Asn Ser Thr Val Pro Lys Gly Glu Ala
675 680 685
Lys Pro Lys Arg Arg Lys Lys Val Arg Arg Pro Phe Gln Arg
690 695 700
<210> 93
<211> 1020
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<223> Rad51
<400> 93
atggctatgc agatgcagct tgaagcaaat gcagatactt cagtggaaga agaaagcttt 60
ggtccacaac ctatttcacg gttagagcaa tgtggcataa gtgccaatga tgtgaagaaa 120
ttagaagaag ctggtttcca tacggtggag gctgttgctt atgcaccaaa gaaggaactc 180
ataaatatta agggaattag tgaagccaaa gcagacaaaa ttctggctga ggccgctaaa 240
ttagttccaa tgggtttcac cactgcaact gaatttcacc aaaggcgttc agaaatcata 300
cagattacta ctggctccaa agagcttgac aaactgcttc aaggtggaat tgagactgga 360
tctatcacag agatgtttgg agaattccga actgggaaga cacagatctg tcatacattg 420
gctgtaacat gccagcttcc cattgatcgt ggtggaggtg aaggaaaggc catgtacatt 480
gacaccgagg gtacgtttag gccagaacgg ctgctagcag tggctgagag gtatggtctg 540
tctggcagcg atgtcctaga taatgtagca tatgctcgag ggttcaacac agaccaccaa 600
acccagctcc tttatcaagc atcagccatg atggtagaat ccagatatgc actgcttatt 660
gtagacagtg ctactgccct ctacagaaca gactactcag gtcgaggaga gctttcagcc 720
aggcaaatgc atttggccag atttctgagg atgctgctgc gacttgctga tgagtttggt 780
gtagcagtgg taatcaccaa ccaggtagta gcccaagtgg atggagcagc catgttcact 840
gcagatccca aaaaacccat tggaggaaac atcattgccc atgcatcaac aaccaggctg 900
tacctgagga aaggaagagg ggagaccaga atctgcaaag tctatgactc tccctgtctc 960
cctgaagctg aagccatgtt tgccattaat gcagatggag taggagatgc caaggactga 1020
<210> 94
<211> 1053
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<223> Rad51b
<400> 94
atgagcaaca agaaactaag acgagtaggt ttatcacaag agctgtgtga ccgtttgagc 60
agacatcaga ttgttaattg tcaggacttt ttaggtcttt ccccactgga acttatgaaa 120
gtgactggcc tgagttatgg aggtgtccag gagcttctgt atatggtcag cagggcctgt 180
gccccacaga tgcaaacagc ctatgatata aagatgcgga ggtctgctga actctcccca 240
gcgttcctgt ctactaccct ttctgctttg gacaaagccc tgcatggtgg tgtggcttgt 300
ggatcgctca cagagattac aggtccgcca ggttgtggga aaactcagtt ttgtataatg 360
atgagtgttt tagctacatt gcccaccaac atgggaggat tagaagggac tgtcgtgtat 420
attgacaccg agtctgcgtt tactgctgaa agactggtcg agattgcaga atcccgtttt 480
ccactctatt ttaacacaga agaaaaactg cttttgatga gcagtaaagt tcatcttcac 540
cgggaactca gctgtgaggc agttctgcaa aggcttgaat ctttggagga agagattatt 600
tccaaaggag ttaagcttgt gattgttgac tctattgctt ctgtggtcag aaaggagttc 660
gatcctcagc ttcagggcaa catcaaagaa aggaacaagt tcttggccaa acaagcatcc 720
ttgctgaagt acctggctga ggaattttca ctcccagtta tcttgacgaa tcaaattacg 780
acccatctga gtggagccct cccttctcaa gcagacctgg tgtctccggc tgatgatttg 840
tccctgtctg aaggcacttc tggatccagc tgtgtggtag ccgcactggg aaactcatgg 900
agtcactgtg tgaacacccg gctgattctc cagtaccttg actcagagag aaggcagatt 960
ctcattgcca agtcacctct ggctgccttc acctccttca tctataccat caagggggaa 1020
ggcctagttc ttcaaggcca agaaaggcca tag 1053
<210> 95
<211> 1101
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<223> Rad51c
<400> 95
atgcagcggg agctagtgag tttcccgctg tctcccacgg tgcgagtgaa gctggtggct 60
gcgggtttcc agacggccga ggacgtcctg ggggtgaagc cctctgagct cagcaaagaa 120
gttgggatat ctaaagagga agctttagaa actctacaaa ttgtaagaag agagagtctc 180
acagacaaac ccagatgtgc tggtgcatct gtggcaggca agaagtacac cgcactggaa 240
cttcttgagc aggagcacac ccagggcttc ataatcacct tctgctcagc gctagataac 300
attcttgggg gtggaatacc cctaatgaaa acaacggaag tttgtggtgt accaggtgtt 360
ggaaaaacac agttatgtat gcagttggca gtggatgtgc agattccaga gtgttttgga 420
ggagtggcag gtgaagcagt gtttattgat acggagggaa gttttatggt tgatagagtg 480
gtcacccttg caaatgcctg cattcagcac cttcacctta tagcaggaac acacaaggat 540
gaagaacacc agaaagcctt ggagggcttt actcttgaaa atattctttc tcatatttat 600
tatttccgtt gtcatgatta tactgagttg ctggcacaag tctatctcct tccagatttc 660
ctttcaaatc attcaaaggt gcagttagtg ataatagatg gcattgctct tccttttcga 720
catgaccttg atgatctatc ccttcgtact cgattactaa atggccttgc ccaacaaatg 780
atcagcctgg caaataatca cagattagct gttattttaa ctaatcagat gacaacaaag 840
attgataaaa atcaagcatt gcttgttcct gcattagggg aaagctgggg acatgctgct 900
acaataagac ttatttttca ctgggagcaa aagcaaaggt ttgcaacatt gtacaagtca 960
ccaagccaga aggagtccac aataccattt cagatcacac cacagggatt tagagatgct 1020
gctgtcactg cttcttcatc acagacagaa ggttcttcaa atctccggaa acggtcacga 1080
gaaccagagg aaggatgctg a 1101
<210> 96
<211> 1002
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<223> Rad51d
<400> 96
aaacatgggc gtgctcaggg tggggctgtg cccgggcctc accgaagaga tcgtccagct 60
tctgaagggc caaaggatca agacagtggc ggacctggca gctgctaacc tggaggaggt 120
agcccagaag tgtggcttgt cctacaaggc cctggttgcc ctgaggaggg tattgctggc 180
gcagttctcg gctttcccat taaacggagc agacctatat gaggaactga agacttccac 240
tgccatcctg tccacaggca ttggaagcct ggacaaacta cttgatgctg gcctctatac 300
aggggaggtg actgaaattg taggaggtcc aggtagcgga aaaacccagg tgtgcctgtg 360
tgtggctgca aatgtggccc atagcctgca gcagaatgta ctgtatgttg attccagtgg 420
aggaatgaca gcatcccgcc tcctgcagct actacaggct agaacccaag atgaggagaa 480
acaggcaggt gctctccaga ggatacaggt ggtgcatgta tttgacatct tccagatgct 540
ggatatgcta caggaccttc ggggctccat ggcccagcag tcgacatctt cttcaggcac 600
tgtgaaggtt gtgattgtgg attctgtcac tgccgtgatt gccccacttc tgggaggtca 660
gcagagggaa ggcctggcct tgatgatgca gctggcccga gagctcaaga tcctggcccg 720
ggacctagct gtggcagtgg tggtgaccaa ccacttgacc cgagacaggg atggtaggag 780
gttcaaacct gctctgggac gctcctggag ctttgtgccc agtacccgga ttctcctgga 840
tgtcaccaaa ggggctggaa cattaggcag aggccaacgc acagtgtgtc tgaccaagtc 900
tccccgccag ccaacaggtc tacaggaggt gatagacatt gggacattgg ggactgagga 960
gcagagccca gaattgcctg ccaaacagac atgatgctgt tt 1002
<210> 97
<211> 1257
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<223> Rad52
<400> 97
atggctggag ctgaggaaac agtccgtgga ggctgtgaca cccatcctcc ctttgctggt 60
gggaaatctg tgctgtgctt tgggcagagc cagtacacag cagaggaata ccaggctatc 120
cagagggctc tgaggcagcg gctgggcccg gagtacatca gcagccgcat ggctggagga 180
ggccagaagg tgtgttatat tgaaggtcat cgagtaatta acctggccaa tgagatgttt 240
ggttacaatg gctgggcaca ctccatcacc cagcagaatg tggattttgt tgacttcaac 300
aatggcaaat tctacgtggg agtctgtgca tttgtaaggg tgcagttaaa ggatggttcc 360
tatcatgagg acgtgggtta tggagttagt gagggcctaa ggtcaaaggc cttgtcactg 420
gagaaggcca ggaaggaggc tgtgactgac gggctgaagc gggcactcag gagttttgga 480
aatgcacttg gaaactgcat tctggacaaa gactatctga ggtcactaaa taagcttcca 540
cgacagctcc ctcttgaagt ggatttaact aaagcaaaga gagaagattt tgaaccatct 600
gtggaacagg caagatataa tagctgccta cagaatgaag caccgggacc cccaaaacca 660
caagaagcgg cttccccttg cagaccaagc cacccacatg attcgaacat taggctgcag 720
ggggctaagg actgcagcag ctcctgcagt ctggccgccc ccatggagag tgatgccatt 780
caccagcgca agctccggaa gctccggcag aaacagctgc agcagcagtt ccggcagcag 840
atggaggccc acctacaggg ccacacacct gccgtaaaag tgaaagccga gcgtgaggca 900
gtgcttccag accttcctcc aaaacacagt acccctgtaa ctgctgcctc agaactcctc 960
agggagaaag ccatttttcc agataaccct gaagacaacc ttgaaatgtg ggacctgact 1020
ccggatttag aggacatcat taagcccttg tctagaccag aaccacctca aacctctgcc 1080
accagagtcc aggtgatcca ggatggtgtc ctacacggcc tttgccacca gatgccacca 1140
gaaaaacatg aagctggtca cctgcaggcc cacagcactc accagcatgt attaggaaac 1200
tctgactctc ataggaagag ccaggacctg aagaaaagga aactggatcc atcctga 1257
<210> 98
<211> 2235
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<223> Rad54
<400> 98
atgaggagga gcttagctcc cagccagttg gccaggagga aaccagaagg cagatcatct 60
gatgatgaag actggcagcc tgggacagta actcctaaga aacaaaaatc cagtaatgag 120
acccagtgct tcctgtctcc ttttcggaaa cctttgactc agttaatcaa ccgaccgcct 180
tgtctggata gcagtcaaca tgaagcgttt attcgaagca ttttgtcaaa gcctttcaag 240
gtccccattc caaattatca aggtcctctg ggctgtcgag cattgggctt gaaaaaggct 300
ggtattcgtc gtgccctcca tgaccctctg gaagaaggtg ccttggttct gtatgagcct 360
cccccactaa gcgtccatga ccaactgaag ctggacaagg agaaactccc tgtccacgtg 420
gttgttgatc ctattctcag taaggtgttg cggcctcatc agagagaggg agtgaagttc 480
ctatgggagt gtgtcaccag tcgtcgaatc cctggaagcc atggctgtat catggctgat 540
gagatgggcc tgggaaagac actacagtgc atcacattga tgtggacact tttacgccag 600
agcccagagt gcaagccaga aattgagaaa gcagtggtag tgtcaccttc cagcttggtg 660
aagaactggt acaatgaggt tggaaagtgg cttggaggca ggatccaacc tctggccatc 720
gacggaggct ctaaggacga gatagaccga aaactggaag gattcatgaa ccagcgtgga 780
gcgagagtgc cttctcctat tctcatcatt tcctatgaga cttttcgcct tcatgtcgga 840
gtccttaaaa aaggaaatgt tggactggtc atatgtgatg agggacacag gcttaaaaac 900
tctgagaatc agacttacca ggccctggac agcttgaata ccagtcgtcg ggtgctcatc 960
tctgggaccc ccatccaaaa tgacttgctt gaatatttca gcttggtgca cttcgttaat 1020
tcaggcattt tgggaactgc ccaggagttc aagaagcatt ttgagctgcc aattttgagg 1080
agtcgagatg cagctgccag cgaggcagac aggcagctag gggaggaacg tcttcgagag 1140
ctcatcagta tagtgaatag gtgcctgata cggagaacat cagatatcct ctctaaatat 1200
ctgccagtga agattgagca ggtggtttgt tgtaggctga caccccttca aactgagtta 1260
tataagagat ttctgagaca ggctaagcct gaagaagaat tgcgtgaagg caagatgagc 1320
gtgtcttccc tgtcttctat cacctctcta aagaagctat gtaaccatcc agccctaatc 1380
tatgacaagt gtgtgtcagg ggaagatggc tttgaggata ctttggatat cttcccacct 1440
ggttatactt ctaaagctgt agaaccacag ctttcaggta aaatgctggt ccttgattac 1500
attctggcca tgactcgaag ccgcagcagt gataaagttg tgctggtgtc taattatact 1560
caaacgttgg atctctttga aaagctgtgc cgagctcgaa ggtacttgta tgttcgcctg 1620
gatggtacaa tgtccattaa gaagcgagcc aaggttgtgg agcgcttcaa tagtccatcg 1680
agtcccgatt ttgtcttcat gctgagcagc aaagctgggg gctgtggact taatctcatt 1740
ggtgctaacc ggctggtcat gtttgatcct gactggaacc cagccaatga tgaacaagct 1800
atggcccgag tctggcgtga tggtcaaaag aagacctgct atatttaccg actgctatct 1860
gctggaacca tagaagagaa gatctttcag cggcagagcc ataagaaggc actgagcagc 1920
tgtgtggttg atgaggagca agatgtagag agacatttct ctcttggcga gctcaaagag 1980
ctgtttaccc tggatgaagc tagcctcagc gacacacatg acaggctgca ttgccgccgt 2040
tgtgtaaaca gacgccaggt ctggccaccc cctgacggtt ctgactgtac ttcagatctg 2100
gctcagtgga accatagcac agataaacgg ggactccagg atgaggtact ccaggctgcc 2160
tgggatgctt cacctacagc catcaccttc gtcttccatc atcgttctca tgaggagcag 2220
cggggtctcc actga 2235
<210> 99
<211> 837
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<223> Xrcc2
<400> 99
atgtgcagcg actttcgtaa ggccgagtcc gggacggagc tccttgcccg gcttgaaggc 60
agaagctccc tgaaagaact agaacccaac ctgtttgctg atgaagattc accagtacat 120
ggtgatgttc ttgaatttca tggtccagaa ggaacaggaa aaacagaaat gctttatcat 180
ttaacagccc gatgtatact tccaaaatca gagggtggac tgcaaataga agtcttattt 240
attgacacag attaccactt tgacatgctc cggcttgtga cagtgctcga gcacagactg 300
tctcgaagct ccgaggagac catcaagctc tgcctgggaa gattgttcct ggcctactgc 360
agcagcagct tgcagctact gctcacgctg cactcactgg aagccctgtt ctgtagtcac 420
ccctctctct gccttctcat tgtggatagc ctgtcggctt tttactggac agaccgcgcc 480
agtggaggag agagtgtggc cctgcaggaa tccactctga agaagtgttc tcagctccta 540
gagaggcttg tcactgagta ccgcttggtg cttttcacaa caacacaaag tctaatgcag 600
aaagcctctg actcagcgga gcagcctgct tcctccaagc tcccaggtga cggagacaca 660
gactacagag cctatctctg caaggcctgg cagaaggtgg tgaagcacag agtcatcttc 720
tccagagagg acgaggctaa gagcagccgc ttctcattag tttcacgtca tttaaaaagt 780
aacagtttaa aaaaacatgc ttttatgatc agagaaagtg gggtggaatt ctgttga 837
<210> 100
<211> 1050
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<223> Xrcc3
<400> 100
atggacttgg atcaactgga cctaaatccc agaattactg ctgcaattaa gaaggggaga 60
ctgaggtcag tgaaggaggt tctgtgctac tcgggaccag acctgcagag gctcaccagc 120
ctgtccaccc acgatgtgca gcacctactg agagtggccg ctctgcacct ccagggcagc 180
cgggtcctca cagcactgca gctgttccag cagagggaga gcttccccga gcagcatcaa 240
cgcctgagcc tgggctgccc ggtcttggat cagttcctgg gtggcggcct gcccctggag 300
ggcatcactg acctggctgg tcgaagctct gcagggaaga cccagctggg gctacagctc 360
tgcttgactg tgcagttccc acgacaatat ggaggcctgg aggctggggc tgtctacatc 420
tgcacagagg atgccttccc cagcaagcgg ctgtggcagc tcattgaaca gcaacagcag 480
ctgcggacgg atgttcctgg ggaggtgatc cagaagatca gattcagcaa ccacatcttc 540
atcgagcatg cggccgacgt ggacgccttg ctggagtgtg tgagcaagag ggttcccatt 600
ctgctgtcaa gggggatggc ccgcctggta gtggttgact ctgttgctgc cccattccgt 660
tgtgagtatg atgctcaggc cttggccacc agggccaagc acctgcagtc tctgggagcc 720
gcgctccgca gactgagcag taccttccgg agccctgtgc tgtgcatcaa ccaggtgatg 780
gaaacggtgg aggagcaaga gtctatgccc aggccactgg gggcctggga tgagcacctc 840
tctccagccc ttggcatcac ctgggccaac cagatcctga tgagactgat ggttgaccgg 900
gcacatgagg acgatgcctc catgggctta cccagaagcc cggcacggac catacgggtg 960
ctctctgccc cgcacctgcc cctctcctcc tgctgctaca cggtcagtgc ggaaggcatc 1020
agagggatac cgggaaccga gtcctgctaa 1050
<210> 101
<211> 5373
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<223> Brca1
<400> 101
atggatttat ctgctgttca aatcgaagaa gtacaaaatg tccttcatgc tatgcagaaa 60
atcctggagt gtccaatctg tttggaattg atcaaagaac ccatttccac aaagtgtgac 120
cacatatttt gcaaattttg tatgctgaaa cttcttaacc agaagaaagg gccttcacaa 180
tgtcctttgt gtaagaatga gataaccaaa aggagcctgc aaggaagcac gaggtttagt 240
cagcttgttg aagagctgtt gaaaatcact gatgcttttg agcttgacac aggaatacag 300
tatgcaaacg gttacagtat ttcaaaattg aaaaattctt ctgaaccttt gaatgaggaa 360
gcttccatca tccagagtgt gggctaccga aaccgcggca aaagacttag acagattgaa 420
tctggaaatg ccaccttgaa ggacagtctc agtgtccagc tgtctaacct tggaattgtg 480
agatcaacaa agaaaaatca tcagacacag cctcgaaata aatctgtgta cattgaatta 540
gagtctgatt cttctgaaga gacagttagt aaaccagatg actgcagtgt gagagaccag 600
gaactgttac aaaccacctc tctgggagct ggagatgaag tcagtttgga ttcttcaacc 660
agagctgctt gtgagttttc tgaggacgta acaaatattg atctgcacca gtgcagtaat 720
aaagatttgg accccattga gaatcatgca actggaagat atccagaaaa atgtcaggat 780
atttctgttt caaacttaca tgtggagcca tgtggcacag atattcatgc cagctcgtta 840
cagcatgaga acagcagctt attactcact gaagacagaa tgaatgtaga aaaggctgag 900
ttctataata aaagcaaaca gtctggctta gccaggagcc aacagaacag atgggctgaa 960
agtaaagaaa catgtaatga taggcagatt cccagcactg agaaaaaggt agatccaaat 1020
actgattcct tctgtgggag aaaaaaatgg aaaaatcaga aaagtctgtg tcctgagaat 1080
tctagagcta cccaggatgt tccttggatg acactgaata gcagcattca gaaagtcaac 1140
gagtggtttt ccaaaactgg tgaaatgcta acttgtgatg gcacatctga caggaggcat 1200
gagtcaaatg ctggagcagc tgttgtgtta gaagtttcag atgaagtaga tggatgttcc 1260
agttcttcaa aagaaatgga cttagtggcc tctgatcccc ataatgcttt aaagtgtaaa 1320
agtgaaagcg acctctccaa accagtagag aacaatatcc gagataaaat atttgggaaa 1380
acgtatcaga gaaagggaag tctccctcac ttgaaccacg taactgaaat tataggcaca 1440
tttattgcag aaccacagat aacacaagaa caccccttca caaataaatt aaaacgtaaa 1500
aggagaacta catgccttca tcctgaggat tttatcaaga aagcagattt aacagttact 1560
caaaagactt ctaaaaatgt aaatcaagga actgaccaaa tggagccaga tggcctagtg 1620
atgggtatta ccagtaatgg tcaagagaat gaaacacaag gtaataatct tcagaaagag 1680
aaaaatgcta atccagtgaa gtccttggaa aaggggtctg tttccacaac taaagccaaa 1740
actataagca acagtataag tgatttggag ctagaattaa atgtccacaa ttcacaggca 1800
cctaagaaaa gtcggctgag gaggaagtct tcaaccagat gtgttcttgc actggaacca 1860
gtcagtagga atccaagccc acctgcttgt actgaatttc aaattgatag ttgtagcagc 1920
agtgaagaaa cagagaaaaa caattccaac ccaacaccag tcaagaacat tagaaagcct 1980
caactcacgg aggacacaga acctgcagca gattccaaga agaataaaga gccaaatgaa 2040
caaagaagga agagaagggc cagtgatcct ttcccagaag agaaatttat gcctggctta 2100
ttaactaact gtccaagttc tagtaaacct caaggacctg ccaatcctag ccctcagaga 2160
aaggaagtag agaaacttga aacaagccaa atgtctgaca gtaccaaaga cctgagggat 2220
ctgttgctgg atggagaaca gggtttgccc actgagaggt cggaggagag taccagtgtt 2280
tcattggtgc ctgacactga ttatgacact cagaacagtg tgtcattgct ggaagctaat 2340
gctgtcagat atgcaaaaac agtatcaagc cagtgtatga cccagtttgt agcaagtgat 2400
aaccctaacg aactggtcca tggttctaaa gatgctggaa gtggcacaga gtgcttcaag 2460
catccattga gacacgaact tagccacatt caggagacca tagaaatgga agagagtgaa 2520
cttgatactc agtatttaca gaatacattt caagcttcaa agcgtcagtc atttacttta 2580
ttttcaaaac caagagatcc ccaagaggag tgtgtaacag cttgtgcttc ctctgtgtcc 2640
ttaagggaca tgagtccaaa agtgacttct gaaggtgaac aacaagaaga aagtcgggga 2700
cacgaagagg ctgaaatcag tcacatacag gcagggcctg cgacagtggg cgtgcctctg 2760
cctcgtcagg aaggtgatcc aggcgctgat acaatgcatg ctgcagtgtg cagcctttgt 2820
ccatcatctc agtacagaag caatgaaaac tcacatccta aacaatcagc ttctcccatc 2880
atgtcttcta taaaaactgg ccatgggaaa accctgtcag aggaacaatc tgagaaacat 2940
acattgtcaa atgaaaaggc aatgggaaat gagacctttg ttcaaagcac aatgcacaca 3000
attagccaaa accacagaaa aaatggttgt caagaagcca actcaggcag tattaatgaa 3060
gtgccttcca gtggtgaaaa cttccaagga cagctaggcc gaaacagaag gactaagtta 3120
aacactgtgc ttccactagg tcttatgcaa cctggagtct gtaagcatag ttttcctgtc 3180
agtgattata aatatcttga aataaaaaag caggaaggtg agaatgttgg tgcacacttc 3240
tcttcgtgtc tgttttcaga taagctcgaa caacctgtag ggagtggtaa tgtttttcag 3300
atttgttctg agacacctga tgacctgttg gatgatgttg aaatacagga aaatactagc 3360
tttggtgaag ttgacataat ggagaagtct gctgttttta acgggagtgt ccagagacga 3420
gagctcagta ggagccctag ccctttaacc catgcatcgc tggctcggaa tctccagaga 3480
cggtctagga agttagagtc ctcagaagac agcggatctt gtgaggatga agaccttccc 3540
tgcttccaac acttacttgg ccaagtaagc aaaacacctg aacctagcag tgttgtgaca 3600
cagcctctgt cagagaaagc agaggggacc caagtgccat ggaagagtag tgttggtgac 3660
tctgataacg aggtgatctt gatagaggca tctcaggaac atcaccctag tgaggatgca 3720
aaatactctg gcagcatgtt ctcttctcag cccagtgctg tacaaggttc aactgcaaat 3780
acaagctccc aggacccctt gtttaacctt tccaaacaaa agagtcacca gtctgaggat 3840
gaggaagatt ttctaagtga caaggaattg atttcagatg atgaggaaat gggaacttgc 3900
ctagaagaag ataatgatca agaagaggat attataatcc cagattcagc tgaagcggca 3960
tctggatatg agagtgaaac aaacctttct gaagattgct cacagagtga tattttaacc 4020
actcagcaga gggccaccat gaaggataac ctgataaagc tccagcagga gatggcccac 4080
ctggaggctg tgctagaaca gcaaggggac cagccttctg tccactcctc gtctctcaca 4140
gctgaacctt gtgcccctga agacctacca aacgcagaac aaaacttatc aggaacagca 4200
attttaactt caaagaatat taatgaaaat cctgtaagcc ggaatccagc atgcgtttct 4260
gctgacaagt tccaaccaca acctccagac agttccagca gtgaaaataa agagtcaagg 4320
gaaggaaggc cttccctttt taaatctccg ttggcaggca gtaggtgctc tgcacacagc 4380
cgctctggga gtcttcaaaa cagaaactgc ccatctcaag aggagctcct ttggactgtt 4440
gaagcaggga agtcagaagg aacgccatac ctggaatctg gaatcagcct tttctctaat 4500
agagaccctg aatctgagtc ccctaaagag ccagcttatg tttgcaccac accagcttca 4560
acctctgcac ggacaatatc ccagtatcag gtttctgact ctttcgagag tccggctgct 4620
actcatgctc atactgcagt gatagaaact gtgagcaaga aaaagccaga attgacatct 4680
tcaaaaggaa gagccaataa aggaatatcc atggtggtgt caggcttgac ccccaaagaa 4740
gtaatgattg tgcaaaagtt tgctgaaaaa taccgcctca ctttaactga tgcaattact 4800
gaggagacta cccatgtcat tatgaaaaca gatgctgagc ttgtgtgtga acggacactg 4860
aaatattttc tgggaattgc aggaggaaaa tggatagtta gctattcatg ggtgattcag 4920
tctattcaag aaagaaaact tctgagtgtg catgaatttg aagtcagagg agatgttgtg 4980
actggaagaa accaccaagg tccaaagcga tccagagaat cccaggaaaa gctcttcaaa 5040
ggcctaacaa tctgttgttg tgagcccttc accaacatgc ccaaagatga gctggagaag 5100
atgctgcagc tgtgtggggc ttccgtggtg aaggagcttt cgtcactcac ccctgacacc 5160
ggtgttcatc caattgtgat tgtacagcca agtgcctgga cagaagagaa tggctgccct 5220
gagattgacc agctgtgtgg ggcgcacctg gtgatgtggg actgggtgtt ggacagtata 5280
tccgtctacc ggtgtcggga tctggacgcc tacctggtac agaatatcac ccatggccac 5340
gacagcagcg agccacagga ccccaatgat tag 5373
<210> 102
<211> 10098
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<223> Brca2
<400> 102
atgtccaatg aatacaaaag gagaccaact ttttttgaaa tttttaaggc acgatgcagc 60
acagcagact taggacctat aagcctgaat tggtttgaag aactttcttc agaagcccca 120
ccatataatt ttgagcctcc agaagaatat gaatataaga ccaacaatta tgagccacag 180
ctgtttaaaa cgccacagag gaagctctct taccatctgt tggcttcaac tccaataata 240
ttcaatgaac aaggtcaaac tctaccagta gaccagtcgc ctttcaaaga actagggaag 300
actcttggaa atagtagaca taaaaatcac cacagaacca aggccaaaat ggactccatg 360
gttgatgttg ccagtccacc tctgaagtct tgtctcagtg aaagccctct tactctgcga 420
tgcacacagg ttgtaccaca aagagaaaag ccagtgatgt gtggaagttt attttctaca 480
ccaaaaatcg aggagggtca gacacctaaa cctatttctg aaagtctggg agttgaggtg 540
gatcctgata tgtcttggtc cagttcatta gctacaccac caacccttag ttccactgtg 600
ctcatagccc gagatgggga agcacgagga attgtgtttc ctgaagactc ccccgctgtt 660
ttgaaaagct acttttccag ccacaatgaa agtctgaaaa agagtggtat atcagttccc 720
tctgtgactg acagcgagaa caaaaaccag agggaagctt ttagtcatgg attggggaaa 780
acgttagagg attcatctgg caaaacaaac agcttcaaag attgccttag gcagtcaata 840
ccaaatgttc tagaagatgg ggagacagct gcagatactt ctgaagaaga tagtttctca 900
ttatgttttc ctaagcataa aaccagaaaa atgcaaaaaa tgagaatggg caagaccagg 960
aagaaaattt tcagtgaaat aagaactgat gaattaagtg aagaaactag aagtggagct 1020
gatggaaaac attcatttgc acttgaaatt gacccaagag atagtgatcc cttagatcca 1080
gatgtgacaa accagaaatg ctttgacaat gggaatgagg aaatctgcga ggaagttgta 1140
cagtcttcag acactcgatg gtctcagcta accctttctc gtctaactgg tacccagaag 1200
ggaaaaatac ctctacctcc tatttcttct tgtaaccaaa ataattcaga aaaagacttc 1260
atagatacga aggaagaagg tattgactct gttactttag aaaattcttt gcctcatatt 1320
tctagttttc cagaaccaga aaagatgttc tgtgagaaaa ctctggtaga taaggaacat 1380
gagggacagc atcttgaatc acatgagaac tccattgcag ggaagcaagt ggtatctgga 1440
acttgtcaag cagcttgcct attgagagag ccacttgaag agtctctggg taatctcttc 1500
tcagagagtg tgactagctc agcctttaca gaagaaccca gtgcctctgc aagtggattg 1560
ggaatatgtg ctgtgtcctc acagagagag gattctttgt gtcctagttc aggtgacact 1620
ggaaactggc catcaactct cactcacact tctgcaactg tgaacaatac aggtttaata 1680
tccagtctaa aaactaaaag aagaaagttt atttactctg tcggtgacag tgcatctcat 1740
caaggaaaaa tactacaggc agacagaaag tcagagctca ctaacacttc tgctcagttc 1800
gaaacaagtg cttttgaagc gccattcacg tttacaaatg ggaattcagg tttatcagat 1860
tcttctctcc aaagaagctg tttacagaat gatgctgaag agccatcttt gtccttatcc 1920
acctcatttg tgactgcttc caagaaagaa agtagttata gtaatgcatt gatatctcag 1980
gatctccatg acaaagaagc aatagtcagt gaagaaaaac tgcagccaca tacagccctg 2040
gaaactgatt gtctgtcgtg cttgccagaa agacaatgtg aatatgatcc aaagggtccc 2100
aaagtttcag atggaaaaga agaagtctta gtctcagcat gtcatcctgc aggacagcac 2160
acagcagcag cacagcccag cagcattagc tttgaattac aggaagaccc tgtcaatggc 2220
cacaatagta caagtcctaa agaaactcct agcttgaagg tgcttctgtc aaagccagtt 2280
gtgctttcta gaggaaaagt gtcatgtaaa atgccagaga aactgcagtg tgagagttat 2340
aaagataata ctgaattaag caaaagcatt cccttgggag gaaataaaat acacatccta 2400
agtgaaaatt ctaaacctcc tgagcttctg ccacctggaa aatatgtaac agaagcatcc 2460
cccacagtga agtctcagtt caatcagaat acaaatctag cagtcaaaaa aaatgaccaa 2520
gaagaaacgc cttttatttc agaagtaaca gtcaatgtga gttctggaga acttttccca 2580
gacaatgaga ataatttcgc ctttcaagta actcatgaaa ataataagac tgccttagga 2640
agtactgtgg aactgcagga agaagacctc cgccatgcta aagggcctaa tctcaacaac 2700
tctcccacag cagtagatgg agacataggt gatgagcaag cagctcatgc actgattatg 2760
gaagactccg attcctcagc tttagtccat gagtgtgcaa agaagagcag aaatactata 2820
gagcagcatc tgaaaggaac cacagacaaa gatttcaatt cctccttgga tgtgaaatca 2880
gatgggaaca atgactatac agacaaatgg ccaggatttt tggatccagt ttttaagcat 2940
aaatttggag gtagcttcag aacagcttcc aataaagaaa taaaactttc agaacataat 3000
gttaagaaaa gcaaaatgtt cttcaaagat attgaagagg agtatcctac tagtttaacc 3060
tgtattgaca tagttaatgc ctcaccatta gcaaaccagg agatactaag tggaccttat 3120
acatttgatt tgcagtcagt cactaccatg tctgcccatc cacagagtca ggcatctgtt 3180
tcttgtgaag atactcacac atcacttcag gtgttacctt caaagcaaga ttttcattcg 3240
aatcacaatt taacacccag ccaaaaggca gaaattacag aactttctac tatcttggaa 3300
gaatcaggaa gtcagtttga attcacacag ttcaaaaagc caagccatgt agcacagaat 3360
aatatacctg aagtgcctgg aaaacagacg gttgccataa atactacttc tgaggggtgg 3420
aaaaggattg gtcttcatct cacagtggat cctgcctctg tagctcagac agatgacagc 3480
aagaaatttg aaggttctgc tggatttaga caaagctttc cttgcctgtt gaaaagcagt 3540
tgtaacaaaa atacatctag ttttttagca aatgtaaatg aaatggagtt tcgaggattt 3600
cgttctgctc ttggcacaaa gcttagtgtg tctagtgagg ctctgcaaaa agctgtgaaa 3660
ctcttcagtg acattgaaag tggtagtgag gagacttcca caaaagtcga cccaagagct 3720
ttgtcttcag gtgctcgtca tgattctggt gcttctgtgt ttaagataag gaaacaaaac 3780
agtggtaaaa gttttgatga gaaaactagt aagtgccaag taacattaca gaataatacc 3840
gaagtgacta ctggtatttt tgttgacaga aatcctgaaa attatgcaag aaatacaaaa 3900
tgtgaagata acaactctac tggttttcaa agaagtcctt ataaattaaa aaactcggag 3960
gatagtgaat caagtacaag cggcacagtt tctgttcatc aagatgatgg tgacttacca 4020
tgtgctgctg atcactgcag caagtaccct gagtcgtgtt cccaatatgt aagggaggaa 4080
aacacacaaa ttaaggaatg tgtatcagat ttaacatgtt tggaagtcat gaaagctgag 4140
gaaacatgct atattcaacc ttcagataaa gaacaattac cttcaggtaa gatggaacaa 4200
aatagaaaag attttaatat atcctttcag actgcaagtg ggaaaaatgt cagagtctct 4260
gaggagtcat taagtaaaag tatgaatatt ttaaatcaag taacagatga atcgatcatc 4320
tcttcagatt ctttgaattc taaatttcat tgtggcacaa ataacaacaa gatgggtatt 4380
tcacatcaca aggaaactac cagtactaaa aaggtatttg aagaacgttt cccagttggg 4440
actgtcagtc aattaccaac tctccagcag catcctagat gtgaaataga aagtatcaaa 4500
gaacctgctc tgttgggttt tcataccgct agtggaaaaa aagtcaaaat tatgcagaaa 4560
tctttagaca aagtgaaaaa cctttttgat gagacacagt atgttagtca tcaagggtca 4620
aaacccttga aggacagaga gaactgcaaa gaaggacttg cattaggatg tgagacaatt 4680
gaaatacctg cctccaagtg tgaagaaatg cagaagagct ttctctctaa ggagtctgaa 4740
gtgctatcta agcaaagtga tcgtttgtat aggtcgactg aaaatctcag aacatcaaat 4800
ggtacctctt ctaaagctaa tgtacatgga aacatagaaa gtgaaataga aaaaagtcct 4860
acaacttgct gcattagtca tttatcttat tcagtcactg aagattctgc tttgacatgt 4920
gacacaggac acggtagaaa aacttgtgtc agtgagtctt ctctatccaa agacagaaaa 4980
tggcttagag accgactggg tgataagctt caaaaaagag atgctgccga aattgaatgt 5040
gtaaaagaac atactgaggg ttatgctgga gatgcctcat gtgagcatag tttagacagt 5100
atcagaaatg aagttgatat aaattgtgtc tctgaaaatc aaacttcagc cctctttagt 5160
gaccctagca tgtgtcatag ctgtccatcc cattttggtt gtcattgtga taacaagcat 5220
aatgactcag gatatttctc aaaaaataaa atttattctg atactcagcc agacacgaag 5280
aatgaagaca ctgccaattt ttccagtgta tatgctacaa aagaagtaaa tatatacccg 5340
ccaactgtaa atgaagatat ttgtgttcag aaacttgaga ctaactcttc accacataca 5400
aataaaaatg tagccattga cttggctata gcagattcaa ggaattgtaa ggtatgccca 5460
tccaagttca ttacagatca ctcacaagaa actgtgaaaa cagtaaaagc aatatttaca 5520
cataacagtg ataaaacaat taagcaaaac acaaagagta aaccagatac ttgccggaca 5580
agctgtcaga aagcattgga taattcagag gattttatat gtcctagctc tttagaagat 5640
gactatatga actcacataa gacttctgtt tatacccacg atgaacaaat attacagcat 5700
aacctaagtg tgtctggact ggagaaagct caaataccac ctgttcactt ggaaacttgg 5760
gataagtgta aatctacaag ggaacttgca caggcagcct gttcttcaca catgccgggg 5820
atttttagca cagcaagtgg aaaagctgta caggtatcag acgcttcatt agaaaaggca 5880
aggcaagtgt tttctgagat ggatggtggt gctaaacagt tactttccac attgtctctg 5940
gaaagtcatg aacaatcaga ccactctggg agaagagaaa actctgtgac acataaccct 6000
gaggatgtat tgtcactccc aaaaaccttt gcaagcaatg ccaattcatc tgtattctct 6060
ggatttagta cagcaggtgg taaacgggtc acagtttcag aaagtgcctt acacaaagtt 6120
aagggaatgt tagaggaatt tgatttgatc ggaactgaac atactctcca gtgtccacct 6180
acatctgaag gtgtatcaaa aatacttcct caatattgtg ttgaaaagag aaccccagaa 6240
taccctataa actctaaatt gcagaaaacc tatgatgata aattcagttt accaaacaac 6300
tataaagaaa gtgcttcttt ggggaatact cattctcttg aagcttctcc ccaactctct 6360
cagtttaagc aagacacacg gttggtatta ggaaccaaag tatcccttct ggaaaaagaa 6420
caaaccttcc ctcaaaatat aaaaacagaa agtggtgtaa tggaaacttg tcctgatgtc 6480
cctgtgagaa caaatgtagg agactgttct gctttcgaca aaaagccaga gaactgtttt 6540
gaaacagaag cggtggagat tgccaaagct tttatggaag atgatgagct gacggattct 6600
gaaccaagtc acgacaaata ctcattgttt acctgccccc aaaatgaggc tttgttaaat 6660
ttgagaacta gaaagagaag aggaatggct gttgatgcag ttggacaacc cccaatcaaa 6720
agaagcttat taaatgagtt tgacaggata atagaaaata aaggaaaatc cttaaagcct 6780
tcaaaaagtg ctccagatgg tacaataaaa gacagaagat tgttcacgca ccacatttct 6840
ctagagccag ttacctgtgg acccttctgc tctaccagag aaaggcaaga aatgcagagt 6900
ccacatttca ctgcacctgc tcaaggactt ctgtctaaag ggcatccttc tgtgcgttcg 6960
gctttggaaa aatcttcaag caattctaca gtttcagtcc agccgactca taaagtttct 7020
gctacaagga atgaaaggac aggatgctca gtcacaggca aatcccacaa agtcttcgtc 7080
ccacctttca aaatgaaatc acagtttcac agagataaac atttgaataa caagaatatt 7140
aattcagagg aaaagaacca aaagagcaga gatggagaca gtgaagatgt gaacgacggt 7200
gacattcgtc aatttaaaaa aggcagcttc catcaagagg ccgctagaat tgtcacagag 7260
tgtgaagaag agcctttaga tttaatgaca agccttcaga atgccagaga cctacagaat 7320
atacgaatta aaaagaaaga aaggcatcag ctctgtccac agccaggcag tctgtatctt 7380
accaagtcat ccactctgcc tcggatctct ctgcaggccg cagtaggagg ccggcttccc 7440
tctgcgtgtt ctcataagca gctctatatg tatggcgttt ctaaagagtg cataagcatt 7500
aacagcaaaa atgcggaata ttttcagttt gacattcagg attattttgg taaagaggac 7560
ctgtgtgctg gaaagggcat tcagctggct gatggtggat ggctgatccc ctccaatgaa 7620
gggaaggctg gaaaagaaga attctatagg gctctgtgtg acactccagg tgtggatcca 7680
aagcttattt ctagcctctg ggtctctaat cactaccggt ggattgtgtg gaaactggca 7740
gctatggaat ttgcttttcc taaggaattt gctaacagat gcctaacccc agaaagagtg 7800
ctgcttcaac taaaatacag atacgatgtg gaaattgaca acagcagcag atcagcccta 7860
aagaagatcc tggaaaggga tgatactgct gcaaaaacac tcgttctctg tgtttctgac 7920
gtcatgtcac taagcacaac tggatcagaa acttcaggcg gcaaaactag tggtgcagat 7980
cccaagagca tagacacgat cgaactcaca gacggatggt atgctgtcaa ggcccagcta 8040
gaccctccac ttgtggctct tgtaaagagc aggagactga ctgtgggtca gaaaatcatt 8100
acccaagggg cagaactggt gggatctcct gatgcctgcg cacctctgga agcaccagac 8160
tctcttagac tgaagatttc tgccaacagc acacggcctg ctcgctggca cagcaaactg 8220
gggttctttc atgaccccag gcctttccct ctgcccttgt cctcactgtt cggtgatgga 8280
ggaagcgttg gctgtgtgga catcattgtt cagagagtgt accctttaca gtgggtggag 8340
aagacggcat caggattgta catattccgt aatgagagag aagaggagaa ggaagcagtg 8400
agatttgcag cggcccaaca gaagaaactg gaggccttgt tcaccaaaat ccaggcagag 8460
tttaaagacc atgaagaaga ctcagcgcag cggcgcgtgc tgtcccatgc actcacaagg 8520
cagcaggtct atgctctgca agatggtgca gagctctatg cagcggtgca gagtgcattg 8580
gatccagatc accttgaggg ttgtttcagt gaagagcagc tgagagcctt gaacaaacac 8640
agacaaatgt tgaatgataa gaagcaagca cagatccaat cagaattccg gaaggccgtg 8700
gagtccgctg agcaagagga gggcttatca agggatgttt caactgtgtg gaagcttcga 8760
gttacaagct acgagagaaa agaaaagtca gctctgctga gtatctggcg tccatcatca 8820
gacttacact ccctgttaac agaaggaaag agatacagaa tctatcatct ggcagtatca 8880
aaatctagga gtacatttga acgacctagc atccagttaa cagctacgaa aagaactcag 8940
tatcagcagc taccggctgc cagtgaaacc gtattccagg tttaccagcc gagggagccg 9000
cttgacttca gcagactgtt agagacagcc tttcagcctc cttgttctga agtggacctc 9060
gtaggagctg tagtttctgt tgtaagaaca acaggtcttg ctcctttggt ctacctatca 9120
gacgaatgcc ttaatttatt agtggtaaag tttgggatag accttaatga agacataaag 9180
ccacatgtgc taattgctgc aagcaacctc cagtggcacc cagaatccag atcaggagtg 9240
ccaacgttat ttgccgggaa tctttccata gtttctgcca gtccaaagga ggtctacttc 9300
cagaagcgag tcaacagaat gaggcaaact gttgagaata tcgatacatt ttacaaggag 9360
gcagaaaaga agcttttaca tctgcttaat ggaaacagtc ccaagtggtc caccccaaat 9420
aaagactcta ctcagccggc ctacacttgc cctgcttcag agctccttgc tacaggaggt 9480
cagctaatga ggttctcacc taatagtgag caaagttatc caagtccttt atcacattgc 9540
acaccaaaag aaaagtctac acccctggct cggtcagccc agatggcatc aaagtcttgt 9600
aacagggaga gagagactga tgaccgaaaa acctgcagaa aaagaagagc cttggatttt 9660
ctgagtcggc tgcccttacc tcccccggtc agtcccattt gtacctttgt ctctccggct 9720
gcacagaagg cttttcagcc gccacggagt tgtggcacca aatatgcaac acctatgaag 9780
aaaaaagaac ccagttcccc tcagaggagg acgccatttc agaaggacag tggcatttct 9840
cttctggaac aagattcggt agctgatgaa gaacttgcct tcctcaatac ccaagctctt 9900
gtacctggct caccagaaga aaatcaacaa gtacttcctg gtgactccac aagaacctct 9960
gtgccccaca acaaaagaac ccccagccag cacagaggcc agaccagcat gtaggacccc 10020
gatccaggaa ggggagtcta tctcagggat tacagaggtg gcaagggcag tgatggaaaa 10080
ttagctgtcg agtcttag 10098
<210> 103
<211> 888
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<223> Cyclin D1
<400> 103
atggaacacc agctcctgtg ctgcgaagtg gagaccatcc gccgcgcgta ccctgacacc 60
aacctcctga acgaccgagt gctgcgagcc atgctcaaga ccgaggagac ctgcgcgccc 120
tccgtgtctt acttcaagtg cgtgcagagg gagattgtgc cgtccatgcg gaaaatcgtg 180
gccacctgga tgctggaggt ctgcgaggag cagaagtgcg aagaggaggt cttccctctg 240
gccatgaact acctggaccg tttcctgtct ctggagcccc taaaaaagag ccgcctgcag 300
ctgctagggg ccacctgcat gttcgtggcc tccaagatga aggagaccat tcctttgacc 360
gccgagaagt tgtgcatcta cactgacaac tctatccggc ccgaggagct gctgcaaatg 420
gaactccttc tggtgaacaa acttaagtgg aacctggccg ccatgactcc ccacgatttc 480
atcgaacact tcctctccaa aatgccagag gcggatgaga acaagcagat catccgcaag 540
catgcgcaga cctttgtggc cctctgtgcc acagacgtga agttcatttc caacccgccc 600
tccatggtgg ctgccgggag cgtggtggct gcaatgcaag gcctgaacct gggcagcccc 660
aacaactacc tgtcctgcta ccgcacaacg cactttcttt ccagagtaat caagtgtgac 720
ccggactgcc tccgcgcctg ccaggaacag attgaggccc ttctggagtc cagcctgcgc 780
caggcccagc agaacatcaa ccccaaggcc accgaggaag agggagaagc agagggagag 840
actgacctgg cctgcacacc caccgatgta cgagatgtgg acatctga 888
<210> 104
<211> 882
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<223> Ercc1
<400> 104
atggaccttg ggaaagacga gggaagcctg ccgcagccca ccaggaagaa gtttgtgatc 60
ccactggaag acgaggcccc tcctgcaggg gccaagccct tattcagatc ctcacggaac 120
cccagcacca cggccccctc ggtcccagcg gcccctcaga cgtacgccga gtatgccatt 180
gcccagcctc caggaggggc tgggcccaca gggcccacag gctctgaacc tgtgaaggga 240
gagaaccccg gccagacggt gaaaacggga gcgaaatcca atagcatcct tgtgagcccc 300
cggcagaggg gcaaccctgt gttgaagttc gtgcgcaacg tgccctggga attcggcgag 360
gtgacccctg actatgtgct gggacagagc acttgcgccc ttttcctcag cctccgctac 420
cacaatctcc atccagacta catccacgaa cggctgcaga gcctggggaa gagctttgcc 480
ctgcgtgtgc tgttggtcca agtggatgtg aaagatcctc agaaggccct gaaggacctg 540
gctaaaatgt gtatcttagc ggactgcacc ctggtcctgg cctggagtgc cgaggaagca 600
ggacggtacc tggagaccta caaggcatat gagcagaagc ccgctgacct cctcatggag 660
aagctggagc agaacttcct gtcccgggcc accgagtgtc tgaccaccgt gaagtcagtc 720
aacaaaaccg acagccagac cctcctggct acatttggat cccttgaaca gctcttgacg 780
gcatcacggg aggacctagc cttgtgcccc ggcctgggcc cccagaaggc ccgcaggctc 840
tttgacgtcc tccatgaacc cttcctcaaa gtgccccgat ga 882
<210> 105
<211> 4473
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<223> MDC1
<400> 105
atggaaaaca cccaggttat tgactgggat gctgaagagg aggaggagac agaaataccc 60
agtgggtcct tggggtatag cttggagcct atagggcagc tgcgtctctt cagtagtact 120
catggaccag aaagagattt cccactctac cttggcaaga atgtaattgg ccgaagcccc 180
gactgctctg tggccctgcc ttttccatcc atctctaaac agcatgcagt aattgaaatc 240
tcagcttgca acaaagcccc tatcctccag gattgtggga gcctcaatgg cactcaactg 300
gtaaagcccc caaaggtcct aacccctgga gtgagccatc gtctgaagga ccaggaatta 360
attctgtttg cagactttcc ctgccagtac cgtcgcttgg atgtccctcc acctttggtc 420
tctcggggac ttctaactat agagaagacc cccagaatac agggagggtc ccaaacctcc 480
agagttttgt tggctgagga ttcggaggag gaagtagatt ttccttctgg aaggtatgtg 540
gcaaatggat caaggaatcc aacgtctcca tcagcaacag tagtaccaga aagtgatgaa 600
gaggggtctt ctccagccca aagtgtccgt gggccgtctt tgccctttga cttgggcagt 660
gacacagatg aagagctatg tccacagcca gcagttgggg agtcctcttc agttgccagg 720
gatggtgctg ctgcagaggc caagcagctg gaagctaatg gagtgacatc tggtatccag 780
ctggtactgg ctcagcctgc tgagcaaaag ctcagagatg caaaagtcaa gagtgaggct 840
ggcaatggag cggctgtggt tgggaggggc tccactgtgg gtaaggacag caacacggaa 900
atgggtgaag aacaccagcc ttccggcttt gtggacagcg atacagacgt ggaagaagac 960
aggatccctg tgaccccccc tgtagttccg gggaagaagc aagtcctgct tggagttggt 1020
aaaaaggacc ctggagcacc tgtcgtgacc catctgcagg acagcccagc tggtcgtggc 1080
acaggtgtgg aagaaggcaa gactccagtg gctggccctc cagagagaaa ccacacggcc 1140
atggtgatca gcagcgacac agatgaggaa gatggagtct cagcagcagt caccttggcc 1200
catctgaaag acagggggat ggctctgtgg agcagggagc caggcatgga agaggtcaag 1260
tcccaaccac aggtcctcgt agaacgaagc cagagtgcct ctgggaaaga cagtgacaca 1320
gacgtggagg aggaaaagag agaagtggtc cctgacagcc ccatggacac agatgaggct 1380
cttactgtcc cacattcaga gagccaagct ccccatagag ccagtgatga tgtagaccag 1440
ggtgtggata tgggctcccc tggtggtcag ctagagggaa accaggcctc ctctgccaca 1500
gtagaagaca gtagtgcaca agcagggaag gaagtcctgc ctcctgagga ggcctgggaa 1560
acagctgtgg aggaaggctc atcttcagca gcggcagatg taagacaaag caagcagcca 1620
ggagtagaag atgctgggac agagtgggct gcaactgttt gtgagcaggc gagcatgctt 1680
gaggtggggg tccaaggcag gtcacctgct acactggtag agccagtggt ggtgcctaca 1740
gctactctgg gggatcccac tcagccacag agagagggag cccagacccc cacaggaaag 1800
gagagaggag tacaaatggg caggaccaag aatgccaaag actgccgtga tgcagagtct 1860
gaagatgtgt gccttccggc tacccagtgc tttgtagaca gggagggcca gagctcagaa 1920
gctgtccaga gtttggaaga tgagcctacg caagtctttc catgcactct tccccaagag 1980
cctgggcctt cccacctcag cctgcagacg ccaggtccag gtgcccagga tgtgccttgg 2040
gaagtcttag ctacacagcc gttttgtctg agagaagctg aggcctctga actgcagctc 2100
atggacaccc accctgcagc tcatgaatcc cacccatctg tgtctagtgc atcagcagga 2160
cagcagcatc tggttcacac agagccgctg ggaattgaag gcggagagat gcaaactgtg 2220
gagaaagcca tgggccaatt gagttgcaag atggcatctg ctggagagga ctcaaggggt 2280
gatccagaac cctcggccca tcgcctgctt tctccagttc ctgaagcttc ttctccacct 2340
cagagtctgc tcacctctca gagccaaaag ccgtctacac cccagtctct gttacttacc 2400
tctccccctt ctgagctaca ccttcctgaa actcctcaca ccaagcctaa tgtcaggcct 2460
cggcggtcct ccaggatgac ctcctcccca cactcctctg ctgcccttaa gccctatact 2520
acctgcccca caaacctgcc tgctgcccct agaccaacat ctcgggctac tcggggcagg 2580
ggcagggcaa ataggtcctc taccaggacc ccggaaccag ttgtccctac agactctgag 2640
cttcaacctc ccacctccac agaacagtct gtcatcccca aacccacatc tccagtcact 2700
cagggcagca taaatggttc ctttgttaaa acgcctgaac cagttgttct cacaggtccc 2760
aaaatccagc ctcccacctc cacagaacag cctgttaccc caaaccccac acctcaggcc 2820
actcggggca ggccacatag gtcttccatc cagaccccag aaccacttac tcccactggt 2880
cctgacctcc agcctcccac ctccacagaa cagcctgtca tacctaaacc cacatctcgg 2940
gctgctcggg gcaggtcacg taagtcttct accaggaccc cagaaccagc tgtccccact 3000
ggtcctgacc tccagcctcc cacctccaca gaacagcctg tcacacctaa acccacatct 3060
cgggccactc ggggcaggtc acgtaagtct gtcagaaccc cagaaccagc tgtccccact 3120
ggtcctgacc tccagcttcc cacctccaca gctctgggca ctttgggaag ggcatgtaag 3180
tcctccattg aggattctga atcagttgga ccagtagcct ctgattttga acctcccatc 3240
tccacagacc ttgttgcccc tgaggtgaca ggtcagagca taacactaaa gtcttcacca 3300
ctaagtgctt ctccagtttc tgccacctct gaactccagc cacctgtccc cacagcccag 3360
cctgttctcc tggagcccat tcctcaagcc aaccaccgaa ggcggcggaa ggctgctggg 3420
aaacggggct cccacacagt tcccattggc caaaagcctt actctgcacc ctctgaacct 3480
ggttcccaat cttcaatcaa tcaaggcttg gcattggaag ccgctgagtc tattactgtt 3540
gctcctgagc ctgctgtttc ccaggctcca gagacctcca ctcagaatcc cgtggtgcaa 3600
aatgaagcag ctgggagatc agggctcatt cccaagcccc agcctgaggt ttctcgatcc 3660
cgcaagaagc cttctactac cacaacctca ccaattcaaa aacgtccccg aagacaaata 3720
ccccagaaga caatagtccc caaggaagaa gatcctgagg aaatgccagt gaaggaagag 3780
cctcaggaga tagcaattcc aacacccggc aaaagaaaga gggaccgtgt agaggatgag 3840
acccagggaa acccaagtcg gagccggcgg gctaaaccta accaagaagc agcagccccc 3900
aaggtactgt tcacaggagt tgtggattct cggggagagc gtgcagtcct ggctctgggt 3960
ggcagtctag ccagctcagt aaatgaggcc tcccacttgg tcactgatcg catccgaaga 4020
acggtcaagt tcttgtgtgc cctggggaag ggcatcccta tcctctccct gaactggctg 4080
tatcagtcca gaaaggctgg tcacttcctg ccacctgatg actacttggt gactgaccct 4140
gaacaagaga agaactttag cttcagcctt cgggactccc tgagccgggc tcggcaacaa 4200
aaactgctgg agggctatga gatttacgtg acccctggag tgcagccacc cccacctcag 4260
atgggcgaga tcatcagctg ctgtgggggc accaacctgc ccagcatgcc ccagtcctat 4320
aagccttacc gagttgtcat aacttgcact gaagacctac ctcgctgcgc tatcccatct 4380
cgactggggc tgcccctcct ctctcctgag ttcctcctga ctggagtgct aaagcaggaa 4440
gtcacaccag aggcctttgt cctttcaaat tag 4473
<210> 106
<211> 2412
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<223> Bard1
<400> 106
atgcaacttt ctgagtctgt ggttggacta ctaggtaggt acacaagccc tgctcgggaa 60
cgaaacccac gaggagcccc gccccttggc gttgagggcg tggccttggg ccgcgctcct 120
ctcagaaatt cgagcgcgct ctcattgcct ctcccctccc tcttacttgc tataaaggag 180
caacccagga tggtctgctg tctgcttcgg ctcatcatca tccagagtgt cgagttcttt 240
gaaatcatca ctaatattct gaaggagcca gtatgcttag gagggtgtga gcacatcttc 300
tgtagtgtgt gtataagtga ttgcgttgga tcaggatgtc ccgtgtgtta cacaccagcc 360
tggatcctag acctcaagat aaacagacaa ttggacaaca tgattcagct ttataggaag 420
cttcaaaatt tgctacatga caataaactt tcagatccaa aagacaacac atctaggaca 480
ggttcatttg atgatgcaga aagcaagaag aattcaataa aaatgtggtt tagtcctcga 540
agtaagaagg ttagatgtgt tgtgaataaa gtatcagtgc caacccagcc tcaaaagaca 600
aaagatgaca aagcccagga agcctccata tacgaatttg tttccacaag tccccctgaa 660
gttgtttcta agagggctaa aacagcttct agaacatctg caaaaaagca gcagaagaaa 720
tctttagctg agatcaacaa gaaggggaat tcaaggccag aaacagaaga tagcaggttt 780
gattctaaag aggaactgaa agaggagagg gttgtctcct gtagccaaat accagttatg 840
gaaagtccac aggtaaatgg tgaaatagac ttgttagcta gtggttctgt tgcagaatct 900
gaatgttctg gaagattgac cgaagtttct ttaccattgg ctgagcatat agtatctcca 960
ggcactgtga gcaagagtga agagactcct gagaagaaag tctgtgtaaa agatcttctt 1020
tcagtagggc gtaatgaaaa tcacaaatac tgtagcaggc ctcctgatcc tacttctaag 1080
aattgtgaga gaagcattcc gagcaccagc agagatgtca ttaaaccaac agtgcttgca 1140
gaaaatatac tgttggttga ctgttcttca ctgccttcag accagcttca agttgatgtc 1200
acactcagga gaaagagtaa catatcagat aactccctta gcctttcacc aggcacaccc 1260
ccaccactgc tgaataattc aactcccaga caaatgatgt caaaaccctc catagtgaag 1320
ctgtcaccca gcattaccgc caggaaaaga aaccacagag gagagactct gcttcatatt 1380
gcttctatta agggcgatat accttctgtt gaatacctct tgcaaaacgg aaacgacccc 1440
aatgttaaag accatgctgg atggacacca ttgcatgaag cctgcagtca tgggcacctg 1500
aaggtagtgg aattgctgct ccagcataac gctttggtga ataccacagg ctatcagaat 1560
gacacaccac tgcacgatgc agtcaagaac ggccatgtgg atatagtcag ggtgttactg 1620
tccaatggcg cctccaggaa tgctgttaac atatttggtg tacggcctgt ggattataca 1680
gacaatgaaa atataagatc attattgctg ctaccagaga agagtgaatc atcctcaact 1740
agccagtgtg cagttgtgac tgctggacag cgaagaaatg ggcctctggt gcttataggc 1800
agtgggcttt cttcccaaca gcagaaaatg ctcagcaaac ttgagacagt tctcaaggct 1860
aaaagatgtg ctgagtttga cagtacagta actcatgtca ttgttcctga tgatgaagct 1920
caaagtactc tgaagtgtat gcttgggatt ctcaatgggt gttggatcct gaagtttgac 1980
tgggtgaaag cttgtttgca cagcaaagta cgtgaacagg aagaaaagta cgaagttcct 2040
ggaggtccgc agaagagcag gctcaacaga gagcagctgt tgccaaagct atttgatgga 2100
tgctacttct ttttgggggg aaacttcaaa catcatccaa agaatgatct ccttaagctc 2160
attactgcag caggaggcaa ggtgctcagt agaaagccca agccagacag tgacgtgact 2220
cagaccatca acactgttgc ataccatgcc aaccctgact ctgaccagcg cttctgtaca 2280
cagtacatcg tctatgaaga tctgtttaat tgtcgcccag aaagggttcg gcagggcaaa 2340
gtctggatgg ctccttccac ttggcttatc agctgtgtga tggcctttga attgcttcct 2400
cttgacagct ga 2412
<210> 107
<211> 2796
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<223> Lig1 (Ligase 1)
<400> 107
atgagaaaaa aagaaccaga gaggaaaggg gagaactctg ctgccaccat gcagaaaagt 60
atcaggtcat ttttccaacc catgaaagag ggtaaagcac agaagccgga gaaggagaca 120
gctaacagca ccaaagagaa ggagccacct ccaaaggtgg cactgaagga gaggaatcga 180
gcagtgcctg agagtgattc tccagtgaag aggcctggaa ggaaggcagc ccaggtccta 240
agcagcgaag gggaggagga agatgaagcc cccagcaccc ctaaagtcca gaagtctgtg 300
tcagactcca aacaaagctc tcctcccagc cctgacgcat gtcctgagaa cagtcctttc 360
cacagtagcc cctccatgga gatctcccca tcaggattcc cgaagcgtcg cactgctcgg 420
aagcagctcc cgaaacggac aattgaggac actgtggagg agcagaatga ggacaaaggc 480
agagcagcca agaaaaggaa gaaggaagaa gaagcacaga ctccaatgga aagcctcaca 540
gagagtgaag atgtaaaacc caaggaagaa aaggaggagg gcaagcatgc tgaggcttcc 600
aagtcccctg agtcgggaac cttgacaaag acagagacca tcccagtgtg taaggccggc 660
gtgaaacaga agcctcagga agaggagcag agcaagcctc ctgccagagg cgccaagaca 720
ctcagcagct tcttcactcc ccggaagcca gcagagaaag ccatagtgaa acaagaagag 780
ccaggtactc cagggaagga agagaccaag ggagccctgg atccaacaaa ttacaatcct 840
tccaagagaa actaccaccc cattgaagat gcctgctgga aacatggcca gaaagtccct 900
tttctcgctg tggcccggac ctttgagaag attgaggagg tttctgctcg gctcaagatg 960
gtggagacac tgagcaactt gctgcgctcg gtggtggccc tgtcacctcc agacctgctt 1020
cctgttcttt acctcagcct caaccgcctt gggccacctc agcagggact agagctgggt 1080
gttggtgatg gtgtcctcct taaggcagtt gcccaggcca caggccgtca gctggagtcc 1140
atccgggctg aggtagctga gaagggtgac gtgggactgg tggccgagaa cagccgcagc 1200
actcagagac tcatgctgcc ccctcctccg ctcaccacct ccggggtctt taccaaattc 1260
tgtgacattg cccggctcac tggcagtgct tccatggcca agaagttgga tgtcatcaag 1320
ggcctgtttg ttgcctgccg tcactcggaa gcccggttca ttgccaggtc cctaagtgga 1380
cgcctgcgcc tcgggctggc tgagcagtcc gtcttggctg cccttgccct ggctgtgagc 1440
ctcacacccc ctggccaaga atttccccca gctgttgtgg atgctgggaa gggcaagacc 1500
acagaggcca gaaagacatg gttggaagaa caaggcatga tcttgaagca gaccttctgt 1560
gaggtacctg acctggaccg aatcatcccg gtgctgctgg aacatggcct ggaacgcctc 1620
ccagagcact gcaggctgag cccaggggtc cctcttaaac caatgctggc tcatcccact 1680
cggggtgtca gcgaggtact gaaacgcttt gaggaggtgg actttacctg cgagtacaaa 1740
tatgacgggc agcgggccca gattcatgtt ctggaaggtg gagaggtgaa gatcttcagt 1800
aggaaccagg aagacaacac aggaaagtac ccggacatca tcagccgcat ccccaagatt 1860
aaactcccct cggtcacctc ctttatcctg gacactgagg ctgtggcctg ggaccgggaa 1920
aagaagcaga tccagccatt ccaagtgctc accacacgca agcgcaagga ggttgacgcc 1980
tcggagatac aggtgcaggt gtgtctgtat gcctttgatc tcatctacct caacggagag 2040
tccctgattc gccagcccct gtctcgacgt cggcagctgc tccgggagaa ctttgtggag 2100
acagagggtg agtttgtctt cgccacctcc ctggacacca aggacatcga gcagatcgct 2160
gagttcttgg agcagtccgt gaaggactcc tgtgagggac tgatggtgaa gaccctggat 2220
gttgatgcca cctatgagat tgccaagagg tctcacaact ggctcaagct aaagaaggac 2280
taccttgacg gtgtgggcga cactctggac cttgtggtga ttggcgccta cctgggccgg 2340
gggaagcgtg ccggccggta tgggggcttc ctcttggctg cctatgatga ggagagtgaa 2400
gagctgcagg ccatatgcaa gctgggaact ggattcagtg atgaagagct ggaggagcat 2460
caccagagcc taaaggccct agtgttgccg accccacgcc cctatgtgag gatcgatggg 2520
gcagttgccc cagaccactg gctggaccca aaggtcgtat gggaggtgaa gtgtgcggat 2580
ctctccctgt cccctatcta ccctgctgcg cggggcctgg tggacaaaga gaaagggatc 2640
tcccttcgtt tccctcggtt cattcgtgtc cgtgaagaca agcagccaga gcaggccacc 2700
accagtgacc aggtggcctg tttgtaccgg aagcagagtc agatacagaa ccagcacaac 2760
tcagacttgg actccgactt tgaggactgc tattaa 2796
<210> 108
<211> 2121
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<223> Mre11
<400> 108
atgagccctg cagatccact tgatgatgaa gacactttta aaatcctggt tgccactgat 60
attcaccttg gatttatgga gaaagatgca gttcgaggaa atgatacatt tgtgacactt 120
aatgaaattt taaaacttgc cctggaaaat gaagtggatt ttattttgtt aggtggtgat 180
cttttccatg aaaacaagcc ctcaaggaaa actcttcata gttgcttgga gttgcttagg 240
aagtactgta tgggtgatcg ccctgtgcag tttgagatca tcagtgacca gtcagtcaac 300
tttggtttta gtaggtttcc atgggtgaac tatcaggatg gcaatctcaa catttccatt 360
ccagtgttta gtatccatgg caaccatgac gatcccacag gggcagatgc cctctgtgcc 420
ctggatattt taagctgtgc tgggtttgtg aatcactttg gacggtcaat gtctgtggag 480
aagattgaca ttagtccagt tctgctgcag aaaggaagca caaaacttgc tctgtacggc 540
ctagggtcca ttcctgatga aaggctctat cggatgtttg tcaataaaaa agtaacaatg 600
ctgagaccaa aggaagatga gaactcatgg tttaacttat ttgtgattca tcagaacagg 660
agtaaacatg gaagtaccaa cttcatccca gaacagtttt tggatgactt cattgacctc 720
gttatctggg gccatgaaca cgagtgtaaa attggcccaa ccaaaaatga gcagcagctc 780
ttctatgtgt ctcagcctgg aagctcagtg gtgacttctc tttcccctgg agaagctgtt 840
aagaaacacg tgggcttgct gcgcgttaaa gggaggaaga tgaacctgca gaagctgcct 900
ctccgcacag tgcggcagtt cttcatggag gatgtggttc tcgctaacca cccaaacctg 960
ttcaaccctg acaatcctaa ggtgacccag gccatccaga gcttctgctt ggagaagatt 1020
gaagaaatgc ttgaaaatgc cgagcgcgaa cggctaggga attctcttca accagagaag 1080
cctcttatcc gactacgggt ggactacagt ggaggctttg aaccttttag tgttcttcgc 1140
tttagccaga aatttgtgga tcgggtcgct aaccccaaag atatcatcca ctttttcagg 1200
catagggagc aaaagggaaa aacaggtgaa gagatcaact ttgggaagct tgtttcaaaa 1260
tctccttcgg aaggaacgac actcagagta gaagacctgg tgaagcagta tttccagact 1320
gcggagaaga atgttcagct ctcactgctg acagaaagag ggatgggtga agccgttcaa 1380
gaatttgtgg acaaggaaga aaaagatgcc atcgaggaat tagtgaagta ccagctggag 1440
aaaacacagc ggtttcttaa ggagcgccat atcgatgctc tggaagacaa gattgacgaa 1500
gaggtccggc gtttcagaga aagcagacag agaaatacca acgaagaaga cgatgaagtg 1560
cgagaggcca tgagcagggc ccgggcgctc agatcgcagt cagagaactc tgcctcagcc 1620
ttcagtgctg acgacctgag tttcgatata gcagaacaga cagcaaatga ctctgatgac 1680
agcctgtcag cagtgcccag cagaggccgg ggccgaggcc gaggtcgaag aggaggcaga 1740
gggcagagca ccgcatcaag aggaggatct cagagaggcc gagacactgg gcaggagacg 1800
gctactcgag gcagatgctc aaaggccact acatcgacct ctagaaatat gtccattcta 1860
gacgctttca gatctactcg acagcagcct tccagaaaca ctgccactaa aaattactca 1920
gagactattg aagtggatga atctgatgaa gatgacattt ttcctaccag ttccaaggct 1980
gatcaaaggt ggccaggcac aacatctagc aaacggatgt cccagagcca gatagccaag 2040
ggggttgact ttgaatcaga tgaggacgat gacgatgacc ctttcatgag cagtagttct 2100
ctaagaagcc gaagataata a 2121
<210> 109
<211> 5973
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<223> 53BP1
<400> 109
atgccagggg agcagatgga ccctactgga agtcagttgg attcagattt ctctcagcaa 60
gatactcctt gcctgataat tgaagattct cagcctgaaa gccaggttct ggaagaagat 120
gcgggctctc acttcagtgt gctgtctcga caccttccca atctgcagat acacaaagag 180
aaccctgtgt tggatattgt gtccaatccg gaacaagcag ctgcagaaga gcaaggagac 240
aataatagct ccttcaatga acatctgaaa gagaacaaag ctgctgcaga tcctgtggat 300
tccactcatt tgggcacatg tgattccatc agtcaggtca tagaacagtt gcctcagcca 360
aacaggacaa gcagtgttct gggagtgaca gtggaagctg cttctcttcc agaagaggag 420
aaggaggaag agctggaaga ggagaatgaa gaggtgggag cagatgctgc tgatgccgct 480
ccgtgctccc ttggtgctga agattctgct tcatcacagt tgggctttgg ggttctggaa 540
ctgtcccaga gccaggatgt tgaagaacat acagtgccat atgatgtcaa ccaagaacat 600
atgcagttgg ttaccaccaa ctcgggttct tcccagctgt ctgacatgga tgcaaataat 660
gttaaatgtg aagaacagtc cactgaagat acctccatgg cagaacaacc taacaaagac 720
atccctgtta cagtcgagca cagtaaaggt atccctgtgg tagatgagca aaatctacca 780
ccggcaaggc cagaggatct gccttccagt cctcaagcct ctgctgcagc tgtggaaaca 840
aaggaagagg tacctgccca agagttgcca gaaggggcgc tggaggttca gatgtcctcg 900
gagcctgagg tctcgtccac tcaggaggac ttgtttgagc agagtagtaa aacagcttct 960
gatggttgtt ctactccttc aagggaggaa ggtgggtgtt ctccggtttc cacacccgcc 1020
accaccctgc aactcctgca gctgtctggt cagaggcccc ttgtccagga cagtctttcc 1080
acgaattcct cagatcttgt tgctccttcc cctgatgctt tccgacctac cccttttatc 1140
gttcctagca gtcccacaga gcaaggaggg agaaaagttg agcccttgga tatgtcagtg 1200
atgcctgaag aaggagggga gactttgcag aagcttcagg atgacgaagc agtggagata 1260
gaaaagcccc atctcccatc tcagccggct gtttccccac aagtgtcaac accagtgtct 1320
cagagcacac ctgtcttcac tccaggctct cttcccatcc cgtcccagcc tgaattttct 1380
catgacattt tcattccatc accaagtttg gaagaaccat caagtgatgg gaagaaaggt 1440
ggcgatttgc acagctcatc tttgactgtg gagtgttcta agacttcaga gagtgaacca 1500
aagaatttca ctgctgatct tgggctctcc ttgacagggg agtcttgcaa actgatgctt 1560
tcttcaagtg agtatagtca atcctcaaag atggagagct tggcttctcc caggagtgag 1620
ggagatggag agaataccca gattgaggac actgaaccgt tgtctccagt caccaattct 1680
aaacttcctg ctgaaagtga tgatgtcctg atgaatccag caccagatga ccaagtagaa 1740
atgaatcaga atgatgacaa agtaaaagag ggtgacacag agaacacagg tgaccatggt 1800
gttttagctg ctggtagtaa aggcagagaa gaaaccgttg ctgaagatgt ttgcattgat 1860
ctcacttgtg attctgggag tcaggcagtt ccgtctcccg ctactcggtc cgaggcactt 1920
tctagtgtct tagatcagga ggaagctatg gaaattaaag aacagcatcc agaggagggg 1980
ttttcgggat ctgaggtaga agaagtcccc gagactccct gtgaaagtca cagagaggag 2040
cccaaggaag aaacgatgga gagtatccca ctgcaccttt ctcttactga aacacagtcc 2100
caggcattgt gtcttcagaa ggaaatgccc aaagaagaat gcccagaggc catggaagtg 2160
gaaccctctg tgattagtgt tgactctccc cagaagctgc cggtactcga ccaggagtca 2220
gagcataagg agccagaggc ctgggaagaa gccgcgtcgg aggactcaag tgtggaggac 2280
tcaagtgtgg ttatcgttga tgtgaaggag ccctcgccaa gagttgtccc ctgcgaacct 2340
ttggagggag cagagaaatg ctcagattcc cactcctggg aggatgtggt gcccgaggtg 2400
gaaccgtgtg ctgcaaatag agtagacact ccggaggaaa agattgtaga atgtgacgga 2460
gatgtgaaag cagagaccac aagaaaggac tctgtagagg aagactcccc acagcctcct 2520
ttgccttcag tgaaagacga gcctcccaga gacgagcctc ccagacccga ccaggagatg 2580
cagcagtccc agcttcaaga gaaagagagc ccagtgacca tagatgcaaa agtggctgat 2640
gccaagcagc tggagtcaga gggagcatcc cagcagcttt cgaaagcccc tgcccgcgac 2700
tcacaaagtt tctgtgaaag ttctagtgaa accccatttc atttcacttt gcctaaagaa 2760
ggtgatatta tcccaccatt gactggtgca accccacctc acattgggca cctaaaattg 2820
gatcgcaaca gacatagtac tccaattggg attggcaact atccagaaag caccatagca 2880
accagtgatg tcatgtctga aagcatggtg gagatcaatg atcctctact tgggagtgaa 2940
aaaggagatt ctgagtctgc cccagaaatg gacggaaaac tgtatctgaa aatgaaactg 3000
gttagtcctg agacagaggc cagtgaagaa tctttgcagt ttagcctgga aaagcctgct 3060
actgctgaga gaaaaaatgg atcaactgct gttgctgagc ctgttgcaaa aaatggatca 3120
actgctgttg ctgagcctgt tgccagtccc cagaagaccg tgcctgtgtt tagctgcagg 3180
caagaggagg tttggagtga ggaccctccc tctgtaccca tcagggcaaa cttgctccat 3240
tttccaagtg ttgaagaaga ggacaaagaa aaactggatg gtaccccaaa gcttaggcag 3300
agtgaacagc ctgtgaggcc cgttgggctg gtcaaggatg ctgctacttc tgaggactct 3360
gcttcttctg ttccccagca gagagcaaca caggggtcat tcagccctca aggagaagtg 3420
atggaaacag acctgctaga aggactgagt gctaaccagg aaaaaccgtg taaggtcttg 3480
atggaaaggc ccacccagag taacatagga atccagacca tggaccattc cctgtgtgct 3540
ccagaaactg tttcagcagc aacccagact gtgaagagtg tatgtgaaca agggaccagt 3600
acagtggacc agaactctgg gaaacaagat gccactgtgc agaccgagag ggggggtgtc 3660
gagaaacagg cccctgtgga cgatacagaa tccctccaca gccagggaga agaagaattt 3720
gaaatgcccc agcctccaca tggccatgtc ttgcatcgtc acatgagaac catccgtgaa 3780
gtccggacac ttgtcacccg tgtcatcaca gatgtttact atgtggatgg gacagaagtg 3840
gaaaggaaag taactgagga gactgaagaa ccaattgtag aatgtcagga atgtgaaaca 3900
gaggtttccc cttcccagac tggaggctct tctggagacc tgggagacat cagttccttc 3960
tcctccaaag catccagctc acaccataca tcaagtggga caagtctctc agccatgcat 4020
agcagtggca gctcaggacg aggagccggg ccactcaaag ggaaaaccag cgggacagaa 4080
cctgcagatt ttgctttacc cagttcccga ggaggcccag gaaaactgag tcctagaaaa 4140
gggatcaatc agacaggggc accagtgtgt gaggaagatg gtgatgcagg ccttggcatc 4200
agacagggag ggaaggctcc tgtcacacct cgtggtcgtg gtcgaagggg ccgcccacct 4260
tctcggacca ctggaacaag agatgcagtt gtgtctggtc cgttgggcat agaagacatt 4320
tcacctagca tgtcaccaga tgacaagtcc ttcacccgaa ttgtgccccg tgtaccagac 4380
tctaccaaac gaattgatac cagttctact gttttgaggc ggagtgattc cccagagatt 4440
ccttttcagg ctgctactgg gtcttctgat ggcttggatg cctcatctcc aggaaatagc 4500
tttgtcgggc tccgtgttgt agccaagtgg tcatccaatg gctattttta ctctgggaaa 4560
atcacacggg atgttggagc tgggaagtat aagctgctct tcgatgatgg gtatgaatgt 4620
gatgtgctgg gcaaagacat tctcctgtgt gaccctatac ccctggacac tgaagtgaca 4680
gccctctcag aagatgagta tttcagtgca ggagtggtca aaggacacag aaaggagtct 4740
ggggagctgt actacagcat tgaaaaagaa ggccaaagga agtggtataa gcggatggca 4800
gtcatcctgt ccttggaaca aggaaacagg ttaagagagc aatatgggct tggcccatat 4860
gaagctgtta cacccctcac aaaggcagca gacatcagcc tagataattt ggtggaagga 4920
aagcggaaac gtcgcagtaa catcagctcc ccagccaccc ccactgcctc cagcagcagc 4980
agcagcagca gcacaacacc cacccgtaaa accacagaga gtccccgtgc ttccacggga 5040
gttccatcag gcaaaaggaa actcatcact tctgaagagg aacggtcccc agctaagcga 5100
ggccgcaagt ctgtcaccgt gaaacctggt acagtggggg caggagaatt tgtgagcccc 5160
tgcgagagtg gagacaacac aggtgaacct tctgtcctgg aagagccaag agggcctttg 5220
cccctcaaca agaccttgtt tctgggctat gcctttctcc ttaccatggc cacaaccaat 5280
gacaagctgg ccagccgctc taaactgcta gatggtccta caggaagcag tgaagaagag 5340
gaggaatttt tagaaattcc tcctttcaac aagcagtata cagaatgcca gcttcgagca 5400
ggagctgggt atatccttga agacttcaat gaagcccagt gtaacacagc ctaccagtgt 5460
ctcctaattg ctgatcagca ttgtcgaacc cggaagtact tcctgtgcct tgccagtgga 5520
attccttgtg tgtctcatgt ctgggtccat gacagctgcc atgccaacca gctccaaaac 5580
taccgtaatt atctgctgcc tgctgggtat agccttgagg agcagcgaat tctggattgg 5640
caacctcgtg aaaacccttt ccagaatctg aaggtactct tggtgtcaga tcaacaacag 5700
aacttcctgg agctctggtc tgagatcctc atgactggag gggcagcctc tgtgaagcag 5760
caccattcaa gtgcccataa caaagacatt gctttagggg tatttgatgt ggtggtgaca 5820
gacccctcat gcccagcctc ggtgctcaag tgtgctgaag ccttgcagct gcctgtggtg 5880
tcacaagagt gggtgatcca gtgcctcatt gttggggaga gaattggatt caagcagcat 5940
ccaaaatata aacatgatta tgtttctcac taa 5973
<210> 110
<211> 384
<212> DNA
<213> Human cytomegalovirus
<220>
<221> misc_feature
<223> CMV IE enhancer
<400> 110
gttgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atgg 384
<210> 111
<211> 799
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> Human GAPDH promoter
<400> 111
gagaagttcc ccaactttcc cgcctctcag cctttgaaag aaagaaaggg gagggggcag 60
gccgcgtgca gccgcgagcg gtgctgggct ccggctccaa ttccccatct cagtcgttcc 120
caaagtcctc ctgtttcatc caagcgtgta agggtccccg tccttgactc cctagtgtcc 180
tgctgcccac agtccagtcc tgggaaccag caccgatcac ctcccatcgg gccaatctca 240
gtcccttccc ccctacgtcg gggcccacac gctcggtgcg tgcccagttg aaccaggcgg 300
ctgcggaaaa aaaaaagcgg ggagaaagta gggcccggct actagcggtt ttacgggcgc 360
acgtagctca ggcctcaaga ccttgggctg ggactggctg agcctggcgg gaggcggggt 420
ccgagtcacc gcctgccgcc gcgcccccgg tttctataaa ttgagcccgc agcctcccgc 480
ttcgctctct gctcctcctg ttcgacagtc agccgcatct tcttttgcgt cgccaggtga 540
agacgggcgg agagaaaccc gggaggctag ggacggcctg aaggcggcag gggcgggcgc 600
aggccggatg tgttcgcgcc gctgcggggt gggcccgggc ggcctccgca ttgcaggggc 660
gggcggagga cgtgatgcgg cgcgggctgg gcatggaggc ctggtggggg aggggagggg 720
aggcgtgtgt gtcggccggg gccactaggc gctcactgtt ctctccctcc gcgcagccga 780
gccacatcgc tcagacacc 799
<210> 112
<211> 1188
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<223> Human Ef1 alpha promoter
<400> 112
catgggtgag gctccggtgc ccgtcagtgg gcagagcgca catcgcccac agtccccgag 60
aagttggggg gaggggtcgg caattgaacc ggtgcctaga gaaggtggcg cggggtaaac 120
tgggaaagtg atgtcgtgta ctggctccgc ctttttcccg agggtggggg agaaccgtat 180
ataagtgcag tagtcgccgt gaacgttctt tttcgcaacg ggtttgccgc cagaacacag 240
gtaagtgccg tgtgtggttc ccgcgggcct ggcctcttta cgggttatgg cccttgcgtg 300
ccttgaatta cttccacctg gctgcagtac gtgattcttg atcccgagct tcgggttgga 360
agtgggtggg agagttcgag gccttgcgct taaggagccc cttcgcctcg tgcttgagtt 420
gaggcctggc ctgggcgctg gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt 480
ctcgctgctt tcgataagtc tctagccatt taaaattttt gatgacctgc tgcgacgctt 540
tttttctggc aagatagtct tgtaaatgcg ggccaagatc tgcacactgg tatttcggtt 600
tttggggccg cgggcggcga cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg 660
ggcctgcgag cgcggccacc gagaatcgga cgggggtagt ctcaagctgg ccggcctgct 720
ctggtgcctg gcctcgcgcc gccgtgtatc gccccgccct gggcggcaag gctggcccgg 780
tcggcaccag ttgcgtgagc ggaaagatgg ccgcttcccg gccctgctgc agggagctca 840
aaatggagga cgcggcgctc gggagagcgg gcgggtgagt cacccacaca aaggaaaagg 900
gcctttccgt cctcagccgt cgcttcatgt gactccacgg agtaccgggc gccgtccagg 960
cacctcgatt agttctcgag cttttggagt acgtcgtctt taggttgggg ggaggggttt 1020
tatgcgatgg agtttcccca cactgagtgg gtggagactg aagttaggcc agcttggcac 1080
ttgatgtaat tctccttgga atttgccctt tttgagtttg gatcttggtt cattctcaag 1140
cctcagacag tggttcaaag tttttttctt ccatttcagg tgtcgtga 1188
<210> 113
<211> 985
<212> DNA
<213> Simian cytomegalovirus
<220>
<221> misc_feature
<223> CMV promoter
<400> 113
gaccatagcc aattcaatat ggcgtatatg gactcatgcc aattcaatat ggtggatctg 60
gacctgtgcc aattcaatat ggcgtatatg gactcgtgcc aattcaatat ggtggatctg 120
gaccccagcc aattcaatat ggcggacttg gcaccatgcc aattcaatat ggcggacttg 180
gcactgtgcc aactggggag gggtctactt ggcacggtgc caagtttgag gaggggtctt 240
ggccctgtgc caagtccgcc atattgaatt ggcatggtgc caataatggc ggccatattg 300
gctatatgcc aggatcaata tataggcaat atccaatatg gccctatgcc aatatggcta 360
ttggccaggt tcaatactat gtattggccc tatgccatat agtattccat atatgggttt 420
tcctattgac gtagatagcc cctcccaatg ggcggtccca tataccatat atggggcttc 480
ctaataccgc ccatagccac tcccccattg acgtcaatgg tctctatata tggtctttcc 540
tattgacgtc atatgggcgg tcctattgac gtatatggcg cctcccccat tgacgtcaat 600
tacggtaaat ggcccgcctg gctcaatgcc cattgacgtc aataggacca cccaccattg 660
acgtcaatgg gatggctcat tgcccattca tatccgttct cacgccccct attgacgtca 720
atgacggtaa atggcccact tggcagtaca tcaatatcta ttaatagtaa cttggcaagt 780
acattactat tggaaggacg ccagggtaca ttggcagtac tcccattgac gtcaatggcg 840
gtaaatggcc cgcgatggct gccaagtaca tccccattga cgtcaatggg gaggggcaat 900
gacgcaaatg ggcgttccat tgacgtaaat gggcggtagg cgtgcctaat gggaggtcta 960
tataagcaat gctcgtttag ggaac 985
<210> 114
<211> 197
<212> DNA
<213> Simian virus 40
<220>
<221> misc_feature
<223> SV40 promoter
<400> 114
tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa 60
ctccgcccag ttccgcccat tctccgcccc atcgctgact aatttttttt atttatgcag 120
aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag 180
gcctaggctt ttgcaaa 197
<210> 115
<211> 999
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<223> CHO Actb promoter
<400> 115
gggcggaggc cagtcatgca tgttcgggcc tatggggcca gcacccaacg ccaaaactct 60
ccatcctctt cctcaatctc gctttctctc tctctctctt tttttttttt tttttttttt 120
tttttttttt tttgcaaaag gaggggagag ggggtaaaaa aatgctgcac tgtgcggcta 180
ggccggtgag tgagcggcgc ggagccaatc agcgctcgcc gttccgaaag ttgcctttta 240
tggctcgagt ggccgctgtg gcgtcctata aaacccggcg gcgcaacgcg cagccactgt 300
cgagtccgcg tccacccgcg agcacaggcc tttcgcagct ctttcttcgc cgctccacac 360
ccgccaccag gtaagcaggg acaacaggcc cagccggcca cagccctccc gtgggcagtg 420
accgcgctgc agggtcgcgg gggacactcg gcgcggacac cggggaaggc tggagggtgg 480
tgccgggccg cggagcggac actttcagat ccaactttca gtccagggtg tagacccttt 540
acagccgcat tgccacggtg tagacaccgg tggacccgct ctggctcaga gcacgcggct 600
tgggggaacc cattagggtc gcagtgtggg cgctatgaga gccgatgcag ctttcgggtg 660
ttgaaccgta tctgcccacc ttggggggag gacacaaggt cgggagccaa acgccacgat 720
catgccttgg tggcccatgg gtctttgtct aaaccggttt gcccatttgg cttgccgggc 780
gggcgggcgc ggcgggcccg gctcggccgg gtgggggctg ggttgccact gcgcttgcgc 840
gctctatggc tgggtattgg ggcgcgtgca cgctggggag ggagcccttc ctcttccccc 900
tctcccaagt taaacttgcg cgtgcgtatt gagacttgga gcgcggccac cggggttggg 960
cgagggcggg gccgttgtcc ggaaggggcg gggtcgcag 999
<210> 116
<211> 683
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<223> CHO Hspa5 promoter
<400> 116
acccgagggg acttaggagg agaaaaggcc gcatactgct tcggggtaag ggacagaccg 60
gggaaggacc caagtcccac cgcccagagg gaactgacac gcagaccccg cagcagtccc 120
cgggggccgg gtgacgggag gacctggacg gttaccggcg gaaacggtct cgggttgaga 180
ggtcacctga gggacaggca gctgctgaac caataggacc ggcgcacagg gcggatgctg 240
cctctcattg gcggccgttg agagtaacca gtagccaatg agtcagcccg gggggcgtag 300
cggtgacgta agttgcggag gaggccgctt cgaatcggca gcggccagct tggtggcatg 360
gaccaatcag cgtcctccaa cgagaagcgc cttcaccaat cggaggcctc cacgacgggg 420
ctggggggag ggtatataag ccaagtcggc ggcggcgcgc tccacactgg ccaagacaac 480
agtgaccgga ggacctgcct ttgcggctcc gagaggtaag cgccgcggcc tgctcttgcc 540
agacctcctt tgagcctgtc tcgtggctcc tcctgacccg gggggcttct gtcgccctca 600
gatcggaacg ccgccgcgct ccgggactac agcctgttgc tggacttcga gactgcagac 660
ggaccgaccg ctgagcactg gcc 683
Claims (60)
- 재조합 핵산 분자로서,
(a) 5' 및 3' 트랜스포존-특이적 역위 말단 반복부(transposon-specific inverted terminal repeat)(ITR),
(b) 상기 5' ITR과 3' ITR 사이에 위치되고, 프로모터의 제어 하에 있는 이식유전자 발현 가공(transgene expression processing: TEP) 단백질 또는 TEP 기능성 RNA를 암호화하는 적어도 하나의 핵산 서열, 및
(c) 선택적으로 또한 상기 5' ITR과 3' ITR 사이에 위치되고 이식유전자 프로모터의 제어 하에 있는 적어도 하나의 이식유전자를 포함하되, 상기 핵산 분자는 선택적으로 벡터의 부분인, 재조합 핵산 분자. - 제1항에 있어서, 적어도 하나의 후성적 조절 구성요소, 특히 적어도 하나의 MAR(기질 부착 영역(matrix attachment region)) 구성요소를 더 포함하는, 재조합 핵산 분자.
- 제2항에 있어서, 상기 MAR 구성요소는 상기 5' ITR과 3' ITR 사이에 위치되고, 선택적으로 항생물질 내성 유전자 또는 면역글로불린을 암호화하는 유전자와 같은 이식유전자는 선택적으로 추가 프로모터의 제어 하에서 5' ITR과 상기 MAR 사이와 같이 상기 5' ITR과 3' ITR 사이에 위치되는, 재조합 핵산 분자.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 TEP 단백질 또는 TEP 기능성 RNA는 게놈 내로 핵산 서열의 통합, 상기 이식 유전자 RNA 산물의 가공 또는 번역에 직접적으로 또는 간접적으로 수반되거나, 또는 ER 전위, 분비, 가공, 폴딩, ER-골지-혈장막 수송, 글라이코실화 및/또는 이식유전자 발현 산물과 같은 단백질의 다른 번역 후 변형에 수반된 단백질 또는 기능성 RNA인, 재조합 핵산 분자.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 TEP 단백질은 상기 단백질 분비 경로의 단백질, 상기 재조합 경로의 단백질, BiP와 같은 샤페론을 포함하는 단백질 가공 또는 대사 단백질, 또는 이들의 조합인, 재조합 핵산 분자.
- 제5항에 있어서, 상기 TEP 단백질은 단백질 분비 경로의 다음의 단백질: hSRP14, hSec61α1, hSec61β, hSec61γ, hSRP54, hSRP9, hSRPRα, hSRPβ 및 hCANX 중 하나 이상이고,
상기 TEP 단백질은 또한 단백질 분비 경로의 다음의 아미노산 서열의 단백질: 서열번호 13을 갖는 hSRP14, 서열번호 15를 갖는 hSec61α1, 서열번호 17을 갖는 hSec61β, 서열번호 19를 갖는 hSec61γ, 서열번호 21을 갖는 hSRP54, 서열번호 23을 갖는 hSRP9, 서열번호 25를 갖는 hSRPRα, 서열번호 27을 갖는 hSRPβ, 및 서열번호 29를 갖는 hCANX 및 상기 명시된 서열들과 80%, 90%, 95% 또는 98% 초과의 서열 동일성을 갖는 아미노산 서열 중 하나 이상에 대응할 수 있는, 재조합 핵산 분자. - 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 TEP 단백질은 다음의 단백질 가공 또는 대사 단백질: hUCP4, hCMPSAT, rST6Gal1, hCOMSC, hT-신타제, hP4HA1, hP4HB, hGILZ, hCyPB, hNRF2, hHK1, hPDI, hPIN1, hSEPW1, hCALR, hDDOST, hHSP40, hATP5A1, hSERCA2, hPDIA4, hHSC70/HSPA8, hHYOU1, hCMP-SAS, hBeclin-1, hERdj3, CHO-AGE, hWip1, hRTP4, hREEP2, hDPM1 및 hDRiP78 중 하나 이상인, 재조합 핵산 분자.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 TEP 단백질은 샤페론, 특히, BiP 단백질, 더 특별하게는, 서열번호 60과 80%, 90%, 95% 또는 100% 서열 동일성을 갖는 합성 BIP 단백질 유도체(DroBiP)인, 재조합 핵산 분자.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 MAR 구성요소는 서열번호 1(MAR 1-68), 2(MAR 1_6), 3(MAR X_S29), 4(MAR S4), 5(닭 라이소자임 MAR)로부터 선택되고, 유전자 조작된, 특히 재배열된 상대이고/이거나 서열번호 1 내지 5 중 어느 하나와 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는, 재조합 핵산 분자.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 세포 내의 상기 TEP 기능성 RNA는 재조합 경로의 적어도 하나의 단백질, 예컨대, 이하로 제한되는 것은 아니지만, Rad51, Rad51B, Rad51C, Rad51D, Xrcc2, Xrcc3, Rad52, Rad54, Brca1, Brca2, 사이클린 D1, Ercc, MDC1, Bard1, 리가제 1, Mre 11 및/또는 53BP1의 발현을 방해하는 기능성 RNA, 바람직하게는 miRNA 또는 shRNA를 암호화하는 핵산 서열을 포함하는/이루어진, 재조합 핵산 분자.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 핵산 분자는 적어도 5000, 6000, 7000, 8000, 90000 또는 10000 bp 길이인, 재조합 핵산 분자.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 5' ITR 및 3' ITR은 슬리핑 뷰티(Sleeping Beauty) 또는 바람직하게는 피기백 트랜스포존(PiggyBac Transposon)의 5' ITR 및 3' ITR인, 재조합 핵산 분자.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 재조합 핵산 분자의 제1 형질감염 및 이식 유전자를 함유하는 추가 재조합 핵산 분자의 포유류 세포 내로 제2의 후속적 형질감염 시, 상기 세포에서의 이식유전자 통합 및/또는 발현은 상기 제1 형질감염을 받지 않은 세포에 비해 증가되는, 재조합 핵산 분자.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 재조합 핵산 분자는 벡터의 부분인, 재조합 핵산 분자.
- 제15항에 있어서, 상기 벡터는 단일 MAR 구성요소, 2 이상의 MAR 구성요소를 포함하되, 상기 구성요소(들)는 상기 5' ITR과 3' ITR 사이에 위치되는, 재조합 핵산 분자.
- 제14항에 있어서, 상기 벡터는 2개의 MAR 구성요소를 포함하되, 제1 MAR 구성요소는 TEP 또는 TEP 기능성 RNA의 상류에 위치되고, 제2 MAR 구성요소는 TEP 또는 TEP 기능성 RNA의 하류에 위치되되, 상기 제1 MAR 구성요소는 MAR 1_6 구성요소 및/또는 서열번호 2와 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소, 특히 MAR 1-6에 기반한 재배열된 MAR, 더 구체적으로는 서열번호 8과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소(MAR 1_6R2)를 포함하고, 상기 제2 MAR 구성요소는 MAR 1-68 구성요소 및/또는 서열번호 1과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소를 포함하는, 재조합 핵산 분자.
- 제14항에 있어서, 상기 벡터는 상기 단일 MAR 구성요소를 포함하되, 상기 단일 MAR 구성요소는 TEP 또는 TEP 기능성 RNA의 하류에 위치되고, 상기 단일 MAR 구성요소는 MAR 1-68 또는 MAR X-29 구성요소 및/또는 서열번호 1 또는 3과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소, 특히, MAR 1-68 또는 MAR X-29에 기반한 재배열된 MAR, 특히 서열번호 6, 7 또는 10(MAR 1_68R, 1_68R2 또는 X_29R3) 또는 9와 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소이고, 바람직하게는 MAR X-29 구성요소 및/또는 서열번호 3과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소인, 재조합 핵산 분자.
- 제14항 내지 제17항 중 어느 한 항에 있어서, 상기 TEP 또는 TEP 기능성 RNA는 EF1 알파 프로모터의 제어 하에 있고 선택적으로 BGH 폴리A 신호가 후속하는, 재조합 핵산 분자.
- 제14항 내지 제18항 중 어느 한 항에 있어서, 상기 벡터는 GAPDH, CGAPDH, SV40p, CMVp, CHO Ef1 알파, CHO Actb 및/또는 CHO Hspa5와 같은 프로모터(들) 및/또는 인핸서(들) 또는 이들의 융합물을 포함하는, 재조합 핵산 분자.
- TEP 또는 TEP 기능성 RNA를 발현시키는 방법으로서,
이식유전자를 포함하는 재조합 포유류 세포를 제공하는 단계를 포함하되, 벡터는 상기 TEP 또는 TEP 기능성 RNA를 발현시키는 제14항 내지 제19항 중 어느 한 항에 따른 발현 벡터이고, 상기 벡터를 통해 발현된 상기 TEP 또는 TEP 기능성 RNA는 상기 포유류 세포 내 이식 유전자의 발현을 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60% 또는 적어도 70%만큼 선택적으로 증가시키는, TEP 또는 TEP 기능성 RNA를 발현시키는 방법. - 제20항에 있어서, 상기 벡터는 단일 MAR X-29 구성요소 및/또는 서열번호 3과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하고, 그리고 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14주 초과로 배양한 후에, 상기 벡터를 통해 발현되는 상기 TEP 또는 TEP 기능성 RNA는 관심 대상 유전자의 발현을 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60% 또는 적어도 70%만큼 증가시킬 수 있는, TEP 또는 TEP 기능성 RNA를 발현시키는 방법.
- 20, 15, 10 또는 5개 이하의 제1항 내지 제14항 중 어느 한 항의 재조합 핵산 분자를 포함하고, 바람직하게는 단일 복제물로서 세포의 게놈 내로 통합된 재조합 포유류 세포.
- 제22항에 있어서, 상기 세포 내에서 TEP 단백질을 암호화하는 상기 핵산 서열(들)은 제6항 내지 제8항 중 어느 한 항의 단백질을 암호화하는 핵산 서열을 포함하는/이루어진, 재조합 포유류 세포.
- 제23항에 있어서, 상기 세포 내에서 상기 TEP 기능성 RNA를 암호화하는 상기 핵산 서열(들)은 적어도 하나의 재조합 단백질, 바람직하게는 HR 유전자, 예컨대, 이하로 제한되는 것은 아니지만, Rad51, Rad51B, Rad51C, Rad51D, Xrcc2, Xrcc3, Rad52, Rad54, Brca1, Brca2, 사이클린 D1, Ercc1, MDC1, Bard1, 리가제 1, Mre 11 및/또는 53BP1의 발현을 방해하는 기능성 RNA, 바람직하게는 miRNA 또는 shRNA를 암호화하는 핵산 서열(들)을 포함하는/이루어진, 재조합 포유류 세포.
- 제22항 내지 제24항 중 어느 한 항에 있어서, 상기 세포는 1차 줄기 세포, 햄스터, 예를 들어, CHO(중국 햄스터 난소) 세포 또는 인간, 예를 들어, HEK293 세포인, 재조합 포유류 세포.
- 재조합 포유류 세포로서,
a) 적어도 하나의 TEP 기능성 RNA 및/또는 TEP 단백질을 암호화하거나 또는 TEP 기능성 RNA를 암호화하는 적어도 하나의 재조합 핵산 서열, 및
b) 재조합 핵산 분자를 포함하되,
상기 재조합 핵산 분자는,
(i) 적어도 하나의 관심 대상 이식유전자, 및
(ii) 선택적으로, MAR 구성요소를 포함하는, 재조합 포유류 세포. - 제26항에 있어서, 상기 TEP 단백질은 제6항 내지 제8항 중 어느 한 항의 적어도 하나의 TEP인, 재조합 포유류 세포.
- 제26항 또는 제27항에 있어서, 상기 기능성 RNA는 상기 적어도 하나의 단리된 핵산 서열로부터 전사된 일시적으로 형질감염된 siRNA 또는 shRNA이되, 상기 siRNA 또는 상기 가공된 shRNA는 NHEJ(비-상동성 말단-결합), HR(상동성 재조합), MMEJ(마이크로상동체(Microhomolgoy) 매개 말단 결합) 재조합 경로의 부분이거나 또는 MDC1(DNA-손상 검사점 1의 매개자)과 같은 DNA 수선 단백질인 적어도 하나의 표적 유전자의 mRNA의 20, 21, 22, 23, 24 또는 25개의 연속적 뉴클레오타이드에 대해 완전히 상보성인 20, 21, 22, 23, 24 또는 25개의 염기쌍 길이의 안티센스 RNA인, 재조합 포유류 세포.
- 제28항에 있어서, 상기 적어도 하나의 표적 유전자는 하기 부분인 재조합 포유류 세포:
- 상기 NHEJ가 53BP1(종양 억제유전자 p53-결합 단백질 1)인 것,
- 상기 HR이
Rad51(DNA 수선 단백질 RAD51), Rad51B(DNA 수선 단백질 RAD51 상동체 2), Rad51C(DNA 수선 단백질 RAD51 상동체 3),
Rad51D(DNA 수선 단백질 RAD51 상동체 4), Rad52(DNA 수선 단백질 RAD52), Rad54(DNA 수선 및 재조합 단백질 RAD54),
Xrcc2(중국 햄스터 세포 2에서 X-선 수선 보완 결함 수선),
Xrcc3(중국 햄스터 세포 3에서 X-선 수선 보완 결함 수선),
Brca1(유방암 1, 조기 개시),
Brca2(유방암 2, 조기 개시),
Bard1(BRCA1 관련 RING 도메인 1)인 것,
- 상기 MMEJ가
Ercc1(절제 수선 교차-보완(excision repair cross-complementing) 설치류 수선 결함, 상보군 1),
Mre11(감수분열 재조합 11),
리가제1(DNA 리가제 1인 것, 및/또는
상기 DNA 수선 단백질 MDC1인 것. - 제26항 내지 제29항 중 어느 한 항에 있어서, 상기 적어도 하나의 이식유전자는 치료적 단백질, 예컨대 면역글로불린, 에리스로포이에틴과 같은 호르몬 또는 성장인자를 발현시킬 수 있고, 그리고 선택적으로 재조합 포유류 세포에서, 이식유전자 통합 및/또는 발현은 상기 재조합 핵산 분자(들)를 포함하지 않는 세포에 비해 증가되는, 재조합 포유류 세포.
- 제26항 내지 제30항 중 어느 한 항에 있어서, 상기 세포는 적어도 2개의 TEP 기능성 RNA를 포함하되, 상기 TEP RNA 중 하나 또는 둘 다는 일시적으로 형질감염된 siRNA이거나, 또는 TEP 기능성 RNA를 암호화하는 상기 단리된 핵산 서열(들)에 의해 발현되는, 재조합 포유류 세포.
- 제26항 내지 제31항 중 어느 한 항에 있어서, 상기 재조합 포유류 세포는 MAR 구성요소를 포함하는, 재조합 포유류 세포.
- 포유류 세포, 특히 햄스터 세포를 형질감염시키는 방법으로서,
선택적으로 제1 형질감염에서, 상기 포유류 세포를,
(i) 제1항 내지 제13항 중 어느 한 항의 재조합 핵산 분자 중 적어도 1, 적어도 2, 적어도 3 또는 적어도 4개 및/또는
(ii) 선택적으로 5' ITR 및 3' ITR을 인식하는 트랜스포사제(transposase)를 발현시키는 단리된 핵산 또는 mRNA와 함께, 선택적으로 제2, 후속 형질감염에서 선택적으로 형질감염되는 재조합 핵산 분자의 부분인 적어도 1, 적어도 2, 적어도 3 또는 적어도 4개의 단리된 TEP 기능성 RNA 및 적어도 하나의 이식유전자
로 형질감염시키는 단계를 포함하는, 방법. - 제33항에 있어서, 상기 세포는 제6항에 명시된 상기 TEP 단백질 중 1, 2 또는 3개를 암호화하는 상기 재조합 핵산 분자의 적어도 2, 적어도 3 또는 적어도 4개를 포함하는 1개 초과로 형질감염되는, 방법.
- 제33항 또는 제34항에 있어서, 각각의 상기 핵산 분자는 벡터의 부분이고, 상기 벡터는 공동-형질감염되는, 방법.
- 제35항에 있어서, 상기 공동-형질감염, 바람직하게는 단백질 SRP14, SRP9 및 SRP54를 암호화하는 재조합 핵산 분자의 공동-형질감염은 이러한 공동-형질감염을 받지 않은 세포에 비해 상기 세포에서 이식유전자 통합 및/또는 발현을 증가시키는, 방법.
- 제33항 또는 임의의 후속 청구항에 있어서, 재조합 포유류 세포를 얻기 위해 상기 TEP 단백질 또는 TEP 기능성 RNA를 안정하게 발현시키는 다수의 상기 포유류 세포가 얻어지되, 상기 재조합 포유류 세포의 수는 상기 MAR 구성요소의 존재와는 독립적인, 방법.
- 제33항 또는 임의의 후속 청구항에 있어서, 상기 포유류 세포는 2회 형질감염되는 방법.
- 제33항에 있어서, 적어도 30%, 40% 또는 45%의 상기 포유류 세포는 재조합 포유류 세포가 되고 상기 이식유전자를 발현시키는, 방법.
- 제33항에 있어서, 상기 포유류 세포는 선택적으로 상기 5' 및 3' ITR을 인식하는 트랜스포사제를 발현시키는 단리된 핵산 또는 mRNA와 함께 상기 적어도 하나의 단리된 TEP 기능성 RNA 및 상기 적어도 하나의 이식유전자를 포함하는 벡터 및 선택적으로 상기 적어도 하나의 이식유전자에 측접하는 3' ITR 및 5' ITR로 형질감염되는, 방법.
- 제33항 또는 임의의 후속 청구항에 있어서, 상기 이식유전자는 치료적 단백질, 예컨대 면역글로불린, 호르몬, 사이토카인 또는 성장인자인, 방법.
- 제33항 또는 임의의 후속 청구항에 있어서, 상기 재조합 핵산 분자는 선택적으로 선택 마커를 포함하되, 상기 적어도 하나의 이식유전자는
(a) 상기 마커에 대한 선택 없이, 또는
(b) 예를 들어, 배양 배지에 함유된 선택제를 통해, 상기 마커에 대한 선택과 함께, 그리고
(c) 트랜스포사제 없이, 또는
(d) 트랜스포사제의 존재 하에, 발현되는, 방법. - 제33항에 있어서, 상기 TEP 기능성 RNA는 shRNA를 암호화하는 재조합 핵산 서열에 의해 암호화되거나 또는 적어도 하나의 HR 유전자, 예컨대, 이하로 제한되는 것은 아니지만, Rad51, Rad51B, Rad51C, Rad51D, Xrcc2, Xrcc3, Rad52, Rad54, Brca1, Brca2, 사이클린 D1, Ercc1, MDC1, Bard1, 리가제 1, Mre 11 및/또는 53BP1의 발현을 방해하는 siRNA를 포함하는/이루어진, 방법.
- 제33항 또는 임의의 후속 청구항에 있어서, 이식유전자 통합 및/또는 발현은 상기 단리된 핵산 분자 및/또는 상기 단리된 TEP 기능성 RNA 중 상기 적어도 하나로 형질감염되지 않은 세포에 비해 그러한 세포에서 증가되는, 방법.
- 하나의 용기에 제1항 내지 제13항 중 어느 한 항에 따른 재조합 핵산 분자 중 임의의 하나를 포함하는 적어도 하나의 벡터를, 제2 선택적 용기에 양립 가능한 트랜스포사제를 암호화하는 벡터를, 그리고 추가의 용기에 벡터 또는 벡터들을 사용하는 방법의 설명서를 포함하는, 키트.
- 제45항에 있어서, 하나 이상의 벡터가 하나 이상의 용기 내에 제공되고, 상기 TEP 단백질은 샤페론, SRP14, SRP9 또는 SRP54 중 적어도 둘인, 키트.
- 제45항에 있어서, 상기 벡터(들) 내의 상기 TEP 기능성 RNA(들)는 적어도 하나의 HR 유전자, 예컨대, 이하로 제한되는 것은 아니지만, Rad51, Rad51B, Rad51C, Rad51D, Xrcc2, Xrcc3, Rad52, Rad54, Brca1, Brca2 사이클린 D1, Ercc1, MDC1, Bard1, 리가제 1, Mre11 및/또는 53BP1의 발현을 방해하는 miRNA, siRNA 또는 shRNA를 암호화하는 핵산 서열, 및 선택적으로 추가의 용기에 적어도 하나의 HR 유전자, 예컨대, 이하로 제한되는 것은 아니지만, Rad51, Rad51B, Rad51C, Rad51D, Xrcc2, Xrcc3, Rad52, Rad54, Brca1, Brca2, 사이클린 D1, Ercc1, MDC1, Bard1, 리가제 1, Mre11 및/또는 53BP1의 발현을 방해하는 siRNA(들)를 포함하는/이루어진, 키트.
- 바람직하게는 이식유전자 통합 및/또는 발현을 증가시키기 위한, 제1항 내지 제13항 중 어느 한 항의 재조합 핵산 및/또는 제22항 내지 제31항 중 어느 한 항의 재조합 포유류 세포의 용도.
- 발현 벡터로서,
(a) 프로모터에 의해 상류에 그리고 폴리아데닐화 신호에 의해 하류에 측접된 이식유전자,
(b) 상기 폴리아데닐화 신호 하류의 단일 MAR 구성요소, 또는
(c) 관심 대상 이식유전자의 상류의 제1 MAR 구성요소 및 상기 이식유전자 통합 부위의 하류의 제2 MAR 구성요소를 포함하는, 발현 벡터. - 제49항에 있어서, 상기 단일 또는 제1 및 제2 MAR 구성요소는 MAR 구성요소들 1_68, 1_6, 1_6R2, 1_68R, 1_68R2, X_29R3 또는 X_29 또는 서열번호 1, 2, 3, 6, 7, 8, 9 또는 10과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소들로부터 선택되는, 발현 벡터.
- 제49항에 있어서, 상기 단일 또는 제1 및 제2 MAR(들)은 재배열된 MAR 구성요소들 1_6R2, 1_68R, 1_68R2 또는 X_29R3 또는 서열번호 6, 7, 8 또는 10과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소들로부터 선택될 수 있되, 선택적으로, 상기 MAR 구성요소(들)는 그들의 비-재배열된 상대에 비해 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60% 또는 적어도 70%만큼 상기 관심 대상 이식유전자의 발현을 증가시키는, 발현 벡터.
- 제49항 내지 제51항 중 어느 한 항에 있어서, 상기 프로모터는 EF1 알파 프로모터이고, 상기 폴리아데닐화 신호는 BGH 폴리A 신호인, 발현 벡터.
- 제49항 내지 제52항 중 어느 한 항에 있어서, 상기 벡터는 프로모터(들) 및/또는 인핸서(들) 또는 이들의 융합물, 예컨대 GAPDH, CGAPDH, CSV40p, CMVp, CHO Ef1알파, CHO Actb 또는 CHO Hspa5를 포함하는, 발현 벡터.
- 제53항에 있어서, 상기 프로모터는 GAPDH 프로모터이고, CMV 인핸서를 포함하는, 발현 벡터.
- 제49항 내지 제54항 중 어느 한 항에 있어서, 상기 하나 또는 제1 및/또는 제2 MAR, 인핸서, 프로모터, 관심 대상 이식유전자 및 폴리아데닐화 신호는 5' ITR과 3' ITR 사이에 위치되는, 발현 벡터.
- 제49항 내지 제55항 중 어느 한 항에 있어서,
(a) 상기 폴리아데닐화 신호의 하류의 단일 MAR 구성요소로서, 상기 단일 MAR 구성요소는 바람직하게는 MAR 1-68 또는 MARX-29 구성요소 및/또는 서열번호 1 또는 3과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소, 특히 MAR 1-68 또는 MAR X-29에 기반한 재배열된 MAR, 특히, 서열번호 6, 7 또는 10(MAR 1_68R, 1_68R2 또는 X_29R3) 또는 서열번호 9와 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 가지고, 바람직하게는 MAR X-29 구성요소이고/이거나 서열번호 3과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 구성요소인, 상기 단일 MAR 구성요소, 또는
(b) 상기 관심 대상 이식유전자의 상류의 제1 MAR 구성요소 및 상기 관심 대상 이식유전자의 하류의 제2 MAR 구성요소로서, 상기 제2 MAR 구성요소는 바람직하게는 1_6 구성요소를 포함하고/하거나 서열번호 2와, 특히 MAR 1-6에 기반한 재배열된 MAR과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖고, 특히 서열번호 8과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 가지며(MAR 1_6R2), 상기 제2 MAR 구성요소는 바람직하게는 MAR 1-68 구성요소를 포함하고/하거나 서열번호 1과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는, 상기 제1 MAR 구성요소 및 제2 MAR 구성요소를 포함하는, 발현 벡터. - 제56항에 있어서, 상기 단일 MAR 구성요소를 포함할 수 있고, 상기 단일 MAR 구성요소는 폴리아데닐화 부위의 하류에 위치되며 MAR 1-68 또는 MAR X-29이고/이거나 서열번호 1 또는 3과, 특히 MAR 1-68 또는 MAR X-29에 기반한 재배열된 MAR과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖고, 특히 서열번호 6, 7 또는 10(MAR 1_68R, 1_68R2 또는 X_29R3) 또는 9와 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 지니는 구성요소이고, 바람직하게는 MAR X-29-유래 구성요소이고/이거나 서열번호 3과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는, 발현 벡터.
- 제56항에 있어서, 상기 이식유전자의 상류의 제1 MAR 구성요소 및 상기 관심 대상 이식유전자의 하류의 제2 MAR 구성요소를 포함하되, 상기 제1 MAR 구성요소는 MAR 1_6 구성요소를 포함하고/있거나 서열번호 2와 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖고, 상기 제2 MAR 구성요소는 MAR 1_68 구성요소를 포함하고/하거나 서열번호 1과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는, 발현 벡터.
- 이식유전자의 발현 방법으로서,
상기 이식유전자를 포함하는 제48항 내지 제57항 중 어느 한 항의 벡터 중 하나를 포함하는 재조합 포유류 세포를 제공하는 단계 및 상기 이식유전자를 발현시키는 단계를 포함하되, 상기 MAR 구성요소(들)는 바람직하게는 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60% 또는 적어도 70%만큼 상기 이식유전자의 발현을 증가시키는, 이식유전자의 발현 방법. - 제59항에 있어서, 상기 벡터는 MAR X_29 구성요소 및/또는 서열번호 3과 적어도 80%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산을 포함하되, 배양의 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14주 초과 후에, 상기 MAR 구성요소는 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60% 또는 적어도 70%만큼 관심 대상 이식유전자의 발현을 증가시키는, 이식유전자의 발현 방법.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361759802P | 2013-02-01 | 2013-02-01 | |
US61/759,802 | 2013-02-01 | ||
US201361800244P | 2013-03-15 | 2013-03-15 | |
US61/800,244 | 2013-03-15 | ||
US201361806634P | 2013-03-29 | 2013-03-29 | |
US61/806,634 | 2013-03-29 | ||
PCT/IB2014/000100 WO2014118619A2 (en) | 2013-02-01 | 2014-02-01 | Enhanced transgene expression and processing |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150123803A true KR20150123803A (ko) | 2015-11-04 |
KR102235603B1 KR102235603B1 (ko) | 2021-04-05 |
Family
ID=50239688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157022393A KR102235603B1 (ko) | 2013-02-01 | 2014-02-01 | 향상된 이식유전자 발현 및 가공 |
Country Status (21)
Country | Link |
---|---|
US (1) | US11898154B2 (ko) |
EP (2) | EP3536797B1 (ko) |
JP (1) | JP6563816B2 (ko) |
KR (1) | KR102235603B1 (ko) |
CN (1) | CN105073995A (ko) |
AU (2) | AU2014210856B2 (ko) |
CA (1) | CA2898878C (ko) |
DK (2) | DK3536797T3 (ko) |
ES (2) | ES2940433T3 (ko) |
FI (1) | FI3536797T3 (ko) |
HK (1) | HK1216323A1 (ko) |
HU (2) | HUE043103T2 (ko) |
IL (1) | IL240198B (ko) |
LT (1) | LT2951309T (ko) |
PL (2) | PL2951309T3 (ko) |
PT (2) | PT3536797T (ko) |
RU (1) | RU2711505C9 (ko) |
SG (2) | SG11201505487UA (ko) |
SI (1) | SI2951309T1 (ko) |
WO (1) | WO2014118619A2 (ko) |
ZA (1) | ZA201506419B (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180127358A (ko) * | 2016-03-15 | 2018-11-28 | 막스-델부뤽-센트럼 퓌어 몰레쿨라레 메디친 인 데어 헬름홀츠-게마인샤프트 | 증강된 슬리핑 뷰티 트랜스포존, 키트 및 전위 방법 |
KR20190056378A (ko) * | 2016-10-03 | 2019-05-24 | 다이이찌 산쿄 가부시키가이샤 | Hspa5 유전자의 프로모터 |
Families Citing this family (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104975009B (zh) * | 2014-04-01 | 2019-10-18 | 三生国健药业(上海)股份有限公司 | 一种新型的含mar核心片段的动物细胞表达载体 |
CN105154473B (zh) * | 2015-09-30 | 2019-03-01 | 上海细胞治疗研究院 | 一种高效安全的转座子整合系统及其用途 |
JP6871679B2 (ja) * | 2016-03-23 | 2021-05-12 | 国立大学法人 岡山大学 | 遺伝子発現用カセット及びその産生物 |
WO2017061354A1 (ja) * | 2015-10-06 | 2017-04-13 | 国立大学法人 岡山大学 | 遺伝子発現用カセット及びその産生物 |
JP2017070224A (ja) * | 2015-10-06 | 2017-04-13 | 国立大学法人 岡山大学 | 遺伝子発現用カセット及びその産生物 |
JP7370702B2 (ja) | 2015-12-24 | 2023-10-30 | セレクシス エス.エー. | タンパク質製造用の改善された真核細胞およびそれらの作製方法 |
ITUA20161610A1 (it) * | 2016-03-14 | 2017-09-14 | Angela Anna Messina | Composto peptidico farmacologicamente attivo, procedimento per la sua preparazione e suo uso. |
EP3219800A1 (en) * | 2016-03-15 | 2017-09-20 | Max-Delbrück-Centrum Für Molekulare Medizin | A transposon-based transfection system for primary cells |
ES2938626T3 (es) * | 2016-05-03 | 2023-04-13 | Lonza Ag | Modulación del metabolismo de los lípidos para la producción de proteínas |
US11278570B2 (en) | 2016-12-16 | 2022-03-22 | B-Mogen Biotechnologies, Inc. | Enhanced hAT family transposon-mediated gene transfer and associated compositions, systems, and methods |
KR102523318B1 (ko) | 2016-12-16 | 2023-04-18 | 비-모젠 바이오테크놀로지스, 인크. | 증진된 hAT 패밀리 트랜스포존 매개 유전자 전달 및 연관된 조성물, 시스템, 및 방법 |
WO2018224162A1 (en) * | 2017-06-09 | 2018-12-13 | Biontech Rna Pharmaceuticals Gmbh | Methods for characterizing loss of antigen presentation |
WO2019066548A2 (ko) * | 2017-09-29 | 2019-04-04 | (주)벳바젠 | 심부전의 예방 또는 치료용 약학적 조성물 |
CN109929839B (zh) * | 2017-12-18 | 2021-02-12 | 华东师范大学 | 拆分型单碱基基因编辑系统及其应用 |
CN108504692B (zh) * | 2018-03-26 | 2021-07-23 | 安徽大学 | 一种基因敲除cho细胞株的构建方法及其在治疗性重组蛋白表达中的应用 |
US20210214747A1 (en) * | 2018-05-18 | 2021-07-15 | Sorbonne Universite | Molecular tools and methods for transgene integration and their transposition dependent expression |
WO2019246486A2 (en) | 2018-06-21 | 2019-12-26 | B-Mogen Biotechnologies, Inc. | ENHANCED hAT FAMILY TRANSPOSON-MEDIATED GENE TRANSFER AND ASSOCIATED COMPOSITIONS, SYSTEMS, AND METHODS |
RU2686102C1 (ru) * | 2018-08-07 | 2019-04-24 | Федеральное Государственное Бюджетное Учреждение Науки Институт Молекулярной Биологии Им. В.А. Энгельгардта Российской Академии Наук (Имб Ран) | Рекомбинантный вектор для создания плазмидных генетических конструкций, обладающих повышенной длительностью экспрессии целевых генов |
US20210343368A1 (en) * | 2018-09-05 | 2021-11-04 | Max-Delbrück-Centrum Für Molekulare Medizin In Der Helmholtz-Gemeinschaft | Method for Engineering Synthetic Cis-Regulatory DNA |
US20210380661A1 (en) * | 2018-10-16 | 2021-12-09 | Texas Tech University System | Method to Express, Purify, and Biotinylate Eukaryotic Cell-Derived Major Histocompatibility Complexes |
WO2020084528A1 (en) | 2018-10-24 | 2020-04-30 | Selexis Sa | Expression systems, recombinant cells and uses thereof |
EP3902910A1 (en) * | 2018-12-24 | 2021-11-03 | Selexis S.A. | Characterization and inactivation of endogenous retroviruses in chinese hamster ovary cells |
US20220088158A1 (en) | 2019-01-23 | 2022-03-24 | Aceragen, Inc. | Method of ameliorating a pro-inflammatory immunophenotype in farber disease subjects by repeated administration of a recombinant human acid ceramidase |
IT201900002321A1 (it) * | 2019-02-18 | 2020-08-18 | Univ Degli Studi Padova | Peptidi con attivita' antitumorale |
TWI818166B (zh) * | 2019-03-27 | 2023-10-11 | 美商菲尼克斯組織修復公司 | 用於生產膠原蛋白7組合物之系統及方法 |
CN110006866B (zh) * | 2019-04-16 | 2022-04-22 | 杭州迈尔德生物科技有限公司 | 一种阿片类活性物质的通用检测方法及其检测试剂盒 |
WO2020228721A1 (en) * | 2019-05-13 | 2020-11-19 | Lin Mei Chun | Method and kit for monitoring cancer |
WO2021069675A1 (en) * | 2019-10-10 | 2021-04-15 | The Regents Of The University Of California | Methods to stabilize mammalian cells |
IL270306A (en) | 2019-10-30 | 2021-05-31 | Yeda Res & Dev | Prevention and treatment of pre-myeloid and myeloid malignancies |
CN110863008B (zh) * | 2019-11-22 | 2020-10-16 | 昆明学院 | Mar序列调控弱启动子构建高效表达载体的方法 |
US20230046668A1 (en) | 2019-12-24 | 2023-02-16 | Selexis S.A. | Targeted integration in mammalian sequences enhancing gene expression |
CN111500629B (zh) * | 2020-04-17 | 2021-11-19 | 安徽中盛溯源生物科技有限公司 | 一种高表达层粘连蛋白-511变体的方法及其应用 |
WO2021231569A1 (en) * | 2020-05-14 | 2021-11-18 | Seattle Children's Hospital (dba Seattle Children's Research Institute) | Dual promoter systems |
US20220010332A1 (en) * | 2020-07-08 | 2022-01-13 | Neuracle Genetics Inc. | Intron fragments |
CN113881703B (zh) * | 2021-10-11 | 2022-06-21 | 中国人民解放军军事科学院军事医学研究院 | 一种提高cho细胞同源重组效率的方法及其相关产品和应用 |
CN116440269B (zh) * | 2022-01-10 | 2024-02-09 | 华中农业大学 | Slc35a1基因作为靶点在防治猪流行性腹泻病中的应用 |
CN114958914B (zh) * | 2022-06-06 | 2023-09-26 | 新乡医学院 | 一种人类及哺乳动物细胞附着体表达载体、构建方法和应用 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0743365A2 (en) * | 1995-05-17 | 1996-11-20 | Ajinomoto Co., Inc. | Process for efficiently producing transglutaminase through DNA recombination |
US20040235011A1 (en) * | 2002-06-26 | 2004-11-25 | Cooper Richard K. | Production of multimeric proteins |
WO2011033375A2 (en) * | 2009-09-18 | 2011-03-24 | Selexis S.A. | Products and methods for enhanced transgene expression and processing |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5731178A (en) | 1990-03-21 | 1998-03-24 | Behringwerke Aktiengesellschaft | Attachment-elements for stimulation of eukaryotic expression systems |
ATE437233T1 (de) | 2001-01-26 | 2009-08-15 | Selexis Sa | Matrix-anheftungsregionen und verfahren zu deren verwendung |
WO2004065581A2 (en) * | 2003-01-15 | 2004-08-05 | Discovery Genomics, Inc. | Transposon-insulator element delivery systems |
US7244616B2 (en) * | 2003-06-27 | 2007-07-17 | Bayer Pharmaceuticals Corporation | Use of molecular chaperones for the enhanced production of secreted, recombinant proteins in mammalian cells |
WO2005040377A2 (en) | 2003-10-24 | 2005-05-06 | Selexis S.A. | High efficiency gene transfer and expression in mammalian cells by a multiple transfection procedure of matrix attachment region sequences |
ES2292271B1 (es) * | 2004-05-20 | 2009-02-16 | Proyecto De Biomedicina Cima, S.L. | Un vector hibrido adenovirus-alfavirus para la administracion eficaz y expresion de genes terapeuticos en celulas tumorales. |
JP2008543283A (ja) * | 2005-06-10 | 2008-12-04 | ジェネンテック・インコーポレーテッド | インスレーターエレメントを含むベクターを使用する抗体発現の改良 |
DK3156414T3 (da) * | 2007-09-26 | 2020-03-09 | Intrexon Corp | Syntetisk 5'utrs ekspressionsvektorer og fremgangsmåder til øgning af transgen ekspression |
US20090247609A1 (en) | 2007-12-20 | 2009-10-01 | Hitto Kaufmann | Sm-protein based secretion engineering |
US20100105140A1 (en) * | 2008-07-16 | 2010-04-29 | Fahrenkrug Scott C | Plaice dna transposon system |
WO2010118360A1 (en) * | 2009-04-09 | 2010-10-14 | The Board Of Supervisors Of Louisiana State University And Agricultural And Mechanical College | Production of proteins using transposon-based vectors |
-
2014
- 2014-02-01 EP EP19153376.9A patent/EP3536797B1/en active Active
- 2014-02-01 DK DK19153376.9T patent/DK3536797T3/da active
- 2014-02-01 CA CA2898878A patent/CA2898878C/en active Active
- 2014-02-01 WO PCT/IB2014/000100 patent/WO2014118619A2/en active Application Filing
- 2014-02-01 CN CN201480010305.9A patent/CN105073995A/zh active Pending
- 2014-02-01 ES ES19153376T patent/ES2940433T3/es active Active
- 2014-02-01 HU HUE14708935A patent/HUE043103T2/hu unknown
- 2014-02-01 DK DK14708935.3T patent/DK2951309T3/en active
- 2014-02-01 EP EP14708935.3A patent/EP2951309B1/en active Active
- 2014-02-01 US US14/761,460 patent/US11898154B2/en active Active
- 2014-02-01 JP JP2015555816A patent/JP6563816B2/ja active Active
- 2014-02-01 HU HUE19153376A patent/HUE061494T2/hu unknown
- 2014-02-01 PL PL14708935T patent/PL2951309T3/pl unknown
- 2014-02-01 ES ES14708935T patent/ES2717175T3/es active Active
- 2014-02-01 LT LTEP14708935.3T patent/LT2951309T/lt unknown
- 2014-02-01 FI FIEP19153376.9T patent/FI3536797T3/fi active
- 2014-02-01 PT PT191533769T patent/PT3536797T/pt unknown
- 2014-02-01 PT PT14708935T patent/PT2951309T/pt unknown
- 2014-02-01 PL PL19153376.9T patent/PL3536797T3/pl unknown
- 2014-02-01 KR KR1020157022393A patent/KR102235603B1/ko active IP Right Grant
- 2014-02-01 SG SG11201505487UA patent/SG11201505487UA/en unknown
- 2014-02-01 SI SI201431115T patent/SI2951309T1/sl unknown
- 2014-02-01 RU RU2015127667A patent/RU2711505C9/ru active
- 2014-02-01 SG SG10201803758XA patent/SG10201803758XA/en unknown
- 2014-02-01 AU AU2014210856A patent/AU2014210856B2/en active Active
-
2015
- 2015-07-28 IL IL24019815A patent/IL240198B/en active IP Right Grant
- 2015-09-01 ZA ZA2015/06419A patent/ZA201506419B/en unknown
-
2016
- 2016-04-14 HK HK16104299.2A patent/HK1216323A1/zh unknown
-
2019
- 2019-10-18 AU AU2019250224A patent/AU2019250224B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0743365A2 (en) * | 1995-05-17 | 1996-11-20 | Ajinomoto Co., Inc. | Process for efficiently producing transglutaminase through DNA recombination |
US20040235011A1 (en) * | 2002-06-26 | 2004-11-25 | Cooper Richard K. | Production of multimeric proteins |
WO2011033375A2 (en) * | 2009-09-18 | 2011-03-24 | Selexis S.A. | Products and methods for enhanced transgene expression and processing |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180127358A (ko) * | 2016-03-15 | 2018-11-28 | 막스-델부뤽-센트럼 퓌어 몰레쿨라레 메디친 인 데어 헬름홀츠-게마인샤프트 | 증강된 슬리핑 뷰티 트랜스포존, 키트 및 전위 방법 |
KR20190056378A (ko) * | 2016-10-03 | 2019-05-24 | 다이이찌 산쿄 가부시키가이샤 | Hspa5 유전자의 프로모터 |
US11555204B2 (en) | 2016-10-03 | 2023-01-17 | Daiichi Sankyo Company, Limited | Promoter of Hspa5 gene |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019250224B2 (en) | Enhanced transgene expression and processing | |
AU2022201329B2 (en) | Genetically modified cells, tissues, and organs for treating disease | |
CN114176043B (zh) | 用于治疗疾病的遗传修饰的细胞、组织和器官 | |
KR102301464B1 (ko) | 종양 세포에 의한 면역 억제를 감소시키기 위한 방법 및 조성물 | |
KR20210116526A (ko) | 증진된 항-신생물 활성 및 면역억제 내성을 갖는 변형된 면역 세포 | |
KR102531749B1 (ko) | Cho 세포 내 통합 부위 | |
KR20210143897A (ko) | 오리지아스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포로의 통합 | |
KR101476010B1 (ko) | 고생산성 세포의 수립을 위한 발현 벡터 및 고생산성 세포 | |
KR20120099376A (ko) | 강화된 전이 유전자 발현과 공정 방법 및 그 산물 | |
AU2022200903B2 (en) | Engineered Cascade components and Cascade complexes | |
KR20200126997A (ko) | 인간 대상체에서의 비-노화-관련 청각 손상의 치료를 위한 조성물 및 방법 | |
KR20220002609A (ko) | 포유동물 세포의 특성을 변경하기 위한 인공 마이크로-rna 및 이들 생성물의 조성물을 사용한 포유동물 세포의 변형 | |
KR20150027793A (ko) | 제한된 면역글로불린 중쇄 유전자좌를 가지는 인간화된 비-인간 동물 | |
KR20210144861A (ko) | 아마이엘로이스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포 게놈으로의 전위 | |
RU2744831C2 (ru) | Не относящееся к человеку животное, у которого проявляется снижение функции верхних и нижних моторных нейронов и чувственного восприятия | |
CN113544257A (zh) | 中国仓鼠卵巢细胞中内源性逆转录病毒的表征及灭活 | |
KR102553990B1 (ko) | Hspa5 유전자의 프로모터 | |
KR20220157944A (ko) | 인간 대상체에서 비-연령-연관 청각 장애를 치료하기 위한 조성물 및 방법 | |
TW201207103A (en) | DNA element having the activity of enhancing foreign gene expression | |
RU2814721C2 (ru) | Транспозиция конструкций нуклеиновой кислоты в эукариотические геномы с транспозазой из amyelois | |
RU2817770C2 (ru) | Интеграция конструкций нуклеиновой кислоты в эукариотические клетки с транспозазой из oryzias | |
RU2774631C1 (ru) | Сконструированные компоненты cascade и комплексы cascade |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
X091 | Application refused [patent] | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |