JP6744909B2 - タンパク質の少なくとも1つの適応度値を予測するための方法及び電子システム、関連するコンピュータプログラム製品 - Google Patents
タンパク質の少なくとも1つの適応度値を予測するための方法及び電子システム、関連するコンピュータプログラム製品 Download PDFInfo
- Publication number
- JP6744909B2 JP6744909B2 JP2018505535A JP2018505535A JP6744909B2 JP 6744909 B2 JP6744909 B2 JP 6744909B2 JP 2018505535 A JP2018505535 A JP 2018505535A JP 2018505535 A JP2018505535 A JP 2018505535A JP 6744909 B2 JP6744909 B2 JP 6744909B2
- Authority
- JP
- Japan
- Prior art keywords
- protein
- fitness
- value
- values
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108090000623 proteins and genes Proteins 0.000 title claims description 362
- 102000004169 proteins and genes Human genes 0.000 title claims description 356
- 238000000034 method Methods 0.000 title claims description 74
- 238000004590 computer program Methods 0.000 title claims description 11
- 238000001228 spectrum Methods 0.000 claims description 148
- 150000001413 amino acids Chemical class 0.000 claims description 44
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 31
- 238000004364 calculation method Methods 0.000 claims description 26
- 230000003595 spectral effect Effects 0.000 claims description 25
- 238000012216 screening Methods 0.000 claims description 18
- 238000005259 measurement Methods 0.000 claims description 15
- 229940024606 amino acid Drugs 0.000 description 36
- 238000012549 training Methods 0.000 description 32
- 230000035772 mutation Effects 0.000 description 22
- 238000010200 validation analysis Methods 0.000 description 21
- 230000000694 effects Effects 0.000 description 20
- 230000027455 binding Effects 0.000 description 16
- 238000004458 analytical method Methods 0.000 description 14
- 238000012360 testing method Methods 0.000 description 14
- 102000002004 Cytochrome P-450 Enzyme System Human genes 0.000 description 11
- 108010015742 Cytochrome P-450 Enzyme System Proteins 0.000 description 11
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 10
- 102000003390 tumor necrosis factor Human genes 0.000 description 10
- 231100000655 enterotoxin Toxicity 0.000 description 9
- 108020004999 messenger RNA Proteins 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 102000005486 Epoxide hydrolase Human genes 0.000 description 8
- 108020002908 Epoxide hydrolase Proteins 0.000 description 8
- 230000003993 interaction Effects 0.000 description 8
- 238000000513 principal component analysis Methods 0.000 description 8
- 102000005962 receptors Human genes 0.000 description 8
- 108020003175 receptors Proteins 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 102000001714 Agammaglobulinaemia Tyrosine Kinase Human genes 0.000 description 7
- 108010029445 Agammaglobulinaemia Tyrosine Kinase Proteins 0.000 description 7
- DTHNMHAUYICORS-KTKZVXAJSA-N Glucagon-like peptide 1 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 DTHNMHAUYICORS-KTKZVXAJSA-N 0.000 description 7
- 101000877314 Homo sapiens Histone-lysine N-methyltransferase EHMT1 Proteins 0.000 description 7
- 239000000147 enterotoxin Substances 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 6
- 238000000126 in silico method Methods 0.000 description 6
- 108090000765 processed proteins & peptides Proteins 0.000 description 6
- 101710146739 Enterotoxin Proteins 0.000 description 5
- 230000003197 catalytic effect Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000002790 cross-validation Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 101800000224 Glucagon-like peptide 1 Proteins 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 102100040918 Pro-glucagon Human genes 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 4
- 238000004220 aggregation Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 210000002064 heart cell Anatomy 0.000 description 4
- 210000003292 kidney cell Anatomy 0.000 description 4
- 238000000491 multivariate analysis Methods 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- WRGVLTAWMNZWGT-VQSPYGJZSA-N taspoglutide Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NC(C)(C)C(=O)N[C@@H](CCCNC(N)=N)C(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)C(C)(C)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 WRGVLTAWMNZWGT-VQSPYGJZSA-N 0.000 description 4
- 108010048573 taspoglutide Proteins 0.000 description 4
- 229950007151 taspoglutide Drugs 0.000 description 4
- 108010086246 Glucagon-Like Peptide-1 Receptor Proteins 0.000 description 3
- 102000007446 Glucagon-Like Peptide-1 Receptor Human genes 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 102000037865 fusion proteins Human genes 0.000 description 3
- 108020001507 fusion proteins Proteins 0.000 description 3
- 230000005847 immunogenicity Effects 0.000 description 3
- 239000003446 ligand Substances 0.000 description 3
- 231100000419 toxicity Toxicity 0.000 description 3
- 230000001988 toxicity Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 201000003874 Common Variable Immunodeficiency Diseases 0.000 description 2
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 2
- 108010088406 Glucagon-Like Peptides Proteins 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- QNAYBMKLOCPYGJ-UWTATZPHSA-N L-Alanine Natural products C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- 101150053185 P450 gene Proteins 0.000 description 2
- 102100033732 Tumor necrosis factor receptor superfamily member 1A Human genes 0.000 description 2
- 101710187743 Tumor necrosis factor receptor superfamily member 1A Proteins 0.000 description 2
- 101710187830 Tumor necrosis factor receptor superfamily member 1B Proteins 0.000 description 2
- 102100033733 Tumor necrosis factor receptor superfamily member 1B Human genes 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 239000000556 agonist Substances 0.000 description 2
- 229960003767 alanine Drugs 0.000 description 2
- 210000003719 b-lymphocyte Anatomy 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 239000003054 catalyst Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 150000003278 haem Chemical class 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000010238 partial least squares regression Methods 0.000 description 2
- 230000036515 potency Effects 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 230000006916 protein interaction Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 231100000617 superantigen Toxicity 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- TVEXGJYMHHTVKP-UHFFFAOYSA-N 6-oxabicyclo[3.2.1]oct-3-en-7-one Chemical group C1C2C(=O)OC1C=CC2 TVEXGJYMHHTVKP-UHFFFAOYSA-N 0.000 description 1
- 101000765308 Aspergillus niger N-(5'-phosphoribosyl)anthranilate isomerase Proteins 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 101000745610 Bacillus megaterium (strain ATCC 14581 / DSM 32 / JCM 2506 / NBRC 15308 / NCIMB 9376 / NCTC 10342 / NRRL B-14308 / VKM B-512) NADPH-cytochrome P450 reductase Proteins 0.000 description 1
- 101000870204 Bacillus subtilis (strain 168) NADPH-cytochrome P450 reductase Proteins 0.000 description 1
- 101000956924 Bacillus subtilis (strain 168) NADPH-cytochrome P450 reductase Proteins 0.000 description 1
- 208000023706 Bruton agammaglobulinaemia Diseases 0.000 description 1
- 201000010717 Bruton-type agammaglobulinemia Diseases 0.000 description 1
- 102000005701 Calcium-Binding Proteins Human genes 0.000 description 1
- 108010045403 Calcium-Binding Proteins Proteins 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 101710095468 Cyclase Proteins 0.000 description 1
- 102000018832 Cytochromes Human genes 0.000 description 1
- 108010052832 Cytochromes Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 108010011459 Exenatide Proteins 0.000 description 1
- 206010016952 Food poisoning Diseases 0.000 description 1
- 208000019331 Foodborne disease Diseases 0.000 description 1
- 102100029974 GTPase HRas Human genes 0.000 description 1
- 102000051325 Glucagon Human genes 0.000 description 1
- 108060003199 Glucagon Proteins 0.000 description 1
- 101000584633 Homo sapiens GTPase HRas Proteins 0.000 description 1
- 101500028774 Homo sapiens Glucagon-like peptide 1 Proteins 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 208000001718 Immediate Hypersensitivity Diseases 0.000 description 1
- 206010061598 Immunodeficiency Diseases 0.000 description 1
- 208000029462 Immunodeficiency disease Diseases 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 101001065566 Mus musculus Lymphocyte antigen 6A-2/6E-1 Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 108010043958 Peptoids Proteins 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 101001015518 Rattus norvegicus Glucagon-like peptide 1 receptor Proteins 0.000 description 1
- 230000010799 Receptor Interactions Effects 0.000 description 1
- 206010040070 Septic Shock Diseases 0.000 description 1
- 239000004283 Sodium sorbate Substances 0.000 description 1
- 206010044248 Toxic shock syndrome Diseases 0.000 description 1
- 231100000650 Toxic shock syndrome Toxicity 0.000 description 1
- 206010045240 Type I hypersensitivity Diseases 0.000 description 1
- 208000016349 X-linked agammaglobulinemia Diseases 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 102000030621 adenylate cyclase Human genes 0.000 description 1
- 108060000200 adenylate cyclase Proteins 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 208000010216 atopic IgE responsiveness Diseases 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000011712 cell development Effects 0.000 description 1
- 230000011748 cell maturation Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- JUFFVKRROAPVBI-PVOYSMBESA-N chembl1210015 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N[C@H]1[C@@H]([C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO[C@]3(O[C@@H](C[C@H](O)[C@H](O)CO)[C@H](NC(C)=O)[C@@H](O)C3)C(O)=O)O2)O)[C@@H](CO)O1)NC(C)=O)C(=O)NCC(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 JUFFVKRROAPVBI-PVOYSMBESA-N 0.000 description 1
- 238000002742 combinatorial mutagenesis Methods 0.000 description 1
- 230000009137 competitive binding Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- GYZLOYUZLJXAJU-UHFFFAOYSA-N diglycidyl ether Chemical compound C1OC1COCC1CO1 GYZLOYUZLJXAJU-UHFFFAOYSA-N 0.000 description 1
- 150000002009 diols Chemical class 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 230000005672 electromagnetic field Effects 0.000 description 1
- 229960001519 exenatide Drugs 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- MASNOZXLGMXCHN-ZLPAWPGGSA-N glucagon Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 MASNOZXLGMXCHN-ZLPAWPGGSA-N 0.000 description 1
- 229960004666 glucagon Drugs 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000007813 immunodeficiency Effects 0.000 description 1
- 230000016784 immunoglobulin production Effects 0.000 description 1
- 239000012678 infectious agent Substances 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 210000003519 mature b lymphocyte Anatomy 0.000 description 1
- 150000004682 monohydrates Chemical class 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 238000011275 oncology therapy Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 239000000816 peptidomimetic Substances 0.000 description 1
- 125000001151 peptidyl group Chemical group 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 239000002574 poison Substances 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- GCYXWQUSHADNBF-AAEALURTSA-N preproglucagon 78-108 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 GCYXWQUSHADNBF-AAEALURTSA-N 0.000 description 1
- 238000000159 protein binding assay Methods 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241000712461 unidentified influenza virus Species 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2/00—Peptides of undefined number of amino acids; Derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1089—Design, preparation, screening or analysis of libraries using computer algorithms
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/10—Libraries containing peptides or polypeptides, or derivatives thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/141—Discrete Fourier transforms
- G06F17/142—Fast Fourier transforms, e.g. using a Cooley-Tukey type algorithm
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Molecular Biology (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Biochemistry (AREA)
- Medicinal Chemistry (AREA)
- Discrete Mathematics (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
Description
− ステップ1:タンパク質残基を電子−イオン相互作用ポテンシャル(EIIP)パラメータの数値へと変換。
− ステップ2:ゼロパディング/アップサンプリング。信号処理は、全てのタンパク質のウインドウの長さが同じであることを必要とするため、このプロセスは、ゼロパディングを使用して、任意の位置で解析され得るタンパク質の配列中の隙間を埋める。
− ステップ3:スペクトル特性(SC)を生成するための高速フーリエ変換(FFT)を使用した数値配列の処理、スペクトル特性(SC)は、ステップ4中に各点について乗算されてクロススペクトル(CS)特徴を生成する。
− ステップ4:クロススペクトル解析:クロススペクトル(CS)解析は、スペクトル特性(SC)の各点乗算を表す。
− タンパク質のアミノ酸配列をタンパク質データベースによる数値配列に符号化するステップであって、当該数値配列はアミノ酸配列の各アミノ酸の値を含む、ステップと、
− 数値配列に従って、タンパク質スペクトルを計算するステップと、
各適応度について、
− 計算されたタンパク質スペクトルを所定のデータベースのタンパク質スペクトル値と比較するステップであって、データベースがは適応度の異なる値に関するタンパク質スペクトル値を含む、ステップと、
− 比較ステップに従って、適応度の値を予測するステップと
を含む方法に関する。
− 計算されたタンパク質スペクトルは、少なくとも1つの周波数値を含み、計算されたタンパク質スペクトルは、各周波数値についてタンパク質スペクトル値と比較され、
− タンパク質スペクトル計算ステップにおいて、高速フーリエ変換などのフーリエ変換が、符号化ステップによってさらに得られた数値配列に適用され、
− 各タンパク質スペクトルは以下の式:
ここで、jはタンパク質スペクトル|fj|のインデックス番号であり、数値配列はxkと表されるN個の値を含み、0≦k≦N−1且つN≧1であり、iはi2=−1であるような虚数を定義し、
− 符号化ステップにおいて、タンパク質データベースは生化学的又は物理化学的な特性値の少なくとも1つのインデックスを含み、各特性値はそれぞれのアミノ酸について与えられ、
各アミノ酸について、数値配列における値が所与のインデックスにおけるアミノ酸に関する特性値に等しく、
− 符号化ステップにおいて、タンパク質データベースは特性値の幾つかのインデックスを含み、
当該方法は、各インデックスに従って、試料タンパク質に関する測定適応度値と、試料タンパク質について以前に得られた予測適応度値との比較に基づいて、最良のインデックスを選択するステップをさらに含み、
符号化ステップは、選択されたインデックスを使用して行われ、
− 選択ステップにおいて、選択されたインデックスは、最小の二乗平均平方根誤差を有するインデックスであり、
各インデックスの二乗平均平方根誤差は以下の式:
ここで、yiは第iの試料タンパク質の測定適応度であり、
Sは試料タンパク質の数であり、
− 選択ステップにおいて、選択されたインデックスは、1に最も近い決定係数を有するインデックスであり、
各インデックスの決定係数は以下の式:
ここで、yiは第iの試料タンパク質の測定適応度であり、
Sは試料タンパク質の数であり、
− 当該方法は、符号化ステップの後で且つタンパク質スペクトル計算ステップの前に、以下のステップ:
+ 数値配列の各値から数値配列値の平均を引くことにより、符号化ステップによって得られた数値配列を正規化するステップ
をさらに含み、
タンパク質スペクトル計算ステップは、正規化された数値配列に対して行われ、
− 当該方法は、符号化ステップの後で且つタンパク質スペクトル計算ステップの前に、以下のステップ:
+ 数値配列の一端にM個のゼロを加えることにより、符号化ステップによって得られた数値配列をゼロパディングするステップであって、Mは(N−P)に等しく、ここで、Nが所定の整数であり、Pは前記数値配列における値の数である、ステップ
をさらに含み、
タンパク質スペクトル計算ステップは、ゼロパディングステップによってさらに得られた数値配列に対して行われ、
− 比較ステップは、適応度の異なる値に関するタンパク質スペクトル値の所定のデータベース内で、所定の基準に従って、計算されたタンパク質スペクトルに最も近いタンパク質スペクトル値を決定するステップを含み、、適応度の予測値は、データベース内において、決定されたタンパク質スペクトル値に関連付けられる適応度値に等しく、
− タンパク質スペクトル計算ステップにおいて、幾つかの周波数範囲に従ってタンパク質について幾つかのタンパク質スペクトルが計算され、
予測ステップにおいて、比較ステップに従って各タンパク質スペクトルについて適応度の中間値が推定され、当該中間適応度値を使用して適応度の予測値が計算され、
好ましくは、中間適応度値に対する部分的最小二乗回帰などの回帰が用いられ、並びに
− 当該方法は、
− 変異体ライブラリのスクリーニングのために、計算されたタンパク質スペクトルに従ってタンパク質を解析するステップ
を含み、
解析は、好ましくは要因判別解析又は主成分解析を使用して行われる。
− アミノ酸配列をタンパク質データベースによる数値配列に符号化するように構成された符号化モジュールであって、数値配列はアミノ酸配列の各アミノ酸の値を含む、符号化モジュールと、
− 数値配列に従って、タンパク質スペクトルを計算するように構成された計算モジュールと、
− 予測モジュールであって、各適応度について、
+ 計算されたタンパク質スペクトルを所定のデータベースのタンパク質スペクトル値と比較することであって、データベースは適応度の異なる値に関するタンパク質スペクトル値を含む、比較することと、
+ 比較に従って適応度の値を予測することと
を行うように構成された予測モジュールと
を含む、電子予測システムに関する。
ここで、yiは第iの試料タンパク質の測定適応度であり、
Sは試料タンパク質の数である。
ここで、yiは第iの試料タンパク質の測定適応度であり、
Sは試料タンパク質の数であり、
[実施例]
この実施例では、シトクロムP450のアミノ酸配列を、以下のAAindexコードを使用して数値配列に符号化した:D伸長構造の正規化周波数(Maxfield and Scheraga,Biochemistry.1976;15(23):5138−53)。
この実施例では、GLP1のアミノ酸配列を、以下のAAindexコードを使用して数値配列に符号化した:D電子−イオン相互作用ポテンシャル値(Cosic,IEEE Trans Biomed Eng.1994 Dec;41(12):1101−14)。
この実施例では、エポキシドヒドロラーゼのアミノ酸配列を、以下のAAindexコードを使用して数値配列に符号化した:D全タンパク質のAA組成のSD(Nakashima et al.,Proteins.1990;8(2):173−8)。
この実施例では、エンテロトキシンのアミノ酸配列を、以下のAAindexコードを使用して数値配列に符号化した:D pK−C(Fasman,1976)。
この実施例では、TNFのアミノ酸配列を、以下のAAindexコードを使用して数値配列に符号化した:D IFHスケールからの重量(Jacobs and White,Biochemistry.1989;28(8):3421−37)。
この実施例では、シトクロムP450のアミノ酸配列を、以下のAAindexコードを使用して数値配列に符号化した:D伸長構造の正規化周波数(Maxfield and Scheraga,Biochemistry.1976;15(23):5138−53)。
低い値及び高い値の適応度(エナンチオ選択性)を有する10個のタンパク質スペクトルを含むエポキシドヒドロラーゼのサブセット(実施例3と同様)を使用した。PCA(主成分解析)を行った。低い値及び高い値の適応度は、それぞれ小さい楕円形180内及び大きい楕円形190内にあり、したがって、タンパク質スペクトルに適用された多変量解析がタンパク質スクリーニングに役立つことを示している。
この実施例において、ブルトン型チロシンキナーゼ(BTK)は、B細胞の発達及び成熟に関与する重要なタンパク質である。実際、BTKは、成熟したB細胞による抗体産生を誘発し、感染の除去を促進する。また、このタンパク質の機能不全は、X連鎖無ガンマグロブリン血症又はブルトン型無ガンマグロブリン血症(B細胞が成熟しない)などの疾患を引き起こし得る。
また、本発明による方法は、K562細胞株でのmRNA発現レベル値を予測するように適合される(Fonseca NA et al.2014 RNA−Seq Gene Profiling−A Systematic Empirical Comparison.PLoS ONE 9(9):e107026.doi:10.1371/journal.pone.0107026)。RNA配列とタンパク質配列との間に共直線性があることから、モデルを構築するために、各遺伝子に関連付けられるタンパク質配列を使用した。タンパク質は、RNA配列及び長さを反映するアミノ酸組成及び長さによって異なる。以下の表16に、97個のRNAについてデータセット(配列及びタンパク質発現レベル)を提供する。
本発明による方法を、心臓細胞における異なるタンパク質のタンパク質発現レベル値を予測するためにも使用した。タンパク質は、アミノ酸組成及び長さによって異なる。以下の表17に、85個のタンパク質についてデータセット(配列及びタンパク質発現レベル)が提供される。
この実施例ではまた、本発明による方法を、腎臓細胞における異なるタンパク質のタンパク質発現レベル値を予測するために使用した。タンパク質は、アミノ酸組成及び長さによって異なる。以下の表18に、データセット(配列及びタンパク質発現レベル)を提供する。
Claims (12)
- タンパク質の少なくとも1つの適応度値を予測するための方法であって、コンピュータ上で実施され、以下のステップ:
− 前記タンパク質のアミノ酸配列をタンパク質データベース(51)による数値配列に符号化するステップ(100)であって、該数値配列は前記アミノ酸配列の各アミノ酸の値を含む、ステップ(100)と、
− 前記数値配列に従って、タンパク質スペクトルを計算するステップ(110)と、
− 各適応度について、前記計算されたタンパク質スペクトルを、前記適応度の異なる値に関するタンパク質スペクトル値を含む所定のデータベース(55)のタンパク質スペクトル値と比較し、前記比較に従って、前記適応度の値を予測するステップ(130)と
を含み、
前記符号化するステップ(100)において、前記タンパク質データベース(51)は生化学的又は物理化学的な特性値の少なくとも1つのインデックスを含み、各特性値はそれぞれのアミノ酸について与えられ、各アミノ酸について、前記数値配列における値が所与のインデックスにおける前記アミノ酸に関する前記特性値に等しく、
前記計算するステップ(100)において、フーリエ変換が前記符号化するステップによってさらに得られた前記数値配列に適用され、
前記予測するステップ(130)は、前記適応度の異なる値に関するタンパク質スペクトル値の前記所定のデータベース(55)内で、所定の基準に従って、前記計算されたタンパク質スペクトルに最も近い前記タンパク質スペクトル値を決定し、予測する前記適応度の前記値は、前記データベース内において、前記決定されたタンパク質スペクトル値に関連付けられる前記適応度値に等しい、
タンパク質の少なくとも1つの適応度値を予測するための方法。 - 前記計算されたタンパク質スペクトルは、少なくとも1つの周波数値を含み、
前記計算されたタンパク質スペクトルは、各周波数値について前記タンパク質スペクトル値と比較される、請求項1に記載の方法。 - 前記符号化ステップ(100)において、前記タンパク質データベース(51)は特性値の幾つかのインデックスを含み、
前記方法は、
− 各インデックスに従って、試料タンパク質に関する測定適応度値と、前記試料タンパク質について以前に得られた予測適応度値との比較に基づいて、最良のインデックスを選択するステップをさらに含み、
前記符号化ステップ(100)は、前記選択されたインデックスを使用して行われる、請求項1〜3のいずれか一項に記載の方法。 - 前記符号化ステップの後で且つ前記タンパク質スペクトル計算ステップの前に、以下のステップ:
− 前記数値配列の各値から前記数値配列値の平均を引くことにより、前記符号化ステップによって得られた前記数値配列を正規化するステップ
をさらに含み、
前記タンパク質スペクトル計算ステップは、前記正規化された数値配列に対して行われる、請求項1〜6のいずれか一項に記載の方法。 - 前記符号化ステップの後で且つ前記タンパク質スペクトル計算ステップの前に、以下のステップ:
− 前記数値配列の一端にM個のゼロを加えることにより、前記符号化ステップによって得られた前記数値配列をゼロパディングするステップであって、Mは(N−P)に等しく、ここで、Nが所定の整数であり、Pは前記数値配列における値の数である、ステップ
をさらに含み、
前記タンパク質スペクトル計算ステップは、前記ゼロパディングステップによってさらに得られた前記数値配列に対して行われる、請求項1〜7のいずれか一項に記載の方法。 - 前記タンパク質スペクトル計算ステップ(110)において、幾つかの周波数範囲に従って前記タンパク質について幾つかのタンパク質スペクトルが計算され、
前記予測ステップにおいて、前記比較ステップに従って各タンパク質スペクトルについて前記適応度の中間値が推定され、該中間適応度値を使用して前記適応度の前記予測値が計算される、請求項1〜8のいずれか一項に記載の方法。 - − 変異体ライブラリのスクリーニングのために、前記計算されたタンパク質スペクトルに従って前記タンパク質を解析するステップ(140)
を含む、請求項1〜9のいずれか一項に記載の方法。 - コンピュータによって実施されると、請求項1〜10のいずれか一項に記載の方法を実施するソフトウェア命令を含む、コンピュータプログラム。
- タンパク質の少なくとも1つの適応度値を予測するための電子予測システム(20)であって、
− アミノ酸配列をタンパク質データベース(51)による数値配列に符号化するように構成された符号化モジュール(50)であって、該数値配列は前記アミノ酸配列の各アミノ酸の値を含む、符号化モジュール(50)と、
− 前記数値配列に従って、タンパク質スペクトルを計算するように構成された計算モジュール(52)と、
− 予測モジュール(56)であって、各適応度について、
+ 前記計算されたタンパク質スペクトルを所定のデータベースのタンパク質スペクトル値と比較することであって、前記データベースは前記適応度の異なる値に関するタンパク質スペクトル値を含む、比較することと、
+ 前記比較に従って前記適応度の値を予測することと
を行うように構成された予測モジュール(56)と
を含み、
前記符号化モジュール(50)において、前記タンパク質データベース(51)は生化学的又は物理化学的な特性値の少なくとも1つのインデックスを含み、各特性値はそれぞれのアミノ酸について与えられ、各アミノ酸について、前記数値配列における値が所与のインデックスにおける前記アミノ酸に関する前記特性値に等しく、
前記計算モジュール(52)において、フーリエ変換が前記符号化モジュール(50)によってさらに得られた前記数値配列に適用され、
前記予測モジュール(56)は、
前記適応度の異なる値に関するタンパク質スペクトル値の前記所定のデータベース(55)内で、所定の基準に従って、前記計算されたタンパク質スペクトルに最も近い前記タンパク質スペクトル値を決定し、
予測する前記適応度の前記値は、前記データベース内において、前記決定されたタンパク質スペクトル値に関連付けられる前記適応度値に等しい、
電子予測システム(20)。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15305552.0A EP3082056B2 (en) | 2015-04-14 | 2015-04-14 | Method and electronic system for predicting at least one fitness value of a protein, related computer program product |
EP15305552.0 | 2015-04-14 | ||
PCT/EP2016/058287 WO2016166253A1 (en) | 2015-04-14 | 2016-04-14 | Method and electronic system for predicting at least one fitness value of a protein, related computer program product |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018517219A JP2018517219A (ja) | 2018-06-28 |
JP6744909B2 true JP6744909B2 (ja) | 2020-08-19 |
Family
ID=52875643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018505535A Active JP6744909B2 (ja) | 2015-04-14 | 2016-04-14 | タンパク質の少なくとも1つの適応度値を予測するための方法及び電子システム、関連するコンピュータプログラム製品 |
Country Status (12)
Country | Link |
---|---|
US (1) | US11749377B2 (ja) |
EP (1) | EP3082056B2 (ja) |
JP (1) | JP6744909B2 (ja) |
KR (1) | KR20170137106A (ja) |
CN (2) | CN114882947A (ja) |
AU (1) | AU2016247474B2 (ja) |
CA (1) | CA2982608C (ja) |
DK (1) | DK3082056T4 (ja) |
IL (1) | IL254976B (ja) |
MX (1) | MX2017013195A (ja) |
SG (1) | SG11201708457VA (ja) |
WO (1) | WO2016166253A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050084907A1 (en) | 2002-03-01 | 2005-04-21 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
US20210183469A9 (en) * | 2018-03-12 | 2021-06-17 | Massachusetts Institute Of Technology | Computational platform for in silico combinatorial sequence space exploration and artificial evolution of peptides |
EP3598327B1 (en) * | 2018-07-20 | 2021-05-05 | Peaccel | Method and electronic system for predicting at least one fitness value of a protein via an extended numerical sequence, related computer program product |
CN115240763B (zh) * | 2022-07-06 | 2024-06-11 | 上海人工智能创新中心 | 基于无偏课程学习的蛋白质热力学稳定性预测方法 |
EP4446411A1 (en) | 2023-04-14 | 2024-10-16 | Peaccel | Variant subtilisin proteases |
CN117116336B (zh) * | 2023-10-18 | 2024-01-23 | 深圳新锐基因科技有限公司 | 基于内部原子波动改善蛋白结构柔性弱点的方法和装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5538897A (en) * | 1994-03-14 | 1996-07-23 | University Of Washington | Use of mass spectrometry fragmentation patterns of peptides to identify amino acid sequences in databases |
DE10021689A1 (de) * | 2000-05-05 | 2001-12-06 | Biotechnolog Forschung Gmbh | Verfahren zur Untersuchung von Makromolekülen |
US6728642B2 (en) * | 2001-03-29 | 2004-04-27 | E. I. Du Pont De Nemours And Company | Method of non-linear analysis of biological sequence data |
JP2008076406A (ja) * | 2002-04-26 | 2008-04-03 | Ajinomoto Co Inc | タンパク質構造解析方法、タンパク質構造解析装置、プログラム、および、記録媒体 |
US20090055147A1 (en) * | 2004-06-25 | 2009-02-26 | National Inst. Of Adv. Industrial Science And Tech | Cell network analysis system |
CN101124581A (zh) * | 2005-03-03 | 2008-02-13 | 伊利诺斯大学理事会 | 使用新的数据库检索模式鉴别和鉴定蛋白质 |
WO2008065180A1 (en) * | 2006-11-30 | 2008-06-05 | Tibotec Pharmaceuticals Ltd. | Phenotype prediction method |
WO2008129458A1 (en) * | 2007-04-18 | 2008-10-30 | Koninklijke Philips Electronics N.V. | A method for data mining dna frequency based spectra |
WO2011069997A2 (en) * | 2009-12-09 | 2011-06-16 | Iti Scotland Limited | Detecting analytes |
CN103473483A (zh) * | 2013-10-07 | 2013-12-25 | 谢华林 | 一种蛋白质结构与功能的在线预测方法 |
EP3598327B1 (en) * | 2018-07-20 | 2021-05-05 | Peaccel | Method and electronic system for predicting at least one fitness value of a protein via an extended numerical sequence, related computer program product |
-
2015
- 2015-04-14 EP EP15305552.0A patent/EP3082056B2/en active Active
- 2015-04-14 DK DK15305552.0T patent/DK3082056T4/da active
-
2016
- 2016-04-14 MX MX2017013195A patent/MX2017013195A/es unknown
- 2016-04-14 SG SG11201708457VA patent/SG11201708457VA/en unknown
- 2016-04-14 WO PCT/EP2016/058287 patent/WO2016166253A1/en active Application Filing
- 2016-04-14 AU AU2016247474A patent/AU2016247474B2/en active Active
- 2016-04-14 US US15/565,893 patent/US11749377B2/en active Active
- 2016-04-14 CN CN202210595983.2A patent/CN114882947A/zh active Pending
- 2016-04-14 CN CN201680027558.6A patent/CN107924429B/zh active Active
- 2016-04-14 KR KR1020177029593A patent/KR20170137106A/ko active IP Right Grant
- 2016-04-14 JP JP2018505535A patent/JP6744909B2/ja active Active
- 2016-04-14 CA CA2982608A patent/CA2982608C/en active Active
-
2017
- 2017-10-10 IL IL254976A patent/IL254976B/en unknown
Also Published As
Publication number | Publication date |
---|---|
US11749377B2 (en) | 2023-09-05 |
KR20170137106A (ko) | 2017-12-12 |
US20180096099A1 (en) | 2018-04-05 |
IL254976B (en) | 2021-10-31 |
EP3082056B1 (en) | 2019-03-27 |
IL254976A0 (en) | 2017-12-31 |
CA2982608A1 (en) | 2016-10-20 |
SG11201708457VA (en) | 2017-11-29 |
EP3082056A1 (en) | 2016-10-19 |
JP2018517219A (ja) | 2018-06-28 |
MX2017013195A (es) | 2018-05-22 |
EP3082056B2 (en) | 2022-02-09 |
CN107924429B (zh) | 2022-12-09 |
AU2016247474A1 (en) | 2017-11-02 |
CA2982608C (en) | 2023-12-05 |
DK3082056T4 (da) | 2022-05-02 |
CN107924429A (zh) | 2018-04-17 |
BR112017022196A2 (pt) | 2019-04-16 |
AU2016247474B2 (en) | 2020-07-30 |
CN114882947A (zh) | 2022-08-09 |
WO2016166253A1 (en) | 2016-10-20 |
DK3082056T3 (da) | 2019-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6744909B2 (ja) | タンパク質の少なくとも1つの適応度値を予測するための方法及び電子システム、関連するコンピュータプログラム製品 | |
Potocnakova et al. | An introduction to B‐cell epitope mapping and in silico epitope prediction | |
Fowler et al. | High-resolution mapping of protein sequence-function relationships | |
Roche et al. | Remodeling of the folding free energy landscape of staphylococcal nuclease by cavity-creating mutations | |
CN114303201A (zh) | 使用机器学习技术生成蛋白质序列 | |
JP7425056B2 (ja) | 拡張数値配列を介してタンパク質の少なくとも1つの適応度の値を予測するための方法および電子システム、関係するコンピュータプログラム | |
Razavi et al. | Computational screening and selection of cyclic peptide hairpin mimetics by molecular simulation and kinetic network models | |
Wales et al. | Evolution of the potential energy landscape with static pulling force for two model proteins | |
Bertazzo et al. | Machine learning and enhanced sampling simulations for computing the potential of mean force and standard binding free energy | |
Hong Enriquez et al. | Designing short peptides with high affinity for organic molecules: a combined docking, molecular dynamics, and Monte Carlo approach | |
van Adrichem et al. | AIM: a mapping program for infrared spectroscopy of proteins | |
Yang et al. | Deploying synthetic coevolution and machine learning to engineer protein-protein interactions | |
Vilseck et al. | Generalizing the discrete Gibbs sampler-based λ-dynamics approach for multisite sampling of many ligands | |
Varvdekar et al. | Response of Terahertz Protein Vibrations to Ligand Binding: Calmodulin–Peptide Complexes as a Case Study | |
Olaleye et al. | Determination of binding sites on trastuzumab and pertuzumab to selective affimers using hydrogen–deuterium exchange mass spectrometry | |
Hegefeld et al. | Structural dynamics of neuropeptide hPYY | |
Ma et al. | A systematic study of the vibrational free energies of polypeptides in folded and random states | |
Harada et al. | Temperature-shuffled structural dissimilarity sampling based on a root-mean-square deviation | |
Rossetti et al. | Structural predictions of neurobiologically relevant G-protein coupled receptors and intrinsically disordered proteins | |
Hattotuwagama et al. | New horizons in mouse immunoinformatics: reliable in silico prediction of mouse class I histocompatibility major complex peptide binding affinity | |
BR112017022196B1 (pt) | Método e sistema eletrônico para prever pelo menos um valor de ajuste de uma proteína | |
Islam et al. | Pattern identification on protein sequences of neurodegenerative diseases using association rule mining | |
Clark et al. | Machine Learning-Guided Antibody Engineering That Leverages Domain Knowledge To Overcome The Small Data Problem | |
Wang et al. | Decoding Molecular Mechanism Underlying Human Olfactory Receptor OR8D1 Activation by Sotolone Enantiomers | |
Rong‐Kai et al. | Quantitative Sequence–Kinetics Relationship in Antigen–Antiboby Interaction Kinetics Based on a Set of Descriptors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180418 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200331 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200604 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200714 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200731 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6744909 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |