JP2021508885A - タンパク質同定のためのデコーディングアプローチ方法 - Google Patents
タンパク質同定のためのデコーディングアプローチ方法 Download PDFInfo
- Publication number
- JP2021508885A JP2021508885A JP2020536280A JP2020536280A JP2021508885A JP 2021508885 A JP2021508885 A JP 2021508885A JP 2020536280 A JP2020536280 A JP 2020536280A JP 2020536280 A JP2020536280 A JP 2020536280A JP 2021508885 A JP2021508885 A JP 2021508885A
- Authority
- JP
- Japan
- Prior art keywords
- protein
- proteins
- binding
- sample
- affinity reagent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 1008
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 1004
- 238000013459 approach Methods 0.000 title description 82
- 238000005259 measurement Methods 0.000 claims abstract description 261
- 238000000034 method Methods 0.000 claims abstract description 123
- 101710100170 Unknown protein Proteins 0.000 claims abstract description 61
- 239000003153 chemical reaction reagent Substances 0.000 claims description 486
- 239000000523 sample Substances 0.000 claims description 366
- 230000027455 binding Effects 0.000 claims description 320
- 238000009739 binding Methods 0.000 claims description 320
- 150000001413 amino acids Chemical class 0.000 claims description 148
- 239000000203 mixture Substances 0.000 claims description 80
- 230000035945 sensitivity Effects 0.000 claims description 49
- 239000002773 nucleotide Substances 0.000 claims description 37
- 125000003729 nucleotide group Chemical group 0.000 claims description 37
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 26
- 230000009871 nonspecific binding Effects 0.000 claims description 19
- 201000010099 disease Diseases 0.000 claims description 17
- 230000035772 mutation Effects 0.000 claims description 12
- 239000012472 biological sample Substances 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 238000011002 quantification Methods 0.000 abstract description 6
- 235000018102 proteins Nutrition 0.000 description 952
- 235000001014 amino acid Nutrition 0.000 description 134
- 239000013638 trimer Substances 0.000 description 108
- 239000000758 substrate Substances 0.000 description 69
- 238000001514 detection method Methods 0.000 description 55
- 238000002474 experimental method Methods 0.000 description 54
- 108010026552 Proteome Proteins 0.000 description 45
- 239000012634 fragment Substances 0.000 description 39
- 108020004414 DNA Proteins 0.000 description 32
- 102000053602 DNA Human genes 0.000 description 32
- 101150046192 sav gene Proteins 0.000 description 30
- 238000006243 chemical reaction Methods 0.000 description 28
- 241000282414 Homo sapiens Species 0.000 description 25
- 238000004458 analytical method Methods 0.000 description 25
- 238000004422 calculation algorithm Methods 0.000 description 22
- 230000004481 post-translational protein modification Effects 0.000 description 22
- 108010029485 Protein Isoforms Proteins 0.000 description 20
- 102000001708 Protein Isoforms Human genes 0.000 description 20
- 210000004027 cell Anatomy 0.000 description 20
- 108090000765 processed proteins & peptides Proteins 0.000 description 20
- 230000015654 memory Effects 0.000 description 19
- 238000003860 storage Methods 0.000 description 18
- 229960000106 biosimilars Drugs 0.000 description 17
- 230000004048 modification Effects 0.000 description 16
- 238000012986 modification Methods 0.000 description 16
- 241000894007 species Species 0.000 description 16
- 108090000144 Human Proteins Proteins 0.000 description 15
- 102000003839 Human Proteins Human genes 0.000 description 14
- 102000039446 nucleic acids Human genes 0.000 description 14
- 108020004707 nucleic acids Proteins 0.000 description 14
- 230000008685 targeting Effects 0.000 description 13
- 241000193690 San Angelo virus Species 0.000 description 12
- 150000007523 nucleic acids Chemical class 0.000 description 12
- 125000000524 functional group Chemical group 0.000 description 11
- 239000002609 medium Substances 0.000 description 11
- 150000004676 glycans Chemical class 0.000 description 10
- 108020004635 Complementary DNA Proteins 0.000 description 9
- 239000008280 blood Substances 0.000 description 9
- 210000004369 blood Anatomy 0.000 description 9
- 238000010804 cDNA synthesis Methods 0.000 description 9
- 239000002299 complementary DNA Substances 0.000 description 9
- 208000035475 disorder Diseases 0.000 description 9
- 239000010410 layer Substances 0.000 description 9
- -1 polypropylene Polymers 0.000 description 9
- 108091023037 Aptamer Proteins 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- 230000026731 phosphorylation Effects 0.000 description 8
- 238000006366 phosphorylation reaction Methods 0.000 description 8
- 230000009870 specific binding Effects 0.000 description 8
- 239000004971 Cross linker Substances 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 102000004196 processed proteins & peptides Human genes 0.000 description 7
- 210000001519 tissue Anatomy 0.000 description 7
- 229910052721 tungsten Inorganic materials 0.000 description 7
- 108010021466 Mutant Proteins Proteins 0.000 description 6
- 102000008300 Mutant Proteins Human genes 0.000 description 6
- 206010028980 Neoplasm Diseases 0.000 description 6
- 208000027418 Wounds and injury Diseases 0.000 description 6
- 201000011510 cancer Diseases 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 6
- 239000005090 green fluorescent protein Substances 0.000 description 6
- 238000010606 normalization Methods 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 235000000346 sugar Nutrition 0.000 description 6
- 238000002198 surface plasmon resonance spectroscopy Methods 0.000 description 6
- 208000035473 Communicable disease Diseases 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 5
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 239000011230 binding agent Substances 0.000 description 5
- 210000000038 chest Anatomy 0.000 description 5
- 229920001184 polypeptide Polymers 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000012883 sequential measurement Methods 0.000 description 5
- IKYJCHYORFJFRR-UHFFFAOYSA-N Alexa Fluor 350 Chemical compound O=C1OC=2C=C(N)C(S(O)(=O)=O)=CC=2C(C)=C1CC(=O)ON1C(=O)CCC1=O IKYJCHYORFJFRR-UHFFFAOYSA-N 0.000 description 4
- JLDSMZIBHYTPPR-UHFFFAOYSA-N Alexa Fluor 405 Chemical compound CC[NH+](CC)CC.CC[NH+](CC)CC.CC[NH+](CC)CC.C12=C3C=4C=CC2=C(S([O-])(=O)=O)C=C(S([O-])(=O)=O)C1=CC=C3C(S(=O)(=O)[O-])=CC=4OCC(=O)N(CC1)CCC1C(=O)ON1C(=O)CCC1=O JLDSMZIBHYTPPR-UHFFFAOYSA-N 0.000 description 4
- WHVNXSBKJGAXKU-UHFFFAOYSA-N Alexa Fluor 532 Chemical compound [H+].[H+].CC1(C)C(C)NC(C(=C2OC3=C(C=4C(C(C(C)N=4)(C)C)=CC3=3)S([O-])(=O)=O)S([O-])(=O)=O)=C1C=C2C=3C(C=C1)=CC=C1C(=O)ON1C(=O)CCC1=O WHVNXSBKJGAXKU-UHFFFAOYSA-N 0.000 description 4
- ZAINTDRBUHCDPZ-UHFFFAOYSA-M Alexa Fluor 546 Chemical compound [H+].[Na+].CC1CC(C)(C)NC(C(=C2OC3=C(C4=NC(C)(C)CC(C)C4=CC3=3)S([O-])(=O)=O)S([O-])(=O)=O)=C1C=C2C=3C(C(=C(Cl)C=1Cl)C(O)=O)=C(Cl)C=1SCC(=O)NCCCCCC(=O)ON1C(=O)CCC1=O ZAINTDRBUHCDPZ-UHFFFAOYSA-M 0.000 description 4
- IGAZHQIYONOHQN-UHFFFAOYSA-N Alexa Fluor 555 Chemical compound C=12C=CC(=N)C(S(O)(=O)=O)=C2OC2=C(S(O)(=O)=O)C(N)=CC=C2C=1C1=CC=C(C(O)=O)C=C1C(O)=O IGAZHQIYONOHQN-UHFFFAOYSA-N 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 4
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 4
- 208000028782 Hereditary disease Diseases 0.000 description 4
- 241000282412 Homo Species 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 241000699666 Mus <mouse, genus> Species 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 4
- 102000035195 Peptidases Human genes 0.000 description 4
- 239000004365 Protease Substances 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 4
- 206010052428 Wound Diseases 0.000 description 4
- 238000003491 array Methods 0.000 description 4
- 230000021615 conjugation Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 4
- 238000005859 coupling reaction Methods 0.000 description 4
- 239000003431 cross linking reagent Substances 0.000 description 4
- 239000010432 diamond Substances 0.000 description 4
- 150000002016 disaccharides Chemical class 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000013467 fragmentation Methods 0.000 description 4
- 238000006062 fragmentation reaction Methods 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 208000026278 immune system disease Diseases 0.000 description 4
- 238000001459 lithography Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 239000002207 metabolite Substances 0.000 description 4
- 201000006417 multiple sclerosis Diseases 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 3
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 3
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 3
- NQTADLQHYWFPDB-UHFFFAOYSA-N N-Hydroxysuccinimide Chemical group ON1C(=O)CCC1=O NQTADLQHYWFPDB-UHFFFAOYSA-N 0.000 description 3
- 102100034574 P protein Human genes 0.000 description 3
- 101710181008 P protein Proteins 0.000 description 3
- 101710177166 Phosphoprotein Proteins 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 210000004900 c-terminal fragment Anatomy 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 239000013578 denaturing buffer Substances 0.000 description 3
- 238000010494 dissociation reaction Methods 0.000 description 3
- 230000005593 dissociations Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 239000000975 dye Substances 0.000 description 3
- 238000000835 electrochemical detection Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 229910052731 fluorine Inorganic materials 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 210000004898 n-terminal fragment Anatomy 0.000 description 3
- 239000011807 nanoball Substances 0.000 description 3
- 239000002061 nanopillar Substances 0.000 description 3
- 239000002070 nanowire Substances 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 102000054765 polymorphisms of proteins Human genes 0.000 description 3
- 229920002477 rna polymer Polymers 0.000 description 3
- 229910052710 silicon Inorganic materials 0.000 description 3
- 239000010703 silicon Substances 0.000 description 3
- 238000001542 size-exclusion chromatography Methods 0.000 description 3
- 150000008163 sugars Chemical class 0.000 description 3
- 125000003396 thiol group Chemical group [H]S* 0.000 description 3
- 229910052720 vanadium Inorganic materials 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 3
- 229910052727 yttrium Inorganic materials 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- VGIRNWJSIRVFRT-UHFFFAOYSA-N 2',7'-difluorofluorescein Chemical compound OC(=O)C1=CC=CC=C1C1=C2C=C(F)C(=O)C=C2OC2=CC(O)=C(F)C=C21 VGIRNWJSIRVFRT-UHFFFAOYSA-N 0.000 description 2
- GOLORTLGFDVFDW-UHFFFAOYSA-N 3-(1h-benzimidazol-2-yl)-7-(diethylamino)chromen-2-one Chemical compound C1=CC=C2NC(C3=CC4=CC=C(C=C4OC3=O)N(CC)CC)=NC2=C1 GOLORTLGFDVFDW-UHFFFAOYSA-N 0.000 description 2
- 239000012103 Alexa Fluor 488 Substances 0.000 description 2
- 239000012109 Alexa Fluor 568 Substances 0.000 description 2
- 239000012114 Alexa Fluor 647 Substances 0.000 description 2
- 239000012116 Alexa Fluor 680 Substances 0.000 description 2
- 239000012118 Alexa Fluor 750 Substances 0.000 description 2
- 206010003210 Arteriosclerosis Diseases 0.000 description 2
- 208000008035 Back Pain Diseases 0.000 description 2
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 description 2
- 206010005003 Bladder cancer Diseases 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 208000003174 Brain Neoplasms Diseases 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 206010007559 Cardiac failure congestive Diseases 0.000 description 2
- 206010008342 Cervix carcinoma Diseases 0.000 description 2
- 208000010693 Charcot-Marie-Tooth Disease Diseases 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 208000006545 Chronic Obstructive Pulmonary Disease Diseases 0.000 description 2
- 208000034656 Contusions Diseases 0.000 description 2
- 201000003883 Cystic fibrosis Diseases 0.000 description 2
- 201000010374 Down Syndrome Diseases 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 2
- 206010016654 Fibrosis Diseases 0.000 description 2
- 206010017076 Fracture Diseases 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 2
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 2
- 206010019280 Heart failures Diseases 0.000 description 2
- 208000023105 Huntington disease Diseases 0.000 description 2
- 206010020772 Hypertension Diseases 0.000 description 2
- 206010021113 Hypothermia Diseases 0.000 description 2
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 2
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- 208000008839 Kidney Neoplasms Diseases 0.000 description 2
- 208000034693 Laceration Diseases 0.000 description 2
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 2
- 208000024556 Mendelian disease Diseases 0.000 description 2
- 108090000143 Mouse Proteins Proteins 0.000 description 2
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 2
- 208000008589 Obesity Diseases 0.000 description 2
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 2
- 206010033128 Ovarian cancer Diseases 0.000 description 2
- 206010061535 Ovarian neoplasm Diseases 0.000 description 2
- 208000002193 Pain Diseases 0.000 description 2
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 2
- 206010034764 Peutz-Jeghers syndrome Diseases 0.000 description 2
- 108010004729 Phycoerythrin Proteins 0.000 description 2
- 206010060862 Prostate cancer Diseases 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 208000035977 Rare disease Diseases 0.000 description 2
- 208000015634 Rectal Neoplasms Diseases 0.000 description 2
- 206010038389 Renal cancer Diseases 0.000 description 2
- 208000027790 Rib fracture Diseases 0.000 description 2
- 208000000453 Skin Neoplasms Diseases 0.000 description 2
- 208000006011 Stroke Diseases 0.000 description 2
- 208000022292 Tay-Sachs disease Diseases 0.000 description 2
- 208000024770 Thyroid neoplasm Diseases 0.000 description 2
- 208000030886 Traumatic Brain injury Diseases 0.000 description 2
- 206010044565 Tremor Diseases 0.000 description 2
- 206010044688 Trisomy 21 Diseases 0.000 description 2
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 2
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 2
- 208000002495 Uterine Neoplasms Diseases 0.000 description 2
- NIXOWILDQLNWCW-UHFFFAOYSA-M acrylate group Chemical group C(C=C)(=O)[O-] NIXOWILDQLNWCW-UHFFFAOYSA-M 0.000 description 2
- 150000001412 amines Chemical class 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 208000011775 arteriosclerosis disease Diseases 0.000 description 2
- 238000004630 atomic force microscopy Methods 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 239000010839 body fluid Substances 0.000 description 2
- 239000005388 borosilicate glass Substances 0.000 description 2
- 208000029028 brain injury Diseases 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 238000002619 cancer immunotherapy Methods 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 201000010881 cervical cancer Diseases 0.000 description 2
- 230000007882 cirrhosis Effects 0.000 description 2
- 208000019425 cirrhosis of liver Diseases 0.000 description 2
- 210000001072 colon Anatomy 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000009519 contusion Effects 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 206010012601 diabetes mellitus Diseases 0.000 description 2
- 238000000132 electrospray ionisation Methods 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 201000004101 esophageal cancer Diseases 0.000 description 2
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 2
- 238000001917 fluorescence detection Methods 0.000 description 2
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 2
- 108091006047 fluorescent proteins Proteins 0.000 description 2
- 102000034287 fluorescent proteins Human genes 0.000 description 2
- 235000013882 gravy Nutrition 0.000 description 2
- 208000019622 heart disease Diseases 0.000 description 2
- FUZZWVXGSFPDMH-UHFFFAOYSA-N hexanoic acid Chemical compound CCCCCC(O)=O FUZZWVXGSFPDMH-UHFFFAOYSA-N 0.000 description 2
- 230000002631 hypothermal effect Effects 0.000 description 2
- 238000003018 immunoassay Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000000126 in silico method Methods 0.000 description 2
- 208000014674 injury Diseases 0.000 description 2
- 201000010982 kidney cancer Diseases 0.000 description 2
- 208000032839 leukemia Diseases 0.000 description 2
- 210000003041 ligament Anatomy 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 201000007270 liver cancer Diseases 0.000 description 2
- 208000014018 liver neoplasm Diseases 0.000 description 2
- 201000005202 lung cancer Diseases 0.000 description 2
- 208000020816 lung neoplasm Diseases 0.000 description 2
- 150000002678 macrocyclic compounds Chemical class 0.000 description 2
- 239000002122 magnetic nanoparticle Substances 0.000 description 2
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 201000001441 melanoma Diseases 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 150000002739 metals Chemical class 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000008450 motivation Effects 0.000 description 2
- 208000037891 myocardial injury Diseases 0.000 description 2
- 239000002086 nanomaterial Substances 0.000 description 2
- 239000002105 nanoparticle Substances 0.000 description 2
- 201000008383 nephritis Diseases 0.000 description 2
- 208000004296 neuralgia Diseases 0.000 description 2
- 208000015122 neurodegenerative disease Diseases 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 235000020824 obesity Nutrition 0.000 description 2
- VYNDHICBIRRPFP-UHFFFAOYSA-N pacific blue Chemical compound FC1=C(O)C(F)=C2OC(=O)C(C(=O)O)=CC2=C1 VYNDHICBIRRPFP-UHFFFAOYSA-N 0.000 description 2
- 230000036407 pain Effects 0.000 description 2
- 201000002528 pancreatic cancer Diseases 0.000 description 2
- 208000008443 pancreatic carcinoma Diseases 0.000 description 2
- 244000045947 parasite Species 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 210000002381 plasma Anatomy 0.000 description 2
- 239000004033 plastic Substances 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- 238000003498 protein array Methods 0.000 description 2
- 238000002331 protein detection Methods 0.000 description 2
- 230000012846 protein folding Effects 0.000 description 2
- 206010038038 rectal cancer Diseases 0.000 description 2
- 201000001275 rectum cancer Diseases 0.000 description 2
- 108010054624 red fluorescent protein Proteins 0.000 description 2
- 206010039073 rheumatoid arthritis Diseases 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000000263 scanning probe lithography Methods 0.000 description 2
- 210000003497 sciatic nerve Anatomy 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 201000000849 skin cancer Diseases 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 208000020431 spinal cord injury Diseases 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 210000002435 tendon Anatomy 0.000 description 2
- JGVWCANSWKRBCS-UHFFFAOYSA-N tetramethylrhodamine thiocyanate Chemical compound [Cl-].C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=C(SC#N)C=C1C(O)=O JGVWCANSWKRBCS-UHFFFAOYSA-N 0.000 description 2
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 2
- 201000002510 thyroid cancer Diseases 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000009529 traumatic brain injury Effects 0.000 description 2
- 201000005112 urinary bladder cancer Diseases 0.000 description 2
- 206010046766 uterine cancer Diseases 0.000 description 2
- FUOJEDZPVVDXHI-UHFFFAOYSA-N (2,5-dioxopyrrolidin-1-yl) 5-azido-2-nitrobenzoate Chemical compound [O-][N+](=O)C1=CC=C(N=[N+]=[N-])C=C1C(=O)ON1C(=O)CCC1=O FUOJEDZPVVDXHI-UHFFFAOYSA-N 0.000 description 1
- CRDAMVZIKSXKFV-FBXUGWQNSA-N (2-cis,6-cis)-farnesol Chemical compound CC(C)=CCC\C(C)=C/CC\C(C)=C/CO CRDAMVZIKSXKFV-FBXUGWQNSA-N 0.000 description 1
- 239000000260 (2E,6E)-3,7,11-trimethyldodeca-2,6,10-trien-1-ol Substances 0.000 description 1
- WYTZZXDRDKSJID-UHFFFAOYSA-N (3-aminopropyl)triethoxysilane Chemical compound CCO[Si](OCC)(OCC)CCCN WYTZZXDRDKSJID-UHFFFAOYSA-N 0.000 description 1
- OJISWRZIEWCUBN-QIRCYJPOSA-N (E,E,E)-geranylgeraniol Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CC\C(C)=C\CO OJISWRZIEWCUBN-QIRCYJPOSA-N 0.000 description 1
- BLSAPDZWVFWUTL-UHFFFAOYSA-N 2,5-dioxopyrrolidine-3-sulfonic acid Chemical compound OS(=O)(=O)C1CC(=O)NC1=O BLSAPDZWVFWUTL-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- SJECZPVISLOESU-UHFFFAOYSA-N 3-trimethoxysilylpropan-1-amine Chemical compound CO[Si](OC)(OC)CCCN SJECZPVISLOESU-UHFFFAOYSA-N 0.000 description 1
- SWDDLRSGGCWDPH-UHFFFAOYSA-N 4-triethoxysilylbutan-1-amine Chemical compound CCO[Si](OCC)(OCC)CCCCN SWDDLRSGGCWDPH-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 208000000044 Amnesia Diseases 0.000 description 1
- 208000031091 Amnestic disease Diseases 0.000 description 1
- 102000035101 Aspartic proteases Human genes 0.000 description 1
- 108091005502 Aspartic proteases Proteins 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 102000004726 Connectin Human genes 0.000 description 1
- 108010002947 Connectin Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 102000005927 Cysteine Proteases Human genes 0.000 description 1
- 108010005843 Cysteine Proteases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 239000004593 Epoxy Chemical group 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 206010019909 Hernia Diseases 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- KOGVDCPMCJJZTB-UHFFFAOYSA-N INNI Chemical compound INNI KOGVDCPMCJJZTB-UHFFFAOYSA-N 0.000 description 1
- 238000004566 IR spectroscopy Methods 0.000 description 1
- 208000003618 Intervertebral Disc Displacement Diseases 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- 108091036060 Linker DNA Proteins 0.000 description 1
- 102000006830 Luminescent Proteins Human genes 0.000 description 1
- 108010047357 Luminescent Proteins Proteins 0.000 description 1
- 102000004317 Lyases Human genes 0.000 description 1
- 108090000856 Lyases Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 102000005741 Metalloproteases Human genes 0.000 description 1
- 108010006035 Metalloproteases Proteins 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 206010028813 Nausea Diseases 0.000 description 1
- 206010029174 Nerve compression Diseases 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- BPQQTUXANYXVAA-UHFFFAOYSA-N Orthosilicate Chemical compound [O-][Si]([O-])([O-])[O-] BPQQTUXANYXVAA-UHFFFAOYSA-N 0.000 description 1
- 229940122907 Phosphatase inhibitor Drugs 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 102000009097 Phosphorylases Human genes 0.000 description 1
- 108010073135 Phosphorylases Proteins 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 239000012083 RIPA buffer Substances 0.000 description 1
- 206010037779 Radiculopathy Diseases 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 108010022999 Serine Proteases Proteins 0.000 description 1
- 102000012479 Serine Proteases Human genes 0.000 description 1
- BLRPTPMANUNPDV-UHFFFAOYSA-N Silane Chemical compound [SiH4] BLRPTPMANUNPDV-UHFFFAOYSA-N 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 102000035100 Threonine proteases Human genes 0.000 description 1
- 108091005501 Threonine proteases Proteins 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 102000006668 UniProt protein families Human genes 0.000 description 1
- 108020004729 UniProt protein families Proteins 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 125000003368 amide group Chemical group 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 230000006986 amnesia Effects 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000000919 ceramic Substances 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000003931 cognitive performance Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000013365 dairy product Nutrition 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000003795 desorption Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 239000004205 dimethyl polysiloxane Substances 0.000 description 1
- 235000013870 dimethyl polysiloxane Nutrition 0.000 description 1
- 238000000979 dip-pen nanolithography Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000000609 electron-beam lithography Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006355 external stress Effects 0.000 description 1
- 210000003722 extracellular fluid Anatomy 0.000 description 1
- 229940043259 farnesol Drugs 0.000 description 1
- 229930002886 farnesol Natural products 0.000 description 1
- 230000006126 farnesylation Effects 0.000 description 1
- 206010016256 fatigue Diseases 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 238000007306 functionalization reaction Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- XWRJRXQNOHXIOX-UHFFFAOYSA-N geranylgeraniol Natural products CC(C)=CCCC(C)=CCOCC=C(C)CCC=C(C)C XWRJRXQNOHXIOX-UHFFFAOYSA-N 0.000 description 1
- OJISWRZIEWCUBN-UHFFFAOYSA-N geranylnerol Natural products CC(C)=CCCC(C)=CCCC(C)=CCCC(C)=CCO OJISWRZIEWCUBN-UHFFFAOYSA-N 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 230000006095 glypiation Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000005802 health problem Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 238000004191 hydrophobic interaction chromatography Methods 0.000 description 1
- 238000002169 hydrotherapy Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- MTNDZQHUAFNZQY-UHFFFAOYSA-N imidazoline Chemical compound C1CN=CN1 MTNDZQHUAFNZQY-UHFFFAOYSA-N 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 238000000752 ionisation method Methods 0.000 description 1
- 230000006122 isoprenylation Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 229920000126 latex Polymers 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 230000006144 lipoylation Effects 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- VZCYOOQTPOCHFL-UPHRSURJSA-N maleic acid Chemical compound OC(=O)\C=C/C(O)=O VZCYOOQTPOCHFL-UPHRSURJSA-N 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 238000000816 matrix-assisted laser desorption--ionisation Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000006011 modification reaction Methods 0.000 description 1
- 238000005232 molecular self-assembly Methods 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 238000001127 nanoimprint lithography Methods 0.000 description 1
- 238000005329 nanolithography Methods 0.000 description 1
- 238000000054 nanosphere lithography Methods 0.000 description 1
- 230000008693 nausea Effects 0.000 description 1
- CXQXSVUQTKDNFP-UHFFFAOYSA-N octamethyltrisiloxane Chemical compound C[Si](C)(C)O[Si](C)(C)O[Si](C)(C)C CXQXSVUQTKDNFP-UHFFFAOYSA-N 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 239000007800 oxidant agent Substances 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 230000026792 palmitoylation Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000013618 particulate matter Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 238000000206 photolithography Methods 0.000 description 1
- 239000006089 photosensitive glass Substances 0.000 description 1
- 238000004987 plasma desorption mass spectroscopy Methods 0.000 description 1
- 201000003144 pneumothorax Diseases 0.000 description 1
- 229920000435 poly(dimethylsiloxane) Polymers 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 230000013823 prenylation Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 229910000077 silane Inorganic materials 0.000 description 1
- 238000002444 silanisation Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 239000010454 slate Substances 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 238000005309 stochastic process Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 229940124530 sulfonamide Drugs 0.000 description 1
- 150000003456 sulfonamides Chemical class 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 210000003448 thoracic nerve Anatomy 0.000 description 1
- CRDAMVZIKSXKFV-UHFFFAOYSA-N trans-Farnesol Natural products CC(C)=CCCC(C)=CCCC(C)=CCO CRDAMVZIKSXKFV-UHFFFAOYSA-N 0.000 description 1
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 238000013413 tumor xenograft mouse model Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 208000016261 weight loss Diseases 0.000 description 1
- 230000004580 weight loss Effects 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
- G16B5/20—Probabilistic models
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/26—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/60—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrostatic variables, e.g. electrographic flaw testing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/72—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating magnetic variables
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Molecular Biology (AREA)
- Public Health (AREA)
- Signal Processing (AREA)
- Epidemiology (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioethics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Probability & Statistics with Applications (AREA)
- Physiology (AREA)
- Genetics & Genomics (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Peptides Or Proteins (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
本出願は、2017年12月29日出願の米国特許仮出願62/611,979号、および2018年10月20日出願の国際出願PCT/US2018/056807号の恩典を主張するものであり、そのそれぞれは、全体が参照により本明細書に組み入れられる。
タンパク質同定のための現行の技術は、典型的には、高度に特異的でかつ感度の高い親和性試薬(抗体など)の結合およびそれに続く情報の読み出し、または質量分析計からのペプチド読み取りデータ(典型的には12〜30アミノ酸長ほど)のいずれかに依存する。そのような技術は、高度に特異的でかつ感度の高い親和性試薬の、関心対象のタンパク質に対する結合測定の分析に基づいて、候補タンパク質の存在、非存在、または量を決定するために、試料中の未知のタンパク質に適用され得る。
本明細書において、未知のタンパク質の試料中のタンパク質の、改善された同定および定量の必要性が認識される。本明細書において提供される方法およびシステムは、試料中のタンパク質を同定する際の誤りを有意に減少または排除することができ、そしてそれにより、前記タンパク質の定量を改善する。そのような方法およびシステムは、未知のタンパク質の試料中の候補タンパク質の、正確でかつ効率の良い同定を達成し得る。そのような同定は、1つまたは複数の候補タンパク質に選択的に結合するように設定されている親和性試薬プローブの結合測定、タンパク質の長さ、タンパク質の疎水性、および等電点などの情報を用いる算定に、基づき得る。いくつかの態様において、未知のタンパク質の試料は、個々の親和性試薬プローブに、プールされた親和性試薬プローブに、または個々の親和性試薬プローブとプールされた親和性試薬プローブとの組み合わせに、曝露されてよい。同定は、1つまたは複数の候補タンパク質のそれぞれが試料中に存在する信頼水準の推測を含み得る。
本明細書において言及されるすべての刊行物、特許、および特許出願は、個々の刊行物、特許、または特許出願がそれぞれ、参照により組み入れられるように具体的にかつ個々に示された場合と同程度に、参照により本明細書に組み入れられる。本明細書において含まれる本開示と相反する、参照により組み入れられる刊行物および特許または特許出願の範囲については、本明細書が、そのような相反する事柄のどれよりも優先され、および/または上位に立つことが、意図される。
本発明のさまざまな態様が本明細書において示されかつ記載されているが、そのような態様が単なる例として提供されていることは、当業者には明らかである。無数の変更、改変、および置き換えが、本発明から逸脱することなく、当業者に想起され得る。本明細書において記載される本発明の態様のさまざまな代替物が採用され得ることが、理解されるべきである。
タンパク質は、生きている生物の細胞および組織の、重要な構成要素である。一定の生物は、典型的にはプロテオームと称される、種々のタンパク質の大きなセットを産生する。プロテオームは、時間とともに変化し得、かつ細胞または生物が経験するさまざまなステージ(たとえば細胞サイクルのステージもしくは疾患の状態)の機能としても変化し得る。プロテオームの大規模研究または測定(たとえば実験による分析)は、プロテオミクスと称され得る。プロテオミクスにおいては、タンパク質を同定するための複数の方法が存在しており、該方法はイムノアッセイ(たとえば酵素結合免疫吸着アッセイ(ELISA)およびウェスタンブロット)、質量分光に基づく方法(たとえばマトリックス支援レーザー脱離イオン化法(MALDI)およびエレクトロスプレーイオン化法(ESI))、混成の方法(たとえば質量分析イムノアッセイ(MSIA))、ならびにタンパク質マイクロアレイを含む。たとえば、単一分子プロテオミクスの手法が、アミノ酸の直接的な機能化から親和性試薬の使用までにわたる多様なアプローチによって、試料中のタンパク質分子のアイデンティティを推定するために、試みられてよい。そのようなアプローチから集められた情報または測定は、典型的には、試料中に存在するタンパク質を同定するために、適したアルゴリズムによって分析される。
P(測定アウトカム | タンパク質)
P(非測定アウトカム | タンパク質) = 1 - P(測定アウトカム | タンパク質)
P(アウトカムセット | タンパク質) = P(測定アウトカム1 | タンパク質) * P(測定アウトカム2 | タンパク質) * … * P(測定アウトカムN | タンパク質)
本明細書において記載される方法は、試料中のタンパク質を分析および/または同定するために、親和性結合試薬(たとえばアプタマーもしくは抗体)の結合測定と組み合わせて、使用され得る。この場合、算定されるべき測定アウトカムの確率は、タンパク質候補への親和性結合試薬(たとえば親和性試薬もしくは親和性プローブ)の結合イベントまたは非結合イベントの確率である。結合確率は、親和性結合試薬によって認識される、タンパク質の配列中に存在するエピトープの存在に合わせて調節されて、モデル化されてよい。たとえば、エピトープは、「三量体」(3アミノ酸の連続物)であってよい。親和性試薬は、特定のエピトープ(たとえばGAV)を標的とするように設計されてよい。親和性試薬のオフターゲット結合(たとえば、親和性試薬の、その標的エピトープとは異なるエピトープへの結合)は、追加のエピトープへの結合の、ゼロではない確率を含めることによって、モデル化され得る。
P(親和性プローブの結合 | タンパク質) = {GAV、CLD、TYL、またはIADがタンパク質配列中に存在する場合は0.25; そうでない場合は0}
P(親和性プローブの結合 | タンパク質) = {GAV、CLD、TYL、またはIADがタンパク質配列中に存在する場合は0.25; そうでない場合は0.00001}
ここで、確率は、抗体結合の検出のアウトカムを測定する。
P(親和性プローブの結合 | タンパク質) = 1 - [ P(非特異的結合無し) * P(特異的結合無し)]
n = タンパク質候補の配列の長さ;
q = 認識部位の長さ(たとえば3);
s = 三量体への非特異的結合の確率(たとえば10-5);
p = 特異的結合の確率(たとえば0.25);
P(非特異的結合無し)との語、およびP(特異的結合無し)との語は、以下のように表現され得る:
P(非特異的結合無し) = (1 - s)n - q + 1 = (1 - 10-5)n - 3 + 1
および
P(特異的結合無し) = Π各認識部位について(1-p)タンパク質において出現する部位の数
P(親和性プローブの非結合 | タンパク質) = 1 - P(親和性プローブの結合 | タンパク質)
本明細書において記載される方法は、切断されている、試料中のタンパク質を、分析および/または同定するために、適用され得る。そのような実験においては、親和性プローブがタンパク質に結合する確率の算定は、全長のタンパク質配列ではなく、切断されているタンパク質配列への結合のみを検討するように、改変される。たとえば、図4は、100個のプローブ(左)、200個のプローブ(中央)、または300個のプローブ(右)を用いる実験によるタンパク質同定の感度を示すプロットを示す。各プロットにおいて、親和性試薬プローブの感度(たとえば、1%未満の偽検出率(FDR)で同定される基材のパーセント)が、以下の4種類の長さの基材が測定される実験に関して、決定される:(1) インタクトな(全長の)タンパク質、(2) 長さ50の、タンパク質のN末端断片またはC末端断片、(3) 長さ100の、タンパク質のN末端断片またはC末端断片、および(4) 長さ200の、タンパク質のN末端断片またはC末端断片。N末端断片およびC末端断片は、それぞれ無地の棒および縞模様の棒で表される。各プローブは、1つの標的三量体、および4つの他の無作為なオフターゲット三量体に結合する。図4に示されるように、たとえば、わずか100アミノ酸を含む断片へとタンパク質が切断されており、かつプローブ200個の実験が実施される場合でさえも、タンパク質のかなりの割合(約40%)が同定され得る。
本明細書において記載される方法は、試料中のタンパク質断片であって、該断片が由来するインタクトなタンパク質の、元の2つの末端のいずれも含まないタンパク質断片を分析および/または同定するために、適用され得る。そのような実験における、親和性プローブがタンパク質に結合する確率の算定は、全長のタンパク質配列ではなく、切断されているものへの結合のみを検討するように、改変される。図5は、さまざまなタンパク質断片化アプローチを用いる実験によるタンパク質同定の感度を示すプロットを示す。上の列および下の列のそれぞれにおいて、タンパク質同定の性能が、50個、100個、200個、および300個の親和性試薬測定(4つのパネルにおいて左から右へ)により、50、100、200、300、400、および500の、断片の最大長の値(それぞれ六角形、下向きの三角形、上向きの三角形、ひし形、四角形、および丸によって表される)において示される。
本明細書において記載される方法は、長さ、疎水性、および/もしくは等電点(pI)を含む、タンパク質における測定からの情報を用いて、試料中のタンパク質を分析ならびに/または同定するために、適用され得る。あるタンパク質クエリー候補についてある特定の長さを測定する確率は、以下によって表現され得る:
ここで
σ = | CV * 予想されるアウトカムの値 |
u = (測定されるアウトカムの値 - 予想されるアウトカムの値) / σ
本明細書において記載される方法は、各結合実験において親和性試薬の混合物が測定される実験からの情報を用いて、試料中のタンパク質を分析および/または同定するために、適用され得る。開示される態様と一致して、1,000個の未知のヒトタンパク質の同定が、Santa Cruz Biotechnology, Inc.から市販されている抗体のプールを用いる結合測定を入手することによって、ベンチマークテストとして実施された。1,000個のタンパク質が、約21,005個のタンパク質を含むUniprotタンパク質データベースから、無作為に選択された。ヒトタンパク質に対して反応性を有する、Santa Cruz Biotechnology社のカタログから利用可能なモノクローナル抗体のリストが、オンライン抗体レジストリからダウンロードされた。リストは22,301個の抗体を含んでいた、そしてUniprotヒトタンパク質データベース中のタンパク質に整合した14,566個の抗体のリストへと、フィルタリングされた。本実験においてモデル化された、抗体の完全な集団は、これらの14,566個の抗体を含んでいた。1,000個の未知のタンパク質候補への抗体混合物の結合の、実験による評価は、以下のように実施された。
P(結合アウトカム | タンパク質) = {混合物がタンパク質に対する抗体を含む場合は0.99; そうでない場合は0.0488}
0.0488との値は、この混合物についての、タンパク質に対する非特異的な(オフターゲット)結合イベントが生じる確率を表す。混合物についての非特異的結合の確率は、任意の個々の抗体が、その標的以外のタンパク質に結合する、予想される確率、および混合物中のタンパク質の数に基づいて、モデル化された。抗体の混合物についての非特異的結合イベントの確率は、混合物中の任意の1つの抗体が非特異的に結合する確率である。この確率は、混合物中の抗体の数(n)、および任意の1つの抗体についての、非特異的結合の確率(p)に基づいて算定され、かつ以下の方程式によって表現され得る:
混合物の非特異的結合の確率 = 1 - (1 - p)n
混合物の非特異的結合の確率 = 1 - (1 - 10-5)5000 = 0.0488
P(非結合アウトカム | タンパク質) = 1 - P(結合アウトカム | タンパク質)
本明細書において記載される方法は、多くの異なる種から得られた試料中のタンパク質を分析および/または同定するために、適用され得る。たとえば、一連の親和性試薬結合実験からの結果は、それぞれ丸、三角形、および四角形によって表される、大腸菌、サッカロマイセス・セレビシエ(Saccharomyces cerevisiae)(酵母)、またはホモ・サピエンス(Homo sapiens)(ヒト)におけるタンパク質を同定するために、使用され得る。分析方法を種それぞれに対して適合させるために、タンパク質候補のリストは、Uniprotからダウンロードされる該種についてのリファレンスプロテオームなどの、種特異的な配列データベースから、生成されなくてはならない。
本明細書において記載される方法は、非同義の一塩基多型(SNP)によって引き起こされる1アミノ酸変異(SAV)の存在下で試料中のタンパク質を分析および/または同定するために、適用され得る。少数の1アミノ酸変異(SAV)を除いて同じ配列を有するタンパク質は、区別することが困難であり得る。たとえば、一連の親和性試薬測定を用いる実験においては、タンパク質のカノニカル型は、タンパク質の多型領域に対して高度に選択的な親和性試薬が実験に含まれない限り、その変異型から区別するのはほぼ不可能であり得る。多型領域が、親和性試薬測定のいずれによっても区別されない場合においては、いずれかのタンパク質型の測定は、カノニカルおよび変異体タンパク質クエリー候補の両方について、類似の確率(尤度)を返すと考えられる(たとえば、 L (カノニカルタンパク質 | 証拠) = 0.8 かつ L (変異体タンパク質 | 証拠) = 0.8)。
ここでLotherは、カノニカルタンパク質および変異体タンパク質を除く、すべてのタンパク質クエリー候補の合計された尤度であり、かつゼロより大きいかまたはゼロと等しい数である。
カノニカルタンパク質と変異体タンパク質とを区別しないものの、このアプローチを用いて、信頼性を有する同定が、未知のタンパク質から導かれ得る。特に、Lotherがゼロに近い場合は、信頼性を有する同定がもたらされる可能性が高い。
本明細書において記載される1つまたは複数の方法において使用される、確率論的なモデルは、期待値最大化アプローチまたは関連するアプローチを用いるタンパク質同定の計算の間に実証的な測定を用いて、反復して改善され得る。そのようなアプローチの1つが、親和性試薬結合実験に関して、本明細書に記載される。
本明細書において記載される1つまたは複数の方法において使用される、タンパク質の推定または同定のための確率論的なモデルは、直接的な成果物として、未知のタンパク質それぞれについての、タンパク質配列整合物のリスト、および該配列整合物が正確であるという、関連する確率を、もたらす。多くの場合、タンパク質同定のサブセットのみが正確であり得る。したがって、タンパク質のセットについての偽同定率を推測および制御するために有用な方法が、以下に記載される。
prot1の確率(p1):0.99
prot2の確率(p2):0.97
prot3の確率(p3):0.92
prot4の確率(p4):0.9
prot5の確率(p5):0.8
prot6の確率(p6):0.75
prot7の確率(p7):0.6
prot8の確率(p8):0.5
タンパク質の同定それぞれが、未知のタンパク質について最も可能性の高いタンパク質整合物を含む、タンパク質同定のリスト、および該整合物が正確であるという、関連する確率(P(タンパク質 | 証拠)を、検討する。たとえば:
である。
本明細書において記載される方法は、未同定のタンパク質への親和性試薬の結合および/または非結合に関連するデータの、異なるサブセットに適用され得る。いくつかの態様において、本明細書において記載される方法は、測定された結合アウトカムのうちの特定のサブセットが検討されない(たとえば非結合測定アウトカム)実験に適用され得る。測定された結合アウトカムのうちのあるサブセットが検討されないこれらの方法は、本明細書において、「打ち切り」の推定アプローチ(たとえば実施例1に記載されるようなアプローチ)と称され得る。図10に記載される結果において、打ち切りの推定アプローチの結果として得られるタンパク質同定は、特定の未同定のタンパク質に関連する結合イベントの発生を評価することに基づいている。したがって、打ち切りの推定アプローチは、未知のタンパク質のアイデンティティを決定する際に、非結合アウトカムを検討しない。
P(アウトカムセット | タンパク質) = P(結合イベント1 | タンパク質) * P(結合イベント2 | タンパク質) * … * P(結合イベントM | タンパク質)
いくつかの場合において、親和性試薬結合に関して、偽陰性の結合測定アウトカムが多発することが起こり得る。「偽陰性」の結合アウトカムは、予想されるよりも少ない頻度で生じる親和性試薬結合測定として現れる。そのような「偽陰性」のアウトカムは、たとえば、結合検出方法、結合条件(たとえば、温度、緩衝液組成物等)、タンパク質試料の劣化、または親和性試薬ストックの劣化の問題のために生じ得る。打ち切りのタンパク質同定アプローチおよび非打ち切りのタンパク質同定アプローチにおける、偽陰性測定の影響を決定するため、親和性試薬測定群のサブセットは、10個のうち1個、100個のうち1個、1,000個のうち1個、10,000個のうち1個、または100,000個のうち1個のいずれかの、無作為な、観測された結合イベントを、非結合イベントへとインシリコで交換することによって、意図的に劣化させた。全300個の親和性試薬群のうち、0個、1個、50個、100個、200個、または300個のいずれかを、この様式で劣化させた。図11にプロットされる結果によって示されるように、打ち切りのタンパク質同定アプローチおよび非打ち切りのタンパク質同定アプローチの両方とも、このタイプの無作為な偽陰性の結合を許容する。図11にプロットされるデータは、表2に提供される。
タンパク質同定の感度は、三量体への親和性試薬の、正確に推測された結合確率、および過大に推測されたまたは過小に推測された親和性試薬結合確率を用いるタンパク質同定を用いて、評価された。真の結合確率は、0.25であった。過小に推測された結合確率は:0.05、0.1、および0.2であった。過大に推測された結合確率は、0.30、0.50、0.75、および0.90であった。全部で300個の親和性試薬測定の群が入手された。親和性試薬のうち、無し(0個)、300個すべて、またはサブセット(1個、50個、100個、200個)は、過大に推測された、または過小に推測された結合確率を適用された。他のすべては、タンパク質同定において、正確な結合確率(0.25)が使用された。分析の結果は、表4に提供される。
いくつかの場合において、親和性試薬は、いくつかの未知の結合部位(たとえば、エピトープ)を有し得る。親和性試薬結合測定を用いる、打ち切りのタンパク質同定アプローチおよび非打ち切りのタンパク質同定アプローチの感度は、5つの三量体部位(たとえば、1つの標的三量体、および4つの無作為なオフターゲット部位)に、タンパク質同定アルゴリズムに入力される0.25の確率でそれぞれ結合する親和性試薬を用いて、比較された。親和性試薬のサブセット(300個のうち0個、300個のうち1個、300個のうち50個、300個のうち100個、300個のうち200個、もしくは300個のうち300個)は、1個、4個、または40個のいずれかの、追加の余分な結合部位を有しており、該部位はそれぞれ、無作為な三量体に対して0.05、0.1、または0.25の結合確率を有していた。分析の結果は、表5に示される。
いくつかの場合において、存在していない、アノテーションされたいくつかの結合エピトープ(たとえば、余分な予想される結合部位)を用いて、不適切に特徴付けされている親和性試薬が、存在し得る。つまり、親和性試薬に関して予想される結合確率を生成するために使用されるモデルは、存在しない、余分な予想される部位を含む。親和性試薬結合測定を用いる、打ち切りのタンパク質同定アプローチおよび非打ち切りのタンパク質同定アプローチの感度は、無作為な三量体部位(たとえば、1つの標的三量体、および4つの無作為なオフターゲット部位)に、タンパク質同定アルゴリズムに入力される0.25の確率でそれぞれ結合する親和性試薬を用いて、比較された。親和性試薬のサブセット(300個のうち0個、300個のうち1個、300個のうち50個、300個のうち100個、300個のうち200個、もしくは300個のうち300個)は、1個、4個、または40個のいずれかの、余分な予想される結合部位を有しており、該部位はそれぞれ、無作為な三量体に対して結合確率0.05、0.1、または0.25を有し、タンパク質推定アルゴリズムによって使用される親和性試薬についてのモデルに追加された。分析の結果は、表6に示される。
本明細書において記載される方法は、確率のさまざまなスケール変換戦略との組み合わせで親和性試薬結合測定を用いる、タンパク質のアイデンティティの推定(たとえば未知のタンパク質の同定)に、適用され得る。実施例11に記載される打ち切りの推定アプローチは、タンパク質における潜在的な結合部位の数(タンパク質の長さ - 2)、および観測された結合アウトカムの数(M)に基づき、タンパク質に関する観測されたアウトカムの確率をスケール変換する:
ここで、P(三量体j)は、プロテオーム中のすべての8,000個の三量体の合計数と比較した、三量体が存在する頻度である。長さkの任意のタンパク質に関して、プローブiがタンパク質に結合する確率は、以下のように表され得る:
P(タンパク質の結合 | プローブi, k) = 1 - (1 - P(三量体の結合 | プローブi))k-2
pプローブ, k = [P(結合 | プローブ1, k), P(結合 | プローブ2, k), P(結合 | プローブ3, k) … P(結合 | プローブn, k)]
P(N個の結合イベント | プローブ, k) = PMFPoiBin (N, pプローブ, k)
本明細書において記載される方法は、親和性試薬の任意のセットに適用され得る。たとえば、タンパク質同定アプローチは、プロテオーム中で最も豊富な三量体を標的とする親和性試薬または無作為な三量体を標的とする親和性試薬のセットに、適用され得る。プロテオーム中で最上位の最も乏しい三量体300個を標的とする親和性試薬、プロテオーム中で無作為に選択された三量体300個を標的とする親和性試薬、またはプロテオーム中で最も豊富な三量体300個を標的とする親和性試薬を用いるヒトタンパク質推定分析からの結果は、それぞれ表7A〜表7Cに示される。
本明細書において記載される方法は、異なるタイプのオフターゲット結合部位(エピトープ)を有する親和性試薬を用いる親和性試薬結合実験に、適用され得る。この実施例においては、親和性試薬の2つのクラスの性能が比較される:無作為な親和性試薬、および「バイオシミラー」親和性試薬。これらの評価からの結果は、表8A〜表8Dに示される。
1) 選択される親和性試薬(AR)の空のリストを、初期化する。
2) 候補ARのセット(たとえば、そのそれぞれが、無作為なオフターゲット部位を有しつつ独特な三量体を標的とする、8,000個のARの集団)を、初期化する。
3) (たとえばUniprotリファレンスプロテオーム中のすべてのヒトタンパク質)に対して最適化するために、タンパク質配列のセットを選択する。
4) 所望の数のARが選択されるまで、以下を繰り返す:
a. 各候補ARに関して:
i. タンパク質セットに対する候補ARの結合をシミュレートする。
ii. 候補ARからシミュレートされた結合測定、および以前に選択されたすべてのARからシミュレートされた結合測定を用いて、各タンパク質についてタンパク質推定を実施する。
iii. タンパク質推定によって決定される、各タンパク質についての正確なタンパク質同定の確率を合計することによって、候補ARについてスコアを算定する。
b. 最高のスコアを有するARを選択されるARのセットへ追加し、そしてそれを候補ARリストから除去する。
本明細書において記載される方法は、親和性試薬の混合物を用いて測定されたタンパク質を、分析および/または同定するために、適用され得る。親和性試薬の混合物によってアッセイされた場合に、ある特定のタンパク質が結合アウトカムを生成する確率は、以下のように計算され得る:
1) 混合物中の各親和性試薬の、非特異的エピトープ結合の平均の確率
を、算定する。
2) タンパク質における結合部位の数を、タンパク質の長さ(L)および親和性試薬のエピトープの長さ(K)に基づいて算定する:結合部位の数 = L - K + 1。非特異的結合イベントが生じない確率は、
である。
3) 混合物中の各親和性試薬に関して、エピトープ特異的結合イベントが生じない確率を、以下のように算定する:
4) タンパク質に関して、混合物が非結合アウトカムを生成する確率は、以下である:
5) 混合物が結合アウトカムを生成する確率は、以下である:
P(結合 | タンパク質) = 1 - P(非結合 | タンパク質)
ここでSOTは、オフターゲット部位と標的部位との間のBLOSUM62類似性であり、かつSselfは、標的配列とそれ自身との間のBLOSUM62類似性である。2.45 x 108を下回る結合確率を有するオフターゲット部位はいずれも、結合確率2.45 x 108を有するように調整される。非特異的エピトープ結合確率は、この例においては2.45 x 108である。
1) 選択される親和性試薬(AR)混合物の空のリストを、初期化する。
2) 候補親和性試薬(この例においては、実施例18に詳細が記載される貪欲法アプローチを用いて計算された、300個のもっとも最適なものからなる)のリストを、初期化する。
3) (たとえばUniprotリファレンスプロテオーム中のすべてのヒトタンパク質)に対して最適化するために、タンパク質配列のセットを選択する。
4) 所望の数のAR混合物が生成されるまで、以下を繰り返す:
a. 空の混合物を初期化する。
b. 各候補ARに関して:
i. それに追加された候補ARを有する現在の混合物を用いて、結合アウトカムをシミュレートする。
ii. i.からシミュレートされた結合測定、および以前に生成された混合物からシミュレートされた結合測定を用いて、各タンパク質についてタンパク質推定を実施する。
iii. タンパク質推定によって決定される、各タンパク質についての正確なタンパク質同定の確率を合計することによって、この候補ARを有する混合物についてスコアを算定する。
c. 最高のスコアが付けられた候補ARを、混合物へ追加する。
d. それまでに混合物になかった各候補ARに関して、該ARが追加された混合物に、i〜iiiにおけるようにスコアを付け、そして、最高のスコアが付けられた候補が、混合物に追加された以前の候補よりも高いスコアを有する場合、それを混合物に追加し、そして、この工程を繰り返す。混合物は、最高のスコアが付けられた候補ARが、以前に追加された候補と比べて、混合物のスコアを減少させる場合に、またはすべての候補ARが混合物に追加された場合に、完成する。
本明細書において記載されるタンパク質同定アプローチは、タンパク質アイソフォームを含む試料に適用され得る。カノニカルタンパク質のアイソフォームとは、カノニカルタンパク質と同じ遺伝子の選択的スプライシングによって形成される、またはカノニカルタンパク質と同じ遺伝子ファミリー中の別の遺伝子によって形成される、カノニカルタンパク質の変異体を指し得る。タンパク質アイソフォームは、カノニカルタンパク質に対して構造的に類似し得るものであり、典型的には、カノニカルタンパク質と、配列の大部分を共有している。
タンパク質同定における、アイソフォーム配列の存在の影響を決定するため、親和性試薬結合分析が、独特なカノニカルヒトタンパク質20,374個、およびそれらカノニカルタンパク質の独特なアイソフォーム21,987個からなるタンパク質の集団において、実施された。カノニカルタンパク質およびアイソフォームタンパク質は、Uniprotデータベースの一部として利用可能なリファレンスヒトプロテオーム中に列挙されているものである。手動でアノテーションされかつレビューされているタンパク質であることを意味するために使用される「Swiss-Prot」との表示のあるタンパク質のみが、分析に含められた。個々のカノニカルタンパク質それぞれについての、含まれるアイソフォームの数は、アイソフォーム0〜36個の範囲にわたっていた。このセット中のカノニカルタンパク質についての、アイソフォームの平均数は、1.08である。試料は、384個の親和性試薬群を用いて分析された、ここで各群は、試料中のタンパク質のそれぞれへの、独特な親和性試薬の結合アウトカムを、測定する。各親和性試薬は、標的三量体に0.25の確率で結合し、かつ標的三量体に最も類似する4つの三量体に0.25の確率で結合する。他のオフターゲット三量体は、2.45 x 10-8より大きい数であってかつ0.25 * 1.5-xという確率で結合され、後者においてxは、標的三量体のそれ自体に対する類似性から差し引かれた、オフターゲット三量体の三量体標的に対する類似性である。三量体配列の間の類似性は、たとえば、3つの配列位置のそれぞれにおけるアミノ酸対について、BLOSUM62係数を合計することによって、計算され得る。親和性試薬の三量体標的は、ヒトプロテオームに対して最適化するために、実施例18に記載されるように、貪欲法アプローチを用いて選択された。
タンパク質試料中の、20,374個のカノニカルタンパク質についての配列のみを含むデータベースを用いて、打ち切りのタンパク質推定が、試料からの結合アウトカムにおいて実施された。タンパク質推定のために使用されたデータベースは、試料中の21,987個のタンパク質アイソフォームの配列を欠くため、この分析の結果は、試料中の潜在的なタンパク質アイソフォームの配列が既知ではない場合の性能を示す。この様式で実施されるタンパク質推定を用いて、正確なタンパク質ファミリーは、試料中のタンパク質の83.9%について、1%の偽発見率で同定される。「タンパク質ファミリー」との語は、本明細書において使用されるように、概して、カノニカルタンパク質配列、および該カノニカルタンパク質配列のすべてのアイソフォームを含む、配列のセットを指す。タンパク質についての正確なタンパク質ファミリーは、推定されたタンパク質のアイデンティティが、分析されている該タンパク質と同じタンパク質ファミリー内にある場合に、同定される。
タンパク質推定が、試料中のすべてのタンパク質配列(カノニカルタンパク質配列およびアイソフォームタンパク質配列の両方)からなる配列データベースを用いて実施された場合、正確なタンパク質配列は、試料中のタンパク質の60.9%について、1%の偽発見率で同定された。あるタンパク質について正しい配列が同定される場合に、該タンパク質について正確なタンパク質配列が同定される。さらに、正確なタンパク質ファミリーは、試料中のタンパク質の89.8%について、同定される。タンパク質ファミリーの同定率と、正しいタンパク質配列の同定率との間の相違は、類似の配列を有する複数のアイソフォーム候補の間で、タンパク質のアイデンティティを区別することの困難性のために、生じ得る。
カノニカルタンパク質配列およびアイソフォームタンパク質配列の、タンパク質ファミリーへのグループ化が、アプリオリに既知である場合、タンパク質ファミリーについての同定率は、タンパク質ファミリーの確率を直接的に算定することによって、改善され得る。測定されている個々のタンパク質に関して、タンパク質がタンパク質ファミリーのメンバーである確率は、ファミリーを構成する個々のタンパク質配列の確率のそれぞれを合計することによって、算定され得る。分析されているタンパク質について最高の確率を有するタンパク質ファミリーが、タンパク質ファミリーの同定物として、割り当てられる。タンパク質ファミリーの確率がこの様式で算定される場合、正確なタンパク質ファミリーは、試料中のタンパク質の97.2%について、1%の偽発見率で同定される。比較として、タンパク質ファミリーの確率が直接的に算定されない場合、正確なタンパク質ファミリーは、試料中のタンパク質の89.8%について、1%の偽発見率で同定される。
本明細書において記載されるタンパク質同定アプローチは、1アミノ酸変異を有するタンパク質を含む試料に適用され得る。カノニカルタンパク質の1アミノ酸変異(SAV)とは、本明細書において使用されるように、概して、1アミノ酸が異なる、カノニカルタンパク質の変異を指す。1アミノ酸変異タンパク質は、典型的には、タンパク質をコードする遺伝子におけるミスセンス一塩基多型(SNP)から生じ得る。
タンパク質同定における、SAVタンパク質の存在の影響を決定するため、親和性試薬結合分析が、独特なカノニカルヒトタンパク質20,374個、およびそれらカノニカルタンパク質の独特なSAV12,827個からなるタンパク質の集団において、実施された。カノニカルタンパク質は、Uniprotデータベースの一部として利用可能なリファレンスヒトプロテオーム中に列挙されているものである。各カノニカルタンパク質に関して、タンパク質についての1つまたは複数のSAVが、SAVデータベース中に存在する場合、無作為に選択されるSAVが、試料中に含められる。使用されたSAVデータベースは、Uniprot human polymorphisms and disease mutations indexである。手動でアノテーションされかつレビューされているタンパク質であることを意味するために使用される「Swiss-Prot」との表示のあるタンパク質のみが、分析に含められた。試料は、384個の親和性試薬群を用いて分析された、ここで各群は、試料中のタンパク質のそれぞれへの、独特な親和性試薬の結合アウトカムを、測定する。各親和性試薬は、標的三量体に0.25の確率で結合し、かつ標的三量体に最も類似する4つの三量体に0.25の確率で結合する。他のオフターゲット三量体は、2.45 x 10-8より大きい数であってかつ0.25 * 1.5-xという確率で結合され、後者においてxは、標的三量体のそれ自体に対する類似性から差し引かれた、オフターゲット三量体の三量体標的に対する類似性である。三量体配列の間の類似性は、たとえば、3つの配列位置のそれぞれにおけるアミノ酸対について、BLOSUM62係数を合計することによって、計算され得る。親和性試薬の三量体標的は、ヒトプロテオームに対して最適化するために、実施例18に記載されるように、貪欲法アプローチを用いて選択された。
タンパク質試料中の、20,374個のカノニカルタンパク質についての配列のみを含むデータベースを用いて、打ち切りのタンパク質推定が、試料からの結合アウトカムにおいて実施された。タンパク質推定のために使用されたデータベースは、試料中の12,827個のSAVタンパク質の配列を欠くため、この分析の結果は、試料中のすべての潜在的なSAVの配列が既知ではない場合の性能を示す。この様式で実施されるタンパク質推定を用いて、正確なSAVタンパク質ファミリーは、試料中のタンパク質の96.0%について、1%の偽発見率で同定される。「SAVタンパク質ファミリー」との語は、本明細書において使用されるように、概して、カノニカルタンパク質配列、および該カノニカルタンパク質配列のすべてのSAVを含む、配列のセットを指す。タンパク質についての正確なSAVタンパク質ファミリーは、推定されたタンパク質のアイデンティティが、分析されている該タンパク質と同じSAVタンパク質ファミリー内にある場合に、同定される。
タンパク質推定が、試料中のすべてのタンパク質配列(カノニカルタンパク質配列およびSAVタンパク質配列の両方)からなる配列データベースを用いて実施された場合、正確なタンパク質配列は、試料中のタンパク質の27.1%について、1%の偽発見率で同定された。あるタンパク質について正しい配列が同定される場合に、該タンパク質について正確なタンパク質配列が同定される。さらに、正確なSAVタンパク質ファミリーは、試料中のタンパク質の96.1%について、同定される。SAVタンパク質ファミリーの同定率と、正しいタンパク質配列の同定率との間の相違は、カノニカルタンパク質配列のアイデンティティと、極度に類似したSAV配列のアイデンティティの間を区別することの困難性のために、生じ得る。
SAVタンパク質ファミリーについての同定率は、SAVタンパク質ファミリーの確率を直接的に算定することによって、改善され得る。測定されている個々のタンパク質に関して、タンパク質がSAVタンパク質ファミリーのメンバーである確率は、ファミリーを構成する個々のタンパク質配列の確率のそれぞれを合計することによって、算定され得る。分析されているタンパク質について最高の確率を有するSAVタンパク質ファミリーが、SAVタンパク質ファミリーの同定物として、割り当てられる。SAVタンパク質ファミリーの確率がこの様式で算定される場合、正確なSAVタンパク質ファミリーは、試料中のタンパク質の96.5%について、1%の偽発見率で同定される。比較として、タンパク質ファミリーの確率が直接的に算定されない場合、正確なSAVタンパク質ファミリーは、試料中のタンパク質の96.1%について、1%の偽発見率で同定される。
いくつかの場合において、タンパク質試料は、複数の種のそれぞれからのタンパク質を含んでよい。タンパク質試料は、化石などの外部供給源に由来するタンパク質を含んでよい。いくつかの態様において、タンパク質試料は、組み換えタンパク質、またはインビトロ転写および翻訳によって合成されたタンパク質などの、合成された、修飾された、または遺伝子操作されたタンパク質を、含んでよい。いくつかの態様において、合成された、修飾された、または遺伝子操作されたタンパク質は、非天然の配列(たとえば、CRISPR-Cas9による改変、または他の人工的な遺伝子構築物から生じるもの)を含んでよい。種のそれぞれは、たとえば、哺乳類(たとえばヒト、マウス、ラット、霊長類、もしくはサル)などの動物、家畜(肉牛、乳牛、家禽、ウマ、ブタ等)、スポーツ動物、伴侶動物(たとえばペットもしくは支援動物);植物、原生生物、細菌、ウイルス、または古細菌であってよい。
試料中のタンパク質の、特定のサブセットの同定のために最適化される、親和性試薬のセットが設計され得る。たとえば、親和性試薬の最適な集団は、プロテオーム全体の同定のために最適化されたセットを用いるのと比べて、より少数の親和性試薬結合群で、標的タンパク質の特定のセットを同定するために、使用され得る。この実施例においては、親和性試薬のセットが、がん免疫療法処置への臨床応答に関する潜在的なバイオマーカーである、25種類のヒトタンパク質の最適な同定のために、生成される。標的パネル中のタンパク質は、表11に列挙される。
本明細書において記載されるタンパク質推定アプローチは、タンパク質およびペプチド中の特定のアミノ酸の測定に適用され得る。たとえば、タンパク質もしくはペプチド中のあるアミノ酸の存在もしくは非存在(二値)、タンパク質もしくはペプチド中のあるアミノ酸の数(数)、またはタンパク質中のあるアミノ酸の順(順)を示す、タンパク質における測定が、実施され得る。この実施例においては、タンパク質は、それぞれが特定のアミノ酸を選択的に修飾する、一連の反応によって、修飾される。一連の反応の各反応は、0〜1の間の、反応の有効性を有し、これは、反応が、タンパク質中の任意の1つのアミノ酸基質を成功裏に修飾する確率を示す。タンパク質試料においてそのような修飾反応を実施した後で、選択的に修飾されたアミノ酸の存在もしくは非存在が検出され得、選択的に修飾されたアミノ酸の数が検出され得、および/またはタンパク質中の、選択的に修飾されたアミノ酸の特定のセットの順が検出され得る。
アミノ酸の存在または非存在を示す一連の二値の測定からタンパク質同定を生成するために、確率Pr(アミノ酸の存在の検出 | タンパク質)は、 1 - (1 - Raa)Caa のように表現され得、ここでRaaは、該アミノ酸についての反応の有効性であり、かつCaaは、該アミノ酸がタンパク質中に出現する回数の数である。確率Pr(アミノ酸の存在の非検出 | タンパク質)は、 1 - Pr(アミノ酸の存在の検出 | タンパク質) のように表現され得る。以下によって表現されるように、一連の、アミノ酸検出の複数の測定がなされる場合、候補タンパク質が与えられるとき、確率は、N個の測定の完全なセットの確率を決定するために、乗じられ得る:
Pr(アウトカムセット | タンパク質) = Pr(アミノ酸1についての測定アウトカム | タンパク質) * Pr(アミノ酸2についての測定アウトカム | タンパク質) * … Pr(アミノ酸Nについての測定アウトカム | タンパク質)
として表現され得、ここで
は、P個のタンパク質からなるタンパク質配列データベース中の、可能性のあるタンパク質それぞれについてのアウトカムセットの確率の合計である。
一連の、アミノ酸の数の測定から、タンパク質同定を生成するために、確率Pr(アミノ酸の数の測定 | タンパク質)は、
のように表現され得、ここでRaaは、該アミノ酸についての反応の有効性であり、Caaは、該アミノ酸がタンパク質中に出現する回数の数であり、かつMは、タンパク質中の該アミノ酸について測定される数である。M > Caa である場合、0の確率が返される。以下によって表現されるように、一連の、アミノ酸数の複数の測定がなされる場合、候補タンパク質が与えられるとき、確率は、N個の測定の完全なセットの確率を決定するために、乗じられ得る:
Pr(アウトカムセット | タンパク質) = Pr(アミノ酸1についての測定アウトカム | タンパク質) * Pr(アミノ酸2についての測定アウトカム | タンパク質) * … Pr(アミノ酸Nについての測定アウトカム | タンパク質)
のように表現され得、ここで
は、P個のタンパク質からなるタンパク質配列データベース中の、可能性のあるタンパク質それぞれについてのアウトカムセットの確率の合計である。
いくつかの態様において、タンパク質中の、選択的に修飾されたアミノ酸の順が、測定され得る。たとえば、配列TINYPRTEINを有するタンパク質は、アミノ酸IおよびNが修飾され、そして測定される場合、測定アウトカムININを生成し得る。同様に、前述のタンパク質は、アミノ酸の修飾および/または測定のサブセットが成功していない場合、測定アウトカムINNまたはIINを生成し得る。確率Pr(測定アウトカム | タンパク質)は、 Pr(aa_counts | タンパク質) * NUMORDER のように表現され得る。
であり、ここでRaaiは、アミノ酸iについての反応の有効性であり、Miは、アミノ酸iが測定された回数であり(たとえば、INNという測定アウトカムにおいて、Nは2回測定された)、Caaiは、アミノ酸iが候補タンパク質の配列中に出現する回数であり、かつアミノ酸1〜L個は、タンパク質において測定された、独特なアミノ酸のすべて(たとえば、測定アウトカムININについては、IおよびN)である。任意の特定のアミノ酸について測定される回数の数が、アミノ酸がタンパク質候補配列中に出現する回数の数より大きい場合、確率Pr(aa_counts | タンパク質)は、ゼロにセットされる。NUMORDERは、タンパク質配列から生成され得る、特定のアウトカムの様式の数である。たとえば、INという測定アウトカムは、タンパク質TINYPRTEINから、以下の様式で生成され得る:
{TINYPRTEIN, TINYPRTEIN, TINYPRTEIN}
このように、NUMORDERは、この特定のアウトカムおよびタンパク質配列に関しては、3である。NUMORDERは、タンパク質から特定のアウトカムを生成することが可能ではない場合においては、ゼロの値を有することに注意されたい(たとえば、INNIという測定アウトカムは、タンパク質TINYPRTEINからは生成され得ない)。ある特定の候補タンパク質が、測定されているタンパク質についての正確な同定物である確率は、
のように表現され得、ここで
は、P個のタンパク質からなるタンパク質配列データベース中の、可能性のあるタンパク質それぞれについての測定アウトカムの確率の合計である。
がゼロに等しい場合においては、候補タンパク質の確率はゼロにセットされる。
本開示は、本開示の方法を遂行するためにプログラムされた、コンピューター制御システムを提供する。図10は、コンピューターシステム1001を示し、これは:試料中の未知のタンパク質の実証的な測定の情報を受信するように、実証的な測定の情報を、候補タンパク質に対応する複数のタンパク質配列を含むデータベースに対して比較するように、観測される測定アウトカムセットを候補タンパク質が生成する確率を生成するように、および/もしくは候補タンパク質が試料において正確に同定される確率を生成するように、プログラムされているか、または別の状況では、そうするように設定されている。
Claims (33)
- 未知のタンパク質の試料中のタンパク質を同定するための、コンピューターによって遂行される方法であって、以下の工程を含む、方法:
(a) 前記試料中の前記未知のタンパク質において実施される複数の実証的な測定の情報を、前記コンピューターによって受信する工程;
(b) 前記複数の前記実証的な測定の前記情報の少なくとも一部分を、複数のタンパク質配列を含むデータベースに対して、前記コンピューターによって比較する工程であって、各タンパク質配列が、複数の候補タンパク質の中の1つの候補タンパク質に対応する、工程;ならびに
(c) 前記複数のタンパク質配列を含む前記データベースに対する、前記複数の前記実証的な測定の前記情報の前記少なくとも一部分の前記比較に基づいて、前記複数の候補タンパク質中の1つまたは複数の候補タンパク質のそれぞれに関して、
(i) 前記複数の実証的な測定の前記情報を前記候補タンパク質が生成する確率、
(ii) 前記候補タンパク質が前記試料中に存在するときに、前記複数の実証的な測定が観測されない確率、および
(iii) 前記候補タンパク質が前記試料中に存在する確率
のうちの1つまたは複数を、前記コンピューターによって生成する工程。 - 前記複数の実証的な測定の2つ以上が、
(i) 前記試料中の前記未知のタンパク質に対する1つまたは複数の親和性試薬プローブのそれぞれについての結合測定であって、親和性試薬プローブそれぞれが、前記複数の候補タンパク質の中の1つまたは複数の候補タンパク質に選択的に結合するように設定されている、結合測定;
(ii) 前記試料中の1つまたは複数の前記未知のタンパク質の長さ;
(iii) 前記試料中の1つまたは複数の前記未知のタンパク質の疎水性;および
(iv) 前記試料中の1つまたは複数の前記未知のタンパク質の等電点
からなる群より選択される、請求項1に記載の方法。 - 前記複数の確率を生成する工程が、複数の追加の親和性試薬プローブのそれぞれについての結合測定の追加の情報を受信することをさらに含み、追加の親和性試薬プローブそれぞれが、前記複数の候補タンパク質の中の1つまたは複数の候補タンパク質に選択的に結合するように設定されている、請求項1に記載の方法。
- 前記1つまたは複数の候補タンパク質のそれぞれに関して、
前記候補タンパク質が前記試料中の前記未知のタンパク質の1つに整合する信頼水準
を生成する工程をさらに含む、請求項1に記載の方法。 - 前記複数の親和性試薬プローブが、50個以下の親和性試薬プローブを含む、請求項1に記載の方法。
- 前記複数の親和性試薬プローブが、100個以下の親和性試薬プローブを含む、請求項1に記載の方法。
- 前記複数の親和性試薬プローブが、200個以下の親和性試薬プローブを含む、請求項1に記載の方法。
- 前記複数の親和性試薬プローブが、300個以下の親和性試薬プローブを含む、請求項1に記載の方法。
- 前記複数の親和性試薬プローブが、500個以下の親和性試薬プローブを含む、請求項1に記載の方法。
- 前記複数の親和性試薬プローブが、500個超の親和性試薬プローブを含む、請求項1に記載の方法。
- 前記試料中の前記タンパク質を同定する紙のまたは電子的なレポートを生成する工程をさらに含む、請求項1に記載の方法。
- 前記試料が、生物学的試料を含む、請求項1に記載の方法。
- 前記生物学的試料が、対象から得られている、請求項12に記載の方法。
- 前記複数の確率に少なくとも基づいて、前記対象における疾患の状態を同定する工程をさらに含む、請求項13に記載の方法。
- (c)が、
前記複数の候補タンパク質中の1つまたは複数の候補タンパク質のそれぞれに関して、
(i) 前記複数の実証的な測定の前記情報を前記候補タンパク質が生成する前記確率
を、前記コンピューターによって生成すること
を含む、請求項1に記載の方法。 - (c)が、
前記複数の候補タンパク質中の1つまたは複数の候補タンパク質のそれぞれに関して、
(ii) 前記候補タンパク質が前記試料中に存在するときに、前記複数の実証的な測定が観測されない前記確率
を、前記コンピューターによって生成すること
を含む、請求項1に記載の方法。 - (c)が、
前記複数の候補タンパク質中の1つまたは複数の候補タンパク質のそれぞれに関して、
(iii) 前記候補タンパク質が前記試料中に存在する前記確率
を、前記コンピューターによって生成すること
を含む、請求項1に記載の方法。 - 測定アウトカムが、親和性試薬プローブの結合を含む、請求項15に記載の方法。
- 測定アウトカムが、親和性試薬プローブの非特異的結合を含む、請求項15に記載の方法。
- 測定アウトカムが、親和性試薬プローブの結合を含む、請求項16に記載の方法。
- 測定アウトカムが、親和性試薬プローブの非特異的結合を含む、請求項16に記載の方法。
- 前記実証的な測定が、親和性試薬プローブの結合を含む、請求項17に記載の方法。
- 前記実証的な測定が、親和性試薬プローブの非特異的結合を含む、請求項17に記載の方法。
- 所定の閾値を有するタンパク質同定のある感度を生成する工程をさらに含む、請求項1に記載の方法。
- 前記所定の閾値が、不正確であるのが1%未満というものである、請求項24に記載の方法。
- 前記試料中の前記タンパク質が、切断されているか、または分解されている、請求項1に記載の方法。
- 前記試料中の前記タンパク質が、タンパク質末端から始まっているのではない、請求項1に記載の方法。
- 前記実証的な測定が、前記試料中の1つまたは複数の前記未知のタンパク質の長さを含む、請求項15〜17のいずれか一項に記載の方法。
- 前記実証的な測定が、前記試料中の1つまたは複数の前記未知のタンパク質の疎水性を含む、請求項15〜17のいずれか一項に記載の方法。
- 前記実証的な測定が、前記試料中の1つまたは複数の前記未知のタンパク質の等電点を含む、請求項15〜17のいずれか一項に記載の方法。
- 前記実証的な測定が、抗体の混合物において実施される測定を含む、請求項1に記載の方法。
- 前記実証的な測定が、複数の種から得られた試料において実施される測定を含む、請求項1に記載の方法。
- 前記実証的な測定が、非同義の一塩基多型(SNP)によって引き起こされる1アミノ酸変異(SAV)の存在下で試料において実施される測定を含む、請求項1に記載の方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024039635A JP2024075638A (ja) | 2017-12-29 | 2024-03-14 | タンパク質同定のためのデコーディングアプローチ方法 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762611979P | 2017-12-29 | 2017-12-29 | |
US62/611,979 | 2017-12-29 | ||
PCT/US2018/056807 WO2019083856A1 (en) | 2017-10-23 | 2018-10-20 | METHODS AND SYSTEMS FOR PROTEIN IDENTIFICATION |
USPCT/US2018/056807 | 2018-10-20 | ||
PCT/US2018/067985 WO2019133892A1 (en) | 2017-12-29 | 2018-12-28 | Decoding approaches for protein identification |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024039635A Division JP2024075638A (ja) | 2017-12-29 | 2024-03-14 | タンパク質同定のためのデコーディングアプローチ方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021508885A true JP2021508885A (ja) | 2021-03-11 |
JP7458678B2 JP7458678B2 (ja) | 2024-04-01 |
Family
ID=67068145
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020536280A Active JP7458678B2 (ja) | 2017-12-29 | 2018-12-28 | タンパク質同定のためのデコーディングアプローチ方法 |
JP2024039635A Pending JP2024075638A (ja) | 2017-12-29 | 2024-03-14 | タンパク質同定のためのデコーディングアプローチ方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024039635A Pending JP2024075638A (ja) | 2017-12-29 | 2024-03-14 | タンパク質同定のためのデコーディングアプローチ方法 |
Country Status (11)
Country | Link |
---|---|
US (5) | US11545234B2 (ja) |
EP (1) | EP3735259A4 (ja) |
JP (2) | JP7458678B2 (ja) |
KR (1) | KR20200105497A (ja) |
CN (1) | CN111788633A (ja) |
AU (2) | AU2018395430B2 (ja) |
BR (1) | BR112020013252A2 (ja) |
CA (1) | CA3086915A1 (ja) |
IL (1) | IL275670A (ja) |
MX (1) | MX2020006803A (ja) |
WO (1) | WO2019133892A1 (ja) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2018013341A (es) | 2016-05-02 | 2019-09-18 | Encodia Inc | Analisis de macromoleculas que emplea la codificacion de acido nucleico. |
JP2020514746A (ja) | 2016-12-01 | 2020-05-21 | ノーティラス バイオテクノロジー インコーポレイテッド | タンパク質をアッセイする方法 |
US11721412B2 (en) | 2017-10-23 | 2023-08-08 | Nautilus Subsidiary, Inc. | Methods for identifying a protein in a sample of unknown proteins |
WO2019083856A1 (en) * | 2017-10-23 | 2019-05-02 | Ignite Biosciences, Inc. | METHODS AND SYSTEMS FOR PROTEIN IDENTIFICATION |
JP7390027B2 (ja) | 2017-10-31 | 2023-12-01 | エンコディア, インコーポレイテッド | 核酸エンコーディングおよび/または標識を使用する解析のためのキット |
KR20200105497A (ko) | 2017-12-29 | 2020-09-07 | 노틸러스 바이오테크놀로지, 인크. | 단백질 식별을 위한 디코딩 접근법 |
GB2595583A (en) | 2018-11-07 | 2021-12-01 | Seer Inc | Compositions, methods and systems for protein corona analysis and uses thereof |
AU2020247907A1 (en) | 2019-03-26 | 2021-10-28 | Seer, Inc. | Compositions, methods and systems for protein corona analysis from biofluids and uses thereof |
JP2022530966A (ja) | 2019-04-30 | 2022-07-05 | エンコディア, インコーポレイテッド | 分析物を調製するための方法および関連キット |
EP4073263A4 (en) | 2020-01-07 | 2023-11-08 | Encodia, Inc. | METHODS FOR FORMING A STABLE COMPLEX AND ASSOCIATED KITS |
EP4204580A2 (en) | 2020-08-25 | 2023-07-05 | Seer, Inc. | Compositions and methods for assaying proteins and nucleic acids |
US11692217B2 (en) | 2020-11-11 | 2023-07-04 | Nautilus Subsidiary, Inc. | Affinity reagents having enhanced binding and detection characteristics |
CN116848266A (zh) * | 2020-12-15 | 2023-10-03 | 宽腾矽公司 | 超灵敏生物传感器方法 |
US20220214350A1 (en) * | 2021-01-05 | 2022-07-07 | Encodia, Inc. | Methods for stable complex formation and related kits |
EP4360097A1 (en) | 2021-06-24 | 2024-05-01 | Nautilus Subsidiary, Inc. | Methods and systems for assay refinement |
AU2022341171A1 (en) | 2021-09-09 | 2024-02-22 | Nautilus Subsidiary, Inc. | Characterization and localization of protein modifications |
CN114034755B (zh) * | 2021-10-13 | 2024-01-12 | 郑州航空工业管理学院 | 一种基于发动机气路静电信号的异常颗粒物检测方法 |
US20230360732A1 (en) * | 2022-04-25 | 2023-11-09 | Nautilus Subsidiary, Inc. | Systems and methods for assessing and improving the quality of multiplex molecular assays |
WO2024058967A1 (en) | 2022-09-13 | 2024-03-21 | Nautilus Subsidiary, Inc. | Systems and methods of validating new affinity reagents |
US20240183858A1 (en) | 2022-11-15 | 2024-06-06 | Nautilus Subsidiary, Inc. | Standard polypeptides |
WO2024124073A1 (en) | 2022-12-09 | 2024-06-13 | Nautilus Subsidiary, Inc. | A method comprising performing on a single-analyte array at least 50 cycles of a process |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1047107A2 (en) * | 1999-04-06 | 2000-10-25 | Micromass Limited | Improved methods of identifying peptides and protein by mass spectrometry |
US20030054408A1 (en) * | 2001-04-20 | 2003-03-20 | Ramamoorthi Ravi | Methods and systems for identifying proteins |
JP2005504263A (ja) * | 2001-02-01 | 2005-02-10 | シファーゲン バイオシステムズ, インコーポレイテッド | タンデム質量分析によるタンパク質同定、特徴付けおよび配列決定のための改良された方法 |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5143854A (en) | 1989-06-07 | 1992-09-01 | Affymax Technologies N.V. | Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof |
US5733729A (en) * | 1995-09-14 | 1998-03-31 | Affymetrix, Inc. | Computer-aided probability base calling for arrays of nucleic acid probes on chips |
US6762056B1 (en) * | 1997-11-12 | 2004-07-13 | Protiveris, Inc. | Rapid method for determining potential binding sites of a protein |
WO2000073787A1 (en) * | 1999-05-27 | 2000-12-07 | Rockefeller University | An expert system for protein identification using mass spectrometric information combined with database searching |
WO2002072613A1 (en) | 2001-03-10 | 2002-09-19 | Kent Ridge Digital Labs | System and method for systematic prediction of ligand/receptor activity |
AU2003231980A1 (en) * | 2002-03-29 | 2003-10-13 | Buck Institute | Identification of apoptotic peptides and methods of use thereof |
JP4584828B2 (ja) | 2002-10-15 | 2010-11-24 | アブメトリックス, インコーポレイテッド | 短いエピトープに対して向けられる複数組のディジタル抗体、およびその使用 |
US7593817B2 (en) * | 2003-12-16 | 2009-09-22 | Thermo Finnigan Llc | Calculating confidence levels for peptide and protein identification |
CN101124581A (zh) * | 2005-03-03 | 2008-02-13 | 伊利诺斯大学理事会 | 使用新的数据库检索模式鉴别和鉴定蛋白质 |
JP5127718B2 (ja) | 2005-10-29 | 2013-01-23 | バイエル・テクノロジー・サービシズ・ゲゼルシヤフト・ミツト・ベシユレンクテル・ハフツング | 複雑な組成を有する生物学的起源のサンプル中の1種若しくはそれ以上の被検体の測定方法およびその使用 |
US20070218503A1 (en) * | 2006-02-13 | 2007-09-20 | Mitra Robi D | Methods of polypeptide identification, and compositions therefor |
EP1996942A1 (en) | 2006-03-10 | 2008-12-03 | Tethys Bioscience, Inc. | Multiplex protein fractionation |
DE102006015001A1 (de) * | 2006-03-31 | 2007-10-11 | NMI Naturwissenschaftliches und Medizinisches Institut an der Universität Tübingen | Verfahren zum Nachweis und/oder zur Anreicherung von Analytproteinen und/oder Analytpeptiden aus einer komplexen Proteinmischung |
US8415102B2 (en) * | 2007-04-10 | 2013-04-09 | Nanostring Technologies, Inc. | Methods and computer systems for identifying target-specific sequences for use in nanoreporters |
US9354236B2 (en) * | 2009-07-01 | 2016-05-31 | Consejo Superior De Investigaciones Cientificas | Method for identifying peptides and proteins from mass spectrometry data |
US9410965B2 (en) * | 2009-09-17 | 2016-08-09 | Battelle Energy Alliance, Llc | Identification of discriminant proteins through antibody profiling, methods and apparatus for identifying an individual |
BR112012017483A2 (pt) * | 2010-01-14 | 2019-09-24 | Haplomics Inc | previsão e redução de aloimunogenicidade de terapêuticos de proteína |
US20130053541A1 (en) * | 2011-03-11 | 2013-02-28 | Lynntech, Inc. | Methods for discovering molecules that bind to proteins |
CN102495127B (zh) * | 2011-11-11 | 2013-09-04 | 暨南大学 | 一种基于概率统计模型的蛋白质二级质谱鉴定方法 |
US10829816B2 (en) | 2012-11-19 | 2020-11-10 | Apton Biosystems, Inc. | Methods of analyte detection |
EP4012716A1 (en) | 2012-11-19 | 2022-06-15 | Apton Biosystems, Inc. | Digital analysis of molecular analytes using single molecule detection |
CN103336914B (zh) * | 2013-05-31 | 2016-05-25 | 中国人民解放军国防科学技术大学 | 一种提取荟萃生物标志物的方法及装置 |
CN104076115B (zh) * | 2014-06-26 | 2015-12-30 | 云南民族大学 | 基于峰强度识别能力的蛋白质二级质谱鉴定方法 |
ES2949063T3 (es) * | 2015-05-18 | 2023-09-25 | Univ California | Sistemas y métodos para predecir la glucosilación de proteínas |
JP2020514746A (ja) * | 2016-12-01 | 2020-05-21 | ノーティラス バイオテクノロジー インコーポレイテッド | タンパク質をアッセイする方法 |
JP7295092B2 (ja) | 2017-08-18 | 2023-06-20 | ノーティラス・サブシディアリー・インコーポレイテッド | 結合試薬を選択する方法 |
WO2019083856A1 (en) * | 2017-10-23 | 2019-05-02 | Ignite Biosciences, Inc. | METHODS AND SYSTEMS FOR PROTEIN IDENTIFICATION |
US11721412B2 (en) | 2017-10-23 | 2023-08-08 | Nautilus Subsidiary, Inc. | Methods for identifying a protein in a sample of unknown proteins |
JP7253833B2 (ja) | 2017-10-31 | 2023-04-07 | エンコディア, インコーポレイテッド | 核酸エンコーディングおよび/または標識を使用する方法およびキット |
KR20200105497A (ko) | 2017-12-29 | 2020-09-07 | 노틸러스 바이오테크놀로지, 인크. | 단백질 식별을 위한 디코딩 접근법 |
WO2021003470A1 (en) | 2019-07-03 | 2021-01-07 | Nautilus Biotechnology, Inc. | Decoding approaches for protein and peptide identification |
-
2018
- 2018-12-28 KR KR1020207021979A patent/KR20200105497A/ko unknown
- 2018-12-28 CN CN201880090531.0A patent/CN111788633A/zh active Pending
- 2018-12-28 MX MX2020006803A patent/MX2020006803A/es unknown
- 2018-12-28 BR BR112020013252-7A patent/BR112020013252A2/pt unknown
- 2018-12-28 WO PCT/US2018/067985 patent/WO2019133892A1/en unknown
- 2018-12-28 JP JP2020536280A patent/JP7458678B2/ja active Active
- 2018-12-28 EP EP18896481.1A patent/EP3735259A4/en active Pending
- 2018-12-28 CA CA3086915A patent/CA3086915A1/en active Pending
- 2018-12-28 AU AU2018395430A patent/AU2018395430B2/en active Active
-
2020
- 2020-06-25 IL IL275670A patent/IL275670A/en unknown
-
2021
- 2021-04-02 US US17/221,431 patent/US11545234B2/en active Active
- 2021-04-02 US US17/221,405 patent/US20220068431A1/en not_active Abandoned
- 2021-07-28 US US17/387,665 patent/US11282585B2/en active Active
- 2021-07-28 US US17/387,670 patent/US11282586B2/en active Active
-
2022
- 2022-11-30 US US18/060,526 patent/US20230117795A1/en active Pending
-
2024
- 2024-03-14 JP JP2024039635A patent/JP2024075638A/ja active Pending
- 2024-04-23 AU AU2024202653A patent/AU2024202653A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1047107A2 (en) * | 1999-04-06 | 2000-10-25 | Micromass Limited | Improved methods of identifying peptides and protein by mass spectrometry |
JP2005504263A (ja) * | 2001-02-01 | 2005-02-10 | シファーゲン バイオシステムズ, インコーポレイテッド | タンデム質量分析によるタンパク質同定、特徴付けおよび配列決定のための改良された方法 |
US20030054408A1 (en) * | 2001-04-20 | 2003-03-20 | Ramamoorthi Ravi | Methods and systems for identifying proteins |
Also Published As
Publication number | Publication date |
---|---|
WO2019133892A1 (en) | 2019-07-04 |
JP2024075638A (ja) | 2024-06-04 |
AU2018395430B2 (en) | 2024-05-23 |
US11545234B2 (en) | 2023-01-03 |
BR112020013252A2 (pt) | 2020-12-01 |
JP7458678B2 (ja) | 2024-04-01 |
CA3086915A1 (en) | 2019-07-04 |
CN111788633A (zh) | 2020-10-16 |
US20230117795A1 (en) | 2023-04-20 |
US20220068431A1 (en) | 2022-03-03 |
EP3735259A4 (en) | 2021-09-08 |
US11282585B2 (en) | 2022-03-22 |
US11282586B2 (en) | 2022-03-22 |
US20210358562A1 (en) | 2021-11-18 |
AU2018395430A1 (en) | 2020-07-23 |
KR20200105497A (ko) | 2020-09-07 |
MX2020006803A (es) | 2020-10-28 |
IL275670A (en) | 2020-08-31 |
US20210304839A1 (en) | 2021-09-30 |
EP3735259A1 (en) | 2020-11-11 |
US20210358563A1 (en) | 2021-11-18 |
AU2024202653A1 (en) | 2024-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7458678B2 (ja) | タンパク質同定のためのデコーディングアプローチ方法 | |
US11721412B2 (en) | Methods for identifying a protein in a sample of unknown proteins | |
JP7434161B2 (ja) | タンパク質同定のための方法およびシステム | |
US11549942B2 (en) | Methods of assaying proteins | |
US11970693B2 (en) | Methods of selecting binding reagents | |
WO2021003470A1 (en) | Decoding approaches for protein and peptide identification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20210118 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20210305 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20210305 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230531 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240314 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7458678 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |