JP6952351B2 - 集団座標バイアシングによりミスフォールディングタンパク質エピトープを予測するためのシステムおよび方法 - Google Patents
集団座標バイアシングによりミスフォールディングタンパク質エピトープを予測するためのシステムおよび方法 Download PDFInfo
- Publication number
- JP6952351B2 JP6952351B2 JP2018522708A JP2018522708A JP6952351B2 JP 6952351 B2 JP6952351 B2 JP 6952351B2 JP 2018522708 A JP2018522708 A JP 2018522708A JP 2018522708 A JP2018522708 A JP 2018522708A JP 6952351 B2 JP6952351 B2 JP 6952351B2
- Authority
- JP
- Japan
- Prior art keywords
- protein model
- protein
- group
- residues
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 102000004169 proteins and genes Human genes 0.000 title claims description 307
- 108090000623 proteins and genes Proteins 0.000 title claims description 307
- 238000000034 method Methods 0.000 title claims description 208
- 238000004088 simulation Methods 0.000 claims description 113
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 61
- 238000000329 molecular dynamics simulation Methods 0.000 claims description 34
- 125000004429 atom Chemical group 0.000 claims description 29
- 239000011159 matrix material Substances 0.000 claims description 17
- 238000005381 potential energy Methods 0.000 claims description 17
- 230000003993 interaction Effects 0.000 claims description 16
- 229910052739 hydrogen Inorganic materials 0.000 claims description 15
- 239000001257 hydrogen Substances 0.000 claims description 15
- 238000011067 equilibration Methods 0.000 claims description 14
- 230000002829 reductive effect Effects 0.000 claims description 11
- 239000002904 solvent Substances 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 7
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 6
- 238000009825 accumulation Methods 0.000 claims description 3
- 229910052799 carbon Inorganic materials 0.000 claims description 3
- 239000002245 particle Substances 0.000 claims description 3
- 240000005499 Sasa Species 0.000 claims 7
- 238000011156 evaluation Methods 0.000 claims 3
- 238000004590 computer program Methods 0.000 claims 1
- 229920001184 polypeptide Polymers 0.000 claims 1
- 230000001131 transforming effect Effects 0.000 claims 1
- 238000005303 weighing Methods 0.000 claims 1
- 235000018102 proteins Nutrition 0.000 description 172
- 230000006870 function Effects 0.000 description 59
- 239000000178 monomer Substances 0.000 description 27
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 20
- 208000035475 disorder Diseases 0.000 description 17
- 230000000670 limiting effect Effects 0.000 description 15
- 230000001965 increasing effect Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 8
- 239000000835 fiber Substances 0.000 description 8
- 210000004897 n-terminal region Anatomy 0.000 description 8
- 206010028980 Neoplasm Diseases 0.000 description 7
- 150000001413 amino acids Chemical class 0.000 description 7
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- 235000001014 amino acid Nutrition 0.000 description 6
- 108010064397 amyloid beta-protein (1-40) Proteins 0.000 description 6
- 108010064539 amyloid beta-protein (1-42) Proteins 0.000 description 6
- 201000011510 cancer Diseases 0.000 description 6
- 238000013500 data storage Methods 0.000 description 6
- 230000007423 decrease Effects 0.000 description 6
- 208000024827 Alzheimer disease Diseases 0.000 description 5
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 5
- 241000233855 Orchidaceae Species 0.000 description 5
- 102000008221 Superoxide Dismutase-1 Human genes 0.000 description 5
- 108010021188 Superoxide Dismutase-1 Proteins 0.000 description 5
- 230000002776 aggregation Effects 0.000 description 5
- 238000004220 aggregation Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 4
- 238000005513 bias potential Methods 0.000 description 4
- 125000004432 carbon atom Chemical group C* 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000002708 enhancing effect Effects 0.000 description 4
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000000087 stabilizing effect Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 3
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 3
- 230000001747 exhibiting effect Effects 0.000 description 3
- 229910052738 indium Inorganic materials 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 2
- 108010029660 Intrinsically Disordered Proteins Proteins 0.000 description 2
- 102000029797 Prion Human genes 0.000 description 2
- 108091000054 Prion Proteins 0.000 description 2
- 108010026552 Proteome Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 101710172711 Structural protein Proteins 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 238000009175 antibody therapy Methods 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000003278 mimic effect Effects 0.000 description 2
- 210000005170 neoplastic cell Anatomy 0.000 description 2
- 230000004770 neurodegeneration Effects 0.000 description 2
- 208000015122 neurodegenerative disease Diseases 0.000 description 2
- 238000010899 nucleation Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000006432 protein unfolding Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000010900 secondary nucleation Methods 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 229940124597 therapeutic agent Drugs 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 208000036849 ATTRV30M amyloidosis Diseases 0.000 description 1
- 206010067484 Adverse reaction Diseases 0.000 description 1
- 102100026882 Alpha-synuclein Human genes 0.000 description 1
- 108010090849 Amyloid beta-Peptides Proteins 0.000 description 1
- 102000013455 Amyloid beta-Peptides Human genes 0.000 description 1
- 108010048112 Amyloidogenic Proteins Proteins 0.000 description 1
- 102000009091 Amyloidogenic Proteins Human genes 0.000 description 1
- 206010059245 Angiopathy Diseases 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 102000000844 Cell Surface Receptors Human genes 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- 102000001189 Cyclic Peptides Human genes 0.000 description 1
- 108010069514 Cyclic Peptides Proteins 0.000 description 1
- 102000009058 Death Domain Receptors Human genes 0.000 description 1
- 108010049207 Death Domain Receptors Proteins 0.000 description 1
- 206010012289 Dementia Diseases 0.000 description 1
- 208000034846 Familial Amyloid Neuropathies Diseases 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 238000012614 Monte-Carlo sampling Methods 0.000 description 1
- 206010028116 Mucosal inflammation Diseases 0.000 description 1
- 201000010927 Mucositis Diseases 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 206010034016 Paronychia Diseases 0.000 description 1
- 241000029132 Paronychia Species 0.000 description 1
- 108010071690 Prealbumin Proteins 0.000 description 1
- 206010037888 Rash pustular Diseases 0.000 description 1
- 102000019197 Superoxide Dismutase Human genes 0.000 description 1
- 108010012715 Superoxide dismutase Proteins 0.000 description 1
- 102000009190 Transthyretin Human genes 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 230000006838 adverse reaction Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 108090000185 alpha-Synuclein Proteins 0.000 description 1
- 230000003942 amyloidogenic effect Effects 0.000 description 1
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 229940034982 antineoplastic agent Drugs 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 108010081355 beta 2-Microglobulin Proteins 0.000 description 1
- 102000015736 beta 2-Microglobulin Human genes 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 230000037011 constitutive activity Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 150000001945 cysteines Chemical class 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 229940121647 egfr inhibitor Drugs 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008472 epithelial growth Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 230000006749 inflammatory damage Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- COCAUCFPFHUGAA-MGNBDDOMSA-N n-[3-[(1s,7s)-5-amino-4-thia-6-azabicyclo[5.1.0]oct-5-en-7-yl]-4-fluorophenyl]-5-chloropyridine-2-carboxamide Chemical compound C=1C=C(F)C([C@@]23N=C(SCC[C@@H]2C3)N)=CC=1NC(=O)C1=CC=C(Cl)C=N1 COCAUCFPFHUGAA-MGNBDDOMSA-N 0.000 description 1
- 210000002241 neurite Anatomy 0.000 description 1
- 230000000626 neurodegenerative effect Effects 0.000 description 1
- 230000006911 nucleation Effects 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000065 osmolyte Effects 0.000 description 1
- 230000004792 oxidative damage Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000003334 potential effect Effects 0.000 description 1
- 230000009219 proapoptotic pathway Effects 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 230000026447 protein localization Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 239000003642 reactive oxygen metabolite Substances 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000000405 serological effect Effects 0.000 description 1
- 206010040882 skin lesion Diseases 0.000 description 1
- 231100000444 skin lesion Toxicity 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 102000013498 tau Proteins Human genes 0.000 description 1
- 108010026424 tau Proteins Proteins 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 108020005087 unfolded proteins Proteins 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/20—Protein or domain folding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Physiology (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Peptides Or Proteins (AREA)
Description
本出願は、
・2015年11月9日出願の米国特許出願第62/253044号;
・2016年2月1日出願の同第62/289893号;
・2016年3月17日出願の同第62/309765号;
・2016年5月4日出願の同第62/331925号;
・2016年6月20日出願の同第62/352346号;
・2016年7月18日出願の同第62/363566号;
・2016年7月22日出願の同第62/365634号;および
・2016年9月12日出願の同第62/393615号;
の優先権を主張するものであり、これらの出願は全て、参照により本明細書に組み入れられる。
本発明は、ミスフォールディングタンパク質エピトープ、より正確にはアンフォールディング特異性(unfolding−specific)タンパク質エピトープの予測に関する。アンフォールディング特異性エピトープは、タンパク質がその構造の少なくとも一部を損失している場合に生じ得る。ミスフォールディングタンパク質は、そのようなエピトープを提示し得るが、適切にフォールディングしたタンパク質は、それを提示しないであろう。特別な実施形態は、タンパク質(またはペプチド凝集体)に集団座標バイアス(例えば、全体的に課された集団座標バイアス)を課して該タンパク質(またはペプチド凝集体)を強制的にアンフォールディングさせる、分子動力学ベースのシミュレーションを実施すること;およびその後、該シミュレーションから得られた、部分的に構造化されていないタンパク質(またはペプチド凝集体)の中のアンフォールディング領域の検出に基づき、アンフォールディングタンパク質エピトープを予測すること、を含む、ミスフォールディングタンパク質エピトープを予測するための方法を提供する。
以下の記載全体を通して、当業者へより完全な理解を提供するために、具体的詳細が示されている。しかし、本開示を不要に妨害することのないよう、周知の要素は詳細に図示または記載されていない場合がある。したがって、該記載および図面は、制限というよりむしろ例示の意味で解釈されなければならない。
表1:図6A〜6Dのファイアプロットに示され、Q=0.71のバイアスに対応する構造の予測されたエピトープ。それらは、最長から最短までのエピトープ予測、そしてその後、同じ長さのエピトープについてN−末端からC−末端まで並べられている。
文脈が他に明確に要求しない限り、本明細書および特許請求の範囲全体を通して、異なる方向で、そして/または空間および/もしくは角度により互いに相殺されて、
・「含む」、「含むこと」などは、排他的または徹底的意味の逆として包含的意味;即ち、「非限定的に包含する」の意味で解釈されなければならない;
・「連結された」、「結合された」またはその任意の変形例は、2つ以上の要素の間の直接的または間接的のいずれかの任意の連結または結合を意味し;要素間の結合または連結が、物理的、論理的またはその組み合わせであり得;一体として形成された要素は、連結または結合されていると見なされ得る;
・本明細書を記載するのに用いられる場合の、「本明細書に」、「先に」、「以下に」および類似の趣旨の言語は、本明細書の任意の特定の部分ではなく、本明細書を全体として参照している;
・2つ以上の事柄の列挙で参照される「または」は、言語の以下の解釈の全てを包含する:リストにある事項のいずれか、リストにある事項の全て、およびリストにある事項の任意の組み合わせ;
・単数の形態「a」、「an」および「the」は、任意の適当な複数形態の意味も包含する。
・幾つかの実施形態において、検討されているタンパク質は、ネイティブコンタクトを用いるのではなく溶媒露出表面積(SASA)を用いることにより、ネイティブ構造を損失するようにバイアスがかけられ得る。
・幾つかの実施形態において、バイアシングの結果を分析すること(例えば、ブロック50)は、力学的作用の最も顕著な増加を有する領域を測定することを含み得、バイアシングされたら、表面積(SASA)の増加または初期コンタクトの損失に加えて、またはその代りに、どの領域が構造的に破壊されて、非ネイティブ相互作用をより受け易いか、も示し得る。力学的作用増加のそのような尺度の例は、アミノ酸の根平均二乗揺らぎ(RMSF)を含み得る。
・幾つかの実施形態は、バイアシングによる構造変化の代理として作用し得るバイアシングによる特定のアミノ酸配列のポテンシャルエネルギーの損失の直接的なコンピュータ測定を含み得る。
・幾つかの実施形態は、バイアシングのための集団座標として、または続いての局所アンフォールディングの印(例えば、ネイティブ構造の局所損失)として作用し得る、ネイティブ構造のバックボーン水素結合の中からのバックボーン水素結合損失の尺度を含み得る。
・先に記載された実施形態は、バイアスの適用によるタンパク質構造の変化をシミュレートするための分子動力学エンジンの使用を行っている。幾つかの実施形態において、モンテカルロ力学エンジンが、分子動力学エンジンに加えて、またはその代わりに用いられ得る。分子動力学エンジンおよびモンテカルロ力学エンジンのいずれか、または両方は、本明細書ではタンパク質または凝集フィブリル構造のためのコンホメーションサンプリングエンジン(conformational sampling engine)と称され得る。
・幾つかの実施形態において、検討されているタンパク質は、ネイティブSASAに比較したSASA、またはネイティブコンタクトのうちのコンタクト数など、オーダーパラメータを基にしたバイアスポテンシャルを適用することに加えて、またはその代わりにメタダイナミクスを利用することによりネイティブ構造を損失するようにバイアスがかけられ得る。
%ΔSASAの測定/記録
各ランについて、1<ラン<Nランであれば、%Nランは、典型的には10に設定される
各鎖について、1<鎖<N鎖であれば、%シミュレートされたフィブリルにおける鎖の数
各resで、1<r<Nresであれば、
<ΔSASA>(res,ラン,鎖)を計算し、%各鎖、各ランにおける各残基のresについて、ΔSASAは、溶媒露出表面積の変化であり、<...>は、システムの構成のスナップショット全体の平衡平均を示す。典型的な100nsシミュレーションでの20psごとのスナップショットが、100ns/20ps=5000スナップショットを与える。この量は、本明細書では以降、平均化された平衡と理解され、そのため<ΔSASA>≡ΔSASAとなる。
resについて終了
鎖について終了
ΔSASAを各ランについて別のデータファイルに書き込む;%フォーマットは、2つの列であり、最初の列=resであり、2番目の列はΔSASAである。ファイルにおける鎖J、残基kの場所は、Nres*j+kの行により与えられる。%各ファイルは、複数の鎖を含む
ランについて終了 %ΔSASAの決定/記録を終了
%全てのランからの全てのデータファイルが、インプットのために読み込まれた後、ΔSASAは、サイズの3D長方形マトリックスである(Nラン×N鎖×Nres)
%各ウインドウ位置wp、各ウインドウサイズwsについてのΔSASA値からなるファイアプロットのために、ウインドウ表示の新しいマトリックスDSASAを定義する。
ウインドウ表示されたDSASA(wp,ws)=全てのwp、wsで0であり、%wpが、1<wp<Nresのウインドウ位置であれば(フォーループ値は、これらの位置のサブセットについて割り付けられる)、wsは、1<ws<wsmax(以下に定義)のウインドウサイズである。
%ウインドウ表示されたDSASAのサイズは、Nres×wsmaxであり;以下のループは、1:Nresからランせず;以下のフォーループの外側の要素は、決して零から変化しない。
%最大ウインドウサイズであるwsmax、典型的には約12アミノ酸/残基を推測する。最大ウインドウサイズは、その中に0の「ヒット」を有するであろう。即ち、以下に定義された通り零の成功。これは、本発明者らが生成されたファイアプロット内のピークを超えるウインドウサイズで終了していることのみを意味する。
fmin=成功の最小割合の設定。%これは、幾つかのランに局在化されたアンフォールディングを確率論的に偶然に示させないようにとらえられる。本発明者らは、典型的にはNラン=10ランを実装するため、本発明者らは、これを0.9であるととらえ、つまり10のランのうち少なくとも9が、局在化されたアンフォールディングの「ヒット」をもたらさなければならず、局在化されたアンフォールディングの「ヒット」が、ウインドウにおける全ての残基でSASA露出を増加していることを意味する。
%「ファイアプロット」のデータ構造を組み立てる
%以下のループへのインプットは、ΔSASA(res,ラン,鎖)の(Nres×Nラン×N鎖)サイズのアレイである。
ウインドウサイズws=1:wsmaxについて %即ちウインドウサイズがwsmaxになるまで増加し;wsmaxが全鎖長Nresになり得るか、または表面積の増加を示す隣接する鎖のいずれかよりも長いと予測されるウインドウサイズであり得る(実際のwsmaxは、12に設定され得る)
%以下に定義されたビルド_ファイアプロット関数を実装する ウインドウの中央位置=wp、ウインドウ表示されたDSASA(:,ws)=ビルドファイアプロット関数(ΔSASA(res,ラン,鎖),ws,fmin);%ビルト_ファイアプロット関数は、Nres長のベクトルを返し、2Dアレイをこのベクトルで満たす
ウインドウサイズについて終了
ウインドウ表示されたDSASA(wp,ws)をファイルに書き込む %各タンパク質またはフィブリルモデルについてファイルに書き込まれたNres×wsmaxのアレイ
%先のループからのアウトプットは、ネイティブタンパク質またはフィブリルモデルについてのウインドウ表示されたDSASA(wp,ws)、Nres×wsmaxサイズのアレイである。
%先の疑似コードにおけるビルド_ファイアプロット関数のコール:
ビルド_ファイアプロット関数を開始する %先のループにおける関数(ΔSASA(res,ラン,鎖),ws,fmin)を以下の通り定義する:
ウインドウ表示されたDSASA(:,ws)=0;%Nres零のベクターにウインドウ表示されたアウトプットDSASAを初期化する
カウント(:,:)=0;%これはfmin規準をチェックするためにビルド_ファイアプロット関数内のみで用いられた1’sおよび0’sサイズのNres×Nランのブールマトリックスである
ラン=1:Nランについて %図4Bの実施例において、Nラン=3およびN鎖=3
ウインドウの中心位置wp=wpmin:wpmaxについて %(ここでwpmin=円形(ws/2)は、所与のウインドウサイズwsについての初期ウインドウ位置である。例えば、もしwsが7であれば、wpminは、3.5の直後の整数として定義される4であるが、もしws=6であれば、wpmin=3;wpmax=Nres−(ws−wpmin))
鎖=1:N鎖について
もし((wp,ws)により定義されたウインドウの全てのresについて、ΔSASA(res、ラン、鎖)>0)、
%図4Bにおいて、この「もし」の提示が(ラン,鎖)=(1,2)、(2,1)、(3,2)、および(3,3)について真実であれば、
ウインドウ表示されたDSASA(wp,ws)=ΔSASA(res、ラン、鎖)のサイズwsのウインドウにおけるresの総和;
カウント(wp,ws)=1;
もしΔSASA>0であれば終了
鎖について終了
wpについて終了 %ここで任意のヒットについて1つの所与のランにおける全ての位置で全ての鎖をチェックした
ランについて終了 %ウインドウ表示されたDSASA(wp,ws)を、ここで鎖全体で、そしてラン全体で総和した;即ち、図4Bにおいて、4つのパネルからのSASA,(ラン,鎖)=(1,2)、(2,1)、(3,2)、および(3,3)を全て総和した。図4Bにおいて、少なくとも1つの鎖について各ランにヒットが存在し、そのため例示されたウインドウ位置でのカウント(wp,ラン)は[111]のベクターである。
%対応するDSASA(wp,ws0)=0を設定しない場合、ランの数がfminの割合要件(カウント=1が9/10のランで出現する)を満たすか否かをチェックする:
開始_要素=フロア((1−fmin)*Nラン)+1;%エピトープが出現しなければならないランの数を設定するアレイ開始要素。fmin=0.9およびNラン=10について、ここでは開始_要素=2であり、エピトープは、10のうち2の要素に出現しなければならない。
wp=1:Nresについて
カウントソート=ソート(カウント(wp,:))%カウント(wp,:)は、1’sおよび0’sのNランの長さのベクター、例えば[1100110111]のベクターであり;ソート(カウント(wp,:))は、これを[0001111111]に転換し;0は、エピトープ予測なしを示し(即ち、区分(wp,ws)における全ての残基がSASAを増加させたわけではなく)、1は、エピトープが予測されることを示す(即ち、区分(wp,ws)における全ての残基がSASAを増加させた)
もし、(任意の(カウントソート(開始_要素:終了)==0)%(最初の(開始_要素−1)ラン状態をスキップする(本発明者らが開始_要素−1のランに予測を省略させることを意味する);カウントソートマトリックス(即ち、カウントソート(ss:終了))の残りの要素について、もし任意の要素が、0であれば(予測を省略するss−1以外のランが存在することを意味する)、本発明者らは、対応するウインドウ表示されたDSASA(wp,ws)=0を設定する:
ウインドウ表示されたDSASA(wp,ws)=0;%ウインドウ表示されたDSASAにおける零の要素は、そのマトリックスがその位置でエピトープを予測しないことを意味する。たとえこの時点でこのマトリックスにおいてSASAの非零の総和が存在したとしても、それがランの閾値基準を満たさなければ、その値は零にリセットされる。
「もし」を終了
wpについて終了
ウインドウ表示されたDSASA(wp,ws)を返す;%ウインドウ表示されたDSASA(:,ws0)を返す
ビルド_ファイアプロット関数を終了
%ファイアプロットデータ構造を利用して、候補エピトープを予測する
%インプット(上述から)は、ウインドウ表示されたDSASAの総和(wp,ws)、即ちファイアプロットのデータである。
ws=wmax−1:3について、%ウインドウサイズを最大値(例えば、図6Aのwsmax=11)から最小で3に減少させる。本発明者らは、ここでは3以上の長さのエピトープを検討する。これは、任意であり、4に減少させることができた。エピトープの長さが短い程、それがプロテオームにおいてより一般的に出現し、オフ・パスウェイターゲットに罹患している可能性がより高い。3の長さを取り入れると、タンパク質内で確定されたターゲットを提供するのに十分、エピトープを短くすることができるが、配列同一性およびコンホメーションに関してプロテオーム内で比較的独特にするのに十分に長くすることができる。
wp=1:Nresについて
もし(wpがヒットである)%即ち、ウインドウ位置wpについて0より大きなウインドウ表示されたDSASAの総和(wp,ws)の値が存在すれば、
エピトープ(wp,ws)を記録する %例えば、図6Aにおいて最初のヒットは(wp=26 ws=7)または位置26を中心とする長さ7のエピトープ:[23 24 25 26 27 28 29]に対応し;したがって残基23〜29は、表1の2M4Jについての最長のエピトープであり、DVGSNKGに対応する2M4Jについての図8内の最長の水平ボックスとして描画される
問題のエピトープ内に存在するサブエピトープ全てを除去する
%図6Aのファイアプロットにおいて、これは以下の座標における長方形を除去することに対応する:(26,7)を、
%その後、(25,6)および(26,6)(これらが、7の長さのエピトープ内の全て、即ち23〜28および24〜29であるサブエピトープを作成する)
%その後、(25,5)(26,5)(27,5)(これらもまた、7の長さのエピトープ内の全てであるサブエピトープを作成する)
%その後、(24,4)(25,4)(26,4)(27,4)
%その後、(24,3)(25,3)(26,3)(27,3)(28,3)
%その後、(23,2)(24,2)(25,2)(26,2)(27,2)(28,2)
%そして最後に(23,1)(24,1)(25,1)(26,1)(27,1)(28,1)(29,1)、を除去する
%対応する「切断された円錐(ablated cone)」を有するプロットは、図16において(A)から(B)への移行部にある。本発明者らは、長さ4のエピトープまで切断工程を続けるため、より多くのエピトープ、ことによるとオーバーラップしたものが、見出される
wpがヒットであれば、終了
wpについて終了
wsについて終了
%図6Aの2M4Jについて、最初の切断の後(本発明者らが託された次に大きなエピトープが(27,6)、またはエピトープ[25 26 27 28 29 30](最初のエピトープとオーバーラップした表1内の残基25〜30)である
%対応する円錐が図16で(B)から(C)への移行部において切断されていることが認められ得る
%本発明者らは、長さ3のエピトープまで(3を含む)、切断工程を反復する
%どの結果が、3以上の長さのエピトープ予測の組であるか
%これらのエピトープは、表1および図8に示される
Claims (18)
- タンパク質における1つまたは複数の候補エピトープのコンピュータベースの予測のための方法であって、
コンピュータシステム上にコンホメーションサンプリングエンジンを提供するステップ;
前記コンピュータシステムにおいて、前記コンホメーションサンプリングエンジンと共に使用するのに適したタンパク質のモデルを得るステップであって、得られたタンパク質モデルがネイティブ構造を含み、任意選択で、タンパク質のモデルを得ることは、タンパク質モデルのデータベースから前記タンパク質モデルを得ることを含んでもよい、ステップ;
前記コンピュータシステムにより、集団座標に基づくバイアシングポテンシャルを適用して前記タンパク質モデルにバイアスをかけるステップであって、前記バイアシングポテンシャルが前記コンホメーションサンプリングエンジンに強制的に順次、前記タンパク質モデルをネイティブ構造から最新構造へ少なくとも部分的にアンフォールディングさせ、前記バイアシングポテンシャルが、前記タンパク質モデルの少なくとも実質的部分に全体的に適用されて、前記タンパク質モデルの実質的部分の中でアンフォールディングが起こる場所に関して偏らない、ステップ;および
前記コンピュータシステムにより、前記最新構造を分析して、1つまたは複数の候補エピトープを同定するステップであって、前記1つまたは複数の候補エピトープが、局所的なアンフォールディングの印を呈する、ステップ、
を含む、方法。 - 前記タンパク質のモデルを得るステップが、前記タンパク質モデルのための第一の構造を得ることと、次いで、前記コンピュータシステムにより前記タンパク質モデルのための前記第一の構造を修飾して前記タンパク質モデルのためのネイティブ構造を作成することと、を含み、
任意選択で、
(A)前記タンパク質モデルのための前記第一の構造を修飾して前記タンパク質モデルのためのネイティブ構造を作成することは、前記コンピュータシステムにより前記タンパク質モデル上での平衡化シミュレーションを実施することを含んでもよく、前記平衡化シミュレーションは、前記第一の構造で開始して、前記第一の構造を変換して前記ネイティブ構造を作成し;任意選択で、前記タンパク質モデル上での平衡化シミュレーションを実施することは、前記第一の構造を有するタンパク質モデルを、一定の粒子数、一定圧力および一定温度のうちの1つまたは複数を特徴とするモデル環境に供することを含んでもよい;あるいは
(B)前記タンパク質モデルのための前記第一の構造を修飾して前記タンパク質モデルのためのネイティブ構造を作成することは、1つまたは複数の不足した残基を前記第一の構造に付加して前記ネイティブ構造を作成することを含んでもよく、前記ネイティブ構造は全長の一次配列に対応する、
請求項1に記載の方法。 - 前記集団座標に基づくバイアシングポテンシャルを適用して前記タンパク質モデルにバイアスをかけるステップが、前記コンピュータシステムにより、複数の時間ステップにわたり前記タンパク質モデル上で不連続時間シミュレーションを実施することを含み、前記不連続時間シミュレーションが、前記タンパク質モデルのためのネイティブ構造で開始して、前記複数の時間ステップのうちの各特定の時間ステップにおいて、前記特定の時間ステップについて前記タンパク質モデルの対応する最新構造を作成する、請求項1または2に記載の方法。
- 前記複数の時間ステップにわたり前記タンパク質モデル上で不連続時間シミュレーションを実施することが、前記コンホメーションサンプリングエンジンに前記タンパク質モデルにおける構造変化を強制的に起こさせることを含み、前記構造変化が、前記タンパク質モデルのための前記最新構造から決定された実際の集団座標を要求して目的の集団座標を前記複数の時間ステップにわたり追跡することにより決定され、
任意選択で、
(A)前記タンパク質のための前記最新構造から決定された実際の集団座標を要求して目的の集団座標を前記複数の時間ステップにわたり追跡することは、前記コンピュータシステムにより、ポテンシャルエネルギー関数に供された前記タンパク質モデルの自由エネルギーを最小化することを含んでもよく、前記ポテンシャルエネルギー関数は、少なくとも部分的に、前記タンパク質モデルの任意の構造のための前記実際の集団座標と前記目的の集団座標との間の差異を表す計量に依存する;あるいは
(B)前記タンパク質のための前記最新構造から決定された実際の集団座標を要求して目的の集団座標を前記複数の時間ステップにわたり追跡することは、前記コンピュータシステムによりポテンシャルエネルギー関数を最小化することを含んでもよく、前記ポテンシャルエネルギー関数は、少なくとも部分的に、前記タンパク質モデルの任意の構造のための前記実際の集団座標と前記目的の集団座標との間の差異を表す計量に依存し、好ましくは、前記ポテンシャルエネルギー関数を最小化することは、前記複数の時間ステップのうちの各特定の時間ステップで前記ポテンシャルエネルギー関数を最小化することを含む、
請求項3に記載の方法。 - 前記ポテンシャルエネルギー関数が、式:
任意選択で、前記ポテンシャルエネルギー関数は、前記タンパク質モデルに内在する、あるいは前記タンパク質モデルに関連する、分子動力学的力にも依存してもよく、および/または前記ポテンシャルエネルギー関数を最小化することは、前記タンパク質モデルに内在する、あるいは前記タンパク質モデルに関連する、分子動力学的力に基づいて課された制限に供されたポテンシャルエネルギー関数を最小化することを含んでもよい、
請求項4に記載の方法。 - 前記不連続時間シミュレーションの複数の時間ステップにわたり、前記目的の集団座標が、前記ネイティブ構造に関連する前記実際の集団座標のものと等しい初期の目的の集団座標の値で開始して、最初のやや多数(sub−plurality)の時間ステップで最後の目的の集団座標の値まで変動した後、第二の複数の時間ステップの間、前記最後の目的の集団座標の値で静止し、
任意選択で、前記不連続時間シミュレーションの前記複数の時間ステップにわたり、前記目的の集団座標は、経時的に滑らかに変動してもよい;あるいは前記目的の集団座標は、前記初期の目的の集団座標の値と前記最後の目的の集団座標の値の間で経時的に一定速度で変動してもよい、
請求項4または5に記載の方法。 - 前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が、前記タンパク質モデルの実質的部分のネイティブ構造に対する前記タンパク質モデルの前記実質的部分の最新構造の全体的なアンフォールディングを示す計量を含み、
任意選択で、
(A)前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造における重い原子の間のコンタクトのうちの、前記タンパク質モデルの前記実質的部分の前記最新構造における重い原子の間のコンタクトの数に基づく、あるいは
(B)前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造における重い原子の間のコンタクトのうちの、前記タンパク質モデルの前記実質的部分の前記最新構造における重い原子の間のコンタクトの数に近似するコンタクト関数に基づく、あるいは
(C)前記タンパク質モデルの前記実質的部分の前記ネイティブ構造におけるコンタクトのうちの各コンタクトについて、前記コンタクト関数が、式:
(D)前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造における重い原子の間の距離に対する、前記タンパク質モデルの前記実質的部分の前記最新構造における重い原子の間の距離に基づく、あるいは
(E)前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造の根平均二乗構造偏差(RMSD)に対する、前記タンパク質モデルの前記実質的部分の前記最新構造におけるRMSDに基づき、前記RMSDが、前記タンパク質モデルの前記実質的部分のα炭素原子、および前記タンパク質モデルの前記実質的部分の重い原子、のうちの少なくとも1つの位置を通して定義される、あるいは
(F)前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造の総溶媒露出表面積(SASA)に対する、前記タンパク質モデルの前記実質的部分の前記最新構造における前記SASAに基づく、あるいは
(G)前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造におけるバックボーン水素結合のうちの、前記タンパク質モデルの前記実質的部分の前記最新構造におけるバックボーン水素結合の数に基づく、あるいは
(H)前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造の回転半径に対する、前記タンパク質モデルの前記実質的部分の前記最新構造の回転半径に基づく、あるいは
(I)前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造の構造オーバーラップ関数に対する、前記タンパク質モデルの前記実質的部分の前記最新構造の構造オーバーラップ関数に基づく、あるいは
(J)前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造からの、前記タンパク質モデルの前記実質的部分の前記最新構造の一般化されたユークリッド距離に基づく、
請求項4〜6のいずれか1項に記載の方法。 - 1つまたは複数の独立したランにおける集団座標に基づくバイアシングポテンシャルを適用して前記タンパク質モデルにバイアスをかけるステップを反復することを含み、
任意選択で、複数の独立したランにおける集団座標に基づくバイアシングポテンシャルを適用して前記タンパク質モデルにバイアスをかけるステップを反復することを含んでもよく、
任意選択で、各ランについて、前記コンピュータシステムにより、そして前記タンパク質モデルのための前記最新構造における複数の残基のうちの各残基について、前記残基の前記タンパク質のアンフォールディングを示す計量を提供する局所アンフォールディング指標を決定することを含んでもよく、
任意選択で、ランにより、そして残基により指数化されたマトリックスデータ構造を前記コンピュータシステムにより作成することをさらに含んでもよく、前記マトリックスデータ構造が、前記複数の残基のうちの各ランおよび各残基について、前記対応する局所アンフォールディング指標のための値を含む、
請求項1〜8のいずれか1項に記載の方法。 - 前記複数の残基のうちの各ランおよび各残基について、前記タンパク質モデルのための複数の最新構造にわたる平均に基づいて前記局所アンフォールティング指標を決定することを含み、
任意選択で、前記複数の残基のうちの各ランおよび各残基について、適用された集団座標に基づくバイアシングポテンシャルが、平均を決定した前記複数の最新構造について一定していてもよい、
請求項9に記載の方法。 - (A)前記タンパク質モデルのための前記最新構造における前記複数の残基のうちの各ランおよび各残基について、前記局所アンフォールディング指標が少なくとも一部として、前記タンパク質モデルの前記ネイティブ構造における前記残基のための溶媒露出表面積(SASA)に対する、前記タンパク質モデルの前記最新構造における前記残基のための前記SASAの変動に基づく;
(B)前記タンパク質モデルのための前記最新構造における前記複数の残基のうちの各ランおよび各残基について、前記局所アンフォールディング指標が少なくとも一部として、前記タンパク質モデルの前記ネイティブ構造における前記残基のための原子間の複数のコンタクトのうちの、前記タンパク質モデルの前記最新構造モデルにおける前記残基のための原子間の損失コンタクトの数に基づく;
(C)前記タンパク質モデルのための前記最新構造における前記複数の残基のうちの各ランおよび各残基について、前記局所アンフォールディング指標が少なくとも一部として、前記タンパク質モデルの前記ネイティブ構造のための前記残基の根平均二乗揺らぎ(RMSF)に対する、前記タンパク質モデルの前記最新構造モデルのための前記残基の前記RMSFに基づく;
(D)前記タンパク質モデルのための前記最新構造における前記複数の残基のうちの各ランおよび各残基について、前記局所アンフォールディング指標が少なくとも一部として、前記タンパク質モデルの前記ネイティブ構造の前記残基における複数の水素結合のうちの、前記タンパク質モデルの前記最新構造モデルの前記残基における損失バックボーン水素結合の数に基づく;
(E)前記タンパク質モデルのための前記最新構造における前記複数の残基のうちの各ランおよび各残基について、前記局所アンフォールディング指標が少なくとも一部として、前記タンパク質モデルについての前記ネイティブ構造における前記残基のための相互作用のポテンシャルエネルギーに対する、前記タンパク質モデルの前記最新構造モデルにおける前記残基のための相互作用のポテンシャルエネルギーに基づく、
請求項9または10に記載の方法。 - 各ランについて、前記最新構造を分析して前記1つまたは複数の候補エピトープを同定することが、前記コンピュータシステムにより、前記タンパク質モデルのための前記最新構造を残基の複数の群に解析すること、および各群について、前記コンピュータシステムにより、前記群のための前記局所アンフォールディングの印を群のアンフォールディング評価に供することを含み、前記群における残基の全てまたは適切な閾値割合より多くが、アンフォールディングを示す局所アンフォールディングの印を有する場合には、前記群のアンフォールディング評価が、前記群についての肯定的なアンフォールディング評価結果を返し、
任意選択で、任意の1つの局所指標がアンフォールディングを示すか否かを評価することが、前記コンピュータシステムにより、前記1つの局所指標を閾値工程に供することを含んでもよい、
請求項9〜11のいずれか1項に記載の方法。 - (A)前記複数の群が、様々なウインドウサイズを含み、特定の群の前記ウインドウサイズが、前記特定の群における複数の残基を参照し、任意選択で、前記複数の群の幾つかが、共通の残基を含んでもよい;
(B)前記複数の群が、群の複数の組を含み、群の各組が、共通のウインドウサイズを有し、群の各組が、前記複数の残基における前記残基の全てを含む;および/または
(C)前記タンパク質モデルのための前記最新構造における前記複数の残基のうちの各ランおよび各残基について、前記局所フォールティング指標が少なくとも一部として、前記タンパク質モデルの前記ネイティブ構造の残基についての溶媒露出表面積(SASA)に対する、前記タンパク質モデルの前記最新構造における残基についての前記SASAの変動に基づき、前記群における残基の全てまたは適切な閾値割合より多くが、零よりも大きなSASAの変動(ΔSASA>0)を有する場合、前記群のための前記局所アンフォールディングの印を群のアンフォールディング評価に供することが、前記群について肯定的な結果を返すことを含む、
請求項12に記載の方法。 - 残基の前記複数の群のそれぞれについて、前記コンピュータシステムにより、ランの総数の閾値割合(f)以上のランの数で肯定的なアンフォールディング評価結果を呈する前記残基の群を決定することに基づいて、前記コンピュータシステムにより、潜在的な候補エピトープである前記残基の群を検討することを含み、
(A)任意選択で、各潜在的な候補エピトープについて、前記潜在的な候補エピトープに対応する残基の群における前記残基のための前記局所アンフォールディングの印を蓄積することを含み、任意選択で、前記残基の群における前記残基のための前記局所アンフォールディングの印を蓄積することが、前記ランの全てを通して実施され、任意選択で、各潜在的な候補エピトープのための前記蓄積された局所アンフォールディングの印が、前記潜在的な候補エピトープの強度を示す;
(B)任意選択で、前記コンピュータシステムにより、ウインドウサイズおよび群の残基参照により指数化されたマトリックスデータ構造を作成することを含み、前記マトリックスデータ構造における各エントリーが、潜在的候補エピトープと、前記潜在的候補エピトープを構成する前記残基と、場合により前記潜在的候補エピトープを構成する前記残基のための前記蓄積された局所アンフォールディングの印と、を含む;
(C)前記潜在的な候補エピトープのうちの第一の候補エピトープを同定することを含み、前記第一の候補エピトープを同定することが、最大のウインドウサイズを有する前記潜在的な候補エピトープを、前記第一の候補エピトープになるように選択することを含み、任意選択で、前記第一の候補エピトープを同定した後、前記潜在的な候補エピトープから前記第一の候補エピトープおよび前記第一の候補エピトープのサブエピトープを除去して、候補エピトープとしてのさらなる検討のために減少された潜在的な候補エピトープの組を得ることを含み、前記第一のエピトープの前記サブエピトープが、前記第一の候補エピトープよりも小さく、前記第一の候補エピトープにも含まれる残基のみを含み、任意選択で、前記減少された潜在的候補エピトープの組の中の前記最大ウインドウサイズが、閾値最小サイズ以下になるまで、
前記減少された潜在的候補エピトープの組の中で最大のウインドウサイズを有する潜在的候補エピトープを次の候補エピトープになるように選択することを含む、前記減少された潜在的候補エピトープの組のうちの前記次の候補エピトープを同定するステップと、
前記次の候補エピトープおよび前記次の候補エピトープのサブエピトープを、前記減少された潜在的候補エピトープの組から除去するステップであって、前記次のエピトープの前記サブエピトープが、前記次の候補エピトープよりも小さく、前記次の候補エピトープにも含まれる残基のみを含む、エピトープの群を含む、ステップと、
を反復することを含む、
請求項12または13に記載の方法。 - (A)前記タンパク質が、凝集構造であり、前記ネイティブ構造が、前記凝集構造のペプチド鎖により呈されたネイティブ構造を含む;
(B)前記タンパク質が、推定フォールディング構造を有する一本鎖ポリペプチドである;
(C)前記タンパク質モデルの前記実質的な部分が、前記タンパク質の全てを含む;
(D)前記タンパク質モデルの前記実質的な部分が、境界構造を除く前記タンパク質モデルの全てを含む;および/または
(E)前記タンパク質が、凝集構造であり、前記タンパク質モデルの前記実質的な部分が、前記凝集構造の端部にある境界ペプチド鎖を除く前記凝集構造に対応する前記タンパク質モデルの全てを含む、
請求項1〜14のいずれか1項に記載の方法。 - 前記タンパク質が、凝集構造であり、前記ネイティブ構造が、前記凝集構造のペプチド鎖により呈されたネイティブ構造を含み、各ランについて、前記最新構造を分析して前記1つまたは複数の候補エピトープを同定することが、前記コンピュータシステムにより、前記タンパク質モデルのための前記最新構造を残基の複数の群に解析すること、および各群について、前記コンピュータシステムにより、前記群のための前記局所アンフォールディングの印を群のアンフォールディング評価に供することを含み、前記群における残基の全てまたは適切な閾値割合より多くが、前記凝集構造における任意のペプチド鎖についてのアンフォールディングを示す局所アンフォールディングの印を有する場合には、前記群のアンフォールディング評価が、前記群について肯定的なアンフォールディング評価結果を返す、請求項9〜15のいずれか1項に記載の方法。
- タンパク質内の1つまたは複数の候補エピトープのコンピュータベースの予測のためのシステムであって、
コンピュータシステム上にコンホメーションサンプリングエンジンを提供するステップ;
前記コンピュータシステムにおいて、前記コンホメーションサンプリングエンジンと共に使用するのに適したタンパク質のモデルを得るステップであって、得られたタンパク質モデルが、ネイティブ構造を含む、ステップ;
前記コンピュータシステムにより、集団座標に基づくバイアシングポテンシャルを適用して前記タンパク質モデルにバイアスをかけるステップであって、前記バイアシングポテンシャルが、前記コンホメーションサンプリングエンジンに順次、前記タンパク質モデルを強制的にネイティブ構造から最新構造に少なくとも部分的にアンフォールディングさせ、前記バイアシングポテンシャルが、前記タンパク質モデルの少なくとも実質的部分に全体的に適用されて、前記タンパク質モデルの前記実質的部分の中でアンフォールディングが起こる場所に関して偏りがない、ステップ;
前記コンピュータシステムにより、前記最新構造を分析して、1つまたは複数の候補エピトープを同定するステップであって、前記1つまたは複数の候補エピトープが、局所的なアンフォールディングの印を呈する、ステップ、
を含む方法を実施するように構成された1つまたは複数のコンピュータを含む、システム。 - コンピュータシステムにより実行された場合に前記コンピュータシステムに請求項1〜17のいずれかの方法を実施させる非一時的なコンピュータで読み取り可能な指令を含む、コンピュータプログラム製品。
Applications Claiming Priority (17)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562253044P | 2015-11-09 | 2015-11-09 | |
US62/253,044 | 2015-11-09 | ||
US201662289893P | 2016-02-01 | 2016-02-01 | |
US62/289,893 | 2016-02-01 | ||
US201662309765P | 2016-03-17 | 2016-03-17 | |
US62/309,765 | 2016-03-17 | ||
US201662331925P | 2016-05-04 | 2016-05-04 | |
US62/331,925 | 2016-05-04 | ||
US201662352346P | 2016-06-20 | 2016-06-20 | |
US62/352,346 | 2016-06-20 | ||
US201662363566P | 2016-07-18 | 2016-07-18 | |
US62/363,566 | 2016-07-18 | ||
US201662365634P | 2016-07-22 | 2016-07-22 | |
US62/365,634 | 2016-07-22 | ||
US201662393615P | 2016-09-12 | 2016-09-12 | |
US62/393,615 | 2016-09-12 | ||
PCT/CA2016/051306 WO2017079836A1 (en) | 2015-11-09 | 2016-11-09 | Systems and methods for predicting misfolded protein epitopes by collective coordinate biasing |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2018538254A JP2018538254A (ja) | 2018-12-27 |
JP2018538254A5 JP2018538254A5 (ja) | 2019-12-19 |
JP6952351B2 true JP6952351B2 (ja) | 2021-10-20 |
Family
ID=58694580
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018522708A Active JP6952351B2 (ja) | 2015-11-09 | 2016-11-09 | 集団座標バイアシングによりミスフォールディングタンパク質エピトープを予測するためのシステムおよび方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US11756650B2 (ja) |
EP (1) | EP3374906B1 (ja) |
JP (1) | JP6952351B2 (ja) |
KR (1) | KR20180093910A (ja) |
CN (1) | CN108475298A (ja) |
CA (1) | CA3004593A1 (ja) |
DK (1) | DK3374906T3 (ja) |
HK (1) | HK1259338A1 (ja) |
WO (1) | WO2017079836A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7448174B2 (ja) | 2015-11-09 | 2024-03-12 | ザ・ユニバーシティ・オブ・ブリティッシュ・コロンビア | アミロイドベータ中間領域エピトープおよびそれに対する立体配座選択的抗体 |
JP7065516B2 (ja) | 2015-11-09 | 2022-05-12 | ザ・ユニバーシティ・オブ・ブリティッシュ・コロンビア | アミロイドベータのn末端エピトープおよびそれに対する立体配座選択的抗体 |
KR20180094876A (ko) | 2015-11-09 | 2018-08-24 | 더 유니버시티 오브 브리티쉬 콜롬비아 | 아밀로이드 베타 에피토프 및 이에 대한 항체 |
JP2019533426A (ja) | 2016-07-18 | 2019-11-21 | ザ・ユニバーシティ・オブ・ブリティッシュ・コロンビア | アミロイドベータに対する抗体 |
US20180125920A1 (en) | 2016-11-09 | 2018-05-10 | The University Of British Columbia | Methods for preventing and treating A-beta oligomer-associated and/or -induced diseases and conditions |
WO2018218352A1 (en) * | 2017-05-30 | 2018-12-06 | The University Of British Columbia | Epitopes in the rna recognition motif 1 (rrm1) of tdp-43 and misfolding-selective antibodies thereto |
CN109086565B (zh) * | 2018-07-12 | 2021-11-23 | 浙江工业大学 | 一种基于残基间接触约束的蛋白质结构预测方法 |
CN109273048B (zh) * | 2018-09-12 | 2021-08-03 | 浙江工业大学 | 一种蛋白质表面残基的快速确定方法 |
CN114333985B (zh) * | 2022-03-03 | 2022-07-12 | 北京晶泰科技有限公司 | 环肽设计方法、复合物结构的生成方法、装置及电子设备 |
CN116386712B (zh) * | 2023-02-20 | 2024-02-09 | 北京博康健基因科技有限公司 | 一种基于抗原蛋白动态空间结构的表位预测方法及装置 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1025521B1 (en) | 1997-06-02 | 2007-04-11 | The Johns Hopkins University | Computer method utilizing free energy calculations for ligand design and the prediction of binding targets |
US6277970B1 (en) * | 1999-05-11 | 2001-08-21 | The Regents Of The University Of California | PRP-like gene |
DE10059720A1 (de) * | 2000-11-30 | 2002-06-06 | Roche Diagnostics Gmbh | Verwendung intramolekular kovalent vernetzter Proteine als Bindepartner in Immunoassays |
CN101082944A (zh) * | 2007-06-01 | 2007-12-05 | 哈尔滨工程大学 | 基于综合算法的蛋白质折叠过程的计算机模拟方法 |
US8417461B2 (en) * | 2007-10-05 | 2013-04-09 | Ut-Battelle, Llc | Identification and modification of dynamical regions in proteins for alteration of enzyme catalytic effect |
WO2010036927A2 (en) | 2008-09-26 | 2010-04-01 | The Regents Of The University Of Michigan | High-throughput ensemble-based docking and elucidation of 3-dimensional structural conformations of flexible biomolecular targets |
WO2010040209A1 (en) | 2008-10-06 | 2010-04-15 | The University Of British Columbia | Methods and systems for predicting misfolded protein epitopes |
JP2013505707A (ja) * | 2009-09-25 | 2013-02-21 | 上海抗体薬物国家工程研究中心有限公司 | コンピュータ支援設計により高親和性の抗体又はタンパク質分子を得る方法 |
WO2011106885A1 (en) | 2010-03-03 | 2011-09-09 | The University Of British Columbia | Oligomer-specific amyloid beta epitope and antibodies |
DE102010026094B4 (de) * | 2010-07-05 | 2012-01-12 | Sigeng Han | Ein neues Verfahren zum Charakterisieren und multidimensionalen Darstellen des Faltungsvorgangs der Proteine |
JP5697638B2 (ja) | 2011-09-26 | 2015-04-08 | 富士フイルム株式会社 | 質点系の挙動を予測するシミュレーション装置およびシミュレーション方法並びにその方法を実行するためのプログラムおよび記録媒体 |
ES2701440T3 (es) * | 2012-08-17 | 2019-02-22 | Zymeworks Inc | Sistemas y métodos de muestreo y análisis de dinámica conformacional de polímeros |
EP3052514A4 (en) * | 2013-10-04 | 2017-08-09 | The Johns Hopkins University | Insertion of ionizable groups in the interior of proteins as a strategy for engineering artificial ph-sensitive switch proteins |
JP7065516B2 (ja) | 2015-11-09 | 2022-05-12 | ザ・ユニバーシティ・オブ・ブリティッシュ・コロンビア | アミロイドベータのn末端エピトープおよびそれに対する立体配座選択的抗体 |
KR20180094876A (ko) | 2015-11-09 | 2018-08-24 | 더 유니버시티 오브 브리티쉬 콜롬비아 | 아밀로이드 베타 에피토프 및 이에 대한 항체 |
JP2019505165A (ja) | 2015-11-09 | 2019-02-28 | ザ・ユニバーシティ・オブ・ブリティッシュ・コロンビア | アミロイドベータのc末端エピトープおよびそれに対する立体配座選択的抗体 |
CN108350050A (zh) | 2015-11-09 | 2018-07-31 | 英属哥伦比亚大学 | 淀粉样蛋白β中的表位及其构象选择性抗体 |
JP7448174B2 (ja) | 2015-11-09 | 2024-03-12 | ザ・ユニバーシティ・オブ・ブリティッシュ・コロンビア | アミロイドベータ中間領域エピトープおよびそれに対する立体配座選択的抗体 |
-
2016
- 2016-11-09 DK DK16863269.3T patent/DK3374906T3/da active
- 2016-11-09 US US15/774,909 patent/US11756650B2/en active Active
- 2016-11-09 CN CN201680065612.6A patent/CN108475298A/zh active Pending
- 2016-11-09 KR KR1020187015912A patent/KR20180093910A/ko not_active Application Discontinuation
- 2016-11-09 EP EP16863269.3A patent/EP3374906B1/en active Active
- 2016-11-09 WO PCT/CA2016/051306 patent/WO2017079836A1/en active Application Filing
- 2016-11-09 JP JP2018522708A patent/JP6952351B2/ja active Active
- 2016-11-09 CA CA3004593A patent/CA3004593A1/en active Pending
-
2019
- 2019-01-31 HK HK19101704.4A patent/HK1259338A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
KR20180093910A (ko) | 2018-08-22 |
EP3374906B1 (en) | 2022-01-05 |
DK3374906T3 (da) | 2022-03-07 |
WO2017079836A1 (en) | 2017-05-18 |
CA3004593A1 (en) | 2017-05-18 |
JP2018538254A (ja) | 2018-12-27 |
US20180330045A1 (en) | 2018-11-15 |
CN108475298A (zh) | 2018-08-31 |
HK1259338A1 (zh) | 2019-11-29 |
EP3374906A4 (en) | 2019-08-07 |
US11756650B2 (en) | 2023-09-12 |
EP3374906A1 (en) | 2018-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6952351B2 (ja) | 集団座標バイアシングによりミスフォールディングタンパク質エピトープを予測するためのシステムおよび方法 | |
Siebenmorgen et al. | Computational prediction of protein–protein binding affinities | |
Yuan et al. | Binding site detection and druggability prediction of protein targets for structure-based drug design | |
Zhang et al. | Prediction of conformational B-cell epitopes from 3D structures by random forests with a distance-based feature | |
Warren et al. | Essential considerations for using protein–ligand structures in drug discovery | |
Camilloni et al. | Statistical mechanics of the denatured state of a protein using replica-averaged metadynamics | |
Brown et al. | Large-scale application of high-throughput molecular mechanics with Poisson− Boltzmann surface area for routine physics-based scoring of protein− ligand complexes | |
Maruyama et al. | Analysis of protein folding simulation with moving root mean square deviation | |
Tuncbag et al. | Fast and accurate modeling of protein–protein interactions by combining template‐interface‐based docking with flexible refinement | |
Graham et al. | Force-induced change in protein unfolding mechanism: discrete or continuous switch? | |
Gao et al. | New benchmark metrics for protein‐protein docking methods | |
Yang et al. | Refining collective coordinates and improving free energy representation in variational enhanced sampling | |
Subramani et al. | Structure prediction of loops with fixed and flexible stems | |
CN116635940A (zh) | 使用简化多序列比对来训练蛋白结构预测神经网络 | |
Yuwen et al. | Role of electrostatic interactions in binding of peptides and intrinsically disordered proteins to their folded targets: 2. The model of encounter complex involving the double mutant of the c-Crk N-SH3 domain and peptide Sos | |
Mugnai et al. | Sizes, conformational fluctuations, and SAXS profiles for intrinsically disordered proteins | |
Suarez et al. | Sampling assessment for molecular simulations using conformational entropy calculations | |
KR20160057003A (ko) | 결합 상대방을 고려하여 rna 서열에서 단백질과 결합하는 부위를 예측하는 방법 | |
JP4377691B2 (ja) | スクリーニング方法とスクリーニングシステム及びスクリーニングプログラム | |
Salvatella | Understanding protein dynamics using conformational ensembles | |
Ghosh et al. | Time-dependent markov state models for single molecule force spectroscopy | |
US20180052952A9 (en) | Methods and apparatus for double-integration orthogonal space tempering | |
Kalinowska et al. | Hypothetical in silico model of the early-stage intermediate in protein folding | |
Cao et al. | Exact Analytical Algorithm for the Solvent-Accessible Surface Area and Derivatives in Implicit Solvent Molecular Simulations on GPUs | |
Luo et al. | Biophysical and Integrative Characterization of Protein Intrinsic Disorder as a Prime Target for Drug Discovery |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210126 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210416 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210625 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210726 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210824 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210917 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6952351 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |