JP2021523680A - アミノ酸配列改変に基づくタンパク質の特性への影響の決定 - Google Patents
アミノ酸配列改変に基づくタンパク質の特性への影響の決定 Download PDFInfo
- Publication number
- JP2021523680A JP2021523680A JP2020544771A JP2020544771A JP2021523680A JP 2021523680 A JP2021523680 A JP 2021523680A JP 2020544771 A JP2020544771 A JP 2020544771A JP 2020544771 A JP2020544771 A JP 2020544771A JP 2021523680 A JP2021523680 A JP 2021523680A
- Authority
- JP
- Japan
- Prior art keywords
- protein
- modified
- group
- amino acid
- proteins
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 125000003275 alpha amino acid group Chemical group 0.000 title claims abstract description 194
- 238000012986 modification Methods 0.000 title description 27
- 230000004048 modification Effects 0.000 title description 27
- 230000001516 effect on protein Effects 0.000 title description 3
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 695
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 695
- 238000006467 substitution reaction Methods 0.000 claims abstract description 399
- 238000004458 analytical method Methods 0.000 claims abstract description 108
- 238000000034 method Methods 0.000 claims abstract description 80
- 230000000694 effects Effects 0.000 claims abstract description 46
- 150000001413 amino acids Chemical class 0.000 claims description 30
- 238000013500 data storage Methods 0.000 claims description 7
- 238000003556 assay Methods 0.000 claims description 6
- 238000000692 Student's t-test Methods 0.000 claims description 4
- 238000012353 t test Methods 0.000 claims description 4
- 238000000540 analysis of variance Methods 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 3
- 238000010586 diagram Methods 0.000 abstract description 8
- 235000018102 proteins Nutrition 0.000 description 629
- 102000035118 modified proteins Human genes 0.000 description 438
- 108091005573 modified proteins Proteins 0.000 description 438
- 235000001014 amino acid Nutrition 0.000 description 31
- 230000008569 process Effects 0.000 description 22
- 108020004414 DNA Proteins 0.000 description 15
- 102000053602 DNA Human genes 0.000 description 15
- 230000008878 coupling Effects 0.000 description 14
- 238000010168 coupling process Methods 0.000 description 14
- 238000005859 coupling reaction Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 7
- 230000000704 physical effect Effects 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 210000004027 cell Anatomy 0.000 description 3
- 230000001808 coupling effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 2
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 239000003398 denaturant Substances 0.000 description 1
- 238000013400 design of experiment Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 230000031146 intracellular signal transduction Effects 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000005057 refrigeration Methods 0.000 description 1
- 230000010666 regulation of catalytic activity Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Peptides Or Proteins (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
Description
本出願は、2018年2月26日に提出され、「アミノ酸配列改変に基づくタンパク質の特性への影響の決定」というタイトルの米国仮出願第62/635,536号の優先権を主張し、その全体は参照により本明細書に組み入れられる。
タンパク質は、化学結合を介してリンクされているアミノ酸のシーケンスで構成されている。特定のタンパク質のアミノ酸配列は、それからタンパク質が発現するデオキシリボ核酸(DNA)のヌクレオチドの配列に基づいている。タンパク質の機能性と構造は、当該タンパク質のアミノ酸配列に基づくことができる。タンパク質は、酵素活性の調節や細胞内シグナル伝達など、生物内でさまざまな機能を持つことができる。一部のタンパク質は、生物学的状態を治療するために治療的に使用することもできる。例えば、抗体などのタンパク質は病原体に結合して、T細胞やマクロファージなどの生物の他の薬剤による破壊のために病原体を標的にすることができる。別の例では、タンパク質は分子に結合して、分子を生物の標的位置に輸送し、生物学的状態の表現型を緩和することができる。
本明細書に記載される概念は、タンパク質のアミノ酸配列への改変に基づいてタンパク質の特性への影響を決定することを対象とする。いくつかの例において、タンパク質のアミノ酸配列への改変は、タンパク質の安定性及びタンパク質の発現のための収量を改善することができる。特に、実装では、タンパク質の配列に包含される特定のアミノ酸に改変を加えることにより、タンパク質が展開する温度を上げることができる。追加の状況では、タンパク質の配列内のアミノ酸に特定の改変が加えられると、タンパク質が分解し始めるpHを下げることができる。
特定の置換を持つ個々のタンパク質は、特定の置換を有する個々のタンパク質のアミノ酸配列と特定の置換を有しないタンパク質のアミノ酸配列との間の差異の数を最小限にするような方法で、特定の置換を持たない1つ以上のタンパク質と結合できる。特定の状況では、置換を持たない複数のタンパク質を、置換を包含する単一のタンパク質に結合することができる。
Martinez Cuesta S, Rahman SA, Furnham N, Thornton JM. The Classification and Evolution of Enzyme Function. Biophysical Journal. 2015;109(6):1082−1086. doi:10.1016/j.bpj.2015.04.020
にある。これは、参照により全体が本明細書に組み込まれる。
に記載されている。これは、参照により全体が本明細書に組み込まれる。
それぞれのアミノ酸配列間の差異の数が最小である第2のグループ206の1つ又は複数の改変タンパク質と結合することができる第1のグループ202の改変されたタンパク質及び第2のグループ206の改変されたタンパク質の1つ又は複数のアミノ酸配列。
第1項
以下: ベースタンパク質のアミノ酸配列に対していくつかの位置で改変されたアミノ酸配列を有するいくつかのタンパク質を発現させること;前記いくつかのタンパク質の特性についての値を決定すること;前記いくつかのタンパク質の一部のアミノ酸配列と特定の位置での前記ベースタンパク質のアミノ酸配列との間の差異を示す候補置換を決定すること;前記候補置換を包含する前記いくつかのタンパク質の第1のグループ及び前記候補置換を包含しない前記いくつかのタンパク質の第2のグループを決定すること;前記第2のグループの特性についての第2の値に関して前記第1のグループの特性についての第1の値の分析を実行すること;及び少なくとも部分的に前記分析に基づいて、前記候補置換が前記第1のグループの少なくとも1つの特性の値に統計的に有意な効果を与えることを決定すること;を含む方法。
前記候補置換によってもたらされる前記統計的に有意な効果に少なくとも部分的に基づいて、収量又は安定性の少なくとも一方が増加することを決定することをさらに含む、第1項に記載の方法。
第1項又は第2項に記載の方法であって、前記分析は、: 前記第1のグループの第1のタンパク質を前記第2のグループの第2のタンパク質及び第3のタンパク質と結合すること;前記第2のタンパク質の前記少なくとも1つの特性についての第1の値及び前記第3のタンパク質の前記少なくとも1つの特性についての第2の値に基づいて、前記少なくとも1つの特性についての平均値を決定すること;及び前記平均値と前記第1のタンパク質の特性についての追加の値との間の差異を決定すること;を包含する方法。
前記第1のタンパク質の第1のアミノ酸配列と前記第2のグループのアミノ酸配列との間の比較を実行すること;及び、少なくとも部分的に前記比較に基づいて、前記第1のアミノ酸配列と、前記第2のタンパク質の第2のアミノ酸配列と、前記第3のタンパク質の第3のアミノ酸配列との間の差異が閾値数未満であることを決定すること;をさらに含む第3項に記載の方法。
前記ベースタンパク質が抗体である、第1〜4項のいずれか一項に記載の方法。
前記いくつかのタンパク質のうちの1つのタンパク質の特性についての値は、前記タンパク質に関して1つ以上のアッセイを行うことによって決定される、第1〜5項のいずれか一項に記載の方法。
前記いくつかのタンパク質の特性についての値を決定することは、以下: 前記いくつかのタンパク質のうちの1つのタンパク質が、前記タンパク質が前記タンパク質の標的分子に結合することができない程度まで展開する温度の値を決定すること;前記タンパク質が水に不溶性になるpHの値を決定すること;又は前記タンパク質の総分子量に対する重鎖分子量のパーセンテージを決定すること;のうちの少なくとも1つを包含する、第1〜6項のいずれか一項に記載の方法。
前記候補置換は、前記ベースタンパク質の前記アミノ酸配列に関して、前記いくつかのタンパク質の前記第1のグループのアミノ酸配列で行われた複数の置換のうちの1つである、第1〜7項のいずれか一項に記載の方法。
前記候補置換が前記第1のグループの前記少なくとも1つの特性の値に前記統計的に有意な効果を与えると決定することは、分散分析又はt検定を実行することを包含する、第1〜8項のいずれか一項に記載の方法。
以下: タンパク質の第1のグループが候補置換を有すること、及びタンパク質の第2のグループが前記候補置換を有しないことを決定すること;前記第1のグループに含まれる1つのタンパク質を前記第2のグループに含まれる複数のタンパク質と結合すること;前記タンパク質に関する特性についての値を決定すること;前記複数のタンパク質の個々のタンパク質に関する特性についての追加の値を決定すること;前記追加の値に少なくとも部分的に基づいて、前記複数のタンパク質に関する特性についての平均値を決定すること;前記特性についての値と前記特性についての平均値との間の差異を決定すること;及び少なくとも部分的に前記差異に基づいて、前記候補置換が前記特性に与える影響の量を決定すること;を含む方法。
前記タンパク質のアミノ酸配列を、タンパク質の前記第2のグループに含まれるタンパク質の個々のアミノ酸配列と比較すること;前記タンパク質のアミノ酸配列と、タンパク質の前記第2のグループに含まれる前記タンパク質の個々のアミノ酸配列との間の差異の最小数を決定すること;をさらに含む第10項に記載の方法。
前記タンパク質のアミノ酸配列と、前記第2のグループに含まれる第1の追加のタンパク質の第1の追加のアミノ酸配列との間の第1のいくつかの差異(a first number of differences)を決定すること; 前記タンパク質のアミノ酸配列と、前記第2のグループに含まれる第2の追加のタンパク質の第2の追加のアミノ酸配列との間の第2のいくつかの差異(a second number of differences)を決定することであって、前記第2のいくつかの差異が前記第1のいくつかの差異と異なること;前記第1のいくつかの差異が前記差異の最小数に対応することを決定すること;前記第2のいくつかの差異が前記差異の最小数より大きいことを決定すること;及び前記第1の追加のタンパク質を前記複数のタンパク質に追加すること;をさらに含む第11項に記載の方法。
前記候補置換が前記特性に与える影響の量を決定することは、前記候補置換が前記特性に影響を与える確率を決定することを包含する、第10〜12項のいずれか一項に記載の方法、
前記タンパク質に関する前記特性についての値を取り込むために、少なくとも1つのユーザーインターフェイス要素を包含するユーザーインターフェイスを生成すること、をさらに含む第10〜13項のいずれか一項に記載の方法、
前記タンパク質に関する前記特性についての値をウェブサイトから又はデータ記憶装置から取得することをさらに含む、第10〜14項のいずれか一項に記載の方法。
前記特性が、前記タンパク質の少なくとも一部が展開し始める温度を包含し、当該方法が、前記候補置換が前記特性に及ぼす影響の量に少なくとも部分的に基づいて、前記候補置換が前記タンパク質の安定性に影響を与えることを決定すること、をさらに含む第10〜15項のいずれか一項に記載の方法。
前記特性は前記タンパク質の溶解度を包含し、当該方法は、少なくとも部分的に前記特性への前記候補置換への影響の量に基づいて、前記候補置換が前記タンパク質の収量に影響を与えることを決定すること、をさらに含む第10〜16項のいずれか一項に記載の方法。
前記特性が、ギブスの自由エネルギー、総分子量、重鎖分子量、軽鎖分子量、総分子量に対する重鎖分子量のパーセンテージ、総分子量に対する軽鎖分子量のパーセンテージ、又は二次構造の存在を包含する、第10〜17項のいずれか一項に記載の方法。
前記候補置換が、ベースタンパク質の同じ位置にある追加のアミノ酸とは異なる、前記タンパク質の特定の位置にあるアミノ酸を包含する、第10〜18項のいずれか一項に記載の方法。
前記タンパク質は、前記ベースタンパク質の複数の追加の位置でのアミノ酸に関して、複数の追加の位置で複数の追加の置換を有する、第19項に記載の方法。
1つ以上のプロセッサ;及び、
前記1つ以上のプロセッサによって実行されると、以下: いくつかのタンパク質の一部のアミノ酸配列と特定の位置でのベースタンパク質のアミノ酸配列との間の差異を示す候補置換を決定することであって、前記いくつかのタンパク質は、前記ベースタンパク質のアミノ酸配列に対していくつかの位置で改変されたアミノ酸配列を包含すること;前記いくつかのタンパク質(the number of proteins)の特性の値を決定すること;候補置換を包含する前記いくつかのタンパク質の第1のグループ及び候補置換を包含しない前記いくつかのタンパク質の第2のグループを決定すること;前記第2のグループの特性についての第2の値に関して前記第1のグループの特性についての第1の値の分析を実行すること;及び少なくとも部分的に前記分析に基づいて、前記候補置換が前記第1のグループの少なくとも1つの特性の値に統計的に有意な影響を与えることを決定すること;を含む操作を実行するコンピュータ可読命令を格納する1つ以上の非一時的(non-transitory)コンピュータ可読媒体;
を含むシステム。
前記操作は、前記候補置換によって生成された統計的に有意な効果に少なくとも部分的に基づいて、収量又は安定性のうち少なくとも一方が増加することを決定することをさらに含む、第21項に記載のシステム。
前記分析は、以下: 前記第1のグループの第1のタンパク質を、前記第2のグループの第2のタンパク質及び第3のタンパク質と結合すること;前記第2のタンパク質の少なくとも1つの特性についての第1の値及び前記第3のタンパク質の少なくとも1つの特性についての第2の値に基づいて、少なくとも1つの特性についての平均値を決定すること;及び平均値と前記第1のタンパク質の特性についての追加の値との差異を決定すること;を包含する、第21又は22項に記載のシステム。
前記操作は、: 前記第1のタンパク質の第1のアミノ酸配列と前記第2のグループのアミノ酸配列との間の比較を実行すること;及び、少なくとも部分的に前記比較に基づいて、前記第1のアミノ酸配列と、前記第2のタンパク質の第2のアミノ酸配列と、前記第3のタンパク質の第3のアミノ酸配列との間の差が閾値未満であることを決定すること;をさらに含む、第23項に記載のシステム。
前記ベースタンパク質が抗体である、第21〜24項のいずれか一項に記載のシステム。
前記いくつかのタンパク質のうちの1つのタンパク質の特性についての値は、前記タンパク質に関して1つ以上のアッセイを行うことによって決定される、第21〜25項のいずれか一項に記載のシステム。
前記いくつかのタンパク質の特性についての値を決定することは、以下: 前記いくつかのタンパク質のうちの1つタンパク質が、前記タンパク質が前記タンパク質についての標的分子に結合することができない程度まで展開する温度の値を決定すること;前記タンパク質が水に不溶性になるpHの値を決定すること;又は、前記タンパク質についての総分子量に対する重鎖分子量のパーセンテージを決定すること;のうち少なくとも1つを包含する、第21〜26項のいずれか一項に記載のシステム。
前記候補置換は、前記ベースタンパク質の前記アミノ酸配列に関して、前記いくつかのタンパク質の前記第1のグループのアミノ酸配列で行われた複数の置換のうちの1つである、第21〜27項のいずれか一項に記載のシステム。
前記候補置換が、前記第1のグループの前記少なくとも1つの特性の値に統計的に有意な効果を与えることを決定することは、分散分析又はt検定を実行することを包含する、第21〜28項のいずれか一項に記載のシステム。
1つ以上のプロセッサ;及び、
前記1つ以上のプロセッサによって実行されると、以下: タンパク質の第1のグループが候補置換を有すること、及びタンパク質の第2のグループが前記候補置換を有しないことを決定すること;前記第1のグループに含まれるタンパク質を前記第2のグループに含まれる複数のタンパク質と結合すること;前記タンパク質に関する特性についての値を決定すること;前記複数のタンパク質の個々のタンパク質に関する特性についての追加の値を決定すること;前記追加の値に少なくとも部分的に基づいて、前記複数のタンパク質に関する特性についての平均値を決定すること;特性についての前記値と特性についての前記平均値との差異を決定すること;及び、少なくとも部分的に前記差異に基づいて、前記候補置換が特性に与える影響の量を決定すること;を含む操作を実行するコンピュータ可読命令を格納する1つ以上の非一時的(non-transitory)コンピュータ可読媒体;
を含むシステム。
前記操作は、: 前記タンパク質のアミノ酸配列を、タンパク質の前記第2のグループに含まれるタンパク質の個々のアミノ酸配列と比較すること;前記タンパク質の前記アミノ酸配列と、タンパク質の前記第2のグループに含まれる前記タンパク質の個々のアミノ酸配列との間の差異の最小数を決定すること;をさらに含む、第30項に記載のシステム。
前記操作は、: 前記タンパク質のアミノ酸配列と前記第2のグループに含まれる第1の追加のタンパク質の第1の追加のアミノ酸配列との間の第1のいくつかの差異を決定すること;前記タンパク質の前記アミノ酸配列と、前記第2のグループに含まれる第2の追加のタンパク質の第2の追加のアミノ酸配列との間の第2のいくつかの差異を決定することであって、前記第2のいくつかの差異は前記第1のいくつかの差異とは異なること;前記第1のいくつかの差異が差異の最小数に対応することを決定すること;前記第2のいくつかの差異が差異の最小数より大きいことを決定すること;及び、前記第1の追加のタンパク質を前記複数のタンパク質に追加すること;をさらに含む、第31項に記載のシステム。
前記候補置換の特性への影響の量を決定することは、前記候補置換が特性に影響を与える確率を決定することを包含する、第30〜32項のいずれか一項に記載のシステム。
前記操作は、前記タンパク質に関する特性についての値を取り込むための少なくとも1つのユーザーインターフェース要素を包含するユーザーインターフェースを生成することをさらに含む、第30〜33項のいずれか一項に記載のシステム。
前記操作は、ウェブサイト又はデータ記憶装置から前記タンパク質に関する特性についての値を取得することをさらに含む、第30〜34項のいずれか一項に記載のシステム。
前記特性は、前記タンパク質の少なくとも一部が展開し始める温度を包含し、前記操作は、前記候補置換が特性に及ぼす影響の量に少なくとも部分的に基づいて、前記候補置換が前記タンパク質の安定性に影響を与えることを決定すること、をさらに含む、第30〜35項のいずれか一項に記載のシステム。
前記特性が前記タンパク質の溶解度を包含し、前記操作が、少なくとも部分的に、前記特性に対する前記候補置換への影響の量に基づいて、前記候補置換が前記タンパク質の収量に影響を与えることを決定することをさらに含む、第30〜36項のいずれか一項に記載のシステム。
前記特性が、ギブスの自由エネルギー、総分子量、重鎖分子量、軽鎖分子量、総分子量に対する重鎖分子量のパーセンテージ、総分子量に対する軽鎖分子量のパーセンテージ、又は二次構造の存在を包含する、第30〜37項のいずれか一項に記載のシステム。
前記候補置換が、ベースタンパク質の同じ位置にある追加のアミノ酸とは異なる、前記タンパク質の特定の位置にあるアミノ酸を包含する、第30〜38項のいずれか一項に記載のシステム。
前記タンパク質が、前記ベースタンパク質の複数の追加の位置でのアミノ酸に対して、複数の追加の位置で複数の追加の置換を有する、第39項に記載のシステム。
Claims (20)
- ベースタンパク質のアミノ酸配列に対していくつかの位置で改変されたアミノ酸配列を有するいくつかのタンパク質を発現させること;
前記いくつかのタンパク質の特性についての値を決定すること;
前記いくつかのタンパク質の一部のアミノ酸配列と特定の位置での前記ベースタンパク質のアミノ酸配列との間の差異を示す候補置換を決定すること;
前記候補置換を包含する前記いくつかのタンパク質の第1のグループ及び前記候補置換を包含しない前記いくつかのタンパク質の第2のグループを決定すること;
前記第2のグループの特性についての第2の値に関して前記第1のグループの特性についての第1の値の分析を実行すること;及び
少なくとも部分的に前記分析に基づいて、前記候補置換が前記第1のグループの少なくとも1つの特性の値に統計的に有意な効果を与えることを決定すること;
を含む方法。 - 前記候補置換によってもたらされる前記統計的に有意な効果に少なくとも部分的に基づいて、収量又は安定性の少なくとも一方が増加することを決定することをさらに含む、請求項1に記載の方法。
- 請求項1に記載の方法であって、前記分析は、:
前記第1のグループの第1のタンパク質を前記第2のグループの第2のタンパク質及び第3のタンパク質と結合すること;
前記第2のタンパク質の前記少なくとも1つの特性についての第1の値及び前記第3のタンパク質の前記少なくとも1つの特性についての第2の値に基づいて、前記少なくとも1つの特性についての平均値を決定すること;及び
前記平均値と前記第1のタンパク質の特性についての追加の値との間の差異を決定すること;を包含する方法。 - 前記第1のタンパク質の第1のアミノ酸配列と前記第2のグループのアミノ酸配列との間の比較を実行すること;及び、
少なくとも部分的に前記比較に基づいて、前記第1のアミノ酸配列と、前記第2のタンパク質の第2のアミノ酸配列と、前記第3のタンパク質の第3のアミノ酸配列との間の差異が閾値数未満であることを決定すること;
をさらに含む請求項3に記載の方法。 - 前記ベースタンパク質が抗体である、請求項1に記載の方法。
- 前記いくつかのタンパク質のうちの1つのタンパク質の特性についての値は、前記タンパク質に関して1つ以上のアッセイを行うことによって決定される、請求項1に記載の方法。
- 前記いくつかのタンパク質の特性についての値を決定することは、:
前記いくつかのタンパク質のうちの1つのタンパク質が、前記タンパク質が前記タンパク質の標的分子に結合することができない程度まで展開する温度の値を決定すること;
前記タンパク質が水に不溶性になるpHの値を決定すること;又は
前記タンパク質の総分子量に対する重鎖分子量のパーセンテージを決定すること;
のうちの少なくとも1つを包含する、請求項1に記載の方法。 - 前記候補置換は、前記ベースタンパク質の前記アミノ酸配列に関して、前記いくつかのタンパク質の前記第1のグループのアミノ酸配列で行われた複数の置換のうちの1つである、請求項1に記載の方法。
- 前記候補置換が前記第1のグループの前記少なくとも1つの特性の値に前記統計的に有意な効果を与えると決定することは、分散分析又はt検定を実行することを包含する、請求項1に記載の方法。
- タンパク質の第1のグループが候補置換を有すること、及びタンパク質の第2のグループが前記候補置換を有しないことを決定すること;
前記第1のグループに含まれる1つのタンパク質を前記第2のグループに含まれる複数のタンパク質と結合すること;
前記タンパク質に関する特性についての値を決定すること;
前記複数のタンパク質の個々のタンパク質に関する特性についての追加の値を決定すること;
前記追加の値に少なくとも部分的に基づいて、前記複数のタンパク質に関する特性についての平均値を決定すること;
前記特性についての値と前記特性についての平均値との間の差異を決定すること;及び
少なくとも部分的に前記差異に基づいて、前記候補置換が前記特性に与える影響の量を決定すること;
を含む方法。 - 前記タンパク質のアミノ酸配列を、タンパク質の前記第2のグループに含まれるタンパク質の個々のアミノ酸配列と比較すること;
前記タンパク質のアミノ酸配列と、タンパク質の前記第2のグループに含まれる前記タンパク質の個々のアミノ酸配列との間の差異の最小数を決定すること;
をさらに含む請求項10に記載の方法。 - 前記タンパク質のアミノ酸配列と、前記第2のグループに含まれる第1の追加のタンパク質の第1の追加のアミノ酸配列との間の第1のいくつかの差異を決定すること;
前記タンパク質のアミノ酸配列と、前記第2のグループに含まれる第2の追加のタンパク質の第2の追加のアミノ酸配列との間の第2のいくつかの差異を決定することであって、前記第2のいくつかの差異が前記第1のいくつかの差異と異なること;
前記第1のいくつかの差異が前記差異の最小数に対応することを決定すること;
前記第2のいくつかの差異が前記差異の最小数より大きいことを決定すること;及び
前記第1の追加のタンパク質を前記複数のタンパク質に追加すること;
をさらに含む請求項11に記載の方法。 - 前記候補置換が前記特性に与える影響の量を決定することは、前記候補置換が前記特性に影響を与える確率を決定することを包含する、請求項10に記載の方法。
- 前記タンパク質に関する前記特性についての値を取り込むために、少なくとも1つのユーザーインターフェイス要素を包含するユーザーインターフェイスを生成すること、
をさらに含む請求項10に記載の方法。 - 前記タンパク質に関する前記特性についての値をウェブサイトから又はデータ記憶装置から取得することをさらに含む、請求項10に記載の方法。
- 前記特性が、前記タンパク質の少なくとも一部が展開し始める温度を包含し、当該方法が、前記候補置換が前記特性に及ぼす影響の量に少なくとも部分的に基づいて、前記候補置換が、:
前記タンパク質の安定性に影響を与えることを決定すること、
をさらに含む請求項10に記載の方法。 - 前記特性は前記タンパク質の溶解度を包含し、当該方法は、:
少なくとも部分的に前記特性への前記候補置換への影響の量に基づいて、前記候補置換が前記タンパク質の収量に影響を与えることを決定すること、
をさらに含む請求項10に記載の方法。 - 前記特性が、ギブスの自由エネルギー、総分子量、重鎖分子量、軽鎖分子量、総分子量に対する重鎖分子量のパーセンテージ、総分子量に対する軽鎖分子量のパーセンテージ、又は二次構造の存在を包含する、請求項10に記載の方法。
- 前記候補置換が、ベースタンパク質の同じ位置にある追加のアミノ酸とは異なる、前記タンパク質の特定の位置にあるアミノ酸を包含する、請求項10に記載の方法。
- 前記タンパク質は、前記ベースタンパク質の複数の追加の位置でのアミノ酸に関して、複数の追加の位置で複数の追加の置換を有する、請求項19に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862635536P | 2018-02-26 | 2018-02-26 | |
US62/635,536 | 2018-02-26 | ||
PCT/US2019/019530 WO2019165411A1 (en) | 2018-02-26 | 2019-02-26 | Determining impact on properties of proteins based on amino acid sequence modifications |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021523680A true JP2021523680A (ja) | 2021-09-09 |
JPWO2019165411A5 JPWO2019165411A5 (ja) | 2022-03-07 |
Family
ID=65952055
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020544771A Pending JP2021523680A (ja) | 2018-02-26 | 2019-02-26 | アミノ酸配列改変に基づくタンパク質の特性への影響の決定 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20200411136A1 (ja) |
EP (1) | EP3759715A1 (ja) |
JP (1) | JP2021523680A (ja) |
CA (1) | CA3092097A1 (ja) |
WO (1) | WO2019165411A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024084600A1 (ja) * | 2022-10-18 | 2024-04-25 | 学校法人 創価大学 | 疾患危険性のあるミスセンス変異の同定方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4073806A4 (en) * | 2019-12-12 | 2023-01-18 | Just-Evotec Biologics, Inc. | GENERATION OF PROTEIN SEQUENCES USING MACHINE LEARNING TECHNIQUES BASED ON MODEL PROTEIN SEQUENCES |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009502141A (ja) * | 2005-07-26 | 2009-01-29 | コモンウエルス サイエンティフィク アンド インダストリアル リサーチ オーガニゼーション | ウシ科動物における背最長筋ピーク力、筋肉内脂肪、小売牛肉歩留および正味飼料摂取量から選択される形質の査定方法 |
JP2009531028A (ja) * | 2006-03-17 | 2009-09-03 | バイオジェン・アイデック・エムエイ・インコーポレイテッド | 安定化されたポリペプチド化合物 |
JP2010523122A (ja) * | 2007-04-04 | 2010-07-15 | ビーエーエスエフ アグロケミカル プロダクツ ビー.ブイ. | Ahasl1の複数の除草剤耐性対立遺伝子を有する除草剤耐性ヒマワリ植物及び使用方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002054063A1 (en) * | 2001-01-04 | 2002-07-11 | Yeda Research And Development Co. Ltd. | Database system and method useful for predicting the effect of amino acid substitutions on protein structure and stability |
-
2019
- 2019-02-26 US US16/975,916 patent/US20200411136A1/en active Pending
- 2019-02-26 WO PCT/US2019/019530 patent/WO2019165411A1/en unknown
- 2019-02-26 EP EP19713902.5A patent/EP3759715A1/en active Pending
- 2019-02-26 CA CA3092097A patent/CA3092097A1/en active Pending
- 2019-02-26 JP JP2020544771A patent/JP2021523680A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009502141A (ja) * | 2005-07-26 | 2009-01-29 | コモンウエルス サイエンティフィク アンド インダストリアル リサーチ オーガニゼーション | ウシ科動物における背最長筋ピーク力、筋肉内脂肪、小売牛肉歩留および正味飼料摂取量から選択される形質の査定方法 |
JP2009531028A (ja) * | 2006-03-17 | 2009-09-03 | バイオジェン・アイデック・エムエイ・インコーポレイテッド | 安定化されたポリペプチド化合物 |
JP2010523122A (ja) * | 2007-04-04 | 2010-07-15 | ビーエーエスエフ アグロケミカル プロダクツ ビー.ブイ. | Ahasl1の複数の除草剤耐性対立遺伝子を有する除草剤耐性ヒマワリ植物及び使用方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024084600A1 (ja) * | 2022-10-18 | 2024-04-25 | 学校法人 創価大学 | 疾患危険性のあるミスセンス変異の同定方法 |
Also Published As
Publication number | Publication date |
---|---|
US20200411136A1 (en) | 2020-12-31 |
EP3759715A1 (en) | 2021-01-06 |
CA3092097A1 (en) | 2019-08-29 |
WO2019165411A1 (en) | 2019-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Cumulus provides cloud-based data analysis for large-scale single-cell and single-nucleus RNA-seq | |
Wang et al. | MusiteDeep: a deep-learning framework for general and kinase-specific phosphorylation site prediction | |
Potocnakova et al. | An introduction to B‐cell epitope mapping and in silico epitope prediction | |
Lindskog et al. | Selection of protein epitopes for antibody production | |
JP2024075638A (ja) | タンパク質同定のためのデコーディングアプローチ方法 | |
CN111566261A (zh) | 选择结合试剂的方法 | |
Anderson et al. | Antigenic cartography of H1N1 influenza viruses using sequence-based antigenic distance calculation | |
JP2021514086A (ja) | Mhcペプチド結合予測のためのgan−cnn | |
Andreatta et al. | NNAlign: a web-based prediction method allowing non-expert end-user discovery of sequence motifs in quantitative peptide data | |
Dalkas et al. | SEPIa, a knowledge-driven algorithm for predicting conformational B-cell epitopes from the amino acid sequence | |
McPartlon et al. | A deep SE (3)-equivariant model for learning inverse protein folding | |
US20200209236A1 (en) | Methods for identifying candidate biomarkers | |
Yang et al. | DeepNetBim: deep learning model for predicting HLA-epitope interactions based on network analysis by harnessing binding and immunogenicity information | |
JP2021523680A (ja) | アミノ酸配列改変に基づくタンパク質の特性への影響の決定 | |
US11532377B2 (en) | Systems and methods for modeling a protein parameter for understanding protein interactions and generating an energy map | |
KR20230098219A (ko) | 생물치료제 개발 방법 및 시스템 | |
US11749377B2 (en) | Method and electronic system for predicting at least one fitness value of a protein, related computer program product | |
CN115280417A (zh) | 使用机器学习技术基于模板蛋白质序列来生成蛋白质序列 | |
Kashani-Amin et al. | A systematic review on popularity, application and characteristics of protein secondary structure prediction tools | |
KR102182091B1 (ko) | 면역항암제에 대한 저항성을 예측하는 방법 및 분석장치 | |
Carrillo-Rodriguez et al. | Mass spectrometry-based proteomics workflows in cancer research: the relevance of choosing the right steps | |
JP2023530719A (ja) | 表面提示ペプチドを予測するための機械学習技術 | |
Arican et al. | PredDRBP-MLP: Prediction of DNA-binding proteins and RNA-binding proteins by multilayer perceptron | |
KR102171681B1 (ko) | 기계 학습 알고리즘을 이용하여 표적 단백질과 결합하는 후보 rna 압타머를 생성하는 프로그램을 기록한 컴퓨터로 판독할 수 있는 기록 매체 및 후보 rna 압타머를 생성하는 방법 | |
Ouellet et al. | CysPresso: a classification model utilizing deep learning protein representations to predict recombinant expression of cysteine-dense peptides |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220225 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230404 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231208 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20231215 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20240126 |