JP2021523680A - アミノ酸配列改変に基づくタンパク質の特性への影響の決定 - Google Patents

アミノ酸配列改変に基づくタンパク質の特性への影響の決定 Download PDF

Info

Publication number
JP2021523680A
JP2021523680A JP2020544771A JP2020544771A JP2021523680A JP 2021523680 A JP2021523680 A JP 2021523680A JP 2020544771 A JP2020544771 A JP 2020544771A JP 2020544771 A JP2020544771 A JP 2020544771A JP 2021523680 A JP2021523680 A JP 2021523680A
Authority
JP
Japan
Prior art keywords
protein
modified
group
amino acid
proteins
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020544771A
Other languages
English (en)
Other versions
JPWO2019165411A5 (ja
Inventor
シェイヴァー,ジェレミー,マーティン
Original Assignee
ジャスト バイオセラピューティクス,インコーポレイテッド
ジャスト バイオセラピューティクス,インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ジャスト バイオセラピューティクス,インコーポレイテッド, ジャスト バイオセラピューティクス,インコーポレイテッド filed Critical ジャスト バイオセラピューティクス,インコーポレイテッド
Publication of JP2021523680A publication Critical patent/JP2021523680A/ja
Publication of JPWO2019165411A5 publication Critical patent/JPWO2019165411A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

タンパク質のアミノ酸配列の置換がベースタンパク質の特性に与える影響の決定に関連する技術について説明する。特定の置換を包含するタンパク質についての特性の値は、前記特定の置換を包含しないタンパク質についての特性の値に関して分析される。分析を利用して、発現する必要のあるタンパク質の数を最小限に抑えながら、タンパク質についての特性に対する特定の置換の影響を特定できる。タンパク質に対する特定の置換の影響は、タンパク質の安定性及び/又は収量の変化を示している可能性がある。【選択図】 図1

Description

関連出願への相互参照
本出願は、2018年2月26日に提出され、「アミノ酸配列改変に基づくタンパク質の特性への影響の決定」というタイトルの米国仮出願第62/635,536号の優先権を主張し、その全体は参照により本明細書に組み入れられる。
背景
タンパク質は、化学結合を介してリンクされているアミノ酸のシーケンスで構成されている。特定のタンパク質のアミノ酸配列は、それからタンパク質が発現するデオキシリボ核酸(DNA)のヌクレオチドの配列に基づいている。タンパク質の機能性と構造は、当該タンパク質のアミノ酸配列に基づくことができる。タンパク質は、酵素活性の調節や細胞内シグナル伝達など、生物内でさまざまな機能を持つことができる。一部のタンパク質は、生物学的状態を治療するために治療的に使用することもできる。例えば、抗体などのタンパク質は病原体に結合して、T細胞やマクロファージなどの生物の他の薬剤による破壊のために病原体を標的にすることができる。別の例では、タンパク質は分子に結合して、分子を生物の標的位置に輸送し、生物学的状態の表現型を緩和することができる。
タンパク質を治療的に利用することの有効性と実行可能性は、特定の環境条件下でのタンパク質の安定性に依存する。いくつかの場合において、タンパク質の環境で温度が上昇すると、タンパク質の機能が低下することがある。例を挙げれば、タンパク質は特定の温度にさらされると反応して展開し、その結果、タンパク質が標的分子に結合する能力が失われる。さらに、一部のタンパク質の発現は、特に低収量にもかかわらず、コストがかかる可能性がある。特定のシナリオでは、タンパク質の収量は、タンパク質が発現される(expressed)環境条件との関係でタンパク質の堅牢性に依存する可能性がある。例えば、一部のタンパク質の収量は、タンパク質が曝される環境でpHが低下すると、低下する可能性がある。
図面の簡単な説明
図1は、ベースタンパク質の変異体であるタンパク質の特性に対するベースタンパク質のアミノ酸配列への置換の影響を決定するためのアーキテクチャのいくつかの実装の図である。 図2は、ベースタンパク質のアミノ酸配列に候補置換を有する改変タンパク質を、候補置換を包含しない単一の改変タンパク質と結合させる(couple)ための技術のいくつかの実装を示している。 図3は、ベースタンパク質のアミノ酸配列に候補置換を有する改変タンパク質を、候補置換を包含しない複数の改変タンパク質と結合させるための技術のいくつかの実装を示す。 図4A及び図4Bは、候補置換を有しない改変タンパク質の特性の値に関して、ベースタンパク質のアミノ酸配列への候補置換を有する改変タンパク質の特性の値の間の差異を分析する技術のいくつかの実装を示す。 図5は、タンパク質のアミノ酸配列に対する改変に基づいてタンパク質の特性への影響を決定するためのシステムのいくつかの実装を示している。 図6は、タンパク質のアミノ酸配列の置換によって影響を受けるタンパク質の特性を識別するための第1の例示的なプロセスのフロー図である。 図7は、タンパク質のアミノ酸配列の置換によって影響を受けるタンパク質の特性を識別するための第2の例示的なプロセスのフロー図である。 図8Aは、ベースタンパク質に関して特定の置換を包含するように改変されたタンパク質の特性の値の第1のプロット及び特定の置換を包含するように改変されていないタンパク質の特性の値の図を示す。 図8Bは、特定の置換を包含するように改変されたタンパク質と、特定の置換を包含するように改変されていないタンパク質との間の結合を示す第2のプロットを図示する。 図9は、図8の第2のプロットに示される結合に基づいて修正された図8の第1のプロットのデータポイントを示すプロットを図示する。 図10は、第1の候補置換を有するタンパク質に由来するデータの第1のグループと第1の候補置換を有しないタンパク質に由来するデータの第2のグループとの間の平均の差を示す第1のプロット、及び第2の候補置換を有するタンパク質に由来するデータの第1のグループと第2の候補置換を有しないタンパク質に由来するデータの第2のグループとの間の平均の差を示す第2のプロットを図示する。
詳細な説明
本明細書に記載される概念は、タンパク質のアミノ酸配列への改変に基づいてタンパク質の特性への影響を決定することを対象とする。いくつかの例において、タンパク質のアミノ酸配列への改変は、タンパク質の安定性及びタンパク質の発現のための収量を改善することができる。特に、実装では、タンパク質の配列に包含される特定のアミノ酸に改変を加えることにより、タンパク質が展開する温度を上げることができる。追加の状況では、タンパク質の配列内のアミノ酸に特定の改変が加えられると、タンパク質が分解し始めるpHを下げることができる。
多くの場合、タンパク質の特性を改善するために改変できるタンパク質配列内のアミノ酸残基を特定することは困難である。特に、各タンパク質配列には数百から最大数千のアミノ酸が含まれている可能性があり、改変する特定のアミノ酸を特定して、タンパク質の特性を改善することは、時間とリソースを消費するプロセスになる可能性がある。つまり、特定の位置で現在のアミノ酸を置き換えるためにどのアミノ酸を使用するかを決定することは、時間とリソースを消費するプロセスになる可能性がある。さらに、タンパク質のアミノ酸配列への変更は時には意図しない結果になることがあるので、アミノ酸配列へのいくつかの変更の影響を予測することは困難である。(Eriksson AE, Baase WA, Zhang XJ, Heinz DW, Blaber M, Baldwin EP, Matthews BW: Response of a protein structure to cavity−creating mutations and its relation to the hydrophobic effect. Science. 1992, 255 (5041): 178−183. 10.1126/science.1553543を参照)。
典型的には、タンパク質のアミノ酸配列への改変がタンパク質の特定の特性に影響を与えるかどうかを判断するには、タンパク質の発現に使用されるDNAを変更して、特定の位置の改変されたアミノ酸配列をコードするように変更される、そして次にタンパク質は改変されたDNAの翻訳を通じて発現することができる。したがって、タンパク質配列の位置の改変を検討して改変の効果を決定するたびに、新しいタンパク質をコードするDNAを合成する必要があり、改変タンパク質を発現させる必要があり、及びその後改変タンパク質の特性をテストできる。改変タンパク質の特性を非改変タンパク質の特性と比較して、特定の位置でのアミノ酸の改変がタンパク質の特性に影響を与えるかどうかを判断できる。したがって、複数の異なるアミノ酸置換の複数の位置での置換を分析する場合、非改変タンパク質の特性に関して改変の効果を決定するために、数千ではないにせよ数百のタンパク質分子を発現させて試験する必要がある。
いくつかの従来の技術は、均衡なデータセットを分析することにより、タンパク質のアミノ酸配列に対する特定の置換の影響を予測しようと試みる場合がある。均衡なデータセットでは、特定の置換を有する発現される各タンパク質について、特定の置換を包含しない少なくとも1つ以上の追加のタンパク質が発現される。均衡データセットを利用して、アミノ酸配列の改変がタンパク質の特定の特性に統計的に有意な影響を与えるかどうかを判断できる。均衡なデータセットを作成することにより、単一の位置での置換によって生じたいずれの変更は、直接置換に起因する可能性がある。ただし、多くの置換を評価する必要があり、均衡なデータセットを生成するために発現する必要があるタンパク質の数が比較的多い場合(数百以上のタンパク質など)、状況によっては、均衡の取れたデータセットを使用することが実際的でない場合がある。したがって、発現培地、ベクター、宿主細胞などのタンパク質を発現するために必要な材料の量は、法外な費用になる可能性がある。別の方法では、タンパク質への改変の数は少ないかもしれないが、このアプローチは、タンパク質の特性に影響を与えるアミノ酸配列改変を決定する可能性を制限する。
本明細書に記載されている技術は、不均衡なデータセットを利用して、改変タンパク質の収量を改善するため、及び/又はベースタンパク質に関連して改変タンパク質の安定性を改善するために改変できるベースタンパク質の残基を特定する。本明細書で使用される場合、「ベースタンパク質」は、実験室環境でヒト及び/又は機械によってタンパク質のDNA配列に加えられた改変によって生成される、そのアミノ酸配列にいかなる変化も受けていないタンパク質を指す。特定の実装では、ベースタンパク質のアミノ酸配列に関する改変を包含する一群のタンパク質を発現させることができる。すなわち、前記一群のタンパク質に含まれるタンパク質は、ベースタンパク質の同じ位置にあるアミノ酸に対して改変されている1つ以上の位置に配置されたアミノ酸を持つことができる。例えば、ベースタンパク質は特定の位置にアラニンを持つことができる一方、改変されたタンパク質は同じ位置にグアニンを持つことができる。特定のケースでは、改変されたタンパク質のアミノ酸配列は、ベースタンパク質のアミノ酸配列に対して複数の位置で異なり得る。ベースタンパク質に対する改変は、ベースタンパク質のDNA配列を改変すること、及び次いで改変DNA配列を利用して改変タンパク質を発現させることにより行われる。
タンパク質のアミノ酸配列の特定の位置で置換を行うことの効果を決定するために、置換を有する第1のセットのタンパク質を発現させることができ、且つ置換を有しない第2のセットのタンパク質を発現させることができる。複数の置換を評価することができるように、タンパク質の第1のセットとタンパク質の第2のセットのアミノ酸配列の間に他の違いもあり得る。特定の置換が行われた各タンパク質について、置換が行われなかった1つ以上の追加のタンパク質を特定し、置換が行われた対応するタンパク質に関連付けることができる。特定の実施において、特定の置換を包含するタンパク質のアミノ酸配列は、特定の置換を有しないタンパク質のアミノ酸配列と複数の違いを有し得る。これらの状況では、
特定の置換を持つ個々のタンパク質は、特定の置換を有する個々のタンパク質のアミノ酸配列と特定の置換を有しないタンパク質のアミノ酸配列との間の差異の数を最小限にするような方法で、特定の置換を持たない1つ以上のタンパク質と結合できる。特定の状況では、置換を持たない複数のタンパク質を、置換を包含する単一のタンパク質に結合することができる。
特定の置換を有するタンパク質と、置換が行われなかった1つ又は複数のタンパク質との間で関連付けが行われた後、タンパク質の1つ以上の特性の値の間の差を決定することができる。特定の置換を持つ単一のタンパク質が置換を持たない複数のタンパク質と結合している実装では、置換されていない複数のタンパク質の特性の値の平均を求めるなどして、置換されていない複数のタンパク質の特性の値を単一の値に結合できる。これらの状況では、置換されていない複数のタンパク質の特性の単一の値を利用して、置換されている特性の値との差を決定できる。このようにして、本明細書に記載されている技術は、均衡なデータセットの欠如を補償することができる。したがって、本明細書で説明する技法を実装することにより、不均衡なデータセットを利用して、興味対象の置換がタンパク質の特性に影響を与えるかどうかを正確に判断できる。さらに、均衡なデータセットの代わりに不均衡なデータセットを利用することにより、多数の置換がタンパク質の特性に影響を与えるかどうかを判断するために、発現する必要があるタンパク質の数が削減される。発現されるタンパク質の数を減らすと、タンパク質の特性に影響を与えるアミノ酸配列への置換を特定するために使用されるリソースが少なくなる。
いくつかの場合において、分析されている特性は、タンパク質の安定性に関連している可能性がある。例えば、特定の置換を有するタンパク質が展開する温度と、置換を有しない1つ以上のタンパク質が展開する温度との間の差を決定することができる。別の例では、特定の置換を有するタンパク質のギブス自由エネルギーと、置換を有しない1つ以上のタンパク質との間の差を決定することができる。さらに、評価される特性は、置換を包含しないタンパク質と比較して、特定の置換を包含するタンパク質の収量の改善に関連している可能性がある。特定の置換を有するタンパク質と置換を有しないタンパク質の特性の値の間の差に少なくとも部分的に基づいて、置換が特定の特性に影響を与えるかどうかに関して決定を行うことができる。様々な実施において、特定の置換を有するタンパク質の特性の値と置換を有しないタンパク質の特性の値との間の差が統計的に有意であるかどうかを決定するために分析を行うことができる。アミノ酸配列の特定の位置への置換に基づくタンパク質の特定の物理的特性の変化を相関させることにより、より安定したタンパク質及び/又は高収量で生産できるタンパク質につながる可能性のある、ベースタンパク質への変更を行うことができる。いくつかの場合において、改変されたタンパク質は、いくつかの改善された特性を備えたベースタンパク質と同じ又は同様の機能を持つことができる。タンパク質の安定性が高まると、ベースタンパク質が生存できない条件下でも、タンパク質が生存し続ける可能性がある。したがって、改変タンパク質は、ベースタンパク質が存在できなかった条件下で輸送及び/又は保存することができる。これにより、ベースタンパク質よりも改変タンパク質を利用した治療を受けることができる対象の数を増やすことができる。一部の対象は、冷蔵が利用できない地域や、ベースタンパク質に適さない可能性がある気候の地域に居住している可能性があるためである。さらに、ベースタンパク質のアミノ酸配列の位置への置換を介してベースタンパク質の特定の物理的特性を改変することにより、ベースタンパク質に関して改変されたタンパク質の収量を増加させることができる。すなわち、改変タンパク質の物理的特性により、改変されたタンパク質の発現中にそれがより堅牢になり、同じ条件下でベースタンパク質より多くの改変されたタンパク質が生成される可能性がある。このようにして、タンパク質の製造コストを削減できる。
以下の詳細な説明では、本明細書の一部を形成し、例として特定の構成又は例を示す添付の図面を参照する。本明細書の図面は、一定の縮尺で描かれていない。同様の数字は、いくつかの図面(本明細書では「FIG」又は「FIGS」と呼ばれる場合がある)全体にわたって同様の要素を表す。
図1は、ベースタンパク質の変異体であるタンパク質の特性に対するベースタンパク質のアミノ酸配列への置換の影響を決定するためのアーキテクチャ100のいくつかの実装の図である。特に、アーキテクチャ100は、ベースタンパク質102の特定の位置におけるアミノ酸の置換を識別すること、及び置換がベースタンパク質102の特性に関連して改変タンパク質の特定の物理的特性に影響を与えるかどうかを決定することを対象とする。ベースタンパク質102は、化学的に結合したアミノ酸の配列を含むことができる。いくつかの場合において、ベースタンパク質102を構成するアミノ酸は、ペプチド結合を介して互いに結合することができる。
ベースタンパク質102は、アミノ酸配列の異なる部分の間に形成される二次構造を有することができる。ベースタンパク質102の二次構造のいくつかの例は、αヘリックス又はβシートを包含し得る。ベースタンパク質102はまた、1つ以上のターン及び/又は1つ以上のループを包含し得る。さらに、ベースタンパク質102は、ベースタンパク質102の折り畳みによって生成される三次構造を有することができる。ベースタンパク質102の三次構造は、三次元構造であることができる。
ベースタンパク質102は、生物学的機能を有することができる。ベースタンパク質102の生物学的機能は、ベースタンパク質102のアミノ酸配列及び/又はベースタンパク質102の三次元構造に少なくとも部分的に基づくことができる。いくつかの特定の例では、ベースタンパク質102は酵素として機能することができる。酵素は、生物内で1つ以上の化学反応を引き起こす可能性がある。さまざまな状況で、酵素は生物内で生化学反応を起こすための触媒となり得る。特定のシナリオでは、酵素は別の分子に結合して化学反応を進行させることができる。さらに、酵素は分子に結合し、分子を改変して生成物を生成することができ、そこで、生成物は化学反応に参加することができる。酵素の機能に関する詳細情報は、
Martinez Cuesta S, Rahman SA, Furnham N, Thornton JM. The Classification and Evolution of Enzyme Function. Biophysical Journal. 2015;109(6):1082−1086. doi:10.1016/j.bpj.2015.04.020
にある。これは、参照により全体が本明細書に組み込まれる。
他の例では、ベースタンパク質102は抗体として機能することができる。抗体は、生物の免疫系による反応を引き起こす分子に結合することができる。抗体が結合する分子は、抗原を包含し得る。「抗体」という用語は最も広い意味で使用され、完全に組み立てられた抗体、モノクローナル抗体(ヒト、ヒト化又はキメラ抗体を包含する)、ポリクローナル抗体、多重特異性抗体(例えば、二重特異性抗体)、及び抗原に結合できる抗体フラグメント(例えば、Fab、Fab’、F(ab’)2、Fv、一本鎖抗体、ダイアボディ)を包含し、それらが所望の生物学的活性を示す限り、前述のものの相補性決定領域(CDR)を含む。化学的に誘導体化された抗体を包含する、インタクトな分子及び/又はフラグメントの多量体又は凝集体が企図される。抗体フラグメントの例は、IgG、IgM、IgD、IgA、及びIgE、IgG1、IgG2、IgG3、IgG4、IgA1及びIgA2、又はいずれのアロタイプを包含する、いずれのアイソタイプクラス又はサブクラスの抗体を包含することができる。
抗体はY字型の構造を持つことができ、2つの重鎖と2つの軽鎖とを包含する。重鎖には軽鎖よりも多くのアミノ酸が含まれている。いくつかの場合において、重鎖はそれぞれ、ヒンジ領域に結合された第1の定常領域に結合された可変領域を包含することができる。次に、ヒンジ領域は、第2の定常領域に結合され、第2の定常領域は、いくつかの状況では、第3の定常領域に結合され得る。軽鎖はそれぞれ、定常領域及び可変領域を包含することができる。軽鎖の定常領域は、軽鎖のクラスを示すことができる。例えば、抗体の軽鎖は、哺乳動物のκクラス又はλクラスと関連している可能性がある。抗体に関する詳細情報は、Schroeder HW, Cavacini L. Structure and Function of Immunoglobulins. The Journal of allergy and clinical immunology. 2010;125(2 0 2):S41−S52. doi:10.1016/j.jaci.2009.09.046
に記載されている。これは、参照により全体が本明細書に組み込まれる。
ベースタンパク質102は、1つ以上のベースタンパク質特性104を包含し得る。ベースタンパク質特性104は、ベースタンパク質102の物理的特性、ベースタンパク質102の化学的特性、又はそれらの組み合わせを包含し得る。ベースタンパク質特性104は、ベースタンパク質102の熱安定性、ベースタンパク質102の化学的安定性、ベースタンパク質102のpH感度、又はそれらの組み合わせを示すことができる。特定の状況において、ベースタンパク質102の熱安定性は、ベースタンパク質102のギブス自由エネルギーの変化の測定によって示され得る。さらに、ベースタンパク質102の熱安定性は、ベースタンパク質102が展開する温度によって示され得る。ベースタンパク質102の化学的安定性は、ベースタンパク質102の特定の二次構造の形成によって示され得る。ベースタンパク質特性104は、ベースタンパク質102の特定の特性の測定に向けられた1つ以上のアッセイを利用することによって決定することができる。
106では、ベースタンパク質102の変異体を発現させることができ、改変されたタンパク質108を生成することができる。改変されたタンパク質108は、発現されることになるベースタンパク質102のバリエーションをコードするデオキシリボ核酸(DNA)配列を合成することによって発現され得る。例えば、ベースタンパク質102の特定の位置でアミノ酸を改変するために、ベースタンパク質102をコードするDNA配列は、特定の位置のアミノ酸をコードする領域で改変できる。これにより、DNA領域がメッセンジャーリボ核酸(mRNA)に転写され、その後、改変タンパク質に翻訳されると、別のアミノ酸が発現される。改変タンパク質108をコードするDNAは、発現培地に含まれる宿主に置くことができる。いくつかの状況では、発現培地は溶液を包含することができ、宿主は哺乳動物細胞又は細菌細胞などの細胞を包含することができる。改変タンパク質108をコードするDNAは、ベクターを使用して宿主に付加することができる。ベクターは、改変タンパク質108のDNAを挿入することができるプラスミド又は他のDNA配列を包含することができる。タンパク質が発現された後、精製技術を利用して、発現培地から改変タンパク質108を回収することができる。抗体などのタンパク質の発現技術については、Frenzel A, Hust M, Schirrmann T. Expression of Recombinant Antibodies. Frontiers in Immunology. 2013;4:217. doi:10.3389/fimmu.2013.00217で議論されている。これは、参照により全体が本明細書に組み込まれる。
図1の例示的な実装では、改変タンパク質108は、第1の置換112、第2の置換114、及び第3の置換116を有する第1の改変タンパク質110を包含することができる。加えて、改変タンパク質108は、第2の置換114及び第3の置換116を有する第2の改変タンパク質118を包含する。さらに、改変タンパク質108は、第1の置換112、第3の置換116、及び第4の置換122を有する第3の改変タンパク質120を包含する。前記置換112、114、116、122は、ベースタンパク質102の特定の位置でのアミノ酸の変化を表す。図1の例示的な例に示される、置換112、114、116、122を表す正方形は、縮尺通りではなく、ベースタンパク質102の複数の位置をカバーすることができる。しかしながら、置換112、114、116、122に対応する正方形は、単に例示を目的としたものであり、特定の置換112、114、116、122を示すことを意図している。
改変タンパク質108が発現された後、124で、改変タンパク質特性126の値を決定することができる。いくつかの実装形態では、改変タンパク質特性126の値は、ベースタンパク質特性104の値を決定するために利用されるものと同様の技術を使用して決定することができる。すなわち、ベースタンパク質102の特定の特性の値を決定するために利用されるアッセイは、特定の実装では、改変タンパク質特性126の値は、改変タンパク質108に関して1つ以上の分析技術を実行することによって得ることができる。
環境100は、ベースタンパク質102に対応するデータに関して改変タンパク質108に対応するデータを分析するタンパク質分析システム128を包含する。タンパク質分析システム128は、1つ以上のコンピューティングデバイス130によって実装することができる。1つ以上のコンピューティングデバイス130は、1つ以上のサーバーコンピューティングデバイス、1つ以上のデスクトップコンピューティングデバイス、1つ以上のラップトップコンピューティングデバイス、1つ以上のタブレットコンピューティングデバイス、1つ以上のモバイルコンピューティングデバイス、又はそれらの組み合わせを包含し得る。特定の実装形態では、1つ以上のコンピューティングデバイス130の少なくとも一部は、分散コンピューティング環境で実装することができる。例えば、1つ以上のコンピューティングデバイス130の少なくとも一部は、クラウドコンピューティングアーキテクチャで実装することができる。
いくつか場合には、タンパク質分析システム128は、ベースタンパク質102に対して行われた置換がベースタンパク質102の特定の特性に関して効果をもたらすかどうかを決定することができる。特定の実装において、ベースタンパク質102の1つ以上の特性の値に影響を与える、ベースタンパク質102のさまざまな位置でのアミノ酸の置換を識別するため、ベースタンパク質特性104の値に関して、改変されたタンパク質特性126の値を分析することができる。特定の状況では、タンパク質分析システム128は、ベースタンパク質102に対する改変タンパク質108の化学的安定性を改善する方法で、改変タンパク質108の特性に影響を与えるベースタンパク質102のアミノ酸配列への置換を特定することができる。タンパク質分析システム128はまた、ベースタンパク質102に対する改変タンパク質108の熱安定性を改善する方法で、改変タンパク質108の特性に影響を与えるベースタンパク質102のアミノ酸配列への置換を特定することができる。ベースタンパク質102に対する改変タンパク質108の化学的安定性及び/又は熱安定性を改善する置換を特定することにより、タンパク質分析システム128は、置換が行われなかった改変タンパク質108の収量に関して改善された収量を有する1つ以上の改変タンパク質108、及び/又は置換が匹敵する環境条件下で行われなかった改変タンパク質108よりも長期間生存可能である1つ以上の改変タンパク質108を特定することができる。置換を包含しかつ置換を包含しない改変タンパク質108の値に関して置換の影響を決定することにより、ベースタンパク質102の特性に対する置換の影響をタンパク質分析システム128によって決定することができる。
タンパク質分析システム128は、候補置換132が、候補置換132を包含する改変タンパク質108の特性の値及び候補置換132を包含しない改変タンパク質108の特性の値に影響を与えるかどうかを判断するため、改変タンパク質特性126の値及び1つ以上の候補置換132を利用することができる。特に、134で、タンパク質分析システム128は、改変されたタンパク質特性126の値及び1つ又は複数の候補置換132を利用して、初期データセット136を生成することができる。初期データセット136は、候補置換132が行われた改変タンパク質108の第1のグループ138と、候補置換132が行われていない改変タンパク質108の第2のグループ140とを包含することができる。初期データセット136はまた、第1のグループ138の特性の第1の値142及び第2のグループ140の特性の第2の値144を包含することができる。
タンパク質分析システム128は、改変タンパク質108のアミノ酸配列を分析すること、及び候補置換132を包含する改変タンパク質108のサブセット及び候補置換132を包含しない改変タンパク質108の別のサブセットを識別することにより、初期データセット136を生成することができる。他の実装態様では、タンパク質分析システム128は、候補置換132を有する改変タンパク質108の第1のグループ138及び候補置換132を包含しない改変タンパク質108の第2のグループ140を示すデータを取得することができる。さらに、タンパク質分析システム128は、第1の値142及び第2の値144を示すデータを取得することができる。特定の実装形態では、タンパク質分析システム128は、第1のグループ138及び第2のグループ140を示すデータファイルを取得することができる。様々な実装において、データファイルはまた、第1の値142及び第2の値144を包含し得る。別の例では、タンパク質分析システム128は、第1のグループ138、第2のグループ140、第1の値142、第2の値144、又はそれらの組み合わせに対応する1つ以上のユーザーインターフェースを介してデータを取得できる。
146で、タンパク質分析システム128は、初期データセット136から修正データセットを生成することができる。例えば、148で、タンパク質分析システム128は、第1のグループ138からの各改変タンパク質を1つ以上の改変タンパク質と結合することができる。図示すると、タンパク質分析システム128は、第1のグループ138に含まれる個々の改変タンパク質に対応する、第2のグループ140に含まれる改変タンパク質の1つ以上を決定することができる。特定の実装態様では、タンパク質分析システム128は、第2のグループ140の改変タンパク質のアミノ酸配列に関して第1のグループ138の各改変タンパク質のアミノ酸配列を分析することにより、第1のグループ138の改変されたタンパク質に対応する第2のグループ140の1つ以上の改変されたタンパク質を識別することができる。特定の実装では、タンパク質分析システム128は、候補置換132を除いて、第1のグループ138の改変タンパク質と同じアミノ酸配列を有する第2のグループ140の改変タンパク質を同定することができる。したがって、候補置換132を持たない第2のグループ140の改変タンパク質及び候補置換132を持つ第1のグループ138の改変タンパク質のアミノ酸配列の間に単一の違いがある。これらの状況では、タンパク質分析システム128は、候補置換132を有しない第2のグループ138の改変タンパク質を、候補置換132を有する第1のグループ138の改変タンパク質と結合することができる。
特定の状況において、第2のグループの改変タンパク質140のアミノ酸配列と第1のグループ138の改変タンパク質の間の単一の違いは、タンパク質の全体的なアミノ酸配列の一部内の単一の差異を意味し得、2つのタンパク質のアミノ酸配列の残りは実質的に同一であり得る。例示的な例では、第1のグループ138からの改変タンパク質のアミノ酸配列と第2のグループ140の改変タンパク質との間の単一の違いは、重鎖の定常領域又は軽鎖の定常領域にあり得る一方、2つの改変タンパク質の重鎖及び軽鎖の可変領域など、残りのアミノ酸配列は実質的に同一である。同一性の程度は、各アミノ酸配列の一部、又はアミノ酸配列の全長に向けることができる。「実質的に同一」である2つ以上のアミノ酸配列又はアミノ酸配列の一部は、少なくとも50%の同一性、好ましくは少なくとも75%の同一性、より好ましくは少なくとも85%の同一性、最も好ましくは少なくとも95%、又は100%の同一性を有し得る。
例示的な例では、候補置換132は第1の置換112であり得、タンパク質分析システム128は、第1の改変タンパク質110及び第3の改変タンパク質120を第1のグループ138に、且つ、第1の置換112及び第1の置換112を包含する第3の改変たんぱく質120及び第1の置換112を持たない第2の改変タンパク質118に基づいて、第2の改変タンパク質118を第2のグループ140に配置することができる。さらに、タンパク質分析システム128は、第1の改変タンパク質110を第2の改変タンパク質に結合することができる。なぜなら、第1の改変タンパク質110及び第2の改変タンパク質118は、第1の置換112を除いて、同じアミノ酸配列を有するからである。
様々な実装において、タンパク質分析システム128は、第1のグループ138と第2のグループ140に含まれる改変タンパク質108のアミノ酸配列の間に複数の違いがあることを決定することができる。これらのシナリオでは、タンパク質分析システム128は、第1のグループ138の個々の改変されたタンパク質のアミノ酸配列と第2のグループ140の改変されたタンパク質のアミノ酸配列との間の差異を最小にする方法で、候補置換132を有する第1のグループ138の改変タンパク質を、候補置換132を有しない第2のグループ140の1つ以上の改変タンパク質と結合することができる。例えば、タンパク質分析システム128は、第1のグループ138の個々の改変されたタンパク質のアミノ酸配列と、第2のグループ140の1つ以上の改変タンパク質との間の最小数の差異を決定することができる。例示すると、タンパク質分析システム128は、第1のグループ138の個々の改変タンパク質と第2のグループ140の少なくとも1つの改変タンパク質のアミノ酸配列の間に2つの違いがあると決定することができる。これらの状況では、タンパク質分析システム128は、第1のグループ138の個々の改変タンパク質を第2のグループ140の少なくとも1つの改変タンパク質と結合することができる。特定のシナリオでは、第1のグループ138の個々の改変タンパク質は、第2のグループ140の複数の改変タンパク質と結合することができる。特定の例では、タンパク質分析システム128は、第1のグループ138の改変されたタンパク質と第2のグループ140の2つの改変されたタンパク質のアミノ酸配列間の差の最小数が2であることを決定することができる。及び結果として、タンパク質分析システム128は、第1のグループ138の個々の改変タンパク質を、第2のグループ140からの2つの改変タンパク質と結合することができる。
特定の実装態様では、タンパク質分析システム114は、第2のグループ140の改変タンパク質が第1のグループ138の複数の改変タンパク質との最小数の差異を有することを決定できる。例えば、タンパク質分析システム128は、第1のグループ138の第1の改変タンパク質と第2のグループ140の改変タンパク質との間の最小数の差が2であること、及び第1のグループ138の第2の改変タンパク質と第2のグループ140の改変タンパク質との間の差の最小数が3であることを決定することができる。次に、タンパク質分析システム128は、第2のグループ140の改変タンパク質を第1のグループ138の第1の改変タンパク質及び第1のグループ138の第2の改変タンパク質に結合することができる。いくつかの実装態様では、第2のグループ140の他の改変タンパク質はまた、第1のグループ138の第1の改変タンパク質及び第2のグループ140の第2の改変タンパク質と結合することができる。
タンパク質分析システム128が、150で、第1のグループ138の各改変タンパク質を第2のグループ140の1つ以上の改変タンパク質と結合することにより改変データセットを生成した後、タンパク質分析システム128は、修正されたデータセットを分析することができる。修正されたデータセットを分析することは、152において、第1のグループ138の個々の改変タンパク質の特性の値と、第1のグループ138の個々のタンパク質に結合される第2のグループ140のそれぞれの改変タンパク質との間の差を決定することを包含し得る。第2のグループ140の単一の改変タンパク質が第1のグループ138の改変タンパク質と結合している状況では、タンパク質分析システム128は、改変されたタンパク質の1つ以上の特性の値の間の差を決定することができる。例示的な例では、第1の改変タンパク質110は、第2の改変タンパク質118と結合され得る。そして、タンパク質分析システム128は、第1の値142を解析して、第1の改変タンパク質110が展開する温度の値を識別し、且つ、第2の値144を解析して、第2の改変タンパク質118が展開する温度の値を識別することができる。次に、タンパク質分析システム128は、第1の改変タンパク質110が展開する温度と第2の改変タンパク質118が展開する温度との間の差を決定することができる。タンパク質分析システム128は、第1のグループ138と第2のグループ140から一緒に結合された改変タンパク質の各ペアについて、及び、第1の値142及び第2の値144に含まれる各特性について、特定の特性の値の間の差を決定するために進むことができる。
第2のグループ140の複数の改変タンパク質が第1のグループ138の単一のバリアント特性に結合されている状況では、第1のグループ138の改変されたタンパク質の特性の値と、結合されている第2のグループ140の改変されたタンパク質の特性の値との間の差を見出す前に、第2のグループ140の改変タンパク質の値を組み合わせることができる。いくつかの実装形態では、タンパク質分析システム128は、第1のグループ138の改変されたタンパク質と結合している第2のグループ140の改変されたタンパク質の第2の値144の平均を決定することができる。次に、タンパク質分析システム128は、第2のグループ140の改変されたタンパク質の特性の値の平均と第1のグループ140の改変されたタンパク質の特性の値との間の差を決定することができる。他の状況では、タンパク質分析システム128は、第1のグループ138の改変されたタンパク質と結合している第2のグループ140の改変されたタンパク質の特性の値の中央値を決定することができる。次に、タンパク質分析システム128は、第2のグループ140の改変されたタンパク質の特性の値の中央値と第1のグループ138の改変されたタンパク質の特性の値の間の差を決定することができる。
タンパク質分析システム128によって生成された修正されたデータセットは、初期データセット136の修正されたバージョンに対応することができる。すなわち、第1のグループ138の個々の改変されたタンパク質と結合される第2のグループ140からの単一の改変されたタンパク質がない状況があるので、タンパク質分析システム128は、第2のグループ140の複数の改変タンパク質の特性の値の組み合わせに対応する特定の特性の値を有する代替改変タンパク質を生成する。このようにして、タンパク質分析システム128は、不均衡データセットの分析の影響を最小限に抑えながら、均衡なデータセットと同様の方法で分析できる修正データセットを作成することにより、不均衡データセットを分析できる。
修正されたデータセットの分析はまた、154において、改変されたタンパク質108の特性に対する候補置換132の1つ以上の効果を決定することを包含し得る。いくつかの例において、タンパク質分析システム128は、候補置換132によって影響を受ける改変タンパク質108の特定の特性を決定することができる。特定の実装態様では、タンパク質分析システム128は、候補置換132が行われた改変タンパク質108の1つ以上の特性の値と候補置換132が行われた改変タンパク質108の1つ以上の特性の値との差に基づき、候補置換132が改変タンパク質108の1つ以上の特性に影響を与えることを決定することができる。例示すると、タンパク質分析システム128は、第2のグループ140のタンパク質と結合された第1のグループ138のタンパク質については、結合された改変タンパク質の特性の値の間の差を分析して、値の差の間に統計的有意性があるかどうかを判定することができる。結合された第1のグループ138と第2のグループ140の改変タンパク質の特性の値の間に統計的に有意な差がある状況では、タンパク質分析システム128は、候補置換132が特性の値に影響を与えると決定することができる。
様々な実装において、提案された置換118が影響を与える1つ以上の特性は、改変タンパク質108の産生に影響を及ぼし得る、及び/又は改変タンパク質108の安定性に影響を及ぼし得る。例えば、タンパク質分析システム128は、改変タンパク質108の収量を増加させる改変タンパク質108の1つ又は複数の特性を特定することができる。別の例では、タンパク質分析システム128は、比較的高い温度での改変タンパク質の安定性を改善する改変タンパク質108の1つ以上の特性を特定することができる。すなわち、タンパク質分析システム128は、改変タンパク質108の少なくとも一部が展開する温度を上昇させる改変タンパク質108の1つ以上の特性を特定することができる。追加の例では、タンパク質分析システム128は、改変タンパク質108の少なくとも一部が可溶性であるpHを低下させる改変タンパク質108の1つ以上の特性を特定することができる。これらの状況では、タンパク質分析システム138は、候補置換132によって影響を受ける改変タンパク質108の特性を決定することができ、そして次に、候補置換132によって影響を受ける特定の特性に基づいて、改変タンパク質108の収量及び/又は安定性に対する候補置換132の影響を特定することができる。
図2は、ベースタンパク質のアミノ酸配列に候補置換を有する改変タンパク質を、候補置換を包含しない単一の改変タンパク質と結合させるための技術のいくつかの実装を示す。特に、図2に関して説明した手法の実装を利用して、関心のある置換の影響を決定するために、関心のある置換のない改変タンパク質を特定して、関心のある置換を持つ個々の改変タンパク質と結合することができます。改変タンパク質の特定の特性について。
特に、改変タンパク質の第1のグループ202は、ベースタンパク質204の配列に関して特定の位置で特定のアミノ酸の候補置換を有することができる。さらに、改変タンパク質の第2のグループ206は、候補置換を有しないタンパク質を包含することができる。第2のグループの改変タンパク質206は候補置換を有しないが、第2のグループの改変タンパク質206は他の置換を有することができる。一例では、ベースタンパク質204は抗体であり得、改変タンパク質202の第1のグループに含まれる改変タンパク質は、セリンがロイシンに変化する重鎖の定常領域の35位で置換を有し得る。
図2の例示的な例では、改変タンパク質202の第1のグループからの第1の改変タンパク質208は、第1の改変タンパク質208の様々な位置に配置された四角で示される置換の少なくとも一部で、ベースタンパク質204に対して複数の置換を包含することができる。例えば、第1の改変タンパク質208は、第1の置換210、第2の置換212、及び第3の置換214を有することができる。さらに、図2の例示的な例は、興味対象の置換を有しない改変タンパク質206の第2のグループに含まれる第2の改変タンパク質216、第3の改変タンパク質218、及び第4の改変タンパク質220を包含する。第2の改変タンパク質218はまた、第2の置換212及び第3の置換214を有することができるが、第1の置換208を有しない。これらの状況において、第1の置換208は、興味対象の置換が改変タンパク質の特性に及ぼす影響を特定するために評価されている興味対象の置換であり得る。さらに、第3の改変タンパク質218は、第2の置換212及び第4の置換222を有するが、第1の置換210及び第3の置換214を包含しない。さらに、第4の改変タンパク質220は、第3の置換212、第4の置換222、及び第5の置換224を包含するが、第1の置換210及び第2の置換212を包含しない。
図2の例示的な例に示される、置換210、212、214、222、224を表す正方形は、縮尺通りではなく、ベースタンパク質204の複数の位置をカバーすることができる。しかしながら、置換210、212、214、222、224に対応する正方形は、単に例示を目的としたものであり、特定の置換210、212、214、222、224を示すことを意図している。
興味対象の置換が改変タンパク質の特性に影響を与えるかどうかを決定するには、第1のグループ202に含まれる各改変タンパク質は、第2のグループ206に含まれる1つ以上の改変タンパク質と結合することができる。第1のグループ202からのタンパク質は、第1のグループ202の改変タンパク質のアミノ酸配列と第2のグループ206の改変タンパク質のアミノ酸配列との間のいくつかの差異に少なくとも部分的に基づき、第2のグループ206の1つ以上のタンパク質と結合することができる。特定の実装では、第1のグループ202の個々の改変タンパク質のアミノ酸配列は、第2のグループ206の個々の改変タンパク質のアミノ酸配列の少なくとも一部と比較することができる。第1のグループ202の各改変タンパク質は、第1のグループ202のそれぞれの改変タンパク質のアミノ酸配列と第2のグループの1つ以上の改変タンパク質のアミノ酸配列との間に最小数の差異を有する、第2のグループ206の1つ以上の改変タンパク質と結合することができる。


それぞれのアミノ酸配列間の差異の数が最小である第2のグループ206の1つ又は複数の改変タンパク質と結合することができる第1のグループ202の改変されたタンパク質及び第2のグループ206の改変されたタンパク質の1つ又は複数のアミノ酸配列。
図2の例示的な例では、第1の改変タンパク質208のアミノ酸配列を、第2の改変タンパク質216、第3の改変タンパク質218、及び第4の改変タンパク質220のアミノ酸配列と比較することができる。第1の改変タンパク質208のアミノ酸配列と改変タンパク質216、218、220のアミノ酸配列との比較は、第1の改変タンパク質208のアミノ酸配列と第2の改変タンパク質216のアミノ酸配列との間に1つの違いがあること、第1の改変タンパク質208のアミノ酸配列と第3の改変タンパク質218のアミノ酸配列の間に2つの違いがあること、及び第1の改変タンパク質208のアミノ酸配列と第4の改変タンパク質220のアミノ酸配列の間に3つの違いがあること、を決定することができる。これらの状況では、第3の改変タンパク質218及び第4の改変タンパク質220のアミノ酸配列に関して、第1の改変タンパク質208のアミノ酸配列との最小数の差異を有する第2の改変タンパク質216のアミノ酸配列に少なくとも部分的に基づいて、第1の改変タンパク質208は、第2の改変タンパク質216と結合することができる。同様に、第1のグループ202の他の改変タンパク質は、第2のグループ204の1つ以上の改変タンパク質と結合して、結合改変タンパク質のデータセット226を生成することができる。図2の例示的な例は、第1の改変タンパク質208及び第2の改変タンパク質216を包含するカップリング228を示す。データセット226に含まれる改変されたタンパク質カップリングの特性の値を分析して、興味対象の置換が、第2のグループ206に含まれる改変タンパク質の特性に関して、第1のグループ202に含まれる改変タンパク質の特性に影響を与えるかどうかを判断することができる。
図3は、ベースタンパク質のアミノ酸配列に候補置換を有する改変タンパク質を、候補置換を包含しない複数の改変タンパク質と結合させるための技術のいくつかの実装を示す。図3の例示的例に含まれる特徴は、図2の例示的例に含まれる特徴とは異なる。ここで、図3の例示的な例に含まれる特徴は、一対の改変タンパク質のカップリングに対応し、特定の位置での置換は、一対の改変タンパク質のアミノ酸配列間の単一の差異を表すことができる一方、図3の例示的な例に含まれる特徴は、興味対象の置換を有する単一の改変タンパク質を、置換を有しない複数の改変タンパク質に結合することに対応する。これらの状況では、興味対象の置換を有する単一の改変タンパク質の配列と複数の改変タンパク質との間の異なる位置に複数の違いがあり得る。
特に、図3の例示的な例は、ベースタンパク質304の配列に関して特定の位置で特定のアミノ酸の置換を有するタンパク質を持つ改変タンパク質302の第1のグループを包含する。図3の例示的な例は、興味対象の置換を包含しないタンパク質を持つ改変タンパク質の第2のグループ306も包含する。一例では、ベースタンパク質304は抗体であり得、且つ改変タンパク質は、チロシンがヒスチジンに変化する軽鎖の定常領域の72位で置換を有し得る。改変タンパク質の第2のグループ306に含まれる改変タンパク質は、他の置換を包含することができるが、評価されている特定の置換を包含しなくてもよい。
図3の例示的な例において、改変タンパク質302の第1のグループからの第1の改変タンパク質308は、第1の改変タンパク質の様々な位置に配置された四角で示される置換の少なくとも一部で、ベースタンパク質304に関して複数の置換を包含し得る。例えば、第1の改変されたタンパク質308は、第1の置換310、第2の置換312、及び第3の置換314を有することができる。図3の例示的な例はまた、第2の改変タンパク質316、第3の改変タンパク質318、及び第4の改変タンパク質320を包含し得る。改変タンパク質316、318、320は、興味対象の置換を持たない改変タンパク質306の第2のグループに含めることができる。第2の改変タンパク質316はまた、第2の置換312及び第4の置換322を有することができるが、第1の置換310を有しない。これらの状況では、第1の置換310は、興味対象の置換が改変タンパク質の特性に及ぼす影響を特定するために評価されている興味対象の置換であり得る。さらに、第3の改変タンパク質318は、第3の置換314及び第5の置換324を有するが、第1の置換310及び第2の置換312を包含しない。さらに、第4の改変タンパク質318は、第4の置換322、第5の置換324、及び第6の置換326を包含するが、第1の置換310、第2の置換312、又は第3の置換314を包含しない。
置換310、312、314、322、324、326は、ベースタンパク質304の特定の位置でのアミノ酸の変化を表す。置換310、312、314、322、324、326を表す図3の例示的な例に示されている正方形は、縮尺通りではなく、ベースタンパク質204の複数の位置をカバーしている場合がある。しかしながら、置換310、312、314、322、324、326に対応する正方形は、単に例示を目的としたものであり、特定の置換310、312、314、322、324、326を示すことを意図している。
興味対象の置換が改変タンパク質の特性に影響を与えるかどうかを判断するには、第1のグループ302に含まれる各改変タンパク質は、第2のグループ306に含まれる1つ以上の改変タンパク質と結合することができる。第1のグループ302からのタンパク質は、第1のグループの改変タンパク質302のアミノ酸配列と第2のグループの改変タンパク質306のアミノ酸配列との間のいくつかの相違に少なくとも部分的に基づいて、第2のグループ306の1つ以上のタンパク質と結合することができる。特定の実装において、第1のグループ302の個々の改変タンパク質のアミノ酸配列は、第2のグループ306の個々の改変タンパク質のアミノ酸配列の少なくとも一部と比較することができる。第1のグループ302の各改変タンパク質は、第1のグループ302のそれぞれの改変タンパク質のアミノ酸配列と第2のグループ306の改変タンパク質の1つ以上のアミノ酸配列との間に最小数の差異を有する、第2のグループ306の1つ以上の改変タンパク質と結合することができる。
図3の例示的な例では、第1の改変タンパク質308のアミノ酸配列を、第2の改変タンパク質316、第3の改変タンパク質318、及び第4の改変タンパク質320のアミノ酸配列と比較することができる。第1の改変されたタンパク質308のアミノ酸配列と改変されたタンパク質316、318、320のアミノ酸配列との間の比較は、第1の改変タンパク質308のアミノ酸配列と、第2の改変タンパク質316及び第3の改変タンパク質318のアミノ酸配列との間に2つの違いがあること、及び第1改変タンパク質308のアミノ酸配列と第4改変タンパク質320のアミノ酸配列との間に3つの違いがあることを決定することができる。これらの状況では、第1の改変タンパク質308は、最低限の数の差異を有する第2の改変タンパク質316及び第3の改変タンパク質318のアミノ酸配列に少なくとも部分的に基づいて、第2の改変タンパク質316及び第3の改変タンパク質318と結合することができる。同様に、第1のグループ302の他の改変タンパク質は、第2のグループ306の1つ以上の改変タンパク質と結合して、結合改変タンパク質のデータセット326を生成することができる。データセット326に含まれる改変タンパク質カップリングの特性の値を分析して、興味対象の置換が、第2のグループ304に含まれる改変タンパク質の特性に関して、第1のグループ302に含まれる改変タンパク質の特性に影響を与えるかどうかを決定することができる。
図3の例示的な例は、第2の改変タンパク質316及び第3の改変タンパク質318と結合された第1の改変タンパク質308を包含するカップリング328を示す。データセット326に含まれる改変タンパク質カップリングの特性の値を分析して決定することができる。データセット326に含まれる改変されたタンパク質カップリングの特性の値を分析して、興味対象の置換が、第2のグループ306に含まれる改変タンパク質の特性に関して、第1のグループ302に含まれる改変タンパク質の特性に影響を与えるかどうかを判断することができる。
第2のグループ306の複数の改変タンパク質、すなわち第2の改変タンパク質316及び第3の改変タンパク質318は、図3の例示的な例では、第1のグループ302の単一のタンパク質、すなわち第1の改変タンパク質308と結合しているので、第2の改変タンパク質316及び第3の改変タンパク質318の特性の値は、改変されたタンパク質の特性に対する候補置換の効果を分析するために改変され得る。例えば、第1の改変タンパク質308の特性の値に関して第2の改変タンパク質316及び第3の改変タンパク質318の特性の値を分析する前に、第2の改変タンパク質316及び第3の改変タンパク質318の特性の少なくとも一部の値を組み合わせることができる。例示すると、第1の改変タンパク質308の特定の特性の値に関して、第2の改変タンパク質316及び第3の改変タンパク質318の特定の特性の値を分析する前に、第2の改変タンパク質316及び第3の改変タンパク質318の特定の特性の値の平均を決定することができる。
図4A及び4Bは、候補置換を持たない改変タンパク質の特性の値に関して、ベースタンパク質のアミノ酸配列への候補置換をもつ改変タンパク質の特性の値の間の違いを分析する、技法のいくつかの実装を示している。図4は、第1の特性の値を表すx軸404及び第2の特性の値を表すy軸406を有する第1のプロット402を包含する。第1の特性及び第2の特性は、タンパク質の特性に対応し得る。例えば、第1の特性及び第2の特性は、タンパク質のギブス自由エネルギー、タンパク質が展開する温度、タンパク質が不溶性になるpHなどを包含し得る。第1のプロット402は、多数のタンパク質について、第1の特性の値及び第2の特性の値を示す。特に、第1のプロット402は、候補置換を包含するように改変されたいくつかのタンパク質、及び候補置換を包含しないいくつかのタンパク質について、第1の特性の値及び第2の特性の値を示す。図4の例示的な例では、候補置換を包含しないタンパク質についての第1の特性の値及び第2の特性の値は、408、410、412、及び414の円によって表される。さらに、興味対象の置換を包含するタンパク質の第1の特性の値と第2の特性の値は、416、418、及び420の三角形で表される。
特定の実装では、候補置換が第1の特性及び/又は第2の特性に影響を与えるかどうかを判断するために、興味対象の置換を包含するタンパク質について、及び興味対象の置換を包含しないタンパク質についての第1の特性と第2の特性の値を分析できる。いくつかの場合において、候補置換を包含するタンパク質と候補置換を包含しないタンパク質についての第1特性の値と第2特性の値の分析は、興味対象の置換を有する各タンパク質を、興味対象の置換を有しない1つ以上のタンパク質と結合することを包含し得る。特定の実装では、候補置換を包含するタンパク質は、候補置換を包含するタンパク質と候補置換を包含しないタンパク質のアミノ酸配列を比較することにより、候補置換を持たない1つ以上のタンパク質と結合できる。候補置換を持たないタンパク質は、候補置換を持つタンパク質のアミノ酸配列で、候補置換を持たず、且つ最小数の違いを持つアミノ酸配列を持つ1つ以上のタンパク質を識別することに基づき、候補置換を包含しない1つ以上のタンパク質と結合できる。
図4Aの第1のプロット402では、三角形418によって表される候補置換を有するタンパク質は、円410によって表される候補置換を包含しない興味対象のタンパク質と結合される。さらに、三角形420によって表される候補置換を有するタンパク質は、円408によって表される候補置換を包含しない興味対象のタンパク質と結合される。さらに、三角形416によって表される候補置換を有するタンパク質は、候補置換を有しない単一のタンパク質と結合されない。図4の例示的な例では、三角形420によって表されるタンパク質は、円412及び414によって表されるタンパク質と結合される。この状況では、候補置換が第1の特性及び/又は第2の特性に影響を与えるかどうかを判断する分析を容易にするため、円412及び414によって表されるタンパク質についての第1の特性の値及び第2の特性の値は、円422によって示される値を生成するために組み合わされる。特定の実装では、円412及び円414によって表される第1の特性の値及び第2の特性の値は、円412及び414によって表される値の平均を決定することによって組み合わせることができる。したがって、図4Aの例示的な例では、三角形416によって表されるタンパク質は、円412及び414によって表されるタンパク質についての第1の特性の値と第2の特性の値の組み合わせを表す円422に結合されているものとして示されている。第1のプロット402では、タンパク質間の結合は、それぞれの三角形と円の間の矢印によって示されている。
第1のプロット402に含まれるデータを分析した後、図4Bに示される第2のプロット424を生成することができる。第2のプロット424は、候補置換が行われた各タンパク質と、候補置換が行われていない1つ以上のタンパク質との間の結合に基づいて、変更されたデータのセットを示すことができる。いくつかの実装形態では、第2のプロット424は、興味対象の候補置換を包含するタンパク質と候補置換を包含しないタンパク質について、第1の特性の値と第2の特性の値との間の差に基づいて、第1のプロット402に示される初期データセットの正規化バージョンを示すことができる。図4Bの例示的な例では、第2のプロット424は、第1のプロット402に示されている初期データセットの円408、410、412、414で示されているタンパク質について、第1の特性の値の変更されたバージョン及び第2の特性の変更された値を表す円426、428、430、及び432を包含する。さらに、第2のプロット424は、第1のプロット402に示されている初期データセットの三角形416、418、420で示されているタンパク質について、第1の特性の修正された値及び第2の特性の修正された値を表す三角形434、436、438も包含する。
特定の実装形態では、第1の特性の値及び/又は第2の特性の値に対する候補置換の影響は、第2のプロット424に含まれるデータの分析に基づいて決定することができる。例えば、第2の特性の値の第1の平均値440は、円426、428、430、432によって表される第2の特性の値に基づいて決定することができる。さらに、第2の特性の値の第2の平均値442は、三角形434、436、438によって表される第2の特性の値に基づいて決定することができる。さらに、第1の平均値440と第2の平均値442との間の差444を決定することができる。差444が統計的に有意であるかどうかを決定するために、差444及び第2のプロット424に含まれるデータに基づいて計算テストを実行することができる。例示すると、差異分析又はt検定を実行して、差444が統計的に有意であるかどうかを判定することができる。差444が統計的に有意である状況では、候補置換が、第1のプロット402の円408、410、412、414及び三角形416、418、420によって表されるタンパク質に関して、第2の特性406の値に影響を与えるという決定を行うことができる。
差444が統計的に有意である特定の状況では、差444が、円408、410、412、414によって表されるタンパク質に対して、三角形416、418、420によって表されるタンパク質の収量及び/又は安定性を改善するかどうかに関して決定を行うことができる。差444が三角形416、418、420によって表されるタンパク質の収量及び/又は安定性を改善するかどうかは、差444が決定されている特性に依存し得る。例えば、差444が、円408、410、412、414によって表されるタンパク質が展開する温度が、円416、418、420によって表されるタンパク質が展開する温度よりも高いことを示す状況では、次に、差444は、候補置換が、円416、418、420によって表されるタンパク質の収量及び/又は安定性に有害であり得ることを示し得る。別の例では、差444が、円416、418、420によって表されるタンパク質が安定であるpHが、円408、410、412、414によって表されるタンパク質に対して低下することを示す状況では、その場合、差444は、興味対象の置換が三角形416、418、420で表されるタンパク質の収量及び/又は安定性を改善できることを示すことができる。
図5は、タンパク質のアミノ酸配列への改変に基づいてタンパク質の特性への影響を決定するためのシステム500のいくつかの実装を示す。システム500は、1つ以上のコンピューティングデバイス130によって実装できるタンパク質分析システム128を包含する。いくつかの実装形態では、1つ以上の第1のコンピューティングデバイス130は、タンパク質分析システム128のユーザなどのタンパク質分析システム128を実装するエンティティに代わって1つ以上の第1のコンピューティングデバイス130を操作するクラウドコンピューティングアーキテクチャに含めることができる。これらのシナリオでは、クラウドコンピューティングアーキテクチャは、1つ以上のコンピューティングデバイス130を使用して、タンパク質分析システム128を実装するエンティティに代わって1つ以上の仮想マシンインスタンスをインスタンス化できる。クラウドコンピューティングアーキテクチャは、タンパク質分析システム128を実装するエンティティから離れた場所に配置できる。追加の実装では、1つ以上のコンピューティングデバイス130は、タンパク質分析システム128を実装するエンティティの直接制御下にあり得る。例えば、タンパク質分析システム128を実装するエンティティは、改変されたタンパク質のアミノ酸配列の置換を分析して、改変されたタンパク質の特性に影響を与える置換を識別することに関連する操作を実行する、1つ以上のコンピューティングデバイス130を維持することができる。様々な実装では、1つ以上のコンピューティングデバイス130は、1つ以上のサーバーコンピュータを包含することができる。
タンパク質分析システム128は、プロセッサ502などの1つ以上のプロセッサを包含することができる。1つ以上のプロセッサ502は、マイクロプロセッサなどの少なくとも1つのハードウェアプロセッサを包含することができる。いくつかの場合においては、1つ以上のプロセッサ502は、中央処理装置(CPU)、グラフィックス処理装置(GPU)、又はCPUとGPUの両方、又は他の処理装置を包含することができる。さらに、1つ以上のプロセッサ502は、プログラムモジュール、プログラムデータ、及び/又は1つ以上のオペレーティングシステムを格納することができるローカルメモリを包含することができる。
さらに、タンパク質分析システム128は、コンピュータ可読記憶媒体504などの1つ以上のコンピュータ可読記憶媒体を包含することができる。コンピュータ可読記憶媒体504は、コンピュータで読み取り可能な命令、データ構造、プログラムモジュール、その他のデータなど、情報を保存するためのあらゆる種類のテクノロジで実装された、揮発性及び不揮発性メモリ及び/又は取り外し可能及び取り外し不能媒体を包含することができる。そのようなコンピュータ可読記憶媒体504は、必要な情報を保存するために使用でき、且つコンピューティングデバイスからアクセスできる、RAM、ROM、EEPROM、フラッシュメモリ又はその他のメモリテクノロジー、CD−ROM、デジタル多用途ディスク(DVD)又はその他の光学ストレージ、磁気カセット、磁気テープ、ソリッドステートストレージ、磁気ディスクストレージ、RAIDストレージシステム、ストレージアレイ、ネットワーク接続されたストレージ、ストレージエリアネットワーク、クラウドストレージ、リムーバブルストレージメディア、又はいずれのその他のメディアを包含することができるが、これらに限定されない。タンパク質分析システム114の構成に応じて、コンピュータ可読記憶媒体504は、有形の(tangible)コンピュータ可読記憶媒体の一種とすることができ、且つ非一時的(non-transitory)記憶媒体とすることができる。
タンパク質分析システム128は、1つ以上のインターネット、ケーブルネットワーク、衛星ネットワーク、広域無線通信ネットワーク、有線ローカルエリアネットワーク、無線ローカルエリアネットワーク、又は公衆交換電話網(PSTN)のうちの1つ以上などのネットワーク(図示せず)を介して他のコンピューティングデバイスと通信する1つ以上の通信インターフェース506を包含することができる。
コンピュータ可読記憶媒体504は、1つ以上のプロセッサ502によって実行可能ないずれの数の機能コンポーネントを格納するために使用することができる。多くの実装では、これらの機能コンポーネントは、1つ以上のプロセッサ502によって実行可能であり、且つ、実行されると、タンパク質分析システム128に起因する操作を実行するための操作ロジックを実装する、命令又はプログラムを含む。改変タンパク質のアミノ酸配列の置換を分析して改変タンパク質の特性に影響を与える置換を特定することに関連する様々な機能及び特徴を実装するために1つ以上のプロセッサ502で実行できるタンパク質解析システム128の機能コンポーネントは、本明細書に記載のように、タンパク質データ命令508、変更されたタンパク質グループ化命令510、変更されたタンパク質分析命令512、及び候補置換評価命令514を包含する。
1つ以上の第1のコンピューティングデバイス502は、1つ以上の入力/出力デバイス(図示せず)を包含することができる。1つ以上の入力/出力デバイスは、ディスプレイデバイス、キーボード、リモートコントローラ、マウス、プリンタ、オーディオ入力/出力デバイス、スピーカ、マイクロフォン、カメラなどを包含することができる。
タンパク質分析システム128はまた、RAM、ROM、EEPROM、フラッシュメモリ、1つ以上のハードディスク、ソリッドステートドライブ、光学メモリ(例えばCD、DVD)、又はその他の非一時的なメモリ技術を包含し得るが、これらに限定されない、データストア516を包含し得るか、又はそれに結合され得る。データストア516は、タンパク質分析システム128によって利用される情報を維持し、改変タンパク質のアミノ酸配列の置換の分析に関連する操作を行って、改変タンパク質の特性に影響を与える置換を識別することができる。例えば、データストア516は、タンパク質配列データ518及びタンパク質特性データ520を格納することができる。タンパク質配列データ518は、タンパク質分析システム128によって分析されているベースタンパク質及びベースタンパク質の変異体のアミノ酸配列を包含することができる。いくつかの場合においては、タンパク質配列データ518は、ベースタンパク質の配列に対して置換が行われる改変タンパク質の位置を示すことができる。
図5の例示的な例では、タンパク質配列データ518は、例示的なベースタンパク質522などの1つ又は複数のベースタンパク質のアミノ酸配列を包含する。また、図5の例示的な例では、タンパク質配列データ518は、改変タンパク質の第1のグループ524及び改変タンパク質の第2のグループ526のアミノ酸配列など、ベースタンパク質522の変異体のアミノ酸配列を包含する。改変タンパク質の第1のグループ524は、例示的な第1の改変タンパク質528などの興味対象となる置換を包含するベースタンパク質522の変異体であるいくつかのタンパク質を包含することができ、改変タンパク質の第2のグループ526は、例示的な第2の改変タンパク質530など、興味対象の置換を包含しないベースタンパク質522の変異体であるいくつかのタンパク質を包含することができる。興味対象の置換は、ベースタンパク質の特定の位置でのアミノ酸の候補置換であり得、ここで、候補置換は、改変タンパク質の特性に対する候補置換の効果を決定するために評価されている。
タンパク質特性データ520は、ベースタンパク質の特性の値及びベースタンパク質の変異体の特性の値を包含することができる。タンパク質特性データ520に含まれる特性は、タンパク質の化学的特性、タンパク質の物理的特性、又はそれらの組み合わせを包含し得る。いくつかの例では、タンパク質特性データ520は、タンパク質が展開する温度を包含し得る。別の例では、タンパク質特性データ520は、タンパク質についての溶解度情報を包含することができる。例示すると、タンパク質特性データ520は、所与のpHでの抗体の重鎖分子量のパーセンテージを包含することができる。タンパク質特性データ520はまた、総分子量、重鎖分子量、軽鎖分子量、総分子量に対する重鎖分子量のパーセンテージ、総分子量に対する軽鎖分子量のパーセンテージ、又はそれらの組み合わせなどの、タンパク質の分子量に関連する追加の情報を包含することができる。タンパク質特性データ520はまた、ベースタンパク質及びベースタンパク質の変異体のギブス自由エネルギーを包含し得る。さらに、タンパク質特性データ520は、ベースタンパク質の二次構造及びベースタンパク質の変異体の二次構造に関連付けることができる。例示すると、タンパク質特性データ520は、ベースタンパク質の二次構造及びベースタンパク質の変異体の位置を示すことができる。タンパク質特性データ520はまた、ベースタンパク質及びベースタンパク質の変異体について二次構造が示され得る波長などの特定の二次構造の存在を示す分光測定及び特性(例えば、ピーク)を示し得る。
タンパク質データ命令508は、1つ以上のプロセッサ502によって実行可能であり、ベースタンパク質及びベースタンパク質の変異体に関連するデータを取得及び格納することができる。いくつかの実装形態では、タンパク質データ命令508は、ベースタンパク質及びベースタンパク質の変異体の配列データを取得することができる。タンパク質データ命令508を使用して得られた配列データは、タンパク質配列データ518としてデータストア516に格納することができる。タンパク質データ命令508は、ベースタンパク質及びベースタンパク質の変異体の特性に関するデータを取得することもできる。特定の実装では、タンパク質データ命令508は、ベースタンパク質及びベースタンパク質の変異体の物理的特性及び/又は化学的特性についての値を取得することができる。タンパク質データ命令508は、ベースタンパク質の特性及びベースタンパク質の変異体に関するデータを、タンパク質特性データ520として格納することができる。
様々な実装において、タンパク質データ命令508は、ベースタンパク質及びベースタンパク質の変異体に対応するデータを取り込むための1つ以上のユーザーインターフェース要素を包含する1つ以上のユーザーインターフェースを生成することによりデータを取得できる。追加の実装では、タンパク質データ命令508は、ベースタンパク質及びベースタンパク質の変異体に関連するデータをウェブサイトから取得することができる。さらなる実装では、タンパク質データ命令508は、1つ以上のデータ記憶装置から、ベースタンパク質及びベースタンパク質の変異体に関連するデータを取得することができる。1つ以上のデータ記憶装置は、メモリスティック、フラッシュドライブ、又はサムドライブ(thumb drives)などの取り外し可能なデータ記憶装置を包含することができる。1つ以上のデータ記憶装置はまた、有線ローカルエリアネットワーク、無線ローカルエリアネットワーク、無線広域ネットワーク、又はそれらの組み合わせなどの1つ以上のネットワークを介してタンパク質分析システム128に結合されたデータストアも包含することができる。
改変タンパク質グループ化命令510は、1つ以上の基準に従って改変タンパク質をグループ化するために1つ以上のプロセッサ502によって実行可能であり得る。特定の実装態様では、改変タンパク質グループ化命令510は、候補置換に従って改変タンパク質をグループ化することができる。候補置換は、ベースタンパク質のアミノ酸配列の改変に対応することができる。改変タンパク質グループ化命令510は、いくつかの改変タンパク質を、候補置換を有する改変タンパク質の第1のグループ及び候補置換を有しない改変タンパク質の第2のグループにグループ化することができる。特定の実装態様では、修正されたタンパク質グループ化命令510は、候補置換に従ってグループ化されるタンパク質のサブセットを識別することができる。例えば、修正されたタンパク質グループ化命令510は、ベースタンパク質522などのベースタンパク質を識別し、その後、ベースタンパク質のアミノ酸配列と改変タンパク質のアミノ酸配列との間の差異に少なくとも部分的に基づいてベースタンパク質の変異体を決定することができる。図5の例示的な例では、ベースタンパク質522の変異体は、第1のグループの改変タンパク質524及び第2のグループの改変タンパク質526を包含することができる。いくつかの場合においては、修正されたタンパク質グループ化命令510は、ベースタンパク質及びベースタンパク質の変異体のグループを示す入力を取得することができる。他の状況では、改変されたタンパク質グループ化命令510は、ベースタンパク質を示す入力を取得し、その後、ベースタンパク質のシーケンスを、タンパク質シーケンスデータ518に含まれる追加のタンパク質のシーケンスと比較することができる。特定の実装では、改変されたタンパク質グループ化命令510は、ベースタンパク質のアミノ酸配列に関して相同であるタンパク質のアミノ酸配列の閾値量に少なくとも部分的に基づいて、タンパク質がベースタンパク質の変異体であることを決定することができる。
改変タンパク質分析命令512は、改変タンパク質を分析するために1つ以上のプロセッサ502によって実行可能であり得る。いくつかの実装形態では、改変タンパク質分析命令512は、1つ以上の候補置換に関して改変タンパク質を分析することができる。1つ以上の候補置換は、ベースタンパク質に関してアミノ酸配列に差異を引き起こすタンパク質のアミノ酸配列に対して行われた置換を包含することができる。改変タンパク質の分析を行って、興味対象の1つ以上の置換が改変タンパク質の特性に影響を与えるかどうかを決定できる。特定の実装では、改変タンパク質分析命令512は、1つ以上の候補置換が改変タンパク質の特性に影響を与えるかどうかを決定するため、1つ以上の候補置換を包含しない改変タンパク質の特性の値に関して、1つ以上の候補置換を包含する改変タンパク質の特性の値を分析することができる。
特定の実装態様では、改変タンパク質分析命令512は、候補置換を包含する1つ以上の改変タンパク質に対応する候補置換を持たない1つ以上の改変タンパク質を識別することによって、改変タンパク質の分析を実行できる。特定の実装態様では、改変タンパク質分析命令512は、候補置換を包含する改変タンパク質を、候補置換を包含しない1つ以上の改変タンパク質と結合することができる。次に、改変タンパク質分析命令512は、候補置換を有する第1のグループに含まれる改変タンパク質の特性の値を識別し、且つ、候補置換を包含しない第2のグループに含まれる改変タンパク質の特性の値を識別することができる。例示的な例では、改変タンパク質分析命令512は、第1の改変タンパク質528を第2の改変タンパク質530と結合することができる。タンパク質分析命令512は、次に、第1の改変タンパク質528の特性の値を識別し、且つ、第2の改変タンパク質530の特性の値に関して、第1の改変タンパク質528の特性の値を分析することができる。
候補置換を有しない改変タンパク質の特性の値に関して、候補置換を有さない改変タンパク質の特性の値に関して分析することは、候補置換を有する改変タンパク質の特性の値と候補置換を有する改変タンパク質の特性の値との間の差異を決定すること包含することができる。さらに、候補置換を有しない改変タンパク質の特性の値に関して候補置換を有する改変タンパク質の特性の値を分析することは、値の差に基づいて特性の値を正規化することを包含し得る。さらに、いくつかの実装形態では、候補置換を有しない改変タンパク質の特性の値に関して、候補置換を有する改変タンパク質の特性の値を分析することは、候補置換を有する改変タンパク質と結合した、候補置換を有しない改変タンパク質の特性の平均値を決定することを包含することができる。タンパク質分析命令512によって実行される分析は、ベースタンパク質に関して変更されたタンパク質の初期データセットとは異なるデータセットを生成することができる。例えば、改変されたデータセットは、候補置換を有する改変タンパク質と候補置換を包含しない1つ以上の改変タンパク質との間の結合を示し得る。また、候補置換のない複数の改変タンパク質が候補置換のある改変タンパク質と結合している状況では、修正データセットは、候補置換なしの複数の改変されたタンパク質の1つ以上の特性についての個々の値の組み合わされた値(例えば、平均値)を含むことができる。修正されたデータセットには、候補置換のない個々の変更されたタンパク質の特性の値が組み合わされたシナリオで、改変されたタンパク質の特性の正規化された値も含まれる。
候補置換評価命令514は、修正されたデータセットの追加の分析を実行することができる。例えば、候補置換評価命令514は、候補置換を有する改変タンパク質の特性の正規化された値の平均、及び候補置換を有しない改変タンパク質の特性の正規化された値の平均を決定することができる。候補置換評価命令514は、平均間の差を決定することができ、且つ、候補置換を包含する改変タンパク質の特性の正規化値の平均と候補置換を包含しない改変タンパク質の特性の正規化値の平均の間に統計的に有意な差があるかどうかを判断するため、1つ以上の統計技術を実装することができる。平均間に統計的に有意な差がある状況では、候補置換評価命令514は、候補置換が改変タンパク質の特性に影響を与えることを決定することができる。特定の実装形態では、候補置換が改変タンパク質の特性の値に影響を与えるという決定は、候補置換が改変タンパク質の1つ以上の特性の値に影響を与える閾値確率を示し得る。特定の実装において、閾値確率は、少なくとも70%の確率、少なくとも80%の確率、少なくとも90%の確率、少なくとも95%の確率、少なくとも97%の確率、少なくとも98%の確率、又は少なくとも99%の確率であり得る。候補置換は、改変タンパク質の1つ以上の特性の値に影響を与える。
改変されたタンパク質の特性の値に対する候補置換の影響は、候補置換によって影響を受ける特定の特性に少なくとも部分的に基づくことができる。例えば、候補置換が改変タンパク質が展開する温度に影響を与えるシナリオでは、候補置換評価命令514は、候補置換が特定の温度で改変タンパク質の安定性に影響を与えると決定することができる。別の例では、候補置換が改変タンパク質の溶解度に影響を与える状況において、候補置換評価命令514は、候補置換が改変タンパク質の収量に影響を与えると決定することができる。
図6及び図7は、ベースタンパク質の特性に対するベースタンパク質のアミノ酸配列の置換の影響を決定する例示的なプロセスを示す。これらのプロセス(並びに本明細書で説明する各プロセス)は、論理フローグラフとして示され、その各動作は、少なくとも部分的に、ハードウェア、ソフトウェア、又はそれらの組み合わせで実装できる一連の動作を表す。ソフトウェアのコンテキストでは、操作は、1つ以上のプロセッサによって実行されると、列挙された操作を実行する1つ以上のコンピュータ可読ストレージメディアに格納されたコンピュータ実行可能命令を表す。一般に、コンピュータ実行可能命令には、特定の機能を実行するか、特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などが含まれる。動作が説明される順序は、限定として解釈されることを意図するものではなく、説明されるいずれの数の動作は、プロセスを実装するためにいずれの順序で及び/又は並列に組み合わせることができる。
図6は、タンパク質のアミノ酸配列の置換によって影響を受けるタンパク質の特性を識別するための第1の例示的なプロセス600のフロー図である。602で、プロセス600は、ベースタンパク質の配列に関して改変されている配列を有する多数の改変タンパク質を発現させることを包含する。いくつかの場合においては、ベースタンパク質に抗体を含めることができる。特定の実装において、タンパク質は、ウイルスと結合するように産生される抗体を包含し得る。様々な実装において、ベースタンパク質のアミノ酸配列への変化を特定することができ、ベースタンパク質のDNAを改変して、改変されたアミノ酸配列が改変されたDNAから発現されるようにすることができる。特定の実装形態では、ベースタンパク質のアミノ酸配列の変化を特定でき、そして、ベースタンパク質のDNAは、改変されたアミノ酸配列が改変されたDNAから発現されるように改変され得る。特定の実装では、ベースタンパク質のアミノ酸配列への改変は、ベースタンパク質のアミノ酸配列への置換がベースタンパク質の特性及び/又は改変タンパク質の特性に影響を与えるかどうかを決定するための実験計画の一部であり得る。
604で、プロセス600は、改変タンパク質の特性の値を決定することを包含する。改変されたタンパク質が発現された後、改変されたタンパク質の特性の値は、発現されたタンパク質に関して分析技術を実施することによって決定され得る。分析技術は、いくつかの場合において、1つ以上のアッセイを使用して実行できる。さらに、606で、プロセス600は、ベースタンパク質に対して行われたいくつかの置換の中から、改変されたタンパク質のアミノ酸配列に含まれる候補置換を決定することを包含する。特定の実装態様では、候補置換は、1つ以上のユーザーインターフェース要素を介して、図1及び図5のタンパク質分析システム128などのアミノ酸配列の置換の効果を分析するシステムによって得ることができる。いくつかの実装態様では、候補置換は、ベースタンパク質に加えられた改変を決定するために利用される実験計画から特定することができる。
608において、プロセス600は、候補置換を包含する改変タンパク質の第1のグループ及び候補置換を包含しない改変タンパク質の第2のグループを決定することを包含する。特定の実装態様では、改変タンパク質の第1のグループ及び改変タンパク質の第2のグループは、候補タンパク質の置換に関して、改変タンパク質の少なくとも一部のアミノ酸配列をベースタンパク質のアミノ酸配列と比較することによって決定できる。他の実装態様では、改変タンパク質の第1のグループ及び改変タンパク質の第2のグループは、タンパク質分析システムに提供される、又は1つ以上のユーザーインターフェース要素を介して指定されるデータファイルで識別できる
610において、プロセス600は、改変タンパク質の第2のグループの特性の値に関して、改変タンパク質の第1のグループの特性の値を分析することを包含する。例えば、第1のグループの改変タンパク質の特性の値と第2のグループの改変タンパク質の特性の値との間の差を決定することができる。いくつかの実装形態では、第1のグループの個々の改変タンパク質は、分析を実行するために第2のグループの1つ以上の改変タンパク質と結合することができる。例示すると、第1のグループの改変タンパク質は、第1のグループの改変タンパク質のアミノ酸配列と1つ以上の改変タンパク質のアミノ酸配列の間に最小限の数の違いがある第2のグループの1つ以上の改変タンパク質と結合することができる。結合された改変タンパク質のみの特性の値の差を決定することにより、第1のグループと第2のグループの特性の値を分析するために使用される処理リソースとメモリリソースが最小化される。第1のグループのすべての改変タンパク質の特性の値は、第2のグループのすべての改変タンパク質の特性の値に関して分析されないためである。代わりに、第1のグループの各改変タンパク質の特性の値は、第2のグループの改変タンパク質のサブセットについての特性の値に関して分析される。
612で、プロセス600は、候補置換によって影響を受ける改変タンパク質の特性を決定することを包含する。特定の実装において、第1のグループの改変タンパク質の特性の値と第2のグループの改変タンパク質の値との間の差は、候補置換によって影響を受ける特性を示し得る。例えば、第1のグループの特性の値と第2のグループの特性の値との間の差が統計的に有意であると決定することにより、特性が候補置換によって影響を受けるという決定を行うことができる。
図7は、タンパク質のアミノ酸配列の置換によって影響を受けるタンパク質の特性を識別するための第2の例示的なプロセス700のフロー図である。702で、プロセス700は、候補置換を有するタンパク質の第1のグループ及び候補置換を有しないタンパク質の第2のグループを決定することを包含する。704で、プロセス700は、第1のグループの各改変タンパク質を第2のグループの1つ以上の改変タンパク質と結合することを包含する。例えば、候補置換を包含するタンパク質は、候補置換を包含するタンパク質のアミノ酸配列との最小数の違いがある、候補置換を持たない1つ以上の候補のアミノ酸配列に少なくとも部分的に基づいて、候補置換を持たない1つ以上の候補と結合できる。
706で、プロセス700は、各カップリングに含まれる改変タンパク質の特性の値を決定することを包含する。第1のグループの単一のタンパク質が第2のグループの単一のタンパク質と結合している状況では、カップリングに含まれる改変タンパク質の特性の値は、1つ以上のユーザーインターフェイス要素を介して、特性についての値を包含するデータストアから取得できる。第1のグループの単一のタンパク質が第2のグループの複数のタンパク質と結合しているシナリオでは、第2のグループからのタンパク質の特性についての値を変更できる。例えば、第2のグループの個々のタンパク質の特性の値の平均は、第1のグループに含まれる単一のタンパク質の特性にっての値と比較できる各特性についての単一の値を提供するように決定できる。
708で、プロセス700は、各カップリングに含まれる改変タンパク質の特性についての値の間の差を決定することを包含し、710で、プロセス700は、少なくとも部分的に差異に基づいて改変タンパク質の特性の値を正規化して、修正データセットを生成することを包含する。特定の実装では、第1のグループと第2のグループからのタンパク質の各カップリングは、評価される各特性の値を持つことができる。それにより、カップリングに含まれる第1のグループのタンパク質の単一の値は、カップリングに含まれる第2のグループの1つ以上のタンパク質の単一の値と比較され得る。このようにして、カップリングごとに単一の差分値を決定できる。次に、これらの差分値に基づいて元のデータセットを修正し、修正されたデータセットを生成できる。つまり、元のデータセットからの特性の値を変更して、第2のグループの複数のタンパク質が第1のグループの単一のタンパク質と結合している状況を修正できる。特定の実装形態では、修正されたデータセットは、不均衡データセットから生成された均衡データセットの近似を表すことができる。
712で、プロセス700は、改変タンパク質の特性に対する候補置換の影響を決定するために修正データセットを分析することを包含することができる。いくつかの実装形態では、第1のグループの特性についての変更された値の平均を、第2のグループの特性についての変更された値の平均と比較することができる。平均間の差は、特性に関する候補置換の統計的有意性を示す可能性がある。候補置換が影響を与える特性に応じて、候補置換の影響に関して追加の決定を行うことができる。例えば、タンパク質の溶解度を示す特性が、より低いpHなどの特定の条件下で向上するという決定に基づいていて、候補置換を有するタンパク質の収量が増加するという決定を行うことができる。
図8Aは、ベースタンパク質に関して特定の置換を含包含するように変更されたタンパク質の特性の値と、特定の置換を包含するように変更されていないタンパク質の特性の値の第1のプロット802を図示する。図8Bは、特定の置換を包含するように改変されたタンパク質と、特定の置換を包含するように改変されていないタンパク質との間の結合を示す第2のプロット804を図示する。特に、プロット802、804は、三角形によって表される候補置換を包含するタンパク質の特性についての値、及び円によって表される候補置換を包含しないタンパク質の特性についての値を示す。プロット802、804のx軸はギブスの自由エネルギーの値を示し、プロット802、804のy軸はタンパク質を展開させるために必要な変性剤の量を示している。
図8Bにおいて、点線、破線、及び実線の両方の赤い線は、候補置換を有するタンパク質と候補置換を有しない1つ以上のタンパク質との間の結合を表す。いくつかの場合においては、候補置換を包含しない複数のタンパク質が候補置換を包含する単一のタンパク質と結合されたときに、806、808、810、及び812に追加の記号が追加された。追加の記号806、808、810、812によって表される値は、候補置換を包含する単一のタンパク質と結合された候補置換を包含しない複数のタンパク質の第2のプロット804に示される特性の値の平均を表すことができる。緑又は青以外の色の記号と破線で結ばれた記号は、結合しているが、候補置換以外の1つ以上の変更を含有しているため、正確性の低い参照であるタンパク質を示す。
図9は、8の第2のプロットに示される結合に基づいて修正された図8の第1のプロットのデータポイントを示すプロット900を図示する。特に、プロット900は、図8の第2のプロット804に示される互いに結合されたタンパク質間の差異に基づいて、候補置換を包含しないタンパク質に関して候補置換を包含するタンパク質の特性の値を正規化することによって生成される。これは、図8Aに示すタンパク質の値が、それ自体の効果の有意性を決定するには不十分であることを示しているが、図9を生成するように結合及び調整すると、2つの特性に対する効果の有意性は明らかである。
図10は、第1の候補置換を有するタンパク質に由来するデータの第1のグループ1006と、第1の候補置換を有しないタンパク質に由来するデータの第2のグループ1008との間の平均の違いを示す第1のプロット1002、及び第2の候補置換を有するタンパク質に由来するデータの第1のグループ1010と第2の候補置換を有しないタンパク質に由来するデータの第2のグループ1012との間の平均の違いを示す第2のプロット1004を図示する。図10の例示的な例において、第1の候補置換は、バリンからセリンへの重鎖の2位での改変を有する研究中の抗体に関連し得る。さらに、第2の候補置換は、軽鎖の3位にスレオニンからリジンへの改変を有する抗体と関連し得る。第1のプロット1002及び第2のプロット1004は、第1のグループ1006、1010及び第2のグループ1008、1012に含まれるタンパク質についての少なくとも1つの特性の値の正規化されたデータセットを表すことができる。
第1のプロット1002は、タンパク質の第1のグループ1006の特性についての値の第1の平均1014及びタンパク質の第2のグループ1008の特性についての値の第2の平均1016を包含する。さらに、第1のプロット1002は、第1の平均1014と第2の平均1016との間の差1018を包含する。さらに、図10の例示的な例は、差1018が、特定の特性、すなわち3.3のpHでのタンパク質の総構成に対する重鎖分子量のパーセンテージに関する差1018を示すバー1020に対応することを示している。さらに、バー1020の陰影は、差1018が統計的に有意であることを示し得る。
加えて、第2のプロット1004は、タンパク質の第1のグループ1010の特性の値の第1の平均1022と、タンパク質の第2のグループ1012の特性の値の第2の平均1024とを包含する。さらに、第2のプロット1004は、第1の平均1022と第2の平均1024との間の差1026を包含する。さらに、図10の例示的な例は、差1024が、pH3.3における、特定の特性、タンパク質の総分子量に対する重鎖分子量のパーセンテージに関する差1024を示すバー1028に対応することを示している。バー1028の陰影は、差1016が統計的に有意であることを示し得る。
実装例
第1項
以下: ベースタンパク質のアミノ酸配列に対していくつかの位置で改変されたアミノ酸配列を有するいくつかのタンパク質を発現させること;前記いくつかのタンパク質の特性についての値を決定すること;前記いくつかのタンパク質の一部のアミノ酸配列と特定の位置での前記ベースタンパク質のアミノ酸配列との間の差異を示す候補置換を決定すること;前記候補置換を包含する前記いくつかのタンパク質の第1のグループ及び前記候補置換を包含しない前記いくつかのタンパク質の第2のグループを決定すること;前記第2のグループの特性についての第2の値に関して前記第1のグループの特性についての第1の値の分析を実行すること;及び少なくとも部分的に前記分析に基づいて、前記候補置換が前記第1のグループの少なくとも1つの特性の値に統計的に有意な効果を与えることを決定すること;を含む方法。
第2項
前記候補置換によってもたらされる前記統計的に有意な効果に少なくとも部分的に基づいて、収量又は安定性の少なくとも一方が増加することを決定することをさらに含む、第1項に記載の方法。
第3項
第1項又は第2項に記載の方法であって、前記分析は、: 前記第1のグループの第1のタンパク質を前記第2のグループの第2のタンパク質及び第3のタンパク質と結合すること;前記第2のタンパク質の前記少なくとも1つの特性についての第1の値及び前記第3のタンパク質の前記少なくとも1つの特性についての第2の値に基づいて、前記少なくとも1つの特性についての平均値を決定すること;及び前記平均値と前記第1のタンパク質の特性についての追加の値との間の差異を決定すること;を包含する方法。
第4項
前記第1のタンパク質の第1のアミノ酸配列と前記第2のグループのアミノ酸配列との間の比較を実行すること;及び、少なくとも部分的に前記比較に基づいて、前記第1のアミノ酸配列と、前記第2のタンパク質の第2のアミノ酸配列と、前記第3のタンパク質の第3のアミノ酸配列との間の差異が閾値数未満であることを決定すること;をさらに含む第3項に記載の方法。
第5項
前記ベースタンパク質が抗体である、第1〜4項のいずれか一項に記載の方法。
第6項
前記いくつかのタンパク質のうちの1つのタンパク質の特性についての値は、前記タンパク質に関して1つ以上のアッセイを行うことによって決定される、第1〜5項のいずれか一項に記載の方法。
第7項
前記いくつかのタンパク質の特性についての値を決定することは、以下: 前記いくつかのタンパク質のうちの1つのタンパク質が、前記タンパク質が前記タンパク質の標的分子に結合することができない程度まで展開する温度の値を決定すること;前記タンパク質が水に不溶性になるpHの値を決定すること;又は前記タンパク質の総分子量に対する重鎖分子量のパーセンテージを決定すること;のうちの少なくとも1つを包含する、第1〜6項のいずれか一項に記載の方法。
第8項
前記候補置換は、前記ベースタンパク質の前記アミノ酸配列に関して、前記いくつかのタンパク質の前記第1のグループのアミノ酸配列で行われた複数の置換のうちの1つである、第1〜7項のいずれか一項に記載の方法。
第9項
前記候補置換が前記第1のグループの前記少なくとも1つの特性の値に前記統計的に有意な効果を与えると決定することは、分散分析又はt検定を実行することを包含する、第1〜8項のいずれか一項に記載の方法。
第10項
以下: タンパク質の第1のグループが候補置換を有すること、及びタンパク質の第2のグループが前記候補置換を有しないことを決定すること;前記第1のグループに含まれる1つのタンパク質を前記第2のグループに含まれる複数のタンパク質と結合すること;前記タンパク質に関する特性についての値を決定すること;前記複数のタンパク質の個々のタンパク質に関する特性についての追加の値を決定すること;前記追加の値に少なくとも部分的に基づいて、前記複数のタンパク質に関する特性についての平均値を決定すること;前記特性についての値と前記特性についての平均値との間の差異を決定すること;及び少なくとも部分的に前記差異に基づいて、前記候補置換が前記特性に与える影響の量を決定すること;を含む方法。
第11項
前記タンパク質のアミノ酸配列を、タンパク質の前記第2のグループに含まれるタンパク質の個々のアミノ酸配列と比較すること;前記タンパク質のアミノ酸配列と、タンパク質の前記第2のグループに含まれる前記タンパク質の個々のアミノ酸配列との間の差異の最小数を決定すること;をさらに含む第10項に記載の方法。
第12項
前記タンパク質のアミノ酸配列と、前記第2のグループに含まれる第1の追加のタンパク質の第1の追加のアミノ酸配列との間の第1のいくつかの差異(a first number of differences)を決定すること; 前記タンパク質のアミノ酸配列と、前記第2のグループに含まれる第2の追加のタンパク質の第2の追加のアミノ酸配列との間の第2のいくつかの差異(a second number of differences)を決定することであって、前記第2のいくつかの差異が前記第1のいくつかの差異と異なること;前記第1のいくつかの差異が前記差異の最小数に対応することを決定すること;前記第2のいくつかの差異が前記差異の最小数より大きいことを決定すること;及び前記第1の追加のタンパク質を前記複数のタンパク質に追加すること;をさらに含む第11項に記載の方法。
第13項
前記候補置換が前記特性に与える影響の量を決定することは、前記候補置換が前記特性に影響を与える確率を決定することを包含する、第10〜12項のいずれか一項に記載の方法、
第14項
前記タンパク質に関する前記特性についての値を取り込むために、少なくとも1つのユーザーインターフェイス要素を包含するユーザーインターフェイスを生成すること、をさらに含む第10〜13項のいずれか一項に記載の方法、
第15項
前記タンパク質に関する前記特性についての値をウェブサイトから又はデータ記憶装置から取得することをさらに含む、第10〜14項のいずれか一項に記載の方法。
第16項
前記特性が、前記タンパク質の少なくとも一部が展開し始める温度を包含し、当該方法が、前記候補置換が前記特性に及ぼす影響の量に少なくとも部分的に基づいて、前記候補置換が前記タンパク質の安定性に影響を与えることを決定すること、をさらに含む第10〜15項のいずれか一項に記載の方法。
第17項
前記特性は前記タンパク質の溶解度を包含し、当該方法は、少なくとも部分的に前記特性への前記候補置換への影響の量に基づいて、前記候補置換が前記タンパク質の収量に影響を与えることを決定すること、をさらに含む第10〜16項のいずれか一項に記載の方法。
第18項
前記特性が、ギブスの自由エネルギー、総分子量、重鎖分子量、軽鎖分子量、総分子量に対する重鎖分子量のパーセンテージ、総分子量に対する軽鎖分子量のパーセンテージ、又は二次構造の存在を包含する、第10〜17項のいずれか一項に記載の方法。
第19項
前記候補置換が、ベースタンパク質の同じ位置にある追加のアミノ酸とは異なる、前記タンパク質の特定の位置にあるアミノ酸を包含する、第10〜18項のいずれか一項に記載の方法。
第20項
前記タンパク質は、前記ベースタンパク質の複数の追加の位置でのアミノ酸に関して、複数の追加の位置で複数の追加の置換を有する、第19項に記載の方法。
第21項
1つ以上のプロセッサ;及び、
前記1つ以上のプロセッサによって実行されると、以下: いくつかのタンパク質の一部のアミノ酸配列と特定の位置でのベースタンパク質のアミノ酸配列との間の差異を示す候補置換を決定することであって、前記いくつかのタンパク質は、前記ベースタンパク質のアミノ酸配列に対していくつかの位置で改変されたアミノ酸配列を包含すること;前記いくつかのタンパク質(the number of proteins)の特性の値を決定すること;候補置換を包含する前記いくつかのタンパク質の第1のグループ及び候補置換を包含しない前記いくつかのタンパク質の第2のグループを決定すること;前記第2のグループの特性についての第2の値に関して前記第1のグループの特性についての第1の値の分析を実行すること;及び少なくとも部分的に前記分析に基づいて、前記候補置換が前記第1のグループの少なくとも1つの特性の値に統計的に有意な影響を与えることを決定すること;を含む操作を実行するコンピュータ可読命令を格納する1つ以上の非一時的(non-transitory)コンピュータ可読媒体;
を含むシステム。
第22項
前記操作は、前記候補置換によって生成された統計的に有意な効果に少なくとも部分的に基づいて、収量又は安定性のうち少なくとも一方が増加することを決定することをさらに含む、第21項に記載のシステム。
第23項
前記分析は、以下: 前記第1のグループの第1のタンパク質を、前記第2のグループの第2のタンパク質及び第3のタンパク質と結合すること;前記第2のタンパク質の少なくとも1つの特性についての第1の値及び前記第3のタンパク質の少なくとも1つの特性についての第2の値に基づいて、少なくとも1つの特性についての平均値を決定すること;及び平均値と前記第1のタンパク質の特性についての追加の値との差異を決定すること;を包含する、第21又は22項に記載のシステム。
第24項
前記操作は、: 前記第1のタンパク質の第1のアミノ酸配列と前記第2のグループのアミノ酸配列との間の比較を実行すること;及び、少なくとも部分的に前記比較に基づいて、前記第1のアミノ酸配列と、前記第2のタンパク質の第2のアミノ酸配列と、前記第3のタンパク質の第3のアミノ酸配列との間の差が閾値未満であることを決定すること;をさらに含む、第23項に記載のシステム。
第25項
前記ベースタンパク質が抗体である、第21〜24項のいずれか一項に記載のシステム。
第26項
前記いくつかのタンパク質のうちの1つのタンパク質の特性についての値は、前記タンパク質に関して1つ以上のアッセイを行うことによって決定される、第21〜25項のいずれか一項に記載のシステム。
第27項
前記いくつかのタンパク質の特性についての値を決定することは、以下: 前記いくつかのタンパク質のうちの1つタンパク質が、前記タンパク質が前記タンパク質についての標的分子に結合することができない程度まで展開する温度の値を決定すること;前記タンパク質が水に不溶性になるpHの値を決定すること;又は、前記タンパク質についての総分子量に対する重鎖分子量のパーセンテージを決定すること;のうち少なくとも1つを包含する、第21〜26項のいずれか一項に記載のシステム。
第28項
前記候補置換は、前記ベースタンパク質の前記アミノ酸配列に関して、前記いくつかのタンパク質の前記第1のグループのアミノ酸配列で行われた複数の置換のうちの1つである、第21〜27項のいずれか一項に記載のシステム。
第29項
前記候補置換が、前記第1のグループの前記少なくとも1つの特性の値に統計的に有意な効果を与えることを決定することは、分散分析又はt検定を実行することを包含する、第21〜28項のいずれか一項に記載のシステム。
第30項
1つ以上のプロセッサ;及び、
前記1つ以上のプロセッサによって実行されると、以下: タンパク質の第1のグループが候補置換を有すること、及びタンパク質の第2のグループが前記候補置換を有しないことを決定すること;前記第1のグループに含まれるタンパク質を前記第2のグループに含まれる複数のタンパク質と結合すること;前記タンパク質に関する特性についての値を決定すること;前記複数のタンパク質の個々のタンパク質に関する特性についての追加の値を決定すること;前記追加の値に少なくとも部分的に基づいて、前記複数のタンパク質に関する特性についての平均値を決定すること;特性についての前記値と特性についての前記平均値との差異を決定すること;及び、少なくとも部分的に前記差異に基づいて、前記候補置換が特性に与える影響の量を決定すること;を含む操作を実行するコンピュータ可読命令を格納する1つ以上の非一時的(non-transitory)コンピュータ可読媒体;
を含むシステム。
第31項
前記操作は、: 前記タンパク質のアミノ酸配列を、タンパク質の前記第2のグループに含まれるタンパク質の個々のアミノ酸配列と比較すること;前記タンパク質の前記アミノ酸配列と、タンパク質の前記第2のグループに含まれる前記タンパク質の個々のアミノ酸配列との間の差異の最小数を決定すること;をさらに含む、第30項に記載のシステム。
第32項
前記操作は、: 前記タンパク質のアミノ酸配列と前記第2のグループに含まれる第1の追加のタンパク質の第1の追加のアミノ酸配列との間の第1のいくつかの差異を決定すること;前記タンパク質の前記アミノ酸配列と、前記第2のグループに含まれる第2の追加のタンパク質の第2の追加のアミノ酸配列との間の第2のいくつかの差異を決定することであって、前記第2のいくつかの差異は前記第1のいくつかの差異とは異なること;前記第1のいくつかの差異が差異の最小数に対応することを決定すること;前記第2のいくつかの差異が差異の最小数より大きいことを決定すること;及び、前記第1の追加のタンパク質を前記複数のタンパク質に追加すること;をさらに含む、第31項に記載のシステム。
第33項
前記候補置換の特性への影響の量を決定することは、前記候補置換が特性に影響を与える確率を決定することを包含する、第30〜32項のいずれか一項に記載のシステム。
第34項
前記操作は、前記タンパク質に関する特性についての値を取り込むための少なくとも1つのユーザーインターフェース要素を包含するユーザーインターフェースを生成することをさらに含む、第30〜33項のいずれか一項に記載のシステム。
第35項
前記操作は、ウェブサイト又はデータ記憶装置から前記タンパク質に関する特性についての値を取得することをさらに含む、第30〜34項のいずれか一項に記載のシステム。
第36項
前記特性は、前記タンパク質の少なくとも一部が展開し始める温度を包含し、前記操作は、前記候補置換が特性に及ぼす影響の量に少なくとも部分的に基づいて、前記候補置換が前記タンパク質の安定性に影響を与えることを決定すること、をさらに含む、第30〜35項のいずれか一項に記載のシステム。
第37項
前記特性が前記タンパク質の溶解度を包含し、前記操作が、少なくとも部分的に、前記特性に対する前記候補置換への影響の量に基づいて、前記候補置換が前記タンパク質の収量に影響を与えることを決定することをさらに含む、第30〜36項のいずれか一項に記載のシステム。
第38項
前記特性が、ギブスの自由エネルギー、総分子量、重鎖分子量、軽鎖分子量、総分子量に対する重鎖分子量のパーセンテージ、総分子量に対する軽鎖分子量のパーセンテージ、又は二次構造の存在を包含する、第30〜37項のいずれか一項に記載のシステム。
第39項
前記候補置換が、ベースタンパク質の同じ位置にある追加のアミノ酸とは異なる、前記タンパク質の特定の位置にあるアミノ酸を包含する、第30〜38項のいずれか一項に記載のシステム。
第40項
前記タンパク質が、前記ベースタンパク質の複数の追加の位置でのアミノ酸に対して、複数の追加の位置で複数の追加の置換を有する、第39項に記載のシステム。
上述の主題は、例証としてのみ提供されており、限定として解釈されるべきではない。さらに、請求される主題は、本開示のいずれかの部分に記載されているいずれか又はすべての欠点を解決する実装に限定されない。図示及び説明される例示的構成及び適用に従うことなく、かつ以下の特許請求の範囲に記載される本発明の真の精神及び範囲から逸脱することなく、本明細書に記載される主題に対して様々な修正及び変更を行うことができる。

Claims (20)

  1. ベースタンパク質のアミノ酸配列に対していくつかの位置で改変されたアミノ酸配列を有するいくつかのタンパク質を発現させること;
    前記いくつかのタンパク質の特性についての値を決定すること;
    前記いくつかのタンパク質の一部のアミノ酸配列と特定の位置での前記ベースタンパク質のアミノ酸配列との間の差異を示す候補置換を決定すること;
    前記候補置換を包含する前記いくつかのタンパク質の第1のグループ及び前記候補置換を包含しない前記いくつかのタンパク質の第2のグループを決定すること;
    前記第2のグループの特性についての第2の値に関して前記第1のグループの特性についての第1の値の分析を実行すること;及び
    少なくとも部分的に前記分析に基づいて、前記候補置換が前記第1のグループの少なくとも1つの特性の値に統計的に有意な効果を与えることを決定すること;
    を含む方法。
  2. 前記候補置換によってもたらされる前記統計的に有意な効果に少なくとも部分的に基づいて、収量又は安定性の少なくとも一方が増加することを決定することをさらに含む、請求項1に記載の方法。
  3. 請求項1に記載の方法であって、前記分析は、:
    前記第1のグループの第1のタンパク質を前記第2のグループの第2のタンパク質及び第3のタンパク質と結合すること;
    前記第2のタンパク質の前記少なくとも1つの特性についての第1の値及び前記第3のタンパク質の前記少なくとも1つの特性についての第2の値に基づいて、前記少なくとも1つの特性についての平均値を決定すること;及び
    前記平均値と前記第1のタンパク質の特性についての追加の値との間の差異を決定すること;を包含する方法。
  4. 前記第1のタンパク質の第1のアミノ酸配列と前記第2のグループのアミノ酸配列との間の比較を実行すること;及び、
    少なくとも部分的に前記比較に基づいて、前記第1のアミノ酸配列と、前記第2のタンパク質の第2のアミノ酸配列と、前記第3のタンパク質の第3のアミノ酸配列との間の差異が閾値数未満であることを決定すること;
    をさらに含む請求項3に記載の方法。
  5. 前記ベースタンパク質が抗体である、請求項1に記載の方法。
  6. 前記いくつかのタンパク質のうちの1つのタンパク質の特性についての値は、前記タンパク質に関して1つ以上のアッセイを行うことによって決定される、請求項1に記載の方法。
  7. 前記いくつかのタンパク質の特性についての値を決定することは、:
    前記いくつかのタンパク質のうちの1つのタンパク質が、前記タンパク質が前記タンパク質の標的分子に結合することができない程度まで展開する温度の値を決定すること;
    前記タンパク質が水に不溶性になるpHの値を決定すること;又は
    前記タンパク質の総分子量に対する重鎖分子量のパーセンテージを決定すること;
    のうちの少なくとも1つを包含する、請求項1に記載の方法。
  8. 前記候補置換は、前記ベースタンパク質の前記アミノ酸配列に関して、前記いくつかのタンパク質の前記第1のグループのアミノ酸配列で行われた複数の置換のうちの1つである、請求項1に記載の方法。
  9. 前記候補置換が前記第1のグループの前記少なくとも1つの特性の値に前記統計的に有意な効果を与えると決定することは、分散分析又はt検定を実行することを包含する、請求項1に記載の方法。
  10. タンパク質の第1のグループが候補置換を有すること、及びタンパク質の第2のグループが前記候補置換を有しないことを決定すること;
    前記第1のグループに含まれる1つのタンパク質を前記第2のグループに含まれる複数のタンパク質と結合すること;
    前記タンパク質に関する特性についての値を決定すること;
    前記複数のタンパク質の個々のタンパク質に関する特性についての追加の値を決定すること;
    前記追加の値に少なくとも部分的に基づいて、前記複数のタンパク質に関する特性についての平均値を決定すること;
    前記特性についての値と前記特性についての平均値との間の差異を決定すること;及び
    少なくとも部分的に前記差異に基づいて、前記候補置換が前記特性に与える影響の量を決定すること;
    を含む方法。
  11. 前記タンパク質のアミノ酸配列を、タンパク質の前記第2のグループに含まれるタンパク質の個々のアミノ酸配列と比較すること;
    前記タンパク質のアミノ酸配列と、タンパク質の前記第2のグループに含まれる前記タンパク質の個々のアミノ酸配列との間の差異の最小数を決定すること;
    をさらに含む請求項10に記載の方法。
  12. 前記タンパク質のアミノ酸配列と、前記第2のグループに含まれる第1の追加のタンパク質の第1の追加のアミノ酸配列との間の第1のいくつかの差異を決定すること;
    前記タンパク質のアミノ酸配列と、前記第2のグループに含まれる第2の追加のタンパク質の第2の追加のアミノ酸配列との間の第2のいくつかの差異を決定することであって、前記第2のいくつかの差異が前記第1のいくつかの差異と異なること;
    前記第1のいくつかの差異が前記差異の最小数に対応することを決定すること;
    前記第2のいくつかの差異が前記差異の最小数より大きいことを決定すること;及び
    前記第1の追加のタンパク質を前記複数のタンパク質に追加すること;
    をさらに含む請求項11に記載の方法。
  13. 前記候補置換が前記特性に与える影響の量を決定することは、前記候補置換が前記特性に影響を与える確率を決定することを包含する、請求項10に記載の方法。
  14. 前記タンパク質に関する前記特性についての値を取り込むために、少なくとも1つのユーザーインターフェイス要素を包含するユーザーインターフェイスを生成すること、
    をさらに含む請求項10に記載の方法。
  15. 前記タンパク質に関する前記特性についての値をウェブサイトから又はデータ記憶装置から取得することをさらに含む、請求項10に記載の方法。
  16. 前記特性が、前記タンパク質の少なくとも一部が展開し始める温度を包含し、当該方法が、前記候補置換が前記特性に及ぼす影響の量に少なくとも部分的に基づいて、前記候補置換が、:
    前記タンパク質の安定性に影響を与えることを決定すること、
    をさらに含む請求項10に記載の方法。
  17. 前記特性は前記タンパク質の溶解度を包含し、当該方法は、:
    少なくとも部分的に前記特性への前記候補置換への影響の量に基づいて、前記候補置換が前記タンパク質の収量に影響を与えることを決定すること、
    をさらに含む請求項10に記載の方法。
  18. 前記特性が、ギブスの自由エネルギー、総分子量、重鎖分子量、軽鎖分子量、総分子量に対する重鎖分子量のパーセンテージ、総分子量に対する軽鎖分子量のパーセンテージ、又は二次構造の存在を包含する、請求項10に記載の方法。
  19. 前記候補置換が、ベースタンパク質の同じ位置にある追加のアミノ酸とは異なる、前記タンパク質の特定の位置にあるアミノ酸を包含する、請求項10に記載の方法。
  20. 前記タンパク質は、前記ベースタンパク質の複数の追加の位置でのアミノ酸に関して、複数の追加の位置で複数の追加の置換を有する、請求項19に記載の方法。
JP2020544771A 2018-02-26 2019-02-26 アミノ酸配列改変に基づくタンパク質の特性への影響の決定 Pending JP2021523680A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862635536P 2018-02-26 2018-02-26
US62/635,536 2018-02-26
PCT/US2019/019530 WO2019165411A1 (en) 2018-02-26 2019-02-26 Determining impact on properties of proteins based on amino acid sequence modifications

Publications (2)

Publication Number Publication Date
JP2021523680A true JP2021523680A (ja) 2021-09-09
JPWO2019165411A5 JPWO2019165411A5 (ja) 2022-03-07

Family

ID=65952055

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020544771A Pending JP2021523680A (ja) 2018-02-26 2019-02-26 アミノ酸配列改変に基づくタンパク質の特性への影響の決定

Country Status (5)

Country Link
US (1) US20200411136A1 (ja)
EP (1) EP3759715A1 (ja)
JP (1) JP2021523680A (ja)
CA (1) CA3092097A1 (ja)
WO (1) WO2019165411A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024084600A1 (ja) * 2022-10-18 2024-04-25 学校法人 創価大学 疾患危険性のあるミスセンス変異の同定方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4073806A4 (en) * 2019-12-12 2023-01-18 Just-Evotec Biologics, Inc. GENERATION OF PROTEIN SEQUENCES USING MACHINE LEARNING TECHNIQUES BASED ON MODEL PROTEIN SEQUENCES

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009502141A (ja) * 2005-07-26 2009-01-29 コモンウエルス サイエンティフィク アンド インダストリアル リサーチ オーガニゼーション ウシ科動物における背最長筋ピーク力、筋肉内脂肪、小売牛肉歩留および正味飼料摂取量から選択される形質の査定方法
JP2009531028A (ja) * 2006-03-17 2009-09-03 バイオジェン・アイデック・エムエイ・インコーポレイテッド 安定化されたポリペプチド化合物
JP2010523122A (ja) * 2007-04-04 2010-07-15 ビーエーエスエフ アグロケミカル プロダクツ ビー.ブイ. Ahasl1の複数の除草剤耐性対立遺伝子を有する除草剤耐性ヒマワリ植物及び使用方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002054063A1 (en) * 2001-01-04 2002-07-11 Yeda Research And Development Co. Ltd. Database system and method useful for predicting the effect of amino acid substitutions on protein structure and stability

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009502141A (ja) * 2005-07-26 2009-01-29 コモンウエルス サイエンティフィク アンド インダストリアル リサーチ オーガニゼーション ウシ科動物における背最長筋ピーク力、筋肉内脂肪、小売牛肉歩留および正味飼料摂取量から選択される形質の査定方法
JP2009531028A (ja) * 2006-03-17 2009-09-03 バイオジェン・アイデック・エムエイ・インコーポレイテッド 安定化されたポリペプチド化合物
JP2010523122A (ja) * 2007-04-04 2010-07-15 ビーエーエスエフ アグロケミカル プロダクツ ビー.ブイ. Ahasl1の複数の除草剤耐性対立遺伝子を有する除草剤耐性ヒマワリ植物及び使用方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024084600A1 (ja) * 2022-10-18 2024-04-25 学校法人 創価大学 疾患危険性のあるミスセンス変異の同定方法

Also Published As

Publication number Publication date
US20200411136A1 (en) 2020-12-31
EP3759715A1 (en) 2021-01-06
CA3092097A1 (en) 2019-08-29
WO2019165411A1 (en) 2019-08-29

Similar Documents

Publication Publication Date Title
Li et al. Cumulus provides cloud-based data analysis for large-scale single-cell and single-nucleus RNA-seq
Wang et al. MusiteDeep: a deep-learning framework for general and kinase-specific phosphorylation site prediction
Potocnakova et al. An introduction to B‐cell epitope mapping and in silico epitope prediction
Lindskog et al. Selection of protein epitopes for antibody production
JP2024075638A (ja) タンパク質同定のためのデコーディングアプローチ方法
CN111566261A (zh) 选择结合试剂的方法
Anderson et al. Antigenic cartography of H1N1 influenza viruses using sequence-based antigenic distance calculation
JP2021514086A (ja) Mhcペプチド結合予測のためのgan−cnn
Andreatta et al. NNAlign: a web-based prediction method allowing non-expert end-user discovery of sequence motifs in quantitative peptide data
Dalkas et al. SEPIa, a knowledge-driven algorithm for predicting conformational B-cell epitopes from the amino acid sequence
McPartlon et al. A deep SE (3)-equivariant model for learning inverse protein folding
US20200209236A1 (en) Methods for identifying candidate biomarkers
Yang et al. DeepNetBim: deep learning model for predicting HLA-epitope interactions based on network analysis by harnessing binding and immunogenicity information
JP2021523680A (ja) アミノ酸配列改変に基づくタンパク質の特性への影響の決定
US11532377B2 (en) Systems and methods for modeling a protein parameter for understanding protein interactions and generating an energy map
KR20230098219A (ko) 생물치료제 개발 방법 및 시스템
US11749377B2 (en) Method and electronic system for predicting at least one fitness value of a protein, related computer program product
CN115280417A (zh) 使用机器学习技术基于模板蛋白质序列来生成蛋白质序列
Kashani-Amin et al. A systematic review on popularity, application and characteristics of protein secondary structure prediction tools
KR102182091B1 (ko) 면역항암제에 대한 저항성을 예측하는 방법 및 분석장치
Carrillo-Rodriguez et al. Mass spectrometry-based proteomics workflows in cancer research: the relevance of choosing the right steps
JP2023530719A (ja) 表面提示ペプチドを予測するための機械学習技術
Arican et al. PredDRBP-MLP: Prediction of DNA-binding proteins and RNA-binding proteins by multilayer perceptron
KR102171681B1 (ko) 기계 학습 알고리즘을 이용하여 표적 단백질과 결합하는 후보 rna 압타머를 생성하는 프로그램을 기록한 컴퓨터로 판독할 수 있는 기록 매체 및 후보 rna 압타머를 생성하는 방법
Ouellet et al. CysPresso: a classification model utilizing deep learning protein representations to predict recombinant expression of cysteine-dense peptides

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220225

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230404

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230808

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231208

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20231215

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20240126