JP2022520071A - バイオ医薬品分析用のデータ抽出 - Google Patents

バイオ医薬品分析用のデータ抽出 Download PDF

Info

Publication number
JP2022520071A
JP2022520071A JP2021546385A JP2021546385A JP2022520071A JP 2022520071 A JP2022520071 A JP 2022520071A JP 2021546385 A JP2021546385 A JP 2021546385A JP 2021546385 A JP2021546385 A JP 2021546385A JP 2022520071 A JP2022520071 A JP 2022520071A
Authority
JP
Japan
Prior art keywords
file
data entry
biopharmacy
variant
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021546385A
Other languages
English (en)
Inventor
ユエン ファン ツォ ケビン
Original Assignee
タンベックス バイオファーマ ユーエスエー,インコーポレイティド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by タンベックス バイオファーマ ユーエスエー,インコーポレイティド filed Critical タンベックス バイオファーマ ユーエスエー,インコーポレイティド
Publication of JP2022520071A publication Critical patent/JP2022520071A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • G01N30/7233Mass spectrometers interfaced to liquid or supercritical fluid chromatograph
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing

Abstract

バイオ医薬品分析用のデータを抽出する方法は、ソースディレクトリと関連する第1パスに基づいて、ソースディレクトリ内に含まれている第1ファイルを選択するステップを含みうる。基準質量値に基づいて第1ファイル内に含まれている1つ又は複数のエントリを識別するべく、第1ファイルを解析することができる。1つ又は複数のエントリは、それぞれ、質量値を含みうる。閾値未満である質量値と基準質量値の間の差に基づいて、1つ又は複数のエントリを識別することができる。1つ又は複数のエントリを第2ファイル内に挿入することができる。

Description

関連出願の相互参照
本出願は、2019年2月8日付けで出願された、且つ、「DATA EXTRACTION FOR BIOPHARMACEUTICAL ANALYSIS」という名称を有する、米国仮特許出願第62/803,339号の優先権を主張するものであり、この特許文献の開示内容は、引用により、そのすべてが本明細書に包含される。
本明細書において開示されている主題は、一般に、分析化学に関し、且つ、更に詳しくは、バイオ医薬品分析に関する。
生物製剤又はバイオ医薬品は、治療効果を有する巨大分子タンパク質に基づいた薬を意味しうる。薬物動態/薬力学(PK/PD)と、バイオ医薬品の効能と、を保証するべく、バイオ医薬品の特性評価は、薬の開発及び製造の必須部分を構成しうる。バイオ医薬品の特性評価は、例えば、インタクトタンパク質、サブユニットタンパク質、ペプチド、グリカン、及び/又はこれらに類似したものを含む、バイオ医薬品内に存在している様々な分子の種の識別を必要としうる。例えば、グリカンは、一般に、複合生体タンパク質内において、特定のアミノ酸残留物に接合された状態において見出される多糖類であってよい。従って、バイオ医薬品の特性評価は、バイオ医薬品中に存在している様々なグリカンの分析を含みうる。但し、バイオ医薬品中に存在しているグリカンの分析は、大量データの分析を必要としうる。
バイオ医薬品分析用のデータを抽出するべく、コンピュータプログラムプロダクトを含むシステム、方法、及び製造物品が提供されている。一態様においては、少なくとも1つのデータプロセッサと、少なくとも1つのメモリと、を含むシステムが提供されている。少なくとも1つのメモリは、少なくとも1つのデータプロセッサによって実行された際に、動作を結果的にもたらす命令を保存することができる。動作は、ソースディレクトリと関連する第1パスに少なくとも基づいて、ソースディレクトリ内に含まれている第1ファイルを選択するステップと、基準質量値に少なくとも基づいて、第1ファイル内に含まれている第1データエントリを少なくとも識別するべく、第1ファイルを解析するステップであって、第1データエントリは、第1質量値を含み、第1データエントリは、閾値未満である第1質量値と基準質量値の間の差に少なくとも基づいて識別されている、ステップと、第2ファイル内に、第1データエントリを挿入するステップと、を含みうる。
いくつかの変形においては、以下の特徴を含む、本明細書において開示されている1つ又は複数の特徴が、任意選択により、任意の実行可能な組合せにおいて含まれうる。第1データエントリは、第1質量値を有する種の存在量値を更に含むことができる。
いくつかの変形において、種は、インタクトタンパク質、サブユニットタンパク質、ペプチド、及び/又はグリカンであってよい。
いくつかの変形において、第1ファイルは、表を含むことができる。第1データエントリは、表の行内に保存することができる。第1質量値は、表の第1列内に保存することができる。存在量値は、表の第2列内に保存することができる。
いくつかの変形において、第1ファイルは、質量分析計からの出力であってよい。
いくつかの変形において、第1ファイルは、質量分析計の出力を処理することによって生成されたExcelファイル及び/又はPDF(Portable Document Format)ファイルであってよい。
いくつかの変形においては、宛先ディレクトリ内に含まれている第2ファイルを宛先ディレクトリと関連する第2パスに少なくとも基づいて識別することができる。
いくつかの変形においては、第3ファイルをソースディレクトリと関連する第1パスに少なくとも基づいて選択することができる。第3ファイルは、基準質量値に少なくとも基づいて、第3ファイル内に含まれている第2データエントリを少なくとも識別するべく、解析することができる。第2データエントリは、第2質量値を含みうる。第2データエントリは、閾値未満である第2質量値と基準質量値の間の差に少なくとも基づいて識別することができる。第2データエントリは、第2ファイル内に挿入することができる。ソースディレクトリが、第1ファイルに加えて、1つ又は複数のファイルを含んでいるという判定に応答して、第3ファイルを選択することができる。
いくつかの変形において、第1データエントリは、第1データエントリに先行する第1区切り文字及び/又は第1データエントリに後続する第2区切り文字に少なくとも基づいて識別することができる。
別の態様においては、バイオ医薬品分析用のデータを抽出する方法が提供されている。方法は、ソースディレクトリと関連する第1パスに少なくとも基づいてソースディレクトリ内に含まれている第1ファイルを選択するステップと、基準質量値に少なくとも基づいて第1ファイル内に含まれている第1データエントリを少なくとも識別するべく第1ファイルを解析するステップであって、第1データエントリは、第1質量値を含み、且つ、第1データエントリは、閾値未満である第1質量値と基準質量値の間の差に少なくとも基づいて識別されている、ステップと、第2ファイル内に、第1データエントリを挿入するステップと、を含むことができる。
いくつかの変形においては、以下の特徴を含む、本明細書において開示されている1つ又は複数の特徴が、任意選択により、任意の実行可能な組合せにおいて含まれうる。第1データエントリは、第1質量値を有する種の存在量値を更に含むことができる。
いくつかの変形において、種は、インタクトタンパク質、サブユニットタンパク質、ペプチド、及び/又はグリカンであってよい。
いくつかの変形において、第1ファイルは、表を含みうる。第1データエントリは、表の行内に保存することができる。第1質量値は、表の第1列内に保存することができる。存在量値は、表の第2列内に保存することができる。
いくつかの変形において、第1ファイルは、質量分析計からの出力であってよい。
いくつかの変形において、第1ファイルは、質量分析計の出力を処理することによって生成されたExcelファイル及び/又はPDF(Portable Document Format)ファイルであってよい。
いくつかの変形において、方法は、宛先ディレクトリと関連する第2パスに少なくとも基づいて、宛先ディレクトリ内に含まれている第2ファイルを識別するステップを更に含みうる。
いくつかの変形において、方法は、ソースディレクトリと関連する第1パスに少なくとも基づいて、ソースディレクト内に含まれている第3ファイルを選択するステップと、基準質量値に少なくとも基づいて、第3ファイル内に含まれている第2データエントリを少なくとも識別するべく、第3ファイルを解析するステップであって、第2データエントリは、第2質量値を含み、且つ、第2データエントリは、閾値未満である第2質量値と基準質量値の間の差に少なくとも基づいて識別されている、ステップと、第2ファイル内に、第2データエントリを挿入するステップと、を更に含むことができる。
いくつかの変形において、第1データエントリは、第1データエントリに先行する第1区切り文字及び/又は第1データエントリに後続する第2区切り文字に少なくとも基づいて識別することができる。
別の態様においては、命令を保存する一時的ではないコンピュータ可読媒体を含むコンピュータプログラムプロダクトが提供されている。命令は、少なくとも1つのデータプロセッサによって実行された際に、動作をもたらすことができる。動作は、ソースディレクトリと関連する第1パスに少なくとも基づいて、ソースディレクトリ内に含まれている第1ファイルを選択するステップと、基準質量値に少なくとも基づいて、第1ファイル内に含まれている第1データエントリを少なくとも識別するべく、第1ファイルを解析するステップであって、第1データエントリは、第1質量値を含み、且つ、第1データエントリは、閾値未満である第1質量値と基準質量値の間の差に少なくとも基づいて識別されている、ステップと、第2ファイル内に、第1データエントリを挿入するステップと、を含みうる。
別の態様においては、少なくとも1つのデータプロセッサと、少なくとも1つのメモリと、を含むシステムが提供されている。少なくとも1つのメモリは、少なくとも1つのデータプロセッサによって実行された際に、動作を結果的にもたらす命令を保存することができる。動作は、ソースディレクトと関連する第1パスに少なくとも基づいて、ソースディレクトリ内に含まれている第1ファイルを選択するステップと、ターゲットバイオ医薬品のバリアントの第1ピーク値を含む第1データエントリを少なくとも識別するべく、第1ファイルを解析するステップと、第2ファイル内に、第1データエントリを挿入するステップと、を含むことができる。
いくつかの変形においては、以下の特徴を含む、本明細書において開示されている1つ又は複数の特徴が、任意選択により、任意の実行可能な組合せにおいて含まれうる。第1ピーク値は、ピーク面積、ピーク保持時間、及び百分率相対ピーク面積の少なくとも1つを含むことができる。
いくつかの変形において、変形は、電荷バリアント、疎水性バリアント、又はサイズバリアントであってよい。
いくつかの変形において、第1ファイルは、クロマトグラムであってよい。
いくつかの変形において、第1データエントリは、閾値を超過する、且つ/又は、値の範囲内にある、第1ピーク値に少なくとも基づいて識別することができる。
いくつかの変形において、ターゲットバイオ医薬品のバリアントのタイプは、第2ファイル内に含まれている第1データエントリに少なくとも基づいて識別することができる。
いくつかの変形において、バリアントは、ターゲットバイオ医薬品のピーク値よりも早期に溶出する第1ピーク値に少なくとも基づいて、ターゲットバイオ医薬品の酸性バリアントとして識別することができる。バリアントは、ターゲットバイオ医薬品のピーク値よりも遅れて溶出する第1ターゲット値に少なくとも基づいて、ターゲットバイオ医薬品の塩基性バリアントとして識別することができる。
いくつかの変形において、バリアントは、バリアントの第1ピーク保持時間及びターゲットバイオ医薬品の第2ピーク保持時間に少なくとも基づいて、ターゲットバイオ医薬品よりも疎水性である、或いは、ターゲットバイオ医薬品よりも乏しく疎水性である、として識別することができる。
いくつかの変形においては、ソースディレクトリ内に含まれている第3ファイルをソースディレクトリと関連する第1パスに少なくとも基づいて選択することができる。第3ファイルは、ターゲットバイオ医薬品のバリアントの第2ピーク値を含む第2データエントリを少なくとも識別するべく、解析することができる。第2データエントリは、第2ファイル内に挿入することができる。第1ファイルは、第1時点において取得された第1クロマトグラムであってよい。第2ファイルは、第2時点において取得された第2クロマトグラムであってよい。バリアントを含むバイオ医薬品のサンプルは、第1時点における第1ストレス及び第2時点における第2ストレスに曝露されている。第1ストレスは、第2ファイルに少なくとも基づいて第2ストレスよりも大きな量のバリアントを生成するものとして判定することができる。
別の態様においては、方法が提供されている。方法は、ソースディレクトリと関連する第1パスに少なくとも基づいて、ソースディレクトリ内に含まれている第1ファイルを選択するステップと、ターゲットバイオ医薬品のバリアントの第1ピーク値を含む第1データエントリを少なくとも識別するべく、第1ファイルを解析するステップと、第2ファイル内に、第1データエントリを挿入するステップと、を含みうる。
いくつかの変形においては、以下の特徴を含む、本明細書において開示されている1つ又は複数の特徴が、任意選択により、任意の実行可能な組合せにおいて含まれうる。第1ピーク値は、ピーク面積、ピーク保持時間、及び百分率相対ピーク面積の少なくとも1つを含むことができる。
いくつかの変形において、バリアントは、電荷バリアント、疎水性バリアント、又はサイズバリアントであってよい。
いくつかの変形において、第1ファイルは、クロマトグラムであってよい。
いくつかの変形において、第1データエントリは、閾値を超過する、且つ/又は、値の範囲内にある、第1ピーク値に少なくとも基づいて識別することができる。
いくつかの変形において、方法は、第2ファイル内に含まれている第1データエントリに少なくとも基づいて、ターゲットバイオ医薬品のバリアントのタイプを識別するステップを更に含みうる。
いくつかの変形において、バリアントは、ターゲットバイオ医薬品のピーク値よりも早期に溶出する第1ピーク値に少なくとも基づいてターゲットバイオ医薬品の酸性バリアントとして識別することができる。バリアントは、ターゲットバイオ医薬品のピーク値よりも遅く溶出する第1ターゲット値に少なくとも基づいてターゲットバイオ医薬品の塩基性バリアントとして識別することができる。
いくつかの変形において、バリアントは、バリアントの第1ピーク保持時間及びターゲットバイオ医薬品の第2ピーク保持時間に少なくとも基づいて、ターゲットバイオ医薬品よりも疎水性である、或いは、ターゲットバイオ医薬品よりも乏しく疎水性である、として識別することができる。
いくつかの変形において、方法は、ソースディレクトリと関連する第1パスに少なくとも基づいて、ソースディレクトリに含まれている第3ファイルを選択するステップと、ターゲットバイオ医薬品のバリアントの第2ピーク値を含む第2データエントリを少なくとも識別するべく、第3ファイルを解析するステップと、第2ファイル内に、第2データエントリを挿入するステップと、を更に含むことができる。第1ファイルは、第1時点において取得された第1クロマトグラムであってよい。第2ファイルは、第2時点において取得された第2クロマトグラムであってよい。バリアントを含むバイオ医薬品のサンプルは、第1時点における第1ストレス及び第2時点における第2ストレスに曝露されている。第1ストレスは、第2ファイルに少なくとも基づいて第2ストレスよりも大きな量のバリアントを生成するものとして判定することができる。
別の態様においては、命令を保存する一時的ではないコンピュータ可読媒体を含むコンピュータプログラムプロダクトが提供されている。命令は、少なくとも1つのデータプロセッサによって実行された際に、動作をもたらしうる。動作は、ソースディレクトリと関連するパスに少なくとも基づいて、ソースディレクトリ内に含まれているクロマトグラフを有する第1ファイルを選択するステップと、ターゲットバイオ医薬品のバリアントのピーク値を含むデータエントリを少なくとも識別するべく、第1ファイルを解析するステップと、第2ファイル内に、データエントリを挿入するステップと、を含みうる。
この主題の実装形態は、限定を伴うことなしに、本明細書において提供されている説明と一貫性を有する方法のみならず、1つ又は複数の機械(例えば、コンピュータ、など)が記述されている特徴の1つ又は複数を実装する動作を結果的にもたらすようにするべく動作可能である有体方式で実施された機械可読媒体を有する物品をも含みうる。又、同様に、1つ又は複数のプロセッサと、1つ又は複数のプロセッサに結合された1つ又は複数のメモリと、を含みうる、コンピュータシステムについても、記述されている。一時的ではないコンピュータ可読又は機械可読ストレージ媒体を含みうる、メモリは、1つ又は複数のプロセッサが、本明細書において記述されている動作の1つ又は複数を実行するようにする1つ又は複数のプログラムを包含することができ、エンコーディングすることができ、保存することができ、又はこれらに類似したことを実行することができる。この主題の1つ又は複数の実装形態と一貫性を有するコンピュータ実装された方法は、単一の演算システム又は複数の演算システム内に存在している1つ又は複数のデータプロセッサによって実装することができる。このような複数の演算システムは、接続することが可能であり、且つ、例えば、ネットワーク(例えば、インターネット、無線ワイドエリアネットワーク、ローカルエリアネットワーク、ワイドエリアネットワーク、有線ネットワーク、又はこれらに類似したもの)上における接続に対するものを含む1つ又は複数の接続を介して、複数の演算システムの1つ又は複数の間の直接接続を介して、などにより、データ及び/又はコマンド又はその他の命令又はこれらに類似したものを交換することができる。
添付図面及び以下の説明には、本明細書において記述されている主題の1つ又は複数の変形の詳細について記述されている。本明細書において記述されている主題のその他の特徴及び利点については、説明及び図面から、且つ、請求項から、明らかとなろう。この開示されている主題の特定の特徴については、例示を目的として、バイオ医薬品用のデータ抽出との関係において記述されているが、このような特徴は、限定を意図したものではないことが容易に理解されよう。本開示に添付されている請求項は、保護対象の主題の範囲を定義することを意図したものである。
本明細書に包含されている、且つ、その一部分を構成している、添付図面は、本明細書において開示されている主題の特定の態様を示しており、且つ、説明と共に、開示されている実装形態と関連する原理のいくつかのものの説明を支援している。図面には、以下のものが含まれている。
いくつかの例示用の実施形態による、バイオ医薬品分析システムを示すシステム図を描いている。
いくつかの例示用の実施形態による、質量分析計からの未加工の出力ファイルの一例を描いている。
いくつかの例示用の実施形態による、質量分析計からの未加工の出力ファイルの別の例を描いている。
いくつかの例示用の実施形態による、質量分析計からの処理済みの出力ファイルの一例を描いている。
いくつかの例示用の実施形態による、統合されたファイルの一例を描いている。
いくつかの例示用の実施形態による、バイオ医薬品分析用のデータを抽出するプロセスを示すフローチャートを描いている。
いくつかの例示用の実施形態による、演算システムを示すブロック図を描いている。
実用的な場合には、類似の参照符号は、類似の構造、特徴、又は要素を表記している。
例えば、液体クロマトグラフィ質量分析(LC-MS)などの、質量分析は、例えば、インタクトタンパク質、サブユニットタンパク質、ペプチド、グリカン、及び/又はこれらに類似したものを含む、バイオ医薬品中の1つ又は複数の分子の種を分析するべく使用することができる。例えば、質量分析は、バイオ医薬品の1つ又は複数のサンプル中に存在している様々なグリカンの相対存在量を判定するべく使用することができる。質量分析の結果は、バイオ医薬品のそれぞれのサンプルごとの個々の出力ファイルを含みうる。例えば、質量分析計からの未加工の出力ファイルは、バイオ医薬品のそれぞれぞれのサンプルごとに、1つの処理済みの出力ファイルを生成するべく、処理することができる。バイオ医薬品の特性評価は、通常、バイオ医薬品の多数の(例えば、50個以上の)サンプルに対して実行されていることから、後続の分析は、大量の処理済みの出力ファイルに跨りうる。従って、いくつかの例示用の実施形態において、分析コントローラは、複数の処理済みの出力ファイルから、対象の分子の基準質量値にマッチングした質量値を有する1つ又は複数のデータエントリを抽出するように構成することができる。更には、分析コントローラは、単一の統合されたファイル内に、処理済みの出力ファイルから抽出されたデータエントリを挿入するように、構成することもできる。
図1は、いくつかの例示用の実施形態による、バイオ医薬品分析システム100を示すシステム図を示している。図1を参照すれば、バイオ医薬品分析システム100は、質量分析計110と、処理エンジン120と、分析コントローラ130と、クライアント140と、を含みうる。図1に示されているように、質量分析計110、処理エンジン120、分析コントローラ130、及びクライアント140は、ネットワーク150を介して通信自在に結合することができる。ネットワーク150は、例えば、ローカルエリアネットワーク(LAN)、仮想ローカルエリアネットワーク(VLAN)、ワイドエリアネットワーク(WAN)、パブリックランドモバイルネットワーク(PLMN)、インターネット、及び/又はこれらに類似したものを含む、任意の有線及び/又は無線ネットワークであってよい。一方、クライアント140は、例えば、ワークステーション、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、モバイル装置、ウェアラブル装置、及び/又はこれらに類似したものを含む、任意のプロセッサに基づいた装置であってよい。図1は、例えば、クラウドに基づいたソフトウェア、ウェブアプリケーション、及び/又はこれらに類似したものとして、遠隔配備されている処理エンジン120及び分析コントローラ130を示している。但し、処理エンジン120及び/又は分析コントローラ130と関連する機能の少なくともいくつかは、クライアント140においてローカル実装することもできることを理解されたい。例えば、分析コントローラ130は、分析コントローラ130と関連するロジックが、なんらのコンパイルをも必要とすることなしに、クライアント140において実行されうるように、スクリプト(例えば、VBA(Visual Basic for Application)スクリプト及び/又はこれに類似したもの)として実装することができる。
以下の表1は、分析コントローラ130を実装する疑似プログラミングコードを示している。
Figure 2022520071000002
Figure 2022520071000003
図1を再度参照すれば、質量分析計110は、バイオ医薬品の1つ又は複数のサンプルを分析するように構成することができる。バイオ医薬品のそれぞれのサンプルごとに、質量分析計110は、例えば、インタクトタンパク質、サブユニットタンパク質、ペプチド、グリカン、及び/又はこれらに類似したものを含む、バイオ医薬品のサンプル中に存在している分子の1つ又は複数の異なる種の相対存在量に対応するスペクトルを生成することができる。質量分析計110の未加工の出力は、質量分析計110によって分析されたバイオ医薬品のそれぞれのサンプルごとに、未加工の出力ファイル(例えば、.raw file及び/又はこれに類似したもの)を含みうる。例えば、バイオ医薬品のn個のサンプルの場合に、質量分析計110は、n個の未加工出力ファイル(例えば、f,f,...,f)を生成しうる。n個の未加工の出力ファイルのそれぞれは、バイオ医薬品のn個のサンプルの1つに対応しうる。
更に説明すれば、図2A~Bは、いくつかの例示用の実施形態による、質量分析計110からの未加工の出力ファイルの例を示している。図2Aを参照すれば、質量分析計110は、未加工の出力ファイル200を出力してもよく、これは、バイオ医薬品のサンプルの分析の結果を含みうる(例えば、抗体)。図2Aに示されているように、未加工の出力ファイル200内の結果は、バイオ医薬品のサンプル中に存在している異なる分子の種の相対存在量値に対応するスペクトルを含みうる。例えば、未加工の出力ファイル200内の上部のグラフは、質量分析計110によって計測された合計イオン電流に対する未加工データの時間経過を追跡しうる。特定の時間ウィンドウ(例えば、保持時間)の選択に基づいて、未加工の出力ファイル200内の下部のグラフは、対応する未加工データスペクトルを表示することができる。この未加工データスペクトルは、そのイオンの相対存在量に対する検出されたイオンの質量対電荷(m/z)比をチャート化する、質量分析計110からの、フーリエ変換済みの信号であってよい。更には、この未加工データスペクトルは、バイオ医薬品のサンプル中に存在している異なる分子の種の相対存在量値を演算するべく、使用することもできる。
或いは、この代わりに、質量分析計110は、図2Bに示されているように、未加工の出力ファイル250を出力することもできる。バイオ医薬品のサンプル中に存在している異なる分子の種の相対存在量値に加えて、未加工の出力ファイル250は、紫外線吸収値、可視吸収値、及び/又はバイオ医薬品のサンプルの反射率値を含みうる。図2Bに示されている未加工の出力ファイル250は、図2Aに示されている未加工の出力ファイル200に代わるフォーマットを有する未加工の出力ファイルであってよい。未加工の出力ファイル250内の上部のグラフは、合計イオン電流のみならず、特定の波長において検出された紫外線吸収に対する未加工データの時間経過を追跡しうる。一方、未加工の出力ファイル250内の下部のグラフは、未加工の出力ファイル200と同一の未加工データスペクトル(例えば、特定の時間ウィンドウにおける未加工データスペクトル)を表示することができる。
処理エンジン120は、質量分析計110からの未加工の出力ファイル(例えば、.raw file及び/又はこれらに類似したもの)を処理するように、且つ、それぞれの未加工出力ファイルごとに、対応する処理出力ファイル(例えば、Excelファイル、Wordファイル、PDF(Portable Document File)ファイル、及び/又はこれらに類似したもの)を生成するように、構成することができる。例えば、図1に示されているように、処理エンジン120は、n個の未加工出力ファイル(例えば、f,f,...,f)に基づいて、n個の処理済みの出力ファイル(例えば、f’,f’,...,f’)を生成することができる。n個の処理済みの出力ファイルのそれぞれは、質量分析計110からのn個の未加工の出力ファイルの1つに対応しうる。更には、n個の処理済みの出力ファイルは、例えば、分析コントローラ130からアクセス可能であるソースディレクトリ内において保存することができる。
いくつかの例示用の実施形態において、処理済みの出力ファイルは、バイオ医薬品の対応するサンプル中に存在している分子のそれぞれの種(例えば、インタクトタンパク質、サブユニットタンパク質、ペプチド、グリカン、及び/又はこれらに類似したもの)ごとにエントリを含むように生成することができる。分子の種のエントリは、その分子の種の質量値及び相対存在量値を含みうる。更には、処理済みの出力ファイル内の連続的なデータエントリは、例えば、白色空間文字、カンマ、コロン、及び/又はこれらに類似したものを含む1つ又は複数の区切り文字によって分離することができる。これらの区切り文字は、分析コントローラ130が、処理済みの出力ファイル内において異なるデータエントリを識別するとことを可能することができる。
更に説明すれば、図3Aは、いくつかの例示用の実施形態による、質量分析計110からの処理済みの出力ファイル300の一例を示している。例えば、処理エンジン120は、未加工の出力ファイル200及び/又は未加工の出力ファイル250に基づいて、処理済みの出力ファイル300を生成することができる。図3Aに示されている例において、処理済みの出力ファイル300は、Excelファイルであってよい。従って、図3Aに示されているExcelスプレッドシート内のそれぞれの行は、処理済みの出力ファイル300内の1つのエントリに対応しうる。エントリの質量値は、スプレッドシートの1つの列内に保存することができる一方で、エントリの相対存在量値は、スプレッドシートの異なる列内に保存することができる。但し、処理済みの出力ファイル300は、処理済みの出力ファイル300内のデータエントリが、例えば、Wordファイル、PDF(Portable Document File)ファイル、及び/又はこれらに類似したものを含む、構造化された方式によって保存されうる、任意のタイプのファイルであってよいことを理解されたい。
いくつかの例示用の実施形態において、分析コントローラ130は、n個の処理済みの出力ファイル(例えば、f’,f’,...,f’)に少なくとも基づいて、単一の統合されたファイルrを生成するように構成することができる。分析コントローラ130は、n個の処理済みの出力ファイルのそれぞれから、対象の分子の基準質量値にマッチングした質量値を有する1つ又は複数のデータエントリを少なくとも抽出することにより、統合されたファイルrを生成することができる。質量値は、2つの質量値の間の差が閾値を超過しない場合に、基準質量値とマッチングするものとして判定されうることを理解されたい。例えば、分析コントローラ130は、対象のグリカンの基準質量値にマッチングしたデータエントリの質量値に少なくとも基づいて、第1の処理済み出力ファイルf’から、データエントリを抽出することができる。データエントリと関連する質量値及び相対存在量を含む、そのデータエントリは、統合されたファイルr内に挿入することができる。
図3は、いくつかの例示用の実施形態による、統合されたファイル350の一例を示している。上述したように、いくつかの例示用の実施形態において、分析コントローラ130は、統合されたファイルf内に、n個の処理済みの出力ファイル(例えば、f’,f’,...,f’)から抽出された1つ又は複数のデータエントリを少なくとも挿入することにより、統合されたファイルrを生成することができる。従って、統合されたファイルrは、n個の処理済みの出力ファイルから抽出されたデータエントリの視覚的表現を提供する1つ又は複数のデータ提示を含みうる。例えば、図3Bに示されている例において、統合されたファイルrは、表のみならず、チャートを含んでいてもよく、これらのそれぞれは、n個の処理済みの出力ファイルから抽出されたデータエントリの異なる視覚的表現を提供している。分析コントローラ130は、統合されたファイルrを宛先ディレクトリ内において保存してもよく、この場合に、統合されたファイルrは、クライアント140からアクセス可能であってよい。従って、統合されたファイルrは、バイオ医薬品中に存在している異なる分子の種(インタクトタンパク質、サブユニットタンパク質、ペプチド、グリカン、及び/又はこれらに類似したもの)の相対存在量に基づいた対応するバイオ医薬品のバイオ医薬品特性評価を可能にするべくクライアント140に対して表示することができる。
いくつかの例示用の実施形態において、質量分析計110からの処理済みの出力ファイルに基づいてバイオ医薬品中に存在しうる分子の様々な種を識別する代わりに且つ/又はこれに加えて、分析コントローラ130は、バイオ医薬品の1つ又は複数のバリアントを識別するべく、液体クロマトグラフィインスツルメントによって出力されたクロマトグラムを解析することができる。本明細書において使用されている、バリアントは、例えば、更なる官能基、酸化したアミノ酸、及び/又はこれらに類似したものの存在を含む、ターゲットバイオ医薬品と比較された際に1つ又は複数の構造的な差を有する、バイオ医薬品の分子を意味しうる。これらの構造的な差は、例えば、電荷、疎水性、サイズ、及びこれらに類似したものを含む、バリアントの特性の差として更に発現しうる。従って、バリアントの例は、電荷バリアント(例えば、酸性バリアント、塩基性バリアント、及び/又はこれらに類似したもの)、疎水性バリアント(例えば、ターゲットバイオ医薬品よりも疎水性である又は乏しく疎水性であるバリアント)、及びサイズバリアント(例えば、集合体、オリゴマー、ダイマー、モノマー、及び/又はこれらに類似したもの)を含みうる。
バリアントの存在の検出は、バイオ医薬品中の不純物の存在の検出に類似しうる。例えば、バリアントの存在は、ターゲットバイオ医薬品と関連するインタクトタンパク質分子とは構造的に異なっているインタクトタンパク質分子を識別するべくインタクトタンパク質分子を検査することにより、検出することができる。バリアントが有する構造的な差のタイプに応じて、バイオ医薬品中のバリアントの存在は、バイオ医薬品の安全性及び効能に対して影響又は悪影響を有していない場合がある。但し、不純物の検出は、バイオ医薬品の製造の際に、必要となりうる。更には、バイオ医薬品中に存在している不純物の量を最小値において又は閾値未満において維持することが望ましい場合もある。
上述のように、分析コントローラ130は、液体クロマトグラフィインスツルメントによって出力されるクロマトグラムに基づいて、バイオ医薬品中に存在しているバリアントを識別することができる。バイオ医薬品と関連するクロマトグラムは、バイオ医薬品中に含まれているそれぞれのバリアントごとに、例えば、ピーク面積、ピーク保持時間、百分率相対ピーク面積、及び/又はこれらに類似したものを含む、1つ又は複数のピーク値を含みうる。従って、分析コントローラ130は、それぞれのクロマトグラムから、ターゲットバイオ医薬品と関連するピーク値のみならず、ターゲットバイオ医薬品のバリアントを抽出するべく、1つ又は複数のクロマトグラムを解析することができる。更には、分析コントローラ130は、別個のファイル内に、それぞれのクロマトグラムから抽出されたピーク値を挿入することもできる。例えば、分析コントローラ130は、1つ又は複数の閾値を超過する、且つ/又は、値の1つ又は複数の範囲内にある、ピーク値を抽出することができる。従って、結果的に得られるファイルは、例えば、ターゲットバイオ医薬品のピーク値(例えば、ピーク面積、ピーク保持時間、及び/又は百分率相対ピーク面積)、ターゲットバイオ医薬品の電荷バリアント、ターゲットバイオ医薬品のサイズバリアント、ターゲットバイオ医薬品の疎水性バリアント、及び/又はこれらに類似したものを含む、ターゲットバイオ医薬品のみならず、ターゲットバイオ医薬品のバリアントの1つ又は複数のピーク値を含みうる。
いくつかの例示用の実施形態において、分析コントローラ130は、バリアントの特定のタイプを更に識別するべく、ピーク値を抽出することができる。例えば、バリアントは、(例えば、バリアントが、ターゲットバイオ医薬品との関係において溶出する際の)ターゲットバイオ医薬品のピーク保持時間との関係におけるそのピーク保持時間に少なくとも部分的に基づいて、ターゲットバイオ医薬品よりも疎水性である、或いは、ターゲットバイオ医薬品よりも乏しく疎水性である、として識別することができる。或いは、この代わりに、且つ/又はこれに加えて、バリアントは、ターゲットバイオ医薬品のピーク保持時間との関係におけるそのピーク保持時間に少なくとも部分的に基づいて、ターゲットバイオ医薬品よりも酸性である、或いは、ターゲットバイオ医薬品よりも乏しく酸性である、として識別することもできる。例えば、ターゲットバイオ医薬品のピーク値よりも早期に溶出するピーク値を有するバリアントは、ターゲットバイオ医薬品の相対的に酸性のバリアントでありうる一方、ターゲットバイオ医薬品のピーク値よりも遅れて溶出するピーク値を有するバリアントは、ターゲットバイオ医薬品の相対的に塩基性のバリアントでありうる。
いくつかの例示用の実施形態において、分析コントローラ130は、複数のクロマトグラムに跨って(例えば、バイオ医薬品の異なるサンプルの)バリアントのピーク値を抽出及び分析することができる。例えば、分析コントローラ130は、一連のクロマトグラムからピーク値を抽出及び分析してもよく、これらのそれぞれは、異なる時点におけるバイオ医薬品の同一のサンプルと関連付けられている。バイオ医薬品のサンプルは、バイオ医薬品のサンプルが、例えば、第1時点における第1ストレス、第2時点における第2ストレス、及び/又はこれらに類似したものなどの、異なるタイプのストレスに曝露されるのに伴って、時間に伴い、変化及び成長を示しうる。従って、異なるタイプのストレスとバイオ医薬品のサンプル中に存在しうる様々なタイプのバリアントの間の相関を識別するべく、第1時点において取得された第1クロマトグラム内に含まれているピーク値を第2時点において取得された第2クロマトグラム内に含まれているピーク値と比較することができる。例えば、特定のタイプのストレスが、ターゲットバイオ医薬品の酸性バリアント、ターゲットバイオ医薬品の塩基性バリアント、ターゲットバイオ医薬品の相対的に疎水性のバリアント、ターゲットバイオ医薬品の相対的に乏しい疎水性のバリアント、及び/又はこれらに類似したもの、の相対的に大きな(又は、小さな)量を生成したのかどうかを判定するべく、異なるクロマトグラムからのピーク値を比較することができる。
図4は、いくつかの例示用の実施形態による、バイオ医薬品分析用のデータを抽出するプロセス400を示すフローチャートを示している。図1、図2A~B、図3A~B、及び図4を参照すれば、プロセス400は、分析コントローラ130によって実行することができる。
分析コントローラ130は、ソースディレクトリと関連する第1パスに少なくとも基づいて、ソースディレクトリ内に含まれている第1の処理済みの出力ファイルを選択することができる(402)。例えば、分析コントローラ130は、n個の処理済みの出力ファイル(例えば、f’,f’,...,f’)を保存しているソースディレクトリのパスに少なくとも基づいて、第1の処理済みの出力ファイルf’を選択することができる。
分析コントローラ130は、閾値未満である、第1データエントリと関連する第1質量値と基準質量値の間の差に少なくとも基づいて、第1の処理済みの出力ファイル内に含まれている第1データエントリを少なくとも識別するべく、第1の処理済みの出力ファイルを解析することができる(404)。例えば、分析コントローラ130は、対象の分子の基準質量値にマッチングした質量値と関連するデータエントリに少なくとも基づいて、第1の処理済みの出力ファイルf’内のデータエントリを識別することができる。いくつかの例示用の実施形態において、データエントリと関連する質量値は、2つの質量値の間の差が閾値を超過していない場合に基準質量値にマッチングしているものとして判定することができる。
分析コントローラ130は、ソースディレクトリと関連する第1パスに少なくとも基づいて、ソースディレクトリ内に含まれている第2の処理済みの出力ファイルを選択することができる(406)。例えば、分析コントローラ130は、n個の処理済みの出力ファイル(例えば、f’,f’,...,f’)を保存しているソースディレクトリのパスに少なくとも基づいて、第2の処理済みの出力ファイルf’を選択することができる。分析コントローラ130は、分析コントローラ130がソースディレクトリ内のすべてのn個の処理済みの出力ファイル(例えば、f’,f’,...,f’)の解析を完了する時点まで、ソースディレクトリから、更なる処理済みの出力ファイルを選択しうることを理解されたい。
分析コントローラ130は、閾値未満である、第2データエントリと関連する第2質量値と基準質量値の間の差に少なくとも基づいて、第2の処理済みの出力ファイル内に含まれている第2データエントリを少なくとも識別するべく、第2の処理済みの出力ファイルを解析することができる(408)。例えば、分析コントローラ130は、対象の分子の基準質量値にマッチングした質量値と関連するデータエントリに少なくとも基づいて第2の処理済みの出力ファイルf’内のデータエントリを識別することができる。上述のように、データエントリと関連する質量値は、2つの質量値の間の差が閾値を超過していない場合に基準質量値とマッチングしているものとして判定することができる。
分析コントローラ130は、宛先ディレクトリと関連する第2パスに少なくとも基づいて、宛先ディレクトリ内に含まれている第3ファイルを識別することができる(410)。例えば、分析コントローラ130は、宛先ディレクトリのパスに少なくとも基づいて、宛先ディレクトリ内に保存されている統合されたファイルrを識別することができる。
分析コントローラ130は、第3ファイル内に、第1データエントリ及び第2データエントリを挿入することができる(412)。例えば、分析コントローラ130は、統合されたファイルr内に、動作404及び408において識別されたデータエントリを挿入することができる。これを実行する際に、分析コントローラ130は、バイオ医薬品の複数のサンプル中に存在している異なる分子の種(インタクトタンパク質、サブユニットタンパク質、ペプチド、グリカン、及び/又はこれらに類似したもの)の相対存在量値を含むように、統合されたファイルrを生成することができる。図3Bが示しているように、統合されたファイルrは、n個の処理済みの出力ファイルから抽出されたデータエントリの視覚的表現を提供する1つ又は複数のデータ提示を含みうる。更には、統合されたファイルrは、バイオ医薬品中に存在している異なる分子の種(インタクトタンパク質、サブユニットタンパク質、ペプチド、グリカン、及び/又はこれらに類似したもの)の相対存在量に基づいた対応するバイオ医薬品のバイオ医薬品特性評価を可能にするべく、クライアント140に対して表示することができる。
図5は、この主題の実装形態と一貫性を有する演算システム500を示すブロック図を示している。図1及び図5を参照すれば、演算システム500は、質量分析計110、処理エンジン120、分析コントローラ130、クライアント140、及び/又は本明細書における任意のコンポーネントを実装するべく、使用することができる。
図5に示されているように、演算装置500は、プロセッサ510と、メモリ520と、ストレージ装置530と、入出力装置540と、を含むことができる。プロセッサ510、メモリ520、ストレージ装置530、及び入出力装置540は、システムバス550を介して相互接続することができる。プロセッサ510は、演算システム500内における実行のために命令を処理する能力を有する。このような実行された命令は、例えば、質量分析計110、処理エンジン120、分析コントローラ130、クライアント140の1つ又は複数のコンポーネントを実装することができる。いくつかの例示用の実施形態において、プロセッサ510は、シングルスレッドプロセッサであってよい。或いは、その代わりに、プロセッサ510は、マルチスレッドプロセッサであってもよい。プロセッサ510は、入出力装置540を介して提供されるユーザーインターフェイス用のグラフィカル情報を表示するべく、メモリ520内において、且つ/又は、ストレージ装置530上において、保存された命令を処理する能力を有する。
メモリ520は、演算システム500内において情報を保存する揮発性又は不揮発性などのコンピュータ可読媒体である。メモリ520は、例えば、構成オブジェクトデータベースを表すデータ構造を保存することができる。ストレージ装置530は、演算システム500用の永続的な保存を提供する能力を有する。ストレージ装置530は、フロッピーディスク装置、ハードディスク装置、光ディスク装置、テープ装置、半導体装置、及び/又はその他の適切な永続的なストレージ手段であってよい。入出力装置540は、演算システム500用の入出力動作を提供している。いくつかの例示用の実施形態において、入出力装置540は、キーボード及び/又はポインティング装置を含む。様々な実装形態において、入出力装置540は、グラフィカルユーザーインターフェイスを表示するための表示ユニットを含む。
いくつかの例示用の実施形態によれば、入出力装置540は、ネットワーク装置用の入出力動作を提供することができる。例えば、入出力装置540は、1つ又は複数の有線及び/又は無線ネットワーク(例えば、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、インターネット)と通信するべく、Ethernetポート又はその他のネットワーキングポートを含むことができる。
いくつかの例示用の実施形態において、演算システム500は、様々なフォーマットにおけるデータの組織化、分析、及び/又は保存のために使用される様々な対話型コンピュータソフトウェアアプリケーションを実行するべく、使用することができる。或いは、この代わりに、演算システム500は、任意のタイプのソフトウェアアプリケーションを実行するべく、使用することもできる。これらのアプリケーションは、例えば、計画機能(例えば、スプレッドシート文書、Wordプロセッシング文書、及び/又は任意のその他のオブジェクト、などの生成、管理、編集)、演算機能、通信機能、などのような様々な機能を実行するべく、使用することができる。アプリケーションは、様々なアドイン機能を含むことが可能であり、或いは、スタンドアロン演算プロダクト及び/又は機能であってもよい。アプリケーション内における起動の際に、機能は、入出力装置540を介して提供されるユーザーインターフェイスを生成するべく使用することができる。ユーザーインターフェイスは、演算システム500によって生成することが可能であり、且つ、(例えば、コンピュータ画面モニタ上などにおいて)ユーザーに提示することができる。
本明細書において記述されている主題の1つ又は複数の態様又は特徴は、デジタル電子回路、集積回路、特別に設計されたASIC、フィールドプログラム可能なゲートアレイ(FPGA)コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はこれらの組合せにおいて実現することができる。これらの様々な態様又は特徴は、ストレージシステム、少なくとも1つの入力装置、及び少なくとも1つの出力装置との間において、データ及び命令を受け取るように、且つ、データ命令を送信するように、結合された、特殊目的型又は汎用でありうる、少なくとも1つのプログラム可能なプロセッサを含むプログラム可能なシステム上において実行可能且つ/又は解釈可能である1つ又は複数のコンピュータプログラムにおける実装形態を含むことができる。プログラム可能なシステム又は演算システムは、クライアント及びサーバーを含みうる。クライアント及びサーバーは、一般に、互いに離れており、且つ、通常、通信ネットワークを通じてやり取りしている。クライアントとサーバーの関係は、個々のコンピュータ上において稼働している、且つ、互いにクライアント-サーバーの関係を有する、コンピュータプログラムにより、発生する。
プログラム、ソフトウェア、ソフトウェアアプリケーション、アプリケーション、コンポーネント、又はコードとも呼称されうる、これらのコンピュータプログラムは、プログラム可能なプロセッサ用の機械命令を含み、且つ、ハイレベルな手続き型及び/又はオブジェクト指向のプログラミング言語において、且つ/又は、アセンブリ/機械言語において、実装することができる。本明細書において使用されている「機械可読媒体」という用語は、機械可読信号として機械命令を受け取る機械可読媒体を含む、プログラム可能なプロセッサに機械命令及び/又はデータを提供するべく使用される、例えば、磁気ディスク、光ディスク、メモリ、及びプログラム可能な論理装置(PLD)などの、任意のコンピュータプログラムプロダクト、装置及び/又は装置を意味している。「機械可読信号」という用語は、機械命令及び/又はデータをプログラム可能なプロセッサに提供するべく使用される任意の信号を意味している。機械可読媒体は、例えば、一時的ではない半導体メモリ、又は磁気ハードドライブ、又は任意の等価なストレージ媒体のように、このような機械命令を一時的ではない方式で保存することができる。或いは、この代わりに、又はこれに加えて、機械可読媒体は、例えば、1つ又は複数の物理的プロセッサコアと関連するプロセッサキャッシュ又はその他のランダムメモリのように、一時的な方式でこのような機械命令を保存することもできる。
ユーザーとのやり取りを提供するべく、本明細書において記述されている主題の1つ又は複数の態様又は特徴は、例えば、情報をユーザーに表示するための、陰極線管(CRT)又は液晶ディスプレイ(LCD)又は発光ダイオード(LED)モニタ、などの、表示装置と、ユーザーが入力をコンピュータに提供しうる、キーボードと、例えば、マウス又はトラックボールなどの、ポインティング装置と、を有するコンピュータ上において実装することができる。同様に、その他の種類の装置も、ユーザーとのやり取りを提供するべく、使用することができる。例えば、ユーザーに提供されるフィードバックは、例えば、視覚的フィードバック、聴覚的フィードバック、又は触覚的フィードバックなどの、感覚的フィードバックの任意の形態であることが可能であり、且つ、ユーザーからの入力も、音響、発話、又は触覚入力を含む、任意の形態において受け取ることができる。その他の可能な入力装置は、シングル又はマルチポイントの抵抗性又は容量性トラックパッド、音声認識ハードウェア及びソフトウェア、光学スキャナ、光学ポインタ、デジタル画像キャプチャ装置、及び関連する解釈ソフトウェア、及びこれらに類似したものなどの、タッチスクリーン又はその他の接触感知装置を含む。
以上の説明において、且つ、請求項において、「~の少なくとも1つ」又は「~の1つ又は複数」などのフレーズが、要素又は特徴の接続リストによって後続された状態において発生している場合がある。又、「及び/又は」という用語も、2つ以上の要素又は特徴のリスト内において発生している場合がある。使用されている文脈と黙示的に又は明示的に矛盾していない限り、このようなフレーズは、個々に列挙されている要素又は特徴の任意のもの、或いは、その他の記述されている要素又は特徴の任意のものとの組合せにおける、記述されている要素又は特徴の任意のもの、を意味するべく、意図されている。例えば、「A及びBの少なくとも1つ」、「A及びBの1つ又は複数」、及び「A及び/又はB」というフレーズは、それぞれ、「Aのみ、Bのみ、又は一緒にA及びB」を意味するべく、意図されている。又、3つ以上のアイテムを含むリストについても、類似の解釈が意図されている。例えば、「A、B、及びCの少なくとも1つ」、「A、B、及びCの1つ又は複数」、及び「A、B、及び/又はC」というフレーズは、それぞれ、「Aのみ、Bのみ、Cのみ、一緒にA及びB、一緒にA及びC、一緒にB及びC、又は一緒にA及びB及びC」を意味するべく、意図されている。以上における且つ請求項における「~に基づいて」という用語の使用は、記述されていない特徴又は要素も許容可能となるように、「~に少なくとも部分的に基づいて」を意味するべく、意図されている。
本明細書において記述されている主題は、望ましい構成に応じて、システム、装置、方法、及び/又は物品において実施することができる。以上の説明において記述されている実装形態は、本明細書において記述されている主題と一貫性を有するすべての実装形態を表すものではない。その代わりに、これらは、記述されている主題と関係する態様と一貫性を有するいくつかの例であるに過ぎない。以上においては、いくつかの変形について詳述されているが、その他の変形又は追加が可能である。具体的には、本明細書において記述されているものに加えて、更なる特徴及び/又は変形を提供することができる。例えば、上述の実装形態は、開示されている特徴の様々な組合せ及びサブ組合せ、並びに/或いは、以上において開示されているいくつかの更なる特徴の組合せ及びサブ組合せを対象としうる。これに加えて、添付図面において描かれている且つ/又は本明細書において記述されている論理フローは、必ずしも、望ましい結果を実現するべく、図示の特定の順序又は連続的な順序を必要としているわけではない。その他の実装形態が添付の請求項の範囲内に含まれうる。

Claims (41)

  1. システムであって、
    少なくとも1つのデータプロセッサと、
    命令を保存する少なくとも1つのメモリと、
    を有し、
    前記命令は、前記少なくとも1つのデータプロセッサによって実行された際に、
    ソースディレクトリと関連する第1パスに少なくとも基づいて、前記ソースディレクトリ内に含まれている第1ファイルを選択するステップと、
    基準質量値に少なくとも基づいて、前記第1ファイル内に含まれている第1データエントリを少なくとも識別するべく、前記第1ファイルを解析するステップであって、前記第1データエントリは、第1質量値を含み、且つ、前記第1データエントリは、閾値未満である前記第1質量値と前記基準質量値の間の差に少なくとも基づいて識別されている、ステップと、
    第2ファイル内に、前記第1データエントリを挿入するステップと、
    を有する動作を結果的にもたらす、システム。
  2. 前記第1データエントリは、前記第1質量値を有する種の存在量値を更に含む請求項1に記載のシステム。
  3. 前記種は、インタクトタンパク質、サブユニットタンパク質、ペプチド、及び/又はグリカンを有する請求項2に記載のシステム。
  4. 前記第1ファイルは、表を含み、前記第1データエントリは、前記表の行内に保存されており、前記第1質量値は、前記表の第1列内に保存されており、且つ、前記存在量値は、前記表の第2列内に保存されている請求項2~3のいずれか1項に記載のシステム。
  5. 前記第1ファイルは、質量分析計からの出力を有する請求項1~4のいずれか1項に記載のシステム。
  6. 前記第1ファイルは、質量分析計の出力を処理することによって生成されるExcelファイル及び/又はPDF(Portable Document Format)ファイルを有する請求項1~5のいずれか1項に記載のシステム。
  7. 宛先ディレクトリと関連する第2パスに少なくとも基づいて、前記宛先ディレクトリ内に含まれている前記第2ファイルを識別するステップを更に有する請求項1~6のいずれか1項に記載のシステム。
  8. 前記ソースディレクトリと関連する前記第1パスに少なくとも基づいて、前記ソースディレクトリ内に含まれている第3ファイルを選択するステップと、
    前記基準質量値に少なくとも基づいて、前記第3ファイル内に含まれている第2データエントリを少なくとも識別するべく、前記第3ファイルを解析するステップであって、前記第2データエントリは、第2質量値を含み、且つ、前記第2データエントリは、前記閾値未満である前記第2質量値と前記基準質量値の間の差に少なくとも基づいて識別されている、ステップと、
    前記第2ファイル内に、前記第2データエントリを挿入するステップと、
    を更に有する請求項1~7のいずれか1項に記載のシステム。
  9. 前記第3ファイルは、前記ソースディレクトリが、前記第1ファイルに加えて、1つ又は複数のファイルを含んでいることを判定することに応答して、選択される、請求項8に記載のシステム。
  10. 前記第1データエントリは、前記第1データエントリに先行する第1区切り文字及び/又は前記第1データエントリに後続する第2区切り文字に少なくとも基づいて識別されている請求項1~9のいずれか1項に記載のシステム。
  11. コンピュータ実装された方法であって、
    ソースディレクトリと関連する第1パスに少なくとも基づいて、前記ソースディレクトリ内に含まれている第1フェイルを選択するステップと、
    基準質量値に少なくとも基づいて、前記第1ファイル内に含まれている第1データエントリを少なくとも識別するべく、前記第1ファイルを解析するステップであって、前記第1データエントリは、第1質量値を含み、且つ、前記第1データエントリは、閾値未満である前記第1質量値と前記基準質量値の間の差に少なくとも基づいて識別されている、ステップと、
    第2ファイル内に、前記第1データエントリを挿入するステップと、
    を有する方法。
  12. 前記第1データエントリは、前記第1質量値を有する種の存在量値を更に含む請求項11に記載の方法。
  13. 前記種は、インタクトタンパク質、サブユニットタンパク質、ペプチド、及び/又はグリカンを有する請求項12に記載の方法。
  14. 前記第1ファイルは、表を含み、前記第1データエントリは、前記表の行内に保存されており、前記第1質量値は、前記表の第1列内に保存されており、且つ、前記存在量値は、前記表の第2列に保存されている請求項12~13のいずれか1項に記載の方法。
  15. 前記第1ファイルは、質量分析計からの出力を有する請求項11~14のいずれか1項に記載の方法。
  16. 前記第1ファイルは、質量分析計の出力を処理することによって生成されたExcelファイル及び/又はPDF(Portable Document Format)ファイルを有する請求項11~15のいずれか1項に記載の方法。
  17. 宛先ディレクトリと関連する第2パスに少なくとも基づいて、前記宛先ディレクトリ内に含まれている前記第2ファイルを識別するステップを更に有する請求項11~16のいずれか1項に記載の方法。
  18. 前記ソースディレクトリと関連する前記第1パスに少なくとも基づいて、前記ソースディレクト内に含まれている第3ファイルを選択するステップと、
    前記基準質量値に少なくとも基づいて、前記第3ファイル内に含まれている第2データエントリを少なくとも識別するべく、前記第3ファイルを解析するステップであって、前記第2データエントリは、第2質量値を含み、且つ、前記第2データエントリは、前記閾値未満である前記第2質量値と前記基準質量値の間の差に少なくとも基づいて識別されている、ステップと、
    前記第2ファイル内に、前記第2データエントリを挿入するステップと、
    を更に有する請求項11~17のいずれか1項に記載の方法。
  19. 前記第1データエントリは、前記第1データエントリに先行する第1区切り文字及び/又は前記第1データエントリに後続する第2区切り文字に少なくとも基づいて識別されている請求項11~18のいずれか1項に記載の方法。
  20. 命令を保存する一時的ではないコンピュータ可読媒体であって、
    前記命令は、少なくとも1つのデータプロセッサによって実行された際、
    ソースディレクトリと関連する第1パスに少なくとも基づいて、前記ソースディレクトリ内に含まれている第1ファイルを選択するステップと、
    基準質量値に少なくとも基づいて、前記第1ファイル内に含まれている第1データエントリを少なくとも識別するべく、前記第1ファイルを解析するステップであって、前記第1データエントリは、第1質量値を含み、且つ、前記第1データエントリは、閾値未満である前記第1質量値と前記基準質量値の間の差に少なくとも基づいて識別されている、ステップと、
    第2ファイル内に、前記第データエントリを挿入するステップと、
    を有する動作を結果的にもたらす、媒体。
  21. システムであって、
    少なくとも1つのデータプロセッサと、
    命令を保存する少なくとも1つのメモリと、
    を有し、
    前記命令は、前記少なくとも1つのデータプロセッサによって実行された際に、
    ソースディレクトリと関連する第1パスに少なくとも基づいて、前記ソースディレクトリ内に含まれている第1ファイルを選択するステップと、
    ターゲットバイオ医薬品のバリアントの第1ピーク値を含む第1データエントリを少なくとも識別するべく、前記第1ファイルを解析するステップと、
    第2ファイル内に、前記第1データエントリを挿入するステップと、
    を有する動作を結果的にもたらす、システム。
  22. 前記第1ピーク値は、ピーク面積、ピーク保持時間、及び百分率相対ピーク面積の少なくとも1つを含む請求項21に記載のシステム。
  23. 前記バリアントは、電荷バリアント、疎水性バリアント、又はサイズバリアントを有する請求項21~22のいずれか1項に記載のシステム。
  24. 前記第1ファイルは、クロマトグラムを有する請求項21~23のいずれか1項に記載のシステム。
  25. 前記第1データエントリは、閾値を超過する、且つ/又は、値の範囲内にある、前記第1ピーク値に少なくとも基づいて識別されている請求項21~24のいずれか1項に記載のシステム。
  26. 前記第2ファイル内に含まれている前記第1データエントリに少なくとも基づいて、前記ターゲットバイオ医薬品の前記バリアントのタイプを識別するステップを更に有する請求項21~25のいずれか1項に記載のシステム。
  27. 前記バリアントは、前記ターゲットバイオ医薬品のピーク値よりも早期に溶出する前記第1ピーク値に少なくとも基づいて前記ターゲットバイオ医薬品の酸性バリアントとして識別され、且つ、前記バリアントは、前記ターゲットバイオ医薬品の前記ピーク値よりも遅れて溶出する前記第1ターゲット値に少なくとも基づいて前記ターゲットバイオ医薬品の塩基性バリアントとして識別される、請求項26に記載のシステム。
  28. 前記バリアントは、前記バリアントの第1ピーク保持時間及び前記ターゲットバイオ医薬品の第2ピーク保持時間に少なくとも基づいて、前記ターゲットバイオ医薬品よりも疎水性である、或いは、前記ターゲットバイオ医薬品よりも乏しく疎水性である、として識別される、請求項26~27のいずれか1項に記載のシステム。
  29. 前記ソースディレクトリと関連する前記第1パスに少なくとも基づいて、前記ソースディレクトリ内に含まれている第3ファイルを選択するステップと、
    前記ターゲットバイオ医薬品の前記バリアントの第2ピーク値を含む第2データエントリを少なくとも識別するべく、前記第3ファイルを解析するステップと、
    前記第2ファイル内に、前記第2データエントリを挿入するステップと、
    を更に有する請求項21~28のいずれか1項に記載のシステム。
  30. 前記第1ファイルは、第1時点において取得された第1クロマトグラムを有し、前記第2ファイルは、第2時点において取得された第2クロマトグラムを有し、前記バリアントを含むバイオ医薬品のサンプルは、前記第1時点における第1ストレス及び前記第2時点におけるストレスに曝露されており、且つ、前記第1ストレスは、前記第2ファイルに少なくとも基づいて前記第2ストレスよりも大きな量の前記バリアントを生成するものとして判定される、請求項29に記載のシステム。
  31. コンピュータ実装された方法であって、
    ソースディレクトリと関連する第1パスに少なくとも基づいて、前記ソースディレクトリ内に含まれている第1ファイルを選択するステップと、
    ターゲットバイオ医薬品のバリアントの第1ピーク値を含む第1データエントリを少なくとも識別するべく、前記第1ファイルを解析するステップと、
    第2ファイル内に、前記第1データエントリを挿入するステップと、
    を有する方法。
  32. 前記第1ピーク値は、ピーク面積、ピーク保持時間、百分率相対ピーク面積の少なくとも1つを含む請求項31に記載の方法。
  33. 前記バリアントは、電荷バリアント、疎水性バリアント、又はサイズバリアントを有する請求項31~32のいずれか1項に記載の方法。
  34. 前記第1ファイルは、クロマトグラムを有する請求項31~33のいずれか1項に記載の方法。
  35. 前記第1データエントリは、閾値を超過する、且つ/又は、値の範囲内にある、前記第1ピーク値に少なくとも基づいて識別されている請求項31~34のいずれか1項に記載の方法。
  36. 前記第2ファイル内に含まれている前記第1データエントリに少なくとも基づいて、前記ターゲットバイオ医薬品の前記バリアントのタイプを識別するステップを更に有する請求項31~35のいずれか1項に記載の方法。
  37. 前記バリアントは、前記ターゲットバイオ医薬品のピーク値よりも早期に溶出する前記第1ピーク値に少なくとも基づいて前記ターゲットバイオ医薬品の酸性バリアントとして識別され、且つ、前記バリアントは、前記ターゲットバイオ医薬品の前記ピーク値よりも遅れて溶出する前記第1ターゲット値に少なくとも基づいて前記ターゲットバイオ医薬品の塩基性バリアントとして識別されている請求項36に記載の方法。
  38. 前記バリアントは、前記バリアントの第1ピーク保持時間及び前記ターゲットバイオ医薬品の第2ピーク保持時間に少なくとも基づいて、前記ターゲットバイオ医薬品よりも疎水性である、或いは、前記ターゲットバイオ医薬品よりも乏しく疎水性である、として識別される請求項36~37のいずれか1項に記載の方法。
  39. 前記ソースディレクトリと関連する前記第1パスに少なくとも基づいて前記ソースディレクトリ内に含まれている第3ファイルを選択するステップと、
    前記ターゲットバイオ医薬品の前記バリアントの第2ピーク値を含む第2データエントリを少なくとも識別するべく、前記第3ファイルを解析するステップと、
    前記第2ファイル内に、前記第2データエントリを挿入するステップと、
    を更に有する請求項31~38のいずれか1項に記載の方法。
  40. 前記第1ファイルは、第1時点において取得された第1クロマトグラムを有し、前記第2ファイルは、第2時点において取得された第2クロマトグラムを有し、前記バリアントを含むバイオ医薬品のサンプルは、前記第1時点における第1ストレス及び前記第2時点における第2ストレスに曝露されており、且つ、前記第1ストレスは、前記第2ファイルに少なくとも基づいて前記第2ストレスよりも大きな量の前記バリアントを生成するものとして判定される請求項39に記載の方法。
  41. 命令を保存する一時的ではないコンピュータ可読媒体であって、
    前記命令は、少なくとも1つのデータプロセッサによって実行された際に、
    ソースディレクトリと関連するパスに少なくとも基づいて、前記ソースディレクトリ内に含まれているクロマトグラフを有する第1ファイルを選択するステップと、
    ターゲットバイオ医薬品のバリアントのピーク値を含むデータエントリを少なくとも識別するべく、前記第1ファイルを解析するステップと、
    第2ファイル内に、前記データエントリを挿入するステップと、
    を有する動作を結果的にもたらす、媒体。
JP2021546385A 2019-02-08 2020-02-07 バイオ医薬品分析用のデータ抽出 Pending JP2022520071A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962803339P 2019-02-08 2019-02-08
US62/803,339 2019-02-08
PCT/US2020/017145 WO2020163675A1 (en) 2019-02-08 2020-02-07 Data extraction for biopharmaceutical analysis

Publications (1)

Publication Number Publication Date
JP2022520071A true JP2022520071A (ja) 2022-03-28

Family

ID=71947891

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021546385A Pending JP2022520071A (ja) 2019-02-08 2020-02-07 バイオ医薬品分析用のデータ抽出

Country Status (5)

Country Link
US (1) US20220139503A1 (ja)
EP (1) EP3921652A4 (ja)
JP (1) JP2022520071A (ja)
AU (1) AU2020219799A1 (ja)
WO (1) WO2020163675A1 (ja)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5778389A (en) * 1996-05-23 1998-07-07 Electronic Data Systems Corporation Method and system for synchronizing computer file directories
US20070282537A1 (en) * 2006-05-26 2007-12-06 The Ohio State University Rapid characterization of post-translationally modified proteins from tandem mass spectra
US7884318B2 (en) * 2008-01-16 2011-02-08 Metabolon, Inc. Systems, methods, and computer-readable medium for determining composition of chemical constituents in a complex mixture
US9378216B2 (en) * 2009-09-29 2016-06-28 Oracle America, Inc. Filesystem replication using a minimal filesystem metadata changelog
WO2013158279A1 (en) * 2012-04-20 2013-10-24 Abbvie Inc. Protein purification methods to reduce acidic species
US9612246B2 (en) * 2013-05-21 2017-04-04 University Of Washington Though Its Center For Commercialization Real-time analysis for cross-linked peptides
US9354922B2 (en) * 2014-04-02 2016-05-31 International Business Machines Corporation Metadata-driven workflows and integration with genomic data processing systems and techniques
EP3443497A1 (en) * 2016-04-11 2019-02-20 DiscernDx, Inc. Mass spectrometric data analysis workflow
US10546736B2 (en) * 2017-08-01 2020-01-28 Protein Metrics Inc. Interactive analysis of mass spectrometry data including peak selection and dynamic labeling

Also Published As

Publication number Publication date
TW202038249A (zh) 2020-10-16
WO2020163675A1 (en) 2020-08-13
EP3921652A1 (en) 2021-12-15
AU2020219799A1 (en) 2021-09-02
US20220139503A1 (en) 2022-05-05
EP3921652A4 (en) 2022-11-02

Similar Documents

Publication Publication Date Title
Searle et al. Generating high quality libraries for DIA MS with empirically corrected peptide predictions
Park et al. Informed-Proteomics: open-source software package for top-down proteomics
Domingo-Almenara et al. Metabolomics data processing using XCMS
Doerr Mass spectrometry-based targeted proteomics
Ting et al. Peptide-centric proteome analysis: an alternative strategy for the analysis of tandem mass spectrometry data
Sandin et al. Data processing methods and quality control strategies for label-free LC–MS protein quantification
JP4594154B2 (ja) 少なくとも1つの成分および生成する生成物の観点でサンプルを特性付けし、特性付けデータを提供するための2つ以上の技術に基づいた少なくとも1つのサンプルの分析;方法、システムおよび指示プログラム
JP6088177B2 (ja) 解析装置、解析方法、プログラム
Wallace et al. Mass spectral library quality assurance by inter-library comparison
Wei et al. Data preprocessing method for liquid chromatography–mass spectrometry based metabolomics
Burton et al. Instrumental and experimental effects in LC–MS-based metabolomics
JP2011510300A (ja) 複合混合物の化学成分の組成を決定するためのシステム、方法、及びコンピュータ読み取り可能な媒体
LaMarche et al. MultiAlign: a multiple LC-MS analysis tool for targeted omics analysis
Bedia et al. Compression strategies for the chemometric analysis of mass spectrometry imaging data
Zhang et al. LFQ uant: a label‐free fast quantitative analysis tool for high‐resolution LC‐MS/MS proteomics data
JP6191773B2 (ja) 質量分析データ処理装置
Franceschi et al. Self‐organizing maps: A versatile tool for the automatic analysis of untargeted imaging datasets
CN109643633B (zh) 自动化质谱库保留时间校正
Edwards Protein identification from tandem mass spectra by database searching
US10636643B2 (en) Ionization method selection assisting apparatus and method
CA2967769A1 (en) Determining the identity of modified compounds
JP2022520071A (ja) バイオ医薬品分析用のデータ抽出
Sun et al. BPDA2d—a 2D global optimization-based Bayesian peptide detection algorithm for liquid chromatograph–mass spectrometry
Erny et al. Algorithm for comprehensive analysis of datasets from hyphenated high resolution mass spectrometric techniques using single ion profiles and cluster analysis
JP2013145245A (ja) 質量分析データ処理方法及び装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231205

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240304