WO2024070543A1

WO2024070543A1 - 情報処理装置、情報処理装置の作動方法、情報処理装置の作動プログラム、並びに状態予測モデル

Info

Publication number: WO2024070543A1
Application number: PCT/JP2023/032535
Authority: WO
Inventors: 惟杉田
Original assignee: 富士フイルム株式会社
Priority date: 2022-09-27
Filing date: 2023-09-06
Publication date: 2024-04-04

Abstract

プロセッサを備え、プロセッサは、目的タンパク質を有効成分とするバイオ医薬品の製造プロセスにおいて産生される懸濁液中の対象成分の状態を予測する状態予測モデルを生成するための準備処理として、目的タンパク質から発せられる電磁波のスペクトルを測定した第１スペクトル測定データと、対象成分から発せられる電磁波のスペクトルを測定した第２スペクトル測定データとを取得し、第１スペクトル測定データの強度値と、第２スペクトル測定データの強度値との比較により、対象成分に特有な特有波数帯または特有波長帯を選定する、情報処理装置。

Description

情報処理装置、情報処理装置の作動方法、情報処理装置の作動プログラム、並びに状態予測モデル

　本開示の技術は、情報処理装置、情報処理装置の作動方法、情報処理装置の作動プログラム、並びに状態予測モデルに関する。

　抗体等の目的タンパク質を有効成分とするバイオ医薬品の製造プロセスが知られている。こうした製造プロセスにおいては、目的タンパク質をはじめとした各種成分が液体中に分散された懸濁液がしばしば産生される。この懸濁液中の対象成分の状態を監視することは、製造プロセスの成否を見極めるために重要である。

　特開２０１６－１２８８２２号公報には、対象成分の状態として目的タンパク質の凝集体の濃度を予測する技術が記載されている。具体的には、特開２０１６－１２８８２２号公報では、懸濁液のラマンスペクトルを測定して得られたスペクトル測定データから、ＰＬＳ（Ｐａｒｔｉａｌ　Ｌｅａｓｔ　Ｓｑｕａｒｅｓ　部分的最小二乗回帰）モデルといった線形モデルを用いて凝集体の濃度を予測している。

　特開２０１６－１２８８２２号公報に記載の技術は、凝集体の濃度の予測精度がそれほど高くなく、実用性に乏しかった。その原因としては、ラマンスペクトル測定データの各波数のうち、凝集体の濃度の予測に寄与すると思われる波数帯を選定していないことが考えられる。

　凝集体の濃度の予測に寄与すると思われる波数帯を選定する方法としては、例えばスパースモデリングが考えらえる。しかしながら、スパースモデリングで選定される波数帯は、選定のために準備されたラマンスペクトル測定データに大いに依存する。このため、スパースモデリングで選定される波数帯が、真に凝集体の濃度の予測に寄与すると思われる合理的なものであるとは断言できない。

　本開示の技術に係る１つの実施形態は、バイオ医薬品の製造プロセスにおいて産生される懸濁液中の対象成分の状態の予測に寄与すると思われる、合理的なスペクトル測定データの波数帯または波長帯を選定することが可能な情報処理装置、情報処理装置の作動方法、および情報処理装置の作動プログラムを提供する。

　また、本開示の技術に係る１つの実施形態は、バイオ医薬品の製造プロセスにおいて産生される懸濁液中の対象成分の状態を、従来と比べて高精度に予測することが可能な状態予測モデルを提供する。

　本開示の情報処理装置は、プロセッサを備え、プロセッサは、目的タンパク質を有効成分とするバイオ医薬品の製造プロセスにおいて産生される懸濁液中の対象成分の状態を予測する状態予測モデルを生成するための準備処理として、目的タンパク質から発せられる電磁波のスペクトルを測定した第１スペクトル測定データと、対象成分から発せられる電磁波のスペクトルを測定した第２スペクトル測定データとを取得し、第１スペクトル測定データの強度値と、第２スペクトル測定データの強度値との比較により、対象成分に特有な特有波数帯または特有波長帯を選定する。

　状態予測モデルは、特有波数帯または特有波長帯の強度値と対象成分の状態の正解データとで構成されるデータセットを用いて生成されることが好ましい。

　対象成分の状態は、懸濁液中の対象成分の濃度であり、データセットの元となった懸濁液中の目的タンパク質および対象成分の濃度は、ともに０．００１ｍｇ／ｍＬ～２０ｍｇ／ｍＬの範囲であることが好ましい。

　特有波数帯または特有波長帯の選定に供される懸濁液には、対象成分の生成を促進する前処理が施されることが好ましい。

　状態予測モデルは、対象成分の状態が未知の懸濁液から発せられる電磁波のスペクトルを測定した第３スペクトル測定データの、特有波数帯または特有波長帯の強度値に応じて、対象成分の状態の予測結果を出力することが好ましい。

　第３スペクトル測定データは、製造プロセスの進行中に測定されたデータであることが好ましい。

　第３スペクトル測定データは、ウイルス不活性化処理後、または陽イオンクロマトグラフィー処理後に測定されたデータであることが好ましい。

　第１スペクトル測定データおよび第２スペクトル測定データは、高速液体クロマトグラフィー装置を用いて懸濁液から分離された、目的タンパク質を含む第１溶液および対象成分を含む第２溶液から測定されたデータであることが好ましい。

　対象成分は、目的タンパク質の凝集体であることが好ましい。

　状態予測モデルは機械学習モデルであることが好ましい。

　目的タンパク質は抗体であることが好ましい。

　スペクトルはラマンスペクトルであることが好ましい。

　特有波数帯は、１２２０ｃｍ^－１～１２６０ｃｍ^－１の範囲、または１６５０ｃｍ^－１～１６９０ｃｍ^－１の範囲の少なくともいずれかにあることが好ましい。

　本開示の情報処理装置の作動方法は、目的タンパク質を有効成分とするバイオ医薬品の製造プロセスにおいて産生される懸濁液中の対象成分の状態を予測する状態予測モデルを生成するための準備処理として、目的タンパク質から発せられる電磁波のスペクトルを測定した第１スペクトル測定データと、対象成分から発せられる電磁波のスペクトルを測定した第２スペクトル測定データとを取得すること、並びに、第１スペクトル測定データの強度値と、第２スペクトル測定データの強度値との比較により、対象成分に特有な特有波数帯または特有波長帯を選定すること、を含む。

　本開示の情報処理装置の作動プログラムは、目的タンパク質を有効成分とするバイオ医薬品の製造プロセスにおいて産生される懸濁液中の対象成分の状態を予測する状態予測モデルを生成するための準備処理として、目的タンパク質から発せられる電磁波のスペクトルを測定した第１スペクトル測定データと、対象成分から発せられる電磁波のスペクトルを測定した第２スペクトル測定データとを取得すること、並びに、第１スペクトル測定データの強度値と、第２スペクトル測定データの強度値との比較により、対象成分に特有な特有波数帯または特有波長帯を選定すること、を含む処理をコンピュータに実行させる。

　本開示の状態予測モデルは、目的タンパク質を有効成分とするバイオ医薬品の製造プロセスにおいて産生される懸濁液から発せられる電磁波のスペクトルを測定したスペクトル測定データの各波数または各波長の強度値のうち、懸濁液中の対象成分に特有な特有波数帯または特有波長帯の強度値に応じて、対象成分の状態の予測結果を出力する機能をコンピュータに実行させる。

　本開示の技術によれば、バイオ医薬品の製造プロセスにおいて産生される懸濁液中の対象成分の状態の予測に寄与すると思われる、合理的なスペクトル測定データの波数帯または波長帯の強度値を選定することが可能な情報処理装置、情報処理装置の作動方法、および情報処理装置の作動プログラムを提供することができる。

　また、本開示の技術によれば、バイオ医薬品の製造プロセスにおいて産生される懸濁液中の対象成分の状態を、従来と比べて高精度に予測することが可能な状態予測モデルを提供することができる。

バイオ医薬品の製造プロセスの概要を示す図である。情報処理システムを示す図である。選定装置、学習装置、および運用装置を構成するコンピュータのブロック図である。第２精製液に対して施される前処理、高速液体クロマトグラフィー装置、および選定装置に入力されるデータを示す図である。スペクトル測定データおよびラマンスペクトルを示す図である。選定装置を構成するコンピュータのＣＰＵのブロック図である。クロマトグラムデータに基づいて、スペクトル測定データ群から第１スペクトル測定データおよび第２スペクトル測定データを特定する処理を示す図である。第１スペクトル測定データを示す図である。第２スペクトル測定データを示す図である。第１スペクトル測定データと第２スペクトル測定データの差分データを算出する処理を示す図である。差分データと閾値とを比較し、凝集体の特有波数帯を選定する処理を示す図である。差分データと閾値とを比較し、凝集体の特有波数帯を選定する処理を、ラマンスペクトル上で示した図である。学習装置を構成するコンピュータのＣＰＵのブロック図である。濃度予測モデルを構成するニューラルネットワークを示す図である。データセット群の成り立ちを示す図である。濃度予測モデルの学習フェーズにおける処理を示す図である。濃度予測モデルの検証フェーズにおける処理を示す図である。運用装置を構成するコンピュータのＣＰＵのブロック図である。第３スペクトル測定データの成り立ちを示す図である。特有波数帯データを参照して、第３スペクトル測定データから入力データを生成し、入力データを濃度予測モデルに入力し、濃度予測モデルから濃度予測結果を出力させる処理を示す図である。ラマンスペクトル分析画面を示す図である。濃度予測結果が表示されたラマンスペクトル分析画面を示す図である。選定装置の処理手順を示すフローチャートである。学習装置の処理手順を示すフローチャートである。運用装置の処理手順を示すフローチャートである。第３スペクトル測定データの成り立ちの別の例を示す図である。実施例および比較例の概要を示す表である。

　［第１実施形態］
　一例として図１に示すように、バイオ医薬品の製造プロセス２は、第１プロセス１０、第２プロセス１１、および第３プロセス１２に大別される。第１プロセス１０は、チャイニーズハムスター卵巣細胞（ＣＨＯ細胞（Ｃｈｉｎｅｓｅ　Ｈａｍｓｔｅｒ　Ｏｖａｒｙ　ｃｅｌｌｓ））といった細胞１３に抗体遺伝子１４を組み込み、抗体生産細胞１５を樹立するプロセスである。第２プロセスは、抗体生産細胞１５を培養槽１６にて細胞培養するプロセスである。

　第３プロセス１２は、培養上清液１７からバイオ医薬品の原薬１８を精製するプロセスである。培養上清液１７は、第２プロセス１１を終えた培養槽１６内の培養液から除細胞して得られた溶液である。培養上清液１７には、抗体生産細胞１５が生産した免疫グロブリン、すなわち抗体１９が分散されている。抗体１９は例えばモノクローナル抗体であり、バイオ医薬品の有効成分となる。また、培養上清液１７には抗体１９の凝集体２０も分散されている。抗体１９は、本開示の技術に係る「目的タンパク質」の一例である。凝集体２０は、本開示の技術に係る「対象成分」の一例である。

　凝集体２０は、抗体１９自体、および／または、抗体１９とアミノ酸配列が７０％以上一致する抗体１９の変成物が複数凝集したものである。このため、凝集体２０は抗体１９よりも質量が大きい。また、凝集体２０は抗体１９よりも分子量が大きい。具体的には、凝集体２０は、抗体１９の１．２倍以上の分子量を有する物質である。さらに言えば、凝集体２０は、好ましくは抗体１９の１．５倍以上、より好ましくは１．８倍以上、特に好ましくは１．９倍以上の分子量を有する物質である。なお、図示は省略したが、培養上清液１７には、抗体１９および凝集体２０の他に、細胞由来タンパク質・細胞由来ＤＮＡ（Ｄｅｏｘｙｒｉｂｏｎｕｃｌｅｉｃ　Ａｃｉｄ）、およびウイルス等も分散されている。

　第３プロセス１２においては、イムノアフィニティクロマトグラフィー装置２５、陽イオンクロマトグラフィー装置２６、および陰イオンクロマトグラフィー装置２７等により、培養上清液１７を連続的または断続的に精製する。イムノアフィニティクロマトグラフィー装置２５には培養上清液１７が導入される。イムノアフィニティクロマトグラフィー装置２５は、抗体１９と親和性をもつプロテインＡ等のリガンドを担体に固定したカラムを用いて培養上清液１７から抗体１９を抽出することで、第１精製液２８を生成する。第１精製液２８には、ウイルス不活性化処理２９が施される。第１精製液２８は、本開示の技術に係る「懸濁液」の一例である。

　陽イオンクロマトグラフィー装置２６には、ウイルス不活性化処理２９を施した後の第１精製液２８が導入される。陽イオンクロマトグラフィー装置２６は、陽イオン交換体を固定相とするカラムを用いて第１精製液２８から抗体１９を抽出することで、第２精製液３０を生成する。第２精製液３０は、本開示の技術に係る「懸濁液」の一例である。

　陰イオンクロマトグラフィー装置２７には第２精製液３０が導入される。陰イオンクロマトグラフィー装置２７は、陰イオン交換体を固定相とするカラムを用いて第２精製液３０から抗体１９を抽出することで、第３精製液３１を生成する。

　第３精製液３１はフィルタ３２に通されてウイルスが除去される。その後、第３精製液３１には、フィルタ３３を用いた限外濾過（ＵＦ：Ｕｌｔｒａｆｉｌｔｒａｔｉｏｎ）および透析濾過（ＤＦ：Ｄｉａｆｉｌｔｒａｔｉｏｎ）による濃縮・濾過処理が施される。これによりバイオ医薬品の原薬１８が得られる。こうした複数種のクロマトグラフィー装置２５～２７による成分分離処理を順に行うことで、培養上清液１７から凝集体２０等の夾雑物およびウイルスが段階的に除去され、抗体１９の純度が段階的に高められる。なお、イムノアフィニティクロマトグラフィー装置２５の前段に、シングルパスタンジェンシャルフロー濾過（ＳＰＴＦＦ：Ｓｉｎｇｌｅ　Ｐａｓｓ　Ｔａｎｇｅｎｔｉａｌ　Ｆｌｏｗ　Ｆｉｌｔｒａｔｉｏｎ）方式のフィルタを設けてもよい。

　一例として図２に示すように、情報処理システム４０は、選定装置４１Ａ、学習装置４１Ｂ、および運用装置４１Ｃにより構成される。これらはネットワーク４２を介して相互通信可能に接続されている。ネットワーク４２は、例えばインターネットまたは公衆通信網等のＷＡＮ（Ｗｉｄｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）である。選定装置４１Ａ、学習装置４１Ｂ、および運用装置４１Ｃは、例えばデスクトップ型のパーソナルコンピュータ、ノート型のパーソナルコンピュータ、あるいはタブレット端末等である。

　選定装置４１Ａは、ラマンスペクトルの各波数のうちで、凝集体２０に特有な特有波数帯を選定する処理を担う。学習装置４１Ｂは、凝集体２０の濃度を予測する濃度予測モデル９６（図１３参照）を学習させる処理を担う。運用装置４１Ｃは、学習済みの濃度予測モデル９６ＬＤ（図１３参照）を用いて、凝集体２０の濃度を予測する処理を担う。濃度は、本開示の技術に係る「状態」の一例である。なお、「状態」とは、対象成分の物理化学的な特徴を表す指標である。また、選定装置４１Ａ、学習装置４１Ｂ、および運用装置４１Ｃは、本開示の技術に係る「情報処理装置」の一例である。このように、本開示の技術に係る「情報処理装置」は、複数の装置に跨って実現されてもよい。

　一例として図３に示すように、選定装置４１Ａ、学習装置４１Ｂ、および運用装置４１Ｃを構成するコンピュータは、基本的には同じ構成であり、ストレージ４５、メモリ４６、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）４７、通信部４８、ディスプレイ４９、および入力デバイス５０を備えている。これらはバスライン５１を介して相互接続されている。

　ストレージ４５は、選定装置４１Ａ、学習装置４１Ｂ、および運用装置４１Ｃを構成するコンピュータに内蔵、またはケーブル、ネットワークを通じて接続されたハードディスクドライブである。もしくはストレージ４５は、ハードディスクドライブを複数台連装したディスクアレイである。ストレージ４５には、オペレーティングシステム等の制御プログラム、各種アプリケーションプログラム、およびこれらのプログラムに付随する各種データ等が記憶されている。なお、ハードディスクドライブに代えてソリッドステートドライブを用いてもよい。

　メモリ４６は、ＣＰＵ４７が処理を実行するためのワークメモリである。ＣＰＵ４７は、ストレージ４５に記憶されたプログラムをメモリ４６へロードして、プログラムにしたがった処理を実行する。これによりＣＰＵ４７はコンピュータの各部を統括的に制御する。ＣＰＵ４７は、本開示の技術に係る「プロセッサ」の一例である。なお、メモリ４６は、ＣＰＵ４７に内蔵されていてもよい。

　通信部４８は、ネットワーク４２等を介した各種情報の伝送制御を行うネットワークインターフェースである。ディスプレイ４９は各種画面を表示する。各種画面にはＧＵＩ(Ｇｒａｐｈｉｃａｌ　Ｕｓｅｒ　Ｉｎｔｅｒｆａｃｅ)による操作機能が備えられる。選定装置４１Ａ、学習装置４１Ｂ、および運用装置４１Ｃを構成するコンピュータは、各種画面を通じて、入力デバイス５０からの操作指示の入力を受け付ける。入力デバイス５０は、キーボード、マウス、タッチパネル、および音声入力用のマイク等である。

　なお、以下の説明では、選定装置４１Ａを構成するコンピュータの各部（ストレージ４５およびＣＰＵ４７）には添え字の「Ａ」を、学習装置４１Ｂを構成するコンピュータの各部（ストレージ４５およびＣＰＵ４７）には添え字の「Ｂ」を、運用装置４１Ｃを構成するコンピュータの各部（ストレージ４５、ＣＰＵ４７、およびディスプレイ４９）には添え字の「Ｃ」を、それぞれ符号に付して区別する。

　一例として図４に示すように、凝集体２０の特有波数帯の選定には、イムノアフィニティクロマトグラフィー装置２５から出力された、イムノアフィニティクロマトグラフィー処理後の第１精製液２８が供される。第１精製液２８には、凝集体２０の生成を促進する前処理５５が施される。前処理５５は、具体的には表５６に示すように、第１精製液２８の水素イオン指数（図４においてはｐＨ（Ｐｏｔｅｎｔｉａｌ　Ｈｙｄｒｏｇｅｎ）と表記）を３．０とし、温度２４℃の環境下で１週間静置する処理である。前処理５５が施された後、第１精製液２８は、高速液体クロマトグラフィー装置（以下、ＨＰＬＣ（Ｈｉｇｈ　Ｐｅｒｆｏｒｍａｎｃｅ　Ｌｉｑｕｉｄ　Ｃｈｒｏｍａｔｏｇｒａｐｈｙ）装置と表記する）５７に導入される。なお、例えば３０℃以上に温度を高める等して、より第１精製液２８の凝集体２０の生成を促進させてもよい。

　ＨＰＬＣ装置５７は、リザーバー５８、ポンプ５９、オートサンプラー６０、カラム６１、および紫外線検出器（以下、ＵＶ（Ｕｌｔｒａｖｉｏｌｅｔ）検出器と表記する）６２を有する。リザーバー５８には、移動相である液体６３が貯留されている。液体６３は、例えばリン酸緩衝生理食塩水（ＰＢＳ：Ｐｈｏｓｐｈａｔｅ－Ｂｕｆｆｅｒｅｄ　Ｓａｌｉｎｅ）等である。ポンプ５９は、予め設定された流量（例えば１ｍＬ／ｍｉｎ）にて、リザーバー５８の液体６３をカラム６１に向けて送液する。

　オートサンプラー６０は、ポンプ５９とカラム６１との間に接続されている。オートサンプラー６０は、前処理５５が施された後の第１精製液２８を、カラム６１に向けて流れる液体６３に、予め設定された量（例えば数μＬ～数十μＬ）自動的に注入する。なお、オートサンプラー６０に代えて、手動で第１精製液２８を注入するインジェクターを用いてもよい。

　カラム６１は、第１精製液２８内の抗体１９および凝集体２０を分離するための固定相としての充填剤（例えばシリカゲル、合成樹脂等）を含み、ゲル濾過クロマトグラフィーまたはサイズ排除クロマトグラフィーを実行することが可能である。カラム６１によって分離された抗体１９および凝集体２０は、液体６３とともに順次カラム６１から溶出し、ＵＶ検出器６２へと至る。ＵＶ検出器６２は、カラム６１からの液体６３に検出光を照射し、液体６３内の物質の吸光度（光吸収量）を測定する。検出光は、抗体１９および凝集体２０に合わせた波長の紫外光および／または可視光（波長１９０ｎｍ～８００ｎｍの光、より具体的には波長２８０ｎｍの光）である。

　ＵＶ検出器６２は、ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）等のコンピュータネットワークを通じて、選定装置４１Ａと相互通信可能に接続されている。ＵＶ検出器６２は、吸光度の測定結果であるクロマトグラムデータ６４を、選定装置４１Ａに送信する。

　ＵＶ検出器６２の下流には、フローセル６５が接続されている。フローセル６５には、ＵＶ検出器６２を通過した液体６３が流れる。フローセル６５の下流には、液体６３の回収タンク６６が接続されている。

　フローセル６５には、ラマン分光計６７のプローブ６８が接続される。ラマン分光計６７は、ラマン散乱光の特性を利用して物質の評価を行う機器である。励起光を物質に照射すると、励起光が物質と相互作用することで励起光と異なる波長をもつラマン散乱光が発生する。励起光とラマン散乱光の波長差は、物質がもつ分子振動のエネルギー分に相当する。このため、分子構造の異なる物質間で、異なる波数をもったラマン散乱光を得ることができる。ラマン散乱光は、ストークス線および反ストークス線のうち、ストークス線を用いることが好ましい。ラマン散乱光は、本開示の技術に係る「電磁波」の一例である。また、ラマン散乱光のスペクトル、すなわちラマンスペクトルは、本開示の技術に係る「スペクトル」の一例である。

　ラマン分光計６７は、プローブ６８とアナライザ６９とで構成される。プローブ６８は、フローセル６５の測定部７０を流れる液体６３に対して、先端の出射口から励起光を出射する。そして、励起光と液体６３内の物質との相互作用により生じたラマン散乱光を、先端に配された受光部にて受光する。プローブ６８は、受光したラマン散乱光をアナライザ６９に出力する。本例においては、励起光としてレーザー光を用い、レーザー光の出力を２００ｍＷ、励起波長を７８５ｎｍ、照射時間を１秒とした。

　アナライザ６９は、ラマン散乱光を波数毎に分解し、波数毎のラマン散乱光の強度値を導出することで、スペクトル測定データ７１を生成する。ここで、プローブ６８は、オートサンプラー６０によって第１精製液２８の注入が開始された時間Ｔ０から、ＵＶ検出器６２が抗体１９および凝集体２０の吸光度の測定に要するに十分な時間ＴＮまで、予め設定された間隔にて励起光を出射し、かつラマン散乱光を受光する。アナライザ６９は、その都度スペクトル測定データ７１を生成する。このため、スペクトル測定データ７１は、時間Ｔ０におけるスペクトル測定データ７１Ｔ０、時間Ｔ１におけるスペクトル測定データ７１Ｔ１、・・・、および時間ＴＮにおけるスペクトル測定データ７１ＴＮの複数が生成される。

　アナライザ６９は、ＨＰＬＣ装置５７と同じく、ＬＡＮ等のコンピュータネットワークを通じて、選定装置４１Ａと相互通信可能に接続されている。アナライザ６９は、複数のスペクトル測定データ７１の集合であるスペクトル測定データ群７１Ｇを、選定装置４１Ａに送信する。

　一例として図５に示すように、スペクトル測定データ７１は、各波数に対するラマン散乱光の強度値が登録されたデータである。図５においては、スペクトル測定データ７１は、波数７００ｃｍ^－１～１８００ｃｍ^－１までの範囲の散乱光の強度値を、１ｃｍ^－１刻みで導出したデータである。なお、図５の下部に示すグラフは、このスペクトル測定データ７１の強度値を波数毎にプロットして線で繋いだもので、すなわちラマンスペクトルを表す。

　一例として図６に示すように、選定装置４１Ａのストレージ４５Ａには、作動プログラム７５Ａが記憶されている。作動プログラム７５Ａは、コンピュータを選定装置４１Ａとして機能させるためのアプリケーションプログラムである。すなわち、作動プログラム７５Ａは、本開示の技術に係る「情報処理装置の作動プログラム」の一例である。

　作動プログラム７５Ａが起動されると、選定装置４１Ａを構成するコンピュータのＣＰＵ４７Ａは、メモリ４６等と協働して、取得部８０、リードライト制御部（以下、ＲＷ（Ｒｅａｄ　Ｗｒｉｔｅ）制御部と表記する）８１、および選定部８２として機能する。

　取得部８０は、ＨＰＬＣ装置５７からのクロマトグラムデータ６４、およびラマン分光計６７からのスペクトル測定データ群７１Ｇを取得する。取得部８０は、クロマトグラムデータ６４およびスペクトル測定データ群７１ＧをＲＷ制御部８１に出力する。

　ＲＷ制御部８１は、ストレージ４５Ａへの各種データの記憶、およびストレージ４５Ａに記憶された各種データの読み出しを制御する。ＲＷ制御部８１は、取得部８０からのクロマトグラムデータ６４およびスペクトル測定データ群７１Ｇをストレージ４５Ａに記憶する。また、ＲＷ制御部８１は、クロマトグラムデータ６４およびスペクトル測定データ群７１Ｇをストレージ４５Ａから読み出し、読み出したクロマトグラムデータ６４およびスペクトル測定データ群７１Ｇを選定部８２に出力する。

　選定部８２は、クロマトグラムデータ６４およびスペクトル測定データ群７１Ｇに基づいて、凝集体２０の特有波数帯を選定する。選定部８２は、特有波数帯の選定結果として特有波数帯データ８５を生成する。選定部８２は、特有波数帯データ８５をＲＷ制御部８１に出力する。ＲＷ制御部８１は、特有波数帯データ８５をストレージ４５Ａに記憶する。

　一例として図７に示すように、選定部８２は、クロマトグラムデータ６４に基づいて、スペクトル測定データ群７１Ｇの複数のスペクトル測定データ７１の中から、第１スペクトル測定データ７１１および第２スペクトル測定データ７１２を特定する。第１スペクトル測定データ７１１は、抗体１９から発せられるラマンスペクトルを測定したデータである。第２スペクトル測定データ７１２は、凝集体２０から発せられるラマンスペクトルを測定したデータである。

　選定部８２は、クロマトグラムデータ６４から、抗体１９を示す吸光度のピークが発現した時間Ｔａｎ（抗体１９のリテンションタイム）、および凝集体２０を示す吸光度のピークが発現した時間Ｔａｇ（凝集体２０のリテンションタイム）を導出する。選定部８２は、時間Ｔａｎにフローセル６５の測定部７０を流れた液体６３のラマンスペクトルを測定したスペクトル測定データ７１Ｔａｎ＋αを、第１スペクトル測定データ７１１と特定する。また、選定部８２は、時間Ｔａｇにフローセル６５の測定部７０を流れた液体６３のラマンスペクトルを測定したスペクトル測定データ７１Ｔａｇ＋αを、第２スペクトル測定データ７１２と特定する。ここで、時間Ｔａｎにフローセル６５の測定部７０を流れた液体６３は、本開示の技術に係る「第１溶液」の一例である。また、時間Ｔａｇにフローセル６５の測定部７０を流れた液体６３は、本開示の技術に係る「第２溶液」の一例である。また、時間Ｔａｎ＋αおよびＴａｇ＋αの「＋α」は、ＵＶ検出器６２で吸光度を測定してから、フローセル６５の測定部７０でラマン分光計６７によりラマンスペクトルを測定するまでのタイムラグである。

　なお、抗体１９を含む液体６３および凝集体２０を含む液体６３を生成する方法としては、ＨＰＬＣ装置５７を用いた方法に限らない。例えば遠心式の限外濾過フィルタを用いて、第１精製液２８から抗体１９を含む液体６３および凝集体２０を含む液体６３を分離してもよい。

　このように、スペクトル測定データ群７１Ｇには、第１スペクトル測定データ７１１と第２スペクトル測定データ７１２とが含まれている。このため取得部８０は、スペクトル測定データ群７１Ｇを取得することで、第１スペクトル測定データ７１１と第２スペクトル測定データ７１２とを取得していることになる。

　第１スペクトル測定データ７１１の一例を図８に示し、第２スペクトル測定データ７１２の一例を図９に示す。図８および図９を見比べても分かる通り、第１スペクトル測定データ７１１および第２スペクトル測定データ７１２は大体同じであるが、前者は抗体１９に基づくもので、後者は凝集体２０に基づくものであるため、所々で多少異なったデータとなる。

　一例として図１０に示すように、選定部８２は、第１スペクトル測定データ７１１と第２スペクトル測定データ７１２の各波数の強度値の差分データ９０を算出する。差分データ９０は、第１スペクトル測定データ７１１の強度値から第２スペクトル測定データ７１２の強度値を減算した差分が、波数毎に登録されたデータである。なお、選定部８２は、差分データ９０の算出に先立ち、強度値の最大値を１、最小値を０として、第１スペクトル測定データ７１１および第２スペクトル測定データ７１２を規格化する。

　一例として図１１に示すように、選定部８２は、差分データ９０の差分の絶対値と、予め設定された閾値９１とを比較する。そして、差分の絶対値が閾値以上の波数帯を、凝集体２０の特有波数帯として選定する。図１１においては、閾値として０．０５が設定され、特有波数帯として、１２２０ｃｍ^－１～１２６０ｃｍ^－１、および１６５０ｃｍ^－１～１６９０ｃｍ^－１が選定された場合を例示している。なお、特有波数帯としては、７００ｃｍ^－１～１８００ｃｍ^－１の範囲であれば特に限定されないが、１２２０ｃｍ^－１～１６９０ｃｍ^－１の範囲にあることが好ましく、例示のように１２２０ｃｍ^－１～１２６０ｃｍ^－１、および１６５０ｃｍ^－１～１６９０ｃｍ^－１の範囲にあることがより好ましい。また、特有波数帯は、例示の１２２０ｃｍ^－１～１２６０ｃｍ^－１、および１６５０ｃｍ^－１～１６９０ｃｍ^－１等、２以上の範囲であることが好ましい。フェニルアラニンのバンドが現れる範囲、トリプトファンのバンドが現れる範囲、あるいはチロシンのバンドが現れる範囲等を、特有波数帯として選定してもよい。

　図１２は、差分データ９０と閾値９１とを比較し、凝集体の特有波数帯を選定する図１１で示した処理を、第１スペクトル測定データ７１１および第２スペクトル測定データ７１２のラマンスペクトル上で示した図である。

　なお、第１スペクトル測定データ７１１の各波数の強度値と、第２スペクトル測定データ７１２の各波数の強度値との比を算出し、比が１から閾値以上乖離している波数帯を、凝集体２０の特有波数帯として選定してもよい。

　一例として図１３に示すように、学習装置４１Ｂのストレージ４５Ｂには、作動プログラム７５Ｂが記憶されている。作動プログラム７５Ｂは、コンピュータを学習装置４１Ｂとして機能させるためのアプリケーションプログラムである。すなわち、作動プログラム７５Ｂは、作動プログラム７５Ａと同じく、本開示の技術に係る「情報処理装置の作動プログラム」の一例である。ストレージ４５Ｂには、作動プログラム７５Ｂに加えて、データセット群９５Ｇおよび濃度予測モデル９６が記憶されている。濃度予測モデル９６は、本開示の技術に係る「状態予測モデル」の一例である。

　作動プログラム７５Ｂが起動されると、学習装置４１Ｂを構成するコンピュータのＣＰＵ４７Ｂは、メモリ４６等と協働して、ＲＷ制御部１００および学習検証部１０１として機能する。

　ＲＷ制御部１００は、選定装置４１ＡのＲＷ制御部８１と同様に、ストレージ４５Ｂへの各種データの記憶、およびストレージ４５Ｂに記憶された各種データの読み出しを制御する。ＲＷ制御部１００は、データセット群９５Ｇおよび濃度予測モデル９６をストレージ４５Ｂから読み出し、読み出したデータセット群９５Ｇおよび濃度予測モデル９６を学習検証部１０１に出力する。

　学習検証部１０１は、データセット群９５Ｇを用いた濃度予測モデル９６の学習および検証を行う。学習検証部１０１は、学習および検証を行って得られた学習済みの濃度予測モデル９６ＬＤをＲＷ制御部１００に出力する。ＲＷ制御部１００は、濃度予測モデル９６ＬＤをストレージ４５Ｂに記憶する。

　一例として図１４に示すように、濃度予測モデル９６はニューラルネットワーク１０５により構築されている。このため、濃度予測モデル９６は、本開示の技術に係る「機械学習モデル」の一例でもある。ニューラルネットワーク１０５は、周知のように入力層１０６、中間層（隠れ層ともいう）１０７、および出力層１０８を有する。これら入力層１０６、中間層１０７、および出力層１０８は、それぞれ複数のノードＮＤをもつ。入力層１０６のノードＮＤと中間層１０７のノードＮＤとの間、中間層１０７内のノードＮＤの間、および中間層１０７のノードＮＤと出力層１０８のノードＮＤとの間には、各ノードＮＤの結合の強さを示す係数が設定される。出力層１０８のノードＮＤには、線形関数、ＲｅＬｕ（Ｒｅｃｔｉｆｉｅｄ　Ｌｉｎｅａｒ　Ｕｎｉｔ）関数といった適当な活性化関数が設定されている。

　入力層１０６の各ノードＮＤには、スペクトル測定データ７１の各波数の強度値のうち、特有波数帯の強度値が入力データ１３０（図２０参照）として入力される。また、出力層１０８のノードＮＤからは、凝集体２０の濃度を予測した結果である濃度予測結果１１５（図１８参照）が出力される。

　一例として図１５に示すように、データセット群９５Ｇは複数のデータセット９５を有する。データセット９５は、学習用または検証用強度値１１０と正解濃度１１１とで構成される。学習用または検証用強度値１１０は、データセット９５を生成するためのスペクトル測定データ７１ＬＶの各波数の強度値から、選定装置４１Ａにおいて選定された特有波数帯の強度値を抜き出したものである。スペクトル測定データ７１ＬＶは、陽イオンクロマトグラフィー装置２６から出力された、陽イオンクロマトグラフィー処理後の第２精製液３０のラマンスペクトルを、フローセル６５およびラマン分光計６７を用いて測定したデータである。

　スペクトル測定データ７１ＬＶは、陽イオンクロマトグラフィー装置２６による陽イオンクロマトグラフィー処理の開始時点から終了時点まで、断続的に複数測定される。また、スペクトル測定データ７１ＬＶは、抗体生産細胞１５の培養条件、陽イオンクロマトグラフィー装置２６のグラジエント幅、線流速、および負荷量等をランダムに変化させて複数測定される。これにより、抗体１９および凝集体２０の濃度比率が異なる複数の第２精製液３０のスペクトル測定データ７１ＬＶを得ることができ、ひいては複数の学習用または検証用強度値１１０を得ることができる。なお、フローセル６５を用いて流路中でスペクトル測定データ７１ＬＶを測定する図示の方法に代えて、フラクションコレクターを用いて流路出口に流出した第２精製液３０を分取し、分取した第２精製液３０のスペクトル測定データ７１ＬＶを測定する方法を採用してもよい。

　スペクトル測定データ７１ＬＶを測定する第２精製液３０中の抗体１９および凝集体２０の濃度は、ともに０．００１ｍｇ／ｍＬ～２０ｍｇ／ｍＬの範囲である。第２精製液３０中の抗体１９および凝集体２０の濃度は、ともに０．００１ｍｇ／ｍＬ～１００００ｍｇ／ｍＬの範囲であればよく、０．００１ｍｇ／ｍＬ～１００ｍｇ／ｍＬの範囲が好ましく、例示の０．００１ｍｇ／ｍＬ～２０ｍｇ／ｍＬの範囲がより好ましい。

　正解濃度１１１は、スペクトル測定データ７１ＬＶを測定した第２精製液３０中の凝集体量１１２を元に算出された濃度である。凝集体量１１２は、文字通り凝集体２０の量であり、ＨＰＬＣ装置５７に備わる質量分析機能によって導出される。正解濃度１１１は、本開示の技術に係る「正解データ」の一例である。

　学習検証部１０１は、複数のデータセット９５を用いて、濃度予測モデル９６に対して交差検証を行う。すなわち、学習検証部１０１は、Ｍ個のデータセット９５のうちのｍ個を学習用データセット９５Ｌ（図１６参照）とし、残りのＭ－ｍ個を検証用データセット９５Ｖ（図１７参照）とする。そして、一例として図１６に示すように、濃度予測モデル９６に学習用データセット９５Ｌを適用し、濃度予測モデル９６を学習させる。また、一例として図１７に示すように、学習用データセット９５Ｌが適用されて学習された後の濃度予測モデル９６に検証用データセット９５Ｖを適用し、濃度予測モデル９６による凝集体２０の濃度の予測精度を検証する。学習検証部１０１は、学習用データセット９５Ｌおよび検証用データセット９５Ｖの構成を変更しつつ、こうした交差検証を設定回数行う。なお、ｍ≧Ｍ－ｍであり、Ｍ－ｍ＝１でもよい。

　図１６に示すように、学習検証部１０１は、学習フェーズにおいて、学習用データセット９５Ｌのうちの学習用または検証用強度値１１０を濃度予測モデル９６に入力し、濃度予測モデル９６から学習用濃度予測結果１１５Ｌを出力させる。学習検証部１０１は、正解濃度１１１と学習用濃度予測結果１１５Ｌとの比較結果に基づいて、損失関数を用いた濃度予測モデル９６の損失演算を行う。学習検証部１０１は、損失演算の結果に応じて濃度予測モデル９６のノードＮＤ間の係数の更新設定を行い、更新設定にしたがって濃度予測モデル９６を更新する。

　学習検証部１０１は、学習用または検証用強度値１１０の濃度予測モデル９６への入力、濃度予測モデル９６からの学習用濃度予測結果１１５Ｌの出力、損失演算、更新設定、および濃度予測モデル９６の更新の上記一連の処理を、学習用データセット９５Ｌを変更しつつ繰り返し行う。学習検証部１０１は、上記一連の処理の繰り返しを、学習用データセット９５Ｌの個数分のｍ回行う。

　図１７に示すように、学習検証部１０１は、検証フェーズにおいて、検証用データセット９５Ｖのうちの学習用または検証用強度値１１０を濃度予測モデル９６に入力し、濃度予測モデル９６から検証用濃度予測結果１１５Ｖを出力させる。学習検証部１０１は、正解濃度１１１と検証用濃度予測結果１１５Ｖとの比較結果に基づいて、濃度予測モデル９６による凝集体２０の濃度の予測精度を検証する。

　学習検証部１０１は、学習用または検証用強度値１１０の濃度予測モデル９６への入力、濃度予測モデル９６からの検証用濃度予測結果１１５Ｖの出力、および予測精度の検証を、検証用データセット９５Ｖを変更しつつ繰り返し行う。学習検証部１０１は、上記一連の処理の繰り返しを、検証用データセット９５Ｖの個数分のＭ－ｍ回行う。

　学習検証部１０１は、上記の交差検証が設定回数行われた濃度予測モデル９６を、濃度予測モデル９６ＬＤとしてＲＷ制御部１００に出力する。ＲＷ制御部１００は、濃度予測モデル９６ＬＤをストレージ４５Ｂに記憶する。

　一例として図１８に示すように、運用装置４１Ｃのストレージ４５Ｃには、作動プログラム７５Ｃが記憶されている。作動プログラム７５Ｃは、コンピュータを運用装置４１Ｃとして機能させるためのアプリケーションプログラムである。すなわち、作動プログラム７５Ｃは、作動プログラム７５Ａおよび７５Ｂと同じく、本開示の技術に係る「情報処理装置の作動プログラム」の一例である。ストレージ４５Ｃには、作動プログラム７５Ｃに加えて、選定装置４１Ａからの特有波数帯データ８５、および学習装置４１Ｂからの濃度予測モデル９６ＬＤが記憶されている。

　作動プログラム７５Ｃが起動されると、運用装置４１Ｃを構成するコンピュータのＣＰＵ４７Ｃは、メモリ４６等と協働して、取得部１２０、ＲＷ制御部１２１、予測部１２２、および表示制御部１２３として機能する。

　取得部１２０は、ラマン分光計６７からの第３スペクトル測定データ７１３を取得する。取得部１２０は、第３スペクトル測定データ７１３をＲＷ制御部１２１に出力する。

　ＲＷ制御部１２１は、選定装置４１ＡのＲＷ制御部８１、および学習装置４１ＢのＲＷ制御部１００と同様に、ストレージ４５Ｃへの各種データの記憶、およびストレージ４５Ｃに記憶された各種データの読み出しを制御する。ＲＷ制御部１２１は、取得部１２０からの第３スペクトル測定データ７１３をストレージ４５Ｃに記憶する。また、ＲＷ制御部１２１は、特有波数帯データ８５、濃度予測モデル９６ＬＤ、および第３スペクトル測定データ７１３をストレージ４５Ｃから読み出し、読み出した特有波数帯データ８５、濃度予測モデル９６ＬＤ、および第３スペクトル測定データ７１３を予測部１２２に出力する。また、ＲＷ制御部１２１は、第３スペクトル測定データ７１３を表示制御部１２３に出力する。

　予測部１２２は、濃度予測モデル９６ＬＤに第３スペクトル測定データ７１３を適用し、濃度予測モデル９６ＬＤから濃度予測結果１１５を出力させる。予測部１２２は、濃度予測結果１１５を表示制御部１２３に出力する。濃度予測結果１１５は、本開示の技術に係る「予測結果」の一例である。

　表示制御部１２３は、ディスプレイ４９Ｃへの各種画面の表示を制御する。例えば表示制御部１２３は、ラマンスペクトル分析画面１３５（図２１等参照）をディスプレイ４９Ｃに表示する制御を行う。

　一例として図１９に示すように、第３スペクトル測定データ７１３は、凝集体２０の濃度が未知の第２精製液３０のラマンスペクトルを、フローセル６５およびラマン分光計６７を用いて測定したデータである。フローセル６５は、陽イオンクロマトグラフィー装置２６と陰イオンクロマトグラフィー装置２７との間に設置されている。このため、第２精製液３０は、より詳しくは、製造プロセス２の進行中に陽イオンクロマトグラフィー装置２６から出力された、陽イオンクロマトグラフィー処理後の液である。すなわち、第３スペクトル測定データ７１３は、製造プロセス２の進行中に測定されたデータである。言い換えれば、第３スペクトル測定データ７１３は、インラインセンシングされたデータである。また、第３スペクトル測定データ７１３は、陽イオンクロマトグラフィー処理後に測定されたデータである。

　一例として図２０に示すように、予測部１２２は、特有波数帯データ８５を参照して、第３スペクトル測定データ７１３の各波数の強度値から特有波数帯の強度値を抜き出すことで、入力データ１３０を生成する。予測部１２２は、入力データ１３０を濃度予測モデル９６ＬＤに入力し、濃度予測モデル９６ＬＤから濃度予測結果１１５を出力させる。図２０においては、特有波数帯が図１１で例示した１２２０ｃｍ^－１～１２６０ｃｍ^－１、および１６５０ｃｍ^－１～１６９０ｃｍ^－１の範囲で、濃度予測結果１１５として２．４８５ｍｇ／ｍＬを出力した場合を例示している。

　表示制御部１２３は、運用装置４１Ｃのユーザの指示に応じて、一例として図２１に示すラマンスペクトル分析画面１３５をディスプレイ４９Ｃに表示する。ラマンスペクトル分析画面１３５には第３スペクトル測定データ７１３が表示される。

　ラマンスペクトル分析画面１３５の下部には、凝集体濃度予測ボタン１３６が設けられている。凝集体濃度予測ボタン１３６が押された場合、運用装置４１ＣのＣＰＵ４７Ｃにて凝集体濃度予測指示が受け付けられる。ＣＰＵ４７Ｃは、凝集体濃度予測指示を受けて、予測部１２２に図２０で示した処理を行わせ、濃度予測モデル９６ＬＤから濃度予測結果１１５を出力させる。

　予測部１２２からの濃度予測結果１１５が入力された場合、表示制御部１２３は、ラマンスペクトル分析画面１３５の表示を、一例として図２２に示すように遷移させる。図２２において、ラマンスペクトル分析画面１３５には、第３スペクトル測定データ７１３とともに濃度予測結果１１５が表示される。

　次に、上記構成による作用について、一例として図２３～図２５に示すフローチャートを参照して説明する。

　選定装置４１ＡのＣＰＵ４７Ａは、図６で示したように、作動プログラム７５Ａの起動により、取得部８０、ＲＷ制御部８１、および選定部８２として機能される。

　一例として図２３に示すように、選定装置４１Ａにおいては、図４で示した方法で測定された、ＨＰＬＣ装置５７からのクロマトグラムデータ６４、およびラマン分光計６７からのスペクトル測定データ群７１Ｇが取得部８０により取得される（ステップＳＴ１００）。クロマトグラムデータ６４およびスペクトル測定データ群７１Ｇは、ＲＷ制御部８１によりストレージ４５Ａに記憶される（ステップＳＴ１１０）。

　クロマトグラムデータ６４およびスペクトル測定データ群７１Ｇは、ＲＷ制御部８１によりストレージ４５Ａから読み出され（ステップＳＴ１２０）、選定部８２に出力される。選定部８２では、まず、図７で示したように、クロマトグラムデータ６４に基づいて、スペクトル測定データ群７１Ｇから第１スペクトル測定データ７１１および第２スペクトル測定データ７１２が特定される（ステップＳＴ１３０）。次いで、図１０で示したように、第１スペクトル測定データ７１１と第２スペクトル測定データ７１２の差分データ９０が算出される（ステップＳＴ１４０）。最後に、図１１で示したように、差分データ９０と閾値９１とが比較され、凝集体２０の特有波数帯が選定される（ステップＳＴ１５０）。特有波数帯の選定結果である特有波数帯データ８５は、選定部８２からＲＷ制御部８１に出力され、ＲＷ制御部８１によりストレージ４５Ａに記憶される（ステップＳＴ１６０）。

　学習装置４１ＢのＣＰＵ４７Ｂは、図１３で示したように、作動プログラム７５Ｂの起動により、ＲＷ制御部１００および学習検証部１０１として機能される。

　学習装置４１Ｂのストレージ４５Ｂには、図１５で示した方法で生成されたデータセット９５の集合であるデータセット群９５Ｇと、濃度予測モデル９６とが記憶されている。データセット群９５Ｇと濃度予測モデル９６は、ＲＷ制御部１００によりストレージ４５Ｂから読み出され、学習検証部１０１に出力される。

　一例として図２４に示すように、学習検証部１０１では、データセット群９５Ｇを構成する複数のデータセット９５が、ｍ個の学習用データセット９５ＬとＭ－ｍ個の検証用データセット９５Ｖに分けられる（ステップＳＴ２００）。そして、まずは学習用データセット９５Ｌを用いた濃度予測モデル９６の学習が行われる。具体的には図１６で示したように、学習用データセット９５Ｌの学習用または検証用強度値１１０が濃度予測モデル９６に入力され、これにより濃度予測モデル９６から学習用濃度予測結果１１５Ｌが出力される（ステップＳＴ２１０）。次いで、学習用データセット９５Ｌの正解濃度１１１と学習用濃度予測結果１１５Ｌとの比較結果に基づいて、濃度予測モデル９６が更新される（ステップＳＴ２２０）。これらステップＳＴ２１０およびステップＳＴ２２０の処理は、用意された学習用データセット９５Ｌが全て用いられないうちは（ステップＳＴ２３０でＮＯ）、学習用データセット９５Ｌが変更されつつ（ステップＳＴ２４０）繰り返し行われる。

　用意された学習用データセット９５Ｌが全て用いられた場合（ステップＳＴ２３０でＹＥＳ）、検証用データセット９５Ｖを用いた濃度予測モデル９６の予測精度の検証に移行する。具体的には図１７で示したように、検証用データセット９５Ｖの学習用または検証用強度値１１０が濃度予測モデル９６に入力され、これにより濃度予測モデル９６から検証用濃度予測結果１１５Ｖが出力される。次いで、検証用データセット９５Ｖの正解濃度１１１と検証用濃度予測結果１１５Ｖとの比較結果に基づいて、濃度予測モデル９６の予測精度が検証される（ステップＳＴ２５０）。図示は省略したが、この検証においても学習の場合と同様に、用意された検証用データセット９５Ｖが全て用いられるまで、検証用データセット９５Ｖが変更されつつ上記一連の処理が繰り返し行われる。

　ステップＳＴ２００～ステップＳＴ２５０の処理は、設定回数の交差検証が終了するまで（ステップＳＴ２６０でＮＯ）繰り返し行われる。設定回数の交差検証が終了した場合（ステップＳＴ２６０でＹＥＳ）、濃度予測モデル９６は、学習済みの濃度予測モデル９６ＬＤとして学習検証部１０１からＲＷ制御部１００に出力される。濃度予測モデル９６ＬＤは、ＲＷ制御部１００によりストレージ４５Ｂに記憶される（ステップＳＴ２７０）。

　運用装置４１ＣのＣＰＵ４７Ｃは、図１８で示したように、作動プログラム７５Ｃの起動により、取得部１２０、ＲＷ制御部１２１、予測部１２２、および表示制御部１２３として機能される。

　運用装置４１Ｃのストレージ４５Ｃには、選定装置４１Ａからの特有波数帯データ８５と、学習装置４１Ｂからの濃度予測モデル９６ＬＤとが記憶されている。特有波数帯データ８５と濃度予測モデル９６ＬＤは、ＲＷ制御部１２１によりストレージ４５Ｃから読み出され、予測部１２２に出力される。

　一例として図２５に示すように、運用装置４１Ｃにおいては、図１９で示した方法で測定された、ラマン分光計６７からの第３スペクトル測定データ７１３が、取得部１２０により取得される（ステップＳＴ３００）。第３スペクトル測定データ７１３は、ＲＷ制御部１２１によりストレージ４５Ｃに記憶される（ステップＳＴ３１０）。

　第３スペクトル測定データ７１３は、ＲＷ制御部１２１によりストレージ４５Ｃから読み出され（ステップＳＴ３２０）、予測部１２２および表示制御部１２３に出力される。そして、図２１で示したように、表示制御部１２３によりラマンスペクトル分析画面１３５がディスプレイ４９Ｃに表示される（ステップＳＴ３３０）。

　運用装置４１Ｃのユーザは、ラマンスペクトル分析画面１３５の第３スペクトル測定データ７１３を測定した第２精製液３０中の凝集体２０の濃度を濃度予測モデル９６ＬＤに予測させるために、凝集体濃度予測ボタン１３６を押す。これにより凝集体濃度予測指示がＣＰＵ４７Ｃにて受け付けられる（ステップＳＴ３４０）。

　凝集体濃度予測指示を受けて、予測部１２２では、図２０で示したように、特有波数帯データ８５を参照して、第３スペクトル測定データ７１３から入力データ１３０が生成される（ステップＳＴ３５０）。そして、入力データ１３０が濃度予測モデル９６ＬＤに入力され、これにより濃度予測モデル９６ＬＤから濃度予測結果１１５が出力される（ステップＳＴ３６０）。濃度予測結果１１５は、予測部１２２から表示制御部１２３に出力され、図２２で示したように、表示制御部１２３によりラマンスペクトル分析画面１３５に表示される（ステップＳＴ３７０）。

　ユーザは、ラマンスペクトル分析画面１３５の濃度予測結果１１５を参考に、様々な決断を下す。例えば、小規模設備による抗体生産細胞１５の培養条件、および／または、培養上清液１７の精製条件の条件出し実験を行っている場合を考える。この場合、濃度予測結果１１５が目標値よりも悪かったら、ユーザは、現行の実験を中止して新たな条件による実験に移行するといった決断を下す。また、条件出し実験が終了し、大規模設備による量産を行っている場合を考える。この場合、濃度予測結果１１５が目標値よりも悪かったら、ユーザは、量産を中断してクロマトグラフィー装置２５～２７のメンテナンスを行うといった決断を下す。

　以上説明したように、選定装置４１ＡのＣＰＵ４７Ａは取得部８０と選定部８２を備える。取得部８０と選定部８２は、抗体１９を有効成分とするバイオ医薬品の製造プロセス２において産生される第２精製液３０中の凝集体２０の濃度を予測する濃度予測モデル９６ＬＤを生成するための準備処理として以下を行う。すなわち、取得部８０は、抗体１９から発せられるラマンスペクトルを測定した第１スペクトル測定データ７１１と、凝集体２０から発せられるラマンスペクトルを測定した第２スペクトル測定データ７１２とを取得する。選定部８２は、第１スペクトル測定データ７１１の強度値と、第２スペクトル測定データ７１２の強度値との比較により、凝集体２０に特有な特有波数帯を選定する。このため、バイオ医薬品の製造プロセス２において産生される第２精製液３０中の凝集体２０の濃度の予測に寄与すると思われる、合理的なスペクトル測定データ７１の波数帯を選定することが可能となる。

　図１５～図１７で示したように、濃度予測モデル９６ＬＤは、特有波数帯の強度値である学習用または検証用強度値１１０と、凝集体２０の正解濃度１１１とで構成されるデータセット９５を用いて生成される。このため、濃度予測モデル９６ＬＤを、特有波数帯の強度値に応じて、凝集体２０の濃度予測結果１１５を出力するモデルとすることができる。濃度予測モデル９６ＬＤによれば、バイオ医薬品の製造プロセス２において産生される第２精製液３０中の凝集体２０の濃度を、従来と比べて高精度に予測することが可能となる。

　濃度は、対象成分（凝集体２０）の物理化学的な特徴を知るうえで最もポピュラーな指標である。このため、対象成分の状態として濃度を予測すれば、対象成分の物理化学的な特徴を、ユーザに容易に理解させることができる。

　また、図１５で示したように、データセット９５の元となった第２精製液３０中の抗体１９および凝集体２０の濃度は、ともに０．００１ｍｇ／ｍＬ～２０ｍｇ／ｍＬの範囲である。このため、濃度予測モデル９６ＬＤを、比較的低い濃度の予測を精度よく行えるモデルとすることができる。

　図４で示したように、特有波数帯の選定に供される第１精製液２８には、凝集体２０の生成を促進する前処理５５が施される。このため、第２スペクトル測定データ７１２を確実に取得することができる。また、凝集体２０を示す吸光度のピークがクロマトグラムデータ６４に明確に発現するため、第２スペクトル測定データ７１２を容易に特定することが可能となる。

　図２０で示したように、濃度予測モデル９６ＬＤは、凝集体２０の濃度が未知の第２精製液３０から発せられるラマンスペクトルを測定した第３スペクトル測定データ７１３の、特有波数帯の強度値に応じて、凝集体２０の濃度予測結果１１５を出力する。このためユーザは、凝集体２０の濃度予測結果１１５を簡単に知ることができる。

　図１９で示したように、第３スペクトル測定データ７１３は、製造プロセス２の進行中に測定されたデータである。このため、第２精製液３０を分取して、精製ラインとは別の場所に用意されたラマン分光計６７に掛けるといった手間を省くことができる。また、製造プロセス２の進行を妨げることなく、第３スペクトル測定データ７１３を取得することができる。

　図１９で示したように、第３スペクトル測定データ７１３は、陽イオンクロマトグラフィー処理後に測定されたデータである。陽イオンクロマトグラフィー処理後の第２精製液３０は、本来ならば凝集体２０が大方取り除かれている。このため、陽イオンクロマトグラフィー処理後の第２精製液３０中の凝集体２０の濃度予測結果１１５が高ければ、条件出し実験の設定条件が不適である、あるいは、陽イオンクロマトグラフィー装置２６が不調であると結論付けることができ、ユーザは決断を下しやすい。

　図７で示したように、第１スペクトル測定データ７１１および第２スペクトル測定データ７１２は、ＨＰＬＣ装置５７を用いて第２精製液３０から分離された、抗体１９を含む液体６３および凝集体２０を含む液体６３から測定されたデータである。このため、第１スペクトル測定データ７１１は抗体１９の特性を顕著に表したデータとなり、第２スペクトル測定データ７１２は凝集体２０の特性を顕著に表したデータとなる。したがって、凝集体２０の特有波数帯を精度よく選定することができる。

　対象成分は、抗体１９の凝集体２０である。凝集体２０は、バイオ医薬品にとっては副作用を引き起こすといった悪影響があり、バイオ医薬品の薬効低下の原因となる。このため、対象成分を凝集体２０とし、その状態を予測することで、バイオ医薬品の薬効低下を抑制することができる。

　図１４で示したように、濃度予測モデル９６ＬＤは、ニューラルネットワーク１０５といった機械学習モデルである。機械学習モデルは、未知のパラメータの予測に一般的に用いられており、学習により予測精度をある程度のレベルまで高めることができる。このため、ＰＬＳモデルといった線形モデル等と比較して、凝集体２０の濃度をより高精度に予測することができる。

　目的タンパク質として抗体１９を含むバイオ医薬品は、抗体医薬品と呼ばれ、癌、糖尿病、関節リウマチといった慢性疾患の治療をはじめとして、血友病、クローン病といった希少疾患の治療にも幅広く用いられている。このため、目的タンパク質を抗体１９とすれば、色々な疾患の治療に幅広く用いられている抗体医薬品の開発を促進することができる。

　ラマンスペクトルは、タンパク質のアミノ酸の官能基由来の情報を反映しやすい。このため、スペクトルをラマンスペクトルとすることで、タンパク質である凝集体２０の濃度の予測精度をさらに高めることができる。

　図１１および図１２で示したように、特有波数帯は、１２２０ｃｍ^－１～１２６０ｃｍ^－１の範囲、および１６５０ｃｍ^－１～１６９０ｃｍ^－１の範囲にある。１２２０ｃｍ^－１～１２６０ｃｍ^－１の範囲は、タンパク質のアミド結合に帰属する通称アミドＩＩＩのバンドが現れる範囲である。また、波数１６５０ｃｍ^－１～１６９０ｃｍ^－１の範囲は、通称アミドＩのバンドが現れる範囲である。このため、妥当性の高い特有波数帯を選定することができる。なお、特有波数帯は、１２２０ｃｍ^－１～１２６０ｃｍ^－１の範囲、または１６５０ｃｍ^－１～１６９０ｃｍ^－１の範囲の少なくともいずれかにあればよい。

　［第２実施形態］
　上記第１実施形態では、第３スペクトル測定データ７１３を、陽イオンクロマトグラフィー処理後に測定されたデータとしたが、これに限らない。一例として図２６に示すように、第３スペクトル測定データ７１３は、ウイルス不活性化処理２９が施された後の第１精製液２８のラマンスペクトルを測定したデータであってもよい。この場合、第１精製液２８が、本開示の技術に係る「懸濁液」の一例となる。

　第１精製液２８は、第２精製液３０と比べて培養上清液１７の組成に近い。このため、第３スペクトル測定データ７１３を、ウイルス不活性化処理２９が施された後の第１精製液２８のラマンスペクトルを測定したデータとすれば、濃度予測結果１１５が目標値よりも悪い場合に、その原因が抗体生産細胞１５の培養条件にあると結論付けることができ、ユーザは決断を下しやすい。

　第３スペクトル測定データ７１３は、陰イオンクロマトグラフィー装置２７から出力された、陰イオンクロマトグラフィー処理後の第３精製液３１のラマンスペクトルを測定したデータであってもよい。また、第３スペクトル測定データ７１３は、製造プロセスの進行中に測定されたデータでなくてもよい。第１精製液２８または第２精製液３０を分取して、精製ラインとは別の場所に用意されたラマン分光計６７に掛けることで、第３スペクトル測定データ７１３を測定してもよい。

　以下、本開示の技術の実施例および比較例を記載する。

　実施例では、上記第１実施形態で説明したように、まず、ＣＨＯ細胞といった細胞１３に抗体遺伝子１４を組み込んだ、抗体１９を生産する抗体生産細胞１５の培養上清液１７を生成した。そして、当該培養上清液１７をイムノアフィニティクロマトグラフィー装置２５に導入して精製し、第１精製液２８を取得した。次いで、表５６で示した条件にて第１精製液２８に対して前処理５５を施し、凝集体２０の生成を促進させた。その後、オートサンプラー６０を通じてＨＰＬＣ装置５７に第１精製液２８を注入し、ＵＶ検出器６２によりクロマトグラムデータ６４を測定するとともに、フローセル６５およびラマン分光計６７を用いて第１精製液２８のラマンスペクトルを測定し、スペクトル測定データ群７１Ｇを取得した。

　クロマトグラムデータ６４から、抗体１９のリテンションタイムＴａｎ、および凝集体２０のリテンションタイムＴａｇを導出し、以ってスペクトル測定データ群７１Ｇから第１スペクトル測定データ７１１および第２スペクトル測定データ７１２を特定した。そして、第１スペクトル測定データ７１１および第２スペクトル測定データ７１２に基づいて、凝集体２０の特有波数帯を選定した。

　次に、上記同様に抗体１９を生産する抗体生産細胞１５の培養上清液１７を生成し、生成した培養上清液１７をイムノアフィニティクロマトグラフィー装置２５および陽イオンクロマトグラフィー装置２６に導入して精製し、第２精製液３０を取得した。この際、フローセル６５およびラマン分光計６７を用いて第２精製液３０のラマンスペクトルを測定してスペクトル測定データ７１ＬＶを取得し、かつ、ＨＰＬＣ装置５７により凝集体量１１２を測定することで、計９個のデータセット９５を取得した。

　得られた計９個のデータセット９５を用いて、ニューラルネットワーク１０５により構成される濃度予測モデル９６の交差検証を行った。具体的には、９個のデータセット９５のうちの８個を学習用データセット９５Ｌ、１個を検証用データセット９５Ｖとし、学習用データセット９５Ｌおよび検証用データセット９５Ｖの構成を変更しつつ９回の交差検証を行った。

　次に、製造プロセス２の進行中に、フローセル６５およびラマン分光計６７を用いて陽イオンクロマトグラフィー処理後の第２精製液３０のラマンスペクトルを測定し、第３スペクトル測定データ７１３を取得した。そして、上記交差検証により生成された濃度予測モデル９６ＬＤに、第３スペクトル測定データ７１３のうちの凝集体２０の特有波数帯の強度値のみで構成される入力データ１３０を入力し、濃度予測結果１１５を出力させた。

　比較例１は、濃度予測モデル９６ＬＤの入力データ１３０を、凝集体２０の特有波数帯の強度値に限らず、全ての波数帯７００ｃｍ^－１～１８００ｃｍ^－１の強度値とした例である。比較例２は、濃度予測モデル９６ＬＤの入力データ１３０を、スパースモデリングで選定された波数帯の強度値とした例である。

　比較例３は、特開２０１６－１２８８２２号公報と同じく、濃度予測モデル９６ＬＤを、ニューラルネットワーク１０５ではなくＰＬＳモデルとし、かつ、濃度予測モデル９６ＬＤの入力データ１３０を、これも特開２０１６－１２８８２２号公報に倣って８００ｃｍ^－１～１７００ｃｍ^－１の波数帯の強度値とした例である。比較例４は、濃度予測モデル９６ＬＤの入力データ１３０を、凝集体２０の特有波数帯を除く波数帯の強度値とした例である。

　一例として図２７の表１４０に示すように、実施例における濃度予測モデル９６ＬＤのＲＭＳＥ（平均二乗偏差　Ｒｏｏｔ－Ｍｅａｎ－Ｓｑｕａｒｅ　Ｅｒｒｏｒ）は０．１１、Ｒ^２（決定係数　Ｃｏｅｆｆｉｃｉｅｎｔ　ｏｆ　Ｄｅｔｅｒｍｉｎａｔｉｏｎ）は０．８７であった。対して比較例１の場合のＲＭＳＥは０．１３、Ｒ^２は０．８１であり、実施例と比べて濃度予測モデル９６ＬＤの予測精度が若干悪化した。この結果から、凝集体２０の特有波数帯を選定し、濃度予測モデル９６ＬＤの入力データ１３０を、凝集体２０の特有波数帯の強度値とすることで、濃度予測モデル９６ＬＤの予測精度が高まることが確かめられた。

　ここで、比較例１は、実施例と遜色ないＲＭＳＥおよびＲ^２を示すため、一見して濃度予測モデル９６ＬＤの予測精度がよいと解される。ただし、凝集体２０とは関係ない波数帯を、凝集体２０の濃度の予測に寄与していると捉えているおそれ、すなわち擬似相関が生じているおそれを否定できない。したがって、比較例１の濃度予測モデル９６ＬＤは、凝集体２０の濃度を予測するモデルとして合理性があるとは一概に言えない。

　また、比較例２の場合のＲＭＳＥは０．１３、Ｒ^２は０．８１であり、実施例と比べて濃度予測モデル９６ＬＤの予測精度が若干悪化した。この結果から、濃度予測モデル９６ＬＤの入力データ１３０を、スパースモデリングで選定された波数帯の強度値とするよりも、凝集体２０の特有波数帯の強度値とすることで、濃度予測モデル９６ＬＤの予測精度が高まることが確かめられた。

　比較例３の場合のＲＭＳＥは０．２５、Ｒ^２は０．５５であり、実施例と比べて濃度予測モデル９６ＬＤの予測精度が大幅に悪化した。この結果から、濃度予測モデル９６ＬＤをＰＬＳモデルではなくニューラルネットワーク１０５で構成し、かつ、濃度予測モデル９６ＬＤの入力データ１３０を、凝集体２０の特有波数帯の強度値とすることで、特開２０１６－１２８８２２号公報に記載の技術よりも濃度予測モデル９６ＬＤの予測精度が高まることが確かめられた。

　また、比較例４の場合のＲＭＳＥは０．１３、Ｒ^２は０．８２であり、実施例と比べて濃度予測モデル９６ＬＤの予測精度が若干悪化した。この結果から、濃度予測モデル９６ＬＤの入力データ１３０を、凝集体２０の特有波数帯の強度値とすることで、濃度予測モデル９６ＬＤの予測精度が高まることが確かめられた。また、凝集体２０の特有波数帯の強度値に基づいて生成された濃度予測モデル９６ＬＤの合理性も示された。

　なお、目的タンパク質は抗体１９に限らない。サイトカイン、ホルモン等でもよい。また、対象成分は凝集体２０に限らない。細胞由来タンパク質・細胞由来ＤＮＡ等を対象成分としてもよい。

　スペクトルはラマンスペクトルに限らない。赤外吸収スペクトル、近赤外吸収スペクトル、核磁気共鳴スペクトル、紫外可視分光（ＵＶ－Ｖｉｓ：Ｕｌｔｒａｖｉｏｌｅｔ　Ｖｉｓｉｂｌｅ　Ａｂｓｏｒｐｔｉｏｎ　Ｓｐｅｃｔｒｏｓｃｏｐｙ）スペクトル、あるいは蛍光スペクトルでもよい。紫外可視分光スペクトルおよび蛍光スペクトルの場合は、特有波数帯に代えて特有波長帯を選定する。

　運用装置４１Ｃにダウンロードされた後も、データセット９５を用いて濃度予測モデル９６ＬＤを学習してもよい。

　濃度予測モデル９６ＬＤとしてニューラルネットワーク１０５を例示したが、これに限らない。決定木、ランダムフォレスト、ナイーブベイズ、および勾配ブースティング決定木等でもよい。

　濃度予測モデル９６ＬＤは機械学習モデルに限らない。多変量解析、統計解析により生成されるモデルでもよい。多変量解析、統計解析の例としては、特開２０１６－１２８８２２号公報に記載のＰＬＳをはじめとして、重回帰、主成分回帰、ロジスティック回帰、Ｌａｓｓｏ回帰、リッジ回帰、サポートベクター回帰、およびガウス過程回帰等が挙げられる。こうした多変量解析、統計解析により生成されるモデルにおいては、少なくとも２つのデータセット９５に基づいて回帰式の係数を決定することが、本開示の技術に係る「状態予測モデル」を「データセットを用いて生成」することに相当する。

　なお、対象成分の状態は濃度に限らない。例えば対象成分の密度であってもよい。あるいは、濃度と密度等、２種以上の状態を予測してもよい。

　上記各実施形態では、選定装置４１Ａ、学習装置４１Ｂ、および運用装置４１Ｃの機能を３台のコンピュータでそれぞれ担う例を示したが、これに限らない。選定装置４１Ａ、学習装置４１Ｂ、および運用装置４１Ｃの機能を１台のコンピュータで担ってもよい。また、１台のコンピュータで選定装置４１Ａの機能を担い、１台のコンピュータで学習装置４１Ｂおよび運用装置４１Ｃの機能を担ってもよい。４台以上のコンピュータで選定装置４１Ａ、学習装置４１Ｂ、および運用装置４１Ｃの機能を分担してもよい。このように、本開示の情報処理装置は、１台のコンピュータで担ってもよいし、複数台のコンピュータで担ってもよい。

　上記各実施形態において、例えば、取得部８０および１２０、ＲＷ制御部８１、１００、および１２１、選定部８２、学習検証部１０１、予測部１２２、および表示制御部１２３といった各種の処理を実行する処理部（Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）のハードウェア的な構造としては、次に示す各種のプロセッサ（Ｐｒｏｃｅｓｓｏｒ）を用いることができる。各種のプロセッサには、上述したように、ソフトウェア（作動プログラム７５Ａ～７５Ｃ）を実行して各種の処理部として機能する汎用的なプロセッサであるＣＰＵ４７Ａ～４７Ｃに加えて、ＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）等の製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス（Ｐｒｏｇｒａｍｍａｂｌｅ　Ｌｏｇｉｃ　Ｄｅｖｉｃｅ:ＰＬＤ）、ＡＳＩＣ（Ａｐｐｌｉｃａｔｉｏｎ　Ｓｐｅｃｉｆｉｃ　Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が含まれる。

　１つの処理部は、これらの各種のプロセッサのうちの１つで構成されてもよいし、同種または異種の２つ以上のプロセッサの組み合わせ（例えば、複数のＦＰＧＡの組み合わせ、および／または、ＣＰＵとＦＰＧＡとの組み合わせ）で構成されてもよい。また、複数の処理部を１つのプロセッサで構成してもよい。

　複数の処理部を１つのプロセッサで構成する例としては、第１に、クライアントおよびサーバ等のコンピュータに代表されるように、１つ以上のＣＰＵとソフトウェアの組み合わせで１つのプロセッサを構成し、このプロセッサが複数の処理部として機能する形態がある。第２に、システムオンチップ（Ｓｙｓｔｅｍ　Ｏｎ　Ｃｈｉｐ:ＳｏＣ）等に代表されるように、複数の処理部を含むシステム全体の機能を１つのＩＣ（Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）チップで実現するプロセッサを使用する形態がある。このように、各種の処理部は、ハードウェア的な構造として、上記各種のプロセッサの１つ以上を用いて構成される。

　さらに、これらの各種のプロセッサのハードウェア的な構造としては、より具体的には、半導体素子等の回路素子を組み合わせた電気回路（ｃｉｒｃｕｉｔｒｙ）を用いることができる。

　以上の記載から、下記の付記項に記載の技術を把握することができる。

　［付記項１］
　プロセッサを備え、
　前記プロセッサは、
　目的タンパク質を有効成分とするバイオ医薬品の製造プロセスにおいて産生される懸濁液中の対象成分の状態を予測する状態予測モデルを生成するための準備処理として、
　前記目的タンパク質から発せられる電磁波のスペクトルを測定した第１スペクトル測定データと、前記対象成分から発せられる電磁波のスペクトルを測定した第２スペクトル測定データとを取得し、
　前記第１スペクトル測定データの強度値と、前記第２スペクトル測定データの強度値との比較により、前記対象成分に特有な特有波数帯または特有波長帯を選定する、
情報処理装置。
　［付記項２］
　前記状態予測モデルは、前記特有波数帯または前記特有波長帯の強度値と前記対象成分の状態の正解データとで構成されるデータセットを用いて生成される付記項１に記載の情報処理装置。
　［付記項３］
　前記対象成分の状態は、前記懸濁液中の前記対象成分の濃度であり、
　前記データセットの元となった懸濁液中の前記目的タンパク質および前記対象成分の濃度は、ともに０．００１ｍｇ／ｍＬ～２０ｍｇ／ｍＬの範囲である付記項２に記載の情報処理装置。
　［付記項４］
　前記特有波数帯または前記特有波長帯の選定に供される懸濁液には、前記対象成分の生成を促進する前処理が施される付記項１から付記項３のいずれか１項に記載の情報処理装置。
　［付記項５］
　前記状態予測モデルは、前記対象成分の状態が未知の懸濁液から発せられる電磁波のスペクトルを測定した第３スペクトル測定データの、前記特有波数帯または前記特有波長帯の強度値に応じて、前記対象成分の状態の予測結果を出力する付記項１から付記項４のいずれか１項に記載の情報処理装置。
　［付記項６］
　前記第３スペクトル測定データは、前記製造プロセスの進行中に測定されたデータである付記項５に記載の情報処理装置。
　［付記項７］
　前記第３スペクトル測定データは、ウイルス不活性化処理後、または陽イオンクロマトグラフィー処理後に測定されたデータである付記項５または付記項６に記載の情報処理装置。
　［付記項８］
　前記第１スペクトル測定データおよび前記第２スペクトル測定データは、高速液体クロマトグラフィー装置を用いて前記懸濁液から分離された、前記目的タンパク質を含む第１溶液および前記対象成分を含む第２溶液から測定されたデータである付記項１から付記項７のいずれか１項に記載の情報処理装置。
　［付記項９］
　前記対象成分は、前記目的タンパク質の凝集体である付記項１から付記項８のいずれか１項に記載の情報処理装置。
　［付記項１０］
　前記状態予測モデルは機械学習モデルである付記項１から付記項９のいずれか１項に記載の情報処理装置。
　［付記項１１］
　前記目的タンパク質は抗体である付記項１から付記項１０のいずれか１項に記載の情報処理装置。
　［付記項１２］
　前記スペクトルはラマンスペクトルである付記項１から付記項１１のいずれか１項に記載の情報処理装置。
　［付記項１３］
　前記特有波数帯は、１２２０ｃｍ^－１～１２６０ｃｍ^－１の範囲、または１６５０ｃｍ^－１～１６９０ｃｍ^－１の範囲の少なくともいずれかにある付記項１２に記載の情報処理装置。

　本開示の技術は、上述の種々の実施形態および／または種々の変形例を適宜組み合わせることも可能である。また、上記各実施形態に限らず、要旨を逸脱しない限り種々の構成を採用し得ることはもちろんである。さらに、本開示の技術は、プログラムに加えて、プログラムを非一時的に記憶する記憶媒体にもおよぶ。

　以上に示した記載内容および図示内容は、本開示の技術に係る部分についての詳細な説明であり、本開示の技術の一例に過ぎない。例えば、上記の構成、機能、作用、および効果に関する説明は、本開示の技術に係る部分の構成、機能、作用、および効果の一例に関する説明である。よって、本開示の技術の主旨を逸脱しない範囲内において、以上に示した記載内容および図示内容に対して、不要な部分を削除したり、新たな要素を追加したり、置き換えたりしてもよいことはいうまでもない。また、錯綜を回避し、本開示の技術に係る部分の理解を容易にするために、以上に示した記載内容および図示内容では、本開示の技術の実施を可能にする上で特に説明を要しない技術常識等に関する説明は省略されている。

　本明細書において、「Ａおよび／またはＢ」は、「ＡおよびＢのうちの少なくとも１つ」と同義である。つまり、「Ａおよび／またはＢ」は、Ａだけであってもよいし、Ｂだけであってもよいし、ＡおよびＢの組み合わせであってもよい、という意味である。また、本明細書において、３つ以上の事柄を「および／または」で結び付けて表現する場合も、「Ａおよび／またはＢ」と同様の考え方が適用される。

　本明細書に記載された全ての文献、特許出願および技術規格は、個々の文献、特許出願および技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。

Claims

　プロセッサを備え、
　前記プロセッサは、
　目的タンパク質を有効成分とするバイオ医薬品の製造プロセスにおいて産生される懸濁液中の対象成分の状態を予測する状態予測モデルを生成するための準備処理として、
　前記目的タンパク質から発せられる電磁波のスペクトルを測定した第１スペクトル測定データと、前記対象成分から発せられる電磁波のスペクトルを測定した第２スペクトル測定データとを取得し、
　前記第１スペクトル測定データの強度値と、前記第２スペクトル測定データの強度値との比較により、前記対象成分に特有な特有波数帯または特有波長帯を選定する、
情報処理装置。
　前記状態予測モデルは、前記特有波数帯または前記特有波長帯の強度値と前記対象成分の状態の正解データとで構成されるデータセットを用いて生成される請求項１に記載の情報処理装置。
　前記対象成分の状態は、前記懸濁液中の前記対象成分の濃度であり、
　前記データセットの元となった懸濁液中の前記目的タンパク質および前記対象成分の濃度は、ともに０．００１ｍｇ／ｍＬ～２０ｍｇ／ｍＬの範囲である請求項２に記載の情報処理装置。
　前記特有波数帯または前記特有波長帯の選定に供される懸濁液には、前記対象成分の生成を促進する前処理が施される請求項１に記載の情報処理装置。
　前記状態予測モデルは、前記対象成分の状態が未知の懸濁液から発せられる電磁波のスペクトルを測定した第３スペクトル測定データの、前記特有波数帯または前記特有波長帯の強度値に応じて、前記対象成分の状態の予測結果を出力する請求項１に記載の情報処理装置。
　前記第３スペクトル測定データは、前記製造プロセスの進行中に測定されたデータである請求項５に記載の情報処理装置。
　前記第３スペクトル測定データは、ウイルス不活性化処理後、または陽イオンクロマトグラフィー処理後に測定されたデータである請求項５に記載の情報処理装置。
　前記第１スペクトル測定データおよび前記第２スペクトル測定データは、高速液体クロマトグラフィー装置を用いて前記懸濁液から分離された、前記目的タンパク質を含む第１溶液および前記対象成分を含む第２溶液から測定されたデータである請求項１に記載の情報処理装置。
　前記対象成分は、前記目的タンパク質の凝集体である請求項１に記載の情報処理装置。
　前記状態予測モデルは機械学習モデルである請求項１に記載の情報処理装置。
　前記目的タンパク質は抗体である請求項１に記載の情報処理装置。
　前記スペクトルはラマンスペクトルである請求項１に記載の情報処理装置。
　前記特有波数帯は、１２２０ｃｍ^－１～１２６０ｃｍ^－１の範囲、または１６５０ｃｍ^－１～１６９０ｃｍ^－１の範囲の少なくともいずれかにある請求項１２に記載の情報処理装置。
　目的タンパク質を有効成分とするバイオ医薬品の製造プロセスにおいて産生される懸濁液中の対象成分の状態を予測する状態予測モデルを生成するための準備処理として、
　前記目的タンパク質から発せられる電磁波のスペクトルを測定した第１スペクトル測定データと、前記対象成分から発せられる電磁波のスペクトルを測定した第２スペクトル測定データとを取得すること、並びに、
　前記第１スペクトル測定データの強度値と、前記第２スペクトル測定データの強度値との比較により、前記対象成分に特有な特有波数帯または特有波長帯を選定すること、
を含む情報処理装置の作動方法。
　目的タンパク質を有効成分とするバイオ医薬品の製造プロセスにおいて産生される懸濁液中の対象成分の状態を予測する状態予測モデルを生成するための準備処理として、
　前記目的タンパク質から発せられる電磁波のスペクトルを測定した第１スペクトル測定データと、前記対象成分から発せられる電磁波のスペクトルを測定した第２スペクトル測定データとを取得すること、並びに、
　前記第１スペクトル測定データの強度値と、前記第２スペクトル測定データの強度値との比較により、前記対象成分に特有な特有波数帯または特有波長帯を選定すること、
を含む処理をコンピュータに実行させるための情報処理装置の作動プログラム。
　目的タンパク質を有効成分とするバイオ医薬品の製造プロセスにおいて産生される懸濁液から発せられる電磁波のスペクトルを測定したスペクトル測定データの各波数または各波長の強度値のうち、前記懸濁液中の対象成分に特有な波数帯または波長帯の強度値に応じて、前記対象成分の状態の予測結果を出力する機能をコンピュータに実行させるための状態予測モデル。