JP2021515586A - 細胞療法、創薬および診断法における使用のための幹細胞およびその誘導体を検証するために機械学習および/またはニューラルネットワークを使用すること - Google Patents

細胞療法、創薬および診断法における使用のための幹細胞およびその誘導体を検証するために機械学習および/またはニューラルネットワークを使用すること Download PDF

Info

Publication number
JP2021515586A
JP2021515586A JP2020549687A JP2020549687A JP2021515586A JP 2021515586 A JP2021515586 A JP 2021515586A JP 2020549687 A JP2020549687 A JP 2020549687A JP 2020549687 A JP2020549687 A JP 2020549687A JP 2021515586 A JP2021515586 A JP 2021515586A
Authority
JP
Japan
Prior art keywords
image
cell
cells
machine learning
test cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020549687A
Other languages
English (en)
Other versions
JPWO2019178561A5 (ja
Inventor
カピル バーティ,
カピル バーティ,
ネイサン エー. ホタリング,
ネイサン エー. ホタリング,
ニコラス ジェイ. ショーブ,
ニコラス ジェイ. ショーブ,
カール ジー. サイモン,
カール ジー. サイモン,
Original Assignee
ザ ユナイテッド ステイツ オブ アメリカ, アズ リプレゼンテッド バイ ザ セクレタリー, デパートメント オブ ヘルス アンド ヒューマン サービシーズ
ザ ユナイテッド ステイツ オブ アメリカ, アズ リプレゼンテッド バイ ザ セクレタリー, デパートメント オブ ヘルス アンド ヒューマン サービシーズ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ザ ユナイテッド ステイツ オブ アメリカ, アズ リプレゼンテッド バイ ザ セクレタリー, デパートメント オブ ヘルス アンド ヒューマン サービシーズ, ザ ユナイテッド ステイツ オブ アメリカ, アズ リプレゼンテッド バイ ザ セクレタリー, デパートメント オブ ヘルス アンド ヒューマン サービシーズ filed Critical ザ ユナイテッド ステイツ オブ アメリカ, アズ リプレゼンテッド バイ ザ セクレタリー, デパートメント オブ ヘルス アンド ヒューマン サービシーズ
Publication of JP2021515586A publication Critical patent/JP2021515586A/ja
Publication of JPWO2019178561A5 publication Critical patent/JPWO2019178561A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume, or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Electro-optical investigation, e.g. flow cytometers
    • G01N15/1429Electro-optical investigation, e.g. flow cytometers using an analyser being characterised by its signal processing
    • G01N15/1433
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/695Preprocessing, e.g. image segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume, or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N2015/1006Investigating individual particles for cytology
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume, or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Electro-optical investigation, e.g. flow cytometers
    • G01N2015/1488Methods for deciding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10056Microscopic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30024Cell structures in vitro; Tissue sections in vitro

Abstract

1つまたはそれを超える細胞および細胞誘導体の特性を非侵襲的に予測するための方法が提供される。その方法は、複数の細胞を表している複数の訓練用細胞画像およびその複数の細胞に対する特性を識別するデータのうちの少なくとも1つを用いて機械学習モデルを訓練する工程を含む。この方法はさらに、評価される少なくとも1つの試験細胞を表している少なくとも1つの試験細胞画像を受け取る工程であって、その少なくとも1つの試験細胞画像は、非侵襲的に取得され、光の絶対尺度としての吸光度に基づく、工程、およびその訓練された機械学習モデルにその少なくとも1つの試験細胞画像を提供する工程を含む。その訓練された機械学習モデルに基づく機械学習を用いて、その少なくとも1つの試験細胞の特性が予測される。

Description

発明の分野
開示される実施形態は、概して、細胞の機能および健康の予測可能性に関し、より詳細には、細胞療法、創薬および薬物毒性試験における使用のための幹細胞およびその誘導体を検証するために機械学習および/またはニューラルネットワークを使用することに関する。
背景
多くの生物学的プロセスおよび臨床プロセスは、細胞の付与によって促進される。これらのプロセスには、細胞療法(例えば、幹細胞療法)、創薬、および化合物の有毒作用の試験が含まれる。細胞死、細胞増殖、細胞機能および細胞健康に対するアッセイが、生物学研究および臨床研究の多くの分野において非常に幅広く行われている。細胞の健康、死、増殖および機能性を評価するためにいくつかの種類のアッセイが使用され、それらとしては、色素、抗体および核酸プローブによる染色が挙げられるがこれに限定されない。毒性評価および細胞成熟度に対しては、バリア機能アッセイ、例えば、経上皮透過性(TEP)および経上皮電気抵抗(TER)が有用な基準を提供する。他の選ばれた機能アッセイとしては、電子顕微鏡法(EM);遺伝子(DNAまたはRNA)発現;もしくは電気生理学的記録を用いる手法、または特定のサイトカイン、タンパク質、成長因子もしくは酵素の分泌;;細胞の1つの側から別の側への流体/小分子の輸送の速度および体積;細胞の貪食作用能;免疫組織化学的(IHC)パターンなどを評価する手法が挙げられるが、これらに限定されない。これらのアッセイのいくつかは、移植前に細胞療法用製品の機能性を検証するための「リリース」基準として使用できる。
しかしながら、細胞療法に使用される既存のリリースアッセイには、重大な限界がある。IHCおよびEMなどの上述の手法のいくつかは、定量的でない。他のリリースアッセイは、ばらつきの程度が大きいと見出された(例えば、サイトカイン放出、TER)か、またはあまりにも破壊的であるか(例えば、遺伝子発現および貪食作用)もしくはあまりにも高額である(サイトカイン放出および遺伝子アレイ)と見出された。また、現行の方法では、最低でも、培地をサンプリングするために細胞培養皿を開ける必要があり、最大で、測定される細胞を完全に破壊する必要がある。いくつかの場合では、これらのアッセイは、薬物スクリーニングおよび毒性試験の全体にわたって行うことができず、細胞の健康および機能性に関する充実した内容の情報が提供されないことが多い。これは、これらの細胞の生育、発生、分化に伴って現行の方法で細胞を長期的に評価することが、例えば、患者への投与前にまたは薬物もしくは有毒化合物を試験するために、それらの細胞を妨害せずに行うことができないことを意味する。より詳細には、現在使用されている多くのアッセイが、汚染の可能性、および/または検査中の細胞が任意のさらなる評価/植え込みに使用できなくなる可能性を高め、ハイスループットに適合しておらず、細胞の健康の完全な全体像を提供しない。
生物学者は、ある特定のタイプの細胞(例えば、網膜色素上皮(RPE)細胞)を明視野/位相差顕微鏡下で見るだけで、それらの細胞が機能的であるか否かを予測することができることが多い。このアプローチは、非侵襲性であり、汎用性があり、比較的安価である。これらの利点があるにもかかわらず、人間による画像ベースの解析には、以下に限定されないが、標本抽出バイアス、視覚データと機能を直接相関させることが困難である点、および因果関係を導くことが困難である点などの欠点がある。
したがって、患者に細胞療法および組織療法を届けるため、ならびに新規の薬物および潜在的に有毒な化合物をより効率的な様式で発見するために、現行のアプローチの上記の限界に対処することができる解析の自動化が当該分野において必要とされている。
発明の要旨
下記に例証される実施形態の目的および利点は、以下の説明に示され、そこから明らかになるだろう。例証される実施形態のさらなる利点は、明細書および請求項において、ならびに添付の図面から、特に指摘されるデバイス、システムおよび方法によって実現および達成され得る。
本開示の態様によると、1つまたはそれを超える細胞および細胞誘導体の特性を非侵襲的に予測するための方法が提供される。その方法は、複数の細胞を表している複数の訓練用細胞画像およびその複数の細胞に対する特性を識別するデータのうちの少なくとも1つを用いて機械学習モデルを訓練する工程を含む。その方法は、評価される少なくとも1つの試験細胞を表している少なくとも1つの試験細胞画像を受け取る工程であって、その少なくとも1つの試験細胞画像は、非侵襲的に取得され、光の絶対尺度としての吸光度に基づく、工程、および訓練された機械学習モデルに少なくとも1つの試験細胞画像を提供する工程をさらに含む。訓練された機械学習モデルに基づく機械学習を用いて、少なくとも1つの試験細胞の特性が予測される。その方法は、少なくとも1つの試験細胞の予測された特性に基づいて、臨床用細胞調製物に対するリリース基準を、訓練された機械学習モデルによって作成する工程をさらに含む。
実施形態において、機械学習は、ディープニューラルネットワークを用いて行われ得、上記方法は、そのディープニューラルネットワークによって、試験画像の画像を個々の細胞にセグメント化する工程をさらに含み得る。
さらに、実施形態において、機械学習は、ディープニューラルネットワークを用いて行われ得、上記方法は、上記特性に基づいて試験細胞を分類する工程をさらに含み得る。
さらなる実施形態において、上記予測工程は、分類工程に基づき得、細胞の同一性、細胞の機能、送達された薬物の効果、疾患の状態、および技術的反復または以前に使用されたサンプルとの類似性のうちの少なくとも1つを決定することをさらに含み得る。
実施形態において、試験細胞の特性の予測は、少なくとも1つの試験細胞画像における単一細胞および1視野の複数の細胞のいずれかに対して行うことができる。
実施形態において、上記方法は、試験細胞画像から少なくとも1つの特徴を視覚的に抽出する工程をさらに含み得る。機械学習モデルを訓練する工程は、抽出された少なくとも1つの特徴を用いて行われ得、予測工程は、その抽出された少なくとも1つの特徴を用いて訓練された、訓練された機械学習モデルを用いて試験細胞の少なくとも1つの特徴を識別すること、および識別された少なくとも1つの特徴を用いて試験細胞の特性を予測すること程を含む。
さらに、実施形態において、試験細胞画像は、定量的明視野吸光度顕微鏡法(quantitative bright−field absorbance microscopy)(QBAM)を用いて取得される。
さらには、実施形態において、上記方法は、顕微鏡によってキャプチャーされた少なくとも1つの顕微鏡画像を受け取る工程およびその少なくとも1つの顕微鏡画像の画素強度を吸光度値に変換する工程をさらに含み得る。
実施形態において、上記方法は、吸光度値の吸光度信頼度を算出する工程、ベンチマーキングによって顕微鏡の平衡を確立する工程、および画像を取得する際に色をフィルタリングする工程のうちの少なくとも1つをさらに含み得る。
加えて、実施形態において、試験画像の第1の画像処理は、ディープニューラルネットワークによって行われ得る。
実施形態において、機械学習は、ディープニューラルネットワークを用いて行われ得、上記方法は、そのディープニューラルネットワークによって、少なくとも1つの試験画像の画像を個々の細胞にセグメント化する工程をさらに含み得、上記特徴は、セグメント化された個々の細胞から視覚的に抽出される。
実施形態において、上記少なくとも1つの試験細胞の特性の予測は、経上皮抵抗(TER)および/または血管内皮成長因子(VEGF)の極性化分泌の予測、少なくとも1つの試験細胞の機能の予測、少なくとも1つの試験細胞の成熟度の予測、少なくとも1つの試験細胞が識別されたドナー由来であるかの予測、および少なくとも1つの試験細胞が既知の分類に対してアウトライヤーであるかの判定のうちの少なくとも1つを含み得る。
ある特定の実施形態において、臨床用細胞調製物に対するリリース基準の作成は、訓練された機械学習モデルによる、創薬または薬物毒性に対するリリース基準の作成をさらに含み得る。
加えて、実施形態において、複数の細胞および試験細胞は、胚性幹細胞(ESC)、人工多能性幹細胞(iPSC)、神経幹細胞(NSC)、網膜色素上皮幹細胞(RPESC)、間葉系幹細胞(MSC)、造血幹細胞(HSC)および癌幹細胞(CSC)のうちの少なくとも1つを含み得る。
実施形態において、第1の複数の細胞および試験細胞は、複数個の、ESC、iPSC、NSC、RPESC、MSCもしくはHSCまたはそれらに由来する任意の細胞のうちの少なくとも1種に由来し得る。
さらに、実施形態において、第1の複数の細胞および試験細胞は、ヒト組織または動物組織に由来する主要な細胞型を含み得る。
加えて、実施形態において、識別されたおよび予測された特性は、生理学的特性、分子の特性、細胞の特性および/または生化学的特性のうちの少なくとも1つを含み得る。
実施形態において、少なくとも1つの抽出された特徴は、細胞の境界線、細胞の形状および複数のテクスチャーメトリクスのうちの少なくとも1つを含み得る。
さらには、実施形態において、複数のテクスチャーメトリクスは、複数の細胞内の特徴を含み得る。
さらに、実施形態において、複数の細胞画像および試験細胞画像は、蛍光像、化学発光像、放射像または明視野像を含み得る。
実施形態において、上記方法は、少なくとも1つの試験画像の試験画像が大型画像であるかを判定する工程、その大型画像を少なくとも2つのタイルに分ける工程、そのタイルの各々を訓練された機械モデルに個々に提供する工程、そのタイルの各々に関連する、訓練された機械モデルによる処理の出力を合わせる工程、および合わされた出力を、試験細胞の特性を予測するために提供して、大型画像に対応する単一の出力にする工程をさらに含み得る。
本開示のさらなる態様において、開示される方法を行うコンピューティングシステムが提供される。
本開示のシステムおよび方法のこれらのおよび他の特徴は、図面と併せて取り扱われる好ましい実施形態の以下の詳細な説明から、当業者にすぐに明らかになるだろう。
本開示は、詳細な説明および添付の図面から、より完全に理解されるようになるだろう。これらの添付の図面は、本開示の1つまたはそれを超える実施形態を説明しており、明細書とともに、本開示の原理を説明するのに役立つ。可能な限り、ある実施形態の同じまたは同様のエレメントのことを指すために、図面全体を通して同じ参照番号が用いられる。
図1は、本開示の1つの実施形態に係る操作環境の一例を説明しているブロック図である。
図2Aおよび2Bは、本開示のある実施形態に係る、細胞およびその誘導体の機能、同一性、疾患状態および健康を予測するために使用され得る選ばれた機械学習フレームワークおよびディープニューラルネットワークフレームワークを図示している。
図3A〜3Cは、本開示のある実施形態に係る、主成分分析機械学習モデルを用いた、多次元データから低次元データへの変換を図示している。 同上。
図4は、本開示のある実施形態に係る、類似の群を識別するための階層型クラスタリングの方法の一例を示している。
図5は、本開示のある実施形態に係る、選ばれた機械学習フレームワークによって使用され得るベクトルベースの回帰モデルの一例を示している。
図6は、本開示のある実施形態に係る、ディープニューラルネットワークの1つの実施形態を図示している概略図である。
図7は、本開示のある実施形態に係る例示的な畳み込みニューラルネットワーク(CNN)モデルのアーキテクチャーの模式図である。
図8は、本開示のある実施形態に係る、幹細胞の機能を計測するために、選ばれた機械学習フレームワークおよび/またはディープニューラルネットワークフレームワークが使用し得る幹細胞画像を図示している。
図9は、本開示のある実施形態に係る、CNNモデルによって提供された平均細胞抵抗(TER)の予測結果を図示している。
図10は、バルク吸光度測定値とTERとの間に直接的な相関がないことを図示している。
図11は、本開示のある実施形態に係る、CNNモデルが使用する類似性アプローチに基づくセグメンテーションを図示している。
図12は、本開示のある実施形態に係る、視覚データを用いておよび用いずに行われた主成分分析の比較を図示している。
図13は、本開示のある実施形態に係る、視覚データを用いておよび用いずに行われた階層型クラスタリング法の比較を図示している。
図14は、本開示のある実施形態に係る、人工多能性幹細胞(iPSC)−網膜色素上皮(RPE)細胞の配列解析を表している。
特定の実施形態の説明
下記の例証される実施形態は、単に例示的であり、当業者が認識するように様々な形態で具体化され得るので、それらの例証される実施形態は、決して例証されるものに限定されない。ゆえに、本明細書中に開示される任意の構造および機能の詳細は、限定として解釈されるべきでなく、単に、請求項の根拠および検討される実施形態を様々に使用するために当業者を教示するための表現として理解されるべきである。さらに、本明細書中で使用される用語および句は、限定を意図しているのではなく、例証される実施形態の理解できる説明を提供すると意図している。
別段定義されない限り、本明細書中で使用されるすべての専門用語および科学用語は、本開示が属する分野の当業者が通常理解する意味と同じ意味を有する。本明細書中に記載される方法および材料と類似または等価な任意の方法および材料も、例証される実施形態の実施または試験において使用できるが、例示的な方法および材料をこれより説明していく。
本明細書中および添付の請求項において使用されるとき、単数形「a」、「an」および「the」は、文脈が明らかに他のことを指示しない限り、複数の指示対象を含むことに注意しなければならない。したがって、例えば、「刺激(a stimulus)」という言及には、複数のそのような刺激が含まれ、「シグナル(the signal)」という言及には、1つまたはそれを超えるシグナルおよび当業者に公知のその等価物などに対する言及が含まれる。
下記で論じられる例証の実施形態は、好ましくは、コンピュータプロセッサーを有する機械において実行を可能にするための制御論理を有するコンピュータ使用可能媒体上に常駐するソフトウェアアルゴリズム、プログラムまたはコードであることが認識されるべきである。その機械は、通常、コンピュータアルゴリズムまたはプログラムの実行から出力を提供するように構成された記憶装置を備える。
本明細書中で使用されるとき、用語「ソフトウェア」は、その実行が、ハードウェアにおいて行われるのか、ファームウェアにおいて行われるのか、それともディスク上の、記憶装置デバイス上のまたは遠隔の機械からのダウンロード用の、利用可能なソフトウェアコンピュータ製品として行われるのかに関係なく、ホストコンピュータのプロセッサーに存在し得る任意のコードまたはプログラムと同義であると意味される。本明細書中に記載される実施形態は、下記に記載される方程式、関連性およびアルゴリズムを実行するためのそのようなソフトウェアを含む。当業者は、上に記載された実施形態に基づいて、例証される実施形態のさらなる特徴および利点を認識するだろう。したがって、例証される実施形態は、添付の請求項が示すものを除いて、特に示されたものおよび特に記載されたものに限定されるべきでない。
例示的な実施形態において、コンピュータシステムコンポーネントは、本明細書中の下記に記載されるある特定の操作を行うように構成されたおよびそのような操作を行うように動作する、「モジュール」を構成し得る。したがって、用語「モジュール」は、ある特定の様式で動作するようにおよび本明細書中に記載されるある特定の操作を行うように物理的に構築された、永続的に構成された(例えば、物理的に組み込まれた)または一時的に構成された(例えば、プログラムされた)実体である有形の実体を包含すると理解されるべきである。
図1は、本開示の1つの実施形態に係る1つの操作環境100の全体的な概要を図示している。特に、図1は、本開示の実施形態において使用され得る情報処理システム102を図示している。下記でさらに詳細に開示される処理システム102は、臨床用バイオ製造(clinical biomanufacturing)において移植片の機能を検証する(組織の機能および細胞のドナー同一性を非侵襲的に予測することを含む)ために使用できる。処理システム102は、損傷したまたは変性した生得組織を、インビトロで開発された新しい機能的なインプラントで置き換えることによって網膜変性、神経変性、心疾患および他の疾患を処置するための細胞ベースの治療の作製を助ける発生生物学および再生医学における進歩と相性がよい。人工多能性幹細胞(iPSC)は、自己組織の移植を可能にする細胞療法の可能性を広げた。処理システム102が支援する本開示の方法は、非侵襲的に行われ、訓練されたユーザーについての要件を無くすこと、ハイスループットを可能にすること、コストを下げること、および適切な予測(例えば、組織の機能および細胞のドナー同一性に関するもの)を行うために必要な時間を短縮することによって、大規模なバイオ製造に対する障壁を克服する。
図1に示される情報処理システム102は、好適なシステムの単なる一例であって、下記に記載される本開示の実施形態の使用または機能性の範囲を限定すると意図されていない。図1の情報処理システム102は、下記に示される任意の機能性を実行するおよび/または行うことができる。任意の適切に構成された処理システムを、本開示の実施形態において情報処理システム102として使用することができる。
図1に図示されているように、情報処理システム102のコンポーネントとしては、1つまたはそれを超えるプロセッサーまたは処理装置104、システムメモリー106、およびシステムメモリー106を含む様々なシステムコンポーネントをプロセッサー104につなぐバス108が挙げられ得るが、これらに限定されない。
バス108は、種々のバスアーキテクチャーのいずれかを用いる、メモリーバスまたはメモリーコントローラー、周辺機器用バス、アクセラレイテッドグラフィックスポートおよびプロセッサーバスまたはローカルバスを含む、いくつかのタイプのバス構造のいずれかのうちの1つまたはそれを超えるものに相当する。例としてであって限定ではないが、そのようなアーキテクチャーとしては、業界標準アーキテクチャー(ISA)バス、マイクロチャネルアーキテクチャー(MCA)バス、拡張ISA(EISA)バス、ビデオエレクトロニクススタンダーズアソシエーション(VESA)ローカルバスおよび周辺コンポーネントインターコネクト(PCI)バスが挙げられる。
システムメモリー106は、1つの実施形態において、下記で論じられる1つまたはそれを超える実施形態を行うように構成された機械学習モジュール109を備える。例えば、1つの実施形態において、機械学習モジュール109は、選ばれた機械学習を適用することにより、機械学習予測モデルを用いて測定値の入力アレイに基づいて出力ベクトルを生成するように構成されている。別の実施形態では、機械学習モジュール109は、ディープニューラルネットワークモデルを用いて画像の入力アレイに基づいて出力を生成するように構成されている(これらは下記でより詳細に論じられる)。図1は、メインメモリーに常駐する機械学習モジュール109を示しているが、機械学習モジュール109は、プロセッサー104内に常駐し得ること、複数の情報処理システムおよび/もしくはプロセッサーに対応している別個のハードウェアコンポーネントであり得ること、ならびに/または複数の情報処理システムおよび/もしくはプロセッサーにまたがって配置され得ることに注意するべきである。
システムメモリー106は、ランダムアクセスメモリー(RAM)110および/またはキャッシュメモリー112などの揮発性メモリーの形態のコンピュータシステム可読媒体も含み得る。情報処理システム102は、他の着脱式/非着脱式の揮発性/不揮発性コンピュータシステム記憶媒体をさらに含み得る。単なる例として、ストレージシステム114は、非着脱式または着脱式の不揮発性媒体、例えば、1つまたはそれを超えるソリッドステートディスクおよび/または磁気媒体(通常、「ハードドライブ」と呼ばれる)から読み出すおよびそれらに書き出すために提供され得る。着脱式の不揮発性磁気ディスクから読み出すおよびそれに書き出すための磁気ディスクドライブ(例えば、「フロッピー(登録商標)ディスク」)ならびに着脱式の不揮発性光ディスクから読み出すまたはそれらに書き出すため光ディスクドライブ(例えば、CD−ROM、DVD−ROMまたは他の光学媒体)が提供され得る。そのような場合において、各々が、1つまたはそれを超えるデータメディアインターフェースによってバス108に接続され得る。メモリー106は、本開示の実施形態の機能を行うように構成された1組のプログラムモジュールを有する少なくとも1つのプログラム製品を含み得る。
1組のプログラムモジュール118を有するプログラム/ユーティリティー116は、オペレーティングシステム、1つまたはそれを超えるアプリケーションプログラム、他のプログラムモジュールおよびプログラムデータと同様に、限定でなく例としてメモリー106に保存され得る。そのオペレーティングシステム、1つまたはそれを超えるアプリケーションプログラム、他のプログラムモジュールおよびプログラムデータの各々またはそれらのいくつかの組み合わせは、ネットワーク利用環境のインプリメンテーションを含み得る。プログラムモジュール118は、通常、本開示の実施形態の機能および/または方法を行う。
情報処理システム102は、1つまたはそれを超える外部デバイス120(例えば、キーボード、ポインティングデバイス、ディスプレイ122など);ユーザーが情報処理システム102と情報をやりとりするのを可能にする1つまたはそれを超えるデバイス;および/または情報処理システム102が1つもしくはそれを超える他のコンピューティングデバイスと通信するのを可能にする任意のデバイス(例えば、ネットワークカード、モデムなど)とも通信し得る。そのような通信は、I/Oインターフェース124を介して行われ得る。それでもなお、情報処理システム102は、1つまたはそれを超えるネットワーク(例えば、ローカルエリアネットワーク(LAN)、汎用広域ネットワーク(WAN)および/またはパブリックネットワーク(例えば、インターネット))とネットワークアダプター126を介して通信し得る。描かれているように、ネットワークアダプター126は、情報処理システム102の他のコンポーネントとバス108を介して通信する。他のハードウェアコンポーネントおよび/またはソフトウェアコンポーネントも、情報処理システム102とともに使用され得る。例としては、マイクロコード、デバイスドライバー、冗長処理装置、外部ディスクドライブアレイ、RAIDシステム、テープドライブおよびデータアーカイブストレージシステムが挙げられるが、これらに限定されない。
本開示の様々な実施形態は、幹細胞の画像を解析するためおよび/またはこれらの幹細胞に由来する複数の細胞型を解析するために新規のニューラルネットワークおよび/または機械学習アルゴリズムを使用する計算フレームワークに関する。少なくとも、いくつかの実施形態では、ニューラルネットワークおよび/または機械学習を用いることにより、細胞の1つまたはそれを超える生理学的機能および/または生化学的機能を自動的に予測することができる。
情報処理システム102に入力される画像は、明視野顕微鏡などの外部デバイス120を用いて取得され得る。情報処理システム102は、これらの画像をリアルタイムでまたは選ばれた時点において、定量的明視野吸光度顕微鏡法(QBAM)を用いて自動的に処理し得る。QBAMは、光の絶対尺度である吸光度に基づく吸光度イメージングを使用する。用いられるQBAM法は、任意の標準的な明視野顕微鏡において実行され得、信頼度の高い画質の再現性のある画像を出力するための統計的にロバストな方法を提供する。
具体的には、QBAMの適用は、入力画像の画素を相対強度単位から、光減衰の絶対尺度である吸光度単位に変換することを含む。イメージングの再現性を改善するために、QBAMは、画像のキャプチャーに伴ってリアルタイムで画像の統計量を算出することにより、各画素において測定された吸光度値が10ミリ吸光度単位(mAU)という95%信頼度を有することが確保される。
未処理の画素強度は、画像が同じ顕微鏡においてキャプチャーされたときでさえ、顕微鏡の配置および設定(例えば、不均一な照明、電球の強度およびスペクトル、カメラなど)によって変化することがあり、画像の比較を困難にするので、QBAMは、未処理の画素強度を使用する方法にまさる利点を提供する。ゆえに、本開示の方法は、自動化、画素強度から吸光度値への変換、吸光度信頼度の算出、およびQBAMを用いてキャプチャーされた画像データの品質を最大にするためのベンチマーキングの使用による顕微鏡の平衡の確立を提供し得る。
組織学的検査を用いるときなど、透過率値を用いて画像を処理するシナリオでは、統計量の算出値は、再現性のある組織切片画像を生成するように修正され得る。QBAMは、算出が波長特異的でないので、任意のマルチスペクトルモダリティに一般化できる。本開示の方法は、細胞の境界および非色素細胞の細胞内構造を特定し得るハイパースペクトル自己蛍光イメージングに好適であり得る。
情報処理システム102は、受け取った画像を処理するために(機械学習および/またはディープニューラルネットワークの処理を画像に適用するため、モデルを訓練するため、特徴を抽出するため、クラスタリング機能を果たすため、および/または分類機能を果たすためを含む)1つまたはそれを超える処理システムおよび/またはソフトウェアアプリケーションを使用し得る。実施形態において、顕微鏡が出力する画像は、さらなる処理が行われる前に、1つの形式(例えば、CZIであるがこれに限定されない)から別の形式(例えば、JPEGまたはTIFFであるがこれらに限定されない)に変換される。実施形態において、顕微鏡から画像を受け取るMATLAB(登録商標)など(これに限定されない)のアプリケーションのスクリプトは、顕微鏡が出力する形式を管理するように適合される。実施形態において、受け取った画像および受け取った画像から得られるデータは、1つまたはそれを超える異なるプログラム(例えば、MATLAB(登録商標)、Fiji by ImageJTM、C++および/またはPython(登録商標))によって使用され得る。実施形態において、データは、1つのプログラムから別のプログラムに手動で移され得る。実施形態において、スクリプトは、プログラムが相互に直接データを移すのを可能にするように適合される。
したがって、開示される方法は、任意の臨床グレードのバイオ製造環境またはハイスループットスクリーニングシステムにおいて実行され得、開示される方法は、明視野顕微鏡、デジタルカメラおよび解析用のデスクトップコンピュータだけを必要とする。
この説明は、ヒト幹細胞(例えば、iPSCおよび網膜色素上皮(RPE)細胞)の機能を評価するために使用され得る1組のデータ駆動型モデリングツールを提示する。少なくとも、いくつかの実施形態において、この画像解析は、iPSCおよびRPEの臨床用調製物に対するロットおよびバッチリリース基準を作成するために使用される。特定の実施形態において、開示されるシステムは、細胞および種々のタイプの組織治療をより効率的な様式で患者に届けるために利用され得る。さらに、開示されるアプローチは、1)異なるサブタイプの細胞間の差を見分けるために使用され得、ゆえに、幹細胞を用いた特定の細胞および組織タイプの作製または作製の最適化の可能性が与えられ;2)健康な細胞と病気の細胞との差を見分けるために使用され得、それにより、病気の細胞の健康状態を改善し得る、薬物または疾患の裏側にある発症機序を発見する可能性が与えられ;3)薬物およびトキシンで処置された細胞間の差を見分けるために使用され得、それにより、細胞に対する薬効、薬物の副作用およびトキシンの影響ならびにそれらの組み合わせを決定する可能性が与えられる。これらの特定の方法の各々が、特定の時点においておよび/または縦断的研究におけるある期間にわたって、調べている細胞を妨害せずに行うことができる。
図2Aおよび2Bは、本開示のある実施形態に係る、細胞およびその誘導体の機能、同一性、疾患状態および健康を予測するために個々にまたは一緒に使用され得る選ばれた機械学習フレームワークおよびディープニューラルネットワークフレームワークを説明している。
図2Aに図示される実施形態では、機械学習予測モデル204は、データ駆動型統計解析アプローチによって入力データ202を相関させて、新しい解釈可能なモデルを生成するように訓練される。ある実施形態において、入力データ202は、複数の幹細胞または複数の幹細胞由来の細胞型の、少なくとも1つの生理学的パラメータ、分子パラメータ、細胞パラメータおよび/または生化学的パラメータを代表する測定値の入力アレイを含み得る。
入力データ202は、例えばウェブ画像処理パイプライン(WIPP)を用いて、QBAM画像から抽出された個々の細胞の抽出された視覚的特徴から得ることができる。その抽出された視覚的特徴を用いることにより、種々の組織の特性(機能、細胞が由来したドナーの同一性および発生上のアウトライヤー(異常な細胞の出現)を含む)を予測するように、選ばれた機械学習アルゴリズムを訓練することができる。次いで、その選ばれた機械学習アルゴリズムを用いることにより、組織の特性の予測に寄与し得る決定的な細胞特徴を識別することができる。
様々な実施形態において、複数の幹細胞には、ヒト起源もしくは動物起源の、胚性幹細胞(ESC)、人工多能性幹細胞(iPSC)、神経幹細胞(NSC)、網膜色素上皮幹細胞(RPESC)、人工多能性幹細胞由来の網膜色素上皮細胞(iRPE)、間葉系幹細胞(MSC)、造血幹細胞(HSC)、癌幹細胞(CSC)、またはそれらに由来する任意の細胞型のうちの少なくとも1つが含まれ得る。いくつかの実施形態において、入力データ202は、ヒト組織もしくは任意の動物組織に由来する複数の主要な細胞型の、少なくとも1つの生理学的パラメータ、分子パラメータ、細胞パラメータおよび/または生化学的パラメータを代表する測定値の入力アレイを含み得る。
様々な実施形態において、機械学習予測モデル204は、複数のタイプの予測モデル(次元削減/ランク低減、階層型クラスタリング/グループ化、ベクトルベースの回帰、決定木、ロジスティック回帰、ベイジアンネットワーク、ランダムフォレストなど)のうちの1つを含み得る。機械学習予測モデル204は、類似の細胞メトリクスに対して訓練され、異なる患者と、iPSC由来RPE組織工学構築物のクローンとの両方のよりロバストなグループ化を提供するために使用される。したがって、機械学習予測モデル204は、細胞の個々の視覚的パラメータを選択し、ランク付けすることにより、例えば細胞の生理学的機能および/または生化学的機能を代表する出力ベクトル206を生成する。
図2Bに図示される本開示の別の実施形態によると、例えばディープニューラルネットワークモデル212を用いるニューラルネットワークフレームワークは、ラベルされたおよび/または定義された画像および/またはデータを含む訓練用入力アレイ208を用いて訓練される。訓練用入力アレイ208の画像は、様々な幹細胞または幹細胞由来の細胞型の微細構造を示す。1つの実施形態において、各微細構造の画像は、好ましくは、2×〜200×の拡大率でキャプチャーされた細胞の微細構造を含み得る。追加的または選択的に、訓練用入力アレイ208は、研究者が関心を示している細胞の超微細構造または微細構造のデータが識別子を伴って強調表示された画像アレイを含み得、また、対応する複数の幹細胞または幹細胞由来の細胞型に対する細胞の起源、細胞の位置、細胞株、生理学的データおよび生化学的特性を識別するデータも含み得る。
下記に詳細に記載されるように、ディープニューラルネットワークモデル212は、一貫してかつ自律的に、画像を解析すること、画像内の特徴を識別すること、所与の画像のハイスループットなセグメンテーションを行うこと、および画像を同一性、安全性、生理学的結果、生化学的結果または分子的結果と相関させることができる。
さらに、ディープニューラルネットワークモデル212によって生成されたセグメンテーションは、訓練用入力アレイ208の元の微細構造画像に再度オーバーレイされ得、次いで、それらの微細構造画像に対して画像特徴抽出が行われ得る。種々の定量的細胞情報(細胞の形態計測(面積、周囲長、伸長など)、強度(平均輝度、最頻値、中央値など)またはテクスチャー(強度のエントロピー、標準偏差、均一性など)が含まれるがこれらに限定されない)が、細胞内の個々の特徴について、細胞自体について、または幹細胞もしくは幹細胞由来の細胞型が分布する組織領域において、算出され得る。
本開示の様々な実施形態によって企図されるディープニューラルネットワークモデル212の利点としては、訓練用入力アレイ208がもたらす予測信頼性と、細胞の画像と細胞の同一性、安全性、生理学的プロセスおよび/または生化学的プロセスとの複雑な関係性を一貫して決定する能力との組み合わせが挙げられる。
そして、ディープニューラルネットワークモデル212によって生成されたセグメンテーションを用いて、選ばれた機械学習方法を、これらの画像から抽出された特徴に適用することにより、画像内のどの特徴が細胞の同一性、安全性、生理機能および/または生化学的プロセスと相関するかを識別することできる。さらに、ディープニューラルネットワークモデル212は、訓練用入力アレイ208の不確実性を軽減し得る。
細胞およびその誘導体の機能、同一性、疾患状態ならびに健康を予測するためのディープニューラルネットワークモデル212によって提供される工程の鍵は、訓練用入力アレイ208の特徴付けられた画像に基づいてパラメータのグループ化を定量的形式で自動的に調整する能力である。本開示の様々な実施形態は、深層学習に焦点を合わせた新規の細胞機能認識および特徴付けの方法に関し、様々な機能の認識が、視覚データのみを用いて行うことが可能である。下記に開示される方法は、細胞の機能性の特徴付けのためにディープ畳み込みニューラルネットワークを用いる方法の非限定的な一例とみなされるべきである。ディープニューラルネットワークモデル212を、ラベルされた限られたデータを扱うように訓練するための方法およびシステムが本明細書中に開示される。
大量の注釈付きデータが入手可能なとき細胞の機能性の特徴付けに使用される他の可能性のあるフレームワークは、通常、教師つきの設定において画素単位のセグメンテーションを用いる。そのような方法/フレームワークの例としては、完全畳み込みネットワーク(FCN)、U−Net、pix2pixおよびそれらの拡張機能が挙げられるが、これらに限定されない。しかしながら、セマンティック画像セグメンテーションおよび超解像などの他のタスクに使用されるFCNのフレームワークは、開示される方法ほど深くない(深さは層の数に関係する)。例えば、FCNネットワークは、入力として画像を受け取り、畳み込みフィルターの4層の隠れ層を介して画像全体を出力として生成し得る。出力とクリーンな画像との差を最小限に抑えることによって、重みを学習する。
深層学習方法を細胞画像解析に適用する難点の1つは、ニューラルネットワークモデルを訓練するための大きなサイズの注釈付きデータが無いことである。しかしながら、人間は、日常の自然の画像からのパターンと顕微鏡像からのパターンの両方を認識するために自身の視覚システムを用いることができる。ゆえに、非常に高いレベルにおいて、目標は、1つのタイプの画像を用いてモデルを訓練し、細胞機能性の認識タスクに使用できるデータパターンを自動的に学習するようにそのモデルを教えることである。
1つの実施形態において、ディープニューラルネットワークフレームワークは、2工程のアプローチを用いる。一例において、訓練用入力アレイ208の画像としては、抗ZO−1抗体染色(白色)を有するRPEを示す、ライブの蛍光顕微鏡像、マルチスペクトル明視野吸収画像、化学発光画像、放射性画像またはハイパースペクトル蛍光画像が挙げられる。タイトジャンクションタンパク質ZO−1は、RPE細胞の境界を表す。他の例において。有利なことに、顕微鏡像の中の細胞の境界および視覚的パラメータ(すなわち、形状、強度およびテクスチャーメトリクス)の理解に基づいて、ディープニューラルネットワークモデル212は、新しい入力アレイ210のそのような画像(例えば、類似の細胞または細胞由来製品の、ライブの蛍光顕微鏡像、マルチスペクトル吸収明視野像、化学発光画像、放射性画像またはハイパースペクトル蛍光画像)の中の細胞境界および視覚的パラメータの相関を検出することができる。テクスチャーメトリクスには、複数の細胞内の特徴が含まれ得ることに注意するべきである。さらに、マルチスペクトル明視野吸収画像には、位相差、微分干渉を用いた画像または明視野のモダリティを有する他の任意の画像が含まれ得ることに注意するべきである。
本開示の実施形態は、機械学習コミュニティーにおいて転移学習として知られる概念を用いる。換言すれば、開示される方法は、知識を効果的かつ自動的に保持すること、および知識を1つのタスク(顕微鏡像)から別の関連するタスク(ライブの吸光度画像解析)に効果的かつ自動的に移動させることを利用する。
上で述べたように、様々な実施形態において、機械学習予測モデル204は、複数のタイプの予測モデルを含み得る。1つの実施形態において、機械学習予測モデル204は、次元削減および/またはランク低減を用い得る。図3A〜3Cは、本開示のある実施形態に係る、主成分分析機械学習モデルを用いた多次元データから低次元データへの変換を図示している。
変数削減法として因子分析を使用するとき、2つまたはそれを超える変数の相関は、2つの変数を合わせて単一の因子にすることによって要約され得る。例えば、2つの変数が、散布図にプロットされ得る。それらの2つの変数の直線関係の概要を表す回帰直線を当てはめ得る(例えば、図2Aの機械学習予測モデル204によって)。例えば、2つの変数が存在する場合、それらの2つの変数が直線を定義する2次元プロットが行われ得る。3つの変数の場合は、3次元散布図が決定され得、そのデータを介して平面を当てはめ得る。3つを超える変数の場合は、散布図に点を図示することが難しくなるが、その解析は、機械学習予測モデル204によって行われ、その3つまたはそれを超える変数の関係性の回帰の要約を決定され得る。2つまたはそれを超える項目の主成分を捉えるようなプロットでは、回帰直線を近似する変数が定義され得る。新しい因子に対する幹細胞データまたは幹細胞由来の細胞型データからのデータ測定値(すなわち、回帰直線によって表される)は、その2つまたはそれを超える項目の本質を表すために、将来のデータ解析において使用され得る。したがって、2つまたはそれを超える変数は、1つの因子に削減されてもよく、ここで、その因子は、その2つまたはそれを超える変数の線形結合である。
主成分(例えば、図3Aにおける第1の成分302および第2の成分304)の抽出は、元の変数空間の分散最大化回転を決定することによって見出され得る。例えば、図3Bに示される散布図310では、回帰直線312は、回帰直線を近似するように回転された、図3Aにおける元のX軸であり得る。このタイプの回転は、分散最大化と呼ばれる。なぜなら、その回転の基準(すなわち、目標)が、新しい変数の周りの分散を最小限に抑えつつ、「新しい」変数(因子)の分散(すなわち、ばらつき)を最大にすることであるからである。3つまたはそれを超える変数を用いて散布図を作成することは難しいが、新しい因子の分散を最大にするように軸を回転させるという論理は同じままである。換言すれば、機械学習予測モデル204は、図3Aに示された多次元データ300に基づいて次の最適直線312をプロットし続ける。図3Cは、最終的な最適直線322を示しており、ここで、データの全分散が、機械学習予測モデル204によって説明される。
別の実施形態によると、機械学習予測モデル204は、クラスタリングアプローチを用いることがある。図4は、本開示のある実施形態に係る、類似の群を識別するための階層型クラスタリングの方法の一例を示している。クラスタリングアプローチは、クラスター解析を含む。本開示の文脈において、用語「クラスター解析」は、類似の種類の対象をそれぞれのカテゴリーにグループ化し、ゆえに観測データを意味のある構造に統合するための、いくつかの異なる標準的なアルゴリズムおよび方法を包含する。この文脈において、クラスター解析は、2つの対象が同じ群に属する場合にはそれらの対象の間の関連度が最大になるように異なる対象を群にソートし、そうでない場合にはそれらの対象の間の関連度が最小になるように異なる対象を群にソートするための一般的なデータ解析プロセスである。クラスター解析は、必ずしもグループ化に説明を提供せずに、データ内の構成を見出すために使用され得る。換言すれば、クラスター解析は、データ内の論理的なグループ化を見出すために使用され得る。
代替の実施形態において、クラスタリングアプローチは、階層型クラスタリングを含み得る。用語「階層型クラスタリング」は、測定された結果を、連続して類似性の低い群(クラスター)にまとめていくことを包含する。換言すれば、階層型クラスタリングは、類似性/距離の何らかの尺度を用いる。
図4は、階層的クラスター402の一例を図示している。クラスタリングは、どの細胞株が癌遺伝子に変異を起こしたのかを識別することによって、細胞療法用製品の安全性を決定するために使用することができる。この場合、階層的ブートストラップクラスタリングは、畳み込みニューラルネットワークによって、RPE画像のセグメンテーションから得られた細胞特徴のデータセットに対して行われ得る。癌性変異を起こした細胞株は、他のすべての変異していない株と統計的に異なる(例えば、図13を参照のこと)。様々な実施形態において、上で論じられたクラスタリングアプローチは、処置、遺伝子などの類似した群が互いにどのように関連しているかを決定するために使用することができる。
なおも別の実施形態によると、機械学習予測モデル204は、ベクトルベースの回帰を使用し得る。ここからは、本開示のある実施形態に係る、機械学習予測モデル204が使用し得るベクトルベースの回帰モデルの一例を示している図5を参照する。より詳細には、図5は、2次元データ領域500を示している。このデータ領域は他の実施形態ではn次元であり得ること、およびn次元空間の超平面はn−1次元の平面であること(例えば、3次元空間では、超平面は2次元平面である)が認識されるだろう。2次元データ領域の場合、超平面は、そのデータ領域における1次元直線である。
データ領域500は、測定値サンプル例501、503を有する。訓練用サンプルは、1クラスのサンプル(ここでは「第1クローン」サンプル501と呼ばれる)および別のクラスのサンプル(ここでは「第2クローン」サンプル503と呼ばれる)を含む。502、504および506とラベルされた3つの候補超平面が示されている。第1の超平面502は、2つのクラスを分離せず、第2の超平面504も2つのクラスを分離しないが、第3の超平面506よりも比較的小さいマージンを有し、第3の超平面506は、最大のマージンで2つのクラスを分離することに注意する。したがって、機械学習予測モデル204は、分類超平面、すなわち、新しいサンプルを第1のクローンまたは第2のクローンとして分類するために使用される超平面として506を出力する。
アウトライヤーと識別された測定値は、特定のパラメータ、パラメータ間の関係性などを解析するために回帰分析に利用できる。次元は、ベクトルのドット積が常に一定である1組のサンプルとして定義される。ベクトルは、通常、サンプル間の距離が最大になるように選択される。換言すれば、候補ベクトルは、収集されたデータセットへの近接について罰則が科される。様々な実施形態において、この罰則化、ならびにそのような罰則化が生じる距離は、機械学習予測モデル204の設定可能なパラメータであり得る。
図5の下部分は、超平面506を他の平行な超平面512および514と比較して図示している。超平面512および514は、それらの間の距離が可能な限り大きくなるように2つのクラスのデータを分離する。第3の超平面506は、超平面512と514との中間に位置する。
図3〜5に示されている予測モデルは、機械学習予測モデル204が使用し得る好適な機械学習方法の単なる例であり、上に記載された本開示の実施形態の使用または機能性の範囲を限定すると意図していない。機械学習予測モデル204が使用し得る他の機械学習方法としては、部分的最小二乗回帰、局所部分的最小二乗回帰、潜在構造に対する正射影、3パス回帰フィルター、再帰的な特徴削除を伴う決定木、ベイジアン線形およびロジスティックモデル、ベイジアンリッジ回帰などが挙げられるが、これらに限定されないことに注意するべきである。
図6は、本開示の実施形態に係る、ディープニューラルネットワークモデル212によって実行され得る例示的な全結合ディープニューラルネットワーク(DNN)600を図示している。DNN600は、入力層604、複数の隠れ層606および出力層608に組織化された複数のノード602を含む。604、606、608の各層が、ノード出力610によって接続される。各層に示されたノード602の数は、例示的であると意味されており、決して限定していると意味されないと理解される。加えて、図示されたDNN600は、全結合として示されているが、DNN600は、他の配置も有し得る。
DNN600の概要として、解析される画像603が、入力層604のノード602に入力され得る。ノード602の各々は、調整可能なパラメータを有する数学関数に対応し得る。ノード602のすべてが、例えばおそらく異なるパラメータ値によってのみ異なる同じスカラー関数であり得る。あるいは、様々なノード602は、層の位置、入力パラメータまたは他の差別的な特徴に応じて異なるスカラー関数であり得る。例として、その数学関数は、シグモイド関数の形をとり得る。他の関数の形式も追加的または選択的に使用され得ると理解される。それらの各数学関数は、1つの入力または複数の入力を受け取るように構成され得、その1つの入力または複数の入力から、スカラー出力を算出または計算するように構成され得る。シグモイド関数の例を挙げると、各ノード602は、その入力の加重和のシグモイド曲線の非線形性を計算し得る。
したがって、入力層604におけるノード602は、細胞の顕微鏡像603を受け取り、次いで、ノード出力610を生成し、それらは、隠れ層606を通じて連続的に送達され、入力層604のノード出力610は、第1の隠れ層606のノード602に向いており、第1の隠れ層606のノード出力610は、第2の隠れ層606のノード602に向いており、以下同様である。最後に、最後の隠れ層606のノード602は、出力層608に送達され得、それはその後、例えば特定の細胞特性(例えば、TER)または細胞の同一性について、予測611を出力し得る。
DNN600のランタイム使用の前に、DNN600は、ラベルされたまたは転写されたデータを用いて訓練され得る。例えば、訓練中、DNN600は、訓練用入力アレイ208の1組のラベル/定義された画像を用いて訓練される。図示されているように、DNN600は、「全結合」と見なされる。なぜなら、入力層604および隠れ層606の各ノード602のノード出力610は、次の隠れ層606または出力層608のいずれかにおけるすべてのノード602の入力に接続されているからである。したがって、各ノード602は、入力データ603を受け取る入力層604におけるノード602を除いては、直前の層604、606から入力値を受け取る。本開示の実施形態は、フィードフォワードネットワークに限定されず、再帰的ニューラルネットワークの使用も同様に企図し、そこでは、少なくともいくつかの層が、それより前の層にデータをフィードバックする。
少なくとも、1つの実施形態において、ディープニューラルネットワークモデル212は、畳み込みニューラルネットワークを使用し得る。図7は、本開示のある実施形態に係る例示的な畳み込みニューラルネットワークモデルのアーキテクチャーの模式図である。図7におけるアーキテクチャーは、活性化マップとしても知られる複数の特徴マップを示している。1つの例証的な例において、分類される対象画像702(例えば、新しい入力アレイ210の画像の1つ)が、224×224のサイズを有するJPEG画像である場合、その画像の代表的なアレイは、224×224×3であり得る(ここで「3」は、RGB値のことを指す)。対応する特徴マップ704〜718は、それぞれ以下のアレイ224×224×64、112×112×128、56×56×256、28×28×512、14×14×512、7×7×512、1×1×4096、1×1×1000によって表され得る。
さらに、上で述べたように、畳み込みニューラルネットワークは、複数の層を含み、それらの1つは、畳み込みを行う畳み込み層である。各畳み込み層は、入力データをフィルタリングするフィルターとして作用する。高レベルでは、CNNは、画像702を取得し、それを一連の畳み込み層、非線形層、プーリング(ダウンサンプリング)層および全結合層に通して、出力を得る。出力は、画像を最もうまく説明する、単一のクラスまたはある確率のクラスであり得る。
畳み込みは、フィルターおよび入力データに基づく内積の生成を含む。各畳み込み層の後、ReLU(正規化線形ユニット)層などの非線形層(または活性化層)を直後に適用するのが従来の手法である。非線形層の目的は、基本的には、畳み込み層による操作中に線形操作(例えば、エレメント毎の乗法および加法)を計算したばかりのシステムに、非線形性を導入することである。いくつかのReLU層の後、CNNは、1つまたはそれを超えるプーリング層を有し得る。プーリング層は、ダウンサンプリング層とも称される。このカテゴリーには、いくつかの層オプション、例えば、マックスプーリングも存在する。このマックスプーリング層は、基本的にフィルター(通常、2×2のサイズ)および同じ長さのストライドをとり、そのマックスプーリング層は、入力ボリュームに適用され、フィルターが畳み込む各サブ領域における最大数を出力する。
各全結合層は、入力ボリュームを受け取り(例えば、その出力は、直前の畳み込み層、ReLU層またはプーリング層の出力である)、N次元ベクトルを出力する(ここで、Nは、学習モデルが選択しなければならないクラスの数である)。このN次元ベクトルにおける各数字は、ある特定のクラスの確率を表している。全結合層は、前の層の出力(高レベル特徴の活性化マップに相当する)を処理し、どの特徴が特定のクラスと最も相関するかを判定する。例えば、前の畳み込み層からの特定の出力特徴は、その画像における特定の特徴がRPE細胞を示すか否かを指摘することがあり、そのような特徴を用いることにより、標的画像を「RPE細胞」または「非RPE細胞」として分類することができる。
さらに、例示的なCNNアーキテクチャーは、ソフトマックス層を最後の全結合層とともに有することにより、二部グラフ表示(BGL)を明確にモデル化でき、それを用いることにより、大域的誤差逆伝播(global back−propagation)を用いてCNNを最適化することができる。
より詳細には、図7に示されるCNNネットワークの例示的なアーキテクチャーは、複数の畳み込みおよびReLU層720、マックスプーリング層722、全結合層およびReLU層724ならびにソフトマックス層726を含む。1つの実施形態において、CNNネットワーク700は、139個の層および4200万個のパラメータを含み得る。
図8は、本開示のある実施形態に係る、幹細胞の機能を計測するために、従来の機械学習フレームワークおよび/またはディープニューラルネットワークフレームワークが使用し得る幹細胞画像を図示している。この実施形態では、2つの異なる細胞株のiPSC−RPE細胞を12ウェルディッシュの1ウェルごとに播種する。このRPE細胞は、光受容体の発達および機能に不可欠であり、完全な成熟のためには機能的な一次繊毛を必要とすることに注意するべきである。1組の細胞を未処置のまま放置し、他の2組をiPSC−RPE分化の成熟ステージにおいて操作する。別の組の細胞を、10日間の培養の後、細胞のG1からSへの移行を阻止することによって繊毛形成を増大させ、RPEの分化を促進する四環式抗生物質であるアフィディコリン(aphidocolin)で処置する。
播種された別の組の細胞を、繊毛のタンパク質輸送を阻止して繊毛の機能を阻害することによって機能し、ゆえにRPEの分化を阻害し、好ましいネガティブコントロールを提供する、AAA+ATPアーゼダイニンモーター阻害剤であるHPI−4で処置する。本開示のある実施形態によると、iPSC−RPE分化の成熟ステージの間の6つの異なる時点(例えば、2〜7週目)において測定を行う。そのような測定としては、TER、サイトカイン分泌プロファイルおよび貪食作用能が挙げられるがこれらに限定されない。RPE細胞の最も重要な機能の1つは、外節を脱落させる光受容体の貪食作用であることに注意するべきである。図8は、アフィディコリンで処置されたRPE細胞802、未処置のRPE細胞804(コントロール群)およびHPI−4で処置されたRPE細胞806を図示している。複数の画像802〜806を、解析される新しい入力アレイ210の画像として使用する。CNNネットワーク700は、複数の画像に対してTER測定値を予測するように構成される。1つの実施形態において、複数の入力画像は、およそ15,000個の画像を含み得る。
図9は、本開示のある実施形態に係る、CNNモデルによって提供されるTERの予測結果900を図示している。図9において、横軸906は、実際のTER測定値を表しており、縦軸908は、CNNネットワーク700によって予測されたTER値を表している。生育された3組すべてのRPE細胞に対する結果および異なる時点において測定されたすべての測定値に対する結果が示されている。この実施形態において、リリース基準は、400Ohm*Cm2というTERに構成されている。図9において、領域902は、すべて正しく許容された細胞を含み、領域904は、CNNモデル700によって正しく棄却されたすべての細胞を表している。換言すれば、この場合、CNNモデル700は、100%の感度および100%の特異度で平均細胞抵抗(TER)を予測することができる完璧な予測器である。
図10は、バルク吸光度測定値とTERとの間に直接的な相関がないことを図示している。より詳細には、図10は、吸光度 対 TERのプロット1002を示している。図10において、横軸1004は、実際のTER測定値を表しており、縦軸1006は、吸光度値を表している。プロット1002は、バルク吸光度測定値とTER測定値との間に直接的な相関がないことをはっきりと図示している。ゆえに、CNNモデル700が使用する複数の視覚的パラメータ(例えば、空間データ、テクスチャーデータおよび幾何学的データ)が、予測能力に必要である。
図11は、本開示のある実施形態に係る、CNNモデルが使用する類似性アプローチに基づくセグメンテーションを図示している。図11において、第1の画像1102は、抗ZO−1抗体染色(白色)を有するRPEを示している共焦点蛍光顕微鏡像を含む訓練用入力アレイ208の画像を表している。タイトジャンクションタンパク質ZO−1は、RPE細胞の境界を表す。第2の画像1104は、CNNモデル700によってセグメント化された第1の画像1102を表している。さらに、この実施形態において、解析される新しい入力アレイ210の画像は、第3の画像1106によって図11に表されるライブのマルチスペクトル吸収画像を含む。第4の画像1108は、ディープニューラルネットワークモデル212によってセグメント化された第3の画像1106を表している。第2の画像1104は、第1の画像1102においてはっきりと目に見える細胞境界を手動で補正することによって検証できるが、第4の画像1108に関しては、手動での補正が不可能ではないにしてもかなり難しいことに注意するべきである。有利なことに、細胞境界および視覚的パラメータ(例えば、形状、強度およびテクスチャーメトリクス)の理解に基づくと、ディープニューラルネットワークモデル212は、細胞境界を検出することができ、新しい入力アレイ210の類似のマルチスペクトル吸収画像内の視覚的パラメータの相関を行うことができる。
図12は、本開示のある実施形態に係る、分子データおよび生理学的データだけを用いて行われた主成分分析と、視覚データだけを用いて行われた画像解析との比較を図示している。図12における形状−陰影の各組み合わせは、3人のドナー(ここで「ドナー2」、「ドナー3」および「ドナー4」と命名する)のうちの1人から作製された異なるクローンを示している。PCA次元削減を行うことにより、機械学習予測モデル204が利用する24の異なる選ばれたメトリクスおよび27の異なる形状メトリクスにわたる、クローンのグループ化がより簡単に可視化される。図12は、選ばれたメトリクス(例えば、TER、遺伝子発現、成長因子の放出、光受容体の外節の貪食作用など)を用いた画像解析に対して行われたPCAのプロット1202と、機械学習予測モデル204を用いた画像解析に対して行われたPCAのプロット1204との比較を図示している。2つのプロット1202と1204との間において、ドナーとクローンとで同一の分離傾向が見られる。ドナー2の第1のクローン1206は、明らかに他のクローンから最も遠くに分離し、続いて、同じドナーの第2のクローン1208が分離した。さらに、ドナー3のクローン1210およびドナー4のクローン1212は、他のドナーのクローン1206および1208よりも強く互いに関連する。
この傾向は、図13に示されるように、機械学習予測モデル204が使用する様々な機械学習手法の間で一貫している。図13は、本開示のある実施形態に係る、視覚データを用いておよび用いずに行われた階層型クラスタリング法の比較を図示している。図13において、第1の階層型クラスタリングマップ1302は、上で論じられた選ばれたメトリクス(視覚的画像データなし)を用いた測定値の解析を表しており、第2の階層マップ1304は、機械学習予測モデル204によって行われた視覚的画像解析を表している。例証される実施形態によると、第1の階層型クラスタリングマップ1302および第2の階層型クラスタリングマップ1304は、解析されたデータの階層型クラスタリングにマルチスケールブートストラップリサンプリングを適用することによって生成される。参照数字1306によってラベルされたすべての数字が、クラスタリングの補正済みの確率を表し、残りの数字が未補正の確率を表すことに注意するべきである。
図13は、機械学習予測モデル204によって行われた解析が、選ばれたメトリクスを用いて行われた解析と一致するだけでなく、機械学習予測モデル204によって行われた解析が、このグループ化を引き起こし得るものの根底にある生物学に貴重な洞察を提供することを図示している。第2の階層型クラスタリングマップ1304は、ドナー2の第1のクローン1206が、変異したいくつかの癌遺伝子をリプログラミング中に有したことを示唆する、癌遺伝子についてのiPSC−RPE細胞の配列解析(図14に図示される)と一致している。
図14は、本開示のある実施形態に係る、解析されたiPSC−RPE細胞の癌遺伝子の配列解析を表している。図14は、3人の異なるドナー由来の9つのクローンを試験したことを図示している。試験されたクローンのうち1つのクローン1206だけが、iPSCへのリプログラミング中に変異を示し、これは、強調表示された領域1402によって表されている。
実施形態において、MATLAB(登録商標)またはFijiなどのある特定のソフトウェアアプリケーションには、それらが取り扱える入力画像のサイズに関して限界があり得るので、大きな入力画像は、重複するタイルに分割され得る。それらのタイルは、別々に、例えば、ディープニューラルネットワークを用いてセグメンテーションを行うことによって、または各タイルにおいて別々に粒子解析iを行うことによって、処理され得る。次いで、適切なソフトウェアアプリケーション(例えば、C++)を用いて画像が再構築され得、次いで、タイルは、処理された個々のタイルからのC++再構築物であり得る。その再構築された画像は、タイルが使用されたことの視覚的示唆を含まないことがある。
要するに、本開示の様々な実施形態は、以前のロットまたはバッチとの類似性の程度を決定するために、個々の幹細胞株の臨床用調製物に対するロットおよびバッチリリース基準を作成するための新規の計算フレームワークに関する。有利なことに、この新規の計算フレームワークは、明視野マルチスペクトルイメージングを使用して画像化され得る、任意の幹細胞型(例えば、ESC、iPSC、MSC、NCSであるがこれらに限定されない)、任意のもの由来の幹細胞製品(例えば、iPSC RPE由来の細胞)または任意の所与の細胞株もしくは遺伝的に改変された細胞療法用製品(例えば、キメラ抗原レセプター(CAR)T細胞)に対して使用され得る。本開示の様々な実施形態によって企図されるディープニューラルネットワークモデル212および機械学習予測/分類モデル204によって提供される利点としては、培養条件(例えば、細胞継代時間、培養中のiPSCまたは他の幹細胞型の純度、健康または不健康なiPSC細胞コロニーのどちらであるかの識別、分化細胞の識別および効力、薬物およびトキシンの識別および効力などであるがこれらに限定されない)を自動化するためのモデルの予測能力が挙げられる。
換言すれば、これらの手法は、新しい薬物のスクリーニングから、新規遺伝子の発現の研究、新しい診断用製品の作製、および癌患者のモニタリングに至るまで、広範囲にわたる情報を簡便かつ効率的に集めることを可能にする。この技術は、特定の細胞を同時に解析し、単離することも可能にする。この技術は、単独でまたは最新の(modem)分子手法と組み合わせて使用すると、生細胞の全体的な活動を含む複雑な機構をユニークに識別可能なパラメータと関連づけるための有用な方法を提供する。さらに、開示される計算フレームワークによって提供される重要な利点の1つは、選ばれた機械学習方法と最新のディープニューラルネットワークによって行われる自動解析が、人間の偏見および誤りを実質的に排除することである。
用いた実験法および方法
定量的明視野顕微鏡法、および組織の機能を非侵襲的に予測するニューラルネットワークを用いるプラットフォームを開発した。実験において、加齢黄斑変性症(AMD)患者および健康ドナー由来の臨床グレードのiPSC由来網膜色素上皮(iRPE)をモデル系として使用することにより、明視野顕微鏡画像から組織の機能を予測できるかを判定した。
網膜色素上皮(RPE)は、細胞の単層であり、RPEは、AMDを処置するためにRPEを使用することに関連する研究において臨床的に興味深い。そのうえ、単層内のRPE細胞の外観は、RPEの機能にとって極めて重要であることが知られており、最近の臨床試験では、移植のためのバイオ製造のリリース基準として熟練技師によるRPEの目視検査が用いられた。RPE細胞の外観は、隣接するRPE細胞間の結合複合体の成熟度、およびメラニン生成による特徴的な色素性外観によって大まかに規定される。その結合複合体は、バリア機能(経上皮抵抗および電位(TERおよびTEP)測定値)および成長因子の極性化分泌(ELISA)を含む、組織の成熟度および機能性と関連がある。したがって、細胞の外観と機能は相関し、互いを予測し得る。
透過光学顕微鏡の画像にばらつきがあるせいで、それらの画像を自動化された細胞解析およびセグメンテーションに使用するのは困難である。したがって、この研究で開発されたプラットフォームは、2つの構成要素からなる。1つ目は、異なる顕微鏡の間で再現性のある画像をキャプチャーする自動化方法を用いるQBAMである。2つ目の構成要素は、QBAMが生成した画像(QBAM画像)を用いて多細胞の機能を予測する機械学習である。その機械学習の手法は、ディープニューラルネットワーク(DNN)および選択(selected)機械学習(SML)のカテゴリーに分けられた。これらの手法は、細胞療法が研究室から臨床に転換される際にバイオ製造プロセスのスケーリングを助けるための非侵襲性の自動化された方法とともに速度、再現性および精度を提供するために選択された。
システムの概要および試験症例の説明
異なる顕微鏡の間で明視野イメージングの再現性を得るために、QBAMを開発した。QBAMは、画素を相対強度単位から吸光度単位に変換するものであり、ここで、吸光度は、光減衰の絶対尺度である。イメージングの再現性を改善するために、QBAMは、画像がキャプチャーされるときリアルタイムで画像上の統計量を算出して、各画素において測定された吸光度値が閾値信頼度(この実験の場合、10ミリ吸光度単位(mAU)という95%信頼度に構成された)を有することを確保した。この研究では、3つの異なる帯域フィルターをイメージングに使用したが、この方法は、任意の数の波長に合うように調整される。QBAMイメージングは、Micromanager(利用可能なハードウェアを有する顕微鏡の場合)またはモジュラーパイソンパッケージ(Micromanagerがサポートしていない顕微鏡の場合)に対するプラグインとして実行され、これは、ほんのわずかなボタン操作だけでユーザーがQBAM画像を得ることができるように構成されている。
QBAM画像の解析は、視野(FOV)スケールまたは単一細胞スケールで選択的に行った。これらの各スケールに対して、異なる目的で、DNNを使用した。FOVスケールでのDNNは、2つのもの:機能/成熟度アッセイの結果(DNN−Fを介して)または2セットのQBAM画像が同じドナー由来であるのか(DNN−Iを介して)を直接予測するようにデザインされた。画像をDNN−FまたはDNN−Iにフィードする前に画像処理は行わなかった。
単一細胞解析は、QBAM画像において細胞の境界を識別するDNNから始めた(DNN−Sを介して)。次に、個々の細胞の視覚的特徴を、ウェブ画像処理パイプライン(WIPP、抽出され得る特徴を下記の表4に示す)を用いてQBAM画像から抽出した。次いで、抽出された視覚的特徴を用いて、種々の組織の特性(当該細胞が由来したドナーの機能、同一性、および発生上のアウトライヤー(異常な細胞の外観を有する)を含む)を予測するようにSMLアルゴリズムを訓練した。次いで、SMLアルゴリズムを用いて、組織の特性の予測に寄与した決定的な細胞の特徴を特定した。このイメージングおよび解析方法の有効性を証明するために、以下のドナータイプ:健康、眼皮膚白皮症障害(OCA)および加齢黄斑変性症(AMD)由来のiRPEにおいて原理証明研究を行った。健康ドナー由来のiRPEは、成熟に伴って画像化していったが、AMDおよびOCAドナーは、成熟に達した最終時点において一度だけ画像化した。
5人の異なるOCA患者および2人の健康ドナー由来のiRPEを、OCA iRPEにおける生物学的変動および生まれつき低いメラニンレベルに対するこのイメージング法の感度を求めるためにQBAMを用いて画像化した。健康ドナー由来のiRPEは、毎週のイメージングに加えて、経上皮抵抗(TER)および血管内皮成長因子(VEGF)の極性化分泌についても評価した。TERは、RPE成熟の尺度であり、隣接細胞の間にタイトジャンクションが形成するにつれて高まる。VEGFの極性化分泌は、RPE機能の尺度であり、細胞単層の頂端側と比べて基底側により多くのVEGFが分泌される(VEGF−Ratio)。最後に、8つのiRPEクローンを、臨床グレードのプロトコルを用いて3人のAMDドナーから得た。ここで、臨床グレードとは、異種不含試薬を用いた細胞の作製およびcGMP準拠の作製プロセスのことを指す。AMD iRPEが成熟に達したら、QBAMイメージングをそれらに対して行った。
QBAMの精度、再現性および感度
参照減光(ND)フィルターと生物学的サンプルとの組み合わせを用いて、QBAMイメージングを検証した。吸光度値が既知であるNDフィルターを、UV−Vis分光計において測定された吸光度とQBAMイメージングを用いて測定された吸光度とを比較することによってQBAMイメージングを検証するための参照として使用した。QBAMイメージングを用いて測定された吸光度は、可視スペクトルにわたって分光計によって測定された吸光度と強く相関した。この方法をさらに検証するために、NDフィルターのQBAMの再現性を、各々が異なるフィルター、対物レンズおよび光源を備える3つのさらなる顕微鏡で明らかにした。すべてのフィルターおよび顕微鏡の間の平方根平均二乗誤差(RMSE)は、66ミリ吸光度単位(mAU)、すなわち、測定された最高吸光度値において約4.4%であった。
次いで、2人の異なる健康ドナーに由来する、徐々に成熟していく生iRPEにおいて、QBAMイメージングを試験した。時間が経過するにつれて平均吸光度が上昇するという一般的な傾向が見られた。QBAMイメージングがiRPEの色素沈着に関してどれくらいの感度であるかを決定するために、QBAMを用いて、OCA(iRPEの色素沈着が低下すると知られている疾患)を有する5人の異なる患者由来のiRPEを画像化した。白皮症のタイプ(OCA1AまたはOCA2)および疾患重症度を確認するために、OCA iRPEを順序付けた。OCA1AのiRPEは、重度の白皮症を有し、メラニンを生成しておらず(OCA8およびOCA26)、ゆえに最低の画像吸光度を有した。OCA2患者は、中程度(OCA103およびOCA9)から軽度(OCA71)の範囲の表現型を有し、それは、QBAMによって行われた吸光度測定と相関した。低レベルの色素を産生するOCA1A患者由来のiRPEであるにもかかわらず、吸光度値は、QBAMの最低感度(10mAU)より2倍高かった。まとめると、これらのデータは、QBAMイメージングの精度、再現性および感度を証明する。
吸光度画像からのiRPE機能のディープニューラルネットワーク予測
QBAMイメージングが、細胞の成熟に影響するかおよびiRPEの色素沈着の広範囲の変動を測定できるかを判定するために、各健康ドナー(Healthy−1、Healthy−2)由来のiRPEを画像化した。これを、3つの培養条件:(1)コントロールiRPE(処置なし)、(2)RPE成熟の公知の誘導物質(アフィディコリン)で処置されたiRPE、および(3)RPE成熟の公知の阻害剤(ヘッジホッグ経路阻害剤−4、HPI4)で処置されたiRPEを用いて行った。
コントロールおよびアフィディコリンで処置されたiRPEは、8週間の培養にわたって画像の吸光度を高めながら、予想通り成熟すると見出された一方で、HPI4で処置されたiRPEは、経時的に吸光度が減少する傾向があった(Healthy−2およびHealthy−1と称される)。成熟マーカーのmRNAおよびタンパク質のより高い発現が、HPI4で処置されたiRPEよりもコントロールおよびアフィディコリンで処置されたiRPEにおいて見出された。1mMカリウム(K+)または100μMアデノシン三リン酸(ATP)という生理学的処置に対するベースラインの電気的応答(TEPおよびTER)およびその変化が、コントロールと比べて、アフィディコリンで処置されたiRPEでは有意に大きく、HPI4で処置されたiRPEでは有意に小さかった。さらに、iRPEの成熟は、天然様の密な先端突起が存在することから明白であった。この実験セットから、(1)臨床グレードの条件において作製されたiRPEは、成熟した上皮の表現型を有し、(2)毎週のQBAMイメージングは、iRPEの成熟に影響せず、(3)成熟したiRPE(コントロールおよびアフィディコリン)と未熟なiRPE(HPI4)との間の色素沈着の差を、QBAMイメージングを用いて定量できると結論づけることができる。
次に、iRPEのQBAM画像からiRPE単層の機能および表現型を予測する能力を評価した。健康ドナーのiRPEの場合、QBAM画素値の平均値は、TERとほとんど相関がなかった。しかしながら、DNN−FによるTER予測は、同じサンプルについて実際のTER値と高度に相関し、これらの予測は、70.6Ω・cmというRMSEを有した。この方法論をバイオ製造の設定に組み込むために、400Ω・cmというTERを、iRPE単層を未熟(<400Ω・cm)または成熟(>400Ω・cm)として分類するためのストリンジェントな閾値として使用した。未熟なiRPEに関連する偽陽性、偽陰性およびTER値を求めた。このTER閾値に基づくと、iRPEの成熟度の分類について、DNN−Fは94%正確であり、感度は100%であり、特異度は90%であった。類似の傾向が、VEGF−Ratioについても観察され、ここで、VEGFの極性化放出は、QBAM平均画素値と十分相関しなかったが、DNN−F予測は、VEGF−Ratioの測定値と高度に相関し(R=0.89)、VEGF−Ratio予測のRMSEは、1.0未満であった。VEGF−Ratioの精度、感度および特異度はすべて、100%であった(ここで、VEGF−Ratioが<3.0であるサンプルを未熟とみなした)。これらの実験から、(a)生細胞のQBAM画像は、TERおよびVEGF−Ratioを高忠実度で予測するために使用することができ、(b)QBAMイメージングは、TERおよび/またはVEGF−Ratioを測定する代わりに細胞の機能的な検証の非侵襲性手段として使用され得ると結論づけることができる。
iRPE単層のライブQBAM画像からの単一細胞の特徴の抽出
DNNは、他の機械学習アルゴリズムと比べて優れた予測力を有すると知られているが、どの画像の特徴をDNNが予測するために使用しているかを判断するのは難しい。iRPEのどの細胞画像パラメータが単層の機能を予測するのかを理解するために、QBAM画像における個々のiRPE細胞の画像の特徴を算出し、それを用いて、iRPE機能を予測するようにSMLアルゴリズムを訓練した。QBAM画像における個々の生iRPE細胞をセグメント化するためにDNNを作成した(DNN−Sを介して)。12,750個のiRPEから算出された細胞特徴を、手動による正解(ground truth)のセグメンテーションから算出された同じ細胞特徴と比較することによって、DNN−Sセグメンテーションを検証した。DNN−S 対 手動で補正されたセグメンテーションにおいて44個の異なる特徴を比較したところ(下記の表1を参照のこと)、それらの特徴ヒストグラムの間の差は、7.94%±4.42%(平均値±標準偏差)と示され、画素単位で良好に一致した(F−2=0.71)。
表1:44個の形態学的特徴の手動での測定およびDNN−Sセグメンテーションからの%誤差の定量および分布
Figure 2021515586
Figure 2021515586
表1において、%誤差は、ヒストグラム内の各値における数値の絶対差を示す。2標本コルモゴロフ・スミルノフ統計量(KSS)、カーネル最大平均不一致(Kernel Maximum Mean Discrepancy)(KMMD)およびX2値は、分布の違いを評価する3つの異なる方法であり、KSSは、ノンパラメトリック分布において使用され、KMMDは、初期分布に仮定が無く、X2は、正規分布した特徴に対するカイ二乗検定である。
QBAMイメージングおよび生細胞セグメンテーションによって、何百もの細胞画像の特徴の測定が可能になり、iRPEの成熟全体にわたって個々の細胞を非侵襲的に追跡することが可能になる。したがって、訓練されたDNN−Sを用いて、アフィディコリンもしくはHPI−4で処置されたまたは処置されなかった(コントロール)生iRPE(Healthy−1およびHealthy−2ドナー)のQBAM画像をセグメント化した。次いで、RPEの成熟および健康に相関すると知られている以前に公開された細胞画像の特徴および強度メトリクスを有意性について評価した。薬物処置に応じて各iRPE細胞が有した隣接細胞(neighbors)の平均数を観察することによって、HPI4が、すべての時点において有意に少ない(p<0.001)近隣細胞の平均数を有したことがわかった。重要なことに、この手法は、データに対して前例のない階層粒度(hierarchical granularity)を可能にし;ウェル全体の「バルク」組織の測定だけでなく、視野に応じたまたは個々の細胞レベルでの測定も可能にする。RPEの成熟と健康に重要であると知られている2つの特徴である、細胞面積と平均細胞強度に基づいた処置のクラスタリングを行った。SMLを用いて特定されるiRPEの機能に関する新しいメトリクスである細胞の最低強度が、下記でさらに説明される。これらの結果は、(a)個々の細胞の手描きのセグメンテーションに対するDNN−Sセグメンテーションの精度および(b)異なる分子で処置されたiRPE間の差が、別個の細胞特徴を用いて説明され得ることを証明する。
単一細胞画像の特徴はiRPEの成熟および機能を予測できる
5つの異なるSML法(多層パーセプトロン−MLP、線形サポートベクターマシン−L−SVM、ランダムフォレスト−RF、主要(principle)最小二乗回帰−PLSR、およびリッジ回帰−RR)を用いて、QBAM画像の細胞境界セグメンテーションから得られた細胞特徴を使用し、Healthy−2ドナーのiRPEからTERおよびVEGF−Ratioを予測した。MLPのTER予測が、RMSE=84.7Ω・cmおよびR=0.94を有する最も正確なSMLアプローチであることが見出された。400Ω・cmを品質保証または品質管理(QA/QC)閾値として使用して、偽陽性および陰性を判定した。MLPは、94%の精度、100%の感度および90%の特異度を有した。しかしながら、すべてのアルゴリズムの比較から、DNN−Fが、TERの最も正確な予測器であることが示され、MLPのRMSEは、DNN−Fより14.1Ω・cm高かった。VEGF−Ratio予測の場合、ランダムフォレスト(RF)が、最良のSML法であったが、DNN−Fは、RMSEが1.4倍低かった。
細胞の特徴からiRPE単層の機能を予測する利点は、組織レベルの機能を示唆する単一細胞の特性を決定することが可能である点である。各SML法について、細胞の特徴を重要度によってランク付けした。すべてのSMLモデルを比較したとき、どのSML法を用いたかを問わず、TERまたはVEGF−Ratioを予測するための最も重要な特徴に類似性があった。興味深いことに、TERを予測するための重要な細胞画像の特徴は、細胞の強度、テクスチャーおよび形状に広がった。10個の最も重要な特徴のうち、3つが、細胞の形状に関係し(形状)、3つが細胞内の色素強度に関係し(強度)、4つが、RPE内の色素の分布を説明する(テクスチャー)。表2は、どのメトリクスがこれらの特徴を特異的に表しているかの抜粋、ならびに各時点および薬物処置に対するそれらの95%信頼区間を示している。
表2 Healthy−2データをモデル化するための特徴一式のサブセット、ならびにそれらの平均値、95%信頼区間(CI)および標準誤差
Figure 2021515586
まとめると、上記のことは、生細胞セグメンテーション、特徴抽出およびSMLを使用すると、QBAM画像を解析するDNNの予測精度に迫る精度レベルで、組織のTERおよびVEGF−Ratioを予測できることを示している。DNNと比べてSML法の利点は、SMLモデルが、iRPE単層の機能を示唆する別個の細胞特徴を特定できる点であり、それによって、製造者は、細胞治療のリリース基準に対する細胞画像の特徴の信頼区間を導き出すことが可能になる。
機能予測の精度は複数の臨床グレードのAMD患者由来iRPEにわたってロバストである
複数のドナーおよび複数の調製物にわたるロバストネスを決定するために、DNN−FおよびSMLを用いて、8つのiPSCクローンにおいて、3人のAMD患者由来の臨床グレードiRPEのTERおよびVEGF−Ratioを予測した。各AMDドナー由来のiRPEサンプルの吸光度画像および対応するiRPE先端突起のSEM画像によって、iRPEの極性化表現型が確認された。TERおよびVEGF−Ratioならびに他のアッセイによって、単層の成熟を評価した。iRPEの平均QBAM画素値を、完全に成熟したAMD−iRPEについて測定した。健康ドナーと同様に、平均吸光度は、TER(R=0.015を有する)またはVEGF−Ratio(R=0.50を有する)と十分相関しなかった。しかしながら、ランダムフォレスト(RF)モデルは、健康ドナーと同様に、類似の程度の精度(RMSE=70.9Ω・cm、R=0.92を有する)までTERを予測することができた。DNN−Fは、TERをモデル化するためにも使用され、予測値と実測値とが十分相関した(R=0.91を有する)。
上記アプローチのロバストネスを評価するために、AMD−iRPE単層の異なる組み合わせに対してSMLモデルを訓練した。合計18個のユニークな訓練用画像サブセットを形成し、各画像サブセットは、各ドナー由来の1つのiRPEサンプルの画像を有する試験データを含んだ。平均TERのRMSEは、すべてのクローンサブセットにおいて、86.9Ω・cm+/−14.3Ω・cmであった(下記の表5に示されているように)ことから、単一サンプル(Healthy−2)と比べて、より大きなドナーサブセット(8つのAMD−iRPEサンプルを有する)にスケーリングしたときに予測誤差が似ていることが示される。測定値および予測値から、95%信頼区間を構築した。この領域から外れるiRPEは、バイオ製造環境では「規格外れ」とみなされ得、さらなる試験に推奨され得る。
最後に、すべてのドナー/サンプル組み合わせにおいてAMD−iRPE単層のTERおよびVEGF−Ratioを予測するために最も重要な細胞特徴を評価することにより、AMD−iRPEの機能を予測するために使用された特徴がHealthy−2の特徴と似ているかを判定した。興味深いことに、4つの特徴、すなわちZernike n4−l0多項式(形状1)、質量変位(mass displacement)(強度2)、ならびに135°(テクスチャー2)および45°(テクスチャー1)における第3の逆差分モーメントだけしか、これらの2群間で重複しなかった。全体的に見て、臨床グレードのiRPE画像から導かれたモデルは、複数のドナー/サンプルにわたってiRPE表現型を予測することができ、iRPE単層の機能を予測する、複数のドナーで共通する生細胞の細胞画像の特徴を決定することができた。さらに、Healthy−2とAMD−iRPEとの特徴の重要度の違いから、機能を予測するためのドナー特異的特徴と、複数のドナーに共通する特徴の両方が存在し得ることが示唆される。
QBAMを用いたiRPEドナーの発生上のアウトライヤーおよび同一性の分類
QBAM画像を用いることにより、3人のAMD患者由来の8つの臨床グレードのiRPEサンプルにおける細胞画像の特徴に基づいて、任意の発生上のアウトライヤーが存在するかを判定した。発生上のアウトライヤーは、細胞画像の特徴に基づいて他のiRPE単層と異なるiRPE単層と定義され、その単層が適切に発達したかを判定するためのさらなる解析を保証し得る。AMDドナー/サンプル調製のQBAM画像からの細胞画像の特徴に主成分分析を適用した。所与のドナー由来のiRPEは、PCAの階層樹形図において特定されるAMD1クローンA(1A)およびAMD3クローンA(3A)を除いては、細胞画像の特徴に基づいて、互いにうまくクラスターを形成した。クローン1AのiRPEの解析から、開始時のドナー材料と比べて、腫瘍エクソームに894個の変化が示された。クローン3AのiRPEは、「同胞」iRPEより低い色素レベルを有すると見出された。その細胞画像の特徴を解析したとき、これらのiRPEをアウトライヤーと識別する際に、細胞の色素沈着および形状が2つの最も優勢な特徴クラスであると見出された。特徴の完全な説明は、オンラインのデータセットに見られる。
各iRPE単層について、複数のSMLモデルを用いてQBAM画像から細胞ドナーを予測した。加えて、2つの異なるiRPE画像が同じドナーに由来するかを判定するために新しいDNN(DNN−I)を開発した。SMLアルゴリズムは、QBAM画像から得た特徴を入力とし、ドナーの識別を出力とした。それに対して、DNN−Iは、2つのQBAM画像を入力とし、それらの画像を同じまたは異なるドナーに由来するとして分類した。SMLアプローチは、同じドナー由来の他のクローンの画像に対して訓練されたとき、あるドナーの新しいクローンのドナー同一性を分類することはできたが、訓練データに存在しなかった「新しい」ドナーを分類することはできなかった。2つの画像を「同じ」または「同じでない」として2値分類するためのDNN−Iストラテジーは、そのDNN−Iに、訓練中に使用されなかった「新しい」ドナーを分類する能力を与える。線形サポートベクターマシン(L−SVM)は、試験されたすべてのSMLアルゴリズムのうち、最も高い精度を有すると見出され、76.4%の精度(2.3×偶然)、64.6%の感度および82.3%の特異度を有した。すべてのドナー/サンプルの組み合わせにおいて、DNN−Iは、より良い性能であり、85.4%の精度(2.6×偶然)、80.9%の感度および86.8%の特異度を有した。興味深いことに、AMD iRPEを互いと識別するのに重要な細胞画像の特徴は、種々のiRPE組み合わせにおいて似ており、組織の機能および発生上のアウトライヤーを識別するために使用される特徴と異なる特徴からなる。各アプリケーションにおいて使用される上位50個の特徴の間の一般的な差は、以下のとおりであった:形状の特徴は、クローンをアウトライヤーとして識別するのに重要であり(上位50個の特徴のうち23個)、テクスチャーの特徴は、クローンのドナー分類にとって重要であり(上位50個の特徴のうち25個)、形状およびテクスチャーの特徴は、iRPE機能を分類するのに重要であった(上位50個の特徴のうち40個)。
吸光度イメージングの考察
データ入力は、解析の成功にとって極めて重要である。したがって、ここで開発された画像処理パイプラインは、明視野顕微鏡を用いた、再現性のある厳しい吸光度イメージング法から始める。ここで開発されたQBAM技術は、任意の標準的な明視野顕微鏡において実行され得、リアルタイムの自動化された統計的にロバストな方法を用いて、画質および再現性に対して高い信頼度を提供する。生の画素強度ではなく吸光度を用いる利点は、吸光度が光減衰の絶対尺度である点である。生の画素強度は、画像が同じ顕微鏡においてキャプチャーされたときでさえ、画像の比較を困難にする顕微鏡の配置および設定(例えば、不均一な照明、電球の強度およびスペクトル、カメラなど)によって変化し得る。吸光度値に変換することによって、画像の再現性に関する多くの課題が克服される。自動化すること、画素強度を吸光度値に変換すること、吸光度信頼度を算出すること、およびベンチマーキングによって顕微鏡の平衡を確立することの組み合わせによって、QBAMを用いてキャプチャーされた画像データの品質が確保される。
複数の状況においてその測定値を使用できることを確保するために、3つのシステムにおいてQBAMのロバストネスを検証した:(1)合成標準、(2)健康な生物学的サンプル、および(3)iRPE成熟の薬物誘発モデル。QBAM画像の解析は、「既知の」合成標準と一致する吸光度値を示し、健康なRPEと病気のRPEの両方において色素の発生を評価できた。この結果は、複数の顕微鏡またはイメージングの配置における測定のロバストネスも強調する。同じサンプルの異なる顕微鏡測定間の誤差は、VEGF ELISAに対する対照基準における31%および上皮におけるTER測定値に対する100%という平均誤差と比べて、シグナルの4.4%以内であった。これは、細胞療法用製品に対する潜在的なリリースアッセイの場合または薬物スクリーニングプラットフォームにおいて使用されたときのばらつきの1〜2桁の減少に相当する。
QBAMは、光を吸収する細胞型の吸光度の計測に対して最適化される。ゆえに、QBAMは、吸光度を用いるアッセイ(例えば、トリパンブルー染色を用いた生細胞の計数、組織学的染色、または色素性皮膚細胞もしくはニューロメラニンを発現するドーパミン作動性ニューロンなどの光吸収性の生物学的検体の解析)に好適であり得る。透過率値が、好ましい可能性がある場合(例えば、組織学的検査)、その統計量は、再現性のある組織切片画像を生成するように修正され得る。また、この方法は、算出値のいずれもが波長特異的でないので、任意のマルチスペクトルモダリティに一般化できる。最後に、これらの方法は、非色素性細胞の細胞境界および細胞内組織化を特定し得るハイパースペクトル自己蛍光イメージングに好適であり得ると予想される。
iRPE機能の予測の考察
ニューラルネットワークおよび機械学習アルゴリズムを、健康なiRPEならびにiRPEの成熟を阻害すると知られている薬物(HPI4)およびiRPEの成熟を促進すると知られている薬物(アフィディコリン)を使用することによって、あらゆる種類の細胞表現型を用いて訓練した。訓練セットの中に多様な表現型があることによって、アルゴリズムのロバストネスが高まった。さらに、この方法は、2人の異なるドナーに対して、組織の健康に関するエンドポイントアッセイとしてだけでなく、長い成熟期間(約35日間)にわたって組織の発生を追跡するための非侵襲性ツールとしても機能した。重要なことに、TERとVEGF−Ratioの両方の予測におけるこれらのアルゴリズムの精度は、TERとVEGFの両方に対する測定不確実性に近かった。
バイオ製造のためのカットオフ比として、TERについては400Ω・cm、VEGF−Ratioについては3を選択した。しかしながら、200Ω・cm〜1000Ω・cmという範囲のTER値または1〜5という範囲のVEGF−Ratioを評価したとき、同様の精度、感度および特異度が見られたこと、および閾値は製造者の仕様に従って構成されるべきであることに注意することが重要である。本研究において、複数のAMDドナー由来のiRPEの予測誤差と比べて、Healthy−2由来のiRPEに対して、より大きな予測誤差が観察された。このことに対して2つの理由が仮定される:(1)Healthy−2のiRPEは、ポジティブコントロールおよびネガティブコントロールを含めたことに起因して、成熟した健康なiRPE単層を再現性よく製造することを目的にcGMP施設において作製されたAMD−iRPEよりも、TERとVEGF−Ratio値の両方が広範囲であった。(2)AMD−iRPEには、すべてのHealthy−2データならびにAMD−iRPEからの訓練データが含まれていたので、AMD−iRPEは、より大きな訓練用データセットを有した。機械学習では、一般にデータが多いほど、より正確なモデルが得られる;しかしながら、任意のアプリケーションにおけるプラットフォームの実行では、モデルのロバストネスを確保するために、この原理証明研究で提示されたものよりも広範囲の条件(すなわち、より多いドナーおよびポジティブ/ネガティブコントロール)を訓練のために確保することを特別に考慮する必要がある。
予想通り、深層学習は、SMLアプローチと比べて、TERとVEGF−Ratioの両方の予測のRMSEが低かった。しかしながら、SMLアプローチを使用することによって、重要な細胞画像特徴の発見が可能であった。細胞製品の製造者、規制当局、臨床医および/または研究者に2つの動機が認識されたので、これらの2つのアプローチを選択した。動機1:製造現場、臨床の状況またはハイスループットスクリーニングではしばしば、時間が重要な要素であり、明確な「続行/中止」または単純な読み取りが望まれる。これらの場合、最も高い精度を提供し、ノイズに対して最もロバストなアルゴリズムを使用するべきであり、深層学習が、この用途にとって優れたツールである。動機2:研究では頻繁に、機能の根底にある機構に関する洞察が重要である。これらの場合、細胞画像の特徴の重要性を判定できるより判読可能な方法が必要である。この動機の場合には、SMLアプローチの根底にあるアーキテクチャーが、理解できるほど十分単純であり、組織機能の予測に対する要素(ここでは細胞画像の特徴)の重要性を得ることができるので、SMLアプローチが望ましい。
QBAM画像から特徴を抽出することにより、単一細胞レベルとより大きな細胞集団の両方において、細胞の形状、強度およびテクスチャーに基づいて数百の特徴が得られる。これらの特徴の多くが、細胞の機能と意味のある繋がりがない数学的抽象概念である。ゆえに、SMLモデルは、DNNよりも解釈可能なものであり得るが、これらのモデルを構成する特徴は、根底にある生物学に関連付けられない恐れがある。それにもかかわらず、細胞を製造する目的の場合、これらの特徴が何であるかおよび根底にある生物学とそれらがどのように関係しているかは、95%信頼区間を特定できること、およびドナー由来の将来のバッチ/クローンがこの範囲に入るのを確保すること;根底にある生物学との関係性を問わず、SMLモデルにおけるそれらの使用を妥当にすることよりも重要でない。
臨床的に妥当なドナー由来のiRPEの分類およびクラスタリングの考察
現在、移植の直前に細胞療法用製品の同一性および品質を確かめるための臨床に適合した非侵襲性アッセイを開発する極めて重要な必要性がある。この満たされていない必要性に、PCAおよびクラスター解析が貢献し得る。このアプローチまたは類似のクラスタリング法を用いて、将来移植される物と他の技術的複製物(または以前製造に成功したバッチ)との類似性が初めて非侵襲的に評価され得る。さらに、DNN−IまたはL−SVMを用いて行われたその分類作業は、細胞インプラントの製造エラーを検出するためおよびこのインプラントと同じドナー由来の他の複製物との同一性をマッチさせるためのQA/QC工程として役立ち得る。これは、数千の自家治療薬を製造する施設であって各患者への投与物の同一性を確認しなければならない施設において特に重要になる。
発生上のアウトライヤーを識別するための最も重要な特徴のうちの2つは、iRPEの最大強度の標準偏差(強度8)およびゼルニケn5−l3多項式(形状10)であると決定された。その最大強度パラメータの偏差は、AMD3のクローンA由来のiRPEが、AMD3の他のクローン由来のiRPEよりも低い吸光度を有したことを示す吸光度の結果とよく一致する。ゼルニケ多項式は、浸潤性癌細胞の形状を検出するためおよび腫瘍を分類する際に有用であったが、これは、AMD1のクローンA(894個の腫瘍エクソーム変異を有した)と他のAMD−iRPE株との差の検出にとって重大であったと仮定される。このクラスター解析は、癌遺伝子変異の発生をQBAMイメージングだけで明らかにできるという決定的証拠ではないかもしれないが、細胞療法の製造環境において、クラスター解析を用いて個々の治療用複製物をスクリーニングすることにより、さらなる精査を必要とし得るアウトライヤーが存在するかを判定できるかもしれないと提唱される。また、このアッセイは非侵襲性であるので、この情報は、これまでは不可能だった、患者に送達される実際の移植片の品質についてさらなる確信を外科医に提供し得る。
結論として、ここに提示した研究は、QBAMイメージングを用いることにより、健康なおよび病気のiRPEの色素沈着の発生を非侵襲的に評価することができることを示している。DNNは、これらの画像を解析し、10個の異なるiRPE調製物において細胞のTERおよびVEGF−Ratioを正確に予測し得る。加えて、QBAM画像は、DNNが生RPEのRPE境界を正確にセグメント化するのを可能にするのに十分な情報を含む。いったんセグメント化されたら、細胞ごとに数百の特徴を算出することができ、これらの特徴を用いて、細胞の機能を予測でき、アウトライヤーサンプルを特定でき、ドナーの同一性を確かめることができる。この情報のすべてが、自動明視野顕微鏡を用いて、臨床医からの専門的意見を必要とせずにほんの数分で、患者に移植される組織に対して得ることができる。したがって、QBAMは、バイオ製造環境において適用される可能性を有し、製造された数千のRPE単位を非侵襲的に試験し、臨床での使用について技師が適格とできる。
実験モデルおよび被験体の詳細
iRPE細胞の起源および培養
ヒト細胞の起源
すべてのヒト研究に関する採取および処理は、NIHにおいて施設審査委員会が承認したプロトコル#11−E1−0245の下で行った。10人の異なるドナーから得られた合計15個のiRPE細胞株を本論文において使用した。それらのiRPE株は、3つのタイプの患者:健康患者、AMD患者およびOCA患者から得た。健康患者(Healthy−1およびHealthy−2と称される)由来のiRPEは、それぞれiPSC株BEST4CおよびLORDY9から得られた。AMD患者由来のiRPEは、ドナー番号およびクローン番号に従って言及される。例えば、AMD1Aは、AMDドナー#1かつクローンAに由来する細胞を意味する。各ドナーに対する異なるクローンは、複製物であり、各クローンは、iPSC作製からiRPE分化まで完全に再現された。AMDクローンは、以前にSharmaら、Patient−Specific Clinical−Grade iPS Cell−Derived Retinal Pigment Epithelium Patch Rescues Retinal Degeneration in Rodent and Pig Eyes,Sci.Transl.Med.Under Review(2018)において報告された。ドナーごとのクローンの番号の要旨は、以下のとおりである:AMD1は、クローンAおよびクローンBを有し、AMD2は、クローンA、クローンBおよびクローンCを有し、AMD3は、クローンA、クローンBおよびクローンCを有した。OCA患者(白皮症患者とも称される)から得られたiRPEは、5人の異なる患者(それぞれ単一のクローン)に由来し、OCA8、OCA26、OCA103、OCA9およびOCA71によって示される。各ドナーの年齢および性別ならびに重要な供給源に関する情報の詳細を表3に提供する。
表3 重要な供給源
Figure 2021515586
細胞培養の条件および培地
すべての細胞を、37℃および5%CO2の細胞培養恒温器において培養した。細胞の発生段階に応じて、異なる細胞培地を使用した。使用した異なる細胞培地としては、以下が挙げられる:
1%(質量/体積)N−2(Thermo Fisher,A13707−01)、1×B−27(Thermo Fisher,17504−044)、10μmol/LMのLDN−193189(Stemgent,04−0074−10)、10nmol/LのSB431452(R&D Systems,1614)、0.5μmol/LのCKI−7二塩酸塩(Sigma Aldrich,C0742−5mg)および1ng/mlのIGF−1(R&D Systems,291−GMP−5.5ug)が補充された、DMEM/F−12(Thermo Fisher,11330−032)、KOSR(CTS KnockOut SR XenoFree Kit,Thermo Fisher,A1099201)である、神経外胚葉誘導培地(NEIM)。
1%N−2(Thermo Fisher,A13707−01)、1×B−27(Thermo Fisher,17504−044)、100μmol/LのLDN−193189(Stemgent,04−0074−10)、100nmol/LのSB431452(R&D Systems,1614)、5μmol/LのCKI−7二塩酸塩(Sigma Aldrich,C0742−5mg)、10ng/mlのIGF−1(R&D Systems,291−GMP−5.5ug)および1μmol/LのPD0325901(Stemgent 04−0006)が補充された、DMEM/F−12(Thermo Fisher,11330−032)、KOSR(Thermo Fisher,A1099201)である、RPE誘導培地(RPEIM)。
1%N−2(Thermo Fisher,A13707−01)、1×B−27(Thermo Fisher,17504−044)、ニコチンアミド(nicotinamde)10mmol/L(Sigma Aldrich,PHR1033−1G)およびアクチビンA 100ng/ml(R&D Systems,AFL338)が補充された、DMEM/F−12()、KOSR(Thermo Fisher,A1099201)である、RPEコミットメント培地(RPECM)。
1%N−2(Thermo Fisher,A13707−01)、1%(質量/体積)グルタミン(GlutaMAX Supplement,Thermo Fisher,35050−061)、1%(質量/体積)非必須アミノ酸(MEM非必須アミノ酸溶液(100×),Thermo Fisher,11140−050)、0.25mg/mlタウリン(Sigma Aldrich,PHR1109−1G)、20ng/mlヒドロコルチゾン(50μmol/L溶液,Sigma Aldrich,H−6909)、13pg/mlトリヨードチロニン(Sigma Aldrich,T5516)、5%(体積/体積)FBS(ウシ胎仔血清,GE Healthcare/Hyclone,SH30071.03)が補充されたMEMα(Thermo Fisher,12571−063)である、RPE増殖培地(RPEGM)。
1%(質量/体積)N−2(Thermo Fisher,A13707−01)、1%(質量/体積)グルタミン(Thermo Fisher,35050−061)、1%(質量/体積)非必須アミノ酸(Thermo Fisher,11140−050)、0.25mg/mlタウリン(Sigma Aldrich,PHR1109−1G)、10ng/mlヒドロコルチゾン(Sigma Aldrich,H−6909)、13pg/mlトリヨードチロニン(yriiodo−thyronin)(Sigma Aldrich,T5516)、5%(体積/体積)FBS(GE Healthcare/Hyclone,SH30071.03)、50uM PGE2(プロスタグランジンE2,R&D Systems,2296)が補充されたMEMα(Thermo Fisher,12571−063)である、RPE成熟培地(RPEMM)。
ヒトiRPEの形質転換および分化
すべてのiRPEを、以前に概説された臨床グレードプロトコル(Sharmaら、2018)を用いて発生させた。簡潔には、以前に公開されたプロトコル(Mackら、Generation of Induced Pluripotent Stem Cells from CD34+Cells across Blood Drawn from Multiple Donors with Non−Integrating Episomal Vectors,W.B.(2011))を用いて、iPSCクローンをCD34+PBMCから得た。次いで、iPSC細胞を、5ug/mlビトロネクチン(ThermoFisher,A14701S)でコーティングされた、E8培地(Essential 8 Medium,ThermoFisher,A1517001)を含む組織培養プレート(Thermo Sci.,140675)またはT75フラスコ(Corning,430641U)に播種した。2日後、細胞培地を10日間、RPEIMに交換し、次いで、さらに10日間、RPECMに交換した。22日目に、細胞培地をRPEGMに切り替えた。27日目に、ヴェルセン溶液(1リットルのリン酸緩衝食塩水あたり0.2gのEDTA(エチレンジアミン四酢酸),Thermo Fisher,15040−066)を用いて細胞を分離し、RPEGMを含む新しい培養プレート(Thermo Sci.,140675)またはT75フラスコ(Corning,430641U)に再度播種した。42日目に、CTS TrypLE Select Enzyme(Thermo Fisher,A12859−01)を用いて細胞を分離し、生分解性ナノ繊維足場[Stellenbosch Nanofiber Company,FiberScaff−RPETM 3D細胞培養足場](AMD株)または12ウェルの0.4μmポリカーボネートトランスウェルプレート(Corning,3401)(Healthy株およびOCA株)に500,000細胞/mlで再度播種し、RPEMMを用いて培養した。42日目に播種したRPEを時間0のiRPEであるとみなし、本文書に概説される実験における薬物処置、イメージング、アッセイ用採取などに対するすべてのタイミングをこの日からカウントした。
方法の詳細
定量的明視野吸光度顕微鏡法
基本的な原則
QBAMイメージングの背景にある基本原理は、吸光度測定値であって、これは、方程式1に記載されるような光減衰の絶対測定値である。
Figure 2021515586
Aは、波長Aにおける吸光度値であり、I(λ)は、サンプルを通過する光の強度であり、I(λ)は、サンプルが存在しない場合の光の強度である。本研究においてなぜ吸光度が興味深いかという理由の1つは、ランベルト・ベールの法則が、方程式2に示されるような吸光度と化学的濃度との関係性を確立しているからであった:
Figure 2021515586
Cは、サンプル中の化学的濃度であり、εは、モル減衰係数であり、ιは、光線束のパス長である。網膜色素上皮細胞(RPE)の場合、それらが成熟するにつれて、健康なRPEによってメラニンが産生される。ゆえに、吸光度の倍加は、細胞内のメラニン量の倍加を示唆し得る。RPEの画像における画素値を吸光度値に変換することによって、画像が、経時的かつ非侵襲的に追跡できるメラニン濃度マップになる。メラニン濃度との関係性に加えて、吸光度イメージングを用いることにはいくつかの利点があったが、最も重要なのは、再現性であった。吸光度値の算出には、配置が異なる顕微鏡間でも値を比較できるようにする内部基準が必要である。QBAMイメージングを用いて、サンプルの画像における各画素の強度(I(λ))を、サンプルが存在しない場合にキャプチャーされた画像における対応する画素(I(λ))で除算することによって、各画素値を吸光度値に変換した。たいていの測定と同様に、再現性を確保するために、測定する際に考慮するべき因子がいくつか存在する。QBAMイメージングは、ベンチマーキング、内部較正およびリアルタイム統計をはじめとした種々の手順を通じて、誤差の原因の一部を軽減する。
画素レベルの吸光度の算出
QBAMイメージングの場合、各画素において吸光度を算出するためには、3つの異なる画像が必要であった:i)露光時間εにおいて光シャッターを閉じた状態でキャプチャーされた画像(IDark(λ))、ii)露光時間εにおいて視野にサンプルを含まず光シャッターを開けた状態でキャプチャーされた画像(IBright(λ))、およびiii)サンプルの画像(I(λ))。方程式1に関して、(IBright(λ))は、ブランク参照画像(I(λ))であったが、方程式3に記載されるように、カメラのバイアスおよび読み出し電流を説明するために(IDark(λ))に対してさらなる項を含める必要があった:
Figure 2021515586
下付き文字iおよびjは、各画像のi番目の行およびj番目の列における画素の位置を示している。透過率(このlog関数の中の項)の算出は、Young,2001が報告した事前のバックグラウンド補正法であることに注意されたい(Young,Shading correction:compensation for illumination and sensor inhomogeneities.Curr.Protoc.Cytom.Chapter 2,Unit 2.11,(2001))。これは、画素レベルの吸光度の算出が、不均一な照明を本質的に補正し、QBAMイメージングを顕微鏡の配置間でロバストなものにする1つの因子であったことを意味する。
画素レベルの信頼区間の算出
方程式3によると、吸光度を算出するために測定された3つの異なる測定値があり、各々にそれ自体の潜在的な誤差の原因があった。画素レベルの吸光度測定値の再現性を改善するために、QBAMイメージング法は、統計量を用いて、各画素における吸光度値に対して信頼区間を算出する。これらの統計学的方法の目標は、各画素における吸光度値が0.01吸光度単位(10mAU)という95%信頼区間を有することを確かめるのに十分な画像データをキャプチャーすることであった。これは、QBAMのダイナミックレンジの下端が10mAUになることを意味する。
吸光度値の標準偏差を方程式4に従って算出した:
Figure 2021515586
方程式4において、σA(λ)i,jは、位置(i,j)における吸光度値の標準偏差である。σI(λ)i,jおよびσIBright(λ)i,jは、それぞれ、サンプル画像内の位置(i,j)における画素に対する画素強度値I(λ)i,jの標準偏差、および明参照画像内の位置(i,j)における画素に対する画素強度値IBright(λ)i,jの標準偏差を示している。方程式4は、不確実性の伝播を用いて導出されたが、この導出について2つのことに注意するべきである。第1に、I(λ)i,jとIBright(λ)i,jとは相関しないと仮定した。これは、実験によって検証されなかったが、これらの変数が相関した場合、さらなる項が方程式4から減算され、それは、吸光度の標準偏差がこの式によって過大評価されていたことを意味する。第2に、暗参照画像の標準偏差が、吸光度の標準偏差の1%未満しか占めなかったので、暗参照画像IDark(λ)によって持ち込まれる誤差を無視した。
吸光度測定の再現性を確保するために、画素の吸光度値が0.01吸光度単位という95%信頼区間を有するように、画素の算出に基準を設けた。方程式5に示されるように正規分布をとると仮定する。
Figure 2021515586
式中、nは、I(λ)i,jに対してキャプチャーされた画像の数である。nが、単にサンプルのキャプチャーされた画像であり、IBrightのキャプチャーされた画像の数を含まないので、方程式5の右辺は、信頼区間の過大評価を表すことに注意されたい。
カラーフィルターによる色収差の軽減
異なる透過光学顕微鏡間の画像を比較するとき、画像が異なるように見える理由の1つは、光スペクトルである。光スペクトルがどのようにして生成されるのか、光学部品を用いてどのように操作されるのか、および顕微鏡においてどのように収集されるのかに関するあらゆることが、顕微鏡ごとに異なり得る。例えば、異なる光源は、経年数および温度に伴って変化し得る異なる光スペクトルを発し、異なる対物レンズは、色収差を異なって補正し、異なるカメラは、異なる波長の光に対して異なる感度を有する。吸光度測定は、単一の顕微鏡配置に対する光源のスペクトル発光およびカメラのスペクトル感度に関連する問題を軽減し得るが、色フィルターは、イメージングのセッション間および顕微鏡間で再現性のあるものである必要がある。本研究の場合、固定されたRPE(AMDおよびOCA細胞)の画像は、3つの異なる色フィルター:405nm(ET405/10x,Chroma,Bellows Falls,VT)、548nm(ET548/10x,Chroma,Bellows Falls,VT)および640nm(ET640/20x,Chroma,Bellows Falls,VT)を用いてZeiss AxioImager M2顕微鏡においてキャプチャーされた。生RPE(Healthy−2細胞)の画像は、3つの異なる色フィルター:461nm(FF01−461/5−25,Semrock,Rochester,NY)、541nm(FF01−541/3−25,Semrock,Rochester,NY)および671nm(FF01−671/3−25,Semrock,Rochester,NY)を用いてZeiss AxioObserver Z1においてキャプチャーした。
顕微鏡のベンチマーキングおよびブランク画像のキャプチャー
ベンチマーキングの目的は、顕微鏡画像の画素強度が照明の変化に直接的に反応するかを判定することである。QBAMイメージングの場合、露光時間の倍加は、画素強度を2倍にするはずであるので、カメラの露光時間を変化させると画素強度がどのように変化するかを見出すことによって、その判定が達成される。
ベンチマーキングプロトコルは、以下の量を算出する:露光時間の関数としての画素強度、平均画素強度の関数としての画素強度の分散、最適な露光時間、および最小許容画素強度。これらの量およびそれらの算出は、下記に詳細に記載される。画像の特性が波長に対して変化し得るので、このベンチマーキングプロトコルは、各画像フィルターに対して用いられる。
ベンチマーキングプロトコルの第1の工程は、種々の露光時間において、カメラのシャッターを閉じた状態および開けた状態で画像をキャプチャーする工程を含む。画像をキャプチャーする前に、各露光時間においてキャプチャーされる画像の数nをユーザーが定義した。次いで、カメラのシャッターを閉じ、1ms、2ms、4msなどにおいて1024msまで、n個の画像をキャプチャーし、すべての画像を品質管理のために保存した。次いで、カメラのシャッターを開け、n個の画像を1ms、2msおよび4msにおいてキャプチャーした。1つの露光時間においてキャプチャーされた各画像セットに対して、各画素に対して画素強度の平均および標準偏差を算出した。次いで、露光時間を2倍にし、n個の画像をキャプチャーし、各画素に対して平均および標準偏差を算出し、このプロセスを、画像が露出過度になるまで繰り返した。特定の露光時間における露出過度を、以下によって判定した。
Figure 2021515586
式中、σ I(λ,ε)i,jは、波長λおよび露光時間2εmsにおいてキャプチャーされた画素(i,j)における強度の分散であり、I*Jは、当該画像における画素の総数である。露出過度は、カメラの最大画素強度値に達することによって定義されるので、露出過度の画素の標準偏差は、0となる。ゆえに、露光時間2εにおいてキャプチャーされた画像が、先の露光時間2ε−1においてキャプチャーされた画像よりもばらつきが少ないとき、方程式6は、満たされる。しかしながら、標準偏差が、方程式6の露出過度の基準に適合しないまま、最大画素強度値より早く低下し得るので(フルウェルキャパシティに達した場合)、これは、露出過度についての大ざっぱな試験である。電荷結合素子(CCD)の場合、画素強度はポアソン分布に従うと知られているので、画素強度に基づいて標準偏差を推定する関数を、方程式7に示されるように作成した:
Figure 2021515586
式中、σλ(p)は、波長λにおける画素強度pに対する画素強度の標準偏差であり、αおよびβは、1ms、2msおよび4msにおいてキャプチャーされた画像における標準偏差に対する平均画素強度の線形回帰から算出されるパラメータであった。
次いで、線形回帰を行うことにより、露光時間に伴ってどれくらい画素強度が変化するかを求めた。露出過度の画像をもたらしたカメラ露光時間を線形回帰から除外し、ある露光時間においてキャプチャーされた画像が方程式7に関して5%超の誤差を有した場合、その画像を露出過度として分類した。露光時間に対する画素強度の線形回帰に従って、理想的な露光時間を、以下のような方程式8において算出した:
Figure 2021515586
式中、ελは、理想的な露光時間であり、pは、最大カメラ画素ビット深度であり、σλ(p)は、標準偏差推定値(方程式7から)であり、aおよびbは、露光時間に対する画素強度の線形回帰の傾きおよび切片であった。理想的な露光時間は、平均露光時間が、最大可能画素強度より3標準偏差低くなるはずの時間であり、これにより、個々の露出過度の画素の数が最小になる時間である。
いったん理想的な露光時間が明らかになると、IBrightを得るためにキャプチャーし、平均すべき画像の数が、方程式7の標準偏差推定関数を用いる方程式9を用いて算出された:
Figure 2021515586
式中、nBrightは、理想的な露光における画素強度pεに対してEという95%信頼区間を有するのに必要な画像の数である。本研究の場合、Eを2画素強度単位に設定し、これは、本研究において用いられた12ビットカメラの場合の約0.05%誤差に相当した。E=2に設定することにより、方程式9のnBright≒σλ(pεという近似が可能になるが、この近似は、ビット深度が異なるカメラに対しては用いられるべきでない。
吸光度を正確に算出するための最小画素強度min)を求めた。吸光度は、対数スケールの関数であり、IBrightと比べて低い画素強度は、それより高い画素強度よりも、かなり大きな誤差を有し得る。生細胞イメージング中、ある画像内の任意の画素が、最小画素強度より小さい値を有した場合、その画素の吸光度値が0.01未満の95%CIを有しない可能性が高い。下記の方程式10は、方程式7および方程式4を用いて、方程式5を満たす最小の画素強度値を推定する:
Figure 2021515586
生細胞イメージング中に最小画素強度値を用いることにより、方程式5を満たすように画像をキャプチャーする方法を調整する。
顕微鏡平衡の評価
QBAMイメージングに使用する顕微鏡を、同じ視野においてばらつきがほとんどない画像をキャプチャーできるように平衡にする。複数の因子によって、同じ視野において撮影された画像が、1つの画像キャプチャーから次の画像キャプチャーにどのように変わり得るか(例えば、電球が熱くなるのに伴う電球の強度の変化、または使用することによってカメラが熱くなるのに伴うカメラの感度の変化)が変化し得る。画像が繰り返しキャプチャーされる場合、顕微鏡は、連続した画像がそれらの間のばらつきが最低限になる平衡状態に達しているべきである。上に記載されたベンチマーキング法を用いることにより、顕微鏡が平衡に達したときに計測される平衡メトリクスを作成した。その平衡メトリクスを方程式11に示す:
Figure 2021515586
式中、Eは、平衡メトリクスであり、aは、ベンチマーキングの項に記載された露光時間に対する画素強度の線形回帰から得られる傾きであり、
Figure 2021515586
は、この線形回帰およびそれより前の6つの線形回帰の傾きの平均である。方程式11は、露光時間の関数としての画素強度の傾きが、露光時間の変化に応じた画素強度のゆらぎを加味するために使用されることを除いては、吸光度に対する方程式(方程式1)に似ている。平衡メトリクスEは、顕微鏡が平衡であるときは0に近い値、および顕微鏡が平衡でない場合は0より大きいまたは小さい値を有するはずである。顕微鏡が平衡であることを確保するために、Eを少なくとも7回算出し、個々のE値が10−4より大きくない状態で、E値の絶対平均値が510−5未満であった場合、顕微鏡を平衡であると判断した。最初の7つのE値が、その平衡基準を満たさない場合、それより古いE値を破棄し、ベンチマーキングプロトコルを再度行った後に、新しいE値を算出する。最新の7つのE値が平衡基準を満たすまで、このプロセスを繰り返す。これらの平衡基準は、顕微鏡を30分間から1時間オンにした後の顕微鏡に対してのみ満たされることが見出された。このプロトコルを生RPEのイメージングセッションの前に毎回行うことにより、使用する顕微鏡が平衡であることを確保した。
サンプルのイメージングおよび吸光度の算出
顕微鏡が平衡であることを確保した後、顕微鏡をベンチマークし、参照画像をキャプチャーし(IBrightおよびIDark)、そしてサンプルを画像化する。サンプルの各視野に対して、n個の画像をキャプチャーし、平均した。明参照画像は常に、サンプルを調製した同じ媒質に対して顕微鏡の焦点を合わせて、キャプチャーされた。顕微鏡用スライドにマウントされた固定された細胞サンプルの場合、顕微鏡ガラスのブランク区画に対して焦点を合わせて明参照画像をキャプチャーした。生細胞イメージングの場合、同じ体積の、細胞を培養した培地を含むウェルにおいて明参照画像をキャプチャーした。任意の画素値の平均が、ベンチマーキング中に算出される最小画素値pmin未満であった場合、理想的な露光時間を倍加し、さらなるn個の画像をキャプチャーし、平均した。露光時間を倍加し、さらなる画像をキャプチャーするこのプロセスを、平均された画像におけるすべての画素がpminより大きくなるまで繰り返した。各露光時間においてキャプチャーされたすべての画像を保存し、測定の信頼度を高めるために画素から吸光度値に変換する際に用いた。
各視野に対する吸光度を算出するために、方程式3を、I(λ)i,jに使用されたn個の画像の平均値とともに用いた。I(λ)i,j<pminの場合、より長い露光時間においてキャプチャーされた画像を使用し、画素強度を露光時間の増加倍率で除算することによって、その画素における吸光度を算出した。画素強度は、ポアソン分布に従うので、画素強度を露光時間の増加倍率で除算することにより、同じだけ標準偏差は小さくなり、信頼区間がより狭くなる。
iRPEの培養、アッセイおよびイメージング
免疫染色
免疫組織化学に向けた組織の調製を、ウェルに4%(質量/体積)パラホルムアルデヒド(Electron Microscopy Science,157−4−100)を20分間入れることによって行った。免疫組織化学ブロッキング液(IBS)は、500mlの1×DPBS(ダルベッコリン酸緩衝食塩水,Life Technologies,14190250)、5%(質量/体積)ウシ血清アルブミン(Sigma Aldrich,A3311)、0.5%(質量/体積)Triton(登録商標) X−100(Sigma Aldrich,X100−100ML)および0.5%(質量/体積)TWEEN(登録商標)20(Sigma Aldrich,P2287−100ML)からなった。固定された細胞をIBSで3回洗浄し、室温において2時間、IBSで透過処理した。次いで、細胞を、室温において1時間、以下の1次抗体で染色した:RPE65(抗RPE65モノクローナル抗体[1:300,Abcam,ab13826)、エズリン(モノクローナル抗エズリン抗体,1:100,Sigma Aldrich,E8897)またはGT335(抗ポリグルタミル化修飾モノクローナル抗体,1:1000,Adipogen,AG−20B−0020)。1次染色の後、サンプルをIBSで洗浄し、ヤギ抗マウスIgG Alexa Fluor 594二次抗体(1:300,Thermo Fisher,A−11032)を加え、4℃で一晩インキュベートした。すべての抗体をIBS溶液で希釈した。一晩のインキュベーションの後、サンプルをIBSで洗浄し、抗ZO−1 Alexa Fluor 488マウスモノクローナル抗体(1:200,Thermo Fisher,339188)を加え、室温において1時間インキュベートした。加えて、核をHoechst 33342色素(1:1000,Thermo Fisher,H3570)で室温において15分間染色した。染色の後、細胞をD−PBS(ダルベッコリン酸緩衝食塩水,Life Technologies,14190250)で洗浄し、スライドにマウントした。すべての画像を、Zeiss AxioImager M2顕微鏡またはZeiss Axio Scan Z1スライドスキャナーを用いてキャプチャーした。Zスタックを、z方向に沿って1.5μm刻みで50μmにわたって取得し、すべての解析に最大強度投影法を用いた。
VEGFのELISA定量
各ウェルから毎週回収した上清から血管内皮成長因子(VEGF)を測定した。各時間における各処置に対して少なくとも5ウェル反復を選択し、1ウェルあたり3技術的反復を測定した。シングルプレックスLuminex(登録商標)マルチプレックスELISAを製造者のプロトコル(R&D Systems)に従って用いて、ELISAを行った。
電気生理学的測定
iRPE単層の予測のために用いる電気抵抗測定値を、EVOM2およびEndOhmチャンバー(World Precision Instruments,それぞれEVOM2およびENDOHM−12)を用いて測定した。各株を、その抵抗について1週間につき1処置あたり12ウェルにおいて測定した。1mMカリウム(Sigma Aldrich,P5405−1KG)および100μM ATP(Sigma Aldrich,A9187−500MG)のときの細胞内の経上皮電位および抵抗の測定を、以前の報告(Miyagishimaら、In Pursuit of Authenticity:Induced Pluripotent Stem Cell−Derived Retinal Pigment Epithelium for Clinical Applications,STEM CELLS Transl.Med.5,1562−1574(2016))の測定と同様に行った。簡潔には、iPSC株由来のRPE単層培養物を、以前に報告されたように、改変された「Ussing」チャンバーにマウントした(Maminishkisら、The P2Y2 Receptor Agonist INS37217 Stimulates RPE Fluid Transport In Vitro and Retinal Reattachment,Rat.Invest.Ophthalmol.Vis.Sci.43,3555−3566(2002);Petersonら、Extracellular ATP Activates Calcium Signaling,Ion,and Fluid Transport in Retinal Pigment Epithelium,J.Neurosci.17,2324−2337(1997))。カロメル電極をリンガー液および寒天橋と直列で用いて、経上皮電位(TEP)を測定した。細胞内の微小電極からのシグナルを、基底槽(basal bath)を基準にして、側底膜電位(V)を測定し、頂端膜電位(V)を、方程式:V=V−TEPによって算出した。2〜4mAの電流パルスを組織に通し、生じるTEP、VおよびVの変化を測定することによって、全経上皮抵抗(R)および頂端膜抵抗と側底膜抵抗との比(R/R)を得た。
iRPEの遺伝子発現
全RNAを、NucleoSpin RNA(Machery−Nagel,740955)を製造者のプロトコルに従って用いて単離した。RNAを、ND−1000分光光度計(Nanodrop Technologies)および製造者のプロトコルを用いて定量した。cDNA合成を、Script cDNA Synthesis Kit(Bio−Rad,1708891)および製造者が提供するプロトコルを用いて行った。以下の遺伝子:MITF、PAX6、BEST1、CLDN19、PMEL、TYR、OCA2、RPE65、RLBP1ならびにハウスキーピング遺伝子RPL13AおよびB2Mに対するプライマーを含む特注の遺伝子アレイをBio−radから購入した。EXPRESS One−Step SYBR GreenER Kitを製造者のプロトコルに従って予混合ROX(Thermo Fisher,1179001K)とともに使用してSybr greenに基づくQPCRをViiA 7 Real−Time PCR System(Thermo Fisher Scientific)において行った。各サンプルを、3つ組の技術的反復で少なくとも2つの独立したウェルにおいて実験した(2×HPI4、3×アフィディコリンおよび5×コントロール)。HPI4のウェルは、RNA抽出量が極端に少なく、測定のために増幅されるcDNAが不十分な量であったことに起因して、そのウェルから除外されなければならなかった。各ウェルに対するハウスキーピング遺伝子のCTの平均を用いて、プロットされる−ΔCT値を求めた。データを、Rソフトウェア(R Development Core Team,2011)を用いて解析した。
iRPEの電子顕微鏡法
成熟したiRPE単層を、10%(質量/体積)グルタルアルデヒド(Electron Microscopy Sciences,16120)で一晩固定した。次いで、サンプルをD−PBSで3回洗浄し、25%(質量/体積)エタノールに10分間浸漬した。次いで、サンプルを取り出し、50%、75%、90%、95%および100%エタノールの溶液にそれぞれ10分間、連続して入れた。100%エタノールへの浸漬(emersion)の後、サンプルを取り出し、臨界点乾燥機(Leica EM CPD300)に入れ、製造者のプロトコルに従って赤血球に対して処理した。CPD処理の後、サンプルを10nmの金で金スパッタコーティングし、Zeiss EVO 10走査型電子顕微鏡を10kVの電圧および10μAのアンペア数で用いて画像化した。
薬物処置およびイメージング
分化の後、Healthy−1およびHealthy−2ドナー由来のiRPEを、12ウェルの0.4μmポリカーボネートトランスウェルプレート(Corning,3401)に、0.5ml中に500,000細胞/mlという播種密度で播種した。12ウェルのうちの6ウェルだけを用いることにより、イメージング中に恒温器の外側で過ごす時間を最小限に抑えた。QBAMイメージングおよび薬物処置は、Healthy−1およびHealthy−2のiRPEの播種のそれぞれ2または1週間後に開始した。各培養プレートに対して、6ウェルのうち2ウェルを、3.0μmol/Lアフィディコリン(Sigma Aldrich,A0781−10MG)もしくは30.0μM HPI4(ヘッジホッグ経路阻害剤4,Sigma Aldrich,H4541−25MG)で処置したか、またはRPEMM培養液への添加物なしで処置した。RPEMMを1週間に3回交換し、培地交換の直後に毎週同じ日に画像化した。室温の培地は凝結を最小限に抑えたので、イメージング中に培養プレートの蓋が曇らないようにするために、イメージングの直前にウェル内の培養液を室温のRPEMM(必要に応じて薬物を含む)と交換した。QBAMイメージング用の明参照画像をキャプチャーするために、薬物を含まないRPEMMを、細胞を含まないウェルに加えた。各ウェルについて、画像スティッチングのために、4×3グリッドの重複画像を、Zeiss AxioImager M2顕微鏡を10×対物レンズとともに用いて、キャプチャーした(10〜15%の画像重複)。Healthy−2およびHealthy−1の場合、合計6枚のプレートを調製し、各プレートにおいて6ウェルが占められたことから、合計36ウェルを画像化し、解析した。AMDサンプル由来のiRPEは、Sharmaらによって以前に報告され(Sharmaら、2018)、OCAドナー由来のiRPEは、上に記載されたように培養されたが、それらが成熟し、PFAで固定された後だけ画像化された。OCA8の合計5ウェル反復、OCA9の6反復、OCA26の4反復、OCA71の8反復およびOCA103の4反復を画像化した。AMDデータの場合、AMD1クローンAの1反復、AMD1クローンBの5反復、AMD2クローンAの1反復、AMD2クローンBの5反復、AMD2クローンCの1反復、AMD3クローンAの1反復、AMD3クローンBの5反復、およびAMD3クローンCの1反復を画像化した。
Healthy−2ドナーから画像化されたiRPEの場合、3枚の色フィルターを用いて画像をキャプチャーしたが、Healthy−1は、異なるフィルターセットを用いて画像化した。Healthy−1を画像化するために用いたフィルターは、より広い帯域幅の光が通過するのを可能にするフィルターであったことから、露光時間が短くなるという利点、およびその結果として、イメージング細胞が恒温器の外側で過ごす時間が短くなるという利点を有した。iRPE成熟がイメージングによる悪影響を受けないことを確保するために、まずは広帯域のフィルターを用いてHealthy−1を画像化した。Healthy−1のiRPE成熟がQBAMイメージングによる悪影響を受けないことが証明されたら、光帯域幅が狭いフィルターをHealthy−2細胞のイメージングに使用した。上記のすべての画像を、Zeiss AxioImager M2顕微鏡を用いて取得した。
アッセイのディープニューラルネットワーク予測
ネットワークのアーキテクチャーおよび訓練
ディープ畳み込みニューラルネットワーク(DNN−F)を、経上皮抵抗(TER)およびVEGF−Ratioを予測するようにデザインした。このネットワークの基本構造は、一連の予備的な畳み込み層に続いて、そのネットワークのより深くにあるインセプション層からなった(Szegedyら、Going Deeper with Convolutions,ArXiv14094842 Cs(2014))。このネットワークは、1024×1024×3画像を入力とし、2つの値:TERおよびVEGF−Ratio値を出力として生成する。このネットワークを、まずTER値を予測するように訓練し、次いで、このネットワークの終わりにVEGF−Ratio予測層を追加した。入力として用いられた3チャンネル画像は、異なる波長(488nm、561nmおよび633nm)においてキャプチャーされた3つのQBAM画像から構成された。このネットワークは、およそ1100万個のパラメータを有した。
訓練の前に、細胞の測定値をスケーリングし、重み付けることにより、DNN−Fの予測能力を改善した。TER測定値を1000で除算し、VEGF−Ratio測定値を10で除算することにより、訓練に向けてそれらの値を0〜1の範囲に大まかにスケーリングした。訓練が始まったら、すべての画像に等しい重みを与えたが、訓練の後期に、その画像に関連するTER値に基づいて各画像に重みを与えた。100Ohmの範囲を有するビンにTER値をビニングすることによって重みを生成したが、ただし、最小のビンは0〜135Ohmの範囲のTER値を含んだ。次いで、TER測定値の総数を各ビンにおける測定値の数で除算することによって、重みを割り当てた。訓練が進むにつれて、すべての重みが1という値を有するまで、重みを漸減した。
訓練のために、平均平方誤差(MSE)回帰を目的関数とした。標準的な確率勾配降下を一定の学習率で用いた。画像をそのネットワークにフィードする前に画像のランダムクロッピング以外の画像の前処理を行わなかった。各画像は、1040×1388画素であり、訓練データにおける画像は、ネットワークにフィードする直前にランダムにクロップし、試験データは、毎回同じ位置でクロップした。1枚の培養プレートを試験データとして割り当てることによって試験データおよび訓練用データを作成し、残りのプレートを訓練用データとして使用した(1プレートあたり各処置の2反復;アフィディコリン、HPI4、コントロール)。試験セットにおける最も低いMSEを用いてネットワークを見つけ出すことによって、最良のネットワークを決定した。
蛍光画像セグメンテーション
ディープ畳み込みニューラルネットワークを、タイトジャンクションタンパク質(ZO−1)について蛍光標識されたRPEをセグメント化するようにデザインし、これにより、細胞境界が強調表示され、正確な細胞セグメンテーションが可能になる。QBAM画像における細胞境界は、RPEの蛍光画像よりもコントラストが低く、細胞境界を手作業でセグメント化することは難しいので、上記の目的は、高度に正確なセグメンテーション方法を手に入れて、QBAMに対して正解の細胞境界ラベルを生成することであった。このアプローチは、1)対応する画像(ここで、その細胞境界は熟練技師によって描かれた)を用いてZO−1蛍光像における細胞境界をセグメント化するようにDNN(DNN−Z)を訓練すること、2)QBAM画像、およびZO−1に対して蛍光染色されたRPEの蛍光画像を収集すること、3)DNN−Zを使用し、ZO−1蛍光像を用いて細胞境界をセグメント化すること、および4)ZO−1セグメンテーションを使用して、QBAM画像における細胞をセグメント化するように新しいDNN(DNN−S)を訓練することであった。
ヒトおよびマウスのデータ
細胞タイトジャンクションタンパク質zonula occluden−1(ZO−1)に対して標識された網膜色素上皮(RPE)細胞の画像を、種々のヒトドナーから種々の条件下において収集した。ヒトRPEを人工多能性幹細胞から誘導し(iRPE)、iRPEを健康なヒトドナーまたは2つの異なる疾患表現型:眼皮膚白皮症(OCA)または加齢黄斑変性症(AMD)のうちの1つを有するヒトドナーから得た。iRPEの画像は、合計で10人の異なるヒトドナーに由来した。すべてのiRPEを、少なくとも6週間成熟させ、パラホルムアルデヒドで固定し、ZO−1に対して標識し、顕微鏡用スライドにマウントした後、画像化した。画像は、3つの異なる顕微鏡において10×〜40×の範囲の拡大率でキャプチャーした。そのヒトデータに、John Nickersonの研究室の厚意により提供された、細胞境界について標識され、ZO−1で標識された成体マウス網膜全体の画像をさらに追加した。
参照セグメンテーション画像および後処理
多くのセグメンテーション方法のうち、FogBankアルゴリズム(Chalfounら、FogBank:a single cell segmentation across multiple cell lines and image modalities,BMC Bioinformatics 15,431(2014))を、蛍光標識された各画像をセグメント化するために選択した。FogBankアルゴリズムは、強度分布から得られた閾値化を輪郭の測地距離マップと組み合わせて使用してRPE細胞の領域を規定する。FogBankセグメンテーションの結果は、ヒト被験体によってレビューされ、補正されることにより、正解のセグメンテーションデータを得た。その正解のデータを作成した後、画像を256×256タイルに分割して、256×256画素のサイズの4,064個の画像を得た。
RPEセグメンテーションのためのディープ畳み込みニューラルネットワークのアーキテクチャーおよび訓練
教師つきのDNNベースセグメンテーションアルゴリズムを、オープンソース機械学習フレームワークであるMatConvNet(Vedaldi et at.,MatConvNet−Convolutional Neural Networks for MATLAB.ArXiv14124564 Cs(2014))を用いてMATLAB(登録商標)(R2017a)においてデザインした。同じアーキテクチャーを用いて、ZO−1に対して標識された蛍光画像(細胞タイトジャンクション染色)をセグメント化し、また、QBAM画像における細胞をセグメント化した。基本的な層構造は、GoogLeNet(Szegedyら、2014)において用いられているインセプション層であり、その高次構造は、U−Netアーキテクチャーに従った(Ronnebergerら、U−Net:Convolutional Networks for Biomedical Image Segmentation.In Medical Image Computing and Computer−Assisted Intervention−MICCAI,(Springer,Cham),pp.234−241(2015))。このネットワークは、256×256画素の画像を入力とし、200×200画素の画像を出力し、細胞境界が正の画素値を有し、細胞本体が、負の画素値を有する。このネットワークは、1500万個超のパラメータを有した。
上記ネットワークを訓練するために、確率勾配降下をADADELTA最適化(ε=10−6およびρ=0.9)とともに用いた。バッチ正規化を、各バッチにおいて10個の画像とともに用いた。F1スコアを用いて、最良のネットワークモデルを決定し、正しく標識された細胞境界を真陽性と見なした。画素を分類するために用いられた最後の畳み込みの前に、ドロップアウト層を50%ドロップアウト率で使用した。この目的関数は、方程式12に示されるような修正ロジスティック対数損失関数であった:
Figure 2021515586
式中、xは、予測される画素クラスであり、cは、実際の画素クラスであり、c=+1は、細胞境界を表し、c=−1は、細胞本体を表し、B=max{0,−cx}である。
画像の前処理
領域統計量に基づいて画素値を正規化するために、蛍光画像を前処理したが、QBAM画像は前処理しなかった。この正規化プロセスは、1)画像値のスケーリングによって訓練時間が短縮されるので、DNNのより速い訓練のために画像のスケーリングを許可し、2)局所的なバックグラウンド蛍光のいくらかを除去するのに役立つかまたは染色が不十分な領域におけるコントラストを改善し、3)異なるビット深度またはコントラストの画像が同じネットワークによって処理されるのを可能にする。画素値は、絶対スケールであり、通常、0〜1であるので、QBAM画像を、ネットワークにフィードする前に正規化しなかった。積分画像を用いて、画像における各画素を中心とした127×127画素ボックス内の局所の平均および標準偏差を算出した。各画素を、方程式13に従って、局所の画素平均および標準偏差に基づいて正規化した:
Figure 2021515586
式中、pi,jは、i行およびj列における画素値であり、μi,jおよびσi,jは、画素pi,jを中心とした127×127画素領域の平均および標準偏差であり、zi,jは、正規化された画素値である。
DNN訓練のための画素重みの割り当て
DNNの精度を改善するために、ある画像における各画素の訓練重みを、各画素の分類に応じて、正規化された画素値に基づいて調整した。この調整は、シグナルの乏しい領域においてDNNが細胞境界を正しく標識するのに役立った。細胞境界の画素を、μi,jおよびσi,jが、pi,j,の周りの127×127画素領域における境界画素のみの平均および標準偏差であることを除いては方程式1に記載されたように正規化した。次いで、zi,j>−1であるすべての境界画素に、1という重みを割り当て、他のすべての画素には−zi,jという重みを割り当てた。これにより、すべての明画素が1という重みを有することになり、暗画素には、その画素強度に反比例する重みが割り当てられた。細胞本体に対する重みは、細胞境界に対する近接性に基づいて割り当てられた。各細胞本体に対する距離の変換を、細胞境界に対して行い、次いで、その距離の平方根を画素訓練の重みとして使用した。10を超えるすべての重みに10という値が割り当てられるように、細胞本体の重みを切り捨てた。
訓練重みは、2つの異なる方法を用いて訓練中の画像に適用した。第1の方法は、重みを従来どおりに適用する方法であり、誤差逆伝播中の損失に重みを乗算した。第2の方法は、ロジスティック回帰関数(方程式1)において画素クラスラベルcとして重みを使用した。第1の方法と第2の方法の両方の場合において、細胞の境界に対してc>0、細胞本体に対してc<0であった。第1の方法では、c=±1であり、第2の方法では、cは、画素の重みと等しかった。第2の方法が、いくつかの理由からより良いことが見出された。第1に、第2の方法は、試験データセットにおいて、より高いF1スコアをもたらした。第2に、DNNを訓練している間に、試験データセットおよび訓練用データセットに対するF1スコアの逸脱(過学習を示唆し得る)が観察されなかった。
QBAM画像のセグメンテーション
DNN訓練用のQBAM画像における細胞境界の決定
QBAM画像をセグメント化するDNNを開発した(DNN−S)。サンプルのサブセットを、ZO−1、具体的にはAMDを有する患者の蛍光イメージングに加えてQBAMイメージングを用いて画像化した。蛍光画像を、iRPEの透過光画像とともにキャプチャーした。次いで、QBAMイメージングを用いて、同じ領域の画像をキャプチャーした。蛍光イメージングおよびQBAMイメージング中にキャプチャーされた透過光画像間に少なくとも97%の相関を有した256×256画素領域を見つけることによって、QBAM画像をiRPEの蛍光画像に登録した。相関を、高速フーリエ変換を使用した一般化された正規化相互相関を用いて評価した。蛍光画像を、DNNを用いてセグメント化し、そのDNNセグメンテーションを、QBAM画像に対する細胞境界ラベルとして用いた。QBAM画像のDNNアンサンブルセグメンテーション
80%を超えるF1スコアを得たRPEの蛍光画像をセグメント化するために用いられるDNNとは異なり、QBAM画像をセグメント化するDNNは、≒60%のF1スコアを達成した。この一部は、ZO−1境界蛍光がRPE単層のいくつかの領域のQBAM画像において観察された境界とあまり重複しないことに起因するとみられた。DNN−Sのセグメンテーション精度を改善するために、アンサンブルアプローチを用い、7つの異なるネットワークを訓練し、すべてのネットワークのコンセンサスを用いて、QBAM画像におけるRPE境界を決定することにより、66%というF1スコアを達成した。
QBAM画像をDNN−Sで処理する前に、QBAM画像の前処理は行わなかった。DNN−Sの構造は、入力画像が1チャンネルではなく3チャンネルを有したことを除いては、蛍光画像をセグメント化するために用いた構造と同じだった。その3チャンネルは、同じ視野のキャプチャーされた3つのQBAM画像であったが、各QBAM画像は、異なる波長(488nm、561nmおよび633nm)でキャプチャーされた。
特徴抽出のためのセグメンテーションの前処理
Healthy−2およびAMDに対するファイル選択
すべての赤色、緑色および青色の明視野画像、キャリブレーション画像および生画像、青色チャンネル由来の吸光度画像ならびにZO−1蛍光ラベル画像を含むディレクトリー構造から。Healthy−2データセット(1,564個のフォルダ内の81,646個のファイル)について、1388画素×1040画素のサイズの2,580個の吸光度ファイルを、セグメンテーションに選んだ。AMDデータセットの場合、2,700画素×3,000画素のサイズの20個の吸光度画像を選んだ。
色の反転およびセグメンテーション結果の細線化(skeletonize)
アーチファクトを除去するため、および小さなギャップを埋めるために、埋めるという形態学的二値操作を、細胞境界線を含むセグメント化された画像に適用した。これより先、細胞境界線が1画素厚になるように、セグメンテーションを細線化した。次に、前景が細胞の内部に対応し、背景が細胞の境界に対応するように、それらの画像を反転した。最後に、各細胞領域がユニークなidでラベルされるように、二値反転画像をラベルした。
画像内の周辺の細胞の除去
参照セグメンテーションマスク上の吸光度画像から正確な細胞レベルの特徴を計算するために、各マスクを前処理して、画像境界に達しているセグメントを除去した。この前処理工程によって、部分的な細胞に対応し得る特徴値が排除される。コンピュータセグメンテーション画像をセグメンテーションの精度について評価するとき、同じ前処理のルーチンをそのコンピュータセグメンテーション画像に適用した。
画像分割
AMDデータセットの場合、大型画像にスティッチしたFOVは、DNNベースのモデル訓練中にRAMに対してスケーラビリティの難題をもたらす。FOVのサイズは、実験の収集物によって異なる。したがって、収集された画像を、大きなモザイク画像にスティッチし、次いで、そのモザイク画像を0%重複の512×512画像タイルに分割することによって、前処理した。
画像の特徴抽出
白皮症iRPEの特徴抽出
439個のフォルダ内に1,978個のファイルを含む、すべての赤色、緑色および青色の明視野画像、キャリブレーション画像および生画像、青色チャンネル由来の吸光度画像およびZO−1蛍光ラベル画像を含むディレクトリー構造から、381個の青色チャンネル由来の吸光度ファイルを画像レベルの特徴抽出に選んだ。これらのファイルは、10%重複の3×3視野(FOV)に対応する。いくつかの吸光度値がゼロ未満であったという事実に起因して(キャリブレーションアーチファクト)、画像ごとの二値マスクを作成して、それらの負の値を特徴抽出から除外した。ウェブ画像処理パイプライン(WIPP)を用いて、対応する各マスク上の吸光度画像(FOV)ごとに特徴ベクトルを計算した。特徴ベクトルは、元々はMATLAB(登録商標)(R2017a)に実装された、14個の強度ベースの画像特徴および5つのテクスチャーベースの画像特徴を含む。強度ベースの特徴は、中心積率およびエントロピー特性に対応する。テクスチャーベースの特徴は、グレーレベルの同時生起行列(GLCM)に由来し、それらには、コントラスト、均一性、相関、エネルギーおよびエントロピーが含まれる。特徴の散布図を、Rおよびggplotパッケージにおけるスクリプトを用いて作製し、選ばれたプロットを、主要なマニュスクリプトに含めた。
AMDのおよび健康なiRPEの特徴抽出
細胞レベルの特徴をできるだけ多く抽出するために、WIPPに統合された特徴抽出用の広く使用されている複数の画像ライブラリーを活用した。同じ特徴定義に対する特徴値は、異なり得るが、それらは、画像取得だけでなく画像処理によっても導入される変動の量に対して洞察を提供する。強度、形状およびテクスチャー特徴を、WIPPにおける特徴抽出器(Bajcsyら、Web Microanalysis of Big Image Data,Springer International Publishing(2018b))、具体的には、各細胞領域に適用されたMATLAB(登録商標)(2017a)およびCellProfiler(Kamentskyら、Improved structure,function and compatibility for CellProfiler:modular high−throughput image analysis software,Bioinformatics 27,1179−11802011(2011))の抽出器を用いて計算した。画像の境界に位置した細胞領域および非常に大きな連結領域に対応する特徴は破棄した。下記の表4は、これらの特徴を要約している:
表4:細胞領域ごとに抽出された細胞特徴クラスタイプのリストおよびその特徴を導いたソフトウェア
Figure 2021515586
Figure 2021515586
表4は、40個の細胞特徴を示しているが、多くの特徴が、モーメントの角度または数などのサブセットを有することから、測定した細胞特徴は合計315個に上った。
アッセイ予測の機械学習モデル
機械学習ベースの回帰モデルを、RPE細胞から抽出された細胞レベルの特徴に対して構築し、訓練されたモデルは、TERおよびVEGF−Ratio測定値を予測するために使用できた。それらのモデルのすべてを試験し、比較可能性のために同一のデータセットに対して訓練した。アフィディコリンまたはHPI4で処置された健康ドナー株に対するTERの予測の場合、5枚の培養プレートを訓練データとして割り当て、6枚目を試験データとして割り当てることによって、データを試験データと訓練データに分けた(プレート1枚あたり各処置の2反復)。VEGF−Ratio予測に対しても類似の手順を行ったが、ただし、プレート5のウェルのサブセットを選択して訓練セットから除外し、試験セットとして使用した(各処置から1ウェル)。これを行った理由としては、すべてのウェルの上清に対してELISAを行わず、ゆえにウェルのサブセットだけがこの解析に利用可能であったからである。サンプル選択時のバイアスを無くすために、訓練/試験のためのこれらのプレート/ウェルの選択は、データの取得または解析の前に盲検で行った。
AMD細胞株の場合、iRPE単層の異なる組み合わせに対してSMLモデルをゼロから訓練した。合計18個のユニークな訓練画像サブセットを形成し、ここで、各画像サブセットは、各ドナー由来の1つのクローンの画像を有する試験データを含んだ。18個すべてのサブセットにわたる平均パフォーマンスを用いて、使用された機械学習方法または試験に使用されたクローンの組み合わせを問わず重要な特徴を特定した。表5は、訓練データに含まれなかったすべての組み合わせを詳細に示している。
表5:試験された18個の異なるクローンサブセットのリスト
Figure 2021515586
Figure 2021515586
特徴の前処理
RPE細胞の特徴を細胞ごとに抽出した。それらの特徴としては、強度、形状およびテクスチャー特性が挙げられる。抽出されたら、各画像分割(上記の「画像分割」の項に記載されている)内の各細胞セットに対する各特徴の平均値、標準偏差、歪度および尖度を算出した。特徴のサブセットが、高度に相関し、様々な振幅範囲を有することが見出された。高度に相関する特徴を取り出し、それらのダイナミックレンジを正規化するために、特徴の前処理を行った。その前処理は、すべての特徴に対して適用され、それは、(1)z正規化、および(2)99.5%超の相関を有するすべての特徴を取り出す、相関に基づく特徴選択(Correlation based Feature Selection)(CFS)法からなる。これは、このマニュスクリプト内のすべてのデータセットに対して独立して行われた。したがって、AMD−iRPE株およびHealthy−2株の合わせたデータセット内の高度に相関した特徴を、AMD−iRPEサンプル同一性に対して用いられたデータセット(Healthy−2のみのデータセットとは別に共相関について解析された)とは別に共相関について解析した。これにより、これらの各モデルにおいて用いられる特徴の総数が異なった。高度に相関した変数の正規化および抜き出しも、他のデータとは独立して、訓練/試験データに対して行った。DNN−Sが個々の細胞特徴を正確にセグメント化する能力およびゆえにそのデータの最も粒度の細かい表示(granular representation)を評価するために、ある特定のデータについて、zスコアの正則化および特徴の相関を、関心領域内の細胞の平均値、標準偏差、歪度および尖度に対してではなく、個々の細胞メトリクスに対して行った。したがって、この解析に対するメトリクスの数は、他のモデルに対する数よりかなり少なかった。
分類および予測のための多くのMLモデルのうち、TERまたはVEGF−Ratio測定値などの連続変数を予測するMLモデルのサブセットを考慮に入れた。このMLモデルのサブセットには、多層パーセプトロン(MLP)、線形サポートベクターマシン(L−SVM)、ランダムフォレスト(RF)、部分的最小二乗回帰(PLSR)およびリッジ回帰(RR)が含まれる。ドナー分類タスクには、同一のモデルを選んだ(分類形式を有しないリッジ回帰を除く)。したがって、分類の場合、リッジ回帰をナイーブベイズ(NB)分類器で置き換えた。すべてのモデルについて、特徴の重みを、それらの0〜1の絶対量に基づいてスケーリングし、次いで、どの特徴が予測と比べて最も高い相対的重みを有するかを決定するために、すべての方法の平均を得た。高い平均を有する特徴は、これらの重要な特徴が一貫して識別された(すなわち、MLモデル非依存的)ので、予測にとって比較的重要な特徴であることを示唆する。すべてのモデルを、10〜30k倍の交差検証を用いて訓練し、次いで、k倍の交差検証内の訓練セットまたは検証セット内にない「脱落」データに対して試験した。
多層パーセプトロン(MLP)
MLPモデルは、独立変数と従属変数との非直線関係を近似する。多層パーセプトロンモデルでは、細胞レベルの特徴を独立変数と見なし、TER/VEGF値を従属変数と見なした。4層(2層の隠れ層)を有するMLPモデルを使用し、70個のニューロンを、そのモデルの第1の隠れ層において使用し、40個のニューロンを第2の隠れ層において使用した。モデルが入力データに過剰適合しないように、また、入力データをロバストに適合させるのに単純すぎないように、隠れ層の数および各隠れ層におけるニューロンの数を経験的に選んだ。TER/VEGF予測にとって重要な特徴を識別するために、Garsonのアルゴリズムを使用して(Garson,Interpreting neural−network connection weights,AI Expert 6,46+(1991))、その関係の重みを計算した。
線形サポートベクターマシン(L−SVM)
サポートベクターマシンは、データ間の分離を最大にするように高次元空間に超平面を構築する。線形サポートベクターマシン(L−SVM)の場合、その平面は、その高次元空間において各次元/特徴と直線的に相関し、L−SVMの重みは、特徴に対する重み/重要度に直接変換され得る。SVM関数は、データへのフィットの「近さ」(コスト)と罰則化が生じる距離(イプシロン)の両方について、超平面の罰則化を最適化する項を有する。したがって、モデルを訓練している間、コストおよびイプシロンを、それぞれ0.001〜1.2および0.001〜4096の範囲にわたって繰り返した。すべてのモデル最適化を、Liblinearパッケージを用いてRにおいて行った。
ランダムフォレスト(RF)
ランダムフォレストは、決定木の「森」またはアンサンブルを使用して、ある因子を予測する。決定木は、意思決定のためのフローダイアグラムとして考えられ得る。決定木は、クラス標識された訓練の配列から構築され、ここで、各ノードは、属性に対する試験を意味し、各枝は、ある試験の結果を表し、各終端ノードは、分類するかまたは回帰推定する。ランダムフォレストは、決定木の出力において分散を減少させるという目標で、同じ訓練セットの異なる部分に対して訓練された、複数の深い決定木を組み合わせる。したがって、木の数および各木が枝分かれする深さが最適化され得る。ここでは、125個の木を、5〜1500個の枝にわたって評価して、最適なモデル性能を計測した。すべてのモデルの最適化を、Caretパッケージを用いてRにおいて行った。変数の相対的重要度は、Liaw,A.ら、Classification and Regression by randomForest,R News 2,18−22(2002)に示されているように算出した。
部分的最小二乗回帰(PLSR)
PLSRは、予測された変数(TERおよびVEGF−Ratio)および観察可能変数(細胞画像の特徴)を低次元空間に投影することによって線形回帰モデルを作成する。PLSRモデルは、Y空間(観察可能変数)における最大多次元分散方向を説明する「X」空間(予測された変数)の中に多次元方向を探し出す。このようにして、高次元データを用いることにより、実世界の結果を予測することができる。PLSRに対して最適化する唯一の変数は、所望の結果を予測するために必要な次元成分の数である。この報告において最適化されたモデルの場合、どれが最も高い予測力を有するかを判定するために、成分を1〜50で変動させた。モデルの最適化を、CaretおよびPLSパッケージを用いてRにおいて行った。変数の重要度は、各次元成分内の各特徴係数の絶対値の和に、各成分が生データを説明する全分散のパーセントを乗算したものと定義された。
リッジ回帰(RR)
RRは、通常の最小二乗回帰の特殊な形であり、ここで、その予測モデルは、予測結果と実際の結果との平方残差の和を最小にするように最適化され、L2正則化を用いた最適化によって共線変数、冗長変数または交絡変数を除去するためのガンマ関数を含む。通常の最小二乗回帰と同様に、変数の重要度は、特徴係数の重みの絶対値から決定され得る。変数の数を合計25個の特徴より少ない数にまで減少させるようにモデルを最適化した。モデルの最適化は、RにおけるCaretおよびfobaパッケージを用いて行った。
ドナー同一性を分類するためのDNNモデル
iRPEのQBAM画像を2枚撮影し、そのiRPEが同じドナーに由来するかを判定するDNNを作成した。入力は、2枚の1024×1024×3画素の画像であった。基本的な層構造は、Jaderbergら、Speeding up Convolutional Neural Networks with Low Rank Expansions,ArXiv14053866 Cs(2014)によって報告されたような低ランク拡張(low−rank expansion)からなった。その低ランク拡張層は、1×3畳み込み層に続いて、3×1畳み込み層からなった。第1層は、8つのニューロンを有し、その後の各層は、前の層と比べてニューロンの数を2倍にした。各畳み込み操作の後に、0.1リーク値を有するリーキーReLU層が続いた。各低ランク拡張層は、バッチ正規化され、その次に、ストライドが2の3×3最大プーリング層が続いた。第1層を除いて、各最大プーリング操作の前に残差層が追加され、ここで、その残差層は、入力層を出力層と同じサイズにスケーリングするための1×1畳み込み操作からなった。最後の層は、3×3平均プーリング層の後、全結合層または密な畳み込み層(サイズ=64×64×256)が続いた。F1スコアに基づいて、最良のネットワークを判断した。このネットワークの単純さおよびサイズの小ささのおかげで、以下の項に記載される同じ18個の訓練/試験データセットに対してネットワークを訓練することができた。
ドナー同一性およびアウトライヤーを分類するための機械学習モデル
機械学習ベースの分類モデルを、RPE細胞から抽出された細胞レベルの特徴に対して構築し、その訓練されたモデルを用いて、クローンアウトライヤーまたはドナー同一性を予測できた。リッジ回帰モデルを除くすべてのモデルを、ドナー同一性を正しく分類する能力について評価した。リッジ回帰の代わりに、ナイーブベイズモデルを行った。クローンアウトライヤーの予測の場合、すべてのデータを、階層型クラスタリング法を用いるiRPE株のPCAおよびクラスタリングにかけた。
AMD細胞株の場合、iRPE単層の異なる組み合わせに対してSMLモデルをゼロから訓練した。合計18個のユニークな訓練画像サブセットを形成し、各画像サブセットは、各ドナー由来の1つのクローンの画像を有する試験データを含んだ。表5は、訓練データに含まれなかったすべての組み合わせを詳細に示している。このアプローチは、ドナー由来のクローンの画像を使用して、ネットワークがこれまで見たことがないクローンの「親」ドナー株を予測しようとした。
主成分分析(PCA)
PCAおよび階層型クラスタリングを用いて、発生上のアウトライヤーの識別を行った。PCAは、直交変換を用いることにより、1組の相関変数を、主成分と呼ばれる線形無相関変数の、1組の次元削減された値に変換することによって、変数を最もうまく記述する最大分散の超平面を見出す。大きな次元空間(例えば、多数の特徴)において、PCAは、細胞画像の特徴が全体として、異なるドナー/クローンを互いに対して分類できるかを判定するためにデータを次元削減するのに有用である。画像をクローンレベルおよび日にちレベルでグループ化し、各クローン/日にちの組み合わせについて、各特徴の平均値、標準偏差、歪度および尖度を算出した。これらの集計値の特徴をPCAにかけた。主成分1および2は、データの全分散の75%超を占めたので、サンプル全体のばらつきの好ましい指標とみなされた。特徴の重要度は、各次元成分内の各特徴係数の絶対値の和に、各成分が生データを説明する全分散のパーセントを乗算したものとして定義された。ベースRを用いてPCAを行った。
階層型クラスタリング
個々の特徴の平均値、標準偏差、歪度および尖度を各クローンに対して算出したPCAの出力に対して、階層型クラスタリングを行った。階層型クラスタリングの場合、全クローンの間のユークリッド距離をすべての主成分にわたって算出し、完全連結距離(complete linkage distance)をクラスタリングに使用した。本研究において使用された3人のドナーを表す3つの枝において分割高さを選択した。ベースR関数を使用して、クラスタリングを行った。
ナイーブベイズ
ナイーブベイズモデルは、所与の特徴セットを有するドナーに由来する細胞の事前確率に基づいて、そのドナー由来である細胞型の確率を記述する。ナイーブベイズモデルは、特徴間の強い(ナイーブな)独立性を前提とする。すなわち、ナイーブベイズ分類器は、各特徴間の考えられる相関を問わず、細胞画像の特徴の各々が独立して、細胞が所与のドナー由来である確率に寄与するとみなす。モデルを、0.0〜0.1の必要とされるラプラシアン補正の量について最適化し、また、それらの特徴には正規密度またはカーネル密度のどちらが必要かについて最適化した。特徴の重要度は、ベストフィットモデルにおける特徴係数の絶対値から得た。RにおけるCaretおよびklaRパッケージを用いてモデルの最適化を行った。
定量および統計解析
白皮症株に対して示された群間のすべての有意性が、単一のウェルからの経時的な反復測定および1ウェルごとに撮影された複数の画像を制御する線形混合効果モデルを使用して行われた。これらのモデルを、Rにおけるmulticompおよびnlmeパッケージを用いて評価した。R値、信頼区間およびコルモゴロフ・スミルノフ統計量を、ベースRにおいて算出した。
上に記載されたある特定の例証の実施形態において、本明細書中に記載される様々な非限定的な実施形態は、特定の用途のために、別々に用いられてもよいし、組み合わされてもよいし、選択的に組み合わされてもよいことが認識されるべきである。さらに、上記の非限定的な実施形態の様々な特徴のいくつかが、記載された他の特徴の対応する使用なしに使用され得る。ゆえに、前述の説明は、本開示の原理、教示および例示的な実施形態を単に例証するものと見なされるべきであって、それらを限定していると見なされるべきでない。
上に記載された配置は、例証される実施形態の原理を適用するための例証にすぎないと理解されるべきである。数多くの修正および代替の配置が、例証される実施形態の範囲から逸脱することなく当業者によって考案され得、添付の請求項は、そのような修正および配置を包含すると意図されている。

Claims (22)

  1. 1つまたはそれを超える細胞および細胞誘導体の特性を非侵襲的に予測するための方法であって、前記方法は、
    複数の細胞を表している複数の訓練用細胞画像および前記複数の細胞に対する特性を識別するデータのうちの少なくとも1つを用いて機械学習モデルを訓練する工程;
    評価される少なくとも1つの試験細胞を表している少なくとも1つの試験細胞画像を受け取る工程であって、前記少なくとも1つの試験細胞画像は、非侵襲的に取得され、光の絶対尺度としての吸光度に基づく、工程;
    前記訓練された機械学習モデルに前記少なくとも1つの試験細胞画像を提供する工程;
    前記訓練された機械学習モデルに基づく機械学習を用いて、前記少なくとも1つの試験細胞の特性を予測する工程;および
    前記少なくとも1つの試験細胞の前記予測された特性に基づいて、臨床用細胞調製物に対するリリース基準を、前記訓練された機械学習モデルによって作成する工程
    を含む、方法。
  2. 前記機械学習が、ディープニューラルネットワークを用いて行われ、前記方法が、前記ディープニューラルネットワークによって、前記少なくとも1つの試験画像の画像を個々の細胞にセグメント化する工程をさらに含む、請求項1に記載の方法。
  3. 前記機械学習が、ディープニューラルネットワークを用いて行われ、前記方法が、前記少なくとも1つの試験細胞を前記特性に基づいて分類する工程をさらに含む、請求項1に記載の方法。
  4. 前記予測する工程が、前記分類する工程に基づき、細胞の同一性、細胞の機能、送達された薬物の効果、疾患の状態、および技術的反復または以前に使用されたサンプルとの類似性のうちの少なくとも1つを決定することをさらに含む、請求項3に記載の方法。
  5. 前記少なくとも1つの試験細胞の特性を予測する工程を、前記少なくとも1つの試験細胞画像における単一細胞および1視野の複数の細胞のいずれかに対して行うことができる、請求項1に記載の方法。
  6. 前記少なくとも1つの試験細胞画像から少なくとも1つの特徴を視覚的に抽出する工程をさらに含み、ここで、前記機械学習モデルを訓練する工程が、前記抽出された少なくとも1つの特徴を用いて行われ、前記予測する工程が、前記抽出された少なくとも1つの特徴を用いて訓練された前記訓練された機械学習モデルを用いて前記少なくとも1つの試験細胞の少なくとも1つの特徴を識別すること、および識別された前記少なくとも1つの特徴を用いて、前記少なくとも1つの試験細胞の前記特性を予測することを含む、請求項1に記載の方法。
  7. 前記少なくとも1つの試験細胞画像が、定量的明視野吸光度顕微鏡法(QBAM)を用いて取得される、請求項1に記載の方法。
  8. 前記方法が、
    顕微鏡によってキャプチャーされた少なくとも1つの顕微鏡画像を受け取る工程;および
    前記少なくとも1つの顕微鏡画像の画素強度を吸光度値に変換する工程
    をさらに含む、請求項7に記載の方法。
  9. 前記方法が、
    前記吸光度値の吸光度信頼度を算出する工程;
    ベンチマーキングによって顕微鏡の平衡を確立する工程;および
    前記画像を取得する際に色をフィルタリングする工程
    のうちの少なくとも1つをさらに含む、請求項7に記載の方法。
  10. 前記少なくとも1つの試験画像の第1の画像処理が、前記ディープニューラルネットワークによって行われる、請求項3に記載の方法。
  11. 前記機械学習が、ディープニューラルネットワークを用いて行われ、前記方法が、前記ディープニューラルネットワークによって、前記少なくとも1つの試験画像の画像を個々の細胞にセグメント化する工程をさらに含み、前記特徴が、セグメント化された個々の細胞から視覚的に抽出される、請求項に記載の方法。
  12. 前記少なくとも1つの試験細胞の前記特性を予測する工程が、経上皮抵抗(TER)および/または血管内皮成長因子(VEGF)の極性化分泌を予測すること、前記少なくとも1つの試験細胞の機能を予測すること、前記少なくとも1つの試験細胞の成熟度を予測すること、前記少なくとも1つの試験細胞が識別されたドナー由来であるかを予測すること、および前記少なくとも1つの試験細胞が既知の分類に対してアウトライヤーであるか否かを判定することのうちの少なくとも1つを含む、請求項1に記載の方法。
  13. 臨床用細胞調製物に対する前記リリース基準を作成する工程が、前記訓練された機械学習モデルにより、創薬または薬物毒性に対するリリース基準を作成することをさらに含む、請求項1に記載の方法。
  14. 前記複数の細胞および前記少なくとも1つの試験細胞が、胚性幹細胞(ESC)、人工多能性幹細胞(iPSC)、神経幹細胞(NSC)、網膜色素上皮幹細胞(RPESC)、間葉系幹細胞(MSC)、造血幹細胞(HSC)および癌幹細胞(CSC)のうちの少なくとも1つを含む、請求項1に記載の方法。
  15. 前記第1の複数の細胞および前記少なくとも1つの試験細胞が、複数個の、ESC、iPSC、NSC、RPESC、MSCもしくはHSCまたはそれらに由来する任意の細胞のうちの少なくとも1種に由来する、請求項15に記載の方法。
  16. 前記第1の複数の細胞および前記少なくとも1つの試験細胞が、ヒト組織または動物組織に由来する主要な細胞型を含む、請求項15に記載の方法。
  17. 前記識別されたおよび予測された特性が、生理学的特性、分子の特性、細胞の特性および/または生化学的特性のうちの少なくとも1つを含む、請求項1に記載の方法。
  18. 前記少なくとも1つの抽出された特徴が、細胞の境界線、細胞の形状および複数のテクスチャーメトリクスのうちの少なくとも1つを含む、請求項6に記載の方法。
  19. 前記複数のテクスチャーメトリクスが、複数の細胞内の特徴を含む、請求項18に記載の方法。
  20. 前記複数の細胞画像および前記少なくとも1つの試験細胞画像が、蛍光像、化学発光像、放射像または明視野像を含む、請求項1に記載の方法。
  21. 前記少なくとも1つの試験画像の試験画像が大型画像であるかを判定する工程;
    前記大型画像を少なくとも2つのタイルに分ける工程;
    前記タイルの各々を前記訓練された機械モデルに個々に提供する工程;
    前記タイルの各々に関連する前記訓練された機械モデルによる処理の出力を合わせる工程;および
    合わされた前記出力を、前記少なくとも1つの試験細胞の特性を予測するために提供して、前記大型画像に対応する単一の出力にする工程
    をさらに含む、請求項1に記載の方法。
  22. 1つまたはそれを超える細胞および細胞誘導体の特性を非侵襲的に予測するためのコンピューティングシステムであって、前記コンピューティングシステムは、
    命令を保存するように構成されたメモリー;
    前記メモリーと通信するように配置されたプロセッサー
    を備え、前記プロセッサーは、前記命令の実行時に、
    複数の細胞を表している複数の訓練用細胞画像および前記複数の細胞に対する特性を識別しているデータのうちの少なくとも1つを用いて機械学習モデルを訓練するように構成されており;
    評価される少なくとも1つの試験細胞を表している少なくとも1つの試験細胞画像を受け取るように構成されており、前記少なくとも1つの試験細胞画像は、非侵襲的に取得され、光の絶対尺度としての吸光度に基づき;
    前記訓練された機械学習モデルに前記少なくとも1つの試験細胞画像を提供するように構成されており;
    前記訓練された機械学習モデルに基づく機械学習を用いて、前記少なくとも1つの試験細胞の特性を予測するように構成されており;
    前記少なくとも1つの試験細胞の前記予測された特性に基づいて、臨床用細胞調製物に対するリリース基準を、前記訓練された機械学習モデルによって作成するように構成されている、
    コンピューティングシステム。
JP2020549687A 2018-03-16 2019-03-15 細胞療法、創薬および診断法における使用のための幹細胞およびその誘導体を検証するために機械学習および/またはニューラルネットワークを使用すること Pending JP2021515586A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862644175P 2018-03-16 2018-03-16
US62/644,175 2018-03-16
PCT/US2019/022611 WO2019178561A2 (en) 2018-03-16 2019-03-15 Using machine learning and/or neural networks to validate stem cells and their derivatives for use in cell therapy, drug discovery, and diagnostics

Publications (2)

Publication Number Publication Date
JP2021515586A true JP2021515586A (ja) 2021-06-24
JPWO2019178561A5 JPWO2019178561A5 (ja) 2022-03-22

Family

ID=65995869

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020549687A Pending JP2021515586A (ja) 2018-03-16 2019-03-15 細胞療法、創薬および診断法における使用のための幹細胞およびその誘導体を検証するために機械学習および/またはニューラルネットワークを使用すること

Country Status (6)

Country Link
US (2) US11531844B2 (ja)
EP (1) EP3766000A2 (ja)
JP (1) JP2021515586A (ja)
AU (1) AU2019236297A1 (ja)
CA (1) CA3094078A1 (ja)
WO (1) WO2019178561A2 (ja)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3675835A4 (en) 2017-08-28 2021-06-09 Matthias Wagner MICROFLUIDIC LASER ACTIVATED INTRACELLULAR DELIVERY SYSTEMS AND METHODS
US11808760B1 (en) * 2019-02-14 2023-11-07 Curi Bio, Inc. System and methods for in vitro structural toxicity testing
AU2020273186A1 (en) 2019-04-11 2021-12-02 Agilent Technologies, Inc. User interface configured to facilitate user annotation for instance segmentation within biological sample
WO2020223798A1 (en) * 2019-05-03 2020-11-12 Huron Technologies International Inc. Image diagnostic system, and methods of operating thereof
WO2020237185A1 (en) * 2019-05-23 2020-11-26 Icahn School Of Medicine At Mount Sinai Systems and methods to train a cell object detector
US20200381122A1 (en) * 2019-05-31 2020-12-03 PAIGE.AI, Inc. Systems and methods for processing images of slides to automatically prioritize the processed images of slides for digital pathology
EP3981008A1 (en) * 2019-06-07 2022-04-13 Leica Microsystems CMS GmbH A system and method for processing biology-related data, a system and method for controlling a microscope and a microscope
WO2021009906A1 (ja) * 2019-07-18 2021-01-21 株式会社島津製作所 細胞画像解析方法および細胞画像解析装置
US11288806B2 (en) 2019-09-30 2022-03-29 Siemens Healthcare Gmbh Protocol-aware tissue segmentation in medical imaging
EP3805986A1 (en) * 2019-10-07 2021-04-14 Robert Bosch GmbH Method for measuring the boundary performance of a semantic segmentation network
CN110838116B (zh) * 2019-11-14 2023-01-03 上海联影医疗科技股份有限公司 医学图像采集方法、装置、设备和计算机可读存储介质
US10902551B1 (en) * 2019-12-17 2021-01-26 X Development Llc True positive transplant
EP4078441A1 (en) * 2019-12-20 2022-10-26 Genentech, Inc. Cell line development image characterization with convolutional neural networks
CN111402320A (zh) * 2020-03-17 2020-07-10 北京和众视野科技有限公司 一种基于深度学习的纤维截面直径检测方法
CN111443165B (zh) * 2020-03-27 2021-06-11 华中科技大学 一种基于气体传感器与深度学习的气味识别方法
CN111709908B (zh) * 2020-05-09 2024-03-26 上海健康医学院 一种基于深度学习的氦泡分割计数方法
CA3181222A1 (en) * 2020-06-03 2021-12-09 Niksa PRALJAK Classification of blood cells
WO2021256514A1 (ja) * 2020-06-17 2021-12-23 大輝 中矢 生体細胞解析装置、生体細胞解析システム、生体細胞解析プログラムおよび生体細胞解析方法
US11385292B2 (en) * 2020-09-10 2022-07-12 Volkswagen Aktiengesellschaft Battery materials screening
CN112198799B (zh) * 2020-10-28 2021-05-14 北京交通大学 一种基于深度学习的高速列车停车控制方法及系统
KR102497003B1 (ko) * 2020-11-30 2023-02-06 재단법인대구경북과학기술원 약물 평가 방법 및 장치
US20220277327A1 (en) * 2021-02-26 2022-09-01 Capital One Services, Llc Computer-based systems for data distribution allocation utilizing machine learning models and methods of use thereof
WO2022192157A1 (en) 2021-03-07 2022-09-15 Cellino Biotech, Inc. Platforms and systems for automated cell culture
CN113177574B (zh) * 2021-03-19 2022-08-16 华中科技大学 用于材料表征图像分析的视觉模型及其分析方法
EP4334948A2 (en) * 2021-05-04 2024-03-13 Q-State Biosciences, Inc. Cell activity machine learning
CN113283353B (zh) * 2021-05-31 2022-04-01 创芯国际生物科技(广州)有限公司 一种基于显微图像的类器官细胞计数方法及系统
GB2607604A (en) * 2021-06-08 2022-12-14 Solentim Ltd Brightfield and fluorescence image comparison
CN113723442B (zh) * 2021-07-08 2024-02-20 华中科技大学 一种电子鼻气体识别方法、系统、电子设备及存储介质
WO2023003993A1 (en) * 2021-07-21 2023-01-26 Coriell Institute For Medical Research Label-free classification of cells by image analysis and machine learning
CN113505849B (zh) * 2021-07-27 2023-09-19 电子科技大学 一种基于对比学习的多层网络聚类方法
CN113604544B (zh) * 2021-08-03 2023-03-10 北京大学口腔医学院 一种生物材料功能预测评价方法
US11931737B2 (en) 2021-09-02 2024-03-19 Cellino Biotech, Inc. Platforms and systems for automated cell culture
CN114202690B (zh) * 2021-12-09 2024-04-12 东北林业大学 以混合多层感知器为基础的多尺度网络分析方法
WO2023177923A1 (en) * 2022-03-18 2023-09-21 University Of South Florida Classification of global cell proliferation based on deep learning
WO2023205780A2 (en) * 2022-04-21 2023-10-26 FUJIFILM Cellular Dynamics, Inc. Automated cell culture analysis and classification and detection
WO2023221951A2 (zh) * 2022-05-14 2023-11-23 北京大学 基于细胞动态图像机器学习的细胞分化
US20230409960A1 (en) * 2022-06-21 2023-12-21 Recursion Pharmaceuticals, Inc. Image embeddings via deep learning and adaptive batch normalization
CN115272342B (zh) * 2022-09-29 2023-02-17 深圳大学 基于明场图像的细胞分化程度评估方法、存储介质及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005525550A (ja) * 2002-05-14 2005-08-25 アマーシャム バイオサイエンセズ ナイアガラ,インク. 細胞の迅速自動化スクリーニングシステム及び方法
JP2009044974A (ja) * 2007-08-16 2009-03-05 Univ Nagoya 細胞の品質を予測する予測モデルの構築法、予測モデルの構築用ブログラム、該プログラムを記録した記録媒体、予測モデルの構築用装置
JP2011229410A (ja) * 2010-04-23 2011-11-17 Nagoya Univ 細胞評価装置、インキュベータ、プログラム、および、培養方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005525550A (ja) * 2002-05-14 2005-08-25 アマーシャム バイオサイエンセズ ナイアガラ,インク. 細胞の迅速自動化スクリーニングシステム及び方法
JP2009044974A (ja) * 2007-08-16 2009-03-05 Univ Nagoya 細胞の品質を予測する予測モデルの構築法、予測モデルの構築用ブログラム、該プログラムを記録した記録媒体、予測モデルの構築用装置
JP2011229410A (ja) * 2010-04-23 2011-11-17 Nagoya Univ 細胞評価装置、インキュベータ、プログラム、および、培養方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KE FAN ET AL., SCIENTIFIC REPORTS, vol. 7:13496, JPN6023016702, 2017, pages 1 - 9, ISSN: 0005045088 *
SAJITH KECHERIL SADANANDAN ET AL., SCIENTIFIC REPORTS, vol. 7:7860, JPN6023016703, 2017, pages 1 - 7, ISSN: 0005045087 *

Also Published As

Publication number Publication date
CA3094078A1 (en) 2019-09-19
AU2019236297A1 (en) 2020-10-08
WO2019178561A2 (en) 2019-09-19
US20210117729A1 (en) 2021-04-22
US11531844B2 (en) 2022-12-20
WO2019178561A3 (en) 2019-10-17
EP3766000A2 (en) 2021-01-20
US20230154215A1 (en) 2023-05-18

Similar Documents

Publication Publication Date Title
US11531844B2 (en) Using machine learning and/or neural networks to validate stem cells and their derivatives (2-D cells and 3-D tissues) for use in cell therapy and tissue engineered products
US20230127698A1 (en) Automated stereology for determining tissue characteristics
Meijering et al. Imagining the future of bioimage analysis
Schaub et al. Deep learning predicts function of live retinal pigment epithelium from quantitative microscopy
Versari et al. Long-term tracking of budding yeast cells in brightfield microscopy: CellStar and the Evaluation Platform
US8831327B2 (en) Systems and methods for tissue classification using attributes of a biomarker enhanced tissue network (BETN)
Tyson et al. A deep learning algorithm for 3D cell detection in whole mouse brain image datasets
Bhardwaj et al. Deep learning–based diabetic retinopathy severity grading system employing quadrant ensemble model
Sun et al. Deep learning‐based single‐cell optical image studies
Loewke et al. Automated cell segmentation for quantitative phase microscopy
Castro-González et al. A digital framework to build, visualize and analyze a gene expression atlas with cellular resolution in zebrafish early embryogenesis
Yuan et al. Phasetime: Deep learning approach to detect nuclei in time lapse phase images
JP2022547722A (ja) 細胞検出およびセグメンテーションのための弱教師ありマルチタスク学習
Eren et al. Deepcan: A modular deep learning system for automated cell counting and viability analysis
Herold et al. Automated detection and quantification of fluorescently labeled synapses in murine brain tissue sections for high throughput applications
AU2021344515A1 (en) Methods and systems for predicting neurodegenerative disease state
Lapierre-Landry et al. Nuclei detection for 3d microscopy with a fully convolutional regression network
Wang et al. OC_Finder: osteoclast segmentation, counting, and classification using watershed and deep learning
Niederlein et al. Image analysis in high content screening
Wang et al. OC_Finder: A deep learning-based software for osteoclast segmentation, counting, and classification
Mehta et al. Cardiovascular Imaging Databases: Building Machine Learning Algorithms for Regenerative Medicine
Soans et al. Automated protein localization of blood brain barrier vasculature in brightfield IHC images
US20230326221A1 (en) Systems for identifying cells and uses thereof
US20230160879A1 (en) Method of training ai for label-free cell viability determination and label-free cell viability determination method by trained ai
Mukhopadhyay et al. Machine learning aided single cell image analysis improves understanding of morphometric heterogeneity of human mesenchymal stem cells

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220311

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231011

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240110

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240405