JP7343215B2 - 生物学的試料の大規模な多重の空間分解データをクラスタリングする方法及びコンピュータプログラム - Google Patents

生物学的試料の大規模な多重の空間分解データをクラスタリングする方法及びコンピュータプログラム Download PDF

Info

Publication number
JP7343215B2
JP7343215B2 JP2021500193A JP2021500193A JP7343215B2 JP 7343215 B2 JP7343215 B2 JP 7343215B2 JP 2021500193 A JP2021500193 A JP 2021500193A JP 2021500193 A JP2021500193 A JP 2021500193A JP 7343215 B2 JP7343215 B2 JP 7343215B2
Authority
JP
Japan
Prior art keywords
cluster
images
image
pixel
clusters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021500193A
Other languages
English (en)
Other versions
JP2021529964A (ja
Inventor
ペルクマンズ,ルーカス
ガット,ガブリエル
Original Assignee
ウニヴェルズィテート チューリッヒ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ウニヴェルズィテート チューリッヒ filed Critical ウニヴェルズィテート チューリッヒ
Publication of JP2021529964A publication Critical patent/JP2021529964A/ja
Application granted granted Critical
Publication of JP7343215B2 publication Critical patent/JP7343215B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/695Preprocessing, e.g. image segmentation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/28Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
    • G01N1/30Staining; Impregnating ; Fixation; Dehydration; Multistep processes for preparing samples of tissue, cell or nucleic acid material and the like for analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2323Non-hierarchical techniques based on graph theory, e.g. minimum spanning trees [MST] or graph cuts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/7635Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks based on graphs, e.g. graph cuts or spectral clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2137Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on criteria of topology preservation, e.g. multidimensional scaling or self-organising maps

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Discrete Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Image Processing (AREA)

Description

本発明は、生物学的試料の大規模な多重データをクラスタリングする方法及びコンピュータプログラムに関する。
複数の長さスケールの高度に多重化されたタンパク質の測定値を得ることは、生体臨床医学において重要な役割を果す。しかし、このような測定のデータセットは比較的大規模で、かつ包括的な分析が入念になされる。
例えば、組織試料中のタンパク質などの40種の異なる細胞構造を標識化することは、結果として理想的にはミリメートルからナノメートルのスケールまで網羅する40重のタンパク質のリードアウトとなる。このようなデータにより、細胞微小環境などの集団レベルにて、細胞形態及び細胞周期状態などの細胞レベルにて、及び細胞小器官、細胞骨格構造、核サブコンパートメント及び単一細胞における数千のシグナル伝達受容体の流れの詳細な形態などの細胞内レベルにて明らかになる特性を、in situで同時に捉えることができる。
機能的に関連する情報を取得するために、既知の偏りのない大規模な方法では、分子多重化の長さスケールを細胞内ドメインに拡張し、最終的には経時的情報を取得する必要がある。
例えば、12,000種のタンパク質の高解像度細胞内免疫蛍光イメージングが知られており、そこからヒトプロテオームの平均細胞内マップを作成することができる[1]。しかし、プロテオームの細胞内分布が細胞の表現型の状態及びその微小環境と機能的にどのように関連しているか、それが変化する条件にどのように応答するかを理解するためには、そのようなマップは、同じ単一の細胞及び多くの細胞間においてin situで直接測定する必要がある。組織又は単一細胞上で空間的に分解された抗体の多重化を実現できる強固な方法は数多く存在するが(4、5、13~21)、組織、単一細胞、高分解の細胞内長さスケールを同時にカバーしながら、複数の条件でのハイスループットな様式で試料の品質を維持し、かつ大規模な画像処理及び多変量統計的アプローチと組み合わせて、そのようなデータに存在する豊富な量の生物学的情報を抽出するすべての要件を満たしているものはない。
[1]P.J.Thulら、「A subcellular map of the human proteome」Science 356、(2017) [2]Levine,Jacob H.ら、「Data-Driven Phenotypic Dissection of AML Reveals Progenitor-like Cells that Correlate with Prognosis」Cell,Volume 162、Issue 1、184~197、doi:10.1016/j.cell.2015.05.047
本発明の目的は、これらの問題を解決する方法及びコンピュータプログラムを提供することにある。前記目的は、請求項1の特徴を有する方法、及び請求項15の特徴を有するコンピュータプログラムによって達成される。
有利な実施形態は、下位請求項に記載されている。
相互作用マップは、ピクセルプロファイルのクラスタ(本明細書では多重細胞ユニットと呼ばれる)の細胞内組織と空間的相互作用を定量化する:相互作用マップの生成、及び本明細書ではピクセルプロファイルの2つのステップのクラスタリングによる多重細胞ユニット(MCU:multiplexed cell unit)(例えば図3A参照)と呼ばれるピクセルプロファイルクラスタの識別の統計解析の概略図である。図1Aでは、最初(1)に細胞の全ピクセルプロファイルを抽出し、(2)自己組織化マップ(SOM:Self-Organizing Map)を用いてクラスタリングを行う。次いで、得られたSOMのノードは、フェノグラフ(phenograph)によってさらにクラスタリングされる(図3B)。本明細書の文脈では、識別されたクラスタは、多重細胞ユニット(MCU)とも呼ばれる。MCUは、各染色剤(マーカーとも呼ばれる)について登録された16ビットの4i(Iterative Indirect Immunofluorescence Imaging:反復間接免疫蛍光イメージング)の多重ピクセル強度の共通プロファイルを有するピクセルから構成される細胞における領域を表す(図3C)。それらは、細胞のセグメンテーション図1A(3)に投影し直すことができる。すべてのMCU間のペア単位の空間的相互作用が計算され、その結果、空間的相互作用のスコアプロファイルが得られ、これは細胞におけるMCUの空間的近接の程度を互いに定量化する。 相互作用マップは、ピクセルプロファイルのクラスタ(本明細書では多重細胞ユニットと呼ばれる)の細胞内組織と空間的相互作用を定量化する:相互作用マップの生成、及び本明細書ではピクセルプロファイルの2つのステップのクラスタリングによる多重細胞ユニット(MCU:multiplexed cell unit)(例えば図3A参照)と呼ばれるピクセルプロファイルクラスタの識別の統計解析の概略図である。図1Aでは、第1(1)に細胞の全ピクセルプロファイルを抽出し、(2)自己組織化マップ(SOM:Self-Organizing Map)を用いてクラスタリングを行う。次いで、得られたSOMのノードは、フェノグラフ(phenograph)によってさらにクラスタリングされる(図3B)。本明細書の文脈では、識別されたクラスタは、多重細胞ユニット(MCU)とも呼ばれる。MCUは、各染色剤(マーカーとも呼ばれる)について登録された16ビットの4i(Iterative Indirect Immunofluorescence Imaging:反復間接免疫蛍光イメージング)の多重ピクセル強度の共通プロファイルを有するピクセルから構成される細胞における領域を表す(図3C)。それらは、細胞のセグメンテーション図1A(3)に投影し直すことができる。すべてのMCU間のペア単位の空間的相互作用が計算され、その結果、空間的相互作用のスコアプロファイルが得られ、これは細胞におけるMCUの空間的近接の程度を互いに定量化する。 細胞状態及び微小環境による細胞内再組織化の包括的定量化:(A)相互作用マップは、細胞周期のG1期とG2期との細胞間で細胞質及び核成長シグナル伝達に関連するMCUの異なる存在度を識別する。ネットワークは300個の非摂動のHeLa細胞の集団から生成された相互作用マップを表す。幾何学的な形状の直径は、それらに割り当てられた細胞におけるピクセルの割合に応じてスケーリングされる。グレースケールは、G1細胞とG2細胞との間のMCUの相対的なサイズの比率を表す。白はG1細胞の面積がより大きいことを示し、黒はG2細胞の面積がより大きいことを示す。白で着色された幾何学的な形状は、MCUがG1細胞にてより大きい面積であることを表し、一方、黒で着色された幾何学的な形状は、MCUがG2細胞にてより大きい面積であることを表す。図2Cに描かれたネットワークは、(B)図2AにおいてハイライトされたMCUのzスコア化された4i強度ローディング(行)のヒートマップ(幾何学的形状の輪郭、列)と同様に構築した。(C)相互作用マップは、細胞の密集が高い及び低い領域の細胞の間で、膜内システムとミトコンドリアに関連するMCUの異なる存在度を識別する。細胞の低い密集と高い密集について(A)のとおり幾何学的な形状が着色される。白の幾何学的な形状は、MCUが高い密集にてより大きい面積であることを表し、一方、黒の幾何学的な形状は、MCUが低い密集にてより大きい細胞であることを表す。特に目的である幾何学的形状には、図1Bのナンバリングに従って番号を付される。(D)図2CのハイライトされたMCUのzスコア化された4i強度ローディング(行)のヒートマップを示す。 細胞状態及び微小環境による細胞内再組織化の包括的定量化:(A)相互作用マップは、細胞周期のG1期とG2期との細胞間で細胞質及び核成長シグナル伝達に関連するMCUの異なる存在度を識別する。ネットワークは300個の非摂動のHeLa細胞の集団から生成された相互作用マップを表す。幾何学的な形状の直径は、それらに割り当てられた細胞におけるピクセルの割合に応じてスケーリングされる。グレースケールは、G1細胞とG2細胞の間のMCUの相対的なサイズの比率を表す。白はG1細胞の面積がより大きいことを示し、黒はG2細胞の面積がより大きいことを示す。白で着色された幾何学的な形状は、MCUがG1細胞にてより大きい面積であることを表し、一方、黒で着色された幾何学的な形状は、MCUがG2細胞にてより大きい面積であることを表す。図2Cに描かれたネットワークは、(B)図2AにおいてハイライトされたMCUのzスコア化された4i強度ローディング(行)のヒートマップ(幾何学的形状の輪郭、列)と同様に構築した。(C)相互作用マップは、細胞の密集が高い及び低い領域の細胞の間で、膜内システムとミトコンドリアに関連するMCUの異なる存在度を識別する。細胞の低い密集と高い密集について(A)のとおり幾何学的な形状が着色される。白の幾何学的な形状は、MCUが高い密集にてより大きい面積であることを表し、一方、黒の幾何学的な形状は、MCUが低い密集にてより大きい細胞であることを表す。特に目的である幾何学的形状には、図1Bのナンバリングに従って番号を付される。(D)図2CのハイライトされたMCUのzスコア化された4i強度ローディング(行)のヒートマップを示す。 相互作用マップの構築:(A)相互作用マップの構築のためのステップごとのワークフローである。 (B)SOMのニューロンの多重強度プロファイルを解析する場合、異なる近傍値(X軸)でのフェノグラフ(Y軸)による同定されたクラスタの数を可視化する折れ線グラフを示す。グラフ構築のための近傍の数によって近傍値を与える。折れ線グラフの変曲点にてMCU検出の近傍値を選択した。これは、クラスタリングのステップについて適したクラスタの数を決定するための一つの方法である。 (C)HeLa細胞の非摂動集団で同定された41個のMCU(列)のzスコア化された4iのマーカー強度(行)のヒートマップを示す。4iマーカー強度は、全MCUにわたって各4iのマーカーについて個別にzスコア化した。 (D)非摂動のHeLa細胞の集団から無作為に選ばれた300個の細胞のMCUサイズのボックスプロットを示す。ボックスプロットは次のとおり構築される:中央のマークは集団の中央値を示し、ボックスは25~75パーセンタイルの間の集団範囲、ひげは集団範囲の99.3%をカバーし、外れ値はドットでマークされる。 (E)HeLa細胞において同定された全MCU(41)との相互作用マップを示す。各MCUは幾何学的な形状(グレー)として描かれ、対応するMCU番号でラベル付けされる。 (F)代表的なHeLa細胞の細胞セグメンテーションに異なるグレースケールで投影された41個のMCUを示す。 組織由来のMCU:(A)反復間接免疫蛍光イメージング(Iterative Indirect Immunofluorescence Imaging)(4i)によって生成されたマウス脾臓の組織画像に多重細胞ユニット(MCU)を投影した。画像のピクセルは、MPMアルゴリズムによって決定されるとおりMCUへの割り当てに基づいて色分けされている。(B)別の図の一部となっている図Aから抽出した多重ピクセルプロファイルにより生成されたMPM(多重タンパク質マップ)の図示的な表示が、ノードとして示され、tSNEを使用して2次元平面内に配置されている。ノードの直径は、そのMCUに割り当てられたピクセルの割合を表す。ノードは、そのペアのSPSによって接続される。平均値から>2.2の標準偏差のSPS値はエッジとして描かれる。 (C)4iチャンネルのzスコア化された強度ローディングのヒートマップを示す。MCU及び4iチャネルは階層的に分類されている。
請求項1によれば、特に対象から得られた生物学的試料の大規模な、例えば、数十メガバイト、ギガバイト、又はテラバイトの多重画像データを処理、特にクラスタリングする方法であって、少なくとも以下のステップを含む:
a)複数の画像を登録するステップであり、前記画像はそれぞれ、生物学的試料の画像ピクセル又はボクセルから構成され、前記複数の画像は、例えば、所定の染色剤で標識化され、標的化される生物学的試料の異なる実在物を有する画像から構成される、前記ステップ;
b)前記複数の特に登録された画像において空間的に対応する画像ピクセルを決定し、かつ特に、前記空間的に対応する画像ピクセルに、画像の座標を割り当てるステップ;
c)例えば、前記空間的に対応する画像ピクセルをピクセルプロファイルに結び付けることによって関連付けるステップであり、各ピクセルプロファイルは、前記空間的に対応するピクセルのピクセル値から構成され、前記ピクセルプロファイルは、前記空間的に対応するピクセルのそれぞれの画像の座標に関連付けられる、前記ステップ;
d)プール化、特に、類似の値を有する特に類似のピクセルプロファイルを決定するように構成されたクラスタリング方法によってピクセルプロファイルをグループ化して、それにより、類似のピクセル値を有するピクセルプロファイルをそれぞれ含む複数のクラスタを生成するステップ;
e)各クラスタについて、特に単一のクラスタ値を、前記クラスタが構成するピクセルプロファイルの画像の座標に割り当て、それにより、前記空間的に対応する画像ピクセルの画像の座標を有するクラスタピクセルを有するクラスタ画像を生成するステップ;
f)特に、クラスタ画像をディスプレイデバイス上に、又はディスプレイデバイスを使用して表示するステップ。
本発明による方法は、生物学的試料における類似のピクセルプロファイル、したがって類似の構造を決定するクラスタリング方法を適用することによって、大きなデータセット及びそのようなデータセットの処理の問題を解決する。
「多重画像データ」という用語は、特に、同じ生物学的試料について、特に生物学的試料の同じ部分から取得された画像データを指す。
この目的のために、生物学的試料は、同時に、又は連続して、複数の異なる染色剤で標識化及びイメージングすることができる。染色剤は、生物学的試料中の特定のタンパク質などの特定の構造を標的化するように特に構成されている。染色剤は、特に、光で励起された場合に所定の波長帯域で発光する蛍光色素である。例えば異なる波長で発光する、又は減衰時間などの他の識別可能なスペクトル特性を示す複数の異なる染色剤を同時にイメージングすることが可能である。
あるいは、又はさらに、イメージング及び標識化のプロセスは、順次実行することができる。これにより、同一又はほぼ同一のスペクトル特性を持つ色素を使用できる。
多重画像データセットは、生体試料中の異なる構造を特に標的化する様々な染色剤により登録される、特に、5枚を超える、特に30枚を超える、さらには40枚を超える異なる画像を含む。
イメージングは、顕微鏡で実行することができる。顕微鏡は、共焦点顕微鏡、回転ディスク、又は広視野顕微鏡であり得る。画像データは、カメラによって、又はポイント検出器又はアレイ検出器でスキャンすることによって取得できる。
生物学的試料は、特に、ヒト又は動物などの対象から得られた組織試料である。生物学的試料はまた、3次元培養試料又は2次元細胞培養などの細胞培養試料であり得る。
試料はまた、光学イメージングに適した組織切片であってもよい。
染色剤、特に蛍光色素を構造に標的化するためには、十分に確立された抗体染色を行うことができるように、それぞれの染色剤で標識化された抗体を使用することが可能である。
各イメージングステップの後に、この抗体を試料から洗浄することができ、異なる構造を標的化する新しい抗体を使用することができる。
イメージング系の熱ドリフト及び他の特に外部からの影響のために、イメージング系の物体空間における各部分が同じ画像ピクセルで構成されるように取得した画像を前処理することが必要な場合がある。
このため、本発明の一実施形態によれば、複数の画像は、例えば、フーリエ変換登録方法で画像を登録することで、特に空間的に登録される。
登録は、ピクセルシフトの断片が存在し得るように特に実行される。
登録のステップは、特に、本発明による方法のステップb)の前に実行される。
「空間的に対応する画像ピクセル」という用語は、特に、異なる画像のピクセルに関し、前記空間的に対応する画像ピクセルとは、試料における同じ位置に対応する画像部分を含む。
空間的に対応するピクセルは、特に同じ画像の座標を持つ。
発明の別の実施形態によれば、各画像のバックグラウンドシグナルが調整され、及び/又は各画像が0~1の間の値に再スケーリングされ、及び/又はz正規化される。
画像の各ピクセルのピクセル値は、8ビット、12ビット、16ビット、又は24ビットのピクセル値であり得、つまり、各画像ピクセルは、それぞれ256、4096、65536、又は16777215ピクセル値と想定することができる。
各画像は、次いで、512ピクセル×512ピクセル以上で構成することができる。
空間的に対応する画像ピクセルに関連付けられるピクセルプロファイルは、各ピクセルプロファイルが関連するピクセルのピクセル値に対応するエントリを有するベクトルとして表現できるように、特に、空間的に対応する画像ピクセルのピクセル値を含む。
ベクトルのエントリの数は、多重画像の数、すなわち複数の画像の画像数に依存する。
各ピクセルプロファイルには、関連付けられた画像の座標を持つ。
ピクセルの画像の座標は、画像におけるピクセルの位置である。それ故、ピクセルプロファイルは、複数の画像のある画像の特定の位置に割り当てることができる。
本発明による方法のステップe)において、ピクセルプロファイルは、類似のピクセルプロファイルがクラスタリング方法によって一緒にグループ化されるように分析される。
したがって、類似のピクセル値もまた、ピクセルプロファイルにおける特定のパターン又はピクセル値の配列によって識別されることが可能である。
クラスタリング方法の目的は、類似のピクセル値を含むピクセルプロファイルを識別することである。
「類似」という用語は、例えば、あるピクセルプロファイルの別のピクセルプロファイルに対するユークリッド距離に基づく類似のメトリック(metric)を指す。しかし、他の類似のメトリックも可能であり、考慮することができる。
例えば、類似のメトリック又はピクセルプロファイル間の類似性は、相関係数であってもよく、又はニューロンネットワーク、訓練された分類器、機械学習法、若しくはさらには訓練されていないクラスタ法などのクラスタリング方法の特定の性質からもたらされてもよい。
類似のピクセルプロファイルが識別され、クラスタへ共にグループ化される。したがって、各クラスタは、互いに類似している複数のピクセルプロファイルを含む。
それ故、各クラスタは、それぞれのクラスタが構成するピクセルプロファイルによって特に引き継がれる各クラスタに関連付けられた複数の画像の座標を有する。
各ピクセルプロファイルは、特に1つのクラスタにのみ割り当てられる。クラスタ値は各クラスタに割り当てられる。
特に各ピクセルプロファイルはあるクラスタにグループ化されるので、複数の画像と特に同じピクセル寸法を有するクラスタ画像を生成することができる。
クラスタ画像のピクセルは、クラスタピクセルと呼ばれる。同じクラスタのクラスタピクセルには、同じクラスタ値がそれに関連付けられている。
クラスタ値が関連付けられているクラスタピクセルは、画像として表示できる。
クラスタ画像は、特に、複数の画像で取得された多重データに関して類似と見なされる、減少した数のグレー値又はカラー値、及び/又は統一された部分を用いて生物学的試料の画像を表す。
クラスタ画像は、複数の画像からの画像と同じ行数及び列数を有する行列で表すことができる。
それ故、本発明に従った方法は、複数の画像データによって提供される寸法の数を減らすことができ、特に、類似の特徴を示す生物学的試料の部分を識別することができる多重画像データの包括的なクラスタ画像を表示することができる。
本発明の別の実施形態によれば、追加のステップが実行される:
i)前記クラスタ画像における各クラスタピクセルについて、前記クラスタ画像における特に直接的に隣接するクラスタピクセルのクラスタ値は、複数のクラスタ値のペアを提供するように決定され、それにより、各クラスタ値のペアについて、隣接の確率が決定されるステップ;
ii)少なくとも1つの無作為化されたクラスタ画像を生成するステップであり、前記少なくとも1つの無作為化されたクラスタ画像におけるクラスタピクセルの画像の座標は、無作為に交換される、前記ステップ、
iii)前記少なくとも1つの無作為化されたクラスタ画像における各クラスタピクセルについて、前記無作為化されたクラスタ画像における特に直接的に隣接するクラスタピクセルのクラスタ値が決定され、それにより、各クラスタ値のペアについて、無作為な隣接の確率が決定され、無作為な隣接の確率は、無作為化されたクラスタ画像の全てについて決定されるステップ;
iv)隣接の確率と無作為な隣接の確率との間の差などの偏差を計算することによって、調整された隣接の確率を決定するステップ;
v)相互作用マップを生成する、特にディスプレイするステップであり、クラスタが互いに距離を置いて配置され、この距離が、調整された隣接の確率の絶対値を示す、前記ステップ。
この実施形態では、互いに近接している傾向のあるクラスタを決定することができ、かつ相互に排他的なクラスタ、すなわち、互いに隣接して配置される確率が比較的低いクラスタを決定することもできる。
各クラスタ値のペアの隣接の確率は、他のクラスタ値のペアに対する前記クラスタ値のペアの発生頻度を計算することによって決定される。
発生頻度は、隣接の確率の尺度であり、つまり、隣接の確率は、他のクラスタ値のペアに関して正規化された発生頻度として表すことができる。
クラスタ値のペアの無作為な相関及びクラスタ画像データの解釈の誤りを取り除くために、決定された隣接の確率は、統計的な一致のために発生する無作為な隣接について修正される。
この目的のために、クラスタは特に異なる画像の座標に無作為に再割り当てされる。したがって、無作為化されたクラスタ画像は、クラスタ画像と同じ数の列と行を有する。
無作為化されたクラスタ画像を表示する必要はない。
無作為化されたクラスタ画像の無作為な隣接の確率は、クラスタ画像の隣接の確率と同様にして算出される。無作為な隣接の確率は、特に、複数の無作為化されたクラスタ画像に対して決定される。得られた無作為な隣接の確率から、決定された隣接の確率を調整するために使用される各クラスタ値のペアの平均値を計算することができる。
調整された隣接の確率はまた負になることもある。負に調整された確率は、互いに隣接していない傾向のあるクラスタ値のペア、すなわち、これらのクラスタ値のペアが互いに反発していることを示している。正に調整された隣接の確率は、特に直接的な隣接関係にある傾向のあるクラスタ値のペア、すなわち、これらのクラスタ値のペアが互いに引き付けることを示している。調整された確率の絶対値が大きいほど、それぞれより強い引き付け、又は反発を示している。
無作為な隣接の確率と、決定された隣接の確率との間で推定される偏差の種類に応じて、負に調整された確率を必要としない、クラスタを引き付ける、及び反発させる異なるメトリックを定義することも可能である。
規則的に間隔をおいたピクセルを有する2次元クラスタ画像の場合、各クラスタピクセルについて、特に8個の周囲に直接隣接するクラスタピクセルが存在する。したがって、各クラスタピクセルについて、特に8個のクラスタ値のペアが決定され得る。隣接するクラスタピクセルがまた、さらに離れている、例えば2ピクセルの距離にあると考えられる場合、合計24個のクラスタ値のペアが生成され、その結果、各クラスタピクセルについて24個の隣接の確率が生成されるように、さらに16個のクラスタ値のペアが、各クラスタピクセルについて推定される。
例えば、クラスタXとクラスタYとの隣接の確率について、調整された隣接の確率は、以下のとおり示され、計算することができる:
式中、p1(X,Y)はクラスタXとクラスタYとの隣接の確率であり、p2(X,Y)はクラスタX及びクラスタYの無作為な隣接の確率に対応する確率であり、p(X,Y)はクラスタ画像におけるクラスタX及びクラスタYの調整された隣接の確率である。Nは、クラスタXのクラスタピクセルのすべての隣接するクラスタピクセルの数であり、n(Y)はクラスタYに関連付けられ、かつクラスタXのクラスタピクセルに隣接するすべてのクラスタピクセルの数であり、n (Y)はクラスタYに関連付けられ、かつ無作為化されたクラスタ画像から導出されるクラスタXのクラスタピクセルに隣接する全てのクラスタピクセルの数である。無作為な隣接の確率をより正確に決定するために、複数の無作為化されたクラスタ画像が生成され、無作為な隣接の確率が、複数の無作為化されたクラスタ画像のそれぞれについて計算される。単一の無作為な隣接の確率は、無作為な隣接の確率を平均することによって導出することができる。
特定のクラスタが他のクラスタによってどの程度引き付けられるか、又は反発されるかは、調整された隣接の確率の特に絶対値を示す距離を割り当てることによって表示することができる。
クラスタ値のペアの引力と斥力とは、調整された隣接の確率に対する距離を割り当てることによって図示することができ、この距離は、調整された隣接の確率の絶対値に関連している。この図は相互作用マップと呼ばれている。
調整された確率の絶対値が引力又は斥力を示すために使用される場合、2つのクラスタのペアが互いに引きつける、又は反発しているかを示すために、追加の図式的な要素が使用され得る。
2つのクラスタ値のペアの間の距離は特に相関があり、より特に調整された隣接の確率に比例している。
この調整された隣接の確率とその表示により、類似のクラスタ間の相互作用を容易に可視化することができる。
本発明の別の実施形態によれば、相互作用マップにおける各クラスタは幾何学的形状として表示され、サイズ、特に幾何学的形状の直径が示され、特に他のクラスタの発生に対するクラスタの相対的な発生に対応し、及び/又は、この幾何学的形状が特に直線によって結ばれ、負の調整された確率が第1の線の色で反映され、かつ正の調整された確率が第2の線の色で反映され、特に、線の長さ又はクラスタ間の距離が、上で詳述したとおり、隣接の調整された確率を示すものである。
本実施形態に従った相互作用マップは、試料中の構造の複雑な相互作用のデータを、知覚しやすく、かつ理解しやすい様式で表示することを可能にする。
本発明の別の実施形態によれば、クラスタは、分散確率的近傍埋め込み(tSNE:distributed stochastic neighbor embedding)法のような次元削減法によって相互作用マップに配置される。
tSNEは、可視化のための高次元データを2次元又は3次元の低次元空間に埋め込むための非線形次元削減機械学習法である。
tSNEは、特に、類似のクラスタ又はピクセルプロファイルが隣接の点によってモデル化され、非類似のクラスタ又はピクセルプロファイルが遠くの点によって高確率でモデル化されるような方法で、各クラスタ又はピクセルプロファイルを2次元又は3次元の点によってモデル化する。
本発明の別の実施形態によれば、複数の画像は、第1の画像のセット及び第2の画像のセットを含み、前記第1の画像のセットは、対照条件などの第1の実験条件の下での生物学的試料の画像を含む、又はそれからなり、前記第2の画像のセットは、第2の実験条件の下での生物学的試料の画像を含む、又はそれからなり、前記第1及び第2のセットは、生物学的試料、特に、同じ存在物を有する生物学的試料の同じ部分、すなわち、同じ染色剤で標的化される生物学的試料のタンパク質などの同じ生物学的構造から登録される対応する画像を含み、特に、本発明に従った少なくともステップb)~e)は、前記第1及び第2の画像のセットについて同じクラスタが生成されるように、両方のセットにて特に同時に実行される。
この実施形態では、この2つの条件の間の比較が可能であるように、目的の生物学的試料を2つの異なる条件で比較し、そして同一のクラスタを有するクラスタ画像を生成することができる。
画像の第1及び第2のセットからの画像データを同時に処理することは有利であり得る。この文脈における同時という用語は、画像が第1の画像のセット又は第2の画像のセットに属するかどうかに関係なく、複数の画像の合同処理を指す。
「実験条件」という用語は、生物学的試料に対して行った実験下のパラメータを指す。実験条件は、例えば、温度、圧力、pH値、試料の照度などの物理的パラメータ、及び/又は溶液、培養培地の組成、薬物などの化合物への曝露などの化学的パラメータである。
本発明の別の実施形態によれば、クラスタの相対的な発生は、第1及び第2の画像のセットから決定され、幾何学的形状の色は、第1の実験条件に対して第2の実験条件の下でクラスタの相対的な発生がより小さくなっているかどうか、又は大きくなっているかどうかを示し、特にクラスタの相対的な発生が逆双曲線正弦関数によって変換され、特に正規化され、平均値(mean value)などの平均値(average value)でzスコア化され、標準偏差が第1の画像のセットにおける各相対的な発生について測定される。
幾何学的形状の色は、幾何学的形状を表示するために使用される表示色を指す。これは継続的に行うことができ、つまり、色についてルックアップテーブルが使用され、このルックアップテーブルは、クラスタの第2の条件での相対的な発生と比較して第1の条件でのクラスタの相対的な発生と相関する。
任意に、分布の正規化は逆双曲正弦関数を用いて行われる。逆双曲線正弦関数は、裾が重い分布をよりコンパクトな準正規分布に変換する。正規分布は、zスコアの正規化の入力に適している。
この実施形態は、相互作用マップが、第1及び第2の実験条件の間の違いを比較的容易に知覚できるように、第1及び第2の画像セットに関する様々な情報を使用者に表示することを可能にする。
本発明のさらなる実施形態によれば、クラスタリング方法は:
- アンサンブル学習法、特にランダムフォレストクラスタリング又はk平均(k-mean)クラスタリング、及び/又は
- 人工ニューラルネットワーク、特に成長ニューラルガス(growing neural gas)又は自己組織化マップ法、及び/又は
- フェノグラフなどのグラフベースの方法、
を実行し、クラスタを決定する。
本発明のさらなる実施形態によれば、クラスタリング方法は、第1のステップにおいて:
- アンサンブル学習法、特にランダムフォレストクラスタリング又はk平均クラスタリング、及び/又は
- -人工ニューラルネットワーク、特に成長ニューラルガス又は自己組織化マップ法、
を実行し、及び/又は前記クラスタリング方法は、第2のステップにおいて:
- アンサンブル学習法、特にランダムフォレストクラスタリング又はk平均クラスタリング、及び/又は
- 人工ニューラルネットワーク、特に成長ニューラルガス又は自己組織化マップ法、及び/又は
- フェノグラフなどのグラフベースの方法、
を実行し、前記第2のステップのアンサンブル学習法、人工ニューラルネットワーク及び/又はグラフベースの方法は、前記第1のステップのアンサンブル学習法及び/又は人工ニューラルネットワーク、特に自己組織化マップの結果をさらに処理して、クラスタを決定する。
特定の実施形態では、第1のステップでは、2個のクラスタ~2000個のクラスタ、特に1000個を超えるノード、より特に2000個を超えるノードを含む、又は生成し、最も特に自己組織化マップ法により、1000個を超えるノード、特に2000個を超えるノードを含む。
本発明の別の実施形態によれば、クラスタリング方法が、第1のステップにおいて、ノードとノード間の接続とを自己組織化マップに提供する自己組織化マップ法を実行し、及び/又はこのクラスタリング方法が、第2のステップにおいて、フェノグラフなどのグラフベースの方法を実行し、このグラフベースの方法が、自己組織化マップをさらに処理してクラスタを決定し、このクラスタリング方法の第1のステップのみが実行された場合には、ノードがクラスタに対応する。
この実施形態によれば、自己組織化マップ法を単独で、又はグラフベースの方法と組み合わせてのいずれかを使用してクラスタを生成して、複数の画像からクラスタを生成することが可能である。
自己組織化マップ(SOM:self-organizing map)方法は、教師なし学習法(unsupervised learning method)で使用される人工ニューラルネットワークである。
フェノグラフなどのグラフベースの方法と組み合わせて、本発明による方法は、クラスタ値の数の減少がもたらされるように、かつピクセルプロファイルの特徴的な特徴が維持されるように、ピクセルプロファイルのクラスタリングを可能にする。クラスタリング方法によるピクセルプロファイルに含まれる情報の削減は、人が管理しやすい情報量にするために最も重要である。
フェノグラフは、例えば[2]に記載されているとおりのグラフベースの方法である。
本発明の別の実施形態によれば、クラスタリング方法は、SOM方法及び/又はグラフベースの方法を含む、又はそれからなり、このSOM方法及び/又はグラフベースの方法は、特に設計上、類似のピクセル値に従ってピクセルプロファイルをクラスタリングするように構成されている。
本発明の別の実施形態によれば、自己組織化マップ法により、1000個を超えるノード、特に2000個を超えるノードを含む。
このノードの数は、生物学的試料の異なる特徴についてのクラスタ数と情報量の削減の間の良好なトレードオフを可能にする。
本発明の別の実施形態によれば、生物学的試料は、複数の生物学的細胞、特に100個を超える細胞から構成される。
生体細胞としては、例えば、動物細胞、植物細胞、原核生物などを挙げることができる。
本発明の別の実施形態によれば、複数の画像は、少なくとも5種、特に少なくとも20種の異なる染色剤で標的化される生物学的試料から構成される。
染色剤は、画像の取得の間に洗浄ステップを伴って、順次適用することができ、又は特に、染色剤が上記のとおり異なるスペクトル特性を示す場合に同時に適用することができる。
生物学的試料の異なる構造を標識化するために少なくとも5種の染色剤を使用することで、豊富な情報を持つデータセットを生成することができ、標識化された構造の間の可能な複雑な相互作用の挙動を抽出及びモニターすることができる。
従来のアプローチでは、このような量のデータをクラスタリングすることは課題であり、上記及び例にあるとおり包括的な可視化は不可能である。
本発明の別の実施形態によれば、3次元画像データは、3次元体積画像が生物学的試料から生成されるように生物学的試料から取得され、ここで画像ピクセルはボクセルであり、特に、画像は3次元画像データ内の層に対応する。
この実施形態では、生物学的試料の特に薄い層(2次元画像)だけでなく、生物学的試料の3次元体積も本発明に従った方法によって調査及び処理されるので、本発明に従った方法による包括的なデータ評価が可能になる。
特に、生物学的試料が組織試料又は3次元細胞培養物である場合には、薄い準2次元層だけでなく、試料の完全な体積部分を取得することが有利である。
本発明の別の実施形態によれば、生物学的試料は対象から得られた単一細胞のみからなる、又は生物学的試料は対象から得られた組織試料である。
本発明の別の実施形態によれば、ピクセルプロファイルはプール化され、例えば、少なくとも20種の異なるクラスタにグループ化される。
本発明の別の実施形態によれば、生物学的試料から複数の画像を生成するように、各染色剤について少なくとも以下のステップが実行される:
- 生体試料を染色剤で標識化するステップであり、前記染色剤が特に第1の抗体に結合しており、前記染色剤が特に蛍光色素である、前記ステップ、
- ブロッキング緩衝液を使用して生物学的試料の非特異的結合部位をブロッキングするステップであり、生物学的試料の前記非特異的結合部位が前記ブロッキング緩衝液を含むブロッキング剤によって覆われる、前記ステップ、
- イメージング緩衝液において、試料からの複数の画像のうちの少なくとも1つの画像を取得するステップ、
- 溶出緩衝液を用いて、生物学的試料から染色剤を溶出させるステップ。
本発明の別の実施形態によれば、緩衝液のセットは、試料のブロッキング、イメージング、及び染色剤、特に抗体を含む又は抗体に結合されている染色剤の溶出のために、複数の画像を生成するための後続のイメージングステップの間に使用され、前記緩衝液のセットは:
- 疎水性結合部位に非特異的に結合可能なブロッキング化合物、スルフヒドリル反応性化合物、及び緩衝成分を含むブロッキング緩衝液;
- チオール含有化合物を含み、pHが7.2~7.6のイメージング緩衝液;
- 還元剤、水素結合を破壊する少なくとも1つの化合物、緩衝成分を含み、pHが4未満(<4)の溶出緩衝液、
を含む。
本明細書の文脈において、「イメージングのために調製される生物学的試料」という用語は、イメージングのために使用可能な装置に固定される任意の生物学的材料を指し、特に、蛍光顕微鏡法に限定されるものではない。イメージングのために調製される生物学的試料は、ガラススライド又はマルチウェルプレート(ガラス/プラスチック)上のパラホルムアルデヒド固定化細胞又は組織、又は顕微鏡検査に適した任意の他の種類の試料ホルダーから選択することができるが、これらに限定されない。
本明細書の文脈において、抗体という用語は、これらに限定されないが、免疫グロブリンG型(IgG)、A型(IgA)、D型(IgD)、E型(IgE)又はM型(IgM)を含む全抗体、任意の抗原結合断片又はその一本鎖、及び関連又は由来の構築物を指す。全抗体とは、ジスルフィド結合で相互に連結された少なくとも2本の重鎖(H)と2本の軽鎖(L)とを含む糖タンパク質である。各重鎖は、重鎖可変領域(VH)と重鎖定常領域(CH)とで構成されている。重鎖定常領域は、CH1、CH2、CH3の3つのドメインで構成されている。各軽鎖は、軽鎖可変領域(以下、VLと略記)と軽鎖定常領域(CL)とで構成されている。軽鎖定常領域は、1つのドメインCLで構成されている。重鎖及び軽鎖の可変領域は、抗原と相互作用する結合ドメインを含有する。同様に、この用語は、いわゆるナノボディ又は単一のドメイン抗体、単一の単量体の可変抗体ドメインからなる抗体断片を包含する。
本明細書の文脈では、用語「チオール含有化合物」は、遊離基と迅速に反応し、それによって遊離基を除去する化合物について使用される。
課題はまた、コンピュータプログラムによって解決され、前記コンピュータプログラムは、コンピュータプログラムがコンピュータによって実行される場合、コンピュータに本発明に従った方法、特にすべてのコンピュータの実行可能なステップを実行させる命令を含む。
さらに、課題はまた、コンピュータプログラム製品によっても解決され、前記コンピュータプログラム製品は、非一過性の媒体に記憶され、前記コンピュータプログラム製品は、命令がコンピュータによって実行される場合に、コンピュータに本発明に従った方法、特にすべてのコンピュータの実行可能なステップを実行させる命令を含む。
本明細書では、「コンピュータ」又はそのシステムという用語は、汎用プロセッサ、マイクロプロセッサ、RISCプロセッサ、又はDSPなどの通常の当該技術の文脈で使用され、メモリ又は通信ポートなどの追加の要素を含むことが可能である。任意に、又は追加的に、「プロセッサ」又は「コンピュータ」又はその派生装置(derivative)という用語は、提供された又は組み込まれたプログラムを実行することができ、及び/又はデータ記憶装置及び/又は入力ポート及び出力ポートなどの他の装置を制御及び/又はアクセスすることができる装置を意味する。「コンピュータ」という用語はまた、特に、メモリなどの1つ又は複数の他のリソースに接続されている、及び/又はリンクされている、及び/又はその他においては通信している、可能であれば共有している複数のプロセッサ又はコンピュータもまた意味する。
「コンピュータプログラム」という用語は、通常、アルゴリズム及び/又は他の処理又は方法を表す一連の操作を実行するための1つ又は複数の命令又は指示、又は回路を意味する。プログラムは、RAM、ROM、ディスクなどの媒体に記憶される、又は、プロセッサ、コンピュータ、又は他の回路などの装置によってアクセス可能かつ実行可能な回路に埋め込まれている。
プロセッサ及びプログラムは、少なくとも部分的に、プログラムされた一連の操作を実行するように設計されたFPGA又はASICなどの電子ゲートのアレイなど同じ装置から構成され得、任意にプロセッサ又は他の回路を含む、又はリンクされている。
以下では、図面に示される例示的な実施形態を参照して、本発明を詳細に説明する。図面の縮尺は必要としないことに留意されたい。
実施例1
本発明者らは、細胞周期の異なる段階におけるMCUの存在度及び細胞間の空間的相互作用を比較した(図2A、B)。予想のとおり、細胞周期マーカーを含有するMCUは強い違いを示した。サイクリンB1(MCU17)について富化された細胞質のMCUは、G2の細胞にはるかに多く存在し、一方、サイクリンE(MCU20)について富化された核内のMCUは、G1の細胞にはるかに多く存在している。これはまた、c-Myc、ホスホ4EBp1、及びYAPの特定の組み合わせを含有し、G2の細胞においてより多く存在する他の核のMCU(MCU9、10、及び13)を同定する。同様に、それはホスホS6が富化される細胞質のMCU(MCU3及び29)は、G2の細胞においてより多く存在すると同定する。これは、シグナル伝達活性及び転写因子へのその下流の影響が細胞周期(34~37)に適応していることを反映している。印象的なことに、これはまた、数ピクセルをカバーする8個のMCUによってのみ表される単一の細胞の間の重要な機能的な違いであるゴルジ複合体マーカー(38)(TGN46、GM130)(MCU27)の存在度の同時に起こる増加と同様に、G2におけるセントロソーム(PCNT)の重複を正確に同定した。これらすべてのMCUを特定の単一細胞においてハイライト表示することで、その精度及び感度を強調する。本発明者らは、低又は高の局所細胞密集を経験する単一細胞を比較した場合(図2C、D)、様々な細胞内位置にある複数の内細胞小器官のマーカーを含有するMCU(MCU12、14、15、19、22、37)が、高い密集を経験する細胞ではより多く存在することが観察された。対照的に、ミトコンドリア(HSP60)及びペルオキシソーム(ABCD3)のマーカーを含有するMCU(MCU6、16、25、28、29)は、低い密集を経験する細胞においてより多く存在する。このことは、異化と生合成とに関与する小器官の単一細胞が成長するために利用可能な空間への全域的な逆適応を示している。
このアプローチは、マウス脾臓の組織切片でも検証された(図4)。
以上のことから、本発明の教師なしデータ作動アプローチは、細胞のサブコンパートメント化の変化を空間的に詳細な高いレベルまで正確かつ感覚的に定量化し、多重測定のそれぞれの複数の小さな差異を統合することで、細胞内の複雑さの意味のある解釈を可能にすることが示された。
参考文献
[1]P.J.Thulら、「A subcellular map of the human proteome」Science 356、(2017)
[2]Levine,Jacob H.ら、「Data-Driven Phenotypic Dissection of AML Reveals Progenitor-like Cells that Correlate with Prognosis」Cell,Volume 162、Issue 1、184~197、doi:10.1016/j.cell.2015.05.047

Claims (16)

  1. 生物学的試料の多重画像データを処理する方法であって、前記方法は、以下のステップ:
    a)生物学的試料の複数の画像を登録するステップであり、前記複数の画像は、所定の染色剤で標的化される前記生物学的試料の異なる存在物を有する画像から構成される、前記ステップ;
    b)前記登録された複数の画像において、空間的に対応する画像ピクセルを決定するステップ;
    c)前記空間的に対応する画像ピクセルをピクセルプロファイルに関連付けるステップであり、各ピクセルプロファイルは、前記空間的に対応するピクセルのピクセル値を含み、前記ピクセルプロファイルは、前記空間的に対応するピクセルのそれぞれの画像の座標に関連付けられる、前記ステップ;
    d)類似の値を有するピクセルプロファイルを決定するように構成されたクラスタリング方法によって前記ピクセルプロファイルをプール化し、それにより類似のピクセル値を有するピクセルプロファイルをそれぞれ含む複数のクラスタを生成するステップ;
    e)各クラスタについて、クラスタ値を前記クラスタに含まれるピクセルプロファイルの画像の座標に割り当て、それによりクラスタピクセルを有するクラスタ画像を生成するステップ、
    を含み、
    i)前記クラスタ画像における各クラスタピクセルについて、前記クラスタ画像における隣接するクラスタピクセルのクラスタ値が決定され、それによって各クラスタ値のペアについて隣接の確率が決定されること;
    ii)少なくとも1つの無作為化されたクラスタ画像を生成することであり、前記少なくとも1つの無作為化されたクラスタ画像における前記クラスタピクセルの画像の座標は、無作為に交換されること;
    iii)前記少なくとも1つの無作為化されたクラスタ画像における各クラスタピクセルについて、前記無作為化されたクラスタ画像における隣接するクラスタピクセルの前記クラスタ値が決定され、それにより各クラスタ値のペアについて、無作為な隣接の確率が決定されることであり、前記無作為な隣接の確率は、無作為化されたクラスタ画像の全てに対して決定されること;
    iv)前記隣接の確率と前記無作為な隣接の確率との間の偏差を計算することによって、調整された隣接の確率を決定すること;
    を含む、前記方法。
  2. v)相互作用マップを生成することであり、クラスタは、互いに距離を置いて配置され、距離は、前記調整された隣接の確率の絶対値を示すこと、
    を含む、請求項1に記載の方法。
  3. 前記相互作用マップにおける各クラスタが幾何学的形状として表示され、前記幾何学的形状のサイズは、他のクラスタの発生に対するクラスタの相対的な発生を示し、及び/又は前記幾何学的形状は線で結ばれ、負の調整された確率は、第1の線の色で反映され、正の調整された確率は、第2の線の色で反映される、請求項2に記載の方法。
  4. 前記クラスタは、分散確率的隣接埋め込み(tSNE)法の次元削減法によって相互作用マップに配置される、請求項2又は3に記載の方法。
  5. 前記複数の画像は、第1の画像のセット及び第2の画像のセットを含み、前記第1の画像のセットは、対照条件の第1の実験条件下での生物学的試料の画像を含む、又はそれからなり、かつ前記第2の画像のセットは、第2の実験条件下での生物学的試料の画像を含む、又はそれからなり、前記第1の画像のセット及び前記第2の画像のセットは、同じ染色で標的化された生物学的試料の同じ存在物を有する生物学的試料から登録される対応する画像を含む、請求項1~4のいずれか一項に記載の方法。
  6. 前記クラスタの相対的な発生は、前記第1の画像のセット及び前記第2の画像のセットから決定され、幾何学的形状の色は、前記クラスタの相対的な発生が前記第1の実験条件と比較して前記第2の実験条件の下でより小さくなったかどうか、又はより大きくなったかどうかを示す、請求項3を引用する請求項5に記載の方法。
  7. 前記クラスタリング方法は、アンサンブル学習法、及び/又は人工ニューラルネットワーク、及び/又はフェノグラフのグラフベースの方法を実行し、クラスタを決定する、請求項1~6のいずれか一項に記載の方法。
  8. 前記クラスタリング方法は、第1のステップにおいて、アンサンブル学習法、及び/又は人工ニューラルネットワークを実行し、及び/又は前記クラスタリング方法は、第2のステップにおいて、アンサンブル学習法、及び/又は人工ニューラルネットワーク、及び/又はフェノグラフのグラフベースの方法を実行し、前記第2のステップの前記アンサンブル学習法、前記人工ニューラルネットワーク及び/又は前記グラフベースの方法は、前記第1のステップのアンサンブル学習法及び/又は人工ニューラルネットワークの結果をさらに処理して、クラスタを決定する、請求項1~7のいずれか一項に記載の方法。
  9. 前記第1のステップでは、2~2000個のクラスタを含む、又は生成する、請求項8に記載の方法。
  10. 前記生物学的試料は、複数の生物学的細胞を含む、請求項1~9のいずれか一項に記載の方法。
  11. 前記複数の画像は、少なくとも5種の異なる染色剤で標的化される生物学的試料から構成される、請求項1~10のいずれか一項に記載の方法。
  12. 3次元画像データは、前記試料から取得され、画像ピクセルは、ボクセルである、請求項1~11のいずれか一項に記載の方法。
  13. 前記生物学的試料は、対象から得られる単一の細胞のみからなる、又は前記生物学的試料は対象から得られる組織試料である、請求項1~12のいずれか一項に記載の方法。
  14. 前記ピクセルプロファイルは、少なくとも20個のクラスタにプール化される、請求項1~13のいずれか一項に記載の方法。
  15. - 疎水性結合部位に非特異的に結合することができるブロッキング化合物、スルフヒドリル反応性化合物及び緩衝成分を含むブロッキング緩衝液;
    - チオール含有化合物を含み、かつpHが7.2~7.6の間であるイメージング緩衝液;
    - 還元剤、水素結合を破壊する少なくとも1つの化合物、緩衝成分を含み、かつpHが4より低い(<4)溶出緩衝液;
    を含む緩衝液のセットが、生物学的試料のブロッキング及びイメージングのために、並びに染色剤の溶出のために、複数の画像を生成する後段のイメージングステップの間に使用される、請求項1に記載の方法。
  16. プログラムがコンピュータによって実行される場合に、請求項1に記載の方法をコンピュータに実行させる命令を含むコンピュータプログラム。
JP2021500193A 2018-07-06 2019-07-05 生物学的試料の大規模な多重の空間分解データをクラスタリングする方法及びコンピュータプログラム Active JP7343215B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP18182243.8 2018-07-06
EP18182243 2018-07-06
EP19154219.0A EP3591574A3 (en) 2018-07-06 2019-01-29 Method and computer program for clustering large multiplexed spatially resolved data of a biological sample
EP19154219.0 2019-01-29
PCT/EP2019/068181 WO2020008071A1 (en) 2018-07-06 2019-07-05 Method and computer program for clustering large multiplexed spatially resolved data of a biological sample

Publications (2)

Publication Number Publication Date
JP2021529964A JP2021529964A (ja) 2021-11-04
JP7343215B2 true JP7343215B2 (ja) 2023-09-12

Family

ID=62947935

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021500193A Active JP7343215B2 (ja) 2018-07-06 2019-07-05 生物学的試料の大規模な多重の空間分解データをクラスタリングする方法及びコンピュータプログラム

Country Status (4)

Country Link
US (1) US11989959B2 (ja)
EP (2) EP3591574A3 (ja)
JP (1) JP7343215B2 (ja)
WO (1) WO2020008071A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11846702B2 (en) * 2019-07-18 2023-12-19 Nec Corporation Image processing device and image processing method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016201186A1 (en) 2015-06-11 2016-12-15 University Of Pittsburgh-Of The Commonwealth System Of Higher Education Systems and methods for finding regions of interest in hematoxylin and eosin (h&e) stained tissue images and quantifying intratumor cellular spatial heterogeneity in multiplexed/hyperplexed fluorescence tissue images
JP2018509591A (ja) 2014-12-03 2018-04-05 ベンタナ メディカル システムズ, インコーポレイテッ 不均一なバイオマーカー分布を定量的に分析するための方法、システム及び装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7035740B2 (en) * 2004-03-24 2006-04-25 Illumina, Inc. Artificial intelligence and global normalization methods for genotyping
US8335360B2 (en) * 2007-05-14 2012-12-18 Historx, Inc. Compartment segregation by pixel characterization using image data clustering
US10619195B2 (en) * 2010-04-06 2020-04-14 Massachusetts Institute Of Technology Gene-expression profiling with reduced numbers of transcript measurements
CN103703015B (zh) * 2011-08-25 2019-07-05 霍夫曼-拉罗奇有限公司 阳离子和阴离子交换层析法
WO2013192351A1 (en) * 2012-06-20 2013-12-27 Bio-Rad Laboratories, Inc. Stabilized droplets for calibration and testing
CN109526227A (zh) * 2016-01-25 2019-03-26 生物辐射欧洲有限公司 数字微生物学
US10948484B2 (en) * 2016-04-11 2021-03-16 Veravas, Inc. Sample depletion and enrichment to improve the quality of diagnostic test results
US11198118B2 (en) * 2017-03-29 2021-12-14 Princeton Biochemicals, Inc. Integrated modular unit containing one or more analyte concentrator-microreactor devices to be coupled to a cartridge-cassette and methods of operation
US10423820B2 (en) * 2017-09-13 2019-09-24 General Electric Company Systems and methods for automatic generation of training sets for machine interpretation of images
EP4038546A1 (en) * 2019-10-01 2022-08-10 10X Genomics, Inc. Systems and methods for identifying morphological patterns in tissue samples
EP4285321A1 (en) * 2021-02-01 2023-12-06 Pathai, Inc. Systems and methods for classifying biomedical image data using a graph neural network

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018509591A (ja) 2014-12-03 2018-04-05 ベンタナ メディカル システムズ, インコーポレイテッ 不均一なバイオマーカー分布を定量的に分析するための方法、システム及び装置
WO2016201186A1 (en) 2015-06-11 2016-12-15 University Of Pittsburgh-Of The Commonwealth System Of Higher Education Systems and methods for finding regions of interest in hematoxylin and eosin (h&e) stained tissue images and quantifying intratumor cellular spatial heterogeneity in multiplexed/hyperplexed fluorescence tissue images

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Michael J. Gerdes et al,Highly multiplexed single-cell analysis of formalin-fixed, paraffin-embedded cancer tissue,PNAS,2013年07月16日,vol.110, no.29,pp.11982-11987,& Supporting Information pp.1-15

Also Published As

Publication number Publication date
JP2021529964A (ja) 2021-11-04
EP3818470A1 (en) 2021-05-12
EP3591574A3 (en) 2020-01-15
EP3591574A2 (en) 2020-01-08
US11989959B2 (en) 2024-05-21
WO2020008071A1 (en) 2020-01-09
US20210224510A1 (en) 2021-07-22

Similar Documents

Publication Publication Date Title
US20200279125A1 (en) Systems and methods for finding regions of interest in hematoxylin and eosin (h&e) stained tissue images and quantifying intratumor cellular spatial heterogeneity in multiplexed/hyperplexed fluorescence tissue images
JP5602717B2 (ja) 高密度細胞集団の自動セグメンテーション方法およびシステム
EP1922695B1 (en) Method of, and apparatus and computer software for, performing image processing
CN105122308B (zh) 用于使用连续染色组织上的单细胞划分的多路生物标志定量的系统和方法
JP2021503666A (ja) 単一チャネル全細胞セグメンテーションのためのシステム及び方法
Megjhani et al. Population-scale three-dimensional reconstruction and quantitative profiling of microglia arbors
US20200300763A1 (en) Methods for analysis of single molecule localization microscopy to define molecular architecture
WO2017109860A1 (ja) 画像処理装置
Lehmussola et al. Synthetic images of high-throughput microscopy for validation of image analysis methods
Kittisopikul et al. Quantitative analysis of nuclear lamins imaged by super-resolution light microscopy
JP7343215B2 (ja) 生物学的試料の大規模な多重の空間分解データをクラスタリングする方法及びコンピュータプログラム
Herold et al. Automated detection and quantification of fluorescently labeled synapses in murine brain tissue sections for high throughput applications
Fishman et al. Practical segmentation of nuclei in brightfield cell images with neural networks trained on fluorescently labelled samples
Hyun et al. Recent development of computational cluster analysis methods for single-molecule localization microscopy images
Sáez et al. Neuromuscular disease classification system
Hajiyan et al. Multi-scale local explanation approach for image analysis using model-agnostic Explainable Artificial Intelligence (XAI)
Chang et al. Graphical methods for quantifying macromolecules through bright field imaging
JP6999118B2 (ja) 画像処理装置
Strömblad et al. Using Systems Microscopy To Understand The Emergence Of Cell Migration From Cell Organization
Edwards et al. TDAExplore: quantitative image analysis through topology-based machine learning
Qidwai et al. Color-based fuzzy classifier for automated detection of cancerous cells in histopathological analysis
Zhang et al. SwinCell: a transformer-based framework for dense 3D cellular segmentation
Khater Machine learning and network analysis for macromolecular structure determination from super-resolution microscopy
Grimes Image processing and analysis methods in quantitative endothelial cell biology
Faezi et al. Multi-Spectral Source-Segmentation using Semantically-Informed Max-Trees

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220704

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230328

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230411

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230626

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230815

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230824

R150 Certificate of patent or registration of utility model

Ref document number: 7343215

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150