JP2019537102A - 最適候補化合物を検出するためのコンピュータ装置およびその方法 - Google Patents

最適候補化合物を検出するためのコンピュータ装置およびその方法 Download PDF

Info

Publication number
JP2019537102A
JP2019537102A JP2019517016A JP2019517016A JP2019537102A JP 2019537102 A JP2019537102 A JP 2019537102A JP 2019517016 A JP2019517016 A JP 2019517016A JP 2019517016 A JP2019517016 A JP 2019517016A JP 2019537102 A JP2019537102 A JP 2019537102A
Authority
JP
Japan
Prior art keywords
class
compound
sample
image data
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019517016A
Other languages
English (en)
Other versions
JP7130630B2 (ja
Inventor
フェンテス,エマニュエル・イスラエル
アヴィナシュ,ゴパル・ビリゲリ
グレイブス,ロバート・ジョン
ザット,アブヒジット・ヴィジェイ
コデシュ,アフェク
ジェフェリー,カロン
ダス,シャーミスタ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Global Life Sciences Solutions USA LLC
Original Assignee
Amersham Biosciences Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Amersham Biosciences Corp filed Critical Amersham Biosciences Corp
Publication of JP2019537102A publication Critical patent/JP2019537102A/ja
Priority to JP2022111675A priority Critical patent/JP2022141771A/ja
Application granted granted Critical
Publication of JP7130630B2 publication Critical patent/JP7130630B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • G06T7/0014Biomedical image inspection using an image reference approach
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/763Non-hierarchical techniques, e.g. based on statistics of modelling distributions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/80Data visualisation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • G06F2218/16Classification; Matching by matching signal segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/24Indexing scheme for image data processing or generation, in general involving graphical user interfaces [GUIs]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30024Cell structures in vitro; Tissue sections in vitro

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Software Systems (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Molecular Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Quality & Reliability (AREA)
  • Radiology & Medical Imaging (AREA)
  • General Engineering & Computer Science (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Image Analysis (AREA)

Abstract

本発明は、セル株および1つ以上のバイオマーカを含む複数のサンプル、ならびにプレートマップ配置に基づいて、最適候補化合物を検出するためのコンピュータ装置のための方法であって、プレートマップ配置は、1つ以上のバイオマーカおよび少なくとも1つの濃度勾配を形成する異なる濃度の候補化合物に曝露されたセル株を含むサンプルの位置を提供しており、候補化合物は、複数の候補化合物に含まれており、当該方法は、複数の連続的な時点における複数の候補化合物の各々の各々の濃度勾配の表現型プロファイルを生成して、複数の化合物プロファイルを形成するステップ(310)であって、表現型プロファイルの生成は、濃度勾配に含まれる各サンプルを表す画像データを取得するステップ(312)と、画像データに基づいてサンプルの各セルについてクラスラベルおよびクラスを生成するステップ(314)とを含むステップ(310)と、複数の化合物プロファイルについて比較基準を評価することによって最適候補化合物を検出するステップ(320)とを含む、方法に関する。さらに、本発明は、対応するコンピュータ装置、コンピュータプログラム、およびコンピュータプログラム製品に関する。【選択図】図1

Description

本発明は、最適候補化合物を検出するためのコンピュータ装置に関する。さらに、本発明は、対応する方法、コンピュータプログラム、およびコンピュータプログラム製品に関する。
例えば医学的用途を意図した化合物など、実験における新規化合物の試験および評価は、典型的には、生物学的文脈においてセル機構を研究して、複数の候補化合物から候補化合物を検出および/または選択することを含み得る。例えばウェルプレートの所定の位置にプレートマップ配置に従って配置された複数のサンプルを含む実験を、純粋に、例えば研究対象のセルの観察可能な特徴または形質などの生物学的表現型への新たな洞察を発見または説明するために、実行することができる。実験から得られる大量の高次元(高密度)のサイトメトリデータセットを解釈することは、例えば統計的な実験の洞察の生成およびセル集団の分類の実行によって、研究者および科学者にとって問題を引き起こす。とくに、サンプル中のセルなどの生物学的な対象物の自動分類のための従来からのツールまたはシステムの欠点は、ユーザが、一変量および二変量可視化を利用して、クラスおよび/またはセル集団領域の間のカットオフ領域および/または決定領域を決定しなければならないことである。さらに、単一の指標を使用し、潜在的には単一の視野(FOV)の反復分析を実行することによって視覚的に実験のサイトメトリデータセットを分析するとき、セル集団間の決定領域の決定は、線形で明確な輪郭であることがまれであり、集団の粒度を理解することが困難であり得る。さらなる手作業のサイトメトリセル指標の調査は、労働集約的であり、どのサイトメトリセル指標が分析において適当であり、どれが集団の分割において最良の能力を含み、したがってヒューマンエラーに対して脆弱であるかを選択することは、困難である。いくつかの従来からのシステムは、視覚によるセルのラベリングおよび教師付きのセル分類を含む2段階の手動プロセスを適用する。これらのシステムの使用は、ユーザがセルをクリックして、それらに手作業でのテキスト入力によって注釈を付けることにより、セルオブジェクトをそれぞれのセル集団の見本として分類することを必要とする。これは、比較的時間がかかる労働集約的なプロセスであるという欠点を有する。これは、通常は、単一の視野を表す画像データを眺めることによって行われ、そのような単一の視野は、用量反応が存在する場合にセル集団の全体を表すことはまれであるため、予測モデリングの可能性が低くなり、したがって入手可能な大規模かつ高密度のデータセットに本来備わっている潜在力が制限されるという欠点を有する。従来からのシステムにおける傾向は、特徴の抽出および/またはサイトメトリの特徴を、それらが人間の理解に束縛されるがゆえに回避し、代わりに、例えばサイトメトリの特徴よりも少ない労力でコンピュータによって抽出することができる指標および/または特徴などの特徴の機械学習に頼ることを試みる。特徴の機械学習の使用の欠点は、それらをユーザが理解または解釈することが困難または不可能であり、したがってユーザによる入力および/または中間データの有効性および/または偏差の評価および排除が、不可能なことである。
したがって、従来からの解決策の欠点および問題を軽減または解決する解決策を提供する必要がある。
本発明の実施形態の目的は、従来からの解決策の欠点および問題を軽減または解決する解決策を提供することである。上記の目的およびさらなる目的は、独立請求項の主題によって達成される。本発明のさらなる好都合な実装形態が、従属請求項によって定められる。
本発明の第1の態様によれば、上記の目的および他の目的は、セル株および1つ以上のバイオマーカを含む複数のサンプルに基づいて最適候補化合物を検出するためのコンピュータ装置によって達成される。最適候補化合物の検出は、プレートマップ配置にさらに基づく。プレートマップ配置は、1つ以上のバイオマーカおよび少なくとも1つの濃度勾配を形成する異なる濃度の1つ以上の候補化合物に曝露されたセル株を含むサンプルの位置を提供しており、候補化合物は、複数の候補化合物に含まれており、コンピュータ装置は、プロセッサおよびメモリを備え、前記メモリが、前記プロセッサによって実行することができる命令を含むことにより、このコンピュータ装置は、複数の連続的な時点における複数の候補化合物の各々の各々の濃度勾配の表現型プロファイルを生成して、複数の化合物プロファイルを形成するように動作することができる。コンピュータ装置は、濃度勾配に含まれる各サンプルを表す画像データをさらに取得することによって表現型プロファイルをさらに生成し、画像データに基づいてサンプルの各セルについてクラスラベルおよびクラスを生成するようにさらに動作することができる。さらに、コンピュータ装置は、複数の化合物プロファイルについて比較基準を評価することによって最適候補化合物を検出するように動作することができる。
この態様の利点は、例えば最適候補化合物を検出するための統計的実験の洞察が、化合物プロファイルを生成し、複数の化合物プロファイルについて比較基準を評価することによって最適候補化合物を検出することにより、効率的なやり方でプレートマップ配置に関する大きな高次元(高密度)のサイトメトリデータセットを処理することによって改善されることである。さらなる利点は、必要とされる時間および労力を、人間の相互作用を最小限で済ませ、あるいは全く必要とせずに、クラスラベルおよびクラスおよび/またはセル集団領域を生成することによって、低減できることである。
第1の態様によるコンピュータ装置の第1の可能な実装形態において、コンピュータ装置は、入力装置および表示装置をさらに備え、コンピュータ装置は、各々のクラスラベルおよび/またはクラスについてサンプルの少なくとも1つのセルを表す画像データの典型的なサブセットを選択し、画像データの典型的なサブセットならびにそれぞれのクラスラベルおよび/またはクラスをユーザへと表示装置上に表示し、少なくとも1つのクラスラベルおよび/またはクラスについての操作を表すユーザによって示されるユーザ入力データを入力装置から受信し、ユーザ入力データに基づいてサンプルのセルのクラスラベルおよび/またはクラスについての操作を実行するようにさらに動作することができる。第1の実装形態の一実施形態において、コンピュータ装置は、クラス追加、クラス削除、クラス分割、またはクラス併合のうちの1つから選択された動作を実行するようにさらに動作可能である。
この実装形態の利点は、視覚化の精通および概念的な理解をユーザに提供し、反復的なユーザ修正を可能にし、したがって分類の品質および/または信頼性を向上させることである。
第1の態様の第1の実装形態または第1の態様自体によるコンピュータ装置の第2の可能な実装形態において、コンピュータ装置は、さらには、1つ以上の基準化合物プロファイルを取得し、1つ以上の基準化合物プロファイルに基づいて複数の化合物プロファイルの各々の化合物プロファイルについて多次元差分値を計算し、複数の化合物プロファイルについて比較基準を多次元差分値に基づいて評価することによって最適候補化合物を検出することによって、最適候補化合物を検出するように動作することができる。この実装形態の一実施形態において、多次元差分値は、好ましくはN次元であり、Nは2以上である。より好ましくは、多次元差分値は、N次元であり、Nは3より大きい。
この実装形態の利点は、候補化合物の検出の品質が、化合物プロファイルを含む高次元(高密度)データセットにわたる評価によって信頼性および/または品質を改善することによって改善されることである。
第1の態様の第1または第2の実装形態あるいは第1の態様自体によるコンピュータ装置の第3の可能な実装形態において、コンピュータ装置は、複数の視野から濃度勾配に含まれる各サンプルを表す画像データを取得するように動作可能であり、さらには/あるいは画像データは、複数の画像フィルタで処理された濃度勾配に含まれる各サンプルを表している。
この実装形態の利点は、セルが複数の視野を使用して表され、さらには/あるいは複数の画像フィルタを使用して表されるため、表現型プロファイルの品質、したがって化合物プロファイルの品質が、サンプルのセルのクラスラベルおよびクラスを生成するときの信頼性および/または品質の改善によって改善されることである。
第1の態様の上述のいずれかの実装形態あるいは第1の態様自体によるコンピュータ装置の第4の可能な実装形態において、コンピュータ装置は、さらには、画像データに基づいて各々のセルについてサイトメトリパラメータセットを生成して、サイトメトリパラメータセットの第1の集合を形成し、パラメータ類似度関数および第1の集合に基づいてサイトメトリパラメータセットをクラスおよび/または表現型クラスにマッピングするように構成された表現型分類モデルを生成することによって、表現型プロファイルを生成するように動作することができ、パラメータ類似度関数は、第1の集合のサイトメトリパラメータセットを互いに相関付けるように構成される。第4の実装形態の一実施形態において、コンピュータ装置は、パラメータ類似度関数および第1の集合に基づいてサイトメトリパラメータセットをクラスにマッピングするように構成された表現型分類モデルをさらに生成することによって表現型プロファイルを生成するように動作することができ、パラメータ類似度関数は、第1の集合のサイトメトリパラメータセットを互いに相関付けるように構成される。
この実装形態の利点は、ユーザによって選択された単一のサイトメトリパラメータおよび/またはサイトメトリセル指標に依存する従来からの方法と対照的に、例えば高次元または高密度のサイトメトリパラメータセットが分類に使用されるため、ヒューマンエラーに対する脆弱性が低減されることである。この実装形態のさらなる利点は、表現型分類モデルの生成されたクラスを連続した実験で再利用できるため、予測モデリングの可能性がさらに向上し、必要な時間および労力がさらに削減されることである。
第1の態様の上述のいずれかの実装形態あるいは第1の態様自体によるコンピュータ装置の第5の可能な実装形態において、コンピュータ装置は、表現型プロファイルおよび/または化合物プロファイルを表示装置上に表示するようにさらに動作することができる。
この実装形態の利点は、中間および最終結果をユーザへと視覚化することによって、ユーザの理解が改善され、したがって検出に必要な時間が短縮されることである。
第1の態様の上述のいずれかの実装形態あるいは第1の態様自体によるコンピュータ装置の第6の可能な実装形態において、候補化合物の濃度勾配は、複数の別々のウェルを含み、各々のウェルは、1つ以上のバイオマーカおよび異なる濃度の候補に曝露されたセル株のサンプルを含み、1つ以上のウェルプレート上にプレートマップ配置に従って配置される。
本発明の第2の態様によれば、上記の目的および他の目的は、複数のサンプルに基づいて最適候補化合物を検出するためのコンピュータ装置のための方法によって達成される。サンプルは、セル株および1つ以上のバイオマーカを含むことができる。最適候補化合物の検出は、プレートマップ配置にさらに基づく。プレートマップ配置は、1つ以上のバイオマーカと、少なくとも1つの濃度勾配を形成する異なる濃度の1つ以上の候補化合物とに曝露されるセル株を含むサンプルの位置を提供している。候補化合物は、複数の候補化合物に含まれる。本方法は、複数の連続的な時点における複数の候補化合物の各々の各々の濃度勾配の表現型プロファイルを生成し、複数の化合物プロファイルを形成することを含み、表現型プロファイルの生成は、濃度勾配に含まれる各々のサンプルを表す画像データを取得するステップと、画像データに基づいてサンプルの各々のセルについてクラスラベルおよびクラスを生成するステップと、複数の化合物プロファイルについて比較基準を評価することによって最適候補化合物を検出するステップとを含む。
この態様の利点は、例えば最適候補化合物を検出するための統計的実験の洞察が、化合物プロファイルを生成し、複数の化合物プロファイルについて比較基準を評価することによって最適候補化合物を検出することにより、効率的なやり方でプレートマップ配置に関する大きな高次元(高密度)のサイトメトリデータセットを処理することによって改善されることである。さらなる利点は、必要とされる時間および労力を、人間の相互作用を必要とせずにクラスラベルおよびクラスおよび/またはセル集団領域を生成することによって、低減できることである。
第2の態様による方法の第1の可能な実装形態においては、各々のクラスラベルおよび/またはクラスについてサンプルの少なくとも1つのセルを表す画像データの典型的なサブセットを選択するステップと、画像データの典型的なサブセットならびにそれぞれのクラスラベルおよび/またはクラスをユーザへと表示するステップと、少なくとも1つのクラスについての操作を表すユーザからのユーザ入力データを受け付けるステップと、ユーザ入力データに基づいてサンプルの少なくとも1つのセルのクラスラベルおよび/またはクラスについての操作を実行するステップとがさらに含まれる。第1の実装形態の一実施形態において、少なくとも1つのクラスについての操作は、クラスの追加、クラスの削除、クラスの分割、またはクラスの併合から選択される。
この実装形態の利点は、視覚化の精通および概念的な理解をユーザに提供し、反復的なユーザ修正を可能にし、したがって分類の品質および/または信頼性を向上させることである。
第2の態様の第1の実装形態または第2の態様自体による方法の第2の可能な実装形態において、最適候補化合物を検出するステップは、1つ以上の基準化合物プロファイルを取得することと、1つ以上の基準化合物プロファイルに基づいて複数の化合物プロファイルの各々の化合物プロファイルについて多次元差分値を計算することと、複数の化合物プロファイルについて比較基準を評価することによって最適候補化合物を検出することとをさらに含み、比較基準は、多次元差分値に基づいて評価される。
第2の態様の第1または第2の実装形態あるいは第2の態様自体による方法の第3の可能な実装形態において、画像データは、複数の視野から濃度勾配に含まれる各サンプルを表しており、さらには/あるいは画像データは、複数の画像フィルタで処理された濃度勾配に含まれる各サンプルを表している。
この実装形態の利点は、セルが複数の視野を使用して表され、さらには/あるいは複数の画像フィルタを使用して表されるため、表現型プロファイルの品質、したがって化合物プロファイルの品質が、サンプルのセルのクラスラベルおよびクラスを生成するときの信頼性および/または品質の改善によって改善されることである。
第2の態様の上述のいずれかの実装形態あるいは第2の態様自体による方法の第4の可能な実装形態において、表現型プロファイルの生成は、画像データに基づいて各々のセルについてサイトメトリパラメータセットを生成して、サイトメトリパラメータセットの第1の集合を形成することと、パラメータ類似度関数および第1の集合に基づいてサイトメトリパラメータセットをクラスおよび/または表現型クラスにマッピングするように構成された表現型分類モデルを生成することとをさらに含み、パラメータ類似度関数は、第1の集合のサイトメトリパラメータセットを互いに相関付けるように構成される。第4の実装形態の一実施形態において、表現型プロファイルの生成は、パラメータ類似度関数および第1の集合に基づいてサイトメトリパラメータセットをクラスにマッピングするように構成された表現型分類モデルを生成することをさらに含み、パラメータ類似度関数は、第1の集合のサイトメトリパラメータセットを互いに相関付けるように構成される。
利点は、ユーザによって選択された単一のサイトメトリパラメータおよび/またはサイトメトリセル指標に依存する従来からの方法と対照的に、サイトメトリパラメータセットが分類に使用されるため、分類時のヒューマンエラーに対する脆弱性が低減されることである。この実装形態のさらなる利点は、表現型分類モデルの生成されたクラスを連続した実験で再利用できるため、予測モデリングの可能性がさらに向上し、必要な時間および労力がさらに削減されることである。
本発明の第3の態様によれば、上記の目的および他の目的は、コンピュータ実行可能命令を含んでおり、コンピュータ実行可能命令は、コンピュータ装置に含まれる処理装置において実行されたときに、コンピュータ装置に、複数の連続的な時点における複数の候補化合物の各々の各々の濃度勾配の表現型プロファイルを生成して、複数の化合物プロファイルを形成するステップであって、表現型プロファイルの生成は、濃度勾配に含まれる各サンプルを表す画像データを取得するステップと、画像データに基づいてサンプルの各セルについてクラスラベルおよびクラスを生成するステップとを含むステップと、複数の化合物プロファイルについて比較基準を評価することによって最適候補化合物を検出するステップとを実行させる、コンピュータプログラムによって達成される。
第3の態様によりコンピュータプログラムの第1の可能な実装形態においては、各々のクラスラベルおよび/またはクラスについてサンプルの少なくとも1つのセルを表す画像データの典型的なサブセットを選択するステップと、画像データの典型的なサブセットならびにそれぞれのクラスラベルおよび/またはクラスをユーザへと表示するステップと、少なくとも1つのクラスラベルおよび/またはクラスについての操作を表すユーザからのユーザ入力データを受け付けるステップと、ユーザ入力データに基づいてサンプルのセルのクラスラベルおよび/またはクラスについての操作を実行するステップとを、コンピュータ装置にさらに実行させる。
第3の態様の第1の実装形態または第3の態様自体によるコンピュータプログラムの第2の可能な実装形態においては、1つ以上の基準化合物プロファイルを取得するステップと、1つ以上の基準化合物プロファイルに基づいて複数の化合物プロファイルの各々の化合物プロファイルについて多次元差分値を計算するステップと、複数の化合物プロファイルについて比較基準を評価することによって最適候補化合物を検出するステップとをさらに実行することによって、最適候補化合物を検出するステップをコンピュータ装置にさらに実行させ、比較基準は多次元差分値に基づいて評価される。
本発明の第4の態様によれば、上記の目的および他の目的は、コンピュータ可読記憶媒体を含むコンピュータプログラム製品によって達成され、コンピュータ可読記憶媒体は、第3の態様の第1の実装形態または第3の態様自体によるコンピュータプログラムの可能ないずれかの実装形態によるコンピュータプログラムを有する。
第2〜第4の態様の利点は、第1の態様による対応する方法と同じである。
本発明の実施形態のさらなる用途および利点は、以下の詳細な説明から明らかになるであろう。本発明の範囲は、参照によってこの部分に組み込まれる特許請求の範囲によって定義される。本発明の実施形態のより完全な理解、ならびにそのさらなる利点の実現が、1つ以上の実施形態の以下の詳細な説明を検討することによって、当業者にもたらされるであろう。添付の図面を、最初に簡単に説明し、参照する。
添付の図面は、本発明の種々の実施形態の明確化および説明を意図している。
本発明の実施形態によるコンピュータ装置の図を示している。 本発明の実施形態によるコンピュータ装置を含む候補化合物検出システムの図を示している。 本発明の実施形態による複数のサンプルに基づいて最適候補化合物を検出するためのコンピュータ装置のための方法のフロー図を示している。 本発明のさらなる実施形態による方法のフロー図を示している。 本発明のさらなる実施形態による方法のフロー図の詳細を示している。 本発明の実施形態に従って画像生成部によって画像データをどのように生成できるのかを概略的に示している。 本発明の実施形態に従って表現型プロファイルがどのように表示されるかの一例を示している。 本発明の実施形態による画像データの典型的なサブセットおよびそれぞれのクラスの表示の一例を示している。 本発明による方法によって生成された表現型プロファイルと手作業による方法によって生成された表現型プロファイルとの間の比較の一例を示している。 本発明の実施形態による複数のサンプルに基づいて最適候補化合物を検出するためのコンピュータ装置のための方法のフロー図を示している。
本開示の実施形態およびそれらの利点は、以下の詳細な説明を参照することによって、最もよく理解される。1つ以上の図に示されている同等の要素を特定するために、同等の参照番号が使用されることを理解されたい。
図1が、本発明の実施形態によるコンピュータ装置100の図を示している。さらなる実施形態において、コンピュータ装置100は、セル実験評価装置、サーバ、据え置き型コンピュータ装置、ラップトップコンピュータ、タブレット型コンピュータ、ハンドヘルドコンピュータ、手首装着型コンピュータ、スマートウォッチ、PDA、スマートフォン、スマートTV、電話機、メディアプレーヤー、ゲーム機、車載コンピュータシステム、またはナビゲーション装置の形態である。いくつかの実施形態において、コンピュータ装置100は、プロセッサおよび/または処理手段112を備え、プロセッサおよび/または処理手段112は、例えば処理回路、中央処理装置、プロセッサモジュール、または互いに協働するように構成された複数のプロセッサなど、プロセッサ/処理ユニットを備え、さらには/あるいはプロセッサ/処理ユニットの形態である。プロセッサおよび/または処理手段に、例えばメモリにて、本明細書に記載の方法の1つ以上の実施形態のステップおよび機能を実行するために処理手段112を制御するように構成された特別設計のプログラミングまたはプログラムコード部分を提供することができる。コンピュータ装置100は、プログラミングまたはプログラムコード部分、ならびに/あるいは処理手段112から書き込み信号として受信されたデータ値またはパラメータを記憶するように構成された少なくとも1つのメモリ115またはデータストレージをさらに備えることができる。少なくとも1つのメモリ115またはデータストレージを、データ値および/またはパラメータを取り出し、読み出し信号として処理手段112へと送信するようにさらに構成することができる。コンピュータ装置100は、例えば無線トランシーバおよび/または通信ネットワークアダプタなど、データ値またはパラメータを信号として処理手段112あるいはデータベースまたは画像生成部などの他の外部ノードへと送信し、さらには/あるいはデータ値またはパラメータを信号として処理手段112あるいはデータベースまたは画像生成部などの他の外部ノードから受信するように構成された通信インターフェース116をさらに備えることができる。一実施形態において、通信インターフェース116は、ノード間で直接通信し、あるいは通信ネットワークを介して通信する。1つ以上の実施形態において、コンピュータ装置100は、ユーザから入力または指示を受け付け、ユーザの入力または指示を表すユーザ入力信号を処理手段112へと送信するように構成された入力装置117をさらに備えることができる。1つ以上の実施形態において、コンピュータ装置は、テキストまたはグラフィカルユーザ入力オブジェクトなどのレンダリングされたオブジェクトを表す表示信号を処理手段112から受け取り、受け取った信号をテキストまたはグラフィカルユーザ入力オブジェクトなどのオブジェクトとして表示するように構成された表示装置118をさらに含む。一実施形態において、表示装置118は、ユーザ入力装置117と統合され、テキストまたはグラフィカルユーザ入力オブジェクトなどのレンダリングされたオブジェクトを表す表示信号を処理手段112から受け取り、受け取った信号をテキストまたはグラフィカルユーザ入力オブジェクトなどのオブジェクトとして表示するように構成され、さらには/あるいはユーザから入力または指示を受け付け、ユーザの入力または指示を表すユーザ入力信号を処理手段112へと送信するように構成される。一例において、入力データは、ユーザによって示され、少なくとも1つのクラスラベルおよび/またはクラスに対する操作を表す。いくつかの実施形態において、処理手段112は、メモリ115および/または通信インターフェースおよび/または入力装置および/または表示装置および/または随意によるセンサ(図示せず)に通信可能に接続される。いくつかの実施形態において、通信インターフェース116は、有線および/または無線通信技術を使用して通信する。いくつかの実施形態において、1つ以上のメモリ115は、ハードRAM、ディスクドライブ、フロッピーディスクドライブ、磁気テープドライブ、光ディスクドライブ、CDまたはDVDドライブ(RまたはRW)、あるいは他のリムーバブルまたは固定メディアドライブの選択を含むことができる。
一実施形態において、コンピュータ装置100は、例えば実験において最適候補化合物を検出するために提供される。一例において、実験は、セルにおいて、コンピュータ装置によって画像化され、調査中の生物学的プロセスへの洞察を提供すると予測される蛍光タグで標識された1つ以上のバイオマーカを、測定するように構成される。最適候補化合物の検出は、セル株および1つ以上のバイオマーカを含む複数のサンプルに基づくことができる。一例において、複数のサンプルは、哺乳動物起源のセル株を含むことができる。さらに別の例において、セル株は、他の種に由来し、あるいはヒト組織などの組織から抽出されたセルまたは上述の目的でマイクロタイタ−プレートへともたらすために適した任意の他のコンテンツを含むことができる。
1つ以上のバイオマーカは、オワンクラゲ(jellyfish Aequorea Victoria)からの緑色蛍光タンパク質(GFP)などの遺伝子組み換えセル株によって生成された蛍光タンパク質、または天然タンパク質を検出するために使用される蛍光標識抗体であってよい。さらなる例においては、「4’,6−ジアミジノ−2−フェニルインドール」(DAPI)などの蛍光セル染色剤が、核または核酸に使用され、種々の他のセル浸透性蛍光染色剤を、他のセル構造を標識するために使用することができる。
最適候補化合物の検出は、プレートマップ配置230にさらに基づくことができる。プレートマップ配置230は、例えばウェルプレート上に配置され、1つ以上のバイオマーカと、少なくとも1つの濃度勾配660を形成する異なる濃度の1つ以上の候補化合物とに曝露されるセル株を含むサンプルの位置を提供している。一例において、プレートマップ配置は、メモリ115および/または外部ノードおよび/または内部もしくは外部データベースに記憶され、例えばウェルプレートのアイデンティティならびに行および列のペアを表すデータ構造の形態である。さらなる例において、プレートマップ配置は、1つ以上のバイオマーカについて蛍光標識され、さらには/あるいは1つ以上のバイオマーカおよび種々の濃度の1つ以上の候補処理/化合物に曝露されたセル株を含むサンプルの位置を提供しており、候補処理/化合物は、予測された効果または未知の効果を有する天然または合成由来の種々の化合物、ならびに少なくとも1つの濃度勾配を形成する形態で配列され得る化合物を含むことができる。さらに、プレートマップ配置は、ウェルプレート上での候補化合物の位置、および溶媒中の溶質などの候補化合物の濃度を表すことができる。さらなる例において、プレートマップ配置は、複数のウェルプレートにわたるサンプルの位置を表すことができる。1つ以上の候補化合物のサンプルは、プレートマップ配置230に従ってウェルプレート上に配置されてよく、さらには/あるいはプレートマップ配置230に従ったウェルプレート上の位置を有することができる。候補化合物は、例えば特定の目的または効果について試験される多数の候補化合物など、複数の候補化合物に含まれてよい。コンピュータ装置100は、プロセッサ112およびメモリ115をさらに備えることができる。さらに上述したように、前記メモリ115は、前記プロセッサ112によって実行可能な命令を含む。前記プロセッサ112は、処理回路、中央処理装置、プロセッサモジュール、または互いに協働するように構成された複数のプロセッサであってよい。コンピュータ装置100は、複数の連続的な時点における複数の候補化合物の例えば各々の候補化合物の各々の濃度勾配660の表現型プロファイルを生成し、複数の化合物プロファイルを形成するように動作可能であってよい。一例において、濃度勾配の表現型プロファイルは、濃度勾配に含まれる各々のサンプルにおける各クラスおよび/または表現型クラスのセル数を含むことができ、ここで各々のサンプルは異なる濃度の候補化合物を含んでいる。表現型プロファイルは、図9に関連してさらに説明される。さらに、コンピュータ装置100は、濃度勾配に含まれる各サンプルを表す画像データを取得するステップと、画像データに基づいて濃度勾配に含まれるサンプルおよび/または各サンプルの各セルについてクラスラベルおよびクラスを生成するステップと、複数の化合物プロファイルについて比較基準を評価することによって最適候補化合物を検出するステップとをさらに実行することによって表現型プロファイルを生成するように動作可能であってよい。比較基準は、当業者にとって利用可能な損失関数および/または費用関数および/または最小化基準であってよい。一例において、表現型プロファイルは、候補化合物の濃度勾配660のサンプル内の各クラスについて、セル数を絶対数またはサンプル内のセルの総数のパーセンテージ%として表すデータを含む。さらなる一例において、濃度プロファイルは、クラスについてのセル数および候補化合物の濃度勾配660の濃度を表すデータを含む。さらなる一例において、表現型プロファイルは、複数の濃度プロファイルを含むことができる。一例において、濃度勾配に含まれる各サンプルを表す画像データの取得は、メモリ115からの画像データの取り出しおよび/または受信、外部ノードからの画像データの取り出しおよび/または受信、内部および/または外部データベースからの画像データの取り出しおよび/または受信、あるいは画像生成部からの画像データの取り出しおよび/または受信を含む。一例において、クラスラベルおよびクラスの生成は、セルオブジェクトとして各セルの画像データをセグメント化すること、および/または画像データに基づいてセルオブジェクトとして各セルのサイトメトリパラメータセットを生成することを含む。セルオブジェクトを、データ構造として実装することができる。
使用事例の実施形態において、本開示を、セルの実験的動揺に起因して既知のセル表現型において生じ得る変化を調査するセルのベースライン表現型検査に使用することができる。実験を、純粋に、生物学的表現型、すなわち研究対象のセルの観察可能な特徴または形質への新たな洞察を発見または説明するために行うことができる。実験的動揺の種類として、多くの場合に遺伝子組み換え技術、生物活性分子を発見するための大規模薬物スクリーニングキャンペーン、およびセルベースの毒性試験を用いて、セル内の酵素活性を阻害または促進する効果を観察することを挙げることができる。これらの研究の明確な特徴は、既知の表現型の存在であり、その目的は、セル株中のセルの被処理サンプルにおける表現型プロファイルを、同じセル株の未処理対照サンプルと比較することである。これらの実験は、一般に、マルチウェルプレートにおいて行われるため、物理的な実験のレイアウトを、例えばプレートマップ配置として、観察結果にマッピングする必要がある。この例において、サンプルの表現型プロファイリングは、単一のセルタイプをセル周期状態などの異なるサブクラスへと分類することを必要とし得る。また、セルタイプの混合が存在する可能性があり、セルタイプに特有の分類ツールが必要とされる組織のセルモデルを開発する傾向も高まっている。本開示は、より迅速かつより正確な分類など、ユーザ目的のワークフローの単純化を目的とする半教師付きパイプラインを提供する。本開示は、そのようなデータ特性に基づいてクラスラベルおよび/またはクラスを生成するのに好適なコンピュータ装置およびその方法を活用する。さらなる例においては、画像データに基づいてサンプルの各セルについてクラスラベルおよびクラスを生成することを、k平均などの教師なしクラスタリングおよび/または分類アルゴリズムを使用して、N次元のセルごとのデータおよび/またはサイトメトリパラメータセットの全体における内在クラスを導出することによって、実行することができる。さらなる例においては、例えばワードクラスタリング、階層的クラスタリング、または自己組織化マップなど、教師なしクラスタリング技術のファミリーからの任意のクラスタリングおよび/または分類アルゴリズムを使用することができる。
本開示において、サンプルの各セルについてのクラスラベルおよびクラスの生成は、例えば表現ベースのモデル(expression−based model)など、表現型分類モデルの生成を含むことができる。さらに、本開示は、反復的なユーザ修正を可能にするとともに、デフォルトでは最小限のユーザインタラクションしか必要とせず、もしくはユーザインタラクションを必要とせずに、表現ベースのモデルをもたらすことができる。本開示は、候補化合物から製品までの時間の短縮、より正確なデータ操作、ユーザエラーの排除、事前のユーザ知識の必要性の排除、機械学習の一部としての継続的成長および学習、表現型プロファイルライブラリ/レポジトリを作成する能力、知識/リソースを外挿して顧客にとって手頃なソリューションを生み出す能力、およびより高い忠実度のワークフローの提供など、多数の利点を有する。問題の複雑さのさらなる例として、高次元サイトメトリデータに基づくセルの分類が挙げられる。画像由来のサイトメトリデータは、当然ながら、高次元であり、そして体積、量、および/またはストレージ空間が大きい。例えば色などの波長帯など、取得された画像データの各々の画像データチャネルについて、抽出することができる画像の特徴の数はますます増えている。2つの画像データチャネルによる簡単な実験は、約30の測定値を有する。問題の複雑さは、急速に「次元の呪い」の領域にある。控えめな予備的研究において、典型的には、数テラバイト程度のデータセットが生じる。画像の取得および/または捕捉および/または生成において使用される倍率に基づき、単一の視野を含む画像データに、約300〜500個のセルオブジェクトおよび/またはセルオブジェクトが含まれる。ウェル内のサンプルを表す約3つの視野を含む画像データ、最も一般的なマイクロタイタ−プレートおよび/またはプレートマップ配置および/またはウェルプレート実験における96個のウェル、ならびにスクリーンごとに数百のプレートマップ配置および/またはウェルプレートにおいて、全体としてのセルオブジェクトの数は、数百万に達し得る。したがって、候補化合物を検出するために必要な時間および労力の要求を低減する必要性は、きわめて高い。
一実施形態においては、入力装置117および表示装置118をさらに備えるコンピュータ装置100が提供され、コンピュータ装置100は、各々のクラスラベルおよび/またはクラスについてサンプルの少なくとも1つのセルを表す画像データの典型的なサブセットを選択し、画像データの典型的なサブセットならびにそれぞれのクラスラベルおよび/またはクラスを表示装置118においてユーザへと表示し、少なくとも1つのクラスラベルおよび/またはクラスについての動作を表すユーザによって示される入力装置117からのユーザ入力データを受け取り、ユーザ入力データに基づいてサンプルのセルのクラスラベルおよび/またはクラスについての動作を実行するようにさらに動作することができる。第1の実装形態の一実施形態において、コンピュータ装置100は、クラス追加、クラス削除、クラス分割、またはクラス併合のうちの1つから選択される動作を実行するようにさらに動作可能である。一例においては、例えば「死滅」などの同じクラスのセルが、第1および第2のグループおよび/またはクラスとして分類されている。表示装置において画像データの典型的なサブセットを眺めるユーザは、それらが実際には同じクラスに属するべきであることに気付き、第1および第2のグループおよび/またはクラスを併合すべきであると判断し、これを入力装置によって示すことができる。次いで、コンピュータ装置100は、第2のグループ/クラスのクラスおよび/またはクラスラベル情報を第1のグループ/クラスと同一になるように設定し、2つのクラスのセルおよび/またはセルオブジェクトを単一のクラスに効果的に合併させることができる。さらなる一例において、少なくとも1つのセルを表す画像データのサブセットは、2Dサムネイルの形態で表示され、それぞれのクラスラベルおよび/またはクラスは、図8に関してさらに説明される1つ以上のサムネイルを囲む矩形として表示される。
一実施形態においては、表現型プロファイルおよび/または化合物プロファイルを表示装置118に表示するようにさらに動作することができるコンピュータ装置が提供される。一例において、表現型プロファイルは、線グラフとして表示され、化合物プロファイルは、ボックスプロットとして表示される。さらなる例において、表現型プロファイルおよび/または化合物プロファイルは、化合物濃度および/または濃度勾配に関し、さらには複数の連続的な時点および/または時間に関して、各々のそれぞれのクラスについてセル数を表示する線グラフプロットとして、表示装置に表示される。表現型プロファイルおよび/または化合物プロファイルを、線プロット、回帰プロット、または表面プロットとして表示することができる。
一実施形態においては、最適候補化合物を検出するときに、1つ以上の基準化合物プロファイルを取得し、1つ以上の基準化合物プロファイルに基づいて複数の化合物プロファイルの各々の化合物プロファイルについて多次元差分値を計算し、複数の化合物プロファイルについて比較基準を評価することによって最適候補化合物を検出するようにさらに動作することができるコンピュータ装置が提供され、比較基準は、多次元差分値に基づいて評価される。比較基準は、損失関数および/または費用関数および/または最小化基準であってよい。一例において、比較基準は、観察またはデータが平均から相違する標準偏差の符号付きの数を表す三次元Z値および/または基準である。さらなる例において、基準化合物プロファイルは、90%の「死んでいない」、3%の「死んでいる」、および7%の「その他」のセル数を指示する。化合物プロファイルは、異なる濃度および時間に関してそれぞれのセル数を示す。多次元差分値を、三次元Z値として計算することができ、かつ/または各クラスの差セル数の幾何平均として計算することができる。
一実施形態においては、候補化合物の濃度勾配が複数の別々のウェル620を含んでおり、各々のウェル620が、1つ以上のバイオマーカおよび異なる濃度の候補に曝露されたウェルプレート上にプレートマップ配置230に従って配置されたセル株のサンプルを含むコンピュータ装置が提供される。
図2が、本発明の実施形態によるコンピュータ装置100を含む候補化合物検出システム200の図を示している。システム200は、図1に関してさらに説明したように、コンピュータ装置100を含むことができる。システムは、例えばリレーショナルデータベース、オブジェクトリレーショナルデータベース、XMLデータベース、NoSQLデータベース、またはNewSQLデータベースなどのデータベース210をさらに含むことができる。データベース210を、画像データなどのデータを格納し、直接または通信ネットワーク240を介してコンピュータ装置100へと送信するように構成することができる。通信ネットワークは、任意の有線または無線通信ネットワークであってよい。通信ネットワーク240を、これらに限られるわけではないが、ローカルエリアネットワーク(LAN)、メトロポリタンエリアネットワーク(MAN)、グローバル移動体ネットワークシステム(GSM)、拡張データGSM環境(EDGE)、高速ダウンリンクパケットアクセス(HSDPA)、広帯域符号分割多元接続(W−CDMA)、符号分割多元接続(CDMA)、時分割多元接続(TDMA)、Bluetooth(登録商標)、Zigbee(登録商標)、Wi−Fi、ボイスオーバーインターネットプロトコル(VoIP)、LTE Advanced、IEEE802.16m、WirelessMAN−Advanced、エボルブド高速パケットアクセス(HSPA+)、3GPPロングタームエボリューション(LTE)、モバイルWiMAX(IEEE 802.16e)、ウルトラモバイルブロードバンド(UMB)(以前のEvolution−Data Optimized(EV−DO)Rev.C)、シームレスハンドオフ直交周波数分割多重による高速低レイテンシアクセス(Flash−OFDM)、大容量空間分割多元接続(iBurst(登録商標))およびモバイルブロードバンド無線アクセス(MBWA)(IEEE 802.20)システム、高性能無線メトロポリタンエリアネットワーク(HIPERMAN)、ビーム分割多元接続(BDMA)、マイクロ波アクセス用ワールドインターオペラビリティ(Wi−MAX)、ならびに超音波通信、などから選択することができる。システムは、画像生成部220をさらに含むことができる。画像生成部220を、画像データを生成し、直接または通信ネットワーク240を介してコンピュータ装置100へと送信するように構成することができる。システムは、1つ以上のプレートマップ配置230および/またはそれぞれのウェルプレートをさらに含むことができる。画像生成部220を、プレートマップ配置230および/またはウェルプレートに従って配置され、さらには/あるいはプレートマップ配置230および/またはウェルプレート上に配置された1つ以上のサンプルを表す画像データを生成するように構成することができる。プレートマップ配置230および/またはウェルプレートは、サンプルを受け入れるように構成された複数の別々のウェルまたはレセプタクルを表すことができ、さらには/あるいは含むことができる。各々のウェルは、1つ以上のバイオマーカおよび濃度勾配の候補化合物の決定された濃度に曝露されたセル株を含むサンプルを含むことができ、例えばウェルプレート上にプレートマップ配置に従って配置される。
1つ以上のプレートマップ配置230および/またはウェルプレートに含まれる複数のウェルは、同じ1つ以上のバイオマーカであってよい1つ以上のバイオマーカおよび少なくとも1つの濃度勾配を形成する候補化合物の異なる濃度に曝露されたセル株のサンプルを含むことができる。一例においては、セル株のセルがウェルに含まれ、さらには/あるいはプレートマップ配置および/またはウェルプレートの第1列に配置されたサンプルが、同じ1つ以上のバイオマーカならびに第1の候補化合物の第1の濃度勾配および/または異なる濃度に曝露される。さらに、プレートマップ配置および/またはウェルプレートの第2の列に配置された各々のウェルに含まれるサンプルのセルは、同じ1つ以上のバイオマーカならびに第2の候補化合物の第2の濃度勾配および/または異なる濃度に曝露される。さらなる例においては、候補化合物の異なる濃度が、複数の列にわたって分布する。さらなる例においては、複数の候補化合物が、複数のプレートマップ配置および/またはウェルプレートにわたって分布する。画像生成部220を、例えば候補化合物の異なる濃度を含む各々のウェルに含まれる各々のサンプルを表す各々の濃度勾配を表す画像データを生成および/または捕捉するように構成することができる。一例において、画像生成部220は、可視光デジタルカメラ、赤外線デジタルカメラ、あるいはX線、ラジオグラフィ、超音波、コンピュータ断層撮影(CT)、陽電子放出断層撮影(PET)を含む核医学、および磁気共鳴イメージング(MRI)システムなどの放射線システムの群から選択される。さらなる例において、画像生成部220は、蛍光顕微鏡法および/または伝統的な明視野技術を使用する。画像データを、ピクセル、ボクセル、またはベクトルデータとして表すことができる。画像データは、各々のウェルに含まれるサンプルのセルの各々のサンプルの複数の視野を含むことができ、さらには/あるいは画像データは、複数の画像フィルタで処理された濃度勾配に含まれる各々のサンプルを表すソース画像の複数のバージョンを含むことができる。
本発明のさらなる態様においては、本開示による方法が提供される。
一実施形態においては、複数の連続的な時点における複数の候補化合物の各々の各々の濃度勾配660の表現型プロファイルを生成し、複数の化合物プロファイルを形成すること(310)と、複数の化合物プロファイルについて比較基準を評価することによって最適候補化合物を検出すること(320)とを含む方法が提供される。
図3が、本発明の実施形態による複数のサンプルに基づいて最適候補化合物を検出するためのコンピュータ装置100のための方法のフロー図を示している。サンプルは、少なくともセル株、1つ以上のバイオマーカを含むことができる。サンプルを、プレートマップ配置230上に配置および/またはプレートマップ配置230に従って配置することができ、さらには/あるいはウェルプレート上に配置することができる。プレートマップ配置230は、1つ以上のバイオマーカと、例えばプレートマップ配置230に従って配置された少なくとも1つの濃度勾配660を形成する異なる濃度の1つ以上の候補化合物とに曝露されるセル株を含むサンプルの位置を提供することができる。候補化合物は、例えば実験の多数の化合物部分など、複数の候補化合物に含まれてよい。一実施形態において、本方法は、複数の連続的な時点における複数の候補化合物の各々の各々の濃度勾配660の表現型プロファイルを生成し、複数の化合物プロファイルを形成すること(310)を含み、表現型プロファイルの生成は、濃度勾配に含まれる各々のサンプルを表す画像データを取得するステップ312と、画像データに基づいてサンプルの各々のセルについてクラスラベルおよびクラスを生成するステップ314と、複数の化合物プロファイルについて比較基準を評価することによって最適候補化合物を検出するステップ320とを含む。
図4が、本発明のさらなる実施形態による方法のフロー図を示している。この方法は、各々のクラスラベルおよび/またはクラスについてサンプルの少なくとも1つのセルを表す画像データの典型的なサブセットを選択するステップ315と、画像データの典型的なサブセットならびにそれぞれのクラスラベルおよび/またはクラスをユーザへと表示するステップ316と、少なくとも1つのクラスについての操作を表すユーザからのユーザ入力データを受け付けるステップ317と、ユーザ入力データに基づいてサンプルのセルのクラスラベルおよび/またはクラスについての操作を実行するステップ318とをさらに含む。第1の実装形態の一実施形態において、少なくとも1つのクラスについての操作は、クラスの追加、クラスの削除、クラスの分割、またはクラスの併合から選択される。一例において、画像データの典型的なサブセットは、画像データがクラスをどの程度良好に表しているかについての信頼度を計算し、典型的なサブセットを最も高い信頼度を有する画像データとして選択することによって選択される。
図5が、本発明のさらなる実施形態による方法のフロー図の詳細を示している。一実施形態において、この方法の最適候補化合物を検出するステップ320は、1つ以上の基準化合物プロファイルを取得するステップ322と、1つ以上の基準化合物プロファイルに基づいて複数の化合物プロファイルの各々の化合物プロファイルについて多次元差分値を計算するステップ324と、複数の化合物プロファイルについて比較基準を評価することによって最適候補化合物を検出するステップ320とをさらに含み、比較基準は、多次元差分値に基づいて評価される。
一実施形態において、画像データは、複数の視野650からの濃度勾配660に含まれる各サンプルを表しており、さらには/あるいは画像データは、複数の画像フィルタで処理された濃度勾配660に含まれる各サンプルを表している。
一実施形態において、表現型プロファイルの生成は、画像データに基づいて各々のセルについてサイトメトリパラメータセットを生成して、サイトメトリパラメータセットの第1の集合を形成することをさらに含む。一実施形態において、表現型プロファイルの生成は、パラメータ類似度関数および第1の集合に基づいてサイトメトリパラメータセットをクラスにマッピングするように構成された表現型分類モデルを生成することをさらに含み、パラメータ類似度関数は、第1の集合のサイトメトリパラメータセットを互いに相関付けるように構成される。
一例において、類似度関数は、相関関数であり、より好ましくは2つ以上のサイトメトリパラメータセットにわたって動作するように構成された多次元相関関数である。さらなる例において、類似度関数は、例えば自己組織化マップ、自動エンコーダ、Wardクラスタリング、K平均クラスタリング、t−SNE次元削減など、機械学習技術から選択される。
一実施形態において、表現型プロファイルの生成は、各々のセルについてサイトメトリパラメータセットに基づいて偏差度および/または除外基準を表示することと、ユーザ入力データを受け取ることと、画像データが有効(viable)でなく、あるいは残りの画像データセットから実質的に逸脱していることを示すユーザ入力データに基づいてセルを表す画像データを除外することとをさらに含む。一例において、偏差度および/または除外基準は、サイトメトリパラメータセットに含まれるサイトメトリパラメータの平均に対する標準偏差または距離指標である。この実施形態の利点は、入力および/または中間データの有効性および/または偏差をユーザが評価できることである。
一例においては、画像データおよび/または蛍光画像が、サイトメトリ測定値および/またはサイトメトリパラメータセットに関連するセルオブジェクトへと変換および/または生成される。次いで、ユーザは、手動でデータを検索して、実験、ならびにセル株、化合物、および異なる濃度などのさまざまな変化に起因して存在する反応について、ベースラインの理解を構築する。加えて、視野を含む特定の画像データについて、焦点が合っておらず、あるいは画像データにアーチファクトが存在し、画像処理特徴抽出および/または各セルについてのサイトメトリパラメータセットの生成に影響が及ぶ場合がある。セルについてのクラスラベルおよびクラスを生成する前に、有効でなく、かつ/または残りのデータセットから実質的に逸脱している実験の局面を、排除することが重要である。これらの考察を念頭に、本発明の発明者は、主成分分析、分散しきい値を用いた特徴選択、例えばピアソン(Pearson)およびスピアマン(Spearman)などの相関統計、制御基準正規化、オブジェクト特徴ベクトルプロファイル、階層的クラスタリング、およびt分布確率的近隣埋め込み(t−SNE)の選択に基づいて、一組の分析を開発した。
図6が、画像生成部220によって画像データをどのように生成できるのかを概略的に示している。一実施形態においては、複数のウェル620が、プレートマップ配置230および/またはウェルプレートに含まれる。複数のウェル620の組の各々は、同じ1つ以上のバイオマーカであってよい1つ以上のバイオマーカおよび少なくとも1つの濃度勾配660を形成する候補化合物の異なる濃度に曝露されたセル株のサンプルを含むことができる。画像生成部220を、1つ以上の濃度勾配660の各々を表し、例えば少なくとも1つの濃度勾配660を形成する候補化合物の異なる濃度を含む各々のウェルに含まれるサンプルのセルの各々のサンプルを個別に表す画像データを生成および/または捕捉するように構成することができる。一例において、ウェル620を表す画像データは、複数の視野650からセルのサンプルを捕捉し、さらには/あるいは表す複数の表現および/または画像を含むことができる。さらなる一例において、ウェル620を表す画像データは、セルのサンプルを表す1つ以上のソース表現および/またはソース画像と、ローパス、ハイパス、平均化、またはカラー画像フィルタ、あるいは当業者にとって利用可能な任意の他の画像フィルタなどの複数の画像フィルタによる処理によって生成された複数の処理済み表現および/または処理済み画像とを含むことができる。さらなる一例において、ウェル620を表す画像データは、超音波などの音、あるいはラジオ、マイクロ波、赤外線、可視光、紫外線、X線、およびガンマ線などの電磁放射線の異なる波長を表す異なる画像データチャネル610内のセルのサンプルを捕捉し、さらには/あるいは表す複数の表現および/または画像を含むことができる。
図7が、本発明の実施形態に従って表現型プロファイルが例えば円グラフトレリス(pie chart trellis)としてどのように表示されるかの一例を示している。一実施形態においては、表現型プロファイルが、プレートマップ配置230および/またはウェルプレートのレイアウト上に重ねて表示される。一実施形態においては、プレートマップ配置230および/またはウェルプレートの各々のウェルの各々のサンプルの表現型プロファイル710が表示される。一例において、濃度Aを有する化合物1の円グラフトレリスは、「死んでいる」として分類された8個のセル、「死んでいない」として分類された12個のセル、および「その他」として分類された6個のセルを示す円グラフとして示されている。さらなる実施形態において、表現型プロファイル710は、列720および行730に配置される。さらなる実施形態においては、濃度勾配が、プレートマップ配置230および/またはウェルプレートの列720のウェルに沿って配置される。
一例において、表現型プロファイルは、プレートのレイアウトを横切る円グラフトレリスとしての視覚化ダッシュボードとして表示される。利点は、プレートマップ上に配置されたサンプル間で集団がどのように変化したかをユーザがすばやく理解できることである。粒度を上げるために、ウェルごとの比較が、分析の良好なソースとなり得る。列を横切るウェルは、異なる濃度および/または薬物投与量において異なる傾向にあり、行を横切るウェルは、候補化合物および/または薬物の種類において異なる傾向にあるからである。これらの比較は、分類後の分析において絶対的に重要である。本発明の発明者は、生物学者が、或るクラスのセルが特定の薬物の下で生き延びたか否か、あるいはそれらの何パーセントが特定の用量の下で生き延びたかを知りたいと思うことに気が付いた。さらなる例において、ユーザは、表現型プロファイルを眺め、画像データが有効でなく、さらには/あるいは残りのデータセットから実質的に逸脱していることを示すユーザ入力データをもたらすことができ、したがって価値のない特徴を除外する能力をユーザに提供することができる。さらなる一例においては、ユーザが特定の集団を分析しており、その集団がエリアに関してどのように変化したかを知りたい場合に、その特定の傾向を調査するために、特徴のないすべてのエリアを除外することができる。
図8が、本発明の実施形態による画像データの典型的なサブセットおよびそれぞれのクラスの表示の一例を示している。一例においては、各々のクラスについてサンプルの少なくとも1つのセルを表す画像データの典型的なサブセットが選択されており、それぞれのクラスラベルおよび/またはクラス810〜840と共にユーザへと表示される。とくには、第1のクラス810についてサンプルの3つのセル850を表す画像データの典型的なサブセットが選択されており、それぞれのクラスラベルおよび/またはクラス810と共にユーザへと表示される。次いで、ユーザは、少なくとも1つのクラス810〜840についての操作を指示することができ、コンピュータ装置100は、本開示によれば、ユーザ入力データに基づいてセル株のセルのクラスラベルおよび/またはクラスについて操作を実行する。操作は、「クラスの追加」、「クラスの削除」、「クラスの分割」、または「クラスの併合」から選択されてよい。セル周期の動揺を含むさらに別の例においては、単一のよく特徴付けられたセル株が、セル分裂を妨害し、あるいはセルの死を引き起こすことによってセル周期の進行を動揺させる異なる濃度の2つの異なる候補化合物で処理され、さらには/あるいはそのような候補化合物に曝露されている。この研究は、セル周期状態による既知の部分集団へのセルの分類、ならびに例えば「死んでいる」、「死んでいない」、または「その他」の健康状態を示す死亡セルについての蛍光バイオマーカの存在に基づくセル健康状態の定義の両方を必要とする。本開示の方法の適用の結果として、画像データの第1の典型的なサブセット850が、それぞれの第1のクラスラベルおよび/またはクラス810と共に「死んでいない」と表示される。さらに、画像データの典型的な第2のサブセット860が、それぞれの第2のクラスラベルおよび/またはクラス820と共に「死んでいる」と表示される。さらに、画像データの典型的な第3のサブセット870が、それぞれの第3のクラスラベルおよび/またはクラス830と共に「死んでいない」と表示される。さらに、画像データの典型的な第4のサブセット880が、それぞれの第4のクラスラベルおよび/またはクラス840と共に「その他」と表示される。ユーザが「死んでいない」第1および第3のクラスを同じクラスとして分類すべきであると認識した後に、ユーザは、それら2つを結合/併合し、第1および第3のクラスラベルおよび/またはクラスのすべてのセルを第1のクラスラベルおよび/またはクラスを示すように更新することを、選択することができる。
1つの使用事例においては、蛍光タンパク質および/またはフルオロフォアの形態の2つのバイオマーカを使用してセルを染色することができ、DAPIを核または核酸またはNucleiを染色するために使用し、Cy5を死んだセルを染色するために使用することができる。これらの染色に基づいて、サンプルの各セルについてクラスラベルおよびクラスを生成するために本発明を使用し、さらには/あるいは教師なしクラスタリングを使用したとき、1つの可能なクラスタリング結果は、以下の通りである。
クラスタ/クラス1:DAPI:核の明るさ。丸み。Cy5:明るさなし。生きているセルを示している。
クラスタ/クラス2〜3:DAPI:ほのかな明るさ。核の不規則な形状。Cy5:きわめて明るい。死んだセルを示している。クラスタ4〜5:DAPI:中程度の明るさ。長円形。Cy5:明るい。死んだセルを示している。
クラスタ/クラス6:DAPI:きわめて明るい。小核の均一な明るさ。Cy5:明るさなし。生きているセルを示している。
クラスタ/クラス7:DAPI:明るさの不均一な広がり。不均一なラベリング。Cy5:軽いラベリング。ノイジー。
これらのクラスタの各々についての典型的なサブセットが、ユーザへと提示され、ユーザは、クラスタ1、6、7をそのまま維持し、クラスタ2、3、4、および5を組み合わせることを選択することができる。この決定は、画像データの典型的なサブセットに基づいて行われるが、再グループ化は、データセット全体に対して決定に基づいて適用される。
図9が、本発明による方法によって生成された表現型プロファイルと手作業による方法によって生成された表現型プロファイルとの間の比較の一例を示している。表現型プロファイルは、濃度勾配の各々の濃度に曝露された各々のサンプルについて特定のクラスに属すると分類されたセルのセル数についてのデータ点を含むことができる。表現型プロファイルは、複数のクラスおよび/または複数の濃度勾配についてのデータ点を含むことができる。上方の図910に、本発明の方法によって第1のクラスに分類されたセルの数が、第1の曲線914にて示されており、手作業による方法によって第1のクラスに分類されたセルの数が、第2の曲線912にて示されている。下方の図920に、本発明の方法によって第2のクラスに分類されたセルの数が、第1の曲線924にて示されており、手作業による方法によって第2のクラスに分類されたセルの数が、第2の曲線922にて示されている。曲線は、クラスに分類されたセルのセル数を、候補化合物の濃度に対して示している。この例において、本発明の方法は、手作業による方法と7%異なっていたが、分類を24倍速く達成した。図7に関する例において、各々が濃度勾配[濃度A、濃度B、・・・、濃度H]を有する8つの候補化合物[化合物1、化合物2、・・・、化合物8]による実験が、本開示の方法およびコンピュータ装置によって処理される。複数の連続的な時点のうちの第1の時点Tにおいて、表現型プロファイルが、各々の候補化合物の各々の濃度勾配について、例えば以下のように生成される。
化合物1、濃度A、8(死んだクラス)、12(死んでいないクラス)
化合物1、濃度B、4(死んだクラス)、16(死んでいないクラス)

化合物1、濃度H、2(死んだクラス)、18(死んでいないクラス)
図10が、本発明の実施形態による複数のサンプルに基づいて最適候補化合物を検出するためのコンピュータ装置100のための方法のフロー図を示している。一実施形態において、この方法は、オブジェクトサンプリング1010および/または画像データからのセルオブジェクトのセグメント化を含む。一実施形態において、この方法は、各々のセルオブジェクトについてそれぞれの対応するサイトメトリパラメータを生成することをさらに含む。この方法は、教師なしクラスタリングアルゴリズム1030を実行して、内在グルーピング1040を生成すること、ならびに/あるいは画像データに基づいて各々のセルオブジェクトについてクラスラベルおよび/またはクラスおよび/またはグループを生成することを、さらに含むことができる。この方法は、各々のクラスラベルおよび/またはクラスについてサンプルの少なくとも1つのセルオブジェクトおよび/または1つのセルを表す画像データの典型的なサブセットを見本サンプリングおよび/または選択することをさらに含むことができる。この方法は、モデルグループ化および/または少なくとも1つのクラスについての操作を表すユーザからのユーザ入力データの受信、ならびにユーザ入力データに基づくサンプルのセルのクラスラベルおよび/またはクラスについての操作の実行をさらに含むことができ、少なくとも1つのクラスについての操作は、クラスの追加、クラスの削除、クラスの分割、またはクラスの併合から選択される。随意により、この方法は、例えば表現ベースのモデルなど、表現型分類モデルの生成をさらに含むことができる。
さらに、本発明の実施形態による任意の方法を、処理手段によって実行されたときに処理手段に本方法のステップを実行させるコード手段を有するコンピュータプログラムにて実装することができる。コンピュータプログラムは、コンピュータプログラム製品のコンピュータ可読媒体および/またはメモリに含まれる。コンピュータ可読媒体は、ROM(読み出し専用メモリ)、PROM(プログラム可能読み出し専用メモリ)、EPROM(消去可能PROM)、フラッシュメモリ、EEPROM(電気的消去可能PROM)、またはハードディスクドライブなど、基本的にあらゆるメモリを含むことができる。
さらに、コンピュータ装置100が、本解決策を実行するために、例えば機能、手段、ユニット、要素などの形で必要な通信機能を備えることを、当業者であれば理解できるであろう。他のそのような手段、ユニット、要素、および機能の例は、本解決策を実行するために互いに適切に配置されるプロセッサ、メモリ、バッファ、制御ロジック、エンコーダ、デコーダ、レートマッチャー、デレートマッチャー、マッピングユニット、乗算器、決定ユニット、選択ユニット、スイッチ、インターリーバ、デインターリーバ、変調器、復調器、入力、出力、アンテナ、増幅器、受信機ユニット、送信機ユニット、DSP、MSD、TCMエンコーダ、TCMデコーダ、電源ユニット、給電装置、通信インターフェース、通信プロトコル、などである。
とくに、本コンピュータ装置100のプロセッサは、例えば、中央処理装置(CPU)、処理装置、処理回路、プロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、マイクロプロセッサ、または命令を解釈し実行することができる他の処理ロジックのうちの1つ以上のインスタンスを含むことができる。したがって、表現「プロセッサ」は、例えば上述のもののうちのいずれか、いくつか、またはすべてなど、複数の処理回路を備える処理回路を表すことができる。処理回路は、呼処理制御、ユーザインターフェース制御、などのデータバッファリングおよびデバイス制御機能を含むデータの入力、出力、および処理のためのデータ処理機能をさらに実行することができる。
最後に、本発明が上述の実施形態に限定されず、添付の独立請求項の範囲内のすべての実施形態にも関連し、それらを包含することを、理解すべきである。
100 コンピュータ装置
112 プロセッサ、処理手段
115 メモリ
116 通信インターフェース
117 ユーザ入力装置
118 表示装置
200 候補化合物検出システム
210 データベース
220 画像生成部
230 プレートマップ配置
240 通信ネットワーク
610 画像データチャネル
620 ウェル
650 視野
660 濃度勾配
710 表現型プロファイル
720 列
730 行
810 第1のクラスラベルおよび/またはクラス
820 第2のクラスラベルおよび/またはクラス
830 第3のクラスラベルおよび/またはクラス
840 第4のクラスラベルおよび/またはクラス
850 セル、第1の典型的なサブセット
860 第2のサブセット
870 第3のサブセット
880 第4のサブセット
912 第2の曲線
914 第1の曲線
922 第2の曲線
924 第1の曲線
1010 オブジェクトサンプリング
1030 クラスタリングアルゴリズム
1040 内在グルーピング

Claims (15)

  1. セル株および1つ以上のバイオマーカを含む複数のサンプル、ならびにプレートマップ配置(230)に基づいて、最適候補化合物を検出するためのコンピュータ装置(100)のための方法であって、前記プレートマップ配置(230)は、1つ以上のバイオマーカおよび少なくとも1つの濃度勾配(660)を形成する異なる濃度の候補化合物に曝露されたセル株を含むサンプルの位置を提供しており、前記候補化合物は、複数の候補化合物に含まれており、当該方法は、
    複数の連続的な時点における前記複数の候補化合物の各々の各々の濃度勾配(660)の表現型プロファイル(710)を生成して、複数の化合物プロファイルを形成するステップ(310)であって、表現型プロファイル(710)の生成は、前記濃度勾配(660)に含まれる各サンプルを表す画像データを取得するステップ(312)と、前記画像データに基づいて前記サンプルの各セルについてクラスラベルおよびクラス(810,820,830,840)を生成するステップ(314)とを含むステップ(310)と、
    前記複数の化合物プロファイルについて比較基準を評価することによって前記最適候補化合物を検出するステップ(320)と
    を含む、方法。
  2. 各々のクラスラベルおよび/またはクラス(810,820,830,840)について前記サンプルの少なくとも1つのセルを表す画像データの典型的なサブセット(850,860,870,880)を選択するステップ(315)と、
    前記画像データの典型的なサブセット(850,860,870,880)ならびにそれぞれのクラスラベルおよび/またはクラス(810,820,830,840)をユーザへと表示するステップ(316)と、
    少なくとも1つのクラス(810,820,830,840)についての操作を表すユーザからのユーザ入力データを受け付けるステップ(317)と、
    前記ユーザ入力データに基づいて前記サンプルのセルの前記クラスラベルおよび/またはクラス(810,820,830,840)についての前記操作を実行するステップ(318)と
    をさらに含む、請求項1に記載の方法。
  3. 前記少なくとも1つのクラス(810,820,830,840)についての操作は、クラスの追加、クラスの削除、クラスの分割、またはクラスの併合から選択される、請求項2に記載の方法。
  4. 前記最適候補化合物を検出するステップ(320)は、
    1つ以上の基準化合物プロファイルを取得するステップ(322)と、
    前記1つ以上の基準化合物プロファイルに基づいて前記複数の化合物プロファイルの各々の化合物プロファイルについて多次元差分値を計算するステップ(324)と、
    前記複数の化合物プロファイルについて比較基準を前記多次元差分値に基づいて評価することによって前記最適候補化合物を検出するステップ(320)と
    をさらに含む、請求項1乃至3のいずれか1項に記載の方法。
  5. 前記画像データは、複数の視野(650)から前記濃度勾配(660)に含まれる各々のサンプルを表しており、さらには/あるいは前記画像データは、複数の画像フィルタによって処理された前記濃度勾配(660)に含まれる各々のサンプルを表している、請求項1乃至4のいずれか1項に記載の方法。
  6. セル株を含む複数のサンプル、1つ以上のバイオマーカ、およびプレートマップ配置(230)に基づいて、最適候補化合物を検出するためのコンピュータ装置(100)であって、前記プレートマップ配置(230)は、1つ以上のバイオマーカおよび少なくとも1つの濃度勾配(660)を形成する異なる濃度の候補化合物に曝露されたセル株を含むサンプルの位置を提供しており、前記候補化合物は、複数の候補化合物に含まれており、当該コンピュータ装置(100)は、
    プロセッサ(112)と、
    メモリ(115)とを備え、前記メモリ(115)が、前記プロセッサ(112)によって実行することができる命令を含むことにより、当該コンピュータ装置(100)は、
    複数の連続的な時点における前記複数の候補化合物の各々の各々の濃度勾配(660)の表現型プロファイル(710)を、前記濃度勾配(660)に含まれる各々のサンプルを表す画像データを取得するステップと、前記画像データに基づいて前記サンプルの各セルについてクラスラベルおよびクラス(810,820,830,840)を生成するステップとを含むステップによって生成して、複数の化合物プロファイルを形成し、
    前記複数の化合物プロファイルについて比較基準を評価することによって前記最適候補化合物を検出する
    ように動作することができる、コンピュータ装置(100)。
  7. 入力装置(117)および表示装置(118)をさらに備え、
    各々のクラスラベルおよび/またはクラス(810,820,830,840)について前記サンプルの少なくとも1つのセルを表す画像データの典型的なサブセット(850,860,870,880)を選択し、
    前記画像データの典型的なサブセット(850,860,870,880)ならびにそれぞれのクラスラベルおよび/またはクラス(810,820,830,840)をユーザへと前記表示装置(118)上に表示し、
    少なくとも1つのクラス(810,820,830,840)についての操作を表すユーザによって示されるユーザ入力データを前記入力装置(117)から受け付け、
    前記ユーザ入力データに基づいて前記サンプルのセルの前記クラスラベルおよび/またはクラス(810,820,830,840)についての前記操作を実行する
    ようにさらに動作することができる、請求項6に記載のコンピュータ装置(100)。
  8. 前記表現型プロファイル(710)および/または化合物プロファイルを前記表示装置(118)上に表示するようにさらに動作することができる、請求項6または7に記載のコンピュータ装置(100)。
  9. 前記最適候補化合物を検出するときに、
    1つ以上の基準化合物プロファイルを取得し、
    前記1つ以上の基準化合物プロファイルに基づいて前記複数の化合物プロファイルの各々の化合物プロファイルについて多次元差分値を計算し、
    前記複数の化合物プロファイルについて比較基準を前記多次元差分値に基づいて評価することによって前記最適候補化合物を検出する
    ようにさらに動作することができる、請求項6乃至8のいずれか1項に記載のコンピュータ装置(100)。
  10. 候補化合物の前記濃度勾配(660)は、複数の別々のウェル(620)を含み、各々のウェル(620)は、1つ以上のバイオマーカおよび異なる濃度の候補化合物に曝露された前記セル株のサンプルを含み、前記プレートマップ配置(230)に従って配置されている、請求項6乃至9のいずれか1項に記載のコンピュータ装置(100)。
  11. コンピュータ実行可能命令を含んでおり、該コンピュータ実行可能命令は、コンピュータ装置(100)に含まれる処理装置において実行されたときに、該コンピュータ装置(100)に、
    複数の連続的な時点における複数の候補化合物の各々の各々の濃度勾配(660)の表現型プロファイル(710)を生成して、複数の化合物プロファイルを形成するステップであって、表現型プロファイル(710)の生成は、前記濃度勾配(660)に含まれる各サンプルを表す画像データを取得するステップと、前記画像データに基づいて前記サンプルの各セルについてクラスラベルおよびクラス(810,820,830,840)を生成するステップとを含むステップと、
    前記複数の化合物プロファイルについて比較基準を評価することによって前記最適候補化合物を検出するステップと
    を実行させる、コンピュータプログラム。
  12. 各々のクラスラベルおよび/またはクラス(810,820,830,840)について前記サンプルの少なくとも1つのセルを表す画像データの典型的なサブセット(850,860,870,880)を選択するステップと、
    前記画像データの典型的なサブセット(850,860,870,880)ならびにそれぞれのクラスラベルおよび/またはクラス(810,820,830,840)をユーザへと表示するステップと、
    少なくとも1つのクラス(810,820,830,840)についての操作を表すユーザからのユーザ入力データを受け付けるステップと、
    前記ユーザ入力データに基づいて前記サンプルのセルの前記クラスラベルおよび/またはクラス(810,820,830,840)についての前記操作を実行するステップと
    を前記コンピュータ装置(100)にさらに実行させる、請求項11に記載のコンピュータプログラム。
  13. 前記少なくとも1つのクラス(810,820,830,840)についての操作は、クラスの追加、クラスの削除、クラスの分割、またはクラスの併合から選択される、請求項12に記載のコンピュータプログラム。
  14. 前記最適候補化合物を検出するステップを、
    1つ以上の基準化合物プロファイルを取得するステップと、
    前記1つ以上の基準化合物プロファイルに基づいて前記複数の化合物プロファイルの各々の化合物プロファイルについて多次元差分値を計算するステップと、
    前記複数の化合物プロファイルについて比較基準を前記多次元差分値に基づいて評価することによって前記最適候補化合物を検出するステップと
    をさらに実行することによって前記コンピュータ装置(100)にさらに実行させる、請求項11乃至13のいずれか1項に記載のコンピュータプログラム。
  15. コンピュータ可読記憶媒体を含むコンピュータプログラム製品であって、前記コンピュータ可読記憶媒体には請求項11乃至14のいずれか1項に記載のコンピュータプログラムが具現化されているコンピュータプログラム製品。
JP2019517016A 2016-09-30 2017-10-02 最適候補化合物を検出するためのコンピュータ装置およびその方法 Active JP7130630B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022111675A JP2022141771A (ja) 2016-09-30 2022-07-12 最適候補化合物を検出するためのコンピュータ装置およびその方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662402272P 2016-09-30 2016-09-30
US62/402,272 2016-09-30
PCT/EP2017/075003 WO2018060523A2 (en) 2016-09-30 2017-10-02 Computer device for detecting an optimal candidate compound and methods thereof

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022111675A Division JP2022141771A (ja) 2016-09-30 2022-07-12 最適候補化合物を検出するためのコンピュータ装置およびその方法

Publications (2)

Publication Number Publication Date
JP2019537102A true JP2019537102A (ja) 2019-12-19
JP7130630B2 JP7130630B2 (ja) 2022-09-05

Family

ID=60153264

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019517016A Active JP7130630B2 (ja) 2016-09-30 2017-10-02 最適候補化合物を検出するためのコンピュータ装置およびその方法
JP2022111675A Withdrawn JP2022141771A (ja) 2016-09-30 2022-07-12 最適候補化合物を検出するためのコンピュータ装置およびその方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2022111675A Withdrawn JP2022141771A (ja) 2016-09-30 2022-07-12 最適候補化合物を検出するためのコンピュータ装置およびその方法

Country Status (5)

Country Link
US (2) US11636924B2 (ja)
EP (1) EP3520004A2 (ja)
JP (2) JP7130630B2 (ja)
CN (2) CN110140176B (ja)
WO (1) WO2018060523A2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113316713A (zh) 2018-10-17 2021-08-27 贝克顿·迪金森公司 颗粒分析仪的自适应分选
CN111291582B (zh) * 2020-03-04 2023-04-07 广西大学 一种基于水母群算法的rfid天线优化部署方法
CN114999582B (zh) * 2022-08-01 2022-10-04 乐比(广州)健康产业有限公司 一种驱蚊化合物含量检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6615141B1 (en) * 1999-05-14 2003-09-02 Cytokinetics, Inc. Database system for predictive cellular bioinformatics
JP2009063508A (ja) * 2007-09-07 2009-03-26 Olympus Corp 細胞画像解析装置及び細胞画像解析ソフトウェア
JP2009526519A (ja) * 2006-01-17 2009-07-23 セルーメン、インコーポレイテッド 生物学的システム応答の予測方法
JP2014134524A (ja) * 2013-01-11 2014-07-24 Dainippon Screen Mfg Co Ltd 理化学装置および画像処理方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080280771A1 (en) * 2000-02-08 2008-11-13 Regents Of The University Of Michigan Protein MicroarraySystem
GB2389692B (en) 2001-02-20 2005-06-29 Cytokinetics Inc Method and apparatus for automated cellular bioinformatics
WO2005010677A2 (en) * 2003-07-18 2005-02-03 Cytokinetics, Inc. Characterizing biological stimuli by response curves
GB2434225A (en) 2006-01-13 2007-07-18 Cytokinetics Inc Random forest modelling of cellular phenotypes
WO2007103469A2 (en) * 2006-03-06 2007-09-13 Aeres Biomedical Ltd. Humanized anti-cd22 antibodies and their use in treatment of oncology, transplantation and autoimmune disease
MX2009002414A (es) * 2006-09-08 2009-05-20 Medimmune Llc Anticuerpos anti-cd19 humanizados y su uso en el tratamiento de oncologia, transplante y enfermedad autoinmunitaria.
CN102165489B (zh) 2008-09-16 2015-11-25 赫斯托克斯公司 生物标志物表达的可再现量化
GB0909461D0 (en) * 2009-06-02 2009-07-15 Ge Healthcare Uk Ltd Image analysis
KR20160103175A (ko) * 2011-07-19 2016-08-31 오비지오 이미징 시스템스 엔.브이. 세포 샘플에서의 암 세포들의 검출 및/또는 분류를 위한 방법 및 시스템
KR101808086B1 (ko) 2011-10-24 2017-12-14 삼성전자주식회사 무선 전력 전송을 이용한 사운드 시스템
JP6198752B2 (ja) 2012-01-20 2017-09-20 アデレード リサーチ アンド イノベイション ピーティーワイ エルティーディーAdelaide Research & Innovation Pty Ltd 胃癌のバイオマーカー及びその使用
CN104975063B (zh) 2014-04-01 2020-04-03 埃提斯生物技术(上海)有限公司 抗肿瘤药物生物标志物的筛选方法及其应用
PL3207130T3 (pl) * 2014-10-14 2020-02-28 Halozyme, Inc. Kompozycje deaminazy adenozyny 2 (ada2), jej warianty i sposoby ich zastosowania
US10321336B2 (en) * 2016-03-16 2019-06-11 Futurewei Technologies, Inc. Systems and methods for robustly determining time series relationships in wireless networks
US9796505B1 (en) * 2016-04-01 2017-10-24 United Technologies Corporation Billet support fingers for palletization
US10360499B2 (en) * 2017-02-28 2019-07-23 Anixa Diagnostics Corporation Methods for using artificial neural network analysis on flow cytometry data for cancer diagnosis
WO2019073069A1 (en) * 2017-10-13 2019-04-18 Boehringer Ingelheim International Gmbh HUMAN ANTIBODIES AGAINST THOMSEN-NEW ANTIGEN (TN)
US20210147828A1 (en) * 2019-10-01 2021-05-20 The Broad Institute, Inc. Dna damage response signature guided rational design of crispr-based systems and therapies

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6615141B1 (en) * 1999-05-14 2003-09-02 Cytokinetics, Inc. Database system for predictive cellular bioinformatics
JP2009526519A (ja) * 2006-01-17 2009-07-23 セルーメン、インコーポレイテッド 生物学的システム応答の予測方法
JP2009063508A (ja) * 2007-09-07 2009-03-26 Olympus Corp 細胞画像解析装置及び細胞画像解析ソフトウェア
JP2014134524A (ja) * 2013-01-11 2014-07-24 Dainippon Screen Mfg Co Ltd 理化学装置および画像処理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
川谷 誠, 長田 裕之: "ケミカルバイオロジーと新規分子標的薬", 日本臨牀, vol. 第73巻第8号 (2015-8), JPN6021037047, 1 August 2015 (2015-08-01), JP, pages 1273 - 1280, ISSN: 0004836488 *

Also Published As

Publication number Publication date
US20240013867A1 (en) 2024-01-11
WO2018060523A3 (en) 2018-06-14
EP3520004A2 (en) 2019-08-07
CN110140176B (zh) 2023-11-14
JP2022141771A (ja) 2022-09-29
CN110140176A (zh) 2019-08-16
WO2018060523A2 (en) 2018-04-05
JP7130630B2 (ja) 2022-09-05
US20210005287A1 (en) 2021-01-07
US11636924B2 (en) 2023-04-25
CN117457097A (zh) 2024-01-26

Similar Documents

Publication Publication Date Title
CN113454733B (zh) 用于预后组织模式识别的多实例学习器
JP6445127B2 (ja) 貨物の検査方法およびそのシステム
Nketia et al. Analysis of live cell images: Methods, tools and opportunities
Vaickus et al. Automating the Paris System for urine cytopathology—A hybrid deep‐learning and morphometric approach
US20240013867A1 (en) Computer device for detecting an optimal candidate compound and methods thereof
CN102687007B (zh) 利用分层标准化切割的高处理量生物标志物分割
US11861881B2 (en) Critical component detection using deep learning and attention
CN111656393A (zh) 组织学图像分析
Simhal et al. Probabilistic fluorescence-based synapse detection
WO2023283321A1 (en) Stain-free detection of embryo polarization using deep learning
CN115769059B (zh) 用于数据分析的计算机实现的方法、计算机程序产品和系统
CA3195891A1 (en) Training end-to-end weakly supervised networks at the specimen (supra-image) level
US20240046671A1 (en) High dimensional spatial analysis
Baker et al. emObject: domain specific data abstraction for spatial omics
Han et al. eDetect: a fast error detection and correction tool for live cell imaging data analysis
Fernández-de-Manúel et al. ESC-Track: A computer workflow for 4-D segmentation, tracking, lineage tracing and dynamic context analysis of ESCs
US20240170165A1 (en) Systems and methods for the detection and classification of biological structures
Sabata Digital pathology imaging-The next frontier in medical imaging
Santamaria-Pang et al. Epithelial cell segmentation via shape ranking
Boushehri et al. PXPermute reveals staining importance in multichannel imaging flow cytometry
Pajanoja et al. ShapeMetrics: A 3D Cell Segmentation Pipeline for Single-Cell Spatial Morphometric Analysis
Korotina Exploring and comparing data selection methods in the pre-processing step of a deep learning framework for automatic tumor segmentation on PET-CT images
CN115272211A (zh) 基于胶原纤维多元融合分析的乳腺癌检查工具

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190527

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20190521

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190527

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200814

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210927

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20211224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211227

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220330

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220712

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20220712

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20220721

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20220722

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220727

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220824

R150 Certificate of patent or registration of utility model

Ref document number: 7130630

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150