JP2014516413A - 細胞におけるバイオマーカーの発現のクラスターによる解析 - Google Patents

細胞におけるバイオマーカーの発現のクラスターによる解析 Download PDF

Info

Publication number
JP2014516413A
JP2014516413A JP2014505671A JP2014505671A JP2014516413A JP 2014516413 A JP2014516413 A JP 2014516413A JP 2014505671 A JP2014505671 A JP 2014505671A JP 2014505671 A JP2014505671 A JP 2014505671A JP 2014516413 A JP2014516413 A JP 2014516413A
Authority
JP
Japan
Prior art keywords
cell
cluster
cells
biomarkers
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014505671A
Other languages
English (en)
Other versions
JP2014516413A5 (ja
JP6063447B2 (ja
Inventor
マコラック,コリン・クレイグ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
General Electric Co
Original Assignee
General Electric Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by General Electric Co filed Critical General Electric Co
Publication of JP2014516413A publication Critical patent/JP2014516413A/ja
Publication of JP2014516413A5 publication Critical patent/JP2014516413A5/ja
Application granted granted Critical
Publication of JP6063447B2 publication Critical patent/JP6063447B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57434Specifically defined cancers of prostate
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5091Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing the pathological state of an organism
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2115Selection of the most significant subset of features by evaluating different subsets according to an optimisation criterion, e.g. class separability, forward selection or backward elimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/771Feature selection, e.g. selecting representative features from a multi-dimensional feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/56Staging of a disease; Further complications associated with the disease
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/60Complex ways of combining multiple protein biomarkers for diagnosis

Abstract

細胞プロファイルデータのデータセットが保存される。細胞プロファイルデータは、複数のバイオマーカーの発現について描述するマルチプレックス化バイオメトリック画像データを含む。細胞プロファイルデータは、共通性と関連する評価を有する患者コホートから得られた組織試料から作成される。類似する細胞の複数のクラスターセットは、データセットから作成され、各クラスター内の細胞の比率が、診断、予後診断又は応答との関連について検証され、予測的なクラスターセットが、モデルの性能に基づき選択される。1つの予測的なクラスターセットが、複数のクラスターセットについての少なくとも1つのモデルの性能の比較に基づき選択される。クラスターの特徴を理解する一助となる表示法が開示される。
【選択図】 図1

Description

本発明は一般に、それらの元の組織においてインサイチュで検証される個別の細胞におけるバイオマーカーの発現を解析及び視覚化し、状態もしくは疾患の診断、予後診断又は状態もしくは疾患の処置に対する応答と関連する発現パターンを同定及び理解することに関する。
バイオマーカーの発現を明らかにするように処理された組織検体の検証は、生物学的探索及び臨床的研究の公知のツールである。このような処理の1つは、バイオマーカーに特異的な対象の抗体又は抗体断片などの抗体サロゲート、一般にはタンパク質の使用を伴う。このような抗体又は抗体サロゲートは、適切な条件下でシグナルを発生させることが可能な部分で直接又は間接に標識することができる。例えば、蛍光部分を抗体に接合させて、処理された組織を蛍光について精査することができる。得られるシグナルは一般に、バイオマーカーの存在だけでなく、存在するバイオマーカーの量もまた示す。
組織の処理及び検証の技術は、特定の細胞、或いはさらに核、細胞質、もしくは膜など、所与の細胞区画における所与のバイオマーカーの発現レベルを定量的に決定しうるように洗練されている。これらの区画又は細胞全体の境界は、公知の組織学的染色を用いて位置特定される。一般に、処理された組織をデジタルイメージングにより検証し、その結果として、異なるバイオマーカーから発せられる異なるシグナルのレベルを容易に定量化することができる。
所与の組織検体を多数のバイオマーカーの発現について調べることを可能とする技術がさらに開発されている。一般に、この技術は、フルオロフォアで標識したプローブで検体を染色して、1つ以上のプローブが結合したバイオマーカーについてシグナルを発生させ、これらのシグナルを化学的に漂白し、検体を再染色して、いくつかのさらなるバイオマーカーについてシグナルを発生させることを伴う。互いから容易に差別化されうる限定された数のシグナルが存在するに過ぎず、特定の段階において限定された数のバイオマーカーだけを検証しうるため、化学的漂白の段階は好都合である。漂白するだけで、複数段階のために試料を再プローブし、再評価することができる。このサイクリング法は、ホルマリン固定化パラフィン包埋組織(FFPE)による試料及び細胞において用いることができる。検体のデジタル画像は、各染色段階の後に収集する。このような検体の継起画像は、そのシグナルが化学的漂白法により改変されていないDAPI染色された細胞核などの形態特徴を用いて登録しうると好都合である。
別の手法は、凍結させた組織検体を、それらを繰り返し染色し、前の染色段階から標識を光漂白してから、次の染色セットを適用することにより検証することであった。次いで、評価される各バイオマーカーと関連する蛍光シグナルの強度を、適切な画像から抽出する。
このデータを使用して、バイオマーカーの発現パターンを同定する試みがなされている。1つの手法は、組織検体の全体においてこのようなパターンを探し出し、閾値を用いてフルオロフォアシグナルを二値化し、多様な発現プロファイルを作成し、次いで、これを対象の組織画像にオーバーレイすることであった。
「Method and System for Analyzing the Expression of Biomarkers in Cells in Situ in Their Tissue of Origin」と題する米国特許出願公開第2011/0091081号及び「Process and System for Analyzing the Expression of Biomarkers in Cells」と題する米国特許出願公開第2011/0091091号はいずれも、本発明に先行するGeneral Electricによる研究及び開発の成果について記載している。
米国特許出願公開第2011/0091081号は、それらの元の組織内の細胞における複数のバイオマーカーの発現パターンを解析するためのデータを取得する工程について開示した。個別の細胞又は個別の細胞の細胞内区画における複数のバイオマーカーの発現レベルが、細胞の元の組織においてインサイチュで測定された。測定は、組織検体を、対象のバイオマーカーに特異的な抗体又は抗体サロゲートで処理することによれば、簡便に行うことができるであろう。抗体又は抗体サロゲートは、適切な波長の光で精査すると光学シグナルを発する部分で直接又は間接に標識された。組織検体は、繰り返し処理され、各処理は、他の任意の処理に関与するバイオマーカーとは異なるバイオマーカーに特異的な抗体又は抗体サロゲートを伴い、直前の処理から発生したシグナルは、光学的手段又は化学的手段により中和された。抗体又は抗体サロゲートを介して対象のバイオマーカーへと結合させた各標識の量は、検体を適切な波長の光の下に置き、応答をデジタルイメージングすることにより測定した。細胞は、個別の細胞単位へと分割するのが好都合であり、それらの細胞内区画(膜、細胞質及び核を含む)が、データ取得の部分であった。データベースは、元の測定値及び各測定値が取り出される位置、細胞又は細胞区画を保存した。
米国特許出願公開第2011/0091081号はまた、それらの元の組織の中の細胞における複数のバイオマーカーの発現パターンを表すデータを解析する工程についても開示した。データベースを精査するのに用いられる数値的方法は、バイオマーカーの発現レベルの測定に基づき、特定の属性を対象の各細胞に割り当て、類似するバイオマーカーの発現属性を有する細胞を併せて群分けすることを伴った。群分けすることは、属性空間内のそれらの間の距離が最小である細胞を併せて群分けするアルゴリズム、すなわち、各属性が1つの次元を割り当てられるn次元空間におけるそれらの互いからの距離に基づき、2つの細胞が同じ群に含まれるアルゴリズムを伴った。
米国特許出願公開第2011/0091081号は、特定のバイオマーカーの発現パターンが類似する細胞群であれば、生物学的状態と所与の細胞属性との間の関連を探索するための好都合な基盤でありうることについてさらに開示した。各群分けを検証すれば、所与の状態もしくは疾患の診断もしくは予後診断と関連する任意の細胞属性又は所与の状態もしくは疾患のための所与の治療に対する応答と関連する任意の細胞属性を同定しうるであろう。
米国特許出願公開第2011/0091081号は、特定のバイオマーカーの発現パターンが類似する1つ以上の細胞群を表示する工程について開示した。バイオマーカーの発現レベルを測定するのに使用される視野についてのデジタル画像の1つ以上にわたるオーバーレイによれば、群分けを視覚化しうるであろう。オーバーレイによれば、元の画像のどこに、所与の群のプロファイルを保有する細胞が存在するのかを示しうるであろう。異なる組織検体に由来する、このようなオーバーレイを伴う画像を比較すれば、1つ以上のプロファイルを伴う細胞のパターン、すなわち、1つ以上の群に属する細胞のパターンが、任意の生物学的状態又は生物学的過程を示すかどうかを決定しうるであろう。
米国特許出願公開第2011/0091091号は、細胞試料の個別の細胞における複数のバイオマーカーの発現レベルを測定し、各細胞のバイオマーカー発現の測定値を、データベースの中のデータ点として保存し、データベースを、バイオマーカーの発現パターンが類似するデータ点について、各バイオマーカーの発現レベルを少なくとも半連続変数として用いる数値解析によりこのような類似性を決定するコンピュータアルゴリズムを用いて、精査することを含む工程について開示した。分散が最小であるデータ点を同定し、併せて群分けした。群には、アルゴリズムにより考慮される各属性についての中央値に基づく新たなデータ点により表される新たなバイオマーカーの発現プロファイルを割り当て、こうして、新たなデータセットを形成した。所定数の群が作成されるまで、この段階を、新たなデータセットにより繰り返した。
米国特許出願公開第2011/0091091号はまた、特定のバイオマーカーの発現パターンが類似する細胞群を表示するのに群分けデータを用いる方法についても開示した。方法は、細胞試料の視野の中の1つ以上の群についての画像であって、群の中の各細胞に、それらが同じ群に属することの目視可能な表示を与える画像を創出することを伴った。新たな画像は、試料の元の画像へと登録されて、視野の中の群についての画像が継起的にオーバーレイされ、解析され、表示されることを可能とする。
本発明は、先行技術の1つ以上の限界に取り組む。例えば、米国特許出願公開第2011/0091081号及び米国特許出願公開第2011/0091091号のいずれも、可能な関連を探索するための特定のデータセットに適する数の群をどのようにして選択するのかについて開示できていない。米国特許出願公開第2011/0091091号は、特定のデータセットの中で所定数の群を作成することについて開示しているが、作成する群の数をどのようにして選択するのかについては開示していない。特定のデータセットに適する数の群を選択する手法がなければ、適切な数の群を選択することはできない。群が少なすぎれば、重要な示差的特徴を伴う細胞が併せて群分けされる結果がもたらされうる。群分けされた細胞のサブセットの関連は、同定するのがより困難な場合もあり、不可能な場合もある。群が多すぎれば、不必要に複雑な計算及び解析が結果として必要となる。群が多すぎれば、重要な示差的特徴を伴わない細胞が個別に群分けされるように、データセットをオーバーフィッティングさせる結果がもたらされうる。重要な示差的特徴を有さない2つの細胞群による関連は、同定するのがより困難な場合もあり、不可能な場合もある。
別の例として述べると、米国特許出願公開第2011/0091081号及び米国特許出願公開第2011/0091091号のいずれも、群に関する情報を表示する技術についての開示が限定されている。いずれの公報も、群に割り当てられる細胞の位置を、はるかに大きな視野の中で印づけうることについて開示している。いずれの公報も、細胞を、はるかに大きな視野の中で印づけて、それらの同じ視野の中の複数の群の1つへの割当てを示しうることについてさらに開示している。しかし、はるかに大きな視野の中のそれらの相対位置以外に、このような表示が任意の特定の群の中の細胞の特徴に対してもたらす洞察は限定されている。さらに、多次元的類似性による細胞の群分けによって得られる群は、医療従事者が理解するのに本質的に困難である。したがって、本明細書で教示される実施形態は、データセットを解析する異なる工程を伴う。
以下の説明を、添付図を参照しながら読めば、本発明の特徴、態様及び利点がよりよく理解されるであろう。
本明細書で教示される例示的な実施形態を実施するのに適する例示的な演算環境を示す図である。 本明細書で教示される実施形態に従い、類似する細胞の予測的なクラスターセットをデータセットから同定するためのモデルを開発する例示的な方法を示す図である。 本明細書で教示される実施形態に従い、細胞クラスターの特徴を表示する例示的な方法を示す図である。 本明細書で教示される実施形態に従い、モデルのクラスターセットを新たな細胞プロファイルデータに適用する例示的な方法を示す図である。 本明細書で教示される実施形態に従い、細胞特徴の積率の予測的なセットをデータセットから同定するためのモデルを開発する例示的な方法を示す図である。 本明細書で教示される実施形態に従い、積率のモデルセットを新たな細胞プロファイルデータに適用する例示的な方法を示す図である。 マーカーデータ及び形態特徴の第1の2つの積率を含む、がん/正常分類子についてのROC(receiver operating characteristic)曲線である。 マーカーデータの第1の2つの積率を含む、がんだけの分類子についてのROC曲線である。 マーカーデータ及び形態特徴の第1の2つの積率を含む、がん/正常分類子についての変数重要度プロットである。 マーカーデータの第1の2つの積率を含む、がんだけの分類子についての変数重要度プロットである。 がん/正常分類子における上位4つの特徴についての偏変数依存性プロットである。 高悪性度/低悪性度分類子における上位4つの特徴についての偏変数依存性プロットである。 全コホートの生存モデルについての変数重要度を示すグラフである。 全コホートの生存モデルについての偏変数依存性プロットのグラフである。 グリソンスコア>0のコホートに対する生存モデルについての変数重要度を示すグラフである。 グリソンスコア>0のコホートの生存モデルについての偏変数依存性プロットである。 バッチごとの侵襲性視野(FOV)において観察される膜P13Kp110aの平均を示す図である。 数を変化させる細胞クラスターの特徴に基づき、がん/正常分類子についてのROC曲線下面積(AUC)を示す図である。 数を変化させる細胞クラスターの特徴に基づき、高悪性度/低悪性度がん分類子についてのROC曲線下面積を示す図である。 がん/正常FOVの20の細胞クラスターモデルについてのROC曲線である。 高悪性度/低悪性度FOVの20の細胞クラスターモデルについてのROC曲線である。 がん/正常FOVの20のクラスター分類子モデルについての変数重要度を示す図である。 高悪性度/低悪性度がんFOVの20のクラスター分類子モデルの変数重要度を示す図である。 がん/正常分類子における上位4つの特徴についての偏変数依存性プロットである。 高悪性度/低悪性度がん分類子における上位4つの特徴についての偏変数依存性プロットである。 バッチごとに(各パネルにおいて)、かつ、がん対正常(真/偽で示した)の対比により、クラスター7の細胞について観察されたFOVレベルの比率を示す図である。x軸は、FOVの中のクラスター7の比率の平方根である。 クラスター7/20のシグネチャーを示す図である。各水平線の黒丸端は、クラスター7の中の平均であり、他端は、20クラスター全ての平均である。 全コホートに対する生存モデルについての性能メトリックを示す図である。RSFによる一致率、並びに3、5及び10年以内の前立腺がんによる死亡を分類するためのAUCである。年齢及びグリソンスコアだけを含むヌルモデルの性能を、水平線として示す。 グリソンスコア>0のコホートに対する生存モデルについての性能メトリックを示す図である。RSFによる一致率、並びに3、5及び10年以内の前立腺がんによる死亡を分類するためのAUCである。年齢及びグリソンスコアだけを含むヌルモデルの性能を、水平の黒色線として示す。 全コホートの生存モデルについての変数重要度を示す図である。 全コホートの生存解析における上位4つの特徴についての偏変数依存性プロットである。 グリソンスコア>0のコホートについての生存モデルの変数重要度を示す図である。 グリソンスコア>0のコホートの20クラスターのモデルにおける上位4つの特徴の偏依存性を示す図である。 いずれも生存期間の短縮の表示である、クラスター6/8及びクラスター1/20のシグネチャーを示す図である。 本明細書で教示される実施形態に従う、クラスターの中の2つの細胞の例示的なモンタージュを示す図である。
本明細書で教示される実施形態では、マルチプレックス化染色−脱染法を介するなど、公知の技術を介して作成されるマルチプレックス化バイオメトリック画像を活用する。画像は、個別の細胞を互いと比較することを可能とする、個別の細胞内におけるバイオマーカーの発現を例示する。個別の細胞は、より大きな細胞試料の部分である。例えば、細胞試料は、細胞培養物、組織試料、臓器、腫瘍又は病変に由来する細胞群でありうる。個別の細胞はまた、異なる対象に由来する類似する組織による検体群の部分でもありうる。これらの細胞群は、1つ以上の疾患モデル又は状態モデルを表す場合もあり、疾患モデル又は状態モデルの中の異なる段階を表す場合もあり、疾患又は状態の処置に対する1つ以上の応答を表す場合もある。
染色された各視野の画像は、適切な顕微鏡及び適切な品質管理ルーチンとカップリングされたデジタルカメラによるなど、公知の技術を介して作成される。自動式画像の登録及び解析はまた、描出される個別の細胞、或いはさらに核、細胞質及び膜などの細胞内区画について、バイオマーカーの濃度レベルを定量化するのにも用いることができる。細胞のマルチプレックス化解析及び画像解析から得られるデータ値は、単独で保存することもでき、さらなる解析の結果であるデータと共に保存することもできる。データベースは、組織及びそれが得られた組織中の位置を含めて、バイオマーカーの発現強度の測定内容を保存する。位置は、ある測定値が得られた細胞を含んでいるべきであり、測定と関連する区画、核、細胞質又は膜を含んでいてもよい。データベースには、保存デバイス116又はネットワークデバイス126において維持されうる情報が保存される。
図1は、本明細書で教示される例示的な実施形態を実施するのに適する例示的な演算環境を示す。環境は、関連する周辺デバイスを伴う演算デバイス100を含む。演算デバイス100は、本明細書で教示される多様な方法のための実行用コード150を実装するようにプログラム可能である。演算デバイス100は、ハードディスクドライブ、CD−ROM又は他の非揮発性コンピュータ読み取り可能媒体など、保存デバイス116を含む。保存デバイス116は、オペレーティングシステム118及び他の関連するソフトウェアを保存する。演算デバイス100は、メモリ106をさらに含んでいてもよい。メモリ106は、DRAM、SRAM、EDO RAMなど、コンピュータのシステムメモリ又はランダムアクセスメモリを含みうる。メモリ106は、他の種類のメモリ又はその組合せも含みうる。演算デバイス100は、保存デバイス116及び/又はメモリ106内に、実行用コード150のモジュールを実装及び処理するための命令を保存しうる。
演算デバイス100はまた、メモリ106に保存されるソフトウェアを実行するためのプロセッサー102及び1つ以上のプロセッサー102’、並びにシステムのハードウェアを制御するための他のプログラムも含む。プロセッサー102及びプロセッサー102’の各々は、単一のコアプロセッサーの場合もあり、複数のコアプロセッサーの場合もある(104及び104’)。演算デバイス100では、演算デバイスの中のインフラストラクチャー及びリソースを動的に共有しうるように、仮想化を使用することができる。仮想化されたプロセッサーはまた、保存デバイス116内の実行用解析コード150及び他のソフトウェアと共に用いることもできる。仮想マシン114を用意して、工程が複数ではなくて唯一の演算リソースを用いていると考えられるように、複数のプロセッサー上で試行される工程を操作することができる。また、複数の仮想マシンも1つのプロセッサーと共に用いることができる。
使用者は、使用者インターフェース124又は他の任意のインターフェースを表示しうるコンピュータモニターなどの視覚表示デバイス122を介して、演算デバイス100と相互作用しうる。また、視覚表示デバイス122は、例示的な実施形態の他の態様又は要素、例えば、保存デバイス116のアイコンも表示しうる。演算デバイス100は、キーボード又はマルチタッチインターフェース108及びポインティングデバイス110、例えば、使用者からの入力を受け取るマウスなど、他のI/Oデバイスを備えていてもよい。。キーボード108及びポインティングデバイス110は、視覚表示デバイス122へと接続することができる。演算デバイス100は、他の従来の適切なI/O周辺機器を備えていてもよい。。
演算デバイス100は、標準的な電話線、LAN接続又はWAN接続(例えば、802.11、T1、T3、56kb、X.25)、ブロードバンド接続(例えば、ISDN、Frame Relay、ATM)、無線接続、コントローラーエリアネットワーク(CAN)又は上記のいずれかもしくは全ての何らかの組合せが含まれるがこれらに限定されない多様な接続を介する、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)又はインターネットを介してネットワークデバイス126とインターフェースされる、ネットワークインターフェース112を備えていてもよい。。ネットワークインターフェース112は、内蔵型ネットワークアダプター、ネットワークインターフェースカード、PCMCIAネットワークカード、カードバスネットワークアダプター、無線ネットワークアダプター、USBネットワークアダプター、演算デバイス100が、通信及び本明細書で記載される操作を実施することが可能な任意の種類のネットワークとインターフェースされることを可能とするのに適するモデム又は他の任意のデバイスを含みうる。
さらに、演算デバイス100は、ワークステーション、デスクトップコンピュータ、サーバー、ラップトップ、ハンドヘルドコンピュータ又は通信が可能であり、本明細書で記載される操作を実施するのに十分なプロセッサー電源及びメモリ容量を有する他の形態の演算デバイスもしくは遠隔通信デバイスなど、任意のコンピュータシステムでありうる。
演算デバイス100は、任意のバージョンのMicrosoft(登録商標)Windows(登録商標)オペレーティングシステム、異なるリリースのUnixオペレーティングシステム及びLinux オペレーティングシステム、Macintoshコンピュータ用の任意のバージョンのMacOS(登録商標)、任意の組込み型オペレーティングシステム、任意のリアルタイムのオペレーティングシステム、任意のオープンソースのオペレーティングシステム、任意の特許取得オペレーティングシステム、任意のモバイル演算デバイス用のオペレーティングシステム又は演算デバイス上で動作し、本明細書で記載される操作を実施することが可能な他の任意のオペレーティングシステムなど、任意のオペレーティングシステム118を実行しうる。オペレーティングシステムは、ネイティブモードで動作することも可能であり、エミュレートモードで動作することも可能である。
図2は、本明細書で教示される実施形態に従い、類似する細胞の予測的なクラスターセットをデータセットから同定するためのモデルを開発する方法200を例示する。方法は、例えば、保存デバイス116又はネットワークデバイス126に保存しうるデータセットを活用する。データセットは、細胞プロファイルデータを含む。細胞プロファイルデータは、個別の細胞が描出され、区画へと分割される複数の視野に関して、複数のバイオマーカーの発現を捕捉するマルチプレックス化バイオメトリック画像を含む。細胞プロファイルデータは、共通性を有する患者コホートから得られた複数の組織試料から作成される。共通性は、例えば、患者が疾患又は状態を共有することでありうる。代替的に、共通性は、例えば、患者が同じ疾患又は状態についての予備診断を共有することでありうる。データセットは、細胞プロファイルデータの、共通性と関連する視野レベルの評価又は患者レベルの評価を含むメタ情報の少なくとも一部分との関連をさらに含む。患者レベルの評価は、例えば、手術後の生存期間でありうる。
220では、類似する細胞の複数のクラスターセットが、データセットから作成される。一部の実施形態では、プロセッサー102、102’など、1つ以上のプロセッサーが、複数のクラスターセットを作成する。作成された複数のクラスターセットの各々は、ユニークな数のクラスターを含む。各細胞を、複数のクラスターセットの各々の中の単一のクラスターに割り当てる。複数のクラスターセットの各々の中の複数のクラスターの各々は、複数の選択された属性であって、そのセットの中の他のクラスターの中の細胞の複数の選択された属性より、そのクラスターの中の他の細胞の複数の選択された属性への類似性が大きい属性を有する細胞を含む。
細胞の類似性は、複数のバイオマーカーの少なくとも1つの発現に基づく、細胞の少なくとも1つの属性の比較から少なくとも部分的に決定される。方法200の一部の実施形態においてクラスターの作成に用いられる細胞属性は、膜の中央値強度と細胞質の中央値強度との合計の半分を、細胞核による複数のバイオマーカーの少なくとも1つの発現の中央値強度から減じることにより定義される核の強度比である。方法200の一部の実施形態においてクラスターの作成に用いられる細胞属性は、核の中央値強度と細胞質の中央値強度との合計の半分を、細胞膜による複数のバイオマーカーの少なくとも1つの発現の中央値強度から減じることにより定義される膜の強度比である。方法200の一部の実施形態においてクラスターの作成に用いられる細胞属性は、膜の中央値強度と核の中央値強度との合計の半分を、細胞質による複数のバイオマーカーの少なくとも1つの発現の中央値強度から減じることにより定義される細胞質の強度比である。方法200の一部の実施形態においてクラスターの作成に用いられる細胞属性は、細胞全体の中央値強度である。例えば、複数のバイオマーカーの各々についての核の強度比は、クラスターセットを作成するためのベースでありうる。
方法200の一部の実施形態では、細胞の類似性を、複数のバイオマーカーの少なくとも1つの発現に基づく、細胞の2つの属性の比較から少なくとも部分的に決定する。例えば、複数のバイオマーカーの少なくとも1つについての核の強度比及び膜の強度比は、クラスターセットを作成するためのベースでありうる。方法200の一部の実施形態では、細胞の類似性を、複数のバイオマーカーの少なくとも1つの発現に基づく、細胞の3つの属性の比較から少なくとも部分的に決定する。例えば、複数のバイオマーカーの少なくとも1つについての核の強度比、膜の強度比及び細胞質の強度比は、クラスターセットを作成するためのベースでありうる。方法200の一部の実施形態では、細胞の類似性を、複数のバイオマーカーの少なくとも1つの発現に基づく、細胞の4つの属性の比較から少なくとも部分的に決定する。例えば、複数のバイオマーカーの少なくとも1つについての核の強度比、膜の強度比及び細胞質の強度比は、クラスターセットを作成するためのベースでありうる。方法200の実施形態では、細胞の類似性を、他の属性の組合せから決定する。方法200の一部の実施形態では、細胞の類似性を、複数のバイオマーカーの少なくとも1つの発現に基づく、細胞の4つを超える属性の比較から決定する。
方法200の一部の実施形態では、Κ中央値によるクラスター化アルゴリズムを、細胞属性の関与性のセットに適用することにより、細胞の類似性のクラスターを作成する。方法200の他の実施形態では、Κ平均によるクラスター化アルゴリズムを、細胞属性の関与性のセットに適用することにより、細胞の類似性のクラスターを作成する。一部の実施形態では、解析コード150が、クラスター化アルゴリズムを含む。
一部の実施形態における複数のクラスターセットは、正規化されたデータセットから作成される。一部の実施形態では、測定値を正規化して、所与の研究における所与のバイオマーカーと関連する全ての測定値の平均及び標準偏差を決定し、この平均値を各測定値から減じ、次いで、得られる差を標準偏差で除することができる。一部の実施形態では、測定値を画像におけるバイオマーカーの発現強度の対数スケールで表す。これらの実施形態において対数スケールで表される測定値の減算は、元の生の測定スケールにおける除算に対応する。他の実施形態では、測定値を正規化して、測定バッチの中の全ての細胞について、細胞全体による発現の中央値強度を決定し、この中央値をバッチの中の各測定値から減じることができる。このような中央値強度は、特定のバイオマーカーの発現に適用することができる。この正規化又は標準化された値は、データベース内に保存することもでき、データベースにおけるデータセット処理の一部として作成することもできる。
一部の実施形態における複数のクラスターセットは、フィルターをかけたデータセットから作成される。このようなフィルタリングは、品質管理措置として行うことができる。このようなフィルタリングにより、例えば、マルチプレックス化画像における閾値より少ない数のピクセルにより表される少なくとも1つの区画を含む細胞と関連する細胞プロファイルデータを除外することができる。フィルタリングはまた、品質管理を超えた理由でも行うことができる。このようなフィルタリングにより、例えば、正常細胞と関連する細胞プロファイルデータを、類似する細胞の複数のクラスターセットを作成するのに用いられるデータセットから除外することができる。
230では、複数のクラスターセットの各々の中で各クラスターに割り当てられた細胞の比率が観察される。240では、共通性と関連する視野レベルの評価又は患者レベルの評価を含むメタ情報の少なくとも一部分との関連について、観察された比率が検証される。観察された比率と視野レベルの評価又は患者レベルの評価との関連は、転帰としての評価を伴う分類モデルと、予測子としての観察されたクラスターの比率とをフィッティングさせることにより導出することができる。Random Forest、ニューラルネットワーク及びロジスティック回帰を含め、複数の分類解析フレームワークが存在する。例えば、一部の実施形態では、組織の悪性度と、所与の細胞クラスターから観察された細胞の存在及び数との関連が、組織の悪性度を転帰として伴うRandom Forestによる分類モデルと、予測子としての観察されたクラスターの比率とをフィッティングさせることにより導出される。他の実施形態では、組織の悪性度と、所与の細胞クラスターから観察された細胞の存在及び数との関連が、組織の悪性度を転帰として伴うニューラルネットワークによる分類モデルと、予測子としての観察されたクラスターの比率とをフィッティングさせることにより導出される。方法200の一部の実施形態は、選択されたクラスターセットにおいて観察された比率を、評価との一変量の関連について検証することをさらに含む。方法200の他の実施形態は、選択されたクラスターセットにおいて観察された比率を、評価との多変量の関連について検証することをさらに含む。
方法200の一部の実施形態では、観察された細胞の比率が、各クラスターに割り当てられた各視野の細胞の観察された比率である。これらの実施形態では、観察された比率が、共通性と関連する視野レベルの評価との関連について検証され、複数のクラスターセットに基づき、視野レベルの評価モデルの性能を比較することを介して、予測的なクラスターセットが選択される。
方法200の一部の実施形態では、観察された細胞の比率が、各クラスターに割り当てられた各患者の細胞の観察された比率である。これらの実施形態では、観察された比率が、状態又は疾患の予後診断との関連について検証され、複数のクラスターセットに基づき、患者レベルの評価モデルの性能を比較することを介して、複数のクラスターセットが選択される。
一部の実施形態では、評価が群分けされる。例えば、前立腺がん患者のコホートでは、2又は3のグリソンスコアを結果としてもたらす評価を併せて群分けすることができる。これらの実施形態では、複数のクラスターセットが、群分けされた、患者コホートの共通性と関連する評価との関連について検証される。例えば、属性の組合せを、グリソンスコアが2又は3である試料が併せて群分けされる低度のグリソンスコアとの関連について検証することができる。他の種類のがんのコホートについての視野レベルの評価は、それらに固有の関与性の腫瘍悪性度を有する他の種類の腫瘍についての評価を伴いうる。他のがんの評価システムには、例えば、乳がんについてのブルーム−リチャードソンシステム及び腎臓がんについてのフールマンシステムが含まれる。一部の実施形態では、がん又は他の疾患が、2つを超える悪性度又は類型の中に収まりうる評価を示す場合はいつでも、類似する悪性度又は類型を群分けすることができる。
250では、複数のクラスターセットの1つが、複数のクラスターセットについての少なくとも1つのモデルの性能の比較に基づき選択される。一部の実施形態では、視覚表示デバイス122が、選択のなされることを可能とする。複数のクラスターセットの各々について、類似する分類モデルを創出することができる。一部の実施形態では、プロセッサー102、102’など、1つ以上のプロセッサーが、分類モデルを創出する。各モデルは、対応するクラスターセットの中の細胞クラスターの比率に基づく評価を予測する。一部の実施形態では、例えば、各モデルは、対応するクラスターセットの中の細胞クラスターの比率に基づき、組織の悪性度を予測する。各クラスターセットについてのモデルの性能は、予測的な性能についての多様なメトリックにより、モデルを開発するのに用いられないテストデータセットにおいて評価することができる。モデルに基づきクラスターセットを比較するのに用いうる性能メトリックには、感度、特異度、ROC(receiver operating characteristic)曲線下面積(また、一致率とも称する)が含まれる。次いで、用いられるクラスターセットを、モデルの性能のメトリックの1つ以上に基づき選択することができる。例えば、一部の実施形態では、最高の一致率と関連するクラスターセットが選択される。他の実施形態では、データが見かけ上オーバーフィッティングであるために、最高の一致率と関連するクラスターセットが選択されない。選択されたセットは、予測的なクラスターセットを含む。方法200の一部の実施形態は、複数のクラスターセットの各々の中のクラスターの数に関して少なくとも1つのモデルの性能を比較することをさらに含む。
方法200の一部の実施形態は、ある数のクラスターを有するクラスターセットであって、それを下回ってクラスターセットの中のクラスターの数が小さくなると、性能の減少がもたらされるクラスターセットを選択することをさらに含む。方法200の一部の実施形態は、ある数のクラスターを有するクラスターセットであって、それを上回ってクラスターセットの中のクラスターの数が大きくなると、統計学的に有意な性能の増大がもたらされないクラスターセットを選択することをさらに含む。方法200の一部の実施形態は、例えば、0.85以上の一致率でありうる、あらかじめ規定された閾値を超える性能メトリックに対応するクラスターセットについての少なくとも1つのモデルの性能に基づき、クラスターセットを選択することをさらに含む。方法200の一部の実施形態は、少なくとも1つの予測的なクラスターを、予測的なクラスターセットから同定することをさらに含む。
方法200の一部の実施形態は、細胞データをトレーニングデータ及びテストデータへと分割し、類似する細胞の複数のクラスターセットをトレーニングデータから作成し、少なくとも1つのモデルの性能をテストデータから決定する。
図3は、本明細書で教示される実施形態に従い、細胞クラスターの特徴を表示する例示的な方法300を示す。この方法は、例えば、保存デバイス116又はネットワークデバイス126に保存しうるデータセットを活用する。データセットは、細胞プロファイルデータを含む。細胞プロファイルデータは、個別の細胞が描出され、区画へと分割される複数の視野に関して、複数のバイオマーカーの発現を捕捉するマルチプレックス化バイオメトリック画像を含む。
320では、類似する細胞の複数のクラスターの中の第1のクラスターが、データセットから同定される。各細胞は、複数のクラスターの1つに割り当てられる。複数のクラスターの中の各クラスターが、複数の選択された属性であって、そのセットの中の他のクラスターの中の細胞の複数の選択された属性より、そのクラスターの中の他の細胞の複数の選択された属性への類似性が大きい属性を有する細胞を含む。220に関して上記で論じた技術のいずれかにより、細胞の類似性を判定することができ、クラスター化を行うことができる。
330では、第1のクラスターの中の第1の細胞のモンタージュを創出する。一部の実施形態では、プロセッサー102、102’など、1つ以上のプロセッサーが、モンタージュを創出する。モンタージュは、第1の細胞による複数のバイオマーカーの各々の発現について描述する、少なくともいくつかのマルチプレックス化画像の部分を含む。少なくともいくつかの画像の各部分は、第1の細胞及び第1の細胞周囲の対象の小領域を含む。
340では、使用者が第1のクラスターの特徴を理解することを可能とするために、第1のクラスターの中の第1の細胞のモンタージュを表示する。一部の実施形態では、モンタージュを、視覚表示デバイス122上に表示する。方法300の他の実施形態で表示される第1の細胞のモンタージュは、第1の細胞による複数のバイオマーカーの各々の発現について描述する視野についての、少なくともいくつかの画像の一連の並置部分を含む。方法300の一部の実施形態で表示される第1の細胞のモンタージュは、第1の細胞による複数のバイオマーカーの各々の発現について描述する視野についての、少なくともいくつかの画像の一連のスーパーインポーズ部分を含む。
方法300の一部の実施形態は、第1のクラスターの中の第2の細胞のモンタージュを創出し、表示することをさらに含む。第2の細胞のモンタージュは、第2の細胞による複数のバイオマーカーの各々の発現について描述する視野についての、少なくともいくつかの画像の部分を含む。少なくともいくつかの画像の各部分は、第2の細胞及び第2の細胞周囲の対象の小領域を含む。図35は、本明細書で教示される実施形態に従い、2つの細胞の例示的なモンタージュを示す。とりわけ、図35は、いずれもが20クラスターのセットによるクラスター15の中の2つの細胞のモンタージュであって、左側の細胞が正常視野(GLO)から採取されるのに対し、右側の細胞はグリソン悪性度3の視野(GL3)から採取されるモンタージュを例示する。方法300の一部のこのような実施形態は、使用者が第1のクラスターの特徴を理解することを可能とするために、第1のクラスターの中の第1の細胞のモンタージュと、第1のクラスターの中の第2の細胞のモンタージュとを同時に表示することをさらに含む。同様に、第1のクラスターの中のさらなる細胞のモンタージュを創出し、表示することもできる。
図4は、本明細書で教示される実施形態に従い、モデル化されたクラスターセットを、新たな細胞プロファイルデータに適用する方法400を例示する。モデル化されたクラスターセットは、例えば、保存デバイス116又はネットワークデバイス126に保存することができる。モデル化されたクラスターセットは、例えば、本明細書で教示される方法200の任意の実施形態を介して展開することができる。
方法400は、患者に由来する少なくとも1つの組織試料についての少なくとも1つの視野に関する細胞プロファイルデータを伴う。細胞プロファイルデータは、複数のバイオマーカーの発現を捕捉するマルチプレックス化バイオメトリック画像を含む。視野の中の個別の細胞は、描出され、区画へと分割される。得られる情報はまた、細胞プロファイルデータ内にも包含される。この方法では、細胞プロファイルデータを、例えば、保存デバイス116又はネットワークデバイス126に保存することができる。
方法400の一部の実施形態は、患者から少なくとも1つの組織試料を得ることをさらに含む。方法400の一部の実施形態は、患者に由来する少なくとも1つの組織試料を染色し、イメージングすることをさらに含む。方法400の一部の実施形態は、複数のバイオマーカーの各々の発現を捕捉するマルチプレックス化画像に基づき、患者に由来する少なくとも1つの組織試料の個別の細胞を描述することをさらに含む。方法400の一部の実施形態は、複数のバイオマーカーの各々の発現を捕捉するマルチプレックス化画像に基づき、患者に由来する少なくとも1つの組織試料の個別の細胞を区画へと分割することをさらに含む。
420では、少なくとも1つの組織試料の視野の中の細胞の各々が、選択されたクラスターセットの中の類似する細胞の複数のクラスターの中の単一のクラスターに割り当てられる。一部の実施形態では、プロセッサー102、102’など、1つ以上のプロセッサーが、細胞を適切なクラスターに割り当てる。選択されたクラスターセットの中の各クラスターは、複数の選択された属性であって、そのセットの中の他のクラスターの中の細胞の複数の選択された属性より、そのクラスターの中の他の細胞の複数の選択された属性への類似性が大きい属性を有する細胞を含む。220に関して上記で論じた技術のいずれかにより、細胞の類似性を判定することができ、クラスター化を行うことができる。一部の実施形態では、解析コード150が、クラスター化アルゴリズムを含む。方法200に関して上記で論じた技術のいずれかにより、クラスターセットを選択することができた。
430では、選択されたクラスターセットにおいて各クラスターに割り当てられた細胞の比率が観察される。方法400の一部の実施形態では、観察された細胞の比率が、各クラスターに割り当てられた各視野の細胞の観察された比率である。方法400の一部の実施形態では、観察された細胞の比率が、各クラスターに割り当てられた各患者の細胞の観察された比率である。
440では、観察された比率が、状態もしくは疾患の診断、予後診断又は状態もしくは疾患の処置に対する応答との関連について検証される。関連は、選択されたクラスターセットの、視野レベルの評価又は患者レベルの評価を含むメタ情報の少なくとも一部分との公知の関連に由来しうる。関連は、例えば、方法200の実施形態に従う解析を介して知ることができる。一部の実施形態では、関連が、グリソンの組織悪性度との関連である。一部の実施形態では、関連が、疾患又は状態による生存期間との関連である。
方法400の一部の実施形態は、観察された比率を、選択されたクラスターセットにおいて、選択されたクラスターセットの公知の一変量の関連に由来しうる一変量の関連について検証することをさらに含む。方法400の他の実施形態は、観察された比率を、選択されたクラスターセットにおいて、選択されたクラスターセットの公知の多変量の関連に由来しうる多変量の関連について検証することをさらに含む。
図5は、本明細書で教示される実施形態に従い、細胞特徴の積率の予測的なセットを、データセットから同定するモデルを開発する方法500を例示する。この方法は、例えば、保存デバイス116又はネットワークデバイス126に保存しうるデータセットを活用する。データセットは、細胞プロファイルデータを含む。細胞プロファイルデータは、個別の細胞が描出され、区画へと分割される複数の視野に関して、複数のバイオマーカーの発現を捕捉するマルチプレックス化バイオメトリック画像を含む。細胞プロファイルデータは、共通性を有する患者コホートから得られた複数の組織試料から作成される。共通性は、例えば、患者が疾患又は状態を共有することでありうる。代替的に、共通性は、例えば、患者が同じ疾患又は状態についての予備診断を共有することでありうる。データセットは、細胞プロファイルデータの、共通性と関連する視野レベルの評価又は患者レベルの評価を含むメタ情報の少なくとも一部分との関連をさらに含む。患者レベルの評価は、例えば、手術後の生存期間でありうる。
520では、少なくとも1つの細胞特徴が、細胞による複数のバイオマーカーの各々の発現に基づき計算される。少なくとも1つの細胞特徴が計算される前に、細胞プロファイルデータを正規化することができる。一部の実施形態では、測定値を標準化して、所与の研究における所与のバイオマーカーと関連する全ての測定値の平均及び標準偏差を決定し、この平均値を各測定値から減じ、次いで、得られる差を標準偏差で除することができる。一部の実施形態では、測定値が、画像におけるバイオマーカーの発現強度の対数スケールで表される。これらの実施形態において対数スケールで表される測定値の減算は、元の生の測定スケールにおける除算に対応しうる。他の実施形態では、測定値を標準化して、測定バッチの中の全ての細胞について、細胞全体による発現の中央値強度を決定し、この中央値をバッチの中の各測定値から減じることができる。このような中央値強度は、特定のバイオマーカーの発現に適用することができる。この正規化又は標準化された値は、データベース内に保存することもでき、データベースにおけるデータセット処理の一部として作成することもできる。
少なくとも1つの細胞特徴が計算される前に、一部の実施形態では、さらなる計算に由来する細胞プロファイルデータのサブセットにフィルターをかける。このようなフィルタリングは、品質管理措置として行うことができる。このようなフィルタリングにより、マルチプレックス化画像における閾値より少ない数のピクセルにより表される少なくとも1つの区画を含む細胞と関連する細胞プロファイルデータを除外することができる。フィルタリングはまた、品質管理を超えた理由でも行うことができる。このようなフィルタリングにより、複数の形態バイオマーカーの各々の発現を、さらなる計算から除外することができる。したがって、本明細書で教示される一部の実施形態では、少なくとも1つの細胞特徴を計算することが、細胞による複数の非形態バイオマーカーの各々の発現に基づき、少なくとも1つの細胞特徴を計算することを伴う。
方法500の一部の実施形態は、細胞による複数の非形態バイオマーカーの各々の発現に基づき、2つ、3つ、4つ以上の細胞特徴を計算することを伴う。一部の実施形態では、プロセッサー102、102’など、1つ以上のプロセッサーが、細胞特徴を計算する。一部の実施形態では、解析コード150が、各細胞特徴についての定義を含む。一部の実施形態における細胞特徴は、膜の中央値強度と細胞質の中央値強度との合計の半分を、細胞核による複数のバイオマーカーの少なくとも1つの発現の中央値強度から減じることにより定義される核の強度比を含む。一部の実施形態における細胞特徴は、核の中央値強度と細胞質の中央値強度との合計の半分を、細胞膜による複数のバイオマーカーの少なくとも1つの発現の中央値強度から減じることにより定義される膜の強度比を含む。一部の実施形態における細胞特徴は、膜の中央値強度と核の中央値強度との合計の半分を、細胞質による複数のバイオマーカーの少なくとも1つの発現の中央値強度から減じることにより定義される細胞質の強度比を含む。
530では、第1の積率が、細胞特徴の各々に由来する複数の視野の各々について計算される。一部の実施形態では、プロセッサー102、102’など、1つ以上のプロセッサーが、細胞特徴の第1の積率を計算する。本明細書で教示される実施形態は、第2の積率及び/又は第3の積率を、細胞特徴の各々に由来する複数の視野の各々について計算することをさらに伴いうる。
540では、属性の複数の組合せが、共通性と関連する視野レベルの評価又は患者レベルの評価を含むメタ情報の少なくとも一部分との関連について検証される。属性の複数の組合せは、少なくとも計算された第1の積率を含む。視野において観察された全てのバイオマーカーの第1の積率と、視野レベルの評価又は患者レベルの評価との関連は、転帰としての評価を伴う分類モデルと、予測子としてのバイオマーカーの第1の積率とをフィッティングさせることにより導出することができる。Random Forest、ニューラルネットワーク及びロジスティック回帰を含め、複数の分類解析フレームワークが存在する。例えば、一部の実施形態では、組織の悪性度と、視野において観察された全てのバイオマーカーの第1の積率との関連が、組織の悪性度を転帰として伴うRandom Forestによる分類モデルと、予測子としてのバイオマーカーの第1の積率とをフィッティングさせることにより導出される。他の実施形態では、組織の悪性度と、視野において観察された全てのバイオマーカーの第1の積率との関連が、組織の悪性度を転帰として伴うニューラルネットワークによる分類モデルと、予測子としてのバイオマーカーの第1の積率とをフィッティングさせることにより導出される。一部の実施形態では、関連が、特定のグリソン悪性度など、試料の視野レベルの評価との関連である。他の実施形態では、関連が、疾患又は状態による生存期間など、患者レベルの評価との関連である。
一部の実施形態では、プロセッサー102、102’など、1つ以上のプロセッサーが、組合せを検証する。第2の積率を計算することを伴う実施形態では、540における検証することが、計算された第1の積率及び第2の積率を含む属性の複数の組合せを、共通性と関連する視野レベルの評価又は患者レベルの評価を含むメタ情報の少なくとも一部分との関連について検証することを伴う。第3の積率を計算することを伴う実施形態では、540における検証することが、計算された第1の積率及び第3の積率を含む属性の複数の組合せを、共通性と関連する視野レベルの評価又は患者レベルの評価を含むメタ情報の少なくとも一部分との関連について検証することを伴う。一部の実施形態は、計算された第1の積率、第2の積率及び第3の積率を検証することをさらに伴う。
一部の実施形態では、540における検証することが、共通性と関連する視野レベルの評価又は患者レベルの評価を含むメタ情報の少なくとも一部分との一変量の関連について計算された積率を検証することを伴う。一部の実施形態では、540における検証することが、共通性と関連する視野レベルの評価又は患者レベルの評価を含むメタ情報の少なくとも一部分との多変量の関連について計算された積率を検証することを伴う。第2の積率及び/又は第3の積率が計算される方法500の実施形態では、計算された積率により、共通性と関連する視野レベルの評価又は患者レベルの評価を含むメタ情報の少なくとも一部分との一変量又は多変量の関連について検証することができる。
一部の実施形態では、視野レベルの評価が群分けされる。前立腺がん患者のコホートでは、例えば、2又は3のグリソンスコアを結果としてもたらす評価を併せて群分けすることができる。これらの実施形態では、属性の複数の組合せを、群分けされた、患者コホートの共通性と関連する視野レベルの評価との関連について検証する。例えば、属性の組合せを、グリソンスコアが2又は3である試料が併せて群分けされる低度のグリソンスコアとの関連について検証することができる。他の種類のがんのコホートについての視野レベルの評価は、それらの固有の関与性の腫瘍悪性度を有する他の種類の腫瘍についての評価を伴いうる。他のがんの評価システムには、例えば、乳がんについてのブルーム−リチャードソンシステム及び腎臓がんについてのフールマンシステムが含まれる。一部の実施形態では、がん又は他の疾患が、2つを超える悪性度又は類型の中に収まりうる評価を示す場合はいつでも、類似する悪性度又は類型を群分けすることができる。
550では、属性の複数の組合せの1つが、属性の複数の組合せについての少なくとも1つのモデルの性能の比較に基づき選択される。一部の実施形態では、視覚表示デバイス122が、選択のなされることを可能とする。属性の複数の組合せの各々について、類似する分類モデルを創出することができる。一部の実施形態では、プロセッサー102、102’など、1つ以上のプロセッサーが、分類モデルを創出する。各モデルは、対応する属性の組合せに基づく評価を予測する。一部の実施形態では、例えば、各モデルは、対応する属性のセットに基づき、組織の悪性度を予測する。各属性の組合せについてのモデルの性能は、予測的な性能についての多様なメトリックにより、モデルを開発するのに用いられないテストデータセットにおいて評価することができる。モデルに基づき属性の組合せを比較するのに用いうる性能メトリックには、感度、特異度、ROC(receiver operating characteristic)曲線下面積(また、一致率とも称する)が含まれる。次いで、用いられる属性の組合せを、モデルの性能メトリックの1つ以上に基づき選択することができる。例えば、一部の実施形態では、最高の一致率と関連する属性の組合せが選択される。他の実施形態では、データが見かけ上オーバーフィッティングであるために、最高の一致率と関連する属性の組合せが選択されない。例えば、一部の実施形態は、例えば0.85以上の一致率でありうる、あらかじめ規定された閾値を超える性能メトリックに対応する属性の組合せについての少なくとも1つのモデルの性能に基づき、属性の組合せを選択することを伴う。他の実施形態は、他の組合せについてのモデルの性能と比較したその組合せについてのモデルの性能に基づき、組合せを選択することを伴いうる。選択された属性の組合せは、予測的な属性の組合せを含む。方法500の実施形態は、積率モデルに由来する少なくとも1つの予測的な非形態的マーカーを同定することをさらに含んでいてもよい。
図6は、本明細書で教示される実施形態に従い、積率のモデルセットを新たな細胞プロファイルデータに適用する方法600を例示する。積率のモデルセットは、例えば、保存デバイス116又はネットワークデバイス126に保存することができる。積率のモデルセットは、例えば、本明細書で教示される方法500の任意の実施形態を介して開発することができる。
方法600は、患者に由来する少なくとも1つの組織試料についての少なくとも1つの視野に関する細胞プロファイルデータを伴う。細胞プロファイルデータは、複数のバイオマーカーの発現を捕捉するマルチプレックス化バイオメトリック画像を含む。視野の中の個別の細胞は、描出され、区画へと分割される。得られる情報はまた、細胞プロファイルデータ内にも包含される。細胞プロファイルデータは、例えば、保存デバイス116又はネットワークデバイス126に保存することができる。
方法600の一部の実施形態は、患者から少なくとも1つの組織試料を得ることをさらに含む。方法600の一部の実施形態は、患者に由来する少なくとも1つの組織試料を染色し、イメージングすることをさらに含む。方法600の一部の実施形態は、複数のバイオマーカーの各々の発現を捕捉するマルチプレックス化画像に基づき、患者に由来する少なくとも1つの組織試料の個別の細胞を描述することをさらに含む。方法600の一部の実施形態は、複数のバイオマーカーの各々の発現を捕捉するマルチプレックス化画像に基づき、患者に由来する少なくとも1つの組織試料の個別の細胞を区画へと分割することをさらに含む。
620では、少なくとも1つの細胞特徴が、細胞による複数のバイオマーカーの各々の発現に基づき計算される。一部の実施形態では、プロセッサー102、102’など、1つ以上のプロセッサーが、少なくとも1つの細胞特徴を計算する。一部の実施形態では、解析コード150が、各細胞特徴についての定義を含む。細胞特徴は、方法500に関して論じた任意の細胞特徴でありうる。方法600の一部の実施形態は、方法500に関して論じた細胞特徴の任意の組合せを備えていてもよい。複数の細胞特徴を計算することをさらに含む。細胞特徴は、細胞による非形態的バイオマーカーの発現から計算することができる。
630では、第1の積率が、各視野の各細胞特徴について計算される。一部の実施形態では、プロセッサー102、102’など、1つ以上のプロセッサーが、細胞特徴の第1の積率を計算する。方法500と同様に、方法600は、各細胞特徴について第2の及び/又は第3の積率を計算することをさらに含んでいてもよい。
640では、計算された第1の積率が、状態もしくは疾患の診断、予後診断又は状態もしくは疾患の処置に対する応答との関連について検証される。関連は、例えば、方法500に関して記載されたデータセットなどの既存のデータセットに基づく積率のモデルセットから知ることができる。一部の実施形態では、関連が、特定のグリソン悪性度などの細胞悪性度との関連である。他の実施形態では、関連が、疾患又は状態による生存期間との関連である。
第2の積率を計算することを伴う方法600の実施形態では、640における検証することが、計算された第1の積率及び第2の積率を、状態もしくは疾患の診断、予後診断又は状態もしくは疾患の処置に対する応答との関連について検証することを伴う。第3の積率を計算することを伴う実施形態では、640における検証することが、計算された第1の積率及び第3の積率を、状態もしくは疾患の診断、予後診断又は状態もしくは疾患の処置に対する応答との関連について検証することを伴う。一部の実施形態は、計算された第1の積率、第2の積率及び第3の積率を検証することをさらに伴う。
一部の実施形態では、プロセッサー102、102’など、1つ以上のプロセッサーが、計算された第1の積率を検証する。方法600の一部の実施形態では、640における検証することが、計算された第1の積率を、状態もしくは疾患の診断、予後診断又は状態もしくは疾患の処置に対する応答との一変量の関連について検証することを伴う。方法600の他の実施形態では、640における検証することが、計算された第1の積率を、状態もしくは疾患の診断、予後診断又は状態もしくは疾患の処置に対する応答との多変量の関連について検証することを伴う。第2の積率及び/又は第3の積率が計算される方法600の実施形態では、計算された積率を、状態もしくは疾患の診断、予後診断又は状態もしくは疾患の処置に対する応答との一変量の関連又は多変量の関連について検証することができる。
例示的な解析及び視覚化
データセット
がんのために前立腺の手術を受けた患者コホートに由来する組織試料に由来する情報を用いて、本明細書で教示される例示的な方法に従う解析を実施した。組織試料は、組織培養物として定義することができ、in vivo試料を備えていてもよい。。80例の患者に由来する前立腺の組織試料が、解析に利用可能であった。寄与集団のうち、62例が前立腺がんを有した。これら62例の前立腺がん患者のうち、11例が追跡時になおも存命であり、22例が前立腺がんにより死亡しており、残りの29例は他の原因で死亡していた。表1は、本発明者らのデータへの寄与集団の年齢、生存期間及び病理学者により導出されたグリソンスコアについての集団統計を示す。
本発明の他の実施形態は、異なる共通性を共有する患者コホートに由来する組織試料を伴う。例えば、一実施形態は、患者が乳がんなど、別の形態のがんを有するか否かを決定するために患者コホートから採取された組織試料を伴いうる。別の実施形態は、患者がパーキンソン病など、別の疾患を有するか否かを決定するために患者コホートから採取された組織試料を伴いうる。同様に、本発明の他の実施形態は、より大きい患者コホート又はより小さい患者コホートも伴う。
組織試料は、蛍光ベースのマルチプレックス化免疫組織化学を用いて処理した。解析では14のバイオマーカーを用いた。14のうち5つのバイオマーカー:NaKATPアーゼ、PCAD、DAPI、S6及びケラチンを、個別の細胞を分割及び区画化するのに用いた。残りのマーカーは、AR、pmTOR、PI3Kp110a、PI3Kp85a、ベータカテニン、EGFR、切断型カスパーゼ3、pGSK3a及び切断型PARPであった。全てのバイオマーカーは、定性的な染色品質の点検に合格した。
本発明の他の実施形態は、異なるバイオマーカーを伴う。同様に、本発明の他の実施形態は、より多くのバイオマーカー又はより少ないバイオマーカーも伴う。
自己蛍光の除去、照度補正及び細胞分割の後、データは、全ての対象で各視野に分割された各細胞の3つの区画における各タンパク質画像の中央値強度を包含した。細胞は、以下のフィルターを適用することにより品質管理した。
1.細胞が、バックグラウンド(登録ミスのために不完全なマーカーデータを伴う画像の境界領域)とオーバーラップしないこと
2.細胞の核の分割が2つ以下であること
3.細胞核が少なくとも50ピクセルを含有すること
4.細胞質が少なくとも50ピクセルを含有すること
5.細胞膜が少なくとも50ピクセルを含有すること。
本発明の他の実施形態は、異なる品質管理特徴を伴う。同様に、本発明の他の実施形態は、より多くの品質管理特徴又はより少ない品質管理特徴も伴う。
イメージング、分割及び品質管理の後に、54例の患者対象が残った。患者1例当たりの視野数は、6〜90の範囲であった。54例の対象においてイメージングされたのべ1757の視野のうち、1349の視野が、解析に十分な組織を含有した。これらの1349の視野の各々は、解析チームの病理学者(QL)により成功裏に評価された。
特に、グリソンスコアは、全ての視野について、解析チームの病理学者(QL)により、0〜5のスケールで、手作業により記録された。グリソン悪性度2のデータがまれであるために、悪性度2の視野を、グリソン悪性度3の視野と組み合わせた。表2は、視野レベルのグリソン悪性度についての概要を示す。
本発明の他の実施形態は、異なる視野レベルの評価であって、関与性の患者コホートに影響を及ぼす疾患又は状態に適切でありうる評価を伴いうる。
対象試料は、5つのバッチに受容され、解析された。表3は、5つのバッチに対するグリソンスコアについての解析結果であって、表示項目が組織試料の総数である解析結果を示す。一部の対象が複数のバッチにおいて解析されたために、表3は、54例の固有の対象に由来するのべ63の組織試料を含む。9例の対象が複数の組織試料を有した:これらの対象のうちの4例が2つのバッチで解析され、2例が3つのバッチで解析され、2例は単一のバッチにおいて2回にわたり解析された。最後の対象は、4つの異なるバッチで解析された。
無病生存は、手術と死亡又は追跡との間の時間として定義された。この尺度は、対象が追跡時において存命であるか又は前立腺がん以外の原因で死んだ場合は右側打ち切りとして扱われた。患者対象のうちの18例は、追跡以前に、前立腺がんで死亡した。また、各患者対象に享受可能な術後の生存期間もデータセットに付加し、これにより、生のデータセットを補完した。
本発明の他の実施形態は、異なる患者レベルの評価であって、関与性の患者コホートに影響を及ぼす疾患又は状態に適切でありうる評価を伴いうる。
細胞全体及び区画の中央値強度は、各バッチの中で、バッチの中の全ての対象における全ての細胞についての全ての細胞全体の測定値の中央値を減じることにより正規化した。複数のバッチにおいて解析された8例の対象については、視野をバッチで正規化し、次いで、その後、単一のバッチにおいて解析された対象と同じ形で取り扱った。本発明の他の実施形態は、収集されたデータのより多くの正規化を伴う場合もあり、より少ない正規化を伴う場合もあり、異なる正規化を伴う場合もあり、正規化を伴わない場合もある。
さらなる細胞特徴
各タンパク質について個別に、4つの細胞特徴を細胞レベルのデータから計算した。各々がlog2スケールで定義される4つの特徴は、細胞全体の中央値強度、核の強度比、膜の強度比及び細胞質の強度比であった。3つの区画比は、核、膜又は細胞質の発現の中央値強度を、他の2つの区画の平均の中央値強度へと関連付ける。3つの区画比は、以下の通りに定義した。
n=In−(Im+Ic)/2
m=Im−(In+Ic)/2
c=Ic−(Im+In)/2
[式中、In、Im及びIcは、核、膜及び細胞質のそれぞれにおけるlog2スケールによる中央値強度である]。区画の中のマーカーの発現レベル、例えば、膜におけるNaKATPアーゼは、記載される通り、1つの区画の他の2つの区画の平均に対する比と解釈した。本発明の他の実施形態は、より多くの細胞特徴を伴う場合もあり、より少ない細胞特徴を伴う場合もあり、異なる細胞特徴を伴う場合もある。
上記のデータセットは保存された。計算される任意のさらなる細胞特徴を、保存されたデータセットに付加することができる。
分類モデル及び生存モデル
2つの異なる種類の解析(積率解析及び細胞クラスター解析)を行った。次いで、各種類の解析の結果を、分類モデル及び生存モデルと個別に比較した。
視野レベルの評価モデルのために、本発明の実施形態では、上記の特徴を伴う、L. Breiman's "Random Forests" in Machine Learning 45(1), 5-32 (2001)において記載されているRandom Forest分類子を適用した。その結果、グリソン悪性度の視野と関連する2つの個別のモデルが得られた。第1のモデルは、グリソン悪性度(すなわち、2、3、4又は5)の視野を、グリソン悪性度0の視野から識別した。第2のモデルは、グリソン悪性度4又は5の視野を、グリソン悪性度2又は3の視野から識別した。第2のモデルでは、グリソン悪性度0の視野を解析から除去した。R(v.2.11.0)用のRandom Forestパッケージ(v.4.5−36)をデフォルトの設定で用いた。200ツリーを構築した後で、OOB(out−of−bag)の誤差率が収束したので、500ツリーを分類子に用いた。フィッティングでは、データをサンプリングし、対象により層別化して(層変数をRandom Forestに用いて)、対象を多数の視野で過剰に重みづけすることを回避した。OOB(out−of−bag)予測から予測されるクラス確率を閾値化することにより、ROC(receiver operating characteristic)解析を行った。ROC曲線下面積(AUC)を推定した。変数重要度の結果は、所与の変数に由来するデータにスクランブルをかけるときの分類精度の低下に基づいた。変数依存性プロットは、予測されるクラス確率の対数値に基づいた。本発明の他の実施形態は、より多くの視野レベルの評価モデルを用いる場合もあり、より少ない視野レベルの評価モデルを用いる場合もあり、異なる視野レベルの評価モデルを用いる場合もある。
生存(患者レベルの転帰)との関連のために、対象の侵襲性視野(グリソンスコア>0)にわたるスポットレベルの特徴の平均及び対象の正常視野にわたる第2の平均を記録した。特定の種類の視野を伴わない対象のマーカーの特徴データは、集団の中央値に帰属させた。
患者レベルの評価モデルのために、本発明の実施形態では、H. Ishwaran et al.'s "Random Survival Forests" in the Ann. App. Statist. 2:841-860 (2008)において開示されているRandom Survival ForestモデルなどのRandom Survival Forestモデルを適用した。R(v.2.11.0)用のRandom Survival Forestパッケージ(v.3.6.3)をデフォルト変数で用いた。5000ツリーを用いてモデルを構築した。表中記載の誤差メトリックは、1−[Harrellの一致率指数(ランダムに選択された対象の対において、最初に死亡する対象のモデルで予測される転帰が不良であった確率)]であった。Harrell, F,E. et al. in "Evaluating the Yield of Medical Tests," J. Amer. Med. Assoc. 247:2543-2546 (1982)によれば、50%誤差はランダムモデルであり、0%が完全モデルである。本発明の他の実施形態は、より多くの患者レベルの評価モデルを用いる場合もあり、より少ない患者レベルの評価モデルを用いる場合もあり、異なる患者レベルの評価モデルを用いる場合もある。
この誤差メトリックは、OOB(out−of−bag)試料において推定した。変数重要度の結果は、ランダムな派生割付けを特徴に関するツリーノードに用いるときの、所与の特徴についての一致率誤差の増大に基づいた。偏変数依存性プロットは、集団内の対象において常に観察される所与の特徴の関数として集団内で予測される死亡率である相対死亡率に基づいた。さらに、時間の閾値を3、5及び10年後に設定し、患者が閾値以前に前立腺がんで死亡したかどうかを分類することにより、3つの個別の二元分類モデルを生存データへとフィッティングさせた。
積率解析
FOVレベルのグリソン悪性度との関連のために、本発明の実施形態の積率ベースの解析では、4つの細胞レベルの特徴を、視野レベルの統計にまとめた。視野の中の細胞集団に基づき、14のマーカー全てについて、4つずつの発現レベルの特徴全ての平均、標準偏差及び歪度を記録した。悪性度FOVとの関連のために、構造マーカー及び標的マーカーを含めた14のマーカー全てを、予測子として考えた。これは、14のバイオマーカーの各々に4つずつの細胞特徴の各々に3つずつの積率(合計168のFOV属性)を結果としてもたらした。本発明の他の実施形態は、より多くの視野レベルの属性を用いる場合もあり、より少ない視野レベルの属性を用いる場合もあり、異なる視野レベルの属性用いる場合もある。
例えば、単一の細胞分割に由来する以下の細胞の形態特徴は、多様な実施形態における積率ベースのモデル内に包含されうる:Eccentricity_Cell、Solidity_Cell MajorAxisLength_Cell、MajorAxisAngle_Cell、Perimeter_Cell、Area_Cell、Area_Nuclei、Area_Mem、and Area_Cyto。
積率解析を用いる視野評価の予測
視野評価モデルを構築するに当たり、FOV属性に関して3つの選択肢を考慮した。
(1)蛍光データに基づく特徴を含むか否か、
(2)細胞の形態データを含むか否か及び
(3)蛍光データの何次の積率を含むのか:平均(m1)、平均及び標準偏差(m12)又は平均、標準偏差及び歪度(m123)。
本発明の他の実施形態は、視野属性に関してより多くの選択肢を考慮する場合もあり、より少ない選択肢を考慮する場合もあり、異なる選択肢を考慮する場合もある。
表4は、異なる積率ベースの特徴セットに基づき、がん性悪性度(グリソン2、3、4又は5)視野を、正常悪性度(グリソン0)視野と対比して比較する分類子の性能を示す。積率の次数(m1、m12又はm123)の少なくとも1つを含めた全てのFOV属性の複数の組合せについて調べた。一部の組合せには、蛍光マーカーデータが含まれ、一部には、細胞の形態特徴が含まれた。ROC曲線下面積(AUC)は、蛍光マーカーデータの少なくとも第1の積率を含む全てのモデルについて少なくとも98%であった。形態特徴はAUCをわずかに増大させるに過ぎなかった。
表5は、高悪性度(グリソン4又は5)のがん性視野を、低悪性度(グリソン2又は3)のがん性視野と対比して比較する分類子の性能を示す。ここでもまた、蛍光マーカーデータの少なくとも第1の積率を包含しないモデルでは、AUCが減少した。
上位のモデルについてのROC曲線を、図7及び8に示す。
上位のモデルについての変数重要度プロットを、図9及び10に示す。いずれの場合にも、上位の特徴は、NaKATPアーゼと関連し、膜の外側で定量化されるか又はFOVレベルの標準偏差が大きい。がん/正常分類子における第1の形態特徴は、一覧表の24位である核の面積である。
積率解析を用いる患者レベルの評価の予測
患者レベルの評価モデルを構築するに当たり、FOV属性に関して4つの選択肢を考慮した。
(1)蛍光データに基づく特徴を含むか否か、
(2)細胞の形態データを含むか否か、
(3)蛍光データの何次の積率を含むのか:平均(m1)、平均及び標準偏差(m12)又は平均、標準偏差及び歪度(m123)及び
(4)患者に由来するどの視野を含むのか:侵襲性組織だけの視野、正常組織だけの視野、全ての組織の視野又は侵襲性組織の平均から正常組織の平均を減じた視野。
本発明の他の実施形態は、視野属性に関してより多くの選択肢を考慮する場合もあり、より少ない選択肢を考慮する場合もあり、異なる選択肢を考慮する場合もある。
表6は、全患者のデータセットへとフィッティングさせた全ての積率ベースのモデルについての性能メトリックを示す。「包含されるFOV」列における「inv−norm」というコードは、対象について用いられる特徴が、それらの侵襲性視野において認められる平均からそれらの正常視野において観察される平均を減じた差であることを意味する。特定の場合には、年齢及びグリソンスコアだけを伴うモデルを11回にわたりフィッティングさせたが、これらの行は太字で強調する。太字の11行についての異なる結果は、Random Survival Forest手順及びRandom Forest手順に固有のランダムサンプリング誤差と関連する。
侵襲性視野にマーカーの第1の積率を伴い、形態特徴を伴わないモデルが、好ましいモデルであった。RSFによる一致率のメトリックにおいてこのモデルを凌ぐモデルも存在するが、3年後及び10年後のAUCではこのモデルの方が優れており、第1の積率及び第2の積率を含むモデルを0.8%下回るに過ぎない。さらに、このモデルは、5年後のAUCが、ヌルモデルより73%〜93%大きい。ヌルモデルのRSFによる一致率を大幅に凌ぐモデルは見られない。
表7は、グリソンスコアが0を超える患者を除外した患者データセットに適用された、モデルについての同じ性能メトリックを示す。侵襲性視野におけるマーカー特徴の第1の積率を含む、表7における上位のモデルは、RSFによる一致率(69%→81%)、5年後のAUC(68%→89%)及び10年後のAUC(64%→87%)において、ヌルモデルを大幅に改善している。表6と同様に、表7の太字で強調された行は、年齢及びグリソンスコアだけを包含したモデルである。
上位2つのモデルにおける上位4つの特徴についての偏変数依存性プロットを、図11及び12に示す。
図13に示される通り、全コホート解析では、PI3Kp110a、PCAD及びpGSK3aが、マーカーのうちで最も予測的であった。図14は、膜におけるPI3Kp110量及びpGSK3a量の増大、並びに細胞全体におけるPCAD量の減少が、生存の短縮と関連しうることを示す。図15及び16で認められる通り、グリソンスコアが0を超える対象のコホートでは、重要な特徴の覧表が類似した。
全ての上位の特徴を明白なバッチ効果について点検したが、バッチ効果は見いだされなかった。例えば、バッチ1においてわずかな差分が認められるに過ぎない図17を参照されたい。
細胞クラスター解析
本発明の実施形態の細胞クラスター解析では、対象により層別化した全コホートからサンプリングされた20,000個の細胞についてのΚ中央値によるクラスター化を用いて、14のマーカー及び4つの細胞レベルの特徴、56次元のマーカー空間に基づき、細胞をΚ群へとクラスター化した。Κを2〜50の範囲として、R(v.2.11.0)用のFlexclustライブラリーのstepFlexclust関数(v.1.3−1)を20連で実行した。次いで、クラスターのセントロイドからの距離を計算することにより、全コホート内の細胞をΚクラスターの1つと関連させた。これは、Flexclust内の予測関数を用いて達成した。次いで、FOVレベルの細胞クラスターの特徴を、Κクラスターの各々に属するFOVの中の細胞の比率として定義した。作成されるΚ群セットの各々について、個別の分類モデル及び生存モデルをフィッティングさせた。本発明の他の実施形態では、異なるクラスター化アルゴリズムを用いる場合もあり、アルゴリズムを細胞属性の異なるセットに適用する場合もあり、作成するクラスターセットの異なる範囲を指定する場合もあり、作成するクラスターセットの特定の数を同定する場合もある。
クラスター解析を用いる視野レベルの評価の予測
図18及び19に見られる通り、がん視野を正常視野と対比する分類子及び高悪性度がん視野を低悪性度がん視野と対比する分類子のいずれの性能も、約20の細胞クラスターを包含した後で定常化した。細胞クラスターが20のとき、正常をがんと対比する分類子のAUCは、トレーニングセット及びテストセットのそれぞれにおいて96.1%及び95.7%であった。細胞クラスターが20のとき、高悪性度がんを低悪性度がんと対比する分類子のAUCは減少した:トレーニングセットにおける88.0%及びテストセットにおける88.7%であった。形態特徴は、これらのモデル内に包含されなかった。
20の細胞クラスターモデルについてのROC曲線を、図20及び21に示す。図22及び23において示される通り、がんを正常と対比する分類子及び 高悪性度がんを低悪性度がんと対比する分類子のいずれの分類子においても、単一のクラスター7が、FOV悪性度について高度に予測的であるものとして突出している。クラスター7は、いずれのモデルにおいても、上位4つの特徴の残りの特徴と同様、正常組織の指標である(図24及び25を参照されたい)。高悪性度のがんにおいてクラスター7の細胞が少数であるパターンは、5つのバッチ全てにおいて明らかであった(図26を参照されたい)。
クラスター7の細胞のFOV比率をバッチ効果について点検したが、バッチ効果は見いだされなかった。
クラスター7のシグネチャーを、図27にプロットする。このクラスターの著明な特徴は、それら両者の細胞質における量の減少と関連する、NaKATPアーゼ及びベータカテニンの両方の核及び膜における量の増大である。
クラスター解析を用いる患者レベルの評価の予測
全コホート解析において、年齢及びグリソンスコアによるヌルモデルを幾分か上回って改善することができるのは、遠隔期生存の予測だけである。これを、Random Survival Forestによる一致率(RSF_CONC)、並びに3、5及び10年以内の前立腺がんによる死亡を分類するためのAUC(AUC_*YR)を、モデル内に包含されるクラスター数と対比してプロットする図28に示す。正常FOVと対比した侵襲性FOVの組入れは、図中の色により差別化される。ヌルモデルより性能が大きい可能性があるモデルは、5年後以降における生存予測の改善を示したので、侵襲性の特徴を含むモデルである。一般に、6つのクラスターにより良好な性能がもたらされる。
グリソンスコアが0を超えるコホート解析では、少なくとも5つの細胞クラスターを含むと、生存期間についての一致率のメトリック及び5年後及び10年後における死亡分類率が、ヌルモデルより良好である(図29を参照されたい)。約20クラスターを含むまでは、生存期間についての一致率が上昇するのに対し、5年後における死亡は、5つだけのクラスターによるときの分類が最も良好である。正常FOVに由来する特徴を含むことは一般に、モデルの性能を改善しない。
図30における、全コホートに適用された、侵襲性組織の中の6つのクラスターを包含したモデルについての変数重要度プロットは、クラスター6が、モデルの中の他の5つのクラスターのいずれよりはるかに大きく予測的であることを示す。図31に示される通り、クラスター6は、生存期間の短縮と関連する。
グリソンスコアが0を超えるコホートについての20クラスターによる解析では、2つのクラスター:クラスター7及びクラスター1が、生存期間を予測するのに比較的重要である。図32は、グリソンスコアが0を超えるコホートについての生存モデルの変数重要度を示す図である。クラスター7が生存期間の延長と関連するのに対し、クラスター1は、生存期間の短縮と関連する。図33は、グリソンスコアが0を超えるコホートについての20クラスターのモデルにおける上位4つの特徴の偏変数依存性を示す図である。
上位のクラスター全てをバッチ効果について点検したが、バッチ効果は見いだされなかった。
クラスター6/8及びクラスター1/20のシグネチャーを、図34に示す。これらの2つのクラスターは、NaKATPアーゼ、S6、ベータカテニン、PCAD、PI3Kp110a及びケラチンの明確な局在化を顕徴とする、類似するシグネチャーを示す。これらの2つのクラスターはまた、細胞全体におけるNaKATPアーゼ、ベータカテニン及びケラチンが幾分か低度であることも示す。
本明細書では、本発明の特定の特徴だけを例示及び記載してきたが、当業者は、多くの改変及び変更に想到するであろう。したがって、付属の特許請求の範囲は、このような改変及び変更の全てを、本発明の真の精神の範囲内に収まるものとして対象とすることを意図することが理解される。
特許請求の範囲では、特定の限定の組合せについて列挙するが、本発明は、各独立請求項を、それ自体で、また、明らかに不適合な限定の組合せを除き、関連する従属請求項において明記される任意の可能な限定の組合せと共に明示的に包摂する。例えば、本発明は、異なるクラスター化アルゴリズムの適用を要請する2つの従属請求項のうちの1つだけを除き、関連する従属請求項の各々において列挙される限定と組み合わせて、独立請求項1を明示的に包摂する。

Claims (54)

  1. マルチプレックス化バイオメトリック画像データに基づき、組織特徴を解析する方法であって、
    個別の細胞が描出され、区画へと分割される複数の視野に関して、複数のバイオマーカーの発現を捕捉するマルチプレックス化バイオメトリック画像を含む細胞プロファイルデータを含むデータセットを保存し、細胞プロファイルデータを、共通性を有する患者コホートから得られた複数の組織試料から作成し、データセットが、細胞プロファイルデータの、共通性と関連する視野レベルの評価又は患者レベルの評価を含むメタ情報の少なくとも一部分との関連をさらに含み、
    類似する細胞の複数のクラスターセットをデータセットから作成し、複数のクラスターセットの各々がユニークな数のクラスターを含み、各細胞を複数のクラスターセットの各々の中の単一のクラスターに割り当て、複数のクラスターセットの各々の中の複数のクラスターの各々が、複数の選択された属性であって、そのセットの中の他のクラスターの中の細胞の複数の選択された属性より、そのクラスターの中の他の細胞の複数の選択された属性への類似性が大きい属性を有する細胞を含み、
    複数のクラスターセットの各々の中で、各クラスターに割り当てられた細胞の比率を観察し、
    観察された比率を、共通性と関連する視野レベルの評価又は患者レベルの評価を含むメタ情報の少なくとも一部分との関連について検証し、
    複数のクラスターセットについての少なくとも1つのモデルの性能の比較に基づき、予測的なクラスターセットを含む複数のクラスターセットの1つを選択する
    ことを含んでなる方法。
  2. データセットが複数のバッチと関連し、
    複数のバッチの1つの中の全ての細胞についての細胞全体の中央値強度を、そのバッチの中の各細胞についての細胞全体の中央値強度、核の中央値強度、膜の中央値強度及び細胞質の中央値強度の各々から減じることにより、複数のバッチに関して細胞プロファイルデータを正規化することをさらに含み、
    複数のクラスターセットを作成することが、正規化されたデータセットから、類似する細胞の複数のクラスターセットを作成することを含む、請求項1記載の方法。
  3. 細胞の類似性が、複数のバイオマーカーの少なくとも1つの発現に基づく、細胞の少なくとも1つの属性の比較に基づく、請求項1記載の方法。
  4. 細胞の少なくとも1つの属性が、細胞全体の中央値強度、核の強度比、膜の強度比及び細胞質の強度比からなる細胞の4つの特徴から選択され、
    核の強度比が、膜の中央値強度と細胞質の中央値強度との合計の半分を、核の中央値強度から減じることにより計算され、
    膜の強度比が、核の中央値強度と細胞質の中央値強度との合計の半分を、膜の中央値強度から減じることにより計算され、
    細胞質の強度比が、膜の中央値強度と核の中央値強度との合計の半分を、細胞質の中央値強度から減じることにより計算される、請求項1記載の方法。
  5. 細胞の類似性が、細胞の少なくとも2つの属性の比較に基づき、少なくとも2つの属性の各々が、複数のバイオマーカーの少なくとも1つの発現に基づく、請求項1記載の方法。
  6. 細胞の類似性が、細胞の少なくとも3つの属性の比較に基づき、少なくとも3つの属性の各々が、複数のバイオマーカーの少なくとも1つの発現に基づく、請求項1記載の方法。
  7. 細胞の類似性が、細胞の少なくとも4つの属性の比較に基づき、少なくとも4つの属性の各々が、複数のバイオマーカーの少なくとも1つの発現に基づく、請求項1記載の方法。
  8. 正常細胞の細胞プロファイルが、類似する細胞の複数のクラスターセットを作成するのに用いられるデータセットから除外される、請求項1記載の方法。
  9. 複数のバイオマーカーの少なくとも1つの発現に基づき、Κ中央値によるクラスター化アルゴリズムを細胞の少なくとも1つの属性に適用することにより細胞の類似性を決定することをさらに含む、請求項1記載の方法。
  10. 複数のバイオマーカーの少なくとも1つの発現に基づき、Κ平均によるクラスター化アルゴリズムを細胞の少なくとも1つの属性に適用することにより細胞の類似性を決定することをさらに含む、請求項1記載の方法。
  11. 観察された細胞の比率が、各クラスターに割り当てられた各視野の細胞の観察された比率である、請求項1記載の方法。
  12. 観察された比率を検証することが、観察された比率を、共通性と関連する視野レベルの評価を含むメタ情報の少なくとも一部分との関連について検証することを含み、
    予測的なクラスターセット選択することが、複数のクラスターセットに基づく視野レベルの評価モデルの性能の比較に基づき、予測的なクラスターセットを選択することを含む、請求項1記載の方法。
  13. 観察された細胞の比率が、各クラスターに割り当てられた各患者の細胞の観察された比率である、請求項1記載の方法。
  14. 観察された比率を検証することが、観察された比率を、状態又は疾患についての予後診断[生存期間]との関連について検証することを含み、
    複数のクラスターセットの1つを選択することが、複数のクラスターセットに基づく患者レベルの評価モデルの性能の比較に基づき、複数のクラスターセットの1つを選択することを含む、請求項1記載の方法。
  15. 細胞データがトレーニングデータ及びテストデータを含み、類似する細胞の複数のクラスターセットがトレーニングデータから作成され、比較のための少なくとも1つのモデルの性能がテストデータから決定される、請求項1記載の方法。
  16. 複数のクラスターセットの各々の中のクラスターの数に関して少なくとも1つのモデルの性能を比較することをさらに含む、請求項1記載の方法。
  17. 予測的なクラスターセット選択することが、それを上回ってクラスターセットの中のクラスターの数が大きくなると、統計学的に有意な性能の増大がもたらされない、ある数のクラスターを有する複数のクラスターセットの1つを選択することをさらに含む、請求項1記載の方法。
  18. 予測的なクラスターセット選択することが、それを下回ってクラスターセットの中のクラスターの数が小さくなると、性能の減少がもたらされる、ある数のクラスターを有する複数のクラスターセットの1つを選択することをさらに含む、請求項1記載の方法。
  19. 選択されたクラスターセットにおいて観察された比率を、メタ情報の少なくとも一部分との一変量の関連について検証することをさらに含む、請求項1記載の方法。
  20. 選択されたクラスターセットにおいて観察された比率を、メタ情報の少なくとも一部分との多変量の関連について検証することをさらに含む、請求項1記載の方法。
  21. 閾値を超える一致率に対応するクラスターセットについての少なくとも1つのモデルの性能に基づき、予測的なクラスターセット選択することをさらに含む、請求項1記載の方法。
  22. 少なくとも1つの予測的なクラスターを、予測的なクラスターセットから同定することをさらに含む、請求項1記載の方法。
  23. マルチプレックス化バイオメトリック画像に基づき、細胞クラスターの特徴を解析する方法であって、
    個別の細胞が描出され、区画へと分割される複数の視野に関して、複数のバイオマーカーの発現を捕捉するマルチプレックス化バイオメトリック画像を含む細胞プロファイルデータを含むデータセットを保存し、
    類似する細胞の複数のクラスターの中の第1のクラスターをデータセットから同定し、各細胞を複数のクラスターの1つに割り当て、複数のクラスターの中の各クラスターが、複数の選択された属性であって、そのセットの中の他のクラスターの中の細胞の複数の選択された属性より、そのクラスターの中の他の細胞の複数の選択された属性への類似性が大きい属性を有する細胞を包含し、
    第1のクラスターの中の第1の細胞のモンタージュを創出し、モンタージュが、第1の細胞による複数のバイオマーカーの各々の発現について描述する、少なくともいくつかのマルチプレックス化画像の部分を含み、少なくともいくつかの画像の各部分が、第1の細胞及び第1の細胞周囲の対象の小領域を包含し、
    使用者が第1のクラスターの特徴を理解することを可能とするために、第1のクラスターの中の第1の細胞のモンタージュを表示する
    ことを含んでなる方法。
  24. 第1の細胞のモンタージュが、第1の細胞による複数のバイオマーカーの各々の発現について描述する視野についての、少なくともいくつかの画像の一連の並置部分を含む、請求項23記載の方法。
  25. 第1の細胞のモンタージュが、第1の細胞による複数のバイオマーカーの各々の発現について描述する視野についての、少なくともいくつかの画像の一連のスーパーインポーズ部分を含む、請求項23記載の方法。
  26. 第1のクラスターの中の第2の細胞のモンタージュを創出し、モンタージュが、第2の細胞による複数のバイオマーカーの各々の発現について描述する視野についての、少なくともいくつかの画像の部分を含み、少なくともいくつかの画像の各部分が第2の細胞及び第2の細胞周囲の対象の小領域を包含し、
    使用者が第1のクラスターの特徴を理解することを可能とするために、第1のクラスターの中の第2の細胞のモンタージュを表示すること
    をさらに含む、請求項23記載の方法。
  27. 使用者が第1のクラスターの特徴を理解することを可能とするために、第1のクラスターの中の第1の細胞のモンタージュと、第1のクラスターの中の第2の細胞のモンタージュとを同時に表示することをさらに含む、請求項23記載の方法。
  28. マルチプレックス化バイオメトリック画像データに基づき、組織特徴を解析するシステムであって、
    個別の細胞が描出され、区画へと分割される複数の視野に関して、複数のバイオマーカーの発現を捕捉するマルチプレックス化バイオメトリック画像を含む細胞プロファイルデータを含むデータセットを保存するための保存デバイスであって、細胞プロファイルデータを、共通性を有する患者コホートから得られた複数の組織試料から作成し、データセットが、細胞プロファイルデータの、共通性と関連する視野レベルの評価又は患者レベルの評価を含むメタ情報の少なくとも一部分との関連をさらに含む保存デバイス、
    少なくとも1つのプロセッサーに
    類似する細胞の複数のクラスターセットをデータセットから作成する段階であって、複数のクラスターセットの各々がユニークな数のクラスターを含み、各細胞を複数のクラスターセットの各々の中の単一のクラスターに割り当て、複数のクラスターセットの各々の中の複数のクラスターの各々が、複数の選択された属性であり、そのセットの中の他のクラスターの中の細胞の複数の選択された属性より、そのクラスターの中の他の細胞の複数の選択された属性への類似性が大きい属性を有する細胞を含む段階、
    複数のクラスターセットの各々の中で、各クラスターに割り当てられた細胞の比率を観察する段階及び
    観察された比率を、共通性と関連する視野レベルの評価又は患者レベルの評価を含むメタ情報の少なくとも一部分との関連について検証する段階
    を実行させるコードを実行するための少なくとも1つのプロセッサー、並びに
    予測的なクラスターセットを含む複数のクラスターセットの1つが、複数のクラスターセットについての少なくとも1つのモデルの性能の比較に基づき選択されることを可能とする視覚表示デバイス
    を含んでなるシステム。
  29. データセットが複数のバッチと関連し、少なくとも1つのプロセッサーが、
    複数のバッチの1つの中の全ての細胞についての細胞全体の中央値強度を、そのバッチの中の各細胞についての細胞全体の中央値強度、核の中央値強度、膜の中央値強度及び細胞質の中央値強度の各々から減じることにより、複数のバッチに関して細胞プロファイルデータを正規化する段階
    を少なくとも1つのプロセッサーに実行させるコードをさらに実行し、
    複数のクラスターセットを作成することが、正規化されたデータセットから、類似する細胞の複数のクラスターセットを作成することを含む、請求項28記載のシステム。
  30. 細胞の類似性が、複数のバイオマーカーの少なくとも1つの発現に基づく、細胞の少なくとも1つの属性の比較に基づく、請求項28記載のシステム。
  31. 細胞の少なくとも1つの属性が、細胞全体の中央値強度、核の強度比、膜の強度比及び細胞質の強度比からなる細胞の4つの特徴から選択され、
    核の強度比が、膜の中央値強度と細胞質の中央値強度との合計の半分を、核の中央値強度から減じることにより計算され、
    膜の強度比が、核の中央値強度と細胞質の中央値強度との合計の半分を、膜の中央値強度から減じることにより計算され、
    細胞質の強度比が、膜の中央値強度と核の中央値強度との合計の半分を、細胞質の中央値強度から減じることにより計算される、請求項28記載のシステム。
  32. 少なくとも1つのプロセッサーが、細胞の少なくとも2つの属性の比較に基づき、細胞の類似性を決定し、少なくとも2つの属性の各々が、複数のバイオマーカーの少なくとも1つの発現に基づく、請求項28記載のシステム。
  33. 少なくとも1つのプロセッサーが、細胞の少なくとも3つの属性の比較に基づき、細胞の類似性を決定し、少なくとも3つの属性の各々が、複数のバイオマーカーの少なくとも1つの発現に基づく、請求項28記載のシステム。
  34. 少なくとも1つのプロセッサーが、細胞の少なくとも4つの属性の比較に基づき、細胞の類似性を決定し、少なくとも4つの属性の各々が、複数のバイオマーカーの少なくとも1つの発現に基づく、請求項28記載のシステム。
  35. 少なくとも1つのプロセッサーが、正常細胞の細胞プロファイルを、類似する細胞の複数のクラスターセットを作成するのに用いられるデータセットから除外する段階を、少なくとも1つのプロセッサーに実行させるコードをさらに実行する、請求項28記載のシステム。
  36. 少なくとも1つのプロセッサーが、複数のバイオマーカーの少なくとも1つの発現に基づき、Κ中央値によるクラスター化アルゴリズムを細胞の少なくとも1つの属性に適用することにより細胞の類似性を決定する、請求項28記載のシステム。
  37. 少なくとも1つのプロセッサーが、複数のバイオマーカーの少なくとも1つの発現に基づき、Κ平均によるクラスター化アルゴリズムを細胞の少なくとも1つの属性に適用することにより細胞の類似性を決定する、請求項28記載のシステム。
  38. 観察された細胞の比率が、各クラスターに割り当てられた各視野の細胞の観察された比率を含む、請求項28記載のシステム。
  39. 観察された比率を検証することが、観察された比率を、共通性と関連する視野レベルの評価を含むメタ情報の少なくとも一部分との関連について検証することを含み、
    予測的なクラスターセット選択することが、複数のクラスターセットに基づく視野レベルの評価モデルの性能の比較に基づき、予測的なクラスターセット選択することを含む、請求項28記載のシステム。
  40. 観察された細胞の比率が、各クラスターに割り当てられた各患者の細胞の観察された比率である、請求項28記載のシステム。
  41. 観察された比率を検証することが、観察された比率を、状態又は疾患についての予後診断[生存期間]との関連について検証することを含み、
    複数のクラスターセットの1つを選択することが、複数のクラスターセットに基づく患者レベルの評価モデルの性能の比較に基づき、複数のクラスターセットの1つを選択することを含む、請求項28記載のシステム。
  42. 少なくとも1つのプロセッサーが、細胞データをトレーニングデータ及びテストデータへとさらに分割し、類似する細胞の複数のクラスターセットをトレーニングデータから作成し、比較のための少なくとも1つのモデルの性能をテストデータから決定する、請求項28記載のシステム。
  43. 少なくとも1つのプロセッサーが、
    複数のクラスターセットの各々の中のクラスターの数に関して少なくとも1つのモデルの性能を比較する段階
    を少なくとも1つのプロセッサーに実行させるコードをさらに実行する、請求項28記載のシステム。
  44. 視覚表示デバイスが、それを上回ってクラスターセットの中のクラスターの数が大きくなると、統計学的に有意な性能の増大がもたらされない、ある数のクラスターを有する複数のクラスターセットの1つを選択することをさらに可能とする、請求項28記載のシステム。
  45. 視覚表示デバイスが、それを下回ってクラスターセットの中のクラスターの数が小さくなると、性能の減少がもたらされる、ある数のクラスターを有する複数のクラスターセットの1つを選択することをさらに可能とする、請求項28記載のシステム。
  46. 選択されたクラスターセットにおいて観察された比率を、メタ情報の少なくとも一部分との一変量の関連について検証することをさらに含む、請求項28記載のシステム。
  47. 選択されたクラスターセットにおいて観察された比率を、メタ情報の少なくとも一部分との多変量の関連について検証することをさらに含む、請求項28記載のシステム。
  48. 視覚表示デバイスが、閾値を超える一致率に対応するクラスターセットについての少なくとも1つのモデルの性能に基づき、複数のクラスターセットの1つを選択することをさらに可能とする、請求項28記載のシステム。
  49. 少なくとも1つのプロセッサーが、少なくとも1つの予測的なクラスターを、予測的なクラスターセットから同定する段階を、少なくとも1つのプロセッサーに実行させるコードをさらに実行する、請求項28記載のシステム。
  50. マルチプレックス化バイオメトリック画像データに基づき、組織特徴を解析するシステムであって、
    個別の細胞が描出され、区画へと分割される複数の視野に関して、複数のバイオマーカーの発現を捕捉するマルチプレックス化バイオメトリック画像を含む細胞プロファイルデータを含むデータセットを保存するための保存デバイス、
    類似する細胞の複数のクラスターの中の第1のクラスターをデータセットから同定することを可能とする視覚表示デバイスであって、各細胞を複数のクラスターの1つに割り当て、複数のクラスターの中の各クラスターが、複数の選択された属性であり、そのセットの中の他のクラスターの中の細胞の複数の選択された属性より、そのクラスターの中の他の細胞の複数の選択された属性への類似性が大きい属性を有する細胞を含む視覚表示デバイス及び
    第1のクラスターの中の第1の細胞のモンタージュを、少なくとも1つのプロセッサーに創出させるコードを実行するための少なくとも1つのプロセッサーであって、モンタージュが、第1の細胞による複数のバイオマーカーの各々の発現について描述する、少なくともいくつかのマルチプレックス化画像の部分を含み、少なくともいくつかの画像の各部分が、第1の細胞及び第1の細胞周囲の対象の小領域を含む少なくとも1つのプロセッサー
    を含んでなり、
    視覚表示デバイスが、使用者が第1のクラスターの特徴を理解することを可能とするために、第1のクラスターの中の第1の細胞のモンタージュをさらに表示する
    システム。
  51. 第1の細胞のモンタージュが、第1の細胞による複数のバイオマーカーの各々の発現について描述する視野についての、少なくともいくつかの画像の一連の並置部分を含む、請求項50記載のシステム。
  52. 第1の細胞のモンタージュが、第1の細胞による複数のバイオマーカーの各々の発現について描述する視野についての、少なくともいくつかの画像の一連のスーパーインポーズ部分を含む、請求項50記載のシステム。
  53. 少なくとも1つのプロセッサーが、第1のクラスターの中の第2の細胞のモンタージュをさらに創出し、モンタージュが、第2の細胞による複数のバイオマーカーの各々の発現について描述する視野についての、少なくともいくつかの画像の部分を含み、少なくともいくつかの画像の各部分が第2の細胞及び第2の細胞周囲の対象の小領域を包含し、
    視覚表示デバイスが、使用者が第1のクラスターの特徴を理解することを可能とするために、第1のクラスターの中の第2の細胞のモンタージュをさらに表示する、請求項50記載のシステム。
  54. 視覚表示デバイスが、使用者が第1のクラスターの特徴を理解することを可能とするために、第1のクラスターの中の第1の細胞のモンタージュと、第1のクラスターの中の第2の細胞のモンタージュとをさらに同時に表示する、請求項23記載の方法。
JP2014505671A 2011-04-22 2012-04-23 細胞におけるバイオマーカーの発現のクラスターによる解析 Active JP6063447B2 (ja)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US201161478224P 2011-04-22 2011-04-22
US61/478,224 2011-04-22
US13/252,069 US20120270752A1 (en) 2011-04-22 2011-10-03 Analyzing the expression of biomarkers in cells with moments
US13/252,072 2011-10-03
US13/252,078 US20120269419A1 (en) 2011-04-22 2011-10-03 Analyzing the expression of biomarkers in cells with moments
US13/252,069 2011-10-03
US13/252,080 US20120271553A1 (en) 2011-04-22 2011-10-03 Analyzing the expression of biomarkers in cells with clusters
US13/252,072 US20120269418A1 (en) 2011-04-22 2011-10-03 Analyzing the expression of biomarkers in cells with clusters
US13/252,080 2011-10-03
US13/252,078 2011-10-03
PCT/EP2012/057395 WO2012143562A2 (en) 2011-04-22 2012-04-23 Analyzing the expression of biomarkers in cells with clusters

Publications (3)

Publication Number Publication Date
JP2014516413A true JP2014516413A (ja) 2014-07-10
JP2014516413A5 JP2014516413A5 (ja) 2015-06-18
JP6063447B2 JP6063447B2 (ja) 2017-01-18

Family

ID=47021377

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2014505670A Active JP6143743B2 (ja) 2011-04-22 2012-04-23 細胞におけるバイオマーカーの発現のクラスターによる解析
JP2014505671A Active JP6063447B2 (ja) 2011-04-22 2012-04-23 細胞におけるバイオマーカーの発現のクラスターによる解析
JP2014505668A Active JP6163152B2 (ja) 2011-04-22 2012-04-23 細胞におけるバイオマーカーの発現の積率による解析
JP2014505669A Active JP6063446B2 (ja) 2011-04-22 2012-04-23 細胞におけるバイオマーカーの発現の積率による解析

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2014505670A Active JP6143743B2 (ja) 2011-04-22 2012-04-23 細胞におけるバイオマーカーの発現のクラスターによる解析

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2014505668A Active JP6163152B2 (ja) 2011-04-22 2012-04-23 細胞におけるバイオマーカーの発現の積率による解析
JP2014505669A Active JP6063446B2 (ja) 2011-04-22 2012-04-23 細胞におけるバイオマーカーの発現の積率による解析

Country Status (8)

Country Link
US (5) US20120269419A1 (ja)
EP (4) EP2700038B1 (ja)
JP (4) JP6143743B2 (ja)
BR (4) BR112013027123A2 (ja)
CA (4) CA2833804A1 (ja)
RU (3) RU2013145162A (ja)
SG (4) SG194588A1 (ja)
WO (4) WO2012143562A2 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201111594D0 (en) * 2011-07-06 2011-08-24 Equateq Ltd New improved process
CN105122114B (zh) * 2012-12-06 2018-07-27 通用电气医疗集团生物科学公司 用于生物样本的分屏显示和用于捕捉其记录的系统和方法
US9488639B2 (en) * 2013-02-25 2016-11-08 Flagship Biosciences, Inc. Cell-based tissue analysis
US8995740B2 (en) * 2013-04-17 2015-03-31 General Electric Company System and method for multiplexed biomarker quantitation using single cell segmentation on sequentially stained tissue
WO2015003178A1 (en) * 2013-07-03 2015-01-08 Coyne Scientific, Llc Methods for predicting responses to chemical or biologic substances
US9322051B2 (en) 2013-10-07 2016-04-26 General Electric Company Probing of biological samples
US9298968B1 (en) * 2014-09-12 2016-03-29 Flagship Biosciences, Inc. Digital image analysis of inflammatory cells and mediators of inflammation
WO2016118860A1 (en) 2015-01-22 2016-07-28 The Board Of Trustees Of The Leland Stanford Junior University Methods and systems for determining proportions of distinct cell subsets
US10672505B2 (en) 2015-06-03 2020-06-02 General Electric Company Biological data annotation and visualization
US9953133B2 (en) 2015-06-03 2018-04-24 General Electric Company Biological data annotation and visualization
WO2017109860A1 (ja) * 2015-12-22 2017-06-29 株式会社ニコン 画像処理装置
US20180032681A1 (en) * 2016-07-29 2018-02-01 General Electric Company Biological feature analysis technique
JP6985684B2 (ja) * 2017-02-16 2021-12-22 国立大学法人京都大学 細胞評価方法、細胞評価装置、及び細胞評価プログラム
US10127696B2 (en) * 2017-03-22 2018-11-13 Sas Institute Inc. Computer system to generate scalable plots using clustering
EP3616213A2 (en) 2017-04-28 2020-03-04 4D Path Inc. Apparatus, systems, and methods for rapid cancer detection
KR101990430B1 (ko) * 2017-06-22 2019-06-18 한국과학기술원 암의 재발 예후 예측을 위한 바이오마커 발굴 시스템 및 방법
US10706328B2 (en) * 2018-05-07 2020-07-07 Google Llc Focus-weighted, machine learning disease classifier error prediction for microscope slide images
WO2020056372A1 (en) * 2018-09-14 2020-03-19 Krishnan Ramanathan Multimodal learning framework for analysis of clinical trials
WO2020068684A2 (en) 2018-09-24 2020-04-02 Krishnan Ramanathan Hybrid analysis framework for prediction of outcomes in clinical trials
US11128667B2 (en) * 2018-11-29 2021-09-21 Rapid7, Inc. Cluster detection and elimination in security environments
CA3120716A1 (en) * 2018-11-29 2020-06-04 Somalogic, Inc. Methods for determining disease risk combining downsampling of class-imbalanced sets with survival analysis
CN113158982A (zh) * 2021-05-17 2021-07-23 广东中卡云计算有限公司 一种半介入式的目标关键点标注方法
JP7368679B2 (ja) 2021-09-01 2023-10-25 イミュニティリサーチ株式会社 細胞集団同定システム、方法、およびプログラム
IT202200001817A1 (it) 2022-02-02 2023-08-02 Aizoon S R L Procedimento per la prognosi di una malattia in seguito ad un trattamento terapeutico, relativo sistema e prodotto informatico
IT202200005861A1 (it) 2022-03-24 2023-09-24 Aizoon S R L Procedimento per stimare una variabile di interesse associata ad una data malattia in funzione di una pluralità di diversi dati omici, relativo dispositivo e prodotto informatico
CA3207405A1 (en) 2022-07-25 2024-01-25 Aizoon S.r.l. Method for providing a clinical decision support, corresponding system for providing a clinical decision support, and computer program product

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007028944A1 (en) * 2005-09-10 2007-03-15 Ge Healthcare Uk Limited Method of, and apparatus and computer software for, performing image processing
WO2008143849A2 (en) * 2007-05-14 2008-11-27 Historx, Inc. Compartment segregation by pixel characterization using image data clustering
US20110091081A1 (en) * 2009-10-16 2011-04-21 General Electric Company Method and system for analyzing the expression of biomarkers in cells in situ in their tissue of origin

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6463438B1 (en) * 1994-06-03 2002-10-08 Urocor, Inc. Neural network for cell image analysis for identification of abnormal cells
US5740269A (en) * 1994-09-20 1998-04-14 Neopath, Inc. Method and apparatus for robust biological specimen classification
US6996549B2 (en) * 1998-05-01 2006-02-07 Health Discovery Corporation Computer-aided image analysis
US6282305B1 (en) * 1998-06-05 2001-08-28 Arch Development Corporation Method and system for the computerized assessment of breast cancer risk
US6337472B1 (en) * 1998-10-19 2002-01-08 The University Of Texas System Board Of Regents Light imaging microscope having spatially resolved images
JP2005503760A (ja) * 2001-01-24 2005-02-10 プロテイン デザイン ラブス, インコーポレイテッド 乳癌の診断方法、組成物および乳癌のモジュレーターのスクリーニング方法
WO2004013658A2 (en) * 2002-07-30 2004-02-12 Deutsches Krebsforschungszentrum Method and apparatus for multiple labeling detection and evaluation of a plurality of particles
US20040121413A1 (en) * 2002-12-20 2004-06-24 Aebersold Rudolf H. Androgen-regulated genes and uses for diagnosis, prognosis and treatment of prostate neoplastic conditions
US20050265588A1 (en) * 2004-02-03 2005-12-01 Bioimagene, Inc. Method and system for digital image based flourescent in situ hybridization (FISH) analysis
WO2006113747A2 (en) * 2005-04-19 2006-10-26 Prediction Sciences Llc Diagnostic markers of breast cancer treatment and progression and methods of use thereof
US7933435B2 (en) * 2005-11-21 2011-04-26 Vala Sciences, Inc. System, method, and kit for processing a magnified image of biological material to identify components of a biological object
CA2652562C (en) * 2006-05-17 2015-05-12 Cellumen, Inc. Method for automated tissue analysis
US7741045B2 (en) * 2006-11-16 2010-06-22 General Electric Company Sequential analysis of biological samples
US8019134B2 (en) * 2006-11-16 2011-09-13 Definiens Ag Automatic image analysis and quantification for fluorescence in situ hybridization
JP2010522554A (ja) * 2007-03-27 2010-07-08 ロゼッタ ゲノミックス エルティーディー. 癌の分類のための遺伝子発現サイン
WO2008137912A1 (en) * 2007-05-07 2008-11-13 Ge Healthcare Bio-Sciences Corp. System and method for the automated analysis of cellular assays and tissues
JP2010538609A (ja) * 2007-09-06 2010-12-16 バイオセラノスティクス,インコーポレイティド 腫瘍グレード分類と癌の予後診断
PT2332087T (pt) * 2008-07-25 2020-06-05 Fund D Anna Sommer Champalimaud E Dr Carlos Montez Champalimaud Sistemas e métodos de tratamento, diagnóstico e previsão da ocorrência de uma condição médica
US9779213B2 (en) * 2008-07-25 2017-10-03 Fundacao D. Anna Sommer Champalimaud E Dr. Carlos Montez Champalimaud System for evaluating a pathological stage of prostate cancer
US8320655B2 (en) * 2009-10-16 2012-11-27 General Electric Company Process and system for analyzing the expression of biomarkers in cells
WO2011087778A1 (en) * 2009-12-22 2011-07-21 The Children's Hospital Of Philadelphia Automated quantitative multidimensional volumetric analysis and visualization

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007028944A1 (en) * 2005-09-10 2007-03-15 Ge Healthcare Uk Limited Method of, and apparatus and computer software for, performing image processing
WO2008143849A2 (en) * 2007-05-14 2008-11-27 Historx, Inc. Compartment segregation by pixel characterization using image data clustering
JP2010527448A (ja) * 2007-05-14 2010-08-12 ヒストロックス,インコーポレイテッド. イメージデータクラスタリングを使用した画素評価によるコンパートメント分離
US20110091081A1 (en) * 2009-10-16 2011-04-21 General Electric Company Method and system for analyzing the expression of biomarkers in cells in situ in their tissue of origin

Also Published As

Publication number Publication date
BR112013027122A2 (pt) 2017-01-10
RU2013145154A (ru) 2015-05-27
SG194592A1 (en) 2013-12-30
SG194590A1 (en) 2013-12-30
WO2012143562A2 (en) 2012-10-26
BR112013027124A2 (pt) 2017-01-10
WO2012143558A2 (en) 2012-10-26
CA2833295A1 (en) 2012-10-26
EP2700038B1 (en) 2021-04-21
CA2833497A1 (en) 2012-10-26
JP2014517954A (ja) 2014-07-24
CA2833428A1 (en) 2012-10-26
SG194594A1 (en) 2013-12-30
US20120271553A1 (en) 2012-10-25
JP6063447B2 (ja) 2017-01-18
JP6163152B2 (ja) 2017-07-12
BR112013027125A2 (pt) 2017-01-10
WO2012143562A3 (en) 2013-02-28
RU2013145162A (ru) 2015-05-27
RU2013145151A (ru) 2015-05-27
US20120269418A1 (en) 2012-10-25
BR112013027123A2 (pt) 2017-01-10
US20120269419A1 (en) 2012-10-25
WO2012143561A2 (en) 2012-10-26
US20120270752A1 (en) 2012-10-25
WO2012143558A3 (en) 2012-12-20
EP2700042A2 (en) 2014-02-26
WO2012143556A3 (en) 2013-05-30
EP2700038A2 (en) 2014-02-26
WO2012143561A3 (en) 2013-05-23
CA2833804A1 (en) 2012-10-26
JP6143743B2 (ja) 2017-06-07
WO2012143556A2 (en) 2012-10-26
SG194588A1 (en) 2013-12-30
JP6063446B2 (ja) 2017-01-18
EP2700042B1 (en) 2021-03-17
JP2014521925A (ja) 2014-08-28
EP2700037A2 (en) 2014-02-26
EP2700036A2 (en) 2014-02-26
US20140185905A1 (en) 2014-07-03
JP2014521926A (ja) 2014-08-28

Similar Documents

Publication Publication Date Title
JP6063447B2 (ja) 細胞におけるバイオマーカーの発現のクラスターによる解析
US8885912B2 (en) Generate percentage of positive cells for biomarkers by normalizing and autothresholding the image intensity produced by immunohistochemistry technique
US11636288B2 (en) Platform, device and process for annotation and classification of tissue specimens using convolutional neural network
US11257209B2 (en) Cancer risk stratification based on histopathological tissue slide analysis
US11315774B2 (en) Big-data analyzing Method and mass spectrometric system using the same method
EP2751730A2 (en) Systems and methods for tissue classification
JP7197795B2 (ja) 機械学習プログラム、機械学習方法および機械学習装置
US20140372450A1 (en) Methods of viewing and analyzing high content biological data
WO2011119967A2 (en) System,method and computer-accessible medium for evaluating a maliganacy status in at-risk populations and during patient treatment management
Ramkumar et al. Experimental Analysis on Breast Cancer Using Random Forest Classifier on Histopathological Images
Li Novel Population Specific Computational Pathology-based Prognostic and Predictive Biomarkers for Breast Cancer

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150421

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150421

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160606

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161216

R150 Certificate of patent or registration of utility model

Ref document number: 6063447

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250