JP7336806B2 - 3D image analysis of cells and tissues for cellular and intracellular morphological modeling and classification - Google Patents

3D image analysis of cells and tissues for cellular and intracellular morphological modeling and classification Download PDF

Info

Publication number
JP7336806B2
JP7336806B2 JP2020544195A JP2020544195A JP7336806B2 JP 7336806 B2 JP7336806 B2 JP 7336806B2 JP 2020544195 A JP2020544195 A JP 2020544195A JP 2020544195 A JP2020544195 A JP 2020544195A JP 7336806 B2 JP7336806 B2 JP 7336806B2
Authority
JP
Japan
Prior art keywords
cell
labeled
biological sample
cells
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020544195A
Other languages
Japanese (ja)
Other versions
JP2021514468A (en
Inventor
ディノブ、イバイロ
ディー. アセイ、ブライアン
エス. ディルワース、デイビッド
- フューアー、アリ アリン
カリニン、アレクサンドル
エス. エイド、アレックス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Michigan
Original Assignee
University of Michigan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Michigan filed Critical University of Michigan
Publication of JP2021514468A publication Critical patent/JP2021514468A/en
Application granted granted Critical
Publication of JP7336806B2 publication Critical patent/JP7336806B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/24765Rule-based classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/143Segmentation; Edge detection involving probabilistic approaches, e.g. Markov random field [MRF] modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/695Preprocessing, e.g. image segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/28Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
    • G01N1/30Staining; Impregnating ; Fixation; Dehydration; Multistep processes for preparing samples of tissue, cell or nucleic acid material and the like for analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/245Classification techniques relating to the decision surface
    • G06F18/2451Classification techniques relating to the decision surface linear, e.g. hyperplane
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10056Microscopic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10064Fluorescence image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10101Optical tomography; Optical coherence tomography [OCT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20036Morphological image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20072Graph-based image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30024Cell structures in vitro; Tissue sections in vitro
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30242Counting objects in image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/62Analysis of geometric attributes of area, perimeter, diameter or volume

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Image Processing (AREA)
  • Image Generation (AREA)
  • Image Analysis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Description

本開示は、細胞および細胞内の形態モデリングと分類のための、細胞および組織の3次元画像解析に関する。 The present disclosure relates to three-dimensional image analysis of cells and tissues for morphological modeling and classification within cells and cells.

組織および細胞内の変形は、空間的および時間的な形態変化に影響する複雑な根本的生体機構によって統制されている。これらの過程を、細胞および細胞内構造体のサイズおよび形状の3次元的な変化の定量解析を通して理解することは、細胞組織の研究のみならず、癌などの病的状態の検出および治療にとって重要である。しかしながら、正確な形態解析が可能で、拡張可能で、雑音に強く、複数の母集団にわたって同時に十分に特異的であるべき3次元形状方法に対して、画像化データの次元数および品質、ならびに母集団内の細胞形状および細胞内形状の多様性の高さは、いくつかの課題を呈する。 Deformation within tissues and cells is governed by complex underlying biomechanisms that influence spatial and temporal morphological changes. Understanding these processes through quantitative analysis of three-dimensional changes in the size and shape of cells and subcellular structures is important not only for the study of cell tissues, but also for the detection and treatment of pathological conditions such as cancer. is. However, for a three-dimensional shape method that should be capable of accurate morphological analysis, scalable, noise tolerant, and sufficiently specific across multiple populations simultaneously, the dimensionality and quality of the imaging data, as well as the population The high diversity of cellular and subcellular shapes within populations presents several challenges.

『Robust Surface Reconstruction via Laplace-Beltrami Eigen-Projection and Boundary Deformation』(Yonggang Shiら)、IEEE Transactions on Medical Imaging、Vol.29、No.12"Robust Surface ReconStructure VIA LaPlace -Beltrami Egen -Projection And Boundary Deformation" (YONGGANG SHI et al.) ACTIONS ON MEDICAL IMaging, Vol. 29, No. 12 『Discrete Differential-Geometry Operators for Triangulated 2-Manifolds』(M. Meyerら)、Visualization and Mathematics III、Berlin、Heidelberg Springer Berlin Heidelberg、2003年、35~57頁"Discrete Differential-Geometry Operators for Triangulated 2-Manifolds" (M. Meyer et al.), Visualization and Mathematics III, Berlin, Heidelberg Springer Berlin Heidelberg, 2003, pp. 35-57 『Segmentation and Recognition of 3D Point Clouds within Graph-theoretic and thermodynamic frameworks』(A.Jagannathan)(博士論文、Northeastern University,2005)"Segmentation and Recognition of 3D Point Clouds within Graph-theoretic and thermodynamic frameworks" (A. Jagannathan) (Doctoral dissertation, Northeastern University, 2005)

よって、母集団について解析を行うための、高スループット能力をもち、ロバストな、細胞および細胞内の3次元形態計測技法に対する強い需要が存在する。 Thus, there is a strong need for robust, cellular and subcellular 3D morphometric techniques with high throughput capabilities for performing analyzes on populations.

この節では、本開示に関する背景情報を提供するが、この情報は必ずしも従来技術ではない。 This section provides background information regarding the present disclosure, which information is not necessarily prior art.

ここで提供するのは本開示の全体的な概要であって、この概要は全範囲の包括的な開示ではなく、全ての特徴でもない。 What is provided here is a general summary of the disclosure, and this summary is neither a comprehensive disclosure of its full scope nor all its features.

生体細胞を解析するための自動化手法を提示する。この方法は、少なくとも1個の細胞を含む生体試料の成分を染色することと、生体試料の3次元表現を提供する、生体試料の画像データを受け取ることと、画像データ内の少なくとも1個の細胞の成分をラベル付けすることと、画像データ内のラベル付けされた各細胞核について、所与の細胞核を画定する境界の数学的表現を構築することと、ラベル付けされた各細胞核について、その細胞核の数学的表現を使用して、そのラベル付けされた細胞核の形状およびサイズの測度である特徴を抽出することと、ラベル付けされた各細胞核小体について、所与の細胞核小体を画定する境界の数学的表現を構築することと、その細胞核小体の数学的表現を使用して、そのラベル付けされた各細胞核小体から、そのラベル付けされた細胞核小体の形状およびサイズの測度である特徴を抽出することと、細胞分類のモデルを2つ以上記憶することと、ラベル付けされた細胞核およびラベル付けされた細胞核小体の抽出された特徴を、記憶されているモデルと比較することによって、生体試料を分類することとを含む。 We present an automated method for analyzing living cells. The method includes staining a component of a biological sample including at least one cell; receiving image data of the biological sample that provides a three-dimensional representation of the biological sample; for each labeled nucleus in the image data, constructing a mathematical representation of the boundaries that define a given nucleus; for each labeled nucleus, for that nucleus Using mathematical expressions to extract features that are measures of the shape and size of the labeled cell nucleus and, for each labeled cell nucleolus, the boundary that defines the given cell nucleolus. constructing a mathematical representation and using the mathematical representation of the cell nucleolus from each of the labeled cell nucleoli a feature that is a measure of the shape and size of the labeled cell nucleolus , storing two or more models of cell classification, and comparing the extracted features of the labeled nuclei and labeled nucleoli with the stored models, and classifying the biological sample.

画像データは、共焦点顕微鏡または別のタイプの画像化装置によって生成されてもよい。 Image data may be generated by a confocal microscope or another type of imaging device.

一実施形態では、反復的なラプラス・ベルトラミ固有投影および境界変形を使用して、数学的表現が構築される。 In one embodiment, the mathematical representation is constructed using iterative Laplace-Betrami eigenprojections and boundary deformations.

いくつかの実施形態では、成分をラベル付けすることは、画像データを、成分を表すボリュームに分割することを含む。 In some embodiments, labeling the components includes dividing the image data into volumes representing the components.

ラベル付けされた細胞核から抽出される特徴には、ラベル付けされた細胞核の体積、ラベル付けされた細胞核の表面積、ラベル付けされた細胞核の平均曲率、ラベル付けされた細胞核の形状指数、ラベル付けされた細胞核の湾曲指数、およびラベル付けされた細胞核のフラクタル次元のうち、決定に関わる1つまたは複数が含まれるが、それに限定されない。 Features extracted from labeled nuclei include volume of labeled nuclei, surface area of labeled nuclei, mean curvature of labeled nuclei, shape index of labeled nuclei, and The determination includes, but is not limited to, one or more of the nuclear curvature index labeled, and the labeled nuclear fractal dimension.

ラベル付けされた各細胞核小体から抽出される特徴には、対応する細胞核内の細胞核小体の数、ラベル付けされた細胞核小体の体積、ラベル付けされた細胞核小体の表面積、ラベル付けされた細胞核小体の平均曲率、ラベル付けされた細胞核小体の形状指数、ラベル付けされた細胞核小体の湾曲指数、およびラベル付けされた細胞核小体のフラクタル次元のうち決定に関わる1つまたは複数が含まれるが、それに限定されない。 Features extracted from each labeled cell nucleolus include the number of cell nucleoli within the corresponding cell nucleus, the volume of the labeled cell nucleolus, the surface area of the labeled cell nucleolus, the labeled one or more of a labeled cell nucleolus mean curvature, a labeled cell nucleolus shape index, a labeled cell nucleolus curvature index, and a labeled cell nucleolus fractal dimension involved in determining including but not limited to.

一実施形態では、生体試料はランダムフォレスト分類法を使用して分類される。 In one embodiment, the biological sample is classified using a random forest taxonomy.

他の実施形態では、生体試料は、線形分類器、k近傍法、決定木法、ニューラルネットワーク、およびサポートベクターマシンから成るグループから選択される分類方法を使用して分類される。 In other embodiments, the biological sample is classified using a classification method selected from the group consisting of linear classifiers, k-nearest neighbors, decision trees, neural networks, and support vector machines.

本明細書に記載される説明から、さらなる適用可能性の領域が明らかになるであろう。発明の概要の中の説明および特定の例は、説明のみを目的とし、本開示の範囲を限定することは意図しない。 Further areas of applicability will become apparent from the description provided herein. The descriptions and specific examples in the Summary of the Invention are for illustrative purposes only and are not intended to limit the scope of the present disclosure.

本明細書に記載の図面は、考え得る全ての実装形態ではなく選択された実施形態の説明のみを目的とし、本開示の範囲を限定することを意図しない。 The drawings described herein are for the purpose of illustrating selected embodiments only, not all possible implementations, and are not intended to limit the scope of the disclosure.

自動化された形態モデリングおよび分類の方法の概要を示す図である。FIG. 10 provides an overview of automated morphological modeling and classification methods; 1つまたは複数の細胞を含む画像データを分割する方法例を示すフローチャートである。FIG. 4 is a flowchart illustrating an example method for segmenting image data including one or more cells; FIG. 細胞または、細胞内の細胞器官もしくは要素(例えば、細胞核、細胞核小体)の表面再構築を行うための方法例を示すフローチャートである。1 is a flowchart illustrating an example method for resurfacing a cell or organelles or elements within a cell (eg, cell nucleus, cell nucleolus). 線維芽細胞の細胞画像から分割された細胞核のバイナリマスク表現の3次元視覚化を示す、ロバストな平滑面再構築の画像である。Robust smooth surface reconstruction image showing 3D visualization of binary mask representation of cell nuclei segmented from fibroblast cell images. 細胞の再構築された平滑面のメッシュ表現の3次元視覚化を示す、ロバストな平滑面再構築の画像である。Robust smooth surface reconstruction images showing a three-dimensional visualization of a mesh representation of the reconstructed smooth surface of a cell. 線維芽細胞の細胞画像から分割された細胞核内の分割された細胞核小体の3つのバイナリマスク表現の3次元視覚化を示す、ロバストな平滑面再構築の画像である。Robust smooth surface reconstruction images showing three-dimensional visualization of three binary mask representations of the segmented cell nucleolus in the segmented cell nucleus from fibroblast cell images. Z軸に沿って色分けされた細胞核小体表面の3つのメッシュ表現の3次元視覚化を示す、ロバストな平滑面再構築の画像である。Images of robust smooth surface reconstruction showing three-dimensional visualization of three mesh representations of the cell nucleolus surface color-coded along the Z-axis. 2つの多様体から成る(局所)幾何学形状を、頂点ごとの局所座標枠に対する湾曲の定義を含めて示す図である。Fig. 2 shows a (local) geometry consisting of two manifolds, including the definition of curvature for a vertex-wise local coordinate frame; LONIパイプラインのクライアントインタフェース内のワークフローの開始から終了までの例示的なグラフィック表現で、ネスティングされたモジュールグループを示す、開始から終了までにわたる検証済みのワークフロープロトコル概要を含む図である。FIG. 10 is an exemplary start-to-finish graphical representation of a workflow within a client interface of a LONI pipeline, including a validated start-to-finish workflow protocol overview showing nested module groups; LONIパイプラインのクライアントインタフェース内のワークフローの例示的なグラフィック表現で、3D形状モデリングの微調整を行うボリューム-形状グループの拡大図および、形態学的測度の抽出を行うモジュールを含む形態計測グループの拡大図を示す図である。Exemplary graphical representation of the workflow within the client interface of the LONI pipeline, showing an expanded view of the Volume-Shape group for fine-tuning 3D shape modeling and an expansion of the Morphometrics group containing modules for the extraction of morphological measures. Fig. 3 shows a diagram. 線維芽細胞の分類結果を、さまざまなサイズの細胞集合について平均AUCで示すグラフである。FIG. 10 is a graph showing fibroblast sorting results with mean AUC for different size cell populations. FIG. 線維芽細胞の分類結果を、分類用の特徴を重要度スコアの順に上位10まで示すグラフである(分類に適した、「平均」、「最小」、「最大」、「分散」の付く細胞核小体の特徴名のうち、PC3細胞の上位10の中にも報告されているものは青色のフォントで示されている)。Graph showing the classification results of fibroblasts with the top 10 features for classification in order of importance score (mean, minimum, maximum, variance, suitable for classification). Somatic feature names that have also been reported among the top 10 PC3 cells are shown in blue font). PC3の分類結果を、さまざまなサイズの細胞集合について平均AUCで示すグラフである。FIG. 10 is a graph showing PC3 sorting results with average AUC for different size cell populations. FIG. PC3の分類結果を、分類用の特徴を重要度スコアの順に上位10まで示すグラフである(分類に適した、「平均」、「最小」、「最大」、「分散」の付く細胞核小体の特徴名のうち、線維芽細胞の上位10の中にも報告されているものは青色のフォントで示されている)。PC3 classification results are graphs showing the top 10 features for classification in order of importance score (cell nucleolus with "mean", "minimum", "maximum", "variance" suitable for classification Feature names that have also been reported among the top ten fibroblasts are shown in blue font).

いくつかの図面にわたって、対応する参照番号は対応する部分を示す。 Corresponding reference numbers indicate corresponding parts throughout the several drawings.

ここで添付図面を参照しながら、実施形態の例について、より詳細に説明する。 Exemplary embodiments will now be described in more detail with reference to the accompanying drawings.

組織および細胞の形態は、細胞分化、発生、増殖および疾病に関連する複雑な根本的生体機構によって統制されている。細胞の形の変化は、遺伝子の調節および発現などの、改変された機能的属性に関連するクロマチン構造の再編成を反映する。同時に、メカノバイオロジーにおける多くの研究によって、細胞の変形に用いられる幾何学的制約および機械的な力が逆に、細胞核およびクロマチンの動力学、遺伝子およびパスウェイの活性化に影響することが示されている。よって、細胞または細胞器官および要素の形態定量化は、4Dヌクレオームとして知られる空間的かつ時間的な枠組み内でのクロマチンとDNAの構造の再編成の研究として、重要性を増している。4Dヌクレオームの文脈において関心の対象となる細胞構造体には、細胞核そのものだけではなく、細胞核小体および核小体会合性ドメイン(NAD)、染色体テリトリー、位相的会合性ドメイン(TDA)、ラミナ会合性ドメイン(LAD)、ならびに、転写ファクトリ内のループドメインもまた含まれる。さらに、これらの過程を形態変化の定量解析を通して理解することは、例えば、癌などの病的状態の検出、理解、および治療について多くの医学的な意味もまた有する。本文献では、細胞、細胞内器官、要素、その他の細胞構造体のサイズおよび形状の定量的測度を包含する形を解析するために、細胞の形態計測をしばしば使用する。 Tissue and cell morphology are governed by complex underlying biomechanisms associated with cell differentiation, development, proliferation and disease. Changes in cell shape reflect rearrangements of chromatin structure associated with altered functional attributes, such as gene regulation and expression. At the same time, numerous studies in mechanobiology have shown that the geometric constraints and mechanical forces used to deform cells inversely affect nuclear and chromatin dynamics, gene and pathway activation. ing. Thus, morphological quantification of cells or organelles and elements is of increasing importance as the study of structural rearrangements of chromatin and DNA within a spatial and temporal framework known as the 4D nucleome. Cellular structures of interest in the context of the 4D nucleome include not only the cell nucleus itself, but also the cell nucleolus and nucleolus-associated domains (NADs), chromosome territories, topologically-associated domains (TDA), lamina associations. Also included are sex domains (LADs), as well as loop domains within transcription factories. Furthermore, understanding these processes through quantitative analysis of morphological changes also has many medical implications for the detection, understanding, and treatment of pathological conditions such as cancer. In the literature, cell morphometry is often used to analyze shape, including quantitative measures of size and shape of cells, organelles, elements, and other cellular structures.

細胞形状の特徴を2Dまたは疑似3Dで開発するために多くの努力が行われてきたが、いくつかの研究では、細胞核形状の記述および識別について、3D形態計測測度の方が2Dの特徴よりも良い結果を出す。しかしながら、ロバストな形態解析が可能で、人間による解読が容易になる3D形状記述子については、現時点ではまだ活発な調査が行われているところである。さらに、拡張可能で雑音に強く、複数の母集団にわたって同時に十分に特異的であるべき3次元形状解析に対して、取得したデータの次元数および体積、さまざまな画像取得条件、および、母集団内の細胞形状の大幅な多様性は、いくつかの課題を呈する。よって、母集団に関する解析を行うための、高スループット能力をもつロバストな3D細胞形態計測技法に対する強い需要が存在する。 Although many efforts have been made to develop cell shape features in 2D or pseudo-3D, several studies have shown that 3D morphometric measures are better than 2D features for describing and identifying cell nucleus shape. get good results. However, 3D shape descriptors that enable robust morphological analysis and are easy to decode by humans are still under active investigation at this time. Furthermore, for 3D shape analysis, which should be scalable, robust to noise, and sufficiently specific across multiple populations simultaneously, the dimensionality and volume of the acquired data, various image acquisition conditions, and intra-population The great diversity of cell shapes in S. cerevisiae presents several challenges. Thus, there is a strong demand for robust 3D cytomorphometry techniques with high throughput capabilities for performing analyzes on populations.

本開示は2つの相補的な目的を有する。第1の目的は、細胞または細胞内器官および構成の形状記述のための3D形態計測メトリクスを査定して検証することである。まず、顕微鏡データから抽出した3Dマスクの表面を、ラプラス・ベルトラミ固有投影および、位相を維持した境界変形を使用して、再構築する。次に、内在的および外在的な幾何学メトリクスを計算する。これらは、3D形状の複雑性を特徴付け、観察された臨床的な表現型形質を識別するために導出されたシグネチャベクトル(形状バイオマーカ)として使用される。これらのメトリクスには、体積、表面積、平均曲率、湾曲性、形状指数、フラクタル次元が含まれる。推奨されるモデリングおよび解析の方法を使用して、細胞、細胞核、ならびにその他の細胞内器官および要素の形状定量化を行うことができる。 This disclosure has two complementary purposes. The first objective is to assess and validate 3D morphometric metrics for shape description of cells or subcellular organelles and structures. First, the surface of the 3D mask extracted from the microscopic data is reconstructed using Laplace-Betrami eigenprojections and phase-preserving boundary deformations. Next, we compute intrinsic and extrinsic geometric metrics. These are used as derived signature vectors (shape biomarkers) to characterize the complexity of the 3D shape and discriminate observed clinical phenotypic traits. These metrics include volume, surface area, mean curvature, curvature, shape index, and fractal dimension. Shape quantification of cells, cell nuclei, and other subcellular organs and elements can be performed using recommended modeling and analysis methods.

第2の目的は、健康な状態と疾病状態にある3D細胞および細胞内の形状表現型の関係を深く調査するためにカスタム化して拡張することができる、プロセス全体を実施する再現可能なパイプラインワークフローを開発することである。高スループットイメージング(HTI)には、リキッドハンドリング、顕微鏡ベースの画像取得、画像処理、および、統計的データ解析の自動化を含むことができる。このワークは、この定義のうち最後の2つの側面に焦点をあてる。合理化された複数ステップのプロトコルが実施され、このプロトコルは、多様なツールセットに依存し、LONIパイプラインのワークフローに滑らかに接続する。このワークフローは現代の高スループットイメージング処理および解析の標準に適合し、妥当性および再現可能性に焦点をあてて、ほとんど自動化されている。 Second, a reproducible pipeline that implements the entire process that can be customized and extended to deeply investigate shape-phenotype relationships in 3D cells and cells in healthy and diseased states. It is to develop a workflow. High-throughput imaging (HTI) can include automation of liquid handling, microscope-based image acquisition, image processing, and statistical data analysis. This work focuses on the last two aspects of this definition. A streamlined multi-step protocol is implemented that relies on a diverse set of tools and seamlessly connects to the workflow of the LONI pipeline. This workflow meets modern high-throughput imaging and analysis standards and is mostly automated with a focus on validity and reproducibility.

図1は、プロトコルの開始から終了までの俯瞰的な流れを示す。開始点として11で、少なくとも1つの細胞を含む生体試料を、3次元画像取得技術を使用して画像化する。この技術には、顕微鏡検査法(例えば共焦点顕微鏡検査法、多光子顕微鏡検査法、ライトシート顕微鏡検査表、および超解像度顕微鏡検査法など)、断層法(例えば蛍光活性化セルソーティング(FACS)断層撮像、ホログラフィック断層法、および光干渉断層法など)、または光音響画像化が含まれるが、それらに限定されない。一実施形態では、3D共焦点画像化は、63xプラン/アポクロマート 1.4na DIC対物レンズ付きのZeiss LSM710レーザ走査型共焦点顕微鏡を使用して行われる。顕微鏡画像化によって生体試料の画像データが生成され、この画像データは生体試料の3次元表現を提供する。生体試料は、下記で詳細に説明するように、分類を改善するために3~20個の細胞を含むことが好ましい。生体試料は組織または細胞培養から採取してもよいことが、理解される。 FIG. 1 shows a bird's-eye view of the protocol from start to finish. At 11 as a starting point, a biological sample containing at least one cell is imaged using a three-dimensional image acquisition technique. The techniques include microscopy (such as confocal microscopy, multiphoton microscopy, light sheet microscopy, and super-resolution microscopy), tomography (such as fluorescence activated cell sorting (FACS) tomography). imaging, holographic tomography, and optical coherence tomography), or optoacoustic imaging. In one embodiment, 3D confocal imaging is performed using a Zeiss LSM710 laser scanning confocal microscope with a 63x plan/apochromat 1.4na DIC objective. Microscopic imaging produces image data of the biological sample, which image data provides a three-dimensional representation of the biological sample. The biological sample preferably contains 3-20 cells to improve classification, as described in detail below. It is understood that the biological sample may be obtained from tissue or cell culture.

12で、画像データを、生体試料内の細胞を含む異なる成分(すなわち細胞器官)を表す個別のボリュームに分割する。例えば、細胞内の細胞核の境界を、画像データ内でラベル付けする。同様に、各細胞核内の細胞核小体を、画像データ内でラベル付けする。細胞内の各成分要素に対して別々のマスク(すなわち、バイナリ画像)を生成してもよい。この実施形態例では、マスクは、NIFTI(Neuroimaging Informatics Technology Initiative)などの標準のファイル形式に変換される。分割することには、下記で詳細に説明するように、他のフィルタリングまたは信号処理が含まれてもよい。 At 12, the image data is divided into separate volumes representing different components (ie, organelles) containing cells within the biological sample. For example, boundaries of cell nuclei within cells are labeled in the image data. Similarly, the nucleolus within each cell nucleus is labeled within the image data. A separate mask (ie, binary image) may be generated for each component element within the cell. In this example embodiment, the mask is converted to a standard file format such as NIFTI (Neuroimaging Informatics Technology Initiative). Splitting may include other filtering or signal processing, as described in detail below.

画像データ内のラベル付けされた細胞または細胞内細胞器官および要素のそれぞれについて、13で表面再構築を行う。つまり、所与の細胞核を画定する境界の数学的表現を構築する。その結果、ラベル付けされた各オブジェクトの境界面がポリゴンメッシュで表される。一実施形態例では、所与の細胞核の表面の数学的表現は、反復的なラプラス・ベルトラミ固有投影および境界変形法を使用して構築される。この表面再構築法の例に関するさらなる情報が、2010年12月に発行された、IEEE Transactions on Medical Imaging、Vol.29、No.12の『Robust Surface Reconstruction via Laplace-Beltrami Eigen-Projection and Boundary Deformation』(Yonggang Shiら)に記載されており、その全体が本明細書に組み込まれている。境界面の数学的表現を構築する他の方法もまた、本開示において企図されている。 Surface reconstruction is performed at 13 for each of the labeled cells or subcellular organelles and elements in the image data. That is, construct a mathematical representation of the boundaries that define a given cell nucleus. As a result, the bounding surfaces of each labeled object are represented by polygon meshes. In one example embodiment, a mathematical representation of the surface of a given cell nucleus is constructed using iterative Laplace-Bestrami eigenprojections and boundary deformation methods. Further information on this example of resurfacing methods can be found in IEEE Transactions on Medical Imaging, December 2010, Vol. 29, No. 12, "Robust Surface Reconstruction via Laplace-Beltrami Eigen-Projection and Boundary Deformation" (Yonggang Shi et al.), which is incorporated herein in its entirety. Other methods of constructing the mathematical representation of the interface are also contemplated in this disclosure.

次に14で、ラベル付けされた細胞または細胞内細胞器官もしくは要素のそれぞれについて、それらの細胞または細胞内細胞器官もしくは要素の表面境界の数学的表現から、特徴を抽出する。特徴は、ラベル付けされた細胞または細胞内細胞器官もしくは要素の形状およびサイズの測度である。例えば、ラベル付けされた細胞または細胞内細胞器官もしくは要素から抽出される特徴には、細胞または細胞内細胞器官もしくは要素の体積、細胞または細胞内細胞器官もしくは要素の表面積、細胞または細胞内細胞器官もしくは要素の平均曲率、細胞または細胞内細胞器官もしくは要素の形状指数、細胞または細胞内細胞器官もしくは要素の屈曲指数、および、細胞または細胞内細胞器官もしくは要素のフラクタル次元が含まれ得るが、これらに限定されない。 At 14, for each labeled cell or subcellular organelle or element, features are then extracted from the mathematical representation of the surface boundaries of those cells or subcellular organelles or elements. A feature is a measure of the shape and size of a labeled cell or subcellular organelle or element. For example, features extracted from labeled cells or intracellular organelles or elements include volume of cells or intracellular organelles or elements, surface area of cells or intracellular organelles or elements, or mean curvature of the element, shape index of the cell or intracellular organelle or element, tortuosity index of the cell or intracellular organelle or element, and fractal dimension of the cell or intracellular organelle or element. is not limited to

この実施形態例では、特徴は、ラベル付けされた細胞核の形状およびサイズの測度である。例えば、ラベル付けされた細胞核から抽出される特徴には、細胞核の体積、細胞核の表面積、細胞核の平均曲率、細胞核の形状指数、細胞核の屈曲指数、および細胞核のフラクタル次元が含まれ得るが、これらに限定されない。特徴はまた、ラベル付けされた細胞核小体のそれぞれについて抽出されてもよい。ここでも、特徴はラベル付けされた細胞核小体の形状およびサイズの測度である。特徴の例には、ラベル付けされた細胞内の細胞核の数、細胞核小体の体積、細胞核小体の表面積、細胞核小体の平均曲率、細胞核小体の形状指数、細胞核小体の湾曲指数、および細胞核小体のフラクタル次元が含まれるが、これらに限定されない。他のタイプの特徴を抽出し、分類に使用してもよいことは、容易に理解される。 In this example embodiment, the feature is a measure of the shape and size of the labeled cell nuclei. For example, features extracted from labeled nuclei can include nucleus volume, nucleus surface area, nucleus mean curvature, nucleus shape index, nucleus curvature index, and nucleus fractal dimension. is not limited to Features may also be extracted for each labeled cell nucleolus. Again, the features are measures of the shape and size of the labeled cell nucleolus. Examples of features include number of cell nuclei in a labeled cell, cell nucleolus volume, cell nucleolus surface area, cell nucleolus mean curvature, cell nucleolus shape index, cell nucleolus curvature index, and the fractal dimension of the cell nucleolus. It is readily understood that other types of features may be extracted and used for classification.

最後に、ステップ15で生体試料内の細胞を分類する。一実施形態では、細胞から抽出された幾何学的形態特徴を使用して、健康な細胞と癌性細胞を識別することができる。画像化の前に、分類のためのモデルを2つ以上決定する。抽出された特徴(すなわち、特徴ベクトルの形での特徴)を、記憶されているモデルと比較することによって、生体試料内の細胞を分類することができる。一実施形態では、細胞は、下記で詳細に説明するように、ランダムフォレスト分類法を使用して分類される。特定の分類法に言及するが、他の分類法も、とりわけ、線形分類器、k近傍法、決定木法、ニューラルネットワーク、およびサポートベクターマシンを含めて、本開示の範囲に該当する。 Finally, at step 15 the cells within the biological sample are classified. In one embodiment, geometric features extracted from cells can be used to distinguish between healthy and cancerous cells. Two or more models for classification are determined prior to imaging. By comparing the extracted features (ie, features in the form of feature vectors) to a stored model, cells within the biological sample can be classified. In one embodiment, cells are classified using a random forest classification method, as described in detail below. Although particular taxonomies are mentioned, other taxonomies also fall within the scope of this disclosure, including linear classifiers, k-nearest neighbors, decision trees, neural networks, and support vector machines, among others.

一実施形態例を、下記で詳細に説明する。画像化の前に、生体試料の成分をラベル付けしてもよい(例えば、染色)。この実施形態例では、3種の異なる蛍光体で細胞をラベル付けした。DAPI(4’,6-ジアミジノ-2-フェニルインドール)は細胞核の一般的な染色手段であり、フィブリラリン抗体(フィブリラリン)および臭化エチジウム(EtBr)は共に細胞核小体の染色に使用される。フィブリラリンは一般的に使用される核小体ラベルであるが、検出される細胞核小体内の局所的な明暗度の変動が大きいためにマスク形状の抽出が困難になるので、形状モデリングの目的には特異的すぎることがわかった。凝集したクロマチン、細胞核小体、およびリボソームの染色には、臭化エチジウムを使用できることが判明した。臭化エチジウムを使用すると、細胞核小体形状の表現が全体的に改善されることがわかった。共局在を通して特定のフィブリラリンを臭化エチジウムと組み合わせ、下記で説明するように、核小体の位置が正確に検出されているか確認する。 An example embodiment is described in detail below. Components of the biological sample may be labeled (eg, stained) prior to imaging. In this example embodiment, cells were labeled with three different fluorophores. DAPI (4',6-diamidino-2-phenylindole) is a common stain for cell nuclei, and fibrillarin antibody (Fibrillarin) and ethidium bromide (EtBr) are both used to stain cell nucleoli. Although fibrillarin is a commonly used nucleolus label, it is not suitable for shape modeling purposes because the large local intensity variation within the detected cell nucleolus makes mask shape extraction difficult. It turned out to be too specific. It was found that ethidium bromide can be used to stain condensed chromatin, cell nucleoli, and ribosomes. The use of ethidium bromide was found to improve overall representation of cell nucleolus shape. Specific fibrillarin is combined with ethidium bromide through co-localization to ensure accurate detection of nucleolus location, as described below.

分割について、図2を参照しながらさらに詳細に説明する。21に示すように、ラベル付けに基づいて、画像データを2つ以上のチャネルに分離することができる。この実施形態例では、チャネルを、それぞれDAPI、フィブリラリン、EtBrのチャネルを表すように、c0、c1、c2とラベル付けされた個別のボリュームとして分離して保存した。次いで、それぞれのチャネル特定のボリュームを1024x1024xZの格子(Z=[10,50])に再スライスし、局部的なサブボリュームによって顕微鏡の固有タイルサイズとの整合が容易になるようにした。全てのサブボリュームを(無損失で)変換し、マルチイメージの3D TIFFボリュームとして保存した。 Splitting is described in more detail with reference to FIG. Based on the labeling, the image data can be separated into two or more channels, as shown at 21 . In this example embodiment, the channels were stored separately as separate volumes labeled c0, c1, c2 to represent the DAPI, fibrillarin, and EtBr channels, respectively. Each channel-specific volume was then resliced into a 1024×1024×Z grid (Z=[10,50]), with local subvolumes facilitating matching with the microscope's intrinsic tile size. All sub-volumes were transformed (losslessly) and saved as multi-image 3D TIFF volumes.

22で、全てのサブボリュームについて、3つ全ての次元での倍率および解像度を含め、附随する顕微鏡メタデータを元データから抽出し、画像の異方性に対処するために、さらに下流モジュールへ送った。23で、各サブボリュームをさらに、グレースケール(例えば、8ビット解像度)に変換した。スペックル除去などのノイズリダクション方法をサブボリュームに適用してもよい。 At 22, for every sub-volume, the accompanying microscopy metadata is extracted from the original data, including magnification and resolution in all three dimensions, and sent to further downstream modules to address image anisotropy. Ta. At 23, each sub-volume was further converted to grayscale (eg, 8-bit resolution). A noise reduction method such as despeckle may be applied to the sub-volume.

24で、ボリュームから細胞核および細胞核小体を分割する。例として、Farsightツールキットに備わるものなどの細胞分割アルゴリズムをDAPIチャネルのサブボリュームに適用することによって、DAPIチャネル内の細胞核の自動3D分割を行った。Farsightツールキットを採用した理由はいくつかある。まず、2Dまたは3DでDAPI染色された細胞核のために専用に作られたCLIキットであり、非常に使いやすい。また、Farsightツールキットは、ラベル付けされた訓練用集合および、そのデータについての実証済みの安定した結果を必要としない。細胞核分割のアルゴリズムは複数のステップを実施し、それらには、サブボリュームをバイナリ化するグラフカットアルゴリズム、細胞核をブロブマスクに変換するマルチスケールLoG(Laplacian of Gaussian)フィルタ、細胞核の輪郭を描くための高速クラスタリング、および、グラフカットとアルファ拡張を使用した細胞核輪郭の微調整が含まれる。分割の後、データを16ビットの3D TIFFファイルに変換する。分割された各細胞核をマスクとして表現し、それぞれに独自のインデックスを与えた。他の細胞核分割法もまた、本開示の範囲に該当することは容易に理解される。 At 24, divide the nucleus and nucleolus from the volume. As an example, automated 3D segmentation of cell nuclei within a DAPI channel was performed by applying a cell segmentation algorithm such as that provided in the Farsight toolkit to subvolumes of the DAPI channel. There are several reasons for adopting the Farsight toolkit. First, it is a CLI kit specifically made for DAPI-stained cell nuclei in 2D or 3D and very easy to use. Also, the Farsight toolkit does not require a labeled training set and proven stable results on the data. The algorithm for nucleus segmentation implements multiple steps, including a graph cut algorithm to binarize the subvolume, a multi-scale Laplacian of Gaussian (LoG) filter to convert the nucleus to a blob mask, a fast algorithm to delineate the nucleus. Clustering and refinement of cell nucleus contours using graph cut and alpha dilation are included. After splitting, the data is converted to a 16-bit 3D TIFF file. Each segmented nucleus was represented as a mask and given its own index. It is readily understood that other cell nucleus division methods are also within the scope of this disclosure.

例として、Weka Data Miningソフトウェアパッケージを使用して、フィブリラリンチャネルおよび臭化エチジウムチャネルでも細胞核小体の自動3D分割を行った。この実施形態例では、Trainable Weka Segmentationプラグインを、ImageJに基づく画像処理・視覚化ソフトウェアパッケージであるFijiとバンドルした。細胞核内の分割は、臭化エチジウム(EtBr)で染色された細胞核小体とフィブリラリンで染色された細胞核小体について別々に行った。Trainable Weka Segmentationプラグインは、ImageJエコシステムで最もポピュラーな分割ツールで、3D画像内の生物構造体のラベル付けに比較的簡単に使用することができる。細胞核内の複数の分割部分を細胞核内のオブジェクトへと切り離す目的で、DAPI細胞核マスクを使用して、EtBrチャネルおよびフィブリラリンチャネル内に分割空間を画定した。訓練対象のチャネル内でサブボリュームの10%を無作為抽出して使用して、各チャネルについて分類器モデルを作成した。次いで、ランダムフォレストアルゴリズムを使用して、チャネル内の全てのサブボリュームにモデルを適用した。その結果の確率マップから、細胞核小体マスクを作成した。次いで、各細胞核小体に独自にインデックス付けするために、“Find Connected Regions”ImageJ/Fijiプラグインを使用して、連結した要素のラベリングを行った。下記に説明する品質調整プロトコルを使用して、細胞核マスクについて、分割アーチファクトをフィルタリングした。最後に、EtBrとフィブリラリンの両方の分割ボリュームを共局在アルゴリズムの入力として使用し、フィブリラリンの存在に基づいて、分割されたEtBr染色細胞内小体を実証した。他の細胞核小体分割法もまた、本開示の範囲に該当することは容易に理解される。 As an example, automated 3D segmentation of cell nucleoli was also performed in fibrillarin and ethidium bromide channels using the Weka Data Mining software package. In this example embodiment, the Trainable Weka Segmentation plugin was bundled with Fiji, an ImageJ-based image processing and visualization software package. Subnuclear segmentation was performed separately for ethidium bromide (EtBr)-stained and fibrillarin-stained nucleoli. The Trainable Weka Segmentation plugin is the most popular segmentation tool in the ImageJ ecosystem and is relatively easy to use for labeling biological structures in 3D images. A DAPI nuclear mask was used to define partition spaces in the EtBr and fibrillarin channels for the purpose of separating multiple divisions into nuclear objects. A random sample of 10% of the sub-volume within the channel being trained was used to create a classifier model for each channel. A random forest algorithm was then used to apply the model to all sub-volumes within the channel. A cell nucleolus mask was generated from the resulting probability map. Connected elements were then labeled using the "Find Connected Regions" ImageJ/Fiji plugin to uniquely index each cell nucleolus. Segmentation artifacts were filtered for the nucleus mask using the quality adjustment protocol described below. Finally, both EtBr and fibrillarin partition volumes were used as inputs for a colocalization algorithm to demonstrate partitioned EtBr-stained intracellular bodies based on the presence of fibrillarin. It is readily understood that other cell nucleolus splitting methods are also within the scope of this disclosure.

非一様な染色は、しばしば偶発的な分割アーチファクトを引き起こし、結果のマスクが、例えば、「取手」、「穴」または、特異点を有する不規則な境界形状を含んで複雑になる。この問題は通常、ステップ25に示すように、さまざまな位相修正技法を適用することにより解決される。細胞核マスクの例示的な後処理ステップには、MATLAB関数のセットを使用した穴の塗りつぶしが含まれる。アーチファクトのフィルタリングは、例えば、特定されたオブジェクトの球面コンパクト性を測定して、そのオブジェクトの体積をボクセル数により推定し、タイルの縁部をまたぐか、または他のオブジェクトに連結しているオブジェクトを検出するJavaアプリケーションなどの、他の方策を使用して行うこともできる。コンパクト性およびボクセル数のカットオフ値は、ほとんどのアーチファクトを除去するように経験的に選択した。このフィルタは、穴の塗りつぶし修正と併せて、より形態計測解析に適したマスクを生成するために役立った。この品質調整プロトコルによって、ジーナスゼロではない可能性のあるマスクが訂正または選別され、さらなる微調整のためにフラグ付けされた。最後に、26で、品質調整を通したマスクを、NIFTI形式などのニューロイメージングの形式に変換した。これらのマスクを、パイプラインワークフロー内で続いて、形状形態計測の解析に使用した。 Non-uniform staining often causes occasional segmentation artifacts, and the resulting mask becomes complex, including, for example, "handles", "holes" or irregular boundary shapes with singularities. This problem is usually solved by applying various phase modification techniques, as shown in step 25. An exemplary post-processing step for the nucleus mask includes filling holes using a set of MATLAB functions. Artifact filtering, for example, measures the spherical compactness of an identified object, estimates the volume of that object in terms of voxel numbers, and identifies objects that straddle tile edges or connect to other objects. It can also be done using other measures, such as Java applications that detect. The compactness and voxel number cutoff values were empirically chosen to remove most artifacts. This filter, in conjunction with the hole fill modification, helped to generate a mask more suitable for morphometric analysis. Through this quality adjustment protocol, potentially non-genus-zero masks were corrected or screened and flagged for further fine-tuning. Finally, at 26, the quality-adjusted mask was converted to a neuroimaging format, such as the NIFTI format. These masks were used for shape morphometric analysis subsequently in the pipeline workflow.

ワークフローの形態計測的特徴抽出部への入力の役割をした集合は、上記のとおり、3D分割されて独自にラベル付けされたバイナリの細胞核マスクを表す、チャネルc0からのボリュームの集合から成り、この集合は、c1を使用した共局在手順によってフィルタリングされた、各細胞についてのチャネルc2からの細胞核小体の3Dマスクを伴う。分割および品質調整済みの細胞核および細胞核小体の、圧縮NIFTI形式(.nii.gz)のボリュームを、ボクセルマスクから三角形をした多様体へ変換し、開発したワークフローを使用して自動的に処理した。 The set that served as input to the morphometric feature extraction portion of the workflow consisted of the set of volumes from channel c0 representing the 3D segmented and uniquely labeled binary nucleus mask, as described above, and this The assembly involves a 3D mask of cell nucleoli from channel c2 for each cell filtered by a colocalization procedure using c1. Compressed NIFTI format (.nii.gz) volumes of segmented and quality-adjusted cell nuclei and nucleoli were converted from voxel masks to triangulated manifolds and processed automatically using the developed workflow. .

細胞核および細胞核小体の3D形状をモデリングするために、顕微鏡データから抽出した3Dマスクの境界を、2次元の多様体(2次元球面S2と位相同型)としてモデリングした。これらはラプラス・ベルトラミ固有投影および、位相を維持した境界変形アルゴリズムを使用して、三角形をした表面として埋め込まれる。この手法について、図3と関連させながらさらに詳しく説明する。 To model the 3D shape of cell nuclei and nucleoli, the boundaries of the 3D masks extracted from the microscopic data were modeled as 2D manifolds (topologically isomorphic to the 2D sphere S2). These are embedded as triangular surfaces using Laplace-Betrami eigenprojections and a phase-preserving boundary deformation algorithm. This approach is described in more detail in connection with FIG.

分割処理から受け取った出力の中にオブジェクトが画定されている。33で、各オブジェクトについて、オブジェクトのバイナリマスクの境界からメッシュ表現を構築する。メッシュ表現を構築する前に、32で、マスクをバイナリ化する。境界はラプラス・ベルトラミ固有関数の部分空間に投影され、それにより、固有投影の測定歪みを計算することによって、疑似的な特徴の位置を自動的に特定することができる。ラプラス・ベルトラミ固有関数は内在的に定義され、パラメータ表現を一切必要とせずに境界面から簡単に計算することができる。これらの関数は等長不変なので、境界面のギザギザな性質に対して強く、これは生体形状解析には望ましい。ラプラス・ベルトラミ作用素の固有値の大きさはフーリエ解析の周波数に直観的に対応するので、再構築される表面の滑らかさを調整するための便利な機構が得られる。 Objects are defined in the output received from the splitting process. At 33, for each object, construct a mesh representation from the boundary of the object's binary mask. The mask is binarized at 32 before constructing the mesh representation. The boundaries are projected onto the subspace of the Laplace-Bestrami eigenfunctions so that spurious features can be automatically located by computing the measured distortion of the eigenprojections. The Laplace-Betrami eigenfunctions are intrinsically defined and can be easily computed from the boundary surface without requiring any parameterization. Since these functions are isometrically invariant, they are robust to the jagged nature of interfaces, which is desirable for biomorphology analysis. The magnitude of the eigenvalues of the Laplace-Betrami operator intuitively corresponds to the frequency of the Fourier analysis, providing a convenient mechanism for adjusting the smoothness of the reconstructed surface.

次のステップは、この情報を使用したステップ34のマスク変形処理であり、疑似的な特徴を除去しながらマスクの残り部分をそのまま残し、それにより、意図しないボリューム縮小を防ぐ。この変形処理は位相を維持し、マスクの境界面が多様体であるように良好に構成されている。ステップ33および34は、35で収束するまで繰り返される。最後に36で、方法は、マスク境界の固有投影として最終的な表面を生成し、この表面はジーナスゼロ位相を有する平滑な表面である。この、局部的細胞器官の境界の多様体表現によって、例えば、三日月形、多葉形、および折りたたまれた形を含め、形状位相が球体と位相同型である限り、全ての形状のアルゴリズム的な理解が容易になる。このステップの例示的な結果を図4に示す。このようにして、分割されたマスクから、反復的なマスクフィルタリング処理を使用して、ジーナスゼロの2次元多様体として、細胞核および細胞核小体のロバストな表面再構築を行った。この処理に関するさらなる詳細が、IEEE Transactions on Medical Imaging 2010の『Robust Surface Reconstruction via Laplace-Beltrami Eigen-Projection and Boundary Deformation』(YG Shenら)に記載されており、その全体が本明細書に組み込まれている。 The next step is the mask deformation process of step 34 that uses this information to remove spurious features while leaving the rest of the mask intact, thereby preventing unintended volume reduction. This deformation process is phase-preserving and well designed so that the boundary surface of the mask is manifold. Steps 33 and 34 are repeated until convergence at 35 . Finally at 36, the method produces the final surface as an eigenprojection of the mask boundary, which is a smooth surface with genus-zero phase. This manifold representation of the boundaries of the local organelles allows algorithmic computation of all shapes, including e.g. easier to understand. An exemplary result of this step is shown in FIG. Thus, from the segmented mask, an iterative mask filtering process was used to perform robust surface reconstruction of cell nuclei and cell nucleoli as genus-zero 2D manifolds. Further details regarding this process can be found in IEEE Transactions on Medical Imaging 2010, "Robust Surface Reconstruction via Laplace-Beltrami Eigen-Projection and Boundary Deformation" (YG S hen et al.), which is incorporated herein in its entirety. there is

この実施形態例では、3D表面の幾何学的特徴を定量化する特徴として、6つの形状測度を使用する。これらの測度を計算するために、ジーナスゼロのソリッドの境界を表す三角形表面のモデルを使用して、主曲率(最小および最大)

を算出する。すると、形状の形態計測測度、すなわち平均曲率、形状指数、および屈曲度を、これらの主曲率で表すことができる。平均曲率は

と定義され、形状指数は

と定義され、屈曲度は

と定義される。表面の主曲率は、ヘッセ行列(第2基本形式)の固有値で、

について解かれ、ここでIは単位行列である。Sが第2基本形式の表面H(X,Y)であれば、

は不動点であり、pにおける接ベクトルの正規直交基底をu,vで示すと、主曲率は、形状テンソルとして知られる、対称ヘッセ行列

の固有値である。図5に示すように、

を表面

のパラメトリック表現とする。これは2変数の滑らかなベクトル値関数を表し、rとrによって示される、uとvに関する偏微分を伴う。すると、パラメトリックなu,v平面内の所与の点(p)のヘッセ係数Hi,jは、その点での第2の偏微分の、Sに対する法線への投影

によって与えられ、ドット積演算子を使用して、

のように計算することができる。
In this example embodiment, six shape measures are used as features to quantify geometric features of 3D surfaces. To compute these measures, we use a model of triangular surfaces representing the boundaries of genus-zero solids to determine the principal curvatures (minimum and maximum)

Calculate The morphometric measures of shape, namely mean curvature, shape index and tortuosity, can then be expressed in terms of these principal curvatures. The average curvature is

and the shape index is

and the tortuosity is

is defined as The principal curvatures of the surface are the eigenvalues of the Hessian matrix (second fundamental form),

where I is the identity matrix. If S is the surface H(X,Y) of the second basic form, then

is a fixed point, and denoting by u,v the orthonormal basis of the tangent vector at p, the principal curvatures are the symmetric Hessian matrix

is the eigenvalue of As shown in FIG.

the surface

be a parametric representation of It represents a smooth vector-valued function of two variables, with partial derivatives with respect to u and v , denoted by r u and r v . Then the Hessian coefficient H i,j at a given point (p) in the parametric u,v plane is the projection of the second partial derivative at that point onto the normal to S

and using the dot product operator,

can be calculated as

あとの3つの形状測度は、体積、表面積、およびフラクタル次元である。体積は閉じた境界面によって囲まれた3D空間の量であり、

として表すことができ、ここでI(x,y,z)は、興味対象の領域(D)の指示関数を表す。r(u,v)が連続的微分可能関数で、パラメトリックなu,v平面内の適切な領域Dにわたる表面に対する法線ベクトルが

で示されるならば、

であり、

は、その領域境界のパラメトリックな表面表現である。すると、表面積は、

として表すことができる。フラクタル次元の計算は、フラクタル縮小率

および、置換部分の数Nに基づく。『Discrete Differential-Geometry Operators for Triangulated 2-Manifolds』(M. Meyerら)Visualization and Mathematics III、Berlin、Heidelberg Springer Berlin Heidelberg、2003年、35~57頁、および、『Segmentation and Recognition of 3D Point Clouds within Graph-theoretic and thermodynamic frameworks』(A.Jagannathan)(博士論文、Northeastern University、2005)に記載されるように、これらのメトリクスの高精度離散近似を使用して、メッシュ表現された表面でこれらの形状測度を計算した。
The other three shape measures are volume, surface area, and fractal dimension. Volume is the amount of 3D space enclosed by a closed bounding surface,

where I D (x,y,z) represents the indicator function of the region of interest (D). r(u,v) is a continuously differentiable function whose normal vector to the surface over a suitable region D in the parametric u,v plane is

If indicated by

and

is the parametric surface representation of the domain boundary. Then the surface area is

can be expressed as The fractal dimension is calculated using the fractal reduction factor

and based on the number N of replacement moieties. "Discrete Differential-Geometry Operators for Triangulated 2-Manifolds" (M. Meyer et al.) Visualization and Mathematics III, Berlin, Heidelberg Springer Berlin Heidelberg, 2 2003, pp. 35-57, and "Segmentation and Recognition of 3D Point Clouds with Graph - theoretic and thermodynamic frameworks" (A. Jagannathan) (Ph.D. thesis, Northeastern University, 2005), using high-precision discrete approximations of these metrics to compute these shape measures on mesh-represented surfaces. was calculated.

抽出された3D形態計測測度は、特徴ベクトルの特徴の役割をした。一実施形態では、特徴ベクトルは各細胞核の測度を含む。具体的には、各細胞核の特徴には、細胞核の体積、細胞核の表面積、細胞核の平均曲率、細胞核の形状指数、細胞核の屈曲指数、および細胞核のフラクタル次元が含まれる。次いで、特徴ベクトルを使用して、いくつかの機械学習分類器を、例えばオープンソースのPythonパッケージscikit-learn 0.17.0を使用して訓練する。分類アルゴリズムの挙動を改善するために、データの前処理には、ゼロ平均と単位分散への変数の標準化および、個々の標本をユニタリノルムへスケーリングするための正規化が含まれ、交差検証の各ステップで別々に、訓練用集合について計算される。 The extracted 3D morphometric measures served as features in the feature vector. In one embodiment, the feature vector contains measures for each cell nucleus. Specifically, the features of each nucleus include nucleus volume, nucleus surface area, nucleus mean curvature, nucleus shape index, nucleus curvature index, and nucleus fractal dimension. The feature vectors are then used to train several machine learning classifiers, eg using the open source Python package scikit-learn 0.17.0. To improve the behavior of the classification algorithm, preprocessing of the data included standardization of the variables to zero mean and unit variance, and normalization to scale individual samples to the unitary norm, allowing each of the cross-validation Computed on the training set separately in steps.

この実施形態例では、各細胞核について、形態計測測度を使用して細胞核小体データを総計した。例えば、細胞核ごとに検出された細胞核小体の数を、特徴ベクトルの個々の特徴として含めた。細胞核小体レベルの特徴を合成するために、さまざまな方法について調査した。それらには、カスタムな、細胞核レベルの相違メトリクスおよび、複数インスタンスの学習フレームワークが含まれる。最良の結果は、それぞれの形態計測測度の密度を推定することにより、各細胞核内の細胞核小体データを総計することによって得られた。各細胞核について、その中の細胞核小体にわたり、それぞれの形態計測測度について標本統計量(例えば、平均値、最小値、最大値、および高次モーメント)を計算した。これらの統計を使用して、対応する親の細胞核のシグネチャ特徴ベクトルを、全ての特徴ベクトルが同じ長さになるようにスケーリングした。これに応じて、各細胞核に少なくとも1つの細胞核小体が存在するように、内部に位置する細胞核小体がひとつも自動検出されなかった細胞核を、その後の解析から除外した。一般に、ひとつひとつの細胞の正しい分類(タイプ、ステージ、治療など)は、観察対象の細胞表現型の著しい母集団異種性に起因して、困難な課題である。例えば、同一の試料に「癌性」と「非癌性」の細胞表現型が絡み合い、密に混ざり合って含まれていたり、両方のクラスが、類似した形状またはサイズを呈するアポトーシス細胞を含んでいたりすることがある。試料の性質を考慮して、単一の細胞ではなく細胞集合の培養、標本作製および収集、分類を検討した。その根本的な理由は、アルゴリズムが試料内の少数の細胞の分類を誤ったとしても、大多数の細胞が正しく分類される限り、最終的な(細胞集合の)ラベルは正しく指定されることになるという観察に基づく。この方策を使用して、分類は、1組につき3~19個の範囲の細胞の小グループに対して行うのが好ましい。内部的交差検証の各フォールドの間、この小さな細胞集合を、反復回数1000のブートストラップ法によって無作為化した。 In this example embodiment, morphometric measures were used to aggregate nucleolus data for each cell nucleus. For example, the number of nucleoli detected per cell nucleus was included as an individual feature in the feature vector. Various methods were explored to synthesize features at the cell nucleolus level. They include custom, nuclear-level dissimilarity metrics and multi-instance learning frameworks. Best results were obtained by summing the nucleolus data within each cell nucleus by estimating the density of each morphometric measure. For each nucleus, sample statistics (eg, mean, minimum, maximum, and higher moments) were calculated for each morphometric measure across the nucleolus therein. Using these statistics, the signature feature vectors of the corresponding parental nuclei were scaled so that all feature vectors were of the same length. Accordingly, cell nuclei in which no internally located cell nucleolus was automatically detected were excluded from further analysis, such that at least one cell nucleolus was present in each cell nucleus. In general, the correct classification (type, stage, treatment, etc.) of each individual cell is a difficult task due to the significant population heterogeneity of observed cell phenotypes. For example, the same sample may contain a tangled and dense mixture of “cancerous” and “non-cancerous” cell phenotypes, or both classes may contain apoptotic cells exhibiting similar shapes or sizes. Sometimes it happens. Given the nature of the samples, culture, preparation and collection, sorting of cell clusters rather than single cells were considered. The rationale is that even if the algorithm misclassifies a small number of cells in the sample, as long as the majority of cells are correctly classified, the final (cell population) label will be correctly assigned. based on the observation that Using this strategy, sorting is preferably performed on small groups of cells ranging from 3 to 19 cells per set. During each fold of internal cross-validation, this small cell population was randomized by bootstrapping with 1000 replicates.

LONIパイプラインはニューロイメージングおよび生物情報科学ではポピュラーなツールだが、細胞バイオイメージ解析のコミュニティではこれまで見落とされてきた。本開示ではLONIパイプラインを使用して、複数ステップを合理化したプロトコルを実装した。このプロトコルはツールとソリューションの多様なセットに依存し、図6に示すように、LONIパイプラインのワークフローに継ぎ目なく接続する。俯瞰的に見ると、データの処理および解析のプロトコルの各ステップは入力と出力を提供する個別のモジュールとしてワークフロー内でラッピングされ、それにより、パイプラインはこれらの不可分モジュールを自動的に接続して管理することができる。その結果、分散型で大規模並列なプロトコル実装によって、何千もの細胞核および細胞核小体を同時に容易に処理することが可能になる。ワークフローは3Dオブジェクトの合計数、生物学的条件、または、実行中のインスタンスの数に依存しない。その理由は、ジョブスケジューリングとリソース割り当てとを含めたワークフロー設定が確定した後は、ワークフローの実行は完全に自動化されるからである。実行中、ワークフローは進捗に関するリアルタイム情報を研究者に提供し、研究者が個々のステップごとの中間結果を表示して、失敗したモジュールまたは特定のインスタンスを簡単に調べて再始動できるようにする。この実装形態は非常に柔軟性が高く、このワークフローに含まれる特定の規則に限定されるものではない。パラメータを調節し、また個々のモジュールを交換することによって、高いスループット能力を維持しながら広範囲のさまざまな実験に転用することができる。 The LONI pipeline is a popular tool in neuroimaging and bioinformatics, but has so far been overlooked in the cellular bioimaging community. This disclosure uses the LONI pipeline to implement a protocol that streamlines multiple steps. This protocol relies on a diverse set of tools and solutions, seamlessly connecting to the LONI pipeline workflow, as shown in FIG. At a high level, each step of the data processing and analysis protocol is wrapped in a workflow as a separate module that provides inputs and outputs, and the pipeline automatically connects these atomic modules together. can be managed. As a result, distributed and massively parallel protocol implementations can easily process thousands of cell nuclei and nucleoli simultaneously. The workflow does not depend on the total number of 3D objects, biological conditions, or number of running instances. The reason is that once the workflow settings, including job scheduling and resource allocation, are finalized, workflow execution is fully automated. During execution, the workflow provides the researcher with real-time information on progress and allows the researcher to view intermediate results for each individual step and easily inspect and restart failed modules or specific instances. This implementation is very flexible and is not limited to any particular rules contained in this workflow. By adjusting parameters and exchanging individual modules, it can be converted to a wide variety of experiments while maintaining high throughput capability.

このワークフローは、共有のために使用される形式、すなわち、16ビットの3D TIFFファイルとして、3チャネルの1024×1024×Zの3Dボリュームでデータを使用できるように構成される。各ボリュームは並列で個別に処理されて、入力データを全て解析するためにいくつのプロセスが必要かをワークフローが自動的に定めるようになっている。さらに、並列化されたワークフローは、必要に応じて分岐および縮約を自動的に行う。例えば、前処理から分割までは、ワークフローの実行はM個のプロセスを開始し、ここでMは入力ボリュームの数である。分割により複数の出力が生まれるので、このステップの後、ワークフローは自動的にM×[N,N,・・・,N]個のプロセスを開始し、ここで、Nxは入力ボリュームXから分割されたオブジェクト(例えば細胞核)の数である。後処理ステップで、分割されたオブジェクトの一部はキュレーションモジュールによってフィルタリングされ、その後の解析から除外される。ワークフローはプロセスの数をキュレーションに合格するマスクの数にまで自動的に減らし、個々のマスクについて個別に3D形状モデリングおよび形態計測的特徴の抽出が行われ、これにより、実験の計算時間を効率的に減らしながら、クラスタ上で最大1200までのジョブを同時に行うことができる。最後に、ワークフローは各個別のマスクから形態計測情報を収集し、結果表にまとめ、その結果表はさらに、分類アルゴリズムの入力として使用される。この能力によって、現代のコンピューテーションリソースを利用し、研究者を低レベルの設定の労務から解放し、実行プロセスの制御を簡単にし、プロセス全体にわたる再現可能性を向上させることができる。 This workflow is configured to make the data available in a 3-channel 1024x1024xZ 3D volume in the format used for sharing, ie a 16-bit 3D TIFF file. Each volume is processed individually in parallel, with the workflow automatically determining how many processes are required to parse all the input data. In addition, parallelized workflows automatically branch and collapse as needed. For example, from preprocessing to splitting, workflow execution initiates M processes, where M is the number of input volumes. After this step, the workflow automatically starts M×[N 1 , N 2 , . is the number of divided objects (eg cell nuclei). In a post-processing step, some of the segmented objects are filtered by the curation module and excluded from further analysis. The workflow automatically reduces the number of processes to the number of masks that pass curation, with separate 3D shape modeling and morphometric feature extraction for each mask, which saves experimental computational time. Up to 1200 jobs can be run concurrently on the cluster while reducing the number of jobs exponentially. Finally, the workflow collects morphometric information from each individual mask and summarizes it into a result table, which is then used as input for the classification algorithm. This ability takes advantage of modern computing resources, frees researchers from the labor of low-level settings, simplifies control of execution processes, and improves reproducibility across processes.

形状形態計測のメトリクスを検証するために、メトリクスをまず、人工的に生成した3Dマスクに適用した。scikit-image Pythonライブラリを使用して、立方体、八面体、球体、楕円体、および、中心が線形に整列した3つの重なり合う球体を表現する3Dソリッドを作成した。これらのオブジェクトを全て処理し、結果の形状形態計測測度を比較した。具体的には、対応する形状パラメータ(例えば、半径、サイズ)を使用して計算された、解析的に導出される(期待される)体積および表面積と、処理パイプラインワークフローによって報告された、コンピュータ計算により導出される体積および表面積との間に密接な関係があるか確認することが望ましい。その結果、球体および楕円体などの細胞核に類似した形状では、コンピュータ計算エラーは2%以内であった。立方体および八面体などの、より幾何学的なオブジェクトでは、計算エラーは6%以内であった。後者で増加したエラーは、特異点(例えば、平滑だが弁別不可能な表面境界)を解決するために形状頂点に適用されるメッシュ平滑化によって説明できる。さまざまなタイプの3Dオブジェクトの間の形状の差異の検出を実証するために、重なり合う複数の球体を、外接する複数の楕円体と比較した。予想されるように、球体では、楕円体と比較して、平均曲率および屈曲度の測度は低く、形状指数の値は高くなった。球体、楕円体、および重なり合う球体を比較すると、形状形態計測測度の漸進的で単調な傾斜が観察された。このシミュレーションによって、3Dオブジェクトのサイズおよび形状の特性を境界形状に基づいて正確に測定する能力が確認された。この能力は、機械学習ベースのオブジェクト分類の基礎を形成する。 To validate the shape morphometry metric, the metric was first applied to an artificially generated 3D mask. The scikit-image Python library was used to create 3D solids representing a cube, an octahedron, a sphere, an ellipsoid, and three overlapping spheres with linearly aligned centers. All these objects were processed and the resulting shape morphometric measures were compared. Specifically, the analytically derived (expected) volume and surface area calculated using the corresponding shape parameters (e.g. radius, size) and the computational It is desirable to check if there is a close relationship between the calculated volume and surface area. As a result, the computational error was within 2% for shapes similar to cell nuclei such as spheres and ellipsoids. For more geometric objects such as cubes and octahedra, the computational error was within 6%. The increased error in the latter can be explained by mesh smoothing applied to shape vertices to resolve singularities (eg, smooth but indistinguishable surface boundaries). To demonstrate the detection of shape differences between various types of 3D objects, overlapping spheres were compared with circumscribing ellipsoids. As expected, spheres had lower measures of mean curvature and tortuosity and higher values of shape index compared to ellipsoids. Comparing spheres, ellipsoids, and overlapping spheres, a gradual monotonic slope of shape morphometric measures was observed. This simulation confirmed the ability to accurately measure the size and shape characteristics of 3D objects based on their boundary shapes. This ability forms the basis for machine learning-based object classification.

選んだ形状形態計測測度を識別的な特徴として査定するために、単一の線維芽細胞核分類について、SPHARM係数と比較した。線維芽細胞(新生児男性)をATCCから購入し (BJ Fibro-blasts CRL-2522 normal)、G0/G1期 Serum Starvation(血清飢餓)プロトコルにかけた。このプロトコルによって得られる画像の状態すなわち表現型は、血清飢餓(SS)および増殖(PROLIF)によって同調させた細胞周期である。結果として、両方の手法で962の細胞マスクの処理に成功し、その内訳はPROLIFで466、SSで496であった。 To assess the chosen shape morphometric measure as a distinguishing feature, single fibroblast nuclear classification was compared with the SPHARM coefficient. Fibroblasts (neonatal male) were purchased from ATCC (BJ Fibro-blasts CRL-2522 normal) and subjected to G0/G1 phase Serum Starvation protocol. The imaging state or phenotype obtained by this protocol is cell cycle synchronized by serum starvation (SS) and proliferation (PROLIF). As a result, both approaches successfully processed 962 cell masks, of which 466 with PROLIF and 496 with SS.

方法を比較するために、細胞核のバイナリマスクを抽出した。形状形態計測測度を上記のとおりに計算した。SPHARM係数を得るために、まず、ポピュラーなSPHARM-MATツールボックス(CALDアルゴリズムを用いて表面再構築および球面パラメータ化を実施する)を使用し、続いて、オブジェクト表面を、球面調和に基づくl=13次(デフォルト設定)関数の完全集合へ展開し、最後に、対応する表面部分の間の距離の平方根を最小化するSHREC法を使用することによって、『Spherical mapping for processing of 3D closed surfaces』にL.Shenらが記載したとおりにSPHARM形状記述子を計算し、それを分類のための特徴ベクトルとして使用した。 To compare the methods, a binary mask of cell nuclei was extracted. Shape morphometric measures were calculated as described above. To obtain the SPHARM coefficients, we first use the popular SPHARM-MAT toolbox, which performs surface reconstruction and spherical parameterization using the CALD algorithm, and then transform the object surface into l= By expanding to the full set of thirteenth order (default setting) functions and finally using the SHREC method that minimizes the square root of the distance between the corresponding surface parts, we have obtained the "Spherical mapping for processing of 3D closed surfaces" L. We computed the SPHARM shape descriptor as described by Shen et al. and used it as the feature vector for classification.

オープンソースのPythonパッケージScikit-learn 0.17.0を採用して、いくつかの一般的に使用されている機械学習分類方法を、各方法にデフォルトパラメータを使用し、該当する場合は同一のランダムシードを使用して、抽出した特徴ベクトルについてテストした。5フォールドの交差検証技法を使用し、メトリックとして受信者動作特性曲線の下の面積(AUC)を使用して、性能を比較した。下記の表1に示すように、3D形状計測測度は、テスト対象の全てのアルゴリズムの使用において、SPHARM係数に匹敵する識別的性能を実証するだけでなく、それらを上回る性能が見られる。 The open-source Python package Scikit-learn 0.17.0 was adapted to test several commonly used machine learning classification methods using default parameters for each method and, where applicable, the same random The seed was used to test on the extracted feature vectors. Performance was compared using a 5-fold cross-validation technique and using area under the receiver operating characteristic curve (AUC) as the metric. As shown in Table 1 below, the 3D profilometry measure not only demonstrates discriminative performance comparable to, but outperforms the SPHARM coefficients in the use of all algorithms tested.


上記の細胞核および細胞核小体の両方の分割および形態計測的特徴抽出の後、線維芽細胞分類のデータ集合全体は、合計965の細胞核(SSが498、PROLIFが470)および、2181の細胞核小体(SSが1151、PROLIFが1030)で構成されていた。単一の分類器による最良の結果は、確率的勾配ブースティング分類器を使用して、ベース学習器1500個、決定木の最大深度9、学習率0.01、サブサンプリング率0.5、葉ノードの最小標本数3で達成された。ハイパーパラメータを、交差検証を併用したグリッドサーチで微調整した。これらの分類結果を評価するために、7フォールドの内部的・統計的な交差検証をランダムに10回繰り返して、正解率、適合率、感度およびAUCを測定した。その結果を、単一細胞および細胞9個の集合の分類について表2に示す。 After segmentation and morphometric feature extraction of both cell nuclei and nucleoli as described above, the entire fibroblast classification data set contains a total of 965 nuclei (498 for SS and 470 for PROLIF) and 2181 nucleoli. (SS is 1151, PROLIF is 1030). The best results with a single classifier were obtained using a stochastic gradient boosting classifier with 1500 base learners, maximum decision tree depth of 9, learning rate of 0.01, subsampling rate of 0.5, leaf A minimum sample size of 3 nodes was achieved. Hyperparameters were fine-tuned by grid search combined with cross-validation. To evaluate these classification results, 7-fold internal statistical cross-validation was randomly repeated 10 times to measure accuracy, precision, sensitivity and AUC. The results are shown in Table 2 for the classification of single cells and clusters of 9 cells.

図7Aは、サイズが3~19である細胞集合について平均AUC値を示す。細胞9個の集合で分類を行った場合は95%、15個以上の細胞集合では98%の正解率が得られた。勾配ブースティング分類器はさらに、交差検証済みの特徴重要度を計算し、図7Bに示すとおりの結果が報告される。2つの細胞状態の間でどの測度が著しく異なるかをこれらの図から評価することができ、また、新規性のある研究仮説を提案し、予想されるデータを使用してテストできる可能性がある。SS線維芽細胞とPROLIFを識別するためには、細胞核の形態計測的特徴(上位3つ)および細胞核小体の形態計測的特徴(上位10のうち5つ)の両方が高い重要性をもつことが報告された。細胞核小体の形状形態計測の統計のうちモーメントが高いものは、おそらく標本サイズが小さすぎるために(ほとんどの細胞が細胞核あたり1~3個しか細胞核小体をもたない)、分類にあまり寄与しないので、特徴の選択時に特徴リストから削除した。 FIG. 7A shows average AUC values for cell populations ranging in size from 3-19. An accuracy rate of 95% was obtained when a group of 9 cells was classified, and an accuracy rate of 98% was obtained for a group of 15 or more cells. The gradient boosting classifier also computes cross-validated feature importance and results are reported as shown in FIG. 7B. Which measures differ significantly between the two cell states can be assessed from these figures, and novel research hypotheses may be proposed and tested using the prospective data. . Both nuclear morphometric features (top 3) and nucleolus morphometric features (top 5 of 10) are of high importance for distinguishing SS fibroblasts from PROLIF was reported. The nucleolus shape morphometric statistics with high moments contribute less to the classification, probably because the sample size is too small (most cells have only 1-3 nucleoli per nucleus). Since it does not, it was removed from the feature list when selecting features.

悪性の癌細胞は、転移への進行の過程の間に、純粋上皮および純粋間葉によって囲まれた複数の中間的表現型状態の間で一連の可逆移行を経験する。前立腺癌におけるこれらの移行は、細胞核構造体の定量化可能な変化に関連する。前立腺癌細胞株P3の顕微鏡スライドを、上皮(EPI)および間葉転換(EMT)の2つの表現型状態で培養した。導出されたデータセットは、458個の細胞核(EPIが310、EMTが148)および、1101個の細胞核小体(EPIが649、EMTが452)マスクで構成されていた。2つのクラスの間の標本サイズの不均衡を、無作為一様サブサンプリングを使用して解決した。7フォールドの交差検証プロセスのそれぞれで、訓練用集合には最多で250個の細胞、テストデータには最多で40個の別の細胞が存在していた。 Malignant cancer cells undergo a series of reversible transitions between multiple intermediate phenotypic states surrounded by pure epithelium and pure mesenchyme during the process of metastatic progression. These transitions in prostate cancer are associated with quantifiable changes in nuclear structures. Microscopic slides of prostate cancer cell line P3 were cultured in two phenotypic states: epithelial (EPI) and mesenchymal transition (EMT). The derived dataset consisted of 458 nuclei (310 EPI, 148 EMT) and 1101 nucleolus (649 EPI, 452 EMT) masks. The sample size imbalance between the two classes was resolved using random uniform subsampling. There were up to 250 cells in the training set and up to 40 different cells in the test data for each of the 7-fold cross-validation processes.

この事例では、単一の分類器による最良の分類は、ランダムフォレストモデル(決定木の数1000、決定木の最大深度12、最良の分割を行うための最大の特徴数40%)を適用した結果であった。ハイパーパラメータの微調整、正解度のメトリクス、交差検証手順は、上記の線維芽細胞実験で報告したものと同じとした。ここでも同様に、線維芽細胞の分類に対して、細胞9個の分類用集合は95.4%の平均正解率を達成し、細胞が15個以上の集合では95.4%に向上した(表3参照)。図8Aは、さまざまなサイズのグループのAUCを示し、細胞集合のサイズが大きくなるにつれて分類の正解率が向上し、細胞が13個の集合では98%に達することがわかる。この実験ではさらに、分類器から報告された特徴の重要度も調査した。この分類における上位10の重要な特徴には、細胞核の形状形態計測の特徴(上位10のうち3つ、そのうち2つは線維芽細胞での上位2つ)および、細胞核小体の形状形態計測の特徴(上位5つ)が含まれていた。 In this case, the best classification with a single classifier is the result of applying a random forest model (number of decision trees 1000, maximum depth of decision trees 12, maximum number of features for best split 40%) Met. Hyperparameter fine-tuning, accuracy metrics, and cross-validation procedures were the same as reported for the fibroblast experiments above. Again, for fibroblast classification, the 9-cell classification set achieved an average accuracy rate of 95.4%, which improved to 95.4% for sets of 15 or more cells ( See Table 3). FIG. 8A shows the AUC of different size groups, and it can be seen that the accuracy of classification increases with the size of the cell population, reaching 98% for the population of 13 cells. This experiment also investigated the feature importance reported by the classifier. The top 10 significant features in this classification include nuclear shape morphometric features (3 of the top 10, 2 of which are the top 2 in fibroblasts) and nucleolus shape morphometric features. Features (top 5) were included.

本開示では、細胞タイプまたは治療状態の3Dモデリング、形態特徴の抽出、および分類のための、高スループットでほぼ自動化された(人間参加型)ソリューションを提供するプロトコルを提示する。2D投影を使用した他の研究と比較して、この手法は3D空間内でネイティブに動作し、また、根底にある実際の細胞核および細胞核小体の幾何学形態をよりよく表現して人間による解釈を簡単にする、内在的および外在的な形態計測的測度を利用する。ロバストな表面再構築によって3Dオブジェクト境界の正確な近似が可能になり、それを人工的なデータで検証した。本明細書で提案する形状計測測度は、別のポピュラーな手法を性能で上回り、さまざまな細胞タイプ、状態、さらにはドメインにわたってその汎用性を実証した。 This disclosure presents a protocol that provides a high-throughput, near-automated (human-involved) solution for 3D modeling, morphological feature extraction, and classification of cell types or therapeutic states. Compared to other studies using 2D projections, this technique operates natively in 3D space and also better represents the underlying real cell nucleus and nucleolus geometries for human interpretation. Make use of intrinsic and extrinsic morphometric measures that simplify Robust surface reconstruction allowed for accurate approximation of 3D object boundaries, which was verified with artificial data. The shape metrology measure proposed here outperforms another popular approach, demonstrating its versatility across different cell types, states, and even domains.

最終的に得られる開始から終了までのプロトコルは並列性が高く、そのスループットは事実上、計算ノードの数によって制限されるので、人間の介入の必要を最小限に抑えながら何千ものオブジェクトを同時に処理することができる。このパイプラインワークフローは、さまざまなデータ処理および解析のステップに、バイオイメージ解析ソフトウェアの多様性を利用し、いくつかのオープンソースツールを統合する。ワークフローのモジュール性によって、再利用可能性が高まり、変更が容易になる。このことによって、細胞、細胞核の多様な配列の解析を必要とする他の目的または他の研究のために、同じワークフローを使用したり、それをカスタム化して拡張したりすることができる(例えば、新しいデータセットの仕様、特定の不可分モジュールの交換など)。LONIパイプラインを通したライブデモによって、使用の簡易さ、および並列データ処理の高い効率が実証される。 The resulting start-to-end protocol is highly parallel, and its throughput is effectively limited by the number of computational nodes, allowing thousands of objects to run simultaneously with minimal need for human intervention. can be processed. This pipeline workflow utilizes the diversity of bioimage analysis software and integrates several open source tools for various data processing and analysis steps. The modularity of workflows makes them more reusable and easier to change. This allows the same workflow to be used or customized and extended for other purposes or other studies requiring analysis of diverse arrays of cells, cell nuclei (e.g. specification of new datasets, replacement of certain atomic modules, etc.). A live demonstration through the LONI pipeline demonstrates the ease of use and high efficiency of parallel data processing.

結果の再現可能性を促進し、オープンサイエンス的な開発を円滑化し、共同検証を可能にするために、公開共有されている2つの細胞株について3D画像化データを作成した。この3D画像化データセットは、このタイプの公開されているデータセットのうち最大級のひとつである(最多で1500の細胞核マスクおよび最多で2700の細胞核小体マスクを有する、3チャネルの元データを含む)。これらのデータについての、上皮性と間葉性のヒト前立腺癌細胞株の比較および、血清飢餓と増殖の線維芽細胞株の比較の分類結果により、3D形態計測を使用した細胞タイプの予測の正解率が、特に細胞の集合に適用したときに高いことが実証された。異なる実験には異なる分類アルゴリズムが最適であると思われるが、細胞核と細胞核小体の両方の形態計測測度が治療状態または細胞表現型の識別について重要な特徴であることが観察された。線維芽細胞の分類の場合、その結果は、細胞核形態計測、細胞核あたりの細胞核小体の数、および、さまざまな内部細胞小体の形態計測測度が重要であることを示す。PC3細胞では、上位の重要な分類特徴は、細胞核のサイズおよび形状に加えて、さまざまな細胞核小体の形態計測測度の分布のモーメントであった。興味深いことに、両方の細胞株について、上位10の重要な形態計測的特徴の中には共通のものが3つあった。このことにより、この方法が、基準の組み合わせを使用して細胞を正しく分類するために細胞の形から妥当な情報を抽出するという、上記で報告された観察が確認され、実証される。 To facilitate reproducibility of results, facilitate open-science development, and enable collaborative validation, we generated 3D imaging data for two publicly shared cell lines. This 3D imaging dataset is one of the largest published datasets of this type (3-channel raw data with up to 1500 nucleus masks and up to 2700 nucleolus masks). include). Classification results of these data comparing epithelial vs. mesenchymal human prostate cancer cell lines and comparing serum starved vs. proliferating fibroblast cell lines demonstrated the correct prediction of cell type using 3D morphometry. The rate was demonstrated to be high, especially when applied to aggregates of cells. Although different classification algorithms may be optimal for different experiments, we observed that morphometric measures of both cell nuclei and nucleoli are important features for distinguishing treatment status or cell phenotype. For fibroblast classification, the results show that nuclear morphometry, number of nucleoli per nucleus, and various inner cell morphometric measures are important. In PC3 cells, the top important classification feature was the moment of distribution of various nucleolus morphometric measures, in addition to the size and shape of the cell nucleus. Interestingly, 3 of the top 10 important morphometric features were common for both cell lines. This confirms and demonstrates the observation reported above that this method extracts relevant information from cell shape to correctly classify cells using a combination of criteria.

提案する手法は拡張可能で、さまざまな複雑で大規模な3D画像データを前処理することができ、かつ、細胞核および細胞核小体の形状に限定されない。この方法は、いくつかの変更によって、興味対象である他の細胞および細胞核要素に適用することができる。ロバストな平滑面再構築は、どのような3D形状にも、位相が球面様である限り、直接適用することができる。分子レベルの技法と併せて、この3D形状形態計測ワークフローは、4Dヌクレオームの、空間的かつ時間的な枠組みの中でのDNA構造の調査のために、強力な組み合わせを形成することができる。このワークフローの考え得る将来の適用例の一例は、非対称の細胞分裂である。幹細胞および前駆細胞は自己複製能力によって特徴付けられ、分化した子孫を生じる。統制された非対称分化によって、これらの過程の間に、あるバランスが得られ、このバランスは、成長期に細胞の多様性を生み出すため、および、成体組織の恒常性を維持するために不可欠である。このバランスを崩すと、幹細胞/前駆細胞プールの早期消耗、すなわち、異常成長につながることがある。多くの組織において、非対称分化の調節異常は癌と関連する。非対称分化の欠陥と前癌病変の間に偶発的な関連性が存在するか否かは知られていない。この形状解析パイプラインは、形態形成および前癌病変の4Dヌクレオーム位相の研究に役立つであろうと予想される。 The proposed approach is scalable, can preprocess various complex and large-scale 3D image data, and is not limited to the shape of cell nuclei and nucleoli. This method can be applied to other cell and cell nuclear elements of interest with some modifications. Robust smooth surface reconstruction can be directly applied to any 3D shape as long as the phase is spherical-like. In conjunction with molecular-level techniques, this 3D shape morphometric workflow can form a powerful combination for interrogation of DNA structure within the spatial and temporal framework of the 4D nucleome. An example of a possible future application of this workflow is asymmetric cell division. Stem and progenitor cells are characterized by the ability to self-renew and give rise to differentiated progeny. Controlled asymmetric differentiation provides a balance between these processes that is essential for generating cellular diversity during development and for maintaining adult tissue homeostasis. . Disruption of this balance can lead to premature exhaustion of the stem/progenitor cell pool, ie, abnormal growth. In many tissues, dysregulation of asymmetric differentiation is associated with cancer. It is not known whether there is a fortuitous link between defects in asymmetric differentiation and precancerous lesions. It is expected that this shape analysis pipeline will aid in the study of 4D nucleomic phases of morphogenesis and precancerous lesions.

検体採取、画像取得、データ前処理、導出されるバイオマーカの計算、モデル化、分類、および解析のプロセスを自動化する能力により、臨床的意思決定および細胞変改の基礎調査に著しい影響を与えることができる。これは、3D細胞核形状モデリングと、ロバストな平滑面再構築および形状形態計測測度とを組み合わせて、何千もの細胞核および細胞核小体の3Dでの形態学的解析の開始から終了までにわたる高度に並列的なパイプラインワークフローを作り出す、初めての試みであると思われる。この手法は画像データ内の細胞形状を効率的かつ有益に評価することができ、生物医学コミュニティで検証、修正、転用することのできる再現可能な技法を表す。これにより、結果の再現可能性、方法の共同検証、および、広範な知識普及が促進される。 The ability to automate the process of specimen collection, image acquisition, data pre-processing, derived biomarker calculation, modeling, classification, and analysis to significantly impact clinical decision-making and the fundamental investigation of cellular alterations can be done. It combines 3D cell nuclear shape modeling with robust smooth surface reconstruction and shape morphometric measures for highly parallel start-to-end morphological analysis of thousands of cell nuclei and nucleoli in 3D. It seems to be the first attempt to create a typical pipeline workflow. This approach can efficiently and informatively assess cell shape within image data, and represents a reproducible technique that can be validated, modified, and transferred in the biomedical community. This facilitates reproducibility of results, joint validation of methods, and widespread knowledge dissemination.

本明細書に記載の技法の複数の部分は、1つまたは複数のプロセッサによって実行される1つまたは複数のコンピュータプログラムによって実施されてもよい。このコンピュータプログラムには、非一時的で有形のコンピュータ可読媒体に記憶された、プロセッサ実行可能命令が含まれる。このコンピュータプログラムはまた、記憶されたデータを含む。非一時的で有形のコンピュータ可読媒体の非限定的な例には、不揮発性メモリ、磁気記憶装置、光学記憶装置が含まれる。 Portions of the techniques described herein may be implemented by one or more computer programs executed by one or more processors. The computer program includes processor-executable instructions stored on a non-transitory, tangible computer-readable medium. This computer program also includes stored data. Non-limiting examples of non-transitory, tangible computer-readable media include non-volatile memory, magnetic storage, and optical storage.

上記の説明のいくつかの部分は、本明細書に記載されている技法を、情報に対する操作のアルゴリズムおよび記号表現の観点から提示する。これらのアルゴリズム記述および表現は、データ処理技術の当業者がその成果の内容を他の当業者に最も効果的に伝えるために使用する手段である。これらの操作は、機能または論理に即して記載されているが、コンピュータプログラムによって実施されることが理解される。さらに、時には、複数操作から成る編成を、一般性を失うことなくモジュールまたは機能名で呼ぶと便利であることが明らかになっている。 Some portions of the above description present the techniques described herein in terms of algorithms and symbolic representations of operations on information. These algorithmic descriptions and representations are the means used by those skilled in the data processing arts to most effectively convey the substance of their work to others skilled in the art. These operations, although described in terms of function or logic, are understood to be implemented by computer programs. Furthermore, it has proven convenient at times to refer to the organization of operations by module or function names without loss of generality.

特に記述のない限り、本記載の全体にわたり、「処理」、「コンピュータ計算」、「計算」、「判断」、「表示」などの用語を使用した考察は、コンピュータシステムメモリもしくはレジスタなどの情報記憶装置、送信装置または表示装置内に物理的(電子的)数量として表現されたデータを操作および変換するコンピュータシステムまたは類似の電子コンピューティング装置の動作またはプロセスを指すことが、上記の考察から明らかである。 Unless otherwise stated, throughout this description, discussion using terms such as "processing", "computing", "calculating", "determining", "displaying" refers to information storage, such as computer system memory or registers. It should be clear from the above discussion that it refers to the operations or processes of a computer system or similar electronic computing device that manipulates and transforms data represented as physical (electronic) quantities in a device, transmitter or display device. be.

記載される技法の一定の態様には、本明細書にアルゴリズムの形で記載されるプロセスステップおよび命令を含む。留意すべきことは、記載されるプロセスステップおよび命令がソフトウェア、ファームウェア、またはハードウェアで具体化されてもよく、ソフトウェアで具体化される場合には、リアルタイムのネットワークオペレーティングシステムによって使用される多様なプラットフォームにダウンロードされて常駐し、それらのプラットフォームから操作されてもよいことである。 Certain aspects of the described techniques include process steps and instructions described herein in algorithmic form. It should be noted that the process steps and instructions described may be embodied in software, firmware, or hardware, and if embodied in software, may be implemented in a variety of applications used by real-time network operating systems. It may be downloaded and reside on platforms and operated from those platforms.

本開示はさらに、本明細書に記載の操作を行うための装置に関する。この装置は必要な目的のために専用に構築されていてもよいし、または、コンピュータプログラムによって選択的に有効化または再設定することのできるコンピュータを含み、そのコンピュータプログラムが、そのコンピュータによってアクセス可能なコンピュータ可読媒体に記憶されていてもよい。そのようなコンピュータプログラムは、有形のコンピュータ可読記憶媒体に記憶されていてもよく、それらの媒体は、フロッピーディスク、光ディスク、CD-ROM、光磁気ディスクを含む任意のタイプのディスク、読み出し専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、EPROM、EEPROM、磁気もしくは光学カード、特定用途向け集積回路(ASIC)、または電子的命令を記憶するために適した任意の媒体などであるが、これらに限定されず、それぞれがコンピュータシステムバスに結合される。さらに、本明細書で称するコンピュータは、単一のプロセッサを含んでもよいし、または、コンピューティング能力を向上させるためにマルチプロセッサ設計を採用したアーキテクチャであってもよい。 The present disclosure further relates to apparatus for performing the operations herein. This apparatus may be specially constructed for the required purposes, or it may contain a computer which can be selectively activated or reconfigured by a computer program, which computer program is accessible by the computer. may be stored on any computer-readable medium. Such computer programs may be stored on tangible computer-readable storage media, which may be any type of disk including floppy disks, optical disks, CD-ROMs, magneto-optical disks, read-only memory ( ROM), random access memory (RAM), EPROM, EEPROM, magnetic or optical cards, application specific integrated circuits (ASICs), or any medium suitable for storing electronic instructions. and each is coupled to a computer system bus. Further, the computers referred to herein may include a single processor, or may be architectures employing multi-processor designs for increased computing power.

本明細書に提示されるアルゴリズムおよび操作は、元来、どのような特定のコンピュータまたは他の装置にも関係しない。また、さまざまなシステムを本明細書の教示によるプログラムと共に使用してもよく、必要な方法ステップを行うために、さらに専用化した装置を構築すると便利であることが明らかな場合もある。これらのさまざまなシステムに必要な構造は、等価な変形形態と共に、当業者には明らかになる。加えて、本開示の記載において、どのような特定のプログラミング言語も考慮されていない。本開示の技法を本明細書の記載のとおりに実施するために、さまざまなプログラミング言語を使用してもよいことが理解される。 The algorithms and operations presented herein are not inherently related to any particular computer or other apparatus. Additionally, various systems may be used with programs in accordance with the teachings herein, and it may prove convenient to construct more specialized apparatus to perform the required method steps. The required structure, along with equivalent variations, for a variety of these systems will be apparent to those skilled in the art. Additionally, no particular programming language is considered in the description of this disclosure. It will be appreciated that a variety of programming languages may be used to implement the techniques of this disclosure as described herein.

上記の実施形態の記載は説明の目的で提供されており、網羅または本開示の制限を意図するものではない。特定の実施形態の個々の要素または特徴は一般に、その特定の実施形態に限定されず、該当する場合には、特に図示または記載されていなくても交換可能であり、選択された実施形態で使用することができる。また、特定の実施形態の個々の要素または特徴は、多数の様式に変形されてもよい。そのような変形形態は本開示からの逸脱とみなされるものではなく、そのような修正は全て本開示の範囲に含まれるものと意図される。 The above description of embodiments has been provided for purposes of illustration and is not intended to be exhaustive or limiting of the present disclosure. Individual elements or features of a particular embodiment are generally not limited to that particular embodiment and, where applicable, are interchangeable even if not specifically shown or described and used in selected embodiments. can do. Also, individual elements or features of a particular embodiment may be varied in numerous ways. Such variations are not considered a departure from the present disclosure and all such modifications are intended to be included within the scope of the present disclosure.

Claims (21)

生体組織及び細胞を解析するための自動化された方法において、
細胞分類の2以上のモデルを記憶する段階であって、該2以上のモデルの各々は、既知の生物学的試料からの成分の形およびサイズを表す、前記2以上のモデルを記憶する工程と、
生体試料の成分を染色する工程であって、前記生体試料が、少なくとも1つの細胞を含有する組織または細胞の培養物を含む、染色する工程と、
前記生体試料の画像データを受け取る工程であって、前記画像データが前記生体試料の3次元表現を提供する、画像データを受け取る工程と、
前記画像データ内の少なくとも1つの細胞または細胞内の細胞器官もしくは要素をラベル付する工程と、
前記画像データ内の、ラベル付けされた細胞または細胞内の細胞器官もしくは要素のそれぞれについて、染色体テリトリー、位相的会合性ドメイン(TDA)、ラミナ会合性ドメイン(LAD)、またはテロメアの境界を含め、細胞核を画定する境界の数学的表現を前記画像データから構築する工程と、
前記ラベル付けされた細胞または細胞内の細胞器官もしくは要素のそれぞれについて、前記細胞核を画定する境界の前記数学的表現を使用して、前記ラベル付けされた細胞または細胞内の細胞器官もしくは要素の形状およびサイズの測度である特徴を抽出する工程と、
前記ラベル付けされた細胞または細胞内の細胞器官もしくは要素の前記抽出された特徴を、前記記憶されているモデルと比較することによって、前記生体試料を分類する工程とを含む、方法。
In an automated method for analyzing living tissue and cells,
storing two or more models of cell classification, each of the two or more models representing the shape and size of a component from a known biological sample; ,
staining a component of a biological sample, said biological sample comprising a tissue or cell culture containing at least one cell;
receiving image data of the biological sample, the image data providing a three-dimensional representation of the biological sample;
labeling at least one cell or subcellular organelle or element within the image data;
for each labeled cell or subcellular organelle or element within said image data, including a chromosomal territory, a topologically associated domain (TDA), a lamina associated domain (LAD), or a telomere boundary; constructing from the image data a mathematical representation of boundaries defining cell nuclei;
for each of said labeled cells or organelles or elements within said cells, using said mathematical representation of the boundary defining said cell nucleus, shape of said labeled cells or organelles or elements within said cells; and extracting features that are measures of size;
and classifying the biological sample by comparing the extracted features of the labeled cells or organelles or elements within cells to the stored model.
前記画像データを、3次元画像取得技法を使用して生成する工程をさらに含む、請求項1に記載の方法。 2. The method of claim 1, further comprising generating said image data using a three-dimensional image acquisition technique. 前記成分をラベル付けする工程が、前記画像データを前記成分を表すボリュームに分割する工程をさらに含む、請求項1に記載の方法。 2. The method of claim 1, wherein labeling the components further comprises dividing the image data into volumes representing the components. 前記数学的表現を構築する工程が、反復的なラプラス・ベルトラミ固有投影および境界変形を使用することをさらに含む、請求項1に記載の方法。 2. The method of claim 1, wherein constructing the mathematical representation further comprises using iterative Laplace-Betrami eigenprojections and boundary deformations. 前記ラベル付けされた細胞または細胞内の細胞器官もしくは要素から抽出される前記特徴が、ラベル付けされた細胞または細胞内の細胞器官もしくは要素の体積、ラベル付けされた細胞または細胞内の細胞器官もしくは要素の表面積、ラベル付けされた細胞または細胞内の細胞器官もしくは要素の平均曲率、ラベル付けされた細胞または細胞内の細胞器官もしくは要素の形状指数、ラベル付けされた細胞または細胞内の細胞器官もしくは要素の湾曲指数、および、ラベル付けされた細胞または細胞内の細胞器官もしくは要素のフラクタル次元のうち、決定に関わる1つまたは複数を含む、請求項1に記載の方法。 The feature extracted from the labeled cell or intracellular organelle or element is the volume of the labeled cell or intracellular organelle or element, the labeled cell or intracellular organelle or element surface area of the element, mean curvature of the labeled cell or subcellular organelle or element, shape index of the labeled cell or subcellular organelle or element, labeled cell or subcellular organelle or 2. The method of claim 1, comprising determining one or more of the curvature index of the element and the fractal dimension of the labeled cell or organelle or element within the cell. 前記生体試料を、ランダムフォレスト分類法を使用して分類する工程をさらに含む、請求項1に記載の方法。 2. The method of claim 1, further comprising classifying the biological sample using a random forest taxonomy. 前記生体試料を、線形分類器、k近傍法、決定木法、ニューラルネットワーク、およびサポートベクターマシンから成るグループから選択される分類方法を使用して分類する工程をさらに含む、請求項1に記載の方法。 2. The method of claim 1, further comprising classifying the biological sample using a classification method selected from the group consisting of linear classifiers, k-nearest neighbors, decision trees, neural networks, and support vector machines. Method. 前記生体試料が3つ以上の細胞を含有する場合にのみ、前記生体試料を分類する工程を含む、請求項1に記載の方法。 2. The method of claim 1, comprising sorting the biological sample only if the biological sample contains three or more cells. フィブリラリン抗体、臭化エチジウム、および4’,6-ジアミジノ-2-フェニルインドールのうちの1つの、細胞または細胞内細胞器官もしくは要素のためのラベルを使用して、前記生体試料の成分を染色する、請求項1に記載の方法。 staining a component of said biological sample using a label for cells or subcellular organelles or elements of one of fibrillarin antibodies, ethidium bromide, and 4',6-diamidino-2-phenylindole. A method according to claim 1. 前記生体試料が細胞培養または細胞組織からのものである、請求項1に記載の方法。 2. The method of claim 1, wherein said biological sample is from cell culture or tissue. 生体組織を解析するための自動化された方法において、
細胞分類の2以上のモデルを記憶する段階であって、該2以上のモデルの各々は、既知の生物学的試料からの成分の形およびサイズを表す、前記2以上のモデルを記憶する工程と、
少なくとも1つの細胞を含有する、生体試料の成分を染色する工程と、
前記生体試料の画像データを受け取る工程であって、前記画像データが前記生体試料の3次元表現を提供する、画像データを受け取る工程と、
前記画像データ内の少なくとも1つの細胞の細胞核および細胞核小体をラベル付する工程と、
前記画像データ内の、ラベル付けされた細胞核のそれぞれについて、細胞核を画定する境界の数学的表現を前記画像データから構築する工程と、
前記ラベル付けされた細胞核のそれぞれについて、前記細胞核を画定する境界の前記数学的表現を使用して、前記ラベル付けされた細胞核の形状およびサイズの測度である特徴を抽出する工程と、
ラベル付けされた細胞核小体のそれぞれについて、細胞核小体を画定する境界の数学的表現を前記画像データから構築する工程と、
前記ラベル付けされた細胞核小体のそれぞれから、前記細胞核小体を画定する境界の前記数学的表現を使用して、前記ラベル付けされた細胞核小体の形状およびサイズの測度である特徴を抽出する工程と、
前記ラベル付けされた細胞核および前記ラベル付けされた細胞核小体の前記抽出された特徴を、前記記憶されているモデルと比較することによって、前記生体試料を分類する工程とを含む、方法。
In an automated method for analyzing biological tissue,
storing two or more models of cell classification, each of the two or more models representing the shape and size of a component from a known biological sample; ,
staining a component of a biological sample containing at least one cell;
receiving image data of the biological sample, the image data providing a three-dimensional representation of the biological sample;
labeling nuclei and nucleoli of at least one cell in the image data;
constructing from the image data, for each labeled cell nucleus in the image data , a mathematical representation of boundaries defining a cell nucleus;
extracting, for each of the labeled nuclei, features that are measures of the shape and size of the labeled nuclei using the mathematical representation of the boundaries that define the nuclei;
constructing from the image data , for each labeled cell nucleolus, a mathematical representation of boundaries defining the cell nucleolus;
extracting from each of the labeled cell nucleoli a feature that is a measure of the labeled cell nucleolus shape and size using the mathematical representation of the boundaries defining the cell nucleolus process and
and classifying the biological sample by comparing the extracted features of the labeled nuclei and the labeled nucleoli with the stored model.
前記画像データを、共焦点顕微鏡を使用して生成する工程をさらに含む、請求項11に記載の方法。 12. The method of claim 11, further comprising generating said image data using a confocal microscope. 前記成分をラベル付けする工程が、前記画像データを前記成分を表すボリュームに分割する工程をさらに含む、請求項11に記載の方法。 12. The method of claim 11, wherein labeling the components further comprises dividing the image data into volumes representing the components. 前記数学的表現を構築する工程が、反復的なラプラス・ベルトラミ固有投影および境界変形を使用する工程をさらに含む、請求項11に記載の方法。 12. The method of claim 11, wherein constructing the mathematical representation further comprises using iterative Laplace-Betrami eigenprojections and boundary deformations. 前記ラベル付けされた細胞核から抽出される前記特徴が、ラベル付けされた細胞核の体積、ラベル付けされた細胞核の表面積、ラベル付けされた細胞核の平均曲率、ラベル付けされた細胞核の形状指数、ラベル付けされた細胞核の湾曲指数、およびラベル付けされた細胞核のフラクタル次元のうち、決定に関わる1つまたは複数を含む、請求項11に記載の方法。 The features extracted from the labeled cell nuclei are volume of the labeled cell nucleus, surface area of the labeled cell nucleus, mean curvature of the labeled cell nucleus, shape index of the labeled cell nucleus, labeling 12. The method of claim 11, comprising determining one or more of the curvature index of the labeled cell nucleus and the fractal dimension of the labeled cell nucleus. 前記ラベル付けされた細胞核小体から抽出される前記特徴が、対応する細胞核内の細胞核小体の数、ラベル付けされた細胞核小体の体積、ラベル付けされた細胞核小体の表面積、ラベル付けされた細胞核小体の平均曲率、ラベル付けされた細胞核小体の形状指数、ラベル付けされた細胞核小体の湾曲指数、およびラベル付けされた細胞核小体のフラクタル次元のうち、決定に関わる1つまたは複数を含む、請求項15に記載の方法。 The features extracted from the labeled cell nucleolus are the number of cell nucleoli in the corresponding cell nucleus, the volume of the labeled cell nucleolus, the surface area of the labeled cell nucleolus, the labeled one or 16. The method of claim 15, comprising a plurality. 前記生体試料を、ランダムフォレスト分類法を使用して分類する工程をさらに含む、請求項11に記載の方法。 12. The method of claim 11, further comprising classifying the biological sample using a random forest taxonomy. 前記生体試料を、線形分類器、k近傍法、決定木法、ニューラルネットワーク、およびサポートベクターマシンから成るグループから選択される分類方法を使用して分類する工程をさらに含む、請求項11に記載の方法。 12. The method of claim 11, further comprising classifying the biological sample using a classification method selected from the group consisting of linear classifiers, k-nearest neighbors, decision trees, neural networks, and support vector machines. Method. 前記生体試料が3つ以上の細胞を含有する場合にのみ、前記生体試料を分類する工程をさらに含む、請求項11に記載の方法。 12. The method of claim 11, further comprising sorting the biological sample only if the biological sample contains three or more cells. フィブリラリン抗体、臭化エチジウム、および4’,6-ジアミジノ-2-フェニルインドールのうちの1つを使用して前記生体試料の成分を染色する、請求項11に記載の方法。 12. The method of claim 11, wherein one of a fibrillarin antibody, ethidium bromide, and 4',6-diamidino-2-phenylindole is used to stain a component of the biological sample. 前記生体試料が細胞培養したものである、請求項11に記載の方法。
12. The method of claim 11, wherein the biological sample is cell cultured.
JP2020544195A 2018-02-20 2019-02-19 3D image analysis of cells and tissues for cellular and intracellular morphological modeling and classification Active JP7336806B2 (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862632663P 2018-02-20 2018-02-20
US62/632,663 2018-02-20
US16/277,128 2019-02-15
US16/277,128 US10915729B2 (en) 2018-02-20 2019-02-15 Three-dimensional cell and tissue image analysis for cellular and sub-cellular morphological modeling and classification
PCT/US2019/018617 WO2019164850A1 (en) 2018-02-20 2019-02-19 Three-dimensional cell and tissue image analysis for cellular and sub-cellular morphological modeling and classification

Publications (2)

Publication Number Publication Date
JP2021514468A JP2021514468A (en) 2021-06-10
JP7336806B2 true JP7336806B2 (en) 2023-09-01

Family

ID=67616867

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020544195A Active JP7336806B2 (en) 2018-02-20 2019-02-19 3D image analysis of cells and tissues for cellular and intracellular morphological modeling and classification

Country Status (8)

Country Link
US (1) US10915729B2 (en)
EP (1) EP3756167A4 (en)
JP (1) JP7336806B2 (en)
CN (1) CN111886630A (en)
AU (1) AU2019223959B2 (en)
CA (1) CA3091935A1 (en)
SG (1) SG11202007982VA (en)
WO (1) WO2019164850A1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020092590A1 (en) * 2018-10-30 2020-05-07 Allen Institute Segmenting 3d intracellular structures in microscopy images using an iterative deep learning workflow that incorporates human contributions
CN115359056B (en) * 2022-10-19 2023-03-24 浙江华诺康科技有限公司 Method and device for detecting dividing cells and computer equipment
CN116665210B (en) * 2023-07-28 2023-10-17 珠海横琴圣澳云智科技有限公司 Cell classification method and device based on multichannel information fusion
CN116704503B (en) * 2023-08-01 2023-10-13 昕传生物科技(北京)有限公司 Machine learning-based three-dimensional lung slice cell classification and protein quantification method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070071755A1 (en) 2005-09-27 2007-03-29 David Balasundaram Novel nucleolar GTPases and method for controlling proliferation of cells
JP2017122610A (en) 2016-01-06 2017-07-13 コニカミノルタ株式会社 Image processing device and program

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110144914A1 (en) * 2009-12-09 2011-06-16 Doug Harrington Biomarker assay for diagnosis and classification of cardiovascular disease
CA3010836C (en) * 2010-07-30 2020-09-08 Fundacao D. Anna Sommer Champalimaud E Dr. Carlos Montez Champalimaud Systems and methods for segmentation and processing of tissue images and feature extraction from same for treating, diagnosing, or predicting medical conditions
JP6161146B2 (en) 2013-01-11 2017-07-12 国立大学法人東京工業大学 Pathological tissue image analysis method, pathological tissue image analysis apparatus, and pathological tissue image analysis program
EP2962101A4 (en) * 2013-02-28 2016-10-19 Progyny Inc Apparatus, method, and system for image-based human embryo cell classification
EP2772882A1 (en) 2013-03-01 2014-09-03 Universite D'angers Automatic measurement of lesions on medical images
EP3108218A4 (en) 2014-02-21 2017-11-15 Massachusetts Institute Of Technology Expansion microscopy
US9784666B2 (en) * 2014-09-11 2017-10-10 3D Signatures Holdings Inc. Methods for assessing cancer cells using granulometry
JP6628969B2 (en) 2015-03-06 2020-01-15 シスメックス株式会社 Cell analyzer, method for controlling cell analyzer, and program
US10545145B2 (en) 2015-04-14 2020-01-28 Massachusetts Institute Of Technology Stochastic arrangement of reagents in clusters—STARC
US10059990B2 (en) 2015-04-14 2018-08-28 Massachusetts Institute Of Technology In situ nucleic acid sequencing of expanded biological samples
US11408890B2 (en) 2015-04-14 2022-08-09 Massachusetts Institute Of Technology Iterative expansion microscopy
CN106338423B (en) 2015-07-10 2020-07-14 三斯坎公司 Spatial multiplexing of histological staining
CN108139408B (en) 2015-08-07 2020-08-28 麻省理工学院 Protein retention expansion microscopy
US11214661B2 (en) 2015-09-17 2022-01-04 Massachusetts Institute Of Technology Three-dimensional nanofabrication by patterning of hydrogels
JP7191697B2 (en) * 2016-05-03 2022-12-19 ユニベルシテ リブレ デ ブリュッセル Nucleolar structure assessment and manipulation
US10360434B2 (en) 2016-07-25 2019-07-23 Case Western Reserve University Multi-pass adaptive voting for nuclei detection in histopathological images
CN106570505B (en) * 2016-11-01 2020-08-21 北京昆仑医云科技有限公司 Method and system for analyzing histopathological images

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070071755A1 (en) 2005-09-27 2007-03-29 David Balasundaram Novel nucleolar GTPases and method for controlling proliferation of cells
JP2017122610A (en) 2016-01-06 2017-07-13 コニカミノルタ株式会社 Image processing device and program

Also Published As

Publication number Publication date
EP3756167A1 (en) 2020-12-30
JP2021514468A (en) 2021-06-10
WO2019164850A1 (en) 2019-08-29
AU2019223959A1 (en) 2020-09-17
EP3756167A4 (en) 2022-07-06
AU2019223959B2 (en) 2024-03-14
US20190258846A1 (en) 2019-08-22
US10915729B2 (en) 2021-02-09
CN111886630A (en) 2020-11-03
CA3091935A1 (en) 2019-08-29
SG11202007982VA (en) 2020-09-29

Similar Documents

Publication Publication Date Title
JP7336806B2 (en) 3D image analysis of cells and tissues for cellular and intracellular morphological modeling and classification
Das et al. Computer-aided histopathological image analysis techniques for automated nuclear atypia scoring of breast cancer: a review
CN106570505B (en) Method and system for analyzing histopathological images
JP6710135B2 (en) Cell image automatic analysis method and system
Perez et al. A workflow for the automatic segmentation of organelles in electron microscopy image stacks
CN107133651B (en) The functional magnetic resonance imaging data classification method of subgraph is differentiated based on super-network
JP2021503666A (en) Systems and methods for single-channel whole-cell segmentation
EP1922695B1 (en) Method of, and apparatus and computer software for, performing image processing
CN113574534A (en) Machine learning using distance-based similarity labels
Kalinin et al. 3D shape modeling for cell nuclear morphological analysis and classification
Pan et al. Cell detection in pathology and microscopy images with multi-scale fully convolutional neural networks
CN110148145B (en) Image target area extraction method fusing boundary information and application
Kheradmand et al. Inner cell mass segmentation in human hmc embryo images using fully convolutional network
Ferlaino et al. Towards deep cellular phenotyping in placental histology
Cao et al. An automatic breast cancer grading method in histopathological images based on pixel-, object-, and semantic-level features
Han et al. Learning generative models of tissue organization with supervised GANs
Biot et al. Strategy and software for the statistical spatial analysis of 3D intracellular distributions
CN108805181B (en) Image classification device and method based on multi-classification model
Hao et al. VP-Detector: A 3D multi-scale dense convolutional neural network for macromolecule localization and classification in cryo-electron tomograms
Agus et al. Shape analysis of 3D nanoscale reconstructions of brain cell nuclear envelopes by implicit and explicit parametric representations
Arar et al. High-quality immunohistochemical stains through computational assay parameter optimization
Zehtabian et al. Automated analysis of neuronal morphology through an unsupervised classification model of neurites
Agus et al. Hyperquadrics for Shape Analysis of 3D Nanoscale Reconstructions of Brain Cell Nuclear Envelopes.
Shakya et al. Bacterial Image Segmentation through Deep Learning Approach
Kalinin Cell Nuclear Morphology Analysis Using 3D Shape Modeling, Machine Learning and Visual Analytics

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230105

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230623

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230804

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230815

R150 Certificate of patent or registration of utility model

Ref document number: 7336806

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150