JP4985480B2 - Method for classifying cancer cells, apparatus for classifying cancer cells, and program for classifying cancer cells - Google Patents

Method for classifying cancer cells, apparatus for classifying cancer cells, and program for classifying cancer cells Download PDF

Info

Publication number
JP4985480B2
JP4985480B2 JP2008054904A JP2008054904A JP4985480B2 JP 4985480 B2 JP4985480 B2 JP 4985480B2 JP 2008054904 A JP2008054904 A JP 2008054904A JP 2008054904 A JP2008054904 A JP 2008054904A JP 4985480 B2 JP4985480 B2 JP 4985480B2
Authority
JP
Japan
Prior art keywords
data
cancer cells
input
map
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008054904A
Other languages
Japanese (ja)
Other versions
JP2009210465A (en
Inventor
浩嗣 松野
功典 佐々木
智子 近藤
裕教 北風
信彦 池田
秀実 松岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NATIONAL UNIVERSITY CORPORATION YAMAGUCHI UNIVERSITY
Institute of National Colleges of Technologies Japan
Original Assignee
NATIONAL UNIVERSITY CORPORATION YAMAGUCHI UNIVERSITY
Institute of National Colleges of Technologies Japan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NATIONAL UNIVERSITY CORPORATION YAMAGUCHI UNIVERSITY, Institute of National Colleges of Technologies Japan filed Critical NATIONAL UNIVERSITY CORPORATION YAMAGUCHI UNIVERSITY
Priority to JP2008054904A priority Critical patent/JP4985480B2/en
Publication of JP2009210465A publication Critical patent/JP2009210465A/en
Application granted granted Critical
Publication of JP4985480B2 publication Critical patent/JP4985480B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Description

本発明は、がん細胞を分類する方法、がん細胞を分類するための装置及びがん細胞を分類するためのプログラムに関し、特にレーザ走査サイトメータ(LSC)により取得された蛋白質データについて自己組織化マップ(SOM)を用いたがん細胞を分類する方法、がん細胞を分類するための装置及びがん細胞を分類するためのプログラムに関する。   The present invention relates to a method for classifying cancer cells, a device for classifying cancer cells, and a program for classifying cancer cells, and more particularly to self-organization of protein data acquired by a laser scanning cytometer (LSC). The present invention relates to a method for classifying cancer cells using a conversion map (SOM), an apparatus for classifying cancer cells, and a program for classifying cancer cells.

がんの検査、治療方針決定、さらには治療法および治療薬開発のために、患者からがん組織および細胞を摘出し、組織および細胞レベルで分析することが医学、薬学、生物学の分野で行われている。がんはその形態の違いからある程度は分類することが可能であるが(組織型の決定)、同一部位から摘出した同じ組織型のがんであっても、進行の速さ、治療薬に対する反応が一様ではないことがしばしばあり、形態学的特徴により決定される組織型分類よりさらに詳細な分類が医療分野では求められている。   In the fields of medicine, pharmacy, and biology, cancer tissue and cells are removed from patients and analyzed at the tissue and cell level for cancer testing, treatment policy determination, and treatment and drug development. Has been done. Cancers can be classified to some extent based on their morphology (determination of tissue type), but even if cancers of the same tissue type are removed from the same site, the speed of progression and response to therapeutic agents Often it is not uniform and a more detailed classification is required in the medical field than the histological classification determined by morphological features.

がん等の悪性細胞の検査、分類を行うことについては下記の文献に開示されるようなものがある。   Regarding the examination and classification of malignant cells such as cancer, there are those disclosed in the following literature.

特許文献1には、顕微鏡及びCCDカメラで得られた画像から分類装置により悪性細胞を検出するシステム及び方法について記載されている。これにより細胞の形状等視覚的な情報からのがん細胞の検出は可能であるが、同形状のがん細胞を分類することはできない。   Patent Document 1 describes a system and method for detecting malignant cells from an image obtained with a microscope and a CCD camera by using a classification device. Accordingly, cancer cells can be detected from visual information such as cell shape, but cancer cells having the same shape cannot be classified.

特許文献2には、撮像された細胞の画像データからLab色空間のb座標値を取得し、その座標値を使用して細胞の色彩に関する特徴パラメータを用いて細胞を分類することについて記載されているが、この方法では細胞の色彩、形状により組織としての分類はなされるが、同形状の細胞を分類することはできない。   Patent Document 2 describes that a b coordinate value of a Lab color space is obtained from imaged cell image data, and the cell is classified using a feature parameter related to the color of the cell using the coordinate value. However, in this method, the tissue is classified according to the color and shape of the cells, but the cells having the same shape cannot be classified.

特許文献3には、健康状態の判断を行う方法として自己組織化マップを利用し、健康状態を自己組織化マップ上に表示することについて記載されているが、細胞の分類を行うものではない。   Patent Document 3 describes using a self-organizing map as a method for determining a health state and displaying the health state on the self-organizing map, but does not classify cells.

特許文献4には、MRIによって取得された画像を対象とし自己組織化マップを用いて所望の画像に容易に検索、アクセスできるようにすることについて記載されているが、細胞1つ1つのレベルの画像を対象とするものではなく、がん細胞の特徴を抽出し分類することはできない。   Patent Document 4 describes that an image acquired by MRI can be easily searched and accessed using a self-organizing map for an image acquired by MRI. It is not intended for images, and features of cancer cells cannot be extracted and classified.

細胞内物質を定量する方法としてサイトメトリーという方法がある。これは蛍光色素単体あるいは蛍光色素を標識した抗体、DNAといった分子プローブで染色した試料となる細胞にレーザを照射し、発せられる蛍光量を測定することによって細胞の大きさ、細胞内物質の定量を行うものである。近年、このサイトメトリーの技術の一つとしてレーザ走査サイトメータ(LSC)が開発され、さらに細胞内物質の凝集度についても測定することができるようになった。このLSCにより多種多様ながん細胞のデータを取得し、タンパク質の量とその凝集度に着目した分析を行い、顕微鏡では分類が困難ながん細胞について分類することが試みられているが、これまでに有効な分類手法は見出されていない。
特表2001−512824号公報 特開2004−340738号公報 特開2003−263502号公報 特開2006−235971号公報
There is a method called cytometry as a method for quantifying intracellular substances. This is a method of quantifying the size of cells and intracellular substances by irradiating laser to cells that become samples stained with molecular probes such as fluorescent dyes alone, fluorescent dye-labeled antibodies and DNA, and measuring the amount of fluorescence emitted. Is what you do. In recent years, a laser scanning cytometer (LSC) has been developed as one of the cytometry techniques, and it has become possible to measure the degree of aggregation of intracellular substances. This LSC is used to acquire data on a wide variety of cancer cells, conduct analysis focusing on the amount of protein and its degree of aggregation, and attempt to classify cancer cells that are difficult to classify with a microscope. No effective classification method has been found so far.
Special table 2001-512824 gazette JP 2004-340738 A JP 2003-263502 A JP 2006-235971 A

CCDカメラで撮影された画像を用いる従来のがん細胞の分類においては、がん細胞の視覚的な情報しか得られず、がん細胞の検出は行えるが、特徴抽出は限定されたものであった。また、ほぼ同形状のがん細胞はそれ以上の詳細な分類を行うことができなかった。そのため、がん細胞の特徴に基づいたさらに適格な情報を取得し、同形状のがん細胞についてもその特徴に基づいたより詳細な分類を行えるようにすることが求められていた。   In conventional classification of cancer cells using images taken with a CCD camera, only visual information about the cancer cells can be obtained and cancer cells can be detected, but feature extraction is limited. It was. In addition, cancer cells having almost the same shape could not be further classified. For this reason, it has been required to obtain more appropriate information based on the characteristics of cancer cells so that more detailed classification of cancer cells having the same shape can be performed based on the characteristics.

本発明は、前述した課題を解決すべくなしたものであり、本発明によるがん細胞を分類する方法は、レーザ走査サイトメータにより抽出されたがん細胞についてのデータを処理することによりがん細胞を分類する方法であって、がん細胞についてレーザ走査サイトメータで取得されたデータから必要なデータとして蛋白質量と蛋白質の凝集度のデータを切り出して散布図を作成することと、該散布図を示すデータを低次元化し入力データを作成することと、該入力データをそれぞれニューロンの集まりである入力層及びマップ層を有するネットワークの入力層に入力し前記入力層とマップ層との間での結合荷重についての学習を行ってトポロジカルマッピングを行うことにより自己組織化マップを形成することと、形成された自己組織化マップにおける蛋白質の分布形態によりがん細胞の特徴を判別しがん細胞の分類を行うことと、からなるものである。   The present invention has been made to solve the above-mentioned problems, and a method for classifying cancer cells according to the present invention is performed by processing data about cancer cells extracted by a laser scanning cytometer. A method for classifying cells, wherein data of protein mass and protein aggregation degree are cut out as necessary data from data acquired by a laser scanning cytometer for cancer cells, and a scatter diagram is created. The input data is input to the input layer of a network having an input layer and a map layer, each of which is a collection of neurons, and is input between the input layer and the map layer. A self-organizing map is formed by learning about connection weights and performing topological mapping, and the formed self-organizing map is formed. And carrying out the classification of cancer cells to determine the characteristics of the cancer cells by the distribution form of the protein in, it is made of.

本発明によるがん細胞を分類する装置は、レーザ走査サイトメータにより抽出されたがん細胞についてのデータを処理することによりがん細胞を分類する装置であって、がん細胞についてレーザ走査サイトメータで取得されたデータから必要なデータとして蛋白質量と蛋白質の凝集度のデータを切り出して散布図を作成する散布図作成手段と、前記散布図を示すデータを低次元化し入力データを作成する入力データ作成手段と、それぞれニューロンの集まりである入力層及びマップ層からなるネットワークを有し前記入力層とマップ層との間での結合荷重についての学習を行ってトポロジカルマッピングを行うことにより自己組織化マップを形成する自己組織化マップ形成手段と、からなるものである。   An apparatus for classifying cancer cells according to the present invention is an apparatus for classifying cancer cells by processing data about cancer cells extracted by a laser scanning cytometer, and the laser scanning cytometer for cancer cells. Scatter plot creating means for cutting out the data of protein mass and protein aggregation degree as necessary data from the data acquired in step 1 to create a scatter plot, and input data for lowering the data indicating the scatter plot and creating input data A self-organizing map by creating a topological mapping by learning about the connection weight between the input layer and the map layer, having a network comprising an input layer and a map layer, each of which is a collection of neurons; And a self-organizing map forming means for forming

また、本発明によるがん細胞を分類するためのプログラムは、レーザ走査サイトメータにより抽出されたがん細胞についてのデータを処理することによりがん細胞を分類することをコンピュータ上で行うためのプログラムであって、がん細胞についてレーザ走査サイトメータで取得されたデータから必要なデータとして蛋白質量と蛋白質の凝集度のデータを切り出して散布図を作成し、該散布図を示すデータを低次元化し入力データを作成し、該入力データをそれぞれニューロンの集まりである入力層及びマップ層を有するネットワークの入力層に入力し前記入力層とマップ層との間での結合荷重についての学習を行ってトポロジカルマッピングを行うことにより自己組織化マップを形成するようにしたものである。   In addition, the program for classifying cancer cells according to the present invention is a program for classifying cancer cells on a computer by processing data on cancer cells extracted by a laser scanning cytometer. However, from the data obtained with a laser scanning cytometer for cancer cells, the data of protein mass and protein aggregation degree are cut out as necessary data to create a scatter diagram, and the data indicating the scatter diagram is reduced in dimension. Create input data, input the input data to an input layer of a network having an input layer and a map layer, each of which is a collection of neurons, and learn about connection weights between the input layer and the map layer to obtain topological A self-organizing map is formed by mapping.

本発明では、レーザ走査サイトメータで取得されたがん細胞のデータについて自己組織化マップを用いた学習によりマッピングを行うことにより、がん細胞の特徴を抽出し分類することができ、同形状のがん細胞であっても細胞の特徴に基づいたさらに詳しい分類が可能となる。   In the present invention, cancer cell data acquired with a laser scanning cytometer can be extracted and classified by performing mapping using learning using a self-organizing map, and the same shape can be obtained. Even cancer cells can be classified in more detail based on the characteristics of the cells.

本発明によるがん細胞の分類では、データの解析による分類の手法として自己組織化マップ(SOM)を用いて細胞の分類を行う。SOMはニューラルネットワークにおける教師なし学習モデルの一つであり、学習により入力データの類似度を自動的に見出し、類似する入力同士をマップ層の近くに配置するトポロジカルマップを形成するものである。トポロジカルマップの形成に際し、レーザ走査サイトメータ(LSC)により抽出したがん細胞データから蛋白質の量とその凝集度の関係を表す画像データを作成し、その距離情報を学習によりマップ化して細胞の分類を行う。   In the classification of cancer cells according to the present invention, cells are classified using a self-organizing map (SOM) as a classification technique based on data analysis. The SOM is one of unsupervised learning models in a neural network, and automatically finds out the similarity of input data by learning, and forms a topological map in which similar inputs are arranged near the map layer. When forming a topological map, image data representing the relationship between the amount of protein and the degree of aggregation is created from cancer cell data extracted by a laser scanning cytometer (LSC), and the distance information is mapped by learning to classify cells. I do.

本発明によるがん細胞の分類は、レーザ走査サイトメータでの検出により細胞の試料から取得されたデータについて解析処理を行うことにより細胞の分類を行うものである。そこで、最初にレーザ走査サイトメータについて説明する。
〔レーザ走査サイトメータ〕
レーザ走査サイトメータ(以下、LSCという)は、細胞の試料にレーザを照射することによって細胞から発せられる散乱光や蛍光を検出する装置である。試料としてはスライドガラス上に培養あるいは貼り付けられた細胞を用いる。これらを測定対象とする細胞内物質(DNA、蛋白質、非ペプチド性物質、薬物など)に応じた方法で蛍光標識(染色)する。細胞はレーザで走査し、細胞から発せられる蛍光の輝度をフォトセンサーで検出し、検出された信号を変換することにより細胞の大きさ、細胞内物質の量、局在(位置情報)などが測定できる。
The classification of cancer cells according to the present invention classifies cells by performing analysis processing on data acquired from a sample of cells by detection with a laser scanning cytometer. First, a laser scanning cytometer will be described.
[Laser scanning cytometer]
A laser scanning cytometer (hereinafter referred to as LSC) is a device that detects scattered light and fluorescence emitted from a cell by irradiating a cell sample with a laser. As the sample, cells cultured or pasted on a slide glass are used. These are fluorescently labeled (stained) by a method according to the intracellular substance (DNA, protein, non-peptide substance, drug, etc.) to be measured. The cells are scanned with a laser, the brightness of the fluorescence emitted from the cells is detected with a photosensor, and the detected signal is converted to measure the size of the cell, the amount of intracellular material, localization (location information), etc. it can.

LSCでは、蛍光量を微小なピクセル単位で測定し、蛍光物質の量、面積等を測定する際に、同時に位置情報も取得する。1つの細胞として認識された領域内の全ピクセルの蛍光量を合算して1つの細胞における蛍光量(Integral)とし、その中で最も高い蛍光量を示すピクセルを極大ピクセル(Max pixel)とする。この極大ピクセルは、換言すれば蛍光物質の凝集度、すなわち測定する細胞内物質の凝集度を表す指標である。この極大ピクセルの値の値によってがん細胞周期を簡単に識別することができる。
〔細胞の試料〕
抗体は抗原と特異的に反応する特性がある。この性質を利用すれば細胞内物質を抗原抗体反応によって蛍光免疫染色することができる。LSCでは、図1に示すようなセルアレイ上に貼り付けた、あるいはセルアレイ上で培養された細胞について測定を行う。セルアレイはスライドガラス上に多数(例えば50個)の直径2mm程度の凹形のスポットが設けられたものであり、図の斜線部分が無蛍光インクによる印刷で盛り上がっている。スポットの配列された部分は縦16mm、横30mm程度の寸法である。セルアレイの1つのスポットの中には通常100〜500個程度のがん細胞がある。従来の方法では、1枚のスライドガラスで1種類の細胞について測定を行っていたが、セルアレイを使用することにより1度に多くのがん細胞のデータを取得することができる。
〔LSCのデータ〕
本発明においては、LSCとしてLSC2(オリンパス株式会社製)を使用している。LSCでの測定により得られるデータはテキスト形式のデータであり、その例を図2に示す。図2の形のデータについて概略説明すると、最初の部分はLSCの機器設定を表し、レーザの種類やセルアレイ上の細胞のある範囲等が設定される。その機器設定データに続いて、細胞一つ一つに関するNo、位置情報、直径、面積、周囲、DNAインデックス(DI)等のデータが記されている。
In LSC, the amount of fluorescence is measured in units of minute pixels, and when measuring the amount, area, etc. of the fluorescent material, position information is also acquired at the same time. The amount of fluorescence of all the pixels in the region recognized as one cell is added to obtain the amount of fluorescence (Integral) in one cell, and the pixel showing the highest amount of fluorescence among them is defined as the maximum pixel (Max pixel). In other words, the maximum pixel is an index representing the aggregation degree of the fluorescent substance, that is, the aggregation degree of the intracellular substance to be measured. The cancer cell cycle can be easily identified by the value of the maximum pixel value.
[Cell samples]
Antibodies have the property of reacting specifically with antigens. If this property is utilized, the intracellular substance can be fluorescent immunostained by antigen-antibody reaction. In the LSC, measurement is performed on cells attached on a cell array as shown in FIG. 1 or cultured on the cell array. The cell array has a large number (for example, 50) of concave spots having a diameter of about 2 mm on a slide glass, and the hatched portion in the figure is raised by printing with non-fluorescent ink. The portion where the spots are arranged is about 16 mm long and 30 mm wide. There are usually about 100 to 500 cancer cells in one spot of the cell array. In the conventional method, one type of cell is measured with one slide glass. However, data of many cancer cells can be acquired at a time by using a cell array.
[LSC data]
In the present invention, LSC2 (manufactured by Olympus Corporation) is used as the LSC. Data obtained by LSC measurement is data in text format, and an example is shown in FIG. The data in the form of FIG. 2 will be described briefly. The first part represents LSC device settings, in which the type of laser, a certain range of cells on the cell array, and the like are set. Subsequent to the device setting data, data such as No, position information, diameter, area, circumference, and DNA index (DI) related to each cell are described.

細胞分類のための解析を行うに際して、機器設定については初期値を用いることにすれば、機器設定のデータを使用することなく、各細胞についてのデータを考慮すればよいことになる。また、各細胞についてのデータに関して、細胞が重なり合っているような不要なデータ(ゴミと称される)があるが、それらの不要なデータを削除し必要なデータを取得することになる。   When performing the analysis for cell classification, if the initial value is used for the device setting, the data for each cell may be considered without using the device setting data. Further, regarding the data about each cell, there is unnecessary data (referred to as garbage) in which cells overlap each other. However, the unnecessary data is deleted and necessary data is acquired.

必要なデータを取得するために、データ切り出しプログラム(例えばAWC:Any Where Cyte)を用い、テキスト形式のデータから蛋白質量等の必要なデータを選択形式で抽出することにより、セルアレイのスポットごとにデータが切り出され、そのデータをcsv形式で蓄積する。このcsv形式のデータの例は図3に示すようなものである。   In order to obtain the necessary data, data is extracted for each spot in the cell array by extracting the necessary data such as protein mass from the text format data in a selected format using a data extraction program (for example, AWC: Any Where Cyte). Is extracted and the data is stored in csv format. An example of the data in the csv format is as shown in FIG.

図3に示すデータのうち、細胞の分類に用いるのは蛋白質の量(Integral)と蛋白質の凝集度(Max Pixel)である。蛋白質の量は、がん細胞内に存在する蛋白質の量であり、凝集度は蛋白質ががん細胞内にどのように存在しているかを表す量である。蛋白質の凝集度はLSCを用いることにより新たに測定が可能になったものである。   In the data shown in FIG. 3, the amount of protein (Integral) and the degree of protein aggregation (Max Pixel) are used for cell classification. The amount of protein is the amount of protein present in the cancer cell, and the degree of aggregation is an amount representing how the protein is present in the cancer cell. The degree of protein aggregation can be newly measured by using LSC.

次に、図3のような切り出されたデータから散布図を作成する。散布図は、セルアレイのスポットごとにデータを抽出し、特定の蛋白質に蛋白質の量と凝集度とをパラメータとした分布特性を表すようなものであり、その例を図4(a)〜(c)に示す。図中の各点はがん細胞についてのデータを表している。これらの散布図において、蛋白質の違いにより点の集まりの形状、傾斜、密度等に違いがあることが見られるが、異種の蛋白質でも形状が似ている場合、同種のがん細胞、同種の蛋白質でも異なった形状になるというように多様であり、散布図を見ただけではデータの分類はできないため、SOMを用いてデータを分類する。
〔自己組織化マップ(SOM)〕
(1)SOMネットワークの構造
図5はSOMネットワークの構造を示すものである。ネットワークはそれぞれニューロンの集まりである入力層とマップ層との2層からなる。層内でのニューロンの結合はなく、入力層とマップ層との間ではニューロンが全結合になっている。マップ層では出力を視覚的に見るために、通常ニューロンが2次元に配置されている。
Next, a scatter diagram is created from the cut out data as shown in FIG. The scatter diagram is such that data is extracted for each spot of the cell array, and the distribution characteristic is expressed by using the amount of protein and the degree of aggregation as parameters for a specific protein, and examples thereof are shown in FIGS. ). Each point in the figure represents data on cancer cells. In these scatter plots, it can be seen that there is a difference in the shape, slope, density, etc. of the cluster of points due to the difference in protein, but when different proteins have similar shapes, the same type of cancer cell, the same type of protein However, there are various shapes such as different shapes, and data cannot be classified simply by looking at the scatter diagram. Therefore, data is classified using SOM.
[Self-Organizing Map (SOM)]
(1) Structure of SOM network FIG. 5 shows the structure of the SOM network. Each network consists of two layers, an input layer and a map layer, each of which is a collection of neurons. There is no neuron connection in the layer, and the neuron is fully connected between the input layer and the map layer. In the map layer, neurons are usually arranged in two dimensions in order to visually see the output.

時刻tにおいて入力層に入力ベクトル
x(t)=[x(t),…,x(t),…,x(t)]
が与えられると、マップ層のニューロンは結合荷重
(t)=[wj1(t),…,wji(t),…,wjn(t)]
(wjiは入力層のi番目のニューロンとマップ層のj番目のニューロンとの間の荷重である。)を介して入力層からの入力を受け、学習のアルゴリズムに従って後述する学習を繰り返す。その結果、似た入力に対しては、マップ層の互いに近くのニューロンが反応するようになる。すなわち、ネットワークはトポロジカルマッピングを行う。
(2)SOMでの学習のアルゴリズム
入力層とマップ層との間でのニューロン間の結合荷重についての学習を行うことによりトポロジカルマッピングを行うのであるが、その学習のアルゴリズムを示す。
a.ネットワークの初期化
入力層とマップ層との間の結合荷重の初期値を乱数によって設定する。
b.入力ベクトルの入力
入力層に入力ベクトルx=(x,…,x,…,x)を入力する。
c.入力ベクトルと結合荷重ベクトルの距離計算
入力ベクトルとマップ層の各ニューロンの結合荷重ベクトルの距離を計算する。入力ベクトルとマップ層のj番目のニューロンの結合荷重ベクトルとの距離d
Input vector x (t) = [x 1 (t),..., X i (t),..., X n (t)] at time t
, The neuron of the map layer has a connection weight x j (t) = [w j1 (t),..., W ji (t) ,.
(W ji is a load between the i-th neuron in the input layer and the j-th neuron in the map layer.) The input from the input layer is received through, and learning described later is repeated according to the learning algorithm. As a result, nearby neurons in the map layer react to similar inputs. That is, the network performs topological mapping.
(2) Learning algorithm in SOM Topological mapping is performed by learning about the connection load between neurons between the input layer and the map layer. The learning algorithm is shown below.
a. Network initialization The initial value of the bond weight between the input layer and the map layer is set by a random number.
b. Input of input vector Input vector x = (x 1 ,..., X i ,..., X n ) is input to the input layer.
c. Calculating the distance between the input vector and the connection weight vector Calculate the distance between the input vector and the connection weight vector of each neuron in the map layer. The distance d j between the coupling weight vector of the j-th neuron of the input vector and map layer

Figure 0004985480
で与えられる。
d.勝者ニューロンの決定
距離dが最小となるニューロン、すなわち入力ベクトルに最も近い結合荷重ベクトルをもつマップ層でニューロンを選択する。このニューロンを勝者ニューロンと呼び、jとする。
e.結合荷重と各パラメータの更新
勝者ニューロンとその近傍領域内の全てのニューロンの結合荷重を
Δwji=αh(j,j)(x−wji)・・・・・・(2)
に基づいて更新する。この近傍関数h(j,j)は
Figure 0004985480
Given in.
d. Determining the winner neuron Select the neuron with the smallest distance d j , that is, the map layer with the connection weight vector closest to the input vector. This neuron is called the winner neuron and is designated j * .
e. Connection weight and update of each parameter The connection weights of the winner neuron and all the neurons in the neighborhood are expressed as follows: Δw ji = αh (j, j * ) (x−w ji ) (2)
Update based on. This neighborhood function h (j, j * ) is

Figure 0004985480
で定義される。αは学習率係数であり、学習の経過とともに減少させるようにする。同様に、σも学習の経過とともに減少させる。
f.反復
bに戻り、bからeの過程を反復する。がん細胞、蛋白質についてLSCで取得されたデータを分散図データとし処理して得られた入力データについてSOMによる学習を行い、その結果として、がん細胞の特性を表すマップ図が得られる。
〔システムの構成〕
LSCで取得されたデータを処理して入力データとしSOMによる学習を行う過程をフローで示すと図6のようになる。LSCで取得されデータ処理を行って得られた散布図のデータについて、データ量を減らすために特徴を保持したまま低次元化する平滑化処理、グレースケール変換を行い、標本化を行う。この処理により例えば10×10=100次元まで次元を落とし、入力ベクトルを作成する。入力ベクトルの各要素は標本化後の散布図の画像の1ブロックに対応し、0〜255の値をもつ。
Figure 0004985480
Defined by α is a learning rate coefficient, and is decreased with the progress of learning. Similarly, σ is decreased with the progress of learning.
f. Return to iteration b and repeat the process from b to e. Learning by SOM is performed on the input data obtained by processing the data acquired by the LSC for cancer cells and proteins as scatter diagram data, and as a result, a map diagram representing the characteristics of the cancer cells is obtained.
[System configuration]
FIG. 6 is a flowchart showing a process of learning by SOM by processing data acquired by LSC and using it as input data. The scatter diagram data obtained by the data processing obtained by the LSC is sampled by performing a smoothing process and a gray scale conversion for reducing the dimensions while maintaining the characteristics in order to reduce the data amount. By this processing, for example, the dimension is reduced to 10 × 10 = 100 dimensions, and an input vector is created. Each element of the input vector corresponds to one block of the image of the scatter diagram after sampling, and has a value of 0 to 255.

SOMネットワークにおけるマップ層は例えば20×20=400のニューロンの2次元マップとし、マップ層の各ニューロンは100次元の結合荷重ベクトルをもつ。これは標本化後の散布図の画像全体に対応している。   The map layer in the SOM network is, for example, a two-dimensional map of 20 × 20 = 400 neurons, and each neuron in the map layer has a 100-dimensional connection weight vector. This corresponds to the entire image of the scatter diagram after sampling.

LSCで取得されたデータを処理して入力データとしSOMによる学習を行いがん細胞を分類するための装置は図7に示す構成を有する。この装置は、概略的にLSCで取得されたテキストデータを処理してSOM作成のための入力データとする入力データ生成部10と、入力データについて学習を行うSOM作成部20とを備えるものである。   A device for classifying cancer cells by processing data acquired by the LSC and using it as input data to perform learning by SOM has the configuration shown in FIG. This apparatus includes an input data generation unit 10 that roughly processes text data acquired by an LSC to be input data for SOM generation, and an SOM generation unit 20 that learns about the input data. .

入力データ生成部10は、LSCで取得されたテキストデータから必要なデータを切り出すデータ切り出し部と、切り出されたデータの低次元化を行いcvsデータに変換するデータ変換部と、変換されたcvsデータから散布図を作成する散布図作成部と、散布図のデータについて低次元化、標本化を行い入力信号とする入力データ生成部とを備えている。   The input data generation unit 10 includes a data cutout unit that cuts out necessary data from text data acquired by the LSC, a data conversion unit that lowers the cutout data and converts it into cvs data, and converted cvs data A scatter diagram creating unit for creating a scatter diagram from the scatter diagram, and an input data generating unit for reducing the dimensionality and sampling of the data of the scatter diagram as an input signal.

SOM生成部20は、入力データ生成部10において生成された入力データを入力し学習を行うニューラルネットワークの構成を備え、それぞれニューロンの集まりである入力層及びマップ層からなり、入力層とマップ層との間の結合荷重についての学習を行ってトポロジカルマッピングを行うことによりSOMを形成する。
〔分析例〕
5種のがん細胞と蛋白質4種についてSOMによる学習を行った結果について示す。がん細胞はKURAMOCHI,MKN1,MS−1,SW−13,WiDrであり、各がん細胞の蛋白質はL−26,LCA,RET,p27である。SOMによる学習は1種類の蛋白質当たり6枚の散布図の画像について15回行い、これを1サイクルとし、30サイクル反復する。1種類の蛋白質についての学習をサブ学習と呼び、その回数をサブ学習回数と言う。学習における各パラメータと学習回数を表1のように設定した。
The SOM generation unit 20 has a configuration of a neural network that inputs and learns the input data generated by the input data generation unit 10, and includes an input layer and a map layer, each of which is a collection of neurons. The SOM is formed by performing topological mapping by learning about the coupling load between the two.
[Example of analysis]
It shows about the result of having learned by SOM about five kinds of cancer cells and four kinds of proteins. The cancer cells are KURAMOCHI, MKN1, MS-1, SW-13, and WiDr, and the proteins of each cancer cell are L-26, LCA, RET, and p27. Learning by SOM is performed 15 times for 6 scatterplot images per type of protein, which is defined as one cycle, and is repeated 30 cycles. Learning about one type of protein is called sub-learning, and the number of times is called sub-learning. Each parameter in learning and the number of learning were set as shown in Table 1.

Figure 0004985480
また、学習終了後に得られたマップを図8〜12に示す。マップ図では、1種類のがん細胞についての4種類の蛋白質データをそれぞれについての勝者ニューロンとして表示している。4種類の蛋白質をA(L−26),B(LCA),C(RET),D(p27)で表し、1種類の蛋白質データについての6枚のデータにそれぞれ番号1〜6を対応づけている。図中、Xは2種類以上の蛋白質に対する勝者ニューロンを示しており、例えばA1は蛋白質L−26に関する1番目のデータの勝者ニューロンを示している。
Figure 0004985480
Moreover, the map obtained after completion | finish of learning is shown to FIGS. In the map diagram, four types of protein data for one type of cancer cell are displayed as winner neurons for each type. Four types of proteins are represented by A (L-26), B (LCA), C (RET), and D (p27), and numbers 1 to 6 are associated with six pieces of data for one type of protein data, respectively. Yes. In the figure, X indicates a winner neuron for two or more types of proteins. For example, A1 indicates a winner neuron of the first data regarding the protein L-26.

マッピングした結果の全てのマップでXが見られる。これは、2種類以上の蛋白質においてその散布図のデータが類似していることを示しているが、この結果から特徴的な蛋白質が存在することがわかる。例えば、図8において、A1〜A4やD1、D2はXとは異なる場所にマッピングされているが、これは、同じ種類のがん細胞データであっても、散布図に違いがあるということを示している。   X is seen in all maps resulting from mapping. This indicates that the data of the scatter plots are similar for two or more types of proteins, and it can be seen from this result that a characteristic protein exists. For example, in FIG. 8, A1 to A4, D1, and D2 are mapped to different locations from X, but this means that there is a difference in the scatter diagram even for the same type of cancer cell data. Show.

がん細胞のデータを取得する際、細胞の周期や蛋白質のデータの取得に要する時間が異なるということがあり、このことから、A1〜A4が示すL−26とD1、D2が示すp27はがん細胞KURAMOCHIにおいて時間的に変化があるもので、他と区別される特徴的な蛋白質データであることが考えられる。   When acquiring cancer cell data, the time required for acquiring cell cycle and protein data may differ, and from this, L-26 indicated by A1 to A4 and p27 indicated by D1 and D2 are different. It is considered that this is characteristic protein data that is different from others because it changes with time in cancer cells KURAMOCHI.

図8〜12に示した5種のがん細胞についての結果から、各がん細胞において時間的に変化する特徴的な蛋白質を表2に示す。   Table 2 shows characteristic proteins that change with time in each cancer cell based on the results for the five types of cancer cells shown in FIGS.

Figure 0004985480
このように、がん細胞の試料からLSCにより取得されたデータについてSOMでの学習による結果として得られたマップ図によりがん細胞ごとに時間的に変化することで他と区別される特徴的な蛋白質が存在することがわかり、これにより同種のがん細胞を特徴的な蛋白質により分類できることが示される。
Figure 0004985480
As described above, the data acquired by the LSC from the sample of cancer cells is distinguished from others by changing with time for each cancer cell by the map obtained as a result of learning by SOM. It can be seen that proteins exist, indicating that the same type of cancer cells can be classified by characteristic proteins.

本発明は、LSCで取得されたがん細胞のデータについてSOMによる学習の結果として自己組織化マップを形成しがん細胞を分類する方法であり、また、
LSCで取得されたテキストデータを処理してSOM作成のための入力データとする入力データ生成部と、入力データについて学習を行うSOM作成部とを備えるがん細胞を分類するための装置でもある。
The present invention is a method for classifying cancer cells by forming a self-organizing map as a result of learning by SOM on cancer cell data acquired by LSC,
It is also an apparatus for classifying cancer cells, which includes an input data generation unit that processes text data acquired by the LSC to be input data for SOM generation, and an SOM generation unit that learns about the input data.

さらにLSCで取得されたがん細胞のデータについて必要な処理を行った上で自己組織化マップでの学習を行うことは独自のデータ処理手段を備えた装置として構成するほか、汎用コンピュータにより実行することができ、そのためのプログラムは、がん細胞についてレーザ走査サイトメータで取得されたデータから必要なデータとして蛋白質量と蛋白質の凝集度のデータを切り出して散布図を作成し、散布図を示すデータを低次元化し入力データを作成し、入力データをそれぞれニューロンの集まりである入力層及びマップ層を有するネットワークの入力層に入力し前記入力層とマップ層との間での結合荷重についての学習を行ってトポロジカルマッピングを行うことにより自己組織化マップを形成するものである。   Furthermore, performing the necessary processing on the cancer cell data acquired by the LSC and then learning with the self-organizing map is configured as a device equipped with an original data processing means, and is executed by a general-purpose computer. Data that shows the scatter diagram can be created by cutting out the protein mass and protein aggregation data as necessary data from the data acquired with a laser scanning cytometer for cancer cells. The input data is input to the input layer of the network having the input layer and the map layer, each of which is a collection of neurons, and learning about the coupling load between the input layer and the map layer is performed. A self-organizing map is formed by performing topological mapping.

セルアレイを上方から見た図である。It is the figure which looked at the cell array from the upper part. LSCによるデータの例を示す図である。It is a figure which shows the example of the data by LSC. 図2のデータを切り出しcsv形式に変換したデータの例を示す図である。It is a figure which shows the example of the data which cut out and converted the data of FIG. 2 to csv format. 散布図の例を示す図である。It is a figure which shows the example of a scatter diagram. SOMネットワークの構造を示す図である。It is a figure which shows the structure of a SOM network. 本発明によるLSCのデータからSOMマップを形成する過程を示すフロー図である。FIG. 6 is a flowchart illustrating a process of forming an SOM map from LSC data according to the present invention. 本発明によるLSCのデータからSOMマップを形成する装置の構成を概略的に示す図である。It is a figure which shows roughly the structure of the apparatus which forms a SOM map from the data of LSC by this invention. 作成されたSOMマップの例を示す図である。It is a figure which shows the example of the produced SOM map. 作成されたSOMマップの例を示す図である。It is a figure which shows the example of the produced SOM map. 作成されたSOMマップの例を示す図である。It is a figure which shows the example of the produced SOM map. 作成されたSOMマップの例を示す図である。It is a figure which shows the example of the produced SOM map. 作成されたSOMマップの例を示す図である。It is a figure which shows the example of the produced SOM map.

符号の説明Explanation of symbols

10 入力データ生成部
20 SOM作成部
10 Input data generation unit 20 SOM creation unit

Claims (3)

レーザ走査サイトメータにより抽出されたがん細胞についてのデータを処理することによりがん細胞を分類する方法であって、
がん細胞についてレーザ走査サイトメータで取得されたデータから必要なデータとして蛋白質量と蛋白質の凝集度のデータを切り出して散布図を作成することと、
該散布図を示すデータを低次元化し入力データを作成することと、
該入力データをそれぞれニューロンの集まりである入力層及びマップ層を有するネットワークの入力層に入力し前記入力層とマップ層との間での結合荷重についての学習を行ってトポロジカルマッピングを行うことにより自己組織化マップを形成することと、
形成された自己組織化マップにおける蛋白質の分布形態によりがん細胞の特徴を判別しがん細胞の分類を行うことと、
からなることを特徴とするがん細胞を分類する方法。
A method of classifying cancer cells by processing data about cancer cells extracted by a laser scanning cytometer,
Cutting out the data of protein mass and protein aggregation degree as necessary data from the data acquired with a laser scanning cytometer for cancer cells, and creating a scatter plot,
Reducing the data representing the scatter diagram to create input data;
The input data is input to an input layer of a network having an input layer and a map layer, each of which is a collection of neurons, and learning is performed on the connection weight between the input layer and the map layer to perform topological mapping. Forming an organizational map;
Classifying the cancer cells by distinguishing the characteristics of the cancer cells according to the protein distribution in the self-organizing map formed,
A method for classifying cancer cells characterized by comprising:
レーザ走査サイトメータにより抽出されたがん細胞についてのデータを処理することによりがん細胞を分類するための装置であって、
がん細胞についてレーザ走査サイトメータで取得されたデータから必要なデータとして蛋白質量と蛋白質の凝集度のデータを切り出して散布図を作成する散布図作成手段と、
前記散布図を示すデータを低次元化し入力データを作成する入力データ作成手段と、
それぞれニューロンの集まりである入力層及びマップ層からなるネットワークを有し前記入力層とマップ層との間での結合荷重についての学習を行ってトポロジカルマッピングを行うことにより自己組織化マップを形成する自己組織化マップ形成手段と、
からなることを特徴とするがん細胞を分類するための装置。
An apparatus for classifying cancer cells by processing data about cancer cells extracted by a laser scanning cytometer,
Scatter plot creation means for cutting out data on protein mass and protein aggregation degree as necessary data from data acquired with a laser scanning cytometer for cancer cells,
Input data creating means for creating input data by reducing the data representing the scatter diagram;
Self having a network composed of an input layer and a map layer, each of which is a collection of neurons, and forming a self-organizing map by performing topological mapping by learning about connection weights between the input layer and the map layer An organizing map forming means;
An apparatus for classifying cancer cells, characterized by comprising:
レーザ走査サイトメータにより抽出されたがん細胞についてのデータを処理することによりがん細胞を分類することをコンピュータ上で行うためのプログラムであって、がん細胞についてレーザ走査サイトメータで取得されたデータから必要なデータとして蛋白質量と蛋白質の凝集度のデータを切り出して散布図を作成し、該散布図を示すデータを低次元化し入力データを作成し、該入力データをそれぞれニューロンの集まりである入力層及びマップ層を有するネットワークの入力層に入力し前記入力層とマップ層との間での結合荷重についての学習を行ってトポロジカルマッピングを行うことにより自己組織化マップを形成するようにしたことを特徴とするがん細胞を分類するためのプログラム。
A program for performing on a computer to classify cancer cells by processing data about cancer cells extracted by a laser scanning cytometer, which was obtained with a laser scanning cytometer Cut out the data of protein mass and protein aggregation degree as necessary data, create a scatter diagram, reduce the data showing the scatter diagram to create input data, and each input data is a collection of neurons A self-organizing map is formed by inputting into an input layer of a network having an input layer and a map layer, learning about a coupling load between the input layer and the map layer, and performing topological mapping. A program for classifying cancer cells characterized by.
JP2008054904A 2008-03-05 2008-03-05 Method for classifying cancer cells, apparatus for classifying cancer cells, and program for classifying cancer cells Expired - Fee Related JP4985480B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008054904A JP4985480B2 (en) 2008-03-05 2008-03-05 Method for classifying cancer cells, apparatus for classifying cancer cells, and program for classifying cancer cells

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008054904A JP4985480B2 (en) 2008-03-05 2008-03-05 Method for classifying cancer cells, apparatus for classifying cancer cells, and program for classifying cancer cells

Publications (2)

Publication Number Publication Date
JP2009210465A JP2009210465A (en) 2009-09-17
JP4985480B2 true JP4985480B2 (en) 2012-07-25

Family

ID=41183767

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008054904A Expired - Fee Related JP4985480B2 (en) 2008-03-05 2008-03-05 Method for classifying cancer cells, apparatus for classifying cancer cells, and program for classifying cancer cells

Country Status (1)

Country Link
JP (1) JP4985480B2 (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011107093A (en) * 2009-11-20 2011-06-02 Jx Nippon Oil & Energy Corp Apparatus and method for diagnosing abnormality of vibrating body
CN104866727A (en) * 2015-06-02 2015-08-26 陈宽 Deep learning-based method for analyzing medical data and intelligent analyzer thereof
KR101927852B1 (en) * 2016-06-10 2018-12-13 주식회사 토모큐브 Method and Apparatus for Identifying Cell Species Using 3D Refractive Index Tomography and Machine Learning Algorithm
EP3605406A4 (en) * 2017-03-29 2021-01-20 ThinkCyte, Inc. Learning result output apparatus and learning result output program
JP7047386B2 (en) 2018-01-10 2022-04-05 セイコーエプソン株式会社 Anomaly warning method and anomaly warning system
US11983612B2 (en) 2018-08-31 2024-05-14 Nec Corporation Classification device, classification method, and recording medium
EP4027131A4 (en) * 2019-09-02 2023-10-04 H.U. Group Research Institute G.K. Gate region estimation program, gate region estimation device, and learning model generation method

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5991028A (en) * 1991-02-22 1999-11-23 Applied Spectral Imaging Ltd. Spectral bio-imaging methods for cell classification
JP2000279168A (en) * 1999-03-31 2000-10-10 Olympus Optical Co Ltd Analysis of chromosome and device therefor
WO2005050479A1 (en) * 2003-11-21 2005-06-02 National University Corporation Kochi University Similar pattern searching apparatus, method of similar pattern searching, program for similar pattern searching, and fractionation apparatus
JP2006235971A (en) * 2005-02-24 2006-09-07 Japan Science & Technology Agency Image referencing apparatus and method for classifying and searching for image
WO2007008583A2 (en) * 2005-07-07 2007-01-18 Kohne David E Improved protein expression comparison assay results and applications

Also Published As

Publication number Publication date
JP2009210465A (en) 2009-09-17

Similar Documents

Publication Publication Date Title
US11842556B2 (en) Image analysis method, apparatus, program, and learned deep learning algorithm
JP7197584B2 (en) Methods for storing and retrieving digital pathology analysis results
US20200388033A1 (en) System and method for automatic labeling of pathology images
JP6503382B2 (en) Digital Holographic Microscopy Data Analysis for Hematology
Bjornsson et al. Associative image analysis: a method for automated quantification of 3D multi-parameter images of brain tissue
DK2973397T3 (en) Tissue-object-based machine learning system for automated assessment of digital whole-slide glass
CN108107197B (en) Methods and systems for detecting and/or classifying cancer cells in a cell sample
JP5602717B2 (en) Method and system for automatic segmentation of high density cell populations
Valkonen et al. Metastasis detection from whole slide images using local features and random forests
JP4985480B2 (en) Method for classifying cancer cells, apparatus for classifying cancer cells, and program for classifying cancer cells
US8831327B2 (en) Systems and methods for tissue classification using attributes of a biomarker enhanced tissue network (BETN)
EP1922695B1 (en) Method of, and apparatus and computer software for, performing image processing
JP2021506013A (en) How to Calculate Tumor Spatial Heterogeneity and Intermarker Heterogeneity
CN109977780A (en) A kind of detection and recognition methods of the diatom based on deep learning algorithm
US20150004630A1 (en) Cell-based tissue analysis
JP7422235B2 (en) Non-tumor segmentation to aid tumor detection and analysis
CN113574534A (en) Machine learning using distance-based similarity labels
JP2023512560A (en) A federated learning system to train machine learning algorithms and maintain patient privacy
Tania et al. Intelligent image-based colourimetric tests using machine learning framework for lateral flow assays
JP2021535369A (en) Image-based assay with intelligent monitoring structure
Niederlein et al. Image analysis in high content screening
CN113178228B (en) Cell analysis method based on nuclear DNA analysis, computer device, and storage medium
Shakarami et al. Tcnn: A transformer convolutional neural network for artifact classification in whole slide images
Qidwai et al. Color-based Fuzzy Classifier for automated detection of cancerous cells in histopathological analysis
Sabata Digital pathology imaging-The next frontier in medical imaging

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120403

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120416

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4985480

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150511

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees