JP2009210465A - Method of classifying cancer cell, device for classifying cancer cell, and program for classifying cancer cell - Google Patents
Method of classifying cancer cell, device for classifying cancer cell, and program for classifying cancer cell Download PDFInfo
- Publication number
- JP2009210465A JP2009210465A JP2008054904A JP2008054904A JP2009210465A JP 2009210465 A JP2009210465 A JP 2009210465A JP 2008054904 A JP2008054904 A JP 2008054904A JP 2008054904 A JP2008054904 A JP 2008054904A JP 2009210465 A JP2009210465 A JP 2009210465A
- Authority
- JP
- Japan
- Prior art keywords
- data
- cancer cells
- input
- map
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 88
- 201000011510 cancer Diseases 0.000 title claims abstract description 86
- 238000000034 method Methods 0.000 title claims description 24
- 210000004027 cell Anatomy 0.000 claims abstract description 125
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 41
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 41
- 210000002569 neuron Anatomy 0.000 claims abstract description 31
- 238000013507 mapping Methods 0.000 claims abstract description 13
- 238000010586 diagram Methods 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 14
- 230000004845 protein aggregation Effects 0.000 claims description 9
- 230000008878 coupling Effects 0.000 claims description 4
- 238000010168 coupling process Methods 0.000 claims description 4
- 238000005859 coupling reaction Methods 0.000 claims description 4
- 230000002776 aggregation Effects 0.000 abstract description 8
- 239000006185 dispersion Substances 0.000 abstract 3
- 238000005054 agglomeration Methods 0.000 abstract 1
- 239000000126 substance Substances 0.000 description 8
- 238000004220 aggregation Methods 0.000 description 7
- 230000003834 intracellular effect Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 239000003814 drug Substances 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000022131 cell cycle Effects 0.000 description 2
- 238000004163 cytometry Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000001678 irradiating effect Effects 0.000 description 2
- 230000003211 malignant effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 101100367016 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) LSC2 gene Proteins 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/698—Matching; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
Description
本発明は、がん細胞を分類する方法、がん細胞を分類するための装置及びがん細胞を分類するためのプログラムに関し、特にレーザ走査サイトメータ(LSC)により取得された蛋白質データについて自己組織化マップ(SOM)を用いたがん細胞を分類する方法、がん細胞を分類するための装置及びがん細胞を分類するためのプログラムに関する。 The present invention relates to a method for classifying cancer cells, a device for classifying cancer cells, and a program for classifying cancer cells, and more particularly to self-organization of protein data acquired by a laser scanning cytometer (LSC). The present invention relates to a method for classifying cancer cells using a conversion map (SOM), an apparatus for classifying cancer cells, and a program for classifying cancer cells.
がんの検査、治療方針決定、さらには治療法および治療薬開発のために、患者からがん組織および細胞を摘出し、組織および細胞レベルで分析することが医学、薬学、生物学の分野で行われている。がんはその形態の違いからある程度は分類することが可能であるが(組織型の決定)、同一部位から摘出した同じ組織型のがんであっても、進行の速さ、治療薬に対する反応が一様ではないことがしばしばあり、形態学的特徴により決定される組織型分類よりさらに詳細な分類が医療分野では求められている。 In the fields of medicine, pharmacy, and biology, cancer tissue and cells are removed from patients and analyzed at the tissue and cell level for cancer testing, treatment policy determination, and treatment and drug development. Has been done. Cancers can be classified to some extent based on their morphology (determination of tissue type), but even if cancers of the same tissue type are removed from the same site, the speed of progression and response to therapeutic agents Often it is not uniform and a more detailed classification is required in the medical field than the histological classification determined by morphological features.
がん等の悪性細胞の検査、分類を行うことについては下記の文献に開示されるようなものがある。 Regarding the examination and classification of malignant cells such as cancer, there are those disclosed in the following literature.
特許文献1には、顕微鏡及びCCDカメラで得られた画像から分類装置により悪性細胞を検出するシステム及び方法について記載されている。これにより細胞の形状等視覚的な情報からのがん細胞の検出は可能であるが、同形状のがん細胞を分類することはできない。
特許文献2には、撮像された細胞の画像データからLab色空間のb座標値を取得し、その座標値を使用して細胞の色彩に関する特徴パラメータを用いて細胞を分類することについて記載されているが、この方法では細胞の色彩、形状により組織としての分類はなされるが、同形状の細胞を分類することはできない。
特許文献3には、健康状態の判断を行う方法として自己組織化マップを利用し、健康状態を自己組織化マップ上に表示することについて記載されているが、細胞の分類を行うものではない。
特許文献4には、MRIによって取得された画像を対象とし自己組織化マップを用いて所望の画像に容易に検索、アクセスできるようにすることについて記載されているが、細胞1つ1つのレベルの画像を対象とするものではなく、がん細胞の特徴を抽出し分類することはできない。
細胞内物質を定量する方法としてサイトメトリーという方法がある。これは蛍光色素単体あるいは蛍光色素を標識した抗体、DNAといった分子プローブで染色した試料となる細胞にレーザを照射し、発せられる蛍光量を測定することによって細胞の大きさ、細胞内物質の定量を行うものである。近年、このサイトメトリーの技術の一つとしてレーザ走査サイトメータ(LSC)が開発され、さらに細胞内物質の凝集度についても測定することができるようになった。このLSCにより多種多様ながん細胞のデータを取得し、タンパク質の量とその凝集度に着目した分析を行い、顕微鏡では分類が困難ながん細胞について分類することが試みられているが、これまでに有効な分類手法は見出されていない。
CCDカメラで撮影された画像を用いる従来のがん細胞の分類においては、がん細胞の視覚的な情報しか得られず、がん細胞の検出は行えるが、特徴抽出は限定されたものであった。また、ほぼ同形状のがん細胞はそれ以上の詳細な分類を行うことができなかった。そのため、がん細胞の特徴に基づいたさらに適格な情報を取得し、同形状のがん細胞についてもその特徴に基づいたより詳細な分類を行えるようにすることが求められていた。 In conventional classification of cancer cells using images taken with a CCD camera, only visual information about the cancer cells can be obtained and cancer cells can be detected, but feature extraction is limited. It was. In addition, cancer cells having almost the same shape could not be further classified. For this reason, it has been required to obtain more appropriate information based on the characteristics of cancer cells so that more detailed classification of cancer cells having the same shape can be performed based on the characteristics.
本発明は、前述した課題を解決すべくなしたものであり、本発明によるがん細胞を分類する方法は、レーザ走査サイトメータにより抽出されたがん細胞についてのデータを処理することによりがん細胞を分類する方法であって、がん細胞についてレーザ走査サイトメータで取得されたデータから必要なデータとして蛋白質量と蛋白質の凝集度のデータを切り出して散布図を作成することと、該散布図を示すデータを低次元化し入力データを作成することと、該入力データをそれぞれニューロンの集まりである入力層及びマップ層を有するネットワークの入力層に入力し前記入力層とマップ層との間での結合荷重についての学習を行ってトポロジカルマッピングを行うことにより自己組織化マップを形成することと、形成された自己組織化マップにおける蛋白質の分布形態によりがん細胞の特徴を判別しがん細胞の分類を行うことと、からなるものである。 The present invention has been made to solve the above-mentioned problems, and a method for classifying cancer cells according to the present invention is performed by processing data about cancer cells extracted by a laser scanning cytometer. A method for classifying cells, wherein data of protein mass and protein aggregation degree are cut out as necessary data from data acquired by a laser scanning cytometer for cancer cells, and a scatter diagram is created. The input data is input to the input layer of a network having an input layer and a map layer, each of which is a collection of neurons, and is input between the input layer and the map layer. A self-organizing map is formed by learning about connection weights and performing topological mapping, and the formed self-organizing map is formed. And carrying out the classification of cancer cells to determine the characteristics of the cancer cells by the distribution form of the protein in, it is made of.
本発明によるがん細胞を分類する装置は、レーザ走査サイトメータにより抽出されたがん細胞についてのデータを処理することによりがん細胞を分類する装置であって、がん細胞についてレーザ走査サイトメータで取得されたデータから必要なデータとして蛋白質量と蛋白質の凝集度のデータを切り出して散布図を作成する散布図作成手段と、前記散布図を示すデータを低次元化し入力データを作成する入力データ作成手段と、それぞれニューロンの集まりである入力層及びマップ層からなるネットワークを有し前記入力層とマップ層との間での結合荷重についての学習を行ってトポロジカルマッピングを行うことにより自己組織化マップを形成する自己組織化マップ形成手段と、からなるものである。
An apparatus for classifying cancer cells according to the present invention is an apparatus for classifying cancer cells by processing data about cancer cells extracted by a laser scanning cytometer, and the laser scanning cytometer for cancer cells. Scatter plot creating means for cutting out the data of protein mass and protein aggregation degree as necessary data from the data acquired in
また、本発明によるがん細胞を分類するためのプログラムは、レーザ走査サイトメータにより抽出されたがん細胞についてのデータを処理することによりがん細胞を分類することをコンピュータ上で行うためのプログラムであって、がん細胞についてレーザ走査サイトメータで取得されたデータから必要なデータとして蛋白質量と蛋白質の凝集度のデータを切り出して散布図を作成し、該散布図を示すデータを低次元化し入力データを作成し、該入力データをそれぞれニューロンの集まりである入力層及びマップ層を有するネットワークの入力層に入力し前記入力層とマップ層との間での結合荷重についての学習を行ってトポロジカルマッピングを行うことにより自己組織化マップを形成するようにしたものである。 In addition, the program for classifying cancer cells according to the present invention is a program for classifying cancer cells on a computer by processing data on cancer cells extracted by a laser scanning cytometer. However, from the data obtained with a laser scanning cytometer for cancer cells, the data of protein mass and protein aggregation degree are cut out as necessary data to create a scatter diagram, and the data indicating the scatter diagram is reduced in dimension. Create input data, input the input data to an input layer of a network having an input layer and a map layer, each of which is a collection of neurons, and learn about connection weights between the input layer and the map layer to obtain topological A self-organizing map is formed by mapping.
本発明では、レーザ走査サイトメータで取得されたがん細胞のデータについて自己組織化マップを用いた学習によりマッピングを行うことにより、がん細胞の特徴を抽出し分類することができ、同形状のがん細胞であっても細胞の特徴に基づいたさらに詳しい分類が可能となる。 In the present invention, cancer cell data acquired with a laser scanning cytometer can be extracted and classified by performing mapping using learning using a self-organizing map, and the same shape can be obtained. Even cancer cells can be classified in more detail based on the characteristics of the cells.
本発明によるがん細胞の分類では、データの解析による分類の手法として自己組織化マップ(SOM)を用いて細胞の分類を行う。SOMはニューラルネットワークにおける教師なし学習モデルの一つであり、学習により入力データの類似度を自動的に見出し、類似する入力同士をマップ層の近くに配置するトポロジカルマップを形成するものである。トポロジカルマップの形成に際し、レーザ走査サイトメータ(LSC)により抽出したがん細胞データから蛋白質の量とその凝集度の関係を表す画像データを作成し、その距離情報を学習によりマップ化して細胞の分類を行う。 In the classification of cancer cells according to the present invention, cells are classified using a self-organizing map (SOM) as a classification technique based on data analysis. The SOM is one of unsupervised learning models in a neural network, and automatically finds out the similarity of input data by learning, and forms a topological map in which similar inputs are arranged near the map layer. When forming a topological map, image data representing the relationship between the amount of protein and the degree of aggregation is created from cancer cell data extracted by a laser scanning cytometer (LSC), and the distance information is mapped by learning to classify cells. I do.
本発明によるがん細胞の分類は、レーザ走査サイトメータでの検出により細胞の試料から取得されたデータについて解析処理を行うことにより細胞の分類を行うものである。そこで、最初にレーザ走査サイトメータについて説明する。
〔レーザ走査サイトメータ〕
レーザ走査サイトメータ(以下、LSCという)は、細胞の試料にレーザを照射することによって細胞から発せられる散乱光や蛍光を検出する装置である。試料としてはスライドガラス上に培養あるいは貼り付けられた細胞を用いる。これらを測定対象とする細胞内物質(DNA、蛋白質、非ペプチド性物質、薬物など)に応じた方法で蛍光標識(染色)する。細胞はレーザで走査し、細胞から発せられる蛍光の輝度をフォトセンサーで検出し、検出された信号を変換することにより細胞の大きさ、細胞内物質の量、局在(位置情報)などが測定できる。
The classification of cancer cells according to the present invention classifies cells by performing analysis processing on data acquired from a sample of cells by detection with a laser scanning cytometer. First, a laser scanning cytometer will be described.
[Laser scanning cytometer]
A laser scanning cytometer (hereinafter referred to as LSC) is a device that detects scattered light and fluorescence emitted from a cell by irradiating a cell sample with a laser. As the sample, cells cultured or pasted on a slide glass are used. These are fluorescently labeled (stained) by a method according to the intracellular substance (DNA, protein, non-peptide substance, drug, etc.) to be measured. The cells are scanned with a laser, the brightness of the fluorescence emitted from the cells is detected with a photosensor, and the detected signal is converted to measure the size of the cell, the amount of intracellular material, localization (location information), etc. it can.
LSCでは、蛍光量を微小なピクセル単位で測定し、蛍光物質の量、面積等を測定する際に、同時に位置情報も取得する。1つの細胞として認識された領域内の全ピクセルの蛍光量を合算して1つの細胞における蛍光量(Integral)とし、その中で最も高い蛍光量を示すピクセルを極大ピクセル(Max pixel)とする。この極大ピクセルは、換言すれば蛍光物質の凝集度、すなわち測定する細胞内物質の凝集度を表す指標である。この極大ピクセルの値の値によってがん細胞周期を簡単に識別することができる。
〔細胞の試料〕
抗体は抗原と特異的に反応する特性がある。この性質を利用すれば細胞内物質を抗原抗体反応によって蛍光免疫染色することができる。LSCでは、図1に示すようなセルアレイ上に貼り付けた、あるいはセルアレイ上で培養された細胞について測定を行う。セルアレイはスライドガラス上に多数(例えば50個)の直径2mm程度の凹形のスポットが設けられたものであり、図の斜線部分が無蛍光インクによる印刷で盛り上がっている。スポットの配列された部分は縦16mm、横30mm程度の寸法である。セルアレイの1つのスポットの中には通常100〜500個程度のがん細胞がある。従来の方法では、1枚のスライドガラスで1種類の細胞について測定を行っていたが、セルアレイを使用することにより1度に多くのがん細胞のデータを取得することができる。
〔LSCのデータ〕
本発明においては、LSCとしてLSC2(オリンパス株式会社製)を使用している。LSCでの測定により得られるデータはテキスト形式のデータであり、その例を図2に示す。図2の形のデータについて概略説明すると、最初の部分はLSCの機器設定を表し、レーザの種類やセルアレイ上の細胞のある範囲等が設定される。その機器設定データに続いて、細胞一つ一つに関するNo、位置情報、直径、面積、周囲、DNAインデックス(DI)等のデータが記されている。
In LSC, the amount of fluorescence is measured in units of minute pixels, and when measuring the amount, area, etc. of the fluorescent material, position information is also acquired at the same time. The fluorescence amount of all the pixels in the region recognized as one cell is added to obtain the fluorescence amount (Integral) in one cell, and the pixel showing the highest fluorescence amount among them is defined as the maximum pixel (Max pixel). In other words, the maximum pixel is an index representing the aggregation degree of the fluorescent substance, that is, the aggregation degree of the intracellular substance to be measured. The cancer cell cycle can be easily identified by the value of the maximum pixel value.
[Cell samples]
Antibodies have the property of reacting specifically with antigens. If this property is utilized, the intracellular substance can be fluorescent immunostained by antigen-antibody reaction. In the LSC, measurement is performed on cells attached on a cell array as shown in FIG. 1 or cultured on the cell array. The cell array has a large number (for example, 50) of concave spots having a diameter of about 2 mm on a slide glass, and the hatched portion in the figure is raised by printing with non-fluorescent ink. The portion where the spots are arranged is about 16 mm long and 30 mm wide. There are usually about 100 to 500 cancer cells in one spot of the cell array. In the conventional method, one type of cell is measured with one slide glass. However, data of many cancer cells can be acquired at a time by using a cell array.
[LSC data]
In the present invention, LSC2 (manufactured by Olympus Corporation) is used as the LSC. Data obtained by LSC measurement is data in text format, and an example is shown in FIG. The data in the form of FIG. 2 will be described briefly. The first part represents LSC device settings, in which the type of laser, a certain range of cells on the cell array, and the like are set. Subsequent to the device setting data, data such as No, position information, diameter, area, circumference, and DNA index (DI) related to each cell are described.
細胞分類のための解析を行うに際して、機器設定については初期値を用いることにすれば、機器設定のデータを使用することなく、各細胞についてのデータを考慮すればよいことになる。また、各細胞についてのデータに関して、細胞が重なり合っているような不要なデータ(ゴミと称される)があるが、それらの不要なデータを削除し必要なデータを取得することになる。 When performing the analysis for cell classification, if the initial value is used for the device setting, the data for each cell may be considered without using the device setting data. Further, regarding the data about each cell, there is unnecessary data (referred to as garbage) in which cells overlap each other. However, the unnecessary data is deleted and necessary data is acquired.
必要なデータを取得するために、データ切り出しプログラム(例えばAWC:Any Where Cyte)を用い、テキスト形式のデータから蛋白質量等の必要なデータを選択形式で抽出することにより、セルアレイのスポットごとにデータが切り出され、そのデータをcsv形式で蓄積する。このcsv形式のデータの例は図3に示すようなものである。 In order to obtain the necessary data, data is extracted for each spot in the cell array by extracting the necessary data such as protein mass from the text format data in a selected format using a data extraction program (for example, AWC: Any Where Cyte). Is extracted and the data is stored in csv format. An example of the data in the csv format is as shown in FIG.
図3に示すデータのうち、細胞の分類に用いるのは蛋白質の量(Integral)と蛋白質の凝集度(Max Pixel)である。蛋白質の量は、がん細胞内に存在する蛋白質の量であり、凝集度は蛋白質ががん細胞内にどのように存在しているかを表す量である。蛋白質の凝集度はLSCを用いることにより新たに測定が可能になったものである。 In the data shown in FIG. 3, the amount of protein (Integral) and the degree of protein aggregation (Max Pixel) are used for cell classification. The amount of protein is the amount of protein present in the cancer cell, and the degree of aggregation is an amount representing how the protein is present in the cancer cell. The degree of protein aggregation can be newly measured by using LSC.
次に、図3のような切り出されたデータから散布図を作成する。散布図は、セルアレイのスポットごとにデータを抽出し、特定の蛋白質に蛋白質の量と凝集度とをパラメータとした分布特性を表すようなものであり、その例を図4(a)〜(c)に示す。図中の各点はがん細胞についてのデータを表している。これらの散布図において、蛋白質の違いにより点の集まりの形状、傾斜、密度等に違いがあることが見られるが、異種の蛋白質でも形状が似ている場合、同種のがん細胞、同種の蛋白質でも異なった形状になるというように多様であり、散布図を見ただけではデータの分類はできないため、SOMを用いてデータを分類する。
〔自己組織化マップ(SOM)〕
(1)SOMネットワークの構造
図5はSOMネットワークの構造を示すものである。ネットワークはそれぞれニューロンの集まりである入力層とマップ層との2層からなる。層内でのニューロンの結合はなく、入力層とマップ層との間ではニューロンが全結合になっている。マップ層では出力を視覚的に見るために、通常ニューロンが2次元に配置されている。
Next, a scatter diagram is created from the cut out data as shown in FIG. The scatter diagram is such that data is extracted for each spot of the cell array, and the distribution characteristic is expressed by using the amount of protein and the degree of aggregation as parameters for a specific protein, and examples thereof are shown in FIGS. ). Each point in the figure represents data on cancer cells. In these scatter plots, it can be seen that there are differences in the shape, slope, density, etc. of the cluster of points due to the difference in protein. However, there are various shapes such as different shapes, and data cannot be classified simply by looking at the scatter diagram. Therefore, data is classified using SOM.
[Self-Organizing Map (SOM)]
(1) Structure of SOM network FIG. 5 shows the structure of the SOM network. Each network consists of two layers, an input layer and a map layer, each of which is a collection of neurons. There is no neuron connection in the layer, and the neuron is fully connected between the input layer and the map layer. In the map layer, neurons are usually arranged in two dimensions in order to visually see the output.
時刻tにおいて入力層に入力ベクトル
x(t)=[x1(t),…,xi(t),…,xn(t)]
が与えられると、マップ層のニューロンは結合荷重
xj(t)=[wj1(t),…,wji(t),…,wjn(t)]
(wjiは入力層のi番目のニューロンとマップ層のj番目のニューロンとの間の荷重である。)を介して入力層からの入力を受け、学習のアルゴリズムに従って後述する学習を繰り返す。その結果、似た入力に対しては、マップ層の互いに近くのニューロンが反応するようになる。すなわち、ネットワークはトポロジカルマッピングを行う。
(2)SOMでの学習のアルゴリズム
入力層とマップ層との間でのニューロン間の結合荷重についての学習を行うことによりトポロジカルマッピングを行うのであるが、その学習のアルゴリズムを示す。
a.ネットワークの初期化
入力層とマップ層との間の結合荷重の初期値を乱数によって設定する。
b.入力ベクトルの入力
入力層に入力ベクトルx=(x1,…,xi,…,xn)を入力する。
c.入力ベクトルと結合荷重ベクトルの距離計算
入力ベクトルとマップ層の各ニューロンの結合荷重ベクトルの距離を計算する。入力ベクトルとマップ層のj番目のニューロンの結合荷重ベクトルとの距離djは
Input vector x (t) = [x 1 (t),..., X i (t),..., X n (t)] at time t
, The neuron of the map layer has a connection weight x j (t) = [w j1 (t),..., W ji (t) ,.
(W ji is a load between the i-th neuron in the input layer and the j-th neuron in the map layer.) The input from the input layer is received through, and learning described later is repeated according to the learning algorithm. As a result, nearby neurons in the map layer react to similar inputs. That is, the network performs topological mapping.
(2) Learning algorithm in SOM Topological mapping is performed by learning about the connection load between neurons between the input layer and the map layer. The learning algorithm is shown below.
a. Network initialization The initial value of the bond weight between the input layer and the map layer is set by a random number.
b. Input of input vector Input vector x = (x 1 ,..., X i ,..., X n ) is input to the input layer.
c. Calculating the distance between the input vector and the connection weight vector Calculate the distance between the input vector and the connection weight vector of each neuron in the map layer. The distance d j between the coupling weight vector of the j-th neuron of the input vector and map layer
d.勝者ニューロンの決定
距離djが最小となるニューロン、すなわち入力ベクトルに最も近い結合荷重ベクトルをもつマップ層でニューロンを選択する。このニューロンを勝者ニューロンと呼び、j*とする。
e.結合荷重と各パラメータの更新
勝者ニューロンとその近傍領域内の全てのニューロンの結合荷重を
Δwji=αh(j,j*)(x−wji)・・・・・・(2)
に基づいて更新する。この近傍関数h(j,j*)は
d. Determining the winner neuron Select the neuron with the smallest distance d j , that is, the map layer with the connection weight vector closest to the input vector. This neuron is called the winner neuron and is designated j * .
e. Connection weight and update of each parameter The connection weights of the winner neuron and all the neurons in the neighborhood are expressed as follows: Δw ji = αh (j, j * ) (x−w ji ) (2)
Update based on. This neighborhood function h (j, j * ) is
f.反復
bに戻り、bからeの過程を反復する。がん細胞、蛋白質についてLSCで取得されたデータを分散図データとし処理して得られた入力データについてSOMによる学習を行い、その結果として、がん細胞の特性を表すマップ図が得られる。
〔システムの構成〕
LSCで取得されたデータを処理して入力データとしSOMによる学習を行う過程をフローで示すと図6のようになる。LSCで取得されデータ処理を行って得られた散布図のデータについて、データ量を減らすために特徴を保持したまま低次元化する平滑化処理、グレースケール変換を行い、標本化を行う。この処理により例えば10×10=100次元まで次元を落とし、入力ベクトルを作成する。入力ベクトルの各要素は標本化後の散布図の画像の1ブロックに対応し、0〜255の値をもつ。
f. Return to iteration b and repeat the process from b to e. Learning by SOM is performed on the input data obtained by processing the data acquired by the LSC for cancer cells and proteins as scatter diagram data, and as a result, a map diagram representing the characteristics of the cancer cells is obtained.
[System configuration]
FIG. 6 is a flowchart showing a process of learning by SOM by processing data acquired by LSC and using it as input data. The scatter diagram data obtained by the data processing obtained by the LSC is sampled by performing a smoothing process and a gray scale conversion for reducing the dimensions while maintaining the characteristics in order to reduce the data amount. By this processing, for example, the dimension is reduced to 10 × 10 = 100 dimensions, and an input vector is created. Each element of the input vector corresponds to one block of the image of the scatter diagram after sampling, and has a value of 0 to 255.
SOMネットワークにおけるマップ層は例えば20×20=400のニューロンの2次元マップとし、マップ層の各ニューロンは100次元の結合荷重ベクトルをもつ。これは標本化後の散布図の画像全体に対応している。 The map layer in the SOM network is, for example, a two-dimensional map of 20 × 20 = 400 neurons, and each neuron in the map layer has a 100-dimensional connection weight vector. This corresponds to the entire image of the scatter diagram after sampling.
LSCで取得されたデータを処理して入力データとしSOMによる学習を行いがん細胞を分類するための装置は図7に示す構成を有する。この装置は、概略的にLSCで取得されたテキストデータを処理してSOM作成のための入力データとする入力データ生成部10と、入力データについて学習を行うSOM作成部20とを備えるものである。
A device for classifying cancer cells by processing data acquired by the LSC and using it as input data to perform learning by SOM has the configuration shown in FIG. This apparatus includes an input
入力データ生成部10は、LSCで取得されたテキストデータから必要なデータを切り出すデータ切り出し部と、切り出されたデータの低次元化を行いcvsデータに変換するデータ変換部と、変換されたcvsデータから散布図を作成する散布図作成部と、散布図のデータについて低次元化、標本化を行い入力信号とする入力データ生成部とを備えている。
The input
SOM生成部20は、入力データ生成部10において生成された入力データを入力し学習を行うニューラルネットワークの構成を備え、それぞれニューロンの集まりである入力層及びマップ層からなり、入力層とマップ層との間の結合荷重についての学習を行ってトポロジカルマッピングを行うことによりSOMを形成する。
〔分析例〕
5種のがん細胞と蛋白質4種についてSOMによる学習を行った結果について示す。がん細胞はKURAMOCHI,MKN1,MS−1,SW−13,WiDrであり、各がん細胞の蛋白質はL−26,LCA,RET,p27である。SOMによる学習は1種類の蛋白質当たり6枚の散布図の画像について15回行い、これを1サイクルとし、30サイクル反復する。1種類の蛋白質についての学習をサブ学習と呼び、その回数をサブ学習回数と言う。学習における各パラメータと学習回数を表1のように設定した。
The
[Example of analysis]
It shows about the result of having learned by SOM about five kinds of cancer cells and four kinds of proteins. The cancer cells are KURAMOCHI, MKN1, MS-1, SW-13, and WiDr, and the proteins of each cancer cell are L-26, LCA, RET, and p27. Learning by SOM is performed 15 times for 6 scatterplot images per type of protein, which is defined as one cycle, and is repeated 30 cycles. Learning about one type of protein is called sub-learning, and the number of times is called sub-learning. Each parameter in learning and the number of learning were set as shown in Table 1.
マッピングした結果の全てのマップでXが見られる。これは、2種類以上の蛋白質においてその散布図のデータが類似していることを示しているが、この結果から特徴的な蛋白質が存在することがわかる。例えば、図8において、A1〜A4やD1、D2はXとは異なる場所にマッピングされているが、これは、同じ種類のがん細胞データであっても、散布図に違いがあるということを示している。 X is seen in all maps resulting from mapping. This indicates that the data of the scatter plots are similar for two or more types of proteins, and it can be seen from this result that a characteristic protein exists. For example, in FIG. 8, A1 to A4, D1, and D2 are mapped to different locations from X, but this means that there is a difference in the scatter diagram even for the same type of cancer cell data. Show.
がん細胞のデータを取得する際、細胞の周期や蛋白質のデータの取得に要する時間が異なるということがあり、このことから、A1〜A4が示すL−26とD1、D2が示すp27はがん細胞KURAMOCHIにおいて時間的に変化があるもので、他と区別される特徴的な蛋白質データであることが考えられる。 When acquiring cancer cell data, the time required for acquiring cell cycle and protein data may differ, and from this, L-26 indicated by A1 to A4 and p27 indicated by D1 and D2 are different. It is considered that this is characteristic protein data that is different from others because it changes with time in cancer cells KURAMOCHI.
図8〜12に示した5種のがん細胞についての結果から、各がん細胞において時間的に変化する特徴的な蛋白質を表2に示す。 Table 2 shows characteristic proteins that change with time in each cancer cell based on the results for the five types of cancer cells shown in FIGS.
本発明は、LSCで取得されたがん細胞のデータについてSOMによる学習の結果として自己組織化マップを形成しがん細胞を分類する方法であり、また、
LSCで取得されたテキストデータを処理してSOM作成のための入力データとする入力データ生成部と、入力データについて学習を行うSOM作成部とを備えるがん細胞を分類するための装置でもある。
The present invention is a method for classifying cancer cells by forming a self-organizing map as a result of learning by SOM on cancer cell data acquired by LSC,
It is also an apparatus for classifying cancer cells, which includes an input data generation unit that processes text data acquired by the LSC to be input data for SOM generation, and an SOM generation unit that learns about the input data.
さらにLSCで取得されたがん細胞のデータについて必要な処理を行った上で自己組織化マップでの学習を行うことは独自のデータ処理手段を備えた装置として構成するほか、汎用コンピュータにより実行することができ、そのためのプログラムは、がん細胞についてレーザ走査サイトメータで取得されたデータから必要なデータとして蛋白質量と蛋白質の凝集度のデータを切り出して散布図を作成し、散布図を示すデータを低次元化し入力データを作成し、入力データをそれぞれニューロンの集まりである入力層及びマップ層を有するネットワークの入力層に入力し前記入力層とマップ層との間での結合荷重についての学習を行ってトポロジカルマッピングを行うことにより自己組織化マップを形成するものである。 Furthermore, performing the necessary processing on the cancer cell data acquired by the LSC and then learning with the self-organizing map is configured as a device equipped with an original data processing means, and is executed by a general-purpose computer. Data that shows the scatter diagram can be created by cutting out the protein mass and protein aggregation data as necessary data from the data acquired with a laser scanning cytometer for cancer cells. The input data is input to the input layer of the network having the input layer and the map layer, each of which is a collection of neurons, and learning about the coupling load between the input layer and the map layer is performed. A self-organizing map is formed by performing topological mapping.
10 入力データ生成部
20 SOM作成部
10 Input
Claims (3)
がん細胞についてレーザ走査サイトメータで取得されたデータから必要なデータとして蛋白質量と蛋白質の凝集度のデータを切り出して散布図を作成することと、
該散布図を示すデータを低次元化し入力データを作成することと、
該入力データをそれぞれニューロンの集まりである入力層及びマップ層を有するネットワークの入力層に入力し前記入力層とマップ層との間での結合荷重についての学習を行ってトポロジカルマッピングを行うことにより自己組織化マップを形成することと、
形成された自己組織化マップにおける蛋白質の分布形態によりがん細胞の特徴を判別しがん細胞の分類を行うことと、
からなることを特徴とするがん細胞を分類する方法。 A method of classifying cancer cells by processing data about cancer cells extracted by a laser scanning cytometer,
Cutting out the data of protein mass and protein aggregation degree as necessary data from the data acquired with a laser scanning cytometer for cancer cells, and creating a scatter plot,
Reducing the data representing the scatter diagram to create input data;
The input data is input to an input layer of a network having an input layer and a map layer, each of which is a collection of neurons, and learning is performed on the connection weight between the input layer and the map layer to perform topological mapping. Forming an organizational map;
Classifying the cancer cells by distinguishing the characteristics of the cancer cells according to the protein distribution in the self-organizing map formed,
A method for classifying cancer cells characterized by comprising:
がん細胞についてレーザ走査サイトメータで取得されたデータから必要なデータとして蛋白質量と蛋白質の凝集度のデータを切り出して散布図を作成する散布図作成手段と、
前記散布図を示すデータを低次元化し入力データを作成する入力データ作成手段と、
それぞれニューロンの集まりである入力層及びマップ層からなるネットワークを有し前記入力層とマップ層との間での結合荷重についての学習を行ってトポロジカルマッピングを行うことにより自己組織化マップを形成する自己組織化マップ形成手段と、
からなることを特徴とするがん細胞を分類するための装置。 An apparatus for classifying cancer cells by processing data about cancer cells extracted by a laser scanning cytometer,
Scatter plot creation means for cutting out data on protein mass and protein aggregation degree as necessary data from data acquired with a laser scanning cytometer for cancer cells,
Input data creating means for creating input data by reducing the data representing the scatter diagram;
Self that has a network composed of an input layer and a map layer, each of which is a collection of neurons, and forms a self-organizing map by learning about connection weights between the input layer and the map layer and performing topological mapping An organizing map forming means;
An apparatus for classifying cancer cells, characterized by comprising:
A program for performing on a computer to classify cancer cells by processing data about cancer cells extracted by a laser scanning cytometer, which was obtained with a laser scanning cytometer Cut out the data of protein mass and protein aggregation degree as necessary data, create a scatter diagram, reduce the data showing the scatter diagram to create input data, and each input data is a collection of neurons A self-organizing map is formed by inputting into an input layer of a network having an input layer and a map layer, learning about a coupling load between the input layer and the map layer, and performing topological mapping. A program for classifying cancer cells characterized by.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008054904A JP4985480B2 (en) | 2008-03-05 | 2008-03-05 | Method for classifying cancer cells, apparatus for classifying cancer cells, and program for classifying cancer cells |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008054904A JP4985480B2 (en) | 2008-03-05 | 2008-03-05 | Method for classifying cancer cells, apparatus for classifying cancer cells, and program for classifying cancer cells |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009210465A true JP2009210465A (en) | 2009-09-17 |
JP4985480B2 JP4985480B2 (en) | 2012-07-25 |
Family
ID=41183767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008054904A Expired - Fee Related JP4985480B2 (en) | 2008-03-05 | 2008-03-05 | Method for classifying cancer cells, apparatus for classifying cancer cells, and program for classifying cancer cells |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4985480B2 (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011107093A (en) * | 2009-11-20 | 2011-06-02 | Jx Nippon Oil & Energy Corp | Apparatus and method for diagnosing abnormality of vibrating body |
JP2018529134A (en) * | 2015-06-02 | 2018-10-04 | 寛 陳 | Medical data analysis method based on deep learning and its intelligent analyzer |
KR101927852B1 (en) * | 2016-06-10 | 2018-12-13 | 주식회사 토모큐브 | Method and Apparatus for Identifying Cell Species Using 3D Refractive Index Tomography and Machine Learning Algorithm |
CN110520876A (en) * | 2017-03-29 | 2019-11-29 | 新克赛特株式会社 | Learning outcome output device and learning outcome output program |
WO2020044665A1 (en) * | 2018-08-31 | 2020-03-05 | 日本電気株式会社 | Classification device, classification method, and recording medium |
US11020996B2 (en) | 2018-01-10 | 2021-06-01 | Seiko Epson Corporation | Abnormality warning method and abnormality warning system |
CN114364965A (en) * | 2019-09-02 | 2022-04-15 | 合同会社予幸集团中央研究所 | Gate area estimation program, gate area estimation device, and learning model generation method |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000279168A (en) * | 1999-03-31 | 2000-10-10 | Olympus Optical Co Ltd | Analysis of chromosome and device therefor |
JP2001523334A (en) * | 1997-03-25 | 2001-11-20 | アプライド スペクトラル イメージング リミテッド | Spectral bioimaging method for cell classification |
WO2005050479A1 (en) * | 2003-11-21 | 2005-06-02 | National University Corporation Kochi University | Similar pattern searching apparatus, method of similar pattern searching, program for similar pattern searching, and fractionation apparatus |
JP2006235971A (en) * | 2005-02-24 | 2006-09-07 | Japan Science & Technology Agency | Image referencing apparatus and method for classifying and searching for image |
WO2007008583A2 (en) * | 2005-07-07 | 2007-01-18 | Kohne David E | Improved protein expression comparison assay results and applications |
-
2008
- 2008-03-05 JP JP2008054904A patent/JP4985480B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001523334A (en) * | 1997-03-25 | 2001-11-20 | アプライド スペクトラル イメージング リミテッド | Spectral bioimaging method for cell classification |
JP2000279168A (en) * | 1999-03-31 | 2000-10-10 | Olympus Optical Co Ltd | Analysis of chromosome and device therefor |
WO2005050479A1 (en) * | 2003-11-21 | 2005-06-02 | National University Corporation Kochi University | Similar pattern searching apparatus, method of similar pattern searching, program for similar pattern searching, and fractionation apparatus |
JP2006235971A (en) * | 2005-02-24 | 2006-09-07 | Japan Science & Technology Agency | Image referencing apparatus and method for classifying and searching for image |
WO2007008583A2 (en) * | 2005-07-07 | 2007-01-18 | Kohne David E | Improved protein expression comparison assay results and applications |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011107093A (en) * | 2009-11-20 | 2011-06-02 | Jx Nippon Oil & Energy Corp | Apparatus and method for diagnosing abnormality of vibrating body |
JP2018529134A (en) * | 2015-06-02 | 2018-10-04 | 寛 陳 | Medical data analysis method based on deep learning and its intelligent analyzer |
US11200982B2 (en) | 2015-06-02 | 2021-12-14 | Infervision Medical Technology Co., Ltd. | Method for analysing medical treatment data based on deep learning and intelligence analyser thereof |
KR101927852B1 (en) * | 2016-06-10 | 2018-12-13 | 주식회사 토모큐브 | Method and Apparatus for Identifying Cell Species Using 3D Refractive Index Tomography and Machine Learning Algorithm |
CN110520876A (en) * | 2017-03-29 | 2019-11-29 | 新克赛特株式会社 | Learning outcome output device and learning outcome output program |
CN110520876B (en) * | 2017-03-29 | 2024-05-14 | 新克赛特株式会社 | Learning result output device and learning result output program |
US11020996B2 (en) | 2018-01-10 | 2021-06-01 | Seiko Epson Corporation | Abnormality warning method and abnormality warning system |
WO2020044665A1 (en) * | 2018-08-31 | 2020-03-05 | 日本電気株式会社 | Classification device, classification method, and recording medium |
JPWO2020044665A1 (en) * | 2018-08-31 | 2021-08-10 | 日本電気株式会社 | Classification device, classification method and program |
JP7132553B2 (en) | 2018-08-31 | 2022-09-07 | 日本電気株式会社 | Classifier, classification method and program |
US11983612B2 (en) | 2018-08-31 | 2024-05-14 | Nec Corporation | Classification device, classification method, and recording medium |
CN114364965A (en) * | 2019-09-02 | 2022-04-15 | 合同会社予幸集团中央研究所 | Gate area estimation program, gate area estimation device, and learning model generation method |
Also Published As
Publication number | Publication date |
---|---|
JP4985480B2 (en) | 2012-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11842556B2 (en) | Image analysis method, apparatus, program, and learned deep learning algorithm | |
JP7197584B2 (en) | Methods for storing and retrieving digital pathology analysis results | |
US12094105B2 (en) | System and method for automatic labeling of pathology images | |
Bjornsson et al. | Associative image analysis: a method for automated quantification of 3D multi-parameter images of brain tissue | |
CN108107197B (en) | Methods and systems for detecting and/or classifying cancer cells in a cell sample | |
Valkonen et al. | Metastasis detection from whole slide images using local features and random forests | |
US10176579B2 (en) | Tissue object-based machine learning system for automated scoring of digital whole slides | |
JP5602717B2 (en) | Method and system for automatic segmentation of high density cell populations | |
JP4985480B2 (en) | Method for classifying cancer cells, apparatus for classifying cancer cells, and program for classifying cancer cells | |
EP1922695B1 (en) | Method of, and apparatus and computer software for, performing image processing | |
US8831327B2 (en) | Systems and methods for tissue classification using attributes of a biomarker enhanced tissue network (BETN) | |
JP2021506013A (en) | How to Calculate Tumor Spatial Heterogeneity and Intermarker Heterogeneity | |
JP7422235B2 (en) | Non-tumor segmentation to aid tumor detection and analysis | |
CN113574534A (en) | Machine learning using distance-based similarity labels | |
US20150004630A1 (en) | Cell-based tissue analysis | |
JP2023512560A (en) | A federated learning system to train machine learning algorithms and maintain patient privacy | |
JP2021535369A (en) | Image-based assay with intelligent monitoring structure | |
Niederlein et al. | Image analysis in high content screening | |
Shakarami et al. | Tcnn: A transformer convolutional neural network for artifact classification in whole slide images | |
CN113178228A (en) | Cell analysis method based on nuclear DNA analysis, computer device, and storage medium | |
Qidwai et al. | Color-based Fuzzy Classifier for automated detection of cancerous cells in histopathological analysis | |
Kucarov et al. | Single cell position determination and transformation from static high-resolution digital image to laser-microdissector coordinate system using image processing techniques | |
Sabata | Digital pathology imaging-The next frontier in medical imaging | |
Zamojski et al. | EpidermaQuant: Unsupervised detection and quantification of epidermal differentiation markers on H-DAB-stained images of reconstructed human epidermis | |
Schwendy | Image segmentation in microscopic single cell analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101124 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120403 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120416 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4985480 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150511 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |