JP6665999B2 - データ処理装置、決定木生成方法、識別装置及びプログラム - Google Patents
データ処理装置、決定木生成方法、識別装置及びプログラム Download PDFInfo
- Publication number
- JP6665999B2 JP6665999B2 JP2015145634A JP2015145634A JP6665999B2 JP 6665999 B2 JP6665999 B2 JP 6665999B2 JP 2015145634 A JP2015145634 A JP 2015145634A JP 2015145634 A JP2015145634 A JP 2015145634A JP 6665999 B2 JP6665999 B2 JP 6665999B2
- Authority
- JP
- Japan
- Prior art keywords
- decision tree
- feature
- learning data
- data processing
- processing device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003066 decision tree Methods 0.000 title claims description 187
- 238000012545 processing Methods 0.000 title claims description 109
- 238000000034 method Methods 0.000 title claims description 59
- 210000004027 cell Anatomy 0.000 claims description 62
- 210000003855 cell nucleus Anatomy 0.000 claims description 58
- 238000004458 analytical method Methods 0.000 claims description 48
- 239000002246 antineoplastic agent Substances 0.000 claims description 36
- 230000008569 process Effects 0.000 claims description 29
- 206010028980 Neoplasm Diseases 0.000 claims description 27
- 201000011510 cancer Diseases 0.000 claims description 25
- 208000014018 liver neoplasm Diseases 0.000 claims description 2
- 210000005229 liver cell Anatomy 0.000 claims 2
- 239000013598 vector Substances 0.000 description 51
- 238000010586 diagram Methods 0.000 description 24
- 230000001575 pathological effect Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 10
- 210000003494 hepatocyte Anatomy 0.000 description 6
- 229940041181 antineoplastic drug Drugs 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000001186 cumulative effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 238000010827 pathological analysis Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002440 hepatic effect Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Landscapes
- Investigating Or Analysing Biological Materials (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Description
特に、細胞画像に与えられたラベルと、前記細胞画像から抽出された複数の特徴量と、を1組とする学習データを入力する入力部と、
サンプルの前記ラベルに相当する情報を識別するための決定木を、前記学習データに基づいて生成する、決定木生成部と、
前記複数の特徴量のなかから、前記決定木生成部による決定木の生成に用いられる特徴量を選択する、特徴量選択部と、を備え
前記特徴量選択部は、
前記学習データに基づく決定木の生成と、
前記生成された決定木の分岐条件に含まれる特徴量それぞれの品質の算出と、
前記品質が算出された特徴量それぞれの重要度の算出と、
前記算出された重要度に基づき、前記学習データに含まれる複数の特徴量から所定の数の特徴量を削除して新たな学習データを生成することと、
前記新たな学習データに含まれる特徴量が、所定の条件を満たすか否かの判定と、
を複数回繰り返すことで、前記決定木生成部による決定木の生成に用いられる特徴量の絞り込みを行う、
データ処理装置が提供される。
特に、細胞画像に与えられたラベルと、前記細胞画像から抽出された複数の特徴量と、を1組とする学習データを入力するステップと、
サンプルの前記ラベルに相当する情報を識別するための決定木を、前記学習データに基づいて生成するステップと、
前記複数の特徴量のなかから、決定木の生成に用いられる特徴量を選択するステップと、を含み、
前記特徴量を選択するステップにおいて、
前記学習データに基づく決定木の生成と、
前記生成された決定木の分岐条件に含まれる特徴量それぞれの品質の算出と、
前記品質が算出された特徴量それぞれの重要度の算出と、
前記算出された重要度に基づき、前記学習データに含まれる複数の特徴量から所定の数の特徴量を削除して新たな学習データを生成することと、
前記新たな学習データに含まれる特徴量が、所定の条件を満たすか否かの判定と、
を複数回繰り返すことで、決定木の生成に用いられる特徴量の絞り込みを行う、
決定木生成方法が提供される
特に、細胞画像に与えられたラベルと、前記細胞画像から抽出された複数の特徴量と、を1組とする学習データを入力する処理と、
サンプルの前記ラベルに相当する情報を識別するための決定木を、前記学習データに基づいて生成する処理と、
前記複数の特徴量のなかから、決定木の生成に用いられる特徴量を選択する処理と、をデータ処理装置に搭載されたコンピュータに実行させ、
前記特徴量を選択する処理において、
前記学習データに基づく決定木の生成と、
前記生成された決定木の分岐条件に含まれる特徴量それぞれの品質の算出と、
前記品質が算出された特徴量それぞれの重要度の算出と、
前記算出された重要度に基づき、前記学習データに含まれる複数の特徴量から所定の数の特徴量を削除して新たな学習データを生成することと、
前記新たな学習データに含まれる特徴量が、所定の条件を満たすか否かの判定と、
を複数回繰り返すことで、決定木の生成に用いられる特徴量の絞り込みを行う、
プログラムが提供される。
なお、このプログラムは、コンピュータが読み取り可能な記憶媒体に記録することができる。記憶媒体は、半導体メモリ、ハードディスク、磁気記録媒体、光記録媒体等の非トランジェント(non-transient)なものとすることができる。本発明は、コンピュータプログラム製品として具現することも可能である。
第1の実施形態について、図面を用いてより詳細に説明する。
但し、Sが細胞核の面積であり、Lは細胞核の周長である。
但し、式(2)のPiはクラスiの確率を示す。
・・・(3)
次に、第1の実施形態にて説明した決定木の生成方法を適用した場合の例について説明する。ここでは、1105人の患者の肝細胞から生成した注視領域画像データ(細胞画像の一部)から特徴量ベクトルを生成し、最終的に4つの特徴量に絞り込んだ学習データ(図19参照)から決定木を生成した場合を説明する。なお、図19において、細胞核の大きさに関する特徴量F1−3は、細胞核領域をなす画素数を用いている。
続いて、第2の実施形態について図面を参照して詳細に説明する。
上述の第1の視点に係るデータ処理装置のとおりである。
[付記2]
前記複数の特徴量のなかから、前記決定木生成部による決定木の生成に用いられる特徴量を選択する、特徴量選択部をさらに備える、付記1のデータ処理装置。
[付記3]
前記特徴量選択部は、
前記学習データに基づく決定木の生成と、
前記生成された決定木の分岐条件に含まれる特徴量それぞれの品質の算出と、
前記品質が算出された特徴量それぞれの重要度の算出と、
前記算出された重要度に基づき、前記学習データに含まれる複数の特徴量から所定の数の特徴量を削除して新たな学習データを生成することと、
前記新たな学習データに含まれる特徴量が、所定の条件を満たすか否かの判定と、
を繰り返すことで、前記決定木生成部による決定木の生成に用いられる特徴量の選択を行う、付記2のデータ処理装置。
[付記4]
前記入力部は、前記学習データと共に、前記細胞画像を識別する識別子により前記細胞画像に関連付けられた付随情報を入力し、
前記決定木生成部による決定木による分類結果それぞれが有する特徴を、前記付随情報に基づき解析する、解析部をさらに備える、付記1乃至3のいずれか一に記載のデータ処理装置。
[付記5]
前記解析部は、
前記付随情報が、前記細胞画像の識別子に対応する患者に対する抗癌剤の有効性に関する結果である場合には、前記分類結果それぞれに含まれる前記細胞画像の識別子に対応する患者への抗癌剤の有効性を解析結果として出力する、付記4のデータ処理装置。
[付記6]
前記解析部は、
前記付随情報が、前記細胞画像の識別子に対応する患者が癌を再発するまでの期間に関する情報である場合には、前記分類結果それぞれに含まれる前記細胞画像の識別子に対応する患者の癌再発に関する傾向を解析結果として出力する、付記4のデータ処理装置。
[付記7]
前記決定木生成部が生成する決定木には、前記細胞画像に含まれる細胞核の大きさ、円形度、一様性及びコントラストのうち少なくとも1つが分岐条件に含まれる、付記1乃至6のいずれか一に記載のデータ処理装置。
[付記8]
前記決定木生成部が生成する決定木は、ルートノードからの最初の分岐条件に、前記細胞画像に含まれる細胞核の円形度を含む、付記1乃至7のいずれか一に記載のデータ処理装置。
[付記9]
前記細胞画像は、肝細胞から得られる画像であり、前記細胞画像に与えられたラベルは前記肝細胞の癌に関するグレード又は患者の癌再発に関する情報である、付記1乃至8のいずれか一に記載のデータ処理装置。
[付記10]
上述の第2の視点に係る決定木生成方法のとおりである。
[付記11]
上述の第3の視点に係る識別装置のとおりである。
[付記12]
上述の第4の視点に係るプログラムのとおりである。
なお、付記10〜12の形態は、付記1の形態と同様に、付記2の形態〜付記9の形態に展開することが可能である。
11、21、101 入力部
12 特徴量ベクトル生成部
13 学習データ出力部
14、25、34 記憶部
20、20a、20b データ処理装置
22 特徴量選択部
23、102 決定木生成部
24 出力部
26 解析部
27 識別部
30 識別装置
100 データ処理装置
201、202 細胞核領域
211 境界線
212 長軸長
213 短軸長
301〜307 分岐条件
401〜405 分類結果
Claims (11)
- 細胞画像に与えられたラベルと、前記細胞画像から抽出された複数の特徴量と、を1組とする学習データを入力する入力部と、
サンプルの前記ラベルに相当する情報を識別するための決定木を、前記学習データに基づいて生成する、決定木生成部と、
前記複数の特徴量のなかから、前記決定木生成部による決定木の生成に用いられる特徴量を選択する、特徴量選択部と、を備え
前記特徴量選択部は、
前記学習データに基づく決定木の生成と、
前記生成された決定木の分岐条件に含まれる特徴量それぞれの品質の算出と、
前記品質が算出された特徴量それぞれの重要度の算出と、
前記算出された重要度に基づき、前記学習データに含まれる複数の特徴量から所定の数の特徴量を削除して新たな学習データを生成することと、
前記新たな学習データに含まれる特徴量が、所定の条件を満たすか否かの判定と、
を複数回繰り返すことで、前記決定木生成部による決定木の生成に用いられる特徴量の絞り込みを行う、
データ処理装置。 - 前記特徴量選択部は、
決定木の分岐条件それぞれの品質の総和に対する特徴量の品質の割合を前記特徴量の重要度として算出する、請求項1に記載のデータ処理装置。 - 前記入力部は、前記学習データと共に、前記細胞画像を識別する識別子により前記細胞画像に関連付けられた付随情報を入力し、
前記決定木生成部による決定木による分類結果それぞれが有する特徴を、前記付随情報に基づき解析する、解析部をさらに備える、請求項1又は2に記載のデータ処理装置。 - 前記解析部は、
前記付随情報が、前記細胞画像の識別子に対応する患者に対する抗癌剤の有効性に関する結果である場合には、前記分類結果それぞれに含まれる前記細胞画像の識別子に対応する患者への抗癌剤の有効性を解析結果として出力する、請求項3のデータ処理装置。 - 前記解析部は、
前記付随情報が、前記細胞画像の識別子に対応する患者が癌を再発するまでの期間に関する情報である場合には、前記分類結果それぞれに含まれる前記細胞画像の識別子に対応する患者の癌再発に関する傾向を解析結果として出力する、請求項3のデータ処理装置。 - 前記決定木生成部が生成する決定木には、前記細胞画像に含まれる細胞核の大きさ、円形度、一様性及びコントラストのうち少なくとも1つが分岐条件に含まれる、請求項1乃至5のいずれか一項に記載のデータ処理装置。
- 前記決定木生成部が生成する決定木は、ルートノードからの最初の分岐条件に、前記細胞画像に含まれる細胞核の円形度を含む、請求項1乃至6のいずれか一項に記載のデータ処理装置。
- 前記細胞画像は、肝細胞から得られる画像であり、前記細胞画像に与えられたラベルは前記肝細胞の癌に関するグレード又は患者の癌再発に関する情報である、請求項1乃至7のいずれか一項に記載のデータ処理装置。
- 細胞画像に与えられたラベルと、前記細胞画像から抽出された複数の特徴量と、を1組とする学習データを入力するステップと、
サンプルの前記ラベルに相当する情報を識別するための決定木を、前記学習データに基づいて生成するステップと、
前記複数の特徴量のなかから、決定木の生成に用いられる特徴量を選択するステップと、を含み、
前記特徴量を選択するステップにおいて、
前記学習データに基づく決定木の生成と、
前記生成された決定木の分岐条件に含まれる特徴量それぞれの品質の算出と、
前記品質が算出された特徴量それぞれの重要度の算出と、
前記算出された重要度に基づき、前記学習データに含まれる複数の特徴量から所定の数の特徴量を削除して新たな学習データを生成することと、
前記新たな学習データに含まれる特徴量が、所定の条件を満たすか否かの判定と、
を複数回繰り返すことで、決定木の生成に用いられる特徴量の絞り込みを行う、
決定木生成方法。 - 請求項9の決定木生成方法により生成された決定木を用いて、サンプルの識別を行う識別装置。
- 細胞画像に与えられたラベルと、前記細胞画像から抽出された複数の特徴量と、を1組とする学習データを入力する処理と、
サンプルの前記ラベルに相当する情報を識別するための決定木を、前記学習データに基づいて生成する処理と、
前記複数の特徴量のなかから、決定木の生成に用いられる特徴量を選択する処理と、をデータ処理装置に搭載されたコンピュータに実行させ、
前記特徴量を選択する処理において、
前記学習データに基づく決定木の生成と、
前記生成された決定木の分岐条件に含まれる特徴量それぞれの品質の算出と、
前記品質が算出された特徴量それぞれの重要度の算出と、
前記算出された重要度に基づき、前記学習データに含まれる複数の特徴量から所定の数の特徴量を削除して新たな学習データを生成することと、
前記新たな学習データに含まれる特徴量が、所定の条件を満たすか否かの判定と、
を複数回繰り返すことで、決定木の生成に用いられる特徴量の絞り込みを行う、
プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015145634A JP6665999B2 (ja) | 2015-07-23 | 2015-07-23 | データ処理装置、決定木生成方法、識別装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015145634A JP6665999B2 (ja) | 2015-07-23 | 2015-07-23 | データ処理装置、決定木生成方法、識別装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017026482A JP2017026482A (ja) | 2017-02-02 |
JP6665999B2 true JP6665999B2 (ja) | 2020-03-13 |
Family
ID=57949586
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015145634A Active JP6665999B2 (ja) | 2015-07-23 | 2015-07-23 | データ処理装置、決定木生成方法、識別装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6665999B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6860073B2 (ja) * | 2017-06-20 | 2021-04-14 | 日本電気株式会社 | グラフ構造解析装置、グラフ構造解析方法、及びプログラム |
JP2019035664A (ja) * | 2017-08-16 | 2019-03-07 | 学校法人東京医科大学 | 肝細胞がんの再発の可能性を試験するシステム |
JP2019061598A (ja) * | 2017-09-28 | 2019-04-18 | Heroz株式会社 | 生産管理装置および生産管理方法 |
JP7438191B2 (ja) | 2019-03-22 | 2024-02-26 | 株式会社Nttドコモ | 情報処理装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5740101B2 (ja) * | 2010-04-23 | 2015-06-24 | 国立大学法人名古屋大学 | 細胞評価装置、インキュベータ、細胞評価方法、細胞評価プログラムおよび細胞の培養方法 |
JP6144916B2 (ja) * | 2012-01-30 | 2017-06-07 | キヤノン株式会社 | 生体組織画像のノイズ低減処理方法及び装置 |
JP5413501B1 (ja) * | 2012-12-07 | 2014-02-12 | 富士ゼロックス株式会社 | 画像処理装置、画像処理システム及びプログラム |
-
2015
- 2015-07-23 JP JP2015145634A patent/JP6665999B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017026482A (ja) | 2017-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Zoom-in-net: Deep mining lesions for diabetic retinopathy detection | |
US10733726B2 (en) | Pathology case review, analysis and prediction | |
Kothari et al. | Pathology imaging informatics for quantitative analysis of whole-slide images | |
Ghahremani et al. | Deep learning-inferred multiplex immunofluorescence for immunohistochemical image quantification | |
Yi et al. | Optimizing and visualizing deep learning for benign/malignant classification in breast tumors | |
JP6665999B2 (ja) | データ処理装置、決定木生成方法、識別装置及びプログラム | |
JP6324338B2 (ja) | 細胞診断支援装置、細胞診断支援方法、遠隔診断支援システム、及びサービス提供システム | |
JP5576775B2 (ja) | 画像処理装置、画像処理方法、及び画像処理プログラム | |
JP2006153742A (ja) | 病理診断支援装置、病理診断支援プログラム、病理診断支援方法、及び病理診断支援システム | |
Liu et al. | Deep learning for image-based large-flowered chrysanthemum cultivar recognition | |
TWI764287B (zh) | 用於組織分割之機器學習模型的交互式訓練 | |
Sangeetha et al. | An empirical analysis of machine learning frameworks for digital pathology in medical science | |
JP2018180794A (ja) | 画像診断支援装置及び画像診断支援システム、並びに画像診断支援方法 | |
Sikpa et al. | Automated detection and quantification of breast cancer brain metastases in an animal model using democratized machine learning tools | |
Goldstein et al. | An attraction–repulsion point process model for respiratory syncytial virus infections | |
Schmarje et al. | 2D and 3D segmentation of uncertain local collagen fiber orientations in SHG microscopy | |
Shen et al. | Randstainna: Learning stain-agnostic features from histology slides by bridging stain augmentation and normalization | |
dos Santos et al. | Automated detection of tumor regions from oral histological whole slide images using fully convolutional neural networks | |
Han et al. | Nuclei counting in microscopy images with three dimensional generative adversarial networks | |
Kromp et al. | Deep Learning architectures for generalized immunofluorescence based nuclear image segmentation | |
JP2022532615A (ja) | マルチパラメータ細胞・細胞内撮像データから細胞表現型多様性を特徴付けるシステム及び方法 | |
Geurts et al. | Visual comparison of 3D medical image segmentation algorithms based on statistical shape models | |
Pandey et al. | An integrated approach for breast cancer classification | |
US11222194B2 (en) | Automated system and method for creating and executing a scoring guide to assist in the analysis of tissue specimen | |
Hu et al. | Predicting molecular traits from tissue morphology through self-interactive multi-instance learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150930 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160721 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180604 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190723 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190909 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200213 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6665999 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |