JP7458519B2 - Image analysis method, image analysis device, program, method for producing trained deep learning algorithm, and trained deep learning algorithm - Google Patents
Image analysis method, image analysis device, program, method for producing trained deep learning algorithm, and trained deep learning algorithm Download PDFInfo
- Publication number
- JP7458519B2 JP7458519B2 JP2023008540A JP2023008540A JP7458519B2 JP 7458519 B2 JP7458519 B2 JP 7458519B2 JP 2023008540 A JP2023008540 A JP 2023008540A JP 2023008540 A JP2023008540 A JP 2023008540A JP 7458519 B2 JP7458519 B2 JP 7458519B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- tissue
- region
- data
- tumor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013135 deep learning Methods 0.000 title claims description 142
- 238000010191 image analysis Methods 0.000 title claims description 108
- 238000004422 calculation algorithm Methods 0.000 title claims description 107
- 238000003703 image analysis method Methods 0.000 title claims description 42
- 238000004519 manufacturing process Methods 0.000 title description 4
- 238000012549 training Methods 0.000 claims description 448
- 206010028980 Neoplasm Diseases 0.000 claims description 248
- 238000012545 processing Methods 0.000 claims description 219
- 238000004458 analytical method Methods 0.000 claims description 207
- 238000013528 artificial neural network Methods 0.000 claims description 100
- 238000000034 method Methods 0.000 claims description 91
- 230000008569 process Effects 0.000 claims description 47
- 230000006870 function Effects 0.000 claims description 45
- 239000003086 colorant Substances 0.000 claims description 36
- 238000010186 staining Methods 0.000 claims description 24
- 238000003745 diagnosis Methods 0.000 claims description 17
- WZUVPPKBWHMQCE-UHFFFAOYSA-N Haematoxylin Chemical compound C12=CC(O)=C(O)C=C2CC2(O)C1C1=CC=C(O)C(O)=C1OC2 WZUVPPKBWHMQCE-UHFFFAOYSA-N 0.000 claims description 10
- 238000007490 hematoxylin and eosin (H&E) staining Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 8
- 210000004881 tumor cell Anatomy 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 238000005520 cutting process Methods 0.000 claims description 4
- 238000012758 nuclear staining Methods 0.000 claims description 3
- 210000001519 tissue Anatomy 0.000 description 241
- 238000010586 diagram Methods 0.000 description 57
- 238000003384 imaging method Methods 0.000 description 35
- 238000003860 storage Methods 0.000 description 35
- 201000011510 cancer Diseases 0.000 description 17
- 210000004027 cell Anatomy 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 12
- 208000005718 Stomach Neoplasms Diseases 0.000 description 11
- 238000001514 detection method Methods 0.000 description 11
- 206010017758 gastric cancer Diseases 0.000 description 11
- 201000011549 stomach cancer Diseases 0.000 description 11
- 230000008520 organization Effects 0.000 description 10
- 238000011478 gradient descent method Methods 0.000 description 7
- 210000003855 cell nucleus Anatomy 0.000 description 6
- 210000004882 non-tumor cell Anatomy 0.000 description 6
- 230000001575 pathological effect Effects 0.000 description 5
- 238000012333 histopathological diagnosis Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 239000011521 glass Substances 0.000 description 3
- 238000012886 linear function Methods 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000010827 pathological analysis Methods 0.000 description 3
- 238000001356 surgical procedure Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 2
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 2
- 206010060862 Prostate cancer Diseases 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 210000000981 epithelium Anatomy 0.000 description 2
- 210000001035 gastrointestinal tract Anatomy 0.000 description 2
- 201000007270 liver cancer Diseases 0.000 description 2
- 208000014018 liver neoplasm Diseases 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 2
- 201000002528 pancreatic cancer Diseases 0.000 description 2
- 208000008443 pancreatic carcinoma Diseases 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 210000002345 respiratory system Anatomy 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 206010061825 Duodenal neoplasm Diseases 0.000 description 1
- 206010062767 Hypophysitis Diseases 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 208000007433 Lymphatic Metastasis Diseases 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 208000006994 Precancerous Conditions Diseases 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 208000009125 Sigmoid Neoplasms Diseases 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 206010054184 Small intestine carcinoma Diseases 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 208000009956 adenocarcinoma Diseases 0.000 description 1
- 210000004100 adrenal gland Anatomy 0.000 description 1
- 210000000436 anus Anatomy 0.000 description 1
- 210000001815 ascending colon Anatomy 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000000621 bronchi Anatomy 0.000 description 1
- 210000004534 cecum Anatomy 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 210000001198 duodenum Anatomy 0.000 description 1
- 201000000312 duodenum cancer Diseases 0.000 description 1
- 210000000750 endocrine system Anatomy 0.000 description 1
- 210000003238 esophagus Anatomy 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 210000004996 female reproductive system Anatomy 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000000834 fixative Substances 0.000 description 1
- 238000002073 fluorescence micrograph Methods 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 210000003016 hypothalamus Anatomy 0.000 description 1
- 210000003405 ileum Anatomy 0.000 description 1
- 238000012744 immunostaining Methods 0.000 description 1
- 210000001630 jejunum Anatomy 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 208000003849 large cell carcinoma Diseases 0.000 description 1
- 201000011061 large intestine cancer Diseases 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 210000001989 nasopharynx Anatomy 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 210000003101 oviduct Anatomy 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 210000002990 parathyroid gland Anatomy 0.000 description 1
- 210000003635 pituitary gland Anatomy 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 210000001599 sigmoid colon Anatomy 0.000 description 1
- 201000003825 sigmoid colon cancer Diseases 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 208000000649 small cell carcinoma Diseases 0.000 description 1
- 210000004872 soft tissue Anatomy 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 210000003437 trachea Anatomy 0.000 description 1
- 210000003384 transverse colon Anatomy 0.000 description 1
- 210000000626 ureter Anatomy 0.000 description 1
- 210000003932 urinary bladder Anatomy 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
Landscapes
- Image Analysis (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Description
本明細書には、画像解析方法、画像解析装置、プログラム、学習済み深層学習アルゴリ
ズムの製造方法および学習済み深層学習アルゴリズムが開示される。より詳細には、解析
対象の組織の画像について、解析用データに含まれる領域が腫瘍領域であるか否かを示す
データを生成することを含む画像解析方法、画像解析装置、プログラム、学習済み深層学
習アルゴリズムの製造方法および学習済み深層学習アルゴリズム等が開示される。
This specification discloses an image analysis method, an image analysis device, a program, a method for manufacturing a trained deep learning algorithm, and a trained deep learning algorithm. More specifically, an image analysis method, an image analysis device, a program, and a learned deep layer include generating data indicating whether or not a region included in analysis data is a tumor region for an image of a tissue to be analyzed. A method for manufacturing a learning algorithm, a trained deep learning algorithm, and the like are disclosed.
特許文献1には、病理組織画像において組織像を、正常、良性腫瘍、前癌状態および癌
状態の4つのグループに分類し、判定する画像診断支援装置が開示されている。画像分類
手段は、画像データから注視領域を抽出し、注視領域の特徴を示す特徴量を算出し、算出
した特徴量に基づいてグループの分類を行う。特徴量は、細胞核における単位面積あたり
の塊の密度、塊面積の密度、塊の面積、塊の太さ、および塊の長さなどである。画像判定
手段は、このような特徴量と判定結果との関係を学習し、学習済みの学習パラメータに基
づいて判定を行う。学習は、サポートベクターマシンなどの学習アルゴリズムを用いて、
機械学習を実行する。
Patent Document 1 discloses an image diagnosis support device that classifies and judges tissue images in a pathological tissue image into four groups: normal, benign tumor, precancerous state, and cancerous state. The image classification means extracts a region of interest from image data, calculates feature values that indicate the characteristics of the region of interest, and classifies the group based on the calculated feature values. The feature values include the density of clumps per unit area in the cell nucleus, the density of the clump area, the clump area, the clump thickness, and the clump length. The image judgment means learns the relationship between such feature values and the judgment result, and makes a judgment based on the learned learning parameters. The learning is performed using a learning algorithm such as a support vector machine,
Perform machine learning.
悪性腫瘍であるか否かを確定診断する際に、病理組織標本を用いた病理組織診断が行わ
れる。また病理組織診断は、手術中に悪性腫瘍を含む組織の切除部位を決定するための術
中迅速診断として行われることも少なくない。術中迅速診断は、手術中に患者の患部を切
開した状態で待機させ、腫瘍が悪性であるか、切除した組織の断端に腫瘍が残っていない
か、リンパ節転移があるか等の判断を病理組織診断により行うものである。術中迅速診断
の結果により、待機している患者のその後の手術の方向性が決められる。
When definitively diagnosing whether or not it is a malignant tumor, histopathological diagnosis using a histopathological specimen is performed. Furthermore, histopathological diagnosis is often performed as a quick intraoperative diagnosis to determine the site of resection of tissue containing a malignant tumor during surgery. Rapid intraoperative diagnosis involves having the patient stand by while an incision is made in the affected area during surgery, and determining whether the tumor is malignant, whether there is any tumor remaining in the resected tissue margin, and whether there is lymph node metastasis. This is done through histopathological diagnosis. The results of the intraoperative rapid diagnosis will determine the direction of subsequent surgery for the waiting patient.
病理組織診断は、医師、特に病理医が顕微鏡等により組織標本を観察して診断するが、
組織標本の観察により正確な確定診断を行えるようになるためには、長い期間、熟練した
病理専門医の元で、様々な症例の組織標本の観察を繰り返す必要があり、病理医の育成に
も膨大な時間を要している。
Histopathological diagnosis is performed by a doctor, especially a pathologist, by observing tissue specimens using a microscope, etc.
In order to be able to make accurate definitive diagnoses through observation of tissue specimens, it is necessary to repeatedly observe tissue specimens from various cases under the supervision of a skilled pathologist over a long period of time, which requires a huge amount of training for pathologists. It takes a lot of time.
病理医の不足は深刻であり、病理医が不足している結果、患者の悪性腫瘍の確定診断が
遅れ、治療開始が遅れる、あるいは確定診断を待たずに治療を開始するという状態も危惧
されている。また、通常の組織診断と術中迅速診断との両方が、少ない病理医に集中する
ために、一人の病理医の業務量が膨大となり、病理医自身の労務状態も問題となっている
。しかし、現在のところこの問題の解消策は見つかっていない。
There is a serious shortage of pathologists, and as a result of the shortage, there are concerns that a definitive diagnosis of a patient's malignant tumor will be delayed, and the start of treatment will be delayed, or that treatment may be started without waiting for a definitive diagnosis. There is. In addition, because both normal tissue diagnosis and intraoperative rapid diagnosis are concentrated on a small number of pathologists, the workload of each pathologist becomes enormous, and the working conditions of the pathologists themselves are also becoming a problem. However, no solution to this problem has been found so far.
したがって、病理組織診断を装置がサポートできるようになることは、特にその診断が
人の目による判断に近いほど、病理医不足の解消、および病理医の労務状態の改善に大き
く貢献すると考えられる。
Therefore, it is thought that the ability of a device to support pathological tissue diagnosis will greatly contribute to resolving the shortage of pathologists and improving the working conditions of pathologists, especially as the diagnosis is closer to judgment made by the human eye.
装置が病理組織診断をサポートするという点において、上述の特許文献1に記載の発明
では、機械学習による画像解析に基づいて標本組織の病理判定を行っている。この方法で
は、特徴量を人の手で作成する必要がある。特徴量を人の手で作成する方法には、その人
の力量が画像解析の性能に大きく影響を与えるという問題がある。さらに、特許文献1に
記載の発明は、顕微鏡で強拡大された組織標本の画像内の細胞核1つ1つに対して癌細胞
の核であるか否かの判定を行う。したがって、標本1枚の全体について解析しようとする
と長い解析時間を要するという問題がある。
In terms of the device supporting pathological tissue diagnosis, the invention described in Patent Document 1 described above performs pathological determination of sample tissue based on image analysis using machine learning. This method requires the feature values to be created manually. The problem with methods of manually creating feature amounts is that the ability of the person greatly affects the performance of image analysis. Further, the invention described in Patent Document 1 determines whether each cell nucleus in an image of a tissue specimen strongly magnified with a microscope is a nucleus of a cancer cell. Therefore, there is a problem in that it takes a long time to analyze an entire specimen.
したがって、個々の細胞について癌細胞の核であるか否かを病理医や機械学習アルゴリ
ズムによって判定する前に、1枚の標本に含まれる組織全体を観察し、その標本のどの部
位に腫瘍組織が含まれるかをスクリーニングすることは、1枚の標本に対する病理診断に
かかる時間を短縮する一助となる。
Therefore, before a pathologist or machine learning algorithm determines whether an individual cell is the nucleus of a cancer cell, it is necessary to observe the entire tissue contained in a single specimen and determine which part of the specimen contains tumor tissue. Screening for the presence of such substances helps reduce the time required for pathological diagnosis of a single specimen.
本発明は、解析対象の組織が解析用データに含まれる領域が腫瘍領域であるか否かを示
すデータを生成する画像解析方法、画像解析装置、プログラム、学習済み深層学習アルゴ
リズムの製造方法および学習済み深層学習アルゴリズムを提供することを課題とする。
The present invention relates to an image analysis method, an image analysis device, a program, a method for manufacturing a trained deep learning algorithm, and a learning method for generating data indicating whether or not a region included in analysis data of a tissue to be analyzed is a tumor region. The goal is to provide advanced deep learning algorithms.
ある実施形態は、ニューラルネットワーク構造の深層学習アルゴリズム(60)を用い
て、組織の画像を解析する画像解析方法に関する。前記画像解析方法では、解析対象の組
織を含む解析対象画像(78)から解析用データ(80)を生成し、解析用データ(80
)を、深層学習アルゴリズム(60)に入力し、深層学習アルゴリズム(60)によって
、解析用データに含まれる領域が腫瘍領域であるか否かを示すデータを生成する。本発明
によれば、解析対象の組織における解析用データに含まれる領域が腫瘍領域であるか否か
を示すデータを生成することができる。
One embodiment relates to an image analysis method for analyzing an image of tissue using a deep learning algorithm (60) having a neural network structure. The image analysis method includes generating analysis data (80) from an analysis target image (78) including a tissue to be analyzed, and
) is input to a deep learning algorithm (60), and the deep learning algorithm (60) generates data indicating whether or not a region included in the analysis data is a tumor region. According to the present invention, data indicating whether or not a region included in the analysis data in the tissue to be analyzed is a tumor region can be generated.
前記実施形態において、好ましくは、解析用データに含まれる領域が腫瘍領域であるか
否かを示すデータは、腫瘍領域の領域を示すデータである。この実施形態により、ユーザ
が一目で解析対象の組織における腫瘍領域を把握することができる。
In the embodiment, preferably, the data indicating whether the area included in the analysis data is a tumor area is data indicating the area of the tumor area. This embodiment allows the user to grasp the tumor region in the tissue to be analyzed at a glance.
前記実施形態において、好ましくは、前記解析対象画像は、組織診断用標本の画像であ
り、2以上の原色を組み合わせた色相を含む。この実施形態により、病理診断を一助する
ことができる。
In the embodiment, preferably, the image to be analyzed is an image of a specimen for tissue diagnosis, and includes a hue that is a combination of two or more primary colors. This embodiment can assist in pathological diagnosis.
前記実施形態において、好ましくは、前記解析対象画像は、前記解析対象の組織を3倍
から20倍に拡大して撮像された画像である。前記実施形態において、解析対象画像に含
まれる領域の大きさが、200μm×200μm以上400μm×400μm以下である
。これらの実施形態により、より精度の高い判別を行うことができる。
In the above embodiment, the analysis target image is preferably an image of the tissue to be analyzed magnified by 3 to 20 times. In the above embodiment, the size of the area included in the analysis target image is 200 μm×200 μm or more and 400 μm×400 μm or less. These embodiments allow for more accurate determination.
前記実施形態において、好ましくは、解析用データに含まれる領域が腫瘍領域であるか
否かを示すデータに基づいて、腫瘍細胞の領域とそれ以外の領域とを区別して提示するた
めのデータを生成する。この実施形態により、ユーザが一目で解析対象の組織における腫
瘍領域を把握することができる。
In the embodiment, preferably, data for distinguishing and presenting tumor cell regions and other regions is generated based on data indicating whether or not a region included in the analysis data is a tumor region. do. This embodiment allows the user to grasp the tumor region in the tissue to be analyzed at a glance.
前記実施形態において、好ましくは、解析用データに含まれる領域が腫瘍領域であるか
否かを示すデータに基づいて、腫瘍細胞の領域とそれ以外の領域との境界を示すデータを
生成する。この実施形態により、ユーザが一目で解析対象の組織における腫瘍領域と非腫
瘍領域の境界を把握することができる。
In the embodiment, preferably, data indicating a boundary between a tumor cell area and other areas is generated based on data indicating whether the area included in the analysis data is a tumor area. This embodiment allows the user to grasp at a glance the boundary between the tumor region and non-tumor region in the tissue to be analyzed.
前記実施形態において、好ましくは、解析用データに含まれる領域が腫瘍領域であるか
否かを示すデータに基づいて、前記解析対象の組織における腫瘍領域の含有率を示すデー
タを生成する。この実施形態により、ユーザが解析対象の組織における腫瘍領域の含有率
を把握することができる。
In the embodiment, preferably, data indicating the content rate of tumor regions in the tissue to be analyzed is generated based on data indicating whether a region included in the analysis data is a tumor region, allowing a user to grasp the content rate of tumor regions in the tissue to be analyzed.
前記実施形態において、好ましくは、解析用データに含まれる領域が腫瘍領域であるか
否かを示すデータに基づいて、前記解析対象の組織における腫瘍領域と非腫瘍領域の比率
を示すデータを生成する。この実施形態により、ユーザが解析対象の組織における腫瘍領
域の含有率を把握することができる。また、遺伝子検査等に使用されるサンプルが適切に
採取されているか知ることができる。
In the embodiment, preferably, data indicating a ratio of a tumor area to a non-tumor area in the tissue to be analyzed is generated based on data indicating whether a region included in the analysis data is a tumor area. . This embodiment allows the user to grasp the content rate of tumor regions in the tissue to be analyzed. In addition, it is possible to know whether samples used for genetic testing, etc. are being collected appropriately.
前記実施態様により、好ましくは、1つの解析対象画像について、腫瘍領域と、非腫瘍
領域と、組織を含まない領域とを区別して提示するためのデータを生成する。この実施形
態により、ユーザが一目で解析対象の組織における腫瘍領域の有無を把握することができ
る。
According to the above-mentioned embodiment, data for distinguishing and presenting a tumor region, a non-tumor region, and a region not containing tissue is preferably generated for one analysis target image. This embodiment allows the user to grasp at a glance the presence or absence of a tumor region in the tissue to be analyzed.
前記実施形態において、好ましくは、1つの解析対象画像について所定画素数の領域毎
に応じた複数の解析用データを生成する。この実施形態により、解析対象の組織の広い範
囲について、精度よく解析を行うことができる。
In the embodiment, preferably, a plurality of pieces of analysis data are generated for each region of a predetermined number of pixels for one image to be analyzed. According to this embodiment, it is possible to accurately analyze a wide range of tissues to be analyzed.
前記実施形態において、好ましくは、深層学習アルゴリズム(60)は、入力された前
記解析用データに対し前記所定画素数の領域が腫瘍領域および非腫瘍領域から選択される
少なくとも一方を含むことを示すラベルを生成する。
In the embodiment, preferably, the deep learning algorithm (60) applies a label to the input analysis data indicating that the region of the predetermined number of pixels includes at least one selected from a tumor region and a non-tumor region. generate.
前記実施形態において、好ましくは、ニューラルネットワーク(50)の入力層(50
a)のノード数が、解析用データ(80)の前記所定画素数と前記組み合わせた原色の数
との積に対応している。この実施形態により、精度の高い解析を行うことができる。
In the embodiment, preferably the input layer (50) of the neural network (50)
The number of nodes in a) corresponds to the product of the predetermined number of pixels of the analysis data (80) and the number of combined primary colors. This embodiment allows highly accurate analysis.
前記実施形態において、好ましくは、前記組織診断用標本が染色された標本であり、前記解析対象画像は、前記染色された標本を顕微鏡の明視野下で撮像した画像である。この実施形態により、病理診断を一助することができる。 In the embodiment, preferably, the tissue diagnosis specimen is a stained specimen, and the analysis target image is an image of the stained specimen taken under a bright field of a microscope. This embodiment can assist in pathological diagnosis.
前記実施形態において、好ましくは、前記深層学習アルゴリズムの学習に用いられる訓
練データが、個体から採取された腫瘍領域を含む組織の標本に対して明視野観察用染色を
施して作製された標本の染色像を顕微鏡の明視野下で撮像した明視野画像に基づいて生成
されている。この実施形態により、組織診断を一助することができる。
In the embodiment, preferably, the training data used for learning the deep learning algorithm is staining of a specimen prepared by applying bright field observation staining to a tissue specimen including a tumor region collected from an individual. The image is generated based on a bright field image taken under the bright field of a microscope. This embodiment can aid in tissue diagnosis.
前記実施形態において、好ましくは、前記明視野観察用染色は、核染色にヘマトキシリ
ンを用いる。より好ましくは、前記明視野観察用染色が、ヘマトキシリン・エオジン染色
(HE染色)である。この実施形態により、組織診断として汎用性の高い検査を網羅する
ことができる。
In the embodiment, preferably, the staining for bright field observation uses hematoxylin for nuclear staining. More preferably, the staining for bright field observation is hematoxylin and eosin staining (HE staining). This embodiment makes it possible to cover highly versatile tests for tissue diagnosis.
前記実施形態において、好ましくは、前記訓練データが、前記明視野画像から判定され
た、腫瘍領域であることを示すラベル値を含む。より好ましくは、前記訓練データが、前
記ラベル値を前記明視野画像の所定画素数の領域毎に含む。この実施形態により、腫瘍領
域の訓練データを生成することができる。
In the embodiment, preferably the training data includes a label value determined from the bright field image indicating a tumor region. More preferably, the training data includes the label value for each area of a predetermined number of pixels of the bright field image. This embodiment allows the generation of training data for tumor regions.
前記実施形態において、好ましくは、前記訓練データが、前記明視野画像における所定
画素数の領域毎に生成されている。この態様により、深層学習アルゴリズム(50)の学
習効率を上げることができる。
In the embodiment, preferably, the training data is generated for each region of a predetermined number of pixels in the bright field image. This aspect makes it possible to increase the learning efficiency of the deep learning algorithm (50).
前記実施形態において、好ましくは、前記深層学習アルゴリズムが、前記解析用データ
を、前記解析対象画像に含まれる組織が腫瘍領域であることを示すクラスに分類する。
In the embodiment, preferably, the deep learning algorithm classifies the analysis data into a class indicating that the tissue included in the image to be analyzed is a tumor region.
前記実施形態において、好ましくは、前記ニューラルネットワーク(50)の出力層(
50b)がソフトマックス関数を活性化関数とするノードである。この実施形態により、
学習効率および解析精度を上げることができる。
In the embodiment, preferably, the output layer (
50b) is a node that uses a softmax function as an activation function.
It is possible to improve learning efficiency and analysis accuracy.
前記実施形態において、好ましくは、前記深層学習アルゴリズムは、解析用データ(7
8)が入力される度に、前記解析対象画像に含まれる組織が腫瘍領域であることを示すデ
ータを所定画素数の領域毎に生成する。この実施形態により、解析効率を上げることがで
きる。
In the embodiment, preferably, the deep learning algorithm uses analysis data (7
Every time 8) is input, data indicating that the tissue included in the image to be analyzed is a tumor region is generated for each region of a predetermined number of pixels. This embodiment allows for increased analysis efficiency.
前記実施形態において、好ましくは、深層学習アルゴリズム(60)が、前記組織の種
類に応じて生成されている。さらに、好ましくは、前記組織の種類に応じて複数の前記深
層学習アルゴリズムの中から選択された、前記解析対象の組織の種類に対応する前記深層
学習アルゴリズムを用いて、前記解析用データを処理する。この実施形態により、解析精
度を上げることができる。
In said embodiment, preferably a deep learning algorithm (60) is generated depending on the type of tissue. Furthermore, preferably, the analysis data is processed using the deep learning algorithm corresponding to the type of tissue to be analyzed, which is selected from the plurality of deep learning algorithms according to the type of tissue. . This embodiment can improve analysis accuracy.
ある実施形態は、ニューラルネットワーク構造の深層学習アルゴリズム(60)を用い
て、組織の画像を解析する画像解析装置(100)に関する。前記解析装置は、解析対象
の組織を含む解析対象画像(78)から解析用データ(80)を生成し、解析用データ(
80)を、深層学習アルゴリズム(50)に入力し、深層学習アルゴリズム(50)によ
って、前記解析用データに含まれる領域が腫瘍領域であるか否かを示すデータを生成する
処理部(10)を備える。
One embodiment relates to an image analysis device (100) that analyzes tissue images using a deep learning algorithm (60) with a neural network structure. The analysis device generates analysis data (80) from an analysis target image (78) including a tissue to be analyzed, and
80) into a deep learning algorithm (50), and the deep learning algorithm (50) generates data indicating whether the region included in the analysis data is a tumor region or not. Be prepared.
ある実施形態は、ニューラルネットワーク構造の深層学習アルゴリズム(60)を用い
て、組織の画像を解析するコンピュータプログラムに関する。前記コンピュータに、解析
対象の組織を含む解析対象画像(78)から解析用データ(80)を生成する処理と、解
析用データ(80)を、深層学習アルゴリズム(60)に入力する処理と、深層学習アル
ゴリズム(60)によって、前記解析用データに含まれる領域が腫瘍領域であるか否かを
示すデータを生成する処理と、を実行させる。
Certain embodiments relate to a computer program that analyzes images of tissue using a deep learning algorithm (60) in a neural network structure. The computer includes a process of generating analysis data (80) from an analysis target image (78) including a tissue to be analyzed, a process of inputting the analysis data (80) into a deep learning algorithm (60), and a process of inputting the analysis data (80) into a deep learning algorithm (60). The learning algorithm (60) executes a process of generating data indicating whether or not the region included in the analysis data is a tumor region.
ある実施態様は、深層学習アルゴリズム(50)の学習に用いられる訓練データを訓練
用の組織標本から取得した訓練用画像に基づいて生成するステップと、前記訓練データを
ニューラルネットワーク(50)に学習させる学習させるステップと、を含み、前記生成
ステップは、腫瘍領域を撮像した第1の訓練用画像(70R1)に対応する第1の訓練デ
ータ(74R1)を取得する第1の取得ステップと、非腫瘍領域を撮像した第2の訓練用
画像(70R2)に対応する第2の訓練データ(74R2)を取得する第2の取得ステッ
プと、組織を含まない領域を撮像した第3の訓練用画像(70R3)に対応する第3の訓
練データ(74R3)を取得する第3の取得ステップと、を含み、前記学習ステップは、
前記第1の訓練データ(74R1)が、腫瘍領域であることをニューラルネットワーク(
50)に学習させる第1の学習ステップと、前記第2の訓練データ(74R2)が、非腫
瘍領域であることをニューラルネットワーク(50)に学習させる第2の学習ステップと
、前記第3の訓練データ(74R3)が、組織を含まない領域であることをニューラルネ
ットワーク(50)に学習させる第3の学習ステップと、を含む、学習済み深層学習アル
ゴリズムの生成方法に関する。好ましくは、前記第1の訓練データ(74R1)と、第2
の訓練データ(74R2)と、第3の訓練データ(74R3)とをニューラルネットワー
ク(50)の入力層(50a)とし、腫瘍領域であることと、非腫瘍領域であることと、
組織を含まない領域であることとをそれぞれ前記第1の訓練データ(74R1)と、第2
の訓練データ(74R2)と、第3の訓練データ(74R3)とに対応するニューラルネ
ットワーク(50)の出力層(50b)とする。さらに好ましくは、前記第1の取得ステ
ップの前に、前記第1の訓練用画像(70R1)から、前記第1の訓練データ(74R1
)を生成するステップと、前記第2の取得ステップの前に、前記第2の訓練用画像(70
R2)から、前記第2の訓練データ(74R2)を生成するステップと、前記第3の取得
ステップの前に、前記第3の訓練用画像(70R3)から、前記第3の訓練データ(74
R3)を生成するステップと、をさらに含む。本実施形態によれば、解析対象の組織が、
腫瘍領域および非腫瘍領域から選択される少なくとも一方を含むことを判別する、学習済
み深層学習アルゴリズムの生成することができる。
An embodiment includes the step of generating training data used for learning the deep learning algorithm (50) based on a training image obtained from a training tissue sample, and causing the neural network (50) to learn the training data. a learning step, and the generation step includes a first acquisition step of acquiring first training data (74R1) corresponding to a first training image (70R1) that captures a tumor region; A second acquisition step of acquiring second training data (74R2) corresponding to a second training image (70R2) that captures a region, and a third training image (70R3) that captures a region that does not include tissue. ), the learning step includes: a third acquisition step of acquiring third training data (74R3) corresponding to
The first training data (74R1) is a tumor region using a neural network (
50), a second learning step in which the neural network (50) learns that the second training data (74R2) is a non-tumor region, and the third training step. The present invention relates to a method for generating a trained deep learning algorithm, including a third learning step of causing a neural network (50) to learn that the data (74R3) is a region that does not include tissue. Preferably, the first training data (74R1) and the second
The training data (74R2) and the third training data (74R3) are used as the input layer (50a) of the neural network (50), and the training data (74R2) and the third training data (74R3) are used as the input layer (50a) of the neural network (50).
The first training data (74R1) and the second training data indicate that the region does not contain tissue, respectively.
The output layer (50b) of the neural network (50) corresponds to the training data (74R2) and the third training data (74R3). More preferably, before the first acquisition step, the first training data (74R1) is extracted from the first training image (70R1).
), and before the second acquisition step, the second training image (70
R2), the second training data (74R2) is generated from the third training image (70R3), and before the third acquisition step, the third training data (74R2) is generated from the third training image (70R3).
R3). According to this embodiment, the tissue to be analyzed is
A trained deep learning algorithm can be generated that determines whether the tumor region includes at least one selected from a tumor region and a non-tumor region.
前記生成方法において、好ましくは、前記訓練用画像が、個体から採取された組織に対
して明視野観察用染色を施して作製された標本の染色像を顕微鏡の明視野下で撮像した明
視野画像である。
In the generation method, preferably, the training image is a bright field image obtained by capturing a stained image of a specimen prepared by performing bright field observation staining on a tissue collected from an individual under the bright field of a microscope. It is.
ある実施形態は、第1の訓練データ(74R1)と、第2の訓練データ(74R2)と
、第3の訓練データ(74R3)とをニューラルネットワーク(50)の入力層(50a
)とし、腫瘍領域であることと、非腫瘍領域であることと、組織を含まない領域であるこ
ととをそれぞれ前記第1の訓練データ(74R1)と、第2の訓練データ(74R2)と
、第3の訓練データ(74R3)とに対応するニューラルネットワーク(50)の出力層
(50b)として学習させた深層学習アルゴリズムであって、前記第1の訓練データ(7
4R1)は、訓練用の組織の腫瘍領域を撮像した第1の訓練用画像(70R1)から生成
され、前記第2の訓練データ(74R2)は、訓練用の組織の非腫瘍領域を撮像した第2
の訓練用画像(70R2)から生成され、前記第3の訓練データ(74R3)は、組織を
含まない領域を撮像した第3の訓練用画像(70R3)から生成される、学習済み深層学
習アルゴリズム(60)である。
Some embodiments provide first training data (74R1), second training data (74R2), and third training data (74R3) to the input layer (50a) of the neural network (50).
), and the first training data (74R1) and second training data (74R2) respectively indicate that it is a tumor region, that it is a non-tumor region, and that it is a region that does not contain tissue. A deep learning algorithm trained as an output layer (50b) of a neural network (50) corresponding to third training data (74R3),
4R1) is generated from a first training image (70R1) that captures a tumor region of the training tissue, and the second training data (74R2) is generated from a first training image (74R2) that captures a non-tumor region of the training tissue. 2
The third training data (74R3) is generated from a trained deep learning algorithm (70R2) that is generated from a third training image (70R3) that captures a region that does not include tissue. 60).
標本に含まれる組織全体を観察し、その標本のどの部位に腫瘍組織が含まれるかスクリ
ーニングするためのデータを生成することができる。
It is possible to observe the entire tissue contained in a specimen and generate data for screening which parts of the specimen contain tumor tissue.
以下、本発明の概要および実施の形態を、添付の図面を参照して詳細に説明する。なお
、以下の説明および図面において、同じ符号は同じまたは類似の構成要素を示すこととし
、よって、同じまたは類似の構成要素に関する説明を省略する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS An outline and embodiments of the present invention will be described in detail below with reference to the accompanying drawings. Note that in the following description and drawings, the same reference numerals indicate the same or similar components, and therefore, explanations regarding the same or similar components will be omitted.
画像解析方法は、組織の画像を解析する。前記画像解析方法は、ニューラルネットワー
ク構造の、好ましくは、畳み込みニューラルネットワーク構造の深層学習アルゴリズムを
用いる。前記画像解析方法は、解析用データに含まれる領域が腫瘍領域であるか否かを示
すデータを生成することを含む。
The image analysis method analyzes images of tissues. The image analysis method uses a deep learning algorithm of a neural network structure, preferably a convolutional neural network structure. The image analysis method includes generating data indicating whether a region included in the analysis data is a tumor region.
本発明において、組織または細胞の画像は、組織試料の標本または細胞を含む試料の標
本から取得される画像である。組織試料の標本または細胞を含む試料の標本は、個体から
採取される。個体は、特に制限されないが、好ましくは哺乳類であり、より好ましくはヒ
トである。前記個体から試料が採取される際に、個体が生きているか死亡しているかは問
わない。前記組織は、個体内に存在するものである限り、制限されない。前記個体から採
取された組織としては、外科的な切除組織、生検組織等を挙げることができる。前記腫瘍
は上皮性および非上皮性のいずれであってもよい。前記腫瘍として好ましくは悪性上皮性
腫瘍である。悪性腫瘍は、特に制限されないが、悪性腫瘍としては、例えば、気管、気管
支又は肺等から発生する呼吸器系悪性腫瘍;上咽頭、食道、胃、十二指腸、空腸、回腸、
盲腸、虫垂、上行結腸、横行結腸、S状結腸、直腸又は肛門部等から発生する消化管系悪
性腫瘍;肝臓癌;膵臓癌;膀胱、尿管又は腎臓から発生する泌尿器系悪性腫瘍;卵巣、卵
管および子宮等から発生する女性生殖器系悪性腫瘍;乳癌;前立腺癌;皮膚癌;視床下部
、下垂体、甲状腺、副甲状腺、副腎等の内分泌系悪性腫瘍;中枢神経系悪性腫瘍;骨軟部
組織から発生する悪性腫瘍等の固形腫瘍が挙げられる。より好ましくは、肺癌(扁平上皮
癌、小細胞癌、大細胞癌、腺癌)等の呼吸器系上皮性悪性腫瘍;胃癌、十二指腸癌、大腸
癌(S状結腸癌、直腸癌等)等の消化管系上皮性悪性腫瘍;肝臓癌;膵臓癌;膀胱癌;甲
状腺癌;卵巣癌;乳癌;前立腺癌を挙げることができる。最も好ましくは、胃癌である。
In the present invention, the image of a tissue or cell is an image obtained from a specimen of a tissue sample or a specimen of a sample containing cells. The specimen of a tissue sample or a specimen of a sample containing cells is taken from an individual. The individual is not particularly limited, but is preferably a mammal, more preferably a human. When the sample is taken from the individual, it does not matter whether the individual is alive or dead. The tissue is not limited as long as it is present within the individual. Examples of the tissue taken from the individual include surgically resected tissue, biopsy tissue, etc. The tumor may be either epithelial or non-epithelial. The tumor is preferably a malignant epithelial tumor. The malignant tumor is not particularly limited, but examples of the malignant tumor include respiratory system malignant tumors arising from the trachea, bronchi, or lungs, etc.; nasopharynx, esophagus, stomach, duodenum, jejunum, ileum,
Examples of the solid tumor include malignant tumors of the digestive tract that occur in the cecum, appendix, ascending colon, transverse colon, sigmoid colon, rectum, anus, etc.; liver cancer; pancreatic cancer; malignant tumors of the urinary system that occur in the bladder, ureter, or kidney; malignant tumors of the female reproductive system that occur in the ovaries, fallopian tubes, and uterus; breast cancer; prostate cancer; skin cancer; malignant tumors of the endocrine system such as the hypothalamus, pituitary gland, thyroid gland, parathyroid gland, and adrenal gland; malignant tumors of the central nervous system; and malignant tumors that occur in bone and soft tissue. More preferred are malignant tumors of the respiratory tract epithelium such as lung cancer (squamous cell carcinoma, small cell carcinoma, large cell carcinoma, and adenocarcinoma); malignant tumors of the digestive tract epithelium such as gastric cancer, duodenal cancer, and large intestine cancer (sigmoid colon cancer, rectal cancer, etc.); liver cancer; pancreatic cancer; bladder cancer; thyroid cancer; ovarian cancer; breast cancer; and prostate cancer. Most preferred is gastric cancer.
前記標本は、前記組織を顕微鏡等で観察ができるように加工した状態のもの、例えばプ
レパラートを意図する。前記標本は、公知の方法に従って作製することができる。例えば
、組織標本の場合には、前記個体から組織を採取した後に、所定の固定液(ホルマリン固
定等)で組織を固定し、その固定組織をパラフィン包埋し、パラフィン包埋組織を薄切す
る。薄切切片をスライドグラスにのせる。切片がのったスライドグラスに対して光学顕微
鏡での観察のため、すなわち明視野観察のための染色を施し、所定の封入処理をして標本
が完成する。組織標本の典型例は、組織診断用標本(病理標本)であり、染色は、へマト
キシリン・エオジン(HE)染色である。
The specimen is intended to be a state in which the tissue is processed so that it can be observed under a microscope or the like, for example, a slide. The specimen can be prepared according to a known method. For example, in the case of a tissue specimen, after collecting tissue from the individual, the tissue is fixed with a specified fixative (formalin fixation, etc.), the fixed tissue is embedded in paraffin, and the paraffin-embedded tissue is thin-sliced. The thin slice is placed on a slide glass. The slide glass on which the slice is placed is stained for observation under an optical microscope, i.e., for bright-field observation, and a specified mounting process is performed to complete the specimen. A typical example of a tissue specimen is a tissue diagnostic specimen (pathological specimen), and the stain is hematoxylin-eosin (HE) staining.
HE染色の核染色はヘマトキシリンである。ヘマトキシリンは、組織細胞染色において
核染色剤として幅広く使用されている(例えば、免疫染色、レクチン染色、糖染色、脂肪
染色、膠原線維染色等)。このため、本発明は、このようなヘマトキシリンを核染色に使
う標本全般において、適用が可能である。
The nuclear stain for HE staining is hematoxylin. Hematoxylin is widely used as a nuclear stain in tissue cell staining (eg, immunostaining, lectin staining, sugar staining, fat staining, collagen fiber staining, etc.). Therefore, the present invention can be applied to all kinds of specimens in which hematoxylin is used for nuclear staining.
前記画像解析には、訓練用画像を用いて訓練された深層学習アルゴリズムを用いる。前
記画像解析は、前記標本から取得した、解析対象の組織を含む解析対象画像から解析デー
タを生成する。前記解析データを、前記深層学習アルゴリズムに入力し、前記解析対象画
像内に存在する組織が解析用データに含まれる領域が腫瘍領域であるか否かを示すデータ
を生成する。解析用データに含まれる領域が腫瘍領域であるか否かを示すデータとは、判
別対象にある組織に含まれる複数の注目画素を含む領域が、腫瘍組織を含む可能性および
/または非腫瘍領域である可能性を示すデータである。解析用データに含まれる領域が腫
瘍領域であるか否かを示すデータは、腫瘍領域を含むことと非腫瘍領域であることを区別
できるラベル値、表示等であり得る。
The image analysis uses a deep learning algorithm trained using a training image. The image analysis generates analysis data from an analysis target image including a tissue to be analyzed, acquired from the specimen. The analysis data is input to the deep learning algorithm, and data is generated indicating whether a region of the tissue present in the analysis target image included in the analysis data is a tumor region. The data indicating whether a region included in the analysis data is a tumor region is data indicating the possibility that a region including a plurality of pixels of interest included in the tissue to be discriminated includes tumor tissue and/or is a non-tumor region. The data indicating whether a region included in the analysis data is a tumor region may be a label value, display, or the like that can distinguish whether the region includes a tumor region from a non-tumor region.
前記訓練用画像は、学習対象となる標本の複数の領域から取得される。好ましくは、前
記訓練用画像は、学習対象となる組織に含まれる複数の層構造から層構造ごとに腫瘍領域
を含む領域、非腫瘍領域を含む領域、および組織を含まない領域より取得される。
The training images are acquired from a plurality of regions of a sample to be studied. Preferably, the training images are acquired from a region including a tumor region, a region including a non-tumor region, and a region not including tissue for each layer structure from a plurality of layer structures included in the tissue to be learned.
例えば、第1の訓練用画像70R1は、個体から採取された組織に含まれる、腫瘍領域
を含む領域から取得された画像である。この画像は、顕微鏡観察により、組織構造が認識
できるように染色された標本から取得される。前記染色は、組織構造が認識できる限り制
限されないが、好ましくは明視野観察用の染色である。前記明視野観察用染色は、少なく
とも細胞核と細胞核以外の部位が、色相で区別可能に染色できる限り制限されない。前記
標本が哺乳類の組織標本である場合には、例えば、HE染色を挙げることができる。
For example, the first training image 70R1 is an image acquired from a region including a tumor region included in tissue collected from an individual. This image is obtained by microscopic observation from a specimen that has been stained so that its tissue structure can be recognized. The staining is not limited as long as the tissue structure can be recognized, but staining for bright field observation is preferable. The staining for bright field observation is not limited as long as at least the cell nucleus and a region other than the cell nucleus can be stained in a distinguishable manner by hue. When the specimen is a mammalian tissue specimen, for example, HE staining can be used.
第1の訓練用画像70R1からは、第1の訓練データ74R1と、第1の予備訓練デー
タ70R1Lが生成される。第1の訓練データ74R1は、第1の訓練用画像70R1に
含まれる色相を原色毎に分離した単一色画像に関する情報である。第1の予備訓練データ
70R1Lは、第1の訓練用画像70R1に含まれている組織の領域が、腫瘍領域を含む
ことを示す二値化データ(ラベル値)として生成される。第1の訓練用画像70R1に含
まれる組織の領域が腫瘍領域を含むか否かは、例えば病理医等による標本観察により判定
される。ここで、前記訓練用画像に含まれる組織の領域において、腫瘍細胞と、非腫瘍細
胞と、細胞以外の組織の領域とが混在する場合がある。この場合、前記訓練用画像に含ま
れる組織の領域が、例えば前記訓練用画像に含まれる組織の領域全体の面積を100%と
した際に、腫瘍細胞がその全体の面積の約10%以上、約20%以上、約30%以上、約
40%以上、約50%以上、約60%以上、約70%以上、約80%以上、または約90
%以上を占める場合に、腫瘍領域を含むと判定することができる。好ましくは、約40%
以上、約50%以上、約60%以上、約70%以上、約80%以上、または約90%以上
を占める場合に、腫瘍領域を含むと判定することができる。前記訓練用画像に含まれる組
織の領域全体の面積(100%)から非腫瘍細胞および細胞以外の組織(非腫瘍領域)が
占める割合を減じた値を前記腫瘍細胞が組織全体の面積を占める割合として決定してもよ
い。
First training data 74R1 and first preliminary training data 70R1L are generated from the first training image 70R1. The first training data 74R1 is information regarding a single color image in which the hues included in the first training image 70R1 are separated for each primary color. The first preliminary training data 70R1L is generated as binarized data (label value) indicating that the tissue region included in the first training image 70R1 includes a tumor region. Whether or not the tissue region included in the first training image 70R1 includes a tumor region is determined by, for example, specimen observation by a pathologist or the like. Here, in the tissue region included in the training image, tumor cells, non-tumor cells, and regions of tissue other than cells may coexist. In this case, the tissue region included in the training image is such that, for example, when the area of the entire tissue region included in the training image is 100%, tumor cells occupy approximately 10% or more of the total area; About 20% or more, about 30% or more, about 40% or more, about 50% or more, about 60% or more, about 70% or more, about 80% or more, or about 90% or more
% or more, it can be determined that a tumor area is included. Preferably about 40%
If the area occupies about 50% or more, about 60% or more, about 70% or more, about 80% or more, or about 90% or more, it can be determined that a tumor area is included. The ratio of the tumor cells to the total area of the tissue is calculated by subtracting the ratio of non-tumor cells and tissues other than cells (non-tumor area) from the area (100%) of the entire tissue region included in the training image. It may be determined as
前記訓練用画像に含まれる第2の訓練用画像70R2は、非腫瘍領域を含む組織の領域
(好ましくは、非腫瘍細胞と細胞以外の組織の領域とを含む領域)から取得された画像で
ある。この画像は、顕微鏡観察により、組織構造が認識できるように染色された標本から
取得される。前記染色は、組織構造が認識できる限り制限されないが、好ましくは明視野
観察用の染色である。前記明視野観察用染色は、少なくとも細胞核と細胞核以外の部位が
、色相で区別可能に染色できる限り制限されない。前記標本が哺乳類の組織標本である場
合には、例えば、HE染色を挙げることができる。前記染色は、第1の訓練用画像70R
1を取得した標本と同じものであることが好ましい。
The second training image 70R2 included in the training images is an image acquired from a tissue region including a non-tumor region (preferably a region including non-tumor cells and a region of tissue other than cells). . This image is obtained by microscopic observation from a specimen that has been stained so that its tissue structure can be recognized. The staining is not limited as long as the tissue structure can be recognized, but staining for bright field observation is preferable. The staining for bright field observation is not limited as long as at least the cell nucleus and a region other than the cell nucleus can be stained in a distinguishable manner by hue. When the specimen is a mammalian tissue specimen, for example, HE staining can be used. The staining is performed on the first training image 70R.
It is preferable that the specimen be the same as the specimen from which No. 1 was obtained.
第2の訓練用画像70R2からは、第2の訓練データ74R2と、第2の予備訓練デー
タ70R2Lが生成される。第2の訓練データ74R2は、第2の訓練用画像70R2に
含まれる色相を原色毎に分離した単一色画像に関する情報である。第2の予備訓練データ
70R2Lは、第2の訓練用画像70R2に含まれている組織の領域が、非腫瘍領域を含
むことを示す二値化データ(ラベル値)である。第2の訓練用画像70R2に含まれる組
織の領域が非腫瘍領域を含むか否かは、例えば病理医等による標本観察により判定される
。ここで、前記訓練用画像に含まれる組織の領域において、腫瘍細胞と、非腫瘍細胞と、
細胞以外の組織の領域が混在する場合がある。この場合、前記訓練用画像に含まれる組織
の領域が、例えば前記訓練用画像に含まれる組織の領域全体の面積を100%とした際に
、非腫瘍細胞と細胞以外の組織の領域(非腫瘍領域)とが組織全体の面積の約10%以上
、約20%以上、約30%以上、約40%以上、約50%以上、約60%以上、約70%
以上、約80%以上、約90%以上、または100%を占める場合に、非腫瘍領域を含む
と判定することができる。好ましくは、約40%以上、約50%以上、約60%以上、約
70%以上、約80%以上、約90%以上、または100%を占める場合に、非腫瘍領域
を含むと判定することができる。前記第2の訓練用画像70R2に含まれる組織の領域全
体の面積(100%)から腫瘍領域が占める割合を減じた値を前記非腫瘍細胞と細胞以外
の組織の領域とが組織全体の面積を占める割合として決定してもよい。
Second training data 74R2 and second preliminary training data 70R2L are generated from the second training image 70R2. The second training data 74R2 is information regarding a single color image in which the hues included in the second training image 70R2 are separated for each primary color. The second preliminary training data 70R2L is binarized data (label value) indicating that the tissue region included in the second training image 70R2 includes a non-tumor region. Whether or not the tissue region included in the second training image 70R2 includes a non-tumor region is determined by, for example, specimen observation by a pathologist or the like. Here, in the tissue region included in the training image, tumor cells, non-tumor cells,
Areas of tissue other than cells may be present. In this case, the area of tissue included in the training image is defined as non-tumor cells and areas of tissue other than cells (non-tumor area) is about 10% or more, about 20% or more, about 30% or more, about 40% or more, about 50% or more, about 60% or more, about 70% of the entire tissue area.
If the area occupies about 80% or more, about 90% or more, or 100%, it can be determined that a non-tumor area is included. Preferably, it is determined that a non-tumor region is included if it occupies about 40% or more, about 50% or more, about 60% or more, about 70% or more, about 80% or more, about 90% or more, or 100%. Can be done. The area of the entire tissue including the non-tumor cells and non-cell tissue is calculated by subtracting the proportion occupied by the tumor region from the area (100%) of the entire tissue region included in the second training image 70R2. It may also be determined as a percentage.
前記訓練用画像に含まれる第3の訓練用画像70R3は、第1の訓練用画像70R1、
および/または第2の訓練用画像70R2を取得した標本における組織を含まない領域(
非組織領域ともいう)から取得された画像である。
The third training image 70R3 included in the training images is the first training image 70R1,
and/or a region (
This is an image obtained from a non-tissue area (also called a non-tissue area).
第3訓練用画像からは、第3の訓練データ74R3と、第3の予備訓練データ70R3
Lが生成される。第3の訓練データ74R3は、第3の訓練用画像70R3に含まれる色
相を原色毎に分離した単一色画像に関する情報である。第3の予備訓練データ70R2L
は、第3の訓練用画像70R3に含まれている領域が、組織を含まない領域であることで
あることを示す二値化データ(ラベル値)である。第3の訓練用画像70R3に含まれる
領域は、例えば病理医等による標本観察により判定される。ここで、前記訓練用画像には
、組織の領域と背景(例えば、プレパラートのガラス部分)の領域とが混在する場合があ
る。この場合、前記訓練用画像に含まれる背景の領域が、例えば前記1枚の訓練用画像に
含まれる領域全体の面積を100%とした際に、背景の領域が約90%以上、約91%以
上、約92%以上、約93%以上、約94%以上、約95%以上、約96%以上、約97
%以上、約98%以上、または約99%以上を占める場合、あるいは背景の領域が100
%を占める場合に、組織を含まない領域であると判定することができる。好ましくは、背
景の領域が約95%以上、約96%以上、約97%以上、約98%以上、または約99%
以上を占める場合、あるいは背景の領域が100%を占める場合に、組織を含まない領域
であると判定することができる。
From the third training image, third training data 74R3 and third preliminary training data 70R3 are obtained.
L is generated. The third training data 74R3 is information regarding a single color image in which the hues included in the third training image 70R3 are separated for each primary color. Third preliminary training data 70R2L
is binarized data (label value) indicating that the region included in the third training image 70R3 is a region that does not include tissue. The area included in the third training image 70R3 is determined by, for example, specimen observation by a pathologist or the like. Here, the training image may include a tissue region and a background region (for example, a glass portion of a slide). In this case, the background area included in the training image is about 90% or more, about 91%, for example, when the area of the entire area included in the one training image is 100%. or more, about 92% or more, about 93% or more, about 94% or more, about 95% or more, about 96% or more, about 97% or more
% or more, approximately 98% or more, or approximately 99% or more, or the background area is 100% or more
%, it can be determined that the area does not contain tissue. Preferably, the background area is about 95% or more, about 96% or more, about 97% or more, about 98% or more, or about 99%
If the background area occupies 100% or more, or if the background area occupies 100%, it can be determined that the area does not contain tissue.
各訓練用画像は、訓練用の組織標本を、例えば5倍から20倍に拡大した画像として取
得されることが好ましい。判別精度の点から、30倍以上、特に40倍以上に拡大した画
像は、訓練用画像としては不向きである。
It is preferable that each training image is obtained as an image of a training tissue specimen enlarged, for example, from 5 times to 20 times. From the viewpoint of discrimination accuracy, images enlarged 30 times or more, particularly 40 times or more, are not suitable as training images.
第1の訓練データ74R1および第1の予備訓練データ70R1Lからは腫瘍領域訓練
データが生成され、第2の訓練データ74R2および第2の予備訓練データ70R2Lか
らは非腫瘍領域訓練データが生成され、第3の訓練データ74R3および第3の予備訓練
データ70R2Lからは非組織領域訓練データが生成される。腫瘍領域訓練データ、非腫
瘍領域訓練データおよび非組織領域訓練データを併せて訓練データと呼ぶことがある。
Tumor region training data is generated from the first training data 74R1 and the first preliminary training data 70R1L, non-tumor region training data is generated from the second training data 74R2 and the second preliminary training data 70R2L, and the first training data 74R1 and the first preliminary training data 70R1L generate tumor region training data. Non-organized region training data is generated from the third training data 74R3 and the third preliminary training data 70R2L. Tumor region training data, non-tumor region training data, and non-tissue region training data may be collectively referred to as training data.
本発明の概要および実施の形態では、HE染色された組織標本を撮像した画像内に含ま
れる組織が腫瘍領域、非腫瘍領域および非組織領域を含むことを、深層学習アルゴリズム
によって判別する場合を一例として説明する。
In the overview and embodiments of the present invention, an example is described in which a deep learning algorithm is used to determine whether the tissue contained in an image of an HE-stained tissue specimen includes tumorous regions, non-tumorous regions, and non-tissue regions.
[深層学習方法および画像解析方法の概要]
はじめに、深層学習方法について説明する。
[Overview of deep learning methods and image analysis methods]
First, we will explain the deep learning method.
・深層学習方法の概要
図1を用いて、第1の訓練データ74R1、第1の予備訓練データ70R1Lおよび腫
瘍領域訓練データ75R1の概要を説明する。図1には、スライドイメージスキャナによ
り取得した組織標本のホールスライドイメージ70W1を使ったニューラルネットワーク
への訓練データの入力例を示す。ホールスライドイメージ70W1は明視野観察用染色と
してHE染色を施して作製された標本を明視野で撮像した組織標本のスライドイメージを
示す。ホールスライドイメージ70W2は、病理医によりホールスライドイメージ70W
1において腫瘍領域を含む部分を病理医が実線で囲って指定した画像である。ホールスラ
イドイメージ70W3は、ホールスライドイメージ70W2を訓練用画像として分割(例
えば、512分割)した像を示す。ホールスライドイメージ70W3内の記号R1で示さ
れた四角枠で囲まれた領域は、図1に示す第1の訓練用画像70R1として使用する領域
を示す。記号R2で示された四角枠で囲まれた領域は、図2に示す第2の訓練用画像70
R2として使用する領域を示す。記号R3で示された四角枠で囲まれた領域は、図3に示
す第3の訓練用画像70R3として使用する領域を示す。第1の訓練用画像70R1が腫
瘍領域を含むこと、第2の訓練用画像70R2が非腫瘍領域を含むこと、および第3の訓
練用画像70R3が組織を含まない領域であることは、それぞれの訓練画像を取得する前
に判定していてもよく、それぞれの訓練画像を取得してから判定してもよい。
- Outline of deep learning method The outline of the first training data 74R1, the first preliminary training data 70R1L, and the tumor region training data 75R1 will be explained using FIG. FIG. 1 shows an example of inputting training data to a neural network using a whole slide image 70W1 of a tissue specimen obtained by a slide image scanner. The whole slide image 70W1 is a slide image of a tissue specimen obtained by imaging a specimen prepared by applying HE staining as a bright field observation stain in a bright field. The whole slide image 70W2 was created by a pathologist.
This is an image in which the pathologist specified the portion including the tumor region in No. 1 by surrounding it with a solid line. The whole slide image 70W3 is an image obtained by dividing the whole slide image 70W2 as a training image (for example, into 512 parts). An area surrounded by a rectangular frame indicated by the symbol R1 in the hole slide image 70W3 indicates an area used as the first training image 70R1 shown in FIG. 1. The area surrounded by a rectangular frame indicated by symbol R2 is the second training image 70 shown in FIG.
The area used as R2 is shown. The area surrounded by a rectangular frame indicated by symbol R3 indicates an area used as the third training image 70R3 shown in FIG. 3. The fact that the first training image 70R1 includes a tumor region, that the second training image 70R2 includes a non-tumor region, and that the third training image 70R3 is a region that does not include tissue means that each The determination may be made before acquiring the training images, or after acquiring each training image.
図1において、第1の訓練用画像70R1は、HE染色した標本を明視野観察下で例え
ばカラー画像として撮像しているため、第1の訓練用画像70R1には複数の色相が含ま
れる。
In FIG. 1, the first training image 70R1 is obtained by capturing an HE-stained specimen as a color image under bright-field observation, and therefore includes a plurality of hues.
第1の訓練用画像70R1は、例えば公知の光学顕微鏡、蛍光顕微鏡またはバーチャル
スライドスキャナ等の画像取得装置を用いて、予め取得することができる。例示的には、
本実施形態において画像取得装置から取得されるカラー撮像は、カラースペースがRGB
の24ビットカラーであることが好ましい。RGBの24ビットカラーでは、赤色、緑色
および青色のそれぞれの濃さ(色濃度)を、8ビット(256段階)の階調で表すことが
好ましい。第1の訓練用画像70R1は、1以上の原色を含む画像であればよい。第1の
訓練用画像70R1に対応して、第1の訓練データ74R1が生成される。
The first training image 70R1 can be acquired in advance using an image acquisition device such as a known optical microscope, a fluorescent microscope, or a virtual slide scanner.
In this embodiment, the color image captured by the image capture device is in the RGB color space.
In the 24-bit color of RGB, it is preferable that the saturation (color density) of each of the red, green, and blue colors is expressed by 8-bit (256 levels) gradation. The first training image 70R1 may be an image including one or more primary colors. First training data 74R1 is generated corresponding to the first training image 70R1.
本発明において、色相は、例示的には、光の3原色の組み合わせ、または色の3原色の
組み合わせで規定される。第1の訓練データ74R1は、第1の訓練用画像70R1から
生成される、第1の訓練用画像70R1に現れる色相を個々の原色に分離して原色毎に生
成し、その濃度に応じた符号で表されたデータである。図1では光の3原色である赤(R
)、緑(G)、青(B)の原色毎に分離した単一色の濃淡で示された画像(以下、「単一
色画像」ともいう)72R1R,72R1G,72R1Bを得る。
In the present invention, hue is illustratively defined by a combination of three primary colors of light or a combination of three primary colors of color. The first training data 74R1 is generated from the first training image 70R1 by separating the hue appearing in the first training image 70R1 into individual primary colors, and generating a code for each primary color according to the density. This is the data expressed as . In Figure 1, red (R
), green (G), and blue (B), images (hereinafter also referred to as "single color images") 72R1R, 72R1G, and 72R1B are obtained, which are shown in shading of a single color separated for each primary color.
単一色画像72R1R,72R1G,72R1B上の各画素について各色の色濃度を符
号化し、画像全体をR、G、B毎の各画像について、画素毎の色濃度に対応した符号化図
(以下、「色濃度符号化図」ともいう)72R1r,72R1g,72R1bを生成する
。色濃度は、各色256段階を示す数値で符号化しても良い。また、色濃度は、各色25
6段階を示す数値に対して、さらに前処理を行って、各画素における色濃度を例えば、値
0から値7の8段階で示す数字で符号化してもよい。図1に例示的に示すR、G、B各色
の単一色画像から生成された色濃度符号化図72R1r,72R1g,72R1bは、説
明の便宜上、各画素における色濃度を値0から値7の8段階の符号で表している。図1に
示す色濃度符号化図72R1r,72R1g,72R1bから画素毎にR、G、Bの色濃
度値が組み合わされた第1の訓練データ74R1が生成される。色濃度を示す符号は、本
明細書において色濃度値ともいう。また、第1の訓練データ74R1として、色濃度符号
化図に替えて、各画素に対応した色濃度値の行列を生成してもよい。
The color density of each color is encoded for each pixel on the single color images 72R1R, 72R1G, and 72R1B, and the entire image is converted into an encoding diagram (hereinafter referred to as " 72R1r, 72R1g, and 72R1b are generated. The color density may be encoded as a numerical value indicating 256 levels for each color. In addition, the color density is 25 for each color.
The numerical values indicating six levels may be further subjected to preprocessing, and the color density at each pixel may be encoded as a number indicating eight levels from value 0 to value 7, for example. For convenience of explanation, the color density encoding diagrams 72R1r, 72R1g, and 72R1b generated from single-color images of R, G, and B shown as an example in FIG. It is expressed by a stage code. First training data 74R1 in which R, G, and B color density values are combined for each pixel is generated from the color density encoding diagrams 72R1r, 72R1g, and 72R1b shown in FIG. The code indicating color density is also referred to as color density value in this specification. Further, as the first training data 74R1, a matrix of color density values corresponding to each pixel may be generated instead of the color density encoded diagram.
図1において、第1の予備訓練データ70R1Lは、第1の訓練用画像70R1に含ま
れている組織が、腫瘍領域を含むことを示すデータである。例えば、第1の訓練用画像7
0R1は、全領域が病理医の判定により腫瘍領域であると判定されているため第1の訓練
用画像70R1には、後述する所定の画素数の領域毎に腫瘍領域を含むことを示すラベル
値として同じ数値、例えば「1」が付され、第1の予備訓練データ70R1Lとなる。
In FIG. 1, the first preliminary training data 70R1L is data indicating that the tissue included in the first training image 70R1 includes a tumor region. For example, the first training image 7
In 0R1, since the entire region is determined to be a tumor region by a pathologist, the first training image 70R1 includes a label value indicating that a tumor region is included in each region of a predetermined number of pixels, which will be described later. The same numerical value, for example, "1" is assigned as the first preliminary training data 70R1L.
深層学習方法では、図1に示す第1の訓練データ74R1および第1の予備訓練データ
70R1Lから腫瘍領域訓練データ75R1を生成する。そして、腫瘍領域訓練データ7
5R1の各画素の色濃度値データ76(第1の訓練データ74R1から得られる)を入力
層50aとし、ラベル値77R1(第1の予備訓練データ70R1Lから得られる)を出
力層50bとするニューラルネットワーク50に学習させる。
In the deep learning method, tumor region training data 75R1 is generated from the first training data 74R1 and the first preliminary training data 70R1L shown in FIG.
The neural network 50 is trained using the color density value data 76 of each pixel of 5R1 (obtained from the first training data 74R1) as the input layer 50a and the label value 77R1 (obtained from the first preliminary training data 70R1L) as the output layer 50b.
次に、図2を用いて、第2の訓練データ74R2、第2の予備訓練データ70R2Lお
よび非腫瘍領域訓練データ75R2の概要を説明する。図2において、ホールスライドイ
メージ70W1、ホールスライドイメージ70W2、およびホールスライドイメージ70
W3は図1と同様であるため、第2の訓練用画像70R2には、第1の訓練用画像70R
1と同様に複数の色相が含まれる。
Next, the second training data 74R2, the second preliminary training data 70R2L, and the non-tumor region training data 75R2 will be outlined with reference to FIG. 2. In FIG. 2, the hole slide image 70W1, the hole slide image 70W2, and the hole slide image 70
Since W3 is the same as in FIG. 1, the second training image 70R2 has the same width as the first training image 70R
Like 1, it contains multiple hues.
第2の訓練用画像70R2は、腫瘍領域を含む組織に替えて非腫瘍領域含む組織を用い
る以外は、第1の訓練用画像70R1と同様の方法で取得される。第2の訓練用画像70
R2に対応して、第2の訓練データ74R2が生成される。
The second training image 70R2 is obtained in the same manner as the first training image 70R1, except that tissue including a non-tumor region is used instead of tissue including a tumor region. Second training image 70
Second training data 74R2 is generated corresponding to R2.
第2の訓練データ74R2は、腫瘍領域を含む組織に替えて非腫瘍領域含む組織を用い
る以外は、第1の訓練データ74R1と同様の方法で生成される。図2に示す色濃度符号
化図72R2r,72R2g,72R2bから画素毎にR、G、Bの色濃度値が組み合わ
された第2の訓練データ74R2が生成される。
The second training data 74R2 is generated in the same manner as the first training data 74R1, except that tissue including a non-tumor region is used instead of tissue including a tumor region. Second training data 74R2 in which R, G, and B color density values are combined for each pixel is generated from the color density encoding diagrams 72R2r, 72R2g, and 72R2b shown in FIG.
図2において、第2の予備訓練データ70R2Lは、第2の訓練用画像70R2が、非
腫瘍領域を含むことを示すデータである。第2の訓練用画像70R2は全領域が病理医の
判定により非腫瘍領域であると判定されているため、第2の訓練用画像70R2には、後
述する所定の画素数の領域毎に非腫瘍領域を含むことを示すラベル値として同じ数値、例
えば「2」が付され、第2の予備訓練データ70R2Lとなる。非腫瘍領域を含む領域で
あることを示すラベル値は、腫瘍領域を含む領域および組織を含まない領域を示すラベル
値と区別できる限り制限されない。
In FIG. 2, the second preliminary training data 70R2L is data indicating that the second training image 70R2 includes a non-tumor region. Since the entire region of the second training image 70R2 is determined to be a non-tumor region by the pathologist, the second training image 70R2 includes non-tumor regions for each region of a predetermined number of pixels, which will be described later. The same numerical value, for example, "2" is assigned as a label value indicating that the area is included, and the data becomes second preliminary training data 70R2L. A label value indicating a region including a non-tumor region is not limited as long as it can be distinguished from a label value indicating a region including a tumor region and a region not including tissue.
深層学習方法では、図2に示す第2の訓練データ74R2および第2の予備訓練データ
70R2Lから非腫瘍領域訓練データ75R2を生成する。そして、非腫瘍領域訓練デー
タ75R2の各画素の色濃度値データ76(第2の訓練データ74R2から得られる)を
入力層50aとし、ラベル値77R2(第2の予備訓練データ70R2Lから得られる)
を出力層50bとするニューラルネットワーク50に学習させる。
In the deep learning method, non-tumor region training data 75R2 is generated from second training data 74R2 and second preliminary training data 70R2L shown in FIG. Then, the color density value data 76 (obtained from the second training data 74R2) of each pixel of the non-tumor region training data 75R2 is used as the input layer 50a, and the label value 77R2 (obtained from the second preliminary training data 70R2L)
The neural network 50 with the output layer 50b is made to learn.
次に、図3を用いて、第3の訓練データ74R3、第3の予備訓練データ70R3Lお
よび非組織領域訓練データ75R3の概要を説明する。図3において、ホールスライドイ
メージ70W1、ホールスライドイメージ70W2、およびホールスライドイメージ70
W3は図1と同様であるため、第3の訓練用画像70R3には、第1の訓練用画像70R
1と同様に複数の色相が含まれる。
Next, an outline of the third training data 74R3, the third preliminary training data 70R3L, and the non-organized region training data 75R3 will be explained using FIG. In FIG. 3, a hole slide image 70W1, a hole slide image 70W2, and a hole slide image 70
Since W3 is the same as in FIG. 1, the third training image 70R3 includes the first training image 70R.
Similar to 1, multiple hues are included.
第3の訓練用画像70R3は、腫瘍領域を含む領域に替えて組織を含まない領域を用い
る以外は、第1の訓練用画像70R1と同様の方法で取得される。第3の訓練用画像70
R3に対応して、第3の訓練データ74R3が生成される。
The third training image 70R3 is acquired in a manner similar to that of the first training image 70R1, except that a tissue-free region is substituted for the region containing the tumor region.
Corresponding to R3, a third training data 74R3 is generated.
第3の訓練データ74R3は、腫瘍領域を含む領域に替えて組織を含まない領域を用い
る以外は、第1の訓練データ74R1と同様の方法で生成される。図3に示す色濃度符号
化図72R3r,72R3g,72R3bから画素毎にR、G、Bの色濃度値が組み合わ
された第3の訓練データ74R3が生成される。
The third training data 74R3 is generated in the same manner as the first training data 74R1, except that a tissue-free region is used instead of a tumor-containing region. The third training data 74R3 is generated by combining R, G, and B color density values for each pixel from the color density coding diagrams 72R3r, 72R3g, and 72R3b shown in FIG.
図3において、第3の予備訓練データ70R3Lは、第3の訓練用画像70R3に含ま
れている領域が、組織を含まない領域であることを示すデータである。第3の訓練用画像
70R3は全領域が病理医の判定により非組織領域であると判定されているため、第3の
訓練用画像70R3には、後述する所定の画素数の領域毎に組織を含まない領域であるこ
とを示すラベル値として同じ数値、例えば「0」が付され、第3の予備訓練データ70R
3Lとなる。組織を含まない領域であることを示すラベル値は、腫瘍領域を含む領域およ
び非腫瘍領域を含む領域を示す数値とは区別される。
In FIG. 3, the third preliminary training data 70R3L is data indicating that the region included in the third training image 70R3 is a region that does not include tissue. Since the entire region of the third training image 70R3 has been determined by the pathologist to be a non-tissue region, the third training image 70R3 includes tissues in each region of a predetermined number of pixels, which will be described later. The same numerical value, for example, "0" is attached as a label value indicating that the region does not include the third preliminary training data 70R.
It becomes 3L. A label value indicating a region that does not contain tissue is distinguished from a numerical value indicating a region containing a tumor region and a region containing a non-tumor region.
深層学習方法では、図3に示す第3の訓練データ74R3および第3の予備訓練データ
70R3Lから非組織領域訓練データ75R3を生成するそして、非組織領域訓練データ
75R3の各画素の色濃度値データ76(第3の訓練データ74R3から得られる)を入
力層50aとし、ラベル値77R3(第3の予備訓練データ70R3Lから得られる)を
出力層50bとするニューラルネットワーク50に学習させる。
In the deep learning method, non-organized region training data 75R3 is generated from the third training data 74R3 and third preliminary training data 70R3L shown in FIG. (obtained from the third training data 74R3) as the input layer 50a, and the label value 77R3 (obtained from the third preliminary training data 70R3L) as the output layer 50b.
図4(a)、(b)を参照して、腫瘍領域訓練データ75R1の生成方法を説明する。
図4(a)に示す第1の訓練データ74R1は、所定の画素数の腫瘍領域の色濃度符号化
図72R1r,72R1g,72R1bのそれぞれの色濃度値を組み合わせたデータであ
る。本明細書において、第1の訓練データ74R1の各画素の位置は、便宜上列を左から
l1、l2・・・li、行を上からm1、m2・・・mjで表す。第1の訓練データ74
R1は、図4(a)では、その画像サイズ(訓練データ1つあたりの大きさ)が説明の便
宜のために簡素化されており、第1の訓練データ74R1が、縦方向9画素および横方向
9画素の合計81画素を有する。すなわち、各画素の位置は、列を左からl1、l2・・
・l9、行を上からm1、m2・・・m9で表す。図4(a)に示す3つの値が、各画素
におけるR、G、B各色の色濃度値である。例示的には、3つの値は、左から、赤(R)
、緑(G)および青(B)の順序で格納されている。第1の訓練データ74R1の各画素
の色濃度値は便宜的に値0から値7の8段階で示されている。これは、画像の前処理の一
例として、撮像された際に256段階で表されている各色の画像72R1R,72R1G
,72R1Bの明るさを、8段階の色濃度値にそれぞれ変換する処理である。色濃度値は
、例えば最も低い明るさ(RGBカラー256段階で表した時の輝度値が低い階調群)を
色濃度値0とし、明るさの程度が高くなるに従い徐々に高い値を割り当ててゆき、最も高
い明るさ(RGBカラー256段階で表した時の輝度値が高い階調群)を色濃度値7とす
る。
A method of generating the tumor region training data 75R1 will be described with reference to FIGS. 4(a) and 4(b).
The first training data 74R1 shown in FIG. 4A is data that combines the color density values of the color density encoded diagrams 72R1r, 72R1g, and 72R1b of a tumor region with a predetermined number of pixels. In this specification, for convenience, the position of each pixel in the first training data 74R1 is expressed by l 1 , l 2 . . . l i in columns from the left, and m 1 , m 2 . . First training data 74
In FIG. 4A, the image size (size per training data) of R1 is simplified for convenience of explanation, and the first training data 74R1 has 9 pixels in the vertical direction and 9 pixels in the horizontal direction. It has a total of 81 pixels, including 9 pixels in the direction. In other words, the position of each pixel is from the left in columns l 1 , l 2 .
・l 9 , the rows are represented by m 1 , m 2 . . . m 9 from the top. The three values shown in FIG. 4A are the color density values of R, G, and B colors in each pixel. Illustratively, the three values are, from the left, red (R)
, green (G) and blue (B). The color density value of each pixel of the first training data 74R1 is shown in eight levels from value 0 to value 7 for convenience. This is an example of image pre-processing.
, 72R1B into eight levels of color density values. As for the color density value, for example, the lowest brightness (a gradation group with a low brightness value when expressed in 256 RGB color levels) is set to a color density value of 0, and gradually higher values are assigned as the degree of brightness increases. Then, the highest brightness (gradation group with a high brightness value when expressed in 256 RGB color levels) is set to a color density value of 7.
図1および図4(b)に示す腫瘍領域訓練データ75R1は、図4(a)に示す第1の
訓練データ74R1を所定数の画素からなる領域(以下、「ウィンドウサイズ」と記載す
る)で切り出したデータに第1の予備訓練データ70R1Lのラベル値に対応するラベル
値77R1を付したものである。ウィンドウサイズの腫瘍領域訓練データ75R1も、説
明の便宜のために3×3画素(l1:l3,m1:m3)に簡素化して示すが、各画素の
位置は、便宜上列を左からl1、l2・・・li、行を上からm1、m2・・・mjで表
す。実際の好ましいウィンドウサイズは、例示的には125×125画素(i=125、
j=125)、150×150画素(i=150、j=150)、166×166画素(
i=166、j=166)、180×180画素(i=180、j=180)、200×
200画素(i=200、j=200)、220×220画素(i=220、j=220
)、250×250画素(i=250、j=250)程度が、学習効率の点から好ましい
。より好ましくは、ウィンドウサイズは200×200画素程度である。ウィンドウサイ
ズは、たとえば60μm×60μm以上500μm×500μm以下の範囲である。好ま
しくは、60μm×60μm、100μm×100μm、150μm×150μm、20
0μm×200μm、250μm×250μm、300μm×300μm、350μm×
350μm、400μm×400μm、450μm×450μm、500μm×500μ
mである。より好ましくは、200μm×200μm~400μm×400μmである。
例えば、図4(b)に示すように、第1の訓練データ74R1の左端から3×3画素のウ
ィンドウW1(l1:l3,m1:m3)を設定し、第1の訓練データ74R1に対して
左から右にウィンドウW1を移動させる。ウィンドウW1は(l1:l3,m1:m3)
の腫瘍領域訓練データ75R1を切り出した後、第1の予備訓練データ70R1Lのラベ
ル値に対応するラベル値77R1を腫瘍領域訓練データ75R1に付す。ウィンドウW1
は点線で示す腫瘍領域訓練データ74R1の次のウィンドウ(l4:l6,m4:m6)
に移動し、(l4:l6,m4:m6)をウィンドウサイズの腫瘍領域訓練データ75R
1として切り出す。新たに切り出された腫瘍領域訓練データ75R1に第1の予備訓練デ
ータ70R1Lのラベル値に対応するラベル値77R1を付す。この操作を、繰り返し、
複数のウィンドウサイズの腫瘍領域訓練データ75R1を第1の訓練データ74R1から
切り出す。切り出したウィンドウサイズの腫瘍領域訓練データ75R1は第1の予備訓練
データ70R1Lのラベル値に対応するラベル値77R1が付され図1に示すニューラル
ネットワーク50の学習に用いられる。
The tumor region training data 75R1 shown in FIGS. 1 and 4(b) is based on the first training data 74R1 shown in FIG. A label value 77R1 corresponding to the label value of the first preliminary training data 70R1L is attached to the cut-out data. The window-sized tumor region training data 75R1 is also shown simplified to 3×3 pixels (l 1 :l 3 , m 1 :m 3 ) for convenience of explanation, but the position of each pixel is shown with the column on the left for convenience. From l 1 , l 2 ... l i , the rows are represented by m 1 , m 2 ... m j from the top. The actual preferred window size is illustratively 125 x 125 pixels (i=125,
j = 125), 150 x 150 pixels (i = 150, j = 150), 166 x 166 pixels (
i=166, j=166), 180×180 pixels (i=180, j=180), 200×
200 pixels (i=200, j=200), 220×220 pixels (i=220, j=220
), about 250×250 pixels (i=250, j=250) is preferable from the point of view of learning efficiency. More preferably, the window size is about 200×200 pixels. The window size is, for example, in a range of 60 μm×60 μm or more and 500 μm×500 μm or less. Preferably, 60 μm x 60 μm, 100 μm x 100 μm, 150 μm x 150 μm, 20
0μm×200μm, 250μm×250μm, 300μm×300μm, 350μm×
350μm, 400μm×400μm, 450μm×450μm, 500μm×500μm
It is m. More preferably, the size is 200 μm×200 μm to 400 μm×400 μm.
For example, as shown in FIG. 4(b), a 3×3 pixel window W1 (l 1 :l 3 , m 1 :m 3 ) is set from the left end of the first training data 74R1, and the first training data The window W1 is moved from left to right with respect to 74R1. Window W1 is (l 1 :l 3 , m 1 :m 3 )
After cutting out the tumor region training data 75R1, a label value 77R1 corresponding to the label value of the first preliminary training data 70R1L is attached to the tumor region training data 75R1. Window W1
is the next window of tumor region training data 74R1 indicated by a dotted line (l 4 :l 6 , m 4 :m 6 )
, and set (l 4 :l 6 ,m 4 :m 6 ) to the tumor region training data of window size 75R.
Cut out as 1. A label value 77R1 corresponding to the label value of the first preliminary training data 70R1L is attached to the newly extracted tumor region training data 75R1. Repeat this operation,
Tumor region training data 75R1 of multiple window sizes are cut out from the first training data 74R1. The tumor region training data 75R1 of the cut out window size is given a label value 77R1 corresponding to the label value of the first preliminary training data 70R1L, and is used for learning of the neural network 50 shown in FIG. 1.
図1に示すように、ニューラルネットワーク50の入力層50aのノード数は、入力さ
れるウィンドウサイズの腫瘍領域訓練データ75R1の画素数と画像に含まれる原色の数
(例えば光の三原色であれば、R、G、Bの3つ)との積に対応している。ウィンドウサ
イズの腫瘍領域訓練データ75R1の各画素の色濃度値データ76をニューラルネットワ
ークの入力層50aとし、第1の予備訓練データ70R1Lに対応するラベル値77R1
をニューラルネットワークの出力層50bとして、ニューラルネットワーク50に学習さ
せる。各画素の色濃度値データ76は、腫瘍領域訓練データ75R1の各画素のR、G、
B各色の色濃度値の集合データである。例示として、ウィンドウサイズの腫瘍領域訓練デ
ータ75R1が3×3画素である場合には、各画素についてR、G、B毎に1つずつの色
濃度値が与えられるので、色濃度値データ76の色濃度値数は「27」(3×3×3=2
7)となり、ニューラルネットワーク50の入力層50aのノード数も「27」となる。
As shown in FIG. 1, the number of nodes in the input layer 50a of the neural network 50 is determined by the number of pixels of the tumor region training data 75R1 of the input window size and the number of primary colors included in the image (for example, in the case of the three primary colors of light, R, G, and B). The color density value data 76 of each pixel of the window-sized tumor region training data 75R1 is used as the input layer 50a of the neural network, and the label value 77R1 corresponding to the first preliminary training data 70R1L is
The neural network 50 is made to learn by using it as the output layer 50b of the neural network. The color density value data 76 of each pixel includes R, G,
B is a collection of color density values for each color. As an example, if the window size tumor region training data 75R1 is 3 x 3 pixels, one color density value is given for each R, G, and B for each pixel, so the color density value data 76 is The number of color density values is "27" (3 x 3 x 3 = 2
7), and the number of nodes in the input layer 50a of the neural network 50 is also "27".
このように、ニューラルネットワーク50に入力するウィンドウサイズの腫瘍領域訓練
データ75R1は、ユーザが作成することなく、コンピュータが自動的に作成することが
できる。これにより、ニューラルネットワーク50の効率的な深層学習が促進される。
In this way, the window-sized tumor region training data 75R1 to be input to the neural network 50 can be automatically created by the computer without being created by the user. This facilitates efficient deep learning of the neural network 50.
図4(b)に示すように、初期状態において、ウィンドウW1は、第1の訓練データ7
4R1の左上角に位置している。以後、ウィンドウW1によってウィンドウサイズの腫瘍
領域訓練データ75R1を切り出し、ニューラルネットワーク50の学習を行う度に、ウ
ィンドウW1の位置を移動させる。具体的には、ウィンドウW1が第1の訓練データ74
R1の例えば全ての画素を走査するように、ウィンドウW1を移動させる。これにより、
第1の訓練データ74R1の全ての画素から切り出されたウィンドウサイズの腫瘍領域訓
練データ75R1が、ニューラルネットワーク50の学習に用いられる。よってニューラ
ルネットワーク50の学習の程度を向上でき、深層学習の結果、図6に示すニューラルネ
ットワーク60構造を有する深層学習アルゴリズムが得られる。
As shown in FIG. 4(b), in the initial state, the window W1 contains the first training data 7.
It is located in the upper left corner of 4R1. Thereafter, the tumor region training data 75R1 of the window size is cut out using the window W1, and the position of the window W1 is moved every time the neural network 50 is trained. Specifically, the window W1 is the first training data 74.
The window W1 is moved so as to scan, for example, all pixels of R1. This results in
Tumor region training data 75R1 of a window size cut out from all pixels of the first training data 74R1 is used for learning of the neural network 50. Therefore, the degree of learning of the neural network 50 can be improved, and as a result of deep learning, a deep learning algorithm having the structure of the neural network 60 shown in FIG. 6 can be obtained.
図5(a)には、第2の訓練データ74R2を示す。第2の訓練データ74R2から非
腫瘍領域訓練データ75R2を生成する方法は、第1の訓練データ74R1および第1の
予備訓練データ70R1Lに替えて、第2の訓練データ74R2および第2の予備訓練デ
ータ70R2Lを使用する点を除き、腫瘍領域訓練データ75R1と同様である。非腫瘍
領域訓練データ75R2に付される第2の予備訓練データ70R2Lのラベル値に対応す
るラベル値77R2が、図2に示す出力層50bに入力される。
FIG. 5(a) shows second training data 74R2. The method of generating non-tumor region training data 75R2 from the second training data 74R2 is to replace the first training data 74R1 and the first preliminary training data 70R1L with the second training data 74R2 and the second preliminary training data. This is similar to the tumor region training data 75R1 except that 70R2L is used. A label value 77R2 corresponding to the label value of the second preliminary training data 70R2L attached to the non-tumor region training data 75R2 is input to the output layer 50b shown in FIG. 2.
図5(b)には、第3の訓練データ74R3を示す。第3の訓練データ74R3から非
組織領域訓練データ75R3を生成する方法は、第1の訓練データ74R1および第1の
予備訓練データ70R1Lに替えて、第3の訓練データ74R3および第3の予備訓練デ
ータ70R3Lを使用する点を除き、腫瘍領域訓練データ75R1と同様である。非組織
領域訓練データ75R3に付される第3の予備訓練データ70R3Lのラベル値に対応す
るラベル値77R3が、図3に示す出力層50bに入力される。
FIG. 5(b) shows third training data 74R3. The method of generating the non-organized region training data 75R3 from the third training data 74R3 is to replace the first training data 74R1 and the first preliminary training data 70R1L with the third training data 74R3 and the third preliminary training data. This is similar to the tumor region training data 75R1 except that 70R3L is used. A label value 77R3 corresponding to the label value of the third preliminary training data 70R3L attached to the non-organized region training data 75R3 is input to the output layer 50b shown in FIG. 3.
各領域訓練データは、10枚以上、20枚以上、50枚以上、100枚以上の各領域の
訓練用画像を使って生成することが好ましい。
It is preferable that the training data for each region is generated using 10 or more, 20 or more, 50 or more, or 100 or more training images for each region.
・画像解析方法の概要 図6に示すように、画像解析方法では、解析対象の組織を含む標
本を撮像した解析対象画像(明視野画像)78から、解析用データ80を生成する。前記
標本は、第1の訓練用画像と同じ染色が施されていることが好ましい。解析対象画像78
も、例えば公知の顕微鏡またはバーチャルスライドスキャナ等を用いて、例えばカラー画
像として取得することができる。解析対象画像78は、訓練用画像と同程度または同じ拡
大倍率で取得されることが好ましい。解析対象画像(明視野画像)78は、1以上の原色
を含む画像であればよい。カラーの解析対象画像78を、各画素についてR、G、B各色
の色濃度値で符号化すると、画像全体をR、G、B毎に各画素における色濃度値の符号化
図として表すことができる(解析用色濃度符号化図79r,79g,79b)。解析用色
濃度符号化図79r,79g,79bから画素毎にR、G、Bの色濃度値が組み合わされ
た解析対象データ(図示せず)が生成される。図6に例示的に示すR、G、B各色の単一
色画像における色濃度の符号を示す色濃度符号化図79r,79g,79bは、3原色の
各画像79R,79G,79Bに代えて、値0から値7の8段階の符号で表された色濃度
値を表示している。本明細書において、解析対象データの各画素の位置は、便宜上列を左
からl1、l2・・・li、行を上からm1、m2・・・mjで表す。
- Outline of image analysis method As shown in FIG. 6, in the image analysis method, analysis data 80 is generated from an analysis target image (bright field image) 78 obtained by capturing a specimen including a tissue to be analyzed. Preferably, the specimen is stained with the same staining as the first training image. Analysis target image 78
It is also possible to obtain, for example, a color image using, for example, a known microscope or virtual slide scanner. It is preferable that the analysis target image 78 is acquired at the same degree or the same magnification as the training image. The image to be analyzed (bright field image) 78 may be any image containing one or more primary colors. When the color analysis target image 78 is encoded using the color density values of R, G, and B for each pixel, the entire image can be represented as an encoded diagram of the color density values of each pixel for each R, G, and B. (Analytical color density encoding diagrams 79r, 79g, 79b). Analysis target data (not shown) in which R, G, and B color density values are combined for each pixel is generated from the analytical color density coding diagrams 79r, 79g, and 79b. The color density coding diagrams 79r, 79g, and 79b showing the signs of color density in the single color images of each of R, G, and B, exemplarily shown in FIG. Color density values are displayed using codes in eight stages from value 0 to value 7. In this specification, for convenience, the position of each pixel of the data to be analyzed is represented by columns l 1 , l 2 . . . l i from the left, and rows m 1 , m 2 .
解析用データ80は、解析対象データを所定の画素数の領域(すなわち、上記各領域訓
練データと同じウィンドウサイズ)で切り出したデータであり、解析対象画像78に含ま
れている組織の色濃度値を含むデータである。図6では、ウィンドウサイズの解析用デー
タ80も、腫瘍領域訓練データ75R1、非腫瘍領域訓練データ75R2および非組織領
域訓練データ75R3と同様に、説明の便宜のために3×3画素に簡素化して示すが、実
際の好ましいウィンドウサイズは、腫瘍領域訓練データ75R1、非腫瘍領域訓練データ
75R2および非組織領域訓練データ75R3と同様である。例えば、3×3画素のウィ
ンドウW2を設定し、解析対象データに対してウィンドウW2を移動させる。ウィンドウ
W2は、解析対象データ中の所定数の画素を含んでおり、解析対象データを、各領域訓練
データと同様の方法で例えば3×3画素の黒枠で示すウィンドウW2によって切り出すと
、ウィンドウサイズの解析用データ80が得られる。各領域訓練データと同様の方法で、
複数の解析用データ80が、解析対象データから、ウィンドウサイズに対応する所定の画
素数の領域毎に生成される。解析対象データ、ウィンドウサイズの解析用データ80にお
いても、腫瘍領域訓練データ75R1、非腫瘍領域訓練データ75R2および非組織領域
訓練データ75R3と同様に、各画素について、色濃度値が赤(R)、緑(G)および青
(B)の順序で格納されている。
The analysis data 80 is data obtained by cutting out the analysis target data into a region with a predetermined number of pixels (that is, the same window size as the training data for each region described above), and the color density value of the tissue included in the analysis target image 78. This is data that includes. In FIG. 6, window size analysis data 80 is also simplified to 3×3 pixels for convenience of explanation, similar to tumor region training data 75R1, non-tumor region training data 75R2, and non-tissue region training data 75R3. As shown, the actual preferred window size is similar to tumor region training data 75R1, non-tumor region training data 75R2, and non-tissue region training data 75R3. For example, a 3×3 pixel window W2 is set and the window W2 is moved relative to the data to be analyzed. The window W2 includes a predetermined number of pixels in the data to be analyzed, and if the data to be analyzed is cut out using the window W2 indicated by a black frame of, for example, 3 x 3 pixels in the same manner as the training data for each region, the window size is Analysis data 80 is obtained. In the same way as each region training data,
A plurality of analysis data 80 are generated from the analysis target data for each region of a predetermined number of pixels corresponding to the window size. In the analysis target data and window size analysis data 80, the color density value of each pixel is red (R), similarly to the tumor region training data 75R1, non-tumor region training data 75R2, and non-tissue region training data 75R3. They are stored in the order of green (G) and blue (B).
画像解析方法では、図1から図3に示すウィンドウサイズの腫瘍領域訓練データ75R
1、非腫瘍領域訓練データ75R2および非組織領域訓練データ75R3を用いて学習さ
せたニューラルネットワークを有する深層学習アルゴリズム60を用いて、解析用データ
80を処理する。解析用データ80を処理することによって、解析対象の組織における解
析用データに含まれる領域が腫瘍領域であるか否かを示すデータ83を生成する。
In the image analysis method, the tumor region training data 75R of the window size shown in Figs.
1. Analysis data 80 is processed using deep learning algorithm 60 having a neural network trained using non-tumor region training data 75R2 and non-tissue region training data 75R3. By processing analysis data 80, data 83 is generated that indicates whether a region included in the analysis data in the tissue to be analyzed is a tumor region.
再び図6を参照し、R、G、B各色の色濃度符号化図79r,79g,79bに基づき
生成された解析対象データから切り出された解析用データ80が深層学習アルゴリズムを
構成するニューラルネットワーク60に入力される。ニューラルネットワーク60の入力
層60aのノード数は、入力される画素数と画像に含まれる原色の数との積に対応してい
る。解析用データ80の各画素の色濃度値データ81を、ニューラルネットワーク60に
入力すると、出力層60bからは、解析用データ80の推定値82(3値)が出力される
。例えば推定値が1の場合は解析用データ80を構成する所定画素数の領域(画素領域)
が腫瘍領域を含むことを示し、推定値が2の場合は前記画素領域が非腫瘍領域を含むこと
を示し、推定値が0の場合は前記画素領域が非組織領域であることを示す。すなわち、ニ
ューラルネットワーク60の出力層60bから出力される推定値82は、解析対象画像の
前記画素領域毎に生成されるラベル値であり、解析対象画像における解析用データに含ま
れる領域が腫瘍領域であるか否かを示すデータである。推定値82は、ニューラルネット
ワークに関する後述する説明ではクラスとも呼ばれる。ニューラルネットワーク60は、
入力された解析用データ80に対し、解析用データ80に含まれる所定数の画素の色濃度
値データ81に基づいて、腫瘍領域を含むことを示すラベル値、非腫瘍領域を含むことを
示すラベル値、または非組織領域を示すラベル値を生成する。言い替えると、ニューラル
ネットワーク60は、解析用データ80を、解析対象画像に含まれる注目画素領域の状態
(腫瘍化しているか、腫瘍化していないか、組織ではないか)を示すクラスに分類する。
ここで、各画素の色濃度値データ81は、解析用データ80の各画素のR、G、B各色の
色濃度値の集合データである。
6 again, analysis data 80 extracted from the analysis target data generated based on the color density coding maps 79r, 79g, and 79b for each of the R, G, and B colors is input to a neural network 60 constituting a deep learning algorithm. The number of nodes in the input layer 60a of the neural network 60 corresponds to the product of the number of input pixels and the number of primary colors contained in the image. When color density value data 81 of each pixel of the analysis data 80 is input to the neural network 60, an estimated value 82 (three values) of the analysis data 80 is output from the output layer 60b. For example, if the estimated value is 1, then the area (pixel area) of a predetermined number of pixels constituting the analysis data 80 is 1.
indicates that the pixel region includes a tumor region, an estimated value of 2 indicates that the pixel region includes a non-tumor region, and an estimated value of 0 indicates that the pixel region is a non-tissue region. That is, the estimated value 82 output from the output layer 60b of the neural network 60 is a label value generated for each pixel region of the image to be analyzed, and is data indicating whether or not a region included in the analysis data in the image to be analyzed is a tumor region. The estimated value 82 is also referred to as a class in the description of neural networks to be given later. The neural network 60
For the input analysis data 80, a label value indicating the inclusion of a tumorous region, a label value indicating the inclusion of a non-tumorous region, or a label value indicating a non-tissue region is generated based on color density value data 81 of a predetermined number of pixels contained in the analysis data 80. In other words, the neural network 60 classifies the analysis data 80 into classes indicating the state of the pixel region of interest contained in the image to be analyzed (tumorous, non-tumorous, or non-tissue).
Here, the color density value data 81 of each pixel is a set of data of the color density values of each of the R, G, and B colors of each pixel of the analysis data 80 .
以後、ウィンドウW2が解析対象データの全ての画素を走査するように、ウィンドウW
2を所定画素数の領域単位で移動させながら、解析用データ80をウィンドウサイズで切
り出す。切り出された解析用データ80を、ニューラルネットワーク60に入力する。こ
れにより、解析対象画像における組織の解析用データに含まれる領域が腫瘍領域であるか
否かを示すデータに基づいて、ラベル値83を得る。図6に示す例では、ラベル値83に
ついてさらに領域検出処理を行うことにより、領域を示す領域強調画像84を得る。領域
検出処理は、具体的には、例えば推定値82に応じて各領域を検出する処理となり、実際
に推定値82が「1」の画素領域を腫瘍領域と、推定値82が「2」の画素領域を非腫瘍
領域と、推定値82が0の画素領域を非組織領域と判別する処理となる。領域強調画像8
4は、画像解析処理により検出された領域を、ラベル値83を色(腫瘍領域を白、非腫瘍
領域をグレー、非組織領域を黒)で表した図である)。また、各領域を判別した後に、腫
瘍領域と、それ以外の領域(すなわち、非腫瘍領域および/又は非組織領域)とを識別可
能に表示装置に表示させる処理を行ってもよい。例えば、腫瘍領域を色で塗りつぶす、腫
瘍領域とそれ以外の領域との間に線を描画する等の処理を行い、これらを表示装置に識別
可能に表示する。また、非腫瘍領域および/又は非組織領域についても識別可能に表示装
置に表示させる処理を行ってもよい。
Thereafter, the window W2 scans all pixels of the data to be analyzed.
2 in units of a predetermined number of pixels, the analysis data 80 is cut out in a window size. The extracted analysis data 80 is input to the neural network 60. As a result, a label value 83 is obtained based on data indicating whether the region included in the tissue analysis data in the image to be analyzed is a tumor region. In the example shown in FIG. 6, by further performing region detection processing on the label value 83, a region-enhanced image 84 indicating the region is obtained. Specifically, the area detection process is a process of detecting each area according to the estimated value 82, for example, and actually identifies a pixel area where the estimated value 82 is "1" as a tumor area, and a pixel area where the estimated value 82 is "2". This is a process for determining a pixel region as a non-tumor region and a pixel region for which the estimated value 82 is 0 as a non-tissue region. Area emphasis image 8
4 is a diagram showing regions detected by image analysis processing using label values 83 and colors (white for tumor regions, gray for non-tumor regions, and black for non-tissue regions). Further, after each region is discriminated, processing may be performed to display the tumor region and other regions (namely, non-tumor region and/or non-tissue region) on the display device in a distinguishable manner. For example, processing such as filling the tumor region with color or drawing lines between the tumor region and other regions is performed, and these are displayed on the display device in a distinguishable manner. Further, a process may be performed to display the non-tumor region and/or the non-tissue region in a distinguishable manner on the display device.
<第1の実施形態>
第1の実施形態では、上述の概要で説明した深層学習方法および画像解析方法を実施す
るシステムの構成について、具体的に説明する。
[構成の概要]
<First embodiment>
In the first embodiment, the configuration of a system that implements the deep learning method and image analysis method described in the above overview will be specifically described.
[Configuration overview]
図7を参照すると、第1の実施形態に係る画像解析システムは、深層学習装置100A
と、画像解析装置200Aとを備える。ベンダ側装置100は深層学習装置100Aとし
て動作し、ユーザ側装置200は画像解析装置200Aとして動作する。深層学習装置1
00Aは、ニューラルネットワーク50に訓練データを使って学習させ、訓練データによ
って訓練された深層学習アルゴリズム60をユーザに提供する。学習済みのニューラルネ
ットワーク60から構成される深層学習アルゴリズムは、記憶媒体98またはネットワー
ク99を通じて、深層学習装置100Aから画像解析装置200Aに提供される。画像解
析装置200Aは、学習済みのニューラルネットワーク60から構成される深層学習アル
ゴリズムを用いて解析対象の画像の解析を行う。
Referring to FIG. 7, the image analysis system according to the first embodiment includes a deep learning device 100A.
and an image analysis device 200A. The vendor device 100 operates as a deep learning device 100A, and the user device 200 operates as an image analysis device 200A. Deep learning device 1
00A causes the neural network 50 to learn using training data, and provides the user with a deep learning algorithm 60 trained using the training data. The deep learning algorithm composed of the trained neural network 60 is provided from the deep learning device 100A to the image analysis device 200A via the storage medium 98 or the network 99. The image analysis device 200A analyzes the image to be analyzed using a deep learning algorithm configured by the trained neural network 60.
深層学習装置100Aは、例えば汎用コンピュータで構成されており、後述するフロー
チャートに基づいて、深層学習処理を行う。画像解析装置200Aは、例えば汎用コンピ
ュータで構成されており、後述するフローチャートに基づいて、画像解析処理を行う。記
憶媒体98は、例えばDVD-ROMやUSBメモリ等の、コンピュータ読み取り可能で
あって非一時的な有形の記憶媒体である。
The deep learning device 100A is composed of, for example, a general-purpose computer, and performs deep learning processing based on a flowchart described later. The image analysis device 200A is composed of, for example, a general-purpose computer, and performs image analysis processing based on a flowchart described later. The storage medium 98 is a computer-readable non-transitory tangible storage medium such as a DVD-ROM or a USB memory.
深層学習装置100Aは撮像装置300に接続されている。撮像装置300は、撮像素
子301と、蛍光顕微鏡302とを備え、ステージ309上にセットされた学習用の標本
308の、明視野画像および蛍光画像を撮像する。学習用の標本308は、上述の染色が
施されている。深層学習装置100Aは、撮像装置300によって撮像された訓練用画像
を取得する。
The deep learning device 100A is connected to the imaging device 300. The imaging device 300 includes an imaging element 301 and a fluorescence microscope 302, and captures a bright field image and a fluorescence image of a learning specimen 308 set on a stage 309. The learning specimen 308 is stained as described above. The deep learning device 100A acquires training images captured by the imaging device 300.
画像解析装置200Aは撮像装置400に接続されている。撮像装置400は、撮像素
子401と、蛍光顕微鏡402とを備え、ステージ409上にセットされた解析対象の標
本408の、明視野画像を撮像する。解析対象の標本408は、上述の通り予め染色され
ている。画像解析装置200Aは、撮像装置400によって撮像された解析対象画像78
を取得する。
Image analysis device 200A is connected to imaging device 400. The imaging device 400 includes an imaging device 401 and a fluorescence microscope 402, and captures a bright field image of a specimen 408 to be analyzed set on a stage 409. The specimen 408 to be analyzed has been stained in advance as described above. The image analysis device 200A analyzes an analysis target image 78 captured by the imaging device 400.
get.
撮像装置300,400には、標本を撮像する機能を有する、公知の蛍光顕微鏡または
バーチャルスライドスキャナ等を用いることができる。撮像装置400は、標本を撮像す
る機能を有する限り、光学顕微鏡であっても良い。
As the imaging devices 300 and 400, a known fluorescence microscope, virtual slide scanner, or the like, which has a function of imaging a specimen, can be used. The imaging device 400 may be an optical microscope as long as it has the function of imaging a specimen.
[ハードウェア構成]
図8を参照すると、ベンダ側装置100(100A,100B)は、処理部10(10
A,10B)と、入力部16と、出力部17とを備える。
[Hardware configuration]
Referring to FIG. 8, the vendor device 100 (100A, 100B) has a processing unit 10 (100B).
A, 10B), an input section 16, and an output section 17.
処理部10は、後述するデータ処理を行うCPU(Central Processing Unit)11と
、データ処理の作業領域に使用するメモリ12と、後述するプログラムおよび処理データ
を記憶する記憶部13と、各部の間でデータを伝送するバス14と、外部機器とのデータ
の入出力を行うインタフェース部15と、GPU(Graphics Processing Unit)19とを
備えている。入力部16および出力部17は、処理部10に接続されている。例示的には
、入力部16はキーボードまたはマウス等の入力装置であり、出力部17は液晶ディスプ
レイ等の表示装置である。GPU19は、CPU11が行う演算処理(例えば、並列演算
処理)を補助するアクセラレータとして機能する。すなわち以下の説明においてCPU1
1が行う処理とは、CPU11がGPU19をアクセラレータとして用いて行う処理も含
むことを意味する。
The processing unit 10 includes a CPU (Central Processing Unit) 11 that performs data processing, which will be described later, a memory 12 that is used as a work area for data processing, and a storage unit 13 that stores programs and processing data that will be described later. It includes a bus 14 for transmitting data, an interface section 15 for inputting and outputting data to and from external devices, and a GPU (Graphics Processing Unit) 19. The input section 16 and the output section 17 are connected to the processing section 10. Illustratively, the input unit 16 is an input device such as a keyboard or a mouse, and the output unit 17 is a display device such as a liquid crystal display. The GPU 19 functions as an accelerator that assists the arithmetic processing (for example, parallel arithmetic processing) performed by the CPU 11. In other words, in the following explanation, CPU1
The processing performed by the CPU 11 includes the processing performed by the CPU 11 using the GPU 19 as an accelerator.
また、処理部10は、以下の図10で説明する各ステップの処理を行うために、本発明
に係るプログラムおよび学習前のニューラルネットワーク50を、例えば実行形式で記憶
部13に予め記憶している。実行形式は、例えばプログラミング言語からコンパイラによ
り変換されて生成される形式である。処理部10は、記憶部13に記憶したプログラムお
よび学習前のニューラルネットワーク50を使用して処理を行う。
Further, the processing unit 10 stores in advance the program according to the present invention and the pre-learning neural network 50 in the storage unit 13 in an executable format, for example, in order to process each step described in FIG. 10 below. . The executable format is, for example, a format generated by converting a programming language with a compiler. The processing unit 10 performs processing using the program stored in the storage unit 13 and the pre-learning neural network 50.
以下の説明においては、特に断らない限り、処理部10が行う処理は、記憶部13また
はメモリ12に格納されたプログラムおよびニューラルネットワーク50に基づいて、C
PU11が行う処理を意味する。CPU11はメモリ12を作業領域として必要なデータ
(処理途中の中間データ等)を一時記憶し、記憶部13に演算結果等の長期保存するデー
タを適宜記憶する。
In the following description, unless otherwise specified, the processing performed by the processing unit 10 is based on the program stored in the storage unit 13 or the memory 12 and the neural network 50.
It means the process performed by PU11. The CPU 11 uses the memory 12 as a work area to temporarily store necessary data (intermediate data during processing, etc.), and appropriately stores long-term storage data such as calculation results in the storage unit 13.
図9を参照すると、ユーザ側装置200(200A,200B,200C)は、処理部
20(20A,20B,20C)と、入力部26と、出力部27とを備える。
Referring to FIG. 9, the user device 200 (200A, 200B, 200C) includes a processing section 20 (20A, 20B, 20C), an input section 26, and an output section 27.
処理部20は、後述するデータ処理を行うCPU(Central Processing Unit)21と
、データ処理の作業領域に使用するメモリ22と、後述するプログラムおよび処理データ
を記憶する記憶部23と、各部の間でデータを伝送するバス24と、外部機器とのデータ
の入出力を行うインタフェース部25と、GPU(Graphics Processing Unit)29とを
備えている。入力部26および出力部27は、処理部20に接続されている。例示的には
、入力部26はキーボードまたはマウス等の入力装置であり、出力部27は液晶ディスプ
レイ等の表示装置である。GPU29は、CPU21が行う演算処理(例えば、並列演算
処理)を補助するアクセラレータとして機能する。すなわち以下の説明においてCPU2
1が行う処理とは、CPU21がGPU29をアクセラレータとして用いて行う処理も含
むことを意味する。
The processing unit 20 includes a CPU (Central Processing Unit) 21 that performs data processing, which will be described later, a memory 22, which is used as a work area for data processing, and a storage unit 23, which stores programs and processing data, which will be described later. It includes a bus 24 for transmitting data, an interface section 25 for inputting and outputting data to and from external devices, and a GPU (Graphics Processing Unit) 29. The input section 26 and the output section 27 are connected to the processing section 20. Illustratively, the input unit 26 is an input device such as a keyboard or a mouse, and the output unit 27 is a display device such as a liquid crystal display. The GPU 29 functions as an accelerator that assists the arithmetic processing (for example, parallel arithmetic processing) performed by the CPU 21. That is, in the following explanation, CPU2
The processing performed by CPU 1 includes processing performed by CPU 21 using GPU 29 as an accelerator.
また、処理部20は、以下の図14で説明する各ステップの処理を行うために、本発明
に係るプログラムおよび学習済みのニューラルネットワーク構造の深層学習アルゴリズム
60を、例えば実行形式で記憶部23に予め記憶している。実行形式は、例えばプログラ
ミング言語からコンパイラにより変換されて生成される形式である。処理部20は、記憶
部23に記憶したプログラムおよび深層学習アルゴリズム60を使用して処理を行う。
Further, the processing unit 20 stores the program according to the present invention and the deep learning algorithm 60 of the learned neural network structure in the storage unit 23 in an executable format, for example, in order to process each step described in FIG. 14 below. I remember it in advance. The executable format is, for example, a format generated by converting a programming language with a compiler. The processing unit 20 performs processing using the program stored in the storage unit 23 and the deep learning algorithm 60.
以下の説明においては、特に断らない限り、処理部20が行う処理は、記憶部23また
はメモリ22に格納されたプログラムおよび深層学習アルゴリズム60に基づいて、実際
には処理部20のCPU21が行う処理を意味する。CPU21はメモリ22を作業領域
として必要なデータ(処理途中の中間データ等)を一時記憶し、記憶部23に演算結果等
の長期保存するデータを適宜記憶する。
In the following description, unless otherwise specified, the processing performed by the processing unit 20 is actually the processing performed by the CPU 21 of the processing unit 20 based on the program and deep learning algorithm 60 stored in the storage unit 23 or memory 22. means. The CPU 21 uses the memory 22 as a work area to temporarily store necessary data (intermediate data during processing, etc.), and appropriately stores long-term storage data such as calculation results in the storage unit 23.
[機能ブロックおよび処理手順]
・深層学習処理
図10を参照すると、第1の実施形態に係る深層学習装置100Aの処理部10Aは、
訓練データ生成部101と、訓練データ入力部102と、アルゴリズム更新部103とを
備える。これらの機能ブロックは、コンピュータに深層学習処理を実行させるプログラム
を、処理部10Aの記憶部13またはメモリ12にインストールし、このプログラムをC
PU11が実行することにより実現される。ウィンドウサイズデータベース104と、ア
ルゴリズムデータベース105とは、処理部10Aの記憶部13またはメモリ12に記憶
される。
[Functional blocks and processing procedures]
-Deep learning processing Referring to FIG. 10, the processing unit 10A of the deep learning device 100A according to the first embodiment is
It includes a training data generation section 101, a training data input section 102, and an algorithm update section 103. These functional blocks install a program that causes a computer to execute deep learning processing in the storage unit 13 or memory 12 of the processing unit 10A, and install this program in the C
This is realized by the PU 11 executing it. The window size database 104 and the algorithm database 105 are stored in the storage unit 13 or memory 12 of the processing unit 10A.
学習用の標本の第1の訓練用画像70R1、第2の訓練用画像70R2、第3の訓練用
画像70R3は、撮像装置300によって予め撮像され、処理部10Aの記憶部13また
はメモリ12に予め記憶されていることとする。ニューラルネットワーク50は、例えば
解析対象の標本が由来する組織の種別(例えば組織名)と対応付けられて、アルゴリズム
データベース105に予め格納されている。
The first training image 70R1, second training image 70R2, and third training image 70R3 of the learning sample are captured in advance by the imaging device 300 and stored in the storage unit 13 or memory 12 of the processing unit 10A in advance. It is assumed that it is remembered. The neural network 50 is stored in advance in the algorithm database 105 in association with, for example, the type of tissue (eg, tissue name) from which the sample to be analyzed comes from.
深層学習装置100Aの処理部10Aは、図11に示す処理を行う。図10に示す各機
能ブロックを用いて説明すると、ステップS10からS12、S17およびS18の処理
は、訓練データ生成部101が行う。ステップS14の処理は、訓練データ入力部102
が行う。ステップS15およびS16の処理は、アルゴリズム更新部103が行う。
The processing unit 10A of the deep learning device 100A performs the processing shown in FIG. 11. Explaining using each functional block shown in FIG. 10, the training data generation unit 101 performs the processing from steps S10 to S12, S17, and S18. The process in step S14 is performed by the training data input unit 102.
will do. The processing in steps S15 and S16 is performed by the algorithm updating unit 103.
以下に説明するステップS10からS18では、第1の訓練用画像70R1と、第2の
訓練用画像70R2と、第3の訓練用画像70R3とを用いた深層学習処理を説明する。
In steps S10 to S18 described below, deep learning processing using the first training image 70R1, the second training image 70R2, and the third training image 70R3 will be described.
処理部10Aは、深層学習方法の概要に記載の方法に準じて、腫瘍領域訓練データ75
R1、非腫瘍領域訓練データ75R2および非組織領域訓練データ75R3を生成するた
めの深層学習処理を行う。処理部10Aは、例えば、病理医等による入力部16からの操
作により、第1の訓練用画像70R1の領域を含む広い領域の画像(ホールスライドイメ
ージ70W1)を、出力部17に表示する。判定を行う病理医等は、出力部17に表示さ
れたホールスライドイメージ70W1の画像を目視で確認する。病理医等は、腫瘍領域を
含むと判定したホールスライドイメージ70W1中の領域を、例えば入力部16を介して
指定し、ホールスライドイメージ70W1に例えば赤色等の実線で囲む。病理医等は、非
腫瘍領域および非組織領域についても、同様に、ホールスライドイメージ70W1中の領
域について、例えば赤色とは異なる青色、緑色等の実線で囲む。処理部10Aは、ホール
スライドイメージ70W1を出力部17に表示して病理医により判断してもらうことに代
えて、判定済みのホールスライドイメージ70W2を、I/F部15を介して例えばネッ
トワーク99を介して取得してもよい。病理医等は、訓練用画像として好ましい画素にホ
ールスライドイメージ70W2を分割してもよい。
The processing unit 10A generates the tumor region training data 75 according to the method described in the overview of the deep learning method.
R1, deep learning processing is performed to generate non-tumor region training data 75R2 and non-tissue region training data 75R3. The processing unit 10A displays, on the output unit 17, an image of a wide area (whole slide image 70W1) including the area of the first training image 70R1, based on an operation from the input unit 16 by a pathologist or the like, for example. A pathologist or the like who makes the determination visually confirms the whole slide image 70W1 displayed on the output unit 17. The pathologist or the like specifies, for example, via the input unit 16, an area in the whole slide image 70W1 that has been determined to include a tumor area, and surrounds the area in the whole slide image 70W1 with a solid line of, for example, red. Similarly, the pathologist and the like surround non-tumor areas and non-tissue areas in the whole slide image 70W1 with solid lines in blue, green, etc., which are different from red, for example. Instead of displaying the whole slide image 70W1 on the output unit 17 for judgment by a pathologist, the processing unit 10A displays the judged whole slide image 70W2 via the I/F unit 15, for example, on the network 99. It may also be obtained via A pathologist or the like may divide the whole slide image 70W2 into pixels preferable as a training image.
処理部10Aは、病理医等の入力部16からの指定により、ホールスライドイメージ7
0W2中に赤色の実線で囲まれている領域から取得された第1の訓練用画像70R1を所
定の画素数を含むように切り出す。同様に、非腫瘍領域および非組織領域と判定された部
分からも、第2の訓練用画像70R2、第3の訓練用画像70R3のそれぞれを、所定の
画素の領域を含むように切り出す。
The processing unit 10A processes the whole slide image 7 based on the instructions from the input unit 16 such as a pathologist.
The first training image 70R1 acquired from the area surrounded by the solid red line during 0W2 is cut out to include a predetermined number of pixels. Similarly, each of the second training image 70R2 and the third training image 70R3 is cut out from the portion determined to be a non-tumor region and a non-tissue region so as to include a predetermined pixel region.
ステップS10において、処理部10Aは、切り出された第1の訓練用画像70R1か
らR、G、B各色の色濃度符号化図72R1r,72R1g,72R1bを生成する。色
濃度符号化図72R1r,72R1g,72R1bは、第1の訓練用画像70R1の各画
素のR、G、B各色の色濃度値を段階的に表す符号を各画素に付すことにより生成する。
本実施形態では、色濃度値を値0から値255の256階調で表すとして各R、G、B階
調画像について色濃度符号化図72R1r,72R1g,72R1bを生成する。色濃度
値の割り当ては、例えば最も低い明るさを色濃度値0とし、明るさの程度が高くなるに従
い徐々に高い値を割り当ててゆき、最も高い明るさを色濃度値255とする。処理部10
Aは、色濃度符号化図72R1r,72R1g,72R1bから画素毎にR、G,Bの色
濃度値を付した第1の訓練データ74R1を生成する。処理部10Aは、第1の訓練用画
像70R1の各画素に腫瘍領域であることを示すラベル値である「1」を対応させた第1
の予備訓練データ70R1Lを生成する。
In step S10, the processing unit 10A generates color density encoded diagrams 72R1r, 72R1g, and 72R1b for each of R, G, and B colors from the extracted first training image 70R1. The color density encoding diagrams 72R1r, 72R1g, and 72R1b are generated by attaching codes to each pixel that stepwise represent the color density values of R, G, and B of each pixel of the first training image 70R1.
In this embodiment, color density encoded diagrams 72R1r, 72R1g, and 72R1b are generated for each R, G, and B gradation image, assuming that color density values are represented by 256 gradations from value 0 to value 255. As for the assignment of color density values, for example, the lowest brightness is assigned a color density value of 0, and as the level of brightness increases, gradually higher values are assigned, and the highest brightness is assigned a color density value of 255. Processing section 10
A generates first training data 74R1 in which R, G, and B color density values are assigned to each pixel from the color density encoded diagrams 72R1r, 72R1g, and 72R1b. The processing unit 10A generates a first training image 70R1 in which each pixel of the first training image 70R1 is associated with a label value "1" indicating that it is a tumor region.
Preliminary training data 70R1L is generated.
ステップS11において、処理部10Aは、第2の訓練用画像70R2からステップS
10と同様の方法により第2の訓練データ74R2を生成する。処理部10Aは、第2の
訓練用画像70R2の各画素に非腫瘍領域であることを示すラベル値である「2」を対応
させた第2の予備訓練データ70R2Lを生成する。
In step S11, the processing unit 10A processes step S from the second training image 70R2.
The second training data 74R2 is generated by the same method as in 10. The processing unit 10A generates second preliminary training data 70R2L in which each pixel of the second training image 70R2 is associated with a label value "2" indicating that it is a non-tumor region.
ステップS12において、処理部10Aは、第3の訓練用画像70R3からステップS
10と同様の方法により第3の訓練データ74R3を生成する。処理部10Aは、第3の
訓練用画像70R3の各画素に非組織領域であることを示すラベル値である「0」を対応
させた第3の予備訓練データ70R3Lを生成する。
In step S12, the processing unit 10A performs step S
The processing unit 10A generates third training data 74R3 in a manner similar to that of the processing unit 10. The processing unit 10A generates third preliminary training data 70R3L in which each pixel of the third training image 70R3 is associated with a label value of “0” indicating a non-tissue region.
ステップS10からステップS12は同時に行ってもよく、順不同であってもよい。 Steps S10 to S12 may be performed simultaneously or in random order.
ステップS13において、処理部10Aは、入力部16を通じて、深層学習装置100
A側のユーザからの、学習用の組織の種別の入力を受け付ける。処理部10Aは、入力さ
れた組織の種別に基づき、ウィンドウサイズデータベース104(ウィンドウサイズDB
104)を参照して、ウィンドウサイズを設定し、アルゴリズムデータベース105(ア
ルゴリズムDB105)を参照して、学習に用いるニューラルネットワーク50を設定す
る。ウィンドウサイズは例えば200×200画素とする。ウィンドウサイズは、1回の
入力時にニューラルネットワーク50に入力する訓練データの単位であり、ウィンドウサ
イズの各領域に対応する訓練データの画素数と画像に含まれる色の原色の数との積が、入
力層50aのノード数に対応している。ウィンドウサイズは組織の種別と対応付けられて
、ウィンドウサイズデータベース104内に予め記憶されている。
In step S13, the processing unit 10A inputs the deep learning device 100 through the input unit 16.
Receives input of the type of organization for learning from the user on the A side. The processing unit 10A stores the window size database 104 (window size DB) based on the input tissue type.
104), the window size is set, and the algorithm database 105 (algorithm DB 105) is referenced to set the neural network 50 used for learning. The window size is, for example, 200×200 pixels. The window size is a unit of training data input to the neural network 50 at one time of input, and the product of the number of pixels of the training data corresponding to each region of the window size and the number of primary colors included in the image is: This corresponds to the number of nodes in the input layer 50a. The window size is stored in advance in the window size database 104 in association with the type of organization.
ステップS14において、処理部10Aは、各領域に対応する訓練データから、ウィン
ドウサイズの腫瘍領域訓練データ75R1、非腫瘍領域訓練データ75R2および非組織
領域訓練データ75R3を生成する。具体的には、上述の「深層学習方法の概要」におい
て、図4(a)、(b)を参照して説明したように、第1の訓練データ74R1および第
1の予備訓練データ70R1Lから、ウィンドウW1によってウィンドウサイズの腫瘍領
域訓練データ75R1を作成する。処理部10Aは、第2の訓練データ74R2および第
2の予備訓練データ70R2Lから、ウィンドウサイズの非腫瘍領域訓練データ75R2
を生成する。具体的には、上述の「深層学習方法の概要」において、図4(a)、(b)
および図5(a)を参照して説明したように、第2の訓練データ74R2および第2の予
備訓練データ70R2Lから、ウィンドウW1によってウィンドウサイズの非腫瘍領域訓
練データ75R2を作成する。処理部10Aは、第3の訓練データ74R3および第3の
予備訓練データ70R3Lから、ウィンドウサイズの非組織領域訓練データ75R3を生
成する。具体的には、上述の「深層学習方法の概要」において、図4(a)、(b)およ
び図5(b)を参照して説明したように、第3の訓練データ74R3および第3の予備訓
練データ70R3Lから、ウィンドウW1によってウィンドウサイズの非組織領域訓練デ
ータ75R3を作成する。
In step S14, the processing unit 10A generates window-sized tumor region training data 75R1, non-tumor region training data 75R2, and non-tissue region training data 75R3 from the training data corresponding to each region. Specifically, as explained in the above-mentioned "Overview of deep learning method" with reference to FIGS. 4(a) and 4(b), from the first training data 74R1 and the first preliminary training data 70R1L, Tumor region training data 75R1 of window size is created using window W1. The processing unit 10A generates window-sized non-tumor region training data 75R2 from the second training data 74R2 and the second preliminary training data 70R2L.
generate. Specifically, in the above “Overview of deep learning method”, Figure 4(a) and (b)
And as explained with reference to FIG. 5(a), non-tumor region training data 75R2 having a window size of window W1 is created from the second training data 74R2 and the second preliminary training data 70R2L. The processing unit 10A generates window-sized non-organized region training data 75R3 from the third training data 74R3 and the third preliminary training data 70R3L. Specifically, as explained with reference to FIGS. 4(a), (b) and FIG. 5(b) in the above-mentioned "Outline of deep learning method", the third training data 74R3 and the third From the preliminary training data 70R3L, non-organized region training data 75R3 having a window size of window W1 is created.
図11に示すステップS15において、処理部10Aは、ウィンドウサイズの腫瘍領域
訓練データ75R1、非腫瘍領域訓練データ75R2および非組織領域訓練データ75R
3を用いて、ニューラルネットワーク50を学習させる。ニューラルネットワーク50の
学習結果は、ウィンドウサイズの腫瘍領域訓練データ75R1、非腫瘍領域訓練データ7
5R2および非組織領域訓練データ75R3を用いてニューラルネットワーク50を学習
させる度に蓄積される。
In step S15 shown in FIG. 11, the processing unit 10A stores the tumor region training data 75R1, non-tumor region training data 75R2, and non-tissue region training data 75R of the window size.
3 to train the neural network 50. The learning results of the neural network 50 include window size tumor region training data 75R1 and non-tumor region training data 7.
5R2 and the non-organized region training data 75R3 are accumulated each time the neural network 50 is trained.
実施形態に係る画像解析方法では、畳み込みニューラルネットワークを使用しており、
確率的勾配降下法を用いるため、ステップS16において、処理部10Aは、予め定めら
れた所定の試行回数分の学習結果が蓄積されているか否かを判断する。学習結果が所定の
試行回数分蓄積されている場合、処理部10AはステップS17の処理を行い、学習結果
が所定の試行回数分蓄積されていない場合、処理部10AはステップS18の処理を行う
。
The image analysis method according to the embodiment uses a convolutional neural network,
Since the stochastic gradient descent method is used, in step S16, the processing unit 10A determines whether learning results for a predetermined number of trials have been accumulated. If the learning results have been accumulated for the predetermined number of trials, the processing unit 10A performs the process of step S17, and if the learning results have not been accumulated for the predetermined number of trials, the processing unit 10A performs the process of step S18.
学習結果が所定の試行回数分蓄積されている場合、ステップS17において、処理部1
0Aは、ステップS15において蓄積しておいた学習結果を用いて、ニューラルネットワ
ーク50の結合重みwを更新する。実施形態に係る画像解析方法では、確率的勾配降下法
を用いるため、所定の試行回数分の学習結果が蓄積した段階で、ニューラルネットワーク
50の結合重みwを更新する。結合重みwを更新する処理は、具体的には、後述の(式1
1)および(式12)に示される、勾配降下法による計算を実施する処理である。
If the learning results have been accumulated for the predetermined number of trials, in step S17, the processing unit 1
0A updates the connection weight w of the neural network 50 using the learning results accumulated in step S15. Since the image analysis method according to the embodiment uses the stochastic gradient descent method, the connection weight w of the neural network 50 is updated at the stage when learning results for a predetermined number of trials have been accumulated. Specifically, the process of updating the connection weight w is performed using (Equation 1
1) and (Equation 12), this is a process of performing calculations using the gradient descent method.
ステップS17において、処理部10Aは、第1の訓練データ74R1、第2の訓練デ
ータ74R2および第3の訓練データ74R3のそれぞれについて各領域訓練データ内の
規定数の画素を処理したか否かを判断する。各領域訓練データの規定数の画素について、
ステップS15からステップS17の一連の処理がなされている場合は、深層学習処理を
終了する。ニューラルネットワークの学習は、必ずしも各訓練データ内の全ての画素に対
して行う必要は無く、処理部10Aは、各訓練データ内の一部の画素、すなわち規定数の
画素に対して処理をし学習を行うことができる。規定数の画素は、各領域訓練データ内の
全ての画素であってもよい。
In step S17, the processing unit 10A judges whether or not a prescribed number of pixels in each of the first training data 74R1, the second training data 74R2, and the third training data 74R3 have been processed.
When a series of processes from step S15 to step S17 have been performed, the deep learning process is terminated. The neural network does not necessarily need to be trained on all pixels in each training data, and the processing unit 10A can process and train a portion of the pixels in each training data, i.e., a specified number of pixels. The specified number of pixels may be all pixels in each area training data.
各領域訓練データ内の規定数の画素が処理されていない場合は、処理部10Aは、ステ
ップS19において、図4(b)に示すように、第1の訓練データ74R1内、第2の訓
練データ74R2内または第3の訓練データ74R3内において、ウィンドウの位置を移
動させる。その後、処理部10Aは、移動後の新たなウィンドウ位置において、ステップ
S14からステップS16の一連の処理を行う。すなわち、処理部10Aは、ステップS
14において、移動後の新たなウィンドウ位置において第1の訓練データ74R1、第2
の訓練データ74R2および第3の訓練データ74R3のそれぞれについてウィンドウサ
イズの各領域訓練データ75R1,75R2,75R3を切り出し、各領域を示すラベル
値を付す。引き続き、処理部10Aは、ステップS15において、新たに切り出したウィ
ンドウサイズの各領域訓練データ75R1,75R2,75R3を用いて、ニューラルネ
ットワーク50を学習させる。ステップS16において、所定の試行回数分の学習結果が
蓄積されている場合は、処理部10Aは、ステップS17において、ニューラルネットワ
ーク50の結合重みwを更新する。このようなウィンドウサイズ毎のニューラルネットワ
ーク50の学習を、第1の訓練データ74R1、第2の訓練データ74R2および第3の
訓練データ74R3のそれぞれについて規定数の画素に対して行う。
If the specified number of pixels in each area training data have not been processed, the processing unit 10A, in step S19, processes the first training data 74R1, the second training data The position of the window is moved within 74R2 or within the third training data 74R3. Thereafter, the processing unit 10A performs a series of processes from step S14 to step S16 at the new window position after the movement. That is, the processing unit 10A performs step S
14, the first training data 74R1 and the second training data 74R1 are displayed at the new window position after the movement.
For each of the training data 74R2 and the third training data 74R3, each region training data 75R1, 75R2, 75R3 of the window size is cut out, and a label value indicating each region is attached. Subsequently, in step S15, the processing unit 10A causes the neural network 50 to learn using the training data 75R1, 75R2, and 75R3 for each region of the newly cut out window size. If the learning results for the predetermined number of trials have been accumulated in step S16, the processing unit 10A updates the connection weight w of the neural network 50 in step S17. Such learning of the neural network 50 for each window size is performed for a specified number of pixels for each of the first training data 74R1, the second training data 74R2, and the third training data 74R3.
以上説明した、ステップS10からS19の深層学習処理を、さらに別途取得された第
1の訓練用画像70R1と、第2の訓練用画像70R2と、第3の訓練用画像70R3に
対して繰り返し行うことにより、ニューラルネットワーク50の学習の程度を向上させる
。これにより、図5に示すニューラルネットワーク構造の深層学習アルゴリズム60を得
る。
The deep learning processing from steps S10 to S19 described above is repeatedly performed on the separately acquired first training image 70R1, second training image 70R2, and third training image 70R3. This improves the degree of learning of the neural network 50. As a result, a deep learning algorithm 60 having a neural network structure shown in FIG. 5 is obtained.
・ニューラルネットワークの構造
図12(a)に示すように、第1の実施形態では、深層学習タイプのニューラルネット
ワークを用いる。深層学習タイプのニューラルネットワークは、図12に示すニューラル
ネットワーク50のように、入力層50aと、出力層50bと、入力層50aおよび出力
層50bの間の中間層50cとを備え、中間層50cが複数の層で構成されている。中間
層50cを構成する層の数は、例えば5層以上とすることができる。
- Structure of Neural Network As shown in FIG. 12(a), the first embodiment uses a deep learning type neural network. A deep learning type neural network, like a neural network 50 shown in FIG. 12, includes an input layer 50a, an output layer 50b, and an intermediate layer 50c between the input layer 50a and the output layer 50b. Consists of multiple layers. The number of layers constituting the intermediate layer 50c can be, for example, five or more.
ニューラルネットワーク50では、層状に配置された複数のノード89が、層間におい
て結合されている。これにより、情報が入力側の層50aから出力側の層50bに、図中
矢印Dに示す一方向のみに伝播する。本実施形態では、入力層50aのノード数は、入力
される画像の画素数すなわち図3(c)に示すウィンドウW1の画素数と各画素に含まれ
る色の原色の数との積に対応している。入力層50aに画像の画素データ(色濃度値)を
入力することができるので、ユーザは入力画像から特徴量を別途算出することなく、入力
画像を入力層50aに入力することができる。
In the neural network 50, a plurality of nodes 89 arranged in layers are connected between the layers. As a result, information propagates from the input side layer 50a to the output side layer 50b in only one direction shown by arrow D in the figure. In this embodiment, the number of nodes in the input layer 50a corresponds to the product of the number of pixels of the input image, that is, the number of pixels of the window W1 shown in FIG. 3(c), and the number of primary colors included in each pixel. ing. Since pixel data (color density values) of an image can be input to the input layer 50a, the user can input the input image to the input layer 50a without separately calculating feature amounts from the input image.
・各ノードにおける演算
図12(b)は、各ノードにおける演算を示す模式図である。各ノード89では、複数
の入力を受け取り、1つの出力(z)を計算する。図12(b)に示す例の場合、ノード
89は4つの入力を受け取る。ノード89が受け取る総入力(u)は、以下の(式1)で
表される。
-Calculation at each node FIG. 12(b) is a schematic diagram showing the calculation at each node. Each node 89 receives multiple inputs and calculates one output (z). In the example shown in FIG. 12(b), node 89 receives four inputs. The total input (u) received by the node 89 is expressed by the following (Equation 1).
各入力には、それぞれ異なる重みが掛けられる。(式1)中、bはバイアスと呼ばれる
値である。ノードの出力(z)は、(式1)で表される総入力(u)に対する所定の関数
fの出力となり、以下の(式2)で表される。関数fは活性化関数と呼ばれる。
Each input is given a different weight. In (Formula 1), b is a value called bias. The output (z) of the node is the output of a predetermined function f for the total input (u) expressed by (Formula 1), and is expressed by (Formula 2) below. The function f is called an activation function.
図12(c)は、ノード間の演算を示す模式図である。ニューラルネットワーク50で
は、(式1)で表される総入力(u)に対して、(式2)で表される結果(z)を出力す
るノードが層状に並べられている。前の層のノードの出力が、次の層のノードの入力とな
る。図12(c)に示す例では、図中左側の層のノード89aの出力が、図中右側の層の
ノード89bの入力となる。右側の層の各ノード89bは、それぞれ、左側の層のノード
89aからの出力を受け取る。左側の層の各ノード89aと右側の層の各ノード89bと
の間の各結合には、異なる重みが掛けられる。左側の層の複数のノード89aのそれぞれ
の出力をx1~x4とすると、右側の層の3つのノード89bのそれぞれに対する入力は
、以下の(式3-1)~(式3-3)で表される。
FIG. 12(c) is a schematic diagram showing operations between nodes. In the neural network 50, nodes that output a result (z) expressed by (Formula 2) with respect to a total input (u) expressed by (Formula 1) are arranged in a layered manner. The output of the node in the previous layer becomes the input to the node in the next layer. In the example shown in FIG. 12(c), the output of the node 89a on the left layer in the figure becomes the input to the node 89b on the right layer in the figure. Each node 89b in the right layer receives an output from node 89a in the left layer. Each connection between each node 89a in the left layer and each node 89b in the right layer is given a different weight. If the outputs of the plurality of nodes 89a in the left layer are x 1 to x 4 , the inputs to each of the three nodes 89b in the right layer are as follows (Equation 3-1) to (Equation 3-3) It is expressed as
これら(式3-1)~(式3-3)を一般化すると、(式3-4)となる。ここで、i
=1,・・・I、j=1,・・・Jである。
When these (Formula 3-1) to (Formula 3-3) are generalized, (Formula 3-4) is obtained. Here, i
=1,...I, j=1,...J.
れる。
・活性化関数
実施形態に係る画像解析方法では、活性化関数として、正規化線形関数(rectified li
near unit function)を用いる。正規化線形関数は以下の(式5)で表される。
・Activation function In the image analysis method according to the embodiment, a rectified linear function is used as the activation function.
near unit function). The normalized linear function is expressed by the following (Equation 5).
(式5)は、z=uの線形関数のうち、u<0の部分をu=0とする関数である。図1
2(c)に示す例では、j=1のノードの出力は、(式5)により、以下の式で表される
。
(Equation 5) is a function in which the part where u<0 is set to u=0 among the linear functions of z=u. Figure 1
In the example shown in 2(c), the output of the node with j=1 is expressed by the following equation using (Equation 5).
・ニューラルネットワークの学習
ニューラルネットワークを用いて表現される関数をy(x:w)とおくと、関数y(x
:w)は、ニューラルネットワークのパラメータwを変化させると変化する。入力xに対
してニューラルネットワークがより好適なパラメータwを選択するように、関数y(x:
w)を調整することを、ニューラルネットワークの学習と呼ぶ。ニューラルネットワーク
を用いて表現される関数の入力と出力との組が複数与えられているとする。ある入力xに
対する望ましい出力をdとすると、入出力の組は、{(x1,d1),(x2,d2),
・・・,(xn,dn)}と与えられる。(x,d)で表される各組の集合を、訓練デー
タと呼ぶ。具体的には、図3(b)に示す、R、G、B各色の単一色画像における画素毎
の色濃度値と真値像のラベルとの組、の集合が、図3(a)に示す訓練データである。
・Learning of neural networks If the function expressed using a neural network is y(x:w), then the function y(x:w)
:w) changes when the parameter w of the neural network is changed. The function y(x:
Adjusting w) is called neural network learning. Assume that multiple pairs of input and output of a function expressed using a neural network are given. If the desired output for a certain input x is d, the input/output pair is {(x 1 , d 1 ), (x 2 , d 2 ),
..., (x n , d n )}. Each set of pairs represented by (x, d) is called training data. Specifically, a set of pairs of color density values and true value image labels for each pixel in a single color image of R, G, and B shown in FIG. 3(b) is shown in FIG. 3(a). This is the training data shown.
ニューラルネットワークの学習とは、どのような入出力の組(xn,dn)に対しても
、入力xnを与えたときのニューラルネットワークの出力y(xn:w)が、出力dnに
なるべく近づくように重みwを調整することを意味する。誤差関数(error function)と
は、ニューラルネットワークを用いて表現される関数と訓練データとの近さ
Neural network learning means that for any input/output pair (x n , d n ), the output y (x n :w) of the neural network when input x n is given is the output d n This means adjusting the weight w so that it is as close as possible. Error function is the closeness between the function expressed using a neural network and the training data.
を測る尺度である。誤差関数は損失関数(loss function)とも呼ばれる。実施形態に係
る画像解析方法において用いる誤差関数E(w)は、以下の(式6)で表される。(式6
)は交差エントロピー(cross entropy)と呼ばれる。
It is a scale to measure. The error function is also called a loss function. The error function E(w) used in the image analysis method according to the embodiment is expressed by the following (Equation 6). (Formula 6
) is called cross entropy.
(式6)の交差エントロピーの算出方法を説明する。実施形態に係る画像解析方法にお
いて用いるニューラルネットワーク50の出力層50bでは、すなわちニューラルネット
ワークの最終層では、入力xを内容に応じて有限個のクラスに分類するための活性化関数
を用いる。活性化関数はソフトマックス関数(softmax function)と呼ばれ、以下の(式
7)で表される。なお、出力層50bには、クラス数kと同数のノードが並べられている
とする。出力層Lの各ノードk(k=1,・・・K)の総入力uは、前層L-1の出力か
ら、uk
(L)で与えられるとする。これにより、出力層のk番目のノードの出力は以下
の(式7)で表される。
A method for calculating the cross entropy of (Equation 6) will be explained. In the output layer 50b of the neural network 50 used in the image analysis method according to the embodiment, that is, in the final layer of the neural network, an activation function is used to classify the input x into a finite number of classes according to the content. The activation function is called a softmax function and is expressed by the following (Equation 7). It is assumed that the same number of nodes as the number of classes k are arranged in the output layer 50b. It is assumed that the total input u of each node k (k=1, . . . K) of the output layer L is given by u k (L) from the output of the previous layer L-1. As a result, the output of the k-th node of the output layer is expressed by the following (Equation 7).
(式7)がソフトマックス関数である。(式7)で決まる出力y1,・・・,yKの総
和は常に1となる。
(Equation 7) is the softmax function. The sum of the outputs y 1 , . . . , y K determined by (Equation 7) is always 1.
各クラスをC1,・・・,CKと表すと、出力層Lのノードkの出力yk(すなわちu
k
(L))は、与えられた入力xがクラスCkに属する確率を表す。以下の(式8)を参
照されたい。入力xは、(式8)で表される確率が最大になるクラスに分類される。
If each class is represented as C 1 , ..., C K , then the output y k (i.e. u
k (L) ) represents the probability that a given input x belongs to class C k . Please refer to (Equation 8) below. The input x is classified into the class in which the probability expressed by (Equation 8) is maximized.
ニューラルネットワークの学習では、ニューラルネットワークで表される関数を、各ク
ラスの事後確率(posterior probability)のモデルとみなし、そのような確率モデルの
下で、訓練データに対する重みwの尤度(likelihood)を評価し、尤度を最大化するよう
な重みwを選択する。
In neural network training, the function represented by the neural network is regarded as a model of the posterior probability of each class, and under such a probability model, the likelihood of the weight w for the training data is calculated as follows: evaluate and select the weight w that maximizes the likelihood.
(式7)のソフトマックス関数による目標出力dnを、出力が正解のクラスである場合
のみ1とし、出力がそれ以外の場合は0になるとする。目標出力をdn=[dn1,・・
・,dnK]というベクトル形式で表すと、例えば入力xnの正解クラスがC3である場
合、目標出力dn3のみが1となり、それ以外の目標出力は0となる。このように符号化
すると、事後分布(posterior)は以下の(式9)で表される。
It is assumed that the target output d n by the softmax function in (Equation 7) is set to 1 only when the output is in the correct class, and is set to 0 otherwise. The target output is d n =[d n1 ,...
. , d nK ], for example, if the correct class of input x n is C 3 , only the target output d n3 becomes 1, and the other target outputs become 0. When encoded in this way, the posterior distribution is expressed by the following (Equation 9).
訓練データ{(xn,dn)}(n=1,・・・,N)に対する重みwの尤度L(w)
は、以下の(式10)で表される。尤度L(w)の対数をとり符号を反転すると、(式6
)の誤差関数が導出される。
Likelihood L(w) of weight w for training data {(x n , d n )} (n=1,...,N)
is expressed by the following (Formula 10). If we take the logarithm of the likelihood L(w) and invert the sign, we get (Equation 6
) is derived.
学習は、訓練データを基に計算される誤差関数E(w)を、ニューラルネットワークの
パラメータwについて最小化することを意味する。実施形態に係る画像解析方法では、誤
差関数E(w)は(式6)で表される。
Learning means minimizing the error function E(w) calculated based on training data with respect to the parameter w of the neural network. In the image analysis method according to the embodiment, the error function E(w) is expressed by (Equation 6).
誤差関数E(w)をパラメータwについて最小化することは、関数E(w)の局所的な
極小点を求めることと同じ意味である。パラメータwはノード間の結合の重みである。重
みwの極小点は、任意の初期値を出発点として、パラメータwを繰り返し更新する反復計
算によって求められる。このような計算の一例には、勾配降下法(gradient descent met
hod)がある。
勾配降下法では、次の(式11)で表されるベクトルを用いる。
Minimizing the error function E(w) with respect to the parameter w has the same meaning as finding a local minimum point of the function E(w). The parameter w is the weight of connections between nodes. The minimum point of the weight w is determined by an iterative calculation in which the parameter w is repeatedly updated using an arbitrary initial value as a starting point. An example of such a calculation is gradient descent met
hod).
The gradient descent method uses a vector expressed by the following (Equation 11).
勾配降下法では、現在のパラメータwの値を負の勾配方向(すなわち-∇E)に移動さ
せる処理を何度も繰り返す。現在の重みをw(t)とし、移動後の重みをw(t+1)と
すると、勾配降下法による演算は、以下の(式12)で表される。値tは、パラメータw
を移動させた回数を意味する。
In the gradient descent method, the process of moving the current value of the parameter w in the negative gradient direction (i.e., −∇E) is repeated many times. If the current weight is w (t) and the weight after the movement is w (t+1) , the calculation by the gradient descent method is expressed by the following (Equation 12). The value t is the parameter w
This refers to the number of times the character has been moved.
記号
)で表される演算を繰り返すことにより、値tの増加に伴って誤差関数E(w(t))が
減少し、パラメータwは極小点に到達する。
symbol
), the error function E(w (t) ) decreases as the value t increases, and the parameter w reaches its minimum point.
なお、(式12)による演算は、全ての訓練データ(n=1,・・・,N)に対して実
施してもよく、一部の訓練データのみに対して実施してもよい。一部の訓練データのみに
対して行う勾配降下法は、確率的勾配降下法(stochastic gradient descent)と呼ばれ
る。実施形態に係る画像解析方法では、確率的勾配降下法を用いる。
Note that the calculation according to (Equation 12) may be performed on all training data (n=1, . . . , N), or may be performed on only some training data. Gradient descent performed only on a portion of the training data is called stochastic gradient descent. The image analysis method according to the embodiment uses stochastic gradient descent.
・画像解析処理
図13を参照すると、第1の実施形態に係る画像解析装置200Aの処理部20Aは、
解析用データ生成部201と、解析用データ入力部202と、解析部203と、領域検出
部204とを備える。これらの機能ブロックは、本発明に係るコンピュータに画像解析処
理を実行させるプログラムを、処理部20Aの記憶部23またはメモリ22にインストー
ルし、このプログラムをCPU21が実行することにより実現される。ウィンドウサイズ
データベース104と、アルゴリズムデータベース105とは、記憶媒体98またはネッ
トワーク99を通じて深層学習装置100Aから提供され、処理部20Aの記憶部23ま
たはメモリ22に記憶される。
- Image analysis processing Referring to FIG. 13, the processing unit 20A of the image analysis device 200A according to the first embodiment is
It includes an analysis data generation section 201, an analysis data input section 202, an analysis section 203, and a region detection section 204. These functional blocks are realized by installing a program that causes a computer according to the present invention to execute image analysis processing in the storage unit 23 or memory 22 of the processing unit 20A, and having the CPU 21 execute this program. The window size database 104 and the algorithm database 105 are provided from the deep learning device 100A via the storage medium 98 or the network 99, and are stored in the storage unit 23 or memory 22 of the processing unit 20A.
解析対象の組織の解析対象画像78は、撮像装置400によって予め撮像され、処理部
20Aの記憶部23またはメモリ22に予め記憶されていることとする。学習済みの結合
重みwを含む深層学習アルゴリズム60は、解析対象の組織の標本が由来する組織の種類
と対応付けられてアルゴリズムデータベース105に格納されており、コンピュータに画
像解析処理を実行させるプログラムの一部であるプログラムモジュールとして機能する。
すなわち、深層学習アルゴリズム60は、CPUおよびメモリを備えるコンピュータにて
用いられ、解析対象の組織において各領域を示すデータを出力するという、使用目的に応
じた特有の情報の演算または加工を実行するよう、コンピュータを機能させる。具体的に
は、処理部20AのCPU21は、記憶部23またはメモリ22に記憶された深層学習ア
ルゴリズム60に規定されているアルゴリズムに従って、学習済みの結合重みwに基づく
ニューラルネットワーク60の演算を行う。処理部20AのCPU21は、入力層60a
に入力された、解析対象の組織を撮像した解析対象画像78に対して演算を行い、出力層
60bから、解析対象の組織において各領域を示すデータである3値画像83を出力する
。
It is assumed that an analysis target image 78 of a tissue to be analyzed is captured in advance by the imaging device 400 and stored in advance in the storage unit 23 or memory 22 of the processing unit 20A. The deep learning algorithm 60 including the learned connection weights w is stored in the algorithm database 105 in association with the type of tissue from which the tissue sample to be analyzed comes from, and is used as a program for causing a computer to perform image analysis processing. Functions as a part of a program module.
That is, the deep learning algorithm 60 is used in a computer equipped with a CPU and memory, and is designed to perform calculations or processing of information specific to the purpose of use, such as outputting data indicating each region in the tissue to be analyzed. , make the computer work. Specifically, the CPU 21 of the processing unit 20A performs calculations of the neural network 60 based on the learned connection weights w according to the algorithm defined in the deep learning algorithm 60 stored in the storage unit 23 or the memory 22. The CPU 21 of the processing unit 20A has an input layer 60a.
The calculation is performed on the analysis target image 78, which is input to the analysis target tissue, and outputs a ternary image 83, which is data indicating each region in the analysis target tissue, from the output layer 60b.
図14を参照すると、画像解析装置200Aの処理部20Aは、図13に示す処理を行
う。図13に示す各機能ブロックを用いて説明すると、ステップS21およびS22の処
理は、解析用データ生成部201が行う。ステップS23,S24,S26およびS27
の処理は、解析用データ入力部202が行う。ステップS25およびS28の処理は、解
析部203が行う。ステップS29の処理は、領域検出部204が行う。
Referring to FIG. 14, the processing unit 20A of the image analysis device 200A performs the processing shown in FIG. 13. Explaining using each functional block shown in FIG. 13, the processing of steps S21 and S22 is performed by the analysis data generation unit 201. Steps S23, S24, S26 and S27
This process is performed by the analysis data input unit 202. The processing in steps S25 and S28 is performed by the analysis unit 203. The process in step S29 is performed by the area detection unit 204.
ステップS21において、処理部20Aは、例えば、ユーザ等が入力部26から入力し
た処理開始の指令により、入力された解析対象画像78からR、G、B各色の色濃度符号
化図79r,79g,79bを生成する。色濃度符号化図79r,79g,79bから画
素毎にR、G、B各色の色濃度値を組み合わせた解析対象データが生成される。色濃度符
号化図79r,79g,79bの生成方法は、図11に示す深層学習処理時におけるステ
ップS10での生成方法と同様である。
In step S21, the processing unit 20A, in response to a command to start processing input by a user or the like from the input unit 26, generates color density encoded diagrams 79r, 79g of R, G, and B colors from the input analysis target image 78, for example. Generate 79b. Data to be analyzed is generated by combining the color density values of R, G, and B colors for each pixel from the color density encoded diagrams 79r, 79g, and 79b. The method of generating the color density encoded diagrams 79r, 79g, and 79b is the same as the method of generating them in step S10 during the deep learning process shown in FIG. 11.
図14に示すステップS22において、処理部20Aは、入力部26を通じて、解析条
件として、画像解析装置200A側のユーザからの、組織の種別の入力を受け付ける。処
理部20Aは、入力された組織の種別に基づき、ウィンドウサイズデータベース104お
よびアルゴリズムデータベース105を参照して、解析に用いるウィンドウサイズを設定
し、解析に用いる深層学習アルゴリズム60を取得する。ウィンドウサイズは、1回の入
力時にニューラルネットワーク60に入力する解析用データの単位であり、ウィンドウサ
イズの解析用データ80の画素数と画像に含まれる色の原色の数との積が、入力層60a
のノード数に対応している。ウィンドウサイズは組織の種別と対応付けられて、ウィンド
ウサイズデータベース104内に予め記憶されている。ウィンドウサイズは、図6に示す
ウィンドウW2のように、例えば3×3画素である。深層学習アルゴリズム60も、組織
の種別と対応付けられて、図13に示すアルゴリズムデータベース105内に予め記憶さ
れている。
In step S22 shown in FIG. 14, the processing unit 20A receives an input of the type of tissue from the user of the image analysis device 200A as an analysis condition through the input unit 26. Based on the input tissue type, the processing unit 20A refers to the window size database 104 and the algorithm database 105, sets a window size to be used for analysis, and obtains a deep learning algorithm 60 to be used for analysis. The window size is a unit of analysis data input to the neural network 60 at one time of input, and the product of the number of pixels of the window size analysis data 80 and the number of primary colors included in the image is 60a
corresponds to the number of nodes. The window size is stored in advance in the window size database 104 in association with the type of organization. The window size is, for example, 3×3 pixels, as shown in window W2 shown in FIG. The deep learning algorithm 60 is also stored in advance in the algorithm database 105 shown in FIG. 13 in association with the type of organization.
図14に示すステップS23において、処理部20Aは、色濃度符号化図79r,79
g,79bから画素毎にR、G、B各色の色濃度値を組み合わせた解析対象データを生成
し、さらにウィンドウサイズの解析用データ80を生成する。
In step S23 shown in FIG. 14, the processing unit 20A performs color density encoding
Data to be analyzed is generated by combining the color density values of R, G, and B colors for each pixel from g and 79b, and furthermore, analysis data 80 of the window size is generated.
ステップS24において、処理部20Aは、図5に示す解析用データ80を、深層学習
アルゴリズム60に入力する。ウィンドウの初期位置は、深層学習処理時におけるステッ
プS14と同様に、例えばウィンドウ内の3×3画素に位置する画素が、解析対象データ
の左上角に対応する位置である。処理部20Aは、ウィンドウサイズの解析用データ80
に含まれる、3×3画素×3原色の合計27個の色濃度値のデータ81を入力層60aに
入力すると、深層学習アルゴリズム60は、出力層60bに判別結果82を出力する。
In step S24, the processing unit 20A inputs the analysis data 80 shown in FIG. 5 to the deep learning algorithm 60. The initial position of the window is, for example, a position where a 3×3 pixel within the window corresponds to the upper left corner of the data to be analyzed, as in step S14 during deep learning processing. The processing unit 20A generates window size analysis data 80.
When the data 81 of a total of 27 color density values of 3×3 pixels×3 primary colors included in the input layer 60a is input to the input layer 60a, the deep learning algorithm 60 outputs a discrimination result 82 to the output layer 60b.
図14に示すステップS25において、処理部20Aは、図5に示す出力層60bに出
力される判別結果82を記憶する。判別結果82は、解析対象データの各画素領域につい
ての推定値(0、1、2の3値のいずれか)である。
In step S25 shown in FIG. 14, the processing unit 20A stores the determination result 82 output to the output layer 60b shown in FIG. The determination result 82 is an estimated value (one of the three values 0, 1, and 2) for each pixel region of the data to be analyzed.
図14に示すステップS26において、処理部20Aは、入力画像内の全ての画素を処
理したか否かを判断する。入力画像は、図6に示す色濃度符号化図79r,79g,79
bであり、解析対象データ内の全ての画素について、図14に示すステップS23からス
テップS25の一連の処理がなされている場合は、ステップS28の処理を行う。
In step S26 shown in FIG. 14, the processing unit 20A determines whether all pixels in the input image have been processed. The input images are color density encoded diagrams 79r, 79g, 79 shown in FIG.
b, and the series of processes from step S23 to step S25 shown in FIG. 14 have been performed for all pixels in the data to be analyzed, the process of step S28 is performed.
解析対象データ内の全ての画素が処理されていない場合は、処理部20Aは、ステップ
S27において、深層学習処理時におけるステップS20と同様に、図5に示す色濃度符
号化図79r,79g,79b内において、ウィンドウW2を所定の画素数の単位で移動
させる。その後、処理部20Aは、移動後の新たなウィンドウW2の位置において、ステ
ップS23からステップS25の一連の処理を行う。処理部20Aは、ステップS25に
おいて、移動後の新たなウィンドウ位置に対応する、判別結果82を記憶する。このよう
なウィンドウサイズ毎の判別結果82の記憶を、解析対象画像内の全ての画素に対して行
うことにより、解析結果の3値画像83が得られる。解析結果の3値画像83の画像サイ
ズは、解析対象画像の画像サイズと同じである。ここで、3値画像83には、推定値の値
2、値1および値0が各画素に付された数値データであってもよく、推定値の値2、値1
および値0に代えて、例えば値2、値1および値0のそれぞれに対応付けた表示色で示し
た画像であっても良い。
If all the pixels in the data to be analyzed have not been processed, in step S27, the processing unit 20A converts the color density encoding diagrams 79r, 79g, 79b shown in FIG. The window W2 is moved in units of a predetermined number of pixels. Thereafter, the processing unit 20A performs a series of processes from step S23 to step S25 at the new position of the window W2 after the movement. In step S25, the processing unit 20A stores the determination result 82 corresponding to the new window position after the movement. By storing such determination results 82 for each window size for all pixels in the image to be analyzed, a ternary image 83 as an analysis result is obtained. The image size of the ternary image 83 as the analysis result is the same as the image size of the analysis target image. Here, the ternary image 83 may include numerical data in which estimated values 2, 1, and 0 are attached to each pixel;
For example, instead of the value 0, the image may be displayed in a display color corresponding to each of the values 2, 1, and 0.
図14に示すステップS28では、処理部20Aは、解析結果の3値画像83を出力部
27に出力する。
In step S28 shown in FIG. 14, the processing unit 20A outputs the ternary image 83 as the analysis result to the output unit 27.
ステップS29では、ステップS28に引き続き、処理部20Aは、解析結果の3値画
像83についてさらに、領域検出処理を行う。3値画像83において、腫瘍領域と、非腫
瘍領域と、非組織領域とは、3値で区別して表されている。
In step S29, following step S28, processing unit 20A further performs region detection processing on the analysis result ternary image 83. In ternary image 83, the tumor region, non-tumor region, and non-tissue region are represented by being distinguished by three values.
任意ではあるが、処理部20Aは、得られた各領域を、解析対象の解析対象画像78に
重ねることにより、領域強調画像84を作成する。処理部20Aは、作成した領域強調画
像84を出力部27に出力し、画像解析処理を終了する。
Although optional, the processing unit 20A creates a region-enhanced image 84 by superimposing each obtained region on the analysis target image 78 to be analyzed. The processing unit 20A outputs the created region-enhanced image 84 to the output unit 27, and ends the image analysis process.
任意ではあるが、処理部20Aは、解析対象画像78に含まれる組織において、腫瘍領
域がどの程度含まれているか算出してもよい。例えば、解析対象画像78に含まれる組織
に該当する画素数、すなわち腫瘍領域および非腫瘍領域と判定された画素数の合計(組織
領域総画素数)を100%とした場合に、腫瘍領域と判定された画素数が何%を占めるか
を算出することにより、腫瘍領域の含有率を算出することができる。また、総画素数から
腫瘍領域と判定された画素数を減じることにより、または組織領域総画素数)を100%
とした場合に、非腫瘍領域と判定された画素数が何%を占めるかを算出することにより、
非腫瘍領域の含有率を算出することができる。そして、腫瘍領域の含有率と非腫瘍領域の
含有率との比率を算出してもよい。前記算出された値は、出力部27に出力されてもよい
。また、算出された値は、領域強調画像84と共に出力部27に出力されてもよい。
Although optional, the processing unit 20A may calculate how much of the tumor region is included in the tissue included in the analysis target image 78. For example, if the number of pixels corresponding to the tissue included in the analysis target image 78, that is, the total number of pixels determined to be a tumor region and a non-tumor region (the total number of pixels in the tissue region), is determined to be a tumor region. By calculating the percentage occupied by the number of pixels, the content rate of the tumor region can be calculated. In addition, by subtracting the number of pixels determined to be tumor areas from the total number of pixels, or the total number of pixels in tissue areas) can be reduced to 100%.
By calculating the percentage of pixels determined to be non-tumor areas,
The content of non-tumor areas can be calculated. Then, the ratio between the content rate of the tumor region and the content rate of the non-tumor region may be calculated. The calculated value may be output to the output section 27. Further, the calculated value may be output to the output unit 27 together with the region-enhanced image 84.
このように腫瘍領域の含有率を算出することは、がん組織の遺伝子解析等に用いられる
組織が検査に適した腫瘍組織を含んでいるかスクリーニングする上で有用である。
Calculating the content rate of tumor regions in this manner is useful in screening whether tissue to be used for genetic analysis of cancer tissue or the like contains tumor tissue suitable for testing.
以上、画像解析装置200Aのユーザは、解析対象の組織の解析対象画像78を画像解
析装置200Aに入力することにより、解析結果として、3値画像83を取得することが
できる。3値画像83は、解析対象の標本における、腫瘍領域と、非腫瘍領域と、非組織
領域とを表しており、ユーザは、解析対象の標本において、各領域を判別することが可能
となる。
As described above, the user of the image analysis apparatus 200A can obtain the ternary image 83 as an analysis result by inputting the analysis target image 78 of the tissue to be analyzed into the image analysis apparatus 200A. The ternary image 83 represents a tumor region, a non-tumor region, and a non-tissue region in the specimen to be analyzed, and allows the user to distinguish each region in the specimen to be analyzed.
さらに、画像解析装置200Aのユーザは、解析結果として、領域強調画像84を取得
することができる。領域強調画像84は、例えば、解析対象の解析対象画像78に、各領
域を色で塗りつぶすことにより生成される。また、別の態様では、各領域の境界線を重ね
ることにより生成されている。これにより、ユーザは、解析対象の組織において、各領域
を一目で把握することが可能となる。
Further, the user of the image analysis device 200A can obtain a region-enhanced image 84 as an analysis result. The region-enhanced image 84 is generated, for example, by filling each region of the analysis target image 78 with a color. In another aspect, the area is generated by overlapping the boundaries of each area. This allows the user to grasp each area at a glance in the tissue to be analyzed.
解析対象の標本において腫瘍領域、および/または非腫瘍領域を示すことは、組織診断
に先立って解析対象組織における腫瘍領域をスクリーニングし、標本観察効率を上げる一
助となる。
Indicating the tumor region and/or non-tumor region in the specimen to be analyzed helps to screen the tumor region in the tissue to be analyzed prior to tissue diagnosis and increases sample observation efficiency.
<第2の実施形態>
以下、第1の実施形態に係る画像解析システムと相違する点について、第2の実施形態
に係る画像解析システムを説明する。
<Second embodiment>
Hereinafter, the image analysis system according to the second embodiment will be described with respect to the differences from the image analysis system according to the first embodiment.
[構成の概要]
図15を参照すると、第2の実施形態に係る画像解析システムは、ユーザ側装置200
を備え、ユーザ側装置200が、統合型の画像解析装置200Bとして動作する。画像解
析装置200Bは、例えば汎用コンピュータで構成されており、第1の実施形態において
説明した深層学習処理および画像解析処理の両方の処理を行う。つまり、第2の実施形態
に係る画像解析システムは、ユーザ側で深層学習および画像解析を行う、スタンドアロン
型のシステムである。第2の実施形態に係る画像解析システムは、ユーザ側に設置された
統合型の画像解析装置200Bが、第1の実施形態に係る深層学習装置100Aおよび画
像解析装置200Aの両方の機能を担う点において、第1の実施形態に係る画像解析シス
テムと異なる。
[Configuration Overview]
Referring to FIG. 15, the image analysis system according to the second embodiment includes a user device 200.
The image analysis system according to the second embodiment is a stand-alone system that performs deep learning and image analysis on the user side. The image analysis system according to the second embodiment is different from the image analysis system according to the first embodiment in that the integrated image analysis device 200B installed on the user side performs the functions of both the deep learning device 100A and the image analysis device 200A according to the first embodiment.
画像解析装置200Bは撮像装置400に接続されている。撮像装置400は、深層学
習処理時には、学習用の組織の訓練用画像を取得し、画像解析処理時には、解析対象の組
織の解析対象画像78を取得する。
Image analysis device 200B is connected to imaging device 400. The imaging device 400 acquires a training image of a tissue for learning during deep learning processing, and acquires an analysis target image 78 of a tissue to be analyzed during image analysis processing.
[ハードウェア構成]
画像解析装置200Bのハードウェア構成は、図9に示すユーザ側装置200のハード
ウェア構成と同様である。
[Hardware configuration]
The hardware configuration of the image analysis device 200B is similar to the hardware configuration of the user-side device 200 shown in FIG.
[機能ブロックおよび処理手順]
図16を参照すると、第2の実施形態に係る画像解析装置200Bの処理部20Bは、
訓練データ生成部101と、訓練データ入力部102と、アルゴリズム更新部103と、
解析用データ生成部201と、解析用データ入力部202と、解析部203と、領域検出
部204とを備える。これらの機能ブロックは、コンピュータに深層学習処理および画像
解析処理を実行させるプログラムを、処理部20Bの記憶部23またはメモリ22にイン
ストールし、このプログラムをCPU21が実行することにより実現される。ウィンドウ
サイズデータベース104と、アルゴリズムデータベース105とは、処理部20Bの記
憶部23またはメモリ22に記憶され、どちらも深層学習時および画像解析処理時に共通
して使用される。学習済みのニューラルネットワーク60は、組織の種別または細胞を含
む試料の種別と対応付けられて、アルゴリズムデータベース105に予め格納されており
、深層学習処理により結合重みwが更新されて、深層学習アルゴリズム60として、アル
ゴリズムデータベース105に格納される。なお、訓練用画像である第1の訓練用画像7
0R1、第2の訓練用画像70R2、第3の訓練用画像70R3は、撮像装置400によ
って予め撮像され、処理部20Bの記憶部23またはメモリ22に予め記憶されているこ
ととする。解析対象の標本の解析対象画像78も、撮像装置400によって予め撮像され
、処理部20Bの記憶部23またはメモリ22に予め記憶されていることとする。
[Functional blocks and processing procedures]
Referring to FIG. 16, the processing unit 20B of the image analysis device 200B according to the second embodiment is
A training data generation unit 101, a training data input unit 102, an algorithm update unit 103,
It includes an analysis data generation section 201, an analysis data input section 202, an analysis section 203, and a region detection section 204. These functional blocks are realized by installing a program that causes a computer to execute deep learning processing and image analysis processing in the storage unit 23 or memory 22 of the processing unit 20B, and having the CPU 21 execute this program. The window size database 104 and the algorithm database 105 are stored in the storage unit 23 or memory 22 of the processing unit 20B, and both are used in common during deep learning and image analysis processing. The trained neural network 60 is stored in advance in the algorithm database 105 in association with the type of tissue or the type of sample containing cells, and the connection weights w are updated by deep learning processing, and the deep learning algorithm 60 It is stored in the algorithm database 105 as follows. Note that the first training image 7 which is a training image
It is assumed that 0R1, the second training image 70R2, and the third training image 70R3 are captured in advance by the imaging device 400 and stored in the storage unit 23 or memory 22 of the processing unit 20B. It is assumed that an analysis target image 78 of a specimen to be analyzed is also captured in advance by the imaging device 400 and stored in advance in the storage unit 23 or the memory 22 of the processing unit 20B.
画像解析装置200Bの処理部20Bは、深層学習処理時には、図11に示す処理を行
い、画像解析処理時には、図14に示す処理を行う。図16に示す各機能ブロックを用い
て説明すると、深層学習処理時には、ステップS10からS12、S14、S18および
S19の処理は、訓練データ生成部101が行う。ステップS13の処理は、訓練データ
入力部102が行う。ステップS16およびS17の処理は、アルゴリズム更新部103
が行う。画像解析処理時には、ステップS21およびS22の処理は、解析用データ生成
部201が行う。ステップS23,S24,S26およびS27の処理は、解析用データ
入力部202が行う。ステップS25およびS28の処理は、解析部203が行う。ステ
ップS29の処理は、領域検出部204が行う。
The processing unit 20B of the image analysis device 200B performs the processing shown in FIG. 11 during deep learning processing, and performs the processing shown in FIG. 14 during image analysis processing. To explain using each functional block shown in FIG. 16, during deep learning processing, the training data generation unit 101 performs the processing from steps S10 to S12, S14, S18, and S19. The process of step S13 is performed by the training data input unit 102. The processing in steps S16 and S17 is carried out by the algorithm updating unit 103.
will do. During image analysis processing, the processing of steps S21 and S22 is performed by the analysis data generation unit 201. The processing of steps S23, S24, S26, and S27 is performed by the analysis data input unit 202. The processing in steps S25 and S28 is performed by the analysis unit 203. The process in step S29 is performed by the area detection unit 204.
第2の実施形態に係る画像解析装置200Bが行う深層学習処理の手順および画像解析
処理の手順は、第1の実施形態に係る深層学習装置100Aおよび画像解析装置200A
がそれぞれ行う手順と同様である。なお、第2の実施形態に係る画像解析装置200Bは
、次の点において第1の実施形態に係る深層学習装置100Aおよび画像解析装置200
Aと異なる。
The deep learning processing procedure and the image analysis processing procedure performed by the image analysis device 200B according to the second embodiment are similar to those of the deep learning device 100A and the image analysis device 200A according to the first embodiment.
The procedure is the same as that for each. Note that the image analysis device 200B according to the second embodiment is different from the deep learning device 100A and the image analysis device 200 according to the first embodiment in the following points.
Different from A.
深層学習処理時のステップS13において、処理部20Bは、入力部26を通じて、画
像解析装置200Bのユーザからの、学習用の組織の種別の入力を受け付ける。処理部2
0Bは、入力された組織の種別に基づき、ウィンドウサイズデータベース104を参照し
て、ウィンドウサイズを設定し、アルゴリズムデータベース105を参照して、学習に用
いるニューラルネットワーク50を設定する。
In step S13 during deep learning processing, the processing unit 20B receives an input of the type of tissue for learning from the user of the image analysis device 200B through the input unit 26. Processing section 2
Based on the input tissue type, 0B refers to the window size database 104 to set the window size, and refers to the algorithm database 105 to set the neural network 50 used for learning.
以上、画像解析装置200Bのユーザは、解析対象画像78を画像解析装置200Bに
入力することにより、解析結果として、3値画像83を取得することができる。さらに、
画像解析装置200Bのユーザは、解析結果として、領域強調画像84を取得することが
できる。
As described above, the user of the image analysis device 200B can obtain the ternary image 83 as an analysis result by inputting the analysis target image 78 into the image analysis device 200B. moreover,
The user of the image analysis device 200B can obtain a region-enhanced image 84 as an analysis result.
第2の実施形態に係る画像解析装置200Bによると、ユーザは、自身が選択した種類
の組織を、学習用の組織として用いることができる。これは、ニューラルネットワーク5
0の学習がベンダ側任せではなく、ユーザ自身がニューラルネットワーク50の学習の程
度を向上できることを意味する。
According to the image analysis device 200B according to the second embodiment, the user can use the type of tissue selected by the user as a learning tissue. This is neural network 5
This means that the learning of 0 is not left to the vendor side, but that the user himself can improve the learning level of the neural network 50.
<第3の実施形態>
以下、第2の実施形態に係る画像解析システムと相違する点について、第3の実施形態
に係る画像解析システムを説明する。
<Third embodiment>
Hereinafter, the image analysis system according to the third embodiment will be described with respect to the differences from the image analysis system according to the second embodiment.
[構成の概要]
図17を参照すると、第3の実施形態に係る画像解析システムは、ベンダ側装置100
と、ユーザ側装置200とを備える。ベンダ側装置100は統合型の画像解析装置100
Bとして動作し、ユーザ側装置200は端末装置200Cとして動作する。画像解析装置
100Bは、例えば汎用コンピュータで構成されており、第1の実施形態において説明し
た深層学習処理および画像解析処理の両方の処理を行う、クラウドサーバ側の装置である
。端末装置200Cは、例えば汎用コンピュータで構成されており、ネットワーク99を
通じて、解析対象の画像を画像解析装置100Bに送信し、ネットワーク99を通じて、
解析結果の画像を画像解析装置100Bから受信する、ユーザ側の端末装置である。
[Configuration overview]
Referring to FIG. 17, the image analysis system according to the third embodiment includes a vendor-side device 100
and a user-side device 200. The vendor device 100 is an integrated image analysis device 100
The user device 200 operates as a terminal device 200C. The image analysis device 100B is configured of, for example, a general-purpose computer, and is a device on the cloud server side that performs both the deep learning processing and the image analysis processing described in the first embodiment. The terminal device 200C is configured with a general-purpose computer, for example, and transmits the image to be analyzed to the image analysis device 100B through the network 99.
This is a user-side terminal device that receives an image of an analysis result from the image analysis device 100B.
第3の実施形態に係る画像解析システムは、ベンダ側に設置された統合型の画像解析装
置100Bが、第1の実施形態に係る深層学習装置100Aおよび画像解析装置200A
の両方の機能を担う点において、第2の実施形態に係る画像解析システムと同様である。
一方、第3の実施形態に係る画像解析システムは、端末装置200Cを備え、解析対象の
画像の入力インタフェースと、解析結果の画像の出力インタフェースとをユーザ側の端末
装置200Cに提供する点において、第2の実施形態に係る画像解析システムと異なる。
つまり、第3の実施形態に係る画像解析システムは、深層学習処理および画像解析処理を
行うベンダ側が、解析対象の画像および解析結果の画像の入出力インタフェースをユーザ
側に提供する、クラウドサービス型のシステムである。
In the image analysis system according to the third embodiment, an integrated image analysis device 100B installed on the vendor side performs the deep learning device 100A and the image analysis device 200A according to the first embodiment.
In terms of having both functions, the image analysis system according to the second embodiment is similar to the image analysis system according to the first embodiment.
On the other hand, the image analysis system of the third embodiment differs from the image analysis system of the second embodiment in that it is equipped with a terminal device 200C and provides an input interface for the image to be analyzed and an output interface for the image of the analysis result to the user's terminal device 200C.
In other words, the image analysis system according to the third embodiment is a cloud service type system in which the vendor that performs the deep learning processing and image analysis processing provides the user with an input/output interface for the images to be analyzed and the images of the analysis results.
画像解析装置100Bは撮像装置300に接続されており、撮像装置300によって撮
像される、学習用の組織の訓練用画像を取得する。
The image analyzing device 100B is connected to the imaging device 300, and acquires training images of the learning tissue captured by the imaging device 300.
端末装置200Cは撮像装置400に接続されており、撮像装置400によって撮像さ
れる、解析対象の組織の解析対象画像78を取得する。
The terminal device 200C is connected to the imaging device 400, and acquires an analysis target image 78 of the tissue to be analyzed, which is captured by the imaging device 400.
[ハードウェア構成]
画像解析装置100Bのハードウェア構成は、図7に示すベンダ側装置100のハード
ウェア構成と同様である。端末装置200Cのハードウェア構成は、図9に示すユーザ側
装置200のハードウェア構成と同様である。
[Hardware configuration]
The hardware configuration of the image analyzing device 100B is similar to that of the vendor-side device 100 shown in Fig. 7. The hardware configuration of the terminal device 200C is similar to that of the user-side device 200 shown in Fig. 9.
[機能ブロックおよび処理手順]
図18を参照すると、第3の実施形態に係る画像解析装置100Bの処理部10Bは、
訓練データ生成部101と、訓練データ入力部102と、アルゴリズム更新部103と、
解析用データ生成部201と、解析用データ入力部202と、解析部203と、領域検出
部204とを備える。これらの機能ブロックは、コンピュータに深層学習処理および画像
解析処理を実行させるプログラムを、処理部10Bの記憶部13またはメモリ12にイン
ストールし、このプログラムをCPU11が実行することにより実現される。ウィンドウ
サイズデータベース104と、アルゴリズムデータベース105とは、処理部10Bの記
憶部13またはメモリ12に記憶され、どちらも深層学習時および画像解析処理時に共通
して使用される。ニューラルネットワーク50は、組織の種別と対応付けられて、アルゴ
リズムデータベース105に予め格納されており、深層学習処理により結合重みwが更新
されて、深層学習アルゴリズム60として、アルゴリズムデータベース105に格納され
る。
[Function blocks and processing procedures]
Referring to FIG. 18, a processing unit 10B of an image analyzing device 100B according to the third embodiment
A training data generation unit 101, a training data input unit 102, an algorithm update unit 103,
The computer-readable storage device includes an analysis data generating unit 201, an analysis data input unit 202, an analysis unit 203, and an area detection unit 204. These functional blocks are realized by installing a program for causing a computer to execute deep learning processing and image analysis processing in the storage unit 13 or memory 12 of the processing unit 10B, and executing the program by the CPU 11. The window size database 104 and the algorithm database 105 are stored in the storage unit 13 or memory 12 of the processing unit 10B, and both are used in common during deep learning and image analysis processing. The neural network 50 is associated with the type of tissue and stored in advance in the algorithm database 105, and the connection weight w is updated by the deep learning processing and stored in the algorithm database 105 as a deep learning algorithm 60.
なお、訓練用画像である第1の訓練用画像70R1、第2の訓練用画像70R2、第3
の訓練用画像70R3は、撮像装置300によって予め撮像され、処理部10Bの記憶部
13またはメモリ12に予め記憶されていることとする。解析対象の組織の解析対象画像
78も、撮像装置400によって予め撮像され、端末装置200Cの処理部20Cの記憶
部23またはメモリ22に予め記憶されていることとする。
The first training image 70R1, the second training image 70R2, and the third training image 70R3 are training images.
The training image 70R3 is assumed to be captured in advance by the imaging device 300 and stored in advance in the storage unit 13 or memory 12 of the processing unit 10B. The analysis target image 78 of the tissue to be analyzed is also assumed to be captured in advance by the imaging device 400 and stored in advance in the storage unit 23 or memory 22 of the processing unit 20C of the terminal device 200C.
画像解析装置100Bの処理部10Bは、深層学習処理時には、図11に示す処理を行
い、画像解析処理時には、図14に示す処理を行う。図18に示す各機能ブロックを用い
て説明すると、深層学習処理時には、ステップS10からS12、S14、S18および
S19の処理は、訓練データ生成部101が行う。ステップS13の処理は、訓練データ
入力部102が行う。ステップS16およびS17の処理は、アルゴリズム更新部103
が行う。画像解析処理時には、ステップS21およびS22の処理は、解析用データ生成
部201が行う。ステップS23,S24,S26およびS27の処理は、解析用データ
入力部202が行う。ステップS25およびS28の処理は、解析部203が行う。ステ
ップS29の処理は、領域検出部204が行う。
The processing unit 10B of the image analysis device 100B performs the processing shown in FIG. 11 during deep learning processing, and performs the processing shown in FIG. 14 during image analysis processing. To explain using each functional block shown in FIG. 18, during deep learning processing, the training data generation unit 101 performs the processing from steps S10 to S12, S14, S18, and S19. The process of step S13 is performed by the training data input unit 102. The processing in steps S16 and S17 is carried out by the algorithm updating unit 103.
will do. During image analysis processing, the processing of steps S21 and S22 is performed by the analysis data generation unit 201. The processing of steps S23, S24, S26, and S27 is performed by the analysis data input unit 202. The processing in steps S25 and S28 is performed by the analysis unit 203. The process in step S29 is performed by the area detection unit 204.
第3の実施形態に係る画像解析装置100Bが行う深層学習処理の手順および画像解析
処理の手順は、第1の実施形態に係る深層学習装置100Aおよび画像解析装置200A
がそれぞれ行う手順と同様である。なお、第3の実施形態に係る画像解析装置100Bは
、次の4つの点において第1の実施形態に係る深層学習装置100Aおよび画像解析装置
200Aと異なる。
The deep learning processing procedure and the image analysis processing procedure performed by the image analysis device 100B according to the third embodiment are similar to those of the deep learning device 100A and the image analysis device 200A according to the first embodiment.
The procedure is the same as that for each. Note that the image analysis device 100B according to the third embodiment differs from the deep learning device 100A and the image analysis device 200A according to the first embodiment in the following four points.
図14に示す画像解析処理時のステップS21において、処理部10Bは、解析対象の
組織の解析対象画像78を、ユーザ側の端末装置200Cから受信し、受信した解析対象
画像78からR、G、B各色の色濃度符号化図79r,79g,79bを生成する。色濃
度符号化図79r,79g,79bおよび解析対象データの生成方法は、図11に示す深
層学習処理時におけるステップS10での生成方法と同様である。
In step S21 during the image analysis process shown in FIG. 14, the processing unit 10B receives the analysis target image 78 of the tissue to be analyzed from the user's terminal device 200C, and from the received analysis target image 78, R, G, Color density encoded diagrams 79r, 79g, and 79b for each B color are generated. The method of generating the color density encoding diagrams 79r, 79g, and 79b and the data to be analyzed is the same as the method of generating them in step S10 during the deep learning process shown in FIG. 11.
図14に示す画像解析処理時のステップS22において、処理部10Bは、端末装置2
00Cの入力部26を通じて、解析条件として、端末装置200Cのユーザからの、組織
の種別の入力を受け付ける。処理部10Bは、入力された組織の種別に基づき、ウィンド
ウサイズデータベース104およびアルゴリズムデータベース105を参照して、解析に
用いるウィンドウサイズを設定し、解析に用いる深層学習アルゴリズム60を取得する。
In step S22 during the image analysis process shown in FIG.
Through the input unit 26 of 00C, input of the type of organization from the user of the terminal device 200C is accepted as an analysis condition. Based on the input tissue type, the processing unit 10B refers to the window size database 104 and the algorithm database 105, sets the window size to be used for analysis, and obtains the deep learning algorithm 60 used for the analysis.
画像解析処理時のステップS28において、処理部10Bは、解析結果の3値画像83
を、ユーザ側の端末装置200Cに送信する。ユーザ側の端末装置200Cでは、処理部
20Cが、受信した解析結果の3画像83を出力部27に出力する。
In step S28 at the time of image analysis processing, the processing unit 10B uses the ternary image 83 as the analysis result.
is transmitted to the user's terminal device 200C. In the user's terminal device 200C, the processing unit 20C outputs the three images 83 of the received analysis results to the output unit 27.
画像解析処理時のステップS29において、処理部10Bは、ステップS28に引き続
き、解析結果の3値画像83についてさらに、核領域の検出処理を行う。任意のステップ
として、処理部10Bは、得られた各領域を、解析対象の解析対象画像78に重ねること
により、領域強調画像84を作成する。処理部10Bは、作成した領域強調画像84を、
ユーザ側の端末装置200Cに送信する。ユーザ側の端末装置200Cでは、処理部20
Cが、受信した領域強調画像84を出力部27に出力し、画像解析処理を終了する。
In step S29 during the image analysis process, the processing unit 10B performs a process of detecting a nucleus region on the ternary image 83 of the analysis result following step S28. As an optional step, the processing unit 10B creates a region-enhanced image 84 by superimposing each of the obtained regions on the analysis target image 78 of the analysis target. The processing unit 10B converts the created region-enhanced image 84 into
The user terminal device 200C transmits the request to the processing unit 20
C outputs the received area-enhanced image 84 to the output unit 27, and ends the image analysis process.
以上、端末装置200Cのユーザは、解析対象の組織の解析対象画像78を画像解析装
置100Bに送信することにより、解析結果として、3値画像83を取得することができ
る。さらに、端末装置200Cのユーザは、解析結果として、領域強調画像84を取得す
ることができる。
As described above, the user of the terminal device 200C can obtain the ternary image 83 as an analysis result by transmitting the analysis target image 78 of the tissue to be analyzed to the image analysis apparatus 100B. Further, the user of the terminal device 200C can obtain the region-enhanced image 84 as an analysis result.
第3の実施形態に係る画像解析装置100Bによると、ユーザは、ウィンドウサイズデ
ータベース104およびアルゴリズムデータベース105を深層学習装置100Aから取
得することなく、画像解析処理の結果を享受することができる。これにより、解析対象の
組織を解析するサービスとして、腫瘍領域および/または非腫瘍領域を判別し各組織にお
ける腫瘍領域をスクリーニングするサービスを、クラウドサービスとして提供することが
できる。
According to the image analyzing device 100B of the third embodiment, a user can enjoy the results of the image analysis process without acquiring the window size database 104 and the algorithm database 105 from the deep learning device 100A. This makes it possible to provide, as a cloud service, a service for analyzing a tissue to be analyzed, for discriminating between tumorous regions and/or non-tumorous regions and screening the tumorous region in each tissue.
[コンピュータプログラム]
本発明の実施形態には、前記ステップS10からS20を処理部10A,20B,10
Bに実行させ、学習済み深層学習アルゴリズムの生成するコンピュータプログラムおよび
その製品が含まれる。また、本発明の実施形態には、前記ステップS21からS29を処
理部10A,20B,10Bに実行させ、コンピュータを個体から採取された組織の画像
を解析するために機能させるコンピュータプログラムおよびその製品が含まれる。
[Computer program]
In the embodiment of the present invention, steps S10 to S20 are performed by the processing units 10A, 20B, 10.
This includes a computer program that is executed by B and generates a trained deep learning algorithm, and products thereof. Further, an embodiment of the present invention includes a computer program and product thereof that causes the processing units 10A, 20B, and 10B to execute the steps S21 to S29 and causes the computer to function to analyze images of tissues collected from an individual. included.
[その他の形態]
以上、本発明を概要および特定の実施形態によって説明したが、本発明は上記した概要
および各実施形態に限定されるものではない。
[Other forms]
Although the present invention has been described above with reference to the outline and specific embodiments, the present invention is not limited to the outline and each embodiment described above.
上記第1から第3の実施形態では、ステップS13において、処理部10A,20B,
10Bは、ウィンドウサイズデータベース104を参照して、ウィンドウサイズの画素数
を設定しているが、オペレータまたはユーザがウィンドウサイズを直接設定してもよい。
この場合、ウィンドウサイズデータベース104は不要となる。
In the first to third embodiments described above, in step S13, the processing units 10A, 20B,
10B sets the number of pixels of the window size with reference to the window size database 104, but the operator or user may directly set the window size.
In this case, the window size database 104 becomes unnecessary.
上記第1から第3の実施形態では、ステップS13において、処理部10A,20B,
10Bは、入力された組織の種別に基づいて、ウィンドウサイズの画素数を設定している
が、組織の種別の入力に代えて、組織のサイズを入力してもよい。処理部10A,20B
,10Bは、入力された組織のサイズに基づいて、ウィンドウサイズデータベース104
を参照して、ウィンドウサイズの画素数を設定すればよい。ステップS22においてもス
テップS13と同様に、組織の種別の入力に代えて、組織のサイズを入力してもよい。処
理部20A,20B,10Bは、入力された組織のサイズに基づいて、ウィンドウサイズ
データベース104およびアルゴリズムデータベース105を参照して、ウィンドウサイ
ズの画素数を設定し、ニューラルネットワーク60を取得すればよい。
In the first to third embodiments described above, in step S13, the processing units 10A, 20B,
10B sets the number of pixels of the window size based on the input tissue type, but the tissue size may be input instead of the tissue type. Processing parts 10A, 20B
, 10B is a window size database 104 based on the input tissue size.
You can set the number of pixels for the window size by referring to . In step S22, as in step S13, instead of inputting the type of organization, the size of the organization may be input. The processing units 20A, 20B, and 10B refer to the window size database 104 and the algorithm database 105 based on the input tissue size, set the number of pixels of the window size, and acquire the neural network 60.
組織のサイズを入力する態様については、サイズを数値として直接入力してもよいし、
例えば入力のユーザインタフェースをプルダウンメニューとして、ユーザが入力しようと
するサイズに対応する、所定の数値範囲をユーザに選択させて入力してもよい。
Regarding the mode of inputting the size of the organization, the size may be input directly as a numerical value, or
For example, the input user interface may be a pull-down menu, and the user may select and input a predetermined numerical range corresponding to the size the user wants to input.
また、ステップS13およびステップS22において、組織の種別または組織のサイズ
に加えて、訓練用画像、および解析対象画像78を撮像した際の撮像倍率を入力してもよ
い。撮像倍率を入力する態様については、倍率を数値として直接入力してもよいし、例え
ば入力のユーザインタフェースをプルダウンメニューとして、ユーザが入力しようとする
倍率に対応する、所定の数値範囲をユーザに選択させて入力してもよい。
Furthermore, in step S13 and step S22, in addition to the tissue type or tissue size, the imaging magnification at which the training image and the analysis target image 78 were captured may be input. Regarding the mode of inputting the imaging magnification, the magnification may be directly input as a numerical value, or, for example, the input user interface may be set as a pull-down menu and the user can select a predetermined range of numerical values corresponding to the magnification that the user wants to input. You can also input it by
上記第1から第3の実施形態では、深層学習処理時および画像解析処理時において、説
明の便宜のためにウィンドウサイズを3×3画素と設定しているが、ウィンドウサイズの
画素数はこれに限定されない。ウィンドウサイズは、例えば組織の種別に応じて設定して
もよい。この場合、ウィンドウサイズの画素数と画像に含まれる色の原色の数との積が、
ニューラルネットワーク50,60の入力層50a,60aのノード数に対応していれば
よい。
In the first to third embodiments above, the window size is set to 3 x 3 pixels for the convenience of explanation during deep learning processing and image analysis processing, but the number of pixels in the window size is set to 3 x 3 pixels for convenience of explanation. Not limited. The window size may be set depending on the type of organization, for example. In this case, the product of the number of pixels in the window size and the number of primary colors included in the image is
It is sufficient that the number of nodes corresponds to the number of nodes in the input layers 50a and 60a of the neural networks 50 and 60.
上記第1から第3の実施形態では、ステップS17において、処理部10A,20B,
10Bは、深層学習アルゴリズム60を、組織の種別と一対一に対応付けて、アルゴリズ
ムデータベース105に記憶している。これに代えて、ステップS17において、処理部
10A,20B,10Bは、1つの深層学習アルゴリズム60に、複数の組織の種別を対
応付けて、アルゴリズムデータベース105に記憶してもよい。
In the first to third embodiments described above, in step S17, the processing units 10A, 20B,
10B stores the deep learning algorithm 60 in the algorithm database 105 in one-to-one correspondence with the type of organization. Alternatively, in step S17, the processing units 10A, 20B, and 10B may store one deep learning algorithm 60 in association with a plurality of tissue types in the algorithm database 105.
上記第1から第3の実施形態では、色相は、光の3原色の組み合わせ、または色の3原
色の組み合わせで規定されているが、色相の数は3つに限定されない。色相の数は、赤(
R),緑(G),青(B)に黄(Y)を加えた4原色としても良いし、赤(R),緑(G
),青(B)の3原色からいずれか1つの色相を減らした2原色としてもよい。あるいは
、赤(R),緑(G),青(B)の3原色のいずれか1つ(例えば緑(G))のみの1原
色としてもよい。例えば公知の顕微鏡またはバーチャルスライドスキャナ等を用いて取得
される訓練用画像70R1,70R2,70R3および解析対象画像78も、赤(R),
緑(G),青(B)の3原色のカラー画像に限定されず、2原色のカラー画像であっても
よく、1以上の原色を含む画像であればよい。
In the first to third embodiments described above, the hue is defined by a combination of three primary colors of light or a combination of three primary colors of color, but the number of hues is not limited to three. The number of hues is red (
It is also possible to use four primary colors such as R), green (G), blue (B) plus yellow (Y), or red (R), green (G).
), blue (B), and blue (B). Alternatively, only one of the three primary colors red (R), green (G), and blue (B) (for example, green (G)) may be used. For example, the training images 70R1, 70R2, 70R3 and the analysis target image 78 obtained using a known microscope or virtual slide scanner are also red (R),
The image is not limited to a color image of three primary colors, green (G) and blue (B), and may be a color image of two primary colors, as long as it includes one or more primary colors.
上記第1から第3の実施形態では、ステップS10において、処理部10A,20B,
10Bは、訓練用画像の各色濃度符号化図(色濃度符号化図70R1r,70R1g,7
0R1b、色濃度符号化図70R2r,70R2g,70R2b、色濃度符号化図70R
3r,70R3g,70R3b)を各原色の8ビット(256段階)の単一色画像として
生成しているが、各色濃度符号化図を作成する際の原色の階調は、8ビットに制限されな
い。各色濃度符号化図の階調は、スライドイメージスキャナの撮像条件に依存してもよい
。例えば、1ビット以上であり2ビット、4ビット、16ビット、24ビットの画像であ
ってもよい。同様に、ステップS21において、処理部20A,20B,10Bは、色濃
度符号化図79r,79g,79b各原色の単一色画像として生成しているが、色濃度符
号化図を作成する際の原色の階調は3階調に制限されない。色濃度符号化図を作成する際
の原色は、8ビットに制限されない。色濃度符号化図79r,79g,79bの階調は、
スライドイメージスキャナの撮像条件に依存してもよい。例えば、1ビット以上であり2
ビット、4ビット、16ビット、24ビットの画像であってもよい。訓練用画像の各色濃
度符号化図および色濃度符号化図79r,79g,79bの階調は、全てが同じ階調であ
ることが好ましい。
In the first to third embodiments described above, in step S10, the processing units 10A, 20B,
10B is each color density coding diagram (color density coding diagram 70R1r, 70R1g, 7
0R1b, color density encoding diagram 70R2r, 70R2g, 70R2b, color density encoding diagram 70R
3r, 70R3g, 70R3b) are generated as a single color image of 8 bits (256 levels) of each primary color, but the gradation of the primary color when creating each color density encoded diagram is not limited to 8 bits. The gradation of each color density encoded map may depend on the imaging conditions of the slide image scanner. For example, the image may be one bit or more, and may be a 2-bit, 4-bit, 16-bit, or 24-bit image. Similarly, in step S21, the processing units 20A, 20B, and 10B generate the color density encoded diagrams 79r, 79g, and 79b as single color images of each primary color. The gradations are not limited to three gradations. The primary colors used when creating a color density encoded diagram are not limited to 8 bits. The gradations of the color density encoding diagrams 79r, 79g, and 79b are as follows:
It may also depend on the imaging conditions of the slide image scanner. For example, 1 bit or more and 2
It may be a bit, 4 bit, 16 bit, or 24 bit image. It is preferable that the gradations of each color density encoded diagram and the color density encoded diagrams 79r, 79g, and 79b of the training image are all the same gradation.
上記第1から第3の実施形態では、ステップS10において、処理部10A,20B,
10Bは、訓練用画像から、各色濃度符号化図を生成しているが、予め各画素が階調に応
じて符号化された行列表を訓練用画像として用いてもよい。処理部10A,20B,10
Bは、訓練用画像を各色濃度符号化図として、例えばバーチャルスライドスキャナ等から
直接取得してもよい。同様に、ステップS21において、処理部20A,20B,10B
は、解析対象画像78からR、G、B各色の色濃度符号化図79r,79g,79bを生
成しているが、予め各画素が階調に応じて符号化された行列表を解析用画像として用いて
もよい。すなわち、処理部20A,20B,10Bは、色濃度符号化図79r,79g,
79bを、例えばバーチャルスライドスキャナ等から直接取得してもよい。
In the first to third embodiments, in step S10, the processing units 10A, 20B,
The processing units 10A, 20B generate each color density coding map from the training image, but a matrix table in which each pixel is coded according to a gray level in advance may be used as the training image.
B may directly acquire the training images as the color density coding maps from, for example, a virtual slide scanner. Similarly, in step S21, the processing units 20A, 20B, and 10B
However, a matrix table in which each pixel is coded in advance according to its gradation may be used as the analysis image.
79b may be acquired directly, for example from a virtual slide scanner.
上記第1から第3の実施形態では、訓練用画像から各色濃度符号化図を生成する際のカ
ラースペースにはRGBを用いているが、カラースペースはRGBに制限されない。RG
B以外にも、YUV、CMY、およびCIE L*a*b*等の種々のカラースペースを
用いることができる。
In the first to third embodiments described above, RGB is used as the color space when generating each color density encoded diagram from the training image, but the color space is not limited to RGB. RG
In addition to B, various color spaces such as YUV, CMY, and CIE L * a * b * can be used.
上記第1から第3の実施形態では、各領域訓練データおよび解析用データ80において
、各画素について濃度値が赤(R),緑(G),青(B)の順番で格納されているが、濃
度値を格納および取り扱う順番はこれに限定されない。例えば濃度値は、青(B),緑(
G),赤(R)の順番で格納されていてもよく、各領域訓練データにおける濃度値の並び
順と、解析用データ80における濃度値の並び順とが同じであればよい。
In the first to third embodiments described above, in each region training data and analysis data 80, the density values for each pixel are stored in the order of red (R), green (G), and blue (B). , the order in which the density values are stored and handled is not limited to this. For example, the density values are blue (B), green (
G) and red (R), as long as the order of density values in each region training data is the same as the order of density values in analysis data 80.
上記第1から第3の実施形態では、処理部10A,10Bは一体の装置として実現され
ているが、処理部10A,10Bは一体の装置である必要はなく、CPU11、メモリ1
2、記憶部13等が別所に配置され、これらがネットワークで接続されていてもよい。処
理部10A,10Bと、入力部16と、出力部17とについても、一ヶ所に配置される必
要は必ずしもなく、それぞれ別所に配置されて互いにネットワークで通信可能に接続され
ていてもよい。処理部20A,20B,20Cについても処理部10A,10Bと同様で
ある。
In the first to third embodiments described above, the processing units 10A and 10B are realized as an integrated device, but the processing units 10A and 10B do not need to be an integrated device, and the CPU 11 and the memory 1
2. The storage unit 13 and the like may be located elsewhere, and these may be connected via a network. The processing units 10A, 10B, the input unit 16, and the output unit 17 do not necessarily need to be placed in one place, but may be placed in separate places and connected to each other so as to be communicable via a network. The processing units 20A, 20B, and 20C are also similar to the processing units 10A and 10B.
上記第1から第3の実施形態では、訓練データ生成部101、訓練データ入力部102
、アルゴリズム更新部103、解析用データ生成部201、解析用データ入力部202、
解析部203および領域検出部204の各機能ブロックは、単一のCPU11または単一
のCPU21において実行されているが、これら各機能ブロックは単一のCPUにおいて
実行される必要は必ずしもなく、複数のCPUで分散して実行されてもよい。また、これ
ら各機能ブロックは、複数のGPUで分散して実行されてもよいし、複数のCPUと複数
のGPUとで分散して実行されてもよい。
In the first to third embodiments described above, the training data generation unit 101, the training data input unit 102
, algorithm update section 103, analysis data generation section 201, analysis data input section 202,
Each functional block of the analysis unit 203 and the area detection unit 204 is executed in a single CPU 11 or a single CPU 21, but each of these functional blocks does not necessarily need to be executed in a single CPU, and is executed in a plurality of CPUs. It may also be executed in a distributed manner by the CPUs. Further, each of these functional blocks may be executed in a distributed manner by a plurality of GPUs, or may be executed in a distributed manner by a plurality of CPUs and a plurality of GPUs.
上記第2および第3の実施形態では、図11および図14で説明する各ステップの処理
を行うためのプログラムを記憶部13,23に予め記憶している。これに代えて、プログ
ラムは、例えばDVD-ROMやUSBメモリ等の、コンピュータ読み取り可能であって
非一時的な有形の記憶媒体98から処理部10B,20Bにインストールしてもよい。ま
たは、処理部10B,20Bをネットワーク99と接続し、ネットワーク99を介して例
えば外部のサーバ(図示せず)からプログラムをダウンロードしてインストールしてもよ
い。
In the second and third embodiments described above, programs for performing the processing of each step explained in FIGS. 11 and 14 are stored in advance in the storage units 13 and 23. Alternatively, the program may be installed in the processing unit 10B, 20B from a computer-readable, non-transitory tangible storage medium 98, such as a DVD-ROM or a USB memory. Alternatively, the processing units 10B and 20B may be connected to the network 99, and a program may be downloaded and installed from, for example, an external server (not shown) via the network 99.
上記第1から第3の実施形態では、入力部16,26はキーボードまたはマウス等の入
力装置であり、出力部17,27は液晶ディスプレイ等の表示装置として実現されている
。これに代えて、入力部16、26と出力部17、27とを一体化してタッチパネル式の
表示装置として実現してもよい。または、出力部17,27をプリンター等で構成し、解
析結果の3値画像83または領域強調画像84を印刷して出力してもよい。
In the first to third embodiments described above, the input units 16 and 26 are input devices such as a keyboard or a mouse, and the output units 17 and 27 are realized as display devices such as a liquid crystal display. Alternatively, the input sections 16, 26 and the output sections 17, 27 may be integrated into a touch panel type display device. Alternatively, the output units 17 and 27 may be configured with a printer or the like, and the ternary image 83 or the region-enhanced image 84 resulting from the analysis may be printed and output.
上記第1から第3の実施形態では、撮像装置300は、深層学習装置100Aまたは画
像解析装置100Bと直接接続されているが、撮像装置300は、ネットワーク99を介
して深層学習装置100Aまたは画像解析装置100Bと接続されていてもよい。撮像装
置400についても同様に、撮像装置400は、画像解析装置200Aまたは画像解析装
置200Bと直接接続されているが、撮像装置400は、ネットワーク99を介して画像
解析装置200Aまたは画像解析装置200Bと接続されていてもよい。
In the first to third embodiments described above, the imaging device 300 is directly connected to the deep learning device 100A or the image analysis device 100B; It may be connected to the device 100B. Similarly, the imaging device 400 is directly connected to the image analysis device 200A or the image analysis device 200B, but the imaging device 400 is connected to the image analysis device 200A or the image analysis device 200B via the network 99. May be connected.
<学習済み深層学習アルゴリズムの検証>
上記第2の実施形態に示すスタンドアロン型のシステムにて、深層学習処理および画像
解析処理を行った。学習の対象とする組織として、腫瘍領域と正常領域を含むヒト胃がん
組織を用いた。学習済みの深層学習アルゴリズムを作成するにあたり、組織標本の拡大倍
率を1倍、3倍、5倍、10倍、20倍、および40倍と変化させて訓練用画像を撮像し
、異なる拡大倍率の訓練用画像を用いた訓練データをニューラルネットワークに学習させ
、解析結果の正確性を確認した。
学習データおよび解析データの詳細は、次の通りであった。
学習データ:106枚のホールスライドイメージ
検証用解析データ:45枚のホールスライドイメージ
<Verification of trained deep learning algorithm>
Deep learning processing and image analysis processing were performed using the stand-alone system shown in the second embodiment. Human gastric cancer tissue, which includes a tumor region and a normal region, was used as the tissue to be studied. To create a trained deep learning algorithm, training images were taken with the tissue sample magnified at different magnifications of 1x, 3x, 5x, 10x, 20x, and 40x. The neural network was trained on training data using training images, and the accuracy of the analysis results was confirmed.
The details of the learning data and analysis data were as follows.
Learning data: 106 hole slide images Verification analysis data: 45 hole slide images
[訓練データの作成および学習]
HE染色した胃がん組織の明視野画像のホールスライドイメージを、バーチャルスライ
ドスキャナ(NanoZoomer-XR、(Hamamatsu Photonics;スキャン分解能:20倍モードスキ
ャン時0.46 μm/pixel、40倍モードスキャン時0.23 μm/pixel))を用いてカラー撮像し
た。撮像倍率は1倍、3倍、5倍、10倍、20倍、および40倍とした。学習対象の組
織を含むホールスライドイメージ上で、病理医が腫瘍領域、非腫瘍領域、および非組織領
域を指定した。各領域が指定されたホールスライドイメージを上記の条件で分割し、訓練
用画像とした。個々の訓練用画像について腫瘍領域であるか、非腫瘍領域であるか、非組
織領域であるかを決定した。その際、腫瘍領域と非腫瘍領域が混在する組織の領域につい
ては、訓練用画像内の組織領域に該当する画素数のうち、腫瘍領域と指定された画素数が
50%以上を占める場合には腫瘍領域とした。また、訓練用画像内の組織領域に該当する
画素数のうち、非腫瘍領域と指定された画素数が占める割合が100%の場合には非腫瘍
領域とした。非組織領域と組織領域が混在する訓練用画像については、組織領域が訓練用
画像の画素数の0%である場合に非組織領域とし、それ以外は組織領域とした。腫瘍領域
、非腫瘍領域、非組織領域と判定されたそれぞれの訓練用画像の各画素について、各領域
を区別するラベル値(腫瘍領域は「1」、非腫瘍領域は「2」、非組織領域は「0」)を
付与し、第1の予備訓練データ70R1L、第2の予備訓練データ70R2Lおよび第3
の予備訓練データ70R2Lを生成した。腫瘍領域と判定された訓練用画像を第1の訓練
用画像とし、非腫瘍領域と判定された訓練用画像を第2の訓練用画像70R2とし、非組
織領域と判定された訓練用画像を第3の訓練用画像70R3とした。各訓練用画像につい
てR、G、B各色の色濃度値を8ビットで階調化して、R、G、B各色の色濃度符号化図
を生成し、作成したR、G、B各色の色濃度符号化図を組み合わせて第1の訓練データ7
4R1、第2の訓練データ74R2、第3の訓練データ74R3のそれぞれを生成した。
[Creating and learning training data]
Bright-field whole-slide images of HE-stained gastric cancer tissues were color-imaged using a virtual slide scanner (NanoZoomer-XR, (Hamamatsu Photonics; scan resolution: 0.46 μm/pixel in 20x mode scan, 0.23 μm/pixel in 40x mode scan). The imaging magnifications were 1x, 3x, 5x, 10x, 20x, and 40x. A pathologist designated tumor regions, non-tumor regions, and non-tissue regions on the whole-slide images containing the tissues to be studied. The whole-slide images in which each region was designated were divided under the above conditions to be used as training images. Each training image was determined to be a tumor region, a non-tumor region, or a non-tissue region. In this case, for tissue regions in which tumor regions and non-tumor regions were mixed, if the number of pixels designated as tumor regions accounted for 50% or more of the number of pixels corresponding to tissue regions in the training image, the region was designated as a tumor region. In addition, if the ratio of the number of pixels designated as non-tumor regions to the number of pixels corresponding to tissue regions in the training image was 100%, the region was designated as a non-tumor region. For training images containing a mixture of non-tissue and tissue regions, if the tissue region accounts for 0% of the number of pixels in the training image, it is determined to be a non-tissue region, and otherwise it is determined to be a tissue region. For each pixel in each training image determined to be a tumor region, a non-tumor region, or a non-tissue region, a label value that distinguishes each region (tumor region is "1", non-tumor region is "2", and non-tissue region is "0") is assigned, and the first preliminary training data 70R1L, the second preliminary training data 70R2L, and the third preliminary training data 70R3L are generated.
The training images determined to be tumor regions were designated as first training images, the training images determined to be non-tumor regions were designated as second training images 70R2, and the training images determined to be non-tissue regions were designated as third training images 70R3. The color density values of R, G, and B for each training image were converted to 8-bit gradation to generate color density coded maps for R, G, and B, and the created color density coded maps for R, G, and B were combined to generate the first training data 70R2L.
The first training data 74R1, the second training data 74R2, and the third training data 74R3 were generated.
その後、第1の訓練データ74R1と第1の予備訓練データ70R1Lとを組み合わせ
て腫瘍領域訓練データを作成した。第2の訓練データ74R2と第2の予備訓練データ7
0R2Lとを組み合わせて非腫瘍領域訓練データを作成した。第3の訓練データ74R3
と第3の予備訓練データ70R2Lとを組み合わせて非組織領域訓練データを作成した。
作成した各領域訓練データを200×200画素のウィンドウサイズに分割し、分割した
ウィンドウサイズの訓練データを入力層として、ニューラルネットワークを学習させた。
Thereafter, tumor region training data was created by combining the first training data 74R1 and the first preliminary training data 70R1L. Second training data 74R2 and second preliminary training data 7
Non-tumor region training data was created by combining with 0R2L. Third training data 74R3
and the third preliminary training data 70R2L were combined to create non-organized region training data.
The created training data for each region was divided into a window size of 200 x 200 pixels, and a neural network was trained using the training data of the divided window size as an input layer.
各領域訓練データは組織標本の拡大倍率毎に生成し、拡大倍率毎にニューラルネットワ
ークを学習させた。
Training data for each region was generated for each magnification of the tissue specimen, and the neural network was trained for each magnification.
[解析対象画像の作成]
訓練データと同様に、HE染色したヒト胃がん組織の明視野画像のホールスライドイメ
ージを、バーチャルスライドスキャナを用いてカラー撮像し解析用画像を得た。撮像倍率
は1倍、3倍、5倍、10倍、20倍、および40倍とした。その後、撮像した解析用画
像をもとにR、G、B各色の色濃度符号化図を作成し、作成したR、G、B各色の色濃度
符号化図を組み合わせて解析対象データを生成した。解析対象データは、拡大倍率毎に生
成した。
[Creating an image to be analyzed]
Similar to the training data, whole slide images of bright field images of HE-stained human gastric cancer tissues were color-imaged using a virtual slide scanner to obtain images for analysis. The imaging magnifications were 1x, 3x, 5x, 10x, 20x, and 40x. Then, based on the images for analysis, color density coding maps for each of the colors R, G, and B were created, and the data to be analyzed were generated by combining the color density coding maps for each of the colors R, G, and B that were created. The data to be analyzed was generated for each magnification.
[解析結果]
解析対象データから200×200画素のウィンドウサイズの解析用データを作成し、
解析用データを、拡大倍率に対応した学習済みのニューラルネットワークに入力した。ニ
ューラルネットワークから出力される解析結果をもとに、腫瘍領域と、非腫瘍領域と、非
組織領域(背景)とに分類し、解析処理により得られた腫瘍領域を白で表示し、非腫瘍領
域をグレーで表示し、非組織領域を黒で表示するように処理した。解析結果を図19に示
す。
[Analysis result]
Create analysis data with a window size of 200 x 200 pixels from the analysis target data,
The analysis data was input to a trained neural network corresponding to the magnification. Based on the analysis results output from the neural network, the image was classified into tumor regions, non-tumor regions, and non-tissue regions (background), and the tumor regions obtained by the analysis process were displayed in white, the non-tumor regions in gray, and the non-tissue regions in black. The analysis results are shown in FIG. 19.
図19中、(a)は、胃がん組織をHE染色して撮像した明視野画像のホールスライド
イメージであり、解析対象の画像である。(b)は、ホールスライドイメージの腫瘍領域
を病理医が指定し実線で囲った像である。(c)は、拡大倍率1倍の訓練用画像と解析用
画像を用いた解析結果を示す。病理医が指定した各領域を正確に示すことはできなかった
。(d)は、拡大倍率5倍の訓練用画像と解析用画像を用いた解析結果を示す。病理医が
指定した腫瘍領域を腫瘍領域として概ね判別することができた。また、病理医が指定した
非腫瘍領域を非腫瘍領域として概ね判別することができた。病理医が指定した非組織領域
を非組織領域として概ね判別することができた。(e)は、拡大倍率40倍の訓練用画像
と解析用画像を用いた解析結果を示す。病理医が指定した腫瘍領域を腫瘍領域としてある
程度判別することができた。しかし、病理医が非腫瘍領域と指定した領域において、腫瘍
領域と判定される領域が増えており、非腫瘍領域を腫瘍領域と誤判定する割合が高くなっ
ていた。
In FIG. 19, (a) is a whole slide image of a bright field image obtained by staining gastric cancer tissue with HE, and is an image to be analyzed. (b) is a whole slide image in which a tumor region is designated by a pathologist and surrounded by a solid line. (c) shows an analysis result using a training image and an analysis image with a magnification of 1x. It was not possible to accurately indicate each area designated by the pathologist. (d) shows an analysis result using a training image and an analysis image with a magnification of 5 times. The tumor area designated by the pathologist could generally be determined as a tumor area. Furthermore, the non-tumor region specified by the pathologist could generally be determined as a non-tumor region. The non-tissue area designated by the pathologist could generally be determined as a non-tissue area. (e) shows an analysis result using a training image and an analysis image with a magnification of 40 times. The tumor area specified by the pathologist could be determined to some extent as a tumor area. However, in areas designated as non-tumor areas by pathologists, the number of areas determined to be tumor areas was increasing, and the rate of erroneously determining non-tumor areas as tumor areas was high.
以上の結果から、訓練用画像および解析用画像を取得する際の拡大倍率は低すぎても高
すぎても誤判定の原因となることが示された。
The above results indicate that either too low or too high a magnification when acquiring training images and analysis images causes erroneous determinations.
図20中、(a)は、図19とは異なる胃がん組織をHE染色して撮像した明視野画像
のホールスライドイメージであり、解析対象の画像である。(b)は、ホールスライドイ
メージの腫瘍領域を病理医が指定し実線で囲った像である。(c)は、拡大倍率5倍の訓
練用画像と解析用画像を用いた解析結果を示す。病理医が指定した腫瘍領域を腫瘍領域と
して概ね判別することができた。また、病理医が指定した非腫瘍領域を非腫瘍領域として
概ね判別することができた。病理医が指定した非組織領域を非組織領域として概ね判別す
ることができた。(d)は、拡大倍率20倍の訓練用画像と解析用画像を用いた解析結果
を示す。拡大倍率5倍の場合と同様に、病理医が指定した各領域を概ね判別することがで
きた。
In FIG. 20, (a) is a whole slide image of a bright field image obtained by staining gastric cancer tissue with HE, which is different from that shown in FIG. 19, and is the image to be analyzed. (b) is a whole slide image in which a tumor region is designated by a pathologist and surrounded by a solid line. (c) shows an analysis result using a training image and an analysis image with a magnification of 5 times. The tumor area designated by the pathologist could generally be determined as a tumor area. Furthermore, the non-tumor region specified by the pathologist could generally be determined as a non-tumor region. The non-tissue area designated by the pathologist could generally be determined as a non-tissue area. (d) shows an analysis result using a training image and an analysis image with a magnification of 20 times. As with the case of 5x magnification, each region specified by the pathologist could be generally distinguished.
拡大倍率5倍の解析用画像について、下式にしたがって、ホールスライドイメージ1枚
に存在する組織領域における腫瘍領域の含有率を算出した。
Regarding the image for analysis at a magnification of 5 times, the content rate of the tumor region in the tissue region present in one whole slide image was calculated according to the following formula.
腫瘍領域の含有率(%)={[腫瘍領域と判定された画素数]/[(腫瘍領域と判定さ
れた画素数)+(非腫瘍領域と判定された画素数)]}×100
Content rate of tumor area (%) = {[Number of pixels determined to be a tumor area]/[(Number of pixels determined to be a tumor area) + (Number of pixels determined to be a non-tumor area)]}×100
腫瘍領域の含有率は54.5%であった。 The tumor area content was 54.5%.
また、図21に各拡大倍率の感度(a)および陽性的中率(b)を示す。この結果から
、訓練用画像および解析用画像を取得する際の組織標本の拡大倍率は、5から20倍が適
切であると考えられた。また、図21にウィンドウサイズの画素数の違いによる感度(c
)および陽性的中率(d)の変化を示す。解析用画像は拡大倍率5倍で撮像した。ウィン
ドウサイズの画素数は、125×125画素から200×200画素が好ましいと考えら
れた。
Furthermore, FIG. 21 shows the sensitivity (a) and positive predictive value (b) of each magnification. From this result, it was considered that a magnification of 5 to 20 times is appropriate for the tissue sample when acquiring images for training and images for analysis. In addition, Figure 21 shows the sensitivity (c
) and positive predictive value (d) are shown. Images for analysis were taken at a magnification of 5 times. It was considered that the number of pixels of the window size is preferably from 125 x 125 pixels to 200 x 200 pixels.
今回1枚のホールスライドイメージの解析時間は、数分~30分程度であった。 The analysis time for one whole slide image was approximately several to 30 minutes.
10(10A,10B) 処理部
20(20A,20B,20C) 処理部
11,21 CPU
12,22 メモリ
13,23 記録部
14,24 バス
15,25 インタフェース部
16,26 入力部
17,27 出力部
19,29 GPU
50 ニューラルネットワーク(深層学習アルゴリズム)
50a 入力層
50b 出力層
50c 中間層
60 学習済みのニューラルネットワーク(学習済みの深層学習アルゴリズム)
60a 入力層
60b 出力層
60c 中間層
70W1 ホールスライドイメージ
70W2 ホールスライドイメージ
70W3 ホールスライドイメージ
70R1L 第1の予備訓練データ
70R2L 第2の予備訓練データ
70R3L 第3の予備訓練データ
72R1r,72R1g,72R1b 色濃度符号化図
72R2r,72R2g,72R2b 色濃度符号化図
72R3r,72R3g,72R3b 色濃度符号化図
74R1,74R2,74R3 訓練データ
75R1,75R2, 75R3 ウィンドウサイズの訓練データ
76 色濃度値
77R1,77R2,77R3 真値像のラベル値
78 解析対象の明視野画像
79r,79g,79b 解析対象の色濃度符号化図
80 解析用データ
81 色濃度値
82 判別結果(画素の推定値)
83 解析結果の3値画像
84 領域強調画像
89(89a,89b) ノード
98 記録媒体
99 ネットワーク
100 ベンダ側装置
100A 深層学習装置
100B 統合型の画像解析装置
101 訓練データ生成部
102 訓練データ入力部
103 アルゴリズム更新部
104 ウィンドウサイズデータベース
105 アルゴリズムデータベース
200 ユーザ側装置
200A 画像解析装置
200B 統合型の画像解析装置
200C 端末装置
201 解析用データ生成部
202 解析用データ入力部
203 解析部
204 領域検出部
300,400 撮像装置
301,401 撮像素子
308,408 試料組織
309,409 ステージ
W1 ウィンドウ
W2 ウィンドウ
10 (10A, 10B) Processing unit 20 (20A, 20B, 20C) Processing unit 11, 21 CPU
12, 22 Memory 13, 23 Recording section 14, 24 Bus 15, 25 Interface section 16, 26 Input section 17, 27 Output section 19, 29 GPU
50 Neural network (deep learning algorithm)
50a Input layer 50b Output layer 50c Middle layer 60 Trained neural network (trained deep learning algorithm)
60a Input layer 60b Output layer 60c Intermediate layer 70W1 Hole slide image 70W2 Hole slide image 70W3 Hole slide image 70R1L First preliminary training data 70R2L Second preliminary training data 70R3L Third preliminary training data 72R1r, 72R1g, 72R1b Color density code Color density encoding diagrams 72R2r, 72R2g, 72R2b Color density encoding diagrams 72R3r, 72R3g, 72R3b Color density encoding diagrams 74R1, 74R2, 74R3 Training data 75R1, 75R2, 75R3 Window size training data 76 Color density values 77R1, 77R2, 77R3 True value Image label value 78 Bright field images to be analyzed 79r, 79g, 79b Color density encoding diagram for analysis target 80 Data for analysis 81 Color density value 82 Discrimination result (estimated value of pixel)
83 Analysis result ternary image 84 Region-enhanced image 89 (89a, 89b) Node 98 Recording medium 99 Network 100 Vendor device 100A Deep learning device 100B Integrated image analysis device 101 Training data generation unit 102 Training data input unit 103 Algorithm Update unit 104 Window size database 105 Algorithm database 200 User device 200A Image analysis device 200B Integrated image analysis device 200C Terminal device 201 Analysis data generation unit 202 Analysis data input unit 203 Analysis unit 204 Region detection unit 300, 400 Imaging Apparatus 301, 401 Image sensor 308, 408 Sample tissue 309, 409 Stage W1 Window W2 Window
Claims (21)
解析対象の組織を含む解析対象画像から解析対象データを生成し、解析対象データから複数の画素からなる複数の画素領域を切り出し、切り出した画素領域のそれぞれについて解析用データを生成し、
前記解析用データのそれぞれを、前記深層学習アルゴリズムに入力し、
前記深層学習アルゴリズムによって、前記画素領域が腫瘍領域であるか否かを示すデータを生成する、
ことを含み、
前記画素領域の前記画素の数は、前記解析対象の組織の種別に応じて設定されている、
画像解析方法。 An image analysis method for analyzing tissue images using a deep learning algorithm with a neural network structure,
Generating data to be analyzed from an image to be analyzed that includes the tissue to be analyzed, cutting out multiple pixel regions each consisting of a plurality of pixels from the data to be analyzed, and generating data for analysis for each of the cut out pixel regions;
inputting each of the analysis data to the deep learning algorithm;
generating data indicating whether the pixel region is a tumor region by the deep learning algorithm;
including that
The number of pixels in the pixel area is set according to the type of tissue to be analyzed.
Image analysis method.
請求項1または2の画像解析方法。 The image to be analyzed is an image of a specimen for tissue diagnosis, and the image to be analyzed includes a hue that is a combination of two or more primary colors.
The image analysis method according to claim 1 or 2.
請求項1乃至3のいずれか1項の画像解析方法。 The image to be analyzed is an image obtained by enlarging the tissue to be analyzed from 3 times to 20 times.
The image analysis method according to any one of claims 1 to 3.
請求項1乃至4のいずれか1項の画像解析方法。 The pixel area is square, and the size of the pixel area is 200 μm x 200 μm or more and 400 μm x 400 μm or less,
The image analysis method according to any one of claims 1 to 4.
請求項1乃至5のいずれか1項の画像解析方法。 generating data indicating a boundary between a tumor cell area and other areas based on data indicating whether the pixel area is a tumor area;
The image analysis method according to any one of claims 1 to 5.
請求項1乃至6のいずれか1項の画像解析方法。 generating data indicating a content rate of a tumor area in the tissue to be analyzed based on data indicating whether the pixel area is a tumor area;
The image analysis method according to any one of claims 1 to 6.
請求項1乃至6のいずれか1項の画像解析方法。 Generating data indicating a ratio of a tumor area to a non-tumor area in the tissue to be analyzed based on data indicating whether the pixel area is a tumor area;
The image analysis method according to any one of claims 1 to 6.
請求項1乃至8のいずれか1項の画像解析方法。 The number of nodes in the input layer of the neural network corresponds to the product of the number of pixels in the pixel area and the number of primary colors of each pixel.
The image analysis method according to any one of claims 1 to 8.
請求項3の画像解析方法。 The tissue diagnostic specimen is a stained specimen, and the image to be analyzed is an image of the stained specimen taken under a bright field of a microscope.
The image analysis method according to claim 3 .
請求項1乃至10のいずれか1項の画像解析方法。 The training data used for learning the deep learning algorithm is a stained image of a specimen prepared by performing bright field observation staining on a tissue specimen including a tumor region collected from an individual under the bright field of a microscope. Generated based on the captured bright field image,
The image analysis method according to any one of claims 1 to 10.
請求項11の画像解析方法。 The bright field observation staining uses hematoxylin for nuclear staining.
The image analysis method according to claim 11.
請求項11の画像解析方法。 The bright field observation staining is hematoxylin and eosin staining.
The image analysis method according to claim 11.
請求項11乃至13のいずれか1項の画像解析方法。 The training data includes a label value determined from the bright field image indicating a tumor region.
The image analysis method according to any one of claims 11 to 13.
請求項14の画像解析方法。 the training data includes the label value for each region of a predetermined number of pixels of the bright field image;
The image analysis method according to claim 14.
請求項1乃至16のいずれか1項の画像解析方法。 the output layer of the neural network is a node whose activation function is a softmax function;
The image analysis method according to any one of claims 1 to 16.
請求項1乃至17のいずれか1項の画像解析方法。 The deep learning algorithm generates data indicating whether the pixel region is a tumor region each time the analysis data is input.
The image analysis method according to any one of claims 1 to 17.
請求項1乃至18のいずれか1項の画像解析方法。 and processing the analysis data using a deep learning algorithm that corresponds to the type of tissue to be analyzed and is selected from among a plurality of deep learning algorithms according to the type of tissue.
19. The image analysis method according to any one of claims 1 to 18.
解析対象の組織を含む解析対象画像から解析対象データを生成し、解析対象データから切り出した複数の画素からなる複数の画素領域を切り出し、切り出した画素領域のそれぞれについて解析用データを生成し、
前記解析用データのそれぞれを、前記深層学習アルゴリズムに入力し、
前記深層学習アルゴリズムによって、前記画素領域が腫瘍領域であるか否かを示すデータを生成する処理部、
を備え、
前記画素領域の前記画素の数は、前記解析対象の組織の種別に応じて設定されている、画像解析装置。 An image analysis device that analyzes tissue images using a deep learning algorithm with a neural network structure,
Generating data to be analyzed from an image to be analyzed that includes the tissue to be analyzed, cutting out a plurality of pixel regions made up of a plurality of pixels cut out from the data to be analyzed, generating data for analysis for each of the cut out pixel regions,
inputting each of the analysis data to the deep learning algorithm;
a processing unit that uses the deep learning algorithm to generate data indicating whether the pixel region is a tumor region;
Equipped with
The number of pixels in the pixel region is set according to the type of tissue to be analyzed.
コンピュータに、
解析対象の組織を含む解析対象画像から解析対象データを生成し、解析対象データから複数の画素からなる複数の画素領域を切り出し、切り出した画素領域のそれぞれについて解析用データを生成する処理と、
前記解析用データのそれぞれを、前記深層学習アルゴリズムに入力する処理と、
前記深層学習アルゴリズムによって、前記画素領域が腫瘍領域であるか否かを示すデータを生成する処理と、を実行させ、
前記画素領域の前記画素の数は、前記解析対象の組織の種別に応じて設定されている、コンピュータプログラム。 A computer program for analyzing tissue images using a deep learning algorithm having a neural network structure, comprising:
On the computer,
A process of generating analysis target data from an analysis target image including a tissue to be analyzed, extracting a plurality of pixel regions each consisting of a plurality of pixels from the analysis target data, and generating analysis data for each of the extracted pixel regions;
inputting each of the analysis data into the deep learning algorithm;
and generating data indicating whether the pixel region is a tumor region using the deep learning algorithm;
The number of pixels in the pixel region is set according to the type of tissue to be analyzed.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023008540A JP7458519B2 (en) | 2018-02-27 | 2023-01-24 | Image analysis method, image analysis device, program, method for producing trained deep learning algorithm, and trained deep learning algorithm |
JP2024004675A JP2024038396A (en) | 2018-02-27 | 2024-01-16 | Image analysis method, image analysis device, and program |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018032761A JP7217589B2 (en) | 2018-02-27 | 2018-02-27 | Image analysis method, image analysis device, program, method for manufacturing trained deep learning algorithm, and trained deep learning algorithm |
JP2023008540A JP7458519B2 (en) | 2018-02-27 | 2023-01-24 | Image analysis method, image analysis device, program, method for producing trained deep learning algorithm, and trained deep learning algorithm |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018032761A Division JP7217589B2 (en) | 2018-02-27 | 2018-02-27 | Image analysis method, image analysis device, program, method for manufacturing trained deep learning algorithm, and trained deep learning algorithm |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024004675A Division JP2024038396A (en) | 2018-02-27 | 2024-01-16 | Image analysis method, image analysis device, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023065352A JP2023065352A (en) | 2023-05-12 |
JP7458519B2 true JP7458519B2 (en) | 2024-03-29 |
Family
ID=67850414
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018032761A Active JP7217589B2 (en) | 2018-02-27 | 2018-02-27 | Image analysis method, image analysis device, program, method for manufacturing trained deep learning algorithm, and trained deep learning algorithm |
JP2023008540A Active JP7458519B2 (en) | 2018-02-27 | 2023-01-24 | Image analysis method, image analysis device, program, method for producing trained deep learning algorithm, and trained deep learning algorithm |
JP2024004675A Pending JP2024038396A (en) | 2018-02-27 | 2024-01-16 | Image analysis method, image analysis device, and program |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018032761A Active JP7217589B2 (en) | 2018-02-27 | 2018-02-27 | Image analysis method, image analysis device, program, method for manufacturing trained deep learning algorithm, and trained deep learning algorithm |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024004675A Pending JP2024038396A (en) | 2018-02-27 | 2024-01-16 | Image analysis method, image analysis device, and program |
Country Status (1)
Country | Link |
---|---|
JP (3) | JP7217589B2 (en) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7350595B2 (en) * | 2019-10-01 | 2023-09-26 | キヤノンメディカルシステムズ株式会社 | Image processing device, medical image diagnostic device, and image processing program |
KR102408405B1 (en) * | 2020-03-19 | 2022-06-15 | 주식회사 아이도트 | System for diagnosing the carotid artery |
CN113710166A (en) * | 2020-03-19 | 2021-11-26 | 艾多特公司 | Carotid artery ultrasonic diagnosis system |
EP4209991A4 (en) * | 2020-09-02 | 2024-05-22 | Evident Corporation | Program, information storage medium, and processing system |
CN112019827B (en) * | 2020-09-02 | 2022-01-25 | 上海网达软件股份有限公司 | Method, device, equipment and storage medium for enhancing video image color |
KR102250219B1 (en) * | 2020-09-15 | 2021-05-11 | 주식회사 아이도트 | Ultrasound diagnostic system |
KR20220042558A (en) * | 2020-09-28 | 2022-04-05 | 주식회사 딥바이오 | Method for displaying diagnosis result of pathological image and computing system performing the same |
KR102499143B1 (en) * | 2020-11-27 | 2023-02-14 | (의)삼성의료재단 | Measurement method of intima-media thickness of artery and device therefore |
KR102684355B1 (en) * | 2020-12-24 | 2024-07-18 | (주)제이엘케이 | Prostate cancer pathological images report system based on artificial intelligence |
KR102316525B1 (en) * | 2021-03-08 | 2021-10-22 | 주식회사 딥바이오 | Method for training artificial neural network for detecting prostate cancer from TURP pathological image, and computing system performing the same |
KR102354476B1 (en) * | 2021-03-15 | 2022-01-21 | 주식회사 딥바이오 | Providing method and system for diagnosing lesions of bladder |
KR102485414B1 (en) * | 2021-12-13 | 2023-01-06 | 주식회사 딥바이오 | Method for training artificial neural network providing result of diagnosis for pathological specimen, and computing system performing the same |
JP7557499B2 (en) * | 2022-05-31 | 2024-09-27 | 楽天グループ株式会社 | Method for predicting data from an image, computer system, and computer readable medium |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005509978A (en) | 2001-11-16 | 2005-04-14 | チェン,ユアン,ヤン | Ambiguous neural network with supervised and unsupervised cluster analysis |
JP2012073179A (en) | 2010-09-29 | 2012-04-12 | Dainippon Screen Mfg Co Ltd | Pathological diagnosis support device, pathological diagnosis support method, control program for pathological diagnosis support and recording medium with control program recorded thereon |
JP2017510792A (en) | 2014-01-28 | 2017-04-13 | ベンタナ メディカル システムズ, インコーポレイテッド | Adaptive classification for total slide tissue segmentation |
JP2017516992A (en) | 2014-05-23 | 2017-06-22 | ベンタナ メディカル システムズ, インコーポレイテッド | System and method for detection of biological structures and / or patterns in images |
WO2017150194A1 (en) | 2016-03-04 | 2017-09-08 | コニカミノルタ株式会社 | Image processing device, image processing method, and program |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2257636A4 (en) | 2008-07-03 | 2014-10-15 | Nec Lab America Inc | Epithelial layer detector and related methods |
JP5321145B2 (en) | 2009-03-04 | 2013-10-23 | 日本電気株式会社 | Image diagnosis support apparatus, image diagnosis support method, image diagnosis support program, and storage medium thereof |
JP2017045430A (en) | 2015-08-28 | 2017-03-02 | パナソニックIpマネジメント株式会社 | Image processing device, image processing system, image processing method and program |
WO2017201540A1 (en) | 2016-05-20 | 2017-11-23 | Techcyte, Inc. | Machine learning classification of particles or substances in digital microscopy images |
WO2018018160A1 (en) | 2016-07-29 | 2018-02-01 | Novadaq Technologies ULC | Methods and systems for characterizing tissue of a subject utilizing machine learning |
JP7076698B2 (en) | 2017-11-17 | 2022-05-30 | 国立研究開発法人国立がん研究センター | Image analysis method, image analysis device, program, learned deep learning algorithm manufacturing method and learned deep learning algorithm |
-
2018
- 2018-02-27 JP JP2018032761A patent/JP7217589B2/en active Active
-
2023
- 2023-01-24 JP JP2023008540A patent/JP7458519B2/en active Active
-
2024
- 2024-01-16 JP JP2024004675A patent/JP2024038396A/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005509978A (en) | 2001-11-16 | 2005-04-14 | チェン,ユアン,ヤン | Ambiguous neural network with supervised and unsupervised cluster analysis |
JP2012073179A (en) | 2010-09-29 | 2012-04-12 | Dainippon Screen Mfg Co Ltd | Pathological diagnosis support device, pathological diagnosis support method, control program for pathological diagnosis support and recording medium with control program recorded thereon |
JP2017510792A (en) | 2014-01-28 | 2017-04-13 | ベンタナ メディカル システムズ, インコーポレイテッド | Adaptive classification for total slide tissue segmentation |
JP2017516992A (en) | 2014-05-23 | 2017-06-22 | ベンタナ メディカル システムズ, インコーポレイテッド | System and method for detection of biological structures and / or patterns in images |
WO2017150194A1 (en) | 2016-03-04 | 2017-09-08 | コニカミノルタ株式会社 | Image processing device, image processing method, and program |
Non-Patent Citations (1)
Title |
---|
深層学習を用いた病理組織画像からの乳癌診断,電子情報通信学会技術研究報告 Vol.117 No.50,2017年05月18日 |
Also Published As
Publication number | Publication date |
---|---|
JP2024038396A (en) | 2024-03-19 |
JP2019148473A (en) | 2019-09-05 |
JP7217589B2 (en) | 2023-02-03 |
JP2023065352A (en) | 2023-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7458519B2 (en) | Image analysis method, image analysis device, program, method for producing trained deep learning algorithm, and trained deep learning algorithm | |
US20230419696A1 (en) | Image analysis method, apparatus, program, and learned deep learning algorithm | |
JP7076698B2 (en) | Image analysis method, image analysis device, program, learned deep learning algorithm manufacturing method and learned deep learning algorithm | |
EP3531339B1 (en) | Image analysis method, image analysis apparatus and learned deep layer learning algorithm manufacturing method | |
CN109791693B (en) | Digital pathology system and related workflow for providing visualized whole-slice image analysis | |
CN105027165B (en) | Tissue object-based machine learning system for automated scoring of digital whole slides | |
US20050265588A1 (en) | Method and system for digital image based flourescent in situ hybridization (FISH) analysis | |
WO2017221592A1 (en) | Image processing device, image processing method, and image processing program | |
US11989882B2 (en) | Histological image analysis | |
JP7156361B2 (en) | Image processing method, image processing apparatus and program | |
WO2018128091A1 (en) | Image analysis program and image analysis method | |
JP2022040540A (en) | Image processing method | |
Dubey et al. | Pathology for gastrointestinal and hepatobiliary cancers using artificial intelligence |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230124 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20230927 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20231004 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240227 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240318 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7458519 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |