JP7252158B2 - 学習方法、学習装置、画像解析装置、及びプログラム - Google Patents
学習方法、学習装置、画像解析装置、及びプログラム Download PDFInfo
- Publication number
- JP7252158B2 JP7252158B2 JP2020044137A JP2020044137A JP7252158B2 JP 7252158 B2 JP7252158 B2 JP 7252158B2 JP 2020044137 A JP2020044137 A JP 2020044137A JP 2020044137 A JP2020044137 A JP 2020044137A JP 7252158 B2 JP7252158 B2 JP 7252158B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- images
- local
- machine learning
- learning device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Description
図1は、本発明の各実施形態を構成するコンピュータ10のハードウェア構成の一例を示すブロック図である。
先ず、第1実施形態に関して説明する。第1実施形態では、第2検出部106の第2機械学習器120(図3を参照)の学習が行われる。
第1画像取得ステップ(ステップS10及びステップS11)は画像取得部12及び前処理部102で行われる。画像取得部12は、例えば損傷箇所として鉄筋露出U1及びコンクリート剥離U2(図4参照)を有する橋梁を撮影した点検画像150を取得する。画像取得部12で取得された点検画像150及び正解画像152は、メモリ16に記憶される。点検画像150に対応する正解画像152は、学習セットを構成する。メモリ16には、単数又は複数の学習セットが記憶されている。
第2画像取得ステップ(ステップS12)は縮小部108により行われる。縮小部108は、第1画像Aを縮小して第2画像Bを取得する。
第3画像切出ステップ(ステップS13)は第1切出部104で行われる。第1切出部104は、第1画像Aから複数の第3画像C1~C9を切り出す。
第4画像取得ステップ(ステップS14)は第1検出部110で行われる。第1検出部110は、第1機械学習器124で構成されている。本実施形態においては、既に学習が行われた第1機械学習器124であって、入力された画像に対してセグメンテーションを行うように学習が行われた検出器である。第1機械学習器124は、深層学習(ディープラーニング)モデルの一つである畳み込みニューラルネットワーク(CNN:Convolution Neural Network)が使用されている。
第5画像切出ステップ(ステップS15)は、第2切出部112で行われる。第2切出部112は、第4画像Dから第5画像E1~E9を切り出す。
局所正解画像取得ステップ(ステップS16)は第3切出部118で行われる。第3切出部118は、全体正解画像αから、図5で説明をした第3画像C1~C9に対応するように局所正解画像β1~β9を切り出す。
次に第2実施形態に関して説明する。第2実施形態では、第1実施形態と同様に第2機械学習器120の学習を行うことに加えて、第1機械学習器124の学習も行われる。以下の説明では、第1機械学習器124の学習に関して主に説明を行う。
次に第3実施形態に関して説明する。本実施形態は、上述した第1実施形態及び第2実施形態により学習した第1機械学習器124及び第2機械学習器120を備えた画像解析装置である。
上記実施形態において、各種の処理を実行する機能部(processing unit)のハードウェア的な構造は、次に示すような各種のプロセッサ(processor)である。各種のプロセッサには、ソフトウェア(プログラム)を実行して各種の処理部として機能する汎用的なプロセッサであるCPU(Central Processing Unit)、FPGA(Field Programmable Gate Array)などの製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス(Programmable Logic Device:PLD)、ASIC(Application Specific Integrated Circuit)などの特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路などが含まれる。
12 :画像取得部
14 :GPU
16 :メモリ
18 :操作部
20 :CPU
22 :RAM
24 :ROM
26 :表示部
52A :入力層
52B :中間層
52C :出力層
54 :損失値算出部
56 :パラメータ制御部
102 :前処理部
104 :第1切出部
106 :第2検出部
108 :縮小部
110 :第1検出部
112 :第2切出部
118 :第3切出部
120 :第2機械学習器
122 :第2合わせ込み部
124 :第1機械学習器
126 :第1合わせ込み部
Claims (11)
- 複数の領域を含む被写体が撮影された第1画像を取得する第1画像取得ステップと、
前記第1画像を縮小した第2画像を生成する第2画像取得ステップと、
前記第1画像を複数の領域で分割し、複数の第3画像を切り出す第3画像切出ステップと、
前記第2画像を第1機械学習器に入力し、前記第1機械学習器から前記複数の領域をそれぞれ分類した全体推定画像である第4画像を取得する第4画像取得ステップと、
前記第4画像から前記複数の第3画像の各々に対応する複数の第5画像を切り出す第5画像切出ステップと、
前記第1画像に対応して作成され、前記複数の領域をそれぞれ分類した正解画像の複数の局所正解画像であって、前記複数の第3画像に対応する前記局所正解画像を取得する局所正解画像取得ステップと、
前記複数の第3画像及び前記複数の第5画像のうちのそれぞれ対応する前記第3画像及び前記第5画像を第2機械学習器の入力画像とし、前記第2機械学習器から得られる局所推定画像を、前記複数の局所正解画像のうち前記入力した前記第3画像に対応する局所正解画像に合わせ込む学習を行わせる局所学習ステップと、
を含む学習方法。 - 前記第2画像を前記第1機械学習器の入力画像とし、前記第1機械学習器から得られる前記全体推定画像である前記第4画像を、前記正解画像に合わせ込む学習を行わせる全体学習ステップを含む請求項1に記載の学習方法。
- 前記局所学習ステップでの前記学習と、前記全体学習ステップでの前記学習とは転移学習である請求項2に記載の学習方法。
- 前記第1画像取得ステップでは、複数の領域を含む被写体が撮影された画像に対して、拡大処理、縮小処理、画像切り出し、コントラスト調整処理、及びエッジ強調処理の少なくとも一つの処理を行って前記第1画像とする請求項1から3のいずれか1項に記載の学習方法。
- 前記第3画像切出ステップでは、前記第1画像を互いにオーバーラップする前記複数の領域で分割し、前記第3画像を切り出す請求項1から4のいずれか1項に記載の学習方法。
- 前記第1画像取得ステップで取得される前記第1画像は、損傷箇所を有する構造物が被写体として撮影されている請求項1から5のいずれか1項に記載の学習方法。
- 前記請求項1から6のいずれか1項に記載の学習方法により学習された前記第2機械学習器と、複数の領域を含む被写体が撮影された第1画像を記憶するメモリと、プロセッサとを備える画像解析装置であって、
前記プロセッサは、
前記メモリに記憶されている前記第1画像を縮小した第2画像を生成し、
前記メモリに記憶されている前記第1画像を複数の領域で分割し、複数の第3画像を切り出し、
前記第2画像を第1機械学習器に入力し、前記第1機械学習器から前記複数の領域をそれぞれ分類した全体推定画像である第4画像を取得し、
前記第4画像から前記複数の第3画像の各々に対応する複数の第5画像を切り出し、
前記第1画像に対応して作成され、前記複数の領域をそれぞれ分類した正解画像の複数の局所正解画像であって、前記複数の第3画像に対応する前記局所正解画像を取得し、
前記複数の第3画像及び前記複数の第5画像のうちのそれぞれ対応する前記第3画像及び前記第5画像を前記第2機械学習器に入力し、前記第2機械学習器から前記複数の領域をそれぞれ分類した局所推定画像を取得する、
画像解析装置。 - 前記請求項2又は3に記載の学習方法により学習された前記第1機械学習器及び前記第2機械学習器と、複数の領域を含む被写体が撮影された第1画像を記憶するメモリと、プロセッサとを備える画像解析装置であって、
前記プロセッサは、
前記メモリに記憶されている前記第1画像を縮小した第2画像を生成し、
前記メモリに記憶されている前記第1画像を複数の領域で分割し、複数の第3画像を切り出し、
前記第2画像を前記第1機械学習器に入力し、前記第1機械学習器から前記複数の領域をそれぞれ分類した全体推定画像である第4画像を取得し、
前記第4画像から前記複数の第3画像の各々に対応する複数の第5画像を切り出し、
前記第1画像に対応して作成され、前記複数の領域をそれぞれ分類した正解画像の複数の局所正解画像であって、前記複数の第3画像に対応する前記局所正解画像を取得し、
前記複数の第3画像及び前記複数の第5画像のうちのそれぞれ対応する前記第3画像及び前記第5画像を前記第2機械学習器に入力し、前記第2機械学習器から前記複数の領域をそれぞれ分類した局所推定画像を取得する、
画像解析装置。 - 前記プロセッサは、
前記局所推定画像を合成して、前記第1画像の解析結果画像を生成する請求項7又は8に記載の画像解析装置。 - 複数の領域を含む被写体が撮影された第1画像及び前記複数の領域をそれぞれ分類した正解画像を記憶するメモリと、プロセッサとを備える学習装置であって、
前記プロセッサは、
前記メモリに記憶されている前記第1画像を縮小した第2画像を生成し、
前記メモリに記憶されている前記第1画像を複数の領域で分割し、複数の第3画像を切り出し、
前記第2画像を第1機械学習器に入力し、前記第1機械学習器から前記複数の領域をそれぞれ分類した全体推定画像である第4画像を取得し、
前記第4画像から前記複数の第3画像の各々に対応する複数の第5画像を切り出し、
前記第1画像に対応して作成され、前記複数の領域をそれぞれ分類した、前記メモリに記憶されている正解画像の複数の局所正解画像であって、前記複数の第3画像に対応する前記局所正解画像を取得し、
前記複数の第3画像及び前記複数の第5画像のうちのそれぞれ対応する前記第3画像及び前記第5画像を第2機械学習器の入力画像とし、前記第2機械学習器から得られる局所推定画像を、前記複数の局所正解画像のうち前記入力した前記第3画像に対応する局所正解画像に合わせ込む学習を行わせる、
学習装置。 - 複数の領域を含む被写体が撮影された第1画像を取得する第1画像取得ステップと、
前記第1画像を縮小した第2画像を生成する第2画像取得ステップと、
前記第1画像を複数の領域で分割し、複数の第3画像を切り出す第3画像切出ステップと、
前記第2画像を第1機械学習器に入力し、前記第1機械学習器から前記複数の領域をそれぞれ分類した全体推定画像である第4画像を取得する第4画像取得ステップと、
前記第4画像から前記複数の第3画像の各々に対応する複数の第5画像を切り出す第5画像切出ステップと、
前記第1画像に対応して作成され、前記複数の領域をそれぞれ分類した正解画像の複数の局所正解画像であって、前記複数の第3画像に対応する前記局所正解画像を取得する局所正解画像取得ステップと、
前記複数の第3画像及び前記複数の第5画像のうちのそれぞれ対応する前記第3画像及び前記第5画像を第2機械学習器の入力画像とし、前記第2機械学習器から得られる局所推定画像を、前記複数の局所正解画像のうち前記入力した前記第3画像に対応する局所正解画像に合わせ込む学習を行わせる局所学習ステップと、
を含む学習方法をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020044137A JP7252158B2 (ja) | 2020-03-13 | 2020-03-13 | 学習方法、学習装置、画像解析装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020044137A JP7252158B2 (ja) | 2020-03-13 | 2020-03-13 | 学習方法、学習装置、画像解析装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021144589A JP2021144589A (ja) | 2021-09-24 |
JP7252158B2 true JP7252158B2 (ja) | 2023-04-04 |
Family
ID=77766842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020044137A Active JP7252158B2 (ja) | 2020-03-13 | 2020-03-13 | 学習方法、学習装置、画像解析装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7252158B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010226694A (ja) | 2009-02-24 | 2010-10-07 | Ricoh Co Ltd | 画像処理装置及び画像処理方法 |
JP2012202858A (ja) | 2011-03-25 | 2012-10-22 | Railway Technical Research Institute | コンクリート表面の閉合ひび割れ検出方法 |
WO2019167882A1 (ja) | 2018-02-27 | 2019-09-06 | 富士フイルム株式会社 | 機械学習装置および方法 |
JP2020038574A (ja) | 2018-09-05 | 2020-03-12 | 京セラ株式会社 | 画像学習プログラム、画像学習方法、画像認識プログラム、画像認識方法、及び画像認識装置 |
-
2020
- 2020-03-13 JP JP2020044137A patent/JP7252158B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010226694A (ja) | 2009-02-24 | 2010-10-07 | Ricoh Co Ltd | 画像処理装置及び画像処理方法 |
JP2012202858A (ja) | 2011-03-25 | 2012-10-22 | Railway Technical Research Institute | コンクリート表面の閉合ひび割れ検出方法 |
WO2019167882A1 (ja) | 2018-02-27 | 2019-09-06 | 富士フイルム株式会社 | 機械学習装置および方法 |
JP2020038574A (ja) | 2018-09-05 | 2020-03-12 | 京セラ株式会社 | 画像学習プログラム、画像学習方法、画像認識プログラム、画像認識方法、及び画像認識装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2021144589A (ja) | 2021-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3553742B1 (en) | Method and device for identifying pathological picture | |
US11651477B2 (en) | Generating an image mask for a digital image by utilizing a multi-branch masking pipeline with neural networks | |
CN110599528A (zh) | 一种基于神经网络的无监督三维医学图像配准方法及系统 | |
JP4480958B2 (ja) | デジタル画像作成方法 | |
CN111696196B (zh) | 一种三维人脸模型重建方法及装置 | |
TWI701608B (zh) | 用於圖片匹配定位的神經網路系統、方法及裝置 | |
JP7398377B2 (ja) | 3d医用画像のジオメトリに従った、構造化された畳み込みを通したいくつかのニューラルネットワークによる3d医用画像の自動セグメンテーションプロセス | |
JP6937508B2 (ja) | 画像処理システム、評価モデル構築方法、画像処理方法及びプログラム | |
CN113077419A (zh) | 用于髋关节ct影像识别的信息处理方法及装置 | |
CN112132164B (zh) | 目标检测方法、系统、计算机装置及存储介质 | |
KR20220019278A (ko) | 이미지 처리를 위한 딥 러닝 모델들 | |
US20220405878A1 (en) | Image processing apparatus, image processing method, and image processing program | |
CN113112518A (zh) | 基于拼接图像的特征提取器生成方法、装置和计算机设备 | |
KR101981284B1 (ko) | 이미지 처리 장치 및 방법 | |
JP7252158B2 (ja) | 学習方法、学習装置、画像解析装置、及びプログラム | |
Goutham et al. | Automatic localization of landmarks in cephalometric images via modified U-Net | |
CN113724267A (zh) | 一种乳腺超声图像肿瘤分割方法及装置 | |
KR20140053259A (ko) | 특징 추출을 위한 기법들 | |
JP2017162034A (ja) | 画像処理装置、画像処理方法、画像処理システムおよびプログラム | |
JP7441312B2 (ja) | 学習装置、学習方法、及びプログラム | |
JP2005235089A (ja) | 画像認識装置、画像認識方法及びプログラム | |
Van Pham et al. | Object contour refinement using instance segmentation in dental images | |
EP4152255A1 (en) | System and method for differentiating a tissue of interest from another part of a medical scanner image | |
CN114241407B (zh) | 一种基于深度学习的近距离屏幕监控方法 | |
RU2803978C2 (ru) | Процесс автоматической сегментации трехмерного медицинского изображения с помощью нескольких нейронных сетей посредством структурированной свертки в соответствии с геометрией трехмерного медицинского изображения |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220304 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230313 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230323 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7252158 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |