JPWO2021106174A5 - 画像処理方法、学習装置、画像処理装置及びプログラム - Google Patents
画像処理方法、学習装置、画像処理装置及びプログラム Download PDFInfo
- Publication number
- JPWO2021106174A5 JPWO2021106174A5 JP2021561092A JP2021561092A JPWO2021106174A5 JP WO2021106174 A5 JPWO2021106174 A5 JP WO2021106174A5 JP 2021561092 A JP2021561092 A JP 2021561092A JP 2021561092 A JP2021561092 A JP 2021561092A JP WO2021106174 A5 JPWO2021106174 A5 JP WO2021106174A5
- Authority
- JP
- Japan
- Prior art keywords
- image
- output
- neural network
- generated
- extended
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims description 17
- 238000013528 artificial neural network Methods 0.000 claims 32
- 238000000034 method Methods 0.000 claims 16
- 238000009499 grossing Methods 0.000 claims 3
- 238000001727 in vivo Methods 0.000 claims 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims 2
- 238000013527 convolutional neural network Methods 0.000 claims 2
- 230000009466 transformation Effects 0.000 claims 2
- 238000010801 machine learning Methods 0.000 claims 1
Description
本発明は、画像処理方法、学習装置、画像処理装置及びプログラム等に関する。
Claims (19)
- 入力画像に第1画像拡張を適用することによって第1拡張画像を生成し、
前記入力画像に前記第1画像拡張と異なる第2画像拡張を適用することによって第2拡張画像を生成し、
前記第1拡張画像をニューラルネットワークに入力することによって第1出力を生成し、
前記第2拡張画像を前記ニューラルネットワークに入力することによって第2出力を生成し、
前記第1出力と前記第2出力との相違度を示す出力相違度を算出し、
前記出力相違度に基づいて、前記ニューラルネットワークの各層における重み係数を更新する、
ことを特徴とする画像処理方法。 - 請求項1において、
前記入力画像に対応する正解ラベルを取得し、
前記第1出力及び前記第2出力の少なくとも1つと、前記正解ラベルとに基づいて出力誤差を算出し、
前記出力誤差と前記出力相違度との重み付け和を全体誤差として求め、
前記全体誤差に基づいて、前記ニューラルネットワークの各層における前記重み係数を更新する、
ことを特徴とする画像処理方法。 - 請求項2において、
前記全体誤差を小さくするように、前記ニューラルネットワークの各層における前記重み係数を更新することを特徴とする画像処理方法。 - 請求項2又は3において、
前記第1画像拡張を決定する第1パラメータと、前記第2画像拡張を決定する第2パラメータの差異が所与の範囲内であることを特徴とする画像処理方法。 - 請求項4において、
前記出力誤差、又は、前記全体誤差を判定対象誤差とした場合に、
前記重み係数の更新処理による前記判定対象誤差の減少度合いに基づいて、前記所与の範囲が設定されることを特徴とする画像処理方法。 - 請求項5において、
前記出力誤差に基づいて、前記ニューラルネットワークの各層における前記重み係数を更新した場合の前記出力誤差の減少度合いと、
前記全体誤差に基づいて、前記ニューラルネットワークの各層における前記重み係数を更新した場合の前記判定対象誤差の減少度合いの比較処理に基づいて、前記所与の範囲が設定されることを特徴とする画像処理方法。 - 請求項1乃至6のいずれか一項において、
前記第1出力と前記第2出力の要素ごとに算出した二乗誤差、又は、前記第1出力と前記第2出力の前記要素ごとに算出したHuber誤差、又は、前記第1出力と前記第2出力の相互相関に基づいて、前記出力相違度を求めることを特徴とする画像処理方法。 - 請求項1乃至7のいずれか一項において、
前記第1画像拡張は、色補正処理、明度補正処理、平滑化処理、鮮鋭化処理、ノイズ付加処理、及び、アフィン変換処理の少なくとも1つの処理を含み、
前記第2画像拡張は、前記色補正処理、前記明度補正処理、前記平滑化処理、前記鮮鋭化処理、前記ノイズ付加処理、及び、前記アフィン変換処理の少なくとも1つの処理を含む、
ことを特徴とする画像処理方法。 - 請求項1乃至8のいずれか一項において、
前記入力画像のうちの一部の領域を画像拡張領域に設定し、
前記入力画像の前記画像拡張領域に前記第1画像拡張を適用することによって前記第1拡張画像を生成し、
前記入力画像の前記画像拡張領域に前記第2画像拡張を適用することによって前記第2拡張画像を生成する、
ことを特徴とする画像処理方法。 - 請求項9において、
前記入力画像のうち注目被写体を撮像した領域を注目領域とした場合に、
前記注目領域に基づいて前記画像拡張領域を設定することを特徴とする画像処理方法。 - 請求項1乃至10のいずれか一項において、
前記ニューラルネットワークは、畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)であることを特徴とする画像処理方法。 - 請求項1乃至11のいずれか一項において、
適用画像を入力し、
前記適用画像を前記ニューラルネットワークに入力することで、適用出力を生成し、
前記適用出力に基づいて、前記適用画像を対象とした認識処理を行う、
ことを特徴とする画像処理方法。 - 請求項1乃至12のいずれか一項において、
前記第1拡張画像を、前記ニューラルネットワークと一部の構造を共有する第2ニューラルネットワークに入力することによって第3出力を生成し、
前記第2拡張画像を、前記第2ニューラルネットワークに入力することによって第4出力を生成し、
前記第3出力と前記第4出力との相違度を示す第2出力相違度を算出し、
前記第2出力相違度に基づいて、前記ニューラルネットワークの各層における重み係数を更新する、
ことを特徴とする画像処理方法。 - ニューラルネットワークを用いた画像処理方法であって、
前記ニューラルネットワークは、一つの入力画像に対して複数の異なる画像拡張を適用することにより生成した複数の拡張画像を、前記ニューラルネットワークに入力したときに、複数の前記拡張画像に対応する複数の出力間の相違度を含む誤差を用いて学習されており、
第1適用画像を前記ニューラルネットワークに入力することによって、第1適用出力を生成し、
前記第1適用出力に基づいて第1認識結果を生成し、
第2適用画像を前記ニューラルネットワークに入力することによって、第2適用出力を生成し、
前記第2適用出力に基づいて第2認識結果を生成し、
前記第1適用画像と前記第2適用画像が対応する被写体を撮像しており、且つ、前記第1適用画像と前記第2適用画像との差異が、色合い、明るさ、及び、平滑化度合いの少なくとも1つの場合に、前記第1認識結果と前記第2認識結果とが同一となる、
ことを特徴とする画像処理方法。 - 入力画像を取得する取得部と、
前記入力画像に基づいて機械学習を行う処理部と、
を含み、
前記処理部は、
前記入力画像に第1画像拡張を適用することによって第1拡張画像を生成し、
前記入力画像に前記第1画像拡張と異なる第2画像拡張を適用することによって第2拡張画像を生成し、
前記第1拡張画像をニューラルネットワークに入力することによって第1出力を生成し、
前記第2拡張画像を前記ニューラルネットワークに入力することによって第2出力を生成し、
前記第1出力と前記第2出力との相違度を示す出力相違度を算出し、
前記出力相違度に基づいて、前記ニューラルネットワークの各層における重み係数を更新する、
ことを特徴とする学習装置。 - 学習済モデルを記憶する記憶部と、
前記学習済モデルに基づいて適用画像に対する画像処理を行う処理部と、
を含み、
前記学習済モデルは、
入力画像に第1画像拡張を適用することによって第1拡張画像を生成し、
前記入力画像に前記第1画像拡張と異なる第2画像拡張を適用することによって第2拡張画像を生成し、
前記第1拡張画像をニューラルネットワークに入力することによって第1出力を生成し、
前記第2拡張画像を前記ニューラルネットワークに入力することによって第2出力を生成し、
前記第1出力と前記第2出力との相違度を示す出力相違度を算出し、
前記出力相違度に基づいて、前記ニューラルネットワークの各層における重み係数を更新することによって学習されていることを特徴とする画像処理装置。 - 請求項16において、
前記処理部は、
内視鏡装置によって撮像された生体内画像を前記適用画像として取得し、前記生体内画像を前記学習済モデルに入力することによって、前記生体内画像を対象とした認識処理を行うことを特徴とする画像処理装置。 - 入力画像に第1画像拡張を適用することによって第1拡張画像を生成し、
前記入力画像に前記第1画像拡張と異なる第2画像拡張を適用することによって第2拡張画像を生成し、
前記第1拡張画像をニューラルネットワークに入力することによって第1出力を生成し、
前記第2拡張画像を前記ニューラルネットワークに入力することによって第2出力を生成し、
前記第1出力と前記第2出力との相違度を示す出力相違度を算出し、
前記出力相違度に基づいて、前記ニューラルネットワークの各層における重み係数を更新する、
ステップをコンピュータに実行させることを特徴とするプログラム。 - ニューラルネットワークを用いた処理をコンピュータに実行させるプログラムであって、
前記ニューラルネットワークは、一つの入力画像に対して複数の異なる画像拡張を適用することにより生成した複数の拡張画像を、前記ニューラルネットワークに入力したときに、複数の前記拡張画像に対応する複数の出力間の相違度を含む誤差を用いて学習されており、
第1適用画像を前記ニューラルネットワークに入力することによって、第1適用出力を生成し、
前記第1適用出力に基づいて第1認識結果を生成し、
第2適用画像を前記ニューラルネットワークに入力することによって、第2適用出力を生成し、
前記第2適用出力に基づいて第2認識結果を生成する、
ステップをコンピュータに実行させ、
前記第1適用画像と前記第2適用画像が対応する被写体を撮像しており、且つ、前記第1適用画像と前記第2適用画像との差異が、色合い、明るさ、及び、平滑化度合いの少なくとも1つの場合に、前記第1認識結果と前記第2認識結果とが同一となる、
ことを特徴とするプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/046692 WO2021106174A1 (ja) | 2019-11-29 | 2019-11-29 | 画像処理方法、学習装置及び画像処理装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2021106174A1 JPWO2021106174A1 (ja) | 2021-06-03 |
JPWO2021106174A5 true JPWO2021106174A5 (ja) | 2022-03-15 |
JP7231762B2 JP7231762B2 (ja) | 2023-03-01 |
Family
ID=76129456
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021561092A Active JP7231762B2 (ja) | 2019-11-29 | 2019-11-29 | 画像処理方法、学習装置、画像処理装置及びプログラム |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP7231762B2 (ja) |
CN (1) | CN114365180A (ja) |
WO (1) | WO2021106174A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11972225B2 (en) * | 2020-10-01 | 2024-04-30 | Shrey Pathak | Automated patent language generation |
CN115661758A (zh) * | 2022-11-15 | 2023-01-31 | 江西创成微电子有限公司 | 基于人工智能的公共场所人群密集度监测方法及其系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019003396A (ja) * | 2017-06-15 | 2019-01-10 | コニカミノルタ株式会社 | 目的物体検出装置、該方法およびプログラム |
JP6760318B2 (ja) * | 2018-03-14 | 2020-09-23 | オムロン株式会社 | 顔画像識別システム、識別器生成装置、識別装置、画像識別システム、及び識別システム |
-
2019
- 2019-11-29 JP JP2021561092A patent/JP7231762B2/ja active Active
- 2019-11-29 CN CN201980099911.5A patent/CN114365180A/zh active Pending
- 2019-11-29 WO PCT/JP2019/046692 patent/WO2021106174A1/ja active Application Filing
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6901802B2 (ja) | イメージ分析に基づいたロバストサーベイランスのための歩行者検出器の学習方法及び学習装置、そしてそれを利用するテスト方法及びテスト装置 | |
JP2019028843A (ja) | 人物の視線方向を推定するための情報処理装置及び推定方法、並びに学習装置及び学習方法 | |
CN106373105B (zh) | 基于低秩矩阵恢复的多曝光图像去伪影融合方法 | |
JP2019012426A5 (ja) | ||
JP2012066026A5 (ja) | ||
JPWO2021106174A5 (ja) | 画像処理方法、学習装置、画像処理装置及びプログラム | |
JP2015197702A5 (ja) | ||
JP2011004190A5 (ja) | ||
JP6860079B2 (ja) | 異常検知装置、異常検知方法、及びプログラム | |
JP2017010092A (ja) | 画像処理装置、撮像装置、画像処理方法、画像処理プログラム、および、記憶媒体 | |
CN111582220B (zh) | 一种基于移位图卷积神经网络骨骼点行为识别系统及其识别方法 | |
JP2014165874A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
WO2021106853A1 (ja) | 画像処理装置、画像処理方法、学習装置、学習方法、撮像装置、及びプログラム | |
JP2019175093A (ja) | 推定装置、推定方法、推定プログラム、学習装置、学習方法、及び学習プログラム | |
JP2019096222A5 (ja) | ||
JP6359985B2 (ja) | デプス推定モデル生成装置及びデプス推定装置 | |
JP5712925B2 (ja) | 画像変換パラメータ算出装置、画像変換パラメータ算出方法およびプログラム | |
JP7398938B2 (ja) | 情報処理装置およびその学習方法 | |
JP6997969B2 (ja) | 画像合成システム、画像合成方法、および画像合成プログラム記録媒体 | |
JP2023055848A5 (ja) | ||
CN110827211B (zh) | 一种图像细节增强方法 | |
Gay-Bellile et al. | Feature-driven direct non-rigid image registration | |
JP4534992B2 (ja) | 画素位置取得方法 | |
WO2017177363A1 (en) | Methods and apparatuses for face hallucination | |
JP6253992B2 (ja) | 臓器位置推定装置、臓器位置推定装置の制御方法および臓器位置推定装置の制御プログラム |