JP7005040B2 - 学習装置、推論装置、学習方法、プログラムおよび推論方法 - Google Patents
学習装置、推論装置、学習方法、プログラムおよび推論方法 Download PDFInfo
- Publication number
- JP7005040B2 JP7005040B2 JP2020079462A JP2020079462A JP7005040B2 JP 7005040 B2 JP7005040 B2 JP 7005040B2 JP 2020079462 A JP2020079462 A JP 2020079462A JP 2020079462 A JP2020079462 A JP 2020079462A JP 7005040 B2 JP7005040 B2 JP 7005040B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- machine learning
- learning model
- unit
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 53
- 238000010801 machine learning Methods 0.000 claims description 235
- 238000012545 processing Methods 0.000 claims description 98
- 230000008569 process Effects 0.000 claims description 39
- 230000006870 function Effects 0.000 claims description 28
- 238000004891 communication Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 15
- 238000013527 convolutional neural network Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000011176 pooling Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Description
本発明の実施の形態1に係る画像処理装置について図1乃至図3を参照して説明する。本実施の形態1において、画像処理装置は、αチャンネル付き画像データなどの所定の学習用画像データに基づいて機械学習モデルにおける設定値を学習する学習装置、及び機械学習モデルを用いて対象画像データに対して所定の推論処理を実行する推論装置の少なくとも一方としての機能を発揮する。
最初に、画像処理装置1に備わる各処理部に関して図1を参照しながら説明する。画像処理装置1は、図1に示すように、制御部10、画像処理部11、記憶部12、通信部13、表示部14、操作部15及び読取部16を備える。なお、画像処理装置1及び画像処理装置1における動作について以下では、1台のサーバコンピュータとして説明するが、複数のコンピュータによって処理を分散するようにして構成されてもよい。
通信部13は、インターネット等の通信網への通信接続を実現する通信モジュールである。通信部13は、ネットワークカード、無線通信デバイス又はキャリア通信用モジュールを用いる。
次に、画像処理装置1の機能に関して図面を参照しながら説明する。なお、画像データは3チャンネルで、RGBを例に挙げて説明するが、YCbCr等、他の画像データ形式のものであっても良い。
図2は本実施の形態1に係る画像処理装置の機能ブロックを示す図あり、図3は機械学習の全体フローを示す図、図4は実施の形態1における機械学習の詳細フローを示す図である。
次にαチャンネルを持つ画像データによる学習について、図3、図5及び図6を用いて説明する。図5は本実施の形態2に係る画像処理装置の機能ブロックを示す図、図6は実施の形態2における画像処理装置の学習動作時の動作を示すフローチャートである。上記実施の形態1に係る画像処理装置1と同様の構成については同様の符号を付し、その詳細な説明は省略する。
次にαチャンネルを持つ画像データによる学習を行う他の実施の形態について図3、図7、図8を用いて説明する。
次に推論時の画像処理装置1の機能に関して図面を参照しながら説明する。なお、画像データは3チャンネルで、RGBを例に挙げて説明するが、YCbCr等、他の画像データ形式のものであっても良い。
図9は図2および図7に示した機械学習モデルの推論時における機能ブロックを示した図、図10はそのフローである。なお、前述した実施の形態における各機能と同じ機能ブロックは同じ符号を付す。
次に実施形態2の機械学習モデルを用いた推論について説明する。図11は図5に示した機械学習モデルの推論時における機能ブロックを示した図であり、図12はそのフローである。また、図13はαチャンネルの推論処理における遷移を示すイメージ図であり、入力データの解像度を上げる処理を例示している。図5と図11とを対比すると、推論時は制御部10が学習処理実行部101に替えて推論処理実行部102を具備する点で学習時と相違する。また、推論時は、出力部117が画像データとαチャンネルの統合を行う機能を備えている点、および、出力部117に第二チャンネル数調整部を備えない点で学習時と異なり、他の機能は学習時と略同じである。
<第1態様>
本態様の学習装置は、所定の学習用画像データに基づいて機械学習モデルにおける設定値を学習する学習装置であって、学習用画像データの各チャンネルのうち少なくとも一部のチャンネルのデータ(色データ、α値)を反転させる反転部(色反転部121、α値反転部133)と、反転されたデータを機械学習モデル(第一機械学習モデル113、第二機械学習モデル115)に入力する入力部(111)と、機械学習モデルから出力されたデータを反転させたデータと教師データとを比較可能、または/および、機械学習モデルから出力されたデータと教師データを反転させたデータとを比較可能な出力部(117)と、比較の結果に応じて、設定値を学習する学習処理実行部(101)とを具備することを特徴とする。
本態様の学習装置は、反転部(α値反転部133)は、学習用画像データの各チャンネルのうちαチャンネルのデータ(α値)を反転することを特徴とする。本態様によれば、各画素の画素値の大きさの傾向が色データとα値とで反転する場合において、学習用画像データに含まれるα値を反転することにより、当該反転したα値に基づいて、推論時に色データが入力される機械学習モデル(第一機械学習モデル113)を学習可能である(図5の具体例および図7の具体例を参照)。したがって、効率的な機械学習が可能になる。
本態様の学習装置は、機械学習モデルは画素データ(色データ)および/または反転したαチャンネルのデータ(α値)を学習する第一機械学習モデル(113)と、色反転した画素データおよび/またはαチャンネルのデータを学習する第二機械学習モデル(115)のいずれか一方或いは両方とからなることを特徴とする。本態様によれば、例えば、第二機械学習モデルが設けられない構成と比較して、α値に対して適当な推論処理が実行できるという利点がある。
本態様の推論装置は、機械学習モデルを用いて所定の推論処理を実行する推論装置であって、対象画像データの各チャンネルのうちαチャンネルのデータ(α値)を反転させる反転部(α値反転部133)と、反転されたデータを機械学習モデル(第一機械学習モデル113)に入力する入力部(111)と、機械学習モデルに入力されたデータに対して推論処理を実行する推論処理実行部(102)と、推論処理が実行されたデータを反転させる再反転部(α値反転部133)とを具備することを特徴とする。
本態様の学習方法は、機械学習モデルにおける設定値の学習方法であって、所定の学習用画像データの各チャンネルのうち少なくとも一部のチャンネルのデータを反転させ(図4のS109、図6のS131、図8のS161、図8のS170)、反転されたデータを機械学習モデルに入力し(図4のS110、図6のS133、図8のS162、図8のS172)、機械学習モデルから出力されたデータを反転させたデータと教師データとを比較(図4のS113、図8のS165、図8のS176)、または/および、機械学習モデルから出力されたデータと教師データを反転させたデータとを比較(図6のS137)し、比較の結果に応じて、設定値を学習する(図4のS114、図6のS138、図8のS158)ことを特徴とする。本態様によれば、第1態様と同様な効果が奏せられる。
本態様のプログラムは、所定の学習用画像データに基づいて機械学習モデルにおける設定値を学習する学習装置のコンピュータを、学習用画像データの各チャンネルのうち少なくとも一部のチャンネルのデータ(色データまたはα値)を反転させる反転部(α値反転部133、色反転部121)と、反転されたデータを機械学習モデル(第一機械学習モデル113、第二機械学習モデル115)に入力する入力部(111)と、機械学習モデルから出力されたデータを反転させたデータと教師データとを比較可能、または/および、機械学習モデルから出力されたデータと教師データを反転させたデータとを比較可能な出力部(117)と、比較の結果に応じて、設定値を学習する学習処理実行部(101)として機能させることを特徴とする。本態様によれば、第1態様と同様な効果が奏せられる。
本態様の推論装置は、機械学習モデルを用いて所定の推論処理を実行する推論方法であって、対象画像データの各チャンネルのうちαチャンネルのデータ(α値)を反転させ(図12のS229)、反転されたデータを機械学習モデル(第一機械学習モデル113)に入力し、機械学習モデルに入力されたデータに対して推論処理を実行し(図12のS231)、推論処理が実行されたデータを反転させる(図12のS234)ことを特徴とする。本態様によれば、第4態様と同様な効果が奏せられる。
本態様のプログラムは、機械学習モデルを用いて所定の推論処理を実行する推論装置のコンピュータを、対象画像データの各チャンネルのうちαチャンネルのデータ(α値)を反転させる反転部(α値反転部133)と、反転されたデータを機械学習モデル(第一機械学習モデル113)に入力する入力部(111)と、機械学習モデルに入力されたデータに対して推論処理を実行する推論処理実行部(102)と、推論処理が実行されたデータを反転させる再反転部(α値反転部133)として機能させることを特徴とする。本態様によれば、第4態様と同様な効果が奏せられる。
12 記憶部
101 学習処理実行部
102 推論処理実行部
111 入力部
113 第一機械学習モデル
115 第二機械学習モデル
117 出力部
119 第一チャンネル数調整部
120 第二チャンネル数調整部
121 色反転部
131 αチャンネル判定部
133 α値反転部
Claims (8)
- 所定の学習用画像データに基づいて機械学習モデルにおける設定値を学習する学習装置であって、
前記学習用画像データの各チャンネルのうち少なくとも一部のチャンネルのデータを反転させる反転部と、
前記反転されたデータを前記機械学習モデルに入力する入力部と、
前記機械学習モデルから出力されたデータを反転させたデータと教師データとを比較可能、または/および、前記機械学習モデルから出力されたデータと教師データを反転させたデータとを比較可能な出力部と、
前記比較の結果に応じて、前記設定値を学習する学習処理実行部と
を具備することを特徴とする学習装置。 - 前記反転部は、前記学習用画像データの各チャンネルのうちαチャンネルのデータを反転することを特徴とする請求項1に記載の学習装置。
- 前記機械学習モデルは画素データおよび/または反転したαチャンネルのデータを学習する第一機械学習モデルと、
色反転した画素データおよび/またはαチャンネルのデータを学習する第二機械学習モデルのいずれか一方或いは両方とからなることを特徴とする請求項1または2に記載の学習装置。 - 機械学習モデルを用いて所定の推論処理を実行する推論装置であって、
対象画像データの各チャンネルのうちαチャンネルのデータを反転させる反転部と、
前記反転されたデータを前記機械学習モデルに入力する入力部と、
前記機械学習モデルに入力されたデータに対して前記推論処理を実行する推論処理実行部と、
前記推論処理が実行されたデータを反転させる再反転部と
を具備することを特徴とする推論装置。 - 機械学習モデルにおける設定値の学習方法であって、
所定の学習用画像データの各チャンネルのうち少なくとも一部のチャンネルのデータを反転させ、
前記反転されたデータを前記機械学習モデルに入力し、
前記機械学習モデルから出力されたデータを反転させたデータと教師データとを比較、または/および、前記機械学習モデルから出力されたデータと教師データを反転させたデータとを比較し、
前記比較の結果に応じて、前記設定値を学習する
ことを特徴とするコンピュータにより実現される学習方法。 - 所定の学習用画像データに基づいて機械学習モデルにおける設定値を学習する学習装置のコンピュータを、
前記学習用画像データの各チャンネルのうち少なくとも一部のチャンネルのデータを反転させる反転部と、
前記反転されたデータを前記機械学習モデルに入力する入力部と、
前記機械学習モデルから出力されたデータを反転させたデータと教師データとを比較可能、または/および、前記機械学習モデルから出力されたデータと教師データを反転させたデータとを比較可能な出力部と、
前記比較の結果に応じて、前記設定値を学習する学習処理実行部として機能させることを特徴とするプログラム。 - 機械学習モデルを用いて所定の推論処理を実行する推論方法であって、
対象画像データの各チャンネルのうちαチャンネルのデータを反転させ、
前記反転されたデータを前記機械学習モデルに入力し、
前記機械学習モデルに入力されたデータに対して前記推論処理を実行し、
前記推論処理が実行されたデータを反転させる
ことを特徴とするコンピュータにより実現される推論方法。 - 機械学習モデルを用いて所定の推論処理を実行する推論装置のコンピュータを、
対象画像データの各チャンネルのうちαチャンネルのデータを反転させる反転部と、
前記反転されたデータを前記機械学習モデルに入力する入力部と、
前記機械学習モデルに入力されたデータに対して前記推論処理を実行する推論処理実行部と、
前記推論処理が実行されたデータを反転させる再反転部として機能させることを特徴とするプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/917,356 US11615609B2 (en) | 2019-07-01 | 2020-06-30 | Learning apparatus, inferring apparatus, learning method, program, and inferring method |
JP2021209174A JP7321579B2 (ja) | 2019-07-01 | 2021-12-23 | 学習装置、推論装置、学習方法、推論方法、コンピュータシステムおよびプログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019123289 | 2019-07-01 | ||
JP2019123289 | 2019-07-01 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021209174A Division JP7321579B2 (ja) | 2019-07-01 | 2021-12-23 | 学習装置、推論装置、学習方法、推論方法、コンピュータシステムおよびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021009686A JP2021009686A (ja) | 2021-01-28 |
JP7005040B2 true JP7005040B2 (ja) | 2022-01-21 |
Family
ID=74198660
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020079462A Active JP7005040B2 (ja) | 2019-07-01 | 2020-04-28 | 学習装置、推論装置、学習方法、プログラムおよび推論方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7005040B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018038789A (ja) | 2016-09-02 | 2018-03-15 | カシオ計算機株式会社 | 診断支援装置、及び診断支援装置における画像処理方法、並びにプログラム |
JP2019087072A (ja) | 2017-11-08 | 2019-06-06 | 株式会社アクセル | 処理装置、推論装置、学習装置、処理システム、処理方法、及び処理プログラム |
-
2020
- 2020-04-28 JP JP2020079462A patent/JP7005040B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018038789A (ja) | 2016-09-02 | 2018-03-15 | カシオ計算機株式会社 | 診断支援装置、及び診断支援装置における画像処理方法、並びにプログラム |
JP2019087072A (ja) | 2017-11-08 | 2019-06-06 | 株式会社アクセル | 処理装置、推論装置、学習装置、処理システム、処理方法、及び処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2021009686A (ja) | 2021-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9552656B2 (en) | Image-based color palette generation | |
US9741137B2 (en) | Image-based color palette generation | |
US8553045B2 (en) | System and method for image color transfer based on target concepts | |
US8508546B2 (en) | Image mask generation | |
CN110088799B (zh) | 图像处理设备和图像处理方法 | |
US10614347B2 (en) | Identifying parameter image adjustments using image variation and sequential processing | |
US20200210783A1 (en) | Learning Method, Computer Program, Classifier, And Generator | |
CN112149635A (zh) | 跨模态人脸识别模型训练方法、装置、设备以及存储介质 | |
CN113012188A (zh) | 图像融合方法、装置、计算机设备和存储介质 | |
JP7321579B2 (ja) | 学習装置、推論装置、学習方法、推論方法、コンピュータシステムおよびプログラム | |
Liu et al. | Image-Driven Harmonious Color Palette Generation for Diverse Information Visualization | |
CN109891459B (zh) | 图像处理装置及图像处理方法 | |
JP7005040B2 (ja) | 学習装置、推論装置、学習方法、プログラムおよび推論方法 | |
US10997947B2 (en) | Electronic device and control method thereof | |
CN111989917B (zh) | 电子设备及其控制方法 | |
GB2587833A (en) | Image modification styles learned from a limited set of modified images | |
US11687782B2 (en) | Systems and methods for recognition of user-provided images | |
CN115605913A (zh) | 图像处理装置、图像处理方法、学习装置、生成方法以及程序 | |
CN116134810A (zh) | 电子装置及其控制方法 | |
JP7100783B1 (ja) | 学習装置及び推論装置 | |
JP7402552B2 (ja) | 学習装置及び推論装置 | |
KR102446711B1 (ko) | 상품 이미지 생성 모델, 상품 이미지 생성 모델을 이용하여 상품 이미지를 생성하는 방법 및 상품 이미지 생성 장치 | |
US20240135672A1 (en) | Generative model for multi-modality outputs from a single input | |
KR20230068894A (ko) | 디스플레이 장치 및 그 동작방법 | |
US20220092363A1 (en) | Information processing apparatus and non-transitory computer readable medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201207 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211223 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7005040 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |