JP6158882B2 - 生成装置、生成方法、及び生成プログラム - Google Patents
生成装置、生成方法、及び生成プログラム Download PDFInfo
- Publication number
- JP6158882B2 JP6158882B2 JP2015184742A JP2015184742A JP6158882B2 JP 6158882 B2 JP6158882 B2 JP 6158882B2 JP 2015184742 A JP2015184742 A JP 2015184742A JP 2015184742 A JP2015184742 A JP 2015184742A JP 6158882 B2 JP6158882 B2 JP 6158882B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- generation
- processing
- intermediate image
- recognition rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 55
- 238000012545 processing Methods 0.000 claims description 67
- 239000002131 composite material Substances 0.000 claims description 51
- 239000000284 extract Substances 0.000 claims description 37
- 230000008569 process Effects 0.000 claims description 29
- 238000000605 extraction Methods 0.000 claims description 28
- 238000013528 artificial neural network Methods 0.000 claims description 21
- 230000008859 change Effects 0.000 claims description 20
- 238000011176 pooling Methods 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 46
- 238000003860 storage Methods 0.000 description 30
- 230000006870 function Effects 0.000 description 21
- 238000013527 convolutional neural network Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000006872 improvement Effects 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 230000010365 information processing Effects 0.000 description 6
- 101000821981 Homo sapiens Sarcoma antigen 1 Proteins 0.000 description 3
- 102100021466 Sarcoma antigen 1 Human genes 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000009966 trimming Methods 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 210000000225 synapse Anatomy 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Description
〔1.生成処理〕
まず、図1を用いて、実施形態に係る生成処理の一例について説明する。図1は、実施形態に係る生成処理の一例を示す図である。図1に示す生成装置100は、画像に含まれる所定の対象を認識し、その所定の対象が含まれる領域に基づいて画像を加工する。具体的には、生成装置100は、画像に含まれる犬の顔を認識し、画像中の犬の顔が含まれる領域をトリミングする。また、生成装置100がトリミングにより生成した画像は、例えば所定のコンテンツの画像として配信されるが、詳細は後述する。
次に、図2を用いて、実施形態に係る生成装置100の構成について説明する。図2は、実施形態に係る生成装置100の構成例を示す図である。図2に示すように、生成装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、生成装置100は、生成装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続され、端末装置10との間で情報の送受信を行う。
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、図2に示すように、学習情報記憶部121と、画像情報記憶部122とを有する。
実施形態に係る学習情報記憶部121は、学習に関する各種情報を記憶する。例えば、図3では、学習情報記憶部121は、所定の学習処理により生成された学習器LEに関する学習情報(モデル)を記憶する。図3に、実施形態に係る学習情報記憶部121の一例を示す。図3に示す学習情報記憶部121は、「重み(wij)」を記憶する。
実施形態に係る画像情報記憶部122は、画像に関する各種情報を記憶する。図4に、実施形態に係る画像情報記憶部122の一例を示す。図4に示す画像情報記憶部122は、「画像ID」、「画像」といった項目を有する。
図2の説明に戻って、制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、生成装置100内部の記憶装置に記憶されている各種プログラム(生成プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
取得部131は、画像を取得する。例えば、取得部131は、外部の情報処理装置から画像を取得する。図1では、取得部131は、外部の情報処理装置から画像IM11を取得する。なお、画像情報記憶部122に元となる画像(例えば、画像IM11)が記憶される場合、取得部131は、画像情報記憶部122から画像(例えば、画像IM11)を取得してもよい。
抽出部132は、画像中の所定の対象を認識するニューラルネットワークの中間層における中間画像群から、所定の対象の認識率向上に寄与する中間画像を抽出する。例えば、抽出部132は、画像に含まれる犬を認識するニューラルネットワークの中間層における中間画像群から、犬の認識率向上に寄与する中間画像を抽出する。また、例えば、抽出部132は、畳み込み処理及びプーリング処理を行うニューラルネットワークの中間層における中間画像群から、所定の対象の認識率向上に寄与する中間画像を抽出する。例えば、抽出部132は、CNNの中間層における中間画像群から、所定の対象の認識率向上に寄与する中間画像を抽出する。
生成部133は、抽出部132により抽出された中間画像を合成した合成画像を生成する。例えば、生成部133は、加工による所定の対象の認識率の変化に応じて重み付けした中間画像を合成した合成画像を生成する。例えば、生成部133は、上記式(2)を用いて、加工による所定の対象の認識率の変化に応じて重み付けした中間画像を合成した合成画像を生成する。図1では、生成部133は、中間画像MM12、MM14、MM17、MM18を合成した合成画像CM11を生成する。
加工部134は、合成画像に基づいて、画像から所定の対象が含まれる領域の画像を取り出す。例えば、加工部134は、合成画像に基づいて、画像から犬の顔が含まれる領域の画像を取り出す。図1では、加工部134は、合成画像CM11を用いて特定された画像IM11の特徴、すなわち犬の顔を含む領域AR11をトリミングする。例えば、加工部134は、画像IM11のうち犬の顔を含む領域AR11をトリミングする。これにより、加工部134は、犬の顔を含む加工画像IM12を生成する。
送信部135は、外部の情報処理装置へ各種情報を送信する。例えば、送信部135は、加工部134により生成された画像を外部の情報処理装置へ送信する。図1では、送信部135は、加工画像IM12を配信する。また、送信部135は、生成装置100がコンテンツを配信する場合、コンテンツを要求した端末装置へ加工画像IM12を含むコンテンツを送信してもよい。
ここで、図5を用いて、実施形態に係る生成装置100による中間画像の取得処理の手順について説明する。図5は、実施形態に係る中間画像群の取得の一例を示すフローチャートである。
次に、図6を用いて、実施形態に係る生成装置100による合成画像の生成処理の手順について説明する。図6は、実施形態に係る合成画像の生成の一例を示すフローチャートである。
次に、図7を用いて、実施形態に係る生成装置100による合成画像を用いた画像の加工処理の手順について説明する。図7は、実施形態に係る画像の加工の一例を示すフローチャートである。
次に、図8を用いて、生成装置100により生成された加工画像IM12の表示例を示す。図8は、実施形態に係る端末装置における加工画像の表示例を示す図である。
上述してきたように、実施形態に係る生成装置100は、抽出部132と、生成部133とを有する。抽出部132は、画像中の所定の対象を認識するニューラルネットワークの中間層における中間画像群から、所定の対象の認識率向上に寄与する中間画像を抽出する。生成部133は、抽出部132により抽出された中間画像を合成した合成画像を生成する。
上述してきた実施形態に係る生成装置100は、例えば図9に示すような構成のコンピュータ1000によって実現される。図9は、生成装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
121 学習情報記憶部
122 画像情報記憶部
130 制御部
131 取得部
132 抽出部
133 生成部
134 加工部
135 送信部
Claims (8)
- 画像中の所定の対象を認識するニューラルネットワークの中間層における中間画像群から、前記中間画像群に含まれる中間画像の各々への加工に応じた前記所定の対象の認識率の変化に基づいて、前記所定の対象の認識率向上に寄与する中間画像を抽出する抽出部と、
前記抽出部により抽出された前記中間画像を合成した合成画像を生成する生成部と、
を備えることを特徴とする生成装置。 - 前記抽出部は、
前記加工により前記所定の対象の認識率を向上させる前記中間画像を抽出する
ことを特徴とする請求項1に記載の生成装置。 - 前記生成部は、
前記加工による前記所定の対象の認識率の変化に応じて重み付けした前記中間画像を合成した合成画像を生成する
ことを特徴とする請求項1または請求項2に記載の生成装置。 - 前記生成部により生成された前記合成画像に基づいて、前記画像を加工する加工部、
をさらに備えることを特徴とする請求項1〜3のいずれか1項に記載の生成装置。 - 前記加工部は、
前記合成画像に基づいて、前記画像から前記所定の対象が含まれる領域の画像を取り出す
ことを特徴とする請求項4に記載の生成装置。 - 前記抽出部は、
畳み込み処理及びプーリング処理を行うニューラルネットワークの中間層における中間画像群から、前記所定の対象の認識率向上に寄与する中間画像を抽出する
ことを特徴とする請求項1〜5のいずれか1項に記載の生成装置。 - コンピュータが実行する生成方法であって、
画像中の所定の対象を認識するニューラルネットワークの中間層における中間画像群から、前記中間画像群に含まれる中間画像の各々への加工に応じた前記所定の対象の認識率の変化に基づいて、前記所定の対象の認識率向上に寄与する中間画像を抽出する抽出工程と、
前記抽出工程により抽出された前記中間画像を合成した合成画像を生成する生成工程と、
を含むことを特徴とする生成方法。 - 画像中の所定の対象を認識するニューラルネットワークの中間層における中間画像群から、前記中間画像群に含まれる中間画像の各々への加工に応じた前記所定の対象の認識率の変化に基づいて、前記所定の対象の認識率向上に寄与する中間画像を抽出する抽出手順と、
前記抽出手順により抽出された前記中間画像を合成した合成画像を生成する生成手順と、
をコンピュータに実行させることを特徴とする生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015184742A JP6158882B2 (ja) | 2015-09-18 | 2015-09-18 | 生成装置、生成方法、及び生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015184742A JP6158882B2 (ja) | 2015-09-18 | 2015-09-18 | 生成装置、生成方法、及び生成プログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017051067A Division JP6214073B2 (ja) | 2017-03-16 | 2017-03-16 | 生成装置、生成方法、及び生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017059090A JP2017059090A (ja) | 2017-03-23 |
JP6158882B2 true JP6158882B2 (ja) | 2017-07-05 |
Family
ID=58391649
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015184742A Active JP6158882B2 (ja) | 2015-09-18 | 2015-09-18 | 生成装置、生成方法、及び生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6158882B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7146372B2 (ja) * | 2017-06-21 | 2022-10-04 | キヤノン株式会社 | 画像処理装置、撮像装置、画像処理方法、プログラム、および、記憶媒体 |
JP6352512B1 (ja) * | 2017-08-22 | 2018-07-04 | 株式会社 ディー・エヌ・エー | 信号処理装置、信号処理方法、信号処理プログラム、及びデータ構造 |
JP6554193B1 (ja) | 2018-01-30 | 2019-07-31 | 三菱電機インフォメーションシステムズ株式会社 | 記入領域抽出装置および記入領域抽出プログラム |
JP6757349B2 (ja) | 2018-03-12 | 2020-09-16 | 株式会社東芝 | 固定小数点を用いて認識処理を行う多層の畳み込みニューラルネットワーク回路を実現する演算処理装置 |
JP7135504B2 (ja) * | 2018-07-02 | 2022-09-13 | カシオ計算機株式会社 | 画像識別装置、画像識別方法及びプログラム |
JP7055769B2 (ja) * | 2019-04-23 | 2022-04-18 | 株式会社東芝 | データ生成装置、データ生成方法およびプログラム |
JP7179705B2 (ja) * | 2019-09-09 | 2022-11-29 | ヤフー株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
JPWO2023157439A1 (ja) * | 2022-02-18 | 2023-08-24 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0447474A (ja) * | 1990-06-14 | 1992-02-17 | Canon Inc | ニューラルネットワークを用いた画像処理方式 |
JPH05101187A (ja) * | 1991-10-09 | 1993-04-23 | Kawasaki Steel Corp | 画像認識装置及びその学習方法 |
JPH0830728A (ja) * | 1994-07-12 | 1996-02-02 | Suzuki Motor Corp | 画像の二値化装置 |
JP5997545B2 (ja) * | 2012-08-22 | 2016-09-28 | キヤノン株式会社 | 信号処理方法及び信号処理装置 |
JP6137916B2 (ja) * | 2013-04-01 | 2017-05-31 | キヤノン株式会社 | 信号処理装置、信号処理方法、及び、信号処理システム |
-
2015
- 2015-09-18 JP JP2015184742A patent/JP6158882B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017059090A (ja) | 2017-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6158882B2 (ja) | 生成装置、生成方法、及び生成プログラム | |
CN108140032B (zh) | 用于自动视频概括的设备和方法 | |
US10726304B2 (en) | Refining synthetic data with a generative adversarial network using auxiliary inputs | |
JP6843086B2 (ja) | 画像処理システム、画像においてマルチラベル意味エッジ検出を行う方法、および、非一時的コンピューター可読記憶媒体 | |
US10534981B2 (en) | Media content analysis system and method | |
JP6099793B2 (ja) | 1つ以上の画像処理アルゴリズムの自動選択のための方法およびシステム | |
JP6458394B2 (ja) | 対象追跡方法及び対象追跡装置 | |
JP6960722B2 (ja) | 生成装置、生成方法、及び生成プログラム | |
US9299004B2 (en) | Image foreground detection | |
KR102008290B1 (ko) | 영상에서 객체의 행동을 인식하는 방법 및 그 장치 | |
US10019823B2 (en) | Combined composition and change-based models for image cropping | |
US9779329B2 (en) | Image processing apparatus, image processing method and program | |
US11620480B2 (en) | Learning method, computer program, classifier, and generator | |
CN110909868A (zh) | 基于图神经网络模型的节点表示方法和装置 | |
JP2023502140A (ja) | タスク固有のデータ利用のための物理学により誘導されたディープマルチモーダル埋め込みのための方法及び装置 | |
JP6214073B2 (ja) | 生成装置、生成方法、及び生成プログラム | |
JP6389742B2 (ja) | 画像セグメンテーション方法、装置、及びプログラム | |
JP2013120441A (ja) | 画像識別情報付与プログラム及び画像識別情報付与装置 | |
Sharjeel et al. | Real time drone detection by moving camera using COROLA and CNN algorithm | |
WO2024145343A1 (en) | Avatar generation according to artistic styles | |
JP7054603B2 (ja) | 判定装置、判定方法、及び判定プログラム | |
CN111435457B (zh) | 对传感器获取的采集进行分类的方法 | |
WO2020170803A1 (ja) | 拡張装置、拡張方法及び拡張プログラム | |
JP2014149788A (ja) | 物体領域境界推定装置、物体領域境界推定方法及び物体領域境界推定プログラム | |
KR101592087B1 (ko) | 배경 영상의 위치를 이용한 관심맵 생성 방법 및 이를 기록한 기록 매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20161220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170316 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20170328 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170509 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170608 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6158882 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |