JP6991960B2 - 画像認識装置、画像認識方法及びプログラム - Google Patents
画像認識装置、画像認識方法及びプログラム Download PDFInfo
- Publication number
- JP6991960B2 JP6991960B2 JP2018246993A JP2018246993A JP6991960B2 JP 6991960 B2 JP6991960 B2 JP 6991960B2 JP 2018246993 A JP2018246993 A JP 2018246993A JP 2018246993 A JP2018246993 A JP 2018246993A JP 6991960 B2 JP6991960 B2 JP 6991960B2
- Authority
- JP
- Japan
- Prior art keywords
- filter
- group
- filters
- subject
- stage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Description
実施の形態に係る画像認識装置は、ニューラルネットワークの機械学習モデルを用いた画像認識処理を実行するための装置である。実施の形態に係る画像認識装置は、主な一例として、畳込みニューラルネットワーク(Convolutional Neural Network;CNN)の機械学習モデルを用いる。そこで、実施の形態に係る情報処理装置の前提技術として、まず畳込みニューラルネットワークについて簡単に説明する。
図3は、実施の形態に係る画像認識装置が用いる畳込みニューラルネットワークNの層構造を模式的に示す図である。以下、図3を参照して、実施の形態に係るニューラルネットワークNについて説明する。
まず、実施の形態に係るニューラルネットワークNの学習過程について説明する。
続いて、実施の形態に係るニューラルネットワークNの学習過程について説明する。
図6は、実施の形態に係る画像認識装置1の機能構成を模式的に示す図である。画像認識装置1は、記憶部2と制御部3とを備える。図6において、矢印は主なデータの流れを示しており、図6に示していないデータの流れがあってもよい。図6において、各機能ブロックはハードウェア(装置)単位の構成ではなく、機能単位の構成を示している。そのため、図6に示す機能ブロックは単一の装置内に実装されてもよく、あるいは複数の装置内に分かれて実装されてもよい。機能ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてもよい。
続いて、実施の形態に係る画像認識装置1におけるフィルタ選択処理を説明する。
ステップ2:優先度設定部37は、p番目の被写体グループのテストデータTpを取得する。
ステップ3:優先度設定部37は、前段フィルタ群と全ての後段フィルタ群とをテストデータTpに適用し、認識率Rpを算出する。
ステップ5:優先度設定部37は、後段フィルタ群に含まれるフィルタの中からフィルタfqを除外して適用した場合のテストデータTpの認識率Rpqを算出する。
ステップ6:優先度設定部37は、認識率Rpから認識率Rpqを減算した値である認識率の低下量Cqを算出する。低下量Cqはフィルタfqを除外したことによる認識率の低下量を示している。すなわち、認識率に対するフィルタfqの貢献度を示している。
ステップ8:qがQを超えるまで、優先度設定部37はステップ4及びステップ5の処理を繰り返す。
ステップ9:優先度設定部37は、Q個の低下量Cqを大きい順に並べ替える。このとき低下量Cqの添字qの順序が、p番目の被写体グループにおけるフィルタfqの重要製の順序Wpqとなる。
スタップ11:pがPを超えるまで、優先度設定部37はステップ2からステップ8までの処理を繰り返す。
図9は、実施の形態に係る画像認識装置1が実行する画像認識処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば画像認識装置1が起動したときに開始する。
以上説明したように、実施の形態に係る画像認識装置1によれば、ニューラルネットワークの機械学習モデルを用いた画像認識処理において、処理負荷を軽減することができる。
2・・・記憶部
3・・・制御部
30・・・画像取得部
31・・・モデル取得部
32・・・グループ認識部
33・・・フィルタ選択部
34・・・個別認識部
35・・・リソース取得部
36・・・重み指標算出部
37・・・優先度設定部
38・・・類似度算出部
39・・・学習部
390・・・前段学習部
391・・・後段学習部
N・・・畳込みニューラルネットワーク
Claims (9)
- 複数のフィルタをモデルパラメータとして含む機械学習モデルであって、処理対象の画像データに含まれる被写体が、あらかじめ定められた複数の認識対象のうちいずれの認識対象であるかを示す情報を出力する機械学習モデルを取得するモデル取得部と、
前記複数のフィルタのうち、前記画像データに含まれる被写体があらかじめ定められた複数の被写体グループのうちいずれの被写体グループに属すかを認識するための前段フィルタ群を前記画像データに適用することにより、前記被写体グループを特定するグループ認識部と、
前記前段フィルタ群の適用結果と、前記複数のフィルタのうち前記前段フィルタ群を除いたフィルタ群である後段フィルタ群の適用結果とに基づいて、前記画像データに含まれる認識対象を特定する個別認識部と、
前記グループ認識部が特定した被写体グループと、前記後段フィルタ群を構成する各フィルタに設定されている優先度とに少なくとも基づいて、前記後段フィルタ群のうち前記個別認識部に適用させるフィルタを選択するフィルタ選択部と、
を備える画像認識装置。 - 前記フィルタ選択部は、前記画像認識装置の計算リソースが許容する範囲において、前記後段フィルタ群を構成する各フィルタに設定されている優先度の高い順に前記個別認識部に適用させるフィルタを選択する、
請求項1に記載の画像認識装置。 - 前記複数のフィルタそれぞれの重み係数の大きさを示す指標を算出する重み指標算出部と、
前記指標によって重み係数が大きいことを示しているフィルタには、重み係数が小さいことを示しているフィルタよりも、前記優先度を高く設定する優先度設定部と、
をさらに備える請求項1又は2に記載の画像認識装置。 - 前記複数のフィルタそれぞれについて他のフィルタとの類似度を算出する類似度算出部と、
他に類似するフィルタが存在しないフィルタには、他に類似するフィルタが存在するフィルタよりも、前記優先度を高く設定する優先度設定部と、をさらに備える、
請求項1から3のいずれか1項に記載の画像認識装置。 - 前記優先度設定部は、前記複数の被写体グループ毎に、前記後段フィルタ群を構成する各フィルタに設定する優先度を変更する、
請求項3又は4に記載の画像認識装置。 - 前記フィルタ選択部は、前記後段フィルタ群を構成する2以上のフィルタそれぞれに等しい優先度が設定されている場合、等しい優先度が設定されたフィルタから無作為にフィルタを選択する、
請求項1から5のいずれか1項に記載の画像認識装置。 - 複数の画像データと、前記複数の画像データそれぞれに含まれる被写体と、当該被写体の被写体グループとが関連付けられた学習データに基づいて、ニューラルネットワークを用いた機械学習によって前記機械学習モデルを生成する学習部をさらに備え、
前記学習部は、
前記前段フィルタ群を生成する前段学習部と、
前記前段学習部が前記前段フィルタ群を生成した後に、前記前段フィルタ群への誤差逆伝搬を行わずに前記前段フィルタ群の適用結果を用いて前記後段フィルタ群を生成する後段学習部と、を備える、
請求項1から6のいずれか1項に記載の画像認識装置。 - プロセッサが、
複数のフィルタをモデルパラメータとして含む機械学習モデルであって、処理対象の画像データに含まれる被写体が、あらかじめ定められた複数の認識対象のうちいずれの認識対象であるかを示す情報を出力する機械学習モデルを取得するステップと、
前記複数のフィルタのうち、前記画像データに含まれる被写体があらかじめ定められた複数の被写体グループのうちいずれの被写体グループに属すかを認識するための前段フィルタ群を前記画像データに適用することにより、前記被写体グループを特定するステップと、
特定した前記被写体グループと、前記複数のフィルタのうち前記前段フィルタ群を除いたフィルタ群である後段フィルタ群を構成する各フィルタに設定されている優先度とに少なくとも基づいて、前記後段フィルタ群を構成するフィルタの中から1以上のフィルタを選択するステップと、
前記前段フィルタ群の適用結果と、選択した前記フィルタの適用結果とに基づいて、前記画像データに含まれる認識対象を特定するステップと、
を実行する画像認識方法。 - コンピュータに、
複数のフィルタをモデルパラメータとして含む機械学習モデルであって、処理対象の画像データに含まれる被写体が、あらかじめ定められた複数の認識対象のうちいずれの認識対象であるかを示す情報を出力する機械学習モデルを取得する機能と、
前記複数のフィルタのうち、前記画像データに含まれる被写体があらかじめ定められた複数の被写体グループのうちいずれの被写体グループに属すかを認識するための前段フィルタ群を前記画像データに適用することにより、前記被写体グループを特定する機能と、
特定した前記被写体グループと、前記複数のフィルタのうち前記前段フィルタ群を除いたフィルタ群である後段フィルタ群を構成する各フィルタに設定されている優先度とに少なくとも基づいて、前記後段フィルタ群を構成するフィルタの中から1以上のフィルタを選択する機能と、
前記前段フィルタ群の適用結果と、選択した前記フィルタの適用結果とに基づいて、前記画像データに含まれる認識対象を特定する機能と、
を実現させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018246993A JP6991960B2 (ja) | 2018-12-28 | 2018-12-28 | 画像認識装置、画像認識方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018246993A JP6991960B2 (ja) | 2018-12-28 | 2018-12-28 | 画像認識装置、画像認識方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020107185A JP2020107185A (ja) | 2020-07-09 |
JP6991960B2 true JP6991960B2 (ja) | 2022-01-13 |
Family
ID=71449279
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018246993A Active JP6991960B2 (ja) | 2018-12-28 | 2018-12-28 | 画像認識装置、画像認識方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6991960B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7401688B2 (ja) | 2020-09-08 | 2023-12-19 | 楽天グループ株式会社 | 画像判定装置、画像判定方法及びプログラム |
US11692769B2 (en) * | 2020-11-17 | 2023-07-04 | Haier Us Appliance Solutions, Inc. | Inventory management system for a refrigerator appliance |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017084320A (ja) | 2015-03-06 | 2017-05-18 | パナソニックIpマネジメント株式会社 | 学習方法およびプログラム |
JP2017538195A (ja) | 2014-10-27 | 2017-12-21 | イーベイ インク.Ebay Inc. | 階層深層畳み込みニューラルネットワーク |
JP2019511777A (ja) | 2016-03-11 | 2019-04-25 | マジック リープ, インコーポレイテッドMagic Leap,Inc. | 畳み込みニューラルネットワークにおける構造学習 |
-
2018
- 2018-12-28 JP JP2018246993A patent/JP6991960B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017538195A (ja) | 2014-10-27 | 2017-12-21 | イーベイ インク.Ebay Inc. | 階層深層畳み込みニューラルネットワーク |
JP2017084320A (ja) | 2015-03-06 | 2017-05-18 | パナソニックIpマネジメント株式会社 | 学習方法およびプログラム |
JP2019511777A (ja) | 2016-03-11 | 2019-04-25 | マジック リープ, インコーポレイテッドMagic Leap,Inc. | 畳み込みニューラルネットワークにおける構造学習 |
Also Published As
Publication number | Publication date |
---|---|
JP2020107185A (ja) | 2020-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI689871B (zh) | 梯度提升決策樹(gbdt)模型的特徵解釋方法和裝置 | |
US20190180176A1 (en) | Concurrent training of functional subnetworks of a neural network | |
JP7376731B2 (ja) | 画像認識モデル生成方法、装置、コンピュータ機器及び記憶媒体 | |
KR20180063189A (ko) | 선택적 역전파 | |
JP5880454B2 (ja) | 画像識別装置及びプログラム | |
TWI726420B (zh) | 叢集結果的解釋方法和裝置 | |
CN113168559A (zh) | 机器学习模型的自动化生成 | |
CN110008853B (zh) | 行人检测网络及模型训练方法、检测方法、介质、设备 | |
US20200151573A1 (en) | Dynamic precision scaling at epoch granularity in neural networks | |
CN104933420A (zh) | 一种场景图像识别方法和场景图像识别设备 | |
WO2021244583A1 (zh) | 一种数据清洗方法、装置及设备、程序及存储介质 | |
JP6991960B2 (ja) | 画像認識装置、画像認識方法及びプログラム | |
US20180247226A1 (en) | Classifier | |
WO2016095068A1 (en) | Pedestrian detection apparatus and method | |
WO2019207910A1 (ja) | データ分析システム及びデータ分析方法 | |
CN112868032A (zh) | 提升ai识别学习能力 | |
CN107392311A (zh) | 序列切分的方法和装置 | |
TWI711934B (zh) | 嵌入結果的解釋方法和裝置 | |
JP2021039758A (ja) | 画像間の類似度を利用した類似領域強調方法およびシステム | |
JP7073171B2 (ja) | 学習装置、学習方法及びプログラム | |
CN110705889A (zh) | 一种企业筛选方法、装置、设备及存储介质 | |
US11875250B1 (en) | Deep neural networks with semantically weighted loss functions | |
WO2017142510A1 (en) | Classification | |
JP2020061147A (ja) | Cnn基盤イメージ検索方法および装置 | |
CN117035044B (zh) | 基于输出激活映射的过滤器剪枝方法、图像分类系统及边缘设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201202 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211208 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6991960 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |