JP7063105B2 - 識別装置 - Google Patents

識別装置 Download PDF

Info

Publication number
JP7063105B2
JP7063105B2 JP2018095378A JP2018095378A JP7063105B2 JP 7063105 B2 JP7063105 B2 JP 7063105B2 JP 2018095378 A JP2018095378 A JP 2018095378A JP 2018095378 A JP2018095378 A JP 2018095378A JP 7063105 B2 JP7063105 B2 JP 7063105B2
Authority
JP
Japan
Prior art keywords
layer
determined
feature map
processing
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018095378A
Other languages
English (en)
Other versions
JP2019200648A (ja
Inventor
将幸 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2018095378A priority Critical patent/JP7063105B2/ja
Publication of JP2019200648A publication Critical patent/JP2019200648A/ja
Application granted granted Critical
Publication of JP7063105B2 publication Critical patent/JP7063105B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、ニューラルネットワークを用いる識別装置の技術分野に関する。
この種の装置で用いられる方法として、例えば、ニューラルネットワークの畳み込みレイヤの特徴マップのセットについての中間分類器による判定を行い、対象とするパターンを含まないデータを後段の畳み込みレイヤで処理しない方法が提案されている(特許文献1参照)。
特表2017-538999号公報
特許文献1に記載の方法では、対象とするパターンの一部が含まれているデータについても後段の畳み込みレイヤで処理されない(即ち、処理が中止されてしまう)ので、対象とするパターンを求めるための情報(例えば、対象とするパターンの一部を含む部分のデータ)が消失してしまうおそれがある。
本発明は、上記問題点に鑑みてなされたものであり、後段のレイヤにおいて有用な情報と無用な情報とを適切に判定しつつ、演算量の低減を図ることができる識別装置を提供することを課題とする。
本発明の一態様に係る識別装置は、複数のレイヤを有するニューラルネットワークと、前記複数のレイヤのうち一のレイヤの出力である中間データとしての一の特徴マップから取得され、夫々前記一の特徴マップの部分的な特徴量を示す複数の部分データ各々に対して、演算処理を継続するか否かの判定を行う分類器と、前記複数のレイヤのうち、前記一のレイヤの後段のレイヤであって、前記中間データを入力データとするレイヤである他のレイヤにおいて、前記複数の部分データのうち前記演算処理を継続しないと判定された部分データについて前記演算処理が行われないように、前記一の特徴マップのうち、前記演算処理を継続しないと判定された部分データに対応するデータの変更又は前記対応するデータが前記他のレイヤに入力される際に適用される重みの変更を行う処理手段と、を備えるというものである。
実施形態に係る画像識別装置の概要を示す図である。 実施形態に係る分類器の動作の概念を説明するための図である。 実施形態に係るゼロ置換の概念を説明するための図である。 実施形態に係る画像識別装置の動作を示すフローチャートである。
識別装置に係る実施形態について図1乃至図3を参照して説明する。以下の実施形態では、識別装置の一例として、畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)を備える画像識別装置を挙げる。
(構成)
実施形態に係る画像識別装置の構成について図1を参照して説明する。図1は、実施形態に係る画像識別装置の概要を示す図である。
図1において、画像識別装置100は、畳み込みニューラルネットワーク10(以降、適宜“CNN10”と称する)と、分類器21、22、23及び24と、処理器30とを備えて構成されている。
CNN10は、複数のレイヤL0、L1、L2、L3、L4、F5及びF6を有する。ここで、レイヤL0、L1、L2、L3及びL4は畳み込みレイヤであり、レイヤF5及びF6は全結合レイヤである。尚、CNN10には、既存の技術を適用可能であるので、その詳細な説明は省略する。
分類器21、22、23及び24各々は、例えばサポートベクターマシン(Support Vector Machine:SVM)分類器であってよい。処理器30については後述する。
(動作)
画像識別装置100の動作について図1に加えて、図2及び図3を参照して説明する。図2は、実施形態に係る分類器の動作の概念を説明するための図である。図3は、実施形態に係るゼロ置換の概念を説明するための図である。
入力データとしての画像に畳み込み処理が施されることによって、レイヤL0の中間出力値としての第1の特徴マップが出力される。分類器21は、第1の特徴マップのサイズよりも十分に小さいサイズの窓を用いて、第1の特徴マップの一の部分から特徴量を抽出する。分類器21は、抽出された特徴量に基づいて、該一の部分が、後段のレイヤL1における処理に有用であるか否かの判別を行う。分類器21は、例えば図2に示すように、窓で第1の特徴マップ全体を走査しながら上記判別を繰り返し行い、第1の特徴マップに含まれる特徴量が後段のレイヤL1における処理に有用であるか否かを部分毎に判別する。
処理器30は、分類器21の判別結果に基づいて、第1の特徴マップのうち、レイヤL1における処理に有用でない(即ち、無用である)と判別された部分の特徴量を“0”に置換する、或いは、レイヤL1に係るウェイトパラメータのうち、該部分に対応するウェイトパラメータを“0”に置換する。このような処理を、本実施形態では「ゼロ置換」と称する。
ウェイトパラメータの置換について、図3を参照して説明を加える。図3において、Lx層の各ノードが、特徴マップの各部分(即ち、窓により特徴量が抽出された部分)に対応しているものとする。Lx層の各ノードとLx+1層の一のノードとを結ぶ各エッジには、ウェイトパラメータw、w、w、…、w、…wが設定されている。Lx層のノードNが、特徴マップのうち、Lx+1層における処理に有用でないと判別された部分に対応しているとすると、処理器30は、ウェイトパラメータwの値を“0”に置換する。
尚、特徴量としては、例えば、ヒートマップやエッジ等の画像的特徴、ジャイロ情報、露光、感度等のカメラ情報、等が挙げられる。
再び図1に戻り、レイヤL0から出力された第1の特徴マップに畳み込み処理が施されることによって、レイヤL1の中間出力値としての第2の特徴マップが出力される。分類器22は、第2の特徴マップのサイズよりも十分に小さい窓で、第2の特徴マップ全体を走査しながら上述の判別を繰り返し行い、第2の特徴マップに含まれる特徴量が後段のレイヤL2における処理に有用であるか否かを部分毎に判別する。
処理器30は、分類器22の判別結果に基づいて、第2の特徴マップのうち、レイヤL2における処理に有用でない(即ち、無用である)と判別された部分の特徴量を“0”に置換する、或いは、レイヤL2に係るウェイトパラメータのうち、該部分に対応するウェイトパラメータを“0”に置換する。
レイヤL1から出力された第2の特徴マップに畳み込み処理が施されることによって、レイヤL2の中間出力値としての第3の特徴マップが出力される。分類器23は、第3の特徴マップのサイズよりも十分に小さい窓で、第3の特徴マップ全体を走査しながら上述の判別を繰り返し行い、第3の特徴マップに含まれる特徴量が後段のレイヤL3における処理に有用であるか否かを部分毎に判別する。
処理器30は、分類器23の判別結果に基づいて、第3の特徴マップのうち、レイヤL3における処理に有用でない(即ち、無用である)と判別された部分の特徴量を“0”に置換する、或いは、レイヤL3に係るウェイトパラメータのうち、該部分に対応するウェイトパラメータを“0”に置換する。
レイヤL2から出力された第3の特徴マップに畳み込み処理が施されることによって、レイヤL3の中間出力値としての第4の特徴マップが出力される。分類器24は、第4の特徴マップのサイズよりも十分に小さい窓で、第4の特徴マップ全体を走査しながら上述の判別を繰り返し行い、第4の特徴マップに含まれる特徴量が後段のレイヤL4における処理に有用であるか否かを部分毎に判別する。
処理器30は、分類器24の判別結果に基づいて、第4の特徴マップのうち、レイヤL4における処理に有用でない(即ち、無用である)と判別された部分の特徴量を“0”に置換する、或いは、レイヤL4に係るウェイトパラメータのうち、該部分に対応するウェイトパラメータを“0”に置換する。
尚、上述した判別及び分類器21、22、23及び24の構築には、既存の技術を適用可能であるので、その詳細な説明は省略する。
次に、画像識別装置100の動作について図4のフローチャートを参照して説明を加える。
図4において、CNN10のLx層(即ち、レイヤL0、L1、L2及びL3のいずれか)において畳み込み処理に係る演算が行われる(ステップS101)。尚、“x”の初期値は“0”である。次に、Lx層に対応する分類器21、22、23又は24は、窓を用いて抽出した、Lx層の中間出力値としての特徴マップの一の部分の特徴量に基づいて、該一の部分が後段のLx+1層における処理に有用であるか否かの判別を行う(ステップS102)。
次に、処理器30は、分類器21、22、23又は24の判別結果に基づいて、上記一の部分についてゼロ置換が必要であるか否かを判定する(ステップS103)。ステップS103の処理において、ゼロ置換が必要ではないと判定された場合(即ち、上記一の部分が後段のLx+1層における処理に有用であると判別された場合)(ステップS103:No)、後述するステップS105の処理が行われる。
他方、ステップS103の処理において、ゼロ置換が必要であると判定された場合(
即ち、上記一の部分が後段のLx+1層における処理に有用でないと判別された場合)(ステップS103:Yes)、処理器30は、上記一の部分の特徴量を“0”に置換する、或いは、Lx+1層に係るウェイトパラメータのうち、該一の部分に対応するウェイトパラメータを“0”に置換する(ステップS104)。
次に、Lx層の中間出力値としての特徴マップの全てについて判別が行われたか否かが判定される(ステップS105)。ステップS105の処理において、特徴マップの全てについて判別が行われていないと判定された場合(ステップS105:No)、ステップS102の処理が行われる。他方、ステップS105の処理において、特徴マップの全てについて判別が行われたと判定された場合(ステップS105:Yes)、“x”がインクリメントされる(ステップS106)。
次に、“x”がN(本実施形態では“4”)以上であるか否かが判定される(ステップS107)。ステップS107の処理において、“x”がN未満であると判定された場合(ステップS107:No)、ステップS101の処理が行われる(即ち、処理が後段に移行する)。他方、ステップS107において、“x”がN以上であると判定された場合(ステップS107:Yes)、図4に示す処理は終了される。
(技術的効果)
当該画像識別装置100では、レイヤL0、L1、L2及びL3各々の中間出力値としての特徴マップの部分毎に、分類器21、22、23又は24により、後段の畳み込みレイヤにおける処理に有用であるか否の判別が行われる。そして、後段の畳み込みレイヤにおける処理に有用でない(即ち、無用である)と判別された部分の特徴量が“0”に置換される、或いは、該部分の特徴量を入力データとする後段の畳み込みレイヤに係るウェイトパラメータが“0”に置換される。このため、後段の畳み込みレイヤにおける処理に無用であると判別された部分については、実質的に、後段の畳み込みレイヤにおける処理が行われない(即ち、当該画像識別装置100全体における演算量が削減される)。
当該画像識別装置100では特に、後段の畳み込みレイヤにおける処理に無用であると判別された部分の特徴量又はウェイトパラメータが“0”に置換されるので、例えば後段の畳み込みレイヤにおける処理に無用であると判別された部分を、後段の畳み込みレイヤにおいて処理するか否かを管理するフラグマップを別途生成する比較例に係る装置に比べて、メモリの消費量を抑制することができる。
当該画像識別装置100では特に、後段の畳み込みレイヤにおける処理に有用であるか否かの判別が特徴マップの部分毎に行われるので、後段の畳み込みレイヤにおける処理に有用である部分(例えば、識別対象の一部が含まれている部分)については、後段の畳み込みレイヤにおいて処理される。つまり、当該画像識別装置100によれば、特徴マップのうち後段の畳み込みレイヤにおける処理に有用な部分を残しつつ、演算量の削減やメモリの消費量の抑制を行うことができる。
当該画像識別装置100を、例えばCPU(Central Processing Unit)及びGPU(Graphics Processing Unit)を組み合わせた構成により実現する場合、上述の如く演算量が削減されたり、メモリの消費量が抑制されたりする結果、CPUとGPUとの間に存在するシステムバスの帯域幅を削減することができる。
当該画像識別装置100によれば更に、上述の如く演算量が削減されたり、メモリの消費量が抑制されたりする結果、演算時間の短縮(言い換えれば、演算速度の向上)や、当該画像識別装置100の発熱の抑制を図ることができる。
以上に説明した実施形態から導き出される発明の各種態様を以下に説明する。
発明の一態様に係る識別装置は、複数のレイヤを有するニューラルネットワークと、前記複数のレイヤのうち一のレイヤの出力である中間データから取得される複数の部分データ各々に対して、演算処理を継続するか否かの判定を行う分類器と、前記複数のレイヤのうち、前記一のレイヤの後段のレイヤであって、前記中間データを入力データとするレイヤである他のレイヤにおいて、前記複数の部分データのうち前記演算処理を継続しないと判定された部分データについて前記演算処理が行われないように、前記中間データのうち、前記演算処理を継続しないと判定された部分データに対応するデータの変更又は前記対応するデータが前記他のレイヤに入力される際に適用される重みの変更を行う処理手段と、を備えるというものである。
上述の実施形態においては、畳み込みニューラルネットワーク10がニューラルネットワークの一例に相当し、分類器21、22、23及び24が分類器の一例に相当し、処理器30が処理手段の一例に相当し、特徴マップが中間データの一例に相当する。上述の実施形態において「後段の畳み込みレイヤにおける処理に有用でない(即ち、無用である)と判別された部分」は、「前記複数の部分データのうち前記演算処理を継続しないと判定された部分データ」の一例に相当する。
当該識別装置では、一のレイヤの出力である中間データから取得される複数の部分データのうち演算処理を継続しないと判定された部分データについて、該一のレイヤの後段の他のレイヤにおいて演算処理が行われない。言い換えれば、上記複数の部分データのうち演算処理を継続すると判定された部分データについては、他のレイヤにおいて演算処理が行われる。つまり、当該識別装置によれば、複数の部分データのうち他のレイヤにおける演算処理に有用な部分データを残すことができる。他方で、複数の部分データのうち他のレイヤにおける演算処理に無用な部分データ(即ち、演算処理を継続しないと判定された部分データ)についての演算処理を削減することができるので、当該識別装置全体の演算量を低減することができる。
従って、当該識別装置によれば、後段レイヤにおける演算処理に有用な情報と無用な情報とを適切に判定しつつ、演算量の低減を図ることができる。
本発明は、上述した実施形態に限られるものではなく、特許請求の範囲及び明細書全体から読み取れる発明の要旨或いは思想に反しない範囲で適宜変更可能であり、そのような変更を伴う識別装置もまた本発明の技術的範囲に含まれるものである。
10…畳み込みニューラルネットワーク、21、22、23、24…分類器、30…処理器、100…画像識別装置

Claims (1)

  1. 複数のレイヤを有するニューラルネットワークと、
    前記複数のレイヤのうち一のレイヤの出力である中間データとしての一の特徴マップから取得され、夫々前記一の特徴マップの部分的な特徴量を示す複数の部分データ各々に対して、演算処理を継続するか否かの判定を行う分類器と、
    前記複数のレイヤのうち、前記一のレイヤの後段のレイヤであって、前記中間データを入力データとするレイヤである他のレイヤにおいて、前記複数の部分データのうち前記演算処理を継続しないと判定された部分データについて前記演算処理が行われないように、前記一の特徴マップのうち、前記演算処理を継続しないと判定された部分データに対応するデータの変更又は前記対応するデータが前記他のレイヤに入力される際に適用される重みの変更を行う処理手段と、
    を備えることを特徴とする識別装置。
JP2018095378A 2018-05-17 2018-05-17 識別装置 Active JP7063105B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018095378A JP7063105B2 (ja) 2018-05-17 2018-05-17 識別装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018095378A JP7063105B2 (ja) 2018-05-17 2018-05-17 識別装置

Publications (2)

Publication Number Publication Date
JP2019200648A JP2019200648A (ja) 2019-11-21
JP7063105B2 true JP7063105B2 (ja) 2022-05-09

Family

ID=68612514

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018095378A Active JP7063105B2 (ja) 2018-05-17 2018-05-17 識別装置

Country Status (1)

Country Link
JP (1) JP7063105B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005011024A (ja) 2003-06-18 2005-01-13 Fuji Xerox Co Ltd 情報処理装置
JP2017538999A (ja) 2014-12-17 2017-12-28 ノキア テクノロジーズ オーユー ニューラルネットワークによるオブジェクト検出

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005011024A (ja) 2003-06-18 2005-01-13 Fuji Xerox Co Ltd 情報処理装置
JP2017538999A (ja) 2014-12-17 2017-12-28 ノキア テクノロジーズ オーユー ニューラルネットワークによるオブジェクト検出

Also Published As

Publication number Publication date
JP2019200648A (ja) 2019-11-21

Similar Documents

Publication Publication Date Title
US11699067B2 (en) Arithmetic processing apparatus and control method therefor
CN107392842B (zh) 图像风格化处理方法、装置、计算设备及计算机存储介质
US9836879B2 (en) Mesh skinning technique
JP2007201533A (ja) ボケ変換装置及び方法
JP2009116400A (ja) 情報処理装置および情報処理方法
JP2017078934A (ja) 畳み込みニューラルネットワークの演算方法及び演算プログラム、情報処理装置
US9626285B2 (en) Storage resource allocation to dataflows based on data requirements and attributes
CN113298695B (zh) 一种图像处理组件和芯片、图像处理方法和存储介质
CN107622481A (zh) 降低ct图像噪声的方法、装置和计算机设备
JP6937782B2 (ja) 画像処理方法及びデバイス
US20160253129A1 (en) Image forming apparatus and control method therefor
JP4786484B2 (ja) 演算処理用データ供給方法および画像処理装置
JP7063105B2 (ja) 識別装置
CN113506305B (zh) 三维点云数据的图像增强方法、语义分割方法及装置
JP2007104706A (ja) 画像処理装置及び画像処理方法
JP7321336B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
CN107977923B (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
CN115239584A (zh) 用三维合成数据去除人像眼镜及其阴影的方法及装置
JP2017038329A (ja) 画像処理装置、画像形成装置、及び画像処理プログラム
JP6564625B2 (ja) データ転送装置およびデータ転送方法
JP2016206934A (ja) 画像処理装置、画像処理方法及びプログラム
US11682100B2 (en) Dynamic allocation of system of chip resources for efficient signal processing
KR101540300B1 (ko) 캐시 메모리를 이용한 이미지 워핑 시스템 및 그 방법
WO2024212750A1 (zh) 图像信号处理方法、装置、设备及计算机可读存储介质
WO2024150430A1 (ja) 画像処理装置、画像処理方法及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200821

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211015

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220404

R151 Written notification of patent or utility model registration

Ref document number: 7063105

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151