JP7099968B2

JP7099968B2 - 演算装置

Info

Publication number: JP7099968B2
Application number: JP2019016217A
Authority: JP
Inventors: 大智村田
Original assignee: Hitachi Astemo Ltd
Current assignee: Hitachi Astemo Ltd
Priority date: 2019-01-31
Filing date: 2019-01-31
Publication date: 2022-07-12
Anticipated expiration: 2039-01-31
Also published as: CN113366509A; US20220092395A1; WO2020158058A1; JP2020123269A

Description

本発明は、ニューラルネットワークを利用する演算装置に関する。

物体の認識や、行動の予測を自動的に行う技術として、ＤＮＮ（ＤｅｅｐＮｅｕｒａｌＮｅｔｗｏｒｋ）を用いた機械学習が知られている。ＤＮＮを自動運転車両へ適用する場合には、車載装置の演算能力を考慮してＤＮＮの演算量を削減する必要が生じる。ＤＮＮの演算量を削減する技術としては、例えば、特許文献１が知られている。

特許文献１には、ニューラルネットワークの重み係数の閾値を変化させて、認識精度の大きな劣化が発生する直前の閾値を決定し、当該閾値より認識精度の絶対値が小さいニューロンをプルーニングし、ＤＮＮを縮約する技術が開示されている。

米国特許出願公開第２０１８／００９６２４９号明細書

しかしながら、上記従来技術では、再学習と推論を繰り返すことでＤＮＮの縮約（または最適化）を実施するため、自動運転車両用のＤＮＮのように大規模なニューラルネットワークに適用した場合、探索対象の組み合わせが膨大となって、処理が完了するまでに膨大な時間を要する、という問題があった。

また、上記従来技術では、重み係数によってニューラルネットワークの縮約を実施しているため、適用先のアプリケーションに応じて縮約を実施することが難しい、という問題があった。

そこで本発明は、上記問題点に鑑みてなされたもので、縮約の際の演算量を削減して短時間で処理を完了させることを目的とする。

本発明は、入力データと、重み係数を用いて演算を行うニューラルネットワークを有する演算装置であって、前記入力データによる前記ニューラルネットワークのニューロンの発火状態を算出するネットワーク解析部と、前記ニューロンの発火状態に基づいて、前記ニューラルネットワークの縮約率が設定された複数の縮約パターンから縮約パターンの候補を絞り込み、前記絞り込んだ縮約パターンの候補に基づいて前記ニューラルネットワークの縮約を実行して縮約後のニューラルネットワークを生成する縮約部と、前記縮約部で生成された前記縮約後のニューラルネットワークに推論を実行して推論誤差を算出し、前記複数の縮約パターンの中から前記推論誤差に基づいて縮約パターンを抽出する最適化エンジン部と、を有し、前記最適化エンジン部は、前記推論誤差が最小となる縮約パターンを抽出する。

したがって、本発明は、ニューロンの発火状態に基づいて縮約を実行できるため、縮約の際の演算量を削減して短時間で縮約処理を完了させることが可能となる。また、適用先のアプリケーション（または装置）に応じたニューラルネットワーク（ＤＮＮ）を生成することが可能となる。

本明細書において開示される主題の、少なくとも一つの実施の詳細は、添付されている図面と以下の記述の中で述べられる。開示される主題のその他の特徴、態様、効果は、以下の開示、図面、請求項により明らかにされる。

本発明の実施例１を示し、ＤＮＮ縮約自動化装置の一例を示すブロック図である。本発明の実施例１を示し、ＤＮＮ縮約自動化装置で行われる処理の一例を示す図である。本発明の実施例１を示し、縮約パターンと縮約率と認識精度への感度の関係を示す図である。本発明の実施例１を示し、設計期間と縮約率の関係を示すグラフである。本発明の実施例２を示し、ＤＮＮ縮約自動化装置を車両に搭載する例を示す車両制御システムのブロック図である。本発明の実施例３を示し、ＤＮＮ縮約自動化装置で行われる処理の一例を示す図である。本発明の実施例４を示し、ＤＮＮ縮約自動化装置で行われる処理の一例を示す図である。

以下、本発明の実施形態を添付図面に基づいて説明する。

図１は、本発明の実施例１を示し、ＤＮＮ（ＤｅｅｐＮｅｕｒａｌＮｅｔｗｏｒｋ）縮約自動化装置１の一例を示すブロック図である。

ＤＮＮ縮約自動化装置１は、縮約（または最適化）対象のＤＮＮ１００と、ＤＮＮ１００へ入力するデータセット２００を格納するストレージ９０と、中間データなどを保持するメモリ１０と、ネットワーク解析部２０と、縮約部３０と、再学習部４０と、最適化エンジン部５０と、縮約率補正部６０と、精度判定部７０と、ネットワーク解析部２０～精度判定部７０の各機能部を制御するスケジューラ８０と、各部を接続するインターコネクト６を含む演算装置である。なお、インターコネクト６としては、例えば、ＡＸｉ（ＡｄｖａｎｃｅｄｅＸｔｅｎｓｉｂｌｅＩｎｔｅｒｆａｃｅ）を採用することができる。

また、メモリ１０、ネットワーク解析部２０～精度判定部７０はスレーブとして機能し、スケジューラ８０は、上記スレーブを制御するマスタとして機能する。

本実施例１のＤＮＮ縮約自動化装置１は、ネットワーク解析部２０～精度判定部７０の各機能部及びスケジューラ８０がハードウェアで実装される。ＤＮＮ縮約自動化装置１は、例えば、計算機の拡張スロットに装着されてデータの授受を行うことができる。なお、ハードウェアとしては、ＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）等を採用することができる。

また、本実施例１では、ハードウェアで各機能部を構成する例を示すが、これに限定されるものではなない。例えば、ネットワーク解析部２０～スケジューラ８０の一部又は全てをソフトウェアで実装することも可能である。また、以下の説明では、ＤＮＮの各層をニューラルネットワークとして説明する。

ストレージ９０に格納される縮約前のＤＮＮ１００は、ニューラルネットワークと重み係数及びバイアスを含む。また、データセット２００は、ＤＮＮ１００の適用先のアプリケーション（または装置）に応じたデータで、正解付きのデータと、ニューラルネットワークの発火（活性化）状態を検出するためのデータが含まれる。縮約済みのＤＮＮ３００は、ネットワーク解析部２０～精度判定部７０で縮約処理を実行した結果である。

スケジューラ８０は、縮約前のＤＮＮ１００とデータセット２００を受け付けると、予め設定された順序で上記各機能部を制御してニューラルネットワーク（ニューロン）の縮約処理を実行し、縮約済みのＤＮＮ３００を生成させる。

本実施例１のＤＮＮ縮約自動化装置１では、入力された縮約前のＤＮＮ１００と適用先のアプリケーションに応じたデータセット２００から、最適な縮約率を自動的に算出し、縮約済みのＤＮＮ３００の縮約に要する設計期間の短縮を実現する。

本実施例１では、縮約率を、縮約済みのＤＮＮ３００の演算量／縮約前のＤＮＮ１００の演算量で表す。ただし、演算量は、単位時間当たりの処理量数（Ｏｐｅｒａｔｉｏｎｐｅｒｓｅｃｏｎｄ）を用いることができる。なお、縮約率としては、上記の他に、縮約済みのＤＮＮ３００のニューロン数／縮約前のＤＮＮ１００のニューロン数で表すことができ、あるいは、縮約済みのＤＮＮ３００のノード数／縮約前のＤＮＮ１００のノード数で表すことができる。

以下、ＤＮＮ縮約自動化装置１で行われる処理の概要を説明した後に、各機能部の詳細について説明する。

＜処理の概要＞
まず、スケジューラ８０は、縮約前のＤＮＮ１００をネットワーク解析部２０へ入力する。スケジューラ８０は、データセット２００から適用先アプリケーションに応じたデータをネットワーク解析部２０へ入力して、ＤＮＮ１００の特徴量を算出させる。

ネットワーク解析部２０では、データセット２００のデータをＤＮＮ１００へ入力し、ニューラルネットワークのニューロンの発火状態から特徴量を算出する。そして、スケジューラ８０は、ネットワーク解析部２０で算出された特徴量を縮約部３０へ入力して、有望な縮約率の組合せ候補について絞り込みを実施させる。

縮約部３０では、特徴量からニューラルネットワークの認識精度への感度を算出し、感度が低い部分については縮約率を高く設定し、感度が高い部分については縮約率を低く設定する。

縮約部３０は、ＤＮＮ１００の各層のニューラルネットワークについて上記縮約率を設定し、縮約率の組合せ候補を複数生成し、これらの候補の中から縮約率と認識精度（への感度）の条件を満たす候補を絞り込む。なお、以下の説明では、縮約率の組合せ候補を縮約パターンとする。そして、縮約部３０は、絞り込んだ縮約パターンについてＤＮＮ１００の縮約を実行し、縮約後のＤＮＮの候補（ＤＮＮ候補１１０）として出力する。

スケジューラ８０は、縮約部３０が縮約を実行中に、再学習部４０によってＤＮＮの再学習を反復的に実行させる。再学習部４０は、再学習によって縮約に対して頑健なＤＮＮ候補１１０を構築する。次に、スケジューラ８０は、縮約部３０から出力された縮約後のＤＮＮ候補１１０と、ＤＮＮ１００を最適化エンジン部５０へ入力して、最適化を実施させる。

最適化エンジン部５０は、縮約後のＤＮＮ候補１１０に対して縮約率の最適化や、縮約方法の選択などを実施し、縮約に必要なパラメータ（例えば、重み係数など）の補正値を決定する。最適化エンジン部５０は、例えば、縮約後のＤＮＮ候補１１０の推論誤差からベイズ推論に基づく最適化アルゴリズムを用いて、最適な縮約パターンやパラメータを推定し、ニューラルネットワーク毎の縮約率の補正値を決定する。

最適化エンジン部５０は、算出された縮約パターンやパラメータを縮約率補正部６０へ出力する。縮約率補正部６０では、縮約後のＤＮＮ候補１１０に上記縮約率とパラメータを適用して縮約率を補正し、縮約後のＤＮＮ候補１１０を構築する。スケジューラ８０は、縮約率補正部６０で構築された縮約後のＤＮＮ候補１１０を精度判定部７０へ入力し、推論を実行させる。

精度判定部７０は、データセット２００から正解付きデータを取得して、縮約後のＤＮＮ候補１１０へ入力して推論を実施する。精度判定部７０は、推論の結果と正解から縮約後のＤＮＮ候補１１０の推論誤差（または推論精度）を判定し、推論誤差が所定の閾値ｔｈ未満となるまで上記処理を繰り返す。なお、推論誤差は、例えば、ＤＮＮ候補１１０の推論結果の正解率の逆数に基づく統計値（平均値など）を用いればよい。

そして、精度判定部７０は、縮約部３０で絞り込まれた縮約パターンのうち、推論誤差が所定の閾値ｔｈ未満のＤＮＮ候補１１０を、最適化が完了した縮約済みのＤＮＮ３００として出力する。

以上のように、ＤＮＮ縮約自動化装置１は、ネットワーク解析部２０によるＤＮＮ１００の解析（１）と、縮約部３０による複数の縮約率の組み合わせ（縮約パターン）の候補の絞り込み及び縮約の実行（２）と、再学習部４０による縮約対象のＤＮＮの再学習（３）と、最適化エンジン部５０によるパラメータの最適化及び縮約率補正部６０での縮約後のＤＮＮ候補１１０の再構築（４）と、精度判定部７０による縮約後のＤＮＮ候補１１０の推論誤差の判定（５）を実施し、複数の縮約パターンの中から推論誤差が閾値ｔｈ未満のＤＮＮ３００を自動的に出力することができる。

ＤＮＮ縮約自動化装置１は、縮約前のＤＮＮ１００を解析して、上記（１）～（５）の処理を推論誤差が所定の閾値ｔｈ未満となるまで繰り返すことで、複数の縮約パターンの中から縮約率と推論精度（認識精度）に優れた縮約済みのＤＮＮ３００を、ＤＮＮ３００の適用先のアプリケーション（または装置）に応じて自動的に生成することが可能となる。

ＤＮＮ縮約自動化装置１は、ＤＮＮ３００の適用先のアプリケーションに応じたデータセットで、縮約前のＤＮＮ１００のニューラルネットワークを解析して、特徴量（発火状態）を算出しておくことで、有望な縮約率の組み合わせを絞り込んでから探索することが可能となり、縮約の際の演算量を削減して短時間で処理を完了させることが可能となる。

さらに、ＤＮＮ縮約自動化装置１は、縮約パターンの候補の絞り込みに加えて、ベイズ推論による確率的探索を組み合わせることで、閾値ｔｈを満足する範囲内で認識精度の低下を最小とする縮約済みのＤＮＮ３００を出力することができる。

＜機能部の詳細＞
まず、ネットワーク解析部２０は、縮約による認識精度への感度を解析し、縮約前のＤＮＮ１００のニューラルネットワーク毎に特徴量を算出する。ネットワーク解析部２０は、縮約済みのＤＮＮ３００の適用先のアプリケーションに応じた複数のデータをデータセット２００から読み込んで、縮約前のＤＮＮ１００へ順次入力し、ＤＮＮ１００のニューラルネットワーク毎に発火状態を推定（数値化）して特徴量とする。

また、ネットワーク解析部２０は、ニューラルネットワークのニューロンの発火状態をヒートマップとして算出し、このヒートマップを特徴量としてもよい。また、ネットワーク解析部２０が算出する特徴量は、ニューラルネットワーク毎に限定されるものではなく、例えば、ニューロン毎に算出してもよい。

各ニューロンの発火状態を推定して数値化する技術としては、公知または周知の技術を適用することができ、例えば、国際公開第２０１１／００７５６９号に開示される技術を適用すればよい。

本実施例１では、適用先のデータの特徴に応じて発火するニューロンと、発火しないニューロンの分布が異なる点に着目し、ＤＮＮ３００の適用先のアプリケーションに応じたデータセット２００によるニューロンの発火状態を特徴量とする。なお、特徴量は、複数のデータをＤＮＮ１００へ順次入力した場合の統計値としてもよい。また、特徴量は、縮約済みＤＮＮ３００の適用先に特有の特徴を包含した解析結果として出力される。

ネットワーク解析部２０は、入力されたデータに対して頻繁に発火するニューロン（またはニューラルネットワーク）を認識精度への感度が大きいと判定することができ、逆に、発火する頻度の低いニューロン（またはニューラルネットワーク）を認識精度への感度が低いと判定することができる。

縮約部３０は、ネットワーク解析部２０から、ニューラルネットワーク（またはニューロン）の発火状態に基づく特徴量を受け付けて、縮約率の組み合わせ（縮約パターン）の候補を絞り込んで、縮約を実行する。縮約部３０は、ニューラルネットワーク毎の特徴量に基づいて、複数の縮約パターンの候補から絞り込みを実施し、絞り込んだ複数の縮約パターンについて縮約を実行し、縮約後のＤＮＮ候補１１０を生成する。

図３は、縮約パターンと縮約率と認識精度への感度の関係を示す図である。図３の例では、ＤＮＮ１００をｎ層のニューラルネットワークで構成し、各層毎に縮約率を設定する例を示す。図示の例では、１層目が入力層、２層目～ｎ－１層目が隠れ層（中間層）、ｎ層目が出力層となる。

本実施例１において、１つの縮約パターンは、各層の縮約率をそれそれ有する。換言すれば、縮約パターンは、各層毎の縮約率の組み合わせで構成される。

縮約パターン１～３は、各層（ニューラルネットワーク）毎に縮約率が異なる組み合わせで設定される。縮約パターンは、予め設定されたパターンを使用してもよいし、予め設定された縮約率の組み合わせから縮約部３０が生成してもよい。また、縮約パターンの数は、３つに限定されるものではなく、ＤＮＮ１００の規模に応じて適宜変更することができる。

縮約部３０は、上述したように、ＤＮＮ３００の適用先に対応するデータの認識精度に対する感度が高いニューラルネットワークについては、縮約率を低く設定する。これにより、上記感度が高い領域では、ニューロンの数が必要以上に減少して認識（推定）精度が低下するのを抑制する。

一方、ＤＮＮ３００の適用先に対応するデータの認識精度に対する感度が低いニューラルネットワークについては、縮約率を高く設定する。これにより、感度が低い領域では、ニューロンの数を大幅に削減しても認識精度が低下するのを抑制でき、かつ、演算量も削減できる。

感度と縮約率の関係は、例えば、認識精度に対する感度が７０％のニューラルネットワークの縮約率を３０％とし、認識精度に対する感度が３０％のニューラルネットワークの縮約率を７０％とする。

縮約率を増大させていくと、削減可能なニューロンが連鎖的に増大するため、演算量を大幅に削減することが可能となる。一方で、認識精度に対する感度に関わらず縮約率を増大させると、認識精度が低下（推定誤差の拡大）するという問題が発生するが、本実施例１のように、ニューラルネットワークの特徴量を認識精度に対する感度と関連させることで、縮約率と認識精度の最適解を探索することが可能となる。

なお、上記ではニューラルネットワーク毎に縮約率を設定する例を示したが、これに限定されるものではない。例えば、各層毎の縮約率を維持しながら、ニューラルネットワーク内のニューロンの特徴量に応じて、縮約すべきニューロンと維持すべきニューロンを分類するようにしてもよい。

このように、縮約部３０は、特徴量に基づいてニューラルネットワーク毎の縮約率を決定することで、ニューロンの数を大幅に削減してから縮約パターンの最適化などの演算を行うことが可能となって、演算時間を短縮することが可能となる。

次に、縮約部３０は、複数の縮約パターンから絞り込みを実行して、縮約処理の演算時間を現実的な値とする。絞り込みの例としては、ＤＮＮ全体の縮約率と認識精度への感度の降順で上位から所定順位までの縮約パターンに絞り込む。あるいは、縮約率が所定値以上の縮約パターンに絞り込む等、絞り込みについては、公知または周知の技術を適用すればよい。

縮約部３０は、絞り込みを行った複数の縮約パターンについて、縮約を実施して縮約後のＤＮＮ候補１１０として出力する。

再学習部４０は、上述したように、縮約部３０で縮約中のＤＮＮに対してデータセット２００による再学習を実施する。これにより、汎化性能の高い(＝縮約に対して頑健な)ＤＮＮを構築することができる。

再学習部４０は、縮約中のＤＮＮと当該ＤＮＮのパラメタ（重み係数）の最適解の候補を入力として受け付けて、受け付けたＤＮＮおよびパラメータを初期値として、再び学習を行うことでＤＮＮを再構築する。再構築された結果は、再学習済みのニューラルネットワーク及び再学習済みの重み係数として出力される。

最適化エンジン部５０は、縮約部３０から出力された複数のＤＮＮ候補１１０について、データセット２００による推論を実施して推論誤差を算出し、推論誤差に基づいて最適な縮約率の組み合わせ（縮約パターン）を推定する。すなわち、最適化エンジン部５０は、ベイズ推論に基づく確率論的探索を実施して、ニューロン毎に適切な縮約率を確率的に決定する。そして、最適化エンジン部５０は、決定された縮約率の組み合わせ（縮約パターン）を縮約率補正部６０へ出力する。

最適化エンジン部５０は、縮約部３０から出力された、複数のＤＮＮ候補１１０に対応する縮約パターンの中から推論誤差が最小となる縮約パターンを算出する。

また、最適化エンジン部５０は、縮約部３０から、複数のＤＮＮ候補１１０および再学習済みの重み係数を入力として受け付けて、ベイズ推論に基づく確率論的探索を用いて、縮約パターンを推定してもよい。

縮約率補正部６０は、最適化エンジン部５０から受け付けた縮約率で縮約後のＤＮＮ候補１１０の縮約率を補正して再構築する。

精度判定部７０は、ＤＮＮ候補１１０へ正解付きデータを入力して推論を実施し、推論の結果と正解から縮約後のＤＮＮ候補１１０の推論誤差が所定の閾値ｔｈ未満であれば、縮約が完了した縮約済みＤＮＮ３００として出力する。

一方、精度判定部７０は、推論誤差が所定の閾値ｔｈ以上の場合には、スケジューラ８０へ処理の繰り返しを通知する。スケジューラ８０は、精度判定部７０から処理の繰り返しの通知を受け付けると、縮約部３０に処理の繰り返しを実行させる。

以上のように、ＤＮＮ縮約自動化装置１は、ネットワーク解析部２０がニューロンの発火状態に基づいて特徴量を算出し、縮約部３０が有望な縮約パターンに絞り込んでから縮約を実行してＤＮＮ候補１１０を複数出力し、再学習部４０が縮約対象のＤＮＮ候補１１０の再学習を実施し、最適化エンジン部５０が、推論の誤差に基づいて適正な縮約率を算出し、縮約率補正部６０が適正な縮約率でＤＮＮ候補１１０を再構築し、精度判定部７０が縮約後のＤＮＮ候補１１０の推論誤差の判定を実施し、複数の縮約パターン（ＤＮＮ候補１１０）の中から推論誤差が閾値ｔｈ未満のＤＮＮ３００を自動的に出力することができる。

ＤＮＮ縮約自動化装置１は、ＤＮＮ３００の適用先のアプリケーション（または装置）に応じたデータセット２００で発火状態に基づく特徴量を算出することで、縮約率と認識精度に優れた縮約パターンに絞り込むことが可能となって、縮約の際の演算量を削減して短時間で縮約処理を完了させることが可能となる。また、ＤＮＮ縮約自動化装置１は、ＤＮＮ１００の縮約処理に、人手を必要としないため、ＤＮＮ１００の縮約にかかる労力を大幅に削減することが可能となる。

また、本実施例１のＤＮＮ縮約自動化装置１は、適用先のアプリケーションに応じたデータセット２００でニューロンの発火状態を推定するので、縮約済みＤＮＮ３００の適用先の環境に応じたＤＮＮを生成することが可能となる。

図４は、ＤＮＮ１００の縮約に要する設計期間と縮約率の関係を示すグラフである。図示のグラフは、横軸を縮約率とし、縦軸を縮約の設計期間とする。

図中実線は、本実施例１のＤＮＮ縮約自動化装置１で大規模なＤＮＮ１００を縮約した場合の縮約率と設計期間（処理時間）の関係を示す。図中破線は、大規模なＤＮＮ１００を人手によって縮約を実施した例を示す。

本実施例１のＤＮＮ縮約自動化装置１では、人手によって７．８日を要していた縮約率＝７０％の縮約を、約１／１０の≒１０時間で完了することができる。さらに、本実施例１のＤＮＮ縮約自動化装置１では、ネットワーク解析部２０による有望な縮約率の組み合わせ（縮約パターン）を絞り込むことにより、縮約の設計期間を大幅に短縮し、かつ、認識精度を向上させることが可能となる。

図５は、本発明の実施例２を示し、ＤＮＮ縮約自動化装置を車両に搭載する例を示す車両制御システムのブロック図である。本実施例２では、前記実施例１に示したＤＮＮ縮約自動化装置１を、自動運転が可能な車両（エッジ）３とデータセンタ（クラウド）４にそれぞれ配置して、自動運転を行う車両３の走行環境に応じてＤＮＮ１００Ｂの縮約を最適化する例を示す。

データセンタ４は、ＤＮＮ縮約自動化装置１Ａと、大規模なＤＮＮ１００Ａに学習を行う学習装置５を含み、ＤＮＮ１００Ａの大幅なアップデートを実行する。データセンタ４は、無線ネットワーク（図示省略）を介して車両３と接続される。

学習装置５は、車両３から走行環境や走行状態に関する情報を取得する。学習装置５は、車両３から取得した情報でＤＮＮ１００Ａの学習を実行する。学習装置５は、学習が完了したＤＮＮ１００Ａを縮約前のＤＮＮとしてＤＮＮ縮約自動化装置１Ａに入力する。

ＤＮＮ縮約自動化装置１Ａは、前記実施例１と同様に構成され、縮約済みＤＮＮを出力する。データセンタ４は、ＤＮＮ縮約自動化装置１Ａから出力されたＤＮＮを、所定のタイミングで車両３へ送信し、アップデートを依頼する。

車両３は、カメラ２１０と、ＬｉＤＡＲ（ＬｉｇｈｔＤｅｔｅｃｔｉｏｎＡｎｄＲａｎｇｉｎｇ）２２０と、レーダ２３０のセンサ類と、センサからのデータを組み合わせるフュージョン２４０と、カメラ２１０とフュージョン２４０からの情報に基づいて自動運転を実行する自動運転ＥＣＵ（ＥｌｅｃｔｒｏｎｉｃＣｏｎｔｒｏｌＵｎｉｔ）２を有する。なお、カメラ２１０とフュージョン２４０で収集した情報は、無線ネットワークを介してデータセンタ４へ送信される。

自動運転ＥＣＵ２は、運転シーン識別部１２０と、ＤＮＮ縮約自動化装置（エッジ）１Ａと、ＤＮＮ１００Ｂと、推論回路７００を含む。

運転シーン識別部１２０は、カメラ２１０からの画像と、フュージョン２４０からのセンサデータに基づいて車両３の走行環境を検出し、走行環境が変化した場合には、ＤＮＮ１００Ｂの補正をＤＮＮ縮約自動化装置１Ｂに指令する。運転シーン識別部１２０が検出する走行環境としては、例えば、一般道や高速道路などの道路種別や、時間帯や、天候等が含まれる。

運転シーン識別部１２０がＤＮＮ縮約自動化装置１Ｂへ指令するＤＮＮ１００Ｂの補正の内容としては、例えば、縮約の条件や、縮約の方法であり、これらの補正内容が走行環境に応じて予め設定される。

ＤＮＮ縮約自動化装置１Ｂは、指令された補正内容でＤＮＮ１００Ｂを縮約して、縮約後のＤＮＮを推論回路７００に出力する。推論回路７００は、縮約後のＤＮＮを用いて、センサデータやカメラ２１０の画像データから所定の認識処理を実行し、制御系（図示省略）へ出力する。なお、制御系とは、駆動力制御装置や操舵装置や制動装置やナビゲーション装置を含む。

データセンタ４では、車両３から収集したセンサデータで大規模なＤＮＮ１００Ａの学習処理を行い、ＤＮＮ縮約自動化装置１Ａは、学習済みのＤＮＮ１００Ａに集約処理を行ってアップデートを行う。アップデートの内容は、例えば、認識対象の追加や、誤認識の低減などが含まれ、ＤＮＮ１００Ａの認識精度を向上させる。

車両３では、運転シーン識別部１２０が、走行環境の変化を検出すると、ＤＮＮ縮約自動化装置１ＢがＤＮＮ１００Ｂの補正を実行することで、走行環境に適応した認識精度を確保することが可能となる。

また、車両３では、データセンタ４からアップデートが行われたＤＮＮを受信して、ＤＮＮ１００Ｂを更新することで、最新のＤＮＮで自動運転を実現することが可能となる。

図６は、本発明の実施例３を示し、ＤＮＮ縮約自動化装置で行われる処理の一例を示す図である。本実施例３では、前記実施例１に示したＤＮＮ縮約自動化装置１の特徴量の算出方法と、縮約方法を複数有する例を示す。なお、その他の構成は、前記実施例１のＤＮＮ縮約自動化装置１と同様である。

ネットワーク解析部２０は、ＳｍｏｏｔｈＧｒａｄ２１と、発火状態抽出２２と、重み係数解析２３と、解析結果マージ２４を含む。

ＳｍｏｏｔｈＧｒａｄ２１は、ＤＮＮ１００が物体を認識する際に、ニューラルネットワークは注視する入力画像の領域を出力する。発火状態抽出２２は、データの認識の際にニューラルネットワークのニューロンがゼロか非ゼロかを出力する。重み係数解析２３は、ＤＮＮ１００のニューロンの結合の強さ（重み）を解析し、結合の弱い部分を縮約の対象とすることができる。

解析結果マージ２４は、ＳｍｏｏｔｈＧｒａｄ２１と、発火状態抽出２２と、重み係数解析２３の結果を統合し、ニューラルネットワークの特徴量を算出する。

縮約部３０は、プルーニング３１と、Ｌｏｗｒａｎｋ（低ランク）近似３２と、ＷｅｉｇｈｔＳｈａｒｉｎｇ（重み共有）３３と、低ビット化３４を含む。

プルーニング３１と、Ｌｏｗｒａｎｋ近似３２では、不要または影響の少ないニューロンを削減して、縮約を実行する。ＷｅｉｇｈｔＳｈａｒｉｎｇ３３では、複数のニューロンの結合で重み係数を共有することでデータ量を削減する。低ビット化３４では、演算で使用するビット幅を制限することで演算負荷を削減する。ただし、ビット幅の制限は、推論誤差が許容される範囲内とする。

縮約部３０は、上記４つの縮約方法のいずれか、あるいは複数の縮約方法の組み合わせで縮約を実行する。いずれの縮約方法を適用するかは、スケジューラ８０が指令してもよい。

また、再学習部４０の一例としては、ＢＣ（Ｂｅｔｗｅｅｎ－ｃｌａｓｓ）ｌｅａｒｎｉｎｇ４１を適用することで、縮約した後にも認識精度を確保可能なＤＮＮを生成することができる。

ネットワーク解析部２０と、縮約部３０及び再学習部４０は、上記のような構成要素を利用することで、縮約率と認識精度に優れたＤＮＮを生成することができる。例えば、前記実施例２のように、エッジデバイス（自動運転ＥＣＵ２）のように、走行環境に応じてＤＮＮの補正を行う場合には、縮約部３０の縮約方法を上記のプルーニング３１～低ビット化３４から選択するようにしてもよい。

また、縮約部３０は、縮約手法が異なる複数の縮約実行部として、プルーニング３１と、Ｌｏｗｒａｎｋ（低ランク）近似３２と、ＷｅｉｇｈｔＳｈａｒｉｎｇ（重み共有）３３と、低ビット化３４を例示したが、これらに限定されるものではない。縮約済み胃ＤＮＮ３００の適用先に応じた縮約手法を適宜採用すればよい。

図７は、本発明の実施例４を示し、ＤＮＮ縮約自動化装置１で行われる処理の一例を示す図である。本実施例４では、前記実施例３に示したＤＮＮ縮約自動化装置１の縮約部３０で、プルーニング３１と、Ｌｏｗｒａｎｋ近似３２で、縮約情報を共有させる。

プルーニング３１で縮約するニューロンと、Ｌｏｗｒａｎｋ近似３２で縮約する行列を連携させることで、不要な演算を削減して処理の高速化を図ることができ、縮約部３０における演算量を削減して、ＤＮＮ縮約自動化装置１の縮約にかかる時間を短縮することができる。

＜まとめ＞
以上のように、上記実施例１～４のＤＮＮ縮約自動化装置１は、以下のような構成とすることができる。

（１）．入力データ（データセット２００）と、重み係数を用いて演算を行うニューラルネットワーク（ＤＮＮ１００）を有する演算装置（ＤＮＮ縮約自動化装置１）であって、前記入力データ（２００）による前記ニューラルネットワーク（ＤＮＮ１００）のニューロンの発火状態を算出するネットワーク解析部（２０）と、前記ニューロンの発火状態に基づいて、前記ニューラルネットワーク（１００）の縮約率が設定された複数の縮約パターンから縮約パターンの候補を絞り込み、前記絞り込んだ縮約パターンの候補に基づいて前記ニューラルネットワーク（１００）の縮約を実行して縮約後のニューラルネットワーク（１１０）を生成する縮約部３０と、を有する。

ネットワーク解析部２０は、適用先の特徴に応じて発火するニューロンと、発火しないニューロンの分布が異なる点に着目し、ＤＮＮ３００の適用先のアプリケーションに応じたデータセット２００によるニューロンの発火状態を特徴量とする。そして、ネットワーク解析部２０は、ニューラルネットワーク（ＤＮＮ１００）の特徴量を認識精度に対する感度と関連させることで、縮約率と認識精度の最適解を探索することが可能となる。

縮約部３０は、特徴量に基づいてニューラルネットワーク毎の縮約率を決定することで、ニューロンの数を大幅に削減してから縮約パターンの最適化などの演算を行うことが可能となって、縮約に要する演算時間を短縮することが可能となる。

（２）．上記（１）に記載の演算装置であって、前記縮約部（３０）で生成された前記縮約後のニューラルネットワーク（１１０）に推論を実行して推論誤差を算出し、前記複数の縮約パターンの中から前記推論誤差に基づいて縮約パターンを抽出する最適化エンジン部を（５０）さらに有する。

上記構成により、ＤＮＮ縮約自動化装置１は、最適化エンジン部５０では、縮約後のＤＮＮ候補１１０の推論誤差を縮約率（縮約パターン）にフィードバックすることで、認識精度の高い縮約済みＤＮＮ３００を生成することができる。

（３）．上記（２）に記載の演算装置であって、前記最適化エンジン部（５０）は、前記推論誤差が最小となる縮約パターンを抽出する。

上記構成により、ＤＮＮ縮約自動化装置１は、推論誤差が最小となる縮約パターンによって、認識精度の高い縮約済みＤＮＮ３００を生成することができる。

（４）．上記（１）に記載の演算装置であって、前記縮約部（３０）で生成された前記縮約後のニューラルネットワーク（１１０）に対して、前記入力データ（２００）によって再度学習を実施する再学習部（４０）を、さらに有する。

上記構成により、汎化性能の高い(縮約に対して頑健な)ＤＮＮを構築することができる

（５）．上記（２）に記載の演算装置であって、前記縮約部（３０）で生成された前記縮約後のニューラルネットワーク（１１０）に対して、前記入力データ（２００）によって再度学習を実施する再学習部（４０）を、さらに有し、前記ネットワーク解析部（２０）と、前記縮約部（３０）および前記最適化エンジン部（５０）ならびに前記再学習部（４０）の演算途中における中間データを一時的に格納するメモリ（１０）と、前記ネットワーク解析部（２０）と、前記縮約部（３０）と、前記再学習部（４０）と、前記最適化エンジン部（５０）および前記メモリ（１０）をスレーブとし、前記スレーブを制御するマスタとしてのスケジューラ（８０）と、前記マスタと前記スレーブを接続するインターコネクト（５）と、をさらに有する。

上記構成により、ＤＮＮ縮約自動化装置１をハードウェアで構成することで、縮約処理の高速化を図ることが可能となる。

（６）．上記（１）に記載の演算装置であって、前記ネットワーク解析部（２０）は、前記ニューラルネットワーク（１００）と、前記縮約後のニューラルネットワーク（３００）の適用先に応じた入力データ（２００）を受け付け、前記ニューラルネットワーク（１００）の各ニューロンの発火状態を推定して数値化した特徴量を算出し、当該特徴量を前記適用先に特有の特徴を包含した解析結果として出力する。

縮約済みＤＮＮ３００の適用先に応じたデータセット２００によるニューロンの発火状態に基づく特徴量を解析結果とすることで、適用先のアプリケーションに最適な縮約率の組み合わせを提供することが可能となる。

（７）．上記（６）に記載の演算装置であって、前記縮約部（３０）は、前記ネットワーク解析部（２０）の解析結果を受け付け、前記解析結果において数値化された特徴量に基づいてニューラルネットワーク（１００）の縮約を実行し、前記縮約後のニューラルネットワーク（１１０）および前記重み係数の最適解候補を複数出力する。

上記構成によって、ＤＮＮ縮約自動化装置１は、特徴量を算出しておくことで、縮約率と認識精度に優れた縮約パターンに絞り込むことが可能となって、縮約の際の演算量を削減して短時間で縮約処理を完了させることが可能となる。また、ＤＮＮ縮約自動化装置１は、ＤＮＮ１００の縮約処理に、人手を必要としないため、ＤＮＮ１００の縮約にかかる労力を大幅に削減することが可能となる。

（８）．上記（１）に記載の演算装置であって、前記縮約部（３０）は、縮約手法が異なる複数の縮約実行部（プルーニング３１、低ランク近似３２、重み共有３３、低ビット化３４）を有し、前記ニューラルネットワーク（３００）の適用先に応じて前記縮約実行部（３１）～３４を切り替える。

上記構成によって、縮約部３０は、縮約済みＤＮＮ３００の適用先に応じた縮約の手法を選択することが可能となって、処理時間の削減と、認識精度の向上を図ることができる。

（９）．上記（７）に記載の演算装置であって、前記縮約部（３０）が出力する縮約後のニューラルネットワーク（１１０）に対して、前記入力データ（２００）によって再度学習を実施する再学習部（４０）を、さらに有し、前記再学習部（４０）は、前記ニューラルネットワーク（２００）および前記重み係数の最適解候補を入力として受け付け、前記ニューラルネットワーク（２００）および前記重み係数を初期値として、再び学習を行うことで、再学習済みのニューラルネットワーク（１１０）及び再学習済みの重み係数を出力する。

上記構成によって、再学習部４０は、縮約した後にも認識精度を確保可能なＤＮＮ３００を生成することができる。

（１０）．上記（９）に記載の演算装置であって、前記縮約部（３０）で縮約を実行した縮約後のニューラルネットワーク（１１０）に推論を実行して推論誤差を算出し、前記複数の縮約パターンの中から前記推論誤差に基づいて縮約パターンを抽出する最適化エンジン部（５０）を、さらに有し、前記最適化エンジン部（５０）は、複数の前記ニューラルネットワーク（１１０）および前記再学習済みの重み係数を入力として受け付けて、予め設定された確率論的探索を用いて、前記縮約パターンを算出する。

上記構成によって、最適化エンジン部５０は、推論誤差を低減可能な縮約パターンを推定することが可能となる。

なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に記載したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加、削除、又は置換のいずれもが、単独で、又は組み合わせても適用可能である。

また、上記の各構成、機能、処理部、及び処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、及び機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等の記録装置、または、ＩＣカード、ＳＤカード、ＤＶＤ等の記録媒体に置くことができる。

また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。

１ＤＮＮ縮約自動化装置
４データセンタ
５インターコネクト
１０メモリ
２０ネットワーク解析部
３０縮約部
４０再学習部
５０最適化エンジン部
６０縮約率補正部
７０精度判定部
８０スケジューラ
９０ストレージ
１００、３００ＤＮＮ
２００データセット２００

Claims

入力データと、重み係数を用いて演算を行うニューラルネットワークを有する演算装置であって、
前記入力データによる前記ニューラルネットワークのニューロンの発火状態を算出するネットワーク解析部と、
前記ニューロンの発火状態に基づいて、前記ニューラルネットワークの縮約率が設定された複数の縮約パターンから縮約パターンの候補を絞り込み、前記絞り込んだ縮約パターンの候補に基づいて前記ニューラルネットワークの縮約を実行して縮約後のニューラルネットワークを生成する縮約部と、
前記縮約部で生成された前記縮約後のニューラルネットワークに推論を実行して推論誤差を算出し、前記複数の縮約パターンの中から前記推論誤差に基づいて縮約パターンを抽出する最適化エンジン部と、
を有し、
前記最適化エンジン部は、
前記推論誤差が最小となる縮約パターンを抽出することを特徴とする演算装置。
請求項１に記載の演算装置であって、
前記縮約部で生成された前記縮約後のニューラルネットワークに対して、前記入力データによって再度学習を実施する再学習部を、さらに有することを特徴とする演算装置。
請求項１に記載の演算装置であって、
前記縮約部で生成された前記縮約後のニューラルネットワークに対して、前記入力データによって再度学習を実施する再学習部を、さらに有し、
前記ネットワーク解析部と、前記縮約部および前記最適化エンジン部ならびに前記再学習部の演算途中における中間データを一時的に格納するメモリと、
前記ネットワーク解析部と、前記縮約部と、前記再学習部と、前記最適化エンジン部および前記メモリをスレーブとし、前記スレーブを制御するマスタとしてのスケジューラと、
前記マスタと前記スレーブを接続するインターコネクトと、をさらに有することを特徴とする演算装置。
請求項１に記載の演算装置であって、
前記ネットワーク解析部は、
前記ニューラルネットワークと、前記縮約後のニューラルネットワークの適用先に応じた入力データとして受け付け、前記ニューラルネットワークの各ニューロンの発火状態を推定して数値化した特徴量を算出し、当該特徴量を前記適用先に特有の特徴を包含した解析結果として出力することを特徴とする演算装置。
請求項４に記載の演算装置であって、
前記縮約部は、
前記ネットワーク解析部の解析結果を受け付け、前記解析結果において数値化された特徴量に基づいてニューラルネットワークの縮約を実行し、前記縮約後のニューラルネットワークおよび前記重み係数の最適解候補を複数出力することを特徴とする演算装置。
請求項１に記載の演算装置であって、
前記縮約部は、
縮約手法が異なる複数の縮約実行部を有し、前記ニューラルネットワークの適用先に応じて前記縮約実行部を切り替えることを特徴とする演算装置。
請求項５に記載の演算装置であって、
前記縮約部が出力する縮約後のニューラルネットワークに対して、前記入力データによって再度学習を実施する再学習部を、さらに有し、
前記再学習部は、
前記ニューラルネットワークおよび前記重み係数の最適解候補を入力として受け付け、前記ニューラルネットワークおよび前記重み係数を初期値として、再び学習を行うことで、再学習済みのニューラルネットワーク及び再学習済みの重み係数を出力することを特徴とする演算装置。
請求項７に記載の演算装置であって、
前記縮約部で縮約を実行した縮約後のニューラルネットワークに推論を実行して推論誤差を算出し、前記複数の縮約パターンの中から前記推論誤差に基づいて縮約パターンを抽出する最適化エンジン部を、さらに有し、
前記最適化エンジン部は、
複数の前記ニューラルネットワークおよび前記再学習済みの重み係数を入力として受け付けて、予め設定された確率論的探索を用いて、前記縮約パターンを算出することを特徴とする演算装置。