JP7413249B2

JP7413249B2 - 情報処理装置、情報処理方法

Info

Publication number: JP7413249B2
Application number: JP2020218058A
Authority: JP
Inventors: 和香子中野; 理宇平井; 延之村中; 浩朗伊藤
Original assignee: Hitachi Astemo Ltd
Current assignee: Hitachi Astemo Ltd
Priority date: 2020-12-25
Filing date: 2020-12-25
Publication date: 2024-01-15
Anticipated expiration: 2040-12-25
Also published as: WO2022137696A1; DE112021005568T5; JP2022102966A

Description

本発明は、情報処理装置および情報処理方法に関する。

従来、カメラの撮影画像や各種センサの情報から車両の周囲状況を認識し、その認識結果に基づいて様々な運転支援を行う技術が広く利用されている。こうした車両の運転支援技術において、近年では複雑な周囲状況に対して高精度な認識結果を得るために、人間の大脳における神経細胞の働きをモデル化したディープニューラルネットワーク（ＤＮＮ）を利用した演算を行うことが提案されている。

従来のＤＮＮ演算では、多数の演算を並列で高速に実行するために、ＦＰＧＡ（Field Programmable Gate Array）やＧＰＵ（Graphics Processing Unit）が広く利用されている。近年では、こうしたＦＰＧＡやＧＰＵの代わりに、ＡＩアクセラレータと呼ばれるデバイスの利用が進んでいる。ＡＩアクセラレータとは、複数の演算コアを有しており、ベクトル型演算を得意とするＡＩ処理に特化した演算装置の一種である。

ＡＩアクセラレータは、上記のようにＤＮＮ演算におけるベクトル型演算に特化したものであるが、ＤＮＮ演算に必要な処理の全てを実行することはできず、一部の処理については実行が困難である。そのため、従来のＡＩアクセラレータを用いたＤＮＮ演算では、ＡＩアクセラレータとは別の演算処理部をＡＩアクセラレータに接続し、これらを協調動作させることでＤＮＮ演算を行っていた。この場合、ＤＮＮの各層についてＡＩアクセラレータと演算処理部がそれぞれの演算結果を受け渡すために、層ごとにデータ転送を行う必要がある。したがって、ＡＩアクセラレータと演算処理部の間でのデータ通信量が増大し、そのために広いバス帯域幅が必要となり、さらに演算処理部ではメモリリソースの使用率が大きくなってしまう。このように、ＡＩアクセラレータと演算処理部のような２つの演算部を用いてＤＮＮ演算を実行する従来の情報処理装置では、２つの演算部の間でのデータ通信量の増大によって様々な問題が生じる。なお、演算処理部には、例えば汎用のマイクロコンピュータ、プログラマブル集積回路、プログラマブル論理デバイス、システムオンチップなど、演算処理が可能な様々なデバイスを利用することが可能である。

ＡＩアクセラレータでは実行困難なＤＮＮ演算における処理の一つに、０パディングと呼ばれる処理がある。０パディングとは、ＤＮＮ演算の対象とされる特徴マップの端部分のデータの畳み込みを可能とするために、特徴マップの周囲に０データを挿入する処理のことである。すなわち、ＤＮＮ演算において畳み込み演算はベクトル同士の積和演算であるため、ＡＩアクセラレータを用いて実行することが可能であるが、畳み込み演算の前処理として必要な０パディングはベクトルを用いた演算ではないため、ＡＩアクセラレータでの実行が困難である。

ＤＮＮ演算での処理負荷の軽減に関して、特許文献１の技術が知られている。特許文献１には、特徴マップを格納したグローバルメモリと、重みデータを格納したローカルメモリと、演算処理回路とを備え、これらを用いて畳み込み演算を行うシステムが開示されている。このシステムでは、演算処理回路へのデータ送信速度がグローバルメモリよりもローカルメモリの方が速い場合に、演算処理回路で受信した入力特徴マップの同じ受信部分に対して複数の畳み込み演算を行うことで、メモリ回路網を往復するデータの移動を減らすようにしている。

特表２０２０－５０３５８４号公報

特許文献１の技術は、畳み込み演算におけるデータの移動を低減する技術であり、０パディング処理のようにＡＩアクセラレータでは実行困難な処理を演算処理回路で実行する際のデータ転送量を削減するものではない。したがって、ＡＩアクセラレータと演算処理部のような２つの演算部の間でのデータ通信量を削減することはできず、前述のような問題を解消するのは困難である。

本発明による情報処理装置は、特徴マップに対してＤＮＮ演算を実行するものであって、第１の演算部と、前記第１の演算部とバスを介して接続された第２の演算部と、前記ＤＮＮ演算で利用される重み情報を格納する記憶部と、を備え、前記第１の演算部は、前記特徴マップの一部である部分特徴マップと、前記部分特徴マップの前記特徴マップ中の位置を表す位置情報とを前記第２の演算部へ送信し、前記第２の演算部は、前記記憶部から前記重み情報を取得し、前記第１の演算部から送信される前記部分特徴マップおよび前記位置情報を受信し、前記位置情報に基づく所定の前処理を実行し、前記前処理の実行結果と前記部分特徴マップとを用いて、前記ＤＮＮ演算を実行する。
本発明による情報処理方法は、第１の演算部と、前記第１の演算部とバスを介して接続された第２の演算部と、ＤＮＮ演算で利用される重み情報を格納する記憶部と、を備える情報処理装置を用いて、特徴マップに対してＤＮＮ演算を実行するものであって、前記第１の演算部により、前記特徴マップの一部である部分特徴マップと、前記部分特徴マップの前記特徴マップ中の位置を表す位置情報を前記第２の演算部へ送信し、前記第２の演算部により、前記記憶部から前記重み情報を取得し、前記第１の演算部から送信される前記部分特徴マップおよび前記位置情報を受信し、前記位置情報に基づく所定の前処理を実行し、前記前処理の実行結果と前記部分特徴マップとを用いて、前記ＤＮＮ演算を実行する。

本発明によれば、２つの演算部を用いてＤＮＮ演算を行う情報処理装置において、２つの演算部の間でのデータ通信量を削減することができる。

本発明の一実施形態に係る情報処理装置の構成を示す図である。情報処理装置の構成要素間で送受信される情報の流れを示す図である。ＡＩアクセラレータにおけるＤＮＮ演算部の機能構成を示す図である。０パディング制御部により実行される処理の説明図である。演算層情報の例を示す図である。位置情報の例を示す図である。ＤＮＮ演算部の処理の流れを示すフローチャートである。上端処理、中央処理および下端処理の流れを示すフローチャートである。第１～第９領域に対する処理の流れを示すフローチャートである。位置情報再演算処理の流れを示すフローチャートである。重みレジスタと入力レジスタのデータ配置およびマスク箇所の一例を示す図である。本発明の第２の実施形態に係る演算処理の説明図である。本発明の第３の実施形態に係る演算処理の説明図である。本発明の第４の実施形態に係るマスク処理が必要でない場合の重みレジスタと入力レジスタのデータ配置およびマスク箇所の一例を示す図である。

（第１の実施形態）
図１は、本発明の一実施形態に係る情報処理装置の構成を示す図である。本実施形態の情報処理装置１は、外部から入力される特徴マップに対してＤＮＮ演算を実行するものであり、図１に示すように、ＡＩアクセラレータ１０、演算処理部２０および記憶部３０を備えて構成される。

演算処理部２０は、例えばマイクロコンピュータを用いて構成されており、所定の演算処理を実行する。演算処理部２０には、不図示の外部装置から、ＤＮＮ演算の実行対象である特徴マップが入力される。例えば、車両に搭載されたカメラによって撮影された画像や、車両に搭載されたＬｉＤＡＲ（Light Detection and Ranging）やレーダによって取得された距離情報などが、車両周辺の物体認識を行うための特徴マップとして演算処理部２０に入力される。なお、記憶部３０に記憶された特徴マップを演算処理部２０に入力してもよい。

記憶部３０は、例えばＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）等の不揮発性の記録媒体を用いて構成されており、情報処理装置１が行うＤＮＮ演算において利用される情報が格納されている。記憶部３０に格納されている情報には、例えばＤＮＮ演算における畳み込み演算に使用される重み情報などが含まれる。

ＡＩアクセラレータ１０は、ベクトル型演算を得意とするＡＩ処理に特化した演算装置の一種であり、演算処理部２０とバスを介して接続されている。ＡＩアクセラレータ１０には、演算処理部２０に入力された特徴マップの一部が演算処理部２０からバスを介して送信される。以下では、演算処理部２０に入力される特徴マップを「全体特徴マップ」、演算処理部２０からＡＩアクセラレータ１０へ送信される特徴マップの一部を「部分特徴マップ」とそれぞれ称することで、これらを互いに区別する。また、部分特徴マップの全体特徴マップ中の位置を表す位置情報も、部分特徴マップとともに演算処理部２０からバスを介して送信される。

ＡＩアクセラレータ１０は、ＤＮＮの各層に対応してＮ個のＤＮＮ演算部１１を有している。各ＤＮＮ演算部１１は、ＡＩアクセラレータ１０において第１層から第Ｎ層まで順に接続されており、各層のＤＮＮ演算を行うカーネル１３（図３参照）を有している。

第１層のＤＮＮ演算部１１には、演算処理部２０からＡＩアクセラレータ１０へ送信される部分特徴マップおよび位置情報が入力されるとともに、記憶部３０から重み情報が入力される。第１層のＤＮＮ演算部１１は、これらの入力データに基づいて第１層のＤＮＮ演算を実行し、その演算結果を次層（第２層）のＤＮＮ演算部１１へ出力する。第２層のＤＮＮ演算部１１は、前層（第１層）のＤＮＮ演算部１１の演算結果と、記憶部３０から入力される重み情報とに基づいて、第２層のＤＮＮ演算を実行し、その演算結果を次層のＤＮＮ演算部１１へ出力する。これ以降の各層のＤＮＮ演算部１１でも、同様の演算処理が行われる。なお、最終層（第Ｎ層）のＤＮＮ演算部１１の演算結果は、ＡＩアクセラレータ１０による最終的なＤＮＮ演算の結果として、演算処理部２０へ出力される。このようにして、各層のＤＮＮ演算部１１が対応する層のＤＮＮ演算をそれぞれ行うことにより、ＡＩアクセラレータ１０においてＤＮＮ演算が実行される。

図２は、情報処理装置１の構成要素であるＡＩアクセラレータ１０、演算処理部２０および記憶部３０の間で送受信される情報の流れを示す図である。図２において、実線の矢印は、矢印の起点から終点に向けたデータの送信を表している。また、破線の矢印は、矢印の起点から終点に向けたデータのストリーム転送、すなわち送信側から受信側への連続したデータの流れを表している。

情報処理装置１においてＤＮＮ演算の実行が開始されると、まず記憶部３０からＡＩアクセラレータ１０に向けて重み情報が送信される。続いて、演算処理部２０からＡＩアクセラレータ１０へ特徴マップの送信が開始される。このとき演算処理部２０は、全体特徴マップを所定のデータサイズごとに分割することで複数の部分特徴マップを生成し、順次ＡＩアクセラレータ１０へ送信する。さらにこのとき、演算処理部２０は、各部分特徴マップをＡＩアクセラレータ１０へ送信するごとに、当該部分特徴マップの全体特徴マップ中での位置を表す位置情報を算出し、ＡＩアクセラレータ１０へ送信する。

ＡＩアクセラレータ１０は、演算処理部２０から送信された部分特徴マップおよび位置情報を受信すると、事前に記憶部３０から受信した重み情報を用いて、これらの入力データに基づくＤＮＮ演算を各層のＤＮＮ演算部１１において順次実行する。全ての層についてＤＮＮ演算の実行を終えたら、その演算結果を演算処理部２０に出力する。

図３は、ＡＩアクセラレータ１０におけるＤＮＮ演算部１１の機能構成を示す図である。ＡＩアクセラレータ１０において、ＤＮＮの各層に対応するＤＮＮ演算部１１は、ローカル記憶領域１２およびカーネル１３をそれぞれ備えて構成される。

ローカル記憶領域１２は、ＤＮＮ演算部１１に入力された情報を一時的に記憶してカーネル１３に受け渡す機能を有する。ローカル記憶領域１２には、位置情報１２１、演算層情報１２２、重み情報１２３および部分特徴マップ１２４が格納される。位置情報１２１は、部分特徴マップ１２４が元の全体特徴マップにおいてどの位置にあるかを表す情報であり、演算処理部２０または前層のＤＮＮ演算部１１から入力される。演算層情報１２２は、当該ＤＮＮ演算部１１が実行するＤＮＮ演算の特徴を表す情報であり、ローカル記憶領域１２において予め格納される。重み情報１２３は、当該ＤＮＮ演算部１１が実行するＤＮＮ演算の畳み込み演算において用いられる情報であり、記憶部３０から入力される。部分特徴マップ１２４は、当該ＤＮＮ演算部１１の演算対象データであり、演算処理部２０または前層のＤＮＮ演算部１１から入力される。

カーネル１３は、０パディング制御部１３１、次カーネル位置情報生成部１３２および畳み込み演算部１３３を備える。畳み込み演算部１３３は、重みレジスタ３０１、入力レジスタ３０２、積和演算部３０３および出力レジスタ３０４を備える。

０パディング制御部１３１は、ローカル記憶領域１２からロードされて重みレジスタ３０１に格納された重み情報１２３に対して、位置情報１２１に基づく０パディング相当の処理を行う。ここで行われる０パディング相当の処理とは、位置情報１２１により表される位置において部分特徴マップ１２４が全体特徴マップの端部を含む場合に、その端部に対する畳み込み演算を実行可能とするため、重み情報１２３において位置情報１２１に対応する箇所を０データでマスクする処理のことである。すなわち、０パディング制御部１３１が重みレジスタ３０１に対して０パディング相当の処理を行うことにより、重みレジスタ３０１に格納された重み情報１２３の一部が０データに置き換えられ、マスク済み重み情報が生成される。

畳み込み演算部１３３は、ローカル記憶領域１２から、重み情報１２３と部分特徴マップ１２４を重みレジスタ３０１と入力レジスタ３０２にそれぞれロードする。積和演算部３０３は、重みレジスタ３０１に格納されて０パディング制御部１３１により０パディング相当の処理が行われたマスク済み重み情報と、入力レジスタ３０２に格納された部分特徴マップとを用いて、部分特徴マップの各データ値に対する畳み込み演算（積和演算）を実行する。積和演算部３０３の演算結果は出力レジスタ３０４に格納され、出力レジスタ３０４から次層のＤＮＮ演算部１１または演算処理部２０に出力される。

出力レジスタ３０４より出力された演算結果が次層のＤＮＮ演算部１１に入力されると、次層のＤＮＮ演算部１１は、その演算結果を部分特徴マップ１２４としてローカル記憶領域１２に格納する。そして、この部分特徴マップ１２４を演算対象データとして、畳み込み演算部１３３により畳み込み演算を実行する。

次カーネル位置情報生成部１３２は、ローカル記憶領域１２に格納された位置情報１２１および演算層情報１２２に基づいて、次層のＤＮＮ演算部１１における部分特徴マップ１２４として出力レジスタ３０４から送信される畳み込み演算結果が、元の全体特徴マップにおいてどの位置にあるかを判別する。そして、この判別結果に基づいて位置情報を生成し、次層のＤＮＮ演算部１１へ出力する。

図４は、０パディング制御部１３１により実行される処理の説明図である。図４では、演算処理部２０において全体特徴マップ４０１が縦方向と横方向にそれぞれ５分割された各部分特徴マップのうち、全体特徴マップ４０１の右上端部分に位置する部分特徴マップ１２４を演算対象とするＤＮＮ演算部１１において、０パディング制御部１３１によって０パディング相当の処理を行う場合の例を示している。なお、図４の例では、部分特徴マップ１２４に対して３×３の重みデータで構成される重み情報１２３を用いて、１データごとのストライドにより畳み込み演算を行うものとしている。

図４に示すように、畳み込み演算時に３×３の重みデータが全体特徴マップ４０１上を移動する範囲の領域を畳み込み演算領域４０２とすると、この畳み込み演算領域４０２は、全体特徴マップ４０１が有する上下左右の端部のうちどの部分が含まれるかにより、９種類の領域に分けられる。具体的には、畳み込み演算領域４０２は、左上角部を含む第１領域と、上端部を含む第２領域と、右上角部を含む第３領域と、左端部を含む第４領域と、いずれの端部も含まない第５領域と、右端部を含む第６領域と、左下角部を含む第７領域と、下端部を含む第８領域と、右下角部を含む第９領域と、に分けられる。

ここで、全体特徴マップ４０１を分割した各部分特徴マップのうち、例えば前述のように全体特徴マップ４０１の右上に位置する部分特徴マップ１２４が入力された場合、ＤＮＮ演算部１１は、この部分特徴マップ１２４に対して、３×３の重みデータを左から右に向かってストライドに応じた移動距離ずつ移動させながら、各位置での畳み込み演算を行う。そして、重みデータが部分特徴マップ１２４の右端まで到達してその位置での畳み込み演算が終了すると、重みデータをストライド分の移動距離だけ下方向にずらした後、再び左から右に向かって畳み込み演算を開始する。このようにして、部分特徴マップ１２４の全ての位置に対して畳み込み演算が行われることにより、ＤＮＮ演算の特定の層に対応する演算がＤＮＮ演算部１１において実行される。

ＤＮＮ演算部１１において０パディング制御部１３１は、位置情報１２１に基づいて、畳み込み演算が行われる部分特徴マップ１２４の位置ごとに、その畳み込み演算の範囲が前述の第１～第９領域のうちどの領域に属するかを判定する。例えば、部分特徴マップ１２４において最初に畳み込み演算が行われる左上の部分は第２領域に属し、右上の部分は第３領域に属すると判定される。同様にして、部分特徴マップ１２４の各位置について領域判定が行われることにより、符号４０３に示すような領域判定結果が得られる。この領域判定結果４０３では、部分特徴マップ１２４の各位置が第１～第９領域のうちどの領域に属するかを丸数字で表している。

上記のようにして部分特徴マップ１２４の各位置に対する領域判定結果が得られたら、０パディング制御部１３１は、この領域判定結果に基づいて、重みレジスタ３０１に格納された重み情報１２３に対するマスク箇所を決定する。ここでは、部分特徴マップ１２４とマスク後の重み情報１２３との畳み込み演算結果が、部分特徴マップ１２４の端部分に対して１行１列分の０データを付加する０パディング処理を行った後に重み情報１２３で畳み込み演算を行ったときの演算結果と一致するように、マスク箇所を決定する。そして、重みレジスタ３０１において決定したマスク箇所の重み情報１２３の値を０とすることにより、重みレジスタ３０１に対して、０パディング相当の処理としてのマスク処理を実行する。こうしてマスク処理が実行された後の重みレジスタ３０１におけるマスク済み重み情報を生成する。

なお、第５領域に属する位置では０パディング処理が不要である。そのため、第５領域に属する位置において畳み込み演算が行われるときには、０パディング制御部１３１によるマスク処理を実行する必要がない。

図５は、各ＤＮＮ演算部１１においてローカル記憶領域１２に格納される演算層情報１２２の例を示す図である。演算層情報１２２は、例えばサイズ変化率５０１、重みサイズ５０２、ストライド５０３、パディング幅５０４、入力特徴マップ幅５０５、入力特徴マップ高さ５０６、入力特徴マップチャンネル数５０７、出力特徴マップチャンネル数５０８の各データにより構成される。これらのデータは、当該ＤＮＮ演算部１１が行う演算の内容に対応して、それぞれの値が設定される。

サイズ変化率５０１は、演算前後での部分特徴マップのサイズの変化率を表している。重みサイズ５０２は重みデータの一辺のサイズを表し、ストライド５０３は部分特徴マップに対して重み付け演算を行う間隔を表し、パディング幅５０４は０パディング時に部分特徴マップに付加する０データの一辺あたりの幅を表している。入力特徴マップ幅５０５および入力特徴マップ高さ５０６は、演算対象とする部分特徴マップの水平方向と垂直方向のデータ数をそれぞれ表している。入力特徴マップチャンネル数５０７および出力特徴マップチャンネル数５０８は、演算前後での部分特徴マップの深さ方向のデータ数をそれぞれ表している。

図６は、各ＤＮＮ演算部１１においてローカル記憶領域１２に格納される位置情報１２１の例を示す図である。位置情報１２１は、例えば分割ＩＤ６０１、全体特徴マップ幅６０２、全体特徴マップ高さ６０３、演算層６０４、開始ｘ座標６０５、開始ｙ座標６０６、終点ｘ座標６０７、終点ｙ座標６０８、横畳み込み数６０９、縦畳み込み数６１０の各データにより構成される。これらのデータは、当該ＤＮＮ演算部１１に入力されて演算対象とされる部分特徴マップの特徴に対応して、それぞれの値が設定される。

分割ＩＤ６０１は、当該ＤＮＮ演算部１１において部分特徴マップをさらに複数に分割して処理する場合に、各分割部分特徴マップをそれぞれ識別するために付与されるＩＤを表す情報である。なお、部分特徴マップを複数に分割して処理する場合については、後で第２の実施形態として詳しく説明する。

全体特徴マップ幅６０２および全体特徴マップ高さ６０３は、部分特徴マップに分割される前の元の全体特徴マップの水平方向と垂直方向のデータ数をそれぞれ表している。

演算層６０４は、当該ＤＮＮ演算部１１において実行される演算が対応するＤＮＮの層を表す情報である。

開始ｘ座標６０５および開始ｙ座標６０６は、部分特徴マップにおいて畳み込み演算が開始される左上の点の全体特徴マップ上での座標値をそれぞれ表している。終点ｘ座標６０７および終点ｙ座標６０８は、部分特徴マップにおいて畳み込み演算が最後に行われる右下の点の全体特徴マップ上での座標値をそれぞれ表している。横畳み込み数６０９および縦畳み込み数６１０は、部分特徴マップに対して行われる畳み込み演算の横方向と縦方向での回数をそれぞれ表している。

次に、ＡＩアクセラレータ１０におけるＤＮＮ演算部１１の処理の流れについて説明する。図７は、ＤＮＮ演算部１１の処理の流れを示すフローチャートである。図７のフローチャートに示す処理は、ＡＩアクセラレータ１０が有する各ＤＮＮ演算部１１において実行される。

ステップＳ７０１では、演算処理部２０または前層のＤＮＮ演算部１１から入力されてローカル記憶領域１２に格納された位置情報１２１および部分特徴マップ１２４に基づき、演算対象の部分特徴マップが全体特徴マップの上端部分を含むか否かを判定する。上端部分を含む場合は、ステップＳ７０２で図８（ａ）に示す上端処理を行った後にステップＳ７０３へ進む。上端部分を含まない場合は、ステップＳ７０２の上端処理を実行せずにステップＳ７０３へ進む。

ステップＳ７０３では、演算対象の部分特徴マップに対する垂直方向の畳み込み演算の回数分だけステップＳ７０４の処理を繰り返し実行し、その後にステップＳ７０５へ進む。ステップＳ７０４では、図８（ｂ）に示す中央処理を行う。

ステップＳ７０５では、位置情報１２１および部分特徴マップ１２４に基づき、演算対象の部分特徴マップが全体特徴マップの下端部分を含むか否かを判定する。下端部分を含む場合は、ステップＳ７０６で図８（ｃ）に示す下端処理を行った後にステップＳ７０７へ進む。下端部分を含まない場合は、ステップＳ７０６の下端処理を実行せずにステップＳ７０７へ進む。

ステップＳ７０７では、次カーネル位置情報生成部１３２により、図１０に示す位置情報再演算処理を行う。ステップＳ７０７の位置情報再演算処理を終えたら、図７のフローチャートに示す処理を終了する。

図８は、図７のステップＳ７０２、Ｓ７０４、Ｓ７０６でそれぞれ実行される上端処理、中央処理および下端処理の流れを示すフローチャートである。

図８（ａ）に示す上端処理において、ステップＳ７１１では、位置情報１２１および部分特徴マップ１２４に基づき、演算対象の部分特徴マップが全体特徴マップの左端部分を含むか否かを判定する。左端部分を含む場合は、ステップＳ７１２で第１領域に対する処理を行った後にステップＳ７１３へ進む。左端部分を含まない場合は、ステップＳ７１２の処理を実行せずにステップＳ７１３へ進む。

ステップＳ７１３では、演算対象の部分特徴マップに対する水平方向の畳み込み演算の回数分だけステップＳ７１４の処理を繰り返し実行し、その後にステップＳ７１５へ進む。ステップＳ７１４では、第２領域に対する処理を行う。

ステップＳ７１５では、位置情報１２１および部分特徴マップ１２４に基づき、演算対象の部分特徴マップが全体特徴マップの右端部分を含むか否かを判定する。右端部分を含む場合は、ステップＳ７１６で第３領域に対する処理を行った後に、図８（ａ）のフローチャートに示す上端処理を終了する。右端部分を含まない場合は、ステップＳ７１６の処理を実行せずに上端処理を終了する。

図８（ｂ）に示す中央処理において、ステップＳ７２１では、位置情報１２１および部分特徴マップ１２４に基づき、演算対象の部分特徴マップが全体特徴マップの左端部分を含むか否かを判定する。左端部分を含む場合は、ステップＳ７２２で第４領域に対する処理を行った後にステップＳ７２３へ進む。左端部分を含まない場合は、ステップＳ７２２の処理を実行せずにステップＳ７２３へ進む。

ステップＳ７２３では、演算対象の部分特徴マップに対する水平方向の畳み込み演算の回数分だけステップＳ７２４の処理を繰り返し実行し、その後にステップＳ７２５へ進む。ステップＳ７２４では、第５領域に対する処理を行う。

ステップＳ７２５では、位置情報１２１および部分特徴マップ１２４に基づき、演算対象の部分特徴マップが全体特徴マップの右端部分を含むか否かを判定する。右端部分を含む場合は、ステップＳ７２６で第６領域に対する処理を行った後に、図８（ｂ）のフローチャートに示す中央処理を終了する。右端部分を含まない場合は、ステップＳ７２６の処理を実行せずに中央処理を終了する。

図８（ｃ）に示す下端処理において、ステップＳ７３１では、位置情報１２１および部分特徴マップ１２４に基づき、演算対象の部分特徴マップが全体特徴マップの左端部分を含むか否かを判定する。左端部分を含む場合は、ステップＳ７３２で第７領域に対する処理を行った後にステップＳ７３３へ進む。左端部分を含まない場合は、ステップＳ７３２の処理を実行せずにステップＳ７３３へ進む。

ステップＳ７３３では、演算対象の部分特徴マップに対する水平方向の畳み込み演算の回数分だけステップＳ７３４の処理を繰り返し実行し、その後にステップＳ７３５へ進む。ステップＳ７３４では、第８領域に対する処理を行う。

ステップＳ７３５では、位置情報１２１および部分特徴マップ１２４に基づき、演算対象の部分特徴マップが全体特徴マップの右端部分を含むか否かを判定する。右端部分を含む場合は、ステップＳ７３６で第９領域に対する処理を行った後に、図８（ｃ）のフローチャートに示す下端処理を終了する。右端部分を含まない場合は、ステップＳ７３６の処理を実行せずに下端処理を終了する。

図９は、図８のステップＳ７１２、Ｓ７１４、Ｓ７１６、Ｓ７２２、Ｓ７２４、Ｓ７２６、Ｓ７３２、Ｓ７３４、Ｓ７３６においてそれぞれ実行される第１～第９領域に対する処理の流れを示すフローチャートである。

図９（ａ）のフローチャートにおいて、ステップＳ８０１では、畳み込み演算部１３３により、ローカル記憶領域１２に格納されている重み情報１２３と部分特徴マップ１２４を読み出し、重みレジスタ３０１と入力レジスタ３０２にそれぞれ格納する。

ステップＳ８０２では、０パディング制御部１３１により、領域の種類に応じたマスク位置を決定するマスク位置決定処理を行う。ここでは、図９（ｂ）のフローチャートに示す手順に従ってマスク位置決定処理が実行される。

ステップＳ８０３では、畳み込み演算部１３３により、ステップＳ８０２のマスク位置決定処理で決定されたマスク位置に従って、重みレジスタ３０１に対するマスク処理を行う。ここでは前述のように、重みレジスタ３０１に格納された重み情報１２３においてマスク位置の値を０データでマスクすることにより、０パディング相当の処理としてマスク処理を行う。ただし、０パディング処理が不要な第５領域については、後述するようにマスク位置が設定されていない。そのため、ステップＳ７２４の第５領域の処理では、ステップＳ８０２でマスク位置が出力されず、そのためステップＳ８０３においてマスク処理が行われない。

ステップＳ８０４では、畳み込み演算部１３３により、積和演算部３０３を用いて、ステップＳ８０３のマスク処理によって生成されたマスク済み重み情報、すなわちマスク処理後の重みレジスタ３０１の重み情報１２３と、入力レジスタ３０２に格納された部分特徴マップ１２４との積和演算（畳み込み演算）を行う。その後、出力レジスタ３０４から演算結果を出力し、図９（ａ）のフローチャートに示す処理を終了する。

図９（ｂ）に示すマスク位置決定処理において、ステップＳ８１１では、演算対象の部分特徴マップが属する領域を取得する。ここでは、図８のステップＳ７１２、Ｓ７１４、Ｓ７１６、Ｓ７２２、Ｓ７２４、Ｓ７２６、Ｓ７３２、Ｓ７３４、Ｓ７３６のどの処理でマスク位置決定処理が実行されているかにより、第１～第９領域のうちどの領域に属するかを判定する。

ステップＳ８１２では、０パディング制御部１３１により、ステップＳ８１１で取得した領域でのマスク位置を照会する。ここでは、第１～第９領域の各領域に対して予め設定されたマスク位置のうち、ステップＳ８１１で取得した領域に対応するマスク位置を照会することで、当該領域でのマスク位置を決定する。なお、０パディング制御部１３１では、第１～第９領域の各領域について、部分特徴マップ１２４とマスク後の重み情報１２３との畳み込み演算結果が、各領域に応じた部分特徴マップ１２４の端部に対して０パディング処理を行った後に重み情報１２３で畳み込み演算を行ったときの演算結果と一致するように、マスク位置が予め設定されているものとする。ただし、０パディング処理が不要な第５領域については、マスク位置が設定されていない。

０パディング制御部１３１は、ステップＳ８１２の処理において、上記のように予め設定されたマスク位置の情報を照会して利用することで、０パディング処理に相当するマスク位置を領域ごとに決定することができる。これにより、各領域における全体特徴マップの端部の位置に応じて、重み情報１２３においてマスクする箇所を正しく決定することができる。

ステップＳ８１３では、ステップＳ８１２で決定したマスク位置を０パディング制御部１３１から畳み込み演算部１３３へ出力する。ステップＳ８１３の処理を終えたら、図９（ｂ）のフローチャートに示すマスク位置決定処理を終了する。

図１０は、図７のステップＳ７０７で実行される位置情報再演算処理の流れを示すフローチャートである。

図１０（ａ）に示す位置情報再演算処理において、ステップＳ９０１では、演算層情報１２２に含まれるサイズ変化率５０１の値に基づき、畳み込み演算部１３３が行う畳み込み演算（積和演算）によって部分特徴マップの大きさが変化するか否かを判定する。サイズ変化率５０１の値が１以外の値であれば、部分特徴マップの水平方向および垂直方向の少なくとも一方の大きさが変化すると判定し、ステップＳ９０２へ進む。サイズ変化率５０１の値が１であれば、部分特徴マップの大きさが変化しないと判定し、ステップＳ９０２の処理を実行せずにステップＳ９０３へ進む。

ステップＳ９０２では、次カーネル位置情報生成部１３２により、演算層情報１２２に基づいて位置情報１２１を再計算する。ここでは、演算層情報１２２に含まれる各データ値に基づいて、位置情報１２１に含まれる各データ値を再計算する。

ステップＳ９０２では、例えば図１０（ｂ）に示す（１）～（７）の各計算式により、位置情報１２１の各データ値が再計算される。式（１）～（７）において、WW、WHは全体特徴マップ幅６０２、全体特徴マップ高さ６０３の値をそれぞれ表す。また、x、yは開始ｘ座標６０５、開始ｙ座標６０６の値をそれぞれ表し、endx、endyは終点ｘ座標６０７、終点ｙ座標６０８の値をそれぞれ表す。また、OW、OHは横畳み込み数６０９、縦畳み込み数６１０の値をそれぞれ表す。さらに、IW、IHは演算層情報１２２の入力特徴マップ幅５０５、入力特徴マップ高さ５０６の値をそれぞれ表し、k、k+1はＤＮＮ演算の全体における現在の演算層と次の演算層の位置（何層目か）をそれぞれ表し、KS、strideは演算層情報１２２の重みサイズ５０２、ストライド５０３の値をそれぞれ表す。

式（１）～（７）により、WW、WH、x、yは、現在の位置情報１２１におけるこれらの値に、演算層情報１２２のサイズ変化率５０１の値をそれぞれ乗算し、小数点以下の値を切り上げることで算出される。また、endx、endyは、次層のx、yにIW、IHをそれぞれ加えて算出される。また、OW、OHは、IW、IHからKSをそれぞれ減算した値をストライドで除算し、その切り捨て値に１を加えて算出される。

ステップＳ９０３では、次カーネル位置情報生成部１３２により、次層のＤＮＮ演算部１１に対する位置情報を作成する。ここでは、ローカル記憶領域１２に格納された位置情報１２１、またはこれにステップＳ９０２で再計算された値が反映された位置情報において、演算層６０４の値をインクリメントして次層のＤＮＮ演算部１１に対応する値とすることで、次層の位置情報を作成する。

ステップＳ９０４では、ステップＳ９０３で作成した位置情報を次カーネル位置情報生成部１３２から次層のＤＮＮ演算部１１へ送信する。ステップＳ９０４の処理を終えたら、図１０のフローチャートに示す位置情報再演算処理を終了する。

ＡＩアクセラレータ１０では、各ＤＮＮ演算部１１において上記の処理がそれぞれ実行されることにより、演算処理部２０から入力された部分特徴マップの各位置に対して、全体特徴マップの畳み込み演算領域内に設定された各領域の種類に応じた処理がそれぞれ行われる。これにより、ＡＩアクセラレータ１０において０パディング相当の処理を行ってマスク済み重み情報を生成し、このマスク済み重み情報を用いてＤＮＮの各層に対応する畳み込み演算を実行することができる。

図１１は、重みレジスタ３０１と入力レジスタ３０２のデータ配置およびマスク箇所の一例を示す図である。図１１では、前述のように重み情報１２３が３×３の重みデータで構成されているときに、重みレジスタ３０１に一度に入力４チャンネル分、出力８チャンネル分の合計３２個の重みデータが格納されている例を示している。この場合、図１１に示すように、例えば重みレジスタ３０１には、３２個の重みデータにおける横３データ分の値がそれぞれ格納される。図１１では、重み情報１２３を構成する３２個の重みデータにおける３×３のデータ値のうち、０～９５の数字が付された箇所のデータ値が重みレジスタ３０１にそれぞれ格納されている。これらの数字は、重みレジスタ３０１の各格納箇所に付された数字と対応している。なお、重みレジスタ３０１中で９６～１２７の数字が付された格納箇所には、重みのデータ値が入っていない。

また、図１１に示すように、例えば入力レジスタ３０２には、ローカル記憶領域１２からロードされた４チャンネル分の部分特徴マップ１２４のうち、０～２７の数字が付された部分のデータ値がそれぞれ格納される。これらの数字も重みレジスタ３０１と同様に、入力レジスタ３０２の各格納箇所に付された数字と対応している。なお、入力レジスタ３０２において「ｘ」が付された先頭の４つの格納箇所には、例えば他の格納箇所のうちいずれかと同じデータ値など、任意のデータ値を格納することができる。

図１１に示した重みレジスタ３０１の各データ値と入力レジスタ３０２の各データ値との畳み込み演算を行う場合に、例えば第４領域に属する位置での畳み込み演算時には、符号１１０１に示す範囲、すなわち「set0」の行に対応する０～３１の数字が付された各格納箇所のデータ値に対してマスク処理が行われる。これにより、重み情報１２３に対して０パディング相当の重みデータを設定することが可能となる。

以上説明した本発明の第１の実施形態によれば、以下の作用効果を奏する。

（１）情報処理装置１は、特徴マップに対してＤＮＮ演算を実行するものであって、演算処理部２０と、演算処理部２０とバスを介して接続されたＡＩアクセラレータ１０と、ＤＮＮ演算で利用される重み情報を格納する記憶部３０とを備える。演算処理部２０は、特徴マップの一部である部分特徴マップ１２４と、部分特徴マップ１２４の特徴マップ中の位置を表す位置情報１２１とをＡＩアクセラレータ１０へ送信する。ＡＩアクセラレータ１０は、記憶部３０から重み情報１２３を取得し、演算処理部２０から送信される部分特徴マップ１２４および位置情報１２１を受信する。そして、位置情報１２１に基づく所定の前処理を実行し（ステップＳ８１１～Ｓ８１３、Ｓ８０３）、その前処理の実行結果と部分特徴マップ１２４とを用いて、ＤＮＮ演算を実行する（ステップＳ８０４）。このようにしたので、ＡＩアクセラレータ１０および演算処理部２０の２つの演算部を用いてＤＮＮ演算を行う情報処理装置１において、ＡＩアクセラレータ１０により０パディング処理に相当する前処理を行うことができるため、これら２つの演算部の間でのデータ通信量を削減することができる。

（２）ＡＩアクセラレータ１０が実行する前処理は、重み情報１２３において位置情報１２１に対応する箇所をマスクする処理である。ＡＩアクセラレータ１０は、前処理を行うことで生成したマスク済み重み情報と部分特徴マップ１２４とを用いて、ＤＮＮ演算としての積和演算をステップＳ８０４において実行する。このようにしたので、ＡＩアクセラレータ１０において実行可能な処理として、０パディング処理に相当する前処理を実現できる。

（３）ＡＩアクセラレータ１０は、位置情報１２１に基づいて、特徴マップに設定された複数の領域のうちどの領域に部分特徴マップ１２４が属するかを判定し（ステップＳ７０１～Ｓ７０７、Ｓ７１１～Ｓ７１６、Ｓ７２１～Ｓ７２６、Ｓ７３１～Ｓ７３６）、当該領域に対応する箇所をマスクする処理を、ステップＳ８１１～Ｓ８１３、Ｓ８０３において前処理として実行する。具体的には、特徴マップに設定された複数の領域は、図４において示すように、特徴マップ４０１の左上角部を含む第１領域と、特徴マップ４０１の上端部を含む第２領域と、特徴マップ４０１の右上角部を含む第３領域と、特徴マップ４０１の左端部を含む第４領域と、特徴マップ４０１のいずれの端部も含まない第５領域と、特徴マップ４０１の右端部を含む第６領域と、特徴マップ４０１の左下角部を含む第７領域と、特徴マップ４０１の下端部を含む第８領域と、特徴マップ４０１の右下角部を含む第９領域と、を有する。ＡＩアクセラレータ１０は、部分特徴マップ１２４が第５領域以外の各領域に属する場合は、ステップＳ８１１、Ｓ８１２において、当該領域における特徴マップの端部の位置に応じて、重み情報１２３においてマスクする箇所を決定し、部分特徴マップ１２４が第５領域に属する場合は、ステップＳ８０３においてマスクする処理を実行しない。このようにしたので、０パディング処理に相当する前処理を確実に行うことができる。

（４）ＡＩアクセラレータ１０は、ベクトル演算に特化した複数の演算コアを有しており、これら複数の演算コアを用いたＡＩ処理によってＤＮＮ演算を実行する。このようにしたので、ＤＮＮ演算を高速に実行することができる。

（５）ＡＩアクセラレータ１０は、ＤＮＮの各層に対応する複数のカーネル１３を有している。ＤＮＮ演算において複数のカーネル１３のいずれかで部分特徴マップ１２４の水平方向および垂直方向の少なくとも一方の大きさが変化する場合（ステップＳ９０１：Ｙｅｓ）、当該カーネル１３は、位置情報１２１を再計算して（ステップＳ９０２）次層に対応するカーネル１３へ送信する（ステップＳ９０４）。このようにしたので、複数の層によって構成されるＤＮＮを利用したＤＮＮ演算において、ＡＩアクセラレータ１０による０パディング処理に相当する前処理を適用することができる。

（第２の実施形態）
次に、本発明の第２の実施形態について説明する。本実施形態では、ＡＩアクセラレータ１０のいずれかのＤＮＮ演算部１１において、部分特徴マップ１２４を垂直方向に複数に分割し、当該ＤＮＮ演算部１１が有する複数のカーネル１３で１層分の演算を実行する例を説明する。

ここで、本実施形態のＡＩアクセラレータ１０では、いずれか少なくとも１つのＤＮＮ演算部１１について、第１の実施形態で説明した構成とは異なり、当該ＤＮＮ演算部１１がＤＮＮの１層分の演算を行う際の部分特徴マップ１２４の分割数だけ、カーネル１３を持つこととなる。なお、本実施形態における情報処理装置１の構成、ＡＩアクセラレータ１０の構成、カーネル１３の個数以外のＤＮＮ演算部１１の構成およびカーネル１３の構成は、第１の実施形態において図１、図３で説明したものとそれぞれ同様である。そのため以下では、これらの説明を省略する。

図１２は、本発明の第２の実施形態に係る演算処理の説明図である。図１２では、３層分の演算のうち２層目の中間層において、部分特徴マップ１２４が３つに分割されて演算が行われる例を示している。この場合、３層分のＤＮＮ演算部１１は、図１２に示すように、１層目のＤＮＮ演算部１１が有する分割カーネル１２０１と、２層目のＤＮＮ演算部１１が有する３つの中間カーネル１２０２と、３層目のＤＮＮ演算部１１が有するマージカーネル１２０３とを含んで構成される。これらのカーネルは、いずれも図３に示した第１の実施形態におけるカーネル１３と同様の構成を有している。

図１２において、分割カーネル１２０１は、１層目の処理を行った後、部分特徴マップ１２４を３分割することで３つの分割部分特徴マップ１２０４を生成し、次層のＤＮＮ演算部１１に送る。中間カーネル１２０２は、分割カーネル１２０１から送られた分割部分特徴マップ１２０４をそれぞれ処理して次層のＤＮＮ演算部１１に送る。マージカーネル１２０３は、３つの中間カーネル１２０２でそれぞれ処理された分割部分特徴マップ１２０４をマージしたのち、３層目の処理を行う。

分割カーネル１２０１は、３つの分割部分特徴マップ１２０４を生成する際に、それぞれの分割部分特徴マップ１２０４に対応する位置情報１２１を作成する。その際には、図６に示した位置情報１２１の各データのうち分割ＩＤ６０１の値を、開始ｘ座標が小さい方から０，１，２と順に設定する。また、終点ｘ座標６０７、終点ｙ座標６０８の値を、各分割部分特徴マップ１２０４に対応する値へとそれぞれ変更する。こうして作成した位置情報１２１は、分割部分特徴マップ１２０４とともに各分割カーネル１２０１へ送信される。

中間カーネル１２０２は、各分割部分特徴マップ１２０４に対して、第１の実施形態と同様の処理をそれぞれ行う。

マージカーネル１２０３は、各中間カーネル１２０２から処理済みの分割部分特徴マップ１２０４とともに位置情報１２１を受け取ると、分割部分特徴マップ１２０４をマージして１つの部分特徴マップ１２４に戻す。このとき、分割ＩＤ６０１の値が最も小さい位置情報１２１の開始ｘ座標６０５および開始ｙ座標６０６の値と、分割ＩＤ６０１の値が最も大きい位置情報１２１の終点ｘ座標６０７および終点ｙ座標６０８の値とを用いて、マージ後の部分特徴マップ１２４に対する位置情報１２１を更新する。そして、マージ後の部分特徴マップ１２４と更新後の位置情報１２１を用いて、３層目に対応する畳み込み演算を行う。

（第３の実施形態）
次に、本発明の第３の実施形態について説明する。本実施形態では、ＡＩアクセラレータ１０のいずれかのＤＮＮ演算部１１において、部分特徴マップ１２４を続けて複数回入力し、次層のＤＮＮ演算部１１に対して、複数の部分特徴マップ１２４の演算結果をまとめて一度に送信する例を説明する。

なお、本実施形態における情報処理装置１の構成、ＡＩアクセラレータ１０の構成、ＤＮＮ演算部１１の構成およびカーネル１３の構成は、第１の実施形態において図１、図３で説明したものとそれぞれ同様である。そのため以下では、これらの説明を省略する。

図１３は、本発明の第３の実施形態に係る演算処理の説明図である。図１３の例では、３層分の演算を行う各ＤＮＮ演算部１１のカーネル１３を、カーネル０、カーネル１、カーネル２でそれぞれ示している。この場合、図１３（ｂ）に示すように、カーネル０は第１の実施形態と同様に、演算処理済みの部分特徴マップ１２４と、その部分特徴マップ１２４の位置情報１２１とを、カーネル１に送信する。カーネル１は、第１の実施形態と同様に部分特徴マップ１２４の処理を行うが、次層のカーネル２の演算に必要なデータが揃わない場合は、部分特徴マップ１２４の演算結果とその部分特徴マップ１２４に対応する位置情報１２１とを、カーネル２へは送信しない。カーネル０がカーネル１に対して２回目のデータ送信を行い、そのデータを用いてカーネル１が処理した部分特徴マップ１２４と、１度目に処理した部分特徴マップ１２４とにより、カーネル２での演算に必要なデータが揃ったときに、カーネル１はカーネル２に対して、部分特徴マップ１２４と位置情報１２１の送信を行う。

上記の演算手順を実現するため、ＡＩアクセラレータ１０の各層のカーネル１３（カーネル０～カーネル２）では、当該カーネルでの演算実行回数を表すカーネル実行回数と、当該カーネルから次層のカーネルへのデータ出力に必要な動作回数を表す出力数とを保持している。そして、これらの情報に基づいて図１３（ａ）のフローチャートに示す処理を実行することで、各カーネルにおいて部分特徴マップ１２４と位置情報１２１の出力タイミング制御を行うようにしている。

図１３（ａ）のフローチャートにおいて、ステップＳ１３０１では、保持している実行回数に１を加算する。なお、実行回数の初期値は０である。

ステップＳ１３０２では、保持している実行回数を出力数で除算したときの剰余を求め、その剰余が０であるか否かを判定する。剰余が０であればステップＳ１３０３へ進み、０でなければ、ステップＳ１３０３の処理を実行せずに図１３（ａ）のフローチャートに示す処理を終了する。

ステップＳ１３０３では、位置情報１２１を更新し、更新後の位置情報１２１と部分特徴マップ１２４を次層のカーネルへと出力する。ステップＳ１３０３の処理を実行したら、実行回数を初期値の０にリセットした後、図１３（ａ）のフローチャートに示す処理を終了する。

(第４の実施形態)
次に、本発明の第４の実施形態について説明する。本実施形態では、処理対象の部分特徴マップ１２４や重み情報１２３における各データの並びによっては、必ずしもマスク処理が必要ではない場合について説明する。

図１４は、本発明の第４の実施形態に係るマスク処理が必要でない場合の重みレジスタ３０１と入力レジスタ３０２のデータ配置の一例を示す図である。図１４では図１１と同様に、重み情報１２３が３×３の重みデータで構成されているときに、重みレジスタ３０１に一度に入力４チャンネル分、出力８チャンネル分の合計３２個の重みデータが格納されている例を示している。この場合に、第１領域に属する位置での畳み込み演算時には、３×３の重みデータの最初の１行目の処理の際に、符号１４０１に示す範囲に対してマスク処理が行われる。すなわち、重みレジスタ３０１において重みデータが格納されている全ての格納箇所に対して、マスク処理が行われることになる。

上記のように、重みレジスタ３０１に格納された全ての重みデータに対してマスク処理が行われる場合は、マスク処理を省略し、畳み込み演算自体を行わずに単に計算結果を０のデータとしても、マスク処理後の畳み込み演算と同じ結果が得られる。このようにすれば、不要な演算処理を省略して高速化を図ることが可能となる。なお、ここでは第１領域に属する位置での畳み込み演算時の例を述べたが、他の領域に属する位置でも同様に、重みレジスタ３０１に格納された全ての重みデータに対してマスク処理が行われる場合には、マスク処理と畳み込み演算を省略することができる。

以上説明した本発明の第２～第４の各実施形態によれば、第１の実施形態と同様の作用効果をそれぞれ奏する。

なお、以上説明した各実施形態では、ＡＩアクセラレータ１０において、０パディング処理に相当する前処理として、重み情報１２３において位置情報１２１に対応する箇所をマスクする処理を行う例を説明したが、ＡＩアクセラレータ１０において０パディング処理を行い、０パディング処理済みの部分特徴マップ１２４を用いてＤＮＮ演算を実行するようにしてもよい。このようにしても、第１の実施形態で説明したのと同様の効果を奏することができる。

以上説明した実施形態や各種変形例はあくまで一例であり、発明の特徴が損なわれない限り、本発明はこれらの内容に限定されるものではない。また、各実施形態や各種変形例は、単独で採用してもよいし、任意に組み合わせてもよい。さらに、上記では種々の実施形態や変形例を説明したが、本発明はこれらの内容に限定されるものではない。本発明の技術的思想の範囲内で考えられるその他の態様も本発明の範囲内に含まれる。

１：情報処理装置、１０：ＡＩアクセラレータ、１１：ＤＮＮ演算部、１２：ローカル記憶領域、１３：カーネル、２０：演算処理部、３０：記憶部、１２１：位置情報、１２２：演算層情報、１２３：重み情報、１２４：部分特徴マップ、１３１：０パディング制御部、１３２：次カーネル位置情報生成部、１３３：畳み込み演算部、３０１：重みレジスタ、３０２：入力レジスタ、３０３：積和演算部、３０４：出力レジスタ

Claims

特徴マップに対してＤＮＮ演算を実行する情報処理装置であって、
第１の演算部と、
前記第１の演算部とバスを介して接続された第２の演算部と、
前記ＤＮＮ演算で利用される重み情報を格納する記憶部と、を備え、
前記第１の演算部は、前記特徴マップの一部である部分特徴マップと、前記部分特徴マップの前記特徴マップ中の位置を表す位置情報とを前記第２の演算部へ送信し、
前記第２の演算部は、
前記記憶部から前記重み情報を取得し、
前記第１の演算部から送信される前記部分特徴マップおよび前記位置情報を受信し、
前記位置情報に基づく所定の前処理を実行し、
前記前処理の実行結果と前記部分特徴マップとを用いて、前記ＤＮＮ演算を実行する情報処理装置。
請求項１に記載の情報処理装置において、
前記前処理は、前記重み情報において前記位置情報に対応する箇所をマスクする処理であり、
前記第２の演算部は、前記前処理を行うことで生成したマスク済み重み情報と前記部分特徴マップとを用いて、前記ＤＮＮ演算を実行する情報処理装置。
請求項２に記載の情報処理装置において、
前記第２の演算部は、前記位置情報に基づいて、前記特徴マップに設定された複数の領域のうちどの領域に前記部分特徴マップが属するかを判定し、当該領域に対応する箇所をマスクする処理を前記前処理として実行する情報処理装置。
請求項３に記載の情報処理装置において、
前記複数の領域は、前記特徴マップの左上角部を含む第１領域と、前記特徴マップの上端部を含む第２領域と、前記特徴マップの右上角部を含む第３領域と、前記特徴マップの左端部を含む第４領域と、前記特徴マップのいずれの端部も含まない第５領域と、前記特徴マップの右端部を含む第６領域と、前記特徴マップの左下角部を含む第７領域と、前記特徴マップの下端部を含む第８領域と、前記特徴マップの右下角部を含む第９領域と、を有し、
前記第２の演算部は、
前記部分特徴マップが前記第５領域以外の各領域に属する場合は、当該領域における前記特徴マップの端部の位置に応じて、前記重み情報においてマスクする前記箇所を決定し、
前記部分特徴マップが前記第５領域に属する場合は、前記マスクする処理を実行しない情報処理装置。
請求項１に記載の情報処理装置において、
前記前処理は、前記部分特徴マップに０を挿入する０パディングであり、
前記第２の演算部は、前記前処理を行うことで生成した０パディング済みの前記部分特徴マップを用いて、前記ＤＮＮ演算を実行する情報処理装置。
請求項１に記載の情報処理装置において、
前記第２の演算部は、ベクトル演算に特化した複数の演算コアを有しており、前記複数の演算コアを用いたＡＩ処理によって前記ＤＮＮ演算を実行する情報処理装置。
請求項１に記載の情報処理装置において、
前記第２の演算部は、ＤＮＮの各層に対応する複数のカーネルを有しており、
前記ＤＮＮ演算において前記複数のカーネルのいずれかで前記部分特徴マップの水平方向および垂直方向の少なくとも一方の大きさが変化する場合、当該カーネルは前記位置情報を再計算して次層に対応するカーネルへ送信する情報処理装置。
第１の演算部と、前記第１の演算部とバスを介して接続された第２の演算部と、ＤＮＮ演算で利用される重み情報を格納する記憶部と、を備える情報処理装置を用いて、特徴マップに対してＤＮＮ演算を実行する情報処理方法であって、
前記第１の演算部により、前記特徴マップの一部である部分特徴マップと、前記部分特徴マップの前記特徴マップ中の位置を表す位置情報を前記第２の演算部へ送信し、
前記第２の演算部により、
前記記憶部から前記重み情報を取得し、
前記第１の演算部から送信される前記部分特徴マップおよび前記位置情報を受信し、
前記位置情報に基づく所定の前処理を実行し、
前記前処理の実行結果と前記部分特徴マップとを用いて、前記ＤＮＮ演算を実行する情報処理方法。