JP2007206887A - Lsiチップ及び演算処理システム - Google Patents
Lsiチップ及び演算処理システム Download PDFInfo
- Publication number
- JP2007206887A JP2007206887A JP2006023630A JP2006023630A JP2007206887A JP 2007206887 A JP2007206887 A JP 2007206887A JP 2006023630 A JP2006023630 A JP 2006023630A JP 2006023630 A JP2006023630 A JP 2006023630A JP 2007206887 A JP2007206887 A JP 2007206887A
- Authority
- JP
- Japan
- Prior art keywords
- data
- lsi chip
- kernel
- arithmetic
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Semiconductor Integrated Circuits (AREA)
- Complex Calculations (AREA)
- Image Processing (AREA)
Abstract
【解決手段】 2次元の対象データと2次元のカーネルとの畳み込み演算を行うLSIチップであって、前記対象データを保持する対象データメモリ10と、前記カーネルを保持するカーネルメモリ11と、前記対象データと、前記カーネルと、に基づいて畳み込み演算処理を行う演算回路16と、前記対象データを外部のLSIチップと入出力する入出力配線と、を備え、前記演算回路16は、前記演算回路における演算において必要な対象データであって、当該LSIチップに備えられた前記対象データメモリ10に存在しないデータは、前記入出力配線を介して、前記外部のLSIチップに備えられた前記対象データメモリから入力することを特徴とする。
【選択図】 図4
Description
2次元の対象データと2次元のカーネルとの畳み込み演算を行うLSIチップであって、
前記対象データを保持する対象データメモリと、
前記カーネルを保持するカーネルメモリと、
前記対象データと、前記カーネルと、に基づいて畳み込み演算処理を行う演算回路と、
前記対象データを外部のLSIチップと入出力する入出力配線と、
を備え、
前記演算回路は、前記演算回路における演算において必要な対象データであって、当該LSIチップに備えられた前記対象データメモリに存在しないデータは、前記入出力配線を介して、前記外部のLSIチップに備えられた前記対象データメモリから入力する。
複数のLSIチップを接続してなり、2次元の対象データと2次元のカーネルとの畳み込み演算を行う、演算処理システムであって、
前記LSIチップのそれぞれは、
前記対象データを保持する対象データメモリと、
前記カーネルを保持するカーネルメモリと、
前記対象データと、前記カーネルと、に基づいて畳み込み演算処理を行う演算回路と、
前記対象データを隣接する前記LSIチップと入出力する入出力配線と、
を備え、
前記対象データは隣接する複数の前記LSIチップのそれぞれに備えられた前記対象データメモリに分散して保持され、
前記演算回路は、該演算回路における演算において必要な対象データであって、当該演算回路を備える前記LSIチップに備えられた前記対象データメモリに存在しないデータは、前記入出力配線を介して、隣接する前記LSIチップに備えられた前記対象データメモリから入力する。
(演算処理システム)
図1は、本実施形態に係る演算処理システムを模式的に示した図である。図1に示すように演算処理システムは、4個のLSIチップ1〜4が1列に配置されて構成される。なお、LSIチップの個数は、演算処理対象のデータサイズに応じて変更することが可能であり、本実施形態においては一例として4個のケースを示している。またそれぞれのLSIチップは、隣接するLSIチップとデータを入力及び出力する配線5によって接続されている。ここで、本実施形態においては、それぞれのチップ間で入力及び出力されるデータ幅を6ビットとしてるが、その他のデータ幅を有するものであっても良い。その場合は、データ幅に応じて配線の本数が変わる。なお図1では、6bitの配線及びLSIチップのピンを1本の配線及びピンで略記している。また図1においては、前述した入力及び出力用の配線5以外の配線は、本実施形態の説明に必要でないため、記載していない。
次に、前記の演算処理システムで実現する演算処理の一例について、図2を参照して説明する。図2は、階層型コンボリューショナル・ニューラルネットワークを用いて顔の位置検出を行う処理を模式的に示した図である。
u=Σw・o ・・・(1)
階層的に畳込み演算を行う際に、それぞれの階層で算出された演算結果は、次段の畳込み演算に対する入力値となる。また各層においては、畳込み演算結果として、複数の異なる演算結果群を算出する場合もある。この場合の複数の異なる演算結果は、図2に示すように、複数の異なる特徴の検出結果に相当する。これはカーネルの重み分布を変更することによって実現される。また図2に示すように、畳込み演算は前段層の複数の演算結果群を入力値とする場合もある。
続いて、前記の演算処理システムを構成するLSIチップ1〜4の回路構成について、図3を参照して説明する。図3は、LSIチップの回路構成を模式的に示したブロック図である。図3に示すように、本実施形態におけるLSIチップは以下の回路ブロックを有する。
・メモリ回路ブロック(MEM)10。
・カーネルデータメモリ回路ブロック(KMEM)11。
・レジスタ(REG)12,14。
・デジタル‐PWM変換回路ブロック(D/P)13,15。
・PWM‐アナログ変換回路(P/A)17。
・演算回路ブロック(PWM−MAC)16。
・累算回路ブロック(ACC)19。
・PWM‐デジタル変換回路ブロック(P/D)18。
・マルチプレクサ(MUX)20。
・ルックアップテーブル(LUT)21。
なお、図3中では、配線は省略している。
続いて、前記の各回路ブロックが実行する処理の流れについて、図4を参照して説明する。図4は、回路ブロック間のデータの流れを模式的に示したブロック図である。
続いて、前述したLSIチップを構成する回路ブロックの中で、演算回路ブロック(PWM−MAC)16の詳細な回路構成について、図5を参照して説明を行う。図5は、演算回路ブロック16の回路構成を示した図である。
(1)スイッチド電流源(SCS)23に入力PWM信号PIを入力する。
(2)PWM信号を積分容量(C)24の電荷に変換することで、アナログ電圧VWjによる重み付け加算を行う。
(3)積分容量(C)24の両端に掛かる電圧Vkを線形なランプ信号Vrefと比較することでPWM信号POkに変換する。
即ち、以下の式が成り立つ。
PO1=PI1・VW1+・・・+PI51・VW51。
・・・・
PO80=PI80・VW1+・・・+PI130・VW51。
演算回路ブロック16において実行される畳み込み演算の実行フローについて、図6を参照して説明する。図6は、演算回路ブロック16による畳込み演算の様子を模式的に示した図である。
上記のように、51×51のカーネルに基づいて畳み込み演算により80×80のデータを取得するためには、130×130の2次元データが入力される必要がある。しかし、メモリ回路ブロック(MEM)10のサイズは80×80である。このため、図6のように、演算回路25に入力される演算対象の130画素のデータのうち、80×80の画素サイズを超える部分(図中斜線部)のデータは、演算を実行するLSIチップ内には保持されていないことになる。そこで、本実施形態に係る構成においては、LSIチップを並列に接続し、隣接するLSIチップから処理に必要な画素データを取得し、当該画素データを用いて2次元データの畳み込み演算を行う。以下、複数のLSIチップによる並列演算について、上記のLSIチップを4つ一列に接続して画像サイズが320×240画素に対して演算を行う場合を例示的に取り上げて説明する。
続いて、再度図4を参照して、隣接するLSIチップとのデータの入出力方法について説明を行う。図4に示したように、隣接したLSIチップとのデータの入出力は、左側のLSIチップから右側のLSIチップへデータが入力される場合と、右側のチップから左側のチップへデータが入力される場合の2種類のケースがある。そこで本実施形態においては、データの入出力の左右方向を切り替えるために、トライステートバッファ26を使用している。二つのトライステートバッファ26は、逆相の制御信号で制御することにより、データの出力方向を左側と右側で切り替えることが可能である。
第1実施形態に係る構成においては、演算回路ブロック16がアナログ回路で構成されていた。本実施形態では、演算回路ブロックをデジタル回路で構成した場合について説明する。本実施形態に係る構成は、演算回路ブロックのデジタル回路化に伴う変更以外は、全て第1実施形態と同様である。このため、本実施形態においては、第1実施形態と異なる部分についてのみ説明を行い、それ以外は第1実施形態と同様であるため説明を省略する。
図11は、本実施形態における演算処理システムを構成するLSIチップの回路構成を模式的に示したブロック図である。図11に示すように、本実施形態におけるLSIチップは以下の回路ブロックを有する。
・メモリ回路ブロック(MEM)10。
・カーネルデータメモリ回路ブロック(KMEM)11。
・レジスタ(REG)12,14。
・デジタル演算回路ブロック(D−MAC)29。
・累算回路ブロック(ACC)19。
・マルチプレクサ(MUX)20。
・ルックアップテーブル(LUT)21。
なお、図11では、配線は省略している。
続いて、前記の各回路ブロックが実行する処理の流れについて、図12を参照して説明する。図12は、回路ブロック間のデータの流れを模式的に示したブロック図である。
続いて、前述したLSIチップを構成する回路ブロックの中で、演算回路ブロック(D−MAC)29の詳細な回路構成について、図13を参照して説明を行う。図13は、演算回路ブロック29の回路構成を示した図である。
(1)乗算回路(MUL)30にデジタル信号DI及びDWを入力する。
(2)乗算回路(MUL)30より、DIとDWの乗算結果が出力され、累算回路ブロック(ACC)19に入力される。
(3)累算回路ブロック(ACC)19は、最大51個の乗算回路(MUL)30からの入力を累算する。
第1、第2実施形態に係る構成においては、LSIチップが一列に接続されていた。本実施形態においては、複数のLSIチップを平面的に配置、接続することで、更に高速な演算処理を実行可能な構成について説明する。
図15は、本実施形態に係る演算処理システムを模式的に示した図である。図15に示すように演算処理システムは、12個のLSIチップ01〜12が3行4列に配置されて構成される。なお、LSIチップの個数は、演算処理対象のデータサイズに応じて変更することが可能であり、本実施形態においては12個のケースを示している。またそれぞれのLSIチップは、隣接するLSIチップとデータを入力及び出力する配線5によって接続されている。ここで、本実施形態においては、それぞれのチップ間で入力及び出力されるデータサイズを6ビットとしてるが、その他のデータサイズを有するものであっても良い。その場合は、データサイズに応じて配線の本数が変わる。また図15においては、前述した入力及び出力用の配線以外の配線は、本実施形態の説明に必要でないため、記載していない。
続いて図16に、前記の演算処理システムを構成するLSIチップ01〜12の回路構成について、図16を参照して説明する。図16は、LSIチップの回路構成を模式的に示したブロック図である。
・メモリ回路ブロック(MEM)10。
・カーネルデータメモリ回路ブロック(KMEM)11。
・レジスタ(REG)12,14。
・デジタル‐PWM変換回路ブロック(D/P)13,15。
・PWM‐アナログ変換回路(P/A)17。
・演算回路ブロック(PWM−MAC)16。
・累算回路ブロック(ACC)19。
・PWM‐デジタル変換回路ブロック(P/D)18。
・マルチプレクサ(MUX)20。
・ルックアップテーブル(LUT)21。
・セレクタ(SEL)32。
なお、前記の各回路ブロックの構成、及び処理の流れは、後述するように、本実施形態ではセレクタ32を介して隣接するチップとデータの入出力をすることを除いて第1実施形態と同様であるため、説明を省略する。また、LSIチップの演算回路ブロックによる畳込み演算の実行フローに関しても第1実施形態の場合と同様であるため、説明を省略する。
図17は、12個のLSIチップ01〜12を用いて320×240の2次元データに対してカーネルとの畳み込み演算を行う様子を模式的に示した図である。図15、図17に示すように本実施形態においては、第1実施形態でLSIチップ4個を1列に並べたものをさらに3行配置することで、第1実施形態で逐次処理によって演算を実行した縦方向の演算ステップを1/3の演算ステップで実行することができる。なお、LSIチップ01〜12は、それぞれの演算領域における対応する位置のデータについて、他のLSIチップによる演算と同期して畳み込み演算を行う。
(1)左又は右にはみ出すケース
(2)左又は右、及び、下又は左下又は右下にはみ出すケース
(3)左又は右、及び、上又は左上又は右上にはみ出すケース
これらのうち、(1)のケースは、左右に隣接したLSIチップ間でのみデータを入出力し合うものであり、従って、各LSIチップ間のデータの流れは第1実施形態と同様である。このため、説明を省略する。
第3実施形態に係る構成においては、演算回路ブロック16がアナログ回路で構成されていた。本実施形態では、演算回路ブロックをデジタル回路で構成した場合について説明する。本実施形態に係る構成は、演算回路ブロックのデジタル回路化に伴う変更以外は、全て第3実施形態と同様である。このため、本実施形態においては、第3実施形態と異なる部分についてのみ説明を行い、それ以外は第3実施形態と同様であるため説明を省略する。
図21は、本実施形態における演算処理システムを構成するLSIチップの回路構成を模式的に示したブロック図である。図21に示すように、本実施形態におけるLSIチップは以下の回路ブロックを有する。
・メモリ回路ブロック(MEM)10。
・カーネルデータメモリ回路ブロック(KMEM)11。
・レジスタ(REG)12,14。
・デジタル演算回路ブロック(D−MAC)29。
・セレクタ(SEL)32。
・累算回路ブロック(ACC)19。
・マルチプレクサ(MUX)20。
・ルックアップテーブル(LUT)21。
なお、図21では、配線は省略している。
続いて、前記の各回路ブロックが実行する処理の流れについて、図22を参照して説明する。図22は、回路ブロック間のデータの流れを模式的に示したブロック図である。
Claims (8)
- 2次元の対象データと2次元のカーネルとの畳み込み演算を行うLSIチップであって、
前記対象データを保持する対象データメモリと、
前記カーネルを保持するカーネルメモリと、
前記対象データと、前記カーネルと、に基づいて畳み込み演算処理を行う演算回路と、
前記対象データを外部のLSIチップと入出力する入出力配線と、
を備え、
前記演算回路は、前記演算回路における演算において必要な対象データであって、当該LSIチップに備えられた前記対象データメモリに存在しないデータは、前記入出力配線を介して、前記外部のLSIチップに備えられた前記対象データメモリから入力する
ことを特徴とするLSIチップ。 - 前記演算回路における前記演算処理は並列に実行される
ことを特徴とする請求項1に記載のLSIチップ。 - 前記演算回路は、アナログ回路又はデジタル回路であることを特徴とする
請求項1又は2に記載のLSIチップ。 - 更に、
前記外部のLSIチップとの前記入出力配線における接続を切り替えるスイッチ回路
を備えることを特徴とする請求項1乃至3のいずれか1項に記載のLSIチップ。 - 更に、
前記外部のLSIチップとの前記入出力配線における接続を切り替えるセレクタ
を備えることを特徴とする請求項1乃至3のいずれか1項に記載のLSIチップ。 - 複数のLSIチップを接続してなり、2次元の対象データと2次元のカーネルとの畳み込み演算を行う、演算処理システムであって、
前記LSIチップのそれぞれは、
前記対象データを保持する対象データメモリと、
前記カーネルを保持するカーネルメモリと、
前記対象データと、前記カーネルと、に基づいて畳み込み演算処理を行う演算回路と、
前記対象データを隣接する前記LSIチップと入出力する入出力配線と、
を備え、
前記対象データは隣接する複数の前記LSIチップのそれぞれに備えられた前記対象データメモリに分散して保持され、
前記演算回路は、該演算回路における演算において必要な対象データであって、当該演算回路を備える前記LSIチップに備えられた前記対象データメモリに存在しないデータは、前記入出力配線を介して、隣接する前記LSIチップに備えられた前記対象データメモリから入力する
ことを特徴とする演算処理システム。 - 前記LSIチップは1列に配置される
ことを特徴とする請求項6に記載の演算処理システム。 - 前記LSIチップは行列形式に配置される
ことを特徴とする請求項6に記載の演算処理システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006023630A JP4947983B2 (ja) | 2006-01-31 | 2006-01-31 | 演算処理システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006023630A JP4947983B2 (ja) | 2006-01-31 | 2006-01-31 | 演算処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007206887A true JP2007206887A (ja) | 2007-08-16 |
JP4947983B2 JP4947983B2 (ja) | 2012-06-06 |
Family
ID=38486319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006023630A Expired - Fee Related JP4947983B2 (ja) | 2006-01-31 | 2006-01-31 | 演算処理システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4947983B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009041350A1 (en) * | 2007-09-26 | 2009-04-02 | Canon Kabushiki Kaisha | Calculation processing apparatus and method |
US11907327B2 (en) | 2018-06-04 | 2024-02-20 | Socionext Inc. | Arithmetic method |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3460724A1 (en) | 2017-09-22 | 2019-03-27 | Kabushiki Kaisha Toshiba | Operation device and operation system |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63118885A (ja) * | 1986-11-06 | 1988-05-23 | Matsushita Electric Ind Co Ltd | 並列型画像処理プロセツサ |
JPH04291682A (ja) * | 1991-03-20 | 1992-10-15 | Res Dev Corp Of Japan | 超高速画像処理システムのフィルタリング処理方式 |
JPH1115801A (ja) * | 1997-06-24 | 1999-01-22 | Sony Corp | データ演算装置および方法、並びに伝送媒体 |
JP2002537613A (ja) * | 1999-02-17 | 2002-11-05 | サン マイクロシステムズ,インコーポレイティッド | スーパサンプリング・サンプル・バッファを有し、表示効果を実現するため選択的フィルタ調節を使用して出力ピクセルを生成するグラフィックス・システム |
-
2006
- 2006-01-31 JP JP2006023630A patent/JP4947983B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63118885A (ja) * | 1986-11-06 | 1988-05-23 | Matsushita Electric Ind Co Ltd | 並列型画像処理プロセツサ |
JPH04291682A (ja) * | 1991-03-20 | 1992-10-15 | Res Dev Corp Of Japan | 超高速画像処理システムのフィルタリング処理方式 |
JPH1115801A (ja) * | 1997-06-24 | 1999-01-22 | Sony Corp | データ演算装置および方法、並びに伝送媒体 |
JP2002537613A (ja) * | 1999-02-17 | 2002-11-05 | サン マイクロシステムズ,インコーポレイティッド | スーパサンプリング・サンプル・バッファを有し、表示効果を実現するため選択的フィルタ調節を使用して出力ピクセルを生成するグラフィックス・システム |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009041350A1 (en) * | 2007-09-26 | 2009-04-02 | Canon Kabushiki Kaisha | Calculation processing apparatus and method |
CN101809597A (zh) * | 2007-09-26 | 2010-08-18 | 佳能株式会社 | 计算处理装置及方法 |
US8391306B2 (en) | 2007-09-26 | 2013-03-05 | Canon Kabushiki Kaisha | Calculation processing apparatus and method |
CN101809597B (zh) * | 2007-09-26 | 2013-06-12 | 佳能株式会社 | 计算处理装置及方法 |
US11907327B2 (en) | 2018-06-04 | 2024-02-20 | Socionext Inc. | Arithmetic method |
Also Published As
Publication number | Publication date |
---|---|
JP4947983B2 (ja) | 2012-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6945986B2 (ja) | 演算回路、その制御方法及びプログラム | |
EP2017743B1 (en) | High speed and efficient matrix multiplication hardware module | |
Komuro et al. | A dynamically reconfigurable SIMD processor for a vision chip | |
EP0390907B1 (en) | Parallel data processor | |
US11487845B2 (en) | Convolutional operation device with dimensional conversion | |
CN111666255A (zh) | 脉动阵列和处理系统 | |
JP2007536628A (ja) | Simdアレープロセッサ用のビットシリアル処理要素 | |
JPH0233191B2 (ja) | ||
CN109074516A (zh) | 计算处理装置和计算处理方法 | |
JPH04128982A (ja) | プロセッサエレメント、プロセッシングユニット、プロセッサ、及びその演算処理方法 | |
JP5360194B2 (ja) | 再構成可能な論理回路 | |
EP0112885A1 (en) | CONNECTION LEVEL USED IN A MODULAR DATA FIELD PROCESSOR. | |
JPH09505921A (ja) | 並列データ処理プロセッサ | |
JP4947983B2 (ja) | 演算処理システム | |
KR20070061538A (ko) | Simd 프로세서 및 데이터 통신 방법 | |
JP2002297377A (ja) | ソート機能を有するsimd型マイクロプロセッサ | |
JP2006154992A (ja) | ニューロプロセッサ | |
JP2017027314A (ja) | 並列演算装置、画像処理装置及び並列演算方法 | |
US7522190B2 (en) | Image detection processing device for calculating the moments of image data | |
US7046821B2 (en) | Image detection processor | |
CN112970036A (zh) | 用于实施神经网络应用的卷积块阵列及其使用方法、和卷积块电路 | |
JPH09259115A (ja) | ビット−シリアルマトリックス転置のための超大規模集積回路 | |
US11579875B2 (en) | Computing chip, hashrate board and data processing apparatus | |
US8131909B1 (en) | System and method of signal processing engines with programmable logic fabric | |
JP3639014B2 (ja) | 信号処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090202 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100423 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100622 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101217 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110715 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111017 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20111129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120302 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120306 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150316 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4947983 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150316 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |