JP2014160516A - 画像処理装置及び画像処理方法 - Google Patents
画像処理装置及び画像処理方法 Download PDFInfo
- Publication number
- JP2014160516A JP2014160516A JP2014118297A JP2014118297A JP2014160516A JP 2014160516 A JP2014160516 A JP 2014160516A JP 2014118297 A JP2014118297 A JP 2014118297A JP 2014118297 A JP2014118297 A JP 2014118297A JP 2014160516 A JP2014160516 A JP 2014160516A
- Authority
- JP
- Japan
- Prior art keywords
- image processing
- image
- parallel
- memory
- cpu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Processing (AREA)
Abstract
【解決手段】フレームメモリ21…は、処理されるべき画像データを格納する。並列メモリ121…は、フレームメモリ21…に格納された画像データの全部又は一部を受け取って、画像処理用のDMAC111…又は処理ユニット13A…のいずれかに送る。処理ユニット13A…は、画像処理のための関数に対応した機能を有している。処理ユニット13A…は、CPU3からの指令に従って、並列メモリ121…又はフレームメモリ21…から、画像データの全部又は一部を受け取り、さらに、画像データの全部又は一部に対して、画像処理のための関数に従った処理を行う。
【選択図】図1
Description
コプロセッサと、フレームメモリと、CPUとを備えており、
前記フレームメモリは、処理されるべき画像データを格納する構成となっており、
前記コプロセッサは、複数の画像処理部と複数の並列メモリとを備えており、
前記並列メモリは、前記フレームメモリに格納された前記画像データの全部又は一部を受け取って前記画像処理部のいずれかに送る構成となっており、
前記複数の画像処理部は、いずれも、画像処理のための関数に対応した機能を有しており、
かつ、前記複数の画像処理部は、前記CPUからの指令に従って、
前記並列メモリ又は前記フレームメモリから、前記画像データの全部又は一部を受け取り、さらに、
前記画像データの全部又は一部に対して、前記画像処理のための関数に従った処理を行う構成となっている
画像処理装置。
前記コプロセッサは、再構成可能なプログラマブル・ロジック・デバイスによって構成されている
項目1に記載の画像処理装置。
前記複数の並列メモリは、デュアルポート・メモリである
項目1又は2に記載の画像処理装置。
前記画像処理部は、ダイレクト・メモリ・アクセス・コントローラと、処理ユニットとを備えており、
前記ダイレクト・メモリ・アクセス・コントローラは、前記並列メモリの動作を制御する構成となっており、
前記処理ユニットは、前記画像処理のための関数に従った処理を行う構成となっている
項目1〜3のいずれか1項に記載の画像処理装置。
前記コプロセッサを複数個備えている
項目1〜4のいずれか1項に記載の画像処理装置。
前記複数のコプロセッサは、共通のコプロセッサ・バスに接続されている
項目5に記載の画像処理装置。
前記コプロセッサは、ディスクリプタをさらに備えており、
前記CPUは、前記コプロセッサへの命令を前記ディスクリプタに書き込む構成となっており、
前記コプロセッサは、前記ディスクリプタに書かれている命令を読み取り、前記複数の画像処理部による処理を実行する構成となっている
項目1〜6のいずれか1項に記載の画像処理装置。
前記複数の画像処理部は、前記CPUからの指令に従って、独立して並列に動作する構成となっている
項目1〜7のいずれか1項に記載の画像処理装置。
以下のステップを備える画像処理方法:
(1)フレームメモリが、処理されるべき画像データを格納するステップ;
(2)並列メモリが、前記フレームメモリに格納された前記画像データの全部又は一部を受け取るステップ;
(3)前記複数の画像処理部が、CPUからの指令に従って、前記並列メモリ又は前記フレームメモリから、前記画像データの全部又は一部を受け取るステップ;
(4)前記複数の画像処理部が、前記CPUからの指令に従って、前記画像データの全部又は一部に対して、画像処理のための関数に従った処理をそれぞれ行うステップ。
前記並列メモリとして、デュアルポート・メモリが用いられており、
さらに、複数の画像処理部は、前記CPUからの指令に従って、前記並列メモリをバッファとしたパイプライン処理を行うものである
項目9に記載の画像処理方法。
前記複数の画像処理部は、前記CPUからの指令に従って、独立して並列に動作する構成となっており、
さらに、前記複数の画像処理部は、前記CPUからの指令に従って、タスクレベルでの並列処理を行うものである
項目9又は10に記載の画像処理方法。
つぎに、本実施形態の画像処理装置を用いた画像処理方法を、図2を参照しながら、以下に説明する。
まず、CPU3からの指示により、処理対象となる画像を、カメラインタフェース6又はビデオインタフェース7から取り込む。
ついで、当該画像を処理するコプロセッサ11…に対応するフレームメモリ21…が、当該画像又はその一部を格納する。この処理も、CPU3からの指示により行われる。
・使用する処理ユニット;
・使用する並列メモリ(入力用及び出力用);
・処理のためのパラメータ;
・どの処理ユニットでの処理が完了してから、処理を開始するか(すなわち待ちユニット)。
ついで、各コプロセッサ11…は、ディスクリプタ141に書き込まれたコマンドを読み取る。
ついで、画像処理部が、フレームメモリ21…又は並列メモリ121…から画像の全部又は一部を受け取って処理する。この処理を以下に詳しく述べる。
1)次のディスクリプタを読む。
2)ディスクリプタが空だったら、処理を停止する。
3)使用しようとする処理ユニットと、待ちユニットの全てが使用可能となるまで待つ。
4)処理ユニットに、処理を振り分ける。
5)前記の1)へ戻る。
1)同一コプロセッサ内で、複数のユニットを同時に使用する。
2)複数のコプロセッサを同時に使う。
・一枚の画像を分割して、それぞれを別ユニットで実行させる方法、
・テンプレートマッチングなどのように同じ処理を複数回行う場合に、それらを別ユニットで実行させる方法、
・タスクレベルで処理をパイプライン化する方法
などがある。
上に述べたアーキテクチャに基づいて、本発明者らは、以下に示す評価用のシステムを開発した。システムのデザインと性能評価の結果を示す。
・FPGA:コプロセッサ
・DDR2DIMM:フレームメモリ
・DIO、USB、RS-232C、Ethernet(登録商標):I/Oインタフェース
・DDR-SDRAM:メインメモリ
・EXT.BUS:拡張バス。なお、この拡張バスを介して各FPGAはCPUバスに接続されている。したがって、機能上は、この拡張バスは、コプロセッサ間のバスとCPUバスとを兼ねていることになる。
・FPGA-DRAM間:3200MB/s (200MHz, 128bit);
・FPGA-SRAM間:1333MB/s (166.6MHz, 64bit);
・FPGA-CPU間:133MB/s (66.67MHz, 16bit);
・FPGA-FPGA間:2133MB/s (133.33MHz, 128bit)。
・二つの並列メモリ(64kbytes) (PAR1, PAR4);
・四つの並列メモリ(16kbytes) (PAR2, PAR3, PAR5, PAR6);
・二つのDMA制御ユニット(DMA1, DMA2);
・九つの処理ユニット(後述の表2及び表3参照);
・命令ディスクリプタ。
・入力データを、
1)0x0000〜0xffffとして解釈(符号無し);
2)-0x8000〜0x7fffとして解釈(符号付き)。
・演算結果を、
1)0x0000〜0xffffで表現;
2)-0x8000〜0x7fffで表現;
3)絶対値をとって、0x0000〜0xffffで表現。
・演算結果が16bitに収まらない場合は最大値か最小値のいずれかで飽和させる。
・二値化を行う場合、結果yがTl≦y≦Thの場合は1、それ以外は0とする。ここで、Tl及びThは、適宜に設定される閾値の上限及び下限を示す。
・(一行あたり転送バイト数)×(行数)の設定;
・ソース及びディスティネーションそれぞれの転送開始アドレスと一行あたりのアドレス増分
を指定する。これによって大画面の画像の一部切り出し、埋め込みが可能である。
この回路は、16バイト毎にデータを左にバイト単位でシフトした結果を出力するものである。データのsrcアドレスについては、16の倍数でなければならないという制限があるが、シフト回路を使うと、任意のアドレスのデータをsrcとすることができる。
この回路は、16バイト毎にデータ入力を受け付け、8→1(出力データ量1/8倍), 4→1(出力データ量1/4倍), 2→1(出力データ量1/2倍)のいずれかの間引きを行ったデータを出力する。この機能とDMA転送のアドレス増分の指定とにより、画像の縮小を行うことができる。
この回路では、16バイト毎にデータを入力する。そして、8ビット(モノクロ)→16ビット(出力データ量は2倍)、8ビット(ベイヤー)→16ビット(R成分、G成分、B成分のいずれか)、16ビット→8ビット(出力データ量は1/2倍)のいずれかの変換を行うことができる。カメラから送られてくるデータは1画素が8ビットで構成されており、これをコプロセッサで処理するためには、1画素16ビットに変換する必要がある。カラーカメラの場合、ベイヤー変換を行い、RGBのいずれかの成分のみを出力する処理を行う。
・SCALE:画素値を線形にスケーリングする処理;
・ARITH:二つの画像間で加減算、乗算を行う処理;
・3x3CONV:オペレータのカーネルサイズが3×3のコンボリューションフィルタ;
・SUM:指定した範囲で画素値の総和を計算する処理;
・AFFINE:画像を平面アフィン変換で変形する処理。
本実施例で用いたFPGAは、200MHzで動作し、使用リソースはFPGA1が88%、FPGA2が81%である。
111、112、…、11N DMAC(画像処理部)
121、122、…、12M 並列メモリ
13A、13B、…、13X 処理ユニット(画像処理部)
141 ディスクリプタ
121 並列メモリ
21、22、…、2P フレームメモリ
3 CPU
4 メインメモリ
5 I/Oインタフェース
6 カメラインタフェース
7 ビデオインタフェース
8 CPUバス
9 インターコプロセッサバス
Claims (11)
- コプロセッサと、フレームメモリと、CPUとを備えており、
前記フレームメモリは、処理されるべき画像データを格納する構成となっており、
前記コプロセッサは、複数の画像処理部と複数の並列メモリとを備えており、
前記並列メモリは、前記フレームメモリに格納された前記画像データの全部又は一部を受け取って前記画像処理部のいずれかに送る構成となっており、
前記複数の画像処理部は、いずれも、画像処理のための関数に対応した機能を有しており、
かつ、前記複数の画像処理部は、前記CPUからの指令に従って、
前記並列メモリ又は前記フレームメモリから、前記画像データの全部又は一部を受け取り、さらに、
前記画像データの全部又は一部に対して、前記画像処理のための関数に従った処理を行う構成となっている
画像処理装置。 - 前記コプロセッサは、再構成可能なプログラマブル・ロジック・デバイスによって構成されている
請求項1に記載の画像処理装置。 - 前記複数の並列メモリは、デュアルポート・メモリである
請求項1又は2に記載の画像処理装置。 - 前記画像処理部は、ダイレクト・メモリ・アクセス・コントローラと、処理ユニットとを備えており、
前記ダイレクト・メモリ・アクセス・コントローラは、前記並列メモリの動作を制御する構成となっており、
前記処理ユニットは、前記画像処理のための関数に従った処理を行う構成となっている
請求項1〜3のいずれか1項に記載の画像処理装置。 - 前記コプロセッサを複数個備えている
請求項1〜4のいずれか1項に記載の画像処理装置。 - 前記複数のコプロセッサは、共通のコプロセッサ・バスに接続されている
請求項5に記載の画像処理装置。 - 前記コプロセッサは、ディスクリプタをさらに備えており、
前記CPUは、前記コプロセッサへの命令を前記ディスクリプタに書き込む構成となっており、
前記コプロセッサは、前記ディスクリプタに書かれている命令を読み取り、前記複数の画像処理部による処理を実行する構成となっている
請求項1〜6のいずれか1項に記載の画像処理装置。 - 前記複数の画像処理部は、前記CPUからの指令に従って、独立して並列に動作する構成となっている
請求項1〜7のいずれか1項に記載の画像処理装置。 - 以下のステップを備える画像処理方法:
(1)フレームメモリが、処理されるべき画像データを格納するステップ;
(2)並列メモリが、前記フレームメモリに格納された前記画像データの全部又は一部を受け取るステップ;
(3)前記複数の画像処理部が、CPUからの指令に従って、前記並列メモリ又は前記フレームメモリから、前記画像データの全部又は一部を受け取るステップ;
(4)前記複数の画像処理部が、前記CPUからの指令に従って、前記画像データの全部又は一部に対して、画像処理のための関数に従った処理をそれぞれ行うステップ。 - 前記並列メモリとして、デュアルポート・メモリが用いられており、
さらに、複数の画像処理部は、前記CPUからの指令に従って、前記並列メモリをバッファとしたパイプライン処理を行うものである
請求項9に記載の画像処理方法。 - 前記複数の画像処理部は、前記CPUからの指令に従って、独立して並列に動作する構成となっており、
さらに、前記複数の画像処理部は、前記CPUからの指令に従って、タスクレベルでの並列処理を行うものである
請求項9又は10に記載の画像処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014118297A JP2014160516A (ja) | 2014-06-09 | 2014-06-09 | 画像処理装置及び画像処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014118297A JP2014160516A (ja) | 2014-06-09 | 2014-06-09 | 画像処理装置及び画像処理方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009195777A Division JP2011048579A (ja) | 2009-08-26 | 2009-08-26 | 画像処理装置及び画像処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014160516A true JP2014160516A (ja) | 2014-09-04 |
Family
ID=51612101
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014118297A Pending JP2014160516A (ja) | 2014-06-09 | 2014-06-09 | 画像処理装置及び画像処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014160516A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111428566A (zh) * | 2020-02-26 | 2020-07-17 | 沈阳大学 | 一种形变目标跟踪系统及方法 |
CN113228095A (zh) * | 2020-06-30 | 2021-08-06 | 深圳市大疆创新科技有限公司 | 图像处理方法、显示处理装置和计算机可读存储介质 |
CN113516035A (zh) * | 2021-05-06 | 2021-10-19 | 佛山市南海区广工大数控装备协同创新研究院 | 一种多接口融合的指纹图像前处理方法 |
CN117893391A (zh) * | 2024-03-14 | 2024-04-16 | 华中科技大学 | 面向小型无人机平台的多光谱图像智能处理系统及方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0573516A (ja) * | 1991-09-12 | 1993-03-26 | Sony Corp | 信号処理用プロセツサ |
JPH06131155A (ja) * | 1991-01-29 | 1994-05-13 | Analogic Corp | 再構成可能な順次処理装置 |
JP2001236496A (ja) * | 1999-10-04 | 2001-08-31 | Texas Instr Inc <Ti> | 絶対差分の合計および対称濾波用の再構成可能simdコプロセッサ構造 |
JP2006515033A (ja) * | 2003-04-17 | 2006-05-18 | コンゾルテイウム フユール エレクトロケミツシエ インヅストリー ゲゼルシヤフト ミツト ベシユレンクテル ハフツング | 火炎挙動が改善されたイソシアネート不含の発泡性混合物 |
JP2006133839A (ja) * | 2004-11-02 | 2006-05-25 | Seiko Epson Corp | 画像処理装置、印刷装置および画像処理方法 |
US20060239551A1 (en) * | 2002-02-14 | 2006-10-26 | Cogent Systems, Inc. | Method and apparatus for two dimensional image processing |
US7281093B1 (en) * | 2004-12-21 | 2007-10-09 | Xilinx, Inc. | Memory apparatus for a message processing system and method of providing same |
-
2014
- 2014-06-09 JP JP2014118297A patent/JP2014160516A/ja active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06131155A (ja) * | 1991-01-29 | 1994-05-13 | Analogic Corp | 再構成可能な順次処理装置 |
JPH0573516A (ja) * | 1991-09-12 | 1993-03-26 | Sony Corp | 信号処理用プロセツサ |
JP2001236496A (ja) * | 1999-10-04 | 2001-08-31 | Texas Instr Inc <Ti> | 絶対差分の合計および対称濾波用の再構成可能simdコプロセッサ構造 |
US20060239551A1 (en) * | 2002-02-14 | 2006-10-26 | Cogent Systems, Inc. | Method and apparatus for two dimensional image processing |
JP2006515033A (ja) * | 2003-04-17 | 2006-05-18 | コンゾルテイウム フユール エレクトロケミツシエ インヅストリー ゲゼルシヤフト ミツト ベシユレンクテル ハフツング | 火炎挙動が改善されたイソシアネート不含の発泡性混合物 |
JP2006133839A (ja) * | 2004-11-02 | 2006-05-25 | Seiko Epson Corp | 画像処理装置、印刷装置および画像処理方法 |
US7281093B1 (en) * | 2004-12-21 | 2007-10-09 | Xilinx, Inc. | Memory apparatus for a message processing system and method of providing same |
Non-Patent Citations (2)
Title |
---|
JPN6015020036; 福島 知紀、外5名: '"線虫Caenorhabdits elegans初期胚の細胞分裂パターン計測システムのリコンフィギュ' 電子情報通信学会論文誌 Vol.J90-D, No.11, 20071101, pp.2970-2980, 社団法人電子情報通信学会 * |
JPN6015020039; 渡辺 義浩、外3名: '"超並列コプロセッサIPを用いたリコンフィギャラブル高速ビジョンシステムの構築と評価"' FIT2006 第5回情報科学技術フォーラム 情報科学技術レターズ 第5巻 , 20060821, pp.25-28, 社団法人電子情報通信学会、社団法人情報処理学会 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111428566A (zh) * | 2020-02-26 | 2020-07-17 | 沈阳大学 | 一种形变目标跟踪系统及方法 |
CN111428566B (zh) * | 2020-02-26 | 2023-09-01 | 沈阳大学 | 一种形变目标跟踪系统及方法 |
CN113228095A (zh) * | 2020-06-30 | 2021-08-06 | 深圳市大疆创新科技有限公司 | 图像处理方法、显示处理装置和计算机可读存储介质 |
CN113516035A (zh) * | 2021-05-06 | 2021-10-19 | 佛山市南海区广工大数控装备协同创新研究院 | 一种多接口融合的指纹图像前处理方法 |
CN117893391A (zh) * | 2024-03-14 | 2024-04-16 | 华中科技大学 | 面向小型无人机平台的多光谱图像智能处理系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2011024654A1 (ja) | 画像処理装置及び画像処理方法 | |
US11859973B2 (en) | Large scale CNN regression based localization via two-dimensional map | |
JP6309620B2 (ja) | 頂点シェーダのフロント・エンドとしてコンピュート・シェーダを使用すること | |
JP5242771B2 (ja) | 混合精度命令実行を伴うプログラマブルストリーミングプロセッサ | |
US10504275B2 (en) | Methods and apparatus for more efficient ray tracing of instanced geometry | |
AU747283B2 (en) | Data processing system for logically adjacent data samples such as image data in a machine vision system | |
US10229468B2 (en) | Automated conversion of GPGPU workloads to 3D pipeline workloads | |
WO2017107168A1 (en) | Event-driven framework for gpu programming | |
US11194722B2 (en) | Apparatus and method for improved cache utilization and efficiency on a many core processor | |
US10789071B2 (en) | Dynamic thread splitting having multiple instruction pointers for the same thread | |
US20110249744A1 (en) | Method and System for Video Processing Utilizing N Scalar Cores and a Single Vector Core | |
JP2014160516A (ja) | 画像処理装置及び画像処理方法 | |
US20160283549A1 (en) | Value sorter | |
US10818067B1 (en) | GPU assist using DSP pre-processor system and method | |
WO2016171817A1 (en) | Optimized depth buffer cache apparatus and method | |
US10409571B1 (en) | Apparatus and method for efficiently accessing memory when performing a horizontal data reduction | |
TW201709085A (zh) | 處理需要相加數個乘法結果之指令 | |
TW202121336A (zh) | 平行解壓縮機制 | |
US9183611B2 (en) | Apparatus implementing instructions that impose pipeline interdependencies | |
JP6329412B2 (ja) | Simdプロセッサ | |
TW201810026A (zh) | 用於在計算環境中資料之邏輯處理的暫存器檔案之延伸 | |
US20170032486A1 (en) | Packet Processing on Graphics Processing Units Using Continuous Threads | |
Komuro et al. | A reconfigurable embedded system for 1000 f/s real-time vision | |
EP3394734A1 (en) | Multiple-patch simd dispatch mode for domain shaders | |
WO2017049583A1 (en) | Gpu-cpu two-path memory copy |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140619 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140619 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150526 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20151006 |