JP2000295613A - 再構成可能なハードウェアを用いた画像符号化方法,画像符号化装置および画像符号化のためのプログラム記録媒体 - Google Patents

再構成可能なハードウェアを用いた画像符号化方法,画像符号化装置および画像符号化のためのプログラム記録媒体

Info

Publication number
JP2000295613A
JP2000295613A JP10201099A JP10201099A JP2000295613A JP 2000295613 A JP2000295613 A JP 2000295613A JP 10201099 A JP10201099 A JP 10201099A JP 10201099 A JP10201099 A JP 10201099A JP 2000295613 A JP2000295613 A JP 2000295613A
Authority
JP
Japan
Prior art keywords
image
block
processing element
domain
image block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10201099A
Other languages
English (en)
Inventor
Hidenao Nagano
秀尚 永野
Akihiro Matsuura
昭洋 松浦
Akira Nagoya
彰 名古屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP10201099A priority Critical patent/JP2000295613A/ja
Publication of JP2000295613A publication Critical patent/JP2000295613A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

(57)【要約】 【課題】 画像符号化において,レンジブロックとドメ
インブロックの組み合わせにおける計算処理を,限られ
たハードウェア資源を有効に活用してできるだけ高速に
行うことを目的とする。 【解決手段】 全てのレンジブロック(画素値:bi
とドメインブロック(画素値:ai )の組み合わせにお
いてその近似度Rを計算するのに必要な処理を行うプロ
セッシングエレメント(PE)を,再構成可能なハード
ウェア上に複数用意し,これらのPEを与えられたレン
ジブロックに特化して構成する。このとき,bi を構成
するビット値により,Σi=1 n i i の演算におい
て,bi の構成するビットを反転させた値を用いる。ま
た,各レンジブロックに対し,閾値未満のRとなるドメ
インブロックを一つ見つけたら,すぐさま,PEを他の
レンジブロックに特化して再構成し,他のレンジブロッ
クのための処理を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は,論理の再構成が可
能なハードウェアを用いて,入力されるデータによって
ハードウェアの論理を再構成し,限定されたリソースを
有効に活用して,処理を高速化する再構成可能なハード
ウェアを用いた画像符号化方法,画像符号化装置および
画像符号化のためのプログラム記録媒体に関するもので
ある。
【0002】
【従来の技術】1980年代,M.F.Barnsleyにより反復
関数系(Iterated Function Systems,略称IFS)を用
いた画像符号化法が提案され(参考文献1), A.E.Jacqu
inが濃淡画像の画像符号化法に発展させた (参考文献
2) 。これらの画像符号化法の典型的な手法の1つとし
て,白黒濃淡画像のための quad-tree decomposition手
法がある (参考文献3) 。 [参考文献1]M.F.Barnsley, V.Ervin, D.Hardin, and
J.Lancaster, "Solution of an Inverse Problem for
Fractals and Other Sets", Proceeding of National A
cademy of Sciences USA, Vol.83, pp.1975-1977, Apr.
1986 . [参考文献2]A.E.Jacquin, "Fractal Image Coding:
A Review", Proc. of the IEEE, vol.81, no.10, pp.14
51-1465, Oct. 1993. [参考文献3]Y.Fisher(Ed.), Fractal Image Compres
sion: Theory and Application, Springer, 1996. 以下, 本発明が利用する quad-tree decomposition手法
について説明する。quad-tree decomposition 手法にお
いては,図7のように符号化したい画像をレンジブロッ
クと呼ばれる重なりのない等しい大きさの正方形の画像
ブロックに分割する。ここで正方形の1辺の長さはn
1/2 画素とし,各正方形はn個の画素からなるとする。
そして,これらのレンジブロックを順にR1 ,R2
…,Rp と呼ぶことにする。
【0003】また,符号化したい画像を図8のようにド
メインブロックと呼ばれる画像ブロックにも分割する。
ドメインブロックは1辺の長さが2n1/2 画素の正方形
であり,4n個の画素からなる。ドメインブロックへの
画像の分割は重なりのあるものも全て考慮に入れ,上下
方向または左右方向に1画素ずつずれた正方形の画像ブ
ロックも別のドメインブロックとする。これらのドメイ
ンブロックを順にD1,D2 ,…,Dq と呼ぶことにす
る。また,このようなドメインブロック全ての集合をド
メインプールと呼ぶ。
【0004】quad-tree decomposition 手法において
は,上記の各レンジブロックについて,全てのドメイン
ブロックにアフィン変換を施した画像ブロックで近似を
行う。そして,各レンジブロックについて,その画素値
の代わりに,そのレンジブロックを最もよく近似するド
メインブロックの番号と,アフィン変換のパラメータを
保存し,画像の符号化を行う。以下,この符号化につい
て詳細に述べる。
【0005】各レンジブロックについて,全てのドメイ
ンブロックから,そのレンジブロックを最も良く近似す
るドメインブロックを以下のようにして探す。ここで,
ドメインブロックとして,各ドメインブロックを90
°,180°,270°,360°回転させた画像ブロ
ック,およびそれらを左右に反転させた画像ブロックも
ドメインブロックとする。すなわち,計8種類の変換を
施した画像ブロックもドメインブロックとする。
【0006】これらのドメインブロックの2×2画素の
濃度値を平均化し,1つの画素とすることで,各ドメイ
ンブロックをレンジブロックと同じ大きさに縮小する。
以下,単にドメインブロックと言えば,このようにして
レンジブロックと同じ大きさに縮小されているものとす
る。そして,縮小されたあるドメインブロックDj の画
素値をa1 ,a2 ,…,an とし,あるレンジブロック
k の画素値をb1 ,b2 ,…,bn とする。ドメイン
ブロックとレンジブロックの画素値の添字については,
添字が同じ画素値は画像ブロック内で同じ位置の画素の
画素値を表すものとする。このレンジブロックに対する
ドメインブロックの近似度は,以下のように定義される
2つの画像ブロック間の2乗距離の2乗であるRで測
る。
【0007】
【数1】
【0008】この式で,sは濃度値に関するスケーリン
グパラメータ,oは濃度値に関するオフセットパラメー
タである。ここで,与えられたa1 ,a2 ,…,an
1 ,b2 ,…,bn において,Rをsとoについて偏
微分することにより,
【0009】
【数2】
【0010】のときに,Rが最小となる。このときのR
は,以下のようにして計算される。
【0011】
【数3】
【0012】以降,与えられたa1 ,a2 ,…,an
1 ,b2 ,…,bn において,Rは式(4) に従って計
算されるものとする。以上のようにして計算されるRを
近似度として,各レンジブロックについて最小のRを与
えるドメインブロック(ここではベストドメインと呼
ぶ)を探す。そして,各レンジブロックについてその最
小のRがユーザの与えるRの閾値tolerance より小さい
場合, その画素値の代わりに, ベストドメインの番号,
および, そのドメインブロックとの間のsとoを符号化
する。
【0013】最小のRが tolerance以上であったレンジ
ブロックについては,そのレンジブロックを図9のよう
に4分の1の大きさに分割し,4つのレンジブロックの
各々について同じように最小のRで近似するドメインブ
ロックを探し,同じ処理を再帰的に繰り返す。このと
き,ドメインブロックについても,レンジブロックと同
様に4分の1の大きさのドメインブロックの全てを考え
る。以上が quad-tree decomposition手法の概要であ
り,図10にその処理のフローチャートを示す。
【0014】[ステップS101]:全てのレンジブロ
ックについてベストドメインが見つかったかどうか判定
する。YESの場合には処理を終了する。NOの場合に
はステップS102へ進む。
【0015】[ステップS102]:ベストドメインが
見つかっていないレンジブロックを入力する。
【0016】[ステップS103]:ステップS102
で入力されたレンジブロックに対し,全てのドメインブ
ロックでsの計算が行われたかどうかを判定する。YE
Sの場合にはステップS110へ進み,NOの場合には
ステップS104へ進む。
【0017】[ステップS104]:ステップS102
で入力されたレンジブロックに対しsの計算が行われて
いないドメインブロックを入力する。
【0018】[ステップS105]:ステップS102
で入力されたレンジブロックと,ステップS104で入
力されたドメインブロックにおいて,式(2) に従ってs
を計算する。
【0019】[ステップS106]:ステップS105
で計算されたsが1未満であるかどうかを判定する。Y
ESの場合にはステップS107へ進み,NOの場合に
はステップS103へ進む。
【0020】[ステップS107]:式(4) に従ってR
を計算する。
【0021】[ステップS108]:ステップS107
で求めたRが現在のレンジブロックについてこれまで求
めたRの最小値min_Rよりも小さいかを判定する。
YESの場合にはステップS109へ進み,NOの場合
にはステップS103へ進む。
【0022】[ステップS109]:min_Rの値を
Rに更新する。また,現時点でベストドメインを示す番
号を現在のドメインブロックの番号に更新する。
【0023】[ステップS110]:min_Rの値が
閾値tolerance より小さいかを判定する。YESの場合
にはステップS111へ進み,NOの場合にはステップ
S112へ進む。
【0024】[ステップS111]:現在のレンジブロ
ックについてベストドメインが見つかったとし,ベスト
ドメインを示す番号,およびsとoを保存する。
【0025】[ステップS112]:現在のレンジブロ
ックを4つに分割し,ベストドメインが見つかっていな
いレンジブロックとする。
【0026】以上が,本発明の利用する quad-tree dec
omposition手法の概要である。
【0027】
【発明が解決しようとする課題】符号化にかかる計算時
間について考えると,上述した quad-tree decompositi
on手法は,長時間を要する複雑な近似度の計算を多くの
回数繰り返さないといけないため,符号化のために非常
に長い計算時間を要する。
【0028】この近似度の計算についてはステップS1
05でsが式(2) に基づいて計算され,このsの値が1
より小さければ,ステップS105で求められたsの値
を用いながら,ステップS107でRが式(4) に基づい
て計算される。特にsの計算については,全てのレンジ
ブロックとドメインブロックの組み合わせについて必ず
計算されることになる。これらの式(2) と式(4) とをみ
ると,項Σi=1 n i,Σi=1 n i ,(nΣi=1 n
i 2 −(Σi=1 n i 2 ),そして(nΣi= 1 n i
2 −(Σi=1 n i 2 )については,それぞれのレン
ジブロックまたはドメインブロックについてただ一度だ
け前もって計算しておけば良い。
【0029】それゆえ,全てのレンジブロックとドメイ
ンブロックの組み合わせにおいて計算しなくてはならな
いものは,式(2) と式(4) の上記の項を除いた部分とな
り,特に計算時間を要するのはΣi=1 n i i の計算
である。そしてこれを全てのレンジブロックとドメイン
ブロックの組み合わせにおいて計算しなくてはならず,
結果,符号化に長時間を要する。
【0030】以上の結果から明らかなように,従来から
汎用の計算機(CPU)や並列計算機を用いて符号化が
行われているが,計算時間が非常に長いことが問題であ
った。
【0031】本発明は,上記のレンジブロックとドメイ
ンブロックの組み合わせにおける計算処理をできるだけ
高速に行い,かつ,同時に複数のレンジブロックとドメ
インブロックの組み合わせについて処理を行うことで符
号化を高速に行うことを目的とする。
【0032】
【課題を解決するための手段】上記目的を達成するため
に,全てのレンジブロックとドメインブロックの組み合
わせにおいてその近似度を計算するのに必要な処理をパ
イプライン化による並列処理で高速に行うプロセッシン
グエレメント(PE)を再構成可能なハードウェア上に
複数用意する。そして,これらのPEを与えられたレン
ジブロックに特化して構成することで,各PEの実現に
必要なハードウェア資源の主要部分を,最悪でも約1/
2まで減らすことにより,限られたハードウェア資源で
できるだけ多くのPEを実現し,同時に複数のレンジブ
ロックとドメインブロックの組み合わせにおいて近似度
の計算を行う。また,各レンジブロックに対し,閾値未
満のRとなるドメインブロックを一つ見つけたら,すぐ
さま,PEを他のレンジブロックに特化して再構成し,
他のレンジブロックのための処理を行う。
【0033】本発明の作用は,以下のとおりである。各
PEにおいて,レンジブロックとドメインブロックの近
似度を計算するのに必要な処理がパイプライン化による
並列処理で高速に行われる。そのため,この計算処理に
かかる時間が短縮される。また,各レンジブロックに対
し,閾値未満のRとなるドメインブロックを一つ見つけ
たら,すぐさま,PEを他のレンジブロックに特化して
再構成し,他のレンジブロックのための処理を行うこと
で,近似度の計算を行うレンジブロックとドメインブロ
ックの組み合わせを減らすことができ,その結果,符号
化時間が短縮される。
【0034】そして,こられのPEを与えられたレンジ
ブロックに特化して構成することで,各PEの実現に必
要なハードウェア資源を減らすことにより,限られたハ
ードウェア資源でできるだけ多くのPEを実現し,同時
に複数のレンジブロックとドメインブロックの組み合わ
せにおいて近似度の計算を同時に行うことにより,符号
化時間が短縮される。
【0035】以上の画像符号化のために,前記複数のP
Eを再構成し,各PEにレンジブロックとドメインブロ
ックとの近似度を計算させる制御装置を実現するための
プログラムは,制御装置の計算機が読み取り可能な可搬
媒体メモリ,半導体メモリ,ハードディスクなどの適当
な記録媒体に格納することができる。
【0036】
【発明の実施の形態】上記目的を達成するために,PE
が複数接続されたネットワーク構造をもつ符号化器を動
的再構成可能なハードウェアを用いて実現し,符号化を
行う。ここで,動的再構成可能なハードウェアとは,例
えばXilinx社のXC6200シリーズFPGA(Xilinx, XC6
200 Field Programmable Gate Arrays, Apr. 1997)や A
tmel社AT40K FPGA(Atmel, AT40K FPGAs, Dec.
1997) のように,ハードウェアの各ロジックエレメント
とそれらの間のプログラム可能な配線に構成データを与
えることで,ハードウェアの論理構造を動的に変更可能
なものとする。
【0037】本発明で提案する基本的なPEのネットワ
ーク構造を図1に示す。図1に示すように,再構成可能
なハードウェア1は,データパス4に多段に接続された
バッファ11,11,…と,各バッファ11からデータ
を授受して演算するPE1 12,PE2 12,…,PE
v 12(以下,PE1 〜PEv の各々をPEと略記す
る)とからなる。各PE12とコントロールユニット3
とは,コントロールパス5によって接続される。
【0038】ドメインユニット2は,ドメインプールの
各ドメインブロックの画素を順に繰り返し,データパス
4に並列に入力する。このデータパス4に与えられたド
メインブロックの画素はバッファ11へと入力される。
バッファ11は,入力されたドメインブロックの画素を
順次,隣り合うバッファ11と,接続されたPE12に
入力する。各PE12は,コントロールユニット3から
与えられる特定のレンジブロックに応じたハードウェア
の構成データにより,特定のレンジブロックに特化して
構成され,そのレンジブロックとバッファ11から与え
られるドメインブロックの間の近似度を計算する。
【0039】各PE12において,与えられたレンジブ
ロックに対するベストドメインが見つかると,そのレン
ジブロックのベストドメインの番号およびsとoをコン
トロールユニット3にコントロールパス5を通して通知
する。通知を受けたコントロールユニット3は,そのレ
ンジブロックのベストドメインが見つかったとし,ベス
トドメインが見つかっていない他のレンジブロックに対
応するハードウェアの構成データをコントロールパス5
に与え,PE12を次のレンジブロックのために再構成
する。
【0040】再構成されたPE12は同じようにして,
与えられたレンジブロックのベストドメインを探す。与
えられたレンジブロックについて閾値tolerance 未満の
Rとなるドメインブロックが見つからなかった場合,P
E12はレンジブロックを再分割することをコントロー
ルユニット3に通知する。この通知を受けると,コント
ロールユニット3は現在のレンジブロックを再分割する
ことにし,ベストドメインが見つかっていない他のレン
ジブロックの構成データをコントロールパス5を通して
PE12に与える。PE12は与えられたレンジブロッ
クに特化して再構成され,同じ処理を繰り返す。
【0041】コントロールユニット3では,上記のよう
にして,ベストドメインが見つかっていないレンジブロ
ックのための構成データを,全てのレンジブロックにつ
いてベストドメインが見つかるまで,各PE12に与え
続ける。この間,ドメインユニット2は,全てのドメイ
ンブロックのデータを順次,繰り返し入力し続ける。各
PE12が再分割されたレンジブロックのために構成さ
れ始めると,それに合わせ,ドメインユニット2も同じ
大きさのドメインブロックのデータを順次繰り返し,入
力する。そして,全てのレンジブロックについてベスト
ドメインが見つかると符号化は終了する。
【0042】上記のように,本発明においては,複数の
PE12の間で,順次,ドメインブロックのデータを受
け渡していくことで,複数のドメインブロックとレンジ
ブロックの組み合わせについて近似度の計算が同時に行
われ,高速に符号化処理を行うことが可能になる。
【0043】次に,図2に,特定のレンジブロックに特
化して構成されたPE12が行う処理のフローチャート
を示す。図2において,各処理は以下のとおりである。
【0044】[ステップS10]:与えられているレン
ジブロックに対し,全てのドメインブロックでsの計算
が行われたかどうかを判定する。YESの場合にはステ
ップS17へ進み,NOの場合にはステップS11へ進
む。
【0045】[ステップS11]:sの計算が行われて
いないドメインブロックを入力する。
【0046】[ステップS12]:与えられているレン
ジブロックと,ステップS11で入力されたドメインブ
ロックにおいて,式(2) に従ってsを計算する。
【0047】[ステップS13]:ステップS12で計
算されたsが1未満であるかどうかを判定する。YES
の場合にはステップS14へ進み,NOの場合にはステ
ップS10へ進む。
【0048】[ステップS14]:式(4) に従ってRを
計算する。
【0049】[ステップS15]:ステップS14で求
めたRが,現在のレンジブロックについてこれまで求め
たRの最小値min_Rよりも小さいかどうかを判定す
る。YESの場合にはステップS16へ進み,NOの場
合にはステップS10へ進む。
【0050】[ステップS16]:min_Rの値をR
に更新する。また,現時点でベストドメインを示す番号
を現在のドメインブロックの番号に更新する。
【0051】[ステップS17]:min_Rの値が閾
値tolerance より小さいかどうかを判定する。YESの
場合にはステップS18へ進み,NOの場合にはステッ
プS19へ進む。
【0052】[ステップS18]:現在のレンジブロッ
クについてベストドメインが見つかったとし,ベストド
メインを示す番号,およびsとoをコントロールユニッ
ト3に通知する。
【0053】[ステップS19]:現在のレンジブロッ
クを4つに分割し,再度ベストドメインを探索すること
をコントロールユニット3に通知する。
【0054】次に,各PE12の構造を,図3に示す。
図3のPE12において,P1と示す部分はΣi=1 n
i i の計算を行う部分で,バッファ11から順次与え
られるドメインブロックの画素値から,Σi=1 n i
i の計算を順次パイプラインで行う。パイプラインで行
うことにより,各クロック毎に一つのドメインブロック
に対し,Σi=1 n i i の計算結果を出力する。P2
は,PE12のその他の計算をΣi=1 n i i と,先
に述べたドメインブロック毎に前計算可能なパラメータ
から,図2で述べた処理をパイプライン化して行う。す
なわち,各PE12においては1クロック毎に与えられ
たレンジブロックとドメインブロックの間の近似度の計
算が行われる。つまり,非常に高速にレンジブロックと
ドメインブロックの間の近似度の計算が行われる。
【0055】限られたハードウェアの資源の下で,複数
のPEにより,できるだけ多数のレンジブロックとドメ
インブロックの組み合わせについて近似度の計算を並列
に行い,さらなる高速処理を行うには,PEの回路規模
を削減し,実装されるPEの数を多くすることが重要で
ある。PEの回路規模についてはP1の部分が大部分を
占める。すなわち,P1の回路規模の削減が重要であ
る。
【0056】まず,通常のハードウェアの再構成可能性
を用いないP1の実現法について説明する。bi の2進
表現をbi,m i,m-1 …bi,1 とし,bi,j は0か1で
あるとする。そして,ai とbi の2進表現でのビット
幅をmとする。ai i の乗算はai i ={(ai
i,m )≪(m−1)}+{(ai i,m-2 )≪(m−
2)}+…+{ai i,1 }と表すことができる。ここ
で,a≪jはaの左へのjビットシフトを表す。この場
合,ai i の乗算はm−1個の加算器で実現され,P
1におけるΣi=1 n i i の計算のための加算器の個
数は, (m−1)n+(n−1)=mn−1 (5) となる。
【0057】一方,ハードウェアの再構成可能性を利用
し,PEを特定のレンジブロックに特化して構成する場
合,bi,j を定数として扱うことができる。すなわち,
(a i i,j )の乗算を,もしbi,j が0であればP1
から取り除くことができる。そして,bi,j が1であれ
ば,(ai i,j )の乗算はai となる。そして,2進
数の集合{bi |i=1,2,…,n}において,1で
あるビットの数が少ないほど,加算器の個数は少なくな
る。そこでまず,Σi=1 n i i を以下のように書き
直す。
【0058】
【数4】
【0059】式(6) のj番目の項, (a1 1,j +a2 2,j +…+an n,j ) (7) は, Σi=1 n i −(a1 1,j * +a2 2,j * +…+an n,j * ) (8) としても計算可能である。そこで,b1,j ,b2,j
…,bn,j について1であるビットの数がn/2よりも
大きければ,P1を式(7) の代わりに式(8) を使って計
算するように構成する。これを全てのjについて行う。
その結果,P1に必要な加算器の数は,一番多い場合で
も, (nm/2)−1 (9) となる。このようにしてP1を構成することで,PEに
ついて必要なハードウェア資源を削減することができ,
従って,一定のハードウェア資源でより多くのPEを実
現することが可能になる。その結果,同時により多くの
ドメインブロックとレンジブロックの組み合わせについ
て近似度の評価が行え,画像の符号化が高速に行えるよ
うになる。
【0060】さらに,各PEでの処理を図4のようにす
ることで,画像の符号化を高速化させることができる。
図4での各処理は以下のようになる。
【0061】[ステップS20]:与えられているレン
ジブロックに対し,全てのドメインブロックでsの計算
が行われたかどうか判定する。YESの場合には,ステ
ップS27へ進み,NOの場合にはステップS21へ進
む。
【0062】[ステップS21]:sの計算が行われて
いないドメインブロックを入力する。
【0063】[ステップS22]:与えられているレン
ジブロックと,ステップS21で入力されたドメインブ
ロックにおいて,式(2) に従ってsを計算する。
【0064】[ステップS23]:ステップS22で計
算されたsが1未満であるかどうかを判定する。YES
の場合にはステップS24へ進み,NOの場合にはステ
ップS20へ進む。
【0065】[ステップS24]:式(4) に従ってRを
計算する。
【0066】[ステップS25]:ステップS24で求
めたRが閾値tolerance より小さいかどうかを判定す
る。YESの場合にはステップS26へ進み,NOの場
合にはステップS20へ進む。
【0067】[ステップS26]:現在のレンジブロッ
クについてベストドメインが見つかったとし,ベストド
メインを示す番号,およびsとoをコントロールユニッ
ト3に通知する。
【0068】[ステップS27]:現在のレンジブロッ
クを4つに分割し,再度ベストドメインを探索すること
をコントロールユニット3に通知する。
【0069】閾値未満の近似度で近似するドメインブロ
ックを見つけると,すぐさま他のレンジブロックに対応
してプロセッシングエレメント(PE)を再構成し,そ
の画像ブロックを近似する画像ブロックの探索を行うこ
とにより,さらに高速に画像の符号化を行うことができ
る。これはPEネットワークを部分的かつ動的に再構成
可能なハードウェア上に実現することで可能になる。
【0070】図5に,コントロールユニット3のフロー
チャートを示す。コントロールユニット3は,以下の処
理を行う。
【0071】[ステップS30]:まず,符号化したい
画像を入力する。
【0072】[ステップS31]:入力した画像データ
をもとに,各レンジブロックに応じたPE12の構成デ
ータを作成する。ここで,PE12に対して,Σi=1 n
ii の部分積の部分和である(a1 1,j +a2
2,j +…+an n,j )の計算を,このままの形で演算
させるか,Σi=1 n i −(a1 1,j * +a2 2, j
* +…+an n,j * )として演算させるかは,
1,j ,b2,j ,…,bn,jの1であるビットの数がn
/2よりも小さいか大きいかによって決定し,その結果
に応じてPE12の構成データを作成する。この構成デ
ータの形式については,再構成可能なハードウェア1の
アーキテクチャによって異なるが,既知の事項であるの
で,ここでの詳細な説明は省略する。
【0073】[ステップS32]:次に,現在の大きさ
の全てのレンジブロックに対し,ベストドメイン探索の
処理を行ったかどうかを判定し,YESの場合にはステ
ップS36へ進み,NOの場合にはステップS33へ進
む。
【0074】[ステップS33]:処理をしていないP
E12に,未処理のレンジブロックの構成データをコン
トロールパス5を介して渡し,その処理を行わせる。
【0075】[ステップS34,S35]:各PE12
からの処理の終了通知を待ち,各PE12からの処理の
終了通知があったなら,それを受け取る。このとき,終
了通知の内容により,4分割することになったレンジブ
ロックについては,4分割後のレンジブロックに対応し
たPE12の構成データを同時に作成する。この場合に
も,ステップS31における構成データの作成のときと
同様に,4分割後のレンジブロックにおける画素値bi
を定数とみたて,bi を構成するビット値が1であるも
のが0であるものより多いか少ないかによって,PE1
2に演算させるためのPE12の構成データを変える。
その後,ステップS32へ戻り,同様に処理を繰り返
す。
【0076】[ステップS36]:現在の大きさの全て
のレンジブロックに対し,ベストドメイン探索の処理を
行った場合,全てのレンジブロックに対し,ベストドメ
インが見つかったかどうかを判定し,YESの場合には
ステップS39へ進み,NOの場合にはステップS37
へ進む。
【0077】[ステップS37]:探索するレンジブロ
ックを,4分割することになった全てのレンジブロック
とする。
【0078】[ステップS38]:4分の1の大きさの
ドメインブロックを出力するよう,ドメインユニット2
に通知する。その後,ステップS32へ戻る。
【0079】[ステップS39]:すべてのレンジブロ
ックについてsとoとベストドメインを示す番号を出力
する。
【0080】[ステップS40]:ドメインユニット2
に処理の終了を通知する。
【0081】図6に,ドメインユニット2のフローチャ
ートを示す。ドメインユニット2は,以下の処理を行
う。
【0082】[ステップS50]:まず,符号化したい
画像を入力する。
【0083】[ステップS51]:次に,現在の大きさ
の全てのドメインブロックに対し,Σi=1 n i ,(Σ
i=1 n i 2 などの前計算を行う。
【0084】[ステップS52,S53]:コントロー
ルユニット3から通知があるまで,現在の大きさの全て
のドメインブロックについて,前計算したデータと画素
値を,各ドメインブロックごとに順番に繰り返しデータ
パス4に送出する。
【0085】[ステップS54]:コントロールユニッ
ト3から通知が送られてきたならば,その通知が終了通
知であるかドメインブロックを分割して出力することを
指示する通知であるかを判定し,終了通知であれば処理
を終了する。分割指示の通知であればステップS55へ
進む。
【0086】[ステップS55]:4分割したドメイン
の大きさを現在のドメインブロックの大きさとする。そ
の後,ステップS51へ戻り,同様に処理を繰り返す。
【0087】以上の実施の形態では,ドメインユニット
2の処理と,コントロールユニット3の処理とを分離し
ているが,これらの処理を1つのプロセッサによって実
現することも可能である。
【0088】
【実施例】ここでは,上記の[課題を解決するための手
段]で述べたPEの構成例と,図4で述べた処理方法の
実施例を示す。まず,PEの構成例について示す。与え
られるレンジブロックの画素値の集合{bi |i=1,
2,…,n}において,ビット幅4,n=9として,以
下のような場合を考える。
【0089】 b1 =1001 (10) b2 =1101 (11) b3 =1110 (12) b4 =1010 (13) b5 =1101 (14) b6 =1001 (15) b7 =1011 (16) b8 =1001 (17) b9 =1001 (18) なお,これらの値は全て2進数表現である。上記の[発
明の実施の形態]で述べたように,これら,bi を定数
と考えずにP1を構成した場合,P1に必要な加算器の
個数は,式(5) より, 4×9−1=35 (19) となる。一方,同じく[発明の実施の形態]で上述した
ように,各bi を定数として扱うと,
【0090】
【数5】
【0091】となる。なお,式中のビット値に付された
オーバーラインは,ビット値の反転を表す。
【0092】Σi=1 9i は前もって計算されている変数
であるから,結果,P1に必要な加算器および減算器の
個数は合わせて9個となる。減算器は加算器とほぼ同じ
ハードウェア資源で構成可能である。したがって,P1
に必要なハードウェア資源を加算器数で35個から9個
に減らすことができる。このようにして各PEに必要な
ハードウェア資源を減らすことにより,より多くのPE
が実装できるようになり,符号化を高速化させることが
できる。
【0093】次に,図4で述べた符号化方法の実施例を
示す。ここでは,実施例のためにレンジブロックR1
ドメインブロックD1 ,D2 ,D3 ,D4 を考える。そ
して,ドメインブロックはこの順番で,R1 に対応する
PEに入力されるものとする。また,R1 と各ドメイン
ブロックD1 ,D2 ,D3 ,D4 との間のRを,R1
1 との間のR=40,R1 とD2 との間のR=20,
1 とD3 との間のR=60,R1 とD4 との間のR=
25,とする。このとき,全てのドメインブロックでs
は1未満であったとする。また,ユーザが与える toler
anceの値は30であったとする。
【0094】まず,図2に示したようにして,R1 のベ
ストドメインを探索すると,D1 からD4 について順に
Rを計算し,結果,D2 をベストドメインとする。この
とき,R1 について,D1 からD4 までの4つのドメイ
ンブロックに対し,計4回のRの計算が行われる。一
方,図4で述べたようにPEを構成した場合,R1 とD
2 の間のRが tolerance未満のため,ベストドメインを
2 とし,この時点で処理を終了する。したがって,R
1 に対し,Rの計算はD1 とD2 の2回しか行われな
い。この実施例のように,一つのレンジブロックに対す
るRの計算回数が少なくて済むため,符号化時間を短縮
することができる。
【0095】以上,quad-tree decomposition 手法に基
づいた画像符号化を行う例について説明したが,この手
法に限らず,Σi=1 n i i の演算が必要となる画像
符号化を行う場合に,同様に本発明を適用することが可
能である。
【0096】
【発明の効果】以上説明したように,例えばquad-tree
decomposition 手法に基づいた画像符号化を行う際,ハ
ードウェア資源を有効に活用し,従来よりも高速に符号
化を行うことができるようになる。
【図面の簡単な説明】
【図1】再構成可能なハードウェア上に構成されるPE
のネットワークを表す図である。
【図2】PEの基本的な処理を示したフローチャートを
表す図である。
【図3】PEの構造を表す図である。
【図4】PEのより高速な処理を示したフローチャート
を表す図である。
【図5】コントロールユニットのフローチャートを表す
図である。
【図6】ドメインユニットのフローチャートを表す図で
ある。
【図7】レンジブロックを示す図である。
【図8】ドメインブロックを示す図である。
【図9】レンジブロックの分割を示す図である。
【図10】quad-tree decomposition 手法の処理を示し
たフローチャートを表した図である。
【符号の説明】
1 再構成可能なハードウェア 11 バッファ 12 プロセッシングエレメント(PE) 2 ドメインユニット 3 コントロールユニット 4 データパス 5 コントロールパス
───────────────────────────────────────────────────── フロントページの続き (72)発明者 名古屋 彰 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 Fターム(参考) 5C059 KK12 KK14 KK17 TA30 TB08 TC03 TD12 UA39 5C078 BA21 BA44 CA25 CA32 DA01 9A001 BB02 EE04 GG01 GG13 HH27

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 複数のプロセッシングエレメントの論理
    構成またはその論理構成とそれらの相互結合とを動的に
    変更することができるハードウェアを用い,2進数の集
    合{ai |i=1,2,…,n}と,bi =bi,m
    i,m-1 …bi,1というようにmビットで2進数表現され
    る2進数の集合{bi |i=1,2,…,n}とから,
    Σi=1 n i i の演算を含む処理を行う画像符号化方
    法において,前記各2進数bi (i=1,2,…,n)
    を定数とみたて,b1,j ,b2,j ,…,bn,j の1であ
    るビットの数がn/2よりも大きいときに,bi,j *
    表すビットbi,j を反転させたビットと,Σi=1 n i
    の値とを用いて,Σi=1 n i i の部分積の部分和で
    ある(a1 1,j +a2 2,j +…+an n,j )の計
    算を,Σi=1 n i −(a1 1,j * +a2 2,j *
    …+an n,j * )として,前記プロセッシングエレメ
    ントに計算させることを特徴とする再構成可能なハード
    ウェアを用いた画像符号化方法。
  2. 【請求項2】 前記プロセッシングエレメントは,前記
    Σi=1 n i i の計算を行う際に,2進数の集合{a
    i |i=1,2,…,n}とΣi=1 n i とを逐次入力
    し,Σi=1 n i i の演算をパイプライン処理し,1
    クロック毎に1組の{ai |i=1,2,…,n}につ
    いてΣi=1 n i i を計算することを特徴とする請求
    項1記載の再構成可能なハードウェアを用いた画像符号
    化方法。
  3. 【請求項3】 複数の異なる2進数の集合{bi |i=
    1,2,…,n}に各々が対応する複数の前記プロセッ
    サエレメントを相互に接続し,それらの各プロセッサエ
    レメントが各々複数の異なる2進数の集合{ai |i=
    1,2,…,n}とそのΣi=1 n i の値とを順次受け
    渡し,複数のプロセッサエレメントが各々の2進数の集
    合{bi |i=1,2,…,n}に対し,同時に1クロ
    ック毎に前記Σi=1 n i i の計算をパイプライン処
    理により並列に行うことを特徴とする請求項2記載の再
    構成可能なハードウェアを用いた画像符号化方法。
  4. 【請求項4】 2進数の集合{ai |i=1,2,…,
    n}と,bi =bi, m i,m-1 …bi,1 というようにm
    ビットで2進数表現される2進数の集合{b i |i=
    1,2,…,n}とから,Σi=1 n i i の演算を含
    む処理を行う画像符号化装置において,内部の論理構成
    またはその論理構成とそれらの相互結合とが動的に変更
    可能に構成されている複数のプロセッシングエレメント
    と,前記複数のプロセッシングエレメントの論理構成ま
    たはその論理構成とそれらの相互結合とを動的に変更す
    る制御を行う制御装置とを備え,前記制御装置は,前記
    各2進数bi (i=1,2,…,n)を定数とみたて,
    1,j ,b2,j ,…,bn,j の1であるビットの数がn
    /2よりも大きいときに,bi,j * で表すビットbi,j
    を反転させたビットと,Σi=1 n i の値とを用いて,
    Σi=1 n i i の部分積の部分和である(a1 1,j
    +a2 2,j +…+an n,j )の計算を,Σi=1 n
    i −(a1 1,j * +a2 2,j * +…+a
    n n,j * )として,前記プロセッシングエレメントに
    計算させるように前記プロセッシングエレメントを再構
    成し,前記プロセッシングエレメントは,前記Σi=1 n
    i i の計算を行う際に,2進数の集合{ai |i=
    1,2,…,n}とΣi=1 n i とを逐次入力し,Σ
    i=1 n i i の演算をパイプライン処理によって行う
    ことを特徴とする再構成可能なハードウェアを用いた画
    像符号化装置。
  5. 【請求項5】 2進数の集合{ai |i=1,2,…,
    n}と,bi =bi, m i,m-1 …bi,1 というようにm
    ビットで2進数表現される2進数の集合{b i |i=
    1,2,…,n}とから,Σi=1 n i i の演算を含
    む画像符号化の処理を,複数のプロセッシングエレメン
    トの論理構成またはその論理構成とそれらの相互結合と
    を動的に変更することができるハードウェアを用いて行
    わせるためのプログラムを記録した記録媒体であって,
    前記各2進数bi (i=1,2,…,n)を定数とみた
    て,b1,j ,b2,j ,…,bn,j の1であるビットの数
    がn/2よりも大きいときに,bi,j * で表すビットb
    i,j を反転させたビットと,Σi=1 n i の値とを用い
    て,Σi=1 n i i の部分積の部分和である(a1
    1,j +a2 2,j +…+an n,j )の計算を,Σi=1
    n i −(a1 1,j * +a2 2,j * +…+an
    n,j * )として,前記プロセッシングエレメントに計算
    させるように前記プロセッシングエレメントを再構成す
    る処理を,計算機に実行させるプログラムを記録したこ
    とを特徴とする画像符号化のためのプログラム記録媒
    体。
  6. 【請求項6】 複数のプロセッシングエレメントの論理
    構成またはその論理構成とそれらの相互結合とを動的に
    変更することができるハードウェアを用い,複数の第1
    の画像ブロックの画素値の集合である2進数の複数の集
    合{ai |i=1,2,…,n}の中から,2進数の集
    合{bi |i=1,2,…,n}を画素値とする第2の
    画像ブロックに近似する画像ブロックを,複数の前記第
    2の画像ブロックに対して各々探索する処理を含む画像
    符号化方法において,前記プロセッシングエレメント
    を,前記各第2の画像ブロックに対応して構成し,各プ
    ロセッシングエレメントに対して,対応する第2の画像
    ブロックの2進数の集合{bi |i=1,2,…,n}
    を定数とみたてて与え,前記プロセッシングエレメント
    に対し,前記複数の第1の画像ブロックを入力として逐
    次与え,前記各プロセッシングエレメントに前記第1の
    画像ブロックと前記第2の画像ブロックとの近似度を計
    算させ,与えられた近似のための閾値以下の近似度で近
    似する画像ブロックを見つけると,別の第2の画像ブロ
    ックに対応して前記プロセッシングエレメントを再構成
    することを特徴とする再構成可能なハードウェアを用い
    た画像符号化方法。
  7. 【請求項7】 複数の第1の画像ブロックの画素値の集
    合である2進数の複数の集合{ai |i=1,2,…,
    n}の中から,2進数の集合{bi |i=1,2,…,
    n}を画素値とする第2の画像ブロックに近似する画像
    ブロックを,複数の前記第2の画像ブロックに対して各
    々探索する処理を含む画像符号化を行う装置において,
    内部の論理構成またはその論理構成とそれらの相互結合
    とが動的に変更可能に構成されている複数のプロセッシ
    ングエレメントと,前記複数のプロセッシングエレメン
    トの論理構成またはその論理構成とそれらの相互結合と
    を動的に変更する制御を行う制御装置とを備え,前記制
    御装置は,前記プロセッシングエレメントを前記各第2
    の画像ブロックに対応して構成し,各プロセッシングエ
    レメントに対して,対応する第2の画像ブロックの2進
    数の集合{bi |i=1,2,…,n}を定数とみたて
    て与え,前記プロセッシングエレメントに対し,前記複
    数の第1の画像ブロックを入力として逐次与え,前記各
    プロセッシングエレメントに前記第1の画像ブロックと
    前記第2の画像ブロックとの近似度を計算させ,与えら
    れた近似のための閾値以下の近似度で近似する画像ブロ
    ックを見つけると,別の第2の画像ブロックに対応して
    前記プロセッシングエレメントを再構成することを特徴
    とする再構成可能なハードウェアを用いた画像符号化装
    置。
  8. 【請求項8】 複数の第1の画像ブロックの画素値の集
    合である2進数の複数の集合{ai |i=1,2,…,
    n}の中から,2進数の集合{bi |i=1,2,…,
    n}を画素値とする第2の画像ブロックに近似する画像
    ブロックを,複数の前記第2の画像ブロックに対して各
    々探索する処理を含む画像符号化の処理を,複数のプロ
    セッシングエレメントの論理構成またはその論理構成と
    それらの相互結合とを動的に変更することができるハー
    ドウェアを用いて行わせるためのプログラムを記録した
    記録媒体であって,前記プロセッシングエレメントを前
    記各第2の画像ブロックに対応して構成し,各プロセッ
    シングエレメントに対して,対応する第2の画像ブロッ
    クの2進数の集合{bi |i=1,2,…,n}を定数
    とみたてて与え,前記プロセッシングエレメントに対
    し,前記複数の第1の画像ブロックを入力として逐次与
    え,前記各プロセッシングエレメントに前記第1の画像
    ブロックと前記第2の画像ブロックとの近似度を計算さ
    せ,与えられた近似のための閾値以下の近似度で近似す
    る画像ブロックを見つけると,別の第2の画像ブロック
    に対応して前記プロセッシングエレメントを再構成する
    処理を,計算機に実行させるプログラムを記録したこと
    を特徴とする画像符号化のためのプログラム記録媒体。
JP10201099A 1999-04-09 1999-04-09 再構成可能なハードウェアを用いた画像符号化方法,画像符号化装置および画像符号化のためのプログラム記録媒体 Pending JP2000295613A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10201099A JP2000295613A (ja) 1999-04-09 1999-04-09 再構成可能なハードウェアを用いた画像符号化方法,画像符号化装置および画像符号化のためのプログラム記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10201099A JP2000295613A (ja) 1999-04-09 1999-04-09 再構成可能なハードウェアを用いた画像符号化方法,画像符号化装置および画像符号化のためのプログラム記録媒体

Publications (1)

Publication Number Publication Date
JP2000295613A true JP2000295613A (ja) 2000-10-20

Family

ID=14315807

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10201099A Pending JP2000295613A (ja) 1999-04-09 1999-04-09 再構成可能なハードウェアを用いた画像符号化方法,画像符号化装置および画像符号化のためのプログラム記録媒体

Country Status (1)

Country Link
JP (1) JP2000295613A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100719939B1 (ko) 2004-10-08 2007-05-18 재단법인서울대학교산학협력재단 영상 움직임 추정기 및 그 영상 움직임 추정기를 이용한영상 압축방법
JP2011181078A (ja) * 2002-10-31 2011-09-15 Lockheed Martin Corp プログラマブル回路、関連計算マシン、並びに、方法
JP2013236380A (ja) * 2002-10-31 2013-11-21 Lockheed Martin Corp プログラマブル回路、関連計算マシン、並びに、方法
JP2016516352A (ja) * 2013-03-12 2016-06-02 クゥアルコム・インコーポレイテッドQualcomm Incorporated 構成可能なマルチコアネットワークプロセッサ

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011181078A (ja) * 2002-10-31 2011-09-15 Lockheed Martin Corp プログラマブル回路、関連計算マシン、並びに、方法
JP2013236380A (ja) * 2002-10-31 2013-11-21 Lockheed Martin Corp プログラマブル回路、関連計算マシン、並びに、方法
KR100719939B1 (ko) 2004-10-08 2007-05-18 재단법인서울대학교산학협력재단 영상 움직임 추정기 및 그 영상 움직임 추정기를 이용한영상 압축방법
JP2016516352A (ja) * 2013-03-12 2016-06-02 クゥアルコム・インコーポレイテッドQualcomm Incorporated 構成可能なマルチコアネットワークプロセッサ

Similar Documents

Publication Publication Date Title
US11456856B2 (en) Method of operation for a configurable number theoretic transform (NTT) butterfly circuit for homomorphic encryption
JP3584053B2 (ja) 複合オペランド内の多ビット要素を選択するためのマスク
US11836368B2 (en) Lossy data compression
KR20190074195A (ko) 뉴럴 프로세싱 가속기
JPH04128982A (ja) プロセッサエレメント、プロセッシングユニット、プロセッサ、及びその演算処理方法
TW202147188A (zh) 神經網路模型的訓練方法和相關産品
Zhang et al. Digital circuit design using intrinsic evolvable hardware
CN110795748B (zh) 基于可重构计算阵列实现流密码算法的方法、系统及介质
Larkin et al. An efficient hardware architecture for a neural network activation function generator
Saegusa et al. An FPGA implementation of real-time K-means clustering for color images
JP2000295613A (ja) 再構成可能なハードウェアを用いた画像符号化方法,画像符号化装置および画像符号化のためのプログラム記録媒体
WO2007102518A1 (ja) 算術符号化装置、算術符号化方法、算術符号化プログラム及びプログラムを格納したコンピュータで読み取り可能な記録媒体
Folkerts et al. REDsec: Running Encrypted DNNs in Seconds.
Trainor et al. Implementation of the 2D DCT using a Xilinx XC6264 FPGA
Nagaraju et al. Design and implementation of an efficient mixed parallel-pipeline SAD architecture for HEVC motion estimation
US5838392A (en) Adaptive block-matching motion estimator with a compression array for use in a video coding system
Liao et al. The algorithm and VLSI architecture of a high efficient motion estimation with adaptive search range for HEVC systems
Fox et al. FPGA fastfood-A high speed systolic implementation of a large scale online kernel method
Senthilkumar et al. Power Reduction in DCT Implementation using Comparative Input Method
Dobai et al. Evolutionary digital circuit design with fast candidate solution establishment in field programmable gate arrays
JP2000102005A (ja) 再構成可能アーキテクチャを用いた画像符号化方法及びそのための装置、及びそのための方法を記述したプログラムを記録した記録媒体
Nagano et al. An efficient implementation method of a metric computation accelerator for fractal image compression using reconfigurable hardware
Babu et al. Area efficient and high-speed Galois field multiplier for mobile edge computing devices
Ngo et al. A novel pipelined architecture of entropy filter
Chen et al. Data encryption using non-uniform 2-D von neumann cellular automata