JP2000102005A - 再構成可能アーキテクチャを用いた画像符号化方法及びそのための装置、及びそのための方法を記述したプログラムを記録した記録媒体 - Google Patents
再構成可能アーキテクチャを用いた画像符号化方法及びそのための装置、及びそのための方法を記述したプログラムを記録した記録媒体Info
- Publication number
- JP2000102005A JP2000102005A JP26648098A JP26648098A JP2000102005A JP 2000102005 A JP2000102005 A JP 2000102005A JP 26648098 A JP26648098 A JP 26648098A JP 26648098 A JP26648098 A JP 26648098A JP 2000102005 A JP2000102005 A JP 2000102005A
- Authority
- JP
- Japan
- Prior art keywords
- processor
- block
- processor elements
- domain
- density value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
Abstract
(57)【要約】 (修正有)
【課題】 対象となる画像毎にハードウエアの論理を変
化させることで符号化処理を高速化する。 【解決手段】 ドメインプール11のドメインブロック
がプロセッサエレメント(PE)ネットワーク12に入
力され、各PE内でレンジブロックとの類似度計算が行
われ、隣接のPEに転送される。各PEでは、ドメイン
ブロックはレンジブロックの近似画像ブロックとして最
適かどうかの判断のためのブロック間の距離計算が行わ
れ、距離が最も短い場合は、そのドメインブロックのId
entity No.、s、o、Rの値が更新される。PEは、原
画像の画像ブロックの濃度値を乗数とする定数乗算とそ
れらの総和を行うP1 部、及び、s、o、Rの値の計
算、比較等をするP2 で構成され、レンジブロックの濃
度値の値によって、PEの論理構成、及びPEネットワ
ークが論理合成、配置配線部13によって自動的に再構
成された後、符号化が実行される。
化させることで符号化処理を高速化する。 【解決手段】 ドメインプール11のドメインブロック
がプロセッサエレメント(PE)ネットワーク12に入
力され、各PE内でレンジブロックとの類似度計算が行
われ、隣接のPEに転送される。各PEでは、ドメイン
ブロックはレンジブロックの近似画像ブロックとして最
適かどうかの判断のためのブロック間の距離計算が行わ
れ、距離が最も短い場合は、そのドメインブロックのId
entity No.、s、o、Rの値が更新される。PEは、原
画像の画像ブロックの濃度値を乗数とする定数乗算とそ
れらの総和を行うP1 部、及び、s、o、Rの値の計
算、比較等をするP2 で構成され、レンジブロックの濃
度値の値によって、PEの論理構成、及びPEネットワ
ークが論理合成、配置配線部13によって自動的に再構
成された後、符号化が実行される。
Description
【0001】
【発明の属する技術分野】本発明は、論理の再構成が可
能なハードウエアを用いて、入力されるデータによって
ハードウエアの論理を再構成し、限定されたリソースを
有効に活用して、処理を高速化する再構成可能アーキテ
クチャを用いた画像符号化方法及びそのための装置、及
びそのための方法を記述したプログラムを記録した記録
媒体に関する。
能なハードウエアを用いて、入力されるデータによって
ハードウエアの論理を再構成し、限定されたリソースを
有効に活用して、処理を高速化する再構成可能アーキテ
クチャを用いた画像符号化方法及びそのための装置、及
びそのための方法を記述したプログラムを記録した記録
媒体に関する。
【0002】
【従来の技術】1980年代、M.F.Barnsleyにより、反
復関数系(Iterated Function System,略称IFS)を用
いた画像符号化法が提案され(M.F.Barnsley,"Solution
of anInverse Problem for Fractals and Other Set
s",Proceedings of National Academy of Sciences US
A,Vol.83,pp.1975-1977,Apr.,1986)、A.E.Jacquin が
濃淡画像に対する手法として発展させた(A.E.Jacqui
n,"Image Coding Based on a Fractal Theory of Itera
ted Contractive Image Transformations",IEEE Transa
ctions on Image Processing,Vol.1,pp.18-32,Jan.,199
2)。さらに、処理の高速化、圧縮率の向上、画像の歪み
率の向上に関して種々の研究が行われている。また、動
画像への応用も行われている(上繁義史,太田諦二,"R
ecurrent IFSの動画像符号化への応用”,電子情報通信
学会論文誌,B-I,Vol.J81-B-I,No.1,pp.10-18,Jan.,199
8)。これらの発展の中では、ソフトウエア的な手法が提
案されている一方で、並列計算機を用いた高速化に関す
る研究も行われている(曽根原登,“並列コンピュータ
によるニューラルネットワーク処理”,電気学会,LAV-
91-9,pp.37-47,Aug.,1991)。
復関数系(Iterated Function System,略称IFS)を用
いた画像符号化法が提案され(M.F.Barnsley,"Solution
of anInverse Problem for Fractals and Other Set
s",Proceedings of National Academy of Sciences US
A,Vol.83,pp.1975-1977,Apr.,1986)、A.E.Jacquin が
濃淡画像に対する手法として発展させた(A.E.Jacqui
n,"Image Coding Based on a Fractal Theory of Itera
ted Contractive Image Transformations",IEEE Transa
ctions on Image Processing,Vol.1,pp.18-32,Jan.,199
2)。さらに、処理の高速化、圧縮率の向上、画像の歪み
率の向上に関して種々の研究が行われている。また、動
画像への応用も行われている(上繁義史,太田諦二,"R
ecurrent IFSの動画像符号化への応用”,電子情報通信
学会論文誌,B-I,Vol.J81-B-I,No.1,pp.10-18,Jan.,199
8)。これらの発展の中では、ソフトウエア的な手法が提
案されている一方で、並列計算機を用いた高速化に関す
る研究も行われている(曽根原登,“並列コンピュータ
によるニューラルネットワーク処理”,電気学会,LAV-
91-9,pp.37-47,Aug.,1991)。
【0003】本発明では、上記IFSを用いた画像符号
化法を利用するため、ここでIFSを用いた手法の概略
について述べておく。
化法を利用するため、ここでIFSを用いた手法の概略
について述べておく。
【0004】符号化においては、まず原画像を図1のよ
うにレンジブロックと呼ばれる重なりのない正方形のブ
ロックに分割する。それらを近似する候補となるブロッ
ク(ドメインブロックと呼ぶ)の集合としては、レンジ
ブロックの縦横2倍の辺を持つ正方形のブロックを図2
のように原画像で一画素ずつずらしたものを全て考え
る。このドメインブロックの集合をドメインプールと呼
ぶ。
うにレンジブロックと呼ばれる重なりのない正方形のブ
ロックに分割する。それらを近似する候補となるブロッ
ク(ドメインブロックと呼ぶ)の集合としては、レンジ
ブロックの縦横2倍の辺を持つ正方形のブロックを図2
のように原画像で一画素ずつずらしたものを全て考え
る。このドメインブロックの集合をドメインプールと呼
ぶ。
【0005】レンジブロック、ドメインブロックとも、
その画像の複雑度から、次のように、シェード、ミッド
レンジ、エッジの3種類のクラスに分類する。
その画像の複雑度から、次のように、シェード、ミッド
レンジ、エッジの3種類のクラスに分類する。
【0006】 シェード:濃度に殆ど変化のないブロックのクラス ミッドレンジ:濃度差はあるが、エッジのないブロック
のクラス エッジ:エッジの存在するブロックのクラス シェードのレンジブロックに対しては、各ピクセルの濃
度値を一つの定数(一般にはブロック内の濃度値の平
均)で置き換え、ミッドレンジ、エッジクラスに対して
は、同じクラスのレンジブロック、ドメインブロックの
間で類似度を計る。
のクラス エッジ:エッジの存在するブロックのクラス シェードのレンジブロックに対しては、各ピクセルの濃
度値を一つの定数(一般にはブロック内の濃度値の平
均)で置き換え、ミッドレンジ、エッジクラスに対して
は、同じクラスのレンジブロック、ドメインブロックの
間で類似度を計る。
【0007】ブロック同士の類似度を表す距離を計る
際、事前にドメインブロックの2×2ピクセルの濃度の
平均を取って1ピクセル化するなどして、両者のサイズ
(ピクセル数)を図3のようにレンジブロックのものに
合わせておく。nをブロックのサイズ、{ai }(i=
1,2,…,n)、{bi }(i=1,2,…,n)を
其々ドメインブロック、レンジブロックの濃度値とす
る。それらレンジブロックとドメインブロックとの距離
(2乗距離R)を次のように2乗誤差で計る。
際、事前にドメインブロックの2×2ピクセルの濃度の
平均を取って1ピクセル化するなどして、両者のサイズ
(ピクセル数)を図3のようにレンジブロックのものに
合わせておく。nをブロックのサイズ、{ai }(i=
1,2,…,n)、{bi }(i=1,2,…,n)を
其々ドメインブロック、レンジブロックの濃度値とす
る。それらレンジブロックとドメインブロックとの距離
(2乗距離R)を次のように2乗誤差で計る。
【0008】
【数1】 ここで、sは濃度値に関するスケーリング、oは濃度値
のオフセット成分である。Rをsとoとに関して偏微分
してRを最小にするs、oを求めると、
のオフセット成分である。Rをsとoとに関して偏微分
してRを最小にするs、oを求めると、
【0009】
【数2】 この時Rの値は、
【0010】
【数3】 エッジのクラスに対しては、ドメインブロックによる近
似の精度を上げるため、元のドメインブロックに加え
て、それを90度、180度、270度回転させたブロ
ック、及び其々を縦方向の軸に関して反転させたブロッ
クもレンジブロックの近似の候補として考える。つまり
1つのドメインブロックに対して8種類のブロックを考
える。これらs、o、Rの計算により、各レンジブロッ
クと最も距離が近いドメインブロックを見つけ、そのブ
ロックの番号(Identity No.と呼ぶことにする)、s、
o、Rの値、さらに回転、反転の種類を求めるのが符号
化の概略である。処理のフローチャートを書くと図4の
ようになる。
似の精度を上げるため、元のドメインブロックに加え
て、それを90度、180度、270度回転させたブロ
ック、及び其々を縦方向の軸に関して反転させたブロッ
クもレンジブロックの近似の候補として考える。つまり
1つのドメインブロックに対して8種類のブロックを考
える。これらs、o、Rの計算により、各レンジブロッ
クと最も距離が近いドメインブロックを見つけ、そのブ
ロックの番号(Identity No.と呼ぶことにする)、s、
o、Rの値、さらに回転、反転の種類を求めるのが符号
化の概略である。処理のフローチャートを書くと図4の
ようになる。
【0011】ステップ(S1):レンジブロックについ
て入力する。
て入力する。
【0012】ステップ(S2):ドメインブロックにつ
いて入力する。
いて入力する。
【0013】ステップ(S3):Σ(ai *bi )を計
算する。
算する。
【0014】ステップ(S4):s、oを計算する。
【0015】ステップ(S5):sが1.2以下か否かを
調べる。NOの場合にはステップ(S1)へ戻る。
調べる。NOの場合にはステップ(S1)へ戻る。
【0016】ステップ(S6):ステップ(S5)がY
ESの場合にRを計算する。
ESの場合にRを計算する。
【0017】ステップ(S7):Rが、それまでレンジ
ブロックに保持していたRの最小値(min.R)よりも小
さいか否かを調べる。NOの場合にはステップ(S2)
に戻る。
ブロックに保持していたRの最小値(min.R)よりも小
さいか否かを調べる。NOの場合にはステップ(S2)
に戻る。
【0018】ステップ(S8):ステップ(S7)がY
ESの場合にmin.Rの値をステップ(S6)でのRに更
新する。
ESの場合にmin.Rの値をステップ(S6)でのRに更
新する。
【0019】ステップ(S9):同じクラスの全てのド
メインブロックについての処理が終了したか否かを調べ
る。NOの場合にはステップ(S2)に戻る。
メインブロックについての処理が終了したか否かを調べ
る。NOの場合にはステップ(S2)に戻る。
【0020】ステップ(S10):ステップ(S9)がY
ESの場合に、ミッドレンジ、エッジ、クラスの全ての
レンジブロックの処理が終了したか否かを調べる。NO
の場合にはステップ(S1)に戻る。
ESの場合に、ミッドレンジ、エッジ、クラスの全ての
レンジブロックの処理が終了したか否かを調べる。NO
の場合にはステップ(S1)に戻る。
【0021】ステップ(S11):全レンジブロックに対
する最良近似ドメインブロックのIdentity No.および
s、oおよび回転か反転かの種類を出力する。
する最良近似ドメインブロックのIdentity No.および
s、oおよび回転か反転かの種類を出力する。
【0022】
【発明が解決しようとする課題】符号化の処理時間とい
う観点から見ると、前章の〔従来の技術〕の式(1)、
式(2)等の計算の反復が処理の大半を占める。さらに
詳細に式(1)、式(2)を見ると、Σai 、Σ
ai 2 、Σbi 、Σbi 2 等の計算は事前にしてレンジ
ブロック、ドメインブロックの情報として保持していれ
ばよく、式(1)、式(2)の計算の反復において避け
られないのはΣai *bi の計算である。したがって、
Σai *bi の計算の効率化が重要な課題となる。従
来、汎用のCPUを1つ搭載したものや並列計算機が用
いられているが、いずれもプロセッサエレメント(P
E)内部の論理構造、PEネットワークの構造等が固定
的なものであった。
う観点から見ると、前章の〔従来の技術〕の式(1)、
式(2)等の計算の反復が処理の大半を占める。さらに
詳細に式(1)、式(2)を見ると、Σai 、Σ
ai 2 、Σbi 、Σbi 2 等の計算は事前にしてレンジ
ブロック、ドメインブロックの情報として保持していれ
ばよく、式(1)、式(2)の計算の反復において避け
られないのはΣai *bi の計算である。したがって、
Σai *bi の計算の効率化が重要な課題となる。従
来、汎用のCPUを1つ搭載したものや並列計算機が用
いられているが、いずれもプロセッサエレメント(P
E)内部の論理構造、PEネットワークの構造等が固定
的なものであった。
【0023】固定的なハードウエアを用いる問題点は、
画像の各ピクセルの濃度値に関する演算を行う際、想定
される濃度値の上限と下限との値を考慮して、その範囲
内の全ての数を処理する演算器を用意する必要があるた
め、特定の濃度値の特徴を活かしたPE内の演算器構
成、ネットワーク構成を取ることができないことであ
る。つまり、複数の画像を処理する強力な処理能力を持
つ見返りとして、処理に必要なリソース量を最も多く必
要とする画像が入力された場合を想定して、想定される
全ての濃度値を処理できる演算器ネットワークを構成し
なければならない。それは、ある特定の画像のみを処理
する場合に比べて広範な入力を受け付ける分だけより多
い回路リソースを必要とするため、限られたリソース上
に出来るだけ多くの演算器をおき処理の並列度を増して
高速化する、という観点からは問題である。
画像の各ピクセルの濃度値に関する演算を行う際、想定
される濃度値の上限と下限との値を考慮して、その範囲
内の全ての数を処理する演算器を用意する必要があるた
め、特定の濃度値の特徴を活かしたPE内の演算器構
成、ネットワーク構成を取ることができないことであ
る。つまり、複数の画像を処理する強力な処理能力を持
つ見返りとして、処理に必要なリソース量を最も多く必
要とする画像が入力された場合を想定して、想定される
全ての濃度値を処理できる演算器ネットワークを構成し
なければならない。それは、ある特定の画像のみを処理
する場合に比べて広範な入力を受け付ける分だけより多
い回路リソースを必要とするため、限られたリソース上
に出来るだけ多くの演算器をおき処理の並列度を増して
高速化する、という観点からは問題である。
【0024】本発明の目的は、これらの問題点を改善
し、画像の濃度値によってハードウエアの論理構成を変
えて、それらの濃度値に特化した演算器構成、演算器ネ
ットワーク構成を取ることによって、全体の処理の中
で、特にΣai *bi の計算部分に必要なリソース量を
削減し、それによって同時にハードウエア内に実現でき
るPEの数を増やして処理の並列度を上げ、符号化に要
する時間を削減することである。
し、画像の濃度値によってハードウエアの論理構成を変
えて、それらの濃度値に特化した演算器構成、演算器ネ
ットワーク構成を取ることによって、全体の処理の中
で、特にΣai *bi の計算部分に必要なリソース量を
削減し、それによって同時にハードウエア内に実現でき
るPEの数を増やして処理の並列度を上げ、符号化に要
する時間を削減することである。
【0025】
【課題を解決するための手段】基本的な方針としては、
各レンジブロック(今、濃度を{bi }(i=1,2,
…,n)としておく)に一つのPEを割り当て、各PE
はドメインブロックの濃度値の情報{ai }(i=1,
2,…,n)、Σai 、Σai 2 等を入力とし、Σai
*bi 、s、o、R等の計算をパイプライン処理で行っ
て行く。以下、PEネットワークの構成、及びPEの内
部構成について説明する。
各レンジブロック(今、濃度を{bi }(i=1,2,
…,n)としておく)に一つのPEを割り当て、各PE
はドメインブロックの濃度値の情報{ai }(i=1,
2,…,n)、Σai 、Σai 2 等を入力とし、Σai
*bi 、s、o、R等の計算をパイプライン処理で行っ
て行く。以下、PEネットワークの構成、及びPEの内
部構成について説明する。
【0026】PEネットワークにおいては、PE間の接
続は隣接するPE同士で行われる。
続は隣接するPE同士で行われる。
【0027】図5は本発明の原理構成図を示し、図中の
符号11はドメインプール、12はPEネットワーク、
13は論理合成、配置配線部、1はドメインブロック、
2−1,2−2,…,2−m(但しm<k)はPEを表
している。なおkは対応する各クラス(エッジ、ミッド
レンジ)のレンジブロックの総数であり、各クラスに対
応して異なる値となる。
符号11はドメインプール、12はPEネットワーク、
13は論理合成、配置配線部、1はドメインブロック、
2−1,2−2,…,2−m(但しm<k)はPEを表
している。なおkは対応する各クラス(エッジ、ミッド
レンジ)のレンジブロックの総数であり、各クラスに対
応して異なる値となる。
【0028】符号化においては、ミッドレンジ、エッジ
の2種類のクラスで、レンジブロックとドメインブロッ
クとの類似度の計算を行うため、ドメインプールの2種
類のクラスのブロックは、対応するクラスのレンジブロ
ックのPEネットワークに入力される。ドメインブロッ
クのデータ{ai }、Σai 、Σai 2 等が1クロック
毎に絶え間なく入力され、PE間の接続によってドメイ
ンブロックの情報が転送される。エッジのクラスでは、
ドメインブロックは回転、反転を施されて、PEネット
ワークに計8回入力される。レンジブロックに対応する
全てのPEが一度にハードウエア上に載らない場合は、
回路の論理合成、配置配線部で生成されたデータを基に
PEネットワークをハードウエア上に再構成して、全て
のレンジブロックの符号化が終わるまでPEによる処理
を行う。全レンジブロックに関して、最も良く近似する
ドメインブロックのIdentity No.、s、oの値などが出
力されると符号化処理は完了する。
の2種類のクラスで、レンジブロックとドメインブロッ
クとの類似度の計算を行うため、ドメインプールの2種
類のクラスのブロックは、対応するクラスのレンジブロ
ックのPEネットワークに入力される。ドメインブロッ
クのデータ{ai }、Σai 、Σai 2 等が1クロック
毎に絶え間なく入力され、PE間の接続によってドメイ
ンブロックの情報が転送される。エッジのクラスでは、
ドメインブロックは回転、反転を施されて、PEネット
ワークに計8回入力される。レンジブロックに対応する
全てのPEが一度にハードウエア上に載らない場合は、
回路の論理合成、配置配線部で生成されたデータを基に
PEネットワークをハードウエア上に再構成して、全て
のレンジブロックの符号化が終わるまでPEによる処理
を行う。全レンジブロックに関して、最も良く近似する
ドメインブロックのIdentity No.、s、oの値などが出
力されると符号化処理は完了する。
【0029】次に、PEの内部の構成について説明す
る。図6はPEネットワークにて行う処理態様を示す。
PEはΣai *bi の計算部P1 (図6参照)とそれ以
下の式(1)、式(2)等を計算して最小のRを求める
部分P2 (図6参照)とを持つ。PEは一つのレンジブ
ロックに対応しているので、P1 において{bi }(i
=1,2,…,n)は定数と見なすことができ、Σai
*bi におけるn個の乗算は、乗数が定数の“定数乗
算”となる。定数乗算の計算は、定数bi を数表現した
際に含まれる0でないビットの情報から定まるシフト、
加算、減算によって行う。乗算結果は図6のように木構
造で加算され、Σai *bi が求められる。P2 では、
図4のフローチャートに従って、s、o、R等の計算が
順次行われる。
る。図6はPEネットワークにて行う処理態様を示す。
PEはΣai *bi の計算部P1 (図6参照)とそれ以
下の式(1)、式(2)等を計算して最小のRを求める
部分P2 (図6参照)とを持つ。PEは一つのレンジブ
ロックに対応しているので、P1 において{bi }(i
=1,2,…,n)は定数と見なすことができ、Σai
*bi におけるn個の乗算は、乗数が定数の“定数乗
算”となる。定数乗算の計算は、定数bi を数表現した
際に含まれる0でないビットの情報から定まるシフト、
加算、減算によって行う。乗算結果は図6のように木構
造で加算され、Σai *bi が求められる。P2 では、
図4のフローチャートに従って、s、o、R等の計算が
順次行われる。
【0030】各PEにおいて、最初に大量に現れる定数
乗算の処理を行うために、演算器として、濃度値のビッ
ト幅分のサイズを持つ汎用乗算器を用いる代わりに、レ
ンジブロックの濃度値(定数)の数表現に基づいて必要
最低限のシフト、加算、減算を行う演算器を用いること
で、PEの回路規模は削減される。
乗算の処理を行うために、演算器として、濃度値のビッ
ト幅分のサイズを持つ汎用乗算器を用いる代わりに、レ
ンジブロックの濃度値(定数)の数表現に基づいて必要
最低限のシフト、加算、減算を行う演算器を用いること
で、PEの回路規模は削減される。
【0031】全レンジブロックに対するPEが同時にハ
ードウエア上に実現できない場合は、一度に実現できる
だけのPEを載せてPEネットワークを作って、各レン
ジブロックの符号化処理を行い、それが終われば新たな
レンジブロック用のPEネットワークを再度ハードウエ
ア上に構成する。各PEネットワークのハードウエア上
の実現は論理合成、配置配線部によって行われる。この
ようにハードウエアの再構成を可能とすることで、限定
されたハードウエアリソースを画像の濃度値に応じて回
路を生成し、符号化処理を行う。
ードウエア上に実現できない場合は、一度に実現できる
だけのPEを載せてPEネットワークを作って、各レン
ジブロックの符号化処理を行い、それが終われば新たな
レンジブロック用のPEネットワークを再度ハードウエ
ア上に構成する。各PEネットワークのハードウエア上
の実現は論理合成、配置配線部によって行われる。この
ようにハードウエアの再構成を可能とすることで、限定
されたハードウエアリソースを画像の濃度値に応じて回
路を生成し、符号化処理を行う。
【0032】
【発明の実施の形態】以下、本発明を組み込んだシステ
ム、及び本発明を適用した具体例を図面により説明す
る。図5は本発明の再構成可能アーキテクチャを利用し
た画像符号化手法を適用したシステムの機能構成図であ
る。
ム、及び本発明を適用した具体例を図面により説明す
る。図5は本発明の再構成可能アーキテクチャを利用し
た画像符号化手法を適用したシステムの機能構成図であ
る。
【0033】このシステムは、ドメインブロックの情報
(濃度値、ドメインブロックの濃度値の総和等)を入力
として、全レンジブロックに関して、それらを最も良く
近似するドメインブロックのIdentity No.、及びその際
のs、oの値を出力するシステムである。
(濃度値、ドメインブロックの濃度値の総和等)を入力
として、全レンジブロックに関して、それらを最も良く
近似するドメインブロックのIdentity No.、及びその際
のs、oの値を出力するシステムである。
【0034】本実施例では、ドメインプール11の持
つ、ドメインブロックの濃度値{ai}(i=1,2,
…,n)、Σai 、Σai 2 等のデータが入力される。
入力された濃度値等はPEネットワーク12の各PEに
おいて、まず濃度値に関する定数乗算と定数乗算により
求まった値の総和計算とが行われる。その後、図4に示
す如く、(i)s、o、Rの計算、(ii)閾値との比
較、及び (iii)それまでにPEに保存されているRの値
との比較ならびにRの値の更新が行われる。
つ、ドメインブロックの濃度値{ai}(i=1,2,
…,n)、Σai 、Σai 2 等のデータが入力される。
入力された濃度値等はPEネットワーク12の各PEに
おいて、まず濃度値に関する定数乗算と定数乗算により
求まった値の総和計算とが行われる。その後、図4に示
す如く、(i)s、o、Rの計算、(ii)閾値との比
較、及び (iii)それまでにPEに保存されているRの値
との比較ならびにRの値の更新が行われる。
【0035】ハードウエアに同時に実現されている全て
のPEにドメインブロックが入力され、それらのPEに
対応するレンジブロックとドメインブロックとの距離計
算が終了すると、まだPEとして実現されていないレン
ジブロックの集合のハードウエアへのマッピング情報を
論理合成、配置配線部13からハードウエアに読み込ん
で、それら新たなレンジブロックに対するPEネットワ
ークに再度ドメインブロックの集合を入力としてPEは
定数乗算、s、o、Rの計算を行う。全てのレンジブロ
ックが、その情報を持つPEとして実現され、最適なド
メインブロックを求める上記のs、o、R等の計算が行
われ、それらの値が出力されると操作は完了する。
のPEにドメインブロックが入力され、それらのPEに
対応するレンジブロックとドメインブロックとの距離計
算が終了すると、まだPEとして実現されていないレン
ジブロックの集合のハードウエアへのマッピング情報を
論理合成、配置配線部13からハードウエアに読み込ん
で、それら新たなレンジブロックに対するPEネットワ
ークに再度ドメインブロックの集合を入力としてPEは
定数乗算、s、o、Rの計算を行う。全てのレンジブロ
ックが、その情報を持つPEとして実現され、最適なド
メインブロックを求める上記のs、o、R等の計算が行
われ、それらの値が出力されると操作は完了する。
【0036】以下、具体例によって説明する。
【0037】図7(A)は縦横方向に其々2ピクセルず
つ持つ正方形からなるレンジブロックである。レンジブ
ロックの濃度値{bi }(i=1,2,3,4)として
は、今図7(B)図示のものを考える。但し、各数は2
進数で表現されている。ドメインブロックは、本来レン
ジブロックに比べて縦横の長さが2倍、つまり縦横方向
に其々4ピクセルずつ持つ正方形であるが、隣接する4
ピクセル毎に、濃度値を平均化したり、4ピクセルから
代表となるピクセルを1つ選ぶなどして、図8のよう
に、レンジブロックと同じ大きさにしておく。この新た
な濃度値を{ai}(i=1,2,3,4)とする。各
濃度値のビット幅は4ビットとする。
つ持つ正方形からなるレンジブロックである。レンジブ
ロックの濃度値{bi }(i=1,2,3,4)として
は、今図7(B)図示のものを考える。但し、各数は2
進数で表現されている。ドメインブロックは、本来レン
ジブロックに比べて縦横の長さが2倍、つまり縦横方向
に其々4ピクセルずつ持つ正方形であるが、隣接する4
ピクセル毎に、濃度値を平均化したり、4ピクセルから
代表となるピクセルを1つ選ぶなどして、図8のよう
に、レンジブロックと同じ大きさにしておく。この新た
な濃度値を{ai}(i=1,2,3,4)とする。各
濃度値のビット幅は4ビットとする。
【0038】これらレンジブロックの濃度値とドメイン
ブロックの濃度値との間で乗算{a i *bi }(i=
1,2,3,4)が行われるが、レンジブロックの濃度
値はPE内では定数であるため、図7の2進表現におい
て、これらの乗算は、各数のビット1を持つ桁に関する
シフト演算、及びその演算結果の加算によって行われ
る。すなわち、 a1 *b1 =a1 +(a1 ≪1)+(a1 ≪2) a2 *b2 =a2 +(a2 ≪1) a3 *b3 =a3 ≪2 a4 *b4 =a4 ≪3 という計算に続いて、
ブロックの濃度値との間で乗算{a i *bi }(i=
1,2,3,4)が行われるが、レンジブロックの濃度
値はPE内では定数であるため、図7の2進表現におい
て、これらの乗算は、各数のビット1を持つ桁に関する
シフト演算、及びその演算結果の加算によって行われ
る。すなわち、 a1 *b1 =a1 +(a1 ≪1)+(a1 ≪2) a2 *b2 =a2 +(a2 ≪1) a3 *b3 =a3 ≪2 a4 *b4 =a4 ≪3 という計算に続いて、
【0039】
【数4】 が計算される。但し、a1 ≪1はa1 の1ビット左シフ
ト、つまりa1 の2倍を表し、a1 ≪2はa2 の2ビッ
ト左シフト、つまりa1 の4倍を表す。このように計算
すると加算回数は6回となる。
ト、つまりa1 の2倍を表し、a1 ≪2はa2 の2ビッ
ト左シフト、つまりa1 の4倍を表す。このように計算
すると加算回数は6回となる。
【0040】次に、{bi }(i=1,2,3,4)に
おいて、このようなビットレベルの情報を用いず、どの
ような定数であっても乗算が行えるように汎用乗算器を
用いる場合を考える。ai 、bi がビット幅4であるた
め、汎用乗算器に必要なリソース量は加算器換算で
「3」と見積もることができる。例で乗算回数は、{a
i*bi }(i=1,2,3,4)より4回であるた
め、Σai *bi を求めるための全演算数を加算は、3
×4+3=15と見積もることができる。但し、“+
3”の部分はa1 *b1 からa4 *b4 までの総和を取
るために必要な部分である。したがって、定数乗算であ
ることを利用して1シフト、加算で計算した場合の加算
数は4ビットの汎用乗算器を使う場合に比べて、6/1
5=約40%に削減された。
おいて、このようなビットレベルの情報を用いず、どの
ような定数であっても乗算が行えるように汎用乗算器を
用いる場合を考える。ai 、bi がビット幅4であるた
め、汎用乗算器に必要なリソース量は加算器換算で
「3」と見積もることができる。例で乗算回数は、{a
i*bi }(i=1,2,3,4)より4回であるた
め、Σai *bi を求めるための全演算数を加算は、3
×4+3=15と見積もることができる。但し、“+
3”の部分はa1 *b1 からa4 *b4 までの総和を取
るために必要な部分である。したがって、定数乗算であ
ることを利用して1シフト、加算で計算した場合の加算
数は4ビットの汎用乗算器を使う場合に比べて、6/1
5=約40%に削減された。
【0041】以上の加算数の見積もりは、定数乗算の利
用による演算数削減の一例である。乗算{ai *bi }
(i=1,2,3,4)がPEのP1 の中で図6のよう
に実現されている場合、上記のようにシフトと加算を用
いた方が汎用乗算器を用いるのに比べて必要なリソース
量が少なくなるため、PE自体の回路規模も小さくな
る。結果として、ハードウエア上に同時に実装されるP
Eの数が増え、全てのレンジブロックに対する符号化時
間が削減される。
用による演算数削減の一例である。乗算{ai *bi }
(i=1,2,3,4)がPEのP1 の中で図6のよう
に実現されている場合、上記のようにシフトと加算を用
いた方が汎用乗算器を用いるのに比べて必要なリソース
量が少なくなるため、PE自体の回路規模も小さくな
る。結果として、ハードウエア上に同時に実装されるP
Eの数が増え、全てのレンジブロックに対する符号化時
間が削減される。
【0042】上記の定数乗算を用いる手法は、数の表現
として2進表現の代わりに、0、1、−1などのディジ
ットを含むような表現(例えばCanonical Signed Digit
表現、以下CSD表現と呼ぶ)を利用する場合も同様の
演算数削減効果をもたらす。例えば、数b1 はCSD表
現でb1 =100(−1)と表されるため、 a1 *b1 =(a1 ≪3)−a1 となる。このようにCSD表現に基づいた定数乗算で
は、加算だけでなく減算も行われる。CSD表現と2進
表現の間で定数乗算に必要な加算と減算の総数を比較す
ると、一般にCSD表現は2進表現より0でない(つま
り、1或いは−1である)ビットの数が少ないため、そ
の分だけ2進表現を用いる場合に比べて加算と減算の総
数が少なくなる。
として2進表現の代わりに、0、1、−1などのディジ
ットを含むような表現(例えばCanonical Signed Digit
表現、以下CSD表現と呼ぶ)を利用する場合も同様の
演算数削減効果をもたらす。例えば、数b1 はCSD表
現でb1 =100(−1)と表されるため、 a1 *b1 =(a1 ≪3)−a1 となる。このようにCSD表現に基づいた定数乗算で
は、加算だけでなく減算も行われる。CSD表現と2進
表現の間で定数乗算に必要な加算と減算の総数を比較す
ると、一般にCSD表現は2進表現より0でない(つま
り、1或いは−1である)ビットの数が少ないため、そ
の分だけ2進表現を用いる場合に比べて加算と減算の総
数が少なくなる。
【0043】上記において、画像符号化方法および装置
を説明したが、当該画像符号化方法はデータ処理装置が
実行可能なプログラムの形で保持することができ、本発
明は当該記録媒体を含むことは言うまでもない。
を説明したが、当該画像符号化方法はデータ処理装置が
実行可能なプログラムの形で保持することができ、本発
明は当該記録媒体を含むことは言うまでもない。
【0044】
【発明の効果】以上説明した如く、本発明によれば、各
PEの構成に関して、固定的なアーキテクチャを用いた
場合には、PE内の定数乗算部は、想定されるあらゆる
濃度値を取る画像を処理するために、汎用の乗算器を使
わざるをえないが、一方で、本発明のように論理の再構
成が可能なハードウエアを用いることで、それらの定数
乗算は、その定数の数表現から定まる、シフト、加算、
減算によって行うことができ、それらを実現するための
演算リソース量は汎用乗算器を用いる場合に比べて削減
される。このようなPEの小規模化は、ハードウエア上
に同時に実現できるPEの数を増加させ、結果的に、画
像符号化のための総所要時間が削減される。
PEの構成に関して、固定的なアーキテクチャを用いた
場合には、PE内の定数乗算部は、想定されるあらゆる
濃度値を取る画像を処理するために、汎用の乗算器を使
わざるをえないが、一方で、本発明のように論理の再構
成が可能なハードウエアを用いることで、それらの定数
乗算は、その定数の数表現から定まる、シフト、加算、
減算によって行うことができ、それらを実現するための
演算リソース量は汎用乗算器を用いる場合に比べて削減
される。このようなPEの小規模化は、ハードウエア上
に同時に実現できるPEの数を増加させ、結果的に、画
像符号化のための総所要時間が削減される。
【図1】原画像をレンジブロックの集合に分割したもの
である。
である。
【図2】ドメインブロックの集合図である。
【図3】ドメインブロックのサイズを半分にする図であ
る。
る。
【図4】符号化処理のフローチャートである。
【図5】本発明の符号化装置の原理構成図である。
【図6】PEの構成図である。
【図7】実施例における2×2ピクセルのレンジブロッ
クと2×2のレンジブロックの濃度値を示す図である。
クと2×2のレンジブロックの濃度値を示す図である。
【図8】実施例における2×2ピクセルのドメインブロ
ック図である。
ック図である。
11 ドメインプール 12 PEネットワーク 13 論理合成、配置配線部 1 ドメインブロック 2−1 PE 2−2 PE 2−m PE
フロントページの続き (72)発明者 名古屋 彰 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 Fターム(参考) 5B057 CA17 CB18 CC02 CG02 CG07 CH02 CH05 CH08 5C059 KK14 LC00 MA43 SS20 UA02 UA21 UA22
Claims (5)
- 【請求項1】 ベクトル{ai }(i=1,2,…,
n)、{bi }(i=1,2,…,n)において、各b
i が定数である場合に、Σai *bi の演算を含む処理
が行われる画像符号化方法において、 複数のプロセッサエレメントが前記Σai *bi の演算
を行い、かつ当該プロセッサエレメントの相互間でデー
タを受渡し可能に構成されてなるプロセッサネットワー
クを用い、 当該プロセッサネットワークに対して、少なくともベク
トル{ai }(i=1,2,…,n)の全n個を一斉に
クロックに対応して逐次入力して、パイプライン処理を
実行させ、 前記各プロセッサエレメント内のおよびプロセッサエレ
メントの相互間の構成を制御するようにしたことを特徴
とする再構成可能アーキテクチャを用いた画像符号化方
法。 - 【請求項2】 請求項1において、前記プロセッサエレ
メントが、 ドメインブロックの濃度値を{ai }、レンジブロック
の濃度値を{bi }として、 前記Σai *bi の演算を定数乗算とみなしてシフト、
加算、減算で行い、 当該Σai *bi の演算結果を用いて濃度値に関するス
ケーリングsおよびオフセットoの演算を行い、 次いで前記ドメインブロックの濃度値と前記レンジブロ
ックの濃度値との距離Rを演算し、 次いで、先に得られた距離Rの値のうちの、より小さい
側を残して保持する処理を行うようにしたことを特徴と
する再構成可能アーキテクチャを用いた画像符号化方
法。 - 【請求項3】 ベクトル{ai }(i=1,2,…,
n)、{bi }(i=1,2,…,n)において、各b
i が定数である場合に、Σai *bi の演算を含む処理
が行われる演算処理方法において、 複数のプロセッサエレメントが前記Σai *bi の演算
を行い、かつ当該プロセッサエレメントの相互間でデー
タを受渡し可能に構成されてなるプロセッサネットワー
クを用い、 当該プロセッサネットワークに対して、少なくともベク
トル{ai }(i=1,2,…,n)の全n個を一斉に
クロックに対応して逐次入力して、パイプライン処理を
実行させ、 前記各プロセッサエレメント内のおよびプロセッサエレ
メントの相互間の構成を制御するようにしたことを特徴
とする再構成可能アーキテクチャを用いた演算処理方
法。 - 【請求項4】 ベクトル{ai }(i=1,2,…,
n)、{bi }(i=1,2,…,n)において、各b
i が定数である場合に、Σai *bi の演算を含む処理
を行う画像符号化装置において、 複数のプロセッサエレメントをそなえ、当該プロセッサ
エレメントが前記Σa i *bi の演算を行い、かつ当該
プロセッサエレメントの相互間でデータを受渡し可能に
構成されてなるプロセッサネットワークと、 当該プロセッサネットワークに対して、少なくともベク
トル{ai }(i=1,2,…,n)の全n個を一斉に
クロックに対応して逐次供給してパイプライン処理を行
わせる手段と、 各プロセッサエレメントの構成を制御する構成制御手段
とを有することを特徴とする再構成可能アーキテクチャ
を用いた画像符号化装置。 - 【請求項5】 ベクトル{ai }(i=1,2,…,
n)、{bi }(i=1,2,…,n)において、各b
i が定数である場合に、Σai *bi の演算を含む処理
が行われる画像符号化方法をプログラムの形で記録した
記録媒体において、 複数のプロセッサエレメントが前記Σai *bi の演算
を行い、かつ当該プロセッサエレメントの相互間でデー
タを受渡し可能に構成されてなるプロセッサネットワー
クを用い、 当該プロセッサネットワークに対して、少なくともベク
トル{ai }(i=1,2,…,n)の全n個を一斉に
クロックに対応して逐次入力して、パイプライン処理を
実行させ、 前記各プロセッサエレメント内のおよびプロセッサエレ
メントの相互間の構成を制御するようにした画像符号化
方法をプログラムの形で記録したことを特徴とする再構
成可能アーキテクチャを用いた画像符号化方法をプログ
ラムの形で記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26648098A JP2000102005A (ja) | 1998-09-21 | 1998-09-21 | 再構成可能アーキテクチャを用いた画像符号化方法及びそのための装置、及びそのための方法を記述したプログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26648098A JP2000102005A (ja) | 1998-09-21 | 1998-09-21 | 再構成可能アーキテクチャを用いた画像符号化方法及びそのための装置、及びそのための方法を記述したプログラムを記録した記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000102005A true JP2000102005A (ja) | 2000-04-07 |
Family
ID=17431526
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26648098A Pending JP2000102005A (ja) | 1998-09-21 | 1998-09-21 | 再構成可能アーキテクチャを用いた画像符号化方法及びそのための装置、及びそのための方法を記述したプログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000102005A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100719939B1 (ko) | 2004-10-08 | 2007-05-18 | 재단법인서울대학교산학협력재단 | 영상 움직임 추정기 및 그 영상 움직임 추정기를 이용한영상 압축방법 |
JP2007274215A (ja) * | 2006-03-30 | 2007-10-18 | Canon Inc | 情報配信装置、情報再生装置、情報処理方法 |
US7433528B2 (en) | 2004-07-06 | 2008-10-07 | Canon Kabushiki Kaisha | Image processing apparatus |
US7792867B2 (en) | 2004-06-03 | 2010-09-07 | Canon Kabushiki Kaisha | Information processing method and information processing apparatus |
-
1998
- 1998-09-21 JP JP26648098A patent/JP2000102005A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7792867B2 (en) | 2004-06-03 | 2010-09-07 | Canon Kabushiki Kaisha | Information processing method and information processing apparatus |
US7433528B2 (en) | 2004-07-06 | 2008-10-07 | Canon Kabushiki Kaisha | Image processing apparatus |
KR100719939B1 (ko) | 2004-10-08 | 2007-05-18 | 재단법인서울대학교산학협력재단 | 영상 움직임 추정기 및 그 영상 움직임 추정기를 이용한영상 압축방법 |
JP2007274215A (ja) * | 2006-03-30 | 2007-10-18 | Canon Inc | 情報配信装置、情報再生装置、情報処理方法 |
US8301866B2 (en) | 2006-03-30 | 2012-10-30 | Canon Kabushiki Kaisha | Processor delivering content information recovered upon sequence of processes performed by data path reconfigured based on received configuration information containing use frequency |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3584053B2 (ja) | 複合オペランド内の多ビット要素を選択するためのマスク | |
US20060002471A1 (en) | Motion estimation unit | |
JP3228927B2 (ja) | プロセッサエレメント、プロセッシングユニット、プロセッサ、及びその演算処理方法 | |
US20220083857A1 (en) | Convolutional neural network operation method and device | |
KR20060056855A (ko) | 프로세서 | |
JPH04294469A (ja) | 相関装置 | |
US5375080A (en) | Performing arithmetic on composite operands to obtain a binary outcome for each multi-bit component | |
US20150147005A1 (en) | Methods and apparatus for image processing at pixel rate | |
CN112200713A (zh) | 一种联邦学习中的业务数据处理方法、装置以及设备 | |
CN113407979A (zh) | 用于纵向联邦逻辑回归学习的异构加速方法、装置及系统 | |
CN113296733A (zh) | 数据处理方法以及装置 | |
Lee et al. | Entropy thresholding and its parallel algorithm on the reconfigurable array of processors with wider bus networks | |
JP2000102005A (ja) | 再構成可能アーキテクチャを用いた画像符号化方法及びそのための装置、及びそのための方法を記述したプログラムを記録した記録媒体 | |
US11403783B2 (en) | Techniques to dynamically gate encoded image components for artificial intelligence tasks | |
US5838392A (en) | Adaptive block-matching motion estimator with a compression array for use in a video coding system | |
CN115994040A (zh) | 计算系统以及进行数据广播和数据归约的方法及存储介质 | |
CN113467752B (zh) | 用于隐私计算的除法运算装置、数据处理系统及方法 | |
CN111901500A (zh) | 图像处理方法和装置、存储介质及电子装置 | |
US20100030836A1 (en) | Adder, Synthesis Device Thereof, Synthesis Method, Synthesis Program, and Synthesis Program Storage Medium | |
WO2024114226A1 (zh) | 前向推理的处理方法、芯片、介质及处理装置 | |
Suchitra et al. | Novel schemes for high-throughput image rotation | |
KR102482728B1 (ko) | 비트 시리얼 연산 방법 및 컴퓨터 기록 매체 | |
JP2000295613A (ja) | 再構成可能なハードウェアを用いた画像符号化方法,画像符号化装置および画像符号化のためのプログラム記録媒体 | |
JP2691559B2 (ja) | 画素密度変換装置及びその方法 | |
JP2934143B2 (ja) | 動画像圧縮におけるブロック・マッチング方法と装置 |