JP3733627B2 - Digital signal arithmetic unit - Google Patents

Digital signal arithmetic unit Download PDF

Info

Publication number
JP3733627B2
JP3733627B2 JP30070295A JP30070295A JP3733627B2 JP 3733627 B2 JP3733627 B2 JP 3733627B2 JP 30070295 A JP30070295 A JP 30070295A JP 30070295 A JP30070295 A JP 30070295A JP 3733627 B2 JP3733627 B2 JP 3733627B2
Authority
JP
Japan
Prior art keywords
digital signal
supplied
adder
circuit
product
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP30070295A
Other languages
Japanese (ja)
Other versions
JPH09120396A (en
Inventor
哲二郎 近藤
秀雄 中屋
賢 堀士
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP30070295A priority Critical patent/JP3733627B2/en
Publication of JPH09120396A publication Critical patent/JPH09120396A/en
Application granted granted Critical
Publication of JP3733627B2 publication Critical patent/JP3733627B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
この発明は、ディジタル化された画素データまたは音声データの積和演算において、演算精度をおとさずに回路規模を削減することができるディジタル信号演算装置に関する。
【0002】
【従来の技術】
従来、ディジタル化された画素データまたは音声データの積和演算を行う装置においては、演算精度を落とさないために積算器、加算器および周辺素子などがともにワーストケース(語長が最も長くなる場合)のビット数が扱えるようにしていたため、タップ数を増やすとそれだけ回路規模が大きくなる傾向があった。
【0003】
このような従来方式のカスケードに接続された係数時変の積和演算回路のブロック図を図4に示す。41で示す入力端子から8ビットにディジタル化された画素データが供給され、その画素データは、nタップブロック化回路42へ供給される。nタップブロック化回路42では、入力画素データをフィルタ演算のタップに応じたブロック化がなされる。ブロック化がなされた信号は、アドレス信号発生回路43およびレジスタ45へ供給される。
【0004】
アドレス信号発生回路43では、供給されたブロックに含まれる画素に対応するアドレス信号を発生し、そのアドレス信号は、予測係数メモリ回路441 へ供給される。予測係数メモリ回路441 は、レジスタ51、54、アドレスデコーダ回路52およびメモリセル53から構成される。アドレス信号発生回路43からのアドレス信号は、レジスタ51へ供給され、保持される。保持されたアドレス信号は、この装置のシステムクロックに基づいて、レジスタ51から予測係数メモリ回路442 およびアドレスデコーダ回路52へ供給される。
【0005】
このように、システムクロックに基づいてアドレス信号は、予測係数メモリ回路44n まで供給され、その予測係数メモリ回路では、以下に示すような処理がなされる。アドレスデコーダ回路52では、メモリセル53に対応するように供給されたアドレス信号の変換が行われる。アドレスデコーダ回路52において、変換されたアドレス信号は、メモリセル53へ供給され、対応する予測係数が読み出される。読み出された予測係数は、メモリセル53からレジスタ54を介して、積和演算回路471 へ供給される。
【0006】
積和演算回路471 は、積算器55、レジスタ56、58および加算器57から構成される。この積和演算回路471 には、レジスタ45からブロック化された画素データ、丸め処理回路46から25ビットからなる8タップのデータおよび予測係数が供給される。供給された8ビットからなる画素データと10ビットからなる予測係数は、積算器55において、積算され、18ビットの積算結果として、レジスタ56を介して加算器57へ供給される。加算器57では、丸め処理回路46からのデータと積算器55の積算結果とが加算され、レジスタ58を介して積和演算回路472 へ供給される。
【0007】
このように、積和演算回路47n まで同様の処理が行われ、積和演算回路47n からの出力は、リミッタ回路48へ供給される。リミッタ回路48では、供給された25ビットのデータが8ビットに制限される。この図4に示す回路には、特に途中の演算精度を落とさないために、ビット幅方向にはオーバーフローまたはアンダーフローが起こらないように充分な幅(25ビット)を有する。
【0008】
ここで、予測係数が時変であることが条件となる画像における簡単なフィルタリングの例として、例えばサンプリングレート変換のようなものがあり、4fscのクロックによるデータ系列から3fscのクロックによるデータ系列に変換することを想定する。この場合図5に示すように、4fscのデータ系列の間の画素データをフィルタによって算出しなければならない。したがって、フィルタの係数は画素位置に応じて3種類(B0、B1、B2)を予め用意しておく必要があり、3fscのデータ系列へ変換するためには、これらをタイミングに応じて切り換える必要がある。
【0009】
このように、図4に示すようなパイプライン方式でサンプリングレート変換を行う場合、nタップのブロック化回路42は、削除することも可能であり、入力画素データが順次各積和演算回路471〜47nに供給されていれば良い。アドレス信号発回路43では、上述したように画素位置に応じたアドレス信号が発生し、各予測係数メモリ回路441〜44nに順次ラッチを介して供給される。各予測係数メモリ回路441〜44nでは、アドレスデコーダ回路52でメモリセル53の該当箇所が選択され、メモリセル53から予測係数が読み出され、各積和演算回路471〜47nに供給される。積和演算回路471〜47nでは、順次供給される画素データと予測係数の積が計算され、前段の積和演算回路471〜47n-1の結果と足し合わされる。以上のようにして、順次タップ毎の積の結果が足し込まれ、最後にリミッタ回路48から8ビットに制限して出力される。
【0010】
【発明が解決しようとする課題】
しかしながら、演算のためのビット数(25ビット)を充分すぎるくらい持っていることと、パイプライン処理の弊害で予測係数メモリ回路のアドレスデコーダ回路が個別になっていることで、かなり回路規模が大きくなる問題があった。
【0011】
従って、この発明の目的は、予測係数メモリ回路のパイプライン処理を並列にすることで、メモリセルの利用効率を上げることができ、それによって、回路全体の規模を縮小化することができるディジタル信号演算装置を提供することにある。
【0012】
【課題を解決するための手段】
請求項1に記載の発明は、ディジタル信号を積和するディジタル信号演算装置において、入力されたディジタル信号から抽出されたn個のディジタル信号に対応するアドレス信号に応じて、メモリからn種類の予測係数読み出予測係数読み出し手段と、読み出されたn種類の予測係数と、入力されたディジタル信号から抽出されたn個のディジタル信号とがそれぞれ供給され、積和演算が行われるnタップの積和演算手段と、積和演算が行われたデータを制限するリミッタ手段とを有し、積和演算手段は、少なくとも、n種類の予測係数と、n個のディジタル信号とをそれぞれ積算するn個の積算器と、n個の積算器による積算結果の少なくとも一部を加算すると共に、加算結果をクリップして出力する第1階層の加算器と、第1階層の加算器による加算結果の少なくとも一部を加算すると共に、加算結果をクリップして出力する第2階層の加算器と、第1及び第2階層の加算器の間に設けられるレジスタとから構成されるようにしたことを特徴とするディジタル信号演算装置である。
【0014】
入力画素データが8ビットであり、フィルタ演算された最終結果も8ビットであることを考慮すると、ここまでビット数に余裕を持たせておく必要もなく、途中で最適に丸めることで、ビット数を削除することが可能である。
【0015】
【発明の実施の形態】
以下、この発明の一実施例について図面を参照して説明する。まず、ディジタル信号演算装置の一実施例のブロック図を図1に示す。1で示す入力端子から8ビットにディジタル化された画素データが供給され、その画素データは、nタップブロック化回路2へ供給される。nタップブロック化回路2では、入力画素データをフィルタ演算のnタップに対応したブロック化がなされる。すなわち、このnタップブロック化回路2では、n画素毎にブロック化が行われ、ブロック化された各画素がn個の積和演算回路(MPY)91 〜9n へ供給されるとともに、アドレス信号発生回路3へ供給される。
【0016】
アドレス信号発生回路3では、供給されたブロックに含まれる画素に対応するアドレス信号を発生し、そのアドレス信号は、予測係数メモリ回路4へ供給される。予測係数メモリ回路4は、レジスタ5、81 〜8n 、アドレスデコーダ回路6およびメモリセル7から構成される。アドレス信号発生回路3からのアドレス信号は、レジスタ5へ供給され、保持される。保持されたアドレス信号は、この装置のシステムクロックに基づいてレジスタ5からアドレスデコーダ回路6へ供給される。
【0017】
アドレスデコーダ回路6では、メモリセル7に対応するように供給されたアドレス信号の変換が行われる。アドレスデコーダ回路6において、変換されたアドレス信号は、メモリセル7へ供給され、後段の積和演算回路91 〜9n にそれぞれ対応する予測係数(CM)が読み出される。読み出された予測係数は、10ビットからなり、メモリセル7からレジスタ81 〜8n を介して、積和演算回路91 〜9n に供給される。
【0018】
積和演算回路91 は、レジスタ10、12および積算器11から構成される。そして、上述したようにnタップブロック化回路2から供給された8ビットの画素データは、レジスタ10へ供給される。その8ビットの画素データと10ビットの予測係数は、積算器11において、積算される。その積算結果は、18ビットのデータとして、レジスタ12を介して、積和演算回路91 の出力として加算器13へ供給される。また、積和演算回路92 〜9n は、積和演算回路91 と同様の処理を行い、各積和演算回路92 〜9n は、対応する加算器へ18ビットのデータを出力する。
【0019】
すなわち、加算器13には、積和演算回路91 および92 からの18ビットのデータが供給される。そして、その加算結果は、下位の1ビットを切り捨てることでビット幅を増やすことなく、すなわち18ビットのデータとして、レジスタ14を介して、次の階層となる加算器15へ供給される。加算器15では、レジスタ17を介して供給される積和演算回路93 と図示しない積和演算回路94 との加算結果と、レジスタ14を介して供給された加算結果との加算が行われる。そして、その加算結果は、加算器13と同様に下位の1ビットを切り捨てることで18ビットのデータとして、次の階層へ出力される。
【0020】
同様に、加算器19では、図示しない積和演算回路9n-1 の出力と積和演算回路9n の出力との加算が行われる。その加算結果は、レジスタ20を介して次の階層へ出力される。このようにして、最終階層の加算器21では、2つの18ビットのデータが加算される。そして、上述の加算器と同様に加算器21の加算結果は、下位1ビットを切り捨てることで18ビットのデータとして、レジスタ22を介してリミッタ回路23へ供給される。リミッタ回路23では、供給された18ビットのデータが8ビットのデータに制限され、出力端子24から伝送される。
【0021】
ここで、図2は、この上述の積和演算回路を25タップの一例で示したものである。また、この図2は、上述の実施例よりさらに積極的に途中の階層でビットの削減を行っている。この例は、25タップからなるため、きれいな階層構造ができないことから、一番下のタップとなる積算器3125の積算結果を最終段に近い階層で加算するようにしている。この積算器3125には、一般にタップの中心となるデータの演算が行われるように配置すると、精度良く演算が行われるという利点も生じる。
【0022】
2の補数を用いた表現で符号を含む9ビットからなる入力画素データと、固定小数点を用いた表現で符号を含む10ビットからなる予測係数とが積算器31に供給され、積算される。図3に示すように、この積算器31において、最初の計算の結果は、フルビットの幅では18ビットとなるが、下位の3ビットを切り捨て、15ビットとして出力される。このようにして積算器311 の出力は、レジスタを介して、加算器321 へ供給される。同様に積算器312 〜3124の出力もレジスタを介して、加算器321 〜3212へ供給される。
【0023】
そして、加算器321 、すなわち第1階層の加算器は、加算結果において、図3に示すように、上位ビット方向に1ビット伸びるが、下位の1ビットを切り捨てることでビット幅を同じ15ビットとしている。同様に第1階層の加算器322 〜3212では、積算器313 〜3124から供給された15ビットのデータが加算され、それぞれの加算結果は、15ビットのデータとして、第2階層の加算器331 〜336 へ供給される。
【0024】
第2階層の加算器331 には、加算器321 および322 から出力された15ビットからなるデータが供給される。その加算器331 の加算結果は、図3に示すように、上位ビット方向への伸びを抑え、下位の1ビットを切り捨て、14ビットのデータとしてレジスタを介して加算器341 へ供給される。同様に第2階層の加算器332 〜336 では、第1階層の加算器323 〜3212から供給される15ビットのデータが加算され、それぞれの加算結果は、14ビットのデータとして、第3階層の加算器341 〜343 へ供給される。
【0025】
第3階層の加算器341 には、加算器331 および332 から出力された14ビットからなるデータが供給される。その加算器341 の加算結果は、図3に示すように、上位ビット方向への伸びを抑え、下位の1ビットを切り捨て、13ビットのデータとしてレジスタを介して加算器351 へ供給される。同様に第3階層の加算器342 および343 では、第2階層の加算器333 〜336 から供給された14ビットのデータが加算され、それぞれの加算結果は、13ビットのデータとして、第4階層の加算器351 および352 へ供給される。
【0026】
第4階層の加算器351 には、加算器341 および342 から出力された13ビットからなるデータが供給される。その加算器351 の加算結果は、図3に示すように、上位ビット方向への伸びを抑え、下位の1ビットを切り捨て、12ビットのデータとしてレジスタを介して加算器36へ供給される。同様に第4階層の加算器352 では、第3階層の加算器343 および積算器3125から供給された13ビットのデータが加算され、その加算結果は、12ビットのデータとして、第5階層の加算器36へ供給される。
【0027】
この加算器352 へ供給される積算器3125では、上述したようにタップの中心となるデータ(9ビット)と予測係数(10ビット)が積算される。この積算器3125から出力されるデータは、上述した積算器311 〜3124と同様に18ビットとなる。しかしながら、この積算器3125の出力は、第4階層の加算器352 へ供給されるため、上位ビット方向に1ビット伸ばし、下位の6ビットを削除することにより13ビットとして、加算器352 へ供給される。
【0028】
そして、第5階層の加算器36には、加算器351 および352 から出力された12ビットからなるデータ供給される。その加算器36の加算結果は、図3に示すように、上位ビット方向の伸びを抑え、下位の1ビットを切り捨て、すなわち小数点以下のビットが全て削除された11ビットのデータとしてリミッタ回路37へ供給される。リミッタ回路37では、供給された11ビットのデータが8ビットに制限され、予測値は、出力端子24から出力される。
【0029】
この実施例で用いられているアドレス信号発生装置3は、供給されたブロックに含まれる画素データに対応するアドレス信号を発生させるが、ブロックに含まれる画素データに対して、例えばADRC(ダイナミックレンジ適応符号化)、DPCM(予測符号化)、DCT(離散的コサイン変換)、VQ(ベクトル量子化)、BTC(ブロックトランケーション符号化)等を用いて圧縮することによって、その圧縮された値をそのブロックのクラスとして、アドレス信号を発生するクラス分類の手法を使用することも可能である。
【0030】
すなわち、クラス分類によって予測係数が読み出され、読み出された予測係数と画素データとを用いた線形一次結合によって、予測値が生成される。このように、予測値が生成されることによって、例えば、SD(Standard Difinition )信号からHD(High Difinition )信号へのアップコンバージョン、またはサブサンプリングにより間引かれた画素の予測がなされる。
【0031】
さらに、この実施例では、係数ゲインが1に近いフィルタの場合、充分にオーバーフローまたはアンダーフローに耐えられる構造となっており、この実施例の最終的な演算結果と、フルビット演算による最終的な演算結果を8ビットに丸めた場合とを比較しても、±1〜±2程度の誤差しか生じておらず、その画像をモニタ表示した場合においても、差異が識別できないという評価がなされている。
【0032】
また、この実施例では、画素データを用いて説明したが、音声データを用いても同じ結果を得ることができる。
【0033】
【発明の効果】
この発明に依れば、画像を扱う場合において、8ビットで入力される画素データを最終段において、8ビットに丸めて出力する場合、それほど厳密に精度をとる必要はなく、演算の途中の段階で最適に丸め処理を重ねる、すなわち積算結果を足し込む階層毎の加算器の結果の下位ビットを切り捨てて削減し、足し込むに毎にビット幅が増加しないようにしたものでも、それ程精度は、劣化しない。
【0034】
さらに、この発明に依れば、積和演算回路を並列化とし、予測係数メモリ回路へ供給するアドレス信号を1つとし、アドレスデコーダ回路を共通化し、さらにメモリセルの利用効率を上げるものであり、画像のフィルタ演算を行う積和演算回路の回路規模を削減することができる。
【図面の簡単な説明】
【図1】この発明のディジタル信号演算装置の一実施例を示すブロック図である。
【図2】この発明に係る積算演算回路の一例を示すブロック図である。
【図3】この発明に係る積算演算回路の階層に応じたビット幅の一例を示す略線図である。
【図4】従来のディジタル信号演算装置のブロック図である。
【図5】信号変換の説明に用いる図である。
【符号の説明】
2 nタップブロック化回路
3 アドレス信号発生回路
4 予測係数メモリ回路
6 アドレスデコーダ回路
7 メモリセル
9 積和演算回路
11 積算器
13、16、19、15、21 加算器
23 リミッタ回路
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a digital signal arithmetic apparatus capable of reducing the circuit scale without reducing the arithmetic accuracy in the product-sum operation of digitized pixel data or audio data.
[0002]
[Prior art]
Conventionally, in an apparatus that performs a product-sum operation on digitized pixel data or audio data, the accumulator, adder, and peripheral elements are all worst-cased (when the word length is the longest) in order not to reduce the calculation accuracy. Since the number of bits can be handled, the circuit scale tends to increase as the number of taps increases.
[0003]
FIG. 4 shows a block diagram of a coefficient time-varying product-sum operation circuit connected to such a conventional cascade. Pixel data digitized to 8 bits is supplied from an input terminal 41, and the pixel data is supplied to an n-tap blocking circuit 42. In the n-tap blocking circuit 42, the input pixel data is blocked according to the tap of the filter operation. The blocked signal is supplied to the address signal generation circuit 43 and the register 45.
[0004]
In the address signal generating circuit 43 generates an address signal corresponding to the pixels included in the supply block, the address signals are supplied to the prediction coefficient memory circuit 44 1. Prediction coefficient memory circuit 44 1 is comprised of registers 51 and 54, the address decoder circuit 52 and the memory cell 53. The address signal from the address signal generation circuit 43 is supplied to the register 51 and held. Holding address signal, based on the system clock of the device, supplied from the register 51 to the prediction coefficient memory circuit 44 2 and the address decoder circuit 52.
[0005]
As described above, the address signal is supplied to the prediction coefficient memory circuit 44 n based on the system clock, and the following processing is performed in the prediction coefficient memory circuit. The address decoder circuit 52 converts an address signal supplied so as to correspond to the memory cell 53. In the address decoder circuit 52, the converted address signal is supplied to the memory cell 53, and the corresponding prediction coefficient is read out. Prediction coefficients read out from the memory cell 53 via the register 54, it is supplied to the product-sum operation circuit 47 1.
[0006]
The product-sum operation circuit 47 1 includes an integrator 55, registers 56 and 58, and an adder 57. The product-sum operation circuit 47 1 is supplied with pixel data that has been blocked from the register 45 and 8-tap data consisting of 25 bits and a prediction coefficient from the rounding processing circuit 46. The supplied 8-bit pixel data and 10-bit prediction coefficient are integrated in the integrator 55 and supplied to the adder 57 via the register 56 as an 18-bit integration result. The adder 57 is a result of integration and data from rounding circuit 46 multiplier 55 adder is supplied to the product-sum operation circuit 47 2 via the register 58.
[0007]
Thus, similar processing to the product-sum operation circuit 47 n is performed, the output from the product-sum operation circuit 47 n is supplied to the limiter circuit 48. In the limiter circuit 48, the supplied 25-bit data is limited to 8 bits. The circuit shown in FIG. 4 has a sufficient width (25 bits) so that overflow or underflow does not occur in the bit width direction, in particular, in order not to reduce the calculation accuracy in the middle.
[0008]
Here, as an example of simple filtering in an image on the condition that the prediction coefficient is time-varying, there is, for example, sampling rate conversion, which converts a data sequence using a 4 fsc clock to a data sequence using a 3 fsc clock. Assuming that In this case, as shown in FIG. 5, pixel data between 4 fsc data series must be calculated by a filter. Therefore, three types of filter coefficients (B0, B1, B2) need to be prepared in advance according to the pixel position, and in order to convert to a 3 fsc data series, it is necessary to switch these according to the timing. is there.
[0009]
As described above, when the sampling rate conversion is performed by the pipeline method as shown in FIG. 4, the n-tap blocking circuit 42 can be deleted, and the input pixel data is sequentially supplied to each product-sum operation circuit 47 1. It is sufficient that it is supplied to ˜47 n . The address signal onset raw circuit 43, an address signal corresponding to a pixel position is generated as described above, it is supplied via sequentially latched to each prediction coefficient memory circuit 44 1 ~ 44 n. In each of the prediction coefficient memory circuits 44 1 to 44 n , a corresponding portion of the memory cell 53 is selected by the address decoder circuit 52, and a prediction coefficient is read from the memory cell 53 and supplied to each of the product-sum operation circuits 47 1 to 47 n . Is done. In the product-sum operation circuits 47 1 to 47 n , the product of the sequentially supplied pixel data and the prediction coefficient is calculated and added to the results of the previous product-sum operation circuits 47 1 to 47 n−1 . As described above, the result of the product for each tap is sequentially added, and finally, the limiter circuit 48 outputs the result limited to 8 bits.
[0010]
[Problems to be solved by the invention]
However, the circuit scale is considerably large because the number of bits for calculation (25 bits) is too large and the address decoder circuit of the prediction coefficient memory circuit is individual due to the adverse effect of pipeline processing. There was a problem.
[0011]
Therefore, an object of the present invention is to make it possible to increase the use efficiency of memory cells by parallelizing the pipeline processing of the prediction coefficient memory circuit, thereby reducing the scale of the entire circuit. It is to provide an arithmetic device.
[0012]
[Means for Solving the Problems]
According to the first aspect of the present invention, in the digital signal arithmetic unit for multiplying and summing digital signals, n types of predictions are made from the memory in accordance with address signals corresponding to n digital signals extracted from the input digital signals. and prediction coefficient reading means to read out coefficients, and prediction coefficients for n type read, and n digital signals extracted from the input digital signal are respectively supplied, n taps product-sum operation is performed Product-sum operation means and limiter means for limiting the data on which the product-sum operation has been performed. The product-sum operation means integrates at least n types of prediction coefficients and n digital signals, respectively. n accumulators, a first hierarchy adder that adds at least a part of the accumulation results of the n accumulators , and clips and outputs the addition results ; A second layer adder that adds at least a part of the addition result by the adder, clips and outputs the addition result, and a register provided between the first and second layer adders This is a digital signal arithmetic device characterized by being configured as described above.
[0014]
Considering that the input pixel data is 8 bits and the final result of the filter operation is 8 bits, it is not necessary to leave a sufficient number of bits so far. Can be deleted.
[0015]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an embodiment of the present invention will be described with reference to the drawings. First, a block diagram of an embodiment of a digital signal arithmetic unit is shown in FIG. Pixel data digitized to 8 bits is supplied from an input terminal indicated by 1, and the pixel data is supplied to an n-tap blocking circuit 2. In the n-tap blocking circuit 2, the input pixel data is blocked corresponding to n-tap of the filter operation. That is, in this n-tap blocking circuit 2, blocking is performed for every n pixels, and each of the blocked pixels is supplied to n product-sum operation circuits (MPY) 9 1 to 9 n and addresses The signal is supplied to the signal generation circuit 3.
[0016]
The address signal generation circuit 3 generates an address signal corresponding to a pixel included in the supplied block, and the address signal is supplied to the prediction coefficient memory circuit 4. The prediction coefficient memory circuit 4 includes registers 5 and 8 1 to 8 n , an address decoder circuit 6 and a memory cell 7. The address signal from the address signal generation circuit 3 is supplied to the register 5 and held. The held address signal is supplied from the register 5 to the address decoder circuit 6 based on the system clock of this apparatus.
[0017]
The address decoder circuit 6 converts an address signal supplied so as to correspond to the memory cell 7. In the address decoder circuit 6, the converted address signal is supplied to the memory cell 7, and the prediction coefficient (CM) corresponding to each of the subsequent product-sum operation circuits 9 1 to 9 n is read. The read prediction coefficient consists of 10 bits and is supplied from the memory cell 7 to the product-sum operation circuits 9 1 to 9 n via the registers 8 1 to 8 n .
[0018]
The product-sum operation circuit 9 1 includes registers 10 and 12 and an integrator 11. As described above, the 8-bit pixel data supplied from the n-tap blocking circuit 2 is supplied to the register 10. The 8-bit pixel data and the 10-bit prediction coefficient are integrated in the integrator 11. The multiplication result as 18-bit data, via the register 12, is supplied to the adder 13 as an output of the product-sum operation circuit 9 1. The product-sum operation circuits 9 2 to 9 n perform the same processing as the product-sum operation circuit 9 1, and each product-sum operation circuit 9 2 to 9 n outputs 18-bit data to the corresponding adder. .
[0019]
That is, the adder 13 is supplied with 18-bit data from the product-sum operation circuits 9 1 and 9 2 . Then, the addition result is supplied to the adder 15 as the next layer through the register 14 without increasing the bit width by truncating the lower one bit, that is, as 18-bit data. In the adder 15, the sum of the product-sum operation circuit 9 4 (not shown) and product-sum operation circuit 9 3 supplied via the register 17, the addition of the addition result supplied via the register 14 is performed . The addition result is output to the next layer as 18-bit data by truncating the lower 1 bit as in the adder 13.
[0020]
Similarly, the adder 19 adds the output of the product - sum operation circuit 9 n-1 ( not shown) and the output of the product-sum operation circuit 9 n . The addition result is output to the next hierarchy through the register 20. In this manner, the adder 21 in the final hierarchy adds two 18-bit data. Similarly to the adder described above, the addition result of the adder 21 is supplied to the limiter circuit 23 via the register 22 as 18-bit data by truncating the lower 1 bit. In the limiter circuit 23, the supplied 18-bit data is limited to 8-bit data and transmitted from the output terminal 24.
[0021]
FIG. 2 shows the above-described product-sum operation circuit as an example of 25 taps. Further, in FIG. 2, bits are reduced more actively in the middle layer than in the above embodiment. This example is to be added in 25 to become a tap, from the inability to clean hierarchy, near the accumulation result of the integrator 31 25 as a tap at the bottom in the final stage hierarchy. The integrator 31 25, the general arithmetic operation of data that is central to the tap arranged to be performed, an advantage that accuracy calculation is performed occurs.
[0022]
The input pixel data consisting of 9 bits including the sign in the expression using the two's complement and the prediction coefficient consisting of 10 bits including the sign in the expression using the fixed point are supplied to the integrator 31 and integrated. As shown in FIG. 3, in the accumulator 31, the result of the first calculation is 18 bits in the full bit width, but the lower 3 bits are rounded down and output as 15 bits. In this way, the output of the integrator 31 1 is supplied to the adder 32 1 via the register. Similarly, the output of the integrator 31 2-31 24 even through the register is supplied to the adder 321 to 323 12.
[0023]
The adder 32 1 , that is, the first layer adder, in the addition result, as shown in FIG. 3, extends by 1 bit in the upper bit direction, but the same bit width is obtained by truncating the lower 1 bit. It is said. In the first layer of the adder 32 2 to 32 12 Similarly, the integrator 31 3-31 are subject to 15-bit data supplied from the 24, each of the addition result, 15 as bit data, the second layer It is supplied to the adders 33 1 to 33 6 .
[0024]
The 15-bit data output from the adders 32 1 and 32 2 is supplied to the adder 33 1 in the second hierarchy. Its adder 33 1 of the addition result, as shown in FIG. 3, to suppress the elongation of the upper bit direction, truncating a bit lower, is supplied to the adder 34 1 via the register as 14-bit data . Similarly, in the second layer adders 33 2 to 33 6 , the 15-bit data supplied from the first layer adders 32 3 to 32 12 are added, and each addition result is expressed as 14-bit data. is supplied to the adder 34 1 to 34 3 of the third layer.
[0025]
The 14-bit data output from the adders 33 1 and 33 2 is supplied to the adder 34 1 in the third hierarchy. Addition result of the adder 34 1, as shown in FIG. 3, to suppress the elongation of the upper bit direction, truncating a bit lower, is supplied to the adder 35 1 through the register as the 13-bit data . Similarly in the third hierarchical adder 34 2 and 34 3 are added 14-bit data supplied from the adder 33 3 to 33 6 of the second hierarchy, each addition result as 13-bit data, It is supplied to the adders 35 1 and 35 2 in the fourth layer.
[0026]
The 13-bit data output from the adders 34 1 and 34 2 is supplied to the adder 35 1 in the fourth layer. Addition result of the adder 35 1, as shown in FIG. 3, to suppress the elongation of the upper bit direction, truncating a bit lower, is supplied to the adder 36 via the register as 12 bits of data. The adder 35 2 of the fourth hierarchy as well, 13-bit data supplied from the adder 34 3 and integrator 31 25 in the third layer is added, the addition result as 12-bit data, the fifth It is supplied to the adder 36 of the hierarchy.
[0027]
The integrator 31 25 supplied to the adder 35 2, the center to become data (9 bits) and the prediction coefficient of the tap, as described above (10 bits) is accumulated. Data output from the integrator 31 25 is the same as the 18-bit and the integrator 31 1-31 24 described above. However, the output of the integrator 31 25 to be supplied to the adder 35 2 of the fourth hierarchy, as 13 bit by stretching 1 bit to the upper bit direction, to remove the 6 bits of the lower adder 35 2 Supplied to.
[0028]
The fifth layer adder 36 is supplied with 12-bit data output from the adders 35 1 and 35 2 . As shown in FIG. 3, the addition result of the adder 36 suppresses the expansion in the upper bit direction, truncates the lower one bit, that is, 11-bit data from which all the bits after the decimal point are deleted, to the limiter circuit 37. Supplied. In the limiter circuit 37, the supplied 11-bit data is limited to 8 bits, and the predicted value is output from the output terminal 24.
[0029]
The address signal generator 3 used in this embodiment generates an address signal corresponding to the pixel data included in the supplied block. For example, ADRC (Dynamic Range Adaptation) is applied to the pixel data included in the block. Coding), DPCM (predictive coding), DCT (discrete cosine transform), VQ (vector quantization), BTC (block truncation coding), etc. to compress the compressed value into the block It is also possible to use a class classification method for generating an address signal as the class.
[0030]
That is, a prediction coefficient is read out by class classification, and a prediction value is generated by linear linear combination using the read prediction coefficient and pixel data. Thus, by generating the prediction value, for example, prediction of pixels thinned out by up-conversion from an SD (Standard Definition) signal to an HD (High Definition) signal or sub-sampling is performed.
[0031]
Further, in this embodiment, in the case of a filter having a coefficient gain close to 1, it has a structure that can sufficiently withstand overflow or underflow. Even when the calculation result is rounded to 8 bits, only an error of about ± 1 to ± 2 occurs, and it is evaluated that the difference cannot be identified even when the image is displayed on the monitor. .
[0032]
In this embodiment, the pixel data is used for the explanation, but the same result can be obtained even if the audio data is used.
[0033]
【The invention's effect】
According to the present invention, in the case of handling an image, when pixel data input in 8 bits is rounded to 8 bits and output in the final stage, it is not necessary to take precision so accurately, and a stage in the middle of an operation Even if the rounding process is optimally repeated, that is, the lower bit of the result of the adder for each layer that adds the integration results is rounded down and reduced so that the bit width does not increase with each addition, the accuracy is so much. Does not deteriorate.
[0034]
Furthermore, according to the present invention, the product-sum operation circuit is parallelized, the address signal supplied to the prediction coefficient memory circuit is one, the address decoder circuit is shared, and the utilization efficiency of the memory cell is further increased. Therefore, the circuit scale of the product-sum operation circuit that performs the filter operation of the image can be reduced.
[Brief description of the drawings]
FIG. 1 is a block diagram showing an embodiment of a digital signal arithmetic device according to the present invention.
FIG. 2 is a block diagram showing an example of an integration operation circuit according to the present invention.
FIG. 3 is a schematic diagram showing an example of a bit width corresponding to a hierarchy of an integration arithmetic circuit according to the present invention.
FIG. 4 is a block diagram of a conventional digital signal arithmetic device.
FIG. 5 is a diagram used for explaining signal conversion;
[Explanation of symbols]
2 n-tap blocking circuit 3 address signal generation circuit 4 prediction coefficient memory circuit 6 address decoder circuit 7 memory cell 9 product-sum operation circuit 11 accumulator 13, 16, 19, 15, 21 adder 23 limiter circuit

Claims (6)

ディジタル信号を積和するディジタル信号演算装置において、
入力されたディジタル信号から抽出されたn個のディジタル信号に対応するアドレス信号に応じて、メモリからn種類の予測係数読み出予測係数読み出し手段と、
上記読み出されたn種類の予測係数と、上記入力されたディジタル信号から抽出されたn個のディジタル信号とがそれぞれ供給され、積和演算が行われるnタップの積和演算手段と、
上記積和演算が行われたデータを制限するリミッタ手段とを有し、
上記積和演算手段は、少なくとも、
上記n種類の予測係数と、上記n個のディジタル信号とをそれぞれ積算するn個の積算器と、
上記n個の積算器による積算結果の少なくとも一部を加算すると共に、加算結果をクリップして出力する第1階層の加算器と、
上記第1階層の加算器による加算結果の少なくとも一部を加算すると共に、加算結果をクリップして出力する第2階層の加算器と、
上記第1及び第2階層の加算器の間に設けられるレジスタとから構成されるようにしたことを特徴とするディジタル信号演算装置。
In a digital signal arithmetic unit that multiplies and sums digital signals,
According to the corresponding address signal into n digital signals extracted from the input digital signal, a prediction coefficient reading means for to read out the prediction coefficients of n type from the memory,
N-tap sum-of-products operation means for supplying the n-type prediction coefficients read out and n number of digital signals extracted from the input digital signal, respectively, and performing a sum-of-products operation;
Limiter means for limiting the data on which the product-sum operation has been performed,
The product-sum operation means is at least
And prediction coefficient of the n type, and the n integrators for integrating said n digital signals and respectively,
A first layer adder for adding at least a part of the integration results by the n integrators and clipping and outputting the addition results ;
A second layer adder that adds at least a part of the addition result by the first layer adder and clips and outputs the addition result;
A digital signal arithmetic apparatus comprising a register provided between the first and second layer adders .
上記第1及び第2階層の加算器を含む階層構造で構成される複数の加算器は、
上記出力するデータに対して、演算の段数を重ねるにつれて上位ビット方向に増加させず、下位ビットに対して丸め処理となるクリップを行うようにしたことを特徴とする請求項1に記載のディジタル信号演算装置。
A plurality of adders configured in a hierarchical structure including the first and second hierarchy adders ,
2. The digital signal according to claim 1, wherein the data to be output is clipped as a rounding process for the lower bits without increasing in the higher bit direction as the number of operation stages is increased. Arithmetic unit.
上記予測係数読み出し手段は、The prediction coefficient reading means is
上記入力されたディジタル信号から抽出されたn個のディジタル信号に基づき決定されるクラスに応じて発生されるアドレス信号に応じて、上記メモリからn種類の予測係数を読み出すことを特徴とする請求項1に記載のディジタル信号演算装置。The n kinds of prediction coefficients are read from the memory in accordance with an address signal generated according to a class determined based on n digital signals extracted from the input digital signal. 2. The digital signal arithmetic device according to 1.
上記予測係数読み出し手段は、
上記入力されたディジタル信号圧縮することにより生成される値に基づき決定されるクラスに応じて発生されるアドレス信号に応じて、上記メモリからn種類の予測係数を読み出すようにしたことを特徴とする請求項に記載のディジタル信号演算装置。
The prediction coefficient reading means is
And characterized in that in response to the address signal generated in accordance with the class that is determined based on the value generated by compressing a digital signal which is the input, and to read out the prediction coefficients of n type from the memory The digital signal arithmetic device according to claim 3 .
上記リミッタ手段は、
上記入力されたディジタル信号と同じビット数になるように上記データを制限するようにしたことを特徴とする請求項1に記載のディジタル信号演算装置。
The limiter means is
2. The digital signal arithmetic apparatus according to claim 1, wherein the data is limited so as to have the same number of bits as the input digital signal.
上記積和演算手段は、The product-sum operation means is
上記nタップのうちの中心タップに対応するディジタル信号の積算結果を、上記第1及び第2階層の加算器を含む階層構造で構成される複数の加算器のうちの最終段に近い階層の加算器で加算することを特徴とする請求項1に記載のディジタル信号演算装置。The summation result of the digital signal corresponding to the center tap among the n taps is added to the layer close to the final stage among the plurality of adders configured in a hierarchical structure including the first and second layer adders. 2. The digital signal arithmetic apparatus according to claim 1, wherein the addition is performed by a calculator.
JP30070295A 1995-10-25 1995-10-25 Digital signal arithmetic unit Expired - Lifetime JP3733627B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30070295A JP3733627B2 (en) 1995-10-25 1995-10-25 Digital signal arithmetic unit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30070295A JP3733627B2 (en) 1995-10-25 1995-10-25 Digital signal arithmetic unit

Publications (2)

Publication Number Publication Date
JPH09120396A JPH09120396A (en) 1997-05-06
JP3733627B2 true JP3733627B2 (en) 2006-01-11

Family

ID=17888062

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30070295A Expired - Lifetime JP3733627B2 (en) 1995-10-25 1995-10-25 Digital signal arithmetic unit

Country Status (1)

Country Link
JP (1) JP3733627B2 (en)

Also Published As

Publication number Publication date
JPH09120396A (en) 1997-05-06

Similar Documents

Publication Publication Date Title
JP4996347B2 (en) Image reduction sampling method
US5859788A (en) Modulated lapped transform method
CN102007489B (en) Reduction of errors during computation of inverse discrete cosine transform
KR100246878B1 (en) Inverse discrete cosine transform processor
US6144700A (en) Method and apparatuses for removing blocking effect in a motion picture decoder
US5649077A (en) Modularized architecture for rendering scaled discrete cosine transform coefficients and inverse thereof for rapid implementation
US5659362A (en) VLSI circuit structure for implementing JPEG image compression standard
US5768429A (en) Apparatus and method for accelerating digital video decompression by performing operations in parallel
KR960028558A (en) Bit rate reduction device and motion vector processing device used therein
Park et al. Area efficient VLSI architectures for Huffman coding
WO2012115486A2 (en) Method and apparatus for converting an image, and method and apparatus for the inverse conversion of an image
JPS5838023A (en) Device including digital filter for subtracting first and second binary numbers by binary calculation
US5689592A (en) Parallel processing of digital signals in a single arithmetic/logic unit
US5652625A (en) Multi-stage pipeline architecture for motion estimation block matching
Fowler et al. Real-time video compression using differential vector quantization
JP3733627B2 (en) Digital signal arithmetic unit
US5748514A (en) Forward and inverse discrete cosine transform circuits
JPS63253786A (en) Differential pcm device and method for establishing transfer function of compressor thereof
US6507673B1 (en) Method and apparatus for video encoding decision
US4910751A (en) Method and apparatus for reversible compression of information-carrying symbols
JP3136785B2 (en) Data compression device
JP3087312B2 (en) Data compression device
JP3225614B2 (en) Data compression device
KR0153173B1 (en) A processor for quantizing/inverse-quantizing
US7724975B2 (en) Design techniques and their circuit designs for versatile and scalable video coding

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050308

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050428

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050927

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051010

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091028

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091028

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101028

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101028

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111028

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111028

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121028

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121028

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131028

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term