JP3371481B2 - Digital arithmetic unit - Google Patents
Digital arithmetic unitInfo
- Publication number
- JP3371481B2 JP3371481B2 JP23685393A JP23685393A JP3371481B2 JP 3371481 B2 JP3371481 B2 JP 3371481B2 JP 23685393 A JP23685393 A JP 23685393A JP 23685393 A JP23685393 A JP 23685393A JP 3371481 B2 JP3371481 B2 JP 3371481B2
- Authority
- JP
- Japan
- Prior art keywords
- block
- pixel data
- data
- storage means
- stored
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Image Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【0001】[0001]
【産業上の利用分野】本発明は、高い効率の画像圧縮を
可能とし、なおかつ、最長の処理時間を短縮することが
できるディジタル演算装置に関し、特に、実空間の画像
データを対象としたフィールドDCTとフレームDCT
とを適切に切り換えてDCTの計算を行うディジタル演
算装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a digital arithmetic unit capable of highly efficient image compression and shortening the longest processing time, and more particularly to a field DCT for image data in real space. And frame DCT
The present invention relates to a digital arithmetic device for appropriately calculating and calculating DCT.
【0002】[0002]
【従来の技術】実空間の画像データに含まれるフレーム
データは、図5に示すように、2つの例えばフィールド
データA、Bで構成される。実空間の画像データを圧縮
する場合には、フレームデータを例えば8×16画素に
応じたブロックデータに分割し、このブロックデータを
単位として実空間の画像データを周波数空間のデータに
変換する離散コサイン変換(DCT:Discrete Cosine
Transformation) を行う。例えば、8×8画素の実空間
の画像データ〔X〕を周波数空間のデータ〔C〕にDC
T変換する変換式は、下記式(1)で示され、その出力
系列は近似的に無相関化されるため、DCT出力をPC
M符号化することにより、高能率な圧縮符号化が可能と
なる。2. Description of the Related Art Frame data included in image data in a real space is composed of, for example, two field data A and B as shown in FIG. When compressing image data in the real space, the frame data is divided into block data corresponding to, for example, 8 × 16 pixels, and the discrete cosine for converting the image data in the real space into data in the frequency space in units of this block data. Transform (DCT: Discrete Cosine
Transformation). For example, the image data [X] in the real space of 8 × 8 pixels is converted into the data [C] in the frequency space by DC.
The conversion formula for T conversion is represented by the following formula (1), and since the output sequence is approximately uncorrelated, the DCT output is converted to PC.
The M coding enables highly efficient compression coding.
【0003】[0003]
【数1】 [Equation 1]
【0004】上記式(1)における行列〔P〕は下記式
(2)で定義される。The matrix [P] in the above equation (1) is defined by the following equation (2).
【0005】[0005]
【数2】 [Equation 2]
【0006】実空間の画像データは、一般的になめらか
に変化し、周波数空間のデータに変換した場合には、高
周波数成分はほとんど無く、データ量を減少させること
が可能である。The image data in the real space generally changes smoothly, and when converted into the data in the frequency space, there is almost no high frequency component, and the data amount can be reduced.
【0007】図6に示されるブロックデータ102は、
フレームデータに含まれる8×16の画素データで構成
されるデータである。図6に示すように、ブロックデー
タ102には、フィールドデータAに属するる画素デー
タ「Aij」(0≦i、j≦7)と、フィールドデータ
Bに属する画素データ「Bij」(0≦i、j≦7)が
含まれる。The block data 102 shown in FIG.
This is data composed of 8 × 16 pixel data included in the frame data. As shown in FIG. 6, the block data 102 includes pixel data “Aij” (0 ≦ i, j ≦ 7) belonging to the field data A and pixel data “Bij” (0 ≦ i, belonging to the field data B. j ≦ 7) is included.
【0008】実空間の画像データが静止画である場合に
は、図6に示すように、ブロックデータ102を、画素
データAij(0≦i≦7、0≦j≦3)および画素デ
ータBij(0≦i≦7、0≦j≦3)で構成される8
×8画素のブロックデータであるフレームブロックFR
M1と、画素データAij(0≦i≦7、4≦j≦7)
および画素データBij(0≦i≦7、4≦j≦7)で
構成される8×8画素のブロックデータであるフレーム
ブロックFRM2とに分割し、フレームブロックFRM
1およびフレームブロックFRM2についてそれぞれ独
自に2次元8×8DCTを実行する。この場合には、実
空間の画像データが静止画であるため、画素データAi
jと画素データBijとが示すデータには時間的な差が
なく、フレームブロックFRM1内のデータ間およびフ
レームブロックFRM2内のデータ間には密接な相関関
係があり、なめらかであることから、効率の良い圧縮が
可能となる。このような画像圧縮方法において用いられ
るDCTをフレームDCTと呼ぶ。When the image data in the real space is a still image, as shown in FIG. 6, the block data 102 is converted into pixel data Aij (0≤i≤7, 0≤j≤3) and pixel data Bij ( 8 ≦ i ≦ 7, 0 ≦ j ≦ 3) 8
Frame block FR which is block data of × 8 pixels
M1 and pixel data Aij (0 ≦ i ≦ 7, 4 ≦ j ≦ 7)
And a frame block FRM2, which is 8 × 8 pixel block data composed of pixel data Bij (0 ≦ i ≦ 7, 4 ≦ j ≦ 7).
Two-dimensional 8 × 8 DCT is independently executed for 1 and frame block FRM2. In this case, since the image data in the real space is a still image, the pixel data Ai
There is no temporal difference between the data indicated by j and the pixel data Bij, and there is a close correlation between the data in the frame block FRM1 and the data in the frame block FRM2, which is smooth, and Good compression is possible. The DCT used in such an image compression method is called a frame DCT.
【0009】一方、実空間の画像データが激しい動きを
含む動画である場合には、図6に示すようにフレームブ
ロックFRM1およびフレームブロックFRM2に分割
して2次元8×8DCTを実行すると、フレームブロッ
クFRM1およびフレームブロックFRM2を構成する
画素データAijおよび画素データBijのデータ間の
相関関係が低くなり圧縮効率が低下する。従って、実空
間の画像データが激しい動きを含む動画である場合に
は、図7に示すように、ブロックデータ102を、画素
データAij(0≦i≦7、0≦j≦7)で構成される
8×8画素のブロックデータであるフィールドブロック
FLD1と、画素データBij(0≦i≦7、0≦j≦
7)で構成される8×8画素のブロックデータであるフ
ィールドブロックFLD2とに分割し、フィールドブロ
ックFLD1およびフィールドブロックFLD2につい
てそれぞれ独自に2次元8×8DCTを実行する。この
ような画像圧縮方法において用いられるDCTをフィー
ルドDCTと呼ぶ。以下、従来の画像圧縮用DSP(以
下、VDSPと記す)について説明する。従来のVDS
Pは、DCTに比べて計算量が少ないアダマール変換を
用いて、実空間のフレームブロックFRM1、FRM
2、および、フィールドブロックFLD1、FLD2か
ら周波数空間のデータを計算し、この計算結果に基づい
て、フレームDCTとフィールドDCTとによる圧縮効
率の優劣を比較する。On the other hand, when the image data in the real space is a moving image including a violent movement, when the two-dimensional 8 × 8 DCT is executed by dividing the frame block FRM1 and the frame block FRM2 as shown in FIG. The correlation between the pixel data Aij and the pixel data Bij forming the FRM1 and the frame block FRM2 becomes low, and the compression efficiency is lowered. Therefore, when the image data in the real space is a moving image including a vigorous movement, the block data 102 is composed of pixel data Aij (0 ≦ i ≦ 7, 0 ≦ j ≦ 7) as shown in FIG. Field block FLD1 which is block data of 8 × 8 pixels and pixel data Bij (0 ≦ i ≦ 7, 0 ≦ j ≦
It is divided into a field block FLD2 which is block data of 8 × 8 pixels constituted by 7), and the two-dimensional 8 × 8 DCT is independently executed for each of the field block FLD1 and the field block FLD2. The DCT used in such an image compression method is called a field DCT. Hereinafter, a conventional image compression DSP (hereinafter, referred to as VDSP) will be described. Conventional VDS
P uses the Hadamard transform, which requires less calculation than DCT, and uses real space frame blocks FRM1 and FRM.
2, the frequency space data is calculated from the field blocks FLD1 and FLD2, and based on the calculation result, the superiority or inferiority of the compression efficiency between the frame DCT and the field DCT is compared.
【0010】図8は、従来のVDSP41の構成図であ
る。図8に示すように、VDSP41は、64ワードの
ワーキングメモリWM4、WM6、DCT計算回路8、
10、制御回路12、フレーム/フィールドDCT切換
検出回路CMP14で構成される。WM4およびWM6
はバス16を介してフレームメモリFM2と接続され、
WM4およびWM6はバス18を介して接続され、WM
4およびDCT計算回路8はバス20を介して接続さ
れ、WM6およびDCT計算回路10はバス22を介し
て接続され、CMP14はバス24およびバス26を介
してそれぞれWM4およびWM6と接続されている。FIG. 8 is a block diagram of a conventional VDSP 41. As shown in FIG. 8, the VDSP 41 has a 64-word working memory WM4, WM6, a DCT calculation circuit 8,
10, a control circuit 12, and a frame / field DCT switching detection circuit CMP14. WM4 and WM6
Is connected to the frame memory FM2 via the bus 16,
WM4 and WM6 are connected via bus 18 and
4 and DCT calculation circuit 8 are connected via a bus 20, WM6 and DCT calculation circuit 10 are connected via a bus 22, and CMP 14 is connected to WM4 and WM6 via a bus 24 and a bus 26, respectively.
【0011】VDSP41では、フレームDCTを実行
する場合には、DCT計算回路8を用いてフレームブロ
ックFRM1のDCT計算を、DCT計算回路10を用
いてフレームブロックFRM2のDCT計算を実行する
ことで、膨大な計算量を有するDCTの計算を並列的に
実行する。一方、VDSP41では、フィールドDCT
を実行する場合には、DCT計算回路8を用いてフィー
ルドブロックFLD1のDCT計算を、DCT計算回路
10を用いてフィールドブロックFLD2のDCT計算
を実行することで、膨大な計算量を有するDCTの計算
を並列的に実行する。In the VDSP 41, when executing the frame DCT, the DCT calculation circuit 8 is used to perform the DCT calculation of the frame block FRM1, and the DCT calculation circuit 10 is used to perform the DCT calculation of the frame block FRM2, resulting in an enormous amount of data. The DCT calculations having different calculation amounts are executed in parallel. On the other hand, in the VDSP 41, the field DCT
In the case of executing, the DCT calculation circuit 8 is used to perform the DCT calculation of the field block FLD1, and the DCT calculation circuit 10 is used to perform the DCT calculation of the field block FLD2 to calculate the DCT having a huge amount of calculation. Are executed in parallel.
【0012】CMP14では、フレームブロックFRM
1、FRM2およびフィールドブロックFLD1、FL
D2のアダマール変換を実行する。8×8画素の実空間
の画像データ〔X〕を周波数空間のデータ〔C〕にアダ
マール変換する変換式は下記式(3)で定義され、和差
演算のみで近似スペクトルを求めるため、計算量がDC
Tの場合と比べて小さく、CMP14単体で充分に処理
することができる。In the CMP 14, the frame block FRM
1, FRM2 and field blocks FLD1, FL
Perform the Hadamard transform of D2. The conversion formula for Hadamard conversion of the image data [X] in the real space of 8 × 8 pixels into the data [C] in the frequency space is defined by the following formula (3), and the approximate spectrum is obtained only by the sum-difference calculation. Is DC
It is smaller than the case of T and can be sufficiently processed by CMP14 alone.
【0013】[0013]
【数3】 [Equation 3]
【0014】上記式(3)における行列〔H〕は下記式
(4)で定義される。The matrix [H] in the above equation (3) is defined by the following equation (4).
【数4】 [Equation 4]
【0015】図9および図10は、従来のVDSP41
における計算処理のフローチャートである。
ステップS1:制御回路12からFM2、WM4および
WM6に出力される制御信号CS2、CS4、CS6に
基づいて、FM2に記憶された実空間の画像データが図
6に示すような8×16画素データで構成されるブロッ
クデータ102としてバス16を介してVDSP41に
転送される。このとき、ブロックデータ102に含まれ
る画素データのうち、図8のフィールドブロックFLD
1に属する画素データAij(0≦i≦7、0≦j≦
7)がWM4に記憶され、フィールドブロックFLD2
に属する画素データBij(0≦i≦7、0≦j≦7)
がWM6に記憶される。9 and 10 show a conventional VDSP 41.
3 is a flowchart of a calculation process in FIG. Step S1: Based on the control signals CS2, CS4, CS6 output from the control circuit 12 to FM2, WM4 and WM6, the image data in the real space stored in FM2 is 8 × 16 pixel data as shown in FIG. The configured block data 102 is transferred to the VDSP 41 via the bus 16. At this time, of the pixel data included in the block data 102, the field block FLD of FIG.
Pixel data Aij belonging to 1 (0 ≦ i ≦ 7, 0 ≦ j ≦
7) is stored in WM4 and field block FLD2
Pixel data Bij belonging to (0 ≦ i ≦ 7, 0 ≦ j ≦ 7)
Are stored in WM6.
【0016】ステップS2:制御回路12からWM4、
WM6に出力される制御信号CS4、CS6に基づい
て、WM4に記憶された画素データAij(0≦i≦
7、0≦j≦7)がバス24を介してCMP14に出力
され、WM6に記憶された画素データBij(0≦i≦
7、0≦j≦7)がバス26を介してCMP14に出力
される。そして、制御回路12からCMP14に出力さ
れる制御信号CS14に基づいて、CMP14において
上記入力した画素データAij、Bijを用いて、フレ
ームブロックFRM1、FRM2、および、フィールド
ブロックFLD1およびFLD2のアダマール変換が実
行される。Step S2: From the control circuit 12 to WM4,
Based on the control signals CS4 and CS6 output to the WM6, the pixel data Aij (0 ≦ i ≦ stored in the WM4 is stored.
7, 0 ≦ j ≦ 7) is output to the CMP 14 via the bus 24, and the pixel data Bij (0 ≦ i ≦) stored in the WM 6 is stored.
7, 0 ≦ j ≦ 7) is output to the CMP 14 via the bus 26. Then, based on the control signal CS14 output from the control circuit 12 to the CMP14, Hadamard conversion of the frame blocks FRM1 and FRM2 and the field blocks FLD1 and FLD2 is executed using the pixel data Aij and Bij input in the CMP14. To be done.
【0017】ステップS3:ステップS2において実行
されたフィールドブロックFLD1、FLD2に対する
アダマール変換と、フレームブロックFRM1、FRM
2に対するアダマール変換との結果が比較され、DCT
を実行する際に、フィールドDCTとフレームDCTと
の何方が優位であるかが判断される。そして、この判断
結果がフィールドDCTがフレームDCTに比べて優位
であることを示す場合にはステップS7の処理を実行
し、そうでない場合にはステップS4の処理を実行す
る。Step S3: Hadamard transform on the field blocks FLD1 and FLD2 executed in step S2 and the frame blocks FRM1 and FRM.
The results with the Hadamard transform for 2 are compared and the DCT
Is executed, it is determined which of the field DCT and the frame DCT is superior. Then, if the determination result indicates that the field DCT is superior to the frame DCT, the process of step S7 is executed, and if not, the process of step S4 is executed.
【0018】ステップS7:ステップS3におけるフレ
ームDCTが優位である判断された場合に実行される。
このとき、WM4には図8のフィールドブロックFLD
1に属する画素データが記憶されており、図6に示すフ
レームブロックFRM1に属する画素データであるBi
j(0≦i≦7、0≦j≦3)が存在しないため、その
ままではDCT計算回路8においてフレームブロックF
RM1のDCT計算を実行することができない。また、
WM6には図8のフィールドブロックFLD1に属する
画素データが記憶されており、図6に示すフレームブロ
ックFRM2に属する画素データであるAij(0≦i
≦7、4≦j≦7)が存在しないため、そのままではD
CT計算回路10においてフレームブロックFRM2の
DCT計算を実行することができない。Step S7: This is executed when it is determined that the frame DCT in step S3 is superior.
At this time, the field block FLD of FIG.
The pixel data belonging to 1 is stored, and the pixel data belonging to the frame block FRM1 shown in FIG. 6 is Bi.
Since j (0 ≦ i ≦ 7, 0 ≦ j ≦ 3) does not exist, the DCT calculation circuit 8 remains in the frame block F as it is.
Unable to perform DCT calculation of RM1. Also,
Pixel data belonging to the field block FLD1 of FIG. 8 is stored in the WM 6, and Aij (0 ≦ i which is pixel data belonging to the frame block FRM2 of FIG. 6 is stored.
≦ 7, 4 ≦ j ≦ 7) does not exist, so D
The CT calculation circuit 10 cannot execute the DCT calculation of the frame block FRM2.
【0019】そこで、制御回路12からWM4、WM6
に出力される制御信号CS4、CS6に基づいて、バス
18を介して、Bij(0≦i≦7、4≦j≦7)とA
ij(0≦i≦7、0≦j≦3)とのスワップ処理が行
われる。即ち、WM4からWM6に対してAij(0≦
i≦7、4≦j≦7)が転送され、WM6からWM4に
対してBij(0≦i≦7、0≦j≦3)が転送される
ことによって、WM4とWM6との間で32ワードのデ
ータのスワップ処理が行われる。Therefore, from the control circuit 12 to WM4, WM6
Bij (0 ≦ i ≦ 7, 4 ≦ j ≦ 7) and A via the bus 18 based on the control signals CS4 and CS6 output to
Swap processing with ij (0 ≦ i ≦ 7, 0 ≦ j ≦ 3) is performed. That is, Aij (0 ≦
i ≦ 7, 4 ≦ j ≦ 7) is transferred, and Bij (0 ≦ i ≦ 7, 0 ≦ j ≦ 3) is transferred from WM6 to WM4, so that 32 words are transferred between WM4 and WM6. Data is swapped.
【0020】これにより、WM4には図6のフレームブ
ロックFRM1に属する画素データであるAij(0≦
i≦7、0≦j≦3)およびBij(0≦i≦7、0≦
j≦3)が記憶され、ステップS4において、Aijお
よびBijがWM4からバス20を介してDCT計算回
路8に転送され、DCT計算回路8にてフレームブロッ
クFRM1のDCT計算が実行され、計算結果がバス2
0を介してWM4に出力される。同時に、WM6には図
6のフレームブロックFRM2に属する画素データであ
るAij(0≦i≦7、4≦j≦7)およびBij(0
≦i≦7、4≦j≦7)が記憶され、ステップS4にお
いてAijおよびBijがWM6からバス22を介して
DCT計算回路10に転送され、DCT計算回路10に
てフレームブロックFRM2のDCT計算が実行され、
計算結果がバス22を介してWM6に出力される。As a result, the pixel data Aij (0.ltoreq.0.ltoreq.0) which belongs to the frame block FRM1 of FIG.
i ≦ 7, 0 ≦ j ≦ 3) and Bij (0 ≦ i ≦ 7, 0 ≦
j ≦ 3) is stored, and in step S4, Aij and Bij are transferred from the WM 4 to the DCT calculation circuit 8 via the bus 20, and the DCT calculation circuit 8 executes the DCT calculation of the frame block FRM1. Bus 2
It is output to WM4 via 0. At the same time, the pixel data Aij (0 ≦ i ≦ 7, 4 ≦ j ≦ 7) and Bij (0) that belong to the frame block FRM2 of FIG.
.Ltoreq.i.ltoreq.7, 4.ltoreq.j.ltoreq.7) are stored, and in step S4, Aij and Bij are transferred from the WM 6 to the DCT calculation circuit 10 via the bus 22, and the DCT calculation circuit 10 calculates the DCT of the frame block FRM2. Executed,
The calculation result is output to the WM 6 via the bus 22.
【0021】ステップS4:ステップS7が実行された
場合には上述したような処理が実行される。一方、ステ
ップS7が実行されず、ステップS3から直接、ステッ
プS4の処理が実行される場合には、WM4には既に図
8のフィールドブロックFLD1に属する画素データで
あるAij(0≦i≦7、0≦j≦7)が記憶されてい
るので、制御回路12からWM4、DCT計算回路8に
出力される制御信号CS4、CS8に基づいて、WM4
からバス20を介してDCT計算回路8に画素データA
ijが出力され、DCT計算回路8にてフィールドブロ
ックFLD1のDCT計算が実行される。また、WM6
には既に図8のフィールドブロックFLD2に属する画
素データであるBij(0≦i≦7、0≦j≦7)が記
憶されているので、制御回路12からWM6、DCT計
算回路10に出力される制御信号CS6、CS10に基
づいて、WM6からバス22を介してDCT計算回路1
0に画素データBijが出力され、DCT計算回路10
にてフィールドブロックFLD2のDCT計算が実行さ
れる。Step S4: When step S7 is executed, the above-mentioned processing is executed. On the other hand, if step S7 is not executed and the process of step S4 is executed directly from step S3, the pixel data Aij (0 ≦ i ≦ 7, which is pixel data already belonging to the field block FLD1 of FIG. Since 0 ≦ j ≦ 7) is stored, the WM4 based on the control signals CS4 and CS8 output from the control circuit 12 to the WM4 and DCT calculation circuit 8 is stored.
From the pixel data A to the DCT calculation circuit 8 via the bus 20.
ij is output, and the DCT calculation circuit 8 executes the DCT calculation of the field block FLD1. Also, WM6
Since Bij (0 ≦ i ≦ 7, 0 ≦ j ≦ 7) which is the pixel data belonging to the field block FLD2 of FIG. 8 has already been stored in, the control circuit 12 outputs it to the WM6 and the DCT calculation circuit 10. The DCT calculation circuit 1 from the WM 6 via the bus 22 based on the control signals CS6 and CS10.
The pixel data Bij is output to 0, and the DCT calculation circuit 10
At the DCT calculation of the field block FLD2 is executed.
【0022】ステップS5:制御回路12からWM4、
WM6、DCT計算回路8、10に出力される制御信号
CS4、CS6、CS8、CS10に基づいて、ステッ
プS4にてDCT計算回路8、10において計算された
フィールドブロックFLD1、FLD2、あるいは、フ
レームブロックFRM1、FRM2のDCT計算結果が
WM4、6に記憶される。Step S5: From the control circuit 12 to WM4,
The field blocks FLD1, FLD2 or the frame block FRM1 calculated in the DCT calculation circuits 8 and 10 in step S4 based on the control signals CS4, CS6, CS8 and CS10 output to the WM6 and DCT calculation circuits 8 and 10. , FRM2 DCT calculation results are stored in WM4,6.
【0023】ステップS6:制御回路12からFM2、
WM4、WM6に出力される制御信号CS2、CS4、
CS6に基づいて、WM4から上記計算結果が読み出さ
れバス16を介してFM2に出力され、また、WM6か
ら上記計算結果が読み出されバス16を介してFM2に
出力される。Step S6: From the control circuit 12 to FM2,
Control signals CS2, CS4 output to WM4, WM6
Based on CS6, the calculation result is read from WM4 and output to FM2 via bus 16, and the calculation result is read from WM6 and output to FM2 via bus 16.
【0024】図11(A)は図9のステップS3におけ
る判断結果がフィールドDCTがフレームDCTに比べ
て優位であることを示す場合における、VDSP41の
処理時間を説明するための図である。この場合には、図
11(A)に示すように、DCT計算回路8によるフィ
ールドブロックFLD1の処理時間とDCT計算回路1
0によるフィールドブロックFLD2の処理時間とがオ
ーバラップされるため、全体の処理時間は、CMP14
による処理時間とDCT計算回路8によるFLD1の処
理時間との総和である。上述した例では、FM2からバ
ス16を介してWM4にフィールドブロックFLD1に
属する画素データを記憶しWM6にフィールドブロック
FLD2に属する画素データを記憶する場合について述
べたが、WM4にフレームブロックFRM1に属する画
素データを記憶しWM6にフレームブロックFRM2に
属する画素データを記憶する場合には、フィールドDC
Tを実行する際に32ワードのデータのスワップ処理に
費やす時間が必要とされ全体の処理時間が終了するのは
図11(B)に示すように時刻T1になる。FIG. 11A is a diagram for explaining the processing time of the VDSP 41 when the judgment result in step S3 of FIG. 9 indicates that the field DCT is superior to the frame DCT. In this case, as shown in FIG. 11A, the processing time of the field block FLD1 by the DCT calculation circuit 8 and the DCT calculation circuit 1
Since the processing time of the field block FLD2 by 0 overlaps, the total processing time is CMP14.
Is the sum of the processing time of the above and the processing time of the FLD 1 by the DCT calculation circuit 8. In the above example, the case where the pixel data belonging to the field block FLD1 is stored in the WM4 from the FM2 via the bus 16 and the pixel data belonging to the field block FLD2 is stored in the WM6 has been described. However, the pixels belonging to the frame block FRM1 are stored in the WM4. When data is stored and pixel data belonging to the frame block FRM2 is stored in the WM6, the field DC
When T is executed, time is required for swap processing of 32-word data, and the entire processing time ends at time T1 as shown in FIG. 11B.
【0025】図11(B)はステップS3における判断
結果がフレームDCTがフィールドDCTに比べて優位
であることを示す場合における、VDSP41の処理時
間を説明するための図である。この場合には、図11
(B)に示すように、ステップS7における32ワード
のデータのスワップ処理に費やす時間が必要とされるた
め、全体の処理時間は、CMP14による処理時間とス
ワップ処理時間とDCT8によるフレームブロックFR
M1の処理時間との総和となり、処理時間が終了するの
は時刻T1になる。FIG. 11B is a diagram for explaining the processing time of the VDSP 41 when the judgment result in step S3 indicates that the frame DCT is superior to the field DCT. In this case, FIG.
As shown in (B), since the time spent for the swap processing of the 32-word data in step S7 is required, the total processing time is the processing time by the CMP 14, the swap processing time, and the frame block FR by the DCT 8.
It is the sum of the processing time of M1 and the processing time ends at time T1.
【0026】[0026]
【発明が解決しようとする課題】しかし、上述したよう
に従来のVDSP41による計算処理では、WM4とW
M6との間で行われる32ワードのデータのスワップ処
理の有無が図9に示すステップS3の判断結果(フィー
ルドDCTを選択するかフレームDCTを選択するかの
判断結果)に依存するため全体の処理時間が一定でな
く、また、最悪の場合に32ワードのスワップ処理によ
り処理時間が長期化するといった問題がある。However, as described above, in the calculation processing by the conventional VDSP 41, WM4 and W
The presence or absence of the swap processing of 32-word data performed with M6 depends on the determination result of step S3 shown in FIG. 9 (the determination result of whether the field DCT or the frame DCT is selected). There is a problem in that the time is not constant, and in the worst case, the 32-word swap processing prolongs the processing time.
【0027】本発明は、高い画像圧縮効率を得ることを
可能とし、DCT計算時間を短く一定にするこができる
ディジタル演算装置を提供することを目的とする。It is an object of the present invention to provide a digital arithmetic unit capable of obtaining a high image compression efficiency and keeping the DCT calculation time short and constant.
【0028】[0028]
【課題を解決するための手段】上述した従来技術の問題
を解決し、上述した目的を達成するために、本発明のデ
ィジタル演算装置は、第1のフィールドおよび第2のフ
ィールドで構成される実空間の画像フレームデータを
を、同一のフィールドに属する所定数の画素データで構
成される第1のブロック、あるいは、異なるフィールド
に属する前記所定数の画素データで構成される第2のブ
ロックを単位として、周波数空間のデータに変換する第
1の直交変換を行う少なくとも2つの第1の演算手段お
よび第2の演算手段と、前記第1の演算手段に前記画素
データを供給する第1の記憶手段と、前記第2の演算手
段に前記画素データを供給する第2の記憶手段と、前記
第1の記憶手段および前記第2の記憶手段から読み出さ
れた前記画素データを用いて、前記第1のブロックおよ
び前記第2のブロックを単位として、前記第1の直交変
換に比べて計算量の少ない第2の直交変換を実行し、該
実行結果に基づいて、前記第1のブロックおよび前記第
2のブロックのうち、前記画像フレームデータを前記第
1の直交変換する場合より高い圧縮効率を得ることが可
能なブロックを選択する選択手段と、前記選択手段が前
記第1のブロックを選択した場合に前記第1の記憶手段
に記憶される前記第1のフィールドの前記第1のブロッ
クを構成する第1の画素データのうち3/4の数分の前
記第1の画素データと、前記選択手段が前記第2のブロ
ックを選択した場合に前記第1の記憶手段に記憶される
前記第2のブロックを構成する第2の画素データのうち
半分の数分の前記第2の画素データとを前記第1の記憶
手段に初期状態として記憶させ、前記選択手段が前記第
1のブロックを選択した場合に前記第2の記憶手段に記
憶される前記第2のフィールドの前記第1のブロックを
構成する前記第2の画素データのうち3/4の数分の前
記第2の画素データと、前記選択手段が前記第2のブロ
ックを選択した場合に前記第2の記憶手段に記憶される
前記第2のブロックを構成する前記第1の画素データの
うち半分の数分の前記第1の画素データとを前記第2の
記憶手段に初期状態として記憶させ、前記選択手段が前
記第1のブロックを選択した場合に、前記第1の記憶手
段に記憶されている前記第2の画素データを前記第2の
記憶手段に転送し、前記第2の記憶手段に記憶されてい
る前記第1の画素データ を前記第1の記憶手段に転送
し、前記選択手段が前記第2のブロックを選択した場合
に、前記第1の記憶手段に記憶されている前記第1の画
素データのうち前記第2の記憶手段に記憶する前記第2
のブロックを構成する前記第1の画素データを前記第2
の記憶手段に転送し、前記第2の記憶手段に記憶されて
いる前記第2の画素データのうち前記第1の記憶手段に
記憶する前記第2のブロックを構成する前記第2の画素
データを前記第1の記憶手段に転送する記憶制御手段と
を有する。In order to solve the above-mentioned problems of the prior art and to achieve the above-mentioned object, the digital arithmetic unit of the present invention has a first field and a second field.
The image frame data of the real space composed of fields is divided into a first block composed of a predetermined number of pixel data belonging to the same field, or a first block composed of the predetermined number of pixel data belonging to different fields. the second block as a unit, the pixel <br/> at least two of the first arithmetic means and second arithmetic means for performing a first orthogonal transform to convert to data in the frequency space, to the first computing means first storage means for supplying data, a second storage means for supplying the pixel data to said second calculation means, wherein
Read from the first storage means and the second storage means
Using the pixel data thus generated, a second orthogonal transform having a smaller calculation amount than that of the first orthogonal transform is executed in units of the first block and the second block, and the execution result is obtained. Based on the above, based on the first block and the second block, a selection unit that selects a block that can obtain a higher compression efficiency than when the image frame data is subjected to the first orthogonal transformation, and the selection. Means before
The first storage means when the first block is selected
The first block of the first field stored in
3/4 of the first pixel data that makes up the
Note that the first pixel data and the selection means are the second block data.
Stored in the first storage means when the user selects
Of the second pixel data forming the second block,
Half the number of the second pixel data and the first storage
Means for storing the initial state, and the selecting means stores the first state.
When the block 1 is selected, it is recorded in the second storage means.
The first block of the second field stored
Before the number of 3/4 of the second pixel data that constitutes
Note that the second pixel data and the selection means are the second block data.
Is stored in the second storage means when the user selects
Of the first pixel data forming the second block,
Half the number of the first pixel data and the second pixel data
The storage means stores the initial state, and the selection means
When the first block is selected, the first memory
The second pixel data stored in the column
Is transferred to the storage means and stored in the second storage means.
Transfer the first pixel data to the first storage means.
And when the selecting means selects the second block
The first image stored in the first storage means.
Of the raw data, the second data stored in the second storage means
The first pixel data forming the block of
Stored in the second storage means and stored in the second storage means.
In the first storage means of the second pixel data
The second pixel forming the second block to be stored
Storage control means for transferring data to the first storage means .
【0029】本発明のディジタル演算装置では、上述し
たように、第1の記憶手段と第2の記憶手段とに、前記
第1のブロックおよび前記第2のブロックに属するデー
タを前記第1のブロックおよび前記第2のブロックのい
ずれが選択される場合にも、前記第1の記憶手段と前記
第2の記憶手段との間におけるデータ交換量が等しくな
るように記憶するため、前記第1の演算手段および前記
第2の演算手段にていずれのブロックを単位とした演算
を行う場合にも、前記第1の記憶手段と前記第2の記憶
手段との間でデータの交換を行うことが必要となるが、
DCT計算に費やす時間を一定にすることができる。In the digital arithmetic unit of the present invention, as described above, the data belonging to the first block and the second block are stored in the first block and the second block. In either case of selecting the second block and the second block, the first arithmetic operation is performed so that the data exchange amounts between the first storage means and the second storage means are equal to each other. It is necessary to exchange data between the first storage means and the second storage means regardless of which block is used as the unit by the means and the second calculation means. But
The time spent in DCT calculation can be constant.
【0030】[0030]
【作用】本発明のディジタル演算装置では、記憶制御手
段の制御に基づいて、第1の記憶手段および第2の記憶
手段に初期状態として、第1のブロックおよび前記第2
のブロックのいずれが選択される場合にも、前記第1の
記憶手段と前記第2の記憶手段との間におけるデータ交
換量が等しくなるようにデータが記憶される。In the digital arithmetic unit of the present invention, the first block and the second block are initialized to the first storage means and the second storage means under the control of the storage control means.
Regardless of which block is selected, the data is stored such that the amount of data exchanged between the first storage means and the second storage means becomes equal.
【0031】そして、決定手段にて、画像フレームデー
タを同一のフィールドに属する所定の複数のデータで構
成される第1のブロック、および、異なるフィールドに
属する所定の複数のデータで構成される第2のブロック
を単位として、第1の直交変換に比べて計算量の少ない
第2の直交変換が実行され、該実行結果に基づいて、前
記第1のブロックおよび前記第2のブロックのうち、前
記画像フレームに関するデータを前記第1の直交変換す
る場合に、高い圧縮効率を得ることが可能な直交変換を
行うブロックが決定される。Then, the determining means sets the image frame data to a first block composed of a plurality of predetermined data belonging to the same field and a second block composed of a plurality of predetermined data belonging to different fields. The second orthogonal transform having a smaller calculation amount than that of the first orthogonal transform is executed in the unit of the block, and the image of the first block and the second block is calculated based on the execution result. When the first orthogonal transform is performed on the data related to the frame, a block for performing the orthogonal transform that can obtain high compression efficiency is determined.
【0032】そして、記憶制御手段の制御に基づいて、
前記決定手段にて決定された前記直交変換を行う単位の
データが、前記第1の記憶手段および前記第2の記憶手
段に記憶されるように、前記第1の記憶手段と前記第2
の記憶手段との間でデータの交換が実行される。Then, based on the control of the storage control means,
The first storage means and the second storage means are arranged so that the data of the unit for performing the orthogonal transformation determined by the determination means is stored in the first storage means and the second storage means.
Data is exchanged with the storage means.
【0033】そして、前記第1の記憶手段および前記第
2の記憶手段に記憶されたデータが前記第1の演算装置
および前記第2の演算装置にそれぞれ供給され、この供
給されたデータを用いて、前記第1の演算装置および前
記第2の演算装置にて第1の直交変換が実行される。Then, the data stored in the first storage means and the second storage means are supplied to the first arithmetic unit and the second arithmetic unit, respectively, and the supplied data is used. The first orthogonal transform is executed by the first arithmetic unit and the second arithmetic unit.
【0034】[0034]
【実施例】【Example】
【0035】本発明のディジタル演算装置の一実施例と
してのVDSPについて説明する。本実施例のVDSP
は、全体の処理時間が一定で、しかも、最長の処理時間
の短縮化が可能なディジタル演算装置である。図1は、
本実施例のVDSP1の構成図である。図1に示すVD
SP1は、図8に示す従来のVDSP41と同一の構成
であるが、WM44およびWM46に初期状態として記
憶されるデータ、および、計算処理の手順がVDSP4
1とは異なる。A VDSP as an embodiment of the digital arithmetic unit of the present invention will be described. VDSP of this embodiment
Is a digital arithmetic device with a constant overall processing time and capable of shortening the longest processing time. Figure 1
It is a block diagram of VDSP1 of the present embodiment. VD shown in FIG.
SP1 has the same configuration as the conventional VDSP 41 shown in FIG. 8, but the data stored as an initial state in the WM 44 and WM 46 and the procedure of the calculation processing are VDSP 4
Different from 1.
【0036】本実施例のVDSP1では、従来のVDS
P41と同様に、FM2に記憶された実空間の画像デー
タが図6に示すような8×16の画素データで構成され
るブロックデータ102としてバス16を介して入力さ
れ、このブロックデータ102が図1に示すブロックデ
ータ30とブロックデータ32とに分割されて、ブロッ
クデータ30がWM44に初期状態として記憶され、ブ
ロックデータ32がWM46に初期状態として記憶され
る。In the VDSP 1 of this embodiment, the conventional VDS is used.
Similar to P41, the image data in the real space stored in the FM2 is input via the bus 16 as the block data 102 composed of 8 × 16 pixel data as shown in FIG. 1 is divided into block data 30 and block data 32, the block data 30 is stored in the WM 44 as an initial state, and the block data 32 is stored in the WM 46 as an initial state.
【0037】図1に示すように、ブロックデータ30に
は画素データであるAij(0≦i≦7、0≦j≦5)
およびBij(0≦i≦7、2≦j≦3)が属する。ま
た、ブロックデータ32には画素データであるAij
(0≦i≦7、6≦j≦7)およびBij(0≦i≦
7、0≦j≦1、4≦j≦7)が属する。As shown in FIG. 1, the block data 30 includes pixel data Aij (0≤i≤7, 0≤j≤5).
And Bij (0 ≦ i ≦ 7, 2 ≦ j ≦ 3) belong. In addition, the block data 32 includes Aij which is pixel data.
(0 ≦ i ≦ 7, 6 ≦ j ≦ 7) and Bij (0 ≦ i ≦
7, 0 ≦ j ≦ 1, 4 ≦ j ≦ 7) belongs.
【0038】このようにブロックデータ30、32を構
成したのは、フィールドDCTおよびフレームDCTの
どちらを実行する場合においても、WM44とWM46
との間で行われるデータ交換量を等しくすることで処理
時間を一定にし、また、データ交換量を従来のVDSP
41の場合の32ワード以下に抑えることで、全体の処
理時間を従来の最悪の場合よりも短縮するためである。The block data 30 and 32 are configured as described above, regardless of whether the field DCT or the frame DCT is executed.
The processing time is made constant by equalizing the amount of data exchange between the VDSP and the conventional VDSP.
This is because the total processing time can be shortened as compared with the worst case of the related art by suppressing the number of words to 32 or less in the case of 41.
【0039】つまり、CMP14における判断結果がフ
ィールドDCTの方がフレームDCTより優れているこ
とを示す場合には、WM44およびWM46の間におい
て、WM44からWM46に対してBij(0≦i≦
7、2≦j≦3)を転送し、WM46からWM44に対
してAij(0≦i≦7、6≦j≦7)を転送すればよ
く、スワップ処理の対象とされるデータ量は16ワード
である。一方、CMP14における判断結果がフレーム
DCTの方がフィールドDCTより優れていることを示
す場合には、WM44およびWM46の間において、W
M44からWM46に対してAij(0≦i≦7、4≦
j≦5)を転送し、WM46からWM44に対してBi
j(0≦i≦7、0≦j≦1)を転送すればよく、スワ
ップ処理の対象とされるデータ量は16ワードである。
従って、フィールドDCTおよびフレームDCTのどち
らが選択された場合においても、スワップ転送の対象と
されるデータ量は16ワードであり、前述した従来のV
DSP41の場合の32ワード以下に抑えることがで
き、WM44およびWM46の間において行われる最長
のスワップ処理時間を短縮し、VDSP41における最
長の処理時間を短縮することができる。That is, when the determination result in the CMP 14 indicates that the field DCT is superior to the frame DCT, Bij (0 ≦ i ≦) between the WM 44 and the WM 46 with respect to the WM 44 to the WM 46.
7, 2 ≦ j ≦ 3) and Aij (0 ≦ i ≦ 7, 6 ≦ j ≦ 7) from the WM 46 to the WM 44. The data amount to be swapped is 16 words. Is. On the other hand, when the determination result in the CMP 14 indicates that the frame DCT is superior to the field DCT, the W between the WM 44 and the WM 46 is
From A44 to WM46, Aij (0 ≦ i ≦ 7, 4 ≦
j ≦ 5) and transfers Bi from WM46 to WM44
It is sufficient to transfer j (0 ≦ i ≦ 7, 0 ≦ j ≦ 1), and the amount of data to be swapped is 16 words.
Therefore, regardless of whether the field DCT or the frame DCT is selected, the amount of data to be swap-transferred is 16 words, which is the same as the conventional V
It can be suppressed to 32 words or less in the case of the DSP 41, the longest swap processing time performed between the WM 44 and the WM 46 can be shortened, and the longest processing time in the VDSP 41 can be shortened.
【0040】以下、本実施例のVDSP1における計算
処理の手順について説明する。図2および図3はVDS
P1における計算処理のフローチャートである。
ステップS11:制御回路12からFM2、WM44お
よびWM46に出力される制御信号CS2、CS44、
CS46に基づいて、FM2から画素データAij(0
≦i≦7、0≦j≦7)を読み出し、バス16を介し
て、WM44に画素データAij(0≦i≦7、0≦j
≦5)を初期状態として記憶させ、WM46に画素デー
タAij(0≦i≦7、6≦j≦7)を初期状態として
記憶させる。
ステップS12:制御回路12からFM2、WM44お
よびWM46に出力される制御信号CS2、CS44、
CS46に基づいて、FM2から画素データBij(0
≦i≦7、0≦j≦7)を読み出し、バス16を介し
て、WM46に画素データBij(0≦i≦7、2≦j
≦3)を初期状態として記憶させ、WM46に画素デー
タAij(0≦i≦7、0≦j≦1、4≦j≦7)を初
期状態として記憶させる。すなわち、ステップS12の
終了時には、図1に示すブロックデータ30が初期状態
としてWM44に記憶され、ブロックデータ32が初期
状態としてWM46に記憶されている。The procedure of calculation processing in the VDSP 1 of this embodiment will be described below. 2 and 3 are VDS
It is a flowchart of the calculation process in P1. Step S11: Control signals CS2, CS44 output from the control circuit 12 to the FM2, WM44 and WM46,
Based on CS46, the pixel data Aij (0
≦ i ≦ 7, 0 ≦ j ≦ 7) is read out, and the pixel data Aij (0 ≦ i ≦ 7, 0 ≦ j is transferred to the WM 44 via the bus 16.
≦ 5) is stored as an initial state, and the pixel data Aij (0 ≦ i ≦ 7, 6 ≦ j ≦ 7) is stored in the WM 46 as an initial state. Step S12: Control signals CS2, CS44 output from the control circuit 12 to the FM2, WM44 and WM46,
Based on CS46, the pixel data Bij (0
≦ i ≦ 7, 0 ≦ j ≦ 7) is read, and the pixel data Bij (0 ≦ i ≦ 7, 2 ≦ j) is transferred to the WM 46 via the bus 16.
≦ 3) is stored as an initial state, and the pixel data Aij (0 ≦ i ≦ 7, 0 ≦ j ≦ 1, 4 ≦ j ≦ 7) is stored in the WM 46 as an initial state. That is, at the end of step S12, the block data 30 shown in FIG. 1 is stored in the WM 44 as the initial state, and the block data 32 is stored in the WM 46 as the initial state.
【0041】ステップS13:制御回路12からWM4
4、WM46、CMP14に出力される制御信号CS4
4、46、14に基づいて、WM44およびWM46か
ら図1に示すブロックデータ30およびブロックデータ
32に属する画素データAij、Bijがバス24およ
びバス26を介してCMP14に出力される。そして、
CMP14にて、画素データAij、Bijを用いて、
前述した図6に示すフレームブロックFRM1、FRM
2、および、図7に示すフィールドブロックFLD1、
FLD2を単位としたアダマール変換が実行される。Step S13: Control circuit 12 to WM4
4, control signal CS4 output to WM46 and CMP14
Based on 4, 46 and 14, the pixel data Aij and Bij belonging to the block data 30 and the block data 32 shown in FIG. 1 are output from the WM 44 and WM 46 to the CMP 14 via the bus 24 and the bus 26. And
In the CMP 14, using the pixel data Aij and Bij,
The frame blocks FRM1 and FRM shown in FIG. 6 described above.
2 and the field block FLD1 shown in FIG.
The Hadamard transform is performed in units of FLD2.
【0042】ステップS14:ステップS13にて実行
された、フィールドブロックFLD1、FLD2を単位
としたアダマール変換と、フレームブロックFRM1、
FRM2を単位としたアダマール変換との結果に基づい
て、フィールドDCTとフレームDCTのどちらが優位
であるかが判断される。そして、その判断結果がフィー
ルドDCTがフレームDCTに比べて優位であることを
示す場合にはステップS15の処理が実行され、そうで
ない場合にはステップS19の処理が実行される。Step S14: Hadamard transform in units of the field blocks FLD1 and FLD2 executed in step S13 and the frame block FRM1,
Based on the result of the Hadamard transform in FRM2 as a unit, it is determined which of the field DCT and the frame DCT is superior. Then, if the determination result indicates that the field DCT is superior to the frame DCT, the process of step S15 is executed, and if not, the process of step S19 is executed.
【0043】ステップS15:後述するステップS16
においてフィールドDCTを行うために必要なデータを
WM44およびWM46に記憶させるための処理を行
う。すなわち、WM44には図1のブロックデータ30
に属する画素データが記憶されており、図7のフィール
ドブロックFLD1に属する画素データであるAij
(0≦i≦7、6≦j≦7)が存在しないため、そのま
まではDCT計算回路8においてフィールドブロックF
LD1のDCT計算を実行することができない。また、
WM46には図1のブロックデータ32に属する画素デ
ータが記憶されており、図7に示すフィールドブロック
FLD2に属する画素データであるBij(0≦i≦
7、2≦j≦3)が存在しないため、そのままではDC
T計算回路10においてフィールドブロックFLD2の
DCT計算を実行することができない。Step S15: Step S16 described later
In step 1, processing for storing data necessary for performing the field DCT in the WM 44 and the WM 46 is performed. That is, the block data 30 of FIG.
Pixel data belonging to the field block FLD1 shown in FIG. 7 is stored.
Since (0 ≦ i ≦ 7, 6 ≦ j ≦ 7) does not exist, the DCT calculation circuit 8 directly leaves the field block F
The DCT calculation of LD1 cannot be performed. Also,
Pixel data belonging to the block data 32 of FIG. 1 is stored in the WM 46, and Bij (0 ≦ i ≦ which is pixel data belonging to the field block FLD2 shown in FIG. 7 is stored.
7, 2 ≦ j ≦ 3) does not exist, so DC
The DCT calculation of the field block FLD2 cannot be executed in the T calculation circuit 10.
【0044】そこで、制御回路12からWM44、WM
46に出力される制御信号CS44、46に基づいて、
バス18を介して、Aij(0≦i≦7、6≦j≦7)
とBij(0≦i≦7、2≦j≦3)とのスワップ処理
を行う。即ち、WM44からWM46に対してBij
(0≦i≦7、2≦j≦3)を転送し、WM46からW
M44に対してAij(0≦i≦7、6≦j≦7)を転
送することによって、WM44とWM46との間で16
ワードのデータスワップ処理を行う。Therefore, from the control circuit 12 to WM44, WM
Based on the control signals CS44, 46 output to 46,
Aij (0 ≦ i ≦ 7, 6 ≦ j ≦ 7) via the bus 18
And Bij (0 ≦ i ≦ 7, 2 ≦ j ≦ 3) are swapped. That is, from WM44 to WM46, Bij
(0 ≦ i ≦ 7, 2 ≦ j ≦ 3) is transferred, and WM46 sends W
By transferring Aij (0 ≦ i ≦ 7, 6 ≦ j ≦ 7) to the M44, 16 between the WM44 and the WM46.
Perform word data swap processing.
【0045】これにより、WM44には図7のフィール
ドブロックFLD1に属する画素データであるAij
(0≦i≦7、0≦j≦7)が記憶され、同時に、WM
46には図7のフィールドブロックFLD2に属する画
素データであるBij(0≦i≦7、0≦j≦7)が記
憶される。As a result, the pixel data Aij belonging to the field block FLD1 of FIG. 7 is stored in the WM 44.
(0 ≦ i ≦ 7, 0 ≦ j ≦ 7) is stored, and at the same time, the WM
Bij (0 ≦ i ≦ 7, 0 ≦ j ≦ 7), which is pixel data belonging to the field block FLD2 of FIG. 7, is stored in 46.
【0046】ステップS19:後述するステップS16
においてフレームDCTを行うために必要なデータをW
M44およびWM46に記憶させるための処理を行う。
すなわち、WM44には図1のブロックデータ30に属
する画素データが記憶されており、図6のフレームブロ
ックFRM1に属する画素データであるBij(0≦i
≦7、0≦j≦1)が存在しないため、そのままではD
CT計算回路8においてフレームブロックFRM1のD
CT計算を実行することができない。また、WM46に
は図1のブロックデータ32に属する画素データが記憶
されており、図6に示すフレームブロックFRM2に属
する画素データであるAij(0≦i≦7、4≦j≦
5)が存在しないため、そのままではDCT計算回路1
0においてフレームブロックFLD2のDCT計算を実
行することができない。Step S19: Step S16 described later
Data required for performing frame DCT in W
Processing for storing in M44 and WM46 is performed.
That is, the pixel data belonging to the block data 30 of FIG. 1 is stored in the WM 44, and Bij (0 ≦ i) which is the pixel data belonging to the frame block FRM1 of FIG.
≦ 7, 0 ≦ j ≦ 1) does not exist, so D
D of the frame block FRM1 in the CT calculation circuit 8
Unable to perform CT calculation. Pixel data belonging to the block data 32 of FIG. 1 is stored in the WM 46, and Aij (0 ≦ i ≦ 7, 4 ≦ j ≦, which is pixel data belonging to the frame block FRM2 shown in FIG.
Since 5) does not exist, the DCT calculation circuit 1 remains as it is.
At 0, the DCT calculation of frame block FLD2 cannot be performed.
【0047】そこで、制御回路12からWM44、WM
46に出力される制御信号CS44、CS46に基づい
て、バス18を介して、Bij(0≦i≦7、0≦j≦
1)とAij(0≦i≦7、4≦j≦5)とのスワップ
処理を行う。即ち、WM44からWM46に対してAi
j(0≦i≦7、4≦j≦5)を転送し、WM46から
WM44に対してBij(0≦i≦7、0≦j≦1)を
転送することによって、WM44とWM46との間で1
6ワードのデータスワップ処理を行う。Therefore, from the control circuit 12 to WM44, WM
Bij (0 ≦ i ≦ 7, 0 ≦ j ≦ based on the control signals CS44 and CS46 output to the bus 46 via the bus 18.
1) and Aij (0 ≦ i ≦ 7, 4 ≦ j ≦ 5) are swapped. That is, Ai from WM44 to WM46
j (0 ≦ i ≦ 7, 4 ≦ j ≦ 5) is transferred, and Bij (0 ≦ i ≦ 7, 0 ≦ j ≦ 1) is transferred from the WM 46 to the WM 44, so that between the WM 44 and the WM 46. In 1
6-word data swap processing is performed.
【0048】これにより、WM44には図6のフレーム
ブロックFRM1に属する画素データであるAij(0
≦i≦7、0≦j≦3)およびBij(0≦i≦7、0
≦j≦3)が記憶され、同時に、WM46には図6のフ
レームブロックFRM2に属する画素データであるAi
j(0≦i≦7、4≦j≦7)およびBij(0≦i≦
7、4≦j≦7)が記憶される。As a result, the pixel data Aij (0) belonging to the frame block FRM1 shown in FIG. 6 is stored in the WM 44.
≤ i ≤ 7, 0 ≤ j ≤ 3) and Bij (0 ≤ i ≤ 7, 0)
.Ltoreq.j.ltoreq.3) is stored, and at the same time, the WM 46 has pixel data Ai belonging to the frame block FRM2 of FIG.
j (0 ≦ i ≦ 7, 4 ≦ j ≦ 7) and Bij (0 ≦ i ≦
7, 4 ≦ j ≦ 7) is stored.
【0049】ステップS16:制御回路12からWM4
4、DCT計算回路8に出力される制御信号CS44、
CS8に基づいて、WM44からバス20を介して画素
データがDCT計算回路8に出力され、DCT計算回路
8にてDCT計算が実行される。また、同時に、WM4
6からバス22を介して画素データがDCT計算回路1
0に出力され、DCT計算回路10にてDCT計算が実
行される。Step S16: From the control circuit 12 to WM4
4, the control signal CS44 output to the DCT calculation circuit 8,
Based on CS8, pixel data is output from the WM 44 to the DCT calculation circuit 8 via the bus 20, and the DCT calculation circuit 8 executes DCT calculation. At the same time, WM4
6 from the DCT calculation circuit 1 via the bus 22
It is output to 0, and the DCT calculation circuit 10 executes the DCT calculation.
【0050】このとき、ステップS15が実行された場
合には、WM44には図7のフレームブロックFLD1
に属する画素データであるAij(0≦i≦7、0≦j
≦7)が記憶され、同時に、WM46には図7のフレー
ムブロックFLD2に属する画素データであるBij
(0≦i≦7、0≦j≦7)が記憶されているため、こ
れらの画素データがDCT計算回路8、10に出力さ
れ、DCT計算回路8、10にて、フィールドDCTが
実行される。At this time, if step S15 is executed, the frame block FLD1 shown in FIG.
Which is pixel data belonging to Aij (0 ≦ i ≦ 7, 0 ≦ j
≦ 7) is stored, and at the same time, WM, which is pixel data belonging to the frame block FLD2 of FIG. 7, is stored in the WM 46.
Since (0 ≦ i ≦ 7, 0 ≦ j ≦ 7) is stored, these pixel data are output to the DCT calculation circuits 8 and 10, and the DCT calculation circuits 8 and 10 execute the field DCT. .
【0051】一方、ステップS19が実行された場合に
は、WM44には図6のフレームブロックFRM1に属
する画素データであるAij(0≦i≦7、0≦j≦
3)およびBij(0≦i≦7、0≦j≦3)が記憶さ
れ、同時に、WM46には図6のフレームブロックFR
M2に属する画素データであるAij(0≦i≦7、4
≦j≦7)およびBij(0≦i≦7、4≦j≦7)が
記憶されているため、これらの画素データがDCT計算
回路8、10に出力され、DCT計算回路8、10に
て、フレームDCTが実行される。On the other hand, when step S19 is executed, the WM 44 has pixel data Aij (0≤i≤7, 0≤j≤) which is pixel data belonging to the frame block FRM1 of FIG.
3) and Bij (0 ≦ i ≦ 7, 0 ≦ j ≦ 3) are stored, and at the same time, the frame block FR of FIG.
Aij (0 ≦ i ≦ 7, 4 which is pixel data belonging to M2
.Ltoreq.j.ltoreq.7) and Bij (0.ltoreq.i.ltoreq.7, 4.ltoreq.j.ltoreq.7) are stored, so these pixel data are output to the DCT calculation circuits 8 and 10, and the DCT calculation circuits 8 and 10 respectively. , The frame DCT is executed.
【0052】ステップS17:制御回路12からWM4
4、WM46、DCT計算回路8、10に出力される制
御信号CS44、CS46、CS8、CS10に基づい
て、ステップS4にてDCT計算回路8、10において
計算されたフィールドブロックFLD1、FLD2、あ
るいは、フレームブロックFRM1、FRM2のDCT
計算結果がWM4、6に記憶される。Step S17: From the control circuit 12 to WM4
4, the field block FLD1, FLD2 or the frame calculated in the DCT calculation circuits 8 and 10 in step S4 based on the control signals CS44, CS46, CS8 and CS10 output to the WM46 and the DCT calculation circuits 8 and 10, respectively. DCT of blocks FRM1 and FRM2
The calculation result is stored in the WMs 4 and 6.
【0053】ステップS18:制御回路12からFM
2、WM44、WM46に出力される制御信号CS2、
CS44、CS46に基づいて、WM44から上記計算
結果が読み出されバス16を介してFM2に出力され、
また、WM46から上記計算結果が読み出されバス16
を介してFM2に出力される。Step S18: FM from the control circuit 12
2, control signal CS2 output to WM44, WM46,
Based on CS44 and CS46, the above calculation result is read from the WM44 and output to the FM2 via the bus 16.
In addition, the above calculation result is read from the WM 46 and the bus 16
Is output to FM2 via.
【0054】図4(A)はステップS14における判断
結果がフィールドDCTがフレームDCTに比べて優位
であることを示す場合における、VDSP1の処理時間
を説明するための図である。この場合には、図4(A)
に示すように、図11に示す従来のVDSP41の場合
と同様にDCT計算回路8によるフレームブロックFL
D1の処理時間とDCT計算回路10によるフレームブ
ロックFLD2の処理時間とがオーバラップされ、ま
た、ステップS15におけるWM44とWM46との間
の16ワードのデータスワップ処理に費やす処理時間が
必要となるため、全体の処理時間は、CMPによる処理
時間とスワップ処理時間とDCT計算回路8によるフィ
ールドブロックFLD1の処理時間との総和である。従
って、この場合におけるVDSP1の全体の処理時間
は、図11(A)に示す従来のVDSP41の全体の処
理時間よりは長くなるが、図11(B)に示す最悪の場
合の処理時間よりは短くなる。FIG. 4A is a diagram for explaining the processing time of the VDSP 1 when the determination result in step S14 indicates that the field DCT is superior to the frame DCT. In this case, FIG. 4 (A)
As shown in FIG. 11, as in the case of the conventional VDSP 41 shown in FIG.
Since the processing time of D1 and the processing time of the frame block FLD2 by the DCT calculation circuit 10 overlap, and the processing time spent for the data swap processing of 16 words between the WM44 and WM46 in step S15 is required. The total processing time is the sum of the processing time of CMP, the swap processing time, and the processing time of the field block FLD1 by the DCT calculation circuit 8. Therefore, the overall processing time of the VDSP 1 in this case is longer than the overall processing time of the conventional VDSP 41 shown in FIG. 11 (A), but shorter than the worst case processing time shown in FIG. 11 (B). Become.
【0055】一方、図4(B)はステップS14におけ
る判断結果がフレームDCTがフィールドDCTに比べ
て優位であることを示す場合における、VDSP1の処
理時間を説明するための図である。この場合には、図4
(B)に示すように、従来のVDSP41の場合と同様
にDCT計算回路8によるフィールドブロックFLD1
の処理時間とDCT計算回路10によるフィールドブロ
ックFLD2の処理時間とがオーバラップされ、また、
ステップS19におけるWM44とWM46との間の1
6ワードのデータスワップ処理に費やす処理時間が必要
となるため、全体の処理時間は、CMP14による処理
時間とスワップ処理時間とDCT計算回路8によるフィ
ールドブロックFLD1の処理時間との総和である。従
って、この場合におけるVDSP1の全体の処理時間
は、16ワードのスワップ処理時間が32ワードのスワ
ップ処理時間に比べて短いことから、図11(B)に示
す従来のVDSP41の全体の処理時間に比べて短くな
る。On the other hand, FIG. 4B is a diagram for explaining the processing time of the VDSP 1 when the judgment result in step S14 shows that the frame DCT is superior to the field DCT. In this case,
As shown in (B), as in the case of the conventional VDSP 41, the field block FLD1 by the DCT calculation circuit 8 is used.
And the processing time of the field block FLD2 by the DCT calculation circuit 10 overlap, and
1 between WM44 and WM46 in step S19
Since the processing time spent for the 6-word data swap processing is required, the total processing time is the sum of the processing time by the CMP 14, the swap processing time, and the processing time of the field block FLD1 by the DCT calculation circuit 8. Therefore, the overall processing time of the VDSP 1 in this case is shorter than the swap processing time of 16 words as compared with the swap processing time of 32 words, and therefore compared with the overall processing time of the conventional VDSP 41 shown in FIG. Becomes shorter.
【0056】その結果、VDSP1では、ステップS1
4においてフィールドDCTおよびフレームDCTのい
ずれが選択された場合であっても全体の処理時間は一定
となり、しかも、従来のVDSP41における最長の処
理時間より短くなる。本実施例のVDSP1では、一般
的に、従来技術にて説明したように、実空間の画像デー
タが静止画などの動きの少ない画像に関するものであれ
ばフレームDCTが選択され、実空間の画像データが激
しい動きを含む動画に関するものであればフィールドD
CTが選択される。As a result, in VDSP1, step S1
Regardless of whether the field DCT or the frame DCT is selected in 4, the entire processing time becomes constant and is shorter than the longest processing time in the conventional VDSP 41. In the VDSP 1 of the present embodiment, generally, as described in the related art, if the image data in the real space relates to an image with a small motion such as a still image, the frame DCT is selected, and the image data in the real space is selected. Field D if the video is about a moving image
CT is selected.
【0057】本実施例のVDSP1によれば、フィール
ドDCTおよびフレームDCTのどちらを実行する場合
にも、WM44とWM46との間で16ワードのデータ
スワップ処理を行えばよく、従来のVDSP41の場合
のようにWM44とWM46との間で32ワードのデー
タスワップ処理を行うことはなく、最長の処理時間を短
縮することができる。また、本実施例のVDSP1によ
れば、フィールドDCTおよびフレームDCTのどちら
を実行する場合にも、その処理時間は一定であるため、
VDSP1の処理結果を用いてその後の処理を行う場合
に、その処理の制御が行いやすくなる。According to the VDSP 1 of this embodiment, a 16-word data swap process may be performed between the WM 44 and the WM 46 regardless of whether the field DCT or the frame DCT is executed. As described above, the 32-word data swap processing is not performed between the WM 44 and the WM 46, and the maximum processing time can be shortened. Further, according to the VDSP 1 of the present embodiment, the processing time is constant regardless of whether the field DCT or the frame DCT is executed.
When the subsequent processing is performed using the processing result of the VDSP 1, the processing can be easily controlled.
【発明の効果】本発明のディジタル演算装置によれば、
第1のブロックおよび第2のブロックのどちらを単位と
して、直交変換を実行する場合にも、第1の記憶手段と
第2の記憶手段との間で交換の対象とするデータ量は等
しく、しかも、比較的小さいため、データ交換に費やす
時間を一定に短くすることができる。その結果、本発明
のディジタル演算装置によれば、最長の処理時間を短縮
することができ、その処理結果を用いてその後の処理を
行う場合に、処理の制御が行い易くなる。 According to the digital arithmetic unit of the present invention,
When performing orthogonal transformation using either the first block or the second block as a unit, the first storage means and the second storage means have the same data amount to be exchanged, and Since the size is relatively small, the time spent for data exchange can be shortened to a constant value. As a result, according to the digital arithmetic unit of the present invention, the longest processing time can be shortened, and when the subsequent processing is performed using the processing result, the processing can be easily controlled .
【図1】本発明のディジタル演算装置の一実施例に係わ
るVDSPの構成図である。FIG. 1 is a configuration diagram of a VDSP according to an embodiment of a digital arithmetic unit of the present invention.
【図2】図1に示すVDSPにおける計算処理のフロー
チャートである。FIG. 2 is a flowchart of a calculation process in the VDSP shown in FIG.
【図3】図1に示すVDSPにおける計算処理のフロー
チャートである。FIG. 3 is a flowchart of a calculation process in the VDSP shown in FIG.
【図4】図1に示すVDSPの処理時間を説明するため
の図である。FIG. 4 is a diagram for explaining a processing time of the VDSP shown in FIG.
【図5】画像フレームデータを説明するための図であ
る。FIG. 5 is a diagram for explaining image frame data.
【図6】フレームDCTを説明するための図である。FIG. 6 is a diagram for explaining a frame DCT.
【図7】フィールドDCTを説明するための図である。FIG. 7 is a diagram for explaining a field DCT.
【図8】従来のVDSPの構成図である。FIG. 8 is a block diagram of a conventional VDSP.
【図9】図8に示すVDSPにおける計算処理のフロー
チャートである。9 is a flowchart of a calculation process in the VDSP shown in FIG.
【図10】図8に示すVDSPにおける計算処理のフロ
ーチャートである。10 is a flowchart of a calculation process in the VDSP shown in FIG.
【図11】図8に示すVDSPの処理時間を説明するた
めの図である。FIG. 11 is a diagram for explaining a processing time of the VDSP shown in FIG.
1・・・VDSP
2・・・FM(フレームメモリ)
4、6、44、46・・・WM(64ワードワーキング
メモリ)
8、10・・・DCT計算回路
12・・・制御回路
14・・・CMP(フレーム/フィールドDCT切換検
出回路)
16、18、20、22、24、26・・・バス
FRM1、FRM2・・・フレームブロック
FLD1、FLD2・・・フィールドブロック1 ... VDSP 2 ... FM (frame memory) 4, 6, 44, 46 ... WM (64-word working memory) 8, 10 ... DCT calculation circuit 12 ... Control circuit 14 ... CMP (frame / field DCT switching detection circuit) 16, 18, 20, 22, 24, 26 ... Bus FRM1, FRM2 ... Frame block FLD1, FLD2 ... Field block
Claims (2)
で構成される実空間の画像フレームデータを、同一のフ
ィールドに属する所定数の画素データで構成される第1
のブロック、あるいは、異なるフィールドに属する前記
所定数の画素データで構成される第2のブロックを単位
として、周波数空間のデータに変換する第1の直交変換
を行う少なくとも2つの第1の演算手段および第2の演
算手段と、 前記第1の演算手段に前記画素データを供給する第1の
記憶手段と、 前記第2の演算手段に前記画素データを供給する第2の
記憶手段と、前記第1の記憶手段および前記第2の記憶手段から読み
出された前記画素データを用いて、 前記第1のブロック
および前記第2のブロックを単位として、前記第1の直
交変換に比べて計算量の少ない第2の直交変換を実行
し、該実行結果に基づいて、前記第1のブロックおよび
前記第2のブロックのうち、前記画像フレームデータを
前記第1の直交変換する場合より高い圧縮効率を得るこ
とが可能なブロックを選択する選択手段と、前記選択手段が前記第1のブロックを選択した場合に前
記第1の記憶手段に記憶される前記第1のフィールドの
前記第1のブロックを構成する第1の画素データのうち
3/4の数分の前記第1の画素データと、前記選択手段
が前記第2のブロックを選択した場合に前記第1の記憶
手段に記憶される前記第2のブロックを構成する第2の
画素データのうち半分の数分の前記第2の画素データと
を前記第1の記憶手段に初期状態として記憶させ、前記
選択手段が前記第1のブロックを選択した場合に前記第
2の記憶手段に記憶される前記第2のフィールドの前記
第1のブロックを構成する前記第2の画素データのうち
3/4の数分の前記第2の画素データと、前記選択手段
が前記第2のブロックを選択した場合に前記第2の記憶
手段に記憶される前記第2のブロックを構成する前記第
1の画素データのうち半分の数分の前記第1の画素デー
タとを前記第2の記憶手段に初期状態として記憶させ、
前記選択手段が前記第1のブロックを選択した場合に、
前記第1の記憶手段に記憶されている前記第2の画素デ
ータを前記第2の記憶手段に転送し、前記第2の記憶手
段に記憶されている前記第1の画素データを前記第1の
記憶手 段に転送し、前記選択手段が前記第2のブロック
を選択した場合に、前記第1の記憶手段に記憶されてい
る前記第1の画素データのうち前記第2の記憶手段に記
憶する前記第2のブロックを構成する前記第1の画素デ
ータを前記第2の記憶手段に転送し、前記第2の記憶手
段に記憶されている前記第2の画素データのうち前記第
1の記憶手段に記憶する前記第2のブロックを構成する
前記第2の画素データを前記第1の記憶手段に転送する
記憶制御手段とを有するディジタル演算装置。1. A first field and a second field
The image space data of the real space composed of the first space is composed of a predetermined number of pixel data belonging to the same field.
Block or the belonging to different fields
At least two first calculation means and second calculation means for performing a first orthogonal transformation for transforming the data into frequency space data in units of a second block composed of a predetermined number of pixel data; First storage means for supplying the pixel data to the calculation means, second storage means for supplying the pixel data to the second calculation means, the first storage means and the second storage means Read from
A second orthogonal transform having a smaller calculation amount than that of the first orthogonal transform is executed using the output pixel data as a unit of the first block and the second block, and the execution result is obtained. based on the first block and of the second block, and selecting means for selecting a block which can obtain high compression efficiency than in the case of orthogonal transform of the said image frame data first, the Before when the selecting means selects the first block
Of the first field stored in the first storage means.
Of the first pixel data forming the first block,
3/4 number of the first pixel data and the selection means
Selects the second block, the first storage
A second block forming said second block stored in the means
Half of the pixel data and the second pixel data
Is stored in the first storage means as an initial state, and
When the selecting means selects the first block, the first block is selected.
2 of the second field stored in a second storage means
Of the second pixel data forming the first block,
3/4 number of the second pixel data and the selecting means
Selects the second block, the second storage
Means for storing the second block stored in the means
One half of the first pixel data of the first pixel data
Data as an initial state in the second storage means,
When the selecting means selects the first block,
The second pixel data stored in the first storage means.
Data to the second storage means, and the second storage means
The first pixel data stored in the column
Was transferred to the storage hand stage, said selection means said second block
Is stored in the first storage means when is selected.
Of the first pixel data stored in the second storage means.
The first pixel data forming the second block to be stored.
Data to the second storage means, and the second storage means
Of the second pixel data stored in a column
The second block to be stored in one storage means
A digital operation device comprising: storage control means for transferring the second pixel data to the first storage means .
であり、 前記第2の直交変換は、アダマール変換であることを特
徴とする請求項1記載のディジタル演算装置。2. The digital arithmetic unit according to claim 1, wherein the first orthogonal transform is a discrete cosine transform, and the second orthogonal transform is a Hadamard transform.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23685393A JP3371481B2 (en) | 1993-09-22 | 1993-09-22 | Digital arithmetic unit |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23685393A JP3371481B2 (en) | 1993-09-22 | 1993-09-22 | Digital arithmetic unit |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0795580A JPH0795580A (en) | 1995-04-07 |
JP3371481B2 true JP3371481B2 (en) | 2003-01-27 |
Family
ID=17006776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP23685393A Expired - Fee Related JP3371481B2 (en) | 1993-09-22 | 1993-09-22 | Digital arithmetic unit |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3371481B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6151069A (en) * | 1997-11-03 | 2000-11-21 | Intel Corporation | Dual mode digital camera for video and still operation |
-
1993
- 1993-09-22 JP JP23685393A patent/JP3371481B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH0795580A (en) | 1995-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5825680A (en) | Method and apparatus for performing fast division | |
JP4924904B2 (en) | Efficient encoding / decoding of sequences of data frames | |
JP3655651B2 (en) | Data processing device | |
JP2821489B2 (en) | Still image compression processing apparatus and method | |
JP2897761B2 (en) | Block-matching arithmetic unit and machine-readable recording medium recording program | |
US6470050B1 (en) | Image coding apparatus and its motion vector detection method | |
JPH11225334A (en) | Dispersion value calculation accelerator for mpeg-2 image decoder | |
US7076105B2 (en) | Circuit and method for performing a two-dimensional transform during the processing of an image | |
JPS622721A (en) | Coding and decoding device for picture signal | |
JP3371481B2 (en) | Digital arithmetic unit | |
KR100252838B1 (en) | Image processing device | |
US7330595B2 (en) | System and method for video data compression | |
JP4744943B2 (en) | Motion vector detection method and moving image processing apparatus | |
JP2888292B2 (en) | Two-dimensional inverse discrete cosine transform (IDCT) device | |
WO2000036562A9 (en) | Digital camera using programmed parallel computer for image processing functions and control | |
JP2000165861A (en) | Moving image decoding device | |
JPH1196138A (en) | Inverse cosine transform method and inverse cosine transformer | |
JP2005184829A (en) | Low power, high performance transform coprocessor for video compression | |
JP3155383B2 (en) | Two-mode processing device, two-dimensional conversion device, and still image data compression system | |
JP2001285643A (en) | Image converting apparatus and method | |
JP3385866B2 (en) | Inverse quantization and inverse DCT circuit | |
JP3326879B2 (en) | Image signal converter | |
JPH08307868A (en) | Moving image decoder | |
JP2000078589A (en) | Method for calculating movement vector and storage medium for recording movement vector calculating program | |
KR100790846B1 (en) | Integer transform method for imaging process and processor thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |