JP2006155223A - Data processor - Google Patents
Data processor Download PDFInfo
- Publication number
- JP2006155223A JP2006155223A JP2004344571A JP2004344571A JP2006155223A JP 2006155223 A JP2006155223 A JP 2006155223A JP 2004344571 A JP2004344571 A JP 2004344571A JP 2004344571 A JP2004344571 A JP 2004344571A JP 2006155223 A JP2006155223 A JP 2006155223A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- common
- dedicated
- data processing
- units
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、所定のデータ処理を実行する専用演算部を搭載したデータ処理装置に関する。 The present invention relates to a data processing apparatus equipped with a dedicated arithmetic unit that executes predetermined data processing.
従来の画像処理やデータ圧縮を行うデータ処理装置は、制御用のメインプロセッサを中心に、特定の演算処理を行う専用演算部が接続される構成を有している。この専用演算部は、それぞれ特定の演算処理を行う専用回路であったり、専用LSIやASIC(特定用途向けIC)の一部や全部であったりする。 A conventional data processing apparatus that performs image processing and data compression has a configuration in which a dedicated arithmetic unit that performs specific arithmetic processing is connected to a main processor for control. The dedicated arithmetic unit may be a dedicated circuit that performs specific arithmetic processing, or may be a part or all of a dedicated LSI or ASIC (specific application IC).
図14は従来のデータ処理装置のブロック図である。 FIG. 14 is a block diagram of a conventional data processing apparatus.
データ処理装置100は、メインプロセッサ101、および複数の専用演算部102を備える、任意のデータ処理を行う装置である。なお、図14では専用演算部102は3つ設けられている。また、メインプロセッサ101は必須の構成要素ではなく、複数の専用演算部102を制御(同期制御や命令制御など)するものであればよい。
The
また、専用演算部102は、それぞれ異なる演算処理を実行するものでもよく、類似ないしは同一の演算処理を実行するものでもよい。複数の専用演算部102が、演算量の多い処理を実行するため、消費電力の低減やリアルタイム処理を可能とする。
In addition, the dedicated
なお、データ処理装置100は、その全てもしくは一部がLSIで実現されることも多い。
Note that the
図14に示されるような従来のデータ処理装置の構成が、特許庁資料室ホームページの技術動向トピックス/システムLSIのレイアウト/画像処理用LSI/データ圧縮用LSIに紹介されている。 The configuration of a conventional data processing apparatus as shown in FIG. 14 is introduced in the technical trend topics / system LSI layout / image processing LSI / data compression LSI on the JPO data room homepage.
データ処理装置の例として、MPEG2やMPEG4、JPEGなどの符号圧縮、復号処理装置や処理LSIが挙げられる。 Examples of data processing devices include code compression / decoding processing devices and processing LSIs such as MPEG2, MPEG4, and JPEG.
また、このようなデータ処理装置での消費電力削減のために、動作周波数制御が有効である(例えば特許文献1、特許文献2参照)。
Further, in order to reduce power consumption in such a data processing apparatus, operation frequency control is effective (see, for example,
また、近年は複数の画像処理フォーマットに対応した符号復号化処理の実現や、画像処理に加えた音声処理の実現なども求められている。即ち、一つのデータ処理装置やこれを実現するLSIが処理するアプリケーションの量が増加傾向にある。 In recent years, there has also been a demand for realization of encoding / decoding processing corresponding to a plurality of image processing formats, realization of audio processing in addition to image processing, and the like. That is, the amount of applications processed by one data processing device or an LSI that realizes the data processing device tends to increase.
しかしながら、従来のデータ処理装置では、次のような問題点を有していた。 However, the conventional data processing apparatus has the following problems.
一つのデータ処理装置やこれを実現するLSIが処理するアプリケーションの量の増加や複雑化に対して、低消費電力とリアルタイム性を確保するために、搭載する専用演算部102の個数や回路規模が増大する問題があった。回路規模の増大により、LSIで実現されている場合にはLSIのチップ面積の増加が問題となっていた。あるいはコスト面でも問題であった。システムや別回路で実現されている場合であっても、同様に回路規模の増加による実装面積の増加などの問題があった。
In order to ensure low power consumption and real-time performance against the increase and complexity of the amount of applications processed by one data processing device or LSI that realizes this, the number and circuit scale of
また、プログラムで実現されている場合には、プログラム規模の増大に伴い、消費電力増大の問題を有していた。
そこで本発明は、処理性能の劣化を防止しつつ、回路規模および消費電力を削減し、要求される複雑なアプリケーションに対応するデータ処理装置を提供することを目的とする。 SUMMARY OF THE INVENTION An object of the present invention is to provide a data processing apparatus that can reduce the circuit scale and power consumption while preventing deterioration in processing performance, and can cope with a required complex application.
第1の発明のデータ処理装置は、所定の演算を行う複数の専用演算部と、複数の専用演算部に接続される信号線と、信号線を介して複数の専用演算部に接続され、共通の演算処理を行う共通演算部を備えるデータ処理装置であって、共通演算部は、複数の専用演算部の少なくとも2以上において共通に用いられる構成である。 A data processing apparatus according to a first aspect of the present invention includes a plurality of dedicated calculation units that perform predetermined calculations, a signal line that is connected to the plurality of dedicated calculation units, and a plurality of dedicated calculation units that are connected via the signal lines. The data processing device includes a common arithmetic unit that performs the arithmetic processing of the above, and the common arithmetic unit is configured to be commonly used in at least two or more of the plurality of dedicated arithmetic units.
複数の専用演算部で重複して設けられていた演算部が、共通演算部として専用演算部から削除されて別個設けられた上で、複数の専用演算部に共有されることで、データ処理装置の回路規模を適切に削減することができる。 The data processing device is configured such that the calculation unit provided redundantly in the plurality of dedicated calculation units is deleted from the dedicated calculation unit as a common calculation unit and provided separately, and then shared by the plurality of dedicated calculation units The circuit scale can be appropriately reduced.
第2の発明のデータ処理装置は、共通演算部が、複数の専用演算部の少なくとも2以上で共通に用いられる積和演算を行う少なくとも1つの共通積和演算部を備える。 In the data processing device according to the second aspect of the present invention, the common operation unit includes at least one common product-sum operation unit that performs a product-sum operation commonly used by at least two or more of the plurality of dedicated operation units.
複数の専用演算部で重複する回路規模および消費電力が共に大きな積和演算部が、共通積和演算部として専用演算部から削除されて別個設けられて共有化されることで、データ処理装置の回路規模、消費電力の削減がさらに促進される。 A product-sum operation unit that has a large circuit scale and power consumption that are duplicated in a plurality of dedicated operation units is deleted from the dedicated operation unit as a common product-sum operation unit, and is provided separately and shared. Reduction of circuit scale and power consumption is further promoted.
第3の発明のデータ処理装置は、共通演算部が、複数の専用演算部で非共通に用いられる演算を行う少なくとも1つの個別演算部をさらに備える。 In the data processing device according to the third aspect of the present invention, the common arithmetic unit further includes at least one individual arithmetic unit that performs arithmetic operations that are not commonly used by the plurality of dedicated arithmetic units.
複数の専用演算部で共通に用いられる演算部だけでなく、個別に用いられる演算部も共通演算部に設けることで、共通演算部での処理能力を高めて専用演算部の処理負担を軽減でき、回路規模の削減に加えて処理能力の向上も図られる。 In addition to computing units that are used in common by multiple dedicated computing units, computing units that are used individually are also provided in the common computing unit, so that the processing capacity of the dedicated computing unit can be reduced and the processing load of the dedicated computing unit can be reduced. In addition to reducing the circuit scale, the processing capability can be improved.
第4の発明のデータ処理装置は、複数の専用演算部のそれぞれが、共通積和演算部と個別演算部の組み合わされた演算結果を用いる。 In the data processing apparatus according to the fourth aspect of the invention, each of the plurality of dedicated calculation units uses a calculation result obtained by combining the common product-sum calculation unit and the individual calculation unit.
共通演算部の処理能力を高め、結果としてデータ処理装置全体の処理能力を向上させつつ、回路規模の適切な削減が可能となる。 It is possible to appropriately reduce the circuit scale while increasing the processing capability of the common arithmetic unit and consequently improving the processing capability of the entire data processing apparatus.
第5の発明のデータ処理装置は、共通演算部が個別演算部を複数備え、複数の個別演算部から専用演算部の要求に対応する所定の個別演算部を選択する選択部をさらに備える。 In a data processing device according to a fifth aspect of the present invention, the common calculation unit includes a plurality of individual calculation units, and further includes a selection unit that selects a predetermined individual calculation unit corresponding to the request of the dedicated calculation unit from the plurality of individual calculation units.
個別演算部が、専用演算部の要求に適切に対応して演算を実行することで、データ処理装置全体のパフォーマンスを向上させることができる。 When the individual calculation unit performs the calculation appropriately corresponding to the request of the dedicated calculation unit, the performance of the entire data processing apparatus can be improved.
第6の発明のデータ処理装置は、共通演算部が複数であるとともに、複数の専用演算部の個数未満である。 In the data processing device according to the sixth aspect of the invention, there are a plurality of common arithmetic units and less than the number of the dedicated arithmetic units.
専用演算部で重複する演算部を最大限に共通化することで、複雑なアプリケーションに対応する種々の専用演算部を有するデータ処理装置であっても、その回路規模の削減を実現できる。 By maximizing the number of overlapping calculation units in the dedicated calculation unit, even a data processing apparatus having various dedicated calculation units corresponding to complex applications can reduce the circuit scale.
第7の発明のデータ処理装置は、複数の専用演算部が、フィルタ処理部、直交変換処理部、動き検出部、および動き補償部の少なくとも一つである。 In the data processing device of the seventh invention, the plurality of dedicated arithmetic units are at least one of a filter processing unit, an orthogonal transformation processing unit, a motion detection unit, and a motion compensation unit.
これらの専用演算部は、乗算器や加算器などの回路規模の大きな積和演算部を重複して有するため、共通する演算部を共有化しやすく、複雑な複数のアプリケーションに対応するデータ処理装置であっても回路規模の削減が実現される。 Since these dedicated arithmetic units have overlapping product-sum arithmetic units such as multipliers and adders, it is easy to share common arithmetic units, and it is a data processing device that supports multiple complex applications. Even in this case, the circuit scale can be reduced.
第8の発明のデータ処理装置は、共通演算部が、専用演算部とは別のクロックを出力するクロック制御部をさらに備える。 In the data processing device according to the eighth aspect of the present invention, the common calculation unit further includes a clock control unit that outputs a clock different from that of the dedicated calculation unit.
共通演算部が、別個独立のクロックで動作するので、複数の専用演算部を並列に動作させる場合に、共通に用いられる共通演算部を擬似的に並列に動作させることができるなど、回路共有化による処理能力の低下を防止する。 Since the common arithmetic unit operates with separate and independent clocks, when multiple dedicated arithmetic units are operated in parallel, the common arithmetic unit used in common can be operated in parallel in a pseudo manner. This prevents the processing capacity from being reduced.
第9の発明のデータ処理装置は、クロック制御部は、共通演算部が非動作時にクロック信号を未出力とする。 In the data processing device according to the ninth aspect of the invention, the clock control unit outputs no clock signal when the common operation unit is not operating.
共通に用いられる演算部を共有化したことで実現された消費電力削減を、さらに削減することができる。 The power consumption reduction realized by sharing the commonly used arithmetic unit can be further reduced.
第10の発明のデータ処理装置は、複数の専用演算部の個数をN、専用演算部のクロック周波数をFとし、共通演算部のクロック周波数をfとしたときに、クロック周波数fがf=N*Fで定められる。 In the data processing device according to the tenth aspect of the present invention, when the number of the plurality of dedicated arithmetic units is N, the clock frequency of the dedicated arithmetic units is F, and the clock frequency of the common arithmetic unit is f, the clock frequency f is f = N. * Determined by F.
専用演算部の個数に応じて、共通演算部の処理を擬似的に並列処理と同じにでき、専用演算部の全てを同時実行させることができる。 Depending on the number of dedicated calculation units, the processing of the common calculation unit can be made the same as the parallel processing in a pseudo manner, and all of the dedicated calculation units can be executed simultaneously.
第11の発明のデータ処理装置は、共通演算部が、プログラム処理を実行するプロセッサユニットを備える。 In a data processing device according to an eleventh aspect, the common arithmetic unit includes a processor unit that executes program processing.
複数の専用演算部で重複している演算を、別途プログラム処理するプロセッサユニットとして共有化することで、回路規模を削減するとともに、共通演算部での演算係数の変更や処理手順の変更などの事後的な変更にも対応でき、フレキシビリティが向上する。 By sharing the operations that are duplicated in multiple dedicated calculation units as a processor unit that performs separate program processing, the circuit scale is reduced, and post-processing such as changes in calculation coefficients and processing procedures in the common calculation unit Can respond to changes, and flexibility is improved.
第12の発明のデータ処理装置は、プロセッサユニットが、複数の専用演算部の少なくとも2以上で共通に用いられる積和演算を実行する共通積和演算プログラムを備える。 In a data processing device according to a twelfth aspect, the processor unit includes a common product-sum operation program for executing a product-sum operation commonly used by at least two or more of the plurality of dedicated arithmetic units.
乗算器や加算器などから構成される回路規模の大きな積和演算部を、共通のプログラムにより処理できるので、フレキシビリティも高く、回路規模の削減が図られる。 Since a product-sum operation unit having a large circuit scale composed of a multiplier and an adder can be processed by a common program, the flexibility is high and the circuit scale can be reduced.
本発明によれば、複数の専用演算部が重複して有する共通の演算処理を、共通演算部として外部に共有して接続することで、回路規模、チップ面積及び実装面積を削減できる。 According to the present invention, the circuit scale, the chip area, and the mounting area can be reduced by sharing the common arithmetic processing that a plurality of dedicated arithmetic units overlap with each other as a common arithmetic unit.
また、共有化される共通演算部が、独立したクロック制御部を有することで、処理速度の低下を防止すると共に、消費電力を削減できる。 In addition, since the shared common operation unit has an independent clock control unit, it is possible to prevent a reduction in processing speed and reduce power consumption.
更に、共通演算部をサブプロセッサなどに搭載し、ソフトウェアで実装することで、回路規模の削減のみならず、事後的な仕様変更や係数変更などに、柔軟に対応できる構成のデータ処理装置とすることができる。 In addition, by installing a common arithmetic unit in a sub-processor, etc., and implementing it with software, a data processing device with a configuration that can flexibly cope with not only reduction in circuit scale but also subsequent specification changes and coefficient changes, etc. be able to.
以下、図面を参照しながら、本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
(実施の形態1)
まず、本発明の実施の形態1におけるデータ処理装置について、従来技術からの変更点を含めて、図1(a)、図1(b)、図2を用いて説明する。
(Embodiment 1)
First, the data processing apparatus according to the first embodiment of the present invention will be described with reference to FIGS. 1A, 1B, and 2 including changes from the prior art.
図1(a)は、従来のデータ処理装置のブロック図であり、図1(b)は本発明の実施の形態1におけるデータ処理装置のブロック図であり、図1(a)は、本発明の実施の形態1におけるデータ処理装置を表す図1(b)との対比のために表されている。図2は、本発明の実施の形態1におけるデータ処理装置のブロック図である。
FIG. 1A is a block diagram of a conventional data processing apparatus, FIG. 1B is a block diagram of a data processing apparatus according to
図1(a)に表される従来のデータ処理装置1は、所定の演算を行う複数の専用演算部4、5、6が、信号線8を介して接続されている。複数の専用演算部4、5、6は、それぞれ共通の演算を行う演算部7を重複して含んでいる。
In the conventional
図1(b)に表されるデータ処理装置2は、所定の演算を行う複数の専用演算部4、5、6と、これらの複数の専用演算部4、5、6に接続される信号線10と、信号線10を介して複数の専用演算部4、5、6に接続され、共通の演算処理を行う共通演算部9を備えて構成される。共通演算部9は、複数の専用演算部4、5、6の内、少なくとも2以上において共通に用いられる。ここで、信号線8、および10はシングルビットの信号線でもよく、マルチビットの信号線でもよいものである。
The
このように、図1(a)に表されるように、複数の専用演算部4、5、6で重複していた共通の演算を実行する演算部7が、各専用演算部4、5、6から括り出されて、別途共有化される共通演算部9として接続されることで、効率的に回路規模を削減できる。
In this way, as shown in FIG. 1A, the
なお、図1(a)、図1(b)共に、信号線8を介してメインプロセッサ3が接続されているが、メインプロセッサ3は必要に応じて接続される。また、メインプロセッサ3に限らず、適宜制御回路などが接続されてもよいものである。また、専用演算部4、5、6は、図1(a)、図1(b)においてそれぞれ3個表されているが、4以上でもよい。
1A and 1B, the
次に、図2には3以上の専用演算部4,5、6、12を含み、複数の共通演算部9が、信号線10を介して接続されているデータ処理装置2が表されている。共通演算部は複数個接続されているが、共通演算部の個数は専用演算部の個数未満である。同数では、回路規模の削減にならないからである。このように、共通演算部9は単数であっても、複数であってもよい。
Next, FIG. 2 shows a
また、図2では、共通演算部9は、さらに共通積和演算部15と個別演算部16を含んでいる構成である。共通積和演算部15は、複数の専用演算部の少なくとも2以上で共通する積和演算を実行する演算ブロックであり、例えば、共通する加算、乗算などを実行する。複数の専用演算部で重複している演算の中でも、加算、乗算の組み合わされる積和演算は非常に回路規模や処理規模、消費電力が大きく、別ブロックとして共有化するメリットが非常に高いからである。
In FIG. 2, the
個別演算部16は、複数の専用演算部で非共通に用いられる演算を実行するブロックであり、必要に応じて共通演算部9に備えられる。この場合には、共通演算部9は、専用演算部の少なくとも2以上で共通に用いられる演算(例えば共通の積和演算)に加えて、個別のデータ加算やビット入れ替えなどの個別演算を実行できる。個別演算部16をさらに含む場合であっても、個別演算部16で必要となる回路素子(例えばフリップフロップやシフトレジスタ、加算器や乗算器など)を、共通積和演算部15の回路素子と共有することもできるので、図1(a)に表されるように、それぞれの専用演算部4、5、6のみを設けるよりも回路規模を削減することができる。
The
次に、図1(b)や図2に表されるデータ処理装置2により、回路規模などが削減できることについての詳細を説明する。
Next, details of the reduction in circuit scale and the like by the
専用演算部4、5、6は、共通の演算処理を実行する演算部7を含んでいる。この演算部7は共通の演算処理を実行する。例えば、専用演算部4がMPEG2を実行し、専用演算部5がMPEG4を実行し、専用演算部6がJPEGを実行する場合、離散コサイン変換(以下「DCT」という)が共通する演算である。またDCTに含まれる積和演算が共通する演算となる。演算部7は、このような複数の専用演算部4〜6において共通する演算を行うブロックである。従来技術におけるデータ処理装置1では、このように共通する演算部7が、複数の専用演算部4、5、6に渡って重複して含まれていた。このため、無駄が生じ、回路規模の増大を招いていた。
The dedicated
一方、データ処理装置2では、演算部7が専用演算部4、5、6それぞれから抽出されて、バス10を介して共通演算部9として接続されている。これにより、専用演算部4、5、6に重複して含まれていた演算部7は削除され、各々の専用演算部4、5、6の回路規模は削減されている。
On the other hand, in the
このように、重複して設けられていた演算部7が各専用演算部4、5、6から削除され、共有される共通演算部9として接続されることで、回路規模の大幅な削減が可能となる。
As described above, the
特に、共通演算部9が、複数の専用演算部で重複していた積和演算をくくりだした共通積和演算部15を備えることで、回路規模の削減がさらに促進されるものである。積和演算は、加算器、乗算器、レジスタなど回路規模の大きくなりやすい回路素子を多く含むからである。
In particular, the
ここで、共通演算部9はバス10を介して接続されているので、専用演算部4〜6は、各々データをやり取りできる。即ち、共通演算部9を複数の専用演算部4、5、6は共通に使用することができる。
Here, since the common
なお、上記のように共通演算部9は、各専用演算部4、5、6に共通する共通積和演算部15を備えることが多いが、積和演算に限られるものではない。例えば特定の制御演算や、誤り訂正、誤り符号、誤り検出などの共通する演算部を備えるものであっても良い。
As described above, the
また、全ての専用演算部に共通している演算部であることが好ましいが、複数の専用演算部の2以上に共通する演算部であっても良いものである。同様に、回路規模の削減を実現できるからである。 Moreover, although it is preferable that it is a calculating part which is common to all the exclusive calculating parts, the calculating part which is common to two or more of several exclusive calculating parts may be used. Similarly, the circuit scale can be reduced.
更に、共通演算部は、共通積和演算部15と個別演算部16両方を含むものであってもよい。共通積和演算部15と親和性の高い演算部が、個別演算部16として共通演算部9に含まれることで処理性能低下を防止できるからである。さらに、個別演算部16が、共通積和演算部15と回路素子を共有することで、回路規模も削減可能である。
Furthermore, the common calculation unit may include both the common product-
次に、図3(a)、図3(b)を用いて、共通演算部9の他のバリエーションについて説明する。図3(a)、図3(b)は本発明の実施の形態1における共通演算部の内部ブロック図である。
Next, another variation of the common
図3(a)には、共通積和演算部15と個別演算部16、および選択部17により構成された共通演算部9が表されている。
FIG. 3A shows a
選択部17は、動作を行っている専用演算部4、5、6に対応する個別演算部16を選択する。これにより、複数の個別演算部16の内、必要なものが選択され、専用演算部4、5、6での処理動作が実現される。ここで、選択部17は、専用演算部4〜6からの制御信号などを基準に対応する個別演算部16を選択する。更に、このとき、共通積和演算部15も必要に応じて動作し、選択された個別演算部16と組み合わされた結果が専用演算部4、5、6に出力される。
The
以上の動作により、専用演算部4、5、6で必要となる演算結果が、共通演算部9により得られる。
Through the above operations, the calculation results required by the
また、図3(b)に表されるように、個別演算部16ではなく、共通積和演算制御部18を設けてもよい。
Further, as illustrated in FIG. 3B, a common product-sum
共通積和演算制御部18は、専用演算部4、5、6で共通する積和演算部での処理動作が、完全同一でない場合に用いられる。例えば、専用演算部4で必要とする積和演算は、乗算が3回まででよいのに対して、専用演算部5で必要とする積和演算は乗算が5回必要である場合である。即ち、同じ乗算器という回路要素を共有するが、その処理結果の要求が異なる場合である。
The common product-sum
このような場合には、共通積和演算制御部18が、共通積和演算部15での積和演算を、対応する専用演算部の要求に従った制御を行う。上記の例では、共通積和演算制御部18は、専用演算部4の場合には、共通積和演算部5での乗算を3回で終了するように制御して結果を選択部17から出力する。専用演算部5の場合には、共通積和演算制御部18は、共通積和演算部15での乗算を5回で終了するように制御する。
In such a case, the common product-sum
以上のように、共通積和演算制御部18は、専用演算部の相違する演算要求に対応した制御を行う。
As described above, the common product-sum
次に、図4(a)、図4(b)を用いて、専用演算部が特定の処理を行う具体的な事例について、従来からの変化を含めて説明する。図4(a)は、従来のデータ処理装置のブロック図であり、図4(b)は本発明の実施の形態1におけるデータ処理装置のブロック図である。ここでは、本発明のデータ処理装置2の特徴とメリットを効果的に説明するために、従来技術のデータ処理装置1も並べて表示したものである。
Next, with reference to FIGS. 4A and 4B, specific examples in which the dedicated calculation unit performs specific processing will be described including changes from the past. FIG. 4A is a block diagram of a conventional data processing apparatus, and FIG. 4B is a block diagram of the data processing apparatus in
図4では、二つの専用演算部が、それぞれフィルタ処理部20と直交変換部21である場合が示されている。
FIG. 4 shows a case where the two dedicated arithmetic units are the
なお、これ以外でも画像圧縮などで用いられる動き検出部、動き補償部などであっても良い。これら、フィルタ処理部20や直交変換部21などは、処理が複雑であるため回路規模が非常に大きいのに対して、乗算や加算といった積和演算や、ビットシフトやビット入れ替えなどの共通する演算を重複して含むことが多い。このため、重複する無駄な演算回路が存在し、回路規模を増大させやすい。
Other than this, a motion detection unit, a motion compensation unit, or the like used for image compression or the like may be used. The
例えば、図4(a)に表されるように、フィルタ処理部20も直交変換部21も共通する積和演算部22を含んでいる。この積和演算部22は、フィルタ処理部でのデータ処理に必要な積和演算を実行する、あるいは、直交変換部でのデータ処理に必要な積和演算を実行する。
For example, as shown in FIG. 4A, the
更に、積和演算部22は、積和にかかわる係数などに差異があっても、基本的には同等の演算処理を実行するものである。結果として、フィルタ処理部20、直交変換部21が回路やLSIで実現されている場合には、回路規模の増大と、チップ面積の増加を招くものである。
Furthermore, the product-
このため、データ処理装置2のように、積和演算部22は、共通演算部9に備えられることが好ましい。このように共有化されることで、回路規模が削減される。
For this reason, as in the
共通演算部9は、重複していた積和演算部22に相当する共通積和演算部24と制御部23を有している。制御部23は、共通積和演算部24を、フィルタ処理部20と直交変換部21に対応するように制御する。これにより、フィルタ処理部20及び直交変換部21に最適な積和演算を、共通積和演算部24が実現することができる。
The
例えば、制御部23は、積和演算に用いる係数をそれぞれで変えたり、積和順序の組換えを行ったりする。
For example, the
以上のように、フィルタ処理部20や直交変換部21、あるいは動き検出部や画像処理、音声処理などを実行する専用演算部に、重複して含まれていた演算部を、共通演算部9として、信号線10を介して接続することで、重複回路を削減し、回路規模の削減や実装面積の削減、コストの削減を実現できるものである。
As described above, the common
なお、共通演算部9はハードウェアによる回路で実現されても良く、LSIの一部として実現されても良く、単体のLSIで個別に実現されても良く、あるいはソフトウェアとして実現されても良いものである。
The common
回路やLSIなどのハードウェアで実現された場合には、回路規模の削減が実現でき、ソフトウェアで実現された場合には、消費電力の削減やメモリの削減などが実現できる。 When implemented with hardware such as a circuit or LSI, the circuit scale can be reduced, and when implemented with software, power consumption or memory can be reduced.
また、フィルタ処理部20などは複数でも良いものであり、共通演算部9が複数であってもよい。
Further, a plurality of
次に、図5、図6を用いて図4に表されているフィルタ処理部20、および直交変換部21の動作と、これに対応する共通演算部9での動作をあわせて説明する。回路規模を削減するために共通積和演算部24を含む共通演算部9が、適切に動作して処理が実行されることが理解される。
Next, the operations of the
図5、図6はそれぞれ本発明の実施の形態1におけるデータ処理装置の動作フローチャートである。
5 and 6 are operation flowcharts of the data processing apparatus according to
まず、図5を用いてフィルタ処理部20と共通積和演算部24との動作を説明する。
First, the operations of the
まず、ステップ1にて、フィルタ処理部20ならびに直交変換部21は、起動後の処理に入る。次に、ステップ2にて、データ処理装置2は積和演算ステージに入る。ここで、フィルタ処理部20は積和演算ステージ(ステップ2)に入ると、ステップ3にて、共通積和演算部24に対して使用要求を出力する。ステップ3による使用要求が出力されると、ステップ4にて、積和演算状態が継続する。この積和演算状態は、ステップ5にて、共通積和演算部24が終了通知を出力するまで継続する。
First, in
ステップ4の積和演算状態では、フィルタ処理部20は、共通積和演算部24に、必要なデータを出力して積和演算を実行させる。具体的にはデータに所定の係数を乗じ、乗算結果を加算するなどの積和処理が実行される。
In the product-sum operation state of step 4, the
積和演算が終了すると、ステップ5にて、共通積和演算部24は終了通知をフィルタ処理部20に出力する。ステップ6にて、終了通知を受け取ったフィルタ処理部20は、次の処理へ移行する。これにより、フィルタ処理部20の所定の処理動作が終了する。
When the product-sum operation is completed, in
次に図6を用いて、共通積和演算部24の動作について説明する。
Next, the operation of the common product-
共通演算部9に含まれる制御部23は、フィルタ処理部20や直交変換部21からの、共通積和演算処理部24に対する使用要求に対する制御を行う。
The
制御は、ステップ11によるキューイング処理と、ステップ12による共通積和演算部24の処理に分けられる。
Control is divided into a queuing process in step 11 and a process of the common product-
ステップ11によるキューイング処理を説明する。 The queuing process in step 11 will be described.
まず、ステップ13にて、フィルタ処理部20もしくは直交変換部21が使用要求を出力する。次に、ステップ14にて、フィルタ処理部20または直交変換部21からの使用要求を要求キューにキューイングする。このキューイングにより、使用要求信号がストックされる。
First, in step 13, the
次に、ステップ12による共通積和演算部24の処理を説明する。
Next, the processing of the common product-
まず、ステップ15にて、制御部23は要求キューにキューイングされている使用要求を取り出す。次いで、ステップ16にて、制御部23は要求キューに使用要求が存在することを確認する。使用要求が存在する場合には、ステップ17にて、制御部23は共通積和演算部を使用状態とする。
First, in
次に、ステップ18にて、制御部23は共通積和演算が終了したことを確認する。ステップ18での共通積和演算の終了確認により、ステップ19にて、制御部23はフィルタ処理部20または直交変換部21に対して終了通知を出力する。
Next, in
なお、ここで、ステップ11によるキューイング処理と、ステップ12による共通積和演算部処理は並列して行われる。
Here, the queuing process in step 11 and the common product-sum operation unit process in
以上のように、重複して設けられていた演算部7を、外部に共通演算部9として接続して共有することで、回路規模が削減されると共に、動作上においても、上記に説明したフローで実行されるので、性能の劣化などは生じない。
As described above, the
また、図1などでは回路やLSIなどのハードウェアでの実現の場合について説明したが、一部、もしくは全部がソフトウェアの場合でも同様である。特に、共通演算部9がソフトウェアで実現される場合は、プログラムの圧縮と、これに伴うメモリの削減、消費電力の低減が実現される。
In addition, FIG. 1 and the like have been described with respect to realization with hardware such as a circuit and LSI, but the same is true even when part or all is software. In particular, when the common
図7を用いて、プロセッサユニットを用いてソフトウェア処理する場合について説明する。図7は、本発明の実施の形態1におけるデータ処理装置のブロック図である。
A case where software processing is performed using a processor unit will be described with reference to FIG. FIG. 7 is a block diagram of the data processing apparatus according to
図7には、共通演算がソフトウェアで実現された構成が示されている。 FIG. 7 shows a configuration in which common operations are realized by software.
従来のデータ処理装置では、複数の専用演算部30は、複数の専用演算部30に重複する積和演算31と、個別演算32、33を含んでいた。
In the conventional data processing apparatus, the plurality of
図7に表される本発明のデータ処理装置2は、これらの重複する積和演算31と、個別演算32、33を、プロセッサユニット34にソフトウェアプログラムとして格納している。さらに、プロセッサユニット34は信号線10を介して、複数の専用演算部30と接続されている。
The
各専用演算部30で重複していた積和演算31や個別演算32、33を回路ではなく、ソフトウェアプログラムとしてプロセッサユニット34に設けられることで、回路規模の削減を実現できるものである。さらに、回路として共通化する場合に比べて、係数の変更や処理手順の変更などの事後的な変更にフレキシブルに対応できるメリットもある。
By providing the product-
また、プロセッサユニット34で共通化されたプログラムが、もともと各専用演算部30にて重複していたプログラムである場合には、プログラム規模の削減に加えて、消費電力も削減できるメリットがある。
Further, when the program shared by the
以上より、ハードウェアの場合と同様、プログラム規模の縮小と消費電力の削減、コストの削減などが実現される。 As described above, as in the case of hardware, reduction of the program scale, reduction of power consumption, cost reduction, and the like are realized.
なお、動作については、図5、図6を用いて説明した場合と同様である。 The operation is the same as that described with reference to FIGS.
また、共通演算部9として共有化される回路やプログラムは、積和演算のみならず、乗算器や加算器、あるいは、ある程度まとまった処理を行う演算部などであっても良いものである。
The circuit or program shared as the common
以上の構成により、演算処理上のデメリットを来たさず、回路規模やプログラム規模を、効率的に削減して、LSIのチップ面積の低減や、回路面積の削減、消費電力の削減が実現される。 With the above configuration, there is no demerit in arithmetic processing, and the circuit scale and program scale can be efficiently reduced to reduce LSI chip area, circuit area, and power consumption. The
(実施の形態2)
実施の形態2では、クロック制御が共通演算部9に独立に含まれる場合について説明する。
(Embodiment 2)
In the second embodiment, a case where clock control is independently included in the common
まず、図8を用いて本発明の実施の形態2におけるデータ処理装置の構成について説明する。図8は、本発明の実施の形態2におけるデータ処理装置のブロック図である。
First, the configuration of the data processing apparatus according to the second embodiment of the present invention will be described with reference to FIG. FIG. 8 is a block diagram of the data processing apparatus according to
図8に表されるデータ処理装置2では、共通演算部9が専用演算部であるフィルタ処理部20や直交変換部21で用いられるクロックとは別のクロックを出力するクロック制御部40をさらに備えている。
In the
クロック制御部40は、専用演算部とは独立したクロック信号を共通演算部9に出力する。制御部23や共通積和演算部24は、クロック制御部40から出力されるクロック信号を用いる。
The
ここで、フィルタ処理部20と直交変換部21を並列動作させたい場合がある。このような場合にフィルタ処理部20と直交変換部21におけるクロック周波数と共通演算部9におけるクロック周波数が同一であると、並列動作させることができない。共通演算部9は、フィルタ処理部20と直交変換部21に共有化されているためである。即ち、回路規模削減のために、共有化されたことで、フィルタ処理部20などの専用演算部は、各々の内部に共通の演算部を有していないため、各専用演算部は共通の演算を同時動作できず並列動作ができない。
Here, the
一方、フィルタ処理部20、直交変換部21の大部分は、メインプロセッサ3を始めとした全体を制御する制御機構とクロックを同一にして、同期を取る必要があるため、これらの処理速度向上には限界がある。
On the other hand, most of the
ここで、クロック制御部40が、専用演算部など他の部分と別個独立に設けられていることで、共通演算部9の処理速度を個別に制御でき、全体としての処理速度の低下を防止しつつ、回路規模削減を実現できるものである。
Here, since the
例えば、クロック制御部40から出力されるクロック周波数が、専用演算部などでのクロック周波数の倍とする。この場合には、共通演算部9はフィルタ処理部20などの倍の速度で動作する。並列処理される専用演算部が2つである場合でも、共通に使用される共通演算部9が、専用演算部の倍の速度で動作するので、2つの専用演算部は見た目上並列動作しているのと同じである。
For example, it is assumed that the clock frequency output from the
図8に表されるフィルタ処理部20と直交変換部21が必要とする積和演算を順次処理しても、結果的には従来と同一クロック数で全体の処理が終了する。即ち、演算部を共有化したために生じる、並列処理の困難性をカバーできる。これにより、見た目上並列処理と変わらないスピードで処理が可能となり、性能低下を防止することができる。
Even if the product-sum operations required by the
なお、クロック制御部40の出力するクロック周波数は、倍速のみならず、3倍速や4倍速(専用演算部の要求に合わせて)、あるいは他の種類、あるいは選択可能とすることも好適である。
Note that the clock frequency output from the
例えば、専用演算部の個数をN、専用演算部のクロック周波数をFとし、共通演算部のクロック周波数をfとしたときに、クロック周波数fが
f=N*F
の式で表される周波数であれば、N個の専用演算部を全て並列処理させるのと同一クロック数で処理できる。
For example, when the number of dedicated arithmetic units is N, the clock frequency of the dedicated arithmetic units is F, and the clock frequency of the common arithmetic units is f, the clock frequency f is f = N * F
Can be processed with the same number of clocks as when all N dedicated arithmetic units are processed in parallel.
また、共通演算部9が動作しているときのみクロック制御部40がクロック信号を出力し、非動作時にはクロック信号を未出力とすることで、消費電力の削減などを効果的に行うことができる。クロックの出力、未出力は、例えばゲーテッド・クロックを用いるなどして実現する。
In addition, the
特に、共通演算部9に含まれる積和演算は、シフトレジスタなどのクロックを用いる順序回路を多く含むため、非動作時にクロック出力を停止することは、消費電力の削減において高い効果を有する。消費電力はクロック周波数に比例して増加するからである。
In particular, the product-sum operation included in the common
次に、図9を用いて共通演算部9の動作を説明する。
Next, the operation of the common
図9は、本発明の実施の形態2における共通演算部の動作フローチャートである。共通演算部9に含まれる制御部23を動作の基準として説明する。また、ここでは図8に表されるようにフィルタ処理部20と直交変換部21を備えたデータ処理装置2として説明する。
FIG. 9 is an operation flowchart of the common arithmetic unit in the second embodiment of the present invention. The
また、メインプロセッサ3、フィルタ処理部20、直交変換部21に供給されているクロックの動作周波数は等しいものとし、以降の説明における基準クロックとする。
Further, it is assumed that the operating frequencies of the clocks supplied to the
制御部23は、ステップ21によるフィルタ処理部20などからの共通演算部使用の要求信号のキューイング処理と、ステップ22による共通積和演算部24の動作処理を行う。
The
まず、ステップ21による使用要求のキューイング処理について説明する。
First, the use request queuing process in
まず、ステップ13にて、制御部23はフィルタ処理部20、または直交変換部21が出力した使用要求を確認する。次いで、ステップ14にて、制御部23は確認された使用要求を要求キューにキューイングする。
First, in step 13, the
次に、ステップ23にて、制御部23はキューイングと同時にタイムカウントを開始する。タイムカウントは、フィルタ処理部20、直交変換部21のそれぞれの使用要求毎にカウントする。これにより、異なる専用演算部が出力した使用要求信号が、適切にキューイングされる。
Next, in
次に、ステップ22における共通積和演算部24の動作処理について説明する。
Next, the operation process of the common product-
まず、ステップ15にて、制御部23は要求キューから要求信号が取り出す。次いで、ステップ16にて、制御部23は要求信号の有無を確認する。ステップ24にて、要求キューに要求信号があれば、制御部23は要求信号に附随するタイムカウント値を調べた上で、タイムカウント値を閾値thと比較する。
First, in
ステップ25にて、タイムカウント値が閾値th以上では、クロック制御部40は基準クロックの倍速のクロックを出力する。一方、ステップ26にて、タイムカウント値が閾値th未満では、クロック制御部40は基準クロックと同速のクロックを出力する。即ち、タイムカウント値は、同時動作する専用演算部の数を表しているので、これに対応して共通演算部9の動作速度を増減させるものである。
In step 25, when the time count value is equal to or greater than the threshold th, the
次いで、ステップ17にて、共通積和演算部24が動作状態となり、積和演算が実行される。更に、ステップ18にて、制御部23は積和演算の終了を確認する。次に、ステップ19にて、制御部23は、積和演算の終了通知を専用演算部であるフィルタ処理部20、もしくは直交変換部21、およびクロック制御部40に出力する。
Next, in
さらに、ステップ27にて、終了通知をうけたクロック制御部40はクロック信号の供給を停止する。これにより、動作不要の期間に於いては共通演算部9の不要な電力消費が削減される。
Furthermore, in step 27, the
なお、ステップ21である使用要求に対するキューイング処理と、ステップ22である共通積和演算部24の動作処理(22)は並列に実行される。
Note that the queuing process for the use request in
以上のような処理により、共通演算となる回路やプログラムの共有化による処理速度の低下を防止できる。また、共通演算部9での動作が不要な場合にクロック信号を停止することで、消費電力の削減も可能となるものである。
Through the processing as described above, it is possible to prevent a reduction in processing speed due to sharing of circuits and programs that are common operations. Further, the power consumption can be reduced by stopping the clock signal when the operation in the common
(実施の形態3)
実施の形態3では、更にアプリケーションの複雑化に伴い、専用演算部が複雑化した場合について説明する。
(Embodiment 3)
In the third embodiment, a case will be described in which the dedicated operation unit becomes more complicated as the application becomes more complicated.
まず、図10(a)、図10(b)を用いて、本発明の実施の形態3におけるデータ処理装置の構成について、従来からの変化を含めて説明する。図10(a)は、従来のデータ処理装置のブロック図であり、図10(b)は、本発明の実施の形態3におけるデータ処理装置のブロック図である。ここでは、本発明のデータ処理装置のメリットを説明するための対比として、従来のデータ処理装置50を表している。
First, the configuration of the data processing apparatus according to the third embodiment of the present invention will be described using FIG. 10A and FIG. FIG. 10A is a block diagram of a conventional data processing apparatus, and FIG. 10B is a block diagram of the data processing apparatus in
従来のデータ処理装置50は、動き検出部52、53、54(図10中では「ME」と示す)、絶対誤差合計(図10中では「SAD」と示す)演算器55、フィルタ処理部20、直交変換部21、積和演算部22を備える。ここで、絶対誤差合計演算器55は動き検出部52、53、54に重複して含まれ、積和演算部22はフィルタ処理部20と直交変換部21に重複して含まれている。即ち、共通の動作を行うブロックが重複して設けられ、回路規模が増加しているものである。
The conventional
一方、実施の形態3におけるデータ処理装置51は、動き検出部52、53、54、フィルタ処理部20、直交変換部21、およびこれらと信号線10を介して接続されるサブプロセッサ60を備えている。
On the other hand, the
さらにサブプロセッサ60は、エンジンインターフェース56(図10中では「エンジンI/F」と表す)、プロセッサユニット57(図10中では「PU」と示す)、絶対誤差合計演算プログラム(図10中では「SAD演算プログラム」と表す)、積和演算プログラム59を含んでいる。 Further, the sub-processor 60 includes an engine interface 56 (represented as “engine I / F” in FIG. 10), a processor unit 57 (denoted as “PU” in FIG. 10), and an absolute error total calculation program (in FIG. A product-sum operation program 59).
このデータ処理装置50、51は例えばMPEG2とMPEG4とJPEGの全てを一つの処理装置やLSIで実現する場合などに用いられるものである。
The
動き検出部52、53、54は、MPEG2などの画像圧縮においてその動きベクトルを検出する。絶対誤差合計演算器55は、動きベクトル検出での絶対誤差を演算する。積和演算部22は、フィルタ処理などで必要となる加算や乗算などの積和演算を実行する。
The
なお、図10(a)、図10(b)では、動き検出部52、53、54を3つと、一つのフィルタ処理部20、一つの直交変換部21が表されているが、この構成に限られるものではなく、その他のブロックが含まれても良い。
In FIGS. 10A and 10B, three
従来技術のデータ処理装置50では、絶対誤差合計演算器55が3つ重複して設けられている。更に、積和演算部22も2つ重複して設けられている。絶対誤差合計演算器55と積和演算部22はそれぞれ同一の演算処理を行うものであり、重複していることで回路規模が不要に増大している。
In the conventional
このため、本発明のデータ処理装置51は、重複している絶対誤差合計演算器55と積和演算部22を抽出し、まとめることで回路規模の削減を実現している。
For this reason, the
このとき、絶対誤差合計演算器55と積和演算部22は、それぞれプログラムで実現され、サブプロセッサ60に実装されている。サブプロセッサ60がバス10を介して、動き検出部52、53、54などの専用演算部と接続されることで、これらのプログラムを共有できる。さらに、共有される演算処理が、ソフトウェアで実装されることで、事後的な変更や各種係数など柔軟な変更に対応できるメリットがある。ソフトウェアは、共有される演算処理を専用の電子回路で実装した場合に比べて柔軟性が高い。勿論、回路により実装されてもよい。
At this time, the absolute error
サブプロセッサ60は、処理の切り替えやバス10の制御を行うエンジンインターフェース56とプロセッサユニット57を搭載している。プロセッサユニット57は、絶対誤差合計演算プログラム58と積和演算プログラム59を搭載している。
The sub-processor 60 includes an
このような構成により、重複して設けられていた絶対誤差合計演算器55や積和演算部22がまとめられ、回路規模を削減できるものである。更に、サブプロセッサ60への実装で、柔軟性も高くなるものである。
With such a configuration, the absolute error
次に、図11、図12を用いてサブプロセッサ60での動作処理について説明する。図11は本発明の実施の形態3におけるサブプロセッサ60の動作フローチャート、図12は、本発明の実施の形態3における割込み処理のフローチャートである。
Next, operation processing in the
エンジンインターフェース56は、ステップ11による使用要求のキューイング処理と、ステップ31によるプロセッサユニット起動処理とを実行する。
The
まず、ステップ11による使用要求のキューイング処理について説明する。 First, the use request queuing process in step 11 will be described.
最初にステップ13にて、エンジンインターフェース56は、動き検出部などが出力した使用要求信号の有無を検出する。次いで、ステップ14にて、検出した使用要求信号を要求キューにキューイングする(即ちストックする)。
First, at step 13, the
次に、ステップ31によるプロセッサユニット起動処理について説明する。
Next, the processor unit activation process in
最初に、ステップ15にて、エンジンインターフェース56は要求キューの要求信号の取り出しを行う。次いで、ステップ16にて、要求信号の有無を確認する。要求信号がある場合には、ステップ32にて、エンジンインターフェースはプロセッサユニット57に割り込み信号を出力して、プロセッサユニットを動作状態にする。
First, in
次いで、ステップ17にて、プロセッサユニット57に含まれるプログラムが動作状態とされる。動作状態となることで、積和演算などのプログラムが実行される。プログラムによる結果は、動き検出部などに出力される。
Next, in
次いで、ステップ18にて、プログラム動作の終了が確認される。プログラム動作の終了が確認されれば、ステップ19にて、プロセッサユニット57は、エンジンインターフェース56に対して終了通知信号を出力する。これにより、プロセッサユニット58でのプログラム動作が終了する。さらに、最初の状態に戻り、必要に応じて次の動作処理が開始される。
Next, at
次に図12を用いて、割り込み処理について説明する。 Next, interrupt processing will be described with reference to FIG.
まず、ステップ41にて、プロセッサユニット57の動作が終了している間は、プロセッサユニット57は、割り込み待ち状態で待機している。
First, in step 41, while the operation of the
次に、ステップ42にて、プロセッサユニット57は、エンジンインターフェース56から割り込み要求が発生した場合、割り込みハンドラへ移行する。
Next, in step 42, when an interrupt request is generated from the
次いで、ステップ43にて、割込みハンドラは、まず要求元を特定する。さらに、この特定に従って、ステップ44にて、絶対誤差合計演算プログラムを実行する。あるいは、ステップ45にて、積和演算プログラムを実行する。 Next, in step 43, the interrupt handler first specifies the request source. Further, in accordance with this specification, the absolute error sum calculation program is executed in step 44. Alternatively, in step 45, the product-sum operation program is executed.
次いで、ステップ46にて、演算終了後にこれらのプログラムは、演終了フラグを設定し、割込みハンドラ状態を終了する。これにより、プロセッサユニット57は、再び割り込み待ち状態となる。
Next, in step 46, after the computation is completed, these programs set a performance end flag and end the interrupt handler state. As a result, the
以上のように、エンジンインターフェース56を用いて、割込みハンドラにより、要求元と必要な演算を実施することで、多彩な演算処理を、一つのサブプロセッサ60で実現することができる。
As described above, various calculation processes can be realized by one
更に、重複していた演算部をサブプロセッサ60の中にプログラムとしてまとめることで、回路規模、LSIのチップ面積、実装面積を削減することができる。 Furthermore, by collecting the overlapping arithmetic units as programs in the sub-processor 60, the circuit scale, LSI chip area, and mounting area can be reduced.
また、プログラムで実装されることで、柔軟性が高くなるメリットもある。 Moreover, there is an advantage that flexibility is increased by being implemented by a program.
なお、キューイング処理とプロセッサユニット起動処理以外に、必要な処理がある場合には、エンジンインターフェース56が、切り替えを更に実行すればよいものである。
If there is a necessary process other than the queuing process and the processor unit activation process, the
また、図13に表されるように、クロック制御部40が、クロック制御をサブプロセッサ60において独立に行うことで、処理速度の低下防止や消費電力の削減も実現できるものである。図13は、本発明の実施の形態3におけるデータ処理装置のブロック図である。
Further, as shown in FIG. 13, the
実施の形態1で説明したように、サブプロセッサ60がクロックを独立に持つことで、全体の処理速度を低下させないことができる。
As described in the first embodiment, since the
本発明に係るデータ処理装置は、例えば、回路規模を削減して種々のアプリケーションに対応することが必要な技術分野などにおいて好適に利用できる。 The data processing apparatus according to the present invention can be suitably used, for example, in a technical field where it is necessary to reduce the circuit scale and cope with various applications.
1、2、50、51 データ処理装置
3 メインプロセッサ
4、5、6、12 専用演算部
7 演算部
8 信号線
9、13 共通演算部
10 信号線
15 共通積和演算部
16 個別演算部
17 選択部
18 共通積和演算制御部
20 フィルタ処理部
21 直交変換部
22 積和演算部
23 制御部
24 共通積和演算部
30 専用演算部
31 共通積和演算プログラム
32、33 個別演算プログラム
34 プロセッサユニット
40 クロック制御部
52、53、54 動き検出部
55 絶対誤差合計演算器
56 エンジンインターフェース
57 プロセッサユニット
58 絶対誤差合計演算プログラム
59 積和演算プログラム
100 データ処理装置
101 メインプロセッサ
102 演算処理部
1, 2, 50, 51
Claims (12)
前記複数の専用演算部に接続される信号線と、
前記信号線を介して前記複数の専用演算部に接続され、共通の演算処理を行う共通演算部を備えるデータ処理装置であって、
前記共通演算部は、前記複数の専用演算部の少なくとも2以上において共通に用いられるデータ処理装置。 A plurality of dedicated calculation units for performing predetermined calculations;
A signal line connected to the plurality of dedicated arithmetic units;
A data processing apparatus including a common arithmetic unit that is connected to the plurality of dedicated arithmetic units via the signal line and performs common arithmetic processing,
The common arithmetic unit is a data processing device that is used in common in at least two of the plurality of dedicated arithmetic units.
f=N*F
で定められる請求項8から9のいずれか記載のデータ処理装置。 When the number of the dedicated arithmetic units is N, the clock frequency of the dedicated arithmetic units is F, and the clock frequency of the common arithmetic unit is f, the clock frequency f is f = N * F
The data processing device according to claim 8, defined by
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004344571A JP2006155223A (en) | 2004-11-29 | 2004-11-29 | Data processor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004344571A JP2006155223A (en) | 2004-11-29 | 2004-11-29 | Data processor |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006155223A true JP2006155223A (en) | 2006-06-15 |
Family
ID=36633449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004344571A Pending JP2006155223A (en) | 2004-11-29 | 2004-11-29 | Data processor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006155223A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008118181A (en) * | 2006-10-31 | 2008-05-22 | Toshiba Corp | Communication apparatus, control method of communication apparatus and control program thereof |
JP2011049619A (en) * | 2009-08-25 | 2011-03-10 | Fujitsu Ltd | Image processing circuit and image encoder |
JP2012238194A (en) * | 2011-05-12 | 2012-12-06 | Hitachi Ltd | Order processing server, order processing method, and order processing program |
CN117687953A (en) * | 2023-09-11 | 2024-03-12 | 灿芯半导体(上海)股份有限公司 | Operation unit structure supporting dynamic allocation |
-
2004
- 2004-11-29 JP JP2004344571A patent/JP2006155223A/en active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008118181A (en) * | 2006-10-31 | 2008-05-22 | Toshiba Corp | Communication apparatus, control method of communication apparatus and control program thereof |
JP2011049619A (en) * | 2009-08-25 | 2011-03-10 | Fujitsu Ltd | Image processing circuit and image encoder |
JP2012238194A (en) * | 2011-05-12 | 2012-12-06 | Hitachi Ltd | Order processing server, order processing method, and order processing program |
CN117687953A (en) * | 2023-09-11 | 2024-03-12 | 灿芯半导体(上海)股份有限公司 | Operation unit structure supporting dynamic allocation |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hameed et al. | Understanding sources of inefficiency in general-purpose chips | |
JP2001256038A (en) | Data processor with flexible multiplication unit | |
JP2009009587A (en) | Method and apparatus for parallel shift right merge of data | |
JPH10187438A (en) | Method for reducing transition to input of multiplier | |
JP2008003708A (en) | Image processing engine and image processing system including the same | |
Hameed et al. | Understanding sources of ineffciency in general-purpose chips | |
TWI803634B (en) | Processor, method of operating a processor, processing apparatus and non-transitory computer-readable medium comprising instructions of loading and replication of sub-vector values | |
Lin et al. | Scalable montgomery modular multiplication architecture with low-latency and low-memory bandwidth requirement | |
Khan et al. | A high performance processor architecture for multimedia applications | |
US6675286B1 (en) | Multimedia instruction set for wide data paths | |
JP4569934B2 (en) | Information processing apparatus, exception control circuit, and exception control method | |
US6378067B1 (en) | Exception reporting architecture for SIMD-FP instructions | |
JP2006155223A (en) | Data processor | |
KNEIP et al. | Single chip programmable baseband ASSP for 5 GHz wireless LAN applications | |
WO2019023910A1 (en) | Data processing method and device | |
US6427159B1 (en) | Arithmetic unit, digital signal processor, method of scheduling multiplication in an arithmetic unit, method of selectively delaying adding and method of selectively adding during a first or second clock cycle | |
CN116662255A (en) | RISC-V processor realization method and system combined with overrunning function hardware accelerator | |
US20080225939A1 (en) | Multifunctional video encoding circuit system | |
JP2006018411A (en) | Processor | |
Chen et al. | Hardware software co-design of a multimedia SOC platform | |
US20030233384A1 (en) | Arithmetic apparatus for performing high speed multiplication and addition operations | |
US6584556B1 (en) | Modulo address generation method and apparatus | |
US8694697B1 (en) | Rescindable instruction dispatcher | |
JP2009258936A (en) | Information processor, information processing method and computer program | |
JP4758538B2 (en) | Data processing apparatus and control method |