JP2000250895A - データ処理装置 - Google Patents

データ処理装置

Info

Publication number
JP2000250895A
JP2000250895A JP5326099A JP5326099A JP2000250895A JP 2000250895 A JP2000250895 A JP 2000250895A JP 5326099 A JP5326099 A JP 5326099A JP 5326099 A JP5326099 A JP 5326099A JP 2000250895 A JP2000250895 A JP 2000250895A
Authority
JP
Japan
Prior art keywords
coprocessor
processor
register
instruction
dct
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5326099A
Other languages
English (en)
Inventor
Kenji Matsumoto
松本  健志
Toshiaki Sekiguchi
俊明 関口
Daisuke Iwahashi
大輔 岩橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP5326099A priority Critical patent/JP2000250895A/ja
Publication of JP2000250895A publication Critical patent/JP2000250895A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 DCT/IDCTに含まれるタスキ掛け演算
を高速で行う。 【解決手段】 RISCプロセッサ10に積和演算コプ
ロセッサ12が接続される。RISCプロセッサ10
は、画像信号や音声信号の圧縮/伸長の際のDCT/I
DCT演算を実行する。タスキ掛け演算が必要となる場
合、RISCプロセッサ10はコプロセッサ12のレジ
スタ34、36に被乗数及び乗数をロードする。積和演
算コプロセッサ12は、RISCプロセッサ10からの
ロード命令をトリガーとしてレジスタ34、36に書き
込まれた被乗数及び乗数を用いてタスキ掛け演算を実行
し、出力レジスタ42に書き込む。出力レジスタ42に
書き込まれたタスキ掛け演算結果は、RISCプロセッ
サ10のストア命令により読み出される。DCT/ID
CT専用のハードウエアを設けることなく、コプロセッ
サ12でタスキ掛け演算を行うことで、簡易なハードウ
ェア構成で高速なタスキ掛け演算を実行できる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はデータ処理装置、特
に画像信号や音声信号の圧縮/伸長に用いられる離散コ
サイン変換/離散コサイン逆変換演算の実行に関する。
【0002】
【従来の技術】従来より、画像信号や音声信号の圧縮/
伸長には、離散コサイン変換(DCT)及び離散コサイ
ン逆変換(IDCT)が用いられている。
【0003】図3に示されるように、8×8の2次元画
素のDCT及びIDCTは以下の式で表される。
【0004】
【数1】
【数2】 ただし、
【数3】 である。ここで、上式で示されるようにDCTは一種の
マトリクス演算と考えることができ、この場合、例えば
DCTは以下のように表現することができる。
【0005】
【数4】 1つの要素Fを算出するには乗算64回、加算64回の
演算が必要となり、全体では64個のF(F
63)についての演算が必要となるので、合計乗算4
096回及び加算4096回が必要となる。単純にこの
演算を実行する場合には、膨大なハードウエアが必要と
なるため、従来より2次元DCT/IDCTを簡易に行
う方法が知られている。
【0006】今、以下のような8要素の1次元DCT及
びIDCTを考える。
【0007】
【数5】
【数6】 ただし、
【数7】 である。これらの演算を、図4に示すように水平方向の
8ライン行い、その後垂直方向に8ライン(合計16ラ
イン)行うと、その結果は2次元DCTを施したものと
等価になることが知られている。1回の1次元DCTは
1要素につき乗算8回、加算8回、1ラインでは乗算6
4回、加算64回が必要であるため、2次元分では乗算
1024回、加算1024回となり、大幅な演算回数の
低減をはかることができる。
【0008】このように、2次元DCT/IDCTも1
次元化することで演算数を低減することが可能であり、
従来より、この1次元DCT/IDCTを実行するため
の高速な演算アルゴリズムが提案されている。これらの
高速アルゴリズムの1つとして、いわゆるバタフライ演
算と呼ばれるものがあり、図5にこの演算を模式的に示
す。
【0009】図において、左方向から右方向に向かう演
算がDCTであり、逆に右方向から左方向に向かう演算
がIDCTである。実線は加算、破線は減算を示してお
り、線に付加される数値(Ci)は乗数を表している。
このバタフライ演算においては、図6に示されるような
演算パターンが頻繁に出現する。すなわち、入力a、b
が存在し、aとbから出力xが生じ、さらに入力aとb
から出力yが生じる場合であって、出力xがx=C6*
a+C2*b、出力yがy=C6*b−C2*aとなる
ような場合である。なお、
【数8】 である。本明細書を通じ、図6に示されるような演算、
すなわち、一般に、
【数9】 X=x・c1−y・s2 Y=y・c2+x・s1 ・・・・(9) に示されるように、2〜4個の係数と2個の乗数の積和
算をタスキ掛け演算と称する。バタフライ演算を高速で
実行するには、このタスキ掛け演算を高速で行う必要が
ある。
【0010】なお、2次元の画像信号ではなく、1次元
の音声信号、例えばデジタルオーディオ信号を圧縮/伸
長する場合も同様であり、また、DCT/IDCTでは
なく、デジタルオーディオ信号の高品質圧縮/伸長方式
として知られているM(改良)DCT/IMDCTでも
同様である。参考までに、DVDオーディオで用いられ
るドルビー(登録商標)デジタル(AC−3)における
MDCTの変換式を以下に示す。
【0011】
【数10】 ちなみに、BSデジタルTVのデコード処理において
は、IMDCT処理が全処理の約半分近くを占めるとさ
れており、極めて大きな比重となっている。
【0012】
【発明が解決しようとする課題】このように、画像信号
や音声信号の圧縮/伸長を高速で行うためには、比重の
大きなDCT/IDCT演算処理、より詳しくはバタフ
ライ演算に出現するタスキ掛け演算を高速で行う必要が
あるが、このような処理を従来のプロセッサ、あるいは
プロセッサと特定の演算を行うコプロセッサとの組み合
わせでソフトウェア的に処理する場合には、高機能かつ
高速なプロセッサが要求され、コスト増加を招く問題が
あった。
【0013】また、タスキ掛け演算、あるいは図5に示
されたバタフライ演算を専用に行うハードウェアを新た
に設けることも考えられるが、プロセッサとの接続及び
制御が複雑化するなど、ハードウェア構成が複雑化する
問題がある。
【0014】本発明は、上記従来技術の有する課題に鑑
みなされたものであり、その目的は、DCT/IDCT
(あるいはMDCT/IMDCT)などで必要となるタ
スキ掛け演算を簡易な構成で、かつ高速に実行すること
ができるデータ処理装置を提供することにある。
【0015】
【課題を解決するための手段】上記目的を達成するため
に、第1の発明は、プロセッサ及びコプロセッサを備え
たデータ処理装置であって、前記コプロセッサは、前記
プロセッサから供給されたデータを格納する入力レジス
タと、前記入力レジスタへの前記データの書き込みをト
リガとしてタスキ掛け演算を実行する演算器と、前記演
算器での演算結果を格納する出力レジスタとを有するこ
とを特徴とする。従来のコプロセッサは、単なる乗算、
あるいは積和演算のみが可能であるが、この発明のコプ
ロセッサでは、入力レジスタへのデータの書き込みによ
り、タスキ掛け演算を起動して実行する。これにより、
プロセッサ側では、タスキ掛け演算結果を容易に得るこ
とができるので、プロセッサの負荷が低減されるととも
に、処理が高速化される。なお、「入力レジスタへのデ
ータの書き込みをトリガとしてタスキ掛け演算を実行」
とは、(9)式で示される係数及び乗数を複数回入力す
ることなく、係数と乗数の組を一度、入力レジスタに書
き込むのみでタスキ掛け演算が自動実行されることを意
味する。
【0016】また、第2の発明は、第1の発明におい
て、前記入力レジスタ及び前記出力レジスタは、前記プ
ロセッサがロード命令及びストア命令でアクセスできる
レジスタ空間に割り当てられ、前記入力レジスタへのデ
ータの書き込みは、前記プロセッサのロード命令で実行
され、前記出力レジスタからの演算結果の読み出しは、
前記プロセッサのストア命令で実行されることを特徴と
する。これにより、プロセッサは、単にレジスタへのロ
ード命令及びストア命令のみで、複雑なタスキ掛け演算
結果を得ることができる。
【0017】また、第3の発明は、第1、第2の発明に
おいて、前記演算器は、前記データの書き込みアドレス
に応じて前記タスキ掛け演算を含む複数種類の演算を実
行することを特徴とする。書き込みアドレスにより演算
の種類を特定することで、プロセッサはロード命令のア
ドレスを変更するのみで、タスキ掛け演算の他、乗算や
積和演算の結果を迅速に得ることができる。
【0018】また、第4の発明は、第1〜第3の発明に
おいて、前記プロセッサは、DCTあるいはIDCTを
実行し、前記コプロセッサは、前記プロセッサからの命
令に基づいて、前記DCTあるいは前記IDCTに含ま
れるタスキ掛け演算を実行することを特徴とする。これ
により、DCTあるいはIDCT用の専用ハードウェア
を設けることなく、プロセッサはDCTあるいはIDC
Tを高速で演算でき、画像信号や音声信号の圧縮/伸長
を高速に実行することができる。
【0019】
【発明の実施の形態】以下、図面に基づき本発明の実施
形態について説明する。
【0020】図1には、本実施形態の構成ブロック図が
示されている。本実施形態のデータ処理装置は、RIS
Cプロセッサ10と積和演算コプロセッサ12から構成
されている。RISCプロセッサ10の構成は従来とほ
ぼ同様であり、命令フェッチ部14、命令デコード実行
制御部16、レジスタファイル部18、ALU20と乗
算除算器22とファネルシフタ24とビットサーチャ2
6から構成される演算部、メモリアクセス部28及びレ
ジスタ書込部30を有している。このRISCプロセッ
サ10は、例えばデジタルオーディオプレイヤーに適用
され、デジタルオーデイオ信号の伸長に必要なIMDC
T処理を実行する。
【0021】命令フェッチ部14は、図示しないメモリ
からデータ転送命令や演算命令などの命令を順次フェッ
チし、命令デコード実行制御部16に供給する。命令デ
コード実行制御部16では、入力した命令をデコード
し、演算部に出力する。また、レジスタファイル部18
の内容を読み出し、ソースバスを介して演算部に供給す
る。デコードした命令が加減算などの演算命令である場
合には、ALU20などでその演算が実行される。演算
結果はリザルトバスを介してメモリアクセス部28に供
給され、レジスタ書込部30がレジスタファイル部18
に書き戻す。また、デコードした命令がメモリへのスト
ア命令の場合には、メモリアクセス部28を介してデー
タがメモリに書き込まれ、また、ロード命令の場合に
は、演算部によって生成されるデータアドレスに従って
メモリの内容が読み出され、レジスタ書込部30がレジ
スタファイルの指定されたレジスタに書き込む。
【0022】以上の処理は、従来のRISCプロセッサ
と同様であるが、本実施形態においては、さらにRIS
Cプロセッサ10にコプロセッサ制御部32が設けられ
ている。このコプロセッサ制御部32は、積和演算コプ
ロセッサ12へのデータ書き込み、演算データ読み取り
を制御している。具体的には、コプロセッサ制御部32
は、RISCプロセッサ10のレジスタ書き込みステー
ジと演算実行ステージとの間にコプロセッサ演算処理を
組み込むようにコプロセッサ12の動作を制御し、コプ
ロセッサ12の後述する入力レジスタ及び出力レジスタ
を、ロード/ストア命令でアクセスできる特殊レジスタ
空間に割り当てる。そして、メモリからコプロセッサ1
2の入力レジスタへのロード命令でコプロセッサ12の
演算、具体的には乗算や積和演算、並びにタスキ掛け演
算を起動し、出力レジスタからメモリへのストア命令に
よってコプロセッサ12の演算結果をプロセッサ10側
で受け取るように制御する。すなわち、コプロセッサ制
御部32は、積和演算コプロセッサ12の動作及びRI
SCプロセッサ10からのデータ入出力を制御し、RI
SCプロセッサ10の通常のロード命令及びストア命令
のみで、RISCプロセッサ10がタスキ掛け演算を含
む所望の演算結果を得られるように制御する。
【0023】なお、積和演算コプロセッサ12の動作制
御は、実際にはコプロセッサ制御部32と図示しない積
和演算コプロセッサ12内の制御機構との協動によりな
されるが、本実施形態では便宜上、コプロセッサ制御部
32が積和演算コプロセッサ12の動作を制御するもの
として説明する。もちろん、本発明はこれに限定される
ものではなく、コプロセッサ制御部32の機能の一部を
積和演算コプロセッサ12内の制御機構が実現してもよ
い。
【0024】積和演算コプロセッサ12は、図に示すよ
うに被乗数(係数)を格納する入力レジスタ34及び乗
数を格納する入力レジスタ36を有しており、各入力レ
ジスタ34、36は4段バッファから構成されている。
入力レジスタ34、36は乗算器38に接続され、乗算
器38は更に加算器40に接続されている。これら乗算
器38及び加算器40により乗算演算、積和演算、タス
キ掛け演算を実行する。加算器40には出力レジスタ4
2が接続されており、演算結果はこの出力レジスタ42
に格納される。出力レジスタ42に格納された演算結果
は、上述したようにプロセッサ10からのストア命令に
よってプロセッサ10側に供給される。
【0025】以下、図2を用いて積和演算コプロセッサ
12の演算処理を詳細に説明する。
【0026】既述したように、積和演算コプロセッサ1
2の入出力レジスタ34、36、42はRISCプロセ
ッサ10のロード/ストア命令でアクセス可能な特殊レ
ジスタに割り当てられる。被乗数(係数)及び乗数の入
力レジスタ34、36はそれぞれ4段のバッファで構成
され、RISCプロセッサ10からのロード命令によっ
てそれぞれ最大4個のデータを投入することができる。
そして、乗算器38には演算の種類と状態に応じて入力
レジスタ34、36から適切なデータが供給される。演
算結果は、加算器40に接続された出力レジスタ42に
送られ、RISCプロセッサからのストア命令によって
読み出される。演算結果は、命令デコード・レジスタア
クセスステージの割込受付可能状態で待機して受け取
る。コプロセッサ12の演算は、入力レジスタ36への
乗数の書き込みをトリガーとして起動され、書き込む特
殊レジスタのアドレスによって以下に示す演算の種類が
特定される。 (1)乗算:2入力(被乗数(係数)1、乗数1)1出
力 (2)積和演算:多入力(係数、乗数とも複数)1出力 (3)タスキ掛け演算:4入力(係数2、乗数2)2出
力 (4)タスキ掛け演算:6入力(係数4、乗数2)2出
力 これらのうち、(1)、(2)は従来のコプロセッサで
も演算可能であり、(3)、(4)については、従来の
コプロセッサでは、複数回にわたって同一の係数と乗数
をプロセッサからコプロセッサに供給する必要がある処
理である。
【0027】以下、上記の中の(3)について説明する
が、(4)についても同様である。2個のロード命令に
より被乗数(係数)を入力レジスタ34に2個書き込ん
だ後、1個のロード命令により最初の乗数を入力レジス
タ36に書き込むことで、まず最初の乗算が開始され
る。例えば、アドレスSR12への2個の係数のロード
命令及びアドレスSR13への乗数のロード命令により
入力レジスタ34の0番バッファ及び1番バッファに係
数c0及びc1が書き込まれ、入力レジスタ36の0番
バッファに乗数X0が書き込まれると、まずc0・X0
が乗算器38で乗算され、加算器40に送られる。そし
て、アドレスSR13への2個目の乗数のロード命令に
より乗数X1が入力レジスタ36のバッファに書き込ま
れると、次の乗算c1・X1が乗算器38で行われ、加
算器40に出力される。加算器40では、これら2つの
乗算結果を減算し、c0・X0−c1・X1を演算して
出力レジスタ42に書き込む。出力レジスタ42は図に
示すようにvreg42a及びwreg42bから構成
され、最初の積和演算で得られた積和演算結果、すなわ
ちc0・X0−c1・X1はvreg42aに格納され
る。一方、最初の積和演算と並行して、コプロセッサ1
2は次の乗算c1・X0とc0・X1も実行し、さらに
加算器40でこれらを加算してc1・X0+c0・X1
を得る。演算結果は、他方の出力レジスタであるwre
g42bに格納される。このようにして、タスキ掛け演
算を構成する2個の積和演算結果が出力レジスタ42に
格納される。
【0028】なお、入力レジスタ34、36としては例
えば24ビットレジスタを用いることができ、加算器4
0と出力レジスタ42は64ビット幅を用いることがで
きる。この場合、RISCプロセッサ10はコプロセッ
サ12へのデータ投入時に係数及び乗数の下位24ビッ
トを転送して入力レジスタ34、36に書き込み、演算
結果を出力レジスタ42からストア命令により受け取る
時には、64ビットの演算結果を上位、下位32ビット
幅ずつ取り出せばよい。例えば、アドレスSR12のス
トア命令で演算結果の上位32ビットを出力レジスタ4
2から取り出し、アドレスSR13のストア命令で演算
結果の残りのビット、つまり下位32ビットを出力レジ
スタ42から取り出すなどである。本実施形態では、出
力レジスタはvreg42a及びwreg42bの2個
存在するので、実際に読み出す際には、まずvreg4
2aから上位32ビット、次にvreg42aから下位
32ビット、次にwreg42bから上位32ビット、
最後にwreg42bから下位32ビットを読み出す
か、あるいは、まずvreg42aから上位32ビッ
ト、次にwreg42bの上位32ビット、次にvre
g42aの下位32ビット、最後にwreg42bの下
位32ビット、と読み出せばよい。
【0029】また、入力レジスタ34、36の4段バッ
ファを利用し、タスキ掛け演算に用いられた入力データ
はバッファから消去されるので、係数及び乗数の組を順
次入力した連続的なタスキ掛け演算も可能である。
【0030】さらに、コプロセッサ12はタスキ掛け演
算のみならず、通常の乗算演算、積和演算も実行するこ
とができ、例えば係数cをアドレスSR8に書き込み、
乗数XをSR9に書き込むと、乗数がSR9に書き込ま
れたことをトリガーとして、コプロセッサ12はc・X
を演算し、出力レジスタに書き込む。そして、演算結果
の読み出し時にはアドレスSR8のストア命令で乗算結
果の上位32ビットを読み出し、アドレスSR9のスト
ア命令で乗算結果の下位32ビットを読み出す。
【0031】このように、本実施形態では入力レジスタ
34、36にそれぞれ係数及び乗数を書き込み、書き込
まれるアドレスにより演算の種類が特定されてタスキ掛
け演算が自動起動され、その演算結果が出力レジスタに
書き込まれてプロセッサ10側に供給されるので、プロ
セッサ10では単にロード命令、ストア命令のみで所望
のタスキ掛け演算結果を得ることができ、バタフライ演
算、ひいてはDCT/IDCT(あるいはMDCT/I
MDCT)を高速で実行することができる。
【0032】なお、BSデジタル放送で規定される最大
オーディオサンプリング周波数48kHzの場合、1ブ
ロック1024サンプルのデコードに許容される時間は
21.3msecであるが、本願出願人は、上述したR
ISCプロセッサ10及びコプロセッサ12(動作周波
数は81MHz)を用いてこのデコード処理を約17.
4msecで実行できることを確認している。このこと
は、比較的低速な動作周波数でも十分に短い時間でデコ
ード処理を完了でき、機器の低廉化を図ることができる
ことを意味する。
【0033】以上、本発明の実施形態を画像信号や音声
信号の圧縮/伸長処理に用いられるDCT/IDCT変
換を例にとり説明したが、本発明の特徴はプロセッサの
ロード命令によってコプロセッサ12に対してタスキ掛
け演算を自動起動して演算させ、ストア命令によってそ
の演算結果を受け取る点に特徴があるので、タスキ掛け
演算が必要な任意の処理にも適用することが可能であ
る。
【0034】
【発明の効果】以上説明したように、本発明によればタ
スキ掛け演算を高速で実行することができるので、画像
信号や音声信号の圧縮/伸長を簡易なハードウエア構成
で、かつ、高速に実行することができる。
【図面の簡単な説明】
【図1】 本発明の実施形態の構成ブロック図である。
【図2】 図1におけるプロセッサの作用説明図であ
る。
【図3】 DCT/IDCTの説明図である。
【図4】 2次元DCTを1次元化した説明図である。
【図5】 DCT/IDCTのバタフライ演算説明図で
ある。
【図6】 図5におけるタスキ掛け演算の説明図であ
る。
【符号の説明】
10 プロセッサ、12 コプロセッサ(積和演算コプ
ロセッサ)。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 岩橋 大輔 大阪府守口市京阪本通2丁目5番5号 三 洋電機株式会社内 Fターム(参考) 5B045 GG06 GG09 5B056 AA01 AA05 BB11 EE01 HH03 HH05 5C059 KK10 MA23 SS30 UA29 UA38

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 プロセッサ及びコプロセッサを備えたデ
    ータ処理装置であって、 前記コプロセッサは、 前記プロセッサから供給されたデータを格納する入力レ
    ジスタと、 前記入力レジスタへの前記データの書き込みをトリガと
    してタスキ掛け演算を実行する演算器と、 前記演算器での演算結果を格納する出力レジスタと、 を有することを特徴とするデータ処理装置。
  2. 【請求項2】 請求項1記載の装置において、 前記入力レジスタ及び前記出力レジスタは、前記プロセ
    ッサがロード命令及びストア命令でアクセスできるレジ
    スタ空間に割り当てられ、 前記入力レジスタへのデータの書き込みは、前記プロセ
    ッサのロード命令で実行され、 前記出力レジスタからの演算結果の読み出しは、前記プ
    ロセッサのストア命令で実行されることを特徴とするデ
    ータ処理装置。
  3. 【請求項3】 請求項1、2のいずれかに記載の装置に
    おいて、 前記演算器は、前記データの書き込みアドレスに応じて
    前記タスキ掛け演算を含む複数種類の演算を実行するこ
    とを特徴とするデータ処理装置。
  4. 【請求項4】 請求項1〜3のいずれかに記載の装置に
    おいて、 前記プロセッサは、離散コサイン変換演算あるいは離散
    コサイン逆変換演算を実行し、 前記コプロセッサは、前記プロセッサからの命令に基づ
    いて、前記離散コサイン変換演算あるいは前記離散コサ
    イン逆変換演算に含まれるタスキ掛け演算を実行するこ
    とを特徴とするデータ処理装置。
JP5326099A 1999-03-01 1999-03-01 データ処理装置 Pending JP2000250895A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5326099A JP2000250895A (ja) 1999-03-01 1999-03-01 データ処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5326099A JP2000250895A (ja) 1999-03-01 1999-03-01 データ処理装置

Publications (1)

Publication Number Publication Date
JP2000250895A true JP2000250895A (ja) 2000-09-14

Family

ID=12937821

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5326099A Pending JP2000250895A (ja) 1999-03-01 1999-03-01 データ処理装置

Country Status (1)

Country Link
JP (1) JP2000250895A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111597886A (zh) * 2020-04-07 2020-08-28 安凯(广州)微电子技术有限公司 一种用于指纹图像处理的硬件加速器、系统及加速方法
JP2021111313A (ja) * 2019-12-31 2021-08-02 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 情報処理用方法及び装置
CN114302148A (zh) * 2021-12-14 2022-04-08 山东芯慧微电子科技有限公司 一种基于risc-v处理器的视频压缩卡的加速处理方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021111313A (ja) * 2019-12-31 2021-08-02 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 情報処理用方法及び装置
JP6998991B2 (ja) 2019-12-31 2022-01-18 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 情報処理用方法及び装置
CN111597886A (zh) * 2020-04-07 2020-08-28 安凯(广州)微电子技术有限公司 一种用于指纹图像处理的硬件加速器、系统及加速方法
CN111597886B (zh) * 2020-04-07 2023-11-07 广州安凯微电子股份有限公司 一种用于指纹图像处理的硬件加速器、系统及加速方法
CN114302148A (zh) * 2021-12-14 2022-04-08 山东芯慧微电子科技有限公司 一种基于risc-v处理器的视频压缩卡的加速处理方法

Similar Documents

Publication Publication Date Title
JP4064989B2 (ja) パック・データの乗加算演算を実行する装置
US5859997A (en) Method for performing multiply-substrate operations on packed data
US5983256A (en) Apparatus for performing multiply-add operations on packed data
US7555514B2 (en) Packed add-subtract operation in a microprocessor
US8051123B1 (en) Multipurpose functional unit with double-precision and filtering operations
JPH11511575A (ja) パック・データを処理する1組の命令
JP4349265B2 (ja) プロセッサ
JP3729540B2 (ja) 画像処理装置
JPH09507941A (ja) multiply−add浮動小数点シーケンスにおけるウエイト・サイクルなしのブロック正規化
JPH04167168A (ja) 信号処理プロセッサ
US5583806A (en) Optimized binary adder for concurrently generating effective and intermediate addresses
KR20210033757A (ko) 메모리 장치 및 그 동작 방법
JPH08123682A (ja) ディジタル信号処理装置
US6078940A (en) Microprocessor with an instruction for multiply and left shift with saturate
JP2000250895A (ja) データ処理装置
US20040128335A1 (en) Fast fourier transform (FFT) butterfly calculations in two cycles
US6922771B2 (en) Vector floating point unit
JPH0766372B2 (ja) 浮動小数点演算処理装置
JP2001092808A (ja) データ処理装置
US20030145030A1 (en) Multiply-accumulate accelerator with data re-use
JPS6125166B2 (ja)
JP3441847B2 (ja) データメモリを有するプロセッサ
EP1163591B1 (en) Processor having a compare extension of an instruction set architecture
JP3691538B2 (ja) ベクトルデータ加算方法及びベクトルデータ乗算方法
JP3336986B2 (ja) 信号処理プロセッサ及びそれに用いる丸め機能付き積和演算器