JPH09106389A - 信号処理装置 - Google Patents

信号処理装置

Info

Publication number
JPH09106389A
JPH09106389A JP7290300A JP29030095A JPH09106389A JP H09106389 A JPH09106389 A JP H09106389A JP 7290300 A JP7290300 A JP 7290300A JP 29030095 A JP29030095 A JP 29030095A JP H09106389 A JPH09106389 A JP H09106389A
Authority
JP
Japan
Prior art keywords
data
processor
bit
parallel
signal processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7290300A
Other languages
English (en)
Inventor
Seiichiro Iwase
清一郎 岩瀬
Masuyoshi Kurokawa
益義 黒川
Takao Yamazaki
孝雄 山崎
Mitsuharu Oki
光晴 大木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP7290300A priority Critical patent/JPH09106389A/ja
Priority to US08/731,161 priority patent/US5926583A/en
Publication of JPH09106389A publication Critical patent/JPH09106389A/ja
Priority to US09/228,237 priority patent/US6038350A/en
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N5/926Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N11/00Colour television systems
    • H04N11/24High-definition television systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/46Receiver circuitry for the reception of television signals according to analogue transmission standards for receiving on more than one standard at will

Abstract

(57)【要約】 【課題】処理能力が高く、汎用性のある簡易な構成の信
号処理装置を実現し難かつた。 【解決手段】ビツト処理プロセツサエレメントを多数1
次元配列した多並列デイジタルシグナルプロセツサを1
つのプロセツサブロツクとして、複数の当該プロセツサ
ブロツクを冗長性を削除しながら順次接続することによ
りプロセツサブロツク列を形成すると共に、後段のプロ
セツサブロツク列に対しては前段のプロセツサブロツク
列の出力又は入力データのいずれか一方を供給し、かつ
これら各プロセツサブロツク列の出力のいずれかを最終
出力として出力するように複数のプロセツサブロツク例
を順次接続するようにしたことにより、処理能力の高
く、汎用性のある簡易な構成の信号処理装置を実現でき
る。

Description

【発明の詳細な説明】
【0001】
【目次】以下の順序で本発明を説明する。 発明の属する技術分野 従来の技術(図14〜図16) 発明が解決しようとする課題(図14〜図16) 課題を解決するための手段(図1〜図13) 発明の実施の形態 (1)第1実施例 (1−1)プロセツサブロツクの横方向の拡張 (1−2)第1実施例によるビデオ信号用プロセツサの
構成(図1、図2及び図4) (1−3)第1実施例の動作(図1及び図2) (1−4)第1実施例の効果(図1及び図2) (1−5)他の実施例(図1〜図4) (2)第2実施例 (2−1)プロセツサブロツクの縦方向の拡張(図5) (2−2)第2実施例によるビデオ信号用プロセツサの
構成(図5〜図7) (2−3)プロセツサエレメントの詳細構成(図6〜図
12) (2−4)第2実施例の動作(図6〜図12) (2−5)水平走査期間を単位とするパイプライン動作
(図6〜図12) (2−6)命令サイクルを単位とするパイプライン動作
(図6〜図12) (2−7)第2実施例の効果(図6〜図12) (2−8)他の実施例(図6〜図12) (3)第3実施例 (3−1)第3実施例によるビデオ信号用プロセツサの
構成(図13) (3−2)第3実施例の効果(図13) (3−3)他の実施例(図13) 発明の効果
【0002】
【発明の属する技術分野】本発明は信号処理装置に関
し、例えばテレビジヨン装置やビデオテープレコーダ、
セツトトツプボツクス、マルチメデイアコンピユータ、
放送機器等に組み込まれるDSP−LSI(Digital Si
gnal Processor−Large Scale Integrated circuit)に
適用して好適なものである。
【0003】
【従来の技術】従来、テレビジヨン信号などの映像信号
のデイジタル信号処理をプログラマブルに実現するプロ
セツサの構成として、SIMD制御(Single Instructi
on stream Multi Data stream /全てのプロセツサエレ
メントを一つのプログラムにより連動して動作させる並
列処理制御) のリニアアレイ型プロセツサがある。例え
ば、米国特許第 4,939,575号においてこの種のプロセツ
サの構成が開示されている。
【0004】このプロセツサは、図14に示すように1
ビツトALU(Arithmetic Logic Unit) による演算アレ
イをVRAM(Video RAM) に組み込んだ形になつてい
る。以下この図14について説明する。リニアアレイ型
プロセツサ1は、大きくは、入力SAM( シリアルアク
セスメモリ) 部2、データメモリ部3、ALUアレイ部
4、データメモリ部5、出力SAM部6及びプログラム
制御部7に分けられる。
【0005】入力SAM部2、データメモリ部3、AL
Uアレイ部4、データメモリ部5及び出力SAM部6
は、全体としてリニアアレイ( 直線配列) 型に多数並列
化されたプロセツサエレメント群を構成しており、この
多数のプロセツサエレメントは、プログラム制御部7内
にある共通の一つのプログラム制御部により連動してS
IMD制御される。
【0006】プログラム制御部7にはプログラムメモリ
とそのプログラム歩進のためのシーケンス制御回路があ
り、プログラムメモリにあらかじめ書き込まれたプログ
ラムに従つて、他の各部分に接続されている各種制御信
号により各部分を制御する。なお入力SAM部2、デー
タメモリ部3、データメモリ部5及び出力SAM部6は
基本的にメモリであり、それらのメモリのための ROWア
ドレスデコードは、詳細に説明しないが、図14におい
てはプログラム制御部7に含まれているものとして以下
説明する。
【0007】多数並列化されたプロセツサエレメントの
単一エレメント分は、図14で斜線で示したような縦の
細長い範囲であり、これが図で横方向に直線配列で並ん
でいる。即ち、ひとつのプロセツサエレメントを構成す
るのに必要なごく一般的な図15のようなプロセツサの
構成を、図14の斜線で示した縦の細長いプロセツサエ
レメントがそれぞれ実現している。
【0008】図15の入力バツフアメモリ( IQ) 10
に相当するのが入力SAM部2である。出力バツフアメ
モリ( OQ) 11に相当するのが出力SAM部6であ
る。第1のデータメモリ( RFB) 12に相当するのが
データメモリ部5である。第2のデータメモリ( RF
A) 13に相当するのがデータメモリ部3である。第1
のデータメモリ12と第2のデータメモリ13のデータ
を、必要に応じて選んで演算するためのセレクタ( SE
L) 14A、14B及びALU15に相当するのが、A
LUアレイ部4である。
【0009】このプロセツサエレメントの普通のプロセ
ツサとの違いは、普通のプロセツサではそのハードウエ
アはワード処理プロセツサであり、ワードを単位として
処理するが、このプロセツサの場合はそのハードウエア
はビツト処理プロセツサであり、ビツトを単位として処
理する点である。普通のCPUで言う、8ビツトマシン
とか16ビツトマシンという言い方に対応させれば、1
ビツトマシンであると言える。ビツト処理プロセツサは
ハードウエアが小さく、普通には実現できない程多数の
並列数を実現できるので、画像用の場合、プロセツサエ
レメントの直線配列の並列数は、映像信号の1水平走査
期間の画素数Hに一致させている。
【0010】このプロセツサエレメントの概略構造は、
図16に示すようになつている。入力SAM部2の一つ
のプロセツサエレメント分は、入力ポインタ2Aからの
制御を受ける縦に並んだ複数の入力SAMセル2Bであ
る。入力SAMセル2Bは図14の入力信号DINのビツ
ト数( ISB) 分だけ縦に並べて用意されるのだが、図
16ではそれを省略して一つのセル分の図で代表して示
している。
【0011】データメモリ部3の一つのプロセツサエレ
メント分は、図16におけるメモリセル3Aを、図14
のMABのビツト数分用意して縦に並べているのだが、
図16ではそれを省略して一つのセルだけ代表して示し
ている。なおMABは演算処理の作業メモリとして必要
なだけ用意される。
【0012】ALUアレイ部4の一つのプロセツサエレ
メント分は、図16におけるALUセル4Aである。こ
こでALUセル4A中の正味のALU部分は1ビツトA
LUであり、全加算器( フルアダー) 程度の回路であ
る、ALUセル4A中には他に、ALU4Bの入力選択
のためのセレクタ回路SEL等がある。セレクタSEL
は、図中の複数の×印で示すバスとの交点のうちの一つ
のバスからのデータを選択する。なお所定のセレクタS
ELによつて選択されたデータがフリツプフロツプ構成
の1ビツトレジスタFFを介してALU4Bに与えられ
る。
【0013】データメモリ部5の一つのプロセツサエレ
メント分は、図16におけるメモリセル5Aを、図14
のMBBのビツト数分用意して縦に並んでいるのだが、
図16ではそれを省略して一つのセルだけ代表して示し
ている。なおMBBは演算処理の作業メモリとして必要
なだけ用意される。またメモリセル5Aとメモリセル3
Aは同じもので良い。
【0014】出力SAM部6の一つのプロセツサエレメ
ント分は、出力ポインタ6Aからの制御を受ける縦に並
んだ複数の出力SAMセル6Bである。出力SAMセル
6Bは図14の出力信号ビツト数( OSB) 分だけ縦に
並べて用意されるのだが、図16ではそれを省略して一
つのセル分の図で代表して示している。
【0015】入力SAM読みだし信号SIR、メモリアク
セス信号SAA及びSAB、出力SAM書き込み信号SOW
どはメモリセルのワード線であり、セルを横に通過する
と共に、横方向に並ぶ同じ回路要素を同様に接続しなが
ら通過する。これらメモリセルのワード線はアドレスデ
コードがされているものとする。またリードモデイフア
イライトのために、読み出しのための信号はサイクルの
前半、書き込みのための信号はサイクルの後半のタイミ
ングで発生される。
【0016】また図16において、セルを縦に通過する
接続線即ちビツト線とポインタ信号線は、縦方向に並ぶ
回路要素を同様に接続しながら通過するものとする。入
力データバスは、それぞれ横に並ぶ同じ回路要素、即ち
入力SAMセル2Bを同様に接続しながら通過してい
る。出力データバスは、それぞれ横に並ぶ同じ回路要
素、即ち出力SAMセル6Bを同様に接続しながら通過
している。
【0017】次にこのプロセツサの動作を、図14及び
図16を使つて説明する。映像信号の画素データでなる
入力データDINは入力データバスを介して入力SAM部
2に導かれる。入力ポインタ2Aは一つのプロセツサエ
レメントにだけ論理「H」を立てた1ビツト信号即ち入
力ポインタ信号SIPを発生し、論理「H」で指定された
プロセツサエレメントの入力SAMセル2Bに入力デー
タDINが書き込まれる。
【0018】ポインタで指定された入力SAMセル2B
では、トランジスタTr1がオンとなつて、コンデンサ
C1が入力信号DINに応じた電位になる。なお入力デー
タバス及び入力SAMセル2BはそれぞれISBビツト
分だけあるが、図16では1ビツト分だけを示してい
る。
【0019】入力ポインタ信号SIPは、映像信号の一水
平走査期間ごとに、左端から右端のプロセツサエレメン
トに順次論理「H」信号が移動することにより、入力デ
ータDINを、左端のプロセツサエレメントの入力SAM
セル2Bから順に右方向のプロセツサエレメントのSA
Mセル2Bに記憶していくことができ、横に並んだプロ
セツサエレメント数が映像信号の一水平走査期間の画素
数H分であるので、入力映像信号のデータレートに合わ
せたクロツクで、一水平走査期間右方向へSAM書き込
みを続けて、一水平走査期間分の入力データDINを入力
SAM部2に蓄積できる。このような入力動作は水平走
査期間毎に繰り返される。
【0020】プログラム制御部7はこのようにして映像
信号の一水平走査期間のデータが入力SAM部2に蓄積
されるごとに、入力SAM部2、データメモリ部3、A
LUアレイ部4、データメモリ部5及び出力SAM部6
を以下のようにSIMD制御して、処理を実行する。こ
のプログラム制御は、水平走査期間ごとに繰り返され
る。即ち水平走査期間の時間をこのプロセツサの命令サ
イクル周期で割り算したステツプ数だけのプログラムが
組める。なおSIMD制御であるから、以下の動作は全
てのプロセツサエレメントで同時に同様に実行される。
【0021】一水平走査期間分の入力SAM部2に蓄積
された入力データDINは、次の一水平走査期間におい
て、必要に応じてプログラム制御部7の制御のもとに入
力SAM部2からデータメモリ部5へ移され、その後の
演算処理に使われる。この入力SAM部2からデータメ
モリ部5への転送動作は、プログラムによつて、入力S
AM部2の必要なビツトの記憶内容を入力SAM読みだ
し信号SIRにより選んでアクセスしては、転送先のデー
タメモリ部5の所定のメモリセル5Aへメモリアクセス
信号SABを出して書き込んでいくことにより実現する。
【0022】ここで入力SAM読み出し信号SIRとメモ
リアクセス信号SABはワード線であり、それぞれ複数あ
るが、これらはアドレスデコーダでデコードされてい
る。またこれらワード線はリードモデイフアイライトの
ために、読み出しのための信号はサイクルの前半、書き
込みのための信号はサイクルの後半のタイミングで発生
される。
【0023】入力SAM読み出し信号SIRにより選ばれ
た入力SAMセル2Bでは、前半サイクルでトランジス
タTr2がオンとなつて、コンデンサC1の電位に応じ
た転送データ信号が上部の縦のビツト線に生じる。この
データ転送は縦方向のビツト線を経由して1サイクルに
1ビツトづつ行われる。このデータ転送に際して、AL
U4Bで処理することは何もないが、ALUセル4Aを
通過するようにされる。即ち各セレクタSELは、転送
データがALU4Bを通過するように経路を選択し、A
LU4Bには無演算の命令が出される。そしてALU出
力制御信号SBBが所定のタイミングで発生され、トラン
ジスタTr5がオンとなつて、後半サイクルにALU出
力が下部のビツト線に出る。
【0024】ALU4Bを通過した転送データは、メモ
リアクセス信号SABで選択されたデータメモリ部5の所
定のメモリセル5BのトランジスタTr6が後半サイク
ルにオンとなつて、コンデンサC3が転送データに応じ
た電位になる。入力SAM部2の各入力SAMセル2B
からの読み出し信号SIRとデータメモリ部3の各メモリ
セル3Aへメモリアクセス信号SAAは同じアドレス空間
にあり、メモリの同じ ROWデコーダでデコードされて、
ワード線として与えられるものである。
【0025】データの演算処理にあたつては、まずその
準備として必要に応じてデータメモリ部3とデータメモ
リ部5の間で、所定のメモリセルへメモリアクセス信号
AA、SABを出して読み出しと書き込みを行い、データ
を移動する。例えばデータメモリ部5からデータメモリ
部3への転送の場合であれば、データメモリ部5の所定
のメモリセル5Aへ読み出しメモリアクセス信号SAB
出してトランジスタTr6を前半サイクルオン状態にし
てコンデンサC3の電位に応じた転送データを下のビツ
ト線に出し、入力SAM部2からデータメモリ部5への
データ転送の場合と同様に、ALU4Bで処理すること
は何もないが、ALUセル4Aを通るようにALUアレ
イ部4を制御し、ALU出力制御信号SBAを所定のタイ
ミングで発生してトランジスタTr4をオンにして、後
半サイクルに転送データを上のビツト線に出す。そし
て、データメモリ部3の所定のメモリセル3Aへ書き込
みメモリアクセス信号SAAを出してトランジスタTr3
を後半サイクルオン状態にして、コンデンサC2が転送
データに応じた電位になる。
【0026】このようにしてデータメモリ部3とデータ
メモリ部5には、過去に上述のようにして書き込まれた
入力データDINや演算途中のデータが記憶されている。
それらのデータ或いはALUセル4A中の1ビツトレジ
スタFFに記憶したデータを用いて、ALU4Bでのビ
ツトごとの必要な演算処理を順次進めることができる。
例えばデータメモリ部3のあるビツトのメモリセル3A
のデータとデータメモリ部5のあるビツトのメモリセル
5Aのデータを加算してデータメモリ部5の今読み出し
たビツトのメモリセル5Aに加算結果を書き込む場合は
以下のようになる。
【0027】即ち、データメモリ部3の所定のビツトの
メモリセル3Aへ読み出し信号SAA及びデータメモリ部
5の所定のビツトのメモリセル5Aへは読み出し信号S
ABをサイクルの前半に出し、両方のメモリセルのトラン
ジスタTr3とTr6をオンにして、データをそれぞれ
のビツト線に出す。データメモリ部3から読み出された
データとデータメモリ部5から読み出されたデータは、
ALUアレイ部4のセレクタSELに所定の経路選択を
させ、ALU4Bに加算をさせ、ALU4Bからの出力
は、ALU出力制御信号SBBを所定のタイミングで発生
してトランジスタTr5をオンにして、後半サイクルに
演算結果データを下のビツト線に出す。そして、データ
メモリ部5の所定のメモリセル5Aへ書き込みメモリア
クセス信号SABを出して、トランジスタTr6を後半サ
イクルオン状態にして、コンデンサC3がALU出力デ
ータに応じた電位になる。
【0028】このALUセル4Aでの演算動作は、AL
U制御信号SALU-CONTによりプログラムから指定され
る。ALUセル4Aで演算した結果は、再びデータメモ
リ部3或いはデータメモリ部5に書き込むか、或いは必
要に応じてALUセル4A中の1ビツトレジスタFFに
記憶することもできる。加算の場合は普通、キヤリーを
1ビツトレジスタFFに、サムをデータメモリ部5に導
く。
【0029】このようにしてALUセル4Aの上下に存
在するデータメモリ部3とデータメモリ部5から、プロ
グラムに応じてデータを読み出しては、ALUアレイ部
4で必要な算術演算或いは論理演算を施し、再びデータ
メモリ部3或いはデータメモリ部5の所定のアドレスに
書き込むことができる。この演算処理は全てビツト処理
であり、サイクル当たり1ビツトづつ処理を進める。
【0030】一水平走査期間の時間内に処理すべき演算
処理が済むと、その水平走査期間のうちに、プログラム
の最後の部分でその水平走査期間分の演算処理済みの出
力データを出力SAM部6に移す必要がある。
【0031】今出力すべきデータがデータメモリ部3に
ある場合には、所定のメモリセル3Aへメモリアクセス
信号SAAをサイクルの前半に出して読み出しを行い、A
LUアレイ部4を通過させ、また出力SAM部6の所定
のビツトの出力SAMセル6Bにデータ転送されるよう
に、その出力SAMセル6Bにサイクルの後半に書き込
み信号SOWが発生される。データは縦方向のビツト線を
経由して1ビツト1ビツトデータ転送される。またこの
ときもデータ移動に際してALU4Bで処理することは
何もないが、ALUセル4Aを通るようになつており、
その際ALU出力制御信号SBBが所定のタイミングで発
生される。細かい動作説明は、上記と同じなので省略す
る。
【0032】出力SAM部6の各出力SAMセル6Bへ
の書き込み信号SOWとデータメモリ部5の各メモリセル
5Aへメモリアクセス信号SABは同じアドレス空間にあ
り、メモリの同じ ROWデコーダでデコードされて、ワー
ド線として与えられるものである。
【0033】以上のように、一水平走査期間の時間のう
ちに、入力SAM部2に蓄積された入力データDINのデ
ータメモリ部3、5への移動、必要なデータメモリ部
3、5間のデータ移動、必要な演算処理、そして出力S
AM部6への出力データの移動までが、ビツトを単位と
するSIMD制御プログラムで制御される。このプログ
ラム処理は水平走査期間を単位として繰り返される。S
IMD制御なので、全てのプロセツサエレメントは連動
動作をしており、水平走査期間分の画素数Hに対して、
同じ処理がなされる。
【0034】このプログラム処理が終わつて出力SAM
部6に移された出力データは、更に次の水平走査期間
に、以下のように出力SAM部6から出力される。出力
データは出力SAM部6から出力データバスへ導かれ、
このプロセツサの外へ出力される。出力ポインタ6A
は、一つのプロセツサエレメントにだけ論理「H」を立
てた1ビツト信号即ち出力ポインタ信号SOPを発生し、
その論理「H」で指定されたプロセツサエレメントの出
力SAMセル6Bから出力データが出力データバスに読
み出され、出力データSOUT となる。出力データバス及
び出力SAMセル6Bは、それぞれOSBビツトだけあ
るが、図16では1ビツト分だけを示している。
【0035】出力ポインタ6Aで指定された出力SAM
セル6Bでは、トランジスタTr8がオンとなつて、コ
ンデンサC4の電位に応じた出力信号が出力データバス
に得られる。出力ポインタ信号SOPが、映像信号の一水
平走査期間ごとに、左端から右端のプロセツサエレメン
トに「H」信号が移動することにより、出力データの読
み出しは、左端のプロセツサエレメントの出力SAMセ
ル6Bから順に右方向のプロセツサエレメントの出力S
AMセル6Bに移つて行き、横に並んだプロセツサエレ
メント数が映像信号の一水平走査期間の画素数H分であ
るので、出力映像信号のデータレートに合わせたクロツ
クで、一水平走査期間分の出力データDOUT を出力SA
M部6から出力できる。このような出力動作は水平走査
期間毎に繰り返される。因に図16の各セルの構造は、
理解を容易にするために非常に一般的なものとして示し
ている。
【0036】一般にCPUやDSPと呼ばれるプログラ
ム制御プロセツサは図15について上述したように、入
力データDINはまずバツフアメモリ10を介してデータ
メモリ部12に書き込まれ、その後で、データメモリ部
12に書き込まれた、今入力されたばかりのデータや、
データメモリ部12やデータメモリ部13にある、前に
入力されたデータや、前に演算処理をした処理過程のデ
ータなどを、メモリアドレスとセレクタ14A、14B
で選んでALU15に導いては演算操作をし、再びデー
タメモリ部12やデータメモリ部13に記憶する。そし
てその演算処理結果は、データメモリ部12から出力バ
ツフアメモリ11を介して出力される。
【0037】図14のリニアアレイ型プロセツサ1で
は、入力バツフアメモリ10に対して入力SAM部2
を、出力バツフアメモリ11に対して出力SAM部6
を、データメモリ12に対してデータメモリ部5を、デ
ータメモリ13に対してデータメモリ部3を、セレクタ
14A、14B及びALU15に対してALUアレイ部
4をそれぞれ対応させて設けている。
【0038】そしてリニアアレイ型プロセツサ1におい
ては、入力データDINの入力SAM部2への書き込みに
よる入力動作を第1の動作とし、プログラム制御部7の
SIMD制御による、入力SAM部2に蓄積された入力
データDINのデータメモリ部3、5への移動、必要なデ
ータメモリ部3、5間のデータ移動、必要な演算処理及
び出力SAM部6への出力データDOUT の移動を第2の
動作とし、出力データDOUT の出力SAM部6からの読
み出しによる出力動作を第3の動作とすると、これら3
つの動作は、映像信号の一水平走査期間を単位とするパ
イプライン動作になつており、ひとつの水平走査期間の
入力データDINに注目すれば、それぞれの動作は一水平
走査期間の時間づつずれた形で実行されるが、3つの動
作は連続して同時に並行して進行できる。
【0039】
【発明が解決しようとする課題】ところで従来のプロセ
ツサにおいては、上述のように入力SAM部、第1のデ
ータメモリ部、ALUアレイ部、第2のデータメモリ部
及び出力SAM部から構成されており、このように構成
されたプロセツサの処理能力は、例えば図14の縦方向
の長さを長く、すなわち入力SAM部2、データメモリ
部3、ALUアレイ部4、データメモリ部5及び出力S
AM部とのメモリサイズを大きくしたとしてもそれぞれ
のデータメモリのアドレス空間が広がるだけで、ワーキ
ングメモリが増えるだけである。
【0040】また図14の横方向の長さを長く、すなわ
ちプロセツサエレメントの並列数を増やしても、このプ
ロセツサエレメントの並列数は適用する映像信号の一水
平走査期間の画素数に対応させて使うので処理性能につ
いては意味がない。従つてかかる構成のプロセツサの処
理性能を向上させるためには、命令サイクルを高速化
し、又はALUを並列化し、或いはプロセツサ全体の並
列化によるしかない問題がある。
【0041】またこのアーキテクチヤのプロセツサで
は、プロセツサのエレメントの並列数は適用する映像信
号の一水平走査期間の画素数に対応させて使うため、汎
用性を考えると画像フオーマツトごとの一水平走査期間
の画素数との対応性の問題がある。すなわち、仮にある
画像フオーマツトの一水平走査期間の画素数にプロセツ
サエレメントの並列数を一致させておくと、別の画像フ
オーマツトの場合に冗長であつたり、不足していたりす
るなどうまく利用できない可能性があつた。
【0042】本発明は以上の点を考慮してなされたもの
で、処理能力が高く、汎用性のある簡易な構成の信号処
理装置を提案しようとするものである。
【0043】
【課題を解決するための手段】かかる課題を解決するた
め第1の発明においては、ビツト処理プロセツサエレメ
ントを1次元配列した多並列デイジタルシグナルプロセ
ツサを1つのプロセツサブロツクとして、複数のプロセ
ツサブロツクを、後段のプロセツサブロツクには入力デ
ータ又は前段のプロセツサブロツクの出力を選択的に供
給し得るようにそれぞれ第1のセレクタを介して接続す
ると共に、各プロセツサブロツクの出力のいずれかを第
2のセレクタにより選択して最終出力として出力し得る
ように信号処理装置を構成するようにした。
【0044】また第2の発明においては、複数のプロセ
ツサブロツクを順次接続すると共に、この際初段のプロ
セツサブロツクを、入力データを直列並列変換する直列
並列変換手段と、データを記憶する第1の記憶手段と、
データを演算処理する第1の演算手段とで形成すると共
に、最終段のプロセツサブロツクを、データを記憶する
第2の記憶手段と、データを演算処理する第2の演算手
段と、データを並列直列変換する並列直列変換手段とで
形成し、かつそれ以外のプロセツサブロツクを、データ
を記憶する第3の記憶手段と、データを演算処理する第
3の演算手段とで形成するようにして信号処理装置を構
成するようにした。
【0045】さらに第3の発明においては、第2の発明
の信号処理装置を1つのプロセツサブロツク列として、
当該プロセツサブロツク列を複数第1の発明のプロセツ
サブロツクと同様に接続するようにして信号処理装置を
構成するようにした。この場合第1の発明では、第1及
び第2のセレクタの切換動作を制御することによつて、
入力データを受け入れるプロセツサブロツク数を自在に
選定することができる。従つて1単位のデータ数(例え
ば入力データが画素データの場合における1水平走査期
間内の画素データ数)が異なる種々のフオーマツトの信
号にビツト処理エレメントが冗長となつたり又は不足し
たりすることなく対応することができる。
【0046】また第2の発明では、複数のプロセツサブ
ロツクを順次接続するようにしたことにより処理能力の
高い信号処理装置を構築することができる。またこの場
合初段プロセツサブロツク、最終段のプロセツサブロツ
ク及び他のプロセツサブロツクを上述のように形成する
ようにしたことにより、複数のプロセツサブロツクを順
次接続する際に不要となる各プロセツサブロツクの構成
要素(例えば初段の出力部としての並列直列変換手段
や、最終段の入力部としての直列並列変換手段等)を省
略して構成を簡易化することができる。
【0047】さらに第3の発明では、第2の発明のよう
に配列された複数のプロセツサブロツクでなるプロセツ
サブロツク列を複数用意し、これらを第1の発明のよう
に接続するようにしたことにより、入力データを受け入
れるプロセツサブロツク列数を自在に選定することがで
きると共に、複数のプロセツサブロツクを順次に接続す
る際に不要となる各プロセツサブロツクの構成要素を省
略することができる。従つて種々のフオーマツトの信号
にビツト処理エレメントが冗長となつたり又は不足した
りすることなく対応することができると共に、構成を簡
易化しながら処理能力を向上させることができる。
【0048】
【発明の実施の形態】以下図面について、本発明の一実
施例を詳述する。
【0049】(1)第1実施例 (1−1)プロセツサブロツクの横方向の拡張 従来、画像のフオーマツトにはいろいろなものがある。
ブランキング期間を除いた場合、画面の横方向(すなわ
ち水平走査期間)の有効画素数は、標準TV信号の一般
的な規格で700 〜1000画素程度であり、高品位TV信号
では、放送局用規格で1920画素、コンスーマ用規格では
1000〜1500画素である。
【0050】このためビツト処理プロセツサエレメント
を多数1次元配列した多並列DSPプロセツサにおいて
は、これらのどれにでも対応し得るようにしようとする
と、2000程度のプロセツサエレメントの並列化が必要に
なるが、2000ものプロセツサエレメントを並列化したの
では、大規模で、かつ標準TV信号の場合に半数以上の
プロセツサエレメントが冗長となる。
【0051】第1実施例ではこの点を考慮し、横方向に
「従来のような並列プロセツサ」を「ブロツク」とし
て、さらにそれを2ブロツク並列化することにより、各
種画像フオーマツトに汎用に対応させ得るようにしよう
とするものである。
【0052】(1−2)第1実施例によるビデオ信号用
プロセツサの構成 図1において、20は全体として第1実施例によるビデ
オ信号用プロセツサを示し、例えば図14のリニアアレ
イ型プロセツサ1からプログラム制御部7を除去したの
と同様に構成された第1及び第2のブロツク21、22
を横方向に並列化することにより構成されている。
【0053】すなわちこのビデオ信号用プロセツサ20
の場合、信号入力端23が第1のブロツク21の入力端
と第1のセレクタ24の第1の切替え端とにそれぞれ接
続されると共に、当該第1のブロツク21の出力端が第
1のセレクタ24の第2の切替え端と第2のセレクタ2
5の第2の切替え端とにそれぞれ接続されている。また
第1のセレクタ25の出力端が第2のブロツク22の入
力端に接続されると共に、当該第2のブロツク22の出
力端が第2のセレクタ25の第1の切替え端に接続さ
れ、かつ第2のセレクタ25の出力端が信号出力端26
に接続されている。
【0054】この場合第1のブロツク21においては、
信号入力端23を介して供給される、画像の一水平走査
期間を単位としたビツト並列かつ時系列直列な画素デー
タでなる映像信号DIN1 に対して第1のプログラム制御
部27の制御のもとに所定の処理を施し、これを出力S
AM部21Bを介して出力する(すなわち第1及び第2
のセレクタ24の各第2の切替え端にそれぞれ送出す
る)ようになされている。同様に第2のブロツク22に
おいては、第1のセレクタ24から供給される映像信号
IN1 又は第1のブロツク21の出力DOUT1に対して第
2のプログラム制御部28の制御のもとに所定の処理を
施し、これを出力SAM部22Bを介して出力する(す
なわち第2のセレクタ25の第1の切替え端に送出す
る)ようになされている。
【0055】また第1及び第2のブロツク21、22に
おいては、それぞれ1次元配列するビツト処理プロセツ
サエレメント数Hが標準TV信号の水平走査期間の画素
数の上限(約1000個)と一致するように選定されてい
る。これは図14の従来例なら最大OSBビツトとな
る。ここで実際上このビデオ信号用プロセツサ20にお
いては、映像信号DIN1 として標準TV信号が供給され
た場合、第1のセレクタ24が第2の切替え端を選択す
ると共に、第2のセレクタ25が第1の切替え端を選択
するようになされている。
【0056】これによりこのビデオ信号用プロセツサ2
0においては、信号入力端23を介して供給される標準
TV信号でなる映像信号DIN1 に対して、第1及び第2
のブロツク21、22において順次所定の処理を行うこ
とができ、かくして当該標準TV信号に対して従来の2
倍の処理を施し得るようになされている。
【0057】なおこのときの動作タイミングを図2に示
す。この図2において(A)は映像信号DIN1 の各ライ
ンデータの入力のタイミングを、(B)は第1のブロツ
ク21における各ラインデータの処理タイミングを、
(C)は第1のブロツク21から第2のブロツク22へ
の各ラインデータの転送タイミングをそれぞれ示してい
る。また(D)は第2のブロツク22における各ライン
データの処理タイミングを示し、(E)は各ラインデー
タの第2のセレクタ25からの出力タイミングを示して
いる。
【0058】一方映像信号DIN1 としてHDTV信号が
入力された場合、第1のブロツク21は、当該映像信号
IN1 の一水平走査期間の各画素データを半数に分けた
ときの前半の各画素データだけを入力SAM部21Aを
介して選択的に入力すると共に、第1のセレクタ24
は、第1の切替え端に供給される映像信号DIN1 の一水
平走査期間の各画素データを半数に分けたときの後半の
各画素データだけを選択的に第2のブロツク22の入力
SAM部22Aに送出するようになされている。
【0059】この場合第1及び第2のブロツク21、2
2の各入力SAM部21A、22A及び各出力SAM部
21B、22Bは、それぞれ一水平走査期間を半分に分
けた後半又は前半の時間中、動作を停止するようになさ
れている。また第2のセレクタ25は、第1のブロツク
21の出力DOUT1が供給されるタイミングで第2の切替
え端を選択し、かつ第2のブロツク22の出力DOUT2
供給されるタイミングで第1の切替え端を選択するよう
になされている。
【0060】これによりこのビデオ信号用プロセツサ2
0においては、HDTV信号でなる映像信号DIN1 の一
水平走査期間の前半部分を第1のブロツク21で処理す
ると共に、後半部分を第2のブロツク22で処理し得る
ようになされ、かくして第1及び第2のブロツク21、
22の各ビツト処理プロセツサエレメント数H(この第
1実施例ではそれぞれ1000個)よりも一水平走査期間の
画素数の多いHDTV信号に対しても所定の処理を施し
得るようになされている。
【0061】なお図1では、第1及び第2のブロツク2
1、22の入力端子数(入力ビツト数ISB(図1
4))と出力端子数(出力ビツト数OSB(図14))
が同数だとする限りは支障がないが、これが違つている
と不自然な部分が生じる。すなわち第1及び第2のセレ
クタ24、25において、その入力の2系統の端子数が
違つていたのでは、これら第1及び第2のセレクタ2
4、25がどのような選択をするのかが理解し難い。従
つてこの実施例では、第1、第2のブロツク21、22
の出力端子数OSBの方が多ければ、これら出力端子数
OSBのうちの入力端子数ISB分のみが第1、第2の
セレクタ24、25においてその入力として受け入れら
れるものとし、また入力端子数ISBの方が多い場合に
は、第1のブロツク21からの配線が当該第1のセレク
タ24の入力の一部にのみ接続されているものとする。
【0062】(1−3)第1実施例の動作 以上の構成において、このビデオ信号用プロセツサ20
では、映像信号DIN1として標準TV信号が供給された
場合、第1のセレクタ24が第2の切替え端を選択し、
かつ第2のセレクタ25が第1の切替え端を選択するこ
とにより、当該映像信号DIN1 に対して第1及び第2の
ブロツク21、22においてそれぞれ所定の処理を施
し、かくして得られる第2のブロツク22の出力DOUT2
を信号出力端26を介して出力信号DOUT3として外部に
出力する。
【0063】一方映像信号DIN1 として標準TV信号が
供給された場合には、この映像信号DIN1 の一水平走査
期間の前半を第1のブロツク21で処理すると共に、後
半を第2のブロツク22で処理し、この後これらを第2
のセレクタ25を介して元の時系列の並びに戻すことに
より出力信号DOUT3を得、これを信号出力端26を介し
て外部に出力する。
【0064】この場合このビデオ信号用プロセツサ20
では、上述のように第1のセレクタ24の切替えによつ
て映像信号DIN1 を受け入れるブロツク21、22を選
択でき、また第1及び第2のブロツク21、22の1次
元配列するビツト処理プロセツサレメント数Hがそれぞ
れ標準TV信号の一水平走査期間の画素数の上限に合わ
せているため、例えば映像信号DIN1 として標準TV信
号が供給された場合でも、各第1及び第2のブロツク2
1、22のビツト処理プロセツサエレメントの数が冗長
とならず、また映像信号DIN1 としてHDTV信号が供
給された場合でも各第1及び第2のブロツク21、22
のビツト処理プロセツサエレメントの数が不足すること
がない。
【0065】従つてビデオ信号用プロセツサをこのよう
に構成することによつて、映像信号DIN1 として標準T
V信号及びHDTV信号のいずれが供給された場合にお
いても実用上十分に対応することができる。因に、映像
信号DIN1 としてHDTV信号が供給された場合と、標
準TV信号が供給された場合とでは、サンプリング周波
数の違いのために入出力のデータレートが異なり、この
結果第1及び第2のブロツク21、22の各入力SAM
部21A、22Aへの入力速度や各出力SAM部21
B、22Bからの出力速度の違いが生じるが、この他に
水平走査期間の時間が異なるためにプログラムできる命
令ステツプ数が異なる。
【0066】すなわち水平走査期間の時間をTとし、プ
ロセツサの命令サイクルタイムをtとすると、プログラ
ム可能な命令ステツプ数の限界Lは、次式
【数1】 で与えられる。従つて映像信号DIN1 としてHDTV信
号が供給された場合には、標準TV信号が供給された場
合に比べてプログラムできるステツプ数が少なくなるの
で注意が必要である。
【0067】(1−4)第1実施例の効果 以上の構成によれば、ビツト処理プロセツサエレメント
を多数1次元配列した多並列DSPプロセツサをブロツ
クとして、第1のブロツク21に映像信号DIN1 を供給
すると共に、第2のブロツク22に第1のブロツク21
の出力又は信号入力端子23に供給される映像信号D
IN1 を第1のセレクタ24により選択的に供給し、かつ
最終出力として第1又は第2のブロツク21、22の各
出力DOUT1、DOUT2のいずれかを第2のセレクタ25に
より選択的に出力するようにしたことにより、映像信号
IN1 として標準TV信号及びHDTV信号のいずれが
供給された場合においても無駄なく汎用に対応すること
ができ、かくして各種の画像フオーマツトに汎用的に対
応し得るビデオ信号用プロセツサを実現できる。
【0068】(1−5)他の実施例 なお上述の第1実施例においては、本発明をビデオ信号
用プロセツサに適用するようにした場合について述べた
が、本発明はこれに限らず、この他種々の信号処理装置
に適用することができる。また上述の第1実施例におい
ては、ビツト処理プロセツサエレメントを1次元配列し
た多並列DSPプロセツサでなるプロセツサブロツク
(第1及び第2のブロツク21、22)を2つだけ接続
配列するようにした場合について述べたが、本発明はこ
れに限らず、要は、各プロセツサブロツクに対して対応
する第1のセレクタにより前段のプロセツサブロツクの
出力又は入力データのいずれか一方を選択的に供給する
と共に、これら各プロセツサブロツクの出力のいずれか
を第2のセレクタにより選択的に最終出力として出力す
るように各プロセツサブロツクを順次接続するようにし
て信号処理装置(ビデオ信号用プロセツサを含む)を構
成するのであれば、接続するプロセツサブロツク数とし
ては3つ以上であつても良い。
【0069】さらに上述の第1実施例においては、第1
及び第2のブロツク21、22を、例えば図14のリニ
アアレイ型プロセツサ1からプログラム制御部7を除去
したのと同様に構成するようにした場合について述べた
が、本発明はこれに限らず、要は、ビツト処理プロセツ
サエレメントを1次元配列することにより形成された多
並列DSPプロセツサであるならば、第1及び第2のブ
ロツク21、22の構成としては、この他種々の構成を
適用できる。
【0070】この場合例えば本発明を適用してビデオ信
号用プロセツサを構築するのであれば、供給されるビツ
ト並列かつ時系列直列な画素データを、画像の水平走査
期間を単位としてビツト直列かつ時系列並列に変換する
直列並列手段と、当該直列並列変換手段によりビツト直
列かつ時系列並列に変換された画像データを水平走査期
間を単位として演算する演算手段と、ビツト直列かつ時
系列並列な画像データを、画像の水平走査期間を単位と
してビツト並列かつ時系列直列に並列直列変換して出力
する並列直列変換手段とで第1及び第2のブロツク2
1、22を構成するようにすれば良い。
【0071】さらに上述の第1実施例においては、画像
信号DIN1 として標準TV信号が供給された場合に、第
1及び第2のセレクタ24、25がいずれも第1の切替
え端を選択するように動作させるようにした場合につい
て述べたが、本発明はこれに限らず、これ以外の動作を
させるようにしても良い。
【0072】例えば第1のセレクタ24に第1の切替え
端を選択させることにより第1及び第2のブロツク2
1、22のそれぞれに映像信号DIN1 を供給すると共
に、これら第1及び第2のブロツク21、22において
それぞれ映像信号DIN1 に対して別の処理を施し、必要
に応じて必要な方の出力DOUT1、DOUT2を第2のセレク
タ25で選択して出力信号DOUT3として出力するように
動作させるようにしても良い。なおこのときのタイミン
グチヤートを図3に示す。この場合図3において、
(A)は映像信号DIN1 の各ラインデータの入力のタイ
ミングを、(B)は第1及び第2のブロツク21、22
での各ラインデータの処理タイミングを、(C)は処理
された各ラインデータの第1及び第2のセレクタ24、
25からの出力タイミングをそれぞれ示す。
【0073】またこの場合の第2のセレクタ25の選択
は、水平走査期間を単位に切り替えることも、画素単位
で切り替えることも可能であり、さらにその切り替えを
何らかの演算の結果によつて作動させるようにしても良
い。さらに外部からの制御信号や条件信号によつて第1
及び第2のブロツク21、22による映像信号DIN1
対する処理内容を代えるようにしても良い。
【0074】また映像信号DIN1 として標準TV信号が
入力された場合の別の動作のさせ方としては、第1のセ
レクタ25には第1の入力端を選択させておき、映像信
号DIN1 として2系統の標準TV信号を倍速で与え、本
来の一水平走査期間の前半でまず片方の系統の標準TV
信号を第2のブロツク22に、後半で他方の系統の標準
TV信号を第1のブロツク21に導き、これら第1及び
第2のブロツク21、22のそれぞれにおいて所定の処
理をして、今度は第2のブロツク22の出力D OUT2と、
第1のブロツク21の出力DOUT1とを順次倍速で出力さ
せ、第2のセレクタ25でも本来の一水平走査期間の前
半と後半とでタイミング良くこれらを選択的に通過させ
て、2系統の映像信号DIN1 の処理結果を両方得ること
ができるようにしても良い。なおこのときのタイミング
チヤートを図4に示す。この場合図4において、(A)
は映像信号DIN1 の各ラインデータの入力のタイミング
を、(B)は第1及び第2のブロツク21、22での各
ラインデータの処理タイミングを、(C)は処理された
各ラインデータの第1及び第2のセレクタ24、25か
らの出力タイミングをそれぞれ示す。
【0075】この場合2系統の標準TV信号の入出力の
倍速化は、上述のように水平走査期間を単位としても良
いが、画素単位であつても良く、要は、第1及び第2の
ブロツク21、22の各入力SAM部21A、22A及
び各出力SAM部21B、22Bや、第1及び第2のセ
レクタ24、25に対応する動作をさせるようにすれば
良い。このとき各第1及び第2のブロツク21、22の
各入力SAM部21A、22A及び各出力SAM部21
B、22Bは倍速動作が必要であるが、これら各入力S
AM部21A、22A及び各出力SAM部21B、22
BはHDTV信号を扱い得ることが前提であるため、標
準TV信号の入力に対しては当然倍速でも扱うことがで
きる。
【0076】またこの場合第1及び第2のブロツク2
1、22での処理内容は、同じであつても又は別々であ
つても良い。さらに上述の第1実施例においては、入力
する映像信号DIN1 がHDTV信号である場合に、一水
平走査期間の各画素の2分割の仕方として前半と後半に
分けるようにした場合について述べたが、本発明はこれ
に限らず、2分割の仕方としては画素単位で交互に分け
るなど、この他種々のバリエーシヨンを適用できる。
【0077】なお上述の第1実施例を含め、このように
一水平走査期間の画素を分割して別々のプロセツサブロ
ツクで処理する場合には、特にフイルタ処理の場合な
ど、入力データを水平走査期間の中央の画素のところで
2分割しては困ることがある。これは例えば水平方向の
デイジタルフイルタのように、その画素ごとの演算処理
に対して隣接する左右の連続画素データも演算に必要な
場合であり、この場合にきれいに分割点を作つてしまう
と、つなぎめの周辺がきちんと計算できなくなる。従つ
てこのような場合には、少しづつデータがオーバーラツ
プするように2つのグループに入力データを分割するよ
うにすれば良い。
【0078】さらに上述の第1実施例においては、第1
及び第2のブロツク21、22に設ける演算手段を図1
4のALUアレイ部4(複数の図16のALUアレイセ
ル4Aからなる)のように構成するようにした場合につ
いて述べたが、本発明はこれに限らず、この他種々の構
成を適用できる。この場合例えばALU4B(図16)
のような演算器の前段又は後段の少なくとも一方にパイ
プラインレジスタを設けるようにしてこの演算手段を構
築すれば、処理の高速化を図ることができる。
【0079】さらに上述の第1実施例においては、第1
及び第2のブロツク21、22の各入力SAM部21
A、22A及び出力SAM部21B、22B並びに他の
記憶手段を図16のように構成するようにした場合につ
いて述べたが、本発明はこれに限らず、これら第1及び
第2のブロツク21、22の各入力SAM部21A、2
2A及び出力SAM部21B、22B並びに他の記憶手
段として、読み出し用の2つのポートを有し、書き込み
用に1つのポートを有する3ポートメモリを適用するよ
うにしても良い。この場合、各ポートのためのビツト線
を書き込み又は読み出しにそれぞれ専用化するようにし
ても良い。
【0080】(2)第2実施例 (2−1)プロセツサブロツクの縦方向の拡張 次に今度は、ビツト処理プロセツサエレメントを多数1
次元配列した多並列DSPプロセツサにおけるプロセツ
サ処理性能を向上させるための技術について説明する。
【0081】先に述べたように、このアーキテクチヤの
プロセツサの処理性能を向上させるには、命令サイクル
を高速化するか、ALUを並列化するか、又はプロセツ
サブロツク全体の並列化によるしかない。以下はプロセ
ツサブロツク全体の並列化に関する方法である。
【0082】第1実施例では、プロセツサブロツク全体
を2つ直列にして2倍の処理を実現しているわけで、既
にある程度目的を達成していると言い得るが、さらに以
下のようなことが考えられる。すなわち第1実施例で
は、ビツト処理プロセツサエレメントを多数1次元配列
した多並列DSPプロセツサをひとつのブロツクとし
て、その2つのブロツク(第1及び第2のブロツク2
1、22)を横方向に並べたわけだが、この第2実施例
ではこれらを縦方向に並べてプロセツサ全体を並列化す
るようにする。
【0083】しかしこれは例えば図5に示すように、第
1及び第2のブロツク21、22を縦方向に並べ、入力
する映像信号DIN1 に対して第1及び第2の各ブロツク
21、22において順次所定の処理を施した後、第2の
ブロツク22の出力DOUT2を最終出力として出力するよ
うにビデオ信号用プロセツサを構成することを意味する
ものではない。実際上これは、第1実施例のビデオ信号
用プロセツサ20において、標準TV信号を第1及び第
2のブロツク21、22により直列処理する場合と同じ
ことである。
【0084】しかしながらこのように構成されたビデオ
信号用プロセツサ30において、第1のブロツク21の
出力SAM部21Bと、第2のブロツク22の入力SA
M部22Aとが冗長であることに気付く。
【0085】すなわちこのビデオ信号用プロセツサ30
の場合、第1のブロツク21において出力SAM部21
Bは、一水平走査期間分の多並列化された各プロセツサ
エレメントの多並列データを並列に受け、それを水平走
査期間の画像信号時系列に戻すために、データ列をパラ
レル/シリアル変換(並列直列変換)しているに他なら
ない。また第2のブロツク22において入力SAM部2
2Aは、水平走査期間の画像信号時系列、すなわち時間
的に直列なデータ列を受けて、水平走査期間分の多並列
化された各プロセツサエレメントへの多並列データにす
るため、データ列をシリアル/パラレル変換(直列並列
変換)しているに他ならない。
【0086】従つて例えばこの図5のようにビデオ信号
用プロセツサを構築する場合、第1のブロツク21の出
力SAM部21B及び第2のブロツク22の入力SAM
部22Aをそれぞれ省略し、第1のブロツク21の出力
SAM部21Bの入力となる多並列データを、直接第2
のブロツク22の入力SAM部22Aの出力の多並列デ
ータと直結しても良いことが分かる。
【0087】(2−2)第2実施例によるビデオ信号用
プロセツサの構成 図6は、第2実施例によるビデオ信号用プロセツサ40
を示し、図5に示すビデオ信号用プロセツサ30の第1
のブロツク21の出力SAM部21Bと第2のブロツク
22の入力SAM部22Aを削除することにより構成さ
れている。またこのビデオ信号用プロセツサ40におい
ては、図14のデータメモリ部3、5に相当する部分を
ビツト線を専用化した1つの3ポートメモリにまとめて
新たなデータメモリ部44、46とし、さらにパイプラ
イン処理を施して性能の向上を計つている。
【0088】従つてこのビデオ信号用プロセツサ40
は、実際上はビツト処理プロセツサエレメントを多数1
次元配列した多並列DSPプロセツサでなる2つのブロ
ツク(第1及び第2のブロツク41、42)から構成さ
れているが、これをひとつのプロセツサブロツク列とし
て考えれば、このプロセツサブロツク列は、図6からも
明らかなように、入力SAM部43、データメモリ部4
4、ALUアレイ部45、データメモリ部46、ALU
アレイ部47、出力SAM部48、プログラム制御部4
9及びプログラム制御部50などからなるひとつの新プ
ロセツサブロツクと言うことができる。
【0089】ここで実際上このビデオ信号用プロセツサ
40の場合、第1のブロツク41は、入力SAM部4
3、データメモリ部44及びALUアレイ部45が、リ
ニアアレイ(直線配列)型に多数並列化されたプロセツ
サエレメント群を構成しており、この多数のプロセツサ
エレメントがプログラム制御部49の共通のプログラム
制御により連動してSIMD制御し得るようになされて
いる。また第2のブロツク42は、データメモリ部4
6、ALUアレイ部47及び出力SAM部48がリニア
アレイ(直線配列)型に多数並列化されたプロセツサエ
レメント群を構成しており、その多数のプロセツサエレ
メントがプログラム制御部50の共通のプログラム制御
により連動してSIMD制御し得るようになされてい
る。
【0090】この場合これらのうち、入力SAM部43
及び出力SAM部48は、図14に示す従来例と全く同
様と考えてよいので、説明を省略する。またプログラム
制御部49及びプログラム制御部50においては、基本
的には従来例とほぼ同様に構成されており、例えば図6
に示すようなアンドゲート回路62でなる調停回路61
を介して通信し得るようになされている。
【0091】一方入力SAM部43、データメモリ部4
4、データメモリ部46及び出力SAM部48は、いず
れも基本的にメモリであり、入力SAM部43及びデー
タメモリ部44と、データメモリ部46及び出力SAM
部48とがそれぞれ同じアドレス空間に置かれている。
またこれらのメモリのためのROW アドレスデコードは、
詳細に説明しないが、プログラム制御部49及びプログ
ラム制御部50に含まれているものとして以下説明す
る。
【0092】第1のブロツク41と第2のブロツク42
を接続した全体を新プロセツサブロツクとして見たと
き、多数並列化されたプロセツサエレメントの単一エレ
メント分は、図6において斜線で示したような縦の細長
い範囲であり、これがこの図6の横方向に直線配列で並
んでいる。すなわちひとつのプロセツサエレメントは、
図15の一般的な書き方に合わせて書くと、図7のよう
な構成に相当する。なおここでのプロセツサエレメント
も、従来例と同じくビツト処理プロセツサである。
【0093】ここでこの図7のプロセツサ63におい
て、入力バツフアメモリ(IQ)51に相当するのが図
6の入力SAM部43であり、出力バツフアメモリ(O
Q)52に相当するのが出力SAM部48である。また
データメモリ(RFR)53に相当するのがデータメモ
リ部44であり、ALU(ALUR)54に相当するの
がALUアレイ部45である。さらにデータメモリ(R
FT)55に相当するのがデータメモリ部46であり、
ALU(ALUT)56に相当するのがALUアレイ部
47である。なお図中においてコントローラ(CONT
R)57及びコントローラ(CONTT)58は、それ
ぞれプログラム制御部49、50に相当する。
【0094】この場合上述のように、図7の各データメ
モリ53、55(すなわち図6のデータメモリ部45と
データメモリ部46)は、従来例と違つてそれぞれ3ポ
ートメモリになつており、これにより1サイクル中に2
つの読み出しと1つの書き込みを同時に行うことができ
る。これら各データメモリ53、55へのアドレシング
は、それぞれ3つのアドレスを同時に与えることにな
る。2つの読み出しポートからの出力は、そのまま図6
のALU54及びALU56(すなわち図6のALUア
レイ部45及びALUアレイ部47)にそれぞれ導かれ
る。
【0095】このALU54(すなわちALUアレイ部
45)の出力は、各データメモリ53、55(すなわち
データメモリ部44とデータメモリ部46)の書き込み
ポートに導かれる。またALU56(すなわちALUア
レイ部47)の出力は、データメモリ55と出力バツフ
アメモリ52(すなわちデータメモリ部46の書き込み
ポートと出力SAM部48)に導かれる。図7の各セレ
クタ(SELR、SELT)59、60は、後述する図
8及び図9のスリーステートバツフアB1、B2、B
3、B4による入力選択機能に相当し、それぞれの3ポ
ートメモリの書き込みポートの入力源を選択するための
ものである。
【0096】ここでこの実施例の場合、図7の入力バツ
フアメモリ51、データメモリ53、55及び出力バツ
フアメモリ52(すなわち図6の入力SAM部43、デ
ータメモリ部44、46及び出力SAM部48)の各メ
モリにおいては、従来例のようなリードモデイフアイラ
イトはしていない。これら各メモリは、書き込みと読み
出しは全て専用のビツト線を有しており、これら専用の
ビツト線を介して命令サイクルの各期間ごとにひとつの
書き込み又は読み出しを行う。
【0097】またデータメモリ53、55(すなわち図
6のデータメモリ部44及びデータメモリ部44)は上
述のように3ポートメモリであり、各ポート専用のビツ
ト線をもつているので、図7のALU54、56(すな
わち図6のALUアレイ部45、47)を介した演算操
作は、後述する命令サイクル単位のパイプライン処理の
ために部分によつて処理サイクルが時間的にずれること
はあるが、毎サイクルごとに1回ずつ行うことができ
る。すなわち演算の前後にデータのメモリからのロード
やストアのための無駄なサイクルは生じない。
【0098】さらに第1のブロツク41と第2のブロツ
ク42のそれぞれのプロセツサエレメントの直線配列の
並列数は、従来例と同じく、扱う映像信号の一水平走査
期間の画素数(H)に一致させるかそれ以上にしてい
る。
【0099】(2−3)プロセツサエレメントの詳細構
成 図8及び図9は、図6に示す新プロセツサブロツクのひ
とつのプロセツサエレメント分(斜線で示す)の構造を
詳細に示したものである。入力SAM部43の一つのプ
ロセツサエレメント分の構成を図10に示す。この図1
0からも明らかなように、入力SAM部43の一つのプ
ロセツサエレメント70は入力ポインタ71と、その制
御を受ける縦に並んだ複数の入力SAMセル72(72
1 、72A2 、……、72AISB )とからなる。実際
上入力SAMセル72は図6の入力する映像信号DIN3
のビツト数分(ISB)だけ縦に並べて用意されるが、
図8ではそれを省略して一つのセル分の図で代表して表
示している。
【0100】またデータメモリ部44の一つのプロセツ
サエレメント分の構成を図11に示す。この図11から
も明らかなように、データメモリ部44の一つのプロセ
ツサエレメント分は、3ポートメモリセル74(74A
1 、74A2 、……、74AMBR )を図8のMBRのビ
ツト数分用意して縦に並べることにより形成されるが、
図10ではそれを省略して一つのセルだけ代表して表示
している。なおメモリのビツト数MBRは、第1のブロ
ツク41での演算処理の作業メモリとして必要なだけ用
意される。
【0101】データメモリ部46の一つのプロセツサエ
レメント分も図11に同じである。すなわち3ポートメ
モリセル75(図9)を、図6のMBTのビツト数分用
意して縦に並べているのだが、図9ではそれを省略して
一つのセルだけ代表して表示している。なおメモリのビ
ツト数MBTは、ブロツクTでの演算処理の作業メモリ
として必要なだけ用意される。ALUアレイ部45及び
ALUアレイ部47の一つのプロセツサエレメント分
は、それぞれ図8及び図9におけるALUセル76、7
7であり、どちらも同じ構成を有している。
【0102】ここでALUセル76、77中の正味のA
LU部分は、それぞれ1ビツトALU78、79であ
り、全加算器(フルアダー)程度の回路である。ALU
セル76、77中にはほかに、ALU78、79の入力
選択のためのセレクタSEL11〜14、SEL15〜
SEL18等がある。セレクタSEL11〜SEL1
3、SEL15〜SEL17は、図中の複数のX印で示
す複数の接続線との交点のうちの一つの接続線からのデ
ータを選択する。なおFF11〜FF14、FF15〜
FF18はフリツプフロツプ(1ビツトレジスタ)を示
す。
【0103】さらに出力SAM部48(図6)の一つの
プロセツサエレメント分を図12に示す。出力SAM部
48は、出力ポインタ81と、その制御を受ける縦に並
んだ複数の出力SAMセル82(82A1 、82A2
……82AOSB )からなる。出力SAMセル82は図6
の出力信号DOUT4のビツト数分(OSB)だけ縦に並べ
て用意されるのだが、図9ではそれを省略して一つのセ
ル分の図で代表して表示している。
【0104】図8及び図9に示す入力SAM読み出し信
号SIR、メモリアクセス信号SRWA、SRRAA、SRRBA
TWA 、STRAA、STRBA及び出力SAM書き込み信号S
OWは、メモリセルのワード線であり、各セルを横に通過
すると共に、横方向に並ぶ各プロセツサエレメントの同
じ回路要素を同様に接続しながら通過する。これらメモ
リセルのワード線はアドレスデコードがされているもの
とする。
【0105】また、各セル72、74、75、76、7
7、82を縦に通過する接続線即ちビツト線とポインタ
信号線は、縦方向に並ぶ回路要素を同様に接続しながら
通過するものとする。入力データバスは、それぞれ横に
並ぶ同じ回路要素、即ち各プロセツサエレメントの入力
SAMセル72を同様に接続しながら通過している。出
力データバスも、それぞれ横に並ぶ同じ回路要素、即ち
出力SAMセルを同様に接続しながら通過している。こ
こで図8及び図9に示す全ての配線はそれぞれ1本であ
る。上述の「バス」とは、その配線が構成するバスのこ
とで、そのうちの1本という意味である。
【0106】(2−4)第2実施例の動作 次にこのビデオ信号用プロセツサ40の動作を、図6、
図8及び図9を使つて説明する。入力する映像信号D
IN3 は入力データバスを介して入力SAM部43に導か
れる。入力ポインタ71による入力SAMセル72への
書き込み動作制御は従来例と同じである。
【0107】横に並んだプロセツサエレメント数が映像
信号DIN3 (映像信号)の一水平走査期間の画素数分
(H)以上あるので、映像信号DIN3 のデータレートに
合わせたクロツクで、一水平走査期間右方向へSAM書
き込みを続けて、一水平走査期間分の入力データを入力
SAM部43に蓄積する。このような入力動作は、水平
走査期間毎に繰り返される。
【0108】プログラム制御部49の動作は、従来例の
場合と制御対象が少し異なるだけで同様である。映像信
号DIN3 の一水平走査期間のデータが入力SAM部43
に蓄積されるごとに、入力SAM部43、データメモリ
部44、ALUアレイ部45を以下のようにSIMD制
御してプログラムされた所定の処理を実行させる。この
プログラム制御は、水平走査期間ごとに繰り返される。
すなわち水平走査期間の時間をこのビデオ信号用プロセ
ツサ40の命令サイクル周期で割り算したステツプ数だ
けのプログラムが組める。
【0109】実施例の場合もSIMD制御であるから、
以下の動作は、全てのプロセツサエレメントで同時に同
様に実行される。まず一水平走査期間分の入力SAM部
43に蓄積された入力データ(すなわち一水平走査期間
分の画素データ)は、次の一水平走査期間において、必
要に応じてプログラム制御部49の制御のもとに入力S
AM部43からデータメモリ部44へ移され、そして演
算処理がなされる。この入力SAM部43からデータメ
モリ部44への転送動作は、入力SAM部43の必要な
ビツトの記憶内容を、入力SAM読み出し信号SIRによ
り選んでアクセスしては、転送先のデータメモリ部44
の所定の3ポートメモリセル74へメモリアクセス信号
RWA を出して書き込んでいく命令サイクルにより実現
する。
【0110】ここで入力SAM読み出し信号SIRとメモ
リアクセス信号SRWA はワード線であり、それぞれ複数
あるが、これらはアドレスデコーダでデコードされてい
る。このデータ転送命令サイクルをさらに詳しく説明す
る。入力SAM読み出し信号SIRにより選ばれた入力S
AMセル74では、トランジスタTr11がONとなつ
て、コンデンサC10の電位に応じた転送データ信号が
データメモリ部44につながる縦のビツト線に生じる。
一方メモリアクセス信号SRWA によつて選ばれた3ポー
トメモリセル74では、トランジスタTr12がONと
なつて、コンデンサC11が転送データに応じた電位と
なる。この際、ビツト線制御信号SRBC 及びその反転信
号SRBC-は、データメモリ部44の書き込みビツト線の
入力源として、入力SAM部43側を選択する。
【0111】このデータ転送は縦方向のビツト線を経由
して1命令サイクルに1ビツトづつ行われる。このデー
タ転送に際しては、従来例と違つてALU78を通過し
ないし、リードモデイフアイライト動作もしない。次に
演算処理動作を説明する。データの演算処理に際して
は、実施例の場合、演算に必要なデータはいつもデータ
メモリ部44にあり、そのデータメモリ部44は読み出
しポートが2つある3ポートメモリなので、従来例のよ
うに、データメモリ部が2つに別れているために、準備
としてデータメモリ間でデータ移動をする必要性などな
い。
【0112】データメモリ部44には、常に、過去に上
述のようにして書き込まれた入力データや演算途中のデ
ータが記憶されている。それらのデータ或いはALUセ
ル76中のいくつかのフリツプチツプ(1ビツトレジス
タ)FF11〜FF14に記憶したデータを用いて、A
LU78でプログラムされたビツトごとの演算処理を順
次進めることができる。例えば、データメモリ部44の
あるメモリセル74のデータ(D1とする)と別のメモ
リセル74のデータ(D2とする)を加算して、更に別
のメモリセル74に加算結果(D3とする)を書き込む
加算命令サイクルの場合の詳細動作は以下のようにな
る。
【0113】すなわちまずデータメモリ部44のデータ
D1が書き込まれているメモリセル74への読み出し信
号SRRAAと、データD2が書き込まれているメモリセル
74への読み出し信号SRRBAを出し、2本の読み出しビ
ツト線にそれぞれのデータを出す。読み出し信号SRRAA
が届いたメモリセル74では、そのメモリセル74のト
ランジスタTr14がONして、コンデンサC11の電
位に応じたデータが読み出しビツト線の片方に出る。ま
た読み出し信号SRRBAが届いたメモリセル74では、そ
のメモリセル74のトランジスタTr15がONして、
そのメモリセル74のコンデンサC11の電位に応じた
データが読み出しビツト線の他方に出る。
【0114】データメモリ部44から読み出されたD1
とD2のデータは、そのサイクルの内にALUアレイ部
45のセレクタSEL11〜SEL14には所定の経路
選択をさせ、ALU78には加算をさせ、ヒマト線制御
信号SRBC 及びその反転信号SRBC-にはデータメモリ部
44の書き込みビツト線の入力源としてALUアレイ部
45側を選択させるので、ALU78の演算結果D3が
データメモリ部44の書き込みビツト線に出る。
【0115】さらにそのサイクルの内に、データメモリ
部44のD3を書き込みたいメモリセル74には、書き
込みメモリアクセス信号SRWA を出すので、そのメモリ
セル74のトランジスタTr12をONにして、コンデ
ンサC11をALU出力データD3に応じた電位にす
る。ここまでが、データD1とデータD2をメモリから
読み出して加算し、加算結果のALU出力データD3を
書き込む演算命令サイクルである。
【0116】このときALUセル76での演算動作は、
ALU制御信号SRALU-CONT によりプログラムから指定
されている。このときALUセル76の中のALU78
は、そのALU制御信号SRALU-CONT により全加算器と
して動作する。そしてその3つの入力は、データD1、
D2とキヤリー入力であり、これらはセレクタSEL1
1、SEL12が各種接続線とのX印で示す接続点の切
り替えにより選択している。ALUはサム(データD
3)とキヤリーを出力するが、セレクタSEL14はサ
ムを選び、キヤリーは後のサイクルの上位ビツトの演算
の時のためにフリツプフロツプFF13に記憶される。
【0117】なおキヤリー入力とは、ひとつ前のサイク
ルで下位ビツトの加算が行なわれた場合には、このフリ
ツプフロツプFF13に記憶されたデータ、即ち前サイ
クルのALUキヤリー出力を意味する。もしこの加算サ
イクルが加算操作の最初のサイクル、即ち最下位ビツト
の演算である場合は、それより前のサイクルで、ALU
制御信号SRALU-CONT によりあらかじめフリツプフロツ
プFF13はクリアされている。このようにこのビデオ
信号用プロセツサ40では、プログラムに応じて1命令
サイクルの内に、データメモリ部44からふたつのデー
タD1、D2を読み出し、ALUアレイ部45で必要な
算術演算又は論理演算を施し、再び演算結果でなるデー
タD3をデータメモリ部44の所定のアドレスに書き込
む。なおこの演算処理は全てビツト処理であり、サイク
ル当たり1ビツトづつ処理を進める。
【0118】このように処理を進めて行くうちに水平走
査期間の時間が来てしまうと、この構成の場合には残る
処理は第2のブロツク42側に引き継ぐことになる。実
際上プログラム制御部49は、あらかじめ分担している
プログラム処理を水平走査期間の時間内に終え、その水
平走査期間が終らないうちに、プログラムの最後の部分
でその水平走査期間分の演算処理結果及び演算処理の途
中のデータを第2のブロツク42に引き渡し終える必要
がある。そして再び次の水平走査期間のデータが入力S
AM部43に蓄積されるのを待つて、次の水平走査期間
のデータに対してのプログラム処理が繰り返される。
【0119】この場合第1のブロツク41から第2のブ
ロツク42への引継ぎのためのデータ引渡しは、図6の
調停回路61を利用して以下のように実現される。すな
わちプログラム制御部49は、あらかじめ分担している
演算処理などを終えて、処理結果を第2のブロツク42
に引き渡す準備ができたところで、フラツグaを立て
て、第2のブロツク42側の準備ができるのを待つ。
【0120】一方プログラム制御部50も、この間プロ
グラム制御部49と同様に、映像信号DIN3 の一水平走
査期間ごとにデータメモリ部46、ALUアレイ部47
及び出力SAM部48をSIMD制御することにより所
定の処理を実行しており、この後第1のブロツク41か
らのデータ受け入れ準備ができたところで、フラツグb
を立てる。この結果調停回路61からは、両方のフラツ
グが揃つたところでフラツグaとbをアンドした調停信
号cとdが出力され、これらがそれぞれプログラム制御
部49又はプログラム制御部50に供給される。
【0121】この場合プログラム制御部49とプログラ
ム制御部50は、共にその調停信号c又はdを見て、第
1のブロツク41から第2のブロツク42へのデータ転
送処理を開始する。なおこの転送が開始されると、それ
ぞれのフラツグa、bは降ろされる。このデータ転送
は、第1のブロツク41と第2のブロツク42で別々に
プログラム制御されるものの、完全に連動動作するよう
にプログラムされ、やはりサイクルごとに1ビツトづつ
実行される。その各サイクルの動作は以下の通りであ
る。
【0122】まず第1のブロツク41側では、データメ
モリ部44の出力すべきデータが記憶されているメモリ
セル74へメモリアクセス信号SRRAA又はSRRBAを出し
て読み出しを行い、ALUアレイ部45を通過させ、第
1のブロツク41と第2のブロツク42とを接続しデー
タメモリ部44に至るビツト線に出す命令が実行され
る。一方第2のブロツク42側では、第1のブロツク4
1の動作とタイミングを合わせて、データメモリ部44
のデータを記憶すべきメモリセル74へメモリアクセス
信号STWA を出して書き込む命令が実行される。
【0123】詳細には、読み出し信号SRRAA又はSRRBA
が届いたデータメモリ部44のメモリセル74では、ト
ランジスタTr14又はTr15がONして、コンデン
サC11の電位に応じたデータが読み出しビツト線の片
方に出る。このときALUアレイ部45では、ALUセ
ル78においてそのデータが何の演算動作もされないで
通過するようなALU制御信号SRALU-CONT がプログラ
ムから指定されてデータメモリ部44へのビツト線に出
力される。
【0124】また書き込み信号STWA が届いたデータメ
モリ部46のメモリセル75では、トランジスタTr1
6をONして、コンデンサC12をALUアレイ部45
からのデータに応じた電位にしている。この際、ビツト
線制御信号STBC 及びその反転信号STBC-は、データメ
モリ部46の書き込みビツト線の入力源として、第1の
ブロツク41側を選択する。
【0125】なおこのサイクルの繰り返しで、第1のブ
ロツク41から第2のブロツク42へのデータ移送がで
きるが、今説明したようにALUアレイ部45で何もし
ないで通過させても良く、又はALUアレイ部45で例
えば加算などの最後の演算処理サイクルなど兼ねさせる
ようにしても良い。その場合のデータメモリ部44とA
LUアレイ部45での動作は、先に示したデータD1と
データD2との加算演算の場合と同じになるので、説明
は省略する。
【0126】やがて第1のブロツク41から第2のブロ
ツク42へのデータ移送が終わると、プログラム制御部
49は、次の水平走査期間の処理の開始のための待機状
態になり、入力SAM部43に次の水平走査期間のデー
タが揃つたところで届く入力水平走査同期信号Se を待
つ。それが届くと、再び入力SAM部43からデータメ
モリ部44へのデータ転送からのプログラムを繰り返し
始める。
【0127】一方プログラム制御部50では、第1のブ
ロツク41から第2のブロツク42へのデータ移送が終
わると、ALUアレイ部47を使つて、移送された第1
のブロツク41での演算処理結果及び演算処理途中のデ
ータと、データメモリ部46に記憶されている過去の演
算処理結果及び演算処理の途中のデータ、及びALUア
レイ部47のALUセル77中のいくつかの1ビツトレ
ジスタFF15〜FF18に記憶したデータを使つて、
第1のブロツク41側でやり残した演算処理などをする
プログラムを実行し始める。そして、次の第1のブロツ
ク41から第2のブロツク42へのデータ移送を始める
までの一水平走査期間の時間のうちに、必要な処理をし
終え、かつ出力すべきデータを出力SAM部48に転送
しておく。
【0128】この場合プログラム制御部50でのALU
アレイ部47を使つた演算処理などは、演算に必要なデ
ータはいつもデータメモリ部46にあるし、そのデータ
メモリ部46は読み出しポートが2つある3ポートメモ
リであるので、第1のブロツク41側での演算処理と同
様に、それらのデータ又はALUセル77中のいくつか
の1ビツトレジスタFF15〜FF18に記憶したデー
タを用いて、ALU79でのビツトごとの必要な演算処
理を順次進めることができる。またデータメモリ部46
とALUアレイ部47による演算処理動作は、第1のブ
ロツク41側でのデータメモリ部44とALUアレイ部
45による演算処理動作と同様なので、詳細説明は省略
する。
【0129】第1のブロツク41から第2のブロツクへ
のデータ移相が終わると、プログラム制御部49は、次
の水平走査期間の処理の開始のための待機状態になり、
入力SAM部43に次のデータが揃つたところで届く入
力水平走査同期信号Se を待つ。そしてこれが届くと、
再び入力SAM部43からデータメモリ部44へのデー
タ転送からのプログラムを繰り返し始める。
【0130】一方プログラム制御50では、第1のブロ
ツク41から第2のブロツクへのデータ移送が終わる
と、ALUアレイ部47を使つて、移相された第1のブ
ロツク41での演算処理結果及び演算処理途中のデータ
と、データメモリ部46に記憶されている過去の演算処
理結果及び演算処理途中のデータと、ALUアレイ部4
7のALUセル77中のいくつかの1ビツトレジスタF
F15〜FF18に記憶したデータとを使つて、第1の
ブロツク41側でやり残した演算処理などをするプログ
ラムを実行し始める。
【0131】そして、次の第1のブロツク41から第2
のブロツク42へのデータ移送を始めるまでの一水平走
査期間の時間のうちに、必要な処理を終え、かつ出力す
べきデータを出力SAM部48に転送する。プログラム
制御部50でのALUアレイ部47を使つた演算処理な
どは、演算に必要なデータがいつもデータメモリ部46
にあり、そのデータメモリ部46部が読み出しポートが
2つある3ポートメモリであるため、第1のブロツク4
1側での演算処理と同様に、それらのデータ又はALU
セル77中のいくつかのフリツプフロツプ(1ビツトレ
ジスタ)FF15〜FF18に記憶したデータを用い
て、ALU79でのビツトごとの必要な演算処理を順次
進める。なおデータメモリ部42とALUアレイ部47
による演算処理動作は、第1のブロツク41側でのデー
タメモリ部44とALUアレイ部45による演算処理動
作と同様なので、詳細説明は省略する。
【0132】そして最後の出力SAM部48への出力デ
ータ転送は、以下のようなセイクルの繰り返しで行なわ
れる。すなわちデータメモリ部46の出力すべきデータ
が記憶されているメモリセル75へメモリアクセス信号
TRAA又はSTRBAを出して読み出しを行い、ALUアレ
イ部47を通過させ、出力SAM部48の所定のビツト
の出力SAMセルに書き込み信号SOWを発生してデータ
転送を行なう。
【0133】この場合データは縦方向のビツト線を経由
して1ビツトずつデータ転送される。このときデータ転
送に際してALU79で処理することが何もなくても、
ALUセル77を通る。なおALU79で最後の何らか
の演算をしても良く、このあたりは第1のブロツク41
側における、第1のブロツク41から第2のブロツク4
2へのデータ移送のときと同様の動作になるし、出力S
AM部48への書き込み動作は従来例と同じであるの
で、これらの詳細説明も省略する。プログラム制御部5
0は、こうして出力SAM部48へデータを移してしま
うと、次の第1のブロツク41側からの転送要求を待つ
べく、フラツグbを立てて、待機状態となる。そして調
停信号dが届くと、再び第1のブロツク41側からの転
送データをデータメモリ部46に書き込むことからプロ
グラム処理を再起動する。
【0134】なおここまでの説明では、プログラム制御
図49、50がフラツグa、bをデータ受け渡しのため
にのみ立てるようにしているが、これ以外の目的で立て
るようにしても良い。また3ポートメモリでは、2つの
読み出しのアドレスは衝突が許されるが、読み出しは書
き込みのアドレスの衝突は許されないのでその点は注意
が必要である。読み出しと書き込みのアドレスが衝突す
るときは、もう1サイクル使つて読み出しと書き込みを
別サイクルとする。
【0135】図8及び図9のような各プロセツサエレメ
ントの動作は、第1のブロツク41においてプログラム
制御部49が、一水平走査期間の時間のうちに入力SA
M部43に蓄積された入力データをデータメモリ部44
へ転送し、第1のブロツク41側に期待される演算処理
をし、そして必要なデータを第2のブロツク42へ転送
をする制御をして実現される。これはビツトを単位とす
るSIMDプログラム制御である。また第2のブロツク
42において、その次の一水平走査期間の時間のうち
に、プログラム制御部50が、第2のブロツク42側に
期待される演算処理をし、結果を出力SAM部48へ出
力し、次の第1のブロツク41側から転送データの受け
入れる制御をして実現され、これもビツトを単位とする
SIMDプログラム制御である。
【0136】これらのプログラム処理はそれぞれの第3
又は第2のブロツク41、42内で、従来例と同様に水
平走査期間を単位として繰り返される。SIMD制御な
ので、全てのプロセツサエレメントは連動動作をしてお
り、水平走査期間分の画素数(H)に対して、同じ処理
がなされる。ここで実施例の図6、図8及び図9に示す
ビデオ信号用プロセツサ40を一般的なプロセツサの表
現に対応させれば、上述のように、図7で示される構成
の1ビツトプロセツサを一次元的(直線的)にアレイ状
に多数並べたものと言える。
【0137】この場合図7のプロセツサ61では、入力
はまずバツフアメモリ51を介してデータメモリ53に
書き込まれ、その後で、データメモリ53に書き込まれ
た、今入力されたばかりのデータや、前に入力されたデ
ータや、前に演算処理をした処理過程のデータなどを、
2つの読み出しメモリアドレスで選んでALU54に導
いては演算操作をし、再びデータメモリ53に書き込み
記憶する。そしてその演算処理途中のデータはデータメ
モリ55に移される。またデータメモリ55に書き込ま
れた、今転送されたばかりのデータや、前に転送された
データや、前に演算処理をした処理過程のデータなど
を、2つの読み出しメモリアドレスで選んでALU56
に導いては演算操作をし、再びデータメモリ55に書き
込み記憶する。そしてその演算処理結果のデータは出力
バツフアメモリ52を介して出力する。
【0138】従つて図6に示す実施例のビデオ信号用プ
ロセツサ40では、入力SAM部43、出力SAM部4
8、データメモリ部44、データメモリ部46、ALU
アレイ部45及びALUアレイ部47がそれぞれ図7に
示すプロセツサ63の入力バツフアメモリ51、出力バ
ツフアメモリ52、データメモリ53、データメモリ5
5、ALU54又はALU56にそれぞれ対応してい
る。なおこのプロセツサ63の構造は、小さなプロセツ
サエレメントを一次元的(直線的)にアレイ状に多数並
べたものなのでリニアアレイ型と呼ぶが、直線的に並ん
でいるのは、構造概念上であつて、実際のLSI上の物
理配置については、必ずしも、全てのプロセツサエレメ
ントが直線的に並ぶわけではない。
【0139】(2−5)水平走査期間を単位とするパイ
プライン動作 ここでこのビデオ信号用プロセツサ40の場合、 1.入力データの入力SAM部48への書き込みによる
入力動作 2.プログラム制御部49のSIMD制御による、入力
SAM部43に蓄積された入力データのデータメモリ部
44への移動、第3のブロツク41側に期待される演算
処理、必要なデータの第4のブロツク42への転送 3.プログラム制御部50のSIMD制御による、第3
のブロツク41側から転送データの受け入れ、第4のブ
ロツク42側に期待される演算処理、出力SAM部48
への出力 4.出力データDOUT4の出力SAM部48からの読み出
しによる出力動作 の4つの動作は、入力する映像信号DIN3 の一水平走査
期間を単位とするパイプライン動作になつており、ひと
つの水平走査期間の入力データに注目すれば、それぞれ
の動作は一水平走査期間の時間づつずれた形で実行され
るが、これら4つの動作は連続して同時に並行して進行
する。
【0140】図8〜図12の各セルの構造は、理解を容
易にするために非常に一般的なものとして示している。
各セルの構成としてはこの他種々のバリエーシヨンが可
能である。図6、図8及び図9に示すビデオ信号用プロ
セツサ40は、従来の2つ分のプロセツサを縦方向に直
列接続したものだが、冗長な第3のブロツク41の出力
SAM部と第4のブロツク42の入力SAM部を削除し
た上、データメモリ部44、46を改善している。
【0141】(2−6)命令サイクルを単位とするパイ
プライン動作 次にこの実施例での命令サイクルを単位とするパイプラ
パイプライン処理について説明する。ここまでの実施例
の説明では、水平走査期間を単位とするパイプライン処
理がなされていることは説明されたが、命令サイクル単
位のパイプライン処理については、ないものとして説明
してきた。しかしそのままだと、例えば加算の演算は、
データメモリ部44、46からのデータの読み出しか
ら、ALUアレイ部45、47での演算、そしてまたデ
ータメモリ部44、46への書き込みまでが1サイクル
であるから、そのパスのゲート遅延によつて動作速度が
決まり、あまり高速動作は期待できない。
【0142】プロセツサの処理能力は、演算器の数とそ
の命令実行サイクルの高速の積で決まるから、演算器が
決まつているなら命令実行サイクルの高速化をしたい。
そのためには命令サイクル単位のパイプライン処理をす
ることになる。なおパイプライン処理自体については、
よく知られた高速化技法であるので、その説明は省く。
【0143】まず2サイクル化を説明する。これは、例
えば加算などの演算の際に、データメモリ部44からの
データの読み出し及びALUアレイ部45でのALU7
8の入力前までと、ALU78からデータメモリ部44
への書き込みまでを別サイクルにするために、ALUセ
ル76のフリツプフロツプFF11、FF12、FF1
3を、パイプラインレジスタとして利用する。こうする
ことによつて、2倍は無理であるが、2倍弱の高速化が
図れる。
【0144】また別の2サイクル化として、データメモ
リ部44からのデータの読み出し及びALUアレイ部4
5のALU78での演算までと、ALU78からデータ
メモリ部44への書き込みまでを別サイクルにするため
に、ALUセル76のフリツプフロツプFF14をパイ
プラインレジスタとして利用する方法もある。次に3サ
イクル化であるが、これは、データメモリ部44からの
データの読み出し及びALUアレイ部76でのALU7
8の入力前までと、ALU78での演算と、ALU78
からデータメモリ部44への書き込みまでを別サイクル
にするために、ALUセル78のフリツプフロツプFF
11、FF12、FF13と、ALUセル78のフリツ
プフロツプFF14を2段のパイプラインレジスタとし
て利用する。こうすることによつて、3倍は無理である
が、2倍前後の高速化が計れる。
【0145】ここで3サイクル化パイプライン処理で
は、読みだしから書き込みまで3サイクルあり、2サイ
クルの時間ズレが生ずるが、処理全体では高速化され
る。この場合2サイクルのズレがあるので、先に説明し
た、3ポートメモリでの読みだしと書き込みのアドレス
の衝突の制約は、それを考慮して衝突を避けるようにす
ることになる。3ポートメモリのアクセス競合が問題に
ついては、プログラム決定時に書き込みアドレス競合が
ないようにサイクルをずらすように修正してコンパイル
(アセンブル)されるようにすれば、これを回避でき
る。アドレスがいつも異なることが保証されていればよ
いので、始めから処理毎にアドレス空間を使い分けるの
も方法である。
【0146】基本的にこのようなメモリアドレス競合の
問題は、プログラミングの際に全て把握可能なことであ
り、充分起こりえる競合を回避できる。また場合によつ
ては、プログラム技術者の代わりにコンパイラ又はアセ
ンブラにおいて、この競合の問題を自動的に回避させる
ためのプログラム自動修正も可能である。今いくつかの
命令サイクル単位のパイプライン処理の動作例説明を、
第3のブロツク41側で説明したが、当然同じことを第
4のブロツク42側でもすることになる。
【0147】(2−7)第2実施例の効果 以上の構成によれば、ビツト処理プロセツサエレメント
を1次元配列した多並列DSPプロセツサでなる第1及
び第2のブロツク41、42を、第1のブロツク41の
出力SAM部及び第2のブロツク42の入力SAM部を
省略して、第1のブロツク41のALUアレイ部45の
出力を直接第2のブロツク42のデータメモリ部46に
供給するように接続するようにしたことにより、第1及
び第2のブロツク41、42間の冗長な回路を削減しな
がら縦方向の処理能力を向上させることができ、かくし
てプロセツサの処理能力を向上させ得る簡易な構成のビ
デオ信号用プロセツサを実現できる。
【0148】また第1及び第2のブロツク41、42の
各データメモリ部45、47をそれぞれ1つの3ポート
メモリにするようにしたことにより、データの演算処理
にあたつて従来例のような2つのデータメモリ構成の場
合によく生じる、2つのデータメモリ部にそれぞれ演算
入力データがなければならないといつた制約がなくな
り、これにより従来においてしばしば必要になつていた
演算処理の前準備の2つのデータメモリ部間でのデータ
転送を不要にすることができる。また演算処理出力を出
力SAM部に移す際にも、演算処理結果を予め準備のた
めにデータメモリ間で移動させる必要をなくすことがで
きる。
【0149】さらに各ブロツク41、42のデータメモ
リ部を1つにするようにしたことにより、従来のように
データメモリ部を2つ有していることにより生じる、片
方のメモリ容量の不足や余剰の問題が生じない。従つて
全体としてフレキシブルに構成することができる。
【0150】さらにリードモデイフアイライトをやめ、
データメモリ部44、46を専用化したビツト線をもつ
3ポートメモリするようにしたことにより、命令サイク
ル単位のパイプライン処理を容易に適用し得るようにす
ることができ、かくしてデータメモリ部44又は46か
ら2つのデータを読み出し、ALUアレイ部45又は4
7のALU78又は79で演算処理し、演算結果をデー
タメモリ部44又は46に書き込むまでの経路を分断で
きると共に、命令サイクルを短縮化でき、さらに高速化
することができる。この場合パイプライン処理として3
サイクル化パイプライン処理を適用することより、2倍
前後までの高速化を図ることができる。
【0151】(2−8)他の実施例 なお上述の第2実施例においては、本発明をビデオ信号
用プロセツサに適用するようにした場合について述べた
が、本発明はこれに限らず、この他種々の信号処理装置
に適用することができる。
【0152】この場合それぞれビツト処理プロセツサエ
レメントを1次元配列した多並列デイジタルシグナルプ
ロセツサでなる複数のプロセツサブロツクを順次接続す
ると共に、この際初段のプロセツサブロツクを、入力デ
ータを直列並列変換する直列並列変換手段と、データを
記憶する第1の記憶手段と、データを演算処理する第1
の演算手段とで構成し、最終段のプロセツサブロツク
を、データを記憶する第2の記憶手段と、データを演算
処理する第2の演算手段と、データを並列直列変換して
出力する並列直列変換手段とで構成し、かつ初段のプロ
セツサブロツク及び最終段のプロセツサブロツク以外の
プロセツサブロツクを、データを記憶する第2の記憶手
段と、データを演算処理する第3の演算手段とで構成す
るようにすれば良い。従つてこのような信号処理装置を
構築するに際して順次接続するプロセツサブロツク数と
しては3つ以上であつても良く、また各プロセツサブロ
ツクの構成は、図6〜図12以外の構成であつても良
い。
【0153】またこの場合、特に入力データが画像の水
平走査期間を単位としたビツト並列かつ時系列直列な画
像データである場合には、初段のプロセツサブロツクの
直列並列変換手段に、ビツト並列かつ時系列直列な画素
データを、画像の水平走査期間を単位としてビツト直列
かつ時系列直列に直列並列変換させ、第1〜第3の演算
手段には、ビツト直列かつ時系列並列な画像データを水
平走査期間を単位として演算処理させ、かつ最終段のプ
ロセツサブロツクの並列直列変換手段には、ビツト直列
かつ時系列並列な画像データを、画像の水平走査期間を
単位としてビツト並列かつ時系列直列に並列直列変換さ
せるようにすれば良い。
【0154】(3)第3実施例 (3−1)第3実施例によるビデオ信号用プロセツサの
構成 図13は第3実施例によるビデオ信号用プロセツサ90
を示すものであり、それぞれビツト処理プロセツサエレ
メントを多数1次元配列した多並列DSPプロセツサで
なるブロツク91〜96を、横方向に2ブロツク、縦方
向に3ブロツク、計6ブロツクを並列化することにより
構成されている。
【0155】すなわちこのビデオ信号用プロセツサ90
の場合、信号入力端100に、第1〜第3のブロツク9
1〜94により形成される第1のブロツク列101の入
力端(第1のブロツク91の入力端に相当)と、第1の
セレクタ24の第1の切替え端とがそれぞれ接続される
と共に、当該第1のブロツク列101の出力端(第3の
ブロツク93の出力端に相当)が第1及び第2の各セレ
クタ24、25の各第2の切替え端にそれぞれ接続され
ている。
【0156】また第1のセレクタ24の出力端は第4〜
第6のブロツク94〜96からなる第2のブロツク列1
02の入力端(第4のブロツク94の出力端に相当)に
接続されると共に、当該第2のブロツク列102の出力
端(第6のブロツク96の出力端に相当)は第2のセレ
クタ25の第1の切替え端に接続され、かつ当該第2の
セレクタ25の出力端は信号出力端103に接続されて
いる。
【0157】この場合このビデオ信号用プロセツサ90
では、第1及び第2のブロツク91、92間の接続にお
いて第1のブロツク91の出力SAM部と第2のブロツ
ク92の入力SAM部とがそれぞれ省略されると共に、
第2及び第3のブロツク92、93間の接続において第
2のブロツク92の出力SAM部と第3のブロツク93
の入力SAM部とがそれぞれ省略されており、これら第
1及び第2のブロツク91、92間、第2及び第3のブ
ロツク92、93間がそれぞれ図6、図8及び図9にお
ける第1及び第2のブロツク41、42間と同様に接続
されている。
【0158】同様にしてこのビデオ信号用プロセツサ9
0では、第4及び第5のブロツク94、95間の接続に
おいて第4のブロツク94の出力SAM部と第5のブロ
ツク95の入力SAM部とがそれぞれ省略されると共
に、第5及び第6のブロツク95、96間の接続におい
て第5のブロツク95の出力SAM部と第6のブロツク
96の入力SAM部が省略されており、これら第4及び
第5のブロツク94、95間、第5及び第6のブロツク
95、96間がそれぞれ図6、図8及び図9における第
1及び第2のブロツク41、42間と同様に接続されて
いる。
【0159】また第1〜第6の各ブロツク91〜96を
それぞれ駆動制御する第1〜第6のプログラム制御部1
10〜115のうち、第1及び第2のプログラム制御部
110、111間、第2及び第3のプログラム制御部1
11、112間、第4及び第5のプログラム制御部11
3、114間、並びに第5及び第6のプログラム制御部
114、115間には、それぞれ図6の調停回路61と
同様に形成された調停回路(図示せず)が設けられてお
り、かくしてこれら第1及び第2のプログラム制御部1
10、111、第2及び第3のプログラム制御部11
1、112、第4及び第5のプログラム制御部113、
114、並びに第5及び第6のプログラム制御部11
4、115がそれぞれ対応する調停回路により調整を取
りながら並列データ転送をタイミング良く行い得るよう
になされている。
【0160】従つてこのビデオ信号用プロセツサ90の
場合、横方向に拡張したことは第1の実施例と同じであ
り、また縦方向に拡張したことは第2の実施例と同じで
あることにより、ハードウェアを6倍にすることなく冗
長部分を削除して6倍の処理能力を確保し、かつ各種画
像フオーマツトに無駄なく対応し得るようになされてい
る。
【0161】この実施例の場合、第1及び第4のブロツ
ク91、94の入力SAM部91A、94Aは第2実施
例の第1のブロツク41の入力SAM部43(図6)と
同様に構成されていると共に、各第1〜第6のブロツク
91〜96のデータメモリ部91B、92A、93A、
94B、95A、96Aは第2実施例のデータメモリ部
44、46(図6)と同様に構成され、かつ各第1〜第
6のブロツク91〜96のALUアレイ部91C、92
B、93B、94C、95B、96Bはそれぞれ第2実
施例のALUアレイ部45、47(図6)と同様に構成
されると共に、第6のブロツク96の出力SAM部96
Cは第2実施例の第2のブロツク42の出力SAM部4
8と同様に構成されている。
【0162】これによりこのビデオ信号用プロセツサ9
0では、第1及び第2のブロツク列101、102のそ
れぞれにおいて、第2実施例において上述したのと同様
の効果を得ることができるようになされている。
【0163】(3−2)第3実施例の効果 以上の構成によれば、ビツト処理プロセツサエレメント
を多数1次元配列した多並列プロセツサでなる第1〜第
3のブロツク91〜93と、第4〜第6のブロツク94
〜96とを、余分な入力SAM部及び出力SAM部を省
略して冗長性を削除しながらそれぞれ縦方向に並列化す
ることにより第1及び第2のブロツク列101、102
を形成すると共に、これら第1及び第2のブロツク列1
01、102を第1実施例の場合と同様にして第1及び
第2のセレクタ24、25を介して横方向に拡張するよ
うに接続するようにしたことにより、簡易な構成で各種
画像フオーマツトに実用上十分に対応することができ、
かくして処理能力が高く、汎用性のある簡易な構成のビ
デオ信号用プロセツサ90を実現できる。
【0164】(3−3)他の実施例 なお上述の第3実施例においては、本発明をビデオ信号
用プロセツサに適用するようにした場合について述べた
が、本発明はこれに限らず、この他種々の信号処理装置
に適用することができる。また上述の第3実施例におい
ては、ビツト処理プロセツサエレメントを多数1次元配
列した多並列プロセツサでなるブロツク91〜96を横
方向に2ブロツク、縦方向に3ブロツク、計6ブロツク
を並列化するようにした場合について述べたが、本発明
はこれに限らず、横方向及び縦方向に並べるブロツク数
としてはこの他種々の数を適用できる。
【0165】さらに上述の第3実施例においては、第1
及び第4のブロツク91、94の入力SAM部91A、
94Aを第2実施例の第1のブロツク41の入力SAM
部43(図6)と同様に構成すると共に、各第1〜第6
のブロツク91〜96のデータメモリ部91B、92
A、93A、94B、95A、96Aを第2実施例のデ
ータメモリ部44、46(図6)と同様に構成し、かつ
各第1〜第6のブロツク91〜96のALUアレイ部9
1C、92B、93B、94C、95B、96Bをそれ
ぞれ第2実施例のALUアレイ部45、47(図6)と
同様に構成すると共に、第6のブロツク96の出力SA
M部96Cを第2実施例の第2のブロツク42の出力S
AM部48と同様に構成するようにした場合について述
べたが、本発明はこれに限らず、これら各ビツト処理プ
ロセツサエレメントの構成としては、この他の構成であ
つても良い。
【0166】
【発明の効果】上述のように第1の発明によれば、ビツ
ト処理プロセツサエレメントを多数1次元配列した多並
列デイジタルシグナルプロセツサを1つのプロセツサブ
ロツクとして、複数のプロセツサブロツクを順次接続す
ると共に、この際後段のプロセツサブロツクに対しては
前段のプロセツサブロツクの出力又は入力データのいず
れか一方を供給し、かつこれら各プロセツサブロツクの
出力のいずれかを最終出力として出力するようにしたこ
とにより、横方向のプロセツサプロツクの並列数だけ処
理能力を向上させ得るだけでなく、各種画像フオーマツ
トの一水平走査期間の画素数への対応性、冗長性が大幅
に改善でき、また多様なデータ処理手順に対応でき、か
くして処理能力の高く、汎用性のある簡易な構成の信号
処理装置を実現できる。
【0167】また第2の発明によれば、ビツト処理プロ
セツサエレメントを多数1次元配列した多並列デイジタ
ルシグナルプロセツサを1つのプロセツサブロツクとし
て、複数のプロセツサブロツクを順次接続すると共に、
この際初段のプロセツサブロツクを、入力データを直列
並列変換する直列並列変換手段と、データを記憶する第
1の記憶手段と、データを演算処理する第1の演算手段
とで形成すると共に、最終段のプロセツサブロツクを、
データを記憶する第2の記憶手段と、データを演算処理
する第2の演算手段と、データを並列直列変換する並列
直列変換手段とで形成し、かつそれ以外のプロセツサブ
ロツクをデータを記憶する第3の記憶手段と、データを
演算処理する第3の演算手段とで形成するようにしたこ
とにより、縦方向のプロセツサプロツクの並列数だけ処
理能力を向上させ得るだけでなく、プロセツサブロツク
間の冗長な回路を削減し、ハードウエアを小さくするこ
とができ、かくして処理能力の高く、汎用性のある簡易
な構成の信号処理装置を実現できる。
【0168】さらに第3の発明においては、第2の発明
のように構成された複数のプロセツサブロツクでなるプ
ロセツサブロツク列を第1の発明と同様に接続するよう
にしたことにより、処理能力の高く、汎用性のある簡易
な構成の信号処理装置を実現できる。
【図面の簡単な説明】
【図1】第1実施例によるビデオ信号用プロセツサの全
体構成を示すブロツク図である。
【図2】図1に示すビデオ信号用プロセツサの動作説明
に供するタイミングチヤートである。
【図3】他の実施例の説明に供するタイミングチヤート
である。
【図4】他の実施例の説明に供するタイミングチヤート
である。
【図5】縦方向に2ブロツク並列化する場合の一例を示
すブロツク図である。
【図6】第2実施例によるビデオ信号用プロセツサの全
体構成を示すブロツク図である。
【図7】図6を一般的なプロセツサの構成に対応させた
ブロツク図である。
【図8】図6に示すビデオ信号用プロセツサのプロセツ
サエレメントの構造を示す略線図である。
【図9】図6に示すビデオ信号用プロセツサのプロセツ
サエレメントの構造を示す略線図である。
【図10】入力SAM部の詳細構成を示す回路図であ
る。
【図11】データメモリ部の詳細構成を示す回路図であ
る。
【図12】出力SAM部の詳細構成を示す回路図であ
る。
【図13】第2実施例によるビデオ信号用プロセツサの
全体構成を示すブロツク図である。
【図14】従来のリニアアレイ型プロセツサの構成を示
すブロツク図である。
【図15】図6を一般的なプロセツサの構成に対応させ
たブロツク図である。
【図16】従来のプロセツサエレメントの一例を示す略
線図である。
【符号の説明】
20、40、90……ビデオ信号用プロセツサ、21、
22、41、42、91〜96……ブロツク、24、2
5……セレクタ、21A、22A、43、91A、94
A……入力SAM部、44、46、91B、92A、9
3A、94B、95A、96A……データメモリ部、4
5、47、91C、92B、93B、94C、95B、
96B……ALUアレイ部、21B、22B、48、9
6C……出力SAM部、78、79……ALU、FF1
1〜FF18……フリツプチツプ、DIN1 、DIN3 、D
IN4 ……画像信号。
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成8年9月17日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0129
【補正方法】削除
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0130
【補正方法】削除
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0131
【補正方法】削除
───────────────────────────────────────────────────── フロントページの続き (72)発明者 大木 光晴 東京都品川区北品川6丁目7番35号ソニー 株式会社内

Claims (24)

    【特許請求の範囲】
  1. 【請求項1】それぞれビツト処理プロセツサエレメント
    を1次元配列した多並列デイジタルシグナルプロセツサ
    でなる複数のプロセツサブロツクと、 それぞれ対応する上記プロセツサブロツクに対して、前
    段の上記プロセツサブロツクの出力及び入力データのい
    ずれか一方を選択的に供給する複数の第1のセレクタ
    と、 各上記プロセツサブロツクの出力のいずれかを選択的に
    最終出力として出力する第2のセレクタとを具えること
    を特徴とする信号処理装置。
  2. 【請求項2】各上記プロセツサブロツクは、 演算を行う演算器と、 上記演算器の前段又は後段の少なくとも一方にパイプラ
    インレジスタとを有する演算手段を、上記ビツト処理プ
    ロセツサエレメントとして具えることを特徴とする請求
    項1に記載の信号処理装置。
  3. 【請求項3】各上記プロセツサブロツクは、 読み出し用に2つのポートを有し、かつ書き込み用に1
    つのポートを有する3ポートメモリを、上記ビツト処理
    プロセツサエレメントとして具えることを特徴とする請
    求項1に記載の信号処理装置。
  4. 【請求項4】上記3ポートメモリの各上記ポートのため
    のビツト線が、書き込み又は読み出しにそれぞれ専用化
    されていることを特徴とする請求項3に記載の信号処理
    装置。
  5. 【請求項5】上記入力データは、画像の水平走査期間を
    単位としたビツト並列かつ時系列直列な画素データでな
    り、 各上記プロセツサブロツクは、上記ビツト処理プロセツ
    サエレメントとして、 供給されるビツト並列かつ時系列直列な画素データを、
    画像の水平走査期間を単位としてビツト直列かつ時系列
    並列に変換する直列並列変換手段と、 上記直列並列変換手段によりビツト直列かつ時系列並列
    に変換された上記画像データを水平走査期間を単位とし
    て演算処理する演算手段と、 ビツト直列かつ時系列並列な画像データを、画像の水平
    走査期間を単位としてビツト並列かつ時系列直列に並列
    直列変換して出力する並列直列変換手段とを具えること
    を特徴とする請求項1に記載の信号処理装置。
  6. 【請求項6】上記演算手段は、 上記演算を行う演算器と、 上記演算器の前段又は後段の少なくとも一方に設けられ
    たパイプラインレジスタとを具えることを特徴とする請
    求項5に記載の信号処理装置。
  7. 【請求項7】各上記プロセツサブロツクは、 読み出し用に2つのポートを有し、かつ書き込み用に1
    つのポートを有する3ポートメモリを上記ビツト処理プ
    ロセツサエレメントとして具えることを特徴とする請求
    項5に記載の信号処理装置。
  8. 【請求項8】上記3ポートメモリの各上記ポートのため
    のビツト線が、書き込み又は読み出しにそれぞれ専用化
    されていることを特徴とする請求項7に記載の信号処理
    装置。
  9. 【請求項9】順次接続された、それぞれビツト処理プロ
    セツサエレメントを1次元配列した多並列デイジタルシ
    グナルプロセツサでなる複数のプロセツサブロツクから
    形成されるプロセツサブロツク列を具え、 初段の上記プロセツサブロツクは、 入力データを直列並列変換する直列並列変換手段と、 データを記憶する第1の記憶手段と、 データを演算処理する第1の演算手段とを上記ビツト処
    理プロセツサエレメントとし、 最終段の上記プロセツサブロツクは、 データを記憶する第2の記憶手段と、 データを演算処理する第2の演算手段と、 データを並列直列変換して出力する並列直列変換手段と
    を上記ビツト処理プロセツサエレメントとし、 上記初段のプロセツサブロツク及び上記最終段のプロセ
    ツサブロツク以外の上記プロセツサブロツクは、 データを記憶する第3の記憶手段と、 データを演算処理する第3の演算手段とを上記ビツト処
    理プロセツサエレメントとすることを特徴とする信号処
    理装置。
  10. 【請求項10】上記第1ないし第3の演算手段は、 上記演算を行う演算器と、 上記演算器の前段又は後段の少なくとも一方に設けられ
    たパイプラインレジスタとを具えることを特徴とする請
    求項9に記載の信号処理装置。
  11. 【請求項11】上記第1ないし第3の記憶手段は、 読み出し用に2つのポートを有し、かつ書き込み用に1
    つのポートを有する3ポートメモリでなることを特徴と
    する請求項9に記載の信号処理装置。
  12. 【請求項12】上記3ポートメモリの各上記ポートのた
    めのビツト線が、書き込み又は読み出しにそれぞれ専用
    化されていることを特徴とする請求項11に記載の信号
    処理装置。
  13. 【請求項13】上記入力データは、画像の水平走査期間
    を単位としたビツト並列かつ時系列直列な画素データで
    なり、 上記初段のプロセツサブロツクの上記直列並列変換手段
    は、 ビツト並列かつ時系列直列な画素データを、上記画像の
    水平走査期間を単位としてビツト直列かつ時系列並列に
    直列並列変換し、 上記第1ないし第3の演算手段は、 ビツト直列かつ時系列並列な画像データを水平走査期間
    を単位として演算処理し、 上記最終段の上記プロセツサブロツクの上記並列直列変
    換手段は、 ビツト直列かつ時系列並列な画像データを、画像の水平
    走査期間を単位としてビツト並列かつ時系列直列に並列
    直列変換して出力することを特徴とする請求項9に記載
    の信号処理装置。
  14. 【請求項14】上記第1ないし第3の演算手段は、 上記演算を行う演算器と、 上記演算器の前段又は後段の少なくとも一方に設けられ
    たパイプラインレジスタとを具えることを特徴とする請
    求項13に記載の信号処理装置。
  15. 【請求項15】上記第1ないし第3の記憶手段は、 読み出し用に2つのポートを有し、かつ書き込み用に1
    つのポートを有する3ポートメモリでなることを特徴と
    する請求項13に記載の信号処理装置。
  16. 【請求項16】上記3ポートメモリの各上記ポートのた
    めのビツト線が、書き込み又は読み出しにそれぞれ専用
    化されていることを特徴とする請求項13に記載の信号
    処理装置。
  17. 【請求項17】順次接続された複数の上記プロセツサブ
    ロツク列と、 それ対応する上記プロセツサブロツク列に対して、前段
    の上記プロセツサブロツク列の出力及び上記入力データ
    のいずれか一方を選択的に供給する複数の第1のセレク
    タと、 各上記プロセツサブロツク列の出力のいずれかを選択的
    に最終出力として出力する第2のセレクタとを具えるこ
    とを特徴とする請求項11に記載の信号処理装置。
  18. 【請求項18】上記第1ないし第3の演算手段は、 上記演算を行う演算器と、 上記演算器の前段又は後段の少なくとも一方に設けられ
    たパイプラインレジスタとをそれぞれ具えることを特徴
    とする請求項17に記載の信号処理装置。
  19. 【請求項19】上記第1ないし第3の記憶手段は、 読み出し用に2つのポートを有し、かつ書き込み用に1
    つのポートを有する3ポートメモリでなることを特徴と
    する請求項17に記載の信号処理装置。
  20. 【請求項20】上記3ポートメモリの各上記ポートのた
    めのビツト線が、書き込み又は読み出しにそれぞれ専用
    化されていることを特徴とする請求項19に記載の信号
    処理装置。
  21. 【請求項21】上記入力データは、画像の水平走査期間
    を単位とするビツト並列かつ時系列直列な画素データで
    なり、 上記初段のプロセツサブロツクの上記直列並列変換手段
    は、 ビツト並列かつ時系列直列な画素データを、上記画像の
    水平走査期間を単位としてビツト直列かつ時系列並列に
    直列並列変換し、 上記第1ないし第3の演算手段は、 ビツト直列かつ時系列並列な画像データを水平走査期間
    を単位として演算処理し、 上記最終段のプロセツサブロツクの上記並列直列変換手
    段は、 ビツト直列かつ時系列並列な画像データを、画像の水平
    走査期間を単位としてビツト並列かつ時系列直列に並列
    直列変換して出力することを特徴とする請求項17に記
    載の信号処理装置。
  22. 【請求項22】上記第1ないし第3の演算手段は、 上記演算を行う演算器と、 上記演算器の前段又は後段の少なくとも一方に設けられ
    たパイプラインレジスタとを具えることを特徴とする請
    求項21に記載の信号処理装置。
  23. 【請求項23】上記第1ないし第3の記憶手段は、 読み出し用に2つのポートを有し、かつ書き込み用に1
    つのポートを有する3ポートメモリでなることを特徴と
    する請求項21に記載の信号処理装置。
  24. 【請求項24】上記3ポートメモリの各上記ポートのた
    めのビツト線が、書き込み又は読み出しにそれぞれ専用
    化されていることを特徴とする請求項21に記載の信号
    処理装置。
JP7290300A 1995-10-12 1995-10-12 信号処理装置 Pending JPH09106389A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP7290300A JPH09106389A (ja) 1995-10-12 1995-10-12 信号処理装置
US08/731,161 US5926583A (en) 1995-10-12 1996-10-10 Signal processing apparatus
US09/228,237 US6038350A (en) 1995-10-12 1999-01-11 Signal processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7290300A JPH09106389A (ja) 1995-10-12 1995-10-12 信号処理装置

Publications (1)

Publication Number Publication Date
JPH09106389A true JPH09106389A (ja) 1997-04-22

Family

ID=17754345

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7290300A Pending JPH09106389A (ja) 1995-10-12 1995-10-12 信号処理装置

Country Status (2)

Country Link
US (2) US5926583A (ja)
JP (1) JPH09106389A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006127460A (ja) * 2004-06-09 2006-05-18 Renesas Technology Corp 半導体装置、半導体信号処理装置、およびクロスバースイッチ
JP2007323308A (ja) * 2006-05-31 2007-12-13 Fuji Xerox Co Ltd 演算装置、画像処理装置及びデータ処理装置

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3715991B2 (ja) * 1996-02-09 2005-11-16 株式会社日立製作所 並列プロセッサ
JPH10326258A (ja) * 1997-05-27 1998-12-08 Sony Corp データ演算システムおよび方法
WO2000077652A2 (de) * 1999-06-10 2000-12-21 Pact Informationstechnologie Gmbh Sequenz-partitionierung auf zellstrukturen
US6961084B1 (en) * 1999-10-07 2005-11-01 Ess Technology, Inc. Programmable image transform processor
JP3922859B2 (ja) * 1999-12-28 2007-05-30 株式会社リコー 画像処理装置、画像処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US6728862B1 (en) 2000-05-22 2004-04-27 Gazelle Technology Corporation Processor array and parallel data processing methods
US6735659B1 (en) * 2000-12-21 2004-05-11 Intel Corporation Method and apparatus for serial communication with a co-processor
SE521697C2 (sv) * 2001-01-25 2003-11-25 Xelerated Ab Anordningar och förfarande för behandling av data i en logisk rörledning
US7263602B2 (en) * 2002-08-16 2007-08-28 Carnegie Mellon University Programmable pipeline fabric utilizing partially global configuration buses
JP4542308B2 (ja) * 2002-12-16 2010-09-15 株式会社ソニー・コンピュータエンタテインメント 信号処理用デバイス及び情報処理機器
US7558428B2 (en) * 2004-09-13 2009-07-07 Microsoft Corporation Accelerated video encoding using a graphics processing unit
CN101595509A (zh) * 2007-02-02 2009-12-02 汤姆逊许可公司 无开销的独立并行图像处理

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4674064A (en) * 1984-08-06 1987-06-16 General Electric Company Selectable bit length serial-to-parallel converter
US4791677A (en) * 1985-12-16 1988-12-13 Matsushita Electric Industrial Co., Ltd. Image signal processor
US5031037A (en) * 1989-04-06 1991-07-09 Utah State University Foundation Method and apparatus for vector quantizer parallel processing
US5093722A (en) * 1990-03-01 1992-03-03 Texas Instruments Incorporated Definition television digital processing units, systems and methods
JPH04236664A (ja) * 1991-01-18 1992-08-25 Sony Corp 演算回路
JPH05182455A (ja) * 1991-12-30 1993-07-23 Sony Corp メモリ装置
US5689592A (en) * 1993-12-22 1997-11-18 Vivo Software, Inc. Parallel processing of digital signals in a single arithmetic/logic unit

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006127460A (ja) * 2004-06-09 2006-05-18 Renesas Technology Corp 半導体装置、半導体信号処理装置、およびクロスバースイッチ
JP2007323308A (ja) * 2006-05-31 2007-12-13 Fuji Xerox Co Ltd 演算装置、画像処理装置及びデータ処理装置

Also Published As

Publication number Publication date
US5926583A (en) 1999-07-20
US6038350A (en) 2000-03-14

Similar Documents

Publication Publication Date Title
JPH09106389A (ja) 信号処理装置
US5517666A (en) Program controlled processor wherein vector distributor and vector coupler operate independently of sequencer
JP2770603B2 (ja) 並列計算機
EP0293701B1 (en) Parallel neighborhood processing system and method
US4839801A (en) Architecture for block processing computer system
US20050262288A1 (en) Method and apparatus for connecting a massively parallel processor array to a memory array in a bit serial manner
JPH0284689A (ja) ビデオメモリ装置
US4799056A (en) Display system having extended raster operation circuitry
EP0521486B1 (en) Hierarchical structure processor
US5991866A (en) Method and system for generating a program to facilitate rearrangement of address bits among addresses in a massively parallel processor system
US20060155906A1 (en) Data processor with a built-in memory
US4697235A (en) List vector control apparatus
JPH04295953A (ja) 要素プロセッサの2次元アレイを内蔵する並列データ処理装置および要素プロセッサのサブアレイユニット
JPS6042516B2 (ja) デ−タ処理装置
JPH0522629A (ja) ビデオ信号用プロセツサ
JPH07210545A (ja) 並列処理プロセッサ
JP2004118713A (ja) 画像処理装置
AU593180B2 (en) Multiprocessor control system
JPH064689A (ja) リニアアレイ型の並列dspプロセッサ
JPH08297652A (ja) アレイプロセッサ
JP5369669B2 (ja) Simd型マイクロプロセッサ
JPH05108586A (ja) 並列演算機構及び並列演算方法
US5721884A (en) Apparatus for combining and separating color component data in an image processing system
JP4244619B2 (ja) 画像データ処理装置
JP4413905B2 (ja) Simd型プロセッサ