WO2010113226A1 - 半導体集積回路装置および映像音響処理システム - Google Patents

半導体集積回路装置および映像音響処理システム Download PDF

Info

Publication number
WO2010113226A1
WO2010113226A1 PCT/JP2009/004711 JP2009004711W WO2010113226A1 WO 2010113226 A1 WO2010113226 A1 WO 2010113226A1 JP 2009004711 W JP2009004711 W JP 2009004711W WO 2010113226 A1 WO2010113226 A1 WO 2010113226A1
Authority
WO
WIPO (PCT)
Prior art keywords
serial
parallel
data
block
data transfer
Prior art date
Application number
PCT/JP2009/004711
Other languages
English (en)
French (fr)
Inventor
丸井信一
Original Assignee
パナソニック株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パナソニック株式会社 filed Critical パナソニック株式会社
Publication of WO2010113226A1 publication Critical patent/WO2010113226A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/42Bus transfer protocol, e.g. handshake; Synchronisation
    • G06F13/4204Bus transfer protocol, e.g. handshake; Synchronisation on a parallel bus
    • G06F13/4234Bus transfer protocol, e.g. handshake; Synchronisation on a parallel bus being a memory bus

Definitions

  • an embodiment of a semiconductor integrated circuit device is a semiconductor integrated circuit device used by being connected to an external memory, wherein the memory controls access to the external memory.
  • One is characterized by having a section for serial data transfer.
  • the data transfer bus having the serial data transfer section has a first state of transferring output data from the memory interface block to at least one of the arithmetic processing blocks, and the semiconductor integrated circuit device has In order to realize the first state, a parallel-serial conversion unit and a serial-parallel conversion unit are sequentially provided from the memory interface block side, and the parallel-serial conversion unit includes K bits (K Is converted to serial data and output to the serial data transfer section, and the serial-parallel conversion unit converts the serial data sent through the serial data transfer section to L bits.
  • FIG. 1 is a configuration diagram of a video / audio processing system using the video / audio processing LSI according to the first embodiment.
  • FIG. 2 is a diagram illustrating an example of a circuit that functions as a parallel-serial conversion unit and a serial-parallel conversion unit.
  • FIG. 3 is a diagram illustrating an example of a configuration when the bus is bidirectional.
  • FIG. 4 is a diagram illustrating an example of a configuration when the bus is unidirectional.
  • FIG. 5 is a configuration diagram of a video / audio processing system using the video / audio processing LSI according to the second embodiment.
  • FIG. 6 is a block diagram of a conventional audio / video processing LSI.
  • the conversion unit 324 is a conversion circuit that is provided between the arithmetic processing block 120 and the memory I / F block and performs bidirectional conversion between parallel data and serial data.
  • 120 first state
  • it functions as a parallel-serial conversion unit
  • the bus width of the data transfer buses 322 and 321 is, for example, 64 bits, the transfer speed is, for example, 200 MHz, and the conversion units 323 and 324 convert a plurality of, for example, 16-bit data into 1-bit serial data. And a plurality of conversion circuits for converting 1 bit into 16-bit parallel data.
  • serial data transfer section needs to be transferred at a speed 16 times as high as the parallel data transfer section.
  • SerDes Serializer Deserializer
  • SerDes Serializer Deserializer
  • the first embodiment has been described above.
  • 16 parallel-serial conversion circuits are arranged in the conversion unit 425, and four serial-parallel conversion circuits are converted into the conversion units 421 to 424. Respectively.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Dram (AREA)

Abstract

 従来の設計資産をそのまま流用できるというプラットフォームアーキテクチャを踏襲しつつ、メモリI/Fブロック周辺でのデータバス配線混雑を解消することを可能にする半導体集積回路装置(10)であって、外部メモリ(700)へのアクセスを制御するメモリI/Fブロック(500)と、演算処理ブロック(110~140)と、演算処理ブロック(110~140)のそれぞれとメモリI/Fブロック(500)とを接続するデータ転送バス(310~340)とを備え、データ転送バス(310~340)の少なくとも1つのデータ転送バス(320)は、シリアルデータ転送をする区間(325)を有する。

Description

半導体集積回路装置および映像音響処理システム
 本発明は、半導体集積回路装置に関し、特にデジタルテレビ、車載機器、モバイル機器、ムービー機器などでマルチメディア処理を行うのに適した半導体集積回路装置およびそれを用いた映像音響処理システムに関するものである。
 近年、半導体回路の集積度が向上し、システム全体が一つのLSI上(1チップ)で実現することが可能になってきている。このようなLSIは、SoC(System on Chip) LSIと呼ばれる。
 ここでのシステムとは、たとえばデジタルテレビの映像音響処理全体(画像コーデック処理や高画質処理など)を指す。
 現在では映像音響データを扱う製品はビデオ、テレビ、オーディオ、パーソナルコンピュータなど多岐にわたり、それぞれの製品カテゴリの中でもさまざまな性能レンジが考えられる。
 それらについてそれぞれのシステムが存在するため、個別のSoC LSIを考えることが可能であるが、一般にこのようなSoC LSIは複雑かつ大規模になり、開発コストが大きく個別に開発するのは実際上不可能である。
 以上のことから、SoC LSIを効率よく開発するための方策が講じられている。たとえば、特許文献1に示されるように、各システムで共通に使用できるプラットフォームアーキテクチャを用意し、内部のそれぞれのブロックの設計資産の流用を容易にするなどである。
 以下、図6を用いて、特許文献1の技術を簡単に説明する。
 プラットフォームアーキテクチャは、多くの映像音響処理が、SoC LSI外部とのデータの授受のありなし、また、その時間的な制約の観点で、4つのブロック(マイコンブロック2、メディア処理ブロック3、ストリームI/Oブロック4、AVIOブロック5)に大別でき、データ処理の観点からそれぞれが独立に処理できることに着目したものである。
 すなわち、上記4つのブロックで行われる処理の間には時間的な区切れがあり、従って上記4つのブロック間のデータのやりとりはブロック間で直接行わずとも外部メモリ経由で行ってもシステム設計が可能であることに着目した。このことより、データ転送は各ブロック2~5と外部メモリ9間のみを考えればよく、各ブロック2~5は他ブロックの設計に左右されずに設計が可能となる。
 具体的には、外部メモリ9とSoC LSIとのやりとりはメモリインタフェースブロック(メモリI/Fブロック)6が行うため、各ブロックへのデータバスをそれぞれ独立して配置すれば、実際のシステム設計は各ブロックの必要データバス帯域を保証するようにメモリI/Fブロック6を設計すればよいことになり、複雑な組み合わせ動作が生じるシステムの設計が、個々のブロックの設計と、それぞれのブロックからのデータバス帯域要求を満たすようなメモリI/Fブロック6の設計に分離することができる。
 以上より、上記プラットフォームアーキテクチャのものとで、上記4つの各ブロック2~5とメモリI/Fブロック6毎に設計資産の流用が可能となる。
 メモリI/Fブロック6は例えば特許文献1中の図7の参照符号250で示されるように、バッファ部と、SoC LSI各ブロックとの転送を制御する、各ブロックに対応したデータ転送制御部(サブシステムIF部)と、内蔵RAM部とから構成され、メモリI/Fブロック6は、各々のデータ転送制御部をスケジューラとして動作させ、各データ転送バスのバス帯域を制御している。
 すなわち、外部メモリ9からの読み出しの場合は、次のような手順により行われる。
・バスマスタとなる各ブロックからの読み出し要求をメモリI/Fブロック6が受ける。
・メモリI/Fブロック6は外部メモリ9への読み出し要求を出し、読み出したデータを内蔵のバッファ部に格納する。
・メモリI/Fブロック6内で、バッファ部中のデータの行き先を指示し、所定のデータ転送制御部(サブシステムI/F部)へデータを送り込む。
・データを受け取ったデータ転送制御部(サブシステムI/F部)は、対応するブロックにデータを送信する。
 また、外部メモリ9への書き込みの場合は次のような手順により行われる。
・バスマスタとなる各ブロックからの書き込み要求をメモリI/Fブロック6が受け、該当のデータをバスマスタに対応するデータ転送制御部(サブシステムI/F部)が受け取る。
・各データ転送制御部(サブシステムI/F部)のデータをメモリI/Fブロック6で調停してバッファ部へ格納する。
・バッファ部のデータを外部メモリ9へと書き込む。
 上記のようにメモリI/Fブロック6内で、バッファ部と各ブロックに対応するデータ転送制御部(サブシステムI/F部)の間で調停が行われ、各ブロックの処理に応じた優先度に従った調停により、転送帯域が確保される。
 また、上記のプラットフォームアーキテクチャを使用すれば、扱うデータ量規模が増大した場合も上記4つのブロックとメモリI/Fブロック6間の独立したデータバスを並列に増やし、対応したメモリI/Fブロック6を設計することで対応できる。
国際公開第2005/096168号(第1図、第7図)
 しかしながら、特許文献1の技術は、扱うデータ量規模が増大するにつれ、論理的には設計可能であっても、物理的には設計困難になるという問題点を有している。
 すなわち、扱うデータ量規模が増大するにつれ、データバス帯域を増強するために、メモリI/Fブロック6に独立に入出力される各ブロックからのデータバスの本数が増大し、レイアウト設計時にメモリI/Fブロック6付近では配線混雑が発生し、事実上設計不可能となってしまう問題が顕在化してきた。
 本発明は上記従来の問題点を解決するためのもので、従来の設計資産をそのまま流用できるというプラットフォームアーキテクチャを踏襲しつつ、メモリI/Fブロック周辺でのデータバス配線混雑を解消することを可能にする半導体集積回路装置および映像音響処理システムを提供することを目的とする。
 上記目的を達成するために、第1の発明に係る半導体集積回路装置の一実施形態は、外部メモリと接続して用いられる半導体集積回路装置であって、前記外部メモリへのアクセスを制御するメモリインタフェースブロックと、少なくとも2つの演算処理ブロックと、前記少なくとも2つの演算処理ブロックのそれぞれと前記メモリインタフェースブロックとを接続する少なくとも2つのデータ転送バスとを備え、前記少なくとも2つのデータ転送バスの少なくとも1つは、シリアルデータ転送をする区間を有することを特徴とする。
 これにより、少なくとも1つの演算処理ブロックとメモリI/Fブロックとを接続するデータ転送バスは、シリアルデータ転送をする区間を有するので、その区間を、1本の信号線で接続することができ、配線混雑が緩和される。なお、「独立したデータ転送バス」とは、演算処理ブロックが複数備えられている場合に、それら複数の演算処理ブロックのそれぞれとメモリI/Fブロックとが独立したデータ転送バスで接続されることを意味する。ここで、さらに、前記少なくとも1つのシリアルデータ転送区間の両端にそれぞれ設けられたパラレルシリアル変換部およびシリアルパラレル変換部を備え、前記パラレルシリアル変換部は、Nビット(Nは2以上の整数)のパラレルデータをシリアルデータに変換して前記シリアルデータ転送区間に出力し、前記シリアルパラレル変換部は、前記シリアルデータ転送区間を介して送られてきた前記シリアルデータをNビットのパラレルデータに変換し、前記シリアルデータは、前記パラレルシリアル変換部で前記シリアルデータに変換される前のパラレルデータの転送速度のN倍以上の速度で転送される構成とするのが好ましい。
 これにより、データ転送バスにおいて、Nビットのパラレルデータがシリアルデータに変換され、再びNビットのパラレルデータに戻されるが、シリアルデータの転送速度がパラレルデータの転送速度のN倍なので、実質的な転送速度としては、パラレルデータだけによるデータ転送の場合と同じである。よって、演算処理ブロックとメモリI/Fブロックについては、パラレルなデータ転送バスで接続されることを想定した従来の設計資産の流用が可能となり、かつ、配線混雑が緩和される。なお、「実質的な転送速度」とは、バス全体としての転送速度であり、バス全体として単位時間当たりに転送できるビット数である。
 また、前記シリアルデータ転送区間を有するデータ転送バスは、前記メモリインタフェースブロックから前記演算処理ブロックのうちの少なくとも1つへの出力データを転送する第1の状態を有し、前記半導体集積回路装置はさらに、前記第1の状態を実現するものとして、前記メモリインタフェースブロック側から順にパラレルシリアル変換部およびシリアルパラレル変換部を有し、前記パラレルシリアル変換部は、前記メモリインタフェースブロックからのKビット(Kは2以上の整数)のパラレルデータをシリアルデータに変換して前記シリアルデータ転送区間に出力し、前記シリアルパラレル変換部は、前記シリアルデータ転送区間を介して送られてきた前記シリアルデータをLビット(Lは2以上の整数)のパラレルデータに変換して前記演算処理ブロックのうちの少なくとも1つへ出力し、前記シリアルデータは、前記パラレルシリアル変換部で前記シリアルデータに変換される前のパラレルデータの転送速度のK倍以上の速度で転送され、前記シリアルパラレル変換部で変換された後のパラレルデータは、前記パラレルシリアル変換部で前記シリアルデータに変換される前のパラレルデータの転送速度のK/L倍以上の速度で転送される構成としてもよい。
 これにより、外部メモリからの読み出し時において、パラレルデータの転送区間の一部がシリアルデータで転送されるが、そのことに起因する実質的な転送速度の低下はない。さらに、パラレルデータのビット数についてもK:Lの比で変更することができ、かつ、そのことに起因する実質的な転送速度の低下はない。
 また、前記シリアルデータ転送区間を有するデータ転送バスは、前記演算処理ブロックのうちの少なくとも1つから前記メモリインタフェースブロックへの入力データを転送する第2の状態を有し、前記半導体集積回路装置はさらに、前記第2の状態を実現するものとして、前記メモリインタフェースブロック側から順にシリアルパラレル変換部およびパラレルシリアル変換部を備え、前記パラレルシリアル変換部は、前記演算処理ブロックのうちの少なくとも1つから出力されたQビット(Qは2以上の整数)のパラレルデータをシリアルデータに変換して前記シリアルデータ転送区間に出力し、前記シリアルパラレル変換部は、前記シリアルデータ転送区間を介して送られてきた前記シリアルデータをRビット(Rは2以上の整数)のパラレルデータに変換して前記メモリインタフェースブロックに出力し、前記シリアルデータは、前記パラレルシリアル変換部で前記シリアルデータに変換される前のパラレルデータの転送速度のQ倍以上の速度で転送され、前記シリアルパラレル変換部で変換された後のパラレルデータは、前記パラレルシリアル変換部で前記シリアルデータに変換される前のパラレルデータの転送速度のQ/R倍以上の速度で転送される構成としてもよい。
 これにより、外部メモリへの書き込み時において、パラレルデータの転送区間の一部がシリアルデータで転送されるが、そのことに起因する実質的な転送速度の低下はない。さらに、パラレルデータのビット数についてもQ:Rの比で変更することができ、かつ、そのことに起因する実質的な転送速度の低下はない。
 また、前記メモリインタフェースFブロックは、前記外部メモリに対してDRAM(Dynamic Random Access Memory)制御をおこなうことが好ましい。
 また、上記目的を達成するために、第2の発明に係る映像音響処理システムの一実施形態は、映像音響処理を行う半導体集積回路装置を備える映像音響処理システムであって、上述の半導体集積回路装置と、前記外部メモリとを備え、前記半導体集積回路装置中の少なくとも2つの演算処理ブロックには、映像音響処理を行うブロックが含まれることを特徴とする。
 これにより、映像音響処理システムを構成する半導体集積回路装置では、少なくとも1つの演算処理ブロックとメモリI/Fブロックとを接続するデータ転送バスは、シリアルデータ転送をする区間を有するので、その区間を、1本の信号線で接続することができ、配線混雑が緩和される。なお、前記外部メモリは、DRAM(Dynamic Random Access Memory)であるのが好ましい。
 上記目的を達成するために、第3の発明に係る半導体集積回路装置の一実施形態は、外部メモリと接続して用いられる半導体集積回路装置であって、少なくとも2つの演算処理ブロックと、前記外部メモリへ送出するデータ、あるいは前記外部メモリから入力されるデータの一時保持のためのバッファブロックとを備え、前記バッファブロックと前記少なくとも2つの演算処理ブロックのそれぞれとの間を接続する全てのデータ転送区間は、少なくとも1つのシリアルデータ転送区間を共有することを特徴とする。
 これにより、バッファブロックと少なくとも1つの演算処理ブロックとの間の全てのデータ転送区間は、少なくとも1つのシリアルデータ転送区間を共有するので、複数の演算処理ブロックが設けられている場合であっても、バッファブロックとのデータ入出力については、1本の信号線で済み、配線混雑が大幅に緩和される。
 さらに、前記バッファブロックから前記演算処理ブロックへのデータ転送経路において、前記バッファブロックから出力されるパラレルデータをシリアルデータに変換して前記シリアルデータ転送区間に出力する第1のパラレルシリアル変換部と、前記シリアルデータ転送区間を介して送られてきた前記シリアルデータを再度パラレルデータに変換する、前記少なくとも2つの演算処理ブロックのそれぞれに対応して設けられた、少なくとも2つの第1のシリアルパラレル変換部とを備え、前記少なくとも2つの第1のシリアルパラレル変換部に入力されるデータは、共有された前記シリアルデータ転送区間を経由した同一のシリアルデータであるのが好ましい。
 これにより、外部メモリからの読み出し時において、バッファブロックから出力されたパラレルデータが共通の1個のパラレルシリアル変換部で変換され、共通のシリアルデータ転送区間を経て全ての演算処理ブロックに配信される。よって、バッファブロックの近くには、1個のパラレルシリアル変換部とその出力であるシリアルデータ転送バスとなるので、バッファブロックの周辺における配線混雑が緩和される。
 さらに、前記少なくとも2つの演算処理ブロックから前記バッファブロックへのデータ転送経路において、前記バッファブロックに入力されるパラレルデータを生成する第2のシリアルパラレル変換部と、前記シリアルデータ転送区間を介して前記第2のシリアルパラレル変換部に入力されるシリアルデータを生成する、前記少なくとも2つの演算処理ブロックのそれぞれに対応して設けられた少なくとも2つの第2のパラレルシリアル変換部とを備えることを特徴とする。
 これにより、外部メモリへの書き込み時において、バッファブロックには、共通のシリアルデータ転送区間を経て送られてきたシリアルデータが1個のシリアルパラレル変換部で変換された後のパラレルデータが入力される。よって、バッファブロックの近くには、シリアルデータ転送バスと1個のシリアルパラレル変換部となるので、バッファブロックの周辺における配線混雑が緩和される。
 さらに、前記少なくとも2つの演算処理ブロックのそれぞれと、対応する前記第1のパラレルシリアル変換部あるいは前記第2のシリアルパラレル変換部との間のデータ転送を制御する、前記少なくとも2つの演算処理ブロックのそれぞれに対応して設けられた、少なくとも2つのデータ転送制御ブロックと、前記データ転送制御ブロックをスケジューラとして動作させるための制御ブロックとを備え、前記第1のシリアルパラレル変換部は、前記第1のパラレルシリアル変換部と前記データ転送制御ブロックの間に配置され、前記第2のパラレルシリアル変換部は、前記第2のシリアルパラレル変換部と前記データ転送制御ブロックの間に配置される構成とするのが好ましい。
 これにより、演算処理ブロックのそれぞれに対応して、スケジューラとして機能するデータ転送制御ブロックが設けられるので、複数の演算処理ブロックが設けられた場合に、それら複数の演算処理ブロックによる、共通のシリアルデータ転送区間の使用に関する排他制御が可能となる。
 また、前記第1のパラレルシリアル変換部は、前記バッファブロックから出力されたNビット(Nは2以上の整数)のパラレルデータをシリアルデータに変換して前記シリアルデータ転送区間に出力し、前記少なくとも2つの第1のシリアルパラレル変換部のそれぞれは、前記シリアルデータ転送区間を介して送られてきた前記シリアルデータをNビットのパラレルデータに変換して対応する演算処理ブロックに出力し、前記シリアルデータは、前記第1のパラレルシリアル変換部で変換される前のパラレルデータを転送する速度のN倍以上の転送速度で転送されることが好ましい。
 これにより、外部メモリからの読み出し時におけるデータ転送バスにおいて、Nビットのパラレルデータがシリアルデータに変換され、再びNビットのパラレルデータに戻されるが、シリアルデータの転送速度がパラレルデータの転送速度のN倍なので、実質的な転送速度の低下は回避される。
 また、前記少なくとも2つの第2のパラレルシリアル変換部のそれぞれは、対応する前記演算処理ブロックから出力されたMビット(Mは2以上の整数)のパラレルデータをシリアルデータに変換して前記シリアルデータ転送区間に出力し、前記第2のシリアルパラレル変換部は、前記シリアルデータ転送区間を介して送られてきた前記シリアルデータをNビットのパラレルデータに変換して前記バッファブロックに出力し、前記シリアルデータは、前記第2のパラレルシリアル変換部で変換される前のパラレルデータを転送する速度のM倍以上の転送速度で転送され、前記第2のシリアルパラレル変換部で変換された後のパラレルデータは、前記第2のパラレルシリアル変換部で前記シリアルデータに変換される前のパラレルデータの転送速度のM/N倍以上の転送速度転送されることが好ましい。
 これにより、外部メモリへの書き込み時におけるデータ転送バスにおいて、Mビットのパラレルデータがシリアルデータに変換され、再びNビットのパラレルデータに戻されるが、変換後のパラレルデータの転送速度が変換前のパラレルデータの転送速度のM/N倍なので、実質的な転送速度の低下は回避される。
 また、上記目的を達成するために、第4の発明に係る映像音響処理システムの一実施形態は、映像音響処理を行う半導体集積回路装置を備える映像音響処理システムであって、請求項8~13のいずれか1項に記載の半導体集積回路装置と、前記半導体集積回路装置中のバッファブロックと接続される前記外部メモリとを含み、前記半導体集積回路装置中の少なくとも2つの演算処理ブロックには、映像音響処理を行うブロックが含まれる。
 これにより、映像音響処理システムを構成する半導体集積回路装置では、バッファブロックと少なくとも1つの演算処理ブロックとの間の全てのデータ転送区間は、少なくとも1つのシリアルデータ転送区間を共有するので、複数の演算処理ブロックが設けられている場合であっても、バッファブロックとのデータ入出力については、1本の信号線で済み、配線混雑が大幅に緩和される。
 なお、前記外部メモリはDRAM(Dynamic Random Access Memory)であることが好ましい。
 本発明によれば、パラレルデータを転送するためのバス配線により、レイアウト上の配線混雑が生じている場合に、その混雑が生じている箇所はシリアル転送することで配線に必要な面積を削減でき、結果として配線混雑によるレイアウト困難を緩和することが可能になる。またその際に従来のメモリI/Fブロック、演算処理ブロックを流用することが可能になり、従来のプラットフォームに基づく開発形態が、扱うデータ量が増大しても、継続できるという効果が得られる。
 また、本発明によれば、パラレルデータをシリアルデータに変換した後も、また再度パラレルデータに変換した後も、当初のデータの転送情報を欠けさせることなく転送することが可能になる。
 また、更に本発明によれば、各演算処理ブロックに応じたバス幅を選択することが可能になる。
 また、本発明によれば、過去の設計資産を継承しつつ、面積増加を抑えた半導体集積回路装置を用いた映像音響処理システムを構築することができ、コンパクトな映像音響処理システムが実現できるという効果が得られる。
 更に別の形態の発明によれば、パラレルデータを転送するためのバス配線により、レイアウト上で特に混雑が生じているバッファブロック近辺でのレイアウト困難を緩和することが可能になり、またその際でも従来の演算処理ブロックを流用することが可能になり、従来のプラットフォームに基づく開発形態が、扱うデータ量が更に増大しても、継続できるという効果が得られる。
 また、本発明によれば、バッファブロック直後にパラレルデータとシリアルデータの変換部を配置することで、従来のメモリI/Fブロックそのものを流用することは不可能であっても、その構成要素を流用することが可能となり、従来の設計資産を流用しつつ、コンパクトな半導体集積回路装置および映像音響処理システムが開発できるという効果が得られる。
図1は、実施の形態1における映像音響処理用LSIを用いた映像音響処理システムの構成図である。 図2は、パラレルシリアル変換部およびシリアルパラレル変換部として機能する回路の一例を示す図である。 図3は、バスが双方向である場合の構成の一例を示す図である。 図4は、バスが単方向である場合の構成の一例を示す図である。 図5は、実施の形態2における映像音響処理用LSIを用いた映像音響処理システムの構成図である。 図6は、従来の映像音響処理用LSIの構成図である。
 以下、本発明の実施の形態について、図面を用いて詳細に説明する。
 (実施の形態1)
 図1は本発明に係る映像音響処理システム100の内部の基本構成を示す機能ブロック図およびシステム構成図である。
 映像音響処理システム100は、半導体基板あるいはプリント基板上に実装される映像音響処理用の回路であり、映像音響処理用のLSI(半導体集積回路装置)10と、その外部メモリ(DDR用SDRAM)700から構成される。
 LSI10は、内部に、少なくとも1つの映像音響処理を行うブロックを含む合計4個の演算処理ブロック110、120、130、140、メモリI/Fブロック500、変換部(P/S)323、324を持つ。
 演算処理ブロック110、120、130、140は、加算、減算、乗算、除算、論理和、論理積、ビット処理等の算術論理演算の少なくとも一つを実行する回路である。演算処理ブロック110は、例えば、上述したマイコンブロックであり、演算処理ブロック120は、例えば、上述したメディア処理ブロックであり、演算処理ブロック130は、例えば、上述したストリームI/Oブロックであり、演算処理ブロック140は、例えば、上述したAVIOブロックである。
 なお、マイコンブロックは、このLSI10全体を制御するプロセッサである。ストリームI/Oブロックは、蓄積メディアやネットワーク等の周辺デバイスから圧縮画像音声ストリーム等のストリームデータを読み込み、メモリI/Fブロック500を介して外部メモリ700に格納したり、その逆方向のストリーム転送をしたりする回路ブロックである。メディア処理ブロックは、映像音響処理を行うブロックの一つであり、外部メモリ700からメモリI/Fブロック500を介して圧縮画像音声ストリーム等の画像音声データを読み出し、圧縮又は伸張等のメディア処理を行った後に、再び、メモリI/Fブロック500を介して、処理後の画像データや音声データを外部メモリ700に格納する回路ブロックである。AVIOブロックは、映像音響処理を行うブロックの一つであり、メモリI/Fブロック500を介して外部メモリ700から画像データ及び音声データ等を読み出し、各種グラフィック処理等を施した後に、画像信号及び音声信号として外部の表示装置やスピーカ等に出力したり、その逆方向のデータ転送をしたりする回路ブロックである。
 メモリI/Fブロック500は、LSI10から外部メモリ700へのアクセスを制御する回路であり、ここでは、外部メモリ700と、LSI10内部の演算処理ブロック110、120、130、140とのデータのやり取りを制御する。また、このメモリI/Fブロック500は、外部メモリ700に対してのDDR SDRAMアクセス制御を行う。なお、このメモリI/Fブロック500は、上述した従来のメモリI/Fブロック6が備える構成要素、つまり、バッファ部と、SoC LSI各ブロックとの転送を制御する、各ブロックに対応したデータ転送制御部(サブシステムIF部)と、内蔵RAM部とを備えてもよい。
 外部メモリ700とメモリI/Fブロック500との間には、それらを結ぶバス600が設けられている。
 演算処理ブロック110、130、140とメモリI/Fブロック(500)との間には、それぞれ、パラレルデータのデータ転送で使用されるデータ転送バス310、330、340が設けられている。
 変換部323は、演算処理ブロック120とメモリI/Fブロックとの間に設けられ、パラレルデータとシリアルデータとの間の両方向の変換をする変換回路であり、外部メモリ700から演算処理ブロック120への読み出し(第1の状態)に際してはシリアルパラレル変換部として機能し、逆に演算処理ブロック120から外部メモリ700への書き込み(第2の状態)に際してはパラレルシリアル変換部として機能する。なお、本明細書において、シリアルパラレル変換とは、シリアルデータからパラレルデータへの変換をいい、パラレルシリアル変換とは、パラレルデータからシリアルデータへの変換をいう。
 変換部324は同様に、演算処理ブロック120とメモリI/Fブロックとの間に設けられ、パラレルデータとシリアルデータとの間の両方向の変換をする変換回路であり、外部メモリ700から演算処理ブロック120への読み出し(第1の状態)に際してはパラレルシリアル変換部として機能し、逆に演算処理ブロック120から外部メモリ700への書き込み(第2の状態)に際してはシリアルパラレル変換部として機能する。
 変換部323と変換部324との間には、変換部323、324によって生成されたシリアルデータを伝送するシリアル伝送路325が設けられている。
 演算処理ブロック120と変換部323との間には、パラレルデータを伝送するデータ転送バス321が設けられ、同様にメモリI/Fブロック500と変換部324との間にも、パラレルデータを伝送するデータ転送バス322が設けられている。
 本実施の形態は、従来では、データ転送バス310、330、340のようにパラレルデータ転送をしていた構成に対し、配線混雑を緩和するために、メモリI/Fブロック500と演算処理ブロック120の間のデータ転送バスの一部をシリアル転送する構成を有するものである。
 このように、本実施の形態におけるLSI10では、メモリI/Fブロック500と4つの演算処理ブロック110、120、130、140のそれぞれとは、独立してデータを転送できる経路(310、320、330、340)で接続され、それら4つの経路(310、320、330、340)のうちの1つの経路(320)は、シリアルデータを転送する区間(シリアル伝送路325)を有する。なお、シリアル伝送路325は、パラレルシリアル変換によって生成されたシリアルデータを伝送する信号線であり、1本の信号線に限られるものではなく、複数の信号線から構成されてもよい。本実施の形態では、後述するように、シリアル伝送路325は、4つのシリアルデータそれぞれを伝送する4本の信号線から構成される。
 以下で、さらに詳細に、各構成要素を説明する。
 データ転送バス322、321のバス幅は、例えば、64ビットであり、転送速度は、例えば、200MHz、また、変換部323、324は、例えば、16ビットデータを1ビットのシリアルデータに変換する複数の変換回路および、1ビットを16ビットのパラレルデータに変換する複数の変換回路を有するとする。
 従って、外部メモリ700から演算処理ブロック120への読み出しのために、4個のパラレルシリアル変換回路を変換部324に配置し、4個のシリアルパラレル変換回路を変換部323に配置する。
 同様に、演算処理ブロック120から外部メモリ700への書き込みのために、4個のパラレルシリアル変換回路を変換部323に配置し、4個のシリアルパラレル変換回路を変換部324に配置する。
 また、転送速度は次のように設定する。シリアル伝送路325におけるシリアルデータの転送速度は、パラレルデータを転送するデータ転送バス321、322の転送速度200MHzの16倍として、3.2GHzと設定する。つまり、Nビットのパラレルデータがシリアルデータに変換される場合には、シリアルデータの転送速度として、変換前のパラレルデータの転送速度のN倍以上の速度となるように設定しておく。
 以上の構成で、シリアル転送を行うことを除けば、演算処理ブロック120とメモリI/Fブロック500との転送帯域は64ビットパラレルデータバスを200MHzで転送するときと変わりなく、従来構成がそのようなバス構成であれば、演算処理ブロック120とメモリI/Fブロック500の設計資産を流用できる。一方で、シリアル転送することで該当の箇所の配線密度を約1/16とすることができ配線混雑の緩和が実現できるという効果を得ることができる。
 なお、本実施の形態ではLSI10内部では4つの演算処理ブロックを想定したが、この数は4つに限定されず、メモリI/Fブロック500とパラレルデータ転送を行うブロックという観点であれば、4以上であっても4以下であっても本発明の有効性は変わらない。
 また、本実施の形態では、シリアル転送を含む区間を持つ転送バスを1つだけと想定したが、配線混雑の度合いにより、更に多くのバスに対し、シリアル転送を行う構成としてもよい。すなわち、全演算処理ブロックがシリアル転送区間を持つとしてかまわない。
 パラレルデータとシリアルデータの変換回路については、例えば図2に示すような変換回路(信号線数の変換の割合1:16)が考えられるが、この構成には限らず、本発明には適用可能である。なお、図2は、変換部323、324の回路例を示す。ここでは、16個のD型プリップフロップと、その入力端子に接続された16個の2入力1出力のセレクタと、動作クロックを選択する1個の2入力1出力セレクタが示されている。この回路は、シリアル/パラレル切り替え信号に依存して、パラレルシリアル変換部として動作するか、シリアルパラレル変換部として動作するかが決定される。
 また、上記実施の形態では変換の割合を1:16としたが、これは本割合には限らない。すなわち1:8、1:24など転送速度と配線混雑度のバランスから考えることが可能である。
 なお、本割合1:16の場合は、シリアルデータ転送区間はパラレルデータの転送区間の16倍の速度で転送する必要があるが、近年のLSI間通信の主流であるSerDes(SerializerDeserializer)の技術を使えば十分に可能である。むしろ、パラレルデータのように各データ間のスキュー調整などを行わなくてよい分、高速化は容易であるといえる。
 更に、本実施の形態ではデータ転送バス321、322のバス幅および転送速度は同じとしたが、同じである必要はない。例えば、データ転送バス322が64ビット、200MHzであった場合、データ転送バス321が128ビットであれば、その転送速度は100MHzでよい。なお、その場合の変換部323は、1:32の変換の割合をもつパラレルシリアル変換回路、シリアルパラレル変換回路をそれぞれ4つずつ持つ構成となる。
 データ転送バス310、330、340、321、322、600については、図3に示すような双方向バス型(1本の双方向バス)、及び、図4に示すような単方向バス型(2本の単方向バス)の両方を考えることができる。いずれの場合もパラレルデータの配線混雑を緩和するという本発明の有効性は変わらない。
 また、本実施の形態では、4つの演算処理ブロック110~140とメモリI/Fブロック500とを接続する4つのデータ転送バス310~340のうちの一つのデータ転送バス320だけがシリアルデータを転送する区間を有したが、本発明は、このような数に限定されるものではない。4つのデータ転送バス310~340のうちの2以上のデータ転送バスがシリアルデータを転送する区間を有してもよい。それにより、配線の混雑度はより緩和される。
 また、本実施の形態では、シリアル伝送路325は双方向であったが、本発明は片方向であってもよい。シリアル伝送路325を利用する演算処理ブロック120が外部メモリ700からデータの読み出しだけをする、あるいは、外部メモリ700へデータの書き込みだけをするブロックである場合には、片方向のシリアル伝送で済むからである。
 以上、実施の形態1を説明した。
 本実施の形態により、ほとんどのケースの配線混雑は解消、緩和されると考えられるが、メモリI/Fブロック500と演算処理ブロック110~140の間にデータ転送バスが独立に存在していることから、メモリI/Fブロック500周辺で配線混雑が残る可能性がある。次の実施の形態でその場合でも本発明により問題が解消されることを示す。
 (実施の形態2)
 図5は本発明の実施の形態2に係る映像音響処理システム200の内部の基本構成を示す別の機能ブロック図およびシステム構成図である。
 映像音響処理システム200は、半導体基板あるいはプリント基板上に実装される映像音響処理用のシステムであり、映像音響処理用のLSI(半導体集積回路装置)20と、その外部メモリ700から構成される。
 LSI20は内部に演算処理ブロック110、120、130、140、バッファブロック510、変換部(P/S)421~425、制御ブロック520、データ転送制御ブロック810~840を持つ。
 演算処理ブロック110は、例えば、上述したマイコンブロックであり、演算処理ブロック120は、例えば、上述したメディア処理ブロックであり、演算処理ブロック130は、例えば、上述したストリームI/Oブロックであり、演算処理ブロック140は、例えば、上述したAVIOブロックである。
 バッファブロック510は、外部メモリ700からの読み出しデータ、あるいは、外部メモリ700への書き込みデータの一時保持を行うメモリである。
 外部メモリ700(DDR SDRAM)とバッファブロック510との間には、それらを結ぶバス600が設けられている。
 変換部421、422、423、424は、それぞれ、演算処理ブロック110、120、130、140とバッファブロック510との間のデータ転送経路に設けられ、パラレルデータとシリアルデータとの間の両方向の変換をする変換回路であり、外部メモリ700から対応する演算処理ブロックへの読み出し(第1の状態)に際してはシリアルパラレル変換部として機能し、逆に対応する演算処理ブロックから外部メモリ700への書き込み(第2の状態)に際してはパラレルシリアル変換部として機能する。
 変換部425は同様に、演算処理ブロック110~140とバッファブロック510との間のデータ転送経路に設けられ、パラレルデータとシリアルデータとの間の両方向の変換をする変換回路であり、外部メモリ700から演算処理ブロック110~140への読み出し(第1の状態)に際してはパラレルシリアル変換部として機能し、逆に演算処理ブロック110~140のいずれかから外部メモリ700への書き込み(第2の状態)に際してはシリアルパラレル変換部として機能する。
 変換部421~424と変換部425との間には、変換部421、422、423、424、425によって生成されたシリアルデータを伝送するシリアル伝送路400が設けられている。
 シリアル伝送路400は、その一端が変換部425に接続され、分岐点401において、4つに分配され、それぞれ、変換部421、422、423、424に接続されている。つまり、バッファブロック510と演算処理ブロック110~140のそれぞれとの間を接続する全て(4つ)のデータ転送区間は、少なくとも1つのシリアルデータ転送区間(変換部425と分岐点401との間の区間)を共有している。よって、変換部421、422、423、424のそれぞれに入力されるまでのシリアルデータは、共有されたシリアルデータ転送区間を経由した同一のシリアルデータとなる。
 データ転送制御ブロック810、820、830、840は、それぞれ、演算処理ブロック110、120、130、140に対応するもので、従来のメモリI/Fブロック6に含まれていたデータ転送制御ブロック(サブシステムIF)であり、各演算処理ブロック110~140と変換部421、422、423、424との間に配置され、その間のデータ転送を制御する。
 制御ブロック520は、従来のメモリI/Fブロック6に含まれていたものと同等のものであり、データ転送制御ブロック810、820、830、840と連携して、各演算処理ブロック110~140とバッファブロック510間の転送制御、更に、外部メモリ700に対してのDDR SDRAMアクセス制御を行う。
 以上のように構成された本実施の形態における映像音響処理システム200において、外部メモリ700から演算処理ブロック110~140への読み出しの場合は以下の手順で転送が行われる。
 いま、読み出し要求が演算処理ブロック110からの要求であるとする。
 step1:バスマスタである各演算処理ブロック110がリードコマンドを出す。
 step2:対応するデータ転送制御ブロック810がデータ転送バス811を通じて、そのコマンドを受ける。
 step3:データ転送制御ブロック810が、制御信号線525を通じて、リード要求を制御ブロック520へ伝達する。
 step4:制御ブロック520が外部メモリ700へリード要求を出す。
 step5:バッファブロック510が外部メモリ700からデータを読み出し、読み出したデータを一時保持する。
 step6:制御ブロック520がその読み出したデータの行き先を制御信号線525を通じて、データ転送制御ブロック810、820、830、840に知らせる。
 step7:バッファブロック510はデータ転送バス450を通じて、データを出力する。
 step8:そのデータは変換部425を通じてパラレルデータからシリアルデータに変換され、変換部421、422、423、424へ送信される。
 step9:そのシリアルデータは変換部421、422、423、424でパラレルデータに変換された後に各データ転送制御ブロック810、820、830、840に送信されるが、別途制御信号線525を通じて示された、データ転送制御ブロック810のみがそのパラレルデータを保持する。
 step10:そのパラレルデータを受け取ったデータ転送制御ブロック810は、対応する演算処理ブロック110に送信する。
 また、演算処理ブロック110~140から外部メモリ700への書き込みの場合は以下の手順で転送が行われる。
 いま、書き込み要求が演算処理ブロック110からの要求であるとする。
 step1:バスマスタである各演算処理ブロック110がライトコマンドを出す。
 step2:対応するデータ転送制御ブロック810がデータ転送バス811を通じて、そのライトデータ、およびコマンドを受ける。
 step3:データ転送制御ブロック810が、制御信号線525を通じて、ライト要求を制御ブロック520へ伝達する。
 step4:制御ブロック520は、他の演算処理ブロック120、130、140からの要求状態を確認し、調停して、データ転送制御ブロック810に送信許可を、制御信号線525を通じて、送信する。
 step5:データ転送制御ブロック810は、ライトデータを出力する。
 step6:バッファブロック510は、データ転送制御ブロック810からのライトデータを受け取る。
 step7:制御ブロック520が外部メモリ700に対しライト要求を出す。
 step8:ライトデータがバッファブロック510から外部メモリ700に書き込まれる。
 以上の手順において、読み出し経路の場合は、制御ブロック520は、各データ転送制御ブロック810、820、830、840と連携して、共通のシリアルデータ400をどのデータ転送制御ブロック810、820、830、840が受け取るかを制御し、また、書き込み経路の場合は、どのデータ転送制御ブロック810、820、830、840のデータを共通のシリアルデータ400とするかを制御する。更に同時に、各経路の場合で、外部メモリ700に対して、リードアクセス、ライトアクセスを制御する。
 本実施の形態は、従来、メモリI/Fブロック、すなわちバッファブロック510の近辺で、各演算処理ブロック毎に独立のバスとして展開(接続)した時点で既に配線混雑が起こっていたことに対応するために、バッファブロック510出力直後のパラレルデータをシリアルデータとして配線混雑を緩和、あるいは解消するものである。
 実施の形態1におけるデータ転送バス310、330、340のようにパラレルデータ転送をしていた構成に対し、本実施の形態では、配線混雑を緩和するために、バッファブロック510と演算処理ブロック110~140のそれぞれとの間のデータ転送バスのすべてをシリアル転送としている。
 以下で、さらに詳細に、各構成要素を説明する。
 データ転送バス450のバス幅は、例えば、256ビット、データ転送バス811、812、821、822、831、832、841、842のバス幅は、例えば、64ビットであり、転送速度は、例えば、200MHz、また、変換部421~425では、例えば、16ビットデータを1ビットのシリアルデータに変換する複数の変換回路および、1ビットを16ビットのパラレルデータに変換する複数の変換回路を用いるとする。
 具体的には、外部メモリ700から演算処理ブロック110~140への読み出しのために、16個のパラレルシリアル変換回路を変換部425に配置し、4個のシリアルパラレル変換回路を変換部421~424にそれぞれ配置する。
 同様に、演算処理ブロック110~140から外部メモリ700への書き込みのために、4個のパラレルシリアル変換回路を変換部421、422、423、424にそれぞれ配置し、16個のシリアルパラレル変換回路を変換部425に配置する。
 また、転送速度は次のように設定する。シリアル伝送路400におけるシリアルデータの転送速度は、データ転送バス450、811、812、821、822、831、832、841、842の転送速度200MHzの16倍として、3.2GHzと設定する。つまり、Nビットのパラレルデータがシリアルデータに変換される場合には、シリアルデータの転送速度として、変換前のパラレルデータの転送速度のN倍以上の速度となるように設定しておく。
 以上の構成で、シリアル転送を行うことと、メモリI/Fブロックの構成要素が展開されていることを除けば、演算処理ブロック110、120、130、140とバッファブロック510との転送帯域は64ビットパラレルデータバスを200MHzで転送するときと変わりなく、従来構成がそのようなバス構成であれば、演算処理ブロック110~140の設計資産を流用できる。一方で、シリアル転送することで、最も配線が集中する箇所の配線密度を約1/16とすることで配線混雑の緩和が実現できるという効果を得ることができる。
 なお、本実施の形態ではLSI20内部では4つの演算処理ブロックを想定したが、この数は4つに限定されず、バッファブロック510とパラレルデータ転送を行うブロックという観点であれば4以上であっても4以下であっても本発明の有効性は変わらない。
 パラレルデータとシリアルデータの変換回路については、例えば図2に示すような変換回路が考えられるが、この構成には限らず、本発明には適用可能である。
 また、上記実施の形態では変換の割合を1:16としたが、これは本割合には限らない。すなわち1:8、1:24など転送速度と配線混雑度のバランスから考えることが可能である。
 また、上記実施の形態ではデータ転送バス811、812、821、822、831、832、841、842のバス幅および転送速度は同じとしたが、同じである必要はない。例えば、データ転送バス810、811が128ビットであった場合、転送速度は、100MHzとすればよい。なお、その場合の変換部421は、1:32の変換の割合をもつパラレルシリアル変換回路、シリアルパラレル変換回路をそれぞれ4つずつ持つ構成となる。
 つまり、メモリI/Fブロック側から演算処理ブロックへ向けて、順にパラレルシリアル変換部およびシリアルパラレル変換部がこの順で接続される構成となる場合であって、そのパラレルシリアル変換部がKビット(Kは2以上の整数)のパラレルデータをシリアルデータに変換し、かつ、そのシリアルパラレル変換部がそのシリアルデータをLビット(Lは2以上の整数)のパラレルデータに変換するときには、シリアルデータがパラレルシリアル変換部でシリアルデータに変換される前のパラレルデータの転送速度のK倍以上の速度で転送され、かつ、シリアルパラレル変換部で変換された後のパラレルデータがパラレルシリアル変換部でシリアルデータに変換される前のパラレルデータの転送速度のK/L倍以上の速度で転送されるように設定しておくのが好ましい。
 また、実施の形態2でも、データ転送バス450、600、811、812、821、822、831、832、841、842については、図3に示すような双方向バス型、図4に示すような単方向バス型の両方を考えることができる。いずれの場合もパラレルデータの配線混雑を緩和するという本発明の有効性は変わらない。
 また、実施の形態2では、外部メモリ700からの読み出しについては、外部メモリ700から読み出されたデータが4つの演算処理ブロック110~140のうちの一つの演算ブロックに取り込まれたが、本発明は、このような読み出しモードに限定されない。外部メモリ700から読み出されたデータが4つの演算処理ブロック110~140のうちの2以上の演算ブロックによって同時に取り込まれてもよい。外部メモリ700から読み出されたデータは共通のシリアルデータ転送区間を介して4つの演算処理ブロック110~140に同報されるからである。
 また、実施の形態2では、バッファブロック510と4つの演算処理ブロック110~140のそれぞれとの間を接続する4つのデータ転送区間は、1つのシリアルデータ転送区間を共有したが、本発明は、このようなシリアルデータ転送区間の個数に限定されるものではない。4つのデータ転送区間が、分岐点401と変換部425との間に設けられた2以上のシリアルデータ転送区間を共有してもよい。
 以上、本発明に係る半導体集積回路装置および映像音響処理システムについて、実施の形態1および2に基づいて説明したが本発明はこれらの実施の形態に限定されるものではない。本発明の主旨を逸脱しない範囲でこれらの実施の形態に対して当業者が思いつく各種変形を施して得られる形態や、これらの実施の形態における構成要素を任意に組み合わせて実現される形態も本発明に含まれる。
 たとえば、シリアル伝送として、金属配線による伝送だけに限られず、無線伝送、光伝送であってもよい。
 また、本発明は、実施の形態1の特徴と実施の形態2の特徴の両方を有する半導体集積回路装置および映像音響処理システムとして実現してもよい。具体的には、ある演算処理ブロックとメモリI/Fブロック(あるいは、バッファブロック)との間を接続するデータ転送バスについて、その一部にシリアルデータの転送区間を設け、さらに、他の複数の演算処理ブロックとバッファブロック(あるいは、メモリI/Fブロック)のそれぞれとを接続するデータ転送区間について、共通のシリアルデータ転送区間を設けてもよい。つまり、複数の演算処理ブロックの一部については実施の形態1の特徴を備え、他の一部については実施の形態2の特徴を備える構成としてもよい。
 本発明は、LSI、特に、SoC LSIとして、例えば、映像音響処理LSIおよびそのLSIを用いたシステム、大量データを扱うようなネットワーク交換システム用LSIおよびそのシステム等として、有効である。
 10、20 映像音響処理用LSI(半導体集積回路装置)
 100、200 映像音響処理システム
 110、120、130、140 演算処理ブロック
 225、323、324、421、422、423、424 パラレルデータとシリアルデータとの両方向変換をする変換部
 310、321、322、330、340、450、600、811、812、821、822、831、832、841、842 データ転送バス
 325、400 シリアル伝送路
 500 メモリI/Fブロック
 510 バッファブロック
 520 制御ブロック
 700 外部メモリ(外付けDDRメモリ)
 810、820、830、840 データ転送制御ブロック

Claims (15)

  1.  外部メモリと接続して用いられる半導体集積回路装置であって、
     前記外部メモリへのアクセスを制御するメモリインタフェースブロックと、
     少なくとも2つの演算処理ブロックと、
     前記少なくとも2つの演算処理ブロックのそれぞれと前記メモリインタフェースブロックとを接続する少なくとも2つのデータ転送バスとを備え、
     前記少なくとも2つのデータ転送バスの少なくとも1つは、シリアルデータ転送をする区間を有する
     半導体集積回路装置。
  2.  さらに、前記少なくとも1つのシリアルデータ転送区間の両端にそれぞれ設けられたパラレルシリアル変換部およびシリアルパラレル変換部を備え、
     前記パラレルシリアル変換部は、Nビット(Nは2以上の整数)のパラレルデータをシリアルデータに変換して前記シリアルデータ転送区間に出力し、
     前記シリアルパラレル変換部は、前記シリアルデータ転送区間を介して送られてきた前記シリアルデータをNビットのパラレルデータに変換し、
     前記シリアルデータは、前記パラレルシリアル変換部で前記シリアルデータに変換される前のパラレルデータの転送速度のN倍以上の速度で転送される
     請求項1記載の半導体集積回路装置。
  3.  前記シリアルデータ転送区間を有するデータ転送バスは、前記メモリインタフェースブロックから前記演算処理ブロックのうちの少なくとも1つへの出力データを転送する第1の状態を有し、
     前記半導体集積回路装置はさらに、前記第1の状態を実現するものとして、前記メモリインタフェースブロック側から順にパラレルシリアル変換部およびシリアルパラレル変換部を有し、
     前記パラレルシリアル変換部は、前記メモリインタフェースブロックからのKビット(Kは2以上の整数)のパラレルデータをシリアルデータに変換して前記シリアルデータ転送区間に出力し、
     前記シリアルパラレル変換部は、前記シリアルデータ転送区間を介して送られてきた前記シリアルデータをLビット(Lは2以上の整数)のパラレルデータに変換して前記演算処理ブロックのうちの少なくとも1つへ出力し、
     前記シリアルデータは、前記パラレルシリアル変換部で前記シリアルデータに変換される前のパラレルデータの転送速度のK倍以上の速度で転送され、
     前記シリアルパラレル変換部で変換された後のパラレルデータは、前記パラレルシリアル変換部で前記シリアルデータに変換される前のパラレルデータの転送速度のK/L倍以上の速度で転送される
     請求項1記載の半導体集積回路装置。
  4.  前記シリアルデータ転送区間を有するデータ転送バスは、前記演算処理ブロックのうちの少なくとも1つから前記メモリインタフェースブロックへの入力データを転送する第2の状態を有し、
     前記半導体集積回路装置はさらに、前記第2の状態を実現するものとして、前記メモリインタフェースブロック側から順にシリアルパラレル変換部およびパラレルシリアル変換部を備え、
     前記パラレルシリアル変換部は、前記演算処理ブロックのうちの少なくとも1つから出力されたQビット(Qは2以上の整数)のパラレルデータをシリアルデータに変換して前記シリアルデータ転送区間に出力し、
     前記シリアルパラレル変換部は、前記シリアルデータ転送区間を介して送られてきた前記シリアルデータをRビット(Rは2以上の整数)のパラレルデータに変換して前記メモリインタフェースブロックに出力し、
     前記シリアルデータは、前記パラレルシリアル変換部で前記シリアルデータに変換される前のパラレルデータの転送速度のQ倍以上の速度で転送され、
     前記シリアルパラレル変換部で変換された後のパラレルデータは、前記パラレルシリアル変換部で前記シリアルデータに変換される前のパラレルデータの転送速度のQ/R倍以上の速度で転送される
     請求項3記載の半導体集積回路装置。
  5.  前記メモリインタフェースブロックは、前記外部メモリに対してDRAM(Dynamic Random Access Memory)制御をおこなう
     請求項1~4のいずれか1項に記載の半導体集積回路装置。
  6.  映像音響処理を行う半導体集積回路装置を備える映像音響処理システムであって、
     請求項1~5のいずれか1項に記載の半導体集積回路装置と、
     前記外部メモリとを備え、
     前記半導体集積回路装置中の少なくとも2つの演算処理ブロックには、映像音響処理を行うブロックが含まれる
     映像音響処理システム。
  7.  前記外部メモリは、DRAM(Dynamic Random Access Memory)である
     請求項6記載の映像音響処理システム。
  8.  外部メモリと接続して用いられる半導体集積回路装置であって、
     少なくとも2つの演算処理ブロックと、
     前記外部メモリへ送出するデータ、あるいは前記外部メモリから入力されるデータの一時保持のためのバッファブロックとを備え、
     前記バッファブロックと前記少なくとも2つの演算処理ブロックのそれぞれとの間を接続する全てのデータ転送区間は、少なくとも1つのシリアルデータ転送区間を共有する
     半導体集積回路装置。
  9.  さらに、前記バッファブロックから前記演算処理ブロックへのデータ転送経路において、
     前記バッファブロックから出力されるパラレルデータをシリアルデータに変換して前記シリアルデータ転送区間に出力する第1のパラレルシリアル変換部と、
     前記シリアルデータ転送区間を介して送られてきた前記シリアルデータを再度パラレルデータに変換する、前記少なくとも2つの演算処理ブロックのそれぞれに対応して設けられた、少なくとも2つの第1のシリアルパラレル変換部とを備え、
     前記少なくとも2つの第1のシリアルパラレル変換部に入力されるデータは、共有された前記シリアルデータ転送区間を経由した同一のシリアルデータである
     請求項8記載の半導体集積回路装置。
  10.  さらに、前記少なくとも2つの演算処理ブロックから前記バッファブロックへのデータ転送経路において、
     前記バッファブロックに入力されるパラレルデータを生成する第2のシリアルパラレル変換部と、
     前記シリアルデータ転送区間を介して前記第2のシリアルパラレル変換部に入力されるシリアルデータを生成する、前記少なくとも2つの演算処理ブロックのそれぞれに対応して設けられた少なくとも2つの第2のパラレルシリアル変換部とを備える
     請求項9記載の半導体集積回路装置。
  11.  さらに、
     前記少なくとも2つの演算処理ブロックのそれぞれと、対応する前記第1のパラレルシリアル変換部あるいは前記第2のシリアルパラレル変換部との間のデータ転送を制御する、前記少なくとも2つの演算処理ブロックのそれぞれに対応して設けられた、少なくとも2つのデータ転送制御ブロックと、
     前記データ転送制御ブロックをスケジューラとして動作させるための制御ブロックとを備え、
     前記第1のシリアルパラレル変換部は、前記第1のパラレルシリアル変換部と前記データ転送制御ブロックの間に配置され、
     前記第2のパラレルシリアル変換部は、前記第2のシリアルパラレル変換部と前記データ転送制御ブロックの間に配置される
     請求項10記載の半導体集積回路装置。
  12.  前記第1のパラレルシリアル変換部は、前記バッファブロックから出力されたNビット(Nは2以上の整数)のパラレルデータをシリアルデータに変換して前記シリアルデータ転送区間に出力し、
     前記少なくとも2つの第1のシリアルパラレル変換部のそれぞれは、前記シリアルデータ転送区間を介して送られてきた前記シリアルデータをNビットのパラレルデータに変換して対応する演算処理ブロックに出力し、
     前記シリアルデータは、前記第1のパラレルシリアル変換部で変換される前のパラレルデータを転送する速度のN倍以上の転送速度で転送される
     請求項11記載の半導体集積回路装置。
  13.  前記少なくとも2つの第2のパラレルシリアル変換部のそれぞれは、対応する前記演算処理ブロックから出力されたMビット(Mは2以上の整数)のパラレルデータをシリアルデータに変換して前記シリアルデータ転送区間に出力し、
     前記第2のシリアルパラレル変換部は、前記シリアルデータ転送区間を介して送られてきた前記シリアルデータをNビットのパラレルデータに変換して前記バッファブロックに出力し、
     前記シリアルデータは、前記第2のパラレルシリアル変換部で変換される前のパラレルデータを転送する速度のM倍以上の転送速度で転送され、
     前記第2のシリアルパラレル変換部で変換された後のパラレルデータは、前記第2のパラレルシリアル変換部で前記シリアルデータに変換される前のパラレルデータの転送速度のM/N倍以上の転送速度転送される
     請求項11記載の半導体集積回路装置。
  14.  映像音響処理を行う半導体集積回路装置を備える映像音響処理システムであって、
     請求項8~13のいずれか1項に記載の半導体集積回路装置と、
     前記半導体集積回路装置中のバッファブロックと接続される前記外部メモリとを含み、
     前記半導体集積回路装置中の少なくとも2つの演算処理ブロックには、映像音響処理を行うブロックが含まれる
     映像音響処理システム。
  15.  前記外部メモリはDRAM(Dynamic Random Access Memory)である
     請求項14記載の映像音響処理システム。
PCT/JP2009/004711 2009-04-03 2009-09-18 半導体集積回路装置および映像音響処理システム WO2010113226A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009091587 2009-04-03
JP2009-091587 2009-04-03

Publications (1)

Publication Number Publication Date
WO2010113226A1 true WO2010113226A1 (ja) 2010-10-07

Family

ID=42827559

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2009/004711 WO2010113226A1 (ja) 2009-04-03 2009-09-18 半導体集積回路装置および映像音響処理システム

Country Status (1)

Country Link
WO (1) WO2010113226A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11250007A (ja) * 1998-03-05 1999-09-17 Hitachi Ltd シリアルアクセスシステム及びそれに用いるデバイス
JP2003198356A (ja) * 2001-12-25 2003-07-11 Hitachi Ltd 半導体チップおよび集積回路
WO2005096168A1 (ja) * 2004-04-01 2005-10-13 Matsushita Electric Industrial Co., Ltd. 映像音声処理用集積回路
JP2005327223A (ja) * 2004-05-13 2005-11-24 Hiroshi Nakanishi シリアルバスとバススイッチを使用した逐次命令実行型の計算機

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11250007A (ja) * 1998-03-05 1999-09-17 Hitachi Ltd シリアルアクセスシステム及びそれに用いるデバイス
JP2003198356A (ja) * 2001-12-25 2003-07-11 Hitachi Ltd 半導体チップおよび集積回路
WO2005096168A1 (ja) * 2004-04-01 2005-10-13 Matsushita Electric Industrial Co., Ltd. 映像音声処理用集積回路
JP2005327223A (ja) * 2004-05-13 2005-11-24 Hiroshi Nakanishi シリアルバスとバススイッチを使用した逐次命令実行型の計算機

Similar Documents

Publication Publication Date Title
JP4425585B2 (ja) 分割されたシステムデータバスに連結されるメモリモジュールを具備する半導体メモリシステム
US10419338B2 (en) Connecting diverse client cores using a directional two-dimensional router and network
JP3241045B2 (ja) マルチポート共有メモリインタフェースおよび関連の方法
JP5107204B2 (ja) マルチポートメモリアーキテクチャおよび集積回路
US6950910B2 (en) Mobile wireless communication device architectures and methods therefor
US8380943B2 (en) Variable-width memory module and buffer
US20070115995A1 (en) NoC system employing AXI protocol and interleaving method thereof
US20070126474A1 (en) Crossbar switch architecture for multi-processor SoC platform
JP2009527829A (ja) 複数のプロセッサコア用の共通アナログインターフェイス
CN112189324B (zh) 带宽匹配的调度器
US20060095637A1 (en) Bus control device, arbitration device, integrated circuit device, bus control method, and arbitration method
KR100772287B1 (ko) 대규모 병렬 프로세서 어레이를 메모리 어레이에 비트직렬 방식으로 접속하는 방법 및 장치
CN116938631B (zh) 配置总线生成方法、系统、存储介质及电子设备
CN116583823A (zh) 使用长向量仲裁的异步管线合并
US8571016B2 (en) Connection arrangement
WO2010113226A1 (ja) 半導体集積回路装置および映像音響処理システム
KR102195069B1 (ko) 패킷 송신기 및 이를 포함하는 인터페이스 장치
US20080294876A1 (en) Control Device with Flag Registers for Synchronization of Communications Between Cores
CN107844451B (zh) 一种级联板间流水线的“蝶式”传输方法
US7519848B2 (en) Data transfer apparatus
US20050152205A1 (en) Semiconductor memory
KR101993258B1 (ko) 레지스터 슬라이싱 회로 및 이를 포함하는 시스템 온 칩
JP2000339269A (ja) クロスバススイッチ装置
WO2021012767A1 (zh) 用于存储器控制器与存储器设备互连的总线
KR20060103683A (ko) Cpu를 내장한 soc 구조

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09842583

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 09842583

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP