JP2004030890A - Record medium and reproducing apparatus - Google Patents

Record medium and reproducing apparatus Download PDF

Info

Publication number
JP2004030890A
JP2004030890A JP2003159774A JP2003159774A JP2004030890A JP 2004030890 A JP2004030890 A JP 2004030890A JP 2003159774 A JP2003159774 A JP 2003159774A JP 2003159774 A JP2003159774 A JP 2003159774A JP 2004030890 A JP2004030890 A JP 2004030890A
Authority
JP
Japan
Prior art keywords
data
cluster
recorded
picture
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003159774A
Other languages
Japanese (ja)
Other versions
JP3580310B2 (en
Inventor
Yoshimasa Hosono
細野 義雅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2003159774A priority Critical patent/JP3580310B2/en
Publication of JP2004030890A publication Critical patent/JP2004030890A/en
Application granted granted Critical
Publication of JP3580310B2 publication Critical patent/JP3580310B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To attain edit processing in the unit of GOP by simple and high speed processing and even special reproduction such as high speed fast-forward and reverse reproduction in the unit of GOP by the simple and high speed processing in the case of recording digital image data subjected to high efficiency encoding on a disk recording medium such as a mini disk. <P>SOLUTION: Clusters being a unit of reproduction each comprising a plurality of sectors, on which a prescribed data quantity can be recorded, are provided to the outer circumferential side in a recording data area of the disk recording medium such as a mini disk as a reproduction exclusive area, each frame of a group of pictures comprising a prescribed number of consecutive frames of a moving picture and subjected to image compression processing is recorded in a first sector area comprising a prescribed number of sectors 0 to 31 of the clusters and compression data Is adopting a prescribed system of a frame P12 required for reproducing frames B1, B2 of an adjacent group of pictures are recorded on a second sector area comprising other sectors 32 to 35 of the clusters. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明は、高能率符号化されたディジタル画像データを記録するのに好適な記録媒体、及びこの記録媒体に高能率符号化されたディジタル画像データを再生する場合に用いて好適な再生装置に関するものである。
【0002】
【従来の技術】
周知のように、CD−ROM(Compact Disc Read Only Memory)は、音楽用CD(Compact Disc Digital Audio:以下CD−DAと略記)をベースに規格化されたものである。
まず、その物理フォーマットについて簡単に説明する。物理フォーマットとは、CD−ROMのディスクを、CD−ROMドライブに装着した場合、少なくとも物理的にデータを読み出すことができるフォーマットを意味する。
【0003】
1枚のディスクには、最大99トラックの音楽トラック又はデータトラックを含むことができる。このトラックに関する情報は、TOC(Table Of Contents)と呼ばれるディスクの先頭部分、すなわちディスクの最内周部分に記録されている。このTOCが記録された部分がリードイントラック(Leadin Track)と呼ばれる。一方、最終トラック、すなわちCD−DAでは最後の曲が終わる部分はリードアウトトラック(Leadout Track)と呼ばれる。
【0004】
CD−DAでは、16ビット、44.1kHzのサンプリングレートでステレオ音声信号をディジタル化して記録しているので、1秒間では、2(ステレオ)×2(16ビット)×44,100=176,400バイトのデータが記録されていることになる。CD−ROMでは、1秒を75等分したセクタを最小単位として扱うので、1セクタは2,352バイトとなる。
【0005】
CD−ROM MODE−1の場合、1セクタ内に、同期のためのSYNCデータ(12バイト)およびヘッダ(4バイト)と、エラー訂正のためのECC(Error Correction Coding:276バイト)およびEDC(Error Detect Coding:4バイト)等を含むため、残り2048バイトがユーザデータとして記録される。また、音声や画像データ等、データ補間処理などにより厳密なエラー訂正が必要とされないデータに関しては、ECCおよびEDCを省略し、SYNCとヘッダを除く2,336バイトが、ユーザデータとして1セクタ内に記録される。これはCD−ROM MODE−2と呼ばれる。
【0006】
さて、近年、ミニディスク(商標)・システムと呼ばれる録音再生可能なパーソナル・オーディオ機器が開発され、商品化されている。
【0007】
このミニディスクでは、ディスクに書き込む変調方式としてEFM(Eight to Fourteen Modulation)、誤り訂正符号としてCIRC(Cross Interleave Reed−Solomon Code)を採用している。このフォーマットに、ATRAC(Adaptive Transform Acoustic Coding)方式で圧縮したオーディオ・データを記録する。圧縮したデータは、図6に示すように、クラスタと呼ばれるブロックごとにまとめて記録する。上述したCD−ROM MODE−2に非常に近いフォーマットとなっている。
【0008】
CD−ROMはCDの98フレームを1セクタとしている。再生時間に換算すると、13.3msとなる。CIRCのインターリーブ長は、108フレーム(14.5ms)である。CD−ROMの1セクタよりも長い。CIRCの誤り訂正符号を使ってデータを記録するには、少なくとも3セクタを余分に確保する必要がある。この領域をリンク領域と呼ぶ。データを書き始める前に、108フレーム(1セクタ+α)以上のリンク領域を確保しなければならない。データを書き終わった後も、同じように108フレーム以上の領域を確保する必要がある。
このようにしないと、誤り訂正のインターリーブが完結しないからである。
【0009】
任意の場所からデータを書き込めるようにすると、リンク領域がディスクの各部に分散しデータの記録再生効率が悪くなる。そこで、ある程度大きな記録単位ごとにデータを書き込むようにした。ミニディスクでは、この記録単位をクラスタと呼ぶ。1クラスタは36セクタからなる。書き換えは必ず1クラスタの整数倍で行う。記録するデータを一旦RAMに蓄積し、ディスクに書き込む。このRAMは再生の際の耐振防止機能を実現するためのショックプルーフ・メモリと共用できる。
【0010】
録音再生可能な光磁気ディスク型のミニディスクでは、1クラスタ(=36セクタ)の内、3セクタをリンク・セクタとし、さらに次の1セクタをサブデータ用に確保しておく。圧縮データは、残りの32セクタに記録する。
【0011】
データを記録するときには、前のクラスタの第2番目のリンク・セクタの途中から書き始める。36セクタ目を書き終わるときは、先頭のリンク・セクタと第2番目のリンクセクタの途中まで誤り訂正用のデータを書かなければならない。
【0012】
再生専用のCDと同様なミニディスクでは、クラスタ単位での書き換えを考慮する必要がなく、データが連続的に記録されているので、リンク領域の3セクタは不要である。この3セクタにサブデータ用の1セクタを合わせた4セクタを、全てサブデータ用に割り当て、グラフィックスのデータなどを格納することができるようになっている。
【0013】
このように、ミニディスクでは、録音用のディスクと再生専用ディスクのサブデータ容量が異なり、サブデータまで含めると、再生専用ディスクから録音用ディスクへの完全な複写はできないようになっている。
【0014】
また、録音用のディスクで、既に記録されているデータの一部を書き換えようとする場合においては、その更新データが例え僅かであったとしても、クラスタ全体を書き換える必要がある。クラスタを単位としてインターリーブされているからである。
【0015】
一方、画像信号を高能率符号化する方式として、MPIG1(Moving Picture Image Coding Experts Group Phasel)による標準化案に従って、ディジタル・ストレージ・メディア用の画像信号の高能率符号化方式が規定されている。ここで、当該方式で対象としているストレージ・メディアは、CDやDAT(ディジタル・オーディオ・テープ)、ハードディスク等のように、連続的な転送速度が約1.5Mbit/sec以下のものである。また、これは、直接復号器に接続されるだけでなく、コンピュータのバス、LAN(ローカル・エリア・ネットワーク)、テレコミュニケーション等の伝送媒体を介して接続されることも想定されており、更に、正順再生だけでなく、ランダムアクセスや高速再生、逆順再生等のような特殊機能についても考慮されている。
【0016】
このようなMPEG1による画像信号の高能率符号化方式の原理は、以下に示すようなものである(例えば、非特許文献1参照)。
【0017】
この高能率符号化方式では、まず、画像間の差分を取ることで時間軸方向の冗長度を削減し、その後、離散コサイン変換(DCT)処理と可変長符号化処理を使用して時間軸方向の冗長度を削減するようになっている。
【0018】
まず、時間軸方向の冗長度について以下に述べる。
一般に、連続した動画では、時間的に前後の画像と、現在注目している画像(ある時刻の画像)とは良く似ているものである。このため、例えば図16に示すように、今から符号化しようとしている画像と、時間的に前方の画像の差分を取り、その差分を伝送するようにすれば、時間軸方向の冗長度を減らして伝送する情報量を少なくすることが可能となる。このようにして符号化される画像は、後述する前方予測符号化画像(Predictive−coded picture、PピクチャあるいはPフレーム)と呼ばれる。同様に、今から符号化しようとしている画像と、時間的に前方あるいは後方もしくは、前方及び後方から生成された補間画像との差分を取り、それらのうち小さな値の差分を伝送するようにすれば、時間軸方向の冗長度を減らして伝送する情報量を少なくすることが可能となる。このようにして符号化される画像は、後述する両方向予測符号化画像(Bidirectionally Predictive−coded picture、BピクチャあるいはBフレーム)と呼ばれる。なお、図16において、図中符号Iで示す画像は、後述する画像内符号化画像(イントラ符号化画像:Intra−coded picture、IピクチャあるいはIフレーム)を示し、同図中符号Pで示す画像はPピクチャを示し、符号Bで示す画像はBピクチャを示している。
【0019】
また、予測画像を生成するためには、動き補償が行われる。
この動き補償によれば、例えば8×8画素の単位ブロックにより構成される16×16画素のブロック(以下、マクロブロックと呼ぶ)を抽出し、前画像の対応するマクロブロックの位置の近傍で一番差分の少ないマクロブロックを探索し、この探索されたマクロブロックとの差分を取ることにより、送らなければならないデータを削減することができる。実際には、例えば、Pピクチャ(前方予測符号化画像)では、動き補償後の予測画像と差分を取ったものと、この動き補償後の予測画像と差分を取らないものとの内、データ量の少ないものを16×16画素のマクロブロック単位で選択して符号化する。
【0020】
しかし、上述したような場合、例えば、物体が動いた後に見えてくる背景などの画像の部分に関しては、多くのデータを伝送しなければならない。そこで、例えば、Bピクチャ(両方向予測符号化画像)では、既に復号化された動き補償後の時間的に前方あるいは後方の画像および、その両者を加算して生成した補間画像と今から符号化しようとしている画像との差分と、この差分を取らないもの、すなわち今から符号化しようとしている画像の四者の内、一番データ量の少ないものが符号化される。
【0021】
次に、空間軸方向の冗長度について以下に述べる。
画像データの差分は、そのまま伝送するのではなく、8×8画素の単位ブロック毎に離散コサイン変換(DCT)を施す。このDCTは、画像を画素レベルでなく、コサイン関数のどの周波数成分がどれだけ含まれているかで表現するものであり、例えば2次元DCTにより、8×8画素の単位ブロックのデータが、8×8のコサイン関数の成分の係数ブロックに変換される。一般に、テレビカメラで撮影された自然画の画像信号は、滑らかな信号になることが多く、この場合、画像信号に対してDCT処理を施すことにより、効率良くデータ量を削減することができる。
【0022】
すなわち、上述した自然画の画像信号のような滑らかな信号の場合、DCT処理を施すことで、特定の係数の近傍に大きな値が集中するようになる。この係数を量子化すると、8×8の係数ブロックはほとんどが0になり、大きな係数のみが残るようになる。
【0023】
そこで、この8×8の係数ブロックのデータを伝送する際に、ジグザグスキャンの順で、非零係数とその係数の前にどれだけ0が続いたかを示す0ランを一組としたハフマン符号で伝送することで、伝送量を削減することが可能となる。復号側では、逆の手順で画像を再構成する。
【0024】
ここで、上述した符号化方式が取り扱うデータの構造を図17に示す。この図17に示すデータ構造は、下から順に、ブロック層と、マクロブロック層と、スライス層と、ピクチャ層と、グループオブピクチャ(GOP:Group OfPicture)層と、ビデオシーケンス層とからなる。以下、この図17の下層から順に説明する。
【0025】
まず、ブロック層において、このブロック層の各単位ブロックは、輝度又は色差の隣合った8×8の画素(8ライン×8画素の画素)から構成される。上述したDCTは、この単位ブロック毎に施される。
【0026】
マクロブロック層において、各マクロブロックは、左右および上下に隣合った4つの輝度ブロック(輝度の単位ブロック)Y0,Y1,Y2,Y3と、画像上では輝度ブロックと同じ位置に相当する色差ブロック(色差の単位ブロック)Cr,Cbとの全部で6個のブロックで構成される。これらブロックの伝送の順は、Y0,Y1,Y2,Y3,Cr,Cbの順である。ここで、本符号化方式において、予測画(差分を取る基準の画像)に何を用いるか、あるいは差分を送らなくても良いか等は、このマクロブロック単位で判断される。
【0027】
スライス層は、画像の走査順に連なる1つ又は複数のマクロブロックで構成されている。このスライスのヘッダにおいては、画像内における動きベクトル及びDC(直流)成分の差分がリセットされ、また、最初のマクロブロックは、画像内での位置を示すデータを持っており、したがってエラーが生じた場合でも復帰できるようになっている。そのため、スライスの長さや開始位置は任意となっており、伝送路のエラー状態によって、変更可能となっている。
【0028】
ピクチャ層において、ピクチャすなわち1枚1枚の画像は、少なくとも1つ又は複数のスライスから構成される。そして、それぞれが符号化の方式に従って、上述したイントラ符号化画像(IピクチャあるいはIフレーム)、前方予測符号化画像(PピクチャあるいはBフレーム)、DCイントラ符号化画像(DC coded(D)picture)の4種類の画像に分類される。
【0029】
ここで、上述したイントラ符号化画像(Iピクチャ)においては、符号化される時に、その画像1枚の中だけで閉じた情報のみを使用する。したがって、換言すれば、復号化するときにIピクチャ自身の情報のみで画像が再構成できることになる。実際には、差分を取らずにそのままDCT処理して符号化を行う。この符号化方式は、一般的に効率が悪いが、このIピクチャを随所に挿入しておけば、ランダムアクセスや高速再生が可能となる。
【0030】
上記前方予測符号化画像(Pピクチャ)においては、予測画像(差分を取る基準となる画像)として、入力で時間的に前に位置し既に復号化されたIピクチャ又はPピクチャを使用する。実際には、動き補償された予測画像との差を符号化するのと、差を取らずにそのまま(イントラ)符号化するのと何れか効率の良い方を上記マクロブロック単位で選択する。
【0031】
上記両方向予測符号化画像(Bピクチャ)においては、予測画像として時間的に前に位置し、既に復号化されたIピクチャ又はPピクチャおよび、その両方から生成された補間画像の3種類を使用する。これにより、上記3種類の動き補償後の差分の符号化とイントラ符号化との中で一番効率の良いものをマクロブロック単位で選択できる。
【0032】
上記DCイントラ符号化画像は、DCTのDC係数のみで構成されるイントラ符号化画像であり、他の3種類の画像と同じシーケンスには存在できないものである。
【0033】
上記グループオブピクチャ(GOP)層は、1又は複数枚のIピクチャと、0又は複数枚の非Iピクチャとから構成されている。
【0034】
ここで、符号器への入力順を、例えば、
1I,2B,3B,4P*5B,6B,7I,8B,9B,10I,11B,12B,13P,14B,15B,16P*17B,18B,19I,20B,21B,22Pのようにした場合、この符号器の出力すなわち復号器の入力は、例えば、1I,4P,2B,3B*7I,5B,6B,10I,8B,9B,13P,11B,12B,16P,14B,15B*19I,17B,18B,22P,20B,21Bとなる。
【0035】
このように符号器の中で順序の入れ換えがなされるのは、例えば、上記Bピクチャを符号化または復号化する場合に、その予測画像となる時間的に後方のIピクチャ又はPピクチャが先に符号化されていなければならないからである。ここで、上記Iピクチャの間隔(例えば9)及び、Iピクチャ又はBピクチャの間隔(例えば3)は任意に設定できる。また、Iピクチャ又はPピクチャの間隔は、当該グループオブピクチャ層の内部で変更されて構わないものである。なお、グループオブピクチャ層の切れ目は、上記「*」で表しており、上記IはIピクチャ、PはPピクチャ、BはBピクチャを示している。
【0036】
図17で最も上に示すビデオシーケンス層は、画像サイズ、画像レート等が同じ1又は複数のグループオブピクチャ層から構成される。
【0037】
【非特許文献1】
テレビジョン学会編,「総合マルチメディア選書 MPEG」,第1版,オーム社,平成8年4月20日,p85〜109
【0038】
【発明が解決しようとする課題】
ところで、上述したMPEG1の方式で高能率符号化されたディジタル画像データを、先に述べたミニディスクに記録することを想定した場合、次のような問題が考えられる。
1.GOPの記録単位をクラスタと無関係な任意の大きさに設定した場合、1GOPの画像データが2つ以上のクラスタにわたって記録される可能性が生じる。この場合、GOPがクラスタの途中から始まったり、途中で終了することになり、そのGOPをカットの単位として、他のGOPと置き換える等の編集処理を行うことが困難となり、仮に、編集処理し得たとしても、平均転送レートが低下するという問題が生じる。
【0039】
2.GOPの先頭に、直前のGOPの最終フレームを予測画像(基準となる画像)とするPピクチャ又はBピクチャを配置した場合、そのGOPのPピクチャ又はBピクチャを復号するのに、直前のGOPをも復号しなければならず、早送りや逆送り再生等のシーク再生時に、迅速な画像再生が困難になるという問題が生じる。
【0040】
本発明の目的は、高能率符号化されたディジタル画像データを、ミニディスク等のディスク状記録媒体に記録するに際し、GOPを単位とする編集処理を簡単かつ迅速な処理によって可能にすると共に、GOPを単位とする高速早送りや逆送り再生等の特殊再生をも簡単かつ迅速な処理によって可能とすることにある。
【0041】
【課題を解決するための手段】
本発明による記録媒体は、所定のデータ量が記録可能なセクタを複数連結した再生の単位となるクラスタがディスクの記録データ領域内の外周側に再生専用に設けられ、動画像の連続する所定数のフレームから構成されるグループオブピクチャの各々のフレームが画像圧縮処理されてクラスタの所定数のセクタから成る第1のセクタ領域に記録され、クラスタの他のセクタから成る第2のセクタ領域に、隣接するグループオプピクチャのフレームの再生に必要なフレームの所定方式の圧縮データが記録されたことを特徴としている。
【0042】
また、隣接するグループオブピクチャのフレームの再生に必要なフレームの圧縮方式は、画像内符号化であることを特徴としている。
【0043】
また、本発明による再生装置は、所定のデータ量が記録可能なセクタを複数連結した再生の単位となるクラスタがディスクの記録データ領域内の外周側に再生専用に設けられ、動画像の連続する所定数のフレームから構成されるグループオブピクチャの各々のフレームが画像圧縮処理されてクラスタの所定数のセクタから成る第1のセクタ領域に記録され、クラスタの他のセクタから成る第2のセクタ領域に、隣接するグループオブピクチャのフレームの再生に必要なフレームの所定方式の圧縮データが記録された記録媒体を再生する再生装置において、記録媒体からクラスタ単位でデータを読出す再生手段と、再生手段にて読出されたデータを記憶する記憶手段と、再生手段にて再生された画像圧縮されたデータを復号する復号手段と、復号するグループオブピクチャが記録媒体から記憶手段へ読出されるように再生手段を制御し、さらに復号するグループオブピクチャに隣接するグループオブピクチャが記録されているクラスタの所定のセクタのデータが読出されるように再生手段を制御し、再生された隣接するグループオブピクチャの第2のセクタ領域に記録されているデータと復号する記録媒体から読出されたグループオブピクチャとに基づいて動画像が再生されるように復号手段を制御する制御手段とを備えることを特徴としている。
【0044】
上記構成の本発明による記録媒体および再生装置によれば、グループオブピクチャの各フレームが画像圧縮されてクラスタの第1のセクタ領域に記録されると共に、隣接するグループオブピクチャのフレームの再生に必要なフレームの画像データがこのクラスタの第2のセクタ領域に記録されており、復号するグループオブピクチャと隣接するグループオブピクチャの第2のセクタ領域に記録されているデータとに基づいて動画像を再生することができるので、GOPを単位とする編集処理や早送りや逆早送り再生等の特殊再生が可能となると共に、より高品質の画像を高速に再生することが可能となる。
【0045】
【発明の実施の形態】
まず、本発明の実施例の外観構成について、図1および図2を参照して説明する。
図1は、本発明によるディスク状記録媒体およびディスク記録再生装置の一実施例の外観構成を示す斜視図である。この図に示すカートリッジ1の内部には、光磁気ディスクもしくは光ディスクで構成されるミニディスク(通常は、カートリッジ1も含めてミニディスクと称される)が収納されており、光磁気ディスクの場合は、光磁気的にディジタル・データを記録し、再生することが可能となっている。ディスク記録再生装置2の手前側の面には、挿入孔3が形成されており、この挿入孔3に挿入されたミニディスク入りカートリッジ1をローディングまたはアンローディングするローディング機構がディスク記録再生装置2の内部に設けられている。ディスク記録再生装置2の正面右側には、種々の操作キー4が配置され、ディスク記録再生装置2に対して種々の指示を入力可能となっている。また、ディスク記録再生装置2の正面上方には、カラーLCD(液晶ディスプレイ)5が設けられており、このカラーLCD5に、ミニディスクから再生されて復号されたカラー動画像が表示されるようになっている。
【0046】
図2は、本発明によるディスク記録再生装置の他の実施例の外観構成を示す斜視図である。この実施例においては、図1の実施例におけるカラーLCD5が省略され、ディスク記録再生装置2から出力された映像信号がケーブル11を介してカラーCRTディスプレイ・モニタ12へ供給され、表示されるようになっている。すなわち、図1に示す実施例においては、携帯型のディスク記録再生装置であるのに対して、図2に示す実施例においては、据置型のディスク記録再生装置となっている。
【0047】
次に図3は、ディスク記録再生装置2の内部の電気的構成を示している。MD(ミニディスク)ドライブ装置20は、カートリッジ1に収納されているミニディスク1aに対してディジタル・データを記録再生するものである。
【0048】
このMDドライブ装置20は、本来、携帯用、据置用、もしくは車載用のパーソナル・オーディオ機器の用途で開発されたミニディスク・システムを基に設計されている。このミニディスク・システムは、ミニディスクと呼ばれる小型で薄型の記録メディアが使用される。ミニディスクは、直径64mmの読出専用光ディスク、書換可能なMO(光磁気)ディスク、又は書換領域と読出専用領域が混在して設けられたハイブリッドディスク(パーシャルROMディスクとも呼ばれる)の何れかを、カートリッジ(W×L×H=72mm×68mm×5mm)内に収納したものである。そして、読出専用光ディスクが収納されたミニディスクからは、CD(Compact Disc)と同様の原理によって、データが読み出されるようになっている。一方、MOディスクやハイブリッドディスクが収納されたミニディスクに対しては、磁界変調ダイレクトオーバーライト方式によってデータが記録される。磁界変調ダイレクトオーバーライト方式とは、回転しているディスクに下方から高出力のレーザー光を照射し、記録すべき部分の光磁気膜を磁性体の保磁力がなくなるキュリー温度まで上昇させ、その部分に、ディスクの上方から磁気ヘッドでデータの書き込みを行う方式である。
【0049】
このようなミニディスク・システムは、パーソナルオーディオ機器としての開発過程により、各回路素子の集積化や各機構部品の最適化が図られ、装置全体の小型・軽量化が達成されていると共に、低消費電力化によりバッテリー・オペレーションが可能となっている。さらに、既存の3.5インチMOディスクとほぼ同じ記憶容量(140Mbytes)を有し、記録メディアの交換が可能であるという特徴に加え、量産効果により、他のMOディスクと比較して、記録メディアの製造コストが抑えられていることは勿論の事、ドライブ装置本体の製造コストも抑えられている。また、パーソナルオーディオ機器としての使用実績からして、信頼性も充分に実証されている。
【0050】
なお、MDドライブ装置20の詳細な構成については、図8を参照して後述する。このMDドライブ装置20は、図3に示すように、I/Oインタフェース回路21を介してバスラインに接続されている。
【0051】
図3において、MPU(マイクロプロセッサユニット)22は、バスラインを介して各部に必要なアドレスやデータを供給し、各部を制御するようになっている。メインメモリ23は、MPU22で実行されるプログラムが予め格納されたROMと、ワークエリアとして各種データが一時的に格納されるRAMとから構成されており、MPU22などからバスラインを介してアドレスされ、これに伴って各種データが書き込まれると共に読み出されるようになっている。
【0052】
DMAC(ダイレクトメモリアクセスコントローラ)24は、メインメモリ23に対するデータの入出力を、MPU22を介さずに、直接制御してDMA転送するものである。
【0053】
オーディオAD/DA(アナログディジタル/ディジタルアナログ)変換回路25は、アナログ・オーディオ入力端子Ainに入力されたアナログ・オーディオ信号をA/D変換し、オーディオ・エンコーダ/デコーダ26へ供給する一方、オーディオ・エンコーダ/デコーダ26から供給されたディジタル・オーディオ・データをD/A変換して、アナログ・オーディオ出力端子Aoutへ出力するものである。オーディオ・エンコーダ/デコーダ26は、オーディオAD/DA変換回路25から供給されたディジタル・オーディオ・データを、MPEGオーディオ規格で規定される所定の方式でエンコードして圧縮し、エンコードされた符号化オーディオ・データは、DMAC24の制御の下に、メインメモリ23に一旦記憶される。また、メインメモリ23から読み出された符号化オーディオ・データをデコードして元のディジタル・オーディオ・データを復元し、オーディオAD/DA変換回路25に供給するようになっている。このメインメモリ23とオーディオ・エンコーダ/デコーダ26との間の符号化オーディオ・データの授受は、DMAC24によって制御される。
【0054】
ビデオ・エンコード部27は、アナログ・ビデオ入力端子Vinに入力されたアナログ・ビデオ信号をA/D変換するAD変換器27aと、このAD変換器27aで変換されたディジタル・ビデオ・データを、MPEG1規格に基づいてエンコードして圧縮するMPEGビデオ・エンコーダ27bとから構成されている。このMPEGビデオ・エンコーダ27bでエンコードされた符号化ビデオ・データは、DMAC24の制御の下に、メインメモリ23に一旦記憶される。
【0055】
また、AD変換器27aで変換されたディジタル・ビデオ・データは、LCDコントローラ28にも供給され、このLCDコントローラ28の制御の下にLCD5によって表示されるようになっている。なお、LCD5を有しない構成では、図2に示すように、外部のケーブル11を介してCRTディスプレイ・モニタ12へ供給され、表示されるようになっている。
【0056】
ビデオ・デコード部29は、メインメモリ23から読み出された符号化ビデオ・データをデコードして元のディジタル・ビデオ・データに復元するMPEGビデオ・デコーダ29bと、このMPEGビデオ・デコーダ29bでデコードされたディジタル・ビデオ・データをD/A変換して、アナログ・ビデオ出力端子Voutへ出力するDA変換器29aとから構成されている。
【0057】
また、MPEGビデオ・デコーダ29bでデコードされたディジタル・ビデオ・データは、LCDコントローラ28にも供給され、このLCDコントローラ28の制御の下にLCD5によって表示されるようになっている。
【0058】
これらMPEGビデオ・エンコーダ27bおよびMPEGビデオ・デコーダ29bとメインメモリ23との間の符号化ビデオ・データの授受に関しても、DMAC24によって制御される。
【0059】
さらに、メインメモリ23とMDドライブ装置20との間における、I/Oインタフェース21を介した各種データの授受に関しても、DMAC24によって制御されるようになっている。
【0060】
操作パネルコントローラ30は、操作キー4によって入力された各種指示データをバスラインを介してMPU22に供給するものである。
【0061】
ここで、上記MPEGビデオ・エンコーダ27bの具体的構成例を図4を参照して説明する。入力端子61よりのブロック化ディジタルビデオ信号が減算器62及び動きベクトル検出回路72に供給される。このブロック化ディジタルビデオ信号は、離散的な画素データ列からなるディジタルビデオ信号が、画面毎に、画面の水平方向及び垂直方向に、例えば、8×8個ずつのマトリクス状に配された画素データからなる複数の単位ブロック信号に細分化される如く時系列変換された信号である。
【0062】
減算器62では、このブロック化ディジタルビデオ信号の単位ブロック信号と、この単位ブロック信号に類似した画素データ構成の単位ブロック信号、即ち、予測単位ブロック信号であって、動き補償回路71から得られたものとの減算が行われる。
【0063】
減算器62の減算出力である差分単位ブロック信号(尚、時には差分単位ブロック信号ではなく、単位ブロック信号の場合もある)が、直交変換回路の一種である2次元離散コサイン変換回路(2次元DCT回路)63に供給されてコサイン変換される。2次元DCT回路63より得られた変換係数が量子化回路(再量子化回路)64に供給されて量子化される。
【0064】
この量子化された変換係数は、可変長符号化回路65に供給されて符号化された後、出力端子66に可変長符号化され、量子化された変換係数(符号化データ)として出力される。
【0065】
そして、フレームメモリ70に記憶されているフレーム信号を構成する単位ブロック信号が動き補償回路71に供給され、その動き補償回路71が動きベクトル検出回路72よりの検出出力によって制御されて、フレームメモリ70内の各単位ブロック信号の相関性が判別され最も相関性の高い単位ブロック信号が予測単位ブロック信号として動き補償回路71から出力されて、減算器62及び加算器69にそれぞれ供給される。
【0066】
次に、上記MPEGビデオ・デコーダ29bの具体的構成例を図5を参照して説明する。図4の出力端子66の出力信号に対応する可変長符号化され、量子化された変換係数(符号化データ)が入力端子81から可変長復号化回路82に供給されて復号化される。可変長復号化回路82よりの量子化された変換係数が逆量子化回路83に供給されて逆量子化される。その得られた変換係量子化回路64よりの量子化された変換係数は逆量子化回路67に供給されて逆量子化されて変換係数が出力される。その変換係数は2次元離散コサイン逆変換回路(2次元離散IDCT回路)68に供給されて、元の差分単位ブロック信号が得られる。
【0067】
この差分単位ブロック信号は加算器69で、動き補償回路71よりの予測単位ブロック信号に加算される。加算器69よりの単位ブロック信号がフレームメモリ70に供給されて、その単位ブロック信号の属するフレーム信号を構成する全単位ブロック信号が記憶される。
【0068】
動きベクトル検出回路72では、入力端子61よりのブロック化ディジタルビデオ信号の各単位ブロック信号に対する、フレームメモリ70内の入力端子61よりのブロック化ディジタルビデオ信号の各単位ブロック信号に対応する単位ブロック信号の近辺で、最も相関性の高い単位ブロック信号が検出される。
【0069】
そして、フレームメモリ70に記憶されているフレーム信号を構成するブロック信号が動き補償回路71に供給され、その動き補償回路71が動きベクトル検出回路72より検出出力によって制御されて、フレームメモリ70内の各ブロック信号の相関性が判別され最も相関性の高いブロック信号が予測ブロック信号として動き補償回路71から出力されて、減算器62及び加算器69にそれぞれ供給される。
【0070】
次に、上記MPEGビデオ・デコーダ29bの具体的構成例を図5を参照して説明する。図4の出力端子66の出力信号に対応する可変長符号化され、量子化された変換係数(符号化データ)が入力端子81から可変長復号化回路82に供給されて可変長復号化される。可変長復号化回路82よりの量子化された変換係数が逆量子化回路83に供給されて逆量子化される。その得られた変換係数が2次元離散逆コサイン変換回路(2次元IDCT回路)84に供給されて逆変換されて、差分単位ブロック信号(時には差分単位ブロック信号ではなく、単位ブロック信号の場合もある)が得られる。
【0071】
この2次元IDCT回路84から差分単位ブロック信号ではなく、単位ブロック信号(Iピクチャの単位ブロック信号)が出力されるときは、切換えスイッチ85の可動接点mが固定接点a側に切換えられ、その単位ブロック信号が切換えスイッチ85を通じて出力端子86に出力される。
【0072】
2次元IDCT回路84から差分単位ブロック信号が出力されるときは、切換えスイッチ85の可動接点mが固定接点b側に切換えられる。この場合には、2次元IDCT回路84よりの差分単位ブロック信号が加算器93に供給されて、切換えスイッチ92よりの予測単位ブロック信号と加算され、加算器93よりの単位ブロック信号が、切換えスイッチ85を通じて、出力端子86に出力される。
【0073】
加算器93よりの予測単位ブロック信号は切換えスイッチ85の固定接点b及び可動接点mを通じてフレームメモリ87に供給される。フレームメモリ87では、加算器93よりの予測単位ブロック信号の属するフレーム信号を構成する全単位ブロック信号がフレームメモリ87に記憶される。
【0074】
フレームメモリ87より読み出されたフレーム信号は、他のフレームメモリ90に供給されて記憶される。フレームメモリ87及び90よりの所定フレーム前及び後のフレーム信号が、それぞれ各別に動き補償前向き予測回路88、動き補償後ろ向き予測回路91に供給されると共に、その所定フレーム前及び後のフレーム信号の平均の信号が動き補償前向き後ろ向き予測回路89に供給される。
【0075】
予測回路88,91,89では、あるフレームの単位ブロック信号に対し、あるフレームの単位ブロック信号の近辺の単位ブロック信号であって、所定フレーム前及び後のフレームの単位ブロック信号及びその平均の単位ブロック信号それぞれのうちで最も相関性の高い予測単位ブロック信号が選択され、前向き予測単位ブロック信号(Pピクチャの予測単位ブロック信号)を得るときは、切換えスイッチ92の可動接点mが固定接点c側に切換えられて、その最も相関性の高い単位ブロック信号が加算器93に供給されて、2次元IDCT回路84からの差分単位ブロック信号に加算される。
【0076】
また、両側予測ブロック信号(Bピクチャの予測単位ブロック信号)を得るときは、3つの相関性の最も高い予測単位ブロック信号のうち、更にその中で最も相関性の高い予測単位ブロック信号が、切換えスイッチ92の可動接点mの固定接点c、d、eに対する切換えによって選択されて、加算器93に供給されて、2次元IDCT回路84からの差分単位ブロック信号に加算される。
【0077】
因みに、図4及び図5で説明したMPEGビデオ・エンコーダ及びデコーダの具体回路は、特開平05−95545号公報等に詳述されている。
【0078】
次に、上述した構成のディスク記録再生装置の動作について説明する。
キー4の内、所定のものを操作して、入力されるオーディオ信号とビデオ信号の記録を指示すると、この指令が操作パネルコントローラ30によりバスラインを介してMPU22に供給される。MPU22は、この指令に応じ、以下に説明する手順で各部を制御し、MPEG1規格に基づいてエンコードした符号化オーディオ・データと符号化ビデオ・データをミニディスク1aに記録させる。
【0079】
ここで、アナログ・オーディオ入力端子Ainに入力されたオーディオ信号は、オーディオAD/DA変換回路25によりA/D変換され、オーディオ・エンコーダ/デコーダ26に供給される。オーディオ・エンコーダ/デコーダ26は、エンコードした符号化オーディオ・データを、前述した1クラスタ分(32セクタ分)内蔵しているRAMに一旦記憶する。
【0080】
そして、オーディオ・エンコーダ/デコーダ26によって、1クラスタ分の符号化オーディオ・データ(約64KBytes)が生成された時点で、そのデータがDMAC24の制御の下にメインメモリ23にDMA転送されて記憶される。メインメモリ23に記憶された1クラスタ分のデータは。DMAC24により所定のタイミングで読み出され、I/Oインターフェイス回路21を介してMDドライブ装置20にDMA転送され、ミニディスク1aに記録される。
【0081】
ここで、MDドライブ装置20において、1クラスタ分のデータは、クラスタを単位としてインターリーブ処理されて、ミニディスク1aに記録される。すなわち、記録再生可能な光磁気ディスク型のミニディスクでは、図6に示すように、1クラスタの内、3セクタをリンク・セクタとし、さらに次の1セクタをサブデータ用に確保しておく。データは、残りの32セクタに記録される。データを記録するときには、前のクラスタの第2番目のリンク・セクタの途中から書き始める。36セクタ目を書き終わるときは、先頭のリンク・セクタと第2番目のリンク・セクタの途中まで誤り訂正用のデータが書き込まれる。
【0082】
本実施例においては、1クラスタが図6に示すように、36セクタによって構成され、その内の最初の32セクタに実質的なデータが記録され、最後の4セクタには、実質的なデータが記録されないようになっている。この最後の4セクタの内の最初の3セクタ分のリンク・セクタには、隣接するクラスタに記録されたデータの誤り訂正用のデータが記録される。最後の1セクタはサブデータセクタとされ、最初の32セクタに記録されるデータに対応する予備のグラフィック・データ等が記録できるようになっているが、本実施例においては、予備的なグラフィック・データは記録されない。各セクタには、アドレス情報とデータが記録される。
【0083】
同様にして、アナログ・ビデオ入力端子Vinに入力されたビデオ信号は、A/D変換回路27aによりA/D変換され、MPEGビデオ・エンコーダ27bに供給され、エンコードされる。この符号化ビデオ・データも、前述した符号化オーディオ・データと同様に、1クラスタ分(32セクタ分)が内蔵しているRAMに一旦記憶される。そして、MPEGビデオ・エンコーダ27bによって、1クラスタ分の符号化ビデオ・データが生成された時点で、そのデータがDMAC24の制御の下にメインメモリ23にDMA転送されて記憶される。メインメモリ23に記憶された1クラスタ分のデータは、DMAC24により所定のタイミングで読み出され、I/Oインターフェイス回路21を介してMDドライブ装置20にDMA転送され、クラスタを単位としてインターリーブ処理された後、ミニディスク1aに記録される。
【0084】
本実施例において、符号化ビデオ・データと符号化オーディオ・データとは、図7に示すように、クラスタ・インターリーブされてミニディスク1aに記録される。すなわち、図中に符号Vで示す符号化ビデオ・データと、Aで示す符号化オーディオ・データとは、それぞれ異なるクラスタに交互に配置されるように、MPU22によって制御される。そして、必要に応じて符号化ビデオ・データVや符号化オーディオ・データA以外の、プログラムや文字データ等の所定のデータDが、符号化ビデオ・データVあるいは符号化オーディオ・データAが記録されるクラスタとは異なるクラスタに記録される。このように、同一のクラスタに、相関関係の強い関連データのみを記録することにより、すなわち、符号化ビデオ・データV、符号化オーディオ・データA、およびその他のデータDをそれぞれ異なるクラスタに記録することにより、記録再生時の処理速度の向上が可能となる。
【0085】
但し、シーク動作時における高速再生を可能にするため、符号化ビデオ・データV、符号化オーディオ・データA、及びその他のデータDは、それぞれ対応するものを比較的近傍のクラスタに配置される。何故ならば、これら関連するデータは、略同一時刻に再生する必要があるからである。
【0086】
なお、上述した記録動作の過程で、A/D変換器27aで変換されたディジタル・ビデオ・データは、LCDコントローラ28に供給され、このLCDコントローラ28の制御の下にLCD5によって表示される。あるいは、LCD5を有しない構成では、図2に示すように、外部のケーブル11を介してCRTディスプレイ・モニタ12へ供給され、表示される。これにより、使用者は記録中の画像をモニタすることができる。
【0087】
次に、再生時の動作について説明する。キー4を操作して再生を指示すると、この指令が操作パネルコントローラ30を介してMPU22へ供給される。このとき、MPU22は、MDドライブ装置20を制御し、ミニディスク1aに記録されているデータを再生させる。この再生データは、I/Oインターフェイス回路21を介してメインメモリ23にDMA転送される。メインメモリ23に記憶されたデータの内、符号化オーディオ・データはオーディオ・エンコーダ/デコーダ26に、また、符号化ビデオ・データはビデオデコード部29に、それぞれDMA転送される。
【0088】
オーディオ・エンコーダ/デコーダ26に供給された1クラスタ分の符号化オーディオ・データは、デコードされた後、オーディオAD/DA変換回路25においてD/A変換された後、アナログ・オーディオ出力端子Aoutから出力される。
【0089】
一方、ビデオデコード部29に供給された1クラスタ分の符号化ビデオ・データも、デコードされた後、LCDコントローラ28に供給され、このLCDコントローラ28の制御の下にLCD5によって表示される。あるいは、LCD5を有しない構成では、DA変換器29aにおいてD/A変換された後、アナログ・ビデオ出力端子Voutから、図2に示す外部のケーブル11を介してCRTディスプレイ・モニタ12へ供給され、表示される。
【0090】
次に、図8を参照してMDドライブ装置20の構成について説明する。
同図に示すスピンドルモータ46により回転駆動されるミニディスク1aに対し、光学ピックアップ44によりレーザ光を照射した状態で、記録データに応じた変調磁界を磁気ヘッド41により印加することにより、ミニディスク1a上の記録トラックに沿って磁界変調オーバーライト記録を行い、ミニディスク1a上の目的トラックを光学ピックアップ44によりレーザ光でトレースすることによって、光学的にデータの再生を行う。
【0091】
光学ピックアップ44は、例えば、レーザダイオード等のレーザ光源、コリメータレンズ、対物レンズ、偏光ビームスプリッタ、シリンドリカルレンズ等の光学部品、ならびに所定の配置に分割されたフォトディテクタ等から構成されており、ミニディスク1aを挟んで磁気ヘッド41と対向する位置に、送りモータ45によって位置づけられる。
【0092】
光学ピックアップ44は、ミニディスク1aにデータを記録するときに、磁気ヘッド駆動回路43により磁気ヘッド41が駆動され、記録データに応じた変調磁界が印加されるミニディスク1aの目的トラックにレーザ光を照射することによって、熱磁気記録によりデータ記録を行う。
【0093】
また、光学ピックアップ44は、目的トラックに照射したレーザ光を検出することによって、例えば非点収差法によりフォーカスエラーを検出し、また、例えばプッシュプル法によりトラッキングエラーを検出するとともに、読み出し専用型のミニディスク1aの目的トラックのピット列における光の回折現象を利用することにより再生信号を検出し、書き込み可能型のミニディスク1aからデータを再生する場合は、目的トラックからの反射光の偏光角(カー回転角)の違いを検出して再生信号を生成する。
【0094】
光学ピックアップ44の出力は、RFアンプ47に供給される。RFアンプ47は、光学ピックアップ44の出力から、フォーカスエラー信号やトラッキングエラー信号を抽出して、サーボ制御回路48に供給するとともに、再生信号を2値化して、アドレスデコーダ49に供給する。アドレスデコーダ49は、供給された2値化再生信号からアドレスをデコードして、EFM/CIRCエンコーダ/デコーダ51に供給する。
【0095】
サーボ制御回路48は、例えばフォーカスサーボ制御回路、トラッキングサーボ制御回路、スピンドルモータサーボ回路及びスレッドサーボ回路等から構成されている。
【0096】
フォーカスサーボ制御回路は、フォーカスエラー信号が零になるように、光学ピックアップ44の光学系のフォーカス制御を行う。トラッキングサーボ制御回路は、トラッキングエラー信号が零になるように、光学ピックアップ44の送りモータ45の制御を行う。
【0097】
さらに、スピンドルモータサーボ制御回路は、ミニディスク1aを所定の回転速度(例えば、一定線速度)で回転駆動するようにスピンドルモータ46を制御する。またスレッドサーボ制御回路は、システムコントローラ50により指定されるミニディスク1aの目的トラック位置に磁気ヘッド41及び光学ピックアップ44を送りモータ45により移動させる。
【0098】
EFM/CIRCエンコーダ/デコーダ51は、I/Oインターフェイス21を介して供給されたデータに対して、エラー訂正用の符号化処理すなわちCIRC(Cross Interleave Reed−Solomon Code)の符号化処理を行うと共に、記録に適した変調処理すなわちEFM(Eight to Fourteen Modulation)符号化処理を行う。
【0099】
EFM/CIRCエンコーダ/デコーダ51から出力される符号化データは、磁気ヘッド駆動回路43に記録データとして供給される。磁気ヘッド駆動回路43は、記録データに応じた変調磁界をミニディスク1aに印加するように磁気ヘッド41を駆動する。
【0100】
システムコントローラ50は、I/Oインターフェイス21を介してMPU22から書き込み命令を受けているときには、記録データがミニディスク1aの所定の記録トラックに記録されるように、ミニディスク1a上の記録位置の制御を行う。この記録位置の制御は、EFM/CIRCエンコーダ/デコーダ51から出力される符号化データから得られるミニディスク1a上の記録位置情報をシステムコントローラ50により管理して、システムコントローラ50からミニディスク1aの記録トラックの記録位置を指定する制御信号をサーボ制御回路48に供給することによって行われる。これにより、いわゆる磁界変調光磁気記録方式により、ミニディスク1a上に、符号化オーディオ・データ、符号化ビデオ・データ及び必要に応じて付加されるその他のディジタルデータが、上述したように、クラスタ単位で記録される。
【0101】
再生時においては、EFM/CIRCエンコーダ/デコーダ51は、入力された2値化再生データに対し、EFM復調処理を行うと共にエラー訂正のためのCIRC複号化処理を行って、I/Oインターフェイス21に出力する。
【0102】
また、システムコントローラ50は、I/Oインターフェイス21を介してMPU22から読み出し命令を受けているときには、再生データが連続的に得られるようにミニディスク1aの記録トラックに対する再生位置の制御を行う。この再生位置の制御は、再生データから得られるミニディスク1a上の記録位置情報をシステムコントローラ50により管理して、システムコントローラ50からミニディスク1aの記録トラックの再生位置を指定する制御信号をサーボ制御回路48に供給することによって行われる。
【0103】
次に、図9と図10を参照して、本発明の一実施例におけるGOPとクラスタの関係について説明する。この実施例においては、図9に示すように、例えば、7フレーム(フィールドでもよい)の画像によりGOPが構成されている場合、最初のフレームの画像をIピクチャI0とし、第4番目のフレームの画像を、第1番目のフレームの画像I0からの前方予測画像であるPピクチャP1とする。さらに、最終の第7番目のフレームの画像を、第4番目のフレームのPピクチャP1からの前方予測画像であるPピクチャP4とする。そして、第2番目と第3番目のフレームの画像は、それぞれ先行するIピクチャI0と、後方のPピクチャP1からの両方向予測画像であるBピクチャB2またはB3とする。同様にして、第5番目と第6番目のフレームの画像は、第4番目のフレームのPピクチャP1と、第7番目のフレームのPピクチャP4からの両方向予測画像であるBピクチャB5またはB6とする。
【0104】
そして、本実施例においては、図10に示すように、1GOPの符号化ビデオ・データが1クラスタの32セクタに納まるようにエンコードされて、ミニディスク1aに記録される。この場合、再生専用のROM型のミニディスク1aにおいては、予め、MPEG規格に基づく符号化ビデオ・データを生成するに際し、1GOPを単位として、各クラスタに各々記録されるようにエンコードが施され、これにより生成された符号化ビデオ・データに基づいて、CDと同様の製造工程を経て、スタンピング等が行われ、同一の符号化ビデオ・データが記録されたミニディスク1aが大量に生産される。
【0105】
また、書き込み可能なRAM型または書き込み可能領域と読み出し専用領域が混在したハイブリッド型(パーシャルROM型)のミニディスク1aにおいては、ビデオ・エンコード部27のMPEGビデオ・エンコーダ27bによって、1GOPを単位として、各1クラスタに各々記録されるようにエンコードが施され、これにより生成された符号化ビデオ・データが、MDドライブ装置20にDMA転送されて、ミニディスク1aに記録される。
【0106】
ここで、エンコードの順番は、図9において数字で示されている。すなわち、I0,B2,B3,P1,B5,B6,P4の順に順次入力される各フレームの画像が、I0,P1,B2,B3,P4,B5,B6の順に順次エンコードされる。そして、このようにエンコードされた順番で、符号化ビデオ・データが1クラスタ内の各セクタに配置される。
【0107】
但し、例外的に、1GOPの符号化ビデオ・データが1クラスタ内の32セクタ内に配置することができない場合においては、連続する複数のクラスタ内に、そのGOPの符号化ビデオ・データが記録される。GOPの最終フレームに相当する符号化ビデオ・データの記録位置が、クラスタの最後のセクタに対応しない場合は、同クラスタの残りのセクタには,例えば、“0”等の実質的に無効なダミーデータが付加的に記録される。
【0108】
このようにして、本実施例においては、1GOPの先頭のフレームがIピクチャとして、また、一番最後のフレームがPピクチャとして、それぞれエンコードされる。そして、先頭のIピクチャは、必ずクラスタの先頭に配置されている。このようにすることで、例えば、ミニディスク1aをシークし、所定のクラスタの画像を間欠的に抽出し、再生するような場合においても、各クラスタの先頭に必ずIピクチャが配置されているため、その抽出したクラスタの少なくとも1フレーム分を完全に復号することが可能になる。また、同一のクラスタ内に、異なるGOPの符号化ビデオ・データが配置されていないため、符号化ビデオ・データを1GOP単位で他の符号化ビデオ・データに置換するなどのカット単位での編集を容易に行うことが可能となる。
【0109】
図11と図12は、本発明のその他の実施例におけるGOPとクラスタの関係を示している。この実施例においては、例えば図11に示すように、15フレームにより1GOPが構成され、順次入力される各フレームの内、第3番目のフレームの画像がIピクチャI0とされ、第6番目のフレームの画像が、第3番目のフレームの画像I0からの前方予測画像であるPピクチャP3、第9番目のフレームの画像が、第6番目のフレームの画像P3からの前方予測画像であるPピクチャP6とされる。また、第12番目のフレームの画像は、第9番目のフレームの画像P6からの前方予測画像であるPピクチャP9とされる。そして、最後の第15番目のフレームの画像は、第12番目のフレームのPピクチャP9からの前方予測画像であるPピクチャP12とされる。
【0110】
そして、IピクチャとPピクチャの間に位置する各フレームの画像は、Bピクチャとされ、そのフレームを挟むように前後に位置するIピクチャまたはBピクチャから予測される。すなわち、第4番目と第5番目のフレームの画像は、第3番目のフレームのIピクチャI0と、第6番目のフレームのPピクチャP3からの両方向予測画像であるBピクチャB4,B5とされる。また、第7番目と第8番目のフレームの画像は、第6番目と第9番目のフレームのPピクチャP3とP6からのBピクチャB7,B8とされ、第10番目と第11番目のフレームの画像は、第9番目と第12番目のフレームのPピクチャP6とP9からのBピクチャB10,B11とされる。さらに、第13番目と第14番目のフレームの画像は、第12番目と第15番目のフレームのPピクチャP9とP12からのBピクチャB13,B14とされる。
【0111】
そして、GOPの先頭の2フレームの画像は、直前のGOPの最後のPピクチャP12と、対応するGOPのIピクチャI0からのBピクチャB1,B2とされる。
【0112】
但し、このようにGOPを構成すると、同一GOPに対応するクラスタのみを再生した場合、最初の2フレームのBピクチャB1,B2を復号することができない。なぜならば、このBピクチャB1,B2を予測するための基準となる一方の画像であるPピクチャP12が、直前のGOPに属しており、直前のクラスタに記録されているからである。
【0113】
そこで、本実施例においては、図12に示すように、1クラスタを構成する36セクタの内の最初の32セクタに、上述したGOPを構成する15フレーム分の符号化ビデオ・データがエンコードされた順番に順次配置されると共に、最後の4セクタに、直後のGOPの先頭2フレームのBピクチャB1,B2を予測するための画像であるPピクチャP12に対応する符号化ビデオ・データを、予測を用いないで自身のデータのみで画像を再構成できる画像内符号化によりエンコードしたIピクチャIsとして記録する。このIピクチャIsは、当然のことながら、同一クラスタ内のPピクチャP12と重複している冗長なデータとなる。
【0114】
しかしながら、このように、冗長なIピクチャIsを記録しておくことで、GOPの最後の4セクタ分の符号化ビデオ・データのみから、元の画像をデコードすることが可能になる。すなわち、直前のクラスタ内のGOPを全て最初からデコードする必要がなくなる。そこで、再生対象となるGOPの直前のGOPの最後の4セクタ分のIピクチャIsと、再生対象となるGOPの第3番目のIピクチャI0とから、その間に挟まれているBピクチャB1,B2をデコードすることが可能になる。
【0115】
但し、上述したように、書き込み可能なミニディスク1a(以下、パーシャルROMディスクの書き込み可能領域も含めてMOクラスタと称す)の場合、各クラスタの最後の4セクタの内の3セクタはリンクセクタとして確保するよう規格上定められている。しかしながら、再生専用のミニディスク1a(以下、パーシャルROMディスクの再生専用領域も含めてROMクラスタと称す)においては、これら4セクタは、全てサブデータセクタとして自由に利用することができる。そこで、再生専用のミニディスク1aの場合においては、各クラスタの最後の4セクタのサブデータセクタ(但し、本明細書において、このサブデータセクタとリンクセクタ双方を含めてリンクセクタと総称することとする)に、直後のGOPの先頭の2フレームのBピクチャB1,B2の予測画像をIピクチャIsとして記録する。
【0116】
図13は、本発明の一実施例における再生専用型のミニディスク1a(ROMクラスタ)に対する1グループオブピクチャ分のデータの作成処理手順を示すフローチャートである。
【0117】
この図において、この場合、ROMクラスタは、ディスク全体がROM領域とされている場合はもとより、例えば、1枚のディスクの内、内周の所定の領域がROMクラスタとされ、その外周が記録可能なMOクラスタとされたパーシャルROMも含む。
【0118】
まず、図13におけるステップS1において、記録対象とされているクラスタが、ROMクラスタであることを想定して、GOPの先頭のフレームのピクチャ形式を決定する。ここで、記録すべきGOPが、例えば図10に示すように、その先頭のフレームがIピクチャとされた場合は、次のステップS2からステップS3へ進み、最後の4セクタには何も記録しないで(但し、実際には、インターリーブを完結させるためのデータは記録される)、処理を終える。
【0119】
一方、ステップS1において、例えば図11に示すように、その先頭のフレームがIピクチャ以外のBピクチャまたはPピクチャにより構成した場合、次のステップS2からステップS4へ進み、クラスタの最後の4セクタに、PピクチャP12に対応したIピクチャIS(直後のGOPの最初の2フレームの予測画像)を記録可能な容量であるか否かが判定される。
【0120】
記録可能な容量であると判定された場合においては、ステップS5に進み、このIピクチャISが記録される。これに対して、IピクチャISのデータ量が多過ぎて、4セクタ内にIピクチャISのデータを記録することができないと判定された場合は、ステップS3へ進み、IピクチャISを記録しない。
【0121】
このように、クラスタの最後の4セクタと、IピクチャISのデータ量とを勘案して、可能な限り、直前のGOPを利用するアルゴリズムを用い、より高画質の画像を得るように、エンコードと記録が行われる。
【0122】
図14は、本発明の一実施例における書き込み可能型のミニディスク1aに対する1グループオブピクチャ分の記録処理手順を示すフローチャートである。この図におけるステップS11において、記録対象とされるクラスタがMOクラスタであると判定された場合においては、各クラスタの最後の4セクタには、3セクタ分のリンクセクタを確保することが規格上定められている{特願平2−222821号(特開平4−105271号公報)及びこれに対応する米国特許第5,243,588号明細書参照}。したがって、この場合においては、ステップS13へ進み、直前のGOPからの予測処理は不可能であるとの前提の下に、GOPの先頭のフレームはIピクチャとされ、一番最後のフレームはPピクチャとして処理される。そして次にステップS14へ進み、クラスタの最後の4セクタには特にデータは記録しない。これにより、図9および図10に示した実施例のフォーマットにより符号化ビデオ・データが記録されることになる。
【0123】
図15は、本発明の一実施例におけるミニディスク1aに対する1グループオブピクチャ分の再生処理手順を示すフローチャートである。
【0124】
最初にステップS21において、再生対象とされているクラスタがROMクラスタであるか否かが判定される。ROMクラスタであると判定された場合においては、ステップS22に進み、直前のクラスタの最後の4セクタにIピクチャIsが記録されているか否かが判定される。IピクチャIsが記録されている場合においては、ステップS23に進み、このIピクチャIsを利用して、次のGOPの先頭の2フレームのBピクチャB1,B2が復号される。
【0125】
ステップS22において、クラスタの最後の4セクタにIピクチャIsが記録されていないと判定された場合においては、ステップS24に進み、直前のGOPのピクチャP12を復号して得られたデータ(Iピクチャのデータとなっている)が存在するか否かが判定される。例えば、サーチ動作が行われているような場合、直前のGOPは、必ずしもそのクラスタを最初のセクタから全て復号しているとは限らない。このような場合、PピクチャP12は、復号されていないことが多い。従って、この場合においては、ステップS26に進み、GOPの先頭の2フレームのBピクチャB1,B2を実質的に復号しないようにする(復号したとしても、表示しないようにする)。これにより、乱れた画像が表示されることが防止される。
【0126】
これに対して、サーチ動作ではなく、通常の再生を行っているような場合においては、各クラスタが順次再生されるため、ステップS24においては、直前のGOPのPピクチャP12が復号されていると判定される。この場合においては、ステップS24からステップS25に進み、その復号されたPピクチャP12を利用して、次のGOPの最初のフレームのBピクチャB1,B2が復号される。
【0127】
一方、ステップS21において、再生対象とされているクラスタがROMのクラスタでないと判定された場合(MOクラスタであると判定された場合)、ステップS21からステップS27に進み、再生対象とされているクラスタ内のデータのみで復号が行われている。即ち、この場合においては、図13のステップS2において説明したように、クラスタの先頭にIピクチャが配置され、クラスタの最後にPピクチャが配置されている。その結果、そのクラスタ内のデータのみで復号が可能となる。
【0128】
以上においては、MPEGのデジタル圧縮ビデオデータをミニディスクに記録する場合を例として説明したが、本発明はその他の圧縮方式で処理されたデジタルビデオデータをその他のディスクに記録する場合にも応用することが可能である。
【0129】
【発明の効果】
以上説明した通り、本発明による記録媒体および再生装置によれば、グループオブピクチャの各フレームが画像圧縮されてクラスタの第1のセクタ領域に記録されると共に、隣接するグループオブピクチャのフレームの再生に必要なフレームの画像データがこのクラスタの第2のセクタ領域に記録されており、復号するグループオブピクチャと隣接するグループオブピクチャの第2のセクタ領域に記録されているデータとに基づいて動画像を再生することができるので、GOPを単位とする編集処理や早送りや逆早送り再生等の特殊再生が可能となり、特殊再生時に画像が途切れるような事態が防止されると共に、より高品質の画像を高速に再生することが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施例によるディスク記録再生装置の外観構成を示す斜視図である。
【図2】本発明の他の実施例によるディスク記録再生装置の外観構成を示す斜視図である。
【図3】本発明の一実施例によるディスク記録再生装置の電気的構成を示すブロック図である。
【図4】図3に示すMPEGビデオエンコーダ27bの具体的構成例を示すブロック図である。
【図5】図3に示すMPEGビデオデコーダ29bの具体的構成例を示すブロック図である。
【図6】本発明の一実施例に適用されるミニディスクの記録フォーマットを説明するための概念図である。
【図7】本発明の一実施例に適用されるクラスタインターリーブを説明するための概念図である。
【図8】本発明の一実施例に適用されるMDドライブ装置の電気的構成を示すブロック図である。
【図9】本発明の一実施例に適用されるグループオブピクチャを説明するための概念図である。
【図10】本発明の一実施例に適用されるグループオブピクチャとクラスタとの関係を説明するための概念図である。
【図11】本発明の一実施例に適用されるグループオブピクチャの他の構成例を説明するための概念図である。
【図12】本発明の一実施例に適用されるグループオブピクチャとクラスタとの他の関係を説明するための概念図である。
【図13】本発明の一実施例における再生専用型のミニディスクに対する1グループオブピクチャ分のデータの作成処理手順を示すフローチャートである。
【図14】本発明の一実施例における書き込み可能型のミニディスクに対する1グループオブピクチャ分の記録処理手順を示すフローチャートである。
【図15】本発明の一実施例におけるミニディスク1aに対する1グループオブピクチャ分の再生処理手順を示すフローチャートである。
【図16】画像間予想を示す線図である。
【図17】データ構造を示す線図である。
【符号の説明】
1a・・・ミニディスク、 2・・・ディスク記録再生装置、 5・・・カラーLCD、 20・・・MDドライブ装置、 21・・・I/Oインターフェイス、 22・・・MPU、 23・・・メインメモリ、 24・・・DMAC、 26・・・オーディオ・エンコーダ/デコーダ、 27・・・ビデオ・エンコード部、 29・・・ビデオ・デコード部、 28・・・LCDコントローラ、 50・・・システムコントローラ、 51・・・EFM/CIRCエンコーダ/デコーダ
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a recording medium suitable for recording highly efficient encoded digital image data, and a reproducing apparatus suitable for reproducing highly efficient encoded digital image data on the recording medium. It is.
[0002]
[Prior art]
As is well known, a CD-ROM (Compact Disc Read Only Memory) is standardized on the basis of a music CD (Compact Disc Digital Audio: hereinafter abbreviated as CD-DA).
First, the physical format will be briefly described. The physical format refers to a format in which data can be physically read at least when a CD-ROM disc is mounted on a CD-ROM drive.
[0003]
One disc can include up to 99 music or data tracks. Information about the track is recorded at the head of the disc, which is called TOC (Table Of Contents), that is, at the innermost circumference of the disc. The part where the TOC is recorded is called a lead-in track (Leadin Track). On the other hand, the last track, that is, the part where the last song ends in CD-DA, is called a lead-out track (Leadout Track).
[0004]
In the CD-DA, a stereo audio signal is digitized and recorded at a sampling rate of 16 bits and 44.1 kHz, so that in one second, 2 (stereo) × 2 (16 bits) × 44,100 = 176,400 This means that byte data is recorded. In a CD-ROM, a sector obtained by dividing one second into 75 is handled as a minimum unit, and thus one sector is 2,352 bytes.
[0005]
In the case of CD-ROM MODE-1, SYNC data (12 bytes) and a header (4 bytes) for synchronization, ECC (Error Correction Coding: 276 bytes) and EDC (Error) for error correction are included in one sector. (Detect Coding: 4 bytes), and the other 2048 bytes are recorded as user data. For data that does not require strict error correction due to data interpolation processing, such as audio and image data, the ECC and EDC are omitted, and 2,336 bytes excluding SYNC and header are included in one sector as user data. Be recorded. This is called CD-ROM MODE-2.
[0006]
In recent years, a personal audio device capable of recording and reproducing has been developed and commercialized, which is called a minidisc (trademark) system.
[0007]
In this mini-disc, EFM (Eight to Fourteen Modulation) is used as a modulation method for writing to the disc, and CIRC (Cross Interleave Reed-Solomon Code) is used as an error correction code. In this format, audio data compressed by ATRAC (Adaptive Transform Acoustic Coding) is recorded. The compressed data is collectively recorded for each block called a cluster as shown in FIG. The format is very close to the above-described CD-ROM MODE-2.
[0008]
The CD-ROM has 98 sectors of a CD as one sector. Converted to the playback time, it is 13.3 ms. The interleave length of CIRC is 108 frames (14.5 ms). It is longer than one sector of a CD-ROM. In order to record data using the CIRC error correction code, it is necessary to secure at least three extra sectors. This area is called a link area. Before starting to write data, a link area of 108 frames (1 sector + α) or more must be secured. Even after the data has been written, it is necessary to secure an area of 108 frames or more in the same manner.
Otherwise, the error correction interleave will not be completed.
[0009]
If data can be written from an arbitrary location, the link areas are distributed to various parts of the disk, and the data recording / reproducing efficiency deteriorates. Therefore, data is written for each recording unit which is relatively large. In a mini disc, this recording unit is called a cluster. One cluster is composed of 36 sectors. Rewriting is always performed at an integral multiple of one cluster. The data to be recorded is temporarily stored in the RAM and written to the disk. This RAM can be shared with a shock-proof memory for realizing a function of preventing vibration during reproduction.
[0010]
In a magneto-optical disk type mini disk capable of recording and reproduction, three sectors in one cluster (= 36 sectors) are set as link sectors, and the next one sector is reserved for sub data. The compressed data is recorded in the remaining 32 sectors.
[0011]
When recording data, writing is started in the middle of the second link sector of the previous cluster. When the 36th sector has been written, data for error correction must be written halfway between the first link sector and the second link sector.
[0012]
In a minidisk similar to a read-only CD, there is no need to consider rewriting in cluster units, and since data is recorded continuously, three sectors in the link area are unnecessary. All four sectors, which are the three sectors plus one sub data sector, are allocated for sub data so that graphics data and the like can be stored.
[0013]
As described above, in the mini-disc, the sub data capacity of the recording disc and the reproduction-only disc are different, and if the sub-data is included, it is impossible to completely copy the reproduction-only disc to the recording disc.
[0014]
In the case of rewriting a part of the data already recorded on the recording disk, it is necessary to rewrite the entire cluster even if the update data is small. This is because interleaving is performed in units of clusters.
[0015]
On the other hand, as a method for encoding an image signal with high efficiency, a high-efficiency encoding method for image signals for digital storage media is specified in accordance with a standardization plan by MPIG1 (Moving Picture Image Coding Experts Group Phasel). Here, the storage medium targeted by the method is one having a continuous transfer speed of about 1.5 Mbit / sec or less, such as a CD, a DAT (Digital Audio Tape), or a hard disk. It is also assumed that this is connected not only directly to the decoder but also via a transmission medium such as a computer bus, a LAN (local area network), and telecommunications. Special functions such as random access, high-speed reproduction, and reverse-order reproduction as well as normal-order reproduction are also considered.
[0016]
The principle of such a high-efficiency encoding method of an image signal by MPEG1 is as follows (for example, see Non-Patent Document 1).
[0017]
In this high-efficiency coding method, first, the redundancy in the time axis direction is reduced by taking the difference between images, and then, the discrete cosine transform (DCT) processing and the variable-length coding processing are used to reduce the redundancy in the time axis direction. To reduce the degree of redundancy.
[0018]
First, the redundancy in the time axis direction will be described below.
In general, in a continuous moving image, the temporally preceding and succeeding images are very similar to the currently focused image (image at a certain time). Therefore, for example, as shown in FIG. 16, if the difference between the image to be encoded and the image ahead in time is obtained and the difference is transmitted, the redundancy in the time axis direction is reduced. To reduce the amount of information to be transmitted. The image coded in this way is called a forward-predicted coded image (P-picture or P-frame) described later. Similarly, if the difference between the image to be coded from now and the interpolated image generated from the front or the rear or the front and the back in time is taken, and the difference of a small value among them is transmitted. Thus, it is possible to reduce the amount of information to be transmitted by reducing the redundancy in the time axis direction. The image encoded in this manner is referred to as a bidirectionally predictive encoded image (B-picture or B-frame) described later. In FIG. 16, an image denoted by reference numeral I in the figure indicates an intra-coded image (intra-coded picture: I-picture or I-frame) described later, and an image denoted by reference numeral P in FIG. Indicates a P picture, and an image indicated by a symbol B indicates a B picture.
[0019]
In addition, motion compensation is performed to generate a predicted image.
According to this motion compensation, for example, a block of 16 × 16 pixels (hereinafter referred to as a macroblock) constituted by a unit block of 8 × 8 pixels is extracted, and one block is located near the position of the corresponding macroblock in the previous image. By searching for a macroblock with a small number difference and taking the difference from the searched macroblock, it is possible to reduce the data to be sent. Actually, for example, in a P picture (forward prediction coded image), the difference between the predicted image after the motion compensation and the difference between the predicted image after the motion compensation and the Are encoded in units of macroblocks of 16 × 16 pixels.
[0020]
However, in the case described above, for example, a large amount of data must be transmitted for an image portion such as a background that appears after an object moves. Therefore, for example, in the case of a B picture (bidirectional predictive coded image), an already decoded temporally forward or backward image after motion compensation and an interpolated image generated by adding both of them will now be encoded. And the image which does not take this difference, that is, the image with the smallest data amount among the four images to be encoded from now on is encoded.
[0021]
Next, the redundancy in the space axis direction will be described below.
The difference of the image data is not transmitted as it is, but is subjected to discrete cosine transform (DCT) for each unit block of 8 × 8 pixels. The DCT expresses an image not at a pixel level but by how many frequency components of a cosine function are included. For example, by a two-dimensional DCT, data of an 8 × 8 pixel unit block is converted to an 8 × 8 pixel unit block. 8 is converted into a coefficient block of the component of the cosine function. Generally, an image signal of a natural image captured by a television camera often becomes a smooth signal. In this case, by performing DCT processing on the image signal, the data amount can be efficiently reduced.
[0022]
That is, in the case of a smooth signal such as the above-described image signal of a natural image, by performing DCT processing, a large value is concentrated near a specific coefficient. When these coefficients are quantized, most of the 8 × 8 coefficient blocks become 0, and only large coefficients remain.
[0023]
Therefore, when transmitting the data of the 8 × 8 coefficient block, a Huffman code is used in which a non-zero coefficient and a 0 run indicating how much 0 continues before the coefficient are set in a zigzag scan order. By transmitting, the amount of transmission can be reduced. On the decoding side, the image is reconstructed in the reverse procedure.
[0024]
Here, FIG. 17 shows the structure of data handled by the above-described encoding method. The data structure shown in FIG. 17 includes, in order from the bottom, a block layer, a macroblock layer, a slice layer, a picture layer, a group of pictures (GOP: Group Of Picture) layer, and a video sequence layer. Hereinafter, description will be made in order from the lower layer of FIG.
[0025]
First, in the block layer, each unit block of the block layer is composed of 8 × 8 pixels (8 lines × 8 pixels) having adjacent luminance or color difference. The DCT described above is performed for each unit block.
[0026]
In the macroblock layer, each macroblock is composed of four luminance blocks (luminance unit blocks) Y0, Y1, Y2, and Y3 adjacent to each other on the left and right and up and down, and a color difference block (corresponding to the same position as the luminance block on the image). (A color difference unit block) Cr and Cb. The order of transmission of these blocks is Y0, Y1, Y2, Y3, Cr, Cb. Here, in the present encoding method, what is used for a predicted image (a reference image for obtaining a difference) or whether or not the difference need not be transmitted is determined in units of macroblocks.
[0027]
The slice layer is composed of one or a plurality of macroblocks connected in the scanning order of the image. In the header of this slice, the difference between the motion vector and the DC (direct current) component in the image is reset, and the first macroblock has data indicating the position in the image, and thus an error has occurred. Even if you can return. Therefore, the length and start position of the slice are arbitrary, and can be changed depending on the error state of the transmission path.
[0028]
In the picture layer, a picture, that is, an image one by one, is composed of at least one or a plurality of slices. Each of the above-described intra-coded images (I-pictures or I-frames), forward prediction-coded images (P-pictures or B-frames), and DC intra-coded images (DC coded (D) pictures) according to the coding method. Are classified into four types of images.
[0029]
Here, in the above-described intra-coded image (I-picture), at the time of coding, only closed information in one image is used. Therefore, in other words, when decoding, an image can be reconstructed using only the information of the I picture itself. Actually, encoding is performed by DCT processing without taking a difference. Although this encoding method is generally inefficient, random insertion and high-speed reproduction are possible if this I picture is inserted everywhere.
[0030]
In the forward prediction coded image (P picture), an I picture or P picture which is located temporally earlier in the input and has already been decoded is used as a prediction image (a reference image for taking a difference). In practice, the more efficient one of encoding the difference from the motion-compensated predicted image and encoding the difference as it is (intra) without taking the difference is selected for each macroblock.
[0031]
In the bidirectional predictive coded image (B picture), three types of an I picture or a P picture that is temporally located earlier as a predicted picture and an interpolated picture generated from both of them are used. . As a result, the most efficient one of the above three types of difference coding after motion compensation and intra coding can be selected in macroblock units.
[0032]
The DC intra-coded image is an intra-coded image composed only of DCT DC coefficients, and cannot exist in the same sequence as the other three types of images.
[0033]
The group of pictures (GOP) layer is composed of one or more I-pictures and zero or more non-I-pictures.
[0034]
Here, the input order to the encoder is, for example,
1I, 2B, 3B, 4P * 5B, 6B, 7I, 8B, 9B, 10I, 11B, 12B, 13P, 14B, 15B, 16P * 17B, 18B, 19I, 20B, 21B, 22P The output of the encoder, that is, the input of the decoder is, for example, 1I, 4P, 2B, 3B * 7I, 5B, 6B, 10I, 8B, 9B, 13P, 11B, 12B, 16P, 14B, 15B * 19I, 17B, 18B. , 22P, 20B, and 21B.
[0035]
The reason why the rearrangement of the order is performed in the encoder is that, for example, when the above B picture is encoded or decoded, a temporally later I picture or P picture serving as a predicted image is first. This is because it must be encoded. Here, the interval between I pictures (for example, 9) and the interval between I pictures or B pictures (for example, 3) can be set arbitrarily. Further, the interval between the I picture and the P picture may be changed inside the group of picture layer. Note that the breaks in the group of picture layer are represented by the above-mentioned “*”, and the I indicates an I picture, P indicates a P picture, and B indicates a B picture.
[0036]
The uppermost video sequence layer in FIG. 17 includes one or a plurality of group of picture layers having the same image size, image rate, and the like.
[0037]
[Non-patent document 1]
The Institute of Television Engineers of Japan, "Multimedia Selection MPEG", First Edition, Ohmsha, April 20, 1996, pp. 85-109.
[0038]
[Problems to be solved by the invention]
By the way, when it is assumed that digital image data encoded at a high efficiency according to the above-described MPEG1 method is recorded on the above-described mini-disc, the following problem may occur.
1. When the recording unit of a GOP is set to an arbitrary size irrespective of a cluster, there is a possibility that image data of one GOP is recorded over two or more clusters. In this case, the GOP starts or ends in the middle of the cluster, making it difficult to perform editing processing such as replacing the GOP with another GOP as a cut unit. Even so, there is a problem that the average transfer rate decreases.
[0039]
2. When a P-picture or B-picture having the last frame of the immediately preceding GOP as a prediction image (reference image) is arranged at the beginning of the GOP, the preceding GOP is decoded to decode the P-picture or B-picture of the GOP. This also requires decoding, which causes a problem that rapid image reproduction becomes difficult during seek reproduction such as fast-forward or reverse-forward reproduction.
[0040]
SUMMARY OF THE INVENTION An object of the present invention is to make it possible to perform editing processing in units of GOPs by a simple and quick processing when recording highly efficient encoded digital image data on a disk-shaped recording medium such as a mini disk. Another object of the present invention is to make it possible to perform special reproduction such as high-speed fast-forward or reverse-forward reproduction by a simple and quick process.
[0041]
[Means for Solving the Problems]
In the recording medium according to the present invention, a cluster serving as a unit of reproduction in which a plurality of sectors capable of recording a predetermined amount of data are connected is provided on the outer peripheral side in the recording data area of the disc for reproduction only, and a predetermined number of continuous moving images is provided. Each frame of the group of pictures composed of the following frames is subjected to image compression processing and recorded in a first sector area composed of a predetermined number of sectors of a cluster, and in a second sector area composed of other sectors of the cluster, It is characterized in that compressed data of a predetermined method of a frame necessary for reproducing a frame of an adjacent group op picture is recorded.
[0042]
Also, the method of compressing a frame necessary for reproducing a frame of an adjacent group of pictures is intra-picture encoding.
[0043]
Further, in the reproducing apparatus according to the present invention, a cluster serving as a unit of reproduction in which a plurality of sectors capable of recording a predetermined data amount are connected is provided on the outer peripheral side in the recording data area of the disc for reproduction only, and a continuous moving image is provided. Each frame of a group of pictures composed of a predetermined number of frames is subjected to image compression processing and recorded in a first sector area composed of a predetermined number of sectors of a cluster, and a second sector area composed of other sectors of the cluster A reproducing unit for reading data in cluster units from a recording medium, wherein the reproducing unit reproduces a recording medium on which compressed data of a predetermined method required for reproducing a frame of an adjacent group of pictures is recorded; Storage means for storing the data read by the decoding means; decoding means for decoding the image-compressed data reproduced by the reproduction means; The reproducing means is controlled so that a group of pictures to be read is read from the recording medium to the storage means, and data of a predetermined sector of a cluster in which a group of pictures adjacent to the group of pictures to be decoded are read. Moving means is reproduced based on the data recorded in the second sector area of the reproduced adjacent group of pictures and the group of pictures read from the recording medium to be decoded. Control means for controlling the decoding means as described above.
[0044]
According to the recording medium and the reproducing apparatus of the present invention having the above configuration, each frame of the group of pictures is image-compressed and recorded in the first sector area of the cluster, and is necessary for reproducing frames of the adjacent group of pictures. Image data of a particular frame is recorded in the second sector area of this cluster, and a moving image is recorded based on the group of picture to be decoded and the data recorded in the second sector area of the adjacent group of pictures. Since reproduction can be performed, editing processing in units of GOPs and special reproduction such as fast forward and reverse fast forward reproduction can be performed, and higher quality images can be reproduced at high speed.
[0045]
BEST MODE FOR CARRYING OUT THE INVENTION
First, an external configuration of an embodiment of the present invention will be described with reference to FIGS.
FIG. 1 is a perspective view showing an external configuration of an embodiment of a disk recording medium and a disk recording / reproducing apparatus according to the present invention. A mini-disk (usually called a mini-disc including the cartridge 1) including a magneto-optical disk or an optical disk is housed inside the cartridge 1 shown in FIG. Digital data can be recorded and reproduced magneto-optically. An insertion hole 3 is formed on a front surface of the disk recording / reproducing device 2. A loading mechanism for loading or unloading the cartridge 1 with a mini-disc inserted in the insertion hole 3 is provided in the disk recording / reproducing device 2. It is provided inside. Various operation keys 4 are arranged on the front right side of the disk recording / reproducing apparatus 2 so that various instructions can be input to the disk recording / reproducing apparatus 2. In addition, a color LCD (liquid crystal display) 5 is provided above and in front of the disk recording / reproducing apparatus 2, and a color moving image reproduced and decoded from the mini disk is displayed on the color LCD 5. ing.
[0046]
FIG. 2 is a perspective view showing an external configuration of another embodiment of the disc recording / reproducing apparatus according to the present invention. In this embodiment, the color LCD 5 in the embodiment of FIG. 1 is omitted, and the video signal output from the disk recording / reproducing device 2 is supplied to the color CRT display / monitor 12 via the cable 11 and displayed. Has become. That is, the embodiment shown in FIG. 1 is a portable disk recording / reproducing apparatus, whereas the embodiment shown in FIG. 2 is a stationary disk recording / reproducing apparatus.
[0047]
Next, FIG. 3 shows an electrical configuration inside the disk recording / reproducing apparatus 2. The MD (mini-disc) drive device 20 records and reproduces digital data on the mini-disc 1a stored in the cartridge 1.
[0048]
The MD drive device 20 is originally designed based on a mini-disk system developed for use in portable, stationary, or in-vehicle personal audio equipment. In this mini-disc system, a small and thin recording medium called a mini-disc is used. The mini-disc can be any of a read-only optical disc having a diameter of 64 mm, a rewritable MO (magneto-optical) disc, or a hybrid disc (also called a partial ROM disc) in which a rewritable area and a read-only area are provided in a mixed manner. (W × L × H = 72 mm × 68 mm × 5 mm). Data is read from a mini-disc containing a read-only optical disc according to the same principle as a CD (Compact Disc). On the other hand, data is recorded on a mini-disc containing an MO disc or a hybrid disc by a magnetic field modulation direct overwrite method. The magnetic field modulation direct overwrite method irradiates a rotating disk with a high-power laser beam from below, and raises the magneto-optical film of the part to be recorded to the Curie temperature at which the coercive force of the magnetic material disappears. In this method, data is written from above a disk by a magnetic head.
[0049]
In the development process of such a mini-disc system as a personal audio device, the integration of each circuit element and the optimization of each mechanical component have been achieved, and the miniaturization and weight reduction of the entire device have been achieved. Battery operation is possible due to power consumption. Furthermore, in addition to the feature that it has almost the same storage capacity (140 Mbytes) as the existing 3.5-inch MO disk and that the recording medium can be exchanged, the recording medium can be compared with other MO disks due to the mass production effect. Of course, the manufacturing cost of the drive unit itself is also reduced. In addition, reliability has been sufficiently demonstrated based on the results of use as personal audio equipment.
[0050]
The detailed configuration of the MD drive device 20 will be described later with reference to FIG. This MD drive device 20 is connected to a bus line via an I / O interface circuit 21 as shown in FIG.
[0051]
3, an MPU (microprocessor unit) 22 supplies necessary addresses and data to each unit via a bus line, and controls each unit. The main memory 23 includes a ROM in which a program executed by the MPU 22 is stored in advance, and a RAM in which various data are temporarily stored as a work area. The main memory 23 is addressed from the MPU 22 or the like via a bus line. Along with this, various data are written and read.
[0052]
The DMAC (direct memory access controller) 24 directly controls the input and output of data to and from the main memory 23 without going through the MPU 22 to perform DMA transfer.
[0053]
An audio AD / DA (analog digital / digital / analog) conversion circuit 25 A / D converts an analog audio signal input to an analog audio input terminal Ain and supplies the analog audio signal to an audio encoder / decoder 26, while the audio audio signal is supplied to the audio encoder / decoder 26. The digital audio data supplied from the encoder / decoder 26 is D / A converted and output to an analog audio output terminal Aout. The audio encoder / decoder 26 encodes and compresses the digital audio data supplied from the audio AD / DA conversion circuit 25 in a predetermined format defined by the MPEG audio standard, and encodes the encoded audio data. The data is temporarily stored in the main memory 23 under the control of the DMAC 24. Further, the coded audio data read from the main memory 23 is decoded to restore the original digital audio data, and is supplied to the audio AD / DA conversion circuit 25. The transfer of encoded audio data between the main memory 23 and the audio encoder / decoder 26 is controlled by the DMAC 24.
[0054]
The video encoding unit 27 converts the analog video signal input to the analog video input terminal Vin into an A / D converter 27a, and converts the digital video data converted by the A / D converter 27a into MPEG1 data. And an MPEG video encoder 27b for encoding and compressing based on the standard. The encoded video data encoded by the MPEG video encoder 27b is temporarily stored in the main memory 23 under the control of the DMAC 24.
[0055]
The digital video data converted by the AD converter 27a is also supplied to an LCD controller 28, and is displayed on the LCD 5 under the control of the LCD controller 28. In the configuration without the LCD 5, as shown in FIG. 2, it is supplied to the CRT display / monitor 12 via the external cable 11 and displayed.
[0056]
The video decoder 29 decodes the coded video data read from the main memory 23 to restore the original digital video data, and the MPEG video decoder 29b decodes the decoded video data. And a D / A converter 29a for D / A converting the digital video data and outputting it to an analog video output terminal Vout.
[0057]
The digital video data decoded by the MPEG video decoder 29b is also supplied to the LCD controller 28, and is displayed on the LCD 5 under the control of the LCD controller 28.
[0058]
The transfer of encoded video data between the MPEG video encoder 27b and the MPEG video decoder 29b and the main memory 23 is also controlled by the DMAC 24.
[0059]
Further, the exchange of various data between the main memory 23 and the MD drive device 20 via the I / O interface 21 is also controlled by the DMAC 24.
[0060]
The operation panel controller 30 supplies various instruction data input by the operation keys 4 to the MPU 22 via a bus line.
[0061]
Here, a specific configuration example of the MPEG video encoder 27b will be described with reference to FIG. The blocked digital video signal from the input terminal 61 is supplied to a subtractor 62 and a motion vector detection circuit 72. This block digital video signal is a digital video signal composed of discrete pixel data strings, for each screen, pixel data arranged in the horizontal and vertical directions of the screen, for example, in an 8 × 8 matrix. Is a signal that has been time-series converted so as to be subdivided into a plurality of unit block signals composed of
[0062]
In the subtractor 62, a unit block signal of the blocked digital video signal and a unit block signal having a pixel data configuration similar to the unit block signal, that is, a prediction unit block signal, obtained from the motion compensation circuit 71. Subtraction with the one is performed.
[0063]
A difference unit block signal (sometimes not a difference unit block signal but a unit block signal) which is a subtraction output of the subtracter 62 is converted to a two-dimensional discrete cosine transform circuit (two-dimensional DCT) which is a kind of orthogonal transform circuit. (Circuit) 63 for cosine conversion. The transform coefficients obtained from the two-dimensional DCT circuit 63 are supplied to a quantization circuit (requantization circuit) 64 and quantized.
[0064]
The quantized transform coefficients are supplied to a variable-length coding circuit 65, where they are coded, and then variable-length coded at an output terminal 66 and output as quantized transform coefficients (coded data). .
[0065]
Then, the unit block signal constituting the frame signal stored in the frame memory 70 is supplied to the motion compensation circuit 71, and the motion compensation circuit 71 is controlled by the detection output from the motion vector detection circuit 72, and The unit block signal having the highest correlation is determined, and the unit block signal having the highest correlation is output from the motion compensation circuit 71 as a predicted unit block signal, and supplied to the subtractor 62 and the adder 69, respectively.
[0066]
Next, a specific configuration example of the MPEG video decoder 29b will be described with reference to FIG. Variable-length coded and quantized transform coefficients (coded data) corresponding to the output signal of the output terminal 66 in FIG. 4 are supplied from the input terminal 81 to the variable-length decoding circuit 82 and decoded. The quantized transform coefficients from the variable length decoding circuit 82 are supplied to an inverse quantization circuit 83 and are inversely quantized. The obtained quantized transform coefficient from the transform quantization circuit 64 is supplied to the inverse quantization circuit 67, where it is inversely quantized and the transform coefficient is output. The transform coefficient is supplied to a two-dimensional discrete cosine inverse transform circuit (two-dimensional discrete IDCT circuit) 68 to obtain an original difference unit block signal.
[0067]
The difference unit block signal is added by the adder 69 to the prediction unit block signal from the motion compensation circuit 71. The unit block signal from the adder 69 is supplied to the frame memory 70, and all the unit block signals constituting the frame signal to which the unit block signal belongs are stored.
[0068]
In the motion vector detection circuit 72, a unit block signal corresponding to each unit block signal of the blocked digital video signal from the input terminal 61 in the frame memory 70 for each unit block signal of the blocked digital video signal from the input terminal 61. , A unit block signal having the highest correlation is detected.
[0069]
Then, a block signal constituting the frame signal stored in the frame memory 70 is supplied to the motion compensation circuit 71, and the motion compensation circuit 71 is controlled by the detection output from the motion vector detection circuit 72, and The correlation of each block signal is determined, and the block signal having the highest correlation is output from the motion compensation circuit 71 as a prediction block signal, and supplied to the subtractor 62 and the adder 69, respectively.
[0070]
Next, a specific configuration example of the MPEG video decoder 29b will be described with reference to FIG. A variable-length coded and quantized transform coefficient (encoded data) corresponding to the output signal of the output terminal 66 in FIG. 4 is supplied from the input terminal 81 to the variable-length decoding circuit 82 and is subjected to variable-length decoding. . The quantized transform coefficients from the variable length decoding circuit 82 are supplied to an inverse quantization circuit 83 and are inversely quantized. The obtained transform coefficient is supplied to a two-dimensional discrete inverse cosine transform circuit (two-dimensional IDCT circuit) 84 and inversely transformed to obtain a differential unit block signal (sometimes a unit block signal instead of a differential unit block signal). ) Is obtained.
[0071]
When a unit block signal (a unit block signal of an I picture) is output from the two-dimensional IDCT circuit 84 instead of the difference unit block signal, the movable contact m of the changeover switch 85 is switched to the fixed contact a, and the unit is changed. The block signal is output to the output terminal 86 through the changeover switch 85.
[0072]
When the difference unit block signal is output from the two-dimensional IDCT circuit 84, the movable contact m of the changeover switch 85 is switched to the fixed contact b. In this case, the difference unit block signal from the two-dimensional IDCT circuit 84 is supplied to the adder 93 and added to the predicted unit block signal from the changeover switch 92, and the unit block signal from the adder 93 is changed to the changeover switch. The signal is output to an output terminal 86 through 85.
[0073]
The prediction unit block signal from the adder 93 is supplied to the frame memory 87 through the fixed contact b and the movable contact m of the changeover switch 85. In the frame memory 87, all the unit block signals constituting the frame signal to which the prediction unit block signal belongs from the adder 93 are stored.
[0074]
The frame signal read from the frame memory 87 is supplied to another frame memory 90 and stored. The frame signals before and after a predetermined frame from the frame memories 87 and 90 are respectively supplied to the motion compensation forward prediction circuit 88 and the motion compensation backward prediction circuit 91, respectively, and the average of the frame signals before and after the predetermined frame is supplied. Is supplied to the motion compensation forward / backward prediction circuit 89.
[0075]
In the prediction circuits 88, 91, and 89, the unit block signal of a certain frame is a unit block signal near the unit block signal of a certain frame, the unit block signal of a frame before and after a predetermined frame and an average unit thereof. When the prediction unit block signal having the highest correlation among the block signals is selected and the forward prediction unit block signal (prediction unit block signal of the P picture) is obtained, the movable contact m of the changeover switch 92 is set to the fixed contact c side. , And the unit block signal having the highest correlation is supplied to the adder 93 and added to the difference unit block signal from the two-dimensional IDCT circuit 84.
[0076]
When obtaining a bilateral prediction block signal (a prediction unit block signal of a B picture), the prediction unit block signal having the highest correlation among the three prediction unit block signals having the highest correlation is switched. The switch 92 is selected by switching the movable contact m of the movable contact m with respect to the fixed contacts c, d, and e, supplied to the adder 93, and added to the difference unit block signal from the two-dimensional IDCT circuit 84.
[0077]
Incidentally, specific circuits of the MPEG video encoder and the decoder described with reference to FIGS. 4 and 5 are described in detail in Japanese Patent Application Laid-Open No. 05-95545.
[0078]
Next, the operation of the disk recording / reproducing apparatus having the above configuration will be described.
When a predetermined one of the keys 4 is operated to instruct recording of the input audio signal and video signal, this instruction is supplied to the MPU 22 via the bus line by the operation panel controller 30. In response to this command, the MPU 22 controls each unit according to the procedure described below, and records the encoded audio data and the encoded video data encoded based on the MPEG1 standard on the mini-disc 1a.
[0079]
Here, the audio signal input to the analog audio input terminal Ain is A / D converted by the audio AD / DA conversion circuit 25 and supplied to the audio encoder / decoder 26. The audio encoder / decoder 26 temporarily stores the encoded audio data in the RAM having one cluster (32 sectors).
[0080]
Then, when encoded audio data (approximately 64 KBytes) for one cluster is generated by the audio encoder / decoder 26, the data is DMA-transferred and stored in the main memory 23 under the control of the DMAC 24. . What is the data for one cluster stored in the main memory 23? The data is read by the DMAC 24 at a predetermined timing, DMA-transferred to the MD drive device 20 via the I / O interface circuit 21, and recorded on the mini disk 1a.
[0081]
Here, in the MD drive device 20, data for one cluster is interleaved in units of clusters and recorded on the mini-disc 1a. That is, in a magneto-optical disk type mini disk capable of recording and reproduction, as shown in FIG. 6, three sectors in one cluster are set as link sectors, and the next one sector is reserved for sub data. Data is recorded in the remaining 32 sectors. When recording data, writing is started in the middle of the second link sector of the previous cluster. When the 36th sector has been written, data for error correction is written halfway between the first link sector and the second link sector.
[0082]
In this embodiment, as shown in FIG. 6, one cluster is composed of 36 sectors, of which the first 32 sectors record substantial data, and the last 4 sectors contain substantial data. It is not recorded. In the link sectors of the first three sectors of the last four sectors, data for error correction of data recorded in the adjacent cluster is recorded. The last one sector is a sub-data sector, and spare graphic data and the like corresponding to the data recorded in the first 32 sectors can be recorded. No data is recorded. In each sector, address information and data are recorded.
[0083]
Similarly, the video signal input to the analog video input terminal Vin is A / D converted by the A / D conversion circuit 27a, supplied to the MPEG video encoder 27b, and encoded. This coded video data is also temporarily stored in a RAM for one cluster (32 sectors), similarly to the coded audio data described above. When encoded video data for one cluster is generated by the MPEG video encoder 27b, the data is DMA-transferred and stored in the main memory 23 under the control of the DMAC 24. The data for one cluster stored in the main memory 23 is read out at a predetermined timing by the DMAC 24, DMA-transferred to the MD drive device 20 via the I / O interface circuit 21, and subjected to interleave processing in cluster units. After that, it is recorded on the mini disc 1a.
[0084]
In this embodiment, the encoded video data and the encoded audio data are cluster-interleaved and recorded on the minidisc 1a as shown in FIG. That is, the MPU 22 controls the coded video data indicated by the reference numeral V and the coded audio data indicated by the reference A in such a manner that they are alternately arranged in different clusters. Then, if necessary, predetermined data D such as programs and character data other than the encoded video data V and the encoded audio data A, and the encoded video data V or the encoded audio data A are recorded. Is recorded in a cluster different from the cluster that As described above, only the related data having a strong correlation is recorded in the same cluster, that is, the encoded video data V, the encoded audio data A, and the other data D are recorded in different clusters. Thereby, the processing speed at the time of recording and reproduction can be improved.
[0085]
However, in order to enable high-speed reproduction during a seek operation, the corresponding coded video data V, coded audio data A, and other data D are arranged in relatively close clusters. This is because these related data need to be reproduced at approximately the same time.
[0086]
The digital video data converted by the A / D converter 27a during the recording operation described above is supplied to the LCD controller 28, and is displayed on the LCD 5 under the control of the LCD controller 28. Alternatively, in a configuration without the LCD 5, as shown in FIG. 2, the data is supplied to the CRT display / monitor 12 via the external cable 11 and displayed. This allows the user to monitor the image being recorded.
[0087]
Next, the operation at the time of reproduction will be described. When the reproduction is instructed by operating the key 4, this instruction is supplied to the MPU 22 via the operation panel controller 30. At this time, the MPU 22 controls the MD drive device 20 to reproduce data recorded on the mini disc 1a. This reproduced data is DMA-transferred to the main memory 23 via the I / O interface circuit 21. Of the data stored in the main memory 23, the encoded audio data is DMA-transferred to the audio encoder / decoder 26, and the encoded video data is DMA-transferred to the video decoding unit 29, respectively.
[0088]
The encoded audio data for one cluster supplied to the audio encoder / decoder 26 is decoded, D / A converted in the audio AD / DA conversion circuit 25, and output from the analog audio output terminal Aout. Is done.
[0089]
On the other hand, the encoded video data for one cluster supplied to the video decoding unit 29 is also supplied to the LCD controller 28 after being decoded, and is displayed on the LCD 5 under the control of the LCD controller 28. Alternatively, in the configuration without the LCD 5, after the D / A conversion is performed by the DA converter 29a, the D / A conversion is supplied from the analog video output terminal Vout to the CRT display monitor 12 via the external cable 11 shown in FIG. Is displayed.
[0090]
Next, the configuration of the MD drive device 20 will be described with reference to FIG.
By applying a modulation magnetic field in accordance with recording data by the magnetic head 41 in a state in which the optical disk 44 irradiates a laser beam to the mini-disc 1a rotated by the spindle motor 46 shown in FIG. Data is optically reproduced by performing magnetic field modulation overwrite recording along the upper recording track and tracing the target track on the mini-disc 1a with the laser light by the optical pickup 44.
[0091]
The optical pickup 44 includes, for example, a laser light source such as a laser diode, an optical component such as a collimator lens, an objective lens, a polarizing beam splitter, a cylindrical lens, and a photodetector divided into a predetermined arrangement. Is positioned by the feed motor 45 at a position opposed to the magnetic head 41 with respect to.
[0092]
When recording data on the mini-disc 1a, the optical pickup 44 drives the magnetic head 41 by the magnetic head driving circuit 43 and applies a laser beam to a target track of the mini-disc 1a to which a modulation magnetic field according to the recording data is applied. By irradiating, data recording is performed by thermomagnetic recording.
[0093]
Further, the optical pickup 44 detects a focus error by, for example, an astigmatism method by detecting a laser beam applied to a target track, and detects a tracking error by, for example, a push-pull method, and a read-only type. When a reproduction signal is detected by utilizing the diffraction phenomenon of light in a pit row of a target track of the mini-disc 1a and data is reproduced from the writable mini-disc 1a, the polarization angle of the reflected light from the target track ( A difference in the car rotation angle is detected to generate a reproduction signal.
[0094]
The output of the optical pickup 44 is supplied to an RF amplifier 47. The RF amplifier 47 extracts a focus error signal and a tracking error signal from the output of the optical pickup 44 and supplies the extracted signal to the servo control circuit 48, binarizes the reproduction signal, and supplies it to the address decoder 49. The address decoder 49 decodes an address from the supplied binary reproduction signal and supplies the decoded signal to the EFM / CIRC encoder / decoder 51.
[0095]
The servo control circuit 48 includes, for example, a focus servo control circuit, a tracking servo control circuit, a spindle motor servo circuit, a thread servo circuit, and the like.
[0096]
The focus servo control circuit controls the focus of the optical system of the optical pickup 44 so that the focus error signal becomes zero. The tracking servo control circuit controls the feed motor 45 of the optical pickup 44 so that the tracking error signal becomes zero.
[0097]
Further, the spindle motor servo control circuit controls the spindle motor 46 to rotate and drive the mini disc 1a at a predetermined rotation speed (for example, a constant linear speed). The thread servo control circuit moves the magnetic head 41 and the optical pickup 44 to the target track position of the mini disk 1a specified by the system controller 50 by the feed motor 45.
[0098]
The EFM / CIRC encoder / decoder 51 performs coding processing for error correction, that is, coding processing of CIRC (Cross Interleaved Reed-Solomon Code), on the data supplied via the I / O interface 21, A modulation process suitable for recording, that is, an EFM (Eight to Fourteen Modulation) encoding process is performed.
[0099]
The encoded data output from the EFM / CIRC encoder / decoder 51 is supplied to the magnetic head drive circuit 43 as recording data. The magnetic head drive circuit 43 drives the magnetic head 41 so as to apply a modulation magnetic field according to the recording data to the mini disk 1a.
[0100]
When receiving a write command from the MPU 22 via the I / O interface 21, the system controller 50 controls the recording position on the mini disc 1a so that the recording data is recorded on a predetermined recording track of the mini disc 1a. I do. The recording position is controlled by controlling the recording position information on the mini disk 1a obtained from the encoded data output from the EFM / CIRC encoder / decoder 51 by the system controller 50, and recording from the system controller 50 on the mini disk 1a. This is performed by supplying a control signal specifying the recording position of the track to the servo control circuit 48. As a result, coded audio data, coded video data, and other digital data to be added as necessary are stored on the mini-disc 1a in cluster units by the so-called magnetic field modulation magneto-optical recording method, as described above. Recorded in.
[0101]
At the time of reproduction, the EFM / CIRC encoder / decoder 51 performs EFM demodulation processing and CIRC decoding processing for error correction on the input binary reproduction data, and performs I / O interface 21 Output to
[0102]
Further, when receiving a read command from the MPU 22 via the I / O interface 21, the system controller 50 controls a reproduction position with respect to a recording track of the mini disc 1a so that reproduction data is continuously obtained. The reproduction position is controlled by controlling the recording position information on the mini-disc 1a obtained from the reproduction data by the system controller 50, and servo-controlling the control signal for specifying the reproduction position of the recording track of the mini-disc 1a from the system controller 50. This is done by supplying the circuit 48.
[0103]
Next, a relationship between a GOP and a cluster according to an embodiment of the present invention will be described with reference to FIGS. In this embodiment, as shown in FIG. 9, for example, when a GOP is composed of seven frames (or fields) of images, the first frame image is defined as an I picture I0, and the fourth frame is defined as an I picture I0. The image is assumed to be a P picture P1 which is a forward prediction image from the image I0 of the first frame. Further, the picture of the final seventh frame is set as a P picture P4 which is a forward prediction picture from the P picture P1 of the fourth frame. The images of the second and third frames are assumed to be B pictures B2 or B3 which are bidirectional prediction images from the preceding I picture I0 and the subsequent P picture P1, respectively. Similarly, the images of the fifth and sixth frames include a B picture B5 or B6, which is a bidirectional prediction image from the P picture P1 of the fourth frame and the P picture P4 of the seventh frame. I do.
[0104]
Then, in the present embodiment, as shown in FIG. 10, the encoded video data of one GOP is encoded so as to fit in 32 sectors of one cluster, and recorded on the minidisc 1a. In this case, in the read-only ROM type mini-disc 1a, when encoded video data based on the MPEG standard is generated, encoding is performed in advance in units of 1 GOP so as to be recorded in each cluster. Based on the coded video data thus generated, stamping and the like are performed through the same manufacturing process as that for a CD, and a large number of minidiscs 1a on which the same coded video data is recorded are produced.
[0105]
Also, in a writable RAM type or a hybrid type (partial ROM type) mini-disc 1a in which a writable area and a read-only area are mixed, the MPEG video encoder 27b of the video encoding unit 27 uses one GOP as a unit. Encoding is performed so as to be recorded in each one cluster, and the encoded video data thus generated is DMA-transferred to the MD drive device 20 and recorded on the minidisc 1a.
[0106]
Here, the encoding order is indicated by a numeral in FIG. That is, the images of the respective frames sequentially input in the order of I0, B2, B3, P1, B5, B6, and P4 are sequentially encoded in the order of I0, P1, B2, B3, P4, B5, and B6. Then, the encoded video data is arranged in each sector in one cluster in the order of the encoding.
[0107]
However, in exceptional cases, when the encoded video data of one GOP cannot be arranged in 32 sectors in one cluster, the encoded video data of the GOP is recorded in a plurality of continuous clusters. You. If the recording position of the coded video data corresponding to the last frame of the GOP does not correspond to the last sector of the cluster, the remaining sectors of the cluster have substantially invalid dummy data such as "0". Data is additionally recorded.
[0108]
Thus, in the present embodiment, the first frame of one GOP is encoded as an I picture, and the last frame is encoded as a P picture. Then, the leading I picture is always located at the head of the cluster. By doing so, for example, even in a case where the minidisk 1a is sought and an image of a predetermined cluster is intermittently extracted and reproduced, an I picture is always arranged at the head of each cluster. , It is possible to completely decode at least one frame of the extracted cluster. Further, since encoded video data of different GOPs are not arranged in the same cluster, editing in cut units such as replacing encoded video data with other encoded video data in units of 1 GOP is performed. This can be easily performed.
[0109]
FIGS. 11 and 12 show the relationship between GOPs and clusters in another embodiment of the present invention. In this embodiment, as shown in FIG. 11, for example, as shown in FIG. 11, one frame is composed of 15 frames, and among the sequentially input frames, the image of the third frame is defined as an I picture I0, and the sixth frame is Is a P picture P3 that is a forward prediction image from the third frame image I0, and a ninth frame image is a P picture P6 that is a forward prediction image from the sixth frame image P3. It is said. The image of the twelfth frame is a P picture P9 which is a forward prediction image from the image P6 of the ninth frame. Then, the picture of the last 15th frame is a P picture P12 which is a forward prediction picture from the P picture P9 of the twelfth frame.
[0110]
The image of each frame located between the I picture and the P picture is a B picture, and is predicted from the I picture or the B picture located before and after the frame. That is, the images of the fourth and fifth frames are B pictures B4 and B5, which are bidirectional predicted images from the I picture I0 of the third frame and the P picture P3 of the sixth frame. . The images of the seventh and eighth frames are B pictures B7 and B8 from the P pictures P3 and P6 of the sixth and ninth frames, respectively, and the images of the tenth and eleventh frames. The images are B pictures B10 and B11 from the P pictures P6 and P9 of the ninth and twelfth frames. Further, the images of the thirteenth and fourteenth frames are B pictures B13 and B14 from the P pictures P9 and P12 of the twelfth and fifteenth frames.
[0111]
Then, the images of the first two frames of the GOP are the last P picture P12 of the immediately preceding GOP and the B pictures B1 and B2 from the I picture I0 of the corresponding GOP.
[0112]
However, if a GOP is configured in this manner, the B pictures B1 and B2 of the first two frames cannot be decoded when only the cluster corresponding to the same GOP is reproduced. This is because the P picture P12, which is one image serving as a reference for predicting the B pictures B1 and B2, belongs to the immediately preceding GOP and is recorded in the immediately preceding cluster.
[0113]
Therefore, in the present embodiment, as shown in FIG. 12, the coded video data for 15 frames constituting the GOP is encoded in the first 32 sectors out of 36 sectors constituting one cluster. The encoded video data corresponding to the P picture P12, which is an image for predicting the B pictures B1 and B2 of the first two frames of the immediately succeeding GOP, is placed in the last four sectors in order. It is recorded as an I-picture Is encoded by intra-coding, which can reconstruct an image only with its own data without using it. This I picture Is is, of course, redundant data that overlaps with the P picture P12 in the same cluster.
[0114]
However, by recording the redundant I picture Is in this way, it becomes possible to decode the original image only from the encoded video data for the last four sectors of the GOP. That is, it is not necessary to decode all GOPs in the immediately preceding cluster from the beginning. Therefore, from the I pictures Is of the last four sectors of the GOP immediately before the GOP to be reproduced and the third I picture I0 of the GOP to be reproduced, the B pictures B1 and B2 sandwiched therebetween. Can be decoded.
[0115]
However, as described above, in the case of the writable mini-disc 1a (hereinafter referred to as MO cluster including the writable area of the partial ROM disk), three of the last four sectors of each cluster are set as link sectors. It is stipulated in the standards to secure. However, in the read-only mini-disc 1a (hereinafter referred to as a ROM cluster including a read-only area of a partial ROM disk), all these four sectors can be freely used as sub data sectors. Therefore, in the case of the read-only mini-disc 1a, the sub data sectors of the last four sectors of each cluster (however, in this specification, these sub data sectors and the link sector are collectively referred to as a link sector. Then, the predicted images of the B pictures B1 and B2 of the first two frames of the immediately following GOP are recorded as I picture Is.
[0116]
FIG. 13 is a flowchart showing a procedure for creating data of one group of pictures for the read-only mini-disc 1a (ROM cluster) in one embodiment of the present invention.
[0117]
In this figure, in this case, the ROM cluster is not limited to the case where the entire disk is a ROM area, for example, a predetermined area of an inner circumference of one disk is a ROM cluster, and the outer circumference thereof is recordable. Also includes a partial ROM that is an MO cluster.
[0118]
First, in step S1 in FIG. 13, the picture format of the first frame of the GOP is determined on the assumption that the cluster to be recorded is a ROM cluster. If the first frame of the GOP to be recorded is an I picture as shown in FIG. 10, for example, the process proceeds from step S2 to step S3, and nothing is recorded in the last four sectors. (However, data for completing the interleaving is actually recorded), and the process is terminated.
[0119]
On the other hand, in step S1, for example, as shown in FIG. 11, when the first frame is composed of a B picture or a P picture other than an I picture, the process proceeds from the next step S2 to step S4, where the last four sectors of the cluster are stored. It is determined whether or not the capacity is such that the I picture IS (the predicted image of the first two frames of the immediately following GOP) corresponding to the P picture P12 can be recorded.
[0120]
If the capacity is determined to be recordable, the process proceeds to step S5, and the I picture IS is recorded. On the other hand, when it is determined that the data amount of the I picture IS is too large to record the data of the I picture IS in four sectors, the process proceeds to step S3, and the I picture IS is not recorded.
[0121]
In this way, taking into account the last four sectors of the cluster and the data amount of the I picture IS, encoding and encoding are performed so as to obtain a higher quality image by using an algorithm using the immediately preceding GOP as much as possible. A record is made.
[0122]
FIG. 14 is a flowchart showing a recording process procedure for one group of pictures on the writable mini-disc 1a in one embodiment of the present invention. In the case where it is determined in step S11 in FIG. 11 that the cluster to be recorded is an MO cluster, the last four sectors of each cluster are required to have three sector link sectors. See Japanese Patent Application No. 2-222821 (JP-A-4-105271) and the corresponding US Pat. No. 5,243,588. Therefore, in this case, the process proceeds to step S13, on the assumption that the prediction process from the immediately preceding GOP is impossible, the first frame of the GOP is set to an I picture, and the last frame is set to a P picture. Is processed as Then, the process proceeds to step S14, in which no data is recorded in the last four sectors of the cluster. As a result, encoded video data is recorded in the format of the embodiment shown in FIGS.
[0123]
FIG. 15 is a flowchart showing a procedure of a reproduction process for one group of pictures on the mini disc 1a in one embodiment of the present invention.
[0124]
First, in step S21, it is determined whether or not the cluster to be reproduced is a ROM cluster. If it is determined that the cluster is a ROM cluster, the process proceeds to step S22, and it is determined whether the I picture Is is recorded in the last four sectors of the immediately preceding cluster. If the I picture Is has been recorded, the process proceeds to step S23, and the B pictures B1 and B2 of the first two frames of the next GOP are decoded using the I picture Is.
[0125]
If it is determined in step S22 that the I picture Is is not recorded in the last four sectors of the cluster, the process proceeds to step S24, where data obtained by decoding the immediately preceding GOP picture P12 (I picture (Which is data) is determined. For example, when a search operation is being performed, the immediately preceding GOP does not necessarily decode all the clusters from the first sector. In such a case, the P picture P12 is often not decoded. Therefore, in this case, the process proceeds to step S26, in which the B pictures B1 and B2 of the first two frames of the GOP are not substantially decoded (even if decoded, they are not displayed). This prevents a distorted image from being displayed.
[0126]
On the other hand, in a case where normal playback is performed instead of the search operation, each cluster is sequentially played back. Therefore, in step S24, it is determined that the P picture P12 of the immediately preceding GOP has been decoded. Is determined. In this case, the process proceeds from step S24 to step S25, and the B pictures B1, B2 of the first frame of the next GOP are decoded using the decoded P picture P12.
[0127]
On the other hand, if it is determined in step S21 that the cluster to be reproduced is not a ROM cluster (if it is determined to be an MO cluster), the process proceeds from step S21 to step S27, and the cluster to be reproduced is determined. The decryption is performed only with the data in. That is, in this case, as described in step S2 of FIG. 13, the I picture is arranged at the head of the cluster, and the P picture is arranged at the end of the cluster. As a result, decoding can be performed only with the data in the cluster.
[0128]
In the above description, the case where MPEG digitally compressed video data is recorded on a mini-disc has been described as an example. However, the present invention is also applied to the case where digital video data processed by another compression method is recorded on another disc. It is possible.
[0129]
【The invention's effect】
As described above, according to the recording medium and the reproducing apparatus of the present invention, each frame of the group of picture is image-compressed and recorded in the first sector area of the cluster, and the reproduction of the adjacent frame of the group of picture is performed. Is recorded in the second sector area of this cluster, and a moving image is generated based on the group of pictures to be decoded and the data recorded in the second sector area of the adjacent group of pictures. Since images can be reproduced, editing processing in units of GOPs and special reproduction such as fast-forward and reverse-fast-forward reproduction can be performed. Can be reproduced at high speed.
[Brief description of the drawings]
FIG. 1 is a perspective view showing an external configuration of a disk recording / reproducing apparatus according to an embodiment of the present invention.
FIG. 2 is a perspective view showing an external configuration of a disk recording / reproducing apparatus according to another embodiment of the present invention.
FIG. 3 is a block diagram showing an electrical configuration of a disk recording / reproducing apparatus according to one embodiment of the present invention.
FIG. 4 is a block diagram showing a specific configuration example of an MPEG video encoder 27b shown in FIG.
FIG. 5 is a block diagram showing a specific configuration example of an MPEG video decoder 29b shown in FIG.
FIG. 6 is a conceptual diagram for explaining a recording format of a mini disc applied to one embodiment of the present invention.
FIG. 7 is a conceptual diagram illustrating cluster interleaving applied to one embodiment of the present invention.
FIG. 8 is a block diagram showing an electrical configuration of an MD drive device applied to one embodiment of the present invention.
FIG. 9 is a conceptual diagram illustrating a group of pictures applied to an embodiment of the present invention.
FIG. 10 is a conceptual diagram illustrating a relationship between a group of pictures and a cluster applied to an embodiment of the present invention.
FIG. 11 is a conceptual diagram illustrating another configuration example of a group of pictures applied to an embodiment of the present invention.
FIG. 12 is a conceptual diagram for explaining another relationship between a group of pictures and a cluster applied to one embodiment of the present invention.
FIG. 13 is a flowchart showing a procedure for creating data of one group of pictures for a read-only type mini-disc in one embodiment of the present invention.
FIG. 14 is a flowchart showing a recording process procedure for one group of pictures on a writable mini-disc in one embodiment of the present invention.
FIG. 15 is a flowchart showing a reproduction processing procedure for one group of pictures on the mini-disc 1a in one embodiment of the present invention.
FIG. 16 is a diagram showing prediction between images.
FIG. 17 is a diagram showing a data structure.
[Explanation of symbols]
1a: Mini disk, 2: Disk recording / reproducing device, 5: Color LCD, 20: MD drive device, 21: I / O interface, 22: MPU, 23: Main memory 24 DMAC 26 Audio encoder / decoder 27 Video encoder 29 Video decoder 28 LCD controller 50 System controller , 51 ... EFM / CIRC encoder / decoder

Claims (3)

所定のデータ量が記録可能なセクタを複数連結した再生の単位となるクラスタがディスクの記録データ領域内の外周側に再生専用に設けられ、
動画像の連続する所定数のフレームから構成されるグループオブピクチャの各々のフレームが画像圧縮処理されて上記クラスタの所定数のセクタから成る第1のセクタ領域に記録され、
上記クラスタの他のセクタから成る第2のセクタ領域に、隣接するグループオプピクチャのフレームの再生に必要なフレームの所定方式の圧縮データが記録された記録媒体。
A cluster which is a unit of reproduction in which a plurality of sectors in which a predetermined amount of data can be recorded is linked is provided exclusively for reproduction on the outer peripheral side in the recording data area of the disk,
Each frame of a group of pictures composed of a predetermined number of continuous frames of a moving image is subjected to image compression processing and recorded in a first sector area including a predetermined number of sectors of the cluster,
A recording medium in which compressed data of a predetermined format of a frame necessary for reproducing a frame of an adjacent group op picture is recorded in a second sector area including another sector of the cluster.
上記隣接するグループオブピクチャのフレームの再生に必要なフレームの圧縮方式は、画像内符号化である請求項1に記載の記録媒体。2. The recording medium according to claim 1, wherein the frame compression method required for reproducing the adjacent group of picture frames is intra-picture encoding. 所定のデータ量が記録可能なセクタを複数連結した再生の単位となるクラスタがディスクの記録データ領域内の外周側に再生専用に設けられ、
動画像の連続する所定数のフレームから構成されるグループオブピクチャの各々のフレームが画像圧縮処理されて上記クラスタの所定数のセクタから成る第1のセクタ領域に記録され、
上記クラスタの他のセクタから成る第2のセクタ領域に、隣接するグループオブピクチャのフレームの再生に必要なフレームの所定方式の圧縮データが記録された記録媒体を再生する再生装置において、
上記記録媒体から上記クラスタ単位でデータを読出す再生手段と、
上記再生手段にて読出されたデータを記憶する記憶手段と、
上記再生手段にて再生された画像圧縮されたデータを復号する復号手段と、
復号するグループオブピクチャが記録媒体から上記記憶手段へ読出されるように上記再生手段を制御し、さらに上記復号するグループオブピクチャに隣接するグループオブピクチャが記録されているクラスタの所定のセクタのデータが読出されるように上記再生手段を制御し、上記再生された隣接するグループオブピクチャの上記第2のセクタ領域に記録されているデータと上記復号する上記記録媒体から読出されたグループオブピクチャとに基づいて動画像が再生されるように上記復号手段を制御する制御手段と
を備える再生装置。
A cluster which is a unit of reproduction in which a plurality of sectors in which a predetermined amount of data can be recorded is linked is provided exclusively for reproduction on the outer peripheral side in the recording data area of the disk,
Each frame of a group of pictures composed of a predetermined number of continuous frames of a moving image is subjected to image compression processing and recorded in a first sector area including a predetermined number of sectors of the cluster,
In a reproducing apparatus for reproducing a recording medium in which compressed data of a predetermined format of a frame necessary for reproducing a frame of an adjacent group of pictures is recorded in a second sector area including another sector of the cluster,
Reproducing means for reading data in cluster units from the recording medium;
Storage means for storing data read by the reproduction means;
Decoding means for decoding the image-compressed data reproduced by the reproducing means,
Controlling the reproducing means so that the group of pictures to be decoded is read from the recording medium to the storage means; Is controlled so that is read out, the data recorded in the second sector area of the reproduced adjacent group of pictures and the group of pictures read from the recording medium to be decoded are And a control means for controlling the decoding means so that a moving image is reproduced based on the video signal.
JP2003159774A 1993-03-26 2003-06-04 Playback device Expired - Fee Related JP3580310B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003159774A JP3580310B2 (en) 1993-03-26 2003-06-04 Playback device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP9196193 1993-03-26
JP2003159774A JP3580310B2 (en) 1993-03-26 2003-06-04 Playback device

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP52191194A Division JP3463299B2 (en) 1993-03-26 1994-03-28 Disc playback device

Publications (2)

Publication Number Publication Date
JP2004030890A true JP2004030890A (en) 2004-01-29
JP3580310B2 JP3580310B2 (en) 2004-10-20

Family

ID=31189716

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003159774A Expired - Fee Related JP3580310B2 (en) 1993-03-26 2003-06-04 Playback device

Country Status (1)

Country Link
JP (1) JP3580310B2 (en)

Also Published As

Publication number Publication date
JP3580310B2 (en) 2004-10-20

Similar Documents

Publication Publication Date Title
JP3463299B2 (en) Disc playback device
KR100219748B1 (en) Optical disk recording and reproducing device and method
JP3254924B2 (en) Data reproducing method and data reproducing apparatus
JP4099547B2 (en) Digital signal editing apparatus and method
US7046916B1 (en) Encoded video image formatting
KR19990023627A (en) Decoding method and decoding player and recording medium
JP3156597B2 (en) Image information decoding and reproducing apparatus and image information decoding and reproducing method
JPH08140043A (en) Method and device for recording picture signal, method and device for reproducing picture signal and picture signal recording disk medium
JP3607315B2 (en) Video decoding device
JP3580310B2 (en) Playback device
JP3070422B2 (en) Image compression recording medium and image compression recording medium reproducing apparatus
JP3248366B2 (en) Data reproducing method and data reproducing apparatus
JPH11313283A (en) Moving-image data reproducing device and reverse reproduction method for moving-image data
JP2864950B2 (en) Management method of compressed video data
JP2001103424A (en) Coded bit stream recording and/or reproducing device, and recording medium
JP3507990B2 (en) Moving image reproducing apparatus and moving image recording / reproducing apparatus
JP3511315B2 (en) Optical disc, reproducing apparatus and reproducing method thereof, and recording apparatus and recording method of optical disc
JP3784473B2 (en) Optical recording medium, moving picture recording apparatus, and moving picture reproducing apparatus
JP2005260988A (en) Optical disk reproducing method and apparatus
JP2885068B2 (en) Variable transfer rate data playback device
JP3751386B2 (en) Continuous information recording method and continuous information reproducing apparatus
JP4199780B2 (en) Optical disc reproducing apparatus and reproducing method
JPH0879710A (en) Disk data reproducing method and reproducing device
JP2002157820A (en) Recording medium reproducing device and information recording medium
JP2005167489A (en) Recorder and recording method, reproducer and reproducing method, and recorder/reproducer and recording/reproducing method

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040413

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040609

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040629

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040712

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090730

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090730

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100730

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100730

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110730

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120730

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120730

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130730

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees