JP4103155B2 - Digital audio signal processing apparatus and processing method - Google Patents

Digital audio signal processing apparatus and processing method Download PDF

Info

Publication number
JP4103155B2
JP4103155B2 JP25331897A JP25331897A JP4103155B2 JP 4103155 B2 JP4103155 B2 JP 4103155B2 JP 25331897 A JP25331897 A JP 25331897A JP 25331897 A JP25331897 A JP 25331897A JP 4103155 B2 JP4103155 B2 JP 4103155B2
Authority
JP
Japan
Prior art keywords
frame
digital audio
audio signal
signal
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP25331897A
Other languages
Japanese (ja)
Other versions
JPH1196693A (en
Inventor
眞吾 中田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP25331897A priority Critical patent/JP4103155B2/en
Publication of JPH1196693A publication Critical patent/JPH1196693A/en
Application granted granted Critical
Publication of JP4103155B2 publication Critical patent/JP4103155B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、例えばディジタルビデオ再生装置におけるディジタルオーディオ信号の処理装置および処理方法に関する。
【0002】
【従来の技術】
近年、ディジタル化されたビデオ信号を記録/再生するようなディジタルビデオテープレコーダが出現している。このようなディジタルビデオテープレコーダでは、記録時にはディジタル化されたビデオ信号に誤り訂正符号が付された信号が磁気テープに記録される。この磁気テープに対する記録は、従来のアナログ方式と同様、ヘリカルスキャンで、回転ヘッドによる傾斜アジマス記録という方式が用いられる。この傾斜アジマス記録方式とは、ギャップの延長方向が互いに異なる2つのヘッドによってテープ上に信号を記録していく方法である。
【0003】
再生時には、このテープ上に形成された斜めのトラックを記録時と同じように回転ヘッドでスキャンすることによって再生RF信号を得ている。この再生RF信号は、アンプ、イコライザなどを介してディジタルのデータ列である再生データとされる。また、この再生データは、再生信号と同期したクロックを生成するPLLにも供給され、再生クロックが生成される。
【0004】
実際には、ビデオ信号の1フレーム分のデータが複数、例えば10フレームにわたって記録される。したがって、再生時にも、回転ヘッドがこの10とラックをスキャンすることでビデオ信号1フレーム分のデータが得られる。
【0005】
当然のことながら、ディジタルビデオテープレコーダにおいては、ビデオデータと共にオーディオデータも記録される。このとき、NTSCによる(525/60)方式のビデオ信号におけるフィールド周波数は、59.94Hzとされている。それに対して、オーディオデータのサンプリング周波数は、48kHz,44.1kHzあるいは、32kHzなどとされている。したがって、1ビデオフレームの周期とオーディオデータのサンプリング周波数とが整数比の関係にない。
【0006】
例えば、サンプリング周波数が48kHzの場合、1ビデオフレーム中のオーディオサンプル数は、
48000Hz×(2〔フィールド〕/59.94Hz)≒1601.6サンプル
とされ、1フレーム当たり0.6サンプル分の端数が生じる。同様に、サンプリング周波数が32kHzの場合、
32000Hz×(2〔フィールド〕/59.94Hz)≒1067.734サンプル
とされ、1フレーム当たり略0.734サンプル分の端数が生じる。
【0007】
そのため、オーディオデータにおいては、整数個のサンプル数が入るフレームの組み合わせによって、平均的ビデオフレームとオーディオデータのサンプリング周波数との関係が規定のものとなるようにされている。上述の48kHzの例では、5フレーム周期でサンプル数を調整することによって、端数を吸収して整数サンプル数での処理が行なえるようになる。例えば、オーディオデータのサンプリング周波数が48kHzの場合においては、1ビデオフレームに対してオーディオデータ1600あるいは1601サンプル入るフレームと、1602サンプルが入るフレームとの組み合わせが用いられる。
【0008】
オーディオデータは、上述した1ビデオフレーム分のデータが記録される10トラックのうち、例えば前半の5トラックには左チャンネル(L-ch)のオーディオデータが、後半の5トラックには右チャンネル(R-ch)のオーディオデータが記録される。後述するように、オーディオデータは、1ビデオフレーム毎に異なるサンプル数を有する場合があり、そのため、1ビデオフレーム中のオーディオデータのサンプル数の情報が記録される。これは、AFSIZEと称され、L-chおよびR-chそれぞれについて、対応するトラックにトラック毎の所定の領域に記録される。
【0009】
そして、再生時にこのAFSIZEが読み出され、例えばオーディオ再生処理回路におけるPLLの手掛かりとして用いられる。すなわち、オーディオデータは、ビデオフレームに対して位相が合っていなければならないため、このAFSIZEによって再生クロックの周波数を変えるのである。
【0010】
ところで、ディジタルビデオのフォーマットにおいて、ディジタルオーディオ信号の扱いとして、ビデオフレームと非同期で処理を行なうUnlockedモードと、ビデオフレームに対して同期を取るLockedモードと称されるモードとの2モードが規定されている。
【0011】
Unlockモードでは、1フレームに入るサンプル数が、例えば1580サンプル〜1620サンプルといった所定の範囲内で可変とされる。標準的には、1フレームには、1601サンプルあるいは1602サンプルが入る。1601サンプルの2フレームと1602サンプルの3フレームとが組み合わされ、5フレームを周期として、1601サンプルのフレームと1602サンプルのフレームとが繰り返されることが予想される。Unlockモードでは、上述のAFSIZEに基づき、フレーム毎のオーディオデータのサンプル数を求める。
【0012】
一方、Lockedモードでは、ビデオフレームとの同期を取るために、1フレーム当たりのディジタルオーディオデータのサンプル数が固定的に決められている。すなわち、Lockedモードでは、1フレーム当たりのオーディオデータのサンプル数は、1600サンプルまたは1602サンプルである。Lockedモードでは、1600サンプルの1フレームと、1602サンプルの4フレームとが組み合わされる。また、これらの1600および1602サンプルのフレームの並び方も、固定的とされる。
【0013】
このように、オーディオデータは、フレーム毎にサンプル数が異なる。そのため、特にアナログ処理において、ビデオフレームとオーディオデータとを対応させるために、フレーム毎にオーディオデータのサンプリング周波数を変えてやる必要がある。そのためには、上述したAFSIZEデータが用いられる。AFSIZEデータに基づき、オーディオデータのサンプリング周波数を生成するPLL(Phase Locked Loop) の動作を制御することで、フレーム毎に異なるサンプリング周波数を得る。図17は、従来の技術による、AFSIZEデータを用いたPLL回路100の構成の一例を示す。
【0014】
図17に示されるPLL回路100において、基準フレーム信号が端子110を介して位相比較器112の一方の入力端に供給される。AFSIZEデータが端子111を介して、フレームカウンタ116の一方の入力端に供給される。フレームカウンタ116では、VCO(電圧制御発振器)114から出力された信号がカウントされ、AFSIZEデータ分カウントしたところでフレーム信号が出力される。このようにして帰還フレームが再生される。このフレーム信号が位相比較器112の他方の入力端に供給される。
【0015】
位相比較器112において、基準フレーム信号とカウンタ116から供給されるフレーム信号とが比較され、位相誤差データが出力される。位相誤差データがローパスフィルタ113を介してVCO114に供給される。VCO114では、位相誤差を打ち消すような周波数の信号が出力される。この信号がフレームカウンタ116に供給される。また、VCO114の出力は、1/n分周器115にも供給され、分周比nで分周されることにより、所定のサンプリング周波数を有するオーディオ信号のサンプリングクロックとされ、出力端117に導出される。
【0016】
このような構成とすることによって、位相比較器112では、基準フレーム信号とフレームカウンタ116においてAFSIZEデータに応じて出力されたフレーム信号とが比較されるため、AFSIZEデータに応じたオーディオサンプリングクロックを、フレーム毎に得ることができる。
【0017】
【発明が解決しようとする課題】
Lockedモードは、オーディオサンプリングクロックの安定した供給がその目的の一つとされる。しかしながら、Lockedモードにおいて、上述した従来技術による方法によってサンプリングクロックを得ようとした場合、所定フレーム周期で位相エラーが発生してしまうという問題点があった。例えば、サンプリング周波数が48kHzのモードでは、5フレーム周期で、また、32kHzのモードでは、15フレーム周期で、AFSIZEデータについて2サンプル分の位相エラーが発生してしまう。
【0018】
また、Unlockモードでは、標準的な設定では、5フレーム周期で1602サンプル,1601サンプル,1602サンプル,1601サンプル,1602サンプルの繰り返しが予想される。これに対して、Lockedモードでは、5フレーム周期での、1600サンプル,1602サンプル×4の繰り返しである。これで明らかなように、PLLの位相エラーについて考えた場合、LockedモードがUnlockモードに対して有利であるとは言い難いという問題点があった。
【0019】
さらに、Lockedモードにおいて、サンプリングクロックの安定供給を行なうために、AFSIZEサイズデータを用いないような、Unlockモードとは異なった方法でPLLを行なうことが考えられる。しかしながら、この場合には、2種類のPLL回路を用意したり、また、1種類のPLL回路でも一部の動作設定を切り替えるような構成が必要となり、コストや回路規模などの点で不利になるという問題点があった。
【0020】
さらにまた、この従来技術による方法では、フレーム毎に、あるいは数フレームに1フレームだけ、オーディオサンプリングクロックが異なってしまうことにより、例えばPLLの追従能力の限界などにより、得られるサンプリングクロックにジッタが含まれるといった問題点があった。
【0021】
したがって、この発明の目的は、同一の回路構成で以て、LockedモードおよびUnlockモードの双方で、オーディオサンプリングクロックを安定に供給できるようなディジタルオーディオ信号の処理装置および処理方法を提供することにある。
【0022】
【課題を解決するための手段】
この発明は、上述した課題を解決するために、ビデオフレームと関連してディジタルオーディオ信号を扱うようにされたディジタルオーディオ信号の処理装置において、各ビデオフレームのディジタルオーディオ信号のサンプル数を示す制御情報を抽出する抽出手段と、制御情報により示される、連続する複数のビデオフレームのサンプル数の平均値を求める平均化手段と、平均化手段によって求められた平均値に基づき生成されるフレーム信号と基準フレーム信号とを比較して位相誤差データを形成し、位相誤差データに基づきディジタルオーディオ信号を処理するためのクロックを生成するクロック生成手段とを有することを特徴とするディジタルオーディオ信号の処理装置である。
【0023】
また、この発明は、上述した課題を解決するために、ビデオフレームと関連してディジタルオーディオ信号を扱うようにされたディジタルオーディオ信号の処理方法において、各ビデオフレームのディジタルオーディオ信号のサンプル数を示す制御情報を抽出する抽出のステップと、制御情報により示される、連続する複数のビデオフレームのサンプル数の平均値を求める平均化のステップと、平均化のステップによって求められた平均値に基づき生成されるフレーム信号と基準フレーム信号とを比較して位相誤差データを形成し、位相誤差データに基づきディジタルオーディオ信号を処理するためのクロックを生成するクロック生成のステップとを有することを特徴とするディジタルオーディオ信号の処理方法である。
【0024】
上述したように、この発明は、複数のビデオフレームにおけるディジタルオーディオ信号のサンプル数の平均値を求め、この平均値と基準フレーム信号とを比較することによってディジタルオーディオ信号を処理するためのクロックを生成するようにされているため、ディジタルオーディオ信号のサンプル数がビデオフレーム間で標準値近傍の変動を有していても、安定したクロックを生成することができる。
【0025】
【発明の実施の形態】
以下、この発明の実施の一形態を、図面を参照しながら説明する。この発明では、連続する5フレームについて、順次オーディオデータのサンプル数の平均化を行い、平均化の結果に基づきオーディオサンプリングクロックを生成する。最初に、この発明を適用できる磁気再生装置の具体的な一例として、回転ヘッド型のディジタルVTR(ビデオテープレコーダ)について説明する。図1に示すように、テープ上に斜めにトラックが形成される。T0、T1は、トラックナンバーを示し、隣接するトラック間のアジマスが相違する傾斜アジマス記録がなされる。図2は、1本のトラックを示す。トラック入口側には、ITI(Insert and Track Information)なるアフレコを確実に行うためのタイミングブロックが設けられる。これは、それ以降のエリアに書かれたデータをアフレコして書き直す場合に、そのエリアの位置決めを正確にするために設けられるものである。
【0026】
この例では、コンポジットディジタルカラービデオ信号が輝度信号Y、色差信号CR およびCB からなるコンポーネント信号に変換され、コンポーネント信号がDCT変換と可変長符号により圧縮され、回転ヘッドにより磁気テープに記録される。記録方式としては、SD方式(525ライン/60Hz、625ライン/50Hz)とHD方式(1125ライン/60Hz、1250ライン/50Hz)とが設定できる。
【0027】
1フレーム当たりのトラック数は、SD方式の場合には、525ライン/60Hzでは図3に示されるように10トラックとされ、625ライン/50Hzでは図4に示されるように12トラックとされる。図示しないが、HD方式の場合には、1フレーム当たりのトラック数がSD方式の倍、つまり、20トラック(1125ライン/60Hzの場合)、または24トラック(1250ライン/50Hzの場合)である。オーディオサンプリング周波数が44.1kHzおよび48kHzの場合では、前半の5トラック(6トラック)にLチャンネルのオーディオデータが記録され、その後半の5トラック(6トラック)にRチャンネルのオーディオデータが記録される。
【0028】
図2のトラックフォーマットに示すように、ITIエリアの後に、ヘッドの走査順に、オーディオデータ、ビデオデータおよびサブコードデータが記録される。ビデオデータおよびオーディオデータを記録するエリアには、それぞれに付加情報を記録するための補助的データ(AUX)を書込むエリアが設けられる。AUXには、記録日時や記録時間などオーディオ、ビデオデータ以外のデータを書込むことができる。サブコードデータ、AUX、カセットに内蔵した半導体メモリに記録するデータは、形式を共通とされている。この形式は、パック構造と称される。パックとは、データグルーブの最小単位のことである。
【0029】
図5Aに示すように、一つのパックは、5バイト(PC0〜PC4)から構成される。先頭の1バイト(PC0)がヘッダであり、残りの4バイトがデータである。ヘッダの1バイトは、上位4ビットと下位の4ビットに分かれ、上位4ビットの上位ヘッダと下位4ビットの下位ヘッダとからなる階層構造を形成する。図5Bは、ヘッダバイトPC0が(01010000)とされるオーディオAUXソースパックを示す。このパック内のデータ、例えばバイトPC1内のデータは、次に記すように規定される。
【0030】
LF(1ビット):ビデオサンプリング周波数とオーディオサンプリング周波数とがロックしているかどうかの指示
AFSIZE(6ビット):1ビデオフレーム内のオーディオフレームの大きさ(オーディオサンプル数)の指示
この発明では、このAFSIZEが関連している。
【0031】
ビデオフレーム周波数は、NTSCによる(525/60)方式の場合では、29.97Hzである。一方、オーディオのサンプリング周波数が例えば48kHzの場合では、ビデオフレーム内のオーディオサンプル数が整数とならず、略1601.6となる。そこで、従来技術で上述したように、各ビデオフレームに対して、この数に近い整数のオーディオサンプル数を配分し、平均的なオーディオサンプル数が上述の数に一致するようになされる。
【0032】
Unlockモードの場合のAFSIZE(例えば525/60方式の場合)は、図5Cに示すように規定されている。この図5Cから分かるように、例えばサンプリング周波数が48kHzの場合では、1ビデオフレーム当りのオーディオサンプル数として1580〜1620の範囲内の数をとりうる。そのトラック(フレーム)に記録されているオーディオサンプル数がAFSIZEによって指示される。
【0033】
なお、従来技術で上述したように、Unlockモードでは、1601サンプル×2フレームおよび1602サンプル×3フレームの組み合わせが標準的な設定とされる。また、Lockedモードでは1600サンプル×1フレームおよび1602サンプル×4フレームの組み合わせが規定される。
【0034】
オーディオデータ、ビデオデータ、サブコードがそれぞれ記録されるエリアは、それぞれオーディオセクタ、ビデオセクタ、サブコードセクタと呼ばれる。これらのセクタ間には、データを記録していないギャップG1、G2、G3が配される。オーディオセクタは、プリアンブル(プリシンクブロック)PR1、データ部(14シンクブロック)およびポストアンブルPO1(ポストシンクブロッ)からなる。
【0035】
オーディオシンクブロックは、図6のように、90バイトで構成される。前半の5バイトは、シンクおよびIDデータである。オーディオデータ(72バイト)およびオーディオAUX(AAUX)(5バイト)が1シンクブロックに含まれる。このデータが積符号によってエラー訂正符号化される。すなわち、水平方向に整列する77バイトに対して内符号(C1符号と称される)の符号化がなされる。具体的には、(85,77)リード・ソロモン符号がC1符号として使用され、8バイトのC1(内符号)パリティが付加される。C1符号の系列の方向がデータの記録/再生方向である。また、垂直方向に並ぶ9バイトのデータに対して、外符号(C2符号と称される)のエラー訂正符号化がなされる。具体的には、(14,9)リード・ソロモン符号がC2符号として使用され、5バイトのC2(外符号)パリティが付加される。
【0036】
ビデオセクタは、プリアンブル(プリシンクブロック)PR2、データ部(149シンクブロック)およびポストアンブルPO2(ポストシンクブロッ)からなる。図7は、ビデオセクタの構成を示す。プリアンブルおよびポストアンブルの構成は、図6に示されるオーディオセクタと同様である。ビデオセクタ内に149個含まれるビデオシンクブロックは、オーディオシンクブロックと同様に90バイトで1シンクブロックが構成される。
【0037】
シンクブロックの先頭の5バイトは、シンクおよびIDである。データ部は77バイトで、オーディオデータと同様の積符号のエラー訂正符号化がなされ。具体的には、(85,77)リード・ソロモン符号がC1符号として使用され、また、(149,138)リード・ソロモン符号がC2符号として使用される。そして、C1(内符号)パリティ(8バイト)とC2(外符号)パリティ(11バイト)がそれぞれ付加されている。シンクブロック番号19および20の2シンクブロックと、C2パリティの直前の1シンクブロックはビデオAUX(VAUX)専用のシンクで、77バイトのデータはVAUXデータとして用いられる。VAUXおよびC2パリティ以外の中央部の135シンクブロックは、圧縮されたビデオ信号のビデオデータが格納されるエリアである。
【0038】
さらに、図8は、サブコードセクタの構成を示す。サブコードセクタのプリアンブル、ポストアンブルには、オーディオセクタやビデオセクタと異なりプリシンクおよびポストシンクが存在しない。サブコードシンクブロックは、12バイトの長さであり、その前半の5バイトは、シンクおよびIDである。続く5バイトはデータ部で、データ部に対しては、C1符号の符号化のみがなされる。そして、C1パリティ(2バイト)が付加される。このように、積符号構成は、サブコードでは、採用されていない。これは、サブコードが主として高速サーチ用のものであり、C2パリティを再生できることが少ないからである。また、200倍程度まで高速サーチするために、シンク長も12バイトと短くしてある。サブコードシンクブロックは、1トラック当り12シンクブロックある。
【0039】
図9は、上述したディジタルVTRにこの発明を適用した場合の再生系の構成を示す。図示しないが、このディジタルVTRは、マイクロプロセッサなどによるCPUで制御されるものである。磁気テープ(カセットテープ)1から磁気ヘッド(回転ヘッド)2により再生された信号が再生信号処理回路3に供給される。再生信号処理回路3は、再生アンプ、再生等化器等で構成されている。再生信号処理回路3からの再生データがC1デコーダ4に供給される。C1デコーダ4は、C1符号のエラー訂正を行う。上述したC1符号の場合、例えばシンクブロック内の3シンボルまでのエラーを訂正する。
【0040】
C1デコーダ4の出力がTBC(時間軸補償器)5に供給される。TBC5は、メモリを有し、再生信号中に含まれる時間軸変動を除去する。TBC5の出力データがフレームメモリ5に供給される。フレームメモリ5によって、データの順序がC2符号の順序へ変換され、次段のC2デコーダ7において、C2復号がなされる。一例として、C2復号では、C1符号でエラー訂正できなかった所定数までのエラーシンボルをイレージャ訂正によって訂正する。
【0041】
C2デコーダ7の出力データがデシャフリングおよび補間処理回路8に供給される。デシャフリングは、記録処理においてなされているシャフリング(データの配列、順序の並び替え)を元の配列、順序に戻す処理である。補間処理は、C1符号およびC2符号によって訂正できなかったエラーを修整する処理である。ビデオデータの場合では、例えば1フレーム前の正しいデータによってエラーデータが修整される。また、デシャフリングおよび補間処理回路8は、メモリ9a、9bと入力切り換えスイッチ10と出力切り換えスイッチ11とからなる2バンク構成とされ、連続的に再生されたデータを処理して、連続的に出力することが可能とされている。デシャフリングおよび補間処理回路8から出力されるビデオ信号は、後段のビデオ信号処理系へ供給される。
【0042】
また、再生オーディオ信号がスイッチング回路12に供給され、チャンネル毎に分離されたオーディオデータが形成される。Lチャンネルのオーディオデータがオーディオ信号処理回路13aに供給され、Rチャンネルのオーディオデータがオーディオ信号処理回路13bに供給される。これらオーディオ信号処理回路13a、13bは、デシャフリング、時間軸伸長、AAUX(オーディオAUX)の分離等の処理を行う。分離されたAAUXから上述したAFSIZEが抽出される。これらの処理のために、各信号処理回路には、1フレーム分の再生オーディオデータを記憶できるメモリが設けられており、このメモリの読出しアドレスがAFSIZEに基づいて生成される。
【0043】
オーディオ信号処理回路13aからのLチャンネルのデータがD/A変換器14aに供給され、D/A変換器14aからアナログのLチャンネルのオーディオ信号が出力される。同様に、オーディオ信号処理回路13bからのRチャンネルのデータがD/A変換器14bに供給され、D/A変換器14bからアナログのRチャンネルのオーディオ信号が出力される。
【0044】
オーディオ信号処理回路13aおよび13b,D/A変換器14aおよび14bで用いられる、オーディオ処理のためのオーディオサンプリングクロックは、PLL回路15によって生成される。オーディオ信号処理回路13aでAAUXから抽出されたAFSIZEがPLL回路15の一方の入力端に供給される。タイミング信号発生回路16において、ビデオ信号処理系で用いられる基準フレーム信号が発生される。この基準フレーム信号がPLL回路15の他方の入力端に供給される。PLL回路15では、これらAFSIZEおよび基準フレーム信号とに基づき、上述のオーディオサンプリングクロックを生成する。
【0045】
図10は、この実施の一形態におけるPLL回路15の構成の一例を示す。AFSIZEが端子20に対して供給される。基準フレーム信号が端子21に対して供給される。基準フレーム信号は、帰還フレームカウンタ22に対してリセット信号として供給されると共に、演算処理回路23および位相比較器24のそれぞれの一方の入力端に供給される。AFSIZEは、帰還フレームカウンタ22および演算処理回路23のそれぞれの一方の入力端に対して供給される。
【0046】
演算処理回路23には、後述する1/m分周器27からオーディオサンプリング周波数より高い周波数のクロックが動作クロックとして供給される。この動作クロックは、例えばオーディオサンプリング周波数の10倍の周波数を有する。すなわち、オーディオサンプリング周波数が48kHzであれば、480kHzの周波数を有する。勿論、オーディオサンプリング周波数の256倍といった、さらに高い周波数のクロックとしてもよい。これにより、演算処理回路23において、より高い分解能力が実現される。
【0047】
図11は、演算処理回路23の構成の一例をさらに詳細に示す。演算処理回路23では、5フレーム分のAFSIZEの平均値が求められる。すなわち、基準フレーム信号のタイミングで遅延される遅延素子を4個用い、AFSIZEを順次遅延させ、入力AFSIZEおよび遅延させたそれぞれのAFSIZEを加算ならびに除算して、平均値を求める。
【0048】
この例では、遅延素子として、端子Dに供給された信号を、端子Enに供給される信号のタイミングで端子Qに出力するようなレジスタ42a〜42dが用いられる。端子41から供給されたAFSIZEがレジスタ42aに供給され、端子40から各レジスタ42a〜42dの端子Enに対して供給された基準フレーム信号により、順次レジスタ42b,42c,42dへと送られる。このようにして得られた5フレーム分のAFSIZEが加算器43で加算され、除算器44で除算されることにより、5フレーム分のAFSIZEの平均値が算出される。このAFSIZEの平均値は、スイッチ回路45を介して帰還フレームカウンタ46に供給される。
【0049】
こうして求められるAFSIZEの平均値は、例えば次のようになる。Lockedモードの場合、図12Aに示されるように5フレーム周期で1600サンプルのフレームが到来し、平均化処理を行なうと、
(1600+1602×4)/5=1601.6サンプル
となる。すなわち、0.6サンプルの端数が生じる。
【0050】
一方、Unlockモードの場合、図12Bに示されるように、5フレーム周期で、1602サンプルの3フレームと1601サンプルの2フレームとが混在して到来することが予想される。平均化処理を行なうと、
(1601×2+1602×3)/5=1601.6サンプル
となり、0.6サンプルの端数が生じる。
【0051】
上述したように、この例に示される演算処理回路23は、オーディオサンプリング周波数の10倍の周波数を有する高速なクロックで動作している。すなわち、1/m分周器27から端子49を介して、この高速なクロックが供給される。このクロックに基づき、帰還フレームカウンタ46は、この例では、AFSIZEの小数点第1位以下の分解能でカウントを行なうことが可能である。したがって、帰還フレームカウンタ46は、AFSIZEの平均化の際に端数として生じた0.6サンプルをカウントすることができる。
【0052】
このようにして、帰還フレームカウンタ46では、高速なクロックに基づきカウントを行ない、AFSIZEの平均値に達すると、フレーム信号を出力する。このフレーム信号は、位相比較器24の他方の入力端に供給される。演算処理回路23では、このようにして、5フレーム周期でオーディオサンプル数の端数の正規化を行なっている。
【0053】
位相比較器24において、一方の入力端に供給された基準フレーム信号と、他方の入力端に供給されたフレーム信号とが比較され、位相誤差データが出力される。この位相誤差データは、ローパスフィルタ25を介してVCO26に供給される。VCO26では、この位相誤差データを打ち消すような周波数の信号を出力する。この信号は、上述の1/m分周器27および1/n分周器28に共に供給される。
【0054】
1/m分周器27では、上述したように、オーディオサンプリング周波数の10倍以上の周波数を有するクロックが得られるように、分周比mが選ばれる。1/m分周器27の出力が演算処理回路23に動作クロックとして供給される。また、1/n分周器28では、分周出力としてオーディオサンプリング周波数を有するクロックが得られるように分周比nが選ばれる。1/n分周器28の分周出力が端子29に対して供給され、オーディオサンプリングクロックとして出力される。また、それと共に、1/n分周器28の出力が帰還フレームカウンタ22の他方の入力端に対して供給される。
【0055】
帰還フレームカウンタ22では、1/n分周器28の分周出力に基づき、ビデオフレーム毎のAFSIZEまでのカウントがなされる。カウントは、基準フレーム信号によってリセットされる。このカウントによって、帰還フレームカウンタ22から、オーディオ処理のための動作フレーム信号が出力される。このオーディオ動作フレーム信号は、端子31を介して外部に出力され、図9では省略されているが、オーディオ信号処理回路13aおよび13b,D/A変換器14aおよび14bに供給される。
【0056】
なお、上述の構成では、急激な変位、例えば動作モードがオーディオサンプル周波数が48kHzのモードから32kHzのモードへと変化したような場合、クロックの追従が非常に遅くなってしまう。そこで、このような場合には、演算処理回路23のスイッチ回路45において端子45bを選択する。こうすることによって、高速な動作への対応が可能とされる。
【0057】
図13は、5フレーム周期の処理を行なった場合の、1ビデオフレーム当たりのオーディオサンプル数の標準偏差を示す。AFSIZE入力パターンAは、Lockedモードに対応し、パターンBは、Unlockモードに対応する。この図で明らかなように、この発明による、5フレームでの平均化処理を行なった場合には、標準偏差の値が0となり、フレーム毎に処理を行なうよりも安定したクロックの供給がなされることがわかる。また、図14は、フレーム毎に処理を行なった場合の、標準近傍のAFSIZEの、標準値(1601.16)に対するオフセットを示す。フレーム毎の処理では、常にこの図14に示されるようなオフセットが含まれることになる。
【0058】
上述では、この発明がビデオがNTSC方式であって、オーディオサンプリング周波数が48kHzである場合に適用されるように説明したが、これはこの例に限定されるものではない。ビデオがNTSC方式で、オーディオサンプリング周波数が32kHzの例にも適用可能なものである。
【0059】
従来技術で既に説明したように、32kHzモードでは、1フレーム当たりのオーディオサンプリング数は、1067.734サンプルとされる。そこで、32kHzモードでは、Lockedモードで以て15フレーム周期で、端数の正規化を行なっている。図15に示されるように、1066サンプルの3フレームと、1068サンプルの12フレームとが組み合わされる。すなわち、
(1066〔サンプル〕×3+1068〔サンプル〕×12)×2=32028〔サンプル〕
となる。5フレームの周期内で、1066サンプルのフレームが6フレームおきに入れられる。
【0060】
15フレーム周期で波数の正規化を行なおうとする場合、本来であれば、基準フレーム信号のタイミングで遅延される遅延素子を14個用意し、15フレームでの演算を行なう必要がある。図16は、32kHzモードで、5,7,8,および15の各フレーム周期で処理を行なった場合について、1ビデオフレーム当たりのオーディオサンプル数の標準偏差を示す。この図16に示されるように、遅延素子の数を減らし、7および8フレーム周期を設定した場合でも、フレーム毎に処理を行なう例に比べて格段に安定したクロックを供給することができる。
【0061】
さらに遅延素子を減らし、5フレーム周期に設定した場合でも、フレーム毎の処理に比べ、非常に好適な結果が得られるこの場合には、上述の48kHzの場合と、回路を共通化できることは言うまでもない。
【0062】
また、遅延素子の構成をこれらの何れに設定する場合でも、LockedモードをUnlockモードとで同一の処理を行なうことができる。
【0063】
なお、上述では、この発明がディジタルVTRに適用された例について説明したが、これはこの例に限定されるものではない。例えば、MD(Mini Disc) やDVD(Digital Versatile Disc)、ハードディスクといったディスク記録媒体からビデオ信号を再生するような場合にも、この発明を適用することができる。
【0064】
【発明の効果】
以上説明したように、この発明によれば、複数フレームのAFSIZEを平均化し、平均化されたAFSIZEを用いてPLL処理を行なっているため、帰還フレームの安定化が図られ、オーディオサンプリングクロックを安定的に供給することができるという効果がある。
【0065】
また、この発明では、AFSIZEの複数フレームでの平均化により、LockedモードおよびUnlockモードとを考慮しなくても、同一構成で再生オーディオデータの処理を行なうことができるという効果がある。
【図面の簡単な説明】
【図1】この発明を適用することができるディジタルVTRの一例のトラックパターンを示す略線図である。
【図2】1トラックのデータ配列を説明するための略線図である。
【図3】ディジタルVTRの一例のトラックパターンを示す略線図である。
【図4】ディジタルVTRの一例のトラックパターンを示す略線図である。
【図5】データのパック構造の説明に用いる略線図である。
【図6】オーディオセクタのデータ構造の一例を示す略線図である。
【図7】ビデオセクタのデータ構造の一例を示す略線図である。
【図8】サブコードセクタのデータ構造の一例を示す略線図である。
【図9】この発明の一実施例のブロック図である。
【図10】この実施の一形態におけるPLL回路の構成の一例を示すブロック図である。
【図11】演算処理回路の構成の一例を示すブロック図である。
【図12】48kHzモードのフレーム構成を説明するための図である。
【図13】5フレーム周期の処理を行なった場合の、1ビデオフレーム当たりのオーディオサンプル数の標準偏差を示す略線図である。
【図14】AFSIZEの、標準値(1601.16)に対するオフセットを示す略線図である。
【図15】32kHzモードのフレーム構成を説明するための図である。
【図16】32kHzモードで、5,7,8,および15の各フレーム周期で処理を行なった場合の1ビデオフレーム当たりのオーディオサンプル数の標準偏差を示す略線図である。
【図17】従来技術によるPLL回路の構成の一例を示すブロック図である。
【符号の説明】
13a,13b・・・オーディオ信号処理回路、14a,14b・・・D/A変換器、15・・・PLL回路、22・・・帰還フレームカウンタ、23・・・演算処理回路、24・・・位相比較器、25・・・ローパスフィルタ、26・・・VCO、27・・・1/m分周器、28・・・1/n分周器、42a〜42d・・・遅延素子として用いられるレジスタ、43・・・加算器、44・・・除算器、46・・・帰還フレームカウンタ
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a digital audio signal processing apparatus and processing method in, for example, a digital video playback apparatus.
[0002]
[Prior art]
In recent years, digital video tape recorders that record / reproduce digitized video signals have appeared. In such a digital video tape recorder, a signal obtained by adding an error correction code to a digitized video signal is recorded on a magnetic tape at the time of recording. For recording on the magnetic tape, a method called inclined azimuth recording by a rotating head is used in a helical scan as in the conventional analog method. The inclined azimuth recording method is a method of recording a signal on a tape by two heads having different gap extending directions.
[0003]
At the time of reproduction, a reproduction RF signal is obtained by scanning an oblique track formed on the tape with a rotary head in the same manner as at the time of recording. This reproduction RF signal is converted into reproduction data which is a digital data string via an amplifier, an equalizer, and the like. The reproduction data is also supplied to a PLL that generates a clock synchronized with the reproduction signal, and a reproduction clock is generated.
[0004]
Actually, data for one frame of the video signal is recorded over a plurality of, for example, 10 frames. Therefore, even during reproduction, the rotating head scans 10 and the rack to obtain data for one frame of the video signal.
[0005]
As a matter of course, in the digital video tape recorder, audio data is recorded together with video data. At this time, the field frequency in the video signal of the NTSC (525/60) system is 59.94 Hz. On the other hand, the sampling frequency of audio data is 48 kHz, 44.1 kHz, 32 kHz, or the like. Therefore, the period of one video frame and the sampling frequency of audio data are not in an integer ratio relationship.
[0006]
For example, when the sampling frequency is 48 kHz, the number of audio samples in one video frame is
48000Hz × (2 [field] /59.94Hz) ≒ 1601.6 samples
As a result, a fraction of 0.6 samples per frame is generated. Similarly, when the sampling frequency is 32 kHz,
32000 Hz × (2 [field] /59.94 Hz) ≈1067.734 samples
A fraction of approximately 0.734 samples per frame is generated.
[0007]
Therefore, in the audio data, the relationship between the average video frame and the sampling frequency of the audio data is defined by a combination of frames in which an integer number of samples are included. In the example of 48 kHz described above, by adjusting the number of samples in a 5-frame cycle, fractions are absorbed and processing with an integer number of samples can be performed. For example, when the sampling frequency of audio data is 48 kHz, a combination of a frame containing audio data 1600 or 1601 samples and a frame containing 1602 samples is used for one video frame.
[0008]
Of the 10 tracks on which the data for one video frame is recorded, the audio data of the left channel (L-ch) is, for example, the first 5 tracks, and the right channel (R) is the second 5 tracks. -ch) audio data is recorded. As will be described later, the audio data may have a different number of samples for each video frame, and therefore information on the number of samples of the audio data in one video frame is recorded. This is called AFSIZE, and is recorded in a predetermined area for each track on the corresponding track for each of L-ch and R-ch.
[0009]
Then, the AFSIZE is read out during reproduction, and is used as a clue to the PLL in the audio reproduction processing circuit, for example. That is, since the audio data must be in phase with the video frame, the frequency of the reproduction clock is changed by this AFSIZE.
[0010]
By the way, in the digital video format, two modes are defined for handling digital audio signals: an Unlocked mode in which processing is performed asynchronously with a video frame, and a mode called a Locked mode in which the video frame is synchronized. Yes.
[0011]
In the Unlock mode, the number of samples entering one frame is variable within a predetermined range such as 1580 samples to 1620 samples. Typically, one frame contains 1601 samples or 1602 samples. It is expected that 2 frames of 1601 samples and 3 frames of 1602 samples are combined, and a frame of 1601 samples and a frame of 1602 samples are repeated with a period of 5 frames. In the Unlock mode, the number of samples of audio data for each frame is obtained based on the above AFSIZE.
[0012]
On the other hand, in the Locked mode, the number of samples of digital audio data per frame is fixedly determined in order to synchronize with the video frame. That is, in the Locked mode, the number of audio data samples per frame is 1600 samples or 1602 samples. In the Locked mode, 1 frame of 1600 samples and 4 frames of 1602 samples are combined. The arrangement of the frames of these 1600 and 1602 samples is also fixed.
[0013]
Thus, the audio data has a different number of samples for each frame. Therefore, in particular, in analog processing, in order to associate video frames with audio data, it is necessary to change the sampling frequency of audio data for each frame. For that purpose, the above-described AFSIZE data is used. A different sampling frequency is obtained for each frame by controlling the operation of a PLL (Phase Locked Loop) that generates a sampling frequency of audio data based on the AFSIZE data. FIG. 17 shows an example of the configuration of a PLL circuit 100 using AFSIZE data according to the prior art.
[0014]
In the PLL circuit 100 shown in FIG. 17, the reference frame signal is supplied to one input terminal of the phase comparator 112 via the terminal 110. The AFSIZE data is supplied to one input terminal of the frame counter 116 via the terminal 111. In the frame counter 116, the signal output from the VCO (voltage controlled oscillator) 114 is counted, and the frame signal is output when counted by the AFSIZE data. In this way, the feedback frame is reproduced. This frame signal is supplied to the other input terminal of the phase comparator 112.
[0015]
The phase comparator 112 compares the reference frame signal with the frame signal supplied from the counter 116, and outputs phase error data. Phase error data is supplied to the VCO 114 via the low-pass filter 113. The VCO 114 outputs a signal having a frequency that cancels the phase error. This signal is supplied to the frame counter 116. The output of the VCO 114 is also supplied to the 1 / n frequency divider 115, and is divided by a frequency division ratio n to be a sampling clock for an audio signal having a predetermined sampling frequency, which is derived to the output terminal 117. Is done.
[0016]
With such a configuration, the phase comparator 112 compares the reference frame signal and the frame signal output in accordance with the AFSIZE data in the frame counter 116, so that the audio sampling clock in accordance with the AFSIZE data is It can be obtained for each frame.
[0017]
[Problems to be solved by the invention]
One of the purposes of the Locked mode is to stably supply an audio sampling clock. However, in the Locked mode, there is a problem in that a phase error occurs at a predetermined frame period when an attempt is made to obtain a sampling clock by the above-described conventional method. For example, a phase error of 2 samples occurs in the AFSIZE data in a period of 5 frames in a mode with a sampling frequency of 48 kHz and in a period of 15 frames in a mode with 32 kHz.
[0018]
In the Unlock mode, it is expected that 1602 samples, 1601 samples, 1602 samples, 1601 samples, and 1602 samples will be repeated in a period of 5 frames under standard settings. On the other hand, in the Locked mode, 1600 samples and 1602 samples × 4 are repeated in a cycle of 5 frames. As is clear from this, when the phase error of the PLL is considered, there is a problem that it is difficult to say that the Locked mode is advantageous over the Unlock mode.
[0019]
Further, in the Locked mode, in order to stably supply the sampling clock, it is conceivable to perform PLL by a method different from the Unlock mode in which the AFSIZE size data is not used. However, in this case, it is necessary to prepare two types of PLL circuits, or to switch some operation settings even with one type of PLL circuit, which is disadvantageous in terms of cost and circuit scale. There was a problem.
[0020]
Furthermore, in this prior art method, the audio sampling clock differs from frame to frame or by one frame every few frames. For example, the sampling clock obtained includes jitter due to the limit of the tracking capability of the PLL. There was a problem such as.
[0021]
SUMMARY OF THE INVENTION Accordingly, an object of the present invention is to provide a digital audio signal processing apparatus and processing method capable of stably supplying an audio sampling clock in both the Locked mode and the Unlock mode with the same circuit configuration. .
[0022]
[Means for Solving the Problems]
In order to solve the above-described problem, the present invention provides a digital audio signal processing apparatus which handles a digital audio signal in association with a video frame, and control information indicating the number of samples of the digital audio signal in each video frame. Extracting means for extracting the average value, averaging means for obtaining an average value of the number of samples of a plurality of continuous video frames indicated by the control information, and an average value obtained by the averaging means Frame signal generated based on And reference frame signal To form phase error data and based on the phase error data A digital audio signal processing apparatus comprising clock generation means for generating a clock for processing a digital audio signal.
[0023]
The present invention also provides a digital audio signal processing method for handling a digital audio signal in association with a video frame in order to solve the above-described problem, and indicates the number of samples of the digital audio signal in each video frame. An extraction step for extracting control information, an averaging step for obtaining an average value of the number of samples of a plurality of continuous video frames indicated by the control information, and an average value obtained by the averaging step Frame signal generated based on And reference frame signal To form phase error data and based on the phase error data And a clock generation step of generating a clock for processing the digital audio signal.
[0024]
As described above, the present invention obtains an average value of the number of samples of a digital audio signal in a plurality of video frames, and generates a clock for processing the digital audio signal by comparing the average value with a reference frame signal. Thus, a stable clock can be generated even if the number of samples of the digital audio signal has a fluctuation near the standard value between video frames.
[0025]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an embodiment of the present invention will be described with reference to the drawings. In the present invention, the number of samples of audio data is sequentially averaged for five consecutive frames, and an audio sampling clock is generated based on the averaged result. First, a rotating head type digital VTR (video tape recorder) will be described as a specific example of a magnetic reproducing apparatus to which the present invention can be applied. As shown in FIG. 1, tracks are formed obliquely on the tape. T0 and T1 indicate track numbers, and inclined azimuth recording is performed in which the azimuth between adjacent tracks is different. FIG. 2 shows one track. On the track entrance side, a timing block is provided for reliably performing ITI (Insert and Track Information) dubbing. This is provided in order to accurately position the area when the data written in the subsequent area is rewritten after dubbing.
[0026]
In this example, the composite digital color video signal is a luminance signal Y and a color difference signal C. R And C B The component signal is compressed by DCT conversion and variable length code, and recorded on the magnetic tape by the rotary head. As a recording method, an SD method (525 lines / 60 Hz, 625 lines / 50 Hz) and an HD method (1125 lines / 60 Hz, 1250 lines / 50 Hz) can be set.
[0027]
In the SD system, the number of tracks per frame is 10 tracks as shown in FIG. 3 at 525 lines / 60 Hz, and 12 tracks as shown in FIG. 4 at 625 lines / 50 Hz. Although not shown, in the HD system, the number of tracks per frame is twice that of the SD system, that is, 20 tracks (1125 lines / 60 Hz) or 24 tracks (1250 lines / 50 Hz). When the audio sampling frequency is 44.1 kHz and 48 kHz, L channel audio data is recorded on the first 5 tracks (6 tracks), and R channel audio data is recorded on the second 5 tracks (6 tracks). .
[0028]
As shown in the track format of FIG. 2, audio data, video data, and subcode data are recorded in the head scanning order after the ITI area. The areas for recording video data and audio data are provided with areas for writing auxiliary data (AUX) for recording additional information, respectively. In the AUX, data other than audio and video data such as recording date and time and recording time can be written. The subcode data, AUX, and data recorded in the semiconductor memory built in the cassette have a common format. This format is referred to as a pack structure. A pack is a minimum unit of a data groove.
[0029]
As shown in FIG. 5A, one pack is composed of 5 bytes (PC0 to PC4). The first 1 byte (PC0) is a header, and the remaining 4 bytes are data. One byte of the header is divided into upper 4 bits and lower 4 bits, and forms a hierarchical structure including an upper header of upper 4 bits and a lower header of lower 4 bits. FIG. 5B shows an audio AUX source pack in which the header byte PC0 is (01010000). Data in this pack, for example, data in the byte PC1, is defined as follows.
[0030]
LF (1 bit): Indication of whether the video sampling frequency and the audio sampling frequency are locked
AFSIZE (6 bits): Instruction of audio frame size (number of audio samples) in one video frame
In the present invention, this AFSIZE is related.
[0031]
The video frame frequency is 29.97 Hz in the case of the NTSC (525/60) system. On the other hand, when the audio sampling frequency is 48 kHz, for example, the number of audio samples in the video frame is not an integer, but is approximately 1601.6. Therefore, as described above in the related art, an integer number of audio samples close to this number is allocated to each video frame so that the average number of audio samples matches the above number.
[0032]
The AFSIZE in the case of the Unlock mode (for example, in the case of the 525/60 system) is defined as shown in FIG. 5C. As can be seen from FIG. 5C, for example, when the sampling frequency is 48 kHz, the number of audio samples per video frame can be in the range of 1580 to 1620. The number of audio samples recorded in the track (frame) is designated by AFSIZE.
[0033]
As described above in the prior art, in the Unlock mode, a combination of 1601 samples × 2 frames and 1602 samples × 3 frames is a standard setting. In the Locked mode, a combination of 1600 samples × 1 frame and 1602 samples × 4 frames is defined.
[0034]
The areas in which the audio data, video data, and subcode are recorded are called an audio sector, a video sector, and a subcode sector, respectively. Between these sectors, gaps G1, G2, and G3 in which no data is recorded are arranged. The audio sector includes a preamble (presync block) PR1, a data portion (14 sync blocks), and a postamble PO1 (postsync block).
[0035]
The audio sync block is composed of 90 bytes as shown in FIG. The first 5 bytes are sync and ID data. Audio data (72 bytes) and audio AUX (AAUX) (5 bytes) are included in one sync block. This data is error correction encoded by a product code. That is, inner codes (referred to as C1 codes) are encoded for 77 bytes aligned in the horizontal direction. Specifically, the (85, 77) Reed-Solomon code is used as the C1 code, and an 8-byte C1 (inner code) parity is added. The direction of the C1 code sequence is the data recording / reproducing direction. Further, error correction coding of an outer code (referred to as C2 code) is performed on 9-byte data arranged in the vertical direction. Specifically, a (14, 9) Reed-Solomon code is used as the C2 code, and a 5-byte C2 (outer code) parity is added.
[0036]
The video sector includes a preamble (presync block) PR2, a data portion (149 sync block), and a postamble PO2 (postsync block). FIG. 7 shows the configuration of the video sector. The configuration of the preamble and the postamble is the same as that of the audio sector shown in FIG. In the video sync block included in 149 video sectors, one sync block is composed of 90 bytes as in the audio sync block.
[0037]
The first 5 bytes of the sync block are a sync and an ID. The data portion is 77 bytes, and error correction encoding of the product code is performed in the same way as audio data. Specifically, the (85, 77) Reed-Solomon code is used as the C1 code, and the (149, 138) Reed-Solomon code is used as the C2 code. Then, C1 (inner code) parity (8 bytes) and C2 (outer code) parity (11 bytes) are respectively added. Two sync blocks with sync block numbers 19 and 20 and one sync block immediately before the C2 parity are dedicated to video AUX (VAUX), and 77-byte data is used as VAUX data. A central 135 sync block other than VAUX and C2 parity is an area in which video data of a compressed video signal is stored.
[0038]
Further, FIG. 8 shows the structure of the subcode sector. Unlike the audio sector and the video sector, the subcode sector preamble and postamble have no presync and postsync. The subcode sync block has a length of 12 bytes, and the first 5 bytes are a sync and an ID. The subsequent 5 bytes are the data part, and only the C1 code is encoded for the data part. Then, C1 parity (2 bytes) is added. Thus, the product code configuration is not adopted in the subcode. This is because the subcode is mainly for high-speed search, and the C2 parity can hardly be reproduced. Also, the sync length is shortened to 12 bytes for high-speed search up to about 200 times. There are 12 sub-code sync blocks per track.
[0039]
FIG. 9 shows the configuration of a reproduction system when the present invention is applied to the digital VTR described above. Although not shown, this digital VTR is controlled by a CPU such as a microprocessor. A signal reproduced from a magnetic tape (cassette tape) 1 by a magnetic head (rotating head) 2 is supplied to a reproduction signal processing circuit 3. The reproduction signal processing circuit 3 includes a reproduction amplifier, a reproduction equalizer, and the like. The reproduction data from the reproduction signal processing circuit 3 is supplied to the C1 decoder 4. The C1 decoder 4 performs error correction of the C1 code. In the case of the above-described C1 code, for example, errors up to three symbols in the sync block are corrected.
[0040]
The output of the C1 decoder 4 is supplied to a TBC (time axis compensator) 5. The TBC 5 has a memory and removes time axis fluctuations included in the reproduction signal. Output data of the TBC 5 is supplied to the frame memory 5. The frame memory 5 converts the data order into the C2 code order, and the C2 decoder 7 in the next stage performs C2 decoding. As an example, in C2 decoding, up to a predetermined number of error symbols that could not be corrected by the C1 code are corrected by erasure correction.
[0041]
Output data of the C2 decoder 7 is supplied to the deshuffling and interpolation processing circuit 8. Deshuffling is a process of returning shuffling (data arrangement, rearrangement of the order) performed in the recording process to the original arrangement and order. The interpolation process is a process for correcting an error that could not be corrected by the C1 code and the C2 code. In the case of video data, for example, error data is corrected with correct data one frame before. Further, the deshuffling and interpolation processing circuit 8 has a two-bank configuration including memories 9a and 9b, an input changeover switch 10 and an output changeover switch 11, and processes continuously reproduced data and outputs it continuously. It is possible. The video signal output from the deshuffling and interpolation processing circuit 8 is supplied to the video signal processing system at the subsequent stage.
[0042]
In addition, the reproduced audio signal is supplied to the switching circuit 12, and audio data separated for each channel is formed. The L channel audio data is supplied to the audio signal processing circuit 13a, and the R channel audio data is supplied to the audio signal processing circuit 13b. These audio signal processing circuits 13a and 13b perform processing such as deshuffling, time axis expansion, and AAUX (audio AUX) separation. The above-described AFSIZE is extracted from the separated AAUX. For these processes, each signal processing circuit is provided with a memory capable of storing reproduced audio data for one frame, and a read address of this memory is generated based on AFSIZE.
[0043]
The L channel data from the audio signal processing circuit 13a is supplied to the D / A converter 14a, and an analog L channel audio signal is output from the D / A converter 14a. Similarly, R channel data from the audio signal processing circuit 13b is supplied to the D / A converter 14b, and an analog R channel audio signal is output from the D / A converter 14b.
[0044]
An audio sampling clock for audio processing used in the audio signal processing circuits 13 a and 13 b and the D / A converters 14 a and 14 b is generated by the PLL circuit 15. AFSIZE extracted from AAUX by the audio signal processing circuit 13 a is supplied to one input terminal of the PLL circuit 15. In the timing signal generation circuit 16, a reference frame signal used in the video signal processing system is generated. This reference frame signal is supplied to the other input terminal of the PLL circuit 15. The PLL circuit 15 generates the above-described audio sampling clock based on the AFSIZE and the reference frame signal.
[0045]
FIG. 10 shows an example of the configuration of the PLL circuit 15 in this embodiment. AFSIZE is supplied to the terminal 20. A reference frame signal is supplied to the terminal 21. The reference frame signal is supplied as a reset signal to the feedback frame counter 22 and is supplied to one input terminal of each of the arithmetic processing circuit 23 and the phase comparator 24. AFSIZE is supplied to one input terminal of each of the feedback frame counter 22 and the arithmetic processing circuit 23.
[0046]
A clock having a frequency higher than the audio sampling frequency is supplied to the arithmetic processing circuit 23 as an operation clock from a 1 / m frequency divider 27 described later. This operation clock has, for example, a frequency 10 times the audio sampling frequency. That is, if the audio sampling frequency is 48 kHz, the frequency is 480 kHz. Of course, a higher frequency clock such as 256 times the audio sampling frequency may be used. As a result, higher resolution is realized in the arithmetic processing circuit 23.
[0047]
FIG. 11 shows an example of the configuration of the arithmetic processing circuit 23 in more detail. In the arithmetic processing circuit 23, an average value of AFSIZE for five frames is obtained. That is, four delay elements delayed by the timing of the reference frame signal are used, AFSIZE is sequentially delayed, and the input AFSIZE and each delayed AFSIZE are added and divided to obtain an average value.
[0048]
In this example, registers 42a to 42d that output the signal supplied to the terminal D to the terminal Q at the timing of the signal supplied to the terminal En are used as the delay elements. The AFSIZE supplied from the terminal 41 is supplied to the register 42a, and is sequentially sent to the registers 42b, 42c and 42d by the reference frame signal supplied from the terminal 40 to the terminal En of each of the registers 42a to 42d. The AFSIZE for 5 frames obtained in this way is added by the adder 43 and divided by the divider 44, whereby the average value of AFSIZE for 5 frames is calculated. The average value of the AFSIZE is supplied to the feedback frame counter 46 via the switch circuit 45.
[0049]
The average value of AFSIZE obtained in this way is, for example, as follows. In the locked mode, as shown in FIG. 12A, when a frame of 1600 samples arrives at a period of 5 frames and an averaging process is performed,
(1600 + 1602 × 4) /5=1601.6 samples
It becomes. That is, a fraction of 0.6 samples occurs.
[0050]
On the other hand, in the case of the Unlock mode, as shown in FIG. 12B, it is expected that 3 frames of 1602 samples and 2 frames of 1601 samples come together in a 5-frame cycle. When averaging is performed,
(1601 × 2 + 1602 × 3) /5=1601.6 samples
This yields a fraction of 0.6 samples.
[0051]
As described above, the arithmetic processing circuit 23 shown in this example operates with a high-speed clock having a frequency 10 times the audio sampling frequency. That is, this high-speed clock is supplied from the 1 / m frequency divider 27 via the terminal 49. Based on this clock, the feedback frame counter 46 can count with a resolution of the first decimal place of AFSIZE in this example. Therefore, the feedback frame counter 46 can count 0.6 samples generated as a fraction during the averaging of AFSIZE.
[0052]
In this way, the feedback frame counter 46 performs counting based on the high-speed clock, and outputs a frame signal when the average value of AFSIZE is reached. This frame signal is supplied to the other input terminal of the phase comparator 24. In this way, the arithmetic processing circuit 23 normalizes the fraction of the number of audio samples in a 5-frame cycle.
[0053]
In the phase comparator 24, the reference frame signal supplied to one input terminal is compared with the frame signal supplied to the other input terminal, and phase error data is output. This phase error data is supplied to the VCO 26 via the low pass filter 25. The VCO 26 outputs a signal having a frequency that cancels the phase error data. This signal is supplied to both the 1 / m frequency divider 27 and the 1 / n frequency divider 28 described above.
[0054]
In the 1 / m frequency divider 27, as described above, the frequency division ratio m is selected so that a clock having a frequency 10 times or more the audio sampling frequency can be obtained. The output of the 1 / m frequency divider 27 is supplied to the arithmetic processing circuit 23 as an operation clock. Further, in the 1 / n frequency divider 28, the frequency division ratio n is selected so that a clock having an audio sampling frequency is obtained as a frequency division output. The frequency-divided output of the 1 / n frequency divider 28 is supplied to the terminal 29 and output as an audio sampling clock. At the same time, the output of the 1 / n frequency divider 28 is supplied to the other input terminal of the feedback frame counter 22.
[0055]
The feedback frame counter 22 counts up to AFSIZE for each video frame based on the divided output of the 1 / n divider 28. The count is reset by the reference frame signal. With this count, the feedback frame counter 22 outputs an operation frame signal for audio processing. The audio operation frame signal is output to the outside via the terminal 31 and is supplied to the audio signal processing circuits 13a and 13b and the D / A converters 14a and 14b, which are omitted in FIG.
[0056]
In the above-described configuration, the clock tracking becomes very slow when the abrupt displacement, for example, the operation mode is changed from the mode with the audio sample frequency of 48 kHz to the mode of 32 kHz. Therefore, in such a case, the terminal 45b is selected in the switch circuit 45 of the arithmetic processing circuit 23. By doing so, it is possible to cope with high-speed operation.
[0057]
FIG. 13 shows the standard deviation of the number of audio samples per video frame when processing is performed for a period of 5 frames. The AFSIZE input pattern A corresponds to the Locked mode, and the pattern B corresponds to the Unlock mode. As is apparent from this figure, when the averaging process is performed in 5 frames according to the present invention, the standard deviation value is 0, and a more stable clock is supplied than when the process is performed for each frame. I understand that. FIG. 14 shows an offset with respect to the standard value (1601.16) of AFSIZE near the standard when processing is performed for each frame. In the processing for each frame, an offset as shown in FIG. 14 is always included.
[0058]
In the above description, the present invention has been described as being applied when the video is NTSC and the audio sampling frequency is 48 kHz. However, the present invention is not limited to this example. The present invention can also be applied to an example in which the video is NTSC and the audio sampling frequency is 32 kHz.
[0059]
As already described in the prior art, in the 32 kHz mode, the number of audio samples per frame is 1067.734 samples. Therefore, in the 32 kHz mode, fractional normalization is performed at a period of 15 frames in the Locked mode. As shown in FIG. 15, 3 frames of 1066 samples and 12 frames of 1068 samples are combined. That is,
(1066 [sample] × 3 + 1068 [sample] × 12) × 2 = 32028 [sample]
It becomes. Within a period of 5 frames, 1066 sample frames are inserted every 6 frames.
[0060]
When attempting to normalize the wave number with a period of 15 frames, it is originally necessary to prepare 14 delay elements that are delayed at the timing of the reference frame signal and perform calculations in 15 frames. FIG. 16 shows the standard deviation of the number of audio samples per video frame when processing is performed in each frame period of 5, 7, 8, and 15 in the 32 kHz mode. As shown in FIG. 16, even when the number of delay elements is reduced and 7 and 8 frame periods are set, a much more stable clock can be supplied as compared with the example in which processing is performed for each frame.
[0061]
Furthermore, even when the number of delay elements is reduced and the period is set to 5 frames, a very favorable result can be obtained as compared with the processing for each frame. .
[0062]
In addition, when the delay element configuration is set to any one of these, the same processing can be performed in the Locked mode and the Unlock mode.
[0063]
In the above description, an example in which the present invention is applied to a digital VTR has been described. However, the present invention is not limited to this example. For example, the present invention can be applied to a case where a video signal is reproduced from a disk recording medium such as an MD (Mini Disc), a DVD (Digital Versatile Disc), or a hard disk.
[0064]
【The invention's effect】
As described above, according to the present invention, since the AFSIZE of a plurality of frames is averaged and the PLL processing is performed using the averaged AFSIZE, the feedback frame is stabilized and the audio sampling clock is stabilized. There is an effect that it can be supplied.
[0065]
In addition, according to the present invention, it is possible to process the reproduced audio data with the same configuration without considering the Locked mode and the Unlock mode by averaging the AFSIZE in a plurality of frames.
[Brief description of the drawings]
FIG. 1 is a schematic diagram showing a track pattern of an example of a digital VTR to which the present invention can be applied.
FIG. 2 is a schematic diagram for explaining the data arrangement of one track.
FIG. 3 is a schematic diagram showing a track pattern of an example of a digital VTR.
FIG. 4 is a schematic diagram showing a track pattern of an example of a digital VTR.
FIG. 5 is a schematic diagram used for explaining a data pack structure;
FIG. 6 is a schematic diagram illustrating an example of a data structure of an audio sector.
FIG. 7 is a schematic diagram illustrating an example of a data structure of a video sector.
FIG. 8 is a schematic diagram illustrating an example of a data structure of a subcode sector.
FIG. 9 is a block diagram of one embodiment of the present invention.
FIG. 10 is a block diagram illustrating an example of a configuration of a PLL circuit according to the embodiment.
FIG. 11 is a block diagram illustrating an example of a configuration of an arithmetic processing circuit.
FIG. 12 is a diagram for explaining a frame configuration in a 48 kHz mode;
FIG. 13 is a schematic diagram illustrating a standard deviation of the number of audio samples per video frame when processing is performed in a 5-frame cycle.
FIG. 14 is a schematic diagram illustrating an offset of an AFSIZE with respect to a standard value (1601.16).
FIG. 15 is a diagram for explaining a frame configuration in a 32 kHz mode;
FIG. 16 is a schematic diagram illustrating the standard deviation of the number of audio samples per video frame when processing is performed in each frame period of 5, 7, 8, and 15 in the 32 kHz mode.
FIG. 17 is a block diagram showing an example of a configuration of a PLL circuit according to a conventional technique.
[Explanation of symbols]
13a, 13b ... audio signal processing circuit, 14a, 14b ... D / A converter, 15 ... PLL circuit, 22 ... feedback frame counter, 23 ... arithmetic processing circuit, 24 ... Phase comparator, 25... Low-pass filter, 26... VCO, 27... 1 / m frequency divider, 28... 1 / n frequency divider, 42 a to 42 d. Register, 43 ... adder, 44 ... divider, 46 ... feedback frame counter

Claims (3)

ビデオフレームと関連してディジタルオーディオ信号を扱うようにされたディジタルオーディオ信号の処理装置において、
各ビデオフレームのディジタルオーディオ信号のサンプル数を示す制御情報を抽出する抽出手段と、
上記制御情報により示される、連続する複数の上記ビデオフレームの上記サンプル数の平均値を求める平均化手段と、
上記平均化手段によって求められた上記平均値に基づき生成されるフレーム信号と基準フレーム信号とを比較して位相誤差データを形成し、該位相誤差データに基づき上記ディジタルオーディオ信号を処理するためのクロックを生成するクロック生成手段と
を有する
ことを特徴とするディジタルオーディオ信号の処理装置。
In a digital audio signal processing apparatus adapted to handle a digital audio signal in association with a video frame,
Extraction means for extracting control information indicating the number of samples of the digital audio signal of each video frame;
Averaging means for obtaining an average value of the number of samples of the plurality of consecutive video frames indicated by the control information;
A clock for processing the digital audio signal based on the phase error data by comparing the frame signal generated based on the average value obtained by the averaging means and the reference frame signal to form phase error data And a clock generation means for generating a digital audio signal processing apparatus.
請求項1に記載のディジタルオーディオ信号の処理装置において、
上記クロック生成手段は、
上記ディジタルオーディオ信号のサンプリング周波数より高い周波数のクロックを生成する分周手段と、
上記基準フレーム信号によりリセットされ、上記クロックをカウントしてカウント値が上記平均値に達したら上記フレーム信号を出力するカウント手段と、
上記フレーム信号と上記基準フレーム信号とを比較して上記位相誤差データを出力する位相比較手段と、
上記位相比較手段の出力を制御信号として供給される可変周波数発振手段と
からなるPLLである
ことを特徴とするディジタルオーディオ信号の処理装置。
The digital audio signal processing apparatus according to claim 1,
The clock generation means includes
Frequency dividing means for generating a clock having a frequency higher than the sampling frequency of the digital audio signal;
Counting means that is reset by the reference frame signal, counts the clock, and outputs the frame signal when the count value reaches the average value;
Phase comparison means for comparing the frame signal with the reference frame signal and outputting the phase error data;
An apparatus for processing a digital audio signal, characterized in that it is a PLL comprising variable frequency oscillating means supplied with the output of the phase comparing means as a control signal.
ビデオフレームと関連してディジタルオーディオ信号を扱うようにされたディジタルオーディオ信号の処理方法において、
各ビデオフレームのディジタルオーディオ信号のサンプル数を示す制御情報を抽出する抽出のステップと、
上記制御情報により示される、連続する複数の上記ビデオフレームの上記サンプル数の平均値を求める平均化のステップと、
上記平均化のステップによって求められた上記平均値に基づき生成されるフレーム信号と基準フレーム信号とを比較して位相誤差データを形成し、該位相誤差データに基づき上記ディジタルオーディオ信号を処理するためのクロックを生成するクロック生成のステップと
を有する
ことを特徴とするディジタルオーディオ信号の処理方法。
In a method of processing a digital audio signal adapted to handle a digital audio signal in association with a video frame,
An extraction step of extracting control information indicating the number of samples of the digital audio signal of each video frame;
An averaging step for obtaining an average value of the number of samples of the plurality of consecutive video frames indicated by the control information;
A phase error data is formed by comparing a frame signal generated based on the average value obtained by the averaging step and a reference frame signal, and the digital audio signal is processed based on the phase error data A method of processing a digital audio signal, comprising: a clock generation step of generating a clock.
JP25331897A 1997-09-18 1997-09-18 Digital audio signal processing apparatus and processing method Expired - Fee Related JP4103155B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25331897A JP4103155B2 (en) 1997-09-18 1997-09-18 Digital audio signal processing apparatus and processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25331897A JP4103155B2 (en) 1997-09-18 1997-09-18 Digital audio signal processing apparatus and processing method

Publications (2)

Publication Number Publication Date
JPH1196693A JPH1196693A (en) 1999-04-09
JP4103155B2 true JP4103155B2 (en) 2008-06-18

Family

ID=17249643

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25331897A Expired - Fee Related JP4103155B2 (en) 1997-09-18 1997-09-18 Digital audio signal processing apparatus and processing method

Country Status (1)

Country Link
JP (1) JP4103155B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7603190B2 (en) 2001-04-19 2009-10-13 Sony Corporation Digital recording/reproducing apparatus

Also Published As

Publication number Publication date
JPH1196693A (en) 1999-04-09

Similar Documents

Publication Publication Date Title
JP3237152B2 (en) Digital information signal recording device
US6085022A (en) Digital VTR for recording special replay video data in track areas designated for digital video and digital audio
JP3159041B2 (en) Digital signal recording / reproducing apparatus and reproducing apparatus
EP0209047B1 (en) Apparatus for recording and/or reproducing an information signal
US5857044A (en) Method and apparatus for processing time code
EP0086658B1 (en) Time base correcting apparatus
KR100275064B1 (en) Method and apparatus for recording time code data
JP4103155B2 (en) Digital audio signal processing apparatus and processing method
KR100630243B1 (en) Magnetic recording method and apparatus for digital signals, magnetic reproducing method and apparatus for digital signals and tape-shaped recording medium
US7062154B2 (en) Magnetic-tape recording apparatus, magnetic-tape recording method, magnetic-tape format, and recording medium
JP3344117B2 (en) Phase control method and device
JP3601128B2 (en) Digital audio signal processing apparatus and processing method
KR100423177B1 (en) Digital signal recording / reproducing apparatus and method
US5990964A (en) Method and apparatus for processing time code
US5247400A (en) Tape reproducing direction detecting apparatus for a digital VTR
US6735375B1 (en) Data recording and reproducing apparatus
US7058283B2 (en) Magnetic tape tracking control apparatus and method, magnetic tape format, recording medium and program
US20070242927A1 (en) Recording/Reproducing Apparatus, Recording/Reproducing Method and Program-Recorded Medium
JPH0973736A (en) Device and method for reproducing digital signal
JPH04305870A (en) Recording and reproducing device
JP2771155B2 (en) Recording device
JP3632352B2 (en) Digital signal recording apparatus and reproducing apparatus
JP2703935B2 (en) Video data playback device
JP3312418B2 (en) Recording device
JP3446259B2 (en) Reference timing signal generation circuit

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070206

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070328

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071023

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080304

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080317

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110404

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees