JP4103155B2 - Digital audio signal processing apparatus and processing method - Google Patents
Digital audio signal processing apparatus and processing method Download PDFInfo
- Publication number
- JP4103155B2 JP4103155B2 JP25331897A JP25331897A JP4103155B2 JP 4103155 B2 JP4103155 B2 JP 4103155B2 JP 25331897 A JP25331897 A JP 25331897A JP 25331897 A JP25331897 A JP 25331897A JP 4103155 B2 JP4103155 B2 JP 4103155B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- digital audio
- audio signal
- signal
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
【0001】
【発明の属する技術分野】
この発明は、例えばディジタルビデオ再生装置におけるディジタルオーディオ信号の処理装置および処理方法に関する。
【0002】
【従来の技術】
近年、ディジタル化されたビデオ信号を記録/再生するようなディジタルビデオテープレコーダが出現している。このようなディジタルビデオテープレコーダでは、記録時にはディジタル化されたビデオ信号に誤り訂正符号が付された信号が磁気テープに記録される。この磁気テープに対する記録は、従来のアナログ方式と同様、ヘリカルスキャンで、回転ヘッドによる傾斜アジマス記録という方式が用いられる。この傾斜アジマス記録方式とは、ギャップの延長方向が互いに異なる2つのヘッドによってテープ上に信号を記録していく方法である。
【0003】
再生時には、このテープ上に形成された斜めのトラックを記録時と同じように回転ヘッドでスキャンすることによって再生RF信号を得ている。この再生RF信号は、アンプ、イコライザなどを介してディジタルのデータ列である再生データとされる。また、この再生データは、再生信号と同期したクロックを生成するPLLにも供給され、再生クロックが生成される。
【0004】
実際には、ビデオ信号の1フレーム分のデータが複数、例えば10フレームにわたって記録される。したがって、再生時にも、回転ヘッドがこの10とラックをスキャンすることでビデオ信号1フレーム分のデータが得られる。
【0005】
当然のことながら、ディジタルビデオテープレコーダにおいては、ビデオデータと共にオーディオデータも記録される。このとき、NTSCによる(525/60)方式のビデオ信号におけるフィールド周波数は、59.94Hzとされている。それに対して、オーディオデータのサンプリング周波数は、48kHz,44.1kHzあるいは、32kHzなどとされている。したがって、1ビデオフレームの周期とオーディオデータのサンプリング周波数とが整数比の関係にない。
【0006】
例えば、サンプリング周波数が48kHzの場合、1ビデオフレーム中のオーディオサンプル数は、
48000Hz×(2〔フィールド〕/59.94Hz)≒1601.6サンプル
とされ、1フレーム当たり0.6サンプル分の端数が生じる。同様に、サンプリング周波数が32kHzの場合、
32000Hz×(2〔フィールド〕/59.94Hz)≒1067.734サンプル
とされ、1フレーム当たり略0.734サンプル分の端数が生じる。
【0007】
そのため、オーディオデータにおいては、整数個のサンプル数が入るフレームの組み合わせによって、平均的ビデオフレームとオーディオデータのサンプリング周波数との関係が規定のものとなるようにされている。上述の48kHzの例では、5フレーム周期でサンプル数を調整することによって、端数を吸収して整数サンプル数での処理が行なえるようになる。例えば、オーディオデータのサンプリング周波数が48kHzの場合においては、1ビデオフレームに対してオーディオデータ1600あるいは1601サンプル入るフレームと、1602サンプルが入るフレームとの組み合わせが用いられる。
【0008】
オーディオデータは、上述した1ビデオフレーム分のデータが記録される10トラックのうち、例えば前半の5トラックには左チャンネル(L-ch)のオーディオデータが、後半の5トラックには右チャンネル(R-ch)のオーディオデータが記録される。後述するように、オーディオデータは、1ビデオフレーム毎に異なるサンプル数を有する場合があり、そのため、1ビデオフレーム中のオーディオデータのサンプル数の情報が記録される。これは、AFSIZEと称され、L-chおよびR-chそれぞれについて、対応するトラックにトラック毎の所定の領域に記録される。
【0009】
そして、再生時にこのAFSIZEが読み出され、例えばオーディオ再生処理回路におけるPLLの手掛かりとして用いられる。すなわち、オーディオデータは、ビデオフレームに対して位相が合っていなければならないため、このAFSIZEによって再生クロックの周波数を変えるのである。
【0010】
ところで、ディジタルビデオのフォーマットにおいて、ディジタルオーディオ信号の扱いとして、ビデオフレームと非同期で処理を行なうUnlockedモードと、ビデオフレームに対して同期を取るLockedモードと称されるモードとの2モードが規定されている。
【0011】
Unlockモードでは、1フレームに入るサンプル数が、例えば1580サンプル〜1620サンプルといった所定の範囲内で可変とされる。標準的には、1フレームには、1601サンプルあるいは1602サンプルが入る。1601サンプルの2フレームと1602サンプルの3フレームとが組み合わされ、5フレームを周期として、1601サンプルのフレームと1602サンプルのフレームとが繰り返されることが予想される。Unlockモードでは、上述のAFSIZEに基づき、フレーム毎のオーディオデータのサンプル数を求める。
【0012】
一方、Lockedモードでは、ビデオフレームとの同期を取るために、1フレーム当たりのディジタルオーディオデータのサンプル数が固定的に決められている。すなわち、Lockedモードでは、1フレーム当たりのオーディオデータのサンプル数は、1600サンプルまたは1602サンプルである。Lockedモードでは、1600サンプルの1フレームと、1602サンプルの4フレームとが組み合わされる。また、これらの1600および1602サンプルのフレームの並び方も、固定的とされる。
【0013】
このように、オーディオデータは、フレーム毎にサンプル数が異なる。そのため、特にアナログ処理において、ビデオフレームとオーディオデータとを対応させるために、フレーム毎にオーディオデータのサンプリング周波数を変えてやる必要がある。そのためには、上述したAFSIZEデータが用いられる。AFSIZEデータに基づき、オーディオデータのサンプリング周波数を生成するPLL(Phase Locked Loop) の動作を制御することで、フレーム毎に異なるサンプリング周波数を得る。図17は、従来の技術による、AFSIZEデータを用いたPLL回路100の構成の一例を示す。
【0014】
図17に示されるPLL回路100において、基準フレーム信号が端子110を介して位相比較器112の一方の入力端に供給される。AFSIZEデータが端子111を介して、フレームカウンタ116の一方の入力端に供給される。フレームカウンタ116では、VCO(電圧制御発振器)114から出力された信号がカウントされ、AFSIZEデータ分カウントしたところでフレーム信号が出力される。このようにして帰還フレームが再生される。このフレーム信号が位相比較器112の他方の入力端に供給される。
【0015】
位相比較器112において、基準フレーム信号とカウンタ116から供給されるフレーム信号とが比較され、位相誤差データが出力される。位相誤差データがローパスフィルタ113を介してVCO114に供給される。VCO114では、位相誤差を打ち消すような周波数の信号が出力される。この信号がフレームカウンタ116に供給される。また、VCO114の出力は、1/n分周器115にも供給され、分周比nで分周されることにより、所定のサンプリング周波数を有するオーディオ信号のサンプリングクロックとされ、出力端117に導出される。
【0016】
このような構成とすることによって、位相比較器112では、基準フレーム信号とフレームカウンタ116においてAFSIZEデータに応じて出力されたフレーム信号とが比較されるため、AFSIZEデータに応じたオーディオサンプリングクロックを、フレーム毎に得ることができる。
【0017】
【発明が解決しようとする課題】
Lockedモードは、オーディオサンプリングクロックの安定した供給がその目的の一つとされる。しかしながら、Lockedモードにおいて、上述した従来技術による方法によってサンプリングクロックを得ようとした場合、所定フレーム周期で位相エラーが発生してしまうという問題点があった。例えば、サンプリング周波数が48kHzのモードでは、5フレーム周期で、また、32kHzのモードでは、15フレーム周期で、AFSIZEデータについて2サンプル分の位相エラーが発生してしまう。
【0018】
また、Unlockモードでは、標準的な設定では、5フレーム周期で1602サンプル,1601サンプル,1602サンプル,1601サンプル,1602サンプルの繰り返しが予想される。これに対して、Lockedモードでは、5フレーム周期での、1600サンプル,1602サンプル×4の繰り返しである。これで明らかなように、PLLの位相エラーについて考えた場合、LockedモードがUnlockモードに対して有利であるとは言い難いという問題点があった。
【0019】
さらに、Lockedモードにおいて、サンプリングクロックの安定供給を行なうために、AFSIZEサイズデータを用いないような、Unlockモードとは異なった方法でPLLを行なうことが考えられる。しかしながら、この場合には、2種類のPLL回路を用意したり、また、1種類のPLL回路でも一部の動作設定を切り替えるような構成が必要となり、コストや回路規模などの点で不利になるという問題点があった。
【0020】
さらにまた、この従来技術による方法では、フレーム毎に、あるいは数フレームに1フレームだけ、オーディオサンプリングクロックが異なってしまうことにより、例えばPLLの追従能力の限界などにより、得られるサンプリングクロックにジッタが含まれるといった問題点があった。
【0021】
したがって、この発明の目的は、同一の回路構成で以て、LockedモードおよびUnlockモードの双方で、オーディオサンプリングクロックを安定に供給できるようなディジタルオーディオ信号の処理装置および処理方法を提供することにある。
【0022】
【課題を解決するための手段】
この発明は、上述した課題を解決するために、ビデオフレームと関連してディジタルオーディオ信号を扱うようにされたディジタルオーディオ信号の処理装置において、各ビデオフレームのディジタルオーディオ信号のサンプル数を示す制御情報を抽出する抽出手段と、制御情報により示される、連続する複数のビデオフレームのサンプル数の平均値を求める平均化手段と、平均化手段によって求められた平均値に基づき生成されるフレーム信号と基準フレーム信号とを比較して位相誤差データを形成し、位相誤差データに基づきディジタルオーディオ信号を処理するためのクロックを生成するクロック生成手段とを有することを特徴とするディジタルオーディオ信号の処理装置である。
【0023】
また、この発明は、上述した課題を解決するために、ビデオフレームと関連してディジタルオーディオ信号を扱うようにされたディジタルオーディオ信号の処理方法において、各ビデオフレームのディジタルオーディオ信号のサンプル数を示す制御情報を抽出する抽出のステップと、制御情報により示される、連続する複数のビデオフレームのサンプル数の平均値を求める平均化のステップと、平均化のステップによって求められた平均値に基づき生成されるフレーム信号と基準フレーム信号とを比較して位相誤差データを形成し、位相誤差データに基づきディジタルオーディオ信号を処理するためのクロックを生成するクロック生成のステップとを有することを特徴とするディジタルオーディオ信号の処理方法である。
【0024】
上述したように、この発明は、複数のビデオフレームにおけるディジタルオーディオ信号のサンプル数の平均値を求め、この平均値と基準フレーム信号とを比較することによってディジタルオーディオ信号を処理するためのクロックを生成するようにされているため、ディジタルオーディオ信号のサンプル数がビデオフレーム間で標準値近傍の変動を有していても、安定したクロックを生成することができる。
【0025】
【発明の実施の形態】
以下、この発明の実施の一形態を、図面を参照しながら説明する。この発明では、連続する5フレームについて、順次オーディオデータのサンプル数の平均化を行い、平均化の結果に基づきオーディオサンプリングクロックを生成する。最初に、この発明を適用できる磁気再生装置の具体的な一例として、回転ヘッド型のディジタルVTR(ビデオテープレコーダ)について説明する。図1に示すように、テープ上に斜めにトラックが形成される。T0、T1は、トラックナンバーを示し、隣接するトラック間のアジマスが相違する傾斜アジマス記録がなされる。図2は、1本のトラックを示す。トラック入口側には、ITI(Insert and Track Information)なるアフレコを確実に行うためのタイミングブロックが設けられる。これは、それ以降のエリアに書かれたデータをアフレコして書き直す場合に、そのエリアの位置決めを正確にするために設けられるものである。
【0026】
この例では、コンポジットディジタルカラービデオ信号が輝度信号Y、色差信号CR およびCB からなるコンポーネント信号に変換され、コンポーネント信号がDCT変換と可変長符号により圧縮され、回転ヘッドにより磁気テープに記録される。記録方式としては、SD方式(525ライン/60Hz、625ライン/50Hz)とHD方式(1125ライン/60Hz、1250ライン/50Hz)とが設定できる。
【0027】
1フレーム当たりのトラック数は、SD方式の場合には、525ライン/60Hzでは図3に示されるように10トラックとされ、625ライン/50Hzでは図4に示されるように12トラックとされる。図示しないが、HD方式の場合には、1フレーム当たりのトラック数がSD方式の倍、つまり、20トラック(1125ライン/60Hzの場合)、または24トラック(1250ライン/50Hzの場合)である。オーディオサンプリング周波数が44.1kHzおよび48kHzの場合では、前半の5トラック(6トラック)にLチャンネルのオーディオデータが記録され、その後半の5トラック(6トラック)にRチャンネルのオーディオデータが記録される。
【0028】
図2のトラックフォーマットに示すように、ITIエリアの後に、ヘッドの走査順に、オーディオデータ、ビデオデータおよびサブコードデータが記録される。ビデオデータおよびオーディオデータを記録するエリアには、それぞれに付加情報を記録するための補助的データ(AUX)を書込むエリアが設けられる。AUXには、記録日時や記録時間などオーディオ、ビデオデータ以外のデータを書込むことができる。サブコードデータ、AUX、カセットに内蔵した半導体メモリに記録するデータは、形式を共通とされている。この形式は、パック構造と称される。パックとは、データグルーブの最小単位のことである。
【0029】
図5Aに示すように、一つのパックは、5バイト(PC0〜PC4)から構成される。先頭の1バイト(PC0)がヘッダであり、残りの4バイトがデータである。ヘッダの1バイトは、上位4ビットと下位の4ビットに分かれ、上位4ビットの上位ヘッダと下位4ビットの下位ヘッダとからなる階層構造を形成する。図5Bは、ヘッダバイトPC0が(01010000)とされるオーディオAUXソースパックを示す。このパック内のデータ、例えばバイトPC1内のデータは、次に記すように規定される。
【0030】
LF(1ビット):ビデオサンプリング周波数とオーディオサンプリング周波数とがロックしているかどうかの指示
AFSIZE(6ビット):1ビデオフレーム内のオーディオフレームの大きさ(オーディオサンプル数)の指示
この発明では、このAFSIZEが関連している。
【0031】
ビデオフレーム周波数は、NTSCによる(525/60)方式の場合では、29.97Hzである。一方、オーディオのサンプリング周波数が例えば48kHzの場合では、ビデオフレーム内のオーディオサンプル数が整数とならず、略1601.6となる。そこで、従来技術で上述したように、各ビデオフレームに対して、この数に近い整数のオーディオサンプル数を配分し、平均的なオーディオサンプル数が上述の数に一致するようになされる。
【0032】
Unlockモードの場合のAFSIZE(例えば525/60方式の場合)は、図5Cに示すように規定されている。この図5Cから分かるように、例えばサンプリング周波数が48kHzの場合では、1ビデオフレーム当りのオーディオサンプル数として1580〜1620の範囲内の数をとりうる。そのトラック(フレーム)に記録されているオーディオサンプル数がAFSIZEによって指示される。
【0033】
なお、従来技術で上述したように、Unlockモードでは、1601サンプル×2フレームおよび1602サンプル×3フレームの組み合わせが標準的な設定とされる。また、Lockedモードでは1600サンプル×1フレームおよび1602サンプル×4フレームの組み合わせが規定される。
【0034】
オーディオデータ、ビデオデータ、サブコードがそれぞれ記録されるエリアは、それぞれオーディオセクタ、ビデオセクタ、サブコードセクタと呼ばれる。これらのセクタ間には、データを記録していないギャップG1、G2、G3が配される。オーディオセクタは、プリアンブル(プリシンクブロック)PR1、データ部(14シンクブロック)およびポストアンブルPO1(ポストシンクブロッ)からなる。
【0035】
オーディオシンクブロックは、図6のように、90バイトで構成される。前半の5バイトは、シンクおよびIDデータである。オーディオデータ(72バイト)およびオーディオAUX(AAUX)(5バイト)が1シンクブロックに含まれる。このデータが積符号によってエラー訂正符号化される。すなわち、水平方向に整列する77バイトに対して内符号(C1符号と称される)の符号化がなされる。具体的には、(85,77)リード・ソロモン符号がC1符号として使用され、8バイトのC1(内符号)パリティが付加される。C1符号の系列の方向がデータの記録/再生方向である。また、垂直方向に並ぶ9バイトのデータに対して、外符号(C2符号と称される)のエラー訂正符号化がなされる。具体的には、(14,9)リード・ソロモン符号がC2符号として使用され、5バイトのC2(外符号)パリティが付加される。
【0036】
ビデオセクタは、プリアンブル(プリシンクブロック)PR2、データ部(149シンクブロック)およびポストアンブルPO2(ポストシンクブロッ)からなる。図7は、ビデオセクタの構成を示す。プリアンブルおよびポストアンブルの構成は、図6に示されるオーディオセクタと同様である。ビデオセクタ内に149個含まれるビデオシンクブロックは、オーディオシンクブロックと同様に90バイトで1シンクブロックが構成される。
【0037】
シンクブロックの先頭の5バイトは、シンクおよびIDである。データ部は77バイトで、オーディオデータと同様の積符号のエラー訂正符号化がなされ。具体的には、(85,77)リード・ソロモン符号がC1符号として使用され、また、(149,138)リード・ソロモン符号がC2符号として使用される。そして、C1(内符号)パリティ(8バイト)とC2(外符号)パリティ(11バイト)がそれぞれ付加されている。シンクブロック番号19および20の2シンクブロックと、C2パリティの直前の1シンクブロックはビデオAUX(VAUX)専用のシンクで、77バイトのデータはVAUXデータとして用いられる。VAUXおよびC2パリティ以外の中央部の135シンクブロックは、圧縮されたビデオ信号のビデオデータが格納されるエリアである。
【0038】
さらに、図8は、サブコードセクタの構成を示す。サブコードセクタのプリアンブル、ポストアンブルには、オーディオセクタやビデオセクタと異なりプリシンクおよびポストシンクが存在しない。サブコードシンクブロックは、12バイトの長さであり、その前半の5バイトは、シンクおよびIDである。続く5バイトはデータ部で、データ部に対しては、C1符号の符号化のみがなされる。そして、C1パリティ(2バイト)が付加される。このように、積符号構成は、サブコードでは、採用されていない。これは、サブコードが主として高速サーチ用のものであり、C2パリティを再生できることが少ないからである。また、200倍程度まで高速サーチするために、シンク長も12バイトと短くしてある。サブコードシンクブロックは、1トラック当り12シンクブロックある。
【0039】
図9は、上述したディジタルVTRにこの発明を適用した場合の再生系の構成を示す。図示しないが、このディジタルVTRは、マイクロプロセッサなどによるCPUで制御されるものである。磁気テープ(カセットテープ)1から磁気ヘッド(回転ヘッド)2により再生された信号が再生信号処理回路3に供給される。再生信号処理回路3は、再生アンプ、再生等化器等で構成されている。再生信号処理回路3からの再生データがC1デコーダ4に供給される。C1デコーダ4は、C1符号のエラー訂正を行う。上述したC1符号の場合、例えばシンクブロック内の3シンボルまでのエラーを訂正する。
【0040】
C1デコーダ4の出力がTBC(時間軸補償器)5に供給される。TBC5は、メモリを有し、再生信号中に含まれる時間軸変動を除去する。TBC5の出力データがフレームメモリ5に供給される。フレームメモリ5によって、データの順序がC2符号の順序へ変換され、次段のC2デコーダ7において、C2復号がなされる。一例として、C2復号では、C1符号でエラー訂正できなかった所定数までのエラーシンボルをイレージャ訂正によって訂正する。
【0041】
C2デコーダ7の出力データがデシャフリングおよび補間処理回路8に供給される。デシャフリングは、記録処理においてなされているシャフリング(データの配列、順序の並び替え)を元の配列、順序に戻す処理である。補間処理は、C1符号およびC2符号によって訂正できなかったエラーを修整する処理である。ビデオデータの場合では、例えば1フレーム前の正しいデータによってエラーデータが修整される。また、デシャフリングおよび補間処理回路8は、メモリ9a、9bと入力切り換えスイッチ10と出力切り換えスイッチ11とからなる2バンク構成とされ、連続的に再生されたデータを処理して、連続的に出力することが可能とされている。デシャフリングおよび補間処理回路8から出力されるビデオ信号は、後段のビデオ信号処理系へ供給される。
【0042】
また、再生オーディオ信号がスイッチング回路12に供給され、チャンネル毎に分離されたオーディオデータが形成される。Lチャンネルのオーディオデータがオーディオ信号処理回路13aに供給され、Rチャンネルのオーディオデータがオーディオ信号処理回路13bに供給される。これらオーディオ信号処理回路13a、13bは、デシャフリング、時間軸伸長、AAUX(オーディオAUX)の分離等の処理を行う。分離されたAAUXから上述したAFSIZEが抽出される。これらの処理のために、各信号処理回路には、1フレーム分の再生オーディオデータを記憶できるメモリが設けられており、このメモリの読出しアドレスがAFSIZEに基づいて生成される。
【0043】
オーディオ信号処理回路13aからのLチャンネルのデータがD/A変換器14aに供給され、D/A変換器14aからアナログのLチャンネルのオーディオ信号が出力される。同様に、オーディオ信号処理回路13bからのRチャンネルのデータがD/A変換器14bに供給され、D/A変換器14bからアナログのRチャンネルのオーディオ信号が出力される。
【0044】
オーディオ信号処理回路13aおよび13b,D/A変換器14aおよび14bで用いられる、オーディオ処理のためのオーディオサンプリングクロックは、PLL回路15によって生成される。オーディオ信号処理回路13aでAAUXから抽出されたAFSIZEがPLL回路15の一方の入力端に供給される。タイミング信号発生回路16において、ビデオ信号処理系で用いられる基準フレーム信号が発生される。この基準フレーム信号がPLL回路15の他方の入力端に供給される。PLL回路15では、これらAFSIZEおよび基準フレーム信号とに基づき、上述のオーディオサンプリングクロックを生成する。
【0045】
図10は、この実施の一形態におけるPLL回路15の構成の一例を示す。AFSIZEが端子20に対して供給される。基準フレーム信号が端子21に対して供給される。基準フレーム信号は、帰還フレームカウンタ22に対してリセット信号として供給されると共に、演算処理回路23および位相比較器24のそれぞれの一方の入力端に供給される。AFSIZEは、帰還フレームカウンタ22および演算処理回路23のそれぞれの一方の入力端に対して供給される。
【0046】
演算処理回路23には、後述する1/m分周器27からオーディオサンプリング周波数より高い周波数のクロックが動作クロックとして供給される。この動作クロックは、例えばオーディオサンプリング周波数の10倍の周波数を有する。すなわち、オーディオサンプリング周波数が48kHzであれば、480kHzの周波数を有する。勿論、オーディオサンプリング周波数の256倍といった、さらに高い周波数のクロックとしてもよい。これにより、演算処理回路23において、より高い分解能力が実現される。
【0047】
図11は、演算処理回路23の構成の一例をさらに詳細に示す。演算処理回路23では、5フレーム分のAFSIZEの平均値が求められる。すなわち、基準フレーム信号のタイミングで遅延される遅延素子を4個用い、AFSIZEを順次遅延させ、入力AFSIZEおよび遅延させたそれぞれのAFSIZEを加算ならびに除算して、平均値を求める。
【0048】
この例では、遅延素子として、端子Dに供給された信号を、端子Enに供給される信号のタイミングで端子Qに出力するようなレジスタ42a〜42dが用いられる。端子41から供給されたAFSIZEがレジスタ42aに供給され、端子40から各レジスタ42a〜42dの端子Enに対して供給された基準フレーム信号により、順次レジスタ42b,42c,42dへと送られる。このようにして得られた5フレーム分のAFSIZEが加算器43で加算され、除算器44で除算されることにより、5フレーム分のAFSIZEの平均値が算出される。このAFSIZEの平均値は、スイッチ回路45を介して帰還フレームカウンタ46に供給される。
【0049】
こうして求められるAFSIZEの平均値は、例えば次のようになる。Lockedモードの場合、図12Aに示されるように5フレーム周期で1600サンプルのフレームが到来し、平均化処理を行なうと、
(1600+1602×4)/5=1601.6サンプル
となる。すなわち、0.6サンプルの端数が生じる。
【0050】
一方、Unlockモードの場合、図12Bに示されるように、5フレーム周期で、1602サンプルの3フレームと1601サンプルの2フレームとが混在して到来することが予想される。平均化処理を行なうと、
(1601×2+1602×3)/5=1601.6サンプル
となり、0.6サンプルの端数が生じる。
【0051】
上述したように、この例に示される演算処理回路23は、オーディオサンプリング周波数の10倍の周波数を有する高速なクロックで動作している。すなわち、1/m分周器27から端子49を介して、この高速なクロックが供給される。このクロックに基づき、帰還フレームカウンタ46は、この例では、AFSIZEの小数点第1位以下の分解能でカウントを行なうことが可能である。したがって、帰還フレームカウンタ46は、AFSIZEの平均化の際に端数として生じた0.6サンプルをカウントすることができる。
【0052】
このようにして、帰還フレームカウンタ46では、高速なクロックに基づきカウントを行ない、AFSIZEの平均値に達すると、フレーム信号を出力する。このフレーム信号は、位相比較器24の他方の入力端に供給される。演算処理回路23では、このようにして、5フレーム周期でオーディオサンプル数の端数の正規化を行なっている。
【0053】
位相比較器24において、一方の入力端に供給された基準フレーム信号と、他方の入力端に供給されたフレーム信号とが比較され、位相誤差データが出力される。この位相誤差データは、ローパスフィルタ25を介してVCO26に供給される。VCO26では、この位相誤差データを打ち消すような周波数の信号を出力する。この信号は、上述の1/m分周器27および1/n分周器28に共に供給される。
【0054】
1/m分周器27では、上述したように、オーディオサンプリング周波数の10倍以上の周波数を有するクロックが得られるように、分周比mが選ばれる。1/m分周器27の出力が演算処理回路23に動作クロックとして供給される。また、1/n分周器28では、分周出力としてオーディオサンプリング周波数を有するクロックが得られるように分周比nが選ばれる。1/n分周器28の分周出力が端子29に対して供給され、オーディオサンプリングクロックとして出力される。また、それと共に、1/n分周器28の出力が帰還フレームカウンタ22の他方の入力端に対して供給される。
【0055】
帰還フレームカウンタ22では、1/n分周器28の分周出力に基づき、ビデオフレーム毎のAFSIZEまでのカウントがなされる。カウントは、基準フレーム信号によってリセットされる。このカウントによって、帰還フレームカウンタ22から、オーディオ処理のための動作フレーム信号が出力される。このオーディオ動作フレーム信号は、端子31を介して外部に出力され、図9では省略されているが、オーディオ信号処理回路13aおよび13b,D/A変換器14aおよび14bに供給される。
【0056】
なお、上述の構成では、急激な変位、例えば動作モードがオーディオサンプル周波数が48kHzのモードから32kHzのモードへと変化したような場合、クロックの追従が非常に遅くなってしまう。そこで、このような場合には、演算処理回路23のスイッチ回路45において端子45bを選択する。こうすることによって、高速な動作への対応が可能とされる。
【0057】
図13は、5フレーム周期の処理を行なった場合の、1ビデオフレーム当たりのオーディオサンプル数の標準偏差を示す。AFSIZE入力パターンAは、Lockedモードに対応し、パターンBは、Unlockモードに対応する。この図で明らかなように、この発明による、5フレームでの平均化処理を行なった場合には、標準偏差の値が0となり、フレーム毎に処理を行なうよりも安定したクロックの供給がなされることがわかる。また、図14は、フレーム毎に処理を行なった場合の、標準近傍のAFSIZEの、標準値(1601.16)に対するオフセットを示す。フレーム毎の処理では、常にこの図14に示されるようなオフセットが含まれることになる。
【0058】
上述では、この発明がビデオがNTSC方式であって、オーディオサンプリング周波数が48kHzである場合に適用されるように説明したが、これはこの例に限定されるものではない。ビデオがNTSC方式で、オーディオサンプリング周波数が32kHzの例にも適用可能なものである。
【0059】
従来技術で既に説明したように、32kHzモードでは、1フレーム当たりのオーディオサンプリング数は、1067.734サンプルとされる。そこで、32kHzモードでは、Lockedモードで以て15フレーム周期で、端数の正規化を行なっている。図15に示されるように、1066サンプルの3フレームと、1068サンプルの12フレームとが組み合わされる。すなわち、
(1066〔サンプル〕×3+1068〔サンプル〕×12)×2=32028〔サンプル〕
となる。5フレームの周期内で、1066サンプルのフレームが6フレームおきに入れられる。
【0060】
15フレーム周期で波数の正規化を行なおうとする場合、本来であれば、基準フレーム信号のタイミングで遅延される遅延素子を14個用意し、15フレームでの演算を行なう必要がある。図16は、32kHzモードで、5,7,8,および15の各フレーム周期で処理を行なった場合について、1ビデオフレーム当たりのオーディオサンプル数の標準偏差を示す。この図16に示されるように、遅延素子の数を減らし、7および8フレーム周期を設定した場合でも、フレーム毎に処理を行なう例に比べて格段に安定したクロックを供給することができる。
【0061】
さらに遅延素子を減らし、5フレーム周期に設定した場合でも、フレーム毎の処理に比べ、非常に好適な結果が得られるこの場合には、上述の48kHzの場合と、回路を共通化できることは言うまでもない。
【0062】
また、遅延素子の構成をこれらの何れに設定する場合でも、LockedモードをUnlockモードとで同一の処理を行なうことができる。
【0063】
なお、上述では、この発明がディジタルVTRに適用された例について説明したが、これはこの例に限定されるものではない。例えば、MD(Mini Disc) やDVD(Digital Versatile Disc)、ハードディスクといったディスク記録媒体からビデオ信号を再生するような場合にも、この発明を適用することができる。
【0064】
【発明の効果】
以上説明したように、この発明によれば、複数フレームのAFSIZEを平均化し、平均化されたAFSIZEを用いてPLL処理を行なっているため、帰還フレームの安定化が図られ、オーディオサンプリングクロックを安定的に供給することができるという効果がある。
【0065】
また、この発明では、AFSIZEの複数フレームでの平均化により、LockedモードおよびUnlockモードとを考慮しなくても、同一構成で再生オーディオデータの処理を行なうことができるという効果がある。
【図面の簡単な説明】
【図1】この発明を適用することができるディジタルVTRの一例のトラックパターンを示す略線図である。
【図2】1トラックのデータ配列を説明するための略線図である。
【図3】ディジタルVTRの一例のトラックパターンを示す略線図である。
【図4】ディジタルVTRの一例のトラックパターンを示す略線図である。
【図5】データのパック構造の説明に用いる略線図である。
【図6】オーディオセクタのデータ構造の一例を示す略線図である。
【図7】ビデオセクタのデータ構造の一例を示す略線図である。
【図8】サブコードセクタのデータ構造の一例を示す略線図である。
【図9】この発明の一実施例のブロック図である。
【図10】この実施の一形態におけるPLL回路の構成の一例を示すブロック図である。
【図11】演算処理回路の構成の一例を示すブロック図である。
【図12】48kHzモードのフレーム構成を説明するための図である。
【図13】5フレーム周期の処理を行なった場合の、1ビデオフレーム当たりのオーディオサンプル数の標準偏差を示す略線図である。
【図14】AFSIZEの、標準値(1601.16)に対するオフセットを示す略線図である。
【図15】32kHzモードのフレーム構成を説明するための図である。
【図16】32kHzモードで、5,7,8,および15の各フレーム周期で処理を行なった場合の1ビデオフレーム当たりのオーディオサンプル数の標準偏差を示す略線図である。
【図17】従来技術によるPLL回路の構成の一例を示すブロック図である。
【符号の説明】
13a,13b・・・オーディオ信号処理回路、14a,14b・・・D/A変換器、15・・・PLL回路、22・・・帰還フレームカウンタ、23・・・演算処理回路、24・・・位相比較器、25・・・ローパスフィルタ、26・・・VCO、27・・・1/m分周器、28・・・1/n分周器、42a〜42d・・・遅延素子として用いられるレジスタ、43・・・加算器、44・・・除算器、46・・・帰還フレームカウンタ[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a digital audio signal processing apparatus and processing method in, for example, a digital video playback apparatus.
[0002]
[Prior art]
In recent years, digital video tape recorders that record / reproduce digitized video signals have appeared. In such a digital video tape recorder, a signal obtained by adding an error correction code to a digitized video signal is recorded on a magnetic tape at the time of recording. For recording on the magnetic tape, a method called inclined azimuth recording by a rotating head is used in a helical scan as in the conventional analog method. The inclined azimuth recording method is a method of recording a signal on a tape by two heads having different gap extending directions.
[0003]
At the time of reproduction, a reproduction RF signal is obtained by scanning an oblique track formed on the tape with a rotary head in the same manner as at the time of recording. This reproduction RF signal is converted into reproduction data which is a digital data string via an amplifier, an equalizer, and the like. The reproduction data is also supplied to a PLL that generates a clock synchronized with the reproduction signal, and a reproduction clock is generated.
[0004]
Actually, data for one frame of the video signal is recorded over a plurality of, for example, 10 frames. Therefore, even during reproduction, the rotating
[0005]
As a matter of course, in the digital video tape recorder, audio data is recorded together with video data. At this time, the field frequency in the video signal of the NTSC (525/60) system is 59.94 Hz. On the other hand, the sampling frequency of audio data is 48 kHz, 44.1 kHz, 32 kHz, or the like. Therefore, the period of one video frame and the sampling frequency of audio data are not in an integer ratio relationship.
[0006]
For example, when the sampling frequency is 48 kHz, the number of audio samples in one video frame is
48000Hz × (2 [field] /59.94Hz) ≒ 1601.6 samples
As a result, a fraction of 0.6 samples per frame is generated. Similarly, when the sampling frequency is 32 kHz,
32000 Hz × (2 [field] /59.94 Hz) ≈1067.734 samples
A fraction of approximately 0.734 samples per frame is generated.
[0007]
Therefore, in the audio data, the relationship between the average video frame and the sampling frequency of the audio data is defined by a combination of frames in which an integer number of samples are included. In the example of 48 kHz described above, by adjusting the number of samples in a 5-frame cycle, fractions are absorbed and processing with an integer number of samples can be performed. For example, when the sampling frequency of audio data is 48 kHz, a combination of a frame containing
[0008]
Of the 10 tracks on which the data for one video frame is recorded, the audio data of the left channel (L-ch) is, for example, the first 5 tracks, and the right channel (R) is the second 5 tracks. -ch) audio data is recorded. As will be described later, the audio data may have a different number of samples for each video frame, and therefore information on the number of samples of the audio data in one video frame is recorded. This is called AFSIZE, and is recorded in a predetermined area for each track on the corresponding track for each of L-ch and R-ch.
[0009]
Then, the AFSIZE is read out during reproduction, and is used as a clue to the PLL in the audio reproduction processing circuit, for example. That is, since the audio data must be in phase with the video frame, the frequency of the reproduction clock is changed by this AFSIZE.
[0010]
By the way, in the digital video format, two modes are defined for handling digital audio signals: an Unlocked mode in which processing is performed asynchronously with a video frame, and a mode called a Locked mode in which the video frame is synchronized. Yes.
[0011]
In the Unlock mode, the number of samples entering one frame is variable within a predetermined range such as 1580 samples to 1620 samples. Typically, one frame contains 1601 samples or 1602 samples. It is expected that 2 frames of 1601 samples and 3 frames of 1602 samples are combined, and a frame of 1601 samples and a frame of 1602 samples are repeated with a period of 5 frames. In the Unlock mode, the number of samples of audio data for each frame is obtained based on the above AFSIZE.
[0012]
On the other hand, in the Locked mode, the number of samples of digital audio data per frame is fixedly determined in order to synchronize with the video frame. That is, in the Locked mode, the number of audio data samples per frame is 1600 samples or 1602 samples. In the Locked mode, 1 frame of 1600 samples and 4 frames of 1602 samples are combined. The arrangement of the frames of these 1600 and 1602 samples is also fixed.
[0013]
Thus, the audio data has a different number of samples for each frame. Therefore, in particular, in analog processing, in order to associate video frames with audio data, it is necessary to change the sampling frequency of audio data for each frame. For that purpose, the above-described AFSIZE data is used. A different sampling frequency is obtained for each frame by controlling the operation of a PLL (Phase Locked Loop) that generates a sampling frequency of audio data based on the AFSIZE data. FIG. 17 shows an example of the configuration of a
[0014]
In the
[0015]
The
[0016]
With such a configuration, the
[0017]
[Problems to be solved by the invention]
One of the purposes of the Locked mode is to stably supply an audio sampling clock. However, in the Locked mode, there is a problem in that a phase error occurs at a predetermined frame period when an attempt is made to obtain a sampling clock by the above-described conventional method. For example, a phase error of 2 samples occurs in the AFSIZE data in a period of 5 frames in a mode with a sampling frequency of 48 kHz and in a period of 15 frames in a mode with 32 kHz.
[0018]
In the Unlock mode, it is expected that 1602 samples, 1601 samples, 1602 samples, 1601 samples, and 1602 samples will be repeated in a period of 5 frames under standard settings. On the other hand, in the Locked mode, 1600 samples and 1602 samples × 4 are repeated in a cycle of 5 frames. As is clear from this, when the phase error of the PLL is considered, there is a problem that it is difficult to say that the Locked mode is advantageous over the Unlock mode.
[0019]
Further, in the Locked mode, in order to stably supply the sampling clock, it is conceivable to perform PLL by a method different from the Unlock mode in which the AFSIZE size data is not used. However, in this case, it is necessary to prepare two types of PLL circuits, or to switch some operation settings even with one type of PLL circuit, which is disadvantageous in terms of cost and circuit scale. There was a problem.
[0020]
Furthermore, in this prior art method, the audio sampling clock differs from frame to frame or by one frame every few frames. For example, the sampling clock obtained includes jitter due to the limit of the tracking capability of the PLL. There was a problem such as.
[0021]
SUMMARY OF THE INVENTION Accordingly, an object of the present invention is to provide a digital audio signal processing apparatus and processing method capable of stably supplying an audio sampling clock in both the Locked mode and the Unlock mode with the same circuit configuration. .
[0022]
[Means for Solving the Problems]
In order to solve the above-described problem, the present invention provides a digital audio signal processing apparatus which handles a digital audio signal in association with a video frame, and control information indicating the number of samples of the digital audio signal in each video frame. Extracting means for extracting the average value, averaging means for obtaining an average value of the number of samples of a plurality of continuous video frames indicated by the control information, and an average value obtained by the averaging means Frame signal generated based on And reference frame signal To form phase error data and based on the phase error data A digital audio signal processing apparatus comprising clock generation means for generating a clock for processing a digital audio signal.
[0023]
The present invention also provides a digital audio signal processing method for handling a digital audio signal in association with a video frame in order to solve the above-described problem, and indicates the number of samples of the digital audio signal in each video frame. An extraction step for extracting control information, an averaging step for obtaining an average value of the number of samples of a plurality of continuous video frames indicated by the control information, and an average value obtained by the averaging step Frame signal generated based on And reference frame signal To form phase error data and based on the phase error data And a clock generation step of generating a clock for processing the digital audio signal.
[0024]
As described above, the present invention obtains an average value of the number of samples of a digital audio signal in a plurality of video frames, and generates a clock for processing the digital audio signal by comparing the average value with a reference frame signal. Thus, a stable clock can be generated even if the number of samples of the digital audio signal has a fluctuation near the standard value between video frames.
[0025]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an embodiment of the present invention will be described with reference to the drawings. In the present invention, the number of samples of audio data is sequentially averaged for five consecutive frames, and an audio sampling clock is generated based on the averaged result. First, a rotating head type digital VTR (video tape recorder) will be described as a specific example of a magnetic reproducing apparatus to which the present invention can be applied. As shown in FIG. 1, tracks are formed obliquely on the tape. T0 and T1 indicate track numbers, and inclined azimuth recording is performed in which the azimuth between adjacent tracks is different. FIG. 2 shows one track. On the track entrance side, a timing block is provided for reliably performing ITI (Insert and Track Information) dubbing. This is provided in order to accurately position the area when the data written in the subsequent area is rewritten after dubbing.
[0026]
In this example, the composite digital color video signal is a luminance signal Y and a color difference signal C. R And C B The component signal is compressed by DCT conversion and variable length code, and recorded on the magnetic tape by the rotary head. As a recording method, an SD method (525 lines / 60 Hz, 625 lines / 50 Hz) and an HD method (1125 lines / 60 Hz, 1250 lines / 50 Hz) can be set.
[0027]
In the SD system, the number of tracks per frame is 10 tracks as shown in FIG. 3 at 525 lines / 60 Hz, and 12 tracks as shown in FIG. 4 at 625 lines / 50 Hz. Although not shown, in the HD system, the number of tracks per frame is twice that of the SD system, that is, 20 tracks (1125 lines / 60 Hz) or 24 tracks (1250 lines / 50 Hz). When the audio sampling frequency is 44.1 kHz and 48 kHz, L channel audio data is recorded on the first 5 tracks (6 tracks), and R channel audio data is recorded on the second 5 tracks (6 tracks). .
[0028]
As shown in the track format of FIG. 2, audio data, video data, and subcode data are recorded in the head scanning order after the ITI area. The areas for recording video data and audio data are provided with areas for writing auxiliary data (AUX) for recording additional information, respectively. In the AUX, data other than audio and video data such as recording date and time and recording time can be written. The subcode data, AUX, and data recorded in the semiconductor memory built in the cassette have a common format. This format is referred to as a pack structure. A pack is a minimum unit of a data groove.
[0029]
As shown in FIG. 5A, one pack is composed of 5 bytes (PC0 to PC4). The first 1 byte (PC0) is a header, and the remaining 4 bytes are data. One byte of the header is divided into upper 4 bits and lower 4 bits, and forms a hierarchical structure including an upper header of upper 4 bits and a lower header of lower 4 bits. FIG. 5B shows an audio AUX source pack in which the header byte PC0 is (01010000). Data in this pack, for example, data in the byte PC1, is defined as follows.
[0030]
LF (1 bit): Indication of whether the video sampling frequency and the audio sampling frequency are locked
AFSIZE (6 bits): Instruction of audio frame size (number of audio samples) in one video frame
In the present invention, this AFSIZE is related.
[0031]
The video frame frequency is 29.97 Hz in the case of the NTSC (525/60) system. On the other hand, when the audio sampling frequency is 48 kHz, for example, the number of audio samples in the video frame is not an integer, but is approximately 1601.6. Therefore, as described above in the related art, an integer number of audio samples close to this number is allocated to each video frame so that the average number of audio samples matches the above number.
[0032]
The AFSIZE in the case of the Unlock mode (for example, in the case of the 525/60 system) is defined as shown in FIG. 5C. As can be seen from FIG. 5C, for example, when the sampling frequency is 48 kHz, the number of audio samples per video frame can be in the range of 1580 to 1620. The number of audio samples recorded in the track (frame) is designated by AFSIZE.
[0033]
As described above in the prior art, in the Unlock mode, a combination of 1601 samples × 2 frames and 1602 samples × 3 frames is a standard setting. In the Locked mode, a combination of 1600 samples × 1 frame and 1602 samples × 4 frames is defined.
[0034]
The areas in which the audio data, video data, and subcode are recorded are called an audio sector, a video sector, and a subcode sector, respectively. Between these sectors, gaps G1, G2, and G3 in which no data is recorded are arranged. The audio sector includes a preamble (presync block) PR1, a data portion (14 sync blocks), and a postamble PO1 (postsync block).
[0035]
The audio sync block is composed of 90 bytes as shown in FIG. The first 5 bytes are sync and ID data. Audio data (72 bytes) and audio AUX (AAUX) (5 bytes) are included in one sync block. This data is error correction encoded by a product code. That is, inner codes (referred to as C1 codes) are encoded for 77 bytes aligned in the horizontal direction. Specifically, the (85, 77) Reed-Solomon code is used as the C1 code, and an 8-byte C1 (inner code) parity is added. The direction of the C1 code sequence is the data recording / reproducing direction. Further, error correction coding of an outer code (referred to as C2 code) is performed on 9-byte data arranged in the vertical direction. Specifically, a (14, 9) Reed-Solomon code is used as the C2 code, and a 5-byte C2 (outer code) parity is added.
[0036]
The video sector includes a preamble (presync block) PR2, a data portion (149 sync block), and a postamble PO2 (postsync block). FIG. 7 shows the configuration of the video sector. The configuration of the preamble and the postamble is the same as that of the audio sector shown in FIG. In the video sync block included in 149 video sectors, one sync block is composed of 90 bytes as in the audio sync block.
[0037]
The first 5 bytes of the sync block are a sync and an ID. The data portion is 77 bytes, and error correction encoding of the product code is performed in the same way as audio data. Specifically, the (85, 77) Reed-Solomon code is used as the C1 code, and the (149, 138) Reed-Solomon code is used as the C2 code. Then, C1 (inner code) parity (8 bytes) and C2 (outer code) parity (11 bytes) are respectively added. Two sync blocks with
[0038]
Further, FIG. 8 shows the structure of the subcode sector. Unlike the audio sector and the video sector, the subcode sector preamble and postamble have no presync and postsync. The subcode sync block has a length of 12 bytes, and the first 5 bytes are a sync and an ID. The subsequent 5 bytes are the data part, and only the C1 code is encoded for the data part. Then, C1 parity (2 bytes) is added. Thus, the product code configuration is not adopted in the subcode. This is because the subcode is mainly for high-speed search, and the C2 parity can hardly be reproduced. Also, the sync length is shortened to 12 bytes for high-speed search up to about 200 times. There are 12 sub-code sync blocks per track.
[0039]
FIG. 9 shows the configuration of a reproduction system when the present invention is applied to the digital VTR described above. Although not shown, this digital VTR is controlled by a CPU such as a microprocessor. A signal reproduced from a magnetic tape (cassette tape) 1 by a magnetic head (rotating head) 2 is supplied to a reproduction
[0040]
The output of the
[0041]
Output data of the
[0042]
In addition, the reproduced audio signal is supplied to the switching
[0043]
The L channel data from the audio
[0044]
An audio sampling clock for audio processing used in the audio
[0045]
FIG. 10 shows an example of the configuration of the
[0046]
A clock having a frequency higher than the audio sampling frequency is supplied to the
[0047]
FIG. 11 shows an example of the configuration of the
[0048]
In this example, registers 42a to 42d that output the signal supplied to the terminal D to the terminal Q at the timing of the signal supplied to the terminal En are used as the delay elements. The AFSIZE supplied from the terminal 41 is supplied to the register 42a, and is sequentially sent to the
[0049]
The average value of AFSIZE obtained in this way is, for example, as follows. In the locked mode, as shown in FIG. 12A, when a frame of 1600 samples arrives at a period of 5 frames and an averaging process is performed,
(1600 + 1602 × 4) /5=1601.6 samples
It becomes. That is, a fraction of 0.6 samples occurs.
[0050]
On the other hand, in the case of the Unlock mode, as shown in FIG. 12B, it is expected that 3 frames of 1602 samples and 2 frames of 1601 samples come together in a 5-frame cycle. When averaging is performed,
(1601 × 2 + 1602 × 3) /5=1601.6 samples
This yields a fraction of 0.6 samples.
[0051]
As described above, the
[0052]
In this way, the
[0053]
In the
[0054]
In the 1 /
[0055]
The
[0056]
In the above-described configuration, the clock tracking becomes very slow when the abrupt displacement, for example, the operation mode is changed from the mode with the audio sample frequency of 48 kHz to the mode of 32 kHz. Therefore, in such a case, the terminal 45b is selected in the
[0057]
FIG. 13 shows the standard deviation of the number of audio samples per video frame when processing is performed for a period of 5 frames. The AFSIZE input pattern A corresponds to the Locked mode, and the pattern B corresponds to the Unlock mode. As is apparent from this figure, when the averaging process is performed in 5 frames according to the present invention, the standard deviation value is 0, and a more stable clock is supplied than when the process is performed for each frame. I understand that. FIG. 14 shows an offset with respect to the standard value (1601.16) of AFSIZE near the standard when processing is performed for each frame. In the processing for each frame, an offset as shown in FIG. 14 is always included.
[0058]
In the above description, the present invention has been described as being applied when the video is NTSC and the audio sampling frequency is 48 kHz. However, the present invention is not limited to this example. The present invention can also be applied to an example in which the video is NTSC and the audio sampling frequency is 32 kHz.
[0059]
As already described in the prior art, in the 32 kHz mode, the number of audio samples per frame is 1067.734 samples. Therefore, in the 32 kHz mode, fractional normalization is performed at a period of 15 frames in the Locked mode. As shown in FIG. 15, 3 frames of 1066 samples and 12 frames of 1068 samples are combined. That is,
(1066 [sample] × 3 + 1068 [sample] × 12) × 2 = 32028 [sample]
It becomes. Within a period of 5 frames, 1066 sample frames are inserted every 6 frames.
[0060]
When attempting to normalize the wave number with a period of 15 frames, it is originally necessary to prepare 14 delay elements that are delayed at the timing of the reference frame signal and perform calculations in 15 frames. FIG. 16 shows the standard deviation of the number of audio samples per video frame when processing is performed in each frame period of 5, 7, 8, and 15 in the 32 kHz mode. As shown in FIG. 16, even when the number of delay elements is reduced and 7 and 8 frame periods are set, a much more stable clock can be supplied as compared with the example in which processing is performed for each frame.
[0061]
Furthermore, even when the number of delay elements is reduced and the period is set to 5 frames, a very favorable result can be obtained as compared with the processing for each frame. .
[0062]
In addition, when the delay element configuration is set to any one of these, the same processing can be performed in the Locked mode and the Unlock mode.
[0063]
In the above description, an example in which the present invention is applied to a digital VTR has been described. However, the present invention is not limited to this example. For example, the present invention can be applied to a case where a video signal is reproduced from a disk recording medium such as an MD (Mini Disc), a DVD (Digital Versatile Disc), or a hard disk.
[0064]
【The invention's effect】
As described above, according to the present invention, since the AFSIZE of a plurality of frames is averaged and the PLL processing is performed using the averaged AFSIZE, the feedback frame is stabilized and the audio sampling clock is stabilized. There is an effect that it can be supplied.
[0065]
In addition, according to the present invention, it is possible to process the reproduced audio data with the same configuration without considering the Locked mode and the Unlock mode by averaging the AFSIZE in a plurality of frames.
[Brief description of the drawings]
FIG. 1 is a schematic diagram showing a track pattern of an example of a digital VTR to which the present invention can be applied.
FIG. 2 is a schematic diagram for explaining the data arrangement of one track.
FIG. 3 is a schematic diagram showing a track pattern of an example of a digital VTR.
FIG. 4 is a schematic diagram showing a track pattern of an example of a digital VTR.
FIG. 5 is a schematic diagram used for explaining a data pack structure;
FIG. 6 is a schematic diagram illustrating an example of a data structure of an audio sector.
FIG. 7 is a schematic diagram illustrating an example of a data structure of a video sector.
FIG. 8 is a schematic diagram illustrating an example of a data structure of a subcode sector.
FIG. 9 is a block diagram of one embodiment of the present invention.
FIG. 10 is a block diagram illustrating an example of a configuration of a PLL circuit according to the embodiment.
FIG. 11 is a block diagram illustrating an example of a configuration of an arithmetic processing circuit.
FIG. 12 is a diagram for explaining a frame configuration in a 48 kHz mode;
FIG. 13 is a schematic diagram illustrating a standard deviation of the number of audio samples per video frame when processing is performed in a 5-frame cycle.
FIG. 14 is a schematic diagram illustrating an offset of an AFSIZE with respect to a standard value (1601.16).
FIG. 15 is a diagram for explaining a frame configuration in a 32 kHz mode;
FIG. 16 is a schematic diagram illustrating the standard deviation of the number of audio samples per video frame when processing is performed in each frame period of 5, 7, 8, and 15 in the 32 kHz mode.
FIG. 17 is a block diagram showing an example of a configuration of a PLL circuit according to a conventional technique.
[Explanation of symbols]
13a, 13b ... audio signal processing circuit, 14a, 14b ... D / A converter, 15 ... PLL circuit, 22 ... feedback frame counter, 23 ... arithmetic processing circuit, 24 ... Phase comparator, 25... Low-pass filter, 26... VCO, 27... 1 / m frequency divider, 28... 1 / n frequency divider, 42 a to 42 d. Register, 43 ... adder, 44 ... divider, 46 ... feedback frame counter
Claims (3)
各ビデオフレームのディジタルオーディオ信号のサンプル数を示す制御情報を抽出する抽出手段と、
上記制御情報により示される、連続する複数の上記ビデオフレームの上記サンプル数の平均値を求める平均化手段と、
上記平均化手段によって求められた上記平均値に基づき生成されるフレーム信号と基準フレーム信号とを比較して位相誤差データを形成し、該位相誤差データに基づき上記ディジタルオーディオ信号を処理するためのクロックを生成するクロック生成手段と
を有する
ことを特徴とするディジタルオーディオ信号の処理装置。In a digital audio signal processing apparatus adapted to handle a digital audio signal in association with a video frame,
Extraction means for extracting control information indicating the number of samples of the digital audio signal of each video frame;
Averaging means for obtaining an average value of the number of samples of the plurality of consecutive video frames indicated by the control information;
A clock for processing the digital audio signal based on the phase error data by comparing the frame signal generated based on the average value obtained by the averaging means and the reference frame signal to form phase error data And a clock generation means for generating a digital audio signal processing apparatus.
上記クロック生成手段は、
上記ディジタルオーディオ信号のサンプリング周波数より高い周波数のクロックを生成する分周手段と、
上記基準フレーム信号によりリセットされ、上記クロックをカウントしてカウント値が上記平均値に達したら上記フレーム信号を出力するカウント手段と、
上記フレーム信号と上記基準フレーム信号とを比較して上記位相誤差データを出力する位相比較手段と、
上記位相比較手段の出力を制御信号として供給される可変周波数発振手段と
からなるPLLである
ことを特徴とするディジタルオーディオ信号の処理装置。The digital audio signal processing apparatus according to claim 1,
The clock generation means includes
Frequency dividing means for generating a clock having a frequency higher than the sampling frequency of the digital audio signal;
Counting means that is reset by the reference frame signal, counts the clock, and outputs the frame signal when the count value reaches the average value;
Phase comparison means for comparing the frame signal with the reference frame signal and outputting the phase error data;
An apparatus for processing a digital audio signal, characterized in that it is a PLL comprising variable frequency oscillating means supplied with the output of the phase comparing means as a control signal.
各ビデオフレームのディジタルオーディオ信号のサンプル数を示す制御情報を抽出する抽出のステップと、
上記制御情報により示される、連続する複数の上記ビデオフレームの上記サンプル数の平均値を求める平均化のステップと、
上記平均化のステップによって求められた上記平均値に基づき生成されるフレーム信号と基準フレーム信号とを比較して位相誤差データを形成し、該位相誤差データに基づき上記ディジタルオーディオ信号を処理するためのクロックを生成するクロック生成のステップと
を有する
ことを特徴とするディジタルオーディオ信号の処理方法。In a method of processing a digital audio signal adapted to handle a digital audio signal in association with a video frame,
An extraction step of extracting control information indicating the number of samples of the digital audio signal of each video frame;
An averaging step for obtaining an average value of the number of samples of the plurality of consecutive video frames indicated by the control information;
A phase error data is formed by comparing a frame signal generated based on the average value obtained by the averaging step and a reference frame signal, and the digital audio signal is processed based on the phase error data A method of processing a digital audio signal, comprising: a clock generation step of generating a clock.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25331897A JP4103155B2 (en) | 1997-09-18 | 1997-09-18 | Digital audio signal processing apparatus and processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25331897A JP4103155B2 (en) | 1997-09-18 | 1997-09-18 | Digital audio signal processing apparatus and processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1196693A JPH1196693A (en) | 1999-04-09 |
JP4103155B2 true JP4103155B2 (en) | 2008-06-18 |
Family
ID=17249643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP25331897A Expired - Fee Related JP4103155B2 (en) | 1997-09-18 | 1997-09-18 | Digital audio signal processing apparatus and processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4103155B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7603190B2 (en) | 2001-04-19 | 2009-10-13 | Sony Corporation | Digital recording/reproducing apparatus |
-
1997
- 1997-09-18 JP JP25331897A patent/JP4103155B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH1196693A (en) | 1999-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3237152B2 (en) | Digital information signal recording device | |
US6085022A (en) | Digital VTR for recording special replay video data in track areas designated for digital video and digital audio | |
JP3159041B2 (en) | Digital signal recording / reproducing apparatus and reproducing apparatus | |
EP0209047B1 (en) | Apparatus for recording and/or reproducing an information signal | |
US5857044A (en) | Method and apparatus for processing time code | |
EP0086658B1 (en) | Time base correcting apparatus | |
KR100275064B1 (en) | Method and apparatus for recording time code data | |
JP4103155B2 (en) | Digital audio signal processing apparatus and processing method | |
KR100630243B1 (en) | Magnetic recording method and apparatus for digital signals, magnetic reproducing method and apparatus for digital signals and tape-shaped recording medium | |
US7062154B2 (en) | Magnetic-tape recording apparatus, magnetic-tape recording method, magnetic-tape format, and recording medium | |
JP3344117B2 (en) | Phase control method and device | |
JP3601128B2 (en) | Digital audio signal processing apparatus and processing method | |
KR100423177B1 (en) | Digital signal recording / reproducing apparatus and method | |
US5990964A (en) | Method and apparatus for processing time code | |
US5247400A (en) | Tape reproducing direction detecting apparatus for a digital VTR | |
US6735375B1 (en) | Data recording and reproducing apparatus | |
US7058283B2 (en) | Magnetic tape tracking control apparatus and method, magnetic tape format, recording medium and program | |
US20070242927A1 (en) | Recording/Reproducing Apparatus, Recording/Reproducing Method and Program-Recorded Medium | |
JPH0973736A (en) | Device and method for reproducing digital signal | |
JPH04305870A (en) | Recording and reproducing device | |
JP2771155B2 (en) | Recording device | |
JP3632352B2 (en) | Digital signal recording apparatus and reproducing apparatus | |
JP2703935B2 (en) | Video data playback device | |
JP3312418B2 (en) | Recording device | |
JP3446259B2 (en) | Reference timing signal generation circuit |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070206 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070328 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071023 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080304 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080317 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110404 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |