JP3946812B2 - Audio signal conversion apparatus and audio signal conversion method - Google Patents

Audio signal conversion apparatus and audio signal conversion method Download PDF

Info

Publication number
JP3946812B2
JP3946812B2 JP12132997A JP12132997A JP3946812B2 JP 3946812 B2 JP3946812 B2 JP 3946812B2 JP 12132997 A JP12132997 A JP 12132997A JP 12132997 A JP12132997 A JP 12132997A JP 3946812 B2 JP3946812 B2 JP 3946812B2
Authority
JP
Japan
Prior art keywords
audio signal
digital audio
prediction coefficient
data
data pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP12132997A
Other languages
Japanese (ja)
Other versions
JPH10313251A (en
Inventor
哲二郎 近藤
正明 服部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP12132997A priority Critical patent/JP3946812B2/en
Publication of JPH10313251A publication Critical patent/JPH10313251A/en
Application granted granted Critical
Publication of JP3946812B2 publication Critical patent/JP3946812B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、レートコンバータやPCM(Pulse Code Modulation)復号装置等に用いて好適なオーディオ信号変換装置等に関し、特に、データの補間処理を行うオーディオ信号変換装置等に関する。
【0002】
【従来の技術】
従来より、ディジタルオーディオ信号をディジタル/アナログ(D/A)コンバータに入力する前に、サンプリング周波数を元の値の数倍に変換するオーバーサンプリング処理を行っている。これにより、上記D/Aコンバータから出力されたディジタルオーディオ信号はアナログ・アンチ・エイリアス・フィルタの位相特性によって可聴周波数高域で一定に保たれ、また、サンプリングに伴うディジタル系のイメージ雑音の影響が排除されるようになっている。上記オーバーサンプリング処理では、通常、線形一次(直線)補間方式のディジタルフィルタが用いられている。このようなディジタルフィルタは、サンプリングレートが変わったりデータが欠落した場合等に、複数の既存データの平均値を求めて直線的な補間データを生成するものである。
【0003】
【発明が解決しようとする課題】
しかし、オーバーサンプリング処理後のディジタルオーディオ信号は、線形一次補間によって時間軸方向に対してデータ量が数倍に緻密になっているものの、オーバーサンプリング処理後のディジタルオーディオ信号の周波数帯域は変換前とあまり変わらず、音質そのものは向上していない。さらに、補間されたデータは必ずしもA/D変換前のアナログオーディオ信号の波形に基づいて生成されたのではないため、波形再現性もほとんど向上していない。
【0004】
また、サンプリング周波数の異なるディジタルオーディオ信号をダビングする場合において、サンプリング・レート・コンバータを用いて周波数を変換しているが、かかる場合でも線形一次ディジタルフィルタによって直線的なデータの補間しか行うことができず、音質や波形再現性を向上することができなかった。さらに、ディジタルオーディオ信号のデータサンプルが欠落した場合において同様である。
【0005】
本発明は、このような実情に鑑みてなされたものであり、オーディオ信号の波形再現性及び音質の向上を図ることのできるオーディオ信号変換装置及びオーディオ信号変換方法を提供することを目的とする。
【0006】
【課題を解決するための手段】
上述の課題を解決するために、本発明に係るオーディオ信号変換装置は、ディジタルオーディオ信号に基づいたデータパターンを生成するパターン生成手段と、ディジタルオーディオ信号を変換するための推定式の予測係数を記憶し、生成された上記データパターンに基づいて、上記予測係数を出力する予測係数記憶手段と、上記予測係数記憶手段から出力された予測係数と上記ディジタルオーディオ信号に基づいて推定演算して、変換処理済みのディジタルオーディオ信号を出力する推定演算手段とを備え、上記予測係数記憶手段には、ディジタルオーディオ信号のサンプリング周波数を小さくするように間引かれたディジタルオーディオ信号、又は、ディジタルオーディオ信号のデータサンプルを欠落させることにより間引かれたディジタルオーディオ信号に基づいて生成されたデータパターンに基づいて算出された上記ディジタルオーディオ信号を変換するための推定式の予測係数が記憶されていることを特徴とする。
【0007】
本発明に係るオーディオ信号変換方法は、 学習用のディジタルオーディオ信号のサンプリング周波数を小さくするように間引かれたディジタルオーディオ信号、又は、ディジタルオーディオ信号のデータサンプルを欠落させることにより間引かれたディジタルオーディオ信号に基づいてデータパターンを生成し、上記データパターンに基づいてディジタルオーディオ信号を変換するための推定式の予測係数を算出して記憶しておき、変換すべきディジタルオーディオ信号に基づいたデータパターンを生成し、生成された上記データパターンに基づいて上記予測係数を読み出し、上記読み出された予測係数と上記変換すべきディジタルオーディオ信号に基づいて推定演算して、変換処理済みのディジタルオーディオ信号を出力することを特徴とする。
【0011】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照しながら詳細に説明する。
本発明は、ディジタルオーディオ信号(以下、オーディオデータという。)のサンプリングレートを上げたり、オーディオデータにエラーが生じたときに、欠落しているオーディオデータを補間したものであって真値に最も近いオーディオデータ(以下、オーディオ補間データという)を生成するものである。
【0012】
本発明は、具体的には図1に示すオーディオ信号変換装置に適用することができる。
上記オーディオ信号変換装置1は、オーディオデータを所定時間毎に切り出す時間軸領域切出回路11と、切り出されたオーディオデータを圧縮して圧縮データパターンを生成するADRC(Adaptive Dynamic Range Coding )回路12と、切り出されたオーディオデータの属するクラスコードを発生するクラスコード発生回路13と、推定式の予測係数がクラスコード毎に、記憶されているメモリテーブル14と、予測係数と上記切り出されたオーディオデータに基づいて推定演算する推定演算回路15とを備える。
【0013】
時間軸領域切出回路11は、入力端子より供給された図2(A)に示すオーディオデータを所定時間毎の領域に分割する。なお、ここでは、時間軸領域分割回路11は、オーディオデータを6サンプル毎に分割するものとする。時間軸領域切出回路11は、分割してブロック化したオーディオデータをADRC回路12及び推定演算回路15に供給する。
【0014】
ADRC回路12は、上述のように各時間軸領域のオーディオデータを、例えば8ビットから2ビットに圧縮するような演算を行うことによりパターン圧縮データを形成し、このパターン圧縮データをクラスコード発生回路13へ供給する。
【0015】
ADRC回路12は、通常、VTR(Video Tape Recoder)向け高能率符号化用に開発された適応的量子化を行うものである。ここでは、信号レベルの局所的なパターンを短い語長で効率的に表現できるので、信号パターンのクラス分類のコード発生に使用されている。
【0016】
具体的には、6つの8ビットのオーディオデータをクラス分類しようとする場合では、248という膨大な数のクラスに分類しなければならない。信号波形の特徴を把握する意味では理想的であるが、回路上の負担が多く、実用的ではない。そこで、ADRC回路12で生成されるパターン圧縮データに基づいてクラス分類を行っている。例えば、6つのオーディオデータに対して1ビットの量子化を実行すると、6つのオーディオデータを6ビットで表すことができ、26 =64クラスに分類することが可能である。
【0017】
ここで、ADRC回路12は、領域内のダイナミックレンジをDR、ビット割当をn、領域内画素のデータレベルをL、量子化コードをQとすると、以下の式(1)に従って、領域内の最大値MAXと最小値MINとの間を指定されたビット長で均等に分割して量子化を行う。
【0018】
【数1】

Figure 0003946812
【0019】
ADRC回路12は、時間軸領域切出回路11で切り出された各オーディオデータを各2ビットに圧縮する。なお、圧縮されたオーディオデータをそれぞれq1〜q6 とする。
【0020】
クラスコード発生回路13は、ADRC回路12から供給されるパターン圧縮データに基づいて以下の式(2)の演算を行って、そのブロックが属するクラスを検出し、そのクラスを示すクラスコードclass をメモリテーブル14へ供給する。このクラスコードclass は、メモリテーブル14からの読み出しアドレスを示す。
【0021】
【数2】
Figure 0003946812
【0022】
ここでは、n=6、P=2である。
【0023】
メモリテーブル14には、補間前後のオーディオデータのパターンの関係を学習することにより、補間前のオーディオデータに対応するオーディオ補間データを算出するための線形推定式の予測係数が各クラスコード毎に、記憶されている。なお、メモリテーブル14に記憶されている予測係数の作成方法については後述する。メモリテーブル14からは、クラスコードclass で示されるアドレスから、そのクラスの予測係数であるwn (class )(n =1〜6)が読み出される。この予測係数は、推定演算回路15へ供給される。
【0024】
推定演算回路15は、時間軸領域切出回路11から供給されるオーディオデータ、およびメモリテーブル14から供給される予測係数であるwn (n =1〜6)に基づいて、入力されたオーディオデータに対応するオーディオ補間データを算出する。
【0025】
より具体的には、推定演算回路15は、時間軸領域切出回路11より供給されたオーディオデータとメモリテーブル14から供給された予測係数により、予測係数であるwn (n =1〜6)に基づいて、それぞれ以下の式(3)に示す演算を行うことにより、オーディオ補間データを算出する。
【0026】
【数3】
Figure 0003946812
【0027】
図2(B)に示す算出されたオーディオ補間データは、出力端子を介して出力される。
【0028】
以上のように、上記オーディオ信号変換装置は、オーディオ補間データを推定するための予測係数をメモリテーブル14に記憶しておき、入力されるオーディオデータ、およびメモリテーブル14から読み出された予測係数に基づいて推定演算を行うことによって、オーディオ補間データを出力することができる。すなわち、上記オーディオ信号変換装置は、入力されるオーディオデータを単に線形補間処理したのとは異なり、実際のオーディオデータから後述の学習により求められた予測係数に基づいて推定演算するので、より実際に近い波形を再現して高音質のオーディオデータを出力することができる。
【0029】
なお、本実施の形態では、データを補間するハードウェアに、予測係数が既に記憶されているメモリテーブル13が設けられている場合について説明したが、本発明はこれに限定されるものではない。
【0030】
例えば、光ディスク等の記録媒体に通常のオーディオデータとともに予測係数を記憶させておき、上述のオーディオ信号変換装置を光ディスク再生装置に適用してもよい。
【0031】
このとき、上記光ディスク再生装置は、光ディスクに記憶されたオーディオデータの読み出しを開始する前に上記予測係数を読み出して、この予測係数を上記メモリテーブル13に記憶させる。これにより、上記光ディスク再生装置は、いかなるオーディオデータであっても、メモリテーブル13を取り替えることなく、波形再現性のよい高音質のオーディオデータを得ることができる。
【0032】
つぎに、メモリテーブル14に格納される予測係数を作成(学習)するための予測係数生成装置について図3を用いて説明する。
上記予測係数生成装置は、再現すべき高音質オーディオデータを用いることによって、メモリテーブル14に予測係数を記憶させるものである。
【0033】
上記予測係数生成装置2は、図3に示すように、高音質オーディオデータを間引く間引き処理回路21と、オーディオデータを所定時間毎に切り出す時間軸領域切出回路22と、切り出されたオーディオデータを圧縮して圧縮データパターンを生成するADRC回路23と、上記圧縮データパターンに基づいてクラスコードを発生するクラスコード発生回路24と、クラスコード毎に正規方程式をたてる正規方程式回路25と、上記クラスコード毎に予測係数を決定する予測係数決定回路26と、決定された予測係数を記憶するメモリテーブル27とを備える。
【0034】
予測係数を学習によって得るためには、まず、既に知られている高音質オーディオデータから所定サンプル間引いた通常のオーディオデータを形成する必要がある。
【0035】
具体的には、間引き処理回路21は、入力端子を介して供給される高音質オーディオデータに対して所定時間毎に間引き処理を行って通常のオーディオデータを生成して、これを時間軸領域切出回路22に供給する。なお、この間引き処理回路21での間引きの程度によって、生成される予測係数が異なり、さらには上述のオーディオ信号変換装置1で再現されるオーディオデータも異なる。例えば、上述のオーディオ信号変換装置1がサンプリング周波数を大きくしたオーディオデータを出力するようにするためには、これに対応して、サンプリング周波数を減らす間引き処理が必要である。また、上記オーディオ信号変換装置1が欠落したデータサンプルを補ってオーディオデータを出力するようにするためには、これに応じて、データサンプルを欠落させる間引き処理が必要である。
【0036】
時間軸領域切出回路22は、間引き処理回路21から供給されたオーディオデータを複数の領域に分割する。具体的には、時間軸領域切出回路22は、先に説明した時間軸領域切出回路11と同一の働きをするものである。時間軸領域切出回路22は、所定時間毎のオーディオデータをADRC回路23、および正規方程式回路25に供給する。
【0037】
ADRC回路23は、上述のように各領域の全てのデータ、あるいは一部のデータを、例えば8ビットのオーディオデータから2ビットのオーディオデータに圧縮する演算を行ってパターン圧縮データを形成し、このパターン圧縮データをクラスコード発生回路24に供給する。なお、ADRC回路23は、先に説明したADRC回路12と同一のものである。
【0038】
クラスコード発生回路24は、先に説明したクラスコード発生回路13と同一のものであり、ADRC回路23から供給されるパターン圧縮データに基づいて、上述の式(2)の演算を行う。これにより、上記クラスコード発生回路24は、そのブロックの属するクラスを検出して、そのクラスを示すクラスコードを正規方程式回路25に供給する。
【0039】
正規方程式回路25は、クラスコード発生回路24から供給された各クラスコードclass 、各クラスコードclass 毎に時間軸領域切出回路22より供給されたオーディオデータx1 ,x2 ,‥‥,xn 、入力端子より供給された高音質オーディオデータyを用いて、後述する正規方程式を立てる。
【0040】
ここで、正規方程式回路25の説明のために、複数個の高音質オーディオデータから通常のオーディオデータへの変換式の学習とその予測式を用いた信号変換について述べる。以下に、説明のために学習をより一般化してnサンプルによる予測を行う場合について説明する。オーディオデータのレベルをそれぞれx1 ,x2 ,‥‥,xn として、それぞれにpビットのADRCを行った結果の量子化データをq1 、‥‥、qn とする。
【0041】
このとき、この領域のクラスコードclass を式(2)のように定義する。上述のようにオーディオデータのレベルをそれぞれ、x1 ,x2 ,‥‥,xn とし、高音質オーディオデータのレベルをyとしたとき、クラスコード毎に、予測係数w1 ,w2 ,‥‥,wn によるnタップの線形推定式を設定する。これを式(4)に示す。学習前は、wn が未定係数である。
【0042】
【数4】
Figure 0003946812
【0043】
学習は、クラスコード毎に、複数のオーディオデータに対して行う。データサンプル数がmの場合、式(4)にしたがって、以下に示す式(5)が設定される。
【0044】
【数5】
Figure 0003946812
【0045】
m>nの場合、予測係数w1 、‥‥wn は、一意的に決まらないので、誤差ベクトルeの要素を以下の式(6)で定義して、式(7)を最小にする予測係数を求める。いわゆる、最小自乗法による解法である。
【0046】
【数6】
Figure 0003946812
【0047】
【数7】
Figure 0003946812
【0048】
ここで、式(7)のwn による偏微分係数を求める。それは以下の式(8)を”0”にするように、各wn (n =1〜6)を求めればよい。
【0049】
【数8】
Figure 0003946812
【0050】
以下、式(9)、式(10)のようにXij、Yi を定義すると、
【0051】
【数9】
Figure 0003946812
【0052】
【数10】
Figure 0003946812
【0053】
式(8)は、行列を用いて式(11)へ書き換えられる。
【0054】
【数11】
Figure 0003946812
【0055】
この方程式は、一般に正規方程式と呼ばれている。なお、ここでは、n=6である。
【0056】
全ての学習用のデータの入力が終了した後、正規方程式回路25は、各クラスコードclass に、式(11)に示す正規方程式を立てて、このデータを予測係数決定回路30に供給する。
【0057】
予測係数決定回路30は、正規方程式を掃き出し法等の一般的な行列解法を用いて、各wn について解き、各クラスコード毎に、予測係数を算出する。換言すると、上記式(11)を式(12)のように書き換え、
X・W=Y ・・・・・・・・・・(12)
掃き出し法等の行列解法により式(13)が求められ、クラスコード毎に予測係数の行列式Wが算出される。
【0058】
W=X-1・Y ・・・・・・・・・(13)
そして、予測係数決定回路30は、算出された予測係数をメモリテーブル31に書き込む。
【0059】
このような学習を行った結果、メモリテーブル31には、量子化データq1 、‥‥、q6 で規定されるパターン毎に、高音質オーディオデータyを推定するための統計的に最も真値に近い推定が出来る予測係数が各クラスコード毎に、格納される。このメモリテーブル31は、本発明のオーディオ信号変換装置において使用されるメモリテーブル14である。かかる処理により、線形推定式に従って通常のオーディオデータから高音質オーディオデータを作成するための予測係数の学習が終了する。
【0060】
以上のように、上記予測係数生成装置2は、オーディオ信号変換装置1で補間処理を行う程度を考慮して、間引き処理回路21で高音質のオーディオデータの間引き処理を行うことによって、かかる補間処理を行うための予測係数を生成することができる。換言すると、上記予測係数生成装置2は、間引き処理回路21の処理に応じて、オーディオデータのサンプル数を変えるための予測係数や、また、サンプル数を変えなくても真値に極めて近いオーディオデータを再現するための予測係数を生成することができる。
【0061】
なお、本実施の形態の説明では、圧縮データパターンを生成するパターン生成手段として、ADRC回路12,23を設けることにしたが、これはほんの一例であり、信号波形のパターンを少ないクラスで表現できるような情報圧縮手段であれば何を設けるかは自由であり、例えば、DPCM(予測符号化)、VQ(ベクトル量子化)等の圧縮手段を用いても良いのは勿論である。
【0062】
つぎに、上記オーディオ信号変換装置を用いたレートコンバータについて図4を参照しながら説明する。レートコンバータは、例えばサンプリング周波数の異なるディジタルオーディオ装置間でダビングをする際のサンプリング周波数の変換に用いられる。
【0063】
例えば、サンプリング周波数32kHz(=fs )のBS放送Aモード音声をサンプリング周波数44.1kHz(=fs')のミニディスク(MD)にディジタル録音する場合を考える。従来では、BS放送Aモード音声のサンプリング周波数を44.1kHzに変換するときに線形1次補間ディジタルフィルタを用いて不足データを補間していた。しかし、上記レートコンバータは、サンプリング周波数44.1kHzの正規のオーディオデータから生成された正規方程式の予測係数に基づいて、32kHzのオーディオデータから44.1kHzのオーディオデータの値を推定して補間するため、従来よりも波形再現性のよい高音質なオーディオデータを得ることができる。
【0064】
つぎに、上記オーディオ信号変換装置を用いたオーバーサンプリング処理装置について説明する。なお、上述した装置及び回路等と同じものについては同じ符号を付け、詳細な説明は省略する。
上記オーバーサンプリング処理装置は、図5に示すように、オーディオ信号変換部1と、D/Aコンバータ3と、アナログ・ポスト・フィルタ4とを備える。
【0065】
オーディオ信号変換部1は、上述したオーディオ信号処理1と同じものであり、入力端子から入力されるオーディオデータのサンプリング周波数fs をサンプリング周波数(N×fs )にするものである(N:自然数)。
【0066】
このオーディオ信号変換部1のメモリテーブル13には、オーディオデータのサンプリング周波数fs を(N×fs )に変換するための正規方程式の予測係数が記憶されている。上記予測係数は、図3に示す上記予測係数生成装置2の入力端子に正規のサンプリング周波数(N×fs )のオーディオデータを供給し、かつ、間引き処理回路21で間引き処理を行ってサンプリング周波数をfs にすることによって生成される。すなわち、この予測係数をメモリテーブル13に記憶させることにより、オーディオ信号変換部1は上述のサンプリング周波数を変換することができる。
【0067】
D/Aコンバータ3は、オーディオ信号変換部1からのオーディオデータをアナログ化して、オーディオ信号をアナログ・ポスト・フィルタ4に供給する。アナログ・ポスト・フィルタ4は、オーディオ信号の位相特性を配慮した緩やかな帯域制限処理を施して高音質のオーディオ信号を出力する。
【0068】
以上のように、上記オーバーサンプリング処理装置は、単にオーディオデータのサンプリング周波数をN倍に上げて線形補間処理をしたものをディジタル/アナログ変換するのではなく、本来のサンプリング周波数(N×fs )のオーディオデータを推定演算してからディジタル/アナログ変換することによって、正規のものに最も近いオーディオデータを生成してアナログ化することができ、線形補間した場合に比べてより高音質なオーディオ信号を得ることができる。
【0069】
また、オーバーサンプリング処理を上記オーディオ信号変換部1のみだけで行う必要はない。例えば、8倍のオーバーサンプリング処理を行う場合、2倍のオーバーサンプリング処理を上記オーディオ信号変換部1で行い、かかる処理後、4倍のオーバーサンプリング処理を線形補間によって行うことも可能である。
【0070】
つぎに、オーディオ信号変換装置を用いたPCM(Pulse Code Modulation)エラー修正装置について説明する。
BS放送やCS放送で利用されているPCMディジタル音声は、伝送時のエラーに対してブロック符号化とビットインターリーブ処理が行われ、伝送エラーの検出とその訂正がビット単位で行われている。しかし、長時間にわたるバーストエラー発生時には、そのエラー訂正能力を超えるため、線形1次補間又は前値保持によって失われたデータを1サンプル単位で補っている。
【0071】
従来では、1サンプルの欠落については線形1次補間で行って、それ以上の欠落に対しては前値保持で補っていた。これに対して、上記PCMエラー修正装置は、1サンプル以上のエラーが生じてもエラーの修正を行うことができる。
【0072】
上記PCMエラー修正装置は、図6に示すように、符号化されたPCMビットストリームの復号を行うPCM復号部5と、欠落したデータの補間を行うオーディオ信号変換部1とを備える。
【0073】
PCM復号部5は、PCMビットストリームのデインターリーブ処理を行うビット・デインターリーブ回路51と、データの欠落の有無を検出するエラー検出訂正回路52とを有する。このエラー検出訂正回路52は、データの欠落があったときにデータ補間指示信号を出力する。
【0074】
オーディオ信号変換部1は、このデータ補間指示信号が供給されると、欠落した部分のオーディオデータの補間処理を開始する。このオーディオデータの補間処理は、メモリテーブル13に記憶されている正規方程式の予測係数に基づいて行われる。この予測係数は、図3に示す予測係数生成装置2にエラーのないオーディオデータを入力端子に供給して、間引き処理回路21でエラーが生じたような間引き処理を行うことによって生成される。
【0075】
以上のように、上記PCMエラー修正装置は、1サンプルから数サンプルのデータが欠落した場合であっても、正規のオーディオデータの値を推定演算して欠落したデータを補間することができる。すなわち、上記PCMエラー修正装置は、単に線形1次補間した場合に比べて、データが欠落する前のオーディオデータの波形の再現性を向上させることができる。
【0076】
つぎに、オーディオ信号変換装置を用いた狭帯域音声信号の高音質化装置について説明する。
上記高音質化装置は、図7に示すように、A/Dコンバータ6と、オーディオ信号変換部1と、D/Aコンバータ3とを備える。ここで、上記オーディオ信号変換部1は、例えばAMラジオ放送のような狭帯域音声信号のサンプリング周波数を上げて、高音質のオーディオデータを得るために用いる。
【0077】
これにより、A/Dコンバータ6に入力された通常のAM放送の音声信号は、上記オーディオ信号変換部1を介して、D/Aコンバータ3から高音質化されて出力される。
【0078】
以上のように、上記高音質化装置は、AMラジオ放送のような狭帯域の音声信号を受信する受信機に使用することによって、低品質な音声信号から高周波成分の波形を再現してより聞き取り易い音声を出力することができる。なお、同軸ケーブル等の狭帯域伝送媒体により音声信号が送信される電話機に上記高音質化装置を適用することも可能である。
【0079】
【発明の効果】
以上詳細に説明したように、本発明に係るオーディオ信号変換装置及び方法によれば、良好な波形再現性の実現による高音質なディジタルオーディオ信号を得ることができ、また、エラーが生じても元のディジタルオーディオ信号をほぼ完全に再現することができる。すなわち、上記オーディオ信号変換装置及び方法によって、高音質なエラー修正や低品質な音声信号の高音質化にも非常に有効である。
【0080】
本発明に係る予測係数生成装置及び方法によれば、間引き処理手段の間引き処理に応じて、オーディオデータのサンプル数を変えるための予測係数や、また、サンプル数を変えなくても真値に極めて近いオーディオデータを再現するための予測係数を生成することができる。
【0081】
本発明に係る予測係数格納媒体は、予測係数を提供して、この予測係数と入力されたディジタルオーディオ信号に基づいて、高音質で波形再現性のよいディジタルオーディオ信号を生成することができる。
【図面の簡単な説明】
【図1】本発明に係るディジタルオーディオ信号変換装置の構成を示すブロック図である。
【図2】補間前後のオーディオデータを示す図である。
【図3】本発明に係る予測係数生成装置の具体的な構成を示すブロック図である。
【図4】レートコンバータの構成を示すブロック図である。
【図5】オーバーサンプリング処理装置の構成を示すブロック図である。
【図6】PCMエラー修正装置の構成を示すブロック図である。
【図7】狭帯域音声信号の高音質化装置の構成を示すブロック図である。
【符号の説明】
11,22 時間軸領域切出回路、12,23 ADRC回路、13,24 クラスコード発生回路、14,27 メモリテーブル、15 推定演算回路、21 間引き処理回路、25 正規方程式回路、26 予測係数決定回路[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an audio signal conversion apparatus suitable for use in a rate converter, a PCM (Pulse Code Modulation) decoding apparatus, and the like, and more particularly to an audio signal conversion apparatus that performs data interpolation processing.
[0002]
[Prior art]
Conventionally, before a digital audio signal is input to a digital / analog (D / A) converter, an oversampling process for converting the sampling frequency to several times the original value is performed. As a result, the digital audio signal output from the D / A converter is kept constant at a high audible frequency range by the phase characteristic of the analog anti-alias filter, and the influence of digital image noise due to sampling is maintained. It has come to be excluded. In the oversampling process, a linear primary (linear) interpolation digital filter is usually used. Such a digital filter obtains an average value of a plurality of existing data and generates linear interpolation data when the sampling rate changes or data is lost.
[0003]
[Problems to be solved by the invention]
However, the digital audio signal after the oversampling process has a data amount that is several times finer in the time axis direction by linear linear interpolation, but the frequency band of the digital audio signal after the oversampling process is It has not changed much, and the sound quality itself has not improved. Furthermore, since the interpolated data is not necessarily generated based on the waveform of the analog audio signal before A / D conversion, the waveform reproducibility is hardly improved.
[0004]
In addition, when dubbing digital audio signals with different sampling frequencies, the frequency is converted using a sampling rate converter. Even in such a case, only linear data interpolation can be performed using a linear primary digital filter. Therefore, the sound quality and waveform reproducibility could not be improved. Further, the same applies when a data sample of the digital audio signal is lost.
[0005]
  The present invention has been made in view of such circumstances, and an audio signal conversion apparatus capable of improving the waveform reproducibility and sound quality of an audio signal.And audio signal conversion methodThe purpose is to provide.
[0006]
[Means for Solving the Problems]
  In order to solve the above-described problems, an audio signal conversion apparatus according to the present invention stores pattern generation means for generating a data pattern based on a digital audio signal, and a prediction coefficient of an estimation formula for converting the digital audio signal. A prediction coefficient storage means for outputting the prediction coefficient based on the generated data pattern; an estimation operation based on the prediction coefficient output from the prediction coefficient storage means and the digital audio signal; Estimating calculation means for outputting a finished digital audio signalThe prediction coefficient storage means includes a digital audio signal thinned out to reduce the sampling frequency of the digital audio signal, or a digital audio signal thinned out by deleting data samples of the digital audio signal. A prediction coefficient of an estimation formula for converting the digital audio signal calculated based on the data pattern generated based on the data pattern is stored.It is characterized by that.
[0007]
  An audio signal conversion method according to the present invention includes:A data pattern is generated based on a digital audio signal thinned out so as to reduce the sampling frequency of the digital audio signal for learning or a digital audio signal thinned out by deleting data samples of the digital audio signal. The prediction coefficient of the estimation formula for converting the digital audio signal based on the data pattern is calculated and stored and converted.A data pattern based on the digital audio signal is generated, the prediction coefficient is read based on the generated data pattern, and the read prediction coefficient and the aboveShould be convertedAn estimation operation is performed based on the digital audio signal, and the converted digital audio signal is output.
[0011]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
The present invention interpolates missing audio data when the sampling rate of a digital audio signal (hereinafter referred to as audio data) is increased or an error occurs in audio data, and is closest to the true value. Audio data (hereinafter referred to as audio interpolation data) is generated.
[0012]
Specifically, the present invention can be applied to the audio signal converter shown in FIG.
The audio signal conversion apparatus 1 includes a time axis region extraction circuit 11 that extracts audio data every predetermined time, an ADRC (Adaptive Dynamic Range Coding) circuit 12 that compresses the extracted audio data and generates a compressed data pattern, and A class code generation circuit 13 for generating a class code to which the cut-out audio data belongs, a memory table 14 in which a prediction coefficient of an estimation formula is stored for each class code, a prediction coefficient and the cut-out audio data And an estimation calculation circuit 15 for performing an estimation calculation based on the calculation.
[0013]
The time axis region cut-out circuit 11 divides the audio data shown in FIG. 2A supplied from the input terminal into regions for every predetermined time. Here, it is assumed that the time axis region dividing circuit 11 divides the audio data every 6 samples. The time axis region extraction circuit 11 supplies the audio data divided into blocks to the ADRC circuit 12 and the estimation calculation circuit 15.
[0014]
The ADRC circuit 12 forms pattern compressed data by performing operations such as compressing the audio data of each time axis region from 8 bits to 2 bits, for example, as described above, and this pattern compressed data is converted into a class code generating circuit. 13 is supplied.
[0015]
The ADRC circuit 12 normally performs adaptive quantization developed for high-efficiency encoding for a VTR (Video Tape Recorder). Here, the local pattern of the signal level can be efficiently expressed with a short word length, and therefore, it is used for code generation of the signal pattern class classification.
[0016]
Specifically, in the case of classifying six 8-bit audio data, 248It must be classified into a huge number of classes. Although it is ideal in terms of grasping the characteristics of the signal waveform, it is not practical because of the heavy load on the circuit. Therefore, class classification is performed based on the compressed pattern data generated by the ADRC circuit 12. For example, if 1-bit quantization is performed on 6 audio data, the 6 audio data can be represented by 6 bits.6= 64 classes can be classified.
[0017]
Here, the ADRC circuit 12 assumes that the dynamic range in the region is DR, the bit allocation is n, the data level of the pixels in the region is L, and the quantization code is Q, and the maximum in the region according to the following equation (1): The quantization is performed by equally dividing the value MAX and the minimum value MIN with a specified bit length.
[0018]
[Expression 1]
Figure 0003946812
[0019]
The ADRC circuit 12 compresses each audio data cut out by the time axis region cut-out circuit 11 into 2 bits. Note that the compressed audio data are q1 to q6, respectively.
[0020]
The class code generation circuit 13 performs an operation of the following equation (2) based on the pattern compression data supplied from the ADRC circuit 12, detects the class to which the block belongs, and stores the class code class indicating the class in the memory Supply to table 14. The class code class indicates a read address from the memory table 14.
[0021]
[Expression 2]
Figure 0003946812
[0022]
Here, n = 6 and P = 2.
[0023]
In the memory table 14, by learning the relationship between the audio data patterns before and after the interpolation, the prediction coefficient of the linear estimation formula for calculating the audio interpolation data corresponding to the audio data before the interpolation is determined for each class code. It is remembered. A method for creating a prediction coefficient stored in the memory table 14 will be described later. From the memory table 14, wn (class) (n = 1 to 6), which is a prediction coefficient of the class, is read from the address indicated by the class code class. This prediction coefficient is supplied to the estimation calculation circuit 15.
[0024]
Based on the audio data supplied from the time axis region cutout circuit 11 and the prediction coefficient wn (n = 1 to 6) supplied from the memory table 14, the estimation calculation circuit 15 converts the input audio data. Corresponding audio interpolation data is calculated.
[0025]
More specifically, the estimation calculation circuit 15 uses the audio data supplied from the time axis region cutout circuit 11 and the prediction coefficient supplied from the memory table 14 to obtain a prediction coefficient wn (n = 1 to 6). Based on this, the audio interpolation data is calculated by performing the calculation shown in the following equation (3).
[0026]
[Equation 3]
Figure 0003946812
[0027]
The calculated audio interpolation data shown in FIG. 2B is output via an output terminal.
[0028]
As described above, the audio signal conversion apparatus stores the prediction coefficient for estimating the audio interpolation data in the memory table 14, and uses the input audio data and the prediction coefficient read from the memory table 14. Audio interpolation data can be output by performing an estimation calculation based on the calculation. That is, the audio signal conversion apparatus performs an estimation operation based on a prediction coefficient obtained by learning described later from actual audio data, unlike the case where the input audio data is simply linearly interpolated. High-quality audio data can be output by reproducing close waveforms.
[0029]
In the present embodiment, the case where the memory table 13 in which the prediction coefficient is already stored is provided in the hardware for interpolating data, but the present invention is not limited to this.
[0030]
For example, a prediction coefficient may be stored together with normal audio data in a recording medium such as an optical disk, and the above-described audio signal conversion apparatus may be applied to an optical disk reproducing apparatus.
[0031]
At this time, the optical disk reproducing device reads the prediction coefficient before starting to read the audio data stored on the optical disk, and stores the prediction coefficient in the memory table 13. As a result, the optical disk reproducing apparatus can obtain high-quality audio data with good waveform reproducibility without replacing the memory table 13 for any audio data.
[0032]
Next, a prediction coefficient generation apparatus for creating (learning) prediction coefficients stored in the memory table 14 will be described with reference to FIG.
The prediction coefficient generation device stores the prediction coefficient in the memory table 14 by using high-quality audio data to be reproduced.
[0033]
As shown in FIG. 3, the prediction coefficient generation apparatus 2 includes a thinning processing circuit 21 that thins out high-quality audio data, a time axis region cutting circuit 22 that cuts out audio data at predetermined time intervals, and audio data that has been cut out. An ADRC circuit 23 that generates a compressed data pattern by compression, a class code generation circuit 24 that generates a class code based on the compressed data pattern, a normal equation circuit 25 that creates a normal equation for each class code, and the class A prediction coefficient determination circuit 26 that determines a prediction coefficient for each code, and a memory table 27 that stores the determined prediction coefficient are provided.
[0034]
In order to obtain the prediction coefficient by learning, first, it is necessary to form normal audio data obtained by thinning predetermined samples from already known high-quality audio data.
[0035]
Specifically, the thinning processing circuit 21 performs thinning processing on high-quality audio data supplied via the input terminal at predetermined time intervals to generate normal audio data, which is then converted into a time axis region cut. This is supplied to the output circuit 22. Note that the prediction coefficient to be generated varies depending on the degree of decimation in the decimation processing circuit 21, and furthermore, the audio data reproduced by the audio signal converter 1 described above also varies. For example, in order for the above-described audio signal conversion apparatus 1 to output audio data with a higher sampling frequency, a thinning process for reducing the sampling frequency is required. In addition, in order for the audio signal conversion apparatus 1 to output the audio data by supplementing the missing data sample, a thinning process for missing the data sample is required accordingly.
[0036]
The time axis region cutout circuit 22 divides the audio data supplied from the thinning processing circuit 21 into a plurality of regions. Specifically, the time axis region extraction circuit 22 functions in the same manner as the time axis region extraction circuit 11 described above. The time axis region extraction circuit 22 supplies audio data for each predetermined time to the ADRC circuit 23 and the normal equation circuit 25.
[0037]
As described above, the ADRC circuit 23 performs an operation for compressing all data or a part of the data in each area from, for example, 8-bit audio data to 2-bit audio data to form pattern compressed data. The pattern compression data is supplied to the class code generation circuit 24. The ADRC circuit 23 is the same as the ADRC circuit 12 described above.
[0038]
The class code generation circuit 24 is the same as the class code generation circuit 13 described above, and performs the calculation of the above equation (2) based on the pattern compression data supplied from the ADRC circuit 23. As a result, the class code generation circuit 24 detects the class to which the block belongs, and supplies the class code indicating the class to the normal equation circuit 25.
[0039]
The normal equation circuit 25 includes each class code class supplied from the class code generation circuit 24, audio data x1, x2,..., Xn supplied from the time axis region cutout circuit 22 for each class code class, input terminal. A normal equation to be described later is established using the high-quality audio data y supplied more.
[0040]
Here, in order to explain the normal equation circuit 25, learning of a conversion formula from a plurality of high-quality audio data to normal audio data and signal conversion using the prediction formula will be described. Hereinafter, for the sake of explanation, a case in which learning is more generalized and prediction using n samples is performed will be described. The audio data levels are x1, x2,..., Xn, respectively, and the quantized data resulting from p-bit ADRC is q1,.
[0041]
At this time, the class code class of this area is defined as in equation (2). As described above, when the audio data level is x1, x2,..., Xn and the high-quality audio data level is y, n by the prediction coefficients w1, w2,. Sets the linear estimation formula for taps. This is shown in equation (4). Before learning, wn is an undetermined coefficient.
[0042]
[Expression 4]
Figure 0003946812
[0043]
Learning is performed on a plurality of audio data for each class code. When the number of data samples is m, the following equation (5) is set according to equation (4).
[0044]
[Equation 5]
Figure 0003946812
[0045]
When m> n, the prediction coefficients w 1,..., wn are not uniquely determined, so that the elements of the error vector e are defined by the following equation (6), and the prediction coefficient that minimizes the equation (7) is Ask. This is a so-called least square method.
[0046]
[Formula 6]
Figure 0003946812
[0047]
[Expression 7]
Figure 0003946812
[0048]
Here, the partial differential coefficient according to wn in equation (7) is obtained. It is only necessary to obtain each wn (n = 1 to 6) so that the following expression (8) is set to “0”.
[0049]
[Equation 8]
Figure 0003946812
[0050]
In the following, if Xij and Yi are defined as shown in equations (9) and (10),
[0051]
[Equation 9]
Figure 0003946812
[0052]
[Expression 10]
Figure 0003946812
[0053]
Equation (8) can be rewritten to Equation (11) using a matrix.
[0054]
## EQU11 ##
Figure 0003946812
[0055]
This equation is generally called a normal equation. Here, n = 6.
[0056]
After the input of all the learning data is completed, the normal equation circuit 25 sets up a normal equation shown in Expression (11) for each class code class and supplies this data to the prediction coefficient determination circuit 30.
[0057]
The prediction coefficient determination circuit 30 solves each wn by using a general matrix solution method such as a sweep-out method, and calculates a prediction coefficient for each class code. In other words, the above equation (11) is rewritten as equation (12),
X · W = Y (12)
Equation (13) is obtained by a matrix solution method such as a sweep-out method, and a determinant W of a prediction coefficient is calculated for each class code.
[0058]
W = X-1・ Y ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ (13)
Then, the prediction coefficient determination circuit 30 writes the calculated prediction coefficient in the memory table 31.
[0059]
As a result of such learning, the memory table 31 is statistically closest to the true value for estimating the high-quality audio data y for each pattern defined by the quantized data q1,..., Q6. Prediction coefficients that can be estimated are stored for each class code. This memory table 31 is the memory table 14 used in the audio signal converter of the present invention. With this processing, the learning of the prediction coefficient for creating high-quality audio data from normal audio data according to the linear estimation formula is completed.
[0060]
As described above, the prediction coefficient generation device 2 performs the interpolation processing by performing the thinning processing on the high-quality audio data in the thinning processing circuit 21 in consideration of the degree to which the audio signal conversion device 1 performs the interpolation processing. The prediction coefficient for performing can be generated. In other words, the prediction coefficient generation device 2 performs the prediction coefficient for changing the number of samples of audio data in accordance with the processing of the thinning-out processing circuit 21, or audio data that is extremely close to the true value without changing the number of samples. The prediction coefficient for reproducing can be generated.
[0061]
In the description of the present embodiment, the ADRC circuits 12 and 23 are provided as the pattern generation means for generating the compressed data pattern. However, this is only an example, and the signal waveform pattern can be expressed by a small number of classes. Any information compression means such as this can be provided, and for example, compression means such as DPCM (predictive coding) and VQ (vector quantization) may be used.
[0062]
Next, a rate converter using the audio signal converter will be described with reference to FIG. The rate converter is used, for example, for converting the sampling frequency when dubbing between digital audio devices having different sampling frequencies.
[0063]
For example, a sampling frequency of 32 kHz (= fs ) BS recording A mode audio is digitally recorded on a mini-disc (MD) having a sampling frequency of 44.1 kHz (= fs ′). Conventionally, when converting the sampling frequency of BS broadcast A-mode audio to 44.1 kHz, the deficient data is interpolated using a linear primary interpolation digital filter. However, the rate converter estimates and interpolates the value of the audio data of 44.1 kHz from the audio data of 32 kHz based on the prediction coefficient of the normal equation generated from the normal audio data of the sampling frequency of 44.1 kHz. Therefore, it is possible to obtain high-quality audio data with better waveform reproducibility than before.
[0064]
Next, an oversampling processing apparatus using the audio signal conversion apparatus will be described. In addition, the same code | symbol is attached about the same thing as the apparatus, circuit, etc. which were mentioned above, and detailed description is abbreviate | omitted.
As shown in FIG. 5, the oversampling processing apparatus includes an audio signal conversion unit 1, a D / A converter 3, and an analog post filter 4.
[0065]
The audio signal conversion unit 1 is the same as the audio signal processing 1 described above, and the sampling frequency f of the audio data input from the input terminalsIs the sampling frequency (N × fs) (N: natural number).
[0066]
In the memory table 13 of the audio signal converter 1, the sampling frequency f of the audio data is stored.s(N × fsThe prediction coefficient of the normal equation for conversion into () is stored. The prediction coefficient is input to the input terminal of the prediction coefficient generation device 2 shown in FIG.s) Audio data and the thinning processing circuit 21 performs the thinning process to obtain the sampling frequency f.sIs generated by That is, by storing this prediction coefficient in the memory table 13, the audio signal conversion unit 1 can convert the above-described sampling frequency.
[0067]
The D / A converter 3 converts the audio data from the audio signal converter 1 into an analog signal and supplies the audio signal to the analog post filter 4. The analog post filter 4 outputs a high-quality audio signal by performing a gentle band limiting process considering the phase characteristics of the audio signal.
[0068]
As described above, the oversampling apparatus does not simply perform digital / analog conversion on the linearly interpolated processing by increasing the sampling frequency of the audio data by N times, but does not convert the original sampling frequency (N × fs) Audio data is estimated and then digital / analog converted to produce the analog data that is closest to the normal one, which can be converted to analog, resulting in a higher-quality audio signal than when linear interpolation is performed. Can be obtained.
[0069]
Further, it is not necessary to perform the oversampling process only with the audio signal converter 1. For example, when 8 times oversampling processing is performed, it is also possible to perform 2 times oversampling processing by the audio signal conversion unit 1 and to perform 4 times oversampling processing by linear interpolation after such processing.
[0070]
Next, a PCM (Pulse Code Modulation) error correction device using an audio signal conversion device will be described.
PCM digital audio used in BS broadcasting and CS broadcasting is subjected to block coding and bit interleaving processing for transmission errors, and transmission errors are detected and corrected in bit units. However, when a burst error occurs for a long time, the error correction capability is exceeded. Therefore, data lost by linear primary interpolation or holding the previous value is compensated in units of one sample.
[0071]
Conventionally, the missing of one sample is performed by linear linear interpolation, and the remaining missing is compensated by holding the previous value. In contrast, the PCM error correction apparatus can correct an error even if an error of one sample or more occurs.
[0072]
As shown in FIG. 6, the PCM error correction apparatus includes a PCM decoding unit 5 that decodes an encoded PCM bitstream and an audio signal conversion unit 1 that performs interpolation of missing data.
[0073]
The PCM decoding unit 5 includes a bit deinterleaving circuit 51 that performs deinterleaving processing of the PCM bitstream, and an error detection and correction circuit 52 that detects the presence or absence of data loss. The error detection / correction circuit 52 outputs a data interpolation instruction signal when data is missing.
[0074]
When this data interpolation instruction signal is supplied, the audio signal conversion unit 1 starts an interpolation process of the missing audio data. This audio data interpolation processing is performed based on the prediction coefficient of the normal equation stored in the memory table 13. This prediction coefficient is generated by supplying audio data without error to the prediction coefficient generation apparatus 2 shown in FIG. 3 to the input terminal and performing a thinning process such that an error has occurred in the thinning processing circuit 21.
[0075]
As described above, the PCM error correction apparatus can estimate the value of normal audio data and interpolate the missing data even when data from one sample to several samples is missing. That is, the PCM error correction apparatus can improve the reproducibility of the waveform of the audio data before the data is lost, compared with the case where the linear linear interpolation is simply performed.
[0076]
Next, a device for improving the sound quality of a narrowband audio signal using the audio signal conversion device will be described.
As shown in FIG. 7, the high quality sound device includes an A / D converter 6, an audio signal converter 1, and a D / A converter 3. Here, the audio signal conversion unit 1 is used to increase the sampling frequency of a narrowband audio signal such as AM radio broadcast to obtain high-quality audio data.
[0077]
As a result, the audio signal of the normal AM broadcast input to the A / D converter 6 is output from the D / A converter 3 with high sound quality via the audio signal converter 1.
[0078]
As described above, the above-described sound quality improvement apparatus reproduces a waveform of a high-frequency component from a low-quality sound signal by using it for a receiver that receives a narrow-band sound signal such as AM radio broadcasting, and thus can be heard more. Easy voice can be output. It should be noted that the above-described sound quality improving device can be applied to a telephone to which an audio signal is transmitted by a narrow band transmission medium such as a coaxial cable.
[0079]
【The invention's effect】
As described above in detail, according to the audio signal conversion apparatus and method of the present invention, it is possible to obtain a high-quality digital audio signal by realizing good waveform reproducibility, and even if an error occurs, The digital audio signal can be reproduced almost completely. In other words, the audio signal conversion apparatus and method are very effective for correcting errors in high sound quality and improving the sound quality of low-quality audio signals.
[0080]
According to the prediction coefficient generation apparatus and method of the present invention, a prediction coefficient for changing the number of samples of audio data in accordance with the thinning process of the thinning processing unit, or a true value without changing the number of samples. Prediction coefficients for reproducing near audio data can be generated.
[0081]
The prediction coefficient storage medium according to the present invention can provide a prediction coefficient and generate a digital audio signal having high sound quality and good waveform reproducibility based on the prediction coefficient and the input digital audio signal.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a digital audio signal conversion apparatus according to the present invention.
FIG. 2 is a diagram illustrating audio data before and after interpolation.
FIG. 3 is a block diagram showing a specific configuration of a prediction coefficient generation device according to the present invention.
FIG. 4 is a block diagram showing a configuration of a rate converter.
FIG. 5 is a block diagram showing a configuration of an oversampling processing device.
FIG. 6 is a block diagram showing a configuration of a PCM error correction apparatus.
FIG. 7 is a block diagram illustrating a configuration of a sound quality enhancing device for a narrowband audio signal.
[Explanation of symbols]
11, 22 Time axis region cut-out circuit, 12, 23 ADRC circuit, 13, 24 class code generation circuit, 14, 27 memory table, 15 estimation calculation circuit, 21 decimation processing circuit, 25 normal equation circuit, 26 prediction coefficient determination circuit

Claims (8)

ディジタルオーディオ信号に基づいたデータパターンを生成するパターン生成手段と、
ディジタルオーディオ信号を変換するための推定式の予測係数を記憶し、生成された上記データパターンに基づいて、上記予測係数を出力する予測係数記憶手段と、
上記予測係数記憶手段から出力された予測係数と上記ディジタルオーディオ信号に基づいて推定演算して、変換処理済みのディジタルオーディオ信号を出力する推定演算手段とを備え、
上記予測係数記憶手段には、ディジタルオーディオ信号のサンプリング周波数を小さくするように間引かれたディジタルオーディオ信号、又は、ディジタルオーディオ信号のデータサンプルを欠落させることにより間引かれたディジタルオーディオ信号に基づいて生成されたデータパターンに基づいて算出された上記ディジタルオーディオ信号を変換するための推定式の予測係数が記憶されていることを特徴とするオーディオ信号変換装置。
Pattern generating means for generating a data pattern based on the digital audio signal;
Prediction coefficient storage means for storing a prediction coefficient of an estimation formula for converting a digital audio signal and outputting the prediction coefficient based on the generated data pattern;
An estimation calculation unit that performs estimation calculation based on the prediction coefficient output from the prediction coefficient storage unit and the digital audio signal, and outputs a converted digital audio signal ;
The prediction coefficient storage means is based on a digital audio signal thinned out so as to reduce the sampling frequency of the digital audio signal or a digital audio signal thinned out by deleting data samples of the digital audio signal. An audio signal conversion apparatus, wherein a prediction coefficient of an estimation formula for converting the digital audio signal calculated based on the generated data pattern is stored .
上記予測係数記憶手段は、ディジタルオーディオ信号を所定のサンプリング周波数に変換するための推定式の予測係数が記憶され、上記推定演算手段は、上記所定のサンプリング周波数に変換されたディジタルオーディオ信号を出力することを特徴とする請求項1記載のオーディオ信号変換装置。  The prediction coefficient storage means stores a prediction coefficient of an estimation formula for converting the digital audio signal to a predetermined sampling frequency, and the estimation calculation means outputs the digital audio signal converted to the predetermined sampling frequency. The audio signal conversion apparatus according to claim 1, wherein: 上記所定のサンプリング周波数に変換されたディジタルオーディオ信号をアナログ化するディジタル/アナログ変換手段を備えることを特徴とする請求項2記載のオーディオ信号変換装置。  3. An audio signal conversion apparatus according to claim 2, further comprising digital / analog conversion means for converting the digital audio signal converted to the predetermined sampling frequency into an analog signal. 所定時間毎にディジタルオーディオ信号を切り出す信号切出手段を更に備え、切り出されたディジタルオーディオ信号に基づいてデータパターンを生成し、
上記推定演算手段は、上記切り出されたディジタルオーディオ信号に基づいて推定演算して、変換処理済みのディジタルオーディオ信号を出力することを特徴とする請求項1記載のオーディオ信号変換装置。
A signal cutting means for cutting out the digital audio signal every predetermined time, and generating a data pattern based on the cut out digital audio signal;
2. The audio signal conversion apparatus according to claim 1, wherein the estimation calculation means performs an estimation calculation based on the extracted digital audio signal and outputs a converted digital audio signal.
圧縮符号化されたビットストリームを復号するとともに、復号されたディジタルオーディオ信号のエラーを検出する復号手段を更に備え、
上記信号切出手段は、エラー検出された部分のディジタルオーディオ信号を切り出すことを特徴とする請求項4記載のオーディオ信号変換装置。
Decoding means for decoding the compression-encoded bitstream and detecting errors in the decoded digital audio signal;
5. The audio signal conversion apparatus according to claim 4, wherein the signal cutout means cuts out a digital audio signal of a portion where an error is detected.
上記予測係数記憶手段は、欠落したディジタルオーディオ信号を補間するための推定式の予測係数が記憶され、上記推定演算手段は、欠落したディジタルオーディオ信号を生成して、エラー修正済みのディジタルオーディオ信号を出力することを特徴とする請求項5記載のオーディオ信号変換装置。  The prediction coefficient storage means stores a prediction coefficient of an estimation formula for interpolating the missing digital audio signal, and the estimation calculation means generates the missing digital audio signal and outputs the error-corrected digital audio signal. 6. The audio signal converter according to claim 5, wherein the audio signal converter is output. 上記パターン生成手段により生成された圧縮データパターンに基づいて、上記切り出されたディジタルオーディオ信号の属するクラスコードを発生するクラスコード発生手段を更に備え、
上記予測係数記憶手段は、ディジタルオーディオ信号を変換するための推定式の予測係数がクラスコード毎に、記憶され、上記クラスコード発生手段で発生されたクラスの予測係数を出力することを特徴とする請求項4に記載のオーディオ信号変換装置。
Based on the compressed data pattern generated by said pattern generating means further comprises a class code generating means for generating a class code belongs the cut out digital audio signal,
The prediction coefficient storage means stores a prediction coefficient of an estimation formula for converting a digital audio signal for each class code, and outputs the prediction coefficient of the class generated by the class code generation means. The audio signal converter according to claim 4.
学習用のディジタルオーディオ信号のサンプリング周波数を小さくするように間引かれたディジタルオーディオ信号、又は、ディジタルオーディオ信号のデータサンプルを欠落させることにより間引かれたディジタルオーディオ信号に基づいてデータパターンを生成し、上記データパターンに基づいてディジタルオーディオ信号を変換するための推定式の予測係数を算出して記憶しておき、
変換すべきディジタルオーディオ信号に基づいたデータパターンを生成し、
生成された上記データパターンに基づいて上記予測係数を読み出し、
上記読み出された予測係数と上記変換すべきディジタルオーディオ信号に基づいて推定演算して、変換処理済みのディジタルオーディオ信号を出力することを特徴とするオーディオ信号変換方法。
A data pattern is generated based on a digital audio signal thinned out so as to reduce the sampling frequency of the digital audio signal for learning or a digital audio signal thinned out by deleting data samples of the digital audio signal. , Calculating and storing a prediction coefficient of an estimation formula for converting the digital audio signal based on the data pattern,
Generate a data pattern based on the digital audio signal to be converted ,
Read the prediction coefficient based on the generated data pattern,
An audio signal conversion method comprising: performing an estimation operation based on the read prediction coefficient and the digital audio signal to be converted, and outputting a converted digital audio signal.
JP12132997A 1997-05-12 1997-05-12 Audio signal conversion apparatus and audio signal conversion method Expired - Fee Related JP3946812B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12132997A JP3946812B2 (en) 1997-05-12 1997-05-12 Audio signal conversion apparatus and audio signal conversion method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12132997A JP3946812B2 (en) 1997-05-12 1997-05-12 Audio signal conversion apparatus and audio signal conversion method

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2004311136A Division JP3947191B2 (en) 2004-10-26 2004-10-26 Prediction coefficient generation device and prediction coefficient generation method

Publications (2)

Publication Number Publication Date
JPH10313251A JPH10313251A (en) 1998-11-24
JP3946812B2 true JP3946812B2 (en) 2007-07-18

Family

ID=14808570

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12132997A Expired - Fee Related JP3946812B2 (en) 1997-05-12 1997-05-12 Audio signal conversion apparatus and audio signal conversion method

Country Status (1)

Country Link
JP (1) JP3946812B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013154027A1 (en) * 2012-04-13 2013-10-17 ソニー株式会社 Decoding device and method, audio signal processing device and method, and program

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100657776B1 (en) 1998-09-30 2006-12-15 소니 가부시끼 가이샤 Arithmetic Device, Converter, And Their Methods
JP4645867B2 (en) * 2000-08-02 2011-03-09 ソニー株式会社 DIGITAL SIGNAL PROCESSING METHOD, LEARNING METHOD, DEVICE THEREOF, AND PROGRAM STORAGE MEDIUM
JP4645869B2 (en) * 2000-08-02 2011-03-09 ソニー株式会社 DIGITAL SIGNAL PROCESSING METHOD, LEARNING METHOD, DEVICE THEREOF, AND PROGRAM STORAGE MEDIUM
JP4538705B2 (en) 2000-08-02 2010-09-08 ソニー株式会社 Digital signal processing method, learning method and apparatus, and program storage medium
JP4596196B2 (en) 2000-08-02 2010-12-08 ソニー株式会社 Digital signal processing method, learning method and apparatus, and program storage medium
JP4596197B2 (en) * 2000-08-02 2010-12-08 ソニー株式会社 Digital signal processing method, learning method and apparatus, and program storage medium
JP4645868B2 (en) * 2000-08-02 2011-03-09 ソニー株式会社 DIGITAL SIGNAL PROCESSING METHOD, LEARNING METHOD, DEVICE THEREOF, AND PROGRAM STORAGE MEDIUM
JP4645866B2 (en) * 2000-08-02 2011-03-09 ソニー株式会社 DIGITAL SIGNAL PROCESSING METHOD, LEARNING METHOD, DEVICE THEREOF, AND PROGRAM STORAGE MEDIUM
EP1944759B1 (en) * 2000-08-09 2010-10-20 Sony Corporation Voice data processing device and processing method
JP4505701B2 (en) * 2000-10-31 2010-07-21 ソニー株式会社 Information processing apparatus, information processing method, and program recording medium
US7082220B2 (en) 2001-01-25 2006-07-25 Sony Corporation Data processing apparatus
JP4507046B2 (en) * 2001-01-25 2010-07-21 ソニー株式会社 Data processing apparatus, data processing method, program, and recording medium
KR100505471B1 (en) * 2002-12-11 2005-07-29 학교법인 명지학원 A waveform generation method using data conversion
BRPI0807594A2 (en) 2007-12-18 2014-07-22 Sony Corp DATA PROCESSING DEVICE, DATA PROCESSING METHOD AND STORAGE
DE102008015702B4 (en) * 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for bandwidth expansion of an audio signal
CN114255788B (en) * 2020-09-21 2024-04-09 炬芯科技股份有限公司 Asynchronous sampling conversion method and conversion device thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013154027A1 (en) * 2012-04-13 2013-10-17 ソニー株式会社 Decoding device and method, audio signal processing device and method, and program

Also Published As

Publication number Publication date
JPH10313251A (en) 1998-11-24

Similar Documents

Publication Publication Date Title
JP3946812B2 (en) Audio signal conversion apparatus and audio signal conversion method
JP3802088B2 (en) Long-time playback digital video signal recording and playback device
JPH05137113A (en) Digital vtr
JP2007504503A (en) Low bit rate audio encoding
JPWO2002080573A1 (en) Quantizer, quantization method, quantization program, and recording medium
US20070118362A1 (en) Audio compression/decompression device
US7584008B2 (en) Digital signal processing method, learning method, apparatuses for them, and program storage medium
JP4567412B2 (en) Audio playback device and audio playback method
JP3947191B2 (en) Prediction coefficient generation device and prediction coefficient generation method
JP3193515B2 (en) Voice coded communication system and apparatus therefor
JP4180124B2 (en) Data prediction in transmission systems.
JPH05303399A (en) Audio time axis companding device
JP3688064B2 (en) Image compression method and image compression apparatus
US20030182107A1 (en) Voice signal synthesizing method and device
JP2821124B2 (en) Decoding method and decoding device
JP3262941B2 (en) Subband split coded audio decoder
JP3816859B2 (en) Digital signal encoding method, decoding method, encoder and decoder thereof, and program thereof
JP3807599B2 (en) Recording device
JPH0241936B2 (en)
JPH0813139B2 (en) Encoder
JPS63272273A (en) Picture compression system
JP2002014698A (en) Audio reproducing device, and video and audio decoding device
JPH08314498A (en) Adaptive conversion encoding audio signal decoder
JPH0233283A (en) High efficiency coding device
JPH01128623A (en) Digital signal transmission equipment

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041026

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050407

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070412

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100420

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110420

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110420

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120420

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120420

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130420

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130420

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140420

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees