JP3974408B2 - 標本化信号生成装置及び標本化信号再生装置並びにその方法 - Google Patents
標本化信号生成装置及び標本化信号再生装置並びにその方法 Download PDFInfo
- Publication number
- JP3974408B2 JP3974408B2 JP2002011901A JP2002011901A JP3974408B2 JP 3974408 B2 JP3974408 B2 JP 3974408B2 JP 2002011901 A JP2002011901 A JP 2002011901A JP 2002011901 A JP2002011901 A JP 2002011901A JP 3974408 B2 JP3974408 B2 JP 3974408B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- sampling
- resolution
- sampled
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
- Analogue/Digital Conversion (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
【発明の属する技術分野】
この発明は、ニューラルネットを利用してオーディオ若しくは画像等の標本化信号を生成する装置及び前記装置にて生成した標本化信号を再生するための装置に関し、更には、その方法に関する。
【0002】
【従来の技術】
周知の通り、標本化信号fsから原信号fを復元するに際して、標本化信号fsの標本化周期をTsとし、時間をtとすると、標本化定理は下記の式(1)にて表される。
【数1】
上記式において、sin[π/Ts*(t−nTs)]/[π/Ts*(t−nTs)は、sinc関数特性を示しており、標本化周期Tsでサンプリングした各n番目(−∞<n<∞)の標本値f(nTs)を、前記sinc関数を係数として−∞から∞の間で畳み込みすれば、原信号fのある時点tにおける信号f(t)を復元することができることを示している。
ところで、周知のように標本化定理によって標本化信号から原信号の復元を行うと、復元された信号においては標本化周期Tsの1/2(ナイキスト周波数)より上の波形成分はカットされてしまう。例えば、音楽用コンパクトディスク(CD)の場合、通常は標本化周波数約44kHzにて標本化しているため、復元信号(つまり再生音)において略々20kHz以上の高調波成分はカットされている。しかしながら、例えば実際の楽器音等のオーディオ波形の周波数スペクトラムは20kHz以上の高い成分を含んでおり、その高調波成分の含み具合の異なり様によって種々の音色の違いが生じる以上、オーディオ再生音においても高調波成分を含む高品質な音を再現できる方が望ましく、未だにアナログ盤が根強い人気を保っているのも、高調波成分を含む高品質な再生音のためといえよう。勿論、標本化周波数(標本化周期Ts)を高く設定することで高周波成分を含む高品質な再生音を得ることも可能だが、そのように細かい周期でサンプリングすると標本化信号に必要なデータ量が膨大に増加してしまい、莫大な記憶容量が必要となるため、例えば通常のCD1枚に記録できる収録時間等の実質的な記憶内容量が減少する等、種々の不都合が生じていた。従って、通常のCDにあっては、現状のデータ量を維持したまま高周波成分を含ませて音質の向上を図ることはできなかった。
【0003】
一方、元の標本化周波数を上げることなくオーバーサンプリングして再生することにより、ナイキスト周波数を上げ、再生音中により高域の成分を含ませることができるようにすることが知られている。すなわち、前記式(1)を変形すると下記の式(2)が得られ、これに基づきオーバーサンプリング再生を行う。
【数2】
式(2)において、fsは原信号fを標本化周期Tsでサンプリングした標本化信号の標本値であり、τはTsよりも細かい所定の周期(オーバーサンプリング周期)であり、Tsはτの整数倍である。fs(t−nτ)は、時刻t−nτにおける標本化信号fsの標本値を示し、時刻t−nτがTsの整数倍のとき実質的な標本値を持ち、それ以外のとき0である。式(2)は、標本化周期Tsで標本化した信号fsに対して、Tsよりも細かな周期τの分解能で畳み込み演算することを示している。すなわち、標本化周期Tsの標本化信号fsに基づき、Tsよりも細かな周期τの分解能で、原信号fの復元を行うことができることを示している。この畳み込み演算は、周期τのタイミングで動作するディジタルフィルタで、標本化周期Tsの標本化信号fsを処理することにより実現される。この場合、重み係数すなわちフィルタ係数としては、式(2)に示すような{sin[π*nτ/Ts]}/[π*nτ/Ts]というsinc関数が、有限個のnに関して固定値として与えられる。
しかし、このような従来のオーバーサンプリングによる再生にあっては、ナイキスト周波数を見かけ上高くすることで再生音中により高域の成分を含ませることができるにしても、予め固定されたsinc関数の重み付け特性でしか畳み込み演算が行われないため、原信号fの波形を精度よく忠実に再現するには限界があった。
音楽用CD等の物理的記憶媒体において標本化信号から原信号を復元する場合に限らず、例えば、近年通信ネットワークを介して盛んに行われている音楽データや画像データの伝送及び再生・復元においても同様の問題がある。
【0004】
【発明が解決しようとする課題】
この発明は上述の点に鑑みてなされたもので、標本化信号のデータ量を増すことなしに、その標本化周波数以上の精度で原信号を忠実に復元できるようにした標本化信号生成装置及び標本化信号再生装置並びにその方法を提供しようとするものである。
【0005】
【課題を解決するための手段】
本発明の請求項1に係る標本化信号生成装置は、原信号を所定の第1の分解能で標本化した標本化信号を提供する手段と、前記原信号を前記第1の分解能よりも細かい第2の分解能で標本化した教師信号を提供する手段と、前記標本化信号と前記教師信号を入力し、前記標本化信号と演算する重み係数を前記教師信号に基づく学習により生成するニューラルネットワークとを具え、前記生成した重み係数を前記標本化信号に付属させて出力することを特徴とする。
教師信号は第1の分解能よりも細かい第2の分解能で標本化したものなので、標本化信号よりも原信号の特性に近い高品質なデータである。よって、教師信号に基づく学習により生成された重み係数は、教師信号の原信号再現精度と同等の品質の波形を再現しうるものである。しかも重み係数のデータ量は標本値それ自体よりもはるかに少ない。また、標本化信号は教師信号よりも分解能が粗いので、教師信号に比べてはるかにデータ量が少ない。よって、標本化信号とそれに付属する重み係数との組み合わせからなるデータセットは、教師信号の原信号再現精度と同等の品質の波形を再現しうるものでありながら、そのデータ量が少なくて済む。
【0006】
また、本発明の請求項2に係る標本化信号再生装置は、請求項1の標本化信号生成装置で出力した前記標本化信号及びそれに付属する前記重み係数に基づき前記原信号を復元する装置であって、前記標本化信号を前記第1の分解能に対応する第1の周期で再生する手段と、前記第2の分解能に対応する第2の周期に従って、再生された前記標本化信号とそれに付属する前記重み係数とを演算するニューラルネットワークとを具え、前記第2の分解能に対応する精度で前記原信号を復元した出力信号が前記ニューラルネットから出力されることを特徴とする。
ここで使用する重み係数は、教師信号に基づく学習により生成されたものであるから、教師信号の原信号再現精度と同等の品質の波形を再現しうるものであり、教師信号の原信号再現性能に見合った可変の重み付け特性で演算が行われることになり、原信号の波形を精度よく忠実に再現することができる。
【0007】
また本発明は、装置の発明として構成し実施することができるのみならず、方法の発明として構成し実施することもできる。
【0008】
また本発明に係る記憶媒体は、原信号を所定の第1の分解能で標本化した標本化信号と、前記原信号を前記第1の分解能よりも細かい第2の分解能で標本化した教師信号を用いた学習により求められた前記標本化信号と演算すべき重み係数とを組み合わせて前記原信号の標本化データとして記憶したことを特徴とする。
更に、本発明に係るデータ伝送方式は、信号を所定の第1の分解能で標本化した標本化信号と、前記原信号を前記第1の分解能よりも細かい第2の分解能で標本化した教師信号を用いた学習により求められた前記標本化信号と演算すべき重み係数とを組み合わせて前記原信号の標本化データとして伝送することを特徴とする。
【0009】
前記原信号を複数の区間に分割し、各区間に対応して前記重み係数のセットをそれぞれ有するようにすれば好ましく、原信号の再現精度をより一層向上させることができる。
【0010】
【発明の実施形態】
以下、添付図面を参照して本発明の一実施例として、楽曲のオーディオ波形を標本化した標本化信号からの原信号復元について説明する。
まず、データ供給側における必要なデータ生成処理の概略について、図1の本発明の一実施例の基本的ブロック図を参照して説明すると、図1において、10は教師付きニューラルネットワーク、20は標本化信号供給源、21は教師信号供給源、である。ニューラルネットワーク10は、概ね、遅延ライン11と、畳み込み演算部12と、教師付き学習部13とから構成される。詳しくは後述するが、このニューラルネットワーク10は、畳み込み演算部12にてニューラルネットワーク10に対して入力された標本化信号fsを所定の重み係数Wnで演算し、その演算結果である出力信号yが教師信号fzと同じ信号になるように、教師付き学習部13にて該重み係数Wnを該教師信号Fzに基づく学習により適切に変更(学習)して、この学習により生成した重み係数Wnを前記標本化信号fsに付属させて出力するものである。この出力した前記重み係数Wnのデータと前記標本化信号fsのデータを例えばCD等の記憶媒体に記憶して、データ受け手に対して提供することができる。
【0011】
標本化信号供給源20は、標本化周期Ts(第1の分解能)でサンプリングした標本化信号fsをニューラルネットワーク10に対して供給するものであり、標本化信号fsの波形図の一例を示すと図1中の(A)のようである。(A)において原信号fを点線で示している。標本化信号fs(t)は、この原信号fを分解能Tsで標本化した信号の、ある時点tにおけるデータである。標本化信号供給源20から実践的に供給されるデータとしては、例えば、復元したい楽曲のマスター音源を所定の標本化周期Ts(例えば通常のCD規格の標本化周波数(約44kHz)等)でサンプリングしたデータ等の任意のものを用いてよく、また、CD等に収録された既存のデータを使用することも可能である。
教師信号供給源21は、原信号fをより精密な標本化周期τ(第2の分解能)でサンプリングした教師信号fzをニューラルネットワーク10に対して供給するものである。教師信号fzの波形図の一例を示すと図1中の(B)のようである。(B)においても原信号fを点線で示している。教師信号fz(t)は、この原信号fを分解能τで標本化した信号の、ある時点tにおけるデータである。教師信号fzの標本化周期τは、標本化信号fsの標本化周期Tsの1/a倍(つまりaτ=Ts、但しaは整数)になっており、標本化信号fsの1標本化周期Ts中に、教師信号fzの1標本化周期τがa個入ることとなる。つまり、教師信号fzは前記標本化信号fsよりも精密な分解能のサンプリングデータである。よって、教師信号供給源21から供給されるデータとしては、復元したい楽曲オーディオ波形(原信号)を標本化周期τでサンプリングした高品質なデータを用いることになる。というのも、この教師信号fzを範として適切な重み係数Wnを生成し、この生成した重み係数Wnと標本化信号fsを演算することで、所望の高品質の出力信号を得ることが可能となるからである。
なお、図1中の波形図(A)及び(B)においては、一例として、標本化信号fsの1標本化周期Ts中に教師信号fzの標本化周期τが4個入っている。
【0012】
遅延ライン11は複数の遅延段から構成されており、図1において該複数の遅延段を遅延ライン11内の点線で示す。標本化信号供給源20から供給される標本化信号fs(t)は、この遅延ライン11に対して入力される。遅延ライン11はシフトコマンドCKによって動作制御される。このシフトコマンドCKは標本化周期τに相当する分解能のシフトコマンドとして機能するものであるが、実際の周期τでリアルタイムで発生されるものではなく、ニューラルネットワーク10における学習処理プログラムの進行に応じて非リアルタイムに発生されるものである。遅延ライン11に対して入力された標本化信号fs(t)は、一回のシフトコマンドCK毎に順次1段づつシフトされる。
【0013】
標本化信号供給源20は、シフトコマンドCKがa回発生する毎に、1サンプルの標本化信号fs(t)を順次出力し、遅延ライン11に入力する。図中、符号aCKはシフトコマンドCKがa回発生する毎に生じる出力コマンドを示す。この出力コマンドaCKに応じて、シフトコマンドCKのa回の発生機会のうち、1回で1サンプルの標本化信号fs(t)が遅延ライン11に入力され、残りのa−1回では0が遅延ライン11に入力される。
この遅延ライン11に対する標本化信号fs(t)の入力動作の一例について図2を参照して説明する。ここでは仮に、シフトコマンドCKに対応する分解能τを標本化信号fs(t)の標本化周期Tsに対して1/4(つまりTs=4τ)とする。また、遅延ライン11に入力される最新の入力データは図において左側の遅延段11aに入力されるものとする。
【0014】
シフトコマンドCKに対応する分解能τはTs/4であるから、標本化信号fs(t)の標本化周期Tsの1間隔につき、シフトコマンドCKは4回発生することになる。そのため、シフトコマンドCKの4回の発生機会のうち、1回で1サンプルの標本化信号fs(t)が遅延ライン11に入力され、残りの3回では0が遅延ライン11に入力される。例えば、fs(t)におけるtが周期Ts毎に0,1,2,…と変化するとすると、実質的な値を持つ標本値は図2においてfs(0),fs(1),fs(2),…で示され、これらはシフトコマンドCKが4回発生する毎に1回の割で遅延ライン11に入力される。図2において、fs(t)におけるtとして、1/4、2/4、3/4、のように分数で示されたものは、標本化周期Tsに同期していないものを示し、これらの値fs(1/4)、fs(2/4)、fs(3/4)としては前述の通り「0」が入力される。
具体例として、実質的な標本値を有する標本化信号fs(0)が最初の遅延段11aに入力されたとき、次に1シフトコマンドCKが発生すると、この標本化信号fs(0)は次の遅延段11bにシフトされ、遅延段11aには信号fs(1/4)の入力データとして値0が入力される。次のシフトコマンドCKが発生すると、これに応じて標本化信号fs(0)は次の遅延段11cにシフトし、また、遅延段11aの値0は次の遅延段11bにシフトし、遅延段11aには信号fs(2/4)の入力データとして値0が入力される。このように、1シフトコマンドに応じて、各遅延段のデータが図において右側の次段に順次シフトして、遅延段11aに新たなデータが入力される。次の3回目のシフトでは遅延段11aには信号fs(3/4)の入力データとして値0が入力され、4回目のシフトで、遅延段11aに対して実質的な標本値を有する標本化信号fs(1)が入力される。この時、各遅延段11a〜11eに対して、図2に示すように、11aにfs(1)、11bに0、11cに0、11dに0、11eにfs(0)、という具合にデータが入力されていることになる。
【0015】
畳み込み演算部12には、遅延ライン11の複数の遅延段に対応する複数の係数値を1セットとする重み係数Wnが入力されている。畳み込み演算部12では、前記複数の各遅延段に入力されているデータとそれに対応する各係数値とを乗算して、畳み込み演算する。この畳み込み演算については公知のため説明を省略する。上記の通り、遅延ライン11に対して分解能τでデータが入力されるので、畳み込み演算部12から、演算した結果として出力される出力信号y(t)も分解能τの信号である。ここで、既述の式(1)に示したsinc関数を1セットの重み係数Wnの初期値Wn’として設定すると、重み係数Wnは下記の式(3)のように表現される。
【数3】
このように重み係数Wnをsinc関数で初期設定したとき、当該ニューラルネットワーク10は既述の式(2)と等価なシステムである。この場合、図1に例示した各係数値W-2,W-1,W0,W1,W2は、それぞれ下記の式(4)、式(5)、式(6)、式(7)、式(8)のように記述される。
【数4】
式(3)にて表現されるsinc関数を図示すると図3のようである。1セットの重み係数Wnにおける各係数…W-2,W-1,W0,W1,W2,…は、図3に示すようなsinc関数においてW0を中心にしてτの分解能で左右にプロットされる有限個の係数群からなる。ここで、W0=1の重み係数が付与される標本値(これをfs(i)とする)のタイミングが現在サンプルタイミングであり、教師信号fz(t)としては該現在サンプルタイミングに対応する教師信号標本値(これをfz(i)とする) が使用される。現在サンプルタイミングとはシフトコマンドCK毎に進行する分解能τに対応する精度のサンプルタイミングのことである。尚、有限個の係数群からなる重み係数Wnの数は設計上任意に設定してよく、例えば1000個程度でも十分によい再生精度が得られる。
【0016】
教師信号供給源21は、分解能τに対応する精度からなる教師信号fz(t)の標本値を、シフトコマンドCKの発生毎に(すなわち現在サンプルタイミングの進行に伴って)順次出力し、これを教師付き学習部13に入力する。なお、例えば、標本化信号fs(t)のi番目の時刻tの標本値fs(i)が遅延ライン11で重み係数W0に対応する位置までシフトされてきたときに、同じi番目の時刻tの教師信号標本値fz(i)を出力するように、標本化信号供給源20と教師信号供給源21とが同期動作する。教師信号fz(t)は、ニューラルネットワーク10の畳み込み演算部12から出力される出力信号y(t)が該教師信号fz(t)と同じ信号になるような適切な重み係数Wnを設定するための模範信号である。教師付き学習部13は、教師信号fz(t)を模範信号とする学習により、畳み込み演算部12から出力される出力信号y(t)が教師信号fz(t)と同じ値になるように、重み係数Wnの値を適切に変更する。なお、教師付き学習部13における具体的な学習アルゴリズムとしては公知又は未公開の適宜の手法を用いてよい。
【0017】
ニューラルネットワーク10に対して、原信号fの復元したい或る範囲に対応する標本化信号fsと教師信号fzとを順次最後まで入力して行き、入力した範囲について一通り学習することを、以下「1波形回学習する」と呼ぶ。例えば、或る楽曲全体を1波形回学習で学習させる場合は、その曲頭から曲終了までの標本化信号をニューラルネットワーク10に対して順次入力して行き、教師信号もそれに対応すして曲頭から曲終了まで順次切り換えて入力して行く。畳み込み演算部12からの出力信号y(t)と教師信号fz(t)とが各々分解能τで教師付き学習部13に入力されることからも明らかな通り、1波形回学習するに際して、或る1時点tに関する学習はτ相当の分解能でなされるもので、この1τ相当の学習処理を1ステップ学習と名付ける。
【0018】
例えば、i番目の1ステップ学習がなされる場合について考えると、このとき、標本化信号fs(t)のi番目の時刻tの標本値fs(i)が遅延ライン11で重み係数W0に対応する位置までシフトされており、同じi番目の時刻tの教師信号標本値fz(i)が教師付き学習部13に入力される。遅延ライン11に入力されている標本化信号に関して、畳み込み演算部12にて重み係数Wn1で畳み込み演算を行い、その演算結果として出力信号y(i)が教師付き学習部13に対して入力され、教師付き学習部13では、入力された教師信号fz(i)の値に基づき、入力された畳み込み演算部12からの出力信号y(i)が該教師信号fz(i)の値と同じになるような適切な1セット全部の重み係数Wn2に変更する。このように、1つの教師信号fzの値に対応して(及びこれに対応する標本化信号の入力設定に対応して)、1ステップ学習の学習結果として重み係数Wnの1セットの値が算出される。次の1ステップ学習では前記重み係数Wn2が更新されることになる。
このように1シフトコマンドCK毎に上記の1ステップ学習を順次行い、各1ステップ学習毎に1セットの重み係数Wnの値が逐次更新されて行く。このようにして順次重み係数Wnを更新して行き、復元したい所定範囲における一番最後のステップ学習がなされた時の1セットの重み係数Wnのデータが、当該1波形回学習における学習結果として1セットの重み係数Wnとして出力(図1に示すWn学習結果出力)されることになる。この1波形回学習の結果として出力される重み係数Wnは、原信号fの特性に近い高品質なデータである教師信号fzに基づく学習により生成されたものなので、教師信号の原信号再現精度と同等の品質の波形を再現しうるものである。学習処理による重み係数Wnの変化の1例を示すと図4のようである。学習の結果、学習処理後の重み係数Wnが初期値Wn’(sinc関数)と比較して変化していることが見て取れる。
【0019】
実際に或る1楽曲について学習処理を行う際は、処理対象となるオーディオ波形(原信号f)を複数の区間に分割し、分割した複数の区間夫々について1波形回学習を行い、その各区間に対応して前記重み係数のセットをそれぞれ有するようにすれば好ましく、これにより原信号fの再現精度をより一層向上させることができる。例えば、曲時間3分の楽曲を1波形回学習を1分間とする3波形回の区間に区切って学習することを考えると、この場合、曲の頭(0分)〜1分までを第1の区間として第1の1波形回学習を行い、1分〜2分までを第2の区間として第2の1波形回学習を行い、2分〜3分までを第3の区間として第3の1波形回学習を行う。この結果、当該楽曲の再生時に使用する重み係数Wnとしては各区間毎に夫々1セットづつ、第1の区間用として第1の重み係数Wn(1)、第2の区間用として第2の重み係数Wn(2)、第3の区間用として第3の重み係数Wn(3)の計3セットの重み係数Wnが得られることになる。尚、1区間あたりの時間長は均一である必要はなく、例えば第1の区間を40秒、第2の区間を1分30秒、第3の区間を50秒とする等、適宜に設定することができる。
【0020】
なお、上述した1波形回学習は同じ波形(区間)について複数回なされるようにしてもよい。すなわち、ある波形を1波形回学習して出力された重み係数Wnを初期値として、前記波形に関して再度1波形回学習して、2波形回学習するようにしてもよく、同様にして、3波形回学習、4波形回学習…というように1波形回学習を重ねて行ってもよい。このように1波形回学習を同じ波形について複数回行うことで、重み係数Wnの原信号復元能力を向上させることができる。
【0021】
上述の学習処理により生成した重み係数のデータは標本化信号fsに付属して出力される。この出力の形態としては例えばCDのような物理的記憶媒体に記録する形態がある。そのような出力形態をとる場合、本発明に従って生成された標本化信号と重み係数との組み合わせからなるデータを記録したCD等の物理的記憶媒体が、一般ユーザ等のデータ受け手に供給される。このようにして出力される、本発明に従って生成された標本化信号と重み係数との組み合わせからなるデータの構成例について図5により説明する。
図5は、本発明に従って生成された標本化信号fsと重み係数Wnとの組み合わせからなる標本化データの構成例を示すもので、楽曲データからなる原信号を複数区間(上記の例では3区間)に分割して各区間毎に重み係数を学習・生成し、これを標本化信号に組み合わせてCDのような記録媒体に記録した例を示す。このデータフォーマットは、当該楽曲データの再生に必要な制御情報等を記録するヘッダ部と、再生する楽曲(原信号f)を標本化周期Tsで標本化した標本化信号fsを時系列的に記録したオーディオデータ記録部とを含む。ヘッダ部には、標本化信号fsの標本化周期Tsを指示するデータ及びそれより細かな標本化周期τを指示するデータと、各区間(第1〜第3の区間)にそれぞれ対応する重み系数Wn(1)〜(3)及び各区間の継続時間を示す時間間隔データT(1)〜(3)とが記録されている。時間間隔データT(1)が第1の区間に対応し、時間間隔データT(2)が第2の区間に対応し、時間間隔データT(3)が第3の区間に対応する。この時間間隔データT(1)〜(3)により指示される時間に応じて、それぞれ該当する重み系数Wn(1)〜(3)を使用し、また、その切り換え時期を制御することとなる。
なお、図5に示すような全部の重み系数Wn(1)〜(3)と時間間隔データT(1)〜(3)とをヘッダに一括して纏めて記録するのに限らず、第1の区間に当たる重み系数Wn(1)と時間間隔データT(1)のみヘッダ部に記憶して、重み系数Wn(2)、Wn(3)と時間間隔データT(2)、T(3)については、それぞれの先行区間におけるオーディオデータ中(例えばCDフォーマットのサブコード領域等)に適宜分散して織り込み、該先行区間の再生中に後続区間の重み系数Wnと時間間隔データTを読み出して行くようにしてもよい。
【0022】
例えば、標本化信号fsの標本化周波数を従来のCD規格と同様に44.1kHzとすると、標本化信号fsのデータ量は、たった1秒間に必要なデータ量(サンプル数)だけでも44100個に及ぶが、1波形回学習分の1セットの重み係数Wnのデータ量は1セットに付き例えば1000個程度でよい。このことから1波形回学習分の重み係数Wnとして必要なデータ量が極めて微量なものであることが判る。従って、重み係数Wnのデータを標本化信号fsに付属させても、復元に要するデータ量の総量は殆ど増加しない。
このように、標本化信号fsとそれに付属する重み係数Wnとの組み合わせからなるデータセットは、教師信号fzの原信号再現精度と同等の品質の波形を再現しうるものでありながら、そのデータ量が少なくて済む。
【0023】
なお、本発明に従って生成された標本化信号と重み係数との組み合わせからなるデータの出力形態、すなわちデータ供給の方式は、上記のように物理的記憶媒体による限りではなく、例えば、インターネット等の通信回線を経由してデータを伝送するようにしてもよい。その場合、データ受け手では、インターネット等の通信回線を経由して受信したデータを自己のメモリ内に保存すればよい。
【0024】
次に、CD等に収録された或いは通信回線を経由して伝送された前記標本化データの再生処理について図6を参照して説明する。図6に示すように、再生処理側(データ受け手側)は、ニューラルネットワーク30と、標本化信号再生装置40とを有する。ニューラルネットワーク30は、図1のニューラルネットワーク10内の遅延ライン11及び畳み込み演算部12と同様の遅延ライン31及び畳み込み演算部32を有するが、学習手段は不要である。
【0025】
図6において、標本化信号再生装置40には、上述したような標本化周期Tsの標本化信号fsと重み係数Wnとの組み合わせからなる標本化データが、CD等の記録媒体で或いは通信回線を経由して供給される。標本化信号再生装置40は、まず供給された標本化データのヘッダ部のデータを読み取り、該ヘッダ部にある各標本化周期Ts、τを指示するデータに基づき、各標本化周期Ts及びτに対応するクロックを生成する。また、該ヘッダ部にある最初の区間の重み係数Wnを読み取ってニューラルネットワーク30の畳み込み演算部32に入力し、該畳み込み演算部32における重み係数Wnを設定する。このように初期設定を行った上で、オーディオデータ部にある標本化信号fsの再生読み出しを開始する。
【0026】
前述の通り、標本化信号再生装置40で再生される標本化信号fsは、比較的粗い標本化周期Tsで標本化されたデータである。再生装置40からの標本化信号fs(t)の再生読み出しは、標本化周期Tsに対応するタイミングで1サンプルづつ順次なされる。再生装置40から読み出された標本化信号fs(t)は、ニューラルネットワーク30の遅延ライン31に入力される。遅延ライン31には、再生装置40から細かい周期τのクロックがシフトクロックとしてリアルタイムに供給される。遅延ライン31では、再生装置40から入力される標本化信号fs(t)を周期τのタイミングで取り込み、周期τ毎に順次シフト(遅延)する。図1の遅延ライン11と同様に、遅延ライン31では、標本化周期Tsに同期する周期τのタイミングで標本化信号fs(t)の実質的な標本値を取り込み、それ以外の周期τのタイミングでは0を取り込む。図中、符号Ts・τは、標本化周期Tsに同期する周期τのタイミングを示す。図6中の(A)は、再生装置40から読み出される標本化信号fs(t)の一例を示し、標本化周期Tsに同期する周期τのタイミングで実質的な標本値が再生出力され、それ以外の周期τのタイミングでは0値が出力される。例えば、標本化信号fsの標本化周波数(周期Ts)を1とし、これに対してクロックτの周波数(周期τ)が4として、ある1つの標本値をSとする。クロックτの1クロックに応じて、遅延ライン31のある1つの遅延段がSを取り込んだとすると、この遅延段は、その後のτの3クロックでは、入力データとして0を取り込む、という具合になる。
【0027】
畳み込み演算部32は、再生装置40から供給された前記重み係数Wnで遅延ライン31に順次入力されるデータを、クロックτに対応する周期τに従って、畳み込み演算し、その演算結果y(i)を周期τ毎に出力する。畳み込み演算部32から演算結果として出力される信号y(i)は、図6中の(B)に示すような、周期τの細密な信号となる。こうして、この周期τに対応する精度で出力信号y(i)がニューラルネットワーク30から出力されることとなる。ここで、畳み込み演算部32に供給された重み係数Wnは、上述の通り教師信号fzの原信号再現精度と同等の品質の波形を再現しうるものであり、このような重み係数Wnによる重み付け特性で演算を行うことで、原信号fの波形を前記教師信号に匹敵する高精度で忠実に再現した出力信号y(i)が得られる。
【0028】
図7に、本発明により復元した信号と従来の方法により復元した信号とを比較したスペクトル分布例を示す。図において横軸に周波数をとり、縦軸を振幅とし、また波形信号成分はスペクトルエンベロープで表しており、1/Tsは標本化周期Tsに対応する標本化周波数である。従来の方式では、図において点線で示す標本化周波数1/Tsの半分の周波数(ナイキスト周波数)1/2Tsを上限としてそれ以上の波形成分はカットされてしまい再現されなかったが、本発明によれば、標本化信号fsの標本化周波数1/Tsを上げることなくデータ量を殆ど増すことなしに、そのような従来再現されていなかった高周波成分を含む原信号fの波形を精度よく忠実に再現できる。例えば、本発明によれば、通常のCD規格による標本化周波数約44kHzで標本化した標本化信号でも、再生時に使用する重み係数を教師信号に基づく学習により生成することで、従来カットされていた約20kHz以上の高周波成分を含む高品質な再生信号の出力が可能となり、更に原信号fの波形を精度よく忠実に再現した高品質な音楽再生ができる。
【0029】
上述した実施例においては、ニューラルネットワーク10,30として1段のみから構成される単層型ニューラルネットワークを用いた例を示したが、これに限らず、ニューラルネットワークを多段にして非線形処理を行える多層型ニューラルネットワークを用いれば、更なる原信号復元能力の向上が可能となる。
なお、入力する標本化信号のサンプリング間隔は、等間隔になされて良いが、本発明においては、サンプリング間隔を不等間隔にしてもよい。
また、本実施例の別の一実施形態としては、本発明をMPGやMP3等の適宜のデータ圧縮方式と組み合わせて実施してもよい。すなわち、重み係数Wnと標本化信号fsとを組み合わせて標本化データとして伝送する際、或いは記憶媒体に記録する際、前記標本化信号fsをMPGやMP3或いはDPCMやADPCM等の適宜のデータ圧縮方式で圧縮し、この圧縮された標本化信号データを重み係数Wnと共に標本化データとして伝送する、或いは記憶媒体に記録する。そして、この標本化データの再生時に、圧縮された標本化信号データの圧縮を解除してから、重み係数Wnと演算すればよい。
本実施例の更に別の例としては、1波形回学習の時間間隔を極短くとることで学習に要する時間を短くし、送信側でリアルタイムにピックアップしたオーディオ信号に基づき本実施例に従って標本化信号fsと重み係数Wnをリアルタイムに生成し、これを通信回線等を介して伝送し、受信側で本実施例に従って再生することで、学習から再生までをリアルタイムに近い形で行うことも可能となる。
【0030】
上述の実施例においては、主にCD等のオーディオ波形データの復元について説明したが、本発明はそれに限らず、例えば画像データ等にも応用可能である。画像データの場合、画素数の粗い画像データから画素数の細かい高精度な画像データを復元できる。また、画像拡大時の補間処理に本発明を適用すれば、拡大した画像が元の画像よりも細かな精度で生成される。また、動画データのコマ数補間処理に本発明を適用すれば、元の動画データのコマ数(フレーム数)よりも多くのコマ数を補間生成することができ、元の動画よりも滑らかな動きの動画を再生することができる。
【0031】
【発明の効果】
以上の通り本発明によれば、標本化信号のデータ量を増すことなしに、その標本化周波数以上の精度で原信号を忠実に復元できるようにした標本化信号生成装置及び標本化信号再生装置並びにその方法を提供することができるという優れた効果を奏する。
【図面の簡単な説明】
【図1】 本発明に係る一実施例を示すデータ供給側の基本的なブロック図。
【図2】 同実施例において、遅延ラインに対して入力される標本化信号の入力動作を示す概念図。
【図3】 同実施例において、重み係数の初期値として設定したsinc関数の特性と各係数値を示す図。
【図4】 図3に示すsinc関数(初期値)からの学習後の重み係数値の変化を示す図。
【図5】 同実施例に係る学習処理の別の例として、原信号を複数区間に分割した場合のデータ構成例を示す図。
【図6】 同実施例に係るデータ受け手側の基本的なブロック図。
【図7】 本発明により復元した信号と従来の方法により復元した信号とを比較したスペクトル分布図。
【符号の説明】
10,30 ニューラルネット
11,31 遅延ライン
12,32 畳み込み演算部
13 教師付き学習部
20 標本化信号供給源
21 教師信号供給源
40 標本化信号再生装置
Claims (7)
- 原信号を所定の第1の分解能で標本化した標本化信号を提供する手段と、
前記原信号を前記第1の分解能よりも細かい第2の分解能で標本化した教師信号を提供する手段と、
前記標本化信号と前記教師信号を入力し、前記標本化信号と演算する重み係数を前記教師信号に基づく学習により生成するニューラルネットワークと
を具え、前記生成した重み係数を前記標本化信号に付属させて出力することを特徴とする標本化信号生成装置。 - 請求項1の標本化信号生成装置で出力した前記標本化信号及びそれに付属する前記重み係数に基づき前記原信号を復元する装置であって、
前記標本化信号を前記第1の分解能に対応する第1の周期で再生する手段と、前記第2の分解能に対応する第2の周期に従って、再生された前記標本化信号とそれに付属する前記重み係数とを演算するニューラルネットワークと
を具え、前記第2の分解能に対応する精度で前記原信号を復元した出力信号が前記ニューラルネットから出力されることを特徴とする標本化信号再生装置。 - 原信号を所定の第1の分解能で標本化した標本化信号と前記原信号を前記第1の分解能よりも細かい第2の分解能で標本化した教師信号とをニューラルネットワークに入力するステップと、
前記ニューラルネットワークにおいて、前記標本化信号と演算する重み係数を前記教師信号に基づく学習により生成するステップと、
前記生成した重み係数を前記標本化信号に付属させて出力するステップと
を備えることを特徴とする標本化信号生成方法。 - 請求項3の標本化信号生成方法で出力した前記標本化信号及びそれに付属する前記重み係数に基づき前記原信号を復元する方法であって、
前記標本化信号を前記第1の分解能に対応する第1の周期で再生するステップと、
ニューラルネットワークにおいて、前記第2の分解能に対応する第2の周期に従って、再生された前記標本化信号とそれに付属する前記重み係数とを演算し、前記第2の分解能に対応する精度で前記原信号を復元した信号を出力するステップと
を備えることを特徴とする標本化信号再生方法。 - 原信号を所定の第1の分解能で標本化した標本化信号と、
前記原信号を前記第1の分解能よりも細かい第2の分解能で標本化した教師信号を用いた学習により求められた前記標本化信号と演算すべき重み係数と
を組み合わせて前記原信号の標本化データとして記憶した記憶媒体。 - 原信号を所定の第1の分解能で標本化した標本化信号と、
前記原信号を前記第1の分解能よりも細かい第2の分解能で標本化した教師信号を用いた学習により求められた前記標本化信号と演算すべき重み係数と
を組み合わせて前記原信号の標本化データとして伝送することを特徴とするデータ伝送方式。 - 前記原信号を複数の区間に分割し、各区間に対応して前記重み係数のセットをそれぞれ有することを特徴とする請求項1乃至6のいずれかに記載の装置又は方法又は記憶媒体又はデータ伝送方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002011901A JP3974408B2 (ja) | 2002-01-21 | 2002-01-21 | 標本化信号生成装置及び標本化信号再生装置並びにその方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002011901A JP3974408B2 (ja) | 2002-01-21 | 2002-01-21 | 標本化信号生成装置及び標本化信号再生装置並びにその方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003218806A JP2003218806A (ja) | 2003-07-31 |
JP3974408B2 true JP3974408B2 (ja) | 2007-09-12 |
Family
ID=27649268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002011901A Expired - Fee Related JP3974408B2 (ja) | 2002-01-21 | 2002-01-21 | 標本化信号生成装置及び標本化信号再生装置並びにその方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3974408B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020046774A (ja) * | 2018-09-14 | 2020-03-26 | 株式会社東芝 | 信号処理装置、距離計測装置、および距離計測方法 |
CN114002733B (zh) * | 2021-10-27 | 2024-01-23 | 武汉科技大学 | 微震波信号初至到时自动拾取方法及微震监测装置 |
-
2002
- 2002-01-21 JP JP2002011901A patent/JP3974408B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2003218806A (ja) | 2003-07-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4446072B2 (ja) | オーディオ信号出力装置 | |
JPH0435930B2 (ja) | ||
US5532424A (en) | Tone generating apparatus incorporating tone control utliizing compression and expansion | |
US20020075777A1 (en) | Method and apparatus for processing digital audio signal | |
JP3974408B2 (ja) | 標本化信号生成装置及び標本化信号再生装置並びにその方法 | |
JPWO2006013660A1 (ja) | 再生信号処理装置 | |
JP3925349B2 (ja) | 音声データと演奏データの同期再生を行うための装置および方法 | |
JP3312538B2 (ja) | 音響信号処理装置 | |
JPS642960B2 (ja) | ||
JP3336823B2 (ja) | 音響信号処理装置 | |
JPH02146599A (ja) | 音源データ圧縮符号化方法 | |
JP4038844B2 (ja) | ディジタル信号再生装置、ディジタル信号再生方法、ディジタル信号記録装置、ディジタル信号記録方法及び記録媒体 | |
US5841945A (en) | Voice signal compacting and expanding device with frequency division | |
JP4704872B2 (ja) | オーディオ信号出力装置 | |
JP2712200B2 (ja) | 電子楽器 | |
JP3873282B2 (ja) | 音色制御フィルタ | |
JPH0962294A (ja) | ピッチシフト回路およびそれを備えた音声信号処理装置 | |
JPH09198045A (ja) | 音源装置 | |
JP6149514B2 (ja) | サーチ機能を備えるデジタル信号処理装置 | |
JP2900076B2 (ja) | 波形生成装置 | |
JP2017021212A (ja) | 音声生成方法、音声生成装置、プログラム、及び記録媒体 | |
JP2824731B2 (ja) | 信号再生方法および信号記録再生方法 | |
JP2003202882A (ja) | サウンド合成方法およびサウンド合成装置 | |
JP3254829B2 (ja) | デジタル音響信号の時間軸伸長読出し方法及び装置 | |
JP2907051B2 (ja) | 波形発生装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070515 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070614 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100622 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110622 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110622 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120622 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |