JP3152109B2 - オーディオ信号の圧縮伸張方法 - Google Patents

オーディオ信号の圧縮伸張方法

Info

Publication number
JP3152109B2
JP3152109B2 JP15534095A JP15534095A JP3152109B2 JP 3152109 B2 JP3152109 B2 JP 3152109B2 JP 15534095 A JP15534095 A JP 15534095A JP 15534095 A JP15534095 A JP 15534095A JP 3152109 B2 JP3152109 B2 JP 3152109B2
Authority
JP
Japan
Prior art keywords
information
audio signal
compression
orthogonal transform
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP15534095A
Other languages
English (en)
Other versions
JPH08330971A (ja
Inventor
恭一 清水
俊弘 丸山
兼史 杵築
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP15534095A priority Critical patent/JP3152109B2/ja
Priority to US08/739,553 priority patent/US5911130A/en
Publication of JPH08330971A publication Critical patent/JPH08330971A/ja
Application granted granted Critical
Publication of JP3152109B2 publication Critical patent/JP3152109B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はオーディオ信号の圧縮伸
張方法に係り、放送・映画・電話・TV会議・オーディオパ
ッケージ・テレビゲーム等のオーディオ信号を取扱う分
野に適用され、オーディオ情報の大幅な圧縮によって伝
送の効率化や情報蓄積媒体の小容量化を図る方法に関す
る。
【0002】
【従来の技術】従来から、オーディオ信号を対象とした
各種の高能率符号化方式が提案されており、実際にオー
ディオシステムに適用されている。例えば、ADPCM
(Adaptive Delta Pulse Code Modulation)法やサブバン
ド符号化法や直交変換法や線形予測法や可変サンプリン
グ法等があり、オーディオ信号の情報量の冗長性を除去
し、また人間の聴覚特性を利用しながらひずみをできる
限り感知され難く工夫した伝送情報の圧縮により、伝送
の効率化を図るためのアルゴリズムが提案・実施されて
いる。
【0003】ここに、ADPCM法は、1標本前の値を
予測値とする差分PCMに適応的な量子化ステップを導
入し、信号を直接量子化せずに信号の予測値と真の値と
の差を適応量子化するものであり、多機能電話機のメッ
セージIC録音等に多用されている。サブバンド符号化
法は、信号を複数のサブバンドに分割し、各サブバンド
の聴覚特性を利用して必要最小限のビット数で量子化す
るものである。直交変換法は、信号を一定の時間窓(5〜
50msec)で切出し、離散フーリエ変換(DFT)や離散コ
サイン変換(DCT)で周波数領域に変換した後、臨界帯
域幅に対応するグループに分け、マスキング効果を考慮
してスペクトラムの優位成分のみを必要最小限のビット
数で量子化するものである。線形予測法は、標本値が過
去の標本と現在の入力の線形結合で表現されるという数
学モデル(自己回帰モデル)に基づいたスペクトル分析か
ら予測値を得て、その予測値と真の標本値との差を符号
化するものである。可変サンプリング法は、信号の帯域
上限が変化することを利用し、標本化周波数を変化させ
るものである。
【0004】一方、映像信号の符号化に関しても多種の
方式が提案・実施されており、アルゴリズムで大別する
とPCM符号化方式、予測符号化方式、直交変換符号化
方式及びハイブリッド符号化方式に分かれ、それらの各
方式にも各種の具体的な方式がある。映像信号は、画面
が走査ラインで組立てられているために左右及び上下方
向に隣接した画素間の相関性が強く、また動きの比較的
少ない映像でフレーム間では相関性も極めて強くなると
いう特徴を有している。従って、1次元(走査ライン)だ
けでなく2次元(フレーム内)や3次元(フレーム間)での
符号化を効率良く行うことができ、予測符号化(ΔM方
式やDPCM方式等)や直交変換符号化(アダマール変換
符号化方式やフーリエ変換符号化方式やコサイン変換符
号化方式等)によって大幅な帯域圧縮が可能になり、更
にMPEG(Moving Picture Image Coding Experts Gro
ups)のように動き補償予測を施して動画像についての符
号化効率を大きく向上させたものもある。
【0005】
【発明が解決しようとする課題】ところで、オーディオ
信号はその性質上1次元のアナログ非周期信号であり、
隣接した音素信号間の類似性は存在しても、信号群ブロ
ックに分割した場合にそのブロック間での相関性は存在
しない。従って、前記のオーディオ信号の高能率符号化
方式では、隣接音素間の類似性や直前の時間帯での数個
の音素に基づいた予測性を利用した冗長性の除去、又は
聴覚特性を利用したマスキング等によって伝送情報の圧
縮を図っているだけであり、映像信号の場合のように高
能率な圧縮を行うことが困難とされている。
【0006】しかし、オーディオ信号の標本値を一定の
時間帯毎に群化して、それぞれの群毎に直交変換を行う
と、各直交変換関数の各周波数に係る係数強度はオーデ
ィオ信号が急激に変化していない時間帯では比較的類似
した値が連続する傾向がみられる。そこで、本発明は、
前記の係数強度の類似性を利用してオーディオ情報の大
幅な圧縮を可能にし、伝送効率の向上や情報蓄積媒体の
小容量化を実現させることを目的として創作された。
【0007】
【課題を解決するための手段】本発明は、オーディオ信
号の圧縮伸張方法において、圧縮側では、オーディオ信
号を一定の標本化間隔で標本化すると共にその各標本値
を一定周期で群化し、前記の標本値群毎に直交変換を施
し、順次生成される直交変換関数について一定周波数間
隔毎の係数の時系列的変化に係る特徴点を抽出し、各特
徴点に係る係数強度情報と周波数情報と時間情報を伝送
し、伸張側では、前記特徴点に係る各情報に基づいた係
数強度の補間を行うことによって各直交変換関数を再現
し、その再現された各直交変換関数を逆直交変換してオ
ーディオ信号の標本値を再生することを特徴としたオー
ディオ信号の圧縮伸張方法に係る。尚、当然に、圧縮側
で得られる圧縮情報を一旦情報蓄積媒体に蓄積させ、伸
張側が前記情報蓄積媒体から圧縮情報を読出して伸張再
生してもよく、前記の圧縮方法と伸張方法は独立した手
段として成立し得る。
【0008】
【作用】オーディオ信号は上記のように信号の時系列的
標本値を群化しても、各標本値群相互間での相関性は見
出せない。しかし、標本値群に対して直交変換を施す
と、各直交変換関数について各周波数に係る係数強度の
時系列的変化をみれば類似した値が連続的に現れる場合
が多い。従って、その時系列的変化から特徴点の抽出を
行うと抽出される特徴点の数は極めて少なくなり、また
各特徴点は係数強度情報と周波数情報と時間情報で一義
的に表現できる。そこで、圧縮側で、標本値群に対して
直交変換を施した後に前記特徴点の抽出を行い、その各
特徴点情報を伝送するようにすればオーディオ情報の大
幅な圧縮が可能になり、伝送効率の向上や情報蓄積媒体
の小容量化が実現できる。
【0009】一方、伸張側では、前記の特徴点が直交変
換関数の係数強度の時系列的変化から抽出されたもので
あるため、個々の時刻における係数強度を各特徴点情報
を用いて補間して各直交変換関数を再現する。そして、
その再現された各直交変換関数に対して逆直交変換を施
すことにより、圧縮側の標本値群を順次再生する。
【0010】
【実施例】以下、本発明のオーディオ信号の圧縮伸張方
法に係る実施例を図面を用いて詳細に説明する。先ず、
図1はオーディオ信号の伝送系のブロック回路図であ
り、送信系は、マイクロフォン1と増幅器2とA/D変換
器3と窓関数乗算器4と直交変換器5と特徴点抽出器6と伝
送情報配列器7と送信器8で構成されており、マイクロフ
ォン1で集音されたオーディオ信号を量子化して圧縮
し、その圧縮情報を伝送路(又はストレージメディア)9
を介して受信系へ伝送する。一方、受信系は、受信器10
と補間器11と直交逆変換器12と窓関数乗算器13とD/A
変換器14と増幅器15とスピーカ16で構成されており、送
信系で圧縮されたオーディオ情報を伸張・再現し、スピ
ーカ16から再生音として出力させる。
【0011】前記の送信系は次のような手順でオーディ
オ信号を圧縮・送信する。マイクロホン1が検出したオー
ディオ信号は増幅器2で所要の電圧振幅が得られるよう
に増幅され、その増幅後のオーディオ信号はA/D変換
器3によって一定の標本化間隔(Δt)で量子化される。
そして、窓関数乗算器4がA/D変換器3から得られる離
散的量子化情報列を一定標本数毎(例えば1024標本
数毎)の単位ブロックに分割し、各単位ブロックの先端
部と後端部の標本値を隣接した単位ブロックと重複させ
て窓関数を乗算する。即ち、離散的量子化情報列をブロ
ック化すると切出したブロック間の信号に不連続点が発
生する場合が多く、その不連続点によって後述のスペク
トラム係数強度の誤差が大きくなるために窓関数(sin2
乗,cos2乗,ハニング,ハミング等の関数)によって補償
しておく。
【0012】次に、直交変換器5で単位ブロックの標本
値群に対してFFT(Fast Fourier Transform)方式によ
る直交変換を行い、各単位ブロック分についての直交変
換関数を得る。その場合、事例的に、増幅器2から図2
に示すようなオーディオ信号が得られているときには、
図3に示されるような単位ブロック毎の直交変換関数が
時系列的に得られることになる。尚、同図におけるΔT
は単位ブロック分の標本数が得られる周期を示す。ここ
に、図2は時刻txにおいて打撃音のような大きな入力
があった場合のオーディオ信号波形を示し、図3におけ
るその時刻txを含んだ単位ブロックに係る直交変換関
数も時刻txで大きな変化を呈している。そして、例え
ば、図3における各直交変換関数の周波数f0とf1に係
るスペクトラム係数強度の時系列的変化関数F0とF1を
みると、図4に示すように、時刻t=0から時刻txへ
至るまでは変化が小さい状態で推移し、時刻txの直後
で急変して再び変化の少ない状態へ収束してゆくことが
理解される。
【0013】そこで、特徴点抽出器6では、図5に示す
ような方法によって前記のスペクトラム係数強度の時系
列的変化から特徴点を抽出する。尚、同図は図4におけ
る周波数f0に係るスペクトラム係数強度の時系列的変
化関数F0から特徴点を求める場合を示したものであ
る。先ず、t=0における係数強度をQ1とする。そし
て、Q1を始点とし、前記の時系列的変化関数F0上の点
を終点とするベクトルq1の終点をt=0からt>0の
方向へ移動させ、その各移動点でベクトルq1上の任意
の点aとその点aを通過してそのベクトルq1に垂直な
直線が時系列的変化関数F0の曲線と交差する点bとの
最大距離dmaxの最大値を求めてゆき、ベクトルq1の終
点の移動過程でdmaxが一定の閾値以上になった場合の
点bを特徴点Q2とする。次に、特徴点Q2を始点とし、
前記の時系列的変化関数F0上の点を終点とするベクト
ルq2の終点を特徴点Q2に対応する時刻から時間経過方
向へ移動させ、前記と同様にベクトルq2と時系列的変
化関数F0の距離が前記の閾値以上になった場合のベク
トルq2の終点を特徴点Q3とする。尚、この場合には、
時刻txを含む直交変換関数のスペクトラム係数強度が
大きく変化しているため、時系列的変化関数F0上の時
刻txに対応した点が特徴点Q3になる。以降、同様のア
ルゴリズムで特徴点Q4,Q5,Q6,・・・を求めてゆくが、
各特徴点Q1,Q2,Q3,・・・についての係数強度情報と時
刻情報を求め、時系列的変化関数F0に係る周波数情報
f0と共にセーブする。また、図4における周波数f1に
係る時系列的変化関数F1から前記と同様のアルゴリズ
ムで特徴点を求めると、図4のP1,P2,P3,・・・が特徴
点となる。
【0014】このようにして周波数f0,f1に係る時系
列的変化関数F0,F1の特徴点が求まるが、図3におい
て一定の周波数間隔(Δf)毎の各周波数に係る時系列的
変化関数についての特徴点も同様の手順で求め、各特徴
点の係数強度情報と時刻情報を伝送情報とする。尚、本
実施例では直交変換にFFT方式を採用しているため、
各特徴点について前記情報以外に位相情報も得ることが
でき、その位相情報も併せて各特徴点の情報とすること
ができる。例えば、前記の特徴点Q1,Q2,Q3,・・・につ
いてみれば、図6の複素平面に示すように、特徴点Q1
から特徴点Q2へ至る位相変化が円弧状矢印で示される
ような軌跡を描いた場合には、特徴点Q2の前記情報に
付随させてその位相差情報(この場合は−320°)を得
ることができる。
【0015】従って、各単位ブロックの直交変換関数の
情報は、各時系列的変化関数についての特徴点の情報
(周波数情報,係数強度情報及びその時刻情報と位相情
報)へ変換されることになるが、図4に示すように、一
般的にオーディオ信号の直交変換関数のスペクトラム係
数強度の変化は比較的穏やかであり、打撃音等の急激な
振幅変化が含まれていても各周波数で求められる特徴点
の数は極めて少なくなる。即ち、図4において、各時系
列的変化関数F0,F1の特徴点(○点)の数は周期ΔT毎
の情報点(●点)の数と比較して遥かに少なく、特徴点の
情報のみを伝送対象とすることにより伝送情報の大幅な
圧縮が実現される。また、各時系列的変化関数は一の周
波数に対応したものであり、各時系列的変化関数に係る
特徴点の情報は一の周波数情報にまとめることができ、
各特徴点の係数強度情報や位相情報は直前の特徴点の係
数強度情報や位相情報との差として、時刻情報は周期Δ
Tの整数倍として表現できるため、情報量の増大を抑制
することができる。
【0016】更に具体的にみると、本実施例によるオー
ディオ情報の圧縮の優位性は次のように説明される。
今、オーディオ信号を44kHzの標本化周波数で時系
列的に標本化した場合、1秒間の標本化数は44000
個になる。そして、この標本化数で表現されるスペクト
ラムの最高周波数はナイキストの定理に基づいて22k
Hzとなる。次に、単位ブロックとして1024個の標
本値をとり、その標本値群をFFT方式で直交変換する
と周波数間隔Δfは約43Hz(=44000/1024)であるた
め、直交変換関数が各周波数で全て特徴点となった場合
を仮定しても、その特徴点の総数は512個(=22000/4
3)となる。従って、係数強度情報と位相情報を併せても
1024個(=512×2)のデータ数となり、前記の単位ブ
ロックの標本値の数と同一になる。
【0017】ところで、平均的なオーディオ信号につい
て、10個の単位ブロックを対象とした本実施例による
特徴点の抽出数を調査してみると次の表1のようにな
る。
【0018】
【表1】
【0019】この表1から、各特徴点を係数強度情報と
位相情報の2つのデータで表すとした場合、データ数は
1144個(=572×2)となるが、10個の単位ブロック
に含まれる標本値の数(=直交変換関数が各周波数で全
て特徴点となった場合の特徴点の総数):10240個
(=1024×10)と比較して約1/9となり、各特徴点の周
波数情報と時刻情報を加味しても約2/9程度に納ま
る。尚、これはデータ数からみた比較であるが、実際の
量子化データ量でみてもほぼ同様の圧縮率となる。一
方、平均的なオーディオ信号に対してADPCM法(標
本化周波数:44.1〜48kHz,16bit量子化)を適用して圧縮
を行った場合には約1/2程度の圧縮であり、本実施例
による圧縮方法に優位性があることは明らかである。
【0020】そして、以上のようにして特徴点抽出器6
で求められた各特徴点の情報は、伝送情報配列器7へ転
送され、伝送情報配列器7が各特徴点の情報を一定の配
列規則(例えば、生成時点の直交関数の直交軸上の係数
番号順に配置する等)に基づいて配列して送信器8へ転送
し、送信器8が順次伝送路(又はストレージメディア)9へ
伝送する。その場合、上記のようにオーディオ信号の情
報量が大幅に圧縮されているために極めて高い伝送効率
が得られ、また情報蓄積媒体を介在させる場合にはその
容量は小さくても足りることになる。
【0021】一方、受信系では次のような手順で受信情
報を伸張・再生する。先ず、伝送路(又はストレージメデ
ィア)9から伝送された情報は受信器10で受信されて補間
器11へ転送され、補間器11が受信した各特徴点情報を用
いて各特徴点間のスペクトラム係数強度を補間する。例
えば、上記の時系列的変化関数F0,F1についてみる
と、図4において、特徴点Q1,Q2,Q3,・・・・を用いた予
測によって●点を近似補間して元の関数F0に近い関数
F0'を再現し、また特徴点P1,P2,P3,・・・・を用いて同
様に元の関数F1に近い関数F1'を再現する。
【0022】従って、その段階では図3に示すように各
単位ブロックに対応した直交変換関数が近似的に再現さ
れたことになるが、再現された各直交変換関数が直交逆
変換器12へ転送される。直交逆変換器12では、各直交変
換関数の逆変換を実行して前記の単位ブロック毎の標本
値群を再現する。この場合、特徴点の補間を行って構成
された近似的な直交変換関数を逆変換して得られた標本
値群であるために圧縮側で標本化された量子化レベルと
完全に一致するわけでなないが、再生音質を劣化させな
い範囲で再現されている。尚、転送された情報には位相
情報が含まれているが、直交逆変換器12に位相補正回路
を内蔵させておき、位相情報を用いた位相ひずみを補正
することによって、より忠実な標本値の再現が可能にな
る。
【0023】ところで、再現された各単位ブロックの標
本値群は、前記のように補間器11で近似補間処理を受け
たことで元の標本値と僅かな誤差を生じている。従っ
て、各単位ブロックを時系列的に連続させた場合に、単
位ブロック間の隣接する標本値相互間で連続性が失われ
ている場合がある。そこで、本実施例では直交逆変換器
12の次段に窓関数乗算器13を設け、図7に示すように、
各単位ブロックB(n),B(n+1)の後端部と先端部を重複
させ、各重複部分Hに窓関数:WF(sin2乗,cos2乗,ハ
ニング,ハミング等の関数)を乗算し、それらを加算する
ことにより連続性を確保させるようにしている。
【0024】そして、連続性を確保せしめられた各単位
ブロックの標本値群は順次D/A変換器14へ転送されて
アナログ信号に変換され、増幅器15で増幅された再生オ
ーディオ信号によってスピーカ16が駆動される。その場
合、本実施例の伝送系が情報の圧縮・伸張を含んでいる
ために、従来の高能率符号化方式を採用した伝送系と同
様に再生信号が多少劣化することは避けられないが、オ
ーディオ情報が大幅に圧縮されている割には再生音質の
品質劣化を軽微に抑制することができる。
【0025】尚、本実施例では直交変換方式としてFF
T方式を採用しているが、コサイン変換やサイン変換や
アダマール・ウォルシュ変換やカルーネン・レーベ変換等
の多様な方式を採用してもよい。また、擬似的直交変換
方式であるウェーブレット変換を採用することも可能で
ある。この変換は、時間軸上及び周波数軸上で局所的に
存在する関数である基本ウェーブレット(波粒)h(t)を
用い、緩やかな変化(低周波数成分)を検出する場合には
時間軸上でa倍した基底関数とし、逆に急激な波形変化
を検出する場合には波形を1/aに相似変換して基底関
数とする。また、変化の発生時刻を見出すために時間軸
上でb秒だけ平行移動して基底関数を作成する。即ち、
基底関数を次の数式1として定め、原信号f(t)のウェ
ーブレット変換関数は次の数式2、逆変換した原信号は
次の数式3で表現される。
【0026】
【数1】
【0027】
【数2】
【0028】
【数3】
【0029】従って、本実施例にウェーブレット変換及
びその逆変換を適用すれば、高周波成分(信号が急激に
変化する場合)には高い時間分解能で、低周波成分(信号
が緩慢に変化する場合)には高い周波数分解能で解析で
き、また直流成分のない局在波形を対象とするために信
号波形の変化点を敏感に捉えながら変換できるという利
点があり、逆変換によって数値的に安定した信号再生が
得られる。
【0030】
【発明の効果】本発明の「オーディオ信号の圧縮伸張方
法」は、以上の構成を有していることにより、次のよう
な効果を奏する。請求項1から請求項3の発明は、オー
ディオ信号の特徴に適合した圧縮・伸張方式として、従
来の各種圧縮方法よりも伝送情報の圧縮率を大幅に向上
させることを可能にし、再生信号の品質劣化を軽微に保
ちながら、オーディオ情報の伝送効率の向上とストレー
ジメディアの小容量化を実現する。請求項4の発明によ
れば、オーディオ信号の変化に対応した緻密な変換が可
能になり、また逆変換によって安定した信号再生が実現
できる。請求項5の発明は、オーディオ信号の標本値の
直交変換過程で同時に得られる位相情報を伝送すること
により、位相ひずみの少ない忠実な信号再生を可能にす
る。
【図面の簡単な説明】
【図1】本発明の「オーディオ信号の圧縮伸張方法」の実
施例に係るオーディオ信号の伝送系(送信系及び受信系)
を示すブロック回路図である。
【図2】送信系側の増幅器から得られているオーディオ
信号波形の一例を示すグラフである。
【図3】単位ブロックの各標本値を直交変換して得られ
た直交変換関数の時系列的配置を示すグラフである。
【図4】図3の直交変換関数の時系列的配置において、
周波数f0,f1に対応したスペクトラム係数強度の時系
列的変化関数F0,F1を示すグラフである。但し、●点
は時系列的変化関数F0,F1の全ての情報点、○点は特
徴点を示す。
【図5】特徴点の抽出方法を示すグラフである。
【図6】特徴点の位相変化状態を示す複素平面グラフで
ある。
【図7】窓関数乗算部での処理過程を示す図である。
【符号の説明】
1…マイクロフォン、2,15…増幅器、3…A/D変換器、
4,13…窓関数乗算器、5…直交変換器、6…特徴点抽出
器、7…伝送情報配列器、8…送信器、9…伝送路又はス
トレージメディア、10…受信器、11…補間器、12…直交
逆変換器、14…D/A変換器、16…スピーカ。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平3−144700(JP,A) 特開 平5−216482(JP,A) 特開 平6−152547(JP,A) 特開 平6−97836(JP,A) 特開 平6−90177(JP,A) 特開 平6−69810(JP,A) 特開 平6−252772(JP,A) 特表 平5−507598(JP,A) (58)調査した分野(Int.Cl.7,DB名) H03M 7/30

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 オーディオ信号の圧縮伸張方法におい
    て、圧縮側では、オーディオ信号を一定の標本化間隔で
    標本化すると共にその各標本値を一定周期で群化し、前
    記の標本値群毎に直交変換を施し、順次生成される直交
    変換関数について一定周波数間隔毎の係数の時系列的変
    化に係る特徴点を抽出し、各特徴点に係る係数強度情報
    と周波数情報と時間情報を伝送し、伸張側では、前記特
    徴点に係る各情報に基づいた係数強度の補間を行うこと
    によって各直交変換関数を再現し、その再現された各直
    交変換関数を逆直交変換してオーディオ信号の標本値を
    再生することを特徴としたオーディオ信号の圧縮伸張方
    法。
  2. 【請求項2】 オーディオ信号の圧縮方法において、オ
    ーディオ信号を一定の標本化間隔で標本化すると共にそ
    の各標本値を一定周期で群化し、前記の標本値群毎に直
    交変換を施し、順次生成される直交変換関数について一
    定周波数間隔毎の係数の時系列的変化に係る特徴点を抽
    出し、各特徴点に係る係数強度情報と周波数情報と時間
    情報をオーディオ信号の圧縮情報として得ることを特徴
    としたオーディオ信号の圧縮方法。
  3. 【請求項3】 請求項2の圧縮方法で得られたオーディ
    オ信号の圧縮情報について、各特徴点に係る係数強度情
    報と周波数情報と時間情報に基づいた係数強度の補間を
    行うことによって各直交変換関数を再現し、その再現さ
    れた各直交変換関数を逆直交変換してオーディオ信号の
    標本値を再生することを特徴としたオーディオ信号の伸
    張方法。
  4. 【請求項4】 圧縮側での直交変換方式がウェーブレッ
    ト変換方式であり、伸張側での直交逆変換方式がウェー
    ブレット逆変換方式である請求項1のオーディオ信号の
    圧縮伸張方法。
  5. 【請求項5】 圧縮側で、各特徴点に係る係数強度情報
    と周波数情報と時間情報と共に各特徴点相互間の位相差
    情報も伝送することとし、伸張側で、前記位相差情報を
    用いて位相ひずみを補正することとした請求項1又は4
    のオーディオ信号の圧縮伸張方法。
JP15534095A 1995-05-30 1995-05-30 オーディオ信号の圧縮伸張方法 Expired - Fee Related JP3152109B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP15534095A JP3152109B2 (ja) 1995-05-30 1995-05-30 オーディオ信号の圧縮伸張方法
US08/739,553 US5911130A (en) 1995-05-30 1996-10-30 Audio signal compression and decompression utilizing amplitude, frequency, and time information

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP15534095A JP3152109B2 (ja) 1995-05-30 1995-05-30 オーディオ信号の圧縮伸張方法
US08/739,553 US5911130A (en) 1995-05-30 1996-10-30 Audio signal compression and decompression utilizing amplitude, frequency, and time information

Publications (2)

Publication Number Publication Date
JPH08330971A JPH08330971A (ja) 1996-12-13
JP3152109B2 true JP3152109B2 (ja) 2001-04-03

Family

ID=26483367

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15534095A Expired - Fee Related JP3152109B2 (ja) 1995-05-30 1995-05-30 オーディオ信号の圧縮伸張方法

Country Status (2)

Country Link
US (1) US5911130A (ja)
JP (1) JP3152109B2 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3191737B2 (ja) * 1997-08-29 2001-07-23 日本電気株式会社 ルータを有するネットワークシステムおよび改良されたルータおよびそのルータに用いられる連想メモリ
JPH11219199A (ja) 1998-01-30 1999-08-10 Sony Corp 位相検出装置及び方法、並びに音声符号化装置及び方法
US6370502B1 (en) 1999-05-27 2002-04-09 America Online, Inc. Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec
FR2796194B1 (fr) * 1999-07-05 2002-05-03 Matra Nortel Communications Procedes et dispositifs d'analyse et de synthese audio
US6993477B1 (en) * 2000-06-08 2006-01-31 Lucent Technologies Inc. Methods and apparatus for adaptive signal processing involving a Karhunen-Loève basis
JP2001356799A (ja) * 2000-06-12 2001-12-26 Toshiba Corp タイム/ピッチ変換装置及びタイム/ピッチ変換方法
CN1272911C (zh) 2001-07-13 2006-08-30 松下电器产业株式会社 音频信号解码装置及音频信号编码装置
US6804733B1 (en) * 2001-12-06 2004-10-12 Emc Corporation Optimizer improved data compression
US6968205B2 (en) * 2002-03-13 2005-11-22 Bellsouth Intellectual Property Corporation Methods and systems for landline access to wireless networks
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
JP2004109362A (ja) * 2002-09-17 2004-04-08 Pioneer Electronic Corp フレーム構造のノイズ除去装置、フレーム構造のノイズ除去方法およびフレーム構造のノイズ除去プログラム
US7953595B2 (en) * 2006-10-18 2011-05-31 Polycom, Inc. Dual-transform coding of audio signals
US7966175B2 (en) * 2006-10-18 2011-06-21 Polycom, Inc. Fast lattice vector quantization
EP2363852B1 (en) * 2010-03-04 2012-05-16 Deutsche Telekom AG Computer-based method and system of assessing intelligibility of speech represented by a speech signal
EP2803141B1 (en) * 2012-03-23 2017-11-01 Siemens Aktiengesellschaft Method and device for compressing data representing a time dependent signal
EP3646466B1 (en) * 2017-06-30 2023-08-23 Siemens Aktiengesellschaft Method and apparatus for compressing data
US10904573B2 (en) * 2017-11-30 2021-01-26 Embry-Riddle Aeronautical University, Inc. Reduced multiplicative complexity discrete cosine transform (DCT) circuitry

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2844695B2 (ja) * 1989-07-19 1999-01-06 ソニー株式会社 信号符号化装置
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
JP3310682B2 (ja) * 1992-01-21 2002-08-05 日本ビクター株式会社 音響信号の符号化方法及び再生方法
JP3446216B2 (ja) * 1992-03-06 2003-09-16 ソニー株式会社 音声信号処理方法
JP3104400B2 (ja) * 1992-04-27 2000-10-30 ソニー株式会社 オーディオ信号符号化装置及び方法
JP3343965B2 (ja) * 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
EP0674394B1 (en) * 1993-10-08 2001-05-16 Sony Corporation Digital signal processor, digital signal processing method and data recording medium
JP3175446B2 (ja) * 1993-11-29 2001-06-11 ソニー株式会社 情報圧縮方法及び装置、圧縮情報伸張方法及び装置、圧縮情報記録/伝送装置、圧縮情報再生装置、圧縮情報受信装置、並びに記録媒体

Also Published As

Publication number Publication date
JPH08330971A (ja) 1996-12-13
US5911130A (en) 1999-06-08

Similar Documents

Publication Publication Date Title
JP3152109B2 (ja) オーディオ信号の圧縮伸張方法
US5347305A (en) Video telephone system
JP2884163B2 (ja) 符号化伝送装置
JP3933691B2 (ja) 画像信号のハイブリッド波形及びモデルベース符号化及び復号化
JP2976860B2 (ja) 再生装置
JPH07160299A (ja) 音声信号帯域圧縮伸張装置並びに音声信号の帯域圧縮伝送方式及び再生方式
JP2002372996A (ja) 音響信号符号化方法及び装置、音響信号復号化方法及び装置、並びに記録媒体
US20030220801A1 (en) Audio compression method and apparatus
WO2004025625A1 (ja) 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム
CN115472153A (zh) 语音增强系统、方法、装置及设备
JPH10313251A (ja) オーディオ信号変換装置及び方法、予測係数生成装置及び方法、予測係数格納媒体
US5899966A (en) Speech decoding method and apparatus to control the reproduction speed by changing the number of transform coefficients
US20090259476A1 (en) Device and computer program product for high frequency signal interpolation
JP2570603B2 (ja) 音声信号伝送装置およびノイズ抑圧装置
JPH09243679A (ja) 任意区間波形を用いた非調和的周波数分析法
FI110220B (fi) Puhesignaalin kompressio ja rekonstruktio
JPH11511315A (ja) 特定一次サンプリング周波数を持つデジタル情報信号の送信
JP3271098B2 (ja) ディジタル画像信号復号装置および方法
JPH07111456A (ja) 音声圧縮方法および装置
JP3011038B2 (ja) 音声情報圧縮方法及び装置
JP2001527734A (ja) 伝送システムにおけるデータの予測
JP2002208860A (ja) データ圧縮装置とそのデータ圧縮方法及びデータ圧縮用プログラムを記録したコンピュータ読み取り可能な記録媒体、並びにデータ伸長装置とそのデータ伸長方法
JP3248162B2 (ja) 帯域合成フィルタ
JP2570981B2 (ja) 帯域圧縮処理器、帯域伸張処理器および音声通信装置
JP3099569B2 (ja) 音響信号の伝送方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090126

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090126

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100126

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110126

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120126

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120126

Year of fee payment: 11

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130126

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees