JPH07111462A - 音声圧縮方法および装置 - Google Patents

音声圧縮方法および装置

Info

Publication number
JPH07111462A
JPH07111462A JP5277484A JP27748493A JPH07111462A JP H07111462 A JPH07111462 A JP H07111462A JP 5277484 A JP5277484 A JP 5277484A JP 27748493 A JP27748493 A JP 27748493A JP H07111462 A JPH07111462 A JP H07111462A
Authority
JP
Japan
Prior art keywords
frequency
logarithmic scale
voice data
voice
spectral distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5277484A
Other languages
English (en)
Inventor
Uonwarauipatsuto Uiwatsuto
ウィワット・ウォンワラウィパット
Sunao Takatori
直 高取
Makoto Yamamoto
山本  誠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TAKAYAMA KK
Original Assignee
TAKAYAMA KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TAKAYAMA KK filed Critical TAKAYAMA KK
Priority to JP5277484A priority Critical patent/JPH07111462A/ja
Publication of JPH07111462A publication Critical patent/JPH07111462A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 人間の聴覚に適合した形で音声データを圧縮
することができ、かつ、圧縮率の高い音声圧縮方法およ
び装置を提供することを目的とする。 【構成】 入力された音声データを対数スケールで周波
数変換して対数スケールで表されるスペクトル分布を抽
出する周波数変換回路3と、このスペクトル分布の情報
から各区間の積分値が等しくなるように、境界となる周
波数を決定する分割回路4とを備え、圧縮結果のパラメ
ータとして各境界周波数間の距離値と平均面積値とを伝
送することを特徴とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声データの伝送の
際にその冗長性を除去して必要情報を取り出す音声圧縮
方法および装置に関する。
【0002】
【従来の技術】音声信号から冗長性を除去して必要情報
を取り出す音声圧縮(帯域圧縮符号化)の技術は、従来か
ら主としてディジタル通信の分野で用いられている。
【0003】人間の聴覚では音声の波形そのものよりも
スペクトル(周波数成分)分布の方がより重視されてい
る。そこで、音声を効率良く圧縮するためには、音声ス
ペクトルを人間の聴覚に適した形で近似する必要があ
る。
【0004】LPC(線形予測符号化)、PARCOR
(自己相関線形予測)等の圧縮方法においては、波形その
ものの誤差による評価が不可能で、スペクトル誤差を基
準にして評価する。これらの圧縮方法は、スペクトルの
間の相対的な位相差を考慮せず、スペクトルの代表値を
決定してその代表値からスペクトル包絡線(エンベロー
プ)を再構成し、逆周波数変換を実行する。
【0005】
【発明が解決しようとする課題】しかしながら、上述し
た従来の線形予測では、スペクトルの周波数に対しても
大きさに対しても感度が線形的である。また、スペクト
ルを変換する従来のFFTスペクトル変換の方法では、
周波数軸が線形で人間の聴覚の特性に適合しない。人間
の聴覚では、音声の大きさや音程に対する感覚が対数的
であることが知られており、上記の方法では音声を効率
良く圧縮することができない。
【0006】
【発明の目的】この発明は、上述した従来技術の課題に
鑑みてなされたものであり、人間の聴覚に適合した形で
音声データを圧縮することができ、かつ、圧縮率の高い
音声圧縮方法および装置を提供することを目的とする。
【0007】
【課題を解決するための手段】この発明にかかる音声圧
縮方法は、上記の目的を達成させるため、入力された音
声データを対数スケールで周波数変換して対数スケール
で表されるスペクトル強度分布を抽出し、この分布を各
区間の積分値が等しくなるような周波数で有限個数に分
割し、各分割領域の幅と単一領域の積分値とを圧縮デー
タとして伝送することを特徴とする。
【0008】
【実施例】以下、この発明にかかる音声圧縮方法および
装置の実施例を説明する。図1は、この発明の一実施例
にかかる音声圧縮装置を示す。
【0009】実施例の音声圧縮装置は、入力された音声
データを対数スケールで周波数変換して対数スケールで
表されるスペクトル強度分布を抽出し、この分布を各区
間の積分値が等しくなるような周波数で有限個数に分割
して各分割領域の幅と単一領域の積分値とを圧縮データ
として伝送する。
【0010】具体的には、図1に示されるようにマイク
ロフォン1から入力されてサンプリング回路2でサンプ
リングされた音声データが、周波数変換回路3に入力さ
れる。周波数変換回路3は、音声データを対数スケール
で周波数変換することにより、図2に示されるような対
数スケールで表されるスペクトル分布を抽出する。図2
の横軸は周波数を示し、縦軸は振幅を対数スケールで示
している。
【0011】このスペクトル分布の情報は分割回路4に
入力され、分割回路4は、各区間の積分値が等しくなる
ように、すなわち、各領域の面積S1,S2,S3が等し
くなるように境界となる周波数s0,s1,s2,s3を決
定し、圧縮結果のパラメータとして各境界周波数間の距
離値s1−s0,s2−s1,s3−s2と平均面積値とを伝
送する。距離値は正数であるため、可変長符号化を用い
ればかなり高い圧縮率を得ることができる。
【0012】なお、縦軸が振幅を表すため、各領域の面
積は音声のパワーの積分値を表すこととなる。また、そ
の値は対数スケールで表されているため、振幅の大きい
部分、すなわち音声パワーの大きい部分の比重が小さく
なるよう定められている。Weberの法則によれば、
人間の聴覚で音声パワーの変化を感知できる最小変化量
は、その時聞いている音声の大きさに比例する。したが
って、振幅レベルの大きいところでの変化量を小さいと
ころでの変化量より軽い比重で評価することは、人間の
感覚的には合理的といえる。
【0013】この方法では、分割領域の面積を変更する
ことにより、圧縮率をリニアに変化させることができ
る。分割領域の数が十分に多くなるよう圧縮率を設定す
れば、完全なスペクトル分布を再現できる。なお、可変
長符号化の手法を用いる場合には、音声パワー等の要素
の値に対応させて単位面積を変化させることもできる。
【0014】一のサンプルタイミングでサンプリングし
た音声データのブロックを図1の回路で圧縮し、さらに
その圧縮されたデータを復元すると、精度良くスペクト
ル分布の再現ができる。しかしながら、連続するサンプ
ルタイミングでサンプリングした複数の音声データのブ
ロックを接続すると、接続点でノイズが発生する。
【0015】そこで、この接続点におけるノイズを低減
するため、実施例では各ブロック間に重複区間を設け、
時間的に前のブロックのエンド部分でレベルを漸次減少
させると共に、後のブロックのスタート部分でレベルを
0から漸次増加させ、これらのエンド部分とスタート部
分とを重畳し、線形的に平均による平滑化を図ってい
る。
【0016】図3は、この接続方法を示す。(a)のブ
ロックと(b)のブロックとを接続する場合、(a)の
エンド部分と(b)のスタート部分とをそれぞれ
(a')、(b')に示すように漸次変化させ、これらを
重畳して(c)に示す波形を得る。
【0017】ただし、上記のノイズ低減対策は、レベル
のみの接続であるため、接続部分のスペクトル分布は復
元時には両ブロックの中間的なスペクトル分布とはなら
ない。その理由の一つは、周波数成分からスペクトル分
布に変換するときに失われた位相情報が、スペクトル分
布から周波数成分に逆変換するときに乱数によって与え
られるためにブロック毎に異なる値となるからである。
この位相情報の差が接続時にスペクトル分布の復元に悪
影響を与える。
【0018】したがって、ブロック間のデータのスムー
スな接続のためには、単純な逆周波数変換ではなく、目
標とするスペクトル分布特性を有するフィルターを構成
する必要がある。
【0019】
【発明の効果】以上説明したように、この発明によれ
ば、入力された音声データを対数スケールで周波数変換
してその積分値が等しくなるようスペクトル分布を分割
し、分割点の相対距離を圧縮された情報として出力する
ことにより、人間の聴覚に適合した非線形の符号化が可
能であり、また、少なくとも個々のサンプルタイミング
では、正確なスペクトル分布を復元することができ、分
割数を多く設定すれば、従来の方法と比較して少ない情
報量で、ほぼ完全な形でスペクトル分布を復元すること
が可能となる。
【図面の簡単な説明】
【図1】 この発明にかかる音声圧縮装置の一実施例を
示すブロック図である。
【図2】 周波数変換されてた異数スケールで表された
音声データのグラフである。
【図3】 ブロック接続のための平滑化処理の手順を示
す説明図である。
【符号の説明】
1 マイクロフォン 2 サンプリング回路 3 周波数変換回路 4 分割回路

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声データを対数スケールで
    周波数変換して対数スケールで表されるスペクトル強度
    分布を抽出し、この分布を各区間の積分値が等しくなる
    ような周波数で有限個数に分割し、各分割領域の幅と単
    一領域の積分値とを圧縮データとして伝送することを特
    徴とする音声圧縮方法。
  2. 【請求項2】 入力された音声データを対数スケールで
    周波数変換して対数スケールで表されるスペクトル分布
    を抽出する周波数変換回路と、 このスペクトル分布の情報から各区間の積分値が等しく
    なるように、境界となる周波数を決定する分割回路とを
    備え、 圧縮結果のパラメータとして各境界周波数間の距離値と
    平均面積値とを伝送することを特徴とする音声圧縮装
    置。
JP5277484A 1993-10-08 1993-10-08 音声圧縮方法および装置 Pending JPH07111462A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5277484A JPH07111462A (ja) 1993-10-08 1993-10-08 音声圧縮方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5277484A JPH07111462A (ja) 1993-10-08 1993-10-08 音声圧縮方法および装置

Publications (1)

Publication Number Publication Date
JPH07111462A true JPH07111462A (ja) 1995-04-25

Family

ID=17584243

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5277484A Pending JPH07111462A (ja) 1993-10-08 1993-10-08 音声圧縮方法および装置

Country Status (1)

Country Link
JP (1) JPH07111462A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0852375A1 (en) * 1996-12-19 1998-07-08 Lucent Technologies Inc. Speech coder methods and systems
US6477490B2 (en) 1997-10-03 2002-11-05 Matsushita Electric Industrial Co., Ltd. Audio signal compression method, audio signal compression apparatus, speech signal compression method, speech signal compression apparatus, speech recognition method, and speech recognition apparatus

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0852375A1 (en) * 1996-12-19 1998-07-08 Lucent Technologies Inc. Speech coder methods and systems
US5839098A (en) * 1996-12-19 1998-11-17 Lucent Technologies Inc. Speech coder methods and systems
USRE43099E1 (en) 1996-12-19 2012-01-10 Alcatel Lucent Speech coder methods and systems
US6477490B2 (en) 1997-10-03 2002-11-05 Matsushita Electric Industrial Co., Ltd. Audio signal compression method, audio signal compression apparatus, speech signal compression method, speech signal compression apparatus, speech recognition method, and speech recognition apparatus
KR100361883B1 (ko) * 1997-10-03 2003-01-24 마츠시타 덴끼 산교 가부시키가이샤 오디오신호압축방법,오디오신호압축장치,음성신호압축방법,음성신호압축장치,음성인식방법및음성인식장치

Similar Documents

Publication Publication Date Title
US6353808B1 (en) Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
JPH1020898A (ja) オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
EP0657873B1 (en) Speech signal bandwidth compression and expansion apparatus, and bandwidth compressing speech signal transmission method, and reproducing method
US3471648A (en) Vocoder utilizing companding to reduce background noise caused by quantizing errors
JPH07297726A (ja) 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法
CA1323934C (en) Speech processing apparatus
JPH10503908A (ja) オーディオ信号の調性を決定するための方法および装置
US5179623A (en) Method for transmitting an audio signal with an improved signal to noise ratio
JPH07111462A (ja) 音声圧縮方法および装置
JP4645869B2 (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JPH08123490A (ja) スペクトル包絡量子化装置
JPH08130494A (ja) 音声信号処理システム
JP4260928B2 (ja) 音声圧縮装置および記録媒体
JPH0784596A (ja) 符号化音声の品質評価方法
JPH0689095A (ja) 音響信号選択装置
JP3089690B2 (ja) ディジタルデータの高能率符号化方法
JP3010663B2 (ja) ノイズシェーピング回路
JP2002049398A (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JP3118964B2 (ja) 変換装置の特性評価方法及び特性評価装置
JP3830106B2 (ja) 広帯域ディジタル信号の信号スペクトルを規定し、かつこの信号スペクトルに応じてビット配置情報を得る機構
US5899974A (en) Compressing speech into a digital format
JPS60239129A (ja) 音声情報量圧縮方法
JPH07225598A (ja) 動的に決定された臨界帯域を用いる音響コード化の方法および装置
JP2555999B2 (ja) 線形予測分析用a−d変換装置
JPH01205200A (ja) 音声符号化方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees