JPH07111456A - 音声圧縮方法および装置 - Google Patents

音声圧縮方法および装置

Info

Publication number
JPH07111456A
JPH07111456A JP27744993A JP27744993A JPH07111456A JP H07111456 A JPH07111456 A JP H07111456A JP 27744993 A JP27744993 A JP 27744993A JP 27744993 A JP27744993 A JP 27744993A JP H07111456 A JPH07111456 A JP H07111456A
Authority
JP
Japan
Prior art keywords
vector
residual
circuit
representative
representative value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP27744993A
Other languages
English (en)
Inventor
Uonwarauipatsuto Uiwatsuto
ウィワット・ウォンワラウィパット
Sunao Takatori
直 高取
Makoto Yamamoto
山本  誠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TAKAYAMA KK
Original Assignee
TAKAYAMA KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TAKAYAMA KK filed Critical TAKAYAMA KK
Priority to JP27744993A priority Critical patent/JPH07111456A/ja
Publication of JPH07111456A publication Critical patent/JPH07111456A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 低ビットレートで明瞭度を確保しつつ、入力
された音声信号を精度良く復元することができる音声圧
縮方法および装置を提供することを目的とする。 【構成】 入力された音声データを線形予測により符号
化して予測係数を出力する符号化回路3と、予測係数に
より予測できない音声データの符号化の残差を出力する
差分回路4と、残差の代表値が規定されたベクトルテー
ブル6から、差分回路から出力された残差に最も近い代
表値を検索し、代表値を特定する番号を出力する検索回
路7とを備え、少なくとも予測係数k(i)と番号VNと
を伝送することを特徴とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声データの伝送の
際にその冗長性を除去して必要情報を取り出す音声圧縮
方法および装置に関する。
【0002】
【従来の技術】音声信号から冗長性を除去して必要情報
を取り出す音声圧縮(帯域圧縮符号化)の技術は、従来か
ら主としてディジタル通信の分野で用いられている。従
来の音声圧縮の技術は、波形符号化とパラメータ符号化
とに大きく分類できる。
【0003】波形符号化は、信号波形そのものを効率良
く符号化する方式で、予測、および量子化技術が主な手
段となる。パラメータ符号化は、音声発生のメカニズム
に基づき、必要なパラメータを抽出して符号化する方法
であり、代表的なものとしてPARCOR(Partial Cor
relation;自己相関線形予測)がある。
【0004】
【発明が解決しようとする課題】しかしながら、上述し
た従来の音声圧縮方法では、低ビットレートで明瞭度を
確保しつつ圧縮するのは困難である。例えば、音声予測
方式を用いた音声圧縮方法では、通常の線形予測では予
測できない部分(残差)を簡単な形に変換して予測係数と
共に伝送するため、圧縮率は向上するものの、復元され
た音声の不自然さが問題となる。
【0005】
【発明の目的】この発明は、上述した従来技術の課題に
鑑みてなされたものであり、低ビットレートで明瞭度を
確保しつつ、入力された音声信号を精度良く復元するこ
とができる音声圧縮方法および装置を提供することを目
的とする。
【0006】
【課題を解決するための手段】この発明にかかる音声圧
縮方法は、上記の目的を達成させるため、入力された音
声データを線形予測により符号化して予測係数を検出す
ると共に、予測係数により予測できない音声データの符
号化の残差を検出し、残差の代表値が規定されたテーブ
ルから、差分回路から出力された残差に最も近い代表値
を検索して該代表値を特定する番号を選択し、少なくと
も予測係数と番号とを伝送することを特徴とする。
【0007】
【実施例】以下、この発明にかかる音声圧縮方法および
装置の実施例を説明する。図1は、この発明の一実施例
にかかる音声圧縮装置を示す。
【0008】実施例の音声圧縮装置は、線形予測の手法
により検出された予測値を用いて再現したときの音声デ
ータと、実際に入力された音声データとの差(残差)を求
めると共に、この残差を量子化テーブルを用いて符号化
し、予測係数と共にその補正データとして伝送する構成
となっている。この構成により、少ないビット数で大き
な情報量を持つ残差を表現することができる。
【0009】具体的には、図1に示されるようにマイク
ロフォン1から入力されてサンプリング回路2でサンプ
リングされた音声データが、LPC(線形予測符号化)回
路3に入力される。LPC回路3は、線形予測によって
音声データの大局情報を抽出する。実際には、PARC
ORにより入力された音声の予測係数(自己相関係数)k
(i)を求めて出力する。
【0010】差分回路4は、LPC回路3により求めら
れた予測係数k(i)を用いて音声信号を復元し、これと
入力された音声信号とを比較することにより、予測でき
ない部分を残差Reとして正規化回路5へ出力する。
【0011】正規化回路5は、残差Reの分散を求めて
残差パワーPeとして出力すると共に、その分散がベク
トルテーブル6に規定された代表ベクトルの分散値3
2.0と等しくなるよう正規化する。ベクトルテーブル
6は、この例では分散値32.0に正規化された残差の
パターンを2048個の代表ベクトルとして保持してい
る。
【0012】検索回路7は、ベクトルテーブル6内の代
表ベクトルから正規化された残差に最も近い値を検索
し、そのベクトルの番号VNを出力する。
【0013】伝送するデータは、予測係数k(i)、残差
パワーPe、ベクトル番号VNの3種類である。予測係
数k(i)は、サンプル周波数が8kHzのときに10次
で約40ビットの容量を持つ。残差パワーPeは6ビッ
ト、ベクトル番号VNは11ビットとなる。
【0014】次に、上記の音声圧縮装置の重要部分の作
用につき詳述する。
【0015】LPC回路3は、現在符号化の対象となっ
ている信号と、過去の信号との強い相関を利用して予測
係数を出力する。相関がある場合、現在対象となってい
る信号は全く未知ではなく、過去の信号からある程度の
予測が可能である。そこで、送信、受信の両サイドで共
通の既符号化情報を元に現信号を予測し、予測から外れ
た部分を示す予測誤差信号のみを予測係数k(i)として
符号化して伝送する。
【0016】上記のLPC回路3による線形予測では予
測できない残差Reは、この例ではベクトル量子化によ
り圧縮されて伝送される。ベクトル量子化は、n個(n
>1)の特徴量をn次のベクトルという一つのブロック
として捉え、これを一括して量子化する処理である。そ
の原理は一種のパターンマッチングであり、あらかじめ
送信側と受信側とで共通のベクトルテーブルを用意し、
入力ベクトルとテーブル内の各代表ベクトルとの近似度
を一定のひずみ尺度で計算し、最も近似度が高いテーブ
ル内の代表ベクトルを検索してその代表ベクトルの番号
を符号化伝送するものである。
【0017】残差Reをベクトル量子化の方法で効率良
く圧縮するためには、以下の2つの準備が事前に必要と
なる。
【0018】第1に、特徴として保存すべき対象を波
形、スペクトラム、予測係数等から選択する。圧縮処理
の種類によって保存対象の特徴が異なり、圧縮率や性能
評価方法も変わる。また、圧縮の際のスケーリングも必
要となる。例えば、音声パワーは対数で評価した方がデ
ータ量を小さくすることができると共に、人間の聴覚の
特性にも適合する。平均値、分散等により正規化する方
法も、ここでいうスケーリングに含まれる。
【0019】第2に、ベクトルテーブルを作成する。ベ
クトルテーブルは、入力ベクトルの分布をカバーできる
ように十分に大きく、かつ、代表ベクトルが入力ベクト
ルの分布内で均一に分布している必要がある。また、リ
アルタイムで変換できるよう高速検索が可能な処理アル
ゴリズムが必要となる。例えば、全件検索を行なうと送
信側のパターンマッチングに非常に大きな処理量が必要
となるため、テーブル内のパターンをツリー状に配列し
てツリーサーチ(分岐探索)を行なうようにする等の処理
量軽減対策がとられる。
【0020】また、ベクトル量子化方式では、波形が同
一であっても平均値や振幅が異なる場合には異なるパタ
ーンとみなされるため、前処理なしにマッチングする場
合には用意する代表ベクトルの数も膨大となる。このた
め、前処理として平均値や振幅を別情報として抽出し、
テーブル内の代表ベクトル、およびこれとのマッチング
をする入力ベクトルには平均値0、振幅一定に正規化し
たものを使用する。これにより、パターンマッチング部
分での処理負担を軽減することができる。
【0021】なお、ベクトル量子化をする場合、音声波
形そのものを対象とするよりも、この発明のように対象
となる特徴量を抽出した後の残差を対象とした方が誤差
を小さく抑えることができる。特に、人間の聴覚では波
形そのものよりもスペクトル(周波数成分)の方がより重
視されているため、線形予測の手法でスペクトルを抽出
し、その残差をベクトル量子化により圧縮して伝送すれ
ば聴覚に適合した情報を伝送することができる。また、
入力ベクトルと代表ベクトルとの間に多少のズレがある
場合にも、線形予測係数を用いて復元するため、復元さ
れた音声ではズレは小さく抑えられる。
【0022】次に、残差のベクトルテーブルの作成方法
について説明する。残差の代表ベクトルを規定するベク
トルテーブルは、本来は対象となる音声の処理結果から
作成すべきであるが、その場合にはベクトルテーブルの
作成に時間と労力とがかかる。そこで、この実施例で
は、乱数を用いてベクトルテーブルを作成している。
【0023】ベクトルテーブルに規定される代表ベクト
ルが持つ成分は、ホワイトノイズ、低周波、周期的なパ
ルスの3つに分けることができ、これらの成分を乱数に
より生成する。作成された代表ベクトルは、次のように
正規化される。
【0024】第1に平均値を0にし、第2に分散を3
2.0にする。これらは、音声圧縮時に残差との距離を
比較し易くするための処理である。残差の入力ベクトル
Reとテーブル内の代表ベクトルVqとの距離E(q)は、
各ベクトルを構成する成分をそれぞれRe(i)、Vq(i)と
して、次の(1)式により求められる。
【0025】
【数1】
【0026】ベクトルテーブル内の代表ベクトルは、残
差ベクトルの分布範囲の中で均一に分布することが望ま
しいため、乱数により代表ベクトルを生成した後、生成
した代表ベクトルと既存のテーブル内の代表ベクトルと
の距離を計算し、既存の代表ベクトルとの距離が近接す
る場合には、新たに生成した代表ベクトルを削除して再
度生成する。このような、生成、距離計算、計算結果に
よっては削除、という3つのサイクルを繰り返すことに
より、代表ベクトルがベクトル空間内で均一に分布した
ベクトルテーブルを作成することができる。
【0027】乱数ではなく実際の音声をソースにしてベ
クトルテーブルを作成する場合にも、同様の反復処理が
必要となる。
【0028】次に、学習によるベクトルテーブルの更新
方法について説明する。使用頻度が高い残差の代表ベク
トルは、対象となる音声信号の分布から抽出した方が乱
数で生成するよりも効率良く生成できる。そのため、初
期テーブルを上記の方法で乱数により作成しておき、対
象音声が入力されたときに、これに基づく学習によりベ
クトルテーブルを更新するよう構成しておけば、使用回
数が増加する毎にベクトルテーブルをより変換効率のよ
いテーブルに変更することができる。
【0029】学習による更新は次のように実行される。
すなわち、まず、残差のベクトルが入力されたときにそ
の入力ベクトルReにテーブル内で最も近い代表ベクト
ルを検索し、入力ベクトルReと検索で抽出された代表
ベクトルV(q)との距離E(q)を計算する。距離E(q)が
所定の基準値より小さければ、テーブルは更新せずに代
表ベクトルの番号VNを出力する。距離E(q)が基準値
より大きい場合には、代表ベクトルV(q)を以下の(2)
式によりV'(q)に更新し、代表ベクトル番号を出力す
る。kは重み付けの定数である。
【0030】
【数2】Vq'(i)=kVq(i)+(1−k)Re(i) …(2) (0<k<1)
【0031】この更新学習を繰り返すことにより、圧縮
誤差が減少する方向にベクトルテーブルを更新すること
ができる。
【0032】
【発明の効果】以上説明したように、この発明によれ
ば、線型予測により予測できない残差をベクトルテーブ
ルを用いて量子化することにより、正確な音声情報の伝
送、復元を確保しつつ、圧縮率を高めて多重化効率を高
めることができる。
【図面の簡単な説明】
【図1】 この発明にかかる音声圧縮装置の一実施例を
示すブロック図である。
【符号の説明】
1 マイクロフォン 2 サンプリング回路 3 LPC(線形予測符号化)回路 4 差分回路 5 正規化回路 6 ベクトルテーブル 7 検索回路

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声データを線形予測により
    符号化して予測係数を検出すると共に、前記予測係数に
    より予測できない音声データの符号化の残差を検出し、
    残差の代表値が規定されたテーブルから、前記差分回路
    から出力された残差に最も近い代表値を検索して該代表
    値を特定する番号を選択し、少なくとも前記予測係数と
    前記番号とを伝送することを特徴とする音声圧縮方法。
  2. 【請求項2】 前記代表値は、複数の要素を含む代表ベ
    クトルとして定義され、前記残差を示す入力ベクトルと
    のパターンマッチングにより検索、特定されることを特
    徴とする請求項1に記載の音声圧縮方法。
  3. 【請求項3】 前記代表値を定義するベクトルテーブル
    は、一定の条件で正規化された代表ベクトルを定義し、
    前記残差を示す入力ベクトルは、前記条件で正規化され
    た後にパターンマッチングが実行されると共に、正規化
    により消失する特徴量を前記予測係数、前記番号と共に
    伝送することを特徴とする請求項2に記載の音声圧縮方
    法。
  4. 【請求項4】 入力された音声データを線形予測により
    符号化して予測係数を出力する符号化回路と、 前記予測係数により予測できない音声データの符号化の
    残差を出力する差分回路と、 残差の代表値が規定されたテーブルから、前記差分回路
    から出力された残差に最も近い代表値を検索し、該代表
    値を特定する番号を出力する検索回路とを備え、 少なくとも前記予測係数と前記番号とを伝送することを
    特徴とする音声圧縮装置。
  5. 【請求項5】 前記代表値は、複数の要素を含む代表ベ
    クトルとして定義され、前記検索回路は、残差を示す入
    力ベクトルと前記代表ベクトルとのパターンマッチング
    により代表値の番号を特定することを特徴とする請求項
    4に記載の音声圧縮装置。
  6. 【請求項6】 前記代表値を定義するベクトルテーブル
    は、一定の条件で正規化された代表ベクトルを定義し、
    前記残差を示す入力ベクトルは、正規化回路により前記
    条件で正規化され、前記検索回路は、正規化された入力
    ベクトルによりパターンマッチングを実行し、正規化に
    より消失する特徴量を前記予測係数、前記番号と共に伝
    送することを特徴とする請求項5に記載の音声圧縮装
    置。
JP27744993A 1993-10-08 1993-10-08 音声圧縮方法および装置 Pending JPH07111456A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27744993A JPH07111456A (ja) 1993-10-08 1993-10-08 音声圧縮方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27744993A JPH07111456A (ja) 1993-10-08 1993-10-08 音声圧縮方法および装置

Publications (1)

Publication Number Publication Date
JPH07111456A true JPH07111456A (ja) 1995-04-25

Family

ID=17583736

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27744993A Pending JPH07111456A (ja) 1993-10-08 1993-10-08 音声圧縮方法および装置

Country Status (1)

Country Link
JP (1) JPH07111456A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020006164A (ko) * 2000-07-11 2002-01-19 송문섭 음성 신호 부호화시 격자방법을 이용한 고정소수점선형예측부호화 계수 추출 방법
JP2006295829A (ja) * 2005-04-14 2006-10-26 Nippon Hoso Kyokai <Nhk> 量子化装置、量子化プログラム、及び信号処理装置
JP2009296278A (ja) * 2008-06-04 2009-12-17 Nippon Telegr & Teleph Corp <Ntt> 代表ベクトル生成方法及び装置及びプログラム
JP2010524332A (ja) * 2007-04-04 2010-07-15 テレフオンアクチーボラゲット エル エム エリクソン(パブル) ベクトルを使用する画像処理
JP2012113657A (ja) * 2010-11-26 2012-06-14 Mitsubishi Electric Corp データ圧縮装置及びデータ復元装置及びデータ処理システム及びコンピュータプログラム及びデータ圧縮方法及びデータ復元方法
US9313384B2 (en) 2012-12-07 2016-04-12 Samsung Electronics Co., Ltd. Zoom lens having vibration prevention function
WO2020161952A1 (ja) 2019-02-05 2020-08-13 シチズンファインデバイス株式会社 磁界センサ装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020006164A (ko) * 2000-07-11 2002-01-19 송문섭 음성 신호 부호화시 격자방법을 이용한 고정소수점선형예측부호화 계수 추출 방법
JP2006295829A (ja) * 2005-04-14 2006-10-26 Nippon Hoso Kyokai <Nhk> 量子化装置、量子化プログラム、及び信号処理装置
JP2010524332A (ja) * 2007-04-04 2010-07-15 テレフオンアクチーボラゲット エル エム エリクソン(パブル) ベクトルを使用する画像処理
US8571339B2 (en) 2007-04-04 2013-10-29 Telefonaktiebolaget Lm Ericsson (Publ) Vector-based image processing
JP2009296278A (ja) * 2008-06-04 2009-12-17 Nippon Telegr & Teleph Corp <Ntt> 代表ベクトル生成方法及び装置及びプログラム
JP2012113657A (ja) * 2010-11-26 2012-06-14 Mitsubishi Electric Corp データ圧縮装置及びデータ復元装置及びデータ処理システム及びコンピュータプログラム及びデータ圧縮方法及びデータ復元方法
US9313384B2 (en) 2012-12-07 2016-04-12 Samsung Electronics Co., Ltd. Zoom lens having vibration prevention function
WO2020161952A1 (ja) 2019-02-05 2020-08-13 シチズンファインデバイス株式会社 磁界センサ装置

Similar Documents

Publication Publication Date Title
Gersho et al. Vector quantization: A pattern-matching technique for speech coding
JP2779886B2 (ja) 広帯域音声信号復元方法
JP4506039B2 (ja) 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
US6269333B1 (en) Codebook population using centroid pairs
JP2006099124A (ja) デジタル無線チャネル上の自動音声/話者認識
KR20080074234A (ko) Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, 기록 매체, 음성 부호화 장치, 음성 복호화장치, 음성 신호 송신 장치, 및 음성 신호 수신 장치
JP2002372996A (ja) 音響信号符号化方法及び装置、音響信号復号化方法及び装置、並びに記録媒体
US6141640A (en) Multistage positive product vector quantization for line spectral frequencies in low rate speech coding
Eriksson et al. Exploiting interframe correlation in spectral quantization: a study of different memory VQ schemes
JPH07261800A (ja) 変換符号化方法、復号化方法
JPH07111456A (ja) 音声圧縮方法および装置
JPH09106299A (ja) 音響信号変換符号化方法および復号化方法
WO2005033860A2 (en) A fast codebook selection method in audio encoding
KR100508618B1 (ko) 피치 주기 탐색 범위 설정 장치, 피치 주기 탐색 장치,적응 음원 벡터의 생성 장치, 음성 부호화 장치, 음성복호화 장치, 음성 신호 송신 장치, 음성 신호 수신 장치,이동국 장치 및 기지국 장치
US7164719B2 (en) System to reduce distortion due to coding with a sample-by-sample quantizer
Gersho et al. Vector quantization techniques in speech coding
JP2958726B2 (ja) 反復性をもつサンプル化アナログ信号をコード化しデコードするための装置
JP4574320B2 (ja) 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体
Rebolledo et al. A multirate voice digitizer based upon vector quantization
US5943644A (en) Speech compression coding with discrete cosine transformation of stochastic elements
Buzo et al. A two-step speech compression system with vector quantizing
Samuelsson et al. Multiple description coding based on Gaussian mixture models
JP4618823B2 (ja) 信号符号化装置及び方法
JPH0451100A (ja) 音声情報圧縮装置
Matsuyama et al. Voice coding and tree encoding speech compression systems based upon inverse filter matching