JPH07111458A - 音声圧縮方法および装置 - Google Patents

音声圧縮方法および装置

Info

Publication number
JPH07111458A
JPH07111458A JP27744493A JP27744493A JPH07111458A JP H07111458 A JPH07111458 A JP H07111458A JP 27744493 A JP27744493 A JP 27744493A JP 27744493 A JP27744493 A JP 27744493A JP H07111458 A JPH07111458 A JP H07111458A
Authority
JP
Japan
Prior art keywords
circuit
residual
peak
prediction coefficient
pulse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP27744493A
Other languages
English (en)
Inventor
Uonwarauipatsuto Uiwatsuto
ウィワット・ウォンワラウィパット
Sunao Takatori
直 高取
Makoto Yamamoto
山本  誠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TAKAYAMA KK
Original Assignee
TAKAYAMA KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TAKAYAMA KK filed Critical TAKAYAMA KK
Priority to JP27744493A priority Critical patent/JPH07111458A/ja
Publication of JPH07111458A publication Critical patent/JPH07111458A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 低ビットレートで明瞭度を確保しつつ、入力
された音声信号を精度良く復元することができる音声圧
縮方法および装置を提供することを目的とする。 【構成】 入力された音声データを線形予測により符号
化して予測係数を検出する符号化回路3と、予測係数に
より予測できない音声データの符号化の残差を出力する
差分回路4と、残差の強度分布内のピークを強調する強
調回路5と、強調された残差から所定のスレッショルド
レベルを越える対象ピークをパルス化することによりマ
ルチパルス方式で残差を近似する閾値回路7とを備え、
予測係数と対象ピークの平均強度、符号、パルスの位置
とを伝送することを特徴とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声データの伝送の
際にその冗長性を除去して必要情報を取り出す音声圧縮
方法および装置に関する。
【0002】
【従来の技術】音声信号から冗長性を除去して必要情報
を取り出す音声圧縮(帯域圧縮符号化)の技術は、従来か
ら主としてディジタル通信の分野で用いられている。従
来の音声圧縮の技術は、波形符号化とパラメータ符号化
とに大きく分類できる。
【0003】波形符号化は、信号波形そのものを効率良
く符号化する方式で、予測、および量子化技術が主な手
段となる。パラメータ符号化は、音声発生のメカニズム
に基づき、必要なパラメータを抽出して符号化する方法
であり、代表的なものとしてPARCOR(Partial Cor
relation;自己相関線形予測)がある。
【0004】
【発明が解決しようとする課題】しかしながら、上述し
た従来の音声圧縮方法では、低ビットレートで明瞭度を
確保しつつ圧縮するのは困難である。例えば、音声予測
方式を用いた音声圧縮方法では、通常の線形予測では予
測できない部分(残差)を簡単な形に変換して予測係数と
共に伝送するため、圧縮率は向上するものの、復元され
た音声の不自然さが問題となる。
【0005】
【発明の目的】この発明は、上述した従来技術の課題に
鑑みてなされたものであり、低ビットレートで明瞭度を
確保しつつ、入力された音声信号を精度良く復元するこ
とができる音声圧縮方法および装置を提供することを目
的とする。
【0006】
【課題を解決するための手段】この発明にかかる音声圧
縮方法は、上記の目的を達成させるため、入力された音
声データを線形予測により符号化して予測係数を検出す
ると共に、予測係数により予測できない音声データの符
号化の残差を検出し、この残差の強度分布内のピークを
強調した後、所定のスレッショルドレベルを越える対象
ピークをパルス化することによりマルチパルス方式で残
差を近似し、予測係数と対象ピークの平均強度、符号、
パルスの位置とを伝送することを特徴とする。
【0007】
【実施例】以下、この発明にかかる音声圧縮方法および
装置の実施例を説明する。図1は、この発明の一実施例
にかかる音声圧縮装置を示す。
【0008】実施例の音声圧縮装置は、線形予測の手法
により検出された予測値を用いて再現したときの音声デ
ータと、実際に入力された音声データとの差(残差)を求
めると共に、この残差のパワーを強調、パルス化してマ
ルチパルス方式で残差を近似し、予測係数と共にパルス
の平均値、位置、符号とを補正データとして伝送する構
成となっている。この構成により、少ないビット数で大
きな情報量を持つ残差を表現することができる。
【0009】具体的には、図1に示されるようにマイク
ロフォン1から入力されてサンプリング回路2でサンプ
リングされた音声データが、LPC(線形予測符号化)回
路3に入力される。LPC回路3は、線形予測によって
音声データの大局情報を抽出する。実際には、PARC
ORにより入力された音声の予測係数(自己相関係数)k
(i)を求めて出力する。
【0010】差分回路4は、LPC回路3により求めら
れた予測係数k(i)を用いて音声信号を復元し、これと
入力された音声信号とを比較することにより、予測でき
ない部分を残差Reとして強調回路5へ出力する。
【0011】強調回路5は、残差Reのピークを強調す
るために、残差パワーの値を3乗して正規化する。これ
により大きいピークはより大きく強調され、小さいピー
クはより低く抑えられる。強調回路5の出力Retは、ロ
ーパスフィルター6に入力されて雑音が除去された後、
閾値回路7に入力される。
【0012】閾値回路7は、残差パワーの強度分布から
所定のスレッショルドレベルSLを越える対象ピークを
検出し、その対象ピークの強度平均を求めると共に、対
象ピークの位置にスパイク状のパルスを置き換えてマル
チパルス方式で残差を近似する。閾値回路7において対
象ピークの強度平均を正確に求めるため、ローパスフィ
ルター6による雑音除去の処理は重要である。
【0013】図2は、残差の信号からパルスを抽出する
過程を示し、(a)は差分回路から出力される残差R
e、(b)は強調回路から出力される強調された残差Re
t、(c)は閾値回路により抽出されたパルス出力であ
る。
【0014】伝送するデータは、予測係数k(i)、スレ
ッショルドレベルSLを越える対象ピークの強度平均
値、符号、パルスの位置の4種類である。予測係数k
(i)は、サンプル周波数が8kHzのときに10次で約
40ビットの容量を持つ。パルス位置は、絶対座標で表
すと各パルス毎に8ビット必要となって情報量が過大と
なるため、相対距離を用いて表現する。
【0015】次に、上記の音声圧縮装置の重要部分の作
用につき詳述する。
【0016】LPC回路3は、現在符号化の対象となっ
ている信号と、過去の信号との強い相関を利用して予測
係数を出力する。相関がある場合、現在対象となってい
る信号は全く未知ではなく、過去の信号からある程度の
予測が可能である。そこで、送信、受信の両サイドで共
通の既符号化情報を元に現信号を予測し、予測から外れ
た部分を示す予測誤差信号のみを予測係数k(i)として
符号化して伝送する。
【0017】強調回路5において残差パワーを強調する
ために2乗ではなく3乗を選択した理由は、第1に対象
ピークをよりシャープに強調するため、第2に符号を保
存するためである。これによって強調された残差の絶対
値がスレッショルドレベルを越えた位置にパルスを発生
させるが、その符号はもとの残差パワーと同一のまま保
持される。
【0018】閾値回路7における処理では、スレッショ
ルドレベルの絶対値が小さいとパルス数が多くなるため
に受信側で復元できる音声の品質を高めることはできる
が、情報量が増えて圧縮率が低下する。反対に、絶対値
が大きいと、圧縮率を高めることはできるが、復元され
る音声の品質が若干低下する。スレッショルドレベル
は、圧縮率と品質とのバランスをとりつつ設定される。
【0019】また、パルス化の過程においては、スレッ
ショルドレベルを越えるピークが一定以上の間隔をおい
て出現するものと仮定して処理をしている。すなわち、
1つのピークが検出された後には、その近傍にはピーク
はないものとみなし、一定の距離をスキップしてから再
びピーク検出を行なう。
【0020】例えば、人間の音声のピッチ特性は約3m
s〜10msであるため、8kHzでサンプリングした
残差の強調データを圧縮する場合には、1つのピークが
検出された後、19サンプルタイミングはピーク検出を
せずに、20サンプル以降に再び検出を開始する。この
処理により、ピーク検出にかかる時間を削減して音声圧
縮処理の高速化を図ることができる。
【0021】
【発明の効果】以上説明したように、この発明によれ
ば、線型予測により予測できない残差をピーク強調によ
りパルス化して検出することにより、正確な音声情報の
伝送、復元を確保しつつ、圧縮率を高めて多重化効率を
高めることができる。
【図面の簡単な説明】
【図1】 この発明にかかる音声圧縮装置の一実施例を
示すブロック図である。
【図2】 残差の強度分布を示すグラフであり、(a)
は強調後の残差データ、(b)はピーク検出後に置き換
えられたパルス列を示す。
【符号の説明】
1 マイクロフォン 2 サンプリング回路 3 LPC(線形予測符号化)回路 4 差分回路 5 強調回路 6 ローパスフィルター 7 閾値回路

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声データを線形予測により
    符号化して予測係数を検出すると共に、前記予測係数に
    より予測できない音声データの符号化の残差を検出し、
    該残差の強度分布内のピークを強調した後、所定のスレ
    ッショルドレベルを越える対象ピークをパルス化するこ
    とによりマルチパルス方式で残差を近似し、前記予測係
    数と前記対象ピークの平均強度、符号、前記パルスの位
    置とを伝送することを特徴とする音声圧縮方法。
  2. 【請求項2】 前記残差の強度分布は、3乗することに
    より強調されることを特徴とする請求項1に記載の音声
    圧縮方法。
  3. 【請求項3】 入力された音声データを線形予測により
    符号化して予測係数を検出する符号化回路と、 前記予測係数により予測できない音声データの符号化の
    残差を出力する差分回路と、 該残差の強度分布内のピークを強調する強調回路と、 前記強調された残差から所定のスレッショルドレベルを
    越える対象ピークをパルス化することによりマルチパル
    ス方式で残差を近似する閾値回路とを備え、 前記予測係数と前記対象ピークの平均強度、符号、前記
    パルスの位置とを伝送することを特徴とする音声圧縮装
    置。
  4. 【請求項4】 前記強調回路は、残差の強度分布を3乗
    することを特徴とする請求項3に記載の音声圧縮方法。
JP27744493A 1993-10-08 1993-10-08 音声圧縮方法および装置 Pending JPH07111458A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27744493A JPH07111458A (ja) 1993-10-08 1993-10-08 音声圧縮方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27744493A JPH07111458A (ja) 1993-10-08 1993-10-08 音声圧縮方法および装置

Publications (1)

Publication Number Publication Date
JPH07111458A true JPH07111458A (ja) 1995-04-25

Family

ID=17583664

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27744493A Pending JPH07111458A (ja) 1993-10-08 1993-10-08 音声圧縮方法および装置

Country Status (1)

Country Link
JP (1) JPH07111458A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006128252A1 (en) * 2005-06-03 2006-12-07 The Commonwealth Of Australia Messaging method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006128252A1 (en) * 2005-06-03 2006-12-07 The Commonwealth Of Australia Messaging method
US8060548B2 (en) 2005-06-03 2011-11-15 The Commonwealth Of Australia Messaging method

Similar Documents

Publication Publication Date Title
AU709369B2 (en) Method of and Apparatus for Coding Audio Signals
CA1218745A (en) Speech signal processing system
KR100587953B1 (ko) 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
JP5543405B2 (ja) フレームエラーに対する感度を低減する符号化体系パターンを使用する予測音声コーダ
JP5226777B2 (ja) 音声信号中に埋め込まれた隠れデータの回復
JP4489960B2 (ja) 音声の無声セグメントの低ビットレート符号化
JPS63223799A (ja) ピツチ検出方法
JP2707564B2 (ja) 音声符号化方式
US4719649A (en) Autoregressive peek-through comjammer and method
JP2002268696A (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
CA2156558C (en) Speech-coding parameter sequence reconstruction by classification and contour inventory
EP0275099B1 (en) Voice analyzing and synthesizing apparatus
US4845753A (en) Pitch detecting device
JPH07111458A (ja) 音声圧縮方法および装置
JP3227929B2 (ja) 音声符号化装置およびその符号化信号の復号化装置
JPH09508479A (ja) バースト励起線形予測
JP2900987B2 (ja) 無音圧縮音声符号化復号化装置
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
US6134519A (en) Voice encoder for generating natural background noise
JP3576485B2 (ja) 固定音源ベクトル生成装置及び音声符号化/復号化装置
JPH01261700A (ja) 音声符号化方式
Goldberg Predictive coding with delayed decision.
JPH01205200A (ja) 音声符号化方式
JP3571448B2 (ja) 音声信号のピッチ検出方法および装置
JPH0637734A (ja) 音声伝送方式