JPH01205200A - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JPH01205200A
JPH01205200A JP63030198A JP3019888A JPH01205200A JP H01205200 A JPH01205200 A JP H01205200A JP 63030198 A JP63030198 A JP 63030198A JP 3019888 A JP3019888 A JP 3019888A JP H01205200 A JPH01205200 A JP H01205200A
Authority
JP
Japan
Prior art keywords
frequency
information
peak
amplitude
phase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63030198A
Other languages
English (en)
Inventor
Yasumi Matsuyuki
松雪 康巳
Yasuhiko Tada
康彦 多田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP63030198A priority Critical patent/JPH01205200A/ja
Publication of JPH01205200A publication Critical patent/JPH01205200A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 「産業上の利用分野」 この発明は音声信号を周波数領域に変換し、変換係数を
振幅と位相成分に分けて符号化する音声符号化方式(二
関するものである。
「従来の技術」 従来、音声信号を周波数領域に変換して、その変換され
たスペクトルヲ伝送パラメータとして符号化する音声符
号化方式としてA T C(AdaptiveTran
sform Coding )方式がある。この方式で
は周波数領域の信号の全てを符号化するため、9.6k
bps程度以下のピットレートでは情報に割り当てられ
るビット数が不足し、十分な符号化品質を得ることがで
きない。
一方、音声信号を周波数領域に変換して、その変換され
たスペクトルを振幅成分と位相成分に分けて符号化する
場合には、変換されたスペクトルの振幅成分からそのピ
ークを抽出し、離散値である周波数位置とその点におけ
る振幅、位相tパラメータとして各パラメータを量子化
する音声符号化方式がある。この方式では伝送すべき情
報が必要最小限に限られているため符号化効率は良<9
.6kbpslJ以下のビットレートでも、ある程度の
符号化品質は得られる。
しかしながらこの方式では抽出されたピーク値は離散値
であり、正確にスペクトルのピーク(調S i分)が検
出されていないため、音声の特徴抽出が十分ではなく、
符号化音声の劣化を招く、また周波数位置、振幅、位相
の3つのパラメータを同時に量子化するため、各々に量
子化誤差が生じて周波数位置に対する振幅、位相が不整
合となることにより、符号化品質の劣化が生じる。
「課題を解決するための手段」 上記問題点を解決するために、この発明では振幅成分の
ピークを抽出した後、例えば抽出した振幅成分のピーク
点とその両側の2点を含む3点による二次補間によって
、実際のビーク乞詳細に定め、ピーク位置の周波数を決
定する。さらに抽出したピークの周波数情報乞量子化し
局部復号化して、その局部復号された周波数位置におけ
る振幅、位相を補間して新たに定めることにより、音声
の特徴抽出を十分に行う。また周波数位置の情報を予め
局部復号化することにより、周波数、振幅、位相の各パ
ラメータの不整合を防止し、S kbps D下の低ビ
ツトレートでも高い符号化品質が得られる。
「実施例」 以下(二この発明の実施例を図面を用いて説明する。弗
1図はこの発明の符号化方式の一実施例を示す。端子か
らの入力音声信号1は直交変換部2で1フレームを単位
に、例えば離散的フーリエ変換(DFT)により周波数
領域の信号、即ちスペクトルに変換される。次に補助情
報抽出部3において音声パワとスペクトルの帯域(例え
ば0〜1゜1〜2,2〜4KHz)毎のパワとが補助情
報として抽出された後、量子化され、さらに補助情報局
部復号化部4において補助情報はあらかじめ符号器にお
いて復号化される。変換されたスペクトルは振幅・位相
成分抽出部6で振幅成分と位相成分とに分けられ、ピー
ク抽出部7で調波構造をもつ振幅成分の各ピークが抽出
される。ピーク抽出部7では振幅スペクトルの尖端、例
えばある点を中心として前後2点を含む5点の振幅スペ
クトル値が中心から順に小さくなっている場合にその点
をピークとして抽出する。検出された複数個のピークの
うち第1番目のピークを基本周波数f、とみなし、全帯
域におけるピーク数をk maxとしたとき、ピーク数
k maxは、8KHzサンプリング音声の場合、音声
帯域は4KHzであるから kmax = 4000/ fp と決める。これはピーク数を決定された基本周波数に対
して一意に決めることにより各ピークの周波数を量子化
する際の効率を上げるためである。
第2図に示すように基本周波数f、の幅を持つ区間にお
いて複数個のピークが検出された場合には、例えばその
区間内の最大の振幅を有するピークを残すという方法に
より、1個のみを残し、その区間内の他のピークは削除
する。また基本周波数f。
の幅をもつ区間においてピークが検出されなかった場合
には、基本周波数fpの整数倍の周波数位置をピーク点
として新たに追加する。このようにしてピークは1区間
に1個とし、ピーク数の総計がk maxになるように
する。
次に周波数情報補間部8で抽出した振幅成分のピーク点
とその両側の2点を含む3点による二次補間によって、
実際のピークとなる周波数を詳細(二定める。この周波
数(I iは弗3図に示すよう(=、抽出したピークの
周波数をfi、振幅値yrmi、その両側の2点の振幅
値Z各々rli −1、mi+lとすると、 として決定される。さらに決定されたピークの周波数位
置?、先に抽出した補助情報(音声の帯域毎のパワ)に
より、適応情報割当部5で帯域毎のパワに応じたビット
配分を行って割り当てられたビット数で、周波数情報量
子化部9で量子化する。
周波数情報量子化部9では、先に抽出した基本周波数(
第1番目のピーク)はそのまま量子化するが、先にピー
クの削除、追加を行ってピーク数を決定しているので、
第2番目以降のピークの周波数は、基本周波数の整数倍
の値との差分を量子化する。
局部復号化部10でこの周波数情報のみを復号化して、
その復号された周波数位置仝iにおける振幅、位相を新
たに定める。決定方法は上記と同様に、振幅情報補間部
11で、局部復号化した周波数仝iに最も近い点とその
両側の2点を含む3点による二次補間な行い、周波数+
iに対応する振幅令を決定する。また位相については、
位相補間部12において、周波数仝iの両側の点の位相
による線形補間を行い、周波数仝iに対応する位相9=
を決定する。周波数f i−1、f i 、 f i+
1に対する位相なψi−1.ψi、ψi+1とすると求
める位相9=は次′式となる。
◇i=、1+ヱ早ヱ止ユ、全1−fi)fI−fi−1 °<ri−1<仝!<fiのとき) ψi+1−ψ1 Qi=ψi+□(全1−fi) fi−1−1−fi (fi≦仝1(fi−1−1のとき) 以上の方法で決定された振幅1位相の各パラメータを先
に求めておいた袖助情報にもとづいて、適応情報割当部
5で適応情報割当(ビット配分)を行い、振幅情報量子
化部13、位相情報量子1ヒ部14で各々量子化する。
振幅情報量子化部13では第1ピークの振幅値はそのま
まの値を量子化し、以降は次々に差分な電子化する。位
相情報部14では各々のピークの位相を線形量子化する
一方、受信側では伝送されたパラメータをもとこ音声信
号を再生する。補助情報復号化部17で復号化された補
助情報を用いて、符号器で用いたものと同じ適応情報割
当部5で割り当てられるピット数によって、各復号化部
18〜20で復号化された伝送パラメータの周波数をf
i、振幅なmi。
位相をΦiとしたとき、音声信号s (t)は音声波形
再生部21で として再生され、符号化音声出力22を得ることができ
る。
ここでは音声信号を周波数領域に変換した信号を符号化
する方法について述べたが、この発明の方式は音声信号
を線形予測分析した線形予測係数により制御されるフィ
ルタ係数を有する逆フィルタの出力である。残差音声信
号に対しても用いることができる。
「発明の効果」 以上述べたようにこの発明によれば、音声信号を周波数
領域に変換して周波数、振幅、位相を主な伝送パラメー
タとして符号化する場合において、振幅、位相の補間な
行い、また周波数情報を予め局部復号化するため、9.
5kbps程度以下の低ピットの符号化においても高い
符号化品質が得られる。
【図面の簡単な説明】
第1図はこの発明の一実施例を示すブロフク図、第2図
はピーク検出と削除、追加を説明する図、第3図は周波
数、振幅、位相の補間方法を説明する図である。 特許出願人  日本電信電話株式会社

Claims (1)

    【特許請求の範囲】
  1. (1)入力音声信号を一定時間間隔で標本化してその標
    本値を取り出し、一定数記憶して1フレームとし、1フ
    レーム毎に、その記憶した音声信号を周波数領域に変換
    して符号化する音声符号化方式において、 その変換したスペクトルを周波数軸上でブロックに分割
    し、各ブロック毎のパワを音声のパワとともに量子化し
    て補助情報として符号化する補助情報抽出手段と、 その補助情報を復号する局部復号化手段と、その復号さ
    れた補助情報を使って適応的に情報割当を行う適応情報
    割当手段と、 上記変換したスペクトルを離散的な振幅成分と位相成分
    に分ける手段と、 その振幅成分のピーク(調波成分)を抽出する手段と、 その抽出したピークによりピークとなる周波数情報を補
    間して求める手段と、 その補間して求めた周波数情報を、上記割当情報によっ
    て量子化する手段と、 その量子化された周波数情報を局部復号化する手段と、 その局部復号された周波数における振幅、位相を補間し
    て定める手段と、 上記割当情報によって上記補間して定められた振幅と位
    相を量子化する手段とを具備することを特徴とする音声
    符号化方式。
JP63030198A 1988-02-12 1988-02-12 音声符号化方式 Pending JPH01205200A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63030198A JPH01205200A (ja) 1988-02-12 1988-02-12 音声符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63030198A JPH01205200A (ja) 1988-02-12 1988-02-12 音声符号化方式

Publications (1)

Publication Number Publication Date
JPH01205200A true JPH01205200A (ja) 1989-08-17

Family

ID=12297050

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63030198A Pending JPH01205200A (ja) 1988-02-12 1988-02-12 音声符号化方式

Country Status (1)

Country Link
JP (1) JPH01205200A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007088853A1 (ja) * 2006-01-31 2007-08-09 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法
JP2013537647A (ja) * 2010-07-30 2013-10-03 クゥアルコム・インコーポレイテッド オーディオ信号の従属モードコーディングのためのシステム、方法、装置、およびコンピュータ可読媒体
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007088853A1 (ja) * 2006-01-31 2007-08-09 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法
JPWO2007088853A1 (ja) * 2006-01-31 2009-06-25 パナソニック株式会社 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法
JP2013537647A (ja) * 2010-07-30 2013-10-03 クゥアルコム・インコーポレイテッド オーディオ信号の従属モードコーディングのためのシステム、方法、装置、およびコンピュータ可読媒体
US8831933B2 (en) 2010-07-30 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for multi-stage shape vector quantization
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
US9236063B2 (en) 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection

Similar Documents

Publication Publication Date Title
RU2387023C2 (ru) Многоканальный аудиокодер без потерь
US4677671A (en) Method and device for coding a voice signal
JP2756515B2 (ja) 可聴信号の知覚符号化方法および音声信号伝送方法
KR100634506B1 (ko) 저비트율 부호화/복호화 방법 및 장치
CN1702974B (zh) 用于对数字信号编码/解码的方法和设备
CN1809872B (zh) 编码音频信号的设备和方法及解码已编码音频信号的设备和方法
USRE46082E1 (en) Method and apparatus for low bit rate encoding and decoding
US20100094642A1 (en) Method of lost frame consealment and device
US20030215013A1 (en) Audio encoder with adaptive short window grouping
JPH09204197A (ja) 周波数領域内のlpc予測による時間領域内での知覚ノイズ整形
JPH10282999A (ja) オーディオ信号を符号化する方法及び装置、並びに符号化されたオーディオ信号を復号する方法及び装置
JP2007504503A (ja) 低ビットレートオーディオ符号化
US8149927B2 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
KR100738109B1 (ko) 입력 신호의 양자화 및 역양자화 방법과 장치, 입력신호의부호화 및 복호화 방법과 장치
US5701389A (en) Window switching based on interblock and intrablock frequency band energy
US5504832A (en) Reduction of phase information in coding of speech
JP2003523535A (ja) 複数のデータ圧縮フォーマット間でのオーディオ信号の変換方法及び装置
US7155384B2 (en) Speech coding and decoding apparatus and method with number of bits determination
JPH08204576A (ja) 信号符号化装置及び信号復号化装置
JPH01205200A (ja) 音声符号化方式
WO1999044291A1 (fr) Dispositif et procede de codage, dispositif et procede de decodage, support d'enregistrement de programme et de donnees
JP3348759B2 (ja) 変換符号化方法および変換復号化方法
WO1997016818A1 (en) Method and system for compressing a speech signal using waveform approximation
JPH05265487A (ja) 高能率符号化方法
JP4618823B2 (ja) 信号符号化装置及び方法