JP2878796B2 - 音声符号化器 - Google Patents

音声符号化器

Info

Publication number
JP2878796B2
JP2878796B2 JP2175642A JP17564290A JP2878796B2 JP 2878796 B2 JP2878796 B2 JP 2878796B2 JP 2175642 A JP2175642 A JP 2175642A JP 17564290 A JP17564290 A JP 17564290A JP 2878796 B2 JP2878796 B2 JP 2878796B2
Authority
JP
Japan
Prior art keywords
coefficient
output
thinning
pattern
selection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2175642A
Other languages
English (en)
Other versions
JPH0463400A (ja
Inventor
昌志 内藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kokusai Electric Corp
Original Assignee
Kokusai Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kokusai Electric Corp filed Critical Kokusai Electric Corp
Priority to JP2175642A priority Critical patent/JP2878796B2/ja
Priority to US07/721,986 priority patent/US5177799A/en
Publication of JPH0463400A publication Critical patent/JPH0463400A/ja
Application granted granted Critical
Publication of JP2878796B2 publication Critical patent/JP2878796B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】 (発明の属する技術分野) 本発明は、音声信号の符号化方式の一つである波形符
号化方式における音声符号化器に関するものであり、特
に、適応変換符号化(Adaptive Transform Coding、以
下ATCと略称する)方式における音声符号化器に関する
ものである。
(従来技術とその問題点) 第1図及び第2図はATC方式における従来の符号化
器、復号器の構成例を示すブロック図である。第1図に
おいて、20は音声符号化器、21は音声復号器である。
音声符号化器20において、はアナログ音声入力信
号、はバッファ1によりアナログ音声信号を所定の
ブロックに分割したブロック単位(以下フレーム単位と
いう。)の信号である。このフレーム単位の信号はDC
T(離散的余弦変換:Discrete Cosine Transform、以下D
CTと略称する)変換器2によってDCT変換されDCT係数
が得られる。このDCT係数は帯域平均スペクトルパワ
ー計算器4により8程度の周波数帯域に分割されて各帯
域の平均スペクトルパワーが計算される。これをスペク
トルパワー符号化器4によって符号化したものが信号
である。
一方、適応符号化器5はスペクトルパワー符号化器4
からの情報をもとにDCT係数を符号化による誤差が
少なくなるように適応符号化しDCT係数符号化情報を
得る。これらの符号化情報及びは多重化器(MUX)
6により多重合成され、ディジタルデータが出力され
る。
音声復号器21が受信したディジタルデータは多重分
離器(DMUX)7により多重分離されてDCT係数符号化情
報が出力され、復号器8によりスペクトルパワー復号
器9から得られるスペクトルパワー符号化情報を用い
て復号されDCT係数を得る。これを逆DCT変換器10によ
り逆DCT変換することによりフレーム単位の合成音声
が得られバッファ11を介して合成音声を復元する。
第2図は従来の他の構成例であり、22は音声符号化
器、23は音声復号器である。音声符号化器22において、
第1図と同様にして得たDCT係数をインタリープ回路1
2によりある規則に従って入替える(インタリーブす
る)ことにより係数列がランダムな雑音状になるように
変換してを得る。次に、コード探索符号化器13におい
て、種々の雑音系列をもつコードブック14からにもっ
ともよく近似するコードを探索しそのコード番号をディ
ジタルデータとして音声復号器23に対して送信する。
音声復号器23が受信したディジタルデータは、コー
ド復号器において、音声符号化器22のコードブック14と
同じコードをもつコードブック17から選択した同一コー
ドを出力する。次に、デ・インタリーブ回路16により
インタリーブ回路12と逆の処理を行い、量子化されたDC
T係数を復号する。このようにして復号されたDCT係数
に対し逆DCT変換器10により逆DCTを行ってバッファ11
を介して合成音声を出力する。
第1図,第2図に示した従来の構成では次のような欠
点がある。
第1図の構成の場合は、符号化速度16kbps程度では高
品質な音声を復元することができるが、8kbps以下の低
符号化速度では音質の劣化が著しいという欠点がある。
また、第2図の構成の場合は、符号化速度8kbps以下
でも良好な音質を復元することができるが、コードブッ
ク14,17に要するメモリ容量は5kByte以上必要であり、
全コードから最適コードを探索するため多くの処理時間
を要する。従って、ハードウェア化する場合に大規模な
回路構成となるなどの欠点がある。
(発明の目的) 本発明の目的は、前述の2方式の欠点を解決し、符号
化速度8kbps以下でも良好な音質を復元することがで
き、しかも、コードブックのような大容量のメモリ及び
多くの処理時間を必要としない音声符号化器を提供する
ことにある。
(発明の構成及び作用) 本発明の音声符号化器は、DCT変換器のDCT係数のうち
絶対値が大きく音質に与える影響の大きい係数を選択し
て符号化を行い、その他の選択されない係数には0を挿
入することにより、符号化速度8kbps以下のときでも音
質劣化の少ない間引き(選択)符号化をするように構成
したことを特徴とするものである。
また、間引き符号化を行う場合に3〜16程度の種類の
異なる多数の間引きパターン(フレーム当たりのベクト
ルパターン)をもたせて符号化による誤差が最小となる
パターンを選択して符号化することにより最適符号化を
行うように構成したことを特徴とする。
さらに詳しく述べると、本発明の音声符号化器は、ア
ナログ音声信号をブロック単位に離散的余弦変換器によ
って周波数領域へ直交変換し適応符号化を行う適応変換
符号化方式の音声符号化器において、前記離散的余弦変
換器からの離散的余弦変換係数が入力され、フレーム当
たりの係数を複数のエリアに分割した該エリア単位に係
数の絶対値の大きい方からそれぞれ相異なる所定の数の
係数が選択されたとき該フレーム当たりの係数の符号化
による情報量が同程度となるように予め定めたそれぞれ
のベクトルパターンに従った係数選択処理を行ってそれ
ぞれ出力する少なくとも3つの係数選択回路と、該少な
くとも3つの係数選択回路からの出力のいずれかを切替
出力する切替器と、前記少なくとも3つの係数選択回路
からの出力と前記離散的余弦変換器からの出力とをそれ
ぞれ比較し、誤差が最小となるベクトルパターンを出力
する係数選択回路の出力を選ぶように前記切替器を制御
する最適パターン選択回路と、前記切替器の出力を適応
変換符号化して出力する符号化器とを備えたことを特徴
とするものである。
以下図面により本発明を詳細に説明する。
第3図は本発明の音声符号化器の一実施例の回路構成
を示すブロック図である。第4図は第3図の実施例にお
ける間引き処理パターン(フレーム当たりのベクトルパ
ターン)の例を示す説明図である。本実施例では3種類
のパターンの場合について説明する。
図において、30は音声符号化器、31は音声復号器であ
る。バッファ1を介して所定のフレームに分割された入
力信号はDCT変換されDCT係数を出力する。このDCT
係数は係数選択回路32〜34に入力され3種類の間引き
処理(係数選択処理)が行われて最適パターン選択器35
と切替器38に入力される。ここでDCT係数と比較され
間引きによる誤差が最小となる選択パターンを1つ選び
その出力を得るために切替器38を切替え制御する。符
号化器36では切替器38からの出力を用いて符号化を行
い、係数の位置情報及び符号化情報をディジタルデータ
として復号器31に対して伝送する。
音声復号器31では、入力したディジタルデータから
復号器37によりDCT係数を復号するとともに伝送されな
かった係数には0を挿入することにより全DCT係数を
得る。そして逆DCT10により合成音声に逆変換しバッ
ファ11を介して復元音声を出力する。
第4図は第3図の係数選択回路32〜34におけるフレー
ム当たりのベクトルパターン(間引き処理のパターン)
の例を示す説明図である。図(a)〜(c)はいずれも
1フレームを96サンプルとし、DCT変換された96係数の
うち24係数を選択する場合の例を示すものである。図の
斜線の部分が選択されて符号化される係数を示す。ま
た、周波数の低い係数から順に1〜96までの全96係数を
各枠で示し、4係数を1つのエリアとし全96係数を24エ
リアとして間引き処理の単位とする。以下順に(a)〜
(c)について説明を行う。
(a)は係数選択回路(a)32の選択パターンであ
り、各エリア内の4係数から絶対値の大きい3係数を選
択し、周波数の低い方から8エリア、計24係数を選択す
る間引きパターンを示す。
(b)は係数選択回路(b)33の選択パターンであ
り、各エリアから絶対値の大きい2係数を選択し、周波
数の低い方から12エリア、計24係数を選択する間引きパ
ターンを示す。
(c)は係数選択回路(c)34の選択パターンであ
り、各エリアから絶対値の大きい1係数のみを選択し、
全24エリアから24係数を選択する間引きパターンを示
す。
各選択パターン(a)〜(c)は音声の特徴から次の
ように選別することに相当する。(a)は母音のように
エネルギーが低い周波数領域に集中する選択パターンで
あり、このパターンを符号化することを集中符号化と呼
ぶ。(c)は子音のようにエネルギーが広い周波数領域
に分散する選択パターンであり、このパターンを符号化
することを分散符号化と呼ぶ。(b)は両者の中間の場
合であり、中間符号化と呼ぶことができる。
また、この間引き処理では各エリア内の4つの係数の
うち絶対値の大きい方から選択されるため、符号化によ
る誤差を低減することができることが明らかである。従
って、最適パターン選択器35及び切替器38によって
(a)〜(c)のパターンのうち間引きによる誤差が最
小となるパターンが選択出力されるために符号化速度8k
bps以下でも良好な音質を復元することができる。
以上の実施例では、3種類のパターンすなわち3つの
係数選択回路32〜34を備えた構成について説明したが、
前述のように3〜16種類の場合についても同様であるこ
とはいうまでもない。
(発明の効果) 以上詳細に説明したように、本発明を実施することに
より、符号化速度8kbps以下でも音質劣化が少なく、し
かも、コードブックのような大容量メモリが不要であり
処理時間も少ない音声符号化器を実現することができる
ため、その効果は極めて大きい。
【図面の簡単な説明】
第1図,第2図は従来の構成例を示すブロック図、第3
図は本発明の一実施例を示すブロック図、第4図は第3
図の間引き処理のパターン示す説明図である。 1,11…バッファ、2…DCT変換器(DCT)、3…帯域平均
スペクトルパワー計算器、4…スペクトルパワー符号化
器、5…適応符号化器、6…多重化器、7…多重分離
器、8…復号器、9…スペクトルパワー復号器、10…逆
DCT変換器、12…インタリーブ回路、13…コード探索符
号化器、14,17…コードブック、15…コード復号器、16
…デ・インタリーブ回路、32〜34…係数選択回路、35…
最適パターン選択器、36…符号化器、37…復号器、38…
切替器、20,22,30…音声符号化器、21,23,31…音声復号
器。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】アナログ音声信号をブロック単位に離散的
    余弦変換器によって周波数領域に直交変換した変換係数
    を適応符号化する適応変換符号化方式の音声符号化器に
    おいて、 前記離散的余弦変換器から出力される変換係数を、予め
    定めた少なくとも3種類の間引きパターンによってフレ
    ーム単位にそれぞれ係数選択処理を行って選択パターン
    を出力する少なくとも3つの係数選択回路と、 該少なくとも3つの係数選択回路から出力される選択パ
    ターンのいずれかを切替え出力する切替器と、 前記少なくとも3つの係数選択回路から出力される選択
    パターンのそれぞれと前記離散的余弦変換器の出力とを
    比較し、間引きによる誤差が最小となる選択パターンを
    出力する係数選択回路の出力を選ぶように前記切替器を
    制御する最適パターン選択回路と、 前記切替器の出力を適応変換符号化して出力する符号化
    器とを備え、 前記少なくとも3種類の間引きパターンは、予め、前記
    離散的余弦変換器から得られるフレーム当たりの変換係
    数を周波数の低い方から順に間引き処理の単位とする複
    数のエリアに分割し、音素の種類による係数の分布の特
    徴に対応させて間引き対象とするエリアの位置及び数
    と、該エリア毎の係数の絶対値の大きい方からの選択数
    とを少なくとも3通りの間引きパターンとし、かつ、各
    間引きパターンによって選択した係数を符号化したとき
    の情報量が同程度になるように定められたことを特徴と
    する音声符号化器。
JP2175642A 1990-07-03 1990-07-03 音声符号化器 Expired - Fee Related JP2878796B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2175642A JP2878796B2 (ja) 1990-07-03 1990-07-03 音声符号化器
US07/721,986 US5177799A (en) 1990-07-03 1991-06-27 Speech encoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2175642A JP2878796B2 (ja) 1990-07-03 1990-07-03 音声符号化器

Publications (2)

Publication Number Publication Date
JPH0463400A JPH0463400A (ja) 1992-02-28
JP2878796B2 true JP2878796B2 (ja) 1999-04-05

Family

ID=15999658

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2175642A Expired - Fee Related JP2878796B2 (ja) 1990-07-03 1990-07-03 音声符号化器

Country Status (2)

Country Link
US (1) US5177799A (ja)
JP (1) JP2878796B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI96248C (fi) * 1993-05-06 1996-05-27 Nokia Mobile Phones Ltd Menetelmä pitkän aikavälin synteesisuodattimen toteuttamiseksi sekä synteesisuodatin puhekoodereihin
US5659659A (en) * 1993-07-26 1997-08-19 Alaris, Inc. Speech compressor using trellis encoding and linear prediction
FI98164C (fi) * 1994-01-24 1997-04-25 Nokia Mobile Phones Ltd Puhekooderin parametrien käsittely tietoliikennejärjestelmän vastaanottimessa
US5491774A (en) * 1994-04-19 1996-02-13 Comp General Corporation Handheld record and playback device with flash memory
US5602961A (en) * 1994-05-31 1997-02-11 Alaris, Inc. Method and apparatus for speech compression using multi-mode code excited linear predictive coding
US5787387A (en) * 1994-07-11 1998-07-28 Voxware, Inc. Harmonic adaptive speech coding method and system
JP3094390B2 (ja) * 1995-11-29 2000-10-03 三星電子株式会社 任意形態の物体の境界を含むブロックの変換符号化装置
US5832443A (en) * 1997-02-25 1998-11-03 Alaris, Inc. Method and apparatus for adaptive audio compression and decompression
KR101037931B1 (ko) * 2004-05-13 2011-05-30 삼성전자주식회사 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법
JP4548348B2 (ja) * 2006-01-18 2010-09-22 カシオ計算機株式会社 音声符号化装置及び音声符号化方法
US8276549B2 (en) * 2007-08-17 2012-10-02 GM Global Technology Operations LLC Flexible fuel variable boost supercharged engine

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4227176A (en) * 1978-04-27 1980-10-07 Dialog Systems, Inc. Continuous speech recognition method
JPS5936280A (ja) * 1982-08-25 1984-02-28 奥野製薬工業株式会社 表示装置の製造方法
US4991213A (en) * 1988-05-26 1991-02-05 Pacific Communication Sciences, Inc. Speech specific adaptive transform coder

Also Published As

Publication number Publication date
JPH0463400A (ja) 1992-02-28
US5177799A (en) 1993-01-05

Similar Documents

Publication Publication Date Title
EP0910900B1 (en) A method of coding and decoding audio signals
JP3430175B2 (ja) スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳
US7003448B1 (en) Method and device for error concealment in an encoded audio-signal and method and device for decoding an encoded audio signal
JP3071795B2 (ja) サブバンドコーディング方法および装置
EP0409248B1 (en) Signal encoding method and apparatus
JP3369422B2 (ja) データ復号化方法及びその装置
RU2423740C2 (ru) Устройство и способ окончательной обработки спектральных значений и кодирующее устройство и декодер для аудиосигналов
JP2878796B2 (ja) 音声符号化器
US5550542A (en) Variable length code look-up table having separate code length determination
JP2004264810A5 (ja)
US5541595A (en) Variable length code decoder for simultaneous decoding the most significant bits and the least significant bits of a variable length code
KR100968057B1 (ko) 부호화 방법 및 장치, 및 복호 방법 및 장치
KR940023044A (ko) 압축데이타 기록 및/또는 재생 혹은 전송 및/또는 수신장치
JP3255022B2 (ja) 適応変換符号化方式および適応変換復号方式
JP3472279B2 (ja) 音声符号化パラメータ符号化方法及び装置
JP2523286B2 (ja) 音声符号化及び復号化方法
JP2002091497A (ja) オーディオ信号符号化方法、復号化方法及びそれらの方法を実行するプログラム記憶媒体
US5715004A (en) Transformation coding apparatus
JP2004252068A (ja) デジタルオーディオ信号の符号化装置及び方法
JPH0816192A (ja) データ圧縮装置
JP3092124B2 (ja) 適応変換符号化の方法及び装置
JP4195598B2 (ja) 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム
JPH08316846A (ja) 画像符号化装置、画像復号化装置、画像符号化方法および画像復号化方法
JP2890522B2 (ja) 適応変換符号化の方法及び装置
JP2890523B2 (ja) 適応変換符号化の方法及び装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees