JP2002055699A - 音声符号化装置および音声符号化方法 - Google Patents
音声符号化装置および音声符号化方法Info
- Publication number
- JP2002055699A JP2002055699A JP2000243114A JP2000243114A JP2002055699A JP 2002055699 A JP2002055699 A JP 2002055699A JP 2000243114 A JP2000243114 A JP 2000243114A JP 2000243114 A JP2000243114 A JP 2000243114A JP 2002055699 A JP2002055699 A JP 2002055699A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- lsp
- speech
- input signal
- quantization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 59
- 238000013139 quantization Methods 0.000 claims abstract description 337
- 238000001228 spectrum Methods 0.000 claims abstract description 73
- 230000005236 sound signal Effects 0.000 claims description 93
- 238000012937 correction Methods 0.000 claims description 86
- 238000006243 chemical reaction Methods 0.000 claims description 73
- 230000015572 biosynthetic process Effects 0.000 claims description 67
- 238000003786 synthesis reaction Methods 0.000 claims description 67
- 238000012545 processing Methods 0.000 claims description 47
- 238000004458 analytical method Methods 0.000 claims description 43
- 230000008569 process Effects 0.000 claims description 29
- 238000001514 detection method Methods 0.000 claims description 14
- 238000010586 diagram Methods 0.000 description 58
- 230000000694 effects Effects 0.000 description 42
- 230000005540 biological transmission Effects 0.000 description 25
- 230000003595 spectral effect Effects 0.000 description 23
- 230000005284 excitation Effects 0.000 description 22
- 239000013598 vector Substances 0.000 description 20
- 230000003044 adaptive effect Effects 0.000 description 17
- 238000004364 calculation method Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 11
- 230000008859 change Effects 0.000 description 9
- 238000001914 filtration Methods 0.000 description 7
- 230000008054 signal transmission Effects 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 4
- 108010076504 Protein Sorting Signals Proteins 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 102100035373 Cyclin-D-binding Myb-like transcription factor 1 Human genes 0.000 description 2
- 101000804518 Homo sapiens Cyclin-D-binding Myb-like transcription factor 1 Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 101100219325 Phaseolus vulgaris BA13 gene Proteins 0.000 description 1
- 101001062854 Rattus norvegicus Fatty acid-binding protein 5 Proteins 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- DZRJLJPPUJADOO-UHFFFAOYSA-N chaetomin Natural products CN1C(=O)C2(Cc3cn(C)c4ccccc34)SSC1(CO)C(=O)N2C56CC78SSC(CO)(N(C)C7=O)C(=O)N8C5Nc9ccccc69 DZRJLJPPUJADOO-UHFFFAOYSA-N 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
Abstract
音声信号も良好に送信可能な音声符号化装置に置き換え
ただけでは、受信側の装置の音声復号装置が従来のまま
であるため、非音声信号を良好に受信することが困難で
あった。 【解決手段】 周波数パラメータ生成手段181によ
り、入力信号のLSP係数を生成し、入力信号が非音声
信号である場合、そのLSP係数を音声信号のLSP係
数に近づけて生成する。そして、同一のLSP量子化符
号帳7を参照して、そのLSP係数が量子化される。
Description
ディジタル有線通信または無線通信に使用され、所定の
アルゴリズムに基づいて音声信号を符号化する音声符号
化装置および音声符号化方法に関し、特にDTMF(Du
al Tone Multi-Frequency)信号、PB(Push Button)信
号などの音声周波数帯域の非音声信号をも伝送可能な音
声符号化装置および音声符号化方法に関するものであ
る。
が求められる。通信トラヒックのかなりの割合を占める
音声信号の高能率伝送を実現するために、近年、「ITU-
T Recommendation G.729 Coding of Speech at 8kbit/s
using Conjugate-Structure Algebraic-Code-Excited
Linear Prediction(CS-ACELP) 」(International Tele
communication Union 発行)に記載のITU-T勧告G.
729準拠の8kbit/sCS−ACELP(Conjug
ate-Structure Algebraic-Code-Excited LinearPredict
ion:共役構造代数的符号励振線形予測)音声符号化方
式に代表されるような音声符号化/復号方式を使用する
事例が増えつつある。
の伝送速度が8kbit/s程度である音声符号化方式
では、少ない情報量で高品質な音声を得るために、入力
信号を音声信号と仮定して、音声信号の特性を利用して
符号化後の情報を低減している。
方式を適用した第1の従来の音声符号化装置の構成例を
示すブロック図であり、図28は、図27のLSP量子
化部およびLSP量子化符号帳の構成例を示すブロック
図である。
ーリングやハイパスフィルタリングといった前処理を実
行する前処理部であり、202は線形予測に基づいて入
力信号から線形予測係数(LPC係数)を計算し、LP
C係数を線スペクトル対(LSP)係数に変換する線形
予測分析部であり、203はLSP量子化符号帳204
を参照してLSP係数に対応する量子化サンプルを選択
するLSP量子化部であり、204は符号帳インデック
スの付されたLSP係数の量子化サンプル(LSPサン
プル)を有するLSP量子化符号帳である。
して符号帳インデックスに対応するLSP係数を計算す
るLSP逆量子化部であり、206はLSP係数をLP
C係数に変換するLSP→LPC変換部であり、207
は上記LSP→LPC変換部206で生成されたLPC
係数を用いてフィルタ処理を実行して音声信号を合成す
る合成フィルタであり、208は減算器であり、209
は音声信号の周波数分布に応じて、量子化誤差によって
生ずる雑音成分のスペクトルを整形することにより耳障
り感を低減する聴覚重み付けフィルタであり、210は
合成フィルタ207により生成された合成音声信号と入
力音声信号とを比較し、聴覚重み付けフィルタ209に
より重み付けされた音声信号の誤差パワーを最小とする
符号語を選択し、出力する歪最小化部である。
140サンプル程度)成分を計算するために過去の励振
信号系列を記憶する適応符号帳であり、212は複数の
ランダムなパルス列を記憶する雑音符号帳であり、21
3は複数の利得パラメータを記憶する利得符号帳であ
り、214,215,216は乗算器であり、217は
雑音の振幅を調整する係数を乗算器215に供給する利
得予測器であり、218は加算器であり、219は選択
されたLSPサンプルの符号帳インデックスおよび歪最
小化部210により選択された符号化パラメータの符号
帳インデックスを多重化して出力する多重化部である。
タから学習により抽出された複数の所定の量子化LSP
係数を記憶する第1段LSP符号帳であり、302は微
調整用の複数の所定の量子化LSP係数を記憶する第2
段LSP符号帳であり、303は所定のセット数の複数
のMA(Moving Average)予測係数を記憶するMA予測
係数符号帳である。
あり、313は所定の数の過去の時点の加算器311の
出力と、いずれかのMA予測係数のセットとを乗算して
MA予測成分を計算するMA予測成分計算部であり、3
14は加算器であり、315は線形予測分析部202か
らのLSP係数から、LSP量子化符号帳204の各係
数より計算されたLSP係数を減算してLSP係数の量
子化誤差を計算する減算器であり、316は各次数のL
SP係数を用いて、減算器315の出力であるLSP係
数の量子化誤差信号に乗算する重み付け係数を計算する
量子化誤差重み付け係数計算部であり、317は量子化
誤差重み付け係数計算部316で計算された係数を用い
て重み付けされた量子化誤差信号のパワーを最小とする
量子化サンプルの組み合わせを上記符号帳301,30
2,303からそれぞれ探索し、選択された各サンプル
に対応する符号帳インデックスを出力する歪最小化部で
ある。
声信号は、前処理部201によりスケーリングなどの前
処理を施された後、線形予測分析部202および減算器
208に供給される。
て入力信号からLPC係数を計算し、LPC係数をLS
P係数に変換し、そのLSP係数をLSP量子化部20
3に供給する。
帳204を参照してLSP係数に対応するLSPサンプ
ルを選択し、その符号帳インデックスを出力する。この
とき、図28に示すように、LSP量子化符号帳204
の第1段LSP符号帳301からの係数と第2段LSP
符号帳302からの係数とがLSP量子化部203の加
算器311により加算され、その演算結果が乗算器31
2およびMA予測成分計算部313に供給される。ま
た、LSP量子化符号帳204のMA予測係数符号帳3
03からMA予測係数が乗算器312およびMA予測成
分計算部313に供給される。そして、乗算器312
は、そのMA予測係数を、加算器311の出力に乗算
し、乗算後の値を加算器314に供給する。MA予測成
分計算部313は、過去の所定の時点分の加算器311
の出力およびMA予測係数を記憶し、各時点についての
加算器311の出力およびMA予測係数の積の総和を計
算し、加算器314に供給する。加算器314は、それ
らの値の和を計算し、減算器315に供給する。減算器
315は、線形予測分析部202より供給されたLSP
係数から加算器314の出力(すなわち、LSP量子化
符号帳204より得られたLSP係数)を減算して、そ
のLSP係数の量子化誤差信号を歪最小化部317に供
給する。歪最小化部317は、そのLSP係数の量子化
誤差信号に対して、量子化誤差重み付け係数計算部31
6からの重み付け係数を乗算し、自乗和を計算する。そ
して、その計算結果を最小とするLSP係数を上記符号
帳301,302,303からそれぞれ探索し、選択さ
れた各LSP係数に対応する符号帳インデックスを出力
する。なお、この動作については、例えば「CS−AC
ELPのLSP係数とゲインの量子化法」(片岡ら著、
NTT R&D、Vol.45、No.4、1996、
第331頁〜第336頁)に記載されている。これによ
り、音声信号のスペクトル包絡情報が効率よく量子化さ
れる。
り選択されたLSP符号帳インデックスは、多重化部2
19に供給されるとともに、LSP逆量子化部205に
供給される。
号帳インデックスに基づいてLSP量子化符号帳204
を参照してLSP係数を生成し、LSP→LPC変換部
206に供給する。LSP→LPC変換部206は、そ
のLSP係数をLPC係数に変換し、合成フィルタ20
7に供給する。
ベクトルの長周期成分(ピッチ周期励振ベクトル)が蓄
積されており、また、雑音符号帳212には、複数の励
振ベクトルの雑音成分が蓄積されている。これらの各符
号帳から、各々1ベクトルが任意に出力され、これらの
2つのベクトル(長周期成分と雑音成分)が加算器21
8により加算され、その演算結果である励振ベクトルが
合成フィルタ207に供給される。
ベクトルに対して、LSP→LPC変換部206からの
LPC係数に基づくフィルタ特性でフィルタ処理を実行
して音声信号を生成し、減算器208に供給する。
からその合成された音声信号を減算し、両者の誤差を聴
覚重み付けフィルタ209に供給する。聴覚重み付けフ
ィルタ209は、入力音声信号のスペクトル包絡に応じ
て適応的にフィルタ係数を調整して、音声信号の誤差に
対してフィルタ処理を実行し、フィルタ処理後の誤差を
歪最小化部210に供給する。
ら出力される励振ベクトルの長周期成分、雑音符号帳2
12から出力される励振ベクトルの雑音成分、および利
得符号帳213から出力される利得パラメータを繰り返
し選択していき、それらから上述のように合成音声信号
と入力音声信号との誤差を計算し、その誤差パワーを最
小とする適応符号帳、雑音符号帳および利得符号帳の各
符号帳インデックスを多重化部219に供給する。
ルの符号帳インデックスと、これらの適応符号帳、雑音
符号帳および利得符号帳の各符号帳インデックスを多重
化して、伝送路に送出する。
は、CELP方式に従って、各符号帳211,212,
213に蓄えられた符号化パラメータに基づいて人間の
声帯音源に相当する時系列信号を生成し、その信号で、
人間の声道情報をモデル化した合成フィルタ207(音
声のスペクトル包絡に対応する線形フィルタ)を駆動し
て音声信号が再生され、最適な符号化パラメータが選択
されている。なお、各部の動作の詳細については、例え
ば「CS−ACELPの基本アルゴリズム」(片岡ら
著、NTT R&D、Vol.45、No.4、199
6年、第325頁〜第330頁)に記載されている。
符号化する従来の音声符号化装置では、音声信号のスペ
クトル包絡情報を効率よく表現する手法として、LSP
(線スペクトル対)が使用されることが多く、CS−A
CELP方式においても音声スペクトル包絡情報を伝送
するために周波数パラメータとしてLSP係数が使用さ
れる。このLSPの詳細については、例えば「線スペク
トル対(LSP)音声分析合成方式による音声情報圧
縮」(菅村、板倉著、電子通信学会論文誌、81/08
Vol.J64−A、No.8、第599頁〜第60
6頁)に記載されている。
は、MA予測係数を使用してLSP符号帳による係数の
移動平均予測を計算することにより、周波数特性の変化
の少ない信号、すなわちフレーム間で相関性の強い信号
のLSP係数を良好に量子化し、また、学習による第1
段のLSP符号帳、乱数による第2段のLSP符号帳を
併用することにより、数学的な厳密性には欠けるもの
の、音声信号のスペクトル包絡の概形が効率よく表現さ
れる。さらに、乱数による第2段の符号帳を使用するこ
とにより、スペクトル包絡の微妙な変化にも柔軟に追随
することができる。したがって、上記従来の音声符号化
装置により、音声信号のスペクトル包絡情報の特徴を効
率よく符号化することができる。
化アルゴリズムに、音声に特化したものを使用すると、
音声周波数帯域における音声信号以外の信号(例えばプ
ッシュボタン式の電話機から発せられるデュアルトーン
で構成されたDTMF信号、No.5シグナリング、モ
デム信号など)の伝送特性は低下する傾向にある。
は、(1)スペクトル包絡が音声信号とは明らかに異な
る、(2)信号継続時間内ではスペクトル特性、利得と
もに変化量は極めて小さく、信号継続時とポーズ時とで
スペクトル特性が急激に変化する、(3)LSP係数の
量子化歪がそのままDTMF信号の周波数歪に反映され
るため、LSP量子化歪をできるだけ小さくしたい、な
どの特徴がある。
声信号、特にDTMF信号を、上記従来の音声符号化装
置で良好に符号化することが困難である。特に伝送速度
が低く符号化のための冗長性が少ないという条件の下で
は、音声信号と同じ手法を用いるのは適当とは言えな
い。
信における呼接続などのために、シグナリング伝送のた
めの信号線を別途設けることをせず、DTMF信号など
を用いて、インチャネルでシグナリング伝送を行なうこ
とが多い。この場合、割当てられた伝送路が、上記の高
能率音声符号化を用いた伝送路であれば、DTMF信号
の伝送特性は悪化するため、呼接続が正常にできなくな
るケースが高い頻度で発生するといった弊害がある。
して、例えば特開平9−81199号公報に記載の第2
の従来の音声符号化装置が提案されている。図29は、
第2の従来の音声符号化装置を示すブロック図である。
図29において、501は従来の音声符号化装置であ
り、502は音声符号化装置501により生成された符
号を復号する音声復号装置である。
音声信号を符号化する符号器であり、512は入力され
た音声帯域信号からDTMF信号を検出するDTMF検
出器であり、513は各DTMF信号に対応する符号化
パターンを予め記憶するDTMF符号化パターンメモリ
であり、514は切替スイッチである。
送路を介して受信した符号のうち音声信号に対する符号
を復号して音声信号を出力する復号器であり、522は
DTMF符号化パターンメモリ523を参照して伝送路
を介して受信した符号からDTMF信号の符号化パター
ンを検出するDTMF符号化パターン検出器であり、5
23は各DTMF信号に対応する符号化パターンを予め
記憶するDTMF符号化パターンメモリであり、524
は検出された符号化パターンに対応するDTMF信号を
生成するDTMF生成器であり、525は切替スイッチ
である。
置501では、符号器511は、入力信号を音声信号と
して符号化し、切替スイッチ514に供給する。また、
DTMF検出器512は、入力信号からDTMF信号を
検出すると、検出したDTMF信号の種類をDTMFパ
ターンメモリ513に供給するとともに、DTMF符号
化パターンメモリ513からの出力を選択させる制御信
号を切替スイッチ514に供給する。
DTMF検出器512より、検出されたDTMF信号の
種類を供給されると、その種類のDTMF信号に対応す
る符号を切替スイッチ514に供給する。
出された場合には、DTMF検出器512からの制御信
号に従って、DTMF符号化パターンメモリ513から
の符号を選択して伝送路へ送出し、そうでない場合に
は、符号器511からの符号を選択して伝送路へ送出す
る。
受信されると、復号器521およびDTMF符号化パタ
ーン検出器522に供給される。復号器521は、その
符号を音声信号に復号し、その音声信号を切替スイッチ
525に供給する。一方、DTMF符号化パターン検出
器522は、その符号がDTMF信号の符号であるか否
かを、DTMF符号化パターンメモリ523に記憶され
た各DTMF信号に対応する符号と比較して判断し、受
信された符号がDTMF信号の符号である場合には、D
TMF生成器524にそのDTMF信号の種類を供給す
るとともに、DTMF生成器524からの信号を選択さ
せる制御信号を切替スイッチ525に供給する。
号が検出された場合には、DTMF符号化パターン検出
器522からの制御信号に従って、DTMF生成器52
4からのDTMF信号を選択して出力し、そうでない場
合には、復号器521からの音声信号を選択して出力す
る。
では、入力された音声帯域信号からDTMF信号を検出
し、DTMF信号が検出された場合には、予め記憶され
たそのDTMF信号に対応する符号を出力し、DTMF
信号が検出されない場合には、符号器511により符号
化された符号が出力される。
て、本出願人は、先に、特開平11−259099号公
報に記載の音声符号化装置を提案した。図30は、先に
提案した音声符号化装置を示すブロック図であり、図3
1は、図30に示す音声符号化装置により生成された符
号を復号する音声復号装置である。
て符号化処理を実行する符号化処理機能ブロック611
と、非音声信号に対して符号化処理を実行する符号化処
理機能ブロック612とを有する符号器であり、602
は入力信号が音声信号であるか、非音声信号であるかを
判定し、その判定結果を出力する音声/非音声信号識別
器であり、603,604は切替スイッチであり、60
5は、音声/非音声信号識別器602からの判定結果
と、符号器601からの符号語とを多重化して伝送路に
送出する多重化部である。
により多重化された音声/非音声信号識別器602の判
定結果と、符号器601の出力符号語とを分離する多重
分離部であり、652は、音声信号の符号語を復号処理
する復号処理機能ブロック661と、非音声信号の符号
語を復号処理する復号処理機能ブロック662とを有す
る復号器であり、653,654は切替スイッチであ
る。
音声符号化装置において、音声/非音声信号識別器60
2は、入力信号が音声信号であるか、非音声信号である
かを常に監視し、その判定結果に基づいて符号器601
の動作モードを決定する。音声/非音声信号識別器60
2は、入力信号が音声信号であると判定した場合、切替
スイッチ603,604を制御して、音声信号用の符号
化処理機能ブロック611により入力信号が符号化され
るようにし、入力信号が非音声信号であると判定した場
合、切替スイッチ603,604を制御して、非音声信
号用の符号化処理機能ブロック612により入力信号が
符号化されるようにする。
号用の符号化処理機能ブロック611または非音声信号
用の符号化処理機能ブロック612により生成された符
号語と、音声/非音声信号識別器602の判定結果とを
多重化して伝送路に送出する。
て、多重分離部651は、伝送路を介して受信した信号
列から、符号器601により生成された符号語と、音声
/非音声信号識別器602の判定結果とを分離し、その
判定結果を切替スイッチ653,654に供給し、その
符号を復号器652に供給する。
ものである場合、切替スイッチ653,654により音
声信号用の復号処理機能ブロック661が選択され、受
信された符号語が音声信号用の復号処理機能ブロック6
61により復号される。一方、その判定結果が、非音声
信号である旨を示すものである場合、切替スイッチ65
3,654により非音声信号用の復号処理機能ブロック
662が選択され、受信された符号語が非音声信号用の
復号処理機能ブロック662により復号される。そし
て、復号された音声信号または非音声信号が復号器65
2から出力される。
えず、かつ音声品質を極力劣化させずに音声信号および
非音声信号を同一伝送路を介して伝送することができ
る。
置を設け、受信側に音声復号装置を設けた企業内通信シ
ステムなどにおいては、金銭面や企業内の運営などの諸
事情により送信側の装置と受信側の装置を同時に新しい
ものに置き換えることが困難な場合がある。
されているので、例えばITU-T勧告G.729に準拠
したCS-ACELP方式に基づく音声コーデックを搭
載した企業内通信システム(例えばマルチメディアを多
重化した通信システム)が構築されている場合におい
て、DTMF信号のインチャネル伝送の実現を目的とし
て、送信側の装置内における音声符号化装置を上述した
ような非音声信号も良好に送信可能な音声符号化装置に
置き換えただけでは、受信側の装置の音声復号装置が従
来のままであるため、非音声信号を良好に受信すること
が困難であるなどの課題があった。
めになされたもので、入力信号の周波数スペクトルの特
徴を示す周波数パラメータを生成し、入力信号が非音声
信号である場合、周波数パラメータを音声信号の周波数
パラメータに近づけて生成し、同一の量子化符号帳を参
照して、音声信号または非音声信号である入力信号の周
波数パラメータに対応する符号語を選択するようにし
て、受信側の音声復号装置を変更することなく、DTM
F信号などの非音声信号をインチャネルで良好に伝送す
ることができる音声符号化装置および音声符号化方法を
得ることを目的とする。
クトルの特徴を示す周波数パラメータを生成し、入力信
号が音声信号である場合、所定の量子化符号帳を参照し
て入力信号の周波数パラメータに対応する符号語を選択
し、入力信号が非音声信号である場合、量子化符号帳の
有する符号語のサブセットを参照して入力信号の周波数
パラメータに対応する符号語を選択するようにして、入
力信号の周波数パラメータに対応する符号語を選択する
ようにして、受信側の音声復号装置を変更することな
く、DTMF信号などの非音声信号をインチャネルで良
好に伝送することができる音声符号化装置および音声符
号化方法を得ることを目的とする。
化装置は、入力信号の周波数スペクトルの特徴を示す周
波数パラメータを生成し、入力信号が非音声信号である
場合、その周波数パラメータを補正する周波数パラメー
タ生成手段と、所定の数の周波数パラメータの符号語を
記憶する量子化符号帳と、同一の量子化符号帳を参照し
て、音声信号または非音声信号である入力信号の周波数
パラメータに対応する符号語を選択する量子化手段とを
備えるものである。
パラメータを、線スペクトル対係数としたものである。
号が非音声信号である場合、周波数パラメータ生成手段
が、入力信号の周波数パラメータと白色雑音の周波数パ
ラメータとの間を補間して、補間した周波数パラメータ
へ、入力信号の周波数パラメータを補正するようにした
ものである。
号が非音声信号である場合、周波数パラメータ生成手段
が、入力信号から線形予測係数を計算し、線形予測係数
に対して帯域幅拡張処理を実行し、帯域幅拡張処理を実
行した線形予測係数から周波数パラメータとして線スペ
クトル対係数を生成するようにしたものである。
号が非音声信号である場合、周波数パラメータ生成手段
が入力信号に白色雑音を重畳するようにしたものであ
る。
符号帳を参照して、入力信号が音声信号である場合に、
音声信号の周波数スペクトルの特性に基づいて入力信号
の符号語を選択する第1の量子化部と、同一の量子化符
号帳を参照して、入力信号が非音声信号である場合に、
非音声信号の周波数スペクトルの特性に基づいて入力信
号の符号語を選択する第2の量子化部とを量子化手段に
有するものである。
号から非音声信号を検出する非音声信号検出器を備え、
入力信号が非音声信号である場合、周波数パラメータ生
成手段が、非音声信号検出器により検出された非音声信
号の種類に応じて入力信号の周波数パラメータを生成す
るようにしたものである。
号が非音声信号である場合、周波数パラメータ生成手段
が、異なる補間特性で複数の周波数パラメータを生成
し、量子化手段が、複数の周波数パラメータにそれぞれ
対応する複数の符号語を選択し、選択手段が、量子化手
段により選択された複数の符号語のうち量子化歪が最小
である符号語を入力信号の符号語として選択するように
したものである。
号が非音声信号である場合、周波数パラメータ生成手段
が、異なる特性で帯域幅拡張処理を実行して複数の周波
数パラメータを生成し、量子化手段が、複数の周波数パ
ラメータにそれぞれ対応する複数の符号語を選択し、選
択手段が、量子化手段により選択された複数の符号語の
うち量子化歪が最小である符号語を入力信号の符号語と
して選択するようにしたものである。
号が非音声信号である場合、周波数パラメータ生成手段
が、異なるレベルの白色雑音を重畳して複数の周波数パ
ラメータを生成し、量子化手段が、複数の周波数パラメ
ータにそれぞれ対応する複数の符号語を選択し、選択手
段が、量子化手段により選択された複数の符号語のうち
量子化歪が最小である符号語を入力信号の符号語として
選択するようにしたものである。
号が非音声信号である場合、周波数パラメータ生成手段
が、補正処理、帯域幅拡張処理および白色雑音重畳処理
のいずれかを実行して複数の周波数パラメータを生成
し、量子化手段が、複数の周波数パラメータにそれぞれ
対応する複数の符号語を選択し、選択手段が、量子化手
段により選択された複数の符号語のうち量子化歪が最小
である符号語を入力信号の符号語として選択するように
したものである。
号の周波数スペクトルの特徴を示す周波数パラメータを
生成し、入力信号が非音声信号である場合、周波数パラ
メータを音声信号の周波数パラメータに近づけて生成す
るステップと、同一の量子化符号帳を参照して、音声信
号または非音声信号である入力信号の周波数パラメータ
に対応する符号語を選択するステップとを備えるもので
ある。
号の周波数スペクトルの特徴を示す周波数パラメータを
生成する周波数パラメータ生成手段と、所定の数の周波
数パラメータの符号語を記憶する量子化符号帳と、入力
信号が音声信号である場合、量子化符号帳を参照して入
力信号の周波数パラメータに対応する符号語を選択し、
入力信号が非音声信号である場合、量子化符号帳の有す
る符号語のサブセットを参照して入力信号の周波数パラ
メータに対応する符号語を選択する量子化手段とを備え
るものである。
パラメータを線スペクトル対係数としたものである。
のサブセットを、量子化符号帳の有する符号語のうち、
非音声信号の周波数パラメータを量子化する際の量子化
歪の少ない符号語で構成したものである。
号が非音声信号である場合、その非音声信号の量子化歪
に基づいて、符号語のサブセットを適応的に選択する符
号語選択手段を備えるようにしたものである。
号から非音声信号を検出する非音声信号検出器を備え、
量子化手段が、量子化符号帳の有する符号語の複数のサ
ブセットのうち、非音声信号検出器により検出された非
音声信号の種類に応じたサブセットを参照して入力信号
が非音声信号である場合の周波数パラメータに対応する
符号語を選択するようにしたものである。
符号帳の有する符号語の複数のサブセットのそれぞれ
を、1つまたは複数の種類の非音声信号の周波数パラメ
ータを量子化する際の量子化歪の少ない符号語で構成し
たものである。
号の周波数パラメータと白色雑音の周波数パラメータと
の間を補間して周波数パラメータを生成する第2の周波
数パラメータ生成手段を備え、符号語選択手段が、第2
の周波数パラメータ生成手段により生成された周波数パ
ラメータを量子化して、そのときの量子化歪に基づいて
サブセットの符号語を選択するようにしたものである。
号から線形予測係数を計算し、線形予測係数に対して帯
域幅拡張処理を実行し、帯域幅拡張処理後の線形予測係
数から周波数パラメータとして線スペクトル対係数を生
成する第2の周波数パラメータ生成手段を備え、符号語
選択手段が、第2の周波数パラメータ生成手段により生
成された周波数パラメータを量子化して、そのときの量
子化歪に基づいてサブセットの符号語を選択するように
したものである。
号に白色雑音を重畳し、白色雑音を重畳した入力信号か
ら周波数パラメータを生成する第2の周波数パラメータ
生成手段を備え、符号語選択手段が、第2の周波数パラ
メータ生成手段により生成された周波数パラメータを量
子化して、そのときの量子化歪に基づいてサブセットの
符号語を選択するようにしたものである。
号から線形予測係数を計算する線形予測分析部と、線形
予測係数を周波数パラメータとしての線スペクトル対係
数に変換するLPC→LSP変換部とを周波数パラメー
タ生成手段に有し、また、入力信号が非音声信号である
場合、入力信号に対して線形予測係数に基づくフィルタ
特性で逆合成フィルタ処理を実行する逆合成フィルタ
と、入力信号が非音声信号である場合、符号語のサブセ
ットのうちのいずれかの符号語を逆量子化して線スペク
トル対係数を生成するLSP逆量子化部と、LSP逆量
子化部により生成された線スペクトル対係数を線形予測
係数に変換するLSP→LPC変換部と、逆合成フィル
タにより生成された信号に対して、LSP→LPC変換
部により変換された線形予測係数に基づくフィルタ特性
で合成フィルタ処理を実行する合成フィルタと、入力信
号が非音声信号である場合、合成フィルタにより合成さ
れた音声信号と入力信号との誤差に基づいて量子化歪が
最小な符号語を選択する歪最小化部とを量子化手段に有
するものである。
号から線形予測係数を計算する線形予測分析部と、線形
予測係数を周波数パラメータとしての線スペクトル対係
数に変換するLPC→LSP変換部とを周波数パラメー
タ生成手段に有し、また、入力信号が非音声信号である
場合、入力信号に対して線形予測係数に基づくフィルタ
特性で逆合成フィルタ処理を実行する逆合成フィルタ
と、入力信号が非音声信号である場合、符号語のサブセ
ットのうちのいずれかの符号語を逆量子化して線スペク
トル対係数を生成するLSP逆量子化部と、LSP逆量
子化部により生成された線スペクトル対係数を線形予測
係数に変換するLSP→LPC変換部と、逆合成フィル
タにより生成された信号に対して、LSP→LPC変換
部により変換された線形予測係数に基づくフィルタ特性
で合成フィルタ処理を実行する合成フィルタと、入力信
号から非音声信号を検出する第1の非音声信号検出手段
と、合成フィルタにより合成された音声信号から非音声
信号を検出する第2の非音声信号検出手段と、第1の非
音声信号検出手段により検出された非音声信号の種類と
第2の非音声信号検出手段により検出された非音声信号
の種類とが同一である符号語を選択する比較部とを量子
化手段に有するようにしたものである。
手段により選択された符号語から復号した信号と入力信
号とを比較して、量子化手段に最適な符号語を閉ループ
探索法に基づいて選択させる最適化手段を備えるように
したものである。
号の周波数スペクトルの特徴を示す周波数パラメータを
生成するステップと、入力信号が音声信号である場合、
所定の量子化符号帳を参照して入力信号の周波数パラメ
ータに対応する符号語を選択し、入力信号が非音声信号
である場合、量子化符号帳の有する符号語のサブセット
を参照して入力信号の周波数パラメータに対応する符号
語を選択するステップとを備えるものである。
説明する。 実施の形態1.図1はこの発明の実施の形態1による音
声符号化装置の構成を示すブロック図である。図におい
て、1は線形予測に基づいて入力信号からLPC係数を
計算する線形予測分析部であり、2はLPC係数を線ス
ペクトル対(LSP)係数に変換するLPC→LSP変
換部であり、3は入力信号のLSP係数の分布を白色雑
音のLSP係数の分布に基づいて音声信号のLSP係数
の分布に近づける補正をするLSP係数補正部であり、
4は切替スイッチであり、5は入力信号が音声信号であ
るか非音声信号であるかを識別する音声/非音声信号識
別器であり、6はLSP量子化符号帳7を参照してLS
P係数を量子化するLSP量子化部(量子化手段)であ
り、7は量子化されたLSP係数(LSPサンプル)と
符号帳インデックスとを関連づけて記憶するLSP量子
化符号帳(量子化符号帳)であり、8はLSP量子化符
号帳7を参照して符号帳インデックスをLSP係数に変
換するLSP逆量子化部であり、9はLSP係数をLP
C係数に変換するLSP→LPC変換部であり、10は
LPC係数に基づいて線形予測演算を実行する合成フィ
ルタである。
40サンプル程度)成分を計算するために過去の励振信
号系列を記憶する適応符号帳であり、12は複数のラン
ダムなパルス列を記憶する雑音符号帳であり、13は加
算器であり、14は乗算器であり、15は複数の利得パ
ラメータを記憶する利得符号帳である。
波数分布に応じて、量子化誤差に起因する雑音成分のス
ペクトルを整形することにより耳障り感を低減する聴覚
重み付けフィルタであり、18は聴覚重み付けフィルタ
17により出力された、入力信号と合成音声信号との誤
差パワーを最小とする各符号帳11,12,15の符号
化パラメータを選択し、それに対応する符号帳インデッ
クスを出力する歪最小化部であり、19は選択されたL
SPサンプルの符号帳インデックス(LSP符号帳イン
デックス)および歪最小化部18により選択された符号
化パラメータの各符号帳インデックスを多重化して出力
する多重化部である。
(周波数パラメータ)を生成する周波数パラメータ生成
手段である。
部1は線形予測に基づいて入力信号から例えば10次の
LPC係数を計算し、LPC→LSP変換部2はそのL
PC係数をLSP係数に変換し、そのLSP係数を切替
スイッチ4およびLSP係数補正部3に供給する。
よって得られたLSP係数の分布がLSP量子化符号帳
7の予め有するLSP係数のサンプルに極力近づくよう
にそのLSP係数を補正し、補正後のLSP係数を切替
スイッチ4に供給する。
信号が音声信号であるか、DTMF信号などの非音声信
号であるかを判定し、その判定結果に基づいて切替スイ
ッチ4を制御して、入力信号が音声信号である場合に
は、LPC→LSP変換部2からのLSP係数をLSP
量子化部6に供給させ、入力信号が非音声信号である場
合には、LSP係数補正部3からの補正後のLSP係数
をLSP量子化部6に供給させる。すなわち、結果的
に、入力信号としてDTMF信号などの非音声信号が入
力された場合のみ、LSP係数の補正が実行される。
7を参照して、入力音声信号の分析によって得られたL
SP係数との誤差パワー(最小自乗誤差)を最も小さく
するLSP係数を選択し、それに対応する符号帳インデ
ックス(LSP符号帳インデックス)を多重化部19お
よびLSP逆量子化部8に供給する。
インデックスに対応するLSP係数を計算し、LSP→
LPC変換部9に供給する。LSP→LPC変換部9
は、そのLSP係数をLPC係数に変換し、合成フィル
タ10に供給する。
クトルの長周期成分(ピッチ周期励振ベクトル)が蓄積
されており、また、雑音符号帳12には、複数の励振ベ
クトルの雑音成分が蓄積されている。これらの各符号帳
から、各々1ベクトルが任意に出力され、これらの2つ
のベクトル(長周期成分と雑音成分)が加算器13によ
り加算され、その演算結果が励振ベクトルとして乗算器
14に供給される。そして乗算器14により利得符号帳
15からの利得パラメータに基づいてその大きさが設定
される。このようにして励振ベクトルが生成され、合成
フィルタ10に供給される。
クトルに対して、LSP→LPC変換部9からのLPC
係数に基づくフィルタ特性でフィルタ処理を実行して音
声信号を合成し、減算器16に供給する。
信号を減算し、両者の誤差を聴覚重み付けフィルタ17
に供給する。聴覚重み付けフィルタ17は、入力信号の
スペクトル包絡に応じて適応的にフィルタ係数を調整し
て、音声信号の誤差に対してフィルタ処理を実行し、フ
ィルタ処理後の誤差を歪最小化部18に供給する。
力される励振ベクトルの長周期成分、雑音符号帳12か
ら出力される励振ベクトルの雑音成分、および利得符号
帳15から出力される利得パラメータを繰り返し選択し
ていき、それらから上述のように合成音声信号と入力音
声信号との誤差を計算し、その誤差パワーを最小とする
適応符号帳、雑音符号帳および利得符号帳の符号帳イン
デックス(適応符号帳インデックス、雑音符号帳インデ
ックスおよび利得符号帳インデックス)を多重化部19
に供給する。
逆量子化部8〜歪最小化部18の部位によりA−b−S
(Analysis by Synthesis)法に基づく音声符号化処理が
実行されて、復号時に使用される最適な符号化パラメー
タ(励振ベクトルの長周期成分、雑音成分および利得パ
ラメータ)が選択され、それに対応する符号帳インデッ
クスがLSP符号帳インデックスとともに出力される。
なお、この部位は、一例としてCS−ACELP方式
(ITU−T勧告G.729準拠)に従った動作をして
おり、音声の発生機構がモデル化されているとともに、
各符号帳についても、大量の音声信号をもとに学習によ
って求められたものが使用されているので、音声信号を
高能率に符号化することが可能である。
6からのLSP符号帳インデックスと、これらの適応符
号帳インデックス、雑音符号帳インデックスおよび利得
符号帳インデックスを多重化して伝送路に送出する。
の符号化が実行される。なお、この実施の形態1におい
ては、音声信号のLSP係数に対しても、非音声信号の
補正後のLSP係数に対しても同一のLSP量子化符号
帳7を参照して量子化が実行され、共通の符号帳インデ
ックスが送出されるため、受信側で、音声/非音声信号
識別器5の判定結果を特に必要としない。したがって、
音声/非音声信号識別器5の判定結果を多重化せず、多
重化部19から送出されるビットシーケンス(フレーム
フォーマット)を従来の音声符号化装置によるものと同
一のものとすることができる。したがって、音声信号用
の従来の音声復号装置により、この実施の形態1による
音声符号化装置から出力された符号を復号することがで
きる。
数の補正について詳細に説明する。図2はDTMF信号
の周波数スペクトルの一例を示す図であり、図3はDT
MF信号のLSP係数と補正後のLSP係数との関係を
示す図である。
12「PBX−TDM間ディジタルインタフェース(個
別線信号方式)−PBX−PBX間信号規定」に定めら
れている受信規格の通り、図2の各トーン信号のピーク
周波数と、各トーン信号のパワーのみで規定されてい
る。
うに、トーン信号のスペクトルのピーク周波数がずれた
場合、その周波数のずれが少量でも、受信側(復号器
側)でDTMF信号が検出されなくなる怖れがある。一
方、図2に示すスペクトルBのように、トーン信号のス
ペクトルの尖鋭度が鈍った場合や、トーン信号が白色雑
音成分に埋もれた場合については、比較的許容される。
を利用して、既存の、音声に特化されたLSP量子化符
号帳7を使用することを前提として、スペクトル概形の
劣化(尖鋭度の鈍りや白色雑音成分の重畳)をある程度
許容しつつ、ピーク周波数を可能な限り保存して、非音
声信号のLSP係数の量子化に起因する周波数歪を抑制
する。
ように、DTMF信号を線形予測分析して得られた各L
SP係数(図3の下段)と白色雑音を線形予測分析して
得られた各LSP係数(図3の上段)とを線形補間して
(すなわち、白色雑音のLSP係数とDTMF信号のL
SP係数との重み付け平均を計算して)、補正後の各L
SP係数を計算する。
クトルは平坦であるので、そのLSP係数の分布は均一
となっており、LSP係数補正部3に予め格納されてい
る。
スペクトルの尖鋭度は鈍るもののピーク周波数は保存さ
れ、DTMF信号のLSP係数の分布が音声信号のもの
に近づくため、音声信号に特化された既存のLSP量子
化符号帳7でも良好にDTMF信号のLSP係数が量子
化される。
て補正処理を最適化することにより、DTMF信号のL
SP係数に対する量子化歪がより低減される。
り、量子化に起因するピーク周波数のずれを抑制しつ
つ、非音声信号のLSP係数が補正される。なお、ここ
では、非音声信号としてDTMF信号を取り上げたが他
の非音声信号についても同様である。
ついて詳細に説明する。DTMF信号は2つのトーン信
号で構成されており、各トーン信号のピーク周波数は、
上述の規定により特定の値に固定されているので、例え
ば、高速フーリエ変換などで入力信号の周波数スペクト
ルを計算したり、バンドパスフィルタを使用してその特
定の周波数成分を濾波したりして特定周波数におけるピ
ークレベルなどの周波数成分の特徴量を抽出し、DTM
F信号の有する特徴量と一致するか否かに基づいて、入
力信号が音声信号であるか、非音声信号であるかが判定
される。
送出レベルおよびその変動範囲が、上記TTC勧告JJ
−20.12に定められた送信規格により特定の範囲に
限定されているため、レベル変動が比較的大きく、ダイ
ナミックレンジの広い音声信号とは明らかに異なる特徴
を示す。そこで、入力信号のレベルの変化をDTMF信
号の識別のための補助情報として使用することにより、
DTMF信号の検出精度を向上させるようにしてもよ
い。
5により、入力信号が音声信号であるか、非音声信号で
あるかが判定される。なお、ここでは、非音声信号とし
てDTMF信号を取り上げたが他の非音声信号について
も同様である。また、ここで掲げた音声/非音声信号識
別器5は一例であり、他の方法で音声信号と非音声信号
とを識別することももちろん可能である。
ば、入力信号が非音声信号である場合、その非音声信号
のLSP係数を、LSP係数の分布が音声信号のものに
近づくように補正し、その補正後のLSP係数を量子化
するようにしたので、非音声信号に固有のトーン周波数
近傍のスペクトル概形を保存しつつ、LSP係数の分布
を分散させることができ、音声信号の場合と共通の(す
なわち、音声信号に対応して作成された)LSP量子化
符号帳7を使用しつつ、各非音声信号のLSP係数を量
子化する際の量子化歪を低減することができ、音声信号
伝送時と非音声信号伝送時とで共通のビットシーケンス
を使用でき、受信側の音声復号装置を変更することな
く、DTMF信号などの非音声信号をインチャネルで良
好に伝送することができるという効果が得られる。
号の特性に近づけるように非音声信号を処理して共通の
LSP量子化符号帳7を使用してLSP係数の量子化を
実行することにより非音声信号の量子化歪を低減してい
るので、例えば入力信号が音声信号であるにも拘わらず
音声/非音声信号識別器5により非音声信号であると誤
って判定された場合における音声品質の劣化を低減する
ことができ、ある程度の音声伝送品質が維持されて通話
中に耳触りな音声になる可能性を低減することができる
という効果が得られる。ひいては、簡単な構成でそのよ
うな効果が得られ、装置のコストを低減することができ
るという効果が得られる。
に特化して(すなわち大量の音声信号を使用して)学習
されたLSPサンプルが使用されており、特に、例え
ば、CS−ACELP方式などの低ビットレートの音声
符号化方式を使用する場合には音声品質の維持を優先す
るため、より音声に特化したものとなっている。しかし
ながら、図4に示すように、DTMF信号のスペクトル
概形と音声信号のスペクトル概形とは異なり、例えば図
5に示すように、DTMF信号のLSP係数は、スペク
トルピークが急峻であることに起因して、トーン周波数
周辺で密に分布しているが、音声信号のLSP係数は、
ホルマント周波数付近で密になっているものの、DTM
F信号に比べなだらかに分布している。このように、音
声信号とDTMF信号のようなトーン信号とでは、その
周波数特性が大きく異なり、周波数軸上における疎密で
スペクトル概形を表現するLSP係数の分布も異なるこ
とになる。なお、図4はディジット「3」のDTMF信
号の周波数スペクトルと「う」についての一般的な男性
の音声の周波数スペクトルとを示す図であり、図5はD
TMF信号のLSP係数の分布と音声信号のLSP係数
の分布の一例を示す図である。
脱したDTMF信号などの非音声信号のLSP係数をそ
のまま量子化すると、LSP量子化符号帳に適当な符号
語(量子化されたLSP係数)が見当たらずに、量子化
歪が大きくなる可能性があるが、この実施の形態1によ
る音声符号化装置では、そのような非音声信号のLSP
係数を補正するため、通常のLSP量子化符号帳を使用
してそのような非音声信号を良好に符号化することがで
きる。
態2による音声符号化装置の構成を示すブロック図であ
り、図7は図6におけるLSP量子化符号帳7およびL
SP量子化部6A,6Bの構成を示すブロック図であ
る。図6において、6Aは音声信号用のLSP量子化部
(量子化手段、第1の量子化部)であり、6Bは非音声
信号用のLSP量子化部(量子化手段、第2の量子化
部)である。なお、LSP量子化部6AとLSP量子化
部6Bは同一のLSP量子化符号帳7を参照し、共通の
符号帳インデックスを使用する。なお、図6におけるそ
の他の構成要素については実施の形態1によるものと同
様であるので、その説明を省略する。
化部6Aにおいて、21は多くの音声データから学習に
より抽出された複数の所定の量子化係数を記憶する第1
段LSP符号帳であり、22は乱数による微調整用の複
数の所定の量子化係数を記憶する第2段LSP符号帳で
あり、23は所定のセット数の複数のMA予測係数を記
憶するMA予測係数符号帳である。
り、33は所定の数の過去の時点の加算器31の出力
と、いずれかのセットのMA予測係数とを乗算してMA
予測成分を計算するMA予測成分計算部であり、34は
加算器であり、35はLPC→LSP変換部2より供給
されたLSP係数から、LSP量子化符号帳7の各係数
より計算されたLSP係数を減算してLSP係数の残差
を計算する減算器である。36Aは量子化誤差を低減す
るために、LPC→LSP変換部2より供給された各次
数のLSP係数から、音声信号の場合の各次数のLSP
係数に乗算する重み付け係数を計算する音声信号用量子
化誤差重み付け係数計算部であり、37はLSP係数の
残差の自乗に対してその重み付け係数を乗算した値が最
小になるLSP係数を、LSP量子化符号帳7の各符号
帳より出力される各係数を変更させて探索し、その係数
に対応する各符号帳インデックスをLSP符号帳インデ
ックスとして出力する歪最小化部である。
子化部6Bにおいて、36Bは量子化誤差を低減するた
めに、LSP係数補正部3より供給された各次数のLS
P係数から、非音声信号の場合の各次数のLSP係数に
乗算する重み付け係数を計算する非音声信号用量子化誤
差重み付け係数計算部である。なお、図7(b)におけ
るその他の構成要素については図7(a)におけるもの
と同様であるので、その説明を省略する。
態2による音声符号化装置では、LPC→LSP変換部
2により生成されたLSP係数が、LSP量子化部6A
およびLSP係数補正部3に供給される。そして、LS
P量子化部6Aは、そのLSP係数が音声信号のもので
あるものとして量子化歪が低減されるように、LSP量
子化符号帳7を参照してそのLSP係数に対応する符号
帳インデックスを選択し、切替スイッチ4に供給する。
一方、LSP係数補正部3は、実施の形態1の場合と同
様にして、そのLSP係数を補正し、補正後のLSP係
数をLSP量子化部6Bに供給し、LSP量子化部6B
は、そのLSP係数が非音声信号のものであるものとし
て量子化歪が低減されるように、LSP量子化符号帳7
を参照してそのLSP係数に対応する符号帳インデック
スを選択し、切替スイッチ4に供給する。
P量子化符号帳7の第1段LSP符号帳21からの係数
と第2段LSP符号帳22からの係数とが加算器31に
より加算され、その演算結果が乗算器32およびMA予
測成分計算部33に供給される。また、LSP量子化符
号帳7のMA予測係数符号帳23からMA予測係数が乗
算器32およびMA予測成分計算部33に供給される。
そして、乗算器32は、そのMA予測係数を加算器31
の出力に乗算し、乗算後の値を加算器34に供給する。
MA予測成分計算部33は、過去の所定の時点分の加算
器31の出力およびMA予測係数を記憶し、各時点につ
いての加算器31の出力およびMA予測係数の積の総和
を計算し、加算器34に供給する。加算器34は、それ
らの値の和を計算し、減算器35に供給する。減算器3
5は、LPC→LSP変換部2より供給されたLSP係
数から加算器34の出力(すなわち、LSP量子化符号
帳7の各符号帳より得られたLSP係数)を減算して、
そのLSP係数の残差を歪最小化部37に供給する。歪
最小化部37は、そのLSP係数の残差の自乗に対し
て、音声信号用量子化誤差重み付け計算部36Aからの
重み付け係数を乗算し、その計算結果が最小になるLS
P係数を、LSP量子化符号帳7の各符号帳より出力さ
れる各係数を変更させて探索し、歪みが最小になるとき
のLSP量子化符号帳7の各符号帳のインデックスをL
SP符号帳インデックスとして出力する。
部37は、そのLSP係数の残差の自乗に対して、非音
声信号用量子化誤差重み付け計算部36Bからの重み付
け係数を乗算し、その計算結果が最小になるLSP係数
を、LSP量子化符号帳7の各符号帳より出力される各
係数を変更させて探索し、歪みが最小になるときのLS
P量子化符号帳7の各符号帳のインデックスをLSP符
号帳インデックスとして出力する。
用量子化誤差重み付け係数計算部36Aは、上述のよう
な音声信号の特性に基づいて量子化歪が低減するように
重み付け係数を決定し、LSP量子化部6Bの非音声信
号用量子化誤差重み付け係数計算部36Bは、上述のよ
うなDTMF信号などの非音声信号の特性に基づいて量
子化歪が低減されるように重み付け係数を決定する。こ
れにより、LSP量子化部6Aは、音声信号のLSP係
数に対して発生する量子化歪が最小であるLSPサンプ
ルのLSP符号帳インデックスを選択し、LSP量子化
部6Bは、非音声信号のLSP係数に対して発生する量
子化歪が最小であるLSPサンプルのLSP符号帳イン
デックスを選択する。
信号が音声信号であるか、DTMF信号などの非音声信
号であるかを判定し、その判定結果に基づいて切替スイ
ッチ4を制御して、入力信号が音声信号である場合に
は、LSP量子化部6AからのLSP符号帳インデック
スを多重化部19およびLSP逆量子化部8に供給さ
せ、入力信号が非音声信号である場合には、LSP量子
化部6AからのLSP符号帳インデックスを多重化部1
9およびLSP逆量子化部8に供給させる。すなわち、
結果的に、入力信号としてDTMF信号などの非音声信
号が入力された場合にのみLSP係数の補正が反映され
る。
1によると同様であるので、その説明を省略する。
ば、LSP係数に対応する最適なLSPサンプルをLS
P量子化符号帳7から選択する際に、非音声信号の場合
にはその非音声信号の特性を考慮して量子化歪が最小に
なるようなLSPサンプルを選択するようにしてLSP
係数を量子化するようにしたので、音声信号の場合と共
通の(すなわち、音声信号に対応して作成された)LS
P量子化符号帳7を使用しつつ、非音声信号のLSP係
数を量子化する際の量子化歪を低減することができると
いう効果が得られる。
態3による音声符号化装置の構成を示すブロック図であ
る。図において、41は入力信号からDTMF信号を検
出し、そのDTMF信号の種類(すなわちディジットの
種類)をLSP係数補正部3Aに通知するDTMF検出
器(非音声信号検出器)であり、3AはDTMF検出器
41より通知されたディジットの種類に応じて補正特性
を変更し、LSP係数補正部3と同様にLSP係数を補
正するLSP係数補正部である。なお、図8におけるそ
の他の構成要素については実施の形態1によるものと同
様であるので、その説明を省略する。また、このDTM
F検出器41としては、交換機や電話機などで既に広く
実用化されている物をそのまま用いることができる。な
お、ディジットの種類としては、0,1,2,3,4,
5,6,7,8,9,*,#の12種類の他、外国で使
用されるA,B,C,Dを含めた16種類がある。
器41は、入力信号からDTMF信号を検出すると、そ
のDTMF信号に対応するディジットの種類をLSP係
数補正部3Aに通知する。LSP係数補正部3Aは、D
TMF検出器41よりディジットの種類の通知を受け取
ると、そのディジットの種類に応じた補正特性で、LP
C→LSP変換部2からのLSP係数を補正し、補正後
のLSP係数を出力する。
されたディジットのDTMF信号を構成する2つのトー
ン信号のピーク周波数は既知であるため、ピーク周波数
周辺のLSP係数については補正量を少なくし、それ以
外の周波数域のLSP係数については補正量を多くし
て、検出されたディジットのDTMF信号のピーク部分
の特徴を保存する。
出された場合のLSP係数の補正について説明する。図
9はディジット「0」が検出された場合のDTMF信号
のLSP係数と補正後のLSP係数との関係の一例を示
す図である。
ーンのピーク周波数は941Hzであり、高群トーンの
ピーク周波数は1336Hzであるので、LSP補正係
数部3Aは、ディジット「0」のDTMF信号が検出さ
れた旨の通知を受け取ると、図9に示すように、この2
つの周波数を中心に密になるようにLSP係数を補正す
る。すなわち、LSP補正係数部3Aは、この2つのピ
ーク周波数近傍のLSP係数(図中では、例えばA,
B,CのLSP係数)に対する補正係数を小さくして補
正量を小さくする。
1によるものと同様であるので、その説明を省略する。
F信号をとりあげているが、他の非音声信号についても
同様である。
ば、DTMF信号の種類(すなわち、ディジットの種
類)に応じた補正特性でDTMF信号のLSP係数を補
正するようにしたので、各DTMF信号に固有のトーン
周波数近傍のスペクトル概形を保存しつつ、LSP係数
の分布を分散させることができ、音声信号の場合と共通
の(すなわち、音声信号に対応して作成された)LSP
量子化符号帳7を使用しつつ、各非音声信号のLSP係
数を量子化する際の量子化歪をより低減することができ
るという効果が得られる。
形態4による音声符号化装置の構成を示すブロック図で
ある。図において、3−1〜3−4は、LSP係数補正
部3と同様の、補正係数が互いに異なる複数のLSP係
数補正部であり、6B−1〜6B−4は、実施の形態2
におけるLSP量子化部6Bと同様に、LSP量子化符
号帳7を参照してLSP係数に対応するLSPサンプル
のLSP符号帳インデックスを選択し、そのときの量子
化歪とともに出力する非音声信号用の複数のLSP量子
化部(量子化手段、第2の量子化部)であり、51は切
替スイッチであり、52は非音声用の複数のLSP量子
化部6B−1〜6B−4からのLSP符号帳インデック
スのうち、量子化歪の最も小さいものを選択する選択部
(選択手段)である。なお、図10におけるその他の構
成要素については実施の形態2によるものと同様である
ので、その説明を省略する。
MF信号のLSP係数と補正係数の異なる補正後のLS
P係数との対応関係の一例を示す図である。
は、音声/非音声信号識別器5による判定結果に基づい
て切替スイッチ51が制御され、LPC→LSP変換部
2からのLSP係数が、入力信号が音声信号である場合
にはLSP量子化部6Aに供給され、入力信号が非音声
信号である場合にはLSP係数補正部3−1〜3−4に
供給される。
0.3として、例えば式(1)に従って、LPC→LS
P変換部2から切替スイッチ51を介して供給された非
音声信号のLSP係数を、白色雑音のLSP係数を使用
して補正し、補正後のLSP係数をLSP量子化部6B
−1に供給する。 f(i)=(1−α)・fDTMF(i)+α・fwhite(i)・・・(1) ここで、f(i)は補正後の第i次のLSP係数であ
り、αは補正係数であり、fDTMF(i)は補正前のDT
MF信号などの非音声信号の第i次のLSP係数であ
り、fwhite (i)は白色雑音の第i次のLSP係数で
ある。
は、補正係数αをそれぞれ0.2、0.1および0.0
5として、例えば式(1)に従って白色雑音のLSP係
数を使用して、LPC→LSP変換部2から切替スイッ
チ51を介して供給された非音声信号のLSP係数を補
正し、補正後のLSP係数をLSP量子化部6B−2〜
6B−4にそれぞれ供給する。
SP量子化部6Bと同様にして、それぞれ供給されたL
SP係数に対応するLSP符号帳インデックスを選択
し、そのときに歪最小化部37で得られた量子化歪の値
とともに、選択部52に供給する。選択部52は、LS
P量子化部6B−1〜6B−4からのLSP符号帳イン
デックスのうち、量子化歪の最も小さいものを選択し、
切替スイッチ4に出力する。
するほど、LSP係数の分布は均一に近づくため、量子
化歪を低減させるという観点では補正係数αが大きいほ
ど有利であるが、補正係数αを大きくすると、ピーク周
波数は保存されるものの、補正後のDTMF信号のスペ
クトル概形が補正前のDTMF信号のものから大きく崩
れることになる。そこで、この実施の形態4による音声
符号化装置では、値の異なる複数の補正係数αに基づい
てそれぞれ補正した複数のLSP係数を量子化して、そ
のときの量子化歪が最小であるLSPサンプルを選択す
るようにしている。
2によるものと同様であるので、その説明を省略する。
数補正部3−1〜3−4は補正係数α以外については同
一のものであり、線形補間に基づいて補正を実行してい
るが、他の補間方法で補正を実行するようにしてもよ
い。
装置にDTMF検出器41を設け、実施の形態3のよう
に、そのDTMF検出器41からのディジット検出結果
を、LSP係数補正部3−1〜3−4のうちの1つまた
は複数に供給させるようにして、LSP係数補正部3A
のように、検出されたディジットに応じて補正特性をさ
らに変更するようにしてもよい。
P係数補正部3−1〜3−4および非音声信号用のLS
P量子化部6B−1〜6B−4がともに4つ設けられて
いるが、これらの構成要素の数は4に限定されるもので
はなく、その他の複数でもよい。
ば、非音声信号のLSP係数に対して、互いに異なる複
数の補正係数で補正処理を実行し、各補正後のLSP係
数を量子化し、それぞれのLSP係数に基づいて選択さ
れたLSPサンプルのうちで量子化歪の最小のものを選
択するようにしたので、量子化歪の少ない、かつスペク
トル概形の崩れていないLSPサンプルが選択され、良
好に非音声信号のLSP係数を量子化することができる
という効果が得られる。
形態5による音声符号化装置の構成を示すブロック図で
ある。図において、61は線形予測分析部1により生成
されたLPC係数に対して帯域幅拡張処理を実行する帯
域幅拡張部であり、62は線形予測分析部1により生成
されたLPC係数をLSP係数に変換するLPC→LS
P変換部であり、63は帯域幅を拡張されたLPC係数
をLSP係数に変換するLPC→LSP変換部である。
なお、図12におけるその他の構成要素については実施
の形態2によるものと同様であるので、その説明を省略
する。
態5による音声符号化装置では、線形予測分析部1によ
り生成されたLPC係数がLPC→LSP変換部63お
よび帯域幅拡張部61に供給される。LPC→LSP変
換部63は、そのLPC係数をLSP係数に変換し、そ
のLSP係数をLSP量子化部6Aに供給する。一方、
帯域幅拡張部61は、線形予測分析部1により生成され
たLPC係数に対して式(2)に従って帯域幅拡張処理
を実行し、帯域幅拡張後のLPC係数をLPC→LSP
変換部62に供給する。 a*(i)=λi ・a(i) ・・・(2) ここで、a*(i)は帯域幅拡張後の第i次のLPC係
数であり、λは拡張係数(1>λ>0)であり、a
(i)帯域幅拡張前の第i次のLPC係数である。
域幅拡張されたLPC係数をLSP係数に変換し、その
LSP係数をLSP量子化部6Bに供給する。
2によるものと同様であるので、その説明を省略する。
ば、非音声信号のLPC係数に対して帯域幅拡張処理を
実行して、非音声信号の周波数スペクトルにおけるピー
ク幅を拡張させるようにしたので、非音声信号に固有の
トーン周波数近傍のスペクトル概形を保存しつつ、LS
P係数の分布を分散させることができ、音声信号の場合
と共通の(すなわち、音声信号に対応して作成された)
LSP量子化符号帳7を使用しつつ、各非音声信号のL
SP係数を量子化する際の量子化歪をより低減すること
ができるという効果が得られる。
形態6による音声符号化装置の構成を示すブロック図で
あり、図14はこの発明の実施の形態6による音声符号
化装置の他の構成を示すブロック図である。図13にお
いて、61−1〜61−4は帯域幅拡張部61と同様
の、拡張係数が互いに異なる複数の帯域幅拡張部であ
り、62−1〜62−4は複数の帯域幅拡張部61−1
〜61−4により帯域幅拡張されたLPC係数をLSP
係数にそれぞれ変換するLPC→LSP変換部である。
なお、図13におけるその他の構成要素については実施
の形態4または実施の形態5によるものと同様であるの
で、その説明を省略する。
態6による音声符号化装置では、線形予測分析部1から
のLPC係数が、LPC→LSP変換部63および帯域
幅拡張部61−1〜61−4に供給される。
ぞれ異なる拡張係数λに基づいて、線形予測分析部1か
らのLPC係数に対して帯域幅拡張処理を実行し、帯域
幅拡張後のLPC係数をLPC→LSP変換部62−1
〜62−4にそれぞれ供給する。各LPC→LSP変換
部62−k(k=1,2,3,4)は、供給されたLP
C係数をLSP係数に変換し、そのLSP係数をLSP
量子化部6B−kに供給し、LSP量子化部6B−kは
そのLSP係数に対応するLSP符号帳インデックスと
量子化時の量子化歪を選択部52に供給する。選択部5
2は、LSP量子化部6B−1〜6B−4からのLSP
符号帳インデックスのうち、量子化歪の最も小さいもの
を選択し、切替スイッチ4に出力する。
わち0に近づける)ほど、LSP係数の分布が均一にな
り、拡張係数λを大きくする(すなわち1に近づける)
ほど、帯域幅拡張の効果が小さくなりLSP係数が帯域
幅拡張処理なしのLSP係数に近づく。すなわち、拡張
係数λを小さくすると、補正係数αを大きくした場合と
同様の効果が得られ、拡張係数λを大きくすると、補正
係数αを小さくした場合と同様の効果が得られる。した
がって、拡張係数λの異なる複数の帯域幅拡張部61−
1〜61−4によりLPC係数の帯域幅を拡張するよう
にして、実施の形態4において補正係数αの異なる複数
のLSP係数補正部3−1〜3−4によりLSP係数を
補正するようにした場合と同様の効果が得られる。
5によるものと同様であるので、その説明を省略する。
張部61−1〜61−4は、式(2)に基づく帯域幅拡
張処理を実行しているが、他の方式で帯域幅拡張処理を
実行するようにしてもよい。また、この実施の形態6で
は、帯域幅拡張部61−1〜61−4、LPC→LSP
変換部62−1〜62−4および非音声信号用のLSP
量子化部6B−1〜6B−4がともに4つ設けられてい
るが、これらの構成要素の数は4に限定されるものでは
なく、その他の複数でもよい。
および実施の形態3に基づいて、帯域幅拡張部61−
1,61−2およびLPC→LSP変換部62−1,6
2−2と、LSP補正部3と、DTMF検出器41およ
びLSP補正部3Aとを組合わせるようにしてもよい。
なお、その場合、帯域幅拡張部61−1,61−2およ
びLPC→LSP変換部62−1,62−2の数はとも
に2に限定されず、LSP補正部3の数は1に限定され
ず、LSP補正部3Aの数は1に限定されないことはい
うまでもない。
ば、非音声信号のLPC係数に対して、互いに異なる複
数の拡張係数で帯域幅拡張処理を実行し、各帯域幅拡張
処理後のLPC係数をそれぞれLSP係数に変換し、各
LSP係数を量子化し、それぞれのLSP係数に基づい
て選択されたLSPサンプルのうちで量子化歪の最小の
ものを選択するようにしたので、量子化歪の少ない、か
つスペクトル概形の崩れていないLSPサンプルが選択
され、良好に非音声信号のLSP係数を量子化すること
ができるという効果が得られる。
形態7による音声符号化装置の構成を示すブロック図で
ある。図において、81は所定のレベルの白色雑音を擬
似的に発生させ、入力信号に重畳する白色雑音重畳部で
あり、82は切替スイッチである。なお、図15におけ
るその他の構成要素については実施の形態1によるもの
と同様であるので、その説明を省略する。
態7による音声符号化装置では、入力信号が、音声/非
音声信号識別器5、減算器16、白色雑音重畳部81お
よび切替スイッチ82に供給される。そして白色雑音重
畳部81は、所定のレベルの白色雑音を入力信号に重畳
し、白色雑音の重畳された入力信号を切替スイッチ82
に供給する。
定結果に基づいて切替スイッチ82により、入力信号が
音声信号である場合には入力信号がそのまま線形予測分
析部1に供給され、入力信号が非音声信号である場合に
は、白色雑音の重畳された入力信号が線形予測分析部1
に供給される。すなわち、結果的に、入力信号が非音声
信号である場合のみ、入力信号に白色雑音が重畳される
ことになる。このように、非音声信号に白色雑音を重畳
することにより、非音声信号のスペクトルにおけるピー
クの幅が若干拡張し、非音声信号のスペクトルがなだら
かになる。
LPC係数を生成し、LPC→LSP変換部2に供給
し、LPC→LSP変換部2はそのLPC係数をLSP
係数に変換し、そのLSP係数をLSP量子化部6に供
給する。
1によるものと同様であるので、その説明を省略する。
ば、非音声信号に白色雑音を重畳し、白色雑音を重畳し
た入力信号からLPC係数を計算し、そのLPC係数を
LSP係数に変換し、そのLSP係数を量子化するよう
にしたので、非音声信号に固有のトーン周波数近傍のス
ペクトル概形を保存しつつ、LSP係数の分布を分散さ
せることができ、音声信号の場合と共通の(すなわち、
音声信号に対応して作成された)LSP量子化符号帳7
を使用しつつ、各非音声信号のLSP係数を量子化する
際の量子化歪をより低減することができるという効果が
得られる。
形態8による音声符号化装置の構成を示すブロック図で
ある。図において、81−1〜81−3は互いにレベル
の異なる白色雑音を擬似的に発生させ、入力信号にそれ
ぞれ重畳する複数の白色雑音重畳部であり、1−1〜1
−3は線形予測分析部1と同様の線形予測分析部であ
り、2−1〜2−3はLPC→LSP変換部2と同様の
LPC→LSP変換部であり、6−1〜6−3はLSP
量子化部6と同様のLSP量子化部である。91はLS
P量子化部6,6−1〜6−3からのLSP符号帳イン
デックスのうち、量子化歪の最も小さいものを選択する
選択部(選択手段)である。なお、図16におけるその
他の構成要素については実施の形態6によるものと同様
であるので、その説明を省略する。
態8による音声符号化装置では、入力信号が、音声/非
音声信号識別器5、減算器16、白色雑音重畳部81−
1〜81−3および線形予測分析部1に供給される。
号に対してSNR(Signal to Noise Ratio )が45d
Bである白色雑音を重畳し、白色雑音の重畳された入力
信号を線形予測分析部1−1に供給し、白色雑音重畳部
81−2は、入力信号に対してSNRが50dBである
白色雑音を重畳し、白色雑音の重畳された入力信号を線
形予測分析部1−2に供給し、白色雑音重畳部81−3
は、入力信号に対してSNRが55dBである白色雑音
を重畳し、白色雑音の重畳された入力信号を線形予測分
析部1−3に供給する。
2,3)は、供給された信号からLPC係数を生成し、
LPC→LSP変換部2−kに供給し、LPC→LSP
変換部2−kはそのLPC係数をLSP係数に変換し、
そのLSP係数をLSP量子化部6−kに供給する。各
LSP量子化部6−kはLSP量子化符号帳7を参照し
てそのLSP係数に対応するLSP符号帳インデックス
とそれに対応する量子化歪を選択部91に供給する。
きくする(SNRを低下させる)ほど、LSP係数の分
布が均一になり、白色雑音のレベルを小さくする(SN
Rを増加させる)ほど、LSP係数の分布が、白色雑音
の重畳しないときのものに近づく。すなわち、白色雑音
のレベルを大きくすると、補正係数αを大きくした場合
と同様の効果が得られ、白色雑音のレベルを小さくする
と、補正係数αを小さくした場合と同様の効果が得られ
る。したがって、複数の白色雑音重畳部81−1〜81
−3により、異なるレベルの白色雑音を重畳させるよう
にして、実施の形態4において補正係数αの異なる複数
のLSP係数補正部3−1〜3−4によりLSP係数を
補正するようにした場合と同様の効果が得られる。
LPC係数を生成し、LPC→LSP変換部2に供給
し、LPC→LSP変換部2はそのLPC係数をLSP
係数に変換し、そのLSP係数をLSP量子化部6に供
給する。LSP量子化部6はLSP量子化符号帳7を参
照してそのLSP係数を選択し、そのときの量子化歪を
選択部91に供給する。
識別器5による判定結果に基づいて、入力信号が音声信
号である場合にはLSP量子化部6からのLSP符号帳
インデックスを選択して多重化部19およびLSP逆量
子化部8に供給し、入力信号が非音声信号である場合に
はLSP量子化部6,6−1〜6−3からのLSP符号
帳インデックスのうち、量子化歪の最も小さいものを選
択して多重化部19およびLSP逆量子化部8に供給す
る。
6によるものと同様であるので、その説明を省略する。
の数および重畳する白色雑音のレベルは上記のものに限
定されるものではない。
ば、非音声信号に対して、互いに異なるレベルの白色雑
音をそれぞれ重畳し、白色雑音を重畳した各信号からL
PC係数を計算し、各LPC係数をそれぞれLSP係数
に変換し、各LSP係数を量子化し、それぞれのLSP
係数に基づいて選択されたLSPサンプルのうちで量子
化歪の最小のものを選択するようにしたので、量子化歪
の少ない、かつスペクトル概形の崩れていないLSPサ
ンプルが選択され、良好に非音声信号のLSP係数を量
子化することができるという効果が得られる。
形態9による音声符号化装置の構成を示すブロック図で
ある。図において、7AはLSP量子化符号帳7の有す
るLSPサンプルの集合の部分集合を有する符号帳サブ
セット(符号語のサブセット)である。なお、符号帳サ
ブセット7Aに含まれるLSPサンプルに付されるLS
P符号帳インデックスは、LSP量子化符号帳7に含ま
れる同一のLSPサンプルに付されるものと同一である
ようにする。
ついては実施の形態2によるものと同様であるので、そ
の説明を省略する。ただし、LSP量子化部6Bの前段
にLSP係数補正部3は特に設けられていない。
MF信号の量子化前のLSP係数とLSP量子化符号帳
7におけるLSPサンプルとの対応関係の一例を示す図
である。
は、LSP量子化部6Bが符号帳サブセット7Aを参照
してLSP係数の量子化を実行する。すなわち、LSP
量子化部6Bは、LSP量子化符号帳7のすべてのLS
Pサンプルにおいて最適なLSPサンプルを探索するの
ではなく、符号帳サブセット7Aの有するLSPサンプ
ルのみにおいて最適なLSPサンプルを探索する。
SPサンプルのうち、非音声信号のLSP係数の量子化
時に大きな周波数歪を生じさせる可能性のあるLSPサ
ンプル以外のものが、符号帳サブセット7AのLSPサ
ンプルとして選択される。例えば、DTMF信号を線形
予測分析して得られたLSP係数の量子化を行った際に
大きな周波数歪を生じさせる可能性のあるLSPサンプ
ルをLSP量子化符号帳7のLSPサンプルから取り除
いていき、残りのLSPサンプルで構成される集合が符
号帳サブセット7Aに設定される。例えば、図18に示
すようにDTMF信号のトーンピーク周波数の周辺で大
きな量子化誤差を有するLSPサンプルは予め取り除か
れ、符号帳サブセット7Aには含まれない。
7Aを使用することにより、LSP量子化部6Bが、D
TMF信号などの非音声信号のLSP係数を符号化する
際に、上述のようなLSP係数の自乗誤差に基づく歪評
価法を使用しても、大きな量子化歪を発生するLSPサ
ンプルが選択されなくなる。
2によるものと同様であるので、その説明を省略する。
また、符号帳サブセット7AにおけるLSPサンプルの
集合は、LSP量子化符号帳7におけるLSPサンプル
の集合のサブセットになっており、両者で同一のLSP
符号帳インデックスを使用しており、音声復号装置では
このLSP符号帳インデックスを使用して同一のLSP
サンプルを選択することが可能であるので、音声符号化
装置における音声/非音声信号識別器5による判定結果
は音声復号装置における復号処理には必要なく、特に音
声符号化装置から送出されない。
ば、LSP量子化符号帳7のうち、非音声信号のLSP
係数の量子化時に大きな周波数歪を生じさせる可能性の
少ないLSPサンプルのみで構成される符号帳サブセッ
ト7Aを参照して非音声信号のLSP係数を量子化する
ようにしたので、音声信号伝送時と非音声信号伝送時と
で共通のビットシーケンスを使用でき、受信側の音声復
号装置を変更することなく、DTMF信号などの非音声
信号をインチャネルで良好に伝送することができるとい
う効果が得られる。
の形態10による音声符号化装置の構成を示すブロック
図である。図において、101はLPC→LSP変換部
2からのLSP係数に基づいて、LSP量子化符号帳7
におけるLSPサンプルのうち、非音声信号に使用可能
なLSPサンプルを抽出し、符号帳サブセット7Aを構
成するLSPサンプルとするLSP予備選択部(符号語
選択手段)である。なお、図19におけるその他の構成
要素については実施の形態9によるものと同様であるの
で、その説明を省略する。
択部101は、LPC→LSP変換部2からの非音声信
号のLSP係数に対して、そのLSP係数を量子化した
際に量子化歪が大きいと推定されるLSPサンプル、お
よび/またはそのLSP係数を量子化した際に量子化歪
が小さいと推定されるLSPサンプルをLSP量子化符
号帳7から選択し、所定の第1の基準値より量子化歪が
大きいと推定されるLSPサンプルが符号帳サブセット
7Aに含まれている場合には、そのLSPサンプルを符
号帳サブセット7Aから削除し、かつ/あるいは、所定
の第2の基準値より量子化歪が小さいと推定されるLS
Pサンプルが符号帳サブセット7Aに含まれていない場
合には、そのLSPサンプルを符号帳サブセット7Aに
追加する。したがって、非音声信号のLSP係数に対応
したLSP予備選択部101の処理結果に応じて符号帳
サブセット7Aに含まれるLSPサンプルが適応的に変
化する。
は、例えば、図7に示すLSP量子化部6Bと同様の構
成のものを使用し、その歪最小化部37が量子化歪の少
ない上位N個(Nは所定の複数)のLSPサンプルを符
号帳サブセット7Aに追加し、その際に量子化歪が所定
の値より大きいLSPサンプルを発見した場合には、そ
のLSPサンプルが符号帳サブセット7Aに含まれてい
るときには、そのLSPサンプルを符号帳サブセット7
Aから削除するようにしてもよい。
9によるものと同様であるので、その説明を省略する。
ば、入力された非音声信号のLSP係数に基づいて、L
SP量子化符号帳7におけるLSPサンプルのうち、非
音声信号に使用可能なLSPサンプルを抽出し、符号帳
サブセット7Aを構成するLSPサンプルとするように
したので、符号帳サブセット7Aを構成するLSPサン
プルが適応的に変化していき、より非音声信号に適した
LSPサンプルに代替されていくという効果が得られ
る。
の形態11による音声符号化装置の構成を示すブロック
図である。図において、7A−1〜7A−3は、所定の
種類の非音声信号のLSP係数を量子化する際に探索さ
れる複数のLSPサンプルをそれぞれ有する複数の符号
帳サブセットである。なお、各符号帳サブセット7A−
1〜7A−3に含まれるLSPサンプルに付されるLS
P符号帳インデックスは、LSP量子化符号帳7に含ま
れる同一のLSPサンプルに付されるものと同一である
ようにする。
たディジットの種類に応じた符号帳サブセット7A−i
(i=1,2,3)を選択し、その符号帳サブセット7
A−iをLSP量子化部6Bから読み出し可能にする選
択器であり、41は入力信号からDTMF信号を検出
し、そのDTMF信号の種類(すなわちディジットの種
類)を選択器111に通知するDTMF検出器である。
なお、図20におけるその他の構成要素については実施
の形態2によるものと同様であるので、その説明を省略
する。
器41は、入力信号からDTMF信号を検出すると、そ
のDTMF信号の種類(すなわちディジットの種類)を
選択器111に通知する。選択器111はDTMF検出
器41より通知されたディジットの種類に応じた符号帳
サブセット7A−i(i=1,2,3)を選択し、その
符号帳サブセット7A−iをLSP量子化部6Bから読
み出し可能にする。そしてLSP量子化部6Bは選択器
111を介してその符号帳サブセット7A−iを参照し
てLSP係数に対応するLSP符号帳インデックスを選
択する。すなわち、LSP量子化部6Bは、LSP量子
化符号帳7のすべてのLSPサンプルにおいて最適なL
SPサンプルを探索するのではなく、符号帳サブセット
7A−iの有するLSPサンプルのみにおいて最適なL
SPサンプルを探索する。
SPサンプルのうち、各ディジットのLSP係数の量子
化時に大きな周波数歪を生じさせる可能性のあるLSP
サンプル以外のものが、符号帳サブセット7A−iのL
SPサンプルとして選択される。例えば、ディジット毎
に分類して、DTMF信号を線形予測分析して得られた
LSP係数の量子化を行った際に大きな周波数歪を生じ
させる可能性のあるLSPサンプルをLSP量子化符号
帳7のLSPサンプルから取り除いていき、残りのLS
Pサンプルで構成される集合が符号帳サブセット7A−
iに設定される。このとき、符号帳サブセット7A−i
の数は図20に示すように3に限定されるものではな
く、他の数、例えば各ディジットに一対一で対応する符
号帳サブセットを合計で16個設けるようにしてもよ
い。また、符号帳サブセット7A−iに含まれるLSP
サンプルが他の符号帳サブセット7A−j(j≠i)に
も含まれていてもよい。
7A−iを使用することにより、LSP量子化部6B
が、DTMF信号の各ディジットに対応するLSP係数
を符号化する際に、上述のようなLSP係数の最小自乗
誤差に基づく歪評価法を使用しても、大きな量子化歪を
発生するLSPサンプルが選択されなくなる。
2によるものと同様であるので、その説明を省略する。
ば、非音声信号の種類を検出し、LSP量子化符号帳7
に含まれるLSPサンプルのうち、その種類の非音声信
号のLSP係数の量子化時に大きな周波数歪を生じさせ
る可能性の少ないLSPサンプルで構成される符号帳サ
ブセット7A−iを参照して、その非音声信号のLSP
係数を量子化するようにしたので、より良好な伝送特性
で、各種類の非音声信号をインチャネルで伝送すること
ができるという効果が得られる。
の形態12による音声符号化装置の構成を示すブロック
図である。図において、121はLSP予備選択部10
1の前段の設けられたLSP係数補正部である。なお、
182は、LSP予備選択部101に供給するLSP係
数(周波数パラメータ)を生成する第2の周波数パラメ
ータ生成手段である。
ついては実施の形態10によるものと同様であるので、
その説明を省略する。
態12による音声符号化装置では、LSP係数補正部1
21はLPC→LSP変換部2から出力されたLSP係
数に対して、LSP係数補正部3と同様の補正処理を実
行し、補正後のLSP係数をLSP予備選択部101に
供給し、LSP予備選択部101がその補正後のLSP
係数に基づいて符号帳サブセット7Aに含まれるLSP
サンプルを適応的に変更する。
10によるものと同様であるので、その説明を省略す
る。
ば、量子化の際の量子化歪が少なくなるように非音声信
号のLSP係数を補正して、補正後のLSP係数に基づ
いて、非音声信号のLSP係数の量子化に適したLSP
サンプルをLSP量子化符号帳7から符号帳サブセット
7Aに抽出するようにしたので、音声信号のためのLS
P量子化符号帳7を構成するLSPサンプルのうち、適
切なLSPサンプルを非音声信号のためのものとして選
択することができるという効果が得られる。
の形態13による音声符号化装置の構成を示すブロック
図である。図において、131はLSP予備選択部10
1の前段に設けられた帯域幅拡張部であり、132はL
SP予備選択部101の前段に設けられたLPC→LS
P変換部である。なお、図22におけるその他の構成要
素については実施の形態10によるものと同様であるの
で、その説明を省略する。
態13による音声符号化装置では、線形予測分析部1か
ら出力されたLPC係数がLPC→LSP変換部2およ
び帯域幅拡張部131に供給され、帯域幅拡張部131
は、帯域幅拡張部61と同様にして、そのLPC係数に
対して帯域幅拡張処理を実行し、帯域幅を拡張されたL
PC係数をLPC→LSP変換部132に供給し、LP
C→LSP変換部132は、そのLPC係数をLSP係
数に変換し、そのLSP係数をLSP予備選択部101
に供給する。LSP予備選択部101は、そのLSP係
数に基づいて符号帳サブセット7Aに含まれるLSPサ
ンプルを適応的に変更する。
10によるものと同様であるので、その説明を省略す
る。
ば、非音声信号のLPC係数に対して帯域幅拡張処理を
実行し、その処理後のLPC係数をLSP係数に変換
し、そのLSP係数に基づいて、非音声信号のLSP係
数の量子化に適したLSPサンプルをLSP量子化符号
帳7から符号帳サブセット7Aに抽出するようにしたの
で、音声信号のためのLSP量子化符号帳7を構成する
LSPサンプルのうち、適切なLSPサンプルを非音声
信号のためのものとして選択することができるという効
果が得られる。
の形態14による音声符号化装置の構成を示すブロック
図である。図において、141はLSP予備選択部10
1の前段に設けられた白色雑音重畳部であり、142は
LSP予備選択部101の前段に設けられた線形予測分
析部であり、143はLSP予備選択部101の前段に
設けられたLPC→LSP変換部である。なお、図23
におけるその他の構成要素については実施の形態10に
よるものと同様であるので、その説明を省略する。
態14による音声符号化装置では、入力信号が、線形予
測分析部1、音声/非音声信号識別器5、減算器16お
よび白色雑音重畳部141に供給され、白色雑音重畳部
141は、白色雑音重畳部81と同様にして、入力信号
に白色雑音を重畳し、白色雑音を重畳した入力信号を線
形予測分析部142に供給し、線形予測分析部142
は、線形予測分析部1と同様にして、その信号からLP
C係数を生成し、LPC→LSP変換部143に供給
し、LPC→LSP変換部143はそのLPC係数をL
SP係数に変換し、そのLSP係数をLSP予備選択部
101に供給する。LSP予備選択部101は、そのL
SP係数に基づいて符号帳サブセット7Aに含まれるL
SPサンプルを適応的に変更する。
10によるものと同様であるので、その説明を省略す
る。
ば、非音声信号に白色雑音を重畳し、白色雑音を重畳し
た入力信号からLPC係数を計算し、そのLPC係数を
LSP係数に変換し、そのLSP係数に基づいて、非音
声信号のLSP係数の量子化に適したLSPサンプルを
LSP量子化符号帳7から符号帳サブセット7Aに抽出
するようにしたので、音声信号のためのLSP量子化符
号帳7を構成するLSPサンプルのうち、適切なLSP
サンプルを非音声信号のためのものとして選択すること
ができるという効果が得られる。
の形態15による音声符号化装置の構成を示すブロック
図である。図において、18Aは、入力信号が非音声信
号である場合に、量子化歪が最小となる符号帳サブセッ
ト7AのLSPサンプルを探索し、そのLSPサンプル
に対応するLSP符号帳インデックスとともに、歪最小
化部18と同様にして量子化歪が最小となる場合の適応
符号帳インデックス、雑音符号帳インデックスおよび利
得符号帳インデックスを出力する歪最小化部(最適化手
段)である。なお、図24におけるその他の構成要素に
ついては実施の形態10によるものと同様であるので、
その説明を省略する。ただし、切替スイッチ4からのL
SP符号帳インデックスは多重化部19に直接供給され
ず、歪最小化部18Aに供給される。
8Aは、適応符号帳インデックス、雑音符号帳インデッ
クスおよび利得符号帳インデックスのそれぞれを順次変
更して、合成フィルタ10を駆動する励振信号を順次変
更させていくとともに、符号帳サブセット7Aに含まれ
るLSPサンプルのLSP符号帳インデックスをLSP
量子化部6Bから順次出力させていき、それらのLSP
符号帳インデックスに対応する複数のLPC係数を合成
フィルタ10へ供給させて、各LPC係数に基づくフィ
ルタ特性で合成フィルタ10に、その各励振信号につい
て音声信号の合成をさせる。
信号を減算し、両者の各誤差を聴覚重み付けフィルタ1
7に供給する。聴覚重み付けフィルタ17は、入力信号
の周波数分布に応じて適応的にフィルタ係数を調整し
て、音声信号の誤差に対してフィルタ処理を実行し、フ
ィルタ処理後の各誤差を歪みとして歪最小化部18Aに
供給する。
用されるLSPサンプル、適応符号帳11から出力され
る音程パラメータ、雑音符号帳12から出力される雑音
パラメータ、および利得符号帳15から出力される利得
パラメータを、その歪みの自乗が最小になるように繰り
返し選択していき、その歪みが最小になったときのLS
P符号帳インデックス、適応符号帳インデックス、雑音
符号帳インデックスおよび利得符号帳インデックスを多
重化部19に供給する。すなわち、歪最小化部18A
は、LSP符号帳インデックス、適応符号帳インデック
ス、雑音符号帳インデックスおよび利得符号帳インデッ
クスの4つを変数として、閉ループ探索法に基づいて最
適な符号語を選択している。
10によるものと同様であるので、その説明を省略す
る。なお、入力信号が音声信号である場合には、LSP
サンプルを含めた閉ループ探索は実行されず、LSP量
子化部6Aから切替スイッチ4を介して歪最小化部18
Aに供給されたLSP符号帳インデックスがそのまま多
重化部19へ供給される。
ば、LSP符号帳インデックス、適応符号帳インデック
ス、雑音符号帳インデックスおよび利得符号帳インデッ
クスの4つを変数として閉ループ探索法に基づいて、合
成される音声信号の歪みの少ない最適な符号語を選択す
るようにしたので、符号化による歪みをより少なくする
ことができるという効果が得られる。
の形態16による音声符号化装置の構成を示すブロック
図である。図において、151はLSP量子化部6Bに
設けられ、入力信号に対して合成フィルタ154の逆演
算(ただし、LPC係数は異なる)を実行する逆合成フ
ィルタであり、152はLSP量子化部6Bに設けら
れ、符号帳サブセット7Aより読み出したLSP符号帳
インデックスからLSP係数を計算するLSP逆量子化
部であり、153はLSP量子化部6Bに設けられたL
SP→LPC変換部であり、154はLSP量子化部6
Bに設けられた合成フィルタ10と同様の合成フィルタ
であり、155はLSP量子化部6Bに設けられた減算
器であり、156はLSP量子化部6Bに設けられ、入
力信号と合成フィルタ154により生成された音声信号
との誤差を最小にするLSPサンプルを探索し、そのL
SPサンプルに対応するLSP符号帳インデックスを出
力する歪最小化部である。
ついては実施の形態10によるものと同様であるので、
その説明を省略する。
態16による音声符号化装置における非音声信号用のL
SP量子化部6Bでは、逆合成フィルタ151は、例え
ば式(3)に示すような、線形予測分析部1より生成さ
れたLPC係数に基づくフィルタ特性で入力信号から線
形予測残差信号を生成し、励振信号の代わりに合成フィ
ルタ154に供給する。
サブセット7Aの有するLSPサンプルに対応するLS
P符号帳インデックスから、それに対応するLSP係数
を計算してLSP→LPC変換部153に供給し、LS
P→LPC変換部153はそのLSP係数をLPC係数
に変換し、そのLPC係数を合成フィルタ154に供給
する。
基づくフィルタ特性(例えば式(3)の逆関数)で、線
形予測残差信号から音声信号を生成して減算器155に
供給する。減算器155は、合成フィルタ154により
生成された音声信号と入力信号との誤差を歪みとして計
算して歪最小化部156に供給する。歪最小化部156
は、その歪みの自乗が最小になるように、符号化帳サブ
セット7Aの有するLSPサンプルを探索していき、歪
みの自乗が最小になったと判断したときのLSPサンプ
ルに対応するLSP符号帳インデックスを切替スイッチ
4へ出力する。
ルの探索の際、符号帳サブセット7AからLSP逆量子
化部152へ繰り返し異なるLSPサンプルのLSP符
号帳インデックスを供給させ、その都度、LSP逆量子
化部152およびLSP→LPC変換部153によりそ
れに対応するLPC係数が生成されて、合成フィルタ1
54により異なるフィルタ特性で音声信号が生成され
る。
10によるものと同様であるので、その説明を省略す
る。
ば、入力された非音声信号のLCP係数に基づくフィル
タ特性でその非音声信号に対して逆合成フィルタ処理を
実行し、それにより生成された信号に対して、符号帳サ
ブセット7Aの各LSPサンプルに対応する各LPC係
数に基づくフィルタ特性で合成フィルタ処理を実行して
音声信号を生成し、入力された非音声信号とその音声信
号との誤差が最小になるLSPサンプルを選択するよう
にしたので、非音声信号のLSP係数の量子化を適切に
実行することができるという効果が得られる。
の形態17による音声符号化装置の構成を示すブロック
図である。図において、161は入力信号からDTMF
信号を検出するDTMF検出器(第1の非音声信号検出
器)であり、162は合成フィルタ154により合成さ
れた音声信号からDTMF信号を検出するDTMF検出
器(第2の非音声信号検出器)であり、163はDTM
F検出器161の検出結果とDTMF検出器162の検
出結果とを比較し、両者が同一になるLSPサンプルを
符号帳サブセット7Aから選択する比較部である。な
お、図26におけるその他の構成要素については実施の
形態16によるものと同様であるので、その説明を省略
する。
態17による音声符号化装置における非音声信号用のL
SP量子化部6Bでは、DTMF検出器161は入力信
号からDTMF信号を検出し、そのDMTF信号に対応
するディジットを比較部163に通知し、DTMF検出
器162は、各LSP符号帳インデックスに対応したL
PC係数に基づくフィルタ特性で合成フィルタ154に
より合成された音声信号からDTMF信号を検出し、そ
のDMTF信号に対応するディジットを比較部163に
通知する。
ら通知されたディジットとDTMF検出器162から通
知されたディジットが同一になるまで、符号帳サブセッ
ト7Aにおける異なるLSPサンプルを順次LSP逆量
子化部152に供給させ、両者が同一になったときのL
SPサンプルのLSP符号帳インデックスを切替スイッ
チ4へ出力する。
16によるものと同様であるので、その説明を省略す
る。ただし、符号帳サブセット7Aの有するLSPサン
プルによっては複数の候補が選択される可能性もあるた
め、その場合には、実施の形態16の場合と同様にし
て、それらのうちの、歪みが最小のものを選択するよう
にしてもよい。
F信号を検出するようにしているが、他の非音声信号に
ついても同様である。
ば、入力された非音声信号の種類を検出し、合成した音
声信号から同じ種類の非音声信号の検出されるLSPサ
ンプルを符号帳サブセット7Aから選択するようにした
ので、量子化歪を低減しつつ、非音声信号のLSP係数
の量子化に要する時間を低減することができるという効
果が得られる。
おいて、非音声信号のLSP量子化部6Bの前段に、実
施の形態1から実施の形態8のように、LSP係数補正
部3、帯域幅拡張部61、白色雑音重畳部81などを設
けるようにしてもよい。
号化方式の一例としてCS−ACELP方式を適用して
いるが、他の音声符号化方式を適用するようにしてもよ
い。
信号の周波数スペクトルの特徴を示す周波数パラメータ
を生成し、入力信号が非音声信号である場合、その周波
数パラメータを補正し、同一の量子化符号帳を参照し
て、音声信号または非音声信号である入力信号の周波数
パラメータに対応する符号語を選択するように構成した
ので、音声信号の場合と共通の量子化符号帳を使用しつ
つ、各非音声信号の周波数パラメータを量子化する際の
量子化歪をより低減することができ、音声信号伝送時と
非音声信号伝送時とで共通のビットシーケンスを使用で
き、受信側の音声復号装置を変更することなく、DTM
F信号などの非音声信号をインチャネルで良好に伝送す
ることができるという効果がある。
らず非音声信号であると誤って判定された場合における
音声品質の劣化を低減することができ、ある程度の音声
伝送品質が維持されて通話中に耳触りな音声になる可能
性を低減することができるという効果がある。ひいて
は、簡単な構成でそのような効果が得られ、装置のコス
トを低減することができるという効果がある。
て、入力信号が音声信号である場合に、音声信号の周波
数スペクトルの特性に基づいて入力信号の符号語を選択
し、同一の量子化符号帳を参照して、入力信号が非音声
信号である場合に、非音声信号の周波数スペクトルの特
性に基づいて入力信号の符号語を選択するように構成し
たので、音声信号の場合と共通の量子化符号帳を使用し
つつ、非音声信号の周波数パラメータを量子化する際の
量子化歪を低減することができるという効果がある。
号を検出する非音声信号検出器を備え、入力信号が非音
声信号である場合、周波数パラメータ生成手段が、非音
声信号検出器により検出された非音声信号の種類に応じ
て入力信号の周波数パラメータを生成するように構成し
たので、音声信号の場合と共通の量子化符号帳を使用し
つつ、各種類の非音声信号の周波数パラメータを量子化
する際の量子化歪をより低減することができるという効
果がある。
である場合、周波数パラメータ生成手段が、異なる補間
特性で複数の周波数パラメータを生成し、量子化手段
が、複数の周波数パラメータにそれぞれ対応する複数の
符号語を選択し、選択手段が、量子化手段により選択さ
れた複数の符号語のうち量子化歪が最小である符号語を
入力信号の符号語として選択するように構成したので、
量子化歪の少ない、かつスペクトル概形の崩れていない
符号語が選択され、良好に非音声信号の周波数パラメー
タを量子化することができるという効果がある。
である場合、周波数パラメータ生成手段が、異なる特性
で帯域幅拡張処理を実行して複数の周波数パラメータを
生成し、量子化手段が、複数の周波数パラメータにそれ
ぞれ対応する複数の符号語を選択し、選択手段が、量子
化手段により選択された複数の符号語のうち量子化歪が
最小である符号語を入力信号の符号語として選択するよ
うに構成したので、量子化歪の少ない、かつスペクトル
概形の崩れていない符号語が選択され、良好に非音声信
号の周波数パラメータを量子化することができるという
効果がある。
である場合、周波数パラメータ生成手段が、異なるレベ
ルの白色雑音を重畳して複数の周波数パラメータを生成
し、量子化手段が、複数の周波数パラメータにそれぞれ
対応する複数の符号語を選択し、選択手段が、量子化手
段により選択された複数の符号語のうち量子化歪が最小
である符号語を入力信号の符号語として選択するように
構成したので、量子化歪の少ない、かつスペクトル概形
の崩れていない符号語が選択され、良好に非音声信号の
周波数パラメータを量子化することができるという効果
がある。
である場合、周波数パラメータ生成手段が、補正処理、
帯域幅拡張処理および白色雑音重畳処理のいずれかを実
行して複数の周波数パラメータを生成し、量子化手段
が、複数の周波数パラメータにそれぞれ対応する複数の
符号語を選択し、選択手段が、量子化手段により選択さ
れた複数の符号語のうち量子化歪が最小である符号語を
入力信号の符号語として選択するように構成したので、
量子化歪の少ない、かつスペクトル概形の崩れていない
符号語が選択され、良好に非音声信号の周波数パラメー
タを量子化することができるという効果がある。
クトルの特徴を示す周波数パラメータを生成し、入力信
号が音声信号である場合、所定の量子化符号帳を参照し
て入力信号の周波数パラメータに対応する符号語を選択
し、入力信号が非音声信号である場合、量子化符号帳の
有する符号語のサブセットを参照して入力信号の周波数
パラメータに対応する符号語を選択するように構成した
ので、音声信号伝送時と非音声信号伝送時とで共通のビ
ットシーケンスを使用でき、受信側の音声復号装置を変
更することなく、DTMF信号などの非音声信号をイン
チャネルで良好に伝送することができるという効果があ
る。
である場合、その非音声信号の量子化歪に基づいて、符
号語のサブセットを適応的に選択するように構成したの
で、符号語のサブセットを構成する符号語が適応的に変
化していき、より非音声信号に適した符号語に代替され
ていくという効果がある。
号を検出する非音声信号検出器を備え、量子化手段が、
量子化符号帳の有する符号語の複数のサブセットのう
ち、非音声信号検出器により検出された非音声信号の種
類に応じたサブセットを参照して入力信号が非音声信号
である場合の周波数パラメータに対応する符号語を選択
するように構成したので、より良好に、各種類の非音声
信号をインチャネルで伝送することができるという効果
がある。
メータと白色雑音の周波数パラメータとの間を補間して
周波数パラメータを生成し、生成したその周波数パラメ
ータを量子化して、そのときの量子化歪に基づいてサブ
セットの符号語を選択するように構成したので、音声信
号のための量子化符号帳を構成する符号語のうち、適切
な符号語を非音声信号のためのものとしてサブセットへ
選択することができるという効果がある。
係数を計算し、線形予測係数に対して帯域幅拡張処理を
実行し、帯域幅拡張処理後の線形予測係数から周波数パ
ラメータとして線スペクトル対係数を生成し、生成され
たその周波数パラメータを量子化して、そのときの量子
化歪に基づいてサブセットの符号語を選択するように構
成したので、音声信号のための量子化符号帳を構成する
符号語のうち、適切な符号語を非音声信号のためのもの
としてサブセットへ選択することができるという効果が
ある。
重畳し、白色雑音を重畳した入力信号から周波数パラメ
ータを生成し、生成したその周波数パラメータを量子化
して、そのときの量子化歪に基づいてサブセットの符号
語を選択するように構成したので、音声信号のための量
子化符号帳を構成する符号語のうち、適切な符号語を非
音声信号のためのものとしてサブセットへ選択すること
ができるという効果がある。
係数を計算する線形予測分析部と、線形予測係数を周波
数パラメータとしての線スペクトル対係数に変換するL
PC→LSP変換部とを周波数パラメータ生成手段に有
し、また、入力信号が非音声信号である場合、入力信号
に対して線形予測係数に基づくフィルタ特性で逆合成フ
ィルタ処理を実行する逆合成フィルタと、入力信号が非
音声信号である場合、符号語のサブセットのうちのいず
れかの符号語を逆量子化して線スペクトル対係数を生成
するLSP逆量子化部と、LSP逆量子化部により生成
された線スペクトル対係数を線形予測係数に変換するL
SP→LPC変換部と、逆合成フィルタにより生成され
た信号に対して、LSP→LPC変換部により変換され
た線形予測係数に基づくフィルタ特性で合成フィルタ処
理を実行する合成フィルタと、入力信号が非音声信号で
ある場合、合成フィルタにより合成された音声信号と入
力信号との誤差に基づいて量子化歪が最小な符号語を選
択する歪最小化部とを量子化手段に有するようにしたの
で、非音声信号の周波数パラメータの量子化を適切に実
行することができるという効果がある。
係数を計算する線形予測分析部と、線形予測係数を周波
数パラメータとしての線スペクトル対係数に変換するL
PC→LSP変換部とを周波数パラメータ生成手段に有
し、また、入力信号が非音声信号である場合、入力信号
に対して線形予測係数に基づくフィルタ特性で逆合成フ
ィルタ処理を実行する逆合成フィルタと、入力信号が非
音声信号である場合、符号語のサブセットのうちのいず
れかの符号語を逆量子化して線スペクトル対係数を生成
するLSP逆量子化部と、LSP逆量子化部により生成
された線スペクトル対係数を線形予測係数に変換するL
SP→LPC変換部と、逆合成フィルタにより生成され
た信号に対して、LSP→LPC変換部により変換され
た線形予測係数に基づくフィルタ特性で合成フィルタ処
理を実行する合成フィルタと、入力信号から非音声信号
を検出する第1の非音声信号検出手段と、合成フィルタ
により合成された音声信号から非音声信号を検出する第
2の非音声信号検出手段と、第1の非音声信号検出手段
により検出された非音声信号の種類と第2の非音声信号
検出手段により検出された非音声信号の種類とが同一で
ある符号語を選択する比較部とを量子化手段に有するよ
うに構成したので、量子化歪を低減しつつ、非音声信号
の周波数パラメータの量子化に要する時間を低減するこ
とができるという効果がある。
れた符号語から復号した信号と入力信号とを比較して、
最適な符号語を閉ループ探索法に基づいて選択させるよ
うに構成したので、符号化による歪みのより少なくする
ことができるという効果がある。
置の構成を示すブロック図である。
す図である。
係数との関係を示す図である。
ペクトルと「う」についての一般的な男性の音声の周波
数スペクトルとを示す図である。
のLSP係数の分布の一例を示す図である。
置の構成を示すブロック図である。
P量子化部の構成を示すブロック図である。
置の構成を示すブロック図である。
F信号のLSP係数と補正後のLSP係数との関係の一
例を示す図である。
装置の構成を示すブロック図である。
なる補正後のLSP係数との対応関係の一例を示す図で
ある。
装置の構成を示すブロック図である。
装置の構成を示すブロック図である。
装置の他の構成を示すブロック図である。
装置の構成を示すブロック図である。
装置の構成を示すブロック図である。
装置の構成を示すブロック図である。
SP量子化符号帳におけるLSPサンプルとの対応関係
の一例を示す図である。
化装置の構成を示すブロック図である。
化装置の構成を示すブロック図である。
化装置の構成を示すブロック図である。
化装置の構成を示すブロック図である。
化装置の構成を示すブロック図である。
化装置の構成を示すブロック図である。
化装置の構成を示すブロック図である。
化装置の構成を示すブロック図である。
用した第1の従来の音声符号化装置の構成例を示すブロ
ック図である。
化符号帳の構成例を示すブロック図である。
ク図である。
ク図である。
れた符号を復号する音声復号装置である。
LSP量子化部(量子化手段)、6A LSP量子化部
(量子化手段、第1の量子化部)、6B,6B−1〜6
B−4 LSP量子化部(量子化手段、第2の量子化
部)、7 LSP量子化符号帳(量子化符号帳)、7A
符号帳サブセット(符号語のサブセット)、18A
歪最小化部(最適化手段)、41 DTMF検出器(非
音声信号検出器)、52,91 選択部(選択手段)、
101 LSP予備選択部(符号語選択手段)、151
逆合成フィルタ、152 LSP逆量子化部、153
LSP→LPC変換部、154 合成フィルタ、15
6 歪最小化部、161 DTMF検出器(第1の非音
声信号検出器)、162 DTMF検出器(第2の非音
声信号検出器)、163 比較部、181 周波数パラ
メータ生成手段、182 第2の周波数パラメータ生成
手段。
Claims (25)
- 【請求項1】 音声帯域の入力信号を符号化する音声符
号化装置において、 前記入力信号の周波数スペクトルの特徴を示す周波数パ
ラメータを生成し、前記入力信号が非音声信号である場
合、前記周波数パラメータを補正する周波数パラメータ
生成手段と、 所定の数の周波数パラメータの符号語を記憶する量子化
符号帳と、 同一の前記量子化符号帳を参照して、音声信号または非
音声信号である前記入力信号の周波数パラメータに対応
する前記符号語を選択する量子化手段とを備えることを
特徴とする音声符号化装置。 - 【請求項2】 周波数パラメータは、線スペクトル対係
数であることを特徴とする請求項1記載の音声符号化装
置。 - 【請求項3】 周波数パラメータ生成手段は、入力信号
が非音声信号である場合、前記入力信号の周波数パラメ
ータと白色雑音の周波数パラメータとの間を補間して、
補間した周波数パラメータへ、前記入力信号の周波数パ
ラメータを補正することを特徴とする請求項1または請
求項2記載の音声符号化装置。 - 【請求項4】 周波数パラメータ生成手段は、入力信号
が非音声信号である場合、前記入力信号から線形予測係
数を計算し、前記線形予測係数に対して帯域幅拡張処理
を実行し、前記帯域幅拡張処理を実行した前記線形予測
係数から周波数パラメータとして線スペクトル対係数を
生成することを特徴とする請求項1記載の音声符号化装
置。 - 【請求項5】 周波数パラメータ生成手段は、入力信号
が非音声信号である場合、前記入力信号に白色雑音を重
畳することを特徴とする請求項1または請求項2記載の
音声符号化装置。 - 【請求項6】 量子化手段は、量子化符号帳を参照し
て、入力信号が音声信号である場合に、音声信号の周波
数スペクトルの特性に基づいて前記入力信号の符号語を
選択する第1の量子化部と、同一の前記量子化符号帳を
参照して、前記入力信号が非音声信号である場合に、非
音声信号の周波数スペクトルの特性に基づいて前記入力
信号の符号語を選択する第2の量子化部とを有すること
を特徴とする請求項1記載の音声符号化装置。 - 【請求項7】 入力信号から非音声信号を検出する非音
声信号検出器を備え、 周波数パラメータ生成手段は、前記入力信号が非音声信
号である場合、前記非音声信号検出器により検出された
非音声信号の種類に応じて前記入力信号の周波数パラメ
ータを生成することを特徴とする請求項1記載の音声符
号化装置。 - 【請求項8】 複数の符号語のうち量子化歪が最小であ
る符号語を選択する選択手段を備え、 周波数パラメータ生成手段は、入力信号が非音声信号で
ある場合、異なる補間特性で複数の周波数パラメータを
生成し、 量子化手段は、前記複数の周波数パラメータにそれぞれ
対応する複数の符号語を選択し、 前記選択手段は、前記量子化手段により選択された複数
の符号語のうち量子化歪が最小である符号語を前記入力
信号の符号語として選択することを特徴とする請求項3
記載の音声符号化装置。 - 【請求項9】 複数の符号語のうち量子化歪が最小であ
る符号語を選択する選択手段を備え、 周波数パラメータ生成手段は、入力信号が非音声信号で
ある場合、異なる特性で帯域幅拡張処理を実行して複数
の周波数パラメータを生成し、 量子化手段は、前記複数の周波数パラメータにそれぞれ
対応する複数の符号語を選択し、 前記選択手段は、前記量子化手段により選択された複数
の符号語のうち量子化歪が最小である符号語を前記入力
信号の符号語として選択することを特徴とする請求項4
記載の音声符号化装置。 - 【請求項10】 複数の符号語のうち量子化歪が最小で
ある符号語を選択する選択手段を備え、 周波数パラメータ生成手段は、入力信号が非音声信号で
ある場合、異なるレベルの白色雑音を重畳して複数の周
波数パラメータを生成し、 量子化手段は、前記複数の周波数パラメータにそれぞれ
対応する複数の符号語を選択し、 前記選択手段は、前記量子化手段により選択された複数
の符号語のうち量子化歪が最小である符号語を前記入力
信号の符号語として選択することを特徴とする請求項5
記載の音声符号化装置。 - 【請求項11】 複数の符号語のうち量子化歪が最小で
ある符号語を選択する選択手段を備え、 周波数パラメータ生成手段は、入力信号が非音声信号で
ある場合、補正処理、帯域幅拡張処理および白色雑音重
畳処理のいずれかを実行して複数の周波数パラメータを
生成し、 量子化手段は、前記複数の周波数パラメータにそれぞれ
対応する複数の符号語を選択し、 前記選択手段は、前記量子化手段により選択された複数
の符号語のうち量子化歪が最小である符号語を前記入力
信号の符号語として選択することを特徴とする請求項1
または請求項2記載の音声符号化装置。 - 【請求項12】 音声帯域の入力信号を符号化する音声
符号化方法において、 前記入力信号の周波数スペクトルの特徴を示す周波数パ
ラメータを生成し、前記入力信号が非音声信号である場
合、前記周波数パラメータを音声信号の周波数パラメー
タに近づけて生成するステップと、 同一の量子化符号帳を参照して、音声信号または非音声
信号である前記入力信号の周波数パラメータに対応する
符号語を選択するステップとを備えることを特徴とする
音声符号化方法。 - 【請求項13】 音声帯域の入力信号を符号化する音声
符号化装置において、 前記入力信号の周波数スペクトルの特徴を示す周波数パ
ラメータを生成する周波数パラメータ生成手段と、 所定の数の周波数パラメータの符号語を記憶する量子化
符号帳と、 前記入力信号が音声信号である場合、前記量子化符号帳
を参照して前記入力信号の周波数パラメータに対応する
前記符号語を選択し、前記入力信号が非音声信号である
場合、前記量子化符号帳の有する符号語のサブセットを
参照して前記入力信号の周波数パラメータに対応する前
記符号語を選択する量子化手段とを備えることを特徴と
する音声符号化装置。 - 【請求項14】 周波数パラメータは、線スペクトル対
係数であることを特徴とする請求項13記載の音声符号
化装置。 - 【請求項15】 符号語のサブセットは、量子化符号帳
の有する符号語のうち、非音声信号の周波数パラメータ
を量子化する際の量子化歪の少ない符号語で構成される
ことを特徴とする請求項13または請求項14記載の音
声符号化装置。 - 【請求項16】 入力信号が非音声信号である場合、そ
の非音声信号の量子化歪に基づいて、符号語のサブセッ
トを適応的に選択する符号語選択手段を備えることを特
徴とする請求項13から請求項15のうちのいずれか1
項記載の音声符号化装置。 - 【請求項17】 入力信号から非音声信号を検出する非
音声信号検出器を備え、 量子化手段は、量子化符号帳の有する符号語の複数のサ
ブセットのうち、前記非音声信号検出器により検出され
た非音声信号の種類に応じた前記サブセットを参照して
前記入力信号が非音声信号である場合の周波数パラメー
タに対応する符号語を選択することを特徴とする請求項
13記載の音声符号化装置。 - 【請求項18】 量子化符号帳の有する符号語の複数の
サブセットのそれぞれは、1つまたは複数の種類の非音
声信号の周波数パラメータを量子化する際の量子化歪の
少ない符号語で構成されることを特徴とする請求項17
記載の音声符号化装置。 - 【請求項19】 入力信号の周波数パラメータと白色雑
音の周波数パラメータとの間を補間して周波数パラメー
タを生成する第2の周波数パラメータ生成手段を備え、 符号語選択手段は、前記第2の周波数パラメータ生成手
段により生成された周波数パラメータを量子化して、そ
のときの量子化歪に基づいてサブセットの符号語を選択
することを特徴とする請求項16記載の音声符号化装
置。 - 【請求項20】 入力信号から線形予測係数を計算し、
前記線形予測係数に対して帯域幅拡張処理を実行し、前
記帯域幅拡張処理後の前記線形予測係数から周波数パラ
メータとして線スペクトル対係数を生成する第2の周波
数パラメータ生成手段を備え、 符号語選択手段は、前記第2の周波数パラメータ生成手
段により生成された周波数パラメータを量子化して、そ
のときの量子化歪に基づいてサブセットの符号語を選択
することを特徴とする請求項16記載の音声符号化装
置。 - 【請求項21】 入力信号に白色雑音を重畳し、白色雑
音を重畳した入力信号から周波数パラメータを生成する
第2の周波数パラメータ生成手段を備え、 符号語選択手段は、前記第2の周波数パラメータ生成手
段により生成された周波数パラメータを量子化して、そ
のときの量子化歪に基づいてサブセットの符号語を選択
することを特徴とする請求項16記載の音声符号化装
置。 - 【請求項22】 周波数パラメータ生成手段は、入力信
号から線形予測係数を計算する線形予測分析部と、前記
線形予測係数を周波数パラメータとしての線スペクトル
対係数に変換するLPC→LSP変換部とを有し、 量子化手段は、前記入力信号が非音声信号である場合、
前記入力信号に対して前記線形予測係数に基づくフィル
タ特性で逆合成フィルタ処理を実行する逆合成フィルタ
と、入力信号が非音声信号である場合、符号語のサブセ
ットのうちのいずれかの符号語を逆量子化して線スペク
トル対係数を生成するLSP逆量子化部と、前記LSP
逆量子化部により生成された線スペクトル対係数を線形
予測係数に変換するLSP→LPC変換部と、前記逆合
成フィルタにより生成された信号に対して、前記LSP
→LPC変換部により変換された前記線形予測係数に基
づくフィルタ特性で合成フィルタ処理を実行する合成フ
ィルタと、前記入力信号が非音声信号である場合、前記
合成フィルタにより合成された音声信号と前記入力信号
との誤差に基づいて量子化歪が最小な前記符号語を選択
する歪最小化部とを有することを特徴とする請求項13
記載の音声符号化装置。 - 【請求項23】 周波数パラメータ生成手段は、入力信
号から線形予測係数を計算する線形予測分析部と、前記
線形予測係数を周波数パラメータとしての線スペクトル
対係数に変換するLPC→LSP変換部とを有し、 量子化手段は、前記入力信号が非音声信号である場合、
前記入力信号に対して前記線形予測係数に基づくフィル
タ特性で逆合成フィルタ処理を実行する逆合成フィルタ
と、前記入力信号が非音声信号である場合、符号語のサ
ブセットのうちのいずれかの符号語を逆量子化して線ス
ペクトル対係数を生成するLSP逆量子化部と、前記L
SP逆量子化部により生成された線スペクトル対係数を
線形予測係数に変換するLSP→LPC変換部と、前記
逆合成フィルタにより生成された信号に対して、前記L
SP→LPC変換部により変換された前記線形予測係数
に基づくフィルタ特性で合成フィルタ処理を実行する合
成フィルタと、前記入力信号から非音声信号を検出する
第1の非音声信号検出手段と、前記合成フィルタにより
合成された音声信号から非音声信号を検出する第2の非
音声信号検出手段と、前記第1の非音声信号検出手段に
より検出された非音声信号の種類と前記第2の非音声信
号検出手段により検出された非音声信号の種類とが同一
である前記符号語を選択する比較部とを有することを特
徴とする請求項13記載の音声符号化装置。 - 【請求項24】 量子化手段により選択された符号語か
ら復号した信号と入力信号とを比較して、前記量子化手
段に最適な符号語を閉ループ探索法に基づいて選択させ
る最適化手段を備えることを特徴とする請求項13記載
の音声符号化装置。 - 【請求項25】 音声帯域の入力信号を符号化する音声
符号化方法において、 前記入力信号の周波数スペクトルの特徴を示す周波数パ
ラメータを生成するステップと、 前記入力信号が音声信号である場合、所定の量子化符号
帳を参照して前記入力信号の周波数パラメータに対応す
る符号語を選択し、前記入力信号が非音声信号である場
合、前記量子化符号帳の有する符号語のサブセットを参
照して前記入力信号の周波数パラメータに対応する前記
符号語を選択するステップとを備えることを特徴とする
音声符号化方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000243114A JP2002055699A (ja) | 2000-08-10 | 2000-08-10 | 音声符号化装置および音声符号化方法 |
IL14439901A IL144399A0 (en) | 2000-08-10 | 2001-07-18 | Speech coding apparatus capable of implementing acceptable in-channel transmission of non-speech signals |
EP01117829A EP1179820A3 (en) | 2000-08-10 | 2001-07-23 | Method of coding LSP coefficients during speech inactivity |
US09/916,534 US7031912B2 (en) | 2000-08-10 | 2001-07-30 | Speech coding apparatus capable of implementing acceptable in-channel transmission of non-speech signals |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000243114A JP2002055699A (ja) | 2000-08-10 | 2000-08-10 | 音声符号化装置および音声符号化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002055699A true JP2002055699A (ja) | 2002-02-20 |
Family
ID=18734024
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000243114A Pending JP2002055699A (ja) | 2000-08-10 | 2000-08-10 | 音声符号化装置および音声符号化方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7031912B2 (ja) |
EP (1) | EP1179820A3 (ja) |
JP (1) | JP2002055699A (ja) |
IL (1) | IL144399A0 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110875048A (zh) * | 2014-05-01 | 2020-03-10 | 日本电信电话株式会社 | 编码装置、及其方法、记录介质、程序 |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7248259B2 (en) * | 2001-12-12 | 2007-07-24 | Technoguide As | Three dimensional geological model construction |
JP4433668B2 (ja) * | 2002-10-31 | 2010-03-17 | 日本電気株式会社 | 帯域拡張装置及び方法 |
US7486719B2 (en) * | 2002-10-31 | 2009-02-03 | Nec Corporation | Transcoder and code conversion method |
US8229749B2 (en) * | 2004-12-10 | 2012-07-24 | Panasonic Corporation | Wide-band encoding device, wide-band LSP prediction device, band scalable encoding device, wide-band encoding method |
US8219391B2 (en) * | 2005-02-15 | 2012-07-10 | Raytheon Bbn Technologies Corp. | Speech analyzing system with speech codebook |
WO2006089055A1 (en) * | 2005-02-15 | 2006-08-24 | Bbn Technologies Corp. | Speech analyzing system with adaptive noise codebook |
WO2006107833A1 (en) * | 2005-04-01 | 2006-10-12 | Qualcomm Incorporated | Method and apparatus for vector quantizing of a spectral envelope representation |
US9043214B2 (en) | 2005-04-22 | 2015-05-26 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor attenuation |
US8280730B2 (en) * | 2005-05-25 | 2012-10-02 | Motorola Mobility Llc | Method and apparatus of increasing speech intelligibility in noisy environments |
US7602902B2 (en) * | 2005-10-14 | 2009-10-13 | Honeywell International Inc. | Method and apparatus for decoding DTMF tones |
US7864717B2 (en) * | 2006-01-09 | 2011-01-04 | Flextronics Automotive Inc. | Modem for communicating data over a voice channel of a communications system |
US7831420B2 (en) * | 2006-04-04 | 2010-11-09 | Qualcomm Incorporated | Voice modifier for speech processing systems |
US20070270987A1 (en) * | 2006-05-18 | 2007-11-22 | Sharp Kabushiki Kaisha | Signal processing method, signal processing apparatus and recording medium |
US7930173B2 (en) * | 2006-06-19 | 2011-04-19 | Sharp Kabushiki Kaisha | Signal processing method, signal processing apparatus and recording medium |
US7961640B2 (en) * | 2006-10-26 | 2011-06-14 | Qualcomm Incorporated | Method and apparatus for codebook exchange in a multiple access wireless communication system |
US8199735B2 (en) | 2006-12-12 | 2012-06-12 | Google Inc. | Method, system and apparatus for the control of transmit diversity |
US8688437B2 (en) | 2006-12-26 | 2014-04-01 | Huawei Technologies Co., Ltd. | Packet loss concealment for speech coding |
US8369799B2 (en) * | 2007-10-25 | 2013-02-05 | Echostar Technologies L.L.C. | Apparatus, systems and methods to communicate received commands from a receiving device to a mobile device |
US8867571B2 (en) | 2008-03-31 | 2014-10-21 | Echostar Technologies L.L.C. | Systems, methods and apparatus for transmitting data over a voice channel of a wireless telephone network |
US8717971B2 (en) * | 2008-03-31 | 2014-05-06 | Echostar Technologies L.L.C. | Systems, methods and apparatus for transmitting data over a voice channel of a wireless telephone network using multiple frequency shift-keying modulation |
US8200482B2 (en) * | 2008-03-31 | 2012-06-12 | Echostar Technologies L.L.C. | Systems, methods and apparatus for transmitting data over a voice channel of a telephone network using linear predictive coding based modulation |
FR2933258B1 (fr) * | 2008-06-27 | 2010-06-11 | Alcatel Lucent | Procede et dispositif de traitement de donnees numeriques representatives de signaux audio dans un systeme de reception |
CA2729751C (en) * | 2008-07-10 | 2017-10-24 | Voiceage Corporation | Device and method for quantizing and inverse quantizing lpc filters in a super-frame |
US8340656B2 (en) * | 2009-10-07 | 2012-12-25 | Echostar Technologies L.L.C. | Systems and methods for synchronizing data transmission over a voice channel of a telephone network |
CN104143336B (zh) * | 2013-05-29 | 2015-12-02 | 腾讯科技(深圳)有限公司 | 一种获取语音信号的平滑谱的方法和装置 |
CN104078047B (zh) * | 2014-06-21 | 2017-06-06 | 西安邮电大学 | 基于语音多带激励编码lsp参数的量子压缩方法 |
KR101996307B1 (ko) * | 2015-01-30 | 2019-07-04 | 니폰 덴신 덴와 가부시끼가이샤 | 부호화 장치, 복호 장치, 이들의 방법, 프로그램 및 기록 매체 |
US11308152B2 (en) * | 2018-06-07 | 2022-04-19 | Canon Kabushiki Kaisha | Quantization method for feature vector, search method, apparatus and storage medium |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5853352B2 (ja) * | 1979-10-03 | 1983-11-29 | 日本電信電話株式会社 | 音声合成器 |
US6230255B1 (en) * | 1990-07-06 | 2001-05-08 | Advanced Micro Devices, Inc. | Communications processor for voice band telecommunications |
JP2993396B2 (ja) * | 1995-05-12 | 1999-12-20 | 三菱電機株式会社 | 音声加工フィルタ及び音声合成装置 |
CA2258183A1 (en) * | 1996-07-17 | 1998-01-29 | Universite De Sherbrooke | Enhanced encoding of dtmf and other signalling tones |
US5835480A (en) * | 1996-10-15 | 1998-11-10 | Chennakeshu; Sandeep | Circuitry and method for simultaneously transmitting voice and data information |
US6708146B1 (en) * | 1997-01-03 | 2004-03-16 | Telecommunications Research Laboratories | Voiceband signal classifier |
US5913189A (en) * | 1997-02-12 | 1999-06-15 | Hughes Electronics Corporation | Voice compression system having robust in-band tone signaling and related method |
US6208959B1 (en) * | 1997-12-15 | 2001-03-27 | Telefonaktibolaget Lm Ericsson (Publ) | Mapping of digital data symbols onto one or more formant frequencies for transmission over a coded voice channel |
IL129752A (en) * | 1999-05-04 | 2003-01-12 | Eci Telecom Ltd | Telecommunication method and system for using same |
EP1577488B8 (en) | 2004-03-18 | 2009-02-18 | Services Petroliers Schlumberger | Borehole tool |
-
2000
- 2000-08-10 JP JP2000243114A patent/JP2002055699A/ja active Pending
-
2001
- 2001-07-18 IL IL14439901A patent/IL144399A0/xx unknown
- 2001-07-23 EP EP01117829A patent/EP1179820A3/en not_active Withdrawn
- 2001-07-30 US US09/916,534 patent/US7031912B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110875048A (zh) * | 2014-05-01 | 2020-03-10 | 日本电信电话株式会社 | 编码装置、及其方法、记录介质、程序 |
Also Published As
Publication number | Publication date |
---|---|
EP1179820A2 (en) | 2002-02-13 |
EP1179820A3 (en) | 2003-11-12 |
US7031912B2 (en) | 2006-04-18 |
IL144399A0 (en) | 2002-05-23 |
US20020038210A1 (en) | 2002-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2002055699A (ja) | 音声符号化装置および音声符号化方法 | |
JP5343098B2 (ja) | スーパーフレーム構造のlpcハーモニックボコーダ | |
JP2964344B2 (ja) | 符号化/復号化装置 | |
EP1157375B1 (en) | Celp transcoding | |
US7577567B2 (en) | Multimode speech coding apparatus and decoding apparatus | |
US6334105B1 (en) | Multimode speech encoder and decoder apparatuses | |
KR100798668B1 (ko) | 무성 음성의 코딩 방법 및 장치 | |
KR100351484B1 (ko) | 음성 부호화 장치, 음성 복호화 장치, 음성 부호화 방법 및 기록 매체 | |
KR100218214B1 (ko) | 음성 부호화 장치 및 음성 부호화 복호화 장치 | |
US20040111257A1 (en) | Transcoding apparatus and method between CELP-based codecs using bandwidth extension | |
AU727706B2 (en) | Repetitive sound compression system | |
US7684978B2 (en) | Apparatus and method for transcoding between CELP type codecs having different bandwidths | |
WO1997015046A9 (en) | Repetitive sound compression system | |
CA2440820A1 (en) | Sound encoding apparatus and method, and sound decoding apparatus and method | |
JP2000308167A (ja) | 音声符号化装置 | |
JP3475772B2 (ja) | 音声符号化装置および音声復号装置 | |
KR0155798B1 (ko) | 음성신호 부호화 및 복호화 방법 | |
JP3232728B2 (ja) | 音声符号化方法 | |
AU767779B2 (en) | Repetitive sound compression system | |
JPH0786952A (ja) | 音声の予測符号化方法 | |
JP4230550B2 (ja) | 音声符号化方法及び装置、並びに音声復号化方法及び装置 | |
JP2004053676A (ja) | 音声符号化装置および復号装置 | |
CA2235275C (en) | Repetitive sound compression system | |
JPH01258000A (ja) | 音声信号符号化復号化方法並びに音声信号符号化装置及び音声信号復号化装置 | |
JPH01293399A (ja) | 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041104 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20061115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061226 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070223 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20071114 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20071114 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20071114 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080715 |