JP2006191316A - 音声信号処理装置 - Google Patents
音声信号処理装置 Download PDFInfo
- Publication number
- JP2006191316A JP2006191316A JP2005000936A JP2005000936A JP2006191316A JP 2006191316 A JP2006191316 A JP 2006191316A JP 2005000936 A JP2005000936 A JP 2005000936A JP 2005000936 A JP2005000936 A JP 2005000936A JP 2006191316 A JP2006191316 A JP 2006191316A
- Authority
- JP
- Japan
- Prior art keywords
- value
- logarithmic
- approximate
- gain
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 claims abstract description 109
- 230000009466 transformation Effects 0.000 claims abstract description 3
- 238000006243 chemical reaction Methods 0.000 claims description 36
- 230000005236 sound signal Effects 0.000 claims description 11
- 230000001629 suppression Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 abstract description 22
- 230000006835 compression Effects 0.000 abstract description 22
- 238000007906 compression Methods 0.000 abstract description 22
- 230000006870 function Effects 0.000 abstract description 17
- 238000000034 method Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 10
- 238000001514 detection method Methods 0.000 description 7
- 238000013139 quantization Methods 0.000 description 5
- 108010014173 Factor X Proteins 0.000 description 4
- 230000006837 decompression Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007430 reference method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
【課題】 本発明は、対数圧縮・伸張を行なう音声処理装置において、更に多様な信号処理機能の付加を効率的に実現することができる装置を提供する。
【解決手段】 μLaw圧縮入力があった場合、近似対数変換処理を実行する。この処理は、まず、μLaw圧縮値のビット反転を実行し、次にMSBを「0」に設定することにより、近似μlog 値を算出する。このように変換された近似μlog 値に対して各種基本計算を実行する。この近似μlog 値においては、線形値の乗算処理は加算処理、除算は減算処理、線形値の2乗処理は1ビット右シフト、平方根処理は1ビットの左シフト、線形値の2倍は「16」を加えることにより算出する。そして、その結果を出力することにより、μLaw圧縮出力を得る。
【選択図】 図1
【解決手段】 μLaw圧縮入力があった場合、近似対数変換処理を実行する。この処理は、まず、μLaw圧縮値のビット反転を実行し、次にMSBを「0」に設定することにより、近似μlog 値を算出する。このように変換された近似μlog 値に対して各種基本計算を実行する。この近似μlog 値においては、線形値の乗算処理は加算処理、除算は減算処理、線形値の2乗処理は1ビット右シフト、平方根処理は1ビットの左シフト、線形値の2倍は「16」を加えることにより算出する。そして、その結果を出力することにより、μLaw圧縮出力を得る。
【選択図】 図1
Description
本発明は、対数圧縮されたCODEC信号を線形信号に、また、線形信号を対数圧縮信号に変換できる機能を有する音声信号処理装置において、これらの信号に対して演算処理を行なう音声信号処理に関する。
音声信号は広いダイナミックレンジをもっているため、量子化には多くのレベルが必要となる。このため、非線形量子化法により量子化レベルの削減を行なうために、対数圧縮変換コードを用いることがある。この対数圧縮変換の中で、デジタル折線近似数圧縮は電話の音声をデジタル化するときに用いられている。すなわち標本化した信号に対して対数圧縮を行ない、次に一様な量子化を行なう。復調する場合には、信号を圧縮と逆の伝達特性を持つ伸長を行なう。
ITUが定義したG.711規格は世界各国の通信回線網用の最も共通な圧縮アルゴリズムであり、PCM(Pulse Code Modulation )のために二つの対数量子化法(A則(ALaw、μ則(μLaw))が、各種回線において利用されている。G.711規格では13ビットのALawまたは14ビットのμLawの線形PCMサンプルを8ビットの対数特性で圧縮する(例えば、非特許文献1参照。)。
μLawにおいては、まず音声であるアナログ全体の振幅を粗いステップ15セグメント16等分に分割する。ビットは8ビットで構成され、極性を示すサイン・ビット(MSB)として1ビット、どの折線にあるかを表わすセグメント・ビットとして3ビットを用いる。次に、それぞれの折線を直線的に16等分して4ビットのステップ・ビットとしての割り当てを行なう。その結果、1ワードが8ビットとなる。これに対し、ALawにおいては、正負領域を含めて13セグメント14等分にまず分離し、各々セグメントをさらに16等分に分割する。現在、μLawは日本やアメリカ、ALawはヨーロッパを中心にデジタル電話に導入されている。
相良岩男著「AD/DA変換回路入門」日刊工業新聞社、1991年11月28日、p.234〜244
相良岩男著「AD/DA変換回路入門」日刊工業新聞社、1991年11月28日、p.234〜244
上述の声信号処理において、線形信号処理(無限インパルス応答フィルタIIR、有限インパルス応答フィルタFIRのようなフィルタなど)では、積和演算が必要である。しかしながら、線形、非線形信号処理(適応化フィルタ、自動利得調整器AGC、レベルリミッタ、レベル比較器等)の制御処理においても、乗算や除算によって、パワー、信号比、ゲインの計算が必要になる。さらに、対数特性が必要な機能もある。これらの演算は、多くの命令、複雑な計算、特別な機能ブロック、そして、より速いプロセッサが必要となる。多くの信号処理プロセッサでは、積和演算器(MAC)を搭載し、線形信号処理を効率よく行っている。しかし、除算が要求されるような場合は、いくつかの命令の組み合わせで実行しなければならない。
また、対数変換して演算することで、乗/除算が加/減算に変換でき、演算量を減らすことができるが、このためには、対数変換用の機構(テーブル参照法、専用演算機構)が必要になり、データメモリや、命令の追加等が必要になる。
本発明の目的は、上記課題を解決するためになされたものであり、対数圧縮・伸張を行
なう音声処理装置において、更に多様な信号処理機能の付加を効率的に実現することができる装置を提供することにある。
なう音声処理装置において、更に多様な信号処理機能の付加を効率的に実現することができる装置を提供することにある。
そこで、以下のように請求項1〜6に記載の発明により、多様な信号処理機能の付加を効率的に実現する。
本発明によれば、少なくとも対数圧縮されたCODEC信号と線形信号との間で変換を行なう信号変換手段を備えた音声信号処理装置において、前記信号変換手段への入力前に前記CODEC信号を、対数圧縮された状態で抽出し、前記CODEC信号に対して信号処理を実行し、前記信号変換手段から出力された信号に、信号処理結果を還元する付加信号処理手段を備えたことを要旨とする。対数領域では、乗算は加算に帰着し、徐算は減算に帰着する。これにより、対数圧縮されたCODEC信号を用いて、効率的にパワー計算や信号比計算等を実行することができる。従って、比較的低い能力のプロセッサにおいても多様な信号処理を実行させることができる。
本発明によれば、少なくとも対数圧縮されたCODEC信号と線形信号との間で変換を行なう信号変換手段を備えた音声信号処理装置において、前記信号変換手段への入力前に前記CODEC信号を、対数圧縮された状態で抽出し、前記CODEC信号に対して信号処理を実行し、前記信号変換手段から出力された信号に、信号処理結果を還元する付加信号処理手段を備えたことを要旨とする。対数領域では、乗算は加算に帰着し、徐算は減算に帰着する。これにより、対数圧縮されたCODEC信号を用いて、効率的にパワー計算や信号比計算等を実行することができる。従って、比較的低い能力のプロセッサにおいても多様な信号処理を実行させることができる。
本発明によれば、前記CODEC信号は、パルスコード変調方式における信号であり、前記付加信号処理手段は、前記抽出したCODEC信号に対して、ビット反転を行ない、最上位ビットを0にして近似対数値を算出する手段を更に設けたことを要旨とする。これにより、μ則等のパルスコード変調方式において、効率的に近似計算を行なうことができる。
本発明によれば、前記付加信号処理手段が、対数平均値を格納する対数平均値記憶手段を備え、前記対数平均値記憶手段に記録された対数平均値と前記近似対数値とを比較し、前記近似対数値が前記対数平均値より小さい場合には、前記対数平均値から所定値を減算した値を新たな対数平均値として前記対数平均値記憶手段に記録し、前記近似対数値が前記対数平均値より大きい場合には、前記対数平均値から所定値を加算した値を新たな対数平均値として前記対数平均値記憶手段に記録することを要旨とする。これにより、信号強度の平均値を算出することができる。
本発明によれば、前記付加信号処理手段が、前記対数平均値を線形信号に変換した線形変換値を算出し、所定の最大ゲイン値と前記線形変換値とを比較し、前記線形変換値が最大ゲイン値より大きい場合には最大ゲイン値をゲインとして還元し、前記線形変換値が最大ゲイン値より小さい場合には前記線形変換値をゲインとして還元することを要旨とする。これにより、自動利得調整器を実現することができる。
本発明によれば、前記付加信号処理手段が、近似ピーク値を格納する近似ピーク値記憶手段を備え、前記近似ピーク値記憶手段に記録された近似ピーク値と前記近似対数値とを比較し、前記近似対数値が前記近似ピーク値より小さい場合には、前記近似ピーク値から所定値を減算した値を新たな近似ピーク値として前記近似ピーク値記憶手段に記録し、前記近似対数値が前記近似ピーク値より大きい場合には、前記近似対数値を新たな近似ピーク値として前記近似ピーク値記憶手段に記録することを要旨とする。これにより、所定値を時定数として、ピークホールドの算出し、包落線の算出を行なうことができる。
本発明によれば、前記付加信号処理手段が、遠端及び近端の近似ピーク値を算出し、遠端の近似ピーク値から近端の近似ピーク値両者を差し引いた差分が所定値より大きい場合、前記近端のゲインとして抑制値を還元し、前差分が所定値より小さい場合、前記近端のゲインとして標準値を還元し、前記遠端の近似ピーク値を線形信号に変換した線形変換値を算出し、所定の最大ゲイン値と前記線形変換値と比較し、前記線形変換値が最大ゲイン値より大きい場合には最大ゲイン値を前記遠端のゲインとして還元し、前記線形変換値が最大ゲイン値より小さい場合には前記線形変換値を前記遠端のゲインとして還元すること
を要旨とする。これにより、エコーサプレッサを実現することができる。
を要旨とする。これにより、エコーサプレッサを実現することができる。
本発明によれば、対数圧縮・伸張を行なう音声処理装置において、更に多様な信号処理機能の付加を効率的に実現することができる。
以下、本発明を具体化した一実施形態を、図1に従って説明する。ここでは、μLaw圧縮入力を取得し、付加的な信号処理を実行し、擬似対数値を得るための基本機能を説明する。まず、μLaw圧縮入力があった場合、近似対数変換処理を実行する(ステップS1−1)。この近似対数変換処理では、線形値の絶対値(abs(Linear) )についてのμLaw圧縮値を取得し、近似対数値としての近似μlog 値を算出する。
μlog(abs(Linear))=(μLaw xor 0xff)& 0x7f
この処理は、まず、μLaw 圧縮値のビット反転を実行し、次にMSBを「0」に設定する処理により行われる。これにより、グラフに示したLinear値の関数として、μlog 特性を得ることができる。
μlog(abs(Linear))=(μLaw xor 0xff)& 0x7f
この処理は、まず、μLaw 圧縮値のビット反転を実行し、次にMSBを「0」に設定する処理により行われる。これにより、グラフに示したLinear値の関数として、μlog 特性を得ることができる。
次に、このように変換された近似μlog 値に関する基本計算方法及びその特性を説明する(ステップS1−2)。この近似μlog 値においては対数になるため、線形値の乗算処理は加算処理により和として算出され、除算は減算処理により差として算出される。また、線形値の2乗処理は1ビットの右シフト、平方根処理は1ビットの左シフトを行なうことにより算出される。また、線形値の2倍は「16」を加えることにより算出される。
また、近似μlog 値は単調増加関数によって表されるため、線形値の大小関係はそのまま維持される。また、線形値の加算は、最大値を計算することによって近似される。
そして、その結果を出力することにより、擬似対数値を得ることができる。
そして、その結果を出力することにより、擬似対数値を得ることができる。
以下、上述した近似対数変換処理と基本計算とを組み合わせた装置を説明する。
(第1の実施例)
本発明を具体化した一実施例である自動利得調整器AGC(Auto Gain Control )を、図2〜図4に従って説明する。この自動利得調整器AGCは、それぞれ信号変換手段として機能するμLaw伸張処理部U2LとμLaw圧縮処理部L2Uとを備えた音声装置において用いられる。そして、このμLaw伸張処理部U2LとμLaw圧縮処理部L2Uとを利用しながら、自動利得調整器AGCは、出力レベル値が常に固定値LEVになるようにゲインを調整する。具体的には、自動利得調整器AGCは、移動平均関数を用いて入力信号の移動平均を求める。そして、以下の式により、ゲイン値を求める。
(第1の実施例)
本発明を具体化した一実施例である自動利得調整器AGC(Auto Gain Control )を、図2〜図4に従って説明する。この自動利得調整器AGCは、それぞれ信号変換手段として機能するμLaw伸張処理部U2LとμLaw圧縮処理部L2Uとを備えた音声装置において用いられる。そして、このμLaw伸張処理部U2LとμLaw圧縮処理部L2Uとを利用しながら、自動利得調整器AGCは、出力レベル値が常に固定値LEVになるようにゲインを調整する。具体的には、自動利得調整器AGCは、移動平均関数を用いて入力信号の移動平均を求める。そして、以下の式により、ゲイン値を求める。
ゲイン値=LEV/移動平均値
まず、対数平均値処理部AVEは、μLaw伸張処理部U2Lに入力される信号S1を抽出する。この信号S1はCODEC信号であり、μLaw圧縮されている。
まず、対数平均値処理部AVEは、μLaw伸張処理部U2Lに入力される信号S1を抽出する。この信号S1はCODEC信号であり、μLaw圧縮されている。
この自動利得調整器AGCは、対数平均値処理部AVE、レジスタ及びゲイン値計算処理部GAINを備える。
対数平均値処理部AVEは、図3に示す、対数平均値計算処理を実行する。この処理においては、まず、対数平均値処理部AVEは、近似対数変換処理を実行する(ステップS2−1)。ここでは、取得した信号S1のビットを反転し、この信号の最上位ビットMSB(Most Significant Bit)を「0」に設定する。これにより近似μlog 値が算出される。更に、このステップでは、スケーリングファクタXを用いてスケールの拡大を行なう。具体的には、信号S1についてXビットの左シフトを行なう。
対数平均値処理部AVEは、図3に示す、対数平均値計算処理を実行する。この処理においては、まず、対数平均値処理部AVEは、近似対数変換処理を実行する(ステップS2−1)。ここでは、取得した信号S1のビットを反転し、この信号の最上位ビットMSB(Most Significant Bit)を「0」に設定する。これにより近似μlog 値が算出される。更に、このステップでは、スケーリングファクタXを用いてスケールの拡大を行なう。具体的には、信号S1についてXビットの左シフトを行なう。
次に、対数平均値処理部AVEは、対数平均値記憶手段としてのレジスタに記録された対数平均値Aを呼び出し、信号S1と比較する(ステップS2−2)。対数平均値Aが信号S1より大きい場合(ステップS2−2においてYESの場合)、対数平均値Aから定数CNSTを差し引いて、新たな対数平均値Aを設定する(ステップS2−3)。一方、信号S1が対数平均値A以上の場合(ステップS2−2においてNOの場合)、対数平均値Aに定数CNSTを加算して、新たな対数平均値Aを生成する(ステップS2−4)。
次に、対数平均値処理部AVEは、対数平均値Aと「0」とを比較する(ステップS2−5)。対数平均値Aが負になった場合(ステップS2−5においてYESの場合)、対数平均値Aを「0」に設定する(ステップS2−6)。そして、この対数平均値Aをレジスタに記録する(ステップS2−7)。また、対数平均値Aが正の場合(ステップS2−2においてNOの場合)も、対数平均値Aをレジスタに記録する(ステップS2−7)。
次に、ゲイン値計算処理部GAINが、ゲイン値計算処理を実行する。この処理を、図4を用いて説明する。ゲイン値計算処理部GAINが、対数ゲイン値Gを算出する(ステップS3−1)。まず、ここでは、ゲイン値計算処理部GAINが、対数平均値AをXビットの右シフトを行ない、スケーリングファクタXを用いてスケールを戻す。そして、所望の出力レベル値について固定値LEVから対数平均値Aを差し引いて対数ゲイン値Gを算出する。
次に、ゲイン値計算処理部GAINは、対数ゲイン値Gを線形ゲインに変換する(ステップS3−2)。具体的には、この音声装置に備えられたμLaw伸張処理部U2Lに対数ゲイン値Gを導入して、線形ゲインgainを取得する。
更に、ゲイン値計算処理部GAINは、予め定められた最大ゲインG_MAX と線形ゲインgainとを比較する(ステップS3−3)。そして、線形ゲインgainが最大ゲインG_MAX を超えている場合、線形ゲインgainを最大ゲインG_MAX と設定する(ステップS3−4)。そして、この線形ゲインgainを出力する(ステップS3−5)。この線形ゲインgainは、μLaw伸張処理部U2Lの出力に還元される。これにより、線形ゲインgainは最大ゲインG_MAX に制限される。
(第2の実施例)
以下、本発明を具体化した一実施例としてエコーサプレッサ(Echo Suppressor :反響抑制器)ESを、図5〜図8に従って説明する。通常、エコーキャンセラは完全に音を消すことが可能であるが、その構成が複雑になる。一方、エコーサプレッサESは、自分が喋っているときは、2つの音の大きさを比較して相手の声を小さくする一種のボイススイッチであり、比較的簡易な構成で実現することができる。
以下、本発明を具体化した一実施例としてエコーサプレッサ(Echo Suppressor :反響抑制器)ESを、図5〜図8に従って説明する。通常、エコーキャンセラは完全に音を消すことが可能であるが、その構成が複雑になる。一方、エコーサプレッサESは、自分が喋っているときは、2つの音の大きさを比較して相手の声を小さくする一種のボイススイッチであり、比較的簡易な構成で実現することができる。
このエコーサプレッサESも付加信号処理手段して機能し、μLaw伸張処理部U2LとμLaw圧縮処理部L2Uとを備えた音声装置において用いられる。この音声装置は近端(Near End)と遠端(Far End )との双方向通信に利用される。そして、それぞれに対して備えられたμLaw伸張処理部U2LとμLaw圧縮処理部L2Uとを利用しならが、エコーサプレッサESは、近端からの信号と遠端からの信号レベルを調整する。このエコーサプレッサESは、対数包落線検出部(ENV1、ENV2)、近端ゲイン制御部NC及び遠端ゲイン制御部FCを備える。
<包落線処理>
まず、エコーサプレッサESの対数包落線検出部ENV1は、μLaw伸張処理部U2Lに入力される遠端からの信号SFEを抽出する。この信号SFEはCODEC信号であり、μLaw圧縮されている。
まず、エコーサプレッサESの対数包落線検出部ENV1は、μLaw伸張処理部U2Lに入力される遠端からの信号SFEを抽出する。この信号SFEはCODEC信号であり、μLaw圧縮されている。
この対数包落線検出部ENV1における処理を、図6に示す対数包落線検出処理を実行する。この処理においては、まず、対数包落線検出部ENV1は、近似対数変換処理を実行する(ステップS4−1)。ここでは、取得した信号SFEのビットを反転し、この信号の最上位ビットMSBを「0」に設定する。これにより近似μlog 値が算出される。更に、このステップでは、スケーリングファクタXを用いてスケールの拡大を行なう。具体的には、信号SFEをXビットの左シフトを行なう。
次に、対数包落線検出部ENV1は、レジスタFに記録された遠端包落線値EFEを呼び出し、信号SFEと比較する(ステップS4−2)。このレジスタFは遠端の近似ピーク値記憶手段として機能する。遠端包落線値EFEが信号SFEより大きい場合(ステップS4−2においてYESの場合)、遠端包落線値EFEから定数CNSTから差し引いて、新たな遠端包落線値EFEを設定する(ステップS4−3)。一方、信号SFEが遠端包落線値EFE以上の場合(ステップS4−2においてNOの場合)、信号SFEを遠端包落線値EFEとして設定する(ステップS4−4)。そして、ステップS4−3又はステップS4−4において設定した遠端包落線値EFEをレジスタFに保存する(ステップS4−5)。これにより、遠端からの信号についてピークホールド機能を実現し、入力値がホールド値より小さい場合は、一定の時定数(CNST)を引き、減衰特性を実現する。
エコーサプレッサESの対数包落線AVE2も、図6に示す処理と同様の対数包落線検出処理を実行する。この場合には、μLaw伸張処理部U2Lに入力される近端からの信号SNEを取得する。この信号SNEも、信号SFEと同様にμLaw圧縮されている。そして、既にレジスタNに保存された近端包落線値ENEと信号SNEとを比較し(ステップS4−2)、近端包落線値ENEを設定し(ステップS4−3又はステップS4−4)、レジスタNに保存する。このレジスタNは近端の近似ピーク値記憶手段として機能する。これにより、近端の信号についてもピークホールド機能を実現し、減衰特性を実現する。
<近端ゲイン制御処理>
次に、近端ゲイン制御部NCの処理を、図7を用いて説明する。
ここでは、近端包落線値ENEと遠端包落線値EFEとを用いる。具体的には、近端ゲイン制御部NCにおいて、遠端包落線値EFEから近端包落線値ENEを差し引いた差と定数R1とを比較する(ステップS5−1)。そして、近端包落線値ENEと遠端包落線値EFEとの差より定数R1が小さい場合(ステップS5−1においてYESの場合)、対数近端ゲインGnとして、抑制値GAIN0を設定する(ステップS5−2)。また、近端包落線値ENEと遠端包落線値EFEとの差が定数R1以下である場合(ステップS5−1においてNOの場合)、近端ゲインGnとして、標準値GAIN1を設定する(ステップS5−3)。
次に、近端ゲイン制御部NCの処理を、図7を用いて説明する。
ここでは、近端包落線値ENEと遠端包落線値EFEとを用いる。具体的には、近端ゲイン制御部NCにおいて、遠端包落線値EFEから近端包落線値ENEを差し引いた差と定数R1とを比較する(ステップS5−1)。そして、近端包落線値ENEと遠端包落線値EFEとの差より定数R1が小さい場合(ステップS5−1においてYESの場合)、対数近端ゲインGnとして、抑制値GAIN0を設定する(ステップS5−2)。また、近端包落線値ENEと遠端包落線値EFEとの差が定数R1以下である場合(ステップS5−1においてNOの場合)、近端ゲインGnとして、標準値GAIN1を設定する(ステップS5−3)。
そして、近端ゲイン制御部NCは、設定された近端ゲインGnを出力するステップS5−4)。この近端ゲインGnは、近端の線形入力に還元される。本実施形態では、近端から入力された信号についてμLaw伸張処理部U2Lで処理された出力に乗算される。
<遠端ゲイン制御処理>
次に、遠端ゲイン制御部FCの処理を、図8を用いて説明する。
まず、ここでは、遠端ゲイン制御部FCが、遠端包落線値EFEをXビットの右シフトを行ない、スケーリングファクタXを用いてスケールを戻す。そして、所望の出力レベル値について固定値LIMから遠端包落線値EFEを差し引いて対数ゲイン値Gfを算出する(ステップS6−1)。この固定値LIMは遠端ゲイン制御部FCに記憶させておく。
次に、遠端ゲイン制御部FCの処理を、図8を用いて説明する。
まず、ここでは、遠端ゲイン制御部FCが、遠端包落線値EFEをXビットの右シフトを行ない、スケーリングファクタXを用いてスケールを戻す。そして、所望の出力レベル値について固定値LIMから遠端包落線値EFEを差し引いて対数ゲイン値Gfを算出する(ステップS6−1)。この固定値LIMは遠端ゲイン制御部FCに記憶させておく。
次に、遠端ゲイン制御部FCは、対数ゲイン値Gfを、線形変換値としての線形ゲインに変換する(ステップS6−2)。具体的には、この音声装置に備えられたμLaw伸張
処理部U2Lに対数ゲイン値Gfを導入して線形ゲインgainを取得する。
処理部U2Lに対数ゲイン値Gfを導入して線形ゲインgainを取得する。
更に、遠端ゲイン制御部FCは、予め定められた最大ゲイン値としての最大ゲインG_MAX と線形ゲインgainとを比較する(ステップS6−3)。そして、線形ゲインgainが最大ゲインG_MAX を超えている場合(ステップS6−3においてYESの場合)、線形ゲインgainを最大ゲインG_MAX と設定する(ステップS6−4)。
そして、ステップS6−2又はステップS6−4において算出された線形ゲインgainを還元する(ステップS6−5)。本実施形態では、遠端から入力された信号についてμLaw伸張処理部U2Lで処理された出力に乗算される。これにより、遠端の線形ゲインgainは最大ゲインG_MAX に制限される。
本実施形態によれば、以下のような効果を得ることができる。
・ 本実施形態においては、音声装置において備えられたμLaw伸張処理部U2LとμLaw圧縮処理部L2Uとを利用しながら、μLaw圧縮値を近似μLawに変換する。
・ 本実施形態においては、音声装置において備えられたμLaw伸張処理部U2LとμLaw圧縮処理部L2Uとを利用しながら、μLaw圧縮値を近似μLawに変換する。
対数領域では、乗算は加算に帰着し、徐算は減算に帰着する。従って、パワー計算は、同じ信号を加算すればよい。一方、2つの信号強度比の計算は、信号の差を計算する。このように、μLaw圧縮信号を用いれば、パワー計算や信号比計算を簡単に実行することができる。従って、特別な対数変換機構を追加することなく、μLaw圧縮信号を直接的に利用することで、命令数を減らすことができる。
そして、乗算/除算や複雑な計算を行なう必要もなくなり、比較的低い能力のプロセッサにおいても多様な信号処理の実行が可能になる。この結果、効率的に自動利得調整器AGCやエコーサプレッサESを効率的に実現することができる。本実施形態によれば、線形領域で処理するためのコードに対して、約1/3のコードで各機能を実現することができる。
なお、上記各実施形態は以下のように変更してもよい。
○ 上記実施形態では、μLawにおける装置を説明したが、ALawや、他の規格においても適用可能である。
○ 上記実施形態では、μLawにおける装置を説明したが、ALawや、他の規格においても適用可能である。
○ 上記実施形態では、μLaw伸張処理部U2LとμLaw圧縮処理部L2Uの両者を用いて信号処理を実行したが、μLaw圧縮信号を取得できるのであれば、一方のみを利用してもよい。
AGC…付加信号処理手段としての自動利得調整器、U2L…信号変換手段としてのLaw伸張処理部、L2U…信号変換手段としてのμLaw圧縮処理部、AVE…対数平均
値処理部、GAIN…ゲイン値計算処理部、ES…付加信号処理手段としてのエコーサプレッサ、ENV1、ENV2…対数包落線検出部、NC…近端ゲイン制御部、NF…遠端ゲイン制御部、S1,SFE,SNE…信号、MSB…最上位ビット、GAIN0…抑制値、GAIN1…標準値。
値処理部、GAIN…ゲイン値計算処理部、ES…付加信号処理手段としてのエコーサプレッサ、ENV1、ENV2…対数包落線検出部、NC…近端ゲイン制御部、NF…遠端ゲイン制御部、S1,SFE,SNE…信号、MSB…最上位ビット、GAIN0…抑制値、GAIN1…標準値。
Claims (6)
- 少なくとも対数圧縮されたCODEC信号と線形信号との間で変換を行なう信号変換手段を備えた音声信号処理装置において、
前記信号変換手段への入力前に前記CODEC信号を、対数圧縮された状態で抽出し、
前記CODEC信号に対して信号処理を実行し、
前記信号変換手段から出力された信号に、信号処理結果を還元する付加信号処理手段を備えたことを特徴とする音声信号処理装置。 - 前記CODEC信号は、パルスコード変調方式における信号であり、
前記付加信号処理手段は、前記抽出したCODEC信号に対して、ビット反転を行ない、最上位ビットを0にして近似対数値を算出する手段を更に設けたことを特徴とする請求項1に記載の音声信号処理装置。 - 前記付加信号処理手段が、対数平均値を格納する対数平均値記憶手段を備え、
前記対数平均値記憶手段に記録された対数平均値と前記近似対数値とを比較し、
前記近似対数値が前記対数平均値より小さい場合には、前記対数平均値から所定値を減算した値を新たな対数平均値として前記対数平均値記憶手段に記録し、前記近似対数値が前記対数平均値より大きい場合には、前記対数平均値から所定値を加算した値を新たな対数平均値として前記対数平均値記憶手段に記録することを特徴とする請求項2に記載の音声信号処理装置。 - 前記付加信号処理手段が、
前記対数平均値を線形信号に変換した線形変換値を算出し、
所定の最大ゲイン値と前記線形変換値とを比較し、
前記線形変換値が最大ゲイン値より大きい場合には最大ゲイン値をゲインとして還元し、前記線形変換値が最大ゲイン値より小さい場合には前記線形変換値をゲインとして還元することを特徴とする請求項3に記載の音声信号処理装置。 - 前記付加信号処理手段が、近似ピーク値を格納する近似ピーク値記憶手段を備え、
前記近似ピーク値記憶手段に記録された近似ピーク値と前記近似対数値とを比較し、
前記近似対数値が前記近似ピーク値より小さい場合には、前記近似ピーク値から所定値を減算した値を新たな近似ピーク値として前記近似ピーク値記憶手段に記録し、前記近似対数値が前記近似ピーク値より大きい場合には、前記近似対数値を新たな近似ピーク値として前記近似ピーク値記憶手段に記録することを特徴とする請求項2に記載の音声信号処理装置。 - 前記付加信号処理手段が、遠端及び近端の近似ピーク値を算出し、
遠端の近似ピーク値から近端の近似ピーク値両者を差し引いた差分が所定値より大きい場合、前記近端のゲインとして抑制値を還元し、前差分が所定値より小さい場合、前記近端のゲインとして標準値を還元し、
前記遠端の近似ピーク値を線形信号に変換した線形変換値を算出し、
所定の最大ゲイン値と前記線形変換値と比較し、前記線形変換値が最大ゲイン値より大きい場合には最大ゲイン値を前記遠端のゲインとして還元し、前記線形変換値が最大ゲイン値より小さい場合には前記線形変換値を前記遠端のゲインとして還元することを特徴とする請求項5に記載の音声信号処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005000936A JP2006191316A (ja) | 2005-01-05 | 2005-01-05 | 音声信号処理装置 |
US11/315,733 US7376568B2 (en) | 2005-01-05 | 2005-12-22 | Voice signal processor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005000936A JP2006191316A (ja) | 2005-01-05 | 2005-01-05 | 音声信号処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006191316A true JP2006191316A (ja) | 2006-07-20 |
Family
ID=36641771
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005000936A Pending JP2006191316A (ja) | 2005-01-05 | 2005-01-05 | 音声信号処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7376568B2 (ja) |
JP (1) | JP2006191316A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2155086B1 (en) * | 2007-06-06 | 2016-05-04 | K2M, Inc. | Medical device to correct deformity |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03226017A (ja) * | 1990-01-31 | 1991-10-07 | Fujitsu Ltd | コード変換自動切替制御方式 |
JPH05204395A (ja) * | 1991-04-30 | 1993-08-13 | Sharp Corp | 音声用利得制御装置および音声記録再生装置 |
JPH05276071A (ja) * | 1992-03-26 | 1993-10-22 | Nec Corp | 線形符号入出力のエコーキャンセラ |
JP2000134338A (ja) * | 1998-10-23 | 2000-05-12 | Nec Miyagi Ltd | A法則符号化信号ブランチ装置及びそのブランチ方法 |
JP2002118503A (ja) * | 2000-10-05 | 2002-04-19 | Mitsubishi Electric Corp | エコーキャンセラ方法およびエコーキャンセラ装置と通信システム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2294614B (en) * | 1994-10-28 | 1999-07-14 | Int Maritime Satellite Organiz | Communication method and apparatus |
US5809133A (en) * | 1996-05-24 | 1998-09-15 | Advanced Micro Devices, Inc. | DTMF detector system and method which performs frequency domain energy calculations with improved performance |
US6201834B1 (en) * | 1996-12-20 | 2001-03-13 | Intel Corporation | Method and apparatus for packet loss recovery with standard-based packet video |
US6418405B1 (en) * | 1999-09-30 | 2002-07-09 | Motorola, Inc. | Method and apparatus for dynamic segmentation of a low bit rate digital voice message |
ATE345613T1 (de) * | 2000-04-07 | 2006-12-15 | Broadcom Corp | Rahmenbasierte übertragung von nutzdaten mit veränderlicher datenrate |
US20030023429A1 (en) * | 2000-12-20 | 2003-01-30 | Octiv, Inc. | Digital signal processing techniques for improving audio clarity and intelligibility |
US20030195745A1 (en) * | 2001-04-02 | 2003-10-16 | Zinser, Richard L. | LPC-to-MELP transcoder |
EP1793370B1 (en) * | 2001-08-31 | 2009-06-03 | Kabushiki Kaisha Kenwood | apparatus and method for creating pitch wave signals and apparatus and method for synthesizing speech signals using these pitch wave signals |
-
2005
- 2005-01-05 JP JP2005000936A patent/JP2006191316A/ja active Pending
- 2005-12-22 US US11/315,733 patent/US7376568B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03226017A (ja) * | 1990-01-31 | 1991-10-07 | Fujitsu Ltd | コード変換自動切替制御方式 |
JPH05204395A (ja) * | 1991-04-30 | 1993-08-13 | Sharp Corp | 音声用利得制御装置および音声記録再生装置 |
JPH05276071A (ja) * | 1992-03-26 | 1993-10-22 | Nec Corp | 線形符号入出力のエコーキャンセラ |
JP2000134338A (ja) * | 1998-10-23 | 2000-05-12 | Nec Miyagi Ltd | A法則符号化信号ブランチ装置及びそのブランチ方法 |
JP2002118503A (ja) * | 2000-10-05 | 2002-04-19 | Mitsubishi Electric Corp | エコーキャンセラ方法およびエコーキャンセラ装置と通信システム |
Also Published As
Publication number | Publication date |
---|---|
US20060149559A1 (en) | 2006-07-06 |
US7376568B2 (en) | 2008-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0731280Y2 (ja) | 符号化音声信号の処理装置 | |
EP0673576A1 (en) | Apparatus for and method of speech digitizing | |
US5715309A (en) | Conversion of compressed speech codes between attenuated and unattenuated formats | |
EP1814107A1 (en) | Method for extending the spectral bandwidth of a speech signal and system thereof | |
KR100497702B1 (ko) | 디지털데이터변환장치 | |
WO2002060053A2 (en) | Methods, devices and computer program products for compressing an audio signal | |
JP2006191316A (ja) | 音声信号処理装置 | |
JPH07283737A (ja) | ディジタル値列のフィルタ方法および回路装置 | |
JP3136797B2 (ja) | 音データ処理方法および音データ処理装置 | |
JPH0715281A (ja) | ノイズシェーピング装置 | |
JP2005012294A (ja) | Adpcm方式復号器 | |
JP3294024B2 (ja) | 音声信号の符号化伝送方法 | |
US7346639B2 (en) | Method and apparatus for suppressing limit cycles in noise shaping filters | |
JPH08102644A (ja) | 適応フィルタシステム | |
JP3056815B2 (ja) | オ−ディオ信号のデジタル可変コンプレッサ− | |
JP3200887B2 (ja) | 音声波形復号化装置 | |
JP2826678B2 (ja) | ディジタル信号の圧伸方法及びその装置 | |
JP3147127B2 (ja) | 音声波形符号化装置 | |
JPS6058614B2 (ja) | Dpcm−pcm変換装置 | |
KR100664017B1 (ko) | 자동 이득 제어 장치 | |
JPS62194741A (ja) | 適応量子化器 | |
JPS5930335A (ja) | Dpcm符号復号化方法及び装置 | |
KR101042479B1 (ko) | 지연시간 예측에 따른 반향 제거 기능을 가지는 음성코딩/디코딩 장치 및 그 방법 | |
TW200409454A (en) | Automatic gain controller and its controlling method | |
JPH11340790A (ja) | ミキシング装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100812 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100817 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110125 |