JP3315956B2 - 音声符号化装置及び音声符号化方法 - Google Patents

音声符号化装置及び音声符号化方法

Info

Publication number
JP3315956B2
JP3315956B2 JP28146699A JP28146699A JP3315956B2 JP 3315956 B2 JP3315956 B2 JP 3315956B2 JP 28146699 A JP28146699 A JP 28146699A JP 28146699 A JP28146699 A JP 28146699A JP 3315956 B2 JP3315956 B2 JP 3315956B2
Authority
JP
Japan
Prior art keywords
noise
parameter
input signal
information source
source model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP28146699A
Other languages
English (en)
Other versions
JP2001109496A (ja
Inventor
正 米崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP28146699A priority Critical patent/JP3315956B2/ja
Priority to AU74473/00A priority patent/AU7447300A/en
Priority to PCT/JP2000/006689 priority patent/WO2001026094A1/ja
Publication of JP2001109496A publication Critical patent/JP2001109496A/ja
Application granted granted Critical
Publication of JP3315956B2 publication Critical patent/JP3315956B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、自動車電話、携帯
電話等の無線通信システムの通信装置に使用される音声
符号化装置及び音声符号化方法に関する。
【0002】
【従来の技術】近年、需要が急増している無線通信シス
テムの分野では、電波資源の有効利用のため低ビットレ
ートで高品質に音声を符号化できる装置の開発が進めら
れている。
【0003】図7は、従来の音声符号化装置の構成を示
すブロック図である。
【0004】図7において、雑音区間検出部11は、入
力信号を音声区間と他の区間に分離し、音声区間以外の
信号を背景雑音として検出する。雑音モデル推定部12
は、雑音区間検出部11にて検出された雑音区間におい
て、例えば、雑音信号の振幅周波数特性のような雑音モ
デルを推定する。
【0005】雑音除去部13は、雑音モデル推定部12
にて推定された雑音モデルを用いて、入力信号から雑音
を除去する。雑音モデルとして振幅周波数特性を用いた
場合、スペクトラルサブトラクション法等を用いて雑音
を除去することができる。なお、雑音除去処理に関して
は、特開平10−133689号公報、及び、特開平1
0−187193号公報等に記載されている。
【0006】音声分析部14は、雑音除去部13の出力
である雑音を除去された信号を分析してパラメータを抽
出する。
【0007】パラメータ量子化部15は、音声分析部1
4にて抽出されたパラメータを量子化し、ユークリッド
距離に代表される1つの尺度に基づいて誤差が最小とな
る符号を量子化値に対応する符号として抽出して出力す
る。
【0008】このように、従来の音声符号化装置は、入
力信号に対して雑音信号成分を除去して、音声信号に特
化したパラメータを抽出することにより、低ビットレー
トで高品質な音声符号化を実現している。
【0009】
【発明が解決しようとする課題】しかしながら、上記従
来の音声符号化装置は、雑音信号成分の除去処理が音声
符号化処理と独立し、雑音信号成分を除去する能力が雑
音モデルの精度に大きく依存し、背景雑音環境下におい
て品質が劣化するという問題を有している。
【0010】本発明はかかる点に鑑みてなされたもので
あり、雑音モデルの精度に対する依存度が少なく、雑音
信号成分に対して頑強で背景雑音環境下においても高品
質な音声符号化処理を実現することができる音声符号化
装置及び音声符号化方法を提供することを目的とする。
【0011】
【課題を解決するための手段】本発明の音声符号化装置
は、入力信号の雑音区間を検出する雑音区間検出手段
と、検出された雑音区間の雑音の大きさを推定する雑音
レベル推定手段と、雑音を含まない音声入力信号に対す
るパラメータ列をモデル化した情報源モデルを記憶する
情報源モデル記憶手段と、入力信号を分析してパラメー
タを抽出する音声分析手段と、前記情報源モデル及び前
記雑音の大きさに基づいて前記抽出されたパラメータを
量子化し、量子化値に対応する符号を出力するパラメー
タ量子化手段とを具備する構成を採る。
【0012】本発明の音声符号化装置のパラメータ量子
化手段は、雑音の大きさに応じて許容誤差を決定し、パ
ラメータとの誤差が前記許容誤差以下の符号を符号帳の
中から抽出し、情報源モデルに基づいて前記抽出された
符号の中で最も確からしい符号を送信符号として選択す
る構成を採る。
【0013】これらの構成により、雑音の大きさに応じ
てパラメータから送信符号の候補を抽出し、情報源モデ
ルに基づいて最終的な送信符号を決定することができる
ので、雑音を含まない信号に対する性能を劣化させるこ
となく、雑音信号成分に対して頑強で背景雑音環境下に
おいても高品質な音声符号化処理を実現することができ
る。
【0014】本発明の音声符号化装置のパラメータ量子
化手段は、雑音の大きさ及び情報源モデルに基づいて、
入力パラメータと量子化値の誤差を算出する際における
パラメータの各要素に対する重み付けを決定し、この決
定された重み付けに従ってパラメータを量子化する構成
を採る。
【0015】この構成により、雑音の大きさ及び情報源
モデルに基づいてパラメータの各要素に重み付けを行
い、パラメータを量子化することができるので、雑音を
含まない信号に対する性能を劣化させることなく、雑音
信号成分に対して頑強で背景雑音環境下においても高品
質な音声符号化処理を実現することができる。
【0016】本発明の音声符号化装置のパラメータ量子
化手段は、雑音の大きさ及び情報源モデルから、入力信
号に雑音を含まない場合のパラメータ量子化値の出現確
率を推定し、この推定された出現確率と誤差値とを合わ
せた尤度に従って、パラメータを量子化する構成を採
る。
【0017】この構成により、雑音の大きさ及び情報源
モデルに基づいてパラメータ量子化値の出現確率を推定
し、パラメータを量子化することができるので、雑音を
含まない信号に対する性能を劣化させることなく、雑音
信号成分に対して頑強で背景雑音環境下においても高品
質な音声符号化処理を実現することができる。
【0018】本発明の音声符号化装置は、入力信号の雑
音区間を検出する雑音区間検出手段と、検出された雑音
区間における雑音モデルを推定する雑音モデル推定手段
と、雑音を含まない音声入力信号に対するパラメータ列
をモデル化した情報源モデルを記憶する情報源モデル記
憶手段と、入力信号を分析してパラメータを抽出する音
声分析手段と、前記情報源モデル及び前記雑音モデルに
基づいて前記抽出されたパラメータを量子化し、量子化
値に対応する符号を出力するパラメータ量子化手段とを
具備する構成を採る。
【0019】本発明の音声符号化装置のパラメータ量子
化手段は、雑音モデルに基づいて許容誤差の範囲を決定
し、パラメータとの誤差が前記許容誤差以下の符号を符
号帳の中から抽出し、情報源モデルに基づいて前記抽出
された符号の中で最も確からしい符号を送信符号として
選択する構成を採る。
【0020】これらの構成により、雑音モデルに基づい
てパラメータから送信符号の候補を抽出し、情報源モデ
ルに基づいて最終的な送信符号を決定することができる
ので、雑音の大きさを用いた場合に比べ、さらに、高品
質な音声符号化処理を実現することができる。
【0021】本発明の音声符号化装置のパラメータ量子
化手段は、雑音モデル及び情報源モデルに基づいて、入
力パラメータと量子化値の誤差を算出する際におけるパ
ラメータの各要素に対する重み付けを決定し、この決定
された重み付けに従ってパラメータを量子化する構成を
採る。
【0022】この構成により、雑音モデル及び情報源モ
デルに基づいてパラメータの各要素に重み付けを行い、
パラメータを量子化することができるので、雑音を含ま
ない信号に対する性能を劣化させることなく、雑音信号
成分に対して頑強で背景雑音環境下においても高品質な
音声符号化処理を実現することができる。
【0023】本発明の音声符号化装置のパラメータ量子
化手段は、雑音モデル及び情報源モデルから、入力信号
に雑音を含まない場合のパラメータ量子化値の出現確率
を推定し、この推定された出現確率と誤差値とを合わせ
た尤度に従って、パラメータを量子化する構成を採る。
【0024】この構成により、雑音モデル及び情報源モ
デルに基づいてパラメータ量子化値の出現確率を推定
し、パラメータを量子化することができるので、雑音を
含まない信号に対する性能を劣化させることなく、雑音
信号成分に対して頑強で背景雑音環境下においても高品
質な音声符号化処理を実現することができる。
【0025】本発明の無線通信装置は、上記いずれかに
記載の音声符号化装置を搭載する構成を採る。
【0026】この構成により、雑音信号成分に対して頑
強で背景雑音環境下においても高品質な音声符号化処理
を実現する無線通信システムを提供することができる。
【0027】本発明の音声符号化方法は、入力信号の雑
音区間を検出する工程と、検出された雑音区間の雑音の
大きさを推定する工程と、入力信号を分析してパラメー
タを抽出する工程と、雑音を含まない音声入力信号に対
するパラメータ列をモデル化した情報源モデル及び前記
雑音の大きさに基づいて前記抽出されたパラメータを量
子化し、量子化値に対応する符号を出力する工程とを有
することとした。
【0028】この方法により、雑音の大きさに応じてパ
ラメータから送信符号の候補を抽出し、情報源モデルに
基づいて最終的な送信符号を決定することができるの
で、雑音を含まない信号に対する性能を劣化させること
なく、雑音信号成分に対して頑強で背景雑音環境下にお
いても高品質な音声符号化処理を実現することができ
る。
【0029】本発明の音声符号化方法は、入力信号の雑
音区間を検出する工程と、検出された雑音区間の雑音モ
デルを推定する工程と、入力信号を分析してパラメータ
を抽出する工程と、雑音を含まない音声入力信号に対す
るパラメータ列をモデル化した情報源モデル及び前記雑
音モデルに基づいて前記抽出されたパラメータを量子化
し、量子化値に対応する符号を出力する工程とを有する
こととした。
【0030】この方法により、雑音モデルに基づいてパ
ラメータから送信符号の候補を抽出し、情報源モデルに
基づいて最終的な送信符号を決定することができるの
で、雑音の大きさを用いた場合に比べ、さらに、高品質
な音声符号化処理を実現することができる。
【0031】本発明の記録媒体は、コンピュータに、入
力信号の雑音区間を検出させる手順と、検出された雑音
区間の雑音の大きさを推定させる手順と、入力信号を分
析してパラメータを抽出させる手順と、雑音を含まない
音声入力信号に対するパラメータ列をモデル化した情報
源モデル及び前記雑音の大きさに基づいて前記抽出され
たパラメータを量子化させ、量子化値に対応する符号を
出力させる手順とを実行させるための音声符号化プログ
ラムを記録した機械読み取り可能なものである。
【0032】これにより、雑音の大きさに応じてパラメ
ータから送信符号の候補を抽出し、情報源モデルに基づ
いて最終的な送信符号を決定することができるので、雑
音を含まない信号に対する性能を劣化させることなく、
雑音信号成分に対して頑強で背景雑音環境下においても
高品質な音声符号化処理を実現することができる。
【0033】本発明の記録媒体は、コンピュータに、入
力信号の雑音区間を検出させる手順と、検出された雑音
区間の雑音モデルを推定させる手順と、入力信号を分析
してパラメータを抽出させる手順と、雑音を含まない音
声入力信号に対するパラメータ列をモデル化した情報源
モデル及び前記雑音モデルに基づいて前記抽出されたパ
ラメータを量子化させ、量子化値に対応する符号を出力
させる手順とを実行させるための音声符号化プログラム
を記録した機械読み取り可能なものである。
【0034】これにより、雑音モデルに基づいてパラメ
ータから送信符号の候補を抽出し、情報源モデルに基づ
いて最終的な送信符号を決定することができるので、雑
音の大きさを用いた場合に比べ、さらに、高品質な音声
符号化処理を実現することができる。
【0035】
【発明の実施の形態】本発明の骨子は、雑音の大きさ又
は雑音モデルに加えて情報源モデルを用いてパラメータ
量子化を実行することである。
【0036】以下、本発明の実施の形態について、添付
図面を参照して詳細に説明する。
【0037】(実施の形態1)図1は、本発明の実施の
形態1に係る音声符号化装置の構成を示すブロック図で
ある。
【0038】図1において、雑音区間検出部101は、
入力信号を音声区間とそれ以外の区間を分離し、音声区
間以外の信号を背景雑音として検出する。雑音レベル推
定部102は、雑音区間検出部101にて検出された雑
音区間の雑音レベル(雑音の大きさ)を推定する。
【0039】情報源モデル記憶部103は、雑音を含ま
ない音声入力信号に対するパラメータ列をモデル化した
情報源モデルを記憶する。音声分析部104は、入力信
号を分析してパラメータを抽出する。
【0040】パラメータ量子化部105は、情報源モデ
ル及び雑音レベルに基づいて音声分析部104にて抽出
されたパラメータを量子化し、量子化値に対応する符号
を出力する。
【0041】図2は、本実施の形態に係る音声符号化装
置のパラメータ量子化部105の内部構成を示すブロッ
ク図である。
【0042】図2において、許容誤差レベル決定器20
1は、雑音レベル推定部102にて推定された雑音レベ
ルに応じて許容誤差を決定する。
【0043】符号帳202は、送信符号に対応する量子
化値を蓄積している。符号抽出器203は、音声分析部
104にて抽出されたパラメータとの誤差が許容誤差以
下の符号を、符号帳202の中から抽出する。
【0044】符号選択器204は、情報源モデルに基づ
いて、符号抽出器203にて抽出された符号の中で最も
確からしい符号を送信符号として選択する。
【0045】このように、雑音レベルに応じてパラメー
タから送信符号の候補を抽出し、情報源モデルに基づい
て最終的な送信符号を決定することにより、雑音を含ま
ない信号に対する性能を劣化させることなく、雑音信号
成分に対して頑強で背景雑音環境下においても高品質な
音声符号化処理を実現することができる。
【0046】(実施の形態2)図3は、本発明の実施の
形態2に係る音声符号化装置の構成を示すブロック図で
ある。図3の音声符号化装置は、図1と比較して、雑音
レベル推定部102の代りに、雑音モデル推定部301
を有する構成を採る。
【0047】なお、図3の音声符号化装置において、図
1と共通する構成部分には図1と同一符号を付して説明
を省略する。
【0048】雑音モデル推定部301は、雑音区間検出
部101にて検出された雑音区間において、例えば、雑
音信号の振幅周波数特性のような雑音モデルを推定す
る。
【0049】パラメータ量子化部105は、音声分析部
104にて抽出されたパラメータを、情報源モデル及び
雑音モデルから得られるパラメータ列の確からしさに基
づいて量子化し、量子化値に対応する符号を出力する。
【0050】図4は、本実施の形態に係る音声符号化装
置のパラメータ量子化部105の内部構成を示すブロッ
ク図である。図4のパラメータ量子化部105は、図2
と比較して、許容誤差レベル決定器201の代りに、許
容誤差範囲決定器401を有する構成を採る。
【0051】なお、図4のパラメータ量子化部105に
おいて、図2と共通する構成部分には図1と同一符号を
付して説明を省略する。
【0052】図4において、許容誤差範囲決定器201
は、雑音モデル推定部301にて推定された雑音モデル
に基づいて許容誤差の範囲を決定する。雑音モデルを考
慮することにより、雑音重畳度合いの分散をベクトル量
子化における各要素毎に設定することができる。
【0053】符号抽出器203は、音声分析部104に
て抽出されたパラメータとの誤差が許容誤差の範囲に入
っている符号を、符号帳202の中から抽出する。
【0054】このように、雑音モデルに基づいてパラメ
ータから送信符号の候補を抽出し、情報源モデルに基づ
いて最終的な送信符号を決定することにより、雑音レベ
ルを用いた場合に比べ、さらに、高品質な音声符号化処
理を実現することができる。
【0055】(実施の形態3)図5は、本発明の実施の
形態3に係る音声符号化装置のパラメータ量子化部10
5の内部構成を示すブロック図である。
【0056】なお、本実施の形態に係る音声符号化装置
の構成は、実施の形態1の図1に示した音声符号化装置
の構成と同様であるので説明を省略する。
【0057】図5において、誤差算出重み決定器501
は、雑音レベル推定部102にて推定された雑音レベル
及び情報源モデルに基づいて、入力パラメータと量子化
値の誤差を算出する際におけるパラメータの各要素に対
する重み付けを決定する。
【0058】例えば、CELP音声符号化方式における
雑音音源を符号化する場合、適応音源のパワー包絡に相
関があるパラメータ要素の誤差値が小さくなるように重
み付けを行う。
【0059】符号帳502は、送信符号に対応する量子
化値を蓄積している。量子化器503は、誤差算出重み
決定器501にて決定された重み付けに従って、音声分
析部104にて抽出されたパラメータを、符号帳502
を用いて量子化する。
【0060】このように、雑音レベル及び情報源モデル
に基づいてパラメータの各要素に重み付けを行い、パラ
メータを量子化することにより、雑音を含まない信号に
対する性能を劣化させることなく、雑音信号成分に対し
て頑強で背景雑音環境下においても高品質な音声符号化
処理を実現することができる。
【0061】なお、上記の説明においては、雑音レベル
を用いる場合について説明したが、本実施の形態は、実
施の形態2で説明した雑音モデルを用いて、重み付け処
理を行うこともできる。
【0062】(実施の形態4)図6は、本発明の実施の
形態4に係る音声符号化装置のパラメータ量子化部10
5の内部構成を示すブロック図である。
【0063】なお、本実施の形態に係る音声符号化装置
の構成は、実施の形態1の図1に示した音声符号化装置
の構成と同様であるので説明を省略する。
【0064】図6において、符号出現確率算出器601
は、雑音レベル推定部102にて推定された雑音レベル
及び情報源モデルから、入力信号に雑音を含まない場合
のパラメータ量子化値の出現確率を推定する。
【0065】符号帳602は、送信符号に対応する量子
化値を蓄積している。量子化器603は、符号出現確率
算出器601にて推定された出現確率と誤差値とを合わ
せた尤度に従って、音声分析部104にて抽出されたパ
ラメータを、符号帳602を用いて量子化する。
【0066】このように、雑音レベル及び情報源モデル
に基づいてパラメータ量子化値の出現確率を推定し、パ
ラメータを量子化することにより、雑音を含まない信号
に対する性能を劣化させることなく、雑音信号成分に対
して頑強で背景雑音環境下においても高品質な音声符号
化処理を実現することができる。
【0067】なお、上記の説明においては、雑音レベル
を用いる場合について説明したが、本実施の形態は、実
施の形態2で説明した雑音モデルを用いて、重み付け処
理を行うこともできる。
【0068】
【発明の効果】以上説明したように、本発明の音声符号
化装置及び音声符号化方法によれば、雑音モデルの精度
に対する依存度が少なく、雑音信号成分に対して頑強で
背景雑音環境下においても高品質な音声符号化処理を実
現することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1に係る音声符号化装置の
構成を示すブロック図
【図2】上記実施の形態に係る音声符号化装置のパラメ
ータ量子化部の内部構成を示すブロック図
【図3】本発明の実施の形態2に係る音声符号化装置の
構成を示すブロック図
【図4】上記実施の形態に係る音声符号化装置のパラメ
ータ量子化部の内部構成を示すブロック図
【図5】本発明の実施の形態3に係る音声符号化装置の
パラメータ量子化部の内部構成を示すブロック図
【図6】本発明の実施の形態4に係る音声符号化装置の
パラメータ量子化部の内部構成を示すブロック図
【図7】従来の音声符号化装置の構成を示すブロック図
【符号の説明】
101 雑音区間検出部 102 雑音レベル推定部 103 情報源モデル記憶部 104 音声分析部 105 パラメータ量子化部 201 許容誤差レベル決定器 202、502、602 符号帳 203 符号抽出器 204 符号選択器 301 雑音モデル推定部 401 許容誤差範囲決定器 501 誤差算出重み決定器 503、603 量子化器 601 符号出現確率算出器

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力信号の雑音区間を検出する雑音区間
    検出手段と、検出された雑音区間の雑音の大きさを推定
    する雑音レベル推定手段と、雑音を含まない音声入力信
    号に対するパラメータ列をモデル化した情報源モデルを
    記憶する情報源モデル記憶手段と、入力信号を分析して
    パラメータを抽出する音声分析手段と、前記雑音の大き
    さに応じて許容誤差を決定し、パラメータとの誤差が前
    記許容誤差以下の符号を符号帳の中から抽出し、前記情
    報源モデルに基づいて前記抽出された符号の中で最も確
    からしい符号を送信符号として選択するパラメータ量子
    化手段とを具備することを特徴とする音声符号化装置。
  2. 【請求項2】 入力信号の雑音区間を検出する雑音区間
    検出手段と、検出された雑音区間の雑音の大きさを推定
    する雑音レベル推定手段と、雑音を含まない音声入力信
    号に対するパラメータ列をモデル化した情報源モデルを
    記憶する情報源モデル記憶手段と、入力信号を分析して
    パラメータを抽出する音声分析手段と、前記雑音の大き
    さ及び前記情報源モデルから入力信号に雑音を含まない
    場合のパラメータ量子化値の出現確率を推定し、この推
    定された出現確率と誤差値とを合わせた尤度に従って、
    パラメータを量子化するパラメータ量子化手段とを具備
    することを特徴とする音声符号化装置。
  3. 【請求項3】 入力信号の雑音区間を検出する雑音区間
    検出手段と、検出された雑音区間における雑音モデルを
    推定する雑音モデル推定手段と、雑音を含まない音声入
    力信号に対するパラメータ列をモデル化した情報源モデ
    ルを記憶する情報源モデル記憶手段と、入力信号を分析
    してパラメータを抽出する音声分析手段と、前記雑音モ
    デルに基づいて許容誤差の範囲を決定し、パラメータと
    の誤差が前記許容誤差以下の符号を符号帳の中から抽出
    し、前記情報源モデルに基づいて前記抽出された符号の
    中で最も確からしい符号を送信符号として選択するパラ
    メータ量子化手段とを具備することを特徴とする音声符
    号化装置。
  4. 【請求項4】 入力信号の雑音区間を検出する雑音区間
    検出手段と、検出された雑音区間における雑音モデルを
    推定する雑音モデル推定手段と、雑音を含まない音声入
    力信号に対するパラメータ列をモデル化した情報源モデ
    ルを記憶する情報源モデル記憶手段と、入力信号を分析
    してパラメータを抽出する音声分析手段と、前記雑音モ
    デル及び前記情報源モデルから入力信号に雑音を含まな
    い場合のパラメータ量子化値の出現確率を推定し、この
    推定された出現確率と誤差値とを合わせた尤度に従っ
    て、パラメータを量子化するパラメータ量子化手段とを
    具備することを特徴とする音声符号化装置。
JP28146699A 1999-10-01 1999-10-01 音声符号化装置及び音声符号化方法 Expired - Fee Related JP3315956B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP28146699A JP3315956B2 (ja) 1999-10-01 1999-10-01 音声符号化装置及び音声符号化方法
AU74473/00A AU7447300A (en) 1999-10-01 2000-09-28 Voice encoding device and voice encoding method
PCT/JP2000/006689 WO2001026094A1 (fr) 1999-10-01 2000-09-28 Dispositif de codage vocal et procede de codage vocal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28146699A JP3315956B2 (ja) 1999-10-01 1999-10-01 音声符号化装置及び音声符号化方法

Publications (2)

Publication Number Publication Date
JP2001109496A JP2001109496A (ja) 2001-04-20
JP3315956B2 true JP3315956B2 (ja) 2002-08-19

Family

ID=17639585

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28146699A Expired - Fee Related JP3315956B2 (ja) 1999-10-01 1999-10-01 音声符号化装置及び音声符号化方法

Country Status (3)

Country Link
JP (1) JP3315956B2 (ja)
AU (1) AU7447300A (ja)
WO (1) WO2001026094A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3079151A1 (en) * 2015-04-09 2016-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and method for encoding an audio signal

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08328598A (ja) * 1995-05-26 1996-12-13 Sanyo Electric Co Ltd 音声符号化・復号化装置
JPH10307598A (ja) * 1997-05-09 1998-11-17 Hitachi Ltd 音声符号化送信装置

Also Published As

Publication number Publication date
AU7447300A (en) 2001-05-10
JP2001109496A (ja) 2001-04-20
WO2001026094A1 (fr) 2001-04-12

Similar Documents

Publication Publication Date Title
CN104966517B (zh) 一种音频信号增强方法和装置
JP4491210B2 (ja) 再帰的構成における反復ノイズ推定法
JP4316583B2 (ja) 特徴量補正装置、特徴量補正方法および特徴量補正プログラム
KR100636317B1 (ko) 분산 음성 인식 시스템 및 그 방법
EP1667112B1 (en) Apparatus, method and medium for coding an audio signal using correlation between frequency bands
JP4245617B2 (ja) 特徴量補正装置、特徴量補正方法および特徴量補正プログラム
KR101201146B1 (ko) 최적의 추정을 위한 중요한 양으로서 순간적인 신호 대 잡음비를 사용하는 잡음 감소 방법
US9467790B2 (en) Reverberation estimator
US6389389B1 (en) Speech recognition using unequally-weighted subvector error measures for determining a codebook vector index to represent plural speech parameters
JP2005527002A (ja) ノイズの低減に関連する不確実性を判定する方法
CA2786803A1 (en) Method and apparatus for multi-sensory speech enhancement
CN1534598A (zh) 采用增量贝叶斯学习进行噪声估计的方法
JP2010160506A (ja) 分散音声認識プロセスにおけるエラーの軽減方法および装置
JP5639273B2 (ja) ピッチサイクルエネルギーを判断し、励起信号をスケーリングすること
US8392177B2 (en) Method and apparatus for frequency encoding, and method and apparatus for frequency decoding
WO2007041789A1 (en) Front-end processing of speech signals
JP2002140093A (ja) ノイズ含有スピーチのドメインにおいて音響空間の区分、補正およびスケーリング・ベクトルを用いたノイズ低減方法
JP3315956B2 (ja) 音声符号化装置及び音声符号化方法
KR100508618B1 (ko) 피치 주기 탐색 범위 설정 장치, 피치 주기 탐색 장치,적응 음원 벡터의 생성 장치, 음성 부호화 장치, 음성복호화 장치, 음성 신호 송신 장치, 음성 신호 수신 장치,이동국 장치 및 기지국 장치
Bernard et al. Joint channel decoding-Viterbi recognition for wireless applications
JP4603429B2 (ja) クライアント・サーバ音声認識方法、サーバ計算機での音声認識方法、音声特徴量抽出・送信方法、これらの方法を用いたシステム、装置、プログラムおよび記録媒体
JPH07111456A (ja) 音声圧縮方法および装置
CN111081264B (zh) 一种语音信号处理方法、装置、设备及存储介质
JP3194930B2 (ja) 音声符号化装置
CN112908346B (zh) 丢包恢复方法及装置、电子设备和计算机可读存储介质

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080607

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090607

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100607

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100607

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110607

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120607

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120607

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130607

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees