JPH0713600A - 駆動同期時間符号化ボコーダおよび方法 - Google Patents

駆動同期時間符号化ボコーダおよび方法

Info

Publication number
JPH0713600A
JPH0713600A JP6136501A JP13650194A JPH0713600A JP H0713600 A JPH0713600 A JP H0713600A JP 6136501 A JP6136501 A JP 6136501A JP 13650194 A JP13650194 A JP 13650194A JP H0713600 A JPH0713600 A JP H0713600A
Authority
JP
Japan
Prior art keywords
signal
input
speech
drive
coupled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6136501A
Other languages
English (en)
Inventor
Bruce A Fette
ブルース・エイ・フェット
Chad S Bergstrom
チャド・エス・バーグストロム
Sean S You
シーン・エス・ユー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Solutions Inc
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of JPH0713600A publication Critical patent/JPH0713600A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0012Smoothing of parameters of the decoder interpolation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 コスト、複雑さおよび高い電力消費を避け、
かつデータレートを犠牲にせずに高い忠実度を実現可能
な駆動同期時間符号化ボコーダを実現する。 【構成】 音声信号の駆動同期時間符号化のための方法
である。該方法は入力音声信号を提供する段階、入力音
声信号を処理してリニア予測符号化(LPC)係数、エ
ポック長および発声を含む特質を特徴づける段階、およ
び入力音声信号が有声音声からなる場合に入力音声信号
を単一エポックの時間領域のベースで特徴づけてパラメ
ータ化された有声音駆動関数を提供する段階を含む。前
記方法はさらに入力音声信号が無声音声からなる場合に
フレームの少なくとも一部に対し入力音声信号を特徴づ
けてパラメータ化された無声音駆動関数を提供する段
階、および前記無声音駆動関数および前記有声音駆動関
数を含む複合駆動関数を符号化して入力音声信号を表す
デジタル出力信号を提供する段階を含む。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は一般的にはデジタル的
に符号化された人間の声(human speech)
の分野に関し、特にコーディングおよびデコーディング
技術に関し、さらにより特定的には音声をデジタル的に
符号化するための高忠実度技術、低減された帯域幅要求
によってデジタル的に符号化された高忠実度音声信号を
送信しかつデジタル符号から高忠実度音声信号を合成す
るための高忠実度技術に関する。
【0002】この出願は、1992年7月14日に出願
され、「低ビットレートボコーダ手段および方法(Lo
w Bit Rate Vocoder Means
and Method)」と題する、同時係属の日本特
許出願、および本願と同じ日に出願された、「ピッチエ
ポック同期リニア予測符号化ボコーダおよび方法(Pi
tch Epoch Synchronous Lin
ear Predictive Coding Voc
oder And Method)」と題する特許出願
に関連しており、これらの特許出願はともに本件出願と
同じ譲受人に譲渡されている。
【0003】
【従来の技術】明瞭な音声信号を提供するために音声信
号をデジタル的に符号化しおよび/またはデジタル信号
をデコードすることは保安された通信能力、デジタルリ
ンクを介する通信またはコンピュータ命令から得られる
音声出力信号を提供する数多くの電子製品にとって重要
である。
【0004】多くのデジタル音声システムは合成された
音声において貧弱な知覚品質をもたらす。入力音声に基
づく要素の不十分な特徴づけ、帯域幅の制限、および符
号化されたデジタル表現からの合成された音声信号の引
き続く再構築または再生は全て合成された音声品質の知
覚的な劣化に寄与する。さらに、いくらかの情報伝達容
量が失われ、微妙であるが重要なメッセージを伝達する
通話者によって加えられたニュアンス、イントネーショ
ンおよび強調がデジタル形式で送信される音声信号の符
号化およびその後のデコードにおける汚染によって種々
の程度で失われる。
【0005】特に、自己回帰リニア予測符号化(aut
o−regressive linear predi
ctive coding:LPC)技術は全てポール
を有しゼロを持たない(all poles and
no zeroes)システムの伝達関数を構成する。
これらの従来技術の符号化技術および特にリニア予測符
号化分析を使用するものは(本質的に人間の声の装置を
記述する伝達関数における「ゼロ」を提供する)鼻孔
(nasal cavities)からの全ての共鳴の
寄与を無視する傾向がありかつその結果不自然に「安っ
ぽい(tinny)」または「鼻にかかる(nasa
l)」品質を有する音声を再生することになる。
【0006】音声をデジタル的に符号化しかつデコード
するための標準的な技術は一般的にかなりの計算機的な
複雑さを有する信号処理分析技術を使用する。さらに、
そこから得られるデジタル信号は高い品質のリアルタイ
ムの通信を実現する場合にはかなり多くの帯域幅を必要
とする。
【0007】
【発明が解決しようとする課題】必要なことは音声信号
をそのデジタル表現に役立つように迅速にかつ正確に特
特徴づける(characterize)ための装置お
よび方法、ならびにデジタル帯域幅を節約しながら高い
忠実度を提供しかつ計算機的な複雑さおよび電力要求の
双方を低減するデジタル表現から音声信号を提供するた
めの合成方法および装置である。
【0008】
【課題を解決するための手段および作用】簡単にいえ
ば、本発明によれば、デジタル音声表現および再生のた
めの新規な改善された装置およびそのための方法が提供
される。
【0009】第1の好ましい実施例においては、本発明
は音声信号の駆動同期時間符号化(excitatio
n synchronous time encodi
ng)のための方法からなる。この方法は入力音声信号
を提供する段階、入力音声信号を処理してリニア予測符
号化係数、エポック長(epoch length)お
よび発声(voicing)を含む品質を特徴づける段
階、そして入力音声が有声音を含む場合は、該入力音声
を単一エポックのベースで特徴づけて単一エポック音声
パラメータを提供しかつ該単一エポック音声パラメータ
をベクトル量子化コードブック(vector qua
ntizer codebook)を使用して符号可し
有声音を表すデジタル信号を提供する段階を含む。
【0010】第2の好ましい実施例においては、本発明
はデジタル信号を駆動同期時間デコードして音声信号を
提供する方法からなる。該方法は音声を表す入力デジタ
ル信号を提供する段階、および前記入力デジタル信号が
有声音声(voiced speech)を表すことを
判定する段階を含む。該方法はリニア予測符号化パラメ
ータを補間する段階、有声駆動関数を再構築する段階、
および前記再構築された有声駆動関数をラチス合成フィ
ルタに提供することにより前記再構築された有声駆動関
数から音声を合成する段階を行なう。
【0011】前記入力デジタルデータが無声音を表す
時、前記方法は、必須のことではないが、望ましくは一
連の連続する二乗平均(RMS)振幅をデコードする段
階、および前記一連の連続するRMS振幅から得られた
駆動エンベロープ(excitation envel
ope)によってノイズ発生器を変調し前記再構築され
た無声音駆動関数から合成された無声音を提供する段階
を含む。
【0012】他の好ましい実施例においては、本発明は
音声信号の駆動同期時間符号化のための装置を含む。該
装置は入力および出力を有するフレーム同期リニア予測
符号化(LPC)装置を具備する。前記入力は入力音声
信号を受入れかつ前記出力は前記入力信号の第1の部分
を記述する第1のグループのLPC係数および前記入力
音声信号の第2の部分を記述する駆動関数を提供する。
前記装置はまた前記駆動波形のエポック長を計算するた
めの自己相関器およびピッチフィルタを含む。前記ピッ
チフィルタは前記自己相関器に結合された入力および前
記駆動波形のピッチ特性を記述する3つの係数を含む出
力信号を有する。前記装置はまた前記ピッチフィルタの
出力、前記相関器の出力、およびフレーム同期LPC装
置の出力に結合されたフレーム発声(frame vo
icing)決定装置を含む。フレーム発声決定装置は
あるフレームが有声音であるかあるいは無声音であるか
を決定する。前記装置はまたあるフレーム長を構成する
一連の連続したタイムスロットにおける代表的な信号レ
ベルを計算するための装置を含む。代表的な信号レベル
を計算するための装置は前記フレーム発声決定装置に結
合されかつ前記フレーム発声決定装置がそのフレームが
無声音であることを指示した場合に動作する。前記装置
はまた代表的な信号レベルを計算するための前記装置に
結合されたベクトル量子化コードブックを含む。該ベク
トル量子化コードブックは入力音声信号に対応するベク
トル量子化デジタル信号を提供する。
【0013】前記装置は、必須のことではないが、望ま
しくは音声データのフレーム内のエポック駆動位置を決
定するための装置を含む。該決定装置は前記フレーム発
声決定装置に結合されかつ前記フレーム発声決定装置が
あるフレームが有声音(voiced)であることを決
定した場合に動作する。第2のリニア予測符号化装置は
入力音声信号を受入れるための第1の入力とエポック駆
動位置を決定するための前記装置に結合された第2の入
力を有する。前記第2のLPC装置は入力音声信号を特
徴づけて、(1)前記入力音声信号の第1の部分を記述
する第2のグループのLPC係数を提供し、かつ(2)
前記入力音声信号の第2の部分を記述する第2の駆動関
数を提供する。前記第2のグループのLPC係数および
前記第2の駆動関数は単一エポックの音声パラメータを
構成する。前記装置はさらに目標駆動関数(targe
t excitation function)を提供
するために最小エンベロープエラーに基づき前記第2の
駆動関数の一部の中から補間駆動目標を選択するための
装置を含む。前記補間駆動目標選択装置の入力は前記第
2のLPC装置に結合されている。前記選択するための
装置は前記符号化装置に結合された出力を有する。
【0014】前記装置は、必須のものではないが、望ま
しくはさらに第1〜第5の発声フラグ(voicing
flags)をセットするための第1〜第5の決定装
置を含む。前記第1の決定装置は前記第1のグループの
LPC係数からのリニア予測ゲイン係数が第1のしきい
値を越えているかあるいは第1のしきい値に等しい場合
に第1の発声フラグを「有声」にセットし、かつそれ以
外では前記第1の発声フラグを「無声」にセットする。
前記第2の決定装置は前記多数の係数の内の第2のもの
が第2のしきい値を越えているかあるいは等しい場合、
あるいは前記ピッチフィルタのピッチゲインが第3のし
きい値を越えているかまたは第3のしきい値に等しい場
合に第2の発声フラグを「有声」にセットし、かつそれ
以外では前記第2の発声フラグを「無声」にセットす
る。第3の決定装置は前記多数の係数の内の第2のもの
が前記第2のしきい値を越えているかあるいは第2のし
きい値に等しくかつリニア予測符号化ゲインが第4のし
きい値を越えているかあるいは第4のしきい値に等しい
場合に第3の発声フラグを「有声」にセットし、かつそ
れ以外では第3の発声フラグを「無声」にセットする。
前記第4の決定装置は前記リニア予測符号化ゲインが第
4のしきい値を越えているかあるいは第4のしきい値に
等しくかつピッチゲインが前記第3のしきい値を越えて
いるかあるいは等しい場合に第4の発声フラグを「有
声」にセットし、かつそれ以外では第4の発声フラグを
「無声」にセットする。前記第5の決定装置は前記第
1、第2、第3および第4の発声フラグのいずれかが
「有声」にセットされている時、前記リニア予測符号化
ゲインが第5のしきい値より小さくない時そして前記多
数の係数の内第2のものが第6のしきい値より小さくな
い場合に第5の発声フラグを「有声」にセットし、かつ
それ以外では第5の発声フラグを「無声」にセットす
る。前記フレームは前記第1、第2、第3および第4の
発声フラグの内のいずれかが「有声」にセットされてお
りかつ前記第5の発声フラグが有声にセットされている
場合に有声音であると判定される。前記フレームは前記
第1、第2、第3および第4の発声フラグの全てが「無
声」にセットされている場合に無声音であると判定され
る。前記フレームは第5の発声フラグが「無声」にセッ
トされていると判定された場合に無声音であると判定さ
れる。
【0015】さらに別の実施例では、前記装置は必須の
ことではないが望ましくは補間駆動目標を選択するため
の前記装置に結合された駆動重み「excitatio
nweighting)を選択するための装置を含む。
前記駆動重みを選択するための装置は男性の声に代表さ
れる第1のタイプの駆動のためのレーリー(Rayle
igh)形重み関数からなる第1のクラスの重み関数か
らの重み関数を提供し、かつ前記第1のタイプの駆動よ
りも高いピッチを有する第2のタイプの駆動のためのガ
ウス(Gaussian)形重み関数からなる第2のク
ラスの重み関数からの重み関数を提供する。前記第2の
タイプの駆動は女性の声に典型的なものである。目標駆
動関数を重み付け関数によって重み付けするための装置
は符号化装置に出力信号を提供する。前記重み付け装置
は駆動重みを選択するための前記装置に結合されてい
る。
【0016】さらに別の好ましい実施例においては、本
発明は音声信号を提供するためにデジタル信号の駆動同
期時間デコードのための装置を含む。該装置は符号化さ
れた音声を表すデジタル信号を受けるための入力および
該入力に結合されたベクトル量子化コードブックを含
む。該ベクトル量子化コードブックは前記デジタル信号
から量子化された信号を提供する。フレーム発声決定装
置が前記ベクトル量子化コードブックに結合されてい
る。前記フレーム発声決定装置は前記量子化された信号
が有声音を表すことおよび前記量子化された信号が無声
音を表すことを判定する。無声音の駆動を表す隣接する
レベルの間を補間するための装置が前記フレーム発声決
定装置に結合される。ランダムノイズ発生器が前記補間
装置に結合される。該ランダムノイズ発生器は前記補間
装置からの信号に応じて振幅変調されたノイズ信号を提
供する。ラチス合成フィルタは前記ランダムノイズ発生
器に結合されかつ振幅変調されたノイズ信号から無声音
を合成する。
【0017】前記装置は、必須のものではないが、望ま
しくは前記フレーム発声決定装置に結合されたリニア予
測符号化(LPC)パラメータ補間装置を含む。該LP
Cパラメータ補間装置は前記量子化された信号が有声音
を表す場合に前記量子化された信号において提供される
引き続くLPCパラメータの間を補間して補間されたL
PCパラメータを提供し、かつラチス合成フィルタ装置
が前記LPCパラメータ補間装置に結合されて前記量子
化された信号および補間されたLPCパラメータから有
声音を合成する。
【0018】前記装置は、必須のものではないが、望ま
しくはさらに目標駆動関数の間に挿入された連続する駆
動関数を補間するための装置を含む。この連続する駆動
関数を補間するための装置は前記LPCパラメータ補間
装置に結合された入力および前記ラチス合成フィルタ装
置に結合された出力を有する。目標駆動関数の間を補間
するための前記装置は第1のフレームにおける第1の目
標エポックと第1のフレームに隣接する第2のフレーム
における第2の目標エポックの間におけるエポックの目
標駆動関数の間を補間する。前記ラチス合成フィルタ装
置は前記補間されたLPCパラメータおよび前記補間さ
れた連続する駆動関数から有声音を合成する。
【0019】本発明の他の好ましい実施例は通信装置で
あって、該通信装置は入力音声信号を受けるための入
力、前記入力に結合され前記入力音声信号をデジタル的
に符号化するための音声デジタイザおよび前記デジタル
的に符号化された入力音声信号を送信するための出力を
有する。前記出力は音声デジタイザに結合されている。
デジタル入力はデジタル的に符号化された音声信号を受
入れかつ音声シンセサイザに結合されており、該音声シ
ンセサイザは前記デジタル的に符号化された音声信号か
ら音声信号を合成する。前記音声シンセサイザはベクト
ル量子化コードブックに結合されたフレーム発声決定装
置を含む。該フレーム発声決定装置は前記ベクトル量子
化コードブックからの中間信号が有声音を表すことおよ
び該中間信号が無声音を表すことを判定する。無声音を
表す連続する信号レベルの間を補間するための装置が前
記フレーム発声決定装置に結合されている。ランダムノ
イズ発生器が前記補間装置に結合されている。該ランダ
ムノイズ発生器は前記補間装置によって決定されるレベ
ルまで変調されたノイズ信号を提供する。出力がランダ
ムノイズ発生器に結合され、該ランダムノイズ発生器は
前記変調されたノイズ信号から無声音を合成する。
【0020】前記通信装置は必須のものではないが望ま
しくはガウス乱数発生器を含む。
【0021】本発明の第3の好ましい実施例は音声信号
の駆動同期時間符号化のための方法を含む。該方法は入
力音声信号を提供する段階、リニア予測係数、エポック
長および発声(voicing)を含む品質特性を特徴
づけるために入力信号を処理する段階を含む。入力信号
が有声音からなる場合、該入力音声信号は単一エポック
時間領域のベースで特徴づけられてパラメータ化された
有声駆動関数を提供する。
【0022】
【実施例】本発明は特に添付の特許請求の範囲において
指摘されている。しかしながら、本発明のより完全な理
解は添付の図面とともに以下の詳細な説明および特許請
求の範囲を参照することにより得られ、添付の図面にお
いては同様の項目は同様の参照数字で示されている。
【0023】図1は、本発明に係わる送信機10におけ
る音声デジタイザ15の構成を示すフローチャート形式
の単純化したブロック図である。音声入力11はサンプ
ルされた入力音声をハイパスフィルタ12に提供する。
ここで用いられている用語「駆動(excitatio
n)」、「駆動関数(excitation func
tion)」、「ドライブ関数(driving fu
nction)」および「駆動波形(excitati
on waveform)」は同じ意味を有し、かつリ
ニア予測符号化装置によってそこから出力信号の1つと
して提供される波形を言及している。ここで用いられて
いる用語「目標(target)」、「駆動目標(ex
citation target)」、および「目標エ
ポック(target epoch)」、は同じ意味を
有し、かつ第1に符号化装置における特徴づけのために
かつ第2にデコード装置における後の補間のために選択
されるエポックを言及している。
【0024】有声音声の主たる成分(例えば、“smo
oth”における“oo”)は便宜的にはゆっくりと変
化するエンベロープおよび周期を有する準周期的(qu
asi−periodic)かつ、インパルス様の(i
mpulse−like)ドライブ関数または駆動関数
として表される。この周期(period)は前記ドラ
イブ関数内の個々のインパルスからなる「ピッチ周期」
または「エポック」と称される。逆に、無声音声(例え
ば、“hiss”における“ss”)に関連するドライ
ブ関数は性質が非常にランダムでありかつシェーピング
された(shaped)ノイズ、すなわち、時変(ti
me−varying)エンベロープを有するノイズと
類似し、この場合該エンベロープの形状が主たる情報伝
達成分である。
【0025】複合有声/無声ドライブ波形はその出力が
得られた音声波形を提供するシステム伝達関数への入力
と考えることができる。前記複合駆動波形は人間の声に
対しては「駆動関数(excitation func
tion)」と称することができる。駆動関数の完全
で、効率的な特徴づけによって個々の通話者の独特の属
性について良好な近似を得ることができ、該属性は現在
まで低減された帯域幅の音声符号化方式では十分に表現
されずあるいはまったく無視されている。(例えば、L
PC10e)。
【0026】本発明に係わる構成では、音声信号は入力
11を介してハイパスフィルタ12へと供給される。ハ
イパスフィルタ12はリンク13を介してフレーム同期
リニア予測符号化(LPC)装置14に結合されてい
る。LPC装置14はリンク16を介して駆動関数を自
己相関器17に提供する。自己相関器17はτ、すなわ
ち前記準周期的駆動波形のサンプルにおける整数ピッチ
周期、を推定または計算する。前記駆動関数およびτの
計算値はリンク18を介してピッチフィルタ19に入力
され、該ピッチフィルタ19は入力音声信号に関連する
駆動関数構造を推定または計算する。ピッチフィルタ1
9は技術的に良く知られている(例えば、R.P.Ra
machandranおよびP.Kabalによる、I
EEE Transactions on Acous
tics,Speech andSignal Pro
cessing,vol.37,no.4、1989年
4月、における「音声符号化におけるピッチ予測フィル
タ(Pitch Prediction Filter
s In Speech Coding)」を参照)。
(フレーム同期LPC装置14からの)LPC予測ゲイ
ン、(自己相関器17からの)τ、(ピッチフィルタ1
9からの)ピッチフィルタ予測ゲイン、および(ピッチ
フィルタ19からの)フィルタ係数値の計算値は判断ブ
ロック22において入力音声データが有声入力音声デー
タを表すかあるいは無声入力音声データを表しているか
を判定するために使用される。
【0027】無声駆動データはリンク23を介してブロ
ック24に結合され、そこで連続するRMSレベルが計
算される。これらのRMSレベルを表す信号は次にリン
ク25を介して技術的に良く知られた総括的構成および
機能を有するベクトル量子化コードブック41に結合さ
れる。
【0028】典型的には、240サンプルからなる無声
駆動の30ミリセカンドのフレームが20の連続するタ
イムスロットに分割される。この例は単一フレームの分
析に関して与えられているが、当業者はより大きなある
いはより小さなブロックの情報を適切な結果とともにこ
のような方式で特徴づけることが可能なことを理解する
であろう。各タイムスロットの間に生じる駆動信号は分
析されかつ、便宜的にはRMS(二乗平均)レベルとし
て実現される、代表的なレベルによって特徴づけられ
る。無声フレーム構成の送信のためのこの有効な技術は
再生された無声音声信号の品質に大きな妥協を行なうこ
となくより込み入った周波数領域の高速フーリエ変換
(FFT)方法では不可能なレベルの計算機的な簡易化
を提供する。
【0029】有声駆動データはブロック24′において
時間領域で処理され、該ブロックにおいて音声特性が
「エポックごとの(per epoch)」ベースで分
析される。これらのデータはリンク26を介してブロッ
ク27に結合され、そこでエポックの位置が決定され
る。いったん該エポックの位置が駆動波形内で決定され
ると、前記整数値τの洗練された推定値または計算値が
決定できる。1つの音声のフレーム内のN個のエポック
位置に対し、N−1の個々のエポック周期が平均化され
て、「フラクショナルピッチ(fractional
pitch)」としても知られている、端数部分(fr
actional portion)を含む改善された
τの推定値を提供する。受信機においては、前記エポッ
ク位置は前の目標位置およびτから適切なτの値だけ前
の目標位置から前に「ステップする」ことにより得られ
る。τの前記端数部分は長い周期の有声音声の間にかな
りのエラーが生じるのを防止する。受信機においてエポ
ック位置を決定するために整数のτの値のみを使用する
場合、得られた位置はかなりの「ウォーキングエラー
(walking error)」(累積エラー)を受
け得る。端数のτの値を使用することは整数のτの値の
みを使用するシステムにおいて固有の位置付けエラーを
効果的に除去する。
【0030】エポック位置の決定に続き、データはリン
ク28を介してブロック27′に結合され、そこで端数
ピッチが決定される。データは次にリンク28′を介し
てブロック29に結合され、そこで、共にリンク28′
を介して与えられる、エポック位置データ(ブロック2
7から)が与えられれば入力音声に関して駆動同期LP
C分析が行なわれる。このプロセスは改善されたLPC
係数および駆動関数を提供し、これらはリンク30を介
してブロック31に結合され、そこで単一の駆動エポッ
クが各フレームにおいて補間目標として選択される。最
適の目標駆動関数に対応する、(LPC装置29から
の)前記駆動同期LPC係数が係数補間目標として選択
される。(後に図4に関して説明する)受信機におい
て、省略した情報を再生するために補間によって統計的
に重み付けされた駆動関数および関連するLPC係数の
双方が利用される。送信機においては1組のLPC係数
および1つの駆動エポックのみが符号化されるから、残
りの駆動波形およびエポック同期係数は受信機において
前記選択された「目標」から得られなければならない。
送信された目標の間のリニア補間が首尾よく使用されて
失われた情報を再生し、もちろん他の非線形の方式も有
用である。したがって、送信機においてはフレームごと
に単一の駆動エポックのみが時間符号化され、介在する
エポックは受信機において補間によって満たされる。
【0031】駆動目標は閉ループ様式で選択することが
でき、それによって隣接フレームにおける候補の目標駆
動エポック(candidate target ex
citation epochs)によって形成される
エンベロープがもとの駆動のエンベロープと比較され
る。最低のまたは最も小さい補間エンべロープエラーと
なった前記候補目標駆動エポックがそのフレームに対す
る補間目標として選択される。目標選択のためのこの閉
ループ技術はエンべロープ「ヌル(nulls)」にわ
たる補間においてまたは得られるエンベロープにギャッ
プを生じさせる(不適切な)補間において遭遇するもの
のような、エンベロープエラーを低減する。そのような
エラーは前記影響を受けた駆動目標に対して適切なエン
ベロープを無視してランダムな様式で駆動目標選択が行
なわれればしばしば生じ得る。
【0032】選択されたエポックはリンク32を介して
ブロック33に結合され、そこで隣接フレームにおける
選択されたエポックは最適のエポックスタート指数(e
poch starting index)を決定しか
つ補間プロセスの実効性を増強するために相互相関され
る。2つの目標を相関することにより、補間の前に最大
相関指数シフトが位置づけ用オフセットとして導入でき
る。このオフセットは2つの目標の「フェーズ(pha
se)」を一致させることにより標準的な補間機構に関
して改善を行なう。補間の前にこの相関手順を行なわな
いことはしばしば受信機においてかなりの再生駆動エン
ベロープエラーを生じることにつながる。
【0033】例えば、そのような場合に再生されたエン
ベロープの不自然な「ヌリング(nulling)」が
生じることがあり、再生された音声信号におけるかなり
の知覚的な不自然さにつながる。補間の前に最大相関オ
フセットを導入することにより、補間プロセスによって
再生されたエンベロープは元の駆動波形(入力音声から
得られる)により近密に類似する。本明細書ではこの相
関手順は送信機において実施されるものとして示されて
いるが、この技術はあるいは同様の有利な結果と共に受
信機において実施することもできる。
【0034】リンク34を介して結合された、前記相関
された目標(ブロック33)は処理されている音声サン
プルにとって適切な「統計的な」駆動重みが選択される
(ブロック36)プロセスにおいて重みづけされる。
【0035】典型的には、男性の声に関連する駆動にと
ってはレーリー(Rayleigh)形状の時間領域駆
動関数の重みづけ関数が適切である。そのような関数は
しばしば次の形式で表わされる。
【0036】
【式1】 yα2((x−a)/b)e−(x−a)2/b, x≧a y=0, x<a
【0037】この場合、aはxのインターセプトであ
り、かつx=a+(b/2)0.5は重みづけピーク位
置を規定する。また、αは比例を表わすものとする。あ
るいは、この形式の重みづけは通常左にシフトしたピー
クを有する累乗した(raised)コサイン関数とし
てまたはカイ二乗分布(chi−squared di
stribution)の形式として表現される。図2
は男性の声に関連した重みづけ駆動に適した代表的なレ
ーリー形駆動重みづけ関数のトレース273を含むグラ
フである。
【0038】これによって高品質の再生音声信号を提供
するために選択された目標エポックごとにおよそ20サ
ンプルが可能となり(80サンプルの典型的なエポック
長に対応する)、もちろん必要に応じてより多くのある
いはより少ない数のサンプルを使用できる。
【0039】より高いピッチの女性の声に関連する駆動
を表わすためにはより少ない数のサンプル(例えば、3
5の典型的なエポック長に対応する、およそ10サンプ
ル)がしばしば適切なものである。女性の声に対する適
切な駆動重み関数はガウス形状により類似する。そのよ
うな関数はしばしば次の形式で表わされる。
【0040】
【式2】yαe−(x−β)2/2σ
【0041】この場合、技術的に良く知られているよう
にβは平均値(mean)を表わしかつσは標準偏差を
表わす。あるいは、この形式の重みづけは通常累乗した
コサイン関数として表わされる。図3は女性の声に関連
した重みづけ駆動に適した代表的なガウス形駆動重み関
数のトレース373を含むグラフである。
【0042】1つの駆動エポックのみがデータのフレー
ムごとに時間符号化され、かつ駆動エポックの顕著な特
徴を適切に表現するためには少しの数の特徴づけサンプ
ルのみが必要とされる。目標駆動関数のインパルスに関
して適切な重みづけ関数を適用することにより、前記駆
動の通話者に依存する特徴がおおいに維持され、かつし
たがって再生された音声は元の入力音声の性格(ten
or)、特徴およびデータ伝達ニュアンスをより正確に
表わすことになる。適切な重みづけ関数を選択すること
により個々の駆動エポックの主たるエンベロープまたは
形状特徴を維持しながら送信のために必要なデータを低
減することができる。
【0043】二三の特徴づけサンプルに圧縮された、1
つの駆動エポックのみが各フレームにおいて使用される
から、得られたデジタル的に符号化された音声を送信す
るのに必要なデータレート(帯域幅)が低減される。送
信帯域幅の要求が低減されても受信機において高品質の
音声が生成される。無声音の特徴づけプロセス(ブロッ
ク24)と同様に、有声音の時間領域重みづけ/デコー
ド手順は周波数領域の技術に対してかなりの計算機的な
節約を可能にし、一方で本発明において成されているの
と同様に注意深く駆動特性をモデル化しないより単純な
または複雑でない技術に対してかなりの忠実度の有利性
を与える。
【0044】適切な駆動関数の重みづけ関数の選択(ブ
ロック36)に続き、前記重みづけ関数およびデータは
リンク37を介してブロック38に結合され、そこで駆
動目標が時間符号化され、すなわち、前記重みが目標に
適用される。得られたデータはリンク39を介してベク
トル量子化コードブック41にわたされる。
【0045】無声(リンク25)および有声(リンク3
9)音声を表わすデータはベクトル量子化コードブック
41を使用して符号化され、かつ符号化されたデジタル
出力信号はリンク42を介して送信媒体、暗号化装置そ
の他に結合される。
【0046】図4は、図1の送信機10のような装置に
よって与えられるデジタルデータのための受信機32に
おける音声シンセサイザ45をフローチャート形式で示
す単純化したブロック図である。受信機32は、暗号化
された受信データの解読、受信されたRFまたは光学的
データの復調、公衆交換電話システムへのインタフェー
スおよび/またはその他を提供する外部装置(図示せ
ず)からベクトル量子化コードブック43へと音声信号
を表わすデジタルデータを結合するデジタル入力44を
有する。ベクトル量子化コードブック43からのデコー
ドされたデータはリンク44′を介して判断ブロック4
6に結合され、該ブロック46はベクトル量子化データ
が有声フレームを表わすかあるいは無声フレームを表わ
すかを判定する。
【0047】リンク44′からのベクトル量子化データ
が無声音フレームを表わしている場合は、これらのデー
タはリンク47を介してブロック51に結合される。ブ
ロック51は隣接するRMSレベルの間をリニアに補間
して無声音駆動エンベロープを再生しかつその結果はガ
ウス乱数発生器53を振幅変調するためにリンク52を
介して送られ無声音の駆動信号を再生する。この無声音
の駆動関数はリンク54を介してラチス合成フィルタ
(lattice synthesis filte
r)62に結合される。62のようなラチス合成フィル
タは技術的に良く知られておりかつ、例えば、“Dig
ital Processing of Speech
Signls”L.R.RabinerおよびR.
W.Schafer(Prentice Hall、ア
メリカ合衆国ニュージャージー州、イングルウッド・ク
リフス、1978年)に記載されている。
【0048】ベクトル量子化データ(リンク44′)が
有声音の入力音声を表わしている場合、これらのデータ
はリンク56を介してLPCパラメータ補間器57に結
合され、該補間器57は(送信帯域幅の要求を低減する
ために送信されなかった)失われたLPC反射係数(L
PC reflection coefficiet
s)を補間する。リニア補間は(ブロック59)前のフ
レームにおける統計的に重みづけされた目標駆動エポッ
クから現在のフレームにおける統計的に重みづけされた
目標駆動エポックへと行なわれ、それによって符号化プ
ロセスの間に(すなわち、図1の送信機10の音声デジ
タイザ15において)捨てられた駆動波形を再生する。
フレーム内の駆動エンベロープおよびピッチの比較的ゆ
っくりした変動のため、これらの補間された鎖状につな
がれた駆動エポックは元の駆動の特徴に類似する。
【0049】再構築された駆動波形およびLPCパラメ
ータ補間器57からのLPC係数および駆動目標59の
間の補間はリンク61を介してラチス合成フィルタ62
に結合される。
【0050】有声音および無声音のフレームの双方に対
しラチス合成フィルタ62は外部装置(例えば、スピー
カ、イアホーン、その他、図4には示されていない)に
結合された高品質の出力音声を合成し、該出力音声は同
時に低減された帯域幅(例えば、毎秒2400ビットま
たはボー)を必要とする一方で入力音声信号に近密に類
似しかつ元の入力音声信号の独特の通話者に依存する属
性を維持する。
【0051】図5は、図1の送信機10において発声
(voicing)を判定するための判断ツリー装置6
2をフローチャート形式で示すより詳細なブロック図で
ある。判断ツリー装置62はリンク21を介して入力デ
ータを受信し、該入力データは判断ブロック63に結合
されかつ代表的な一連のしきい値と共に以下の表1に要
約されている。本発明に関連する技術の分野に習熟した
ものには表1に与えられた値は代表的なものでありかつ
他の組合わせの値もまた受け入れ可能な性能を提供する
ことを理解するであろう。
【0052】LPCG≧TH1、(すなわち、LPCゲ
イン係数が第1の有声音のしきい値を超えている)場
合、データはリンク66を介して判断ブロック67に結
合され、そうでない場合はデータはリンク64を介して
判断ブロック69に結合される。LPCGはどれだけ良
好に(あるいは劣悪に)予測された音声が元の音声を近
似しているかを示し、かつ元の音声波形のRMS振幅に
対する前記駆動のRMS振幅の比率の逆数によって形成
できる。
【0053】
【表1】 シンボル 量 ソース/値 −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− LPCG LPC フレーム同期 予測ゲインLPC14 PLG フィルタ ピッチフィルタ19 予測ゲイン(ピッチゲイン) ALPHA2 第2のフィルタ係数 ピッチフィルタ19 TH1 LPCG絶対有声音しきい値 4.1 TH2 ALPHA2有声音しきい値 0.2 TH3 PLG有声音しきい値 1.06 TH4 LPCG有声音しきい値 2.45 TH5 LPCG無声音しきい値 1.175 TH6 ALPHA2無声音しきい値 0.01 (発声判定およびそのソースまたはそのための値におい
て使用されるパラメータのためのシンボルおよび定義)
【0054】判断ブロック69はALPHA2≧TH2
であるか否か(すなわち、第2のフィルタ係数が第2の
有声音のしきい値より大きいか否か)を調べかつまたP
LG≧TH3であるか否か(すなわち、フィルタ予測ゲ
インが第3の有声音のしきい値を超えているか否か)を
調べる。ALPHA2は有声音に関連するものとして経
験的または実験的に決定される。ピッチゲインPLGは
ピッチフィルタ19からの係数がどれだけ良好に駆動関
数を予測するかについての尺度でありかつLPCGと同
様にして計算される。
【0055】判断ブロック69において調べられた双方
の条件が真であれば、データはリンク66を介して判断
ブロック67に結合され、そうでなければデータはリン
ク71を介して判断ブロック72に結合される。判断ブ
ロック72はALPHA2≧TH2であるか否かかつま
たLPCG≧TH4(すなわち、LPCゲイン係数が第
4の有声音のしきい値を超えているか否か)を調べる。
双方の条件が真である場合は、データはリンク66を介
して判断ブロック67に結合され、そうでない場合はデ
ータはリンク73を介して判断ブロック74に結合され
る。判断ブロック74はPLG≧TH3であるか否かか
つまたLPCG≧TH4であるか否かを調べる。両方の
条件が真である場合は、データはリンク66を介して判
断ブロック67に結合され、そうでない場合は入力音声
信号は「無声音」であるものと分類され、かつデータは
リンク76を介して出力23(図1を参照)に結合され
る。
【0056】判断ブロック67はLPCG≧TH5であ
るか否か(すなわち、LPCゲイン係数が第1の無声音
のしきい値を超えているか否か)かつまたALPHA2
≧TH6であるか否か(すなわち、第2のフィルタ係数
が第6の無声音のしきい値を超えているか否か)を調べ
る。双方の条件が真である場合は、入力音声信号は「有
声音(voiced)」であると分類され、かつデータ
はリンク68を介して出力26(図1を参照)に結合さ
れ、そうでない場合は入力音声信号は「無声音(unv
oiced)」であると分類されかつデータはリンク7
6を介して出力23に結合される。
【0057】〔実例〕図6は、本発明に係わる音声デジ
タイザ15(図1)および音声シンセサイザ45(図
4)を使用した音声通信装置77の非常に単純化したブ
ロック図である。音声デジタイザ15および音声シンセ
サイザ45はアメリカ合衆国、アリゾナ州、フェニック
スのモトローラ・インコーポレイテッドから入手可能な
DSP56001型、DSP56002型またはDSP
96002型のようなデジタル信号プロセッサにおける
アセンブリ言語プログラムとして実施できる。デジタル
信号処理集積回路に付随する、メモリ回路その他もまた
技術的に良く知られているように必要とされる。
【0058】音声通信装置77は音声入力11に結合さ
れた音声入力装置78を含む。音声入力装置78は、例
えば、マイクロホンはハンドセットマイクロホンでよ
く、あるいは電話または無線装置またはメモリ装置(図
示せず)または音声データの任意の他の発生源とするこ
とができる。音声入力11からの入力音声は図1および
図3並びに関連するテキストにおいて説明されたように
音声デジタイザ15によってデジタル化される。デジタ
ル化された音声は出力42を介して音声デジタイザ15
から出力される。
【0059】音声通信装置77は出力42に結合された
通信用プロセッサ79を含むことができ、リンク81を
介して出力信号を提供するために、技術的に良く知られ
ているように、ダイヤリング、スピーカホンの多重化、
変調、電話または無線ネットワークへの信号の結合、フ
ァクシミリ送信、デジタル信号(例えば、出力42から
のデジタル化された音声)の暗号化、データ圧縮、課金
機能および/またはその他のような、付加的な機能を達
成することができる。
【0060】同様に、通信用プロセッサ83はリンク8
2を介して到来信号を受信しかつ、技術的に良く知られ
ているように、適切な結合、スピーカホーンの多重化、
復調、暗号解読、ファクシミリ受信、データ伸長、課金
機能および/またはその他を提供することができる。
【0061】音声を表わすデジタル信号は通信用プロセ
ッサ83からリンク44を介して音声シンセサイザ45
に結合される。音声シンセサイザ45はリンク61を介
して音声信号に対応する電気信号を出力装置84に提供
する。出力装置84はスピーカ、ハンドセット受信エレ
メントまたはそのような信号を処理可能な任意の他の装
置とすることができる。
【0062】通信用プロセッサ79,83は物理的に別
個のプロセッサである必要はなく、むしろ通信用プロセ
ッサ79,83によって満たされる機能は、例えば、音
声デジタイザ15および/または音声シンセサイザ45
を提供する同じ装置によって実効できることが理解され
るであろう。
【0063】本発明の実施例においては、リンク81,
82は共通の双方向データリンクとすることが可能なこ
とが理解できる。本発明の実施例においては、通信用プ
ロセッサ79,83は共通のプロセッサとすることがで
きおよび/または音声または音声と他の信号、例えば、
テレビジョン、カムコーダ(camcorder)、そ
の他を表わすデジタルデータを記憶しあるいはその後に
処理するための装置へのリンクを含むものとすることが
できる。
【0064】音声通信装置77はしたがって音声信号を
デジタル的に符号化し、送信しかつデコードするための
新規な装置および方法を提供し、高忠実度の音声信号の
再生並びに与えられた忠実度レベルに対し低減された帯
域幅要求を可能にする。この発明において使用された独
自の駆動特徴づけおよび再生技術により大幅な帯域幅の
節約が可能になりかつ従来はずっと高いデータレートを
有するデジタルシステムにおいてのみ達成可能であった
デジタル音声品質を可能にする。
【0065】例えば、補間されたエンベロープエラーが
低減されあるいは最小化されるという意味でエポックを
選択しかつ好ましくは最適のエポックを選択し、その選
択されたエポックを適切な関数によって重みづけして必
要な情報の量を低減しかつ目標の相関が符号化プロセス
において実質的な利益および有利性を提供し、一方受信
機においてフレームからフレームへの補間によって前記
符号化された信号から入力音声信号の高忠実度の再構築
が可能になる。さらに、駆動(excitation)
の領域、組またはサンプルを一連の連続するウィンドウ
に分割しかつその連続するウィンドウの各々に対しRM
S信号レベルを測定することにより音声を表わす無声音
の駆動を特徴づけることにより信号処理の複雑さを大幅
に低減できる。
【0066】以上開示されたのは音声信号の駆動同期時
間符号化のための方法であって、該方法は入力音声信号
を提供する段階、該入力音声信号を処理してリニア予測
符号化係数、エポック長およびボイシングを含む特質を
特徴づける段階、そして、入力音声が有声音声からなる
場合には該入力音声を単一エポックをベースとして特徴
づけて単一エポックの音声パラメータを提供する段階、
そして前記単一エポックの音声パラメータを符号化して
有声音声を表わすデジタル信号を提供する段階を具備す
る。
【0067】前記単一エポックのベースで入力音声を特
徴づける段階は、さらに、音声データのフレーム内のエ
ポック駆動位置を決定しかつ音声データのフレームから
駆動データのフレームを決定する段階、駆動同期リニア
予測符号化(LPC)を行ない前記決定段階からのエポ
ック駆動位置に対応する同期LPC係数を提供する段
階、そして最小エンベロープエラーに基づき駆動データ
のフレーム内から補間駆動目標を選択して目標駆動関数
を提供する段階を具備し、この場合目標駆動関数は前記
同期LPC係数を含む単一エポックの音声パラメータを
含む。
【0068】補間目標を選択する前記段階はさらに前記
選択段階において選択された補間駆動目標を駆動データ
の隣接フレームにおいて選択された補間駆動目標と相関
して最適の補間オフセットを提供する段階、そして前記
選択段階において選択された補間駆動目標を前記補間オ
フセットだけ回転させて補間駆動目標のための新しい値
を提供する段階を具備する。
【0069】入力音声が無声音声からなる場合は、無声
音声を一連の連続する領域に分割する段階、前記連続す
る領域の各々に対し二乗平均(RMS)振幅を決定する
段階、そして前記RMS振幅を符号化して無声音声を表
わすデジタル信号を提供する段階が含まれる。
【0070】補間目標を選択する前記段階はさらに、所
定の重みづけ関数のファミリから統計的な重みづけ関数
を選択する段階、そして前記補間された駆動目標を選択
された統計的重みづけ関数によって重みづけして前記補
間駆動目標のための新しい値を提供する段階を具備す
る。
【0071】さらに、デジタル信号を駆動同期時間デコ
ードして音声信号を提供するための方法が開示され、該
方法は音声を表わす入力デジタル信号を提供する段階、
前記入力デジタル信号が有声音声を表わすことを判定す
る段階、そして、前記入力デジタル信号が有声音声を表
わしている場合には、リニア予測符号化パラメータを補
間する段階を行なう段階、有声音駆動関数を再構築する
段階、そして前記再構築された有声音駆動関数をラチス
合成フィルタに提供することによって前記再構築された
有声音駆動関数から音声を合成する段階を具備する。
【0072】有声音駆動関数を再構築する段階はさらに
隣接フレームにおける目標駆動関数の間を補間する段階
を具備する。
【0073】前記入力デジタル信号が有声音声を表わす
ことを判定する段階は、前記入力デジタルデータが無声
音声を表わす場合に、一連の連続する二乗平均(RM
S)振幅をデコードする段階、前記連続するRMS振幅
の間を補間して無声音エンベロープを再生する段階、ノ
イズ発生器を再生されたエンベロープで変調して再生さ
れた無声音駆動関数を提供する段階、そして前記再生さ
れた無声音駆動関数から無声音声を合成する段階を具備
する。
【0074】ノイズ発生器を変調する段階はガウス乱数
発生器を含む。
【0075】また、音声信号の駆動同期時間符号化のた
めの装置が開示されており、該装置は前記フレーム同期
リニア予測符号化(LPC)装置を有し、該フレーム同
期LPC装置は入力および出力を有し、該入力は入力音
声信号を受け入れるためのものであり、前記出力は入力
音声信号の第1の部分を記述する第1のグループのLP
C係数および前記入力音声信号の第2の部分を記述する
駆動波形を提供するためのものである。前記装置はまた
前記フレーム同期LPC装置に結合され前記駆動波形の
エポック長を計算するための自己相関器、入力が該自己
相関器に結合されかつ出力信号が前記駆動波形の特徴を
記述する多数の係数からなるピッチフィルタを具備す
る。前記装置はまた前記ピッチフィルタの出力、前記相
関器の出力および前記フレーム同期LPC装置の出力に
結合され、あるフレームが有声音であるかあるいは無声
音であるかを決定するためのフレーム発声(voici
ng)決定手段、前記フレーム発声決定手段に結合され
た一連の連続するタイムスロットにおける代表的な駆動
レベルを計算しかつ前記フレーム発声決定手段が前記一
連の連続するタイムスロットが無声音であることを判定
した場合に動作するための手段、そして前記代表的な駆
動レベルを計算するための手段に結合され前記駆動波形
に対応する符号化デジタル信号を提供するための符号化
手段(encoding means)を具備する。
【0076】音声信号の駆動同期時間符号化のための装
置はさらに、音声データのフレーム内のエポック駆動位
置を決定するための手段を具備し、該決定するための手
段は前記フレーム発声決定手段に結合されかつ前記フレ
ーム発声決定手段があるフレームが有声音であると判定
した場合に動作する。前記装置はまた入力音声信号を受
け入れるための第1の入力を有しかつ前記エポック駆動
位置を決定するための手段に結合された第2の入力を有
する第2のリニア予測符号化手段を具備し、該第2のL
PC手段は前記入力音声信号を特徴づけて前記入力音声
信号の第1の部分を記述する第2のグループのLPC係
数および入力音声信号の第2の部分を記述する第2の駆
動関数を提供し、前記第2のグループのLPC係数およ
び前記第2の駆動関数は単一エポックの音声パラメータ
からなる。前記装置はさらに最小エンべロープエラーに
基づき第2の駆動関数の一部の中から補間駆動目標を選
択し目標駆動関数を提供するための手段を具備し、該補
間駆動目標選択手段の入力は前記第2のLPC手段に結
合され、前記選択のための手段は前記符号化手段に結合
された出力を有する。
【0077】前記フレーム発声決定手段はさらに前記第
1のグループのLPC係数からのリニア予測ゲイン係数
が第1のしきい値を越えているかあるいは第1のしきい
値に等しい場合に第1の発声フラグを「有声音」にセッ
トしそれ以外では前記第1の発声フラグを「無声音」に
セットするための第1の決定手段を具備する。前記フレ
ーム発声決定手段はさらに前記多数の係数の内の第2の
ものが第2のしきい値を越えているかあるいは第2のし
きい値に等しい場合、あるいは前記ピッチフィルタのピ
ッチゲインが第3のしきい値を越えているかあるいは第
3のしきい値に等しい場合に第2の発声フラグを「有声
音」にセットし、かつそれ以外では該第2の発声フラグ
を「無声音」にセットするための第2の決定手段を具備
する。前記フレーム音声決定手段はさらに前記多数の係
数の内の前記第2のものが前記第2のしきい値を越えて
いるかあるいは前記第2のしきい値に等しくかつリニア
予測符号化ゲインが第4のしきい値を越えているかある
いは第4のしきい値に等しい場合に第3の発声フラグを
「有声音」にセットし、それ以外では前記第3の発声フ
ラグを「無声音」にセットするための第3の決定手段を
具備する。前記フレーム発声決定手段はさらにリニア予
測符号化ゲインが第4のしきい値を越えているかあるい
は第4のしきい値に等しくかつ前記ピッチゲインが前記
第3のしきい値を越えているかあるいは前記第3のしき
い値に等しい場合に第4の発声フラグを「有声音」にセ
ットし、それ以外では前記第4の発声フラグを「無声
音」にセットするための第4の決定手段を具備する。前
記フレーム発声決定手段はさらに前記第1、第2、第3
および第4の発声フラグが「有声音」にセットされてい
る時、前記リニア予測符号化ゲインが第5のしきい値よ
り小さくなくかつ前記多数の係数の内の第2のものが第
6のしきい値よりも小さくない場合に第5の発声フラグ
を「有声音」にセットしかつそれ以外では前記第4の発
声フラグを「無声音」にセットするための第5の決定手
段を具備する。そして、前記フレームは前記第1、第
2、第3および第4の発声フラグの内のいずれかが「有
声音」にセットされておりかつ前記第5の発声フラグが
有声音にセットされている場合に有声音であると決定さ
れ、前記フレームは前記第1、第2、第3および第4の
発声フラグの全てが「無声音」にセットされている場合
に無声音であると判定され、そして前記フレームは前記
第5の発声フラグが「無声音」にセットされているもの
と判定された場合に無声音であると判定される。
【0078】音声信号の駆動同期時間符号化のための装
置はさらに補間駆動目標を選択するための前記手段に結
合された駆動重みを選択するための手段を具備し、該駆
動重みを選択するための手段は男性の声に典型的な第1
のタイプの駆動に対しレーリー形重み関数からなる第1
のクラスの重み関数から重み関数を提供し、かつ前記第
1のタイプの駆動よりも高いピッチを有する第2のタイ
プの駆動についてはガウス形重み関数からなる第2のク
ラスの重み関数から重み関数を提供し、前記第2のタイ
プの駆動は女性の声に典型的なものである。前記音声信
号の駆動同期時間符号化のための装置はさらに前記目標
駆動関数を前記重み関数によって重み付けして前記符号
化手段に出力信号を提供するための重み付けのための手
段を具備し、該重み付けのための手段は前記駆動重みを
選択するための手段に結合されている。
【0079】音声信号の駆動同期時間符号化のための装
置はさらに第1の補間目標を隣接フレームにおける第2
の補間目標と相関するための手段を具備し、該相関手段
は前記補間駆動目標選択手段に結合された入力を有しか
つ前記符号化手段に結合された出力を有し、前記相関手
段は前記第1の補間目標と前記第2の補間目標との間の
相関位相を決定する。
【0080】デジタル信号を駆動同期時間デコードして
音声信号を提供するための装置が開示され、該装置は符
号化された音声を表すデジタル信号を受けるための入
力、前記入力に結合され前記デジタル信号から量子化さ
れた信号を提供するための符号化手段、前記符号化手段
に結合され前記量子化された信号が有声音声を表すこと
および前記量子化された信号が無声音声を表すことを判
定するためのフレーム発声決定手段、前記フレーム発声
決定手段に結合された無声音駆動を表す隣接する信号レ
ベルの間を補間するための手段、前記補間手段に結合さ
れ前記補間手段によって決定されるレベルまで変調され
たノイズ信号を提供するためのランダムノイズ発生器、
そして前記ランダムノイズ発生器に結合され前記変調さ
れたノイズ信号から無声音声を合成するためのラチス合
成フィルタを具備する。
【0081】前記ランダムノイズ発生器はガウス乱数発
生器である。
【0082】デジタル信号を駆動同期時間デコードして
音声信号を提供するための装置は、さらに、前記フレー
ム発声決定手段に結合され、量子化された信号が有声音
声を表す場合に前記量子化された信号において提供され
る引き続くLPCパラメータの間を補間して補間された
LPCパラメータを提供するリニア予測符号化(LP
C)パラメータ補間手段、および該LPCパラメータ補
間手段に結合されて前記量子化された信号および前記補
間されたLPCパラメータから有声音声を合成するため
のラチス合成フィルタ手段を具備する。
【0083】デジタル信号を駆動同期時間デコードして
音声信号を提供するための装置は、さらに、目標駆動関
数の間に挿入された引き続く駆動関数を補間するための
手段を具備し、該引き続く駆動関数を補間するための手
段は前記LPCパラメータ補間手段に結合された入力を
有しかつ前記ラチス合成フィルタ手段に結合された出力
を有し、前記目標駆動関数を補間するための手段は第1
のフレームにおける第1の目標エポックと該第1のフレ
ームに隣接する第2のフレームにおける第2の目標エポ
ックとの間のエポックにおける連続する駆動関数を補間
し、前記ラチス合成フィルタ手段は前記補間されたLP
Cパラメータおよび前記補間された引き続く駆動関数か
ら有声音声を合成する。
【0084】前記無声音駆動を表す連続する(cont
iguous)信号レベルは無声音駆動を表す連続する
二乗平均レベルからなる。
【0085】通信装置が開示され、該通信装置は入力音
声信号を受けるための入力、前記入力に結合されて前記
入力音声信号をデジタル的に符号化するための音声デジ
タイザ、前記デジタル的に符号化された入力音声信号を
送信するための出力であって前記音声デジタイザに結合
されているもの、デジタル的に符号化された音声信号を
受けるためのデジタル入力を有する。前記通信装置はま
た、前記デジタル入力に結合され前記デジタル的に符号
化された音声信号から音声信号を合成するための音声シ
ンセサイザ手段を具備し、該音声シンセサイザ手段はさ
らにベクトル量子化コードブックに結合され該ベクトル
量子化コードブックからの量子化された信号が有声音声
を表すことおよび前記量子化された信号が無声音声を表
すことを判定するためのフレーム発声決定手段と、該フ
レーム発声決定手段に結合されて無声音駆動を表す引き
続く信号レベルの間の補間を行なうための手段と、前記
補補間手段に結合され前記補間手段によって決定された
レベルまで変調されたノイズ信号を提供するためのラン
ダムノイズ発生器とを具備する。前記通信装置はさらに
前記ランダムノイズ発生器に結合されて前記変調された
ノイズ信号から無声音声を合成するための出力手段を含
む。
【0086】前記ランダムノイズ発生器はガウス形乱数
発生器である。
【0087】音声信号を駆動同期時間符号化するための
方法が開示され、該方法は入力信号を提供する段階、リ
ニア予測符号化係数、エポック長およびボイシングを含
む特質を特徴づけるために入力音声信号を処理する段
階、前記入力音声信号が有声音声からなる場合に前記入
力音声信号を単一エポックの時間領域をベースとして特
徴づけてパラメータ化された駆動関数を提供する段階、
前記入力音声信号が有声音声からなる場合にあるフレー
ムの駆動内のエポック駆動位置を決定する段階、前記パ
ラメータ化された駆動関数のフレーム内の各エポックに
対するエポック長を決定する段階、前記エポック長を平
均して端数(fractional)ピッチを提供する
段階、そして前記パラメータ化された駆動関数および前
記端数ピッチを符号化して前記入力音声信号を表すデジ
タル出力信号を提供する段階を具備する。
【0088】さらに、音声信号を駆動同期時間符号化す
るための方法が開示され、該方法は、入力音声信号を提
供する段階、該入力音声信号を処理してリニア予測符号
化(LPC)係数、エポック長およびボイシングを含む
特質を特徴づける段階、前記入力音声信号が有声音声か
らなる場合に前記入力音声信号を単一エポックの時間領
域のベースで特徴づけてパラメータ化された有声音駆動
関数を提供する段階、前記入力音声信号が無声音からな
る場合にフレームの少なくとも一部に対して入力音声信
号を特徴づけてパラメータ化された無声音駆動関数を提
供する段階、そして前記パラメータ化された無声音駆動
関数および前記パラメータ化された有声音駆動関数を含
む複合駆動関数を符号化して前記入力音声信号を表すデ
ジタル出力信号を提供する段階を具備する。
【0089】さらに、単一エポックのベースで特徴づけ
られた音声信号をデジタル的に符号化する方法が提供さ
れ、該方法は端数ピッチを決定しかつデジタル的に符号
化する段階を含む。
【0090】以上述べた特定の実施例は本発明の一般的
な性質を完全に開示しているから、当業者が、現在の知
識を適用することにより、本発明の一般的な概念から離
れることなくそのような特定の実施例に対し容易に変更
および/または種々の用途に適応させることが可能であ
る。したがって、そのような適応および修正は開示され
た実施例と等価な意味および範囲内にあるものと解釈さ
れるべきでありかつ解釈されるものと考える。
【0091】ここで使用されている表現または用語は説
明のためのものであり限定的なものでないことが理解さ
れるべきである。したがって、本発明は添付の特許請求
の範囲の精神および範囲内にある全てのそのような置き
換え、修正、等価物および変形を含むものと考える。
【0092】
【発明の効果】したがって、本発明により、前述の従来
例の問題を克服しかつ従来技術の方法および機構に関し
ある有利性を達成する駆動同期時間符号化ボコーダおよ
び方法が開示されたことが明らかである。知られた技術
に対する改善はかなり大きいものである。従来の手法に
おける高価な費用、複雑さおよび高い電力消費が避けら
れる。同様に、達成可能なデータレートを犠牲にするこ
となく改善された忠実度が提供される。
【図面の簡単な説明】
【図1】本発明に係わる送信機における音声デジタイザ
をフローチャート形式で示す単純化したブロック図であ
る。
【図2】男性の声に関連する駆動を重み付けるのに適し
たレーリー形駆動重み付け関数を示すグラフである。
【図3】女性の声に関連した重み付け駆動に適したガウ
ス形駆動重み付け関数を示すグラフである。
【図4】図1の送信機のような装置によって提供される
デジタルデータのための受信機における音声シンセサイ
ザをフローチャート形式で示す単純化したブロック図で
ある。
【図5】図1の送信機において発声を決定するための判
断ツリー装置をフローチャート形式で示す詳細なブロッ
ク図である。
【図6】本発明に係わる図1の音声デジタイザおよび図
4の音声シンセサイザを使用した音声通信装置を示す非
常に単純化したブロック図である。
【符号の説明】
10 送信機 11 音声入力 12 ハイパスフィルタ 14 リニア予測符号化(LPC)装置 15 音声デジタイザ 17 自己相関器 19 ピッチフィルタ 41 ベクトル量子化コードブック 29 LPC装置 43 ベクトル量子化コードブック 45 音声シンセサイザ 53 ガウスランダムノイズ発生器 57 LPCパラメータ補間器 62 ラチス合成フィルタ 78 入力装置 79,83 通信用プロセッサ 84 出力装置 15,45 音声デジタイザ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 シーン・エス・ユー アメリカ合衆国アリゾナ州85224、チャン ドラー、ウエスト・チルトン・ストリート 402

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 音声信号の駆動同期時間符号化方法であ
    って、該方法は、 入力音声信号(11)を提供する段階、 前記入力音声信号(11)を処理して(12,14,1
    7,19,22)リニア予測符号化係数、エポック長お
    よび発声を含む特質を特徴づける段階、そして、入力音
    声(11)が有声音声からなる場合に、 前記入力音声(11)を単一エポックのベースで特徴づ
    けて(24′)単一エポックの音声パラメータを提供す
    る段階、および前記単一エポックの音声パラメータを符
    号化して(41)有声音声を表すデジタル信号を提供す
    る段階、 を具備することを特徴とする音声信号の駆動同期時間符
    号化方法。
  2. 【請求項2】 音声信号を提供するためにデジタル信号
    を駆動同期時間デコードする方法であって、該方法は、 音声を表す入力デジタル信号(44)を提供する段階、 前記入力デジタル信号(44)が有声音声を表すことを
    判定する段階(46)、そして、前記入力デジタル信号
    (44)が有声音声を表す場合、 リニア予測符号化パラメータを補間する段階(57)、 有声駆動関数を再構築する段階(59)、そして前記再
    構築された有声駆動関数をラチス合成フィルタに提供す
    ることにより前記再構築された有声駆動関数から音声を
    合成する段階(62)、 を具備することを特徴とする音声信号を提供するために
    デジタル信号を駆動同期時間デコードする方法。
  3. 【請求項3】 音声信号の駆動同期時間符号化装置であ
    って、 入力(11)および出力を有するフレーム同期リニア予
    測符号化(LPC)装置(15)であって、前記入力
    (11)は入力音声信号を受け入れるためのものであ
    り、前記出力は前記入力信号の第1の部分を記述する第
    1のグループのLPC係数および前記入力音声信号の第
    2の部分を記述する駆動波形を提供するもの、 前記フレーム同期LPC装置(15)に結合され前記駆
    動波形のエポック長を計算するための自己相関器(1
    5)、 前記自己相関器(15)に結合された入力を有しかつ前
    記駆動波形の特徴を記述する複数の係数を含む出力信号
    を有するピッチフィルタ(15)、 前記ピッチフィルタ(15)の出力、前記自己相関器
    (15)の出力および前記フレーム同期LPC装置(1
    5)の前記出力に結合されあるフレームが有声音である
    かあるいは無声音であるかを判定するためのフレーム発
    声決定手段(15)、 前記フレーム発声決定手段(15)に結合され一連の引
    き続くタイムスロットにおける代表的な駆動レベルを計
    算しかつ前記フレーム発声決定手段(15)が前記一連
    の引き続くタイムスロットが無声音であることを判定し
    た場合に動作する手段(15)、そして 前記代表的な駆動レベルを計算するための前記手段(1
    5)に結合され前記駆動波形に対応する符号化されたデ
    ジタル信号を提供するための符号化手段(15)、 を具備することを特徴とする音声信号の駆動同期時間符
    号化装置。
  4. 【請求項4】 音声信号を提供するためにデジタル信号
    の駆動同期時間デコードを行なうための装置であって、
    該装置は、 符号化された音声を表すデジタル信号を受けるための入
    力(44)、 前記入力(44)に結合され前記デジタル信号から量子
    化された信号を提供するための符号化手段(45)、 前記符号化手段(45)に結合され、前記量子化された
    信号が有声音声を表すことおよび前記量子化された信号
    が無声音声を表すことを判定するためのフレーム発声決
    定手段(45)、 前記フレーム発声決定手段(45)に結合されて無声音
    駆動を表す引き続く信号レベルの間を補間するための手
    段(45)、 前記補間手段(45)に結合され、前記補間手段(4
    5)によって決定されるレベルまで変調されたノイズ信
    号を提供するためのランダムノイズ発生器(45)、そ
    して前記ランダムノイズ発生器(45)に結合され前記
    変調されたノイズ信号から無声音声を合成するためのラ
    チス合成フィルタ手段(45)、 を具備することを特徴とする音声信号を提供するために
    デジタル信号を駆動同期時間デコードするための装置。
  5. 【請求項5】 通信装置であって、 入力音声信号を受けるための入力(78)、 前記入力(78)に結合され前記入力音声信号をデジタ
    ル的に符号化するための音声デジタイザ(15)、 前記デジタル的に符号化された入力音声信号を送信する
    ための出力(79)であって、該出力(79)は前記音
    声デジタイザ(15)に結合されているもの、 デジタル的に符号化された音声信号を受けるためのデジ
    タル入力(83)、 前記デジタル入力(83)に結合され前記デジタル的に
    符号化された音声信号から音声信号を合成するための音
    声合成手段(45)であって、該音声合成手段(45)
    はさらに、 前記ベクトル量子化コードブック(45)に結合され前
    記ベクトル量子化コードブック(45)からの量子化さ
    れた信号が有声音声を表すことおよび前記量子化された
    信号が無声音声を表すことを判定するためのフレーム発
    声決定手段(45)、 前記フレーム発声決定手段(45)に結合されて無声音
    駆動を表す引き続く信号レベルの間を補間するための手
    段(45)、そして前記補間手段(45)に結合され、
    前記補間手段(45)によって決定されるレベルまで変
    調されたノイズ信号を提供するためのランダムノイズ発
    生器(45)、を具備する前記音声合成手段(45)、
    そして前記ランダムノイズ発生器(45)に結合され前
    記変調されたノイズ信号から無声音声を合成するための
    出力手段(84)、 を含むことを特徴とする通信装置。
  6. 【請求項6】 音声信号を駆動同期時間符号化するため
    の方法であって、該方法は、 入力音声信号(11)を提供する段階、 前記入力音声信号(11)を処理して(12,14,1
    7,19,22)リニア予測符号化係数、エポック長お
    よび発声を含む特質を特徴づける段階、 前記入力音声信号(11)が有声音声からなる場合に前
    記入力音声信号(11)を単一エポックの時間領域のベ
    ースで特徴づけて(24′)パラメータ化された駆動関
    数(39)を提供する段階、 前記入力音声信号(11)が有声音声からなる場合にあ
    る駆動のフレーム内でエポック駆動位置を決定する段階
    (27)、 前記パラメータ化された駆動関数のフレーム内の各々の
    エポックに対しエポック長を決定する段階(27)、 前記エポック長を平均化して(27′)端数ピッチを提
    供する段階、そして前記パラメータ化された駆動関数お
    よび前記端数ピッチを符号化して(41)前記入力音声
    信号(11)を表すデジタル出力信号(42)を提供す
    る段階、 を具備することを特徴とする音声信号を駆動同期時間符
    号化するための方法。
  7. 【請求項7】 音声信号を駆動同期時間符号化するため
    の方法であって、該方法は、 入力音声信号(11)を提供する段階、 前記入力音声信号(11)を処理して(12,14,1
    7,19,22)リニア予測符号化(LPC)係数、エ
    ポック長および発声を含む特質を特徴づける段階、 前記入力音声信号(11)が有声音声からなる場合に前
    記入力音声信号(11)を単一エポックの時間領域のベ
    ースで特徴づけて(24′)パラメータ化された有声音
    駆動関数(39)を提供する段階、 前記入力音声信号(11)が無声音声からなる場合に前
    記入力音声信号(11)を少なくともフレームの一部に
    対して特徴づけて(24)パラメータ化された無声音駆
    動関数(25)を提供する段階、そして前記パラメータ
    化された無声音駆動関数(25)および前記パラメータ
    化された有声音駆動関数(39)を含む複合駆動関数を
    符号化して(41)入力音声信号(11)を表すデジタ
    ル出力信号(42)を提供する段階、 を具備することを特徴とする音声信号を駆動同期時間符
    号化するための方法。
  8. 【請求項8】 端数ピッチを決定する段階(27′)お
    よびデジタル的に符号化する段階(41)を含むことを
    特徴とする単一エポックのベースで特徴づけられた音声
    信号をデジタル的に符号化する方法。
JP6136501A 1993-05-28 1994-05-26 駆動同期時間符号化ボコーダおよび方法 Pending JPH0713600A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US068,918 1993-05-28
US08/068,918 US5479559A (en) 1993-05-28 1993-05-28 Excitation synchronous time encoding vocoder and method

Publications (1)

Publication Number Publication Date
JPH0713600A true JPH0713600A (ja) 1995-01-17

Family

ID=22085545

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6136501A Pending JPH0713600A (ja) 1993-05-28 1994-05-26 駆動同期時間符号化ボコーダおよび方法

Country Status (4)

Country Link
US (2) US5479559A (ja)
EP (1) EP0626675A1 (ja)
JP (1) JPH0713600A (ja)
CA (1) CA2123187A1 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2655046B2 (ja) * 1993-09-13 1997-09-17 日本電気株式会社 ベクトル量子化装置
TW295747B (ja) * 1994-06-13 1997-01-11 Sony Co Ltd
US5991725A (en) * 1995-03-07 1999-11-23 Advanced Micro Devices, Inc. System and method for enhanced speech quality in voice storage and retrieval systems
JP3747492B2 (ja) * 1995-06-20 2006-02-22 ソニー株式会社 音声信号の再生方法及び再生装置
US6591240B1 (en) * 1995-09-26 2003-07-08 Nippon Telegraph And Telephone Corporation Speech signal modification and concatenation method by gradually changing speech parameters
GB2305750B (en) * 1995-09-30 1998-02-18 Samsung Electronics Co Ltd Recording method and apparatus of an audio signal using an integrated circuit memory card
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
US5960386A (en) * 1996-05-17 1999-09-28 Janiszewski; Thomas John Method for adaptively controlling the pitch gain of a vocoder's adaptive codebook
US5809459A (en) * 1996-05-21 1998-09-15 Motorola, Inc. Method and apparatus for speech excitation waveform coding using multiple error waveforms
US5794185A (en) * 1996-06-14 1998-08-11 Motorola, Inc. Method and apparatus for speech coding using ensemble statistics
JPH1091194A (ja) * 1996-09-18 1998-04-10 Sony Corp 音声復号化方法及び装置
WO1998045951A1 (en) * 1997-04-07 1998-10-15 Koninklijke Philips Electronics N.V. Speech transmission system
JP3180762B2 (ja) 1998-05-11 2001-06-25 日本電気株式会社 音声符号化装置及び音声復号化装置
US6754265B1 (en) * 1999-02-05 2004-06-22 Honeywell International Inc. VOCODER capable modulator/demodulator
US6377914B1 (en) 1999-03-12 2002-04-23 Comsat Corporation Efficient quantization of speech spectral amplitudes based on optimal interpolation technique
US6952669B2 (en) * 2001-01-12 2005-10-04 Telecompression Technologies, Inc. Variable rate speech data compression
US6721282B2 (en) 2001-01-12 2004-04-13 Telecompression Technologies, Inc. Telecommunication data compression apparatus and method
US20030135374A1 (en) * 2002-01-16 2003-07-17 Hardwick John C. Speech synthesizer
GB0408856D0 (en) * 2004-04-21 2004-05-26 Nokia Corp Signal encoding
EP1979899B1 (de) * 2006-01-31 2015-03-11 Unify GmbH & Co. KG Verfahren und anordnungen zur audiosignalkodierung
FR2897977A1 (fr) * 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
KR100900438B1 (ko) * 2006-04-25 2009-06-01 삼성전자주식회사 음성 패킷 복구 장치 및 방법
US8364492B2 (en) * 2006-07-13 2013-01-29 Nec Corporation Apparatus, method and program for giving warning in connection with inputting of unvoiced speech
JPWO2008072701A1 (ja) * 2006-12-13 2010-04-02 パナソニック株式会社 ポストフィルタおよびフィルタリング方法
DE602007004504D1 (de) * 2007-10-29 2010-03-11 Harman Becker Automotive Sys Partielle Sprachrekonstruktion
BR112019021019B1 (pt) 2017-04-05 2023-12-05 Syngenta Participations Ag Compostos derivados de oxadiazol microbiocidas, composição agrícola, método para controlar ou prevenir a infestação de plantas úteis por microrganismos fitopatogênicos e uso de um composto derivado de oxadiazol

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE308817C (ja) * 1917-04-12
US4439839A (en) * 1981-08-24 1984-03-27 International Telephone And Telegraph Corporation Dynamically programmable processing element
US4710959A (en) * 1982-04-29 1987-12-01 Massachusetts Institute Of Technology Voice encoder and synthesizer
US4742550A (en) * 1984-09-17 1988-05-03 Motorola, Inc. 4800 BPS interoperable relp system
CA1245363A (en) * 1985-03-20 1988-11-22 Tetsu Taguchi Pattern matching vocoder
US4797926A (en) * 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US4899385A (en) * 1987-06-26 1990-02-06 American Telephone And Telegraph Company Code excited linear predictive vocoder
US4815134A (en) * 1987-09-08 1989-03-21 Texas Instruments Incorporated Very low rate speech encoder and decoder
DE3732047A1 (de) * 1987-09-23 1989-04-06 Siemens Ag Verfahren zur umcodierung von kanalvocoder-parameter in lpc-vocoder-parameter
JP2763322B2 (ja) * 1989-03-13 1998-06-11 キヤノン株式会社 音声処理方法
US5060269A (en) * 1989-05-18 1991-10-22 General Electric Company Hybrid switched multi-pulse/stochastic speech coding technique
US4963034A (en) * 1989-06-01 1990-10-16 Simon Fraser University Low-delay vector backward predictive coding of speech
US5138661A (en) * 1990-11-13 1992-08-11 General Electric Company Linear predictive codeword excited speech synthesizer
US5293449A (en) * 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
US5127053A (en) * 1990-12-24 1992-06-30 General Electric Company Low-complexity method for improving the performance of autocorrelation-based pitch detectors
US5265190A (en) * 1991-05-31 1993-11-23 Motorola, Inc. CELP vocoder with efficient adaptive codebook search
US5371853A (en) * 1991-10-28 1994-12-06 University Of Maryland At College Park Method and system for CELP speech coding and codebook for use therewith
US5341456A (en) * 1992-12-02 1994-08-23 Qualcomm Incorporated Method for determining speech encoding rate in a variable rate vocoder

Also Published As

Publication number Publication date
CA2123187A1 (en) 1994-11-29
EP0626675A1 (en) 1994-11-30
US5623575A (en) 1997-04-22
US5479559A (en) 1995-12-26

Similar Documents

Publication Publication Date Title
JPH0713600A (ja) 駆動同期時間符号化ボコーダおよび方法
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
US5903866A (en) Waveform interpolation speech coding using splines
RU2255380C2 (ru) Способ и устройство воспроизведения речевых сигналов и способ их передачи
JP5226777B2 (ja) 音声信号中に埋め込まれた隠れデータの回復
US5966689A (en) Adaptive filter and filtering method for low bit rate coding
US6081776A (en) Speech coding system and method including adaptive finite impulse response filter
US20080082343A1 (en) Apparatus and method for processing signal, recording medium, and program
US5504834A (en) Pitch epoch synchronous linear predictive coding vocoder and method
JP2002541499A (ja) Celp符号変換
JP2002528777A (ja) オーバーサンプリングされた合成広帯域信号の高周波数成分回復の方法および装置
WO2000075919A1 (en) Methods and apparatus for generating comfort noise using parametric noise model statistics
JPH08278799A (ja) 雑音荷重フィルタリング方法
US5924061A (en) Efficient decomposition in noise and periodic signal waveforms in waveform interpolation
JP2003501675A (ja) 時間同期波形補間によるピッチプロトタイプ波形からの音声を合成するための音声合成方法および音声合成装置
US6064955A (en) Low complexity MBE synthesizer for very low bit rate voice messaging
EP0779732A2 (en) Multi-point voice conferencing system over a wide area network
JPH0946233A (ja) 音声符号化方法とその装置、音声復号方法とその装置
EP1385150A1 (en) Method and system for parametric characterization of transient audio signals
JP4420562B2 (ja) 背景ノイズが共存する符号化音声の品質を向上させるためのシステムおよび方法
EP1672619A2 (en) Speech coding apparatus and method therefor
JPH1083199A (ja) 量子化装置及び方法
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法
US5684926A (en) MBE synthesizer for very low bit rate voice messaging systems
JP4099879B2 (ja) 帯域幅拡張方法及び装置