JPH02203398A - スピーチ処理、合成と解析方法及びその装置 - Google Patents

スピーチ処理、合成と解析方法及びその装置

Info

Publication number
JPH02203398A
JPH02203398A JP1087179A JP8717989A JPH02203398A JP H02203398 A JPH02203398 A JP H02203398A JP 1087179 A JP1087179 A JP 1087179A JP 8717989 A JP8717989 A JP 8717989A JP H02203398 A JPH02203398 A JP H02203398A
Authority
JP
Japan
Prior art keywords
spectrum
determining
speech
sinusoids
another
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1087179A
Other languages
English (en)
Inventor
David L Thomson
デビッド・エル・トムソン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
American Telephone and Telegraph Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by American Telephone and Telegraph Co Inc filed Critical American Telephone and Telegraph Co Inc
Publication of JPH02203398A publication Critical patent/JPH02203398A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声処理に関する。
(従来の技術) シヌソイド(sinusold)の和を用いて合成を行
う高調波モデルを用いて正確なスピーチ表現を実証した
。解析器によってスピーチを複数のオーバラップフレー
ム(overlapping frames)に区切り
、各ウィンドをハミングウィンドウ(HalIilog
 winday) L、レベル/位相スペクトル(ma
gn1tude/phase 5pectru11)を
構築し、個々のシヌソイドの位置をチエツクする。続い
てシヌソイドの正確な。
位相1周波数を合成器へ送り、合成器によって合成スピ
ーチを生成する。非量子化高調波スピーチコーディング
システムにおいては、得られたスピーチの質は、はとん
どの人が合成スピーチからオリジナルスピーチを識別で
きるないという点で、はぼ透過である。この方式を低ビ
ツト速度で適用することは、最高80個の高調波を必要
とするために困難である。(ここで言うシヌソイドとは
高調波を言うが、必ずしも高調波に関するものであると
は限らない)−船釣には、ピッチ(pitch)とボイ
シング(volclng)を導入するか又は、特定の又
はすべての位相情報を落す(drop)ことによって9
゜6キロビツト/秒以下のビット速度を確保する。
そうすれば量と堅牢度(robustness)が非量
子化スピーチと異なる合成スピーチが得られる。
1つの先行技術としての高調波スピーチコーディングシ
ステムがR,J、McAulay/T、F、Quati
eri著″Multirate 5inusoldal
 transform coding atrates
 fro112.4 kbps to 8 kbps 
 (2,4〜8kbpsマルチ速度正弦波変、換コーデ
ィング)Proc、 IEEE Int、 Conf’
、Acoust、、5peech、 and Sign
al Proc、、vol、3.I)p、1845−1
848.April 1987に紹介されている。ピッ
チ検知器を用いて、基本ピッチを決定し、この決定され
たピッチとその倍数で、スピーチスペクトルを線スペク
トルとしてモデル化する。この決定されたピッチの値は
解析器から合成器に伝送され、そこで、基本周波数と倍
数でシヌソイドの和として、スピーチを再構成する。
このようにして達成された音声の質には限界がある。そ
れは、大部分の入力音声のエネルギは線スペクトルの線
間に存在し、非音声スピーチには別のアプローチが要求
されるからである。
(発明が解決しようとする課題) 上記の従来技術の問題点は、公知の音声コーディングシ
ステムで達成できる音声の質の低さである。この従来の
システムは、入力音声を少ない基本周波数と倍数でもっ
て、線スペクトルとして、モデル化するだけである。
人力音声レベルスペクトルを解析器で比較的小さなパラ
メータセットで、線レベルスペクトルではなく、連続レ
ベルスペクトルとして、モデル化する高調波スピーチコ
ーディングシステムでスピーチの質を向上させる本発明
の原理によって前記の開発ニーズを満し、技術の進歩を
図ることができる。
(課題を解決するための手段及び作用)解析器ではなく
合成器によって、多数のシヌソイドのレベル、周波数、
位相を決定し、このシヌソイドを加えて、高質の音声を
生成する。解析器からシヌソイドを明確に定義する情報
を受信するのではなく、合成器が、少数のパラメータセ
ットを受信し、これらのパラメータセットを利用して、
スペクトルを決定し、合成器によって、合成用のシヌソ
イドを決定する。
高調波スピーチコーディングシステムの解析器において
、本発明の方法に従って、まずスピーチからレベルスペ
クトルを求めることによってスピーチを処理する。パラ
メータセットを計算し、この決定されたレベルスペクト
ルを連続レベルスペクトスルとして、モデリーングし、
このパラメータセットがスピーチ合成用に通信するのに
用いられる。
高調波スピーチコーディングシステムの合成器において
、スピーチは、本発明の方法に従って、パラメータセッ
トを受信し、このパラメータセットからスペクトルを求
めることによって、スピーチを合成する。このスペクト
ルを用いて、複数のシヌソイドを決定し、少なくとも1
つのシヌソイドの正弦波周波数は、スペクトルの振幅値
に基づいて決定される。その後、スピーチはシヌソイド
の和として合成される。
上記の高調波スピーチコーディングシステムの解析器に
おいて、レベルスペクトルは4!の関数の和としてモデ
ル化される。この4個の関数は、先行スピーチフレーム
の推定レベルスペクトル、第1周期パルス列のレベルス
ペクトル、第2周期パルス列のレベルスペクトル、コー
ドブックから選択されたベクトルである。パラメータセ
ットは計算されて、最少平均二乗誤差基準にしたがって
、レベルスペクトルをモデル化する。位相スペクトルも
、スピーチから決定されて、位相スペクトルは、推定位
相とコードブックから選択されたベクトルの2個の関数
の和として位相スペクトルをモデル化する第2のパラメ
ータセットを計算するのに使用される。推定位相は、全
極解析法、極−零解析法、先行スピーチフレームからの
位相予測を実行し、誤差基準にしたがって、最適推定を
選択することにより、決定される。解析器は、位相推定
に使用されるレベルスペクトルから複数のシヌソイドを
求め(決定し)、シヌソイドの振幅と周波数及び、フレ
ームのピッチ比率を考慮にいれたマツチング基準を用い
て、現在のスピーチフレームのシヌソイドと先行及び後
続のスピーチフレームのシヌソイドとマツチングさせる
上記の高調波スピーチコーディングシステムの解析器に
おいては、受信したパラメータに基づいて、推定レベル
スペクトルと推定位相スペクトルを共に求める。複数の
シヌソイドは、推定レベルスペクトルから、その中にピ
ークを求めるプロセス、このピークに関係す−るスペク
トル成分を減算するプロセス、上記プロセスを推定レベ
ルスペクトルが全周波数に対して限界値以下になるまで
繰り返すプロセスを実行することにより、決定される。
スペクトル成分はここで定義される広いレベルスペクト
ルウィンドウを含んでいる。現在のスピーチフレームの
シヌソイドと先行及び後続のスピーチフレームのシヌソ
イドとは、解析器で使用されるのと同一のマツチング基
準を用いてマツチングさせられる。このシヌソイドは、
推定レベルスペクトルから決定された正弦波振幅と周波
数と、推定位相スペクトルから決定された正弦波位相と
を有している。音声は、これらのシヌソイドを加算する
ことにより合成され、マツチングされたシヌソイド間で
内挿が行われ、マツチングされなかったシヌソイドは、
一定周波数で残留する。
(実施例) 本発明の高調波スピーチコーディングシステムにおいて
は、個々の高調波を送るのではなく、複合スペクトル(
complex 5pectrua+)全体を一括して
送る。この方式の1つの利点としては、解析器ではなく
合成器がシヌソイドの周波数を加金せて合成スピーチを
生成するため、各高調波の周波数を送る必要がない。高
調波は、スペクトルから直接求められるから、基本ピッ
チ(fundamental pitch)に高調波と
して関係づける必要はない。 連続スピーチスペクトル
を低ビツト速度で送るためには、少数のパラメータで記
述することができる一組の連続関数でスペクトルを特定
しなければならない。関数は、入力スピーチの高速フー
リエ変換(F F T  fast Fourier 
transform )によって計算するレベル/位相
スペクトルに整合している。これは、特殊冗長性を利用
することができるために実スペクトルと仮想スペクトル
を整合させるよりも容易である。−例として、スペクト
ルは1つのフレームから次のフレームにかけて比較的不
変であり、位相は周波数に比例して大きくなるから、振
幅と位相は部分的に先行フレームから予測することがで
きる。
レベルと位相を表現する他の有益な関数は極/零モデル
(pole−zero mqdel)である。理想パル
スに対する極/零フィルタのレスポンスとして音声をモ
デリングし、フィルタパラメータからレベルと位相を導
出する。モデル推定量(model estlmate
)に残っているエラーをベクトル量子化する。
−組の関数でスペクトルを整合させた後、モデルノ、イ
ラメータを合成器・へ送り、そこでスペクトルを再構築
する。ピッチとボイシング(voteing)に基づく
方法と違って、この方式はパラメータ推定誤差(par
ameter estimatlon error)の
影響を受けない。 本発明の1つの代表的実施態様とし
てのシステムのスピーチコーディングプロセスは次の通
りである。
解析: 1、 極と零で複合スペクトルエンベロープ(comp
lex 5pectral envelope)をモデ
リングする。
2、 複合スペクトルエンベロープからレベルスペクト
ルエンベローブを求める。
3、  レベルスペクトルの微細ピッチストラクチ+ 
(flne pitch 5tructure)をモデ
リングする。
4、 残留エラーをベクトル量子化する。
5、 位相スペクトルをモデリングする2つの方法を評
価する: a、極/零モデルから位相を導出す。
b、先行フレームから位相を予測する。
6、 ステップ5において最良方法を選び、残留エラー
(residual error)をベクトル量子化す
る。
7、  モデルパラメータを送る。
合成 1、レベルスペクトルと位相スペクトルを再構築する。
2、レベルスペクトルから正弦周波数を求める。
3、シヌソイドの和としてスピーチを生成する。
レベルスペクトルモデリング できるだけ数の少ないパラメータでスペクトルレベル(
spectrat magnitude)を表現するた
めには、スペクトルの冗長性を活用する。レベルスペク
トルは、スペクトルの全体形状を設定するエンベロープ
と、微細ストラクチ+ (f’ine 5tructu
re)を付与する略周期成分(approximate
ly  periodic coraponents)
とで構成されている。全極(all−pole mod
el)又は極/零モデルのレベルレスポンス(magn
itude response)で滑らかなレベルスペ
クトルエンベローブを表現する。非理想的状態の時に周
期性は明白に存在しているが、しばしば堅牢性が欠ける
時に、ピッチ検出器(pitch detect。
「)が微細ストラフチャを表現できる。数多くのスピー
チ特性に対してレベルスペクトルにぴったりフィツトす
る1つのパラメータ関数を見付は出すことは困難である
。複数の関数の加重和 (veighted 5uI1
1)から1つの信頼し得る推定値を構築することができ
る。特に有効であることが確認された関数は、先行フレ
ームの推定レベルスペクトルと、2つの周期パルス例の
レベルスペクトルと、コードブックから選択したベクト
ルの4っである。
パルス例とコードワード(codevord)をレベル
エンベロープによって時間領域でハミングウィンドし、
周波数領域で重みづけし、スペクトルの全体形状を保持
する。周知の平均二乗誤差(MSEmean 5qua
red error)法によって最適重みを見出す。
各パルス列の最適周波数と最適コードベクトルは同時に
選択せず、−度に1つの周波数を見出し、続いてコード
ワードを選択する。m個の関数dt(ω)、1≦i≦m
と、それに対するm個の重みα1.。がある場合は、レ
ベルスペクトル IF (ω)Iの推定値は次式で与え
られる: IF(ω)1=Σ帆mdi(ω)、      −(1
)戸l レベルスペクトルは線スペクトルではなく連続スペクト
ルとしてモデリングする。重みは、次式を最小にするも
のを選ぶ。
ここでF(ω)はスピーチスペクトルであり、ω はサ
ンプリング周波数であり、mは含まれている関数の数で
ある。
第1パルス例の周波数」よ、可能周波数レンジ(40乃
至4(lGHz )を試験し、m−2で(2)式を最小
にするものを選ぶ。各候補周波数についてα  の最適
値を計算する。m−3で同じブロモ1、m スを繰返し、第2周波数を見出す。非音声スピーチ(u
nvoiced 5peechの場合のようにレベルス
ペクトルが周期ストラクチ+ (periodlc 5
tructure)を持っていない時は、パルス列の中
の1つが時々低周波数を持っており、ウィンドウィング
の効果で関連スペクトルが比較的スムーズになる。
コードベクトルはm=4で(2)式を最小にするコード
ブックエントリであり、サーチング(searchin
g)によって見出す。本発明のシステムにおいては、ラ
ンダム周波数とランダム振幅を有する16個のシヌソイ
ドのFFTによってコードワードを構築する。
位相モデリング 良好なスピーチクォリティを確保するためには正弦波ス
ピーチ合成器において位相を正しく表現することが重要
である。レベルスペクトルと違って、位相スペクトルは
高調波で整合させるだけで良い。従って解析器と合成器
の両方において高調波を求める。本発明の実施態様にお
いては2つの位相推定法を用いる。2つの方法を各スピ
ーチフレームについて評価し、エラーが小さい方の方法
を採用する。第1の方法はパラメータ法であり、ピッチ
パルスの位置とスペクトルエンベロープとからを位相を
導き出す。第2の方法は、位相が連続していることを前
提とし、先行フレームの位相から位相を予測する。
最小位相を前提としてレベルスペクトルから位相を導出
す高調波位相モデルを作った。声楽位相関数(voca
l tract phase function)φk
を全極モデルから直接導き出すこともできる。周波数が
ω、の高調波の実位相θ、とφ、との関係は次式%式% ここで10はピッチパルスの立上り(onset)の時
間位置であり、λは整数であり、ε、は推定誤差(es
tiIIlation error)即ち位相残留誤差
(phase  residual)である6+ εにの分散(yBriance)は、全極モデルに代え
て匪/零モデルを用いることによってほぼ完全に抑制す
ることができる。声門パルス(glottalpuls
e)の形状が理想パルスから隔たっている時には、零に
よって鼻音(nasal)とスピーチを表現することが
できる。複合スペクトル誤差を最小にする方法によれば
、p個の極とq個の零とで構成されるフィルタH(ωk
)を係数a1、biで指定する: 最適フィルタは総二乗スペクトル誤差を最小にする: H(ωk)はスペクトルエンベロープのみをモデリング
する故、ω、1≦に≦にはレベルスペクトルのピークに
相当する。この式の閉解(coosad f’ori 
5olution)は知られていない故、反復法を用い
る。一定範囲の値10を試し、E、を最小にする値を選
ぶことによってパルスの位置を認識する。H(ωk)が
最小パルスであることは強制されない。極/零フィルタ
が正確な°位相スペクトルを出すが、レベルスペクトル
に誤差を生じる場合がある。このような場合の最も簡単
な解決方法としては全極フィルタに切替える。
M2の位相推定法は、周波数がフレームからフレームに
かけて直線的に変化し、位相が連続していることを前提
とする。この2つの条件が満されれば、先行フレームか
ら位相を予測することができる。高周波の位相の推定増
分はtwkである(ωえは高調波の平均周波数であり、
tはフレームとフレームとの間の時間である)。この方
法は、先行フレームの正確な推定値が得られ、高調波が
フレームとフレームとの間で正確に整合している場合に
有効である。誤差を最小にする方法によって位相を推定
した後、ε、残留位相(phase residual
)が残る。残留位相1え、εkを0個のコードワードか
ら成るコードブックから選んだランダムベクトルマ  
 1≦C≦Cで置換することによっc、にゝ てコーディングすることができる。コードワード選択は
、最小平均二乗誤差(MSE)を与えるコードワードを
見出すための徹底サーチング(exhaustive 
 5earch)である。周波数と振幅Akは同じであ
るが、位相が角度Vkだけ隔たっている2λ つのシヌソイドのMSEはAK [1−cos(vk)
]である。コードワードは次式を最小にするものを選ぶ
この基準(c、riterlon)によってまた、パラ
メータ推定法を用いるか、位相予測推定法を用いるかを
判断することができる。
特定のスペクトル内の残留位相は相関関係がなく、正規
分布になる性質がある故、ホワイトガウスノイズシーケ
ンスからコードワードを構築する。
換算係数は非直線性の故に必ずしも最適ではないが、コ
ードワードに換算係数を掛けて誤差を最小にする。
高調波整合 フレームとフレームの間で高調波が正しく整合している
ことは位相を予測するうえで特に重要な条件である。フ
レームとフレームとの間の基本ピッチ変化と、サイドロ
ーブとウィンドウの減算(Sldelobes and
 window 5ubtraction)に起因する
疑似低レベル高調波(f’alse low−leve
l harmonies)によって整合が複雑化する。
エネルギー基準(energy criterion)
を導入することによって真高調波を疑似高調波から弁別
することができる。フレームmのに番目の高調波の振幅
をAk(m)とする。
エネルギー正規化振幅比 またはその逆数が一定の上限を越えれば、4m)  A
(、m−1)  は同じ同一高調波に対応せず、整合し
ない。実験によっ−で求めた最適上限は約4であるが、
厳密に4とする必要はない。
ピッチの変化は、専攻フレームに対する各フレームのピ
ッチの比γを推定することによって考慮することができ
る。周波数がωK(m)の高調派は、調節ずみ周波数差 ω戸ゝ−γωfrri−1) 1    ・・・(8)
が小さければ、周波数ωr−1)  の高調波に近いと
考えることができる。(8)式によれば接近しており、
(7)式に従えば振幅が同じである隣接フレーム内の高
調波を整合する。正しい整合が分っていれば、振幅で重
みづけした先行フレームのピッチに対する各高調波のピ
ッチの平均比からγを推定することができる。
γの値は未知であるが、γを最初に1とし、高調波を反
復整合させ、安定値になるまでγを更新することによっ
て近似することができる。この方式は、ピッチが急変化
し疑似高調波が存在する時に信頼性がある。
合成 パラメータ法の特徴としては、各シヌソイドの周波数を
合成器によってレベルスペクトルから求めることができ
、転送する必要がない。スピーチをウィンドウィングす
れば高調波のスペクトル拡張(spectral sp
readlng)を生じる故、スペクトルのピークの位
置を確認することによって周波数を推定する。大低の音
声スピーチ(volced 5peech)に対して 
は単純なピークピッキングアルゴリスム(peak p
lcking algorithm)で十分対応できる
が1非音声スピーチ(unvoiced 5peech
 )の場合は不自然な音質になる。それは、非音声スピ
ーチにおいてはスペクトルの領域内のピーク数かスペク
トルエネルギーではなくスペクトルの平滑度に関係づけ
られるからである。
ピーク数(concentratlon of pea
ks)は、見出した各高調波の寄与を減算することによ
って、スペクトル領域の下の部分に対応させることがで
きる。まず最大ベークを高調波と仮定するハミングウィ
ンドウのレベルスペクトルをスピーチのレベルスペクト
ルから減算する。レベルスペクトルがすべての周波数に
おいて一定の限界値を下回るまでこのプロセスを繰返す
FFT解による周波数推定誤差によって、ピークの真の
位置の一方の側しか測定されない場合は、スペクトルの
一部がウィンドウ減算(wlndow subtrae
tion)の後他方の側に残り、スプリアス高調波(s
purious harmonlc)になる。FFT解
内のこの周波数誤差(artlfacts of’ f
requency errors)は、変更ウィンドウ
変換(modeled vindov transro
rm)W’1−max  (W   、 W  、 W
   )を用i−t   t   Di いることによって排除することができる(W、は時間ウ
ィンドウ(time window)のFFTを表すシ
ーケンスである)。W゛1はここでは広いレベルスペク
トルウィンドウ(wide magnitude sp
ectrumwindow)と言う。FFTが大きけれ
ばW’1はWlに近付く。
この実施態様におけるフレーム境界の不連続を防止する
ために、後続フレームと先行フレームに各々半分オーバ
ラップする二乗余弦関数(ralsedcosine 
runctlon)によって各フレームをウィンドウィ
ング(ウィンドウ)する。互いに整合している隣接フレ
ーム内の高調波ペア(harmonics pair)
の周波数を直線内挿(linear Interpol
atlon)すれば、ペアの和が連続シヌソイドになる
。非整合高調波の周波数は不変である。
[詳細な説明] 本発明の1つの代表的実施態様としてのスピーチ処理シ
ステムのブロックダイヤグラムを第1図に示す。A/D
へ変換器110が乗入アナログスピーチ信号をデジタル
スピーチサンプルに変換し、このデジタルスピーチサン
プルをスピーチ解析器120が処理する。解析器120
で得た一連のパラメータをチャンネルエンコーダ130
へ送ってエンコーディング。チャンネルデコーダ150
がチャンネルデコーダ130からチャンネル140を介
して量子化パラメータを受け、これをデコーディングし
、デコーディングしたパラ、メータをスピーチ合成器1
60へ送る。合成器160がパラメータを処理して、デ
ジタル合成スピーチを生成し、D/A変換器170がこ
のディジタル合成スピーチを処理し、乗入アナログスピ
ーチ信号を再生する。
以下の解説を理解するための一連の計算式(10)乃至
(26)を表1.2.3に示す。
ABLE1 ABu2 TAJ3LE3 スピーチ合成器120の詳細を第2図に示す。変換器1
10がデジタルスピーチサンプルをオーバラップフレー
ムにしてウィンドウ器201へ送り、ウィンドウ器20
1が各フレームをハミングウィンドウして一連のスピー
チサンプルS、を生成する。
フレーミング(framing)並びにウィンドウィン
グの方法は当業者にとって周知である。スペクトル生成
器203がスピーチサンプルs1をFFTを実行し、レ
ベルスペクトルIF (ω)1 と位相スペクトルθ(
ω)を生成する。スペクトル生成器203が実行するF
FTは一次元フーリエ変換である。
スペクトル生成器203力を生成するレベルスペクトル
IF(ω)1 は内挿スペクトルであり、各スピーチフ
レームにおいてスピーチサンプル S、の数よりも周波
数サンプルの数の方が多い。内挿スペクトルは、スピー
チサンプルを時間領域を零埋込み(zero padd
ing)するか又は、未内挿スペクトルの隣接周波数サ
ンプルを内挿することによって求めることができる。全
極解析器210が(11)式で与えられる全極モデルに
対して標準直線予測コーディング(LPCIfnear
predictlvecodlng)を用いて、ウィン
ドウィングずみスピーチサンプルS、を処理してパラメ
ータa、を生成し、(22)。
(23)式を逐次評価し、E を最小にするピッチパル
ス位置t。の値を出す。(11)式のパラメータpは全
極モデルの極数である。(22)、  (23)、 (
11)式においで用いる周波数ωには、ピーク検出器2
09によってレベルスペクトル1F(ω)のピークを検
出するだけで求める周波数ω′、である。解析器210
がa、、toの値を、パラメータbiに対する零値(極
/零解析の零に相当する)と共に選択器212へ送る。
全極解析器206はまず、レベルスペクトルF(ω)と
位相スペクトルθ(ω)から複合スペクトルIF(0月
を求め、続いて直線法と複合スペクトルF(ω)を用い
てパラメータa i +b1.toを計算し、(5)式
で与えられるE、を最小にする(I((ωk)は(4)
式で与えられる)。
(4)式のパラメータp、zは各々極/零モデルの極数
1例数である。(4) (5)式、において用いる周波
数ωには、ピーク検出器209が求める周波数ω kで
ある。解析器206はa、、b、、toの値を選択器2
12へ送る。選択器212は、全極解析結果と極/零解
析結果を評価し、(12)式で与えられる平均二乗誤差
を最少にするパラメータを選択する。量子化器217は
、選択器212が選択したパラメータに対して周知の量
子化法を用いて量子化ハラス9 a 、、b = ’+
  t Oの値を求め、チャンネルエンコーダ130が
エンコーディングし、チャンネル140を介して送る。
レベル量子化器221は、量子化パラメータi、。
b工、レベルスペクトルIF(ω)1並びにコードンQ
b4− C12,a −(Za、4. (14,4−f
 1. f 2を生成する。レベル量子化器221の詳
細を第4図に示す。総和器421が、時限器423が生
成する先行フレームの推定レベルスペクトル、パルス列
変換生成器(pulse train transfo
rm generator)403゜405が生成する
2つの周期パルス列のレベルスペクトル、並びにコード
ブック230がら選択したべクトルvd、にの加重和と
して推定レベルスペクトル F(ω) を生成する。パ
ルス列とベクトル(コードワード)を時間領域でハミン
グウィンドウィングし、スペクトル逓倍器(spect
ral multiplier)407 、409 、
411を介して、生成器401が量子化パラメータa1
、blから生成するレベルスペクトルエンベローブを用
いて重みづけする。
生成した関数d (ω)、d2 (ω)、d3 (ω)
■ 、d4 (ω)、を更に各々逓倍器413 、415 
、417 、419で重みづけする。重みα1.4 ’
  2.4α3,4.α4,4並びに2つの周期パルス
列の周波数fl、f2は、最適化器(optia+1z
er)427によって(2)式を最小にする値を選択す
る。
シヌソイド検出器(sinusoid finder)
224 (第2図)が、推定レベルスペクトルIF(ω
)1 を解析することによって、一連のシヌソイドの振
幅Akと周波数ω、を求める。シヌソイド検出器224
はまず、 1?(ω)1 のピークを検出し、続いてピ
ークと同じ振幅と周波数の広いレベルスペクトルウィン
ドウを構築する。広いレベルスペクトルウィンドウは、
ここでは変更ウィンドウ変換(tnodnled wi
ndow transf’orm)とも言う。シヌソイ
ド検出器224は続いて、広いレベルスペクトルウィン
ドウであるスペクトル成分を推定レベルスペクトルIF
 <ω)1 がら減算する。シヌソイド検出器224は
、推定レベルスペクトル+?(ω)Iがすべての周波数
において一定の限界値を下回るまで次のピークで同じプ
ロセスを繰返す。シヌソイド検出器224は続いて高調
波に換算係数を掛け、高調波の総エネルギーを、計算器
20gが(1o)式にしたがってスピーチサンプルs1
がら計算するエネルギーnrgに等しく丈る。続いてシ
ヌソイド整合器(sinusoid watcher)
227が、(7) 、 (a) 、  (9)式に従っ
て整合された現在フレームのシヌソイドと先行シヌソイ
ドを結付けるアレイBACKを生成する。シヌソイド整
合器227はまた、周知のフレーム格納法(f’raI
Ile storage technlque)を用い
て、同じように整合させた現在フレームのシヌソイドと
後続シヌソイドを結付けるアレイLINKを生成する。
パラメータ位相推定器235が、数量子化パラメータa
is bt−、toを用いて、(22)式に従って推定
位相スペクトルθ。(ω)を生成する。位相予測器23
3が、周波数を直線的に内挿することを前提として先行
フレームから位相スペクトルθ1(ω)を予測する。選
択器237が、(23)式で与えられる加重位相誤差を
最小にする推定位相スペクトルθ(ω)を選択する(A
kは各シヌソイドの振幅であり、θ(ω、)は実位相で
あり、 θ(ω、)は推定位相である)。パラメータ法
を選んだ場合は、パラメータ(位相法)をゼロにセット
し、予測法を選んだ場合はパラメータ(位相法)を1に
セットする。総和器247、逓倍器245、最適化器2
40から成るシステムによって、選んだ位相推定法を用
いた後、残る誤差をベクトル量子化する。ベクトル量子
化プロセスとしては、θ(ωk)とθ(ω、)の差であ
る残留位相を、徹底サーチングによってコードブック2
43から選択したランダムベクトル’c、にと置換し、
(24)式で与えられる平均二乗誤差を最小にするコー
ドワードを求める。選択されたベクトルへの指数11と
換算係数γ。がかくして決定される。総和器249が最
終位相スペクトルを生成する。時限器251が最終位を
目スペクトルを1フレ一ム分だけ遅らせ、位相予測器2
51へ送る。
スピーチ合成器160の詳細を第3図に示す。受けた指
数12を用いて、コードブック308がらベクトルvd
、kを求める。レベルスペクトル推定器310がベクト
ルvd、にと、受けたパラメータa1.4’   2.
4  3,4  4.4’  ”  ””a i s 
b tを用いて、(1)式に従って推定レベルスペクト
ル1?(ω)i、を計算する。推定器310(第5図)
のコンポーネント501 、503 、505 。
507 、509 、511 、513 、515 、
517 、519 。
521 、523は、レベル量子化器221(第4図)
の対応コンポーネント401 、403 、405 、
407 、409 。
411 、413 、415 、 417 、419 
、421 、 423と同じ機能を実行する。合成器1
8Gシヌソイド検出器312(第3図)とシヌソイド整
合器314は、解析器120のシヌソイド検出器224
(第2図)とシヌソイド整合器227と同じ機能を実行
し、一連のシヌソイドの周波数ωにと、現在フレームの
シヌソイドと先行フレームのシヌソイドを結付けるアレ
イBACK、並びに現在フレームのシヌソイドと後続フ
レームのシヌソイドを結付けるアレイLINKを生成す
る。スピーチ合成器160が生成するシヌソイドは予め
設定した周波数は持っていない。同周波数は、チャンネ
ル140を介して受けるパラメータによって決まり、推
定レベルスペクトルlF(ω)■の振幅値に基づいて計
算する。シヌソイド周波数は不等間隔である。
パラメータ位相推定器319は、受けたパラメータas
 、bt 、jOsシヌソイド検出器312が生成した
シヌソイドの周波数ω  (並びに解析器k ゝ 210(第2図)と解析器206に関連した上述したと
おりに実行する)全極解析又は極/零解析を用で、推定
位相スペクトルθ。(ω)を生成する。
受けたパラメータb1がすべてゼロである場合は、全極
解析を行い、しからざる場合は極/零解析を行う。位相
予測器317(第3図)は、位相予測器233(第2図
)と同じようにアレイLINKSBACKから推定位相
スペクトルθ1 (ω)を生成する。受けたパラメータ
(位相法)の値に応じて推定器319又は予測器317
が推定位相スペクトルを生成する。
位相法がゼロである場合は推定器319が生成した推定
位相スペクトルを選択器321を介して総和器327へ
送る。位相法が1である場合は、予測器317が生成し
た推定位相スペクトルを総和器327へ送る。選択した
位相スペクトルを、受けたパラメータγ と、受けた指
数■1によって設定されるコードブック323のベクト
ルマ。、にとの積と加え合せ、位相法の値に處して(2
5)式又は(2B)式で与えられる最終位相スペクトル
を求める。時限器335が最終位相スペクトルを1フレ
一ム分だけ遅らせて位相予測器317へ送る。シヌソイ
ド和生成器329が、長さがW(フレーム長さ)、周波
数がω (1≦に≦K)、振幅がA、位相がθにのK個
のシヌソイドを構築する。互いに整合している隣接フレ
ームのシヌソイドベアは周波数が直線内挿されており、
従って同シヌソイドベアの和は連続シヌソイドである。
非整合シヌソイドの周波数は不変である。生成器329
が構築したシヌソイドを加え合せ、ウィンドウィング(
ウィンドウ)器331が二乗余弦ウィンドウでシヌソイ
ド和をウィンドウィングし、オーバラップ/加算器(o
verlap/adder)333が隣接フレームをオ
ーバラップさせ、加え合せる。続いてD/A変換器17
0がデジタルサンプルをアナログ合成スピーチに変換す
る。
スピーチ解析器120(第1図)とチャンネルエンコー
ダ130の機能を実行する本発明の1実施態様としての
スピーチ解析プログラムのフローチャートを第6図に示
す。本実施例においてはフレーム中心間隔りは160の
サンプルであり、フレーム長さWは320サンプルであ
り、FFTKサンプル数Fは1024サンプルである。
解析に用いる極数Pは8であり、零敗Zは3である。ア
ナログスピーチは8000サンプル/秒の速度でサンプ
リングする。ブロック800乃至804で構成されてい
るTIME2POLルーチン601(第8図)によって
ブロック600(第6図)で受けるデジタルスピーチサ
ンプルを処理する。
ブロック802において(10)式を用いてウィンドウ
正規化エネルギー(vindov−normalize
d energy)を計算する。続いてプロセスはルー
チン601(第6図)から、ブロック900乃至904
で構成されているARMAルーチンB02(第9図)に
進む。ブロック902において(5)式でE を計算す
る(H(ω、)は(4)式で与えられる)。ブロック9
03において、全極解析に対して(11〉式を用いる。
ブロック904において(12)式で平均二乗誤差を計
算する。続いてプロセスはルーチン602(第6図)か
ら、ブロック1000乃至1017で構成されているQ
MAGルーチン603(第10図)へ進む。、ブロック
1004において(13)、(14)式でflを計算す
る。ブロック1005において(15)式でElを計算
する。ブロック1009において(16)、(17)式
でf2を計算する。ブロック1010において(18)
式でE2を計算する。ブロック1014において(19
)式でE3を計算する。ブロック1017において(2
0)式を用いて推定レベルスペクトルF(ω) を構築
する。続いてプロセスはルーチン603(第6図)から
、ブフック1100乃至1015で構成されている)I
AC2LI NEルーチン804(第11゛図)へ進む
。続いてプロセスルーチン604  (M6図)から、
ブロック1200  乃至1204で構成されているL
INKLINEルーチン605(第12図)へ進み、先
行フレームと現在フレーム、並びに現在フレームと後続
フレームのシヌソイド整合を行う。第12図のルーチン
はフレームmとフレーム(m−1)のンヌソイドを整合
させる。ブロック1203において、(7)式で与えら
れる比が0.25以下または4.0以上あればペアのエ
ネルギーは同一ではない。ブロック1204において(
21)式でピッチ比ρを計算する。続いてプロセスは、
ルーチン605(第6図)から、ブロック1300乃至
1307で構成されているC0NTルーチン606(第
13図)へ進む。ブロック1301において、(22)
式を評価することによって推定を行う。ブロック130
3において(23)式で加重位相誤差を求める(AKは
各シヌソイドの振幅であり、θ(ω )は実位相であり
、 ?(ω、)は推定に 位相である)。ブロック1305において(24)式で
平均二乗誤差を求める。ブロック 1307において、
パラメータ(位相法)がゼロであれば、(25)式によ
って構築を行い、位相法が1であれば(26)式によっ
て構築を行う。(26)式において、フレーム中心時間
間隔tはL/8000で与えられる。続いてプロセスは
ルーチン606(第6図)からENCルーチン607へ
進み、パラメータをエンコーディングする。
チャンネルデコーダ150(第1図)とスピーチ合成器
160の機能を実行する本発明の1つの代表的実施態様
としてのスピーチ合成プログラムのフローチャートを第
7図に示す。ブロック700(第7図)で受けたパラメ
ータをDECルーチン701でデコーディングする。続
いてプロセスはルーチン701からQMAGルーチン7
02へ進み、(1)式に従って量子化スペクトルip(
ω)1を構築する。続いてプロセスはルーチン720か
らMAG2LINEルーチン703へ進む(MAG2L
INEルーチン703は、エネルギーを再換算係数倍(
rescale) シないこと以外はMAG2LINE
ルーチン604(第6図)と同じである。続いてプロセ
スはルーチン703(第7図)からLINKLINEル
ーチン704(第6図のLINK LINEルーチン6
05と同じ)へ進む。続いてプロセスはルーチン704
(第7図)からC0NTルーチン705へ進む(CON
Tルーチン705は、位相法の直に応じて1つだけの位
相推定法を実行し、パラメータ推定に関しては、受けた
パラメータb、の値に応じて全極解析又は極/零解析の
みを実行すること以外は第6図のCDNTルーチン60
6と同じである)。続いてプロセスはルーチン705(
第7図)から、ブロック 1400乃至1404て構成
されるSYMPLOTルーチン706(第14図)へ進
む。
高調波スピーチコーディングを行う本発明の別の実施態
様としてのスピーチ解析プログラム、スピーチ合成プロ
グラムのフローチャートを第15図、第1.6図に示す
。第15図のフローチャートにおいて、ブロック150
1で入力スピーチの処理プロセスを開始し、−例として
FFTを行うことによってレベルスペクトルのピークを
見出だすスペクトル解析を行い、複数のシヌソイドにつ
いてA1、ω11θ1を求める。ブロック1502にお
いて、−例として入力スピーチの直線予測コーディング
(L P C1inear predlctlve c
oding)解1斤によってパラメータセット1を計算
し、推定値 A、を求める。ブロック1503において
、AIと A1との間の誤差を誤差基準(error 
criterion)に従ってベクトル量子化し、コー
ドブックにおけるベクトルを設定する指数IAと、換算
係数αAを求める。ブロック1504において、−例と
して、入力スピーチのピッチ検出によって得られる1つ
の基本周波数と、複数の整数倍基本周波数を用いてパラ
メータセット2を計算し、推定値ω1を求める。
ブロック1505において、ωtとωlとの間の誤差を
誤差基準に従ってベクトル量子化し、コードブックにお
けるベクトルを設定する指数Iωと、換算係数αωを求
める。ブロック1506において、−例として、先述の
パラメータ解析又は位相予測によってパラメータセット
3を計算し、推定値θ。
を求める。ブロック1507において、θIとθiと0
間の誤差を誤差基準に従ってベクトル量子化し、コード
ブックにおけるベクトルを設定する指数1θと、換算係
数αθを求める。これらのバラメータセット、指数並び
に換算係数をブロック1508においてエンコーディン
グする。(パラメータセット1,2.3は一般的には離
散セット(disjolntset)ではない)。
本発明の別の実施態様としてのスピーチ合成プログラム
のフローチャートを第16図に示す。ブロック1601
において受けたパラメータの処理プロセスを開始し、パ
ラメータセット1を用いて推定値A1を求める。ブロッ
ク1602において、指数I八によって設定されるベク
トルをコードブックから求め、換算計数αAを掛け、A
1に加え合せてA1を求める。ブロック1603におい
て、パラメータセット2を用いて推定値ω1を求める。
ブロック1804において、指数■ωによって設定され
るベクトルをコードブックから求め、換算計数αωを掛
け、ω に加え合せてωIを求める。プロワり1605
において、パラメータセット3を用いて推定値θ1を求
める。ブロック1606において、指数Iθによって設
定されるベクトルをコードブックから求め、換算係数α
θを掛け、θ1に加え合せてθ1を求める。ブロック1
607において、A1、ω1、θ1によって設定される
シヌソイドの和としての合成スピーチを生成する。
[発明の効果コ 本願の発明によれば、スピーチクォリティを向上させた
高質の合成スピーチが生成できる高調波スピーチコーデ
ィングシステムを提供することができる。
【図面の簡単な説明】
第1図は、本発明の1つの代表的実施態様としての高調
波スピーチコーディングシステムのブロックダイヤグラ
ム、 第2図は、第1図のシステムのスピーチ解析器のブロッ
クダイヤグラム、 第3図は、第1図のシステムのスピーチ合成器のブロッ
クダイヤグラム、 第4図は、第2図の解析器のレベル数量子化器(LIa
gnltude quantizer)のブロックダイ
ヤグラム〜第5図は、第3図の合成器のレベルスペクト
ル推定器、 第6図、第7図は、本発明の1つの代表的実施態様とし
てのスピーチ解析プログラム、スピーチ合成プログラム
のフローチャート、 第8図乃至第13図は、第6図のスピーチ解析プログラ
ムのルーチンの詳細フローチャート、第14図は、第7
図のスピーチ合成プログラムのルーチンの詳細フローチ
ャート、 第15図、第16図は、本発明の別の実施態様としての
スピーチ解析プログラム、スピーチ合成プログラムのフ
ローチャートである。 出願人:アメリカン テレフォン アンド図面の;浄書
(内容に変更なし) f;/+3 FIG、G 図面の浄書(内容に変更なし) FIG。 FIG。 図面の浄書(内容に変更なし) FI(3゜ 図面の浄書(内容に変更なし) 9/13 図面の浄書(内容に変更なし) FIG。 FIO。 図面の浄書(内容に変更なし) FIG。 図面の浄書(内容に変更なし) I!/+3 図面の浄書(内容に変更なし) FI(3,15 ゛スピー千MFTV’ロ2°゛ラヘ FIG、  16 スし・−号心乃ntりbへ 手 続 補 正 書(方式) %式% 発明の名称 スピーチ処理、合成と解析方法及びその装置3゜ 補正をする者 事件との関係 アメリカン テレフォン

Claims (42)

    【特許請求の範囲】
  1. (1)高調波スピーチコーディングシステムにおいて、 スピーチからレベルスペクトルを決定するプロセス、 連続レベルスペクトルとして、このレベルスペクトルを
    モデリングするパラメータセットを計算するプロセス、 このパラメータセットをスピーチ合成用に通信するプロ
    セス、 からなることを特徴とするスピーチ処理方法。
  2. (2)スピーチはスピーチフレームを含み、決定プロセ
    スは、ある現在スピーチフレームからレベルスペクトル
    を決定するステップを含み、計算プロセスは、複数の関
    数の和を含む連続レベルスペクトルとして、このレベル
    スペクトルをモデリングするパラメータセットを計算す
    るステップを含み、 この関数の1つは先行前記フレームのレベルスペクトル
    の1つであることを特徴とする請求項1記載の方法。
  3. (3)連続レベルスペクトルは、複数の関数の和を含む
    ことを特徴とする請求項1記載の方法。
  4. (4)前記関数の少なくとも1つは、周期パルス列のレ
    ベルスペクトルであることを特徴とする請求項3記載の
    方法。
  5. (5)ある前記関数は、第1周期パルス列のレベルスペ
    クトルで、別の前記関数は、第2周期パルス列のレベル
    スペクトルであることを特徴とする請求項3記載の方法
  6. (6)前記関数の少なくとも1つは、コードブックから
    選択されたベクトルであることを特徴とする請求項3記
    載の方法。
  7. (7)計算プロセスは、連続レベルスペクトルを決定さ
    れたレベルスペクトルに、最少平均二乗誤差基準に基づ
    いて合わせるよう、パラメータセットを計算するステッ
    プを含むことを特徴とする請求項1記載の方法。
  8. (8)スピーチから位相スペクトルを決定するプロセス
    、 この位相スペクトルをモデリングする第2パラメータセ
    ットを計算するプロセス、 この第2パラメータセットをスピーチ合成用に通信する
    プロセス、 を更に含むことを特徴とする請求項1記載の方法。
  9. (9)計算プロセスは、複数の関数の和として、この位
    相スペクトルをモデリングする第2パラメータセットを
    計算するステップを含むことを特徴とする請求項8記載
    の方法。
  10. (10)前記関数のすくなくとも1つは、コードブック
    から選択されたベクトルであることを特徴とする請求項
    9記載の方法。
  11. (11)計算プロセスは、この位相スペクトルをモデリ
    ングするため、極−零解析法を用いて、第2パラメータ
    セットを計算するステップを含むことを特徴とする請求
    項8記載の方法。
  12. (12)計算プロセスは、この位相スペクトルをモデリ
    ングするため、全極解析法を用いて、第2パラメータセ
    ットを計算するステップを含むことを特徴とする請求項
    8記載の方法。
  13. (13)計算プロセスは、 この位相スペクトルをモデリングするため、極−零解析
    法を用いるステップ、 この位相スペクトルをモデリングするため、全極解析法
    を用いるステップ、 極−零解析法、全極解析法のいずれかを選択するステッ
    プ、 前記ステップで選択された解析法に基づいて、第2パラ
    メータセットを決定するステップ、を含むことを特徴と
    する請求項8記載の方法。
  14. (14)スピーチはスピーチフレームを含み、現在のス
    ピーチフレームの1つから位相スペクトルを決定するプ
    ロセス、 現在のスピーチフレーム以外の少なくともあるフレーム
    からの予測により、この位相スペクトルをモデリングす
    る第2パラメータセットを計算するプロセス、 この第2パラメータセットをスピーチ合成用に通信する
    プロセス、 を更に含むことを特徴とする請求項1記載の方法。
  15. (15)スピーチはスピーチフレームを含み、決定プロ
    セスは、 ある現在スピーチフレームからレベルスペクトルを決定
    するステップと、 現在スピーチフレーム以外のフレームの1つから別のレ
    ベルスペクトルを決定するステップとを含み、 本方法は あるレベルスペクトルから複数のシヌソイドを決定する
    プロセス、 別のレベルスペクトルから別の複数のシヌソイドを決定
    するプロセス、 正弦波周波数に基づいて、ある複数のシヌソイドと別の
    複数のシヌソイドとをマッチングさせるプロセス、 現在のスピーチフレームから位相スペクトルを決定する
    プロセス、 前記マッチングプロセスに基づく予測により、この位相
    スペクトルをモデリングする第2パラメータセットを計
    算するプロセス、 この第2パラメータセットをスピーチ合成用に通信する
    プロセス、 を更に含むことを特徴とする請求項1記載の方法。
  16. (16)スピーチはスピーチフレームを含み、決定プロ
    セスは、 ある現在スピーチフレームからレベルスペクトルを決定
    するステップと、 現在スピーチフレーム以外のフレームの1つから別のレ
    ベルスペクトルを決定するステップとを含み、 本方法は、 あるレベルスペクトルから複数のシヌソイドを決定する
    プロセス、 別のレベルスペクトルから別の複数のシヌソイドを決定
    するプロセス、 正弦波周波数と振幅に基づいて、ある複数のシヌソイド
    と別の複数のシヌソイドとをマッチングさせるプロセス
    、 現在のスピーチフレームから位相スペクトルを決定する
    プロセス、 前記マッチングプロセスに基づく予測により、この位相
    スペクトルをモデリングする第2パラメータセットを計
    算するプロセス、 この第2パラメータセットをスピーチ合成用に通信する
    プロセス、 を更に含むことを特徴とする請求項1記載の方法。
  17. (17)スピーチはスピーチフレームを含み、決定プロ
    セスは、 ある現在スピーチフレームからレベルスペクトルを決定
    するステップと、 現在スピーチフレーム以外のフレームから別のレベルス
    ペクトルを決定するステップとを含み、本方法は、 あるレベルスペクトルから複数のシヌソイドを決定する
    プロセス、 別のレベルスペクトルから別の複数のシヌソイドを決定
    するプロセス、 現在スピーチフレームのピッチと現在スピーチフレーム
    以外のフレームのピッチとの比率を決定するプロセス、 正弦波周波数と前記プロセスで決定された比率に基づい
    て、ある複数のシヌソイドと別の複数のシヌソイドとを
    マッチングさせるプロセス、現在のスピーチフレームか
    ら位相スペクトルを決定するプロセス、 前記マッチングプロセスに基づく予測により、この位相
    スペクトルをモデリングする第2パラメータセットを計
    算するプロセス、 この第2パラメータセットをスピーチ合成用に通信する
    プロセス、 を更に含むことを特徴とする請求項1記載の方法。
  18. (18)スピーチはスピーチフレームを含み、決定プロ
    セスは、 ある現在スピーチフレームからレベルスペクトルを決定
    するステップと、 現在スピーチフレーム以外のフレームから別のレベルス
    ペクトルを決定するステップとを含み、本方法は、 あるレベルスペクトルから複数のシヌソイドを決定する
    プロセス、 別のレベルスペクトルから別の複数のシヌソイドを決定
    するプロセス、 現在スピーチフレームのピッチと現在スピーチフレーム
    以外のフレームのピッチとの比率を決定するプロセス、 正弦波周波数と振幅と前記プロセスで決定された比率に
    基づいて、ある複数のシヌソイドと別の複数のシヌソイ
    ドとをマッチングさせるプロセス、現在のスピーチフレ
    ームから位相スペクトルを決定するプロセス、 前記マッチングプロセスに基づく予測により、この位相
    スペクトルをモデリングする第2パラメータセットを計
    算するプロセス、 この第2パラメータセットをスピーチ合成用に通信する
    プロセス、 を更に含むことを特徴とする請求項1記載の方法。
  19. (19)スピーチはスピーチフレームを含み、現在スピ
    ーチフレームから位相スペクトルを決定するプロセス、 現在スピーチフレームのパラメータ解析法により推定第
    1位相を獲得するプロセス、 現在スピーチフレーム以外の少なくともあるフレームか
    らの予測により推定第2位相を獲得するプロセス、 推定第1位相と推定第2位相とのいずれかを選択するプ
    ロセス、 前記プロセスで選択された位相に関係し、位相スペクト
    ルをモデリングする第2パラメータセットを決定するプ
    ロセス、 この第2パラメータセットをスピーチ合成用に通信する
    プロセス、 を更に含むことを特徴とする請求項1記載の方法。
  20. (20)スピーチはスピーチフレームを含み、レベルス
    ペクトルから複数のシヌソイドを決定するプロセス、 現在スピーチフレームから位相スペクトルを決定するプ
    ロセスと、 現在スピーチフレームのパラメータ解析法により推定第
    1位相を獲得するプロセス、 現在スピーチフレーム以外の少なくともあるフレームか
    らの予測により推定第2位相を獲得するプロセス、 シヌソイドの周波数における誤差基準に基づいて、推定
    第1位相と推定第2位相とのいずれかを選択するプロセ
    ス、 前記プロセスで選択された位相に関係し、位相スペクト
    ルをモデリングする第2パラメータセットを決定するプ
    ロセス、 この第2パラメータセットをスピーチ合成用に通信する
    プロセス、 を更に含むことを特徴とする請求項1記載の方法。
  21. (21)レベルスペクトルから複数のシヌソイドを決定
    するプロセス、 スピーチから位相スペクトルを決定するプロセス、シヌ
    ソイドの周波数でこの位相スペクトルをモデリングする
    第2パラメータセットを計算するプロセス、 この第2パラメータセットをスピーチ合成用に通信する
    プロセス、 を更に含むことを特徴とする請求項1記載の方法。
  22. (22)高調波スピーチコーディングシステムにおいて
    、 パラメータセットを受信するプロセス、 このパラメータからスペクトルを決定するプロセス、 このスペクトルから複数のシヌソイドを決定するプロセ
    ス、 前記シヌソイドの少なくともある正弦波周波数は前記ス
    ペクトル振幅値に基づいて決定され、前記シヌソイドの
    和として音声を合成することを特徴とするスピーチ合成
    方法。
  23. (23)スピーチはスピーチフレームを含み、スペクト
    ル決定プロセスは、 少なくともその1つは先行フレームの推定レベルスペク
    トルである複数の関数の和として、現在のスピーチフレ
    ーム用に推定レベルスペクトルを決定するステップを含
    むことを特徴とする請求項22記載の方法。
  24. (24)スペクトル決定プロセスは、 複数の関数の和として、推定レベルスペクトルを決定す
    るステップを含むことを特徴とする請求項22記載の方
    法。
  25. (25)前記関数の少なくとも1つは、受信パラメータ
    により決定される周波数を有する周期パルス列のレベル
    スペクトルであることを特徴とする請求項24記載の方
    法。
  26. (26)ある前記関数は、第1周期パルス列のレベルス
    ペクトルで、 別の前記関数は、第2周期パルス列のレベルスペクトル
    で、 第1と第2周期パルス列の周波数は、受信パラメータセ
    ットにより決定されることを特徴とする請求項24記載
    の方法。
  27. (27)前記関数の少なくとも1つは、コードブックか
    らの、受信パラメータセットにより決定される指数によ
    り識別されるベクトルであることを特徴とする請求項2
    4記載の方法。
  28. (28)スペクトル決定プロセスは、 複数の関数の和として、推定位相スペクトルを決定する
    ステップを含むことを特徴とする請求項22記載の方法
  29. (29)前記関数の少なくとも1つは、コードブックか
    らの、受信パラメータセットにより決定される指数によ
    り識別されるベクトルであることを特徴とする請求項2
    8記載の方法。
  30. (30)スペクトル決定プロセスは、 極−零モデルと受信パラメータセットを用いて、推定位
    相スペクトルを決定するステップを含むことを特徴とす
    る請求項22記載の方法。
  31. (31)スペクトル決定プロセスは、 全極モデルと受信パラメータセットを用いて、推定位相
    スペクトルを決定するステップを含むことを特徴とする
    請求項22記載の方法。
  32. (32)受信プロセスは、 現在のスピーチフレーム用のパラメータセットを受信す
    るステップを、 スペクトル決定プロセスは、 このパラメータセットのある第1値に応答して、パラメ
    ータ法モデルとパラメータセットを用いて、現在のスピ
    ーチフレーム用の推定位相スペクトルを決定するステッ
    プと、 このパラメータセットのある第2値に応答して、現在の
    スピーチフレーム以外のスピーチフレームに基づく予測
    モデルを用いて、現在のスピーチフレーム用の推定位相
    スペクトルを決定するステップとを、 含むことを特徴とする請求項22記載の方法。
  33. (33)スペクトル決定プロセスは、 推定レベルスペクトルを決定するステップを、シヌソシ
    ド決定プロセスは、 推定レベルスペクトルにピークを見出だすステップと、 推定レベルスペクトルから前記ピークに関連するスペク
    トル成分を減算するステップと、 前記見出しステップと減算ステップとを、推定レベルス
    ペクトルが全周波数に対して限界値以下になるまでくり
    かえすステップとを、 含むことを特徴とする請求項22記載の方法。
  34. (34)スペクトル成分は広いレベルスペクトルウィン
    ドウを含むことを特徴とする請求項33記載の方法。
  35. (35)スペクトル決定プロセスは、 推定レベルスペクトルを決定するステップと、推定レベ
    ルスペクトルを決定するステップとを、シヌソシド決定
    プロセスは、 推定レベルスペクトルに基づいて、各シヌソイドの正弦
    波周波数と振幅を決定するステップと、推定位相スペク
    トルに基づいて、各シヌソイドの正弦波位相を決定する
    ステップとを、 含むことを特徴とする請求項22記載の方法。
  36. (36)受信プロセスは、 あるスピーチフレーム用のあるパラメータセットと別の
    スピーチフレーム用の別のパラメータセットとを受信す
    るステップを、 スペクトル決定プロセスは、 あるパラメータセットからあるスペクトルを、別のパラ
    メータセットから別のスペクトルを決定するステップを
    、 シヌソイド決定プロセスは、 あるスペクトルからある複数のシヌソイドを、別のスペ
    クトルから別の複数のシヌソイドを決定するステップを
    含み、 本方法は、正弦波周波数に基づいて、ある複数のシヌソ
    イドと、別の複数のシヌソイドとをマッチングさせるプ
    ロセスを更に含み、 合成プロセスは、マッチングしたある複数のシヌソイド
    と、別の複数のシヌソイドとを内挿するステップを含む ことを特徴とする請求項22記載の方法。
  37. (37)受信プロセスは、 あるスピーチフレーム用のあるパラメータセットと別の
    スピーチフレーム用の別のパラメータセットとを受信す
    るステップを、 スペクトル決定プロセスは、 あるパラメータセットからあるスペクトルを、別のパラ
    メータセットから別のスペクトルを決定するステップを
    、 シヌソイド決定プロセスは、 あるスペクトルからある複数のシヌソイドを、別のスペ
    クトルから別の複数のシヌソイドを決定するステップを
    含み、 本方法は、正弦波周波数と振幅に基づいて、ある複数の
    シヌソイドと、別の複数のシヌソイドとをマッチングさ
    せるプロセスを更に含み、 合成プロセスは、マッチングしたある複数のシヌソイド
    と、別の複数のシヌソイドとを内挿するステップを含む ことを特徴とする請求項22記載の方法。
  38. (38)受信プロセスは、 あるスピーチフレーム用のあるパラメータセットと別の
    スピーチフレーム用の別のパラメータセットとを受信す
    るステップを、 スペクトル決定プロセスは、 あるパラメータセットからあるスペクトルを、別のパラ
    メータセットから別のスペクトルを決定するステップを
    、 シヌソイド決定プロセスは、 あるスペクトルからある複数のシヌソイドを、別のスペ
    クトルから別の複数のシヌソイドを決定するステップを
    含み、 本方法は、 あるスピーチフレームのピッチと別のスピーチフレーム
    のピッチとの比率を決定するプロセスと、正弦波周波数
    と前記プロセスにより決定された比率に基づいて、ある
    複数のシヌソイドと、別の複数のシヌソイドとをマッチ
    ングさせるプロセスとを更に含み、 合成プロセスは、マッチングしたある複数のシヌソイド
    と、別の複数のシヌソイドとを内挿するステップを含む ことを特徴とする請求項22記載の方法。
  39. (39)受信プロセスは、 あるスピーチフレーム用のあるパラメータセットと別の
    スピーチフレーム用の別のパラメータセットとを受信す
    るステップを、 スペクトル決定プロセスは、 あるパラメータセットからあるスペクトルを、別のパラ
    メータセットから別のスペクトルを決定するステップを
    、 シヌソイド決定プロセスは、 あるスペクトルからある複数のシヌソイドを、別のスペ
    クトルから別の複数のシヌソイドを決定するステップを
    含み、 本方法は、 あるスピーチフレームのピッチと別のスピーチフレーム
    のピッチとの比率を決定するプロセスと、正弦波周波数
    と振幅と前記プロセスにより決定された比率に基づいて
    、ある複数のシヌソイドと、別の複数のシヌソイドとを
    マッチングさせるプロセスとを更に含み、 合成プロセスは、マッチングしたある複数のシヌソイド
    と、別の複数のシヌソイドとを内挿するステップを含む ことを特徴とする請求項22記載の方法。
  40. (40)高調波スピーチコーディングシステムにおいて
    、 スピーチからレベルスペクトルを決定するプロセス、 連続レベルスペクトルとして、このレベルスペクトルを
    モデリングするパラメータセットを計算するプロセス、 このパラメータセットからスペクトルを決定するプロセ
    ス、 このスペクトルから複数のシヌソイドを決定するプロセ
    ス、 このシヌソイドの和としてスピーチを合成するプロセス
    、 からなることを特徴とするスピーチ処理方法。
  41. (41)高調波スピーチコーディングシステムにおいて
    、 スピーチに応答して、レベルスペクトルを決定する手段
    、 前記決定手段に応答して、連続レベルスペクトルとして
    、このレベルスペクトルをモデリングするパラメータセ
    ットを計算する手段、 スピーチ合成用に、前記パラメータセットを通信する手
    段、 とからなることを特徴とするスピーチ解析装置。
  42. (42)高調波スピーチコーディングシステムにおいて
    、 パラメータセットの受信に応答して、スペクトルを決定
    する手段、 このスペクトルとから、複数のシヌソイドを決定する手
    段、 前記シヌソイドの少なくとも1つの正弦波周波数は前記
    スペクトルの振幅値に基づいて決定され、前記シヌソイ
    ドの和として、スピーチを合成する手段、 とからなることを特徴とするスピーチ合成装置。
JP1087179A 1988-04-08 1989-04-07 スピーチ処理、合成と解析方法及びその装置 Pending JPH02203398A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US179170 1988-04-08
US07/179,170 US5179626A (en) 1988-04-08 1988-04-08 Harmonic speech coding arrangement where a set of parameters for a continuous magnitude spectrum is determined by a speech analyzer and the parameters are used by a synthesizer to determine a spectrum which is used to determine senusoids for synthesis

Publications (1)

Publication Number Publication Date
JPH02203398A true JPH02203398A (ja) 1990-08-13

Family

ID=22655511

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1087179A Pending JPH02203398A (ja) 1988-04-08 1989-04-07 スピーチ処理、合成と解析方法及びその装置

Country Status (5)

Country Link
US (1) US5179626A (ja)
EP (1) EP0337636B1 (ja)
JP (1) JPH02203398A (ja)
CA (1) CA1336456C (ja)
DE (1) DE68916831D1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002524759A (ja) * 1998-08-28 2002-08-06 シグマ オーディオ リサーチ リミテッド オーディオ信号の時間スケール及び/又は基本周波数を変更するための信号処理技術

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5189701A (en) * 1991-10-25 1993-02-23 Micom Communications Corp. Voice coder/decoder and methods of coding/decoding
JP3310682B2 (ja) * 1992-01-21 2002-08-05 日本ビクター株式会社 音響信号の符号化方法及び再生方法
JPH05307399A (ja) * 1992-05-01 1993-11-19 Sony Corp 音声分析方式
IT1270439B (it) * 1993-06-10 1997-05-05 Sip Procedimento e dispositivo per la quantizzazione dei parametri spettrali in codificatori numerici della voce
US5574823A (en) * 1993-06-23 1996-11-12 Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Communications Frequency selective harmonic coding
US5684920A (en) * 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
AU696092B2 (en) * 1995-01-12 1998-09-03 Digital Voice Systems, Inc. Estimation of excitation parameters
US5701390A (en) * 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
JP3680374B2 (ja) * 1995-09-28 2005-08-10 ソニー株式会社 音声合成方法
JPH09127995A (ja) * 1995-10-26 1997-05-16 Sony Corp 信号復号化方法及び信号復号化装置
US5946650A (en) * 1997-06-19 1999-08-31 Tritech Microelectronics, Ltd. Efficient pitch estimation method
US6029133A (en) * 1997-09-15 2000-02-22 Tritech Microelectronics, Ltd. Pitch synchronized sinusoidal synthesizer
US6893430B2 (en) * 1998-02-04 2005-05-17 Wit Ip Corporation Urethral catheter and guide
US6067511A (en) * 1998-07-13 2000-05-23 Lockheed Martin Corp. LPC speech synthesis using harmonic excitation generator with phase modulator for voiced speech
US6119082A (en) * 1998-07-13 2000-09-12 Lockheed Martin Corporation Speech coding system and method including harmonic generator having an adaptive phase off-setter
US6275798B1 (en) * 1998-09-16 2001-08-14 Telefonaktiebolaget L M Ericsson Speech coding with improved background noise reproduction
US6400310B1 (en) 1998-10-22 2002-06-04 Washington University Method and apparatus for a tunable high-resolution spectral estimator
JP2003502703A (ja) * 1999-06-18 2003-01-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 改善された符号器を有するオーディオ伝送システム
US6351729B1 (en) * 1999-07-12 2002-02-26 Lucent Technologies Inc. Multiple-window method for obtaining improved spectrograms of signals
US6876991B1 (en) 1999-11-08 2005-04-05 Collaborative Decision Platforms, Llc. System, method and computer program product for a collaborative decision platform
US7139743B2 (en) * 2000-04-07 2006-11-21 Washington University Associative database scanning and information retrieval using FPGA devices
US6711558B1 (en) * 2000-04-07 2004-03-23 Washington University Associative database scanning and information retrieval
US8095508B2 (en) * 2000-04-07 2012-01-10 Washington University Intelligent data storage and processing using FPGA devices
WO2002049001A1 (fr) * 2000-12-14 2002-06-20 Sony Corporation Dispositif d'extraction d'informations
US7716330B2 (en) 2001-10-19 2010-05-11 Global Velocity, Inc. System and method for controlling transmission of data packets over an information network
US20090161568A1 (en) * 2007-12-21 2009-06-25 Charles Kastner TCP data reassembly
US7093023B2 (en) * 2002-05-21 2006-08-15 Washington University Methods, systems, and devices using reprogrammable hardware for high-speed processing of streaming data to find a redefinable pattern and respond thereto
US7711844B2 (en) * 2002-08-15 2010-05-04 Washington University Of St. Louis TCP-splitter: reliable packet monitoring methods and apparatus for high speed networks
ES2298568T3 (es) * 2002-11-29 2008-05-16 Koninklijke Philips Electronics N.V. Descodificacion de audio.
US10572824B2 (en) 2003-05-23 2020-02-25 Ip Reservoir, Llc System and method for low latency multi-functional pipeline with correlation logic and selectively activated/deactivated pipelined data processing engines
US20070277036A1 (en) 2003-05-23 2007-11-29 Washington University, A Corporation Of The State Of Missouri Intelligent data storage and processing using fpga devices
US7602785B2 (en) 2004-02-09 2009-10-13 Washington University Method and system for performing longest prefix matching for network address lookup using bloom filters
US20060053295A1 (en) * 2004-08-24 2006-03-09 Bharath Madhusudan Methods and systems for content detection in a reconfigurable hardware
US7702629B2 (en) * 2005-12-02 2010-04-20 Exegy Incorporated Method and device for high performance regular expression pattern matching
US7954114B2 (en) 2006-01-26 2011-05-31 Exegy Incorporated Firmware socket module for FPGA-based pipeline processing
US7636703B2 (en) * 2006-05-02 2009-12-22 Exegy Incorporated Method and apparatus for approximate pattern matching
US7840482B2 (en) * 2006-06-19 2010-11-23 Exegy Incorporated Method and system for high speed options pricing
US7921046B2 (en) * 2006-06-19 2011-04-05 Exegy Incorporated High speed processing of financial information using FPGA devices
JP4827661B2 (ja) * 2006-08-30 2011-11-30 富士通株式会社 信号処理方法及び装置
US7660793B2 (en) 2006-11-13 2010-02-09 Exegy Incorporated Method and system for high performance integration, processing and searching of structured and unstructured data using coprocessors
US8326819B2 (en) * 2006-11-13 2012-12-04 Exegy Incorporated Method and system for high performance data metatagging and data indexing using coprocessors
KR101317269B1 (ko) * 2007-06-07 2013-10-14 삼성전자주식회사 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치
US8374986B2 (en) 2008-05-15 2013-02-12 Exegy Incorporated Method and system for accelerated stream processing
CA2744746C (en) 2008-12-15 2019-12-24 Exegy Incorporated Method and apparatus for high-speed processing of financial market depth data
US8489403B1 (en) * 2010-08-25 2013-07-16 Foundation For Research and Technology—Institute of Computer Science ‘FORTH-ICS’ Apparatuses, methods and systems for sparse sinusoidal audio processing and transmission
JP6045505B2 (ja) 2010-12-09 2016-12-14 アイピー レザボア, エルエルシー.IP Reservoir, LLC. 金融市場における注文を管理する方法および装置
US9990393B2 (en) 2012-03-27 2018-06-05 Ip Reservoir, Llc Intelligent feed switch
US10121196B2 (en) 2012-03-27 2018-11-06 Ip Reservoir, Llc Offload processing of data packets containing financial market data
US10650452B2 (en) 2012-03-27 2020-05-12 Ip Reservoir, Llc Offload processing of data packets
US11436672B2 (en) 2012-03-27 2022-09-06 Exegy Incorporated Intelligent switch for processing financial market data
US10133802B2 (en) 2012-10-23 2018-11-20 Ip Reservoir, Llc Method and apparatus for accelerated record layout detection
WO2014066416A2 (en) 2012-10-23 2014-05-01 Ip Reservoir, Llc Method and apparatus for accelerated format translation of data in a delimited data format
US9633093B2 (en) 2012-10-23 2017-04-25 Ip Reservoir, Llc Method and apparatus for accelerated format translation of data in a delimited data format
GB2541577A (en) 2014-04-23 2017-02-22 Ip Reservoir Llc Method and apparatus for accelerated data translation
US10942943B2 (en) 2015-10-29 2021-03-09 Ip Reservoir, Llc Dynamic field data translation to support high performance stream data processing
EP3560135A4 (en) 2016-12-22 2020-08-05 IP Reservoir, LLC PIPELINES INTENDED FOR AUTOMATIC ACCELERATED LEARNING BY EQUIPMENT
EP3616196A4 (en) 2017-04-28 2021-01-20 DTS, Inc. AUDIO ENCODER WINDOW AND TRANSFORMATION IMPLEMENTATIONS

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5326761A (en) * 1976-08-26 1978-03-13 Babcock Hitachi Kk Injecting device for reducing agent for nox
JPS58188000A (ja) * 1982-04-28 1983-11-02 日本電気株式会社 音声認識合成装置
JPS6139099A (ja) * 1984-07-31 1986-02-25 日本電気株式会社 Csmパラメ−タの量子化方法とその装置
JPS6157999A (ja) * 1984-08-29 1986-03-25 日本電気株式会社 擬フオルマント型ボコ−ダ
JPS62999A (ja) * 1985-03-26 1987-01-06 日本電気株式会社 区分的最適関数近似方法
JPS6265100A (ja) * 1985-09-18 1987-03-24 日本電気株式会社 Csm型音声合成器

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3681530A (en) * 1970-06-15 1972-08-01 Gte Sylvania Inc Method and apparatus for signal bandwidth compression utilizing the fourier transform of the logarithm of the frequency spectrum magnitude
US3982070A (en) * 1974-06-05 1976-09-21 Bell Telephone Laboratories, Incorporated Phase vocoder speech synthesis system
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
US4815135A (en) * 1984-07-10 1989-03-21 Nec Corporation Speech signal processor
US4797926A (en) * 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5326761A (en) * 1976-08-26 1978-03-13 Babcock Hitachi Kk Injecting device for reducing agent for nox
JPS58188000A (ja) * 1982-04-28 1983-11-02 日本電気株式会社 音声認識合成装置
JPS6139099A (ja) * 1984-07-31 1986-02-25 日本電気株式会社 Csmパラメ−タの量子化方法とその装置
JPS6157999A (ja) * 1984-08-29 1986-03-25 日本電気株式会社 擬フオルマント型ボコ−ダ
JPS62999A (ja) * 1985-03-26 1987-01-06 日本電気株式会社 区分的最適関数近似方法
JPS6265100A (ja) * 1985-09-18 1987-03-24 日本電気株式会社 Csm型音声合成器

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002524759A (ja) * 1998-08-28 2002-08-06 シグマ オーディオ リサーチ リミテッド オーディオ信号の時間スケール及び/又は基本周波数を変更するための信号処理技術

Also Published As

Publication number Publication date
US5179626A (en) 1993-01-12
EP0337636A3 (en) 1990-03-07
CA1336456C (en) 1995-07-25
EP0337636A2 (en) 1989-10-18
DE68916831D1 (de) 1994-08-25
EP0337636B1 (en) 1994-07-20

Similar Documents

Publication Publication Date Title
JPH02203398A (ja) スピーチ処理、合成と解析方法及びその装置
EP0336658B1 (en) Vector quantization in a harmonic speech coding arrangement
US5781880A (en) Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
US6122608A (en) Method for switched-predictive quantization
US5794182A (en) Linear predictive speech encoding systems with efficient combination pitch coefficients computation
US5787387A (en) Harmonic adaptive speech coding method and system
CA2031006C (en) Near-toll quality 4.8 kbps speech codec
US7039581B1 (en) Hybrid speed coding and system
US7222070B1 (en) Hybrid speech coding and system
JP2759646B2 (ja) 音響波形の処理
NO323730B1 (no) Modellering, analyse, syntese og kvantisering av tale
US6889185B1 (en) Quantization of linear prediction coefficients using perceptual weighting
JP2003050600A (ja) 線スペクトル平方根を発生し符号化するための方法と装置
US7139700B1 (en) Hybrid speech coding and system
Srivastava Fundamentals of linear prediction
Gottesmann Dispersion phase vector quantization for enhancement of waveform interpolative coder
Thomson Parametric models of the magnitude/phase spectrum for harmonic speech coding
JP2000514207A (ja) 音声合成システム
Champion et al. High-order allpole modelling of the spectral envelope
EP0713208B1 (en) Pitch lag estimation system
Li et al. Enhanced harmonic coding of speech with frequency domain transition modelling
Ahmadi et al. New techniques for sinusoidal coding of speech at 2400 bps
Akamine et al. ARMA model based speech coding at 8 kb/s
Yang et al. Pitch synchronous multi-band (PSMB) speech coding
Magner Orthogonal analysis of multipulse-excited LPC speech coders