JPS59500988A - ボイスエンコ−ダおよびシンセサイザ - Google Patents

ボイスエンコ−ダおよびシンセサイザ

Info

Publication number
JPS59500988A
JPS59500988A JP57502136A JP50213682A JPS59500988A JP S59500988 A JPS59500988 A JP S59500988A JP 57502136 A JP57502136 A JP 57502136A JP 50213682 A JP50213682 A JP 50213682A JP S59500988 A JPS59500988 A JP S59500988A
Authority
JP
Japan
Prior art keywords
voice
pitch
digital
filter
sampling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57502136A
Other languages
English (en)
Inventor
フエルドマン・ジヨエル・エイ
ホフステツタ−・エドワ−ド・エム
Original Assignee
マサチユ−セツツ インステイテユ−ト オブ テクノロジ−
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by マサチユ−セツツ インステイテユ−ト オブ テクノロジ− filed Critical マサチユ−セツツ インステイテユ−ト オブ テクノロジ−
Publication of JPS59500988A publication Critical patent/JPS59500988A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 ボイスエンコーダおよびシンセサイザ 技術分野 本発明は音声(スピーチ)技術に関し、詳しくいうと、音声を合成するためのデ ィジタルコード化技術および方法に関する。
発明の背景 米国政府は米国空車によって認定された契約AF19(62B)−’76−C− 0002によりこの発明に対する権利を有する。
音声帯域幅を圧縮・する種々の方法が記載されている「ボコーダ・インプルメン テーションズ・オン・ザ・リンカーン・ディジタル・ボイス・ターミナル(Vo coderimplementations on the Lincoln  l)igital VoiceTerminal ) J 7’ロシーデイング ス・オン・イー・エイ・ニス・シー・オー・エヌ(EAS CON ) 197 5年、ワシントン・ディー・シー(1975年9月)と題する本発明者の1人で あるイー・エム・ホフステッター、ならびにビー・イー・プランケンシップ等に よる論文に注目されたい。また、音声の線形予測コード化に対する専用(デジケ ーテッド)マイクロプロセッサが記載されている[マイクロプロセッサ・リアラ イゼーション・オン・ア・リニアー・プレディクチイブ・ボコーダ(Micro p−rocessor Realization of a Linear P redictive Vocoder)Jリンカーン・ラボラトリイ・テクニカ ル・ノー) 1976−3y(1q76年9月)と題するホフステッター等によ る論文に注目されたい。これら論文は両方とも参考として本明細書に取り入れら れている。
現在まで、電子的に音声を送信する主な方法し1マイクロホンのようなトランス ジューサへの音声圧力に比例するアナログ信号によっている。帯域幅圧縮用の電 子装置は1939年以来知られており、また音声をディジタルにコード化するた めの多くのアルゴリズムが1960年代以来提案されているけれど、過去15年 間のディジタル電子技術の指数関数的なコストの低減によって始めて、低価格の 、低電力の、コンパクトな、信頼できるボコーダの実現が予見できるようKなっ た。
音声をコード化するための種々の方法の中で好ましい1つの方法は線形予測コー ド化(LPG)である。この技術の含蓄のある記述についてはジエイ・ディー・ 7−ケルおよびエイ・エッチ・グレイ・ジュニアの「リニア・プレディクチイブ ・オン−スピーチ(T、1near Predictionof 5peech  ) J (スプリンガー・ヘルラーク、エヌ・ティー1967年)を参照され たい。本質的に、LPCは音沖の非常に短かい加重されたセグメントを使用して 自己相関係数を形成することによって時間変化線形全極フィルタとして声道の模 型を作成しようとするものである。
これら係数から、フィルタの臨界周波数極が回帰(帰納)分析を使用して推定さ れる。
フィルタとして声道の模型を作成することに加えて、ボイスエンコーダは声帯の ピッチ周期およびボイシング状態を決定しなければならない。これを遂行する1 つの方法ハエム・エル・マルバスの論文[す・コールド・ピッチ・デテクター・ イン・す・リアル・タイム・エンビロンメント(The Gold Pitch  ])etector in a Real TimeEnvironment  ) Jプロシーディンゲス・オン・イー・エイ・ニス・シー・オー・エヌ19 75年(1975年9月)に記載されたゴールドの方法である。この論文も参考 として本明細書に取り入れられている。また、ビイ・ゴールドの「ディスクリブ ジョン・オン・ア・コンピュータ・プログラム・フォー・ピッチ・デテクション (1’)escription of a Computer Program  for PitchJ)etection ) J第4回国際音響大会、コペ ンハー“771962年8月21−28日、およびビイ・ゴールドの「ノート・ オン・バズ−ヒス・デテクション(Note on)3uzz((iss I) etection ) Jアメリカ音響学会誌第36巻第1659−166.1 頁(1964年)も一般的に参照されたい。
通信処理の目的のために、上記したコード化技術は音声を合成するためには反対 方向に遂行されなければならない。
多くの通信および関連した領域にボイスエンコーダおよびシンセサイザ(以後「 ボコーダ」と称す)が必要である。帯域幅の圧縮は1つの明白な利点である。デ ィジタル音声信号は政府の防衛関係の、産業関係のおよび財政関係のデータの秘 密の、安全な通信を保証するために暗号化装置にも結合することができる。その 上、音声システムによるデータの入力は、秘密(プライベート)であってもなく ても、多くの適用例におけるキーバンチングに勝る重要な改善を童味する。また 、自動化プロセスの音声確認および音声制御も高品質のボコーダに依存する。同 様に、ボコーダは娯楽、教育、およびビジ木ス関係の適用装置においてかなりの 用途がある。
従って、高品質のボコーダ、好ましくは低価格の、かつ標準の信号処理チップの ようなストックのある電子部品から製造できるボコーダが必要である。
発明の概要 本発明者は商業的に入手できるデバイスのみを使用して非常にコンパクトな、融 通性のある、完全にディジタルな、完全に二重の2.4 Kビット/秒の、線形 予測コード化ボコーダを開発した。18平方インチの面積を占有し、かつ5.5 ワツトの電力を消費する合計16の集積回路と4つの別個の部品担持体が使用さ れる。好ましい一実施例においては、その設計は制御および通信のタスクのため の1つのインテル8085,8ビツトマイクロコンピユータおよび3つの日本電 気製信号処理インターフx−ス(SPI ) μPD7720. 1 (Sビッ ト、250ns サイクル時開信号処理単一チツブマイクロコンピュータに基づ いた分散信号処理アーキテクチャである。
マイクロプログラムされる性質の設計を活用することによって非常にすぐれた徹 通性が得られる。初期設定オプションはインテル8o85から3つのSPIチッ プヘラン時間にダウンロードされ、線形予測モデルオーダー(16より小さい) 、分析および合成フレームサイズ、音声サンプリング周波数、音声入力および出 力コード化フォーマット(線形またはμm255法)ならびに与えられた入力音 声のバックグラウンド雑音条件に対してボコーダの性能を改善するパラメータを 選択する。終りに、商用狭帯域ボコーダの小売り価格は通常10.000ドル以 上であるけれど、本明細書に記載するボコーダは大量生産によりこれより1桁程 度安価になるように計画されている。
本発明を図面に示す好ましい実施例に関して記載するが、特許請求の範囲の精神 および範囲から逸脱することなしに種々の変形および変更がこの分野の技術者に よってなし得ることは明らかなことである。
図面の簡単な説明 第1図は本発明によるボコーダの概略構成図、第2図は本発明によるボコーダの LPC分析器、ピッチ検出器およびシンセサイザの詳細な構成図である。
好ましい実施例の詳細な説明 第1図にはボコーダ1oの全体の構成が示されている。
アナログ信号はコーグ・デコーダ(CODEC)モジュール12Vcより処理さ れる。フィルタ14を通った入力信号ハモジュール12内のコーグ16においテ ティジタルパルス列に変換される。ニーダ1乙の出力はLPC分析器18および ピッチ検出器2oに入力する直列データ流である。
各分析フレームにおいて、結果として生じる線形予測反射係数(K −ハラメー タ)、エネルギおよびピッチの推定値は4チツプインテル8085に基づいたマ イクロコンピュータ22の制御のもとで端末プロセッサ26または8ビット並列 インターフェースを介して外部へ転送される。同様の態様で、制御コンピュータ 22は外部または端末プロセッサ26から各フレームごとに合成パラメータを受 信し、それらをSPIシンセサイザチップ28に送信する。このシンセサイザチ ップ28は合成音声を構成し、この合成音声をその直列出力口を介してディジタ ル−アナログ変換モジュール12に出力する。このディジタル−アナログ変換モ ジュール12はデコーダ30および出力フィルタ32を含む。初期設定パラメー タを3つのSPIチップにダウンロードするために、および正常な動作中SPI チップフレーム同期を保持するために8ビツトバスがマイクロコンピュータ22 によりて使用される。ボコーダ全体に対するタイミング信号はタイミングサブシ ステム24によって提供される。モジュール12はフィルタを具備するAMI  83505$ −グソプCQDECに基づくものでよく、アナログまたはディジ タルに構成されたプレエンファシスユニット34およびデエンファシスユニット 38を選択するためのスイッチ36を含む。
第2図に示すように、LPC分析器18は次のように機能する。初期設定パラメ ータはサンプリングレー)K関係する相関およびフィルタオーダ一定数を設定す るプロセッサ26から受信される。コーグ・デコーダモジュール12からのディ ジタル信号は初めにデコーダ40によって線形処理のためにデコードされ、次に 相関係数が相関器42によって確立され、回帰分析器44によって分析されてフ ィルタモデルの極を定めるに一パラメータを得る。
ピッチ検出器20はマイクロコンピュータ22から初期設定パラメータを受信し 、かつコーグ・デコーダモジュール12からディジタル信号を受信する。ディジ タル信号はデコーダ50によって線形処理のためにデコードされ、ピーク検出器 52によって処理され、そしてゴールドのアルゴリズムを実施するユニット54 においてピッチおよびボイシングの決定がなされる。
I、PC分析器18およびピッチ検出器20の出力はマイクロコンピュータ22 によって通信チャネル26へ送信するためにフレーム化され、記録され、そして パックされる。
音声を合成する際に、シンセサイザ28は通信チャネル26から、信号がマイク ロコンピュータ22によって同期され、アンパックされ、そしてデコードされた 後で、該信号を受信する。シンセサイザ28はマイクロコンピュータ22から初 期設定パラメータも受信する。ピッチおよびボイシング命令が励起発生器58に 送られ、K−パラメータがインタボレータロoによって再構成される。
結果はフィルタ64によって結合されて適正な音響管モデルを生じさせる。フィ ルタ64の出力はコータ68 icよってCQl)ECモジュール12の非線形 フォーマットでコード化され、アナログ変換のためにC0DECモジユール12 に送られる。
LPC分析器18、ピッチ検出器2o、シンセサイザ28およびC0DECモジ ユール12の動作は説話風にさらに後述する。この記載は種々の参照をNECチ ップアーキテクチャに対して行なっているので、NECによって発行された書類 「μPD7720信号処理インターフェース(SPI’)ユーサース・マニュア ルJKl注意が向けられている。
T、 P C分析器18は新しいサンプルがA/Dコンバータ12によって発生 されるときごとに挿入される割込みサービスルーチンと、制御マイクロコンピュ ータからの指令について各分析フレーム(すなわち約20m5)ごとに1回実行 されるバックグラウンドプログラムとよりなる。分析のためのパラメータは動作 の始動段階中1回実行される初期設定プログラムによって制御マイクロコンピュ ータ22から’ 7720 に転送される。分析のために必要なパラメータは後 で定義される2つのハミング・ウィンド定数SおよびC1フィルタ・オーダーP (16より小さい)、使用されるディジタル・プリエンファシスの程度を決定す る定数、ならびに事前相関ダウンスケーリングファクタである。送られる最後の パラメータは2つのモードビットを含むワードである。一方のモードピットは’ 7720 にA/Dコンバータデータフォーマットの形式を報知して8ビットμ m255コード化あるいは16ピツト線形を予期する。他方のビットは残ってい る、すなわち未処理のとのLPCエネルギパラメータが各フレームの終了時に制 御プロセッサ22に伝送されるかを決定する。制御プロセッサ22に送られる残 りの分析パラメータはP反射係数である。
A/D割込みサービスルーチンは初めにモードピットをチェックし、入力データ が8ビットμmコード化であるか、16ピツト未コード化であるかを決定する。
このデータは必要ならばデコードされ、そしてハミング・ウィンドルーチンに送 られる。このルーチンは音声データに適当なハミング・ウェイトを掛算する。こ れらウェイトは、量2π/N−1のサインおよびコサインをそれぞれ指示する記 憶された定数SおよびCを使用して、回帰的に計算される。なお、Nは1つの分 析フレームにおけるサンプル点の数である。
ウィンド付音声データは記憶された事前相関ダウンスケーリングファクタと掛算 され、自己相関ルーチンに送もれる。ダウンスケーリングファクタの値はフレー ム長に依存し、相関器のオーバーフローをさけるように選択されなければならな い。相関ルーチンはウィンド付のスケールされた音声データを使用して現フレー ムに対して計算されているp+1相関係数を回帰的に更新する。全62ビツトの 積がこの計算で使用される。この計算は割込みサービスルーチンのタスクを終了 させる。
バックグラウンドルーチンは割込みサービスルーチンによって送られた相関係数 からJ、 P C反射係数および残りのエネルギを計算する。この計算は制御マ イクロコンピュータ22からの指令でフレーム当り1回実行される。
この指令を受信したときに、バックグラウンドルーチンはアイドル・ループを放 置して割込みサービスルーチンから放置された集合体(アグリゲート)処理時間 を使用することに移り、LPCパラメータを計算する。このプロセスにおける第 1の段階は最新のp+1 52 ビット相関係数を取り出してそれらを16ビツ トのブロック浮動点フォーマツ)K置くことである。その結果のスケールされた 相関係数はルルー・ゲガーン(J、eRoux−Gueguen)アルゴリズム を実施するルーチンに送られる。一般的にはジエイ・ルルーおよびシイ−・ゲガ ーンの[ア・フィックスト・ポイント・コンピユーティジョン・オン・パーシャ ル・コレレイジョン・コエフイシエンツ・イン・リニアー・グレデイクション( A Fixed Po1nt Computa−tion of Partia l Correlation Coefficients in I、1nea rPrediction) J 1977年アイ・イー・イー・イー(■EEE )・インターナショナル・コンフエランス・オン・アコウスティックス、スピー チ・アンド・シグナル・プロセッシング・レコード、コネチカット州ハートフォ ード1977年5月9−11日、第742頁〜第743頁を参照されたい。この 計算の最終結果はP反射係数と予測残留エネルギとからなるアレイである。この エネルギは前に実行されたブロック浮動点動作に対して補正される。この−組の パラメータおよび未処理のエネルギ(0の相関係数)Kよって置換された残留エ ネルギは、適当なモードピットによってそのように指令された場合には、制御マ イクロコンピュータに送られる。SPI分析器の融通性を保持するためにパラメ ータのコード化が制御プロセッサ22において実施される。
この分析器の性能の2つの面がSPIハードウェアのビンPOおよびPlによっ て監視できる。ビンPOは相関器がオーバーフローする各フレーム中1に設定さ れる。
その他の場合にはクリアされる。従って、ビンPOは相関器のオーバーフローを 制限するために使用される相関器ダウンスケーリング・ファクタを選択する際に 有用である。実時間の使用が割込みサービスルーチン中1に設定され、かつその 他のときには0に設定されるビン1から監視できる。
ピッチ検出器 各分析フレームにおいて、ピッチ検出器20は入力音声が有声化されるべきか無 声化されるべきかを宣告し、有声化の場合にはサンプリング時間の単位でピッチ 周期の概算を計算する。ゴールドのアルゴリズムが使用され、単一のNECμP D7720で実施される。フォアグラウンド・ルーチンは各サンプルととに実行 される計算と、フィルタされた入力音声波形にピークが検出されたときに実行さ れる追加のタスクより構成されている。最悪の場合にはピッチ検出器フォアグラ ウンド・プログラムの実行時間が実際には1サンプル期間を超過することがある けれど、SPIの直列入力口バッファ能力が引続くサンプリング期間にわたって 処理負荷を平均化させることによって実時間の制約を弛緩する。フォアグラウン ド・ルーチンはサンプリングクロック24によって作動される。前のサンプルの 処理が完了する前に新しいサンプルが到来するときには(’7720直列入カア クルツジ・フリップフロップをチェックすることによって検出される)、フォア グラウンド・ルーチンはバックグラウンド・タスクに戻ることなしに即座に繰返 される。ピッチ検出器チップ20にダウンロードされた初期設定パラメータは実 時間の制約内で随意のサンプリング周波数での動作を可能にする。これらパラメ ータにはサード・オーダー・バターワース・ローパス・プレフィルタならびに最 大限および最小限の許容し得るピッチ推定値に対する内部クランプに対する係数 および利得がある。ボイシング決定無音スレシホールドが入力音声バックグラウ ンド雑音条件およびオーディオ・システムの感度の異なる組合せに対するピッチ 検出器の性能を最適化するためにダウンロードされる。与えられた一組の初期設 定パラメータに対するSPIピッチ検出器20の実時間の使用はSPIデバイス の2つの出力ビンを通じて容易に監視できる。PO出力ピンはバックグラウンド ・ルーチンが活動しているときに高TTLレベルに設定され、P1ビンはフォア グラウンド・ルーチンが活動しているときに高レベルに設定される。ピッチ検出 器に対する実時間の制約は主として公称フォアグラウンド処理時間によって決定 される。
何故ならば、ときたま生じる最悪時の処理負荷が引続くサンプリング期間にわた って平均化されるからである。
各フレームにおいて、SP・■シンセサイザ2日は制御および通信マイクロプロ セッサ22からエネルギ推定値、ピッチ/ダイシング決定値および一組の反射係 数を受信し、合成音声を構成し、それをSPI直列出力口を介して出力する。シ ンセサイザ28はデュアル・ソース励起発生器、ラティス・フィルタおよびワン ・ポール・ディジタル・デエンファシス・フィルタより構成されている。
ラティス・フィルタ係数は過去および現在のフレームの反射係数の線形補間から 得られる。有声化フレームにおいて、フィルタの励起は過去および現在のフレー ムのエネルギ推定値の線形補間に基づいたピッチの推定値および振幅に等しい周 期を持つパルス列であり、一方無声化フレームにおいては擬似ランダム雑音波形 が使用される。
各サンプリング期間において、SPI割込み駆動されるフォアグラウンド・ルー チンは励起発生器ならびにラティスおよびデエンファシス・フィルタを更新し、 合成音声サンプルを発生する。フォアグラウンド・ルーチンはまた、1フレーム 当り6回反射係数を補間し、また、各ピッチ周期ごとにピッチパルス振幅を補間 する。補間が生じるサンプリング期間において、かつ新しい反射係数がバックグ ラウンド・ルーチンから得られるフレームの境界において、フォアグラウンド励 起時間が1サンプリング期間を超過し得る。ピッチ検出器20の場合のように、 実時間を保持するためにフォアグラウンド処理負荷平均化戦略が使用される。バ ックグラウンド・プログラムは、フォアグラウンド・プログラムが制御マイクロ プロセッサからフレームマークを受信したときに作動され、そのときにフル・ノ ーンドシエイク・プロトコールのもとで一組の合成パラメータを入力し、二重バ ッファする。
制御プロセッサにおいてパラメータのデコードが実行され、S、PIシンセサイ ザの多様性を保持する。バックグラウンド・ルーチンはまた、有声化フレーム中 エネルギ推定パラメータをピッチパルス振幅に、また無声化フレーム中工ゝネル ギ推定パラメータを擬似ランダム雑音振幅に変換する。これら振幅はエネルギ推 定、ピッチ周期およびフレームサイズに基づいている。
ボコーダ初期設定時間にラティス・フィルタ・オーダー、合成フレームサイズお よび補間周波数をコントローラ22からダウンロードすることによって犬℃・に プログラム可能なシンセサイザの構成がこの実施態様にお℃・て達成される。他 のプログラム可能な特徴として、16ビツト線形または8ビットμm255法合 成音声出カフオーマットの選択およびワン・ポール・デエンファシス・フィルタ に対するフィードバックおよび利得係数の選択がある。ディジタル・デエンファ シスはフィートノくツク係数を0に設定することによって事実上ノ(イノくスで きる。
終りに、エネルギの推定は残留エネルギとしであるいは0の自己相関係数として 解釈できる。SPIピッチ検出器の場合のように、)・−ドウエアのビンPOお よびPlはバックグラウンドおよびフォアグラウンド・プログラムの活動を指示 することによって実時間の使用を監視する。シンセサイザの実時間制約はその公 称フォアグラウンド処理負荷によって決定される。何故ならば、最悪の場合の処 理負荷はフレームおよび補間の境界においてのみ生じ、引続くサンプリング期間 にわたって平均化されるからである。
制御マイクロコンピュータ 各分析フレームごとに、制御マイクロコンピュータ22は分析器18セよびピッ チ検出器20から、SPIのエネルギ推定、P反射係数、ピッチ推定およびボイ シング決定を受信し、それらを通信チャネルに送信する。
同様の態様で、制御マイクロコンピュータ22は各フレームごとに通信チャネル 26からこれらパラメータを受信し、それらをシンセサイザ2日へ送る。分析器 およびピッチ検出器パラメータのコード化およびパック、ならびに合成パラメー タのデコードおよびアンパックは3つのSPIデバイスの融通性を保持するため に制御マイクロコンピュータにおいて行なわれる。分析および合成の両方に対す るフレームの同期もまた、制御マイクロコンピュータ22の責任であり、タイミ ング・サブシステム24から、あるいは通信チャネル26それ自体から得ること ができる。終りに1制御マイクロコンピユータ22ば、サンプリング・レート、 フレームサイズ、線形予測モデル・オーダー、ならびに音声入力および出力コー ド化フォーマットを決定する定数でSPIを初期設定する始動ルーチンを含む。
制御マイクロコンピュータ22はインテル8085A−28ビツトマイクロプロ セツサに基づいている。
アナログ/ディジタル変換サブシステムこの設計においては24ビンのDIPで 8ビットμm255法エンコーダ(A/Dコンバータ)おヨヒテコーダ(D/A コンバータ)、ならびにスイッチされるコンデンサ入力および出力帯域制限フィ ルタを具体化するフィルタ付のAMI 53sos C0DECの使用により非 常にコンパクトなアナログ・サブシステムが得られる。このC0DECのアナロ グ入力には1−o(sooHz)、ワンポール(6KHz)7’レニンフアシス ・フィルタが前置されている。53505のアナログ出力の後に対応するワンポ ール(sooHz)デエンファシス・フィルタが続いている。アナログ・プレエ ンファシスおよびデエンファシスはSPIチップの内部ディジタル・プレエンフ ァシスおよびデエンファシスが使用されるときに切換えることができる。アナロ グ・サブシステムは全体として、1つの24ビンAMI 83505 C0DE Cと、1つの14ピンのフォード演算増幅器DIPと、2つの14ピンの別個の 部品担持体とを必要とする。
浄書(内容に変更なし) 手続補正書(方式) 特許庁長官 若 杼 和 夫 殿 事件との関係 特許出願人 名称 マサチューセッツインステイテユートオンテクノロジー同 補正の対象 、6− ; 一吻;−−:二一−一 〜 −−−一一一一゛′:″J−□゛− 一□□−−司ヲ通−一 特許法第184東の5第1項の規定による書面の特許出願人の欄明細書、請求の 範囲及び図面の翻訳文 各1通委任状及び翻訳文 各1過 補正の内容 別紙の通り

Claims (1)

  1. 【特許請求の範囲】 1、アナログ・ボイス信号をサンプリングし、個々のサンプルを発生するための サンプリング手段と、該サンプリング手段からのサンプルを相互に関係付け、回 帰的に分析することによって前記ボイスの多極のフィルタモデルを生じさせるた めの分析手段と、ボイシングの決定を行なうとともに、有声化されたときに前記 サンプリング手段の前記サンプルから前記ボイスのピッチを決定するためのピッ チ検出器と、前記分析手段および前記ピッチ検出器の出力をディジタル伝送に適 したフォーマットに構成するための制御装置 とを具備することを特徴とするディジタル・ボイスエンコーダ。 2 前記サンプリング手段が非線形のコード化フォーマツ、トでサンプルを発生 する請求の範囲第1項記載のボイスエンコーダ。 3、 前記サンプリング手段が前記アナログ・ボイス信号の一部分をプレエンフ ァシスする手段を具備する請求の範囲第1項記載のボイスエンコーダ。 4 前記分析手段が相関および回帰分析において線形予測コードを使用する請求 の範囲第1項記載のボイスエンコーダ。 b 前記ヒツチ検出器がローパス・フィルタと、ピーク検出器と、ピッチおよび ポイシング推定器と、フレームごとの結果を平滑にするための手段とを有する請 求の範囲第1項記載のボイスエンコーダ。 & 前記制御装置が伝送する前にディジタル出力をフレーム化し、パックし、コ ード化するための手段を含む請求の範囲第1項記載のボイスエンコーダ。 Z 前記制御装置がサンプリング・レートに関係した相関およびフィルタ・オー ダ一定数に対する初期設定パラメータを得るための手段を有する請求の範囲第1 項記載のボイスエンコーダ。 8 ボイシング、ピッチおよびフィルタ・モデル情報を提供するディジタル信号 を受信するだめの制御装置と、該制御装置からのポイシングおよびピッチ指令に 応答して声帯励起信号を発生するための励起発生器と、前記制御装置からの指令 に応答して該発生器の出方をフィルタするための可変ディジタルフィルタと、該 ディジタルフィルタの出力をアナログ・ボイス信号に変換するためのコンバータ とを具備することを特徴とするディジタル・ボイス合成装置。 9 前記フィルタが前記制御装置からの引続くエネルギおよびに一パラメータ入 力を補間して前記コンバータにより高品質の出力信号を発生するための補間手段 を有する請求の範囲第8項記載のボイス合成装置。 10 前記制御装置がディジタル久方信号をデコードし、アンパックし、同期を とるための手段を特する請求間第8項記載のボイス合成装置。 11 請求の範囲第1項記載の装置と、請求の範囲第8項記載の装置とからなる ボイスコード化および合成装置。 It(nil″″″!’−cL)n表明59−!’1iJfl!188 (2)
JP57502136A 1982-04-29 1982-04-29 ボイスエンコ−ダおよびシンセサイザ Pending JPS59500988A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US1982/000556 WO1983003917A1 (en) 1982-04-29 1982-04-29 Voice encoder and synthesizer

Publications (1)

Publication Number Publication Date
JPS59500988A true JPS59500988A (ja) 1984-05-31

Family

ID=22167955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57502136A Pending JPS59500988A (ja) 1982-04-29 1982-04-29 ボイスエンコ−ダおよびシンセサイザ

Country Status (4)

Country Link
US (1) US4710959A (ja)
EP (1) EP0107659A4 (ja)
JP (1) JPS59500988A (ja)
WO (1) WO1983003917A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4890327A (en) * 1987-06-03 1989-12-26 Itt Corporation Multi-rate digital voice coder apparatus
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5754976A (en) * 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
US5701392A (en) * 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
US5265219A (en) * 1990-06-07 1993-11-23 Motorola, Inc. Speech encoder using a soft interpolation decision for spectral parameters
DE69231266T2 (de) * 1991-08-09 2001-03-15 Koninkl Philips Electronics Nv Verfahren und Gerät zur Manipulation der Dauer eines physikalischen Audiosignals und eine Darstellung eines solchen physikalischen Audiosignals enthaltendes Speichermedium
US5504834A (en) * 1993-05-28 1996-04-02 Motrola, Inc. Pitch epoch synchronous linear predictive coding vocoder and method
US5479559A (en) * 1993-05-28 1995-12-26 Motorola, Inc. Excitation synchronous time encoding vocoder and method
US5568588A (en) * 1994-04-29 1996-10-22 Audiocodes Ltd. Multi-pulse analysis speech processing System and method
US5854998A (en) * 1994-04-29 1998-12-29 Audiocodes Ltd. Speech processing system quantizer of single-gain pulse excitation in speech coder
ES2143396B1 (es) * 1998-02-04 2000-12-16 Univ Malaga Circuito integrado monolitico codec-encriptador de baja tasa para señales de voz.
US6173255B1 (en) * 1998-08-18 2001-01-09 Lockheed Martin Corporation Synchronized overlap add voice processing using windows and one bit correlators
KR20030011912A (ko) * 2001-04-18 2003-02-11 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
US6754203B2 (en) * 2001-11-27 2004-06-22 The Board Of Trustees Of The University Of Illinois Method and program product for organizing data into packets
EP1997196A2 (en) * 2006-03-20 2008-12-03 Outerbridge Networks, LLC Device and method for provisioning or monitoring cable services
CN108461087B (zh) * 2018-02-07 2020-06-30 河南芯盾网安科技发展有限公司 数字信号穿过声码器的装置及方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3624302A (en) * 1969-10-29 1971-11-30 Bell Telephone Labor Inc Speech analysis and synthesis by the use of the linear prediction of a speech wave
US3916105A (en) * 1972-12-04 1975-10-28 Ibm Pitch peak detection using linear prediction
US4038495A (en) * 1975-11-14 1977-07-26 Rockwell International Corporation Speech analyzer/synthesizer using recursive filters
US4225918A (en) * 1977-03-09 1980-09-30 Giddings & Lewis, Inc. System for entering information into and taking it from a computer from a remote location
US4301329A (en) * 1978-01-09 1981-11-17 Nippon Electric Co., Ltd. Speech analysis and synthesis apparatus
US4304965A (en) * 1979-05-29 1981-12-08 Texas Instruments Incorporated Data converter for a speech synthesizer
US4310721A (en) * 1980-01-23 1982-01-12 The United States Of America As Represented By The Secretary Of The Army Half duplex integral vocoder modem system

Also Published As

Publication number Publication date
WO1983003917A1 (en) 1983-11-10
US4710959A (en) 1987-12-01
EP0107659A4 (en) 1985-02-18
EP0107659A1 (en) 1984-05-09

Similar Documents

Publication Publication Date Title
JPS59500988A (ja) ボイスエンコ−ダおよびシンセサイザ
US4704730A (en) Multi-state speech encoder and decoder
JP4599558B2 (ja) ピッチ周期等化装置及びピッチ周期等化方法、並びに音声符号化装置、音声復号装置及び音声符号化方法
JP2887286B2 (ja) デジタル的にコード化されたスピーチを圧縮するたの方法における改良
JP4005359B2 (ja) 音声符号化及び音声復号化装置
CN100578621C (zh) 信号处理设备和方法
EP0152430B1 (en) Apparatus and methods for coding, decoding, analyzing and synthesizing a signal
IL135192A (en) Method and system for speech reconstruction from speech recognition features
CA2188493A1 (en) Speech encoding/decoding method and apparatus using lpc residuals
JPH0668680B2 (ja) 改善された多パルス線形予測符号化音声処理装置
JPH10307599A (ja) スプラインを使用する波形補間音声コーディング
EP0477960B1 (en) Linear prediction speech coding with high-frequency preemphasis
JPH0869299A (ja) 音声符号化方法、音声復号化方法及び音声符号化復号化方法
TW521265B (en) Relative pulse position in CELP vocoding
US20080140394A1 (en) Method and system for low bit rate voice encoding and decoding applicable for any reduced bandwidth requirements including wireless
JPS58207100A (ja) 次数を減らした波形形成多項式を用いるlpc符号化方法
US20050159942A1 (en) Classification of speech and music using linear predictive coding coefficients
JP2645465B2 (ja) 低遅延低ビツトレート音声コーダ
JPH07199997A (ja) 音声信号の処理システムにおける音声信号の処理方法およびその処理における処理時間の短縮方法
US10490196B1 (en) Method and system for low bit rate voice encoding and decoding applicable for any reduced bandwidth requirements including wireless
KR101038446B1 (ko) 오디오 코딩
CA1240396A (en) Relp vocoder implemented in digital signal processors
JP4736699B2 (ja) 音声信号圧縮装置、音声信号復元装置、音声信号圧縮方法、音声信号復元方法及びプログラム
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP3994332B2 (ja) 音声信号圧縮装置、音声信号圧縮方法、及び、プログラム