JP3268349B2

JP3268349B2 - 音声合成器

Info

Publication number: JP3268349B2
Application number: JP33453495A
Authority: JP
Inventors: 俊二田中
Original assignee: 日本電気エンジニアリング株式会社
Priority date: 1995-12-22
Filing date: 1995-12-22
Publication date: 2002-03-25
Anticipated expiration: 2015-12-22
Also published as: JPH09179584A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は音声合成器に関し、
特に適応予測器の予測係数を再生出力に基づいて予測す
るバックワード予測型の音声合成器に関するものであ
る。

【０００２】

【従来の技術】音声合成器を会話練習のため等に使用す
る場合、本来の再生スピードよりも遅く再生するいわゆ
る遅聞き機能があり、この遅聞き機能は会話練習にとっ
ては重要な機能となっている。

【０００３】従来、この遅聞き機能を実現するために
は、分析合成形（フォワード予測型）の音声符号化法が
用いられている。このフォワード予測型の符号復号化系
では、データ中に予測係数をも含んでいるために、音声
データの圧縮効率が上がらず、ビットレートの割には音
声品質が良くないという問題がある。

【０００４】最近、ＬＤ−ＣＥＣＰ（ＬｏｗＤｅｌａ
ｙＣｏｄｅＥｘｉｔｅｄＬｉｎｅａｒＰｒｅｄ
ｉｃｔｉｏｎ）方式と称されるバックワード予測型の音
声符号化法が、音声品質の良さから電話ネットワークに
使用され始めている。

【０００５】

【発明が解決しようとする課題】このバックワード予測
型の音声符号化方式を音声合成器に適用して遅聞き機能
を実現しようとしても、正常な遅聞き機能は実現できな
い。その理由は次の通りである。

【０００６】すなわち、このバックワード予測型の音声
符号化復号化方式では、予測係数はデータの中に含まれ
ておらず、再生時から音声信号に逆に（バックワード
に）作成されるからである。バックワードに作成される
予測係数は、通常の再生速度では問題ないが、２倍の遅
聞き再生では、２倍の長さだけデータが加算されること
になるので、符号化時の予測係数と異なった係数とな
り、正常な遅聞き機能は達成されない。

【０００７】そこで、本発明はこの様な従来技術の問題
点を解決すべくなされたものであって、その目的とする
ところは、バックワード予測型音声符号化法を用いた場
合にも、正常な遅聞き機能を実現することが可能な音声
合成器を提供することにある。

【０００８】

【課題を解決するための手段】本発明によれば、単位時
間当りの音声入力データをゲイン可変手段及び合成フィ
ルタ手段を介して再生出力し、これ等各手段の出力に基
づき次の単位時間当りのデータに対するゲイン予測及び
符号予測を夫々行うようにしたバックワード予測型の音
声合成器であって、前記単位時間当りの音声入力データ
を格納するデータメモリと、前記音声入力データと前記
データメモリの読出し音声データとを択一的に導出して
前記ゲイン可変手段へ供給する選択手段と、前記ゲイン
可変手段の出力に基づき次の単位時間当りのデータのゲ
イン予測を行うゲイン予測手段と、前記合成フィルタ手
段の出力に基づき次の単位時間当りのデータの符号予測
を行う符号予測手段と、これ等予測ゲイン及び予測符号
を夫々格納する予測ゲインメモリ及び予測符号メモリと
を含み、前記単位時間当りの音声入力データとそれに続
いて前記データメモリに格納されている同一単位時間当
りのデータを読出して入力データとして順次導出する様
に前記選択手段を制御すると共に、前記データメモリの
読出しに同期して前記予測ゲインメモリ及び予測符号メ
モリの各読出しを行って前記データメモリの読出しデー
タのための予測ゲイン及び予測係数とすること特徴とす
る音声合成器が得られる。

【０００９】

【発明の実施の形態】本発明の作用について述べる。遅
聞き再生においては、音声入力データがフレーム単位で
２度（またはそれ以上）折り返し再生されるが、予測係
数がそれに伴って２度（またはそれ以上）予測修正され
ることになって、１度目の予測係数と異なってしまい、
結果的に正常な遅聞き再生がなされない。そこで、本発
明においては、１度目の予測係数をメモリにて記憶して
おき、２度目はこの記憶予測係数を再び用いるようにし
て、正常な遅聞き再生をなすものである。

【００１０】以下に本発明の実施例について図面を用い
て説明する。

【００１１】図１は本発明の実施例の機能ブロック図で
ある。図１において、入力部１０からの音声入力データ
ＩＮはフレーム単位にメモリ２へ格納され、フレーム単
位にメモリ２から読出される。スイッチ１は、切替え制
御部７の制御に従って、フレーム単位の入力データＩＮ
かメモリ２からの読出しデータかを択一的に導出してゲ
イン可変部３へ供給する。

【００１２】すなわち、ある１フレームの音声入力デー
タＩＮはゲイン可変部３へ直接供給されると共に、メモ
リ２へ一時記憶され、当該１フレームの音声入力データ
に続くフレームデータとしてゲイン可変部３へ供給され
る。この時点において、データ量は２倍となっているの
で、時間は２倍となり、スピードは１／２になってい
る。

【００１３】ゲイン可変部３によりゲインが与えられた
データは合成フィルタ４へ送出されると同時に、ゲイン
適応部５へ入力される。合成フィルタ４の出力は再生出
力部２０から送出されると共に、予測適応化部６へも入
力される。

【００１４】予測適応化部６において、合成フィルタ４
の予測符号が求められて次のフレームデータの予測符号
として合成フィルタ４へ送られる。ゲイン適応部５にお
いても予測ゲインが求められて次のフレームデータの予
測ゲインとしてゲイン可変部３へ送られる。

【００１５】これ等各予測ゲインと予測符号とはゲイン
メモリ８及び予測符号メモリ９へ夫々格納される。

【００１６】切替え制御部７はスイッチ１の切替え制御
を行うと共に、ゲインメモリ８及び予測符号メモリ９の
書込み読出し制御をも行い、またゲイン適応部５及び予
測適応化部６のリセットをも行うものである。

【００１７】スイッチ１が切替えられて、メモリ２から
の読出しデータである前のフレームデータと同一フレー
ムデータが選択されると、ゲインメモリ８及び予測符号
メモリ９に夫々格納されていた前のフレームデータによ
る予測ゲイン及び予測符号が夫々読出されて、ゲイン可
変部３及び合成フィルタ４へ夫々セットされる。同時
に、ゲイン適応部５及び予測適応化部６がリセットされ
る。

【００１８】このリセットとメモリ８，９の読出しとに
より、フレームデータがメモリ２に蓄えられてスイッチ
１を介して再度（２度目に）入力されたときに、最初
（１度目）に入力されたフレームデータのときと全く同
一の状態で回路全体が動作することになり、正常な遅聞
き再生が可能となる。

【００１９】図２は予測係数である予測符号の変化例を
示しており、（Ａ）は通常再生の場合の変化例を示し、
（Ｂ）は本発明による遅聞き再生の場合の変化例を示し
ている。（Ｂ）に示す如く、フレームａのデータが再度
使用されるときには（フレームａ´のデータ）、予測符
号メモリ９に格納されているフレームａの予測符号が用
いられ、また、予測適応化部６がリセットされて最初の
状態に戻るので、フレームａ´のデータが終了すると、
次のフレームｂのデータにより予測適応化部６は更新さ
れることになる。予測ゲインについても同様である。

【００２０】尚、上記実施例においては、単位時間当り
のデータを１フレーム単位のデータとしているが、２フ
レーム以上のある一まとまりのデータを単位時間当りの
データとして扱うことができるものである。

【００２１】

【発明の効果】叙上の如く、本発明によれば、同一の単
位時間当りのデータを少なくとも２度用いて再生する遅
聞き再生において、適応予測動作はリセットして、２度
目以降は同一予測係数を用いるようにしているので、同
じデータにて２度以上適応予測動作を行っても、不安定
になることはなく、単に時間軸のみ延長された正常な遅
聞き機能が実現できるという効果がある。

【図面の簡単な説明】

【図１】本発明の実施例の機能ブロック図である。

【図２】（Ａ）は通常再生動作時の予測係数の変化を示
す図、（Ｂ）は遅聞き再生動作時の予測係数の変化を示
す図である。

【符号の説明】

１スイッチ２データメモリ３ゲイン可変部４合成フィルタ５ゲイン適応部６予測適応化部７切替え制御部８ゲインメモリ９予測符号メモリ

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 21/04

Claims

(57)【特許請求の範囲】

【請求項１】単位時間当りの音声入力データをゲイン
可変手段及び合成フィルタ手段を介して再生出力し、こ
れ等各手段の出力に基づき次の単位時間当りのデータに
対するゲイン予測及び符号予測を夫々行うようにしたバ
ックワード予測型の音声合成器であって、前記単位時間当りの音声入力データを格納するデータメ
モリと、前記音声入力データと前記データメモリの読出し音声デ
ータとを択一的に導出して前記ゲイン可変手段へ供給す
る選択手段と、前記ゲイン可変手段の出力に基づき次の単位時間当りの
データのゲイン予測を行うゲイン予測手段と、前記合成フィルタ手段の出力に基づき次の単位時間当り
のデータの符号予測を行う符号予測手段と、これ等予測ゲイン及び予測符号を夫々格納する予測ゲイ
ンメモリ及び予測符号メモリとを含み、前記単位時間当りの音声入力データとそれに続いて前記
データメモリに格納されている同一単位時間当りのデー
タを読出して入力データとして順次導出する様に前記選
択手段を制御すると共に、前記データメモリの読出しに
同期して前記予測ゲインメモリ及び予測符号メモリの各
読出しを行って前記データメモリの読出しデータのため
の予測ゲイン及び予測係数とすること特徴とする音声合
成器。
【請求項２】前記データメモリの読出しに同期して前
記ゲイン予測手段及び前記符号予測手段の各リセットを
なすようにしたことを特徴とする請求項１記載の音声合
成器。
【請求項３】前記単位時間当りのデータはフレーム単
位のデータであることを特徴とする請求項１または２記
載の音声合成器。