JP3268349B2 - 音声合成器 - Google Patents
音声合成器Info
- Publication number
- JP3268349B2 JP3268349B2 JP33453495A JP33453495A JP3268349B2 JP 3268349 B2 JP3268349 B2 JP 3268349B2 JP 33453495 A JP33453495 A JP 33453495A JP 33453495 A JP33453495 A JP 33453495A JP 3268349 B2 JP3268349 B2 JP 3268349B2
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- data
- gain
- memory
- unit time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
【0001】
【発明の属する技術分野】本発明は音声合成器に関し、
特に適応予測器の予測係数を再生出力に基づいて予測す
るバックワード予測型の音声合成器に関するものであ
る。
特に適応予測器の予測係数を再生出力に基づいて予測す
るバックワード予測型の音声合成器に関するものであ
る。
【0002】
【従来の技術】音声合成器を会話練習のため等に使用す
る場合、本来の再生スピードよりも遅く再生するいわゆ
る遅聞き機能があり、この遅聞き機能は会話練習にとっ
ては重要な機能となっている。
る場合、本来の再生スピードよりも遅く再生するいわゆ
る遅聞き機能があり、この遅聞き機能は会話練習にとっ
ては重要な機能となっている。
【0003】従来、この遅聞き機能を実現するために
は、分析合成形(フォワード予測型)の音声符号化法が
用いられている。このフォワード予測型の符号復号化系
では、データ中に予測係数をも含んでいるために、音声
データの圧縮効率が上がらず、ビットレートの割には音
声品質が良くないという問題がある。
は、分析合成形(フォワード予測型)の音声符号化法が
用いられている。このフォワード予測型の符号復号化系
では、データ中に予測係数をも含んでいるために、音声
データの圧縮効率が上がらず、ビットレートの割には音
声品質が良くないという問題がある。
【0004】最近、LD−CECP(Low Dela
y Code Exited Linear Pred
iction)方式と称されるバックワード予測型の音
声符号化法が、音声品質の良さから電話ネットワークに
使用され始めている。
y Code Exited Linear Pred
iction)方式と称されるバックワード予測型の音
声符号化法が、音声品質の良さから電話ネットワークに
使用され始めている。
【0005】
【発明が解決しようとする課題】このバックワード予測
型の音声符号化方式を音声合成器に適用して遅聞き機能
を実現しようとしても、正常な遅聞き機能は実現できな
い。その理由は次の通りである。
型の音声符号化方式を音声合成器に適用して遅聞き機能
を実現しようとしても、正常な遅聞き機能は実現できな
い。その理由は次の通りである。
【0006】すなわち、このバックワード予測型の音声
符号化復号化方式では、予測係数はデータの中に含まれ
ておらず、再生時から音声信号に逆に(バックワード
に)作成されるからである。バックワードに作成される
予測係数は、通常の再生速度では問題ないが、2倍の遅
聞き再生では、2倍の長さだけデータが加算されること
になるので、符号化時の予測係数と異なった係数とな
り、正常な遅聞き機能は達成されない。
符号化復号化方式では、予測係数はデータの中に含まれ
ておらず、再生時から音声信号に逆に(バックワード
に)作成されるからである。バックワードに作成される
予測係数は、通常の再生速度では問題ないが、2倍の遅
聞き再生では、2倍の長さだけデータが加算されること
になるので、符号化時の予測係数と異なった係数とな
り、正常な遅聞き機能は達成されない。
【0007】そこで、本発明はこの様な従来技術の問題
点を解決すべくなされたものであって、その目的とする
ところは、バックワード予測型音声符号化法を用いた場
合にも、正常な遅聞き機能を実現することが可能な音声
合成器を提供することにある。
点を解決すべくなされたものであって、その目的とする
ところは、バックワード予測型音声符号化法を用いた場
合にも、正常な遅聞き機能を実現することが可能な音声
合成器を提供することにある。
【0008】
【課題を解決するための手段】本発明によれば、単位時
間当りの音声入力データをゲイン可変手段及び合成フィ
ルタ手段を介して再生出力し、これ等各手段の出力に基
づき次の単位時間当りのデータに対するゲイン予測及び
符号予測を夫々行うようにしたバックワード予測型の音
声合成器であって、前記単位時間当りの音声入力データ
を格納するデータメモリと、前記音声入力データと前記
データメモリの読出し音声データとを択一的に導出して
前記ゲイン可変手段へ供給する選択手段と、前記ゲイン
可変手段の出力に基づき次の単位時間当りのデータのゲ
イン予測を行うゲイン予測手段と、前記合成フィルタ手
段の出力に基づき次の単位時間当りのデータの符号予測
を行う符号予測手段と、これ等予測ゲイン及び予測符号
を夫々格納する予測ゲインメモリ及び予測符号メモリと
を含み、前記単位時間当りの音声入力データとそれに続
いて前記データメモリに格納されている同一単位時間当
りのデータを読出して入力データとして順次導出する様
に前記選択手段を制御すると共に、前記データメモリの
読出しに同期して前記予測ゲインメモリ及び予測符号メ
モリの各読出しを行って前記データメモリの読出しデー
タのための予測ゲイン及び予測係数とすること特徴とす
る音声合成器が得られる。
間当りの音声入力データをゲイン可変手段及び合成フィ
ルタ手段を介して再生出力し、これ等各手段の出力に基
づき次の単位時間当りのデータに対するゲイン予測及び
符号予測を夫々行うようにしたバックワード予測型の音
声合成器であって、前記単位時間当りの音声入力データ
を格納するデータメモリと、前記音声入力データと前記
データメモリの読出し音声データとを択一的に導出して
前記ゲイン可変手段へ供給する選択手段と、前記ゲイン
可変手段の出力に基づき次の単位時間当りのデータのゲ
イン予測を行うゲイン予測手段と、前記合成フィルタ手
段の出力に基づき次の単位時間当りのデータの符号予測
を行う符号予測手段と、これ等予測ゲイン及び予測符号
を夫々格納する予測ゲインメモリ及び予測符号メモリと
を含み、前記単位時間当りの音声入力データとそれに続
いて前記データメモリに格納されている同一単位時間当
りのデータを読出して入力データとして順次導出する様
に前記選択手段を制御すると共に、前記データメモリの
読出しに同期して前記予測ゲインメモリ及び予測符号メ
モリの各読出しを行って前記データメモリの読出しデー
タのための予測ゲイン及び予測係数とすること特徴とす
る音声合成器が得られる。
【0009】
【発明の実施の形態】本発明の作用について述べる。遅
聞き再生においては、音声入力データがフレーム単位で
2度(またはそれ以上)折り返し再生されるが、予測係
数がそれに伴って2度(またはそれ以上)予測修正され
ることになって、1度目の予測係数と異なってしまい、
結果的に正常な遅聞き再生がなされない。そこで、本発
明においては、1度目の予測係数をメモリにて記憶して
おき、2度目はこの記憶予測係数を再び用いるようにし
て、正常な遅聞き再生をなすものである。
聞き再生においては、音声入力データがフレーム単位で
2度(またはそれ以上)折り返し再生されるが、予測係
数がそれに伴って2度(またはそれ以上)予測修正され
ることになって、1度目の予測係数と異なってしまい、
結果的に正常な遅聞き再生がなされない。そこで、本発
明においては、1度目の予測係数をメモリにて記憶して
おき、2度目はこの記憶予測係数を再び用いるようにし
て、正常な遅聞き再生をなすものである。
【0010】以下に本発明の実施例について図面を用い
て説明する。
て説明する。
【0011】図1は本発明の実施例の機能ブロック図で
ある。図1において、入力部10からの音声入力データ
INはフレーム単位にメモリ2へ格納され、フレーム単
位にメモリ2から読出される。スイッチ1は、切替え制
御部7の制御に従って、フレーム単位の入力データIN
かメモリ2からの読出しデータかを択一的に導出してゲ
イン可変部3へ供給する。
ある。図1において、入力部10からの音声入力データ
INはフレーム単位にメモリ2へ格納され、フレーム単
位にメモリ2から読出される。スイッチ1は、切替え制
御部7の制御に従って、フレーム単位の入力データIN
かメモリ2からの読出しデータかを択一的に導出してゲ
イン可変部3へ供給する。
【0012】すなわち、ある1フレームの音声入力デー
タINはゲイン可変部3へ直接供給されると共に、メモ
リ2へ一時記憶され、当該1フレームの音声入力データ
に続くフレームデータとしてゲイン可変部3へ供給され
る。この時点において、データ量は2倍となっているの
で、時間は2倍となり、スピードは1/2になってい
る。
タINはゲイン可変部3へ直接供給されると共に、メモ
リ2へ一時記憶され、当該1フレームの音声入力データ
に続くフレームデータとしてゲイン可変部3へ供給され
る。この時点において、データ量は2倍となっているの
で、時間は2倍となり、スピードは1/2になってい
る。
【0013】ゲイン可変部3によりゲインが与えられた
データは合成フィルタ4へ送出されると同時に、ゲイン
適応部5へ入力される。合成フィルタ4の出力は再生出
力部20から送出されると共に、予測適応化部6へも入
力される。
データは合成フィルタ4へ送出されると同時に、ゲイン
適応部5へ入力される。合成フィルタ4の出力は再生出
力部20から送出されると共に、予測適応化部6へも入
力される。
【0014】予測適応化部6において、合成フィルタ4
の予測符号が求められて次のフレームデータの予測符号
として合成フィルタ4へ送られる。ゲイン適応部5にお
いても予測ゲインが求められて次のフレームデータの予
測ゲインとしてゲイン可変部3へ送られる。
の予測符号が求められて次のフレームデータの予測符号
として合成フィルタ4へ送られる。ゲイン適応部5にお
いても予測ゲインが求められて次のフレームデータの予
測ゲインとしてゲイン可変部3へ送られる。
【0015】これ等各予測ゲインと予測符号とはゲイン
メモリ8及び予測符号メモリ9へ夫々格納される。
メモリ8及び予測符号メモリ9へ夫々格納される。
【0016】切替え制御部7はスイッチ1の切替え制御
を行うと共に、ゲインメモリ8及び予測符号メモリ9の
書込み読出し制御をも行い、またゲイン適応部5及び予
測適応化部6のリセットをも行うものである。
を行うと共に、ゲインメモリ8及び予測符号メモリ9の
書込み読出し制御をも行い、またゲイン適応部5及び予
測適応化部6のリセットをも行うものである。
【0017】スイッチ1が切替えられて、メモリ2から
の読出しデータである前のフレームデータと同一フレー
ムデータが選択されると、ゲインメモリ8及び予測符号
メモリ9に夫々格納されていた前のフレームデータによ
る予測ゲイン及び予測符号が夫々読出されて、ゲイン可
変部3及び合成フィルタ4へ夫々セットされる。同時
に、ゲイン適応部5及び予測適応化部6がリセットされ
る。
の読出しデータである前のフレームデータと同一フレー
ムデータが選択されると、ゲインメモリ8及び予測符号
メモリ9に夫々格納されていた前のフレームデータによ
る予測ゲイン及び予測符号が夫々読出されて、ゲイン可
変部3及び合成フィルタ4へ夫々セットされる。同時
に、ゲイン適応部5及び予測適応化部6がリセットされ
る。
【0018】このリセットとメモリ8,9の読出しとに
より、フレームデータがメモリ2に蓄えられてスイッチ
1を介して再度(2度目に)入力されたときに、最初
(1度目)に入力されたフレームデータのときと全く同
一の状態で回路全体が動作することになり、正常な遅聞
き再生が可能となる。
より、フレームデータがメモリ2に蓄えられてスイッチ
1を介して再度(2度目に)入力されたときに、最初
(1度目)に入力されたフレームデータのときと全く同
一の状態で回路全体が動作することになり、正常な遅聞
き再生が可能となる。
【0019】図2は予測係数である予測符号の変化例を
示しており、(A)は通常再生の場合の変化例を示し、
(B)は本発明による遅聞き再生の場合の変化例を示し
ている。(B)に示す如く、フレームaのデータが再度
使用されるときには(フレームa´のデータ)、予測符
号メモリ9に格納されているフレームaの予測符号が用
いられ、また、予測適応化部6がリセットされて最初の
状態に戻るので、フレームa´のデータが終了すると、
次のフレームbのデータにより予測適応化部6は更新さ
れることになる。予測ゲインについても同様である。
示しており、(A)は通常再生の場合の変化例を示し、
(B)は本発明による遅聞き再生の場合の変化例を示し
ている。(B)に示す如く、フレームaのデータが再度
使用されるときには(フレームa´のデータ)、予測符
号メモリ9に格納されているフレームaの予測符号が用
いられ、また、予測適応化部6がリセットされて最初の
状態に戻るので、フレームa´のデータが終了すると、
次のフレームbのデータにより予測適応化部6は更新さ
れることになる。予測ゲインについても同様である。
【0020】尚、上記実施例においては、単位時間当り
のデータを1フレーム単位のデータとしているが、2フ
レーム以上のある一まとまりのデータを単位時間当りの
データとして扱うことができるものである。
のデータを1フレーム単位のデータとしているが、2フ
レーム以上のある一まとまりのデータを単位時間当りの
データとして扱うことができるものである。
【0021】
【発明の効果】叙上の如く、本発明によれば、同一の単
位時間当りのデータを少なくとも2度用いて再生する遅
聞き再生において、適応予測動作はリセットして、2度
目以降は同一予測係数を用いるようにしているので、同
じデータにて2度以上適応予測動作を行っても、不安定
になることはなく、単に時間軸のみ延長された正常な遅
聞き機能が実現できるという効果がある。
位時間当りのデータを少なくとも2度用いて再生する遅
聞き再生において、適応予測動作はリセットして、2度
目以降は同一予測係数を用いるようにしているので、同
じデータにて2度以上適応予測動作を行っても、不安定
になることはなく、単に時間軸のみ延長された正常な遅
聞き機能が実現できるという効果がある。
【図1】本発明の実施例の機能ブロック図である。
【図2】(A)は通常再生動作時の予測係数の変化を示
す図、(B)は遅聞き再生動作時の予測係数の変化を示
す図である。
す図、(B)は遅聞き再生動作時の予測係数の変化を示
す図である。
1 スイッチ 2 データメモリ 3 ゲイン可変部 4 合成フィルタ 5 ゲイン適応部 6 予測適応化部 7 切替え制御部 8 ゲインメモリ 9 予測符号メモリ
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 21/04
Claims (3)
- 【請求項1】 単位時間当りの音声入力データをゲイン
可変手段及び合成フィルタ手段を介して再生出力し、こ
れ等各手段の出力に基づき次の単位時間当りのデータに
対するゲイン予測及び符号予測を夫々行うようにしたバ
ックワード予測型の音声合成器であって、 前記単位時間当りの音声入力データを格納するデータメ
モリと、 前記音声入力データと前記データメモリの読出し音声デ
ータとを択一的に導出して前記ゲイン可変手段へ供給す
る選択手段と、 前記ゲイン可変手段の出力に基づき次の単位時間当りの
データのゲイン予測を行うゲイン予測手段と、 前記合成フィルタ手段の出力に基づき次の単位時間当り
のデータの符号予測を行う符号予測手段と、 これ等予測ゲイン及び予測符号を夫々格納する予測ゲイ
ンメモリ及び予測符号メモリとを含み、 前記単位時間当りの音声入力データとそれに続いて前記
データメモリに格納されている同一単位時間当りのデー
タを読出して入力データとして順次導出する様に前記選
択手段を制御すると共に、前記データメモリの読出しに
同期して前記予測ゲインメモリ及び予測符号メモリの各
読出しを行って前記データメモリの読出しデータのため
の予測ゲイン及び予測係数とすること特徴とする音声合
成器。 - 【請求項2】 前記データメモリの読出しに同期して前
記ゲイン予測手段及び前記符号予測手段の各リセットを
なすようにしたことを特徴とする請求項1記載の音声合
成器。 - 【請求項3】 前記単位時間当りのデータはフレーム単
位のデータであることを特徴とする請求項1または2記
載の音声合成器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33453495A JP3268349B2 (ja) | 1995-12-22 | 1995-12-22 | 音声合成器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33453495A JP3268349B2 (ja) | 1995-12-22 | 1995-12-22 | 音声合成器 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09179584A JPH09179584A (ja) | 1997-07-11 |
JP3268349B2 true JP3268349B2 (ja) | 2002-03-25 |
Family
ID=18278486
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP33453495A Expired - Fee Related JP3268349B2 (ja) | 1995-12-22 | 1995-12-22 | 音声合成器 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3268349B2 (ja) |
-
1995
- 1995-12-22 JP JP33453495A patent/JP3268349B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH09179584A (ja) | 1997-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3167385B2 (ja) | 音声信号伝送方法 | |
KR100530680B1 (ko) | 신호기록/재생장치및방법 | |
KR20090026818A (ko) | 인터넷 프로토콜을 통한 음성통화용 적응성 디-지터 버퍼 | |
JP5329846B2 (ja) | ディジタルデータプレーヤー、そのデータ処理方法及び記録媒体 | |
JP2597987B2 (ja) | ブロツク化伝送信号のデコード装置 | |
JPH08305398A (ja) | 音声復号化装置 | |
JP3268349B2 (ja) | 音声合成器 | |
JPH08202397A (ja) | 音声復号化装置 | |
JP3191854B2 (ja) | 情報蓄積出力装置 | |
EP0725385B1 (en) | Sub-band audio signal synthesizing apparatus | |
KR100912171B1 (ko) | 논인트라 화상의 변환을 이용한 비디오 신호의 수정 | |
JP2904083B2 (ja) | 音声符号化切替えシステム | |
JP3219467B2 (ja) | 音声復号化方法 | |
JP4535069B2 (ja) | 補償回路 | |
KR100724008B1 (ko) | 오디오 고속 재생 장치 및 오디오 고속 재생 방법 | |
JPH11243341A (ja) | 音声符号化復号化方法 | |
JP3191856B2 (ja) | 情報蓄積出力装置 | |
JP3222226B2 (ja) | 復号装置 | |
US6853869B1 (en) | Method and apparatus for generating surround-sound data | |
JPH07287600A (ja) | 音声蓄積装置 | |
JPH08292798A (ja) | 音声再生制御方式 | |
JPH0226905B2 (ja) | ||
JP2001103425A (ja) | 符号化データ蓄積出力装置 | |
JPH04252690A (ja) | 映像信号符号化方法と映像信号符号化装置 | |
JPH07322200A (ja) | データ出力装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20011204 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |