JP2547532B2 - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JP2547532B2
JP2547532B2 JP59030744A JP3074484A JP2547532B2 JP 2547532 B2 JP2547532 B2 JP 2547532B2 JP 59030744 A JP59030744 A JP 59030744A JP 3074484 A JP3074484 A JP 3074484A JP 2547532 B2 JP2547532 B2 JP 2547532B2
Authority
JP
Japan
Prior art keywords
voice
parameter
time
interpolation
update time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59030744A
Other languages
English (en)
Other versions
JPS60175100A (ja
Inventor
龍司 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Denki Co Ltd
Original Assignee
Sanyo Denki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Denki Co Ltd filed Critical Sanyo Denki Co Ltd
Priority to JP59030744A priority Critical patent/JP2547532B2/ja
Publication of JPS60175100A publication Critical patent/JPS60175100A/ja
Application granted granted Critical
Publication of JP2547532B2 publication Critical patent/JP2547532B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reciprocating, Oscillating Or Vibrating Motors (AREA)

Description

【発明の詳細な説明】 イ)産業上の利用分野 本発明は音声の特徴を示す音声パラメータに基づいて
音声を合成する音声合成装置に関する。
ロ)従来技術 音声合成装置としては、現在パーコール方式を代表と
する線形予測符号化方式が主流になっており、このパー
コール方式は例えば日経エレクトロニクス1980年2月4
日号の記事「身近になった音声合成の各種方式を比較す
る」に示されている如く、音声信号から抽出したパーコ
ール係数、アンプパラメータ、及びピッチパラメータを
パラメータメモリに約10msecのフレーム周期単位で格納
しておき、これを音声合成回路にフレーム周期単位で更
新して導入し音声信号を再合成するものである。然る
に、このフレーム周期は音声が定常状態であるとみなせ
る10msecに設定されているが、音声合成回路では音声の
自然な変化状態を忠実に再現する為に、これを1/4分割
した2.5msecを単位時間として上記パラメータの時系列
をこの単位時間間隔に補間する補間処理が行なわれ、こ
の処理にて得られる補間パラメータに基づいて音声が再
合成されるのである。
しかしながら、上述の如き従来の音声合成装置に於い
ても、音質の低下を招く事なく音声データとしての音声
パラメータの時系列のデータ量る削減してパラメータメ
モリのコストダウンを図る事が要望されており、言い換
えれば音声データのデータ量を増す事なく合成音声の品
質の向上を図る事が要望されている。
(ハ)発明の目的 本発明は上述の点に鑑みて為されたものであり音声デ
ータの圧縮を図り合成音声の品質の向上を可能とした音
声合成装置を提供するものである。
(ニ)発明の構成 本発明の音声合成装置は、パラメータメモリに特定単
位時間の整数倍時間を更新時間とした音声パラメータの
時系列と、この音声パラメータ毎の更新時間を示す更新
時間コードと、が夫々対応づけられて格納されており、
音声合成回路はパラメータメモリから得られる音声パラ
メータの時系列を夫々の音声パラメータに対応した更新
時間コードが示す更新時間毎に更新すると共に、夫々の
音声パラメータを特定単位時間間隔に補間するものであ
る。
(ホ)実施例 図に本発明の音声合成装置の構成を示す。同図に於い
て、(1)はパラメータROMであり、音声の特徴を示す
パーコール係数K1〜N10、ピッチパラメータP、及びア
ンプパラメータAからなる計約50ビットのパラメータ群
に加えて1〜3ビット程度の更新時間コードnを1フレ
ームの音声データとして、この各フレームが時系列的に
格納されている。ただしこの時の1フレームの各パラメ
ータは音声信号の特定時間に対応したものではなく、基
本となる例えば2.5msecの単位時間を整数倍した時間に
対応しており、この整数値が更新時間コードnとして表
わされているのである。尚、この場合のコードnは0,1,
2を示すものとする。(2)は該パラメータROM(1)か
らの1フレーム分毎の音声データの読み出しを制御する
読み出し制御回路、(3)は該パラメータROM(1)か
ら読み出された1フレーム分の音声データを一時的に格
納するバッファメモリであり、このメモリ(3)の更新
時間コードnに従って上記読み出し制御回路(2)の次
のフレームの読み出しまでの時間即ち更新時間が決定さ
れる。例えばn=0の時T=2.5msec、n=1の時T=5
msec、n=2の時T=10msecとなる。(4)は上記バッ
ファメモリ(2)に格納されているパラメータ群K1〜K
10,P,Aの夫々について、非線形な伸張処理を行なって真
のパラメータ値に逆変換する変換ROMである。即ち、パ
ラメータROM(1)の各パラメータK1〜K10,P,Aは夫々効
率の良いデータ削減の為に真の値を非線形圧縮処理され
ているのである。(51),(52)は夫々上記変換ROM
(4)からのパラメータ値を前回のサンプルに基づいて
補間する1/2補間回路、及び1/4補間回路であり、これ等
回路(51)、(52)の出力と上記変換ROM(4)からの
直接の出力を選択出力するマルチプレクサ(6)に結合
している。即ち、該マルチプレクサ(6)は上記バッフ
ァメモリ(3)の更新時間コードnに従って、例えばn
=0の時、補間されないパラメータ値を2.5msecに一度
選択出力し、n=1の時1/2補間されたパラメータ値が
2.5msecに一度ずつ計5msec間に2度選択出力し、n=2
の時1/4補間されたパラメータ値が2.5msecに一度ずつ計
10msec間に4度選択出力するのである。(7)は上記マ
ルチプレクサ(6)から常に2.5msecの単位時間毎に得
られる各パラメータ値に基づいて音声信号を合成するデ
ィジタルフィルタ、(8)はディジタルフィルタ(7)
からの音声信号をアナログ形成に変換してスピーカ
(9)を駆動するD・A変換回路である。
斯様な音声合成装置に於いては、そのパラメータROM
(1)には、音声信号をパーコール分析して得られるパ
ラメータ群が格納される事となるが、この分析時にパラ
メータ群の時間変化が非線形な所ではこのパラメータ群
のフレーム時間を短かくし、逆にパラメータ群の時間変
化が線形な所ではこのパラメータ群のフレーム時間を長
くする処理が行なわれる。
即ち、パーコール分析にて2.5msecの単位時間毎にパ
ラメータ群ここでは各パラメータK1〜K10,P,Aを代表し
てX(t)のサンプル列が順次得られるとすると、X
(t)とX(t+4)とに依って1/4補間を行ない、補
間値(t+1),(t+2),(t+3)を求
め、これ等の補間値の夫々と実際の各分析値X(t+
1),X(t+2),X(t+3)の夫々との誤差δ(t+
1),δ(t+2),δ(t+3)がいずれも特定の誤
差許容範囲内にある時には、この時間区間でのサンプル
列が線形に変化していると判定され、1/4補間が採用さ
れ、更新時間コードとしてn=2が割当てられる。ま
た、上記の誤差δ(t+1),δ(t+2),δ(t+
3)の内一つでも誤差許容範囲外にある場合は、この時
間区間のサンプル列が非線形に変化していると判定さ
れ、1/4補間は採用されない。従って、この場合、次に
X(t)とX(t+2)とに依って1/2補間を行ない、
補間値(t+1)を求め、この値と実際の分析値X
(t+1)との誤差δ′(t+1)が特定の誤差許容範
囲内にある時に、1/2補間が採用され、更新時間コード
としてn=1が割当てられる。逆に、上記の誤差δ′
(t+1)が誤差許容範囲外にある時には、1/2補間も
採用されず、即ちいずれの補間もなしでn=0が割当て
られる。
この様にして、パラメータ群の各パラメータのサンプ
ルX(t)の変化状態に応じてこのパラメータ群の更新
時間nを設定しているので、図の音声合成装置に於い
て、この更新時間nに対応した補間処理ができるのであ
る。尚、以上の説明に於いては、1/4補間までについて
述べたがn=3として1/8補間を加えてもよく、この場
合にはさらに、音声データの圧縮が可能となる事は明白
であろう。
(ヘ)発明の効果 本発明の音声合成装置は、以上の説明から明らかな如
く、音声信号の変化率の状態に依ってパラメータの更新
時間を可変としながら、これに対応して補間回数を可変
に設定できるので、合成音声の品質の劣化を防止しなが
ら、音声データの大巾なデータ圧縮が可能となる。また
逆に言えば従来装置と同一のデータ量であれば、合成音
声の品質の向上が図れるのである。
【図面の簡単な説明】
図は本発明の音声合成装置の構成を示すブロック図であ
り、(1)はパラメータROM、(2)は読み出し制御回
路、(51)(52)は補間回路、(7)はディジタルフィ
ルタ、(9)はスピーカを夫々示している。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】音声信号から抽出した音声パラメータを時
    系列的に貯えたパラメータメモリと、該パラメータメモ
    リから順次得られる音声パラメータの時系列に基づいて
    音声を合成する音声合成回路とからなり、上記パラメー
    タメモリには、特定単位時間の整数倍時間を更新時間と
    した音声パラメータの時系列と、この音声パラメータ毎
    の更新時間を示す更新時間コードと、が夫々対応づけら
    れて格納されており、音声合成回路はパラメータメモリ
    から得られる音声パラメータの時系列を夫々の音声パラ
    メータに対応した更新時間コードが示す時間毎に更新す
    ると共に、夫々の音声パラメータを特定単位時間間隔に
    補間する事を特徴とした音声合成装置。
JP59030744A 1984-02-20 1984-02-20 音声合成装置 Expired - Lifetime JP2547532B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59030744A JP2547532B2 (ja) 1984-02-20 1984-02-20 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59030744A JP2547532B2 (ja) 1984-02-20 1984-02-20 音声合成装置

Publications (2)

Publication Number Publication Date
JPS60175100A JPS60175100A (ja) 1985-09-09
JP2547532B2 true JP2547532B2 (ja) 1996-10-23

Family

ID=12312184

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59030744A Expired - Lifetime JP2547532B2 (ja) 1984-02-20 1984-02-20 音声合成装置

Country Status (1)

Country Link
JP (1) JP2547532B2 (ja)

Also Published As

Publication number Publication date
JPS60175100A (ja) 1985-09-09

Similar Documents

Publication Publication Date Title
US4435832A (en) Speech synthesizer having speech time stretch and compression functions
US4715257A (en) Waveform generating device for electronic musical instruments
JP3451900B2 (ja) ピッチ/テンポ変換方法及び装置
JPH06506070A (ja) スペクトル補間および高速コードブックサーチを有する音声コーダおよび方法
JPH0562495A (ja) サンプリング周波数変換器
US5594443A (en) D/A converter noise reduction system
KR100327969B1 (ko) 음성재생속도변환장치및음성재생속도변환방법
JP2863902B2 (ja) デジタル・オーディオ・サンプル・クロックの直接合成回路及び方法
US5111505A (en) System and method for reducing distortion in voice synthesis through improved interpolation
US6480550B1 (en) Method of compressing an analogue signal
JP2547532B2 (ja) 音声合成装置
US5416264A (en) Waveform-forming device having memory storing non-compressed/compressed waveform samples
US4873724A (en) Multi-pulse encoder including an inverse filter
JP2674161B2 (ja) 音源データ圧縮符号化方法
JP3974408B2 (ja) 標本化信号生成装置及び標本化信号再生装置並びにその方法
JPH0477320B2 (ja)
JPS5917438B2 (ja) スペクトルパラメ−タの符号化方式および音声合成装置
JP3130673B2 (ja) 音声符号化装置
JPH01134400A (ja) 残差駆動型音声合成器のピッチ周波数制御方式
DE3938311C2 (de) Vorrichtung zum Erzeugen von Quelltondaten
DE3943795C2 (de) Interpolationsfilter
JPH0863192A (ja) スペクトルパラメータ抽出装置
JPH0422278B2 (ja)
JPH10322205A (ja) 非線形歪み補正装置及び非線形歪み補正方法
JPS6136800A (ja) 可変長フレ−ム音声分析合成方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term