JPS61278900A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPS61278900A
JPS61278900A JP60121704A JP12170485A JPS61278900A JP S61278900 A JPS61278900 A JP S61278900A JP 60121704 A JP60121704 A JP 60121704A JP 12170485 A JP12170485 A JP 12170485A JP S61278900 A JPS61278900 A JP S61278900A
Authority
JP
Japan
Prior art keywords
data
frame
milliseconds
pacor
frame length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60121704A
Other languages
English (en)
Inventor
高森 和男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP60121704A priority Critical patent/JPS61278900A/ja
Priority to EP86304183A priority patent/EP0205298A1/en
Priority to KR1019860004425A priority patent/KR870000673A/ko
Publication of JPS61278900A publication Critical patent/JPS61278900A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野] この発明はパコール方式による音声分析により生成され
る分析データを記憶装置で記憶し、その後、この記憶装
置から分析データを読み出して音声合成処理を行なうパ
コール方式の音声合成装置に関する。
[発明の技術的背景とその問題点] 従来、パコール方式の音声合成装置では、合成しようと
する音声の原音波形に対して、10ミリ秒もしくは20
ミリ秒を1フレームとして音声波形を区切り、各フレー
ム毎に音声分析を行なって振幅データ、周波数データお
よびにパラメータデータと称される複数のパコール係数
を生成してこれらのデータをフレームデータとして記憶
装置に記憶し、音声合成の際にはこの記憶装置から上記
各データを読み出し、分析の際に使用したものと同じフ
レーム長で音声合成処理を行なうようにしている。
ところで、種々の方式を用いた音声合成装置では合成音
の音質を損わずにデータ量(ビットレート)をいかに少
なくするかが大きな課題となっている。このような課題
に対してパコール方式の音声合成装置でも様々な方法が
試みられており、その中でもフレーム長を20ミリ秒に
設定する方法が一般化している。このフレーム長を2o
ミリ秒に設定する方法ではフレーム長を10ミリ秒に設
定したときに比較してデータは半分に圧縮される。
しかし、このフレーム長を20ミリ秒に設定する方法で
は原音に含まれる子音や破裂音等は分析時にデータとし
て抽出できず、従って、合成時にはこのような子音や破
裂音等が表現できないという欠点がある。
他方、このような子音や破裂音等は10ミリ秒のフレー
ム長ではデータとして抽出することができるが、この場
合には上記したようにデータ量が多くなりデータの圧縮
化が損われるという欠点がある。
[発明の目的] この発明は上記のような事情を考慮してなされたもので
ありその目的は、子音や破裂音等、短いフレーム長でし
か表現できない音声を合成することができ、かつ大幅な
データ圧縮化が達成できる音声合成装置を提供すること
にある。
[発明の概要] 上記目的を達成するためこの発明にあっては、原音に含
まれる子音や破裂音等、フレーム長が10ミリ秒でしか
表現ではない音声に対してはフレーム長10ミリ秒で分
析を行ない、通常の音声に対してはフレーム長20ミリ
秒で分析を行ない、分析により生成されたフレームデー
タに対し各フレーム毎に分析時に使用したフレーム長を
表わすデータを可変フレームビットデ・−夕として付加
して記憶装置に記憶し、音声合成の際にはこの可変フレ
ームごットデータに応じて、音声合成回路で音声合成を
行なう際に使用するフレーム長を決定するようにしてい
る。
このようにすれば、従来の20ミリ秒のフレーム長で合
成することができない子音や破裂音等は10ミリ秒のフ
レーム長で合成することができる。
また発生音に含まれる子音や破裂音等の割合いは少なく
、全体として20ミリ秒のフレーム長で合成される音声
データと同程度で音声の合成が可能となり、大幅なデー
タの圧縮を行なうことができる。
[発明の実施例] 以下、図面を参照してこの発明の一実施例を説明する。
第1図はこの発明に係る音声合成装置の構成を示すブロ
ック図である。第1図において10はデータメモリであ
る。このデータメモリ10にはパコール音声分析法によ
って生成された各フレーム毎の分析データであるフレー
ムデータおよび各フレームでの分析の際に使用されたフ
レーム長に応じたデータである可変フレームビットデー
タとが記憶される。このデータメモリ10はアドレスカ
ウンタ11の出力によりアドレス指定され、アドレス指
定された複数ビットの記憶領域に予め記憶されているデ
ータが並列に読み出される。上記データメモリ10から
読み出されたデータは並列直列変換回路12に与えられ
る。この並列直列変換回路12は上記データメモリ10
から並列に読み出されたデータを直列データに変換して
出力するものあり、後述する制御回路から出力される制
御信号に基づき次のフレームデータを所定時間後に出力
する。この直列データは直列並列変換回路13に与えら
れる。直列並列変換回路13は上記並列直列変換回路1
2から出力される直列データを格納し、格納したデータ
を所定のタイミングで並列に出力する。この直列並列変
換回路13から出力される並列データは制御回路14お
よびパコール音声合成回路15に与えられる。
上記パコール音声合成回路15には上記直列並列変換回
路13から出力される並列データを一時的に記憶する入
力データ一時記憶回路16が設けられ、パコール音声合
成回路15はこの記憶回路16に記憶されたデータを用
いて、かつ少なくとも2種類のフレーム長のいずれかを
選択してパコール音声合成処理を順次行なう。
上記制御回路14は上記アドレスカウンタ11を歩進さ
せるための歩道信号を出力するデータ読みだし制@機能
、上記直列並列変換回路13を通じて与えられる前記可
変フレームビットデータの内容を判定する可変フレーム
ごットデータ判定機能、このデータ判定機能による判定
結果に応じて前記並列直列変換回路12から次のフレー
ムデータを出力させる間隔を制御するための前記制御信
号を出力する出力制御機能、上記パコール音声合成回路
15内の入力データ一時記憶回路16におけるタイミン
グ制御およびデータ判定機能による判定結果に応じて上
記パコール音声合成回路15における音声合成の際のフ
レーム長の選択動作を制御するフレーム長選択制@機能
をそれぞれ持っている。
第2図はrPAJという破裂音を持つ音声の波形図であ
り、第3図はこの第2図のような波形を持つ音声をパコ
ール音声分析法により分析した結果を記憶した前記デー
タメモリ10におけるデータ記憶状態の一例を示す図で
ある。第2図の原音声は複数のフレームti(i−4,
2・・・)に区切られている。そしてパコール音声分析
法による分析の際には各フレーム毎にフレーム長は10
ミリ秒および20ミリ秒のいずれかが選択的に使用され
る。この原音声rPAJのように音声の立ち上がり時に
破裂音が存在し、フレーム長20ミリ秒では合成ができ
ない音声区間がある場合には、最初のフレームt1とt
2とではフレーム長として10ミリ秒が選択され、t3
以降のフレームではフレーム長として20ミリ秒が選択
されて分析が行なわれる。
このようにして各フレーム毎に分析され、生成されたフ
レームデータが前記データメモリ10に記憶される。ま
た、分析により生成されたフレームデータに加えて、分
析時に各フレームで使用されたフレーム長が10ミリ秒
か20ミリ秒であるかを示す可変フレームごットデータ
も合せてデータメモリ10に記憶される。
第3図においてVFBは分析時に使用されたフレーム長
が10ミリ秒か2oミリ秒であるかを示す可変フレーム
ごットデータであり、10ミリ秒を選択した最初のフレ
ームt1とt2とではこの内容が「1」にされ、20ミ
リ秒を選択するt3以降のフレームではこの内容が「0
」にされる。
前記フレームデータは振幅データ (AMPデータ)、
周波数データ(PITCHデータ)およびパコール係数
である複数のにパラメータデータからなり、AMPデー
タのデータ量は1ビツトであり、PMTCHデータのデ
ータ量はmビット、Kパラメータデータのデータ農はn
xjビットであるとする。
なお、上記データメモリ10は1ワード(1バイト)が
例えば8ビツト構成であり、フレームt1の分析データ
については第1バイト目に可変フレームビットデータV
FBとAMPデータおよびPITC)(データの一部の
計8ビットが格納され、第2バイト目にPITCHデー
タの残りとにパラメータの一部の計8ビットが格納され
、第3バイト目ににパラメータの残りが格納される。
次に動作を説明する。まず、制御回路14はアドレスカ
ウンタ11に対して歩道信号を与える。これにより、デ
ータメモリ10では発生音に対応するアドレス指定がな
されて最初の8ビツトの記憶領域からデータが読み出さ
れ、並列直列変換回路12に供給される。次に制御回路
14から並列直列変換回路12に制御信号が供給される
と、並列直列変換回路12はこの制御信号の供給タイミ
ングに基づき、上記8ビツトのデータを直列並列変換回
路13に直列に出力する。制御回路14は上記直列並列
変換回路13を介して可変フレームごットデータVFB
が入力すると、このデータの内容を判定する。そしてこ
の判定の結果、VFB−1であれば、その次のフレーム
データを並列直列変換回路12から10ミリ秒後に出力
させるように前記制御信号の出力タイミングを制御し、
かつパコール音声合成回路15に対しては音声合成の際
に使用するフレーム長を10ミリ秒に選択するための制
御信号を出力する。他方、制御回路14における可変フ
レームビットデータVFBの判定の結果、VFB−0で
あれば、次のフレームデータを並列直列変換回路12か
ら20ミリ秒後に出力させるように前記制御信号の出力
タイミングを制御し、かつパコール音声合成回路15に
対し音声合成の際に使用するフレーム長を20ミリ秒に
選択寸、る′だめの制御信号を出力する。
パコール音声合成回路15は、次の10ミリ秒後もしく
は20ミリ秒模までの期間に、選択した10ミリ秒もし
くは20ミリ秒のフレーム長で音声合成を行なう。
このように、上記実施例回路では、原音に含まれる子音
や破裂音等、フレーム長が10ミリ秒でしか表現ではな
い音声に対してはフレーム長10ミリ秒で分析を行ない
、通常の音声に対してはフレーム長20ミリ秒で分析を
行ない、分析により生成されたフレームデータに対し各
フレーム毎に分析時に使用したフレーム長を表わすデー
タを可変フレームビットデータとして付加してデータメ
モリ10に記憶し、音声合成の際にはこの可変フレーム
ビットデータに応じて、音声合成回路15で音声合成を
行なう際に使用するフレーム長を決定するようにしてい
るので、子音や破裂音等、短いフレーム長でしか表現で
きない音声を合成することができる。また、発生音に含
まれる子音や破裂音等の割合いは少ないので、全体とし
て20ミリ秒のフレーム長で合成される音声データと同
程度で音声の合成が可能となり、大幅なデータの圧縮を
行なうことができる。
第4図の波形aは前記第2図の原音声を全て20ミリ秒
のフレーム長で分析し、合成した後の合成音波形であり
、波形すは同様に全て10ミリ秒のフレーム長で分析し
、合成した後の合成音波形であり、波形Cは上記実施例
回路による可変フレーム長により分析し、合成した後の
合成音波形である。波形Cでは波形aで表現できない特
徴を持っており、また、波形aとbとで差異の見られな
い立ち上がり後の音声の特徴も充分に表現されているこ
とがわかる。
[発明の効果] 以上説明したようにこの発明によれば、子音や破裂音等
、短いフレーム長でしか表現できない音声を合成するこ
とができ、かつ大幅なデータ圧縮化が達成できる音声合
成装置を提供することができる。
【図面の簡単な説明】
第1図はこの発明の一実施例の構成を示すブロック図、
第2図は上記実施例を説明するための波形図、第3図は
上記実施例回路のデータメモリのデータ記憶状態の一例
を示す図、第4図は上記実施例回路を説明するための波
形図である。 10・・・データメモリ、11・・・アドレスカウンタ
、12・・・並列直列変換回路、13・・・直列並列変
換回路、14・・・制御回路、15・・・パコール音声
合成回路、16・・・入力データ一時記憶回路。 出願人代理人 弁理士 鈴江武彦 第1図 ts2図 II3wI I!j4 図

Claims (1)

    【特許請求の範囲】
  1. パコール音声分析法により、異なる2種のフレーム長を
    選択して音声分析を行なうことにより生成される振幅デ
    ータ、周波数データおよびパコール係数からなるフレー
    ムデータとこれら各フレームデータ生成の際に選択され
    たフレーム長を表わす可変フレームビットデータとを記
    憶するデータメモリと、上記データメモリから読み出さ
    れるフレームデータを用いてパコール音声合成処理を行
    なう音声合成回路と、上記データメモリから読み出され
    るデータのうち可変フレームビットデータの内容を判定
    する判定手段と、上記判定手段による判定結果に応じて
    上記音声合成回路における音声合成の際に選択されるフ
    レーム長を決定する制御手段とを具備したことを特徴と
    する音声合成装置。
JP60121704A 1985-06-05 1985-06-05 音声合成装置 Pending JPS61278900A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP60121704A JPS61278900A (ja) 1985-06-05 1985-06-05 音声合成装置
EP86304183A EP0205298A1 (en) 1985-06-05 1986-06-02 Speech synthesis device
KR1019860004425A KR870000673A (ko) 1985-06-05 1986-06-04 음성합성장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60121704A JPS61278900A (ja) 1985-06-05 1985-06-05 音声合成装置

Publications (1)

Publication Number Publication Date
JPS61278900A true JPS61278900A (ja) 1986-12-09

Family

ID=14817812

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60121704A Pending JPS61278900A (ja) 1985-06-05 1985-06-05 音声合成装置

Country Status (3)

Country Link
EP (1) EP0205298A1 (ja)
JP (1) JPS61278900A (ja)
KR (1) KR870000673A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5495552A (en) * 1992-04-20 1996-02-27 Mitsubishi Denki Kabushiki Kaisha Methods of efficiently recording an audio signal in semiconductor memory
DE4345252B4 (de) * 1992-04-20 2004-05-27 Mitsubishi Denki K.K. Verfahren zur Wiedergabe von digitalisierten Audiodaten aus einem Halbleiterspeicher
KR970017456A (ko) * 1995-09-30 1997-04-30 김광호 음성신호의 무음 및 무성음 판별방법 및 그 장치

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5872194A (ja) * 1981-10-23 1983-04-30 松下電器産業株式会社 音声分析符号化方式

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3177166D1 (de) * 1980-02-04 1990-04-26 Texas Instruments Inc Vorrichtung zur sprachsynthese.
JPS5913758B2 (ja) * 1980-02-22 1984-03-31 株式会社日立製作所 音声合成方法
US4658424A (en) * 1981-03-05 1987-04-14 Texas Instruments Incorporated Speech synthesis integrated circuit device having variable frame rate capability

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5872194A (ja) * 1981-10-23 1983-04-30 松下電器産業株式会社 音声分析符号化方式

Also Published As

Publication number Publication date
KR870000673A (ko) 1987-02-19
EP0205298A1 (en) 1986-12-17

Similar Documents

Publication Publication Date Title
US7418388B2 (en) Voice synthesizing method using independent sampling frequencies and apparatus therefor
JPS61278900A (ja) 音声合成装置
JPS5940700A (ja) 音声合成装置
JPS62229198A (ja) 音声応答装置
JPS6053999A (ja) 音声合成器
JPS603000A (ja) 音声合成方式
JPS6040636B2 (ja) 音声合成装置
JPS6199198A (ja) 音声分析合成装置
JPS58107597A (ja) 音声合成装置
JP2614436B2 (ja) 音声合成装置
JPS59177597A (ja) 楽音合成装置
JPH0664477B2 (ja) 音声合成装置
JPH03160500A (ja) 音声合成装置
JPH01118200A (ja) 音声合成方式
JPS63262699A (ja) 音声分析,合成装置
JPS6022190A (ja) 楽音合成装置
JPS5868799A (ja) 音声合成装置
JPS60113299A (ja) 音声合成装置
JPS60205596A (ja) 音声合成装置
JPS58192099A (ja) 音声合成器
JPH03225521A (ja) 音声変換装置
JPS62150398A (ja) 音声規則合成装置
JPS59133596A (ja) 音声合成装置
JPS63210899A (ja) 音声合成装置
JPH0738113B2 (ja) 音声合成装置