JPS62254196A - 音声合成方式 - Google Patents

音声合成方式

Info

Publication number
JPS62254196A
JPS62254196A JP9670386A JP9670386A JPS62254196A JP S62254196 A JPS62254196 A JP S62254196A JP 9670386 A JP9670386 A JP 9670386A JP 9670386 A JP9670386 A JP 9670386A JP S62254196 A JPS62254196 A JP S62254196A
Authority
JP
Japan
Prior art keywords
synthesis
code
information
sound source
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9670386A
Other languages
English (en)
Inventor
市川 熹
浅川 吉章
武田 昌一
畑岡 信夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP9670386A priority Critical patent/JPS62254196A/ja
Publication of JPS62254196A publication Critical patent/JPS62254196A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業の利用分野] 本発明は音声合成方式に係り、特に音声高能率伝送と共
通の合成手段を有するのに好適な音声規則合成方式に関
する。
[従来の技術] 従来、音声情報の出力を用いる主用な形態である高能率
伝送の合成部と任意の音声を合成する音声規則合成の合
成部は、例えば、特公昭49−18007号公報や、D
 、 I−I 、 klatt“ザクラットーク テキ
スト−1〜ウースピーチ コンベンション システム(
The K L A T T A L K Text−
to −5peech   Convention  
 System)   ”  ICAS S P 82
  pp、1589−1592のように一般には独立に
開発されるか、あるいは、良く知られているP A R
COR方式のように、元々前者用に開発されたものを、
そのまま流用する場合が多く、後者用に改良されたもの
は、そのまま前者に用い考慮が十分でない。このため、
両者を兼用でき、かつ高品質の音声出力が得られるよう
には配慮されていなかった。
[発明の解決しようとする問題点] 上記従来技術は高能率音声符号化方式と規則合成方式の
音声合成部の共用については何ら配慮されておらず装置
の経済性が問題であった。
本発明の目的は、すでに発明の一人が主発明者となって
いる高能率音声符号化方式(特願昭6O−201542
)の合成部をそのまま用いて、高品質の規則合成音声を
得る手段を提供することにある。
また、本発明のもう一つの目的は1本発明と同一の発明
者がすでに発明者として出願している(特願昭6O−9
3611)r文字音声通信大火及び装置」の一つの高性
能な実現手段を提供することにある。
[問題を解決するための手段] 上記目的は入力文字列から残差利用階層的ベクトル量子
化方式(HVQR方式)に必要な符号系列を発生する手
段を与えることにより達成される。
[作用] 音声の規則合成を実現するためには、「ア」とか「イ」
という情報を主に伝えるスペクトル情報と、「雨」と「
飴」の区別を示すアクセントやイントネーションなど抑
揚情報を主に伝える音源情報を独立に制御する必要があ
る。人間では前者は主に口の形状により与えられ、後者
は音帯の振動などで主に与えられている。しかし、後者
は流体力学的な発振現象によると言われており、その発
振条件は前者の口の形状などによっても異なるため完全
に独立ではなく、そのことによる両者の相関のある組み
合せが人の声らしい音質を与える重要な因子の一つとな
っていると言われている。声帯の発振条件により、声帯
の発振波形(音源波形)や発振周期の微妙な差やゆらぎ
が異なり、このことが、mに人の声らしさというだけで
なく、発声者の個人差(個人性)を伝える上で重要な因
子となる。
この点に注目した両者の相関性を考慮した高性能音声符
号化方式(以下階層的バク1−ル量子化方式I−I V
 Q Rと呼ぶ)を先に我々は提案した(特願昭6O−
201542)。先ずこのHVQR方式を極く簡単に説
明する。
音声は口という物理的制約のあるもので生成されている
ため、物理的特性から見た場合、特性上存在する範囲に
は偏りがある。従って、複数の特性で記述される空間内
の点で音声を記述すると、音声の存在する範囲は一様で
はなく、たとえばラグビーボールのような偏よった分布
になる。そこで、この存在しうる範囲を幾つかの部分空
間に分割し、各部分空間に一つ一つ記号を的応させ、こ
の記号を伝送することにより大幅に伝送に必要な情報量
を圧縮することができる。この方式は一般にベクトル量
子化と呼ばれている。
我々のHVQR方式では、先ずスペクトル情報をベクト
ル量子化する。次にこのベクトル量子化により選択され
た記号と相関性の高い音源情報の範囲からのみ音源情報
を選択する。音源情報内でも階層的に、ピッチ情報(声
の高さの情報)、音源振幅、音源波形の間の相関性を利
用して符号化を行なう。
次に、従来主に音声規則合成用に用いられて来た合成手
法の音質上の問題点を見て見る。
規則合成に用いられている合成手法を大別すると二つに
なる。その第一は、ターミナル・アナログ方式、あるい
はホルマント合成方式ど呼ばれる方式に代表されるもの
で1合成に必要な情報を主に人工的に検討して与えてお
くものである。この方式は十分手を加えれば、かなり良
い音質が得られるが、自然音声から安定に必要な情報を
得ることがむつかしく、高能率音声符号化に用いるのに
は未だ問題が解決されていない。
第二の方法は、PARCOR方式やL P C方式と呼
ばれる方式に代表されるもので、元々高能率音声符号化
用に開発されたものの中で、スペクトル情報と音源情報
に分離して処理するものの−・群である。この方式の利
点は人間の発声した音声を分析して、規則合成に用いる
情報が得られる点にあり、人間が発声した音節音声をも
とに、規則合成用の単位で割合簡単にに作り出せる。こ
の方式は原理的に両者へ共用出来るものの、先述のよう
に、本来スペクトルと音源に相関のあるものを分けて独
立に用いるため、規則合成に用いた場合、音質に問題が
生じる。
本発明は、先に提案した符号化方式であるHVQ R方
式が、スペクトルと音源に分けながら、かつ両者の間の
方式である点に着目し、高品質の音声規則合成を実現す
る手段としての手段を与える。
このようにすることにより装置の小型化が図れると同時
に規則合成の音声の品質も向上させることになる。
[発明の実施例] 以下、本発明の一実施例を図を用いながら説明する。な
お、以下の説明では、入力の文字列から、その読み方や
、アクセン1〜型の推定等を行なう部分については、様
々な提案がすでにあり、かつ本発明の一般性をそこなう
ものではないので、省略し、読みの系列やアクセント情
報に伴なう抑揚のピッチ周波数パターンはすでに主成さ
れているものとして、説明する。また、本実施例では、
HVQR方式の具体的構成例として、LPC系のパラメ
ータをベースにしたものを例として取り」−げ説明する
。この例では、スペク1〜ルパラメータはLPG係数な
PARCOR係数をベースにベクトル量子化され、音源
情報としては、音源波形としての残産波形;ピッチ周期
、残差振幅を各々コード化したものを用いて説明する。
これらの具体的パラメータは、本発明の規則合成と組み
合せて用いる符号化方式のパラメータに、別のものを用
いる場合には、それに合せたものが選択されることは言
うまでもなく、そのことにより本発明の一般性が損なわ
れるものではない。
第1図は本発明の一実施例を説明するためのブロック図
である。
高能率音声符号化の符号から説明する。符号化部及びそ
の考え方はすでに出願している。特願昭60.2015
42に記しであるので省略し、本発明に実施例に直接関
係する復合部についてのみここで記す。受信レシーバ2
1で受けたコードはコード解読部22でスペクトル情報
コード23と音源情報コード24に分けられそれぞれの
バッファ31と32に送られる。スペクトルに情報(ベ
クトル)コードは音源波形選択部33と音声波形合成部
38に、音源情報コードは残差波形ベクトルとピッチ周
期コード及び残差振幅コードにさらに分けられ、残差波
形ベクトルコードは音源波形(残差波形)選択部33は
、ピッチ周期コードは音源波形選択部33と音源波形再
生部35に、残差振幅コードは音源波形再生部35に送
られる。
音源波形選択部33は、スペクトル・ベクトルコードと
残差波形ベクトル・コード及びピッチ周期コードにより
、合成時に用いる音源波形(残差波形)を音源波形ベク
トル・コードブック34よ=7− り選択し、音源波形再生部211に送る。音源波形再生
部36は前記選択された音源波形をピッチ周期コードを
用いて繰り返えし波形にし、残差振幅コードより波形振
幅を修正し、一連の音源波形に再生して音声波形、合成
部211に送る。
音声波形合成部211は、スペクトル・ベクトルコード
により、使用するスペク1〜ル情報をスペクトル・ベク
トル・コードブック37より読み出し内部にある合成フ
ィルタに設定し、前記再生された音源波形を取り込んで
音声合成を行ない、D/A変換部212を経て合成/再
生波形108として出力する。
次に規則合成部1の説明を日本語の合成を例に行なう。
合成の単位及び言語の処理を各言語に合せれば、他の言
語でも同様に可能であり、この点は本発明の一般性を失
なわない。
入力された文字コード列は規則合成用言語処理部11に
て、ツヅリを発音の単位のコード列に変換し、高低や強
弱などのアクセント型やイントネーションの形及び各発
音単位に割り当てられる時間長の配分が行なわれる。こ
れらの具体的な手順は言語により異なるが、その内容は
日本語や英語など、幾つかの言語では様々な方式がすで
に提供されており、また、それ自体は本発明の本質とは
特に関係ないので、ここでは省略する。言語処理部で得
られた時間配分及びアクセント、イントネーションの判
定結果にもとすき、抑揚、特にピッチ周期のパターンを
ピッチパターン生成部12で生成する。この生成手順も
たとえば藤先らの生成モデルにもとすき、実現すること
が可能である。
(たとえば、H,Fujisaki et al“An
alysisof Vojce fandamenta
l frequency comtours ford
eclarative 5entenses of J
apan” J 、 Acoust。
Soc、 Jpn(E) 5.4 (1984) p2
33)−このようにして得られた読みの情報及びピッチ
パターン情報は合成コード生成部13に送られる。第2
図は日本語で「オハヨウ」という音声を合成する場合の
例について、合成の単位を日本語の音節に従い[0] 
 [ha]  [yol  [0]に取り、各々の時間
配分に従い、横軸に時間(1)を、縦軸にピッチ周波数
f。(Hz)を取って示した例である。
第2図に示されたような情報を受は取ると合成コード生
成部13は規則合成用ツー1〜辞書△ISより、入力情
報に最も良く合う特性を持つコードを順次取り出し、音
声合成バッファ部」5に高能率符号化におけるコードと
同一形式にして送り込む。説明を簡単にするために、ピ
ッチ周波数範囲を第2同右に示すように相互に領域の重
なる3つの区間に分けて扱う場合を例に説明する。(実
際には、この領域の数は要求音質によりさらに増すが本
説明はこの領域を増しても一般性を失なわない)。
第3図は規則合成用コード辞書部の構成の一例を示す。
合成均位/ a / / i /・・・・などとピッチ
の周波範囲■■■などをキーに合成コード列ai1+a
工2.・・・・などを引きことが出来る構造となってい
る。各合成コードは音声合成部を制御する間隔単位(た
とえばioms)毎にその合成単位の使われる予想最大
長n(間隔10m5の場合n X 10m5)までのコ
ード列として記録されている。各コードは第3図下に示
すように、音源振幅情報コード解読部l、クトル・ベク
トル・コートrI。
音源波形ベクトル・コードWからなる。第2図の重列で
、たとえば【」型詰/ Ok+ a y o o /の
最初の合成単位10/の例の場合、その長さが1201
118とすると、ピッチ範囲は■に属するから、第3図
の規則合成用コード辞書の/○/の■の部分の頭からo
31+ 03□、・・・・03□2まで(120÷10
=12)が読み出され、音声合成バッファに送り込まれ
ることになる。また、ピッチコードは■及び第2図の該
当の値に当るコードが併せて送り込まれる。これらのコ
ードの相互の位置関係は高能率音声符号化の場合のコー
ド構成と−rtするように編集させる。なお本方式には
、たとえば同源振幅情報は規則合成用コード辞書部中の
値をそのまま使用するのではなく、合成コード生成部で
なんらかの修正を加えたりするなど様々な付加修正の方
式がありうる。
[発明の効果] 本発明によれば、任意の文章等を合成する音声規則合成
の音声合成部と、高能率音声符号化の復IJ− 合成化部を共用することができるので、装置の小型化及
び経済化がはがれると同時に、規則合成の音声の品質を
従来にない高品質なものとして得ることが可能となる。
【図面の簡単な説明】
第1図は本発明の実施例を示す図、第2図、第3図は実
施例の動什及び構成を説明する図である。 101・・・音声規則合成部、11・・・規則合成用言
語処理部、12・・・ピッチパターン生成部、13・・
・合成コード生成部、14・・・規則合成用コード辞書
部、15・・音声合成バッファ部、21・・・受信レシ
ーバ、22・・・コード解読部、23・・スペクトル情
報コード、24・・音源情報コード、31・・・スペク
トル情報コードバッファ、32・・音波情報コードバッ
ファ、33・・音源波形(残差波形)選択部、34・・
・音源波形(残差波形)ベクトルコードブック、35・
・・音源波形再生部、37・・・スペクトル・ベクトル
コードブック、38・・・音声波形合成部、209・・
・スペク1〜ル概形復号化部、21Q・・・スペクトル
微細構造復号化部、211・・・合成フィルタ、212
・・・D/A変換部、108・・・合成/再生音声波形
。 手  続  補  正  書(方式) 昭植1年7月1栢

Claims (1)

    【特許請求の範囲】
  1. 1、合成制御単位名と、同単位の使用中のピッチ周波数
    情報とを見出しとして、少なくとも、スペクトル情報と
    音波波形情報を取り出すことの出来るコード辞書を有す
    ることを特徴とする規則合成用音声合成方式。
JP9670386A 1986-04-28 1986-04-28 音声合成方式 Pending JPS62254196A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9670386A JPS62254196A (ja) 1986-04-28 1986-04-28 音声合成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9670386A JPS62254196A (ja) 1986-04-28 1986-04-28 音声合成方式

Publications (1)

Publication Number Publication Date
JPS62254196A true JPS62254196A (ja) 1987-11-05

Family

ID=14172119

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9670386A Pending JPS62254196A (ja) 1986-04-28 1986-04-28 音声合成方式

Country Status (1)

Country Link
JP (1) JPS62254196A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010224418A (ja) * 2009-03-25 2010-10-07 Kddi Corp 音声合成装置、方法およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010224418A (ja) * 2009-03-25 2010-10-07 Kddi Corp 音声合成装置、方法およびプログラム

Similar Documents

Publication Publication Date Title
US4975957A (en) Character voice communication system
US6161091A (en) Speech recognition-synthesis based encoding/decoding method, and speech encoding/decoding system
EP0380572B1 (en) Generating speech from digitally stored coarticulated speech segments
JP2782147B2 (ja) 波形編集型音声合成装置
US4912768A (en) Speech encoding process combining written and spoken message codes
US4821324A (en) Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate
JPH06110498A (ja) 音声合成システムの音声断片コーディングおよびそのピッチ調節方法とその有声音合成装置
JPS6046440B2 (ja) 音声処理方法とその装置
WO2003010752A1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
US5091946A (en) Communication system capable of improving a speech quality by effectively calculating excitation multipulses
Rabiner et al. Computer synthesis of speech by concatenation of formant-coded words
US4985923A (en) High efficiency voice coding system
JPS62254196A (ja) 音声合成方式
JP3394281B2 (ja) 音声合成方式および規則合成装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JPS6162100A (ja) マルチパルス型符号化復号化装置
JPS58188000A (ja) 音声認識合成装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP2577372B2 (ja) 音声合成装置および方法
JPS62102294A (ja) 音声符号化方式
JPH04349499A (ja) 音声合成システム
Khudoyberdiev The Algorithms of Tajik Speech Synthesis by Syllable
JPH0258640B2 (ja)
JPH09258796A (ja) 音声合成方法
JP2573587B2 (ja) ピッチパタン生成装置