JPH03139699A - 音声編集合成器 - Google Patents

音声編集合成器

Info

Publication number
JPH03139699A
JPH03139699A JP1278994A JP27899489A JPH03139699A JP H03139699 A JPH03139699 A JP H03139699A JP 1278994 A JP1278994 A JP 1278994A JP 27899489 A JP27899489 A JP 27899489A JP H03139699 A JPH03139699 A JP H03139699A
Authority
JP
Japan
Prior art keywords
sentence
component
phrase
pitch
prosodic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1278994A
Other languages
English (en)
Inventor
Kanji Kunisawa
国澤 寛治
Noboru Uechi
上地 登
Akira Yamamura
山村 彰
Junko Omukai
大向 順子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP1278994A priority Critical patent/JPH03139699A/ja
Publication of JPH03139699A publication Critical patent/JPH03139699A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、音声応答装置などに用いる音声編集合成器に
関するものである。
[従来の技術] 従来、L、R,RABINER,R,W、5etlAF
ERand J、L、FLANΔG八N:1lへo+n
puter 5ynthesis of Forman
しCoded Words−Bell  System
  Technical  、Iounal、50、p
p、1541−1558(1971) [文献1]に示
されるように、フォルマント合成方式の音声合成器を用
いて、種々の単語をフォルマントデータの形で記憶して
おき、それらを結合し、時間長とピッチパターンの制御
を行って、自然な文章音声を合成する方法があった。
このような方法を用いると、単語音声をフォルマントデ
ータで記憶していることと、単語を結合して文章を合成
していることとにより、文章音声を非常に少ない記憶容
量で合成することができる。
しかしながらこの方法では単語を結きすることにより文
章を合成しているので、文章全体としての韻律の自然さ
は劣化し、特に波形符号化方式により単語音声を記憶し
てそれらの単語音声を結合する場合は文章全体としての
韻律を制御することが困難である。
しかしフォルマント合成方式の音声合成器を用いて、単
語音声をフォルマントデータで記憶する場合は、文章全
体としての韻律を制御することができるので、文章全体
としての韻律の自然さの劣化を小さくすることができる
この方法は単語音声をパラメータ編集方式で用いられる
パラメータて記憶していることになるが、規則合成方式
(の合成過程)で用いられるパラメータ、即ち音韻情報
と、韻律情報で記憶する方法も考えられる( 木下、荒
用、松本、石川、本多、小川:ホルマントアナログ方式
による文章合成についてパ日本音響学会講演論文集 、
1.−6−7、 P、 419(昭和55年10月)参
照 [文献′2])。
前者の方法の場合は合成音の品質は高いが、記憶容量が
大きくなり、文章全体としての韻律制御を行う場合に音
節単位の制御が困難であり、また後者の方法の場合は記
憶容量が少なくて住み、音節単位の韻律制御が容易であ
るが、合成音の品質は低いという長所と短所とがある。
[発明が解決しようとする課題] ところでピッチパターンはき放音の韻律に関して大きな
影響を与える要因の一つであるが、上記の[文献1]に
は文章全体の韻律の自然さ得るためのピッチパターンの
与え方として、次の4つを示しているが、夫々問題があ
る。
■出力する文章音声に対応した自然音声からピッチパタ
ーンを抽出する。この方法を用いると非常にピッチパタ
ーンが得られるが、出力され得る文章音声の数が膨大な
音声合成器では、それに対応して総ての自然音声を得る
ことは困難である。
■一つの棋聖を用いる。この方法は出力する文章音声の
内容が非常に限られている場合は有効であるが、一般に
はそうではないため、適用できない。
■テキスト合成によりピッチパターンを生成する。
この方法は有効であるが、現在の段階では完成度は低く
そのためテキスト合成のシステムを音声合成器に組み込
まなければならないので、その分だけ音声合成器が大型
化し、コストも高いという問題がある。
■単語が持っているピッチパターンをそのまま用い、そ
れらのピッチパターンを結きして全体のと・ノチパター
ンとする。この方法は一つの単語に対していくつかのピ
ッチパターンを持った音声を記憶する必要があり、また
そのようにしても文章全体として滑らかさは良くないと
いう問題がある。
本発明は上述の問題点に鑑みて為されたもので、その目
的とするところは出力音声全体として自然な合成音が得
られるピッチパターンを与えることができる音声編集合
成器を提供するにある。
[課題を解決するための手段] 上記目的を達成するために、請求項1記載の発明は韻律
語を単位として音声を記憶し、且つピッチパターンが任
意に制御できる音声編集合成器において、各韻律語の記
憶時にピッチについてはアクセント成分のみを記憶して
おき、文章合成時にその文章に対応したフレーズ成分を
生成するとともに、該フレーズ成分にアクセント成分を
重畳することによりピッチパターンを生成することを特
徴とするものである。
また請求項2記載の発明はピッチパターンの制御を臨界
制動モデルで制御する音声編集合成器であつて、韻律語
に対するピッチのアクセント成分のみを記憶しておき、
複数の韻律語の結合で形成される文を合成するときに、
文頭のみで声立てが発生するフレーズ成分に各韻律語の
アクセント成分を重畳することによりピッチパターンを
生成することを特徴とする請 求 明において、出力される得る音声中の文から総ての文型
を抽出してその各文型に対するフレーズ成分を記憶し、
一つの文の合成時に韻律語の列とのその文型を入力信号
として該文型に対するフレーズ成分に各韻律語のアクセ
ント成分を重畳してもよい。
更に請求項4記載の発明は点ピッチを直線近似してピッ
チパターンを生成する音声編集合成器であって、韻律語
に対するピッチのアクセント成分のみを記憶しておき、
複数の韻律語の結合て形成される文を合成するときに、
文頭のみで声立てが発生するフレーズ成分に各韻律語の
アクセント成分を重畳することによりピッチパターンを
生成することを特徴とずる。 尚請求項5記載の発明の
ように請求項4記載の発明において、出力される得る音
声中の文から総ての文型を抽出してその各文型に対する
フレーズ成分を記憶し、一つの文の合成時に韻律語の列
とのその文型を入力信号として該文型に対するフレーズ
成分に各韻律語のアクセン1一成分を重畳してもよい。
[作用] 而して本発明によれば、単語程度の韻律語の音律情報と
、韻律語に対するピッチのアクセントのみを記憶するだ
けでよいから、記憶容量が少なくてすみ小型、且つ低コ
ストで製作することができる上に、物理的には自然なピ
ッチパターンとなって、自然の抑揚をもった文章音声の
合成が行える。
[実施例コ 以下本発明を実施例により説明する。
第1図は本発明の一実施例の構成を示しており、この実
施例では韻律語(現実の発話において、1個のアクセン
ト型を呈する語又は語連鎖)を単位として音声を記憶部
2に記憶させる。この記憶するデータは音韻情報と、韻
律情報とからなり、韻律情報はその韻律話に対応ずる自
然音声から抽出するが、ピッ− チについてはアクセント成分のみを記憶する。このアク
セント成分の抽出は例えば「藤崎夕′韻律方法の検出″
、平成元年度 文部省重点領域研究 「日本語における
韻律的特徴の実態とその教育にかんする総合的研究」の
講演とシンポジウムの資料」で公知となっているモデル
C基づいて分析を行うことにより行える。
而して編集・規則合成部1に合成したい文章情報を与え
ると、編集・・規則合成部1は文章を構成する韻律語n
1・・・の列に対応して記憶部2より順次韻律語n,・
・・の音韻情報、韻律情報を順次読み出して結合して合
成を行い、その合成音声をスピーカ3より再生ずる。こ
の合成時においてピッチパターンは次にようにして生成
される。つまり出力文章を韻律節、つまり休止により区
切られた発話の区間(1個乃至それ以上の韻律旬を含む
)からなる文に分解し、夫々の文の文頭に正のフレーズ
指令と文末の負のフレーズ指令からなる(つまり一つの
声立てからなる)フレーズ成分を与え、それに各対応す
る韻律語n・・・のアクセント・成分を重畳したものを
編集・規則合成部1に与えるのである。尚韻律句は現実
の発話において一個のフレーズと対応する語又は語連鎖
と定義する。
第2図(a)〜(c)は韻律語rl 、〜nコのアクセ
ント成分を示し、第2図(d)はこれら韻律語n〜n3
からなる文音声に与えるフレーズ成分を示し、これらア
クセント成分とフレーズ成分とを合成して得られたピッ
チパターンが第2図(e)である。
ここで一般に文は複数のフレーズ指令を含んでいるので
、このような方法では意味的、文法的には不自然な抑揚
となるが、物理的には自然なピッチパターンとなってお
り、非常に簡単な方法で比較的自然な抑揚が得られるこ
とになる。
ところで韻律語を結合して一つの文を構成する場合、そ
の文は多くは幾つかの文型(例えば「A番線にB行きの
電車が入ります。」等の文型)の中の一つに分類できる
と考えられる。
そこで、第3図に示すように韻律語の音韻情報、韻律情
報を記憶する記憶部2a以外に韻律語の並びによって構
成される文の文型に対するフレーズ成分を各文型に対応
して記憶部2bに記憶しておき、合成時には編集・規則
合成部1に韻律語nビ・・列とともに与えられる文型m
に対応するフレーズ成分を記憶部2bより読み出して、
該フレーズ成分に各韻律語n+−のアクセント成分(第
1図実施例と同様に各韻律語はアクセント成分のみを記
憶している)を重畳したものをピッチパターンとして与
える(フレーズ成分については、時間パターンをそのま
ま記憶するのではなく、フレーズ指令の形で表現し、そ
の位置を文型中の各文に関連付けて記憶することにすれ
ば、実際に合成音を出力する場合の各文の長さが異なる
ことに対応できる。)。
第4図(a)〜(e)は韻律語n1〜n5のアクセント
成分を示し、第4図(f>は韻律語n1〜n5からなる
文に対応する文型mに与えるフレーズ成分を示し、第4
図(g>は合成時のピッチパターンを示す。
このようにすることにより、韻律語n1・・・をっなぎ
合わせたものも自然性の高い抑揚の合成音が得られるこ
とになるのである。
尚−」二記各実施例は臨界制動モデルを用いた音声編集
合成器に関するものであるが、点ピッチを用いる方法に
よる音声m集合成語においても採用できるのはいうまで
もない。点ピッチを用いる方法は公知の方法(例えば箱
出、佐藤:″文音声合成における音調規則パ、電子通信
学会論文誌、Vol、J63D、No、9、pp、71
5−722  参照)を用いれば良く、この場合各韻律
語のアクセント成分の点ピッチパターンを自然音声から
抽出する方法としては、上述と同様にアクセント成分を
抽出し、点ピッチパターンで直線近似を行うのである。
この場合音声編集合成器の構成は第1図実施例と同じ構
成でよく、記憶部2に記憶する点ピッチを用いた韻律語
n1・・・のアクセント成分のみを韻律情報として記憶
しておき、第5図(a)〜(c)に示す韻律語n1〜n
3のアクセント成分と、第5図(cl)に示す韻律語n
、〜n3からなる文音声に与えるフレーズ成分とから第
5図(e)に示すピッチパターンを得るのである。
尚点ピッチを用いた方法に第3図実施例のように1 〜12 文型mのフレーズ成分を採用した場合、音声編集自戒器
の構成は第4図実施例と同じ構成であり、この場合第6
図(a)〜(e)に示ず韻律g!n1〜n5のアクセン
ト成分に第6図(f)に示す文型mに与えるフレーズ成
分とで第6図(g>のようにピッチパターンを得るので
ある。
またパラメータ編集方式を用いた場合でも同様な処理が
行える。更にパラメータ編集方式と点ピッチによる方法
を組み合わせても良いが、この場合はパラメータ編集方
式では各母音の中心位置が明示されていないので、韻律
語の記憶時に各母音の中心位置も記憶する必要がある。
[発明の効果] 本発明は各韻律語の記憶時にピッチについてはアクセン
ト成分のみを記憶しておき、文章合成時にその文章に対
応したフレーズ成分を生成するとともに、該フレーズ成
分にアクセント成分を重畳することによりピッチパター
ンを生成するので、文章全体としての抑揚が自然となる
ようなピッチパターンを簡単に生成することがてき、し
かも記憶するための情報量が少なくてずむから記憶部の
容量が少なくて済み、低コストで且つ小型に製作できる
という効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例の構成図、第2図は同上の動
作説明図、第3図は本発明の別の実施例の構成図、第4
図は同上の動作説明図、第5図は本発明の他の実施例の
動作説明図、第6図は本発明の更に別の実施例の動作説
明図である。 1は編集・規則合成部、2’、2a、2bは記憶部、3
はスピーカて′ある。

Claims (5)

    【特許請求の範囲】
  1. (1)韻律語を単位として音声を記憶し、且つピッチパ
    ターンが任意に制御できる音声編集合成器において、各
    韻律語の記憶時にピッチについてはアクセント成分のみ
    を記憶しておき、文章合成時にその文章に対応したフレ
    ーズ成分を生成するとともに、該フレーズ成分にアクセ
    ント成分を重畳することによりピッチパターンを生成す
    ることを特徴とする音声編集合成器。
  2. (2)ピッチパターンの制御を臨界制動モデルで制御す
    る音声編集合成器であって、韻律語に対するピッチのア
    クセント成分のみを記憶しておき、複数の韻律語の結合
    で形成される文を合成するときに、文頭のみで声立てが
    発生するフレーズ成分に各韻律語のアクセント成分を重
    畳することによりピッチパターンを生成することを特徴
    とする音声編集合成器。
  3. (3)出力される得る音声中の文から総ての文型を抽出
    してその各文型に対するフレーズ成分を記憶し、一つの
    文の合成時に韻律語の列とのその文型を入力信号として
    該文型に対するフレーズ成分に各韻律語のアクセント成
    分を重畳することを特徴とする請求項2記載の音声編集
    合成器。
  4. (4)点ピッチを直線近似してピッチパターンを生成す
    る音声編集合成器であって、韻律語に対するピッチのア
    クセント成分のみを記憶しておき、複数の韻律語の結合
    で形成される文を合成するときに、文頭のみで声立てが
    発生するフレーズ成分に各韻律語のアクセント成分を重
    畳することによりピッチパターンを生成することを特徴
    とする音声編集合成器。
  5. (5)出力される得る音声中の文から総ての文型を抽出
    してその各文型に対するフレーズ成分を記憶し、一つの
    文の合成時に韻律語の列とのその文型を入力信号として
    該文型に対するフレーズ成分に各韻律語のアクセント成
    分を重畳することを特徴とする請求項4記載の音声編集
    合成器。
JP1278994A 1989-10-26 1989-10-26 音声編集合成器 Pending JPH03139699A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1278994A JPH03139699A (ja) 1989-10-26 1989-10-26 音声編集合成器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1278994A JPH03139699A (ja) 1989-10-26 1989-10-26 音声編集合成器

Publications (1)

Publication Number Publication Date
JPH03139699A true JPH03139699A (ja) 1991-06-13

Family

ID=17604926

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1278994A Pending JPH03139699A (ja) 1989-10-26 1989-10-26 音声編集合成器

Country Status (1)

Country Link
JP (1) JPH03139699A (ja)

Similar Documents

Publication Publication Date Title
US7565291B2 (en) Synthesis-based pre-selection of suitable units for concatenative speech
US8340967B2 (en) Speech samples library for text-to-speech and methods and apparatus for generating and using same
JPH031200A (ja) 規則型音声合成装置
JPH0833744B2 (ja) 音声合成装置
JPH0632020B2 (ja) 音声合成方法および装置
JPH0641557A (ja) 音声合成のための方法および装置
JPH01284898A (ja) 音声合成方法
van Rijnsoever A multilingual text-to-speech system
JPH05100692A (ja) 音声合成装置
JP2008058379A (ja) 音声合成システム及びフィルタ装置
JP2894447B2 (ja) 複合音声単位を用いた音声合成装置
JPH03139699A (ja) 音声編集合成器
JP3394281B2 (ja) 音声合成方式および規則合成装置
JP3081300B2 (ja) 残差駆動型音声合成装置
JP2577372B2 (ja) 音声合成装置および方法
JPH09179576A (ja) 音声合成方法
JPS5914752B2 (ja) 音声合成方式
JPH05224689A (ja) 音声合成装置
Georgila 19 Speech Synthesis: State of the Art and Challenges for the Future
JP2573586B2 (ja) 規則型音声合成装置
JPH09292897A (ja) 音声合成装置
Butler et al. Articulatory constraints on vocal tract area functions and their acoustic implications
Khudoyberdiev The Algorithms of Tajik Speech Synthesis by Syllable
May et al. Speech synthesis using allophones
JPH0836397A (ja) 音声合成装置