JPH04367000A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH04367000A
JPH04367000A JP3143101A JP14310191A JPH04367000A JP H04367000 A JPH04367000 A JP H04367000A JP 3143101 A JP3143101 A JP 3143101A JP 14310191 A JP14310191 A JP 14310191A JP H04367000 A JPH04367000 A JP H04367000A
Authority
JP
Japan
Prior art keywords
speech
character string
section
phoneme
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3143101A
Other languages
English (en)
Inventor
Tomohisa Hirokawa
広川 智久
Hideyuki Mizuno
秀之 水野
Shinya Nakajima
信弥 中嶌
Kazuo Hakoda
箱田 和雄
Yamato Sato
大和 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP3143101A priority Critical patent/JPH04367000A/ja
Publication of JPH04367000A publication Critical patent/JPH04367000A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、入力された文字列に
対応した音声応答メッセージを出力する音声合成装置に
おいて、入力文字列が分析合成音に対応した文字列であ
るか或はテキスト合成音に対応した文字列であるかを判
定する処理判定部を具備し、分析合成音に対応した文字
列であると判定された入力文字列については予め登録さ
れている分析合成音を出力し、テキスト合成音に対応し
た文字列であると判定された入力文字列についてはテキ
スト合成音を出力する音声合成装置に関する。
【0002】
【従来の技術】電話番号案内その他の如き音声を用いた
サービスに使用される音声応答装置は、従来、定型の文
章或は単語を音声応答用のファイルに予め登録しておき
、これら定型の文章或は単語を編集して音声応答メッセ
ージを作成する方法を採用していた。ところが、この方
法は種々の理由で汎用性に乏しいものであり、結局、サ
ービスの種類および内容は限られることとなる。そして
、この方法を実施するにしても、音声応答用のファイル
の作成に多大の労力を要した。この様なことから、テキ
ストから音声を合成する方法が開発され、テキスト音声
合成装置が市場において販売されるようにもなった。 これら音声合成装置の多くは音声を合成する基本単位で
ある音声合成単位として子音ー母音連鎖(CV)を採用
するものである。しかし、これら音声合成装置は何れも
、或る1つの子音ー母音連鎖(CV)について1種類の
子音ー母音連鎖(CV)しか登録していなかったがため
に実音声の如くに自然な調音結合を実現することはでき
ず、合成される音声は滑らかさに乏しいロボット的なも
のに過ぎなかった。このような欠点を補うための方法と
して、合成単位を音素の長さとし、大量の実音声データ
から前後の音素環境を考慮して分類を行ない、音声合成
単位を作成するという方法(COC法:Context
Oriented  Clustering)がある。 この方法は確かに、合成音声は滑らかにはなるが、音声
合成単位数が2000個にも上り、その上に前後の音素
環境との間のマッチングをとりながら音素セグメントを
決めて行かなければならないので最適セグメントの検索
に時間がかかり、実時間処理が困難であるという欠点を
内包している。
【0003】一方、音声応答サービス自体について考え
てみると、全ての音声をテキストからのみ合成しなけれ
ばならないというものでもない。音声応答メッセージは
その内の一部が定型である場合が殆んどなのである。こ
のような音声応答サービスの場合、定型部分は分析合成
音とする方が音声品質は高くなる。従来のテキスト音声
合成装置は分析合成音出力機能はないのであるが、この
機能をも具備して両出力をしようとしても装置全体、制
御方法共に複雑になるものとされていた。
【0004】
【発明が解決しようとする課題】この発明は、上述の通
りの欠点、問題を解消、除去した音声合成装置を提供し
ようとするものである。
【0005】
【課題を解決するための手段】この発明は、入力された
文字列に対応した音声応答メッセージを出力する音声合
成装置において、入力文字列が分析合成音に対応した文
字列であるか或はテキスト合成音に対応した文字列であ
るかを判定する処理判定部を具備し、分析合成音に対応
した文字列であると判定された入力文字列については予
め登録されている分析合成音を出力し、テキスト合成音
に対応した文字列であると判定された入力文字列につい
てはテキスト合成音を出力する構成としたことにより、
音声合成装置を簡便で高品質な音声応答メッセージを出
力し、しかもテキスト音声合成を迅速に実施することが
できるものとした。
【0006】
【実施例】この発明の実施例を図を参照して説明する。 図1はこの発明の音声合成装置の実施例のブロック図で
ある。図1において、端子1から音声に変換されるべき
文字列が入力されると、これらの文字は処理判定部2に
おいて分析合成音対応文字列であるか或はテキスト合成
音対応文字列であるかを判定される。
【0007】分析合成音対応文字としては、通常のテキ
ストにはあまり現われない文字、例えば「$」というよ
うな文字をこれに割り当てる。分析合成音対応文字例え
ば$には、図2に示される如く、その後に01、02の
ように2文字程の情報を付加し、この情報により分析合
成音の内容を識別選択するようにしている。処理判定部
2において文字列がテキスト合成音対応文字列であると
判定された場合、文字列はテキスト解析部3において漢
字に対して単語の同定が行なわれ、単語境界、漢字の読
み、アクセントその他の読みに関する情報が設定される
。ここで、単語の同定は漢字列を有限長の窓で切り出し
、予め用意された単語辞書4の見出しと、左側からの最
長一致マッチングをとりながら行う。単語辞書4は、一
般語辞書、固有名詞辞書、カタカナ語辞書、英単語辞書
、接辞辞書、文法辞書その他の辞書より成る。図3は一
般語辞書の内容を示す。漢字見出しに対して通番、同形
語フラグ、連濁フラグ、かな語幹、品詞、読みの他にア
クセント情報をも有している。他の辞書もほぼ同様の仕
様を持ち、それぞれアクセント情報を有している。次に
、句読点、文字列中に含まれる格助詞その他の後にポー
ズを設定する。ポーズで囲まれた部分に対して図4に示
されるアクセント統合規則を適用することにより、複合
単語、文節レベルについてのアクセントを求める。
【0008】韻律情報生成部5は、テキスト解析部3に
より得られたかな読み列、アクセント情報、ポーズ情報
に基づいて適切なイントネーション、即ちピッチパター
ンを生成する。ピッチパターンは、複合単語、文節固有
のアクセント成分と文章全体の基本的イントネーション
を表現する話調成分とで近似し、これら各成分を独立に
制御するモデルで設定する。アクセント成分は、その基
本形状をアクセント形と文節の長さから決定する。話調
成分は、一定の傾きを持つ直線により近似し、その形状
はポーズ位置、文節の長さに基づいて決める。
【0009】パラメータ生成部6は、テキスト解析部3
により得られたかな読み列に対応する音素セグメントを
音素セグメント格納部8から読み出し、これにピッチ情
報を付与して連続的な音声パラメータ列を生成する。こ
こで、音素セグメントとしてCOC法により求められた
音素セグメントを例にとり、図5を参照して音素セグメ
ントの検索方法の説明をする。先ず、各音素セグメント
が持つ音韻環境の内、子音に対しては後続母音、母音に
対しては直前の前接子音種別(以下、これらを、主音素
環境、と称す)をインデックス部7にインデックステー
ブルとして登録しておき、これとかな読み列との間の一
致を調べる。一致すれば、次いでインデックス部7にマ
ップテーブルとして表記されている全音素環境を検索し
、かな読み列とマップテーブルに表記されている音素環
境情報との間の一致を調べて最適な音素セグメントを決
定する。例えば、かな読み列/OHAYOU/中の/A
/に対応する合成単位を検索する場合、/A/の音素環
境は前々音/O/、前音/H/、後音/Y/、後々音/
O/であり、/A/の主音素環境は/H/である。ここ
で、/A/の音素番号は10、/O/の音素番号は1、
/H/の音素番号は5、/Y/の音素番号は21である
ものとする。検索処理は、先ずインデックステーブルを
見て/A/の音素番号10に対応する10行目に表記さ
れている始点ポインタ、終点ポインタの値を読み出す。 この場合、始点ポインタの値は20、終点ポインタの値
23であるので、サブインデックステーブルの20行目
から23行目の間に表記されている主音素環境を読み出
し、/H/の音素番号である5が書かれている行、即ち
21行を検索する。ところで、このサブインデックステ
ーブルはインデックス部7に格納されているテーブルで
あり、これにはマップテーブル上の検索範囲を限定する
始点ポインタおよび終点ポインタが記載されている。サ
ブインデックステーブルの21行における102、10
4がこの場合の始点ポインタ、終点ポインタである。こ
れらのポインタの指示に基づいてマップテーブルを検索
する。マップテーブルには音素セグメント格納部8に格
納している音素セグメントの音素環境を表現する後々音
、後音、前音、前々音に対応する音素番号および実際の
格納アドレスが記載されている。これら音素番号とかな
読み列音素番号との間のマッチングをとり、最適な音素
セグメントを選択決定する。この場合、最適な音素セグ
メントとしてポインタ103のものを選択する。その格
納アドレス4061、4090により音素セグメントを
選択することとなる。ここで、アドレス4061は音声
パラメータの始フレーム4061を指示し、アドレス4
090は終フレーム4090を指示するものである。即
ち、この場合の音声パラメータは始フレーム4061か
ら終フレーム4090に至る合計30フレームより成る
ものであることを意味している。上述の如くして、迅速
に合成単位、この場合/A/に対する合成単位、の検索
をすることができる。パラメータ生成部6においてこの
検索を繰り返すことにより得られた音声パラメータ列は
、次いで音声合成部9に送り込まれてここにおいて音声
波形13に変換される。上述の処理によれば、高速な合
成単位の検索が実現される。
【0010】一方、処理判定部2において分析合成音で
あるものと判定された文字列は、パラメータ読み出し部
10に送り込まれてここにおいて分析パラメータ格納部
11に予め登録されている分析合成音と対応付けがなさ
れ、対応する分析音声パラメータを読み出してこれを音
声合成部9に送り込み、ここにおいて音声波形13に変
換する。
【0011】ここで、入力文字列が「$01明日の天気
は晴れ、一時曇りでしょう。$02」である時、これは
分析合成音、テキスト合成音、分析合成音の組合せであ
る。音声応答出力は、図2の対応から「コチラハ、オン
セイオウトウセンターデス。アスノテンキワハレ、イチ
ジクモリデショウ。アリガトウゴザイマシタ。」となる
【0012】
【発明の効果】この発明は、上述した通りのものであっ
て、入力された文字列に対応した音声応答メッセージを
出力する音声合成装置において、入力文字列が分析合成
音に対応した文字列であるか或はテキスト合成音に対応
した文字列であるかを判定する処理判定部を具備し、分
析合成音に対応した文字列であると判定された入力文字
列については予め登録されている分析合成音を出力し、
テキスト合成音に対応した文字列であると判定された入
力文字列についてはテキスト合成音を出力する構成とし
たものであって、分析合成音とテキスト合成音とを組合
せた音声応答メッセージが入力テキスト作成時に簡便に
編集できる。その上に、テキスト合成に際して合成音声
単位の検索をインデックス部を介して実施することによ
り、音声合成は効率よく迅速に実施することができるこ
ととなり、音声応答メッセージをこれを必要とするオン
ラインサービスに即時に提供することが可能となるに到
った。
【図面の簡単な説明】
【図1】この発明の音声合成装置のブロック図。
【図2】分析合成音対応文字と音声応答メッセージの対
応を示す図。
【図3】一般辞書の内容を示す図。
【図4】アクセント統合規則を示す図。
【図5】音素セグメントの検索の仕方を説明するための
図。
【符号の説明】
1    端子 2    処理判定部 3    テキスト解析部 4    単語辞書 5    韻律情報生成部 6    パラメータ生成部 7    インデックス部 8    音素セグメント格納部 9    音声合成部 10  パラメータ読み出し部 11  分析パラメータ格納部 13  音声波形

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  入力される入力文字列に対応した音声
    応答メッセージを出力する音声合成装置において、入力
    文字列が分析合成音に対応した文字列であるか或はテキ
    スト合成音に対応した文字列であるかを判定する処理判
    定部を具備し、単語の読み、アクセント情報、文法情報
    その他の単語情報からなる単語辞書部を具備し、単語辞
    書部を使用して入力文字列に読み、アクセントおよびポ
    ーズその他の読みに関する情報を付与するテキスト解析
    部を具備し、テキスト解析部の出力に基づいて音声合成
    のための韻律情報を生成する韻律情報生成部を具備し、
    出力音声を生成するに際して基本単位となる音素セグメ
    ントを蓄積しておく音素セグメント格納部を具備し、音
    素セグメントを検索する音素セグメントインデックス部
    を具備し、テキスト解析部から送られてくる情報に基づ
    いて音素セグメント格納部から音素セグメントを選択し
    て連続音声パラメータを生成する音声パラメータ生成部
    を具備し、予め分析された音声パラメータを格納してお
    く分析パラメータ格納部を具備し、入力文字列に対応す
    る分析音声パラメータを読み出すパラメータ読み出し部
    を具備し、上記両音声パラメータから音声波形を合成す
    る音声合成部を具備することを特徴とする音声合成装置
JP3143101A 1991-06-14 1991-06-14 音声合成装置 Pending JPH04367000A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3143101A JPH04367000A (ja) 1991-06-14 1991-06-14 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3143101A JPH04367000A (ja) 1991-06-14 1991-06-14 音声合成装置

Publications (1)

Publication Number Publication Date
JPH04367000A true JPH04367000A (ja) 1992-12-18

Family

ID=15330935

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3143101A Pending JPH04367000A (ja) 1991-06-14 1991-06-14 音声合成装置

Country Status (1)

Country Link
JP (1) JPH04367000A (ja)

Similar Documents

Publication Publication Date Title
US6751592B1 (en) Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically
US8219398B2 (en) Computerized speech synthesizer for synthesizing speech from text
JP3587048B2 (ja) 韻律制御方法及び音声合成装置
JPH086591A (ja) 音声出力装置
JPH1039895A (ja) 音声合成方法および装置
JPH0887297A (ja) 音声合成システム
CN114822490A (zh) 语音拼接方法和语音拼接装置
JP4409279B2 (ja) 音声合成装置及び音声合成プログラム
van Rijnsoever A multilingual text-to-speech system
JP3060276B2 (ja) 音声合成装置
JP3397406B2 (ja) 音声合成装置及び音声合成方法
JPH04367000A (ja) 音声合成装置
JP2002123281A (ja) 音声合成装置
JP4056647B2 (ja) 波形接続型音声合成装置および方法
KR0173340B1 (ko) 텍스트/음성변환기에서 억양패턴 정규화와 신경망 학습을 이용한 억양 생성 방법
JP2000056788A (ja) 音声合成装置の韻律制御方法
JP2003005776A (ja) 音声合成装置
JPH09292897A (ja) 音声合成装置
JP2746880B2 (ja) 複合語分割方法
Hakoda et al. Japanese text-to-speech synthesizer based on residual excited speech synthesis
JPH06176023A (ja) 音声合成システム
JPH01321496A (ja) 音声合成装置
JPH08160983A (ja) 音声合成装置
JPH06138894A (ja) 音声合成装置及び音声合成方法
Yiourgalis et al. Text-to-speech system for Greek