JPH04107598A - 音声合成方式 - Google Patents

音声合成方式

Info

Publication number
JPH04107598A
JPH04107598A JP2225225A JP22522590A JPH04107598A JP H04107598 A JPH04107598 A JP H04107598A JP 2225225 A JP2225225 A JP 2225225A JP 22522590 A JP22522590 A JP 22522590A JP H04107598 A JPH04107598 A JP H04107598A
Authority
JP
Japan
Prior art keywords
synthesized
storage means
accent
voice
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2225225A
Other languages
English (en)
Inventor
Shigetoshi Saito
成利 斉藤
Hiroshi Matsuura
博 松浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2225225A priority Critical patent/JPH04107598A/ja
Publication of JPH04107598A publication Critical patent/JPH04107598A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、電話サービスシステム等に利用されている音
声応答装置に用いられる音声合成方式に関する。
(従来の技術) 従来、銀行の振込み照会サービスなど音声応答装置か使
用されている。このサービスは、ユーザの口座に誰から
振込まれたかを教えるもので、応答音声は、固定メツセ
ージの部分はあらかしめ録音しである音声を再生する録
音再生方式により生成し、名前部分はカナ文字からルー
ルにより音声を合成する規則合成方式により生成してい
る。固定メツセージの部分か録音再生方式であるため、
高品質の音声を生成できるが、メツセージの内容を変更
するためには、改めて音声を録音しなければならず大変
であった。
そのため、メツセージの内容が頻繁に変わるシステムで
は、録音再生方式よりもメツセージ内容をも含めてすべ
て規則合成による装置が考えられる。
ところで規則合成には、入力に韻律情報(区切り、アク
セント、ポーズ)を与えて音声合成するものと、韻律情
報を必要とせず、アクセント辞書の照合により音声合成
するものがある。従来、メッセージが頻繁に変わるシス
テムでは、韻律情報を与える煩わしさを避けるため、ア
クセント辞書の照合による規則合成装置が使われていた
。ところか、すべてアクセント辞書の照合による規則合
成により合成音を生成すると、区切り位置やポーズ長か
不自然であったり、辞書にない単語のため、誤読が生じ
たり、アクセント位置が違って聞きにくいものになった
りするという問題点かあった。
(発明が解決しようとする課題) 本発明は、このような事情を考慮して成されたもので、
その目的とするところは、電話サービスで、ガイダンス
やメツセージとして出力する規則合成音が、区切り位置
、ポーズ長、アクセントの自然である音声合成方式を提
供することにある。
[発明の構成コ (課題を解決するための手段) 本発明は、この目的を実現するために、電話サビス等を
行う音声合成方式において、名前部分の音声は、アクセ
ント辞書を照合することにより生成した規則合成音を用
い、ガイダンスやメッセシなどその他の部分は、韻律情
報を含むあらかしめ作成した入力文字列から生成した規
則合成音を使用するようにしたものである。
(作用) 本発明によれば、電話サービス等を行う音声合成方式に
おいて、ガイダンスやメツセージ部は、韻律情報を含む
あらかじめ作成した入力文字列から生成した規則合成音
を使用しているため、区切り位置、ポーズ長、アクセン
トの自然である応答音声を出力することかできる。
(実施例) 以下、本発明の一実施例の詳細を試験成績の電話サービ
スシステムを例に図面に基いて説明する。
第1図は本発明の実施例装置の構成を示すブロック図で
ある。第1図において1は音声規則合成部、2はN C
U (Network Control Unit)部
、3は主制御部、4は第1の記憶手段としての試験成績
データファイル、5は第2の記憶手段としての音声変換
用入力ファイルである。しかして、この試験成績の電話
サービスシステムは主制御部の制御の元に、試験成績デ
ータファイル4及び音声変換用人カフアイルから選択的
に文字列を抽出し、音声規則合成部1によって音声合成
する。この合成された音声は、NC0部2、電話回線8
、ネットワーク6を介して利用者の電話機7に伝達され
る。なお、9はモニタ用のスピーカ、10はヘッドホン
である。
ここで、音声規則合成部1の詳細を第2図のブロック図
を用いて説明する。11は入力文字列を解析し、アクセ
ント辞書12を参照してアクセント位置を検定し、音韻
記号列と韻律情報を求める文字列解析部である。音韻記
号列は音韻パラメータ列生成装置14に入力され、音声
素片ファイル15を参照し音声パラメータ列を生成する
。一方、韻律情報は、韻律パラメータ列生成装置13に
与えられ、韻律パラメータ列が生成される。合成器16
は、こうして求められた音声パラメータ列と韻律パラメ
ータ列とに従って、所定の合成規則によって合成音を生
成出力する。
次に、試験成績の電話サービスの態様を説明する。第3
図のような試験成績が、第1図の試験成績データファイ
ル4に、あらかじめインプットされている。システムは
、このデータに基づいて電話サービスを行う。なお、各
人の成績の機密保持のため、暗証番号を登録するように
しである。試験成績の電話サービスの態様を第4図に示
す。システムは利用者からの電話を、NC0部2により
、着信すると、「こちらは、××予備校試験情報サービ
スセンターです。学籍番号をどうぞ(ピッ)。
」と規則合成音で応答する。利用者はガイダンスの合成
音の指示に従い、学籍番号と暗証番号をブツシュボタン
(PB)で入力することにより、試験成績の点数と順位
を規則合成音で聞くことができる。このサービスでは、
第3図のデータからメツで一ジ内容を作り出している。
例えば、第3図で「××××タロウ」の点数は、国語7
0、数学85、英語67で、順位は、5位となっている
このデータから、第4図の「×ヌ太部さんの順位は・・
・・・・数学が優秀です。」を作り出している。
従来の装置では、この作り出したすべてのメッセージ文
を、規則合成部1に送り、文字列解析部11で、アクセ
ント辞書12と照合をして、規則合成音を生成していた
。しかし、すべてのメッセジ文を、文字列解析部のアク
セント辞書照合により生成した場合には、区切りやポー
ズ長が自然でなかったり、アクセント位置が誤っていた
り、誤読か生しるという問題が生じていた。ところで、
こういったシステムでは、出力するメツセージはそれほ
ど長いものでなく、可変であるにしろ、ある程度決まっ
たもので、あらかじめガイダンスやメツセージ部分を韻
律情報を含む形で作成しておくことが可能である。
本発明では、名前部分の合成音は、第1の記憶手段とし
ての試験成績データファイル4から抽出した文字と、ア
クセント辞書12を参照して規則合成し、それ以外の部
分は、区切りやポーズ長、アクセントが自然な合成音に
するため、韻律情報を含むあらかじめ作成した入力文字
列を記憶した第2の記憶手段としての音声変換用入力列
ファイル5から抽出した文字列を規則合成する。そのた
め、出力するすべてのガイダンスやメッセーシノ応答音
声か、区切り位置、ポーズ長、アクセントか自然である
合成音によって電話サービスすることかできる。
第5図に、韻律情報を含む音声変換用入力列ファイル5
の記憶内容の一部を示す。ここで「−」はアクセント、
「、」はポーズ、「/」は文節区切り、「//」は文の
終りを表し、カナ文字列は発声音韻を表す。
なお、このような韻律情報を含む音声変換用人力列ファ
イルをすばやく作成する方法としては、例えば、「電子
情報通信学会春季全国大会論文集」(1990年3月)
講演番号A−247r音声エディタ付き電話サービス用
規則合成システム」 (斉藤他著)と題して発表されて
いる音声エディタを使用することが考えられる。このエ
ディタを使用すると初心者でも簡単にアクセントを付し
た入力列を作成することができる。
[発明の効果] 以上説明したように本発明によれば、規則合成による音
声合成装置において、名前部分の合成音は名前を記憶し
た記憶手段から抽出した文字とアクセント辞書を参照し
て規則合成し、それ以外の部分は、あらかじめ作成した
韻律情報を含む入力文字列を記憶した記憶手段からの文
字列から規則合成するため、区切りやポーズ長、アクセ
ントなどが自然であるガイダンスやメツセージの合成音
で情報サービスが行えるという効果を奏する。
【図面の簡単な説明】
第1図は、本発明の音声合成方式の一実施例を示すブロ
ック図、第2図は音声規則合成部の詳細例を示すブロッ
ク図、第3図は試験成績データファイルの記憶内容を示
す図、第4図は電話サービスの態様例を示す図、第5図
は音声変換用入力列ファイルの内容を示す図である。 1・・・音声規則合成部 4・・・試験成績データファイル 5・・・音声変換用入力列ファイル 12・・・アクセント辞書 J 第2図

Claims (1)

    【特許請求の範囲】
  1.  所定の規則により少なくとも名前を含む入力文字列に
    対して、アクセントを付与し音声合成する音声合成装置
    において、名前を含む応答すべき文字列を記憶する第1
    の記憶手段と、韻律情報の入った応答すべき文字列を記
    憶する第2の記憶手段とを有し、少なくとも名前部分の
    合成音は、第1の記憶手段から抽出した文字とアクセン
    ト辞書とを照合して規則合成し、それ以外の部分の合成
    音は、第2の記憶手段から抽出した入力文字列から規則
    合成することを特徴とする音声合成方式。
JP2225225A 1990-08-29 1990-08-29 音声合成方式 Pending JPH04107598A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2225225A JPH04107598A (ja) 1990-08-29 1990-08-29 音声合成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2225225A JPH04107598A (ja) 1990-08-29 1990-08-29 音声合成方式

Publications (1)

Publication Number Publication Date
JPH04107598A true JPH04107598A (ja) 1992-04-09

Family

ID=16825950

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2225225A Pending JPH04107598A (ja) 1990-08-29 1990-08-29 音声合成方式

Country Status (1)

Country Link
JP (1) JPH04107598A (ja)

Similar Documents

Publication Publication Date Title
US5774854A (en) Text to speech system
US9214154B2 (en) Personalized text-to-speech services
US7260533B2 (en) Text-to-speech conversion system
US7596499B2 (en) Multilingual text-to-speech system with limited resources
US6826530B1 (en) Speech synthesis for tasks with word and prosody dictionaries
JP2002366186A (ja) 音声合成方法及びそれを実施する音声合成装置
WO2005093713A1 (ja) 音声合成装置
Levinson et al. Speech synthesis in telecommunications
JP3270356B2 (ja) 発話文書作成装置,発話文書作成方法および発話文書作成手順をコンピュータに実行させるプログラムを格納したコンピュータ読み取り可能な記録媒体
Westall et al. Speech technology for telecommunications
JP4409279B2 (ja) 音声合成装置及び音声合成プログラム
JPH04107598A (ja) 音声合成方式
Henton Challenges and rewards in using parametric or concatenative speech synthesis
JPH04167749A (ja) 音声応答装置
JPH09244679A (ja) 音声合成方法および音声合成装置
Yarrington et al. A system for creating personalized synthetic voices
JPH0683381A (ja) 音声合成装置
JPH09258785A (ja) 情報処理方法および情報処理装置
JPH09258764A (ja) 通信装置および通信方法、並びに情報処理装置
Amatya Emotional speech from machine
JPH09251373A (ja) 音声合成方法および音声合成装置
KR100363876B1 (ko) 음성의 특징 벡터를 이용한 문자 음성 변환 장치 및 그 방법
KR20230099934A (ko) 복수의 화자음성을 이용한 음성 변환 장치 및 그 방법
Ojala Auditory quality evaluation of present Finnish text-to-speech systems
JPH03145698A (ja) 音声合成装置