JP2002023787A - 音声合成装置、音声合成システム、音声合成方法及び記憶媒体 - Google Patents

音声合成装置、音声合成システム、音声合成方法及び記憶媒体

Info

Publication number
JP2002023787A
JP2002023787A JP2000204959A JP2000204959A JP2002023787A JP 2002023787 A JP2002023787 A JP 2002023787A JP 2000204959 A JP2000204959 A JP 2000204959A JP 2000204959 A JP2000204959 A JP 2000204959A JP 2002023787 A JP2002023787 A JP 2002023787A
Authority
JP
Japan
Prior art keywords
waveform
voice
text data
speech
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000204959A
Other languages
English (en)
Inventor
Hiroyuki Kimura
裕行 木村
Hironori Goto
裕典 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2000204959A priority Critical patent/JP2002023787A/ja
Priority to US09/891,389 priority patent/US7031924B2/en
Publication of JP2002023787A publication Critical patent/JP2002023787A/ja
Priority to US11/357,021 priority patent/US20060143012A1/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 複数のテキストデータの合成音声の再生タイ
ミングが重なってしまうのを検知した場合、現在再生中
の音声波形の有無や再生待ちの音声波形の数に応じて、
音声再生のスピードを早くすることによって、複数のテ
キストデータが同時に発声されて聞き取りにくくなるこ
ともなく、また、音声再生までの待ち時間が極力少ない
状態で、再生された音声を聞けるようにした音声合成装
置、音声合成システム、音声合成方法及び記憶媒体を提
供する。 【解決手段】 テキストデータの音声波形を生成する音
声波形生成部209と、複数のテキストデータの音声波
形のタイミングの重なりを検知した場合、音声波形の再
生スピードを早くし、または空白を挿入し、または特定
の音声合成波形を挿入して出力する音声出力部210と
を具備する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声合成装置、音
声合成システム、音声合成方法及び記憶媒体に関し、特
に、テキストデータを合成音声に変換して出力する場合
に好適な音声合成装置、音声合成システム、音声合成方
法及び記憶媒体に関する。
【0002】
【従来の技術】従来より、文字情報を音声出力する機能
を有する音声合成装置がある。従来の音声合成装置にお
いて、音声出力するデータは、予め電子化されたテキス
トデータとして準備されたものでなければならなかっ
た。即ち、そのテキストデータは、パーソナルコンピュ
ータ上におけるエディタやワードプロセッサなどで作成
した文章や、インターネット上のHTML(Hyper Text
Markup Language)文章である。
【0003】また、音声合成装置から上記のようなテキ
ストデータを音声で出力する場合、殆どの場合が、1入
力からのテキストデータを、音声合成装置に予め設定さ
れている1種類の音声で出力していた。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の音声合成装置においては、同時に複数のテキストデ
ータの入力を受け付け、しかもそれらの合成音声を聞き
分け易く、且つできるだけ待ち時間も少なくなるように
音声出力することができないという問題があった。
【0005】本発明は、上述した点に鑑みなされたもの
であり、複数のテキストデータの合成音声の再生タイミ
ングが重なってしまうのを検知した場合、現在再生中の
音声波形の有無や再生待ちの音声波形の数に応じて、音
声再生のスピードを早くすることによって、複数のテキ
ストデータが同時に発声されて聞き取りにくくなること
もなく、また、音声再生までの待ち時間が極力少ない状
態で、再生された音声を聞けるようにした音声合成装
置、音声合成システム、音声合成方法及び記憶媒体を提
供することを第一の目的とする。
【0006】また、本発明は、複数のテキストデータの
合成音声の再生タイミングが繋がってしまうのを検知し
た場合、現在再生中の音声波形の後に、区切りを明確に
するための予め定められた空白時間を設けることによっ
て、複数のテキストデータが繋がってしまうことがなく
なり、音声情報の区切りが明確にわかるので、音声情報
を容易に区別して聞けるようにした音声合成装置、音声
合成システム、音声合成方法及び記憶媒体を提供するこ
とを第二の目的とする。
【0007】また、本発明は、複数のテキストデータの
合成音声の再生タイミングが繋がってしまうのを検知し
た場合、現在再生中の音声波形の後に、別の情報である
ことを判らせる特定の音声合成波形の再生を行うことに
よって、複数のテキストデータが繋がって発声された場
合でも、音声情報の区切りが明確にわかるので、音声情
報を容易に区別して聞けるようにした音声合成装置、音
声合成システム、音声合成方法及び記憶媒体を提供する
ことを第三の目的とする。
【0008】
【課題を解決するための手段】上記目的を達成するた
め、請求項1記載の発明は、テキストデータを合成音声
に変換して出力する音声合成装置であって、前記テキス
トデータの音声波形を生成する音声波形生成手段と、複
数の前記テキストデータの音声波形の再生タイミングの
重なりを検知した場合は、音声波形の再生スピードを早
くして出力する音声出力手段とを有することを特徴とす
る。
【0009】上記目的を達成するため、請求項2記載の
発明は、前記音声出力手段は、現時点で音声再生中の音
声波形があり且つ音声再生待ちの音声波形が一つの場合
は、通常より若干早い再生スピードで出力し、現時点で
音声再生中の音声波形があり且つ音声再生待ちの音声波
形が二つ以上の場合は、更に早い再生スピードで出力す
ることを特徴とする。
【0010】上記目的を達成するため、請求項3記載の
発明は、前記音声出力手段は、音声再生待ちの音声波形
の数に応じた細かいステップで再生スピードを上げるこ
とが可能であることを特徴とする。
【0011】上記目的を達成するため、請求項4記載の
発明は、テキストデータを合成音声に変換して出力する
音声合成装置であって、前記テキストデータの音声波形
を生成する音声波形生成手段と、複数の前記テキストデ
ータに係る音声波形を再生する場合、前の音声波形の再
生終了後、次の音声波形の再生開始前に、予め定められ
た空白時間を設ける音声出力手段とを有することを特徴
とする。
【0012】上記目的を達成するため、請求項5記載の
発明は、前記空白時間は、任意に設定可能であることを
特徴とする。
【0013】上記目的を達成するため、請求項6記載の
発明は、テキストデータを合成音声に変換して出力する
音声合成装置であって、前記テキストデータの音声波形
を生成する音声波形生成手段と、複数の前記テキストデ
ータに係る音声波形を再生する場合、前の音声波形の再
生終了後、次の音声波形の再生開始前に、予め用意され
た特定の音声合成波形を再生する音声出力手段とを有す
ることを特徴とする。
【0014】上記目的を達成するため、請求項7記載の
発明は、前記特定の音声合成波形は、前記前の音声波形
と前記次の音声波形の間に挿入される明確に区切りと判
る音声メッセージの音声合成波形であることを特徴とす
る。
【0015】上記目的を達成するため、請求項8記載の
発明は、遊園地等の各種施設で前記テキストデータを音
声放送するシステム、インターネットを介して前記テキ
ストデータで会話を行うシステムに適用可能であること
を特徴とする。
【0016】上記目的を達成するため、請求項9記載の
発明は、テキストデータを合成音声に変換して出力する
音声合成装置と、該音声合成装置に前記テキストデータ
を送信する外部装置とを具備してなる音声合成システム
であって、前記音声合成装置は、前記テキストデータの
音声波形を生成する音声波形生成手段と、複数の前記テ
キストデータの音声波形の再生タイミングの重なりを検
知した場合は、音声波形の再生スピードを早くして出力
する音声出力手段とを有することを特徴とする。
【0017】上記目的を達成するため、請求項10記載
の発明は、前記音声合成装置の前記音声出力手段は、現
時点で音声再生中の音声波形があり且つ音声再生待ちの
音声波形が一つの場合は、通常より若干早い再生スピー
ドで出力し、現時点で音声再生中の音声波形があり且つ
音声再生待ちの音声波形が二つ以上の場合は、更に早い
再生スピードで出力することを特徴とする。
【0018】上記目的を達成するため、請求項11記載
の発明は、前記音声合成装置の前記音声出力手段は、音
声再生待ちの音声波形の数に応じた細かいステップで再
生スピードを上げることが可能であることを特徴とす
る。
【0019】上記目的を達成するため、請求項12記載
の発明は、テキストデータを合成音声に変換して出力す
る音声合成装置と、該音声合成装置に前記テキストデー
タを送信する外部装置とを具備してなる音声合成システ
ムであって、前記音声合成装置は、前記テキストデータ
の音声波形を生成する音声波形生成手段と、複数の前記
テキストデータに係る音声波形を再生する場合、前の音
声波形の再生終了後、次の音声波形の再生開始前に、予
め定められた空白時間を設ける音声出力手段とを有する
ことを特徴とする。
【0020】上記目的を達成するため、請求項13記載
の発明は、前記空白時間は、任意に設定可能であること
を特徴とする。
【0021】上記目的を達成するため、請求項14記載
の発明は、テキストデータを合成音声に変換して出力す
る音声合成装置と、該音声合成装置に前記テキストデー
タを送信する外部装置とを具備してなる音声合成システ
ムであって、前記音声合成装置は、前記テキストデータ
の音声波形を生成する音声波形生成手段と、複数の前記
テキストデータに係る音声波形を再生する場合、前の音
声波形の再生終了後、次の音声波形の再生開始前に、予
め用意された特定の音声合成波形を再生する音声出力手
段とを有することを特徴とする。
【0022】上記目的を達成するため、請求項15記載
の発明は、前記特定の音声合成波形は、前記前の音声波
形と前記次の音声波形の間に挿入される明確に区切りと
判る音声メッセージの音声合成波形であることを特徴と
する。
【0023】上記目的を達成するため、請求項16記載
の発明は、遊園地等の各種施設で前記テキストデータを
音声放送するシステム、インターネットを介して前記テ
キストデータで会話を行うシステムに適用可能であるこ
とを特徴とする。
【0024】上記目的を達成するため、請求項17記載
の発明は、テキストデータを合成音声に変換して出力す
る音声合成装置に適用される音声合成方法であって、前
記テキストデータの音声波形を生成する音声波形生成工
程と、複数の前記テキストデータの音声波形の再生タイ
ミングの重なりを検知した場合は、音声波形の再生スピ
ードを早くして出力する音声出力工程とを有することを
特徴とする。
【0025】上記目的を達成するため、請求項18記載
の発明は、前記音声出力工程では、現時点で音声再生中
の音声波形があり且つ音声再生待ちの音声波形が一つの
場合は、通常より若干早い再生スピードで出力し、現時
点で音声再生中の音声波形があり且つ音声再生待ちの音
声波形が二つ以上の場合は、更に早い再生スピードで出
力することを特徴とする。
【0026】上記目的を達成するため、請求項19記載
の発明は、前記音声出力工程では、音声再生待ちの音声
波形の数に応じた細かいステップで再生スピードを上げ
ることが可能であることを特徴とする。
【0027】上記目的を達成するため、請求項20記載
の発明は、テキストデータを合成音声に変換して出力す
る音声合成装置に適用される音声合成方法であって、前
記テキストデータの音声波形を生成する音声波形生成工
程と、複数の前記テキストデータに係る音声波形を再生
する場合、前の音声波形の再生終了後、次の音声波形の
再生開始前に、予め定められた空白時間を設ける音声出
力工程とを有することを特徴とする。
【0028】上記目的を達成するため、請求項21記載
の発明は、前記空白時間は、任意に設定可能であること
を特徴とする。
【0029】上記目的を達成するため、請求項22記載
の発明は、テキストデータを合成音声に変換して出力す
る音声合成装置に適用される音声合成方法であって、前
記テキストデータの音声波形を生成する音声波形生成工
程と、複数の前記テキストデータに係る音声波形を再生
する場合、前の音声波形の再生終了後、次の音声波形の
再生開始前に、予め用意された特定の音声合成波形を再
生する音声出力工程とを有することを特徴とする。
【0030】上記目的を達成するため、請求項23記載
の発明は、前記特定の音声合成波形は、前記前の音声波
形と前記次の音声波形の間に挿入される明確に区切りと
判る音声メッセージの音声合成波形であることを特徴と
する。
【0031】上記目的を達成するため、請求項24記載
の発明は、遊園地等の各種施設で前記テキストデータを
音声放送するシステム、インターネットを介して前記テ
キストデータで会話を行うシステムに適用可能であるこ
とを特徴とする。
【0032】上記目的を達成するため、請求項25記載
の発明は、テキストデータを合成音声に変換して出力す
る音声合成装置に適用される音声合成方法を実行するプ
ログラムを記憶したコンピュータにより読み出し可能な
記憶媒体であって、前記音声合成方法は、前記テキスト
データの音声波形を生成するように制御する音声波形生
成ステップと、複数の前記テキストデータの音声波形の
再生タイミングの重なりを検知した場合は、音声波形の
再生スピードを早くして出力するように制御する音声出
力ステップとを有することを特徴とする。
【0033】上記目的を達成するため、請求項26記載
の発明は、前記音声出力ステップでは、現時点で音声再
生中の音声波形があり且つ音声再生待ちの音声波形が一
つの場合は、通常より若干早い再生スピードで出力する
ように制御し、現時点で音声再生中の音声波形があり且
つ音声再生待ちの音声波形が二つ以上の場合は、更に早
い再生スピードで出力するように制御することを特徴と
する。
【0034】上記目的を達成するため、請求項27記載
の発明は、前記音声出力ステップでは、音声再生待ちの
音声波形の数に応じた細かいステップで再生スピードを
上げることが可能であることを特徴とする。
【0035】上記目的を達成するため、請求項28記載
の発明は、テキストデータを合成音声に変換して出力す
る音声合成装置に適用される音声合成方法を実行するプ
ログラムを記憶したコンピュータにより読み出し可能な
記憶媒体であって、前記音声合成方法は、前記テキスト
データの音声波形を生成するように制御する音声波形生
成ステップと、複数の前記テキストデータに係る音声波
形を再生する場合、前の音声波形の再生終了後、次の音
声波形の再生開始前に、予め定められた空白時間を設け
るように制御する音声出力ステップとを有することを特
徴とする。
【0036】上記目的を達成するため、請求項29記載
の発明は、前記空白時間は、任意に設定可能であること
を特徴とする。
【0037】上記目的を達成するため、請求項30記載
の発明は、テキストデータを合成音声に変換して出力す
る音声合成装置に適用される音声合成方法を実行するプ
ログラムを記憶したコンピュータにより読み出し可能な
記憶媒体であって、前記音声合成方法は、前記テキスト
データの音声波形を生成するように制御する音声波形生
成ステップと、複数の前記テキストデータに係る音声波
形を再生する場合、前の音声波形の再生終了後、次の音
声波形の再生開始前に、予め用意された特定の音声合成
波形を再生するように制御する音声出力ステップとを有
することを特徴とする。
【0038】上記目的を達成するため、請求項31記載
の発明は、前記特定の音声合成波形は、前記前の音声波
形と前記次の音声波形の間に挿入される明確に区切りと
判る音声メッセージの音声合成波形であることを特徴と
する。
【0039】上記目的を達成するため、請求項32記載
の発明は、遊園地等の各種施設で前記テキストデータを
音声放送するシステム、インターネットを介して前記テ
キストデータで会話を行うシステムに適用可能であるこ
とを特徴とする。
【0040】上記目的を達成するため、請求項33記載
の発明は、テキストデータを合成音声に変換して出力す
る音声合成装置であって、前記テキストデータを入力す
る入力手段と、前記テキストデータの音声波形を生成す
る音声波形生成手段と、前記音声波形に係る音声を出力
する音声出力手段と、第1の前記テキストデータに係る
音声の出力中に第2の前記テキストデータの入力による
音声波形を検出した場合に、前記第1のテキストデータ
に係る音声の出力を終了した後前記第2のテキストデー
タに係る音声を出力するよう前記音声出力手段を制御す
る制御手段とを備えることを特徴とする。
【0041】上記目的を達成するため、請求項34記載
の発明は、前記制御手段は前記第2のテキストデータに
よる音声波形の検出に応じて前記第1のテキストデータ
に係る音声波形の再生速度を通常速度よりも速くするよ
う前記音声出力手段を制御することを特徴とする。
【0042】上記目的を達成するため、請求項35記載
の発明は、前記制御手段は前記第1のテキストデータに
係る音声出力の終了後、所定期間経過した後に前記第2
のテキストデータに係る音声の出力を開始するよう前記
音声出力手段を制御することを特徴とする。
【0043】上記目的を達成するため、請求項36記載
の発明は、前記制御手段は前記第1のテキストデータに
係る音声出力の終了後、所定の音声を出力した後に前記
第2のテキストデータに係る音声を出力するよう前記音
声出力手段を制御することを特徴とする。
【0044】上記目的を達成するため、請求項37記載
の発明は、前記制御手段は前記第1のテキストデータに
係る音声と前記第2のテキストデータに係る音声とを通
常の再生速度で出力することを特徴とする。
【0045】上記目的を達成するため、請求項38記載
の発明は、前記音声波形生成手段により生成された音声
波形データを記憶する記憶手段を備え、前記制御手段は
前記記憶手段に記憶されている前記入力テキストデータ
に応じた音声波形データの数に応じて前記音声波形の再
生速度を変更するよう前記音声出力手段を制御すること
を特徴とする。
【0046】上記目的を達成するため、請求項39記載
の発明は、テキストデータを合成音声に変換して出力す
る音声合成装置に適用される音声合成方法であって、前
記テキストデータを入力する入力工程と、前記テキスト
データの音声波形を生成する音声波形生成工程と、前記
音声波形に係る音声を出力する音声出力工程と、第1の
前記テキストデータに係る音声の出力中に第2の前記テ
キストデータの入力による音声波形を検出した場合に、
前記第1のテキストデータに係る音声の出力を終了した
後前記第2のテキストデータに係る音声を出力するよう
前記音声出力工程を制御する制御工程とを有することを
特徴とする。
【0047】上記目的を達成するため、請求項40記載
の発明は、前記制御工程では前記第2のテキストデータ
による音声波形の検出に応じて前記第1のテキストデー
タに係る音声波形の再生速度を通常速度よりも速くする
よう前記音声出力工程を制御することを特徴とする。
【0048】上記目的を達成するため、請求項41記載
の発明は、前記制御工程では前記第1のテキストデータ
に係る音声出力の終了後、所定期間経過した後に前記第
2のテキストデータに係る音声の出力を開始するよう前
記音声出力工程を制御することを特徴とする。
【0049】上記目的を達成するため、請求項42記載
の発明は、前記制御工程では前記第1のテキストデータ
に係る音声出力の終了後、所定の音声を出力した後に前
記第2のテキストデータに係る音声を出力するよう前記
音声出力工程を制御することを特徴とする。
【0050】上記目的を達成するため、請求項43記載
の発明は、前記制御工程では前記第1のテキストデータ
に係る音声と前記第2のテキストデータに係る音声とを
通常の再生速度で出力することを特徴とする。
【0051】上記目的を達成するため、請求項44記載
の発明は、前記音声波形生成工程により生成された音声
波形データを記憶する記憶工程を有し、前記制御工程で
は前記記憶工程に記憶されている前記入力テキストデー
タに応じた音声波形データの数に応じて前記音声波形の
再生速度を変更するよう前記音声出力工程を制御するこ
とを特徴とする。
【0052】上記目的を達成するため、請求項45記載
の発明は、テキストデータを合成音声に変換して出力す
る音声合成装置に適用される音声合成方法を実行するプ
ログラムを記憶したコンピュータにより読み出し可能な
記憶媒体であって、前記音声合成方法は、前記テキスト
データを入力する入力ステップと、前記テキストデータ
の音声波形を生成するように制御する音声波形生成ステ
ップと、前記音声波形に係る音声を出力するように制御
する音声出力ステップと、第1の前記テキストデータに
係る音声の出力中に第2の前記テキストデータの入力に
よる音声波形を検出した場合に、前記第1のテキストデ
ータに係る音声の出力を終了した後前記第2のテキスト
データに係る音声を出力するよう前記音声出力ステップ
を制御する制御ステップとを有することを特徴とする。
【0053】上記目的を達成するため、請求項46記載
の発明は、前記制御ステップでは前記第2のテキストデ
ータによる音声波形の検出に応じて前記第1のテキスト
データに係る音声波形の再生速度を通常速度よりも速く
するよう前記音声出力ステップを制御することを特徴と
する。
【0054】上記目的を達成するため、請求項47記載
の発明は、前記制御ステップでは前記第1のテキストデ
ータに係る音声出力の終了後、所定期間経過した後に前
記第2のテキストデータに係る音声の出力を開始するよ
う前記音声出力ステップを制御することを特徴とする。
【0055】上記目的を達成するため、請求項48記載
の発明は、前記制御ステップでは前記第1のテキストデ
ータに係る音声出力の終了後、所定の音声を出力した後
に前記第2のテキストデータに係る音声を出力するよう
前記音声出力ステップを制御することを特徴とする。
【0056】上記目的を達成するため、請求項49記載
の発明は、前記制御ステップでは前記第1のテキストデ
ータに係る音声と前記第2のテキストデータに係る音声
とを通常の再生速度で出力するように制御することを特
徴とする。
【0057】上記目的を達成するため、請求項50記載
の発明は、前記音声波形生成ステップにより生成された
音声波形データを記憶するように制御する記憶ステップ
を有し、前記制御ステップでは前記記憶ステップに記憶
されている前記入力テキストデータに応じた音声波形デ
ータの数に応じて前記音声波形の再生速度を変更するよ
う前記音声出力ステップを制御することを特徴とする。
【0058】
【発明の実施の形態】以下、本発明の実施の形態を図面
に基づいて詳細に説明する。
【0059】[第1の実施の形態]本発明の第1の実施
の形態は、他のコンピュータ(サーバコンピュータ)か
ら非同期に送られてくるテキストデータを音声出力する
システムにおいて、1つのテキストデータの音声出力が
終了する前に、次のテキストデータが送られてきた時、
先に音声出力中の発声スピードを早くして出力するシス
テムである。
【0060】図1は本発明の第1の実施の形態に係る音
声合成装置の構成例を示すブロック図である。本発明の
第1の実施の形態に係る音声合成装置は、CPU10
1、ハードディスクコントローラ(HDC)102、プ
ログラム113・辞書114・音声素片データ115を
有するハードディスク(HD)103、キーボード10
4、ポインティングデバイス(PD)105、RAM1
06、通信回線インターフェイス(I/F)107、V
RAM108、表示コントローラ109、モニタ11
0、サウンドカード111、スピーカ112を備えてい
る。図中150はサーバコンピュータである。
【0061】上記各部の構成を詳述すると、CPU10
1は、本装置全体の制御を行う中央演算処理装置であ
り、後述の図4のフローチャートに示す処理を実行す
る。ハードディスクコントローラ102は、ハードディ
スク103内のデータやプログラムの制御を行う。ハー
ドディスク103内には、プログラム113と、音声波
形生成部(後述)において入力された漢字かな混じり文
を解析し読み情報を得る時に参照される漢字等の読みや
アクセント情報が登録されている辞書114と、発声す
る文字列に従って音声の素片を接続する際に必要になる
音声素片データ115が格納されている。
【0062】キーボード104は、文字・数字・記号等
の入力に用いる。ポインティングデバイス105は、プ
ログラム開始などの指示に用いるものであり、例えばマ
ウスやディジタイザなどから構成されている。RAM1
06は、プログラムやデータを格納する。通信回線イン
ターフェイス107は、外部のサーバコンピュータ15
0との間でデータのやり取りを行う。本実施形態では通
信形態はTCP/IP(Transmission Control Protoco
l/Internet Protocol)を用いている。表示コントロー
ラ109は、VRAM108に格納された映像データを
映像信号としてモニタ110に出力する制御を行う。サ
ウンドカード111は、CPU101で生成されRAM
106に格納された音声波形データをスピーカ112を
通して出力している。
【0063】図2は本発明の第1の実施の形態に係る音
声合成装置のプログラムのモジュール関係を示す説明図
である。本発明の第1の実施の形態に係る音声合成装置
は、辞書114、音声素片データ115、メインルーチ
ン初期化部201、音声処理初期化部202、通信デー
タ処理部204、通信データ格納部206、表示文章デ
ータ格納部207、文章表示部208、音声波形生成部
209(音声波形生成手段)、音声出力部210(音声
出力手段)、初期化部203・受信部205を有する通
信処理部211、音響パラメータ212、出力パラメー
タ213を備えている。
【0064】上記各部の機能を詳述すると、本実施形態
のシステムが起動すると、先ず、メインルーチン220
のメインルーチン初期化部201にてプログラム全体の
初期化が行われる。次に、通信処理部211の初期化部
203にて通信部230の初期化が行われ、音声処理初
期化部202にて音声部240の初期化が行われる。本
実施形態では通信形態はTCP/IPを用いている。
【0065】通信処理部211の初期化部203にて通
信部230の初期化が終了すると、通信処理部211の
受信部205が起動し、サーバコンピュータ150から
音声合成装置に送信されるテキストデータを受信できる
ようになる。通信処理部211の受信部205にてこの
テキストデータを受信すると、受信されたテキストデー
タは通信データ格納部206に格納される。
【0066】メインルーチン初期化部201にてメイン
ルーチン220全体の初期化が終了すると、通信データ
処理部204は通信データ格納部206の監視を開始す
る。受信されたテキストデータが通信データ格納部20
6に格納されると、通信データ処理部204はそのテキ
ストデータを読み込み、モニタ110に表示するための
表示文章を格納する表示文章データ格納部207にテキ
ストデータを格納する。
【0067】文章表示部208は、表示文章データ格納
部207にデータがあるのを検知すると、そのデータを
モニタ110に表示できる形態に変換して、VRAM1
08上に置く。この結果、モニタ110に表示文章が表
示されることになる。この際、テキストデータに何らか
の処理を施して表示文章とする場合は、その処理を通信
データ処理部204にて行う。
【0068】また、通信データ処理部204は、受信さ
れたテキストデータを音声波形生成部209に送り、音
声波形生成部209にてテキストデータの音声波形の生
成を行う。その際、テキストデータに何らかの処理を施
して音声波形を生成する場合は、その処理を通信データ
処理部204にて行う。音声波形生成部209にて辞書
114、音声素片データ115、音響パラメータ212
を参照しながら、受信したテキストデータの音声波形を
生成する。生成された波形は、音声出力部210に渡さ
れる。
【0069】図3は本発明の第1の実施の形態に係る音
声合成装置の音声出力部210の詳細構成を示す説明図
である。本発明の第1の実施の形態に係る音声合成装置
の音声出力部210は、一時蓄積部301、コントロー
ル部302、音声再生部304を備えている。図中30
3は音声波形である。
【0070】上記各部の機能を詳述すると、一時蓄積部
301は、音声波形生成部209より送られてきた音声
波形303を一時的に蓄積する。コントロール部302
は、音声出力部210の全体をコントロールするもので
あり、常時、一時蓄積部301に音声波形303が送ら
れてきたかどうかをチェックしており、音声波形303
が送られてきた場合は、送られてきた順番に音声再生部
304に送って音声再生を実行させる。この時、音声再
生部304で現在音声再生が実行中の場合は、その再生
が終了するのを待ってから、次の音声再生を開始させる
ようになっている。
【0071】音声再生部304は、上記図2の出力パラ
メータ213から、音声出力に必要な予め設定されたパ
ラメータ(サンプリングレート、データのビット数等の
こと)に従って、音声波形303の再生を実行し、再生
された音声データは上記図1のスピーカ112から出力
される。尚、音声再生部304は、コントロール部30
2からの指示に従って、音声再生のスピードを調整でき
るように構成されている。
【0072】図12は本発明の音声合成方法を実行する
プログラム及び関連データが記憶媒体から装置に供給さ
れる概念例を示す説明図である。本発明の音声合成方法
を実行するプログラム及び関連データは、フロッピディ
スクやCD−ROM等の記憶媒体1201を装置120
2に装備された記憶媒体ドライブ挿入口1203に挿入
することで供給される。その後、プログラム及び関連デ
ータを記憶媒体1201から一旦ハードディスクにイン
ストールしハードディスクからRAMにロードするか、
或いはハードディスクにインストールせずに直接RAM
にロードすることで、プログラム及び関連データを実行
することが可能となる。
【0073】この場合、本発明の第1〜第3の実施の形
態に係る音声合成装置において本発明の音声合成方法を
実行するプログラムを実行する場合は、上記図12を参
照して説明したような手順で音声合成装置にプログラム
及び関連データを供給するか、或いは音声合成装置に予
めプログラム及び関連データを格納しておくことで、プ
ログラム実行が可能となる。
【0074】図11は本発明の音声合成方法を実行する
プログラム及び関連データを記憶した記憶媒体の記憶内
容の構成例を示す説明図である。記憶媒体は、例えばボ
リューム情報1101、ディレクトリ情報1102、プ
ログラム実行ファイル1103(図1や後述の図7の、
プログラム113に相当)、プログラム関連データファ
イル1104(図1や後述の図7の、辞書114、音声
素片データ115等に相当)等の記憶内容で構成され
る。本発明の音声合成方法を実行するプログラムは、後
述の図4(第1の実施の形態)、図5・図6(第2の実
施の形態)、図9・図10(第3の実施の形態)のフロ
ーチャートに基づきプログラムコード化されたものであ
る。
【0075】次に、上記の如く構成された本発明の第1
の実施の形態に係る音声合成装置の動作を図4を参照し
ながら詳細に説明する。下記の処理は上記図1に示した
CPU101の制御のもとに実行される。
【0076】図4は音声合成装置の音声波形生成部20
9から音声波形が音声出力部210に送られてきた時に
実行される音声再生スピードの調整処理に関する流れ図
である。音声波形生成部209から音声波形が音声出力
部210に送られてきた時、先ずステップS401で、
音声出力部210のコントロール部302は音声再生部
304の動作状態を調べて、現在音声を出力中かどうか
を確認する。その結果、音声を出力中でなければ、ステ
ップS402にて、音声の再生スピードを通常のスピー
ドに設定する。現在音声を出力中の場合は、ステップS
403に進んで、コントロール部302は現在幾つの再
生待ちの音声波形が一時蓄積部301にあるかを調べ
る。
【0077】この結果、現在再生待ちの音声波形が1つ
だけ(即ち、今送られてきた音声波形だけ)の場合は、
ステップS404に進んで、音声の再生スピードを予め
定められた第1の値まで早くした設定値に設定する。他
方、現在再生待ちの音声波形が2つ以上(即ち、今送ら
れてきた音声波形以外にも再生待ちの音声波形がある)
場合は、ステップS405に進んで、音声の再生スピー
ドを予め定められた第1の値より、より早い値に設定さ
れた第2の値まで早くした設定値に設定する。
【0078】この後、ステップS406に進んで、コン
トロール部302から音声再生部304に対して、上記
ステップS402、ステップS404、ステップS40
5で設定された再生スピードへの設定を実行する。これ
によって、その時点から音声波形再生のスピードが変化
するのである。
【0079】上記図4の流れ図の処理の結果、現在音声
再生中でない場合は、通常の再生スピードで再生し(そ
の時点からの再生スピードの変更となるため、この場合
は、今、音声出力部210に送られてきた音声波形30
3の再生スピードが通常の再生スピードとなる)、現在
再生中の音声波形はあるが、再生待ちの音声波形が1つ
だけの場合は、少し早い再生スピードで再生し(その時
点からの再生スピードの変更となるため、この場合は、
今再生中の音声波形303の再生スピードが少し早くな
って再生される)、現在再生中の音声波形があり、且つ
再生待ちの音声波形が2つ以上の場合は、更に早い再生
スピードで再生する(その時点からの再生スピードの変
更となるため、この場合は、今再生中の音声波形303
の再生スピードが更に早くなって再生される)ことにな
るのである。
【0080】従って、複数の音声再生の要求が来た場合
でも、音声再生の重なりが生じて聞き取りにくくなるこ
ともなく、また、音声再生までの待ち時間が極力少ない
状態で、再生された音声を聞くことができるようになる
のである。尚、上記ステップS405において、再生待
ちの音声波形の数に応じて、もっと細かいステップで再
生スピードを上げるように設定することも可能である。
【0081】以上説明したように、本発明の第1の実施
の形態に係る音声合成装置によれば、複数の音声出力が
送られて来た時、音声の再生が重なって聞き取りにくく
なることもなく、再生順番待ちの時間も極力少ない状態
で音声再生を聞けるようになるという効果を奏する。
【0082】本実施形態を用いれば、例えば遊園地で各
場所から送られてきたテキスト情報を、サーバコンピュ
ータを介して音声放送するシステムにおいて、送られて
きた情報が一時的に重なった場合でも、重なって再生さ
れて聞き取りにくくなることもなく、また、再生順番待
ちの時間も極力少ない状態で再生音声を聞けるようにな
るという効果を奏する。
【0083】また、本実施形態を用いれば、例えばイン
ターネットで接続された複数のユーザ同士がサーバコン
ピュータを介してテキストデータで会話を行うチャット
システムにおいて、サーバコンピュータから送られてき
た他のユーザの発言であるテキストデータを音声出力す
る際に、複数のユーザからのテキストデータの音声出力
が重なりそうになった場合に、音声が重なって再生され
て聞き取りにくくなることもなく、また、再生順番待ち
の時間も極力少ない状態で再生音声を聞けるようになる
という効果を奏する。
【0084】[第2の実施の形態]本発明の第2の実施
の形態は、他のコンピュータ(サーバコンピュータ)か
ら非同期に送られてくるテキストデータを音声出力する
システムにおいて、1つのテキストデータの音声出力が
終了する前に、次のテキストデータが送られてきた時、
先に音声出力中の音声の発声が終わった後、次の合成音
声の発声を始める前に、予め定められた空白時間を設け
るシステムである。また、前述の実施形態では1つのテ
キストデータの音声出力中に次の合成音声波形を検出し
た場合、各音声の再生速度を早くしたが、本形態では、
両者の再生速度を特に早くせず、通常の再生速度で出力
するものとする。
【0085】本発明の第2の実施の形態に係る音声合成
装置は、上記第1の実施の形態と同様に、CPU10
1、ハードディスクコントローラ(HDC)102、プ
ログラム113・辞書114・音声素片データ115を
有するハードディスク(HD)103、キーボード10
4、ポインティングデバイス(PD)105、RAM1
06、通信回線インターフェイス(I/F)107、V
RAM108、表示コントローラ109、モニタ11
0、サウンドカード111、スピーカ112を備えてい
る(上記図1参照)。尚、CPU101は、後述の図
5、図6のフローチャートに示す処理を実行する。音声
合成装置の各部の構成は上記第1の実施の形態で詳述し
たので説明を省略する。
【0086】また、本発明の第2の実施の形態に係る音
声合成装置のプログラムモジュールは、上記第1の実施
の形態と同様に、辞書114、音声素片データ115、
メインルーチン初期化部201、音声処理初期化部20
2、通信データ処理部204、通信データ格納部20
6、表示文章データ格納部207、文章表示部208、
音声波形生成部209、音声出力部210、初期化部2
03・受信部205を有する通信処理部211、音響パ
ラメータ212、出力パラメータ213を備えている
(上記図2参照)。音声合成装置のプログラムモジュー
ルの構成は上記第1の実施の形態で詳述したので説明を
省略する。
【0087】また、本発明の第2の実施の形態に係る音
声合成装置の音声出力部210は、上記第1の実施の形
態と同様に、一時蓄積部301、コントロール部30
2、音声再生部304を備えている(上記図3参照)。
尚、音声再生部304で現在音声再生が実行中の場合
は、その再生が終了するのを待つようになっている。音
声出力部210の各部の構成は上記第1の実施の形態で
詳述したので説明を省略する。
【0088】次に、上記の如く構成された本発明の第2
の実施の形態に係る音声合成装置の動作を図5、図6を
参照しながら詳細に説明する。下記の処理は上記図1に
示したCPU101の制御のもとに実行される。
【0089】図5は音声合成装置の音声波形生成部20
9から音声波形が音声出力部210に送られてきた時に
実行される再生時の繋がりのチェックに関する流れ図で
ある。音声波形が音声出力部210に送られてきた時、
先ずステップS501で、音声出力部210のコントロ
ール部302は現在幾つの再生待ちの音声波形が一時蓄
積部301にあるか調べる。この結果、現在再生待ちの
音声波形が1つだけ(即ち、今送られてきた音声波形だ
け)の場合は、ステップS502に進む。他方、現在再
生待ちの音声波形が2つ以上(即ち、今送られてきた音
声波形以外にも再生待ちの音声波形がある)の場合は、
ステップS505に進む。
【0090】次にステップS502では、コントロール
部302は音声再生部304の動作状態を調べて、現在
音声を出力中かどうかを確認する。その結果、音声を出
力中でなければ、ステップS503に進み、現在音声を
出力中の場合は、ステップS505に進む。次にステッ
プS503では、最終の音声出力の終了後、どの程度の
時間が経過しているかをチェックする。その時間が、予
め定められた所定の時間より短い場合は、ステップS5
06に進み、予め定められた所定の時間より同じか長い
場合は、ステップS504に進む。
【0091】ステップS504は、今届いた音声波形以
外に再生待ちの音声はなく、且つ、現在再生中の音声も
なく、更に、最後に再生された音声が終了してから予め
定められた所定の時間以上の時間が経過している場合に
実行されるステップで、ここでは、予め定められた所定
時間の空白は設けないというフラグの設定を行って、こ
のフローの処理を終了する。
【0092】ステップS505は、今届いた音声波形以
外に再生待ちの音声があるか、且つ、現在再生中の音声
がある場合に実行されるステップで、ここでは、予め定
められた所定時間の空白を設けるというフラグの設定を
行って、このフローの処理を終了する。この場合、上記
所定時間は任意に設定可能である。
【0093】ステップS506は、最後に再生された音
声が終了してから予め定められた所定の時間が経過して
ない場合に実行されるステップで、ここでは、予め定め
られた所定時間までの不足時間の空白を設けるというフ
ラグの設定と、その不足時間の設定を行って、このフロ
ーの処理を終了する。不足時間Tは、予め定められた所
定時間をt0、最後に再生された音声が終了してからの
経過時間をt1とした時に、 T=t0−t1 で求めることができる。
【0094】図6は実際の音声波形再生を実行する処理
の流れ図である。先ずステップS601で、音声出力部
210のコントロール部302は、現在再生待ちの音声
波形が一時蓄積部301にあるかどうかを調べる。再生
待ちの音声波形が一時蓄積部301にない場合は、上記
ステップS601を繰り返して、音声波形が到着するの
を待つ。ステップS602では、再生待ちの音声波形が
一時蓄積部301にある場合に、上記図5の流れ図で示
される所定時間の空白の有無を示すフラグの設定が済ん
でいるかを確認する。まだフラグの設定が終わっていな
い場合は、上記ステップS602を繰り返して、フラグ
が設定されるのを待つ。
【0095】次にステップS603で、どのようなフラ
グが設定されたかを確認する。フラグが「所定時間の空
白あり」に設定されている場合は、ステップS604に
進んで、コントロール部302は予め定められた所定時
間が経過するのを待ち、ステップS605に進む。この
ステップS605で、予め定められた所定時間が経過す
るのを待つことにより、この間の音声再生が行われない
ため、所定の空白時間、即ち、無音の時間が生まれるの
である。
【0096】上記ステップS603でフラグが「不足時
間あり」に設定されている時は、ステップS607に進
んで、コントロール部302は不足時間が経過するのを
待ち、ステップS605に進む。このステップS605
で、不足時間が経過するのを待つことにより、この間の
音声再生が行われないため、最後に再生された音声が終
了してからの時間を加えて、所定の空白時間、即ち、無
音の時間が生まれるのである。
【0097】ステップS605は、ステップS603で
フラグが所定時間の空白なしに設定されている場合と、
ステップS604またはステップS607で所定時間・
もしくは不足時間の経過を待った後で実行されるステッ
プで、一時蓄積部301に蓄積されている最初の音声波
形303を音声再生部304で再生開始する。この後、
ステップS606で、この音声波形の再生が終了するを
待って、上記ステップS601に戻る。
【0098】このようにすることで、複数の音声再生の
要求が重なって送られてきて、そのまま再生すると、音
声が繋がってしまい、音声情報の区切りが判りづらくな
るのに対し、音声情報の間に、明らかに区切りとわかる
予め定められた空白を入れることにより、聞く人は容易
に情報の区切りを区別できるようになるのである。
【0099】以上説明したように、本発明の第2の実施
の形態に係る音声合成装置によれば、複数の音声出力が
送られてきた時、明らかに区切りとわかる予め定められ
た空白の挿入により、音声の再生が繋がってしまうこと
がなくなり、音声情報の区切りが明確にわかるので、音
声情報を容易に区別して聞けるようになるという効果を
奏する。
【0100】本実施形態を用いれば、例えば遊園地で各
場所から送られてきたテキスト情報を、サーバコンピュ
ータを介して音声放送するシステムにおいて、情報が一
時的に重なって送られてきた結果、音声が繋がって再生
されそうになった場合でも、音声情報の区切りが明確に
わかるので、音声情報を容易に区別して聞けるようにな
るという効果を奏する。
【0101】また、本実施形態を用いれば、例えばイン
ターネットで接続された複数のユーザ同士がサーバコン
ピュータを介してテキストデータで会話を行うチャット
システムにおいて、サーバコンピュータから送られてき
た他のユーザの発言であるテキストデータを音声出力す
る際に、複数のユーザからのテキストデータが一時的に
重なって送られてきた結果、音声が繋がって再生されそ
うになった場合でも、音声情報の区切りが明確にわかる
ので、音声情報を容易に区別して聞けるようになるとい
う効果を奏する。
【0102】[第3の実施の形態]本発明の第3の実施
の形態は、他のコンピュータ(サーバコンピュータ)か
ら非同期に送られてくるテキストデータを音声出力する
システムにおいて、1つのテキストデータの音声出力が
終了する前に、次のテキストデータが送られてきた時、
先に音声出力中の音声の発声が終わった後、次の合成音
声の発声を始める前に、例えば「次のお知らせをいたし
ます」のような、予め用意された特定の合成音声の発声
を行わせるシステムである。
【0103】図7は本発明の第3の実施の形態に係る音
声合成装置の構成例を示すブロック図である。本発明の
第3の実施の形態に係る音声合成装置は、CPU10
1、ハードディスクコントローラ(HDC)102、プ
ログラム113・辞書114・音声素片データ115・
特定音声合成波形116を有するハードディスク(H
D)103、キーボード104、ポインティングデバイ
ス(PD)105、RAM106、通信回線インターフ
ェイス(I/F)107、VRAM108、表示コント
ローラ109、モニタ110、サウンドカード111、
スピーカ112を備えている。図中150はサーバコン
ピュータである。
【0104】第3の実施の形態が上記第1〜第2の実施
の形態と相異する点を説明すると、CPU101は、図
9、図10のフローチャートに示す処理を実行する。ハ
ードディスク103内に格納された特定音声合成波形1
16は、2つの音声合成が繋がりそうな場合に使用され
る、例えば「次のお知らせをいたします」のような、特
定の音声合成波形である。音声合成装置の各部の構成は
上記第1の実施の形態で詳述したので説明を省略する。
【0105】図8は本発明の第3の実施の形態に係る音
声合成装置のプログラムのモジュール関係を示す説明図
である。本発明の第3の実施の形態に係る音声合成装置
は、辞書114、音声素片データ115、メインルーチ
ン初期化部201、音声処理初期化部202、通信デー
タ処理部204、通信データ格納部206、表示文章デ
ータ格納部207、文章表示部208、音声波形生成部
209、音声出力部210、初期化部203・受信部2
05を有する通信処理部211、音響パラメータ21
2、出力パラメータ213、特定音声合成波形116を
備えている。音声合成装置の特定音声合成波形116以
外の、プログラムモジュールの各部の構成は上記第1の
実施の形態で詳述したので説明を省略する。
【0106】また、本発明の第3の実施の形態に係る音
声合成装置の音声出力部210は、上記第1の実施の形
態と同様に、一時蓄積部301、コントロール部30
2、音声再生部304を備えている(上記図3参照)。
尚、音声再生部304は、コントロール部302からの
指示に従って、上記図8に示された特定音声合成波形1
16の再生もできるようになっている。音声出力部21
0の各部の構成は上記第1の実施の形態で詳述したので
説明を省略する。
【0107】次に、上記の如く構成された本発明の第3
の実施の形態に係る音声合成装置の動作を図9、図10
を参照しながら詳細に説明する。下記の処理は上記図1
に示したCPU101の制御のもとに実行される。
【0108】図9は音声合成装置の音声波形生成部20
9から音声波形が音声出力部210に送られてきた時に
実行される再生時の繋がりのチェックに関する流れ図で
ある。音声波形が音声出力部210に送られてきた時、
先ずステップS901で、音声出力部210のコントロ
ール部302は現在幾つの再生待ちの音声波形が一時蓄
積部301にあるか調べる。この結果、現在再生待ちの
音声波形が1つだけ(即ち、今送られてきた音声波形だ
け)の場合は、ステップS902に進む。他方、現在再
生待ちの音声波形が2つ以上(即ち、今送られてきた音
声波形以外にも再生待ちの音声波形がある)の場合は、
ステップS905に進む。
【0109】次にステップS902では、コントロール
部302は音声再生部304の動作状態を調べて、現在
音声を出力中かどうかを確認する。その結果、音声を出
力中でなければ、ステップS903に進み、現在音声を
出力中の場合は、ステップS905に進む。次にステッ
プS903では、最終の音声出力の終了後、どの程度の
時間が経過しているかをチェックする。その時間が、予
め定められた所定の時間より短い場合は、ステップS9
05に進み、予め定められた所定の時間より同じか長い
場合は、ステップS904に進む。
【0110】ステップS904は、今届いた音声波形以
外に再生待ちの音声はなく、且つ、現在再生中の音声も
なく、更に、最後に再生された音声が終了してから予め
定められた所定の時間以上の時間が経過している場合に
実行されるステップで、ここでは、特定音声合成波形の
再生は行わないというフラグの設定を行って、このフロ
ーの処理を終了する。ステップS905は、今届いた音
声波形以外に再生待ちの音声があるか、現在再生中の音
声があるか、最後に再生された音声が終了してから予め
定められた所定の時間以上の時間が経過していない場合
に実行されるステップで、ここでは、特定音声合成波形
の再生を行うというフラグの設定を行って、このフロー
の処理を終了する。
【0111】図10は実際の音声波形再生を実行する処
理の流れ図である。先ずステップS1001で、音声出
力部210のコントロール部302は、現在再生待ちの
音声波形が一時蓄積部301にあるかどうかを調べる。
再生待ちの音声波形が一時蓄積部301にない場合は、
上記ステップS1001を繰り返して、音声波形が到着
するのを待つ。ステップS1002では、再生待ちの音
声波形が一時蓄積部301にある場合に、上記図9の流
れ図で示される特定音声合成波形の再生の有無を示すフ
ラグの設定を確認する。まだフラグの設定が終わってい
ない場合は、上記ステップS1002を繰り返して、フ
ラグが設定されるのを待つ。
【0112】フラグが「再生あり」に設定されている場
合は、ステップS1003に進んで、コントロール部3
02は上記図8の116に示される特定音声合成波形を
読み出して、音声再生部304で再生を開始する。ステ
ップS1004では、このステップS1003で開始し
た特定音声合成波形の再生が終了するのを待ち、ステッ
プS1005に進む。
【0113】ステップS1005は、上記ステップS1
002でフラグが「再生なし」に設定されている場合
と、上記ステップS1003とステップS1004で特
定音声合成波形の再生が終了した後に実行されるステッ
プで、この音声波形を音声再生部304で再生を開始す
る。この後、ステップS1006で、この音声波形の再
生が終了するのを待って、上記ステップS1001に戻
る。
【0114】このようにすることで、複数の音声再生の
要求が重なって送られてきて、そのまま再生すると、音
声が繋がってしまい、音声情報の区切りが判りずらくな
るのに対し、音声情報の間に、明らかに区切りとわか
る、例えば「次のお知らせをいたします」のような、特
定の音声合成波形の再生を入れることにより、聞く人は
容易に情報の区切りを区別できるようになるのである。
【0115】以上説明したように、本発明の第3の実施
の形態に係る音声合成装置によれば、複数の音声出力が
送られてきた時、音声の再生が繋がって聞き取りにくく
なっても、明らかに区切りとわかる特定の音声合成波形
の挿入により、音声情報の区切りが明確にわかるので、
音声情報を容易に区別して聞けるようになるという効果
を奏する。
【0116】本実施形態を用いれば、例えば遊園地で各
場所から送られてきたテキスト情報を、サーバコンピュ
ータを介して音声放送するシステムにおいて、情報が一
時的に重なって送られてきた結果、音声が繋がって再生
された場合でも、音声情報の区切りが明確にわかるの
で、音声情報を容易に区別して聞けるようになるという
効果を奏する。
【0117】また、本実施形態を用いれば、例えばイン
ターネットで接続された複数のユーザ同士がサーバコン
ピュータを介してテキストデータで会話を行うチャット
システムにおいて、サーバコンピュータから送られてき
た他のユーザの発言であるテキストデータを音声出力す
る際に、複数のユーザからのテキストデータが一時的に
重なって送られてきた結果、音声が繋がって再生された
場合でも、音声情報の区切りが明確にわかるので、音声
情報を容易に区別して聞けるようになるという効果を奏
する。
【0118】[他の実施の形態]上述した本発明の実施
の形態においては、音声合成装置を適用する具体例とし
て、遊園地でテキストデータを音声放送する場合を例に
上げたが、これ以外に、例えばモーターショー等の各種
催事施設における催事案内/館内呼出し等に関する音声
放送、カーレース場等の各種スポーツ施設におけるレー
ス競技案内/館内呼出し等に関する音声放送など、各種
分野に適用可能であり、上記実施形態と同様の効果が得
られる。
【0119】尚、本発明は、複数の機器から構成される
システムに適用しても、1つの機器からなる装置に適用
してもよい。上述した実施形態の機能を実現するソフト
ウエアのプログラムコードを記憶した記憶媒体を、シス
テム或いは装置に供給し、そのシステム或いは装置のコ
ンピュータ(またはCPUやMPU)が記憶媒体等の媒
体に格納されたプログラムコードを読み出し実行するこ
とによっても、達成されることは言うまでもない。
【0120】この場合、記憶媒体等の媒体から読み出さ
れたプログラムコード自体が上述した実施形態の機能を
実現することになり、そのプログラムコードを記憶した
記憶媒体等の媒体は本発明を構成することになる。プロ
グラムコードを供給するための記憶媒体等の媒体として
は、例えば、フロッピディスク、ハードディスク、光デ
ィスク、光磁気ディスク、CD−ROM、CD−R、磁
気テープ、不揮発性のメモリカード、ROM、或いはネ
ットワークを介してのダウンロードなどの方法を用いる
ことができる。
【0121】また、コンピュータが読み出したプログラ
ムコードを実行することにより、上述した実施形態の機
能が実現されるだけでなく、そのプログラムコードの指
示に基づき、コンピュータ上で稼働しているOSなどが
実際の処理の一部または全部を行い、その処理によって
上述した実施形態の機能が実現される場合も含まれるこ
とは言うまでもない。
【0122】更に、記憶媒体等の媒体から読出されたプ
ログラムコードが、コンピュータに挿入された機能拡張
ボードやコンピュータに接続された機能拡張ユニットに
備わるメモリに書込まれた後、そのプログラムコードの
指示に基づき、その機能拡張ボードや機能拡張ユニット
に備わるCPUなどが実際の処理の一部または全部を行
い、その処理によって上述した実施形態の機能が実現さ
れる場合も含まれることは言うまでもない。
【0123】
【発明の効果】以上説明したように、請求項1〜3、8
記載の音声合成装置、請求項9〜11、16記載の音声
合成システム、請求項17〜19、24記載の音声合成
方法、請求項25〜27、32記載の記憶媒体によれ
ば、複数のテキストデータの合成音声の再生タイミング
が重なってしまうのを検知した場合、現在再生中の音声
波形の有無や再生待ちの音声波形の数に応じて、音声再
生のスピードを早くすることによって、複数のテキスト
データが同時に発声されて聞き取りにくくなることもな
く、また、音声再生までの待ち時間が極力少ない状態
で、再生された音声を聞けるようになるという効果を奏
する。
【0124】また、請求項4〜5、8記載の音声合成装
置、請求項12〜13、16記載の音声合成システム、
請求項20〜21、24記載の音声合成方法、請求項2
8〜29、32記載の記憶媒体によれば、複数のテキス
トデータの合成音声の再生タイミングが繋がってしまう
のを検知した場合、現在再生中の音声波形の後に、区切
りを明確にするための予め定められた空白時間を設ける
ことによって、複数のテキストデータが繋がってしまう
ことがなくなり、音声情報の区切りが明確にわかるの
で、音声情報を容易に区別して聞けるようになるという
効果を奏する。
【0125】また、請求項6〜7、8記載の音声合成装
置、請求項14〜15、16記載の音声合成システム、
請求項22〜23、24記載の音声合成方法、請求項3
0〜31、32記載の記憶媒体によれば、複数のテキス
トデータの合成音声の再生タイミングが繋がってしまう
のを検知した場合、現在再生中の音声波形の後に、別の
情報であることを判らせる特定の音声合成波形の再生を
行うことによって、複数のテキストデータが繋がって発
声された場合でも、音声情報の区切りが明確にわかるの
で、音声情報を容易に区別して聞けるようになるという
効果を奏する。
【0126】また、請求項33〜38記載の音声合成装
置、請求項39〜44記載の音声合成方法、請求項45
〜50記載の記憶媒体においても、上記と同様に、複数
のテキストデータが同時に発声されて聞き取りにくくな
ることもなく、また、音声再生までの待ち時間が極力少
ない状態で、再生された音声を聞けるようになるという
効果を奏する。
【図面の簡単な説明】
【図1】本発明の第1〜第2の実施の形態に係る音声合
成装置の全体構成例を示すブロック図である。
【図2】本発明の第1〜第2の実施の形態に係る音声合
成装置のプログラムのモジュールの構成例を示す説明図
である。
【図3】本発明の第1〜第3の実施の形態に係る音声合
成装置のプログラムのモジュールにおける音声出力部の
詳細構成例を示す説明図である。
【図4】本発明の第1の実施の形態に係る音声合成装置
の音声波形生成部から音声波形が音声出力部に送られて
きた時に実行する音声再生スピードの調整処理を示す流
れ図である。
【図5】本発明の第2の実施の形態に係る音声合成装置
の音声波形生成部から音声波形が音声出力部に送られて
きた時に実行する音声の繋がりのチェック処理を示す流
れ図である。
【図6】本発明の第2の実施の形態に係る音声合成装置
の音声出力部で実際の音声波形再生を実行する処理を示
す流れ図である。
【図7】本発明の第3の実施の形態に係る音声合成装置
の全体構成例を示すブロック図である。
【図8】本発明の第3の実施の形態に係る音声合成装置
のプログラムのモジュールの構成例を示す説明図であ
る。
【図9】本発明の第3の実施の形態に係る音声合成装置
の音声波形生成部から音声波形が音声出力部に送られて
きた時に実行する音声の繋がりのチェック処理を示す流
れ図である。
【図10】本発明の第3の実施の形態に係る音声合成装
置の音声出力部で実際の音声波形再生を実行する処理を
示す流れ図である。
【図11】本発明の音声合成方法を実行するプログラム
及び関連データを記憶した記憶媒体の記憶内容の構成例
を示す説明図である。
【図12】本発明の音声合成方法を実行するプログラム
及び関連データが記憶媒体から装置に供給される概念例
を示す説明図である。
【符号の説明】
101 CPU 116 特定音声合成波形 209 音声波形生成部 210 音声出力部 303 音声波形

Claims (50)

    【特許請求の範囲】
  1. 【請求項1】 テキストデータを合成音声に変換して出
    力する音声合成装置であって、 前記テキストデータの音声波形を生成する音声波形生成
    手段と、複数の前記テキストデータの音声波形の再生タ
    イミングの重なりを検知した場合は、音声波形の再生ス
    ピードを早くして出力する音声出力手段とを有すること
    を特徴とする音声合成装置。
  2. 【請求項2】 前記音声出力手段は、現時点で音声再生
    中の音声波形があり且つ音声再生待ちの音声波形が一つ
    の場合は、通常より若干早い再生スピードで出力し、現
    時点で音声再生中の音声波形があり且つ音声再生待ちの
    音声波形が二つ以上の場合は、更に早い再生スピードで
    出力することを特徴とする請求項1記載の音声合成装
    置。
  3. 【請求項3】 前記音声出力手段は、音声再生待ちの音
    声波形の数に応じた細かいステップで再生スピードを上
    げることが可能であることを特徴とする請求項1又は2
    記載の音声合成装置。
  4. 【請求項4】 テキストデータを合成音声に変換して出
    力する音声合成装置であって、 前記テキストデータの音声波形を生成する音声波形生成
    手段と、複数の前記テキストデータに係る音声波形を再
    生する場合、前の音声波形の再生終了後、次の音声波形
    の再生開始前に、予め定められた空白時間を設ける音声
    出力手段とを有することを特徴とする音声合成装置。
  5. 【請求項5】 前記空白時間は、任意に設定可能である
    ことを特徴とする請求項4記載の音声合成装置。
  6. 【請求項6】 テキストデータを合成音声に変換して出
    力する音声合成装置であって、 前記テキストデータの音声波形を生成する音声波形生成
    手段と、複数の前記テキストデータに係る音声波形を再
    生する場合、前の音声波形の再生終了後、次の音声波形
    の再生開始前に、予め用意された特定の音声合成波形を
    再生する音声出力手段とを有することを特徴とする音声
    合成装置。
  7. 【請求項7】 前記特定の音声合成波形は、前記前の音
    声波形と前記次の音声波形の間に挿入される明確に区切
    りと判る音声メッセージの音声合成波形であることを特
    徴とする請求項6記載の音声合成装置。
  8. 【請求項8】 遊園地等の各種施設で前記テキストデー
    タを音声放送するシステム、インターネットを介して前
    記テキストデータで会話を行うシステムに適用可能であ
    ることを特徴とする請求項1乃至7の何れかに記載の音
    声合成装置。
  9. 【請求項9】 テキストデータを合成音声に変換して出
    力する音声合成装置と、該音声合成装置に前記テキスト
    データを送信する外部装置とを具備してなる音声合成シ
    ステムであって、 前記音声合成装置は、前記テキストデータの音声波形を
    生成する音声波形生成手段と、複数の前記テキストデー
    タの音声波形の再生タイミングの重なりを検知した場合
    は、音声波形の再生スピードを早くして出力する音声出
    力手段とを有することを特徴とする音声合成システム。
  10. 【請求項10】 前記音声合成装置の前記音声出力手段
    は、現時点で音声再生中の音声波形があり且つ音声再生
    待ちの音声波形が一つの場合は、通常より若干早い再生
    スピードで出力し、現時点で音声再生中の音声波形があ
    り且つ音声再生待ちの音声波形が二つ以上の場合は、更
    に早い再生スピードで出力することを特徴とする請求項
    9記載の音声合成システム。
  11. 【請求項11】 前記音声合成装置の前記音声出力手段
    は、音声再生待ちの音声波形の数に応じた細かいステッ
    プで再生スピードを上げることが可能であることを特徴
    とする請求項9又は10記載の音声合成システム。
  12. 【請求項12】 テキストデータを合成音声に変換して
    出力する音声合成装置と、該音声合成装置に前記テキス
    トデータを送信する外部装置とを具備してなる音声合成
    システムであって、 前記音声合成装置は、前記テキストデータの音声波形を
    生成する音声波形生成手段と、複数の前記テキストデー
    タに係る音声波形を再生する場合、前の音声波形の再生
    終了後、次の音声波形の再生開始前に、予め定められた
    空白時間を設ける音声出力手段とを有することを特徴と
    する音声合成システム。
  13. 【請求項13】 前記空白時間は、任意に設定可能であ
    ることを特徴とする請求項12記載の音声合成システ
    ム。
  14. 【請求項14】 テキストデータを合成音声に変換して
    出力する音声合成装置と、該音声合成装置に前記テキス
    トデータを送信する外部装置とを具備してなる音声合成
    システムであって、 前記音声合成装置は、前記テキストデータの音声波形を
    生成する音声波形生成手段と、複数の前記テキストデー
    タに係る音声波形を再生する場合、前の音声波形の再生
    終了後、次の音声波形の再生開始前に、予め用意された
    特定の音声合成波形を再生する音声出力手段とを有する
    ことを特徴とする音声合成システム。
  15. 【請求項15】 前記特定の音声合成波形は、前記前の
    音声波形と前記次の音声波形の間に挿入される明確に区
    切りと判る音声メッセージの音声合成波形であることを
    特徴とする請求項14記載の音声合成システム。
  16. 【請求項16】 遊園地等の各種施設で前記テキストデ
    ータを音声放送するシステム、インターネットを介して
    前記テキストデータで会話を行うシステムに適用可能で
    あることを特徴とする請求項9乃至15の何れかに記載
    の音声合成システム。
  17. 【請求項17】 テキストデータを合成音声に変換して
    出力する音声合成装置に適用される音声合成方法であっ
    て、 前記テキストデータの音声波形を生成する音声波形生成
    工程と、複数の前記テキストデータの音声波形の再生タ
    イミングの重なりを検知した場合は、音声波形の再生ス
    ピードを早くして出力する音声出力工程とを有すること
    を特徴とする音声合成方法。
  18. 【請求項18】 前記音声出力工程では、現時点で音声
    再生中の音声波形があり且つ音声再生待ちの音声波形が
    一つの場合は、通常より若干早い再生スピードで出力
    し、現時点で音声再生中の音声波形があり且つ音声再生
    待ちの音声波形が二つ以上の場合は、更に早い再生スピ
    ードで出力することを特徴とする請求項17記載の音声
    合成方法。
  19. 【請求項19】 前記音声出力工程では、音声再生待ち
    の音声波形の数に応じた細かいステップで再生スピード
    を上げることが可能であることを特徴とする請求項17
    又は18記載の音声合成方法。
  20. 【請求項20】 テキストデータを合成音声に変換して
    出力する音声合成装置に適用される音声合成方法であっ
    て、 前記テキストデータの音声波形を生成する音声波形生成
    工程と、複数の前記テキストデータに係る音声波形を再
    生する場合、前の音声波形の再生終了後、次の音声波形
    の再生開始前に、予め定められた空白時間を設ける音声
    出力工程とを有することを特徴とする音声合成方法。
  21. 【請求項21】 前記空白時間は、任意に設定可能であ
    ることを特徴とする請求項20記載の音声合成方法。
  22. 【請求項22】 テキストデータを合成音声に変換して
    出力する音声合成装置に適用される音声合成方法であっ
    て、 前記テキストデータの音声波形を生成する音声波形生成
    工程と、複数の前記テキストデータに係る音声波形を再
    生する場合、前の音声波形の再生終了後、次の音声波形
    の再生開始前に、予め用意された特定の音声合成波形を
    再生する音声出力工程とを有することを特徴とする音声
    合成方法。
  23. 【請求項23】 前記特定の音声合成波形は、前記前の
    音声波形と前記次の音声波形の間に挿入される明確に区
    切りと判る音声メッセージの音声合成波形であることを
    特徴とする請求項22記載の音声合成方法。
  24. 【請求項24】 遊園地等の各種施設で前記テキストデ
    ータを音声放送するシステム、インターネットを介して
    前記テキストデータで会話を行うシステムに適用可能で
    あることを特徴とする請求項17乃至23の何れかに記
    載の音声合成方法。
  25. 【請求項25】 テキストデータを合成音声に変換して
    出力する音声合成装置に適用される音声合成方法を実行
    するプログラムを記憶したコンピュータにより読み出し
    可能な記憶媒体であって、 前記音声合成方法は、前記テキストデータの音声波形を
    生成するように制御する音声波形生成ステップと、複数
    の前記テキストデータの音声波形の再生タイミングの重
    なりを検知した場合は、音声波形の再生スピードを早く
    して出力するように制御する音声出力ステップとを有す
    ることを特徴とする記憶媒体。
  26. 【請求項26】 前記音声出力ステップでは、現時点で
    音声再生中の音声波形があり且つ音声再生待ちの音声波
    形が一つの場合は、通常より若干早い再生スピードで出
    力するように制御し、現時点で音声再生中の音声波形が
    あり且つ音声再生待ちの音声波形が二つ以上の場合は、
    更に早い再生スピードで出力するように制御することを
    特徴とする請求項25記載の記憶媒体。
  27. 【請求項27】 前記音声出力ステップでは、音声再生
    待ちの音声波形の数に応じた細かいステップで再生スピ
    ードを上げることが可能であることを特徴とする請求項
    25又は26記載の記憶媒体。
  28. 【請求項28】 テキストデータを合成音声に変換して
    出力する音声合成装置に適用される音声合成方法を実行
    するプログラムを記憶したコンピュータにより読み出し
    可能な記憶媒体であって、 前記音声合成方法は、前記テキストデータの音声波形を
    生成するように制御する音声波形生成ステップと、複数
    の前記テキストデータに係る音声波形を再生する場合、
    前の音声波形の再生終了後、次の音声波形の再生開始前
    に、予め定められた空白時間を設けるように制御する音
    声出力ステップとを有することを特徴とする記憶媒体。
  29. 【請求項29】 前記空白時間は、任意に設定可能であ
    ることを特徴とする請求項28記載の記憶媒体。
  30. 【請求項30】 テキストデータを合成音声に変換して
    出力する音声合成装置に適用される音声合成方法を実行
    するプログラムを記憶したコンピュータにより読み出し
    可能な記憶媒体であって、 前記音声合成方法は、前記テキストデータの音声波形を
    生成するように制御する音声波形生成ステップと、複数
    の前記テキストデータに係る音声波形を再生する場合、
    前の音声波形の再生終了後、次の音声波形の再生開始前
    に、予め用意された特定の音声合成波形を再生するよう
    に制御する音声出力ステップとを有することを特徴とす
    る記憶媒体。
  31. 【請求項31】 前記特定の音声合成波形は、前記前の
    音声波形と前記次の音声波形の間に挿入される明確に区
    切りと判る音声メッセージの音声合成波形であることを
    特徴とする請求項30記載の記憶媒体。
  32. 【請求項32】 遊園地等の各種施設で前記テキストデ
    ータを音声放送するシステム、インターネットを介して
    前記テキストデータで会話を行うシステムに適用可能で
    あることを特徴とする請求項25乃至31の何れかに記
    載の記憶媒体。
  33. 【請求項33】 テキストデータを合成音声に変換して
    出力する音声合成装置であって、 前記テキストデータを入力する入力手段と、 前記テキストデータの音声波形を生成する音声波形生成
    手段と、 前記音声波形に係る音声を出力する音声出力手段と、 第1の前記テキストデータに係る音声の出力中に第2の
    前記テキストデータの入力による音声波形を検出した場
    合に、前記第1のテキストデータに係る音声の出力を終
    了した後前記第2のテキストデータに係る音声を出力す
    るよう前記音声出力手段を制御する制御手段とを備える
    ことを特徴とする音声合成装置。
  34. 【請求項34】 前記制御手段は前記第2のテキストデ
    ータによる音声波形の検出に応じて前記第1のテキスト
    データに係る音声波形の再生速度を通常速度よりも速く
    するよう前記音声出力手段を制御することを特徴とする
    請求項33記載の音声合成装置。
  35. 【請求項35】 前記制御手段は前記第1のテキストデ
    ータに係る音声出力の終了後、所定期間経過した後に前
    記第2のテキストデータに係る音声の出力を開始するよ
    う前記音声出力手段を制御することを特徴とする請求項
    33記載の音声合成装置。
  36. 【請求項36】 前記制御手段は前記第1のテキストデ
    ータに係る音声出力の終了後、所定の音声を出力した後
    に前記第2のテキストデータに係る音声を出力するよう
    前記音声出力手段を制御することを特徴とする請求項3
    3記載の音声合成装置。
  37. 【請求項37】 前記制御手段は前記第1のテキストデ
    ータに係る音声と前記第2のテキストデータに係る音声
    とを通常の再生速度で出力することを特徴とする請求項
    33記載の音声合成装置。
  38. 【請求項38】 前記音声波形生成手段により生成され
    た音声波形データを記憶する記憶手段を備え、前記制御
    手段は前記記憶手段に記憶されている前記入力テキスト
    データに応じた音声波形データの数に応じて前記音声波
    形の再生速度を変更するよう前記音声出力手段を制御す
    ることを特徴とする請求項33記載の音声合成装置。
  39. 【請求項39】 テキストデータを合成音声に変換して
    出力する音声合成装置に適用される音声合成方法であっ
    て、 前記テキストデータを入力する入力工程と、 前記テキストデータの音声波形を生成する音声波形生成
    工程と、 前記音声波形に係る音声を出力する音声出力工程と、 第1の前記テキストデータに係る音声の出力中に第2の
    前記テキストデータの入力による音声波形を検出した場
    合に、前記第1のテキストデータに係る音声の出力を終
    了した後前記第2のテキストデータに係る音声を出力す
    るよう前記音声出力工程を制御する制御工程とを有する
    ことを特徴とする音声合成方法。
  40. 【請求項40】 前記制御工程では前記第2のテキスト
    データによる音声波形の検出に応じて前記第1のテキス
    トデータに係る音声波形の再生速度を通常速度よりも速
    くするよう前記音声出力工程を制御することを特徴とす
    る請求項39記載の音声合成方法。
  41. 【請求項41】 前記制御工程では前記第1のテキスト
    データに係る音声出力の終了後、所定期間経過した後に
    前記第2のテキストデータに係る音声の出力を開始する
    よう前記音声出力工程を制御することを特徴とする請求
    項39記載の音声合成方法。
  42. 【請求項42】 前記制御工程では前記第1のテキスト
    データに係る音声出力の終了後、所定の音声を出力した
    後に前記第2のテキストデータに係る音声を出力するよ
    う前記音声出力工程を制御することを特徴とする請求項
    39記載の音声合成方法。
  43. 【請求項43】 前記制御工程では前記第1のテキスト
    データに係る音声と前記第2のテキストデータに係る音
    声とを通常の再生速度で出力することを特徴とする請求
    項39記載の音声合成方法。
  44. 【請求項44】 前記音声波形生成工程により生成され
    た音声波形データを記憶する記憶工程を有し、前記制御
    工程では前記記憶工程に記憶されている前記入力テキス
    トデータに応じた音声波形データの数に応じて前記音声
    波形の再生速度を変更するよう前記音声出力工程を制御
    することを特徴とする請求項39記載の音声合成方法。
  45. 【請求項45】 テキストデータを合成音声に変換して
    出力する音声合成装置に適用される音声合成方法を実行
    するプログラムを記憶したコンピュータにより読み出し
    可能な記憶媒体であって、 前記音声合成方法は、 前記テキストデータを入力する入力ステップと、 前記テキストデータの音声波形を生成するように制御す
    る音声波形生成ステップと、 前記音声波形に係る音声を出力するように制御する音声
    出力ステップと、 第1の前記テキストデータに係る音声の出力中に第2の
    前記テキストデータの入力による音声波形を検出した場
    合に、前記第1のテキストデータに係る音声の出力を終
    了した後前記第2のテキストデータに係る音声を出力す
    るよう前記音声出力ステップを制御する制御ステップと
    を有することを特徴とする記憶媒体。
  46. 【請求項46】 前記制御ステップでは前記第2のテキ
    ストデータによる音声波形の検出に応じて前記第1のテ
    キストデータに係る音声波形の再生速度を通常速度より
    も速くするよう前記音声出力ステップを制御することを
    特徴とする請求項45記載の記憶媒体。
  47. 【請求項47】 前記制御ステップでは前記第1のテキ
    ストデータに係る音声出力の終了後、所定期間経過した
    後に前記第2のテキストデータに係る音声の出力を開始
    するよう前記音声出力ステップを制御することを特徴と
    する請求項45記載の記憶媒体。
  48. 【請求項48】 前記制御ステップでは前記第1のテキ
    ストデータに係る音声出力の終了後、所定の音声を出力
    した後に前記第2のテキストデータに係る音声を出力す
    るよう前記音声出力ステップを制御することを特徴とす
    る請求項45記載の記憶媒体。
  49. 【請求項49】 前記制御ステップでは前記第1のテキ
    ストデータに係る音声と前記第2のテキストデータに係
    る音声とを通常の再生速度で出力するように制御するこ
    とを特徴とする請求項45記載の記憶媒体。
  50. 【請求項50】 前記音声波形生成ステップにより生成
    された音声波形データを記憶するように制御する記憶ス
    テップを有し、前記制御ステップでは前記記憶ステップ
    に記憶されている前記入力テキストデータに応じた音声
    波形データの数に応じて前記音声波形の再生速度を変更
    するよう前記音声出力ステップを制御することを特徴と
    する請求項45記載の記憶媒体。
JP2000204959A 2000-06-30 2000-07-06 音声合成装置、音声合成システム、音声合成方法及び記憶媒体 Pending JP2002023787A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2000204959A JP2002023787A (ja) 2000-07-06 2000-07-06 音声合成装置、音声合成システム、音声合成方法及び記憶媒体
US09/891,389 US7031924B2 (en) 2000-06-30 2001-06-27 Voice synthesizing apparatus, voice synthesizing system, voice synthesizing method and storage medium
US11/357,021 US20060143012A1 (en) 2000-06-30 2006-02-21 Voice synthesizing apparatus, voice synthesizing system, voice synthesizing method and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000204959A JP2002023787A (ja) 2000-07-06 2000-07-06 音声合成装置、音声合成システム、音声合成方法及び記憶媒体

Publications (1)

Publication Number Publication Date
JP2002023787A true JP2002023787A (ja) 2002-01-25

Family

ID=18702128

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000204959A Pending JP2002023787A (ja) 2000-06-30 2000-07-06 音声合成装置、音声合成システム、音声合成方法及び記憶媒体

Country Status (1)

Country Link
JP (1) JP2002023787A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002054383A1 (fr) * 2000-12-28 2002-07-11 Sharp Kabushiki Kaisha Dispositif de synthese vocale de texte et support d'enregistrement de programme
JP2005250010A (ja) * 2004-03-03 2005-09-15 Denso It Laboratory Inc 音声データ出力装置及び音声データ出力制御装置並びに音声データ出力制御システム
JP2011221237A (ja) * 2010-04-08 2011-11-04 Nec Corp 音声出力装置、そのコンピュータプログラムおよびデータ処理方法
JP2016189195A (ja) * 2016-05-25 2016-11-04 ソニー株式会社 携帯端末、情報処理装置、およびプログラム
JP2017203827A (ja) * 2016-05-10 2017-11-16 日本放送協会 解説音声再生装置及びそのプログラム
US9830128B2 (en) 2011-11-09 2017-11-28 Sony Corporation Voice control device, voice control method and program
US9992536B2 (en) 2013-07-23 2018-06-05 Fujitsu Limited Information provision device, information provision method, and information provision system
WO2022186471A1 (ko) * 2021-03-02 2022-09-09 삼성전자 주식회사 그룹 통화 서비스를 제공하기 위한 방법 및 이를 지원하는 전자 장치

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002054383A1 (fr) * 2000-12-28 2002-07-11 Sharp Kabushiki Kaisha Dispositif de synthese vocale de texte et support d'enregistrement de programme
US7249021B2 (en) 2000-12-28 2007-07-24 Sharp Kabushiki Kaisha Simultaneous plural-voice text-to-speech synthesizer
JP2005250010A (ja) * 2004-03-03 2005-09-15 Denso It Laboratory Inc 音声データ出力装置及び音声データ出力制御装置並びに音声データ出力制御システム
JP2011221237A (ja) * 2010-04-08 2011-11-04 Nec Corp 音声出力装置、そのコンピュータプログラムおよびデータ処理方法
US9830128B2 (en) 2011-11-09 2017-11-28 Sony Corporation Voice control device, voice control method and program
US9992536B2 (en) 2013-07-23 2018-06-05 Fujitsu Limited Information provision device, information provision method, and information provision system
JP2017203827A (ja) * 2016-05-10 2017-11-16 日本放送協会 解説音声再生装置及びそのプログラム
JP2016189195A (ja) * 2016-05-25 2016-11-04 ソニー株式会社 携帯端末、情報処理装置、およびプログラム
WO2022186471A1 (ko) * 2021-03-02 2022-09-09 삼성전자 주식회사 그룹 통화 서비스를 제공하기 위한 방법 및 이를 지원하는 전자 장치

Similar Documents

Publication Publication Date Title
JP5750380B2 (ja) 音声翻訳装置、音声翻訳方法および音声翻訳プログラム
EP0627728B1 (en) Method and system for providing an apparent spatial position to a synthesized voice
JP6078964B2 (ja) 音声対話システム及びプログラム
US20030028380A1 (en) Speech system
US7230177B2 (en) Interchange format of voice data in music file
US6463412B1 (en) High performance voice transformation apparatus and method
US20060143012A1 (en) Voice synthesizing apparatus, voice synthesizing system, voice synthesizing method and storage medium
WO2017006766A1 (ja) 音声対話方法および音声対話装置
JP2008500573A (ja) メッセージを変更するための方法及びシステム
JP2003521750A (ja) スピーチシステム
WO2013135167A1 (zh) 一种移动终端处理文本的方法、相关设备及系统
JP4174940B2 (ja) カラオケ装置
WO2007045187A1 (fr) Procede, appareil et systeme pour executer la fonction de conversion texte-parole
JP2002023787A (ja) 音声合成装置、音声合成システム、音声合成方法及び記憶媒体
JPH10326176A (ja) 音声対話制御方法
US11790913B2 (en) Information providing method, apparatus, and storage medium, that transmit related information to a remote terminal based on identification information received from the remote terminal
US7092884B2 (en) Method of nonvisual enrollment for speech recognition
JP2000206987A (ja) 音声認識装置
JP2000081897A (ja) 音声情報の記録方法、音声情報記録媒体、並びに音声情報の再生方法及び再生装置
JP2015187738A (ja) 音声翻訳装置、音声翻訳方法および音声翻訳プログラム
JP2002023778A (ja) 音声合成装置、音声合成システム、音声合成方法及び記憶媒体
JP2002032098A (ja) 音声出力装置、音声出力システム、音声出力方法及び記憶媒体
JP2024031442A (ja) 音声処理装置、音声処理方法、音声処理プログラム及び通信システム
KR100612780B1 (ko) 음성 및 악곡 재생 장치
JPH11219195A (ja) 対話型詩朗読システム

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060327

RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20070626