JPH08272388A - 音声合成装置及びその方法 - Google Patents

音声合成装置及びその方法

Info

Publication number
JPH08272388A
JPH08272388A JP7071206A JP7120695A JPH08272388A JP H08272388 A JPH08272388 A JP H08272388A JP 7071206 A JP7071206 A JP 7071206A JP 7120695 A JP7120695 A JP 7120695A JP H08272388 A JPH08272388 A JP H08272388A
Authority
JP
Japan
Prior art keywords
text data
voice
speaker
control information
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7071206A
Other languages
English (en)
Inventor
Takashi Aso
隆 麻生
Mitsuru Otsuka
充 大塚
Yasunori Ohora
恭則 大洞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP7071206A priority Critical patent/JPH08272388A/ja
Publication of JPH08272388A publication Critical patent/JPH08272388A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 テキストデータに音声の種別を設定すること
を可能とし、複数の音声を設定し出力することが容易に
できる音声合成装置及びその方法を提供する。 【構成】 表示部2に表示されるテキストデータに制御
情報を組み込み、制御情報に対応した音質でテキストデ
ータに基づく音声を音響処理部6で合成し出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声を合成音声に変換
して出力する音声合成装置及びその方法に関するもので
ある。
【0002】
【従来の技術】従来の音声合成装置において、文字情報
を音声出力する音声合成装置は、音声出力するデータ
を、あらかじめ電子化されたテキストデータとして準備
する必要があった。テキストデータとしては、パソコン
上におけるエディタやワードプロセッサなどで作成した
文や、すでに電子化された各種テキストデータなどを使
用していた。
【0003】また、これらのテキストデータを音声で出
力する場合、ほとんどの場合が該装置にあらかじめ設定
されている一種類の音声(音質)で出力された。更に、
従来の音声合成装置では、何種類かの音声(音質)を選
択できるものもあるが、音声(音質)を切り替えるに
は、音声合成装置において、操作者がその都度切り替え
るのが一般的であった。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の音声合成装置において、あらかじめテキストデータ
を作成する時に、複数種類の音声(音質)を設定するこ
とが容易にできないという欠点があった。すなわち、使
用者はテキストデータのある一部をある音声(例えば、
男性の声)で、また、別の一部を他の音声(例えば、女
性の声)でという複数の設定を行うことができなかっ
た。
【0005】本発明は上記の問題点に鑑みてなされたも
のであり、テキストデータに音声の種別を設定すること
を可能とし、複数の音声を設定し出力することが容易に
できる音声合成装置及びその方法を提供することを目的
とする。
【0006】
【課題を解決するための手段】上記の目的を達成するた
めの本発明による音声合成装置は以下の構成を備える。
即ち、音声を合成音声に変換して出力する音声合成装置
であって、前記テキストデータに制御情報を組み込む組
み込み手段と、前記制御情報に対応する音声を合成し出
力する出力手段とを備える。
【0007】また、好ましくは、前記組み込み手段は、
前記テキストデータを表示する表示手段と、前記テキス
トデータの所望の領域を選択する選択手段と、前記選択
手段によって、選択された領域に前記制御情報を設定す
る設定手段とを更に備える。制御情報の設定を画面に表
示して行うことで設定を容易に行うことができるからで
ある。
【0008】また、好ましくは、前記制御情報を前記表
示手段の一部分に部分表示する部分表示手段を備える。
制御情報を画面に表示することで、制御情報の選択を容
易にすることができるからである。
【0009】また、好ましくは、前記制御情報は文字属
性であり、前記文字属性に従って、文字の字体又は文字
のスタイルを変更して前記テキストデータを表示する表
示手段を更に備える。文字属性を持たせて表示すること
で、表示されているテキストデータに使われている音声
を容易に把握することができるからである。
【0010】また、好ましくは、前記制御情報は任意の
画像で表現され、前記画像を前記画像を前記テキストデ
ータの所望の位置に挿入して表示する表示手段を更に備
える。画像を用いて表示することで、直感的にテキスト
データに使われている音声を認識することができるから
である。
【0011】また、好ましくは、前記画像は、写真デー
タである。写真データを用いることで、より認識を容易
にすることができるからである。
【0012】上記の目的を達成するための本発明による
音声合成方法は以下の構成を備える。即ち、音声を合成
音声に変換して出力する音声合成方法であって、テキス
トデータに制御情報を組み込む組み込み工程と、前記制
御情報に対応した音質で前記テキストデータに基づく音
声を合成し出力する出力工程とを備える。
【0013】
【作用】上記の構成により、テキストデータに制御情報
を組み込み、制御情報に対応した音声(音質)の種類で
テキストデータに基づく音声を合成し出力する。
【0014】
【実施例】以下、図面を参照して本発明の好適な実施例
を詳細に説明する。
【0015】<実施例1>図1は実施例1の音声合成装
置の概略構成を示すブロック図である。
【0016】同図において、11はCPUであり、音声
合成装置における各種の制御を実行する。12はROM
であり、CPU11が処理を実行するための各種制御プ
ログラムが格納されている。なお、ROM12には、後
述の図3のフローチャートで表される制御プログラムも
格納されている。13はRAMであり、CPU11が各
種の制御を実行する際に必要なデータ等を一時的に記憶
する。14は入力部であり、各種データの入力や制御命
令などを入力する。なお、音声合成装置におけるテキス
トデータを編集する際の編集作業も入力部14より行
う。15は辞書であり、漢字等の読みやアクセント情報
が登録されている。辞書15は、入力された漢字かな混
じり文を解析し読み情報をえる言語処理部(後述)にお
いて参照される。16は、テキストデータを格納するた
めの記憶装置である。2は表示部であり、編集中のテキ
ストデータの表示等、各種の表示がなされる。18は入
力された文字列に従って音声の素片を接続する際に必要
となる音声素片データで、一般的にはcV(子音ー母
音)、cVc(子音ー母音ー子音)、VcV(母音ー子
音ー母音)などの音声データを、パラメータや波形デー
タである。6は音響処理部であり、各種の設定に従っ
て、テキストデータを音声に合成し、音声信号に変換す
る。そしてスピーカ17により、変換された音声信号が
出力される。
【0017】図2は実施例1の音声合成装置の機能構成
を示すブロック図である。
【0018】同図において、1はテキストデータ入力部
であり、入力部14により、テキストデータをワードプ
ロセッサやエディタ等により直接入力するか、または、
記憶装置16にあらかじめ記録されたテキストデータを
読み込むことによって、テキストデータを入力する。2
は表示部であり、テキストデータ入力部1で入力された
テキストデータを表示する。3は編集部であり、表示部
2に表示されたテキストデータに対して、音声(話者)
の設定を実行する。4は話者情報抽出部であり、テキス
トデータ中の話者情報を抽出する。5は言語処理部であ
り、テキストデータ入力部1で入力されたテキストデー
タの「読み」と「音調成分」を解析する。ここで言う
「音調成分」とは「アクセント」と「イントネーショ
ン」である。6は音響処理部であり、話者情報抽出部4
で抽出された「話者情報」により、言語処理部5で解析
されたテキストデータの「読み」と「音調成分」ならび
に音声素片データを所望の話者に対応させ合成音声を生
成する。
【0019】以上のような構成を有する本実施例の音声
合成装置の動作について、図3のフローチャートを参照
して以下に説明する。
【0020】図3は実施例1の音声合成装置における制
御を示すフローチャートである。
【0021】まず、ステップS11で、テキストデータ
入力部1により、対象となるテキストデータを入力す
る。入力手段としては、ワードプロセッサなどにより直
接テキストデータを入力してもよいし、記憶装置16に
あらかじめ記憶されたテキストデータを読み込んできて
もよい。ステップS12で、入力されたテキストデータ
を表示部2に表示する。ステップS13で、入力された
テキストデータに対して、話者を設定する場合(ステッ
プS13でYES)には、ステップS14へ進む。ステ
ップS14では、表示部2に表示されたテキストデータ
を編集部3により、話者を設定する。ステップS14に
おいて、具体的な話者の設定を行う編集作業について、
図4〜図7を用いて説明する。
【0022】図4〜図7は実施例1の入力されたテキス
トデータに対して、話者の属性の設定方法を示す図であ
る。
【0023】入力されたテキストデータは、図4のよう
に表示部2に表示される。ここで401はテキストデー
タを示す。テキストデータ401中において、話者の設
定をする箇所を図5のように反転表示し、選択する。こ
こで402は選択されたテキストデータを示す。選択す
る方法としては、ポインティングデバイス(マウスなど)
を用いた方法など、既存の技術で実現可能である。次
に、選択されたテキストデータ402について、図6の
ような斜字体に文字属性を変更する。403は、選択さ
れたテキストデータ402に対して、文字の属性を斜字
体に変更したことを示す。文字属性は、斜字体に限ら
ず、標準、ボールド、袋文字、下線等での変更が可能
で、各文字スタイルに対して、それぞれ違った話者をあ
らかじめ対応させておくことで、複数の話者の設定が可
能である。図7は、テキストデータ401の全体につい
て、すべての設定が行われたあとの様子を示す。なお、
話者を設定する範囲は、図7で示すように、文、単語、
文字などの任意の単位で選択することが可能である。こ
こで、話者の設定がされたテキストデータは、話者の種
類と、その話者が設定されている範囲が容易にわかるよ
うなデータ構造として出力される。
【0024】図8は実施例1のテキストデータのデータ
構造を示す図である。
【0025】図8において、テキストデータの話者が変
化する境界位置に、その境界以降の話者の種類を制御記
号の形で挿入している。また、テキストデータに対する
制御記号は、これに限らず、話者とその範囲を明確に設
定することができれば、どのような方法を用いてもかま
わない。
【0026】一方、ステップS13において、話者の設
定をしない場合(ステップS13でNO)には、ステッ
プS15に進み、テキストデータを記憶装置16に保存
するか否かの判定を行う。そして、データを保存する場
合(ステップS15でYES)は、ステップS14にお
いて、話者を設定された話者情報付きテキストデータを
記憶装置16に記録する。データを保存しない場合(ス
テップS15でNO)は、ステップS17に進む。
【0027】次に、ステップS17において、音声出力
を実行するか否かを判定する。音声出力を実行する場合
(ステップS17でYES)は、ステップS18に進
む。ステップ18で、話者情報抽出部4より話者情報付
きテキストデータを「話者情報」と「テキストデータ」
に分離する。そして、ステップS19で、「テキストデ
ータ」の部分について、言語処理部5より辞書15を使
って言語解析を行い、「テキストデータ」の「読み」と
「音調成分」を生成する。さらに、ステップS20でス
テップS18で抽出された話者情報付きテキストデータ
の「話者情報」と、ステップS19で解析された「テキ
ストデータ」の「読み」と「音調成分」を使って、音響
処理部6において所望の話者による合成音声信号を生成
し、スピーカ17より出力する。音声出力を実行しない
場合(ステップS17でNO)は、そのまま処理を終了
する。
【0028】以上説明した様に、テキストデータの文字
属性を話者(音声)と対応させておくことで、文字属性
を変えるだけで任意の話者(音声)を設定することが可
能となる。また、表示部にテキストデータを文字属性に
従って表示することで、設定された文字属性を容易に識
別することが可能となる。
【0029】なお、上記実施例においては、テキストデ
ータの文字属性を種々に変化させることで話者を設定す
るようにしているが、文字の色属性(文字の色あるい
は、文字の背景色)を変化させることにより話者(音
声)を設定するようにしてもよい。その場合には、それ
ぞれの話者(音声)と色とを対応させておき、使用者が
設定する話者(音声)に対応する色属性によりテキスト
データを編集することが可能である。
【0030】<実施例2>また、話者を設定する方法と
して、次に示すような方法を用いることも可能である。
【0031】図9〜13は実施例2の入力されたテキス
トデータに対して、話者の属性の設定方法を示す図であ
る。
【0032】入力されたテキストデータは、表示部2に
図9のように表示される。ここで、601はテキストデ
ータを表す。また、602は選択可能な話者の種類を表
示するパネルである。まず、話者を設定すべきテキスト
データの領域を図10のように反転表示し、選択する。
ここで、603は選択されたテキストデータを示す。次
に選択されたテキストデータ603について、パネル6
02を用いて、図11のように話者を設定する。604
は、選択されたテキストデータ603に対して「成人男
性」話者を設定し、パネル602の「成人男性」を反転
表示し、選択した状態を表す。パネル602の各話者を
選択する方法としては、ポインティングデバイス(マウ
スなど)で選択肢を選び、ボタンをクリックするなどの
方法を使うことができる。話者が設定された区間は、文
字のスタイルや、文字の色、背景色などをそれぞれの話
者に対応した表示にすることで、その話者の種類が容易
に識別できるようにする。設定された成人男性の文字属
性が斜字体に対応しているとすると、図12のような表
示になる。同様に、テキストデータ601全体につい
て、パネル602を用いて話者の設定を行うと、図13
のような表示になる。なお、実施例1と同様に、話者を
設定する範囲は、文、単語、文字などの任意の単位で選
択することが可能である。
【0033】更に、図9〜13においては、 複数の話
者で構成されるパネルにおける話者の表示には、ある特
定の文字スタイルのみを用いているが、これを、図14
に示すような、テキストデータの話者の設定に用いた文
字スタイルと同一の文字スタイルとしてパネルに表示す
るようにしてもよい。
【0034】以上説明したように、複数の話者で構成さ
れるパネルを、テキストデータが表示されている表示部
上に表示することで、容易に話者を設定することが可能
となる。また、パネルに表示されている話者のそれぞれ
の文字属性をテキストデータで設定するそれぞれの文字
属性で表示することで、容易に話者を識別することが可
能となる。
【0035】<実施例3>図9〜13においては、話者
の種類を表示したパネルにおける話者の表示には、話者
の種類を表す「言葉」で表示しているが、これを、図1
5に示すような、各話者に即した顔の表情のイラスト画
像、あるいは実際の顔写真などで表示するようにしても
よい。この場合には、直感的に話者を設定することがで
きるという効果がある。
【0036】<実施例4>さらに、図4〜7、図9〜1
3に示したテキストデータへの話者の設定において、テ
キストデータの話者の表示には、文字のスタイル、色、
背景色を変えることで話者の種類の識別をするようにし
ているが、これを、図16に示すように各話者の境界
に、図15で用いたような顔の表情のイラスト画像、あ
るいは実際の顔写真などを挿入し表示することで、識別
するようにしてもよい。
【0037】以上のように上記実施例によると、テキス
トデータを、複数の音声(話者)で出力する場合に、あ
らかじめ、複数の音声に対応した文字情報または画像情
報を用いて、所望のテキストデータに再編集することに
よって、テキストデータ中の所望の部分におけるデータ
に音声(音質)の種類を設定する操作を、各所望のデー
タごとに音声を切り替える操作をすることなく、複数の
音声(音質)を設定することができる。
【0038】尚、本発明は、複数の機器から構成される
システムに適用しても1つの機器からなる装置に適用し
ても良い。また、本発明は、システム或いは装置にプロ
グラムを供給することによって達成される場合にも適用
できることはいうまでもない。
【0039】
【発明の効果】以上の説明からも明らかなように、本発
明によれば、テキストデータに音声の種別を設定するこ
とを可能とし、複数の音声を設定し出力することが容易
にできる音声合成装置及びその方法を提供できる。
【0040】
【図面の簡単な説明】
【図1】実施例1の音声合成装置の概略構成を示すブロ
ック図である。
【図2】実施例1の音声合成装置の機能構成を示すブロ
ック図である。
【図3】実施例1の音声合成装置における制御を示すフ
ローチャートである。
【図4】実施例1の入力されたテキストデータに対し
て、話者の属性の設定方法を示す図である。
【図5】実施例1の入力されたテキストデータに対し
て、話者の属性の設定方法を示す図である。
【図6】実施例1の入力されたテキストデータに対し
て、話者の属性の設定方法を示す図である。
【図7】実施例1の入力されたテキストデータに対し
て、話者の属性の設定方法を示す図である。
【図8】実施例1のテキストデータのデータ構造を示す
図である。
【図9】実施例2の入力されたテキストデータに対し
て、話者の属性の設定方法を示す図である。
【図10】実施例2の入力されたテキストデータに対し
て、話者の属性の設定方法を示す図である。
【図11】実施例2の入力されたテキストデータに対し
て、話者の属性の設定方法を示す図である。
【図12】実施例2の入力されたテキストデータに対し
て、話者の属性の設定方法を示す図である。
【図13】実施例2の入力されたテキストデータに対し
て、話者の属性の設定方法を示す図である。
【図14】実施例2の話者の種類を表示したパネルを示
す図である。
【図15】実施例3の話者の種類を表示したパネルを示
す図である。
【図16】実施例4の入力されたテキストデータに対し
て、話者の属性の設定方法を示す図である。
【符号の説明】
1 テキストデータ入力部 2 表示部 3 編集部 4 話者情報抽出部 5 言語処理部 6 音響処理部 11 CPU 12 ROM 13 RAM 14 入力部 15 辞書 16 記憶装置 17 スピーカ 18 音声素片データ

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 漢字かな混じりのテキストデータを合成
    音声に変換して出力する音声合成装置であって、 テキストデータに制御情報を組み込む組み込み手段と、 前記制御情報に対応した音質で前記テキストデータに基
    づく音声を合成し出力する出力手段とを備えることを特
    徴とする音声合成装置。
  2. 【請求項2】 前記組み込み手段は、前記テキストデー
    タを表示する表示手段と、 前記テキストデータの所望の領域を選択する選択手段
    と、 前記選択手段によって、選択された領域に前記制御情報
    を設定する設定手段とを更に備えることを特徴とする請
    求項1に記載の音声合成装置。
  3. 【請求項3】 前記制御情報を前記表示手段の一部分に
    部分表示する部分表示手段を備えることを特徴とする請
    求項2に記載の音声合成装置。
  4. 【請求項4】 前記制御情報は文字属性であり、前記文
    字属性に従って、文字の字体又は文字のスタイルを変更
    して前記テキストデータを表示する表示手段を更に備え
    ることを特徴とする請求項1に記載の音声合成装置。
  5. 【請求項5】 前記制御情報は任意の画像で表現され、
    前記画像を前記テキストデータの所望の位置に挿入して
    表示する表示手段を更に備えることを特徴とする請求項
    1に記載の音声合成装置。
  6. 【請求項6】 前記画像は、写真データであることを特
    徴とする請求項5に記載の音声合成装置。
  7. 【請求項7】 音声を合成音声に変換して出力する音声
    合成方法であって、 テキストデータに制御情報を組み込む組み込み工程と、 前記制御情報に対応した音質で前記テキストデータに基
    づく音声を合成し出力する出力工程とを備えることを特
    徴とする音声合成方法。
JP7071206A 1995-03-29 1995-03-29 音声合成装置及びその方法 Pending JPH08272388A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7071206A JPH08272388A (ja) 1995-03-29 1995-03-29 音声合成装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7071206A JPH08272388A (ja) 1995-03-29 1995-03-29 音声合成装置及びその方法

Publications (1)

Publication Number Publication Date
JPH08272388A true JPH08272388A (ja) 1996-10-18

Family

ID=13453983

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7071206A Pending JPH08272388A (ja) 1995-03-29 1995-03-29 音声合成装置及びその方法

Country Status (1)

Country Link
JP (1) JPH08272388A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001343991A (ja) * 2000-05-31 2001-12-14 Sharp Corp 音声合成処理装置
US6397183B1 (en) 1998-05-15 2002-05-28 Fujitsu Limited Document reading system, read control method, and recording medium
JP2002297174A (ja) * 2001-04-02 2002-10-11 Oki Electric Ind Co Ltd テキスト音声合成装置
JP2013025112A (ja) * 2011-07-21 2013-02-04 Sharp Corp 電子機器、再生方法、プログラム、及び、記録媒体
JP2016170218A (ja) * 2015-03-11 2016-09-23 カシオ計算機株式会社 音声出力装置およびプログラム
JP2020154050A (ja) * 2019-03-18 2020-09-24 日本電信電話株式会社 音声出力方法、音声出力システム及びプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6397183B1 (en) 1998-05-15 2002-05-28 Fujitsu Limited Document reading system, read control method, and recording medium
JP2001343991A (ja) * 2000-05-31 2001-12-14 Sharp Corp 音声合成処理装置
JP2002297174A (ja) * 2001-04-02 2002-10-11 Oki Electric Ind Co Ltd テキスト音声合成装置
JP2013025112A (ja) * 2011-07-21 2013-02-04 Sharp Corp 電子機器、再生方法、プログラム、及び、記録媒体
JP2016170218A (ja) * 2015-03-11 2016-09-23 カシオ計算機株式会社 音声出力装置およびプログラム
JP2020154050A (ja) * 2019-03-18 2020-09-24 日本電信電話株式会社 音声出力方法、音声出力システム及びプログラム
WO2020189376A1 (ja) * 2019-03-18 2020-09-24 日本電信電話株式会社 音声出力方法、音声出力システム及びプログラム

Similar Documents

Publication Publication Date Title
EP1490861B1 (en) Method, apparatus and computer program for voice synthesis
JP2008268477A (ja) 韻律調整可能な音声合成装置
JP7200533B2 (ja) 情報処理装置およびプログラム
JP3340581B2 (ja) テキスト読み上げ装置及びウインドウシステム
JPH08272388A (ja) 音声合成装置及びその方法
JPH07181992A (ja) 文書読上げ装置及び方法
JP4311710B2 (ja) 音声合成制御装置
JPH07168691A (ja) 表示図形領域選択方式
JPS63157226A (ja) 会話型文章読み上げ装置
JP2006139162A (ja) 語学学習装置
JP2580565B2 (ja) 音声情報辞書作成装置
JPH0883270A (ja) 音声合成装置及びその方法
JP4551066B2 (ja) 音声合成装置、音声合成方法及び音声合成プログラム
JPH10228471A (ja) 音声合成システム,音声用テキスト生成システム及び記録媒体
JP2801622B2 (ja) テキスト音声合成方法
JP2002268664A (ja) 音声変換装置及びプログラム
JPH0877152A (ja) 音声合成装置
JP4543919B2 (ja) 語学学習装置
JP3292218B2 (ja) 音声メッセージ作成装置
JP2007127994A (ja) 音声合成方法及び音声合成装置並びにプログラム
JPH11272673A (ja) 文書処理方法および文書処理装置ならびに文書処理のためのコンピュータプログラムを記録した記録媒体
JPH11175308A (ja) 文書読み上げ音声の声色指定方法
JP2006047866A (ja) 電子辞書装置およびその制御方法
JP2003150182A (ja) 音声合成装置、音声合成装置の制御方法、音声合成制御プログラム及び記録媒体
JPH08221095A (ja) 文章読み上げ方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030609