JP2002268664A - 音声変換装置及びプログラム - Google Patents

音声変換装置及びプログラム

Info

Publication number
JP2002268664A
JP2002268664A JP2001067664A JP2001067664A JP2002268664A JP 2002268664 A JP2002268664 A JP 2002268664A JP 2001067664 A JP2001067664 A JP 2001067664A JP 2001067664 A JP2001067664 A JP 2001067664A JP 2002268664 A JP2002268664 A JP 2002268664A
Authority
JP
Japan
Prior art keywords
voice
document
feature information
pattern
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001067664A
Other languages
English (en)
Inventor
Akira Ro
彬 呂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001067664A priority Critical patent/JP2002268664A/ja
Publication of JP2002268664A publication Critical patent/JP2002268664A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 文書の特定箇所に対して、音声特徴情報を簡
単に設定できる音声変換装置およびそのプログラムを提
供する。 【解決手段】 文書中の所定の箇所に、ユーザ指定の音
声特徴情報を設定して付加する手段と、作成した音声特
徴情報付き文書を記憶する手段と、文書を設定された音
声特徴情報に対応する音声に変換する手段と、音声を出
力する手段と、を備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書を所定の発話
スタイルの音声に変換し、出力する音声変換装置及びそ
のプログラムに関する。
【0002】
【従来の技術】近年、音声機能付きのアプリケーション
は広く使われており、例として、メール読み上げソフト
等があげられる。これらのアプリケーションには、文書
を読み上げる際に、文字情報だけでなく、文書作成者の
感情やニュアンス等の文字情報以外の情報を十分に表現
し、かつ聞き手にとって聞き取りやすく、分かりやすく
伝えるための種々の従来技術が適用されている。
【0003】例えば、特開2000−122941号公
報に、文字情報と読み上げ時の感情や送信者情報等の音
声に関する特徴情報を電子メールとして相手に送信し、
受信側は、受信した音声に関する特徴情報に基づき、文
字情報を音声に変換して受信者に読み上げる情報転送方
法の従来技術が開示されている。
【0004】また、特開2000−148175号公報
に、文書に発信者のニュアンスや表情を表す表情記号を
付加し、韻律部分の調整や効果音の追加によって、その
表情記号通りに文書を読み上げる音声変換装置の従来技
術が開示されている。この技術によれば、ユーザは、文
書中の発信者のニュアンスや表情を表す表情記号を音声
で表現することで、文書内の特定箇所に対して個別に音
声に関する特徴情報を指定することができる。
【0005】
【発明が解決しようとする課題】しかしながら、特開2
000−122941号公報に記載の従来技術では、文
字情報と一緒に送信される音声に関する特徴情報は、そ
の文字情報全体に対して設定されている。そのため、個
別の文字情報に対して指定することができないという問
題点が指摘される。
【0006】また、特開2000−148175号公報
に記載の従来技術では、上記の表情記号の種類は限られ
ているので、ユーザは自分の思い通りに指定するのはと
ても困難であるという問題点も指摘される。
【0007】本発明は、上記問題点に鑑みなされたもの
であり、文書の特定箇所に対して、音声特徴情報を簡単
に設定できる音声変換装置及びそのプログラムを提供す
ることを目的とする。
【0008】
【課題を解決するための手段】かかる目的を達成するた
めに、請求項1に記載の音声変換装置の発明は、文書中
の所定の箇所に、ユーザ指定の音声特徴情報を設定して
付加する手段と、作成した音声特徴情報付き文書を記憶
する手段と、文書を設定された音声特徴情報に対応する
音声に変換する手段と、音声を出力する手段と、を備え
ることを特徴とする。
【0009】請求項2に記載の発明は、請求項1に記載
の音声変換装置において、音声特徴情報は、発話音量、
発話速度、抑揚情報、効果音、発話言語、声質、および
発話時の感情を表現する発話スタイルを含む、音声を特
徴付ける情報であることを特徴とする。
【0010】請求項3に記載の発明は、請求項2に記載
の音声変換装置において、発話パターンを登録する手段
と、文書中の所定の箇所にパターンを設定して付加する
手段と、パターンを設定された文書をパターンに対応す
る音声に変換する手段と、をさらに備えることを特徴と
する。
【0011】請求項4に記載の発明は、請求項3に記載
の音声変換装置において、発話パターンは、音声特徴情
報の所定の項目に対して、ユーザ指定の任意の値を設定
したものであることを特徴とする。
【0012】請求項5に記載のプログラムの発明は、文
書中の所定の箇所にユーザ指定の音声特徴情報を設定さ
せる手順と、作成した音声特徴情報付き文書を音声変換
装置の記憶装置に記憶させる手順と、文書を音声特徴情
報に対応する音声に変換させる手順と、音声を出力させ
る手順と、をコンピュータに実行させることを特徴とす
る。
【0013】請求項6に記載の発明は、請求項5に記載
のプログラムの発明において、音声特徴情報の各項目を
ユーザ指定の値に設定させて発話パターンとして登録さ
せる手順と、文書中の所定の箇所にパターンを設定させ
る手順と、パターンを設定された文書をパターンに対応
する音声に変換させる手順と、をコンピュータに実行さ
せることを特徴とする。
【0014】
【発明の実施の形態】以下、本発明の実施の形態を添付
図面を参照しながら詳細に説明する。図1は、本発明の
音声変換装置の概略構成を示す図である。この音声変換
装置は、画面表示部1と、入力部2と、制御部3と、記
憶部4と、音声出力部5と、を有する。
【0015】画面表示部1は、コンピュータのディスプ
レイが考えられる。本発明の提案する音声変換装置のユ
ーザインタフェースの部分は、画面表示部1によって表
示される。
【0016】入力部2は、キーボード、マウス等の入力
機器によって実現される。
【0017】制御部3は、記憶部4に格納している制御
プログラムと、操作メニューデータをロードする。その
後、ロードした制御プログラムを実行し、画面表示部1
に操作画面を表示し、ユーザによる文字入力、音声変
換、および音声出力の制御を行う。
【0018】記憶部4は、プログラムやデータを格納す
る記憶媒体を含む。この記憶媒体は、磁気的、あるいは
光学的な記憶媒体である。ここでは、コンピュータのハ
ードディスクが考えられる。また、記憶部4に格納され
ているプログラムは、操作メニュー表示機能と、文字入
力制御機能と、音声変換機能と、音声出力制御機能と、
を有するプログラムである。また、記憶部4は、操作メ
ニュー表示データ、ユーザが作成した音声特徴情報付き
文書、かな漢字変換辞書、音声変換用韻律テーブルD
B、音声辞書DB等のデータを格納する。
【0019】音声出力部5は、コンピュータに接続され
ているスピーカである。音声特徴情報付き文書の変換音
は、音声出力部5によって出力される。
【0020】次に、音声変換装置全体の操作の流れを図
2のフローチャートを用いて説明する。まず、ユーザ
は、コンピュータのキーボードによって、かな文字を入
力する(ステップS21)。次に、入力されたかな文字
をかな漢字変換辞書を参照し、かな漢字に変換する(ス
テップS22)。その後、ユーザは、コンピュータのマ
ウスを使って編集したい部分を選択し、所望の音声特徴
情報を設定する(ステップS23)。
【0021】なお、ここでは編集部分の選択はマウスを
用いて行ったが、キーボード等の他の入力機器を用いて
行ってもよいものとする。
【0022】作成した音声特徴情報付き文書をコンピュ
ータのハードディスクに保存する(ステップS24)。
または、音声特徴情報付き文書を音声に変換し、出力す
る(ステップS25)。
【0023】次に、本発明の音声変換装置の操作画面の
一例を図3、図4を用いて説明する。画面情報のツール
バーに本発明の音声変換装置の各ファンクションキーが
表示される。各ファンクションの役割は、表1に示す通
りである。
【0024】
【表1】
【0025】ユーザは、各ファンクションキーを選択し
て、文書の保存、所定の文書を音声に変換し再生、音声
特徴情報の設定、および発話パターンの登録等の処理を
行うことができる。
【0026】次に、音声特徴情報付き文書を作成する場
合の操作例について説明する。ユーザが、例えば、図3
に示すように、”こんにちわ。小林です。”を入力する
ものとする。ここで、”小林です。”の部分だけを編集
したい場合、マウスでその部分を選択する。読み上げる
口調を設定する場合、マウスで、ツールバーにある「ス
タイル」をクリックする。すると、図3に示すように、
選択できる発話スタイルが表示される。
【0027】この実施例において、ユーザは、”喜
び”、”悲しみ”、”怒り”という三つの発話スタイル
から選択することができる。もし、マウスで”喜び”を
選択すると、図4のように、”小林です。”の部分
は、”小林です。/*喜び*/”となる。
【0028】上記のような方法で、ユーザは、所望の音
声特徴情報項目を選択し、設定する。各音声特徴情報の
設定値と文書中の記述例を表2に示す。
【0029】
【表2】
【0030】ここで、「音声」、「速度」、および「ア
クセント」の設定値は、レベルで五段階に分けられてい
る。また、「お気に入り」は、ユーザによって登録した
発話パターンであって、その設定値は、各発話パターン
名である。
【0031】次に、ユーザによる発話パターン登録の実
行例を図3、図5、図6を参照しながら説明する。ま
ず、図3の操作画面表示ツールバーから「お気に入り作
成」を選択する。そうすると、図5のような操作画面が
表示される。この画面で本システムが提供できる各音声
特徴情報項目に対し、設定することができる。「音
量」、「速度」、および「抑揚」を設定する場合、マウ
スでそれぞれの項目横のスクロールバーを移動すること
で、所望の設定値に設定する。
【0032】また、「言語」、「音質」、「スタイ
ル」、および「効果音」を設定する場合、該当項目を選
択すると図6のようにその項目の設定値が表示される。
その中から所望設定値をクリックし、設定する。
【0033】すべての設定が終了し、「テスト」がクリ
ックされると、設定した音声特徴情報を反映するサンプ
ル音声で確認することはできる。そして、ユーザは、
「パターン名」横の欄にパターン名を入力し、「登録」
をクリックすると、ユーザの作成した発話パターンが登
録され、「お気に入り」からその発話パターンを選択で
きる。
【0034】次に、音声特徴情報が付加された文書を対
応する音声に変換する場合の実施例を図7、図8を参照
しながら説明する。図7は、音声特徴情報が付加された
文書を対応する音声情報に変換する場合の動作を示すフ
ローチャートである。また、図8は、音声特徴情報付き
の文書を対応する音声に変換する場合のデータの流れを
示す図である。
【0035】まず、本発明の音声合成システムによって
入力された文書が、”こんにちは。小林です。/*喜び
*/”(81)だとすると、システム内部で、”こんに
ちは。/*style=”喜び”,sentence
=”小林です。”*/”と変換され(82)、音声合成
の入力とする。
【0036】次に、言語解析部71は、入力文書の文字
情報から、読みと韻律情報を抽出し、入力文書は、”コ
ンニチハ。/*style=”喜び”,sentenc
e=”コバヤシデス。”*/”と変換する(83)。
【0037】さらに、音声特徴情報処理部72は、入力
文書に埋め込んだ音声特徴情報を解析し、韻律テーブル
DB75から該当する韻律テーブルを参照し、入力文書
各音の合成音声の高さ、長さと大きさを設定する。ま
た、音声辞書DB76を参照し、該当音声辞書名を設定
する(84)。
【0038】次に、音声変換部73は、合成時入力文書
を指定された合成時設定値通りに音声に変換し(8
5)、音声出力部74によって出力する。
【0039】
【発明の効果】以上の説明から明らかなように、本発明
を用いることにより、ユーザは、ワードプロセッサ等の
文書作成アプリケーションにおける文字の文書の編集方
法と同様の簡便な方法によって、音声特徴情報を文書中
の所定の箇所に付加することができる。そのため、文書
作成者の思惑通りのニュアンスで文書を読み上げること
が可能となる。
【0040】また、本発明によれば、ユーザは、自分の
よく使う発話表現に対して各音声特徴情報項目を設定し
て、登録することができる。そのため、使用性を向上さ
せることができる。
【図面の簡単な説明】
【図1】本発明の音声変換装置の概略構成を示す図であ
る。
【図2】本発明における操作の流れを示すフローチャー
トである。
【図3】音声特徴情報付き文書を作成する場合における
画面表示の第1の例を示す図である。
【図4】音声特徴情報付き文書を作成する場合における
画面表示の第2の例を示す図である。
【図5】ユーザのお気に入り発話パターン作成時におけ
る画面表示の第1の例を示す図である。
【図6】ユーザのお気に入り発話パターン作成時におけ
る画面表示の第2の例を示す図である。
【図7】音声特徴情報付き文書を対応する音声に変換す
る場合の実施例を示す図である。
【図8】音声特徴情報付き文書を対応する音声に変換す
る場合の入力データの処理を示すフローチャートであ
る。
【符号の説明】
1 画面表示部 2 入力部 3 制御部 4 記憶部 5 音声出力部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 文書中の所定の箇所に、ユーザ指定の音
    声特徴情報を設定して付加する手段と、作成した音声特
    徴情報付き文書を記憶する手段と、該文書を設定された
    前記音声特徴情報に対応する音声に変換する手段と、該
    音声を出力する手段と、を備えることを特徴とする音声
    変換装置。
  2. 【請求項2】 前記音声特徴情報は、発話音量、発話速
    度、抑揚情報、効果音、発話言語、声質、および発話時
    の感情を表現する発話スタイルを含む、音声を特徴付け
    る情報であることを特徴とする請求項1に記載の音声変
    換装置。
  3. 【請求項3】 発話パターンを登録する手段と、文書中
    の所定の箇所に該パターンを設定して付加する手段と、
    該パターンを設定した文書を該パターンに対応する音声
    に変換する手段と、をさらに備えることを特徴とする請
    求項2に記載の音声変換装置。
  4. 【請求項4】 前記発話パターンは、前記音声特徴情報
    の所定の項目に対して、ユーザ指定の任意の値を設定し
    たものであることを特徴とする請求項3に記載の音声変
    換装置。
  5. 【請求項5】 文書中の所定の箇所にユーザ指定の音声
    特徴情報を設定させる手順と、作成した音声特徴情報付
    き文書を前記音声変換装置の記憶装置に記憶させる手順
    と、該文書を前記音声特徴情報に対応する音声に変換さ
    せる手順と、該音声を出力させる手順と、をコンピュー
    タに実行させるためのプログラム。
  6. 【請求項6】 前記音声特徴情報の各項目をユーザ指定
    の値に設定させて発話パターンとして登録させる手順
    と、文書中の所定の箇所に該パターンを設定させる手順
    と、該パターンを設定された文書を該パターンに対応す
    る音声に変換させる手順と、をコンピュータに実行させ
    るための請求項5に記載のプログラム。
JP2001067664A 2001-03-09 2001-03-09 音声変換装置及びプログラム Pending JP2002268664A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001067664A JP2002268664A (ja) 2001-03-09 2001-03-09 音声変換装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001067664A JP2002268664A (ja) 2001-03-09 2001-03-09 音声変換装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2002268664A true JP2002268664A (ja) 2002-09-20

Family

ID=18925982

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001067664A Pending JP2002268664A (ja) 2001-03-09 2001-03-09 音声変換装置及びプログラム

Country Status (1)

Country Link
JP (1) JP2002268664A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005332339A (ja) * 2004-05-21 2005-12-02 Xing Inc 音楽メール出力方法、音楽メール出力システム、及び音楽出力装置
JP2006337468A (ja) * 2005-05-31 2006-12-14 Brother Ind Ltd 音声合成装置及び音声合成プログラム
JP2013025112A (ja) * 2011-07-21 2013-02-04 Sharp Corp 電子機器、再生方法、プログラム、及び、記録媒体
EP2779159A1 (en) 2013-03-15 2014-09-17 Yamaha Corporation Voice synthesis device, voice synthesis method, and recording medium having a voice synthesis program stored thereon
WO2016067766A1 (ja) * 2014-10-30 2016-05-06 株式会社東芝 音声合成装置、音声合成方法およびプログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005332339A (ja) * 2004-05-21 2005-12-02 Xing Inc 音楽メール出力方法、音楽メール出力システム、及び音楽出力装置
JP4514513B2 (ja) * 2004-05-21 2010-07-28 株式会社エクシング 音楽メール出力方法、音楽メール出力システム、及び音楽出力装置
JP2006337468A (ja) * 2005-05-31 2006-12-14 Brother Ind Ltd 音声合成装置及び音声合成プログラム
JP2013025112A (ja) * 2011-07-21 2013-02-04 Sharp Corp 電子機器、再生方法、プログラム、及び、記録媒体
EP2779159A1 (en) 2013-03-15 2014-09-17 Yamaha Corporation Voice synthesis device, voice synthesis method, and recording medium having a voice synthesis program stored thereon
US9355634B2 (en) 2013-03-15 2016-05-31 Yamaha Corporation Voice synthesis device, voice synthesis method, and recording medium having a voice synthesis program stored thereon
WO2016067766A1 (ja) * 2014-10-30 2016-05-06 株式会社東芝 音声合成装置、音声合成方法およびプログラム
JP2016090664A (ja) * 2014-10-30 2016-05-23 株式会社東芝 音声合成装置、音声合成方法およびプログラム
CN106688035A (zh) * 2014-10-30 2017-05-17 株式会社东芝 声音合成装置、声音合成方法及程序
US10217454B2 (en) 2014-10-30 2019-02-26 Kabushiki Kaisha Toshiba Voice synthesizer, voice synthesis method, and computer program product

Similar Documents

Publication Publication Date Title
US7062437B2 (en) Audio renderings for expressing non-audio nuances
US20050065795A1 (en) Text structure for voice synthesis, voice synthesis method, voice synthesis apparatus, and computer program thereof
KR20060051151A (ko) 텍스트를 음성으로 변환하기 위한 시스템 및 방법
JP4872323B2 (ja) Htmlメール生成システム、通信装置、htmlメール生成方法、及び記録媒体
JPH1091389A (ja) テキストを音声に変換するシンセサイザ
JP2007272773A (ja) 対話型インターフェイス制御システム
WO2007138944A1 (ja) 情報付与システム、情報付与方法、情報付与プログラム及び情報付与プログラム記録媒体
GB2444539A (en) Altering text attributes in a text-to-speech converter to change the output speech characteristics
JP3795692B2 (ja) 文字処理装置および方法
US20090281808A1 (en) Voice data creation system, program, semiconductor integrated circuit device, and method for producing semiconductor integrated circuit device
JP6013104B2 (ja) 音声合成方法、装置、及びプログラム
JP2007086309A (ja) 音声合成装置、音声合成方法および音声合成プログラム
JP2002268664A (ja) 音声変換装置及びプログラム
JP2005215888A (ja) テキスト文の表示装置
JP4311710B2 (ja) 音声合成制御装置
JP2005181840A (ja) 音声合成装置及び音声合成プログラム
JP3282151B2 (ja) 音声制御方式
JPH08272388A (ja) 音声合成装置及びその方法
JP2015179198A (ja) 読み上げ装置、読み上げ方法及びプログラム
JP2004294577A (ja) 文字情報音声変換方法
JP2003044072A (ja) 音声読み上げ設定装置、音声読み上げ装置、音声読み上げ設定方法、音声読み上げ設定プログラム及び記録媒体
JP2007127994A (ja) 音声合成方法及び音声合成装置並びにプログラム
JP2007256815A (ja) 音声再生装置、音声再生方法、音声再生プログラム
JP4563418B2 (ja) 音声処理装置、音声処理方法、ならびに、プログラム
JP2004287192A (ja) 合成音声編集装置及び合成音声編集プログラム