JP2000148175A - テキスト音声変換装置 - Google Patents
テキスト音声変換装置Info
- Publication number
- JP2000148175A JP2000148175A JP10283169A JP28316998A JP2000148175A JP 2000148175 A JP2000148175 A JP 2000148175A JP 10283169 A JP10283169 A JP 10283169A JP 28316998 A JP28316998 A JP 28316998A JP 2000148175 A JP2000148175 A JP 2000148175A
- Authority
- JP
- Japan
- Prior art keywords
- text
- speech
- expression
- facial expression
- speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【課題】 電子メールや電子掲示板などの電子化文書の
内容を合成音声によって表現する場合に、発言者のニュ
アンスや表情が、聞き手に伝わるようにして、聞き手の
理解容易性を向上させる。 【解決手段】 テキスト上に表情記号で視覚的に表現し
た発言者のニュアンスや表情を、表情記号マッチング部
3において、メモリ2に記憶されている表情記号・制御
値対応表と照合する。マッチングした表情記号に応じ
て、韻律補正部11、パターン選択部12、効果音発声
部14、BGM(背景音楽)生成部15、音響処理部1
6等を作動させ、発言者のニュアンスや表情を付加させ
る。
内容を合成音声によって表現する場合に、発言者のニュ
アンスや表情が、聞き手に伝わるようにして、聞き手の
理解容易性を向上させる。 【解決手段】 テキスト上に表情記号で視覚的に表現し
た発言者のニュアンスや表情を、表情記号マッチング部
3において、メモリ2に記憶されている表情記号・制御
値対応表と照合する。マッチングした表情記号に応じ
て、韻律補正部11、パターン選択部12、効果音発声
部14、BGM(背景音楽)生成部15、音響処理部1
6等を作動させ、発言者のニュアンスや表情を付加させ
る。
Description
【0001】
【発明の属する技術分野】本発明は、テキスト音声変換
装置、より詳細には、電子メール等の電子化テキスト列
を音声に変換して読み上げる場合、該テキスト上に視覚
的に表現した表情やニュアンスを聴覚に変換して表現す
るようにしたテキスト音声変換装置に関する。
装置、より詳細には、電子メール等の電子化テキスト列
を音声に変換して読み上げる場合、該テキスト上に視覚
的に表現した表情やニュアンスを聴覚に変換して表現す
るようにしたテキスト音声変換装置に関する。
【0002】
【従来の技術】電子メールや電子掲示板などの電子化文
書によるコミュニケーションが広がりを見せるに従い、
外出先からの電話によるアクセスや視覚障害者の利用な
ど、電子化文書の内容を合成音声によって確認する場面
が見られるようになった。この様な電子化文書の内容を
合成音声によって表現する場合の聞き手の理解容易性を
向上させるために、例えば、特開平9−265380号
公報(音声合成方法及び装置)では、引用記号の付けら
れた行を異なった声質で読み上げることにより、特定の
引用記号に対して音声属性を変化させるようにしてい
る。
書によるコミュニケーションが広がりを見せるに従い、
外出先からの電話によるアクセスや視覚障害者の利用な
ど、電子化文書の内容を合成音声によって確認する場面
が見られるようになった。この様な電子化文書の内容を
合成音声によって表現する場合の聞き手の理解容易性を
向上させるために、例えば、特開平9−265380号
公報(音声合成方法及び装置)では、引用記号の付けら
れた行を異なった声質で読み上げることにより、特定の
引用記号に対して音声属性を変化させるようにしてい
る。
【0003】
【発明が解決しようとする課題】上記従来技術は、引用
記号の付けられた行を音質で読み上げるものであり、例
えば、電子メール等の読み上げに際し、文書の本文と引
用部分とで単に出力音声を変えて読み上げるもので、発
言者のニュアンスや表情は全く考慮されていない。
記号の付けられた行を音質で読み上げるものであり、例
えば、電子メール等の読み上げに際し、文書の本文と引
用部分とで単に出力音声を変えて読み上げるもので、発
言者のニュアンスや表情は全く考慮されていない。
【0004】本発明は、上述のごとき実情に鑑みてなさ
れたもので、電子化文書の内容を合成音声によって読み
上げる場合に、聞き手に、発言者のニュアンスや表情が
補足できるようにすることを目的としてなされたもので
ある。
れたもので、電子化文書の内容を合成音声によって読み
上げる場合に、聞き手に、発言者のニュアンスや表情が
補足できるようにすることを目的としてなされたもので
ある。
【0005】
【課題を解決するための手段】請求項1の発明は、発言
者のニュアンスや表情を視覚的に表現した表情記号を含
むテキストに対して、これらニュアンスや表情を聴覚的
表現に置き換えて読み上げるテキスト音声変換装置であ
って、該テキスト音声変換装置は、前記テキストの文書
を音声方式にて出力する音声合成手段と、前記テキスト
に付加されている表情記号を抽出する表情記号列抽出手
段と、表情記号列・制御値対応表記憶手段と、前記抽出
手段によって抽出された表情記号と前記記憶手段に記憶
されている記情記号とを照合するマッチング手段とより
なり、該マッチング手段の出力に応じて前記聴覚的表現
を変えるようにしたことを特徴としたものである。
者のニュアンスや表情を視覚的に表現した表情記号を含
むテキストに対して、これらニュアンスや表情を聴覚的
表現に置き換えて読み上げるテキスト音声変換装置であ
って、該テキスト音声変換装置は、前記テキストの文書
を音声方式にて出力する音声合成手段と、前記テキスト
に付加されている表情記号を抽出する表情記号列抽出手
段と、表情記号列・制御値対応表記憶手段と、前記抽出
手段によって抽出された表情記号と前記記憶手段に記憶
されている記情記号とを照合するマッチング手段とより
なり、該マッチング手段の出力に応じて前記聴覚的表現
を変えるようにしたことを特徴としたものである。
【0006】請求項2の発明は、請求項1の発明におい
て、前記聴覚的表現として合成音声に音声特徴を持たせ
たことを特徴としたものである。
て、前記聴覚的表現として合成音声に音声特徴を持たせ
たことを特徴としたものである。
【0007】請求項3の発明は、請求項2の発明におい
て、韻律や声質を制御するパラメーターへの補正値表を
用いて前記合成音声に音声特徴を持たせるようにしたこ
とを特徴としたものである。
て、韻律や声質を制御するパラメーターへの補正値表を
用いて前記合成音声に音声特徴を持たせるようにしたこ
とを特徴としたものである。
【0008】請求項4の発明は、請求項2の発明におい
て、韻律や声質のパラメーターの時系列パターンへの対
応表を用いて前記合成音声に音声特徴を持たせるように
したことを特徴としたものである。
て、韻律や声質のパラメーターの時系列パターンへの対
応表を用いて前記合成音声に音声特徴を持たせるように
したことを特徴としたものである。
【0009】請求項5の発明は、請求項4の発明におい
て、上記時系列パターンはシステムに予め用意されたも
のであることを特徴としたものである。
て、上記時系列パターンはシステムに予め用意されたも
のであることを特徴としたものである。
【0010】請求項6の発明は、請求項4の発明におい
て、上記時系列パターンは発言者(文書作成者)がエデ
ィターによって作成したものであることを特徴としたも
のである。
て、上記時系列パターンは発言者(文書作成者)がエデ
ィターによって作成したものであることを特徴としたも
のである。
【0011】請求項7の発明は、請求項4の発明におい
て、上記時系列パターンは発言者(文書作成者)の発声
から抽出したものであることを特徴としたものである。
て、上記時系列パターンは発言者(文書作成者)の発声
から抽出したものであることを特徴としたものである。
【0012】請求項8の発明は、請求項1の発明におい
て、前記聴覚的表現として合成音声の背景に音楽を流す
ことを特徴としたものである。
て、前記聴覚的表現として合成音声の背景に音楽を流す
ことを特徴としたものである。
【0013】請求項9の発明は、請求項1の発明におい
て、前記聴覚的表現として効果音を付加することを特徴
としたものである。
て、前記聴覚的表現として効果音を付加することを特徴
としたものである。
【0014】請求項10の発明は、請求項1の発明にお
いて、前記聴覚的表現として音響的処理を施すことを特
徴としたものである。
いて、前記聴覚的表現として音響的処理を施すことを特
徴としたものである。
【0015】
【発明の実施の形態】本発明は、電子メールや電子掲示
板などの電子化文書の内容を合成音声によって表現する
場合に、発言者のニュアンスや表情が、聞き手に伝わる
ようにして、聞き手の理解容易性を向上したものであ
り、その特徴は、以下のように要約される。
板などの電子化文書の内容を合成音声によって表現する
場合に、発言者のニュアンスや表情が、聞き手に伝わる
ようにして、聞き手の理解容易性を向上したものであ
り、その特徴は、以下のように要約される。
【0016】(発明の技術の要約) 1)発言者のニュアンスや表情を視覚的に表現した表情
記号を含むテキストに対して、これらニュアンスや表情
を聴覚的表現に置き換えるテキスト音声変換システム。 1.2)聴覚的表現として合成音声に音声特徴を設定す
る。 1.2.1)音声特徴を設定する方法として韻律や声質
を制御するパラメーターへの補正値表を用いる。 1.2.2)同方法として韻律や声質のパラメーターの
時系列パターンへの対応表を用いる。 1.2.2.1)上記時系列パターンはシステムに予め
用意されたものである。 1.2.2.2)上記時系列パターンは発言者(文書作
成者)がエディターによって作成したものである。 1.2.2.3)上記時系列パターンは発言者(文書作
成者)の発声から抽出したものである。 1.3)聴覚的表現として音響的処理を施す。 1.4)聴覚的表現として効果音を付加する。 1.5)聴覚的表現として合成音声の背景に音楽を流
す。
記号を含むテキストに対して、これらニュアンスや表情
を聴覚的表現に置き換えるテキスト音声変換システム。 1.2)聴覚的表現として合成音声に音声特徴を設定す
る。 1.2.1)音声特徴を設定する方法として韻律や声質
を制御するパラメーターへの補正値表を用いる。 1.2.2)同方法として韻律や声質のパラメーターの
時系列パターンへの対応表を用いる。 1.2.2.1)上記時系列パターンはシステムに予め
用意されたものである。 1.2.2.2)上記時系列パターンは発言者(文書作
成者)がエディターによって作成したものである。 1.2.2.3)上記時系列パターンは発言者(文書作
成者)の発声から抽出したものである。 1.3)聴覚的表現として音響的処理を施す。 1.4)聴覚的表現として効果音を付加する。 1.5)聴覚的表現として合成音声の背景に音楽を流
す。
【0017】図1は、本発明による文書読み上げ装置の
一実施例を説明するための要部構成図で、図中、1はテ
キストより表情記号を抽出する表情記号抽出部、2は表
情記号・制御値対応表が記憶されているメモリ部、3は
テキストから抽出した表情記号とメモリに記憶されてい
る表情記号列を照合する表情記号マッチング部、4はテ
キストの文字列を読み上げる音声合成部、5は音声合成
部4の出力に音響信号を合成するミキサーで、本発明に
おいては、テキスト上に表情記号で視覚的に表現した発
言者のニュアンスや表情を、表情記号マッチング部3に
おいて、メモリ2に記憶されている表情記号・制御値対
応表と照合して検出し、マッチした表情記号に応じて、
韻律補正部11、パターン選択部12(パターン記憶部
13に記憶されているパターンから選択する)、効果音
発生部14、BGM(背景音楽)生成部15、音響処理
部16等へ制御値を送って、合成音声に発言者のニュア
ンスや表情を付加させるようにしている。
一実施例を説明するための要部構成図で、図中、1はテ
キストより表情記号を抽出する表情記号抽出部、2は表
情記号・制御値対応表が記憶されているメモリ部、3は
テキストから抽出した表情記号とメモリに記憶されてい
る表情記号列を照合する表情記号マッチング部、4はテ
キストの文字列を読み上げる音声合成部、5は音声合成
部4の出力に音響信号を合成するミキサーで、本発明に
おいては、テキスト上に表情記号で視覚的に表現した発
言者のニュアンスや表情を、表情記号マッチング部3に
おいて、メモリ2に記憶されている表情記号・制御値対
応表と照合して検出し、マッチした表情記号に応じて、
韻律補正部11、パターン選択部12(パターン記憶部
13に記憶されているパターンから選択する)、効果音
発生部14、BGM(背景音楽)生成部15、音響処理
部16等へ制御値を送って、合成音声に発言者のニュア
ンスや表情を付加させるようにしている。
【0018】表1、表2は、本発明の実施例を説明する
ためのもので、表1は、表情記号によって、読み上げピ
ッチ、速度、パワー等を変えるようにした例、表2は、
表情記号によって、韻律パターン、声質、音響効果、効
果音、音楽等を変えるようにしたものである。
ためのもので、表1は、表情記号によって、読み上げピ
ッチ、速度、パワー等を変えるようにした例、表2は、
表情記号によって、韻律パターン、声質、音響効果、効
果音、音楽等を変えるようにしたものである。
【0019】
【表1】
【0020】
【表2】
【0021】
【発明の効果】以上の説明から明らかなように、本発明
によると、電子メールや電子掲示板などの電子化文書の
内容を合成音声によって表現する場合に、発言者のニュ
アンスや表情が、聞き手に伝わり、聞き手の理解容易性
が向上する。
によると、電子メールや電子掲示板などの電子化文書の
内容を合成音声によって表現する場合に、発言者のニュ
アンスや表情が、聞き手に伝わり、聞き手の理解容易性
が向上する。
【図1】 本発明によるテキスト読み上げ装置の一実施
例を説明するための要部構成図である。
例を説明するための要部構成図である。
1…表情記号抽出部、2…表情記号・制御値対応表、3
…表情記号マッチング部、4…音声合成部、5…ミキサ
ー、11…韻律補正部、12…パターン選択部、13…
パターン記憶部、14…効果音発生部、15…BGM生
成部、16…音響処理部。
…表情記号マッチング部、4…音声合成部、5…ミキサ
ー、11…韻律補正部、12…パターン選択部、13…
パターン記憶部、14…効果音発生部、15…BGM生
成部、16…音響処理部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 北川 博雄 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 有吉 敬 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 小島 裕一 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 櫻又 義文 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 鷹見 淳一 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 呂 彬 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 Fターム(参考) 5D045 AA07 AA08 AA09 BA02 9A001 EE02 HH15 HH18 HH27 JJ14 JJ15 JJ19
Claims (10)
- 【請求項1】 発言者のニュアンスや表情を視覚的に表
現した表情記号を含むテキストに対して、これらニュア
ンスや表情を聴覚的表現に置き換えて読み上げるテキス
ト音声変換装置であって、該テキスト音声変換装置は、
前記テキストの文書を音声方式にて出力する音声合成手
段と、前記テキストに付加されている表情記号を抽出す
る表情記号列抽出手段と、表情記号列・制御値対応表記
憶手段と、前記抽出手段によって抽出された表情記号と
前記記憶手段に記憶されている表情記号とを照合するマ
ッチング手段とよりなり、該マッチング手段の出力に応
じて前記聴覚的表現を変えるようにしたことを特徴とす
るテキスト音声変換装置。 - 【請求項2】 前記聴覚的表現として合成音声に音声特
徴を持たせたことを特徴とする請求項1に記載のテキス
ト音声変換装置。 - 【請求項3】 韻律や声質を制御するパラメーターへの
補正値表を用いて前記合成音声に音声特徴を持たせるよ
うにしたことを特徴とする請求項2に記載のテキスト音
声変換装置。 - 【請求項4】 韻律や声質のパラメーターの時系列パタ
ーンへの対応表を用いて前記合成音声に音声特徴を持た
せるようにしたことを特徴とする請求項2に記載のテキ
スト音声変換装置。 - 【請求項5】 上記時系列パターンはシステムに予め用
意されたものであることを特徴とする請求項4に記載の
テキスト音声変換装置。 - 【請求項6】 上記時系列パターンは発言者がエディタ
ーによって作成したものであることを特徴とする請求項
4に記載のテキスト音声変換装置。 - 【請求項7】 上記時系列パターンは発言者の発声から
抽出したものであることを特徴とする請求項4に記載の
テキスト音声変換装置。 - 【請求項8】 前記聴覚的表現として合成音声の背景に
音楽を流すことを特徴とする請求項1に記載のテキスト
音声変換装置。 - 【請求項9】 前記聴覚的表現として効果音を付加する
ことを特徴とする請求項1に記載のテキスト音声変換装
置。 - 【請求項10】 前記聴覚的表現として音響的処理を施
すことを特徴とする請求項1に記載のテキスト音声変換
装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10283169A JP2000148175A (ja) | 1998-09-10 | 1998-10-06 | テキスト音声変換装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10-255910 | 1998-09-10 | ||
JP25591098 | 1998-09-10 | ||
JP10283169A JP2000148175A (ja) | 1998-09-10 | 1998-10-06 | テキスト音声変換装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000148175A true JP2000148175A (ja) | 2000-05-26 |
Family
ID=26542465
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10283169A Pending JP2000148175A (ja) | 1998-09-10 | 1998-10-06 | テキスト音声変換装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000148175A (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001343991A (ja) * | 2000-05-31 | 2001-12-14 | Sharp Corp | 音声合成処理装置 |
WO2003028010A1 (en) * | 2001-09-25 | 2003-04-03 | Motorola, Inc. | Text-to-speech native coding in a communication system |
DE10163277A1 (de) * | 2001-12-21 | 2003-08-14 | Speech Design Carrier Systems | Verfahren zum Versenden einer Nachricht an eine Rufnummer, sowie Vorrichtung hierfür |
EP1341155A2 (en) * | 2002-02-15 | 2003-09-03 | Canon Kabushiki Kaisha | Information processing apparatus and method with speech synthesis function |
JP2004226505A (ja) * | 2003-01-20 | 2004-08-12 | Toshiba Corp | ピッチパタン生成方法、音声合成方法とシステム及びプログラム |
KR100533218B1 (ko) * | 2003-08-12 | 2005-12-02 | (주)해와달 | 인터넷에서 링크형태의 실시간 음성변환 BBS(Bulletin Board System) 서비스 방법 |
US7260533B2 (en) * | 2001-01-25 | 2007-08-21 | Oki Electric Industry Co., Ltd. | Text-to-speech conversion system |
CN112331223A (zh) * | 2020-11-09 | 2021-02-05 | 合肥名阳信息技术有限公司 | 一种给配音添加背景音乐的方法 |
-
1998
- 1998-10-06 JP JP10283169A patent/JP2000148175A/ja active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001343991A (ja) * | 2000-05-31 | 2001-12-14 | Sharp Corp | 音声合成処理装置 |
US7260533B2 (en) * | 2001-01-25 | 2007-08-21 | Oki Electric Industry Co., Ltd. | Text-to-speech conversion system |
WO2003028010A1 (en) * | 2001-09-25 | 2003-04-03 | Motorola, Inc. | Text-to-speech native coding in a communication system |
US6681208B2 (en) | 2001-09-25 | 2004-01-20 | Motorola, Inc. | Text-to-speech native coding in a communication system |
DE10163277A1 (de) * | 2001-12-21 | 2003-08-14 | Speech Design Carrier Systems | Verfahren zum Versenden einer Nachricht an eine Rufnummer, sowie Vorrichtung hierfür |
DE10163277C2 (de) * | 2001-12-21 | 2003-11-20 | Speech Design Carrier Systems | Verfahren zum Versenden einer Nachricht an eine Rufnummer, sowie Vorrichtung hierfür |
EP1341155A2 (en) * | 2002-02-15 | 2003-09-03 | Canon Kabushiki Kaisha | Information processing apparatus and method with speech synthesis function |
EP1341155A3 (en) * | 2002-02-15 | 2005-06-15 | Canon Kabushiki Kaisha | Information processing apparatus and method with speech synthesis function |
JP2004226505A (ja) * | 2003-01-20 | 2004-08-12 | Toshiba Corp | ピッチパタン生成方法、音声合成方法とシステム及びプログラム |
KR100533218B1 (ko) * | 2003-08-12 | 2005-12-02 | (주)해와달 | 인터넷에서 링크형태의 실시간 음성변환 BBS(Bulletin Board System) 서비스 방법 |
CN112331223A (zh) * | 2020-11-09 | 2021-02-05 | 合肥名阳信息技术有限公司 | 一种给配音添加背景音乐的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1490861B1 (en) | Method, apparatus and computer program for voice synthesis | |
US5555343A (en) | Text parser for use with a text-to-speech converter | |
CN101694772B (zh) | 将文本文字转换成说唱音乐的方法及装置 | |
JP2000148175A (ja) | テキスト音声変換装置 | |
AU769036B2 (en) | Device and method for digital voice processing | |
JPH06337876A (ja) | 文章読み上げ装置 | |
JPS6223888B2 (ja) | ||
JP2740510B2 (ja) | テキスト音声合成方式 | |
JP2001051688A (ja) | 音声合成を用いた電子メール読み上げ装置 | |
JPH0950286A (ja) | 音声合成装置及びこれに使用する記録媒体 | |
JPH05224688A (ja) | テキスト音声合成装置 | |
JP5471138B2 (ja) | 音素符号変換装置および音声合成装置 | |
JP2577372B2 (ja) | 音声合成装置および方法 | |
JPH0644247A (ja) | 音声合成装置 | |
JP2573586B2 (ja) | 規則型音声合成装置 | |
JP2624708B2 (ja) | 音声合成装置 | |
JP2001166787A (ja) | 音声合成装置および自然言語処理方法 | |
JP2573585B2 (ja) | 音声スペクトルパタン生成装置 | |
JP5481958B2 (ja) | 音素符号変換装置および音声合成装置 | |
JPH11175308A (ja) | 文書読み上げ音声の声色指定方法 | |
JPH0756589A (ja) | 音声合成方法 | |
JP2023044436A (ja) | 合成音声生成用データ形成方法、合成音声生成方法及び合成音声生成装置 | |
JPH10274998A (ja) | 文書読み上げ方法および文書読み上げ装置 | |
JPH05173587A (ja) | 音声合成装置 | |
JPH11344997A (ja) | 音声合成方法 |