JP5213036B2 - 音声合成装置及び方法 - Google Patents

音声合成装置及び方法 Download PDF

Info

Publication number
JP5213036B2
JP5213036B2 JP2008203342A JP2008203342A JP5213036B2 JP 5213036 B2 JP5213036 B2 JP 5213036B2 JP 2008203342 A JP2008203342 A JP 2008203342A JP 2008203342 A JP2008203342 A JP 2008203342A JP 5213036 B2 JP5213036 B2 JP 5213036B2
Authority
JP
Japan
Prior art keywords
speech
text data
synthesized speech
text
generated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008203342A
Other languages
English (en)
Other versions
JP2010039293A (ja
Inventor
奈津子 西
直樹 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC Infrontia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Infrontia Corp filed Critical NEC Infrontia Corp
Priority to JP2008203342A priority Critical patent/JP5213036B2/ja
Publication of JP2010039293A publication Critical patent/JP2010039293A/ja
Application granted granted Critical
Publication of JP5213036B2 publication Critical patent/JP5213036B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

本発明はテキストデータで入力された文章を読み上げるための音声合成装置に関する。
ワードプロセッサやテキストエディタ等で作成した文章を認識し、音声信号に変換して読み上げる音声合成装置は、文章のテキストデータを入力するだけで該文章を音声で発話するため、様々な用途で用いられる。
この作成した文章に各種の記号が含まれている場合、背景技術の音声合成装置では、それらの記号を無視したり、記号の名称をそのまま読み上げたりするため、機械的で不自然な発話になってしまう。
このような問題を緩和するため、例えば特許文献1では、( )、「 」、◎、*、#等の記号を検出すると、該記号の文章中における位置でその種類に応じた効果音を発する技術が記載されている。
特開平7−200554号公報
上述した特許文献1では、( )、「 」、◎、*、#等の主として文章内だけで使用する記号をどのように読み上げるかを提案している。そのため、文章を作成した人の感情や発話時の状況を表現する、感嘆符記号「!」や疑問符記号「?」をどのように読み上げるかについては何も記載していない。
例えば、感嘆符記号「!」は、緊急事態が起きたために人に注意を喚起する場合に文章の終端に付加されることがあるが、特許文献1のように単純に感嘆符記号の位置(文章の終端)で効果音を発するだけでは、人に十分な注意を喚起できるとは言えない。そのため、別途、警告音(アラーム)を発する手段等を備える必要があった。
本発明は上記したような背景技術が有する問題点を解決するためになされたものであり、感嘆符記号が含まれた文章の発話時に人に十分な注意を喚起できる音声合成装置及び方法を提供することを目的とする。
上記目的を達成するため本発明の音声合成装置は、テキストデータで入力された文章を読み上げるための音声合成装置であって、
前記テキストデータの内容を解析するテキスト解析部と、
前記テキスト解析部の解析結果に基づき、前記テキストデータの終端文字が感嘆符記号であるか否かを判定し、前記テキストデータの終端文字が感嘆符記号である場合、音声合成装置の処理を制御するための制御識別子を該テキストデータの先頭に配置した、生成すべき合成音声のルールを示す音声合成コマンドを生成するテキスト解析結果制御部と、
音声合成コマンドにしたがって合成音声を生成する合成音声生成部と、
合成音声生成部で生成された合成音声を出力する合成音声出力部と、
を有し、
前記制御識別子は、前記合成音声の先頭に警告音を付加するための制御識別子である。
または、テキストデータで入力された文章を読み上げるための音声合成装置であって、
前記テキストデータの内容を解析するテキスト解析部と、
前記テキスト解析部の解析結果に基づき、前記テキストデータの終端文字が感嘆符記号であるか否かを判定し、前記テキストデータの終端文字が感嘆符記号である場合、音声合成装置の処理を制御するための制御識別子を該テキストデータの先頭に配置した、生成すべき合成音声のルールを示す音声合成コマンドを生成するテキスト解析結果制御部と、
音声合成コマンドにしたがって合成音声を生成する合成音声生成部と、
合成音声生成部で生成された合成音声を出力する合成音声出力部と、
を有し、
前記制御識別子は、前記合成音声出力部をオンにするための制御識別子である。
または、テキストデータで入力された文章を読み上げるための音声合成装置であって、
前記テキストデータの内容を解析するテキスト解析部と、
前記テキスト解析部の解析結果に基づき、前記テキストデータの終端文字が感嘆符記号であるか否かを判定し、前記テキストデータの終端文字が感嘆符記号である場合、音声合成装置の処理を制御するための制御識別子を該テキストデータの先頭に配置した、生成すべき合成音声のルールを示す音声合成コマンドを生成するテキスト解析結果制御部と、
音声合成コマンドにしたがって合成音声を生成する合成音声生成部と、
合成音声生成部で生成された合成音声を出力する合成音声出力部と、
前記テキスト解析部で解析された文章を表示するための表示装置と、
を有し、
前記制御識別子は、前記テキストデータで示される文章を前記表示装置で表示するための制御識別子である
一方、本発明の音声合成方法は、テキストデータで入力された文章を情報処理装置で読み上げるための音声合成方法であって、
前記テキストデータの内容を解析し、
前記テキストデータの解析結果に基づき、前記テキストデータの終端文字が感嘆符記号であるか否かを判定し、
前記テキストデータの終端文字が感嘆符記号である場合、情報処理装置の処理を制御するための制御識別子を該テキストデータの先頭に配置した、生成すべき合成音声のルールを示す音声合成コマンドを生成し、
音声合成コマンドにしたがって合成音声を生成し、
生成された合成音声を出力する音声合成方法であり、
前記制御識別子は、前記合成音声の先頭に警告音を付加するための制御識別子である。
または、テキストデータで入力された文章を情報処理装置で読み上げるための音声合成方法であって、
前記テキストデータの内容を解析し、
前記テキストデータの解析結果に基づき、前記テキストデータの終端文字が感嘆符記号であるか否かを判定し、
前記テキストデータの終端文字が感嘆符記号である場合、情報処理装置の処理を制御するための制御識別子を該テキストデータの先頭に配置した、生成すべき合成音声のルールを示す音声合成コマンドを生成し、
音声合成コマンドにしたがって合成音声を生成し、
生成された合成音声を出力する音声合成方法であり、
前記制御識別子は、生成された合成音声を出力する合成音声出力部をオンにするための制御識別子である。
または、テキストデータで入力された文章を情報処理装置で読み上げるための音声合成方法であって、
前記テキストデータの内容を解析し、
前記テキストデータの解析結果に基づき、前記テキストデータの終端文字が感嘆符記号であるか否かを判定し、
前記テキストデータの終端文字が感嘆符記号である場合、情報処理装置の処理を制御するための制御識別子を該テキストデータの先頭に配置した、生成すべき合成音声のルールを示す音声合成コマンドを生成し、
音声合成コマンドにしたがって合成音声を生成し、
生成された合成音声を出力する音声合成方法であり、
前記制御識別子は、前記テキストデータで示される文章を表示装置で表示するための制御識別子である
本発明によれば、感嘆符記号が含まれた文章の発話時に人に十分な注意を喚起することが可能であり、合成音声をより効果的に人に聞かせることができる。
次に本発明について図面を用いて説明する。
(第1の実施の形態)
第1の実施の形態の音声合成装置は、入力されたテキストの終端文字が感嘆符記号である場合、出力する合成音声に警告音を付加する例である。
図1は第1の実施の形態の音声合成装置の一構成例を示すブロック図である。
図1に示すように、音声合成装置200は、読み上げ対象となる、入力されたテキストデータ100の内容を解析するテキスト解析部210と、テキストデータ100の解析に用いる、単語や文字毎の読みやアクセント、句読点記号、感嘆符記号、疑問符記号等の情報が格納された言語辞書220と、テキスト解析部210の解析結果に基づいて、入力されたテキストデータ100から生成すべき合成音声のルールを示す音声合成コマンド300を生成するテキスト解析結果制御部230と、音声合成コマンド300にしたがって合成音声を生成する合成音声生成部240と、音声合成で用いる音声の最小単位である多数の音声素片が格納された音声素片辞書250とを有する構成である。
合成音声生成部240で生成された合成音声は合成音声出力部(例えば、スピーカー)400により出力(発話)される。読み上げ対象となるテキストデータ100には、漢字仮名交じりの文章を含むものとする。
テキスト解析部210は、入力されたテキストデータ100を先読みし、「、」、「。」等の句読点記号、「!」等の感嘆符記号、「?」等の疑問符記号を検出すると、それらを終端文字と判定して入力されたテキスト100を分割する。
また、テキスト解析部210は、言語辞書220を用いて分割された各テキストデータを解析し、漢字の読み、単語のアクセントを示す情報、句読点記号等に伴う無音区間を付加する。
テキスト解析結果制御部230は、テキストデータの終端文字が感嘆符記号であるか否かを判定すると共に、生成すべき合成音声のルールを示す音声合成コマンド300を生成する。
合成音声生成部240は、テキスト解析結果制御部230から受け取った音声合成コマンド300を基に、音声素片辞書250を用いて合成音声を生成する。
図1に示す音声合成装置200は、例えば、D/A変換器を含むコンピュータ等の情報処理装置、あるいはD/A変換器や音声合成処理用のLSIを含む各種の論理回路等によって実現できる。音声合成装置200を情報処理装置で実現する場合、情報処理装置に後述する音声合成装置200の処理を実行するためのプログラムが記録された記録媒体を備え、該プログラムにしたがってCPUに処理を実行させることで、該情報処理装置を本発明の音声合成装置200として動作させればよい。
次に、本実施形態の音声合成装置の動作について図面を用いて説明する。
図2は第1の実施の形態の音声合成装置の処理手順を示すフローチャートである。
なお、以下では、テキストデータ100として、「ご注意下さい!電池残量が少なくなっています。」または「電池残量が少なくなっていますのでご注意下さい!」が入力された場合を例にして説明する。
音声合成装置200に読上げ対象となるテキストデータ100が入力されると(ステップA1)、テキスト解析部210は、入力されたテキストデータ100を先読みし、「、」、「。」及びその他の句読点記号、「!」及びその他の感嘆符記号、「?」及びその他の疑問符記号等を検出すると、それらを終端文字と判定し、該終端文字を境にして入力されたテキストデータ100を分割する(ステップA2)。例えば、テキストデータ100として上述した「ご注意下さい!電池残量が少なくなっています。」が入力された場合、「ご注意下さい!」と「電池残量が少なくなっています。」とに分割される。テキストデータ100として上述した「電池残量が少なくなっていますのでご注意下さい!」が入力された場合は分割されない。
また、テキスト解析部210は、言語辞書220を用いて分割された各テキストデータを解析し、テキストデータ中に含まれる漢字を読みに変換すると共に、アクセントやポーズを付与する(ステップA3)。例えば、分割後のテキストデータが「ご注意下さい!」の場合、「ゴチュウイクダサイ」に変換する。テキストデータが「電池残量が少なくなっていますのでご注意下さい!」の場合、「デンチザンリョウガスクナクナッテイマスノデゴチュウイクダサイ!」に変換する。なお、ここでは、テキストデータに付与するアクセント等を示す情報は省略する。
テキスト解析結果制御部230は、テキスト解析部210によるテキストデータ100の解析結果を基に、分割された各テキストデータの終端文字が感嘆符記号であるか否かを判定する(ステップA4)。終端文字が感嘆符記号である場合は、該テキストデータの先頭に警告音を発するための制御識別子を付加し(ステップA5)、音声合成コマンド300を生成する(ステップA6)。終端文字が感嘆符記号でない場合は、ステップA5の処理を省略し、ステップA6にて音声合成コマンド300を生成する。
第1の実施の形態の音声合成装置200で生成する音声合成コマンド300の一例を図3に示す。
図3に示すように、テキスト解析結果制御部230は、終端文字が感嘆符記号であった場合、読上げ対象となる分割後のテキストデータ320の先頭に警告音を発するための制御識別子310を配置した音声合成コマンド300を生成する。終端文字が感嘆符記号以外の場合はテキストデータ320のみで音声合成コマンド300が構成される。
合成音声生成部240は、テキスト解析結果制御部230から受け取った音声合成コマンド300を基に、音声素片辞書250を用いて制御識別子に対応する警告音を先頭に付加した合成音声を生成する(ステップA7)。
合成音声生成部240で生成された合成音声は、合成音声出力部400から出力される(ステップA8)。例えば、テキストデータ100として上述した「ご注意下さい!電池残量が少なくなっています。」が入力された場合、「(ピンポーン)ご注意ください。電池残量が無くなっています。」の合成音声が合成音声出力部400から出力される。また、テキストデータ100として上述した「電池残量が少なくなっていますのでご注意下さい!」が入力された場合、「(ピンポーン)電池残量が少なくなっていますのでご注意下さい。」の合成音声が合成音声出力部400から出力される。
本実施形態によれば、テキストの終端文字が感嘆符記号であった場合に、該テキストの合成音声の先頭に警告音を付加することで、感嘆符記号が含まれた文章の発話時に人に十分な注意を喚起することが可能であり、合成音声をより効果的に人に聞かせることができる。
上述したように、感嘆符記号は、主として感情や注意を促す目的で使用される。本実施形態では、例えば、「ご注意ください。」と「ご注意ください!」の合成音声を出力させるとき、入力されたテキストデータの終端文字である「。」と「!」の違いのみで、警告音を鳴らすか否かを簡単に制御できるため、音声合成処理とは別に警告音を鳴らすための手段等を設ける必要が無い。
なお、上述した説明では、音声合成装置に入力されたテキストデータ100の終端文字が感嘆符記号であった場合に、該テキストデータの先頭に警告音を配置する例を示したが、警告音はテキストデータの先頭である必要はなく、文章の区切りの位置であってもよい。
また、例えばテキストデータ100として「電池残量が少なくなっていますのでご注意下さい!」が入力された場合、「電池残量が少なくなっていますので(ピンポーン)ご注意下さい!」の合成音声を合成音声出力部400から出力してもよい。
(第2の実施の形態)
第2の実施の形態の音声合成装置は、入力されたテキストデータの終端文字が感嘆符記号であるか否かに応じて合成音声を出力する合成音声出力部400の動作を制御する例である。音声合成装置の構成は図1に示した第1の実施の形態と同様であるため、その説明は省略する。
図4は第2の実施の形態の音声合成装置の処理手順を示すフローチャートである。なお、図4に示すステップB1〜B4及びB6〜B8の処理は、図2に示したステップA1〜A4及びA6〜A8の処理と同様であるため、ここではその説明を省略する。
第2の実施の形態の音声合成装置では、図4に示すように、ステップB4でテキストデータの終端文字が感嘆符記号であることが検出されると、テキスト解析結果制御部230は合成音声出力部400をオンにするための制御識別子をテキストデータに付加し(ステップB5)、音声合成コマンド300を生成する(ステップB6)。
例えば、デパートやショッピングモール等の施設内のリラクゼーションを目的とした店舗では、施設内の店舗案内放送や業務放送等は可能な限り流さないことが望ましい。一方、地震や火災等の災害時の緊急放送は流す必要がある。
本実施形態の音声合成装置では、例えば、感嘆符記号「!」を含まない通常の店舗案内や業務用等を放送するためのテキストデータのときは店舗に設置してある合成音声出力部400(スピーカー)をオフにしておき、「火事です!火事です!」のように感嘆符記号「!」を含む緊急用のテキストデータのときは、合成音声出力部400をオンにすることで、緊急用の放送のみを流すことができる。
本実施形態によれば、テキストデータの終端文字が感嘆符記号であるか否かに応じて合成音声を出力する合成音声出力部400の動作を制御することで、第1の実施の形態と同様の効果に加えて合成音声を選択的に出力できる。
(第3の実施の形態)
第3の実施の形態の音声合成装置は、入力されたテキストデータの終端文字が感嘆符記号である場合に、合成音声の出力とテキストの画面表示を連動させる例である。
音声合成装置の構成は図1に示した第1の実施の形態と同様であるため、その説明は省略する。また、音声合成装置の処理手順は図4に示した第2の実施の形態と同様であるため、その説明は省略する。
第3の実施の形態の音声合成装置では、ステップB4(図4参照)でテキストデータの終端文字が感嘆符記号であることが検出されると、テキスト解析結果制御部230は該テキストデータで示される文章を不図示の表示装置で表示するための制御識別子をテキストデータに付加し(ステップB5)、音声合成コマンド300を生成する(ステップB6)。その場合、音声合成コマンド300は不図示の表示制御装置(コンピュータ等)にも送信され、該表示制御装置の制御により表示装置に文章等が表示される。
例えば、生鮮食品や家電製品等を販売する店舗では、店舗内放送だけでなく表示装置を用いて提供している各種のサービスやイベントの開催等を周知できることが望ましい。
本実施形態の音声合成装置では、例えば、「ただいま5時より生鮮食品コーナーで、秋刀魚のタイムサービスを実施します!」等の感嘆符記号を含むテキストデータ100が音声合成装置200に入力されたとき、合成音声を放送すると共に店舗に設置された表示装置にテキスト及び生鮮食品コーナーを案内する地図等を表示することができる。
本実施形態によれば、テキストデータ100の終端文字が感嘆符記号であるか否かに応じて合成音声の出力とテキストの画面表示を連動させることで、第1の実施の形態と同様の効果に加えて、作成した文章を人により有効に通知できる。
(第4の実施の形態)
第4の実施の形態の音声合成装置は、入力されたテキストデータの終端文字が感嘆符記号である場合に、合成音声に用いる話者データベースを切り替える例である。
音声合成装置の構成は図1に示した第1の実施の形態と同様であるため、その説明は省略する。また、音声合成装置の処理手順は図4に示した第2の実施の形態と同様であるため、その説明は省略する。
第4の実施の形態の音声合成装置では、ステップB4(図4参照)でテキストデータの終端文字が感嘆符記号であることが検出されると、テキスト解析結果制御部230は該テキストデータの合成音声の生成に用いる話者データベースを指示する制御識別子をテキストデータに付加し(ステップB5)、音声合成コマンド300を生成する(ステップB6)。その場合、合成音声生成部240は、予め音声素片辞書250に格納された、制御識別子で指定される話者データベースを用いて合成音声を生成する。
例えば、アミューズメント等の施設では、施設の案内放送や業務放送等は客層に合わせて放送用の話者を選択できることが望ましく、地震や火災等の災害時の緊急放送は人が聞き取ることが容易な話者を選択できることが望ましい。
本実施形態の音声合成装置では、例えば、感嘆符記号「!」を含まない通常の施設の案内放送等を放送するためのテキストデータのときは、子供達が喜ぶようなヒーローやキャラクター等の話者データベースを用いて合成音声を生成し、「火事です!火事です!」等の感嘆符記号が付加された緊急用のテキストデータのときは、人が聞き取ることが容易な高音質な話者データベースを用いて合成音声を生成できる。
本実施形態によれば、テキストデータの終端文字が感嘆符記号であるか否かに応じて合成音声に用いる話者データベースを切り替えることで、第1の実施の形態と同様の効果に加えて、合成音声の話者を発話時の状況に応じて選択できる。
(第5の実施の形態)
第5の実施の形態の音声合成装置は、入力されたテキストデータに含まれる感嘆符記号の種類に応じて、上述した第1の実施の形態〜第4の実施の形態で示した音声合成装置の処理を組み合わせる例である。
音声合成装置の構成は図1に示した第1の実施の形態と同様であるため、その説明は省略する。また、音声合成装置の処理手順は図4に示した第2の実施の形態と同様であるため、その説明は省略する。
第5の実施の形態の音声合成装置では、ステップB4(図4参照)でテキストデータの終端文字が感嘆符記号であることが検出されると、テキスト解析結果制御部230は該感嘆符記号の種類に応じて複数種類の制御識別子をテキストデータに付加し(ステップB5)、音声合成コマンド300を生成する(ステップB6)。
第5の実施の形態の音声合成装置200で生成する音声合成コマンド300の一例を図5に示す。
図5に示すように、音声合成コマンド300は、制御識別子の始まりを示す開始識別子330、複数種類の制御識別子310、制御識別子の終わりを示す終了識別子340及び読上げ対象となるテキストデータ320から構成される。制御識別子の数は感嘆符記号の種類に応じて設定される。
合成音声生成部240は、テキスト解析結果制御部230から受け取った音声合成コマンド300に基づいて合成音声を生成する。
本実施形態の音声合成装置では、例えば、「ただいま5時より生鮮食品コーナーで、秋刀魚のタイムサービスを実施します!!」等の感嘆符記号が付加されたテキストデータ100が音声合成装置200に入力されたとき、警告音を追加した合成音声を放送すると共に、店舗に設置された表示装置にテキスト及び生鮮食品コーナーを案内する地図等を表示することができる。そのため、テキストの内容をより有効に人に通知できる。
また、例えば、テキストデータの終端に感嘆符記号「!!!」が付加されていた場合は、合成音声出力部400のON制御の実施、警告音を追加した合成音声の生成、話者データベースの切り替え等を同時に実行できる。
本実施形態によれば、テキストデータ100に含まれる感嘆符記号の種類に応じて第1の実施の形態〜第4の実施の形態で示した音声合成装置の処理を組み合わせることで、第1の実施の形態と同様の効果に加えて、様々な状況に応じた最適な通知形態が選択できる。
第1の実施の形態の音声合成装置の一構成例を示すブロック図である。 第1の実施の形態の音声合成装置の処理手順を示すフローチャートである。 第1の実施の形態の音声合成装置で生成する音声合成コマンドの構成例を示す模式図である。 第2の実施の形態の音声合成装置の処理手順を示すフローチャートである。 第5の実施の形態の音声合成装置で生成する音声合成コマンドの構成例を示す模式図である。
符号の説明
100、320 テキストデータ
200 音声合成装置
210 テキスト解析部
220 言語辞書
230 テキスト解析結果制御部
240 合成音声生成部
250 音声素片辞書
300 音声合成コマンド
310 制御識別子
330 開始識別子
340 終了識別子
400 合成音声出力部

Claims (8)

  1. テキストデータで入力された文章を読み上げるための音声合成装置であって、
    前記テキストデータの内容を解析するテキスト解析部と、
    前記テキスト解析部の解析結果に基づき、前記テキストデータの終端文字が感嘆符記号であるか否かを判定し、前記テキストデータの終端文字が感嘆符記号である場合、音声合成装置の処理を制御するための制御識別子を該テキストデータの先頭に配置した、生成すべき合成音声のルールを示す音声合成コマンドを生成するテキスト解析結果制御部と、
    音声合成コマンドにしたがって合成音声を生成する合成音声生成部と、
    合成音声生成部で生成された合成音声を出力する合成音声出力部と、
    を有し、
    前記制御識別子は、前記合成音声の先頭に警告音を付加するための制御識別子である音声合成装置。
  2. テキストデータで入力された文章を読み上げるための音声合成装置であって、
    前記テキストデータの内容を解析するテキスト解析部と、
    前記テキスト解析部の解析結果に基づき、前記テキストデータの終端文字が感嘆符記号であるか否かを判定し、前記テキストデータの終端文字が感嘆符記号である場合、音声合成装置の処理を制御するための制御識別子を該テキストデータの先頭に配置した、生成すべき合成音声のルールを示す音声合成コマンドを生成するテキスト解析結果制御部と、
    音声合成コマンドにしたがって合成音声を生成する合成音声生成部と、
    合成音声生成部で生成された合成音声を出力する合成音声出力部と、
    を有し、
    前記制御識別子は、前記合成音声出力部をオンにするための制御識別子である音声合成装置。
  3. テキストデータで入力された文章を読み上げるための音声合成装置であって、
    前記テキストデータの内容を解析するテキスト解析部と、
    前記テキスト解析部の解析結果に基づき、前記テキストデータの終端文字が感嘆符記号であるか否かを判定し、前記テキストデータの終端文字が感嘆符記号である場合、音声合成装置の処理を制御するための制御識別子を該テキストデータの先頭に配置した、生成すべき合成音声のルールを示す音声合成コマンドを生成するテキスト解析結果制御部と、
    音声合成コマンドにしたがって合成音声を生成する合成音声生成部と、
    合成音声生成部で生成された合成音声を出力する合成音声出力部と、
    前記テキスト解析部で解析された文章を表示するための表示装置と、
    を有し、
    前記制御識別子は、前記テキストデータで示される文章を前記表示装置で表示するための制御識別子である音声合成装置。
  4. 前記テキスト解析結果制御部は、
    前記テキストデータに含まれる感嘆符記号の数に応じた複数種類の制御識別子を含む音声合成コマンドを生成する請求項1からのいずれか1項記載の音声合成装置。
  5. テキストデータで入力された文章を情報処理装置で読み上げるための音声合成方法であって、
    前記テキストデータの内容を解析し、
    前記テキストデータの解析結果に基づき、前記テキストデータの終端文字が感嘆符記号であるか否かを判定し、
    前記テキストデータの終端文字が感嘆符記号である場合、情報処理装置の処理を制御するための制御識別子を該テキストデータの先頭に配置した、生成すべき合成音声のルールを示す音声合成コマンドを生成し、
    音声合成コマンドにしたがって合成音声を生成し、
    生成された合成音声を出力する音声合成方法であり、
    前記制御識別子は、前記合成音声の先頭に警告音を付加するための制御識別子である音声合成方法。
  6. テキストデータで入力された文章を情報処理装置で読み上げるための音声合成方法であって、
    前記テキストデータの内容を解析し、
    前記テキストデータの解析結果に基づき、前記テキストデータの終端文字が感嘆符記号であるか否かを判定し、
    前記テキストデータの終端文字が感嘆符記号である場合、情報処理装置の処理を制御するための制御識別子を該テキストデータの先頭に配置した、生成すべき合成音声のルールを示す音声合成コマンドを生成し、
    音声合成コマンドにしたがって合成音声を生成し、
    生成された合成音声を出力する音声合成方法であり、
    前記制御識別子は、生成された合成音声を出力する合成音声出力部をオンにするための制御識別子である音声合成方法。
  7. テキストデータで入力された文章を情報処理装置で読み上げるための音声合成方法であって、
    前記テキストデータの内容を解析し、
    前記テキストデータの解析結果に基づき、前記テキストデータの終端文字が感嘆符記号であるか否かを判定し、
    前記テキストデータの終端文字が感嘆符記号である場合、情報処理装置の処理を制御するための制御識別子を該テキストデータの先頭に配置した、生成すべき合成音声のルールを示す音声合成コマンドを生成し、
    音声合成コマンドにしたがって合成音声を生成し、
    生成された合成音声を出力する音声合成方法であり、
    前記制御識別子は、前記テキストデータで示される文章を表示装置で表示するための制御識別子である音声合成方法。
  8. 前記テキストデータに含まれる感嘆符記号の数に応じた複数種類の制御識別子を含む音声合成コマンドを生成する請求項からのいずれか1項記載の音声合成方法。
JP2008203342A 2008-08-06 2008-08-06 音声合成装置及び方法 Expired - Fee Related JP5213036B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008203342A JP5213036B2 (ja) 2008-08-06 2008-08-06 音声合成装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008203342A JP5213036B2 (ja) 2008-08-06 2008-08-06 音声合成装置及び方法

Publications (2)

Publication Number Publication Date
JP2010039293A JP2010039293A (ja) 2010-02-18
JP5213036B2 true JP5213036B2 (ja) 2013-06-19

Family

ID=42011903

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008203342A Expired - Fee Related JP5213036B2 (ja) 2008-08-06 2008-08-06 音声合成装置及び方法

Country Status (1)

Country Link
JP (1) JP5213036B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3260275B2 (ja) * 1996-03-14 2002-02-25 シャープ株式会社 活字入力で通話が可能な通信通話装置
JP3603008B2 (ja) * 2000-05-31 2004-12-15 シャープ株式会社 音声合成処理装置
JP4651168B2 (ja) * 2000-08-23 2011-03-16 任天堂株式会社 合成音声出力装置およびその方法並びに記録媒体
CN1961350A (zh) * 2004-05-27 2007-05-09 皇家飞利浦电子股份有限公司 用于修改消息的方法和系统

Also Published As

Publication number Publication date
JP2010039293A (ja) 2010-02-18

Similar Documents

Publication Publication Date Title
US7472065B2 (en) Generating paralinguistic phenomena via markup in text-to-speech synthesis
US10043519B2 (en) Generation of text from an audio speech signal
JP2007206317A (ja) オーサリング方法、オーサリング装置およびプログラム
WO2006123539A1 (ja) 音声合成装置
JP2007086316A (ja) 音声合成装置、音声合成方法、音声合成プログラムおよび音声合成プログラムを記憶したコンピュータ読み取り可能な記憶媒体
JP4797597B2 (ja) 語学学習装置
WO2005093713A1 (ja) 音声合成装置
JP5198046B2 (ja) 音声処理装置及びそのプログラム
WO2018034169A1 (ja) 対話制御装置および方法
KR20160131505A (ko) 음성 변환 방법 및 음성 변환 장치
JP2006337667A (ja) 発音評価方法、音素列モデル学習方法、これらの方法を用いた装置、プログラム、および記録媒体。
US20140278404A1 (en) Audio merge tags
JP5213036B2 (ja) 音声合成装置及び方法
JP2005215888A (ja) テキスト文の表示装置
JP2017021245A (ja) 語学学習支援装置、語学学習支援方法および語学学習支援プログラム
JP2004325905A (ja) 外国語学習装置および外国語学習プログラム
JP4409279B2 (ja) 音声合成装置及び音声合成プログラム
US20080228497A1 (en) Method For Communication and Communication Device
JP2006349787A (ja) 音声合成方法および装置
Tsuji The case study of high pitch register in English and in Japanese: Does high pitch register relate to politeness
JP2015179198A (ja) 読み上げ装置、読み上げ方法及びプログラム
JP6957069B1 (ja) 学習支援システム
JPWO2013008385A1 (ja) 音声合成装置、音声合成方法および音声合成プログラム
JP6498346B1 (ja) 外国語学習支援システムおよび外国語学習支援方法ならびにプログラム
JP6274470B1 (ja) 上下発声母音表記方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110311

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120712

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130109

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130220

R150 Certificate of patent or registration of utility model

Ref document number: 5213036

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160308

Year of fee payment: 3

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees