JP6428229B2 - テキストメッセージ音声化装置、テキストメッセージ音声化方法、テキストメッセージ音声化プログラム - Google Patents

テキストメッセージ音声化装置、テキストメッセージ音声化方法、テキストメッセージ音声化プログラム Download PDF

Info

Publication number
JP6428229B2
JP6428229B2 JP2014252654A JP2014252654A JP6428229B2 JP 6428229 B2 JP6428229 B2 JP 6428229B2 JP 2014252654 A JP2014252654 A JP 2014252654A JP 2014252654 A JP2014252654 A JP 2014252654A JP 6428229 B2 JP6428229 B2 JP 6428229B2
Authority
JP
Japan
Prior art keywords
message
data
voice conversion
reference data
conversion reference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014252654A
Other languages
English (en)
Other versions
JP2016114729A (ja
Inventor
裕生 渡邉
裕生 渡邉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Priority to JP2014252654A priority Critical patent/JP6428229B2/ja
Publication of JP2016114729A publication Critical patent/JP2016114729A/ja
Application granted granted Critical
Publication of JP6428229B2 publication Critical patent/JP6428229B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephone Function (AREA)

Description

本発明は、テキストメッセージを音声合成によって音声化するテキストメッセージ音声化装置、テキストメッセージ音声化方法、テキストメッセージ音声化プログラムに関する。
テキストメッセージを音声合成によって音声化するテキストメッセージ音声化装置は、カーナビゲーション装置等の各種の装置で用いられている。テキストメッセージを音声合成によって音声化するためには、話者モデルデータが必要である。
話者モデルデータは、テキストメッセージを音声に変換するために必要な音素、単語、文節等の多数の音声要素データを含むため、データ量が膨大である。また、1つの話者モデルデータを作成するには多大な工数が必要となる。
特開2010−102163号公報
複数の作成者それぞれによって作成されたテキストメッセージをテキストメッセージ音声化装置によって音声化する場合がある。このような場合、複数の作成者のテキストメッセージそれぞれに対して用いる話者モデルデータを異ならせれば、複数の作成者の声や話し方が異なって、作成者の違いを認識することができる。
ところが、上記のように話者モデルデータはデータ量が膨大であり、話者モデルデータを作成するには多大の工数が必要であるから、複数の作成者それぞれに対応させた話者モデルデータを用意し、テキストメッセージ音声化装置に記憶させておくことは困難である。
本発明はこのような問題点に鑑み、同じ話者モデルデータを用いたとしても、作成者が異なる複数のテキストメッセージを聴覚的に異なる状態で音声化することができるテキストメッセージ音声化装置、テキストメッセージ音声化方法、テキストメッセージ音声化プログラムを提供することを目的とする。
本発明は、上述した従来の技術の課題を解決するため、テキストメッセージと、前記テキストメッセージを作成したメッセージ作成者を示す情報とを含むメッセージデータを取得するメッセージデータ取得部と、前記テキストメッセージを所定の話者モデルデータを用いて音声データに変換する音声変換部と、前記テキストメッセージの読み上げ速度と、読み上げ音程と、読み上げ音量と、前記音声データによる音声を複数のスピーカより音声を出力する際のバランスを示す音声出力定位とのうちの少なくとも1つのパラメータの設定値を含む音声変換参照データを、メッセージ作成者ごとに異なるように、前記メッセージ作成者に対応させて記憶する記憶部と、前記メッセージデータ取得部が所定のメッセージデータを取得したとき、前記記憶部より、前記所定のメッセージデータのメッセージ作成者に対応して記憶されている音声変換参照データに含まれるパラメータの設定値を読み出し、前記音声変換部が、前記所定のメッセージデータに含まれているテキストメッセージを、前記話者モデルデータと、前記パラメータの設定値とを用いて音声データに変換するよう、前記音声変換部を制御する制御部とを備え、前記メッセージデータ取得部が所定のメッセージデータを取得して、前記記憶部に、前記所定のメッセージデータのメッセージ作成者に対応した音声変換参照データが記憶されていないとき、前記制御部は、前記音声変換参照データが複数のパラメータの設定値を含む場合にはパラメータデータの設定値の組み合わせパターンが重複しないように新規の音声変換参照データを生成し、前記音声変換参照データが1つのパラメータの設定値のみを含む場合にはパラメータの設定値が重複しないように新規の音声変換参照データを生成する音声変換参照データ生成部を有することを特徴とするテキストメッセージ音声化装置を提供する。
また、本発明は、上述した従来の技術の課題を解決するため、テキストメッセージと、前記テキストメッセージを作成したメッセージ作成者を示す情報とを含む所定のメッセージデータを取得し、前記テキストメッセージの読み上げ速度と、読み上げ音程と、読み上げ音量と、音声を複数のスピーカより音声を出力する際のバランスを示す音声出力定位とのうちの少なくとも1つのパラメータの設定値を含む音声変換参照データが、メッセージ作成者ごとに異なるように、前記メッセージ作成者に対応させて記憶されている記憶部より、前記メッセージ作成者に対応する前記パラメータの設定値を読み出し、前記所定のメッセージデータに含まれているテキストメッセージを、所定の話者モデルデータと、前記記憶部より読み出した前記パラメータの設定値とを用いて音声データに変換し、前記メッセージデータを取得して、前記記憶部に、前記メッセージ作成者に対応した前記音声変換参照データが記憶されていないとき、前記音声変換参照データが複数のパラメータの設定値を含む場合にはパラメータデータの設定値の組み合わせパターンが重複しないように新規の音声変換参照データを生成し、前記音声変換参照データが1つのパラメータの設定値のみを含む場合にはパラメータの設定値が重複しないように新規の音声変換参照データを生成することを特徴とするテキストメッセージ音声化方法を提供する。
さらに、本発明は、上述した従来の技術の課題を解決するため、コンピュータに、テ キストメッセージと、前記テキストメッセージを作成したメッセージ作成者を示す情報とを含むメッセージデータを取得したとき、前記テキストメッセージの読み上げ速度と、読み上げ音程と、読み上げ音量と、音声を複数のスピーカより音声を出力する際のバランスを示す音声出力定位とのうちの少なくとも1つのパラメータの設定値を含む音声変換参照データが、メッセージ作成者ごとに異なるように、前記メッセージ作成者に対応させて記憶されている記憶部より、前記パラメータの設定値を読み出すステップと、前記メッセージデータに含まれているテキストメッセージを、所定の話者モデルデータと、前記記憶部より読み出した前記パラメータの設定値とを用いて音声データに変換するステップと、前記メッセージデータを取得して、前記記憶部に、前記メッセージ作成者に対応した前記音声変換参照データが記憶されていないとき、前記音声変換参照データが複数のパラメータの設定値を含む場合にはパラメータデータの設定値の組み合わせパターンが重複しないように新規の音声変換参照データを生成し、前記音声変換参照データが1つのパラメータの設定値のみを含む場合にはパラメータの設定値が重複しないように新規の音声変換参照データを生成するステップと、を実行させることを特徴とするテキストメッセージ音声化プログラムを提供する。

本発明のテキストメッセージ音声化装置、テキストメッセージ音声化方法、テキストメッセージ音声化プログラムによれば、同じ話者モデルデータを用いたとしても、作成者が異なる複数のテキストメッセージを聴覚的に異なる状態で音声化することができる。
各実施形態のテキストメッセージ音声化装置を示すブロック図である。 第1実施形態のテキストメッセージ音声化装置における制御部101の機能的な内部構成を示すブロック図である。 第1実施形態のテキストメッセージ音声化装置の動作、第1実施形態のテキストメッセージ音声化方法及びテキストメッセージ音声化プログラムによる処理を説明するためのフローチャートである。 メッセージデータの形式の一例を示す図である。 第1実施形態で用いる音声変換参照データの一例を示す図である。 音声変換参照データの新規作成及び登録の動作を説明するための図である。 第2〜第4実施形態で用いる音声変換参照データの一例を示す図である。 第2実施形態のテキストメッセージ音声化装置の動作、第2実施形態のテキストメッセージ音声化方法及びテキストメッセージ音声化プログラムによる処理を説明するためのフローチャートである。 第3実施形態のテキストメッセージ音声化装置における制御部101の機能的な内部構成を示すブロック図である。 第3実施形態において、テキストメッセージにメッセージ送信者の紹介文を示す文字列を付加する第1の例を説明するための部分的なフローチャートである。 第3実施形態において、テキストメッセージにメッセージ送信者の紹介文を示す文字列を付加する第2の例を説明するための部分的なフローチャートである。 第4実施形態のテキストメッセージ音声化装置における制御部101の機能的な内部構成を示すブロック図である。
以下、各実施形態のテキストメッセージ音声化装置、テキストメッセージ音声化方法、テキストメッセージ音声化プログラムについて、添付図面を参照して説明する。
<第1実施形態>
図1において、テキストメッセージ音声化装置100には、外部システム200と、音声出力部300とが接続されている。テキストメッセージ音声化装置100と外部システム200とは、インターネットを介して接続されていてもよい。
外部システム200は、例えばインスタントメッセンジャ等のメッセージデータを管理するシステムである。
テキストメッセージ音声化装置100は、テキストメッセージ音声化装置100の全体を制御する制御部101と、制御部101とそれぞれ接続されたメッセージデータ取得部102と記憶部103と音声変換部104とを備える。
メッセージデータ取得部102は、外部システム200からメッセージデータを取得する。メッセージデータ取得部102が外部システム200に対してメッセージデータの送信を要求することにより、メッセージデータ取得部102がメッセージデータを取得してもよいし、メッセージデータ取得部102が受動的にメッセージデータを取得してもよい。
記憶部103は、音声変換部104でメッセージデータを音声変換するために用いる話者モデルデータの識別情報と、後述するパラメータデータとを含む音声変換参照データを、メッセージデータの送信者(作成者)ごとに記憶している。
音声変換部104は、少なくとも1つの話者モデルデータを記憶している。記憶部103に記憶されている音声変換参照データには、複数の送信者に対して、共通の話者モデルデータが割り当てられていることがある。
図2に示すように、制御部101は、機能的な内部構成として、音声変換参照データ生成部1011と、音声変換参照データ書き込み部1012と、音声変換参照データ読み出し部1013とを有する。音声変換参照データ生成部1011と、音声変換参照データ書き込み部1012と、音声変換参照データ読み出し部1013は、ソフトウェアによって構成することができる。
制御部101は、メッセージデータ取得部102が取得したメッセージデータに含まれるテキストメッセージと、音声変換参照データ読み出し部1013が記憶部103より読み出した音声変換参照データとを、所定の形式で音声変換部104に供給する。
音声変換部104は、テキストメッセージを、所定の話者モデルデータを用い、さらに、音声変換参照データを参照して音声データに変換する。
制御部101は、音声データ(音声信号)を音声出力部300に供給して、音声として出力させる。音声出力部300は、スピーカと増幅部等で構成される。音声データは、制御部101または図示していないD/A変換器によってアナログ信号に変換されてスピーカに供給される。
図3に示すフローチャートを用いて、図1のテキストメッセージ音声化装置の動作、テキストメッセージ音声化装置で実行されるテキストメッセージ音声化方法をさらに説明する。
図3において、制御部101は、ステップS01にて、メッセージデータ取得部102が取得したメッセージデータを取り込む。メッセージデータは、一例として、図4に示すようなデータである。メッセージデータの形式は例えばXML形式である。
図4に示すように、メッセージデータは、messageタグを有し、messageタグは、メッセージに関する各種のタグを格納している。accountタグは、メッセージ送信者(メッセージ作成者)を一意に特定できるアカウント名を格納する。genderタグはメッセージ送信者の性別を格納し、languageタグはメッセージの言語を格納する。textタグは、メッセージ本文であるテキストメッセージを格納する。
制御部101は、ステップS02にて、記憶部103に、メッセージ送信者に対応する音声変換参照データが存在するか否かを判定する。
図5は、記憶部103に記憶されている音声変換参照データの一例を示している。音声変換参照データは、アカウント名と、使用する話者モデルデータを特定する識別情報と、パラメータデータの設定値とを含む。ここでは、パラメータデータとして、読み上げ速度、読み上げ音声、読み上げ音量、音声出力定位それぞれの設定値が設定されている。パラメータデータは、これらのうちの少なくとも1つの設定値であってもよい。
図5では、読み上げ速度、読み上げ音声、読み上げ音量が全てノーマルなる設定値に設定されており、音声出力定位はL5:R5なる設定値に設定されている。音声出力定位のL5:R5とは、左右2つのスピーカにおける左スピーカと右スピーカとより音声を出力させるバランスを示す。音声出力定位は、前後左右の4つのスピーカより音声を出力させるバランスであってもよく、複数のスピーカより音声を出力させるバランスを示せばよい。
制御部101は、メッセージデータに含まれるaccountタグに記述されているアカウント名を含む音声変換参照データが存在しているか否かによって、メッセージ送信者に対応する音声変換参照データが存在するか否かを判定することができる。
制御部101は、メッセージ送信者に対応する音声変換参照データが存在すれば(YES)、処理をステップS05に移行させ、存在しなければ(NO)、処理をステップS03に移行させる。
音声変換参照データ生成部1011は、ステップS03にて、新規の音声変換参照データを、パラメータデータの設定値が重複しないように生成する。話者モデルデータは他の音声変換参照データにおけるそれと重複していてもよい。
音声変換参照データ生成部1011は、音声変換参照データが複数のパラメータの設定値を含む場合には、パラメータデータの設定値の組み合わせパターンが重複しないように新規の音声変換参照データを生成すればよい。
音声変換参照データ生成部1011は、音声変換参照データが1つのパラメータの設定値のみを含む場合には、パラメータの設定値が重複しないように新規の音声変換参照データを生成する。
複数のテキストメッセージを聴覚的に異なる状態で音声化するには、パラメータデータの設定値を大きく異ならせるのがよい。そこで、例えば、読み上げ速度、読み上げ音声、読み上げ音量の設定値をそれぞれロー、ノーマル、ハイの3段階に設定したとすると、パラメータデータの設定値の組み合わせパターンは比較的限られたパターンとなる。
音声変換参照データ書き込み部1012は、ステップS04にて、新たに生成した音声変換参照データを記憶部103に書き込んで登録し、処理をステップS05に移行させる。
図6の(a)に示すように、記憶部103に、アカウント名がaccount0と設定されている図5に示す音声変換参照データが予め登録されているとする。
図4に示すアカウント名account1を有するメッセージ送信者がメッセージデータを送信したとする。
音声変換参照データ書き込み部1012は、ステップS04にて、記憶部103にアカウント名account1に対応する音声変換参照データを登録する。よって、図6の(b)に示すように、記憶部103には、既存のアカウント名account0に対応する音声変換参照データと、アカウント名account1に対応する音声変換参照データとが記憶された状態となる。
図6の(b)に示すように、アカウント名account1に対応する音声変換参照データは、例えば読み上げ速度と読み上げ音程の設定値がハイに設定される。音声変換参照データが複数のパラメータデータを含む場合には、少なくとも1つのパラメータデータの設定値を変更すればよい。アカウント名account1に対応する話者モデルデータは、アカウント名account0に対応する話者モデルデータと同じである。
ところで、音声変換部104が例えば男性用の話者モデルデータと、女性用の話者モデルデータとを記憶している場合には、音声変換参照データ生成部1011は、音声変換参照データを生成する際に、メッセージデータに含まれるgenderタグに記述されている性別に対応した話者モデルデータを選択すればよい。
図3に戻り、音声変換参照データ読み出し部1013は、ステップS05にて、記憶部103からメッセージ送信者に対応する音声変換参照データを読み出して、後述するデータを音声変換部104に供給する。
制御部101が音声変換部104へと供給するデータの形式は例えば次のとおりである。制御部101は、textタグに記述されているテキストメッセージと、音声変換参照データに含まれる話者モデルデータを示す識別情報と、音声出力定位以外のパラメータデータとを用いて、例えばSSML形式のデータを生成する。
制御部101は、SSML形式のデータと音声出力定位のパラメータデータとを音声変換部104に供給する。音声出力定位のパラメータデータをSSML形式のデータと別にしているのは、音声出力定位のパラメータデータをSSML形式のデータに記述できないからである。
制御部101は、ステップS06にて、音声変換部104による音声変換処理を実行させる。音声変換部104は、入力されたSSML形式のデータに記述されている識別情報の話者モデルデータを用い、SSML形式のデータに記述されているパラメータデータ及び音声出力定位のパラメータデータに従って、テキストメッセージを音声変換する。
制御部101は、ステップS07にて、音声変換部104によって変換された音声データに基づく音声を音声出力部300より出力させて、処理を終了させる。
制御部101をマイクロコンピュータによって構成し、コンピュータプログラム(テキストメッセージ音声化プログラム)によって、マイクロコンピュータに図3に示す処理を実行させるように構成してもよい。
以上のように、第1実施形態によれば、音声変換部104によってテキストメッセージを音声変換する際に用いる話者モデルデータが同じであっても、メッセージ作成者が異なる複数のテキストメッセージを聴覚的に異なる状態で音声化することができる。
<第2実施形態>
第2実施形態のテキストメッセージ音声化装置、テキストメッセージ音声化方法、テキストメッセージ音声化プログラムを、第1実施形態におけるそれとは異なる点を中心に説明する。
第2実施形態においては、図7に示すように、音声変換参照データに、その音声変換参照データの最終利用日時の情報を追加している。
図8に示す第2実施形態のフローチャートにおいて、図3に示す第1実施形態のフローチャートと同一のステップには同一の符号を付し、説明を省略する。図8において、制御部101は、ステップS02にて、記憶部103に、メッセージ送信者に対応する音声変換参照データが存在しなければ(NO)、処理をステップS08に移行させる。
制御部101は、ステップS08にて、パラメータデータの設定値の組み合わせパターンが不足しているか否かを判定する。パラメータデータが1つのみであれば、パラメータデータの設定値が不足しているか否かを判定すればよい。
制御部101は、組み合わせパターンが不足していれば(YES)、処理をステップS09に移行させ、組み合わせパターンが不足していなければ(NO)、処理をステップS03に移行させる。
音声変換参照データ生成部1011は、ステップS09にて、最終利用日時が最も古い音声変換参照データを削除し、新規の音声変換参照データを生成して、処理をステップS05に移行させる。
具体的には、音声変換参照データ生成部1011が、最終利用日時が最も古い音声変換参照データのアカウント名を他のアカウント名に書き換えた音声変換参照データを生成し、音声変換参照データ書き込み部1012が記憶部103に書き込めばよい。これに伴って、最終利用日時が更新される。
ステップS09の処理によって、最終利用日時が最も古い、あるメッセージ送信者に対して設定されている音声変換参照データが消去され、新規のメッセージ送信者に対して、音声変換参照データが設定されることになる。
第2実施形態によれば、第1実施形態と同じ効果に加えて、パラメータデータの設定値の組み合わせパターンが不足した場合でも、新規のメッセージ送信者に対して音声変換参照データを設定することができる。
上記のように、パラメータデータの設定値の組み合わせパターンは限られているので、第2実施形態は有効となる。
<第3実施形態>
第3実施形態のテキストメッセージ音声化装置、テキストメッセージ音声化方法、テキストメッセージ音声化プログラムを、第1または第2実施形態におけるそれとは異なる点を中心に説明する。以下の第3実施形態の構成及び動作は、第1実施形態に対して加えてもよいし、第2実施形態に対して加えてもよい。
図9に示すように、第3実施形態においては、制御部101は、機能的な内部構成として、文字列付加部1014をさらに有する。文字列付加部1014は、ソフトウェアによって構成することができる。
図10において、制御部101は、ステップS03にて新規の音声変換参照データを生成して、ステップS04にて音声変換参照データを記憶部103に登録する。文字列付加部1014は、ステップS11にて、テキストメッセージの前にメッセージ送信者の紹介文を示す文字列を付加して、処理をステップS05に移行させる。
記憶部103には、言語ごとの紹介文のテンプレートが記憶されている。例えば日本語のテンプレートを例にすると、記憶部103には、一例として、「こんにちは。???です。」というテンプレートが記憶されている。
制御部101は、languageタグに記述されている言語のテンプレートを読み出し、文字列付加部1014は、テンプレートにaccountタグに記述されているアカウント名を追記してメッセージ送信者の紹介文を生成する。
languageタグが日本語であることを示せば、文字列付加部1014は、上記のテンプレートにおける「???」の部分をアカウント名に置換した文字列を生成して、メッセージ送信者の紹介文としてテキストメッセージの前に付加する。英語等の他の言語の場合も同様である。
文字列付加部1014は、新規の音声変換参照データを生成したタイミング以外でも、テキストメッセージの前にメッセージ送信者の紹介文を付加してもよい。例えば、文字列付加部1014は、音声変換参照データの最終利用日時から所定期間以上経過して、その音声変換参照データを利用するときに、テキストメッセージの前に紹介文を付加する。
音声変換参照データの最終利用日時から所定期間以上経過した場合にテキストメッセージに紹介文を付加する場合には、音声変換参照データの形式を、図7のように、最終利用日時の情報を含む音声変換参照データとする。
図11に示すように、制御部101は、ステップS02,S04に続くステップS12にて、最終利用日時から所定期間以上経過したか否かを判定する。制御部101は、所定期間以上経過していれば(YES)、処理をステップS13に移行させ、所定期間以上経過していなければ(NO)、処理をステップS05に移行させる。
文字列付加部1014は、ステップS13にて、テキストメッセージの前にメッセージ送信者の紹介文を示す文字列を付加して、ステップS05に移行させる。
第3実施形態によれば、第1実施形態または第2実施形態と同じ効果に加えて、次のような効果を奏する。
第1の例である図10に示す処理によれば、新しいメッセージ送信者がテキストメッセージを送信してきて、音声変換部104がテキストメッセージを音声変換するときに、メッセージ送信者の紹介文を再生することができる。よって、新しいメッセージ送信者が誰であるかを認識することが可能となる。
第2の例である図11に示す処理によれば、音声変換参照データの最終利用日時から所定期間以上経過した状態でその音声変換参照データを利用して、音声変換部104がテキストメッセージを音声変換するときに、メッセージ送信者の紹介文を再生することができる。よって、期間が経過することによってメッセージ送信者が誰であるかを忘れていたとしても、メッセージ送信者が誰であるかを認識することが可能となる。
<第4実施形態>
第4実施形態のテキストメッセージ音声化装置、テキストメッセージ音声化方法、テキストメッセージ音声化プログラムを、第1〜第3実施形態におけるそれとは異なる点を中心に説明する。以下の第4実施形態の構成及び動作は、第1〜第3実施形態それぞれに対して加えてもよい。
図12に示すように、第4実施形態においては、制御部101は、機能的な内部構成として、音声変換参照データ変更部1015をさらに有する。音声変換参照データ変更部1015は、ソフトウェアによって構成することができる。図12における文字列付加部1014は省略可能である。
第4実施形態においても、音声変換参照データの形式を、図7のように、最終利用日時の情報を含む音声変換参照データとする。
まず、メッセージ送信者Aが、テキストメッセージを送信してきたとする。記憶部103に記憶されている、メッセージ送信者Aに対して設定されている音声出力定位が左右3:7であったとする。このとき、音声変換部104は、音声出力定位を左右3:7として、テキストメッセージを音声変換する。
その後、メッセージ送信者Bが、テキストメッセージを送信してきたとする。記憶部103に記憶されている、メッセージ送信者Bに対して設定されている音声出力定位が左右5:5であったとする。このとき、音声変換部104は、音声出力定位を左右5:5として、テキストメッセージを音声変換する。
さらにその後、再びメッセージ送信者Bが、テキストメッセージを送信してきたとする。このとき、メッセージ送信者Bに対応する音声変換参照データの最終利用日時からの経過期間は、メッセージ送信者Aに対応する音声変換参照データのそれよりも短くなる。
音声変換参照データ変更部1015は、記憶部103に記憶されている、メッセージ送信者Bに対して設定されている音声出力定位を、左右3:7に変更して、音声変換部104は、音声出力定位を左右3:7として、テキストメッセージを音声変換する。
併せて、音声変換参照データ変更部1015は、記憶部103に記憶されている、メッセージ送信者Aに対して設定されている音声出力定位が左右3:7を左右5:5に変更する。
このように、第4実施形態は、最終利用日時からの経過期間に応じて音声出力定位の設定値を変更する音声変換参照データ変更部を有する。第4実施形態によれば、例えば次のような場合に効果を発揮する。左右のスピーカが車両に搭載されているとする。ここでは、車両は右側にステアリングが配置されているとする。
メッセージ送信者Aが送信したテキストメッセージを音声変換部104によって音声データに変換し、音声出力定位を左右3:7として、左右のスピーカで再生すると、運転者は、運転者側に近付いた位置からの音声を聞くことになる。
次に、メッセージ送信者Bが送信したテキストメッセージを音声変換部104に音声データに変換して、音声出力定位を左右5:5として、左右のスピーカで再生したとする。この場合、音声は左右のほぼ中央から聞こえることになるので、運転者は、音声出力定位を左右3:7とした場合と比較して、運転者から離れた位置からの音声を聞くことになる。
その後、再びメッセージ送信者Bが送信したテキストメッセージを音声変換部104に音声データに変換して、音声出力定位を左右3:7として、左右のスピーカで再生すると、運転者は、運転者側に近付いた位置からの音声を聞くことになる。
メッセージ送信者Bは、メッセージ送信者Aよりも直近にメッセージデータを送信している。よって、メッセージ送信者Bは、メッセージ送信者Aよりも、メッセージ受信者とメッセージ送信者とでメッセージデータを送受信する際の話題の中心となっている可能性が高い。
運転者は、話題の中心となっている可能性が高いメッセージ送信者による音声を運転者側に近付いた位置から聞き、そうでないメッセージ送信者による音声を運転者から比較的離れた位置から聞くことにより、両者を容易に識別することが可能となる。
本発明は以上説明した各実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々変更可能である。図5等に示すように、音声変換参照データは話者モデルデータを特定するための識別情報を含むが、音声変換部104が有する話者モデルデータが1つのみであれば、話者モデルデータの識別情報を省略してもよい。
101 制御部
102 メッセージデータ取得部
103 記憶部
104 音声変換部
1011 音声変換参照データ生成部
1014 文字列付加部
1015 音声変換参照データ変更部

Claims (6)

  1. テキストメッセージと、前記テキストメッセージを作成したメッセージ作成者を示す情
    報とを含むメッセージデータを取得するメッセージデータ取得部と、
    前記テキストメッセージを所定の話者モデルデータを用いて音声データに変換する音声
    変換部と、
    前記テキストメッセージの読み上げ速度と、読み上げ音程と、読み上げ音量と、前記音
    声データによる音声を複数のスピーカより音声を出力する際のバランスを示す音声出力
    定位とのうちの少なくとも1つのパラメータの設定値を含む音声変換参照データを、メッセージ作成者ごとに異なるように、前記メッセージ作成者に対応させて記憶する記憶部と、
    前記メッセージデータ取得部が所定のメッセージデータを取得したとき、前記記憶部よ
    り、前記所定のメッセージデータのメッセージ作成者に対応して記憶されている音声変
    換参照データに含まれるパラメータの設定値を読み出し、前記音声変換部が、前記所定の
    メッセージデータに含まれているテキストメッセージを、前記話者モデルデータと、前記
    パラメータの設定値とを用いて音声データに変換するよう、前記音声変換部を制御する制御部とを備え、
    前記メッセージデータ取得部が所定のメッセージデータを取得して、前記記憶部に、前記所定のメッセージデータのメッセージ作成者に対応した音声変換参照データが記憶されていないとき、
    前記制御部は、
    前記音声変換参照データが複数のパラメータの設定値を含む場合にはパラメータデータ
    の設定値の組み合わせパターンが重複しないように新規の音声変換参照データを生成し、
    前記音声変換参照データが1つのパラメータの設定値のみを含む場合にはパラメータの設定値が重複しないように新規の音声変換参照データを生成する音声変換参照データ生成部を有する
    ことを特徴とするテキストメッセージ音声化装置。
  2. 前記音声変換参照データは、前記音声変換参照データを利用した最終利用日時を示す情
    報を含み、
    前記音声変換参照データ生成部は、パラメータデータの設定値の組み合わせパターンま
    たはパラメータの設定値が重複しない新規の音声変換参照データを生成することができ
    ないとき、前記最終利用日時を示す情報に基づいて、最終利用日時が最も古い音声変換参
    照データを削除して、新規の音声変換参照データを生成する
    ことを特徴とする請求項記載のテキストメッセージ音声化装置。
  3. 前記制御部は、
    前記メッセージデータに、前記メッセージ作成者を示す情報に基づいて前記メッセージ
    作成者の紹介文である文字列を付加する文字列付加部を有する
    ことを特徴とする請求項1または2に記載のテキストメッセージ音声化装置。
  4. 前記音声変換参照データは、前記パラメータとして前記音声出力定位の設定値と、前記音声変換参照データを利用した最終利用日時を示す情報とを含み、
    前記制御部は、
    最終利用日時からの経過期間に応じて前記音声出力定位の設定値を変更する音声変換参
    照データ変更部を有する
    ことを特徴とする請求項に記載のテキストメッセージ音声化装置。
  5. テキストメッセージと、前記テキストメッセージを作成したメッセージ作成者を示す情報とを含む所定のメッセージデータを取得し、
    前記テキストメッセージの読み上げ速度と、読み上げ音程と、読み上げ音量と、音声を
    複数のスピーカより音声を出力する際のバランスを示す音声出力定位とのうちの少なく
    とも1つのパラメータの設定値を含む音声変換参照データが、メッセージ作成者ごとに異なるように、前記メッセージ作成者に対応させて記憶されている記憶部より、前記メッセージ作成者に対応する前記パラメータの設定値を読み出し、
    前記所定のメッセージデータに含まれているテキストメッセージを、所定の話者モデル
    データと、前記記憶部より読み出した前記パラメータの設定値とを用いて音声データに
    変換し、
    前記メッセージデータを取得して、前記記憶部に、前記メッセージ作成者に対応した前記音声変換参照データが記憶されていないとき、
    前記音声変換参照データが複数のパラメータの設定値を含む場合にはパラメータデータ
    の設定値の組み合わせパターンが重複しないように新規の音声変換参照データを生成し、
    前記音声変換参照データが1つのパラメータの設定値のみを含む場合にはパラメータの設定値が重複しないように新規の音声変換参照データを生成する
    ことを特徴とするテキストメッセージ音声化方法。
  6. コンピュータに、
    テキストメッセージと、前記テキストメッセージを作成したメッセージ作成者を示す情
    報とを含むメッセージデータを取得したとき、前記テキストメッセージの読み上げ速度
    と、読み上げ音程と、読み上げ音量と、音声を複数のスピーカより音声を出力する際のバ
    ランスを示す音声出力定位とのうちの少なくとも1つのパラメータの設定値を含む音声変換参照データが、メッセージ作成者ごとに異なるように、前記メッセージ作成者に対応させて記憶されている記憶部より、前記パラメータの設定値を読み出すステップと、
    前記メッセージデータに含まれているテキストメッセージを、所定の話者モデルデータ
    と、前記記憶部より読み出した前記パラメータの設定値とを用いて音声データに変換す
    るステップと、
    前記メッセージデータを取得して、前記記憶部に、前記メッセージ作成者に対応した前記音声変換参照データが記憶されていないとき、
    前記音声変換参照データが複数のパラメータの設定値を含む場合にはパラメータデータ
    の設定値の組み合わせパターンが重複しないように新規の音声変換参照データを生成し、
    前記音声変換参照データが1つのパラメータの設定値のみを含む場合にはパラメータの設定値が重複しないように新規の音声変換参照データを生成するステップと、
    を実行させることを特徴とするテキストメッセージ音声化プログラム。
JP2014252654A 2014-12-15 2014-12-15 テキストメッセージ音声化装置、テキストメッセージ音声化方法、テキストメッセージ音声化プログラム Active JP6428229B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014252654A JP6428229B2 (ja) 2014-12-15 2014-12-15 テキストメッセージ音声化装置、テキストメッセージ音声化方法、テキストメッセージ音声化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014252654A JP6428229B2 (ja) 2014-12-15 2014-12-15 テキストメッセージ音声化装置、テキストメッセージ音声化方法、テキストメッセージ音声化プログラム

Publications (2)

Publication Number Publication Date
JP2016114729A JP2016114729A (ja) 2016-06-23
JP6428229B2 true JP6428229B2 (ja) 2018-11-28

Family

ID=56141615

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014252654A Active JP6428229B2 (ja) 2014-12-15 2014-12-15 テキストメッセージ音声化装置、テキストメッセージ音声化方法、テキストメッセージ音声化プログラム

Country Status (1)

Country Link
JP (1) JP6428229B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102212363B1 (ko) * 2019-04-26 2021-02-05 주식회사 타바바 백팩 장치 및 이를 지원하는 서비스 시스템

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3287281B2 (ja) * 1997-07-31 2002-06-04 トヨタ自動車株式会社 メッセージ処理装置
JP2006012056A (ja) * 2004-06-29 2006-01-12 Canon Inc 携帯端末装置、電子メール読み上げ方法、制御プログラムおよび記憶媒体
JP4992591B2 (ja) * 2007-07-25 2012-08-08 日本電気株式会社 通信システム及び通信端末

Also Published As

Publication number Publication date
JP2016114729A (ja) 2016-06-23

Similar Documents

Publication Publication Date Title
KR102582291B1 (ko) 감정 정보 기반의 음성 합성 방법 및 장치
JP4478939B2 (ja) 音声処理装置およびそのためのコンピュータプログラム
JP6129134B2 (ja) 音声対話装置、音声対話システム、端末、音声対話方法およびコンピュータを音声対話装置として機能させるためのプログラム
JP6078964B2 (ja) 音声対話システム及びプログラム
US8315873B2 (en) Sentence reading aloud apparatus, control method for controlling the same, and control program for controlling the same
JP6470097B2 (ja) 通訳装置、方法およびプログラム
US11527251B1 (en) Voice message capturing system
WO2005093713A1 (ja) 音声合成装置
CN101111885A (zh) 使用抽出的声音数据生成应答声音的声音识别系统
US11308951B2 (en) Information processing apparatus, information processing method, and program
CN105244027B (zh) 生成谐音文本的方法和系统
KR20160131505A (ko) 음성 변환 방법 및 음성 변환 장치
JP2013025299A (ja) 書き起こし支援システムおよび書き起こし支援方法
JP6428229B2 (ja) テキストメッセージ音声化装置、テキストメッセージ音声化方法、テキストメッセージ音声化プログラム
JP2019045831A (ja) 音声処理装置、方法およびプログラム
JP5818753B2 (ja) 音声対話システム及び音声対話方法
JP5689774B2 (ja) 対話型情報発信装置、対話型情報発信方法、及びプログラム
JP6596903B2 (ja) 情報提供システムおよび情報提供方法
WO2020110744A1 (ja) 情報処理装置、情報処理方法、およびプログラム
JP3581044B2 (ja) 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体
CN113035181A (zh) 语音数据处理方法、设备和系统
KR20200053242A (ko) 차량용 음성 인식 시스템 및 그 제어 방법
JP2019211737A (ja) 音声処理装置および翻訳装置
JP2015187738A (ja) 音声翻訳装置、音声翻訳方法および音声翻訳プログラム
JP2005283646A (ja) 音声認識率推定装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170330

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180316

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180327

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180508

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181002

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181015

R150 Certificate of patent or registration of utility model

Ref document number: 6428229

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150