JP2005003795A - 車載情報提供装置 - Google Patents
車載情報提供装置 Download PDFInfo
- Publication number
- JP2005003795A JP2005003795A JP2003165254A JP2003165254A JP2005003795A JP 2005003795 A JP2005003795 A JP 2005003795A JP 2003165254 A JP2003165254 A JP 2003165254A JP 2003165254 A JP2003165254 A JP 2003165254A JP 2005003795 A JP2005003795 A JP 2005003795A
- Authority
- JP
- Japan
- Prior art keywords
- music
- information
- storage means
- reproduction
- fade
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management Or Editing Of Information On Record Carriers (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
【課題】文字情報を合成音声にて再生する際に、音響信号のレベル調整を行う機械的制御を行うことなく、フェードインおよびフェードアウト処理が施された音楽とともに提供する。
【解決手段】フェードイン処理が施された第1の音楽、フェードアウト処理が施された第2の音楽、および、第1の音楽と第2の音楽との間に挿入された状態で再生される第3の音楽を予め記憶部2に記憶しておく。文字情報をユーザに合成音声にて提供する際に、合成音声と、第1〜第3の音楽とをミキシング部4にて合成し、合成した情報をスピーカ6から出力する。
【選択図】図1
【解決手段】フェードイン処理が施された第1の音楽、フェードアウト処理が施された第2の音楽、および、第1の音楽と第2の音楽との間に挿入された状態で再生される第3の音楽を予め記憶部2に記憶しておく。文字情報をユーザに合成音声にて提供する際に、合成音声と、第1〜第3の音楽とをミキシング部4にて合成し、合成した情報をスピーカ6から出力する。
【選択図】図1
Description
【0001】
【発明の属する技術分野】
本発明は、車両の乗員に提供する文字情報を合成音声にて読み上げる際に、音楽をミキシングして乗員に提供する車載情報提供装置に関する。
【0002】
【従来の技術】
あるディスクやトラックの曲から他のディスクやトラックへの曲間の音量を揃えてつなぐように編集して再生または録音する場合に、最初に入力したデジタル音響信号のレベルに基づいて、後から入力されるデジタル音響信号の信号レベルを制御する音響信号処理装置が知られている(特許文献1参照)。
【0003】
【特許文献1】
特開平11−126424号公報
【0004】
【発明が解決しようとする課題】
しかしながら、従来の装置では、音響信号のフェードイン・フェードアウト処理を行うために、入力される音響信号を検出する音響信号レベル検出部と、信号レベルを制御するための音量制御部とが必要となるために、装置全体としてコストが増大するという問題があった。
【0005】
本発明は、音響信号のレベル調整を行う機械的制御を用いることなく、音楽のフェードイン、フェードアウトを可能とする車載情報提供装置を提供する。
【0006】
【課題を解決するための手段】
本発明による車載情報提供装置は、フェードイン処理が施された第1の音楽、フェードアウト処理が施された第2の音楽、および、第1の音楽と第2の音楽との間に挿入された状態で再生される第3の音楽を予め記憶しておき、文字情報をユーザに合成音声にて提供する際に、合成音声を出力するための音声データと、第1〜第3の音楽とを合成した合成情報を再生することを特徴とする。
【0007】
【発明の効果】
本発明による車載情報提供装置によれば、音響信号のレベル調整を行う機械的制御を行うことなく、フェードインおよびフェードアウト処理が施された音楽とともに、文字情報を合成音声にてユーザに提供することができる。
【0008】
【発明の実施の形態】
図1は、本発明による車載情報提供装置の一実施の形態の構成を示す図である。一実施の形態における車載情報提供装置は、制御部1と、記憶部2と、TTSエンジン3と、ミキシング部4と、増幅部5と、スピーカ6と、オーディオ再生部7と、インタフェース8とを備える。
【0009】
一実施の形態における車載情報提供装置では、インタフェース8を介して接続された携帯電話(不図示)を介して、図示しない情報センターと接続し、情報センターから様々な情報をダウンロードする。ダウンロードする情報はテキストデータであり、情報の内容に応じて画像データが含まれることもある。ユーザに提供される情報は、例えば、交通情報、天気予報、ニュース、飲食店情報などである。
【0010】
ここでは、情報センターから取得してユーザに提供するテキスト情報を文字情報コンテンツと呼ぶ。この文字情報コンテンツには、後述するTTSエンジン3が処理を行うための中間言語と呼ばれるデータも含まれる。例えば、情報ソースが「今日の天気は晴れです」というテキストデータの場合には、「きょうの[S]てんきは[S]はれです」のように、TTSエンジン3に入力するデータが中間言語である。なお、[S]はスペースを表す。この文字情報コンテンツには、TTS機能により音声読み上げを行う必要があることを示すタグ(データ)、および、情報の種類(交通情報、ニュース、天気予報など)を判別するためのタグが含まれている。情報センターからダウンロードした情報は、記憶部2に記憶される。
【0011】
TTSエンジン3は、記憶部2に記憶されているテキスト情報を合成音声にて読み上げるTTS(Text To Speech)機能を有し、テキストデータを音声データに変換する。一実施の形態における車載情報提供装置では、情報(文字情報コンテンツ)を合成音声にて読み上げる際に、音楽をBGMとして同時に再生する。BGMとして再生する音楽(背景音楽)には、圧縮音楽、MIDIと呼ばれる電子楽器音楽や、CD(Compact Disc)、MD(Mini Disc)に記録される音楽などが含まれる。オーディオ再生部7は、CDやMDなどに記録されている音楽を再生する。BGMとして再生する音楽や、オーディオ再生部7で再生される音楽は、記憶部2に予め記憶させておく。
【0012】
ミキシング部4は、DSP(Digital Signal Processor)により構成されており、合成音声にて読み上げられる文字情報コンテンツと、BGMとして用いられる音楽とをミキシング、すなわち、合成する。ここでのミキシングとは、文字情報コンテンツの再生の背景で音楽を再生することを意味する。以下では、合成音声にて読み上げられる文字情報コンテンツとBGMとをミキシングしたものを番組コンテンツと呼ぶ。ミキシング部4でミキシングされた番組コンテンツは、増幅部5にて増幅された後、スピーカ6から出力される。
【0013】
制御部1は、図示しないCPU,ROM,RAMを備え、TTSエンジン3により音声データに変換された文字情報の読み上げ総時間を計算し、ミキシング部4でミキシングを行うためのBGMを選択する。また、合成音声にて読み上げられた文字情報の残り再生時間を計測する機能を有する。BGMの選択方法については、後述する。
【0014】
ミキシング部4でミキシングを行うためのBGMは、合成音声にて読み上げられる情報の種類に応じて、複数種類用意される。例えば、ニュース情報に対応したBGM、スポーツ情報に対応したBGMなどを用意しておき、BGMを聞いたユーザが提供される情報の種類を迅速に把握できるようにする。これらのBGMは、情報の種類に対応するタグを有する。
【0015】
一実施の形態における車載情報提供装置では、番組コンテンツと音楽コンテンツとを交互に再生する。番組コンテンツと音楽コンテンツとを交互に再生するために組み合わせたものが1つの番組となる。番組の一例を図2に示す。図2に示す番組コンテンツには、交通情報、天気予報、スポーツ情報、経済情報、芸能情報が含まれている。なお、番組内で再生される音楽コンテンツと、上述したBGMとは異なるものである。すなわち、音楽コンテンツとは、例えば、CDやMDに記録されている曲のことであり、BGMは、番組コンテンツを生成するために用いられるミキシング専用の曲のことで、後述するように、短時間(例えば、5秒)のものである。
【0016】
図3は、一実施の形態における車載情報提供装置により行われる番組再生の手順を示すフローチャートである。ステップS10から始まる処理は、主に制御部1により行われ、音楽コンテンツの再生が終了したことを制御部1が検知した時に開始する。なお、番組の最初に再生されるコンテンツが音楽コンテンツではなく、番組コンテンツの場合には、ユーザによる番組の再生要求があった時に開始される。
【0017】
ステップS10では、ユーザに提供する情報(コンテンツ)に、TTS機能により読み上げる必要のある文字情報コンテンツが含まれているか否かを判定する。この判定は、コンテンツファイルのヘッダーに付属しているタグに基づいて行われる。ユーザに提供する情報の中に、文字情報コンテンツが含まれていると判定すると、ステップS20に進み、文字情報コンテンツが含まれていないと判定すると、本フローチャートによる処理を終了する。
【0018】
ステップS20では、文字情報コンテンツとミキシングするBGMを選択する。制御部1は、文字情報コンテンツの種類、および、合成音声による読み上げ時間に基づいて、3種類のBGM(BGM1,BGM2,BGM3)を選択する。BGM1は、文字情報コンテンツの読み上げ再生を行う前に再生されるフェードイン用のBGMであり、音量が少しずつ大きくなるように録音されている。BGM2は、文字情報コンテンツの読み上げ再生が行われている間に再生されるBGMである。このBGM2は、フェードイン処理もフェードアウト処理も施されていない。BGM3は、文字情報コンテンツの読み上げ再生が終了する際に再生されるフェードアウト用のBGMであり、音量が少しずつ小さくなっていくように録音されている。
【0019】
上述したように、BGM1〜BGM3は、文字情報コンテンツの種類に応じて、複数用意されている。また、BGM2は、それぞれの文字情報コンテンツの種類に対応させて、再生時間の異なるものを複数用意しておく。すなわち、文字情報コンテンツの読み上げ再生中は、後述する方法により選択されたBGM2を繰り返し再生することにより、長さの異なる文字情報コンテンツに対応することができる。BGMは、最初にBGM1が再生された後にBGM2が繰り返し再生され、最後にフェードアウト用のBGM3が再生される。従って、BGM1,BGM2,BGM3は、再生時の聞き心地に違和感が生じないように、曲調を滑らかに接続できるものを用意しておく。
【0020】
制御部1で行われるBGMの選択処理の方法を図4に示すフローチャートを用いて説明する。ステップS200では、文字情報コンテンツファイルのヘッダーに付属する属性タグに基づいて、情報の種類を判別する。情報の種類を判別すると、ステップS210に進む。ステップS210では、文字情報コンテンツを合成音声にて読み上げる総時間を算出する。読み上げ時間は、ファイルサイズ、および、ファイル中のテキストデータ部分の最初の番地と末尾の番地とに基づいて算出する。読み上げ時間を算出すると、ステップS220に進む。
【0021】
ステップS220では、記憶部2に記憶されている複数のBGM2の中から、ステップS200で判別した情報の種類、および、ステップS210で算出した読み上げ総時間に基づいて、適切なBGM2を選択する。適切なBGM2を選択する方法について説明する。
【0022】
ステップS210で算出した読み上げ総時間をtT、BGM2を1回再生するの要する時間をt2−x、BGM2を繰り返し再生する回数をα、読み上げ総時間tTとBGM2の再生時間αt2−xとの差をβとすると、t2−x=(tT−β)/αの関係式を満たすBGM2を選択する。ただし、tT≧αt2−x、t2−x≫βの関係を満たすものとし、α、t2−xは、βの値が最小となるものを選ぶ。
【0023】
一例として、読み上げ総時間tT=33.1秒、t2−1=9秒、t2−2=8秒、t2−3=7秒、t2−4=5秒の4種類のBGM2がある場合について説明する。BGM2は、tTをt2−1〜t2−4で割った余りβが最も小さくなるものを選択する。実際に計算すると、下記のようになる。
(i)33.1/t2−1=33.1/9=3余り6.1秒
(ii)33.1/t2−2=33.1/8=4余り1.1秒
(iii)33.1/t2−3=33.1/7=4余り5.1秒
(iv)33.1/t2−4=33.1/5=6余り3.1秒
【0024】
従って、余りβが最小となるt2−2のBGM2が選択される。この場合、BGM2を繰り返し再生する回数αは、上記演算の商の4となり、余りβは、読み上げ総時間tTとBGM2の再生時間αt2−2との差βと同値の1.1秒となる。
【0025】
ステップS220でBGM2を選択すると、ステップS230に進む。ステップS230では、ステップS220で選択したBGM2が有する情報の種類のタグと同一のタグを有するBGM1およびBGM3を選択する。BGM1およびBGM3を選択すると、BGMの選択処理を終了し、図3に示すフローチャートのステップS30に進む。
【0026】
ステップS30では、ミキシング部4により、文字情報コンテンツと、ステップS20で選択したBGMとをミキシングする。図5(a)は、BGMの再生イメージを示す図である。ステップS30に続くステップS40では、ステップS20で選択したBGM1の再生を開始して、ステップS50に進む。ステップS50では、BGM1の再生が終了したか否かを判定する。BGM1の再生が終了していないと判定すると、終了するまで待機し、終了したと判定するとステップS60に進む。
【0027】
ステップS60では、TTS機能により、文字情報コンテンツの合成音声による読み上げ処理を開始して、ステップS70に進む。ステップS70では、ステップS20で選択したBGM2の再生を開始する。なお、実際には、ステップS60で行う文字情報コンテンツの読み上げ処理と、ステップS70で行うBGM2の再生開始処理は、同時に行われる。ステップS70に続くステップS80では、BGM2の再生残り回数が0より大きいか否かを判定する。BGM2の再生残り回数が0より大きい、すなわち、1回以上であると判定すると、ステップS90に進む。ステップS90では、再生中のBGM2の再生終了後に、再びBGM2の再生を行い、ステップS80に戻る。
【0028】
すなわち、図4に示すフローチャートのステップS220においてBGM2を選択した際に、選択したBGM2の繰り返し再生回数αも決定されるので、繰り返し再生回数α回、BGM2の再生が繰り返し行われる。ステップS80において、BGM2の再生残り回数が0となったと判定すると、ステップS100に進む。ステップS100では、最後に再生するBGM2の再生が終了したか否かを判定する。再生が終了していないと判定すると、再生が終了するまでステップS100で待機し、再生が終了したと判定するとステップS110に進む。
【0029】
ステップS110では、ステップS20で選択したBGM3の再生を開始して、ステップS120に進む。ステップS120では、BGM3の再生が終了したか否かを判定する。再生が終了していないと判定すると、再生が終了するまでステップS120で待機し、再生が終了したと判定すると、図3に示すフローチャートによる処理を終了する。
【0030】
なお、繰り返し再生するBGM2の再生処理が終了して、BGM3の再生が始まる時刻と、文字情報コンテンツの読み上げ処理が終了する時刻との間に時間差βが存在するが(図5(b)参照)、上述したように、BGM2を選択する際にβが最小となるものを選択している。従って、BGM3の再生時のフェードアウトの初期段階で文字情報コンテンツの読み上げ処理が終了するので、ユーザが聞き心地に違和感を感じることはない。
【0031】
−BGMを選択する別の方法−
BGM2を選択する別の方法について説明する。上述した方法では、1つのBGM2を選択して、文字情報コンテンツの読み上げ処理を行っている間に繰り返し再生した。ここでは、複数のBGM2を選択する方法について説明する。
【0032】
一例として、読み上げ総時間tT=33.1秒、t2−1=9秒、t2−2=8秒、t2−3=7秒、t2−4=5秒の4種類のBGM2がある場合について説明する。再生時間t2−1〜t2−4のBGM2の繰り返し再生回数をそれぞれA,B,C,Dとすると、33.1≒9A+8B+7C+5Dの関係が成り立つA〜Dを求め、合計再生回数α’=A+B+C+Dが最小となるA〜Dの組み合わせを選択する。
【0033】
図6は、33.1≒9A+8B+7C+5Dの関係が成り立つA〜Dの組み合わせと、そのときの合計再生回数α’とをまとめた表である。例えば、図6に示す▲1▼の組み合わせの場合、再生時間t2−1のBGM2を2回、再生時間t2−2のBGM2を1回、再生時間t2−3のBGM2を1回、それぞれ再生することを意味する。ただし、再生の順序は順不同とする。
【0034】
図6に示すように、合計再生回数α’が最小となるA〜Dの組み合わせは、(A,B,C,D)=(2,1,1,0)、(1,3,0,0)となる▲1▼および▲3▼の組み合わせである。従って、▲1▼および▲3▼の組み合わせのうちのいずれか一方の組み合わせを選択する。
【0035】
図7は、上述した方法により、複数のBGM2を選択した時のBGMの再生イメージを示す図である。1つのBGM2を選択する方法と比べると、文字情報コンテンツの読み上げ時間tTと、BGMの総再生時間との差βは小さくなる。上述した例では、1つのBGM2を選択した時のβは1.1秒であったが、複数のBGM2を選択した時のβは0.1秒(=33.1−9・2−8・1−7・1または33.1−9・1−8・3)となる。
【0036】
このように、一実施の形態における車載情報提供装置によれば、フェードイン処理が施された第1の音楽(BGM1)、フェードアウト処理が施された第2の音楽(BGM3)、および、第1の音楽と第2の音楽との間に挿入された状態で再生される第3の音楽(BGM2)を予め記憶部2に記憶させておき、文字情報をユーザに合成音声にて提供する際に、合成音声と、第1〜第3の音楽とを合成した合成情報を再生する。これにより、合成音声にてユーザに情報を提供する際に、フェードイン処理およびフェードアウト処理を施したBGMを同時に再生するので、利用者の聞き心地を向上させることができる。また、音楽のフェードイン処理、および、フェードアウト処理を行うのに、音量レベルの機械的調整を行う必要がないため、処理の簡易化により装置全体のコストを低減することができる。
【0037】
一実施の形態における車載情報提供装置によれば、フェードイン処理が施されたBGM1の再生とフェードアウト処理が施されたBGM3の再生の間で再生されるBGM2を、文字情報コンテンツの読み上げ時間に基づいて、くり返し再生する。これにより、ユーザに提供する文字情報コンテンツのサイズに関わらず、文字情報コンテンツの合成音声による読み上げ中は、BGMを再生し続けることができる。すなわち、合成音声による文字情報コンテンツの読み上げ処理中の途中で、BGMが途切れることを防ぐことができる。
【0038】
また、1つのBGM2を繰り返し再生する代わりに、複数のBGM2を用いることにより、文字情報コンテンツの読み上げ時間と、BGM2の再生時間との間の誤差を低減することができる。
【0039】
本発明は、上述した一実施の形態に限定されることはない。例えば、上述した説明では、情報センターから取得(ダウンロード)した情報をユーザに提供するものとしたが、ユーザに提供する情報の取得先によって本発明が限定されることはない。また、ユーザに提供する情報も情報センターから取得した最新の情報である必要はなく、過去に取得して記憶部2に記憶された情報であってもよい。さらに、文字情報コンテンツとミキシングする音楽の格納場所や取得方法、フォーマット、音楽の種類により本発明が限定されることはない。
【0040】
また、図2に示すように、予め1つの番組として再生順序が決まっている番組コンテンツだけでなく、オンデマンドで番組を再生するなど、予め再生順序が決まっていない場合にも本発明を適用することができる。さらに、車載情報提供装置が電子メールの受信機能を有する場合には、受信した電子メールを合成音声にて読み上げる際に、本発明を適用することもできる。この場合には、電子メールの受信が自動で行われるか手動で行われるか、また、メールの読み上げ方法などにより、本発明が限定されることもない。
【0041】
特許請求の範囲の構成要素と一実施の形態の構成要素との対応関係は次の通りである。すなわち、記憶部2が情報記憶手段、第1音楽記憶手段、第2音楽記憶手段および第3音楽記憶手段を、TTSエンジン3がデータ変換手段を、ミキシング部4が合成情報生成手段を、スピーカ6が情報再生手段を、制御部1が情報量検出手段、再生時間算出手段および第3音楽選択手段をそれぞれ構成する。なお、本発明の特徴的な機能を損なわない限り、各構成要素は上記構成に限定されるものではない。
【図面の簡単な説明】
【図1】本発明による車載情報提供装置の一実施の形態の構成を示す図
【図2】ユーザに提供する番組の一例を示す図
【図3】一実施の形態における車載情報提供装置により行われる番組再生の手順を示すフローチャート
【図4】制御部で行われるBGMの選択処理の方法を示すフローチャート
【図5】図5(a)は、BGMの再生イメージを示す図、図5(b)は、BGM2の再生終了時刻と文字情報コンテンツの読み上げ終了時刻との間の差βを示す図
【図6】33.1≒9A+8B+7C+5Dの関係が成り立つA〜Dの組み合わせと、そのときの合計再生回数α’とをまとめた表
【図7】複数のBGM2を選択した時のBGMの再生イメージを示す図
【符号の説明】
1…制御部、2…記憶部、3…TTSエンジン、4…ミキシング部、5…増幅部、6…スピーカ、7…オーディオ再生装置、8…インタフェース
【発明の属する技術分野】
本発明は、車両の乗員に提供する文字情報を合成音声にて読み上げる際に、音楽をミキシングして乗員に提供する車載情報提供装置に関する。
【0002】
【従来の技術】
あるディスクやトラックの曲から他のディスクやトラックへの曲間の音量を揃えてつなぐように編集して再生または録音する場合に、最初に入力したデジタル音響信号のレベルに基づいて、後から入力されるデジタル音響信号の信号レベルを制御する音響信号処理装置が知られている(特許文献1参照)。
【0003】
【特許文献1】
特開平11−126424号公報
【0004】
【発明が解決しようとする課題】
しかしながら、従来の装置では、音響信号のフェードイン・フェードアウト処理を行うために、入力される音響信号を検出する音響信号レベル検出部と、信号レベルを制御するための音量制御部とが必要となるために、装置全体としてコストが増大するという問題があった。
【0005】
本発明は、音響信号のレベル調整を行う機械的制御を用いることなく、音楽のフェードイン、フェードアウトを可能とする車載情報提供装置を提供する。
【0006】
【課題を解決するための手段】
本発明による車載情報提供装置は、フェードイン処理が施された第1の音楽、フェードアウト処理が施された第2の音楽、および、第1の音楽と第2の音楽との間に挿入された状態で再生される第3の音楽を予め記憶しておき、文字情報をユーザに合成音声にて提供する際に、合成音声を出力するための音声データと、第1〜第3の音楽とを合成した合成情報を再生することを特徴とする。
【0007】
【発明の効果】
本発明による車載情報提供装置によれば、音響信号のレベル調整を行う機械的制御を行うことなく、フェードインおよびフェードアウト処理が施された音楽とともに、文字情報を合成音声にてユーザに提供することができる。
【0008】
【発明の実施の形態】
図1は、本発明による車載情報提供装置の一実施の形態の構成を示す図である。一実施の形態における車載情報提供装置は、制御部1と、記憶部2と、TTSエンジン3と、ミキシング部4と、増幅部5と、スピーカ6と、オーディオ再生部7と、インタフェース8とを備える。
【0009】
一実施の形態における車載情報提供装置では、インタフェース8を介して接続された携帯電話(不図示)を介して、図示しない情報センターと接続し、情報センターから様々な情報をダウンロードする。ダウンロードする情報はテキストデータであり、情報の内容に応じて画像データが含まれることもある。ユーザに提供される情報は、例えば、交通情報、天気予報、ニュース、飲食店情報などである。
【0010】
ここでは、情報センターから取得してユーザに提供するテキスト情報を文字情報コンテンツと呼ぶ。この文字情報コンテンツには、後述するTTSエンジン3が処理を行うための中間言語と呼ばれるデータも含まれる。例えば、情報ソースが「今日の天気は晴れです」というテキストデータの場合には、「きょうの[S]てんきは[S]はれです」のように、TTSエンジン3に入力するデータが中間言語である。なお、[S]はスペースを表す。この文字情報コンテンツには、TTS機能により音声読み上げを行う必要があることを示すタグ(データ)、および、情報の種類(交通情報、ニュース、天気予報など)を判別するためのタグが含まれている。情報センターからダウンロードした情報は、記憶部2に記憶される。
【0011】
TTSエンジン3は、記憶部2に記憶されているテキスト情報を合成音声にて読み上げるTTS(Text To Speech)機能を有し、テキストデータを音声データに変換する。一実施の形態における車載情報提供装置では、情報(文字情報コンテンツ)を合成音声にて読み上げる際に、音楽をBGMとして同時に再生する。BGMとして再生する音楽(背景音楽)には、圧縮音楽、MIDIと呼ばれる電子楽器音楽や、CD(Compact Disc)、MD(Mini Disc)に記録される音楽などが含まれる。オーディオ再生部7は、CDやMDなどに記録されている音楽を再生する。BGMとして再生する音楽や、オーディオ再生部7で再生される音楽は、記憶部2に予め記憶させておく。
【0012】
ミキシング部4は、DSP(Digital Signal Processor)により構成されており、合成音声にて読み上げられる文字情報コンテンツと、BGMとして用いられる音楽とをミキシング、すなわち、合成する。ここでのミキシングとは、文字情報コンテンツの再生の背景で音楽を再生することを意味する。以下では、合成音声にて読み上げられる文字情報コンテンツとBGMとをミキシングしたものを番組コンテンツと呼ぶ。ミキシング部4でミキシングされた番組コンテンツは、増幅部5にて増幅された後、スピーカ6から出力される。
【0013】
制御部1は、図示しないCPU,ROM,RAMを備え、TTSエンジン3により音声データに変換された文字情報の読み上げ総時間を計算し、ミキシング部4でミキシングを行うためのBGMを選択する。また、合成音声にて読み上げられた文字情報の残り再生時間を計測する機能を有する。BGMの選択方法については、後述する。
【0014】
ミキシング部4でミキシングを行うためのBGMは、合成音声にて読み上げられる情報の種類に応じて、複数種類用意される。例えば、ニュース情報に対応したBGM、スポーツ情報に対応したBGMなどを用意しておき、BGMを聞いたユーザが提供される情報の種類を迅速に把握できるようにする。これらのBGMは、情報の種類に対応するタグを有する。
【0015】
一実施の形態における車載情報提供装置では、番組コンテンツと音楽コンテンツとを交互に再生する。番組コンテンツと音楽コンテンツとを交互に再生するために組み合わせたものが1つの番組となる。番組の一例を図2に示す。図2に示す番組コンテンツには、交通情報、天気予報、スポーツ情報、経済情報、芸能情報が含まれている。なお、番組内で再生される音楽コンテンツと、上述したBGMとは異なるものである。すなわち、音楽コンテンツとは、例えば、CDやMDに記録されている曲のことであり、BGMは、番組コンテンツを生成するために用いられるミキシング専用の曲のことで、後述するように、短時間(例えば、5秒)のものである。
【0016】
図3は、一実施の形態における車載情報提供装置により行われる番組再生の手順を示すフローチャートである。ステップS10から始まる処理は、主に制御部1により行われ、音楽コンテンツの再生が終了したことを制御部1が検知した時に開始する。なお、番組の最初に再生されるコンテンツが音楽コンテンツではなく、番組コンテンツの場合には、ユーザによる番組の再生要求があった時に開始される。
【0017】
ステップS10では、ユーザに提供する情報(コンテンツ)に、TTS機能により読み上げる必要のある文字情報コンテンツが含まれているか否かを判定する。この判定は、コンテンツファイルのヘッダーに付属しているタグに基づいて行われる。ユーザに提供する情報の中に、文字情報コンテンツが含まれていると判定すると、ステップS20に進み、文字情報コンテンツが含まれていないと判定すると、本フローチャートによる処理を終了する。
【0018】
ステップS20では、文字情報コンテンツとミキシングするBGMを選択する。制御部1は、文字情報コンテンツの種類、および、合成音声による読み上げ時間に基づいて、3種類のBGM(BGM1,BGM2,BGM3)を選択する。BGM1は、文字情報コンテンツの読み上げ再生を行う前に再生されるフェードイン用のBGMであり、音量が少しずつ大きくなるように録音されている。BGM2は、文字情報コンテンツの読み上げ再生が行われている間に再生されるBGMである。このBGM2は、フェードイン処理もフェードアウト処理も施されていない。BGM3は、文字情報コンテンツの読み上げ再生が終了する際に再生されるフェードアウト用のBGMであり、音量が少しずつ小さくなっていくように録音されている。
【0019】
上述したように、BGM1〜BGM3は、文字情報コンテンツの種類に応じて、複数用意されている。また、BGM2は、それぞれの文字情報コンテンツの種類に対応させて、再生時間の異なるものを複数用意しておく。すなわち、文字情報コンテンツの読み上げ再生中は、後述する方法により選択されたBGM2を繰り返し再生することにより、長さの異なる文字情報コンテンツに対応することができる。BGMは、最初にBGM1が再生された後にBGM2が繰り返し再生され、最後にフェードアウト用のBGM3が再生される。従って、BGM1,BGM2,BGM3は、再生時の聞き心地に違和感が生じないように、曲調を滑らかに接続できるものを用意しておく。
【0020】
制御部1で行われるBGMの選択処理の方法を図4に示すフローチャートを用いて説明する。ステップS200では、文字情報コンテンツファイルのヘッダーに付属する属性タグに基づいて、情報の種類を判別する。情報の種類を判別すると、ステップS210に進む。ステップS210では、文字情報コンテンツを合成音声にて読み上げる総時間を算出する。読み上げ時間は、ファイルサイズ、および、ファイル中のテキストデータ部分の最初の番地と末尾の番地とに基づいて算出する。読み上げ時間を算出すると、ステップS220に進む。
【0021】
ステップS220では、記憶部2に記憶されている複数のBGM2の中から、ステップS200で判別した情報の種類、および、ステップS210で算出した読み上げ総時間に基づいて、適切なBGM2を選択する。適切なBGM2を選択する方法について説明する。
【0022】
ステップS210で算出した読み上げ総時間をtT、BGM2を1回再生するの要する時間をt2−x、BGM2を繰り返し再生する回数をα、読み上げ総時間tTとBGM2の再生時間αt2−xとの差をβとすると、t2−x=(tT−β)/αの関係式を満たすBGM2を選択する。ただし、tT≧αt2−x、t2−x≫βの関係を満たすものとし、α、t2−xは、βの値が最小となるものを選ぶ。
【0023】
一例として、読み上げ総時間tT=33.1秒、t2−1=9秒、t2−2=8秒、t2−3=7秒、t2−4=5秒の4種類のBGM2がある場合について説明する。BGM2は、tTをt2−1〜t2−4で割った余りβが最も小さくなるものを選択する。実際に計算すると、下記のようになる。
(i)33.1/t2−1=33.1/9=3余り6.1秒
(ii)33.1/t2−2=33.1/8=4余り1.1秒
(iii)33.1/t2−3=33.1/7=4余り5.1秒
(iv)33.1/t2−4=33.1/5=6余り3.1秒
【0024】
従って、余りβが最小となるt2−2のBGM2が選択される。この場合、BGM2を繰り返し再生する回数αは、上記演算の商の4となり、余りβは、読み上げ総時間tTとBGM2の再生時間αt2−2との差βと同値の1.1秒となる。
【0025】
ステップS220でBGM2を選択すると、ステップS230に進む。ステップS230では、ステップS220で選択したBGM2が有する情報の種類のタグと同一のタグを有するBGM1およびBGM3を選択する。BGM1およびBGM3を選択すると、BGMの選択処理を終了し、図3に示すフローチャートのステップS30に進む。
【0026】
ステップS30では、ミキシング部4により、文字情報コンテンツと、ステップS20で選択したBGMとをミキシングする。図5(a)は、BGMの再生イメージを示す図である。ステップS30に続くステップS40では、ステップS20で選択したBGM1の再生を開始して、ステップS50に進む。ステップS50では、BGM1の再生が終了したか否かを判定する。BGM1の再生が終了していないと判定すると、終了するまで待機し、終了したと判定するとステップS60に進む。
【0027】
ステップS60では、TTS機能により、文字情報コンテンツの合成音声による読み上げ処理を開始して、ステップS70に進む。ステップS70では、ステップS20で選択したBGM2の再生を開始する。なお、実際には、ステップS60で行う文字情報コンテンツの読み上げ処理と、ステップS70で行うBGM2の再生開始処理は、同時に行われる。ステップS70に続くステップS80では、BGM2の再生残り回数が0より大きいか否かを判定する。BGM2の再生残り回数が0より大きい、すなわち、1回以上であると判定すると、ステップS90に進む。ステップS90では、再生中のBGM2の再生終了後に、再びBGM2の再生を行い、ステップS80に戻る。
【0028】
すなわち、図4に示すフローチャートのステップS220においてBGM2を選択した際に、選択したBGM2の繰り返し再生回数αも決定されるので、繰り返し再生回数α回、BGM2の再生が繰り返し行われる。ステップS80において、BGM2の再生残り回数が0となったと判定すると、ステップS100に進む。ステップS100では、最後に再生するBGM2の再生が終了したか否かを判定する。再生が終了していないと判定すると、再生が終了するまでステップS100で待機し、再生が終了したと判定するとステップS110に進む。
【0029】
ステップS110では、ステップS20で選択したBGM3の再生を開始して、ステップS120に進む。ステップS120では、BGM3の再生が終了したか否かを判定する。再生が終了していないと判定すると、再生が終了するまでステップS120で待機し、再生が終了したと判定すると、図3に示すフローチャートによる処理を終了する。
【0030】
なお、繰り返し再生するBGM2の再生処理が終了して、BGM3の再生が始まる時刻と、文字情報コンテンツの読み上げ処理が終了する時刻との間に時間差βが存在するが(図5(b)参照)、上述したように、BGM2を選択する際にβが最小となるものを選択している。従って、BGM3の再生時のフェードアウトの初期段階で文字情報コンテンツの読み上げ処理が終了するので、ユーザが聞き心地に違和感を感じることはない。
【0031】
−BGMを選択する別の方法−
BGM2を選択する別の方法について説明する。上述した方法では、1つのBGM2を選択して、文字情報コンテンツの読み上げ処理を行っている間に繰り返し再生した。ここでは、複数のBGM2を選択する方法について説明する。
【0032】
一例として、読み上げ総時間tT=33.1秒、t2−1=9秒、t2−2=8秒、t2−3=7秒、t2−4=5秒の4種類のBGM2がある場合について説明する。再生時間t2−1〜t2−4のBGM2の繰り返し再生回数をそれぞれA,B,C,Dとすると、33.1≒9A+8B+7C+5Dの関係が成り立つA〜Dを求め、合計再生回数α’=A+B+C+Dが最小となるA〜Dの組み合わせを選択する。
【0033】
図6は、33.1≒9A+8B+7C+5Dの関係が成り立つA〜Dの組み合わせと、そのときの合計再生回数α’とをまとめた表である。例えば、図6に示す▲1▼の組み合わせの場合、再生時間t2−1のBGM2を2回、再生時間t2−2のBGM2を1回、再生時間t2−3のBGM2を1回、それぞれ再生することを意味する。ただし、再生の順序は順不同とする。
【0034】
図6に示すように、合計再生回数α’が最小となるA〜Dの組み合わせは、(A,B,C,D)=(2,1,1,0)、(1,3,0,0)となる▲1▼および▲3▼の組み合わせである。従って、▲1▼および▲3▼の組み合わせのうちのいずれか一方の組み合わせを選択する。
【0035】
図7は、上述した方法により、複数のBGM2を選択した時のBGMの再生イメージを示す図である。1つのBGM2を選択する方法と比べると、文字情報コンテンツの読み上げ時間tTと、BGMの総再生時間との差βは小さくなる。上述した例では、1つのBGM2を選択した時のβは1.1秒であったが、複数のBGM2を選択した時のβは0.1秒(=33.1−9・2−8・1−7・1または33.1−9・1−8・3)となる。
【0036】
このように、一実施の形態における車載情報提供装置によれば、フェードイン処理が施された第1の音楽(BGM1)、フェードアウト処理が施された第2の音楽(BGM3)、および、第1の音楽と第2の音楽との間に挿入された状態で再生される第3の音楽(BGM2)を予め記憶部2に記憶させておき、文字情報をユーザに合成音声にて提供する際に、合成音声と、第1〜第3の音楽とを合成した合成情報を再生する。これにより、合成音声にてユーザに情報を提供する際に、フェードイン処理およびフェードアウト処理を施したBGMを同時に再生するので、利用者の聞き心地を向上させることができる。また、音楽のフェードイン処理、および、フェードアウト処理を行うのに、音量レベルの機械的調整を行う必要がないため、処理の簡易化により装置全体のコストを低減することができる。
【0037】
一実施の形態における車載情報提供装置によれば、フェードイン処理が施されたBGM1の再生とフェードアウト処理が施されたBGM3の再生の間で再生されるBGM2を、文字情報コンテンツの読み上げ時間に基づいて、くり返し再生する。これにより、ユーザに提供する文字情報コンテンツのサイズに関わらず、文字情報コンテンツの合成音声による読み上げ中は、BGMを再生し続けることができる。すなわち、合成音声による文字情報コンテンツの読み上げ処理中の途中で、BGMが途切れることを防ぐことができる。
【0038】
また、1つのBGM2を繰り返し再生する代わりに、複数のBGM2を用いることにより、文字情報コンテンツの読み上げ時間と、BGM2の再生時間との間の誤差を低減することができる。
【0039】
本発明は、上述した一実施の形態に限定されることはない。例えば、上述した説明では、情報センターから取得(ダウンロード)した情報をユーザに提供するものとしたが、ユーザに提供する情報の取得先によって本発明が限定されることはない。また、ユーザに提供する情報も情報センターから取得した最新の情報である必要はなく、過去に取得して記憶部2に記憶された情報であってもよい。さらに、文字情報コンテンツとミキシングする音楽の格納場所や取得方法、フォーマット、音楽の種類により本発明が限定されることはない。
【0040】
また、図2に示すように、予め1つの番組として再生順序が決まっている番組コンテンツだけでなく、オンデマンドで番組を再生するなど、予め再生順序が決まっていない場合にも本発明を適用することができる。さらに、車載情報提供装置が電子メールの受信機能を有する場合には、受信した電子メールを合成音声にて読み上げる際に、本発明を適用することもできる。この場合には、電子メールの受信が自動で行われるか手動で行われるか、また、メールの読み上げ方法などにより、本発明が限定されることもない。
【0041】
特許請求の範囲の構成要素と一実施の形態の構成要素との対応関係は次の通りである。すなわち、記憶部2が情報記憶手段、第1音楽記憶手段、第2音楽記憶手段および第3音楽記憶手段を、TTSエンジン3がデータ変換手段を、ミキシング部4が合成情報生成手段を、スピーカ6が情報再生手段を、制御部1が情報量検出手段、再生時間算出手段および第3音楽選択手段をそれぞれ構成する。なお、本発明の特徴的な機能を損なわない限り、各構成要素は上記構成に限定されるものではない。
【図面の簡単な説明】
【図1】本発明による車載情報提供装置の一実施の形態の構成を示す図
【図2】ユーザに提供する番組の一例を示す図
【図3】一実施の形態における車載情報提供装置により行われる番組再生の手順を示すフローチャート
【図4】制御部で行われるBGMの選択処理の方法を示すフローチャート
【図5】図5(a)は、BGMの再生イメージを示す図、図5(b)は、BGM2の再生終了時刻と文字情報コンテンツの読み上げ終了時刻との間の差βを示す図
【図6】33.1≒9A+8B+7C+5Dの関係が成り立つA〜Dの組み合わせと、そのときの合計再生回数α’とをまとめた表
【図7】複数のBGM2を選択した時のBGMの再生イメージを示す図
【符号の説明】
1…制御部、2…記憶部、3…TTSエンジン、4…ミキシング部、5…増幅部、6…スピーカ、7…オーディオ再生装置、8…インタフェース
Claims (3)
- 車両の乗員に提供する情報を記憶する情報記憶手段と、
前記情報記憶手段に記憶されている情報に含まれる文字情報を、合成音声にて再生するための音声データに変換するデータ変換手段と、
音量が少しずつ大きくなるフェードイン処理が施された第1の音楽を記憶する第1音楽記憶手段と、
音量が少しずつ小さくなるフェードアウト処理が施された第2の音楽を記憶する第2音楽記憶手段と、
前記第1の音楽と前記第2の音楽との間に挿入された状態で再生される第3の音楽を記憶する第3音楽記憶手段と、
前記音声データと、前記第1音楽記憶手段に記憶されている第1の音楽と、前記第2音楽記憶手段に記憶されている第2の音楽と、前記第3音楽記憶手段に記憶されている第3の音楽とを合成して合成情報を生成する合成情報生成手段と、
前記合成情報生成手段により生成された合成情報を再生する情報再生手段とを備えることを特徴とする車載情報提供装置。 - 請求項1に記載の車載情報提供装置において、
前記合成音声にて再生する文字情報の情報量を検出する情報量検出手段と、
前記情報量検出手段により検出された情報量に基づいて、前記文字情報を前記合成音声にて再生する時間を算出する再生時間算出手段と、
前記再生時間算出手段により算出された再生時間に基づいて、前記第3の音楽を繰り返し再生する回数を算出する再生回数算出手段とをさらに備え、
前記合成情報生成手段は、前記再生回数算出手段により算出された回数だけ前記第3の音楽が繰り返し再生されるように、前記合成情報の生成を行うことを特徴とする車載情報提供装置。 - 請求項1に記載の車載情報提供装置において、
前記第3音楽記憶手段は、再生時間の異なる第3の音楽を複数記憶しており、
前記合成音声にて再生する文字情報の情報量を検出する情報量検出手段と、
前記情報量検出手段により検出された情報量に基づいて、前記文字情報を前記合成音声にて再生する時間を算出する再生時間算出手段と、
前記再生時間算出手段により算出された再生時間に基づいて、前記第3音楽記憶手段に記憶されている複数の第3の音楽の中から、少なくとも2つ以上の第3の音楽を選択するとともに、前記選択した第3の音楽を繰り返し再生する回数を算出する第3音楽選択手段とをさらに備え、
前記合成情報生成手段は、前記第3音楽選択手段により選択された第3の音楽が前記算出した繰り返し回数だけそれぞれ再生されるように、前記合成情報の生成を行うことを特徴とする車載情報提供装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003165254A JP2005003795A (ja) | 2003-06-10 | 2003-06-10 | 車載情報提供装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003165254A JP2005003795A (ja) | 2003-06-10 | 2003-06-10 | 車載情報提供装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005003795A true JP2005003795A (ja) | 2005-01-06 |
Family
ID=34091792
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003165254A Pending JP2005003795A (ja) | 2003-06-10 | 2003-06-10 | 車載情報提供装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005003795A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018181391A (ja) * | 2017-04-11 | 2018-11-15 | 船井電機株式会社 | 再生装置 |
WO2018211748A1 (ja) * | 2017-05-16 | 2018-11-22 | ソニー株式会社 | 情報処理装置および情報処理方法 |
-
2003
- 2003-06-10 JP JP2003165254A patent/JP2005003795A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018181391A (ja) * | 2017-04-11 | 2018-11-15 | 船井電機株式会社 | 再生装置 |
WO2018211748A1 (ja) * | 2017-05-16 | 2018-11-22 | ソニー株式会社 | 情報処理装置および情報処理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI250508B (en) | Voice/music piece reproduction apparatus and method | |
JP2917834B2 (ja) | カラオケ装置 | |
JP2004347943A (ja) | データ処理装置、楽曲再生装置、データ処理装置の制御プログラムおよび楽曲再生装置の制御プログラム | |
JPH0990965A (ja) | カラオケ装置 | |
JP2007025570A (ja) | 歌詞文字に基づいて切り貼り編集を行うカラオケ録音編集装置 | |
JP3304852B2 (ja) | カラオケ装置 | |
JP2005003795A (ja) | 車載情報提供装置 | |
JP2000047677A (ja) | カラオケ装置 | |
JP4107212B2 (ja) | 楽曲再生装置 | |
JPH11167392A (ja) | カラオケ再生装置、通信カラオケシステム、およびカラオケプログラムを記録した読み取り可能な記録媒体 | |
JP2005037846A (ja) | 音楽再生装置の情報設定装置及び情報設定方法 | |
JP2004206009A (ja) | カラオケ装置 | |
JP4207578B2 (ja) | 情報提供装置 | |
JP2548723Y2 (ja) | 楽音再生装置 | |
JP2947184B2 (ja) | カラオケシステム | |
JP3471672B2 (ja) | ボーカル音量の自動フェードアウト機能を備えたカラオケ装置 | |
JP4244639B2 (ja) | 情報提供装置 | |
JP3432771B2 (ja) | カラオケ装置 | |
JP3363667B2 (ja) | カラオケ装置 | |
JP3106076B2 (ja) | 映像再生装置 | |
JP2001100771A (ja) | カラオケ装置 | |
JPH0728607Y2 (ja) | 歌唱装置 | |
KR100620973B1 (ko) | 음원데이타 출력시스템 | |
JP2576961Y2 (ja) | 楽音再生装置 | |
JP2008191292A (ja) | 音声合成方法、プログラム及び音声合成装置並びに音楽音声再生装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060424 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090402 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090421 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090908 |