JP2003058198A - 音声出力装置、音声出力方法、及び、プログラム - Google Patents

音声出力装置、音声出力方法、及び、プログラム

Info

Publication number
JP2003058198A
JP2003058198A JP2001250409A JP2001250409A JP2003058198A JP 2003058198 A JP2003058198 A JP 2003058198A JP 2001250409 A JP2001250409 A JP 2001250409A JP 2001250409 A JP2001250409 A JP 2001250409A JP 2003058198 A JP2003058198 A JP 2003058198A
Authority
JP
Japan
Prior art keywords
music
volume
voice
output
output device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001250409A
Other languages
English (en)
Inventor
Hideo Kuboyama
英生 久保山
Makoto Hirota
誠 廣田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2001250409A priority Critical patent/JP2003058198A/ja
Priority to US10/216,753 priority patent/US7203647B2/en
Publication of JP2003058198A publication Critical patent/JP2003058198A/ja
Priority to US11/612,603 priority patent/US7603280B2/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音楽の出力に重畳して合成音声を出力する場
合に、ユーザが合成音声をより聞き取り易いようにする
こと。 【解決手段】 音楽の再生中に電子メールを受信し、そ
の電子メールを合成音声により読み上げる場合、合成音
声の出力開始と共に、音楽の音量を徐々に小さくする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、電子メールやニュ
ースなどの各種情報を音声合成により出力する技術に関
する。
【0002】
【従来の技術】インターネットに代表される通信技術の
発達により、ネットワーク上でのニュース記事の配信
や、電子メールが普及している。このような情報は、ユ
ーザに迅速に提供されることが望ましいため、情報の着
信をユーザに通知するパソコン、携帯型電話機等の端末
装置も提案されている。また、このような情報を、ディ
スプレイによって表示するのみならず、音声合成によっ
て音声出力する機能を備えた端末装置も提案されてい
る。
【0003】音声出力は、ディスプレイによる表示の場
合よりも、ユーザの注意を奪うことが少ない。従って、
ユーザは、別のことをしながらでも、出力された音声を
聞くことにより、情報の内容を知ることができるという
利点がある。
【0004】
【発明が解決しようとする課題】しかしながら、このよ
うな合成音声による音声出力は、ユーザが端末装置によ
り音楽等の別の音声を聞いている場合に問題となる。例
えば、ユーザが音楽を聞いている最中に、受信した電子
メールの内容が合成音声により音楽に重畳して読み上げ
られるような場合には、合成音声が聞き取り難い場合が
生じ得る。
【0005】従って、本発明の目的は、音楽の出力に重
畳して合成音声を出力する場合に、ユーザが合成音声を
より聞き取り易いようにすることにある。
【0006】
【課題を解決するための手段】本発明によれば、音楽
と、情報の内容を示す合成音声と、を重畳して出力可能
な出力手段と、出力される音楽の音量を制御する制御手
段と、を備え、前記制御手段は、音楽の出力中に前記合
成音声を重畳して出力する場合には、該音楽の音量を徐
々に小さくすることを特徴とする音声出力装置が提供さ
れる。
【0007】また、本発明によれば、音楽と、情報の内
容を示す合成音声と、を重畳して出力する音声出力方法
であって、音楽の出力中に前記合成音声を重畳して出力
する場合には、該音楽の音量を徐々に小さくすることを
特徴とする音声出力方法が提供される。
【0008】また、本発明によれば、音楽、及び、情報
の内容を示す合成音声を出力するために、コンピュータ
を、音楽の出力中に前記合成音声を重畳して出力する場
合には、該音楽の音量を徐々に小さくする手段、として
機能させるプログラムが提供される。
【0009】
【発明の実施の形態】<システムの構成>図1は、本発
明の一実施形態に係る音声出力装置101が使用される
システムの例を示した図である。
【0010】同図において、サーバコンピュータ105
は、インターネットに代表されるネットワーク103を
介して、ユーザ端末にニュースや電子メールといった各
種情報を提供するサーバであり、配信サーバやメールサ
ーバがこれに該当する。図中、サーバコンピュータ10
5は1つのみ例示しているが、複数のサーバがネットワ
ーク103に接続されよう。基地局104は、サーバコ
ンピュータ105から送信される情報を受信し、これを
無線通信によって音声出力装置101へ送信する。音声
出力装置101は、ネットワーク103上で、例えば、
サーバコンピュータ105から、提供される情報を基地
局104を介して受信し、ユーザに提供することができ
る。後述するように、本実施形態では、音声出力装置1
01は、受信した情報を合成音声により音声出力し、ユ
ーザに提供することが可能である。
【0011】<音声出力装置の構成>図2は、音声出力
装置101のハードウエア構成例を示すブロック図であ
る。音声出力装置101は、例えば、携帯型電話機、モ
バイルコンピュータ等の携帯型端末として実施すること
が好適であるが、パソコン等として実施することもでき
る。
【0012】CPU1は、音声出力装置101全体の制
御を司り、特に、本実施形態では後述する処理を実行す
る。RAM2は、CPU1のワークエリアとして用いら
れるメモリである。ROM3には、CPU1が実行する
制御プログラム、該プログラムの処理に用いられるデー
タといった固定的なデータを記憶するメモリである。
【0013】本実施形態では、ROM3にオーディオデ
ータを再生するデコーダプログラム等の音楽再生ソフト
ウエア、テキストデータ等の文字データを合成音声デー
タに変換する変換ソフトウエア、及び、文字データを合
成音声データに変換する際に用いられる合成音声用の辞
書データ、も格納される。これらのソフトウエアや辞書
データは公知のものを利用することができる。
【0014】コネクタ4には、スマートメディア4aが
挿入され、スマートメディア4aは、CPU1がアクセ
ス可能なメモリとして用いられる。このスマートメディ
ア4aには、例えば、オーディオデータが格納される。
【0015】本実施形態では、CPU1のメモリとし
て、RAM2、ROM3及びスマートメディア4aが使
用される例を挙げたが、他の種類のメモリも利用可能で
あることは言うまでもない。
【0016】入力インターフェース5は、CPU1と操
作スイッチ6との間のインターフェースとして機能す
る。操作スイッチ6は、ユーザが音声出力装置101に
対して指示を与えるためのものであり、キースイッチ等
から構成される。
【0017】通信デバイス7は、基地局104との間で
無線通信を行うためのRF回路等の電子回路を有する。
本実施形態では、無線通信を想定しているが、有線通信
も採用することができ、このの場合は通信デバイス7と
してネットワークインターフェース等が採用されよう。
CPU1は、ネットワーク103から提供される各種情
報を通信デバイス7を介して取得することができる。デ
ィスプレイ9は、液晶表示装置等から構成され、ディス
プレイドライバ8を介してCPU1に表示制御される。
【0018】D/A変換器10は、デジタル信号をアナ
ログ信号に変換する回路であり、本実施形態では、CP
U1から出力されるデジタル形式の音声データをアナロ
グ信号に変換するために用いられる。増幅回路11は、
D/A変換器10から出力されるアナログ信号を増幅す
る回路である。スピーカ12は、増幅回路11から出力
されるアナログ信号を音声として出力するものであり、
例えば、ヘッドホン等である。
【0019】<音声出力装置に対する操作>図3は、デ
ィスプレイ9に表示される操作選択画面の一例を示す図
である。アプリケーションウインドウ301には種々の
操作を行うための表示がされている。ユーザは、上述し
た操作スイッチ6を操作することにより、各表示領域に
従って、各種の指示を行うことが可能である。
【0020】音楽再生用の操作領域302には、再生す
る音楽のデータファイルを指定するための入力フィール
ドや、音楽の再生、停止、一時停止、早送り或いは巻き
戻しを指定するためのボタンが表示されている。
【0021】通信設定用の操作領域303には、接続先
を指定する入力フィールドや、接続又は切断を指示する
ためのボタンが表示されている。
【0022】操作領域304は、ネットワーク103か
ら提供された情報を受信した場合に、これを合成音声に
変換して出力するか否かを設定するための領域である。
操作領域304には、メールとニュースとについてチェ
ックボックスが設けられている。このチェックボックス
がチェックされた情報を受信した場合、これが合成音声
に変換されて出力されるようにすることもできる。
【0023】図3では、メールのチェックボックスがチ
ェックされているので、電子メールを受信した場合に、
その内容が合成音声に変換されて出力されることとな
る。また、操作領域304には、合成音声の出力停止又
は一時停止ボタンも表示されている。
【0024】状態表示部305には、音声出力装置10
1の現在の状態を示す情報が表示され、終了ボタン30
6は、このアプリケーションの終了を指示するためのボ
タンである。
【0025】ユーザは、図3に示す表示画面上で処理を
選択することにより、好きな音楽を聞いたり、或いは、
基地局104を経由してネットワーク103からニュー
スや電子メールを受信し、これを合成音声によって読み
上げさせて聴くことができる。
【0026】次に、音声出力装置101によって実行さ
れる処理について説明する。
【0027】<合成音声変換処理>図4は、文字データ
を合成音声データに変換する合成音声変換処理の例を示
すフローチャートである。本実施形態では、ネットワー
ク103から受信した電子メールやニュースといった各
種情報の内容を合成音声により読み上げることができ
る。
【0028】S401では、CPU1が、合成音声に変
換する情報の文字データをメモリから読み出す。変換す
る情報は、例えば、RAM2やスマートメディア4aに
格納される。文字データは、例えば、文字単位或いは単
語単位等で読み出される。S402では、CPU1が、
ROM3に格納された合成音声用の辞書データを検索
し、S401で読み出した文字データに対応する合成音
声データをROM3から読み出す。
【0029】S403では、CPU1が、S502で読
み出した合成音声データをRAM2の所定の領域に一時
格納する。S504では、CPU1が、未変換の文字デ
ータがあるか否かを判定し、なければ処理を終了し、あ
ればS501へ戻って上述した処理を繰り返す。
【0030】以上により、各種情報に含まれるテキスト
データ等の文字データが、合成音声データに変換される
こととなる。変換された合成音声データは、RAM2に
一時格納されており、その出力時には、CPU1が、R
AM2に一時格納した合成音声データを順次読み出して
D/A変換器10へ出力する。その後、D/A変換器1
0では、CPU1から出力された合成音声データがデジ
タル信号からアナログ信号へ変換され、増幅回路11で
増幅された後、スピーカ12から音声として出力され
る。このようにして、各種情報の内容が合成音声により
読みあげられることとなる。
【0031】<音楽出力処理>図5は、ユーザが音楽の
出力を指示した場合に実行される処理の例を示すフロー
チャートである。ユーザが音楽の出力を指示した場合、
CPU1は、ROM3に格納された音楽再生ソフトウエ
アを起動して以下の処理を行い、音楽を再生する。
【0032】S501では、CPU1が、ユーザが選択
した音楽のオーディオデータを格納したメモリからオー
ディオデータを所定の単位で読み出す。オーディオデー
タは、例えば、スマートメディア4a等に記憶されてい
る。S502では、CPU1が、読み出したオーディオ
データに対して再生処理を行う。例えば、オーディオデ
ータが圧縮されたデータである場合、そのデコードを行
う。
【0033】S503では、CPU1が再生されたオー
ディオデータをD/A変換器10へ出力する。その後、
D/A変換器10では、CPU1から出力されたデジタ
ル信号がアナログ信号へ変換され、増幅回路11で増幅
された後、スピーカ12から音声として出力されること
となる。S504では、全ての(例えば、1曲分の)オ
ーディオデータについて上記処理を行ったか否かを判定
し、そうでない場合は、S501へ戻ってこれらの処理
を繰り返す。これらの処理を繰り返すことにより、ユー
ザが音楽を聞くことができることとなる。
【0034】<音楽再生中の合成音声の出力>次に、音
楽の再生中に、合成音声を重畳して出力する場合の処理
について説明する。
【0035】本実施形態の音声出力装置101は、例え
ば、定期的にサーバコンピュータ105にアクセスして
ニュース等の情報を受信してRAM2に格納したり、或
いは、電子メールの着信に応答してこれを受信してRA
M2に格納したりすることができる。このような情報
は、受信後、速やかにユーザに通知することが望ましい
ところである。
【0036】そこで、本実施形態では、再生中の音楽に
重畳して、受信した情報の内容を合成音声により読み上
げることができる。しかし、これらを重畳すると合成音
声が聞き取り難い場合等も生じえる。本実施形態では、
合成音声を出力する場合には、再生中の音楽の音量を小
さくすることにより、合成音声を聞き取り易くする。
【0037】図6及び図7は、合成音声を出力する場合
の処理の例を示すフローチャートである。この処理は、
例えば、CPU1が、情報が格納されるRAM2に、ネ
ットワーク103からの新たな情報が格納されているか
を定期的にチェックし、格納されていた場合に実行され
る。
【0038】S601では、その新たな情報について、
図4の合成音声変換処理を実行する。その結果、合成音
声データが作成され、RAM2に格納される。S602
では、CPU1が音楽の再生中か否かを判定する。再生
中でない場合には、音楽に重畳する必要はないので、S
603へ進み、合成音声データを順次D/A変換器10
へ出力して、合成音声を出力させる。音楽の再生中であ
った場合、S604へ進む。
【0039】S604及びS605は、図5のS501
及びS502と同様の処理である。S606では、出力
される音楽の音量を小さくするため、音量制御処理1を
行う。
【0040】図8は、音量制御処理1を示すフローチャ
ートである。
【0041】本実施形態では、再生したオーディオデー
タの値を所定倍することにより、音量を調節する。通常
時は1倍であるが音量を小さくする場合は、例えば、
0.5倍(50%)等とする。以下、オーディオデータ
の値を所定倍するための係数を出力率d(0<d≦1、
初期値=1)と呼ぶ。また、出力率dの下限値を目標値
q(0<q<1)と呼ぶ。出力率dは、後述するように
徐々に値が小さくなり、これにより音楽の音量が徐々に
小さくなる。
【0042】図8において、S801では、CPU1が
目標値qが設定済みか否かを判定する。設定していない
場合は、S802へ進み、目標値qを設定する。図6の
処理において、S604乃至S610のループに最初に
入った時に目標値qが設定されることになり、以後、S
610で合成音声が終了すると判定されるまで目標値q
が維持される。
【0043】S802では、CPU1が目標値qを設定
し、RAM2等に格納しておく。目標値qは固定値でも
よいが、後述する設定方法も採用することができる。
【0044】S803では、CPU1が、出力率dが目
標値qに等しいか否かを判定する。出力率dが目標値q
に等しくなった場合は、出力率dの値をそのまま維持す
ることとなり、S805へ進む。出力率dが目標値qに
達していない場合は、S804へ進む。
【0045】S804では、CPU1が、出力率dの値
を更新する。出力率dは、処理のループ回数に比例して
所定値毎ずつ減算していってもよい。例えば、1回の処
理のループにつき0.005づつ減算する場合、出力率
dは、1→0.095→0.090→...→目標値
q、といった具合に変化することとなる。出力率dは、
このように処理のループ回数に線形に減算して更新して
もよいし、非線形(例えば、カーブ)に減算して更新し
てもよい。更新された出力率dの値は、例えば、RAM
2等に格納される。
【0046】S805では、図6のS605で再生され
たオーディオデータに出力率dを反映させる。例えば、
S605で再生されたオーディオデータのデジタル値と
出力率dとを乗算し、これをオーディオデータとして用
いる。このように出力率dが反映されたオーディオデー
タのD/A変換後のアナログ信号は、そうでない場合よ
りも相対的に信号の振幅が小さくなり、音楽の音量が小
さくなるわけである。
【0047】次に、目標値qの設定の仕方の例について
説明する。
【0048】目標値qは、出力する音楽のパワーの平均
値に基づいて設定することも可能である。そうすること
で、例えば、激しい音楽や穏やかな音楽といった音楽の
種類に応じて適切な目標値qを定めることができる。
【0049】音楽のパワーの平均値は、例えば、以下の
式から算出できる。
【0050】
【数1】
【0051】この音楽のパワーの平均値を用いて、以下
の式により導かれるQ(t)を算出する。このQ(t)
を音楽のパワー尺度と称する。
【0052】
【数2】
【0053】この場合のパワー尺度Q(t)は、直近の
b回分のPm(t)の平均値を意味している。
【0054】パワー尺度Q(t)は、以下の式により導
くこともできる。
【0055】
【数3】
【0056】そして、目標値qを以下の式から導くこと
ができる。
【0057】
【数4】
【0058】なお、Psは、合成音声のパワーの平均値
として予め定めた値であり、この値を基準として、合成
音声データを作成することとなる。また、係数lは、固
定値であってもよいし、ユーザが設定するようにしても
よい。
【0059】このようにして目標値qを算出することに
より、音楽の種類に応じて、音楽と合成音声とのバラン
スの取れた音声出力が可能となる。なお、この手法によ
り目標値qを設定する場合には、音楽のパワーの平均値
Pm(t)を音楽の音の出力毎に常時算出してRAM2
等に格納してデータベース化しておき、図8のS802
の処理を実行する場合に、上述した計算を実行して、目
標値qを導くこととなる。
【0060】次に、図6のフローチャートに戻って説明
を続ける。
【0061】S607では、RAM2に格納されている
合成音声データをCPU1が読み出す。S608では、
CPU1が、音量制御処理1により処理されたオーディ
オデータとS607で読み出した合成音声データとを重
畳した音声データを作成する。S609では、CPU1
が、S608で作成した音声データを、D/A変換器1
0へ出力する。アナログ信号に変換された音声データ
は、増幅回路11で増幅された後、スピーカ12から音
声として出力されることとなる。出力された音声は、音
楽と合成音声とが重畳された音声となる。
【0062】S610では、CPU1が合成音声を全て
出力し終えたか否かを判定し、そうでない場合は、S6
04へ戻って、上述した手順を繰り返すこととなる。こ
の結果、スピーカ12からは、音楽の音量が徐々に小さ
くなり、かつ、合成音声が重畳された音声が出力される
こととなる。
【0063】S610で、合成音声を全て出力し終えた
と判定した場合は、図7のS701へ進む。S701乃
至S705は、音楽の音量を徐々に元に戻しつつ音楽を
再生する処理である。
【0064】S701及びS702は、図5のS501
及びS502と同様の処理である。S703では、出力
される音楽の音量を元に戻すため、音量制御処理2を行
う。
【0065】図9は、音量制御処理2を示すフローチャ
ートである。音楽の音量は、合成音声の出力終了後、直
ちに元の音量に戻すことも可能であるが、本実施形態で
は、ユーザの不快感を軽減すべく、徐々に戻すこととし
ている。
【0066】S901では、CPU1が出力率dの値を
更新する。図8のS804の場合には、目標値qまで減
算していったが、ここでは、出力率dを初期値(d=
1)まで、加算していくこととなる。この場合、S80
4の場合と同様に、出力率dは、処理のループ回数に線
形に加算して更新してもよいし、非線形(例えば、カー
ブ)に加算して更新してもよい。
【0067】S902では、図7のS702で再生され
たオーディオデータに出力率dを反映させる。図8のS
805と同様の処理である。以上により1回の音量制御
処理2が終了する。図7のS701乃至S705の処理
のループを繰り返すことにより、出力率dが徐々に増加
して元に戻る。この結果、出力される音楽の音量が徐々
に大きくなって元の音量に戻ることとなる。
【0068】図7に戻って、S704では、CPU1
が、音量制御処理2により処理されたオーディオデータ
をD/A変換器10へ出力する。アナログ信号に変換さ
れたオーディオデータは、増幅回路11で増幅された
後、スピーカ12から音声として出力されることとな
る。
【0069】S705では、CPU1が、音量調整が終
了したか否か、すなわち、出力率d=1に戻ったか否か
を判定する。元に戻った場合には、S706へ進み、通
常の音楽出力処理(図5の処理)へ移行する。そうでな
い場合には、S701へ戻り、上述した手順を繰り返す
こととなる。この結果、スピーカ12からは、音楽の音
量が徐々に大きくなり、最終的に元の音量で音楽が出力
されることとなる。
【0070】図10は、図6及び図7の処理により、音
声出力装置101から出力される音楽の音量の変化を示
すタイミングチャートである。音楽の音量は、合成音声
の出力開始と共に徐々に小さくなって一定の音量となっ
ている。そして、合成音声の出力終了後に徐々に大きく
なって元の音量に戻っている。
【0071】このように本実施形態によれば、合成音声
の出力開始により音楽の音量を小さくするので、音楽と
合成音声とが重畳されていても、ユーザは合成音声をよ
り確実に聞き取ることができる。また、音楽の音量は徐
々に小さくなるので、ユーザに与える不快感を軽減でき
る。更に、合成音声の出力終了後には音楽の音量が元に
戻るので、この点からもユーザの不快感を軽減できる。
【0072】なお、上記実施形態では、合成音声の出力
と並行して音楽の音量を徐々に小さくすることとした
が、例えば、音楽の音量を変化させている間には合成音
声の出力を開始せずに、音楽の音量が小さくなった後に
(出力率d=目標値qとなった後に)、合成音声の出力
を開始してもよい。このようにすることで、ユーザは更
に確実に合成音声を聞き取ることができる。
【0073】また、本実施形態では、ネットワーク10
3から送信された電子メールやニュース等の情報を受信
し、これを音楽に重畳して合成音声により出力すること
としたが、このように合成音声により出力される情報
は、これに限られず、広くユーザに通知すべき情報が含
まれる。例えば、バッテリー残量等といった音声出力装
置101の状態を示す情報や、音声出力装置101が既
に記憶している情報等についても対象となり得る。
【0074】<他の実施形態>上記実施形態では、合成
音声を重畳する際に、出力される音楽全体の音量を徐々
に小さくしたが、出力される音楽のうち、所定の周波数
帯域に属する音の音量のみを徐々に小さくするようにし
てもよい。例えば、音楽に含まれる歌声の音量のみを徐
々に小さくするように、人間の声が多く含まれる周波数
帯域(概ね1乃至2kHz周辺である。)に属する音の
音量のみを徐々に小さくするようにしてもよい。歌声と
合成音声とは、その周波数が近い場合があり、ユーザに
おける合成音声の聞き取り難さの要因になり得るからで
ある。この場合、オーディオデータを帯域フィルタにか
けて、所定の周波数帯域の音にのみ、上述した出力率d
が反映されるようにすればよい。このようにすることで
音楽の音質も比較的維持することができよう。
【0075】また、同様の考え方により、上述した数式
1乃至4を用いて目標値qを設定する場合に、音楽のパ
ワーの平均値Pmを音楽全体のパワーから算出するので
はなく、所定の周波数帯域に属する音のパワーのみから
算出して、目標値qを設定することもできる。この場
合、人間の声が多く含まれる周波数帯域に属する音のみ
のパワーの平均値に基づいて目標値qを算出すること
で、比較的パワーの大きい音(例えば、ベース音やドラ
ム音等)の音量減少による音のバランスのくずれの影響
を軽減できる。
【0076】更に、このように周波数帯域を考慮に入れ
る場合において、音楽に男性又は女性の歌声が含まれる
場合には、男性の歌声か女性の歌声かにより、ターゲッ
トとする周波数帯域を異なるものとすることができる。
男性と女性とでは、声の周波数帯域が異なるため、これ
らを区別することでターゲットとする周波数帯域をより
狭めることができる。
【0077】<その他>以上、本発明の好適な実施の形
態について説明したが、本発明の目的は、前述した実施
形態の機能を実現するソフトウェアのプログラムを、シ
ステムあるいは装置に供給し、そのシステムあるいは装
置のコンピュータ(またはCPUやMPU)がプログラムを読
み出し実行することによっても、達成されることは言う
までもない。
【0078】この場合、そのプログラム自体が前述した
実施形態の機能を実現することになり、そのプログラム
や、そのプログラムを記憶した記憶媒体或いはプログラ
ム製品は、本発明を構成することになる。また、コンピ
ュータが読み出したプログラムコードを実行することに
より、前述した実施形態の機能が実現されるだけでな
く、そのプログラムコードの指示に基づき、コンピュー
タ上で稼働しているオペレーティングシステム(OS)など
が実際の処理の一部または全部を行い、その処理によっ
て前述した実施形態の機能が実現される場合も含まれる
ことは言うまでもない。
【0079】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
【0080】
【発明の効果】以上述べてきた通り、本発明によれば、
音楽の出力に重畳して合成音声を出力する場合に、ユー
ザが合成音声をより聞き取り易いようにすることができ
る。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る音声出力装置101
が使用されるシステムの例を示した図である。
【図2】音声出力装置101のハードウエア構成例を示
すブロック図である。
【図3】ディスプレイ9に表示される操作選択画面の一
例を示す図である。
【図4】文字データを合成音声データに変換する合成音
声変換処理の例を示すフローチャートである。
【図5】ユーザが音楽の出力を指示した場合に実行され
る処理の例を示すフローチャートである。
【図6】合成音声を出力する場合の処理の例を示すフロ
ーチャートである。
【図7】合成音声を出力する場合の処理の例を示すフロ
ーチャートである。
【図8】音量制御処理1を示すフローチャートである。
【図9】音量制御処理2を示すフローチャートである。
【図10】音声出力装置101から出力される音楽の音
量の変化を示すタイミングチャートである。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 21/06

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】音楽と、情報の内容を示す合成音声と、を
    重畳して出力可能な出力手段と、 出力される音楽の音量を制御する制御手段と、を備え、 前記制御手段は、 音楽の出力中に前記合成音声を重畳して出力する場合に
    は、該音楽の音量を徐々に小さくすることを特徴とする
    音声出力装置。
  2. 【請求項2】前記制御手段は、前記音楽の音量を所定の
    音量まで徐々に小さくすることを特徴とする請求項1に
    記載の音声出力装置。
  3. 【請求項3】前記所定の音量は、出力される音楽のパワ
    ーの平均値に基づいて定められることを特徴とする請求
    項2に記載の音声出力装置。
  4. 【請求項4】前記合成音声は、前記音楽の音量が前記所
    定の音量まで小さくなった後に、前記音楽に重畳して出
    力されることを特徴とする請求項2に記載の音声出力装
    置。
  5. 【請求項5】前記制御手段は、前記合成音声の出力後
    に、前記音楽の音量を元に戻すことを特徴とする請求項
    2に記載の音声出力装置。
  6. 【請求項6】前記音楽のパワーの平均値が、前記音楽の
    所定の周波数帯域に属する音に関するパワーの平均値で
    あることを特徴とする請求項3に記載の音声出力装置。
  7. 【請求項7】前記制御手段は、前記音楽の所定の周波数
    帯域に属する音の音量を徐々に小さくすることを特徴と
    する請求項1に記載の音声出力装置。
  8. 【請求項8】更に、 前記情報に含まれる文字データを合成音声データに変換
    する手段を備えたことを特徴とする請求項1に記載の音
    声出力装置。
  9. 【請求項9】更に、 前記情報を受信する手段を備えたことを特徴とする請求
    項8に記載の音声出力装置。
  10. 【請求項10】前記情報がネットワークから送信される
    情報であることを特徴とする請求項9に記載の音声出力
    装置。
  11. 【請求項11】音楽と、情報の内容を示す合成音声と、
    を重畳して出力する音声出力方法であって、 音楽の出力中に前記合成音声を重畳して出力する場合に
    は、該音楽の音量を徐々に小さくすることを特徴とする
    音声出力方法。
  12. 【請求項12】音楽、及び、情報の内容を示す合成音声
    を出力するために、コンピュータを、 音楽の出力中に前記合成音声を重畳して出力する場合に
    は、該音楽の音量を徐々に小さくする手段、として機能
    させるプログラム。
JP2001250409A 2001-08-21 2001-08-21 音声出力装置、音声出力方法、及び、プログラム Pending JP2003058198A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2001250409A JP2003058198A (ja) 2001-08-21 2001-08-21 音声出力装置、音声出力方法、及び、プログラム
US10/216,753 US7203647B2 (en) 2001-08-21 2002-08-13 Speech output apparatus, speech output method, and program
US11/612,603 US7603280B2 (en) 2001-08-21 2006-12-19 Speech output apparatus, speech output method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001250409A JP2003058198A (ja) 2001-08-21 2001-08-21 音声出力装置、音声出力方法、及び、プログラム

Publications (1)

Publication Number Publication Date
JP2003058198A true JP2003058198A (ja) 2003-02-28

Family

ID=19079229

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001250409A Pending JP2003058198A (ja) 2001-08-21 2001-08-21 音声出力装置、音声出力方法、及び、プログラム

Country Status (1)

Country Link
JP (1) JP2003058198A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007091475A1 (ja) * 2006-02-08 2007-08-16 Nec Corporation 音声合成装置、音声合成方法及びプログラム
WO2020013647A1 (ko) * 2018-07-13 2020-01-16 삼성전자 주식회사 전자 장치 및 전자 장치의 음량 조절 방법
JP2021182051A (ja) * 2020-05-18 2021-11-25 トヨタ自動車株式会社 エージェント連携装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0785590A (ja) * 1993-09-17 1995-03-31 Pioneer Electron Corp 音声ミキシング装置
JPH0818475A (ja) * 1994-06-27 1996-01-19 Fujitsu Ten Ltd 交通情報受信機能付オーディオ装置
JPH08181673A (ja) * 1994-12-26 1996-07-12 Fujitsu Ten Ltd 音声情報出力系付きオーディオ装置
JPH09146579A (ja) * 1995-11-22 1997-06-06 Matsushita Electric Ind Co Ltd 音楽再生装置
JPH10274542A (ja) * 1997-03-31 1998-10-13 Sony Corp 車載用音響装置
JPH11166835A (ja) * 1997-12-03 1999-06-22 Alpine Electron Inc ナビゲーション音声補正装置
JP2000029498A (ja) * 1998-07-15 2000-01-28 Yamaha Corp デジタルオーディオ信号のミキシング方法およびミキシング装置
JP2001034281A (ja) * 1999-07-26 2001-02-09 Fujitsu Ten Ltd 音声合成システム
JP2001103593A (ja) * 1999-09-29 2001-04-13 Nippon Columbia Co Ltd 信号レベル調整装置及び信号レベル調整方法
JP2001195079A (ja) * 2000-01-06 2001-07-19 Yamaha Corp 携帯型情報記録再生装置及びそのためのシステム
JP2001256041A (ja) * 2000-02-29 2001-09-21 Internatl Business Mach Corp <Ibm> コンピュータ、その制御方法、記録媒体及び伝送媒体

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0785590A (ja) * 1993-09-17 1995-03-31 Pioneer Electron Corp 音声ミキシング装置
JPH0818475A (ja) * 1994-06-27 1996-01-19 Fujitsu Ten Ltd 交通情報受信機能付オーディオ装置
JPH08181673A (ja) * 1994-12-26 1996-07-12 Fujitsu Ten Ltd 音声情報出力系付きオーディオ装置
JPH09146579A (ja) * 1995-11-22 1997-06-06 Matsushita Electric Ind Co Ltd 音楽再生装置
JPH10274542A (ja) * 1997-03-31 1998-10-13 Sony Corp 車載用音響装置
JPH11166835A (ja) * 1997-12-03 1999-06-22 Alpine Electron Inc ナビゲーション音声補正装置
JP2000029498A (ja) * 1998-07-15 2000-01-28 Yamaha Corp デジタルオーディオ信号のミキシング方法およびミキシング装置
JP2001034281A (ja) * 1999-07-26 2001-02-09 Fujitsu Ten Ltd 音声合成システム
JP2001103593A (ja) * 1999-09-29 2001-04-13 Nippon Columbia Co Ltd 信号レベル調整装置及び信号レベル調整方法
JP2001195079A (ja) * 2000-01-06 2001-07-19 Yamaha Corp 携帯型情報記録再生装置及びそのためのシステム
JP2001256041A (ja) * 2000-02-29 2001-09-21 Internatl Business Mach Corp <Ibm> コンピュータ、その制御方法、記録媒体及び伝送媒体

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007091475A1 (ja) * 2006-02-08 2007-08-16 Nec Corporation 音声合成装置、音声合成方法及びプログラム
US8209180B2 (en) 2006-02-08 2012-06-26 Nec Corporation Speech synthesizing device, speech synthesizing method, and program
WO2020013647A1 (ko) * 2018-07-13 2020-01-16 삼성전자 주식회사 전자 장치 및 전자 장치의 음량 조절 방법
KR20200007378A (ko) * 2018-07-13 2020-01-22 삼성전자주식회사 전자 장치 및 전자 장치의 음량 조절 방법
CN112424744A (zh) * 2018-07-13 2021-02-26 三星电子株式会社 电子设备和电子设备的音量调节方法
US11169769B2 (en) 2018-07-13 2021-11-09 Samsung Electronics Co., Ltd. Electronic device and volume adjustment method of electronic device
KR102580521B1 (ko) 2018-07-13 2023-09-21 삼성전자주식회사 전자 장치 및 전자 장치의 음량 조절 방법
JP2021182051A (ja) * 2020-05-18 2021-11-25 トヨタ自動車株式会社 エージェント連携装置
US11740865B2 (en) 2020-05-18 2023-08-29 Toyota Jidosha Kabushiki Kaisha Agent coordination device, agent coordination method and recording medium
JP7347324B2 (ja) 2020-05-18 2023-09-20 トヨタ自動車株式会社 エージェント連携装置

Similar Documents

Publication Publication Date Title
US7603280B2 (en) Speech output apparatus, speech output method, and program
KR100605854B1 (ko) 이동통신단말기에서 데이터의 다운로드 및 재생 시 진행시간 표시 방법
CN110390925B (zh) 人声与伴奏同步方法、终端、蓝牙设备及存储介质
US20230252964A1 (en) Method and apparatus for determining volume adjustment ratio information, device, and storage medium
JPH10257596A (ja) 話速変換方法およびその装置
CN110675848A (zh) 音频处理方法、装置及存储介质
KR100591378B1 (ko) 악음 재생 장치와 방법, 및 휴대 단말 장치
CN112616108B (zh) 音频输出方法及装置、系统、存储介质和电子设备
CN112017622B (zh) 一种音频数据的对齐方法、装置、设备和存储介质
WO2023061330A1 (zh) 音频合成方法、装置、设备及计算机可读存储介质
JP2003058198A (ja) 音声出力装置、音声出力方法、及び、プログラム
CN116347320B (zh) 音频播放方法及电子设备
JP4224450B2 (ja) 移動体通信端末及びプログラム
JP2014060690A (ja) 音声出力システム、情報処理装置、情報処理プログラム、および音声出力制御方法
KR20010076533A (ko) 휴대전화 단말기의 노래방 기능 구현 및 사용방법
JP4229058B2 (ja) 端末装置および記録媒体
JP4574299B2 (ja) 音楽再生装置
CN112307161B (zh) 用于播放音频的方法和装置
JP2014167520A (ja) 通信障害時にデュエット歌唱を継続可能な通信カラオケシステム
CN113407147A (zh) 音频播放方法、装置、设备及存储介质
CN1157537A (zh) 无线电选择呼叫接收机
US20050096915A1 (en) Contents reproducing system and contents reproducing program
KR102523048B1 (ko) 가상공간에서의 소리 변환 시스템 및 그 방법
JP7359896B1 (ja) 音処理装置及びカラオケシステム
JP2003058200A (ja) 音声出力装置、音声出力方法、及び、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080717

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110411

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110608

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111028

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120326