JP2003257125A - 音再生方法および音再生装置 - Google Patents

音再生方法および音再生装置

Info

Publication number
JP2003257125A
JP2003257125A JP2002059570A JP2002059570A JP2003257125A JP 2003257125 A JP2003257125 A JP 2003257125A JP 2002059570 A JP2002059570 A JP 2002059570A JP 2002059570 A JP2002059570 A JP 2002059570A JP 2003257125 A JP2003257125 A JP 2003257125A
Authority
JP
Japan
Prior art keywords
sound source
data
source data
music
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002059570A
Other languages
English (en)
Inventor
Yoshiteru Uchiyama
喜照 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2002059570A priority Critical patent/JP2003257125A/ja
Publication of JP2003257125A publication Critical patent/JP2003257125A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】複数の音源データを1つのCPUで効率よく混
合して再生する。 【解決手段】音源データとして、圧縮・符号化された音
声データ11と音楽データ12をメモリ1上に保持し、
このメモリ1上に保持された音声データ11と音楽デー
タ12を1つのCPU2に入力する。このCPU2は音
声データ11をデコード処理する音声デコーダ21と音
楽データ12をデコード処理する音楽デコーダ22を有
するとともに、それぞれのデコード処理された音声デー
タと音楽データを混合する混合処理部25を有する。ま
た、たとえば、音楽をユーザに出力している最中に音声
メッセージをユーザに伝えるような場合は、デコード処
理後の音楽データの音量を下げて、小さいな音量で音楽
を出力しながらユーザの聞き取りやすい適正な音量で音
声データを出力するようなゲイン制御を行う音声ゲイン
制御部23と音楽ゲイン制御部24を設ける。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、少なくとも2つの
音情報を混合して再生可能な音再生方法および音再生装
置に関する。
【0002】
【従来の技術】たとえば、音楽に音声を重畳させて再生
するというように複数の音源データを混合して再生可能
な機器が種々の分野で利用されている。これは、たとえ
ば、音楽の再生中にその音楽を聴いているユーザに対し
て、音声によるメッセージを伝えることができるもので
あり、音楽を発生する音源と音声を発生する音源をそれ
ぞれ別個に持ち、それぞれの音源からの音源データを混
合させて出力させるようにしているのが一般的である。
【0003】このような技術の従来例としては、たとえ
ば、特開平5−101536号公報に記載の技術(以
下、第1の従来技術という)や、特開平9−27169
号公報に記載の技術(以下、第2の従来技術という)な
どがある。
【0004】
【発明が解決しようとする課題】上述した第1の従来技
術は、ラジオやカセットテープ再生装置などからの音楽
アナログ信号と音声合成LSIから出力される音声アナ
ログ信号とを混合して再生するもので、ラジオやカセッ
トテープ再生装置などから音楽を再生している最中に、
その音楽に音声を混合させて出力させる際、その音声の
出力期間中は、ラジオやカセットテープ再生装置などか
ら出力される音楽アナログ信号を減衰させるようにし
て、音声を聞き取りやすくするというものである。
【0005】しかし、この第1の従来技術を実現するた
めのシステム構成としては、音源発生手段として、音楽
アナログ信号を発生するための音源発生手段(ラジオや
カセットテープ再生装置)と、音声アナログ信号を発生
するための音源発生手段(音声合成LSI)をそれぞれ
別個に用意し、さらに、これらそれぞれの音源発生手段
から出力されるアナログ信号を混合させるための混合手
段、音量を制御するための音量制御手段などの構成要素
をそれぞれ別個に用意することで1つのシステムを実現
している。
【0006】また、第2の従来技術は、音声データと音
楽データをCD(コンパクトディスク)などの記録媒体
に別フレームで記録し、それをデータ読み出し制御部が
それぞれのデータを読み出して、マイコンによってメモ
リ上に一時的に記憶させたのちに、両者を混合させて出
力させるようにしている。
【0007】この第2の従来技術も、それを実現するた
めには、音声データや音楽データなどの音源データを発
生する音源発生手段(CDなど)を必要とし、しかも、
その音源発生手段から音声データや音楽データを所定の
タイミングで読み出すためのデータ読み出し制御手段
や、読み出された音源データを処理するマイコンなどを
それぞれ個別に用意することで1つのシステムを実現し
ている。
【0008】また、この第2の従来技術は、CDなどに
記録された音声データや音楽データを音源データとして
用いているが、一般に、CDなどの記録媒体に記録され
たデータ量はきわめて多いのが普通であり、たとえ、無
音削除処理などの圧縮はなされていても、それを格納す
るためには大きなメモリ容量が必要であるという問題も
ある。
【0009】そこで本発明は、圧縮・符号化された少な
くとも2つの音源データをメモリ上に保持し、そのメモ
リ上に保持された少なくとも2つの音源データを1つの
演算処理手段(CPU)上においてソフトウエアでの演
算処理によるデコード処理および混合・再生処理を可能
とすることで、簡単なハードウエアで複数の音源データ
の混合再生を実現することができる音再生方法および音
再生装置を提供することを目的としている。
【0010】
【課題を解決するための手段】上述の目的を達成するた
めに、本発明の音再生方法は、2つ以上の音源データを
混合させて再生可能な音再生方法において、前記2つ以
上の音源データが圧縮・符号化された状態でメモリに保
持され、これらそれぞれの音源データを混合して出力す
る際は、前記メモリ上に保持されたそれぞれの音源デー
タを演算処理装置に入力して、この演算処理装置では、
この演算処理装置に組み込まれたソフトウエアによって
それぞれの音源データをデコード処理し、そのデコード
処理されたそれぞれの音源データを所定の混合比率で混
合して出力するようにしている。
【0011】このような音再生方法において、前記それ
ぞれの音源データのうち、少なくとも1つの音源データ
に対するデコード処理は、そのデコード処理を行う際の
演算精度が複数段階で設定され、その複数段階の演算精
度のいずれかを選択可能とし、その演算精度の選択が可
能とされた音源データに対しては、その音源データと他
の音源データとの混合比率に応じて、その音源データに
おけるデコード処理の演算精度を選択可能としている。
【0012】この音再生方法において、前記混合比率
は、ある1つの音源データのみを出力させる混合比率を
含むようにしている。
【0013】この音再生方法において、前記複数の音源
データを混合する際、デコード処理後の混合すべき音声
データのうち、ユーザに対し主に伝達すべき音源データ
以外の音源データの音量を当該ユーザが可聴な範囲で小
さくするようなゲイン制御を可能としている。
【0014】また、本発明の音再生装置は、2つ以上の
音源データを混合させて再生可能な音再生装置におい
て、2つ以上の圧縮・符号化された音源データを保持す
るメモリと、このメモリ上に保持されたそれぞれの音源
データをデコード処理するそれぞれのデコード処理部お
よびこれらデコード処理された音源データを混合する音
源データ混合処理部を有し、この音源データのデコード
処理およびそのデコード処理されたそれぞれの音源デー
タを所定の混合比率で混合する処理をソフトウエアによ
る演算によって行う演算処理手段とを有する構成として
いる。
【0015】このような音再生装置において、前記それ
ぞれの音源データをデコード処理するそれぞれのデコー
ド処理部のうち、少なくとも1つの音源データに対する
デコード処理部は、そのデコード処理を行う際の演算精
度が複数段階で設定され、その複数段階の演算精度のい
ずれかを選択可能とし、その演算精度の選択が可能とさ
れた音源データに対しては、その音源データと他の音源
データとの混合比率に応じて、その音源データにおける
デコード処理の演算精度を選択可能としている。
【0016】この音再生装置において、前記混合比率
は、ある1つの音源データのみを出力させる混合比率を
含むようにしている。
【0017】この音再生装置において、前記複数の音源
データを混合する際、デコード処理後の混合すべき音声
データのうちユーザに対し主に伝達すべき音源データ以
外の音源データの音量を当該ユーザが可聴な範囲で小さ
くするようなゲイン制御を可能としている。
【0018】このように本発明は、2つ以上の圧縮・符
号化された音源データをメモリ上に保持し、これら2つ
以上の音源データを1つの演算処理装置(CPU)でデ
コード処理し、そのデコード処理されたそれぞれの音源
データを混合して出力するようにしている。これによっ
て、本発明を実現するに必要な主な構成要素としては、
メモリと1つのCPUで済み、ハードウエアを簡素化す
ることができ、また、メモリ上に保持される音源データ
は圧縮・符号化された音源データであるので、小容量の
メモリで対応することができるとともに、メモリを有効
利用することができる。
【0019】また、それぞれの音源データのうち、少な
くとも1つの音源データに対するデコード処理は、その
デコード処理を行う際の演算精度を複数段階に設定し、
その複数段階のいずれかの演算精度を選択可能とし、他
の音源データとの混合比率に応じていずれかの演算精度
を選択可能としている。
【0020】これによって、ある特定の音源データにつ
いては、他の音源データとの混合比率に応じた演算精度
でデコード処理をすることができるので、場合によって
は演算精度を落としたデコード処理も可能となり、デコ
ード処理に要する演算量を極力抑えることができ、演算
処理手段(CPU)の演算負荷を小さくすることができ
る。それによって、処理能力の小さなCPUでも対応す
ることができ安価なシステムへの適用が可能となる。
【0021】また、混合比率は、ある1つの音源データ
のみを100%とする混合比率を含んでいる。これは、
ある1つの音源データを単独で出力可能とするもので、
これを上述の混合比率に応じた演算精度でデコード処理
することと組み合わせることによって、たとえば、ある
1つの音源データを単独で出力させるような場合は、演
算精度の高いデコード処理を行い、逆に、他の音源デー
タと混合させる場合は、演算精度を落としたデコード処
理を行うということが可能となる。
【0022】これによって、ある1つの音源データを単
独で出力させるような場合は、音質に優れた音再生を行
うことができ、他の音源データと混合させる場合は、演
算量を削減したデコード処理が可能となり、その時の状
況に応じた効率的なデコード処理が可能となる。
【0023】また、複数の音源データを混合する際は、
デコード処理後の混合すべき音声データのうち、ユーザ
に対して、主に伝達すべき音源データ以外の音源データ
の音量を当該ユーザが可聴な範囲で小さくするようなゲ
イン制御を行うようにしている。これにより、たとえ
ば、音楽の再生中に、その音楽を聴いているユーザに音
声メッセージを出力するような場合、その音楽を中断さ
せることなく音声メッセージを適切な音量で出力するこ
とができるので、音楽が途中で途切れるといった不自然
さをなくすことができる。
【0024】本発明は以上のような特徴を有するので、
たとえば、携帯MP3(Mpeg audiolayer3)プレーヤな
どで、音楽を再生中に、ユーザに電池残量を音声メッセ
ージとして伝えるような場合や、時刻を音声によって報
知可能な時計などでバックグラウンドミュージックに乗
せて現在時刻を知らせるような場合、さらに、カーナビ
ゲーションシステムにおいてハードディスクに録音した
音楽を再生しながら道案内の音声メッセージを出力する
ような場合など、幅広い分野で使用することができる。
【0025】また、本発明が行う圧縮・符号化された音
源データのデコード処理、ゲイン制御処理、混合処理な
どは、1つの演算処理手段(CPU)内においてソフト
ウエアで実現されるので、本発明はこれらデコード処
理、ゲイン制御、混合処理などを実現するための構成要
素を個々に持つ必要がなく、音再生装置としてのハード
ウエアを簡素化することができる。
【0026】
【発明の実施の形態】以下、本発明の実施の形態につい
て説明する。なお、本発明を第1の実施の形態と第2の
実施の形態に分けて説明する。
【0027】〔第1の実施の形態〕図1は本発明の第1
の実施の形態に係る音再生装置の全体的な構成を示す図
であり、少なくとも2つ以上の圧縮・符号化された音源
データを保持するメモリ1、このメモリ1に保持された
それぞれの音源データをデコード処理してゲイン制御を
行ったのちに混合する演算処理手段(CPUという)
2、このCPU2から出力される音源データをディジタ
ル/アナログ変換するD/A変換部3、D/A変換され
た音を出力するスピーカ4を有した構成となっている。
【0028】図2は図1で示した音再生装置のメモリ1
が保持するデータ内容とCPU2の処理機能について具
体的に説明する図である。この第1の実施の形態では、
メモリ1に格納される少なくとも2つの音源データは、
音声データ11と音楽データ12であるとし、音声デー
タ11はたとえばADPCMやCELPなどの符号化アルゴリズ
ムを用いて圧縮・符号化された音声データであり、ま
た、音楽データ12はMP3やAACなどの符号化アルゴリズ
ムを用いて圧縮・符号化された音楽データである。
【0029】また、CPU2はこの発明を実現するため
に必要な演算処理手段であり、圧縮・符号化された音声
データ11を通常のPCMの音声データに復元する音声デ
ータ用デコーダ(以下、音声デコーダという)21、圧
縮・符号化された音楽データ12を通常のPCMの音楽デ
ータに復元する音楽データ用デコーダ(以下、音楽デコ
ーダという)22、音声デコーダ21によりデコード処
理された音声データのゲイン制御を行うことでその音量
を制御する音声データ用ゲイン制御処理部(音声ゲイン
制御部という)23、音楽デコーダ22によりデコード
処理された音楽データのゲイン制御を行うことでその音
量を制御する音楽データゲイン制御処理部(音楽ゲイン
制御部という)24、これらゲイン制御された音声デー
タと音楽データを混合させる混合処理部25、出力音量
を制御する出力音量制御部26を有している。
【0030】このように、本発明はメモリ1に格納され
た少なくとも2つの圧縮・符号化された音源データ(こ
の実施の形態では、音声データ11と音楽データ12の
2種類の音源データとしている)を、1つのCPU2で
デコード処理するとともに、際の混合比率(音量の比率
であるとする)を決めるためのゲイン制御を行って混合
させたのちに、出力音量を決定して出力するようにして
いる。
【0031】なお、圧縮・符号化された音源データ(音
声データ11と音楽データ12)のデコード処理、ゲイ
ン制御処理、混合処理、さらには、出力音量制御処理な
どは、すべてCPU2内においてソフトウエアで実現さ
れるものである。以下に、このCPU2が行う処理につ
いて詳細に説明する。
【0032】まず、メモリ1に格納されている圧縮・符
号化された音声データ11は、CPU2によって読み出
されて音声デコーダ21でデコード処理されPCMの音
声データとして出力され、また、圧縮・符号化された音
楽データ12は、音楽デコーダ22でデコード処理され
PCMの音楽データとして出力される。
【0033】なお、これら音声デコーダ21と音楽デコ
ーダ22におけるデコード処理は、音声データ11と音
楽データ12に対して、それぞれフレーム単位で行うの
が一般的である。このフレームの長さは符号化する際の
符号化方式によって決まっている。
【0034】ここで、メモリ1に格納されている圧縮・
符号化された音声データ11のフレーム長をLとし、圧
縮・符号化された音楽データ12のフレーム長をNとし
たとき、仮にL=Nであれば、音声デコーダ21による
デコード処理と音楽デコーダ22によるデコード処理を
交互に行って、デコード処理後の音声データとデコード
処理後の音楽データのそれぞれのフレームごとに混合
(それぞれゲイン制御を行ったのちに混合)して行けば
よいが、音声データ11と音楽データ12ではそのフレ
ーム長が異なる(L≠N)のが一般的である。
【0035】このように、音声データ11のフレーム長
Lと音楽データ12のフレーム長Nが異なる場合の混合
処理について図3を参照しながら以下に説明する。
【0036】図3(a)は、メモリ1上に格納されてい
る圧縮・符号化された音声データ11を示すもので、フ
レーム長Lごとの音声データをV1,V2,V3,・・
・で表せば、これら各フレーム長Lごとの音声データV
1,V2,V3,・・・が時間軸上に沿って記録されて
いる。
【0037】また、同様に、図3(b)は、メモリ1上
に格納されている圧縮・符号化された音楽データ12で
あり、フレーム長N(この場合、L<N)ごとの音楽デ
ータをM1,M2,M3,・・・で表せば、これら各フ
レーム長Nごとの音楽データM1,M2,M3,・・・
がそれぞれの時間軸上に沿って記録されている。
【0038】メモリ1上にこのように格納された音声デ
ータ11( 各フレーム長Lごとの音声データV1,V
2,V3,・・・)と音楽データ12(各フレーム長N
ごとの音楽データM1,M2,M3,・・・)は、CP
U2によって読み出され、音声データ11は各フレーム
長Lごとの音声データV1,V2,V3,・・・単位で
音声デコーダ21によってデコード処理され、音楽デー
タ12は各フレーム長Nごとの音楽データM1,M2,
M3,・・・単位で音楽デコーダ22によってデコード
処理される。
【0039】なお、ここでは、1つのCPU2によって
デコード処理を行うので、音声データV1,V2,V
3,・・・と音楽データM1,M2,M3,・・・とを
それぞれのフレームごとに交互にデコード処理するよう
にしている。
【0040】このとき、音声データ11と音楽データ1
2のどちらを先にデコード処理するかは自由であるが、
ここでは、音声データ11を先に行うものとする。した
がって、始めに音声データ11における第1フレームの
音声データV1をデコード処理し、続いて音楽データ1
1における第1フレームの音楽データM1をデコード処
理し、これらデコード処理された音声データ(これをV
1’で表す)とデコード処理された音楽データ(これを
M1’で表す)とを混合する。
【0041】このとき、デコード処理後の音声データと
音楽データのそれぞれのゲインを制御し、たとえば、音
楽を再生中にユーザに対して音声で何かを伝えたい場合
は、音声を聞き取りやすくするために、音楽データの音
量を小さくして、その分、音声データの音量を大きくす
るようなゲイン制御処理を音声ゲイン制御部23と音楽
ゲイン制御部24によって行うが、ここでは、その説明
を省略し、混合出力を得る処理についてのみをこの図3
によって説明する。なお、このゲイン制御についての具
体例についてはのちに説明する。
【0042】上述のように、まず、第1フレームの音声
データV1をデコード処理し、デコード処理された音声
データV1’(図3(c)参照)を得たのち、続いて、第
1フレームの音楽データM1をデコード処理し、デコー
ド処理された音楽データM1’(図3(d)参照)を得
て、これらデコード処理された音声データV1’と音楽
データM1’を混合処理する。
【0043】この混合処理は、音声データV1’のフレ
ーム長Lと音楽データM1’のフレーム長Nが異なり、
この場合、L<Nであるので、音声データV1’と音楽
データM1’の混合処理は、図3(e)に示すように、
音楽データM1’に対してはそのフレームの始点(p0
とする)から音声データV1’のフレーム長Lに対応し
た分だけの長さ(p0からp1までの区間)の区間で行
われ、その混合出力S1を得る。この混合処理によっ
て、音楽データM1’はα1だけ余ることになる。
【0044】そして次に、第2フレームの音声データV
2についてデコード処理を行い、デコード処理された音
声データV2’(図3(c)参照)を得たのち、第2フレ
ームの音楽データM2についてデコード処理を行い、デ
コード処理された音楽データM2’(図3(d)参照)を
得るが、ここでの混合処理は、音声データV2’と、そ
のフレーム長Lに対応する音楽データに対して行われ
る。つまり、この場合、音楽データM2’に対しては、
デコード処理された音楽データM1’におけるp1を始
点にフレーム長Lに対応した分だけの長さ(p1からp
2までの区間)の区間で混合処理が行われ、その混合出
力S2が図3(e)のように出力される。この混合処理
によって、音楽データV2’はα2だけ余ることにな
る。
【0045】そして次に、第3フレームの音声データV
3についてデコード処理を行い、デコード処理された音
声データV3’(図3(c)参照)を得たのち、第3フレ
ームの音楽データM3についてデコード処理を行い、デ
コード処理された音楽データM3’(図3(d)参照)を
得るが、ここでの混合処理は、音声データV3’と、そ
のフレーム長Lに対応する音楽データに対して行われ
る。つまり、この場合、音楽データに対しては、デコー
ド処理された音楽データM2’におけるp2を始点にフ
レーム長Lに対応した分だけの長さ(p2からp3まで
の区間)の区間で混合処理が行われ、その混合出力S3
が図3(e)のように出力される。この混合処理によっ
て、音楽データV3’はα3だけ余ることになる。
【0046】そして次に、第4フレームの音声データV
4についてデコード処理を行い、デコード処理された音
声データV4’(図3(c)参照)を得たのち、第4フレ
ームの音楽データM4についてデコード処理を行い、デ
コード処理された音楽データM4’(図3(d)参照)を
得るが、ここでの混合処理は、音声データV4’と、そ
のフレーム長Lに対応する音楽データに対して行われ
る。つまり、この場合、音楽データに対しては、デコー
ド処理された音楽データM3’におけるp3を始点にフ
レーム長Lに対応した分だけの長さ(p3からp4まで
の区間)の区間で混合処理が行われ、その混合出力S4
が図3(e)のように出力される。この混合処理によっ
て、音楽データV4’はα4だけ余ることになる。
【0047】そして次に、第5フレームの音声データV
5についてデコード処理を行い、デコード処理された音
声データV5’(図3(c)参照)を得るが、そのデコー
ド処理された音声データV5’のフレーム長Lに対応可
能な長さの音楽データがすでに音楽データM4’として
得られている。
【0048】つまり、前回の混合処理による音楽データ
V4’の余りα4は、この図3からもわかるように、音
声データV5’のフレーム長Lよりも長いので、この場
合は、音楽データM5のデコード処理を行う前に、その
時点でデコード処理された音声データV5’とすでにデ
コード処理されている音楽データM4’のp4からp5
の区間を用いて混合処理することができ、それによっ
て、混合出力S5が図3(e)のように出力される。こ
のとき、音楽データV4’はさらにα5だけ余ることに
なる。
【0049】そして次に、第6フレームの音声データV
6についてデコード処理を行い、デコード処理された音
声データV6’(図3(c)参照)を得て、続いて、第5
フレームの音楽データM5のデコード処理を行うことに
よって、デコード処理された音楽データM5’(図3
(d)参照)を得て、これまで説明したような混合処理を
行い、以降、上述した処理を繰り返す。
【0050】図4は以上説明した音声データ11(各フ
レーム長Lごとの音声データV1,V2,・・・)と音
楽データ12(各フレーム長Nごとの音楽データM1,
M2,・・・)のデコード処理順序1,2,3,・・・
と、それによって得られたデコード処理後の各フレーム
対応の音声データV1’, V2’, V3’,・・・お
よび各フレーム対応の音楽データM1’, M2’, M
3’,・・・と、その混合出力S1,S2,S3,・・
・の関係を示す図である。
【0051】まず、デコード処理順序1では、デコード
処理された第1フレームの音声データV1’を得て、デ
コード処理順序2では、デコード処理された第1フレー
ムの音楽データM1’を得る。そして、その第1フレー
ムの音楽データM1’を得たところで、両者を混合して
混合出力S1を出力する。
【0052】続いて、デコード処理順序3では、デコー
ド処理された第2フレームの音声データV2’を得て、
デコード処理順序4では、デコード処理された第2フレ
ームの音楽データM2’を得る。そして、その第2フレ
ームの音楽データM2’を得たところで、両者を混合し
て混合出力S2を出力する。このような処理を、デコー
ド処理順序5,6,7,8と繰り返す。
【0053】そして、デコード処理順序8において、混
合出力S4を出力したあと、デコード処理順序9として
デコード処理された第5フレームの音声データV5’を
得るが、この時点では、図3で説明したように、前回
(デコード処理順序8)の混合処理による音楽データM
4’の余りα4が、音声データV5’のフレーム長Lよ
りも長いので、この場合は、その時点でデコード処理さ
れた音声データV5’と、すでにデコード処理されてい
る音楽データM4’を用いた混合処理がなされ、混合出
力S5が出力される。
【0054】そのあとのデコード処理順序10として
は、デコード処理された音声データV6’を得たのち、
デコード処理順序11において、デコード処理された音
声データV6’を得て、それらによって混合出力S6を
得るというような処理を繰り返す。
【0055】以上のような処理を行うことで、フレーム
長の異なる2つの圧縮・符号化された音源データ(この
実施の形態では音声データ11と音楽データ12)を1
つのCPU2によってデコード処理と混合処理を行うこ
とができる。
【0056】ところで、前述したCPU2の処理におい
て、音声データ11と音楽データ12をそれぞれデコー
ド処理したのち、これらデコード処理された音声データ
と音楽データを、音声ゲイン制御部23および音楽ゲイ
ン制御部24でゲインの混合比率(音量比率)を制御す
ることも可能である。たとえば、前述したように、音声
メッセージをユーザに伝えるような場合は、音声データ
を適切な音量となるようなゲイン制御して、音楽データ
の音量を可聴な範囲で小さくするといった制御を行う。
これによって、音楽は小さい音量でバックグラウンド的
に出力したまま、ユーザに伝えたい音声メッセージなど
はユーザが聞き取りやすい適切な音量で出力させること
ができる。
【0057】〔第2の実施の形態〕この第2の実施の形
態は、CPU2で行うデコード処理をより効率よく、よ
り少ない演算量で行おうとするもので、この第2の実施
の形態も第1の実施の形態と同様、メモリ1に格納され
ている音源データとしては、圧縮・符号化された音声デ
ータ11と、圧縮・符号化された音楽データ12である
とする。
【0058】図5は本発明の第2の実施の形態に係る音
再生装置の構成図であり、図2で示した構成図に対応す
るもので、図2の構成に対して、音楽データ12をデコ
ード処理する音楽デコーダ22が2つ存在している(こ
の図5では、第1の音楽デコーダ221と第2の音楽デ
コーダ222とする)点と、これら第1および第2の音
楽デコーダ221,222を選択するデコーダ選択部2
7が存在する点が異なり、その他は図2と同じであるの
で、図2と同じ構成要素には図2と同じ符号が付されて
いる。
【0059】第1の音楽デコーダ221は、通常の演算
精度によってデコード処理を行うデコーダであって、圧
縮・符号化された音楽データ12を音楽として聴くに十
分な音質を得ることができる程度のデコード処理を行う
ものである。一方、第2の音楽デコーダ222は、第1
の音楽デコーダ221よりも演算精度をある程度落とす
ことで、少ない演算量で音楽データ12のデコード処理
を行うものであり、音質的には多少の劣化が生じる。
【0060】デコーダ選択部27は、音声データ11と
音楽データ12との混合比率(音量比率)に応じて、第
1および第2の音楽デコーダ221,222のいずれか
を選択するもので、具体的には、たとえば、メモリ1か
ら音楽データ12のみを読み出して、読み出された音楽
データ12をデコード処理して出力する場合、つまり、
音楽データの混合比率が100%の場合には、第1の音
楽デコーダ221を選択する。また、音楽に乗せて音声
メッセージを出力する場合のように、音楽データ12の
音量を小さくして音声データ11の音量を大きくする場
合には、第2の音楽デコーダ222を選択する。
【0061】これは、デコーダ選択部27が、音楽デー
タ12のみをデコード処理して再生するモード(音楽再
生モードという)であるか、音楽データ12と音声デー
タ11とを混合して再生するモード(混合再生モードと
いう)であるかを検出して、音楽再生モードであるとき
は、第1の音楽デコーダ221を選択し、混合再生モー
ドであるときは第2の音楽デコーダ222を選択する機
能を持つことで実現できる。
【0062】また、第1および第2の音楽デコーダ22
1,222は、この図5では、便宜上、2つの独立した
ブロックとして描かれているが、実際のデコード処理に
必要な演算は、それぞれのデコーダにおいて共通してい
る部分も多く、プログラムコードなどの資源の多くは共
用することができる。
【0063】このような構成においてその動作を説明す
る。まず、音楽再生モードである場合は、デコーダ選択
部27は第1の音楽デコーダ221を選択した状態にあ
る。この音楽再生モードは、ここでは、メモリ1から音
楽データ12のみが読み出されて、音楽データのみを再
生して出力する場合である。
【0064】このような音楽再生モードにおいては、そ
の音楽データ12のデコード処理は、高い演算精度によ
るデコード処理が可能な第1の音楽デコーダ221を用
いて行われるので、高品質な音再生がなされる。また、
そのときの音楽ゲイン制御部24におけるゲイン制御
は、この場合、音声データ11の再生は行わないので、
全体の混合比率を100%(これを1で表す)とすれ
ば、音楽ゲイン制御部24と音声ゲイン制御部23にお
ける音楽データ12と音声データ11の混合比率は1:
0となり、それによって音楽データ12のみが最適な音
量に制御されて再生される。
【0065】一方、音楽データ12の再生中に音声メッ
セージなどをその音楽データ12に混合させて出力する
場合について、図6を参照しながら説明する。なお、こ
の図6は、時間tの変化に対するデコード処理後の音楽
データとデコード処理後の音声データに対するゲインの
制御と、第1および第2の音楽デコーダ221,222
の選択制御を説明するもので、デコード処理後の音楽デ
ータ(このデコード処理後の音楽データに12’の符号
を付す)のゲインの変化を細い実線で示し、デコード処
理後の音声データ(このデコード処理後の音声データに
11’の符号を付す)のゲインの変化を太い実線で示し
ている。
【0066】今、音楽データ12を第1の音楽デコーダ
221によってデコード処理して再生している最中に、
ある時刻t0において、音声データ11の混合を指示す
る信号が出されたとする。
【0067】これによって、デコード処理後の音楽デー
タ12’と音声データ11をデコード処理して得られた
デコード処理後の音声データ11’のゲインの比率を制
御、つまり、デコード処理後の音楽データ12’の音量
を小さくして、デコード処理後の音声データ11’の音
量を大きくするようなゲイン制御を行うが、デコード処
理後の音楽データ12’の音量を急激に小さくすると、
それを聴いているユーザにとっては不快なものとなるた
め、徐々に音量が小さくなるようなゲイン制御を行う。
【0068】すなわち、図6に示すように、時刻t0ま
では音楽ゲイン制御部23と音声ゲイン制御部24のゲ
インの比率は1:0、つまり、デコード処理後の音楽デ
ータ12’が100%の音量で出力されるようなゲイン
制御となっており、それによって、音楽はある最適な音
量で出力されている。この状態で、時刻t0からデコー
ド処理後の音楽データ12’のゲインを徐々に下げて行
く。そして、時刻t1において、デコード処理後の音声
データ11’には、デコード処理後の音楽データ12’
よりも大きなゲインrを与え(0<r<1)、デコード
処理後の音楽データ12’には1−rのゲインを与え
る。
【0069】つまり、デコード処理後の音声データ1
1’は、全体のゲイン(100%=1)の範囲内におい
て、デコード処理後の音楽データ12’のゲインよりも
大きな値rを有するゲインが与えられる。これに対し
て、デコード処理後の音楽データ12’には、全体のゲ
インからrを差し引いた1−rのゲインが与えられる。
具体的に言えば、デコード処理後の音声データ11’に
対しては、たとえば80%、デコード処理後の音楽デー
タ12’に対しては、たとえば20%を割り当てるとい
うことであり、これによって、音楽を小さい音量で出力
しながら音声メッセージなどを大きな音量で出力させる
ことができる。
【0070】なお、上述したように、rは1(100
%)未満であるので、音声出力中にも音楽を小さな音量
で継続して出力することができ、音声出力中に音楽が途
切れるといった不自然さをなくすことができる。
【0071】なお、このデコード処理後の音声データ1
1’のゲインrは、ユーザに伝えるべき音声がそのユー
ザにとって明瞭に聞き取れるような適切な音量となるよ
うな値で、かつ、このデコード処理後の音声データ1
1’のゲインrで決まる1−rのゲインによって再生さ
れる音楽が、音声の妨げとならないような音量となるよ
うに設定することが望ましい。
【0072】このように、時刻t1以降はデコード処理
後の音楽データ12’にデコード処理後の音声データ1
1’を混合させ、しかも、デコード処理後の音楽データ
12’の音量を可聴な範囲で下げて、デコード処理後の
音声データ11’を適切な音量で出力させる状態とな
る。
【0073】そして、時刻t2で音声データ11の終了
の指示が出されると、今度は、デコード処理後の音楽デ
ータ12’のゲインの比率を徐々に上げる制御を行い、
時刻t3でもとの100%の状態に戻る。
【0074】ところで、この図6で説明した処理におい
て、時刻t1まで、つまり、音声データ11の出力指示
が出されるまでは、音楽データ12に対するデコード処
理は第1の音楽デコーダ221を用いてのデコード処理
を行い、時刻t1以降は、音楽データ12に対しては第
2の音楽デコーダ222を用いてデコード処理を行う。
なお、このとき、音声データ12に対しては音声デコー
ダ21によるデコード処理が行われる。
【0075】そして、時刻t2以降は、音声データ11
の再生処理は無いので、再び、第1の音楽デコーダ22
1を用いて音楽データ12のデコード処理を行う。
【0076】このように、音楽データ12のみを再生す
る場合は、演算精度の高い高性能なデコード処理を行う
ことのできる第1の音楽デコーダ221を用いてデコー
ド処理することにより、高品質な音楽を再生させること
ができる。なお、この第1の音楽デコーダ221を用い
てのデコード処理は演算量は多少多いが、このときは、
音声データ11のデコード処理は行わないので、CPU
2に対する演算負荷の増加は特に問題になる程ものでは
ない。
【0077】一方、音声データ11を音楽データ12に
混合させて出力させる必要のある場合には、音楽データ
12に対しては演算精度の低い第2の音楽デコーダ22
2を用いてのデコード処理を行う。この第2の音楽デコ
ーダ222を用いてデコード処理されたデコード処理後
の音楽データ12’は、音質に多少の劣化が生じるが、
このときは音声データ11と混合させ、しかも、デコー
ド処理後の音楽データ12’を小さな音量として出力す
るので、ユーザに対して音質の劣化を感じさせるほどの
ものとはならない。
【0078】また、音楽データ12に音声データ11を
混合させる場合は、前述の第1の実施の形態で説明した
ように、音声データ11と音楽データ12の両方を1つ
のCPU2で交互にデコード処理するので、音声データ
11と音楽データ12のいずれか一方をCPU2でデコ
ード処理する場合に比べると、CPU2の演算負荷は大
きくなるが、音楽データ12のデコード処理を演算精度
の低いデコード処理(第2の音楽デコーダ222)に切
り替えるので、演算量の増加を極力抑えることができ
る。
【0079】なお、この第2の実施の形態における音声
データ11と音楽データ12の混合処理は、前述の第1
の実施の形態において、図3により説明したと同様に行
うことができるので、その説明は省略する。
【0080】このように、この第2の実施の形態では、
音楽データ12を単独で再生する場合は、高精度なデコ
ード処理を行うことのできる第1の音楽デコーダ221
を用いてデコード処理し、音声データ11を音楽データ
12に混合させて出力させる場合には、音楽データ12
に対しては演算量の少ない第2の音楽デコーダ222を
用いてデコード処理するようにしているので、このよう
な混合処理を行う場合も、デコード処理に要する演算量
の増加を極力抑えることができる。
【0081】なお、この第2の実施の形態では、2段階
の演算精度を有する第1および第2の音楽デコーダ22
1,222を設けるようにしたが、これは、2段階に限
らず、より多くの段階の演算精度を有する音楽デコーダ
を設けて、混合比率に応じて任意の音楽デコーダを選択
できるようにしてもよい。また、この第2の実施の形態
では、音楽データ12側に複数の演算精度を有する音楽
デコーダを設けるようにしたが、音声データ11側に複
数の演算精度を有する音声デコーダを設けるようにして
もよく、さらに、音声データ11側と音楽データ12側
の両方に複数の演算精度を有するデコーダをそれぞれ設
けるようにしてもよい。
【0082】また、以上説明した第1および第2の実施
の形態においては、圧縮された音声データ11と音楽デ
ータ12をメモリ1上に格納し、そのメモリ1上の音声
データ11と音楽データ12をデコード処理して混合す
る例について説明したが、処理すべき音源データ(前述
の各実施の形態では音声データ11と音楽データ12)
は、通信手段などを利用して他のシステムから取得した
り、ネットワーク上から取得してメモリ1に一時的に保
持させるようにして、その一時的に保持された音源デー
タを用いるものであってもよい。
【0083】また、前述の各実施の形態では、音声デー
タ11と音楽データ12を混合する例について説明した
が、これに限らず、たとえば、2つの音声データを混合
させることもできる。この場合、一方の音声データの再
生中にユーザに伝えるべき何らかの音声メッセージ(他
方の音声データという)が発生した場合には、その他方
の音声データを、現在、再生中の音声データに混合させ
て、当該再生中の音声データの音量を小さくし、他方の
音声データの音量を大きくしてユーザに伝えるといった
用い方もでき、また、2つの音楽データを同様に混合さ
せることもできる。さらに、混合すべき音源データは2
つに限られるものではなく、3つ以上でも可能である。
【0084】また、前述の各実施の形態では、再生すべ
き音声を得るための音源データとして音声データ11を
メモリ1に格納してそれをデコード処理して再生するよ
うにしたが、これは、再生すべき音声を得るための音源
データとしては、音声データでなくテキストデータであ
ってもよい。この場合、CPU2側に音声合成処理手段
を設け、メモリ1からテキストデータを読み出して音声
合成処理して音声データを生成し、その音声データを音
声ゲイン制御部23に与えるようにすれば、それ以降は
前述の各実施の形態同様の処理が可能となる。
【0085】また、本発明は、以上説明した本発明を実
現するための処理手順が記述された処理プログラムを作
成し、その処理プログラムをフロッピィディスク、光デ
ィスク、ハードディスクなどの記録媒体に記録させてお
くことができ、本発明はその処理プログラムが記録され
た記録媒体をも含むものである。また、ネットワークか
ら当該処理プログラムを得るようにしてもよい。
【0086】
【発明の効果】以上説明したように本発明によれば、メ
モリ上に保持された2つ以上の圧縮・符号化された音源
データを1つの演算処理装置(CPU)でデコード処理
し、そのデコード処理されたそれぞれの音源データを混
合して出力するようにしている。これによって、本発明
を実現するための主な構成要素としては、小容量のメモ
リと1つのCPUで済み、ハードウエアを簡素化するこ
とができ、また、メモリ上に保持される処理対象となる
音源データは圧縮・符号化された音源データであるの
で、小容量のメモリで対応可能とすることができるとと
もに、そのメモリを有効利用することができる。
【0087】また、それぞれの音源データのうち、少な
くとも1つの音源データに対するデコード処理は、複数
段階の演算精度のいずれかのデコード演算精度を選択可
能とし、当該音源データに対しては、他の音源データと
の混合比率に応じてデコード処理を行う際の演算精度を
選択可能としている。これによって、ある音源データに
対しては、他の音源データとの混合比率に応じた演算精
度でデコード処理をすることができるので、デコード処
理に要する演算を極力抑えることができ、演算処理手段
(CPU)の演算負荷を小さくすることができる。それ
によって、処理能力の小さなCPUでも対応することが
でき安価なシステムへの適用が可能となる。
【0088】また、複数の音源データを混合する際、デ
コード処理後の混合すべき音声データのうちユーザに対
し主に伝達すべき音源データ以外の音源データの音量を
当該ユーザが可聴な範囲で小さくするようなゲイン制御
を行うことによって、たとえば、音楽の再生中にその音
楽を聴いているユーザに音声メッセージを出力するよう
な場合、その音楽を中断させることなく音声メッセージ
を適切な音量で出力することができるので、音楽が途中
で途切れるといった不自然さをなくすことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係る音再生装置の
全体的な構成を示す図である。
【図2】図1で示した音再生装置のメモリが保持するデ
ータ内容とCPUの処理機能について具体的に説明する
図である。
【図3】音声データのフレーム長と音楽データのフレー
ム長が異なる場合の混合処理について説明する図であ
る。
【図4】図3で示した混合処理において、音声データと
音楽データのデコード処理の順序に対するデコード処理
後の音声データおよび音楽データと、そのデコード処理
後の音声データと音楽データを混合した混合出力の関係
を示す図である。
【図5】本発明の第2の実施の形態に係る音再生装置の
メモリが保持するデータ内容とCPUの処理機能につい
て具体的に説明する図である。
【図6】デコード処理後の音楽データおよびデコード処
理後の音声データに対するゲインの制御と音楽デコーダ
の選択制御を説明するタイムチャートである。
【符号の説明】 1 メモリ 2 CPU 3 D/A変換器 4 スピーカ 11 音声データ 12 音楽データ 11’ デコード処理後の音声データ 12’ デコード処理後の音楽データ 21 音声デコーダ 22 音楽デコーダ 23 音声ゲイン制御部 24 音楽ゲイン制御部 25 混合処理部 26 出力音量制御部 27 デコーダ選択部

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 2つ以上の音源データを混合させて再生
    可能な音再生方法において、 前記2つ以上の音源データが圧縮・符号化された状態で
    メモリに保持され、これらそれぞれの音源データを混合
    して出力する際は、前記メモリ上に保持されたそれぞれ
    の音源データを演算処理装置に入力して、この演算処理
    装置では、この演算処理装置に組み込まれたソフトウエ
    アによってそれぞれの音源データをデコード処理し、そ
    のデコード処理されたそれぞれの音源データを所定の混
    合比率で混合して出力することを特徴とする音再生方
    法。
  2. 【請求項2】 前記それぞれの音源データのうち、少な
    くとも1つの音源データに対するデコード処理は、その
    デコード処理を行う際の演算精度が複数段階で設定さ
    れ、その複数段階の演算精度のいずれかを選択可能と
    し、その演算精度の選択が可能とされた音源データに対
    しては、その音源データと他の音源データとの混合比率
    に応じて、その音源データにおけるデコード処理の演算
    精度を選択可能とすることを特徴とする請求項1記載の
    音再生方法。
  3. 【請求項3】 前記混合比率は、ある1つの音源データ
    のみを出力させる混合比率を含むことを特徴とする請求
    項1または2記載の音再生方法。
  4. 【請求項4】 前記複数の音源データを混合する際、デ
    コード処理後の混合すべき音声データのうち、ユーザに
    対し主に伝達すべき音源データ以外の音源データの音量
    を当該ユーザが可聴な範囲で小さくするようなゲイン制
    御を可能とすることを特徴とする請求項1または2記載
    の音再生方法。
  5. 【請求項5】 2つ以上の音源データを混合させて再生
    可能な音再生装置において、 2つ以上の圧縮・符号化された音源データを保持するメ
    モリと、 このメモリ上に保持されたそれぞれの音源データをデコ
    ード処理するそれぞれのデコード処理部およびこれらデ
    コード処理された音源データを混合する音源データ混合
    処理部を有し、この音源データのデコード処理およびそ
    のデコード処理されたそれぞれの音源データを所定の混
    合比率で混合する処理をソフトウエアによる演算によっ
    て行う演算処理手段と、 を有することを特徴とする音再生装置。
  6. 【請求項6】 前記それぞれの音源データをデコード処
    理するそれぞれのデコード処理部のうち、少なくとも1
    つの音源データに対するデコード処理部は、そのデコー
    ド処理を行う際の演算精度が複数段階で設定され、その
    複数段階の演算精度のいずれかを選択可能とし、その演
    算精度の選択が可能とされた音源データに対しては、そ
    の音源データと他の音源データとの混合比率に応じて、
    その音源データにおけるデコード処理の演算精度を選択
    可能とすることを特徴とする請求項5記載の音再生装
    置。
  7. 【請求項7】 前記混合比率は、ある1つの音源データ
    のみを出力させる混合比率を含むことを特徴とする請求
    項5または6記載の音再生装置。
  8. 【請求項8】 前記複数の音源データを混合する際、デ
    コード処理後の混合すべき音声データのうちユーザに対
    し主に伝達すべき音源データ以外の音源データの音量を
    当該ユーザが可聴な範囲で小さくするようなゲイン制御
    を可能とすることを特徴とする請求項5または6記載の
    音再生装置。
JP2002059570A 2002-03-05 2002-03-05 音再生方法および音再生装置 Withdrawn JP2003257125A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002059570A JP2003257125A (ja) 2002-03-05 2002-03-05 音再生方法および音再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002059570A JP2003257125A (ja) 2002-03-05 2002-03-05 音再生方法および音再生装置

Publications (1)

Publication Number Publication Date
JP2003257125A true JP2003257125A (ja) 2003-09-12

Family

ID=28669190

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002059570A Withdrawn JP2003257125A (ja) 2002-03-05 2002-03-05 音再生方法および音再生装置

Country Status (1)

Country Link
JP (1) JP2003257125A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005098854A1 (ja) * 2004-04-06 2005-10-20 Matsushita Electric Industrial Co., Ltd. 音声再生装置、音声再生方法及びプログラム
JP2010231089A (ja) * 2009-03-27 2010-10-14 Yamaha Corp 録音装置および録音再生装置
JP2011514558A (ja) * 2008-03-04 2011-05-06 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
EP1724774A3 (en) * 2005-05-20 2011-09-07 Enter Tech Co., Ltd Digital audio player and playing method thereof

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005098854A1 (ja) * 2004-04-06 2005-10-20 Matsushita Electric Industrial Co., Ltd. 音声再生装置、音声再生方法及びプログラム
US7877156B2 (en) 2004-04-06 2011-01-25 Panasonic Corporation Audio reproducing apparatus, audio reproducing method, and program
EP1724774A3 (en) * 2005-05-20 2011-09-07 Enter Tech Co., Ltd Digital audio player and playing method thereof
JP2011514558A (ja) * 2008-03-04 2011-05-06 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
JP2010231089A (ja) * 2009-03-27 2010-10-14 Yamaha Corp 録音装置および録音再生装置

Similar Documents

Publication Publication Date Title
JP3622365B2 (ja) 音声符号化伝送方式
US7853343B2 (en) Acoustic device and reproduction mode setting method
RU2011131868A (ru) Способ и устройство для кодирования и оптимальной реконструкции трехмерного акустического поля
US7507894B2 (en) Sound data encoding apparatus and sound data decoding apparatus
JP2004170610A (ja) エンコード装置、デコード装置、エンコード方法およびデコード方法
JP2005032425A (ja) ミキシングのためのオーディオストリームを製作する方法、その装置およびその情報保存媒体
JP5329846B2 (ja) ディジタルデータプレーヤー、そのデータ処理方法及び記録媒体
US20050163322A1 (en) Apparatus and method for playing and storing three-dimensional stereo sound in communication terminal
JP2003257125A (ja) 音再生方法および音再生装置
JP2010136236A (ja) オーディオ信号処理装置、オーディオ信号処理方法およびプログラム
KR20080099006A (ko) 오디오 데이터에 다중 혼합 및 음향효과를 부가하는 기능을제공하는 디지털 오디오 재생 장치 및 방법
JP3859200B2 (ja) ポータブルミキシング記録装置及びその制御方法並びにプログラム
US7385129B2 (en) Music reproducing system
JP2006243128A (ja) 再生装置及び再生方法
JP3829134B2 (ja) 生成装置、再生装置、生成方法、再生方法、および、プログラム
JP2001100792A (ja) 符号化方法、符号化装置およびそれを備える通信システム
JPH10161699A (ja) 音声格納再生装置および方法
JP2003022613A (ja) 再生装置
JP2004071108A (ja) ディスク再生装置及びディスク記録再生装置
JP2004334046A (ja) 圧縮音声データ再生装置、カラオケ装置
JP2003162297A (ja) 音楽再生装置
JP4983211B2 (ja) オーディオ再生装置
JP2003023688A (ja) オーディオ機器および音声出力制御方法
JP2005086389A (ja) 音響装置
JPH09198796A (ja) 音響信号記録再生装置およびそれを用いたビデオカメラ

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050510