JP2004334046A - 圧縮音声データ再生装置、カラオケ装置 - Google Patents
圧縮音声データ再生装置、カラオケ装置 Download PDFInfo
- Publication number
- JP2004334046A JP2004334046A JP2003132116A JP2003132116A JP2004334046A JP 2004334046 A JP2004334046 A JP 2004334046A JP 2003132116 A JP2003132116 A JP 2003132116A JP 2003132116 A JP2003132116 A JP 2003132116A JP 2004334046 A JP2004334046 A JP 2004334046A
- Authority
- JP
- Japan
- Prior art keywords
- data
- audio data
- bit rate
- compressed audio
- speed reproduction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
【課題】デコーダの処理速度を向上することなく圧縮音声データの高速再生にも適応できるようにする。
【解決手段】ハードディスクに記憶された楽曲データには、128kbpsでエンコードされた標準速度再生用の波形データD4(MP3データ)に加え、標準速度再生用の波形データD4の半分のビットレートである64kbpsでエンコードされた倍速再生用の波形データD5(MP3データ)が含めて構成している。そして、カラオケ演奏時、通常は、標準速度再生用の波形データD4をデコーダによってPCMデータにデコードするが、操作パネルの早送りボタンが押下された場合には、倍速再生用の波形データD5をデコーダによって倍のビットレートである128kbpsでPCMデータにデコードする。したがって、倍速再生時であっても通常速度再生時であっても、デコーダに必要なビットレートは128kbpsで済む。
【選択図】図3
【解決手段】ハードディスクに記憶された楽曲データには、128kbpsでエンコードされた標準速度再生用の波形データD4(MP3データ)に加え、標準速度再生用の波形データD4の半分のビットレートである64kbpsでエンコードされた倍速再生用の波形データD5(MP3データ)が含めて構成している。そして、カラオケ演奏時、通常は、標準速度再生用の波形データD4をデコーダによってPCMデータにデコードするが、操作パネルの早送りボタンが押下された場合には、倍速再生用の波形データD5をデコーダによって倍のビットレートである128kbpsでPCMデータにデコードする。したがって、倍速再生時であっても通常速度再生時であっても、デコーダに必要なビットレートは128kbpsで済む。
【選択図】図3
Description
【0001】
【発明の属する技術分野】
本発明は、圧縮音声データの再生技術に関する。
【0002】
【従来の技術】
近年、映像や音声などのデータをデジタル化した情報を再生する情報再生装置が開発されており、たとえば映画ソフトやカラオケなどの再生装置として広く利用されている。カラオケ市場においては、いわゆる通信カラオケというものが一般的になっている。この通信カラオケにおいてはMIDI演奏が一般的だが、例えばバックコーラスなど肉声が欲しい時はデジタルオーディオを使う。デジタルオーディオデータはそのままではデータが巨大過ぎるため、通常は、ADPCM(Adaptive Differential Pulse Code Modulation)やMP3(MPEG 1 Audio Layer 3)等のコーデックでエンコード(圧縮)して保存しておき、使用時にはデコード(解凍)している。また最近では、映像/音声などのデータに対するデータ圧縮方式が、MPEG(Moving Picture Image Coding Expert Group)方式として既に国際標準化されるにいたっている。このMPEG方式は、映像データや音声データを可変長圧縮する方式である。このMPEG方式の圧縮情報再生方式に関しては、以下に示すような提案があった(例えば、特許文献1参照。)。
【0003】
つまり、音声の入力により符号化器(エンコーダ)で圧縮音声(MPEG音声データ)を生成し、通信路あるいは蓄積メディアを介してMPEG音声データを復号器(デコーダ)に入力し元の音声データを再生するよう構成されている。この圧縮情報再生装置を例えば放送や通信などの分野に応用している分には、エンコーダとデコーダとの間は常に一定レートでデータが転送されるだけなので、デコーダ側の最大処理速度としては、サンプリング周波数とビットレートで決まる処理能力だけ持たせておけばよい。
【0004】
ところで、今後、この圧縮情報再生装置は、蓄積メディア、つまりVTRや光ディスクなどの分野に応用されることが考えられる。この場合、順方向/逆方向、早送り/スロー再生などの特殊再生が多用されることから、特に音声を映像と同時に伝送した上で所望の速度で再生することの実現が必至である。この場合、データ間引きを行うことにより、映像と音声とを同時に2倍速や3倍速等で再生することが考えられる。
【0005】
しかしながら、MPEG方式で圧縮されたデータは、その再生にデータの連続性が要求されることから、データ間引きを行う特殊再生、つまり2倍再生や3倍再生などは基本的に適していない。
そこで、これを実現するためにデータ構造を工夫したり、回路を付加することが別途必要になる。たとえばVTRなどにて、MPEG方式で圧縮された映像/音声などのデータを高速再生(通常2〜10倍速再生程度)する場合には、もっとも単純な方法としては、デコーダに入力するデータの転送レートを上げ、これに伴ってデコーダの処理速度を向上させて瞬時にデータをデコードし、その後、音声サンプル単位でデータを間引けばよい。
【0006】
【特許文献1】
特許第3226711号公報(第2,3頁)
【0007】
【発明が解決しようとする課題】
しかしながら、デコーダに入力するデータの転送レートを上げて、デコードするためには、処理能力の高いデコーダを採用する必要がある。例えば、n倍速(n>1)の高速再生を実現する場合、通常速度再生時のn倍のビットレートでデコード可能なデコーダを採用する必要がある。こうした通常速度再生時のn倍(n>1)のビットレートでデコード可能なデコーダは、通常速度再生時のビットレートでデコードするデコーダよりも高価でありコストがかかる。例えば、デコーダをハードウェアで実現する場合、デコーダチップのコストが増加し、また、デコーダをソフトウェアで実現する場合も、デコード処理のために高速なCPUを採用する必要があってコストがかかる。こうした高速再生は、通常速度再生に比べ使用頻度が低いことが多く、高速再生のためにこうした処理能力の高いデコーダを備えるのは、コストパフォーマンスが悪かった。
【0008】
また、高速再生時には、通常速度再生時のn倍のビットレートでデコードするため、通常速度再生時に比べ、消費電力が大きくなってしまう。そのため、特に、電池を用いた機器で通常速度再生時のn倍のビットレートでデコードすると、著しく連続使用可能時間が短くなってしまい、利便性や経済性が損なわれ、致命的である。
【0009】
そこで本発明は、このような課題を解決するためになされたもので、デコーダの処理速度を向上することなく圧縮音声データの高速再生にも適応できるようにすることを目的とする。
【0010】
【課題を解決するための手段及び発明の効果】
上述した問題点を解決するためになされた請求項1に係る圧縮音声データ再生装置は、圧縮された音声データである圧縮音声データを記憶する記憶手段と、記憶手段に記憶された圧縮音声データを復号する復号手段とを備え、復号手段によって復号された音声データを用いて再生を行うものであり、記憶手段は、音声データを圧縮して得た第一のビットレートの圧縮音声データである通常速度再生用データに加え、前記音声データを圧縮して得た圧縮音声データであって第一のビットレートよりも低いビットレートである第二のビットレートの圧縮音声データである高速再生用データを記憶しており、復号手段は、通常速度での再生の場合には通常速度再生用データを記憶手段から読み出して第一のビットレートで復号する一方、高速再生の場合には高速再生用データを記憶手段から読み出して第一のビットレート以下、かつ、第二のビットレート以上のビットレートで復号する。
【0011】
このようにすれば、高速再生の場合であっても、高速再生用のデータを復号手段が復号する際のビットレートは、第一のビットレート、すなわち、通常速度再生の場合のビットレートを超えることがない。よって、従来のように、高速再生のために、通常速度再生時のビットレートより大きいビットレートの圧縮音声データを復号する必要がないため、復号手段のコストを抑えることができる。このように、復号手段(デコーダ)の処理速度を向上することなく圧縮音声データの高速再生に適応できる。また、高速再生用のデータを復号手段が復号する際のビットレートは、通常速度再生の場合のビットレートを超えることがないので、高速再生の場合の消費電力も、通常速度再生の場合の消費電力と同等以下に抑えることができる。そのため、特に、請求項10に示すように、復号手段への電源の供給を電池から行うように構成された圧縮音声データ再生装置では、高速再生の場合であっても、通常速度再生の場合の連続使用可能時間と同等以上、電池による利用が可能となり、利便性や経済性が向上する。
【0012】
なお、復号手段は高速再生用データを記憶手段から読み出して第一のビットレート以下、かつ、第二のビットレート以上のビットレートで復号することで、高速再生を行うことができるが、特に、復号手段は、第一のビットレートで復号するとよい。例えば、請求項2に示すように、第二のビットレートは、第一のビットレートの1/nのビットレートとし、復号手段は、高速再生の場合には高速再生用データを記憶手段から読み出して第二のビットレートのn倍のビットレート(=第一のビットレート)で復号する。このようにすれば、再生時のビットレートは、通常速度再生の場合であっても、高速再生(n倍速再生)の場合であっても、第一のビットレートとなり一定にすることができる。
【0013】
例えば、第一のビットレートは128kbpsとし、第二のビットレートは64kbpsとした場合、n=2となり、復号手段は、高速再生の場合には、この64kbpsのビットレートの高速再生用データを2倍のビットレートである128kbpsで復号する。このようにすることでビットレートを一定に保ったまま2倍速再生を行うことができる。
【0014】
ところで、第一のビットレートよりも低いビットレートである第二のビットレートの圧縮音声データである高速再生用データは、例えば、請求項3〜6に示すものとすることができる。換言すれば、高速再生用データは、以下のような方法で得ることができる。
【0015】
例えば、請求項3に示すように、高速再生用データは、通常速度再生用データの圧縮率よりも高い圧縮率で音声データを圧縮して得たものとすることができる。特に、非可逆圧縮の場合には、圧縮率を上げると、圧縮時に情報を欠損させる度合いが上がるため、デコーダのデコード時の負荷が著しく上昇することもない場合が多い。通常速度再生用データの圧縮率よりも高い圧縮率の圧縮音声データ(高速再生用データ)は、例えば、通常速度再生用の音声データをエンコードする際に、エンコーダに第2のビットレート、具体的には例えば64kbpsを指定してエンコードすることにより得ることができる。
【0016】
また、請求項4に示すように、高速再生用データは、音声データのサンプリングレート(サンプリング周波数)をダウンコンバートした音声データを圧縮して得たものとすることができる。例えば、通常速度再生用の音声データのサンプリングレートが44.1kHzの場合には、まず、そのデータを1/2間引いた後、エンコードする際に、エンコーダに第2のビットレート、具体的には例えば64kbpsを指定してエンコードすることにより、ビットレートが64kbpsでサンプリングレートが22.05kHzの高速再生用データを得ることができる。
【0017】
また、請求項5に示すように、高速再生用データは、音声データの量子化ビット数をダウンコンバートしながら音声データを圧縮して得たものとすることができる。例えば、通常速度再生用の音声データの量子化ビット数が16ビットの場合には、その音声データをエンコードする際に、エンコーダに第2のビットレート、具体的には例えば64kbps及び量子化ビット数として8ビットを指定してエンコードすることにより、ビットレートが64kbpsで、量子化ビット数が8ビットの高速再生用データを得ることができる。
【0018】
また、請求項6に示すように、通常速度再生用の音声データは、nチャンネル(n>1)の音声データであり、高速再生用データは、前記nチャンネルの音声データのうちの一部のチャンネルの音声データを圧縮して得たものとすることができる。例えば、通常速度再生用の音声データが2チャンネル(ステレオ)の場合には、その音声データをエンコードする際に、エンコーダに第2のビットレート、具体的には例えば64kbps及びモノラル化を指定してエンコードすることにより、ビットレートが64kbpsでモノラルの高速再生用データを得ることができる。この場合、通常速度再生用の音声データが4チャンネルで、高速再生用の音声データが2チャンネルとすることも可能であり、この他の組み合わせも可能である。
【0019】
なお、請求項3〜6の引用関係にも示すとおり、上述した方法を組み合わせて高速再生用データを得てもよい。例えば、サンプリングレートと量子化ビット数の双方を通常速度再生用データの半分にすることで、通常速度再生用データの4分の1のビットレートの圧縮音声データを高速再生用データとすることができる。
【0020】
請求項3〜6のいずれの高速再生用データ(組み合わせたものも含む)を利用するかは、音声データの特性や、圧縮音声データ再生装置の用途等に応じて、適するものを選択することができる。例えば、音質の低下が最小になるものを選択するとよい。
【0021】
さて、復号手段は、高速再生の場合には高速再生用データを記憶手段から読み出して第一のビットレート以下、かつ、第二のビットレート以上のビットレートで復号することによって音声データが得られるのであるが、この音声データは、例えば一旦メモリに格納し逐次CPUがメモリからD/A変換器へ転送して、D/A変換手段によって変換されたアナログ信号をスピーカ等の音声出力手段へ入力して音声として出力するようにして再生してもよいし、音声データをストリームとしてそのままD/A変換手段へ転送して、D/A変換手段によって変換されたアナログ信号をスピーカ等の音声出力手段へ入力して音声として出力するようにして再生してもよい。いずれにせよ、復号手段から出力されたレート(速度)で音声データをD/A変換手段へ入力すると、D/A変換手段は、通常速度再生の場合に比べ高速にD/A変換しなければならない場合がでてくる。
【0022】
そこで、請求項7に示すように、高速再生の場合には、復号手段によって復号された音声データを間引いた音声データを再生用の音声データとして得る間引き手段を備えるとよい。このようにすれば、間引いた後の音声データのレートを落とすことができる。したがって、再生の際のD/A変換に必要な速度を落とすことができる。
【0023】
特に、請求項8に示すように、間引き手段は、第一のビットレートと第二ビットレートとのビットレートの比に基づいて間引く割合を決定するとよい。例えば、第一のビットレートが128kbpsであり、第二のビットレートが64kbpsの場合、これらの比は、第一のビットレート/第二のビットレート=128/64=2となる。この場合、高速再生時には、復号手段によって復号された音声データを2つに1つの割合で間引く。例えば、通常速度再生用データと高速再生用データのサンプリング周波数が共に44.1KHzの場合には、高速再生時には、復号手段は、高速再生用データを圧縮時のビットレートの2倍の128kbpsでデコードし、その結果、レートが88.2KHzの音声データ(音声ストリームデータ)が出力される。間引き手段は、この場合、復号手段によって復号されたこの音声データを2つに1つの割合で間引き、レートが44.1KHzの音声データを出力する。したがって、D/A変換は、高速再生の場合であっても、通常速度再生の場合と同一のレートで行えばよくなる。このように、間引き手段は、高速再生の場合に、通常速度再生の場合と同一のレートでD/A変換可能となる割合で、復号手段から入力した音声データを間引いて出力するとよい。
【0024】
ところで、通常速度での再生の場合であるか高速再生の場合であるかは、例えば、メモリ等に記憶された状態に基づいて判定してもよいし、例えば、請求項9に示すようにして判定してもよい。すなわち、通常速度での再生を行うか高速再生を行うかの再生モードをユーザに設定させるための設定手段を備え、復号手段は、通常速度での再生の場合であるか高速再生の場合であるかを設定手段に設定された再生モードに基づいて判定する。このようにすれば、ユーザが再生速度を設定することができる。
【0025】
なお、高速再生用データは、ビットレート別に複数設けてもよい。例えば、通常速度再生用データのビットレートが256kbpsの場合、記憶手段には、通常速度再生用データと、2倍速再生用データとしてビットレートが128kbpsの圧縮音声データと、4倍速再生用データとしてビットレートが64kbpsの圧縮音声データを記憶しておく。そして、これらのいずれのデータを復号手段によって復号させるか(再生モード)をユーザに設定させるための設定手段を備え、復号手段は、設定手段に設定された再生モードに基づいて復号するデータを選択するとよい。
【0026】
ところで、高速再生用データは、例えば上述した請求項3〜6の説明で示した方法で、予め別の装置などで生成しておき、記憶手段に記憶しておいてもよいし、請求項11に示すように、音声データを第二のビットレートの圧縮音声データへ変換する変換手段を備え、復号手段は、通常速度再生用データを記憶手段から読み出して第一のビットレートで復号した音声データを得て、変換手段は、復号手段によって得られた音声データを第二のビットレートの圧縮音声データへ変換し、記憶手段は、変換手段によって変換された圧縮音声データを高速再生用データとして記憶するようにしてもよい。すなわち、高速再生用データを、圧縮音声データ再生装置自らが作成する。このようにすれば、記憶手段には、予め高速再生用データを記憶しておかなくても、通常速度再生用データを記憶しておくだけで、高速再生用データが記憶手段に記憶されることとなる。なお、高速再生用データは、再生中(音声出力中)に生成してもよいし、再生は行わず(音声出力はせず)に生成してもよい。なお、変換手段による音声データから高速再生用データへの変換の方法としては、上述した請求項3〜6の説明で示した方法を用いるとよい。
【0027】
上述した圧縮音声データ再生装置の用途としては種々考えられるが、例えばカラオケ装置への利用を想定した場合には、請求項12に示すように、圧縮音声データ再生装置中のデータ記憶手段が、カラオケ演奏時に用いるバックコーラス用の波形データとしての圧縮音声データを記憶することが考えられる。バックコーラス以外の楽曲演奏に際しては例えばMIDIデータを用いることで、特段の処理負荷の増大なしに再生速度は自由に変更できる。しかし、バックコーラスのように肉声による波形データを圧縮音声データとして記憶した場合には、そのバックコーラスもMIDI演奏に合わせて高速再生させなくてはならず、標準速度再生用データのみ用いた場合には、復号手段の復号速度の増大を強制してしまう。したがって、本発明を適用することが有効である。そして特にカラオケ装置の場合には、既存のCPUや復号手段(デコーダ)をそのまま用いながら機能の充実を図っていることが現実的である。つまり、復号速度を向上させた復号手段を用いればリアルタイムに間引き処理等を行うことができ、理論的には問題が解決するが、現実的には市場に出回っている膨大な数のカラオケ装置に対して復号手段の交換を強制するのは経済的な観点も含め困難である。本発明によれば、このような復号手段の機能アップを強制することなく、既存のもので対応できるため、現実的な実効性は非常に高い。
【0028】
圧縮音声データについては、例えばCD−ROMやDVD−ROMのようなパッケージメディアから読み込んでもよいが、請求項13に示すように外部装置から配信してもらうこともできる。特に、いわゆる通信カラオケと称されるように、カラオケ演奏用データを外部装置(例えば配信センタ等のホストコンピュータ)から配信してもらうことが近年のカラオケ市場ではよく行われている。近年普及がめざましいブロードバンドの通信網を介して配信される場合には、通信コストが低下すると共に、カラオケ装置側で波形データを生成する手間が省けるメリットがある。なお、この場合でも、請求項11に示すように標準速度再生用データを元にして圧縮音声データ再生装置自らが高速再生用データを作成してもよい。その場合であれば、外部装置から配信してもらうのは標準速度再生用データだけでよくなり、配信に要する時間やコストが低減する。
【0029】
【発明の実施の形態】
以下、本発明が適用された実施例について図面を用いて説明する。なお、本発明の実施の形態は、下記の実施例に何ら限定されることなく、本発明の技術的範囲に属する限り種々の形態を採りうることは言うまでもない。
【0030】
図1は、圧縮音声データ再生装置を備えた本実施例のカラオケ装置1の構成を示すブロック図である。本実施例のカラオケ装置1は、いわゆる通信カラオケと称されるものであり、通信ネットワーク3を介してホストコンピュータ2に接続できるようになっている。そして、カラオケ装置1は、この通信ネットワーク3を介して接続したホストコンピュータ2からカラオケに関する音楽情報と画像情報とを取得することができる。
【0031】
なお、ホストコンピュータ2は、通信ネットワーク3を介してカラオケ装置1とアクセス可能であって、カラオケ装置1に対して、最新の流行曲等の曲データを発信したり、どのような曲が何回演奏されたかといったログデータを含む関連情報をカラオケ装置1から受信したりして管理することができるようになっている。また、ホストコンピュータ2は、データベースを備えており、このデータベースに楽曲演奏に使用するコンテンツデータとしての音楽情報や背景画または歌詞等の画像情報等を記憶している。また、ホストコンピュータ2は、コンテンツデータ以外にバージョンアップされたシステムプログラム等をデータベースに記憶し、そのデータベースから随時読み出してカラオケ装置1に対して配信することができるようになっている。
【0032】
次に、カラオケ装置1の構成について説明する。
このカラオケ装置1には、図1に示されるように、ホストコンピュータ2に通信ネットワーク3を介して接続し各種の情報を送受信する「通信手段」としての通信装置19、曲の予約操作などを行うための操作パネル10、カラオケ装置1全体の制御を司るCPU14、各種情報を一時的に記憶するRAM15、演奏の再生を行う音源再生装置18、音楽情報にかかる電気信号を増幅等するアンプ20、カラオケ用の音楽情報や画像情報その他各種データを記憶しているハードディスク13、ハードディスク13に記憶された画像情報に基づいて歌詞や背景画を再生するための映像再生装置24を備えている。この内、通信装置19、操作パネル10、ハードディスク13、RAM15、音源再生装置18及び映像再生装置24は、CPU14に接続されている。
【0033】
アンプ20には、当該アンプ20からの電気信号を入力して伴奏曲及び利用者(歌唱者)の歌声等を流すスピーカ22と、利用者(歌唱者)の歌声等をアンプ20に入力するためのマイクロフォン(以下、単にマイクと称す。)23が接続されている。また、映像再生装置24には、画像情報である背景画及び歌詞等を表示する表示装置26が接続されている。
【0034】
上述した通信装置19は、信号の変調および復調を行う変復調装置であり、CPU14の制御の下、通信ネットワーク3を通じてホストコンピュータ2にアクセス可能に構成されている。それによって、通信装置19は、通信ネットワーク3を介してホストコンピュータ2から送られてくる楽曲データ等を受信したり、上記関連情報をホストコンピュータ2に伝送することができる。
【0035】
また、操作パネル10は、利用者によって操作されるものであり、図2に示すように、任意の曲の選択等を行うためのテンキーパネル10a、演奏再生の早送りをさせるための早送りボタン10b、例えば選曲番号等を表示するための表示部10cを備えている。
【0036】
テンキーパネル10aは、「0」から「9」までの数字ボタンと、その数字ボタンを介して入力された選曲番号を確定させて演奏を実行させるための選曲ボタンを備える。また、早送りボタン10bは、例えば歌唱者が早送りさせたい場合に操作するもので、本実施例では早送りボタン10bを押している間、通常の2倍の速度で再生されるようになっている。したがって、例えば間奏が長い場合に2番や3番の頭まで早送りさせたりすることができる。なお、この早送りボタン10bが「設定手段」を構成する。
【0037】
また、ハードディスク13には、図2に示すように、アプリケーションプログラムや楽曲データなどが記憶されている。楽曲データは、図3に示すようにヘッダD1、MIDIデータD2、歌詞データD3、バックコーラスなどの肉声の波形データD4,D5によって構成されている。波形データD4,D5は、アナログのオーディオ信号をデジタル変換して作成したものであり、例えばPCM録音によって作成したPCMデータをエンコードしたADPCMデータやMP3データ等が該当する。ここでは波形データが44.1KHzのサンプリングレートのPCMデータを圧縮して得たMP3データであるとして以下の説明を進める。波形データD4は、このPCMデータを128kbpsのビットレートでMP3データへエンコードしたデータである。また、波形データD5は、波形データD4の生成に用いたPCMデータと同一のPCMデータを、ビットレートを波形データD4の半分である64kbpsとしてMP3データへエンコードしたデータである。すなわち、波形データD5は、波形データD4よりも圧縮率を高めたデータということができる。例えば、高音低音部の人に聞こえない音を消したり、小さな雑音部を消したり、人に聞こえにくい大きな音の近傍の音を消すなどして、指定されたビットレートになるまで情報量を削減して圧縮を行う。このように指定されたビットレートで圧縮するMP3エンコーダは公知である。
【0038】
そして、各波形データには、MP3の規格(MPEG1 Audio(ISO/IEC11172−3))で規定される各種の情報が含まれており、この情報の中には、ビットレート情報が含まれている。なお、波形データD4が「通常速度再生用データ」に相当し、波形データD5が「高速再生用データ」に相当する。またPCMデータが「音声データ」に相当する。そして、ハードディスク13は「記憶手段」に相当する。
【0039】
ハードディスク13には、映像データや各種の設定に必要な設定データ、さらには演奏記録などのログデータなども記憶されている。そして、操作パネル10のテンキーパネル10aを介して曲が選択されると、CPU14は、選択された曲の楽曲データや選択された曲と関連する映像データをハードディスク13から呼び出して、音源再生装置18及び映像再生装置24に同期させて出力するようになっている。
【0040】
その後、CPU14から出力される楽曲データは、音源再生装置18において、アナログの演奏音信号に変換された後、アンプ20へ送られて電気的に増幅される。このアンプ20は、マイク23を介して入力される利用者の歌唱音信号と適度な割合でミキシングするもので、ミキシングされた歌唱音信号と演奏音信号は、アンプ20からスピーカ22に出力され、音声及び演奏音となってスピーカ22から外部へ出力される。
【0041】
ここで、音源再生装置18について、図2を参照してさらに説明する。音源再生装置18は、MP3用のデコーダ18a、「D/A変換手段」としてのデジタルアナログコンバータ(DAC)18b、「変換手段」としてのエンコーダ18c、「間引き手段」としての間引き処理器18d、MIDI音源18eを備えている。
【0042】
CPU14から出力される楽曲データ中のMIDIデータD2は、MIDI音源18eにおいて演奏音信号に変換された後、DAC18bを介してアンプ20へ出力される。
一方、例えばバックコーラス用の波形データD4,D5(MP3データ)は、デコーダ18aによってPCMデータにデコードされた後、間引き処理器18d及びDAC18bを介してアンプ20へ出力される。デコーダ18は、MP3データに含まれるビットレート情報の示すビットレートでMP3データをPCMデータにデコードして出力する。また、間引き処理器18dは、間引き処理器18dに備える設定レジスタの値が「間引き処理実行」に設定されている場合には、デコーダ18aから出力されたPCMデータを入力し、入力したPCMデータを2つに1つの割合で間引いたPCMデータを出力する。また、間引き処理器18は、間引き処理器18dに備える設定レジスタの値が「スルー」に設定されている場合には、デコーダ18aから出力されたPCMデータを入力し、入力したPCMデータをそのまま(間引かずに)出力する。また、間引き処理器18は、設定レジスタの値が「停止」の場合には、デコーダ18aから出力されたPCMデータの入力を行わず、その結果、DAC18bへPCMデータは出力されない。この間引き処理器18dに備える設定レジスタの値は、CPU14が書き換え可能に構成されている。
【0043】
またデコーダ18aから出力されたPCMデータは、エンコーダ18cへ入力可能に構成されており、エンコーダ18cは、CPU14によってエンコーダ18cの設定レジスタが「エンコード」に設定されている場合に、デコーダ18aでデコードされたPCMデータを入力して64kbpsのビットレートでMP3データへエンコードし、エンコードしたMP3データをRAM15へ転送する機能を備える。エンコーダ18cは、通常、PCMデータをエンコードする際に設定することができるパラメータとして、ビットレート、量子化ビット数、モノラル化等があり、特段パラメータが設定されていない場合には、エンコードするPCMデータが有するパラメータに基づいてエンコードが行われる。本実施例の場合、エンコーダ18cに対してビットレートとして64kbpsが設定された状態で、PCMデータのエンコードが行われる。これにより、波形データD4に比べて圧縮率を高めたビットレートとして64kbpsの波形データD5を得ることができる。なお、波形データD5として、音声データのサンプリングレート(サンプリング周波数)を1/2ダウンコンバートして圧縮した音声データを用いる場合には、エンコーダ18cは、入力されるPCMデータを1/2間引いた後に、指定されたビットレートによりエンコードするような機能を備える必要がある。また、この設定レジスタが「停止」に設定されている場合にはエンコーダ18cはエンコードを行わない。CPU14、RAM15、デコーダ18aは「復号手段」を構成する。
【0044】
楽曲演奏に際して再生速度変更(早送り)をする場合、MIDIデータD2を用いた演奏に際しては、標準再生速度からの変更量をCPU14からMIDI音源18eに指示してやれば、MIDIデータD2を用いてその指示された再生速度での演奏音信号を容易に作成できる。
【0045】
ところで、通信ネットワーク3を介してホストコンピュータ2からカラオケ装置1に送られてくる時点での楽曲データ中には、図3(b)に示すように、波形データとしては標準速度再生用の波形データD4しか存在しないものがあってもよい。この場合、標準速度再生用の波形データD4を用いて他の波形データをカラオケ装置1内で作成する。もちろん、図3(c)に示すように、波形データ自体が存在しない楽曲データが存在してもよい。上述のバックコーラスなどのようにMIDIデータでは対応することが難しい楽音データについて波形データとして持つため、もともとバックコーラス等がない楽曲データであれば波形データ自体が存在しなくてもよいからである。
【0046】
図4のフローチャートを参照して、標準速度再生用の波形データD4を用いて波形データD5を作成する処理について説明する。この処理は、楽曲データの受信時にCPU14が実行するものである。なお、楽曲データの受信時に即座に実行せず、例えば受信後のカラオケ装置1が演奏を行っていないアイドリング時を判断し、そのアイドリング時に実行するようにしてもよい。
【0047】
まず、楽曲データを受信し(S102)、その中に波形データD4があるか否かを判断する(S104)。図3(c)に示すように、波形データD4が存在しない楽曲データであれば(S104:NO)、そのまま本処理ルーチンを終了する。一方、図3(a)(b)に示すように、波形データD4が存在する楽曲データであれば(S104:YES)、S106へ移行する。
【0048】
S106では、S102で受信した楽曲データに波形データD5があるか否かを判断する。図3(a)に示すように、波形データD5が存在する楽曲データであれば(S106:YES)、そのまま本処理ルーチンを終了する。一方、図3(b)に示すように、波形データD5が存在しない楽曲データであれば(S106:YES)、S108へ移行する。
【0049】
S108では、各部をエンコード用に設定する。すなわち、間引き処理器18dの設定レジスタを「停止」に設定し、エンコーダ18cの設定レジスタを「エンコード」に設定すると共に、パラメータとして、ビットレート64kbpsを設定する。
【0050】
続くS110では、波形データD4をデコーダ18cへ転送し、エンコーダ18cからRAM15上に出力されるMP3データをハードディスク13へ記憶する。
S110の処理が完了すると、S110でハードディスク13へ記憶されたMP3データを波形データD5として楽曲データに連結する(S112)。本実施例ではMP3データとして倍速再生用の波形データD5を作成したので、それを標準速度再生用の波形データD4の後に連結する。その後、本処理ルーチンを終了する。このようにして、ビットレートが128kbpsの波形データD4からビットレートが64kbpsの波形データD5を生成することができ、波形データD5を有する楽曲データを得ることができる。つまり、図3(a)に示す楽曲データを得ることができる。
【0051】
このような配信時の処理が終了すると、この時点ではハードディスク13中には、図3(a)に示すように、2種類の波形データD4、D5を持つ楽曲データか、あるいは図3(c)に示すように波形データ自体を持たない楽曲データのいずれかが存在することとなる。
【0052】
次に、カラオケ装置1にて実行されるカラオケ演奏時の処理について、図5のフローチャートを参照して説明する。この処理もCPU14が実行するものである。
まず、曲番号の受付が完了したか否か判断し(S202)、選曲ボタンが操作されて受付完了の場合は(S202:YES)、その受け付けた曲番号に対応する楽曲データをハードディスク13からRAM15に転送する(S204)。上述した配信時の処理の結果、カラオケ演奏時においては、ハードディスク13中には、2種類の波形データD4、D5を持つ楽曲データ(図3(a)参照)か、波形データ自体を持たない楽曲データ(図3(c)参照)のいずれかが存在することとなる。
【0053】
続くS205では、各部を再生用に設定する。すなわち、間引き処理器18dの設定レジスタを「スルー」に設定し、エンコーダ18cの設定レジスタを「停止」に設定する。
そして、次のステップS206では、RAM15に転送した楽曲データ内のMIDIデータD2を音源再生装置18(図1参照)内のMIDI音源18e(図2参照)に送る。それと共に、図3(a)に示すように波形データ(MP3データ)を持つ楽曲データの場合には、標準速度再生用の波形データD4(図3(a)参照)を音源再生装置18内のデコーダ18a(図2参照)に送る。当然ながら、図3(c)に示すように波形データ(MP3データ)自体を持たない楽曲データの場合は、波形データ自体が存在しないためデコーダ18aへ送ることはない。MIDIデータD2はMIDI音源18eにおいて演奏音信号に変更された後、DAC18bを介してアンプ20へ出力され、標準速度再生用の波形データD4についてはデコーダ18aにてPCMデータにデコードされた後、間引き処理器18dを介し、MIDI音源18eから出力された演奏音信号と合成されてDAC18bへ出力される。そして、曲の演奏が終了するまでは(S208:NO)、再生速度変更処理(S210)を実行し、曲の演奏が終了したら(S208:YES)、本処理ルーチンを終了する。
【0054】
それでは、図5のステップS210にて実行される再生速度変更処理について、図6のフローチャートを参照して説明する。
まず、再生速度変更操作があるか否かについて判断する(S302)。具体的には、操作パネル10における早送りボタン10bが押下されていない状態から押下状態に変化したか、あるいは早送りボタン10bが押下状態から押下されていない状態に変化したかを判断する。上述したように、本実施例の場合は、早送りボタン10bを押している間は早送りするようになっているため、早送りボタン10bが押下されていない状態から押下状態に変化した場合には標準速度再生から倍速再生に変化させ、早送りボタン10bが押下状態から押下されていない状態に変化した場合には、倍速再生から標準速度再生に変化させることとなる。
【0055】
このような再生速度変更操作が無い場合(S302:NO)には、そのまま本処理ルーチンを終了するが、早送りボタン10bが操作された場合(S302:YES)には、その操作に応じて「現在の演奏再生速度値」を増減させる(S304)。具体的には、早送りボタン10bが押下された場合には倍速再生速度の値が「現在の演奏再生速度値」として設定され、早送りボタン10bが押下状態から押下されない状態になった場合には標準再生速度の値が「現在の演奏再生速度値」として設定される。なお、この「現在の演奏再生速度値」は、RAM15にセット(記憶)される。
【0056】
ステップS304の処理後はステップS306へ移行し、MIDI演奏を、S304にてセット(記憶)された現在の演奏再生速度値に応じたものに変更する。MIDI音源18eを用いたMIDI演奏における演奏再生速度の変更は、MIDIデータD2のパラメータの変更のみで簡単に対応できる。
【0057】
次のステップS308では、S304にてセット(記憶)された現在の演奏再生速度値に対応する波形データ(MP3データ)を選択してデコーダ18aへ送り、また、波形データ自体を持たない楽曲データ(図3(c)に示す)の場合、この処理はスルーされる。つまり、現在の演奏再生速度値が「倍速再生速度の値」であれば、倍速再生用の波形データD5(図3(a)参照)をビットレート128kbpsの転送速度でデコーダ18aに送り、現在の演奏再生速度値が「標準再生速度の値」であれば、標準速度再生用の波形データD4(図3(a)参照)をビットレート128kbpsの転送速度でデコーダ18aに送る。また、現在の演奏再生速度値が「倍速再生速度の値」であれば、間引き処理器18dの設定レジスタを「間引き処理実行」に設定し、現在の演奏再生速度値が「標準再生速度の値」であれば、間引き処理器18dの設定レジスタを「スルー」に設定する。そして、デコーダ18aが、これら倍速再生用の波形データD5あるいは標準速度再生用の波形データD4をPCMデータにデコードし、間引き処理器18dを介して、DAC18bへ送る。前述のように、デコーダ18aは、前述したCPU14の転送速度に応じてMP3データをPCMデータにデコードして出力するので、波形データD4の場合も、波形データD5の場合も、128kbpsのビットレートでデコードしてPCMデータを間引き処理器18dへ出力する。そのため、デコーダ18aからのPCMデータの出力レートは、波形データD4が入力された場合には44.1KHzとなり、間引き処理器18dはスルーするため、DAC18bへは、44.1KHzのレートのPCMデータが入力される。一方、波形データD5が入力された場合には、デコーダ18aからのPCMデータの出力レートは、2倍の88.1KHzとなり、間引き処理器18dは前述した間引き処理を行うため、DAC18bへは、44.1KHzのレートのPCMデータが入力される。その結果、早送りボタン10bが押下されていない間は、標準速度で再生されたバックコーラスなどの肉声がスピーカ22から出力され、早送りボタン10bが押下されている間は倍速再生されたバックコーラスなどの肉声がスピーカ22から出力される。
【0058】
本実施例のカラオケ装置1によれば、次のような効果が得られる。
(イ)ハードディスク13に記憶された楽曲データには、図3(a)に示すように、128kbpsでエンコードされた標準速度再生用の波形データD4(MP3データ)に加え、標準速度再生用の波形データD4の半分のビットレートである64kbpsでエンコードされた倍速再生用の波形データD5(MP3データ)を含めて構成している。そして、カラオケ演奏時、通常は、標準速度再生用の波形データD4をデコーダ18aによってPCMデータにデコードするが、操作パネル10の早送りボタン10bが押下された場合には、倍速再生用の波形データD5をデコーダ18aによって倍のビットレートである128kbpsでPCMデータにデコードする。したがって、倍速再生時であっても通常速度再生時であっても、デコーダに必要なビットレートは128kbpsで済む。そのためデコーダの処理速度を向上することなく高速再生に適応できる。また、高速再生の場合の消費電力も、通常速度再生の場合の消費電力と同等に抑えることができる。特に、この通信カラオケが、ハンディタイプのものであって、図1及び図2に示した各部が電池で駆動する場合には、高速再生の場合であっても通常速度再生の場合の連続使用可能時間と同等の時間、電池による利用が可能となり、利便性や経済性が向上する。
【0059】
(ロ)上述した倍速再生用の波形データD5は、もともとホストコンピュータ2にて作成してカラオケ装置1に配信するようにしてもよいが、上記実施例では図3(b)に示すように、配信時の楽曲データ中には波形データとして標準速度再生用の波形データD4(MP3データ)のみを含めておき、倍速再生用の波形データD5についてはカラオケ装置1内で作成するものにも対応している。そのため、配信時の1曲あたりのデータ量が相対的に少なくなるため、ホストコンピュータ2とカラオケ装置1との間での通信時間や通信コストの低減に寄与する。
【0060】
以上実施例について説明したが、本発明は上記実施例に限定されるものではなく、種々の態様で実施し得る。そのいくつかを説明する。
(1)上記実施例では、早送りのために2倍速再生を採用したが、例えば3倍速再生、4倍速再生、あるいは1.5倍速再生などであってもよい。すなわち、波形データD4のビットレートと波形データD5のビットレートの比を3倍、4倍、あるいは1.5倍とするとしてもよい。また、例えば2倍速再生及び3倍速再生というように複数の高速再生用の波形データを準備しておき、早送りボタンの方も2倍速再生と3倍速再生を選択して指定できるようにしておいてもよい。さらには、例えば早送りボタンを最初押下した時点では2倍速再生であり、押下継続時間が所定時間を経過すると3倍速再生に自動的に切り換わるようになっていてもよい。この場合、高速再生の速度として、標準の整数倍でない場合も設定可能な場合、つまり、例えば、上述の1.5倍をも設定可能な場合には、図2に示す音源再生装置18の構成として、MIDI音源18eの出力側に、デジタルアナログコンバータをDAC18bとは別に設け、そのデジタルアナログコンバータの出力とDAC18bの出力とをミキシング、つまりアナログ信号レベルでミキシングするように構成するのが望ましい。このように構成することにより、間引き処理器18dから出力されるデジタル信号と、MIDI音源18eから出力されるデジタル信号の同期を考慮する必要がなくなり、音源再生装置18の構成が簡単となる。
【0061】
なお、このように複数の高速再生用の波形データを準備する場合にも、上記実施例と同様に、通信ネットワーク3を介してホストコンピュータ2からカラオケ装置1に送られてくる時点での楽曲データ中には、波形データとしては標準速度再生用の波形データD4しか存在させず(図3(b)参照)、受信後に、その標準速度再生用の波形データD4を用いて他の複数の高速再生用の波形データをカラオケ装置1内で作成するようにできる。
【0062】
(2)上記実施例では、デコーダ18a、間引き処理器18d、エンコーダ18c、MIDI音源18eをCPU14とは別のハードウェアで実現したが、これらの一部または全部は、CPU14による処理で実現してもよい。この場合、CPU14はDAC18に対してPCMデータを転送可能なように構成してもよい。この場合、例えば、デコーダ18aの出力をCPU14がDAC18やエンコーダ18cへ転送可能な構成としてもよい。この時、CPU14が間引き処理を行うようにしてもよい。
【0063】
(3)上記実施例では、波形データD5は、波形データD4よりも圧縮率を高めたデータとして説明したが、波形データD5は、ビットレートを波形データD4のビットレートより低くしたデータであればよい。したがって、例えば、波形データD5は、PCMデータのサンプリングレート(サンプリング周波数)をダウンコンバートした音声データを圧縮して得たものとしてもよい。例えば、波形データD4が44.1kHzのサンプリングレートのPCMデータを圧縮したMP3データである場合、波形データD5は、このPCMデータを1/2間引き処理した後、ビットレートを波形データD4のビットレートの1/2にてエンコードして圧縮したMP3データとすることができる。
【0064】
また、例えば、波形データD5は、PCMデータの量子化ビット数をダウンコンバートしたPCMデータを圧縮したMP3データとしてもよい。例えば、波形データD4が16ビットの量子化ビット数のPCMデータを圧縮したMP3データである場合、波形データD5は、このPCMデータを量子化ビット数8ビット、ビットレートを波形データD4のビットレートの1/2にてエンコードして圧縮したMP3データとすることができる。
【0065】
また、例えば、波形データD4が2チャンネル(ステレオ)のPCMデータを圧縮したMP3データである場合、波形データD5は、いずれか1チャンネルのPCMデータをビットレートを波形データD4のビットレートの1/2にてエンコードして圧縮したMP3データとする。
【0066】
例えば、エンコーダ18cは、デコーダ18aから入力したPCMデータのサンプリングレートをダウンコンバート(間引き)する機能や指定されたビットレートや量子化ビット数でエンコードする機能や、上記のように片方のチャンネルのPCMデータのみを指定されたビットレートでエンコードする機能を備えればよい。またこれらの方法(機能)を組み合わせてもよい。
【0067】
(4)上記実施例では、カラオケ装置を例に挙げて説明したが、圧縮音声データを再生する装置であれば同様に適用できる。例えばカラオケではない通常の音楽演奏装置であってもよいし、あるいは音声と映像がセットになっている映画ソフト等を再生する装置(例えばビデオ再生装置など)であってもよい。但し、例えばビデオ再生装置等の場合には主に個人ユースであり、CPUやデコーダ自体の性能を向上させた新機種をどんどん市場に投入していく傾向にある。それに対してカラオケ装置の場合には、店舗等での使用が主であり、既存のCPUやデコーダをそのまま用いながら機能の充実を図っていることが現実的である。つまり、デコード速度を向上させたデコーダを用いればリアルタイムに間引き処理等を行うことができ、理論的には問題が解決するが、現実的には市場に出回っている膨大な数のカラオケ装置に対してデコーダ18aの交換を強制するのは経済的な観点も含め困難である。そのような観点から、上記実施例のカラオケ装置1であれば、このようなデコーダの機能アップを強制することなく、既存のもので対応できるというメリットが得られる。
【0068】
(5)上記実施例ではMP3データを例に挙げたが、波形データの形式としては、それ以外にも、ADPCM、MPEG2オーディオAAC、TwinVQ、ATRAC3などであってもよい。
(6)上記実施例ではカラオケ装置1の本体に設けられた操作パネル10の早送りボタン10bを操作することによってユーザが早送りを指示できるようにしたが、例えば赤外線信号やBluetooth規格に基づく無線通信によって接続されたリモコンなどに上記早送りボタンを準備し、そのリモコンの早送りボタンを操作することでユーザが早送りを指示できるようにしてもよい。
【図面の簡単な説明】
【図1】実施例のカラオケ装置の概略構成を示すブロック図である。
【図2】実施例のカラオケ装置における音源再生装置などの詳細を示すブロック図である。
【図3】実施例の楽曲データの説明図である。
【図4】標準速度再生用の波形データを用いて倍速再生用の波形データを作成する処理を示すフローチャートである。
【図5】カラオケ演奏時の処理を示すフローチャートである。
【図6】図5の処理中で実行される再生速度変更処理を示すフローチャートである。
【符号の説明】
1…カラオケ装置、2…ホストコンピュータ、3…通信ネットワーク、10…操作パネル、10a…テンキーパネル、10b…早送りボタン、10c…表示部、13…ハードディスク、14…CPU、15…RAM、18…音源再生装置、18a…デコーダ、18b…デジタルアナログコンバータ(DAC)、18c…エンコーダ、18d…間引き処理器、18e…MIDI音源、20…アンプ、22…スピーカ、23…マイクロフォン、24…映像再生装置、26…表示装置
【発明の属する技術分野】
本発明は、圧縮音声データの再生技術に関する。
【0002】
【従来の技術】
近年、映像や音声などのデータをデジタル化した情報を再生する情報再生装置が開発されており、たとえば映画ソフトやカラオケなどの再生装置として広く利用されている。カラオケ市場においては、いわゆる通信カラオケというものが一般的になっている。この通信カラオケにおいてはMIDI演奏が一般的だが、例えばバックコーラスなど肉声が欲しい時はデジタルオーディオを使う。デジタルオーディオデータはそのままではデータが巨大過ぎるため、通常は、ADPCM(Adaptive Differential Pulse Code Modulation)やMP3(MPEG 1 Audio Layer 3)等のコーデックでエンコード(圧縮)して保存しておき、使用時にはデコード(解凍)している。また最近では、映像/音声などのデータに対するデータ圧縮方式が、MPEG(Moving Picture Image Coding Expert Group)方式として既に国際標準化されるにいたっている。このMPEG方式は、映像データや音声データを可変長圧縮する方式である。このMPEG方式の圧縮情報再生方式に関しては、以下に示すような提案があった(例えば、特許文献1参照。)。
【0003】
つまり、音声の入力により符号化器(エンコーダ)で圧縮音声(MPEG音声データ)を生成し、通信路あるいは蓄積メディアを介してMPEG音声データを復号器(デコーダ)に入力し元の音声データを再生するよう構成されている。この圧縮情報再生装置を例えば放送や通信などの分野に応用している分には、エンコーダとデコーダとの間は常に一定レートでデータが転送されるだけなので、デコーダ側の最大処理速度としては、サンプリング周波数とビットレートで決まる処理能力だけ持たせておけばよい。
【0004】
ところで、今後、この圧縮情報再生装置は、蓄積メディア、つまりVTRや光ディスクなどの分野に応用されることが考えられる。この場合、順方向/逆方向、早送り/スロー再生などの特殊再生が多用されることから、特に音声を映像と同時に伝送した上で所望の速度で再生することの実現が必至である。この場合、データ間引きを行うことにより、映像と音声とを同時に2倍速や3倍速等で再生することが考えられる。
【0005】
しかしながら、MPEG方式で圧縮されたデータは、その再生にデータの連続性が要求されることから、データ間引きを行う特殊再生、つまり2倍再生や3倍再生などは基本的に適していない。
そこで、これを実現するためにデータ構造を工夫したり、回路を付加することが別途必要になる。たとえばVTRなどにて、MPEG方式で圧縮された映像/音声などのデータを高速再生(通常2〜10倍速再生程度)する場合には、もっとも単純な方法としては、デコーダに入力するデータの転送レートを上げ、これに伴ってデコーダの処理速度を向上させて瞬時にデータをデコードし、その後、音声サンプル単位でデータを間引けばよい。
【0006】
【特許文献1】
特許第3226711号公報(第2,3頁)
【0007】
【発明が解決しようとする課題】
しかしながら、デコーダに入力するデータの転送レートを上げて、デコードするためには、処理能力の高いデコーダを採用する必要がある。例えば、n倍速(n>1)の高速再生を実現する場合、通常速度再生時のn倍のビットレートでデコード可能なデコーダを採用する必要がある。こうした通常速度再生時のn倍(n>1)のビットレートでデコード可能なデコーダは、通常速度再生時のビットレートでデコードするデコーダよりも高価でありコストがかかる。例えば、デコーダをハードウェアで実現する場合、デコーダチップのコストが増加し、また、デコーダをソフトウェアで実現する場合も、デコード処理のために高速なCPUを採用する必要があってコストがかかる。こうした高速再生は、通常速度再生に比べ使用頻度が低いことが多く、高速再生のためにこうした処理能力の高いデコーダを備えるのは、コストパフォーマンスが悪かった。
【0008】
また、高速再生時には、通常速度再生時のn倍のビットレートでデコードするため、通常速度再生時に比べ、消費電力が大きくなってしまう。そのため、特に、電池を用いた機器で通常速度再生時のn倍のビットレートでデコードすると、著しく連続使用可能時間が短くなってしまい、利便性や経済性が損なわれ、致命的である。
【0009】
そこで本発明は、このような課題を解決するためになされたもので、デコーダの処理速度を向上することなく圧縮音声データの高速再生にも適応できるようにすることを目的とする。
【0010】
【課題を解決するための手段及び発明の効果】
上述した問題点を解決するためになされた請求項1に係る圧縮音声データ再生装置は、圧縮された音声データである圧縮音声データを記憶する記憶手段と、記憶手段に記憶された圧縮音声データを復号する復号手段とを備え、復号手段によって復号された音声データを用いて再生を行うものであり、記憶手段は、音声データを圧縮して得た第一のビットレートの圧縮音声データである通常速度再生用データに加え、前記音声データを圧縮して得た圧縮音声データであって第一のビットレートよりも低いビットレートである第二のビットレートの圧縮音声データである高速再生用データを記憶しており、復号手段は、通常速度での再生の場合には通常速度再生用データを記憶手段から読み出して第一のビットレートで復号する一方、高速再生の場合には高速再生用データを記憶手段から読み出して第一のビットレート以下、かつ、第二のビットレート以上のビットレートで復号する。
【0011】
このようにすれば、高速再生の場合であっても、高速再生用のデータを復号手段が復号する際のビットレートは、第一のビットレート、すなわち、通常速度再生の場合のビットレートを超えることがない。よって、従来のように、高速再生のために、通常速度再生時のビットレートより大きいビットレートの圧縮音声データを復号する必要がないため、復号手段のコストを抑えることができる。このように、復号手段(デコーダ)の処理速度を向上することなく圧縮音声データの高速再生に適応できる。また、高速再生用のデータを復号手段が復号する際のビットレートは、通常速度再生の場合のビットレートを超えることがないので、高速再生の場合の消費電力も、通常速度再生の場合の消費電力と同等以下に抑えることができる。そのため、特に、請求項10に示すように、復号手段への電源の供給を電池から行うように構成された圧縮音声データ再生装置では、高速再生の場合であっても、通常速度再生の場合の連続使用可能時間と同等以上、電池による利用が可能となり、利便性や経済性が向上する。
【0012】
なお、復号手段は高速再生用データを記憶手段から読み出して第一のビットレート以下、かつ、第二のビットレート以上のビットレートで復号することで、高速再生を行うことができるが、特に、復号手段は、第一のビットレートで復号するとよい。例えば、請求項2に示すように、第二のビットレートは、第一のビットレートの1/nのビットレートとし、復号手段は、高速再生の場合には高速再生用データを記憶手段から読み出して第二のビットレートのn倍のビットレート(=第一のビットレート)で復号する。このようにすれば、再生時のビットレートは、通常速度再生の場合であっても、高速再生(n倍速再生)の場合であっても、第一のビットレートとなり一定にすることができる。
【0013】
例えば、第一のビットレートは128kbpsとし、第二のビットレートは64kbpsとした場合、n=2となり、復号手段は、高速再生の場合には、この64kbpsのビットレートの高速再生用データを2倍のビットレートである128kbpsで復号する。このようにすることでビットレートを一定に保ったまま2倍速再生を行うことができる。
【0014】
ところで、第一のビットレートよりも低いビットレートである第二のビットレートの圧縮音声データである高速再生用データは、例えば、請求項3〜6に示すものとすることができる。換言すれば、高速再生用データは、以下のような方法で得ることができる。
【0015】
例えば、請求項3に示すように、高速再生用データは、通常速度再生用データの圧縮率よりも高い圧縮率で音声データを圧縮して得たものとすることができる。特に、非可逆圧縮の場合には、圧縮率を上げると、圧縮時に情報を欠損させる度合いが上がるため、デコーダのデコード時の負荷が著しく上昇することもない場合が多い。通常速度再生用データの圧縮率よりも高い圧縮率の圧縮音声データ(高速再生用データ)は、例えば、通常速度再生用の音声データをエンコードする際に、エンコーダに第2のビットレート、具体的には例えば64kbpsを指定してエンコードすることにより得ることができる。
【0016】
また、請求項4に示すように、高速再生用データは、音声データのサンプリングレート(サンプリング周波数)をダウンコンバートした音声データを圧縮して得たものとすることができる。例えば、通常速度再生用の音声データのサンプリングレートが44.1kHzの場合には、まず、そのデータを1/2間引いた後、エンコードする際に、エンコーダに第2のビットレート、具体的には例えば64kbpsを指定してエンコードすることにより、ビットレートが64kbpsでサンプリングレートが22.05kHzの高速再生用データを得ることができる。
【0017】
また、請求項5に示すように、高速再生用データは、音声データの量子化ビット数をダウンコンバートしながら音声データを圧縮して得たものとすることができる。例えば、通常速度再生用の音声データの量子化ビット数が16ビットの場合には、その音声データをエンコードする際に、エンコーダに第2のビットレート、具体的には例えば64kbps及び量子化ビット数として8ビットを指定してエンコードすることにより、ビットレートが64kbpsで、量子化ビット数が8ビットの高速再生用データを得ることができる。
【0018】
また、請求項6に示すように、通常速度再生用の音声データは、nチャンネル(n>1)の音声データであり、高速再生用データは、前記nチャンネルの音声データのうちの一部のチャンネルの音声データを圧縮して得たものとすることができる。例えば、通常速度再生用の音声データが2チャンネル(ステレオ)の場合には、その音声データをエンコードする際に、エンコーダに第2のビットレート、具体的には例えば64kbps及びモノラル化を指定してエンコードすることにより、ビットレートが64kbpsでモノラルの高速再生用データを得ることができる。この場合、通常速度再生用の音声データが4チャンネルで、高速再生用の音声データが2チャンネルとすることも可能であり、この他の組み合わせも可能である。
【0019】
なお、請求項3〜6の引用関係にも示すとおり、上述した方法を組み合わせて高速再生用データを得てもよい。例えば、サンプリングレートと量子化ビット数の双方を通常速度再生用データの半分にすることで、通常速度再生用データの4分の1のビットレートの圧縮音声データを高速再生用データとすることができる。
【0020】
請求項3〜6のいずれの高速再生用データ(組み合わせたものも含む)を利用するかは、音声データの特性や、圧縮音声データ再生装置の用途等に応じて、適するものを選択することができる。例えば、音質の低下が最小になるものを選択するとよい。
【0021】
さて、復号手段は、高速再生の場合には高速再生用データを記憶手段から読み出して第一のビットレート以下、かつ、第二のビットレート以上のビットレートで復号することによって音声データが得られるのであるが、この音声データは、例えば一旦メモリに格納し逐次CPUがメモリからD/A変換器へ転送して、D/A変換手段によって変換されたアナログ信号をスピーカ等の音声出力手段へ入力して音声として出力するようにして再生してもよいし、音声データをストリームとしてそのままD/A変換手段へ転送して、D/A変換手段によって変換されたアナログ信号をスピーカ等の音声出力手段へ入力して音声として出力するようにして再生してもよい。いずれにせよ、復号手段から出力されたレート(速度)で音声データをD/A変換手段へ入力すると、D/A変換手段は、通常速度再生の場合に比べ高速にD/A変換しなければならない場合がでてくる。
【0022】
そこで、請求項7に示すように、高速再生の場合には、復号手段によって復号された音声データを間引いた音声データを再生用の音声データとして得る間引き手段を備えるとよい。このようにすれば、間引いた後の音声データのレートを落とすことができる。したがって、再生の際のD/A変換に必要な速度を落とすことができる。
【0023】
特に、請求項8に示すように、間引き手段は、第一のビットレートと第二ビットレートとのビットレートの比に基づいて間引く割合を決定するとよい。例えば、第一のビットレートが128kbpsであり、第二のビットレートが64kbpsの場合、これらの比は、第一のビットレート/第二のビットレート=128/64=2となる。この場合、高速再生時には、復号手段によって復号された音声データを2つに1つの割合で間引く。例えば、通常速度再生用データと高速再生用データのサンプリング周波数が共に44.1KHzの場合には、高速再生時には、復号手段は、高速再生用データを圧縮時のビットレートの2倍の128kbpsでデコードし、その結果、レートが88.2KHzの音声データ(音声ストリームデータ)が出力される。間引き手段は、この場合、復号手段によって復号されたこの音声データを2つに1つの割合で間引き、レートが44.1KHzの音声データを出力する。したがって、D/A変換は、高速再生の場合であっても、通常速度再生の場合と同一のレートで行えばよくなる。このように、間引き手段は、高速再生の場合に、通常速度再生の場合と同一のレートでD/A変換可能となる割合で、復号手段から入力した音声データを間引いて出力するとよい。
【0024】
ところで、通常速度での再生の場合であるか高速再生の場合であるかは、例えば、メモリ等に記憶された状態に基づいて判定してもよいし、例えば、請求項9に示すようにして判定してもよい。すなわち、通常速度での再生を行うか高速再生を行うかの再生モードをユーザに設定させるための設定手段を備え、復号手段は、通常速度での再生の場合であるか高速再生の場合であるかを設定手段に設定された再生モードに基づいて判定する。このようにすれば、ユーザが再生速度を設定することができる。
【0025】
なお、高速再生用データは、ビットレート別に複数設けてもよい。例えば、通常速度再生用データのビットレートが256kbpsの場合、記憶手段には、通常速度再生用データと、2倍速再生用データとしてビットレートが128kbpsの圧縮音声データと、4倍速再生用データとしてビットレートが64kbpsの圧縮音声データを記憶しておく。そして、これらのいずれのデータを復号手段によって復号させるか(再生モード)をユーザに設定させるための設定手段を備え、復号手段は、設定手段に設定された再生モードに基づいて復号するデータを選択するとよい。
【0026】
ところで、高速再生用データは、例えば上述した請求項3〜6の説明で示した方法で、予め別の装置などで生成しておき、記憶手段に記憶しておいてもよいし、請求項11に示すように、音声データを第二のビットレートの圧縮音声データへ変換する変換手段を備え、復号手段は、通常速度再生用データを記憶手段から読み出して第一のビットレートで復号した音声データを得て、変換手段は、復号手段によって得られた音声データを第二のビットレートの圧縮音声データへ変換し、記憶手段は、変換手段によって変換された圧縮音声データを高速再生用データとして記憶するようにしてもよい。すなわち、高速再生用データを、圧縮音声データ再生装置自らが作成する。このようにすれば、記憶手段には、予め高速再生用データを記憶しておかなくても、通常速度再生用データを記憶しておくだけで、高速再生用データが記憶手段に記憶されることとなる。なお、高速再生用データは、再生中(音声出力中)に生成してもよいし、再生は行わず(音声出力はせず)に生成してもよい。なお、変換手段による音声データから高速再生用データへの変換の方法としては、上述した請求項3〜6の説明で示した方法を用いるとよい。
【0027】
上述した圧縮音声データ再生装置の用途としては種々考えられるが、例えばカラオケ装置への利用を想定した場合には、請求項12に示すように、圧縮音声データ再生装置中のデータ記憶手段が、カラオケ演奏時に用いるバックコーラス用の波形データとしての圧縮音声データを記憶することが考えられる。バックコーラス以外の楽曲演奏に際しては例えばMIDIデータを用いることで、特段の処理負荷の増大なしに再生速度は自由に変更できる。しかし、バックコーラスのように肉声による波形データを圧縮音声データとして記憶した場合には、そのバックコーラスもMIDI演奏に合わせて高速再生させなくてはならず、標準速度再生用データのみ用いた場合には、復号手段の復号速度の増大を強制してしまう。したがって、本発明を適用することが有効である。そして特にカラオケ装置の場合には、既存のCPUや復号手段(デコーダ)をそのまま用いながら機能の充実を図っていることが現実的である。つまり、復号速度を向上させた復号手段を用いればリアルタイムに間引き処理等を行うことができ、理論的には問題が解決するが、現実的には市場に出回っている膨大な数のカラオケ装置に対して復号手段の交換を強制するのは経済的な観点も含め困難である。本発明によれば、このような復号手段の機能アップを強制することなく、既存のもので対応できるため、現実的な実効性は非常に高い。
【0028】
圧縮音声データについては、例えばCD−ROMやDVD−ROMのようなパッケージメディアから読み込んでもよいが、請求項13に示すように外部装置から配信してもらうこともできる。特に、いわゆる通信カラオケと称されるように、カラオケ演奏用データを外部装置(例えば配信センタ等のホストコンピュータ)から配信してもらうことが近年のカラオケ市場ではよく行われている。近年普及がめざましいブロードバンドの通信網を介して配信される場合には、通信コストが低下すると共に、カラオケ装置側で波形データを生成する手間が省けるメリットがある。なお、この場合でも、請求項11に示すように標準速度再生用データを元にして圧縮音声データ再生装置自らが高速再生用データを作成してもよい。その場合であれば、外部装置から配信してもらうのは標準速度再生用データだけでよくなり、配信に要する時間やコストが低減する。
【0029】
【発明の実施の形態】
以下、本発明が適用された実施例について図面を用いて説明する。なお、本発明の実施の形態は、下記の実施例に何ら限定されることなく、本発明の技術的範囲に属する限り種々の形態を採りうることは言うまでもない。
【0030】
図1は、圧縮音声データ再生装置を備えた本実施例のカラオケ装置1の構成を示すブロック図である。本実施例のカラオケ装置1は、いわゆる通信カラオケと称されるものであり、通信ネットワーク3を介してホストコンピュータ2に接続できるようになっている。そして、カラオケ装置1は、この通信ネットワーク3を介して接続したホストコンピュータ2からカラオケに関する音楽情報と画像情報とを取得することができる。
【0031】
なお、ホストコンピュータ2は、通信ネットワーク3を介してカラオケ装置1とアクセス可能であって、カラオケ装置1に対して、最新の流行曲等の曲データを発信したり、どのような曲が何回演奏されたかといったログデータを含む関連情報をカラオケ装置1から受信したりして管理することができるようになっている。また、ホストコンピュータ2は、データベースを備えており、このデータベースに楽曲演奏に使用するコンテンツデータとしての音楽情報や背景画または歌詞等の画像情報等を記憶している。また、ホストコンピュータ2は、コンテンツデータ以外にバージョンアップされたシステムプログラム等をデータベースに記憶し、そのデータベースから随時読み出してカラオケ装置1に対して配信することができるようになっている。
【0032】
次に、カラオケ装置1の構成について説明する。
このカラオケ装置1には、図1に示されるように、ホストコンピュータ2に通信ネットワーク3を介して接続し各種の情報を送受信する「通信手段」としての通信装置19、曲の予約操作などを行うための操作パネル10、カラオケ装置1全体の制御を司るCPU14、各種情報を一時的に記憶するRAM15、演奏の再生を行う音源再生装置18、音楽情報にかかる電気信号を増幅等するアンプ20、カラオケ用の音楽情報や画像情報その他各種データを記憶しているハードディスク13、ハードディスク13に記憶された画像情報に基づいて歌詞や背景画を再生するための映像再生装置24を備えている。この内、通信装置19、操作パネル10、ハードディスク13、RAM15、音源再生装置18及び映像再生装置24は、CPU14に接続されている。
【0033】
アンプ20には、当該アンプ20からの電気信号を入力して伴奏曲及び利用者(歌唱者)の歌声等を流すスピーカ22と、利用者(歌唱者)の歌声等をアンプ20に入力するためのマイクロフォン(以下、単にマイクと称す。)23が接続されている。また、映像再生装置24には、画像情報である背景画及び歌詞等を表示する表示装置26が接続されている。
【0034】
上述した通信装置19は、信号の変調および復調を行う変復調装置であり、CPU14の制御の下、通信ネットワーク3を通じてホストコンピュータ2にアクセス可能に構成されている。それによって、通信装置19は、通信ネットワーク3を介してホストコンピュータ2から送られてくる楽曲データ等を受信したり、上記関連情報をホストコンピュータ2に伝送することができる。
【0035】
また、操作パネル10は、利用者によって操作されるものであり、図2に示すように、任意の曲の選択等を行うためのテンキーパネル10a、演奏再生の早送りをさせるための早送りボタン10b、例えば選曲番号等を表示するための表示部10cを備えている。
【0036】
テンキーパネル10aは、「0」から「9」までの数字ボタンと、その数字ボタンを介して入力された選曲番号を確定させて演奏を実行させるための選曲ボタンを備える。また、早送りボタン10bは、例えば歌唱者が早送りさせたい場合に操作するもので、本実施例では早送りボタン10bを押している間、通常の2倍の速度で再生されるようになっている。したがって、例えば間奏が長い場合に2番や3番の頭まで早送りさせたりすることができる。なお、この早送りボタン10bが「設定手段」を構成する。
【0037】
また、ハードディスク13には、図2に示すように、アプリケーションプログラムや楽曲データなどが記憶されている。楽曲データは、図3に示すようにヘッダD1、MIDIデータD2、歌詞データD3、バックコーラスなどの肉声の波形データD4,D5によって構成されている。波形データD4,D5は、アナログのオーディオ信号をデジタル変換して作成したものであり、例えばPCM録音によって作成したPCMデータをエンコードしたADPCMデータやMP3データ等が該当する。ここでは波形データが44.1KHzのサンプリングレートのPCMデータを圧縮して得たMP3データであるとして以下の説明を進める。波形データD4は、このPCMデータを128kbpsのビットレートでMP3データへエンコードしたデータである。また、波形データD5は、波形データD4の生成に用いたPCMデータと同一のPCMデータを、ビットレートを波形データD4の半分である64kbpsとしてMP3データへエンコードしたデータである。すなわち、波形データD5は、波形データD4よりも圧縮率を高めたデータということができる。例えば、高音低音部の人に聞こえない音を消したり、小さな雑音部を消したり、人に聞こえにくい大きな音の近傍の音を消すなどして、指定されたビットレートになるまで情報量を削減して圧縮を行う。このように指定されたビットレートで圧縮するMP3エンコーダは公知である。
【0038】
そして、各波形データには、MP3の規格(MPEG1 Audio(ISO/IEC11172−3))で規定される各種の情報が含まれており、この情報の中には、ビットレート情報が含まれている。なお、波形データD4が「通常速度再生用データ」に相当し、波形データD5が「高速再生用データ」に相当する。またPCMデータが「音声データ」に相当する。そして、ハードディスク13は「記憶手段」に相当する。
【0039】
ハードディスク13には、映像データや各種の設定に必要な設定データ、さらには演奏記録などのログデータなども記憶されている。そして、操作パネル10のテンキーパネル10aを介して曲が選択されると、CPU14は、選択された曲の楽曲データや選択された曲と関連する映像データをハードディスク13から呼び出して、音源再生装置18及び映像再生装置24に同期させて出力するようになっている。
【0040】
その後、CPU14から出力される楽曲データは、音源再生装置18において、アナログの演奏音信号に変換された後、アンプ20へ送られて電気的に増幅される。このアンプ20は、マイク23を介して入力される利用者の歌唱音信号と適度な割合でミキシングするもので、ミキシングされた歌唱音信号と演奏音信号は、アンプ20からスピーカ22に出力され、音声及び演奏音となってスピーカ22から外部へ出力される。
【0041】
ここで、音源再生装置18について、図2を参照してさらに説明する。音源再生装置18は、MP3用のデコーダ18a、「D/A変換手段」としてのデジタルアナログコンバータ(DAC)18b、「変換手段」としてのエンコーダ18c、「間引き手段」としての間引き処理器18d、MIDI音源18eを備えている。
【0042】
CPU14から出力される楽曲データ中のMIDIデータD2は、MIDI音源18eにおいて演奏音信号に変換された後、DAC18bを介してアンプ20へ出力される。
一方、例えばバックコーラス用の波形データD4,D5(MP3データ)は、デコーダ18aによってPCMデータにデコードされた後、間引き処理器18d及びDAC18bを介してアンプ20へ出力される。デコーダ18は、MP3データに含まれるビットレート情報の示すビットレートでMP3データをPCMデータにデコードして出力する。また、間引き処理器18dは、間引き処理器18dに備える設定レジスタの値が「間引き処理実行」に設定されている場合には、デコーダ18aから出力されたPCMデータを入力し、入力したPCMデータを2つに1つの割合で間引いたPCMデータを出力する。また、間引き処理器18は、間引き処理器18dに備える設定レジスタの値が「スルー」に設定されている場合には、デコーダ18aから出力されたPCMデータを入力し、入力したPCMデータをそのまま(間引かずに)出力する。また、間引き処理器18は、設定レジスタの値が「停止」の場合には、デコーダ18aから出力されたPCMデータの入力を行わず、その結果、DAC18bへPCMデータは出力されない。この間引き処理器18dに備える設定レジスタの値は、CPU14が書き換え可能に構成されている。
【0043】
またデコーダ18aから出力されたPCMデータは、エンコーダ18cへ入力可能に構成されており、エンコーダ18cは、CPU14によってエンコーダ18cの設定レジスタが「エンコード」に設定されている場合に、デコーダ18aでデコードされたPCMデータを入力して64kbpsのビットレートでMP3データへエンコードし、エンコードしたMP3データをRAM15へ転送する機能を備える。エンコーダ18cは、通常、PCMデータをエンコードする際に設定することができるパラメータとして、ビットレート、量子化ビット数、モノラル化等があり、特段パラメータが設定されていない場合には、エンコードするPCMデータが有するパラメータに基づいてエンコードが行われる。本実施例の場合、エンコーダ18cに対してビットレートとして64kbpsが設定された状態で、PCMデータのエンコードが行われる。これにより、波形データD4に比べて圧縮率を高めたビットレートとして64kbpsの波形データD5を得ることができる。なお、波形データD5として、音声データのサンプリングレート(サンプリング周波数)を1/2ダウンコンバートして圧縮した音声データを用いる場合には、エンコーダ18cは、入力されるPCMデータを1/2間引いた後に、指定されたビットレートによりエンコードするような機能を備える必要がある。また、この設定レジスタが「停止」に設定されている場合にはエンコーダ18cはエンコードを行わない。CPU14、RAM15、デコーダ18aは「復号手段」を構成する。
【0044】
楽曲演奏に際して再生速度変更(早送り)をする場合、MIDIデータD2を用いた演奏に際しては、標準再生速度からの変更量をCPU14からMIDI音源18eに指示してやれば、MIDIデータD2を用いてその指示された再生速度での演奏音信号を容易に作成できる。
【0045】
ところで、通信ネットワーク3を介してホストコンピュータ2からカラオケ装置1に送られてくる時点での楽曲データ中には、図3(b)に示すように、波形データとしては標準速度再生用の波形データD4しか存在しないものがあってもよい。この場合、標準速度再生用の波形データD4を用いて他の波形データをカラオケ装置1内で作成する。もちろん、図3(c)に示すように、波形データ自体が存在しない楽曲データが存在してもよい。上述のバックコーラスなどのようにMIDIデータでは対応することが難しい楽音データについて波形データとして持つため、もともとバックコーラス等がない楽曲データであれば波形データ自体が存在しなくてもよいからである。
【0046】
図4のフローチャートを参照して、標準速度再生用の波形データD4を用いて波形データD5を作成する処理について説明する。この処理は、楽曲データの受信時にCPU14が実行するものである。なお、楽曲データの受信時に即座に実行せず、例えば受信後のカラオケ装置1が演奏を行っていないアイドリング時を判断し、そのアイドリング時に実行するようにしてもよい。
【0047】
まず、楽曲データを受信し(S102)、その中に波形データD4があるか否かを判断する(S104)。図3(c)に示すように、波形データD4が存在しない楽曲データであれば(S104:NO)、そのまま本処理ルーチンを終了する。一方、図3(a)(b)に示すように、波形データD4が存在する楽曲データであれば(S104:YES)、S106へ移行する。
【0048】
S106では、S102で受信した楽曲データに波形データD5があるか否かを判断する。図3(a)に示すように、波形データD5が存在する楽曲データであれば(S106:YES)、そのまま本処理ルーチンを終了する。一方、図3(b)に示すように、波形データD5が存在しない楽曲データであれば(S106:YES)、S108へ移行する。
【0049】
S108では、各部をエンコード用に設定する。すなわち、間引き処理器18dの設定レジスタを「停止」に設定し、エンコーダ18cの設定レジスタを「エンコード」に設定すると共に、パラメータとして、ビットレート64kbpsを設定する。
【0050】
続くS110では、波形データD4をデコーダ18cへ転送し、エンコーダ18cからRAM15上に出力されるMP3データをハードディスク13へ記憶する。
S110の処理が完了すると、S110でハードディスク13へ記憶されたMP3データを波形データD5として楽曲データに連結する(S112)。本実施例ではMP3データとして倍速再生用の波形データD5を作成したので、それを標準速度再生用の波形データD4の後に連結する。その後、本処理ルーチンを終了する。このようにして、ビットレートが128kbpsの波形データD4からビットレートが64kbpsの波形データD5を生成することができ、波形データD5を有する楽曲データを得ることができる。つまり、図3(a)に示す楽曲データを得ることができる。
【0051】
このような配信時の処理が終了すると、この時点ではハードディスク13中には、図3(a)に示すように、2種類の波形データD4、D5を持つ楽曲データか、あるいは図3(c)に示すように波形データ自体を持たない楽曲データのいずれかが存在することとなる。
【0052】
次に、カラオケ装置1にて実行されるカラオケ演奏時の処理について、図5のフローチャートを参照して説明する。この処理もCPU14が実行するものである。
まず、曲番号の受付が完了したか否か判断し(S202)、選曲ボタンが操作されて受付完了の場合は(S202:YES)、その受け付けた曲番号に対応する楽曲データをハードディスク13からRAM15に転送する(S204)。上述した配信時の処理の結果、カラオケ演奏時においては、ハードディスク13中には、2種類の波形データD4、D5を持つ楽曲データ(図3(a)参照)か、波形データ自体を持たない楽曲データ(図3(c)参照)のいずれかが存在することとなる。
【0053】
続くS205では、各部を再生用に設定する。すなわち、間引き処理器18dの設定レジスタを「スルー」に設定し、エンコーダ18cの設定レジスタを「停止」に設定する。
そして、次のステップS206では、RAM15に転送した楽曲データ内のMIDIデータD2を音源再生装置18(図1参照)内のMIDI音源18e(図2参照)に送る。それと共に、図3(a)に示すように波形データ(MP3データ)を持つ楽曲データの場合には、標準速度再生用の波形データD4(図3(a)参照)を音源再生装置18内のデコーダ18a(図2参照)に送る。当然ながら、図3(c)に示すように波形データ(MP3データ)自体を持たない楽曲データの場合は、波形データ自体が存在しないためデコーダ18aへ送ることはない。MIDIデータD2はMIDI音源18eにおいて演奏音信号に変更された後、DAC18bを介してアンプ20へ出力され、標準速度再生用の波形データD4についてはデコーダ18aにてPCMデータにデコードされた後、間引き処理器18dを介し、MIDI音源18eから出力された演奏音信号と合成されてDAC18bへ出力される。そして、曲の演奏が終了するまでは(S208:NO)、再生速度変更処理(S210)を実行し、曲の演奏が終了したら(S208:YES)、本処理ルーチンを終了する。
【0054】
それでは、図5のステップS210にて実行される再生速度変更処理について、図6のフローチャートを参照して説明する。
まず、再生速度変更操作があるか否かについて判断する(S302)。具体的には、操作パネル10における早送りボタン10bが押下されていない状態から押下状態に変化したか、あるいは早送りボタン10bが押下状態から押下されていない状態に変化したかを判断する。上述したように、本実施例の場合は、早送りボタン10bを押している間は早送りするようになっているため、早送りボタン10bが押下されていない状態から押下状態に変化した場合には標準速度再生から倍速再生に変化させ、早送りボタン10bが押下状態から押下されていない状態に変化した場合には、倍速再生から標準速度再生に変化させることとなる。
【0055】
このような再生速度変更操作が無い場合(S302:NO)には、そのまま本処理ルーチンを終了するが、早送りボタン10bが操作された場合(S302:YES)には、その操作に応じて「現在の演奏再生速度値」を増減させる(S304)。具体的には、早送りボタン10bが押下された場合には倍速再生速度の値が「現在の演奏再生速度値」として設定され、早送りボタン10bが押下状態から押下されない状態になった場合には標準再生速度の値が「現在の演奏再生速度値」として設定される。なお、この「現在の演奏再生速度値」は、RAM15にセット(記憶)される。
【0056】
ステップS304の処理後はステップS306へ移行し、MIDI演奏を、S304にてセット(記憶)された現在の演奏再生速度値に応じたものに変更する。MIDI音源18eを用いたMIDI演奏における演奏再生速度の変更は、MIDIデータD2のパラメータの変更のみで簡単に対応できる。
【0057】
次のステップS308では、S304にてセット(記憶)された現在の演奏再生速度値に対応する波形データ(MP3データ)を選択してデコーダ18aへ送り、また、波形データ自体を持たない楽曲データ(図3(c)に示す)の場合、この処理はスルーされる。つまり、現在の演奏再生速度値が「倍速再生速度の値」であれば、倍速再生用の波形データD5(図3(a)参照)をビットレート128kbpsの転送速度でデコーダ18aに送り、現在の演奏再生速度値が「標準再生速度の値」であれば、標準速度再生用の波形データD4(図3(a)参照)をビットレート128kbpsの転送速度でデコーダ18aに送る。また、現在の演奏再生速度値が「倍速再生速度の値」であれば、間引き処理器18dの設定レジスタを「間引き処理実行」に設定し、現在の演奏再生速度値が「標準再生速度の値」であれば、間引き処理器18dの設定レジスタを「スルー」に設定する。そして、デコーダ18aが、これら倍速再生用の波形データD5あるいは標準速度再生用の波形データD4をPCMデータにデコードし、間引き処理器18dを介して、DAC18bへ送る。前述のように、デコーダ18aは、前述したCPU14の転送速度に応じてMP3データをPCMデータにデコードして出力するので、波形データD4の場合も、波形データD5の場合も、128kbpsのビットレートでデコードしてPCMデータを間引き処理器18dへ出力する。そのため、デコーダ18aからのPCMデータの出力レートは、波形データD4が入力された場合には44.1KHzとなり、間引き処理器18dはスルーするため、DAC18bへは、44.1KHzのレートのPCMデータが入力される。一方、波形データD5が入力された場合には、デコーダ18aからのPCMデータの出力レートは、2倍の88.1KHzとなり、間引き処理器18dは前述した間引き処理を行うため、DAC18bへは、44.1KHzのレートのPCMデータが入力される。その結果、早送りボタン10bが押下されていない間は、標準速度で再生されたバックコーラスなどの肉声がスピーカ22から出力され、早送りボタン10bが押下されている間は倍速再生されたバックコーラスなどの肉声がスピーカ22から出力される。
【0058】
本実施例のカラオケ装置1によれば、次のような効果が得られる。
(イ)ハードディスク13に記憶された楽曲データには、図3(a)に示すように、128kbpsでエンコードされた標準速度再生用の波形データD4(MP3データ)に加え、標準速度再生用の波形データD4の半分のビットレートである64kbpsでエンコードされた倍速再生用の波形データD5(MP3データ)を含めて構成している。そして、カラオケ演奏時、通常は、標準速度再生用の波形データD4をデコーダ18aによってPCMデータにデコードするが、操作パネル10の早送りボタン10bが押下された場合には、倍速再生用の波形データD5をデコーダ18aによって倍のビットレートである128kbpsでPCMデータにデコードする。したがって、倍速再生時であっても通常速度再生時であっても、デコーダに必要なビットレートは128kbpsで済む。そのためデコーダの処理速度を向上することなく高速再生に適応できる。また、高速再生の場合の消費電力も、通常速度再生の場合の消費電力と同等に抑えることができる。特に、この通信カラオケが、ハンディタイプのものであって、図1及び図2に示した各部が電池で駆動する場合には、高速再生の場合であっても通常速度再生の場合の連続使用可能時間と同等の時間、電池による利用が可能となり、利便性や経済性が向上する。
【0059】
(ロ)上述した倍速再生用の波形データD5は、もともとホストコンピュータ2にて作成してカラオケ装置1に配信するようにしてもよいが、上記実施例では図3(b)に示すように、配信時の楽曲データ中には波形データとして標準速度再生用の波形データD4(MP3データ)のみを含めておき、倍速再生用の波形データD5についてはカラオケ装置1内で作成するものにも対応している。そのため、配信時の1曲あたりのデータ量が相対的に少なくなるため、ホストコンピュータ2とカラオケ装置1との間での通信時間や通信コストの低減に寄与する。
【0060】
以上実施例について説明したが、本発明は上記実施例に限定されるものではなく、種々の態様で実施し得る。そのいくつかを説明する。
(1)上記実施例では、早送りのために2倍速再生を採用したが、例えば3倍速再生、4倍速再生、あるいは1.5倍速再生などであってもよい。すなわち、波形データD4のビットレートと波形データD5のビットレートの比を3倍、4倍、あるいは1.5倍とするとしてもよい。また、例えば2倍速再生及び3倍速再生というように複数の高速再生用の波形データを準備しておき、早送りボタンの方も2倍速再生と3倍速再生を選択して指定できるようにしておいてもよい。さらには、例えば早送りボタンを最初押下した時点では2倍速再生であり、押下継続時間が所定時間を経過すると3倍速再生に自動的に切り換わるようになっていてもよい。この場合、高速再生の速度として、標準の整数倍でない場合も設定可能な場合、つまり、例えば、上述の1.5倍をも設定可能な場合には、図2に示す音源再生装置18の構成として、MIDI音源18eの出力側に、デジタルアナログコンバータをDAC18bとは別に設け、そのデジタルアナログコンバータの出力とDAC18bの出力とをミキシング、つまりアナログ信号レベルでミキシングするように構成するのが望ましい。このように構成することにより、間引き処理器18dから出力されるデジタル信号と、MIDI音源18eから出力されるデジタル信号の同期を考慮する必要がなくなり、音源再生装置18の構成が簡単となる。
【0061】
なお、このように複数の高速再生用の波形データを準備する場合にも、上記実施例と同様に、通信ネットワーク3を介してホストコンピュータ2からカラオケ装置1に送られてくる時点での楽曲データ中には、波形データとしては標準速度再生用の波形データD4しか存在させず(図3(b)参照)、受信後に、その標準速度再生用の波形データD4を用いて他の複数の高速再生用の波形データをカラオケ装置1内で作成するようにできる。
【0062】
(2)上記実施例では、デコーダ18a、間引き処理器18d、エンコーダ18c、MIDI音源18eをCPU14とは別のハードウェアで実現したが、これらの一部または全部は、CPU14による処理で実現してもよい。この場合、CPU14はDAC18に対してPCMデータを転送可能なように構成してもよい。この場合、例えば、デコーダ18aの出力をCPU14がDAC18やエンコーダ18cへ転送可能な構成としてもよい。この時、CPU14が間引き処理を行うようにしてもよい。
【0063】
(3)上記実施例では、波形データD5は、波形データD4よりも圧縮率を高めたデータとして説明したが、波形データD5は、ビットレートを波形データD4のビットレートより低くしたデータであればよい。したがって、例えば、波形データD5は、PCMデータのサンプリングレート(サンプリング周波数)をダウンコンバートした音声データを圧縮して得たものとしてもよい。例えば、波形データD4が44.1kHzのサンプリングレートのPCMデータを圧縮したMP3データである場合、波形データD5は、このPCMデータを1/2間引き処理した後、ビットレートを波形データD4のビットレートの1/2にてエンコードして圧縮したMP3データとすることができる。
【0064】
また、例えば、波形データD5は、PCMデータの量子化ビット数をダウンコンバートしたPCMデータを圧縮したMP3データとしてもよい。例えば、波形データD4が16ビットの量子化ビット数のPCMデータを圧縮したMP3データである場合、波形データD5は、このPCMデータを量子化ビット数8ビット、ビットレートを波形データD4のビットレートの1/2にてエンコードして圧縮したMP3データとすることができる。
【0065】
また、例えば、波形データD4が2チャンネル(ステレオ)のPCMデータを圧縮したMP3データである場合、波形データD5は、いずれか1チャンネルのPCMデータをビットレートを波形データD4のビットレートの1/2にてエンコードして圧縮したMP3データとする。
【0066】
例えば、エンコーダ18cは、デコーダ18aから入力したPCMデータのサンプリングレートをダウンコンバート(間引き)する機能や指定されたビットレートや量子化ビット数でエンコードする機能や、上記のように片方のチャンネルのPCMデータのみを指定されたビットレートでエンコードする機能を備えればよい。またこれらの方法(機能)を組み合わせてもよい。
【0067】
(4)上記実施例では、カラオケ装置を例に挙げて説明したが、圧縮音声データを再生する装置であれば同様に適用できる。例えばカラオケではない通常の音楽演奏装置であってもよいし、あるいは音声と映像がセットになっている映画ソフト等を再生する装置(例えばビデオ再生装置など)であってもよい。但し、例えばビデオ再生装置等の場合には主に個人ユースであり、CPUやデコーダ自体の性能を向上させた新機種をどんどん市場に投入していく傾向にある。それに対してカラオケ装置の場合には、店舗等での使用が主であり、既存のCPUやデコーダをそのまま用いながら機能の充実を図っていることが現実的である。つまり、デコード速度を向上させたデコーダを用いればリアルタイムに間引き処理等を行うことができ、理論的には問題が解決するが、現実的には市場に出回っている膨大な数のカラオケ装置に対してデコーダ18aの交換を強制するのは経済的な観点も含め困難である。そのような観点から、上記実施例のカラオケ装置1であれば、このようなデコーダの機能アップを強制することなく、既存のもので対応できるというメリットが得られる。
【0068】
(5)上記実施例ではMP3データを例に挙げたが、波形データの形式としては、それ以外にも、ADPCM、MPEG2オーディオAAC、TwinVQ、ATRAC3などであってもよい。
(6)上記実施例ではカラオケ装置1の本体に設けられた操作パネル10の早送りボタン10bを操作することによってユーザが早送りを指示できるようにしたが、例えば赤外線信号やBluetooth規格に基づく無線通信によって接続されたリモコンなどに上記早送りボタンを準備し、そのリモコンの早送りボタンを操作することでユーザが早送りを指示できるようにしてもよい。
【図面の簡単な説明】
【図1】実施例のカラオケ装置の概略構成を示すブロック図である。
【図2】実施例のカラオケ装置における音源再生装置などの詳細を示すブロック図である。
【図3】実施例の楽曲データの説明図である。
【図4】標準速度再生用の波形データを用いて倍速再生用の波形データを作成する処理を示すフローチャートである。
【図5】カラオケ演奏時の処理を示すフローチャートである。
【図6】図5の処理中で実行される再生速度変更処理を示すフローチャートである。
【符号の説明】
1…カラオケ装置、2…ホストコンピュータ、3…通信ネットワーク、10…操作パネル、10a…テンキーパネル、10b…早送りボタン、10c…表示部、13…ハードディスク、14…CPU、15…RAM、18…音源再生装置、18a…デコーダ、18b…デジタルアナログコンバータ(DAC)、18c…エンコーダ、18d…間引き処理器、18e…MIDI音源、20…アンプ、22…スピーカ、23…マイクロフォン、24…映像再生装置、26…表示装置
Claims (13)
- 圧縮音声データを記憶する記憶手段と、
前記記憶手段に記憶された圧縮音声データを復号する復号手段と、
を備え、前記復号手段によって復号された音声データを用いて再生を行う圧縮音声データ再生装置であって、
前記記憶手段は、音声データを圧縮して得た第一のビットレートの圧縮音声データである通常速度再生用データに加え、前記音声データを圧縮して得た圧縮音声データであって前記第一のビットレートよりも低いビットレートである第二のビットレートの圧縮音声データである高速再生用データを記憶しており、
前記復号手段は、通常速度での再生の場合には前記通常速度再生用データを前記記憶手段から読み出して前記第一のビットレートで復号する一方、高速再生の場合には前記高速再生用データを前記記憶手段から読み出して前記第一のビットレート以下、かつ、前記第二のビットレート以上のビットレートで復号すること
を特徴とする圧縮音声データ再生装置。 - 請求項1に記載の圧縮音声データ再生装置において、
前記第二のビットレートは、前記第一のビットレートの1/nのビットレート(n>1)とし、
前記復号手段は、前記高速再生の場合には前記高速再生用データを前記記憶手段から読み出して前記第二のビットレートのn倍のビットレートで復号することで、
n倍速再生を行うこと
を特徴とする圧縮音声データ再生装置。 - 請求項1または2に記載の圧縮音声データ再生装置において、
前記高速再生用データは、通常速度再生用データを得た際の圧縮率よりも高い圧縮率で前記音声データを圧縮して得たものであること
を特徴とする圧縮音声データ再生装置。 - 請求項1〜3のいずれかに記載の圧縮音声データ再生装置において、
前記高速再生用データは、前記音声データのサンプリングレートをダウンコンバートした音声データを圧縮して得たものであること
を特徴とする圧縮音声データ再生装置。 - 請求項1〜4のいずれかに記載の圧縮音声データ再生装置において、
前記高速再生用データは、前記音声データの量子化ビット数をダウンコンバートした音声データを圧縮して得たものであること
を特徴とする圧縮音声データ再生装置。 - 請求項1〜5のいずれかに記載の圧縮音声データ再生装置において、
前記音声データは、nチャンネル(n>1)の音声データであり、
前記高速再生用データは、前記nチャンネルの音声データのうちの一部のチャンネルの音声データを圧縮して得たものであること
を特徴とする圧縮音声データ再生装置。 - 請求項1〜6のいずれかに記載の圧縮音声データ再生装置において、
前記高速再生の場合には、前記復号手段によって復号された音声データを間引いた音声データを再生用の音声データとして得る間引き手段を備えること
を特徴とする圧縮音声データ再生装置。 - 請求項7に記載の圧縮音声データ再生装置において、
前記間引き手段は、前記第一のビットレートと前記第二ビットレートとのビットレートの比に基づいて間引く割合を決定すること
を特徴とする圧縮音声データ再生装置。 - 請求項1〜8のいずれかに記載の圧縮音声データ再生装置において、
前記通常速度での再生を行うか前記高速再生を行うかの再生モードをユーザに設定させるための設定手段を備え、
前記復号手段は、通常速度での再生の場合であるか高速再生の場合であるかを前記設定手段に設定された再生モードに基づいて判定すること
を特徴とする圧縮音声データ再生装置。 - 請求項1〜9のいずれかに記載の圧縮音声データ再生装置において、
少なくとも前記復号手段への電源の供給は、電池から行うこと
を特徴とする圧縮音声データ再生装置。 - 請求項1〜10のいずれかに記載の圧縮音声データ再生装置において、
音声データを前記第二のビットレートの圧縮音声データへ変換する変換手段を備え、
前記復号手段は、前記通常速度再生用データを前記記憶手段から読み出して前記第一のビットレートで復号した音声データを得て、
前記変換手段は、前記復号手段によって得られた音声データを前記第二のビットレートの圧縮音声データへ変換し、
前記記憶手段は、前記変換手段によって変換された圧縮音声データを前記高速再生用データとして記憶すること
を特徴とする圧縮音声データ再生装置。 - 請求項1〜11のいずれかに記載の圧縮音声データ再生装置を備え、
前記記憶手段は、カラオケ演奏時に用いるバックコーラス用の波形データとしての圧縮音声データを記憶していること
を特徴とするカラオケ装置。 - 請求項12に記載のカラオケ装置において、
外部装置と通信するための通信手段を備え、
前記記憶手段が記憶している圧縮音声データの少なくとも一部は、外部装置から配信されたものであること
を特徴とするカラオケ装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003132116A JP2004334046A (ja) | 2003-05-09 | 2003-05-09 | 圧縮音声データ再生装置、カラオケ装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003132116A JP2004334046A (ja) | 2003-05-09 | 2003-05-09 | 圧縮音声データ再生装置、カラオケ装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004334046A true JP2004334046A (ja) | 2004-11-25 |
Family
ID=33507109
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003132116A Pending JP2004334046A (ja) | 2003-05-09 | 2003-05-09 | 圧縮音声データ再生装置、カラオケ装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004334046A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007029832A1 (ja) * | 2005-09-08 | 2007-03-15 | Sony Corporation | 撮像画像記録装置、撮像画像記録方法、撮像画像再生装置、撮像画像再生方法及び撮像画像記録再生システム |
WO2010086912A1 (ja) * | 2009-01-30 | 2010-08-05 | 日本ビクター株式会社 | 記録装置及び記録方法 |
-
2003
- 2003-05-09 JP JP2003132116A patent/JP2004334046A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007029832A1 (ja) * | 2005-09-08 | 2007-03-15 | Sony Corporation | 撮像画像記録装置、撮像画像記録方法、撮像画像再生装置、撮像画像再生方法及び撮像画像記録再生システム |
US8081864B2 (en) | 2005-09-08 | 2011-12-20 | Sony Corporation | Captured image recording apparatus, captured image recording method, captured image reproducing apparatus, captured image reproducing method, and captured image recording/reproducing system |
JP4973497B2 (ja) * | 2005-09-08 | 2012-07-11 | ソニー株式会社 | 撮像画像記録装置、撮像画像記録方法、撮像画像再生装置、撮像画像再生方法及び撮像画像記録再生システム |
KR101264817B1 (ko) | 2005-09-08 | 2013-05-15 | 소니 주식회사 | 촬상 화상 기록 장치, 촬상 화상 기록 방법, 촬상 화상재생 장치, 촬상 화상 재생 방법, 및 촬상 화상 기록 및재생 시스템 |
WO2010086912A1 (ja) * | 2009-01-30 | 2010-08-05 | 日本ビクター株式会社 | 記録装置及び記録方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7119267B2 (en) | Portable mixing recorder and method and program for controlling the same | |
KR101320756B1 (ko) | 재생 장치, 재생 방법, 프로그램 | |
US20070150082A1 (en) | Method, mechanism, implementation, and system of real time listen-sing-record STAR karaoke entertainment (STAR "Sing Through And Record") | |
EP1262969A2 (en) | Information reproduction apparatus and information reproduction method | |
JP2006317972A (ja) | オーディオデータ編集方法とこれを適用した記録媒体及びデジタルオーディオプレーヤー | |
JP2008268969A (ja) | ディジタルデータプレーヤー、そのデータ処理方法及び記録媒体 | |
WO2006122177A2 (en) | Mp-me recorder | |
WO2005096270A1 (ja) | 音楽を再生するためのコンテンツフレームを配信するコンテンツ配信サーバ及び端末 | |
US6759585B2 (en) | Musical-file-processing apparatus, musical-file-processing method and musical-file-processing method program | |
JP4649901B2 (ja) | 曲の符号化伝送のための方法および装置 | |
JP2004334046A (ja) | 圧縮音声データ再生装置、カラオケ装置 | |
KR100605094B1 (ko) | 노래 저장 및 재생기능을 갖는 노래방 기기와, 이를이용한 노래 저장방법 및 노래 재생방법 | |
JP3859200B2 (ja) | ポータブルミキシング記録装置及びその制御方法並びにプログラム | |
KR100617754B1 (ko) | 휴대용 디지털 오디오 재생 장치에서 음악 데이터와 함께사운드 효과를 재생하기 위한 장치 및 방법 | |
JP4419432B2 (ja) | カラオケ装置 | |
JP3859201B2 (ja) | ポータブルミキシング記録装置及びその制御方法並びにプログラム | |
JP2003217265A (ja) | 音楽ストレージ装置及び映像ストレージ装置 | |
JP4403319B2 (ja) | 端末装置 | |
JP2010002841A (ja) | コンテンツ再生装置 | |
JP2002109824A (ja) | ディジタル音声信号の記録方法、およびその装置 | |
JP2005033826A (ja) | ポータブルミキシング記録装置及びプログラム | |
JP2004515130A (ja) | マルチスピード再生モードにおける圧縮データの再生のための再生装置 | |
JP2009237275A (ja) | 曲データ受信装置、曲データ配信装置、および該曲データ受信装置および曲データ配信装置をそれぞれ制御する各制御方法を実現するためのプログラム | |
JP3900576B2 (ja) | 音楽情報再生装置 | |
JP2009122609A (ja) | 音響信号符号化装置と音響信号復号化装置と、その方法とプログラムと記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060428 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090402 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090421 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090908 |