JP4193240B2 - Compressed encoded data decoding apparatus and karaoke apparatus using the same - Google Patents
Compressed encoded data decoding apparatus and karaoke apparatus using the same Download PDFInfo
- Publication number
- JP4193240B2 JP4193240B2 JP26757798A JP26757798A JP4193240B2 JP 4193240 B2 JP4193240 B2 JP 4193240B2 JP 26757798 A JP26757798 A JP 26757798A JP 26757798 A JP26757798 A JP 26757798A JP 4193240 B2 JP4193240 B2 JP 4193240B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- decoding
- storage means
- karaoke
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Abstract
Description
【0001】
【発明の属する技術分野】
この発明は、圧縮符号化された音響データの復号装置及び同装置を用いたカラオケ装置に関し、特に音声データ等の音響データをベクトル量子化法によって圧縮符号化した装置に関する。
【0002】
【従来の技術】
音声信号等の音響信号を高能率で圧縮符号化する手法として、ベクトル量子化法が提案されている。例えば、TwinVQ(NTT社によって開発された音響信号の圧縮符号化法:Transform-domain Weighted Interleave Vector Quantization)と称されるベクトル量子化法は、圧縮符号化対象となる信号を一定区間で切り出し、切り出した各情報パターンをインターリーブして複数のターゲットベクトルを作成し、このターゲットベクトルに対してコードブック探索を行って最も近いパターンベクトルのインデックスを伝送する。復号時には、圧縮時に使用したコードブックと同じものを用いて元の信号を復元する。このベクトル量子化法では、コードブック探索によって得られたコードを圧縮符号とするから、音質レベルを高く維持したまま圧縮率を高めることができ、また、信号を一定区間で切り出す固定長フレーム方式を採用しているために符号誤りに強い特徴がある。そこで、TwinVQに代表されるベクトル量子化法による圧縮符号化方式は、特に、音楽信号や音声信号などの音響信号の圧縮に使用されている。
【0003】
なお、コードブックを用いてベクトル量子化する圧縮符号化方式については、例えば、特開平10−112657号公報等に示されている。
【0004】
従来、上記の圧縮符号化方式によって得られるデータは、図9に示すようにヘッダ1とデータ本体2とからなり、ヘッダ1は復号時(デコード時)に必要なサンプルレートやビットレートからなるデコード時に必要なデコードパラメータからなり、データ本体2はビットストリームからなる圧縮符号化データからなっている。
【0005】
デコード時には、まずヘッダ1を獲得し、この中のデコードパラメータを解釈してからデータ本体2の復号化操作を行う。
【0006】
【発明が解決しようとする課題】
しかし、従来の復号装置では、ヘッダ1とデータ本体2とを常に一体のものとして認識し、デコード時には、最初に必ずヘッダ1内のデコードラメータを解釈してからデータ本体2のデコードを行うようにしていた。このために、例えば、データ本体2の途中までデコードして一旦停止し、ある時間経過後に再びデータ本体2の任意の部分からデコードしたり、または、データ本体2の途中までデコードした後、他のデータ本体の途中からデコード開始をする、といった操作を行うことができなかった。すなわち、データ途中からのデコードを行うことができないために、圧縮符号化データの応用的な使用ができないという不都合があった。
【0007】
この発明の目的は、圧縮符号化データの任意の位置からデコードを行うことのできる圧縮符号化データの復号装置を提供することにある。
【0008】
また、この発明の他の目的は、上記復号装置を採用することによって、MIDIが苦手とする音声信号や楽器音信号等の応用的な操作が容易になるカラオケ装置を提供することにある。
【0009】
【課題を解決するための手段】
請求項1の発明は、コードブックを用いてベクトル量子化された圧縮符号化データをデコードするためのデコードパラメータを含むヘッダと、該圧縮符号化データを一定のフレーム毎に分割した状態で記憶するベクトル量子化データ記憶手段と、該ベクトル量子化データ記憶手段に記憶されている圧縮符号化データを再生するデコード手段とを備え、
前記デコード手段は、
前記ベクトル量子化データ記憶手段に記憶されている圧縮符号化データを再生するときに、該ベクトル量子化データ記憶手段から前記ヘッダに含まれるデコードパラメータを受信して一時的に記憶するデコードパラメータ記憶手段と、前記デコードパラメータ記憶手段に前記デコードパラメータが記憶されている状態で、前記ベクトル量子化データ記憶手段に記憶されている圧縮符号化データをその途中のフレームから受信して該受信したデータを前記デコードパラメータ記憶手段に記憶されているデコードパラメータに基づいて再生する再生部とを備えることを特徴とする。
【0010】
この発明の圧縮符号化データは、コードブックを用いて圧縮対象となる信号をベクトル量子化することによって得る。コードブックを用いるベクトル量子化手法には、TwinVQがある。TwinVQは、圧縮対象となる音響信号等を一定区間毎に切り出してインターリーブすることによって複数のターゲットベクトルを作成し、このターゲットベクトルに最も近いパターンベクトルをコードブックから選択してそのコードを伝送するようにしたものである。復号時(デコード時)には、上記と同じコードブックを用いることによってコードに対応するターゲットベクトルを復元しDACを通すことによって元の信号を得る。ベクトル量子化データ記憶手段は、このようにしてベクトル量子化された圧縮符号化データを記憶するものであって、CD−ROM等の記憶媒体やインターネットあるいはISDNなどの通信ラインを介して得られる。デコード手段は、上記ベクトル量子化データを復号する時に、最初にヘッダを受信してデコードパラータを一時的に記憶しておく。その後、ベクトル量子化データの任意のフレームから受信して、一時記憶しているデコードパラメータに基づいてデコード(復号)する。この発明では、ヘッダと圧縮符号化データとを別々に取り扱うと共に、圧縮符号化データを一定のフレーム毎に分割しているから、最初に1度デコードパラメータを受けておくことによって、その後、任意のフレーム位置から圧縮符号化データの複合を可能とするものである。したがって、一旦ヘッダを受信してデコードパラメータを解釈して記憶しておけば、その後、圧縮符号化データの最初のフレームからはもちろん、途中のフレームからも復号化ができ、また、途中フレームから復号した後、任意のフレーム位置にジャンプして復号することも可能である。
【0011】
なお、デコードパラメータは、サンプルレートとビットレートで構成される。ベクトル量子化手法によっては、これ以外の情報を含むことも可能である。要するに、ヘッダには、圧縮符号化データを復号するために必要な情報がすべて含まれていればよい。
【0012】
請求項3の発明は、上記圧縮符号化データの復号装置が用いられ、楽音トラックなどのシーケンスデータをシーケンサ部により再生するカラオケ装置であって、
前記ベクトル量子化データ記憶手段は、デコードパラメータを含むヘッダと、ベクトル量子化されてフレーム分割された音響シーケンスデータを記憶し、
前記デコード手段は、カラオケ再生前にヘッダのデコードパラメータを獲得して前記デコードパラメータ記憶手段に記憶し、カラオケ再生時に音響シーケンスデータの中のシーケンサ部で指定された任意のフレームから前記デコードパラメータに基づいて再生することを特徴とする。
この発明は、上記圧縮符号化データの復号装置を用いたカラオケ装置において、圧縮符号化の対象を音声や楽器音などを含む音響のシーケンスデータとしたものである。そして、カラオケ再生前にヘッダのデコードパラメータを獲得しておいて、カラオケ再生時に音響シーケンスデータの中のシーケンサ部で指定された任意のフレームからデコードパラメータに基づいて再生する。
【0013】
例えば、このカラオケ装置に早送りと巻き戻しを指定する手段をリモコン装置等に設けることによって、早送りや巻き戻しが指定された時、シーケンサ部は早送りや巻き戻しの量に基づいて音響シーケンスデータの中の途中フレームを指定する。この時、事前にデコードパラメータが獲得できているために、指定された途中フレームから直接再生することが可能になる。また、複数の楽曲データによるメドレー演奏を指定する手段を備えることによって、最初にデコードパラメータが獲得されているために、メドレー曲の2曲目以降を再生する時には、その2曲目以降の音響シーケンスデータの中のメドレー部分の途中フレームを直接指定することができる。
【0014】
【発明の実施の形態】
図1は、この発明の実施形態であるカラオケ装置の概略構成図である。このカラオケ装置は、ハードディスク12及びDVD(デジタル・ビデオ・ディスク)40にカラオケ曲演奏用の楽曲データや背景映像用の動画データを記憶しており、利用者がリモコン装置3を用いて曲番号を入力すると、その曲番号の楽曲データを読み出してカラオケ曲を演奏する。リモコン装置は早送りキー3a、巻き戻しキー3b、一時停止キー3cを備え、これらのキーをオンすることによって、演奏中のカラオケ曲を早送り、巻き戻し、一時停止させることができる。
【0015】
このカラオケシステムは、カラオケ装置本体1のほか、コントロールアンプ2、リモコン装置3、DVDチャンジャ4、スピーカ5、モニタ6、マイク7及び音響データ処理部8で構成されている。
【0016】
カラオケ装置本体1は、システム全体の動作を制御する制御部10、カラオケ演奏を実行するシーケンサ11、楽曲データなど記憶したハードディスク(HDD)12、リモコン装置3が発信する赤外線信号を受信してデコードするリモコン受信部13、楽曲データに基づいて楽音を発生する音源装置14、歌詞の文字パターンなど展開するパターン展開部16及び歌詞や背景映像などの表示を制御する表示制御部17を備えている。
【0017】
音響データ処理部8は、MIDIデータでは再生できないような音声や、楽器音などの音響信号を処理する。このカラオケ装置では、ハードディスク12に記憶されている楽曲データに含まれる音響制御トラックで指定されるTwinVQデータファイルのTwinVQデータが入力する。音響データ処理部8では、このTwinVQデータをデコードして、DA変換した後コントロールアンプ2に出力する。
【0018】
音源装置14が発生した楽音及び音響データ処理部8で復号したコーラス音等の音声や楽器音等はコントロールアンプ2に入力する。コントロールアンプ2は、これらの楽音信号、音声信号、楽器音信号及びマイク7からの歌唱音声信号等をミキシングして効果を付与してスピーカ5に出力する。
【0019】
DVDチェンジャ4は複数枚のDVD40のいずれかを選択して読出・再生する。DVDにはMPEG圧縮された動画背景映像が記憶されている。背景映像には、特定のカラオケ曲に個別に対応する個別背景映像やカラオケ曲の種別(例えばジャンル)毎に設けられた汎用の背景映像などがある。このDVDチェンジャ4及びパターン展開部16は、表示制御部17に接続されている。表示制御部17はDVDチャンジャ4から入力される背景映像の上にパターン展開部16が展開した文字パターンなどをスーパーインポーズ合成しモニタ6に表示する。
【0020】
ハードディスクディスク12には多数のカラオケ曲の楽曲データが記憶されているほか、静止画像データ等も記憶されている。
【0021】
なお、図1の機能ブロック図で示したカラオケ装置は、CPUを含むコンピュータシステムで構成され、シーケンサ11やパターン展開部16はソフト的に実現される。
【0022】
図2は、ハードディスクディスク12やDVD40に記憶されている楽曲データの構成を示す図である。このカラオケ装置では、楽曲データは、ヘッダ、トラック群、音響データ部で構成されている。前述のように、音響データは、TwinVQデータからなる。ヘッダには、曲番号、タイトルなどの書誌データや、圧縮符号化データであるTwinVQデータのデコードパラメータが書き込まれている。トラック群は、音源装置14を制御する楽音トラックのほか、パターン展開部16が文字パターンに展開する歌詞データが書き込まれた歌詞トラック、フレーズ毎に分割された音響データをどのタイミングで再生するかを制御する音響制御トラック、音源装置14やコントロールアンプ2のエフェクト
(効果)を制御する効果制御トラックなどで構成されている。
【0023】
楽音トラックは、ノートイベントデータや設定データなどのイベントデータと各イベントデータの読み出しタイミングを示すタイミングデータを時系列に配列して構成されている。タイミングデータは、各イベントデータ間の時間的間隔を示すデュレーションや、曲がスタートしてから各イベントデータが発生するまでの絶対時間などのデータで記述される。シーケンサ11は、タイミングデータで指示されるタイミングにイベントデータを読み出して音源装置14に入力する。音源装置14は、入力されたイベントデータに応じて楽音を発生する。
【0024】
音響制御トラックは、イベントデータであるTwinVQデータ番号と各イベントデータの読み出しタイミングを示すタイミングデータを時系列に配列して構成される。シーケンサ11は、タイミングデータで指定されるタイミングにTwinVQデータ番号を読み出し、この番号で指定されるTwinVQデータをファイルから読み出し、このデータ内の該当するデータフレームから音響データ処理部8に出力する。なお、後述のように実際にはシーケンサ11は、TwinVQのフレームを指定し、そのフレームに対応するデータが音響データ処理部8に出力される。
【0025】
歌詞トラック、効果制御トラックについても上記楽音トラックや音響制御トラックと同様に、イベントデータと各イベントデータの読み出しタイミングを示すタイミングデータを時系列に配列して構成される。
【0026】
リモコン3は、上述のように早送りキー3a、巻き戻しキー3b、一時停止キー3cを備えており、このキーが操作されることによって演奏中のカラオケ曲の早送りや巻き戻しが可能になる。すなわち、カラオケ曲が演奏されている時に、早送りキー3aを操作すると、その操作されている間カラオケ曲の早送りが行われる。カラオケ曲の早送りとは、シーケンサ11での正方向(時間経過方向)への歩進スピードを速めることである。また、巻き戻しキー3bが操作されると、その操作されている間カラオケ曲の巻き戻しが行われる。カラオケ曲の巻き戻しとは、シーケンサ11での歩進方向を逆方向にすると共にその歩進スピードを通常の歩進スピードよりも速めることである。図3に、シーケンサ11での歩進動作を示す。ポインタPはシーケンサ11で現在処理しているトラック上の位置を示すものであって、通常のカラオケ曲の再生時には一定のスピードで右方向(時間経過方向)に歩進している。今カラオケ曲が再生されている状態で位置a1で早送りキー3aが操作されると、ポインタPが早送り用に設定された歩進スピードで右方向に進む。ポインタPが位置a2に達した時に早送りキー3aが離されると、この位置a2から通常の歩進スピードでのカラオケ曲の再生が再開される。また、ポインタPが位置a3の位置に達した時に巻き戻しキーが操作されると、巻き戻し用に設定された歩進スピードで左方向(時間経過と逆方向)に進んでいく。ポインタPが位置a4に達した時に巻き戻しキー3bが離されると、この時から再び右方向に通常のスピードでポインタPが歩進していく。すなわち、通常のカラオケ曲の再生が再開される。このように、早送りキー3aと巻き戻しキー3bのいずれかが操作された時には、シーケンサ11での歩進スピード及び歩進方向を制御することによってポインタPの位置を先の任意の位置に進めたり元の任意の位置に戻したりすることが自由にできる。
【0027】
早送りや巻き戻しの時に、各トラックの再生をその時の歩進スピードに合わせて行うことも可能であるが、巻き戻しの場合にはイベントデータの解釈を逆にするなどの制御が必要になってくる。例えば、楽音トラックではノートオンのイベントデータの時にはノートオフを実行し、ノートオフのイベントデータの時にはノートオンを実行することが必要である。音響制御トラックについては、この実施形態では早送り時巻き戻し時共に再生をしない。別途、「キュルキュルキュル」のような擬似音を出すことも可能である。
【0028】
図4は、TwinVQの作成部の機能ブロック図である。このTwinVQデータは図外のCD−ROMやISDN通信回線によって楽曲データの一部として送られ、ハードディスク12等に記憶される。したがって、TwinVQデータ自体はカラオケ装置で作成されるものではなく楽曲データの一部としてインプリメントされるものである。図4に示すようにTwinVQデータの作成においては、対象となる音響信号をデジタル化したものをまずメモリ50に展開し、制御部51の制御によって、ベクトル量子化部52において所定のサンプリングレート及びビットレートに基づいてベクトル量子化された圧縮符号化データ、すなわちTwinVQフレームデータを生成する。ベクトル量子化にはコードブック53を用いる。前述のように、TwinVQフレームデータを得るためのベクトル量子化は以下のようにして行う。すなわち、メモリ50に記憶されている音響データを一定区間毎に切り出してインターリーブし、複数のターゲットベクトルを作成すると共に、この各ターゲットベクトルに対し、コードブック53を参照して最も近いパターンベクトルを選ぶ。その時のコードをTwinVQフレームデータとして出力する。なお、TwinVQフレームデータはフレーム化されたものとなる。また、この実施形態では、フレームの大きさがバイト単位となるように、ビットレート等から決定されるフレーム長に無効ビットを加える(padding処理)ようにしている。バイト単位でフレーム長を扱えるようにすることで、デコード時に途中フレームから再生開始するときフレーム指定が容易になる。また、デコードのためにこの時に用いたサンプリングレート及びビットレートをデコードパラメータとして出力する。デコードパラメータは楽曲データのヘッダ部に挿入され、ベクトル量子化されたTwinVQフレームデータは音響データとして用いられる。
【0029】
図5は、TwinVQデータを復号化するための音響データ処理部の機能ブロック図である。シーケンサ11からはデコードパラメータやTwinVQフレームデータが送られてきて、デコードパラメータの場合にはメモリ60に一時的に記憶される。また、TwinVQフレームデータの時にはベクトル逆量子化部61において逆量子化を行うことによって復号化が行われる。すなわち、TwinVQデータを作成する時に使用したコードブック53と同じコードブック62を用いることによってベクトル逆量子化部61で元の信号に復号化することができる。63は、これらの制御を行う部分であって、DAC64は、復号化されたデータをアナログ信号に変換してコントロールアンプ2に出力する信号を作成する。
【0030】
音響データ処理部8では、シーケンサ11から、カラオケ曲再生前にデコードパラメータ、すなわちサンプリングレートとビットレートを含むデータ(図2の楽曲データのヘッダ部に含まれている)を受信してメモリ60に記憶しておく。この状態で、シーケンサ11から送られてくるTwinVQフレームデータを該デコードパラメータに基づいて復号化する。メモリ60に、デコードパラメータが一旦記憶されると、その後、早送りや巻き戻しなどによって、音響制御トラック上のポインタPの位置が変わっても、その位置に対応するフレームデータから復号化することができる。すなわち、ポインタPの位置が変わった時に、もう一度ヘッダ部から受信する必要がない。
【0031】
図6は、TwinVQデータの構成を示し、早送り及び巻き戻しが行われた時のデータフレームの再生例を示している。最初にヘッダ部のサンプリングレートとビットレートがメモリ60に一旦記憶された後、データフレームの1番から2番まで再生され、早送りキーがデータフレームi−1の所まで押されると、続いてデータフレームiの再生が行われ、同フレームiの再生が終わった時に巻き戻しキー3bがデータフレーム2の最初の位置まで操作されると再びデータフレーム2からの再生がスタートする。なお、早送りキーや巻き戻しキーの操作終了位置があるフレームの中途であれば、その次に再生開始となるフレーム番号は当該フレームの次のフレームからとなる。このように、一旦ヘッダのサンプリングレートとビットレートが音響データ処理部8に送られていれば、以後早送りキー3aや巻き戻しキー3bが操作されても、操作終了時点から直ちに音響データの再生が可能となる。なお、早送りや巻戻しのときに、再生開始フレームは、トラックのデュレーションデータとイベントが指定するTwinVQデータの1フレーム時間に基づいて計算する。すなわち、早送りキーや巻戻しキーの操作された時間分ポインタを移動させるとき、ポインタはシーケンストラック上と1ファイルのTwinVQデータ上を移動させ、その移動合計がキー操作時間となるように制御する。
【0032】
図7は、上記カラオケ装置の一部動作を示すフローチャートである。特に、このフローチャートではリモコン3の早送りキー3aや巻き戻しキー3bがカラオケ演奏中に操作された時の音響データの制御について示している。
【0033】
カラオケ演奏の初期設定を行うタイミングでは(n1)、音源装置14や表示制御部17等の初期設定のほか、音響データ処理部8に対してサンプリングレート及びビットレートを含むデコードパラメータを送る。これらのデータは、音響データ処理部8においてメモリ60に記憶される。
【0034】
カラオケ演奏が始まると、シーケンサ11は再生モードとなって(n2)、各トラックのシーケンス処理を行う(n3)。カラオケ演奏中にリモコンキー3によって早送りキー3aが操作されると(n4)、早送りが停止されるまでポインタPの歩進速度をN倍にして歩進する(n6)。早送りが停止した時にn7に進んでその時にポインタが指定しているデータフレームをスタート位置とする。また、巻き戻しキー3bが操作されると(n8)、巻き戻しが停止するまでポインタPのN倍の速度で逆歩進が行われ(n10)、巻き戻しが停止した時にn11に進み、その時のポインタで指定しているデータフレームをスタート位置として設定する。
【0035】
以上の動作によって、最初の初期設定の段階でデコードパラメータが音響データ処理部8に記憶されるために、早送りキーや巻き戻しキーが操作された時には最初からデータを再送しなくても所望のデータ再生を直ちに行うことができる。なお、以上の実施形態では早送りキーと巻き戻しキーが操作された時についての構成と動作を示したが、カラオケ装置において、複数の楽曲のメドレー演奏が指定された時にも各楽曲の音響データについては途中フレームから再生することができる。例えば、図8に示すように楽曲1の音響データについてはデータフレーム1、2を再生し、楽曲2についてはデータフレーム2、3を、楽曲3についてもデータフレーム2、3を再生する場合、楽曲1のヘッダのサンプリングレート及びビットレートを音響データ処理部のメモリ60に記憶しておくことによって、楽曲2ではヘッダを読み直さなくても、データフレーム2から直ちに再生をすることができ、また、楽曲3においてもデータフレーム2から直ちに再生を開始することができる。この場合各楽曲の音響データはすべて同じコードブックを用いて且つ同じサンプリングレートとビットレートを用いて量子化されていることが前提である。
【0036】
【発明の効果】
請求項1の発明によれば、初めにデコードパラメータを受信しているために、任意のフレームから再生することができ、圧縮符号化データの種々の応用的な利用が可能となる。
【0037】
また、この圧縮符号化データ復号装置をカラオケ装置に採用することよって、音声や楽器音などMIDIでは処理のできない音響シーケンスデータを途中から再生したりすることが自由にできる。例えば、早送り機能と巻き戻し機能を採用したカラオケ装置では、早送りした位置または巻き戻しした位置から直ちに音響シーケンスデータの再生を行うことができ、また、メドレー演奏機能を採用したカラオケ装置では、2曲目以降のメドレー曲の音響シーケンスデータを途中フレームから直ちに再生することができる。
【図面の簡単な説明】
【図1】この発明の実施形態であるカラオケ装置の機能ブロック図
【図2】楽曲データの構成図
【図3】シーケンサの保進動作を示す図
【図4】TwinVQデータの作成部の機能ブロック図
【図5】音響データ処理部の機能ブロック図
【図6】TwinVQデータの構成を示す図
【図7】カラオケ装置の一部動作を示すフローチャート
【図8】メドレー演奏時のTwinVQデータ処理法を示す図
【図9】従来の圧縮符号化データの構成例[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a compression-encoded audio data decoding apparatus and a karaoke apparatus using the same, and more particularly to an apparatus that compresses and encodes audio data such as audio data by a vector quantization method.
[0002]
[Prior art]
A vector quantization method has been proposed as a technique for compressing and encoding an acoustic signal such as an audio signal with high efficiency. For example, a vector quantization method called TwinVQ (Transform-domain Weighted Interleave Vector Quantization developed by NTT) cuts out a signal to be compressed and encoded in a certain interval. Each information pattern is interleaved to create a plurality of target vectors, and a code book search is performed on the target vectors to transmit the index of the nearest pattern vector. At the time of decoding, the original signal is restored using the same codebook used at the time of compression. In this vector quantization method, the code obtained by codebook search is used as a compression code, so the compression rate can be increased while maintaining a high sound quality level, and a fixed-length frame method that cuts out a signal in a certain interval is used. Because it is adopted, it is strong against code errors. Therefore, a compression coding method based on a vector quantization method typified by TwinVQ is used particularly for compression of an acoustic signal such as a music signal or a voice signal.
[0003]
Note that a compression coding method that performs vector quantization using a codebook is disclosed in, for example, Japanese Patent Laid-Open No. 10-112657.
[0004]
Conventionally, the data obtained by the above-described compression coding method is composed of a
[0005]
At the time of decoding, first, the
[0006]
[Problems to be solved by the invention]
However, in the conventional decoding device, the
[0007]
An object of the present invention is to provide a compression-encoded data decoding apparatus capable of decoding from an arbitrary position of compression-encoded data.
[0008]
Another object of the present invention is to provide a karaoke apparatus that facilitates an applied operation of a voice signal, a musical instrument sound signal, or the like that MIDI is not good at by adopting the decoding device.
[0009]
[Means for Solving the Problems]
According to the first aspect of the present invention, a header including a decoding parameter for decoding compression-encoded data vector-quantized using a codebook, and the compressed-encoded data are stored in a state of being divided into fixed frames. A vector quantized data storage means; and a decoding means for reproducing the compressed encoded data stored in the vector quantized data storage means,
The decoding means includes
Decode parameter storage means for receiving and temporarily storing the decode parameter included in the header from the vector quantized data storage means when reproducing the compressed encoded data stored in the vector quantized data storage means And receiving the compressed encoded data stored in the vector quantized data storage means from the intermediate frame in a state where the decode parameters are stored in the decode parameter storage means, and receiving the received data And a playback unit for playing back based on the decode parameters stored in the decode parameter storage means .
[0010]
The compression-coded data of the present invention is obtained by vector quantization of a signal to be compressed using a code book. There is TwinVQ as a vector quantization method using a codebook. TwinVQ creates a plurality of target vectors by cutting out and compressing an acoustic signal or the like to be compressed at fixed intervals, selects a pattern vector closest to the target vector from the codebook, and transmits the code. It is a thing. At the time of decoding (decoding), the same signal as above is used to restore the target vector corresponding to the code, and the original signal is obtained by passing through the DAC. The vector quantized data storage means stores the compressed encoded data that has been vector quantized in this way, and is obtained via a storage medium such as a CD-ROM, or a communication line such as the Internet or ISDN. When decoding the vector quantized data, the decoding means first receives the header and temporarily stores the decoding parameters. Thereafter, it is received from an arbitrary frame of vector quantized data, and is decoded (decoded) based on the temporarily stored decoding parameters. In the present invention, the header and the compression encoded data are handled separately, and the compression encoded data is divided into fixed frames. It enables compression-coded data to be combined from the frame position. Therefore, once the header is received and the decoding parameters are interpreted and stored, it is possible to decode not only from the first frame of the compressed encoded data but also from the intermediate frame, and from the intermediate frame. After that, it is possible to jump to an arbitrary frame position for decoding.
[0011]
Note that the decode parameter is composed of a sample rate and a bit rate. Depending on the vector quantization method, other information may be included. In short, the header only needs to include all information necessary for decoding the compression-encoded data.
[0012]
The invention of claim 3 is a karaoke apparatus in which the compression-encoded data decoding device is used, and sequence data such as a musical sound track is reproduced by a sequencer unit.
The vector quantized data storage means stores a header including decoding parameters, and acoustic sequence data that has been vector quantized and divided into frames,
The decoding means acquires a decoding parameter of a header before karaoke reproduction and stores it in the decoding parameter storage means, and based on the decoding parameter from an arbitrary frame designated by a sequencer unit in acoustic sequence data at the time of karaoke reproduction And playing.
According to the present invention, in a karaoke apparatus using the above-described decoding apparatus for compression-encoded data, the object of compression-encoding is acoustic sequence data including voices, instrument sounds, and the like. Then, the header decoding parameters are acquired before karaoke reproduction, and reproduction is performed based on the decoding parameters from an arbitrary frame designated by the sequencer unit in the acoustic sequence data during karaoke reproduction.
[0013]
For example, by providing the karaoke device with a means for specifying fast forward and rewind in the remote control device or the like, when the fast forward or rewind is designated, the sequencer unit includes the acoustic sequence data based on the amount of fast forward or rewind. Specify a frame in the middle of. At this time, since the decoding parameters can be acquired in advance, it is possible to directly reproduce from the designated intermediate frame. In addition, since the decoding parameter is first acquired by providing means for designating a medley performance by a plurality of music data, when reproducing the second and subsequent music of the medley music, the acoustic sequence data of the second and subsequent music You can directly specify the middle frame of the medley part.
[0014]
DETAILED DESCRIPTION OF THE INVENTION
FIG. 1 is a schematic configuration diagram of a karaoke apparatus according to an embodiment of the present invention. In this karaoke device, song data for karaoke song performance and moving image data for background video are stored in a
[0015]
The karaoke system includes a karaoke device
[0016]
The
[0017]
The sound
[0018]
The musical sound generated by the
[0019]
The DVD changer 4 selects and reads / reproduces one of the plurality of
[0020]
The
[0021]
The karaoke apparatus shown in the functional block diagram of FIG. 1 is configured by a computer system including a CPU, and the
[0022]
FIG. 2 is a diagram showing the composition of music data stored in the
[0023]
The musical sound track is configured by arranging event data such as note event data and setting data and timing data indicating the read timing of each event data in time series. The timing data is described by data such as a duration indicating a time interval between the event data and an absolute time from when the music starts to when each event data is generated. The
[0024]
The acoustic control track is configured by arranging, in time series, TwinVQ data numbers that are event data and timing data indicating the read timing of each event data. The
[0025]
The lyrics track and the effect control track are configured by arranging event data and timing data indicating the read timing of each event data in chronological order, similarly to the musical tone track and the sound control track.
[0026]
As described above, the remote controller 3 includes the fast forward key 3a, the rewind key 3b, and the pause key 3c. By operating these keys, the karaoke song being played can be fast forwarded or rewinded. That is, when the fast-forward key 3a is operated while a karaoke song is being played, the karaoke song is fast-forwarded while the karaoke song is being operated. The fast-forwarding of the karaoke song is to increase the stepping speed in the forward direction (time passage direction) in the
[0027]
When fast-forwarding or rewinding, it is possible to play back each track according to the stepping speed at that time, but in the case of rewinding, control such as reversing the interpretation of the event data is necessary. come. For example, in a musical tone track, it is necessary to execute note-off for note-on event data and to execute note-on for note-off event data. In this embodiment, the acoustic control track is not reproduced at the time of fast-forwarding and rewinding. Separately, it is also possible to make a pseudo sound such as “Kyurukurukuru”.
[0028]
FIG. 4 is a functional block diagram of the TwinVQ creation unit. The TwinVQ data is sent as a part of music data by a CD-ROM or ISDN communication line (not shown) and stored in the
[0029]
FIG. 5 is a functional block diagram of an acoustic data processing unit for decoding TwinVQ data. Decode parameters and TwinVQ frame data are sent from the
[0030]
The acoustic
[0031]
FIG. 6 shows the structure of TwinVQ data and shows an example of data frame reproduction when fast forward and rewind are performed. First, the sampling rate and bit rate of the header part are temporarily stored in the
[0032]
FIG. 7 is a flowchart showing a partial operation of the karaoke apparatus. In particular, this flowchart shows control of acoustic data when the fast-forward key 3a and the rewind key 3b of the remote controller 3 are operated during a karaoke performance.
[0033]
At the timing of initial setting of the karaoke performance (n1), in addition to the initial settings of the
[0034]
When the karaoke performance starts, the
[0035]
With the above operation, since the decoding parameters are stored in the acoustic
[0036]
【The invention's effect】
According to the first aspect of the present invention, since the decoding parameter is received first, it can be reproduced from an arbitrary frame, and various applied uses of the compression-encoded data are possible.
[0037]
Further, by adopting this compression-encoded data decoding apparatus in a karaoke apparatus, it is possible to freely reproduce sound sequence data such as voice and musical instrument sound that cannot be processed by MIDI from the middle. For example, in a karaoke device that employs a fast-forward function and a rewind function, the acoustic sequence data can be immediately reproduced from the fast-forward position or the rewind position, and in the karaoke device that employs a medley performance function, The subsequent medley music sequence data can be reproduced immediately from the middle frame.
[Brief description of the drawings]
FIG. 1 is a functional block diagram of a karaoke apparatus according to an embodiment of the present invention. FIG. 2 is a block diagram of music data. FIG. 3 is a diagram showing a storage operation of a sequencer. FIG. 5 is a functional block diagram of an acoustic data processing unit. FIG. 6 is a diagram showing a configuration of TwinVQ data. FIG. 7 is a flowchart showing a partial operation of a karaoke apparatus. FIG. 8 is a TwinVQ data processing method during medley performance. FIG. 9 shows a configuration example of conventional compression-encoded data.
Claims (5)
前記デコード手段は、
前記ベクトル量子化データ記憶手段に記憶されている圧縮符号化データを再生するときに、該ベクトル量子化データ記憶手段から前記ヘッダに含まれるデコードパラメータを受信して一時的に記憶するデコードパラメータ記憶手段と、前記デコードパラメータ記憶手段に前記デコードパラメータが記憶されている状態で、前記ベクトル量子化データ記憶手段に記憶されている圧縮符号化データをその途中のフレームから受信して該受信したデータを前記デコードパラメータ記憶手段に記憶されているデコードパラメータに基づいて再生する再生部とを備えることを特徴とする、圧縮符号化データの復号装置。A header including a decoding parameter for decoding the compression-encoded data vector-quantized using the codebook, and vector-quantized data storage means for storing the compressed-encoded data in a state of being divided into predetermined frames; A decoding means for reproducing the compressed encoded data stored in the vector quantized data storage means,
The decoding means includes
Decode parameter storage means for receiving and temporarily storing the decode parameter included in the header from the vector quantized data storage means when reproducing the compressed encoded data stored in the vector quantized data storage means And receiving the compressed encoded data stored in the vector quantized data storage means from the intermediate frame in a state where the decode parameters are stored in the decode parameter storage means, and receiving the received data A decoding device for compression-encoded data, comprising: a reproduction unit that reproduces data based on the decode parameter stored in the decode parameter storage means .
前記ベクトル量子化データ記憶手段は、デコードパラメータを含むヘッダと、ベクトル量子化されてフレーム分割された音響シーケンスデータを記憶し、
前記デコード手段は、カラオケ再生前にヘッダのデコードパラメータを獲得して前記デコードパラメータ記憶手段に記憶し、カラオケ再生時に音響シーケンスデータの中のシーケンサ部で指定された途中のフレームから前記デコードパラメータに基づいて再生することを特徴とする、カラオケ装置。A karaoke device that uses the decoding device for compression-encoded data according to claim 1 or 2 and reproduces sequence data such as a musical sound track by a sequencer unit,
The vector quantized data storage means stores a header including decoding parameters, and acoustic sequence data that has been vector quantized and divided into frames,
The decoding means acquires a decoding parameter of a header before karaoke reproduction and stores it in the decoding parameter storage means, and based on the decoding parameter from a frame in the middle designated by a sequencer unit in acoustic sequence data at the time of karaoke reproduction A karaoke device characterized by being played back.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26757798A JP4193240B2 (en) | 1998-09-22 | 1998-09-22 | Compressed encoded data decoding apparatus and karaoke apparatus using the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26757798A JP4193240B2 (en) | 1998-09-22 | 1998-09-22 | Compressed encoded data decoding apparatus and karaoke apparatus using the same |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000099091A JP2000099091A (en) | 2000-04-07 |
JP4193240B2 true JP4193240B2 (en) | 2008-12-10 |
Family
ID=17446721
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26757798A Expired - Fee Related JP4193240B2 (en) | 1998-09-22 | 1998-09-22 | Compressed encoded data decoding apparatus and karaoke apparatus using the same |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4193240B2 (en) |
-
1998
- 1998-09-22 JP JP26757798A patent/JP4193240B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000099091A (en) | 2000-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2003248479A (en) | Multimedia information encoding device, multimedia information reproducing device, multimedia information encoding processing program, multimedia information reproduction processing program, and multimedia encoding data | |
JP4174940B2 (en) | Karaoke equipment | |
WO1999040566A1 (en) | Method and apparatus for digital signal processing, method and apparatus for generating control data, and medium for recording program | |
JPH07140991A (en) | 'karaoke' device | |
JPH04339000A (en) | Music reproduction device | |
JP4649901B2 (en) | Method and apparatus for coded transmission of songs | |
KR100324746B1 (en) | Digital data player capable of voice hearing | |
JP3968206B2 (en) | Playback device | |
JP4193240B2 (en) | Compressed encoded data decoding apparatus and karaoke apparatus using the same | |
JP4542805B2 (en) | Variable speed reproduction method and apparatus, and program | |
JP4739598B2 (en) | Music data playback device | |
JP4016665B2 (en) | VIDEO REPRODUCTION DEVICE AND VIDEO REPRODUCTION DEVICE CONTROL METHOD | |
JP3320056B2 (en) | Karaoke video playback device | |
JPH09134188A (en) | Singing voice synthesizer and musical tone reproducing device | |
JP3867695B2 (en) | Image playback device | |
JP2000195234A (en) | Reproducing device and method | |
JP2005107285A (en) | Musical piece reproducing apparatus | |
JP4570026B2 (en) | How to embed digital watermark | |
JP4665550B2 (en) | Playback apparatus and playback method | |
JPH1152964A (en) | Karaoke device | |
JP3035948B2 (en) | Audio data playback method | |
JP2005223939A (en) | Video reproducing apparatus | |
JP4419432B2 (en) | Karaoke equipment | |
JP4060278B2 (en) | Karaoke equipment | |
JPH09127959A (en) | Cd karaoke system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041224 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070404 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080902 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080915 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111003 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111003 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121003 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121003 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131003 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |