JPH1011100A - 音声発音装置 - Google Patents

音声発音装置

Info

Publication number
JPH1011100A
JPH1011100A JP8178535A JP17853596A JPH1011100A JP H1011100 A JPH1011100 A JP H1011100A JP 8178535 A JP8178535 A JP 8178535A JP 17853596 A JP17853596 A JP 17853596A JP H1011100 A JPH1011100 A JP H1011100A
Authority
JP
Japan
Prior art keywords
data
decoding
adpcm
sound
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8178535A
Other languages
English (en)
Inventor
保夫 ▲蔭▼山
Yasuo Kageyama
Shinji Hizuka
真二 肥塚
Yuji Senba
祐二 仙場
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP8178535A priority Critical patent/JPH1011100A/ja
Priority to US08/877,169 priority patent/US5974387A/en
Priority to CN200410007331.4A priority patent/CN1259649C/zh
Priority to CN97113802.8A priority patent/CN1240045C/zh
Publication of JPH1011100A publication Critical patent/JPH1011100A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 伝送路などを介して音声データを伝送する
際、すなわち非リアルタイム音声データ転送の際に、そ
のデータ転送時間を大幅に短縮化できるようにする。 【解決手段】 音声波形データはベクトル量子化技術に
よって音声スペクトルパターンを特定するインデックス
情報とスペクトル包絡に関する補助情報とからなるデー
タに圧縮され、MIDI規格に準拠したデータと共に楽
曲データを構成し、伝送路を介して送信される。カラオ
ケ装置はこの楽曲データを取り込み、インデックス情報
を音声スペクトルパターンに変換し、変換された音声ス
ペクトルパターンと補助情報とに基づいて音声波形デー
タを復号化する。そして、復号化された音声波形データ
をADPCMデータ圧縮技術によって再び圧縮する。音
声発音装置としてのカラオケ装置は、このADPCMデ
ータ圧縮手段によって圧縮された音声波形データと楽曲
データとに基づいてカラオケ演奏を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、圧縮された音声
データを音声信号に復号して発音する音声発音装置に係
り、特にリアルタイムに発音が要求されるリアルタイム
音声データ転送とリアルタイムには発音が要求されない
非リアルタイム音声データ転送において、音声データの
圧縮方法を変更した音声発音装置に関する。
【0002】
【従来の技術】この明細書中では、音声データを復号し
て音声を発音する音声発音装置の一例として、カラオケ
装置を例に説明する。最も単純なカラオケ装置は、楽曲
をアナログ信号として記録したテープを再生することに
よって楽曲を再生するものであったが、電子技術の発達
に伴って、テープがCD(Compact Disk)
やLD(Laser Disk)に代わり、記録される
信号もアナログ信号からディジタル信号に代わり、それ
らに記録されるデータも楽曲データだけでなく映像デー
タや歌詞データなどの種々の情報が付加されるようにな
ってきた。そして、最近では、CDやLDに代えて、通
信回線(一般の電話回線やISDN回線)を介して楽曲
データを取り込み、それを音源とシーケンサを用いて演
奏する通信型のカラオケ装置が急速に普及してきた。こ
の通信型のカラオケ装置には、再生する楽曲データをそ
の都度通信回線を介して取り込んで再生する非蓄積型の
ものと、取り込んだ楽曲データを内蔵の記憶装置(ハー
ドディスクなど)に蓄積しておき、必要な時に読み出し
て再生する蓄積型とがある。現在では通信コストの点か
ら、蓄積型のカラオケ装置が主流になっている。このよ
うな通信型のカラオケ装置には、通信時間(通信コス
ト)や記憶容量を極力低く抑えるために、1曲当たりの
楽曲データのデータ量を少なくするために最新のデータ
圧縮方法や通信方法が導入されている。例えば、楽曲デ
ータとして、CDやLDに記録されていたディジタルデ
ータをそのまま使用して通信していたのでは、通信時間
や通信コストの点から通信型のカラオケ装置は成り立た
ない。そこで、通信型のカラオケ装置は、楽曲データの
中の演奏に関するデータや歌詞に関するデータなどをM
IDI(MusicalInstrument Dig
ital Interface)規格に準拠したデータ
(以下「MIDIデータ」という)に符号化し、このM
IDIデータに符号化することのできない音声データな
どをADPCM(Adaptive Differen
tial Pulse Code Modulatio
n)データに符号化することによって、1曲当たりの楽
曲データのデータ量を少なくして通信を行っていた。
【0003】
【発明が解決しようとする課題】ところが、ADPCM
データは、圧縮してあるとはいっても、MIDIデータ
に比べるとそのデータ量が比較的大きいため、蓄積型の
カラオケ装置の記憶装置内の大半(約3分の2程度)を
占有し、カラオケ装置内に蓄積可能な楽曲データの数を
制限する要因の一つとなっていた。また、これは、楽曲
データを通信する場合の通信時間(通信コスト)の短縮
化を制限する要因でもあった。この発明は上述の点に鑑
みてなされたものであり、伝送路などを介して音声デー
タを伝送する際、すなわち非リアルタイム音声データ転
送の際に、そのデータ転送時間を大幅に短縮化すること
のできる音声発音装置を提供することを目的とする。
【0004】
【課題を解決するための手段】第1の発明に係る音声発
音装置は、第2のデータ圧縮方法よりも高い圧縮率でデ
ータを圧縮することのできる第1のデータ圧縮方法によ
って圧縮された音声データを取り込む手段と、取り込ま
れた音声データを前記第1のデータ圧縮方法によって復
号する第1の復号化手段と、前記第1の復号化手段によ
って復号化された音声データを前記第2のデータ圧縮方
法によって再び圧縮して出力する第2のデータ圧縮手段
と、この第2のデータ圧縮手段によって圧縮された音声
データを前記第2のデータ圧縮方法によって復号する第
2の復号化手段と、前記第2の復号化手段によって復号
化された音声信号を発音処理する発音処理手段とを備え
たものである。第2の発明に係る音声発音装置は、ベク
トル量子化技術によって音声スペクトルパターンを特定
するインデックス情報とスペクトル包絡に関する補助情
報とにデータ圧縮された音声データを取り込む手段と、
前記インデックス情報を音声スペクトルパターンに変換
する変換テーブル手段と、前記変換テーブル手段によっ
て変換された前記音声スペクトルパターンと前記補助情
報とに基づいて音声データを復号する復号化手段と、前
記復号化手段によって復号化された音声データをADP
CMデータ圧縮技術によって再び圧縮して出力するAD
PCMデータ圧縮手段と、このADPCMデータ圧縮手
段によって圧縮された音声データに基づいて発音処理す
る発音処理手段とを備えたものである。
【0005】従来の音声発音装置としてのカラオケ装置
は、ADPCMデータ圧縮技術によってデータ圧縮され
た音声データ(ADPCM音声データ)に基づいてカラ
オケ演奏処理を行っていた。このADPCMデータ圧縮
技術が第2のデータ圧縮方法だとすると、この発明の推
奨される実施の形態では、これよりも高い圧縮率でデー
タを圧縮することのできる第1のデータ圧縮方法として
ベクトル量子化技術を採用している。このベクトル量子
化技術はADPCMデータ圧縮技術の約3倍の圧縮率で
音声データを圧縮することができるものであり、音声デ
ータを、音声スペクトルパターンを特定するインデック
ス情報とスペクトル包絡に関する補助情報とに圧縮す
る。この発明では、ベクトル量子化技術によってデータ
圧縮された音声データ(ベクトル量子化音声データ)を
伝送路を介して転送する。従って、従来のADPCM音
声データを送信する場合に比べてそのデータ伝送時間を
大幅に短縮化することができる。しかしながら、現在使
用されているカラオケ装置の大部分は、ADPCM音声
データを処理することはできても、ベクトル量子化音声
データを処理することはできない。そこで、この発明で
は、カラオケ装置側でベクトル量子化音声データを元の
音声データに復号し、復号された音声データをさらにA
DPCMデータ圧縮技術で圧縮している。これによっ
て、ADPCM音声データしか処理することのできない
カラオケ装置に対してもベクトル量子化音声データを転
送することが可能となる。また、ベクトル量子化音声デ
ータはノイズにも強い(ロバスト性が高い)ので、音声
データ転送後、その音声データを記憶する非リアルタイ
ム音声データ転送においては、音声データをロバスト性
が高く、圧縮率も高い圧縮方法を用いて圧縮することが
でき、音声データ転送後、その音声データを発音させる
リアルタイム音声データ転送においては、ロバスト性が
低く、圧縮率も低い従来の圧縮方法を用いた音声信号復
号化手段をそのまま用いることができる。なお、第2の
発明では、インデックス情報を変換テーブルで音声スペ
クトルパターンに変換し、変換された音声スペクトルパ
ターンと補助情報とに基づいてベクトル量子化音声デー
タの復号処理を行っている。
【0006】
【発明の実施の形態】以下、添付図面を参照して、この
発明の実施の形態を詳細に説明する。図1はこの発明に
係る音声発音装置の一例としてのカラオケ装置70の一
実施の形態の全体構成を示す概略ブロック図である。こ
の実施の形態ではカラオケ装置70が通信インターフェ
イス6及び通信ネットワーク80を介してホストコンピ
ュータ90に接続され、ホストコンピュータ90から配
信された楽曲データを受信し、内蔵ハードディスクに記
憶する蓄積型のカラオケ装置70について説明する。な
お、この実施の形態では、ホストコンピュータ90がデ
ィジタル音声データ1〜nをベクトル量子化技術によっ
て圧縮し、圧縮されたディジタル音声データ(以下、
「ベクトル量子化音声データ」とする)をヘッダ部及び
MIDIデータ部に付加して図2(A)のような楽曲デ
ータを構成し、それを所定の通信方式に従って通信ネッ
トワーク80を介してカラオケ装置70に送信する。こ
の楽曲データを受信したカラオケ装置70は、その中か
らベクトル量子化音声データを元のADPCM音声デー
タに変換してからハードディスク装置5に記憶する場合
について説明する。なお、このベクトル量子化技術につ
いては、図4を用いて後述する。
【0007】このカラオケ装置70は、マイクロプロセ
ッサユニット(CPU)1、プログラムメモリ(RO
M)2、ワーキングメモリ(RAM)3からなるマイク
ロコンピュータシステムの制御の下で各種の処理を実行
するようになっている。CPU1はこのカラオケ装置7
0全体の動作を制御する。このCPU1に対して、デー
タ及びアドレスバス21を介してプログラムメモリ(R
OM)2、ワーキングメモリ(RAM)3、パネルイン
ターフェイス4、ハードディスク装置(HDD)5、A
DPCMデータ符号化手段9、音源回路10、ADPC
Mデータ復号化手段11、エフェクト回路14、映像作
成回路16及び背景映像再生回路18が接続されてい
る。なお、これ以外にも、MIDIインターフェイス回
路やLD(CD)チェンジャーからなる背景映像再生装
置などの付属装置が接続されているが、ここでは説明を
省略する。
【0008】プログラムメモリ2はCPU1のシステム
関連のプログラム、またハードディスク装置5に記憶さ
れたシステム関連のプログラムをロードするプログラ
ム、各種のパラメータやデータなどを記憶しているもの
であり、リードオンリメモリ(ROM)で構成されてい
る。ワーキングメモリ3は、ハードディスク装置5から
ロードされたシステムプログラム、またCPU1がプロ
グラムを実行する際に発生する各種のデータを一時的に
記憶するものであり、ランダムアクセスメモリ(RA
M)の所定のアドレス領域がそれぞれ割り当てられ、レ
ジスタやフラグ等として利用される。パネルインターフ
ェイス4は、カラオケ装置70のパネル(図示せず)上
に設けられた各種操作子やリモコン装置(図示せず)な
どからの指令信号をCPU1の処理可能な信号に変換し
てデータ及びアドレスバス21に出力する。
【0009】ハードディスク装置5は、カラオケ装置7
0のシステムプログラムや楽曲データを記憶するもので
あり、例えば数百Mから数Gの記憶容量のもので構成さ
れる。この実施の形態では、ハードディスク装置5に記
憶される楽曲データの中に含まれる音声データはADP
CMデータで圧縮されている。なお、このハードディス
ク装置5に記憶される楽曲データは通信ネットワーク8
0を介して取り込まれるだけではなく、図示していない
フロッピーディスクドライバやCD−ROMドライバな
どから読み込まれて記録されてもよいことは言うまでも
ない。通信インターフェイス6は、通信ネットワーク8
0を介して送信されてきた楽曲データをその通信方式に
従って元のヘッダ部、MIDIデータ部及び音声データ
部(ベクトル量子化音声データ)のデータとして再現
し、それをベクトル量子化データ復号化手段7に出力す
る。ベクトル量子化データ復号化手段7は、通信インタ
ーフェイス6を介して受信したベクトル量子化音声デー
タに含まれるインデックス情報34をコードブック8に
基づいてスペクトルパターンに変換し、変換されたスペ
クトルパターンと補助情報とに基づいて元のディジタル
音声データを復号化し、それをヘッダ部及びMIDIデ
ータ部のデータと共にADPCMデータ符号化手段9に
出力する。コードブック8は、インデックス情報を音声
データのスペクトルパターンに変換するための変換テー
ブルである。コードブック8は、専用のメモリで構成さ
れていてもよいし、ハードディスク装置5の適当な場所
に記憶されていてもよい。コードブック8のデータは、
通信ネットワーク80を介して取り込まれてもよいし、
図示していないフロッピーディスクドライバやCD−R
OMドライバなどから読み込まれて記録されてもよい。
ADPCMデータ符号化手段9は、ベクトル量子化デー
タ復号化手段7によって復号化されたディジタル音声デ
ータをADPCMデータに符号化する。このADPCM
データ符号化手段9によってADPCMデータに符号化
された音声データを含む楽曲データはハードディスク装
置5に記憶される。すわなち、この実施の形態に係るカ
ラオケ装置70では、ADPCMデータ圧縮技術よりも
高い圧縮率でデータを圧縮することのできるベクトル量
子化技術によって圧縮された音声データを含む楽曲デー
タを取り込み、取り込まれた楽曲データに含まれる音声
データをベクトル量子化技術によって復号化し、復号化
された音声データをADPCMデータ圧縮技術によって
再び圧縮して楽曲データに含ませてからハードディスク
装置5に記録したり、直接ADPCMデータ復号化手段
11に出力したりしている。
【0010】音源回路10は、複数チャンネルで楽音信
号の同時発生が可能であり、データ及びアドレスバス2
1を経由して与えられた楽音トラック上のMIDI規格
に準拠したデータを入力し、このデータに基づいた楽音
信号を生成し、それをミキサ回路12に出力する。音源
回路10において複数チャンネルで楽音信号を同時に発
音させる構成としては、1つの回路を時分割で使用する
ことによって複数の発音チャンネルを形成するようなも
のや、1つの発音チャンネルが1つの回路で構成される
ような形式のものであってもよい。また、音源回路10
における楽音信号発生方式はいかなるものを用いてもよ
い。例えば、発生すべき楽音の音高に対応して変化する
アドレスデータに応じて波形メモリに記憶した楽音波形
サンプル値データを順次読み出すメモリ読み出し方式
(波形メモリ方式)、又は上記アドレスデータを位相角
パラメータデータとして所定の周波数変調演算を実行し
て楽音波形サンプル値データを求めるFM方式、あるい
は上記アドレスデータを位相角パラメータデータとして
所定の振幅変調演算を実行して楽音波形サンプル値デー
タを求めるAM方式等の公知の方式を適宜採用してもよ
い。また、これらの方式以外にも、自然楽器の発音原理
を模したアルゴリズムにより楽音波形を合成する物理モ
デル方式、基本波に複数の高調波を加算することで楽音
波形を合成する高調波合成方式、特定のスペクトル分布
を有するフォルマント波形を用いて楽音波形を合成する
フォルマント合成方式、VCO、VCF及びVCAを用
いたアナログシンセサイザ方式等を採用してもよい。ま
た、専用のハードウェアを用いて音源回路を構成するも
のに限らず、DSPとマイクロプログラムを用いて音源
回路を構成するようにしてもよいし、CPUとソフトウ
ェアのプログラムで音源回路を構成するようにしてもよ
い。
【0011】ADPCMデータ復号化手段11は、ハー
ドディスク装置5からの楽曲データ又はADPCMデー
タ符号化手段9からの楽曲データに含まれるADPCM
データをビット変換及び周波数変換して伸長し、元の音
声信号を生成する。なお、ADPCMデータ復号化手段
11は、音程情報に従ってピッチシフトされた音声信号
を生成することもある。ミキサ回路12は、音源回路1
0からの楽音信号と、ADPCMデータ復号化手段11
からの音声信号と、マイク13からの音声信号とをミキ
シングし、それをエフェクト手段14に出力する。エフ
ェクト手段14は、ミキサ回路12からの楽音信号、音
声信号に残響やリバーブなどの効果を付与して音響出力
装置15に出力する。エフェクト手段14は、楽曲デー
タの中の効果制御トラックの制御データに応じて効果の
種類や程度を制御する。音響出力装置15は、エフェク
ト手段14からの楽音信号及び音声信号をアンプ及びス
ピーカからなるサウンドシステムを介して発音する。
【0012】映像作成回路16は、歌詞トラックに記録
されているMIDIデータに基づいて作成された文字コ
ードと、その表示箇所に関する文字データと、歌詞の表
示時間に関する表示時間データと、歌詞の表示色を曲進
行に合わせて順次変化させるためのワイプシーケンスデ
ータとに基づいてモニタ画面に表示される歌詞映像を作
成する。背景映像再生回路18は、演奏される楽曲のジ
ャンルに対応した所定の背景映像をCD−ROM17か
ら選択的に再生し、それを映像ミキサ回路19に出力す
る。映像ミキサ回路19は、背景映像再生回路18から
の背景映像に映像作成回路16からの歌詞映像をスーパ
ーインポーズで重ね合わせて、映像出力回路20に出力
する。映像出力回路20は、映像ミキサ回路19によっ
てミキシングされた背景映像と歌詞映像の合成画像をモ
ニタ画面上に表示する。
【0013】図2は図1のカラオケ装置70が通信ネッ
トワークを介して受信する際の1曲分の楽曲データの構
成例を示す図である。楽曲データは図2(A)に示すよ
うにヘッダ部31、MIDIデータ部32及び音声デー
タ部33からなる。ヘッダ部31は、この楽曲データに
関する種々のデータからなり、具体的には、楽曲名、楽
曲の属するジャンル名、発売日、演奏時間などのデータ
である。これ以外にも、ヘッダ部31には通信された日
付やアクセスされた日付や回数などの付随的な情報が記
録される場合がある。MIDIデータ部32は、楽音ト
ラック、歌詞トラック、音声トラック及び効果制御トラ
ックからなる。楽音トラックには、楽曲に応じたメロデ
ィパート、伴奏パート、リズムパートなどの演奏データ
が記録される。演奏データは、MIDI規格に準拠した
データであり、イベントとイベントとの間の時間間隔を
示すデュレーションタイムデータΔtと、そのイベント
の種類(発音開始命令、発音停止命令など)を示すステ
ータスデータと、発音開始又は発音停止される音高を指
定するピッチ指定データと、発音時の音量を指定する音
量指定データとからなる。音量指定データはステータス
データが発音開始命令の場合に付与される。歌詞トラッ
クには、図示していないモニタ画面に表示されるべき歌
詞に関するデータがMIDIのシステム・エクスクルー
シブ・メッセージ形式で記録される。すなわち、この歌
詞トラックに記録されるMIDIデータは、表示する歌
詞に対応した文字コード及びその表示箇所に関する文字
データと、歌詞の表示時間に関する表示時間データと、
歌詞の表示色を曲進行に合わせて順次変化させるための
ワイプシーケンスデータとからなる。音声トラックに
は、音声データ部に記録されている音声データの発生に
関するデータが図2(B)に示すようなMIDIのシス
テム・エクスクルーシブ・メッセージ形式で記録され
る。すなわち、この音声トラックに記録されるMIDI
データは、音声データの発生タイミングに関するデータ
と、そのタイミングで発生されるべき音声データを指定
するデータと、その音声データの音量、ピッチを指定す
るデータからなる。効果制御トラックには、エフェクト
手段14の制御に関するMIDIデータが記憶される。
歌詞トラック及び効果制御トラックも図2(B)のよう
なMIDI規格に準拠したデータとして送信され、ハー
ドディスク装置5に記憶される。
【0014】MIDIデータ部32のデータはMIDI
規格に準拠したデータなので、データ圧縮されることな
くそのまま送信されるが、音声データ部33のデータは
ベクトル量子化技術によってデータ圧縮されてから送信
される。そして、カラオケ装置70は、通信ネットワー
ク80及び通信インターフェイス6を介して取り込まれ
た楽曲データに含まれるベクトル量子化音声データをベ
クトル量子化データ復号化手段7によって元のディジタ
ル音声データに復号化し、復号化されたディジタル音声
データをさらにADPCMデータ符号化手段9によって
ADPCMデータに符号化してから、ハードディスク装
置5に書き込む。従って、ハードディスク装置5に書き
込まれる楽曲データには、従来と同じADPCMデータ
の音声データが含まれることになる。すなわち、音声デ
ータをADPCMデータとして扱う従来のカラオケ装置
にベクトル量子化データ復号化手段7、コードブック8
及びADPCMデータ符号化手段9を付加することによ
って、この実施の形態に係るカラオケ装置を実現するこ
とができる。
【0015】図2(C)は、ベクトル量子化技術によっ
て量子化された音声データ部33のデータ構成の一例を
示す図である。この音声データ部33のデータ1〜n
は、楽曲に対応して発生されるバックコーラス、お手本
音声およびデュエット音声などに関する音声データのス
ペクトル包絡に関する補助情報37〜39と、音声デー
タのスペクトルパターンを特定するインデックス情報3
4〜36とからなる。図では、インデックス情報と補助
情報とからなるフレームが3個分だけ示してあるが、音
声データ部33のデータは実際には多数のフレームで構
成されている。図3は、コードブック8の内容を示す図
である。例えば、インデックス情報が『1』の場合はス
ペクトルパターン1が該フレームのスペクトルとして読
み出され、『2』の場合はスペクトルパターン2が該フ
レームのスペクトルとして読み出される。
【0016】図4は、音声データをベクトル量子化音声
データに圧縮する動作の概略を説明する図である。図4
(A)のような、音声データが存在する場合、その音声
データの一部を図4(B)の長方形40に示すような領
域で切り出す。図4(B)のように切り出された波形デ
ータは、離散的コサイン変換や離散的フーリエ変換など
の直交変換(MDCT)部41によって、図4(C)の
ような周波数領域の信号すなわちスペクトル信号に変換
される。また、切り出されたデータは、線形予測分析
(LPC)部42によって、図4(D)のようなスペク
トル包絡情報に変換される。量子化部43は図4(D)
のようなスペクトル包絡情報と、その音声パワー情報と
を補助情報として量子化する。図4(C)の周波数領域
の信号(スペクトル信号)は、正規化部44によって、
図4(E)のように正規化されたスペクトルパターンに
変換される。ここでは、図4(D)のスペクトル包絡情
報によって図4(C)の周波数領域の信号を除算するこ
とによって、正規化されたスペクトルパターンを得る場
合について説明するが、これ以外の方法で正規化しても
よい。正規化されたスペクトルパターンは、量子化部4
5によって、図3のコードブック8に記憶されたスペク
トルパターンのうち最も近いスペクトルパターンに対応
するインデックス情報に量子化される。このようにして
量子化部43及び量子化部45によってそれぞれ量子化
された補助情報とインデックス情報が図2(C)のよう
に構成されて、音声データ部のデータ1〜nを表すベク
トル量子化音声データとして、通信される。
【0017】カラオケ装置70は、ベクトル量子化音声
データを音声データ部のデータとして含む楽曲データを
通信ネットワーク80及び通信インターフェイス6を介
して受信したら、それをベクトル量子化データ復号化手
段7で、元のディジタル音声データに復号する。図5
は、ベクトル量子化データ復号化手段7がベクトル量子
化音声データに基づいて元のディジタル音声データを復
号する際の動作の概略を説明する図である。なお、図5
(B)は図4(B)に、図5(C)は図4(C)に、図
5(D)は図4(D)に、図5(E)は図4(E)に、
それぞれ対応している。ベクトル量子化データ復号化手
段7において、正規化スペクトル再生部51はインデッ
クス情報34〜36に基づき図3のコードブック8から
図5(E)のようなスペクトルパターンを読み出す。ス
ペクトル包絡再生部52は、補助情報37〜39に基づ
いて図5(D)のようなスペクトル包絡情報を再生す
る。スペクトル再生部53は、正規化スペクトル再生部
51からのスペクトルパターンに、スペクトル包絡再生
部からのスペクトル包絡情報を乗じることによって、図
5(C)のようなスペクトル信号を再生する。逆直交変
換部54は、スペクトル再生部53からのスペクトル信
号に逆直交変換処理を施すことによって、図5(D)の
ような元のディジタル音声データの一部を復号する。復
号されたディジタル音声データは、ミキサ回路71に出
力される。復号されたディジタル音声データは、ADP
CM符号化手段9によってADPCMデータに符号化さ
れてから、ヘッダ部31及びMIDIデータ部32のデ
ータと共にハードディスク装置5に記憶されたり、その
まま、ADPCMデータ復号化手段11に出力される。
【0018】なお、上述の実施の形態では、ADPCM
データ圧縮技術よりも圧縮率の高いデータ圧縮方法とし
て、ベクトル量子化技術を例に説明したが、これ以外の
データ圧縮方法で圧縮してもよいことは言うまでもな
い。また、上述の実施の形態では、音声データをベクト
ル量子化技術でデータ圧縮して送信する場合ついて説明
したが、これ以外の背景映像などをベクトル量子化技術
で圧縮してから送信するようにしてもよい。また、上述
の実施の形態では、1つのカラオケ装置70に対して、
ホストコンピュータ90が通信回線80を介してデータ
を伝送する場合について説明したが、ベクトル量子化デ
ータ復号化手段、コードブック及びADPCMデータ符
号化手段を備えたサブホストコンピュータに対してホス
トコンピュータ90がデータを伝送し、サブホストコン
ピュータのADPCM符号化手段によってADPCMデ
ータに符号化された楽曲データを各部屋のカラオケ装置
に分配転送するような構成のものにも適用可能なことは
いうまでもない。
【0019】
【発明の効果】この発明によれば、従来の音声発音装置
としてのカラオケ装置が有する圧縮率が低い音声データ
復号化手段を活かしつつ、圧縮率の高い音声データ圧縮
方法で圧縮された音声データを伝送路を介して伝送でき
るので、データ転送時間を大幅に短縮化することができ
るという効果を奏する。
【図面の簡単な説明】
【図1】 この発明に係るカラオケ装置の一実施の形態
の全体構成を示す概略ブロック図。
【図2】 カラオケ装置に配信される楽曲データの構成
例を示す図。
【図3】 図1のコードブックの内容の一例を示す図。
【図4】 ベクトル量子化技術によって音声データがイ
ンデッスク情報と補助情報に量子化される際の動作の概
略を説明する図。
【図5】 ベクトル量子化技術によって圧縮されたベク
トル量子化音声データに基づいて元のディジタル音声デ
ータを復号する際の動作の概略を説明する図。
【符号の説明】
1…CPU、2…ROM、3…RAM、4…パネルイン
ターフェイス、5…ハードディスク装置、6…通信イン
ターフェイス、7…ベクトル量子化データ復号化手段、
8…コードブック、9…ADPCMデータ符号化手段、
10…音源回路、11…ADPCMデータ復号化手段、
12…ミキサ回路、13…マイク、14…エフェクト手
段、15…音響出力手段、16…映像作成回路、17…
CD−ROM、18…背景映像再生回路、19…映像ミ
キサ回路、20…映像出力手段、21…データ及びアド
レスバス
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成9年6月30日
【手続補正1】
【補正対象書類名】図面
【補正対象項目名】図3
【補正方法】変更
【補正内容】
【図3】
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 H03M 7/30 9382−5K H03M 7/30 B

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 第2のデータ圧縮方法よりも高い圧縮率
    でデータを圧縮することのできる第1のデータ圧縮方法
    によって圧縮された音声データを取り込む手段と、 取り込まれた音声データを前記第1のデータ圧縮方法に
    よって復号する第1の復号化手段と、 前記第1の復号化手段によって復号化された音声データ
    を前記第2のデータ圧縮方法によって再び圧縮して出力
    する第2のデータ圧縮手段と、 この第2のデータ圧縮手段によって圧縮された音声デー
    タを前記第2のデータ圧縮方法によって復号する第2の
    復号化手段と、 前記第2の復号化手段によって復号化された音声信号を
    発音処理する発音処理手段とを備えたことを特徴とする
    音声発音装置。
  2. 【請求項2】 ベクトル量子化技術によって音声スペク
    トルパターンを特定するインデックス情報とスペクトル
    包絡に関する補助情報とにデータ圧縮された音声データ
    を取り込む手段と、 前記インデックス情報を音声スペクトルパターンに変換
    する変換テーブル手段と、 前記変換テーブル手段によって変換された前記音声スペ
    クトルパターンと前記補助情報とに基づいて音声データ
    を復号する復号化手段と、 前記復号化手段によって復号化された音声データをAD
    PCMデータ圧縮技術によって再び圧縮して出力するA
    DPCMデータ圧縮手段と、 このADPCMデータ圧縮手段によって圧縮された音声
    データに基づいて発音処理する発音処理手段とを備えた
    ことを特徴とする音声発音装置。
JP8178535A 1996-06-19 1996-06-19 音声発音装置 Pending JPH1011100A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP8178535A JPH1011100A (ja) 1996-06-19 1996-06-19 音声発音装置
US08/877,169 US5974387A (en) 1996-06-19 1997-06-17 Audio recompression from higher rates for karaoke, video games, and other applications
CN200410007331.4A CN1259649C (zh) 1996-06-19 1997-06-18 用于卡拉ok、游戏机之类的声音重放装置和方法
CN97113802.8A CN1240045C (zh) 1996-06-19 1997-06-18 用于卡拉ok、游戏机之类的声音重放装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8178535A JPH1011100A (ja) 1996-06-19 1996-06-19 音声発音装置

Publications (1)

Publication Number Publication Date
JPH1011100A true JPH1011100A (ja) 1998-01-16

Family

ID=16050180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8178535A Pending JPH1011100A (ja) 1996-06-19 1996-06-19 音声発音装置

Country Status (1)

Country Link
JP (1) JPH1011100A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004095424A1 (ja) * 2003-04-22 2004-11-04 Nec Corporation 符号変換方法及び装置とプログラム並びに記録媒体
JP2011520305A (ja) * 2008-02-20 2011-07-14 ディー−ボックス テクノロジーズ インコーポレイテッド ディジタルシネマストリーム環境における振動−運動信号のトランスポート

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004095424A1 (ja) * 2003-04-22 2004-11-04 Nec Corporation 符号変換方法及び装置とプログラム並びに記録媒体
US7747431B2 (en) 2003-04-22 2010-06-29 Nec Corporation Code conversion method and device, program, and recording medium
JP2011520305A (ja) * 2008-02-20 2011-07-14 ディー−ボックス テクノロジーズ インコーポレイテッド ディジタルシネマストリーム環境における振動−運動信号のトランスポート
US8515240B2 (en) 2008-02-20 2013-08-20 D-Box Technologies Inc. Transporting vibro-kinetic signals in a digital cinema environment

Similar Documents

Publication Publication Date Title
US5974387A (en) Audio recompression from higher rates for karaoke, video games, and other applications
JP2921428B2 (ja) カラオケ装置
US6191349B1 (en) Musical instrument digital interface with speech capability
JP3173382B2 (ja) 楽音制御装置、カラオケ装置、音楽情報供給及び再生方法、音楽情報供給装置並びに音楽再生装置
JPH1173182A (ja) 音楽作品ファイルを作成、配布、記憶、及び、実行するシステム並びに方法
US20060060069A1 (en) Method and device for enhancing ring tones in mobile terminals
JP3261983B2 (ja) カラオケ装置
US20020066359A1 (en) Tone generator system and tone generating method, and storage medium
JP3261982B2 (ja) カラオケ装置
JPH1011100A (ja) 音声発音装置
JPH10268895A (ja) 音声信号処理装置
JPH08160961A (ja) 音源装置
JPH1011095A (ja) ゲーム装置
JP2897614B2 (ja) カラオケ装置
JP2002041035A (ja) 再生用符号化データ作成方法
JP3592373B2 (ja) カラオケ装置
JPH1195769A (ja) 音楽再生装置
JP3211646B2 (ja) 演奏情報記録方法及びその演奏情報の再生装置
JP2797141B2 (ja) 楽音波形発生装置
JP3933147B2 (ja) 発音制御装置
EP1017039B1 (en) Musical instrument digital interface with speech capability
JP2001092450A (ja) オーディオ・ファイルの生成処理方法
JP3552676B2 (ja) 波形生成方法及び装置
JP2003173190A (ja) 波形圧縮方法及び波形生成方法
JP2001042867A (ja) 発音制御装置並びにこれを用いた装置及びシステム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040506

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040518

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040720

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040824