JP4202367B2 - 音声データ処理装置及び音声データ処理方法 - Google Patents

音声データ処理装置及び音声データ処理方法 Download PDF

Info

Publication number
JP4202367B2
JP4202367B2 JP2006066804A JP2006066804A JP4202367B2 JP 4202367 B2 JP4202367 B2 JP 4202367B2 JP 2006066804 A JP2006066804 A JP 2006066804A JP 2006066804 A JP2006066804 A JP 2006066804A JP 4202367 B2 JP4202367 B2 JP 4202367B2
Authority
JP
Japan
Prior art keywords
data
sound
audio
sound source
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006066804A
Other languages
English (en)
Other versions
JP2006154873A (ja
Inventor
真 古橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Interactive Entertainment Inc
Original Assignee
Sony Computer Entertainment Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Computer Entertainment Inc filed Critical Sony Computer Entertainment Inc
Priority to JP2006066804A priority Critical patent/JP4202367B2/ja
Publication of JP2006154873A publication Critical patent/JP2006154873A/ja
Application granted granted Critical
Publication of JP4202367B2 publication Critical patent/JP4202367B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Electrophonic Musical Instruments (AREA)

Description

本発明は、効果音や背景音楽(BGM)等を発生させる際に用いられる音声データ処理装置に関する。
従来、電子楽器、ゲーム機、及びパーソナルコンピュータ等の情報処理装置においては、楽音や効果音等を発生させることが行われている。 この楽音や効果音等を発生させる場合には、例えば方形波、三角波、正弦波等の信号をそれぞれ分周比及びデューティ比が異なる複数のプリセット分周器に供給し、各分周器から出力される個々の音源信号いわゆるボイスを所望のレベルで合成するものがある。
また、ピアノやドラム等の楽器においては、音の全発音期間がアタック、ディケイ、サスティン及びリリースの4区間に分けられて、各区間で信号の振幅、即ちレベルが特有の変化状態を呈するものがある。この変化状態に対応するために、各ボイスの信号レベルが同様に変化するようないわゆるADSR制御が行われている。
さらに、電子楽器用には、正弦波信号を低周波数の正弦波信号で周波数変調(FM)するいわゆるFM音源が知られており、変調度を時間の関数として少ない音源データによって多種多様の音声信号を発生することができる。尚、効果音の音源として、ノイズが用いられることもある。また、近年、ゲーム機及びパーソナルコンピュータ等の情報処理装置等においてゲームプログラムを行う場合には、ゲームプログラムの進行あるいはゲーム機及び情報処理装置の使用者の操作等に応じて、発生される効果音や背景音楽(BGM)の開始、停止、及び音量等が、実時間、即ちリアルタイムで変更される。
この効果音やBGMのための音声情報は、例えばディジタル録音された16ビットの多様なディジタルデータが圧縮されて、4ビットのビット・レート低減、即ちBRRエンコード処理が施された後にブロック化された適応差分PCMいわゆるADPCMデータであり、基本波の波形のための音源データである。即ち、ゲーム機及び情報処理装置等においては、指示された音程等に応じて上記音源データの読み出し周期を可変させて音程を発生させるいわゆるPCM音源を備えている。
ところで、従来のPCM音源により合成される音声出力が、例えばゲームプログラム中の効果音用に用いられるときには、BGM等の楽曲に重ね合わせて出力される場合が多い。この場合には、この効果音のための音声出力データとBGM等の楽曲のための音声信号とを混合して出力する必要がある。このとき、上記混合される音声信号として、上記PCM音源とは異なる他の処理回路から出力される音声信号を用いているので、音声出力データと音声信号との混合は複雑になっている。また、回路構成も大きいものとなっている。
そこで、本発明は上述の実情に鑑み、音源データから合成された音声出力データと音声信号とを容易に混合することができる音声データ処理装置を提供するものである。
本発明に係る音声データ処理装置は、デコードの必要なデータである音源データと、デコードの不要なデータである実音声データとを処理する音声データ処理装置であって、上記音源データを格納するサウンドバッファと、上記サウンドバッファに格納されたもののうち発音すべき音についての音源データを特定する選択情報を受け付けた場合に、上記サウンドバッファから、上記選択情報で特定された音源データを読出すとともに、読み出された上記音源データをデコード処理して音声を出力するための音声出力データを出力する音声出力手段と、上記音声出力手段からの上記音声出力データと、上記実音声データとを混合して出力音声データを生成し、これを出力する混合手段とを有してなる、音声データ処理装置である。
或いは、本発明に係る音声データ処理装置は、楽音が連続しない音についてのデータである音源データと、楽音が連続した音についてのデータである実音声データとを処理する音声データ処理装置であって、上記音源データを格納するサウンドバッファと、上記サウンドバッファに格納されたもののうち発音すべき音についての音源データを特定する選択情報を受け付けた場合に、上記サウンドバッファから、上記選択情報で特定された音源データを読出すとともに、読み出された上記音源データを処理して音声出力データを出力する音声出力手段と、上記音声出力手段からの上記音声出力データを、連続的に供給される上記実音声データに混合して出力音声データを生成し、これを出力する混合手段とを有してなる、音声データ処理装置である。
或いは、本発明に係る音声データ処理装置は、効果音についてのデータである音源データと、BGMについてのデータである実音声データとを処理する音声データ処理装置であって、上記音源データを格納するサウンドバッファと、上記サウンドバッファに格納されたもののうち発音すべき音についての音源データを特定する選択情報を受け付けた場合に、上記サウンドバッファから、上記選択情報で特定された音源データを読出すとともに、読み出された上記音源データを処理して音声を出力するための音声出力データを出力する音声出力手段と、上記音声出力手段からの上記音声出力データを、連続的に供給される上記実音声データに混合して出力音声データを生成し、これを出力する混合手段とを有してなる、音声データ処理装置である。
以上のような音声データ処理装置によれば、音源データから合成された音声出力データと音声信号とを容易に混合することができるようになる。
本発明の音声データ処理装置は、前記音源データと、前記実音声データを、所定の外部記録媒体から読み込むようになっていてもよい。
音源データから合成された音声出力データと音声信号とを容易に混合することができるようになるという作用効果は、以下のような方法によっても得ることができる。
例えば、音についての所定のビット数のデータである音源データと、音についての上記音源データとは異なるビット数のデータである実音声データとを処理する音声データ処理装置で実行される方法であって、当該音声データ処理装置が、上記音源データをサウンドバッファに格納する過程と、上記サウンドバッファに格納されたもののうち発音すべき音についての音源データを特定する選択情報を受け付けた場合に、上記サウンドバッファから、上記選択情報で特定された音源データを読出すとともに、読み出された上記音源データを処理して音声を出力するための上記音源データと同じビット数の音声出力データを出力する過程と、上記音声出力データと、上記実音声データとを混合して出力音声データを生成し、これを出力する過程と、を有する音声データ処理方法である。
或いは、デコードの必要なデータである音源データと、デコードの不要なデータである実音声データとを処理する音声データ処理装置で実行される方法であって、当該音声データ処理装置が、上記音源データをサウンドバッファに格納する過程と、上記サウンドバッファに格納されたもののうち発音すべき音についての音源データを特定する選択情報を受け付けた場合に、上記サウンドバッファから、上記選択情報で特定された音源データを読出すとともに、読み出された上記音源データをデコード処理して音声を出力するための音声出力データを出力する過程と、上記音声出力データと、上記実音声データとを混合して出力音声データを生成し、これを出力する過程と、を有する音声データ処理方法である。
或いは、楽音が連続しない音についてのデータである音源データと、楽音が連続した音についてのデータである実音声データとを処理する音声データ処理装置で実行される方法であって、当該音声データ処理装置が、上記音源データをサウンドバッファに格納する過程と、上記サウンドバッファに格納されたもののうち発音すべき音についての音源データを特定する選択情報を受け付けた場合に、上記サウンドバッファから、上記選択情報で特定された音源データを読出すとともに、読み出された上記音源データを処理して音声出力データを出力する過程と、上記音声出力データを、連続的に供給される上記実音声データに混合して出力音声データを生成し、これを出力する過程と、を有する音声データ処理方法である。
或いは、効果音についてのデータである音源データと、BGMについてのデータである実音声データとを処理する音声データ処理装置で実行される方法であって、当該音声データ処理装置が、上記音源データをサウンドバッファに格納する過程と、上記サウンドバッファに格納されたもののうち発音すべき音についての音源データを特定する選択情報を受け付けた場合に、上記サウンドバッファから、上記選択情報で特定された音源データを読出すとともに、読み出された上記音源データを処理して音声出力データを出力する過程と、上記音声出力データを、連続的に供給される上記実音声データに混合して出力音声データを生成し、これを出力する過程と、を有する音声データ処理方法である。
以下、本発明の好ましい実施例について、図面を参照しながら説明する。図1には、本発明に係る音声データ処理装置を備える音声出力装置の概略的な構成を示す。ここで、図1のCD−ROMドライブ93は、ディスク状記録媒体であって、光学的にデータの記録及び再生を行う場合に用いられる光ディスクの内で、再生専用型光ディスクであるコンパクトディスクいわゆるCDを読み出し専用メモリとして用いるCD−ROMを記録媒体として用いるものである。
この図1において、マイクロプロセッサ等から成る中央処理装置であるCPU90は、バス92に接続されている。また、このバス92には、上記CPU90によってデータの格納等に用いられるメインメモリ91、CD−ROMドライブ93内のCD−ROMから読み出されるデータにデコード処理等を施すCD−ROMデコーダ80、及び上記CD−ROMから読み出された音声データを用いて音を発生する音声データ処理装置49が接続されている。この音声データ処理装置49は、音源データの処理及び音源データと実音声データとの混合を行うディジタル音声信号発生装置50及び音源データを格納するためのサウンドバッファ51から構成される。また、上記ディジタル音声信号発生装置50には、音を外部に出力するスピーカ装置95が接続されている。
上記CPU90からの制御命令により、上記CD−ROMドライブ93から音声データが読み出されて、CD−ROMデコーダ80内のCD−ROMバッファ82に格納される。上記CD−ROMバッファ82に格納された音声データは、エラー訂正部81に送られる。このエラー訂正部81では、送られたデータに対してエラー訂正処理等を行う。
ここで、上記音声データとしては、楽音が連続した、即ち背景音楽(BGM)等の楽曲として出力されるための実音声データ、及び効果音等の音を発生するための音源データが含まれている。具体的には、上記エラー訂正処理等がなされた音声データの内で、曲として出力される実音声データは、CD−ROM用音声データの規格であるCD−ROM XAに基づく4ビットADPCMデータ、及び音楽用CDにおける音声データの規格であるCD−DAによる16ビットPCMデータであり、また、効果音等の音を発生するための音源データは、上記4ビットADPCMデータである。
そして、上記CPU90によってその音声データが、上記どちらのデータであるのかが検出される。また、上記CPU90の制御により、楽曲として出力される実音声データはデコーダ83に送られる。このデコーダ83では、ADPCMデータのみにデコード処理が施され、16ビットPCMデータがミキサ84に出力される。このミキサ84では、ステレオの左右チャンネルのPCMデータに対して、ディジタル的に減衰量を変更してミックスすることを行う。このミキサ84から出力されるデータは、ディジタル音声信号発生装置50に入力される。
また、効果音等を発生するための音源データは、ホストインターフェイス(I/F)85からバス92を介してディジタル音声信号発生装置50に入力される。この後、上記送られた音源データは、上記ディジタル音声信号発生装置50によりサウンドバッファ51に格納される。ここで、上記サウンドバッファ51に格納される音源データを、図2に示す。
この音源データは、横16ビット、縦8ビットの16バイトを1ブロックとするブロック単位で構成される。このブロックは、音源データの音声情報のヘッダ情報である2バイトのサウンドパラメータ領域PAと、28サンプルの音声情報いわゆるサウンドデータから成る14バイトのサウンドデータ領域SAとから構成される。
また、上記サウンドパラメータ領域PAは、4ビットのシフト量RA、4ビットのフィルタ情報FL、3ビットのループ情報LP、及び5ビットの予約領域RSから成る。上記シフト量RAは、BRRデコード処理において、4ビット値を16ビット値に伸張するためのパラメータである。このシフト量RAは、0〜12の値をとり得るものであり、以下の(1)式で表される。
(16ビットデータ)=2(12-RA) ・(4ビットデータ) ・・・(1)
また、上記ブロック毎のサウンドデータを生成する際にはBRRエンコード処理が施されており、上記フィルタ情報FLは、上記BRRエンコード処理に対応するBRRデコード処理を行う際に用いるフィルタの情報を示している。このフィルタ情報FLにより、後述する複数の予測フィルタから、ブロック単位毎に最適なもの、即ち誤差の少ないものを選択する。
上記ループ情報LPは、下位ビット側から順に、それぞれ1ビットのループ終了フラグEF、ループフラグLF、及びループ開始フラグLSFを備えている。上記ループ開始フラグLSFは、1のときに、このブロックがループのスタートであることを示すものである。また、ループフラグLFは、音源データにループがあるのか否かを示し、このループフラグLFが1のときにはループがあることを示すものである。尚、ループありの音源データは、その全てのブロックのこのループフラグLFのビットを1にする。また、ループ終了フラグEFは、このブロックが音源データの最後のブロックであることを示すものである。
また、上記サウンドデータ領域SAには、サウンドデータSD0〜SD27までの28サンプルのサウンドデータが含まれる。上記ディジタル音声信号発生装置50では、入力された実音声データ、及び上記サウンドバッファ51内の音源データを用いて出力音声データを生成し、これに基づいて楽曲及び効果音等をスピーカ装置95から出力する。
次に、上記ディジタル音声信号発生装置の概略的な構成を図3に示し、以下に詳細に説明する。この実施例に示すディジタル音声信号発生装置は、上記サウンドバッファ51から、図2に示す4ビットのADPCMデータであるサンプルデータいわゆる音源データを読み出して、このADPCMデータに施されているビット・レート低減のエンコード処理に対応するデコード処理を施してPCMデータに変換するBRRデコーダ53、上記変換されたPCMデータのピッチを変換するピッチ変換部54、クロック信号を発生するクロック信号発生器55、この発生されたクロックに基づいてノイズを発生するノイズ発生器56、上記ピッチ変換部54からの出力と上記ノイズ発生器56からの出力とを切り換える信号切換部57、この信号切換部57からの出力のレベルを調整して、出力波形の振幅を可変させて発生する音の包絡線(エンベロープ)を変換するエンベロープジェネレータ58、ミュート時にはオフされるミュート処理部59、音量及び左右のチャンネルのバランスを調整する左右ボリューム60L、60Rを備えている。これにより、上記音源データを用いた音声の出力がなされる。
ここで、図3においては、1音声(1ボイス)分の音声出力を行うための回路構成のみを示しているが、この実施例のディジタル音声信号発生装置は24ボイス分の音声出力を行うことが可能であり、24ボイスにそれぞれ対応する、上記ピッチ変換部54〜ボリューム60L、60Rまでの回路構成を備えている。よって、このディジタル音声信号発生装置では、各ボイスの左チャンネル及び右チャンネルがそれぞれ合成されて、左チャンネル及び右チャンネルの2チャンネル分の音声出力が発生される。
また、各ボイス毎に、上記サウンドバッファ51に記憶された音源データ、エンベロープ、音量、及び左右チャンネルのバランス等を独立に設定することができる。また、このディジタル音声信号発生装置においては、図1のCD−ROMデコーダ80から送られる実音声データを、音声出力データに混合するために、実音声データについての音声信号を入力して上記音声出力データに合成するか否かを選択する信号切換部64、及びこの混合する音声信号の音量を調節するミキシングボリューム65が設けられている。よって、音声信号と上記音声出力データとの混合を行う場合には、図1のCD−ROMデコーダ80内のミキサ84から送られるPCMデータが信号入力端子63から入力されて、上記信号切換部64を介してミキシングボリューム65に送られる。このミキシングボリューム65では、送られた音声信号の音量調節がなされる。この音量調節された音声信号は加算器62に送られて、上記ボリューム60Lからの音声出力データと混合される。
尚、図3には、上記ボリューム60Lから出力される24ボイス分の音声出力データが合成された左チャンネルの出力音声データと、上記ミキシングボリューム65からの左チャンネルの音声信号との混合を行う回路構成のみを示しているが、右チャンネルについても上記左チャンネルのための回路構成と同様な回路構成を備えており、左チャンネル及び右チャンネルの2チャンネルについてそれぞれ混合が行われる。
さらに、このディジタル音声信号発生装置では、上記発生された出力音声データに、時間を前後させた出力音声データを混合するいわゆるリバーブ処理を行うことが可能である。上記リバーブ処理を行うために、上記音声信号をリバーブ処理に用いるか否かを切り換える信号切換部66、この信号切換部66からの音声信号と信号切換部61Lを介して出力される上記発生された音声出力データとを加算する加算器67、この加算器67からの出力音声データである音声信号を用いてリバーブ処理を行うリバーブ処理部68、リバーブ処理が施された出力音声データである音声信号による音の音量を調節するリバーブボリューム69、この音量が調節されたリバーブボリューム69からの出力を、上記加算器62から出力される、時間的に前後させる前の出力音声データに混合する加算器70、この加算器70から出力される出力音声データの音量を調節するマスタボリューム71が設けられており、上記出力音声データに混合する出力音声データとして上記ミキシングボリューム65からの音声信号を用いている。
上記加算器67から出力される音声信号は、リバーブ処理部68に入力されて時間的に前後され、リバーブボリューム69に送られる。このリバーブボリューム69では、送られた出力音声データである音声信号の音量が調節される。この音量調節がなされた音声信号は、加算器70に送られ、上記加算器62からの音声信号と合成される。次に、このディジタル音声信号発生装置における、図2に示す音源データの処理動作について以下に説明する。
図1のCPU90により、発音する音の音源データを指示する選択情報、音の長さ情報、音の音程情報、音の音色を決めるためのエンベロープ情報、音の音量情報が上記メインメモリ91から取り出されて、このディジタル音声信号発生装置50に送られる。このディジタル音声信号発生装置は、上記送られた選択情報に基づいて上記サウンドバッファ51から音源データを読み出し、この音源データを音源データ入力端子52から入力する。また、上記CPU90からの音の長さ情報に基づいて、サウンドバッファ51からの音源データの入力を制御する。
この入力された音源データは、上記BRRデコーダ53に送られてデコード処理が施され、16ビットPCMデータに変換される。このBRRデコーダ53によるデコード処理は、各ボイス毎に、1処理単位(1Ts)について最大4サンプル行われる。このデコード結果は、内部メモリ(サウンドバッファ51)内に格納される。これらの格納されたデータは、後述するピッチ変換部54におけるピッチ変換演算に使用されるが、その際のデータの消費量に従って、BRRデコード処理の割合が決定される。なお、ピッチ変換によるデータの消費量が少なければ、BRRデコード処理の頻度は少なくなる。
ここで、図2の音源データのサウンドパラメータ領域PA内のフィルタ情報FLの内容を図4に示す。このように、フィルタ情報FLに示す値によって、ストレート、1次、2次(Level B)、2次(LevelC)の4種類の予測フィルタを選択することができる。尚、係数a、bは、フィルタ情報FLの値によって決定されるものである。
このフィルタ情報FLが2及び3の値をとる予測フィルタは、CD−ROMXAの規格に基づく4ビットのADPCMデータのデコード処理のために用いられるものである。図2に示すサウンドデータが4ビットのADPCMデータである場合には、この4ビットのADPCMデータをデコード処理するために、上記フィルタ情報FLが2及び3の値をとる予測フィルタを用いることも可能である。
ここで、4ビットの音源データをDn 、1サンプル前のデコード結果をXn-1(16ビットデータ)、2サンプル前のデコード結果をXn-2(16ビットデータ)とすると、現サンプルのデコード結果Xn ( 16ビットデータ)は、シフト量RAを用いて以下の(2)式で表される。
n =2(12-RA)n +aXn-1 +bXn-2 ・・・(2)
上記BRRデコーダ53から出力されるPCMデータは、ピッチ変換部54に入力される。このピッチ変換部54では、上記CPU90からの音程情報に基づいてピッチ変換演算が行われて、入力されたPCMデータにより発生する音の音程、即ちピッチが変換される。このピッチ変換されたデータは信号切換部57内の端子57aに送られる。
一方、クロック信号発生器55によって発生されたクロック信号は、ノイズ発生器56に送られることによりノイズが発生される。ここで、このノイズ発生器56は、例えばM系列の疑似乱数によるノイズを発生するものである。この発生されたノイズは、信号切換部57内の端子57bに送られる。このディジタル音声信号発生装置は、図1のCPU90からの制御命令に基づいて上記信号切換部57を端子57a又は57bに切り換えることにより、上記ピッチ変換部54からの音声データ又は上記ノイズ発生器56からのノイズが選択されて、エンベロープジェネレータ58に出力される。
このエンベロープジェネレータ58では、上記CPU90からのエンベロープ情報に基づいて、いわゆるADSR制御が行われ、発音される音の音色が決定される。このエンベロープジェネレータ58からの出力は、信号切換部59を介して、左チャンネル用の音声データはボリューム60Lに、右チャンネル用の音声データはボリューム60Rにそれぞれ送られる。このボリューム60L、60Rでは、上記CPU90からの音量情報に基づいて音量が調節された出力音声データが発生される。
このようにして、24ボイス分の音声がそれぞれ生成されて出力される。そして、各ボイスの左チャンネル及び右チャンネルがそれぞれ合成されて、左チャンネル及び右チャンネルの2チャンネル分の出力音声データが発生される。この左右チャンネルの2チャンネル分の出力音声データは、上述のように、上記加算器62において上記ミキシングボリューム65から出力される出力音声データと混合され、さらに、上記加算器70において上記リバーブボリューム69から出力される出力音声データと混合される。この混合された出力音声データは、マスタボリューム71で発生される音の音量調節がなされた後に、音声信号出力端子72から出力される。これにより、図1のスピーカ装置95から音が発生する。
また、上述した音声データ処理装置は家庭用ゲーム機等において好適なものであり、この音声データ処理装置を用いた家庭用ゲーム機の一実施例の概略的な構成を図5に示し、以下に説明する。この家庭用ゲーム機は、バス31に、CPU11及び周辺デバイス12等から構成されるメインシステム、グラフィックスシステム、サウンドシステム、CD−ROMシステム、及び通信システム内の各種の機能を実現するための複数のプロセッサ及びデバイスが接続されることにより構成されている。
上記メインシステムの基本部分となる上記CPU11は、32ビットのRISC(Reduced Instruction Set Computer) CPUであり、周辺デバイス12は、DMA、タイマ、割り込み等の複数の制御用コントローラから構成されるものである。また、2MBytesのメインメモリ13、512KBytesのメモリ容量をもち、上記CPU11や周辺デバイス12等の動作を制御してこの家庭用ゲーム機を制御するためのオペレーティングシステム(OS)プログラムが格納されているROM14、パラレル通信の入出力(I/O)部であるPIO29、及びシリアル通信の入出力(I/O)部であるSIO30が、それぞれバス31に接続されている。
この家庭用ゲーム機に電源が投入されたときには、上記CPU11によってROM14内のOSが実行されて装置全体の初期化が行われ、上記CPU11からの制御命令により、CD−ROMシステムのCD−ROMドライブ25に搭載されたCD−ROMからアプリケーションプログラム即ちゲームプログラムや画像及び音声データが読み出される。
具体的には、上記CD−ROMに記録されている画像データは、DCT(離散コサイン変換)等の直交変換が施されて画像圧縮された動画や静止画の画像データ、及びポリゴンを修飾するためのテクスチャ画像の画像データである。尚、動画及び静止画の画像データとしては、静止画データ圧縮の国際標準規格であるJPEG(Joint Photographic Experts Group)方式で圧縮されたデータ、及び動画圧縮の国際標準規格であるMPEG(Moving Picture Image Coding Experts Group) 方式であって、フレーム内符号化のみによって圧縮されたデータが用いられる。また、上記CD−ROMからのゲームプログラムには、微小な多角形領域いわゆるポリゴンを描画するためのポリゴン描画命令が含まれている。
また、CD−ROMに記録されている音声データは、音楽用CDにおける音声データの規格であるCD−DAによる16ビットPCMデータ、及びCD−ROM用画像及び音声データの規格であるCD−ROM XAに基づいた適応差分PCMいわゆるADPCMデータである。上記CD−ROMから読み出されたデータはCD−ROMバッファ24に格納された後、CD−ROMデコーダ23によってデコード処理が施され、データの内容に従って、上記メインシステム、グラフィックスシステム及びサウンドシステム等に送られる。
上記グラフィックスシステムとしては、グラフィックスデータ生成プロセッサであるジェオメトリトランスファエンジン、即ちGTE15、グラフィックス描画処理プロセッサであるグラフィックスプロセッシングユニット、即ちGPU16、このGPU16によって画像を生成する際に使用される1MBytesのフレームバッファ17、画像データ伸張エンジンであるモーションデコーダ、即ちMDEC19、及びCRTディスプレイ装置や液晶ディスプレイ(LCD)装置等のビデオ出力装置18から構成される。
上記GTE15は、上記CPU11のコプロセッサとして用いられ、上記CPU11が描画命令や制御命令を生成する際に、画像内の3次元の物体を表示するためにポリゴンについての座標変換や光源計算、例えば固定少数点形式の行列やベクトルの計算を、並列処理機構によって高速に行う。上記GPU16は、上記CPU11からのポリゴン描画命令に従って動作するものであり、上記CPU11とは独立した2次元のアドレス空間にマッピングされるフレームバッファ17にポリゴンの描画を行う。このGPU16は、ポリゴンに同じ色で描画を行うフラットシェーディング、ポリゴンの頂点毎に任意の色を指定して、この頂点の色を用いてポリゴン内の色を求めるグーローシェーディング、及びポリゴンに対して2次元のイメージデータであるテクスチャ(素材)を貼り付けるテクスチャマッピングを行う。
上記GTE15は、具体的には、例えば1つの三角形のポリゴンに同じ色で描画を行うフラットシェーディングを行う場合には、1秒間に最大150万程度のポリゴンの座標演算を行うことができ、また、グーローシェーディング又はテクスチャマッピングを行う場合には、1秒間に最大50万程度のポリゴンの座標演算を行うことができるので、CPU11の負荷を軽減すると共に、高速な座標演算を行うことができる。
上記フレームバッファ17は、縦512画素、横1024画素の矩形領域であって、16ビットのいわゆるデュアルポートRAMから成り、上記GPU16による画像の描画、メインメモリ13から転送されるデータの格納等に使用される。尚、上記GPU16による描画又はメインメモリ13からのデータ転送、及び画像データの読み出しは同時に行われる。また、フレームバッファ17内には、テクスチャが格納されるテクスチャ領域、及びカラーパレットとして用いられるカラールックアップテーブル(CLUT)が格納されるCLUT領域が設けられている。このテクスチャパターン及びCLUTのデータは、上記CPU11の制御によってCD−ROMドライブ25から読み出され、上記GPU16を介して上記フレームバッファ17に転送され、格納される。また、CLUTのデータは上記GPU16によって生成される場合もある。
従って、上記CPU16によって、上記GTE15で求めた座標や色情報を用いてポリゴンが描画され、このポリゴンに対してテクスチャを貼り付けることにより3次元(3D)画像を作成している。この作成された画像データを画像信号として上記ビデオ出力装置18に出力することにより、3次元(3D)画像が表示される。
尚、動画像を表示する場合に、フレームバッファ17上に2つの矩形領域を設け、一方の矩形領域にフレーム画像を描画すると同時に、他方の矩形領域に既に描画されたフレーム画像のデータをビデオ出力装置18に出力して画像を表示するように、上記2つの矩形領域を交互に描画及び画像表示用として用いることにより、上記ビデオ出力装置18上に画像の書き換えの状態が表示されるのを回避している。
また、MDEC19は、CD−ROMドライブ25から読み出された画像データを再生する際に用いられるものであり、上記CPU11と互いにメインメモリ13を共有しながら並列的に動作を行う。上記CD−ROMドライブ25から読み出された動画像用のデータは、CD−ROMデコーダ23でエラー訂正等がなされた後、MDEC19に送られる。このMDEC19では、送られたデータにデコード処理を施す。このデコード処理されたデータは、動画像データとしてメインメモリ13に送られる。このメインメモリ13に送られた動画像データは、上記GPU16を介してフレームバッファ17に格納された後、画像信号として上記ビデオ出力装置18に出力されることにより、動画が表示される。
また、サウンドシステムとしては、サウンド再生処理プロセッサであるサウンドプロセッシングユニットいわゆるSPU20、このSPU20によって音声信号を再生する際に用いられる512KBytesのサウンドバッファ21、及びスピーカ装置等のサウンド出力装置22から構成される。上記SPU20は、16ビットの音声データが4ビットの差分信号としてADPCMされた音声データを再生するADPCM復号化機能、サウンドバッファ21に記憶されている音源データを再生して効果音等を発生する再生機能、上記音源データを変調させて再生する変調機能等を備えている。
ここで、上記CD−ROM内には背景音楽(BGM)に用いられる実音声データ及び効果音の発生等に用いられる音源データが記録されている。これらのデータは、上記CPU11の制御により、上記CD−ROMドライブ25から読み出されてCD−ROMデコーダ23でエラー訂正等の処理が施される。BGM等に用いられる実音声データは、上記CPU11の制御により上記CD−ROMデコーダ23から上記SPU20に送られ、このSPU20によって楽曲として上記サウンド出力装置22から出力される。また、効果音用に用いられる音源データは、上記CPU11の制御により上記サウンドバッファ21内に格納される。上記SPU20は、上記サウンドバッファ21内に格納された音源データに基づいて、楽音や効果音等を発生する。よって、上記SPU20は、いわゆるサンプリング音源である。
また、通信システムとして、入力デバイスいわゆる入力パッドであるコントローラ27、1MBytesのメモリカード28、及び同期シリアルポートである通信デバイス26により構成されている。上記コントローラ27は、ゲームの進行及びゲーム内において画像表示される物体の動作等を制御するための指示を入力するためのキーを有する。このコントローラ27から入力された操作情報は、通信デバイス26に送られる。この通信デバイス26に送られた情報は、上記CPU11によって約1/60秒毎に読み出される。上記CPU11は、この情報に基づいて、周辺デバイス12やメインメモリ13、及びグラフィックスシステム、サウンドシステム、CD−ROMシステムのそれぞれの動作を制御する制御命令を送信することにより、各システムの動作が制御され、上記入力された操作情報に応じた画像が表示され、音声が出力する。
また、上記メモリカード28は、例えばフラッシュメモリ等の不揮発性のメモリから成り、複数のゲームの設定及び進行途中の状態や結果を格納し、保持するために用いられる。また、バス31から分離されているので、電源を入れた状態で着脱することが可能であり、この家庭用ゲーム機の動作中に複数のメモリカード28を着脱させてデータを記憶させることができる。
尚、上記PIO29を介して周辺機器との接続を行うことができ、また、SIO30を介して他のゲーム装置との通信等を行うことが可能である。また、この家庭用ゲーム機においては、ゲームプログラムの読み出し、画像データの表示あるいは描画等を行う際に、上記メインメモリ13、GPU16、MDEC19、及びCD−ROMデコーダ23等の間で大量の画像データを高速に転送する必要があるので、この場合には、上記CPU11を介さずに周辺デバイス12からの制御によって直接に画像データを転送するいわゆるDMA転送を行う。これにより、データ転送によるCPU11の負荷を低減させて、高速なデータ転送を行っている。
本発明に係る音声データ処理装置を用いた音声出力装置の一実施例の概略的な構成を示す図である。 音源データの構成を示す図である。 ディジタル音声信号発生装置の概略的な構成を示す図である。 フィルタ情報を説明するための図である。 家庭用ゲーム機の概略的な構成を示す図である。
符号の説明
49 音声データ処理装置
50 ディジタル音声信号発生装置
51 サウンドバッファ
53 BRRデコーダ
54 ピッチ変換部
57、61L、61R、64、66 信号切換部
58 エンベロープジェネレータ
60L、60R ボリューム
65 ミキシングボリューム
68 リバーブ処理部
69 リバーブボリューム
71 マスタボリューム
80 CD−ROMデコーダ
90 CPU
91 メインメモリ
92 バス
93 CD−ROMドライブ
95 スピーカ装置

Claims (5)

  1. 楽音が連続しない効果音についてのエンコードされたデータである音源データと、楽音が連続したBGMについてのデータである実音声データとを処理する音声データ処理装置であって、
    上記音源データをエンコードされた状態で格納するサウンドバッファと、
    上記サウンドバッファに格納されたもののうち発音すべき音についての音源データを特定する選択情報を受け付けた場合に、上記サウンドバッファから、上記選択情報で特定された音源データを読出すとともに、読み出された上記音源データをデコード処理してデータサイズが増された音声出力データを出力する音声出力手段と、
    上記音声出力手段からの上記音声出力データを、所定の記録媒体から供給される上記実音声データに混合して出力音声データを生成し、これを出力する混合手段とを有してなり、
    上記実音声データは前記混合手段から見て前記混合手段に連続して供給されるようになっている、
    音声データ処理装置。
  2. 効果音についてのエンコードされたデータである音源データと、BGMについてのデータである実音声データとを処理する音声データ処理装置であって、
    上記音源データをエンコードされた状態で格納するサウンドバッファと、
    上記サウンドバッファに格納されたもののうち発音すべき音についての音源データを特定する選択情報を受け付けた場合に、上記サウンドバッファから、上記選択情報で特定された音源データを読出すとともに、読み出された上記音源データをデコード処理してデータサイズが増された音声を出力するための音声出力データを出力する音声出力手段と、
    上記音声出力手段からの上記音声出力データを、所定の記録媒体から供給される上記実音声データに混合して出力音声データを生成し、これを出力する混合手段とを有してなり、
    上記実音声データは前記混合手段から見て前記混合手段に連続して供給されるようになっている、
    音声データ処理装置。
  3. 前記音源データと、前記実音声データの双方を、所定の外部記録媒体から読み込むようになっているとともに、前記音源データは、前記外部記録媒体から読み込まれた後前記サウンドバッファに格納されるようになっている、
    請求項1〜のいずれかに記載の音声データ処理装置。
  4. 楽音が連続しない効果音についてのエンコードされたデータである音源データと、楽音が連続したBGMについてのデータである実音声データとを処理する音声データ処理装置で実行される方法であって、
    当該音声データ処理装置が、
    上記音源データをエンコードされた状態でサウンドバッファに格納する過程と、
    上記サウンドバッファに格納されたもののうち発音すべき音についての音源データを特定する選択情報を受け付けた場合に、上記サウンドバッファから、上記選択情報で特定された音源データを読出すとともに、読み出された上記音源データをデコード処理してデータサイズが増された音声出力データを出力する過程と、
    上記音声出力データを、所定の記録媒体から供給される上記実音声データに混合して出力音声データを生成し、これを出力する過程であって、当該過程では混合される上記実音声データが連続的に供給される過程と、
    を有する音声データ処理方法。
  5. 効果音についてのエンコードされたデータである音源データと、BGMについてのデータである実音声データとを処理する音声データ処理装置で実行される方法であって、
    当該音声データ処理装置が、
    上記音源データをエンコードされた状態でサウンドバッファに格納する過程と、
    上記サウンドバッファに格納されたもののうち発音すべき音についての音源データを特定する選択情報を受け付けた場合に、上記サウンドバッファから、上記選択情報で特定された音源データを読出すとともに、読み出された上記音源データをデコード処理してデータサイズが増された音声出力データを出力する過程と、
    上記音声出力データを、所定の記録媒体から供給される上記実音声データに混合して出力音声データを生成し、これを出力する過程であって、当該過程では混合される上記実音声データが連続的に供給される過程と、
    を有する音声データ処理方法。
JP2006066804A 2006-03-10 2006-03-10 音声データ処理装置及び音声データ処理方法 Expired - Fee Related JP4202367B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006066804A JP4202367B2 (ja) 2006-03-10 2006-03-10 音声データ処理装置及び音声データ処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006066804A JP4202367B2 (ja) 2006-03-10 2006-03-10 音声データ処理装置及び音声データ処理方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP30003194A Division JP3792742B2 (ja) 1994-12-02 1994-12-02 音声データ処理装置及び音声データ処理方法

Publications (2)

Publication Number Publication Date
JP2006154873A JP2006154873A (ja) 2006-06-15
JP4202367B2 true JP4202367B2 (ja) 2008-12-24

Family

ID=36633150

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006066804A Expired - Fee Related JP4202367B2 (ja) 2006-03-10 2006-03-10 音声データ処理装置及び音声データ処理方法

Country Status (1)

Country Link
JP (1) JP4202367B2 (ja)

Also Published As

Publication number Publication date
JP2006154873A (ja) 2006-06-15

Similar Documents

Publication Publication Date Title
JP5241805B2 (ja) タイミング・オフセット許容型カラオケゲーム
KR100458395B1 (ko) 오디오 메모리에 데이터를 프리캐싱하는 방법과 장치
JP2009157272A (ja) 音声再生装置
EP1109149B1 (en) Sound source controlling device
JP2000156039A (ja) マルチトラック記録再生方式及び装置
KR100384919B1 (ko) 음원데이터생성방법,기록매체,및음원데이터처리장치
JP5345780B2 (ja) データ処理
JP4202367B2 (ja) 音声データ処理装置及び音声データ処理方法
JP3792742B2 (ja) 音声データ処理装置及び音声データ処理方法
JP4595828B2 (ja) オーディオ再生装置
CN100399421C (zh) 声音重放方法以及声音重放装置
JPH08160961A (ja) 音源装置
AU732128B2 (en) Method and apparatus for recording sound data on a storage disk
AU733313B2 (en) Sound source data generating apparatus and method for processing sound data
JPH08160956A (ja) 音源データ生成方法、記録媒体、及び音源データ処理装置
WO2001039129A1 (fr) Processeur d'images, procede de traitement d'image et support de stockage
JP2004141352A (ja) 画像生成システム、プログラム及び情報記憶媒体
US7470848B2 (en) Structure and method for playing MIDI messages and multi-media apparatus using the same
JP2008122888A (ja) カラオケ装置
JP3660379B2 (ja) 音源制御情報の記憶方法及び音源制御装置
JPH03186898A (ja) カラオケ装置の効果音出力装置
EP1889645A2 (en) Data processing
JP2004141351A (ja) 画像生成システム、プログラム及び情報記憶媒体
JPH1011096A (ja) カラオケ装置
JP2003280690A (ja) ディジタルデータ再生装置,ディジタルデータ復号化プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060314

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080115

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080624

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080825

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081007

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081008

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111017

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121017

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131017

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees