JP2004205679A - 音声データ処理装置及び方法 - Google Patents
音声データ処理装置及び方法 Download PDFInfo
- Publication number
- JP2004205679A JP2004205679A JP2002372800A JP2002372800A JP2004205679A JP 2004205679 A JP2004205679 A JP 2004205679A JP 2002372800 A JP2002372800 A JP 2002372800A JP 2002372800 A JP2002372800 A JP 2002372800A JP 2004205679 A JP2004205679 A JP 2004205679A
- Authority
- JP
- Japan
- Prior art keywords
- audio data
- sound
- audio
- data
- stored
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
【課題】機器の構成を簡易化させながら、所望の音声をノイズなくかつ高品質で出力させ得る音声データ処理装置及び方法を提案する。
【解決手段】音声データ処理装置及び方法において、所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶し、所定音を発音させる際、出力対象の第1の音声データの音声フォーマットと同じ音声フォーマットの対応する第2の音声データを、第1の音声データの一部と置き換えて出力するようにした。
【選択図】 図1
【解決手段】音声データ処理装置及び方法において、所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶し、所定音を発音させる際、出力対象の第1の音声データの音声フォーマットと同じ音声フォーマットの対応する第2の音声データを、第1の音声データの一部と置き換えて出力するようにした。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は音声データ処理装置及び方法に関し、例えばDVD(Digital Versatile Disk )プレイヤや、BS(Broadcasting Satellite)ディジタルチューナ、セットトップボックス又はPVR(Personal Video Recorder)等の内部又は外部にディジタルオーディオ出力能力を有するオーディオ機器に適用して好適なものである。
【0002】
【従来の技術】
近年、ディジタルコンテンツの音声フォーマットとして、AAC(MPEG-2, Advanced Audio Coding)方式や、ドルビー社が提案しているDD5.1(Dolby Digital 5.1)方式及びディジタルシアターシステム社が提案しているDTS方式(DTS5.1、DTS−ES6.1等)など、種々の音声フォーマットが提案されている。
【0003】
【発明が解決しようとする課題】
ところで、DVDプレイヤやBSディジタルチューナなど、複数の音声フォーマットの音声データを取り扱う機器から効果音や操作音(以下、これらをまとめて効果音等と呼ぶ)を出力する方法としては、当該機器に搭載されたビーブ音用のブザーやスピーカから直接発音させる第1の方法と、効果音等の音声データを予めPCM(Pulse Code Modulation)等の特定の圧縮音声フォーマットで機器に記憶保持させ、その発音時に効果音等の音声データを当該機器において現在出力しているコンテンツの音声データ(以下、これをコンテンツ音声データと呼ぶ)の音声フォーマットに合わせてエンコードして出力することによりスピーカから発音させる第2の方法と、機器が記憶保持している効果音データを特定音声フォーマットのまま当該機器に接続されたAV(Audio Video)アンプに出力し、当該AVアンプにおいてエンコードするようにしてスピーカから発音させる第3の方法とが考えられる。
【0004】
しかしながら、かかる第1の方法によると、効果音等の音質を向上させ難く、また多チャンネル出力の音量とのバランスがとり難いなどの問題があり、第2の方法によると、その機器が取り扱う音声フォーマットの数に応じた相当数のエンコーダを当該機器に搭載する必要があるため、機器全体の構成が煩雑化及び大型化し、高コスト化するなどの問題がある。
【0005】
さらに第3の方法によると、AVアンプによっては、出力音声が本来のコンテンツの音声からこれと異なる音声フォーマットの効果音等に切り替わる際、又は効果音等からコンテンツの音声に切り替わる際の切り替え時にノイズが発生する問題がある。またかかる問題を解決するため、切り替え時に出力音声をミュート(消音)する方法も考えられるものの、この方法によるとスムーズな音声の切り替えを行い難い問題がある。
【0006】
かかる事情に鑑み、従来のDVDプレイヤやBSディジタルチューナなどの機器では、ビープ音以外の効果音等の音声データは当該機器のアナログ出力端子から出力するのが一般的となっている。このためこの種機器においては、外部のAVアンプとの接続にコンテンツ音声データ出力用のディジタルケーブルに加えて効果音等の音声データ出力用のアナログケーブルをも必要とし、ディジタルケーブルのみの接続ではかかる機器が出力する効果音等が発音されない問題があった。
【0007】
本発明は以上の点を考慮してなされたもので、機器の構成を簡易化させながら、所望の音声をノイズなくかつ高品質で出力させ得る音声データ処理装置及び方法を提案しようとするものである。
【0008】
【課題を解決するための手段】
かかる課題を解決するため本発明においては、複数の音声フォーマットの第1の音声データを取り扱う機器に搭載される音声データ処理装置において、所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶する第1の記憶手段と、所定音を発音させる際、第1の記憶手段を制御して、出力対象の第1の音声データの音声フォーマットと同じ音声フォーマットの対応する第2の音声データを当該第1の記憶手段から読み出させ、当該第1の記憶手段から読み出された第2の音声データを、第1の音声データの一部と置き換えて出力する置換え手段とを設けるようにした。
【0009】
この結果この音声データ処理装置によれば、機器が取り扱う音声フォーマットの数に応じたエンコーダを設けることなく、また所定音の発音時にノイズを発生させずに、第1の音声データに基づく音声と同じ音質で所定音を発音させることができる。
【0010】
また本発明においては、複数の音声フォーマットの第1の音声データを取り扱う機器における音声データ処理方法において、所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶する第1のステップと、所定音を発音させる際、出力対象の第1の音声データの音声フォーマットと同じ音声フォーマットの対応する第2の音声データを、第1の音声データの一部と置き換えて出力する第2のステップとを設けるようにした。
【0011】
この結果この音声データ処理方法によれば、機器が取り扱う音声フォーマットの数に応じたエンコーダを設けることなく、また所定音の発音時にノイズを発生させずに、第1の音声データに基づく音声と同じ音質で所定音を発音させることができる。
【0012】
さらに本発明においては、複数の音声フォーマットの第1の音声データを取り扱う機器に搭載される音声データ処理装置において、所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶する第1の記憶手段と、所定音を発音させる際、第1の記憶手段を制御して、出力対象の第1の音声データの音声フォーマットと同じ音声フォーマットの対応する第2の音声データを当該第1の記憶手段から読み出させ、当該第1の記憶手段から読み出された第2の音声データを、第1の音声データの一部と置き換えて出力する置換え手段と、所定音の音声データを所望の音声フォーマットでエンコードすることにより得られた第2の音声データを記録媒体から又はネットワークを介して取得する取得手段とを設け、置換え手段は、出力対象の第1の音声データと同じ音声フォーマットの第2の音声データが第1の記憶手段に格納されていないときは、取得手段を制御して当該音声フォーマットの第2の音声データを取得させると共に、第1の記憶手段を制御して当該第2の音声データを記憶させるようにした。
【0013】
この結果この音声データ処理装置によれば、機器が取り扱う音声フォーマットの数に応じたエンコーダを設けることなく、また所定音の発音時にノイズを発生させずに、第1の音声データに基づく音声と同じ音質で所定音を発音させることができる。
【0014】
さらに本発明によれば、複数の音声フォーマットの第1の音声データを取り扱う機器における音声データ処理方法において、所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶する第1のステップと、所定音を発音させる際、記憶した複数の音声データのうち、出力対象の第1の音声データの音声フォーマットと同じ音声フォーマットの対応する第2の音声データを、第1の音声データの一部と置き換えて出力する第2のステップとを設け、第2のステップでは、出力対象の第1の音声データと同じ音声フォーマットの第2の音声データを記憶していないときは、当該音声フォーマットの第2の音声データを記録媒体から又はネットワークを介して取得して記憶するようにした。
【0015】
この結果この音声データ処理方法によれば、機器が取り扱う音声フォーマットの数に応じたエンコーダを設けることなく、また所定音の発音時にノイズを発生させずに、第1の音声データに基づく音声と同じ音質で所定音を発音させることができる。
【0016】
【発明の実施の形態】
以下図面について、本発明の一実施の形態を詳述する。
【0017】
(1)第1の実施の形態
(1−1)第1の実施の形態による音声データ処理装置の全体構成
図1において、1は全体としてPVRや、BSディジタルチューナ、セットトップボックス又はDVDプレイヤ等の複数の音声フォーマットを扱う機器に搭載される本実施の形態による音声データ処理装置を示し、それぞれ例えばシステムLSI(Large Scale Integrated Circuit)及びソフトウェアからなる入力データ処理部2、システムコントローラ3及びビットストリームコントローラ4と、例えばDRAM(Dynamic Random Access Memory)等でなるビットストリームバッファ5と、フラッシュメモリ等の不揮発性メモリでなる効果音格納メモリ6と、同じ機器内のDVDドライブ、CD(Compact Disk)ドライブ、ハードディスクドライブ、インターネット接続モジュール等でなる効果音入力部7とから構成されている。
【0018】
この場合、効果音格納メモリ6には、予め各種音色の効果音等の音声データを、それぞれACC音声フォーマットの384〔Kbps〕ビットレート、AAC音声フォーマットの256〔Kbps〕ビットレート、DTS音声フォーマットの768〔Kbps〕ビットレート及びDD5.1音声フォーマットの384〔Kbps〕ビットレート、PCM音声フォーマットの48〔KHz〕ビットレート等の各種音声フォーマット及びビットレートで、かつその音声フォーマット及びビットレートに応じたフレームサイズでエンコードすることにより得られたそれぞれフレーム単位で構成される複数の音声データ(以下、これを効果音データと呼ぶ)D1が格納されている。また効果音格納メモリ6には、そのとき格納されている効果音データD1の音声フォーマット及びビットレートの種類と、その音声フォーマット及びビットレートでの各効果音データD1のフレーム数となどの情報でなる格納効果音情報D2が格納されている。
【0019】
そして、この音声データ処理装置1では、同じ機器内部の記録媒体再生部やBSチューナ部等から与えられる音声データや映像音声データをコンテンツデータD3として入力データ処理部2に入力する。
【0020】
入力データ処理部2は、供給されるコンテンツデータD3について、システムコントローラ3の制御のもとに、複数の音声フォーマットの音声データを含んでいる場合の出力すべき音声フォーマットの選択処理や、多重化されたコンテンツの分離処理等の所定の信号処理を施し、かくして得られたそのコンテンツの音声データでなるコンテンツ音声データD4と、そのコンテンツ音声データD4の音声フォーマットやビットレート、フレームサイズ及びチャンネル数等の付加情報でなるコンテンツ音声付加情報D5とをビットストリームバッファ5に送出する。
【0021】
ビットストリームバッファ5は、供給されるコンテンツ音声データD4及びコンテンツ音声付加情報D5を順次記憶すると共に、当該記憶したコンテンツ音声データD4をビットストリームコントローラ4の制御のもとに順次読み出し、これを同じ機器内部の図示しないオーディオデコーダモジュール又は図示しないディジタル出力端子を介して外部のオーディオデコーダに出力する。
【0022】
この結果、この内部のオーディオデコーダモジュール又は外部のオーディオデコーダにおいてコンテンツ音声データD4がデコードされ、得られた音声データがアナログ変換された後スピーカに与えられることにより、このコンテンツ音声データD4に基づくコンテンツの音声がそのスピーカから発音されることとなる。
【0023】
またこのとき入力データ処理部2は、そのとき出力しているコンテンツ音声データD4の音声フォーマット及びビットレート等のデータ構造に関する情報をデータ構成情報D6としてシステムコントローラ3及びビットストリームコントローラ4に送出する。
【0024】
そしてビットストリームコントローラ4は、供給されるデータ構造情報D6に基づいて、この後必要時に出力する効果音等の音声フォーマット及びビットレートとして、そのとき入力データ処理部2が出力しているコンテンツ音声データD4と同じ音声フォーマット及びビットレートを選択する。
【0025】
この際ビットストリームコントローラ4は、そのとき入力データ処理部2が出力しているコンテンツ音声データD4と同じ音声フォーマット及びビットレートでエンコードされた各種音色の効果音等の効果音データD1が効果音格納メモリ6に格納されていない場合には、効果音入力部7及び効果音格納メモリ6を制御して、予めその機器内に装填されているDVD、CD又はハードディスク等の記録媒体からそれら効果音データD1を再生させ、又はインターネット等のネットワークを通じてそれらの効果音データD1をダウンロードさせ、かくして得られたコンテンツ音声データD4と同じ音声フォーマット及びビットレートでエンコードされた各種音色の効果音等の効果音データD1を効果音格納メモリ6に格納させると共にこれに応じて格納効果音情報D2を更新させる。
【0026】
なおこの実施の形態の場合、ビットストリームコントローラ4は、効果音格納メモリ6に格納されている各効果音データD1の使用頻度を記憶している。そしてビットストリームコントローラ4は、上述のようにして新たな音声フォーマット及びビットレートの効果音データD1を効果音格納メモリ6に取り込むに際して当該効果音格納メモリ6の記憶容量が不足している場合など、効果音格納メモリ6に格納されたいずれかの効果音データD1の削除が必要となったときには、効果音格納メモリ6を制御して、使用頻度の少ない効果音データD1を削除させるようになされている。
【0027】
これによりこの音声データ処理装置1においては、効果音格納メモリ6を有効に利用することができ、その分効果音格納メモリ6として記憶容量が格段的に大きいものを必要としないことから、より一層と当該音声データ処理装置が搭載された機器全体の小型化や低コスト化を図ることができるようになされている。
【0028】
一方、システムコントローラ3においては、他の同じ機器内のビデオ関連のモジュールや、ユーザインターフェース、システムクロック及びデバイス制御関連の他のモジュールと接続されており、ビデオ関連又はデバイス関連のモジュールから効果音を出力すべき要請が与えられ、又はユーザインターフェースを介してユーザからの操作入力が与えられると、これに応じた効果音又は操作音の出力指令(以下、これを効果音出力指令と呼ぶ)COM1をビットストリームコントローラ4に与える。
【0029】
このときビットストリームコントローラ4は、システムコントローラ3から与えられる効果音出力指令COM1に基づいて効果音格納メモリ6を制御し、現在入力データ処理部2が出力しているコンテンツ音声データD4と同じ音声フォーマット及びビットレートでエンコードされた各種音色の効果音等のうち、指定された効果音等の効果音データD1を読み出させる。
【0030】
またビットストリームコントローラ4は、これと同時にビットストリームバッファ5を制御して、この効果音格納メモリ6から読み出された効果音データD1を、そのときビットストリームバッファ5が蓄えているコンテンツ音声データD4の一部とフレーム単位で順次置き換えるようにして当該ビットストリームバッファ5に記憶させる。なお、このような効果音格納メモリ6の制御と、かかる置換え処理はシステムクロックに同期して、ビットストリームバッファ5がコンテンツ音声データD4を1フレーム分出力する時間間隔以内に行われる。
【0031】
この結果、かかる効果音データD1は、やがてビットストリームコントローラ4の制御のもとに前後のコンテンツ音声データD4と共に順次ビットストリームバッファ5から読み出され、この後上述のようにコンテンツ音声データD4と共にデコードされ、アナログ変換されてスピーカに与えられる。
【0032】
このようにしてこの音声データ処理装置1では、必要な効果音等をコンテンツの音声と同じスピーカから発音させ得るようになされている。
【0033】
なおこの実施の形態の場合、ビットストリームコントローラ4は、上述のように効果音格納メモリ6から読み出した効果音データD1をビットストリームバッファ5に格納されているコンテンツ音声データD4の一部と置き換えさせる際、予めそのときビットストリームバッファ5に格納されているコンテンツ音声データD4のうち、当該コンテンツ音声データD4に基づく音声の音量レベルが最も小さい箇所を探し出して、当該箇所のコンテンツ音声データD4と効果音データD1とを置き換えさせるようになされている。これによりこのデータ処理装置1では、スピーカから効果音等が発音される際における当該効果音等の出力前後においての急激な音量変化を未然に防止させ得るようになされている。
【0034】
(1−2)ビットストリームコントローラ4の各種処理手順
ここで、実際上、ビットストリームコントローラ4は、入力データ処理部2からデータ構造情報D6が与えられたときに、図2に示す効果音音声フォーマット選択処理手順RT1に従って、ユーザ操作時等の必要時に出力すべき効果音等の音声フォーマットを選択する。
【0035】
すなわちビットストリームコントローラ4は、入力データ処理部2からデータ構造情報D6が与えられるとこの効果音音声フォーマット選択処理手順RT1をステップSP0において開始し、続くステップSP1において、当該データ構造情報D6に基づいて、そのとき入力データ処理部2から出力されているコンテンツ音声データD4の音声フォーマット及びビットレートを取得し、認識する。
【0036】
続いてビットストリームコントローラ4は、ステップSP2に進んで、かかるステップSP1において認識した音声フォーマットと同じ音声フォーマット及びビットレートでエンコードされた各種音色の効果音等の効果音データD1が効果音格納メモリ6に既に格納されているか否かを、効果音格納メモリ6に格納されている格納効果音情報D2に基づいて判断する。
【0037】
そしてビットストリームコントローラ4は、このステップSP2において肯定結果を得るとステップSP4に進み、これに対して否定結果を得るとステップSP3に進んで、効果音入力部7及び効果音格納メモリ6を制御して、対応する音声フォーマット及びビットレートでエンコードされた各種音色の効果音等の効果音データD1をDVD等の記録媒体から再生させ又はネットワークからダウンロードさせて効果音格納メモリ6に格納させ、かつこれに応じて格納効果音情報D2を更新した後、ステップSP4に進む。
【0038】
そしてビットストリームコントローラ4は、このステップSP4において、この後必要時に出力する効果音等の音声フォーマット及びビットレートとしてステップSP1において認識した音声フォーマット及びビットレートを選択し、内部設定を切り替えた後、ステップSP5に進んでこの効果音フォーマット選択処理手順RT1を終了する。
【0039】
またビットストリームコントローラ4は、この後図3に示す第1の効果音発音処理手順RT2に従って対応する効果音等の出力処理を実行する。
【0040】
すなわちビットストリームコントローラ4は、システムコントローラ3から効果音出力指令COM1が与えられると、この第1の効果音発音処理手順RT2をステップSP10において開始し、続くステップSP11において、出力すべき効果音等のフレーム数を効果音格納メモリ6に格納されている格納効果音情報D2に基づいて取得し、認識する。
【0041】
続いてビットストリームコントローラ4は、ステップSP12に進んで、ビットストリームバッファ5が記憶している上述のコンテンツ音声付加情報D5に基づいて、そのときビットストリームバッファ5に格納されているコンテンツ音声データD4におけるフレームの区切り目の位置(アドレス)を検出する。
【0042】
次いでビットストリームコントローラ4は、ステップSP13に進んで、効果音出力指令COM1が与えられてから予め設定された所定時間(例えば0.5秒)が経過していないか否か、及びそのときビットストリームバッファ5が記憶しているコンテンツ音声データD4の1つのフレームについて、そのフレームにおける平均の音声レベル(信号レベル)を検出すると共にその音声レベルが予め設定された閾値以上であるか否かをそれぞれ判断する。
【0043】
そしてビットストリームコントローラ4は、これら2つの判断結果として共に肯定結果を得ると、ビットストリームバッファ5に格納されているコンテンツ音声データD4におけるこれ以降の各フレームについて、同様の判断処理を順次繰り返す。
【0044】
そしてビットストリームコントローラ4は、やがてかかる所定時間が経過し又は平均の音声レベルが閾値以上のフレームを検出することによりこのステップSP13において否定結果を得ると、ステップSP14に進んで、ビットストリームバッファ5に格納されたコンテンツ音声付加情報D5に基づいて、そのとき当該ビットストリームバッファ5に1フレーム分以上のコンテンツ音声データD4が格納されているか否かを判断する。
【0045】
そしてビットストリームコントローラ4は、このとき否定結果を得ると、この後このステップSP14において肯定結果を得るのを待ち受け、やがてビットストリームバッファ5に1フレーム分以上のコンテンツ音声データD4が格納されることによりこのステップSP14において肯定結果を得ると、ステップSP15に進んで、そのときまでに後述のようにして削除したコンテンツ音声データD4の合計フレーム数がステップSP11において認識した対応する効果音データD1のフレーム数未満であるか否かを判断する。
【0046】
ビットストリームコントローラ4は、このステップSP15において否定結果を得るとステップSP17に進み、これに対して肯定結果を得るとステップSP16に進んで、ビットストリームバッファ5に格納されているコンテンツ音声データD4における所定の1フレーム、具体的には、効果音データD1の最初のフレームを入力する場合でかつステップSP13において平均の音声レベルが閾値未満のフレームを検出できた場合にはそのフレーム、検出できなかった場合にはビットストリームバッファ5に保存されている中で最小音量のフレーム、音量の検出が不可能な場合はビットストリームバッファ5に保存されている先頭のフレームを削除し、そのアドレス及びそのときまでに削除したコンテンツ音声データD4のフレーム数を記憶した後、ステップSP17に進む。
【0047】
さらにビットストリームコントローラ4は、このステップSP17において、ビットストリームバッファ5に格納されたコンテンツ音声付加情報D5に基づいて、当該ビットストリームバッファ5に、そのとき置き換えようとしている効果音データD1の1フレーム分以上の空きがあるか否かを判断する。そしてビットストリームコントローラ4は、このステップSP17において否定結果を得るとステップSP14に戻り、この後ステップSP17において肯定結果を得るまでステップSP14〜SP17−SP14のループを繰り返す。
【0048】
そしてビットストリームコントローラ4は、やがてこのステップSP17において肯定結果を得ると、ステップSP18に進んで、かかる1フレーム分の未出力の効果音データD1をビットストリームバッファ5におけるステップSP16において削除したコンテンツ音声データD4のフレームの箇所に格納する。
【0049】
さらにビットストリームコントローラ4は、この後ステップSP19に進んで、かかる効果音データD1の全フレームのデータをコンテンツ音声データD4のその後連続する各フレームのデータと置き換え終えたか否かを判断する。
【0050】
そしてビットストリームコントローラ4は、このステップSP19において否定結果を得るとステップSP14に戻り、この後このステップSP19において肯定結果を得るまでステップSP14〜SP19−SP14のループを繰り返すことにより、かかる効果音データD1の各フレームのデータをコンテンツ音声データD1のその後連続する各フレームのデータと順次置き換える。
【0051】
そしてビットストリームコントローラ4は、やがてかかる効果音データD1の全フレームのデータをコンテンツ音声データD1の対応する各フレームのデータと置き換え終えることによりこのステップSP19において肯定結果を得ると、ステップSP20に進んでこの第1の効果音発音処理手順RT2を終了する。
【0052】
(1−3)本実施の形態の動作及び効果
以上の構成において、この音声データ処理装置1では、各種音声フォーマット及びビットレートでエンコードされた各種音色の効果音等の効果音データD1を予め効果音格納メモリ6に保持し、その出力時には、そのとき出力しているコンテンツ音声データD4と同じ音声フォーマット及びビットレートでエンコードされた指定された音色の効果音等の効果音データD1を効果音格納メモリ6から読み出し、これをそのときストリームバッファ5に格納されているコンテンツ音声データD4の一部と置き換えて出力する。
【0053】
従って、この音声データ処理装置1は、効果音等の発音のためにその機器が取り扱う各音声フォーマットにそれぞれ対応したデコーダを必要とせず、その分機器全体の構成が煩雑化及び大型化し、高コスト化するのを未然に防止することができる。
【0054】
またこの音声データ処理装置1では、上述のように出力対象のコンテンツ音声データD4の一部と、これと同じ音声フォーマットの効果音データD1を置き換えて出力するため、効果音等の発音の前後においてノイズを発生させることなく、高音質の効果音等をスピーカから発音させることができる。
【0055】
以上の構成によれば、各種音声フォーマット及びビットレートでエンコードされた各種音色の効果音等の効果音データD1を予め効果音格納メモリ6に保持し、その出力時には、そのとき出力しているコンテンツ音声データD4と同じ音声フォーマット及びビットレートでエンコードされた指定された音色の効果音等の効果音データD1を効果音格納メモリ6から読み出し、これをそのときストリームバッファ5に格納されているコンテンツ音声データD4の一部と置き換えて出力するようにしたことにより、効果音の発音のためにその機器が取り扱う各音声フォーマットにそれぞれ対応したデコーダを必要とせず、また効果音等の発音の前後においてノイズを発生させることなく、高音質の効果音等をスピーカから発音させることができ、かくして機器の構成を簡易化させながら、効果音等をノイズなくかつ高品質で出力させ得る音声データ処理装置を実現できる。
【0056】
(2)第2の実施の形態
(2−1)第2の実施の形態による音声データ処理装置の全体構成
図1との対応部分に同一符号を付して示す図4は、第2の実施の形態による音声データ処理装置10を示し、DRAMでなるビットストリームバッファ11の後段にストリーム切替え部13が設けられ、当該ストリーム切替え部13における出力データの切替え処理により、効果音データD1をコンテンツ音声データD4の一部と置き換えて出力し得るようになされている。
【0057】
実際上、この音声データ処理装置10において、ビットストリームバッファ11は、上述のように入力データ処理部2から供給されるコンテンツ音声データD4及びコンテンツ音声付加情報D5を順次記憶すると共に、当該記憶したコンテンツ音声データD4をビットストリームコントローラ12の制御のもとに順次読み出し、これをストリーム切替え部13に送出する。
【0058】
ストリーム切替え部13は、例えば汎用ロジックIC(Integrated Circuit)から構成され、その内部にはコンテンツ音声データD4及び効果音データD1間の切り替え時やコンテンツ音声データD4が可変長符号化(VBR:Variable Bit Rate)されているときなどにおける緩衝のためのFIFO(First-In First-Out)等でなるバッファメモリ14が設けられている。
【0059】
またストリーム切替え部13においては、第1〜第3の入力切替端151〜153と第1及び第2の出力切替え端161、162とが設けられ、ビットストリームコントローラ12の制御によって、図4のように第2の入力切替端152及び第1の出力切替端161間が導通すると共に第3の入力切替端153及び第2の出力切替端162が導通する第1の切替えモードと、図5ように第1の入力切替端151及び第1の出力切替端161間が導通すると共に第2の入力切替端152及び第2の出力切替端162間が導通する第2の切替えモードとに動作モードを相互に切り替えさせ得るようになされている。
【0060】
そしてストリーム切替え部13においては、効果音格納メモリ6からの効果音データを第1の入力切替端151に入力し、ビットストリームバッファ11からのコンテンツ音声データD4をバッファメモリ14を介して第2の入力切替端152に入力するようになされており、これにより第1の切替えモード時には、ビットストリームバッファ11からのコンテンツ音声データD4を第1の出力切替端161を介して出力し得、第2の切替えモード時には、効果音格納メモリ6からの効果音データD1を第1の出力切替端161を介して出力し、かつビットストリームバッファ5からのコンテンツ音声データD2を第2の出力切替端162を介して廃棄し得るようになされている。
【0061】
かくしてビットストリームコントローラ12においては、通常時には、ストリーム切替え部13を制御してその動作モードを第1の切替えモードに設定することにより、ビットストリームバッファ11から出力されたコンテンツ音声データD4を、ストリーム切替え部13を介して後段に設けられた同じ機器内の図示しないオーディオデコーダモジュール又は図示しないディジタル出力端子を介して外部のオーディオデコーダに出力させる。
【0062】
この結果、この内部のオーディオデコーダモジュール又は外部のオーディオデコーダにおいてコンテンツ音声データD4がデコードされ、得られた音声データがアナログ変換された後スピーカに出力される。これによりこのコンテンツ音声データD4に基づくそのコンテンツの音声がそのスピーカを介して外部に発音されることとなる。
【0063】
またこのときビットストリームコントローラ12は、第1の実施の形態の場合と同様にして、図2について上述した効果音フォーマット選択処理手順RT1を実行することにより、この後必要時に出力する効果音等の音声フォーマットとしてそのときビットストリームバッファ11が出力しているコンテンツ音声データD4と同じ音声フォーマット及びビットレートを選択する。
【0064】
一方、ビットストリームコントローラ12は、この後システムコントローラ3から効果音出力指示COM1が与えられると、ビットストリームバッファ11に格納されたコンテンツ音声付加情報D5に基づき、システムクロックに同期してストリーム切替え部13を制御することにより、コンテンツ音声データD4のフレームの区切り目のタイミングでその動作モードを第2の切替えモードに切り替えさせる。
【0065】
またビットストリームコントローラ12は、これと同時に効果音格納メモリ6を制御して、そのときビットストリームバッファ11が出力しているコンテンツ音声データD4と同じ音声フォーマット及びビットレートでエンコードされた指定された音色の操作音等の効果音データD1を読み出させる。
【0066】
この結果、ストリーム切替え部13からの出力がコンテンツ音声データD4のフレームの区切り目のタイミングで効果音データD1に切り替わり、これが上述の内部のオーディオデコーダモジュール又は外部のオーディオデコーダに出力されることにより、当該効果音データD1に基づく効果音等がスピーカを介して発音される。
【0067】
さらにビットストリームコントローラ12は、その後効果音格納メモリ6がその効果音データD1を全て読み出し終えると、ビットストリームバッファ11に格納されたコンテンツ音声付加情報D5に基づき、システムクロックに同期してストリーム切替え部13を制御することにより、かかる効果音データD1の最後のフレームが出力し終えたタイミングでその動作モードを第1の切替えモードに切り替えさせる。
【0068】
また、この際ビットストリームコントローラ12は、例えばコンテンツ音声データD4が可変長符号化されていて1フレームのデータサイズが固定長でない場合などには、ストリーム切替え部13内のバッファメモリ14を利用してビットストリームバッファ11が破綻しないように、かつ効果音データD1の最後のフレームに続けてコンテンツ音声データD4をフレームの区切り目から出力できるようにストリーム切替え部13を制御する。
【0069】
この結果、ストリーム切替え部13からの出力が効果音データD1の最後のフレームを出力し終えたタイミングでコンテンツ音声データD4に切り替わり、これが上述の内部のオーディオデコーダモジュール又は外部のオーディオデコーダに出力されることにより、かかるスピーカを介して発音される音声が効果音からコンテンツの音声に戻ることとなる。
【0070】
このようにしてこの音声データ処理装置1では、必要な効果音等をコンテンツの音声と同じスピーカから発音させ得るようになされている。
【0071】
(2−2)本実施の形態におけるビットストリームコントローラ12の処理
ここで、ビットストリームコントローラ12は、上述のような対応する効果音等の出力処理を図6に示す第2の効果音発音処理手順RT3に従って実行する。
【0072】
すなわちビットストリームコントローラ12は、システムコントローラ3から効果音出力指令COM1が与えられると、この第2の効果音発音処理手順RT3をステップSP30において開始し、続くステップSP31〜ステップSP33までを図3について上述した第1の効果音発音処理手順RT1のステップSP11〜ステップSP13までと同様に処理する。
【0073】
そしてビットストリームコントローラ12は、この後ステップSP34に進むと、ストリーム切替え部13を制御して、コンテンツ音声データD4のフレームの区切り目のタイミングでその動作モードを第2の切替えモードに切り替えさせると共に、続くステップSP35において効果音格納メモリ6を制御することにより、そのときビットストリームバッファ11が出力しているコンテンツ音声データD4と同じ音声フォーマット及びビットレートでエンコードされた指定された音色の効果音等の効果音データD1を1フレーム分だけ読み出させ、ストリーム切替え部13内のバッファメモリ14中に存在するコンテンツ音声データD4を破棄する。
【0074】
さらにビットストリームコントローラ12は、この後ステップSP36に進んで、ステップSP31において取得したその効果音データD1のフレーム数に基づいて、当該効果音データD1の全てのフレームを出力し終えたか否かを判断する。そしてビットストリームコントローラ12は、このステップSP36において否定結果を得るとステップSP35に戻り、この後このステップSP36において肯定結果を得るまでステップSP35−SP36−SP35のループを繰り返す。
【0075】
そしてビットストリームコントローラ12は、やがて効果音データD1の全てのフレームを出力し終えることによりステップSP36において肯定結果を得ると、ステップSP37に進んで、ストリーム切替え部13を制御することにより、かかる効果音データD1の最後のフレームが出力し終えたタイミングでその動作モードを第1の切替えモードに切り替えさせる。
【0076】
この際、ビットストリームコントローラ12は、コンテンツ音声データD4のフレームの区切れ目のタイミングで当該コンテンツ音声データD4に切り替わるように、必要に応じてストリーム切替え部13のバッファメモリ14から読み出されるコンテンツ音声データD4の読み出し開始のタイミングを制御する。
【0077】
そしてビットストリームコントローラ12は、この後ステップSP38に進んでこの第2の効果音発音処理手順RT3を終了する。
【0078】
(2−3)本実施の形態の動作及び効果
以上の構成において、この音声データ処理装置10では、各種音声フォーマットでエンコードされた各種音色の効果音等の効果音データD1を予め効果音格納メモリ6に保持し、必要時にそのとき出力しているコンテンツ音声データD4と同じ音声フォーマット及びビットレートでエンコードされた指定された音色の効果音等の効果音データD1を効果音格納メモリ6から読み出し、これをそのときビットストリームバッファ5から出力されているコンテンツ音声データD4の一部とストリーム切替え部13における出力データの切替え処理により置き換えて出力する。
【0079】
従って、この音声データ処理装置10は、第1の実施の形態による音声データ処理装置1と同様に、効果音の発音のためにその機器が取り扱う各音声フォーマットにそれぞれ対応したデコーダを必要とせず、また効果音等の発音の前後においてノイズを発生させることなく、高音質の効果音等をスピーカから発音させることができる。
【0080】
以上の構成によれば、各種音声フォーマットでエンコードされた各種音色の効果音等の効果音データD1を予め効果音格納メモリ6に保持し、必要時にそのとき出力しているコンテンツ音声データD4と同じ音声フォーマット及びビットレートでエンコードされた指定された音色の効果音等の効果音データD1を効果音格納メモリ6から読み出し、これをそのときストリームバッファ5から出力されているコンテンツ音声データD4の一部とストリーム切替え部13における出力データの切替え処理により置き換えて出力するようにしたことにより、効果音の発音のためにその機器が取り扱う各音声フォーマットにそれぞれ対応したデコーダを必要とせず、また効果音等の発音の前後においてノイズを発生させることなく、高音質の効果音等をスピーカから発音させることができ、かくして機器の構成を簡易化させながら、効果音等をノイズなくかつ高品質で出力させ得る音声データ処理装置を実現できる。
【0081】
(3)他の実施の形態
なお上述の第1及び第2の実施の形態においては、ビットストリームコントローラ4、12を他のシステムコントローラ3や入力データ処理部2等のモジュールと別体に形成するようにした場合について述べたが、本発明はこれに限らず、要は、システムコントローラ3等の各モジュールと接続され、各指令や情報を送受信することができるようにするのであれば他のモジュールと一体に形成するようにしても良い。この場合において、例えばシステムコントローラ3や入力データ処理部2にビットストリームコントローラ4、12と同等の機能をもたせるようにしても良く、このようにすることによって、ビットストリームコントローラ4、12を独立に構成する場合に比べて、通信経路の短縮によるエラーの減少や実装面積及び部品などの削減という新たな効果を得ることができる。
【0082】
また上述の第1及び第2の実施の形態においては、効果音及び操作音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の音声データを記憶する記憶手段としての効果音格納メモリ6をフラッシュメモリにより構成するようにした場合について述べたが、本発明はこれに限らず、要は、コンテンツと同等の音声フォーマットのデータが格納でき、またコンテンツ音声データD4と同等の出力レート(可変長符号化されている場合には最大出力レート)以上で出力可能な伝送レートを有するモジュールであればフラッシュメモリ以外の例えばDRAMやDVD又はハードディスク装置等を適用するようにしても良い。これらに置き換えた場合、メディアによって様々な利点や欠点(コスト、交換の容易さ、容量の大きさ等)があるので、本発明を適用する機器によって選択して採用することで、そのメディアの利点を生かすことができる。また効果音格納メモリ6が半導体メモリによって構成されている場合、第1及び第2の実施の形態のように独立したモジュール構成を採らずに例えばビットストリームコントローラ4、12に内蔵させるようにしても良い。
【0083】
さらに上述の第1及び第2の実施の形態においては、入力データ処理部2をシステムコントローラ3等の他のモジュールとは別体に構成するようにした場合について述べたが、本発明はこれに限らず、例えばシステムコントローラ3に同等の機能をもたせるようにしても良い。
【0084】
さらに上述の第1及び第2の実施の実施の形態においては、ビットストリームバッファ5、11をDRAMにより構成するようにした場合について述べたが、本発明はこれに限らず、要は、コンテンツ音声データD4を一時的に蓄えることができるモジュールであればSRAM等の他のモジュールを適用するようにしても良い。
【0085】
さらに上述の第1及び第2の実施の実施の形態においては、ビットストリームバッファ5、11をシステムコントローラ3等の他のモジュールとは別体に形成するようにした場合について述べたが、本発明はこれに限らず、ビットストリームバッファ5、11をビットストリームコントローラ4、12又は入力データ処理部2等の他のモジュールに内蔵させるようにしても良い。このようにすることによって、実装面積の削減を図れるという効果を得ることができる。
【0086】
さらに上述の第2の実施の形態においては、ストリーム切替え部13を汎用ロジックICにより構成するようにした場合について述べたが、本発明はこれに限らず、要は、2つの入力ビットストリームを瞬間的(切り替わり時にエラーが発生しない時間内)に切替えられるものであれば、その構成としては汎用ロジックIC以外の例えばシステムLSI等の他の形態を広く適用するようにしても良い。
【0087】
さらに上述の第2の実施の形態においては、ストリーム切替え部13をシステムコントローラ3等の他のモジュールから独立した構成とするようにした場合について述べたが、本発明はこれに限らず、ビットストリームコントローラ12に内蔵させるようにしても良い。このようにすることによって、実装面積の削減や動作の高速化、コストの削減といった効果を得ることができる。
【0088】
さらに上述の第2の実施の形態においては、ストリーム切替え部13内に記憶手段としてのバッファメモリ14を設けるようにした場合について述べたが、本発明はこれに限らず、例えば可変長符号化の音声フォーマットをサポートしないのであれば、バッファメモリ14を省略するようにしても良い。
【0089】
さらに上述の第1及び第2の実施の形態においては、効果音入力部7が機器内に装填されているDVD、CD又はハードディスク等の記録媒体から必要な効果音データD1を再生し、又はインターネット等のネットワークを通じて必要な効果音データD1をダウンロードするようにした場合について述べたが、本発明はこれに限らず、要は、必要な効果音データD1を効果音格納メモリ6に供給し得るような手段であれば、この他種々の手段を広く適用することができる。また場合に応じてこの効果音入力部7を省略するようにしても良い。
【0090】
さらに上述の第1及び第2の実施の形態においては、第1又は第2の効果音発音処理手順RT2、RT3のステップSP13又はSP33の処理において、コンテンツ音声データD4の音量レベルの小さな部分で効果音データD1に置き換える場合について述べたが、本発明はこれに限らず、コンテンツ音声データD4の音量レベルの小さな部分以外の部分で効果音データD1に置き換えるようにしても良い。
【0091】
さらに上述の第1及び第2の実施の形態においては、システムコントローラ3をシステムLSI及びソフトウェアにより構成するようにした場合について述べたが、本発明はこれに限らず、他のモジュールを統括できるのであればその形態はこれ以外であっても良い。
【0092】
さらに上述の第1及び第2の実施の形態においては、システムコントローラ3をビットストリームコントローラ4等の他のモジュールと別体に形成するようにした場合について述べたが、本発明はこれに限らず、例えばビットストリームコントローラ4や入力データ処理部2と一体に形成するようにしても良い。
【0093】
さらに上述の第1及び第2の実施の形態においては、コンテンツ音声データD4と入れ替える所定音が効果音又は操作音である場合について述べたが、本発明はこれに限らず、これ以外の各種音声をコンテンツ音声データD4と置き換える場合にも本発明を広く適用することができる。
【0094】
さらに上述の第1の実施の形態においては、所定音を発音させる際、出力対象のコンテンツ音声データD4と同じ音声フォーマットの対応する効果音データD1を効果音格納メモリ6に読み出させ、当該効果音格納メモリ6から読み出された効果音データD1をコンテンツ音声データD4の一部と置き換えて出力する置換え手段を、システムLSI及びソフトウェアからなる制御手段としてのビットストリームコントローラ4と、DRAMからなる記憶手段としてのビットストリームバッファ5とにより構成するようにした場合について述べたが、本発明はこれに限らず、この他種々の構成を広く適用することができる。
【0095】
同様に、上述の第2の実施の形態においては、かかる置換え手段を、システムLSI及びソフトウェアからなる制御手段としてのビットストリームコントローラ12と、汎用ロジックICからなる切替え手段としてのストリーム切替え部13とにより構成するようにした場合について述べたが、本発明はこれに限らず、この他種々の構成を広く適用することができる。
【0096】
【発明の効果】
上述のように本発明によれば、複数の音声フォーマットの第1の音声データを取り扱う機器に搭載される音声データ処理装置において、所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶する第1の記憶手段と、所定音を発音させる際、第1の記憶手段を制御して、出力対象の第1の音声データの音声フォーマットと同じ音声フォーマットの対応する第2の音声データを当該第1の記憶手段から読み出させ、当該第1の記憶手段から読み出された第2の音声データを、第1の音声データの一部と置き換えて出力する置換え手段とを設けるようにしたことにより、機器が取り扱う音声フォーマットの数に応じたエンコーダを設けることなく、また所定音の発音時にノイズを発生させずに、第1の音声データに基づく音声と同じ音質で所定音を発音させることができ、かくして機器の構成を簡易化させながら、所望の音声をノイズなくかつ高品質で出力させ得る音声データ処理装置を実現できる。
【0097】
また本発明によれば、複数の音声フォーマットの第1の音声データを取り扱う機器における音声データ処理方法において、所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶する第1のステップと、所定音を発音させる際、出力対象の第1の音声データの音声フォーマットと同じ音声フォーマットの対応する第2の音声データを、第1の音声データの一部と置き換えて出力する第2のステップとを設けるようにしたことにより、機器が取り扱う音声フォーマットの数に応じたエンコーダを設けることなく、また所定音の発音時にノイズを発生させずに、第1の音声データに基づく音声と同じ音質で所定音を発音させることができ、かくして機器の構成を簡易化させながら、所望の音声をノイズなくかつ高品質で出力させ得る音声データ処理方法を実現できる。
【0098】
さらに本発明によれば、複数の音声フォーマットの第1の音声データを取り扱う機器に搭載される音声データ処理装置において、所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶する第1の記憶手段と、所定音を発音させる際、出力対象の第1の音声データの音声フォーマットと同じ音声フォーマットの対応する第2の音声データを第1の記憶手段から読み出させ、当該第1の記憶手段から読み出された第2の音声データを、第1の音声データの一部と置き換えて出力する置換え手段と、所定音の音声データを所望の音声フォーマットでエンコードすることにより得られた第2の音声データを記録媒体から又はネットワークを介して取得する取得手段とを設け、置換え手段は、出力対象の第1の音声データと同じ音声フォーマットの第2の音声データが第1の記憶手段に格納されていないときは、取得手段を制御して当該音声フォーマットの第2の音声データを取得させると共に、第1の記憶手段を制御して当該第2の音声データを記憶させるようにしたことにより、機器が取り扱う音声フォーマットの数に応じたエンコーダを設けることなく、また所定音の発音時にノイズを発生させずに、第1の音声データに基づく音声と同じ音質で所定音を発音させることができ、かくして機器の構成を簡易化させながら、所望の音声をノイズなくかつ高品質で出力させ得る音声データ処理装置を実現できる。
【0099】
さらに本発明によれば、複数の音声フォーマットの第1の音声データを取り扱う機器における音声データ処理方法において、所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶する第1のステップと、所定音を発音させる際、記憶した複数の音声データのうち、出力対象の第1の音声データの音声フォーマットと同じ音声フォーマットの対応する第2の音声データを、第1の音声データの一部と置き換えて出力する第2のステップとを設け、第2のステップでは、出力対象の第1の音声データと同じ音声フォーマットの第2の音声データを記憶していないときは、当該音声フォーマットの第2の音声データを記録媒体から又はネットワークを介して取得して記憶するようにしたことにより、機器が取り扱う音声フォーマットの数に応じたエンコーダを設けることなく、また所定音の発音時にノイズを発生させずに、第1の音声データに基づく音声と同じ音質で所定音を発音させることができ、かくして機器の構成を簡易化させながら、所望の音声をノイズなくかつ高品質で出力させ得る音声データ処理方法を実現できる。
【図面の簡単な説明】
【図1】第1の実施の形態による音声データ処理装置の全体構成を示すブロック図である。
【図2】効果音フォーマット選択処理手順を示すフローチャートである。
【図3】第1の効果音発音処理手順を示すフローチャートである。
【図4】第2の実施の形態による音声データ処理装置の全体構成を示すブロック図である。
【図5】第2の効果音発音処理手順を示すフローチャートである。
【図6】第2の効果音発音処理手順を示すフローチャートである。
【符号の説明】
1、10……音声データ処理装置、2……入力データ処理部、3……システムコントローラ、4、12……ビットストリームコントローラ、5、11……ビットストリームバッファ、6……効果音格納メモリ、7……効果音入力部、13……ストリーム切替え部、D1……効果音データ、D4……コンテンツ音声データ。
【発明の属する技術分野】
本発明は音声データ処理装置及び方法に関し、例えばDVD(Digital Versatile Disk )プレイヤや、BS(Broadcasting Satellite)ディジタルチューナ、セットトップボックス又はPVR(Personal Video Recorder)等の内部又は外部にディジタルオーディオ出力能力を有するオーディオ機器に適用して好適なものである。
【0002】
【従来の技術】
近年、ディジタルコンテンツの音声フォーマットとして、AAC(MPEG-2, Advanced Audio Coding)方式や、ドルビー社が提案しているDD5.1(Dolby Digital 5.1)方式及びディジタルシアターシステム社が提案しているDTS方式(DTS5.1、DTS−ES6.1等)など、種々の音声フォーマットが提案されている。
【0003】
【発明が解決しようとする課題】
ところで、DVDプレイヤやBSディジタルチューナなど、複数の音声フォーマットの音声データを取り扱う機器から効果音や操作音(以下、これらをまとめて効果音等と呼ぶ)を出力する方法としては、当該機器に搭載されたビーブ音用のブザーやスピーカから直接発音させる第1の方法と、効果音等の音声データを予めPCM(Pulse Code Modulation)等の特定の圧縮音声フォーマットで機器に記憶保持させ、その発音時に効果音等の音声データを当該機器において現在出力しているコンテンツの音声データ(以下、これをコンテンツ音声データと呼ぶ)の音声フォーマットに合わせてエンコードして出力することによりスピーカから発音させる第2の方法と、機器が記憶保持している効果音データを特定音声フォーマットのまま当該機器に接続されたAV(Audio Video)アンプに出力し、当該AVアンプにおいてエンコードするようにしてスピーカから発音させる第3の方法とが考えられる。
【0004】
しかしながら、かかる第1の方法によると、効果音等の音質を向上させ難く、また多チャンネル出力の音量とのバランスがとり難いなどの問題があり、第2の方法によると、その機器が取り扱う音声フォーマットの数に応じた相当数のエンコーダを当該機器に搭載する必要があるため、機器全体の構成が煩雑化及び大型化し、高コスト化するなどの問題がある。
【0005】
さらに第3の方法によると、AVアンプによっては、出力音声が本来のコンテンツの音声からこれと異なる音声フォーマットの効果音等に切り替わる際、又は効果音等からコンテンツの音声に切り替わる際の切り替え時にノイズが発生する問題がある。またかかる問題を解決するため、切り替え時に出力音声をミュート(消音)する方法も考えられるものの、この方法によるとスムーズな音声の切り替えを行い難い問題がある。
【0006】
かかる事情に鑑み、従来のDVDプレイヤやBSディジタルチューナなどの機器では、ビープ音以外の効果音等の音声データは当該機器のアナログ出力端子から出力するのが一般的となっている。このためこの種機器においては、外部のAVアンプとの接続にコンテンツ音声データ出力用のディジタルケーブルに加えて効果音等の音声データ出力用のアナログケーブルをも必要とし、ディジタルケーブルのみの接続ではかかる機器が出力する効果音等が発音されない問題があった。
【0007】
本発明は以上の点を考慮してなされたもので、機器の構成を簡易化させながら、所望の音声をノイズなくかつ高品質で出力させ得る音声データ処理装置及び方法を提案しようとするものである。
【0008】
【課題を解決するための手段】
かかる課題を解決するため本発明においては、複数の音声フォーマットの第1の音声データを取り扱う機器に搭載される音声データ処理装置において、所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶する第1の記憶手段と、所定音を発音させる際、第1の記憶手段を制御して、出力対象の第1の音声データの音声フォーマットと同じ音声フォーマットの対応する第2の音声データを当該第1の記憶手段から読み出させ、当該第1の記憶手段から読み出された第2の音声データを、第1の音声データの一部と置き換えて出力する置換え手段とを設けるようにした。
【0009】
この結果この音声データ処理装置によれば、機器が取り扱う音声フォーマットの数に応じたエンコーダを設けることなく、また所定音の発音時にノイズを発生させずに、第1の音声データに基づく音声と同じ音質で所定音を発音させることができる。
【0010】
また本発明においては、複数の音声フォーマットの第1の音声データを取り扱う機器における音声データ処理方法において、所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶する第1のステップと、所定音を発音させる際、出力対象の第1の音声データの音声フォーマットと同じ音声フォーマットの対応する第2の音声データを、第1の音声データの一部と置き換えて出力する第2のステップとを設けるようにした。
【0011】
この結果この音声データ処理方法によれば、機器が取り扱う音声フォーマットの数に応じたエンコーダを設けることなく、また所定音の発音時にノイズを発生させずに、第1の音声データに基づく音声と同じ音質で所定音を発音させることができる。
【0012】
さらに本発明においては、複数の音声フォーマットの第1の音声データを取り扱う機器に搭載される音声データ処理装置において、所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶する第1の記憶手段と、所定音を発音させる際、第1の記憶手段を制御して、出力対象の第1の音声データの音声フォーマットと同じ音声フォーマットの対応する第2の音声データを当該第1の記憶手段から読み出させ、当該第1の記憶手段から読み出された第2の音声データを、第1の音声データの一部と置き換えて出力する置換え手段と、所定音の音声データを所望の音声フォーマットでエンコードすることにより得られた第2の音声データを記録媒体から又はネットワークを介して取得する取得手段とを設け、置換え手段は、出力対象の第1の音声データと同じ音声フォーマットの第2の音声データが第1の記憶手段に格納されていないときは、取得手段を制御して当該音声フォーマットの第2の音声データを取得させると共に、第1の記憶手段を制御して当該第2の音声データを記憶させるようにした。
【0013】
この結果この音声データ処理装置によれば、機器が取り扱う音声フォーマットの数に応じたエンコーダを設けることなく、また所定音の発音時にノイズを発生させずに、第1の音声データに基づく音声と同じ音質で所定音を発音させることができる。
【0014】
さらに本発明によれば、複数の音声フォーマットの第1の音声データを取り扱う機器における音声データ処理方法において、所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶する第1のステップと、所定音を発音させる際、記憶した複数の音声データのうち、出力対象の第1の音声データの音声フォーマットと同じ音声フォーマットの対応する第2の音声データを、第1の音声データの一部と置き換えて出力する第2のステップとを設け、第2のステップでは、出力対象の第1の音声データと同じ音声フォーマットの第2の音声データを記憶していないときは、当該音声フォーマットの第2の音声データを記録媒体から又はネットワークを介して取得して記憶するようにした。
【0015】
この結果この音声データ処理方法によれば、機器が取り扱う音声フォーマットの数に応じたエンコーダを設けることなく、また所定音の発音時にノイズを発生させずに、第1の音声データに基づく音声と同じ音質で所定音を発音させることができる。
【0016】
【発明の実施の形態】
以下図面について、本発明の一実施の形態を詳述する。
【0017】
(1)第1の実施の形態
(1−1)第1の実施の形態による音声データ処理装置の全体構成
図1において、1は全体としてPVRや、BSディジタルチューナ、セットトップボックス又はDVDプレイヤ等の複数の音声フォーマットを扱う機器に搭載される本実施の形態による音声データ処理装置を示し、それぞれ例えばシステムLSI(Large Scale Integrated Circuit)及びソフトウェアからなる入力データ処理部2、システムコントローラ3及びビットストリームコントローラ4と、例えばDRAM(Dynamic Random Access Memory)等でなるビットストリームバッファ5と、フラッシュメモリ等の不揮発性メモリでなる効果音格納メモリ6と、同じ機器内のDVDドライブ、CD(Compact Disk)ドライブ、ハードディスクドライブ、インターネット接続モジュール等でなる効果音入力部7とから構成されている。
【0018】
この場合、効果音格納メモリ6には、予め各種音色の効果音等の音声データを、それぞれACC音声フォーマットの384〔Kbps〕ビットレート、AAC音声フォーマットの256〔Kbps〕ビットレート、DTS音声フォーマットの768〔Kbps〕ビットレート及びDD5.1音声フォーマットの384〔Kbps〕ビットレート、PCM音声フォーマットの48〔KHz〕ビットレート等の各種音声フォーマット及びビットレートで、かつその音声フォーマット及びビットレートに応じたフレームサイズでエンコードすることにより得られたそれぞれフレーム単位で構成される複数の音声データ(以下、これを効果音データと呼ぶ)D1が格納されている。また効果音格納メモリ6には、そのとき格納されている効果音データD1の音声フォーマット及びビットレートの種類と、その音声フォーマット及びビットレートでの各効果音データD1のフレーム数となどの情報でなる格納効果音情報D2が格納されている。
【0019】
そして、この音声データ処理装置1では、同じ機器内部の記録媒体再生部やBSチューナ部等から与えられる音声データや映像音声データをコンテンツデータD3として入力データ処理部2に入力する。
【0020】
入力データ処理部2は、供給されるコンテンツデータD3について、システムコントローラ3の制御のもとに、複数の音声フォーマットの音声データを含んでいる場合の出力すべき音声フォーマットの選択処理や、多重化されたコンテンツの分離処理等の所定の信号処理を施し、かくして得られたそのコンテンツの音声データでなるコンテンツ音声データD4と、そのコンテンツ音声データD4の音声フォーマットやビットレート、フレームサイズ及びチャンネル数等の付加情報でなるコンテンツ音声付加情報D5とをビットストリームバッファ5に送出する。
【0021】
ビットストリームバッファ5は、供給されるコンテンツ音声データD4及びコンテンツ音声付加情報D5を順次記憶すると共に、当該記憶したコンテンツ音声データD4をビットストリームコントローラ4の制御のもとに順次読み出し、これを同じ機器内部の図示しないオーディオデコーダモジュール又は図示しないディジタル出力端子を介して外部のオーディオデコーダに出力する。
【0022】
この結果、この内部のオーディオデコーダモジュール又は外部のオーディオデコーダにおいてコンテンツ音声データD4がデコードされ、得られた音声データがアナログ変換された後スピーカに与えられることにより、このコンテンツ音声データD4に基づくコンテンツの音声がそのスピーカから発音されることとなる。
【0023】
またこのとき入力データ処理部2は、そのとき出力しているコンテンツ音声データD4の音声フォーマット及びビットレート等のデータ構造に関する情報をデータ構成情報D6としてシステムコントローラ3及びビットストリームコントローラ4に送出する。
【0024】
そしてビットストリームコントローラ4は、供給されるデータ構造情報D6に基づいて、この後必要時に出力する効果音等の音声フォーマット及びビットレートとして、そのとき入力データ処理部2が出力しているコンテンツ音声データD4と同じ音声フォーマット及びビットレートを選択する。
【0025】
この際ビットストリームコントローラ4は、そのとき入力データ処理部2が出力しているコンテンツ音声データD4と同じ音声フォーマット及びビットレートでエンコードされた各種音色の効果音等の効果音データD1が効果音格納メモリ6に格納されていない場合には、効果音入力部7及び効果音格納メモリ6を制御して、予めその機器内に装填されているDVD、CD又はハードディスク等の記録媒体からそれら効果音データD1を再生させ、又はインターネット等のネットワークを通じてそれらの効果音データD1をダウンロードさせ、かくして得られたコンテンツ音声データD4と同じ音声フォーマット及びビットレートでエンコードされた各種音色の効果音等の効果音データD1を効果音格納メモリ6に格納させると共にこれに応じて格納効果音情報D2を更新させる。
【0026】
なおこの実施の形態の場合、ビットストリームコントローラ4は、効果音格納メモリ6に格納されている各効果音データD1の使用頻度を記憶している。そしてビットストリームコントローラ4は、上述のようにして新たな音声フォーマット及びビットレートの効果音データD1を効果音格納メモリ6に取り込むに際して当該効果音格納メモリ6の記憶容量が不足している場合など、効果音格納メモリ6に格納されたいずれかの効果音データD1の削除が必要となったときには、効果音格納メモリ6を制御して、使用頻度の少ない効果音データD1を削除させるようになされている。
【0027】
これによりこの音声データ処理装置1においては、効果音格納メモリ6を有効に利用することができ、その分効果音格納メモリ6として記憶容量が格段的に大きいものを必要としないことから、より一層と当該音声データ処理装置が搭載された機器全体の小型化や低コスト化を図ることができるようになされている。
【0028】
一方、システムコントローラ3においては、他の同じ機器内のビデオ関連のモジュールや、ユーザインターフェース、システムクロック及びデバイス制御関連の他のモジュールと接続されており、ビデオ関連又はデバイス関連のモジュールから効果音を出力すべき要請が与えられ、又はユーザインターフェースを介してユーザからの操作入力が与えられると、これに応じた効果音又は操作音の出力指令(以下、これを効果音出力指令と呼ぶ)COM1をビットストリームコントローラ4に与える。
【0029】
このときビットストリームコントローラ4は、システムコントローラ3から与えられる効果音出力指令COM1に基づいて効果音格納メモリ6を制御し、現在入力データ処理部2が出力しているコンテンツ音声データD4と同じ音声フォーマット及びビットレートでエンコードされた各種音色の効果音等のうち、指定された効果音等の効果音データD1を読み出させる。
【0030】
またビットストリームコントローラ4は、これと同時にビットストリームバッファ5を制御して、この効果音格納メモリ6から読み出された効果音データD1を、そのときビットストリームバッファ5が蓄えているコンテンツ音声データD4の一部とフレーム単位で順次置き換えるようにして当該ビットストリームバッファ5に記憶させる。なお、このような効果音格納メモリ6の制御と、かかる置換え処理はシステムクロックに同期して、ビットストリームバッファ5がコンテンツ音声データD4を1フレーム分出力する時間間隔以内に行われる。
【0031】
この結果、かかる効果音データD1は、やがてビットストリームコントローラ4の制御のもとに前後のコンテンツ音声データD4と共に順次ビットストリームバッファ5から読み出され、この後上述のようにコンテンツ音声データD4と共にデコードされ、アナログ変換されてスピーカに与えられる。
【0032】
このようにしてこの音声データ処理装置1では、必要な効果音等をコンテンツの音声と同じスピーカから発音させ得るようになされている。
【0033】
なおこの実施の形態の場合、ビットストリームコントローラ4は、上述のように効果音格納メモリ6から読み出した効果音データD1をビットストリームバッファ5に格納されているコンテンツ音声データD4の一部と置き換えさせる際、予めそのときビットストリームバッファ5に格納されているコンテンツ音声データD4のうち、当該コンテンツ音声データD4に基づく音声の音量レベルが最も小さい箇所を探し出して、当該箇所のコンテンツ音声データD4と効果音データD1とを置き換えさせるようになされている。これによりこのデータ処理装置1では、スピーカから効果音等が発音される際における当該効果音等の出力前後においての急激な音量変化を未然に防止させ得るようになされている。
【0034】
(1−2)ビットストリームコントローラ4の各種処理手順
ここで、実際上、ビットストリームコントローラ4は、入力データ処理部2からデータ構造情報D6が与えられたときに、図2に示す効果音音声フォーマット選択処理手順RT1に従って、ユーザ操作時等の必要時に出力すべき効果音等の音声フォーマットを選択する。
【0035】
すなわちビットストリームコントローラ4は、入力データ処理部2からデータ構造情報D6が与えられるとこの効果音音声フォーマット選択処理手順RT1をステップSP0において開始し、続くステップSP1において、当該データ構造情報D6に基づいて、そのとき入力データ処理部2から出力されているコンテンツ音声データD4の音声フォーマット及びビットレートを取得し、認識する。
【0036】
続いてビットストリームコントローラ4は、ステップSP2に進んで、かかるステップSP1において認識した音声フォーマットと同じ音声フォーマット及びビットレートでエンコードされた各種音色の効果音等の効果音データD1が効果音格納メモリ6に既に格納されているか否かを、効果音格納メモリ6に格納されている格納効果音情報D2に基づいて判断する。
【0037】
そしてビットストリームコントローラ4は、このステップSP2において肯定結果を得るとステップSP4に進み、これに対して否定結果を得るとステップSP3に進んで、効果音入力部7及び効果音格納メモリ6を制御して、対応する音声フォーマット及びビットレートでエンコードされた各種音色の効果音等の効果音データD1をDVD等の記録媒体から再生させ又はネットワークからダウンロードさせて効果音格納メモリ6に格納させ、かつこれに応じて格納効果音情報D2を更新した後、ステップSP4に進む。
【0038】
そしてビットストリームコントローラ4は、このステップSP4において、この後必要時に出力する効果音等の音声フォーマット及びビットレートとしてステップSP1において認識した音声フォーマット及びビットレートを選択し、内部設定を切り替えた後、ステップSP5に進んでこの効果音フォーマット選択処理手順RT1を終了する。
【0039】
またビットストリームコントローラ4は、この後図3に示す第1の効果音発音処理手順RT2に従って対応する効果音等の出力処理を実行する。
【0040】
すなわちビットストリームコントローラ4は、システムコントローラ3から効果音出力指令COM1が与えられると、この第1の効果音発音処理手順RT2をステップSP10において開始し、続くステップSP11において、出力すべき効果音等のフレーム数を効果音格納メモリ6に格納されている格納効果音情報D2に基づいて取得し、認識する。
【0041】
続いてビットストリームコントローラ4は、ステップSP12に進んで、ビットストリームバッファ5が記憶している上述のコンテンツ音声付加情報D5に基づいて、そのときビットストリームバッファ5に格納されているコンテンツ音声データD4におけるフレームの区切り目の位置(アドレス)を検出する。
【0042】
次いでビットストリームコントローラ4は、ステップSP13に進んで、効果音出力指令COM1が与えられてから予め設定された所定時間(例えば0.5秒)が経過していないか否か、及びそのときビットストリームバッファ5が記憶しているコンテンツ音声データD4の1つのフレームについて、そのフレームにおける平均の音声レベル(信号レベル)を検出すると共にその音声レベルが予め設定された閾値以上であるか否かをそれぞれ判断する。
【0043】
そしてビットストリームコントローラ4は、これら2つの判断結果として共に肯定結果を得ると、ビットストリームバッファ5に格納されているコンテンツ音声データD4におけるこれ以降の各フレームについて、同様の判断処理を順次繰り返す。
【0044】
そしてビットストリームコントローラ4は、やがてかかる所定時間が経過し又は平均の音声レベルが閾値以上のフレームを検出することによりこのステップSP13において否定結果を得ると、ステップSP14に進んで、ビットストリームバッファ5に格納されたコンテンツ音声付加情報D5に基づいて、そのとき当該ビットストリームバッファ5に1フレーム分以上のコンテンツ音声データD4が格納されているか否かを判断する。
【0045】
そしてビットストリームコントローラ4は、このとき否定結果を得ると、この後このステップSP14において肯定結果を得るのを待ち受け、やがてビットストリームバッファ5に1フレーム分以上のコンテンツ音声データD4が格納されることによりこのステップSP14において肯定結果を得ると、ステップSP15に進んで、そのときまでに後述のようにして削除したコンテンツ音声データD4の合計フレーム数がステップSP11において認識した対応する効果音データD1のフレーム数未満であるか否かを判断する。
【0046】
ビットストリームコントローラ4は、このステップSP15において否定結果を得るとステップSP17に進み、これに対して肯定結果を得るとステップSP16に進んで、ビットストリームバッファ5に格納されているコンテンツ音声データD4における所定の1フレーム、具体的には、効果音データD1の最初のフレームを入力する場合でかつステップSP13において平均の音声レベルが閾値未満のフレームを検出できた場合にはそのフレーム、検出できなかった場合にはビットストリームバッファ5に保存されている中で最小音量のフレーム、音量の検出が不可能な場合はビットストリームバッファ5に保存されている先頭のフレームを削除し、そのアドレス及びそのときまでに削除したコンテンツ音声データD4のフレーム数を記憶した後、ステップSP17に進む。
【0047】
さらにビットストリームコントローラ4は、このステップSP17において、ビットストリームバッファ5に格納されたコンテンツ音声付加情報D5に基づいて、当該ビットストリームバッファ5に、そのとき置き換えようとしている効果音データD1の1フレーム分以上の空きがあるか否かを判断する。そしてビットストリームコントローラ4は、このステップSP17において否定結果を得るとステップSP14に戻り、この後ステップSP17において肯定結果を得るまでステップSP14〜SP17−SP14のループを繰り返す。
【0048】
そしてビットストリームコントローラ4は、やがてこのステップSP17において肯定結果を得ると、ステップSP18に進んで、かかる1フレーム分の未出力の効果音データD1をビットストリームバッファ5におけるステップSP16において削除したコンテンツ音声データD4のフレームの箇所に格納する。
【0049】
さらにビットストリームコントローラ4は、この後ステップSP19に進んで、かかる効果音データD1の全フレームのデータをコンテンツ音声データD4のその後連続する各フレームのデータと置き換え終えたか否かを判断する。
【0050】
そしてビットストリームコントローラ4は、このステップSP19において否定結果を得るとステップSP14に戻り、この後このステップSP19において肯定結果を得るまでステップSP14〜SP19−SP14のループを繰り返すことにより、かかる効果音データD1の各フレームのデータをコンテンツ音声データD1のその後連続する各フレームのデータと順次置き換える。
【0051】
そしてビットストリームコントローラ4は、やがてかかる効果音データD1の全フレームのデータをコンテンツ音声データD1の対応する各フレームのデータと置き換え終えることによりこのステップSP19において肯定結果を得ると、ステップSP20に進んでこの第1の効果音発音処理手順RT2を終了する。
【0052】
(1−3)本実施の形態の動作及び効果
以上の構成において、この音声データ処理装置1では、各種音声フォーマット及びビットレートでエンコードされた各種音色の効果音等の効果音データD1を予め効果音格納メモリ6に保持し、その出力時には、そのとき出力しているコンテンツ音声データD4と同じ音声フォーマット及びビットレートでエンコードされた指定された音色の効果音等の効果音データD1を効果音格納メモリ6から読み出し、これをそのときストリームバッファ5に格納されているコンテンツ音声データD4の一部と置き換えて出力する。
【0053】
従って、この音声データ処理装置1は、効果音等の発音のためにその機器が取り扱う各音声フォーマットにそれぞれ対応したデコーダを必要とせず、その分機器全体の構成が煩雑化及び大型化し、高コスト化するのを未然に防止することができる。
【0054】
またこの音声データ処理装置1では、上述のように出力対象のコンテンツ音声データD4の一部と、これと同じ音声フォーマットの効果音データD1を置き換えて出力するため、効果音等の発音の前後においてノイズを発生させることなく、高音質の効果音等をスピーカから発音させることができる。
【0055】
以上の構成によれば、各種音声フォーマット及びビットレートでエンコードされた各種音色の効果音等の効果音データD1を予め効果音格納メモリ6に保持し、その出力時には、そのとき出力しているコンテンツ音声データD4と同じ音声フォーマット及びビットレートでエンコードされた指定された音色の効果音等の効果音データD1を効果音格納メモリ6から読み出し、これをそのときストリームバッファ5に格納されているコンテンツ音声データD4の一部と置き換えて出力するようにしたことにより、効果音の発音のためにその機器が取り扱う各音声フォーマットにそれぞれ対応したデコーダを必要とせず、また効果音等の発音の前後においてノイズを発生させることなく、高音質の効果音等をスピーカから発音させることができ、かくして機器の構成を簡易化させながら、効果音等をノイズなくかつ高品質で出力させ得る音声データ処理装置を実現できる。
【0056】
(2)第2の実施の形態
(2−1)第2の実施の形態による音声データ処理装置の全体構成
図1との対応部分に同一符号を付して示す図4は、第2の実施の形態による音声データ処理装置10を示し、DRAMでなるビットストリームバッファ11の後段にストリーム切替え部13が設けられ、当該ストリーム切替え部13における出力データの切替え処理により、効果音データD1をコンテンツ音声データD4の一部と置き換えて出力し得るようになされている。
【0057】
実際上、この音声データ処理装置10において、ビットストリームバッファ11は、上述のように入力データ処理部2から供給されるコンテンツ音声データD4及びコンテンツ音声付加情報D5を順次記憶すると共に、当該記憶したコンテンツ音声データD4をビットストリームコントローラ12の制御のもとに順次読み出し、これをストリーム切替え部13に送出する。
【0058】
ストリーム切替え部13は、例えば汎用ロジックIC(Integrated Circuit)から構成され、その内部にはコンテンツ音声データD4及び効果音データD1間の切り替え時やコンテンツ音声データD4が可変長符号化(VBR:Variable Bit Rate)されているときなどにおける緩衝のためのFIFO(First-In First-Out)等でなるバッファメモリ14が設けられている。
【0059】
またストリーム切替え部13においては、第1〜第3の入力切替端151〜153と第1及び第2の出力切替え端161、162とが設けられ、ビットストリームコントローラ12の制御によって、図4のように第2の入力切替端152及び第1の出力切替端161間が導通すると共に第3の入力切替端153及び第2の出力切替端162が導通する第1の切替えモードと、図5ように第1の入力切替端151及び第1の出力切替端161間が導通すると共に第2の入力切替端152及び第2の出力切替端162間が導通する第2の切替えモードとに動作モードを相互に切り替えさせ得るようになされている。
【0060】
そしてストリーム切替え部13においては、効果音格納メモリ6からの効果音データを第1の入力切替端151に入力し、ビットストリームバッファ11からのコンテンツ音声データD4をバッファメモリ14を介して第2の入力切替端152に入力するようになされており、これにより第1の切替えモード時には、ビットストリームバッファ11からのコンテンツ音声データD4を第1の出力切替端161を介して出力し得、第2の切替えモード時には、効果音格納メモリ6からの効果音データD1を第1の出力切替端161を介して出力し、かつビットストリームバッファ5からのコンテンツ音声データD2を第2の出力切替端162を介して廃棄し得るようになされている。
【0061】
かくしてビットストリームコントローラ12においては、通常時には、ストリーム切替え部13を制御してその動作モードを第1の切替えモードに設定することにより、ビットストリームバッファ11から出力されたコンテンツ音声データD4を、ストリーム切替え部13を介して後段に設けられた同じ機器内の図示しないオーディオデコーダモジュール又は図示しないディジタル出力端子を介して外部のオーディオデコーダに出力させる。
【0062】
この結果、この内部のオーディオデコーダモジュール又は外部のオーディオデコーダにおいてコンテンツ音声データD4がデコードされ、得られた音声データがアナログ変換された後スピーカに出力される。これによりこのコンテンツ音声データD4に基づくそのコンテンツの音声がそのスピーカを介して外部に発音されることとなる。
【0063】
またこのときビットストリームコントローラ12は、第1の実施の形態の場合と同様にして、図2について上述した効果音フォーマット選択処理手順RT1を実行することにより、この後必要時に出力する効果音等の音声フォーマットとしてそのときビットストリームバッファ11が出力しているコンテンツ音声データD4と同じ音声フォーマット及びビットレートを選択する。
【0064】
一方、ビットストリームコントローラ12は、この後システムコントローラ3から効果音出力指示COM1が与えられると、ビットストリームバッファ11に格納されたコンテンツ音声付加情報D5に基づき、システムクロックに同期してストリーム切替え部13を制御することにより、コンテンツ音声データD4のフレームの区切り目のタイミングでその動作モードを第2の切替えモードに切り替えさせる。
【0065】
またビットストリームコントローラ12は、これと同時に効果音格納メモリ6を制御して、そのときビットストリームバッファ11が出力しているコンテンツ音声データD4と同じ音声フォーマット及びビットレートでエンコードされた指定された音色の操作音等の効果音データD1を読み出させる。
【0066】
この結果、ストリーム切替え部13からの出力がコンテンツ音声データD4のフレームの区切り目のタイミングで効果音データD1に切り替わり、これが上述の内部のオーディオデコーダモジュール又は外部のオーディオデコーダに出力されることにより、当該効果音データD1に基づく効果音等がスピーカを介して発音される。
【0067】
さらにビットストリームコントローラ12は、その後効果音格納メモリ6がその効果音データD1を全て読み出し終えると、ビットストリームバッファ11に格納されたコンテンツ音声付加情報D5に基づき、システムクロックに同期してストリーム切替え部13を制御することにより、かかる効果音データD1の最後のフレームが出力し終えたタイミングでその動作モードを第1の切替えモードに切り替えさせる。
【0068】
また、この際ビットストリームコントローラ12は、例えばコンテンツ音声データD4が可変長符号化されていて1フレームのデータサイズが固定長でない場合などには、ストリーム切替え部13内のバッファメモリ14を利用してビットストリームバッファ11が破綻しないように、かつ効果音データD1の最後のフレームに続けてコンテンツ音声データD4をフレームの区切り目から出力できるようにストリーム切替え部13を制御する。
【0069】
この結果、ストリーム切替え部13からの出力が効果音データD1の最後のフレームを出力し終えたタイミングでコンテンツ音声データD4に切り替わり、これが上述の内部のオーディオデコーダモジュール又は外部のオーディオデコーダに出力されることにより、かかるスピーカを介して発音される音声が効果音からコンテンツの音声に戻ることとなる。
【0070】
このようにしてこの音声データ処理装置1では、必要な効果音等をコンテンツの音声と同じスピーカから発音させ得るようになされている。
【0071】
(2−2)本実施の形態におけるビットストリームコントローラ12の処理
ここで、ビットストリームコントローラ12は、上述のような対応する効果音等の出力処理を図6に示す第2の効果音発音処理手順RT3に従って実行する。
【0072】
すなわちビットストリームコントローラ12は、システムコントローラ3から効果音出力指令COM1が与えられると、この第2の効果音発音処理手順RT3をステップSP30において開始し、続くステップSP31〜ステップSP33までを図3について上述した第1の効果音発音処理手順RT1のステップSP11〜ステップSP13までと同様に処理する。
【0073】
そしてビットストリームコントローラ12は、この後ステップSP34に進むと、ストリーム切替え部13を制御して、コンテンツ音声データD4のフレームの区切り目のタイミングでその動作モードを第2の切替えモードに切り替えさせると共に、続くステップSP35において効果音格納メモリ6を制御することにより、そのときビットストリームバッファ11が出力しているコンテンツ音声データD4と同じ音声フォーマット及びビットレートでエンコードされた指定された音色の効果音等の効果音データD1を1フレーム分だけ読み出させ、ストリーム切替え部13内のバッファメモリ14中に存在するコンテンツ音声データD4を破棄する。
【0074】
さらにビットストリームコントローラ12は、この後ステップSP36に進んで、ステップSP31において取得したその効果音データD1のフレーム数に基づいて、当該効果音データD1の全てのフレームを出力し終えたか否かを判断する。そしてビットストリームコントローラ12は、このステップSP36において否定結果を得るとステップSP35に戻り、この後このステップSP36において肯定結果を得るまでステップSP35−SP36−SP35のループを繰り返す。
【0075】
そしてビットストリームコントローラ12は、やがて効果音データD1の全てのフレームを出力し終えることによりステップSP36において肯定結果を得ると、ステップSP37に進んで、ストリーム切替え部13を制御することにより、かかる効果音データD1の最後のフレームが出力し終えたタイミングでその動作モードを第1の切替えモードに切り替えさせる。
【0076】
この際、ビットストリームコントローラ12は、コンテンツ音声データD4のフレームの区切れ目のタイミングで当該コンテンツ音声データD4に切り替わるように、必要に応じてストリーム切替え部13のバッファメモリ14から読み出されるコンテンツ音声データD4の読み出し開始のタイミングを制御する。
【0077】
そしてビットストリームコントローラ12は、この後ステップSP38に進んでこの第2の効果音発音処理手順RT3を終了する。
【0078】
(2−3)本実施の形態の動作及び効果
以上の構成において、この音声データ処理装置10では、各種音声フォーマットでエンコードされた各種音色の効果音等の効果音データD1を予め効果音格納メモリ6に保持し、必要時にそのとき出力しているコンテンツ音声データD4と同じ音声フォーマット及びビットレートでエンコードされた指定された音色の効果音等の効果音データD1を効果音格納メモリ6から読み出し、これをそのときビットストリームバッファ5から出力されているコンテンツ音声データD4の一部とストリーム切替え部13における出力データの切替え処理により置き換えて出力する。
【0079】
従って、この音声データ処理装置10は、第1の実施の形態による音声データ処理装置1と同様に、効果音の発音のためにその機器が取り扱う各音声フォーマットにそれぞれ対応したデコーダを必要とせず、また効果音等の発音の前後においてノイズを発生させることなく、高音質の効果音等をスピーカから発音させることができる。
【0080】
以上の構成によれば、各種音声フォーマットでエンコードされた各種音色の効果音等の効果音データD1を予め効果音格納メモリ6に保持し、必要時にそのとき出力しているコンテンツ音声データD4と同じ音声フォーマット及びビットレートでエンコードされた指定された音色の効果音等の効果音データD1を効果音格納メモリ6から読み出し、これをそのときストリームバッファ5から出力されているコンテンツ音声データD4の一部とストリーム切替え部13における出力データの切替え処理により置き換えて出力するようにしたことにより、効果音の発音のためにその機器が取り扱う各音声フォーマットにそれぞれ対応したデコーダを必要とせず、また効果音等の発音の前後においてノイズを発生させることなく、高音質の効果音等をスピーカから発音させることができ、かくして機器の構成を簡易化させながら、効果音等をノイズなくかつ高品質で出力させ得る音声データ処理装置を実現できる。
【0081】
(3)他の実施の形態
なお上述の第1及び第2の実施の形態においては、ビットストリームコントローラ4、12を他のシステムコントローラ3や入力データ処理部2等のモジュールと別体に形成するようにした場合について述べたが、本発明はこれに限らず、要は、システムコントローラ3等の各モジュールと接続され、各指令や情報を送受信することができるようにするのであれば他のモジュールと一体に形成するようにしても良い。この場合において、例えばシステムコントローラ3や入力データ処理部2にビットストリームコントローラ4、12と同等の機能をもたせるようにしても良く、このようにすることによって、ビットストリームコントローラ4、12を独立に構成する場合に比べて、通信経路の短縮によるエラーの減少や実装面積及び部品などの削減という新たな効果を得ることができる。
【0082】
また上述の第1及び第2の実施の形態においては、効果音及び操作音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の音声データを記憶する記憶手段としての効果音格納メモリ6をフラッシュメモリにより構成するようにした場合について述べたが、本発明はこれに限らず、要は、コンテンツと同等の音声フォーマットのデータが格納でき、またコンテンツ音声データD4と同等の出力レート(可変長符号化されている場合には最大出力レート)以上で出力可能な伝送レートを有するモジュールであればフラッシュメモリ以外の例えばDRAMやDVD又はハードディスク装置等を適用するようにしても良い。これらに置き換えた場合、メディアによって様々な利点や欠点(コスト、交換の容易さ、容量の大きさ等)があるので、本発明を適用する機器によって選択して採用することで、そのメディアの利点を生かすことができる。また効果音格納メモリ6が半導体メモリによって構成されている場合、第1及び第2の実施の形態のように独立したモジュール構成を採らずに例えばビットストリームコントローラ4、12に内蔵させるようにしても良い。
【0083】
さらに上述の第1及び第2の実施の形態においては、入力データ処理部2をシステムコントローラ3等の他のモジュールとは別体に構成するようにした場合について述べたが、本発明はこれに限らず、例えばシステムコントローラ3に同等の機能をもたせるようにしても良い。
【0084】
さらに上述の第1及び第2の実施の実施の形態においては、ビットストリームバッファ5、11をDRAMにより構成するようにした場合について述べたが、本発明はこれに限らず、要は、コンテンツ音声データD4を一時的に蓄えることができるモジュールであればSRAM等の他のモジュールを適用するようにしても良い。
【0085】
さらに上述の第1及び第2の実施の実施の形態においては、ビットストリームバッファ5、11をシステムコントローラ3等の他のモジュールとは別体に形成するようにした場合について述べたが、本発明はこれに限らず、ビットストリームバッファ5、11をビットストリームコントローラ4、12又は入力データ処理部2等の他のモジュールに内蔵させるようにしても良い。このようにすることによって、実装面積の削減を図れるという効果を得ることができる。
【0086】
さらに上述の第2の実施の形態においては、ストリーム切替え部13を汎用ロジックICにより構成するようにした場合について述べたが、本発明はこれに限らず、要は、2つの入力ビットストリームを瞬間的(切り替わり時にエラーが発生しない時間内)に切替えられるものであれば、その構成としては汎用ロジックIC以外の例えばシステムLSI等の他の形態を広く適用するようにしても良い。
【0087】
さらに上述の第2の実施の形態においては、ストリーム切替え部13をシステムコントローラ3等の他のモジュールから独立した構成とするようにした場合について述べたが、本発明はこれに限らず、ビットストリームコントローラ12に内蔵させるようにしても良い。このようにすることによって、実装面積の削減や動作の高速化、コストの削減といった効果を得ることができる。
【0088】
さらに上述の第2の実施の形態においては、ストリーム切替え部13内に記憶手段としてのバッファメモリ14を設けるようにした場合について述べたが、本発明はこれに限らず、例えば可変長符号化の音声フォーマットをサポートしないのであれば、バッファメモリ14を省略するようにしても良い。
【0089】
さらに上述の第1及び第2の実施の形態においては、効果音入力部7が機器内に装填されているDVD、CD又はハードディスク等の記録媒体から必要な効果音データD1を再生し、又はインターネット等のネットワークを通じて必要な効果音データD1をダウンロードするようにした場合について述べたが、本発明はこれに限らず、要は、必要な効果音データD1を効果音格納メモリ6に供給し得るような手段であれば、この他種々の手段を広く適用することができる。また場合に応じてこの効果音入力部7を省略するようにしても良い。
【0090】
さらに上述の第1及び第2の実施の形態においては、第1又は第2の効果音発音処理手順RT2、RT3のステップSP13又はSP33の処理において、コンテンツ音声データD4の音量レベルの小さな部分で効果音データD1に置き換える場合について述べたが、本発明はこれに限らず、コンテンツ音声データD4の音量レベルの小さな部分以外の部分で効果音データD1に置き換えるようにしても良い。
【0091】
さらに上述の第1及び第2の実施の形態においては、システムコントローラ3をシステムLSI及びソフトウェアにより構成するようにした場合について述べたが、本発明はこれに限らず、他のモジュールを統括できるのであればその形態はこれ以外であっても良い。
【0092】
さらに上述の第1及び第2の実施の形態においては、システムコントローラ3をビットストリームコントローラ4等の他のモジュールと別体に形成するようにした場合について述べたが、本発明はこれに限らず、例えばビットストリームコントローラ4や入力データ処理部2と一体に形成するようにしても良い。
【0093】
さらに上述の第1及び第2の実施の形態においては、コンテンツ音声データD4と入れ替える所定音が効果音又は操作音である場合について述べたが、本発明はこれに限らず、これ以外の各種音声をコンテンツ音声データD4と置き換える場合にも本発明を広く適用することができる。
【0094】
さらに上述の第1の実施の形態においては、所定音を発音させる際、出力対象のコンテンツ音声データD4と同じ音声フォーマットの対応する効果音データD1を効果音格納メモリ6に読み出させ、当該効果音格納メモリ6から読み出された効果音データD1をコンテンツ音声データD4の一部と置き換えて出力する置換え手段を、システムLSI及びソフトウェアからなる制御手段としてのビットストリームコントローラ4と、DRAMからなる記憶手段としてのビットストリームバッファ5とにより構成するようにした場合について述べたが、本発明はこれに限らず、この他種々の構成を広く適用することができる。
【0095】
同様に、上述の第2の実施の形態においては、かかる置換え手段を、システムLSI及びソフトウェアからなる制御手段としてのビットストリームコントローラ12と、汎用ロジックICからなる切替え手段としてのストリーム切替え部13とにより構成するようにした場合について述べたが、本発明はこれに限らず、この他種々の構成を広く適用することができる。
【0096】
【発明の効果】
上述のように本発明によれば、複数の音声フォーマットの第1の音声データを取り扱う機器に搭載される音声データ処理装置において、所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶する第1の記憶手段と、所定音を発音させる際、第1の記憶手段を制御して、出力対象の第1の音声データの音声フォーマットと同じ音声フォーマットの対応する第2の音声データを当該第1の記憶手段から読み出させ、当該第1の記憶手段から読み出された第2の音声データを、第1の音声データの一部と置き換えて出力する置換え手段とを設けるようにしたことにより、機器が取り扱う音声フォーマットの数に応じたエンコーダを設けることなく、また所定音の発音時にノイズを発生させずに、第1の音声データに基づく音声と同じ音質で所定音を発音させることができ、かくして機器の構成を簡易化させながら、所望の音声をノイズなくかつ高品質で出力させ得る音声データ処理装置を実現できる。
【0097】
また本発明によれば、複数の音声フォーマットの第1の音声データを取り扱う機器における音声データ処理方法において、所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶する第1のステップと、所定音を発音させる際、出力対象の第1の音声データの音声フォーマットと同じ音声フォーマットの対応する第2の音声データを、第1の音声データの一部と置き換えて出力する第2のステップとを設けるようにしたことにより、機器が取り扱う音声フォーマットの数に応じたエンコーダを設けることなく、また所定音の発音時にノイズを発生させずに、第1の音声データに基づく音声と同じ音質で所定音を発音させることができ、かくして機器の構成を簡易化させながら、所望の音声をノイズなくかつ高品質で出力させ得る音声データ処理方法を実現できる。
【0098】
さらに本発明によれば、複数の音声フォーマットの第1の音声データを取り扱う機器に搭載される音声データ処理装置において、所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶する第1の記憶手段と、所定音を発音させる際、出力対象の第1の音声データの音声フォーマットと同じ音声フォーマットの対応する第2の音声データを第1の記憶手段から読み出させ、当該第1の記憶手段から読み出された第2の音声データを、第1の音声データの一部と置き換えて出力する置換え手段と、所定音の音声データを所望の音声フォーマットでエンコードすることにより得られた第2の音声データを記録媒体から又はネットワークを介して取得する取得手段とを設け、置換え手段は、出力対象の第1の音声データと同じ音声フォーマットの第2の音声データが第1の記憶手段に格納されていないときは、取得手段を制御して当該音声フォーマットの第2の音声データを取得させると共に、第1の記憶手段を制御して当該第2の音声データを記憶させるようにしたことにより、機器が取り扱う音声フォーマットの数に応じたエンコーダを設けることなく、また所定音の発音時にノイズを発生させずに、第1の音声データに基づく音声と同じ音質で所定音を発音させることができ、かくして機器の構成を簡易化させながら、所望の音声をノイズなくかつ高品質で出力させ得る音声データ処理装置を実現できる。
【0099】
さらに本発明によれば、複数の音声フォーマットの第1の音声データを取り扱う機器における音声データ処理方法において、所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶する第1のステップと、所定音を発音させる際、記憶した複数の音声データのうち、出力対象の第1の音声データの音声フォーマットと同じ音声フォーマットの対応する第2の音声データを、第1の音声データの一部と置き換えて出力する第2のステップとを設け、第2のステップでは、出力対象の第1の音声データと同じ音声フォーマットの第2の音声データを記憶していないときは、当該音声フォーマットの第2の音声データを記録媒体から又はネットワークを介して取得して記憶するようにしたことにより、機器が取り扱う音声フォーマットの数に応じたエンコーダを設けることなく、また所定音の発音時にノイズを発生させずに、第1の音声データに基づく音声と同じ音質で所定音を発音させることができ、かくして機器の構成を簡易化させながら、所望の音声をノイズなくかつ高品質で出力させ得る音声データ処理方法を実現できる。
【図面の簡単な説明】
【図1】第1の実施の形態による音声データ処理装置の全体構成を示すブロック図である。
【図2】効果音フォーマット選択処理手順を示すフローチャートである。
【図3】第1の効果音発音処理手順を示すフローチャートである。
【図4】第2の実施の形態による音声データ処理装置の全体構成を示すブロック図である。
【図5】第2の効果音発音処理手順を示すフローチャートである。
【図6】第2の効果音発音処理手順を示すフローチャートである。
【符号の説明】
1、10……音声データ処理装置、2……入力データ処理部、3……システムコントローラ、4、12……ビットストリームコントローラ、5、11……ビットストリームバッファ、6……効果音格納メモリ、7……効果音入力部、13……ストリーム切替え部、D1……効果音データ、D4……コンテンツ音声データ。
Claims (22)
- 複数の音声フォーマットの第1の音声データを取り扱う機器に搭載される音声データ処理装置において、
所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶する第1の記憶手段と、
上記所定音を発音させる際、上記第1の記憶手段を制御して、出力対象の上記第1の音声データの音声フォーマットと同じ上記音声フォーマットの対応する上記第2の音声データを当該第1の記憶手段から読み出させ、当該第1の記憶手段から読み出された上記第2の音声データを、上記第1の音声データの一部と置き換えて出力する置換え手段と
を具えることを特徴とする音声データ処理装置。 - 上記置換え手段は、
上記第1の音声データを一時的に記憶する第2の記憶手段と、
上記第1及び第2の記憶手段を制御する制御手段と
を具え、
上記制御手段は、
上記所定音を発音させる際、上記対応する第2の音声データを上記第1の記憶手段から読み出させると共に、上記第1の記憶手段から読み出された上記第2の音声データを上記第2の記憶手段が上記一時的に記憶している上記第1の音声データの一部に代えて当該第2の記憶手段に記憶させるようにして、上記第2の音声データを上記第1の音声データの一部と置き換えて出力させる
を具えることを特徴とする請求項1に記載の音声データ処理装置。 - 上記置換え手段は、
上記第1の音声データ又は上記第1の記憶手段から読み出された上記第2の音声データのいずれか一方を選択的に切り替えて出力する切替え手段と、
上記第1の記憶手段及び上記切替え手段を制御する制御手段と
を具え、
上記制御手段は、
上記所定音を発音させる際、上記対応する第2の音声データを上記第1の記憶手段から読み出させると共に、上記第1の記憶手段から読み出された上記第2の音声データを上記切替え手段に選択させるようにして、上記第2の音声データを上記第1の音声データの一部と置き換えて出力させる制御手段と
を具えることを特徴とする請求項1に記載の音声データ処理装置。 - 各上記第2の音声データは、
それぞれ上記所定音の音声データを対応する上記音声フォーマット及びビットレートごとにそれぞれ定められたフレームサイズで上記エンコードすることにより得られた
ことを特徴とする請求項1に記載の音声データ処理装置。 - 上記置換え手段は、
上記第1の記憶手段に記憶された各上記第2の音声データの使用頻度を記憶し、
上記第1の記憶手段に記憶されたいずれかの上記第2の音声データの削除が必要となったときには、上記使用頻度の少ない上記第2の音声データを削除させる
ことを特徴とする請求項1に記載の音声データ処理装置。 - 上記置換え手段は、
上記第1の音声データのフレームの区切り目において当該第1の音声データから上記第2の音声データに切り替わり、かつ上記第1の音声データのフレームの区切り目において上記第2の音声データから上記第1の音声データに切り替わるように、上記第1の記憶手段から読み出された上記第2の音声データを上記第1の音声データの一部に置き換えて出力する
ことを特徴とする請求項1に記載の音声データ処理装置。 - 上記置換え手段は、
上記第2の記憶手段に格納されている上記第1の音声データの各フレームの中から、上記第1の記憶手段から読み出させる上記第2の音声データのフレーム数と同数の上記フレームを削除し、当該削除した上記第1の音声データの各上記フレームに代えて、上記第1の記憶手段から読み出させた上記第2の音声データの各上記フレームを上記第2の記憶手段に記憶させることにより、上記第2の音声データを上記第1の音声データの一部と置き換えさせる
ことを特徴とする請求項2に記載の音声データ処理装置。 - 上記切替え手段は、
上記第1の音声データを一時的に記憶する第4の記憶手段を具える
ことを特徴とする請求項3に記載の音声データ処理装置。 - 上記置換え手段は、
上記第1の記憶手段の制御と、当該第1の記憶手段から読み出された上記対応する第2の音声データを上記第1の音声データの一部と置き換える処理とを所定のシステムクロックに同期して行う
ことを特徴とする請求項1に記載の音声データ処理装置。 - 上記置換え手段は、
上記第1の音声データにおける音量レベルの低い箇所を検出し、上記第1の記憶手段から読み出された上記第2の音声データを、上記第1の音声データの当該箇所と置き換えるようにして、上記第1の音声データの一部と置き換える
ことを特徴とする請求項1に記載の音声データ処理装置。 - 複数の音声フォーマットの第1の音声データを取り扱う機器における音声データ処理方法において、
所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶する第1のステップと、
上記所定音を発音させる際、記憶した上記複数の第2の音声データのうち、出力対象の上記第1の音声データの音声フォーマットと同じ上記音声フォーマットの対応する上記第2の音声データを、上記第1の音声データの一部と置き換えて出力する第2のステップと
を具えることを特徴とする音声データ処理方法。 - 上記第2のステップは、
上記出力対象の第1の音声データを一時的に記憶する記憶ステップと、
上記所定音を発音させる際、上記対応する第2の音声データを、上記一時的に記憶した上記第1の音声データの一部に代えて記憶する置換えステップと、
当該記憶した上記第1及び第2の音声データを順次出力することにより、上記第2の音声データを上記第1の音声データの一部と置き換えて出力する出力ステップと
を具えることを特徴とする請求項11に記載の音声データ処理方法。 - 上記第2のステップでは、
上記所定音を発音させる際、上記対応する第2の音声データと、上記第1の音声データとを選択的に切り替えて出力することにより、上記第2の音声データを上記第1の音声データの一部と置き換えて出力させる
を具えることを特徴とする請求項11に記載の音声データ処理方法。 - 各上記第2の音声データは、
上記第1の音声データを対応する上記音声フォーマット及びビットレートごとにそれぞれ定められたフレームサイズで上記エンコードすることにより得られた
ことを特徴とする請求項11に記載の音声データ処理方法。 - 上記第2のステップは、
記憶した各上記第2の音声データの使用頻度を記憶する記憶ステップと、
当該記憶したいずれかの上記第2の音声データの削除が必要となったときには、上記使用頻度の少ない上記第2の音声データを削除する削除ステップと
を具えることを特徴とする請求項11に記載の音声データ処理方法。 - 上記第2のステップでは、
上記第1の音声データのフレームの区切り目において当該第1の音声データから上記第2の音声データに切り替わり、かつ上記第1の音声データのフレームの区切り目において上記第2の音声データから上記第1の音声データに切り替わるように、上記対応する第2の音声データを上記第1の音声データの一部に置き換えて出力する
ことを特徴とする請求項11に記載の音声データ処理方法。 - 上記第2のステップでは、
上記一時的に記憶した上記第1の音声データの各フレームの中から、上記対応する第2の音声データのフレーム数と同数の上記フレームを削除し、当該削除した上記第1の音声データの各上記フレームに代えて、上記対応する第2の音声データの各上記フレームを記憶することにより、上記第2の音声データを上記第1の音声データの一部と置き換える
ことを特徴とする請求項12に記載の音声データ処理方法。 - 上記第2のステップは、
上記出力対象の第1の音声データを一時的に記憶する記憶ステップを具える
ことを特徴とする請求項13に記載の音声データ処理方法。 - 上記第2のステップでは、
上記対応する第2の音声データを上記第1の音声データの一部と置き換える処理を所定のシステムクロックに同期して行う
ことを特徴とする請求項11に記載の音声データ処理方法。 - 上記第2のステップでは、
上記出力対象の第1の音声データにおける音量レベルの低い箇所を検出し、上記対応する第2の音声データを、当該第1の音声データの当該箇所と置き換えるようにして、上記第1の音声データの一部と置き換える
ことを特徴とする請求項11に記載の音声データ処理方法。 - 複数の音声フォーマットの第1の音声データを取り扱う機器に搭載される音声データ処理装置において、
所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶する第1の記憶手段と、
上記所定音を発音させる際、上記第1の記憶手段を制御して、出力対象の上記第1の音声データの音声フォーマットと同じ上記音声フォーマットの対応する上記第2の音声データを当該第1の記憶手段から読み出させ、当該第1の記憶手段から読み出された上記第2の音声データを、上記第1の音声データの一部と置き換えて出力する置換え手段と、
上記所定音の音声データを所望の上記音声フォーマットでエンコードすることにより得られた上記第2の音声データを記録媒体から又はネットワークを介して取得する取得手段と
を具え、
上記置換え手段は、
上記出力対象の第1の音声データと同じ上記音声フォーマットの上記第2の音声データが上記第1の記憶手段に格納されていないときは、上記取得手段を制御して当該音声フォーマットの上記第2の音声データを取得させると共に、上記第1の記憶手段を制御して当該第2の音声データを記憶させる
ことを特徴とする音声データ処理装置。 - 複数の音声フォーマットの第1の音声データを取り扱う機器における音声データ処理方法において、
所定音の音声データを複数の音声フォーマットでそれぞれエンコードすることにより得られた複数の第2の音声データを記憶する第1のステップと、
上記所定音を発音させる際、記憶した上記複数の第2の音声データのうち、出力対象の上記第1の音声データの音声フォーマットと同じ上記音声フォーマットの対応する上記第2の音声データを、上記第1の音声データの一部と置き換えて出力する第2のステップと
を具え、
上記第2のステップでは、
上記出力対象の第1の音声データと同じ上記音声フォーマットの上記第2の音声データを記憶していないときは、当該音声フォーマットの上記第2の音声データを記録媒体から又はネットワークを介して取得して記憶する
ことを特徴とする音声データ処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002372800A JP2004205679A (ja) | 2002-12-24 | 2002-12-24 | 音声データ処理装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002372800A JP2004205679A (ja) | 2002-12-24 | 2002-12-24 | 音声データ処理装置及び方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004205679A true JP2004205679A (ja) | 2004-07-22 |
Family
ID=32811296
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002372800A Pending JP2004205679A (ja) | 2002-12-24 | 2002-12-24 | 音声データ処理装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004205679A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008539452A (ja) * | 2005-04-26 | 2008-11-13 | ディー−ボックス テクノロジーズ インコーポレイテッド | 音声信号と共に動作信号を符号化する方法及び装置 |
JP2009004037A (ja) * | 2007-06-22 | 2009-01-08 | Panasonic Corp | オーディオ符号化装置、及びオーディオ復号化装置 |
-
2002
- 2002-12-24 JP JP2002372800A patent/JP2004205679A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008539452A (ja) * | 2005-04-26 | 2008-11-13 | ディー−ボックス テクノロジーズ インコーポレイテッド | 音声信号と共に動作信号を符号化する方法及び装置 |
JP2009004037A (ja) * | 2007-06-22 | 2009-01-08 | Panasonic Corp | オーディオ符号化装置、及びオーディオ復号化装置 |
US8010374B2 (en) | 2007-06-22 | 2011-08-30 | Panasonic Corporation | Audio coding apparatus and audio decoding apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100188483B1 (ko) | 디지털 비디오/오디오 데이터 스트림의 동기 유지 장치 및 방법, 디지털 비디오/오디오 재생 시스템 및 재생 서브시스템과 비디오/오디오 데이터의 동기화된 디스플레이 제공 시스템 | |
US6330214B1 (en) | Signal recording/reproducing apparatus and method | |
JP5329846B2 (ja) | ディジタルデータプレーヤー、そのデータ処理方法及び記録媒体 | |
JP2003032617A (ja) | データ記録再生装置及び方法 | |
US7840290B2 (en) | Encoded digital audio reproducing apparatus | |
JP4649901B2 (ja) | 曲の符号化伝送のための方法および装置 | |
JP2004205679A (ja) | 音声データ処理装置及び方法 | |
JP3968206B2 (ja) | 再生装置 | |
JP3416403B2 (ja) | Mpegオーディオデコーダ | |
JP2003006991A (ja) | デジタル信号処理装置及びデジタル信号処理方法、並びにデジタル信号再生受信システム | |
US20060093157A1 (en) | Audio high-speed reproducing device and audio high-speed reproducing method | |
JP2002156998A (ja) | オーディオ信号のビットストリーム処理方法、この処理方法を記録した記録媒体、及び処理装置 | |
JP4665550B2 (ja) | 再生装置および再生方法 | |
KR100537542B1 (ko) | 카 오디오 시스템의 엠펙 음악파일 재생장치 | |
JP2001128119A (ja) | 符号化データ記録再生装置、符号化データ再生装置、及び符号化データ記録媒体 | |
KR20050041603A (ko) | 비디오 데이터를 포함하는 오디오 컨텐츠 제작방법 및비디오 데이터가 포함된 오디오 컨텐츠 재생장치 | |
JP2001318700A (ja) | 話速変換装置 | |
JPH09198796A (ja) | 音響信号記録再生装置およびそれを用いたビデオカメラ | |
JPH08221100A (ja) | 半導体メモリを使用した録音再生装置の録音方法 | |
JP2003216195A (ja) | Mpegオーディオデコーダ | |
JP2007101644A (ja) | 音声再生装置 | |
JP2003233951A (ja) | デジタル映像ファイル分割方法、及びデジタル映像ファイル分割装置 | |
JP2005244303A (ja) | データ遅延装置及び同期再生装置並びにデータ遅延方法 | |
JP2005032369A (ja) | 光ディスク再生装置および再生方法 | |
JPH06259100A (ja) | 音声合成装置 |