JP2008197199A - Audio encoder and audio decoder - Google Patents
Audio encoder and audio decoder Download PDFInfo
- Publication number
- JP2008197199A JP2008197199A JP2007030062A JP2007030062A JP2008197199A JP 2008197199 A JP2008197199 A JP 2008197199A JP 2007030062 A JP2007030062 A JP 2007030062A JP 2007030062 A JP2007030062 A JP 2007030062A JP 2008197199 A JP2008197199 A JP 2008197199A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- data
- output
- encoding
- category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
Description
本発明は、デジタル信号処理を行い、符号化を行うオーディオ符号化装置と符号化された符号化データを再生するオーディオ復号化装置に関するものである。 The present invention relates to an audio encoding device that performs digital signal processing and performs encoding, and an audio decoding device that reproduces encoded data.
従来のオーディオ符号化装置及びその復号化装置には、音楽情報でない部分にアクセスして音楽出力しているものがある(例えば、特許文献1参照)。 Some conventional audio encoding devices and decoding devices output music by accessing portions that are not music information (see, for example, Patent Document 1).
図13はCD上のフォーマットを示す。また図14は従来のオーディオ復号化装置のフローチャートを示す。
以下図13を補足として用いて、図14のフローチャートで従来のオーディオ復号化装置の動作を説明する。
FIG. 13 shows the format on the CD. FIG. 14 shows a flowchart of a conventional audio decoding apparatus.
The operation of the conventional audio decoding apparatus will be described below with reference to the flowchart of FIG. 14, using FIG. 13 as a supplement.
図14において、オーディオ復号化装置は、リードIN領域(図13の1300)のデータを読み込み、ディスクのTOC情報を読み込む(ステップST1)。読み込んだTOC情報より、各トラックのコントロールコードを抽出し(ステップST2)、CDがCD−DAのオーディオディスクであるか、またはCD−ROMディスクであるかを判定する(ステップST3)。ここで、CDが、CD−DAのオーディオディスクの場合は、オーディオ復号化装置は、TOC情報を基に、CDオーディオ再生処理(ステップST12)を行って、通常のCDプレーヤとしての音楽再生を行う。 In FIG. 14, the audio decoding apparatus reads the data in the lead-in area (1300 in FIG. 13) and reads the TOC information of the disc (step ST1). The control code of each track is extracted from the read TOC information (step ST2), and it is determined whether the CD is a CD-DA audio disk or a CD-ROM disk (step ST3). Here, if the CD is a CD-DA audio disc, the audio decoding device performs CD audio playback processing (step ST12) based on the TOC information, and performs music playback as a normal CD player. .
一方、CD−ROMディスクと判定した場合は、オーディオ復号化装置は、CD−ROMパステーブル(図13の1301)の内容を読み込んで、CD−ROMとしてのファイル構造を読み込む(ステップST4)。ここで、オーディオ復号化装置は、読み込んだファイル構造を確認し、ファイルの拡張子等から、圧縮オーディオファイルが存在するか否かを判断し(ステップST5)、圧縮オーディオファイルが存在しない場合は処理を終了する。圧縮オーディオファイルが存在する場合は、続いて、オーディオ復号化装置は、同様にファイルの拡張子等から、情報ファイル(図13の1303)が存在するか否かを確認する(ステップST6)。ここで、情報ファイルが存在しない場合は、オーディオ復号化装置は、パステーブル(図13の1301)を参照し、CD−ROMファイルシステムの内容に基づいて、圧縮オーディオファイルの抽出を行い(ステップST10)、圧縮オーディオ再生プログラムを起動し(ステップST11)、圧縮オーディオの再生を行う。 On the other hand, if it is determined that the disc is a CD-ROM disc, the audio decoding device reads the contents of the CD-ROM path table (1301 in FIG. 13) and reads the file structure as a CD-ROM (step ST4). Here, the audio decoding device confirms the read file structure, determines whether or not the compressed audio file exists from the file extension or the like (step ST5), and performs processing when the compressed audio file does not exist. Exit. If there is a compressed audio file, the audio decoding apparatus subsequently checks whether or not an information file (1303 in FIG. 13) exists from the file extension and the like (step ST6). Here, if the information file does not exist, the audio decoding device refers to the path table (1301 in FIG. 13) and extracts the compressed audio file based on the contents of the CD-ROM file system (step ST10). ), A compressed audio reproduction program is started (step ST11), and the compressed audio is reproduced.
一方、ステップST6において情報ファイルが存在した場合は、オーディオ復号化装置は、その内容を読み込み(ステップST7)、楽曲再生リストを作成する(ステップST8)。併せて、オーディオ復号化装置は、再生リストからそれぞれのファイル名、再生開始アドレスを抽出しておく(ステップST9)。 On the other hand, if an information file exists in step ST6, the audio decoding device reads the content (step ST7) and creates a music reproduction list (step ST8). In addition, the audio decoding apparatus extracts each file name and reproduction start address from the reproduction list (step ST9).
なお、オーディオ符号化装置は、上記オーディオ復号化装置で再生できるように図13に示すフォーマットで符号化することになる。
このような、従来のオーディオ復号化装置でオーディオデータを再生する際、オーディオ符号化装置が出力する、圧縮オーディオデータ以外のデータを用いて、該オーディオ復号化装置は上述のように楽曲再生リストを作成表示し、使用者がこれを見てタイトル名とオーディオデータ等とを関連付けながら再生操作を行うことができる。 When audio data is reproduced by such a conventional audio decoding device, the audio decoding device uses the data other than the compressed audio data output from the audio encoding device, and the audio decoding device displays the music reproduction list as described above. The user can create and display it and perform a reproduction operation while associating the title name with the audio data or the like by seeing this.
しかしながら従来のオーディオ符号化装置が出力する圧縮オーディオデータ以外のデータは、圧縮オーディオデータとリンクされた再生開始アドレスやタイトル名といった情報であって、オーディオデータそのものを加工するために用いる情報ではないため、オーディオ復号化装置で圧縮オーディオデータそのもの等の加工を行い、元のオーディオデータとは異なるオーディオデータを、即ち元々のオーディオデータとは異なる音量のオーディオ等を出力することができないという問題があった。 However, data other than the compressed audio data output by the conventional audio encoding device is information such as a reproduction start address and a title name linked to the compressed audio data, and is not information used for processing the audio data itself. The audio decoding device processes the compressed audio data itself and the like, and there is a problem that audio data different from the original audio data cannot be output, that is, audio having a volume different from that of the original audio data cannot be output. .
本発明は、上記の問題点を解消するためになされたもので、オーディオ復号化装置でオーディオを再生する際に、圧縮オーディオデータそのもの等の加工を行い、元のオーディオデータとは異なるオーディオデータを出力することを可能とできるオーディオ符号化装置、及びオーディオ復号化装置を提供することを目的とする。 The present invention has been made to solve the above-described problems. When audio is played back by an audio decoding device, the compressed audio data itself is processed, and audio data different from the original audio data is processed. It is an object of the present invention to provide an audio encoding device and an audio decoding device that can be output.
上記の課題を解決するために、本発明の請求項1に係るオーディオ符号化装置は、オーディオデータが入力され、該オーディオデータを符号化した符号化データを、前記オーディオデータに関する補助データとともに出力するオーディオ符号化装置において、入力されるオーディオデータを符号化処理して前記符号化データを出力すると共に、前記オーディオデータの符号化に関する符号化関連データを出力する符号化手段と、前記オーディオデータの予め決められた期間毎の音量レベルを求めて出力する音量レベル出力手段と、前記音量レベル出力手段が出力する前記音量レベルと、前記符号化手段が出力する前記符号化関連データとから、前記音量レベルを含む補助データを作成する補助データ出力手段とを備えた、ことを特徴とするものである。
In order to solve the above problem, an audio encoding device according to
これにより、オーディオデータの音量レベルの情報を含む補助データをオーディオデータの符号化データとともに出力することができ、音量レベルの情報を用いたオーディオデータの加工を可能とできる。 As a result, auxiliary data including volume level information of audio data can be output together with encoded data of audio data, and audio data can be processed using volume level information.
また、本発明の請求項2に係るオーディオ符号化装置は、請求項1記載のオーディオ符号化装置において、前記予め決められた期間が、楽曲1曲分である、ことを特徴とするものである。
An audio encoding apparatus according to
これにより、オーディオデータの音量レベルの情報を含む補助データをオーディオデータの符号化データとともに出力することができ、音量レベルの情報を用いたオーディオデータの加工を可能とでき、特に元のオーディオデータにおいて曲間で音量レベルの差があるときに、これを一定の音量レベルとなるような調整を可能とできる。 As a result, the auxiliary data including the volume level information of the audio data can be output together with the encoded data of the audio data, and the audio data can be processed using the volume level information, particularly in the original audio data. When there is a difference in volume level between songs, it is possible to adjust the volume level to a certain level.
また、本発明の請求項3に係るオーディオ符号化装置は、請求項1記載のオーディオ符号化装置において、前記音量レベル出力手段が、前記音量レベルを、前記予め決められた期間のオーディオデータの音量の最大値と、平均の音量とに基づいて求める、ことを特徴とするものである。
An audio encoding apparatus according to
これにより、精度よく検出された音量レベルの情報を含む補助データをオーディオデータの符号化データとともに出力することができる。 As a result, auxiliary data including volume level information detected accurately can be output together with encoded data of audio data.
また、本発明の請求項4に係るオーディオ復号化装置は、請求項1記載のオーディオ符号化装置より出力される符号化データを、復号出力するオーディオ復号化装置であって、前記オーディオ符号化装置より出力される前記符号化データを復号してオーディオデータを出力する復号化手段と、前記オーディオ符号化装置より出力される前記補助データから前記音量レベルを抽出する音量レベル抽出手段と、前記符号化手段が出力する前記オーディオデータの音量を、前記音量レベル抽出手段により抽出した前記音量レベルに基づき、調整し、出力する音量調整手段とを備えた、ことを特徴とするものである。
An audio decoding apparatus according to claim 4 of the present invention is an audio decoding apparatus that decodes and outputs encoded data output from the audio encoding apparatus according to
これにより、復号したオーディオデータの振幅を、オーディオ符号化装置が出力する補助データに含まれる音量レベルの情報を用いて調整することができる。 Thereby, the amplitude of the decoded audio data can be adjusted by using the volume level information included in the auxiliary data output from the audio encoding device.
また、本発明の請求項5に係るオーディオ符号化装置は、オーディオデータが入力され、該オーディオデータを符号化した符号化データを、前記オーディオデータに関する補助データとともに出力するオーディオ符号化装置において、入力されるオーディオデータを符号化の単位であるフレーム毎に符号化処理して前記符号化データを出力すると共に、前記オーディオデータの符号化に関する符号化関連データを出力する符号化手段と、前記オーディオデータを前記フレーム毎に、複数のカテゴリのいずれかに分類し、該フレームがいずれのカテゴリに分類されたかを示すカテゴリ情報を出力するカテゴリ分類手段と、前記カテゴリ分類手段が出力する前記カテゴリ情報と、前記符号化手段が出力する前記符号化関連データとから、前記カテゴリ情報を含む補助データを作成する補助データ出力手段とを備えた、ことを特徴とするものである。
An audio encoding device according to
これにより、オーディオデータのカテゴリ情報を含む補助データをオーディオデータの符号化データとともに出力することができ、カテゴリ情報を用いたオーディオデータの加工を可能とできる。 Thereby, auxiliary data including category information of audio data can be output together with encoded data of audio data, and audio data can be processed using category information.
また、本発明の請求項6に係るオーディオ符号化装置は、請求項5記載のオーディオ符号化装置において、前記補助データが、カテゴリを示す値と、該カテゴリに分類されたフレームが連続する数との対の情報を含むものである、ことを特徴とするものである。
An audio encoding apparatus according to claim 6 of the present invention is the audio encoding apparatus according to
これにより、補助データに埋め込むデータの量を削減することができる。 As a result, the amount of data embedded in the auxiliary data can be reduced.
また、本発明の請求項7に係るオーディオ復号化装置は、請求項5記載のオーディオ符号化装置より出力される符号化データを、復号出力するオーディオ復号化装置であって、前記オーディオ符号化装置より出力される前記符号化データを復号してオーディオデータを出力する復号化手段と、前記オーディオ符号化装置より出力される前記補助データから前記カテゴリ情報を抽出するカテゴリ抽出手段と、前記複数のカテゴリのうちオーディオ出力を制御しようとするカテゴリを指定するカテゴリ指定手段と、前記補助データより抽出した前記カテゴリ情報と、前記カテゴリ指定手段より出力される指定カテゴリとに基づき、前記復号化されたオーディオデータを、そのうちの前記指定カテゴリに属するフレームのオーディオ出力については出力制御を行ない、出力するオーディオ出力手段とを備えた、ことを特徴とするものである。
An audio decoding apparatus according to claim 7 of the present invention is an audio decoding apparatus for decoding and outputting encoded data output from the audio encoding apparatus according to
これにより、カテゴリ情報を用いて、所定のカテゴリに属する音声のオーディオ出力を制御することができる。 Thereby, the audio output of the sound belonging to the predetermined category can be controlled using the category information.
また、本発明の請求項8に係るオーディオ復号化装置は、請求項7記載のオーディオ復号化装置において、前記カテゴリ指定手段は、前記複数のカテゴリのうちオーディオ出力しないカテゴリを指定するものであり、前記オーディオ出力手段は、前記復号化手段が出力するオーディオデータのうち、前記カテゴリ指定手段により指定されるカテゴリに属するフレームをオーディオ出力しないよう制御する、ことを特徴とするものである。 An audio decoding device according to claim 8 of the present invention is the audio decoding device according to claim 7, wherein the category specifying means specifies a category in which the audio is not output among the plurality of categories. The audio output means controls the audio data output from the decoding means so that frames belonging to the category specified by the category specifying means are not output as audio.
これにより、カテゴリ情報を用いて、所定のカテゴリに属する音声のオーディオ出力をしないように制御することができる。 Thereby, it is possible to control not to output audio belonging to a predetermined category using the category information.
また、本発明の請求項9に係るオーディオ復号化装置は、請求項5記載のオーディオ符号化装置より出力される符号化データを、復号出力するオーディオ復号化装置であって、前記オーディオ符号化装置より出力される前記補助データから前記カテゴリ情報を抽出するカテゴリ抽出手段と、前記複数のカテゴリのうちオーディオ出力しないカテゴリを指定する出力禁止カテゴリ指定手段と、前記補助データより抽出した前記カテゴリ情報と、前記出力禁止カテゴリ指定手段より出力される出力禁止カテゴリとに基づき、前記オーディオ符号化装置より出力される前記符号化データのうち、前記出力禁止カテゴリに属するフレームの符号化データを除く符号化データを復号してオーディオデータを出力する復号化手段とを備えた、ことを特徴とするものである。
An audio decoding apparatus according to claim 9 of the present invention is an audio decoding apparatus for decoding and outputting encoded data output from the audio encoding apparatus according to
これにより、カテゴリ情報を用いて、所定のカテゴリに属する音声のオーディオ出力をしないように制御することができる。 Thereby, it is possible to control not to output audio belonging to a predetermined category using the category information.
また、本発明の請求項10に係るオーディオ復号化装置は、請求項9記載のオーディオ復号化装置において、前記復号化手段の後段に設けられ、該復号化手段が復号したオーディオデータの出力を、前記出力禁止カテゴリ指定手段の出力に応じて、前記復号化手段が復号をしていない符号化データのままのデータが出力される期間が一定となるよう制御するオーディオ出力手段を、さらに備えた、ことを特徴とするものである。
An audio decoding device according to
これにより、カテゴリ情報を用いて、所定のカテゴリに属する音声のオーディオ出力をしないように制御することができ、また、復号化しないフレームの数によらず、一定の間隔でオーディオ出力を行うことができる。 Thus, it is possible to perform control so that audio belonging to a predetermined category is not output using the category information, and audio output can be performed at regular intervals regardless of the number of frames that are not decoded. it can.
また、本発明の請求項11に係るオーディオ符号化装置は、複数のオーディオ音源からのオーディオデータが入力され、該オーディオデータを符号化した符号化データを、前記オーディオデータに関する補助データとともに出力するオーディオ符号化装置において、前記複数のオーディオ音源のうちの1つ以上のオーディオ音源について該オーディオ音源からのオーディオデータが符号化の際の複数のオーディオ帯域のうちのどのオーディオ帯域に盛り込まれたかを示す帯域データ、及び符号化に関する符号化関連データを、前記複数のオーディオ音源からのオーディオデータを符号化した符号化データとともに、出力する符号化手段と、前記符号化手段が出力する前記帯域データと、前記符号化関連データとから、前記帯域データを含む補助データを作成する補助データ出力手段とを備えた、ことを特徴とするものである。
An audio encoding apparatus according to
これにより、オーディオデータの帯域データの情報を含む補助データをオーディオデータの符号化データとともに出力することができ、帯域データの情報を用いたオーディオデータの加工を可能とできる。 As a result, auxiliary data including information on the band data of the audio data can be output together with the encoded data of the audio data, and the audio data can be processed using the information on the band data.
また、本発明の請求項12に係るオーディオ符号化装置は、請求項11記載のオーディオ符号化装置において、前記符号化手段が、所定のオーディオ音源のオーディオデータについて、前記符号化データ中の所定のオーディオ帯域に収まるように制限をかけた上で符号化して、前記符号化データを出力する、ことを特徴とするものである。
An audio encoding device according to
これにより、所定のオーディオ音源のオーディオデータをより狭い帯域に盛り込むことができる。 Thereby, audio data of a predetermined audio source can be included in a narrower band.
また、本発明の請求項13に係るオーディオ復号化装置は、請求項11記載のオーディオ符号化装置より出力される符号化データを、復号出力するオーディオ復号化装置であって、前記オーディオ符号化装置より出力される前記補助データから前記帯域データを抽出する帯域データ抽出手段と、前記1つ以上のオーディオ音源のうちオーディオ出力を制御しようとするオーディオ音源を指定する音源指定手段と、前記補助データより抽出した前記帯域データと、前記音源指定手段より出力される指定音源とに基づき、前記指定音源のオーディオデータが盛り込まれた帯域の符号化データを、そのオーディオデータの振幅を制限して復号して出力する復号化手段とを備えた、ことを特徴とするものである。
An audio decoding apparatus according to
これにより、帯域データを用いて、複数のオーディオ音源のうちのいずれかの音源のオーディオ出力を任意に制御することができる。 Thereby, it is possible to arbitrarily control the audio output of any one of the plurality of audio sound sources using the band data.
本発明によれば、オーディオ符号化装置において、符号化データとともに、オーディオデータの音量レベル、オーディオデータのフレーム毎のカテゴリ、又はオーディオ音源が盛り込まれた帯域を示すデータを含む補助データを出力するようにしたから、オーディオ復号化装置でオーディオを再生する際に、補助データに含まれる音量レベル等を用いて、オーディオデータそのもの等の加工を行い、復号後のオーディオデータを加工して出力でき、利用価値の高いオーディオ符号化装置、及びオーディオ復号化装置を提供することができる。 According to the present invention, the audio encoding device outputs the auxiliary data including the encoded data and the volume level of the audio data, the category for each frame of the audio data, or the data indicating the band in which the audio sound source is included. Therefore, when audio is played back by the audio decoding device, the audio data itself can be processed using the volume level included in the auxiliary data, and the decoded audio data can be processed and output. A high-value audio encoding device and audio decoding device can be provided.
(実施の形態1)
以下、本発明の実施の形態1によるオーディオ符号化装置、及びオーディオ復号化装置について説明する。
図1は、本実施の形態1によるオーディオ符号化装置の構成を示すブロック図である。図1において、101は、入力されるオーディオデータを符号化して符号化データを出力する符号化手段、102は、入力されるオーディオデータの音量レベルを求めて出力する音量レベル出力手段、103は、オーディオデータに関する補助データを作成出力する補助データ出力手段である。これら符号化手段101、音量レベル出力手段102、及び補助データ出力手段103を含んでオーディオ符号化装置100が構成される。
(Embodiment 1)
Hereinafter, an audio encoding device and an audio decoding device according to
FIG. 1 is a block diagram showing a configuration of an audio encoding device according to the first embodiment. In FIG. 1, 101 is an encoding unit that encodes input audio data and outputs encoded data, 102 is a volume level output unit that calculates and outputs a volume level of input audio data, and 103 is Auxiliary data output means for creating and outputting auxiliary data relating to audio data. The
また、図2は、本実施の形態1によるオーディオ復号化装置の構成を示すブロック図である。図2において、201は、入力される補助データから音量レベルを抽出し抽出した音量レベルに応じた音量の倍率を出力する音量レベル抽出手段、202は、符号化データを復号化してオーディオデータを出力する復号化手段、203は、復号化手段202が出力するオーディオデータの音量を調節してオーディオ出力する音量調節手段である。これら音量レベル抽出手段201、復号化手段201、及び音量調節手段203を含んでオーディオ復号化装置200が構成される。
FIG. 2 is a block diagram showing the configuration of the audio decoding apparatus according to the first embodiment. In FIG. 2, 201 is a volume level extraction means for extracting a volume level from input auxiliary data and outputting a volume magnification according to the extracted volume level, 202 is a decoder for decoding encoded data and outputting audio data Decoding means 203 for controlling the volume of the audio data output from the decoding means 202 is adjusted so as to output the audio. The
図3は、MPEG1−LayerIIのオーディオフレームのフォーマットを示す図である。図3において、オーディオフレームは、header(ヘッダ)領域、Error_check領域、audio_data領域、ancillary_data領域を含んでいる。そして、上記ヘッダ領域は、“syncword”、“ID”、“layer”、“protection_bit”、“bitrate_index”、“sampling_frequency”、“padding_bit”、“private_bit”、“mode”、“mode_extention”、“copyright”、“original/copy”,“emphasis”といった符号化に関する各種のデータの領域を含む。 FIG. 3 is a diagram showing the format of an MPEG1-Layer II audio frame. In FIG. 3, the audio frame includes a header (header) area, an Error_check area, an audio_data area, and an ancillary_data area. The header area includes “syncword”, “ID”, “layer”, “protection_bit”, “bitrate_index”, “sampling_frequency”, “padding_bit”, “private_bit”, “mode”, “mode”, “mode”, “mode”, “mode”, “mode”, “mode”, “mode”, , “Original / copy”, “emphasis” and various data areas related to encoding.
次に本実施の形態1によるオーディオ符号化装置、及びオーディオ復号化装置の動作を説明する。
まず本実施の形態1によるオーディオ符号化装置100の動作について説明する。
Next, operations of the audio encoding device and the audio decoding device according to
First, the operation of the
図1に示すように、オーディオデータは符号化手段101、及び音量レベル出力手段102に入力される。符号化手段101はオーディオデータを入力すると、これを符号化して符号化データを出力する。また、符号化手段101は、このときの符号化に関する符号化関連データを補助データ出力手段103に出力する。符号化をMPEG1−LayerIIの規則にしたがって行う場合、符号化関連データとして、図3に示すように、オーディオフレームのヘッダ領域に含まれる、ビットレートを示す“bitrate_index”、チャンネル符号を示す“mode”、帯域の境界を示す“mode_extension”等を出力する。
As shown in FIG. 1, the audio data is input to the
一方、音量レベル出力手段102はオーディオデータを入力すると、楽曲1曲分の間の音量のピーク値と、平均音量を求め、「ピーク値:平均音量」を「8:2」の比率で重み付けして音量レベルを求める。例えば、音量レベル出力手段102は、測定した音量のピーク値が「6」であり、平均音量が「4」であるとき、6×0.8+4×0.2で求められる「5.6」を該楽曲の音量レベルとして出力する。なお、音量レベルを割り出す方法は、特にこの方法に限定されるものではなく、ピーク値そのもの、もしくは平均音量そのものを音量レベルとして出力するようにしてもよい。また、ピーク値、及び平均音量を変数として、ピーク値と平均音量を所定の比率で重み付けするのとは異なる所定の演算をすることにより、音量レベルを求めるようにしてもよい。音量レベル出力手段102は、こうして求めた音量レベルを補助データ出力手段103に出力する。
On the other hand, when the audio level is input, the volume level output means 102 obtains the peak value and average volume of the music for one song, and weights “peak value: average volume” at a ratio of “8: 2”. To find the volume level. For example, when the peak value of the measured volume is “6” and the average volume is “4”, the volume
補助データ出力手段103は、符号化手段101からの符号化関連データと音量レベル出力手段102からの音量レベルを入力すると、図3のMPEG1−LayerIIに基づいたフォーマットに変換して補助データとして出力する。 When the auxiliary data output means 103 receives the encoding-related data from the encoding means 101 and the volume level from the volume level output means 102, the auxiliary data output means 103 converts it into a format based on MPEG1-LayerII in FIG. 3 and outputs it as auxiliary data. .
本実施の形態1では、MPEG1−LayerIIのストリーム中のヘッダ領域の“private_bit”の部分に音量レベルの情報を含めて補助データを作成する。補助データ出力手段103は、音量レベル出力手段102から受け取った音量レベルの情報を、オーディオフレームのヘッダ領域に含まれる2ビットの“private_bit”に埋め込む。2ビットの“private_bit”を用いることにより、例えば“00”,“01”,“10”,“11”で示される4段階の音量レベル「0」、「1」、「2」、「3」の情報を、補助データに含めることが可能である。本実施の形態1では、音量レベルの情報をユーザに開放されている領域に埋め込むようにしているので、該領域のデータを有意のものとして扱わない従来の復号化装置で復号する場合にその復号動作に影響を及ぼさない。また元々各規格で準備されている領域を使用しているので、音量レベルの情報を含めるためにビット量が増加することもない。
In the first embodiment, auxiliary data is created by including volume level information in the “private_bit” portion of the header area in the MPEG1-LayerII stream. The auxiliary
以上の動作により、本実施の形態1によるオーディオ符号化装置100は、オーディオデータの符号化データとともに、オーディオデータの音量レベルを含む補助データを出力する。
Through the above operation, the
次に本実施の形態1によるオーディオ復号化装置の動作について説明する。
図2に示すように、音量レベル抽出手段201は、補助データを入力すると、前記“private_bit”に埋め込まれた情報、つまり音量レベルの情報を抽出する。
Next, the operation of the audio decoding apparatus according to the first embodiment will be described.
As shown in FIG. 2, when the auxiliary data is input, the volume
音量レベル抽出手段201は、補助データから音量レベルを抽出すると、図4の表に示す規則に従って、音量の倍率を音量調節手段203に出力する。本実施の形態1では、図4に示すように、音量レベルが「0」のとき音量の倍率を1.1倍とし、音量レベルが「1」のとき音量の倍率を1倍とし、音量レベルが「2」のとき音量の倍率を0.9倍とし、音量レベルが「3」のとき音量の倍率を0.8倍とする。なお、音量レベルと、音量の倍率の関係は、これに限るものではない。
When the volume
復号化手段202は符号化データを入力すると復号化を行い、復号化されたオーディオを音量調節手段203に出力する。 Decoding means 202 performs decoding when the encoded data is input, and outputs the decoded audio to volume control means 203.
音量調節手段203は、復号化手段202から入力したオーディオの振幅に、音量レベル抽出手段201により抽出した音量レベルに対応する音量の倍率を掛けて出力する。
The
図5は、本実施の形態1によるオーディオ復号装置の音量調節手段203がオーディオの振幅を変更する様子を示す図である。楽曲の境の前後の符号化フレームを復号したオーディオデータの振幅が調整される様子を示す。 FIG. 5 is a diagram showing how the volume adjusting means 203 of the audio decoding device according to the first embodiment changes the audio amplitude. A state in which the amplitude of audio data obtained by decoding encoded frames before and after a music boundary is adjusted is shown.
図5に示すように、音量レベル抽出手段201により補助データから抽出された音量レベルは、第1の楽曲に含まれるフレーム#nは「1」であり、第2の楽曲に含まれるフレーム#n+1は「2」である。音量レベルが「1」のとき音量の倍率は、図4に示すように、1倍であるので、音量調節手段203は復号後のフレーム#1のオーディオ振幅を1倍にして出力し、音量レベルが「2」のとき音量の倍率は、図4に示すように、0.9倍であるので、音量調節手段203は復号後のフレーム#n+1のオーディオ振幅を0.9倍にして出力する。
As shown in FIG. 5, the volume level extracted from the auxiliary data by the volume
これにより、復号化手段202に入力され復号された第2の楽曲のフレーム#n+1の振幅は、第1の楽曲のフレーム#nの振幅より大きいが、音量調節手段203から出力されるフレーム#n+1の振幅はフレーム#nの振幅と同じになる。このとき、スムーズに音量が変更できるように倍率を同一フレームでも徐々に変更するようにしてもよい。このようにして、オーディオ符号化装置100から出力された補助データに含まれる音量レベルの情報に基づいて、楽曲間で差がある音量を一定のレベルに合わせることができ、オーディオデータを再生したときに、オーディオ振幅の変化による違和感を軽減することができる。
As a result, the amplitude of the frame # n + 1 of the second song input and decoded by the
以上のように本実施の形態1によるオーディオ符号化装置は、入力されるオーディオデータを符号化処理して符号化データを出力すると共に、前記符号化に関する符号化関連データを出力する符号化手段101と、オーディオデータの音量レベルを出力する音量レベル出力手段102と、検出した音量レベルと、符号化関連データとから、音量レベルの情報を含む補助データを作成する補助データ出力手段103とを備えることにより、オーディオデータの音量レベルの情報を含む補助データをオーディオデータの符号化データとともに出力することができ、音量レベルの情報を用いたオーディオデータの加工を可能とできる。 As described above, the audio encoding device according to the first embodiment encodes input audio data and outputs encoded data, and also outputs encoding-related data related to the encoding. And volume level output means 102 for outputting the volume level of the audio data, and auxiliary data output means 103 for creating auxiliary data including volume level information from the detected volume level and the encoding related data. Thus, the auxiliary data including the volume level information of the audio data can be output together with the encoded data of the audio data, and the audio data can be processed using the volume level information.
また、本実施の形態1によるオーディオ復号化装置は、オーディオ符号化装置より出力される符号化データを復号してオーディオデータを出力する復号化手段202と、オーディオ符号化装置より出力される音量レベルの情報を含む補助データから前記音量レベルを抽出する音量レベル抽出手段201と、復号化手段202より出力されるオーディオデータの音量を、音量レベル抽出手段201により抽出した前記音量レベルに基づき調整して、出力する音量調整手段203とを備えることにより、補助データから抽出した音量レベルの情報を用いてオーディオデータを加工し、復号したオーディオデータの振幅を調整することができる。
Also, the audio decoding apparatus according to
なお、上記実施の形態1では、補助データ出力手段が、音量レベルの情報をオーディオフレームのヘッダ領域に含まれる2ビットの“private_bit”に埋め込むようにしたものについて説明したが、音量レベルの情報をオーディオフレームのancillary_data領域等、他の領域に埋め込むようにしてもよい。また、システムとして、領域が確保されている、もしくは余分がある領域を、利用してもよい。例えば図8に示されるようなDVD−Video規格であれば、以下のように、各領域を、補助データとして活用することができる。すなわち、DVD−Video規格では、VOBUという単位で管理されている。VOBUには、必ず、NV_PCKパックと呼ばれているシステム情報が含まれている。NV_PCKパックの中には、PCI_PCKパックと呼ばれている再生制御情報が含まれていて、最後の18バイトはReserved領域で定義されていない。そのためこのReserved領域を、補助データとして利用できる。また各規格で定義されていたとしてもシステムとして利用しない領域については、これを補助データに利用することが可能である。補助データは、その他、SD規格や、ブルーレイ規格中のオーディオ符号化データ以外の補助データを使用することも可能である。 In the first embodiment described above, the auxiliary data output unit has described the case where the volume level information is embedded in the 2-bit “private_bit” included in the header area of the audio frame. The audio frame may be embedded in another area such as an ancillary_data area. Moreover, you may utilize the area | region where the area | region is ensured or there exists an extra as a system. For example, in the DVD-Video standard as shown in FIG. 8, each area can be used as auxiliary data as follows. That is, in the DVD-Video standard, it is managed in units of VOBU. The VOBU always includes system information called an NV_PCK pack. The NV_PCK pack includes playback control information called a PCI_PCK pack, and the last 18 bytes are not defined in the Reserved area. Therefore, this Reserved area can be used as auxiliary data. Moreover, even if it is defined in each standard, it is possible to use this as auxiliary data for an area that is not used as a system. As the auxiliary data, auxiliary data other than the encoded audio data in the SD standard or the Blu-ray standard can be used.
また、上記実施の形態1ではオーディオデータの符号化、復号化をMPEG1−LayerIIの規則に従って行うものとしたが、オーディオデータの符号化、復号化の規則はこれに限られるものではない。 In the first embodiment, encoding and decoding of audio data are performed according to the MPEG1-Layer II rules. However, the encoding and decoding rules of audio data are not limited to this.
(実施の形態2)
以下、本発明の実施の形態2によるオーディオ符号化装置、及びオーディオ復号化装置について説明する。
(Embodiment 2)
Hereinafter, an audio encoding device and an audio decoding device according to
図6は、本実施の形態2によるオーディオ符号化装置の構成を示すブロック図である。図6において、601は、入力されるオーディオデータを符号化して符号化データを出力する符号化手段、602は、入力されるオーディオデータを複数のカテゴリに分類するカテゴリ分類手段、603は、オーディオデータに関する補助データを作成出力する補助データ出力手段である。これら符号化手段601、カテゴリ分類手段602、及び補助データ出力手段603を含んでオーディオ符号化装置600が構成される。
FIG. 6 is a block diagram showing the configuration of the audio encoding apparatus according to the second embodiment. In FIG. 6,
また、図7は、本実施の形態2によるオーディオ復号化装置の構成を示すブロック図である。図7において、701は、入力される補助データからカテゴリ情報を抽出して出力するカテゴリ抽出手段、702は、符号化データを復号化してオーディオデータを出力する復号化手段である。また、704は複数のカテゴリのうちオーディオ出力を制御しようとするカテゴリを指定するカテゴリ指定手段である。703は、復号化手段702が出力するオーディオデータのオーディオ出力を、カテゴリ情報とカテゴリ指定手段704の出力とに基づいて制御するオーディオ出力手段である。これらカテゴリ抽出手段701、復号化手段702、オーディオ出力手段703、及びカテゴリ指定手段704を含んでオーディオ復号化装置700が構成される。
FIG. 7 is a block diagram showing the configuration of the audio decoding apparatus according to the second embodiment. In FIG. 7,
図8は、DVD−Video規格のデータフォーマットを示す図である。DVD−Video規格では、VOBUという単位で管理されている。VOBUには、必ずNV_PCKパックと呼ばれているシステム情報が含まれている。NV_PCKパックの中には、PCI_PCKパックと呼ばれている再生制御情報が含まれていて最後の18バイトはReserved(RSV)領域となっており使用用途が定義されていない。 FIG. 8 is a diagram showing a data format of the DVD-Video standard. In the DVD-Video standard, it is managed in units of VOBU. The VOBU always includes system information called an NV_PCK pack. The NV_PCK pack includes playback control information called a PCI_PCK pack, and the last 18 bytes are a Reserved (RSV) area, and the usage is not defined.
次に本実施の形態2によるオーディオ符号化装置、及びオーディオ復号化装置の動作を説明する。
まず本実施の形態2によるオーディオ符号化装置600の動作について説明する。
Next, operations of the audio encoding device and the audio decoding device according to the second embodiment will be described.
First, the operation of the
図6に示すように、符号化手段601はオーディオが入力されると該オーディオデータをサンプリングレートに応じて決まる所定の時間長のフレーム毎に符号化し、符号化データを出力する。また、符号化手段601はこのときの符号化に関する符号化関連データを補助データ出力手段603に出力する。DVD−Video規格の場合でもオーディオがMPEG1−LayerIIの場合であれば、基本的に符号化関連データは実施の形態1と同一であるため符号化関連データの詳細な説明は割愛する。
As shown in FIG. 6, when audio is input, the
カテゴリ分類手段602は、入力したオーディオデータを、符号化手段601の符号化の単位であるフレームに分割し、フレーム毎に複数のカテゴリのいずれかに分類し、該フレームがいずれのカテゴリに分類されたかを示すカテゴリ情報を補助データ出力手段603に出力する。カテゴリ分類手段602が、オーディオデータのフレームの切れ目を知る方法としては、カテゴリ分類手段602でオーディオデータのサンプルをカウントし、カウント値がフレームのサンプル数と一致するタイミングを検出する方法を用いることができる。この他、符号化手段601からフレームの切れ目を示す同期信号を受け取ってフレームの切れ目を知ることも可能である。
The
図9は、本実施の形態2におけるオーディオデータのフレームとカテゴリとの対応関係の例を示す図であり、図9において、上段はフレーム番号、中段はカテゴリ値、下段はオーディオデータを示す。この例では英語音声と日本語音声を含むオーディオデータを、フレーム毎に、日本語音声であるものはカテゴリ「2」、特定の英単語の音声であるものはカテゴリ「1」、特定の英単語以外の英語音声であるものはカテゴリ「0」として分類する。図に示すように、フレーム番号10、11、21、22、23はカテゴリ「0」に分類され、フレーム番号12、13、24、25はカテゴリ「1」に分類され、フレーム番号14〜20、26〜31はカテゴリ「2」に分類される。
FIG. 9 is a diagram showing an example of the correspondence between audio data frames and categories in the second embodiment. In FIG. 9, the upper row shows frame numbers, the middle row shows category values, and the lower row shows audio data. In this example, audio data including English speech and Japanese speech is classified into categories “2” for Japanese speech, category “1” for speech of a specific English word, and specific English words for each frame. Those other than English speech are classified as category “0”. As shown in the figure,
補助データ出力手段603は、符号化手段601からの符号化関連データとカテゴリ分類手段602からのカテゴリ情報を入力すると、図8のDVD−Video規格のデータフォーマットに変換して補助データとして出力する。 When the auxiliary data output means 603 receives the encoding related data from the encoding means 601 and the category information from the category classification means 602, the auxiliary data output means 603 converts the data into the DVD-Video standard data format of FIG. 8 and outputs it as auxiliary data.
本実施の形態2では、DVD−VideoのNV_PCKパック中のPCI_PCKパックの部分が補助データに該当する。ここで、補助データ出力手段603は、図8のPCI_PCK情報を組上げるときに、入力したカテゴリ情報に基づいて、フレーム番号とカテゴリの値をセットにして順次RSV領域に埋め込む。例えば、分類されるフレームのフレーム番号を4ビットの信号で表し、このフレームが属するカテゴリを2ビットの信号で表し、各フレームについてこれら4ビットと2ビットの信号を対にして順次RSV領域に埋め込む。この時に、複数フレーム連続してカテゴリの値が同じである場合は、各フレーム毎にカテゴリの値を保存するのではなく、カテゴリの値を1回保存して、その後に同一のカテゴリのフレームの連続回数を保存すようにすれば、カテゴリ情報を圧縮することができる。このような構成は、同一のカテゴリに属するフレームが複数連続することが多い時に特に有効である。 In the second embodiment, the PCI_PCK pack portion in the DVD_Video NV_PCK pack corresponds to the auxiliary data. Here, the auxiliary data output means 603, when assembling the PCI_PCK information of FIG. 8, sets the frame number and the category value as a set and sequentially embeds them in the RSV area based on the input category information. For example, the frame number of the frame to be classified is represented by a 4-bit signal, the category to which this frame belongs is represented by a 2-bit signal, and for each frame, the 4-bit and 2-bit signals are paired and sequentially embedded in the RSV area. . At this time, if the category value is the same for a plurality of frames continuously, the category value is not saved for each frame, but the category value is saved once, and then the frames of the same category are saved. If the number of consecutive times is stored, the category information can be compressed. Such a configuration is particularly effective when there are many consecutive frames belonging to the same category.
補助データ出力手段603は、PCI_PCKパックが完成した段階で出力する。DVD−Video規格の場合は、PCI_PCKパックにはビデオ情報も必要な場合があるが、このような場合は、補助データ出力手段603から、RSV領域に埋め込むカテゴリ情報を含む、PCI_PCKパックの作成に必要な情報の一部を出力し、符号化システムの別の手段により、所定のビデオ情報も含めてPCI_PCKパックを組上げる構成としてもよい。本実施の形態2では、カテゴリ情報をユーザに開放されている領域に埋め込むようにしているので、該領域のデータを有意のものとして扱わない従来の復号化装置で復号する場合にその復号動作に影響を及ぼさない。また元々各規格で準備されている領域を使用しているので、カテゴリ情報を含めるためにビット量が増加することもない。 The auxiliary data output means 603 outputs it when the PCI_PCK pack is completed. In the case of the DVD-Video standard, video information may be required for the PCI_PCK pack. In such a case, it is necessary to create a PCI_PCK pack including category information embedded in the RSV area from the auxiliary data output means 603. Alternatively, a part of the information may be output and a PCI_PCK pack including predetermined video information may be assembled by another means of the encoding system. In the second embodiment, the category information is embedded in an area open to the user. Therefore, when decoding is performed by a conventional decoding apparatus that does not treat the data in the area as significant, the decoding operation is performed. Has no effect. Further, since the area originally prepared in each standard is used, the bit amount does not increase to include the category information.
上述した動作により、オーディオ符号化装置600から、オーディオデータの符号化データとともに、オーディオデータのカテゴリ情報を含む補助データが出力される。
Through the above-described operation, the
次に本実施の形態2によるオーディオ復号化装置700の動作について説明する。
図7に示すように、カテゴリ抽出手段701は補助データとしてPCI_PCKパックを入力するとRSV領域からカテゴリ情報を抽出し、抽出したカテゴリをオーディオ出力手段703に出力する。RSV領域にカテゴリの値と同一カテゴリのフレームの連続数が含まれている場合には、それを解釈してフレーム毎のカテゴリの値をオーディオ出力手段703に出力する。カテゴリ情報がフレーム単位で保存されているか、同一カテゴリのフレームの連続数で保存されているかは、オーディオ符号化装置とオーディオ復号化装置の間で予め決めていても良いし、連続数での繰り返しをする、しないの選択ビットをつけたフォーマットを決めておいてもよい。
Next, the operation of the audio decoding apparatus 700 according to the second embodiment will be described.
As shown in FIG. 7, when a PCI_PCK pack is input as auxiliary data, the
復号化手段702は符号化データを入力すると復号化を行い、復号化されたオーディオをオーディオ出力手段703に出力する。
The
オーディオ出力手段703の動作を図9の例を用いて説明する。図9に示す例において、オーディオ出力を制御しようとするカテゴリが何も指定されていない場合は、オーディオ出力手段703は、「『I am hungry.』『私はお腹が空いた。』『I eat an apple.』『私はリンゴを食べる。』」と復号化手段601が復号した通りにオーディオデータを出力する。 The operation of the audio output means 703 will be described using the example of FIG. In the example shown in FIG. 9, when no category for controlling the audio output is specified, the audio output means 703 displays “I am hungry.” “I am hungry.” “I eat. an apple. "I eat an apple." and the decoding means 601 outputs the audio data as decoded.
また外部からカテゴリ「1」だけ出力するように指示されると、カテゴリ指定手段704はオーディオ出力を制御しようとするカテゴリ「0」とカテゴリ「2」をカテゴリ指定信号として出力する。オーディオ出力手段703はカテゴリ指定手段704の出力に応じて、カテゴリ「0」とカテゴリ「2」に属するフレームのオーディオデータのオーディオ出力をしないように制御し、その結果、「『hungry』『apple』」、と特定単語だけがオーディオ出力される。 Further, when an instruction is given to output only the category “1” from the outside, the category specifying means 704 outputs the category “0” and the category “2” to be controlled for audio output as the category specifying signal. The audio output means 703 controls the audio data of the frames belonging to the category “0” and the category “2” not to be output in accordance with the output of the category specifying means 704, and as a result, ““ hungly ”“ apple ” ", Only a specific word is output as audio.
また外部からカテゴリ「2」だけをオーディオ出力をしないように指示されると、カテゴリ指定手段704はオーディオ出力を制御しようとするカテゴリ「2」をカテゴリ指定信号として出力する。 Further, when it is instructed not to output only the category “2” from the outside, the category specifying means 704 outputs the category “2” for controlling the audio output as a category specifying signal.
オーディオ出力手段703はカテゴリ指定手段704の出力に応じて、カテゴリ「2」に属するフレームのオーディオデータのオーディオ出力をしないように制御し、その結果、「『I am hungry.』『I eat an apple.』」、と日本語音声以外の部分がオーディオ出力される。このように、語学学習の際に、1つの符号化データに対して外国語と日本語をそれぞれ単独に聞くことや、重要単語だけを抜き出して聞く、といった使用方法が可能である。 The audio output means 703 performs control so as not to output audio data of frames belonging to the category “2” in accordance with the output of the category specifying means 704. As a result, “I am hungry.” “I eat an apple” . ”” And other parts than Japanese speech are output as audio. In this way, during language learning, it is possible to use a single encoded data such as listening to a foreign language and Japanese individually, or extracting only important words and listening.
以上のように本実施の形態2によるオーディオ符号化装置600では、入力されるオーディオデータをフレーム毎に符号化処理して符号化データを出力すると共に、前記符号化に関する符号化関連データを出力する符号化手段601と、オーディオデータをフレーム毎に、複数のカテゴリのいずれかに分類し、該フレームがいずれのカテゴリに分類されたかを示すカテゴリ情報を出力するカテゴリ分類手段602と、カテゴリ情報と符号化関連データとから、カテゴリ情報を含む補助データを作成する補助データ出力手段103とを備えることにより、オーディオデータのカテゴリ情報を含む補助データをオーディオデータの符号化データとともに出力することができ、カテゴリ情報を用いたオーディオデータの加工を可能とできる。
As described above, the
また、本実施の形態2によるオーディオ復号化装置700では、オーディオ符号化装置より出力される符号化データを復号してオーディオデータを出力する復号化手段702と、オーディオ符号化装置より出力されるカテゴリ情報を含む補助データから前記カテゴリ情報を抽出するカテゴリ抽出手段701と、複数のカテゴリのうちオーディオ出力を制御しようとするカテゴリを指定するカテゴリ指定手段704と、カテゴリ抽出手段701により抽出したカテゴリ情報とカテゴリ指定手段704の出力する指定カテゴリとに基づき、指定カテゴリに属するフレームのオーディオ出力を出力制御して出力するオーディオ出力手段703とを備えることにより、補助データから抽出したカテゴリ情報を用いてオーディオデータを加工し、所定のカテゴリに属する音声のオーディオ出力を制御することができる。
Also, in the audio decoding apparatus 700 according to the second embodiment, a
なお、上記実施の形態2では、カテゴリの数が3つである場合について説明したが、これに限るものではない。 In the second embodiment, the case where the number of categories is three has been described. However, the present invention is not limited to this.
また、上記実施の形態2では、カテゴリ「1」のデータのみを出力する場合、またはカテゴリ「2」のデータを出力しない場合について説明したが、特定カテゴリの出力、未出力の指示も上記以外にも可能である。 Further, in the second embodiment, the case where only the data of category “1” is output or the case where the data of category “2” is not output has been described. Is also possible.
また、上記実施の形態2では、補助データ出力手段が、カテゴリの情報を、DVD−VideoのVOBUのNV_PCKパック中のPCI_PCKパックのReserved領域に埋め込むようにしたものについて説明したが、オーディオフレームのヘッダ領域に含まれる2ビットの“private_bit”等、他の領域に埋め込むようにしてもよい。 In the second embodiment, the auxiliary data output means has described that the category information is embedded in the Reserved area of the PCI_PCK pack in the NV_PCK pack of the DVD-Video VOBU. It may be embedded in another area such as 2-bit “private_bit” included in the area.
また、本実施の形態2では、オーディオデータの符号化、復号化をMPEG1−LayerIIの規則に従って行い、システムがDVD−Video規格のシステムであるものとしたが、オーディオデータの符号化、復号化の規則、およびシステムの規格はこれに限られるものではない。 In the second embodiment, encoding and decoding of audio data are performed according to the MPEG1-Layer II rules, and the system is a DVD-Video standard system. However, encoding and decoding of audio data is performed. Rules and system standards are not limited to this.
(実施の形態3)
以下、本発明の実施の形態3によるオーディオ符号化装置、及びオーディオ復号化装置について説明する。
本実施の形態3は、オーディオ符号化装置の構成が上記実施の形態2によるオーディオ符号化装置と同一であり、オーディオ復号化装置の構成が上記実施の形態2によるオーディオ復号化装置と異なるものである。
(Embodiment 3)
Hereinafter, an audio encoding device and an audio decoding device according to
In the third embodiment, the configuration of the audio encoding device is the same as that of the audio encoding device according to the second embodiment, and the configuration of the audio decoding device is different from that of the audio decoding device according to the second embodiment. is there.
図10は、本実施の形態3によるオーディオ復号化装置の構成を示すブロック図である。1001は、入力される補助データからカテゴリ情報を抽出して出力するカテゴリ抽出手段、1004は複数のカテゴリのうちオーディオ出力を禁止しようとするカテゴリを指定する出力禁止カテゴリ指定手段である。1002は、カテゴリ情報と出力禁止カテゴリ指定手段1004の出力とに基づいて符号化データを復号化してオーディオデータを出力する復号化手段、1003は、復号化手段1002が出力するオーディオデータのオーディオ出力を制御するオーディオ出力手段である。これらカテゴリ抽出手段1001、復号化手段1002、オーディオ出力手段1003、及び出力禁止カテゴリ指定手段1004を含んでオーディオ復号化装置1000が構成される。
FIG. 10 is a block diagram showing the configuration of the audio decoding apparatus according to the third embodiment.
次に本実施の形態3によるオーディオ復号化装置1000の動作について図9の例を用いて説明する。
カテゴリ抽出手段1001は、実施の形態2のカテゴリ抽出手段701と同じ動作をするためその説明を省略する。
Next, the operation of the
The
復号化手段1002は、外部からの指示に応じて以下のように動作する。
まず、外部から何も指定されていない場合は、出力禁止カテゴリ指定手段1004はオーディオ出力を禁止するカテゴリを出力せず、復号化手段1002は、実施の形態2の符号化手段601と同様、すべての符号化データを復号化し復号化されたオーディオをオーディオ出力手段1003に出力する。
Decoding means 1002 operates as follows in response to an instruction from the outside.
First, when nothing is specified from the outside, the output prohibition
また外部からカテゴリ「1」だけ出力するように指示されると、出力禁止カテゴリ指定手段1004はオーディオ出力を禁止しようとするカテゴリ「0」とカテゴリ「2」をカテゴリ指定信号として出力する。復号化手段1002は、出力禁止カテゴリ指定手段1004の出力に応じ、図3に示すオーディオフレームのヘッダ領域の”sampling_frequency”から1秒間のフレーム数を求め、”bitrate_index”から1秒間の転送レートを割り出す。そして、両者から1フレーム当たりのビット数を求める。1フレーム当たりのビット数が求まれば、復号化を行わず、求めたビット数まで符号化データをスキップする。例えば、外部からカテゴリ1だけ出力するように指示された場合、図9に示すように、カテゴリ0のフレーム10、11と、カテゴリ2のフレーム14〜20と、カテゴリ0のフレーム21〜23と、カテゴリ2のフレーム26〜31は復号化を行わず、符号化データをスキップする。
When an instruction is given to output only the category “1” from the outside, the output prohibition
符号化データをスキップする方法としては、上述の方法のほか、図3に示すオーディオフレームのヘッダ領域の”syncword”のパターンがスキップするフレームの個数分出現するまでデータをスキップする方法を用いてもよい。これにより、復号化手段1002からはフレーム12、13、24、25の符号化データを復号化したオーディオデータが出力され、オーディオ出力手段1003はこの復号化されたオーディオデータをオーディオ出力する。
As a method of skipping encoded data, in addition to the above-described method, a method of skipping data until the “syncword” pattern in the header area of the audio frame shown in FIG. 3 appears for the number of skipped frames may be used. Good. As a result, audio data obtained by decoding the encoded data of the
ここで復号化しないでスキップするフレーム数が異なると、オーディオ出力手段1003へのオーディオデータの出力の間隔が不均一になることが考えられる。本実施の形態3では、オーディオ出力手段1003は、出力禁止カテゴリ指定手段1004の出力禁止カテゴリに応じて、復号化手段1002が復号をしていない符号化データのままのデータが出力される期間が一定となるように制御する。このような制御は、例えば、復号化手段1002の出力データを、復号化手段1002が復号をしていない部分に対応する期間を除いて、バッファメモリ等に所定時間分蓄積した後、該蓄積したデータを順に出力することによって行なうことができる。
Here, if the number of frames to be skipped without decoding is different, it is conceivable that the interval of output of audio data to the audio output means 1003 becomes non-uniform. In the third embodiment, the audio output means 1003 has a period in which the encoded data that is not decoded by the decoding means 1002 is output according to the output prohibited category of the output prohibited
以上のように本実施の形態3によるオーディオ復号化装置1000では、オーディオ符号化装置より出力される補助データからカテゴリ情報を抽出するカテゴリ抽出手段1001と、複数のカテゴリのうちオーディオ出力しないカテゴリを指定する出力禁止カテゴリ指定手段1004と、カテゴリ抽出手段1001により抽出したカテゴリ情報と、出力禁止カテゴリ指定手段1004の出力とに基づき、オーディオ符号化装置より出力される符号化データのうち、出力禁止カテゴリ指定手段1004より出力されるカテゴリに属するフレームの符号化データを除く符号化データを復号してオーディオデータを出力する復号化手段とを備えることにより、オーディオ符号化装置より出力される符号化データを復号出力する際に、カテゴリ情報を用いて、所定のカテゴリに属する音声のオーディオ出力を制御することができる。
As described above, in the
なお、上記実施の形態3では、カテゴリの数が3つである場合について説明したが、これに限るものではない。 In the third embodiment, the case where the number of categories is three has been described. However, the present invention is not limited to this.
また、上記実施の形態3では、補助データ出力手段が、カテゴリの情報を、DVD−VideoのVOBUのNV_PCKパック中のPCI_PCKパックのReserved領域に埋め込むようにしたものについて説明したが、オーディオフレームのヘッダ領域に含まれる2ビットの“private_bit”等、他の領域に埋め込むようにしてもよい。 In the third embodiment, the auxiliary data output unit has described that the category information is embedded in the Reserved area of the PCI_PCK pack in the NV_PCK pack of the DVD-Video VOBU. It may be embedded in another area such as 2-bit “private_bit” included in the area.
また、本実施の形態3では、オーディオデータの符号化、復号化をMPEG1−LayerIIの規則に従って行うものとしたが、オーディオデータの符号化、復号化の規則はこれに限られるものではない。 In the third embodiment, encoding and decoding of audio data are performed according to the MPEG1-Layer II rules, but the encoding and decoding rules of audio data are not limited to this.
(実施の形態4)
以下、本発明の実施の形態4によるオーディオ符号化装置、及びオーディオ復号化装置について説明する。
(Embodiment 4)
Hereinafter, an audio encoding device and an audio decoding device according to Embodiment 4 of the present invention will be described.
図11は、本発明の実施の形態4によるオーディオ符号化装置の構成を示すブロック図である。図11において、1101は、複数のオーディオ音源からのオーディオデータを符号化して符号化データを出力する符号化手段、1102は、符号化手段1101が出力する帯域データと、符号化関連データとからオーディオデータに関する補助データを作成出力する補助データ出力手段である。これら符号化手段1101、及び補助データ出力手段1102を含んでオーディオ符号化装置1100が構成される。
FIG. 11 is a block diagram showing a configuration of an audio encoding device according to Embodiment 4 of the present invention. In FIG. 11,
また、図12は、本発明の実施の形態4によるオーディオ復号化装置の構成を示すブロック図である。図12において、1201は、入力される補助データから帯域データを抽出する帯域データ抽出手段、1202は、入力される符号化データを復号化する復号化手段である。また、1203は複数のオーディオ音源のうちオーディオ出力を制御しようとするオーディオ音源を指定する音源指定手段である。これら帯域データ抽出手段1201、復号化手段1202、及び音源指定手段1203を含んでオーディオ復号化装置1200が構成される。
FIG. 12 is a block diagram showing the configuration of the audio decoding apparatus according to Embodiment 4 of the present invention. In FIG. 12,
次に本実施の形態4によるオーディオ符号化装置、及びオーディオ復号化装置の動作を説明する。
まず本実施の形態4によるオーディオ符号化装置1100の動作について説明する。本実施の形態4では、符号化手段1101に楽器音源のオーディオデータと音声音源のオーディオデータを入力する場合を想定する。なお、符号化手段1101へのオーディオ音源の入力は2入力に限るものではなく、楽器と音声に限るものでもない。例えば、符号化手段1101への入力を3入力とし、1つはピアノ、1つはバイオリン、1つは拍手といった3つのオーディオ音源を入力することも想定できる。
Next, operations of the audio encoding device and the audio decoding device according to the fourth embodiment will be described.
First, the operation of the
MPEG1−LayerIIの場合、符号化するときに、オーディオの帯域を“sb(サブバンド)”として0〜31までの32個に分割できる。本実施の形態4ではこのうち音声音源のオーディオデータの符号化に“sb”を2〜8まで使用したとする。符号化手段1101は符号化した符号化データを出力し、さらに、音声音源のオーディオデータが符号化の際の複数のオーディオ帯域“sb”0〜31までのうちの“sb”2〜8のオーディオ帯域に盛り込まれたことを示す帯域データする。帯域データとして“sb”の2〜8を補助データ出力手段1102に出力する。 In the case of MPEG1-LayerII, when encoding, the audio band can be divided into 32 bands from 0 to 31 as “sb (subband)”. In the fourth embodiment, it is assumed that “sb” from 2 to 8 is used for encoding the audio data of the sound source. The encoding means 1101 outputs the encoded data, and further, audio of “sb” 2 to 8 among a plurality of audio bands “sb” 0 to 31 when the audio data of the sound source is encoded. Band data indicating that the data is included in the band. 2 to 8 of “sb” are output to the auxiliary data output means 1102 as band data.
本実施の形態4によるオーディオ符号化装置において、音声音源のオーディオデータの符号化の際に“sb”2と8の帯域を削減し、“sb”3と4の符号化データの振幅を大きくする、といった加工を行うことも可能である。これにより、音声音源のオーディオデータをより狭い帯域に盛り込むことができる。ここで符号化手段が指定されたオーディオ音源の帯域を削減するのに、オーディオ音源の帯域の両端を削減しているが、これに限られるものではなく、オーディオ音源の帯域の一端側のみで削減するようにしてもよい。また、このように符号化の際に指定されたオーディオ音源の帯域を削減する場合は、別の帯域で補正をすることもできる。 In the audio encoding device according to the fourth embodiment, the bands of “sb” 2 and 8 are reduced and the amplitude of the encoded data of “sb” 3 and 4 is increased when encoding audio data of a sound source. It is also possible to perform processing such as. Thereby, the audio data of the sound source can be included in a narrower band. Here, both ends of the audio source band are reduced in order to reduce the band of the audio source specified by the encoding means, but this is not limited to this, and it is reduced only at one end side of the audio source band. You may make it do. Further, when the band of the audio sound source designated at the time of encoding is reduced in this way, correction can be performed in another band.
補助データ出力手段1102は、図8のPCI_PCK情報を組上げるときに、RSV領域に順次入力した帯域データを保存する。補助データ出力手段1102は、PCI_PCKパックが完成した段階で補助データを出力する。実施の形態2と同様、補助データ出力手段1102から、RSV領域に埋め込む帯域データの情報を含む、PCI_PCKパックの作成に必要な情報の一部を出力し、符号化システムの別の手段により、所定のビデオ情報も含めてPCI_PCKパックを組上げる構成としてもよい。本実施の形態4では、帯域データをユーザに開放されている領域に埋め込むようにしているので、該領域のデータを有意のものとして扱わない従来の復号化装置で復号する場合にその復号動作に影響を及ぼさない。また元々各規格で準備されている領域を使用しているので、帯域データを含めるためにビット量が増加することもない。 The auxiliary data output unit 1102 stores the band data sequentially input to the RSV area when the PCI_PCK information of FIG. 8 is assembled. The auxiliary data output unit 1102 outputs auxiliary data when the PCI_PCK pack is completed. As in the second embodiment, the auxiliary data output unit 1102 outputs a part of information necessary for creating the PCI_PCK pack including information on the band data to be embedded in the RSV area, and is determined by another unit of the encoding system. The PCI_PCK pack may be assembled including the video information. In the fourth embodiment, since band data is embedded in an area open to the user, when decoding is performed by a conventional decoding apparatus that does not treat the data in the area as significant, the decoding operation is performed. Has no effect. Further, since the area originally prepared in each standard is used, the amount of bits does not increase to include band data.
以上の動作により、本実施の形態4によるオーディオ符号化装置1100は、オーディオデータの符号化データとともに、オーディオデータの帯域データを含む補助データを出力する。
Through the above operation,
次に本実施の形態4によるオーディオ復号化装置1200の動作について説明する。図12に示すように、帯域データ抽出手段1201は補助データから帯域データを抽出し、復号化手段1202に出力する。復号化手段1202は、オーディオ出力を制御しようとするオーディオ音源が何も指定されていない場合は、すべてのオーディオ帯域“sb”の符号化データをそのまま復号し、復号したオーディオを出力する。
Next, the operation of the
外部からオーディオ出力を制御しようとするオーディオ音源の指定があれば、音源指定手段1203がオーディオ出力を制御しようとするオーディオ音源を指定する音源指定信号を出力する。復号化手段1202は音源指定手段1203の出力に応じて、帯域データ抽出手段1201から受け取った帯域データが示す、音源指定信号に指定されるオーディオ音源が盛り込まれたオーディオ帯域“sb”の符号化データをその振幅を半分に制限して復号し、それ以外は通常に復号する。ここで、復号化手段1202は、帯域データが示す指定された音源が盛り込まれた帯域の振幅を半分にしているが、これに限らずゼロやその他の値にすることも可能である。このように音声音源のオーディオデータの出力を制御することにより、音声付のオーディオデータをカラオケとして出力することができる。
If an audio sound source to be controlled externally is designated, the sound
以上のように本実施の形態4によるオーディオ符号化装置1100では、複数のオーディオ音源のうちの1つ以上のオーディオ音源について該オーディオ音源のオーディオデータが符号化の際の複数のオーディオ帯域のうちのどのオーディオ帯域に盛り込まれたかを示す帯域データ、及び符号化に関する符号化関連データを、複数のオーディオ音源からのオーディオデータを符号化した符号化データとともに、出力する符号化手段1101と、符号化手段1101より出力される帯域データと符号化関連データとから、補助データを作成し出力する補助データ出力手段1102とを備えることにより、オーディオデータの帯域データの情報を含む補助データをオーディオデータの符号化データとともに出力することができ、帯域データの情報を用いたオーディオデータの加工を可能とできる。
As described above, in the
また、本実施の形態4によるオーディオ復号化装置1200では、オーディオ符号化装置より出力される補助データから帯域データを抽出する帯域データ抽出手段1201と、オーディオ出力を制御しようとするオーディオ音源を指定する音源指定手段1203と、帯域データ抽出手段1201により抽出した帯域データと、音源指定手段1203の出力とに基づき、音源指定手段1203により指定されるオーディオ音源のオーディオデータが盛り込まれた帯域の符号化データを、そのオーディオデータの振幅を制限して復号して出力する復号化手段1202とを備えることにより、補助データから抽出した帯域データの情報を用いてオーディオデータを加工し、復号したオーディオデータのオーディオ出力を制御することができる。
Also, in the
なお、上記実施の形態4では、補助データ出力手段が、カテゴリの情報を、DVD−VideoのVOBUのNV_PCKパック中のPCI_PCKパックのReserved領域に埋め込むようにしたものについて説明したが、オーディオフレームのヘッダ領域に含まれる2ビットの“private_bit”等、他の領域に埋め込むようにしてもよい。 In the fourth embodiment, the auxiliary data output unit has described that the category information is embedded in the Reserved area of the PCI_PCK pack in the NV_PCK pack of the DVD-Video VOBU. It may be embedded in another area such as 2-bit “private_bit” included in the area.
また、本実施の形態4では、オーディオデータの符号化、復号化をMPEG1−LayerIIの規則に従って行うものとしたが、オーディオデータの符号化、復号化の規則はこれに限られるものではない。 In the fourth embodiment, encoding and decoding of audio data are performed according to the MPEG1-Layer II rule, but the encoding and decoding rules of audio data are not limited to this.
また、上記実施の形態1によるオーディオ符号化装置、実施の形態2または実施の形態3によるオーディオ符号化装置、及び実施の形態4によるオーディオ符号化装置のいずれか2つ、または3つを組み合わせた構成とすることも可能であり、また、実施の形態1によるオーディオ復号化装置、実施の形態2によるオーディオ復号化装置、及び実施の形態4によるオーディオ復号化装置のいずれか2つ、または3つを組み合わせた構成とすることも可能である。 Also, any two or three of the audio encoding device according to the first embodiment, the audio encoding device according to the second or third embodiment, and the audio encoding device according to the fourth embodiment are combined. The audio decoding device according to the first embodiment, the audio decoding device according to the second embodiment, and the audio decoding device according to the fourth embodiment are also possible. It is also possible to adopt a configuration combining the above.
本発明は、オーディオ符号化装置において、符号化データとともに、オーディオデータの音量レベル、オーディオデータのフレーム毎のカテゴリ、又はオーディオ音源が盛り込まれた帯域を示すデータを含む補助データを出力し、オーディオ復号化装置において、補助データに含まれた情報を用いてオーディオデータそのものを加工し、復号後のオーディオデータを加工して出力できるようにしたものであり、利用価値の高いオーディオ符号化装置、及びオーディオ復号化装置を提供する上で有用である。 According to the present invention, an audio encoding apparatus outputs auxiliary data including data indicating a volume level of audio data, a category for each frame of audio data, or a band in which an audio sound source is included, together with encoded data. In the encoding apparatus, the audio data itself is processed using the information included in the auxiliary data, and the decoded audio data can be processed and output. This is useful in providing a decoding device.
101 符号化手段
102 音量レベル出力手段
103 補助データ出力手段
201 音量レベル抽出手段
202 復号化手段
203 音量調節手段
601 符号化手段
602 カテゴリ分類手段
603 補助データ出力手段
701 カテゴリ抽出手段
702 復号化手段
703 オーディオ出力手段
1001 カテゴリ抽出手段
1002 復号化手段
1003 オーディオ出力手段
1101 符号化手段
1102 補助データ出力手段
1201 帯域データ抽出手段
1202 復号化手段
101 Coding means 102 Volume level output means 103 Auxiliary data output means 201 Volume level extraction means 202 Decoding means 203 Volume adjustment means 601 Encoding means 602 Category classification means 603 Auxiliary data output means 701 Category extraction means 702 Decoding means 703 Audio Output means 1001 Category extraction means 1002 Decoding means 1003 Audio output means 1101 Encoding means 1102 Auxiliary data output means 1201 Band data extraction means 1202 Decoding means
Claims (13)
入力されるオーディオデータを符号化処理して前記符号化データを出力すると共に、前記オーディオデータの符号化に関する符号化関連データを出力する符号化手段と、
前記オーディオデータの予め決められた期間毎の音量レベルを求めて出力する音量レベル出力手段と、
前記音量レベル出力手段が出力する前記音量レベルと、前記符号化手段が出力する前記符号化関連データとから、前記音量レベルを含む補助データを作成する補助データ出力手段とを備えた、
ことを特徴とするオーディオ符号化装置。 In an audio encoding device that receives audio data and outputs encoded data obtained by encoding the audio data together with auxiliary data related to the audio data,
Encoding means for encoding input audio data and outputting the encoded data, and outputting encoding related data relating to encoding of the audio data;
Volume level output means for obtaining and outputting a volume level for each predetermined period of the audio data;
Auxiliary data output means for creating auxiliary data including the volume level from the volume level output by the volume level output means and the encoding related data output by the encoding means,
An audio encoding device.
前記予め決められた期間は、楽曲1曲分である、
ことを特徴とするオーディオ符号化装置。 The audio encoding device according to claim 1, wherein
The predetermined period is one song.
An audio encoding device.
前記音量レベル出力手段は、前記音量レベルを、前記予め決められた期間のオーディオデータの音量の最大値と、平均の音量とに基づいて求める、
ことを特徴とするオーディオ符号化装置。 The audio encoding device according to claim 1, wherein
The volume level output means obtains the volume level based on a maximum value of the volume of audio data in the predetermined period and an average volume.
An audio encoding device.
前記オーディオ符号化装置より出力される前記符号化データを復号してオーディオデータを出力する復号化手段と、
前記オーディオ符号化装置より出力される前記補助データから前記音量レベルを抽出する音量レベル抽出手段と、
前記符号化手段が出力する前記オーディオデータの音量を、前記音量レベル抽出手段により抽出した前記音量レベルに基づき、調整し、出力する音量調整手段とを備えた、
ことを特徴とするオーディオ復号化装置。 An audio decoding device for decoding and outputting encoded data output from the audio encoding device according to claim 1,
Decoding means for decoding the encoded data output from the audio encoding device and outputting audio data;
Volume level extraction means for extracting the volume level from the auxiliary data output from the audio encoding device;
Volume adjustment means for adjusting and outputting the volume of the audio data output by the encoding means based on the volume level extracted by the volume level extraction means,
An audio decoding device characterized by that.
入力されるオーディオデータを符号化の単位であるフレーム毎に符号化処理して前記符号化データを出力すると共に、前記オーディオデータの符号化に関する符号化関連データを出力する符号化手段と、
前記オーディオデータを前記フレーム毎に、複数のカテゴリのいずれかに分類し、該フレームがいずれのカテゴリに分類されたかを示すカテゴリ情報を出力するカテゴリ分類手段と、
前記カテゴリ分類手段が出力する前記カテゴリ情報と、前記符号化手段が出力する前記符号化関連データとから、前記カテゴリ情報を含む補助データを作成する補助データ出力手段とを備えた、
ことを特徴とするオーディオ符号化装置。 In an audio encoding device that receives audio data and outputs encoded data obtained by encoding the audio data together with auxiliary data related to the audio data,
Encoding means for encoding input audio data for each frame as a unit of encoding and outputting the encoded data, and outputting encoding related data relating to encoding of the audio data;
Category classification means for classifying the audio data into any one of a plurality of categories for each frame and outputting category information indicating in which category the frame is classified;
Auxiliary data output means for creating auxiliary data including the category information from the category information output by the category classification means and the encoding-related data output by the encoding means,
An audio encoding device.
前記補助データは、
カテゴリを示す値と、該カテゴリに分類されたフレームが連続する数との対の情報を含むものである、
ことを特徴とするオーディオ符号化装置。 The audio encoding device according to claim 5, wherein
The auxiliary data is
It includes information on a pair of a value indicating a category and the number of consecutive frames classified into the category.
An audio encoding device.
前記オーディオ符号化装置より出力される前記符号化データを復号してオーディオデータを出力する復号化手段と、
前記オーディオ符号化装置より出力される前記補助データから前記カテゴリ情報を抽出するカテゴリ抽出手段と、
前記複数のカテゴリのうちオーディオ出力を制御しようとするカテゴリを指定するカテゴリ指定手段と、
前記補助データより抽出した前記カテゴリ情報と、前記カテゴリ指定手段より出力される指定カテゴリとに基づき、前記復号化されたオーディオデータを、そのうちの前記指定カテゴリに属するフレームのオーディオ出力については出力制御を行ない、出力するオーディオ出力手段とを備えた、
ことを特徴とするオーディオ復号化装置。 An audio decoding device for decoding and outputting encoded data output from the audio encoding device according to claim 5,
Decoding means for decoding the encoded data output from the audio encoding device and outputting audio data;
Category extraction means for extracting the category information from the auxiliary data output from the audio encoding device;
Category designating means for designating a category for controlling audio output among the plurality of categories;
Based on the category information extracted from the auxiliary data and the specified category output from the category specifying means, the decoded audio data is output-controlled for audio output of frames belonging to the specified category. Audio output means for performing and outputting,
An audio decoding device characterized by that.
前記カテゴリ指定手段は、前記複数のカテゴリのうちオーディオ出力しないカテゴリを指定するものであり、
前記オーディオ出力手段は、前記復号化手段が出力するオーディオデータのうち、前記カテゴリ指定手段により指定されるカテゴリに属するフレームをオーディオ出力しないよう制御する、
ことを特徴とするオーディオ復号化装置。 The audio decoding device according to claim 7, wherein
The category designating unit designates a category that does not output audio among the plurality of categories,
The audio output means controls the audio data output by the decoding means not to output audio belonging to a category specified by the category specifying means;
An audio decoding device characterized by that.
前記オーディオ符号化装置より出力される前記補助データから前記カテゴリ情報を抽出するカテゴリ抽出手段と、
前記複数のカテゴリのうちオーディオ出力しないカテゴリを指定する出力禁止カテゴリ指定手段と、
前記補助データより抽出した前記カテゴリ情報と、前記出力禁止カテゴリ指定手段より出力される出力禁止カテゴリに基づき、前記オーディオ符号化装置より出力される前記符号化データのうち、前記出力禁止カテゴリに属するフレームの符号化データを除く符号化データを復号してオーディオデータを出力する復号化手段とを備えた、
ことを特徴とするオーディオ復号化装置。 An audio decoding device for decoding and outputting encoded data output from the audio encoding device according to claim 5,
Category extraction means for extracting the category information from the auxiliary data output from the audio encoding device;
Output prohibition category designation means for designating a category that does not output audio among the plurality of categories;
Based on the category information extracted from the auxiliary data and an output prohibition category output from the output prohibition category designating unit, frames belonging to the output prohibition category among the encoded data output from the audio encoding device Decoding means for decoding the encoded data excluding the encoded data and outputting audio data,
An audio decoding device characterized by that.
前記復号化手段の後段に設けられ、該復号化手段が復号したオーディオデータの出力を、前記出力禁止カテゴリ指定手段の出力に応じて、前記復号化手段が復号をしていない符号化データのままのデータが出力される期間が一定となるよう制御するオーディオ出力手段を、さらに備えた、
ことを特徴とするオーディオ復号化装置。 The audio decoding device according to claim 9, wherein
The output of audio data decoded by the decoding means is provided as the encoded data that is not decoded by the decoding means according to the output of the output prohibition category specifying means. Audio output means for controlling the period during which the data is output to be constant,
An audio decoding device characterized by that.
前記複数のオーディオ音源のうちの1つ以上のオーディオ音源について該オーディオ音源からのオーディオデータが符号化の際の複数のオーディオ帯域のうちのどのオーディオ帯域に盛り込まれたかを示す帯域データ、及び符号化に関する符号化関連データを、前記複数のオーディオ音源からのオーディオデータを符号化した符号化データとともに、出力する符号化手段と、
前記符号化手段が出力する前記帯域データと、前記符号化関連データとから、前記帯域データを含む補助データを作成する補助データ出力手段とを備えた、
ことを特徴とするオーディオ符号化装置。 In an audio encoding device that receives audio data from a plurality of audio sources and outputs encoded data obtained by encoding the audio data together with auxiliary data related to the audio data,
Band data indicating in which audio band of the plurality of audio bands the audio data from the audio sound source is included in one or more audio sound sources of the plurality of audio sound sources, and encoding Encoding means for outputting the encoding-related data with the encoded data obtained by encoding the audio data from the plurality of audio sound sources;
Auxiliary data output means for creating auxiliary data including the band data from the band data output by the encoding means and the encoding-related data,
An audio encoding device.
前記符号化手段が、所定のオーディオ音源のオーディオデータについて、前記符号化データ中の所定のオーディオ帯域に収まるように制限をかけた上で符号化して、前記符号化データを出力する、
ことを特徴とするオーディオ符号化装置。 The audio encoding device according to claim 11, wherein
The encoding means encodes audio data of a predetermined audio sound source after being limited so as to be within a predetermined audio band in the encoded data, and outputs the encoded data.
An audio encoding device.
前記オーディオ符号化装置より出力される前記補助データから前記帯域データを抽出する帯域データ抽出手段と、
前記1つ以上のオーディオ音源のうちオーディオ出力を制御しようとするオーディオ音源を指定する音源指定手段と、
前記補助データより抽出した前記帯域データと、前記音源指定手段より出力される指定音源とに基づき、前記指定音源のオーディオデータが盛り込まれた帯域の符号化データを、前記オーディオデータの振幅を制限して復号して出力する復号化手段とを備えた、
ことを特徴とするオーディオ復号化装置。 An audio decoding device for decoding and outputting encoded data output from the audio encoding device according to claim 11,
Band data extraction means for extracting the band data from the auxiliary data output from the audio encoding device;
Sound source designating means for designating an audio sound source to be controlled for audio output among the one or more audio sound sources;
Based on the band data extracted from the auxiliary data and the designated sound source output from the sound source designating means, the encoded data of the band including the audio data of the designated sound source is limited in amplitude of the audio data. Decoding means for decoding and outputting,
An audio decoding device characterized by that.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007030062A JP2008197199A (en) | 2007-02-09 | 2007-02-09 | Audio encoder and audio decoder |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007030062A JP2008197199A (en) | 2007-02-09 | 2007-02-09 | Audio encoder and audio decoder |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008197199A true JP2008197199A (en) | 2008-08-28 |
Family
ID=39756229
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007030062A Pending JP2008197199A (en) | 2007-02-09 | 2007-02-09 | Audio encoder and audio decoder |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008197199A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012020828A1 (en) * | 2010-08-13 | 2012-02-16 | 株式会社エヌ・ティ・ティ・ドコモ | Audio decoding device, audio decoding method, audio decoding program, audio encoding device, audio encoding method, and audio encoding program |
JP2012507059A (en) * | 2008-10-29 | 2012-03-22 | ドルビー インターナショナル アーベー | Protection of signal clipping using existing audio gain metadata |
JP2017536020A (en) * | 2014-10-10 | 2017-11-30 | ドルビー ラボラトリーズ ライセンシング コーポレイション | Presentation-based program loudness without regard to transmission |
JP2022050646A (en) * | 2010-12-03 | 2022-03-30 | ドルビー ラボラトリーズ ライセンシング コーポレイション | Adaptive processing with multiple media processing nodes |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0651790A (en) * | 1992-07-31 | 1994-02-25 | Sanyo Electric Co Ltd | Disk player for karaoke |
JP2000347697A (en) * | 1999-06-02 | 2000-12-15 | Nippon Columbia Co Ltd | Voice record regenerating device and record medium |
JP2001250333A (en) * | 2000-03-06 | 2001-09-14 | Sony Corp | Information signal reproducing device |
JP2002328685A (en) * | 2001-05-02 | 2002-11-15 | Sony Corp | Information processor and information processing method, recording medium, and program |
JP2003302988A (en) * | 2002-04-09 | 2003-10-24 | Sony Corp | Audio device |
JP2005024815A (en) * | 2003-07-01 | 2005-01-27 | Ryuichiro Yamazaki | System, device, method, and program for language learning, and recording medium for recording the program |
JP2005172450A (en) * | 2003-12-08 | 2005-06-30 | Pioneer Electronic Corp | Information processor and method of voice guidance for running information |
JP2008521028A (en) * | 2004-11-16 | 2008-06-19 | ソニー エリクソン モバイル コミュニケーションズ, エービー | How to normalize recording volume |
-
2007
- 2007-02-09 JP JP2007030062A patent/JP2008197199A/en active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0651790A (en) * | 1992-07-31 | 1994-02-25 | Sanyo Electric Co Ltd | Disk player for karaoke |
JP2000347697A (en) * | 1999-06-02 | 2000-12-15 | Nippon Columbia Co Ltd | Voice record regenerating device and record medium |
JP2001250333A (en) * | 2000-03-06 | 2001-09-14 | Sony Corp | Information signal reproducing device |
JP2002328685A (en) * | 2001-05-02 | 2002-11-15 | Sony Corp | Information processor and information processing method, recording medium, and program |
JP2003302988A (en) * | 2002-04-09 | 2003-10-24 | Sony Corp | Audio device |
JP2005024815A (en) * | 2003-07-01 | 2005-01-27 | Ryuichiro Yamazaki | System, device, method, and program for language learning, and recording medium for recording the program |
JP2005172450A (en) * | 2003-12-08 | 2005-06-30 | Pioneer Electronic Corp | Information processor and method of voice guidance for running information |
JP2008521028A (en) * | 2004-11-16 | 2008-06-19 | ソニー エリクソン モバイル コミュニケーションズ, エービー | How to normalize recording volume |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012507059A (en) * | 2008-10-29 | 2012-03-22 | ドルビー インターナショナル アーベー | Protection of signal clipping using existing audio gain metadata |
WO2012020828A1 (en) * | 2010-08-13 | 2012-02-16 | 株式会社エヌ・ティ・ティ・ドコモ | Audio decoding device, audio decoding method, audio decoding program, audio encoding device, audio encoding method, and audio encoding program |
JP2012042534A (en) * | 2010-08-13 | 2012-03-01 | Ntt Docomo Inc | Audio decoding device, audio decoding method, audio decoding program, audio encoding device, audio encoding method and audio encoding program |
CN103098125A (en) * | 2010-08-13 | 2013-05-08 | 株式会社Ntt都科摩 | Audio decoding device, audio decoding method, audio decoding program, audio encoding device, audio encoding method, and audio encoding program |
TWI476762B (en) * | 2010-08-13 | 2015-03-11 | Ntt Docomo Inc | Audio decoding device, audio decoding method, audio decoding program, audio coding device, audio coding method, and audio coding program |
CN104835501A (en) * | 2010-08-13 | 2015-08-12 | 株式会社Ntt都科摩 | Audio decoding device, audio decoding method, audio encoding device, and audio encoding method |
US9280974B2 (en) | 2010-08-13 | 2016-03-08 | Ntt Docomo, Inc. | Audio decoding device, audio decoding method, audio decoding program, audio encoding device, audio encoding method, and audio encoding program |
JP2022050646A (en) * | 2010-12-03 | 2022-03-30 | ドルビー ラボラトリーズ ライセンシング コーポレイション | Adaptive processing with multiple media processing nodes |
JP7346617B2 (en) | 2010-12-03 | 2023-09-19 | ドルビー ラボラトリーズ ライセンシング コーポレイション | Adaptive processing with multiple media processing nodes |
JP2017536020A (en) * | 2014-10-10 | 2017-11-30 | ドルビー ラボラトリーズ ライセンシング コーポレイション | Presentation-based program loudness without regard to transmission |
US11062721B2 (en) | 2014-10-10 | 2021-07-13 | Dolby Laboratories Licensing Corporation | Transmission-agnostic presentation-based program loudness |
US12080308B2 (en) | 2014-10-10 | 2024-09-03 | Dolby Laboratories Licensing Corporation | Transmission-agnostic presentation-based program loudness |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009116362A (en) | Apparatus and method for processing digital data reproduced from recording medium | |
US7507894B2 (en) | Sound data encoding apparatus and sound data decoding apparatus | |
US7479594B2 (en) | Sound data encoding apparatus and sound decoding apparatus | |
JP5377974B2 (en) | Signal processing device | |
JP2008197199A (en) | Audio encoder and audio decoder | |
US20080147218A1 (en) | Recording/reproduction apparatus | |
US8010374B2 (en) | Audio coding apparatus and audio decoding apparatus | |
JP4990375B2 (en) | Recording / playback device | |
JP4649901B2 (en) | Method and apparatus for coded transmission of songs | |
US20070192089A1 (en) | Apparatus and method for reproducing audio data | |
JP3747806B2 (en) | Data processing apparatus and data processing method | |
JP2005149608A (en) | Audio data recording/reproducing system and audio data recording medium therefor | |
KR20080113844A (en) | Apparatus and method for voice file playing in electronic device | |
US20050053362A1 (en) | Method of adaptively inserting karaoke information into audio signal and apparatus adopting the same, method of reproducing karaoke information from audio data and apparatus adopting the same, method of reproducing karaoke information from the audio data and apparatus adopting the same, and recording medium on which programs realizing the methods are recorded | |
JP2010123225A (en) | Record reproducing apparatus and record reproducing method | |
JP4787131B2 (en) | Audio playback apparatus, audio playback method and program, audio recording apparatus, and audio recording method | |
TW200414136A (en) | Processing circuit capable of modifying digital audio signals | |
KR20080031109A (en) | Apparatus and method for processing signal and program | |
US20050259964A1 (en) | Information reproduction apparatus, information reproduction method, information reproduction program, and information recording medium having the program recorded thereon | |
JP2006522949A (en) | Updating embedded data channels | |
WO2006087974A1 (en) | Reproduction device and reproduction method | |
JP2005241796A (en) | Embedding method of electronic watermark, and reproducing device of acoustic signal | |
JP2005121743A (en) | Audio data encoding method, audio data decoding method, audio data encoding system and audio data decoding system | |
JP2005043761A (en) | Information amount conversion device and information amount conversion system | |
JP2006127704A (en) | Data input/output device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100201 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110613 |
|
RD05 | Notification of revocation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7425 Effective date: 20110613 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110729 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110809 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111213 |