JP4254960B2 - Audio data encoding apparatus and audio data reproducing apparatus - Google Patents
Audio data encoding apparatus and audio data reproducing apparatus Download PDFInfo
- Publication number
- JP4254960B2 JP4254960B2 JP2004351162A JP2004351162A JP4254960B2 JP 4254960 B2 JP4254960 B2 JP 4254960B2 JP 2004351162 A JP2004351162 A JP 2004351162A JP 2004351162 A JP2004351162 A JP 2004351162A JP 4254960 B2 JP4254960 B2 JP 4254960B2
- Authority
- JP
- Japan
- Prior art keywords
- audio data
- loop
- block
- encoding
- blocks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
本発明は、音声データの記録および再生に係り、特に、ループ部分を含む音声データの再生時の処理負荷を軽減する記録および再生技術に関する。 The present invention relates to recording and reproduction of audio data, and more particularly to a recording and reproduction technique for reducing processing load during reproduction of audio data including a loop portion.
パーソナルコンピュータ、ゲーム機、音楽再生装置等のデジタル音声データ再生機能を備えた情報処理装置では、符号化された音声データを再生時にアナログ音声データに変換して音声出力することが行なわれている。 In an information processing apparatus having a digital voice data playback function such as a personal computer, a game machine, a music playback device, etc., encoded voice data is converted into analog voice data during playback and output as voice.
符号化された音声データは、音楽用CDのように非圧縮のものもあるが、多くは、圧縮された状態で読み出され、再生時に伸長され音声出力される。 The encoded audio data may be uncompressed like a music CD, but most of the encoded audio data is read in a compressed state, decompressed during reproduction, and output as audio.
音声圧縮方式としては、種々の方式が提案され実用化されているが、時系列に並んだサンプルデータを複数のブロックに分割し、直交変換、例えば、DCT(Discrete Consine Transform)、MDCT(Modified Discrete Consine Transform)等を施して圧縮を行なう方式が広く知られている。このとき、音声波形の連続性を高めるため、隣り合う複数のブロックを組にして、ブロックをオーバーラップさせながら順次圧縮することが行なわれている。このような圧縮方式の代表的なものとして、いわゆるミニディスク(MD)等で採用されているATRAC(Adaptive TRans form Acoustic Coding)が挙げられる(特許文献1参照)。 Various methods have been proposed and put to practical use as audio compression methods, but sample data arranged in time series is divided into a plurality of blocks, and orthogonal transformation, for example, DCT (Discrete Consine Transform), MDCT (Modified Discrete) is performed. A method of performing compression by applying (Consine Transform) is widely known. At this time, in order to increase the continuity of the speech waveform, a plurality of adjacent blocks are grouped and sequentially compressed while overlapping the blocks. A typical example of such a compression method is ATRAC (Adaptive TRans form Acoustic Coding) employed in a so-called minidisc (MD) (see Patent Document 1).
図7(a)は、ブロック単位で音声データの圧縮を行なう様子を示す図である。本図では、時系列に並んだサンプルデータが所定個数毎に区切られてブロック(オリジナルブロック)「A0」「A」「B」「C」「D」「D0」…が生成されている。 FIG. 7A is a diagram illustrating a state in which audio data is compressed in units of blocks. In this figure, sample data arranged in time series is divided every predetermined number to generate blocks (original blocks) “A0” “A” “B” “C” “D” “D0”.
そして、連続する2つのブロックを組として、ブロックをオーバーラップさせながら圧縮処理を行ない、エンコードブロックが生成される。ここでは、オリジナルブロック「A0」「A」からエンコードブロック「X1」が生成され、オリジナルブロック「A」「B」からエンコードブロック「X2」が生成されている。 Then, an encoding block is generated by performing compression processing with two consecutive blocks as a set and overlapping the blocks. Here, an encoding block “X1” is generated from the original blocks “A0” and “A”, and an encoding block “X2” is generated from the original blocks “A” and “B”.
音声データの再生時には、エンコードブロック「X1」「X2」からデコードブロック「a」が生成される。このデコードブロック「a」はオリジナルブロックの「A」に対応するため、デコードブロック「a」のサンプルをD/A変換して音声を再生することができる。以下同様にして、デコードブロック「b」「c」…を得ることができるため、音声が連続的に再生される。
ところで、音声データをループ再生させたい場合がある。例えば、図7(b)に示すように、サンプルデータの所定の位置(LS)から所定の位置(LE)までの音声を、ある条件が満たされるまで繰り返し再生するような場合である。ここでは、ループのスタート位置であるLSがオリジナルブロック「A」に含まれ、ループのエンド位置であるLEがオリジナルブロック「D」に含まれているものとする。 By the way, there is a case where audio data is desired to be reproduced in a loop. For example, as shown in FIG. 7B, the sound from the predetermined position (LS) to the predetermined position (LE) of the sample data is repeatedly reproduced until a certain condition is satisfied. Here, it is assumed that LS that is the start position of the loop is included in the original block “A”, and LE that is the end position of the loop is included in the original block “D”.
この場合、再生時には、図7(c)に示すように、デコードブロック「d」のLEに対応する位置まで再生を行なうと、続けて、デコードブロック「a」のLSに対応する位置から再生を行なうことになる。 In this case, as shown in FIG. 7C, when reproduction is performed up to the position corresponding to LE of the decoded block “d”, reproduction is continued from the position corresponding to LS of the decoded block “a”. Will do.
デコードブロック「d」は、エンコードブロック「X4」「X5」とから生成されるが、エンコードブロック「X4」は、デコードブロック「c」の生成の際にすでに読み込んでいるため、「X5」を読み込んで処理を行なえば足りる。一方、デコードブロック「a」は、エンコードブロック「X1」「X2」から生成されるが、ループで戻ってきた際には、両方のエンコードブロックを読み込んで処理を行なわなくてはならない。このため、一時的にデコード処理の負荷が増大する。 The decode block “d” is generated from the encode blocks “X4” and “X5”, but since the encode block “X4” has already been read when the decode block “c” is generated, “X5” is read. It's enough if you do the process. On the other hand, the decode block “a” is generated from the encode blocks “X1” and “X2”, but when returning in a loop, both the encode blocks must be read and processed. For this reason, the load of the decoding process temporarily increases.
さらに、ループの際には、デコードブロック「d」に引き続いて再生されるデコードブロック「a」は、デコードブロック「d」の再生が終わるまでに生成されていなければならない。ところが、デコードブロック「d」は、ブロック全体が再生されずに、LEの位置までしか再生されない。このため、より短時間でデコードブロック「a」を生成しなければならず、上述の処理負荷が一層大きくなっていた。 Further, in the loop, the decoded block “a” reproduced subsequent to the decoded block “d” must be generated before the reproduction of the decoded block “d” is completed. However, the decoded block “d” is reproduced only up to the position of LE without reproducing the entire block. For this reason, the decode block “a” must be generated in a shorter time, and the processing load described above is further increased.
このループの際の処理負荷の増大は、携帯型ゲーム機、ポータブル音楽再生装置のように携帯性が重視され、処理速度に制約のある音声データ再生装置において特に問題となっている。 The increase in processing load at the time of the loop is a problem particularly in an audio data reproducing apparatus in which portability is important and a processing speed is restricted like a portable game machine and a portable music reproducing apparatus.
本発明は、ループ部分を含む音声データの再生時における処理負荷を軽減させることを目的とする。 An object of the present invention is to reduce the processing load at the time of reproducing audio data including a loop portion.
上記課題を解決するため、本発明の第1の態様によれば、
ループスタート位置とループエンド位置とが指定されたループ部分を含む音声データをエンコードする音声データエンコード装置であって、
音声データをブロックに分割するブロック分割手段と、
連続する複数のブロックを組としてエンコードを行なうエンコード手段とを備え、
前記エンコード手段は、さらに、
ループエンド位置を含むブロックとループスタート位置を含むブロックとを組としてエンコードを行なうことを特徴とする音声データエンコード装置が提供される。
In order to solve the above problems, according to the first aspect of the present invention,
An audio data encoding device that encodes audio data including a loop portion in which a loop start position and a loop end position are specified,
A block dividing means for dividing the audio data into blocks;
Encoding means for encoding a set of a plurality of consecutive blocks as a set,
The encoding means further comprises:
There is provided an audio data encoding apparatus characterized in that encoding is performed by combining a block including a loop end position and a block including a loop start position.
また、上記課題を解決するため、本発明の第2の態様によれば、
ループスタート位置とループエンド位置とが指定されたループ部分を含む音声データを再生する音声データ再生装置であって、
ブロック単位のエンコード音声データを順次読み込み、連続する複数のブロックを組としてデコードして音声データを生成するデコード手段と、
ループの有無を判定する判定手段とを備え、
前記デコード手段は、
生成する音声データにループエンド位置が含まれる場合であって、前記判定手段がループ有と判定した場合には、次に読み込むべきブロックに代え、ループエンド位置を含むブロックとループスタート位置を含むブロックとを組としてエンコードされたブロックを読み込んでデコードを行なうことを特徴とする音声データ再生装置が提供される。
Moreover, in order to solve the said subject, according to the 2nd aspect of this invention,
An audio data reproducing device for reproducing audio data including a loop portion in which a loop start position and a loop end position are designated,
Decoding means for sequentially reading encoded audio data in units of blocks and decoding a plurality of consecutive blocks as a set to generate audio data;
Determination means for determining the presence or absence of a loop,
The decoding means includes
If the audio data to be generated includes a loop end position and the determination means determines that there is a loop, the block including the loop end position and the block including the loop start position are used instead of the block to be read next. An audio data reproducing apparatus is provided that reads and decodes a block encoded as a set.
ここで、前記デコード手段は、
生成する音声データにループエンド位置が含まれる場合であって、前記判定手段がループ有と判定した場合には、さらに、ループスタート位置を含む音声データの次のブロックを生成するために用いるエンコードブロックを読み込んでデコードを行なうことができる。
Here, the decoding means includes
If the audio data to be generated includes a loop end position, and the determination means determines that there is a loop, the encoding block used for generating the next block of the audio data including the loop start position Can be read and decoded.
本発明の実施の形態について図面を参照して説明する。図1は、本発明の実施形態の構成の概要を示す図である。本図に示すように、本実施形態では、音声データエンコード装置100がエンコードした音声データを、音声データ再生装置200がデコードして再生する処理を行なう。
Embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a diagram showing an outline of the configuration of an embodiment of the present invention. As shown in the figure, in this embodiment, the audio
具体的には、音声データエンコード装置100は、記録対象の音声データ11を読み込み、エンコード処理部110を用いて圧縮等の処理を施して、エンコードデータ20に変換する。ここで、音声データ11は、あらかじめ所定のレートでサンプリングされているものとする。もちろん、アナログ音声データとして音声データエンコード装置100に入力し、音声データエンコード装置100においてA/D変換するようにしてもよい。
Specifically, the audio
本実施形態において、音声データ11は、ループ部分を含んでおり、あらかじめループスタート位置とループエンド位置が指定されている。ループスタート位置とループエンド位置とは、例えば、音声データ11におけるアドレスあるいはサンプル番号等で示されており、ループ情報12として音声データ11とともに読み込まれる。なお、ループ情報12は、音声データ11のヘッダ部分等に付加するようにしてもよいし、音声データ11とは別個に存在するようにしてもよい。
In the present embodiment, the
ループ部分は、音声データ再生装置200での音声データ11の再生時において、あらかじめ定められた条件にしたがってループの有無が判断される。
When the audio
ループ有無の判断の結果、ループを行なうと判断された場合には、ループ情報12にしたがってループを行なう。すなわち、ループエンド位置まで再生するとループスタート位置まで戻って再生を続ける。一方、ループを行なわないと判断された場合には、ループ情報12に関わらず、ループは行なわない。すなわち、ループエンド位置まで再生すると、それ以降の音声データ11の再生を続ける。
If it is determined as a result of the loop presence / absence that a loop is to be performed, the loop is performed according to the
1つの音声データ11についてループ部分は複数含まれていてもよい。この場合、それぞれのループ部分についてループスタート位置とループエンド位置とがループ情報として指定される。複数のループ部分は、それぞれ異なる条件でループの有無が判断されるようにすることができる。
A plurality of loop portions may be included for one
音声データ11のどの範囲についてループ部分とするかは、音声データ11の内容に基づいて、開発者が任意に定めることができる。
The developer can arbitrarily determine which range of the
音声データエンコード装置100のエンコード処理部110は、音声データ11を複数のブロックに分割して、連続する所定数のブロックを一単位として、直交変換(例えば、MDCT)を用いたエンコードを行ない、ブロックをオーバラップさせ、順次エンコードデータを生成する。なお、エンコード処理部110の具体的な処理については、後述する。
The
エンコードデータ20は、音声データ11のループ処理を制御する制御用プログラム30とともにCD−ROM等の記録媒体300に記録される。記録媒体300への記録処理は、音声データエンコード装置100で行なうようにしてもよいし、他の装置で行なうようにしてもよい。
The encoded
なお、エンコードデータ20と制御用プログラム30とは、別々の記録媒体300に記録するようにしてもよい。また、記録媒体300は、CD−ROMに限られず、DVD−ROM等の光ディスク、磁気ディスク、半導体記録装置等であってもよい。あるいは、インターネット等の通信回線を介して音声データエンコード装置100から音声データ再生装置200にエンコードデータ20を出力するようにしてもよい。
Note that the encoded
制御用プログラム30は、音声データ再生装置200で実行されるプログラムである。音声データ再生装置200は、制御用プログラム30に基づいて、例えば、ユーザからの操作に応じて、エンコードデータ20をデコードして再生される音声データ(以下「音声データ11a」)のループの有無を決定する。具体的な例としては、ユーザからキー入力等の所定の操作を受け付けるまで、音声データ11aのループ部分を繰り返し再生し、所定の操作を受け付けると、ループ再生を終了し、ループ部分以降の音声データ11aを再生することが挙げられる。
The
音声データ再生装置200は、制御用プログラム30等を実行するプログラム実行部210とエンコードデータ20のデコードを行なうデコード処理部220とを備えている。また、音声データ再生装置200は、デコードされた音声データ11aを再生し、音声出力する機能を備えている。これにより、音声データ再生装置200は、エンコードデータ20をほぼリアルタイムでデコードし、再生することができる。デコード処理部220の具体的な処理については後述する。
The audio
なお、音声データエンコード装置100は、音声処理機能を備えたパーソナルコンピュータ、ワークステーション、その他の一般的な情報処理装置を用いて構成することができる。もちろん、音声データ記録に特化した専用のシステムを用いて構成するようにしてもよい。
Note that the audio
音声データ再生装置200も、音声処理機能を備えたパーソナルコンピュータ、ワークステーション、その他の一般的な情報処理装置を用いて構成することができる。もちろん、音声データ再生に特化した専用のシステムを用いて構成するようにしてもよい。
The audio
なお、本発明は、音声データ再生装置200として、PDA(Personal Digital Assistant)、携帯型ゲーム機、ポータブル音楽再生装置のように携帯性が重視され、処理速度に制約のある情報処理装置を用いた場合に特に効果的に適用することができる。
Note that the present invention uses an information processing apparatus that places importance on portability and restricts processing speed, such as a PDA (Personal Digital Assistant), a portable game machine, and a portable music playback apparatus, as the audio
情報処理装置は、音声データ記録用あるいは音声データ再生用に開発されたアプリケーションプログラムを中央処理装置(CPU)が実行することにより、音声データエンコード装置100あるいは音声データ再生装置200として機能することができる。これらのアプリケーションプログラムは、CD−ROM等の記録媒体に記録させることで市場に流通させることができる。また、インターネット等のコンピュータネットワークを介して流通させることもできる。
The information processing apparatus can function as the audio
つぎに、音声データエンコード装置100における音声データのエンコード処理について図2のフロー図を参照して説明する。
Next, audio data encoding processing in the audio
まず、音声データエンコード装置100は、音声データ11とループ情報12とを読み込む(S101)。ここで、音声データ11は、図3(a)に示すように、サンプルデータが時系列に並んだものであり、ループ情報12によりループスタート(LS)位置と、ループエンド(LE)位置とが指定されている。
First, the audio
つぎに、エンコード処理部110は、音声データ11をブロックに分割する(S102)。ブロック分割は、例えば、音声データ11の先頭から所定のサンプル毎に区切ることで行なわれる。ここでは、各ブロックのサンプル数は一定とするが、所定の規則にしたがって可変とするようにしてもよい。図3(b)は、音声データ11をブロック(オリジナルブロック)に分割した様子を示している。すなわち、音声データ11が、オリジナルブロック「A0」「A」「B」「C」「D」「D0」…に分割されている。
Next, the
一般に、ループ部分とブロック分割位置とは無関係に定められる。ループスタート位置とループエンド位置とは、それらの音声データにおける相対位置と各ブロックに含まれるサンプル数とに応じて、それぞれ、いずれかのオリジナルブロックに含まれることになる。 In general, the loop portion and the block division position are determined independently. The loop start position and the loop end position are included in any one of the original blocks according to the relative position in the audio data and the number of samples included in each block.
ここでは、ループスタート位置がオリジナルブロック「A」に含まれ、ループエンド位置がオリジナルブロック「D」に含まれているものとする。なお、ループスタート位置およびループエンド位置がそれぞれどのオリジナルブロックに含まれるかは、各ブロックに含まれるサンプル数から容易に求めることができる。 Here, it is assumed that the loop start position is included in the original block “A” and the loop end position is included in the original block “D”. It should be noted that which original block each includes the loop start position and the loop end position can be easily obtained from the number of samples included in each block.
エンコード処理部110は連続するオリジナルブロックを単位として音声圧縮(エンコード)を行なう(S103)。ここでは、ループ情報の有無にかかわらず、時系列に並ぶオリジナルブロックそれぞれについてエンコード処理を行なう。
The
エンコード処理では、連続する2つのオリジナルブロックから1つのエンコードブロックを生成するものとする。ただし、それぞれのオリジナルブロックはオーバーラップされ、前後のエンコードブロック生成に用いられる。 In the encoding process, one encoded block is generated from two consecutive original blocks. However, each original block is overlapped and used to generate preceding and subsequent encoded blocks.
すなわち、図3(c)に示すように、連続するオリジナルブロック「A0」「A」とからエンコードブロック「X1」を生成し、オリジナルブロック「A」「B」とからエンコードブロック「X2」を生成する。以下同様にして、エンコードブロック「X3」「X4」「X5」…を生成する。 That is, as shown in FIG. 3C, the encoding block “X1” is generated from the continuous original blocks “A0” and “A”, and the encoding block “X2” is generated from the original blocks “A” and “B”. To do. Similarly, encode blocks “X3”, “X4”, “X5”,... Are generated.
このような圧縮方式としては、ATRAC(Adaptive TRans form Acoustic Coding)が代表的であるが、本発明は、これに限られない。また、連続する3以上のオリジナルブロックから1つのエンコードブロックを生成するようにしてもよいし、デコード時に3以上のエンコードブロックから1つのデコードブロックを生成するようにしてもよい。 As such a compression method, ATRAC (Adaptive TRans form Acoustic Coding) is typical, but the present invention is not limited to this. In addition, one encode block may be generated from three or more consecutive original blocks, or one decode block may be generated from three or more encode blocks during decoding.
つぎに、エンコード処理部110は、ループ用のエンコードブロックを生成する(S104)。ここで、ループ用のエンコードブロックは、ループエンド位置が含まれるオリジナルブロックとループスタート位置が含まれるオリジナルブロックとから生成するようにする。このとき、ループ時には、ループエンド位置からループスタート位置への順で再生すべきであるから、ループエンド位置が含まれるブロックを前にし、ループスタート位置が含まれるブロックを後ろにしてエンコードを行なう。
Next, the
図4は、ループ用のエンコードブロックを生成する様子を示す図である。本例では、ループエンド位置はオリジナルブロック「D」に含まれ、ループスタート位置はオリジナルブロック「A」に含まれているため、ループ用エンコードブロック「X」は、オリジナルブロック「D」と「A」とから生成される。このため、ループ用ブロックとしてオリジナルブロック「D」「A」が並んでいる。なお、ループの際にはブロック「D」のD1に対応する部分を再生すると、ブロック「A」のA1に対応する部分が再生されることになる。 FIG. 4 is a diagram illustrating a state in which an encoding block for a loop is generated. In this example, since the loop end position is included in the original block “D” and the loop start position is included in the original block “A”, the loop encoding block “X” includes the original blocks “D” and “A”. Is generated. Therefore, the original blocks “D” and “A” are arranged as loop blocks. In the loop, when the portion corresponding to D1 of the block “D” is reproduced, the portion corresponding to A1 of the block “A” is reproduced.
ここで、ループ時にはカットされるD1部分とA1部分以外のデータについては、もとのオリジナルブロック「D」および「A」のデータをそのまま用いることができる。このようにすることで、音声波形の連続性を高めることができる。もちろん、無音等のダミーデータを用いるようにしてもよい。 Here, the original blocks “D” and “A” can be used as they are for the data other than the portions D1 and A1 that are cut during the loop. By doing in this way, the continuity of a speech waveform can be improved. Of course, dummy data such as silence may be used.
音声データエンコード装置100は、時系列に並んだエンコードブロックとループ用のエンコードブロックとをエンコードデータ20として出力する(S105)。このとき、ループ情報もあわせて出力する。ループ情報は、エンコードデータ20とは別のファイルとして出力するようにしてもよいし、エンコードデータ20のヘッダ部分に付加して出力するようにしてもよい。いずれにしても、エンコードデータ20とループ情報とは関連性を保って扱われる。また、エンコードデータ20には、必要に応じて、エンコード時のエンコードディレイ(遅延情報)も含めるようにする。
The audio
上述のように、音声データエンコード装置100が出力したエンコードデータ20は、制御用プログラム30とともに記録媒体300に記録され、市場に流通される。
As described above, the encoded
つぎに、音声データ再生装置200における再生処理について図5のフロー図を参照して説明する。
Next, playback processing in the audio
ユーザの操作等に基づいて記録媒体300に記録された音声データの再生を開始すると(S201)、音声データ再生装置200は、エンコードデータ20の先頭のエンコードブロックおよびループ情報を読み込む(S202)。
When reproduction of audio data recorded on the
まず、ループを行なわない場合の再生について説明する。ループを行なわない場合とは、再生対象のブロック(デコード後のブロック:デコードブロック)にループエンド位置が含まれていない場合(S203:N)、あるいは、ループエンド位置が含まれていても(S203:Y)、ループを行なわない状態の場合(S208:N)である。なお、ループを行なうかどうかは、上述のように、制御用プログラム30にしたがって、プログラム実行部210が判断する。また、デコード後のブロックにループエンド位置が含まれているかどうかは、再生済のブロック数とブロックに含まれるサンプル数とループ情報とから判断することができる。
First, reproduction when no loop is performed will be described. The case where the loop is not performed means that the block to be reproduced (block after decoding: decoded block) does not include the loop end position (S203: N), or even if the loop end position is included (S203). : Y), the case where no loop is performed (S208: N). Whether or not to perform the loop is determined by the
ループを行なわない場合には、従来どおり、つぎのエンコードブロックを読み込み(S205)、連続するエンコードブロックを用いてデコードを行ない、デコードブロックを生成する(S205)。 When the loop is not performed, the next encoding block is read as usual (S205), and the decoding is performed using the continuous encoding block to generate the decoding block (S205).
すなわち、図3(d)に示すように、エンコードブロック「X1」「X2」からデコードブロック「a」を生成し、エンコードブロック「X2」「X3」からデコードブロック「b」を生成していく。なお、デコードブロック「a」「b」…は、オリジナルブロック「A」「B」…に対応する音声データである。 That is, as shown in FIG. 3D, a decode block “a” is generated from the encode blocks “X1” and “X2”, and a decode block “b” is generated from the encode blocks “X2” and “X3”. The decoded blocks “a”, “b”,... Are audio data corresponding to the original blocks “A”, “B”,.
そして、デコードブロックを順次D/A変換し、音声出力することで音声データが再生される(S206)。以上の処理は、エンコードブロックが終了するまで続けられる(S207、S215)。 Audio data is reproduced by sequentially D / A converting the decoded blocks and outputting the audio (S206). The above processing is continued until the encoding block is completed (S207, S215).
つぎに、ループを行なう場合の再生について説明する。ループを行なう場合とは、再生対象のデコードブロックにループエンド位置が含まれており(S203:Y)、かつ、ループを行なう状態の場合(S208:Y)である。 Next, reproduction when looping will be described. The case where the loop is performed is a case where the loop end position is included in the decoding block to be reproduced (S203: Y) and the state where the loop is performed (S208: Y).
この場合、音声データ再生装置200は、つぎのエンコードブロックではなく、ループ用のエンコードブロックを読み込む(S209)。そして、読み込み済みのエンコードブロックと新たに読み込んだループ用のエンコードブロックとからデコードブロックを生成する(S211)。
In this case, the audio
この処理について、さらに、図6を参照して説明する。本例では、再生対象がデコードブロック「d」の場合にループが発生する。デコードブロック「c」の処理の際に、すでにエンコードブロック「X4」を読み込んでいるため、ループがない場合には、エンコードブロック「X5」を読み込むことになるが、ループを行なう場合には「X5」ではなく、ループ用のエンコードブロック「X」を読み込む。 This process will be further described with reference to FIG. In this example, a loop occurs when the reproduction target is the decode block “d”. Since the encode block “X4” has already been read when the decode block “c” is processed, the encode block “X5” is read when there is no loop, but when the loop is performed, “X5” is read. ”Instead of the loop encoding block“ X ”.
そして、図6(a)に示すように、「X4」と「X」とからデコードブロック「d」を生成する。デコードブロック「d」のうち、再生すべきはd1の部分であるので、音声データ再生装置200は、d1の部分を再生し、それ以降はカットする(S211)。
Then, as shown in FIG. 6A, a decode block “d” is generated from “X4” and “X”. Of the decoded block “d”, the portion to be reproduced is the portion of d1, so the audio
音声データ再生装置200は、ループスタート位置を含むデコードブロック「a」を得るためにエンコードブロックを読み込む。本来、デコードデータ「a」を生成するためにはエンコードブロック「X1」「X2」を読み込まなければならないが(図3(d)参照)、ここでは、エンコードブロック「X」をすでに読み込んでいるため、エンコードブロック「X2」を読み込んで処理すれば足りる(S212)。
The audio
そして、図6(b)に示すように、「X」と「X2」とからデコードブロック「a」を生成する(S213)。デコードブロック「a」のうち、再生すべきはa1の部分であるので、音声データ再生装置200は、a1の部分のみを再生する(S214)。これは、ループ情報を参照することで容易に判断することができる。
Then, as shown in FIG. 6B, a decode block “a” is generated from “X” and “X2” (S213). In the decoded block “a”, the portion to be reproduced is the portion a1, and therefore the audio
このように、本発明によれば、ループ用のエンコードブロックを用意しているため、ループの際の処理負荷を軽減することができる。 As described above, according to the present invention, since the encoding block for the loop is prepared, the processing load at the time of the loop can be reduced.
図6(b)は、この様子を示している。すなわち、デコードブロック「d」から「a」へループで戻る際に、オリジナルブロック「D」「A」を用いて生成したループ用のエンコードブロック「X」を用いているため、図7(c)のようにエンコードブロック「X1」「X2」の両方を読み込む必要はない。なぜならば、図6(b)において「X」は、「d」の処理の際にすでに読み込んでいるため、「X2」のみを読み込んで処理すれば足りるからである。 FIG. 6B shows this state. That is, when the loop is returned from the decoding block “d” to “a”, the encoding block “X” for the loop generated using the original blocks “D” and “A” is used. Thus, it is not necessary to read both the encoding blocks “X1” and “X2”. This is because “X” in FIG. 6B has already been read in the process of “d”, and therefore it is sufficient to read and process only “X2”.
ここで、連続する3つのオリジナルブロックを用いて1ブロックのエンコードデータを生成するエンコード方式を用いた場合について簡単に説明する。図4で示した例のようにオリジナルブロック「D」から「A」に戻るとすると、「CDA」「DAB」の組で2つのループ用エンコードブロックを生成するようにする。そして、再生の際には、ループ部分にこれらのエンコードブロックを用いてエンコード処理を行なえばよい。
なお、エンコード時、デコード時に遅延が発生する圧縮方式があるが、このような圧縮方式を用いている場合には、デコード時の出力サンプルが遅延を持って出力される。このときは、カットする位置を遅延サンプル分後ろにずらすことで、所望の再生が可能となる。
Here, a brief description will be given of a case where an encoding method for generating encoded data of one block using three consecutive original blocks is used. When returning from the original block “D” to “A” as in the example shown in FIG. 4, two loop encoding blocks are generated with a set of “CDA” and “DAB”. Then, at the time of reproduction, encoding processing may be performed using these encoding blocks in the loop portion.
There is a compression method in which a delay occurs at the time of encoding and decoding. When such a compression method is used, output samples at the time of decoding are output with a delay. At this time, the desired reproduction can be performed by shifting the cutting position backward by the delayed sample.
11…音声データ
12…ループ情報
20…エンコードデータ
30…制御用プログラム
100…音声データエンコード装置
110…エンコード処理部
200…音声データ再生装置
210…プログラム実行部
220…デコード処理部
300…記録媒体
DESCRIPTION OF
Claims (13)
音声データをブロックに分割するブロック分割手段と、
連続する複数のブロックを組としてエンコードを行なうことにより、それぞれの組について第1のエンコードブロックを生成するエンコード手段と
を備え、
前記エンコード手段は、さらに、
ループエンド位置を含むブロックとループスタート位置を含むブロックとを組としてエンコードを行なうことにより、当該ブロックの組について第2のエンコードブロックを生成することを特徴とする音声データエンコード装置。 An audio data encoding apparatus that encodes audio data including a loop portion in which a loop start position and a loop end position are specified,
A block dividing means for dividing the audio data into blocks;
Encoding means for generating a first encoded block for each set by encoding a plurality of consecutive blocks as a set,
The encoding means further comprises:
An audio data encoding apparatus characterized in that a second encoded block is generated for a set of blocks by encoding a block including a loop end position and a block including a loop start position as a set.
前記第2のエンコードブロックにおいて、前記ループエンド位置を含むブロックの先頭からループエンド位置まで、および、前記ループスタート位置を含むブロックのループスタート位置から最後尾までのデータ以外のデータについては、任意のデータを許容することを特徴とする音声データエンコード装置。 The audio data encoding device according to claim 1,
In the second encoding block, any data other than the data from the beginning of the block including the loop end position to the loop end position and the data from the loop start position to the end of the block including the loop start position is arbitrarily set. An audio data encoding apparatus characterized by allowing data.
所定のブロックに分割された音声データにおいて、連続する複数のブロックを組としてエンコードされた第1のエンコードブロックのそれぞれを順次読み込み、連続する複数の第1のエンコードブロックを組としてデコードすることにより音声データを生成するデコード手段と、
ループ再生を行う条件が満たされているか否かを判定する判定手段と
を備え、
前記デコード手段は、
次の第1のエンコードブロックを用いて生成される音声データにループエンド位置が含まれる場合であって、前記判定手段によりループ再生を行う条件が満たされていると判定された場合に、当該次の第1のエンコードブロックに代え、ループエンド位置を含むブロックとループスタート位置を含むブロックとを組としてエンコードされた第2のエンコードブロックを読み込んでデコードを行なうことにより、ループエンド位置を含む音声データを生成することを特徴とする音声データ再生装置。 An audio data reproducing device for reproducing audio data including a loop portion in which a loop start position and a loop end position are designated,
In the audio data divided into predetermined blocks, each of the first encoded blocks encoded as a set of a plurality of continuous blocks is sequentially read, and the audio is obtained by decoding the plurality of continuous first encode blocks as a set. Decoding means for generating data;
Determination means for determining whether or not a condition for performing loop reproduction is satisfied,
The decoding means includes
When the audio data generated using the next first encoding block includes a loop end position and the determination means determines that the condition for performing loop reproduction is satisfied, In place of the first encoding block, audio data including the loop end position is obtained by reading and decoding the second encoding block encoded as a set of the block including the loop end position and the block including the loop start position. An audio data reproducing apparatus characterized by generating
前記デコード手段は、
前記第2のエンコードブロックをデコードすることによりループエンド位置を含む音声データを生成した後に、さらに、ループスタート位置を含むブロックおよびその次のブロックを組としてエンコードされた第1のエンコードブロックを読み込んでデコードを行なうことにより、ループスタート位置を含む音声データを生成することを特徴とする音声データ再生装置。 The audio data reproducing device according to claim 3,
The decoding means includes
After the audio data including the loop end position is generated by decoding the second encoded block, the first encoded block encoded as a set of the block including the loop start position and the next block is read. An audio data reproducing apparatus that generates audio data including a loop start position by performing decoding.
前記情報処理装置に、
音声データをブロックに分割するブロック分割機能、および
連続する複数のブロックを組としてエンコードを行なうことにより、それぞれの組について第1のエンコードブロックを生成するエンコード機能
を実現させ、
前記エンコード機能は、さらに、
ループエンド位置を含むブロックとループスタート位置を含むブロックとを組としてエンコードを行なうことにより、当該ブロックの組について第2のエンコードブロックを生成することを特徴とするプログラム。 A program for causing an information processing apparatus to function as an audio data encoding apparatus that encodes audio data including a loop portion in which a loop start position and a loop end position are specified,
In the information processing apparatus,
A block division function that divides audio data into blocks, and an encoding function that generates a first encoded block for each set by encoding a plurality of consecutive blocks as a set.
The encoding function further includes:
A program for generating a second encoded block for a set of blocks by encoding a block including a loop end position and a block including a loop start position as a set.
前記第2のエンコードブロックにおいて、前記ループエンド位置を含むブロックの先頭からループエンド位置まで、および、前記ループスタート位置を含むブロックのループスタート位置から最後尾までのデータ以外のデータについては、任意のデータを許容することを特徴とするプログラム。 The program according to claim 5,
In the second encoding block, any data other than the data from the beginning of the block including the loop end position to the loop end position and the data from the loop start position to the end of the block including the loop start position is arbitrarily set. A program characterized by allowing data.
前記情報処理装置に、
所定のブロックに分割された音声データにおいて、連続する複数のブロックを組としてエンコードされた第1のエンコードブロックのそれぞれを順次読み込み、連続する複数の第1のエンコードブロックを組としてデコードすることにより音声データを生成するデコード機能、および
ループ再生を行う条件が満たされているか否かを判定する判定機能
を実現させ、
前記デコード機能は、
次の第1のエンコードブロックを用いて生成される音声データにループエンド位置が含まれる場合であって、前記判定手段によりループ再生を行う条件が満たされていると判定された場合には、当該次の第1のエンコードブロックに代え、ループエンド位置を含むブロックとループスタート位置を含むブロックとを組としてエンコードされた第2のエンコードブロックを読み込んでデコードを行なうことにより、ループエンド位置を含む音声データを生成することを特徴とするプログラム。 A program for causing an information processing apparatus to function as an audio data reproducing apparatus that reproduces audio data including a loop portion in which a loop start position and a loop end position are designated,
In the information processing apparatus,
In the audio data divided into predetermined blocks, each of the first encoded blocks encoded as a set of a plurality of continuous blocks is sequentially read, and the audio is obtained by decoding the plurality of continuous first encode blocks as a set. A decoding function that generates data and a determination function that determines whether the conditions for loop playback are satisfied,
The decoding function is
If the audio data generated using the next first encoding block includes a loop end position and the determination means determines that the condition for performing loop reproduction is satisfied, Instead of the next first encoding block, a second encoding block encoded as a set of a block including a loop end position and a block including a loop start position is read and decoded, so that audio including the loop end position is read. A program characterized by generating data.
前記デコード機能は、
前記第2のエンコードブロックをデコードすることによりループエンド位置を含む音声データを生成した後に、さらに、ループスタート位置を含むブロックおよびその次のブロックを組としてエンコードされた第1のエンコードブロックを読み込んでデコードを行なうことにより、ループスタート位置を含む音声データを生成することを特徴とするプログラム。 The program according to claim 7,
The decoding function is
After the audio data including the loop end position is generated by decoding the second encoded block, the first encoded block encoded as a set of the block including the loop start position and the next block is read. A program that generates audio data including a loop start position by performing decoding.
音声データのループスタート位置とループエンド位置とを指定するための情報と、
ブロックに分割された音声データについて、連続する複数のブロックを組としてエンコードされた第1のエンコードブロックと、
ブロックに分割された音声データについて、ループエンド位置を含むブロックとループスタート位置を含むブロックとを組としてエンコードされた第2のエンコードブロックと
が記録されており、
前記情報処理装置が、
前記記録媒体から前記第1のエンコードブロックを順次読み込み、連続する複数の第1のエンコードブロックを組としてデコードすることにより音声データを生成するデコードステップと、
ループ再生を行う条件が満たされているか否かを判定する判定ステップと
を実行し、
前記デコードステップにおいて、
次の第1のエンコードブロックを用いて生成される音声データにループエンド位置が含まれる場合であって、前記判定ステップにおいてループ再生を行う条件が満たされていると判定した場合に、当該次の第1のエンコードブロックに代え、前記第2のエンコードブロックを前記記録媒体から読み込んでデコードを行なうことにより、ループエンド位置を含む音声データを生成し、
前記情報処理装置に前記判定ステップを実現させるプログラムがさらに記録されていることを特徴とする記録媒体。 A recording medium readable by an information processing device,
Information for designating the loop start position and loop end position of the audio data;
For audio data divided into blocks, a first encoded block encoded as a set of a plurality of consecutive blocks;
For the audio data divided into blocks, a second encoded block encoded as a set of a block including the loop end position and a block including the loop start position is recorded,
The information processing apparatus is
A decoding step of sequentially reading the first encoding block from the recording medium and generating audio data by decoding a plurality of consecutive first encoding blocks as a set;
A determination step for determining whether or not a condition for performing loop playback is satisfied,
In the decoding step,
When it is determined that the loop end position is included in the audio data generated using the next first encoding block and the condition for performing the loop reproduction is satisfied in the determination step, the next Instead of the first encoding block, the second encoding block is read from the recording medium and decoded, thereby generating audio data including a loop end position ,
Recording medium characterized Rukoto said determining step is further a program for realizing the recording to the information processing apparatus.
前記音声データエンコード装置が、
音声データをブロックに分割するブロック分割ステップと、
連続する複数のブロックを組としてエンコードを行なうことにより、それぞれの組について第1のエンコードブロックを生成するエンコードステップと
を実行し、
前記エンコードステップにおいて、さらに、
ループエンド位置を含むブロックとループスタート位置を含むブロックとを組としてエンコードを行なうことにより、当該ブロックの組について第2のエンコードブロックを生成することを特徴とする音声データエンコード方法。 An audio data encoding method in an audio data encoding apparatus for encoding audio data including a loop portion in which a loop start position and a loop end position are specified,
The audio data encoding device is
A block dividing step for dividing the audio data into blocks;
Performing an encoding step of generating a first encoding block for each set by encoding a plurality of consecutive blocks as sets,
In the encoding step,
An audio data encoding method comprising: encoding a block including a loop end position and a block including a loop start position as a set to generate a second encoded block for the set of blocks.
前記音声データデコード装置が、
所定のブロックに分割された音声データにおいて、連続する複数のブロックを組としてエンコードされた第1のエンコードブロックを順次読み込み、連続する複数の第1のエンコードブロックを組としてデコードすることにより音声データを生成するデコードステップと、
ループ再生を行う条件が満たされているか否かを判定する判定ステップと
を実行し、
前記デコードステップにおいて、
次の第1のエンコードブロックを用いて生成される音声データにループエンド位置が含まれる場合であって、前記判定ステップにおいてループ再生を行う条件が満たされていると判定した場合に、当該次の第1のエンコードブロックに代え、ループエンド位置を含むブロックとループスタート位置を含むブロックとを組としてエンコードされた第2のエンコードブロックを読み込んでデコードを行なうことにより、ループエンド位置を含む音声データを生成することを特徴とする音声データデコード方法。 An audio data decoding method in an audio data reproducing apparatus for reproducing audio data including a loop portion in which a loop start position and a loop end position are designated,
The audio data decoding device comprises:
In the audio data divided into predetermined blocks, the first encoded block encoded as a set of a plurality of continuous blocks is sequentially read, and the audio data is decoded by decoding the plurality of continuous first encode blocks as a set. A decoding step to generate;
A determination step for determining whether or not a condition for performing loop playback is satisfied,
In the decoding step,
When it is determined that the loop end position is included in the audio data generated using the next first encoding block and the condition for performing the loop reproduction is satisfied in the determination step, the next Instead of the first encoding block, the second encoding block encoded as a set of the block including the loop end position and the block including the loop start position is read and decoded, so that the audio data including the loop end position is obtained. An audio data decoding method comprising generating the audio data.
前記音声データデコード装置が、前記デコードステップにおいて、
前記第2のエンコードブロックをデコードすることによりループエンド位置を含む音声データを生成した後に、さらに、ループスタート位置を含むブロックおよびその次のブロックを組としてエンコードされた第1のエンコードブロックを読み込んでデコードを行なうことにより、ループスタート位置を含む音声データを生成することを特徴とする音声データデコード方法。 An audio data decoding method of claim 1 2,
The audio data decoding device, in the decoding step,
After the audio data including the loop end position is generated by decoding the second encoded block, the first encoded block encoded as a set of the block including the loop start position and the next block is read. An audio data decoding method comprising: generating audio data including a loop start position by performing decoding.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004351162A JP4254960B2 (en) | 2004-12-03 | 2004-12-03 | Audio data encoding apparatus and audio data reproducing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004351162A JP4254960B2 (en) | 2004-12-03 | 2004-12-03 | Audio data encoding apparatus and audio data reproducing apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006162756A JP2006162756A (en) | 2006-06-22 |
JP4254960B2 true JP4254960B2 (en) | 2009-04-15 |
Family
ID=36664882
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004351162A Expired - Fee Related JP4254960B2 (en) | 2004-12-03 | 2004-12-03 | Audio data encoding apparatus and audio data reproducing apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4254960B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4940875B2 (en) * | 2006-10-06 | 2012-05-30 | ヤマハ株式会社 | Audio data compression method and apparatus, and decompression method and apparatus |
WO2009116141A1 (en) * | 2008-03-18 | 2009-09-24 | パイオニア株式会社 | Encoding device and encoding method, and program for encoding |
-
2004
- 2004-12-03 JP JP2004351162A patent/JP4254960B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006162756A (en) | 2006-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7507894B2 (en) | Sound data encoding apparatus and sound data decoding apparatus | |
JP4084990B2 (en) | Encoding device, decoding device, encoding method and decoding method | |
JP4952469B2 (en) | Information processing apparatus, information processing method, and program | |
US7479594B2 (en) | Sound data encoding apparatus and sound decoding apparatus | |
KR100924731B1 (en) | Playback device, playback method and recording medium having computer-readable playback program | |
WO2016171900A1 (en) | Gapless media generation | |
JP2006221714A (en) | Encoded digital audio reproduction apparatus | |
JP4254960B2 (en) | Audio data encoding apparatus and audio data reproducing apparatus | |
WO2009090705A1 (en) | Recording/reproduction device | |
JP2005512134A (en) | Digital audio with parameters for real-time time scaling | |
JP2004093729A (en) | Recording device and reproducing device for music data | |
JP4739598B2 (en) | Music data playback device | |
JP2007179604A (en) | Music player, reproduction control method, and program | |
JP2005122034A (en) | Audio data compression method | |
JP4765460B2 (en) | Speech coding apparatus and speech coding method | |
JP2008107629A (en) | Method of encoding and decoding audio signal, and device and program for implementing the method | |
JP7476516B2 (en) | Signal processing device, signal processing system, program, and signal processing method | |
JP2010123225A (en) | Record reproducing apparatus and record reproducing method | |
JP4570026B2 (en) | How to embed digital watermark | |
JP2009122609A (en) | Acoustic signal coder and acoustic signal decoder, their method, program and recording medium | |
JP2006079742A (en) | Device, method and program for processing information | |
JP2020009515A (en) | Play list creation device and play list creation program | |
JP2002100120A (en) | Intermusic control method of music data, information processor and intermusic control program of music data | |
JP2011013620A (en) | Voice editing method and device | |
JPH01138600A (en) | Voice filing system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080317 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080401 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080529 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090106 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090121 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130206 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140206 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |