JP2009134115A - Decoder - Google Patents
Decoder Download PDFInfo
- Publication number
- JP2009134115A JP2009134115A JP2007310628A JP2007310628A JP2009134115A JP 2009134115 A JP2009134115 A JP 2009134115A JP 2007310628 A JP2007310628 A JP 2007310628A JP 2007310628 A JP2007310628 A JP 2007310628A JP 2009134115 A JP2009134115 A JP 2009134115A
- Authority
- JP
- Japan
- Prior art keywords
- bit string
- frame
- audio data
- bit
- head position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
Description
本発明は圧縮音声データファイルをフレーム単位でデコードするデコーダに関する。 The present invention relates to a decoder that decodes a compressed audio data file in units of frames.
映像データ圧縮方式MPEG−1で利用されるMP3やMPEG−2又はMPEG−4で利用されるAAC(Advanced Audio Coding)などの音声圧縮方式が知られている。MP3やAAC ADTS(Audio Data Transport Stream)形式のファイルフォーマットにおいては、フレーム毎にヘッダが備えられており、デコーダはヘッダ内に含まれる位置情報などに基づいてフレームの先頭位置を検出して再生のための同期を取ることができる。一方、AAC ADIF(Audio Data Interchange Format)やAAC raw data形式のファイルフォーマットにおいては、フレームはデータ(raw data block)のみで構成されている。 Audio compression systems such as MP3 used in video data compression system MPEG-1 and AAC (Advanced Audio Coding) used in MPEG-2 or MPEG-4 are known. In the MP3 and AAC ADTS (Audio Data Transport Stream) format file formats, a header is provided for each frame, and the decoder detects the start position of the frame based on position information included in the header and plays back the frame. Can be synchronized for. On the other hand, in the file format of AAC ADIF (Audio Data Interchange Format) or AAC raw data format, a frame is composed only of data (raw data block).
AAC ADIF形式やAAC raw data形式において、早送りや巻き戻しのため又はエラー発生のために再生を一旦停止した後で、デコード及び再生を再開する場合には、いわゆるパーサー(Parser)と称される、MPEG−4形式のファイルフォーマットを解釈できる装置が必要であった。しかしながら、パーサーを用いた場合、再生処理量やメモリにおける記憶量の増加など再生装置のリソースを消費することになり、再生装置の小型化を阻害する要因となっていた。そのため、パーサーを使用することなく、デコード及び再生の再開を可能とする技術が望まれていた。従来、パーサーを使用せず、再生再開のための特段の技術を用いない場合、フレームの先頭位置を検出できないことから正常にデコードできず、圧縮音声データファイルを再生できなかった。 In the AAC ADIF format or AAC raw data format, when playback is temporarily stopped due to fast forward, rewind, or error occurrence, decoding and playback are resumed, so-called a parser. A device capable of interpreting the MPEG-4 format file format is required. However, when a parser is used, the resources of the playback device are consumed, such as an increase in the amount of playback processing and the amount of storage in the memory, and this is a factor that hinders downsizing the playback device. Therefore, there has been a demand for a technique that enables decoding and reproduction to be resumed without using a parser. Conventionally, when a parser is not used and a special technique for resuming playback is not used, the head position of the frame cannot be detected, so that it cannot be normally decoded and the compressed audio data file cannot be played.
例えば、特許文献1には、AACエンコーダが同期のための情報をDSE(data stream element)と称されるエレメントに予め埋め込み、AACデコーダは当該情報に基づいてAACエンコーダと同期を取ることにより圧縮情報を再生する圧縮情報再生方法が開示されている。DSEはISO/IEC14496−3規格において規定されているエレメントであり、当該規格においてはユーザーによる拡張が許容されており、当該文献に開示されているような方法を用いた場合でも当該規格を逸脱することなく圧縮情報を再生できるとしている。
For example, in
また、特許文献2には、圧縮オーディオ信号の初回の再生処理中に再生フレームのフレーム番号及び先頭アドレスをフレーム位置情報としてフレーム位置情報テーブルに保持し、2回目以降の再生処理中の早送り指示に応じて当該フレーム情報テーブルを参照し、早送り指示後の圧縮オーディオ信号の読み込み開始アドレスを決定する圧縮オーディオ信号再生装置が開示されている。当該装置によれば、AAC規格のADIFフォーマットの圧縮オーディオ信号の早送り再生を高速に行うことができるとしている。
しかしながら、特許文献1に開示される圧縮情報再生方法の場合、AACエンコーダにおいて同期情報をDSEエレメント内に予め埋め込み、AACデコーダが当該同期情報に基づいてAACエンコーダと同期するため、AACデコーダに当該同期情報がどのようなものであるかを予め設定しておく必要があった。したがって、AACデコーダは任意のエンコーダと同期できるわけではなく、AACエンコーダとAACデコーダの組み合わせが限定されてしまうという問題点があった。
However, in the compressed information reproduction method disclosed in
また、特許文献2に開示される圧縮オーディオ信号再生装置の場合、圧縮オーディオ信号の再生によって得られたフレーム番号及び先頭アドレスなどの情報を保持し、2回目以降の再生処理時にこれらの情報を参照して再生するため、最低でも1回は中断無しでの再生を行わなければならず、初回再生時に再生を中断した場合には、再生を再開しようとしても正常な再生ができないという問題点があった。
In the case of the compressed audio signal reproducing device disclosed in
本発明は上記した如き問題点に鑑みてなされたものであって、エンコーダに依存せず、初回再生時でも、AAC ADIFやAAC raw dataなどのファイルフォーマットによる圧縮音声データファイルの任意のフレーム位置から正常にデコードできるデコーダを提供することを目的とする。 The present invention has been made in view of the above-described problems, and does not depend on an encoder. Even at the time of initial playback, the present invention can be applied from an arbitrary frame position of a compressed audio data file using a file format such as AAC ADIF or AAC raw data. An object is to provide a decoder capable of normal decoding.
本発明によるデコーダは、連続する複数のフレームからなる圧縮音声データファイルをデコード処理して音声データを得るデコーダであって、フレーム先頭位置検出用ビット列を記憶する検出用ビット列記憶部と、前記圧縮音声データファイルの再生再開位置を表す情報を取得する再生再開位置取得部と、前記圧縮音声データファイルにおける前記再生再開位置以降のビット列であって前記フレーム先頭位置検出ビット列と一致するビット列を検索し当該検索によって得られたビット列の位置に基づいて前記フレームの先頭位置を検出するフレーム先頭位置検出部と、を含むことを特徴とする。 A decoder according to the present invention is a decoder that obtains audio data by decoding a compressed audio data file consisting of a plurality of consecutive frames, and includes a detection bit string storage unit that stores a frame start position detection bit string, and the compressed audio data A reproduction resumption position acquisition unit that obtains information indicating a reproduction resumption position of the data file, and a bit string that is a bit string after the reproduction resumption position in the compressed audio data file and that matches the frame head position detection bit string And a frame head position detecting unit for detecting the head position of the frame based on the position of the bit string obtained by the above.
以下、本発明に係る実施例について添付の図面を参照しつつ詳細に説明する。 Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings.
<第1の実施例>
図1は本発明によるデコーダ10を表すブロック図である。デコーダ10は、再生再開位置取得部11と、検出用ビット列記憶部12と、フレーム先頭位置検出部13と、デコード処理部14と、を含む。デコーダ10は圧縮音声データファイルをデコードして音声データを得る装置である。圧縮音声データファイルは例えば、ISO/IEC14496−3規格において規定されているAAC ADIF(Audio Data Interchange Format)やAAC raw data形式のファイルフォーマットによって構成されたデータである。
<First embodiment>
FIG. 1 is a block diagram illustrating a
再生再開位置取得部11は、圧縮音声データファイルの再生再開位置を表す情報(以下、再生再開位置情報STと称する)を取得する。再生再開位置情報STは、早送り/巻き戻し又は再生エラーのために圧縮音声データファイルの再生を中断した後、再生を再開する際の位置を表す情報である。例えば早送り/巻き戻し後にユーザーが再生再開位置を指定する場合、再生再開位置取得部11は、ユーザーによって入力された再生再開位置情報STを入力部(図示せず)から取得する。また、再生エラーのために再生を中断した場合、再生再開位置取得部11は、図示せぬ制御部から再生再開の指示と共に与えられた再生再開位置情報STを取得する。
The reproduction resume
また、再生再開位置取得部11は、圧縮音声データファイルAFも併せて取得する。例えば、図示せぬファイル記憶部が圧縮音声データファイルAFを記憶している場合には、再生再開位置取得部11は、当該ファイル記憶部から圧縮音声データファイルAFを取得する。また、図示せぬファイル受信部が圧縮音声データファイルAFを、通信回線を介して送信装置(図示せず)から受信した場合には、再生再開位置取得部11は、当該ファイル受信部から圧縮音声データファイルAFを取得する。
Further, the reproduction restart
圧縮音声データファイルAFは一連のフレームからなる。図2は、ISO/IEC14496−3規格において規定されているAAC ADIF及びAAC raw dataのフレームの構成要素を表す図である。フレームは、SCE、CPE、CCE、LFE、DSE、PCE、FIL及びTERMの要素からなる。同図に示されるようにTERM(Terminator)はフレームの終端を表す要素である。TERMの値は同規格により0x7すなわち2進数で111であることが定められている。また、フレームのデータサイズをバイト単位に揃える為のデータパディング(Data Padding)と称される要素がTERMに続いて挿入される。データパディングの値は0であり、1〜7ビットの内のいずれかで表される。 The compressed audio data file AF consists of a series of frames. FIG. 2 is a diagram showing the components of the AAC ADIF and AAC raw data frames defined in the ISO / IEC 14496-3 standard. The frame is composed of SCE, CPE, CCE, LFE, DSE, PCE, FIL, and TERM elements. As shown in the figure, TERM (Terminator) is an element representing the end of a frame. The TERM value is defined by the standard as 0x7, that is, 111 in binary. Further, an element called data padding for aligning the data size of the frame in byte units is inserted following the TERM. The value of data padding is 0, and is represented by any one of 1 to 7 bits.
検出用ビット列記憶部12は、フレーム先頭位置検出用ビット列(以下、単に検出用ビット列と称する)からなる検出用ビット列テーブルを記憶する。図3は検出用ビット列テーブルを表す図である。検出用ビット列テーブルには7通りの検出用ビット列が示されている。検出用ビット列の各々は10ビットのビット列である。これらは、TERM及びデータパディングの値に対応するように定められている。上記したようにTERMの値は111の固定値であり、データパディングの値は0であり1〜7ビットの内のいずれかで表される。
The detection bit
例えば、フレーム内におけるデータパディングが7ビットの場合、TERMビット列111及びデータパディングビット列0000000(7ビットの0)より、TERMからデータパディングに掛けてのビット列は1110000000となることから、これと同一のビット列を検出用ビット列として検出用ビット列テーブルに予め記憶する(同図中のNo.7)。また、フレーム内におけるデータパディングが1ビットの場合、TERMビット列111及びデータパディングビット列0より、TERMからデータパディングに掛けてのビット列は1110となる。TERMビット列より前方の6ビットの値を0、1のどちらでも良いものとして、10ビットの検出用ビット列xxxxxx1110を検出用ビット列テーブルに予め記憶する(同図中のNo.1。ここでのxは0又は1)。他の検出用ビット列も同様の考え方にしたがって定められる。
For example, when the data padding in the frame is 7 bits, the bit string from the TERM to the data padding becomes 1110000000 from the TERM bit string 111 and the data padding bit string 0000000 (7-bit 0). Is stored in advance in the detection bit string table as a detection bit string (No. 7 in the figure). When the data padding in the frame is 1 bit, the bit string from the TERM to the data padding becomes 1110 from the TERM bit string 111 and the data
フレーム先頭位置検出部13は、再生再開位置取得部11から再生再開位置情報ST及び圧縮音声データファイルAFを受け取り、フレーム先頭位置検出処理を実行する。図4は、圧縮音声データファイルAFを構成する一連のフレームの内、N番目及びN+1番目のフレームを中心に表した図である(ここでのNは正整数)。ここでは、再生再開位置情報STが表す再生再開位置が同図中に表される記号STで示される位置であるとする。ここでの再生再開位置STは、N番目のフレームの途中に位置する。フレーム先頭位置検出部13は、圧縮音声データファイルAFにおける再生再開位置ST以降のビット列であって図3に示される7通りの検出用ビット列の内の何れかに一致するビット列を検索し、該検索によって得られたビット列の位置に基づいてフレームの先頭位置FRを検出する。
The frame head
詳細には、先ず、フレーム先頭位置検出部13は再生再開位置STのビットを先頭とするビット列が、検出用ビット列記憶部12に記憶されている7通りの検出用ビット列の内の何れかに一致するか否かを判別する。フレーム先頭位置検出部13は、一致したと判別した場合、当該一致したビット列(N番目のフレームの終端)の次のビットの位置をN+1番目のフレームの先頭位置FRとして、これをデコード処理部14に通知する。フレーム先頭位置検出部13は、一致しなかったと判別した場合、圧縮音声データファイルAF内における検出位置を変更してフレームの先頭位置を検出する。このときフレーム先頭位置検出部13は、再生再開位置取得部11から再生再開位置STを再度、取得して同様に検索する。また、フレーム先頭位置検出部13は、例えば、再生再開位置STのビットから所定のMビットだけ進んだビットを先頭とするビット列が、検出用ビット列の内の何れかに一致するか否かを判別するようにしても良い(ここでのMは正整数)。この場合、フレーム先頭位置検出部13は、一致したという判別結果が得られるまで、Mの値を増加させつつ、同様の判別処理を繰り返す。最終的にフレーム先頭位置検出部13が一致したと判別した場合、当該一致したビット列の次のビットの位置をフレームの先頭位置FRとして、これをデコード処理部14に通知する。
Specifically, first, the frame head
例えば、図4に示される再生再開位置STのビットを先頭とする10ビットのビット列が0101010101であったとすると、当該ビット列は検出用ビット列の何れにも一致しない。この場合、フレーム先頭位置検出部13は、一致したという判別結果が得られるまで、判別対称のビット列の先頭位置を再生再開位置STのビットの位置からフレームの進行方向にずらしつつ、判別処理を繰り返す。例えば、同図に示される如くTERMからデータパディングに至るビット列が1110000000であった場合、フレーム先頭位置検出部13は、検出用ビット列テーブルに記憶されているNo.7の検出用ビット列1110000000と一致したと判別し、該一致したビット列1110000000(すなわちN番目のフレームの終端)の次のビットの位置、すなわち、N+1番目のフレームの最初のビットの位置をフレームの先頭位置FRとして、これをデコード処理部14に通知する。
For example, if the 10-bit bit string starting from the bit at the reproduction restart position ST shown in FIG. 4 is 0101010101, the bit string does not match any of the detection bit strings. In this case, the frame start
デコード処理部14は、連続する複数のフレームからなる圧縮音声データファイルAFをデコード処理して音声データを得る機能を有する。デコード処理部14は、フレーム先頭位置検出部13から圧縮音声データファイルAFと共にフレームの先頭位置FRを受け取り、これを同期位置としてN+1番目以降のフレームについてデコード処理を施すことができる。一般的にデコーダはフレームの途中からデコードした場合、正常な音声データが得られないが、デコード処理部14は、フレーム先頭位置検出部13からのフレームの先頭位置FRに基づいてN+1番目のフレームをその先頭位置から正常にデコードすることができると共に、当該先頭位置を同期位置としてN+2番目以降のフレームについても正常にデコードすることができる。
The
また、デコード処理部14は、圧縮音声データファイルAFに対するエラー判定処理機能を有する。デコード処理部14は、次の2つの場合にエラーと判定する。1つは、圧縮音声データファイルAF内にデータの誤りが検出された場合である。例えば、圧縮音声データファイルAFがハードディスク(図示せず)に記憶されていた場合、再生再開位置取得部11は、当該ハードディスクから何らかのハードウェア回路(図示せず)を介して圧縮音声データファイルAFを取得するが、この際、ハードディスクの読み取りミスやハードウェア回路におけるノイズ等の影響により、誤りのあるデータを含む圧縮音声データファイルAFを取得することになり、これにエラー判定処理を施したときにエラーと判定する。あるいは、圧縮音声データファイルAFが配信装置(図示せず)から有線若しくは無線の通信回線を介してデコーダ10に配信される場合、通信回線に生じたノイズや瞬断の影響により、再生再開位置取得部11は、誤りのあるデータを含む圧縮音声データファイルAFを取得することになり、この場合も同様に、エラー判定処理を施したときにエラーと判定する。
The
もう1つは、オーディオデータをデコードするための情報が仕様範囲外である場合である。通常、圧縮音声データファイルAFにはオーディオデータと共に、例えば圧縮方式や圧縮率などの当該オーディオデータをデコードするための情報が含まれている。これら圧縮方式や圧縮率などがデコーダ10における仕様に適合しない場合、デコード処理部14は、エラー判定処理を施したときにエラーと判定する。
The other is a case where information for decoding audio data is out of the specification range. Normally, the compressed audio data file AF includes information for decoding the audio data such as a compression method and a compression rate together with the audio data. If these compression methods and compression ratios do not conform to the specifications in the
デコード処理部14は、デコード処理により得られた音声データDAを図示せぬメモリに記憶せしめる。音声再生部(図示せず)は当該メモリから音声データDAを適宜、読み出して音声として再生することができる。
The
図5はデコード再生処理ルーチンを表すフローチャートである。以下に図5を参照しつつ、デコード再生処理について説明する。 FIG. 5 is a flowchart showing a decoding reproduction processing routine. Hereinafter, the decoding reproduction process will be described with reference to FIG.
先ず、再生再開位置取得部11は、早送り/巻き戻し後にユーザーが再生再開位置を指定する場合、ユーザーによって入力された再生再開位置情報STを図示せぬ入力部から取得する。若しくは、再生エラーのために再生を中断した場合、再生再開位置取得部11は、図示せぬ制御部から再生再開の指示と共に与えられた再生再開位置情報STを取得する(ステップS1)。また、再生再開位置取得部11は、圧縮音声データファイルAFを併せて取得する。再生再開位置取得部11は、図示せぬファイル記憶部が圧縮音声データファイルAFを記憶している場合には当該ファイル記憶部から、若しくは、図示せぬファイル受信部が圧縮音声データファイルAFを通信回線を介して送信装置(図示せず)から受信した場合には当該ファイル受信部から、圧縮音声データファイルAFを取得する。
First, when the user designates a reproduction resume position after fast forward / rewind, the reproduction resume
フレーム先頭位置検出部13は、再生再開位置取得部11から再生再開位置情報ST及び圧縮音声データファイルAFを受け取り、フレーム先頭位置検出処理を実行する(ステップS2)。フレーム先頭位置検出部13は、圧縮音声データファイルにおける再生再開位置ST以降のビット列であって検出用ビット列記憶部12に記憶されている7通りの検出用ビット列の何れかに一致するビット列を検索し、該検索によって得られたビット列の位置に基づいてフレームの先頭位置FRを検出する。
The frame head
先ず、フレーム先頭位置検出部13は再生再開位置STのビットを先頭とするビット列が、検出用ビット列記憶部12に記憶されている7通りの検出用ビット列の内の何れかに一致するか否かを判別する(ステップS3)。フレーム先頭位置検出部13は、一致したと判別した場合、当該一致したビット列(N番目のビット列の終端)の次のビットの位置をN+1番目のフレームの先頭位置FRとして、これをデコード処理部14に通知する。
First, the frame head
フレーム先頭位置検出部13は、一致しなかったと判別した場合(ステップS3)、再生再開位置STを再生再開位置取得部11から再度取得して同様の判別処理を実行するか、若しくは、再生再開位置STのビットからMビット(Mは正整数)だけ進んだビットを先頭とするビット列が検出用ビット列の内の何れかに一致するか否かを判別する(ステップS2)。フレーム先頭位置検出部13は、一致したという判別結果が得られるまで、再生再開位置STを取得し直すか、Mの値を増加させるかして、同様の判別処理を繰り返す。最終的にフレーム先頭位置検出部13が一致したと判別した場合、当該一致したビット列(N番目のフレームの終端)の次のビットの位置をN+1番目のフレームの先頭位置FRとして、これをデコード処理部14に通知する。
When it is determined that they do not match (step S3), the frame head
デコード処理部14は、フレーム先頭位置検出部13から圧縮音声データファイルAFと共にフレームの先頭位置FRを受け取り、N+1番目のフレームをその先頭位置からデコードすると共に、当該先頭位置を同期位置としてN+2番目以降のフレームについても同様にデコードする。フレームに対してその先頭位置からデコード処理を施す(ステップS4)。このとき、デコード処理部14は、圧縮音声データファイルAFに対してエラー判定処理も施す。エラーが検出されるなどしてデコードが正常に実行されなかった場合(ステップS5)、再生再開位置取得部11は、別の再生再開位置情報STを取得し(ステップS1)、同様の処理を繰り返す。
The
エラーが検出されず、デコードが正常に実行された場合(ステップS5)、デコード処理部14は、デコード処理により得られた音声データDAを図示せぬメモリに記憶せしめる。音声再生部(図示せず)は当該メモリから音声データDAを適宜、読み出して音声として再生することができる(ステップS6)。
If no error is detected and decoding is executed normally (step S5), the
上記したように本実施例によるデコーダは、AAC規格に規定されるTERMビット列に対応するビット列と、データパディングビット列に対応するビット列と、からなるフレーム先頭位置検出用ビット列を予め記憶している。デコーダは再生再開位置を取得し、圧縮音声データファイルにおける当該再生再開位置以降のビット列であって当該フレーム先頭位置検出ビット列と一致するビット列(N番目のフレームの終端)を検索し、当該検索によって得られたビット列の次のビットの位置をN+1番目のフレームの先頭位置とする。デコーダは、N+1番目のフレームの先頭位置を同期位置としてN+1番目以降のフレームを正常にデコードすることができる。このように本実施例によるデコーダは、早送り/巻き戻し又は再生エラーのために圧縮音声データファイルの再生を中断した場合においても、任意のフレーム位置から正常にデコードを開始し、再生を再開することができる。 As described above, the decoder according to the present embodiment stores in advance a frame head position detection bit string including a bit string corresponding to the TERM bit string defined by the AAC standard and a bit string corresponding to the data padding bit string. The decoder acquires the playback restart position, searches for a bit string (the end of the Nth frame) that matches the frame head position detection bit string after the playback restart position in the compressed audio data file, and obtains it by the search. The position of the next bit of the obtained bit string is set as the head position of the (N + 1) th frame. The decoder can normally decode the (N + 1) th and subsequent frames using the start position of the (N + 1) th frame as a synchronization position. As described above, the decoder according to the present embodiment starts decoding normally from an arbitrary frame position and resumes reproduction even when reproduction of the compressed audio data file is interrupted due to fast-forward / rewind or reproduction error. Can do.
フレーム先頭位置検出用ビット列は、ISO/IEC14496−3の規格を満足するように定められており、圧縮音声データファイルを圧縮するエンコーダも当該規格を満たしてさえいれば良く、エンコーダが圧縮音声データファイルに特定の情報を埋め込むなどの特段の処理を施す必要がない。そのため、本実施例によるデコーダは、エンコーダに依存せず、圧縮音声データファイルを正常にデコードすることができる。また、本実施例によるデコーダは、初回再生であるか2回目以降の再生であるかにかかわらず、圧縮音声データファイルを正常にデコードすることができる。 The frame start position detection bit string is determined so as to satisfy the ISO / IEC 14496-3 standard, and the encoder that compresses the compressed audio data file only needs to satisfy the standard. There is no need to perform special processing such as embedding specific information. Therefore, the decoder according to the present embodiment can normally decode the compressed audio data file without depending on the encoder. Also, the decoder according to the present embodiment can normally decode the compressed audio data file regardless of whether it is the first reproduction or the second reproduction or later.
<第2の実施例>
本実施例におけるデコーダ10は第1の実施例と同様に図1に示される。以下、第1の実施例と異なる部分について説明する。デコーダ10は2チャンネルのデータをデコード可能であるとする。
<Second Embodiment>
The
図6は圧縮音声データファイルAFを構成する2チャンネルCh1及びCh2の一連のフレームの内、N番目及びN+1番目のフレームを中心に表した図である。ここでは、再生再開位置情報STが表す再生再開位置が同図中に表される記号STで示される位置であるとする。再生再開位置STは、N番目のフレームの途中に位置する。チャンネルCh1の一連のフレームには、N番目のフレームの終端部TERM及びデータパディングに続いてN+1番目のフレームの先頭の要素SCE(Single Channel Element)が示されている。SCEはオーディオ信号の内、前方中央信号を格納する要素として知られる。SCEはISO/IEC14496−3規格により0x0すなわち3ビットの2進数表現で000と規定されている。チャンネルCh2の一連のフレームには、N番目のフレームの終端部TERM及びデータパディングに続いてN+1番目のフレームの先頭の要素CPE(Channel Pair Element)が示されている。CPEはオーディオ信号の内、前方左右信号及びサラウンド信号を格納する要素として知られる。CPEは同規格により0x1すなわち3ビットの2進数表現で001と規定されている。 FIG. 6 is a diagram mainly showing the Nth and N + 1th frames in a series of frames of the two channels Ch1 and Ch2 constituting the compressed audio data file AF. Here, it is assumed that the reproduction resume position represented by the reproduction resume position information ST is a position indicated by a symbol ST represented in the figure. The reproduction restart position ST is located in the middle of the Nth frame. In a series of frames of the channel Ch1, an element SCE (Single Channel Element) at the head of the (N + 1) th frame is shown following the end portion TERM and data padding of the Nth frame. SCE is known as an element that stores a front center signal in an audio signal. SCE is defined by the ISO / IEC 14496-3 standard as 0x0, that is, 000 in a 3-bit binary representation. In a series of frames of the channel Ch2, an element CPE (Channel Pair Element) at the head of the (N + 1) th frame is shown following the terminal TERM and data padding of the Nth frame. CPE is known as an element that stores a front left / right signal and a surround signal among audio signals. CPE is defined as 0x1 by the same standard, that is, 001 in a 3-bit binary representation.
図7はチャンネル1用検出用ビット列テーブルを表す図である。当該テーブルには7通りの検出用ビット列が示されている。これらのビット列は、図3に示される検出用ビット列の各々の末尾にSCEの値000を付加したものである。図8はチャンネル2用検出用ビット列テーブルを表す図である。当該テーブルには7通りの検出用ビット列が示されている。これらのビット列は、図3に示される検出用ビット列の各々の末尾にCPEの値001を付加したものである。
FIG. 7 shows a
フレーム先頭位置検出部13は、第1の実施例と同様に、圧縮音声データファイルAFにおける再生再開位置ST以降のビット列であってフレーム先頭位置検出ビット列と一致するビット列を検索する。当該検索によって得られるビット列はN番目のフレームのTERM及びデータパディングとN+1番目のフレームのSCE若しくはCPEとからなるビット列である。フレーム先頭位置検出部13は、圧縮音声データファイルAFにおけるSCEビット列若しくはCPEビット列に対応するビット列の先頭のビットの位置をN+1番目のフレームの先頭位置FRとする。
Similarly to the first embodiment, the frame head
例えば、同図のCh1に示される如くN番目のフレームのTERMからN+1番目のフレームのSCEに至るビット列が1110000000000であった場合、フレーム先頭位置検出部13は、チャンネル1用検出用ビット列テーブルに記憶されているNo.7の検出用ビット列1110000000000と一致したと判別し、SCEのビット列に対応するビット列000の先頭のビットの位置をN+1番目のフレームの先頭位置FRとして、これをデコード処理部14に通知する。デコード処理部14は、フレーム先頭位置検出部13から圧縮音声データファイルAFと共にフレームの先頭位置FRを受け取り、N+1番目のフレームをその先頭位置からデコードすると共に、当該先頭位置を同期位置としてN+2番目以降のフレームについても同様にデコードする。
For example, as shown in Ch1 in the figure, when the bit string from the TERM of the Nth frame to the SCE of the (N + 1) th frame is 1110000000000000, the frame head
本実施例によるデコーダは、フレーム先頭位置検出処理を、N番目のフレームのTERM及びデータパディングに対応するビット列に加えて、N+1番目のフレームのSCE若しくはCPEに対応するビット列に基づいて行うため、第1の実施例に比較してフレームの先頭位置をより正確に検出することができる。 The decoder according to the present embodiment performs the frame head position detection process based on the bit string corresponding to the SCE or CPE of the (N + 1) th frame in addition to the bit string corresponding to the TERM and data padding of the Nth frame. Compared with the first embodiment, the head position of the frame can be detected more accurately.
<第3の実施例>
本実施例におけるデコーダ10は第2の実施例と同様に図1に示される。以下、第2の実施例と異なる部分について説明する。
<Third embodiment>
The
本実施例におけるフレーム先頭位置検出部13は、フレーム先頭位置検出処理により最初に得られたビット列の位置以降のビット列であってフレーム先頭位置検出用ビット列と一致するビット列を再検索する再検索手段を備えている。また、フレーム先頭位置検出部13は、最初の検索及び再検索によって得られたビット列が同一であるか否かを判別する判別手段を備えている。フレーム先頭位置検出部13は、当該判別手段により、最初の検索及び再検索によって得られたビット列が同一であると判別した場合にのみ、最初の検索によって得られたビット列の位置に基づいてフレームの先頭位置を検出する。
In this embodiment, the frame head
図9は、N番目のフレームのTERMの先頭ビットからN+1番目のフレームのSCE若しくはCPEの末尾のビットに至るビット列を記号SYNC1、N+1番目のフレームのTERMの先頭ビットからN+2番目のフレームのSCE若しくはCPEの末尾のビットに至るビット列を記号SYNC2、・・・、として表したときの圧縮音声データファイルを構成する一連のフレームの一部を表す図である。ISO/IEC14496−3の規格には、N番目のフレームのTERM及びSCEとN+1番目のフレームのTERM及びSCEとは同一であることが規定されている。そのため、当該規格が満たされている圧縮音声データファイルAFであれば、SYNC1とSYNC2とは同一となる。ここでは、再生再開位置情報STが表す再生再開位置が同図中に表される記号STで示される位置であるとする。再生再開位置STは、N番目のフレームの途中に位置する。 FIG. 9 shows a bit string from the first bit of the TERM of the Nth frame to the last bit of the SCE or CPE of the N + 1th frame as a symbol SYNC1, and the SCE of the N + 2th frame from the first bit of the TERM of the N + 1th frame. It is a figure showing a part of a series of frames which constitute a compression voice data file when a bit string which reaches the last bit of CPE is expressed as symbol SYNC2,. The ISO / IEC 14496-3 standard specifies that the TERM and SCE of the Nth frame are the same as the TERM and SCE of the (N + 1) th frame. Therefore, if the compressed audio data file AF satisfies the standard, SYNC1 and SYNC2 are the same. Here, it is assumed that the reproduction resume position represented by the reproduction resume position information ST is a position indicated by a symbol ST represented in the figure. The reproduction restart position ST is located in the middle of the Nth frame.
フレーム先頭位置検出部13は第2の実施例と同様に、図7に示されるチャンネル1用検出用ビット列テーブル及び図8に示されるチャンネル2用検出用ビット列テーブルを参照してビット列を検索する。以下、図5に示されるデコード再生処理ルーチンを参照しつつ、デコード再生処理について説明する。
Similarly to the second embodiment, the frame
先ず、フレーム先頭位置検出部13は、再生再開位置取得部11から再生再開位置STを取得し(ステップS1)、圧縮音声データファイルAFにおける再生再開位置ST以降のビット列であってフレーム先頭位置検出ビット列と一致するビット列を検索する(ステップS2)。当該検索によって最初に得られるビット列はSYNC1である。続いてフレーム先頭位置検出部13は、SYNC1の位置以降のビット列であって、フレーム先頭位置検出用ビット列と一致するビット列を再検索する(ステップS2)。当該再検索によって最初に得られるビット列はSYNC2である。
First, the frame head
フレーム先頭位置検出部13は、最初の検索によって得られたビット列SYNC1と再検索によって得られたビット列SYNC2とが同一であるか否かを判別する(ステップS3)。フレーム先頭位置検出部13は、これらのビット列が同一であると判別した場合にのみ、圧縮音声データファイルAFにおけるSCEビット列若しくはCPEビット列に対応するビット列の先頭のビットの位置をN+1番目のフレームの先頭位置FRとする。例えば、図9に示される如くSYNC1及びSYNC2のビット列が共に1110000000000であった場合、フレーム先頭位置検出部13は、SCEのビット列に対応するビット列000の先頭のビットの位置をN+1番目のフレームの先頭位置FRとする。
The frame head
フレーム先頭位置検出部13は、圧縮音声データファイルAFと共にフレームの先頭位置FRをデコード処理部14に与える。デコード処理部14は、フレーム先頭位置検出部13から圧縮音声データファイルAFと共にフレームの先頭位置FRを受け取り、N+1番目のフレームをその先頭位置からデコードすると共に、当該先頭位置を同期位置としてN+2番目以降のフレームについても同様にデコードする。(ステップS4)。
The frame head
本実施例によるデコーダは、フレームの先頭位置を再検索する手段を備え、最初の検索によって得られたビット列と再検索によって得られたビット列とが同一である場合にのみ、フレームの先頭位置を検出するため、第3の実施例に比較してフレームの先頭位置をより正確に検出することができる。 The decoder according to this embodiment includes means for re-searching the start position of the frame, and detects the start position of the frame only when the bit string obtained by the initial search and the bit string obtained by the re-search are the same. Therefore, the head position of the frame can be detected more accurately than in the third embodiment.
第1〜第3の実施例は、圧縮音声データファイルをAAC ADIF及びAAC raw dataのファイルフォーマットとした場合の例であるが、本発明はフレームの先頭と終端のビット列が規定されている全てのファイルフォーマットに適用可能である。 The first to third embodiments are examples in which the compressed audio data file has an AAC ADIF and AAC raw data file format. However, the present invention is not limited to all the bit strings at the beginning and end of a frame. Applicable to file format.
10 デコーダ
11 再生再開位置取得部
12 検出用ビット列記憶部
13 フレーム先頭位置検出部
14 デコード処理部
AF 圧縮音声信号
DA デコード音声データ
FR フレーム先頭位置
RP 再生データ
ST 再生再開位置
DESCRIPTION OF
Claims (6)
フレーム先頭位置検出用ビット列を記憶する検出用ビット列記憶部と、
前記圧縮音声データファイルの再生再開位置を表す情報を取得する再生再開位置取得部と、
前記圧縮音声データファイルにおける前記再生再開位置以降のビット列であって前記フレーム先頭位置検出ビット列と一致するビット列を検索し当該検索によって得られたビット列の位置に基づいて前記フレームの先頭位置を検出するフレーム先頭位置検出部と、を含むことを特徴とするデコーダ。 A decoder for obtaining audio data by decoding a compressed audio data file consisting of a plurality of consecutive frames,
A detection bit string storage unit for storing a frame start position detection bit string;
A reproduction resumption position acquisition unit for acquiring information indicating a reproduction resumption position of the compressed audio data file;
A frame in which a bit string that coincides with the frame head position detection bit string in the compressed audio data file after the reproduction restart position is searched, and the head position of the frame is detected based on the position of the bit string obtained by the search And a head position detector.
前記フレーム先頭位置検出部は、前記フレーム先頭位置検出用ビット列と一致するビット列の次のビットの位置を前記フレームの先頭位置とすることを特徴とする請求項1に記載のデコーダ。 The frame head position detection bit string includes a bit string corresponding to a TERM bit string defined in the AAC standard and a bit string corresponding to a data padding bit string.
2. The decoder according to claim 1, wherein the frame head position detection unit sets a position of a bit next to a bit string that matches the frame head position detection bit string as a head position of the frame.
前記フレーム先頭位置検出部は、前記圧縮音声データファイルにおける前記SCEビット列若しくはCPEビット列に対応するビット列の先頭のビットの位置を前記フレームの先頭位置とすることを特徴とする請求項1に記載のデコーダ。 The frame start position detection bit string includes a bit string corresponding to a TERM bit string defined in the AAC standard, a bit string corresponding to a data padding bit string, and a bit string corresponding to an SCE bit string or a bit string corresponding to a CPE bit string,
2. The decoder according to claim 1, wherein the frame head position detection unit sets a position of a head bit of a bit string corresponding to the SCE bit string or CPE bit string in the compressed audio data file as a head position of the frame. .
最初の検索によって得られたビット列の位置以降のビット列であって前記フレーム先頭位置検出用ビット列と一致するビット列を再検索する再検索手段と、
前記最初の検索及び再検索によって得られたビット列が同一であるか否かを判別する判別手段と、を含み、
前記判別手段が同一であると判別した場合にのみ、前記最初の検索によって得られたビット列の位置に基づいて前記フレームの先頭位置を検出することを特徴とする請求項1に記載のデコーダ。 The frame head position detector
Re-search means for re-searching a bit string after the position of the bit string obtained by the first search and matching the bit start position detection bit string;
Discriminating means for discriminating whether or not the bit strings obtained by the initial search and the re-search are the same,
2. The decoder according to claim 1, wherein the start position of the frame is detected based on the position of the bit string obtained by the first search only when the determination means determines that they are the same.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007310628A JP2009134115A (en) | 2007-11-30 | 2007-11-30 | Decoder |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007310628A JP2009134115A (en) | 2007-11-30 | 2007-11-30 | Decoder |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009134115A true JP2009134115A (en) | 2009-06-18 |
Family
ID=40866029
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007310628A Pending JP2009134115A (en) | 2007-11-30 | 2007-11-30 | Decoder |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009134115A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020004027A1 (en) * | 2018-06-25 | 2020-01-02 | ソニーセミコンダクタソリューションズ株式会社 | Information processing device, information processing system, program and information processing method |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003162299A (en) * | 2001-11-28 | 2003-06-06 | Fujitsu Ltd | Speech reproducing circuit, decoding circuit, and device and method for reproducing speech |
JP2006101382A (en) * | 2004-09-30 | 2006-04-13 | Kenwood Corp | Mobile wireless communication apparatus, wireless communication apparatus, and communication processing method |
JP2006139054A (en) * | 2004-11-12 | 2006-06-01 | Kddi Corp | Method to play back or record downloaded musical contents, terminal and program |
-
2007
- 2007-11-30 JP JP2007310628A patent/JP2009134115A/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003162299A (en) * | 2001-11-28 | 2003-06-06 | Fujitsu Ltd | Speech reproducing circuit, decoding circuit, and device and method for reproducing speech |
JP2006101382A (en) * | 2004-09-30 | 2006-04-13 | Kenwood Corp | Mobile wireless communication apparatus, wireless communication apparatus, and communication processing method |
JP2006139054A (en) * | 2004-11-12 | 2006-06-01 | Kddi Corp | Method to play back or record downloaded musical contents, terminal and program |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020004027A1 (en) * | 2018-06-25 | 2020-01-02 | ソニーセミコンダクタソリューションズ株式会社 | Information processing device, information processing system, program and information processing method |
JPWO2020004027A1 (en) * | 2018-06-25 | 2021-08-05 | ソニーセミコンダクタソリューションズ株式会社 | Information processing equipment, information processing system, program and information processing method |
JP7247184B2 (en) | 2018-06-25 | 2023-03-28 | ソニーセミコンダクタソリューションズ株式会社 | Information processing device, information processing system, program and information processing method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4354455B2 (en) | Playback apparatus and playback method | |
KR101819027B1 (en) | Reproducing method for audio and reproducing apparatus for audio thereof, and information storage medium | |
TWI469134B (en) | Method and apparatus for generating or changing a frame based bit stream format file including at least one header section, and a corresponding data structure | |
WO2009114972A1 (en) | Method for finding out the frame size of a multimedia sequence | |
US20170163978A1 (en) | System and method for synchronizing audio signal and video signal | |
US6694030B1 (en) | Apparatus and method for reproducing a digital audio signal from a record carrier | |
JP5036353B2 (en) | Data reproducing apparatus and data reproducing method | |
JP2009134115A (en) | Decoder | |
US20090220094A1 (en) | Processing circuit capable of modifying digital audio signals | |
US20100286989A1 (en) | Recording/reproduction device | |
JP4380930B2 (en) | Audio / video decoding / playback apparatus and synchronized playback method thereof | |
JP2005217486A (en) | Stream decoding device | |
JP2008197199A (en) | Audio encoder and audio decoder | |
US20110022400A1 (en) | Audio resume playback device and audio resume playback method | |
JPH10178419A (en) | Error correcting method and its device | |
US9514768B2 (en) | Audio reproducing method, audio reproducing apparatus therefor, and information storage medium | |
KR100752874B1 (en) | Decoding control method for audio frame | |
JP2002170330A (en) | Pcm audio signal reproducing device | |
JP2006319552A (en) | Multimedia reproducing device | |
JP2011085643A (en) | Decoder, information processor and voice compression format determination method | |
US20080077411A1 (en) | Decoder, signal processing system, and decoding method | |
US20060045142A1 (en) | Demultiplexer | |
WO2012006784A1 (en) | Method for searching for flash video tag in bitstream and searching apparatus thereof | |
JP2000152236A (en) | Moving picture coder, multiplexing method, its system and recording and reproducing device | |
KR100632532B1 (en) | Audio frame recognition method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101101 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120214 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120612 |