JP2009134115A - Decoder - Google Patents

Decoder Download PDF

Info

Publication number
JP2009134115A
JP2009134115A JP2007310628A JP2007310628A JP2009134115A JP 2009134115 A JP2009134115 A JP 2009134115A JP 2007310628 A JP2007310628 A JP 2007310628A JP 2007310628 A JP2007310628 A JP 2007310628A JP 2009134115 A JP2009134115 A JP 2009134115A
Authority
JP
Japan
Prior art keywords
bit string
frame
audio data
bit
head position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007310628A
Other languages
Japanese (ja)
Inventor
Ko Uchida
航 内田
Hirobumi Muramatsu
寛文 村松
Katsu Nagase
克 永瀬
Makoto Onishi
誠 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lapis Semiconductor Co Ltd
Original Assignee
Oki Semiconductor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Semiconductor Co Ltd filed Critical Oki Semiconductor Co Ltd
Priority to JP2007310628A priority Critical patent/JP2009134115A/en
Publication of JP2009134115A publication Critical patent/JP2009134115A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a decoder capable of correctly decoding a compressed speech data file in a file format such as an AAC, ADIF and an AAC raw data from an optional position without depending on an encoder, even in the first reproduction time. <P>SOLUTION: The decoder prestores a bit string for detecting a frame head position, composed of a bit string corresponding to a TERM bit string which is defined in an AAC standard, and a bit string corresponding to a data padding bit string, acquires the reproduction resume position, searches a bit string which matches the bit string for detecting the frame head position and which is the bit string on and after a reproduction resume position in the compressed speech data file, and detects a head position of the frame based on a position of the bit string which is acquired by the search. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は圧縮音声データファイルをフレーム単位でデコードするデコーダに関する。   The present invention relates to a decoder that decodes a compressed audio data file in units of frames.

映像データ圧縮方式MPEG−1で利用されるMP3やMPEG−2又はMPEG−4で利用されるAAC(Advanced Audio Coding)などの音声圧縮方式が知られている。MP3やAAC ADTS(Audio Data Transport Stream)形式のファイルフォーマットにおいては、フレーム毎にヘッダが備えられており、デコーダはヘッダ内に含まれる位置情報などに基づいてフレームの先頭位置を検出して再生のための同期を取ることができる。一方、AAC ADIF(Audio Data Interchange Format)やAAC raw data形式のファイルフォーマットにおいては、フレームはデータ(raw data block)のみで構成されている。   Audio compression systems such as MP3 used in video data compression system MPEG-1 and AAC (Advanced Audio Coding) used in MPEG-2 or MPEG-4 are known. In the MP3 and AAC ADTS (Audio Data Transport Stream) format file formats, a header is provided for each frame, and the decoder detects the start position of the frame based on position information included in the header and plays back the frame. Can be synchronized for. On the other hand, in the file format of AAC ADIF (Audio Data Interchange Format) or AAC raw data format, a frame is composed only of data (raw data block).

AAC ADIF形式やAAC raw data形式において、早送りや巻き戻しのため又はエラー発生のために再生を一旦停止した後で、デコード及び再生を再開する場合には、いわゆるパーサー(Parser)と称される、MPEG−4形式のファイルフォーマットを解釈できる装置が必要であった。しかしながら、パーサーを用いた場合、再生処理量やメモリにおける記憶量の増加など再生装置のリソースを消費することになり、再生装置の小型化を阻害する要因となっていた。そのため、パーサーを使用することなく、デコード及び再生の再開を可能とする技術が望まれていた。従来、パーサーを使用せず、再生再開のための特段の技術を用いない場合、フレームの先頭位置を検出できないことから正常にデコードできず、圧縮音声データファイルを再生できなかった。   In the AAC ADIF format or AAC raw data format, when playback is temporarily stopped due to fast forward, rewind, or error occurrence, decoding and playback are resumed, so-called a parser. A device capable of interpreting the MPEG-4 format file format is required. However, when a parser is used, the resources of the playback device are consumed, such as an increase in the amount of playback processing and the amount of storage in the memory, and this is a factor that hinders downsizing the playback device. Therefore, there has been a demand for a technique that enables decoding and reproduction to be resumed without using a parser. Conventionally, when a parser is not used and a special technique for resuming playback is not used, the head position of the frame cannot be detected, so that it cannot be normally decoded and the compressed audio data file cannot be played.

例えば、特許文献1には、AACエンコーダが同期のための情報をDSE(data stream element)と称されるエレメントに予め埋め込み、AACデコーダは当該情報に基づいてAACエンコーダと同期を取ることにより圧縮情報を再生する圧縮情報再生方法が開示されている。DSEはISO/IEC14496−3規格において規定されているエレメントであり、当該規格においてはユーザーによる拡張が許容されており、当該文献に開示されているような方法を用いた場合でも当該規格を逸脱することなく圧縮情報を再生できるとしている。   For example, in Patent Document 1, the AAC encoder embeds information for synchronization in an element called DSE (data stream element) in advance, and the AAC decoder synchronizes with the AAC encoder based on the information, thereby compressing information. A method for reproducing compressed information is disclosed. DSE is an element specified in the ISO / IEC 14496-3 standard, and the standard allows extensions by the user. Even if a method such as that disclosed in the document is used, the DSE deviates from the standard. The compressed information can be reproduced without any problem.

また、特許文献2には、圧縮オーディオ信号の初回の再生処理中に再生フレームのフレーム番号及び先頭アドレスをフレーム位置情報としてフレーム位置情報テーブルに保持し、2回目以降の再生処理中の早送り指示に応じて当該フレーム情報テーブルを参照し、早送り指示後の圧縮オーディオ信号の読み込み開始アドレスを決定する圧縮オーディオ信号再生装置が開示されている。当該装置によれば、AAC規格のADIFフォーマットの圧縮オーディオ信号の早送り再生を高速に行うことができるとしている。
USP6718507 特開2002−041095号公報
In Patent Document 2, the frame number and head address of a playback frame are held in the frame position information table as frame position information during the first playback process of the compressed audio signal, and a fast-forward instruction during the second and subsequent playback processes is provided. Accordingly, there is disclosed a compressed audio signal reproducing apparatus that refers to the frame information table and determines the read start address of the compressed audio signal after the fast-forward instruction. According to this apparatus, fast-forward reproduction of a compressed audio signal in the AAC standard ADIF format can be performed at high speed.
USP 6718507 JP 2002-041095 A

しかしながら、特許文献1に開示される圧縮情報再生方法の場合、AACエンコーダにおいて同期情報をDSEエレメント内に予め埋め込み、AACデコーダが当該同期情報に基づいてAACエンコーダと同期するため、AACデコーダに当該同期情報がどのようなものであるかを予め設定しておく必要があった。したがって、AACデコーダは任意のエンコーダと同期できるわけではなく、AACエンコーダとAACデコーダの組み合わせが限定されてしまうという問題点があった。   However, in the compressed information reproduction method disclosed in Patent Document 1, since synchronization information is embedded in the DSE element in advance in the AAC encoder and the AAC decoder synchronizes with the AAC encoder based on the synchronization information, the synchronization information is included in the AAC decoder. It was necessary to set in advance what the information is. Therefore, the AAC decoder cannot be synchronized with an arbitrary encoder, and there is a problem that the combination of the AAC encoder and the AAC decoder is limited.

また、特許文献2に開示される圧縮オーディオ信号再生装置の場合、圧縮オーディオ信号の再生によって得られたフレーム番号及び先頭アドレスなどの情報を保持し、2回目以降の再生処理時にこれらの情報を参照して再生するため、最低でも1回は中断無しでの再生を行わなければならず、初回再生時に再生を中断した場合には、再生を再開しようとしても正常な再生ができないという問題点があった。   In the case of the compressed audio signal reproducing device disclosed in Patent Document 2, information such as a frame number and a head address obtained by reproducing the compressed audio signal is held, and the information is referred to in the second and subsequent reproduction processing. Therefore, if playback is interrupted at the first playback, normal playback cannot be performed even if playback is resumed. It was.

本発明は上記した如き問題点に鑑みてなされたものであって、エンコーダに依存せず、初回再生時でも、AAC ADIFやAAC raw dataなどのファイルフォーマットによる圧縮音声データファイルの任意のフレーム位置から正常にデコードできるデコーダを提供することを目的とする。   The present invention has been made in view of the above-described problems, and does not depend on an encoder. Even at the time of initial playback, the present invention can be applied from an arbitrary frame position of a compressed audio data file using a file format such as AAC ADIF or AAC raw data. An object is to provide a decoder capable of normal decoding.

本発明によるデコーダは、連続する複数のフレームからなる圧縮音声データファイルをデコード処理して音声データを得るデコーダであって、フレーム先頭位置検出用ビット列を記憶する検出用ビット列記憶部と、前記圧縮音声データファイルの再生再開位置を表す情報を取得する再生再開位置取得部と、前記圧縮音声データファイルにおける前記再生再開位置以降のビット列であって前記フレーム先頭位置検出ビット列と一致するビット列を検索し当該検索によって得られたビット列の位置に基づいて前記フレームの先頭位置を検出するフレーム先頭位置検出部と、を含むことを特徴とする。   A decoder according to the present invention is a decoder that obtains audio data by decoding a compressed audio data file consisting of a plurality of consecutive frames, and includes a detection bit string storage unit that stores a frame start position detection bit string, and the compressed audio data A reproduction resumption position acquisition unit that obtains information indicating a reproduction resumption position of the data file, and a bit string that is a bit string after the reproduction resumption position in the compressed audio data file and that matches the frame head position detection bit string And a frame head position detecting unit for detecting the head position of the frame based on the position of the bit string obtained by the above.

以下、本発明に係る実施例について添付の図面を参照しつつ詳細に説明する。   Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings.

<第1の実施例>
図1は本発明によるデコーダ10を表すブロック図である。デコーダ10は、再生再開位置取得部11と、検出用ビット列記憶部12と、フレーム先頭位置検出部13と、デコード処理部14と、を含む。デコーダ10は圧縮音声データファイルをデコードして音声データを得る装置である。圧縮音声データファイルは例えば、ISO/IEC14496−3規格において規定されているAAC ADIF(Audio Data Interchange Format)やAAC raw data形式のファイルフォーマットによって構成されたデータである。
<First embodiment>
FIG. 1 is a block diagram illustrating a decoder 10 according to the present invention. The decoder 10 includes a reproduction restart position acquisition unit 11, a detection bit string storage unit 12, a frame head position detection unit 13, and a decoding processing unit 14. The decoder 10 is a device that obtains audio data by decoding a compressed audio data file. The compressed audio data file is, for example, data configured in a file format of AAC ADIF (Audio Data Interchange Format) or AAC raw data format defined in the ISO / IEC 14496-3 standard.

再生再開位置取得部11は、圧縮音声データファイルの再生再開位置を表す情報(以下、再生再開位置情報STと称する)を取得する。再生再開位置情報STは、早送り/巻き戻し又は再生エラーのために圧縮音声データファイルの再生を中断した後、再生を再開する際の位置を表す情報である。例えば早送り/巻き戻し後にユーザーが再生再開位置を指定する場合、再生再開位置取得部11は、ユーザーによって入力された再生再開位置情報STを入力部(図示せず)から取得する。また、再生エラーのために再生を中断した場合、再生再開位置取得部11は、図示せぬ制御部から再生再開の指示と共に与えられた再生再開位置情報STを取得する。   The reproduction resume position acquisition unit 11 obtains information indicating the reproduction resume position of the compressed audio data file (hereinafter referred to as reproduction resume position information ST). The reproduction restart position information ST is information indicating a position when reproduction is resumed after the reproduction of the compressed audio data file is interrupted due to fast forward / rewind or a reproduction error. For example, when the user designates a playback resume position after fast forward / rewind, the playback resume position acquisition unit 11 acquires playback resume position information ST input by the user from an input unit (not shown). When the reproduction is interrupted due to a reproduction error, the reproduction resume position acquisition unit 11 obtains reproduction resume position information ST given together with an instruction to resume reproduction from a control unit (not shown).

また、再生再開位置取得部11は、圧縮音声データファイルAFも併せて取得する。例えば、図示せぬファイル記憶部が圧縮音声データファイルAFを記憶している場合には、再生再開位置取得部11は、当該ファイル記憶部から圧縮音声データファイルAFを取得する。また、図示せぬファイル受信部が圧縮音声データファイルAFを、通信回線を介して送信装置(図示せず)から受信した場合には、再生再開位置取得部11は、当該ファイル受信部から圧縮音声データファイルAFを取得する。   Further, the reproduction restart position acquisition unit 11 also acquires the compressed audio data file AF. For example, when the file storage unit (not shown) stores the compressed audio data file AF, the reproduction restart position acquisition unit 11 acquires the compressed audio data file AF from the file storage unit. When a file reception unit (not shown) receives the compressed audio data file AF from a transmission device (not shown) via a communication line, the reproduction resume position acquisition unit 11 receives the compressed audio data from the file reception unit. A data file AF is acquired.

圧縮音声データファイルAFは一連のフレームからなる。図2は、ISO/IEC14496−3規格において規定されているAAC ADIF及びAAC raw dataのフレームの構成要素を表す図である。フレームは、SCE、CPE、CCE、LFE、DSE、PCE、FIL及びTERMの要素からなる。同図に示されるようにTERM(Terminator)はフレームの終端を表す要素である。TERMの値は同規格により0x7すなわち2進数で111であることが定められている。また、フレームのデータサイズをバイト単位に揃える為のデータパディング(Data Padding)と称される要素がTERMに続いて挿入される。データパディングの値は0であり、1〜7ビットの内のいずれかで表される。   The compressed audio data file AF consists of a series of frames. FIG. 2 is a diagram showing the components of the AAC ADIF and AAC raw data frames defined in the ISO / IEC 14496-3 standard. The frame is composed of SCE, CPE, CCE, LFE, DSE, PCE, FIL, and TERM elements. As shown in the figure, TERM (Terminator) is an element representing the end of a frame. The TERM value is defined by the standard as 0x7, that is, 111 in binary. Further, an element called data padding for aligning the data size of the frame in byte units is inserted following the TERM. The value of data padding is 0, and is represented by any one of 1 to 7 bits.

検出用ビット列記憶部12は、フレーム先頭位置検出用ビット列(以下、単に検出用ビット列と称する)からなる検出用ビット列テーブルを記憶する。図3は検出用ビット列テーブルを表す図である。検出用ビット列テーブルには7通りの検出用ビット列が示されている。検出用ビット列の各々は10ビットのビット列である。これらは、TERM及びデータパディングの値に対応するように定められている。上記したようにTERMの値は111の固定値であり、データパディングの値は0であり1〜7ビットの内のいずれかで表される。   The detection bit string storage unit 12 stores a detection bit string table composed of a frame head position detection bit string (hereinafter simply referred to as a detection bit string). FIG. 3 shows a detection bit string table. The detection bit string table shows seven detection bit strings. Each of the detection bit strings is a 10-bit bit string. These are defined to correspond to the values of TERM and data padding. As described above, the TERM value is a fixed value of 111, the data padding value is 0, and is represented by any one of 1 to 7 bits.

例えば、フレーム内におけるデータパディングが7ビットの場合、TERMビット列111及びデータパディングビット列0000000(7ビットの0)より、TERMからデータパディングに掛けてのビット列は1110000000となることから、これと同一のビット列を検出用ビット列として検出用ビット列テーブルに予め記憶する(同図中のNo.7)。また、フレーム内におけるデータパディングが1ビットの場合、TERMビット列111及びデータパディングビット列0より、TERMからデータパディングに掛けてのビット列は1110となる。TERMビット列より前方の6ビットの値を0、1のどちらでも良いものとして、10ビットの検出用ビット列xxxxxx1110を検出用ビット列テーブルに予め記憶する(同図中のNo.1。ここでのxは0又は1)。他の検出用ビット列も同様の考え方にしたがって定められる。   For example, when the data padding in the frame is 7 bits, the bit string from the TERM to the data padding becomes 1110000000 from the TERM bit string 111 and the data padding bit string 0000000 (7-bit 0). Is stored in advance in the detection bit string table as a detection bit string (No. 7 in the figure). When the data padding in the frame is 1 bit, the bit string from the TERM to the data padding becomes 1110 from the TERM bit string 111 and the data padding bit string 0. Assuming that the value of the 6 bits ahead of the TERM bit string can be either 0 or 1, a 10-bit detection bit string xxxxxxxx 1110 is stored in advance in the detection bit string table (No. 1 in FIG. 0 or 1). Other detection bit strings are determined according to the same concept.

フレーム先頭位置検出部13は、再生再開位置取得部11から再生再開位置情報ST及び圧縮音声データファイルAFを受け取り、フレーム先頭位置検出処理を実行する。図4は、圧縮音声データファイルAFを構成する一連のフレームの内、N番目及びN+1番目のフレームを中心に表した図である(ここでのNは正整数)。ここでは、再生再開位置情報STが表す再生再開位置が同図中に表される記号STで示される位置であるとする。ここでの再生再開位置STは、N番目のフレームの途中に位置する。フレーム先頭位置検出部13は、圧縮音声データファイルAFにおける再生再開位置ST以降のビット列であって図3に示される7通りの検出用ビット列の内の何れかに一致するビット列を検索し、該検索によって得られたビット列の位置に基づいてフレームの先頭位置FRを検出する。   The frame head position detection unit 13 receives the playback restart position information ST and the compressed audio data file AF from the playback restart position acquisition unit 11, and executes a frame head position detection process. FIG. 4 is a diagram centering on the Nth and N + 1th frames in a series of frames constituting the compressed audio data file AF (where N is a positive integer). Here, it is assumed that the reproduction resume position represented by the reproduction resume position information ST is a position indicated by a symbol ST represented in the figure. The reproduction restart position ST here is located in the middle of the Nth frame. The frame head position detector 13 searches for a bit string after the reproduction resuming position ST in the compressed audio data file AF that matches any of the seven detection bit strings shown in FIG. The head position FR of the frame is detected based on the position of the bit string obtained by.

詳細には、先ず、フレーム先頭位置検出部13は再生再開位置STのビットを先頭とするビット列が、検出用ビット列記憶部12に記憶されている7通りの検出用ビット列の内の何れかに一致するか否かを判別する。フレーム先頭位置検出部13は、一致したと判別した場合、当該一致したビット列(N番目のフレームの終端)の次のビットの位置をN+1番目のフレームの先頭位置FRとして、これをデコード処理部14に通知する。フレーム先頭位置検出部13は、一致しなかったと判別した場合、圧縮音声データファイルAF内における検出位置を変更してフレームの先頭位置を検出する。このときフレーム先頭位置検出部13は、再生再開位置取得部11から再生再開位置STを再度、取得して同様に検索する。また、フレーム先頭位置検出部13は、例えば、再生再開位置STのビットから所定のMビットだけ進んだビットを先頭とするビット列が、検出用ビット列の内の何れかに一致するか否かを判別するようにしても良い(ここでのMは正整数)。この場合、フレーム先頭位置検出部13は、一致したという判別結果が得られるまで、Mの値を増加させつつ、同様の判別処理を繰り返す。最終的にフレーム先頭位置検出部13が一致したと判別した場合、当該一致したビット列の次のビットの位置をフレームの先頭位置FRとして、これをデコード処理部14に通知する。   Specifically, first, the frame head position detection unit 13 matches the bit string starting from the bit of the reproduction restart position ST with any of the seven detection bit strings stored in the detection bit string storage unit 12. It is determined whether or not to do so. If the frame head position detection unit 13 determines that they match, the position of the next bit in the matched bit string (the end of the Nth frame) is set as the head position FR of the (N + 1) th frame, and this is used as the decoding processing unit 14. Notify If the frame head position detection unit 13 determines that they do not match, the frame head position detection unit 13 detects the head position of the frame by changing the detection position in the compressed audio data file AF. At this time, the frame head position detection unit 13 obtains the reproduction resume position ST again from the reproduction resume position acquisition unit 11 and searches similarly. Further, the frame head position detection unit 13 determines, for example, whether a bit string starting from a bit advanced by a predetermined M bits from the bit of the reproduction restart position ST matches any of the detection bit strings. (M here is a positive integer). In this case, the frame head position detection unit 13 repeats the same determination process while increasing the value of M until a determination result indicating that they match is obtained. When it is finally determined that the frame head position detection unit 13 matches, the position of the next bit in the matched bit string is set as the frame head position FR, and this is notified to the decoding processing unit 14.

例えば、図4に示される再生再開位置STのビットを先頭とする10ビットのビット列が0101010101であったとすると、当該ビット列は検出用ビット列の何れにも一致しない。この場合、フレーム先頭位置検出部13は、一致したという判別結果が得られるまで、判別対称のビット列の先頭位置を再生再開位置STのビットの位置からフレームの進行方向にずらしつつ、判別処理を繰り返す。例えば、同図に示される如くTERMからデータパディングに至るビット列が1110000000であった場合、フレーム先頭位置検出部13は、検出用ビット列テーブルに記憶されているNo.7の検出用ビット列1110000000と一致したと判別し、該一致したビット列1110000000(すなわちN番目のフレームの終端)の次のビットの位置、すなわち、N+1番目のフレームの最初のビットの位置をフレームの先頭位置FRとして、これをデコード処理部14に通知する。   For example, if the 10-bit bit string starting from the bit at the reproduction restart position ST shown in FIG. 4 is 0101010101, the bit string does not match any of the detection bit strings. In this case, the frame start position detection unit 13 repeats the determination process while shifting the start position of the bit string that is symmetrical to the determination from the position of the bit at the reproduction resume position ST in the frame progress direction until a determination result that they match is obtained. . For example, when the bit string from TERM to data padding is 1111000000 as shown in the figure, the frame head position detection unit 13 stores the No. stored in the detection bit string table. 7 is determined to be coincident with the detection bit string 11110000000, and the position of the bit next to the coincident bit string 11110000000 (that is, the end of the Nth frame), that is, the position of the first bit of the (N + 1) th frame is determined as the head of the frame. This is notified to the decoding processing unit 14 as the position FR.

デコード処理部14は、連続する複数のフレームからなる圧縮音声データファイルAFをデコード処理して音声データを得る機能を有する。デコード処理部14は、フレーム先頭位置検出部13から圧縮音声データファイルAFと共にフレームの先頭位置FRを受け取り、これを同期位置としてN+1番目以降のフレームについてデコード処理を施すことができる。一般的にデコーダはフレームの途中からデコードした場合、正常な音声データが得られないが、デコード処理部14は、フレーム先頭位置検出部13からのフレームの先頭位置FRに基づいてN+1番目のフレームをその先頭位置から正常にデコードすることができると共に、当該先頭位置を同期位置としてN+2番目以降のフレームについても正常にデコードすることができる。   The decode processing unit 14 has a function of obtaining audio data by decoding a compressed audio data file AF composed of a plurality of consecutive frames. The decode processing unit 14 can receive the frame start position FR from the frame start position detection unit 13 together with the compressed audio data file AF, and can perform the decoding process on the (N + 1) th and subsequent frames using this as the synchronization position. In general, when the decoder decodes from the middle of the frame, normal audio data cannot be obtained. However, the decoding processing unit 14 determines the N + 1th frame based on the frame start position FR from the frame start position detection unit 13. The normal position can be decoded from the head position, and the N + 2 and subsequent frames can be normally decoded with the head position as a synchronization position.

また、デコード処理部14は、圧縮音声データファイルAFに対するエラー判定処理機能を有する。デコード処理部14は、次の2つの場合にエラーと判定する。1つは、圧縮音声データファイルAF内にデータの誤りが検出された場合である。例えば、圧縮音声データファイルAFがハードディスク(図示せず)に記憶されていた場合、再生再開位置取得部11は、当該ハードディスクから何らかのハードウェア回路(図示せず)を介して圧縮音声データファイルAFを取得するが、この際、ハードディスクの読み取りミスやハードウェア回路におけるノイズ等の影響により、誤りのあるデータを含む圧縮音声データファイルAFを取得することになり、これにエラー判定処理を施したときにエラーと判定する。あるいは、圧縮音声データファイルAFが配信装置(図示せず)から有線若しくは無線の通信回線を介してデコーダ10に配信される場合、通信回線に生じたノイズや瞬断の影響により、再生再開位置取得部11は、誤りのあるデータを含む圧縮音声データファイルAFを取得することになり、この場合も同様に、エラー判定処理を施したときにエラーと判定する。   The decode processing unit 14 has an error determination processing function for the compressed audio data file AF. The decode processing unit 14 determines an error in the following two cases. One is a case where a data error is detected in the compressed audio data file AF. For example, when the compressed audio data file AF is stored in a hard disk (not shown), the reproduction resume position acquisition unit 11 receives the compressed audio data file AF from the hard disk via some hardware circuit (not shown). At this time, the compressed audio data file AF including erroneous data is acquired due to the influence of a reading error of the hard disk or noise in the hardware circuit, and when error determination processing is performed on this. Judged as an error. Alternatively, when the compressed audio data file AF is distributed from a distribution device (not shown) to the decoder 10 via a wired or wireless communication line, the reproduction resume position is acquired due to noise or a momentary interruption that occurs in the communication line. The unit 11 obtains the compressed audio data file AF including erroneous data. In this case as well, the unit 11 determines that an error has occurred when the error determination process is performed.

もう1つは、オーディオデータをデコードするための情報が仕様範囲外である場合である。通常、圧縮音声データファイルAFにはオーディオデータと共に、例えば圧縮方式や圧縮率などの当該オーディオデータをデコードするための情報が含まれている。これら圧縮方式や圧縮率などがデコーダ10における仕様に適合しない場合、デコード処理部14は、エラー判定処理を施したときにエラーと判定する。   The other is a case where information for decoding audio data is out of the specification range. Normally, the compressed audio data file AF includes information for decoding the audio data such as a compression method and a compression rate together with the audio data. If these compression methods and compression ratios do not conform to the specifications in the decoder 10, the decode processing unit 14 determines an error when performing an error determination process.

デコード処理部14は、デコード処理により得られた音声データDAを図示せぬメモリに記憶せしめる。音声再生部(図示せず)は当該メモリから音声データDAを適宜、読み出して音声として再生することができる。   The decoding processing unit 14 stores the audio data DA obtained by the decoding processing in a memory (not shown). An audio reproducing unit (not shown) can appropriately read out audio data DA from the memory and reproduce it as audio.

図5はデコード再生処理ルーチンを表すフローチャートである。以下に図5を参照しつつ、デコード再生処理について説明する。   FIG. 5 is a flowchart showing a decoding reproduction processing routine. Hereinafter, the decoding reproduction process will be described with reference to FIG.

先ず、再生再開位置取得部11は、早送り/巻き戻し後にユーザーが再生再開位置を指定する場合、ユーザーによって入力された再生再開位置情報STを図示せぬ入力部から取得する。若しくは、再生エラーのために再生を中断した場合、再生再開位置取得部11は、図示せぬ制御部から再生再開の指示と共に与えられた再生再開位置情報STを取得する(ステップS1)。また、再生再開位置取得部11は、圧縮音声データファイルAFを併せて取得する。再生再開位置取得部11は、図示せぬファイル記憶部が圧縮音声データファイルAFを記憶している場合には当該ファイル記憶部から、若しくは、図示せぬファイル受信部が圧縮音声データファイルAFを通信回線を介して送信装置(図示せず)から受信した場合には当該ファイル受信部から、圧縮音声データファイルAFを取得する。   First, when the user designates a reproduction resume position after fast forward / rewind, the reproduction resume position acquisition unit 11 obtains reproduction resume position information ST input by the user from an input unit (not shown). Alternatively, when playback is interrupted due to a playback error, the playback restart position acquisition unit 11 acquires playback restart position information ST given together with a playback restart instruction from a control unit (not shown) (step S1). Further, the reproduction restart position acquisition unit 11 acquires the compressed audio data file AF together. When the file storage unit (not shown) stores the compressed audio data file AF, the reproduction resume position acquisition unit 11 communicates the compressed audio data file AF from the file storage unit or the file reception unit (not shown). When the data is received from a transmission device (not shown) via a line, the compressed audio data file AF is acquired from the file receiving unit.

フレーム先頭位置検出部13は、再生再開位置取得部11から再生再開位置情報ST及び圧縮音声データファイルAFを受け取り、フレーム先頭位置検出処理を実行する(ステップS2)。フレーム先頭位置検出部13は、圧縮音声データファイルにおける再生再開位置ST以降のビット列であって検出用ビット列記憶部12に記憶されている7通りの検出用ビット列の何れかに一致するビット列を検索し、該検索によって得られたビット列の位置に基づいてフレームの先頭位置FRを検出する。   The frame head position detection unit 13 receives the playback restart position information ST and the compressed audio data file AF from the playback restart position acquisition unit 11, and executes a frame head position detection process (step S2). The frame head position detection unit 13 searches for a bit string that corresponds to one of the seven detection bit strings stored in the detection bit string storage unit 12 after the reproduction restart position ST in the compressed audio data file. Then, the start position FR of the frame is detected based on the position of the bit string obtained by the search.

先ず、フレーム先頭位置検出部13は再生再開位置STのビットを先頭とするビット列が、検出用ビット列記憶部12に記憶されている7通りの検出用ビット列の内の何れかに一致するか否かを判別する(ステップS3)。フレーム先頭位置検出部13は、一致したと判別した場合、当該一致したビット列(N番目のビット列の終端)の次のビットの位置をN+1番目のフレームの先頭位置FRとして、これをデコード処理部14に通知する。   First, the frame head position detection unit 13 determines whether the bit string starting from the bit at the reproduction restart position ST matches any of the seven detection bit strings stored in the detection bit string storage unit 12. Is discriminated (step S3). If the frame head position detection unit 13 determines that they match, the position of the bit next to the matched bit string (the end of the Nth bit string) is set as the head position FR of the (N + 1) th frame, and this is used as the decoding processing unit 14. Notify

フレーム先頭位置検出部13は、一致しなかったと判別した場合(ステップS3)、再生再開位置STを再生再開位置取得部11から再度取得して同様の判別処理を実行するか、若しくは、再生再開位置STのビットからMビット(Mは正整数)だけ進んだビットを先頭とするビット列が検出用ビット列の内の何れかに一致するか否かを判別する(ステップS2)。フレーム先頭位置検出部13は、一致したという判別結果が得られるまで、再生再開位置STを取得し直すか、Mの値を増加させるかして、同様の判別処理を繰り返す。最終的にフレーム先頭位置検出部13が一致したと判別した場合、当該一致したビット列(N番目のフレームの終端)の次のビットの位置をN+1番目のフレームの先頭位置FRとして、これをデコード処理部14に通知する。   When it is determined that they do not match (step S3), the frame head position detection unit 13 acquires the playback resume position ST from the playback resume position acquisition unit 11 again and executes the same determination process, or the playback restart position. It is determined whether or not the bit string starting from the bit advanced by M bits (M is a positive integer) from the ST bit matches any of the detection bit strings (step S2). The frame head position detection unit 13 repeats the same determination process until the reproduction restart position ST is re-acquired or the value of M is increased until a determination result that matches is obtained. When it is finally determined that the frame head position detection unit 13 matches, the position of the bit next to the matched bit string (the end of the Nth frame) is set as the head position FR of the (N + 1) th frame, and this is decoded. Notification to the unit 14.

デコード処理部14は、フレーム先頭位置検出部13から圧縮音声データファイルAFと共にフレームの先頭位置FRを受け取り、N+1番目のフレームをその先頭位置からデコードすると共に、当該先頭位置を同期位置としてN+2番目以降のフレームについても同様にデコードする。フレームに対してその先頭位置からデコード処理を施す(ステップS4)。このとき、デコード処理部14は、圧縮音声データファイルAFに対してエラー判定処理も施す。エラーが検出されるなどしてデコードが正常に実行されなかった場合(ステップS5)、再生再開位置取得部11は、別の再生再開位置情報STを取得し(ステップS1)、同様の処理を繰り返す。   The decode processing unit 14 receives the frame start position FR from the frame start position detection unit 13 together with the compressed audio data file AF, decodes the (N + 1) th frame from the start position, and uses the start position as the synchronization position and the (N + 2) th and subsequent frames. The same frame is also decoded. The frame is decoded from the head position (step S4). At this time, the decoding processing unit 14 also performs error determination processing on the compressed audio data file AF. When the decoding is not normally executed due to an error or the like (step S5), the reproduction resume position acquisition unit 11 obtains another reproduction resume position information ST (step S1) and repeats the same processing. .

エラーが検出されず、デコードが正常に実行された場合(ステップS5)、デコード処理部14は、デコード処理により得られた音声データDAを図示せぬメモリに記憶せしめる。音声再生部(図示せず)は当該メモリから音声データDAを適宜、読み出して音声として再生することができる(ステップS6)。   If no error is detected and decoding is executed normally (step S5), the decoding processing unit 14 stores the audio data DA obtained by the decoding processing in a memory (not shown). An audio reproducing unit (not shown) can appropriately read out the audio data DA from the memory and reproduce it as audio (step S6).

上記したように本実施例によるデコーダは、AAC規格に規定されるTERMビット列に対応するビット列と、データパディングビット列に対応するビット列と、からなるフレーム先頭位置検出用ビット列を予め記憶している。デコーダは再生再開位置を取得し、圧縮音声データファイルにおける当該再生再開位置以降のビット列であって当該フレーム先頭位置検出ビット列と一致するビット列(N番目のフレームの終端)を検索し、当該検索によって得られたビット列の次のビットの位置をN+1番目のフレームの先頭位置とする。デコーダは、N+1番目のフレームの先頭位置を同期位置としてN+1番目以降のフレームを正常にデコードすることができる。このように本実施例によるデコーダは、早送り/巻き戻し又は再生エラーのために圧縮音声データファイルの再生を中断した場合においても、任意のフレーム位置から正常にデコードを開始し、再生を再開することができる。   As described above, the decoder according to the present embodiment stores in advance a frame head position detection bit string including a bit string corresponding to the TERM bit string defined by the AAC standard and a bit string corresponding to the data padding bit string. The decoder acquires the playback restart position, searches for a bit string (the end of the Nth frame) that matches the frame head position detection bit string after the playback restart position in the compressed audio data file, and obtains it by the search. The position of the next bit of the obtained bit string is set as the head position of the (N + 1) th frame. The decoder can normally decode the (N + 1) th and subsequent frames using the start position of the (N + 1) th frame as a synchronization position. As described above, the decoder according to the present embodiment starts decoding normally from an arbitrary frame position and resumes reproduction even when reproduction of the compressed audio data file is interrupted due to fast-forward / rewind or reproduction error. Can do.

フレーム先頭位置検出用ビット列は、ISO/IEC14496−3の規格を満足するように定められており、圧縮音声データファイルを圧縮するエンコーダも当該規格を満たしてさえいれば良く、エンコーダが圧縮音声データファイルに特定の情報を埋め込むなどの特段の処理を施す必要がない。そのため、本実施例によるデコーダは、エンコーダに依存せず、圧縮音声データファイルを正常にデコードすることができる。また、本実施例によるデコーダは、初回再生であるか2回目以降の再生であるかにかかわらず、圧縮音声データファイルを正常にデコードすることができる。   The frame start position detection bit string is determined so as to satisfy the ISO / IEC 14496-3 standard, and the encoder that compresses the compressed audio data file only needs to satisfy the standard. There is no need to perform special processing such as embedding specific information. Therefore, the decoder according to the present embodiment can normally decode the compressed audio data file without depending on the encoder. Also, the decoder according to the present embodiment can normally decode the compressed audio data file regardless of whether it is the first reproduction or the second reproduction or later.

<第2の実施例>
本実施例におけるデコーダ10は第1の実施例と同様に図1に示される。以下、第1の実施例と異なる部分について説明する。デコーダ10は2チャンネルのデータをデコード可能であるとする。
<Second Embodiment>
The decoder 10 in this embodiment is shown in FIG. 1 as in the first embodiment. Hereinafter, parts different from the first embodiment will be described. It is assumed that the decoder 10 can decode data of two channels.

図6は圧縮音声データファイルAFを構成する2チャンネルCh1及びCh2の一連のフレームの内、N番目及びN+1番目のフレームを中心に表した図である。ここでは、再生再開位置情報STが表す再生再開位置が同図中に表される記号STで示される位置であるとする。再生再開位置STは、N番目のフレームの途中に位置する。チャンネルCh1の一連のフレームには、N番目のフレームの終端部TERM及びデータパディングに続いてN+1番目のフレームの先頭の要素SCE(Single Channel Element)が示されている。SCEはオーディオ信号の内、前方中央信号を格納する要素として知られる。SCEはISO/IEC14496−3規格により0x0すなわち3ビットの2進数表現で000と規定されている。チャンネルCh2の一連のフレームには、N番目のフレームの終端部TERM及びデータパディングに続いてN+1番目のフレームの先頭の要素CPE(Channel Pair Element)が示されている。CPEはオーディオ信号の内、前方左右信号及びサラウンド信号を格納する要素として知られる。CPEは同規格により0x1すなわち3ビットの2進数表現で001と規定されている。   FIG. 6 is a diagram mainly showing the Nth and N + 1th frames in a series of frames of the two channels Ch1 and Ch2 constituting the compressed audio data file AF. Here, it is assumed that the reproduction resume position represented by the reproduction resume position information ST is a position indicated by a symbol ST represented in the figure. The reproduction restart position ST is located in the middle of the Nth frame. In a series of frames of the channel Ch1, an element SCE (Single Channel Element) at the head of the (N + 1) th frame is shown following the end portion TERM and data padding of the Nth frame. SCE is known as an element that stores a front center signal in an audio signal. SCE is defined by the ISO / IEC 14496-3 standard as 0x0, that is, 000 in a 3-bit binary representation. In a series of frames of the channel Ch2, an element CPE (Channel Pair Element) at the head of the (N + 1) th frame is shown following the terminal TERM and data padding of the Nth frame. CPE is known as an element that stores a front left / right signal and a surround signal among audio signals. CPE is defined as 0x1 by the same standard, that is, 001 in a 3-bit binary representation.

図7はチャンネル1用検出用ビット列テーブルを表す図である。当該テーブルには7通りの検出用ビット列が示されている。これらのビット列は、図3に示される検出用ビット列の各々の末尾にSCEの値000を付加したものである。図8はチャンネル2用検出用ビット列テーブルを表す図である。当該テーブルには7通りの検出用ビット列が示されている。これらのビット列は、図3に示される検出用ビット列の各々の末尾にCPEの値001を付加したものである。   FIG. 7 shows a channel 1 detection bit string table. The table shows seven detection bit strings. These bit strings are obtained by adding the SCE value 000 to the end of each of the detection bit strings shown in FIG. FIG. 8 is a diagram showing a channel 2 detection bit string table. The table shows seven detection bit strings. These bit strings are obtained by adding the CPE value 001 to the end of each of the detection bit strings shown in FIG.

フレーム先頭位置検出部13は、第1の実施例と同様に、圧縮音声データファイルAFにおける再生再開位置ST以降のビット列であってフレーム先頭位置検出ビット列と一致するビット列を検索する。当該検索によって得られるビット列はN番目のフレームのTERM及びデータパディングとN+1番目のフレームのSCE若しくはCPEとからなるビット列である。フレーム先頭位置検出部13は、圧縮音声データファイルAFにおけるSCEビット列若しくはCPEビット列に対応するビット列の先頭のビットの位置をN+1番目のフレームの先頭位置FRとする。   Similarly to the first embodiment, the frame head position detection unit 13 searches for a bit string after the reproduction restart position ST in the compressed audio data file AF that matches the frame head position detection bit string. The bit string obtained by the search is a bit string including the TERM and data padding of the Nth frame and the SCE or CPE of the (N + 1) th frame. The frame head position detection unit 13 sets the position of the head bit of the bit string corresponding to the SCE bit string or CPE bit string in the compressed audio data file AF as the head position FR of the (N + 1) th frame.

例えば、同図のCh1に示される如くN番目のフレームのTERMからN+1番目のフレームのSCEに至るビット列が1110000000000であった場合、フレーム先頭位置検出部13は、チャンネル1用検出用ビット列テーブルに記憶されているNo.7の検出用ビット列1110000000000と一致したと判別し、SCEのビット列に対応するビット列000の先頭のビットの位置をN+1番目のフレームの先頭位置FRとして、これをデコード処理部14に通知する。デコード処理部14は、フレーム先頭位置検出部13から圧縮音声データファイルAFと共にフレームの先頭位置FRを受け取り、N+1番目のフレームをその先頭位置からデコードすると共に、当該先頭位置を同期位置としてN+2番目以降のフレームについても同様にデコードする。   For example, as shown in Ch1 in the figure, when the bit string from the TERM of the Nth frame to the SCE of the (N + 1) th frame is 1110000000000000, the frame head position detection unit 13 stores the bit string in the detection bit string table for channel 1 No. 7 is determined to coincide with the detection bit string 1110000000000000, and the position of the head bit of the bit string 000 corresponding to the bit string of SCE is set as the head position FR of the (N + 1) th frame, and this is notified to the decoding processing unit 14. The decode processing unit 14 receives the frame start position FR from the frame start position detection unit 13 together with the compressed audio data file AF, decodes the (N + 1) th frame from the start position, and uses the start position as the synchronization position and the (N + 2) th and subsequent frames. The same frame is also decoded.

本実施例によるデコーダは、フレーム先頭位置検出処理を、N番目のフレームのTERM及びデータパディングに対応するビット列に加えて、N+1番目のフレームのSCE若しくはCPEに対応するビット列に基づいて行うため、第1の実施例に比較してフレームの先頭位置をより正確に検出することができる。   The decoder according to the present embodiment performs the frame head position detection process based on the bit string corresponding to the SCE or CPE of the (N + 1) th frame in addition to the bit string corresponding to the TERM and data padding of the Nth frame. Compared with the first embodiment, the head position of the frame can be detected more accurately.

<第3の実施例>
本実施例におけるデコーダ10は第2の実施例と同様に図1に示される。以下、第2の実施例と異なる部分について説明する。
<Third embodiment>
The decoder 10 in this embodiment is shown in FIG. 1 as in the second embodiment. Hereinafter, a different part from a 2nd Example is demonstrated.

本実施例におけるフレーム先頭位置検出部13は、フレーム先頭位置検出処理により最初に得られたビット列の位置以降のビット列であってフレーム先頭位置検出用ビット列と一致するビット列を再検索する再検索手段を備えている。また、フレーム先頭位置検出部13は、最初の検索及び再検索によって得られたビット列が同一であるか否かを判別する判別手段を備えている。フレーム先頭位置検出部13は、当該判別手段により、最初の検索及び再検索によって得られたビット列が同一であると判別した場合にのみ、最初の検索によって得られたビット列の位置に基づいてフレームの先頭位置を検出する。   In this embodiment, the frame head position detection unit 13 includes a re-search unit that re-searches a bit string after the position of the bit string first obtained by the frame head position detection process and that matches the bit string for detecting the frame head position. I have. The frame head position detection unit 13 includes determination means for determining whether or not the bit strings obtained by the initial search and the re-search are the same. The frame head position detection unit 13 determines the frame based on the position of the bit string obtained by the first search only when the discrimination means determines that the bit strings obtained by the first search and re-search are the same. Detect the start position.

図9は、N番目のフレームのTERMの先頭ビットからN+1番目のフレームのSCE若しくはCPEの末尾のビットに至るビット列を記号SYNC1、N+1番目のフレームのTERMの先頭ビットからN+2番目のフレームのSCE若しくはCPEの末尾のビットに至るビット列を記号SYNC2、・・・、として表したときの圧縮音声データファイルを構成する一連のフレームの一部を表す図である。ISO/IEC14496−3の規格には、N番目のフレームのTERM及びSCEとN+1番目のフレームのTERM及びSCEとは同一であることが規定されている。そのため、当該規格が満たされている圧縮音声データファイルAFであれば、SYNC1とSYNC2とは同一となる。ここでは、再生再開位置情報STが表す再生再開位置が同図中に表される記号STで示される位置であるとする。再生再開位置STは、N番目のフレームの途中に位置する。   FIG. 9 shows a bit string from the first bit of the TERM of the Nth frame to the last bit of the SCE or CPE of the N + 1th frame as a symbol SYNC1, and the SCE of the N + 2th frame from the first bit of the TERM of the N + 1th frame. It is a figure showing a part of a series of frames which constitute a compression voice data file when a bit string which reaches the last bit of CPE is expressed as symbol SYNC2,. The ISO / IEC 14496-3 standard specifies that the TERM and SCE of the Nth frame are the same as the TERM and SCE of the (N + 1) th frame. Therefore, if the compressed audio data file AF satisfies the standard, SYNC1 and SYNC2 are the same. Here, it is assumed that the reproduction resume position represented by the reproduction resume position information ST is a position indicated by a symbol ST represented in the figure. The reproduction restart position ST is located in the middle of the Nth frame.

フレーム先頭位置検出部13は第2の実施例と同様に、図7に示されるチャンネル1用検出用ビット列テーブル及び図8に示されるチャンネル2用検出用ビット列テーブルを参照してビット列を検索する。以下、図5に示されるデコード再生処理ルーチンを参照しつつ、デコード再生処理について説明する。   Similarly to the second embodiment, the frame head position detector 13 searches for a bit string with reference to the channel 1 detection bit string table shown in FIG. 7 and the channel 2 detection bit string table shown in FIG. Hereinafter, the decoding / reproducing process will be described with reference to the decoding / reproducing process routine shown in FIG.

先ず、フレーム先頭位置検出部13は、再生再開位置取得部11から再生再開位置STを取得し(ステップS1)、圧縮音声データファイルAFにおける再生再開位置ST以降のビット列であってフレーム先頭位置検出ビット列と一致するビット列を検索する(ステップS2)。当該検索によって最初に得られるビット列はSYNC1である。続いてフレーム先頭位置検出部13は、SYNC1の位置以降のビット列であって、フレーム先頭位置検出用ビット列と一致するビット列を再検索する(ステップS2)。当該再検索によって最初に得られるビット列はSYNC2である。   First, the frame head position detection unit 13 acquires the playback restart position ST from the playback restart position acquisition unit 11 (step S1), and is a bit string after the playback restart position ST in the compressed audio data file AF and a frame head position detection bit string. Is searched for a bit string that matches (step S2). The first bit string obtained by the search is SYNC1. Subsequently, the frame head position detection unit 13 re-searches a bit string after the position of SYNC1 that matches the frame head position detection bit string (step S2). The first bit string obtained by the re-search is SYNC2.

フレーム先頭位置検出部13は、最初の検索によって得られたビット列SYNC1と再検索によって得られたビット列SYNC2とが同一であるか否かを判別する(ステップS3)。フレーム先頭位置検出部13は、これらのビット列が同一であると判別した場合にのみ、圧縮音声データファイルAFにおけるSCEビット列若しくはCPEビット列に対応するビット列の先頭のビットの位置をN+1番目のフレームの先頭位置FRとする。例えば、図9に示される如くSYNC1及びSYNC2のビット列が共に1110000000000であった場合、フレーム先頭位置検出部13は、SCEのビット列に対応するビット列000の先頭のビットの位置をN+1番目のフレームの先頭位置FRとする。   The frame head position detection unit 13 determines whether or not the bit string SYNC1 obtained by the first search is the same as the bit string SYNC2 obtained by the re-search (step S3). Only when the frame head position detection unit 13 determines that these bit strings are the same, the position of the head bit of the bit string corresponding to the SCE bit string or the CPE bit string in the compressed audio data file AF is determined as the head of the (N + 1) th frame. Let it be position FR. For example, as shown in FIG. 9, when both the bit strings of SYNC1 and SYNC2 are 1110000000000000, the frame head position detection unit 13 sets the position of the head bit of the bit string 000 corresponding to the SCE bit string to the head of the N + 1th frame. Let it be position FR.

フレーム先頭位置検出部13は、圧縮音声データファイルAFと共にフレームの先頭位置FRをデコード処理部14に与える。デコード処理部14は、フレーム先頭位置検出部13から圧縮音声データファイルAFと共にフレームの先頭位置FRを受け取り、N+1番目のフレームをその先頭位置からデコードすると共に、当該先頭位置を同期位置としてN+2番目以降のフレームについても同様にデコードする。(ステップS4)。   The frame head position detection unit 13 gives the frame head position FR to the decode processing unit 14 together with the compressed audio data file AF. The decode processing unit 14 receives the frame start position FR from the frame start position detection unit 13 together with the compressed audio data file AF, decodes the (N + 1) th frame from the start position, and uses the start position as the synchronization position and the (N + 2) th and subsequent frames. The same frame is also decoded. (Step S4).

本実施例によるデコーダは、フレームの先頭位置を再検索する手段を備え、最初の検索によって得られたビット列と再検索によって得られたビット列とが同一である場合にのみ、フレームの先頭位置を検出するため、第3の実施例に比較してフレームの先頭位置をより正確に検出することができる。   The decoder according to this embodiment includes means for re-searching the start position of the frame, and detects the start position of the frame only when the bit string obtained by the initial search and the bit string obtained by the re-search are the same. Therefore, the head position of the frame can be detected more accurately than in the third embodiment.

第1〜第3の実施例は、圧縮音声データファイルをAAC ADIF及びAAC raw dataのファイルフォーマットとした場合の例であるが、本発明はフレームの先頭と終端のビット列が規定されている全てのファイルフォーマットに適用可能である。   The first to third embodiments are examples in which the compressed audio data file has an AAC ADIF and AAC raw data file format. However, the present invention is not limited to all the bit strings at the beginning and end of a frame. Applicable to file format.

本発明によるデコーダを表すブロック図である。FIG. 3 is a block diagram illustrating a decoder according to the present invention. AAC ADIF及びAAC raw dataのフレームの構成要素を表す図である。It is a figure showing the component of the flame | frame of AAC ADIF and AAC raw data. 検出用ビット列テーブルを表す図である。It is a figure showing the bit string table for a detection. 圧縮音声データファイルを構成する一連のフレームの一部を表す図である。It is a figure showing a part of a series of frames which constitute a compression audio data file. デコード再生処理ルーチンを表すフローチャートである。It is a flowchart showing a decoding reproduction processing routine. 2チャンネル時の圧縮音声データファイルを構成する一連のフレームの一部を表す図である。It is a figure showing a part of a series of frames which constitute a compression audio data file at the time of 2 channels. チャンネル1用の検出用ビット列テーブルを表す図である。6 is a diagram illustrating a detection bit string table for channel 1. FIG. チャンネル2用の検出用ビット列テーブルを表す図である。6 is a diagram illustrating a detection bit string table for channel 2. FIG. 特定のビット列を記号SYNCとして表したときの圧縮音声データファイルを構成する一連のフレームの一部を表す図である。It is a figure showing a part of a series of frames which constitute a compression audio data file when a specific bit sequence is expressed as symbol SYNC.

符号の説明Explanation of symbols

10 デコーダ
11 再生再開位置取得部
12 検出用ビット列記憶部
13 フレーム先頭位置検出部
14 デコード処理部
AF 圧縮音声信号
DA デコード音声データ
FR フレーム先頭位置
RP 再生データ
ST 再生再開位置
DESCRIPTION OF SYMBOLS 10 Decoder 11 Reproduction | regeneration resumption position acquisition part 12 Bit stream memory | storage part 13 for detection Frame start position detection part 14 Decoding processing part AF Compressed audio signal DA Decoding audio | voice data FR Frame top position RP Reproduction data ST Reproduction resumption position

Claims (6)

連続する複数のフレームからなる圧縮音声データファイルをデコード処理して音声データを得るデコーダであって、
フレーム先頭位置検出用ビット列を記憶する検出用ビット列記憶部と、
前記圧縮音声データファイルの再生再開位置を表す情報を取得する再生再開位置取得部と、
前記圧縮音声データファイルにおける前記再生再開位置以降のビット列であって前記フレーム先頭位置検出ビット列と一致するビット列を検索し当該検索によって得られたビット列の位置に基づいて前記フレームの先頭位置を検出するフレーム先頭位置検出部と、を含むことを特徴とするデコーダ。
A decoder for obtaining audio data by decoding a compressed audio data file consisting of a plurality of consecutive frames,
A detection bit string storage unit for storing a frame start position detection bit string;
A reproduction resumption position acquisition unit for acquiring information indicating a reproduction resumption position of the compressed audio data file;
A frame in which a bit string that coincides with the frame head position detection bit string in the compressed audio data file after the reproduction restart position is searched, and the head position of the frame is detected based on the position of the bit string obtained by the search And a head position detector.
前記フレーム先頭位置検出用ビット列は、AAC規格に規定されるTERMビット列に対応するビット列と、データパディングビット列に対応するビット列と、からなり、
前記フレーム先頭位置検出部は、前記フレーム先頭位置検出用ビット列と一致するビット列の次のビットの位置を前記フレームの先頭位置とすることを特徴とする請求項1に記載のデコーダ。
The frame head position detection bit string includes a bit string corresponding to a TERM bit string defined in the AAC standard and a bit string corresponding to a data padding bit string.
2. The decoder according to claim 1, wherein the frame head position detection unit sets a position of a bit next to a bit string that matches the frame head position detection bit string as a head position of the frame.
前記フレーム先頭位置検出用ビット列は、AAC規格に規定されるTERMビット列に対応するビット列と、データパディングビット列に対応するビット列と、SCEビット列に対応するビット列若しくはCPEビット列に対応するビット列と、からなり、
前記フレーム先頭位置検出部は、前記圧縮音声データファイルにおける前記SCEビット列若しくはCPEビット列に対応するビット列の先頭のビットの位置を前記フレームの先頭位置とすることを特徴とする請求項1に記載のデコーダ。
The frame start position detection bit string includes a bit string corresponding to a TERM bit string defined in the AAC standard, a bit string corresponding to a data padding bit string, and a bit string corresponding to an SCE bit string or a bit string corresponding to a CPE bit string,
2. The decoder according to claim 1, wherein the frame head position detection unit sets a position of a head bit of a bit string corresponding to the SCE bit string or CPE bit string in the compressed audio data file as a head position of the frame. .
前記フレーム先頭位置検出部は、
最初の検索によって得られたビット列の位置以降のビット列であって前記フレーム先頭位置検出用ビット列と一致するビット列を再検索する再検索手段と、
前記最初の検索及び再検索によって得られたビット列が同一であるか否かを判別する判別手段と、を含み、
前記判別手段が同一であると判別した場合にのみ、前記最初の検索によって得られたビット列の位置に基づいて前記フレームの先頭位置を検出することを特徴とする請求項1に記載のデコーダ。
The frame head position detector
Re-search means for re-searching a bit string after the position of the bit string obtained by the first search and matching the bit start position detection bit string;
Discriminating means for discriminating whether or not the bit strings obtained by the initial search and the re-search are the same,
2. The decoder according to claim 1, wherein the start position of the frame is detected based on the position of the bit string obtained by the first search only when the determination means determines that they are the same.
前記フレームの前記先頭位置を同期位置として、前記フレームに続くフレームをデコードするデコード処理部を含むことを特徴とする請求項1〜4のいずれか一項に記載のデコーダ。   5. The decoder according to claim 1, further comprising: a decoding processing unit that decodes a frame subsequent to the frame with the head position of the frame as a synchronization position. 6. 前記デコード処理部は、前記圧縮音声データファイルに対するエラー判定を行うことを特徴とする請求項5に記載のデコーダ。   The decoder according to claim 5, wherein the decoding processing unit performs error determination on the compressed audio data file.
JP2007310628A 2007-11-30 2007-11-30 Decoder Pending JP2009134115A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007310628A JP2009134115A (en) 2007-11-30 2007-11-30 Decoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007310628A JP2009134115A (en) 2007-11-30 2007-11-30 Decoder

Publications (1)

Publication Number Publication Date
JP2009134115A true JP2009134115A (en) 2009-06-18

Family

ID=40866029

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007310628A Pending JP2009134115A (en) 2007-11-30 2007-11-30 Decoder

Country Status (1)

Country Link
JP (1) JP2009134115A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020004027A1 (en) * 2018-06-25 2020-01-02 ソニーセミコンダクタソリューションズ株式会社 Information processing device, information processing system, program and information processing method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003162299A (en) * 2001-11-28 2003-06-06 Fujitsu Ltd Speech reproducing circuit, decoding circuit, and device and method for reproducing speech
JP2006101382A (en) * 2004-09-30 2006-04-13 Kenwood Corp Mobile wireless communication apparatus, wireless communication apparatus, and communication processing method
JP2006139054A (en) * 2004-11-12 2006-06-01 Kddi Corp Method to play back or record downloaded musical contents, terminal and program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003162299A (en) * 2001-11-28 2003-06-06 Fujitsu Ltd Speech reproducing circuit, decoding circuit, and device and method for reproducing speech
JP2006101382A (en) * 2004-09-30 2006-04-13 Kenwood Corp Mobile wireless communication apparatus, wireless communication apparatus, and communication processing method
JP2006139054A (en) * 2004-11-12 2006-06-01 Kddi Corp Method to play back or record downloaded musical contents, terminal and program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020004027A1 (en) * 2018-06-25 2020-01-02 ソニーセミコンダクタソリューションズ株式会社 Information processing device, information processing system, program and information processing method
JPWO2020004027A1 (en) * 2018-06-25 2021-08-05 ソニーセミコンダクタソリューションズ株式会社 Information processing equipment, information processing system, program and information processing method
JP7247184B2 (en) 2018-06-25 2023-03-28 ソニーセミコンダクタソリューションズ株式会社 Information processing device, information processing system, program and information processing method

Similar Documents

Publication Publication Date Title
JP4354455B2 (en) Playback apparatus and playback method
KR101819027B1 (en) Reproducing method for audio and reproducing apparatus for audio thereof, and information storage medium
TWI469134B (en) Method and apparatus for generating or changing a frame based bit stream format file including at least one header section, and a corresponding data structure
WO2009114972A1 (en) Method for finding out the frame size of a multimedia sequence
US20170163978A1 (en) System and method for synchronizing audio signal and video signal
US6694030B1 (en) Apparatus and method for reproducing a digital audio signal from a record carrier
JP5036353B2 (en) Data reproducing apparatus and data reproducing method
JP2009134115A (en) Decoder
US20090220094A1 (en) Processing circuit capable of modifying digital audio signals
US20100286989A1 (en) Recording/reproduction device
JP4380930B2 (en) Audio / video decoding / playback apparatus and synchronized playback method thereof
JP2005217486A (en) Stream decoding device
JP2008197199A (en) Audio encoder and audio decoder
US20110022400A1 (en) Audio resume playback device and audio resume playback method
JPH10178419A (en) Error correcting method and its device
US9514768B2 (en) Audio reproducing method, audio reproducing apparatus therefor, and information storage medium
KR100752874B1 (en) Decoding control method for audio frame
JP2002170330A (en) Pcm audio signal reproducing device
JP2006319552A (en) Multimedia reproducing device
JP2011085643A (en) Decoder, information processor and voice compression format determination method
US20080077411A1 (en) Decoder, signal processing system, and decoding method
US20060045142A1 (en) Demultiplexer
WO2012006784A1 (en) Method for searching for flash video tag in bitstream and searching apparatus thereof
JP2000152236A (en) Moving picture coder, multiplexing method, its system and recording and reproducing device
KR100632532B1 (en) Audio frame recognition method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101101

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120214

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120612