JP2001318696A - Device and method for fast feeding/listening and rewinding of compressed audio contents - Google Patents

Device and method for fast feeding/listening and rewinding of compressed audio contents

Info

Publication number
JP2001318696A
JP2001318696A JP2000376953A JP2000376953A JP2001318696A JP 2001318696 A JP2001318696 A JP 2001318696A JP 2000376953 A JP2000376953 A JP 2000376953A JP 2000376953 A JP2000376953 A JP 2000376953A JP 2001318696 A JP2001318696 A JP 2001318696A
Authority
JP
Japan
Prior art keywords
data
fast
audio
data stream
header
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2000376953A
Other languages
Japanese (ja)
Inventor
D Rueku Charles
ディ、ルエク チャールズ
C Robinson Alek
シー、ロビンソン アレク
L Laurens Jonathan
エル、ローランズ ジョナサン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Texas Instruments Inc
Original Assignee
Texas Instruments Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Texas Instruments Inc filed Critical Texas Instruments Inc
Publication of JP2001318696A publication Critical patent/JP2001318696A/en
Abandoned legal-status Critical Current

Links

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a method to execute a fast-feeding/listening or a rewinding of audio contents expressed in a compressed format. SOLUTION: Repeated skips are made for a beforehand set amount to forward or to backward a compressed audio data stream, data blocks are retrieved and these data blocks are mutally rejoined. During the decoding, these data block joints are detected, resynchronization is rapidly conducted and fast feeding/listening and rewinding are realized.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明はディジタル通信信号
を使用するための方法並びに装置に係わり、更に詳細に
は圧縮されたオーディオ内容を可聴早送りまたは巻き戻
しするための方法並びに装置に関する。
FIELD OF THE INVENTION The present invention relates to a method and apparatus for using digital communication signals, and more particularly to a method and apparatus for audibly fast-forwarding or rewinding compressed audio content.

【0002】[0002]

【従来の技術】圧縮されたオーディオ・フォーマットの
可聴早送り/巻き戻しを提供することは、その様なフォ
ーマットに関して再同期の問題があるため概して挑戦的
な課題である。図Xは典型的な圧縮されたオーディオ・
データ・ストリームのフォーマットを示す。データ・ス
トリームはフレームと呼ばれる単位に分割される。各々
のフレームは復号可能なオーディオ・データのセグメン
トを表す。各フレームの開始部にはヘッダがあり、これ
はそのデータ・ストリームに関する一般情報、例えばサ
ンプリング速度、ビット速度、プロフィールなどを含
む。ヘッダの先頭ワードは同期ワードであり、これは1
つのフレームの「開始」を同定するビット列である。
BACKGROUND OF THE INVENTION Providing audible fast-forward / rewind of compressed audio formats is generally a challenge due to the resynchronization problem associated with such formats. Figure X shows a typical compressed audio
Indicates the format of the data stream. The data stream is divided into units called frames. Each frame represents a segment of audio data that can be decoded. At the beginning of each frame is a header, which contains general information about the data stream, such as sampling rate, bit rate, profile, and the like. The first word of the header is the sync word, which is 1
A bit string that identifies the "start" of one frame.

【0003】現世代の個人用ディジタル式オーディオ・
プレーヤでは早送りおよび巻き戻し機能は無声である。
すなわち、使用者は早送り(または巻き戻し)操作中は
何も聞こえない。簡単な早送り技術は希望する早送り速
度に関連する量だけデータ・ストリーム内でジャンプし
て送り、続いてフレーム・ヘッダに基づいて再同期する
ことを含む。この再同期を行うために、1つの検索が行
われてこれはデータ・ストリームの中で同期ワードに整
合するビット列を検索する。この同期ワードが見つかる
と、復号器がフレームの構文解釈を開始できる。加え
て、巡回冗長化符号(CRC)をデータ・ストリーム内
のエラー検出に使用できる。
The current generation of personal digital audio
The fast forward and rewind functions are silent in the player.
That is, the user does not hear anything during the fast forward (or rewind) operation. A simple fast-forward technique involves jumping and sending in the data stream by an amount related to the desired fast-forward rate, followed by resynchronization based on the frame header. To perform this resynchronization, a search is performed which searches the data stream for a bit string that matches the sync word. Once this sync word is found, the decoder can begin parsing the frame. In addition, a cyclic redundancy code (CRC) can be used for detecting errors in the data stream.

【0004】しかしながら、この簡単な技術でさえもそ
れに関連して多くの実際的な問題を有する。多くの圧縮
されたオーディオ・ファイル・フォーマット、例えばM
PEG−1レイヤ3(MP3)またはMPEG−2AC
C、は多量の可変長符号を使用している。これらの可変
長符号のある許容可能なシーケンスが実際に同期ワード
を模擬することが出来る、すなわち同期ワードはユニー
クではない。この様なデータ・ストリーム内で検索する
際に「偽」同期ワードとの整合を発見してしまうことが
一般的に生じる。
[0004] However, even this simple technique has many practical problems associated with it. Many compressed audio file formats, eg M
PEG-1 Layer 3 (MP3) or MPEG-2AC
C uses a large number of variable length codes. Certain acceptable sequences of these variable length codes can actually simulate a sync word, ie, the sync word is not unique. When searching within such a data stream, it is common to find a match with a "false" sync word.

【0005】更に、CRCチェックは典型的に必要とさ
れず、従って常に送信される訳ではない。これが送信さ
れる際には、多量の構文解釈そして/または計算がその
フレームの妥当性を判定するために必要とされるはずで
ある。オーディオ転送の中には、1ビットフィールドを
使用してCRCが使用されているか否かを指示している
ものもある。このビットが0にセットされているものを
有する不完全なヘッダ(不完全な同期ワード検出のた
め)を構文解釈すると、実際CRCチェックを無効化す
るはずである。
[0005] In addition, CRC checking is typically not required and therefore is not always transmitted. When this is sent, a lot of parsing and / or computation would be needed to determine the validity of the frame. Some audio transfers use a one-bit field to indicate whether CRC is used. Parsing an incomplete header with this bit set to 0 (due to incomplete sync word detection) should actually override the CRC check.

【0006】可変長符号を使用しているので、構文解釈
の誤りが検出されずに発生し得る(従って復号/再生さ
れる)が、それはランダム雑音でさえ符号ワードの有効
シーケンスとなりうる場合があるためである。この結
果、復号器の出力が著しく歪められることになる。
[0006] Because of the use of variable length codes, parsing errors can occur undetected (and thus decoded / reproduced), but even random noise can be a valid sequence of codewords. That's why. As a result, the output of the decoder will be significantly distorted.

【0007】更に、例えばMP3に関連するオーディオ
・データ・ストリームの中には、フレームの復号を必要
とするデータが実際は同期ワードおよびヘッダの前に生
じるものもある。ヘッダ内の1つのフィールドが復号器
に対して何処にデータを探すかを伝える。このポインタ
は常に後方を指し示すはずであるが、場合によっては先
行のフレームヘッダの位置を指し示すこともある。破断
または不連続がデータ・ストリームの中で生じると、同
期は困難になるがそれはヘッダが見つかっているにも係
わらず、データが完全ではないためである。
[0007] Furthermore, in some audio data streams, such as those associated with MP3, the data that requires decoding of the frame actually occurs before the sync word and header. One field in the header tells the decoder where to look for the data. This pointer should always point backward, but in some cases may point to the location of the previous frame header. If breaks or discontinuities occur in the data stream, synchronization becomes difficult because the data is not complete despite the header being found.

【0008】階層型またはマルチプレクスされたデータ
・ストリームの同期は別の問題をもたらす。その様なデ
ータ・ストリームでは、暗号化されている外部ビット・
ストリームが内部データ・ストリームの断片をペイロー
ドとして搬送している。このマルチプレクスされたデー
タ・ストリームは外部復号器で復号され、これはペイロ
ード・データを抽出してそれを内部復号器に供給する。
データ・ストリームの継ぎ目に続いて、外部復号器/暗
号解読器は最初に同期を獲得しなければならず、内部復
号器がそれに続く。これは再同期時間および誤り耐性の
ような問題の困難さを複雑にする。
[0008] The synchronization of hierarchical or multiplexed data streams poses another problem. In such a data stream, the encrypted external bits
The stream carries fragments of the internal data stream as payload. This multiplexed data stream is decoded at the outer decoder, which extracts the payload data and provides it to the inner decoder.
Following the seam of the data stream, the outer decoder / decryptor must first acquire synchronization, followed by the inner decoder. This complicates the difficulty of problems such as resynchronization time and error resilience.

【0009】[0009]

【概要】本発明は、圧縮されたオーディオ内容の可聴早
送りまたは巻き戻しするための方法並びに装置を提供す
る。
SUMMARY The present invention provides a method and apparatus for audibly fast-forwarding or rewinding compressed audio content.

【0010】本発明は、これらに限定するわけではない
が例えば、MPEG−1レイヤ3(MP3)またはMP
EG−2高度オーディオ符号(ACC)の様な圧縮され
たフォーマットで表現されたオーディオ内容の可聴早送
り/巻き戻しを実行するための方法を提供する。早送り
制御装置が採用されており、これは格納されている圧縮
されたオーディオ・データ・ストリーム内で前方または
後方に繰り返しスキップし、データの大きな塊をリトリ
ーブし、続いてこれらのデータの大きな塊を、これらが
単一データ・ストリームとして互いにつなぎ戻されるよ
うエンド・ツー・エンド様式で格納して、早送りまたは
巻き戻しを実行する。次に復号器を使用してこれらの大
きな塊の各々を復号し、大きな塊の切換が生じたこと
(データ・ストリーム内の継ぎ)を検出し、各々の切り
替わりに際して迅速に再同期を行う。階層的またはマル
チプレクスされたデータ・ストリームは暗号解読され、
各々この技術を採用している直列復号器を用いて復号さ
れる。復号器は新奇でロバストな同期ワード検索を使用
して再同期および誤り復元を実行する。
The invention is not limited to, for example, MPEG-1 Layer 3 (MP3) or MP3.
A method is provided for performing audible fast forward / rewind of audio content represented in a compressed format such as EG-2 Advanced Audio Code (ACC). A fast-forward controller is employed, which repeatedly skips forward or backward within the stored compressed audio data stream, retrieves large chunks of data, and subsequently retrieves these large chunks of data. , Stored in an end-to-end fashion such that they are tied back together as a single data stream to perform fast forward or rewind. A decoder is then used to decode each of these large chunks to detect that a large chunk switch has occurred (a splice in the data stream) and to quickly resynchronize upon each switch. The hierarchical or multiplexed data stream is decrypted,
Each is decoded using a serial decoder employing this technique. The decoder performs resynchronization and error recovery using a novel and robust sync word search.

【0011】本発明およびその特長を更に完全に理解す
るために、添付図を参照して以下に更に詳細な説明を行
う。
For a more complete understanding of the present invention and its features, a more detailed description is given below with reference to the accompanying drawings.

【0012】[0012]

【詳細な説明】本発明は圧縮されたオーディオ内容の可
聴早送りまたは巻き戻しのための方法並びに装置を提供
する。
DETAILED DESCRIPTION The present invention provides a method and apparatus for audible fast forward or rewind of compressed audio content.

【0013】図1を参照すると、此処には例えば携帯型
オーディオ再生機の様な個別最終使用者用のディジタル
・オーディオ・ファイルを再生するためのハードウェア
・プラットフォームまたはシステム100が示されてい
る。ディジタル・オーディオ・ファイルは種々の圧縮さ
れたそして/または符号化されたフォーマットが可能で
ある。このプラットフォーム100は好適なホルダの中
に含まれていて、容易に輸送、操作および格納されたオ
ーディオ・ファイル(オーディオ内容)を置き換えられ
るようにしている。
Referring to FIG. 1, there is shown a hardware platform or system 100 for playing digital audio files for an individual end user, such as a portable audio player. Digital audio files can be in various compressed and / or encoded formats. The platform 100 is included in a suitable holder so that it can be easily transported, manipulated and replaced stored audio files (audio content).

【0014】図1から分かるように、このプラットフォ
ームはディジタル信号処理装置(DSP)110とマイ
クロ制御装置120とを含み、これらは相互接続されて
いる。典型的に、DSPは格納されたプログラム11
2,114,または116を実行し、格納されたオーデ
ィオ・データ・ファイルの復号並びに圧縮解除を行う。
マイクロ制御装置120は好適な表示器122および制
御124を提供し、使用者がこのプラットフォームを操
作出来るようにしている。マイクロ制御装置およびDS
Pはオンチップ・メモリ132,130を含み、マイク
ロ制御装置およびDSPを操作して携帯型オーディオ再
生機に対して希望する機能を提供するためのプログラム
を格納している。プラットフォーム100はまたフラッ
シュメモリ140を含み、これは好適に取り外し可能
で、ディジタル・オーディオ・データを格納する。
As can be seen from FIG. 1, the platform includes a digital signal processor (DSP) 110 and a microcontroller 120, which are interconnected. Typically, the DSP will store the stored program 11
Perform 2, 114, or 116 to decode and decompress the stored audio data file.
Microcontroller 120 provides suitable displays 122 and controls 124 to allow a user to operate the platform. Microcontroller and DS
P includes on-chip memories 132 and 130 and stores programs for operating the microcontroller and the DSP to provide desired functions to the portable audio player. Platform 100 also includes flash memory 140, which is preferably removable and stores digital audio data.

【0015】プラットフォームはバッテリー150を含
み、これは取り替え可能そして/または再充電可能であ
り、これはプラット・フォーム上のその他の装置に電力
を供給する。バッテリー150に関連して接続された電
源ブロック160が存在する。電源ブロック160はD
C/DC変換器162を含み、バッテリーの電圧をプラ
ットフォーム上の装置を動作させるのに必要な電圧に変
換する。電圧調整器164が具備されていて、選択され
た電圧を希望する調整レベルに調整する。更に、電圧監
視装置166が電源の一部として具備されており、DC
/DC変換器および電圧調整器の操作を監視し制御して
いる。説明を簡単にする目的で、図1には電源とプラッ
トフォーム100内の装置間の相互接続の全てを示して
いるわけではない。
[0015] The platform includes a battery 150, which is replaceable and / or rechargeable, which provides power to other devices on the platform. There is a power supply block 160 connected in connection with the battery 150. The power supply block 160 is D
A C / DC converter 162 is included to convert the battery voltage to the voltage required to operate the device on the platform. A voltage regulator 164 is provided to regulate the selected voltage to a desired regulation level. Further, a voltage monitoring device 166 is provided as part of the power supply,
It monitors and controls the operation of the / DC converter and voltage regulator. For simplicity, FIG. 1 does not show all of the interconnections between the power supply and the devices in platform 100.

【0016】DSPはオーディオ・ビット・ストリーム
をステレオ式ディジタル/アナログ(DAC)変換器1
70に供給し、これはディジタル信号を等価なアナログ
に変換する。電力増幅器180がDACと、信号を増幅
するために相互接続されていて、信号を例えばスピー
カ、イヤフォーン・セット、またはその他の電気信号を
可聴信号に変換するための装置のような外部装置に提供
する。
The DSP converts the audio bit stream to a stereo digital-to-analog (DAC) converter 1.
70, which converts the digital signal to an equivalent analog. A power amplifier 180 is interconnected with the DAC to amplify the signal and provides the signal to an external device such as a speaker, an earphone set, or other device for converting an electrical signal to an audible signal. I do.

【0017】好適に、DSPは復号することに加えてイ
コライゼーション、音量、音調およびバランス制御機能
185を、キーパッド124内の制御キーを具備した使
用者インタフェースの結果としてマイクロ制御装置から
の制御信号に応答して実行する。これに代わって、電力
増幅器が音量、音調およびバランス制御に関するマイク
ロ制御装置(またはDSP)からの制御信号に応答する
ことも可能である。
Preferably, the DSP, in addition to decoding, provides equalization, volume, tone and balance control functions 185 to control signals from the microcontroller as a result of a user interface with control keys in the keypad 124. Execute in response. Alternatively, the power amplifier can respond to control signals from a microcontroller (or DSP) for volume, tone and balance control.

【0018】プラットフォームは好適に、DSPのクロ
ック周波数を制御するための水晶186を含み、またマ
イクロ制御装置のクロック周波数を制御するための別の
水晶を含むことも可能である。これに代わって、DSP
がクロック信号をマイクロ制御装置に供給したりまたは
その逆も可能である。
The platform preferably includes a crystal 186 for controlling the clock frequency of the DSP, and may include another crystal for controlling the clock frequency of the microcontroller. Instead of a DSP
Supply clock signals to the microcontroller or vice versa.

【0019】フラッシュメモリ140はオーディオ・フ
ァイル、例えば最終使用者が聴くことの出来るオーディ
オ内容を含む。オーディオ・ファイルは典型的に各々の
歌毎に個別のファイルとして格納されており、これらは
限定するわけではないがMP3およびAACの様な異な
るオーディオ・フォーマットである可能性がある。フラ
ッシュメモリはまた各型式のオーディオ・フォーマット
を復号したり、同様に本発明の方法に関連するその他の
操作を制御するためのプログラム・ファイルを含む。こ
れらのファイルは典型的にそのフォーマットを示すファ
イル拡張子を付けて格納される。従って、システム制御
装置は次に使用者が再生を希望する歌のフォーマットを
認識し、DSPに関連するローカル・メモリ内に現在ロ
ードされている復号器プログラムが異なるフォーマット
であることを認識できる;続いてシステム制御装置は
「旧い」復号器用のプログラムを廃棄してDSPのロー
カル・メモリに再生を希望されるファイルのフォーマッ
ト用の復号器プログラムを再ロードする。フラッシュメ
モリ内に格納されている各々のその様なデータ・ファイ
ルに対して、オーディオ・データは典型的に隣接するメ
モリ配置の中にデータの連続シーケンスとして格納され
ている。従って、メモリ内のシーケンシャル・データ・
ストリームが復号そして/または暗号解読のためにアク
セスされてリトリーブされるが、これは対応するシーケ
ンシャル・メモリ・アドレス位置をアドレス指定し、フ
ラッシュ・メモリで採用されている特定のメモリ素子の
出力データ幅に対応するサイズのデータ・ブロックをリ
トリーブして行われる。
The flash memory 140 contains audio files, for example, audio content that can be heard by the end user. The audio files are typically stored as separate files for each song, which may be in different audio formats such as, but not limited to, MP3 and AAC. The flash memory also contains program files for decoding each type of audio format, as well as controlling other operations associated with the method of the present invention. These files are typically stored with a file extension indicating their format. Thus, the system controller can then recognize the format of the song that the user wishes to play and recognize that the decoder program currently loaded in the local memory associated with the DSP is of a different format; The system controller then discards the "old" decoder program and reloads the DSP's local memory with the decoder program for the format of the file desired to be played. For each such data file stored in flash memory, the audio data is typically stored as a continuous sequence of data in an adjacent memory arrangement. Therefore, sequential data in memory
The stream is accessed and retrieved for decryption and / or decryption, which addresses the corresponding sequential memory address location and the output data width of the particular memory element employed in the flash memory. Is performed by retrieving a data block having a size corresponding to.

【0020】外部パーソナル・コンピュータ(PC)9
0が好適にプラットフォーム100に接続される場合も
ある。この様にして、オーディオ・ファイルをメモリ1
40の中にPCから直接、またはメモリ140の中にマ
イクロ制御装置120を経由してロードすることが出来
る。これに代わって、オーディオ・ファイルをメモリ1
40の中にロードするためにPCを採用することも可能
であって、これはメモリ140がプラットフォーム10
0から取り外され、オーディオ・ファイルをメモリ14
0の中にダウンロードするためにPCに相互接続された
特別なハードウェアに挿入されて実施される。
External personal computer (PC) 9
0 may be suitably connected to the platform 100. In this way, the audio file is stored in memory 1
It can be loaded into PC 40 directly from a PC or into memory 140 via microcontroller 120. Instead, store audio files in memory 1.
It is also possible to employ a PC to load into the platform 40, where the memory 140 is
0 and the audio file is stored in memory 14
It is implemented by being inserted into special hardware interconnected to a PC for downloading into a PC.

【0021】次に図2を参照すると、本発明を図1のハ
ードウェア・プラットフォーム100の上で実現するの
に適したソフトウェア階層200の高レベルなブロック
図が示されている。更に詳細には、図2にはフラッシュ
メモリ140内に格納されているデータ・ストリーム2
05が示されている。早送り制御装置210はプログラ
ム可能アドレス発生器であって、これはデータのシーケ
ンスをメモリから一時データ・バッファ220に「通
常」プレーバック・モードで運転する際に移動させる。
早送り制御装置210は、使用者がオーディオ再生機上
の適切な早送り(または巻き戻し)操作をすると、それ
に応答して早送りモードで動作する。
Referring now to FIG. 2, there is shown a high-level block diagram of a software hierarchy 200 suitable for implementing the present invention on the hardware platform 100 of FIG. More specifically, FIG. 2 shows data stream 2 stored in flash memory 140.
05 is shown. Fast-forward controller 210 is a programmable address generator that moves a sequence of data from memory to temporary data buffer 220 when operating in "normal" playback mode.
The fast-forward control device 210 operates in the fast-forward mode in response to the user performing an appropriate fast-forward (or rewind) operation on the audio player.

【0022】早送りモードで動作中は、早送り制御装置
はシーケンシャル・データ・ストリームをデータの大き
な塊(データのブロック)に分割し、これらは時間軸で
分離される。大きな塊の間の時間間隔は希望する早送り
速度で決定される。この速度は好適にソフトウェアまた
はその他の制御信号を経由して設定または選択される。
早送り制御装置210は好適にマイクロ制御装置120
上で実行するプログラムとして実現される;尤も、明ら
かなようにこのプログラムはまたDSP110上でも実
行される。どの場合にも、早送り制御装置はデータをメ
モリから一時データ・バッファ220に移動させる。
When operating in the fast-forward mode, the fast-forward controller divides the sequential data stream into large chunks of data (blocks of data), which are separated in time. The time interval between large chunks is determined by the desired rapid traverse speed. This speed is preferably set or selected via software or other control signals.
The fast-forward control 210 is preferably a microcontroller 120
It is implemented as a program executing on the above; however, as will be apparent, this program also executes on the DSP 110. In each case, the fast-forward controller moves data from memory to temporary data buffer 220.

【0023】継ぎ目検出器および同期化ブロック230
は早送り(または巻き戻し)モードでのこれらの大きな
塊の各々の間の遷移を検出し、大きな塊の切換(例えば
データ・ストリーム内の継ぎ目)が生じるとこれを検出
し、直ちに各々の継ぎ目の後で再同期させる(例えば同
期ワードとそれに関連するヘッダを見つける)。継ぎ目
検出器および同期化ブロック230は同期を保持し、デ
ータ・ストリーム内に破断または継ぎ目が生じると常に
再同期を実施する。その様な操作実行の詳細を以下に説
明する。一度データ・ストリームが同期されると、その
データは検出器240に送られ、これはオーディオ・デ
ータを検出し出力オーディオ・データ・ストリーム25
0を提供する。
Seam detector and synchronization block 230
Detects transitions between each of these large chunks in fast-forward (or rewind) mode, detects when a large chunk switch occurs (e.g., a seam in the data stream), and immediately proceeds with each seam. Resynchronize later (eg, find sync word and its associated header). The seam detector and synchronization block 230 maintains synchronization and performs resynchronization whenever a break or seam occurs in the data stream. The details of such operation execution will be described below. Once the data stream is synchronized, the data is sent to detector 240, which detects audio data and outputs audio data stream 25.
Provide 0.

【0024】次に図3を参照すると、ここには本発明の
早送り(または巻き戻し)方法に関する簡略化された流
れ図300が示されている。更に詳細には、早送り制御
装置210はメモリ内に格納されているデータ・ストリ
ーム310内で前方(または後方)へジャンプする。デ
ータの大きなひと塊が一時バッファ220へ送られる。
早送り制御装置は再び前方へジャンプして続いて別のデ
ータの大きな塊をバッファへ送る。これが進行形式で継
続される。次に継ぎ目検出器および同期化ブロック23
0がバッファ内のデータの、少なくとも第1の大きな塊
の1部分の中で同期ワード320を検索する。同期ワー
ドが配置されていない場合は、バッファからの第1の大
きな塊230の別のデータの同期ワードが調べられる。
同期ワードが配置されている場合は、ヘッダが調べられ
て、CRCチェックが実施されているか否かが判定され
る340。CRCチェックが行われない場合は、そのデ
ータは復号器240に送られて復号される350。そう
でない場合は、CRCチェックが実行され、生成された
チェックサムに対して評価が行われる。CRCチェック
に合格すると、そのデータは復号器240で利用可能に
なりそのデータ・ファイルのオーディオ・フォーマット
に基づいて復号される350。CRCチェックに失敗す
ると、別のヘッダを見つけるために同期ワードの新たな
検索が開始される320。
Referring now to FIG. 3, there is shown a simplified flow diagram 300 for the fast forward (or rewind) method of the present invention. More specifically, the fast forward controller 210 jumps forward (or backward) within the data stream 310 stored in memory. A large chunk of data is sent to temporary buffer 220.
The fast-forward controller jumps forward again and subsequently sends another large chunk of data to the buffer. This continues in a progressive manner. Next, the seam detector and the synchronization block 23
A zero searches for the sync word 320 in at least a portion of the first large chunk of data in the buffer. If the sync word has not been placed, the sync word of another data of the first chunk 230 from the buffer is examined.
If a sync word is located, the header is examined to determine 340 whether a CRC check has been performed. If no CRC check is performed, the data is sent to decoder 240 and decoded 350. Otherwise, a CRC check is performed and the generated checksum is evaluated. If the CRC check passes, the data is made available at decoder 240 and decoded 350 based on the audio format of the data file. If the CRC check fails, a new search for a sync word is started 320 to find another header.

【0025】次に図4を参照すると、本発明の同期方法
に関する簡略化された流れ図400が示されている。更
に詳細には、図4から分かるように一時データ・バッフ
ァからのデータが最初にその同期ワードを検索または分
析される。同期ワードが検出されない場合、更にデータ
がバッファからリトリーブされて同期ワードの検索が継
続される。同期ワードが配置されていない場合は、それ
に関連するヘッダが構文解釈されていくつかの事柄が判
定される。1つの判定項目はデータ・ストリーム内の何
処に次の同期ワードが配置されているべきかである。こ
れは次にフレーム長を決定するために使用される。別の
判定がサンプリング速度、ビット速度、プロフィール、
レイヤおよび同定フィールドに対して行われる。
Referring now to FIG. 4, a simplified flowchart 400 for the synchronization method of the present invention is shown. More specifically, as can be seen from FIG. 4, data from the temporary data buffer is first searched or analyzed for its sync word. If no sync word is found, more data is retrieved from the buffer and the search for the sync word continues. If the sync word is not located, the associated header is parsed to determine some of the things. One criterion is where in the data stream the next sync word should be located. This is then used to determine the frame length. Other decisions are sampling rate, bit rate, profile,
Performed on layers and identification fields.

【0026】続いてその対応する同期ワードを経由して
次のヘッダへジャンプが行われる。続いて次のヘッダが
構文解釈され先に説明したものと同じ情報が判定され
る。次に2つのヘッダからの情報の整合性が比較され
る。この整合性比較と並行して第1ヘッダへの戻りジャ
ンプが行われる。2つのヘッダからの情報が整合してい
る場合、CRCチェックを実施する必要があるか否かの
チェックが行われる。情報が整合しない場合、データ・
ストリームからのデータが進められて、第1同期ワード
とヘッダの検索が再び開始される。同様の方法で、CR
Cチェックが実施されそのチェックサムが正しくない場
合、第1同期ワードと関連するヘッダの検索が再び開始
される。
Subsequently, a jump is made to the next header via the corresponding synchronization word. The next header is then parsed and the same information as described above is determined. Next, the consistency of the information from the two headers is compared. A return jump to the first header is performed in parallel with the consistency comparison. If the information from the two headers is consistent, a check is made as to whether a CRC check needs to be performed. If the information is inconsistent, the data
The data from the stream is advanced and the search for the first sync word and header is started again. In a similar manner, CR
If a C-check is performed and the checksum is incorrect, the search for the header associated with the first synchronization word is started again.

【0027】CRCチェックに合格した場合は、そのデ
ータが復号器に供給される。この形式の二重ヘッダ検索
は特にACCフォーマットに関連する様なフォーマット
に対して有効である。ACCフレーム・フォーマットが
図6に示されている。図6から分かるように、フレーム
は初期同期ワードを含みその直後にヘッダが続く。ヘッ
ダには次に固定長データの部分が続く。この固定長デー
タには可変長データのパケットが続いている。先に示し
たように、フレームの長さに関する情報はヘッダの中に
含まれている。
If the CRC check passes, the data is supplied to the decoder. This type of double header search is particularly useful for formats such as those associated with the ACC format. The ACC frame format is shown in FIG. As can be seen from FIG. 6, the frame contains an initial synchronization word, immediately followed by a header. The header is followed by a portion of fixed length data. This fixed-length data is followed by a packet of variable-length data. As indicated above, information about the length of the frame is included in the header.

【0028】図7はMP3オーディオ・フォーマットの
フレーム・フォーマットを図示する。ここでも同期ワー
ドの直後にヘッダが続いている。しかしながら、MP3
フォーマットに関してデータは部分的にまたは全てがヘ
ッダの「前に」存在している。図7において、ヘッダN
はその関連するデータ・パケットの「真ん中」に存在し
ている。従って、ヘッダNはそのデータが始まる場所
(main_data_begin)のポインタを有する。しかしなが
ら、ヘッダN+1が復号されるまで、何処でパケットN
のデータが終了しパケットN+1が開始するかは確かで
はない。従って、しばしば2つのヘッダを評価してパケ
ット長を決定する必要がある。図7の残りは、パケット
N+2のパケット長を決定するために3つのヘッダが復
号されなければならない状況を図示している。フレーム
が1つの同期ワードから次の同期ワードへ延長されて、
特定パケットのデータが1つまたは複数のフレームに広
がっていることを注意されたい。
FIG. 7 illustrates a frame format of the MP3 audio format. Again, a header follows immediately after the sync word. However, MP3
With respect to the format, the data is partially or completely present "before" the header. In FIG. 7, the header N
Is in the "middle" of its associated data packet. Therefore, header N has a pointer to the location where the data starts (main_data_begin). However, until the header N + 1 is decoded,
It is uncertain whether the data of this data ends and the packet N + 1 starts. Therefore, it is often necessary to evaluate two headers to determine the packet length. The remainder of FIG. 7 illustrates a situation where three headers must be decoded to determine the packet length of packet N + 2. The frame is extended from one sync word to the next sync word,
Note that the data for a particular packet is spread over one or more frames.

【0029】次に図5を参照すると、MP3フォーマッ
ト用に修正された本発明の同期方法の簡略化された流れ
図500が示されている。「totalamountMainData」は
変数であって、ヘッダおよび同期ワードの調整(削除)
後のデータ・パケットの長さを獲得するように働く。こ
れは最初に同期ワードの検索が始まる時点で零に初期化
される。同様にして、変数「mainDataThisFrame」は解
析または判定中のフレーム内のデータ長を格納してい
る。図5はヘッダおよびフレームに対するこれらの変数
を決定するステップを追加している。
Referring now to FIG. 5, there is shown a simplified flowchart 500 of the synchronization method of the present invention modified for the MP3 format. "TotalamountMainData" is a variable, which adjusts (removes) the header and sync word
Serves to capture the length of the later data packet. It is initialized to zero at the beginning of the first sync word search. Similarly, the variable “mainDataThisFrame” stores the data length in the frame being analyzed or determined. FIG. 5 adds the step of determining these variables for the header and frame.

【0030】暗号化されたオーディオ・データに対して
は、先に示したように外部層が、復号される必要のある
データの内部層に追加されている。これらの階層化され
たまたはマルチプレクスされたデータ・ストリームは、
各々がこの技術を採用している直列の復号器を用いて暗
号解除および復号される。
For encrypted audio data, an outer layer has been added to the inner layer of the data that needs to be decrypted, as indicated above. These layered or multiplexed data streams are
Each is decrypted and decrypted using a serial decoder that employs this technique.

【0031】再同期中の継ぎ目検出に関して、本発明は
後続フレーム・ヘッダの位置を正しく同定する「候補」
ヘッダ・フレームを必要とする。入力データ・ストリー
ム・データが復号器に順番に送られる一般的なケースに
対して、これら2つのヘッダの間にまたがるデータがメ
モリ内に格納される。大きな外部フレームを具備した階
層型データ・ストリームのケースでは、これは内部デー
タ・ストリームを復号するために必要なもの以上に、許
容を超えるメモリ・コストの増加を招く。加えて、デー
タ・ストリームが有限データ速度で復号器に送られるた
め、メモリが増加すると外部復号器が判定を下すまでの
遅延が増加し、これは復号されたオーディオの中で気づ
かれてしまう。本発明の更に別の特徴は、階層型データ
・ストリームのケースでのメモリ並びに遅延の増加を最
小にする方法にある。次にこの方法の詳細を説明する。
With respect to seam detection during resynchronization, the present invention provides a "candidate" that correctly identifies the location of the subsequent frame header.
Requires a header frame. For the general case where the input data stream data is sent to the decoder in turn, the data spanning between these two headers is stored in memory. In the case of a hierarchical data stream with large outer frames, this results in an unacceptable increase in memory costs beyond what is required to decode the inner data stream. In addition, as the data stream is sent to the decoder at a finite data rate, the extra memory increases the delay before the external decoder makes a decision, which is noticed in the decoded audio. Yet another feature of the present invention is a method for minimizing memory and delay increases in the case of a hierarchical data stream. Next, the details of this method will be described.

【0032】階層型またはマルチプレクスされたデータ
・ストリームに対して、最も外側の暗号化レイヤに対す
る同期ワード検索は単一の同期ワードと関連するヘッダ
検索に緩和されている。これは暗号化が弱い状況で可能
であり、すなわち暗号化されたヘッダ直後のデータは暗
号化されているが、そのフレーム内の残りのデータは暗
号されていない場合である。
For a hierarchical or multiplexed data stream, the sync word search for the outermost encryption layer is relaxed to a single sync word and associated header search. This is possible in situations where encryption is weak, i.e., the data immediately after the encrypted header is encrypted, but the remaining data in the frame is unencrypted.

【0033】本発明はソフトウェア、ハードウェアまた
はハードウェアとソフトウェアの組み合わせで実現する
ことができる。本発明並びにその特長を詳細に説明して
きたが、種々の変更、置き換えおよび代替を添付の特許
請求の範囲で定義された本発明の精神並びに範囲から逸
脱することなく行えることは理解されよう。
The present invention can be realized by software, hardware, or a combination of hardware and software. Having described the invention and its features in detail, it will be appreciated that various changes, substitutions and substitutions can be made without departing from the spirit and scope of the invention as defined in the appended claims.

【0034】以上の説明に関して更に以下の項を開示す
る。 (1)オーディオ・フォーマット・データ・ファイルに
対して可聴早送りまたは巻き戻しを提供するための方法
であって:予め選択された量だけデータ・ファイル内で
前方または後方にジャンプし、その長さが少なくともサ
ンプリング速度およびビット速度の関数であるデータの
大きな塊を取りまとめ、前記データの大きな塊を格納
し、データを具備したデータ・パケットを探しだすため
に、前記格納されたデータの大きな塊の切り替わり部を
分析し、前記データ・パケットを選択的に復号し、前記
データ・パケットを再生する、ステップを含む前記方
法。
With respect to the above description, the following items are further disclosed. (1) A method for providing audible fast-forward or rewind for an audio format data file: jumping forward or backward in the data file by a preselected amount, and its length Switching of the stored chunks of data to assemble the chunks of data that are at least a function of the sampling rate and the bit rate, store the chunks of data, and look for data packets with data. Analyzing the data packet, selectively decoding the data packet, and playing back the data packet.

【0035】(2)復号可能なデータ・パケットを決定
するための方法であって:データ・ストリームの同期ワ
ードを走査および評価し、データ位置を示す少なくとも
1つのヘッダを評価し、データに指標を付ける、ステッ
プを含む前記方法。
(2) A method for determining a decodable data packet: scanning and evaluating a synchronization word of a data stream, evaluating at least one header indicating a data position, and indicating an index on the data. Applying the method.

【0036】(3)オーディオ・フォーマット・データ
・ファイルの可聴早送りまたは巻き戻しを提供するため
の装置であって:圧縮されたオーディオ・データ・スト
リーム内で前方または後方に繰り返しスキップし、デー
タのブロックをリトリーブし、続いてこれらのデータ・
ブロックを互いに継ぎ戻すための早送り制御装置と、各
々のデータ・ブロックを復号し、ブロックの切換が発生
(データ・ストリーム内の継ぎ目)すると検出し、各々
の切り替わりで迅速に再同期を行うための復号器とを含
む、前記装置。
(3) Apparatus for providing audible fast-forward or rewind of an audio format data file: repeatedly skipping forward or backward within a compressed audio data stream, and blocks of data And then retrieve these data
A fast-forward controller for splicing blocks back together and a decoder for decoding each data block, detecting when a block switch has occurred (a seam in the data stream), and quickly resynchronizing at each switch. Said apparatus comprising: a decoder.

【0037】(4)この開示は圧縮されたフォーマッ
ト、例えばこれらに限定するわけではないが、MPEG
−1レイヤ3(MP3)またはMPEG−2高度オーデ
ィオ符号(AAC)で表現されるオーディオ内容の、可
聴早送りまたは巻き戻しを実行するための方法を記述し
ている。この技術の中で、早送り制御装置(210)が
採用されていて、これは早送りまたは巻き戻しを圧縮さ
れたオーディオ・データ・ストリームの中で前方または
後方に繰り返しスキップし、データのブロック(22
0)をリトリーブし、そしてこれらのデータ・ブロック
を互いに継ぎ戻すことを実行する。続いて復号器(24
0)を用いてこれらの各々のブロックを復号し、ブロッ
ク切換の発生(データ・ストリームの継ぎ目)を検出
し、各々の切り替わりで迅速に再同期を行う。階層化ま
たはマルチプレクスされたデータ・ストリームは、各々
がこの技術を採用している直列の復号器を用いて復号さ
れる。復号器は本発明に新奇なロバスト同期検索を用い
て再同期およびエラー復元を実施している。
(4) This disclosure is not limited to compressed formats, such as, but not limited to, MPEG
Describes a method for performing audible fast-forward or rewind of audio content expressed in a-1 layer 3 (MP3) or MPEG-2 advanced audio code (AAC). In this technique, a fast forward control (210) is employed, which skips forward or backward repeatedly in the compressed audio data stream forward or backward, and blocks blocks of data (22).
0) and perform the splicing of these data blocks back to each other. Subsequently, the decoder (24
0) is used to decode each of these blocks, to detect the occurrence of a block switch (a seam in the data stream) and to quickly resynchronize at each switch. The layered or multiplexed data stream is decoded using a serial decoder, each employing this technique. The decoder implements resynchronization and error recovery using a novel robust synchronization search in the present invention.

【図面の簡単な説明】[Brief description of the drawings]

【図1】図1は、個別の最終使用者、例えば携帯型オー
ディオ再生機用にディジタル・オーディオ・ファイルを
再生し、本発明の方法を実施することの可能なハードウ
ェア・プラットフォームのブロック図を示す。
FIG. 1 is a block diagram of a hardware platform capable of playing digital audio files and implementing the method of the present invention for an individual end user, eg, a portable audio player. Show.

【図2】図2は、図1に示された本発明のハードウェア
・プラットフォーム上で使用されるのに適したソフトウ
ェア階層の高レベル・ブロック図を示す。
FIG. 2 shows a high-level block diagram of a software hierarchy suitable for use on the hardware platform of the present invention shown in FIG.

【図3】図3は、本発明の早送り(または巻き戻し)方
法の簡略化された流れ図を示す。
FIG. 3 shows a simplified flow diagram of the fast forward (or rewind) method of the present invention.

【図4】図4は、本発明の1つの同期方法の簡略化され
た流れ図を示す。
FIG. 4 shows a simplified flow diagram of one synchronization method of the present invention.

【図5】図5は、MP3オーディオ・フォーマットに適
用される、本発明の同期方法の簡略化された流れ図を示
す。
FIG. 5 shows a simplified flowchart of the synchronization method of the present invention applied to the MP3 audio format.

【図6】図6は、AACオーディオ・フォーマット用の
フレーム構造のブロック図を示す。
FIG. 6 shows a block diagram of a frame structure for the AAC audio format.

【図7】図7は、MP3オーディオ・フォーマット用の
フレーム構造のブロック図を示す。
FIG. 7 shows a block diagram of a frame structure for the MP3 audio format.

【符号の説明】[Explanation of symbols]

90 パーソナル・コンピュータ(PC) 100 プラットフォーム 110 ディジタル信号処理装置(DSP) 112、114,116 プログラム 120 マイクロ制御装置 130、132 オンチップ・メモリ 140 フラッシュメモリ 150 バッテリー 160 電源ブロック 200 ソフトウェア階層 205 データ・ストリーム 210 早送り制御装置 220 一時データ・バッファ 230 継ぎ目検出器および同期化ブロック 240 検出器 250 出力オーディオ・データ・ストリーム 90 Personal Computer (PC) 100 Platform 110 Digital Signal Processor (DSP) 112, 114, 116 Program 120 Microcontroller 130, 132 On-Chip Memory 140 Flash Memory 150 Battery 160 Power Block 200 Software Hierarchy 205 Data Stream 210 Fast forward controller 220 Temporary data buffer 230 Seam detector and synchronization block 240 Detector 250 Output audio data stream

フロントページの続き (72)発明者 アレク シー、ロビンソン アメリカ合衆国 テキサス、ダラス、マッ コマス 5830 (72)発明者 ジョナサン エル、ローランズ アメリカ合衆国 マサチューセッツ、サマ ービル、 ウェブスター アベニュー 25 ナンバー303 Fターム(参考) 5D044 AB05 DE03 FG09 FG24 GK08 5D045 DA20 DB01 Continued on the front page (72) Inventor Alexey, Robinson United States of America Texas, Dallas, McComas 5830 (72) Inventor Jonathan Elle, Rowlands United States of America Massachusetts, Somerville, Webster Avenue 25 Number 303 F-term (reference) 5D044 AB05 DE03 FG09 FG24 GK08 5D045 DA20 DB01

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 オーディオ・フォーマット・データ・フ
ァイルの可聴早送りまたは巻き戻しを提供するための方
法であって:予め選択された量だけデータ・ファイル内
で前方または後方にジャンプし、 その長さが少なくともサンプリング速度およびビット速
度の関数であるデータの大きな塊を取りまとめ、 前記データの大きな塊を格納し、 データを具備したデータ・パケットを探しだすために、
前記格納されたデータの大きな塊の切り替わり部を分析
し、 前記データ・パケットを選択的に復号し、 前記データ・パケットを再生する、ステップを含む前記
方法。
1. A method for providing an audible fast forward or rewind of an audio format data file, comprising: jumping forward or backward in a data file by a preselected amount; To assemble a large chunk of data that is at least a function of the sampling rate and bit rate, store the large chunk of data, and find a data packet with the data:
Analyzing the stored data chunk transitions, selectively decoding the data packets, and playing back the data packets.
【請求項2】 オーディオ・フォーマット・データ・フ
ァイルの可聴早送りまたは巻き戻しを提供するための装
置であって:圧縮されたオーディオ・データ・ストリー
ム内で前方または後方に繰り返しスキップし、データの
ブロックをリトリーブし、続いてこれらのデータ・ブロ
ックを互いに継ぎ戻すための早送り制御装置と、 各々のデータ・ブロックを復号し、ブロックの切換が発
生(データ・ストリーム内の継ぎ目)すると検出し、各
々の切り替わりで迅速に再同期を行うための復号器とを
含む、前記装置。
2. Apparatus for providing audible fast forward or rewind of an audio format data file, comprising: repeatedly skipping forward or backward in a compressed audio data stream to block blocks of data. A fast-forward controller for retrieving and subsequently splicing these data blocks together, decoding each data block, detecting when a block switch occurs (a seam in the data stream), and switching each And a decoder for quick resynchronization at the same time.
JP2000376953A 1999-12-13 2000-12-12 Device and method for fast feeding/listening and rewinding of compressed audio contents Abandoned JP2001318696A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17044999P 1999-12-13 1999-12-13
US170449 1999-12-13

Publications (1)

Publication Number Publication Date
JP2001318696A true JP2001318696A (en) 2001-11-16

Family

ID=22619889

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000376953A Abandoned JP2001318696A (en) 1999-12-13 2000-12-12 Device and method for fast feeding/listening and rewinding of compressed audio contents

Country Status (1)

Country Link
JP (1) JP2001318696A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005327450A (en) * 2004-05-12 2005-11-24 Samsung Electronics Co Ltd Audio encoding method and apparatus for sound skipping protection function in audio player

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005327450A (en) * 2004-05-12 2005-11-24 Samsung Electronics Co Ltd Audio encoding method and apparatus for sound skipping protection function in audio player

Similar Documents

Publication Publication Date Title
US6721710B1 (en) Method and apparatus for audible fast-forward or reverse of compressed audio content
JP5774983B2 (en) Method and apparatus for generating, cutting or modifying a frame-based bitstream format file including at least one header section and corresponding data structure
KR100756354B1 (en) A method for playing back/storing an audio data file, and handheld audio playback apparatus
JP5902154B2 (en) Method and apparatus for searching and playing back a hierarchical bitstream having a layer structure including a base layer and at least one enhancement layer
US7363230B2 (en) Audio data processing apparatus and audio data distributing apparatus
KR100904626B1 (en) Trick play for MP3
JP5329846B2 (en) Digital data player, data processing method thereof, and recording medium
WO2002047087A1 (en) Reproduction system and reproduction method, and data transmission device and data transmission method
WO2005104549A1 (en) Method and apparatus of synchronizing caption, still picture and motion picture using location information
JP2001318696A (en) Device and method for fast feeding/listening and rewinding of compressed audio contents
Wang et al. Content-based UEP: A new scheme for packet loss recovery in music streaming
WO2009095971A1 (en) Audio resume reproduction device and audio resume reproduction method
EP3575989A1 (en) Method and device for processing multimedia data
JP2007279241A (en) Decoding processor
JP3942523B2 (en) Digital signal encoding method, decoding method, encoder, decoder, and programs thereof
KR100844194B1 (en) Method and device for decodig digital audio data, and recoded medium for performing method of decoding digital audio data
JP2004212412A (en) Compressed audio data reproducing device, and method and program for audible fast forwarding and rewinding
KR100424473B1 (en) Method for parsing audio header in mobile terminal provided multimedia service
JP2003173622A (en) Device and method for decoding coded audio data
JP4385710B2 (en) Audio signal processing apparatus and audio signal processing method
JP2005114931A (en) Apparatus and method for music data reproduction
JP2000152236A (en) Moving picture coder, multiplexing method, its system and recording and reproducing device
JP4193240B2 (en) Compressed encoded data decoding apparatus and karaoke apparatus using the same
JP2000268539A (en) Recording and editing method for variable length compressed voice data
JP2002149196A (en) Device and method for transmitting signal

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071212

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20090914