JP2010122596A - オーディオ信号再生装置及び方法、並びにプログラム - Google Patents

オーディオ信号再生装置及び方法、並びにプログラム Download PDF

Info

Publication number
JP2010122596A
JP2010122596A JP2008298030A JP2008298030A JP2010122596A JP 2010122596 A JP2010122596 A JP 2010122596A JP 2008298030 A JP2008298030 A JP 2008298030A JP 2008298030 A JP2008298030 A JP 2008298030A JP 2010122596 A JP2010122596 A JP 2010122596A
Authority
JP
Japan
Prior art keywords
frame
information table
frame information
address
reproduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008298030A
Other languages
English (en)
Other versions
JP4591594B2 (ja
Inventor
Yuki Kawaguchi
勇輝 川口
Yukihiko Mogi
幸彦 茂木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2008298030A priority Critical patent/JP4591594B2/ja
Priority to US12/619,843 priority patent/US20100131088A1/en
Priority to CN2009102239158A priority patent/CN101740075B/zh
Publication of JP2010122596A publication Critical patent/JP2010122596A/ja
Application granted granted Critical
Publication of JP4591594B2 publication Critical patent/JP4591594B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/005Reproducing at a different information rate from the information rate of recording
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • G11B2020/00028Advanced audio coding [AAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】早送り/早戻し等の特殊再生を簡易な構成で迅速に処理する。
【解決手段】アドレス位置情報テーブル12は、フレーム情報テーブル13のエントリ番号と先頭位置アドレスとをフレーム番号に対応付けて格納する。信号再生部20は、特殊再生時にアドレス位置情報テーブル12を参照し、特殊再生で指定されたフレーム番号のフレーム情報がフレーム情報テーブル13に格納されている場合、当該フレーム情報をフレーム情報テーブル13から取得して再生信号を生成する。
【選択図】図1

Description

本発明は、ヘッダ情報にフレーム長の情報を持たないフォーマットで記録された圧縮オーディオ信号の再生における早送り/早戻し処理を可能にするオーディオ信号再生装置及び方法、並びにプログラムに関する。
オーディオ信号を符号化する方法として、MPEG(Moving Picture Expert Group)オーディオ規格がある。MPEGオーディオ規格には複数の方式がある。例えば、ISO/IEC 13818−7にて、MPEG−2オーディオ規格AAC(Advanced Audio Coding)という方式が標準化されている。さらに、拡張されたISO/IEC 14496−3にて、MPEG−4オーディオ規格AAC(Advanced Audio Coding)という方式が標準化されている。以下、MPEG−2オーディオ規格AACとMPEG−4オーディオ規格AACを合わせてAAC規格と呼ぶ。
図7は、AAC規格に準拠した復号化装置の構成を示すブロック図である。図7において、ビットストリーム情報解析部101は、入力されたビットストリームを解析する。そして、ハフマン復号化部102、M/Sステレオ部(Middle Side Stereo)113、インテンシティ/カップリング部115、TNS処理部116、IMDCT部117及びゲイン制御部118へ渡す情報を作成する。
ハフマン復号化部102は、ビットストリーム情報解析部101より受け取った情報に基づきハフマン復号処理を行い、量子化されたスペクトルデータ及びスケールファクタ情報を得る。また、この時点で入力ビットストリームにおける次フレームの先頭位置アドレスが判明する。
逆量子化部111は、ハフマン復号化部102より受け取った量子化されたスペクトルデータを受け取って逆量子化を行い、逆量子化後のスペクトルデータを得る。正規化部112は、逆量子化後のスペクトルデータをスケールファクタに従って正規化し、正規化されたスペクトルデータを得る。
M/Sステレオ部113及びインテンシティ/カップリング部115は、ステレオ相関符号化処理を行われたデータを復元する処理を行う。予測部114は、予測符号化を行う。TNS(Temporal Noise Shaping)処理部116は、量子化ノイズの時間的制御を施されたスペクトルデータを元に戻す。IMDCT(Inverse Modified Discrete Cosine Transform)部117は、周波数領域のスペクトルデータを時間領域の波形データに変換する。ゲイン制御部118は、SSRプロファイルのみに使用され、4つの等間隔の帯域に分割された信号を元に戻す処理を行う。
これらの一連の処理を通じて復号化されたPCMデータを出力する。
なお、AAC規格の復号化処理において、ハフマン復号化部102がハフマン復号処理を行い、量子化されたスペクトルデータ及びスケールファクタ情報を得てから、入力ビットストリームにおける次フレームの先頭位置アドレスが判明するまでの処理をビットストリームパース処理と呼ぶことにする。またビットストリームパース処理を行うブロックをまとめてビットストリームパース部100と呼ぶことにする。
また、このビットストリームパース処理によって生成される量子化されたスペクトルデータと、スケールファクタ情報データと、M/Sステレオ部113、インテンシティ/カップリング部115、TNS処理部116、IMDCT部117及びゲイン制御部118へ渡す情報とをまとめてフレーム情報と呼ぶことにする。
また、フレーム情報を受け取って逆量子化部111からゲイン制御部118までが行う、逆量子化からPCM出力までの処理をビットストリームデコード処理と呼ぶことにする。またビットストリームデコード処理を行うブロックをまとめてビットストリームデコード部110と呼ぶことにする。
このビットストリームデコード処理とビットストリームパース処理の処理時間の比はおよそ7:3〜6:4である。
AAC規格を含む多くの圧縮オーディオデータはフレームに区分されたデータ構造を有し、それぞれのフレームにはヘッダ情報と圧縮オーディオ信号データ本体が含まれる。
AAC規格のフォーマットには、ADIF(Audio Data Interchange Format)ヘッダを持つADIFフォーマットと、ADTS(Audio Data Transport Stream)ヘッダを持つADTSフォーマットと、ヘッダを持たないRaw Dataとの3種類が存在する。いずれのフォーマットも1フレームの長さは可変となっている。
このうち、ADTSフォーマットは、ヘッダ情報にフレーム長の情報を含んでいるため、各フレームのヘッダ情報のみを取得し、解析を行うことによって、例えば特許文献1のような方法を用いて高速に早送り/早戻し処理を行うことができる。
しかし、ADIFフォーマットのヘッダ情報には、各フレームのフレーム長に関する情報が含まれていない。そのため、あるフレームのヘッダ情報のみを取得、解析するだけでは次のフレームの先頭位置アドレスを取得することができず、1フレーム全体のビットストリームパース処理が終了した時点で初めて次のフレームの先頭位置アドレスが判明する。
したがって、早送り/早戻し処理を行う場合には、ヘッダ情報のみでなく、フレーム全体のビットストリームパース処理を行う必要があり、高速な早送り/早戻し処理を行うことができない。
また、ヘッダを持たないRaw Dataの場合も当然1フレーム全体のビットストリームパース処理が終了するまで次のフレームの先頭位置アドレスが分からないため、高速な早送り、早戻しを行うことができない。
特許文献2には、フレーム長情報がヘッダ情報に含まれない圧縮オーディオ信号を再生するための装置が開示されている。特許文献2に開示された装置では、ヘッダ情報にフレーム長情報を持たない圧縮オーディオ信号を早送り/早戻し処理を高速に行う。このため、圧縮オーディオ信号の初回再生時に再生フレームのフレーム番号及びフレームの先頭位置アドレスをフレーム位置情報としてフレーム位置情報テーブルに保持する。そして、2回目以降の再生処理中に早送り/早戻し指示があった場合には、フレーム位置情報テーブルを参照して、早送り/早戻し先フレームの読み込み開始アドレスを決定する。
しかし、この特許文献2による早送り/早戻し方法では、一度も再生していない圧縮オーディオ信号の場合はフレーム位置情報がフレーム位置情報テーブルに保持されていないため、高速な早送り/早戻しが実現できない。
これを解決する手段として特許文献3に示される装置がある。特許文献3に開示された装置では、フレーム長をヘッダ情報として持たないフレーム構造を有する圧縮オーディオ信号の再生処理に平行して次の処理を行う。先ず、再生処理を行っているフレームより後に再生されるフレームのフレーム位置情報を取得してフレーム位置情報テーブルに格納する位置情報取得処理を行う。そして、早送り命令があった場合は、前記フレーム位置情報テーブルに格納されたフレーム位置情報に基づいて早送り先のフレーム位置を決定している。
図8を用いて、特許文献3に記載された従来の圧縮オーディオ信号再生装置を用いた早送り/早戻し処理について簡単に説明する。
この装置は、信号再生部200と、位置情報取得部210と、フレーム位置情報テーブル220とからなる。これら信号再生部200と位置情報取得部210とは、並行に動作する。
位置情報取得部210は、ビットストリームパース部211によってビットストリーム入力を読み込んでストリームパース処理を行い、フレームの先頭位置だけを次々と取得してフレーム位置情報テーブルに格納していく。
早送り/早戻し命令が信号再生部200の読み込み開始アドレス決定部201に渡されると、読み込み開始アドレス決定部201は、フレーム位置情報テーブル220を参照する。そして、早送り/早戻し先のフレームに対する先頭位置アドレスを読み込み開始アドレスとして取得し、ビットストリームパース部202へ読み込み開始アドレスを通知する。
信号再生部200のビットストリームパース部202は、読み込み開始アドレスにしたがってビットストリーム入力を取得してビットストリームパース処理を行う。ビットストリームデコード部203は、ビットストリームパース部202にて生成したフレーム情報を受け取り、ビットストリームデコード処理を行い、PCM信号を出力する。
しかし、この特許文献3の再生装置は、信号再生部200と位置情報取得部210とがそれぞれ別のビットストリームパース部を持つ必要があり、回路構成が冗長であった。また、位置情報取得部210が、ビットストリームパース処理をした後のフレームのフレーム情報を保持する機構を有していない。このため、信号再生部200は、フレームの先頭位置アドレス情報をフレーム位置情報テーブル220から取得した後、再度再生フレームのビットストリームパース処理を行わなくてはならない。
特開2003−6992号公報 特開2002−41095号公報 特開2006−178179号公報
上述したように、従来の再生装置では、フレーム長情報がヘッダ情報に含まれない圧縮オーディオ信号データに対して早送り/早戻し等の特殊再生を行うのに、回路構成が冗長となったり、信号処理が煩雑になったりしていた。
本発明は、これらの問題点を鑑みてなされたものであり、早送り/早戻し等の特殊再生を簡易な構成で迅速に処理するオーディオ信号再生装置及び方法、並びにプログラムを提供する。
上述した課題を解決するために、本発明に係るオーディオ信号再生装置は、ヘッダ情報にフレーム長の情報を持たないフォーマットで記録された圧縮オーディオ信号をフレーム毎にビットストリームパース処理し、フレーム情報を生成し、次のフレームの先頭位置アドレスを解析するビットストリームパース部と、上記フレーム情報をエントリ番号に対応付けて格納するフレーム情報テーブルと、上記フレーム情報テーブルのエントリ番号と上記先頭位置アドレスとをフレーム番号に対応付けて格納するアドレス位置情報テーブルと、上記フレーム情報テーブルに格納されたフレーム情報に基づいて再生信号を生成する信号再生部とを備え、上記信号再生部は、特殊再生時に上記アドレス位置情報テーブルを参照し、上記特殊再生で指定されたフレーム番号のフレーム情報が上記フレーム情報テーブルに格納されている場合、当該フレーム情報を上記フレーム情報テーブルから取得する。
また、本発明に係るオーディオ信号再生方法は、ヘッダ情報にフレーム長の情報を持たないフォーマットで記録された圧縮オーディオ信号をフレーム毎にビットストリームパース処理し、フレーム情報を生成し、フレーム情報テーブルに上記フレーム情報をエントリ番号に対応付けて格納し、次のフレームの先頭位置アドレスを解析し、アドレス位置情報テーブルに上記フレーム情報テーブルのエントリ番号と上記先頭位置アドレスとをフレーム番号に対応付けて格納し、特殊再生時に上記アドレス位置情報テーブルを参照し、上記特殊再生で指定されたフレーム番号のフレーム情報が上記フレーム情報テーブルに格納されている場合、当該フレーム情報を上記フレーム情報テーブルから取得し、再生信号を生成する。
また、プログラムは、ヘッダ情報にフレーム長の情報を持たないフォーマットで記録された圧縮オーディオ信号をフレーム毎にビットストリームパース処理し、フレーム情報を生成し、フレーム情報テーブルに上記フレーム情報をエントリ番号に対応付けて格納し、次のフレームの先頭位置アドレスを解析し、アドレス位置情報テーブルに上記フレーム情報テーブルのエントリ番号と上記先頭位置アドレスとをフレーム番号に対応付けて格納し、特殊再生時に上記アドレス位置情報テーブルを参照し、上記特殊再生で指定されたフレーム番号のフレーム情報が上記フレーム情報テーブルに格納されている場合、当該フレーム情報を上記フレーム情報テーブルから取得し、再生信号を生成する処理を情報処理装置に実行させる。
本発明は、特殊再生時にアドレス位置情報テーブルを参照し、特殊再生で指定されたフレーム番号のフレーム情報がフレーム情報テーブルに格納されている場合、当該フレーム情報をフレーム情報テーブルから取得し、再生信号を生成する。これにより、従来では2つ必要であったビットストリームパース部を1つに削減することができる。また、フレーム情報テーブルに格納されたフレーム情報を有効利用することが可能となり、早送り/早戻し等の特殊再生を簡易な構成で迅速に処理することができる。
以下、本発明の具体的な実施の形態について、図面を参照しながら詳細に説明する。ここでは、以下の順番で説明を行う。
1.全体構成 図1
2.アドレス位置情報テーブル及びフレーム情報テーブル 図2〜図4
3.早送り/早戻し再生処理 図5
4.変形例 図6
[全体構成]
本発明の具体例と示すオーディオ信号再生装置は、ヘッダ情報にフレーム長の情報を持たないフォーマットで記録された圧縮オーディオ信号に対して早送り/早戻し等の特殊再生を行うものである。ヘッダ情報にフレーム長の情報を持たないフォーマット例として、AAC(Advanced Audio Coding)規格のADIF(Audio Data Interchange Format)、Raw Data等を挙げることができる。
図1は、本実施の形態における再生装置の構成を示すブロック図である。この再生装置は、ビットストリームパース部11と、アドレス位置情報テーブルと12、フレーム情報テーブル13と、信号再生部20とを備え、信号再生部20とビットストリームパース部11とは並行に動作する。また、信号再生部20とビットストリームパース部11との処理時間の比は、およそ7:3〜6:4である。また、信号再生部20は、再生開始フレーム決定部21と、ビットストリームデコード部22とを備えている。なお、ビットストリームパース部11及びビットストリームデコード部22は、それぞれ図7に示すビットストリームパース部100及びビットストリームデコード部110に該当する。
ビットストリームパース部11は、圧縮された入力ビットストリームをフレーム毎にビットストリームパース処理し、判明したフレーム先頭位置アドレスをアドレス位置情報テーブル12に保存する。同時に、フレーム情報テーブル13に空きがある場合は、ビットストリームパース処理によって得られたフレーム情報をフレーム情報テーブル13に保存する。
アドレス位置情報テーブル12には、フレーム情報テーブル13のエントリ番号とフレーム先頭位置アドレスとがフレーム番号に対応付けられて格納される。また、フレーム情報テーブル13には、フレーム情報がエントリ番号に対応付けられて格納される。ここで、フレーム先頭位置アドレスは、入力されたフレームのデータの先頭位置を示す記録元の情報である。また、フレーム情報は、図7において、ビットストリームパース処理によって生成される量子化されたスペクトルデータと、スケールファクタ情報データと、M/Sステレオ部113、インテンシティ/カップリング部115、TNS処理部116、IMDCT部117及びゲイン制御部118へ渡す情報とをまとめて呼ぶものである。
再生開始フレーム決定部21は、通常再生を行う場合には次のフレームの番号を決定し、早送り、早戻しの特殊再生の際にはジャンプ先のフレーム番号を決定する。また、早送り、早戻しだけでなく、例えばデータの途中にあるフレームから再生を開始したい場合などには、再生開始フレーム決定部21は、頭出し再生開始位置を指定してフレーム番号を決定する。
再生開始フレーム決定部21は、再生するフレーム番号を決定した後、アドレス位置情報テーブル12を確認して決定したフレーム番号のデータがあるかどうかを確認する。具体的には、アドレス位置情報テーブル12に決定したフレーム番号のフレーム先頭位置アドレスが存在するか否かを判別する。アドレス位置情報テーブル12に決定したフレーム番号のデータが存在しないとき、ビットストリームパース部11が再生開始フレームのフレーム先頭位置アドレスを取得するまでビットストリームパース処理し続けるように命令を送る。ビットストリームパース部11が再生開始のフレームをビットストリームパース処理すると、フレーム情報テーブル13にフレーム情報が書き出され、アドレス位置情報テーブル12が更新される。
アドレス位置情報テーブル12に決定されたフレーム番号のデータがある場合は、当該データの内容を参照して、フレーム情報テーブル13にフレーム情報が存在するか否かを確認する。フレーム情報が存在する場合には、再生開始フレーム決定部21は、ビットストリームデコード部22にフレーム情報テーブルエントリ番号を通知する。フレーム情報テーブル13に決定されたフレーム番号のフレーム情報が存在しない場合、再生開始フレーム決定部21は、ビットストリームパース部11に対してアドレス位置情報テーブル12に記録されたフレーム先頭位置アドレスを通知する。そして、ビットストリームパース部11にビットストリームパース処理を開始させる。なお、フレーム情報テーブル13の1エントリ分のサイズは、実装にもよるが、AAC規格の圧縮オーディオ信号再生装置で5.1chデータを再生させるケースでは36kB程度である。
ビットストリームデコード部22は、再生開始フレーム決定部21からフレーム情報テーブル13のエントリ番号を受け取り、受け取ったエントリ番号に基づいてフレーム情報テーブル13からフレーム情報を取得する。そして、ビットストリームデコード部22は、取得したフレーム情報に基づいてデコードを開始し、PCM信号を出力する。
このように本実施の形態では、フレーム先頭位置アドレスをアドレス位置情報テーブル12に保存するだけでなく、ビットストリームパース部11がビットストリームパース処理した後のフレーム情報もフレーム情報テーブル13に同時に保存する。そして、ビットストリームデコード部22は、フレーム情報テーブル13に保存されたフレーム情報を利用してPCM信号を生成する。
すなわち、本実施の形態の再生装置によれば、再度ビットストリームパース処理を行うためにビットストリームパース部を2つ用意する必要がなく、回路構成を簡略化することができる。
一方、従来の再生装置は、図8に示すようにビットストリームパース処理をした後のフレーム情報を保持するための手段を備えていないため、ビットストリームパース処理によって得たフレーム情報が捨てられる。このため、従来の信号再生部は、フレーム先頭位置アドレス情報を元にビットストリームパース処理を行う前のデータを改めて取得する必要があり、再度ビットストリームパース処理を行うためにビットストリームパース部を2つ用意する必要があった。また、従来の再生装置の再生処理をプログラムとして記述し、CPUを1つだけ用いて実現するような場合においては、信号再生部200の処理と位置情報取得部210の処理を直列的に行う必要があった。したがって、従来の再生装置では、冗長なビットストリームパース処理が、そのまま実行サイクル数の増加や消費電力の増加につながっていた。
[アドレス位置情報テーブル及びフレーム情報テーブル]
次に、アドレス位置情報テーブル12及びフレーム情報テーブル13について説明する。図2は、アドレス位置情報テーブルの一例を示す図である。このアドレス位置情報テーブル12は、フレーム毎にフィールドとして、フレーム番号、フレーム先頭位置アドレス、フレーム情報テーブルエントリ番号を有し、フレーム情報テーブルエントリ番号とフレーム先頭位置アドレスとをフレーム番号に対応付けて保持する。ここで、フレーム番号は、圧縮オーディオ信号の各フレームに対応する番号である。また、フレーム先頭位置アドレスは、圧縮オーディオ信号のフレームの記録元の先頭位置である。また、フレーム情報テーブルエントリ番号は、フレーム情報テーブル13の記録位置を示す番号である。
また、図3に示すように、フレーム情報テーブルエントリ番号のフィールドをフレーム情報テーブル有効判定フラグとしても用いることが好ましい。これにより、信号再生部20は、フレーム情報テーブル13を確認しなくてもフレーム情報の有無を容易に判別することができる。
図4は、フレーム情報テーブルの一例を示す図である。フレーム情報テーブル13は、フレーム毎にフィールドとして、エントリ番号、フレーム情報を有し、フレーム情報をエントリ番号に対応付けて保持する。
[早送り/早戻し再生処理]
続いて、図5を用いて本発明を適用させた早送り/早戻し再生処理について説明する。ここでは、再生装置が図3に示すアドレス位置情報テーブル及び図4に示すフレーム情報テーブルを備えることとして説明する。
信号再生部20が備える再生開始フレーム決定部21は、早送り、早戻し命令を受信するとアドレス位置情報テーブル12を参照してジャンプ先のフレーム番号を決定する。
ステップS01において、再生開始フレーム決定部21は、アドレス位置情報テーブル12にジャンプ先のフレーム番号のフレーム情報エントリ番号がある否かを確認する。ここで、アドレス位置情報テーブル12にジャンプ先のフレーム情報テーブルエントリ番号が存在しない場合ステップS02に進み、ジャンプ先のフレーム情報テーブルエントリ番号が存在する場合ステップS07に進む。
ステップS02において、ビットストリームパース部11は、ビットストリームパース処理がジャンプ先のフレーム番号のフレームか否かを判別する。ジャンプ先のフレーム番号のフレームではない場合ステップS03に進み、ジャンプ先のフレーム番号のフレームの場合ステップS05に進む。
ステップS03において、ビットストリームパース部11は、ジャンプ先のフレーム番号ではないフレームのビットストリームパース処理を行う。
ステップS04において、ビットストリームパース部11は、次のフレームのフレーム先頭位置アドレスを解析し、このフレーム先頭位置アドレスをフレーム番号と対応付けてアドレス位置情報テーブル12へ格納してアドレス位置情報テーブル12を更新する。
ステップS05において、ビットストリームパース部11は、ジャンプ先のフレーム番号のフレームのビットストリームパース処理を行う。そして、パース結果であるフレーム情報をフレーム情報テーブル13にフレーム情報をエントリ番号に対応付けて格納し、フレーム情報テーブル13を更新する。
ステップS06において、ビットストリームパース部11は、次のフレームの先頭位置アドレスを解析し、このフレーム先頭位置アドレスをフレーム番号と対応付けてアドレス位置情報テーブル12へ格納してアドレス位置情報テーブル12を更新する。ここで、ジャンプ先のフレーム番号の情報テーブル有効判定フラグのフィールドを有効(オン)にする。アドレス位置情報テーブル12の更新が終了した場合、ステップS12に進む。
すなわち、ステップS02〜ステップS06において、ビットストリームパース部11は、再生開始フレーム決定部21によって指定されたフレーム番号までビットストリームパース処理し、次のフレーム番号のフレーム先頭位置アドレスまでを解析する。そして、アドレス位置情報テーブル12及びフレーム情報テーブル13を更新する。
ステップS07において、再生開始フレーム決定部21は、アドレス位置情報テーブル12を参照し、ジャンプ先のフレーム番号のフレーム情報テーブル有効判定フラグのフィールド内容を確認する。これによりアドレス位置情報テーブル12にフレーム情報が格納されているかを判別する。ジャンプ先のフレーム番号のフレーム情報が格納されていない場合ステップS08に進む。ここで、フレーム情報テーブル有効判定フラグが無効であった場合は、ジャンプ先のフレームの先頭位置アドレスは判明しているがフレーム情報テーブル13にフレーム情報がない状態である。また、ジャンプ先のフレーム番号のフレーム情報が格納されている場合ステップS12に進む。この場合、フレーム情報データがフレーム情報テーブル13に格納された時間分だけ高速化することができる。
ステップS08において、再生開始フレーム決定部21は、アドレス位置情報テーブル12からジャンプ先のフレーム先頭位置アドレスを読み出してビットストリームパース部11へ通知する。
ステップS09において、ビットストリームパース部11は、再生開始フレーム決定部21から通知されたフレーム先頭位置アドレスに基づいて記録元からジャンプ先のフレームを読み込み、ビットストリームパース処理を開始する。
ステップS10において、ビットストリームパース部11は、ビットストリームパース処理してパース結果であるフレーム情報を生成し、フレーム情報テーブル13にフレーム情報をエントリ番号に対応付けて格納し、フレーム情報テーブル13を更新する。
ステップS11において、ビットストリームパース部11は、次のフレームの先頭位置アドレスをフレーム番号と対応付けてアドレス位置情報テーブル12へ格納してアドレス位置情報テーブル12を更新する。ここで、ジャンプ先のフレーム番号のフレーム情報テーブル有効判定フラグのフィールドを有効(オン)にする。
ステップS12において、再生開始フレーム決定部21は、ジャンプ先のフレームのフレーム情報テーブルエントリ番号をアドレス位置情報テーブル12から読み出してビットストリームデコード部22に通知する。すなわち、ステップS12では、ジャンプ先のフレームのフレーム情報がフレーム情報テーブル13に保持された状態にある。
ステップS13において、ビットストリームデコード部22は、再生開始フレーム決定部21から受け取ったエントリ番号に基づいて、フレーム情報テーブル23からジャンプ先のフレーム情報を取得してデコードを開始し、PCM信号を出力する。
ステップS14において、ビットストリームデコード部22は、ジャンプ先のフレームのビットストリームデコード処理が終了すると、そのフレーム番号のフレーム情報テーブル有効判定フラグを無効にし、アドレス位置情報テーブル12を更新する。
ステップS15において、ビットストリームデコード部22は、フレーム情報テーブル13のジャンプ先のフレーム情報を消去してビットストリームパース部11がその場所にフレーム情報を書き込めるようにする。
このように圧縮オーディオ信号再生装置における早送り等の特殊再生において、ビットストリームパース部が細分化したフレームのビット情報をそのまま信号再生部20が有効利用できる。このため、従来では2つ必要だったビットストリームパース部を1つに削減し、冗長な回路を削減することができる。
なお、ステップS08において、再生開始フレーム決定部21がジャンプ先のフレーム番号をビットストリームパース部11へ通知してもよい。そして、ステップS09において、ビットストリームパース部11が通知されたフレーム番号に基づいて対応する先頭位置アドレスをアドレス位置情報テーブル12より取得して圧縮オーディオ信号を読み込んでもよい。
[変形例]
図6は、フレーム情報テーブルの変形例を示す図である。このフレーム情報テーブル13は、フィールドとしてエントリ毎にエントリ有効判定フラグが用意されている。このエントリ有効判定フラグは、信号再生部20のビットストリームデコード処理が終了した際、無効にされ、ビットストリームパース部11は、エントリ有効判定フラグが無効になっているエントリ番号の領域へデータを次々上書きする。このようにビットストリームパース部11は、エントリ有効判定フラグの内容を参照して書き込み可能であるかどうか判定して上書きするため、消去にかかる時間を省略し、フレーム情報テーブル13の更新を高速に行うことができる。
また、上述の実施の形態では、AACフォーマットの圧縮オーディオ信号再生について説明してきたが、この手法は、次の2つ処理に分けることが可能な圧縮オーディオ信号再生処理であれば適用することができる。第1の処理は、再生処理の全体を圧縮オーディオ信号の情報を解析して1フレームの長さを決定し、情報をパースする処理であり、第2の処理は、パースした情報を用いて最終出力信号を生成する処理である。本手法は、これら2つの処理により、ヘッダ情報にフレーム長を持たないフォーマットの圧縮オーディオ信号再生時における早送り/早戻し、及び頭出し再生処理を可能にする。
また、コンピュータ装置等を用いて上述した圧縮オーディオ信号の再生装置を構成する場合、CPU(Central Processing Unit)やDSP(Digital Signal Processor)が実行するプログラムで構成することができる。この場合、プログラムの実行に必要な総サイクル数を23.1〜28.6%削減することができる。また、実行するCPUやDSPにスリープ機能など、演算を行っていない間の電力供給をストップする機構がある場合、実行に必要な総サイクル数の少ない本法を用いることで、消費電力を低く抑えることが可能になる。
本実施の形態における再生装置の構成を示すブロック図である。 アドレス位置情報テーブルの一例を示す図である。 アドレス位置情報テーブルの他の例を示す図である。 フレーム情報テーブルの一例を示す図である。 早送り/早戻し時の1フレーム分の圧縮データの再生処理を示すフローチャートである。 フレーム情報テーブルの変形例を示す図である。 AAC規格に準拠した復号化装置の構成を示すブロック図である。 従来の圧縮オーディオ信号再生装置の構成を示すブロック図である。
符号の説明
11 ビットストリームパース部、 12 アドレス位置情報テーブル、 13 フレーム情報テーブル、 20 信号再生部、 21 再生開始フレーム決定部、 22 ビットストリームデコード部、 23 フレーム情報テーブル、 100 ビットストリームパース部、 101 ビットストリーム情報解析部、 102 ハフマン復号化部、 110 ビットストリームデコード部、 111 逆量子化部、 112 正規化部、 113 M/Sステレオ部、 114 予測部、 115 インテンシティ/カップリング部、 116 TNS処理部、 117 IMDCT部、 118 ゲイン制御部、 200 信号再生部、 201 開始アドレス決定部、 202 ビットストリームパース部、 203 ビットストリームデコード部、 210 位置情報取得部、 211 ビットストリームパース部、 220 フレーム位置情報テーブル

Claims (6)

  1. ヘッダ情報にフレーム長の情報を持たないフォーマットで記録された圧縮オーディオ信号をフレーム毎にビットストリームパース処理し、フレーム情報を生成し、次のフレームの先頭位置アドレスを解析するビットストリームパース部と、
    上記フレーム情報をエントリ番号に対応付けて格納するフレーム情報テーブルと、
    上記フレーム情報テーブルのエントリ番号と上記先頭位置アドレスとをフレーム番号に対応付けて格納するアドレス位置情報テーブルと、
    上記フレーム情報テーブルに格納されたフレーム情報に基づいて再生信号を生成する信号再生部とを備え、
    上記信号再生部は、特殊再生時に上記アドレス位置情報テーブルを参照し、上記特殊再生で指定されたフレーム番号のフレーム情報が上記フレーム情報テーブルに格納されている場合、当該フレーム情報を上記フレーム情報テーブルから取得するオーディオ信号再生装置。
  2. 上記信号再生部は、上記特殊再生で指定されたフレーム番号のフレーム情報が上記フレーム情報テーブルに格納されていない場合、上記ビットストリームパース部に上記特殊再生で指定されたフレーム番号を通知し、
    上記ビットストリームパース部は、上記通知されたフレーム番号に基づいて対応する先頭位置アドレスをアドレス位置情報テーブルより取得して圧縮オーディオ信号を読み込む請求項1記載のオーディオ信号再生装置。
  3. 上記アドレス位置情報テーブルは、上記エントリ番号に対応するフレーム情報の有効無効判定フラグをフレーム番号に対応付けて格納し、
    上記信号再生部は、上記有効無効判定フラグに応じて上記特殊再生で指定されたフレーム番号のフレーム情報が上記フレーム情報テーブルに格納されているか否かを判別し、上記再生信号の生成が終了すると、上記有効無効判定フラグを無効とする請求項2記載のオーディオ信号再生装置。
  4. 上記フレーム情報テーブルは、上記エントリ番号毎にフレーム情報の有効無効判定フラグを格納し、
    上記信号再生部は、上記再生信号の生成が終了すると、上記有効無効判定フラグを無効とし、
    上記ビットストリームパース部は、上記有効無効判定フラグが無効のエントリ番号の領域を上書きする請求項2記載のオーディオ信号再生装置。
  5. ヘッダ情報にフレーム長の情報を持たないフォーマットで記録された圧縮オーディオ信号をフレーム毎にビットストリームパース処理し、
    フレーム情報を生成し、フレーム情報テーブルに上記フレーム情報をエントリ番号に対応付けて格納し、
    次のフレームの先頭位置アドレスを解析し、アドレス位置情報テーブルに上記フレーム情報テーブルのエントリ番号と上記先頭位置アドレスとをフレーム番号に対応付けて格納し、
    特殊再生時に上記アドレス位置情報テーブルを参照し、上記特殊再生で指定されたフレーム番号のフレーム情報が上記フレーム情報テーブルに格納されている場合、当該フレーム情報を上記フレーム情報テーブルから取得し、再生信号を生成するオーディオ信号再生方法。
  6. ヘッダ情報にフレーム長の情報を持たないフォーマットで記録された圧縮オーディオ信号をフレーム毎にビットストリームパース処理し、
    フレーム情報を生成し、フレーム情報テーブルに上記フレーム情報をエントリ番号に対応付けて格納し、
    次のフレームの先頭位置アドレスを解析し、アドレス位置情報テーブルに上記フレーム情報テーブルのエントリ番号と上記先頭位置アドレスとをフレーム番号に対応付けて格納し、
    特殊再生時に上記アドレス位置情報テーブルを参照し、上記特殊再生で指定されたフレーム番号のフレーム情報が上記フレーム情報テーブルに格納されている場合、当該フレーム情報を上記フレーム情報テーブルから取得し、再生信号を生成する
    処理を情報処理装置に実行させるプログラム。
JP2008298030A 2008-11-21 2008-11-21 オーディオ信号再生装置及び方法、並びにプログラム Expired - Fee Related JP4591594B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2008298030A JP4591594B2 (ja) 2008-11-21 2008-11-21 オーディオ信号再生装置及び方法、並びにプログラム
US12/619,843 US20100131088A1 (en) 2008-11-21 2009-11-17 Audio signal playback apparatus, method, and program
CN2009102239158A CN101740075B (zh) 2008-11-21 2009-11-19 音频信号播放装置、音频信号播放方法和程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008298030A JP4591594B2 (ja) 2008-11-21 2008-11-21 オーディオ信号再生装置及び方法、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2010122596A true JP2010122596A (ja) 2010-06-03
JP4591594B2 JP4591594B2 (ja) 2010-12-01

Family

ID=42197029

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008298030A Expired - Fee Related JP4591594B2 (ja) 2008-11-21 2008-11-21 オーディオ信号再生装置及び方法、並びにプログラム

Country Status (3)

Country Link
US (1) US20100131088A1 (ja)
JP (1) JP4591594B2 (ja)
CN (1) CN101740075B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9565476B2 (en) * 2011-12-02 2017-02-07 Netzyn, Inc. Video providing textual content system and method
CN107256707B (zh) * 2017-05-24 2021-04-30 深圳市冠旭电子股份有限公司 一种语音识别方法、系统及终端设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003162299A (ja) * 2001-11-28 2003-06-06 Fujitsu Ltd 音声再生回路、デコード回路、音声再生装置及び音声再生方法
JP2006178179A (ja) * 2004-12-22 2006-07-06 Nec Electronics Corp 圧縮オーディオ信号再生方法及び圧縮オーディオ信号再生装置
JP2006221714A (ja) * 2005-02-09 2006-08-24 Toshiba Corp 符号化ディジタルオーディオ再生装置
JP2008185769A (ja) * 2007-01-30 2008-08-14 Oki Electric Ind Co Ltd 圧縮オーディオ再生装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6721710B1 (en) * 1999-12-13 2004-04-13 Texas Instruments Incorporated Method and apparatus for audible fast-forward or reverse of compressed audio content
JP2002152681A (ja) * 2000-11-14 2002-05-24 Alpine Electronics Inc 記録媒体再生方法及び記録媒体再生装置
JP2004524776A (ja) * 2001-04-20 2004-08-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Mp3のトリック再生
JP2004341430A (ja) * 2003-05-19 2004-12-02 Sony Corp 再生装置および再生方法、記録媒体、並びにプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003162299A (ja) * 2001-11-28 2003-06-06 Fujitsu Ltd 音声再生回路、デコード回路、音声再生装置及び音声再生方法
JP2006178179A (ja) * 2004-12-22 2006-07-06 Nec Electronics Corp 圧縮オーディオ信号再生方法及び圧縮オーディオ信号再生装置
JP2006221714A (ja) * 2005-02-09 2006-08-24 Toshiba Corp 符号化ディジタルオーディオ再生装置
JP2008185769A (ja) * 2007-01-30 2008-08-14 Oki Electric Ind Co Ltd 圧縮オーディオ再生装置

Also Published As

Publication number Publication date
JP4591594B2 (ja) 2010-12-01
US20100131088A1 (en) 2010-05-27
CN101740075A (zh) 2010-06-16
CN101740075B (zh) 2012-02-08

Similar Documents

Publication Publication Date Title
CN101682515B (zh) 用于确定多媒体序列的帧尺寸的方法
US20120243692A1 (en) Decoding of Multichannel Audio Encoded Bit Streams Using Adaptive Hybrid Transformation
JP2009021997A5 (ja)
CA2578190C (en) Device and method for generating a coded multi-channel signal and device and method for decoding a coded multi-channel signal
US9355644B2 (en) Method and apparatus for searching in a layered hierarchical bit stream followed by replay, said bit stream including a base layer and at least one enhancement layer
US6977877B2 (en) Compressed audio data reproduction apparatus and compressed audio data reproducing method
US7840290B2 (en) Encoded digital audio reproducing apparatus
JP2009157272A (ja) 音声再生装置
KR20120013885A (ko) 오디오 재생 방법 및 그에 따른 오디오 재생 장치, 및 정보 저장 매체
JP7157736B2 (ja) サブバンドエネルギー平滑化を伴う変換ベースのオーディオコーデック及び方法
TWI236232B (en) Method and apparatus for bit stream decoding in MP3 decoder
JP4591594B2 (ja) オーディオ信号再生装置及び方法、並びにプログラム
KR100501930B1 (ko) 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
US20080133250A1 (en) Method and Related Device for Improving the Processing of MP3 Decoding and Encoding
JP4888048B2 (ja) オーディオ信号の符号化復号化方法、この方法を実施するための装置及びプログラム
US20110022400A1 (en) Audio resume playback device and audio resume playback method
US20080077411A1 (en) Decoder, signal processing system, and decoding method
KR100903958B1 (ko) 디지털 오디오 데이터의 복호화 방법, 디지털 오디오데이터의 복호화 장치 및 디지털 오디오 데이터의 복호화방법을 수행하는 기록매체
JP2010123225A (ja) 記録再生装置及び記録再生方法
JP4862136B2 (ja) 音声信号処理装置
JP2006195066A (ja) 符号化オーディオ信号の再生装置及び再生方法
JP2005173201A (ja) オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、及びオーディオ復号プログラムを記録したコンピュータ可読記録媒体
JP2006178179A (ja) 圧縮オーディオ信号再生方法及び圧縮オーディオ信号再生装置
US20070245218A1 (en) Semiconductor integrated circuit and record player
JP5326724B2 (ja) 映像処理装置および映像処理装置の制御プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100723

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100817

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100830

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130924

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130924

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees