JP2007033585A - 音声符号化装置および音声符号化方法 - Google Patents

音声符号化装置および音声符号化方法 Download PDF

Info

Publication number
JP2007033585A
JP2007033585A JP2005213676A JP2005213676A JP2007033585A JP 2007033585 A JP2007033585 A JP 2007033585A JP 2005213676 A JP2005213676 A JP 2005213676A JP 2005213676 A JP2005213676 A JP 2005213676A JP 2007033585 A JP2007033585 A JP 2007033585A
Authority
JP
Japan
Prior art keywords
encoding
audio data
encoded
continuously
encoding method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005213676A
Other languages
English (en)
Other versions
JP4765460B2 (ja
Inventor
Tatsuya Suzuki
達也 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2005213676A priority Critical patent/JP4765460B2/ja
Publication of JP2007033585A publication Critical patent/JP2007033585A/ja
Application granted granted Critical
Publication of JP4765460B2 publication Critical patent/JP4765460B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】符号化音声データを利用機器に合わせて再符号化すると、ファイル分割点での音声の連続性が失われてしまう。
【解決手段】第一の符号化方法による符号化音声データを復号する際に、音声の連続性が必要な複数のファイルを結合して復号化し、復号化音声データを得る。第二の符号化方法で再符号化した後、得られた符号化音声データを所定の場所で複数のファイルに分割する。これにより、連続性が必要な複数のファイルの再符号化を行っても音声の連続性を保つことが可能となる。
【選択図】図2

Description

本発明は、MP3やAACなどの符号化音声データを再符号化する音声符号化装置および音声符号化方法に関するものである。
近年、デジタル化された音声データを、人間の聴覚特性を利用して知覚されない情報を捨てることで圧縮する音声符号化(圧縮)技術が進歩し、符号化前のデータ量の1/10以上のデータ量に圧縮しても符号化前の音質と遜色ない音質が得られるようになり、光ディスクやハードディスク、半導体メモリ等を使用したオーディオプレーヤで盛んに使われるようになった。
このようなオーディオプレーヤは、通常、パーソナルコンピュータ上に前記のような符号化技術を用いてデータ量を削減した上で蓄積されたコンテンツをオーディオプレーヤや記録媒体へ転送して使用するのが一般的である。
符号化音声データは、使用者が所有するコンパクトディスクなどから作成されるのが一般的であるが、音楽配信のように、特定の符号化方法で符号化されたものを手に入れて使用する場合もある。これらの符号化音声データの符号化方法、または、符号化音声データの符号化レートなど、必ずしも使用者が持つオーディオプレーヤの能力に適合したものであるとは限らないのが現状である。
上記を解決するために、パーソナルコンピュータ上で符号化音声データを管理するソフトウェアの中には、使用者の所望の符号化方法、あるいはオーディオプレーヤの能力に適合した符号化方法に再符号化する音声符号化処理機能を持つものがある。例えば特許文献1でその技術が開示されている。以下、従来の前記の音声符号化装置について説明する。
従来の音声符号化装置においては、第一の符号化方法で符号化されている音声データを復号化部で復号化し、復号化したデータを一時記憶部に格納する。次に、符号化部により第二の符号化方法で音声データを符号化する。符号化部は、一時記憶部に所定のデータ量が蓄積されたら一時記憶部よりデータを読み出し、第二の符号化方法で符号化して一時記憶部へ出力し、さらに記録媒体に出力する。これを必要なコンテンツ分だけ実施すればよい。
なお、復号化部の処理は、変換元の符号化方法に合わせて適宜処理の切り換えを行い、また、符号化部の処理は、変換後の音声データを利用する装置に適合する符号化方法に合わせて適宜処理の切り換えを行う。
以上のように、符号化された音声データを、利用する装置、目的に合わせて再符号化を行うことで、その音声データの利用範囲を大きく広げることが出来る。
特開2005−12277号公報
ところで、現在一般的に用いられているMP3やAACといった音声符号化方法では、音声データから一定量を切り出し、MDCT(変形離散コサイン変換)によって時間領域のデータを周波数領域のデータに変換し、処理を行う。この処理単位をフレームと呼ぶが、符号化時には、隣接するフレームと、ある割合でオーバーラップさせる窓関数を用いてデータを切り出し、処理を行っている。逆に、復号化時は、オーバーラップさせた部分を相互に加算して元の音声データを復元している。隣接するフレームとオーバーラップさせるのは、符号化による圧縮によって生じるフレーム間の歪みを軽減するためである。このように、符号化された音声データのあるフレームを復元するためには、隣接するフレームの情報が必要になってくる。
コンパクトディスクなどの音声データから符号化音声データを作成する場合は、トラック毎に符号化音声データをファイル化するのが普通である。コンパクトディスクに納められている音楽コンテンツの中には、トラックは分かれているが、複数トラックにまたがって音声が連続的に納められているものがあり、これらを符号化してトラック毎にファイル化しても、再生時にはこれらのトラックの音声を途切れさせることなく連続的に再生する必要がある。従って、符号化時には、トラック分割点においても、隣接するフレームとオーバーラップさせて符号化した後に分割する必要があり、また、復号化時においても、トラック分割点前後のフレームを隣接させた後に復号化された音声データをオーバーラップ加算して連続する音声データを復元する必要がある。
しかしながら、前記従来の音声符号化装置では、復号化時に、各々のコンテンツの先頭フレームと最終フレームは、隣接するフレームがないために、フレームを正しく復元することが出来ず、これを再度符号化した符号化音声データは、隣接するフレームとオーバーラップさせても元のフレームを復元することが出来ず、音途切れが発生してしまう。
本発明は、連続して再生したときに連続的に音が接続されるべき符号化音声データを再符号化した場合であっても、連続的に再生したときに音途切れが発生しないよう再符号化を行う音声符号化装置を提供することを目的とする。
上記の目的を達成するため、本発明の第1の発明の音声符号化装置は、第一の符号化方法で符号化され、コンテンツ毎に分割された複数の符号化音声データを、連続的に復号化する復号化手段と、前記連続的に復号化された音声データを第二の符号化方法で連続的に符号化するとともに、符号化された音声データを再びコンテンツ毎に分割する符号化手段とを有するものである。
また、本発明の第2の発明の音声符号化装置は、第1の発明において、符号化手段は、第二の符号化方法で符号化された音声データをコンテンツ毎に分割する際、復号化手段で復号化する前の分割点に近い、第二の符号化方法の符号化フレームの境界で分割することを特徴とするものである。
また、本発明の第3の発明の音声符号化装置は、第一の符号化方法で符号化され、コンテンツ毎に分割された複数の符号化音声データを、個別にまたは連続的に復号化する復号化手段と、前記個別にまたは連続的に復号化された音声データを、第二の符号化方法で個別にまたは連続的に符号化するとともに、連続的に符号化された音声データを再びコンテンツ毎に分割する符号化手段とを有し、前記復号化手段は、複数のコンテンツについて、連続性を示す付随情報を持つ場合は連続的に処理を行い、連続性を示す付随情報を持たない場合は個別に処理を行うものである。
本発明の音声符号化装置によれば、符号化音声データを再符号化した場合であっても、連続的な復号化処理と符号化処理を施すことが可能となり、連続的に再生したときに音途切れが発生しない再符号化コンテンツを得ることができる。
以下、本発明の実施の形態について、図面を用いて説明する。
(実施の形態1)
図1は、本発明の実施の形態1による音声符号化装置の構成を示すブロック図である。始めに、図1を参照しながら、本実施の形態の音声符号化装置の構成について説明する。
図1に示すように、本実施の形態1における音声符号化装置は、第一の符号化方法で符号化された複数の符号化音声データを格納する第一の記録媒体10と、第一の記録媒体10に格納されている符号化音声データを順次読み出して一時的に記憶しておく第一の一時記憶部11と、第一の一時記憶部11に蓄積されている符号化音声データを復号化する復号化部12と、復号化部12にて復号化した音声データを一時的に記憶しておく第二の一時記憶部13と、第二の一時記憶部13に蓄積されている復号化された音声データを第二の符号化方法で符号化する符号化部14と、符号化部14にて符号化した音声データを一時的に記憶しておく第三の一時記憶部15と、再符号化された音声データを格納する第二の記憶媒体16と、装置全体の制御を行う制御部17とから構成される。
次に、その動作について説明する。記録媒体10には第一の符号化方法で符号化された複数の符号化音声データファイルが格納されている。これら符号化音声データは、ある規則に従って再生順序が指定されているものである。制御部17は、この再生順序に従って記録媒体10から符号化音声データを読み出し、第一の一時記憶部11に順次格納する。第一の一時記憶部11に所定の音声データ量が蓄積された段階で、制御部17は復号化部12に対して復号化開始を指示する。復号化が開始され、第一の一時記憶部11の音声データ量が所定量を下回れば、再び第一の記憶媒体10から符号化音声データを読み出し、第一の一時記憶部11に追加する。これを符号化音声データファイルの終端まで繰り返すが、あるファイルのデータを全て読み出し終えれば、再生順序に従って次の符号化音声データファイルを開き、音声データを読み出して第一の一時記憶部11に、前ファイルのデータに続けて格納する。ここで、制御部17は、ファイルの境界のタイミングを記憶しておく。
復号化部12で復号化された音声データは、順次第二の一時記憶部13に格納される。復号化部12は、第一の符号化方法で符号化された符号化音声データのファイルの境界に依存することなく連続的に復号化処理を行うため、第二の一時記憶部13に格納される音声データは連続データとなる。第二の一時記憶部13に所定の音声データ量が蓄積された段階で、制御部17は符号化部14に対して符号化開始を指示する。符号化部14にて符号化された音声データは、順次第三の一時記憶部15に格納される。制御部17は、第三の一時記憶部15に蓄積された符号化音声データを第二の記録媒体16に順次記録する。ここで、前記第一の一時記憶部11に符号化音声データを格納する際に記憶していたファイルの境界のタイミングに基づき、第二の記録媒体16に記録していく際に、符号化音声データのファイルを分割する。
以上のように、本発明の実施の形態1による音声符号化装置によれば、複数の符号化音声データファイルを再符号化するときに、各ファイルの接続点において、隣接するフレームを接続した状態で復号化して連続音声データとして復元し、さらに、連続音声データとして符号化した後に元のファイルの単位で分割するため、再符号化された符号化音声データを連続的に再生した場合にも音途切れが発生することがない。
なお、第一の符号化方法と第二の符号化方法では、音声データの時間軸方向の処理単位(フレームという)が異なる場合がある。このときの処理について図2を用いて説明する。
符号化音声データは、分割できる最小単位がこのフレームになるので、異なるフレーム長の符号化方法の間での変換を行う場合は、ファイルの分割点に注意する必要がある。本発明の実施の形態1による処理においては、図2に示すように、第一の符号化方法で符号化されている複数ファイルの音声データを、一旦連続する音声データに復号化する。そして、この連続する音声データを第二の符号化方法で連続的に符号化する。そして最後に、元のファイルの分割点に対して最も近いフレームの分割点においてファイルを分割し、記録する。元のファイルの分割点とは異なるが、連続的に再生可能な複数の符号化音声データファイルとして再符号化することが可能となる。
なお、ファイルの分割点を選択する際に、最も近い分割点を選ぶか、前側もしくは後側で最も近い分割点を選ぶかは、その装置の設計事項として決定すればよい。
(実施の形態2)
図3は、本発明の実施の形態2による音声符号化装置の構成を示すブロック図である。構成については、本発明の実施の形態1と共通であるが、制御部17が第一の記録媒体10より、各々の符号化音声データファイルに付随する情報を取得するところが異なる。
動作についても本発明の実施の形態1と共通であり、異なる部分のみを説明する。
本発明の実施の形態2では、制御部17は、符号化音声データファイルに付随する情報として、異なる音声データファイル間の連続性に関する情報を取得する。この情報は、ファイル間の連続性を直接的に示すフラグ情報でも良いし、コンテンツのグループ属性とその順列という間接的に示す情報であっても良い。後者の場合、例えば、元々の音声データがコンパクトディスクから作成されたものであれば、コンテンツ毎に「アルバム」「トラック番号」といった属性を持たせることが出来る。これらの情報は、ユーザが入力しても良いし、インターネットといった外部ネットワークから取得する情報であっても良い。そして、「アルバム」属性が同一であり、「トラック番号」属性が連続する複数の音声データは、連続性があると判断することが出来る。
そして、制御部17は、連続性があると判断した複数の符号化音声データファイルを再符号化する場合は、復号化後の音声の連続性が保たれるように、連続的な復号化と符号化による再符号化を行い、連続性がないと判断した複数の符号化音声データファイルを再符号化する場合は、各々の符号化音声データファイルを独立して再符号化する。
このように、本発明の実施の形態2では、本来連続的に再生されるべき複数の符号化音声データファイルのみに対して、音声の連続性を保つ再符号化処理を施すことが可能となる。
なお、上記各実施の形態において、第一に記録媒体10と第二の記録媒体16は、個別の記録媒体でも、同じ記録媒体であってもよい。また、第一〜第三の一時記憶部11,13,15においても、個別の記録部として構成しても、同じ記録部の領域を分けて構成してもよい。
また、上記各実施の形態における音声符号化装置の一部または全部を、CPUやメモリからなるコンピュータにおいて実行可能なソフトウェアとして実現できることは言うまでもない。この場合、本発明は、図1または図3に示した各構成に対応するステップを有する音声符号化方法としても実現可能である。
本発明にかかる音声符号化装置は、装置として構成できることはもちろんのこと、パーソナルコンピュータ上で音声データを管理し、音声データを再生する外部機器に再符号化を施して出力するソフトウェアとしても有用であるし、音楽配信サーバや端末として、音声データを販売する際に、ユーザに最適な符号化方法で再符号化するようなシステムとしても有用である。
本発明の実施の形態1における音声符号化装置の構成を示すブロック図 同実施の形態1における音声符号化装置のファイル分割の例を示す説明図 本発明の実施の形態2における音声符号化装置の構成を示すブロック図
符号の説明
10、16 記録媒体
11、13、15 一時記憶部
12 復号化部
14 符号化部
17 制御部

Claims (6)

  1. 第一の符号化方法で符号化され、コンテンツ毎に分割された複数の符号化音声データを、連続的に復号化する復号化手段と、前記連続的に復号化された音声データを、第二の符号化方法で連続的に符号化するとともに、符号化された音声データを再びコンテンツ毎に分割する符号化手段とを有する音声符号化装置。
  2. 前記符号化手段は、第二の符号化方法で符号化された音声データをコンテンツ毎に分割する際、前記復号化手段で復号化する前の分割点に近い、第二の符号化方法の符号化フレームの境界で分割することを特徴とする請求項1記載の音声符号化装置。
  3. 第一の符号化方法で符号化され、コンテンツ毎に分割された複数の符号化音声データを、個別にまたは連続的に復号化する復号化手段と、前記個別にまたは連続的に復号化された音声データを、第二の符号化方法で個別にまたは連続的に符号化するとともに、連続的に符号化された音声データを再びコンテンツ毎に分割する符号化手段とを有し、
    前記復号化手段は、複数のコンテンツについて、連続性を示す付随情報を持つ場合は連続的に処理を行い、連続性を示す付随情報を持たない場合は個別に処理を行うことを特徴とする音声符号化装置。
  4. 第一の符号化方法で符号化され、コンテンツ毎に分割された複数の符号化音声データを、連続的に復号化する復号化ステップと、前記連続的に復号化された音声データを、第二の符号化方法で連続的に符号化するとともに、符号化された音声データを再びコンテンツ毎に分割する符号化ステップとを有する音声符号化方法。
  5. 前記符号化ステップは、第二の符号化方法で符号化された音声データをコンテンツ毎に分割する際、前記復号化ステップで復号化する前の分割点に近い、第二の符号化方法の符号化フレームの境界で分割することを特徴とする請求項4記載の音声符号化方法。
  6. 第一の符号化方法で符号化され、コンテンツ毎に分割された複数の符号化音声データを、個別にまたは連続的に復号化する復号化ステップと、前記個別にまたは連続的に復号化された音声データを、第二の符号化方法で個別にまたは連続的に符号化するとともに、連続的に符号化された音声データを再びコンテンツ毎に分割する符号化ステップとを有し、
    前記復号化ステップは、複数のコンテンツについて、連続性を示す付随情報を持つ場合は連続的に処理を行い、連続性を示す付随情報を持たない場合は個別に処理を行うことを特徴とする音声符号化方法。
JP2005213676A 2005-07-25 2005-07-25 音声符号化装置および音声符号化方法 Expired - Fee Related JP4765460B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005213676A JP4765460B2 (ja) 2005-07-25 2005-07-25 音声符号化装置および音声符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005213676A JP4765460B2 (ja) 2005-07-25 2005-07-25 音声符号化装置および音声符号化方法

Publications (2)

Publication Number Publication Date
JP2007033585A true JP2007033585A (ja) 2007-02-08
JP4765460B2 JP4765460B2 (ja) 2011-09-07

Family

ID=37792964

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005213676A Expired - Fee Related JP4765460B2 (ja) 2005-07-25 2005-07-25 音声符号化装置および音声符号化方法

Country Status (1)

Country Link
JP (1) JP4765460B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007079063A (ja) * 2005-09-13 2007-03-29 Sony Corp データ処理装置、データ処理方法及びデータ処理制御プログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001337698A (ja) * 2000-05-30 2001-12-07 Sony Corp 符号化装置および符号化方法並びに復号化装置および復号化方法
JP2001337699A (ja) * 2000-05-30 2001-12-07 Sony Corp 符号化装置および符号化方法並びに復号化装置および復号化方法
JP2004007127A (ja) * 2002-05-31 2004-01-08 Nippon Telegr & Teleph Corp <Ntt> 番組配信制御方法及び番組配信制御システム及び番組配信制御プログラムを記録した記録媒体
JP2004128651A (ja) * 2002-09-30 2004-04-22 Yamaha Corp オーディオデータ配信装置
JP2005012277A (ja) * 2003-06-16 2005-01-13 Hitachi Ltd コンテンツデータ再生・転送方法およびコンテンツデータ再生・転送装置
JP2005122034A (ja) * 2003-10-20 2005-05-12 Fujitsu Ten Ltd オーディオデータ圧縮方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001337698A (ja) * 2000-05-30 2001-12-07 Sony Corp 符号化装置および符号化方法並びに復号化装置および復号化方法
JP2001337699A (ja) * 2000-05-30 2001-12-07 Sony Corp 符号化装置および符号化方法並びに復号化装置および復号化方法
JP2004007127A (ja) * 2002-05-31 2004-01-08 Nippon Telegr & Teleph Corp <Ntt> 番組配信制御方法及び番組配信制御システム及び番組配信制御プログラムを記録した記録媒体
JP2004128651A (ja) * 2002-09-30 2004-04-22 Yamaha Corp オーディオデータ配信装置
JP2005012277A (ja) * 2003-06-16 2005-01-13 Hitachi Ltd コンテンツデータ再生・転送方法およびコンテンツデータ再生・転送装置
JP2005122034A (ja) * 2003-10-20 2005-05-12 Fujitsu Ten Ltd オーディオデータ圧縮方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007079063A (ja) * 2005-09-13 2007-03-29 Sony Corp データ処理装置、データ処理方法及びデータ処理制御プログラム

Also Published As

Publication number Publication date
JP4765460B2 (ja) 2011-09-07

Similar Documents

Publication Publication Date Title
CN1312664C (zh) 特技模式的音频播放
US20060107820A1 (en) Sound data encoding apparatus and sound data decoding apparatus
US7714223B2 (en) Reproduction device, reproduction method and computer usable medium having computer readable reproduction program emodied therein
US7479594B2 (en) Sound data encoding apparatus and sound decoding apparatus
TW200304123A (en) Audio frequency scaling during video trick modes utilizing digital signal processing
US20080147218A1 (en) Recording/reproduction apparatus
JP2004093729A (ja) 音楽データの記録装置及び再生装置
JP4765460B2 (ja) 音声符号化装置および音声符号化方法
JP4973422B2 (ja) 信号記録再生装置及び方法
WO2009090705A1 (ja) 記録再生装置
JP4750759B2 (ja) 映像音声再生装置
JP2010123225A (ja) 記録再生装置及び記録再生方法
JP4254960B2 (ja) 音声データエンコード装置および音声データ再生装置
JP4570026B2 (ja) 電子透かしの埋め込み方法
US20030081515A1 (en) Information recording medium, information recording apparatus, information reproducing apparatus, and copying apparatus
JP2011209412A (ja) 圧縮装置、圧縮方法、再生装置および再生方法
JP4356046B2 (ja) 符号化データ記録再生装置、及び符号化データ再生装置
JP2006079742A (ja) 情報処理装置および方法、並びにプログラム
JP2005064664A (ja) データファイルの圧縮方法
JP2005215595A (ja) 符号化方法、復号化方法、および、符号化・復号化方法、並びに、符号化装置、復号化装置、および、符号化・復号化装置
JP3922412B2 (ja) オーディオ信号記録装置および方法ならびにオーディオ信号記録再生装置および方法
JP5987511B2 (ja) 音響信号に対する妨害音の埋め込み装置
JP3922411B2 (ja) オーディオ信号再生装置および方法ならびにオーディオ信号記録再生装置および方法
JP2007188592A (ja) 映像信号記録制御装置および映像信号記録制御方法
JP2009216915A (ja) 音声符号化データ編集装置及び音声符号化データ編集方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080507

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20091126

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101029

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110517

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110530

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140624

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees