JP5596800B2 - 符号化方法、周期性特徴量決定方法、周期性特徴量決定装置、プログラム - Google Patents

符号化方法、周期性特徴量決定方法、周期性特徴量決定装置、プログラム Download PDF

Info

Publication number
JP5596800B2
JP5596800B2 JP2012554739A JP2012554739A JP5596800B2 JP 5596800 B2 JP5596800 B2 JP 5596800B2 JP 2012554739 A JP2012554739 A JP 2012554739A JP 2012554739 A JP2012554739 A JP 2012554739A JP 5596800 B2 JP5596800 B2 JP 5596800B2
Authority
JP
Japan
Prior art keywords
candidates
interval
acoustic signal
periodic feature
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012554739A
Other languages
English (en)
Other versions
JPWO2012102149A1 (ja
Inventor
健弘 守谷
登 原田
祐介 日和▲崎▼
優 鎌本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012554739A priority Critical patent/JP5596800B2/ja
Publication of JPWO2012102149A1 publication Critical patent/JPWO2012102149A1/ja
Application granted granted Critical
Publication of JP5596800B2 publication Critical patent/JP5596800B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、音響信号の符号化技術に関する。より詳しくは、音響信号を周波数領域に変換して得られた周波数領域のサンプル列の符号化と当該符号化処理の際にサンプル列の並べ替えの指標となる周期性特徴量(例えば基本周波数やピッチ周期)を決定する技術に関する。
低ビット(例えば10kbit/s〜20kbit/s程度)の音声信号や音響信号の符号化方法として、DFT(離散フーリエ変換)やMDCT(変形離散コサイン変換)などの直交変換係数に対する適応符号化が知られている。例えば標準規格技術であるAMR-WB+(Extended Adaptive Multi-Rate Wideband)は、TCX(transform coded excitation:変換符号化励振)符号化モードを持ち、この中ではDFT係数を8サンプルごとに正規化してベクトル量子化している。
また、TwinVQ(Transform domain Weighted Interleave Vector Quantization)では、MDCT係数全体を固定の規則で並べ替えた後のサンプルの集まりがベクトルとして符号化される。この際、例えば、MDCT係数からピッチ周期ごとの大きな成分を抽出し、ピッチ周期に対応する情報を符号化し、さらにピッチ周期ごとの大きな成分を取り除いた残りのMDCT係数列を並べ替えて、並べ替え後のMDCT係数列を所定サンプル数ごとにベクトル量子化することにより符号化する方法などが採用される場合もある。TwinVQに関する文献として非特許文献1,2を例示できる。
また、等間隔にサンプルを抽出して符号化する技術として例えば特許文献1を例示できる。
特開2009−156971号公報
T. Moriya, N. Iwakami, A. Jin, K. Ikeda, and S. Miki, "A Design of Transform Coder for Both Speech and Audio Signals at 1 bit/sample," Proc. ICASSP'97, pp. 1371-1374, 1997. J.Herre, E. Allamanche, K. Brandenburg, M. Dietz, B.Teichmann, B. Grill, A. Jin, T. Moriya, N. Iwakami, T. Norimatsu, M. Tsushima, T. Ishikawa, "The integrated Filterbank Based Scalable MPEG-4 Audio Coder," 105th Convention Audio Engineering Society, 4810, 1998.
AMR-WB+をはじめ、TCXに基づく符号化では周期性に基づく周波数領域の係数の振幅のばらつきは考慮されていないため、ばらつきの大きい振幅をまとめて符号化すると符号化効率は低下してしまう。TCXでの量子化や符号化には各種変形例があるが、例えば、量子化により離散値となったMDCT係数を周波数の低いほうから並べた系列をエントロピー符号化によって圧縮を行う場合を考える。この場合、複数のサンプルを1シンボル(符号化単位)とし、そのシンボルの直前のシンボルに依存して割り当て符号を適応的に制御する。一般に、振幅が小さければ短い符号が割り当てられ、振幅が大きい場合には長い符号が割り当てられる。シンボルの直前のシンボルに依存して割り当て符号を適応的に制御するため、振幅の小さい値が連続すると、ますます短い符号が割り当てられる一方、小さい振幅のサンプルのあとに急に大きな振幅が出現すると非常に長い符号が割り当てられてしまう。
また、従来のTwinVQは、所定サンプルにより構成されるベクトルの全てに同じ符号帳の符号を割り当てる固定長符号のベクトル量子化を用いることを前提として設計されており、可変長符号化を使ってMDCT係数を符号化することは一切想定されていなかった。
本発明は、このような技術的背景に鑑みて、離散信号、特に音声音響ディジタル信号の低ビットでの符号化による品質を低演算量で改善する符号化技術と当該符号化の際に実施されるサンプル列の並べ替えの指標となる周期性特徴量を決定する技術を提供することを目的とする。
本発明の符号化技術によると、フレーム単位の音響信号に由来する周波数領域のサンプル列の符号化方法であって、フレーム毎に、音響信号の周期性に対応するサンプルの間隔T、または、音響信号の基本周波数の整数倍に対応するサンプルの間隔Tを、間隔Tの候補の集合Sの中から決定する間隔決定処理と、間隔決定処理で決定された間隔Tを符号化して補助情報を得る補助情報生成処理と、(1)サンプル列の全てのサンプルが含まれ、かつ、(2)間隔決定処理で決定された間隔Tに基づいて、サンプル列のうちの音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、サンプル列のうちの音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるようにサンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、を並べ替え後のサンプル列として、並べ替え後のサンプル列を符号化して符号列を得るサンプル列符号化処理とを有する。間隔決定処理では、補助情報で表現可能な間隔TのZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定処理の対象となった候補に依存せずに選択されたZ個の候補(ただし、Z<Z)と、所定フレーム数だけ過去のフレームにおいて間隔決定処理の対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を集合Sとして、間隔Tを決定する。
間隔決定処理は、所定フレーム数だけ過去のフレームにおいて間隔決定処理の対象となった候補に隣接する値または/および所定の差分を持つ値を集合Sに加える追加処理を更に含んでもよい。
間隔決定処理は、補助情報で表現可能な間隔TのZ個の候補のうちの一部であるZ1個の候補から、現在のフレームの音響信号または/およびサンプル列から求まる指標に基づいて選択した一部の候補をZ個の候補(ただしZ<Z)とする予備選択処理を更に含んでもよい。
間隔決定処理は、補助情報で表現可能な間隔TのZ個の候補のうちの一部であるZ1個の候補から、現在のフレームの音響信号または/およびサンプル列から求まる指標に基づいて一部の候補を選択する予備選択処理と、予備選択処理で選択された候補と、予備選択処理で選択された候補に隣接する値または/および所定の差分を持つ値とのセットをZ個の候補とする第二追加処理を更に含んでもよい。
間隔決定処理は、現在のフレームの音響信号または/およびサンプル列から求まる指標に基づいて、集合Sに含まれる間隔Tの候補のうちの一部の候補を選択する第二予備選択処理と、第二予備選択処理で選択された一部の候補により構成される集合を対象として上記間隔Tを決定する最終選択処理とを含んでもよい。
現在のフレームの音響信号の定常性の大きさを表す指標値が大きいほど、集合Sにて、所定フレーム数だけ過去のフレームにおいて間隔決定処理の対象となった候補が占める割合が大きくなるようにしてもよい。
現在のフレームの音響信号の定常性の大きさを表す指標値が所定の条件より小さい場合には、集合SにはZ個の候補のみが含まれるようにしてもよい。
現在のフレームの音響信号の定常性の大きさを表す指標値は、
(a-1)「現在のフレームの上記音響信号の予測利得」が大きくなる
(a-2)「現在のフレームの上記音響信号の予測利得の推定値」が大きくなる
(b-1)「直前のフレームの予測利得」と「現在のフレームの予測利得」との差分が小さくなる
(b-2)「直前のフレームの予測利得の推定値」と「現在のフレームの予測利得の推定値」との差分が小さくなる
(c-1)「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」が大きくなる
(c-2)「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」が大きくなる
(d-1)「直前のフレームに含まれる上記音響信号のサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」との差分が小さくなる
(d-2)「直前のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」との差分が小さくなる
(e-1)「現在のフレームの上記音響信号のパワー」が大きくなる
(e-2)「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」が大きくなる
(f-1)「直前のフレームの上記音響信号のパワー」と「現在のフレームの上記音響信号のパワー」との差分が小さくなる
(f-2)「直前のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」と「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」との差分が小さくなる、の少なくともいずれか一つの条件を満たす場合に、大きくなる値である。
サンプル列符号化処理は、並べ替え前のサンプル列を符号化して得られる符号列と、並べ替え後のサンプル列を符号化して得られる符号列と補助情報、のうち符号量が少ない方を出力する処理を含んでもよい。
サンプル列符号化処理は、並べ替え後のサンプル列を符号化して得られる符号列の符号量またはその推定値と補助情報の符号量との合計が、並べ替え前のサンプル列を符号化して得られる符号列の符号量またはその推定値より少ない場合には、並べ替え後のサンプル列を符号化して得られる符号列と補助情報とを出力し、並べ替え前のサンプル列を符号化して得られる符号列の符号量またはその推定値が、並べ替え後のサンプル列を符号化して得られる符号列の符号量またはその推定値と補助情報の符号量との合計より少ない場合には、並べ替え前のサンプル列を符号化して得られる符号列を出力するようにしてもよい。
直前のフレームで出力した符号列が並べ替え後のサンプル列を符号化して得られた符号列である場合のほうが、直前のフレームで出力した符号列が並べ替え前のサンプル列を符号化して得られた符号列である場合よりも、集合Sにて、所定フレーム数だけ過去のフレームにおいて間隔決定処理の対象となった候補が占める割合が大きくなるようにしてもよい。
直前のフレームで出力した符号列が並べ替え前のサンプル列を符号化して得られた符号列である場合には、集合SにはZ個の候補のみが含まれるようにしてもよい。
現在のフレームが時間的に先頭にあるフレームである場合、直前のフレームが本発明の符号化方法以外で符号化された場合、直前のフレームで出力した符号列が並べ替え前のサンプル列を符号化して得られた符号列である場合、の何れかに該当する場合には、集合SにはZ個の候補のみが含まれるようにしてもよい。
また、本発明による、フレーム単位の音響信号の周期性特徴量を決定する方法は、フレーム毎に、音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定処理と、周期性特徴量決定処理で得られた周期性特徴量を符号化して補助情報を得る補助情報生成処理とを有する。周期性特徴量決定処理では、補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定処理の対象となった候補に依存せずに選択されたZ個の候補(ただし、Z<Z)と、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定処理の対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、周期性特徴量を決定する。
周期性特徴量決定処理は、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定処理の対象となった候補に隣接する値または/および所定の差分を持つ値を集合Sに加える追加処理を更に含んでもよい。
現在のフレームの音響信号の定常性の大きさを表す指標値が大きいほど、集合Sにて、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定処理の対象となった候補が占める割合が大きいようにしてもよい。
現在のフレームの音響信号の定常性の大きさを表す指標値が所定の条件より小さい場合には、集合SにはZ個の候補のみが含まれるようにしてもよい。
現在のフレームの音響信号の定常性の大きさを表す指標値は、
(a-1)「現在のフレームの上記音響信号の予測利得」が大きくなる
(a-2)「現在のフレームの上記音響信号の予測利得の推定値」が大きくなる
(b-1)「直前のフレームの予測利得」と「現在のフレームの予測利得」との差分が小さくなる
(b-2)「直前のフレームの予測利得の推定値」と「現在のフレームの予測利得の推定値」との差分が小さくなる
(c-1)「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」が大きくなる
(c-2)「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」が大きくなる
(d-1)「直前のフレームに含まれる上記音響信号のサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」との差分が小さくなる
(d-2)「直前のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」との差分が小さくなる
(e-1)「現在のフレームの上記音響信号のパワー」が大きくなる
(e-2)「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」が大きくなる
(f-1)「直前のフレームの上記音響信号のパワー」と「現在のフレームの上記音響信号のパワー」との差分が小さくなる
(f-2)「直前のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」と「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」との差分が小さくなる、の少なくともいずれか一つの条件を満たす場合に、大きくなる値である。
本発明によると、例えば、音響信号に由来する周波数領域のサンプル列に含まれる少なくとも一部のサンプルを、音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルが集まるように並べ替えることにより、サンプルの大きさを反映する指標が同等か同程度のサンプルが集まるように並べ替えるという少ない演算量で実行可能な処理を行うことにより、符号化効率の向上や量子化歪の軽減などが実現される。また、音響信号の定常区間の性質に基づき、過去のフレームで考慮された周期性特徴量や上記間隔の候補を考慮することによって、現在のフレームにおける周期性特徴量や上記間隔の決定を効率良く行うことができる。
符号化装置の実施形態の機能構成例を示す図。 符号化方法の実施形態の処理手順を示す図。 サンプル列に含まれるサンプルの並べ替えの一例を説明するための概念図。 サンプル列に含まれるサンプルの並べ替えの一例を説明するための概念図。 復号装置の実施形態の機能構成例を示す図。 復号方法の実施形態の処理手順を示す図。 間隔Tを決定するための処理機能の一例を示す図。 間隔Tを決定するための処理手順の一例を示す図。 間隔Tを決定するための処理手順の変形例を示す図。 符号化装置の実施形態の変形例を示す図。
図面を参照しながら本発明の実施形態を説明する。なお、重複する構成要素には同じ参照符号を当てて重複説明を省略する。
本発明は、所定の時間区間の音響信号に由来する周波数領域のサンプル列を量子化する枠組みの中で、周波数領域のサンプルの特徴量に基づくサンプルの並べ替えによって量子化歪を小さくしつつ、可変長符号化を利用することで符号量を少なくするという符号化の改善を特徴の一つとする。以下、所定の時間区間をフレームと呼称する。例えば基本周期が比較的明瞭なフレームでは周期性に合わせたサンプルの並べ替えによって大きな振幅のサンプルを集中させることにより符号化の改善が実現する。ここで、音響信号に由来する周波数領域のサンプル列として、例えば、フレーム単位の音声音響ディジタル信号が時間領域から周波数領域に変換して得られるDFT係数列やMDCT係数列、このような係数列に対して正規化や重み付けや量子化などの処理が適用された係数列などを例示することができる。以下、MDCT係数列を例にとって本発明の実施形態を説明する。
[実施形態]
「符号化処理」
最初に図1〜図4を参照して符号化処理を説明する。本発明の符号化処理は、例えば、周波数領域変換部1と重み付け包絡正規化部2と正規化利得計算部3と量子化部4と並べ替え部5と符号化部6とを備える図1の符号化装置100、または、周波数領域変換部1と重み付け包絡正規化部2と正規化利得計算部3と量子化部4と並べ替え部5と符号化部6と間隔決定部7と補助情報生成部8を備える図10の符号化装置100aにより行われる。ただし、符号化装置100または符号化装置100aは周波数領域変換部1と重み付け包絡正規化部2と正規化利得計算部3と量子化部4とは必ずしも備える必要は無く、例えば、符号化装置100は並べ替え部5と符号化部6、符号化装置100aは並べ替え部5と符号化部6と間隔決定部7と補助情報生成部8とにより構成されることもある。なお、図10に例示される符号化装置100aでは間隔決定部7が並べ替え部5と符号化部6と補助情報生成部8を含むが、このような構成に限定されるものではない。
「周波数領域変換部1」
まず、周波数領域変換部1がフレーム単位で音声音響ディジタル信号を周波数領域のN点のMDCT係数列に変換する(ステップS1)。
一般論として、符号化側ではMDCT係数列を量子化して、量子化されたMDCT係数列を符号化して、得られた符号列を復号側へ伝送し、復号側では当該符号列から量子化されたMDCT係数列を再構成し、さらに逆MDCT変換によって時間領域の音声音響ディジタル信号を再構成することができる。ところで、MDCT係数の振幅は近似的に通常のDFTのパワースペクトルと同じ振幅包絡(パワースペクトル包絡)を持つ。このため、振幅包絡の対数値に比例する情報割り当てを行うことによって、全帯域のMDCT係数の量子化歪(量子化誤差)を均一に分散させることができ、全体の量子化歪を小さくすることができ、加えて情報圧縮も実現される。なお、パワースペクトル包絡は線形予測分析によって求められた線形予測係数を使って効率よく推定することができる。このような量子化誤差を制御する方法としては、各MDCT係数の量子化ビットを適応的に割り当てる(振幅を平坦にした後で量子化のステップ幅を調整する)方法や、重み付けベクトル量子化により適応的に重みをつけて符号を決定する方法がある。ここでは、本発明の実施形態において実行される量子化方法の一例を説明するが、説明する量子化方法に限定されるものではないことに留意されたい。
「重み付け包絡正規化部2」
重み付け包絡正規化部2が、フレーム単位の音声音響ディジタル信号に対する線形予測分析によって求められた線形予測係数を用いて推定された音声音響ディジタル信号のパワースペクトル包絡係数列によって、入力されたMDCT係数列の各係数を正規化し、重み付け正規化MDCT係数列を出力する(ステップS2)。ここでは聴覚的に歪が小さくなるような量子化の実現のために、重み付け包絡正規化部2は、パワースペクトル包絡を鈍らせた重み付けパワースペクトル包絡係数列を用いて、フレーム単位でMDCT係数列の各係数を正規化する。この結果、重み付け正規化MDCT係数列は、入力されたMDCT係数列ほどの大きな振幅の傾きや振幅の凹凸を持たないが、音声音響ディジタル信号のパワースペクトル包絡係数列と類似の大小関係を有するもの、すなわち、低い周波数に対応する係数側の領域にやや大きな振幅を持ち、ピッチ周期に起因する微細構造をもつもの、となる。
[重み付け包絡正規化処理の具体例]
N点のMDCT係数列の各係数X(1),・・・,X(N)に対応するパワースペクトル包絡係数列の各係数W(1),・・・,W(N)は、線形予測係数を周波数領域に変換して得ることができる。例えば、全極型モデルであるp次自己回帰過程により、時刻tの時間信号x(t)は、p時点まで遡った過去の自分自身の値x(t-1),・・・,x(t-p)と予測残差e(t)と線形予測係数α1,・・・,αpによって式(1)で表される。このとき、パワースペクトル包絡係数列の各係数W(n)[1≦n≦N]は式(2)で表される。exp(・)はネイピア数を底とする指数関数、jは虚数単位、σ2は予測残差エネルギーである。
Figure 0005596800
線形予測係数は、周波数領域変換部1に入力された音声音響ディジタル信号を重み付け包絡正規化部2によって線形予測分析して得られたものでもよいし、符号化装置100内または符号化装置100a内に在る図示しない他の手段によって音声音響ディジタル信号を線形予測分析して得られたものであってもよい。このような場合には、重み付け包絡正規化部2が線形予測係数を用いてパワースペクトル包絡係数列の各係数W(1),・・・,W(N)を求める。また、符号化装置100内または符号化装置100a内に在る他の手段(パワースペクトル包絡係数列計算部9)によってパワースペクトル包絡係数列の各係数W(1),・・・,W(N)が既に得られている場合には、重み付け包絡正規化部2は、このパワースペクトル包絡係数列の各係数W(1),・・・,W(N)を用いることができる。なお、後述する復号装置200でも符号化装置100または符号化装置100aで得られた値と同じ値を得る必要があるため、量子化された線形予測係数および/またはパワースペクトル包絡係数列が利用される。以後の説明において、特に断りが無い限り、「線形予測係数」ないし「パワースペクトル包絡係数列」は量子化された線形予測係数ないしパワースペクトル包絡係数列を意味する。また、線形予測係数は例えば従来的な符号化技術によって符号化されて予測係数符号が復号側へ伝送される。従来的な符号化技術とは、例えば、線形予測係数そのものに対応する符号を予測係数符号とする符号化技術、線形予測係数をLSPパラメータに変換してLSPパラメータに対応する符号を予測係数符号とする符号化技術、線形予測係数をPARCOR係数に変換してPARCOR係数に対応する符号を予測係数符号とする符号化技術、などである。符号化装置100内または符号化装置100a内に在る他の手段によってパワースペクトル包絡係数列が得られる構成である場合は、符号化装置100内または符号化装置100a内に在る他の手段において線形予測係数が従来的な符号化技術によって符号化されて予測係数符号が復号側へ伝送される。
ここでは、重み付け包絡正規化処理の具体例として二つの例を示すが、本発明ではこれらの例に限定されるものではない。
<例1>
重み付け包絡正規化部2は、MDCT係数列の各係数X(1),・・・,X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数の補正値Wγ(1),・・・,Wγ(N)で除算することによって、重み付け正規化MDCT係数列の各係数X(1)/Wγ(1),・・・,X(N)/Wγ(N)を得る処理を行う。補正値Wγ(n)[1≦n≦N]は式(3)で与えられる。但し、γは1以下の正の定数であり、パワースペクトル係数を鈍らせる定数である。
Figure 0005596800
<例2>
重み付け包絡正規化部2は、MDCT係数列の各係数X(1),・・・,X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数のβ乗(0<β<1)の値W(1)β,・・・,W(N)βで除算することによって、重み付け正規化MDCT係数列の各係数X(1)/W(1)β,・・・,X(N)/W(N)βを得る処理を行う。
この結果、フレーム単位の重み付け正規化MDCT係数列が得られるが、重み付け正規化MDCT係数列は入力されたMDCT係数列ほどの大きな振幅の傾きや振幅の凹凸を持たないが、入力されたMDCT係数列のパワースペクトル包絡と類似の大小関係を有するもの、すなわち、低い周波数に対応する係数側の領域にやや大きな振幅を持ち、ピッチ周期に起因する微細構造をもつもの、となる。
なお、重み付け包絡正規化処理に対応する逆処理、つまり、重み付け正規化MDCT係数列からMDCT係数列を復元する処理が復号側にて行われるため、パワースペクトル包絡係数列から重み付けパワースペクトル包絡係数列を算出する方法を符号化側と復号側で共通の設定にしておくことが必要である。
「正規化利得計算部3」
次に、正規化利得計算部3が、フレームごとに、重み付け正規化MDCT係数列の各係数を与えられた総ビット数で量子化できるように、全周波数に亘る振幅値の和またはエネルギー値を用いて量子化ステップ幅を決定し、この量子化ステップ幅になるように重み付け正規化MDCT係数列の各係数を割り算する係数(以下、利得という。)を求める(ステップS3)。この利得を表す情報は、利得情報として復号側へ伝送される。正規化利得計算部3は、フレームごとに、重み付け正規化MDCT係数列の各係数をこの利得で正規化(除算)する。
「量子化部4」
次に、量子化部4が、フレームごとに、利得で正規化された重み付け正規化MDCT係数列の各係数をステップS3の処理で決定された量子化ステップ幅で量子化する(ステップS4)。
「並べ替え部5」
ステップS4の処理で得られたフレーム単位の量子化MDCT係数列は、本実施形態の要部である並べ替え部5の入力となるが、並べ替え部5の入力は、ステップS1〜ステップS4の各処理で得られた係数列に限定されない。例えば、重み付け包絡正規化部2による正規化が適用されていない係数列や量子化部4による量子化が適用されていない係数列であってもよい。このことを明示的に理解するため、以下、並べ替え部5の入力を音響信号に由来する「周波数領域のサンプル列」あるいは単に「サンプル列」と呼称することにする。この実施形態では、ステップS4の処理で得られた量子化MDCT係数列が「周波数領域のサンプル列」に相当し、この場合、周波数領域のサンプル列を構成するサンプルは量子化MDCT係数列に含まれる係数に相当する。
並べ替え部5は、フレームごとに、(1)周波数領域のサンプル列の全てのサンプルを含み、かつ、(2)サンプルの大きさを反映する指標が同等か同程度のサンプルが集まるように周波数領域のサンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、を並べ替え後のサンプル列として出力する(ステップS5)。ここで「サンプルの大きさを反映する指標」とは、例えばサンプルの振幅の絶対値やパワー(自乗値)であるが、これらに限定されない。
[並べ替え処理の詳細]
この並べ替え処理の具体例を説明する。例えば、並べ替え部5は、(1)サンプル列の全てのサンプルを含み、かつ、(2)サンプル列のうちの音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、サンプル列のうちの音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるようにサンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、を並べ替え後のサンプル列として出力する。つまり、音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、当該音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルが集まるように、入力されたサンプル列に含まれる少なくとも一部のサンプルが並べ替えられる。
この理由は、基本周波数や高調波(基本周波数の整数倍波)に対応するサンプルとそれらの近傍のサンプルの振幅の絶対値やパワーは、基本周波数と高調波を除く周波数領域に対応するサンプルの振幅の絶対値やパワーよりも大きいという音響信号、特に音声や楽音などに顕著な特徴に基づく。ここで、音声や楽音などの音響信号から抽出される音響信号の周期性の特徴量(例えばピッチ周期)は、基本周波数と等価なものであるから、音響信号の周期性の特徴量(例えばピッチ周期)やその整数倍に対応するサンプルとそれらの近傍のサンプルの振幅の絶対値やパワーは、周期性特徴量やその整数倍を除く周波数領域に対応するサンプルの振幅の絶対値やパワーよりも大きいという特徴も認められる。
そして、音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、当該音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルは、低周波側に一まとまりになるように集められる。以下、音響信号の周期性または基本周波数に対応するサンプルと当該音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔(以下、単に間隔という)を表す記号をTとする。
具体例として、並べ替え部5は、入力されたサンプル列から、間隔Tの整数倍に対応するサンプルF(nT)の前後のサンプルF(nT-1),F(nT+1)を含めた3個のサンプルF(nT-1),F(nT),F(nT+1)を選択する。F(j)は、周波数に対応するサンプルインデックスを表す番号jに対応するサンプルである。nは、1からnT+1が予め設定した対象サンプルの上限Nを超えない範囲の各整数とする。n=1は基本周波数に対応し、n>1は高調波に対応する。周波数に対応するサンプルインデックスを表す番号jの最大値をjmaxとする。nに応じて選択されたサンプルの集まりをサンプル群と呼称する。上限Nは、jmaxと一致させてもよいが、音声や楽音などの音響信号では高域におけるサンプルの指標は一般的に十分に小さいことが多いので、後述する符号化効率の向上のために大きい指標を有するサンプルを低周波側に集めるという観点から、Nはjmaxよりも小さい値であってもよい。例えば、Nはjmaxの半分程度の値であってもよい。上限Nに基づいて定まるnの最大値をnmaxとすると、入力されたサンプル列に含まれるサンプルのうち、最低の周波数から第1の所定の周波数nmax*T+1までの各周波数に対応するサンプルが並べ替えの対象となる。なお、記号*は乗算を表す。
並べ替え部5は、選択されたサンプルF(j)を、元の番号jの大小関係を保ったままサンプル列の先頭から順に配置してサンプル列Aを生成する。例えば、nが1から5までの各整数を表す場合、並べ替え部5は、第1のサンプル群F(T-1),F(T),F(T+1)、第2のサンプル群F(2T-1),F(2T),F(2T+1)、第3のサンプル群F(3T-1),F(3T),F(3T+1)、第4のサンプル群F(4T-1),F(4T),F(4T+1)、第5のサンプル群F(5T-1),F(5T),F(5T+1)をサンプル列の先頭から並べる。つまり、15個のサンプルF(T-1),F(T),F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1)がこの順番でサンプル列の先頭から並べられ、これら15個のサンプルがサンプル列Aを構成する。
さらに、並べ替え部5は、選択されなかったサンプルF(j)を、元の番号jの大小関係を保ったままサンプル列Aの最後から順に配置する。選択されなかったサンプルF(j)は、サンプル列Aを構成するサンプル群の間に位置するサンプルであり、このような連続した一まとまりのサンプルをサンプルセットと呼称する。つまり、上述の例であれば、第1のサンプルセットF(1),…,F(T-2)、第2のサンプルセットF(T+2),…,F(2T-2)、第3のサンプルセットF(2T+2),…,F(3T-2)、第4のサンプルセットF(3T+2),…,F(4T-2)、第5のサンプルセットF(4T+2),…,F(5T-2)、第6のサンプルセットF(5T+2),…F(jmax)がサンプル列Aの最後から順に並べられ、これらのサンプルがサンプル列Bを構成する。
要するに、この例であれば、入力されたサンプル列F(j)(1≦j≦jmax)は、F(T-1),F(T),F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1),F(1),…,F(T-2),F(T+2),…,F(2T-2),F(2T+2),…,F(3T-2),F(3T+2),…,F(4T-2),F(4T+2),…,F(5T-2),F(5T+2),…F(jmax)に並べ替えられることになる(図3参照)。
なお、低周波数帯域では、音響信号の周期性や基本周波数に対応するサンプルやその整数倍のサンプル以外のサンプルでも、各サンプルは振幅やパワーが大きな値を持つことが多い。そこで、最低の周波数から所定の周波数fまでの各周波数に対応するサンプルの並べ替えを行わないようにしてもよい。例えば、所定の周波数fをnT+αとすれば、並べ替え前のサンプルF(1),…,F(nT+α)を並べ替えず、並べ替え前のF(nT+α+1)以降のサンプルを並べ替えの対象とする。αは0以上かつTよりもある程度小さい整数(例えばT/2を超えない整数)に予め設定されている。ここでnは2以上の整数であってもよい。あるいは、並べ替え前の最低周波数に対応するサンプルから連続するP個のサンプルF(1),…,F(P)を並べ替えないようにして、並べ替え前のF(P+1)以降のサンプルを並べ替えの対象としてもよい。この場合、所定の周波数fはPである。並べ替えの対象となるサンプルの集まりに対する並べ替えの基準は上述のとおりである。なお、第1の所定の周波数が設定されている場合、所定の周波数f(第2の所定の周波数)は第1の所定の周波数よりも小さい。
例えば、並べ替え前のサンプルF(1),…,F(T+1)を並べ替えず、並べ替え前のF(T+2)以降のサンプルを並べ替えの対象とする場合、上述の並べ替えの基準に従うと、入力されたサンプル列F(j)(1≦j≦jmax)は、F(1),…,F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1),F(T+2),…,F(2T-2),F(2T+2),…,F(3T-2),F(3T+2),…,F(4T-2),F(4T+2),…,F(5T-2),F(5T+2),…F(jmax)に並べ替えられることになる(図4参照)。なお、図3および図4では、周波数領域のサンプル列に含まれる全てのサンプルが0以上の値であるかの如く図示してあるが、これは、サンプルの並べ替えによって低域側に、より大きな振幅を持つサンプルが偏ることを分かりやすく図示するための便宜に過ぎない。周波数領域のサンプル列に含まれる各サンプルは正または負またはゼロの値をとる場合があり、このような場合であっても、上述の並べ替え処理あるいは後述の並べ替え処理を実行すればよい。
並べ替えの対象となる番号jの最大値を決定付ける上限Nあるいは第1の所定の周波数を全てのフレームに共通の値とせずに、フレーム毎に異なる上限Nあるいは第1の所定の周波数を設定してもよい。この場合、フレームごとに上限Nあるいは第1の所定の周波数を指定する情報を復号側へ送ればよい。また、並べ替えの対象となる番号jの最大値を指定するのではなく、並べ替えるサンプル群の個数を指定してもよく、この場合、サンプル群の個数をフレーム毎に設定して、サンプル群の個数を指定する情報を復号側へ送ってもよい。もちろん、並べ替えるサンプル群の個数を全てのフレームに共通としてもよい。また、第2の所定の周波数fについても、全てのフレームに共通の値とせずに、フレーム毎に異なる第2の所定の周波数fを設定してもよい。この場合、フレームごとに第2の所定の周波数を指定する情報を復号側へ送ればよい。
このように並べ替えられた後のサンプル列は、周波数を横軸とし、サンプルの指標を縦軸とした場合に、サンプルの指標の包絡線が周波数の増大に伴って下降傾向を示すことになる。この理由として、周波数領域のサンプル列は音響信号、特に音声信号や楽音信号の特徴として、一般的に高周波成分が少ないという事実が挙げられる。換言すれば、並べ替え部5は、サンプルの指標の包絡線が周波数の増大に伴って下降傾向を示すように入力されたサンプル列に含まれる少なくとも一部のサンプルを並べ替えると言ってもよい。
さらに、この実施形態では低域側に、周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルを集める並べ替えを行ったが、逆に高域側に、周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルを集める並べ替えを行ってもよい。この場合、サンプル列Aではサンプル群が逆順で並べられ、サンプル列Bではサンプルセットが逆順で並べられ、低域側にサンプル列Bが配置されサンプルBの後ろにサンプル列Aが配置される。つまり、上述の例であれば、低域側から、第6のサンプルセットF(5T+2),…F(jmax)、第5のサンプルセットF(4T+2),…,F(5T-2)、第4のサンプルセットF(3T+2),…,F(4T-2)、第3のサンプルセットF(2T+2),…,F(3T-2)、第2のサンプルセットF(T+2),…,F(2T-2)、第1のサンプルセットF(1),…,F(T-2)、第5のサンプル群F(5T-1),F(5T),F(5T+1)、第4のサンプル群F(4T-1),F(4T),F(4T+1)、第3のサンプル群F(3T-1),F(3T),F(3T+1)、第2のサンプル群F(2T-1),F(2T),F(2T+1)、第1のサンプル群F(T-1),F(T),F(T+1)の順番でサンプルが並べられる。
このように並べ替えられた後のサンプル列は、周波数を横軸とし、サンプルの指標を縦軸とした場合に、サンプルの指標の包絡線が周波数の増大に伴って増大傾向を示すことになる。換言すれば、並べ替え部5は、サンプルの指標の包絡線が周波数の増大に伴って増大傾向を示すように入力されたサンプル列に含まれる少なくとも一部のサンプルを並べ替えると言ってもよい。
間隔Tは整数ではなく小数(たとえば5.0、5.25、5.5、5.75)であってもよい。この場合、例えば、R(nT)をnTを四捨五入した値として、F(R(nT-1)),F(R(nT)),F(R(nT+1))が選択されることになる。
「符号化部6」
符号化部6が、入力された並べ替え後のサンプル列を符号化し、得られた符号列を出力する(ステップS6)。符号化部6は、入力された並べ替え後のサンプル列に含まれるサンプルの振幅の偏りに応じて可変長符号化を切り替えて符号化する。つまり、並べ替えによってフレーム内で低域側(あるいは高域側)に振幅の大きなサンプルが集められているので、符号化部6はその偏りに適した可変長符号化を行う。並べ替え後のサンプル列のように、局所的な領域ごとに同等か同程度の振幅を持つサンプルが集まっていると、例えば領域ごとに異なるライスパラメータでライス符号化することによって平均符号量を削減できる。以下、フレーム内で低域側(フレームの先頭に近い側)に振幅の大きなサンプルが集められている場合を例に採って説明する。
[符号化の具体例]
具体例として、符号化部6は、大きな振幅に対応する指標をもつサンプルが集まっている領域ではサンプルごとにライス符号化(ゴロム-ライス符号化ともいう)を適用する。
この領域以外の領域では、符号化部6は、複数のサンプルごとにエントロピー符号化(ハフマン符号化や算術符号化など)を適用する。ライス符号化の適用に関して、ライス符号化の適用領域とライスパラメータが固定されていてもよいし、あるいは、ライス符号化の適用領域とライスパラメータの組み合わせが異なる複数の選択肢の中から一つ選択できる構成であってもよい。このような複数の選択肢から一つを選択する際、ライス符号化の選択情報として、例えば下記のような可変長符号(記号""で囲まれたバイナリ値)を使うことができ、符号化部6は選択情報も符号列に含めて出力する。
"1":ライス符号化を適用しない。
"01":ライス符号化を先頭から1/32の領域にライスパラメータを1として適用する。
"001":ライス符号化を先頭から1/32の領域にライスパラメータを2として適用する。
"0001":ライス符号化を先頭から1/16の領域にライスパラメータを1として適用する。
"00001":ライス符号化を先頭から1/16の領域にライスパラメータを2として適用する。
"00000":ライス符号化を先頭から1/32の領域にライスパラメータを3として適用する。
なお、このような選択肢の中からどれを選択すればよいかを決める方法として、符号化処理で得られる各ライス符号化に対応する符号列の符号量を比較し、最も符号量が小さい選択肢を選択するという方法を採用すればよい。
また、並べ替え後のサンプル列に0の振幅を持つサンプルが長く続く領域が現れると、0の振幅を持つサンプルの連続数を例えばランレングス符号化することにより平均符号量を削減できる。このような場合、符号化部6は、(1)大きな振幅に対応する指標をもつサンプルが集まっている領域ではサンプルごとにライス符号化を適用し、(2)この領域以外の領域では、(a)0の振幅を持つサンプルが連続する領域では、0の振幅を持つサンプルの連続数を表す符号を出力する符号化を行い、(b)残りの領域では、複数のサンプルごとにエントロピー符号化(ハフマン符号化や算術符号化など)を適用する。このような場合であっても、上述のようなライス符号化の選択を行ってもよい。このような場合、どの領域にランレングス符号化が適用されたかを表す情報も復号側へ伝送される必要があり、例えばこの情報は上記の符号列に含められる。さらに、エントロピー符号化に属する複数の符号化方法を選択肢として用意してある場合には、いずれの符号化を選択したかを特定するための情報も復号側へ伝送される必要があり、例えばこの情報は上記の符号列に含められる。
[間隔Tの決定方法]
間隔Tの決定方法について説明する。簡便な決定方法の一例として、間隔Tの異なるZ個の候補T1,T2,…,TZを予め用意しておき、並べ替え部5が各候補Ti(i=1,2,…,Z)についてサンプル列に含まれるサンプルの並べ替えを実施し、後述する符号化部6が各候補Tiに基づいて得られたサンプル列に対応する符号列の符号量を得て、最小の符号量を与えた候補Tiを間隔Tとして選択するという決定方法を挙げることができる。サンプル列に含まれるサンプルの並べ替えを特定する補助情報、例えば、間隔Tを符号化して得られる符号、は符号化部6から出力される。
適切な間隔Tを決定するためには、Zは十分に大きい数であることが望ましい。しかし、Zが十分に大きい数であると、全ての候補について実際の符号量を計算するためにかなりの演算処理量が必要となり、効率の観点から問題となる場合があるかもしれない。このような観点から演算処理量を削減するために、Z個の候補に対して予備選択処理を適用して候補の数をY個に絞り込むことが考えられる。ここで予備選択処理とは、各候補に基づいて得られた並べ替え後のサンプル列(場合によっては並べ替え前のサンプル列)に対応する符号列の符号量を近似的に求める、(符号量の推定値を求める)、あるいは当該符号列の符号量を反映する指標、あるいは当該符号列の符号量の大小と関連が認められる指標(ただし、ここでの指標は「符号量」とは異なる)を求めることにより、最終選択処理の対象となる候補を選ぶ処理をいう。最終選択処理は、サンプル列に対応する符号列の実際の符号量に基づいて間隔Tを選択する処理である。予備選択処理の具体的な処理内容は種々考えられるが、いずれにせよ予備選択処理で得られたY個の候補それぞれについてサンプル列に対応する符号列の符号量の算出を実際に行い、最小の符号量を与えた候補Tj(Tj∈SY;ただしSYはY個の候補の集合を表す)を間隔Tとして選択する。Yは少なくともY<Zを満たすことが必須であるが、演算処理量の有意義な削減の観点からは、例えばY≦Z/2を満たすように、YはZに比べてある程度小さい値に設定しておくことが好ましい。一般に符号量を算出する処理は多大な演算処理量を要するが、この演算処理量をAとし、予備選択処理の演算処理量はその1/10程度の演算処理量A/10と仮定すると、Z個の候補の全てについて符号量を算出する処理を行うとこの演算処理量はZAであり、他方、Z個の候補について予備選択処理を行い、予備選択処理で選定されたY個の候補について符号量を算出する処理を行うと、全体の演算処理量は(ZA/10+YA)になる。この場合、Y<9Z/10を満たすならば、予備選択処理を経由する方法の方が少ない演算処理量で間隔Tを決定できることがわかる。
本発明では、さらに少ない演算処理量で間隔Tを決定する方法を提供し、この実施の形態の説明に先立ち、低演算処理量で間隔Tを決定するコンセプトを説明する。
一般的に、音声や楽音などの音響信号では、複数のフレームに跨る定常的な信号区間では音響信号の周期性特徴量が当該複数のフレームに亘ってゆるやかに変化することが多い。従って、或るフレームXtの時間的に直前のフレームXt-1において決定された間隔Tt-1を考慮することによって、当該フレームXtにおける間隔Ttを効率良く決定することができると考えられる。ただし、フレームXt-1において決定された間隔Tt-1がフレームXtにおいても適切な間隔Ttであるとは限らないので、フレームXt-1において決定された間隔Tt-1のみを考慮に入れるのではなく、フレームXt-1において間隔Tt-1を決定する際に用いられた間隔Tの候補を、フレームXtにおいて間隔Ttを決定する際の間隔Tの候補に含めることが好ましい。
他方、複数のフレームに跨る非定常的な信号区間では、隣接するフレーム間であっても、音響信号の周期性特徴量の連続性を期待することは難しい。従って、図示しない別途の手段によって複数のフレームに跨る信号区間が定常的な信号区間であるか非定常的な信号区間であるかの判定がされていない状況であるならば、「フレームXt-1において間隔Tt-1を決定する際に用いられた間隔Tの候補の中から、フレームXtにおける間隔Ttを探索する」という方針が好ましい結果を齎すとは必ずしも言えない。つまり、当該状況の下では、フレームXt-1において間隔Tt-1を決定する際に用いられた間隔Tの候補に依存しない間隔Tの候補の中からも、フレームXtにおける間隔Ttを探索できるようにした方がよいのである。
このようなコンセプトに基づく実施の形態を具体的に説明する(図7と図8参照)。この実施形態では、図10に示すように符号化装置100aには間隔決定部7が備えられ、間隔決定部7内に並べ替え部5と符号化部6と補助情報生成部8とが備えられる。
(A)予備選択処理(ステップS71)
サンプル列に含まれるサンプルの並べ替えを特定する補助情報によって表現することが可能な間隔Tの候補は、補助情報を固定長符号化するか可変長符号化するか等の後述する符号化方法と対応して予め定められている。間隔決定部7は、この予め定められている間隔Tの異なるZ個の候補T1,T2,…,TZの中から予め決定されたZ1個の候補を記憶しておく(Z1<Z)。その目的は予備選択処理の対象となる候補の数を少なくすることにある。予備選択処理の対象となる候補には、T1,T2,…,TZのうち、そのフレームの間隔Tとして好ましいものをできるだけ多く含むことが望まれる。しかし実際には予備選択処理を行う前の段階では好ましさは不明であるので、間隔決定部7は、例えば、Z個の候補T1,T2,…,TZの中から等間隔に選択したZ1個の候補を予備選択処理の対象とする。例えば「Z個の候補T1,T2,…,TZの中の奇数番目の候補を予備選択処理の対象とする」(この場合、Z1=ceil(Z/2)となる。ceil(・)は天井関数である)という基準でZ個の候補T1,T2,…,TZの中のZ1個の候補を予備選択処理の対象とすればよい。Z個の候補の集合をSZとし(SZ={T1,T2,…,TZ})、Z1個の候補の集合をSZ1とする。
間隔決定部7は、予備選択処理の対象とされたZ1個の候補について上述の選択処理を実施する。この選択処理で絞り込まれた候補の数をZ2個とする。既述のとおり、予備選択処理の具体的な処理内容は種々考えられるが、並べ替え後のサンプル列に対応する符号列の符号量の大小と関連が認められる指標に基づく方法としては、例えば、サンプルの指標の低域への集中度や、周波数軸で最高周波数から低域側に向かってゼロの振幅を持つサンプルの連続数に基づいてZ2個の候補を決定することが考えられる。
具体的には、Z2の値を予め設定していない場合には次のような予備選択処理を行う。間隔決定部7は、それぞれの候補について、当該候補に基づいて上記で説明したサンプル列の並べ替えを行い、並べ替えられた後のサンプル列の低域側から例えば1/4の領域に含まれるサンプルの振幅の絶対値の和をサンプル列に対応する符号列の符号量の大小と関連が認められる指標として求め、この和が予め定められた閾値と比較して大きければ、当該候補を選択する。あるいは、間隔決定部7は、それぞれの候補について、当該候補に基づいて上記で説明したサンプル列の並べ替えを行い、並べ替えられた後のサンプル列において最高周波数から低域側に向かってゼロの振幅を持つサンプルの連続数をサンプル列に対応する符号列の符号量の大小と関連が認められる指標として求め、この連続数が予め定められた閾値と比較して大きければ、当該候補を選択する。並べ替えは並べ替え部5が行なう。この場合、決定された候補の数がZ2であり、フレームごとにZ2の値は変わりえる。
2の値を予め設定している場合には次のような予備選択処理を行う。Z1個の候補それぞれについて、間隔決定部7は、各候補に基づく上記で説明したサンプル列の並べ替えを行い、サンプルが並べ替えられた後のサンプル列の低域側から例えば1/4の領域に含まれるサンプルの振幅の絶対値の和をサンプル列に対応する符号列の符号量の大小と関連が認められる指標として求め、この和の値の大きい方からZ2個の候補を選択する。あるいは、Z1個の候補それぞれについて、各候補に基づく上記で説明したサンプル列の並べ替えを行い、サンプルが並べ替えられた後のサンプル列において最高周波数から低域側に向かってゼロの振幅を持つサンプルの連続数をサンプル列に対応する符号列の符号量の大小と関連が認められる指標として求め、この連続数の大きい方からZ2個の候補を選択する。サンプル列の並べ替えは並べ替え部5が行なう。この場合、どのフレームでもZ2の値は同じである。当然であるが、Z>Z1>Z2なる関係を少なくとも満たす。Z2個の候補の集合をSZ2とする。
(B)追加処理(ステップS72)
次に、間隔決定部7は、(A)の予備選択処理で得られた候補の集合SZ2に一つまたは複数の候補を追加する処理を行う。この追加処理を行う目的は、フレームごとにZ2の値が変わりえる場合にZ2の値が小さくなりすぎて上述の最終選択処理における間隔Tの探索範囲が狭くなりすぎることを防止すること、あるいは、Z2の値がある程度大きな値であったとしても、上述の最終選択処理において適切な間隔Tが決定される可能性を少しでも広げること、である。なお、本発明の間隔Tの決定方法の目的は、演算処理量を従来技術より少なくすることであるから、集合SZ2の要素(候補)の数を|SZ2|と表せば|SZ2|=Z2であり、追加される候補の数をQとすると、QがZ2+Q<Zを満たすことが必須条件となる。さらに好ましい条件は、QがZ2+Q<Z1を満たすことである。追加される候補は、例えば、集合SZ2に含まれる候補Tkの前後の候補Tk-1,Tk+1∈SZとしてもよい(ここでの「前後」とは、集合SZ={T1,T2,…,TZ}に値の大きさに基づく順序T1<T2<…<TZを導入したときの前後を意味する)。この理由は(A)の予備選択処理の対象であるZ1個の候補に候補Tk-1,Tk+1が含まれていない可能性があるからである。ただし、候補Tk-1,Tk+1∈SZ1であって候補Tk-1,Tk+1が集合SZ2に含まれない場合、候補Tk-1,Tk+1を追加しないようにしてもよい。また、追加される候補は、集合SZから選択されればよく、例えば、集合SZ2に含まれる候補Tkについて、Tk−α(ただし、Tk−α∈SZ)および/またはTk+β(ただし、Tk+β∈SZ)を新しい候補として追加するようにしてもよい。ここでα,βは例えば予め定められた正の実数値である。α=βであってもよい。Tk−αおよび/またはTk+βが集合SZ2に含まれる他の候補と重複する場合は、このTk−αおよび/またはTk+βを追加しないようにする(追加しても意味がないからである)。Z2+Q個の候補の集合をSZ3とする。続いて、(D1)または(D2)の処理が行われる。
(D)予備選択処理(ステップS73)
(D1−ステップS731)間隔決定部7は、間隔Tを決定する対象のフレームが時間的に先頭のフレームである場合、集合SZ3に含まれるZ2+Q個の候補について上述の予備選択処理を実施する。この予備選択処理で絞り込まれた候補の数をY個とする。YはY<Z2+Qを満たす。
既述のとおり、予備選択処理の具体的な処理内容は種々考えられるが、例えば、(A)における予備選択処理と同じ内容の処理を行ってもよい(ただし、出力される候補の数は異なる(つまり、Y≠Z2))。この場合、Yの値がフレームごとに変わりえることに留意しなければならない。(A)における予備選択処理と異なる内容の予備選択処理を行うならば、例えば、集合SZ3に含まれるZ2+Q個の候補それぞれについて、各候補に基づく上記で説明したサンプル列の並べ替えを行い、並べ換え後のサンプル列を符号化して得られる符号列の符号量を近似的に求める予め定められた近似式などを利用して、近似的符号量(符号量の推定値)を求める。サンプル列の並べ替えは並べ替え部5が行なう。(A)における予備選択処理で並べ替え後のサンプル列が得られている候補については、(A)における予備選択処理で得られた並べ替え後のサンプル列を用いてもよい。この場合、Yの値が予め設定されていないならば、近似的符号量が予め定められた閾値以下となる候補を後述の(E)符号量算出処理の対象となる候補として決定すればよく(この場合、決定された候補の数がYである)、Yの値が予め設定されているならば、近似的符号量の小さい方からY個の候補を後述の(E)最終選択処理の対象となる候補として決定すればよい。Y個の候補はメモリに記憶され、これらY個の候補は、時間的に2番目のフレームにおける間隔Tの決定の際に後述の(C)または(D2)の処理にて利用される。(D1)の処理の後、(E)の最終選択処理が行われる。
なお、(A)の予備選択処理と同じ内容の予備選択処理を(D1)で行う場合であって、(A)の予備選択処理において並べ替え後のサンプル列を符号化して得られる符号列の符号量の大小と関連が認められる指標と閾値との比較により候補を選択する場合は、(A)の予備選択処理で選択された候補は(D1)の予備選択処理でも必ず選択されるため、(B)の追加処理で追加された候補についてのみ当該指標と当該閾値との比較により候補を選択する処理を行い、ここで選択された候補と(A)の予備選択処理で選択された候補とを(E)の最終選択処理の対象となる候補とすればよい。ただし、(E)の最終選択処理は演算処理量が多いため、(D1)の予備選択処理ではYの値を予め設定した固定値とし、近似的符号量の小さい方からY個の候補を(E)の最終選択処理の対象となる候補として決定するほうが好ましい。
(D2−ステップS732)間隔決定部7は、間隔Tを決定する対象のフレームが時間的に先頭のフレームでない場合、和集合SZ3∪SPに含まれる高々Z2+Q+Y+W個(ただし、|SP|=Y+W)の候補について上述の予備選択処理を実施する。ここで和集合SZ3∪SPについて説明する。間隔Tを決定する対象のフレームをXt,フレームXtの時間的に直前のフレームをXt-1とする。集合SZ3は上述の(A)−(B)の処理で得られたフレームXtにおける候補の集合であり、集合SZ3に含まれる候補の数はZ2+Qである。集合SPは、フレームXt-1において間隔Tを決定する際に後述の(E)の最終選択処理の対象となった候補の集合SYと、当該集合SYに対して後述する(C)の追加処理によって追加される候補の集合SWとの和集合である。集合SYはメモリに記憶されている。|SY|=Y,|SW|=Wであり、少なくとも|SZ3∪SP|<Zが必須条件である。和集合SZ3∪SPに含まれる高々Z2+Q+Y+W個の候補について上述の予備選択処理を実施する。この予備選択処理で絞り込まれた候補の数をY個とする。YはY<|SZ3∪SP|≦Z2+Q+Y+Wを満たす。既述のとおり、予備選択処理の具体的な処理内容は種々考えられるが、例えば、上述の(B)における予備選択処理と同じ内容の処理を行ってもよい(ただし、出力される候補の数は異なる(つまり、Y≠Z2))。この場合、Yの値がフレームごとに変わりえることに留意しなければならない。上述の(B)における予備選択処理と異なる内容の予備選択処理を行うならば、例えば、|SZ3∪SP|個の候補それぞれについて、各候補に基づく上記で説明したサンプル列の並べ替えを行い、並べ換え後のサンプル列を符号化して得られる符号列の符号量を近似的に求める予め定められた近似式などを利用して、近似的符号量(符号量の推定値)を求める。サンプル列の並べ替えは並べ替え部5が行なう。(A)における予備選択処理で並べ替え後のサンプル列が得られている候補については、(A)における予備選択処理で得られた並べ替え後のサンプル列を用いてもよい。この場合、Yの値が予め設定されていないならば、近似的符号量が予め定められた閾値以下となる候補を後述の(E)の最終選択処理の対象となる候補として決定すればよく(この場合、決定された候補の数がYである)、Yの値が予め設定されているならば、近似的符号量の小さい方からY個の候補を後述の(E)の最終選択処理の対象となる候補として決定すればよい。Y個の候補はメモリに記憶され、これらY個の候補は、時間的に次のフレームにおける間隔Tの決定の際に実施される(D2)の処理にて利用される。(D2)の処理の後、(E)の最終選択処理が行われる。
なお、(A)の予備選択処理と同じ内容の予備選択処理を(D2)で行う場合であって、(A)の予備選択処理において並べ換え後のサンプル列を符号化して得られる符号列の符号量の大小と関連が認められる指標と閾値との比較により候補を選択する場合は、(A)の予備選択処理で選択された候補は(D2)の予備選択処理でも必ず選択されるため、(B)の追加処理で追加された候補とフレームXt-1において間隔Tを決定する際に後述の(E)の最終選択処理の対象となった候補と(C)の追加処理で追加された候補について当該指標と当該閾値との比較により候補を選択する処理を行い、ここで選択された候補と(A)の予備選択処理で選択された候補とを(E)の最終選択処理の対象となる候補とすればよい。ただし、(E)の最終選択処理は演算処理量が多いため、(D2)の予備選択処理ではYの値を予め設定した固定値とし、近似的符号量の小さい方からY個の候補を(E)の最終選択処理の対象となる候補として決定するほうが好ましい。
(C)追加処理(ステップS74)
間隔決定部7は、フレームXt-1において間隔Tを決定する際に後述の(E)の最終選択処理の対象となった候補の集合SYに一つまたは複数の候補を追加する処理を行う。集合SYに対して追加される候補は、例えば、集合SYに含まれる候補Tmの前後の候補Tm-1,Tm+1∈SZとしてもよい(ここでの「前後」とは、集合SZ={T1,T2,…,TZ}に値の大きさに基づく順序T1<T2<…<TZを導入したときの前後を意味する)。また、追加される候補は、集合SZから選択されればよく、例えば、集合SYに含まれる候補Tmについて、Tm−γ(ただし、Tm−γ∈SZ)および/またはTm+η(ただし、Tm+η∈SZ)を新しい候補として追加するようにしてもよい。ここでγ,ηは例えば予め定められた正の実数値である。γ=ηであってもよい。Tm−γおよび/またはTm+ηが集合SYに含まれる他の候補と重複する場合は、このTm−γおよび/またはTm+ηを追加しないようにする(追加しても意味がないからである)。続いて、(D2)の処理が行われる。
(E)最終選択処理(ステップS75)
間隔決定部7はY個の候補のそれぞれについて、各候補に基づく上記で説明したサンプル列の並べ替えを行い、並べ替え後のサンプル列を符号化して符号列を得て、符号列の実際の符号量を求め、最小の符号量を与えた候補を間隔Tとして選択する。サンプル列の並べ替えは並べ替え部5が行ない、並べ替え後のサンプル列の符号化は符号化部6が行う。(A)または(D)における予備選択処理で並べ替え後のサンプル列が得られている候補については、予備選択処理で得られた並べ替え後のサンプル列を入力として符号化部6が符号化を行えばよい。
なお、(B)の追加処理、(C)の追加処理、(D)の予備選択処理は必須ではなく、これらのうち少なくともいずれか一つを行わない実施構成であってもよい。(B)の追加処理を行わない場合、集合SZ3の要素(候補)の数を|SZ3|と表せば、Q=0であるから|SZ3|=Zである。(D)の予備選択処理を行わない場合には、集合SZ3に含まれる高々Z2+Q個の候補(間隔Tを決定する対象のフレームが時間的に先頭のフレームである場合)または和集合SZ3∪SPに含まれる高々Z2+Q+Y+W個の候補(間隔Tを決定する対象のフレームが時間的に先頭のフレームでない場合)が(E)の最終選択処理の対象となる。
上記の間隔Tの決定に関する説明では、「先頭のフレーム」を「時間的に先頭のフレーム」としたが、このようなフレームに限定されるものではない。「先頭のフレーム」は、次の(1)―(3)の条件Aを満たすフレーム以外のフレームであればよい(図9参照)。
<条件A>
フレームについて、
(1)当該フレームが時間的に先頭ではなく、
(2)一つ前のフレームが本発明の符号化方法に従って符号化されたものであり、かつ、
(3)一つ前のフレームが上述の並べ替え処理の適用を受けている。
上述の説明では、(D2)の処理にて、集合SYを、「直前のフレームXt-1において間隔Tを決定する際に後述の(E)の最終選択処理の対象となった候補の集合」としたが、集合SYは「間隔Tを決定する対象のフレームよりも時間的に前の複数のフレームのそれぞれにおいて間隔Tを決定する際に後述の(E)の最終選択処理の対象となった候補の集合の和集合」であってもよい。つまり、過去のフレームの個数をmとすれば、集合SYは、フレームXt-1において間隔Tを決定する際に後述の(E)の最終選択処理の対象となった候補の集合St-1と、フレームXt-2において間隔Tを決定する際に後述の(E)の最終選択処理の対象となった候補の集合St-2と、・・・、フレームXt-mにおいて間隔Tを決定する際に後述の(E)の最終選択処理の対象となった候補の集合St-mとの和集合、すなわちSY=St-1∪St-2∪…∪St-mである。ただし、mが大きいと演算処理量が増大するので、Z,Z1,Z2,Qの値などにもよるが、mは1,2,3のいずれかとすることが好ましい。
符号量を算出する処理の演算処理量をAとし、予備選択処理の演算処理量はその1/10程度の演算処理量A/10と仮定すると、Z,Z1,Z2,Q,W,Yが固定値として予め設定されている場合に(A),(B),(C),(D2)の各処理を実施したときの演算処理量は高々((Z1+Z2+Q+Y+W)A/10+YA)となる。ここでZ2+Q≒3Z2,Y+W≒3Yとすると、演算処理量は((Z1+3Z2+3Y)A/10+YA)となる。上述の演算処理量(ZA/10+YA)と比較した場合、Z>(Z1+3Z2+3Y)を満たすようにZ,Z1,Z2,Yを設定すれば演算処理量を削減できることになる。例えば一例としてZ=256、Z1=64、Z2=Y=8とすることができる。
SZ={T1,T2,…,TZ}はフレームごとに同じでも異なってもよい。また、Zの値はフレームごとに同じでも異なってもよい。ただし、(E)の最終選択処理の対象となる候補の数はZよりも小さくなることが要求されるので、(D2)の処理にて|SY|がZ以上である場合には、例えば、メモリから読み込んだ集合SYに対して上述の(A)の予備選択処理と同様の指標を用いた候補の絞り込みを行い、(E)の最終選択処理の対象となる候補の数がZよりも小さくなるようにすればよい。また、(D)の予備選択処理を行わない場合であって|SZ3∪SP|≧Zの場合にもSZ3∪SPに対して上述の(A)の予備選択処理と同様の指標を用いた候補の絞り込みを行い、(E)の最終選択処理の対象となる候補の数がZよりも小さくなるようにすればよい。
<間隔Tの決定方法の変形例>
音声や楽音などの音響信号では複数のフレームに跨る定常的な信号区間では現在のフレームと過去のフレームとの相関が高いことが多い。定常信号の持つこのような性質を利用して、(D2)の処理にてSZ3とSPの比率を変えることによって圧縮性能を維持しつつ、より処理演算量を下げることができる。なお、ここでの比率は、SZ3に対するSPの比として定められていてもよいし、SPに対するSZ3の比として定められていてもよいし、SZ3∪SPにおけるSPの占有率として定められていてもよいし、SZ3∪SPにおけるSZ3の占有率として定められていてもよい。
或る信号区間の定常性が大きいか否かは、例えば定常性の大きさを表す指標値が閾値以上であるか否か、または、閾値より大きいか否か、により判断することができる。定常性の大きさを表す指標値は、例えば、下記に示されるものである。以下、間隔Tを決定する対象のフレームを現フレームと呼称し、現フレームの時間的に直前のフレームを直前フレームと呼称する。定常性の大きさを表す指標値は、
(a-1)「現フレームの音響信号の予測利得」が大きい、
(a-2)「現フレームの音響信号の予測利得の推定値」が大きい、
(b-1)「直前フレームの音響信号の予測利得」と「現フレームの音響信号の予測利得」との差分が小さい、
(b-2)「直前フレームの音響信号の予測利得の推定値」と「現フレームの音響信号の予測利得の推定値」との差分が小さい
(c-1)「現フレームに含まれる音響信号のサンプルの振幅の和」が大きい、
(c-2)「現フレームに含まれる音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」が大きい、
(d-1)「直前フレームに含まれる音響信号のサンプルの振幅の和」と「現フレームに含まれる音響信号のサンプルの振幅の和」との差分が小さい、
(d-2)「直前フレームに含まれる音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」と「現フレームに含まれる音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」との差分が小さい、
(e-1)「現フレームの音響信号のパワー」が大きい、
(e-2)「現フレームの音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」が大きい、
(f-1)「直前フレームの音響信号のパワー」と「現フレームの音響信号のパワー」との差分が小さい、
(f-2)「直前フレームの音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」と「現フレームの音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」との差分が小さい、
ほど大きくなる値である。
なお、予測利得は予測符号化における原信号のエネルギーの予測誤差信号のエネルギーに対する比であって、この値は、重み付け包絡正規化部2が出力した当該フレームの重み付け正規化MDCT係数列に含まれるサンプルの値の絶対値の総和に対する周波数領域変換部1が出力した当該フレームのMDCT係数列に含まれるサンプルの値の絶対値の総和の比、または、当該フレームの重み付け正規化MDCT係数列に含まれるサンプルの値の二乗の総和に対する当該フレームのMDCT係数列に含まれるサンプルの値の二乗の総和の比、の値にほぼ比例する。そこで、「フレームの音響信号の予測利得」と大小関係が等価な値として前記の何れかの比の値を用いることができる。
「フレームの音響信号の予測利得」は、重み付け包絡正規化部2で用いる当該フレームの線形予測係数と対応するm次のPARCOR係数をkmとしたとき、
Figure 0005596800

により計算されるEのことである。ここで、線形予測係数と対応するPARCOR 係数は、量子化前の全次のPARCOR係数とする。なお、線形予測係数と対応するPARCOR 係数として、一部の次数(例えば、1次からP2次まで。ただし、P2<P。)の量子化前のPARCOR係数、または、一部または全次の量子化後のPARCOR係数、を用いてEを計算した場合は、計算されたEは「フレームの音響信号の予測利得の推定値」となる。
「フレームに含まれる音響信号のサンプルの振幅の和」とは、当該フレームに含まれる音声音響ディジタル信号のサンプル値の絶対値の総和、または、周波数領域変換部1が出力した当該フレームのMDCT係数列に含まれるサンプルの値の絶対値の総和、である。
「フレームの音響信号のパワー」とは、当該フレームに含まれる音声音響ディジタル信号のサンプル値の二乗の総和、または、周波数領域変換部1が出力した当該フレームのMDCT係数列に含まれるサンプルの値の二乗の総和、である。
なお、例示された(a)〜(f)のいずれか一つを定常性の大小判定に用いてもよいし、例示された(a)〜(f)のうち二つ以上の間の論理和や論理積を定常性の大小判定に用いてもよい。前者の場合、間隔決定部7が、例えば(a)の「現フレームの音響信号の予測利得」だけを用いて、「現フレームの音響信号の予測利得」Gと予め定められた閾値εとの間にε<Gが成立した場合に定常性が大きいと判断し、あるいは、例えば(b)の「直前フレームの音響信号の予測利得」と「現フレームの音響信号の予測利得」との差分だけを用いて、「直前フレームの音響信号の予測利得」と「現フレームの音響信号の予測利得」との差分Gdiffと予め定められた閾値τとの間にGdiff<τが成立した場合に定常性が大きいと判断する。後者の場合、間隔決定部7が、例えば(c)と(e)の両基準を用いて、「現フレームに含まれる音響信号のサンプルの振幅の和」Acと予め定められた閾値ξとの間にξ<Acが成立し且つ「現フレームの音響信号のパワー」Pcと予め定められた閾値δとの間にδ<Pcが成立した場合に定常性が大きいと判断し、あるいは、例えば(a)と(c)と(f)の基準を用いて、「現フレームの音響信号の予測利得」Gと予め定められた閾値εとの間にε<Gが成立し又は「現フレームに含まれる音響信号のサンプルの振幅の和」Acと予め定められた閾値ξとの間にξ<Acが成立し、且つ、「直前フレームの音響信号のパワー」と「現フレームの音響信号のパワー」との差分Pdiffと予め定められた閾値θとの間にPdiff<θが成立した場合に定常性が大きいと判断する。
このような定常性の大小判定によって変更されるSZ3とSPの比率は、例えば予め間隔決定部7内のルックアップテーブルに定められているとする。通常、定常性が大きいと判定された場合、SZ3∪SPにおいてSPの比率が高まるように(相対的にSZ3の比率が低くなるように、あるいはSZ3∪SPにおいてSPの比率が50%を超えるように)設定され、定常性が大きくないと判定された場合、SZ3∪SPにおいてSPの比率が低くなるように(相対的にSZ3の比率が高くなるように、あるいはSZ3∪SPにおいてSPの比率が50%を超えないように)、あるいは当該比率が同程度となるように設定される。定常性が大きいと判定された場合、(D2)の処理にて、ルックアップテーブルを参照してSPの比率(あるいはSZ3の比率)を決定し、SPとSZ3に含まれる候補の数が当該比率に適合するように、例えば上述の(A)の予備選択処理と同様の指標が大きいものから候補を選択する処理によって集合SZ3に含まれる候補の数を減らす。反対に、定常性が大きくないと判定された場合、(D2)の処理にて、ルックアップテーブルを参照してSPの比率(あるいはSZ3の比率)を決定し、SPとSZ3に含まれる候補の数が当該比率に適合するように、例えば上述の(A)の処理と同様の指標が大きいものから候補を選択する処理によって集合SPに含まれる候補の数を調整する。このような処理によると、(D2)の処理の対象となる候補の数を減らせると同時に、現フレームの間隔Tが候補として含まれるであろう方の集合の比率を高めることができ、効率よく間隔Tを決定することが可能になる。なお、定常性が大きくないと判定された場合、SPを空集合としてもよい。つまり、この場合、過去のフレームにおいて(E)の最終選択処理の対象となった候補を現フレームにおける(D)の予備選択処理の対象に含めないようにするのである。
また、ルックアップテーブルに、定常性の大小の程度に応じてSZ3とSPの異なる比率を設定しておく実施構成も可能である。例えば(a)の基準の「現フレームの音響信号の予測利得」だけを用いて定常性の大小を判定する場合、「現フレームの音響信号の予測利得」Gに対して複数の閾値ε1,ε2,…,εk-1,εk(ただし、ε1<ε2<…<εk-1<εk)が予め与えられており、ルックアップテーブルに、
G<ε1 ⇒ SZ3∪SPにおけるSPの比率:10%
ε1≦G<ε2 ⇒ SZ3∪SPにおけるSPの比率:20%

εk-1≦G<εk ⇒ SZ3∪SPにおけるSPの比率:80%
εk≦G ⇒ SZ3∪SPにおけるSPの比率:90%
と予め定めておくのである。ここでは(a)の基準の「現フレームの音響信号の予測利得」だけを用いる例について説明したが、他の基準はもとより、上記(a)〜(f)のうち二つ以上の間の論理和や論理積を定常性の大小判定に用いる場合であっても、ルックアップテーブルに、定常性の大小の程度に応じてSZ3とSPの異なる比率を設定しておくことができる。
以上の説明では、(D2)の処理で集合SZ3とSPが定まっている状況にて、定常性の大小判定に基づいてSZ3とSPの比率を変更する実施の例を説明したが、定常性の大小判定を集合SZ3とSPの決定よりも前に行う実施も可能である。例えば、ルックアップテーブルに、Yの値との関係で定常性の大小の判定結果に応じたZ1,Z2,Q,Wの値を予め設定しておく。定常性が大きいと判定された場合に対応するZ1,Z2,Qの値のうち少なくともいずれか(好ましくはZ2やQ)が、Y+Wの値(ただし、W=0も可とする)に比して|SZ3|が小さくなるように小さい値に設定される(あるいはWが大きい値に設定される)。定常性が大きくないと判定された場合に対応するZ1,Z2,Qの値のうち少なくともいずれか(好ましくはZ2やQ)が、Y+Wの値(ただし、W=0も可とする)に比して|SZ3|が大きくなるように大きい値に設定される(あるいはWが小さい値に設定される)。
定常性の大小判定を集合SZ3とSPの決定よりも前に行う実施の形態においても、ルックアップテーブルに、定常性の大小の程度に応じたZ1,Z2,Qの値を設定しておくことが可能である。例えば(a)の基準の「現フレームの音響信号の予測利得」だけを用いて定常性の大小を判定する場合、「現フレームの音響信号の予測利得」Gに対して複数の閾値ε1,ε2,…,εk-1,εk(ただし、ε1<ε2<…<εk-1<εk)が予め与えられており、ルックアップテーブルに、
G<ε1 ⇒ Z2=16,Q=30
ε1≦G<ε2 ⇒ Z2=12,Q=20

εk-1≦G<εk ⇒ Z2=4,Q=4
εk≦G ⇒ Z2=2,Q=0
と予め定めておくのである。ここでは(a)の基準の「現フレームの音響信号の予測利得」だけを用いる例について説明したが、他の基準はもとより、上記(a)〜(f)のうち二つ以上の間の論理和や論理積を定常性の大小判定に用いる場合であっても、ルックアップテーブルに、定常性の大小の程度に応じたZ1,Z2,Qの値を設定しておくことができる。
[周期性特徴量決定方法]
これまで少ない演算処理量で間隔Tを決定する方法を説明したが、当該方法によって決定されるべき対象は間隔Tに限定されない。当該方法は、例えば、サンプルの並べ替えの際に上記サンプル群を特定するための情報である音響信号の周期性特徴量(例えば基本周波数やピッチ周期など)を決定する方法としても使用することができる。すなわち、間隔決定部7を周期性特徴量決定装置として機能させ、並べ替え後のサンプル列を符号化して得られる符号列を出力することなく、間隔Tを周期性特徴量として決定してもよい。この場合、上述の[間隔Tの決定方法]の説明にて、「間隔T」を「ピッチ周期」に読み替えればよく、または、サンプル列のサンプリング周波数を「間隔T」で除算した値を「基本周波数」とすればよく、少ない演算処理量でサンプルの並べ替えのための基本周波数やピッチ周期を決定することができる。
[サンプル列に含まれるサンプルの並べ替えを特定する補助情報]
符号化部6または補助情報生成部8は、サンプル列に含まれるサンプルの並べ替えを特定する補助情報、すなわち、音響信号の周期性を表す情報、または基本周波数を表す情報、または音響信号の周期性または基本周波数に対応するサンプルと音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔Tを表す情報を出力する。なお、符号化部6が補助情報を出力する場合、サンプル列の符号化処理の中で補助情報を得る処理を行ってもよいし、当該符号化処理と別の処理として補助情報を得る処理を行ってもよい。例えば間隔Tをフレーム毎に決定する場合は、サンプル列に含まれるサンプルの並べ替えを特定する補助情報もフレーム毎に出力されることになる。サンプル列に含まれるサンプルの並べ替えを特定する補助情報は、周期性、基本周波数または間隔Tをフレーム毎に符号化して得られる。この符号化は固定長符号化であってもよいし、可変長符号化して平均符号量を削減してもよい。固定長符号化する場合は、例えば、補助情報と当該補助情報を一意に特定可能な符号とが対応付けられて記憶されており、入力された補助情報に対応する符号を出力する構成となる。可変長符号化する場合は、前フレームの間隔Tと現フレームの間隔Tの差分を可変長符号化した情報を間隔Tを表す情報としもよい。この場合は、例えば、間隔Tの差分値と当該差分値を一意に特定可能な符号とが対応付けられて記憶されており、入力された前フレームの間隔Tと現フレームの間隔Tの差分に対応する符号を出力する構成となる。同様に、前フレームの基本周波数と現フレームの基本周波数の差分を可変長符号化した情報を基本周波数を表す情報としてもよい。また、nを複数の選択肢から選択可能な場合には、nの上限値あるいは上述の上限Nを補助情報に含めてもよい。
[集めるサンプルの個数]
また、この実施形態では、各サンプル群に含まれるサンプルの個数が、周期性や基本周波数ないしその整数倍に対応するサンプル(以下、中心サンプルという)とその前後1サンプルの計3サンプルであるという固定された個数の例を示したが、サンプル群に含まれるサンプルの個数やサンプルインデックスを可変とする場合には、サンプル群に含まれるサンプルの個数とサンプルインデックスの組み合わせが異なる複数の選択肢の中から選択された一つを表す情報も補助情報に含める。
例えば、選択肢として、
(1)中心サンプルのみ、F(nT)
(2)中心サンプルとその前後1サンプルの計3サンプル、F(nT-1),F(nT),F(nT+1)
(3)中心サンプルとその前2サンプルの計3サンプル、F(nT-2),F(nT-1),F(nT)
(4)中心サンプルとその前3サンプルの計4サンプル、F(nT-3),F(nT-2),F(nT-1),F(nT)
(5)中心サンプルとその後2サンプルの計3サンプル、F(nT),F(nT+1),F(nT+2)
(6)中心サンプルとその後3サンプルの計4サンプル、F(nT),F(nT+1),F(nT+2),F(nT+3)
が設定されている場合に、(4)が選択されたならば、この(4)が選択されたことを表す情報が補助情報に含められる。この例であれば、選択された選択肢を表す情報として3ビットあれば十分である。
なお、このような選択肢の中からどれを選択すればよいか決める方法として、並べ替え部5では各選択肢に対応する並べ替えを実施し符号化部6で各選択肢に対応する符号列の符号量を得て、最も符号量が小さい選択肢を選択するという方法を採用すればよい。この場合は、サンプル列に含まれるサンプルの並べ替えを特定する補助情報は並べ替え部5からではなく符号化部6から出力される。この方法は、nを選択可能な場合にも妥当する。
ただし、選択肢としては、例えば、間隔Tに関する選択肢、サンプル群に含まれるサンプルの個数とサンプルインデックスの組み合わせに関する選択肢、nに関する選択肢があり、これらの選択肢の全ての組み合わせは相当の数になることが予想される。これらの選択肢の全ての組み合わせについて最終的な符号量を計算するには処理量がかかり、効率の観点から問題となる場合があるかもしれない。このような観点から処理量を削減するために、下記のような近似処理を用いることが好ましい。つまり、符号化部6では、選択肢の全ての組み合わせについて簡易で近似的な方法で符号量の推定値である近似的符号量を求め、例えば近似的符号量が最小のものから所定の複数の候補を選択する等にて好ましいと推定される複数の候補を絞り込み、絞り込まれた候補(選択された候補)中で最小の符号量を与えた選択肢を選択すれば、少ない処理量で最終的な符号量をほぼ最適に小さくできる。
一つの例として、まず、サンプル群に含まれるサンプル数を“3サンプル”に固定した上で間隔Tの候補を少数に絞り込み、各候補に対して、サンプル群に含まれるサンプル数を組み合わせて、最も好ましい選択肢を選択するようにしてもよい。
あるいは、近似的にサンプルの指標の和を測定し、サンプルの指標の低域への集中度や、周波数軸で最高周波数から低域側に向かってゼロの振幅を持つサンプルの連続数で選択肢を決定してもよい。具体的には、並べ替え後のサンプル列の振幅の絶対値の和を全体のサンプル列の低域側から1/4の領域について求め、その総和が予め定められた閾値と比較して大きければ、好ましい並べ替えであることが想定される。また、並べ替え後のサンプル列の最高周波数から低域側に向かってゼロの振幅を持つサンプルの連続数が最長となる選択肢を選択する方法に拠ると、低域に指標の大きいサンプルが集中していることを意味しており、これも好ましい並べ替えであることが想定される。
上述のような近似処理で選択肢を決定すると、処理量は少ないが、必ずしも最終的な符号量を最小とするサンプル列に含まれるサンプルの並べ替えが選択できない場合が生じる。このため、上述のような近似処理で複数の候補を選択し、これら少数の候補だけについて最終的に符号量を正確に計算して最も好ましい(符号量が小さくなる)ものを選択すればよい。
[変形例]
なお、サンプル列に含まれるサンプルの並べ替えによる利点が無い場合も考えられる。このような場合には並べ替え前のサンプル列を符号化すべきである。そこで、並べ替え部5からは並べ替え前のサンプル列(並べ替えを行っていないサンプル列)も出力し、符号化部6は並べ替え前のサンプル列も可変長符号化して符号列を得て、並べ替え前のサンプル列を可変長符号化して得られる符号列の符号量と、並べ替え後のサンプル列を可変長符号化して得られる符号列の符号量と補助情報の符号量との合計符号量とを比較する。
並べ替え前のサンプル列を可変長符号化して得られる符号列の符号量のほうが少ない場合には、並べ替え前のサンプル列を可変長符号化して得られた符号列を出力する。
並べ替え後のサンプル列を可変長符号化して得られる符号列の符号量と補助情報の符号量との合計符号量のほうが少ない場合には、並べ替え後のサンプル列を可変長符号化して得られた符号列と補助情報を出力する。
並べ替え前のサンプル列を可変長符号化して得られる符号列の符号量と、並べ替え後のサンプル列を可変長符号化して得られる符号列の符号量と補助情報の符号量との合計符号量と、が同一である場合は、並べ替え前のサンプル列を可変長符号化して得られた符号列と、並べ替え後のサンプル列を可変長符号化して得られた符号列と補助情報と、の何れか一方を出力する。何れを出力するかは、予め定めておく。
また、符号列に対応するサンプル列が並べ替えを行ったサンプル列であるか否かを表す第2補助情報も出力する(図10参照)。この第2補助情報として1ビットを使えば十分である。
なお、既述のように並べ替え後のサンプル列を可変長符号化して得られる符号列の近似的符号量すなわち符号量の推定値を得た場合には、並べ替え後のサンプル列を可変長符号化して得られる符号列の符号量に代えて、並べ替え後のサンプル列を可変長符号化して得られる符号列の近似的符号量を用いてもよい。また同様に、並べ替え前のサンプル列を可変長符号化して得られる符号列の近似的符号量すなわち符号量の推定値を得て、並べ替え前のサンプル列を可変長符号化して得られる符号列の符号量に代えて、並べ替え前のサンプル列を可変長符号化して得られる符号列の近似的符号量すなわち符号量の推定値を用いてもよい。
また、予め予測利得またはその推定値がある定められた閾値より大きい場合のみサンプル列に含まれるサンプルの並べ替えを適用することに決めておくこともできる。これは予測利得が大きいときには声帯振動や楽器の振動が強く、周期性も高い場合が多いという音声や楽音の性質を利用するものである。予測利得は原音のエネルギーを予測残差のエネルギーで割ったものである。線形予測係数やPARCOR係数をパラメータとして使う符号化においては、量子化済みのパラメータを符号化装置と復号装置で共通に使うことができる。そこで、例えば、符号化部6は、符号化装置100内の図示しない別の手段によって求めたi次の量子化済PARCOR係数k(i)を用いて、(1-k(i)*k(i))を次数ごとに乗算したものの逆数で表わされる予測利得の推定値を計算し、計算された推定値がある定められた閾値より大きい場合は並べ替え後のサンプル列を可変長符号化して得られた符号列を出力し、そうでない場合は並べ替え前のサンプル列を可変長符号化して得られた符号列を出力する。この例のように符号化装置と復号装置で共通に使うことができる場合は、符号列に対応するサンプル列が並べ替えを行ったサンプル列であるか否かを表す第2補助情報を出力する必要は無い。すなわち、予測がきかない雑音的音声や無音時には効果が小さい可能性が高いので並べ替えをしないと決めておくほうが補助情報や計算の無駄が少ない。
なお、並べ替え部5において、予測利得または予測利得の推定値の計算を行い、予測利得または予測利得の推定値がある定められた閾値より大きい場合はサンプル列に対する並べ替えを行って並べ替え後のサンプル列を符号化部6に出力し、そうでない場合はサンプル列に対する並べ替えを行なわずに並べ替え部5に入力されたサンプル列そのものを符号化部6に出力し、符号化部6では並べ替え部5から出力されたサンプル列を可変長符号化する構成としてもよい。
なお、この構成の場合には、閾値を符号化側と復号側とで共通の値として予め設定しておくこととする。
なお、ここで例示したライス符号化、エントロピー符号化、ランレングス符号化はいずれも周知であるからその詳細な説明を省略する。
「復号処理」
続いて図5〜図6を参照して復号処理を説明する。
復号装置200では、符号化装置100または符号化装置100aによる符号化処理と逆順の処理でMDCT係数が再構成される。復号装置200には、少なくとも、上記利得情報と、上記補助情報と、上記符号列が入力される。なお、符号化装置100aから第2補助情報が出力された場合にはこの第2補助情報も復号装置200に入力される。
「復号部11」
まず、復号部11が、フレームごとに、入力された符号列を選択情報に応じて復号して周波数領域のサンプル列を出力する(ステップS11)。当然であるが、符号列を得るために実行された符号化方法に対応する復号方法が実行される。復号部11による復号処理の詳細は符号化装置100の符号化部6による符号化処理の詳細に対応するので、当該符号化処理の説明をここに援用し、実行された符号化に対応する復号が復号部11の行う復号処理であることを明記し、これをもって復号処理の詳細な説明とする。なお、どのような符号化方法が実行されたかは選択情報によって特定される。選択情報に、例えば、ライス符号化の適用領域とライスパラメータを特定する情報と、ランレングス符号化の適用領域を表す情報と、エントロピー符号化の種類を特定する情報が含まれている場合には、これらの符号化方法に応じた復号方法が入力された符号列の対応する領域に適用される。ライス符号化に対応する復号処理、エントロピー符号化に対応する復号処理、ランレングス符号化に対応する復号処理はいずれも周知であるから説明を省略する。
「回復部12」
次に、回復部12が、フレームごとに、入力された補助情報に従って、復号部11が出力した周波数領域のサンプル列から元のサンプルの並びを得る(ステップS12)。ここで「元のサンプルの並び」とは、符号化装置100の並べ替え部5に入力された「周波数領域のサンプル列」に相当する。上述のとおり、符号化装置100の並べ替え部5による並べ替え方法や並べ替え方法に対応する並べ替えの選択肢は種々あるが、並べ替えが実行された場合には実行された並べ替えは一つであり、その並べ替えを特定する情報は補助情報に含まれている。よって、回復部12は補助情報に基づいて復号部11が出力した周波数領域のサンプル列を元のサンプルの並びに戻すことができる。
なお、補助情報に並べ替えを行ったか否かを表す第2補助情報が入力される構成も有り得る。この構成では、回復部12は、並べ替えを行ったか否かを表す第2補助情報が並べ替えを行ったことを示すものである場合は復号部11が出力した周波数領域のサンプル列を元のサンプルの並びに戻して出力し、並べ替えを行っていないことを示すものである場合は復号部11が出力した周波数領域のサンプル列をそのまま出力する。
また、予測利得または予測利得の推定値の大小により並べ替えを行ったか否かを判断する構成も有り得る。この構成では、回復部12は、例えば、復号装置200内の図示しない別の手段から入力されたi次の量子化済PARCOR係数k(i)を用いて、(1-k(i)*k(i))を次数ごとに乗算したものの逆数で表わされる予測利得の推定値を計算し、計算された推定値がある定められた閾値より大きい場合は復号部11が出力した周波数領域のサンプル列を元のサンプルの並びに戻して出力し、そうでない場合は復号部11が出力した周波数領域のサンプル列をそのまま出力する。
回復部12による回復処理の詳細は符号化装置100の並べ替え部5による並べ替え処理の詳細に対応するので、当該並べ替え処理の説明をここに援用し、その並べ替え処理の逆順の処理(逆の並べ替え)が回復部12の行う回復処理であることを明記し、これをもって回復処理の詳細な説明とする。なお、理解の一助のため、上述の並べ替え処理の具体例に対応する回復処理の一例を説明する。
例えば、並べ替え部5がサンプル群を低域側に集めてF(T-1),F(T),F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1),F(1),…,F(T-2),F(T+2),…,F(2T-2),F(2T+2),…,F(3T-2),F(3T+2),…,F(4T-2),F(4T+2),…,F(5T-2),F(5T+2),…F(jmax)を出力した上述の例であると、回復部12には復号部11が出力した周波数領域のサンプル列F(T-1),F(T),F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1),F(1),…,F(T-2),F(T+2),…,F(2T-2),F(2T+2),…,F(3T-2),F(3T+2),…,F(4T-2),F(4T+2),…,F(5T-2),F(5T+2),…F(jmax)が入力される。
そして、補助情報には、例えば、間隔Tに関する情報や、nが1以上5以下の各整数であることを表す情報や、サンプル群には3サンプルが含まれることを特定する情報などが含められている。従って、回復部12は、この補助情報に基づいて、入力されたサンプル列F(T-1),F(T),F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1),F(1),…,F(T-2),F(T+2),…,F(2T-2),F(2T+2),…,F(3T-2),F(3T+2),…,F(4T-2),F(4T+2),…,F(5T-2),F(5T+2),…F(jmax)を元のサンプルの並びF(j)(1≦j≦jmax)に戻すことができる。
「逆量子化部13」
次に、逆量子化部13が、フレームごとに、回復部12が出力した元のサンプルの並びF(j)(1≦j≦jmax)を逆量子化する(ステップS13)。上述の例に対応させて述べれば、逆量子化によって、符号化装置100の量子化部4に入力された「利得で正規化された重み付け正規化MDCT係数列」が得られる。
「利得乗算部14」
次に、利得乗算部14が、フレームごとに、逆量子化部13が出力した「利得で正規化された重み付け正規化MDCT係数列」の各係数に、上記利得情報で特定される利得を乗じて、「正規化された重み付け正規化MDCT係数列」を得る(ステップS14)。
「重み付け包絡逆正規化部15」
次に、重み付け包絡逆正規化部15が、フレームごとに、利得乗算部14が出力した「正規化された重み付け正規化MDCT係数列」の各係数に重み付けパワースペクトル包絡値を除算することで「MDCT係数列」を得る(ステップS15)。
「時間領域変換部16」
次に、時間領域変換部16が、フレームごとに、重み付け包絡逆正規化部15が出力した「MDCT係数列」を時間領域に変換してフレーム単位の音声音響ディジタル信号を得る(ステップS16)。
ステップS13からS16の各処理は従来的処理であるから詳細な説明を省略したが、例えば、上記各非特許文献に詳しい。
実施形態から明らかなように、例えば基本周波数が明瞭である場合には、基本周波数に応じてサンプル列を並べ替えたものを符号化することによって、効率の高い符号化ができる(すなわち平均符号長を小さくできる)。また、サンプル列に含まれるサンプルの並べ替えによって局所領域ごとに同等か同程度の指標を有するサンプルが集中するので、可変長符号化の効率化だけでなく、量子化歪の軽減や符号量の削減が可能となっている。
<符号化装置/復号装置のハードウェア構成例>
上述の実施形態に関わる符号化装置/復号装置は、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、CPU(Central Processing Unit)〔キャッシュメモリなどを備えていてもよい。〕、メモリであるRAM(Random Access Memory)やROM(Read Only Memory)と、ハードディスクである外部記憶装置、並びにこれらの入力部、出力部、CPU、RAM、ROM、外部記憶装置間のデータのやり取りが可能なように接続するバスなどを備えている。また必要に応じて、符号化装置/復号装置に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。
符号化装置/復号装置の外部記憶装置には、符号化/復号を実行するためのプログラム並びにこのプログラムの処理において必要となるデータなどが記憶されている〔外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくなどでもよい。〕。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。以下、データやその格納領域のアドレスなどを記憶する記憶装置を単に「記憶部」と呼ぶことにする。
符号化装置の記憶部には、音声音響信号に由来する周波数領域のサンプル列に含まれるサンプルの並べ替えを行うためのプログラム、並べ替えで得られたサンプル列の符号化のためのプログラムなどが記憶されている。
復号装置の記憶部には、入力された符号列を復号するためのプログラム、復号で得られたサンプル列を符号化装置で並べ替えが行われる前のサンプル列に回復するためのプログラムなどが記憶されている。
符号化装置では、記憶部に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてRAMに読み込まれて、CPUで解釈実行・処理される。この結果、CPUが所定の機能(並べ替え部、符号化部)を実現することで符号化が実現される。
復号装置では、記憶部に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてRAMに読み込まれて、CPUで解釈実行・処理される。この結果、CPUが所定の機能(復号部、回復部)を実現することで復号が実現される。
<補記>
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
また、上記実施形態において説明したハードウェアエンティティ(符号化装置/復号装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (26)

  1. フレーム単位の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
    フレーム毎に、上記音響信号の周期性に対応するサンプルの間隔T、または、上記音響信号の基本周波数の整数倍に対応するサンプルの間隔Tを、間隔Tの候補の集合Sの中から決定する間隔決定ステップと、
    上記間隔決定ステップで決定された間隔Tを符号化して補助情報を得る補助情報生成ステップと、
    (1)上記サンプル列の全てのサンプルが含まれ、かつ、
    (2)上記間隔決定ステップで決定された間隔Tに基づいて、上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
    を並べ替え後のサンプル列として、上記並べ替え後のサンプル列を符号化して符号列を得るサンプル列符号化ステップとを有し、
    上記間隔決定ステップは、
    上記補助情報で表現可能な間隔TのZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に依存せずに選択されたZ 個の候補(ただし、Z <Z)と、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を上記集合Sとして、上記間隔Tを決定するステップであり
    上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に隣接する値または/および所定の差分を持つ値を上記集合Sに加える追加ステップを更に含む
    ことを特徴とする符号化方法。
  2. フレーム単位の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
    フレーム毎に、上記音響信号の周期性に対応するサンプルの間隔T、または、上記音響信号の基本周波数の整数倍に対応するサンプルの間隔Tを、間隔Tの候補の集合Sの中から決定する間隔決定ステップと、
    上記間隔決定ステップで決定された間隔Tを符号化して補助情報を得る補助情報生成ステップと、
    (1)上記サンプル列の全てのサンプルが含まれ、かつ、
    (2)上記間隔決定ステップで決定された間隔Tに基づいて、上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
    を並べ替え後のサンプル列として、上記並べ替え後のサンプル列を符号化して符号列を得るサンプル列符号化ステップとを有し、
    上記間隔決定ステップは、
    上記補助情報で表現可能な間隔TのZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に依存せずに選択されたZ 個の候補(ただし、Z <Z)と、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を上記集合Sとして、上記間隔Tを決定するステップであり
    上記補助情報で表現可能な間隔TのZ個の候補のうちの一部であるZ1個の候補から、現在のフレームの上記音響信号または/およびサンプル列から求まる指標に基づいて選択した一部の候補を上記Z個の候補(ただしZ<Z)とする予備選択ステップを更に含む
    ことを特徴とする符号化方法。
  3. フレーム単位の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
    フレーム毎に、上記音響信号の周期性に対応するサンプルの間隔T、または、上記音響信号の基本周波数の整数倍に対応するサンプルの間隔Tを、間隔Tの候補の集合Sの中から決定する間隔決定ステップと、
    上記間隔決定ステップで決定された間隔Tを符号化して補助情報を得る補助情報生成ステップと、
    (1)上記サンプル列の全てのサンプルが含まれ、かつ、
    (2)上記間隔決定ステップで決定された間隔Tに基づいて、上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
    を並べ替え後のサンプル列として、上記並べ替え後のサンプル列を符号化して符号列を得るサンプル列符号化ステップとを有し、
    上記間隔決定ステップは、
    上記補助情報で表現可能な間隔TのZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に依存せずに選択されたZ 個の候補(ただし、Z <Z)と、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を上記集合Sとして、上記間隔Tを決定するステップであり
    上記補助情報で表現可能な間隔TのZ個の候補のうちの一部であるZ1個の候補から、現在のフレームの上記音響信号または/およびサンプル列から求まる指標に基づいて一部の候補を選択する予備選択ステップと、
    上記予備選択ステップで選択された候補と、上記予備選択ステップで選択された候補に隣接する値または/および所定の差分を持つ値とのセットを上記Z個の候補とする第二追加ステップを更に含む
    ことを特徴とする符号化方法。
  4. フレーム単位の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
    フレーム毎に、上記音響信号の周期性に対応するサンプルの間隔T、または、上記音響信号の基本周波数の整数倍に対応するサンプルの間隔Tを、間隔Tの候補の集合Sの中から決定する間隔決定ステップと、
    上記間隔決定ステップで決定された間隔Tを符号化して補助情報を得る補助情報生成ステップと、
    (1)上記サンプル列の全てのサンプルが含まれ、かつ、
    (2)上記間隔決定ステップで決定された間隔Tに基づいて、上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
    を並べ替え後のサンプル列として、上記並べ替え後のサンプル列を符号化して符号列を得るサンプル列符号化ステップとを有し、
    上記間隔決定ステップは、
    上記補助情報で表現可能な間隔TのZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に依存せずに選択されたZ 個の候補(ただし、Z <Z)と、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を上記集合Sとして、上記間隔Tを決定するステップであり
    現在のフレームの上記音響信号または/およびサンプル列から求まる指標に基づいて、上記集合Sに含まれる間隔Tの候補のうちの一部の候補を選択する第二予備選択ステップと、
    上記第二予備選択ステップで選択された一部の候補により構成される集合を対象として上記間隔Tを決定する最終選択ステップとを含む
    こと特徴とする符号化方法。
  5. フレーム単位の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
    フレーム毎に、上記音響信号の周期性に対応するサンプルの間隔T、または、上記音響信号の基本周波数の整数倍に対応するサンプルの間隔Tを、間隔Tの候補の集合Sの中から決定する間隔決定ステップと、
    上記間隔決定ステップで決定された間隔Tを符号化して補助情報を得る補助情報生成ステップと、
    (1)上記サンプル列の全てのサンプルが含まれ、かつ、
    (2)上記間隔決定ステップで決定された間隔Tに基づいて、上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
    を並べ替え後のサンプル列として、上記並べ替え後のサンプル列を符号化して符号列を得るサンプル列符号化ステップとを有し、
    上記間隔決定ステップは、
    上記補助情報で表現可能な間隔TのZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に依存せずに選択されたZ 個の候補(ただし、Z <Z)と、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を上記集合Sとして、上記間隔Tを決定するステップであり
    現在のフレームの上記音響信号の定常性の大きさを表す指標値が大きいほど、上記集合Sにて、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補が占める割合が大きい
    ことを特徴とする符号化方法。
  6. フレーム単位の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
    フレーム毎に、上記音響信号の周期性に対応するサンプルの間隔T、または、上記音響信号の基本周波数の整数倍に対応するサンプルの間隔Tを、間隔Tの候補の集合Sの中から決定する間隔決定ステップと、
    上記間隔決定ステップで決定された間隔Tを符号化して補助情報を得る補助情報生成ステップと、
    (1)上記サンプル列の全てのサンプルが含まれ、かつ、
    (2)上記間隔決定ステップで決定された間隔Tに基づいて、上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
    を並べ替え後のサンプル列として、上記並べ替え後のサンプル列を符号化して符号列を得るサンプル列符号化ステップとを有し、
    上記間隔決定ステップは、
    上記補助情報で表現可能な間隔TのZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に依存せずに選択されたZ 個の候補(ただし、Z <Z)と、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を上記集合Sとして、上記間隔Tを決定するステップであり
    現在のフレームの上記音響信号の定常性の大きさを表す指標値が所定の条件より小さい場合には、上記集合Sには上記Z個の候補のみが含まれる
    ことを特徴とする符号化方法。
  7. 請求項または請求項に記載の符号化方法であって、上記現在のフレームの上記音響信号の定常性の大きさを表す指標値は、
    (a-1)「現在のフレームの上記音響信号の予測利得」が大きくなる、
    (a-2)「現在のフレームの上記音響信号の予測利得の推定値」が大きくなる、
    (b-1)「直前のフレームの予測利得」と「現在のフレームの予測利得」との差分が小さくなる、
    (b-2)「直前のフレームの予測利得の推定値」と「現在のフレームの予測利得の推定値」との差分が小さくなる、
    (c-1)「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」が大きくなる、
    (c-2)「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」が大きくなる、
    (d-1)「直前のフレームに含まれる上記音響信号のサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」との差分が小さくなる、
    (d-2)「直前のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」との差分が小さくなる、
    (e-1)「現在のフレームの上記音響信号のパワー」が大きくなる、
    (e-2)「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」が大きくなる、
    (f-1)「直前のフレームの上記音響信号のパワー」と「現在のフレームの上記音響信号のパワー」との差分が小さくなる、
    (f-2)「直前のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」と「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」との差分が小さくなる、の少なくともいずれか一つの条件を満たす場合に、大きくなる値である
    ことを特徴とする符号化方法。
  8. フレーム単位の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
    フレーム毎に、上記音響信号の周期性に対応するサンプルの間隔T、または、上記音響信号の基本周波数の整数倍に対応するサンプルの間隔Tを、間隔Tの候補の集合Sの中から決定する間隔決定ステップと、
    上記間隔決定ステップで決定された間隔Tを符号化して補助情報を得る補助情報生成ステップと、
    (1)上記サンプル列の全てのサンプルが含まれ、かつ、
    (2)上記間隔決定ステップで決定された間隔Tに基づいて、上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
    を並べ替え後のサンプル列として、上記並べ替え後のサンプル列を符号化して符号列を得るサンプル列符号化ステップとを有し、
    上記間隔決定ステップは、
    上記補助情報で表現可能な間隔TのZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に依存せずに選択されたZ 個の候補(ただし、Z <Z)と、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を上記集合Sとして、上記間隔Tを決定するステップであり
    上記サンプル列符号化ステップは、
    上記並べ替え前のサンプル列を符号化して得られる符号列と、上記並べ替え後のサンプル列を符号化して得られる符号列と上記補助情報、のうち符号量が少ない方を出力するステップを含む
    ことを特徴とする符号化方法。
  9. フレーム単位の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
    フレーム毎に、上記音響信号の周期性に対応するサンプルの間隔T、または、上記音響信号の基本周波数の整数倍に対応するサンプルの間隔Tを、間隔Tの候補の集合Sの中から決定する間隔決定ステップと、
    上記間隔決定ステップで決定された間隔Tを符号化して補助情報を得る補助情報生成ステップと、
    (1)上記サンプル列の全てのサンプルが含まれ、かつ、
    (2)上記間隔決定ステップで決定された間隔Tに基づいて、上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
    を並べ替え後のサンプル列として、上記並べ替え後のサンプル列を符号化して符号列を得るサンプル列符号化ステップとを有し、
    上記間隔決定ステップは、
    上記補助情報で表現可能な間隔TのZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に依存せずに選択されたZ 個の候補(ただし、Z <Z)と、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を上記集合Sとして、上記間隔Tを決定するステップであり
    上記サンプル列符号化ステップは、
    上記並べ替え後のサンプル列を符号化して得られる符号列の符号量またはその推定値と上記補助情報の符号量との合計が、上記並べ替え前のサンプル列を符号化して得られる符号列の符号量またはその推定値より少ない場合には、上記並べ替え後のサンプル列を符号化して得られる符号列と上記補助情報とを出力し、
    上記並べ替え前のサンプル列を符号化して得られる符号列の符号量またはその推定値が、上記並べ替え後のサンプル列を符号化して得られる符号列の符号量またはその推定値と上記補助情報の符号量との合計より少ない場合には、上記並べ替え前のサンプル列を符号化して得られる符号列を出力する
    ことを特徴とする符号化方法。
  10. 請求項または請求項に記載の符号化方法であって、
    直前のフレームで出力した符号列が並べ替え後のサンプル列を符号化して得られた符号列である場合のほうが、直前のフレームで出力した符号列が並べ替え前のサンプル列を符号化して得られた符号列である場合よりも、上記集合Sにて、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補が占める割合が大きい
    ことを特徴とする符号化方法。
  11. 請求項から請求項1のいずれかに記載の符号化方法であって、
    直前のフレームで出力した符号列が並べ替え前のサンプル列を符号化して得られた符号列である場合には、上記集合Sには上記Z個の候補のみが含まれる
    ことを特徴とする符号化方法。
  12. 請求項から請求項1のいずれかに記載の符号化方法であって、
    現在のフレームが時間的に先頭にあるフレームである場合、直前のフレームが上記の符号化方法以外で符号化された場合、直前のフレームで出力した符号列が並べ替え前のサンプル列を符号化して得られた符号列である場合、の何れかに該当する場合には、上記集合Sには上記Z個の候補のみが含まれる
    ことを特徴とする符号化方法。
  13. フレーム単位の音響信号の周期性特徴量を決定する方法であって、
    フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定ステップと、
    周期性特徴量決定ステップで得られた周期性特徴量を符号化して補助情報を得る補助情報生成ステップとを有し、
    上記周期性特徴量決定ステップは、
    上記補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補に依存せずに選択されたZ 個の候補(ただし、Z <Z)と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、上記周期性特徴量を決定するステップであり
    上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補に隣接する値または/および所定の差分を持つ値を上記集合Sに加える追加ステップを更に含む
    ことを特徴とする周期性特徴量決定方法。
  14. フレーム単位の音響信号の周期性特徴量を決定する方法であって、
    フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定ステップと、
    周期性特徴量決定ステップで得られた周期性特徴量を符号化して補助情報を得る補助情報生成ステップとを有し、
    上記周期性特徴量決定ステップは、
    上記補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補に依存せずに選択されたZ 個の候補(ただし、Z <Z)と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、上記周期性特徴量を決定するステップであり、
    上記補助情報で表現可能な間隔TのZ個の候補のうちの一部であるZ 1 個の候補から、現在のフレームの上記音響信号または/および上記音響信号に由来する周波数領域のサンプル列から求まる指標に基づいて選択した一部の候補を上記Z 個の候補(ただしZ <Z )とする予備選択ステップを更に含む
    ことを特徴とする周期性特徴量決定方法。
  15. フレーム単位の音響信号の周期性特徴量を決定する方法であって、
    フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定ステップと、
    周期性特徴量決定ステップで得られた周期性特徴量を符号化して補助情報を得る補助情報生成ステップとを有し、
    上記周期性特徴量決定ステップは、
    上記補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補に依存せずに選択されたZ 個の候補(ただし、Z <Z)と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、上記周期性特徴量を決定するステップであり、
    上記補助情報で表現可能な間隔TのZ個の候補のうちの一部であるZ 1 個の候補から、現在のフレームの上記音響信号または/および上記音響信号に由来する周波数領域のサンプル列から求まる指標に基づいて一部の候補を選択する予備選択ステップと、
    上記予備選択ステップで選択された候補と、上記予備選択ステップで選択された候補に隣接する値または/および所定の差分を持つ値とのセットを上記Z 個の候補とする第二追加ステップを更に含む
    ことを特徴とする周期性特徴量決定方法。
  16. フレーム単位の音響信号の周期性特徴量を決定する方法であって、
    フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定ステップと、
    周期性特徴量決定ステップで得られた周期性特徴量を符号化して補助情報を得る補助情報生成ステップとを有し、
    上記周期性特徴量決定ステップは、
    上記補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補に依存せずに選択されたZ 個の候補(ただし、Z <Z)と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、上記周期性特徴量を決定するステップであり、
    現在のフレームの上記音響信号または/および上記音響信号に由来する周波数領域のサンプル列から求まる指標に基づいて、上記集合Sに含まれる間隔Tの候補のうちの一部の候補を選択する第二予備選択ステップと、
    上記第二予備選択ステップで選択された一部の候補により構成される集合を対象として上記間隔Tを決定する最終選択ステップとを含む
    ことを特徴とする周期性特徴量決定方法。
  17. フレーム単位の音響信号の周期性特徴量を決定する方法であって、
    フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定ステップと、
    周期性特徴量決定ステップで得られた周期性特徴量を符号化して補助情報を得る補助情報生成ステップとを有し、
    上記周期性特徴量決定ステップは、
    上記補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補に依存せずに選択されたZ 個の候補(ただし、Z <Z)と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、上記周期性特徴量を決定するステップであり
    現在のフレームの上記音響信号の定常性の大きさを表す指標値が大きいほど、上記集合Sにて、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補が占める割合が大きい
    ことを特徴とする周期性特徴量決定方法。
  18. 請求項1に記載の周期性特徴量決定方法であって、
    現在のフレームの上記音響信号の定常性の大きさを表す指標値が所定の条件より小さい場合には、上記集合Sには上記Z個の候補のみが含まれる
    ことを特徴とする周期性特徴量決定方法。
  19. 請求項1または請求項1に記載の周期性特徴量決定方法であって、上記現在のフレームの上記音響信号の定常性の大きさを表す指標値は、
    (a-1)「現在のフレームの上記音響信号の予測利得」が大きくなる、
    (a-2)「現在のフレームの上記音響信号の予測利得の推定値」が大きくなる、
    (b-1)「直前のフレームの予測利得」と「現在のフレームの予測利得」との差分が小さくなる、
    (b-2)「直前のフレームの予測利得の推定値」と「現在のフレームの予測利得の推定値」との差分が小さくなる、
    (c-1)「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」が大きくなる、
    (c-2)「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」が大きくなる、
    (d-1)「直前のフレームに含まれる上記音響信号のサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」との差分が小さくなる、
    (d-2)「直前のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」との差分が小さくなる、
    (e-1)「現在のフレームの上記音響信号のパワー」が大きくなる、
    (e-2)「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」が大きくなる、
    (f-1)「直前のフレームの上記音響信号のパワー」と「現在のフレームの上記音響信号のパワー」との差分が小さくなる、
    (f-2)「直前のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」と「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」との差分が小さくなる、の少なくともいずれか一つの条件を満たす場合に、大きくなる値である
    ことを特徴とする周期性特徴量決定方法。
  20. フレーム単位の音響信号の周期性特徴量を決定する装置であって、
    フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定部と、
    周期性特徴量決定部で得られた周期性特徴量を符号化して補助情報を得る補助情報生成部とを有し、
    上記周期性特徴量決定部は、
    上記補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補に依存せずに選択されたZ 個の候補(ただし、Z <Z)と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、上記周期性特徴量を決定するものであり、
    上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補に隣接する値または/および所定の差分を持つ値を上記集合Sに加える追加部を更に含む
    ことを特徴とする周期性特徴量決定装置。
  21. フレーム単位の音響信号の周期性特徴量を決定する装置であって、
    フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定部と、
    周期性特徴量決定部で得られた周期性特徴量を符号化して補助情報を得る補助情報生成部とを有し、
    上記周期性特徴量決定部は、
    上記補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補に依存せずに選択されたZ 個の候補(ただし、Z <Z)と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、上記周期性特徴量を決定するものであり、
    上記補助情報で表現可能な間隔TのZ個の候補のうちの一部であるZ 1 個の候補から、現在のフレームの上記音響信号または/および上記音響信号に由来する周波数領域のサンプル列から求まる指標に基づいて選択した一部の候補を上記Z 個の候補(ただしZ <Z )とする予備選択部を更に含む
    ことを特徴とする周期性特徴量決定装置。
  22. フレーム単位の音響信号の周期性特徴量を決定する装置であって、
    フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定部と、
    周期性特徴量決定部で得られた周期性特徴量を符号化して補助情報を得る補助情報生成部とを有し、
    上記周期性特徴量決定部は、
    上記補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補に依存せずに選択されたZ 個の候補(ただし、Z <Z)と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、上記周期性特徴量を決定するものであり、
    上記補助情報で表現可能な間隔TのZ個の候補のうちの一部であるZ 1 個の候補から、現在のフレームの上記音響信号または/および上記音響信号に由来する周波数領域のサンプル列から求まる指標に基づいて一部の候補を選択する予備選択部と、
    上記予備選択部で選択された候補と、上記予備選択部で選択された候補に隣接する値または/および所定の差分を持つ値とのセットを上記Z 個の候補とする第二追加部を更に含む
    ことを特徴とする周期性特徴量決定装置。
  23. フレーム単位の音響信号の周期性特徴量を決定する装置であって、
    フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定部と、
    周期性特徴量決定部で得られた周期性特徴量を符号化して補助情報を得る補助情報生成部とを有し、
    上記周期性特徴量決定部は、
    上記補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補に依存せずに選択されたZ 個の候補(ただし、Z <Z)と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、上記周期性特徴量を決定するものであり、
    現在のフレームの上記音響信号または/および上記音響信号に由来する周波数領域のサンプル列から求まる指標に基づいて、上記集合Sに含まれる間隔Tの候補のうちの一部の候補を選択する第二予備選択部と、
    上記第二予備選択部で選択された一部の候補により構成される集合を対象として上記間隔Tを決定する最終選択部とを含む
    ことを特徴とする周期性特徴量決定装置。
  24. フレーム単位の音響信号の周期性特徴量を決定する装置であって、
    フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定部と、
    周期性特徴量決定部で得られた周期性特徴量を符号化して補助情報を得る補助情報生成部とを有し、
    上記周期性特徴量決定部は、
    上記補助情報で表現可能な周期性特徴量のZ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補に依存せずに選択されたZ 個の候補(ただし、Z <Z)と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補と、によるY個の候補(ただし、Y<Z)により構成される集合を周期性特徴量の候補の集合Sとして、上記周期性特徴量を決定するものであり、
    現在のフレームの上記音響信号の定常性の大きさを表す指標値が大きいほど、上記集合Sにて、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部の処理対象となった候補が占める割合が大きい
    ことを特徴とする周期性特徴量決定装置。
  25. 請求項24に記載の周期性特徴量決定装置であって、
    現在のフレームの上記音響信号の定常性の大きさを表す指標値が所定の条件より小さい場合には、上記集合Sには上記Z 個の候補のみが含まれる
    ことを特徴とする周期性特徴量決定装置。
  26. 請求項1から請求項1のいずれかに記載された符号化方法、または、請求項1から請求項1のいずれかに記載された周期性特徴量決定方法、の各ステップをコンピュータに実行させるためのプログラム。
JP2012554739A 2011-01-25 2012-01-18 符号化方法、周期性特徴量決定方法、周期性特徴量決定装置、プログラム Active JP5596800B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012554739A JP5596800B2 (ja) 2011-01-25 2012-01-18 符号化方法、周期性特徴量決定方法、周期性特徴量決定装置、プログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2011013426 2011-01-25
JP2011013426 2011-01-25
PCT/JP2012/050970 WO2012102149A1 (ja) 2011-01-25 2012-01-18 符号化方法、符号化装置、周期性特徴量決定方法、周期性特徴量決定装置、プログラム、記録媒体
JP2012554739A JP5596800B2 (ja) 2011-01-25 2012-01-18 符号化方法、周期性特徴量決定方法、周期性特徴量決定装置、プログラム

Publications (2)

Publication Number Publication Date
JPWO2012102149A1 JPWO2012102149A1 (ja) 2014-06-30
JP5596800B2 true JP5596800B2 (ja) 2014-09-24

Family

ID=46580721

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012554739A Active JP5596800B2 (ja) 2011-01-25 2012-01-18 符号化方法、周期性特徴量決定方法、周期性特徴量決定装置、プログラム

Country Status (8)

Country Link
US (1) US9711158B2 (ja)
EP (1) EP2650878B1 (ja)
JP (1) JP5596800B2 (ja)
KR (2) KR101740359B1 (ja)
CN (1) CN103329199B (ja)
ES (1) ES2558508T3 (ja)
RU (1) RU2554554C2 (ja)
WO (1) WO2012102149A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9524725B2 (en) * 2012-10-01 2016-12-20 Nippon Telegraph And Telephone Corporation Encoding method, encoder, program and recording medium
BR112016008117B1 (pt) * 2013-10-18 2021-12-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificação de coeficientes espectrais de um espectro de um sinal de áudio
US9928850B2 (en) * 2014-01-24 2018-03-27 Nippon Telegraph And Telephone Corporation Linear predictive analysis apparatus, method, program and recording medium
ES2768090T3 (es) * 2014-03-24 2020-06-19 Nippon Telegraph & Telephone Método de codificación, codificador, programa y soporte de registro
TR201900472T4 (tr) * 2014-04-24 2019-02-21 Nippon Telegraph & Telephone Frekans alanı parametre dizisi oluşturma metodu, kodlama metodu, kod çözme metodu, frekans alanı parametre dizisi oluşturma aparatı, kodlama aparatı, kod çözme aparatı, programı ve kayıt ortamı.
PL3139381T3 (pl) * 2014-05-01 2019-10-31 Nippon Telegraph & Telephone Urządzenie generujące sekwencję okresowej połączonej obwiedni, sposób generowania sekwencji okresowej połączonej obwiedni, program do generowania sekwencji okresowej połączonej obwiedni i nośnik rejestrujący
CN106663437B (zh) 2014-05-01 2021-02-02 日本电信电话株式会社 编码装置、解码装置、编码方法、解码方法、记录介质
PL3163571T3 (pl) * 2014-07-28 2020-05-18 Nippon Telegraph And Telephone Corporation Kodowanie sygnału dźwiękowego
CN107430869B (zh) * 2015-01-30 2020-06-12 日本电信电话株式会社 参数决定装置、方法及记录介质
JP6758890B2 (ja) * 2016-04-07 2020-09-23 キヤノン株式会社 音声判別装置、音声判別方法、コンピュータプログラム
US10146500B2 (en) * 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
CN106373594B (zh) * 2016-08-31 2019-11-26 华为技术有限公司 一种音调检测方法及装置
CN108665036A (zh) * 2017-04-02 2018-10-16 田雪松 位置编码方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06131000A (ja) * 1992-10-15 1994-05-13 Nec Corp 基本周期符号化装置
JPH1152994A (ja) * 1997-08-05 1999-02-26 Kokusai Electric Co Ltd 音声符号化装置
JP2004187290A (ja) * 2002-11-21 2004-07-02 Nippon Telegr & Teleph Corp <Ntt> ディジタル信号処理方法、その処理器、そのプログラム、及びそのプログラムを格納した記録媒体
JP2006126592A (ja) * 2004-10-29 2006-05-18 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
WO2006121101A1 (ja) * 2005-05-13 2006-11-16 Matsushita Electric Industrial Co., Ltd. 音声符号化装置およびスペクトル変形方法
JP2009253706A (ja) * 2008-04-07 2009-10-29 Casio Comput Co Ltd 符号化装置、復号装置、符号化方法、復号方法及びプログラム

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
JP3277705B2 (ja) * 1994-07-27 2002-04-22 ソニー株式会社 情報符号化装置及び方法、並びに情報復号化装置及び方法
JP4005154B2 (ja) * 1995-10-26 2007-11-07 ソニー株式会社 音声復号化方法及び装置
JP2001285073A (ja) * 2000-03-29 2001-10-12 Sony Corp 信号処理装置及び方法
US6587816B1 (en) * 2000-07-14 2003-07-01 International Business Machines Corporation Fast frequency-domain pitch estimation
WO2003038812A1 (en) * 2001-11-02 2003-05-08 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device
EP1483759B1 (en) 2002-03-12 2006-09-06 Nokia Corporation Scalable audio coding
RU2383941C2 (ru) * 2005-06-30 2010-03-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для кодирования и декодирования аудиосигналов
US7599840B2 (en) * 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding
KR100883656B1 (ko) 2006-12-28 2009-02-18 삼성전자주식회사 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
JP4964114B2 (ja) 2007-12-25 2012-06-27 日本電信電話株式会社 符号化装置、復号化装置、符号化方法、復号化方法、符号化プログラム、復号化プログラム、および記録媒体
US20090319261A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
PL2146344T3 (pl) * 2008-07-17 2017-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sposób kodowania/dekodowania sygnału audio obejmujący przełączalne obejście
US8207875B2 (en) 2009-10-28 2012-06-26 Motorola Mobility, Inc. Encoder that optimizes bit allocation for information sub-parts
US9236063B2 (en) * 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06131000A (ja) * 1992-10-15 1994-05-13 Nec Corp 基本周期符号化装置
JPH1152994A (ja) * 1997-08-05 1999-02-26 Kokusai Electric Co Ltd 音声符号化装置
JP2004187290A (ja) * 2002-11-21 2004-07-02 Nippon Telegr & Teleph Corp <Ntt> ディジタル信号処理方法、その処理器、そのプログラム、及びそのプログラムを格納した記録媒体
JP2006126592A (ja) * 2004-10-29 2006-05-18 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
WO2006121101A1 (ja) * 2005-05-13 2006-11-16 Matsushita Electric Industrial Co., Ltd. 音声符号化装置およびスペクトル変形方法
JP2009253706A (ja) * 2008-04-07 2009-10-29 Casio Comput Co Ltd 符号化装置、復号装置、符号化方法、復号方法及びプログラム

Also Published As

Publication number Publication date
US20130311192A1 (en) 2013-11-21
CN103329199A (zh) 2013-09-25
RU2554554C2 (ru) 2015-06-27
KR20160080115A (ko) 2016-07-07
EP2650878A4 (en) 2014-11-05
RU2013134463A (ru) 2015-03-10
KR20130111611A (ko) 2013-10-10
US9711158B2 (en) 2017-07-18
KR101740359B1 (ko) 2017-05-26
EP2650878B1 (en) 2015-11-18
ES2558508T3 (es) 2016-02-04
CN103329199B (zh) 2015-04-08
WO2012102149A1 (ja) 2012-08-02
JPWO2012102149A1 (ja) 2014-06-30
EP2650878A1 (en) 2013-10-16

Similar Documents

Publication Publication Date Title
JP5596800B2 (ja) 符号化方法、周期性特徴量決定方法、周期性特徴量決定装置、プログラム
US11074919B2 (en) Encoding method, decoding method, encoder, decoder, program, and recording medium
JP5612698B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
JP6053196B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体
JP5893153B2 (ja) 符号化方法、符号化装置、プログラム、および記録媒体
JP6542796B2 (ja) 線形予測係数量子化方法及びその装置、並びに線形予測係数逆量子化方法及びその装置
JP5694751B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
JP5663461B2 (ja) 符号化方法、符号化装置、プログラム、記録媒体
JP6387117B2 (ja) 符号化装置、復号装置、これらの方法、プログラム及び記録媒体
JPWO2013129528A1 (ja) 符号化装置、この方法、プログラムおよび記録媒体
JPWO2013002238A1 (ja) 符号化方法、装置、プログラム及び記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140603

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140702

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140729

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140807

R150 Certificate of patent or registration of utility model

Ref document number: 5596800

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150