JP5872034B2 - 符号化方法、符号化装置、プログラム、および記録媒体 - Google Patents

符号化方法、符号化装置、プログラム、および記録媒体 Download PDF

Info

Publication number
JP5872034B2
JP5872034B2 JP2014518696A JP2014518696A JP5872034B2 JP 5872034 B2 JP5872034 B2 JP 5872034B2 JP 2014518696 A JP2014518696 A JP 2014518696A JP 2014518696 A JP2014518696 A JP 2014518696A JP 5872034 B2 JP5872034 B2 JP 5872034B2
Authority
JP
Japan
Prior art keywords
gain
bits
value
consumed
update
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014518696A
Other languages
English (en)
Other versions
JPWO2013180164A1 (ja
Inventor
守谷 健弘
健弘 守谷
優 鎌本
優 鎌本
登 原田
登 原田
祐介 日和▲崎▼
祐介 日和▲崎▼
勝宏 福井
勝宏 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=49673352&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP5872034(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014518696A priority Critical patent/JP5872034B2/ja
Publication of JPWO2013180164A1 publication Critical patent/JPWO2013180164A1/ja
Application granted granted Critical
Publication of JP5872034B2 publication Critical patent/JP5872034B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

本発明は、音響信号の符号化技術に関する。特に、音響信号に由来するサンプル列を利得で除算して得られる系列の符号化技術に関する。
低ビット(例えば10kbit/s〜20kbit/s程度)の音声信号や音響信号の符号化方法として、DFT(離散フーリエ変換)やMDCT(変形離散コサイン変換)などの直交変換係数に対する適応符号化が知られている。例えば非特許文献1の標準規格技術であるAMR-WB+(Extended Adaptive Multi-Rate Wideband)は、TCX(transform coded excitation:変換符号化励振)符号化モードを持つ。TCX符号化においては、フレームごとに与えられた総ビット数での符号化が行えるように、周波数領域の音響ディジタル信号系列をパワースペクトル包絡係数列によって正規化して得られる係数列について、係数列中の各係数を利得で除算して得られる系列を所定のビット数で符号化できるように利得を決定する。
<TCX符号化装置1000>
従来のTCX符号化の符号化装置1000の構成例を図1に示す。以下、図1の各部について説明する。
<周波数領域変換部1001>
周波数領域変換部1001は、所定の時間区間であるフレーム単位で、入力された音響ディジタル信号を周波数領域のN点のMDCT係数列X(1),・・・,X(N)に変換して出力する。ただし、Nは正整数である。
<パワースペクトル包絡係数列計算部1002>
パワースペクトル包絡係数列計算部1002は、フレーム単位の音響ディジタル信号に対する線形予測分析を行って線形予測係数を求め、その線形予測係数を用いてN点の音響ディジタル信号のパワースペクトル包絡係数列W(1),・・・,W(N)を得て出力する。
<重み付け包絡正規化部1003>
重み付け包絡正規化部1003は、パワースペクトル包絡係数列計算部1002が得たパワースペクトル包絡係数列を用いて、周波数領域変換部1001が得たMDCT係数列の各係数を正規化し、重み付け正規化MDCT係数列XN(1),・・・,XN(N)を出力する。ここでは聴覚的に歪が小さくなるような量子化の実現のために、重み付け包絡正規化部1003は、パワースペクトル包絡を鈍らせた重み付けパワースペクトル包絡係数列を用いて、フレーム単位でMDCT係数列の各係数を正規化する。この結果、重み付け正規化MDCT係数列XN(1),・・・,XN(N)は、入力されたMDCT係数列ほどの大きな振幅の傾きや振幅の凹凸を持たないが、音響ディジタル信号のパワースペクトル包絡係数列と類似の大小関係を有するもの、すなわち、低い周波数に対応する係数側の領域にやや大きな振幅を持ち、ピッチ周期に起因する微細構造をもつもの、となる。
<初期化部1004>
初期化部1004は、利得(グローバルゲイン)gの初期値を設定する。利得の初期値は、重み付け正規化MDCT係数列XN(1),・・・,XN(N)のエネルギーと可変長符号化部1006が出力する符号に予め配分されたビット数などから決めることができる。以下、可変長符号化部1006が出力する符号に予め配分されたビット数を配分ビット数Bと呼ぶ。また、初期化部は、利得の更新回数の初期値として0を設定する。
<利得更新ループ処理部1130>
利得更新ループ処理部1130は、重み付け正規化MDCT係数列XN(1),・・・,XN(N)中の各係数を利得で除算して得られる系列を所定のビット数で符号化できるように利得を決定し、重み付け正規化MDCT係数列XN(1),・・・,XN(N)中の各係数を決定した利得で除算して得られる系列を可変長符号化して得た整数信号符号と、決定した利得を符号化して得た利得符号と、を出力する。
利得更新ループ処理部1130は、量子化部1005と、可変長符号化部1006と、判定部1007と、利得拡大更新部1131と、利得縮小更新部1132と、切り捨て部1016と、利得符号化部1017と、を有する。
<量子化部1005>
量子化部1005は、重み付け正規化MDCT係数列XN(1),・・・,XN (N)の各係数を利得gで割り算して得られる値を量子化して、整数値による系列である量子化正規化済係数系列XQ(1),・・・,XQ(N)を得て出力する。
<可変長符号化部1006>
可変長符号化部1006は、量子化正規化済係数系列XQ(1),・・・,XQ(N)を可変長符号化して符号を得て出力する。この符号を整数信号符号と呼ぶ。この可変長符号化には、例えば、量子化正規化済係数系列中の複数の係数を纏めて符号化する方法を用いる。また、可変長符号化部1006は、可変長符号化で得た整数信号符号のビット数を計測する。以下では、このビット数を消費ビット数cと呼ぶ。
<判定部1007>
判定部1007は、利得の更新回数が予め定めた回数の場合は、利得、整数信号符号、消費ビット数cを出力する。
利得の更新回数が予め定めた回数未満である場合は、可変長符号化部1006が計測した消費ビット数cが配分ビット数Bより多い場合には利得拡大更新部1131が、可変長符号化部1006が計測した消費ビット数cが配分ビット数Bより少ない場合には利得縮小更新部1132が、次の処理を行うように制御する。なお、消費ビット数cと配分ビット数Bが等しいときは、今回の利得の値が最適な値であることを意味するので、利得、整数信号符号、消費ビット数cを出力する。
<利得拡大更新部1131>
利得拡大更新部1131は、今回の利得gの値よりも大きな値g’>gを新たな利得として設定する。利得拡大更新部1131は、利得下限設定部1008と、第1分岐部1009と、第1利得更新部1010と、利得拡大部1011と、を有する。
<利得下限設定部1008>
利得下限設定部1008は、今回の利得gの値を利得の下限値gminとして設定する(gmin←g)。この利得の下限値gminは、少なくとも利得の値はこれ以上であるべきことを意味する。
<第1分岐部1009>
利得下限設定部1008で利得の下限値gminが設定された場合、第1分岐部1009は、利得の上限値gmaxが既に設定されている場合には第1利得更新部1010が、そうでない場合には利得拡大部1011が、次の処理を行うように制御する。
<第1利得更新部1010>
第1利得更新部1010は、例えば、今回の利得gの値と利得の上限値gmaxの平均値を新たに利得gの値として設定する(g←(g+gmax)/2)。これは、最適な利得の値は、今回の利得gの値と利得の上限値gmaxとの間に存在するからである。今回の利得gの値は利得の下限値gminとして設定されているので、利得の上限値gmaxと利得の下限値gminの平均値を新たに利得gの値として設定するとも言える(g←(gmax+gmin)/2)。その後、量子化部1005の処理に戻る。
<利得拡大部1011>
利得拡大部1011は、今回の利得gの値より大きな値を新たな利得gの値として設定する。例えば、今回の利得gの値に予め定めた値である利得変更量Δgを加算したものを新たな利得gの値として設定する(g←g+Δg)。また例えば、利得の上限値gmaxが設定されずに、消費ビット数cが配分ビット数Bより多い状態が複数回続いている場合には、予め定めた値より大きな値を利得変更量Δgとして用いる。その後、量子化部1005の処理に戻る。
<利得縮小更新部1132>
利得縮小更新部1132は、今回の利得gの値よりも小さな値g’<gを新たな利得として設定する。利得縮小更新部1132は、利得上限設定部1012と、第2分岐部1013と、第2利得更新部1014と、利得縮小部1015と、を有する。
<利得上限設定部1012>
利得上限設定部1012は、今回の利得gの値を利得の上限値gmaxと設定する(gmax←g)。この利得の上限値gmaxは、少なくとも利得の値はこれ以下であるべきことを意味する。
<第2分岐部1013>
利得上限設定部1012で利得の上限値gmaxが設定された場合、第2分岐部1013は、利得の下限値gminが既に設定されている場合には第2利得更新部1014が、そうでない場合には利得縮小部1015が、次の処理を行うように制御する。
<第2利得更新部1014>
第2利得更新部1014は、例えば、今回の利得gの値と利得の下限値gminの平均値を新たな利得gの値として設定する(g←(g+gmin)/2)。これは、最適な利得の値は、今回の利得gの値と利得の下限値gminとの間に存在するからである。今回の利得gの値は利得の上限値gmaxとして設定されているので、利得の上限値gmaxと利得の下限値gminの平均値を新たに利得gの値として設定するとも言える(g←(gmax+gmin)/2)。その後、量子化部1005の処理に戻る。
<利得縮小部1015>
利得縮小部1015は、今回の利得gの値より小さな値を新たな利得gの値として設定する。例えば、今回の利得gの値から予め定めた値である利得変更量Δgを減算したものを新たな利得gの値として設定する(g←g−Δg)。また例えば、利得の下限値gminが設定されずに、消費ビット数cが配分ビット数Bより少ない状態が複数回続いている場合には、予め定めた値より大きな値を利得変更量Δgとして用いる。その後、量子化部1005の処理に戻る。
<切り捨て部1016>
切り捨て部1016は、判定部1007が出力した消費ビット数cが配分ビット数Bより多い場合には、判定部1007が出力した整数信号符号のうち、消費ビット数cが配分ビット数Bを上回る分だけの符号を、高い周波数側の量子化正規化済係数に対応する符号から取り除いたものを、新たな整数信号符号として出力する。すなわち切り捨て部1016は、消費ビット数cの配分ビット数Bに対する上回り分c−Bに対応する高い周波数側の量子化正規化済係数に対応する符号を整数信号符号から取り除くことで得られる、残りの符号を、新たな整数信号符号として出力する。
<利得符号化部1017>
判定部1007が出力した利得を所定のビット数で符号化して利得符号を得て、出力する。
3rd Generation Partnership Project (3GPP), Technical Specification (TS) 26.290, "Extended Adaptive Multi-Rate-Wideband (AMR-WB+) codec; Transcoding functions", Version 10.0.0 (2011-03)
従来の符号化装置1000の利得拡大部1011では、利得gの値に所定の値である利得変更量Δgを加算したものを新たな利得gの値とすることで、固定的に利得の値を拡大していた。
利得の上限値が設定されずに、利得拡大部1011の処理が複数回必要となる場合には利得の初期値がきわめて小さすぎた可能性があるので、利得変更量Δgを所定の値より大きくして、利得の上限値に到達できる確率を高めざるをえないが、これにより適正な利得を大幅に超えた値を新たな利得の値として設定してしまうこともあり、収束に回数がかかり、所定の回数で適切な利得の値を求められないことがあった。
同様に、従来の符号化装置1000の利得縮小部1015では、利得gの値から所定の値である利得変更量Δgを減算したものを新たな利得gの値とすることで、固定的に利得の値を縮小していた。
利得の下限値が設定されずに、利得縮小部1015の処理が複数回必要となる場合には利得の初期値がきわめて大きすぎた可能性があるので、利得変更量Δgを所定の値より大きくして、利得の下限値に到達できる確率を高めざるをえないが、これにより適正な利得を大幅に超えた値を新たな利得の値として設定してしまうこともあり、収束に回数がかかり、所定の回数で適切な利得の値を求められないことがあった。
所定の回数で求まった利得の値が小さ過ぎる場合には、可変長符号化により得られた符号のビット数が配分ビットより大きいため、可変長符号化により得られた符号の一部しか整数信号符号とできず、高域の量子化正規化済係数に対応する符号が符号化装置から出力されず、復号装置にも伝えられないため、復号装置では高域の係数を0として復号信号を得なければならない等により、復号信号の歪が大きくなるという問題がある。所定の回数で求まった利得の値が大き過ぎる場合には、整数信号符号のビット数が配分ビットより少ないため、十分な音響信号の品質を得られない問題がある。
所定の区間の入力音響信号に由来するサンプル列のサンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数と、所定の配分ビット数Bと、の差が大きいほど、更新前の利得と更新後の利得との差が大きくなるように利得の値を更新し、得られた利得に対応する利得符号と、サンプル列の各サンプルを利得で除算して得られる整数値サンプルによる列を符号化して得られる整数信号符号とを得る。
本発明の符号化によれば、利得の値の適切な値への収束を早めることにより、従来技術よりも可変長符号化により得られる符号のビット数を配分ビットに近づけることが可能となり、従来技術よりも高品質な符号化を行うことが可能となる。
従来の符号化装置の構成を例示したブロック図。 第1実施形態の符号化装置の構成を例示したブロック図。 第1実施形態の変形例の符号化装置の構成を例示したブロック図。 第2実施形態の符号化装置の構成を例示したブロック図。 第2実施形態の変形例の符号化装置の構成を例示したブロック図。 第3実施形態の符号化装置の構成を例示したブロック図。
図面を参照しながら本発明の実施形態を説明する。同一構成要素ないし同一処理には同一符号を割り当てて重複説明を省略する場合がある。なお、各実施形態で扱う音響ディジタル信号(入力音響信号)は、音声や楽音などの音響信号がディジタル化された信号である。各実施形態では、入力される音響ディジタル信号が所定の時間区間の時間領域信号であり、音響ディジタル信号を周波数領域信号に変換し、さらにパワースペクトル包絡係数列を用いて当該周波数領域信号を正規化して得られる列が、符号化対象のサンプル列(入力音響信号に由来するサンプル列)であることを想定している。しかしながら、入力された音響ディジタル信号が所定の時間区間の時間領域信号であり、当該音響ディジタル信号そのものが符号化対象のサンプル列であってもよいし、当該音響ディジタル信号に対して線形予測分析を行って得られた残差信号が符号化対象のサンプル列であってもよいし、当該音響ディジタル信号から変換された周波数領域信号が符号化対象のサンプル列であってもよい。或いは、入力された音響ディジタル信号が所定の区間の周波数領域信号(所定の時間区間に対応する周波数領域信号、または当該周波数領域信号の所定の周波数区間の周波数領域信号)であり、当該音響ディジタル信号そのものが符号化対象のサンプル列であってもよいし、当該音響ディジタル信号から変換された時間領域信号が符号化対象のサンプル列であってもよいし、その時間領域信号に対して線形予測分析を行って得られた残差信号が符号化対象のサンプル列であってもよい。すなわち、入力される音響ディジタル信号は、時間領域信号でも周波数領域信号でもよく、符号化処理の対象のサンプル列も、時間領域信号でも周波数領域信号でもよい。また、時間領域信号から周波数領域信号への変換方法、および周波数域信号から時間領域信号への変換方法に限定はなく、例えばMDCT(Modified Discrete Cosine Transform)やDCT(Discrete Cosine Transform)、およびそれらの逆変換などを用いることができる。
上述の想定に基づき、各実施形態では、符号化装置が周波数領域変換部、パワースペクトル包絡係数列計算部、および重み付け包絡正規化部を有し、重み付け包絡正規化部で得られたサンプル列が量子化部に入力される例を示す。しかしながら、入力された音響ディジタル信号そのものを符号化対象のサンプル列とする場合には、例えば、周波数領域変換部、パワースペクトル包絡係数列計算部、および重み付け包絡正規化部が省略され、音響ディジタル信号のサンプル列がそのまま量子化部に入力される。入力された時間領域信号である音響ディジタル信号に対して線形予測分析を行って得られた残差信号を符号化対象のサンプル列とする場合には、例えば、符号化装置が、周波数領域変換部、パワースペクトル包絡係数列計算部、および重み付け包絡正規化部に代えて、音響ディジタル信号を入力として線形予測係数またはそれらに変換可能な係数を得る線形予測部、および当該線形予測係数に対応する線形予測フィルタと音響ディジタル信号とから予測残差を得る残差計算部を有し、当該残差信号のサンプル列が量子化部に入力される。入力された時間領域信号である音響ディジタル信号から変換された周波数領域信号を符号化対象のサンプル列とする場合には、例えば、パワースペクトル包絡係数列計算部、および重み付け包絡正規化部が省略され、周波数領域変換部で得られた周波数領域信号のサンプル列が量子化部に入力される。入力された周波数領域信号である音響ディジタル信号から変換された時間領域信号を符号化対象のサンプル列とする場合には、例えば、符号化装置が、周波数領域変換部、パワースペクトル包絡係数列計算部、および重み付け包絡正規化部に代えて、音響ディジタル信号を時間領域信号に変換する時間領域変換部を有し、当該時間領域信号のサンプル列が量子化部に入力される。入力された周波数領域信号である音響ディジタル信号から変換された時間領域信号に対して線形予測分析をして得られた残差信号を符号化対象のサンプル列とする場合には、例えば、符号化装置が、周波数領域変換部、パワースペクトル包絡係数列計算部、および重み付け包絡正規化部に代えて、時間領域変換部、線形予測部、および残差計算部を有し、残差計算部で得られた残差信号のサンプル列が量子化部に入力される。
[第1実施形態]
<符号化装置100>
図2を参照して第1実施形態の符号化装置100が行う符号化処理を説明する。
<周波数領域変換部101>
周波数領域変換部101は、所定の時間区間であるフレーム単位で、入力された音響ディジタル信号(入力音響信号)を周波数領域のN点のMDCT係数列X(1),・・・,X(N)に変換して出力する。ただし、Nは正整数である。
<パワースペクトル包絡係数列計算部102>
パワースペクトル包絡係数列計算部102は、フレーム単位の音響ディジタル信号に対する線形予測分析を行って線形予測係数を求め、その線形予測係数を用いてN点の音響ディジタル信号のパワースペクトル包絡係数列W(1),・・・,W(N)を得て出力する。
<重み付け包絡正規化部103>
重み付け包絡正規化部103は、パワースペクトル包絡係数列計算部102が得たパワースペクトル包絡係数列を用いて、周波数領域変換部101が得たMDCT係数列の各係数を正規化し、重み付け正規化MDCT係数列XN(1),・・・,XN(N)を出力する。ここでは聴覚的に歪が小さくなるような量子化の実現のために、重み付け包絡正規化部103は、パワースペクトル包絡を鈍らせた重み付けパワースペクトル包絡係数列を用いて、フレーム単位でMDCT係数列の各係数を正規化する。この結果、重み付け正規化MDCT係数列XN(1),・・・,XN(N)は、入力されたMDCT係数列ほどの大きな振幅の傾きや振幅の凹凸を持たないが、音響ディジタル信号のパワースペクトル包絡係数列と類似の大小関係を有するもの、すなわち、低い周波数に対応する係数側の領域にやや大きな振幅を持ち、ピッチ周期に起因する微細構造をもつもの、となる。
[重み付け包絡正規化処理の具体例]
N点のMDCT係数列の各係数X(1),・・・,X(N)に対応するパワースペクトル包絡係数列の各係数W(1),・・・,W(N)は、線形予測係数を周波数領域に変換して得ることができる。例えば、全極型モデルであるp次自己回帰過程により(ただしpは正整数)、時刻tの時間信号x(t)は、p時点まで遡った過去の自分自身の値x(t-1),・・・,x(t-p)と予測残差e(t)と線形予測係数α1,・・・,αpによって式(1)で表される。このとき、パワースペクトル包絡係数列の各係数W(n)[1≦n≦N]は式(2)で表される。exp(・)はネイピア数を底とする指数関数、jは虚数単位、σ2は予測残差エネルギーである。
Figure 0005872034
線形予測係数は、周波数領域変換部101に入力された音響ディジタル信号を重み付け包絡正規化部103によって線形予測分析して得られたものでもよいし、符号化装置100内に在る図示しない他の手段によって音響ディジタル信号を線形予測分析して得られたものであってもよい。このような場合には、重み付け包絡正規化部103が線形予測係数を用いてパワースペクトル包絡係数列の各係数W(1),・・・,W(N)を求める。また、符号化装置100内に在る他の手段(パワースペクトル包絡係数列計算部102など)によってパワースペクトル包絡係数列の各係数W(1),・・・,W(N)が既に得られている場合には、重み付け包絡正規化部103は、このパワースペクトル包絡係数列の各係数W(1),・・・,W(N)を用いることができる。なお、復号装置でも符号化装置100で得られた値と同じ値を得る必要があるため、量子化された線形予測係数および/またはパワースペクトル包絡係数列が利用される。以後の説明において、特に断りが無い限り、「線形予測係数」ないし「パワースペクトル包絡係数列」は量子化された線形予測係数ないしパワースペクトル包絡係数列を意味する。また、線形予測係数は例えば従来的な符号化技術によって符号化されて予測係数符号が復号側へ伝送される。従来的な符号化技術とは、例えば、線形予測係数そのものに対応する符号を予測係数符号とする符号化技術、線形予測係数をLSPパラメータに変換してLSPパラメータに対応する符号を予測係数符号とする符号化技術、線形予測係数をPARCOR係数に変換してPARCOR係数に対応する符号を予測係数符号とする符号化技術、などである。符号化装置100内に在る他の手段によってパワースペクトル包絡係数列が得られる構成である場合は、符号化装置100内に在る他の手段において線形予測係数が従来的な符号化技術によって符号化されて予測係数符号が復号側へ伝送される。
ここでは、重み付け包絡正規化処理の具体例として二つの例を示すが、本発明ではこれらの例に限定されるものではない。
<例1>
重み付け包絡正規化部103は、MDCT係数列の各係数X(1),・・・,X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数の補正値Wγ(1),・・・,Wγ(N)で除算することによって、重み付け正規化MDCT係数列の各係数X(1)/Wγ(1),・・・,X(N)/Wγ(N)を得る処理を行う。補正値Wγ(n)[1≦n≦N]は式(3)で与えられる。但し、γは1以下の正の定数であり、パワースペクトル係数を鈍らせる定数である。
Figure 0005872034
<例2>
重み付け包絡正規化部103は、MDCT係数列の各係数X(1),・・・,X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数のβ乗(0<β<1)の値W(1)β,・・・,W(N)βで除算することによって、重み付け正規化MDCT係数列の各係数X(1)/W(1)β,・・・,X(N)/W(N)βを得る処理を行う。
この結果、フレーム単位の重み付け正規化MDCT係数列が得られるが、重み付け正規化MDCT係数列は入力されたMDCT係数列ほどの大きな振幅の傾きや振幅の凹凸を持たないが、入力されたMDCT係数列のパワースペクトル包絡と類似の大小関係を有するもの、すなわち、低い周波数に対応する係数側の領域にやや大きな振幅を持ち、ピッチ周期に起因する微細構造をもつもの、となる。
なお、重み付け包絡正規化処理に対応する逆処理、つまり、重み付け正規化MDCT係数列からMDCT係数列を復元する処理が復号側にて行われるため、パワースペクトル包絡係数列から重み付けパワースペクトル包絡係数列を算出する方法を符号化側と復号側で共通の設定にしておくことが必要である。
<初期化部104>
初期化部104は、利得(グローバルゲイン)gの初期値を設定する。利得の初期値は、重み付け正規化MDCT係数列XN(1),・・・,XN(N)のエネルギーと可変長符号化部106が出力する符号に予め配分されたビット数などから決めることができる。また、利得gの初期値は正値である。以下、可変長符号化部106が出力する符号に予め配分されたビット数を配分ビット数Bと呼ぶ。また、初期化部は、利得の更新回数の初期値として0を設定する。
<利得更新ループ処理部130>
利得更新ループ処理部130は、重み付け正規化MDCT係数列XN(1),・・・,XN(N)中の各係数を利得で除算して得られる系列(整数値サンプルによる列)を所定のビット数で符号化できるように利得を決定し、重み付け正規化MDCT係数列XN(1),・・・,XN(N)中の各係数を決定した利得で除算して得られる系列(整数値サンプルによる列)を可変長符号化して得た整数信号符号と、決定した利得を符号化して得た利得符号(利得に対応する利得符号)と、を出力する。利得更新ループ処理部130は、上記の整数値サンプルによる列を符号化して得られる符号のビット数と、所定の配分ビット数Bと、の差が大きいほど、更新前の利得と更新後の利得との差が大きくなるように利得の値を更新する。
利得更新ループ処理部130は、量子化部105と、可変長符号化部106と、判定部107と、利得拡大更新部131と、利得縮小更新部132と、切り捨て部116と、利得符号化部117と、を含む。
<量子化部105>
量子化部105は、入力された重み付け正規化MDCT係数列XN(1),・・・,XN (N)(所定の区間の入力音響信号に由来するサンプル列)の各係数(各サンプル)を利得gで割り算して得られる値を量子化して、整数値(量子化正規化済サンプル)による系列である量子化正規化済係数系列XQ(1),・・・,XQ(N)を得て出力する。
また量子化部105は、最も低い周波数側にある量子化正規化済係数から、値が0ではない最も高い周波数側にある量子化正規化済係数までの、サンプル数sを計数し、このサンプル数sを出力する。
<可変長符号化部106>
可変長符号化部106は、入力された量子化正規化済係数系列XQ(1),・・・,XQ(N)を可変長符号化して符号(サンプル列符号)を得て出力する。この符号を整数信号符号と呼ぶ。この可変長符号化には、例えば、量子化正規化済係数系列中の複数の係数を纏めて符号化する方法を用いる。また、可変長符号化部106は、可変長符号化で得た整数信号符号のビット数を計測する。本形態では、このビット数を消費ビット数cと呼ぶ。
<判定部107>
判定部107は、利得の更新回数が予め定めた回数の場合は、利得g、整数信号符号、消費ビット数cを出力する。
利得の更新回数が予め定めた回数未満である場合は、可変長符号化部106が計測した消費ビット数cが配分ビット数Bより多い場合には利得拡大更新部131が、可変長符号化部106が計測した消費ビット数cが配分ビット数Bより少ない場合には利得縮小更新部132が、次の処理を行うように制御する。なお、可変長符号化部106が計測した消費ビット数cが配分ビット数Bと等しい場合は、判定部107は、利得g、整数信号符号、消費ビット数cを出力する。
<利得拡大更新部131>
利得拡大更新部131は、今回の利得gの値よりも大きな値g’>gを新たな利得として設定する。利得拡大更新部131は、サンプル数計測部118と、利得下限設定部108と、第1分岐部109と、第1利得更新部110と、利得拡大部111と、を含む。
<サンプル数計測部118>
サンプル数計測部118は、消費ビット数cが配分ビット数Bより多い場合には、判定部107が出力した整数信号符号のうち、消費ビット数cが配分ビット数Bを上回らないように、高い周波数側の量子化正規化済係数に対応する符号を取り除いた符号に対応する量子化正規化済係数のサンプル数tを出力する。
つまり、サンプル数計測部118は、消費ビット数cの配分ビット数Bに対する上回り分c−Bに対応する符号(切り捨て符号)に対応する高い周波数側の量子化正規化済係数を、量子化部105が出力した量子化正規化済係数系列から取り除いた残りである、対応する符号が取り除かれなかった量子化正規化済係数のサンプル数tを出力する。切り捨て符号の例は、最も高い周波数を含む領域内の1個以上の量子化正規化済係数に対応する符号のうち、ビット数がc−B以上かつ最小の符号である。言い換えれば、低い周波数側の量子化正規化済係数のみを符号化対象とし、残りの高い周波数側の量子化正規化済係数を符号化対象としないことにより、対応する可変長符号の長さが配分ビット数B以下かつ最大となるときの、符号化対象とする量子化正規化済係数のサンプル数がtである。
<利得下限設定部108>
消費ビット数cが配分ビット数Bより多い場合には、さらに利得下限設定部108が、今回の利得gの値(当該消費ビット数cに対応する利得g)を利得の下限値gminとして設定する(gmin←g)。この利得の下限値gminは、少なくとも利得の値はこれ以上であるべきことを意味する。
<第1分岐部109>
利得下限設定部108で利得の下限値gminが設定された場合、第1分岐部109は、利得の上限値gmaxが既に設定されている場合には第1利得更新部110が、そうでない場合には利得拡大部111が、次の処理を行うように制御する。
<第1利得更新部110>
第1利得更新部110は、今回の利得gの値(消費ビット数cに対応する利得g)と利得の上限値gmaxとの間の値を、利得gの新たな値とする。これは、最適な利得の値は、今回の利得gの値と利得の上限値gmaxとの間に存在するからである。第1利得更新部110は、例えば、今回の利得gの値と利得の上限値gmaxの平均値を新たに利得gとして設定する(g←(g+gmax)/2)。今回の利得gの値は利得の下限値gminとして設定されているので、利得の上限値gmaxと利得の下限値gminの平均値を新たに利得gの値として設定するとも言える(g←(gmax+gmin)/2)。その後、量子化部105の処理に戻る。
<利得拡大部111>
利得拡大部111は、最も低い周波数側にある量子化正規化済係数から値が0ではない最も高い周波数側にある量子化正規化済係数までのサンプル数sから、サンプル数計測部118が出力したサンプル数tを減算して得られる値u=s−t、が大きいほど、今回の利得から新たな利得への増分が大きくなるようにする。例えば、新たな利得g←今回の利得g×(1+u/N×α)とする。ここで、αは予め定めた正の定数とする。
または、利得拡大部111は、符号化対象のすべてのサンプル数Nから、サンプル数計測部118が出力したサンプル数tを減算して得られるv=N−tが大きいほど、今回の利得から新たな利得への増分が大きくなるようにする。たとえば、新たな利得g←今回の利得g×(1+v/N×α)とする。
すなわち利得拡大部111は、量子化正規化済サンプル列の一部または全てのサンプル数から、上記の対応する符号が取り除かれなかった量子化正規化済係数のサンプル数、を減算して得られる値が大きいほど、利得gの値を大きく増加させる。その後、量子化部105の処理に戻る。言い換えると、利得拡大部111は、量子化正規化済サンプル列の一部または全てのサンプル数から、上記の対応する符号が取り除かれなかった量子化正規化済係数のサンプル数、を減算して得られる値が大きいほど、利得の更新前の値から更新後の値への増分が大きくなるように利得の値を更新し、その後の量子化部105の処理を行わせる。
<利得縮小更新部132>
利得縮小更新部132は、今回の利得gの値よりも小さな値g’<gを新たな利得として設定する。利得縮小更新部132は、利得上限設定部112と、第2分岐部113と、第2利得更新部114と、利得縮小部115と、を含む。
<利得上限設定部112>
消費ビット数cが配分ビット数Bよりも少ない場合には、利得上限設定部112が、今回の利得gの値(当該消費ビット数cに対応する利得gの値)を利得の上限値gmaxと設定する(gmax←g)。この利得の上限値gmaxは、少なくとも利得の値はこれ以下であるべきことを意味する。
<第2分岐部113>
利得上限設定部112で利得の上限値gmaxが設定された場合、第2分岐部113は、利得の下限値gminが既に設定されている場合には第2利得更新部114が、そうでない場合には利得縮小部115が、次の処理を行うように制御する。
<第2利得更新部114>
第2利得更新部114は、今回の利得gの値(消費ビット数cに対応する利得gの値)と、利得の下限値gminとの間の値を、利得gの新たな値とする。これは、最適な利得の値は、今回の利得gの値と利得の下限値gminとの間に存在するからである。第2利得更新部114は、例えば、今回の利得gの値と利得の下限値gminの平均値を新たな利得gの値として設定する(g←(g+gmin)/2)。今回の利得gの値は利得の上限値gmaxとして設定されているので、利得の上限値gmaxと利得の下限値gminの平均値を新たに利得gの値として設定するとも言える(g←(gmax+gmin)/2)。その後、量子化部105の処理に戻る。
<利得縮小部115>
利得縮小部115は、配分ビット数Bから消費ビット数cを減算して得られる値である余剰ビット数B−cが大きいほど、今回の利得gの値から新たな利得gの値への減少分が大きくなるようにする。ただし、新たな利得gの値も正値である。例えば、新たな利得g←今回の利得g×(1-(B-c)/B×β)とする。ここで、βは予め定めた正の定数とする。すなわち利得縮小部115は、配分ビット数Bから消費ビット数cを減算して得られる値B−cが大きいほど、利得gの値を大きく減少させる。その後、量子化部105の処理に戻る。言い換えると、利得縮小部115は、配分ビット数Bから消費ビット数cを減算して得られる値B−cが大きいほど、利得gの更新前の値から更新後の値への減少分が大きくなるように利得gの値を更新し、その後の量子化部105の処理を行わせる。
<切り捨て部116>
切り捨て部116は、判定部107が出力した消費ビット数cが配分ビット数Bより多い場合には、判定部107が出力した整数信号符号のうち、消費ビット数cが配分ビット数Bを上回る分だけの符号を、高い周波数側の量子化正規化済係数に対応する符号から取り除いたものを、新たな整数信号符号として出力する。すなわち切り捨て部116は、消費ビット数cの配分ビット数Bに対する上回り分c−Bに対応する高い周波数側の量子化正規化済係数に対応する符号(切り捨て符号)を整数信号符号(サンプル列符号)から取り除くことで得られる、残りの符号(切り捨て済サンプル列符号)を、新たな整数信号符号として出力する。
<利得符号化部117>
判定部107が出力した利得を所定のビット数で符号化して利得符号を得て、出力する。
[第1実施形態の変形例]
<符号化装置150>
図3を参照して第1実施形態の変形例の符号化装置150が行う符号化処理を説明する。第1実施形態の変形例の符号化装置150が第1実施形態の符号化装置100と異なるのは、可変長符号化で得た整数信号符号のビット数に代えて、整数信号符号の推定ビット数を消費ビット数cとする点である。符号化装置150は、符号化装置100の利得更新ループ処理部130に代えて、利得更新ループ処理部190を備える。利得更新ループ処理部190は、利得更新ループ処理部130の可変長符号化部106、判定部107、利得拡大更新部131、および切り捨て部116に代えて、ビット数推定部156、判定部157、利得拡大更新部191、および可変長符号化部159を備える。利得拡大更新部191は、利得拡大更新部131の利得拡大部111、およびサンプル数計測部118に代えて、利得拡大部151、およびサンプル数計測部168を備える。
以下、第1実施形態との差分についてのみ説明する。
<ビット数推定部156>
ビット数推定部156は、量子化正規化済係数系列XQ(1),・・・,XQ(N)を可変長符号化して得られる符号のビット数の推定値(推定ビット数)を求めて出力する。第1実施形態の変形例では、この推定ビット数を消費ビット数cと呼ぶ。
<判定部157>
判定部157は、利得の更新回数が予め定めた回数の場合は、利得g、量子化正規化済係数系列XQ(1),・・・,XQ(N)を出力する。
利得の更新回数が予め定めた回数未満である場合は、ビット数推定部156が推定した消費ビット数cが配分ビット数Bより多い場合には利得拡大更新部191が、ビット数推定部156が推定した消費ビット数cが配分ビット数Bより少ない場合には利得縮小更新部132が、次の処理を行うように制御する。なお、ビット数推定部156が推定した消費ビット数cが配分ビット数Bと等しい場合は、判定部157は、利得g、量子化正規化済係数系列XQ(1),・・・,XQ(N)を出力する。
<サンプル数計測部168>
サンプル数計測部168は、消費ビット数cが配分ビット数Bより多い場合には、消費ビット数cの配分ビット数Bに対する上回り分c−Bに対応する符号(切り捨て符号)の対象となる高い周波数側の量子化正規化済係数を、量子化部105が出力した量子化正規化済係数系列XQ(1),・・・,XQ(N)から取り除いた残りの量子化正規化済係数のサンプル数tを出力する。
<利得拡大部151>
利得拡大部151は、第1実施形態の利得拡大部111におけるサンプル数計測部118が出力したサンプル数tの代わりに、サンプル数計測部168が出力したサンプル数tを用いる点を除いては同じである。
すなわち、利得拡大部151は、最も低い周波数側にある量子化正規化済係数から値が0ではない最も高い周波数側にある量子化正規化済係数までのサンプル数sから、サンプル数計測部118が出力したサンプル数tを減算して得られる値u=s−t、が大きいほど、今回の利得から新たな利得への増分が大きくなるようにする。例えば、新たな利得g←今回の利得g×(1+u/N×α)とする。ここで、αは予め定めた正の定数とする。
または、利得拡大部151は、符号化対象のすべてのサンプル数Nから、サンプル数計測部118が出力したサンプル数tを減算して得られるv=N−tが大きいほど、今回の利得から新たな利得への増分が大きくなるようにする。たとえば、新たな利得g←今回の利得g×(1+v/N×α)とする。
すなわち利得拡大部151は、量子化正規化済サンプル列の一部または全てのサンプル数から、上記の対応する符号が取り除かれなかった量子化正規化済係数のサンプル数、を減算して得られる値が大きいほど、利得gの値を大きく増加させる。その後、量子化部105の処理に戻る。言い換えると、利得拡大部151は、量子化正規化済サンプル列の一部または全てのサンプル数から、上記の切り捨て符号の対象となる高い周波数側の量子化正規化済係数を量子化部105が出力した量子化正規化済係数系列XQ(1),・・・,XQ(N)から取り除いた残りの量子化正規化済係数のサンプル数t、を減算して得られる値が大きいほど、利得の更新前の値から更新後の値への増分が大きくなるように利得の値を更新し、その後の量子化部105の処理を行わせる。
<可変長符号化部159>
可変長符号化部159は、判定部157から出力された量子化正規化済係数系列XQ(1),・・・,XQ(N)を可変長符号化して符号を得て、得られた符号を整数信号符号(サンプル列符号)として出力する。可変長符号化によって配分ビット数Bを超えるビット数の符号が得られる場合、可変長符号化部159は、可変長符号化により得られた符号のうち、配分ビット数Bを上回る分だけの符号を、高い周波数側の量子化正規化済係数に対応する符号から取り除いたものを、整数信号符号として出力する。
[第2実施形態]
<符号化装置200>
図4を参照して第2実施形態の符号化装置200が行う符号化処理を説明する。第2実施形態の符号化装置200が第1実施形態の符号化装置100と異なるのは、利得更新ループ処理部130に代えて利得更新ループ処理部230を備え、利得更新ループ処理部230が、利得更新ループ処理部130の量子化部105、判定部107、利得拡大更新部131、および切り捨て部116に代えて、量子化部205、判定部207、利得拡大更新部231、および切り捨て部216を備える点、ならびに第1利得更新部110、第2利得更新部114、および利得縮小部115の処理の後、量子化部105の処理に戻ることに代えて、量子化部205の処理に戻る点である。利得拡大更新部231は、第1実施形態の利得拡大更新部131におけるサンプル数計測部118を含まず、利得下限設定部108と、第1分岐部109と、第1利得更新部110と、利得拡大部211と、から構成される。以下、第1実施形態との差分についてのみ説明する。
<量子化部205>
量子化部205は、重み付け正規化MDCT係数列XN(1),・・・,XN(N) (所定の区間の入力音響信号に由来するサンプル列)の各係数(各サンプル)を利得gで割り算して得られる値を量子化して、整数値(量子化正規化済サンプル)による系列である量子化正規化済係数系列XQ(1),・・・,XQ(N)を得て出力する。
<判定部207>
判定部207は、利得の更新回数が予め定めた回数の場合は、利得、整数信号符号、消費ビット数cを出力する。
利得の更新回数が予め定めた回数未満である場合は、可変長符号化部106が計測した消費ビット数cが配分ビット数Bより多い場合には利得拡大更新部231が、可変長符号化部106が計測した消費ビット数cが配分ビット数Bより少ない場合には利得縮小更新部132が、第1実施形態で説明した処理を行うように制御する。なお、可変長符号化部106が計測した消費ビット数cが配分ビット数Bと等しい場合は、判定部207は、利得、整数信号符号、消費ビット数cを出力する。
<切り捨て部216>
切り捨て部216は、判定部207が出力した消費ビット数cが配分ビット数Bより多い場合には、判定部207が出力した整数信号符号のうち、消費ビット数cが配分ビット数Bを上回る分だけの符号を、高い周波数側の量子化正規化済係数に対応する符号から取り除いたものを、新たな整数信号符号として出力する。すなわち切り捨て部216は、消費ビット数cの配分ビット数Bに対する上回り分c−Bに対応する高い周波数側の量子化正規化済係数に対応する符号(切り捨て符号)を整数信号符号(サンプル列符号)から取り除くことで得られる、残りの符号(切り捨て済サンプル列符号)を、新たな整数信号符号として出力する。
<利得拡大部211>
利得拡大部211は、消費ビット数cから配分ビット数Bを減算して得られる値である不足ビット数c−Bが大きいほど、今回の利得から新たな利得への増加分が大きくなるようにする。たとえば、新たな利得g←今回の利得g×(1+(c−B)/B×α)とする。ここで、αは予め定めた正の定数とする。すなわち、消費ビット数cが配分ビット数Bよりも多く、なおかつ、利得の上限値gmaxが設定されていない場合、利得拡大部211が、消費ビット数cから配分ビット数Bを減算して得られる値c−Bが大きいほど、利得gの値を大きく増加させる。その後、量子化部205の処理に戻る。言い換えると、利得拡大部211は、消費ビット数cから配分ビット数Bを減算して得られる値c−Bが大きいほど、利得gの更新前の値から更新後の値への増分が大きくなるように利得gの値を更新し、その後の量子化部205の処理を行わせる。
[第2実施形態の変形例]
<符号化装置250>
図5を参照して第2実施形態の変形例の符号化装置250が行う符号化処理を説明する。第2実施形態の変形例の符号化装置250が第2実施形態の符号化装置200と異なるのは、可変長符号化で得た整数信号符号のビット数に代えて、整数信号符号の推定ビット数を消費ビット数cとする点である。符号化装置250は、符号化装置200の利得更新ループ処理部230に代えて利得更新ループ処理部290を備え、利得更新ループ処理部290が利得更新ループ処理部230の可変長符号化部106、切り捨て部216、および判定部207に代えて、ビット数推定部156、可変長符号化部159、および判定部257を備える。以下、第2実施形態との差分についてのみ説明する。
<ビット数推定部156>
ビット数推定部156は、第1実施形態の変形例と同じである。
<判定部257>
判定部257は、利得の更新回数が予め定めた回数の場合は、利得、量子化正規化済係数系列、消費ビット数cを出力する。
利得の更新回数が予め定めた回数未満である場合は、ビット数推定部156が推定した消費ビット数cが配分ビット数Bより多い場合には利得拡大更新部231が、ビット数推定部156が推定した消費ビット数cが配分ビット数Bより少ない場合には利得縮小更新部132が、第1実施形態で説明した処理を行うように制御する。なお、ビット数推定部156が推定した消費ビット数cが配分ビット数Bと等しい場合は、判定部257は、利得、量子化正規化済係数系列、消費ビット数cを出力する。
<可変長符号化部159>
可変長符号化部159は、第1実施形態の変形例と同じである。
[第3実施形態]
<符号化装置300>
図6を参照して第3実施形態の符号化装置300が行う符号化処理を説明する。第3実施形態の符号化装置300が第1実施形態の符号化装置100と異なるのは、利得下限設定部108、第1利得更新部110、利得上限設定部112、および第2利得更新部114に代えて、利得下限設定部308、第1利得更新部310、利得上限設定部312、第2利得更新部314、および消費ビット数記憶部320を備える点である。利得拡大更新部331は、利得拡大更新部131の利得下限設定部108、第1利得更新部110に代えて、利得下限設定部308、第1利得更新部310を備える。利得縮小更新部332は、利得縮小更新部132の利得上限設定部112、第2利得更新部114に代えて、利得上限設定部312、第2利得更新部314を備える。利得更ループ処理部330は、利得更新ループ処理部130の利得拡大更新部131と利得縮小更新部132に代えて、利得拡大更新部331と利得縮小更新部332を備える。以下、第1実施形態との差分についてのみ説明する。
<利得下限設定部308>
利得下限設定部308は、今回の利得gの値を利得の下限値gminとして設定する(gmin←g)。また、利得下限設定部308は、消費ビット数cを下限設定時消費ビット数cとして消費ビット数記憶部320に記憶する。すなわち利得下限設定部308は、消費ビット数cが配分ビット数Bよりも多い場合に、第1実施形態の利得下限設定部108の処理に加え、さらに消費ビット数cを下限設定時消費ビット数cとして設定して消費ビット数記憶部320に記憶する。
<利得上限設定部312>
利得上限設定部312は、今回の利得gの値を利得の上限値gmaxと設定する(gmax←g)。また、利得上限設定部312は、消費ビット数cを上限設定時消費ビット数cとして消費ビット数記憶部320に記憶する。すなわち利得上限設定部312は、消費ビット数cが配分ビット数Bよりも少ない場合に、第1実施形態の利得上限設定部112の処理に加え、さらに消費ビット数cを上限設定時消費ビット数cとして設定して消費ビット数記憶部320に記憶する。
<第1利得更新部310>
消費ビット数cが配分ビット数Bよりも多く、なおかつ、利得の上限値gmaxが既に設定されている場合、第1利得更新部310は、配分ビット数Bと上限設定時消費ビット数cと下限設定時消費ビット数cとに基づき、利得の下限値gminのもっともらしさの指標と利得の上限値gmaxのもっともらしさの指標との少なくとも何れかを求める。なお、「もっともらしさの指標」とは、利得gの値としてのもっともらしさを表す指標を意味する。
[利得の下限値gminのもっともらしさの指標]
第1利得更新部310は、例えば、利得の下限値gminの相対的もっともらしさを表す指標wを式Aにより求める。
w=(B−c)/(c−c) (式A)
式Aは、意味的には、配分ビット数Bと上限設定時消費ビット数cとの差、と下限設定時消費ビット数cと配分ビット数Bとの差に基づく式Bの右辺を変形したものである。
w=(B−c)/(B−c+c−B) (式B)
従って、式Aではなく式Bにより指標wを求めてもよい。
式Aまたは式Bにより求まる指標wが大きいときには、利得の下限値gminのほうが利得gの値としてもっともらしく、指標wが小さいときには、利得の上限値gmaxのほうが利得gの値としてもっともらしいことになる。
[利得の上限値gmaxのもっともらしさの指標]
利得の上限値gmaxの相対的もっともらしさは(1−w)である。
すなわち、式Aまたは式Bにより指標wを求めることに代えて、利得の上限値gmaxのもっともらしさの指標(1−w)を式Cによって求めてもよい。
(1−w)=(c−B)/(c−c) (式C)
式Cは、意味的には、配分ビット数Bと上限設定時消費ビット数cとの差B−c、と下限設定時消費ビット数cと配分ビット数Bとの差c−Bに基づく式Dの右辺を変形したものである。
1−w=(c−B)/(B−c+c−B) (式D)
従って、式Cではなく式Dにより指標(1−w)を求めてもよい。
式Aまたは式Bにより求まる指標(1−w)が大きいときには、利得の上限値gmaxのほうが利得gの値としてもっともらしく、指標(1−w)が小さいときには、利得の下限値gminのほうが利得gの値としてもっともらしいことになる。
そして、第1利得更新部310は、利得の上限値gmaxと利得の下限値gminのうちもっともらしさの大きいほうの値に重きを置いた重みつき平均を新たな利得gの値として設定して出力する(g←gmin×w+gmax×(1−w))。すなわち、配分ビット数Bと上限設定時消費ビット数cの差が下限設定時消費ビット数cと配分ビット数Bの差より大きい場合には、利得の下限値gminのほうがもっともらしく、好ましい利得gの値に近いことになる。
あるいは第1利得更新部310が、正の値である定数Cを使って、w=(B−c+C)/(c−c+2×C)として重みづけを緩和したものを指標wとして求めてもよい。なお、この場合は
(1−w)=(c−B+C)/(c−c+2×C)
となり、新たな利得gの値は利得の上限値gmaxと利得の下限値gminの算術平均値と消費ビット数と配分ビット数の差に基づく重みつき平均の中間となる。
なお、サンプル数計測部118で切り捨て符号の対象となる量子化正規化済サンプルのサンプル数(切り捨てられたサンプル数Tr)が得られている場合には、下限設定時消費ビット数cと配分ビット数Bの差のかわりに、切り捨てられたサンプル数Trを用いることも可能である。下限設定時消費ビット数cと配分ビット数Bの差が大きいほど切り捨てられたサンプル数Trが大きいという性質があるためである。下限設定時消費ビット数cと配分ビット数Bの差と切り捨てられたサンプル数Trの対応関係をあらかじめ実験的にもとめておくことで、切り捨てられたサンプル数Trを下限設定時消費ビット数cと配分ビット数Bの差に近似的に換算すればよい。γは換算のために実験的に定める係数で(c−B)=γ×Trと置き換えるとw=(B−c)/(B−c+γ×Tr)とすることができる。同様に、正の値である定数Cを使ってw=(B−c+C)/(B−c+γ×Tr+2×C)として重みづけを緩和したものを指標wとすることもできる。すなわち、第1利得更新部310は、配分ビット数B、切り捨てられたサンプル数Tr、および上限設定時消費ビット数cを用い、利得の下限値のもっともらしさの指標と利得の上限値のもっともらしさの指標との少なくとも何れかを得てもよい。なお、直近のサンプル数計測部118の処理で得られた最も新しいサンプル数Trを用いることが望ましいが、より過去のサンプル数計測部118の処理で得られたサンプル数Trを用いてもよい。
その後、量子化部105の処理に戻る。
<第2利得更新部314>
消費ビット数cが配分ビット数Bよりも少なく、なおかつ、利得の下限値gminが既に設定されている場合に、第2利得更新部314は第1利得更新部310と同じ動作をする。
上述した「もっともらしさの指標」は、利得の下限値gminまたは上限値gmaxのどちらの方向に、どのくらい利得gの値を動かせば、適切な利得gの値に近づくかを表す。本形態では、この指標に基づいて利得gの新たな値に更新するため、利得gが適切な値に収束するまでの更新回数を削減することができる。
なお、本形態の第1利得更新部310および第2利得更新部314は、利得の下限値gminのもっともらしさの指標と利得の上限値gmaxのもっともらしさの指標との少なくとも何れかを得て、利得の下限値gminと利得の上限値gmaxのうちもっともらしいほうに大きな重みを与えた、利得の下限値gminと利得の上限値gmaxとの重みつき平均を、利得gの新たな値とした。しかしながら、第1利得更新部310および第2利得更新部314が、もっともらしさの指標を得ることなく、利得の下限値gminと利得の上限値gmaxのうちもっともらしいほうに大きな重みを与えた、利得の下限値gminと利得の上限値gmaxとの重みつき平均を、利得gの新たな値としてもよい。例えば、第1利得更新部310および第2利得更新部314が、指標wおよび(1−w)の何れも得ることなく、上限設定時消費ビット数cと下限設定時消費ビット数cと、配分ビット数Bとに基づき、
Figure 0005872034

あるいは、
Figure 0005872034

を利得gの新たな値として得てもよい。すなわち、配分ビット数Bと上限設定時消費ビット数cの差が大きいほど、利得の上限値gmaxのほうに大きな重みを与えた、または、下限設定時消費ビット数cと配分ビット数Bの差が大きいほど、利得の下限値gminのほうに大きな重みを与えた、利得の下限値gminと利得の上限値gmaxとの重みつき平均を、利得gの新たな値とすればよく、その処理過程に限定はない。
あるいは、第1利得更新部310および第2利得更新部314が、切り捨てられたサンプル数Trに基づき利得gを更新する構成とする場合には、第1利得更新部310が、
Figure 0005872034

もしくは、
Figure 0005872034

を利得gの新たな値として得てもよい。
また例えば、利得の下限値gminと利得の上限値gmaxの何れかに重みを与えた、利得の下限値gminと利得の上限値gmaxとの重みつき平均を、利得gの新たな値としても良い。例えば、
(ω×gmin+gmax)/(ω+1)
を利得gの新たな値としても良い。ここで、ωは、例えば、gminの方がもっともらしい場合、すなわち(B−c)>(c−B)の場合、に1以上の正の値を取り、gmaxの方がもっともらしい場合、すなわち(B−c)<(c−B)の場合、に1以下の正の値を取り、B−cが大きいほど大きな値を取るように設定すればよい。例えば、ωをB−cに関する単調増加関数値とすれば良い。あるいは、
(gmin+ω×gmax)/(1+ω
を利得gの新たな値としても良い。ここで、ωは、例えば、gmaxの方がもっともらしい場合に1以上の正の値を取り、gminの方がもっともらしい場合に1以下の正の値を取り、c−Bが大きいほど大きな値を取るように設定すればよい。例えば、ωを、c−Bに関する単調増加関数値とすれば良い。あるいは、ωを1以上の正の値であって、B−cに関する単調増加関数値を取るものとし、ωを1以上の正の値であってc−Bに関する単調増加関数値を取るものとして、gminの方がもっともらしい場合((B−c)>(c−B)の場合)に
(ω×gmin+gmax)/(ω+1)
を利得gの新たな値とし、gmaxの方がもっともらしい場合((B−c)<(c−B)の場合)に
(gmin+ω×gmax)/(1+ω
を利得gの新たな値としても良い。
このように、配分ビット数Bと下限設定時消費ビット数cと上限設定時消費ビット数cとに少なくとも基づく重みを、利得の上限値gmaxと利得の下限値gminとの少なくとも何れかに与えた、利得の上限値と利得の下限値の重み付き平均を更新後の利得としてもよい。
[第3実施形態の変形例]
上記の第3実施形態では第1実施形態の利得下限設定部108、利得上限設定部112、第1利得更新部110、第2利得更新部114を置き換えるものとして説明したが、第2実施形態の利得下限設定部108、利得上限設定部112、第1利得更新部110、第2利得更新部114を上記の第3実施形態で説明したものに置き換えて実施してもよいし、[背景技術]に記載したTCX符号化の符号化装置1000の利得下限設定部1008、利得上限設定部1012、第1利得更新部1010、第2利得更新部1014を上記の第3実施形態で説明したものに置き換えて実施してもよい。
あるいは、第1実施形態の変形例の利得下限設定部108、利得上限設定部112、第1利得更新部110、第2利得更新部114を上記の第3実施形態で説明したものに置き換えて実施してもよいし、第2実施形態の変形例の利得下限設定部108、利得上限設定部112、第1利得更新部110、第2利得更新部114を上記の第3実施形態で説明したものに置き換えて実施してもよい。
すなわち、サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、所定の配分ビット数Bより多い場合に、更新前の利得を利得の下限値gminとして設定し、ビット数または推定ビット数を下限設定時消費ビット数cとして設定し、サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、所定の配分ビット数Bより少ない場合に、更新前の利得を利得の上限値gmaxとして設定し、ビット数または推定ビット数を上限設定時消費ビット数cとして設定し、配分ビット数Bと下限設定時消費ビット数cと上限設定時消費ビット数cとに少なくとも基づく重みを、利得の上限値gmaxと利得の下限値gminとの少なくとも何れかに与えた、利得の上限値と利得の下限値の重み付き平均を更新後の利得とすればよい。
<符号化装置のハードウェア構成例>
上述の実施形態に関わる符号化装置は、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、CPU(Central Processing Unit)〔キャッシュメモリなどを備えていてもよい。〕、メモリであるRAM(Random Access Memory)やROM(Read Only Memory)、ハードディスクである外部記憶装置、およびこれらの入力部、出力部、CPU、RAM、ROM、外部記憶装置間のデータのやり取りが可能なように接続するバスなどを備えている。また必要に応じて、符号化装置に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。
符号化装置の外部記憶装置には、符号化を実行するためのプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている〔外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくなどでもよい。〕。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。以下、データやその格納領域のアドレスなどを記憶する記憶装置を単に「記憶部」と呼ぶことにする。符号化装置の記憶部には、符号化を実行するためのプログラムなどが記憶されている。
符号化装置では、記憶部に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてRAMに読み込まれて、CPUで解釈実行・処理される。この結果、CPUが所定の機能を実現することで符号化が実現される。
<補記>
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。例えば、上記の各実施形態では、消費ビット数が配分ビット数より少ない場合には利得縮小更新部の処理を行い、消費ビット数が配分ビット数と等しい場合に判定部が利得等を出力することとした。しかしながら、消費ビット数が配分ビット数より多くない場合に利得縮小更新部の処理を行ってもよい。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
また、上記実施形態において説明したハードウェアエンティティ(符号化装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は非一時的な(non-transitory)記録媒体である。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
100,150,200,250,300,1000 符号化装置

Claims (28)

  1. 所定の区間の入力音響信号に由来するサンプル列の符号化を行う符号化装置の符号化方法であって、
    上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数と、所定の配分ビット数Bと、の差が大きいほど、更新前の利得と更新後の利得との差が大きくなるように利得の値を更新する利得拡大縮小ステップを含む処理を行って、利得を得る利得更新ループ処理ステップと、
    上記利得更新ループ処理ステップにより得られた利得に対応する利得符号と、上記サンプル列の各サンプルを上記利得で除算して得られる整数値サンプルによる列を符号化して得られる整数信号符号とを得る符号出力ステップと、
    を有する符号化方法。
  2. 所定の区間の入力音響信号に由来するサンプル列について、利得をループ処理により求める利得更新ループ処理ステップにより得られた利得に対応する利得符号と、上記サンプル列の各サンプルを上記利得で除算して得られる整数値サンプルによる列を符号化して得られる整数信号符号とを得る符号化装置の符号化方法であって、
    上記利得更新ループ処理ステップは、
    上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、定の配分ビット数Bより多い場合に、上記更新前の利得を利得の下限値gminとして設定する利得下限値設定ステップと、
    上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、上記所定の配分ビット数Bより少ない場合に、上記更新前の利得を利得の上限値gmaxとして設定する利得上限値設定ステップと、
    上記配分ビット数Bと、上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、上記所定の配分ビット数Bより多い場合の上記ビット数または推定ビット数である下限設定時消費ビット数c、上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、上記所定の配分ビット数Bより少ない場合の上記ビット数または推定ビット数である上限設定時消費ビット数cに少なくとも基づく重みを、利得の上限値gmaxと利得の下限値gminとの少なくとも何れかに与えた、利得の上限値と利得の下限値の重み付き平均を更新後の利得とする利得更新ステップと、
    を含む符号化方法。
  3. 請求項2記載の符号化方法であって、
    上記利得更新ステップにおける重み付き平均は、

    Figure 0005872034

    もしくは、Cを所定の正の定数として、
    Figure 0005872034

    である符号化方法。
  4. 所定の区間の入力音響信号に由来するサンプル列の符号化を行う符号化装置の符号化方法であって、
    上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化ステップと、
    上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化ステップと、
    上記利得よりも大きな値を新たな利得として設定する利得拡大更新ステップと、
    上記利得よりも小さな値を新たな利得として設定する利得縮小更新ステップと、
    上記利得の更新回数が予め定めた回数の場合は上記利得と上記サンプル列符号とを出力し、上記利得の更新回数が予め定めた回数未満かつ上記サンプル列符号のビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新ステップを行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に利得縮小更新ステップを行わせる判定ステップと、
    を有し、
    上記利得拡大更新ステップは、
    上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定ステップと、
    上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記量子化正規化済サンプル列の一部または全てのサンプル数Aから、上記消費ビット数の上記配分ビット数に対する上回り分に対応する切り捨て符号を上記サンプル列符号から取り除くことで得られる残りの切り捨て済サンプル列符号に対応する量子化正規化済サンプルのサンプル数T、を減算して得られる値A−Tが大きいほど、上記利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得拡大ステップと、
    を含み、
    上記利得縮小更新ステップは、
    上記消費ビット数が上記配分ビット数よりも少ない場合に上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定ステップと、
    上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得縮小ステップと、
    を含む符号化方法。
  5. 所定の区間の入力音響信号に由来するサンプル列の符号化を行う符号化装置の符号化方法であって、
    上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化ステップと、
    上記利得よりも大きな値を新たな利得として設定する利得拡大更新ステップと、
    上記利得よりも小さな値を新たな利得として設定する利得縮小更新ステップと、
    上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化ステップと、
    上記利得の更新回数が予め定めた回数の場合は可変長符号化ステップを行わせ、上記利得の更新回数が予め定めた回数未満かつ上記量子化正規化済サンプル列に対応する符号の推定ビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新ステップを行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に上記利得縮小更新ステップを行わせる判定ステップと、
    を有し、
    上記利得拡大更新ステップは、
    上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定ステップと、
    上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記量子化正規化済サンプル列の一部または全てのサンプル数Aから、上記消費ビット数の上記配分ビット数に対する上回り分に対応する切り捨て符号の対象となる量子化正規化済サンプルを上記量子化正規化済サンプル列から取り除いた残りのサンプル数T、を減算して得られる値A−Tが大きいほど、上記利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得拡大ステップと、
    を含み、
    上記利得縮小更新ステップは、
    上記消費ビット数が上記配分ビット数よりも少ない場合に、上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定ステップと、
    上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得縮小ステップと、
    を含む符号化方法。
  6. 所定の区間の入力音響信号に由来するサンプル列の符号化を行う符号化装置の符号化方法であって、
    上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化ステップと、
    上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化ステップと、
    上記利得よりも大きな値を新たな利得として設定する利得拡大更新ステップと、
    上記利得よりも小さな値を新たな利得として設定する利得縮小更新ステップと、
    上記利得の更新回数が予め定めた回数の場合は上記利得と上記サンプル列符号とを出力し、上記利得の更新回数が予め定めた回数未満かつ上記サンプル列符号のビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新ステップを行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に上記利得縮小更新ステップを行わせる判定ステップと、
    を有し、
    上記利得拡大更新ステップは、
    上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定ステップと、
    上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記消費ビット数から上記配分ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得拡大ステップと、
    を含み、
    上記利得縮小更新ステップは、
    上記消費ビット数が上記配分ビット数よりも少ない場合に、上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定ステップと、
    上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得縮小ステップと、
    を含む符号化方法。
  7. 所定の区間の入力音響信号に由来するサンプル列の符号化を行う符号化装置の符号化方法であって、
    上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化ステップと、
    上記利得よりも大きな値を新たな利得として設定する利得拡大更新ステップと、
    上記利得よりも小さな値を新たな利得として設定する利得縮小更新ステップと、
    上記利得の更新回数が予め定めた回数の場合は可変長符号化ステップを行わせ、上記利得の更新回数が予め定めた回数未満かつ上記量子化正規化済サンプル列に対応する符号の推定ビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新ステップを行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に上記利得縮小更新ステップを行わせる判定ステップと、
    を有し、
    上記利得拡大更新ステップは、
    上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定ステップと、
    上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記消費ビット数から上記配分ビット数を減算して得られる値が大きいほど、利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得拡大ステップと、
    を含み、
    上記利得縮小更新ステップは、
    上記消費ビット数が上記配分ビット数よりも少ない場合に、上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定ステップと、
    上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得縮小ステップと、
    上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化ステップと、
    を含む符号化方法。
  8. 請求項4から7の何れかの符号化方法であって
    記利得拡大更新ステップは、
    上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数、上記消費ビット数が上記配分ビット数よりも多い場合の上記消費ビット数である下限設定時消費ビット数、および、上記消費ビット数が上記配分ビット数よりも少ない場合の上記消費ビット数である上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第1利得更新ステップ
    をさらに含み、
    上記利得縮小更新ステップは、
    上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、上記配分ビット数、上記下限設定時消費ビット数、および上記上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第2利得更新ステップ
    をさらに含む符号化方法。
  9. 請求項4から7の何れかの符号化方法であって
    上記利得拡大更新ステップは、
    上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記消費ビット数が上記配分ビット数よりも多い場合の上記消費ビット数である下限設定時消費ビット数c上記消費ビット数が上記配分ビット数よりも少ない場合の上記消費ビット数である上限設定時消費ビット数c、上記利得の下限値gmin、および上記利得の上限値gmaxについての
    Figure 0005872034

    を、上記利得の新たな値とする第1利得更新ステップ
    をさらに含み、
    上記利得縮小更新ステップは、
    上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
    Figure 0005872034

    を、上記利得の新たな値とする第2利得更新ステップ
    をさらに含む符号化方法。
  10. 請求項4から7の何れかの符号化方法であって
    記利得拡大更新ステップは、
    上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記消費ビット数が上記配分ビット数よりも多い場合の上記消費ビット数である下限設定時消費ビット数c上記消費ビット数が上記配分ビット数よりも少ない場合の上記消費ビット数である上限設定時消費ビット数c、上記利得の下限値gmin、上記利得の上限値gmax、および正の定数Cについての
    Figure 0005872034

    を、上記利得の新たな値とする第1利得更新ステップ
    をさらに含み、
    上記利得縮小更新ステップは、
    上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
    Figure 0005872034

    を、上記利得の新たな値とする第2利得更新ステップ
    をさらに含む符号化方法。
  11. 請求項4または5の符号化方法であって
    上記利得拡大更新ステップは、
    上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数、および、上記消費ビット数が上記配分ビット数よりも少ない場合における上記消費ビット数である上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第1利得更新ステップ
    をさらに含み、
    上記利得縮小更新ステップは、
    上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、上記配分ビット数、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数、および上記上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第2利得更新ステップ
    をさらに含む符号化方法。
  12. 請求項4または5の符号化方法であって
    上記利得拡大更新ステップは、
    上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数Tr、および、上記消費ビット数が上記配分ビット数よりも少ない場合における上記消費ビット数である上限設定時消費ビット数c、上記利得の下限値gmin、上記利得の上限値gmax、および係数γについての
    Figure 0005872034

    を、上記利得の新たな値とする第1利得更新ステップ
    をさらに含み、
    上記利得縮小更新ステップは、
    上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
    Figure 0005872034

    を、上記利得の新たな値とする第2利得更新ステップ
    をさらに含む符号化方法。
  13. 請求項4または5の符号化方法であって
    上記利得拡大更新ステップは、
    上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数Tr、および、上記消費ビット数が上記配分ビット数よりも少ない場合における上記消費ビット数である上限設定時消費ビット数c、上記利得の下限値gmin、上記利得の上限値gmax、係数γ、および正の定数Cについての
    Figure 0005872034

    を、上記利得の新たな値とする第1利得更新ステップ
    をさらに含み、
    上記利得縮小更新ステップは、
    上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
    Figure 0005872034

    を、上記利得の新たな値とする第2利得更新ステップ
    をさらに含む符号化方法。
  14. 所定の区間の入力音響信号に由来するサンプル列の符号化装置であって、
    上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数と、所定の配分ビット数Bと、の差が大きいほど、更新前の利得と更新後の利得との差が大きくなるように利得の値を更新する利得拡大縮小部の処理を含む処理を行って、利得を得る利得更新ループ処理部と、
    上記利得更新ループ処理部により得られた利得に対応する利得符号と、上記サンプル列の各サンプルを上記利得で除算して得られる整数値サンプルによる列を符号化して得られる整数信号符号とを得る符号出力部と、
    を有する符号化装置。
  15. 所定の区間の入力音響信号に由来するサンプル列について、利得をループ処理により求める利得更新ループ処理部により得られた利得に対応する利得符号と、上記サンプル列の各サンプルを上記利得で除算して得られる整数値サンプルによる列を符号化して得られる整数信号符号とを得る符号化装置であって、
    上記利得更新ループ処理部は、
    上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、上記所定の配分ビット数Bより多い場合に、上記更新前の利得を利得の下限値gminとして設定する利得下限値設定部と、
    上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、上記所定の配分ビット数Bより少ない場合に、上記更新前の利得を利得の上限値gmaxとして設定する利得上限値設定部と、
    上記配分ビット数Bと、上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、上記所定の配分ビット数Bより多い場合の上記ビット数または推定ビット数である下限設定時消費ビット数c、上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、上記所定の配分ビット数Bより少ない場合の上記ビット数または推定ビット数である上限設定時消費ビット数cに少なくとも基づく重みを、利得の上限値gmaxと利得の下限値gminとの少なくとも何れかに与えた、利得の上限値と利得の下限値の重み付き平均を更新後の利得とする利得更新部と、
    を含む符号化装置。
  16. 請求項15記載の符号化装置であって、
    上記利得更新部における重み付き平均は、
    Figure 0005872034

    もしくは、Cを所定の正の定数として、
    Figure 0005872034

    である符号化装置。
  17. 所定の区間の入力音響信号に由来するサンプル列の符号化装置であって、
    上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化部と、
    上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化部と、
    上記利得よりも大きな値を新たな利得として設定する利得拡大更新部と、
    上記利得よりも小さな値を新たな利得として設定する利得縮小更新部と、
    上記利得の更新回数が予め定めた回数の場合は上記利得と上記サンプル列符号とを出力し、上記利得の更新回数が予め定めた回数未満かつ上記サンプル列符号のビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新部の処理を行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に利得縮小更新部の処理を行わせる判定部と、
    を有し、
    上記利得拡大更新部は、
    上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定部と、
    上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記量子化正規化済サンプル列の一部または全てのサンプル数Aから、上記消費ビット数の上記配分ビット数に対する上回り分に対応する切り捨て符号を上記サンプル列符号から取り除くことで得られる残りの切り捨て済サンプル列符号に対応する量子化正規化済サンプルのサンプル数T、を減算して得られる値A−Tが大きいほど、上記利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得拡大部と、
    を含み、
    上記利得縮小更新部は、
    上記消費ビット数が上記配分ビット数よりも少ない場合に上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定部と、
    上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得縮小部と、
    を含む符号化装置。
  18. 所定の区間の入力音響信号に由来するサンプル列の符号化装置であって、
    上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化部と、
    上記利得よりも大きな値を新たな利得として設定する利得拡大更新部と、
    上記利得よりも小さな値を新たな利得として設定する利得縮小更新部と、
    上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化部と、
    上記利得の更新回数が予め定めた回数の場合は可変長符号化部の処理を行わせ、上記利得の更新回数が予め定めた回数未満かつ上記量子化正規化済サンプル列に対応する符号の推定ビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新部の処理を行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に上記利得縮小更新部の処理を行わせる判定部と、
    を有し、
    上記利得拡大更新部は、
    上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定部と、
    上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記量子化正規化済サンプル列の一部または全てのサンプル数Aから、上記消費ビット数の上記配分ビット数に対する上回り分に対応する切り捨て符号の対象となる量子化正規化済サンプルを上記量子化正規化済サンプル列から取り除いた残りのサンプル数T、を減算して得られる値A−Tが大きいほど、上記利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得拡大部と、
    を含み、
    上記利得縮小更新部は、
    上記消費ビット数が上記配分ビット数よりも少ない場合に、上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定部と、
    上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得縮小部と、
    を含む符号化装置。
  19. 所定の区間の入力音響信号に由来するサンプル列の符号化装置であって、
    上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化部と、
    上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化部と、
    上記利得よりも大きな値を新たな利得として設定する利得拡大更新部と、
    上記利得よりも小さな値を新たな利得として設定する利得縮小更新部と、
    上記利得の更新回数が予め定めた回数の場合は上記利得と上記サンプル列符号とを出力し、上記利得の更新回数が予め定めた回数未満かつ上記サンプル列符号のビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新部の処理を行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に上記利得縮小更新部の処理を行わせる判定部と、
    を有し、
    上記利得拡大更新部は、
    上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定部と、
    上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記消費ビット数から上記配分ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得拡大部と、
    を含み、
    上記利得縮小更新部は、
    上記消費ビット数が上記配分ビット数よりも少ない場合に、上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定部と、
    上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得縮小部と、
    を含む符号化装置。
  20. 所定の区間の入力音響信号に由来するサンプル列の符号化装置であって、
    上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化部と、
    上記利得よりも大きな値を新たな利得として設定する利得拡大更新部と、
    上記利得よりも小さな値を新たな利得として設定する利得縮小更新部と、
    上記利得の更新回数が予め定めた回数の場合は可変長符号化部の処理を行わせ、上記利得の更新回数が予め定めた回数未満かつ上記量子化正規化済サンプル列に対応する符号の推定ビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新部の処理を行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に上記利得縮小更新部の処理を行わせる判定部と、
    を有し、
    上記利得拡大更新部は、
    上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定部と、
    上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記消費ビット数から上記配分ビット数を減算して得られる値が大きいほど、利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得拡大部と、
    を含み、
    上記利得縮小更新部は、
    上記消費ビット数が上記配分ビット数よりも少ない場合に、上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定部と、
    上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得縮小部と、
    上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化部と、
    を含む符号化装置。
  21. 請求項17から20の何れかの符号化装置であって
    上記利得拡大更新部は、
    上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数、上記下限設定時消費ビット数、および上記上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第1利得更新部
    をさらに含み、
    上記利得縮小更新部は、
    上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、上記配分ビット数、上記消費ビット数が上記配分ビット数よりも多い場合の上記消費ビット数である下限設定時消費ビット数、および、上記消費ビット数が上記配分ビット数よりも少ない場合の上記消費ビット数である上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第2利得更新部
    をさらに含む符号化装置。
  22. 請求項17から20の何れかの符号化装置であって
    上記利得拡大更新部は、
    上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記消費ビット数が上記配分ビット数よりも多い場合の上記消費ビット数である下限設定時消費ビット数c上記消費ビット数が上記配分ビット数よりも少ない場合の上記消費ビット数である上限設定時消費ビット数c、上記利得の下限値gmin、および上記利得の上限値gmaxについての
    Figure 0005872034

    を、上記利得の新たな値とする第1利得更新部
    をさらに含み、
    上記利得縮小更新部は、
    上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
    Figure 0005872034

    を、上記利得の新たな値とする第2利得更新部
    をさらに含む符号化装置。
  23. 請求項17から20の何れかの符号化装置であって
    上記利得拡大更新部は、
    上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記消費ビット数が上記配分ビット数よりも多い場合の上記消費ビット数である下限設定時消費ビット数c上記消費ビット数が上記配分ビット数よりも少ない場合の上記消費ビット数である上限設定時消費ビット数c、上記利得の下限値gmin、上記利得の上限値gmax、および正の定数Cについての
    Figure 0005872034

    を、上記利得の新たな値とする第1利得更新部
    をさらに含み、
    上記利得縮小更新部は、
    上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
    Figure 0005872034

    を、上記利得の新たな値とする第2利得更新部
    をさらに含む符号化装置。
  24. 請求項17または18の符号化装置であって
    上記利得拡大更新部は、
    上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数、および、上記消費ビット数が上記配分ビット数よりも少ない場合における上記消費ビット数である上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第1利得更新部
    をさらに含み、
    上記利得縮小更新部は、
    上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、上記配分ビット数、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数、および上記上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第2利得更新部
    をさらに含む符号化装置。
  25. 請求項17または18の符号化装置であって
    上記利得拡大更新部は、
    上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数Tr、および、上記消費ビット数が上記配分ビット数よりも少ない場合における上記消費ビット数である上限設定時消費ビット数c、上記利得の下限値gmin、上記利得の上限値gmax、および係数γについての
    Figure 0005872034

    を、上記利得の新たな値とする第1利得更新部
    をさらに含み、
    上記利得縮小更新部は、
    上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
    Figure 0005872034

    を、上記利得の新たな値とする第2利得更新部
    をさらに含む符号化装置。
  26. 請求項17または18の符号化装置であって
    上記利得拡大更新部は、
    上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数Tr、および、上記消費ビット数が上記配分ビット数よりも少ない場合における上記消費ビット数である上限設定時消費ビット数c、上記利得の下限値gmin、上記利得の上限値gmax、係数γ、および正の定数Cについての
    Figure 0005872034

    を、上記利得の新たな値とする第1利得更新部
    をさらに含み、
    上記利得縮小更新部は、
    上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
    Figure 0005872034

    を、上記利得の新たな値とする第2利得更新部
    をさらに含む符号化装置。
  27. 請求項1から13の何れかの符号化方法の各ステップをコンピュータに実行させるためのプログラム。
  28. 請求項1から13の何れかの符号化方法の各ステップをコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
JP2014518696A 2012-05-30 2013-05-29 符号化方法、符号化装置、プログラム、および記録媒体 Active JP5872034B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014518696A JP5872034B2 (ja) 2012-05-30 2013-05-29 符号化方法、符号化装置、プログラム、および記録媒体

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2012122785 2012-05-30
JP2012122785 2012-05-30
PCT/JP2013/064877 WO2013180164A1 (ja) 2012-05-30 2013-05-29 符号化方法、符号化装置、プログラム、および記録媒体
JP2014518696A JP5872034B2 (ja) 2012-05-30 2013-05-29 符号化方法、符号化装置、プログラム、および記録媒体

Publications (2)

Publication Number Publication Date
JPWO2013180164A1 JPWO2013180164A1 (ja) 2016-01-21
JP5872034B2 true JP5872034B2 (ja) 2016-03-01

Family

ID=49673352

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014518696A Active JP5872034B2 (ja) 2012-05-30 2013-05-29 符号化方法、符号化装置、プログラム、および記録媒体

Country Status (8)

Country Link
US (1) US9552821B2 (ja)
EP (3) EP2827328B1 (ja)
JP (1) JP5872034B2 (ja)
KR (4) KR101746697B1 (ja)
CN (1) CN104321813B (ja)
ES (3) ES2661504T3 (ja)
PL (2) PL3534367T3 (ja)
WO (1) WO2013180164A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4407609A3 (en) * 2013-12-02 2024-08-21 Top Quality Telephony, Llc A computer-readable storage medium and a computer software product
US9911427B2 (en) * 2014-03-24 2018-03-06 Nippon Telegraph And Telephone Corporation Gain adjustment coding for audio encoder by periodicity-based and non-periodicity-based encoding methods
CN106448688B (zh) 2014-07-28 2019-11-05 华为技术有限公司 音频编码方法及相关装置
CN107430869B (zh) * 2015-01-30 2020-06-12 日本电信电话株式会社 参数决定装置、方法及记录介质
US11087774B2 (en) * 2017-06-07 2021-08-10 Nippon Telegraph And Telephone Corporation Encoding apparatus, decoding apparatus, smoothing apparatus, inverse smoothing apparatus, methods therefor, and recording media
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
US20230121712A1 (en) * 2021-10-18 2023-04-20 S&P Global Inc. String Alignment with Translocation Insensitivity

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6732071B2 (en) 2001-09-27 2004-05-04 Intel Corporation Method, apparatus, and system for efficient rate control in audio encoding
US7940839B2 (en) * 2004-01-26 2011-05-10 Diablo Technologies Inc. Fully adaptive equalization for high loss communications channels
US7292092B2 (en) * 2004-08-31 2007-11-06 Integration Associates Inc. Tunable poly-phase filter and method for calibration thereof
EP1632902B1 (en) * 2004-09-03 2007-12-05 STMicroelectronics S.r.l. Method for image compression, related system and computer product therefor
KR100682890B1 (ko) 2004-09-08 2007-02-15 삼성전자주식회사 비트량 고속제어가 가능한 오디오 부호화 방법 및 장치
JP4639073B2 (ja) * 2004-11-18 2011-02-23 キヤノン株式会社 オーディオ信号符号化装置および方法
JP4641272B2 (ja) * 2006-03-08 2011-03-02 シャープ株式会社 デジタルデータ復号化装置
US8374857B2 (en) * 2006-08-08 2013-02-12 Stmicroelectronics Asia Pacific Pte, Ltd. Estimating rate controlling parameters in perceptual audio encoders
JP5224666B2 (ja) * 2006-09-08 2013-07-03 株式会社東芝 オーディオ符号化装置
WO2009001874A1 (ja) * 2007-06-27 2008-12-31 Nec Corporation オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム
US8566106B2 (en) * 2007-09-11 2013-10-22 Voiceage Corporation Method and device for fast algebraic codebook search in speech and audio coding
JP2010281965A (ja) * 2009-06-03 2010-12-16 Sony Corp 量子化装置、再生装置、量子化方法およびプログラム
US9240192B2 (en) * 2010-07-06 2016-01-19 Panasonic Intellectual Property Corporation Of America Device and method for efficiently encoding quantization parameters of spectral coefficient coding
US20150341158A1 (en) * 2014-05-23 2015-11-26 Mediatek Inc. Loop gain calibration apparatus for controlling loop gain of timing recovery loop and related loop gain calibration method

Also Published As

Publication number Publication date
KR101746697B1 (ko) 2017-06-14
EP3534367B1 (en) 2020-05-13
CN104321813A (zh) 2015-01-28
KR20170068617A (ko) 2017-06-19
US9552821B2 (en) 2017-01-24
WO2013180164A1 (ja) 2013-12-05
US20150088529A1 (en) 2015-03-26
EP2827328A4 (en) 2016-04-13
JPWO2013180164A1 (ja) 2016-01-21
EP3236468B1 (en) 2019-05-29
KR101762205B1 (ko) 2017-07-27
KR20170069294A (ko) 2017-06-20
EP2827328B1 (en) 2018-01-03
PL3534367T3 (pl) 2020-10-05
PL3236468T3 (pl) 2019-10-31
EP3534367A1 (en) 2019-09-04
KR20150003817A (ko) 2015-01-09
EP3236468A1 (en) 2017-10-25
KR101661917B1 (ko) 2016-10-05
CN104321813B (zh) 2016-12-14
KR101762210B1 (ko) 2017-07-27
ES2742481T3 (es) 2020-02-14
ES2807241T3 (es) 2021-02-22
ES2661504T3 (es) 2018-04-02
KR20160114200A (ko) 2016-10-04
EP2827328A1 (en) 2015-01-21

Similar Documents

Publication Publication Date Title
JP5872034B2 (ja) 符号化方法、符号化装置、プログラム、および記録媒体
JP5603484B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
JP5893153B2 (ja) 符号化方法、符号化装置、プログラム、および記録媒体
JP5612698B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
JP6595687B2 (ja) 符号化方法、符号化装置、プログラム、および記録媒体
JP6979048B2 (ja) 低複雑度の調性適応音声信号量子化
US9838700B2 (en) Encoding apparatus, decoding apparatus, and method and program for the same
JP5663461B2 (ja) 符号化方法、符号化装置、プログラム、記録媒体
EP3252758A1 (en) Encoding device, decoding device, methods therefor, program, and recording medium
JP5361565B2 (ja) 符号化方法、復号方法、符号化器、復号器およびプログラム
JP5336942B2 (ja) 符号化方法、復号方法、符号化器、復号器、プログラム
JP5579932B2 (ja) 符号化方法、装置、プログラム及び記録媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160112

R150 Certificate of patent or registration of utility model

Ref document number: 5872034

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R157 Certificate of patent or utility model (correction)

Free format text: JAPANESE INTERMEDIATE CODE: R157