JPWO2013176177A1 - 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体 - Google Patents

符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体 Download PDF

Info

Publication number
JPWO2013176177A1
JPWO2013176177A1 JP2014516829A JP2014516829A JPWO2013176177A1 JP WO2013176177 A1 JPWO2013176177 A1 JP WO2013176177A1 JP 2014516829 A JP2014516829 A JP 2014516829A JP 2014516829 A JP2014516829 A JP 2014516829A JP WO2013176177 A1 JPWO2013176177 A1 JP WO2013176177A1
Authority
JP
Japan
Prior art keywords
pitch period
frequency domain
domain pitch
sample
interval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014516829A
Other languages
English (en)
Other versions
JP6053196B2 (ja
Inventor
守谷 健弘
健弘 守谷
優 鎌本
優 鎌本
登 原田
登 原田
祐介 日和▲崎▼
祐介 日和▲崎▼
勝宏 福井
勝宏 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014516829A priority Critical patent/JP6053196B2/ja
Publication of JPWO2013176177A1 publication Critical patent/JPWO2013176177A1/ja
Application granted granted Critical
Publication of JP6053196B2 publication Critical patent/JP6053196B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • G10L2025/903Pitch determination of speech signals using a laryngograph
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • G10L2025/906Pitch tracking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

所定の時間区間の音響信号の時間領域ピッチ周期符号に時間領域のピッチ周期Lが対応し、時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得、換算間隔T1および換算間隔T1の整数倍の値U?T1を含む候補値の中から周波数領域ピッチ周期Tを決定し、周波数領域ピッチ周期Tが換算間隔T1の何倍であるかを示す周波数領域ピッチ周期符号を得る。周波数領域ピッチ周期符号は、復号側で周波数領域ピッチ周期Tが特定できるよう、出力される。

Description

本発明は、音響信号の符号化技術およびこの符号化技術によって得られた符号列の復号技術に関する。より詳しくは、音響信号を周波数領域に変換して得られた周波数領域のサンプル列の符号化とその復号に関する。
低ビット(例えば10kbit/s〜20kbit/s程度)の音声信号や音響信号の符号化方法として、DFT(離散フーリエ変換)やMDCT(変形離散コサイン変換)などの直交変換係数に対する適応符号化が知られている。例えば標準規格技術であるAMR-WB+(Extended Adaptive Multi-Rate Wideband)は、TCX(transform coded excitation:変換符号化励振)符号化モードを持ち、この中ではDFT係数を8サンプルごとに正規化してベクトル量子化している。
また、TwinVQ(Transform domain Weighted Interleave Vector Quantization)では、MDCT係数全体を固定の規則で並べ替えた後のサンプルの集まりがベクトルとして符号化される。この際、例えば、MDCT係数から時間領域のピッチ周期ごとの大きな成分を抽出し、時間領域のピッチ周期に対応する情報を符号化し、さらに時間領域のピッチ周期ごとの大きな成分を取り除いた残りのMDCT係数列を並べ替えて、並べ替え後のMDCT係数列を所定サンプル数ごとにベクトル量子化することにより符号化する方法などが採用される場合もある。TwinVQに関する文献として非特許文献1,2を例示できる。
また、等間隔にサンプルを抽出して符号化する技術として例えば特許文献1を例示できる。
特開2009−156971号公報
T. Moriya, N. Iwakami, A. Jin, K. Ikeda, and S. Miki, "A Design of Transform Coder for Both Speech and Audio Signals at 1 bit/sample," Proc. ICASSP'97, pp. 1371-1374, 1997. J.Herre, E. Allamanche, K. Brandenburg, M. Dietz, B.Teichmann, B. Grill, A. Jin, T. Moriya, N. Iwakami, T. Norimatsu, M. Tsushima, T. Ishikawa, "The integrated Filterbank Based Scalable MPEG-4 Audio Coder," 105th Convention Audio Engineering Society, 4810, 1998.
AMR-WB+をはじめ、TCXに基づく符号化では周期性に基づく周波数領域のサンプル列の振幅のばらつきは考慮されておらず、振幅のばらつきの大きいサンプル列をまとめて符号化すると符号化効率が低下してしまう。符号化効率を向上させるためには、周波数領域のサンプル列のピッチ周期に基づき、振幅のばらつきが小さなサンプル群ごとに異なる基準に従って符号化を行うことが有効である。
しかしながら、周波数領域のサンプル列のピッチ周期を効率よく決定して符号化する方法は知られていない。
本発明は、このような技術的背景に鑑みて、符号化時に周波数領域のサンプル列のピッチ周期を効率よく決定して符号化し、復号時に周波数領域のサンプル列のピッチ周期を特定することが可能な技術を提供することを目的とする。
本発明の符号化技術によると、所定の時間区間の音響信号の時間領域ピッチ周期符号に時間領域のピッチ周期Lが対応し、時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得、換算間隔T1および換算間隔T1の整数倍の値U×T1を含む候補値の中から周波数領域ピッチ周期Tを決定し、周波数領域ピッチ周期Tが換算間隔T1の何倍であるかを示す周波数領域ピッチ周期符号を得る。周波数領域ピッチ周期符号は、復号側で周波数領域ピッチ周期Tが特定できるよう、出力される。
本発明によると、換算間隔の整数倍から周波数領域ピッチ周期Tを探索するため、周波数領域ピッチ周期Tの探索に要する演算処理量が少ない。さらには、周波数領域ピッチ周期Tを特定する情報として周波数領域ピッチ周期Tが換算間隔の何倍であるかを表す情報を用いるので、周波数領域ピッチ周期符号の符号量を抑制できる。これにより、符号化時に周波数領域のサンプル列のピッチ周期を効率よく決定して符号化し、復号時に周波数領域のサンプル列のピッチ周期を特定することができる。
実施形態の符号化装置のブロック図。 実施形態の復号装置のブロック図。 時間領域での基本周期と時間領域のピッチ周期とサンプル点との関係を表した図。 周波数領域での理想換算間隔とそのm倍の間隔と周波数との関係を表した図。 周波数領域ピッチ周期/(変換フレーム長*2/時間領域のピッチ周期)の頻度を表した図。 サンプル列に含まれるサンプルの並べ替えの一例を説明するための概念図。 サンプル列に含まれるサンプルの並べ替えの一例を説明するための概念図。 実施形態の符号化装置のブロック図。 実施形態の復号装置のブロック図。 実施形態の符号化装置のブロック図。 実施形態の復号装置のブロック図。 実施形態の可変長符号帳を例示した図。 実施形態の可変長符号帳を例示した図。 実施形態の符号化装置のブロック図。 実施形態の復号装置のブロック図。 実施形態の周波数領域ピッチ周期分析装置のブロック図。
図面を参照しながら本発明の実施形態を説明する。なお、重複する構成要素には同じ参照符号を当てて重複説明を省略する。
[第1実施形態]
「符号化装置11」
図1を参照して符号化装置11が行う符号化処理を説明する。符号化装置11の各部は、所定の時間区間であるフレーム単位に、以下の動作をする。以下の説明では、フレームのサンプル数がNtであり、1フレーム分のディジタル音響信号がディジタル音響信号列x(1),...,x(Nt)であるとしている。
「長期予測分析部111」
(概要)
長期予測分析部111は、所定の時間区間であるフレーム単位に、入力されたディジタル音響信号列x(1),...,x(Nt)に対応する時間領域のピッチ周期Lを得て(ステップS111−1)、当該時間領域のピッチ周期Lに対応するピッチ利得gpを算出し(ステップS111−2)、当該ピッチ利得gpに基づいて長期予測を実行するか否かを示す長期予測選択情報を求めて出力し(ステップS111−3)、長期予測選択情報が長期予測を実行することを示す場合には、少なくとも時間領域のピッチ周期Lと、時間領域のピッチ周期Lを特定する時間領域ピッチ周期符号CLとを更に出力する(ステップS111−4)。
(ステップS111−1:時間領域のピッチ周期L)
長期予測分析部111は、例えば、予め定めた時間領域のピッチ周期の候補τの中から、式(A1)により得られる値が最大となる候補τをディジタル音響信号列x(1),...,x(Nt)に対応する時間領域のピッチ周期Lとして選択する。
Figure 2013176177

候補τおよび時間領域のピッチ周期Lは、整数のみを用いて表現される場合(整数精度)のみならず、整数と小数値(分数値)とを用いて表現される場合(小数精度)もある。小数精度の候補τに対する式(A1)の値を求める場合には、複数のディジタル音響信号サンプルに重み付き平均操作を行う補間フィルタを用いてx(t-τ)を求める。
(ステップS111−2:ピッチ利得gp
長期予測分析部111は、例えば、ディジタル音響信号と時間領域のピッチ周期Lとに基づき、式(A2)によりピッチ利得gpを算出する。
Figure 2013176177
(ステップS111−3:長期予測選択情報)
長期予測分析部111は、ピッチ利得gpが予め定めた値以上である場合には長期予測を実行することを示す長期予測選択情報を得て出力し、ピッチ利得gpが上記の予め定めた値未満である場合には長期予測を実行しないとを示す長期予測選択情報を得て出力する。
(ステップS111−4:長期予測を実行する場合)
長期予測選択情報が長期予測を実行することを示す場合には、長期予測分析部111は、以下を行う。
長期予測分析部111には、予め定めた時間領域のピッチ周期の候補τに当該候補と一意に対応するインデックスが割り当てたものが格納されている。長期予測分析部111は、時間領域のピッチ周期Lとして選択された候補τを特定するインデックスを、時間領域のピッチ周期Lを特定する時間領域ピッチ周期符号CLとして選択する。
そして、長期予測分析部111は、上記の長期予測選択情報に加えて、時間領域のピッチ周期Lと、時間領域ピッチ周期符号CLと、を出力する。
また、長期予測分析部111が量子化済みピッチ利得gp^およびピッチ利得符号Cgpも出力する場合には、長期予測分析部111には、予め定めたピッチ利得の候補に当該候補と一意に対応するインデックスが割り当てたものが格納されている。長期予測分析部111は、ピッチ利得の候補のうちピッチ利得gpと最も近いものを特定するインデックスを、量子化済みピッチ利得gp^を特定するピッチ利得符号Cgpとして選択する。
そして、長期予測分析部111は、上記の長期予測選択情報と、時間領域のピッチ周期Lと、時間領域ピッチ周期符号CLと、に加えて、量子化済みピッチ利得gp^と、ピッチ利得符号Cgpとを出力する。
「長期予測残差生成部112」
長期予測分析部111が出力した長期予測選択情報が長期予測を実行することを示す場合には、長期予測残差生成部112は、所定の時間区間であるフレーム単位に、入力されたディジタル音響信号列から長期予測された信号を除いた長期予測残差信号列を生成して出力する。例えば、入力されたディジタル音響信号列x(1),...,x(Nt)と時間領域のピッチ周期Lと量子化済みピッチ利得gp^に基づき、式(A3)により長期予測残差信号列xp(1),...,xp(Nt)を算出することにより生成する。長期予測分析部111が量子化済みピッチ利得gp^を出力しない場合には、gp^として例えば0.5などの予め定めた値を用いる。
xp(t) = x(t)-gp^x(t-L) (A3)
「周波数領域変換部113a」
まず、周波数領域変換部113aがフレーム単位で、長期予測分析部111が出力した長期予測選択情報が長期予測を実行することを示す場合には入力された長期予測残差信号列xp(1),...,xp(Nt)を、長期予測分析部111が出力した長期予測選択情報が長期予測を実行しないことを示す場合には入力されたディジタル音響信号列x(1),...,x(Nt)を、周波数領域のN点(Nを「変換フレーム長」と呼ぶ)のMDCT係数列X(1),...,X(N)に変換する(ステップS113a)。周波数領域変換部113aは、時間領域で2*N点の長期予測残差信号列またはディジタル音響信号列に窓をかけた後の信号列のMDCT変換を行い、周波数領域でN点の係数を得る。なお、記号*は乗算を表す。周波数領域変換部113aは、時間領域での窓をN点ずつずらすことでフレームを更新する。この際、隣り合うフレームのサンプルはN点ずつ重複する。長期予測分析の対象サンプルとMDCT変換での窓の対象サンプルとは独立で、遅延や、重ね合わせの程度で窓の形を設定できる。例えば長期予測分析の対象サンプルとして重ね合わせのないサンプル部分からNt点を取りだせばよい。また重ね合わせのあるサンプルに対しても長期予測分析を行う場合には、重ね合わせ処理と長期予測の差分と合成の処理の適応順序などを設定し、符号化装置と復号装置で大きな誤差を生じないようにする必要がある。
「重み付け包絡正規化部113b」
重み付け包絡正規化部113bが、フレーム単位のディジタル音響信号列に対する線形予測分析によって求められた線形予測係数を用いて推定されたディジタル音響信号列のパワースペクトル包絡係数列によって、入力されたMDCT係数列の各係数を正規化し、重み付け正規化MDCT係数列を出力する(ステップS113b)。ここでは聴覚的に歪が小さくなるような量子化の実現のために、重み付け包絡正規化部113bは、パワースペクトル包絡を鈍らせた重み付けパワースペクトル包絡係数列を用いて、フレーム単位でMDCT係数列の各係数を正規化する。この結果、重み付け正規化MDCT係数列は、入力されたMDCT係数列ほどの大きな振幅の傾きや振幅の凹凸を持たないが、音声音響ディジタル信号のパワースペクトル包絡係数列と類似の大小関係を有するもの、すなわち、低い周波数に対応する係数側の領域にやや大きな振幅を持ち、時間領域のピッチ周期に起因する微細構造をもつもの、となる。
[重み付け包絡正規化処理の具体例]
N点のMDCT係数列の各係数X(1),・・・,X(N)に対応するパワースペクトル包絡係数列の各係数W(1),・・・,W(N)は、線形予測係数を周波数領域に変換して得ることができる。例えば、全極型モデルであるp次自己回帰過程により、時刻に対応するサンプル点tのディジタル音響信号x(t)は、p時点(pは正整数)まで遡った過去の自分自身の値x(t-1),・・・,x(t-p)と予測残差e(t)と線形予測係数α1,・・・,αpによって式(1)で表される。このとき、パワースペクトル包絡係数列の各係数W(n)[1≦n≦N]は式(2)で表される。exp(・)はネイピア数を底とする指数関数、jは虚数単位、σ2は予測残差エネルギーである。
Figure 2013176177
線形予測係数は、長期予測分析部111に入力されたのと同じディジタル音響信号列を重み付け包絡正規化部113bによって線形予測分析して得られたものでもよいし、符号化装置11内に在る図示しない他の手段によって音声音響ディジタル信号を線形予測分析して得られたものであってもよい。このような場合には、重み付け包絡正規化部113bが線形予測係数を用いてパワースペクトル包絡係数列の各係数W(1),・・・,W(N)を求める。また、符号化装置11内に在る他の手段(パワースペクトル包絡係数列計算部)によってパワースペクトル包絡係数列の各係数W(1),・・・,W(N)が既に得られている場合には、重み付け包絡正規化部113bは、このパワースペクトル包絡係数列の各係数W(1),・・・,W(N)を用いることができる。なお、後述する復号装置12でも符号化装置11で得られた値と同じ値を得る必要があるため、量子化された線形予測係数および/またはパワースペクトル包絡係数列が利用される。以後の説明において、特に断りが無い限り、「線形予測係数」ないし「パワースペクトル包絡係数列」は量子化された線形予測係数ないしパワースペクトル包絡係数列を意味する。また、線形予測係数は例えば従来的な符号化技術によって符号化され、それによって得られる予測係数符号が復号側へ伝送される。従来的な符号化技術とは、例えば、線形予測係数そのものに対応する符号を予測係数符号とする符号化技術、線形予測係数をLSPパラメータに変換してLSPパラメータに対応する符号を予測係数符号とする符号化技術、線形予測係数をPARCOR係数に変換してPARCOR係数に対応する符号を予測係数符号とする符号化技術、などである。符号化装置11内に在る他の手段によってパワースペクトル包絡係数列が得られる構成である場合は、符号化装置11内に在る他の手段において線形予測係数が従来的な符号化技術によって符号化されて予測係数符号が復号側へ伝送される。
ここでは、重み付け包絡正規化処理の具体例として二つの例を示すが、本発明ではこれらの例に限定されるものではない。
<例1>
重み付け包絡正規化部113bは、MDCT係数列の各係数X(1),・・・,X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数の補正値Wγ(1),・・・,Wγ(N)で除算することによって、重み付け正規化MDCT係数列の各係数X(1)/Wγ(1),・・・,X(N)/Wγ(N)を得る処理を行う。補正値Wγ(n)[1≦n≦N]は式(3)で与えられる。但し、γは1以下の正の定数であり、パワースペクトル係数を鈍らせる定数である。
Figure 2013176177
<例2>
重み付け包絡正規化部113bは、MDCT係数列の各係数X(1),・・・,X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数のβ乗(0<β<1)の値W(1)β,・・・,W(N)βで除算することによって、重み付け正規化MDCT係数列の各係数X(1)/W(1)β,・・・,X(N)/W(N)βを得る処理を行う。
この結果、フレーム単位の重み付け正規化MDCT係数列が得られるが、重み付け正規化MDCT係数列は入力されたMDCT係数列ほどの大きな振幅の傾きや振幅の凹凸を持たないが、入力されたMDCT係数列のパワースペクトル包絡と類似の大小関係を有するもの、すなわち、低い周波数に対応する係数側の領域にやや大きな振幅を持ち、時間領域のピッチ周期に起因する微細構造をもつもの、となる。
なお、重み付け包絡正規化処理に対応する逆処理、つまり、重み付け正規化MDCT係数列からMDCT係数列を復元する処理が復号側にて行われるため、パワースペクトル包絡係数列から重み付けパワースペクトル包絡係数列を算出する方法を符号化側と復号側で共通の設定にしておくことが必要である。
「正規化利得計算部113c」
次に、正規化利得計算部113cが、重み付け正規化MDCT係数列を入力とし、フレームごとに、重み付け正規化MDCT係数列の各係数を与えられた総ビット数で量子化できるように、全周波数に亘る振幅値の和またはエネルギー値を用いて量子化ステップ幅を決定し、この量子化ステップ幅になるように重み付け正規化MDCT係数列の各係数を割り算する係数(以下、利得という。)を求める(ステップS113c)。この利得を表す情報は、利得情報として復号側へ伝送される。正規化利得計算部113cは、フレームごとに、入力された重み付け正規化MDCT係数列の各係数をこの利得で正規化(除算)して出力する。
「量子化部113d」
次に、量子化部113dが、フレームごとに、利得で正規化された重み付け正規化MDCT係数列の各係数をステップS113cの処理で決定された量子化ステップ幅で量子化し、得られた量子化MDCT係数列を「周波数領域のサンプル列」として出力する(ステップS113d)。
ステップS113dの処理で得られたフレーム単位の量子化MDCT係数列(周波数領域のサンプル列)は、周波数領域ピッチ周期分析部115および並べ替え処理部116aの入力となる。
「周期換算部114」
周期換算部114は、長期予測選択情報が長期予測を実行することを示す場合には、入力された時間領域のピッチ周期Lと周波数領域のサンプル点数Nとに基づき、式(A4)により換算間隔T1を求めて出力する。式(A4)の「INT()」は、()内の数値の小数点以下を切り捨てたものを表す。
T1=INT(N*2/L) (A4)
なお理論的な換算周期はN*2/L‐1/2であるが、換算間隔T1を整数値とする場合にはこれを四捨五入するために1/2を加えて切り捨てる。または、N*2/L‐1/2を予め定めた小数点桁数以下を四捨五入して換算間隔T1としてもよい。例えば、N*2/L‐1/2が2進5桁の小数部をもつ疑似浮動小数点形式で保持し、整数値としてのピッチ周期を四捨五入で求める場合は、25*(N*2/L‐1/2+1/2)を切り捨てた値を換算間隔T1とし、T1を整数倍した結果を1/25=1/32倍して浮動小数点数に戻した値を候補として、周波数領域のピッチ周期を決定しても良い。
周期換算部114は、長期予測選択情報が長期予測を実行しないことを示す場合には、何もしない。ただし、長期予測選択情報が長期予測を実行する場合と同様の処理を行っても問題は無い。すなわち、周期換算部114には、長期予測選択情報が入力されず、入力された時間領域のピッチ周期Lと周波数領域のサンプル点数Nとが入力され、換算間隔T1を求めて出力する構成であってもよい。
「周波数領域ピッチ周期分析部115」
周波数領域ピッチ周期分析部115は、長期予測選択情報が長期予測を実行することを示す場合には、入力された換算間隔T1および換算間隔T1の整数倍の値U×T1を候補値として、周波数領域ピッチ周期Tを決定し、周波数領域ピッチ周期Tと周波数領域ピッチ周期Tが換算間隔T1の何倍であるかを示す周波数領域ピッチ周期符号とを出力する。ただし、Uは予め定めた第1の範囲の整数である。例えばUは0を除く整数であり、例えばU≧2である。例えば、予め定めた第1の範囲の整数が2以上8以下である場合は、換算間隔T1、換算間隔T1の2倍〜8倍の2T1、3T1、4T1、5T1、6T1、7T1、8T1の計8個の値が周波数領域ピッチ周期の候補値であり、これらの候補値の中から周波数領域ピッチ周期Tが選択される。この場合は、周波数領域ピッチ周期符号は、少なくとも3ビットの、1以上8以下の整数それぞれと一対一に対応する符号である。
周波数領域ピッチ周期分析部115は、長期予測選択情報が長期予測を実行しないことを示す場合には、予め定めた第2の範囲の整数値を候補値として周波数領域ピッチ周期Tを決定し、周波数領域ピッチ周期Tと周波数領域ピッチ周期Tを示す周波数領域ピッチ周期符号とを出力する。例えば、予め定めた第2の範囲の整数値が5以上36以下である場合は、5、6、・・・、36の計25個の値が周波数領域ピッチ周期の候補値であり、これらの候補値の中から周波数領域ピッチ周期Tが選択される。この場合は、周波数領域ピッチ周期符号は、少なくとも5ビットの、0以上31以下の整数それぞれと一対一に対応する符号である。
周波数領域ピッチ周期分析部115は、例えば、予め定めた並べ替え規則に従って選択されるサンプル群へのエネルギーの集中度を示す指標値が最大となる候補を周波数領域ピッチ周期Tとして決定する。エネルギーの集中度を示す指標値とは、エネルギーの総和、絶対値和などである。すなわち、エネルギーの集中度を示す指標値がエネルギーの総和である場合は、予め定めた並べ替え規則に従って選択されるサンプル群に含まれる全サンプルのエネルギーの総和が最大となる候補値を周波数領域ピッチ周期Tとして決定する。また、エネルギーの集中度を示す指標値が絶対値和である場合は、予め定めた並べ替え規則に従って選択されるサンプル群に含まれる全サンプルの値の絶対値和が最大となる候補値を周波数領域ピッチ周期Tとして決定する。「予め定めた並べ替え規則に従って選択されるサンプル群」については、並べ替え処理部116aの欄で詳細に説明する。
または、周波数領域ピッチ周期分析部115は、例えば、予め定めた並べ替え規則に従って並べ替えたサンプル列を実際に符号化して符号量が最小となる候補値を周波数領域ピッチ周期Tと決定する。「予め定めた並べ替え規則に従って並べ替えたサンプル列」については、並べ替え処理部116aの欄で詳細に説明する。
または、周波数領域ピッチ周期分析部115は、例えば、予め定めた並べ替え規則に従って選択されるサンプル群へのエネルギーの集中度を示す指標値が最大から上記所定個数の候補値を選択し、選択された候補値の中から予め定めた並べ替え規則に従って並べ替えたサンプル列を実際に符号化して符号量が最小となる候補値を周波数領域ピッチ周期Tと決定する。
周波数領域ピッチ周期分析部115が、長期予測選択情報が長期予測を実行することを示す場合には、換算間隔T1および換算間隔T1整数倍の値U×T1を候補値として、周波数領域ピッチ周期Tを決定することの意味を以下で説明する。
時間領域で2*N点の長期予測残差信号列に窓をかけたあとの信号列をxp’(1),...,xp’(2*N)とすると、この信号列xp’(1),...,xp’(2*N)のMDCT変換によって得られるMDCT係数列X(1),...,X(N)は、例えば以下のようになる。
Figure 2013176177

ただし、ρは(1/N)1/2などの係数であり、kは周波数に対応するインデックスk=1,...,Nである。すなわち各MDCT係数列X(k)は、例えば、以下の2*N次元の正規直交基底ベクトルB(k)と信号列ベクトル(xp’(1),...,xp’(2*N))との内積である。
Figure 2013176177
理想的には、信号列xp’(1),...,xp’(2*N)は時間領域で基本周期Pf(ディジタル音響信号列x(1),...,x(Nt)の基本周期)の周期性を持つため、上記の各内積からなる列、すなわち各MDCT係数X (k)のエネルギーや絶対値は、周波数方向の間隔2*N/Pf(以下「理想換算間隔」という)の周期で極大となる(ただし、信号列xp’(1),...,xp’(2*N)が正弦波であるような特別な場合を除く)。したがって理想的には、ステップS111−1で選択される時間領域のピッチ周期Lが基本周期Pfであり、Pf=Lとした理想換算間隔2*N/Pfが周波数領域ピッチ周期Tである。
しかしながら、x(1),...,x(Nt)およびX(1),...,X(N)はそれぞれ離散値である。時間領域でのx(1),...,x(Nt)の隣接サンプル間隔の整数倍が基本周期Pfであるとは限らず、さらに、周波数領域でのX(1),...,X(N)の隣接サンプル間隔の整数倍が理想換算間隔2*N/Pfであるとも限らない。したがって、ステップS111−1で選択される時間領域のピッチ周期Lが基本周期Pfまたはその近傍の候補τではなく、基本周期Pfの整数倍またはその近傍の候補τである場合もある。時間領域のピッチ周期Lが基本周期の整数倍n*Pfであった場合、時間領域のピッチ周期Lを周波数領域に換算した間隔T1’は、理想換算間隔の整数分の一倍、すなわち(2*N/Pf)/nとなる。結果として、理想換算間隔2*N/Pfを周波数領域ピッチ周期Tとしてサンプル群を選択することができず、間隔T1’=2*N/Lの整数倍を周波数領域ピッチ周期Tとしてサンプル群を選択することで、選択されたサンプル群へのエネルギーの集中度を示す指標値を大きくすることができる場合もある。以下、具体例を用いてこれらを説明する。
前述のように、ステップS111−1で選択される時間領域のピッチ周期Lは、式(A1)によって得られる値を最大にする候補τである。一般に式(A1)のx(t)x(t-τ)が最大となるのは、ディジタル音響信号列x(1),...,x(Nt)の基本周期Pfまたはその整数倍、すなわちn*Pf(ただしnは正整数)の何れか、に最も近い候補τが選択された場合である。つまり、n*Pfの何れかに最も近い候補τが時間領域のピッチ周期Lとなる傾向が高い。ここで、基本周期Pfがディジタル音響信号列x(1),...,x(Nt)のサンプリング周期(隣接サンプル間隔)の整数倍であるならば、基本周期Pfまたはそれに最も近い候補τが式(A1)によって得られる値を最大にし、時間領域のピッチ周期Lとなる傾向が高い。一方、基本周期Pfがサンプリング周期の整数倍でない場合には、基本周期Pf以外のn*Pfまたはそれに最も近い候補τが式(A1)によって得られる値を最大にし、時間領域のピッチ周期Lとなる場合が多い。例えば図3の例では、基本周期Pfがサンプリング周期の整数倍ではなく、2*Pfが時間領域のピッチ周期Lとして選択されている。時間領域ピッチ周期の候補τのうち、サンプリング周期の整数倍となる候補が複数あった場合、候補の値の小さい方が式(A1)の値が大きくなるので、時間領域ピッチ周期Lとして選択されやすい傾向にある。例えば、2*Pfと4*Pfがサンプリング周期の整数倍となる場合、2*Pfの方が式(A1)の値が大きくなるので、時間領域ピッチ周期Lとして選択されやすい。すなわち、上述のnは、値が小さいものほど使われる可能性が高い傾向にあると言える。
すなわち、ステップS111−1で選択される時間領域のピッチ周期LはL≒n*Pfと近似できる。よって、時間領域のピッチ周期Lを周波数領域に換算した間隔T1’=2*N/Lは以下のように近似できる。
T1’=2*N/L≒2*N/n*Pf= (2*N/Pf)/n (A41)
つまり、間隔T1’は理想換算間隔(2*N/Pf)の1/n倍で近似することができる。このような場合、間隔T1’そのものではなく、間隔の整数倍n*T1’が理想換算間隔2*N/Pfに対応する。
さらに、周波数領域におけるサンプリング間隔の整数倍は、理想換算間隔2*N/Pfに対応しているとは限らない。例えば、図4の例では、理想換算間隔2*N/PfがMDCT係数列X(1),...,X(N)の隣接サンプル間隔の整数倍となっていないため、理想換算間隔2*N/Pfを周波数領域ピッチ周期Tとしてサンプル群を選択することができない。しかし、周波数領域のピッチ周期に基づいて選択されるサンプル群へのエネルギーの集中度を大きくするという目的においては、理想換算間隔2*N/Pfそのものが周波数領域のピッチ周期として選択できなくても、理想換算間隔2*N/Pfのm倍(ただし、mは正整数)を周波数領域ピッチ周期T=m*2*N/Pfとしてサンプル群を選択することで、選択されたサンプル群へのエネルギーの集中度を示す指標値を大きくすることができる。つまり、選択されるサンプル群へのエネルギーの集中度を大きくするという目的においては、周波数領域ピッチ周期Tと換算間隔T1’との関係は、式(A41)を用いて以下のように書ける。
T=m*(2*N/Pf) ≒m*n*T1’ (A42)
さらに、式(A42)は式(A4)の換算間隔T1を用いて以下のように近似できる。
T≒m*n*INT(T1’)=m*n*INT(2*N/L)=m*n*T1 (A43)
つまり、周波数領域のピッチ周期Tは、換算間隔T1の整数倍で近似することができる。言い換えれば、換算間隔T1の整数倍の値の方が、それ以外の値よりもサンプル群へのエネルギーの集中度を示す指標値を大きくするような周波数領域のピッチ周期Tである可能性が高い。すなわち、換算間隔T1および換算間隔T1の整数倍とその近傍の値を候補値として、周波数領域ピッチ周期Tを決定することで、サンプル群へのエネルギーの集中度を示す指標値を大きくすることができる。
上述のように、nは値が小さいものほど使われる可能性が高い傾向にあり、mは正整数なので、周波数領域においては、周波数領域ピッチ周期Tの換算間隔T1に対する乗数m*nが小さいものほど、周波数領域ピッチ周期Tとして決定されやすい傾向にあると言える。すなわち、換算間隔T1の整数倍の倍数値が小さいほど周波数領域ピッチ周期Tとして決定されやすい傾向にあるといえる。
図5に、周波数領域ピッチ周期/(変換フレーム長*2/時間領域のピッチ周期)(T/(2*N/L)=T/T1)を横軸とし、その頻度を縦軸としたグラフを例示する。図5は、サンプル群へのエネルギーの集中度を示す指標値を大きくするような周波数領域ピッチ周期と時間領域ピッチ周期との関係を示すものである。図5から、周波数領域ピッチ周期Tが換算間隔T1の整数倍(特に1倍、2倍、3倍、4倍)またはその近傍の値となる頻度が高く、周波数領域ピッチ周期Tが換算間隔T1の整数倍にならない場合の頻度が低いことが分かる。つまり、図5は、サンプル群へのエネルギーの集中度を大きくするような周波数領域ピッチ周期Tは、換算間隔T1の整数倍もしくはその近傍の値となる確率が極めて高いことを示している。また、周波数領域ピッチ周期Tの換算間隔T1に対する乗数m*nが小さいものほど、周波数領域ピッチ周期Tとして決定されやすい傾向にあることも分かる。よって、換算間隔T1の整数倍およびその近傍の値を候補値として周波数領域ピッチ周期を探索することで、サンプル群へのエネルギーの集中度を大きくするような値を周波数領域ピッチ周期として得ることができる。
「周波数領域ピッチ周期考慮符号化部116」
周波数領域ピッチ周期考慮符号化部116は、並べ替え処理部116aと符号化部116bとを備え、周波数領域ピッチ周期Tに基づく符号化方法で、入力された周波数領域のサンプル列を符号化し、それによって得られた符号列を出力する。
「並べ替え処理部116a」
並べ替え処理部116aは、(1)周波数領域のサンプル列の全てのサンプルを含み、かつ、(2)周波数領域のサンプル列のうちの周波数領域ピッチ周期分析部115が決定した周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周波数領域サンプル列のうちの周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるようにサンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、を並べ替え後のサンプル列として出力する。つまり、周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、当該周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルが集まるように、入力されたサンプル列に含まれる少なくとも一部のサンプルが並べ替えられる。
そして、周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、当該周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルは、低周波側に一まとまりになるように集められる。
具体例として、並べ替え処理部116aは、入力されたサンプル列から、周波数領域ピッチ周期Tの整数倍に対応するサンプルF(nT)の前後のサンプルF(nT-1),F(nT+1)を含めた3個のサンプルF(nT-1),F(nT),F(nT+1)を選択する。この選択されたサンプルによる群が、周波数領域ピッチ周期分析部115における「予め定めた並べ替え規則に従って選択されるサンプル群」である。F(j)は、周波数に対応するサンプルインデックスを表す番号jに対応するサンプルである。nは、1からnT+1が予め設定した対象サンプルの上限Nを超えない範囲の各整数とする。周波数に対応するサンプルインデックスを表す番号jの最大値をjmaxとする。nに応じて選択されたサンプルの集まりをサンプル群と呼称する。上限Nは、jmaxと一致させてもよいが、音声や楽音などの音響信号では高域におけるサンプルの指標は一般的に十分に小さいことが多いので、後述する符号化効率の向上のために大きい指標を有するサンプルを低周波側に集めるという観点から、Nはjmaxよりも小さい値であってもよい。例えば、Nはjmaxの半分程度の値であってもよい。上限Nに基づいて定まるnの最大値をnmaxとすると、入力されたサンプル列に含まれるサンプルのうち、最低の周波数から第1の所定の周波数nmax*T+1までの各周波数に対応するサンプルが並べ替えの対象となる。なお、記号*は乗算を表す。
並べ替え処理部116aは、選択されたサンプルF(j)を、元の番号jの大小関係を保ったままサンプル列の先頭から順に配置してサンプル列Aを生成する。例えば、nが1から5までの各整数を表す場合、並べ替え処理部116aは、第1のサンプル群F(T-1),F(T),F(T+1)、第2のサンプル群F(2T-1),F(2T),F(2T+1)、第3のサンプル群F(3T-1),F(3T),F(3T+1)、第4のサンプル群F(4T-1),F(4T),F(4T+1)、第5のサンプル群F(5T-1),F(5T),F(5T+1)をサンプル列の先頭から並べる。つまり、15個のサンプルF(T-1),F(T),F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1)がこの順番でサンプル列の先頭から並べられ、これら15個のサンプルがサンプル列Aを構成する。
さらに、並べ替え処理部116aは、選択されなかったサンプルF(j)を、元の番号の大小関係を保ったままサンプル列Aの最後から順に配置する。選択されなかったサンプルF(j)は、サンプル列Aを構成するサンプル群の間に位置するサンプルであり、このような連続した一まとまりのサンプルをサンプルセットと呼称する。つまり、上述の例であれば、第1のサンプルセットF(1),…,F(T-2)、第2のサンプルセットF(T+2),…,F(2T-2)、第3のサンプルセットF(2T+2),…,F(3T-2)、第4のサンプルセットF(3T+2),…,F(4T-2)、第5のサンプルセットF(4T+2),…,F(5T-2)、第6のサンプルセットF(5T+2),…F(jmax)がサンプル列Aの最後から順に並べられ、これらのサンプルがサンプル列Bを構成する。
要するに、この例であれば、入力されたサンプル列F(j)(1≦j≦jmax)は、F(T-1),F(T),F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1),F(1),…,F(T-2),F(T+2),…,F(2T-2),F(2T+2),…,F(3T-2),F(3T+2),…,F(4T-2),F(4T+2),…,F(5T-2),F(5T+2),…F(jmax)に並べ替えられることになる(図6参照)。この並べ替え後のサンプル列が、周波数領域ピッチ周期分析部115における「予め定めた並べ替え規則に従って並べ替えたサンプル列」である。
なお、低周波数帯域では、周波数領域ピッチ周期Tに対応するサンプルやその整数倍のサンプル以外のサンプルでも、各サンプルは振幅やパワーが大きな値を持つことが多い。そこで、最低の周波数から所定の周波数fまでの各周波数に対応するサンプルの並べ替えを行わないようにしてもよい。例えば、所定の周波数fをnT+αとすれば、並べ替え前のサンプルF(1),…,F(nT+α)を並べ替えず、並べ替え前のF(nT+α+1)以降のサンプルを並べ替えの対象とする。αは0以上かつTよりもある程度小さい整数(例えばT/2を超えない整数)に予め設定されている。ここでnは2以上の整数であってもよい。あるいは、並べ替え前の最低周波数に対応するサンプルから連続するP個のサンプルF(1),…,F(P)を並べ替えないようにして、並べ替え前のF(P+1)以降のサンプルを並べ替えの対象としてもよい。この場合、所定の周波数fはPである。並べ替えの対象となるサンプルの集まりに対する並べ替えの基準は上述のとおりである。なお、第1の所定の周波数が設定されている場合、所定の周波数f(第2の所定の周波数)は第1の所定の周波数よりも小さい。
例えば、並べ替え前のサンプルF(1),…,F(T+1)を並べ替えず、並べ替え前のF(T+2)以降のサンプルを並べ替えの対象とする場合、上述の並べ替えの基準に従うと、入力されたサンプル列F(j)(1≦j≦jmax)は、F(1),…,F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1),F(T+2),…,F(2T-2),F(2T+2),…,F(3T-2),F(3T+2),…,F(4T-2),F(4T+2),…,F(5T-2),F(5T+2),…F(jmax)に並べ替えられることになる(図7参照)。
並べ替えの対象となる番号jの最大値を決定付ける上限Nあるいは第1の所定の周波数を全てのフレームに共通の値とせずに、フレーム毎に異なる上限Nあるいは第1の所定の周波数を設定してもよい。この場合、フレームごとに上限Nあるいは第1の所定の周波数を指定する情報を復号側へ送ればよい。また、並べ替えの対象となる番号jの最大値を指定するのではなく、並べ替えるサンプル群の個数を指定してもよく、この場合、サンプル群の個数をフレーム毎に設定して、サンプル群の個数を指定する情報を復号側へ送ってもよい。もちろん、並べ替えるサンプル群の個数を全てのフレームに共通としてもよい。また、第2の所定の周波数fについても、全てのフレームに共通の値とせずに、フレーム毎に異なる第2の所定の周波数fを設定してもよい。この場合、フレームごとに第2の所定の周波数を指定する情報を復号側へ送ればよい。
このように並べ替えられた後のサンプル列は、周波数を横軸とし、サンプルの指標を縦軸とした場合に、サンプルの指標の包絡線が周波数の増大に伴って下降傾向を示すことになる。この理由として、周波数領域のサンプル列は音響信号、特に音声信号や楽音信号の特徴として、一般的に高周波成分が少ないという事実が挙げられる。換言すれば、並べ替え処理部116aは、サンプルの指標の包絡線が周波数の増大に伴って下降傾向を示すように入力されたサンプル列に含まれる少なくとも一部のサンプルを並べ替えると言ってもよい。なお、図6および図7では、サンプルの並べ替えによって低域側に、より大きな振幅を持つサンプルが偏ることを分かりやすく図示するため、周波数領域のサンプル列に含まれる全てのサンプルが正の値である場合の例を図示してある。実際には、周波数領域のサンプル列に含まれる各サンプルは正または負またはゼロの値である場合も多いが、このような場合であっても、上述の並べ替え処理あるいは後述の並べ替え処理を実行すればよい。
さらに、この実施形態では低域側に、周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルを集める並べ替えを行ったが、逆に高域側に、周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルを集める並べ替えを行ってもよい。この場合、サンプル列Aではサンプル群が逆順で並べられ、サンプル列Bではサンプルセットが逆順で並べられ、低域側にサンプル列Bが配置されサンプルBの後ろにサンプル列Aが配置される。つまり、上述の例であれば、低域側から、第6のサンプルセットF(5T+2),…F(jmax)、第5のサンプルセットF(4T+2),…,F(5T-2)、第4のサンプルセットF(3T+2),…,F(4T-2)、第3のサンプルセットF(2T+2),…,F(3T-2)、第2のサンプルセットF(T+2),…,F(2T-2)、第1のサンプルセットF(1),…,F(T-2)、第5のサンプル群F(5T-1),F(5T),F(5T+1)、第4のサンプル群F(4T-1),F(4T),F(4T+1)、第3のサンプル群F(3T-1),F(3T),F(3T+1)、第2のサンプル群F(2T-1),F(2T),F(2T+1)、第1のサンプル群F(T-1),F(T),F(T+1)の順番でサンプルが並べられる。
このように並べ替えられた後のサンプル列は、周波数を横軸とし、サンプルの指標を縦軸とした場合に、サンプルの指標の包絡線が周波数の増大に伴って増大傾向を示すことになる。換言すれば、並べ替え処理部116aは、サンプルの指標の包絡線が周波数の増大に伴って増大傾向を示すように入力されたサンプル列に含まれる少なくとも一部のサンプルを並べ替えると言ってもよい。
周波数領域ピッチ周期Tは整数ではなく小数である場合もある。この場合、例えば、R(nT)を、nTを四捨五入した値として、F(R(nT-1)),F(R(nT)),F(R(nT+1))が選択されることになる。
なお、周波数領域ピッチ周期分析部115が実際の符号量が最小となる候補値を周波数領域ピッチ周期Tとして決定する処理を行う場合は、周波数領域ピッチ周期分析部115において並べ替え後のサンプル列が生成されているので、周波数領域ピッチ周期考慮符号化部116が並べ換え処理部116aを備えなくてもよい。
[集めるサンプルの個数]
また、この実施形態では、各サンプル群に含まれるサンプルの個数が、周波数領域ピッチ周期Tないしその整数倍に対応するサンプル(以下、中心サンプルという)とその前後1サンプルの計3サンプルであるという固定された個数の例を示した。しかしながら、サンプル群に含まれるサンプルの個数やサンプルインデックスを可変とする場合には、並び替え処理部116aは、サンプル群に含まれるサンプルの個数とサンプルインデックスの組み合わせが異なる複数の選択肢の中から選択された一つを表す情報を補助情報(第1補助情報)として出力する。
例えば、選択肢として、
(1)中心サンプルのみ、F(nT)
(2)中心サンプルとその前後1サンプルの計3サンプル、F(nT-1),F(nT),F(nT+1)
(3)中心サンプルとその前2サンプルの計3サンプル、F(nT-2),F(nT-1),F(nT)
(4)中心サンプルとその前3サンプルの計4サンプル、F(nT-3),F(nT-2),F(nT-1),F(nT)
(5)中心サンプルとその後2サンプルの計3サンプル、F(nT),F(nT+1),F(nT+2)
(6)中心サンプルとその後3サンプルの計4サンプル、F(nT),F(nT+1),F(nT+2),F(nT+3)
が設定されている場合に、(4)が選択されたならば、この(4)が選択されたことを表す情報を第1補助情報とする。この例であれば、選択された選択肢を表す情報として3ビットあれば十分である。
なお、このような選択肢の中からどれを選択すればよいか決める方法として、並べ替え処理部116aでは各選択肢に対応する並べ替えを実施し、後述する符号化部116bで各選択肢に対応する符号列の符号量を得て、最も符号量が小さい選択肢を選択するという方法を採用すればよい。この場合は、第1補助情報は並べ替え処理部116aからではなく符号化部116bから出力される。この方法は、nを選択可能な場合にも妥当する。
「符号化部116b」
次に、符号化部116bが、並べ替え処理部116aが出力したサンプル列を符号化し、得られた符号列を出力する(ステップS116b)。例えば、符号化部116bは、並べ替え処理部116aが出力したサンプル列に含まれるサンプルの振幅の偏りに応じて可変長符号化の方法を切り替えて符号化する。つまり、並べ替え処理部116aによってフレーム内で、低域側(あるいは高域側)に振幅の大きなサンプルが集められているので、符号化部116bはその偏りに適した方法による可変長符号化を行う。並べ替え処理部116aが出力したサンプル列のように、局所的な領域ごとに同等か同程度の振幅を持つサンプルが集まっていると、例えば領域ごとに異なるライスパラメータでライス符号化することによって平均符号量を削減できる。以下、フレーム内で低域側(フレームの先頭に近い側)に振幅の大きなサンプルが集められている場合を例に採って説明する。
[符号化の具体例]
具体例として、符号化部116bは、大きな振幅を持つサンプルが集まっている領域ではサンプルごとにライス符号化(ゴロム-ライス符号化ともいう)を適用する。この領域以外の領域では、符号化部116bは、複数のサンプルをまとめたサンプルの集合に対する符号化にも適するエントロピー符号化(ハフマン符号化や算術符号化など)を適用する。ライス符号化の適用に関して、ライス符号化の適用領域とライスパラメータが固定されていてもよいし、あるいは、ライス符号化の適用領域とライスパラメータの組み合わせが異なる複数の選択肢の中から一つ選択できる構成であってもよい。このような複数の選択肢から一つを選択する際、ライス符号化の選択情報として、例えば下記のような可変長符号(記号""で囲まれたバイナリ値)を使うことができ、符号化部116bは選択情報も出力する。
"1":ライス符号化を適用しない
"01":ライス符号化を先頭から1/32の領域にライスパラメータを1として適用する。
"001":ライス符号化を先頭から1/32の領域にライスパラメータを2として適用する。
"0001":ライス符号化を先頭から1/16の領域にライスパラメータを1として適用する。
"00001":ライス符号化を先頭から1/16の領域にライスパラメータを2として適用する。
"00000":ライス符号化を先頭から1/32の領域にライスパラメータを3として適用する。
なお、このような選択肢の中からどれを選択すればよいかを決める方法として、符号化処理で得られる各ライス符号化に対応する符号列の符号量を比較し、最も符号量が小さい選択肢を選択するという方法を採用すればよい。
また、並べ替え後のサンプル列に0の振幅を持つサンプルが長く続く領域が現れると、0の振幅を持つサンプルの連続数を例えばランレングス符号化することにより平均符号量を削減できる。このような場合、符号化部116bは、(1)大きな振幅を持つサンプルが集まっている領域ではサンプルごとにライス符号化を適用し、(2)この領域以外の領域では、(a)0の振幅を持つサンプルが連続する領域では、0の振幅を持つサンプルの連続数を表す符号を出力する符号化を行い、(b)残りの領域では、複数のサンプルをまとめたサンプルの集合に対する符号化にも適するエントロピー符号化(ハフマン符号化や算術符号化など)を適用する。このような場合であっても、上述のようなライス符号化の選択を行ってもよい。また、このような場合、どの領域にランレングス符号化が適用されたかを表す情報も復号側へ伝送される必要があり、例えばこの情報は上記選択情報に含められる。さらに、エントロピー符号化に属する複数の符号化方法を選択肢として用意してある場合には、いずれの符号化を選択したかを特定するための情報も復号側へ伝送される必要があり、例えばこの情報は上記選択情報に含められる。
なお、サンプル列に含まれるサンプルの並べ替えによる利点が無い場合も考えられる。このような場合には並べ替え前のサンプル列を符号化すべきである。そこで、並べ替え処理部116aからは並べ替え前のサンプル列(並べ替えを行っていないサンプル列)も出力し、符号化部116bは、並べ替え前のサンプル列と並べ替え後のサンプル列をそれぞれ可変長符号化し、並べ替え前のサンプル列を可変長符号化して得られる符号列の符号量と、並べ替え後のサンプル列を領域ごとに可変長符号化を切り替えて符号化して得られる符号列の符号量とを比較し、並べ替え前のサンプル列の符号量が最小である場合には、並べ替え前のサンプル列を可変長符号化して得られた符号列を出力する。この場合、符号化部116bは、符号列に対応するサンプル列がサンプルの並べ替えを行ったサンプル列であるか否かを表す補助情報(第2補助情報)も出力する。この第2補助情報として1ビットを使えば十分である。なお、第2補助情報が符号列に対応するサンプル列がサンプルの並べ替えを行なっていないサンプル列を特定するものである場合は、第1補助情報は出力されなくてもよい。
また、予め予測利得またはその推定値がある定められた閾値より大きい場合のみサンプル列の並べ替えを適用することに決めておくこともできる。これは予測利得が大きいときには声帯振動や楽器の振動が強く、周期性も高い場合が多いという音声や楽音の性質を利用するものである。予測利得は原音のエネルギーを予測残差のエネルギーで割ったものである。線形予測係数やPARCOR係数をパラメータとして使う符号化においては、量子化済みのパラメータを符号化装置と復号装置で共通に使うことができる。そこで、例えば、符号化部116bは、符号化装置11内の図示しない別の手段によって求めたi次の量子化済PARCOR係数k(i)を用いて、(1-k(i)*k(i))を次数ごとに乗算したものの逆数で表わされる予測利得の推定値を計算し、計算された推定値がある定められた閾値より大きい場合は並べ替え後のサンプル列を可変長符号化して得られた符号列を出力し、そうでない場合は並べ替え前のサンプル列を可変長符号化して得られた符号列を出力する。この場合は、符号列に対応するサンプル列が並べ替えを行ったサンプル列であるか否かを表す第2補助情報を出力する必要は無い。すなわち、予測がきかない雑音的音声や無音時には効果が小さい可能性が高いので並べ替えをしないと決めておくほうが第2補助情報や計算の無駄が少ない。
なお、並べ替え処理部116aにおいて、予測利得または予測利得の推定値の計算を行い、予測利得または予測利得の推定値がある定められた閾値より大きい場合はサンプル列に対する並べ替えを行って並べ替え後のサンプル列を符号化部116bに出力し、そうでない場合はサンプル列に対する並べ替えを行なわずに並べ替え処理部116aに入力されたサンプル列そのものを符号化部116bに出力し、符号化部116bでは並べ替え処理部116aから出力されたサンプル列を可変長符号化する構成としてもよい。
なお、この構成の場合には、閾値を符号化側と復号側とで共通の値として予め設定しておくこととする。
なお、ここで例示したライス符号化、算術符号化、ランレングス符号化はいずれも周知であるからその詳細な説明を省略する。また、量子化済PARCOR係数は、線形予測係数やLSPパラメータから変換可能な係数であるので、符号化装置11内の図示しない別の手段によって量子化済PARCOR係数を求める代わりに、符号化装置11内の図示しない別の手段によってまず量子化済の線形予測係数や量子化済のLSPパラメータを求め、次に、求めたパラメータから量子化済PARCOR係数を求め、更に、予測利得の推定値を求めてもよい。要は、予測利得の推定値は、線形予測係数に対応する量子化済みの係数に基づいて求められることになる。
上述の符号化処理では、並べ替え処理部116aが出力したサンプル列に含まれるサンプルの振幅の偏りに応じて可変長符号化方法を切り替えて符号化する例を説明したが、このような符号化処理に限定されるものではない。例えば、一つまたは複数のサンプルを1シンボル(符号化単位)とし、その1つまたは複数のシンボルによる系列(以下、シンボル系列、と呼ぶ)の直前のシンボル系列に依存して割り当て符号を適応的に制御する符号化処理を採用することもできる。このような符号化処理として、例えばJPEG2000にも採用されている適応型算術符号を例示できる。適応型算術符号化ではモデリング処理と算術符号化が行われる。モデリング処理では直前のシンボル系列から算術符号化のためのシンボル系列の頻度表が選択される。そして、選択されたシンボル系列の出現確率に応じて閉区間半直線[0,1]を区分し、区分された区間内の位置を示す2進小数値にそのシンボル系列に対する符号を割り当てる算術符号化が行われる。本発明の実施形態においては、モデリング処理として、並べ替え後の周波数領域のサンプル列(上述の例では量子化MDCT係数列)を低域から順次シンボルに分け、算術符号化のための頻度表を選択し、さらに算術符号化として、選択されたシンボル系列の出現確率に応じて閉区間半直線[0,1]を区分し、区分された区間内の位置を示す2進小数値にそのシンボル系列に対する符号を割り当てる。上述のように、並べ替え処理によって、既にサンプル列がサンプルの大きさを反映する指標(例えば振幅の絶対値)が同等か同程度のサンプルが集まるように並べ替えられていることから、サンプル列内での隣接するサンプル間でのサンプルの大きさを反映する指標の変動が小さくなり、シンボルの頻度表の精度が高まり、シンボルに対する算術符号化によって得られる符号の総符号量を抑制できる。
「復号装置」
図2を参照して復号装置12が行う復号処理を説明する。
復号装置12には、少なくとも、上記長期予測選択情報と、上記利得情報と、上記周波数領域ピッチ周期符号と、上記符号列が入力される。また、上記長期予測選択情報が長期予測を実行することを示す場合には、少なくとも時間領域ピッチ周期符号CLが入力される。時間領域ピッチ周期符号CLに加えてピッチ利得符号Cgpも入力される場合もある。なお、符号化装置11から選択情報や第1補助情報や第2補助情報が出力された場合にはこの選択情報や第1補助情報や第2補助情報も復号装置12に入力される。
「周波数領域ピッチ周期考慮復号部123」
周波数領域ピッチ周期考慮復号部123は、復号部123aと回復部123bとを備え、周波数領域ピッチ周期Tに基づく復号方法で、入力された符号列を復号して元のサンプルの並びを得て出力する。
「復号部123a」
復号部123aが、フレームごとに、入力された符号列を復号して周波数領域のサンプル列を出力する(ステップS123a)。
復号装置12に第2補助情報が入力された場合には、第2補助情報が符号列に対応するサンプル列がサンプルの並べ替えを行ったサンプル列であることを示すか否かによって、復号部123aが得た周波数領域のサンプル列の出力先が異なる。第2補助情報が符号列に対応するサンプル列が並べ替えを行ったサンプル列であることを示す場合には、復号部123aが得た周波数領域のサンプル列は回復部123bに対して出力される。第2補助情報が符号列に対応するサンプル列が並べ替えを行っていないサンプル列であることを示す場合には、復号部123aが得た周波数領域のサンプル列は利得乗算部124aに対して出力される。
また、符号化装置11で予め予測利得またはその推定値と閾値との比較結果によりサンプルの並べ替えを行うか否かの切り替えを行った場合には、復号装置12でも同様の切り替えを行う。すなわち、復号部123aは、復号装置12内の図示しない別の手段によって求めたi次の量子化済PARCOR係数k(i)を用いて、(1-k(i)*k(i))を次数ごとに乗算したものの逆数で表わされる予測利得の推定値を計算する。そして、復号部123aは、計算された推定値がある定められた閾値より大きい場合は、復号部123aが得た周波数領域のサンプル列を回復部123bに対して出力する。そうでない場合は、復号部123aは、復号部123aが得た周波数領域のサンプル列を並べ替え前のサンプル列を利得乗算部124aに対して出力する。
なお、復号装置12内の図示しない別の手段によって量子化済PARCOR係数を求める方法としては、PARCOR係数に対応する符号を復号して量子化済PARCOR係数を得る方法、LSPパラメータに対応する符号を復号して量子化済LSPパラメータを得て、得られた量子化済LSPパラメータを変換して量子化済PARCOR係数を得る方法、など周知の方法を採用すればよい。要はこれらの方法は、すべて、線形予測係数に対応する符号から線形予測係数に対応する量子化済みの係数を得る方法である。すなわち、予測利得の推定値は、線形予測係数に対応する符号を復号して得られた線形予測係数に対応する量子化済みの係数に基づくものである。
復号装置12に符号化装置11から選択情報が入力された場合には、復号部123aは入力された符号列に対して選択情報に応じた復号方法で復号処理を実行する。当然であるが、符号列を得るために実行された符号化方法に対応する復号方法が実行される。復号部123aによる復号処理の詳細は符号化装置11の符号化部116bによる符号化処理の詳細に対応するので、当該符号化処理の説明をここに援用し、実行された符号化に対応する復号が復号部123aの行う復号処理であることを明記し、これをもって復号処理の詳細な説明とする。なお、選択情報が入力された場合には、どのような符号化方法が実行されたかは当該選択情報によって特定される。選択情報に、例えば、ライス符号化の適用領域とライスパラメータを特定する情報と、ランレングス符号化の適用領域を表す情報と、エントロピー符号化の種類を特定する情報が含まれている場合には、これらの符号化方法に応じた復号方法が入力された符号列の対応する領域に適用される。ライス符号化に対応する復号処理、エントロピー符号化に対応する復号処理、ランレングス符号化に対応する復号処理はいずれも周知であるから説明を省略する。
「長期予測情報復号部121」
長期予測情報復号部121は、長期予測選択情報が長期予測を実行することを示す場合には、入力された時間領域ピッチ周期符号CLを復号して時間領域のピッチ周期Lを得て出力する。ピッチ利得符号Cgpも入力された場合には、さらに、ピッチ利得符号Cgpを復号して量子化済みピッチ利得gp^を得て出力する。
「周期換算部122」
周期換算部122は、長期予測選択情報が長期予測を実行することを示す場合には、入力された周波数領域ピッチ周期符号を復号して周波数領域ピッチ周期Tが換算間隔T1の何倍であるかを示す整数値を得て、時間領域のピッチ周期Lと周波数領域のサンプル点数Nとに基づき式(A4)によって換算間隔T1を得て、換算間隔T1に整数値を乗算することで周波数領域ピッチ周期Tを得て出力する。
周期換算部122は、長期予測選択情報が長期予測を実行しないことを示す場合には、入力された周波数領域ピッチ周期符号を復号して周波数領域ピッチ周期Tを得て出力する。
「回復部123b」
次に、回復部123bが、フレームごとに、周期換算部122が得た周波数領域ピッチ周期Tに従って、または、復号装置12に補助情報が入力された場合には周期換算部122が得た周波数領域ピッチ周期Tと入力された補助情報とに従って、復号部123aが出力した周波数領域のサンプル列から元のサンプルの並びを得て出力する(ステップS123b)。ここで「元のサンプルの並び」とは、符号化装置11の周波数領域サンプル列生成部113から出力された「周波数領域のサンプル列」に相当する。上述のとおり、符号化装置11の並べ替え処理部116aによる並べ替え方法や並べ替え方法に対応する並べ替えの選択肢は種々あるが、並べ替えが実行された場合には実行された並べ替えは一つであり、その並べ替えは周波数領域ピッチ周期Tと補助情報とによって特定できる。
回復部123bによる回復処理の詳細は符号化装置11の並べ替え処理部116aによる並べ替え処理の詳細に対応するので、当該並べ替え処理の説明をここに援用し、その並べ替え処理の逆順の処理(逆の並べ替え)が回復部123bの行う回復処理であることを明記し、これをもって回復処理の詳細な説明とする。なお、理解の一助のため、上述の並べ替え処理の具体例に対応する回復処理の一例を説明する。
例えば、並べ替え処理部116aがサンプル群を低域側に集めてF(T-1),F(T),F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1),F(1),…,F(T-2),F(T+2),…,F(2T-2),F(2T+2),…,F(3T-2),F(3T+2),…,F(4T-2),F(4T+2),…,F(5T-2),F(5T+2),…F(jmax)を出力した上述の例であると、回復部123bには復号部123aが出力した周波数領域のサンプル列F(T-1),F(T),F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1),F(1),…,F(T-2),F(T+2),…,F(2T-2),F(2T+2),…,F(3T-2),F(3T+2),…,F(4T-2),F(4T+2),…,F(5T-2),F(5T+2),…F(jmax)が入力される。回復部123bは、周波数領域ピッチ周期Tと補助情報に基づいて、入力されたサンプル列F(T-1),F(T),F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1),F(1),…,F(T-2),F(T+2),…,F(2T-2),F(2T+2),…,F(3T-2),F(3T+2),…,F(4T-2),F(4T+2),…,F(5T-2),F(5T+2),…F(jmax)を元のサンプルの並びF(j)(1≦j≦jmax)に戻す。
「利得乗算部124a」
次に、利得乗算部124aが、フレームごとに、復号部123aまたは回復部123bが出力したサンプル列の各係数に、上記利得情報で特定される利得を乗じて、「正規化された重み付け正規化MDCT係数列」を得て出力する(ステップS124a)。
「重み付け包絡逆正規化部124b」
次に、重み付け包絡逆正規化部124bが、フレームごとに、利得乗算部124aが出力した「正規化された重み付け正規化MDCT係数列」の各係数に、前述のように伝送されたパワースペクトル包絡係数列から得られる補正係数を適用することで「MDCT係数列」を得て出力する(ステップS124b)。符号化装置11で実行された重み付け包絡正規化処理の例に対応させて具体例を説明すると、重み付け包絡逆正規化部124bは、利得乗算部124aが出力した「正規化された重み付け正規化MDCT係数列」の各係数に、当該各係数に対応するパワースペクトル包絡係数列の各係数のβ乗(0<β<1)の値W(1)β,・・・,W(N)βを乗算することによって、MDCT係数列の各係数X(1),・・・,X(N)を得る。
「時間領域変換部124c」
次に、時間領域変換部124cが、フレームごとに、重み付け包絡逆正規化部124bが出力した「MDCT係数列」を時間領域に変換してフレーム単位の信号列(時間領域の信号列)を得て出力する(ステップS124c)。長期予測情報復号部121が出力した長期予測選択情報が長期予測を実行することを示す場合には、時間領域変換部124cが得た信号列は長期予測残差信号列xp(1),...,xp(Nt)として長期予測合成部125に入力される。長期予測情報復号部121が出力した長期予測選択情報が長期予測を実行しないことを示す場合には、時間領域変換部124cが得た信号列はディジタル音響信号列x(1),...,x(Nt)として復号装置12から出力される。
「長期予測合成部125」
長期予測合成部125は、長期予測選択情報が長期予測を実行することを示す場合には、時間領域変換部124cが得た長期予測残差信号列xp(1),...,xp(Nt)と、長期予測情報復号部121が出力した時間領域のピッチ周期Lと量子化済みピッチ利得gp^と、長期予測合成部125が生成した過去のディジタル音響信号とに基づき、式(A5)によって、ディジタル音響信号列x(1),...,x(Nt)を得る。長期予測情報復号部121が量子化済みピッチ利得gp^を出力しない場合、すなわち、復号装置12にピッチ利得符号Cgpが入力されなかった場合には、gp^として例えば0.5などの予め定めた値を用いる。この場合のgp^の値は、符号化装置11と復号装置12とで同じ値を用いることができるよう、長期予測情報復号部121内に予め記憶しておく。
x(t)= xp(t)+gp^x(t-L) (A5)
そして、長期予測合成部125が得た信号列はディジタル音響信号列x(1),...,x(Nt)として復号装置12から出力される。
長期予測合成部125は、長期予測選択情報が長期予測を実行しないことを示す場合には、何もしない。
実施形態から明らかなように、例えば周波数領域ピッチ周期Tが明瞭である場合には、周波数領域ピッチ周期Tに応じてサンプル列を並べ替えたものを符号化することによって、効率の高い符号化ができる(すなわち平均符号長を小さくできる)。また、サンプル列の並べ替えによって局所領域ごとに同等か同程度の指標を有するサンプルが集中するので、可変長符号化の効率化だけでなく、量子化歪の軽減や符号量の削減が可能となっている。
[第1実施形態の変形例]
第1実施形態の符号化装置11では換算間隔T1および換算間隔T1の整数倍の値U×T1を候補値として周波数領域ピッチ周期Tを決定したが、換算間隔T1の整数倍の値U×T1以外の倍数値も候補値として周波数領域ピッチ周期Tを決定してもよい。以下、第1実施形態と異なる点について説明する。
[符号化装置11’]
本変形例の符号化装置11’が第1実施形態の符号化装置11と異なるのは、周波数領域ピッチ周期分析部115に替えて周波数領域ピッチ周期分析部115’を備える点である。本変形例では、周波数領域ピッチ周期分析部115’が、換算間隔T1および換算間隔T1の整数倍の値U×T1および換算間隔T1の整数倍U×T1以外の予め定めた倍数の値を候補値として、周波数領域ピッチ周期Tを決定して出力する。周波数領域ピッチ周期分析部115’は、長期予測選択情報が長期予測を実行しないことを示す場合には、第1実施形態と同様に、予め定めた第2の範囲の整数値を候補値として周波数領域ピッチ周期Tを決定して出力する。
「周波数領域ピッチ周期分析部115’」
周波数領域ピッチ周期分析部115’は、換算間隔T1および換算間隔T1の整数倍の値U×T1および換算間隔T1の整数倍U×T1以外の予め定めた倍数の値を候補値として、周波数領域ピッチ周期Tを決定し(換算間隔T1および換算間隔T1の整数倍の値U×T1を含む候補値の中から周波数領域ピッチ周期Tを決定し)、周波数領域ピッチ周期Tと周波数領域ピッチ周期Tが換算間隔T1の何倍であるかを示す周波数領域ピッチ周期符号とを出力する。
例えば、予め定めた第1の範囲の整数が2以上9以下である場合は、換算間隔T1、その整数倍の値2T1、3T1、4T1、5T1、6T1、7T1、8T1、9T1、換算間隔T1の整数倍以外の予め定めた倍数の値である1.9375T1, 2.0625T1, 2.125T1, 2.1875T1, 2.25T1, 2.9375T1, 3.0625T1の計16個の値が周波数領域ピッチ周期の候補値であり、これらの候補値の中から周波数領域ピッチ周期Tが選択される。この場合は、周波数領域ピッチ周期符号は、16個の候補値それぞれと一対一に対応する少なくとも4ビットの符号である。
なお、「予め定めた第1の範囲の整数」とは、ある整数以上ある整数以下の全ての整数を必ずしも含む必要はない。例えば、2以上9以下であり、かつ、5を除く整数を予め定めた第1の範囲の整数としてもよい。この場合には、例えば、換算間隔T1、その整数倍の値2T1、3T1、4T1、6T1、7T1、8T1、9T1、換算間隔T1の整数倍以外の予め定めた倍数の値である1.3750T1、1.53125T1、2.03125T1、2.0625T1、2.09375T1、2.1250 T1、8.5000 T1、14.5000 T1の計16個の値が周波数領域ピッチ周期の候補値であり、これらの候補値の中から周波数領域ピッチ周期Tが選択される。この場合は、周波数領域ピッチ周期符号は、16個の候補値それぞれと一対一に対応する少なくとも4ビットの符号である。
周波数領域ピッチ周期分析部115’は、長期予測選択情報が長期予測を実行しないことを示す場合には、第1実施形態と同様に、予め定めた第2の範囲の整数値を候補値として周波数領域ピッチ周期Tを決定する。
[復号装置12’]
本変形例の復号装置12’が第1実施形態の復号装置12と異なるのは、周期換算部122に替えて周期換算部122’を備える点である。
「周期換算部122’」
周期換算部122’は、長期予測選択情報が長期予測を実行することを示す場合には、周波数領域ピッチ周期符号を復号して周波数領域ピッチ周期Tが換算間隔T1の何倍であるかを示す値(倍数値)を得て、時間領域のピッチ周期Lと周波数領域のサンプル点数Nとに基づき式(A4)によって換算間隔T1を得て、換算間隔T1に何倍であるかを示す値を乗算することで周波数領域ピッチ周期Tを得て出力する。
周期換算部122’は、長期予測選択情報が長期予測を実行しないことを示す場合には、周波数領域ピッチ周期符号を復号して周波数領域ピッチ周期Tを得て出力する。
[第1実施形態の変形例2]
第1実施例の変形例1では、換算間隔T1の整数倍の値U×T1以外の倍数値も候補値として周波数領域ピッチ周期Tを決定した。このとき、整数倍の値U×T1の方がそれ以外の値よりも周波数領域ピッチ周期Tとなる可能性が高いという特性があることを反映し、第1実施形態の変形例2では、周波数領域ピッチ周期符号の長さを可変長符号帳により決定する。
また、周波数領域ピッチ周期分析部115’’において、周波数領域ピッチ周期符号の長さも考慮して、ピッチ周期Tを決定する。
以下、第1実施形態の変形例1と異なる点について説明する。本変形例の符号化装置11’’が第1実施形態の符号化装置11と異なるのは、周波数領域ピッチ周期分析部115に替えて周波数領域ピッチ周期分析部115’’を備える点である。
「周波数領域ピッチ周期分析部115’’」
周波数領域ピッチ周期分析部115’’は、換算間隔T1および換算間隔T1の整数倍の値U×T1および換算間隔T1の整数倍U×T1以外の予め定めた倍数の値を候補値として、周波数領域ピッチ周期Tを決定し(換算間隔T1および換算間隔T1の整数倍の値U×T1を含む候補値の中から周波数領域ピッチ周期Tを決定し)、周波数領域ピッチ周期Tと周波数領域ピッチ周期Tが換算間隔T1の何倍であるかを示す周波数領域ピッチ周期符号とを出力する。
ここで、周波数領域ピッチ周期Tが換算間隔T1の何倍であるかを示す周波数領域ピッチ周期符号は、換算間隔T1の整数倍の値V×T1に対応する符号の符号長が、それ以外の候補に対応する符号の符号長よりも短くなるような可変長符号帳を用いて周波数領域ピッチ周期符号を決定する。ただし、Vは整数である。例えばVは0を除く整数であり、例えばVは正の整数である。例えばV∈{1, U}である。
例えば、周波数領域ピッチ周期Tが換算間隔T1そのものである場合の可変長符号の符号長、および、周波数領域ピッチ周期Tが換算間隔T1の整数倍U×T1である場合の可変長符号の符号長が、それ以外の場合の可変長符号の符号長よりも短い可変長符号帳(例1)を用いて、周波数領域ピッチ周期符号を決定してもよい。なお、「可変長符号」は、頻度が高い事象に対して頻度の低い事象に対する符号より短い符号をわりあてて平均符号長を短くする符号を意味する。このような周波数領域ピッチ周期符号は、周波数領域ピッチ周期Tが換算間隔T1そのものである場合、換算間隔T1の整数倍である場合、の符号長のほうが、それ以外の場合の符号長よりも短い。このような可変長符号帳の例を図12に示す。換算間隔T1の整数倍は、それ以外よりも周波数領域ピッチ周期として決定される頻度が高い性質があるので、このような可変長符号帳を用いて周波数領域ピッチ周期符号を決定することにより、平均符号帳を短くすることができる。
また、周波数領域ピッチ周期Tが換算間隔T1そのものである場合の可変長符号の符号長、周波数領域ピッチ周期Tが換算間隔T1の整数倍U×T1である場合の可変長符号の符号長、周波数領域ピッチ周期Tが換算間隔T1の近傍である場合の可変長符号の符号長、および、周波数領域ピッチ周期Tが換算間隔T1の整数倍U×T1の近傍である場合の可変長符号の符号長が、いずれも、それ以外の場合の可変長符号の符号長よりも短い可変長符号帳(例2)を用いて、周波数領域ピッチ周期符号を決定してもよい。この場合の周波数領域ピッチ周期符号は、周波数領域ピッチ周期Tが換算間隔T1そのものである場合、換算間隔T1の整数倍である場合、換算間隔T1の近傍である場合、換算間隔T1の整数倍の近傍である場合、の符号長のほうが、それ以外の場合の符号長よりも短い。周波数領域ピッチ周期Tが換算間隔T1そのものである場合、換算間隔T1の整数倍である場合、換算間隔T1の近傍である場合、換算間隔T1の整数倍の近傍である場合、はそれ以外の場合よりも周波数領域ピッチ周期として選択される頻度が高くなる性質があるので、それらに対応する符号長を、それ以外の場合の符号長よりも短くすることで平均符号長を短くすることができる。
また、周波数領域ピッチ周期Tが換算間隔T1そのものである場合の可変長符号の符号長のほうが、周波数領域ピッチ周期Tが換算間隔T1の整数倍U×T1である場合の可変長符号の符号長よりも短い可変長符号帳(例3)を用いて、周波数領域ピッチ周期符号を決定してもよい。この場合の周波数領域ピッチ周期符号は、周波数領域ピッチ周期Tが換算間隔T1そのものである場合、の符号長のほうが、換算間隔T1の近傍である場合の符号長よりも短い。
また、周波数領域ピッチ周期Tが換算間隔T1の整数倍U×T1である場合の可変長符号の符号長のほうが、周波数領域ピッチ周期Tが換算間隔T1の整数倍U×T1の近傍であるである場合の可変長符号の符号長よりも短い可変長符号帳(例4)を用いても良い。この場合の第1周波数領域ピッチ周期符号は、第1周波数領域ピッチ周期Tが換算間隔T1の整数倍である場合、の符号長のほうが、換算間隔T1の整数倍の近傍である場合の符号長よりも短い。
また、前述のように、過去のフレームの情報を用いることができない場合または用いない場合、周波数領域ピッチ周期Tの換算間隔T1に対する乗数m*nが小さいものほど、周波数領域ピッチ周期Tとして決定されやすい傾向にある。このことを反映し、図13のように、少なくとも、周波数領域ピッチ周期Tが換算間隔T1の整数倍の値V×T1である場合の可変長符号の符号長が、当該整数値Vの大きさに対して単調非減少の関係となるように可変長符号が割り当てられた可変長符号帳(例5)を用いて周波数領域ピッチ周期符号を決定してもよい。この場合、少なくとも、上記周波数領域ピッチ周期Tが換算間隔T1の整数倍の値V×T1である場合の周波数領域ピッチ周期符号の符号長は、整数Vの大きさに対して単調非減少の関係になる。
また、上述の例1,3の特徴を兼ね備えた可変長符号帳(例6)を用いてもよく、例2,3の特徴を兼ね備えた可変長符号帳(例7)を用いてもよく、例2,4の特徴を兼ね備えた可変長符号帳(例8)を用いてもよく、例2,3,4の特徴を兼ね備えた可変長符号帳(例9)を用いてもよく、例1〜9の何れかと例5との特徴を兼ね備えた可変長符号帳(例10)を用いてもよい。
周波数領域ピッチ周期分析部115’’は、予め定めた並べ替え規則に従って選択されるサンプル群へのエネルギーの集中度を示す指標値と換算間隔T1との関係を示す符号の長さを考慮して周波数領域ピッチ周期Tを決定する。例えば集中度の指標が同じであれば、換算間隔T1との関係を示す符号の長さが短いほうを選択する。あるいはcを適切にあらかじめ設定した定数(重み)として
変形した集中度指標=集中度の指標−c*(換算間隔T1との関係を示す符号の長さ)
とし、変形した集中度指標が最大となる周波数領域ピッチ周期Tを決定する。
[第2実施形態]
[符号化装置21]
本実施形態の符号化装置21が第1実施形態の符号化装置11と異なるのは、周波数領域ピッチ周期分析部115に替えて周波数領域ピッチ周期分析部215を備える点である。本実施形態では、周波数領域ピッチ周期分析部215が、長期予測選択情報が長期予測を実行することを示す場合には、換算間隔T1および換算間隔T1の整数倍の値U×T1の中から中間候補値を決定し、中間候補値および中間候補値の近傍の予め定めた第3の範囲の値の中から周波数領域ピッチ周期Tを決定して出力する。周波数領域ピッチ周期分析部215は、長期予測選択情報が長期予測を実行しないことを示す場合には、第1実施形態と同様に、予め定めた第2の範囲の整数値を候補値として周波数領域ピッチ周期Tを決定して出力する。以下、第1実施形態と異なる点について説明する。
「周波数領域ピッチ周期分析部215」
周波数領域ピッチ周期分析部215は、長期予測選択情報が長期予測を実行することを示す場合には、まず、換算間隔T1および換算間隔T1の整数倍の値U×T1を候補値として、中間候補値を決定する。次に周波数領域ピッチ周期分析部215は、中間候補値および中間候補値の近傍の予め定めた第3の範囲の値を候補値として、周波数領域ピッチ周期Tを決定し周波数領域ピッチ周期Tを出力する。さらに、周波数領域ピッチ周期分析部215は、中間候補値が換算間隔T1の何倍であるかを示す情報と、周波数領域ピッチ周期Tと中間候補値との差を示す情報と、を周波数領域ピッチ周期符号として出力する。
例えば、予め定めた第1の範囲の整数が2以上8以下である場合は、換算間隔T1、換算間隔T1の2倍〜8倍の2T1、3T1、4T1、5T1、6T1、7T1、8T1の計8個の値が中間候補値の候補であり、これらの候補の中から中間候補値Tcandが選択される。この場合は、中間候補値が換算間隔T1の何倍であるかを示す情報は、少なくとも3ビットの、1以上8以下の整数それぞれと一対一に対応する符号である。
また、例えば予め定めた第3の範囲が-3以上4以下の整数である場合は、Tcand-3、Tcand-2、Tcand-1、Tcand、Tcand+1、Tcand+2、Tcand+3、Tcand+4の計8個の値が周波数領域ピッチ周期Tの候補であり、これらの候補の中から周波数領域ピッチ周期Tが選択される。この場合は、周波数領域ピッチ周期Tと中間候補値との差を示す情報は、少なくとも3ビットの、-3以上4以下の整数それぞれと一対一に対応する符号である。
なお、予め定めた第3の範囲の値は、整数値であっても小数値であってもよい。また、第1実施形態の変形例と同様に、換算間隔T1および換算間隔T1の整数倍の値U×T1に加えて、換算間隔T1の整数倍の値U×T1以外の倍数値も候補値として、中間候補値を決定してもよい。すなわち、換算間隔T1および換算間隔T1の整数倍の値U×T1を含む候補値の中から中間候補値を決定してもよい。
[復号装置22]
本実施形態の復号装置22が第1実施形態の復号装置12と異なるのは、周期換算部122に替えて周期換算部222を備える点である。本実施形態では、周期換算部222が、長期予測選択情報が長期予測を実行することを示す場合には、周波数領域ピッチ周期符号を復号して、中間候補値が換算間隔T1の何倍であるかの整数値と、周波数領域ピッチ周期Tと中間候補値との差の値と、を得て、換算間隔T1に整数値を乗算して得られる値に上記の差の値を加算したものを周波数領域ピッチ周期Tとして得て出力する。周期換算部222は、長期予測選択情報が長期予測を実行しないことを示す場合には、周波数領域ピッチ周期符号を復号して周波数領域ピッチ周期Tを得て出力する。
[第3実施形態]
[符号化装置31]
本実施形態の符号化装置31が第1実施形態、第1実施形態の変形例、および第2実施形態の符号化装置11,11’,21と異なるのは、周波数領域ピッチ周期分析部115,115’,215に替えて周波数領域ピッチ周期分析部315を備える点である。本実施形態では、周波数領域ピッチ周期分析部315は、「長期予測選択情報が長期予測を実行することを示す場合」に替えて「量子化済みピッチ利得gp^が予め定めた値以上である場合」、「長期予測選択情報が長期予測を実行しないことを示す場合」に替えて「量子化済みピッチ利得gp^が予め定めた値より小さい場合」、として処理を行う。これ以外は、第1実施形態および第2実施形態と同様である。なお、本実施形態は、第1実施形態のうち、符号化装置31が量子化済みピッチ利得gp^およびピッチ利得符号Cgpを得る構成が前提となる。
[復号装置32]
本実施形態の復号装置32が第1実施形態および第2実施形態の復号装置12,12’,22と異なるのは、周期換算部122,122’,222に替えて周期換算部322を備える点である。本実施形態では、周期換算部322は、「長期予測選択情報が長期予測を実行することを示す場合」に替えて「量子化済みピッチ利得gp^が予め定めた値以上である場合」、「長期予測選択情報が長期予測を実行しないことを示す場合」に替えて「量子化済みピッチ利得gp^が予め定めた値より小さい場合」、として処理を行う。これ以外は、第1実施形態および第2実施形態と同様である。なお、本実施形態は、第1実施形態のうち、復号装置32にピッチ利得符号Cgpが入力され量子化済みピッチ利得gp^を得る構成、が前提となる。
[第4実施形態]
[符号化装置41]
本実施形態の符号化装置41が第1実施形態、第1実施形態の変形例、および第2実施形態の符号化装置11,11’,21と異なるのは、長期予測分析部111、長期予測残差生成部112、周波数領域変換部113a、周期換算部114、周波数領域ピッチ周期分析部115,115’,215のそれぞれに替えて、長期予測分析部411、長期予測残差生成部412 、周波数領域変換部413a、周期換算部414、周波数領域ピッチ周期分析部415を備える点である。
本実施形態の長期予測分析部411では、ピッチ利得gpの値に関わらず長期予測を実行する。より具体的には、長期予測分析部411は、ピッチ利得gpの値に関わらず、長期予測分析部111の「長期予測選択情報が長期予測を実行することを示す場合」の処理を行う。従って、長期予測分析部411が、ピッチ利得gpが予め定めた値以上であるか否かによる長期予測の実行の有無の判断を行う必要は無く、長期予測選択情報を出力する必要も無い。
以降、長期予測残差生成部412、周波数領域変換部413a、周期換算部414、周波数領域ピッチ周期分析部415のそれぞれは、長期予測残差生成部112、周波数領域変換部113a、周期換算部114、周波数領域ピッチ周期分析部115,115’,215の「長期予測分析部111が出力した長期予測選択情報が長期予測を実行することを示す場合」に対応する処理を実施する。
[復号装置42]
本実施形態の復号装置42が第1実施形態および第2実施形態の復号装置12,12’,22と異なるのは、復号部123a、長期予測情報復号部121、周期換算部122,122’,222、時間領域変換部124c、長期予測合成部125のそれぞれに替えて、復号部423a、長期予測情報復号部421、周期換算部422、時間領域変換部424c、長期予測合成部425を備える点である。本実施形態は、長期予測選択情報や量子化済みピッチ利得gp^の値に関わらず長期予測合成を行う。従って、本実施形態の復号装置42には、長期予測選択情報は入力される必要は無い。
本実施形態の復号部423a、長期予測情報復号部421、周期換算部422、時間領域変換部424c、長期予測合成部425のそれぞれは、復号部123a、長期予測情報復号部121、周期換算部122,122’,222、時間領域変換部124c、長期予測合成部125の「長期予測選択情報が長期予測を実行することを示す場合」に対応する処理を実施する。
[その他]
上記の各実施形態の符号化装置11,11’,21,31,41では、周波数領域変換部113a,413aと重み付け包絡正規化部113bと正規化利得計算部113cと量子化部113dを備えて、量子化部113dで得られたフレーム単位の量子化MDCT係数列を周波数領域ピッチ周期分析部115,115’,215,315,415の入力とした。しかしながら、符号化装置11,11’,21,31,41が、周波数領域変換部113a,413aと重み付け包絡正規化部113bと正規化利得計算部113cと量子化部113d以外の処理部を備えたり、一部の処理部を省略した処理を行ってもよい。すなわち、符号化装置11,11’,21,31,41は、一例として周波数領域変換部113a,413aと重み付け包絡正規化部113bと正規化利得計算部113cと量子化部113dとにより構成される、周波数領域サンプル列生成部113を備えていることになる。符号化装置11,11’,21,31,41が備える周波数領域サンプル列生成部113は、長期予測を実行する場合には上記長期予測残差信号に由来する周波数領域のサンプル列を得る処理を行い、長期予測を実行しない場合には上記音響信号に由来する周波数領域のサンプル列を得る処理を行う。周波数領域サンプル列生成部113が得たサンプル列は周波数領域ピッチ周期分析部115,115’,215,315,415に入力される。
復号装置12,12’,22,32,42についても同様であり、復号装置12,12’,22,32,42は、一例として利得乗算部124aと重み付け包絡逆正規化部124bと時間領域変換部124c,424cとにより構成される、時間領域信号列生成部124を備えていることになる。復号装置12,12’,22,32,42が備える時間領域信号列生成部124は、復号部123a,423aまたは回復部123bから入力された周波数領域のサンプル列に由来する時間領域の信号列を得る処理を行う。長期予測情報復号部121,421が出力した長期予測選択情報が長期予測を実行することを示す場合には、時間領域信号列生成部124が得た信号列は、長期予測残差信号列xp(1),...,xp(Nt)として長期予測合成部125,425に入力される。長期予測情報復号部121,421が出力した長期予測選択情報が長期予測を実行しないことを示す場合には、時間領域信号列生成部124が得た信号列は、ディジタル音響信号列x(1),...,x(Nt)として復号装置12,12’,22,32,42から出力される。
[第5実施形態]
[符号化装置51]
図8に示すように、本実施形態の符号化装置51が第1実施形態、第1実施形態の変形例、第2実施形態、第3実施形態および第4実施形態の符号化装置11,11’,21,31,41と異なるのは、符号化装置51が周波数領域ピッチ周期考慮符号化部116を含まない点である。この場合は、符号化装置51は、周波数領域ピッチ周期を特定するための符号を得る符号化装置として機能する。符号化装置51から出力された周波数領域のサンプル列も符号化する場合は、符号化装置51から出力された周波数領域のサンプル列は、例えば、符号化装置51の外部の周波数領域ピッチ周期考慮符号化部116に入力されて符号化されるが、その他の符号化手段を用いて符号化してもよい。その他は、第1実施形態、第1実施形態の変形例、第2実施形態、第3実施形態および第4実施形態の符号化装置11,11’,21,31,41と同じである。
[復号装置52]
図9に示すように、本実施形態の復号装置52が第1実施形態、第1実施形態の変形例、第2実施形態、第3実施形態および第4実施形態の復号装置12,12’,22,32,42と異なるのは、復号装置52が周波数領域ピッチ周期考慮復号部123、時間領域信号列生成部124、および長期予測合成部125を含まない点である。この場合は、復号装置52は、符号列に含まれる少なくとも周波数領域ピッチ周期符号と時間領域ピッチ周期符号とから、少なくとも長期予測周波数領域ピッチ周期Tと時間領域のピッチ周期Lとを得る復号装置として機能する。例えば、復号装置52から出力された時間領域のピッチ周期Lおよび量子化済みピッチ利得gp^は、長期予測合成部125の入力となる。また、例えば、符号列、復号装置52から出力された周波数領域ピッチ周期T、(および、補助情報が入力された場合には補助情報)は、周波数領域ピッチ周期考慮復号部123の入力となる。その他は、第1実施形態、第1実施形態の変形例、第2実施形態、第3実施形態および第4実施形態の復号装置12,12’,22,32,42と同じである。
[第6実施形態]
図10および図11に示すように、本実施形態の符号化装置61および復号装置62が第1実施形態、第1実施形態の変形例、第2実施形態、第3実施形態および第4実施形態と異なるのは、周波数領域ピッチ周期考慮符号化部116に替えて周波数領域ピッチ周期考慮符号化部616が構成され、周波数領域ピッチ周期考慮復号部123に替えて周波数領域ピッチ周期考慮復号部623が構成される点である。周波数領域のサンプル列は、周波数領域ピッチ周期考慮符号化部616の入力となる。符号列、周波数領域ピッチ周期Tおよび補助情報は、周波数領域ピッチ周期考慮復号部623の入力となる。以下では、周波数領域ピッチ周期考慮符号化部616および周波数領域ピッチ周期考慮復号部623のみを説明する。
「周波数領域ピッチ周期考慮符号化部616」
周波数領域ピッチ周期考慮符号化部616は、符号化部616bを備え、周波数領域ピッチ周期Tに基づく符号化方法で、入力された周波数領域のサンプル列を符号化し、それによって得られた符号列を出力する。
「符号化部616b」
符号化部616bは、周波数領域のサンプル列のうちの周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周波数領域のサンプル列のうちの周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルによるサンプル群G1と、周波数領域のサンプル列のうちのサンプル群G1に含まれないサンプルによるサンプル群G2と、を異なる基準に従って(区別して)符号化し、それによって得られた符号列を出力する。
[サンプル群G1,G2の具体例]
「周波数領域のサンプル列のうちの周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周波数領域のサンプル列のうちの周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプル」の具体例は第1実施形態と同じであり、このようなサンプルによる群がサンプル群G1である。第1実施形態で説明したように、このようなサンプル群G1の設定方法には様々な選択肢がある。例えば、符号化部616bに入力されたサンプル列のうち、周波数領域ピッチ周期Tの整数倍に対応するサンプルF(nT)の前後のサンプルF(nT-1),F(nT+1)を含めた3個のサンプルF(nT-1),F(nT),F(nT+1)によるサンプル群の集合がサンプル群G1の例である。例えば、nが1から5までの各整数を表す場合、第1のサンプル群F(T-1),F(T),F(T+1)、第2のサンプル群F(2T-1),F(2T),F(2T+1)、第3のサンプル群F(3T-1),F(3T),F(3T+1)、第4のサンプル群F(4T-1),F(4T),F(4T+1)、第5のサンプル群F(5T-1),F(5T),F(5T+1)からなる群がサンプル群G1である。
符号化部616bに入力されたサンプル列のうちサンプル群G1に含まれないサンプルからなる群がサンプル群G2である。例えば、nが1から5までの各整数を表す場合、第1のサンプルセットF(1),…,F(T-2)、第2のサンプルセットF(T+2),…,F(2T-2)、第3のサンプルセットF(2T+2),…,F(3T-2)、第4のサンプルセットF(3T+2),…,F(4T-2)、第5のサンプルセットF(4T+2),…,F(5T-2)、第6のサンプルセットF(5T+2),…F(jmax)からなる群がサンプル群G2の例である。
その他、第1実施形態で例示したように、周波数領域ピッチ周期Tが小数である場合、例えば、F(R(nT-1)),F(R(nT)),F(R(nT+1))によるサンプル群の集合がサンプル群G1であってもよい。ただし、R(nT)はnTを四捨五入した値である。また、サンプル群G1を構成する各サンプル群に含まれるサンプルの個数やサンプルインデックスを可変としてもよいし、サンプル群G1を構成する各サンプル群に含まれるサンプルの個数とサンプルインデックスの組み合わせが異なる複数の選択肢の中から選択された一つを表す情報が補助情報(第1補助情報)として出力されてもよい。
[異なる基準に従った符号化の例]
符号化部616bは、サンプル群G1,G2に含まれるサンプルの並び替えを行うことなく、サンプル群G1とサンプル群G2とを互いに異なる基準に従って符号化し、それによって得られた符号列を出力する。
サンプル群G1に含まれるサンプルはサンプル群G2に含まれるサンプルよりも平均的に振幅が大きい。このとき、例えば、サンプル群G1に含まれるサンプルの振幅の大きさまたはその推定値に対応する基準に従ってサンプル群G1に含まれるサンプルを可変長符号化し、サンプル群G2に含まれるサンプルの振幅の大きさまたはその推定値に対応する基準に従ってサンプル群G2に含まれるサンプルを可変長符号化する。このような構成とすることで、サンプル列に含まれる全てのサンプルを同じ基準に従って可変長符号化する場合よりも、サンプルの振幅の推定精度をあげることができるので、可変長符号の平均符号量を少なくすることできる。すなわち、サンプル群G1とサンプル群G2とを互いに異なる基準に従って符号化すれば、並び替え操作なしでも、サンプル列の符号量を少なくする効果が得られる。振幅の大きさの例は、振幅の絶対値、振幅のエネルギーなどである。
[ライス符号化の例]
可変長符号化として1サンプルごとのライス符号化を用いる例を説明する。
この場合、符号化部616bは、サンプル群G1に含まれるサンプルの振幅の大きさまたはその推定値に対応するライスパラメータを用いてサンプル群G1に含まれるサンプルを1サンプルごとにライス符号化する。また符号化部616bは、サンプル群G2に含まれるサンプルの振幅の大きさまたはその推定値に対応するライスパラメータを用いてサンプル群G2に含まれるサンプルを1サンプルごとにライス符号化する。符号化部616bは、ライス符号化によって得られた符号列と、ライスパラメータを特定するための補助情報とを出力する。
例えば、符号化部616bは、各フレームでサンプル群G1に含まれるサンプルの振幅の大きさの平均から、当該フレームでのサンプル群G1のライスパラメータを求める。例えば、符号化部616bは、各フレームでサンプル群G2に含まれるサンプルの振幅の大きさの平均から、当該フレームでのサンプル群G2のライスパラメータを求める。ライスパラメータは0以上の整数である。符号化部616bは、各フレームで、サンプル群G1のライスパラメータを用いてサンプル群G1に含まれるサンプルをライス符号化し、サンプル群G2のライスパラメータを用いてサンプル群G2に含まれるサンプルをライス符号化する。これによって平均符号量を削減できる。以下にこのことを詳細に説明する。
まず、サンプル群G1に含まれるサンプルを1サンプルごとにライス符号化する場合を例にとる。
サンプル群G1に含まれるサンプルX(k)を1サンプルごとにライス符号化して得られる符号は、サンプル群G1のライスパラメータsに対応する値でサンプルX(k)を除算して得られる商q(k)をアルファ符号化したprefix(k)と、その剰余を特定するsub(k)とを含む。すなわち、この例でのサンプルX(k)に対応する符号はprefix(k)とsub(k)とを含む。なお、ライス符号化対象となるサンプルX(k)は整数表現されたものである。
以下にq(k)およびsub(k)の算出方法を例示する。
ライスパラメータs>0の場合、以下のように商q(k)が生成される。ただし、floor(χ)はχ以下の最大の整数である。
q(k)=floor(X(k)/2s-1) (for X(k)≧0) …(B1)
q(k)=floor{(-X(k)-1)/2s-1} (for X(k)<0) …(B2)
ライスパラメータs=0の場合、以下のように商q(k)が生成される。
q(k)=2*X(k) (for X(k)≧0) …(B3)
q(k)=-2*X(k)-1 (for X(k)<0) …(B4)
ライスパラメータs>0の場合、以下のようにsub(k)が生成される。
sub(k)=X(k)-2s−1*q(k)+2s-1 (for X(k)≧0) …(B5)
sub(k)=(-X(k)-1)-2s-1*q(k) (for X(k)<0) …(B6)
ライスパラメータs=0の場合、sub(k)はnullである(sub(k)=null)。
式(B1)〜(B4)を共通化して商q(k)を表現すると以下ようになる。ただし、|・|は・の絶対値を示す。
q(k)=floor{(2*|X(k)|-z)/2s} (z=0 or 1 or 2) …(B7)
ライス符号化の場合、prefix(k)は商q(k)をアルファ符号化した符号であり、その符号量は、式(B7)を用いて以下のように表現できる。
floor{(2*|X(k)|-z)/2s}+1 …(B8)
ライス符号化の場合、式(B5)(B6)の剰余を特定するsub(k)はsビットで表現される。よって、サンプル群G1に含まれるサンプルX(k)に対応する符号(prefix(k)およびsub(k))の総符号量C(s,X(k),G1)は、以下のようになる。
Figure 2013176177
ここでfloor{(2*|X(k)|-z)/2s}=(2*|X(k)|-z)/2sと近似すると、式(B9)は以下のように近似できる。ただし、|G1|は、1フレームでのサンプル群G1に含まれるサンプルX(k)の個数を表す。
Figure 2013176177
式(B10)のsについての偏微分結果を0にするsをs’と表現する。
s’=log2{ln2*(2*D/|G1|-z)} …(B11)
D/|G1|がzよりも十分大きいならば、式(B11)は以下のように近似できる。
s’=log2{ln2*(2・D/|G1|)} …(B12)
式(B12)で得られるs’は整数化されていないため、s’を整数に量子化した値をライスパラメータsとする。このライスパラメータsは、サンプル群G1に含まれるサンプルの振幅の大きさの平均D/|G1|に対応し(式(B12)参照)、サンプル群G1に含まれるサンプルX(k)に対応する符号の総符号量を最小化する。
以上のことは、サンプル群G2に含まれるサンプルをライス符号化する場合についても同様である。従って、各フレームで、サンプル群G1に含まれるサンプルの振幅の大きさの平均からサンプル群G1のためのライスパラメータを求め、サンプル群G2に含まれるサンプルの振幅の大きさの平均からサンプル群G2のためのライスパラメータを求め、サンプル群G1とサンプル群G2とを区別してライス符号化を行うことで、総符号量を最小化できる。
なお、近似された式(B10)による総符号量C(s,X(k),G1)の評価は、サンプルX(k)の振幅の大きさの変動が小さいほど適切なものとなる。そのため、特にサンプル群G1に含まれるサンプルの振幅の大きさがほぼ均等であり、なおかつ、サンプル群G2に含まれるサンプルの振幅の大きさがほぼ均等である場合に、より大きな符号量削減効果が得られる。
[ライスパラメータを特定するための補助情報の例1]
サンプル群G1に対応するライスパラメータとサンプル群G2に対応するライスパラメータとを区別して扱う場合、復号側では、サンプル群G1に対応するライスパラメータを特定するための補助情報(第3補助情報)と、サンプル群G2に対応するライスパラメータを特定するための補助情報(第4補助情報)とが必要となる。そのため、符号化部616bは、サンプル列を1サンプルごとにライス符号化して得られた符号からなる符号列に加え、第3補助情報および第4補助情報を出力してもよい。
[ライスパラメータを特定するための補助情報の例2]
音響信号が符号化対象である場合、サンプル群G1に含まれるサンプルの振幅の大きさの平均はサンプル群G2に含まれるサンプルの振幅の大きさの平均よりも大きく、サンプル群G1に対応するライスパラメータがサンプル群G2に対応するライスパラメータよりも大きい。このことを利用してライスパラメータを特定するための補助情報の符号量を削減することもできる。
例えば、サンプル群G1に対応するライスパラメータがサンプル群G2に対応するライスパラメータよりも固定的に固定値(例えば1)だけ大きいと定める。すなわち、固定的に「サンプル群G1に対応するライスパラメータ=サンプル群G2に対応するライスパラメータ+固定値」の関係を満たすとする。この場合、符号化部616bは、符号列に加え、第3補助情報または第4補助情報の何れか一方のみを出力すればよい。
[ライスパラメータを特定するための補助情報の例3]
単独でサンプル群G1に対応するライスパラメータを特定できる情報を第5補助情報とし、サンプル群G1に対応するライスパラメータとサンプル群G2に対応するライスパラメータとの差分を特定できる情報を第6補助情報としてもよい。逆に、単独でサンプル群G2に対応するライスパラメータを特定できる情報を第6補助情報とし、サンプル群G1に対応するライスパラメータとサンプル群G2に対応するライスパラメータとの差分を特定できる情報を第5補助情報としてもよい。なお、サンプル群G1に対応するライスパラメータがサンプル群G2に対応するライスパラメータよりも大きいことが分かっているため、サンプル群G1に対応するライスパラメータとサンプル群G2に対応するライスパラメータとの大小関係を表す補助情報(正負を表す情報など)は不要である。
[ライスパラメータを特定するための補助情報の例4]
フレーム全体に割り当てられる符号ビット数が定められている場合には、ステップS113cで求められる利得の値もかなり制約され、サンプルの振幅のとり得る範囲も大きく制約される。この場合、フレーム全体に割り当てられる符号ビット数からサンプルの振幅の大きさの平均を或る程度の精度で推定できる。符号化部616bは、当該サンプルの振幅の大きさの平均の推定値から推定されるライスパラメータを用いてライス符号化を行ってもよい。
例えば、符号化部616bは、当該推定されるライスパラメータに第1差分値(例えば1)を加えたものをサンプル群G1に対応するライスパラメータとして用い、当該推定されるライスパラメータをサンプル群G2に対応するライスパラメータとして用いてもよい。あるいは、符号化部616bは、当該推定されるライスパラメータをサンプル群G1に対応するライスパラメータとして用い、当該推定されるライスパラメータから第2差分値(例えば1)を減じたものをサンプル群G2に対応するライスパラメータとして用いてもよい。
これらの場合の符号化部616bは、例えば、符号列に加え、第1差分値を特定するための補助情報(第7補助情報)または第2差分値を特定するための補助情報(第8補助情報)を出力すればよい。
[ライスパラメータを特定するための補助情報の例5]
サンプル群G1に含まれるサンプルの振幅の大きさが均等ではない場合や、サンプル群G2に含まれるサンプルの振幅の大きさが均等ではない場合であっても、サンプル列X(1),...,X(N)の振幅の包絡情報をたよりに、符号量削減効果がより大きなライスパラメータを推定することもできる。たとえば、サンプルの振幅の大きさが高域ほど大きい場合には、サンプル群G1に含まれるサンプルのうち高域側のサンプルに対応するライスパラメータを固定的に増加させ、サンプル群G2に含まれるサンプルのうち高域側のサンプルに対応するライスパラメータを固定的に増加させることで、符号量をより削減できる。以下に具体例を示す。
Figure 2013176177
ただし、s1およびs2は、[ライスパラメータを特定するための補助情報の例1〜4]で例示した、サンプル群G1およびG2にそれぞれ対応するライスパラメータである。const.1からconst.10は、予め定められた正整数である。この例の場合、符号化部616bは、符号列およびライスパラメータの例2,3で例示した補助情報に加え、包絡情報を特定する補助情報(第9補助情報)を出力すればよい。包絡情報が復号側に既知である場合には、符号化部616bは、第7補助情報を出力しなくてもよい。
「周波数領域ピッチ周期考慮復号部623」
周波数領域ピッチ周期考慮復号部623は、復号部623aを備え、周波数領域ピッチ周期Tに基づく復号方法で符号列を復号して周波数領域のサンプル列を得て出力する。
「復号部623a」
復号部623aは、周波数領域のサンプル列を、周波数領域のサンプル列のうちの周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周波数領域のサンプル列のうちの周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルによるサンプル群G1と、周波数領域のサンプル列のうちのサンプル群G1に含まれないサンプルによるサンプル群G2と、を異なる基準に従った(区別された)復号処理により符号列を復号することにより得て出力する。
[符号群C1,C2とサンプル群G1,G2の具体例]
復号部623aは、入力された周波数領域ピッチ周期Tによって(第1補助情報が入力される場合には周波数領域ピッチ周期Tと第1補助情報とによって)、フレームごとに、入力された符号列に含まれる符号群C1およびC2、およびそれぞれの符号群が対応するサンプル群G1およびG2に含まれるサンプル番号を特定し、符号群C1およびC2を復号して得られるサンプル値群を各符号が対応するサンプル番号に割り当てることでサンプル群G1およびG2を得ることにより周波数領域のサンプル列を得る。符号群C1は、符号列のうちサンプル群G1に含まれるサンプルに対応する符号からなり、符号群C2は、符号列のうちサンプル群G2に含まれるサンプルに対応する符号からなる。復号部623aでの符号群C1およびC2の特定方法は、符号化部616bでのサンプル群G1およびG2の設定方法に対応し、例えば、前述のサンプル群G1およびG2の設定方法での「サンプル」を「符号」に、「F(j)」を「C(j)」に、「サンプル群G1」を「符号群C1」に、「サンプル群G2」を「符号群C2」に置換したものである。ただし、C(j)はサンプルF(j)に対応する符号である。
例えば、符号化部616bに入力されたサンプル列のうち、周波数領域ピッチ周期Tの整数倍に対応するサンプルF(nT)の前後のサンプルF(nT-1),F(nT+1)を含めた3個のサンプルF(nT-1),F(nT),F(nT+1)による群がサンプル群G1とされていた場合、復号部623aは、入力された符号列C(1),…,C(jmax)のうち、周波数領域ピッチ周期Tの整数倍に対応するサンプル番号nTの前後のサンプル番号nT-1, nT+1を含めた3個のサンプル番号に対応する符号C(nT-1),C(nT),C(nT+1)による群を符号群C1とし、符号群C1に含まれない符号からなる群を符号群C2とし、符号群C1に含まれる符号C(nT-1),C(nT),C(nT+1)をそれぞれ復号してサンプル番号nT-1のサンプルF(nT-1)、サンプル番号nTのサンプルF(nT) 、サンプル番号nT+1のサンプルF(nT+1)を得、符号群C2に含まれる符号を復号してサンプル番号nT-1, nT, nT+1以外のサンプル番号のサンプルを得る。例えば、nが1から5までの各整数を表す場合、第1の符号群C(T-1),C(T),C(T+1)、第2の符号群C(2T-1),C(2T),C(2T+1)、第3の符号群C(3T-1),C(3T),C(3T+1)、第4の符号群C(4T-1),C(4T),C(4T+1)、第5の符号群C(5T-1),C(5T),C(5T+1)からなる群が符号群C1であり、第1の符号セットC(1),…,C(T-2)、第2の符号セットC(T+2),…,C(2T-2)、第3の符号セットC(2T+2),…,C(3T-2)、第4の符号セットC(3T+2),…,C(4T-2)、第5の符号セットC(4T+2),…,C(5T-2)、第6の符号セットC(5T+2),…C(jmax)からなる群が符号群C2であり、これらの符号群と符号セットをそれぞれ復号して、第1のサンプル群F(T-1),F(T),F(T+1)、第2のサンプル群F(2T-1),F(2T),F(2T+1)、第3のサンプル群F(3T-1),F(3T),F(3T+1)、第4のサンプル群F(4T-1),F(4T),F(4T+1)、第5のサンプル群F(5T-1),F(5T),F(5T+1)、第1のサンプルセットF(1),…,F(T-2)、第2のサンプルセットF(T+2),…,F(2T-2)、第3のサンプルセットF(2T+2),…,F(3T-2)、第4のサンプルセットF(3T+2),…,F(4T-2)、第5のサンプルセットF(4T+2),…,F(5T-2)、第6のサンプルセットF(5T+2),…F(jmax)を得ることにより、周波数領域のサンプル列を得る。
[異なる基準に従った復号の例]
復号部623aは、符号群C1と符号群C2とを互いに異なる基準に従って復号し、それによって周波数領域のサンプル列を得て出力する。例えば、復号部623aは、符号群C1に対応するサンプル群G1に含まれるサンプルの振幅の大きさまたはその推定値に対応する基準に従って符号群C1に含まれる符号を復号し、符号群C2に対応するサンプル群G2に含まれるサンプルの振幅の大きさまたはその推定値に対応する基準に従って符号群C2に含まれる符号を復号する。
[ライス符号化の例]
1サンプルごとのライス符号化によって符号列が得られている場合を例示する。
この場合、復号部623aは、フレームごとに、入力された補助情報(第1〜9補助情報の少なくとも一部)から特定される、サンプル群G1に対応するライスパラメータを符号群C1に対応するライスパラメータとし、サンプル群G2に対応するライスパラメータを符号群C2に対応するライスパラメータとする。以下に前述の[ライスパラメータを特定するための補助情報の例1〜5]に対応するライスパラメータの特定方法を例示する。
[ライスパラメータを特定するための補助情報の例1の場合]
例えば、第3補助情報および第4補助情報が入力された復号部623aは、第3補助情報からサンプル群G1に対応するライスパラメータを特定し、それを符号群C1に対応するライスパラメータとし、第4補助情報からサンプル群G2に対応するライスパラメータを特定し、それを符号群C2に対応するライスパラメータとする。
[ライスパラメータを特定するための補助情報の例2の場合]
例えば、符号列の他に第4補助情報のみが入力された復号部623aは、第4補助情報から符号群C2に対応するライスパラメータを特定し、符号群C2に対応するライスパラメータに固定値(例えば1)を加えたものを符号群C1に対応するライスパラメータとする。或いは、符号列の他に第3補助情報のみが入力された復号部623aは、第3補助情報から符号群C1に対応するライスパラメータを特定し、符号群C1に対応するライスパラメータから固定値(例えば1)を減じたものを符号群C2に対応するライスパラメータとする。
[ライスパラメータを特定するための補助情報の例3の場合]
例えば、ライスパラメータを特定する第5補助情報および差分を特定する第6補助情報が入力された復号部623aは、第5補助情報からサンプル群G1に対応するライスパラメータを特定し、それを符号群C1に対応するライスパラメータとする。さらに、符号群C1に対応するライスパラメータから、第6補助情報から特定した差分を減じた値を符号群C2に対応するライスパラメータとする。
例えば、差分を特定する第5補助情報およびライスパラメータを特定する第6補助情報が入力された復号部623aは、第6補助情報からサンプル群G1に対応するライスパラメータを特定し、それを符号群C1に対応するライスパラメータとする。さらに、符号群C2に対応するライスパラメータに第5補助情報から特定した差分を加算した値を符号群C1に対応するライスパラメータとする。
[ライスパラメータを特定するための補助情報の例4の場合]
例えば、第7補助情報が入力された復号部623aは、フレーム全体に割り当てられる符号ビット数から推定されるライスパラメータを符号群C2に対応するライスパラメータとし、これに第7補助情報から特定される第1差分値を加算したものを符号群C1に対応するライスパラメータとする。
例えば、第8補助情報が入力された復号部623aは、フレーム全体に割り当てられる符号ビット数から推定されるライスパラメータを符号群C1に対応するライスパラメータとし、これから、第8補助情報から特定される第2差分値を減じたものを符号群C2に対応するライスパラメータとする。
[ライスパラメータを特定するための補助情報の例5の場合]
例えば、上述のライスパラメータを特定するための補助情報に加え、さらに第9補助情報が入力された復号部623aは、補助情報3〜8の少なくとも一部を用いてs1およびs2を特定し、第9補助情報に基づいてs1およびs2を前述の[表1]ように調整することで、符号群C1およびC2にそれぞれ対応するライスパラメータを得る。
第9補助情報が入力されない場合であっても、包絡情報が既知であって、符号化部616bがs1およびs2を前述の[表1]ように調整することでサンプル群G1およびG2にそれぞれ対応するライスパラメータを得ている場合には、復号部623aは、s1およびs2を前述の[表1]ように調整することで、符号群C1およびC2にそれぞれ対応するライスパラメータを得る。
上述のようにライスパラメータを得た復号部623aは、フレームごとに、符号群C1に対応するライスパラメータを用いて符号群C1に含まれる符号を復号し、符号群C2に対応するライスパラメータを用いて符号群C2に含まれる符号を復号し、それによって元のサンプルの並びを得て出力する。なお、ライス符号化に対応する復号処理は周知であるから説明を省略する。
[第7実施形態]
第6実施形態では、符号化装置61の内部に周波数領域ピッチ周期考慮符号化部616が構成され、復号装置62の内部に周波数領域ピッチ周期考慮復号部623が構成される例を示した。しかしながら、符号化装置61に周波数領域ピッチ周期考慮符号化部616を含まない構成とし、復号装置62に周波数領域ピッチ周期考慮復号部623を含まない構成としてもよい。これは、第1実施形態、第1実施形態の変形例、第2実施形態、第3実施形態、第4実施形態に対する第5実施形態と同じ構成の差異であるので、詳細な説明は省略する。
[第8実施形態]
[符号化装置81]
図14に示すように、本実施形態の符号化装置81が第5実施形態の符号化装置51と異なるのは、符号化装置81が長期予測分析部111と長期予測残差生成部112と周波数領域サンプル列生成部113とを含まない点である。この場合は、符号化装置81は、符号化装置81の外部から時間領域のピッチ周期Lと時間領域ピッチ周期符号Cと周波数領域サンプル列とが入力され、周波数領域サンプル列に対する周波数領域ピッチ周期を特定するための符号を得る符号化装置として機能する。
符号化装置81に入力される時間領域のピッチ周期Lと時間領域ピッチ周期符号Cは、例えば、長期予測分析部111にて計算されるが、その他の時間領域ピッチ周期算出手段を用いて算出してもよい。
また、符号化装置81に入力される周波数領域サンプル列は、入力ディジタル音響信号列を周波数領域のN点に変換したサンプル列に対応するサンプル列であり、例えば、符号化装置81の外部の周波数領域サンプル列生成部113において計算される量子化MDCT係数列であっても良いし、他の周波数領域サンプル列生成手段を用いて生成された周波数領域サンプル列であっても良い。
符号化装置81の周期換算部814には、時間領域のピッチ周期Lと周波数領域のサンプル点数Nとが入力され、換算間隔T1を求めて出力する。換算間隔T1を求める処理は、周期換算部114と同じである。なお、時間領域のピッチ周期Lの代わりに、時間領域のピッチ周期Lに対応する時間領域ピッチ周期符号Cが入力されてもよく、この場合は入力された時間領域ピッチ周期符号Cに対応する時間領域ピッチ周期Lを求め、時間領域ピッチ周期Lから換算間隔T1を求めて出力する。
周波数領域ピッチ周期分析部815には換算間隔T1と周波数領域サンプル列とが入力される。周波数領域ピッチ周期分析部815は、換算間隔T1と換算間隔T1の整数倍の値U×T1(ただし、Uは予め定めた第1の範囲の整数)を含む候補値から、周波数領域ピッチ周期を決定し、周波数領域ピッチ周期を特定するための符号を得て出力する。周波数領域ピッチ周期を決定する処理及び周波数領域ピッチ周期を特定するための符号を得る処理は、周波数領域ピッチ周期分析部115、115’、215、315、415の長期予測選択情報が長期予測を実行することを示す場合の処理と同じである。
また、周期換算部814と周波数領域ピッチ周期分析部815は、周期換算部114、414と周波数領域ピッチ周期分析部115、115’、215、315、415と同様に、長期予測選択情報が長期予測を実行することを示す場合と長期予測選択情報が長期予測を実行しないことを示す場合とで異なる処理を行う構成としても良い。この場合は、符号化装置81の外部の長期予測分析部111において、長期予測選択情報も符号化装置81に入力される。
[復号装置82]
図15に示すように、本実施形態の復号装置82が第5実施形態の復号装置52と異なるのは、復号装置82が長期予測情報復号部121を含まない点である。この場合は、復号装置82は、復号装置82の外部の長期予測情報復号部121により得た時間領域ピッチ周期Lと、入力される符号列に含まれる少なくとも周波数領域ピッチ周期符号と時間領域ピッチ周期符号とから、少なくとも周波数領域ピッチ周期Tを得る復号装置として機能する。例えば、符号列、復号装置52から出力された周波数領域ピッチ周期T、(および、補助情報が入力された場合には補助情報)は、周波数領域ピッチ周期考慮復号部123の入力となる。その他は、第5実施形態の復号装置52と同じである。
[第9実施形態]
[周波数領域ピッチ周期分析装置91]
また、第5実施形態、第7実施形態、第8実施形態では、符号化装置51、81で求めた周波数領域ピッチ周期Tを、外部の周波数領域ピッチ周期考慮符号化部116、616で周波数領域のサンプル列の符号化に用いることを前提とし、周波数領域ピッチ周期Tに対応する周波数領域ピッチ周期符号を出力していた。しかし、周波数領域ピッチ周期Tを、符号化以外の目的に使うことも可能であり、その場合、周波数領域ピッチ周期Tに対応する周波数領域ピッチ周期符号を出力しなくても良い。符号化以外の目的としては、例えば、音声や楽音の分析、複数の音声や楽音の分離、音声や楽音の認識などが考えられる。
図16に示すように、第9実施形態の周波数領域ピッチ周期分析装置91が、第5実施形態、第7実施形態、第8実施形態の符号化装置51,81と異なる点は、周波数領域ピッチ周期Tに対応する周波数領域ピッチ周期符号を出力しない点である。この場合、周波数領域ピッチ周期分析装置91は、外部から入力された時間領域のピッチ周期Lから、周波数領域サンプル列に対する周波数領域ピッチ周期を決定する周波数領域ピッチ周期分析装置として機能する。
第9実施形態の周期換算部914には、時間領域のピッチ周期Lと周波数領域のサンプル点数Nとが入力され、換算間隔T1を求めて出力する。換算間隔T1を求める処理は、周期換算部114と同じである。
周波数領域ピッチ周期分析部915には、換算間隔T1と周波数領域サンプル列とが入力され、換算間隔T1と換算間隔T1の整数倍の値U×T1(ただし、Uは予め定めた第1の範囲の整数)を含む候補値から、周波数領域ピッチ周期を決定し、決定した周波数領域ピッチ周期を出力する。
[その他]
なお、第1実施形態、第1実施形態の変形例、第2実施形態、第3実施形態、第4実施形態では、周波数領域ピッチ周期考慮符号化部として並べ替え処理部116aと符号化部116bとによる構成を説明し、第6実施形態では、周波数領域ピッチ周期考慮符号化部として符号化部616bによる構成を説明したが、何れの周波数領域ピッチ周期考慮符号化部も「周波数領域ピッチ周期Tに基づく符号化方法で、入力された周波数領域のサンプル列を符号化し、それによって得られた符号列を出力する。」ものであり、より詳細には、「周波数領域のサンプル列のうちの周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周波数領域のサンプル列のうちの周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルによるサンプル群と、周波数領域のサンプル列のうちのサンプル群G1に含まれないサンプルによるサンプル群と、を異なる基準に従って(区別して)符号化し、それによって得られた符号列を出力する。」ものである。
復号装置についても同様であり、第1実施形態、第1実施形態の変形例、第2実施形態、第3実施形態、第4実施形態の周波数領域ピッチ周期考慮復号部と、第6実施形態の周波数領域ピッチ周期考慮復号部とは、「周波数領域ピッチ周期Tに基づく復号方法で、入力された符号列を復号して周波数領域のサンプル列を出力する。」ものであり、より詳細には、「入力された符号列から、周波数領域のサンプル列のうちの周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周波数領域のサンプル列のうちの周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルによるサンプル群と、周波数領域のサンプル列のうちのサンプル群G1に含まれないサンプルによるサンプル群と、を異なる基準に従って(区別して)復号して周波数領域のサンプル列を得て出力する。」ものである。
<符号化装置/復号装置のハードウェア構成例>
上述の実施形態に関わる符号化装置/復号装置は、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、CPU(Central Processing Unit)〔キャッシュメモリなどを備えていてもよい。〕、メモリであるRAM(Random Access Memory)やROM(Read Only Memory)、ハードディスクである外部記憶装置、およびこれらの入力部、出力部、CPU、RAM、ROM、外部記憶装置間のデータのやり取りが可能なように接続するバスなどを備えている。また必要に応じて、符号化装置/復号装置に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。
符号化装置/復号装置の外部記憶装置には、符号化/復号を実行するためのプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている〔外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくなどでもよい。〕。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。以下、データやその格納領域のアドレスなどを記憶する記憶装置を単に「記憶部」と呼ぶことにする。
符号化装置の記憶部には、音声音響信号に由来する周波数領域のサンプル列の並べ替えを行うためのプログラム、並べ替えで得られたサンプル列の符号化のためのプログラムなどが記憶されている。
復号装置の記憶部には、入力された符号列を復号するためのプログラム、復号で得られたサンプル列を符号化装置で並べ替えが行われる前のサンプル列に回復するためのプログラムなどが記憶されている。
符号化装置では、記憶部に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてRAMに読み込まれて、CPUで解釈実行・処理される。この結果、CPUが所定の機能(並べ替え処理部、符号化部など)を実現することで符号化が実現される。
復号装置では、記憶部に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてRAMに読み込まれて、CPUで解釈実行・処理される。この結果、CPUが所定の機能(復号部、回復部など)を実現することで復号が実現される。
<補記>
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。例えば、上述の復号処理において、長期予測情報復号部121による処理と復号部123a,523aによる処理とは、並列に実行することができる。
また、上記実施形態において説明したハードウェアエンティティ(符号化装置/復号装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は非一時的な(non-transitory)記録媒体である。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
例えば、周波数領域ピッチ周期Tが換算間隔T1そのものである場合の可変長符号の符号長、および、周波数領域ピッチ周期Tが換算間隔T1の整数倍U×T1である場合の可変長符号の符号長が、それ以外の場合の可変長符号の符号長よりも短い可変長符号帳(例1)を用いて、周波数領域ピッチ周期符号を決定してもよい。なお、「可変長符号」は、頻度が高い事象に対して頻度の低い事象に対する符号より短い符号をわりあてて平均符号長を短くする符号を意味する。このような周波数領域ピッチ周期符号は、周波数領域ピッチ周期Tが換算間隔T1そのものである場合、換算間隔T1の整数倍である場合、の符号長のほうが、それ以外の場合の符号長よりも短い。このような可変長符号帳の例を図12に示す。換算間隔T1の整数倍は、それ以外よりも周波数領域ピッチ周期として決定される頻度が高い性質があるので、このような可変長符号帳を用いて周波数領域ピッチ周期符号を決定することにより、平均符号を短くすることができる。
[ライスパラメータを特定するための補助情報の例5]
サンプル群G1に含まれるサンプルの振幅の大きさが均等ではない場合や、サンプル群G2に含まれるサンプルの振幅の大きさが均等ではない場合であっても、サンプル列X(1),...,X(N)の振幅の包絡情報をたよりに、符号量削減効果がより大きなライスパラメータを推定することもできる。たとえば、サンプルの振幅の大きさが高域ほど大きい場合には、サンプル群G1に含まれるサンプルのうち高域側のサンプルに対応するライスパラメータを固定的に増加させ、サンプル群G2に含まれるサンプルのうち高域側のサンプルに対応するライスパラメータを固定的に増加させることで、符号量をより削減できる。以下に具体例を示す。
Figure 2013176177
ただし、s1およびs2は、[ライスパラメータを特定するための補助情報の例1〜4]で例示した、サンプル群G1およびG2にそれぞれ対応するライスパラメータである。const.1からconst.10は、予め定められた正整数である。この例の場合、符号化部616bは、符号列およびライスパラメータの例2,3で例示した補助情報に加え、包絡情報を特定する補助情報(第9補助情報)を出力すればよい。包絡情報が復号側に既知である場合には、符号化部616bは、第補助情報を出力しなくてもよい。
[復号装置82]
図15に示すように、本実施形態の復号装置82が第5実施形態の復号装置52と異なるのは、復号装置82が長期予測情報復号部121を含まない点である。この場合は、復号装置82は、復号装置82の外部の長期予測情報復号部121により得た時間領域ピッチ周期Lと、入力される符号列に含まれる少なくとも周波数領域ピッチ周期符号と時間領域ピッチ周期符号とから、少なくとも周波数領域ピッチ周期Tを得る復号装置として機能する。例えば、符号列、符号化装置81から出力された周波数領域ピッチ周期T、(および、補助情報が入力された場合には補助情報)は、周波数領域ピッチ周期考慮復号部123の入力となる。その他は、第5実施形態の復号装置52と同じである。
[その他]
なお、第1実施形態、第1実施形態の変形例、第2実施形態、第3実施形態、第4実施形態では、周波数領域ピッチ周期考慮符号化部として並べ替え処理部116aと符号化部116bとによる構成を説明し、第6実施形態では、周波数領域ピッチ周期考慮符号化部として符号化部616bによる構成を説明したが、何れの周波数領域ピッチ周期考慮符号化部も「周波数領域ピッチ周期Tに基づく符号化方法で、入力された周波数領域のサンプル列を符号化し、それによって得られた符号列を出力する。」ものであり、より詳細には、「周波数領域のサンプル列のうちの周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周波数領域のサンプル列のうちの周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルによるサンプル群G1と、周波数領域のサンプル列のうちのサンプル群G1に含まれないサンプルによるサンプル群と、を異なる基準に従って(区別して)符号化し、それによって得られた符号列を出力する。」ものである。

Claims (41)

  1. 所定の時間区間の音響信号の時間領域ピッチ周期符号に時間領域のピッチ周期Lが対応し、上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得る周期換算ステップと、
    上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1(ただし、Uは予め定めた第1の範囲の整数)を含む候補値の中から上記音響信号に由来する周波数領域サンプル列のピッチ周期(以下、「第1周波数領域ピッチ周期」という。)Tを決定し、上記第1周波数領域ピッチ周期Tが上記換算間隔T1の何倍であるかを示す第1周波数領域ピッチ周期符号を得る周波数領域ピッチ周期分析ステップと、
    を有する符号化方法。
  2. 所定の時間区間の音響信号の時間領域での長期予測分析を行い時間領域のピッチ周期Lと当該時間領域のピッチ周期Lに対応する時間領域ピッチ周期符号を得る長期予測分析ステップと、
    上記時間領域のピッチ周期Lを用いて上記音響信号の長期予測残差信号を得る長期予測残差生成ステップと、
    上記長期予測残差信号に由来する周波数領域のサンプル列または上記音響信号に由来する周波数領域のサンプル列を得る周波数領域サンプル列生成ステップと、
    上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得る周期換算ステップと、
    上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1(ただし、Uは予め定めた第1の範囲の整数)を含む候補値の中から上記周波数領域サンプル列のピッチ周期(以下、「第1周波数領域ピッチ周期」という。)Tを決定し、上記第1周波数領域ピッチ周期Tが上記換算間隔T1の何倍であるかを示す第1周波数領域ピッチ周期符号を得る周波数領域ピッチ周期分析ステップと、
    を有する符号化方法。
  3. 請求項1または2に記載の符号化方法であって、
    上記周波数領域ピッチ周期分析ステップは、
    上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1を含む候補値の中から中間候補値を決定し、上記中間候補値および上記中間候補値の近傍の予め定めた第3の範囲の値の中から上記第1周波数領域ピッチ周期Tを決定し、上記中間候補値が上記換算間隔T1の何倍であるかを示す情報と、上記第1周波数領域ピッチ周期Tと上記中間候補値との差を示す情報と、を上記第1周波数領域ピッチ周期符号として得る
    ことを特徴とする符号化方法。
  4. 所定の時間区間の音響信号の時間領域での長期予測分析を行い、長期予測を実行するか否かを示す長期予測選択情報、長期予測を実行する場合は時間領域のピッチ周期Lと当該時間領域のピッチ周期に対応する時間領域ピッチ周期符号、を得る長期予測分析ステップと、
    長期予測を実行する場合には、上記時間領域のピッチ周期Lを用いて上記音響信号の長期予測残差信号を得る長期予測残差生成ステップと、
    長期予測を実行する場合には上記長期予測残差信号に、長期予測を実行しない場合には上記音響信号に、由来する周波数領域のサンプル列を得る周波数領域サンプル列生成ステップと、
    上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得る周期換算ステップと、
    長期予測を実行する場合には、上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1(ただし、Uは予め定めた第1の範囲の整数)を含む候補値の中から上記周波数領域サンプル列のピッチ周期(以下、「第1周波数領域ピッチ周期」という。)Tを決定し、上記周波数領域ピッチ周期Tが上記換算間隔T1の何倍であるかを示す第1周波数領域ピッチ周期符号を得て、長期予測を実行しない場合には、予め定めた第2の範囲の整数値を候補値の中から上記周波数領域サンプル列のピッチ周期(以下、「第2周波数領域ピッチ周期」という。)Tを決定し、上記第2周波数領域ピッチ周期Tを示す第2周波数領域ピッチ周期符号を得る周波数領域ピッチ周期分析ステップと、
    を有する符号化方法。
  5. 請求項4に記載の符号化方法であって、
    上記周波数領域ピッチ周期分析ステップは、
    長期予測を実行する場合には、上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1を含む候補値の中から中間候補値を決定し、上記中間候補値および上記中間候補値の近傍の予め定めた第3の範囲の値の中から上記第1周波数領域ピッチ周期Tを決定し、上記中間候補値が上記換算間隔T1の何倍であるかを示す情報と、上記第1周波数領域ピッチ周期Tと上記中間候補値との差を示す情報と、を上記第1周波数領域ピッチ周期符号として得て、長期予測を実行しない場合には、上記予め定めた第2の範囲の整数値を候補値として上記第2周波数領域ピッチ周期Tを決定し、上記第2周波数領域ピッチ周期Tと上記第2周波数領域ピッチ周期Tを示す上記第2周波数領域ピッチ周期符号とを得る
    ことを特徴とする符号化方法。
  6. 所定の時間区間の音響信号の時間領域での長期予測分析を行い、長期予測を実行するか否かを示す長期予測選択情報、長期予測を実行する場合は時間領域のピッチ周期Lと当該時間領域のピッチ周期に対応する時間領域ピッチ周期符号とピッチ利得、を得る長期予測分析ステップと、
    長期予測を実行する場合には、上記時間領域のピッチ周期Lと上記ピッチ利得とを用いて上記音響信号の長期予測残差信号を得る長期予測残差生成ステップと、
    長期予測を実行する場合には上記長期予測残差信号に、長期予測を実行しない場合には上記音響信号に、由来する周波数領域のサンプル列を得る周波数領域サンプル列生成ステップと、
    上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得る周期換算ステップと、
    量子化済みピッチ利得が予め定めた値以上である場合には、上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1(ただし、Uは予め定めた第1の範囲の整数)を含む候補値の中から上記周波数領域サンプル列のピッチ周期(以下、「第1周波数領域ピッチ周期」という。)Tを決定し、上記第1周波数領域ピッチ周期Tと上記第1周波数領域ピッチ周期Tが上記換算間隔T1の何倍であるかを示す第1周波数領域ピッチ周期符号とを得て、上記量子化済みピッチ利得が予め定めた値より小さい場合には、予め定めた第2の範囲の整数値を候補値の中から上記周波数領域サンプル列のピッチ周期(以下、「第2周波数領域ピッチ周期」という。)Tを決定し、上記第2周波数領域ピッチ周期Tと上記第2周波数領域ピッチ周期Tを示す第2周波数領域ピッチ周期符号とを得る周波数領域ピッチ周期分析ステップと、
    を有する符号化方法。
  7. 請求項6に記載の符号化方法であって、
    上記周波数領域ピッチ周期分析ステップは、
    上記量子化済みピッチ利得が予め定めた値以上である場合には、上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1を含む候補値の中から中間候補値を決定し、上記中間候補値および上記中間候補値の近傍の予め定めた第3の範囲の値の中から上記第1周波数領域ピッチ周期Tを決定し、上記中間候補値が上記換算間隔T1の何倍であるかを示す情報と、上記第1周波数領域ピッチ周期Tと上記中間候補値との差を示す情報と、を上記第1周波数領域ピッチ周期符号として得て、上記量子化済みピッチ利得が予め定めた値より小さい場合には、上記予め定めた第2の範囲の整数値を候補値として上記第2周波数領域ピッチ周期Tを決定し、上記第2周波数領域ピッチ周期Tと上記第2周波数領域ピッチ周期Tを示す上記第2周波数領域ピッチ周期符号とを得る
    ことを特徴とする符号化方法。
  8. 請求項1から7の何れかに記載の符号化方法であって、
    上記第1または2周波数領域ピッチ周期Tに基づく符号化方法で上記周波数領域のサンプル列を符号化する周波数領域ピッチ周期考慮符号化ステップ
    を更に有する符号化方法。
  9. 請求項8に記載の符号化方法であって、
    上記第1または2周波数領域ピッチ周期Tに基づく符号化方法は、
    上記周波数領域のサンプル列のうちの上記第1または2周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記周波数領域のサンプル列のうちの上記第1または2周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルによるサンプル群と、上記サンプル列のうちの上記サンプル群に含まれないサンプルによるサンプル群と、を異なる基準に従って符号化する符号化方法である
    符号化方法。
  10. 請求項8に記載の符号化方法であって、
    上記周波数領域ピッチ周期考慮符号化ステップは、
    (1)上記サンプル列の全てのサンプルが含まれ、かつ、
    (2)上記サンプル列のうちの上記第1または2周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記第1または2周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
    を並べ替え後のサンプル列として得る並べ替えステップと、
    上記並べ替えステップで得られたサンプル列を符号化する符号化ステップと、
    を含む符号化方法。
  11. 請求項10に記載の符号化方法であって、
    上記並べ替えステップでは、
    上記所定の時間区間の音響信号に対応する予測利得またはその推定値が予め定めた閾値以下である場合は、上記サンプル列を並べ替え後のサンプル列として出力する
    ことを特徴とする符号化方法。
  12. 請求項1,2,4,6の何れかに記載の符号化方法であって、
    上記第1周波数領域ピッチ周期符号は、上記第1周波数領域ピッチ周期Tが
    上記換算間隔T1そのものである場合、
    上記換算間隔T1の整数倍である場合、
    の符号長のほうが、
    それ以外の場合の符号長よりも短い
    ことを特徴とする符号化方法。
  13. 請求項1,2,4,6の何れかに記載の符号化方法であって、
    上記第1周波数領域ピッチ周期符号は、上記第1周波数領域ピッチ周期Tが
    上記換算間隔T1そのものである場合、
    上記換算間隔T1の整数倍である場合、
    上記換算間隔T1の近傍である場合、
    上記換算間隔T1の整数倍の近傍である場合、
    の符号長のほうが、
    それ以外の場合の符号長よりも短い
    ことを特徴とする符号化方法。
  14. 請求項1,2,4,6の何れかに記載の符号化方法であって、
    上記第1周波数領域ピッチ周期符号は、上記第1周波数領域ピッチ周期Tが
    上記換算間隔T1そのものである場合、
    の符号長のほうが、
    上記換算間隔T1の近傍である場合の符号長よりも短い
    ことを特徴とする符号化方法。
  15. 請求項1,2,4,6の何れかに記載の符号化方法であって、
    上記第1周波数領域ピッチ周期符号は、上記第1周波数領域ピッチ周期Tが
    上記換算間隔T1の整数倍である場合、
    の符号長のほうが、
    上記換算間隔T1の整数倍の近傍である場合の符号長よりも短い
    ことを特徴とする符号化方法。
  16. 請求項12乃至15のいずれかに記載の符号化方法であって、
    少なくとも、上記第1周波数領域ピッチ周期Tが上記換算間隔T1の整数倍の値V×T1(ただし、Vは正の整数)である場合の上記第1周波数領域ピッチ周期符号の符号長は、
    上記整数Vの大きさに対して単調非減少の関係にある
    ことを特徴とする符号化方法。
  17. 時間領域ピッチ周期符号を復号して時間領域のピッチ周期Lを得る長期予測情報復号ステップと、
    上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得、第1周波数領域ピッチ周期符号を復号して第1周波数領域ピッチ周期Tが上記換算間隔T1の何倍であるかを示す倍数値を得、上記換算間隔T1に上記倍数値を乗算したものを上記第1周波数領域ピッチ周期Tとして得る周期換算ステップと
    を有する復号方法。
  18. 請求項17に記載の復号方法であって、
    上記周期換算ステップは、
    上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を上記換算間隔T1として得、上記第1周波数領域ピッチ周期符号を復号して、中間候補値が上記換算間隔T1の何倍であるかの倍数値と、上記第1周波数領域ピッチ周期Tと上記中間候補値との差の値と、を得、上記換算間隔T1に上記倍数値を乗算して得られる値に上記差の値を加算したものを上記第1周波数領域ピッチ周期Tとして得る
    ことを特徴とする復号方法。
  19. 長期予測選択情報が長期予測を実行することを示す場合に、時間領域ピッチ周期符号を復号して時間領域のピッチ周期Lを得る長期予測情報復号ステップと、
    上記長期予測選択情報が長期予測を実行することを示す場合には、上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得、第1周波数領域ピッチ周期符号を復号して第1周波数領域ピッチ周期Tが上記換算間隔T1の何倍であるかを示す倍数値を得、上記換算間隔T1に上記倍数値を乗算したものを上記第1周波数領域ピッチ周期Tとして得て、上記長期予測選択情報が長期予測を実行しないことを示す場合には、第2周波数領域ピッチ周期符号を復号して上記第2周波数領域ピッチ周期Tを得る周期換算ステップと
    を有する復号方法。
  20. 請求項19に記載の復号方法であって、
    上記周期換算ステップは、
    上記長期予測選択情報が長期予測を実行することを示す場合には、上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を上記換算間隔T1として得、上記第1周波数領域ピッチ周期符号を復号して、中間候補値が上記換算間隔T1の何倍であるかの倍数値と、上記第1周波数領域ピッチ周期Tと上記中間候補値との差の値と、を得、上記換算間隔T1に上記倍数値を乗算して得られる値に上記差の値を加算したものを上記第1周波数領域ピッチ周期Tとして得て、上記長期予測選択情報が長期予測を実行しないことを示す場合には、上記第2周波数領域ピッチ周期符号を復号して上記第2周波数領域ピッチ周期Tを得る
    ことを特徴とする復号方法。
  21. 長期予測選択情報が長期予測を実行することを示す場合に、時間領域ピッチ周期符号を復号して時間領域のピッチ周期Lを得て、利得符号を復号して量子化済みピッチ利得を得る長期予測情報復号ステップと、
    上記量子化済みピッチ利得が予め定めた値以上である場合には、上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得、第1周波数領域ピッチ周期符号を復号して第1周波数領域ピッチ周期Tが上記換算間隔T1の何倍であるかを示す倍数値を得、上記換算間隔T1に上記倍数値をしたものを上記第1周波数領域ピッチ周期Tとして得て、上記量子化済みピッチ利得が予め定めた値より小さい場合には、第2周波数領域ピッチ周期符号を復号して第2周波数領域ピッチ周期Tを得る周期換算ステップと
    を有する復号方法。
  22. 請求項21に記載の復号方法であって、
    上記周期換算ステップは、
    上記量子化済みピッチ利得が予め定めた値以上である場合には、上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を上記換算間隔T1として得、上記第1周波数領域ピッチ周期符号を復号して、中間候補値が上記換算間隔T1の何倍であるかの倍数値と、上記第1周波数領域ピッチ周期Tと上記中間候補値との差の値と、を得、上記換算間隔T1に上記倍数値を乗算して得られる値に上記差の値を加算したものを上記第1周波数領域ピッチ周期Tとして得て、上記量子化済みピッチ利得が予め定めた値より小さい場合には、上記第2周波数領域ピッチ周期符号を復号して上記第2周波数領域ピッチ周期Tを得る
    ことを特徴とする復号方法。
  23. 請求項17から22の何れかに記載の復号方法であって、
    上記第1または2周波数領域ピッチ周期Tに基づく復号方法で符号列を復号して周波数領域のサンプル列を得る周波数領域ピッチ周期考慮復号ステップと、
    上記周波数領域のサンプル列に由来する時間領域の信号列を得る時間領域信号列生成ステップと、
    上記時間領域の信号列と上記時間領域のピッチ周期Lと過去の復号音響信号列を用いて、復号音響信号列を得る長期予測合成ステップと、
    を更に有する復号方法。
  24. 請求項23に記載の復号方法であって、
    上記第1または2周波数領域ピッチ周期Tに基づく復号方法は、
    上記周波数領域のサンプル列のうちの上記第1または2周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記周波数領域のサンプル列のうちの上記第1または2周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルによるサンプル群と、上記周波数領域のサンプル列のうちの上記サンプル群に含まれないサンプルによるサンプル群と、が異なる基準に従った復号処理により得られる復号方法である
    ことを特徴とする復号方法。
  25. 請求項23に記載の復号方法であって、
    上記周波数領域ピッチ周期考慮復号ステップは、
    上記符号列を復号してサンプル列を得る復号ステップと
    上記第1または2周波数領域ピッチ周期Tに従って上記サンプル列から周波数順のサンプルの並びである周波数領域のサンプル列を得る回復ステップを含む
    ことを特徴とする復号方法。
  26. 請求項25に記載の復号方法であって、
    上記回復ステップでは、
    所定の時間区間の予測利得の推定値が予め定めた閾値以下である場合は、上記符号列を復号して得られたサンプル列を元のサンプルの並びである周波数領域のサンプル列として出力する
    ことを特徴とする復号方法。
  27. 所定の時間区間の音響信号に由来する周波数領域サンプル列のピッチ周期(以下、「周波数領域ピッチ周期」という。)Tを決定する周波数領域ピッチ周期分析方法であって、
    上記音響信号の時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得る周期換算ステップと、
    上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1(ただし、Uは予め定めた第1の範囲の整数)を含む候補値の中から上記周波数領域ピッチ周期Tを決定する周波数領域ピッチ周期分析ステップと、
    を有する周波数領域ピッチ周期分析方法。
  28. 請求項27に記載の周波数領域ピッチ周期分析方法であって、
    上記周波数領域ピッチ周期分析ステップは、
    上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1を含む候補値の中から中間候補値を決定し、上記中間候補値および上記中間候補値の近傍の予め定めた第3の範囲の値の中から周波数領域ピッチ周期Tを決定する
    ことを特徴とする周波数領域ピッチ周期分析方法。
  29. 所定の時間区間の音響信号の時間領域ピッチ周期符号に時間領域のピッチ周期Lが対応し、上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得る周期換算部と、
    上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1(ただし、Uは予め定めた第1の範囲の整数)を含む候補値の中から上記音響信号に由来する周波数領域サンプル列のピッチ周期(以下、「第1周波数領域ピッチ周期」という。)Tを決定し、上記第1周波数領域ピッチ周期Tが上記換算間隔T1の何倍であるかを示す第1周波数領域ピッチ周期符号を得る周波数領域ピッチ周期分析部と、
    を有する符号化装置。
  30. 所定の時間区間の音響信号の時間領域での長期予測分析を行い時間領域のピッチ周期Lと当該時間領域のピッチ周期Lに対応する時間領域ピッチ周期符号を得る長期予測分析部と、
    上記時間領域のピッチ周期Lを用いて上記音響信号の長期予測残差信号を得る長期予測残差生成部と、
    上記長期予測残差信号に由来する周波数領域のサンプル列または上記音響信号に由来する周波数領域のサンプル列を得る周波数領域サンプル列生成部と、
    上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得る周期換算部と、
    上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1(ただし、Uは予め定めた第1の範囲の整数)を含む候補値の中から上記周波数領域サンプル列のピッチ周期(以下、「第1周波数領域ピッチ周期」という。)Tを決定し、上記第1周波数領域ピッチ周期Tが上記換算間隔T1の何倍であるかを示す第1周波数領域ピッチ周期符号を得る周波数領域ピッチ周期分析部と、
    を有する符号化装置。
  31. 請求項29または30に記載の符号化装置であって、
    上記周波数領域ピッチ周期分析部は、
    上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1を含む候補値の中から中間候補値を決定し、上記中間候補値および上記中間候補値の近傍の予め定めた第3の範囲の値の中から上記第1周波数領域ピッチ周期Tを決定し、上記中間候補値が上記換算間隔T1の何倍であるかを示す情報と、上記第1周波数領域ピッチ周期Tと上記中間候補値との差を示す情報と、を上記第1周波数領域ピッチ周期符号として得る
    ことを特徴とする符号化装置。
  32. 時間領域ピッチ周期符号を復号して時間領域のピッチ周期Lを得る長期予測情報復号部と、
    上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得、第1周波数領域ピッチ周期符号を復号して第1周波数領域ピッチ周期Tが上記換算間隔T1の何倍であるかを示す倍数値を得、上記換算間隔T1に上記倍数値を乗算したものを上記第1周波数領域ピッチ周期Tとして得る周期換算部と
    を有する復号装置。
  33. 請求項32に記載の復号装置であって、
    上記周期換算部は、
    上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を上記換算間隔T1として得、上記第1周波数領域ピッチ周期符号を復号して、中間候補値が上記換算間隔T1の何倍であるかの倍数値と、上記第1周波数領域ピッチ周期Tと上記中間候補値との差の値と、を得、上記換算間隔T1に上記倍数値を乗算して得られる値に上記差の値を加算したものを上記第1周波数領域ピッチ周期Tとして得る
    ことを特徴とする復号装置。
  34. 所定の時間区間の音響信号に由来する周波数領域サンプル列のピッチ周期(以下、「周波数領域ピッチ周期」という。)Tを決定する周波数領域ピッチ周期分析装置であって、
    上記音響信号の時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得る周期換算部と、
    上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1(ただし、Uは予め定めた第1の範囲の整数)を含む候補値の中から上記周波数領域ピッチ周期Tを決定する周波数領域ピッチ周期分析部と、
    を有する周波数領域ピッチ周期分析装置。
  35. 請求項34に記載の周波数領域ピッチ周期分析装置であって、
    上記周波数領域ピッチ周期分析部は、
    上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1を含む候補値の中から中間候補値を決定し、上記中間候補値および上記中間候補値の近傍の予め定めた第3の範囲の値の中から周波数領域ピッチ周期Tを決定する
    ことを特徴とする周波数領域ピッチ周期分析装置。
  36. 請求項1から16の何れかに記載の符号化方法の各ステップをコンピュータに実行させるためのプログラム。
  37. 請求項17から26の何れかに記載の復号方法の各ステップをコンピュータに実行させるためのプログラム。
  38. 請求項27または28の周波数領域ピッチ周期分析方法の各ステップをコンピュータに実行させるためのプログラム。
  39. 請求項1から16の何れかに記載の符号化方法の各ステップをコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
  40. 請求項17から26の何れかに記載の復号方法の各ステップをコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
  41. 請求項27または28の周波数領域ピッチ周期分析方法の各ステップをコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
JP2014516829A 2012-05-23 2013-05-22 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体 Active JP6053196B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014516829A JP6053196B2 (ja) 2012-05-23 2013-05-22 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2012117172 2012-05-23
JP2012117172 2012-05-23
JP2012171155 2012-08-01
JP2012171155 2012-08-01
JP2014516829A JP6053196B2 (ja) 2012-05-23 2013-05-22 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体
PCT/JP2013/064209 WO2013176177A1 (ja) 2012-05-23 2013-05-22 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体

Publications (2)

Publication Number Publication Date
JPWO2013176177A1 true JPWO2013176177A1 (ja) 2016-01-14
JP6053196B2 JP6053196B2 (ja) 2016-12-27

Family

ID=49623862

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014516829A Active JP6053196B2 (ja) 2012-05-23 2013-05-22 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体

Country Status (8)

Country Link
US (3) US9947331B2 (ja)
EP (3) EP3576089B1 (ja)
JP (1) JP6053196B2 (ja)
KR (4) KR20140143438A (ja)
CN (3) CN108962270B (ja)
ES (3) ES2689072T3 (ja)
PL (2) PL2830057T3 (ja)
WO (1) WO2013176177A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2689072T3 (es) * 2012-05-23 2018-11-08 Nippon Telegraph And Telephone Corporation Codificación de una señal de audio
WO2016121826A1 (ja) * 2015-01-30 2016-08-04 日本電信電話株式会社 符号化装置、復号装置、これらの方法、プログラム及び記録媒体
US10276186B2 (en) * 2015-01-30 2019-04-30 Nippon Telegraph And Telephone Corporation Parameter determination device, method, program and recording medium for determining a parameter indicating a characteristic of sound signal
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
EP3270376B1 (en) * 2015-04-13 2020-03-18 Nippon Telegraph and Telephone Corporation Sound signal linear predictive coding
CN106373594B (zh) * 2016-08-31 2019-11-26 华为技术有限公司 一种音调检测方法及装置
CN110291583B (zh) * 2016-09-09 2023-06-16 Dts公司 用于音频编解码器中的长期预测的系统和方法
JP6712643B2 (ja) * 2016-09-15 2020-06-24 日本電信電話株式会社 サンプル列変形装置、信号符号化装置、信号復号装置、サンプル列変形方法、信号符号化方法、信号復号方法、およびプログラム
EP3742441B1 (en) * 2018-01-17 2023-04-12 Nippon Telegraph And Telephone Corporation Encoding device, decoding device, fricative determination device, and method and program thereof
CN110728990B (zh) * 2019-09-24 2022-04-05 维沃移动通信有限公司 基音检测方法、装置、终端设备和介质
US11769071B2 (en) * 2020-11-30 2023-09-26 IonQ, Inc. System and method for error correction in quantum computing

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001249698A (ja) * 2000-03-06 2001-09-14 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化パラメータ取得方法、音声復号方法及び装置
JP2002516420A (ja) * 1998-05-21 2002-06-04 ユニバーシティ オブ サリー 音声コーダ
WO2012046685A1 (ja) * 2010-10-05 2012-04-12 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4797926A (en) 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
US5003604A (en) * 1988-03-14 1991-03-26 Fujitsu Limited Voice coding apparatus
US5127053A (en) * 1990-12-24 1992-06-30 General Electric Company Low-complexity method for improving the performance of autocorrelation-based pitch detectors
JP3362471B2 (ja) * 1993-07-27 2003-01-07 ソニー株式会社 音声信号の符号化方法及び復号化方法
JP3890605B2 (ja) * 1994-08-22 2007-03-07 ソニー株式会社 送受信装置
TW321810B (ja) * 1995-10-26 1997-12-01 Sony Co Ltd
WO1999059139A2 (en) * 1998-05-11 1999-11-18 Koninklijke Philips Electronics N.V. Speech coding based on determining a noise contribution from a phase change
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
JP4550176B2 (ja) * 1998-10-08 2010-09-22 株式会社東芝 音声符号化方法
JP2000267700A (ja) * 1999-03-17 2000-09-29 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化復号方法および装置
JP4005359B2 (ja) * 1999-09-14 2007-11-07 富士通株式会社 音声符号化及び音声復号化装置
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
JP3731575B2 (ja) * 2002-10-21 2006-01-05 ソニー株式会社 符号化装置及び復号装置
EP1619664B1 (en) * 2003-04-30 2012-01-25 Panasonic Corporation Speech coding apparatus, speech decoding apparatus and methods thereof
BRPI0517246A (pt) 2004-10-28 2008-10-07 Matsushita Electric Ind Co Ltd aparelho de codificação escalável, aparelho de decodificação escalável e métodos para os mesmos
WO2006075605A1 (ja) * 2005-01-12 2006-07-20 Nippon Telegraph And Telephone Corporation 長期予測符号化方法、長期予測復号化方法、これら装置、そのプログラム及び記録媒体
ES2351935T3 (es) * 2005-04-01 2011-02-14 Qualcomm Incorporated Procedimiento y aparato para la cuantificación vectorial de una representación de envolvente espectral.
KR100647336B1 (ko) * 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
JP4964114B2 (ja) 2007-12-25 2012-06-27 日本電信電話株式会社 符号化装置、復号化装置、符号化方法、復号化方法、符号化プログラム、復号化プログラム、および記録媒体
WO2010140546A1 (ja) * 2009-06-03 2010-12-09 日本電信電話株式会社 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム及びこれらの記録媒体
ES2689072T3 (es) * 2012-05-23 2018-11-08 Nippon Telegraph And Telephone Corporation Codificación de una señal de audio
US9589570B2 (en) * 2012-09-18 2017-03-07 Huawei Technologies Co., Ltd. Audio classification based on perceptual quality for low or medium bit rates

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002516420A (ja) * 1998-05-21 2002-06-04 ユニバーシティ オブ サリー 音声コーダ
JP2001249698A (ja) * 2000-03-06 2001-09-14 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化パラメータ取得方法、音声復号方法及び装置
WO2012046685A1 (ja) * 2010-10-05 2012-04-12 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体

Also Published As

Publication number Publication date
EP3576089B1 (en) 2020-10-14
ES2689072T3 (es) 2018-11-08
CN108962270B (zh) 2023-03-17
US9947331B2 (en) 2018-04-17
US20150046172A1 (en) 2015-02-12
EP2830057A4 (en) 2016-01-13
CN104321814B (zh) 2018-10-09
KR20170073732A (ko) 2017-06-28
PL3385950T3 (pl) 2020-02-28
EP3385950A1 (en) 2018-10-10
KR20140143438A (ko) 2014-12-16
US10096327B2 (en) 2018-10-09
KR20160100411A (ko) 2016-08-23
WO2013176177A1 (ja) 2013-11-28
CN109147827B (zh) 2023-02-17
EP3385950B1 (en) 2019-09-25
EP3576089A1 (en) 2019-12-04
US10083703B2 (en) 2018-09-25
ES2762160T3 (es) 2020-05-22
CN109147827A (zh) 2019-01-04
EP2830057B1 (en) 2018-07-11
KR101663607B1 (ko) 2016-10-07
US20180182405A1 (en) 2018-06-28
KR101750071B1 (ko) 2017-06-23
CN108962270A (zh) 2018-12-07
CN104321814A (zh) 2015-01-28
PL2830057T3 (pl) 2019-01-31
JP6053196B2 (ja) 2016-12-27
ES2834391T3 (es) 2021-06-17
US20180182406A1 (en) 2018-06-28
KR101762204B1 (ko) 2017-07-27
KR20160087394A (ko) 2016-07-21
EP2830057A1 (en) 2015-01-28

Similar Documents

Publication Publication Date Title
JP6053196B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体
JP5612698B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
JP5596800B2 (ja) 符号化方法、周期性特徴量決定方法、周期性特徴量決定装置、プログラム
JP5603484B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
JP5893153B2 (ja) 符号化方法、符号化装置、プログラム、および記録媒体
JP5694751B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160322

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20160518

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160701

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161128

R150 Certificate of patent or registration of utility model

Ref document number: 6053196

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150