JP5602769B2 - 符号化装置、復号装置、符号化方法及び復号方法 - Google Patents

符号化装置、復号装置、符号化方法及び復号方法 Download PDF

Info

Publication number
JP5602769B2
JP5602769B2 JP2011549935A JP2011549935A JP5602769B2 JP 5602769 B2 JP5602769 B2 JP 5602769B2 JP 2011549935 A JP2011549935 A JP 2011549935A JP 2011549935 A JP2011549935 A JP 2011549935A JP 5602769 B2 JP5602769 B2 JP 5602769B2
Authority
JP
Japan
Prior art keywords
celp
unit
decoding
component
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011549935A
Other languages
English (en)
Other versions
JPWO2011086923A1 (ja
Inventor
正浩 押切
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Panasonic Intellectual Property Corp of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Corp of America filed Critical Panasonic Intellectual Property Corp of America
Priority to JP2011549935A priority Critical patent/JP5602769B2/ja
Publication of JPWO2011086923A1 publication Critical patent/JPWO2011086923A1/ja
Application granted granted Critical
Publication of JP5602769B2 publication Critical patent/JP5602769B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、符号化装置、復号装置、符号化方法及び復号方法に関する。
移動体通信システムでは、電波資源等の有効利用のために、音声信号を低ビットレートに圧縮して伝送する技術が要求されている。その一方で、音声信号のみならず、音楽信号等、音声信号以外の信号に対しても低ビットレートで高品質に符号化できる音声コーデックが求められている。これは、例えば、リングバックトーンとして音楽を流すサービス(メロディコール等)を高品質に実現するために必須の技術である。
音声信号を低ビットレートで高能率に符号化する有効な方式にCELP(Code Excited Linear Prediction;符号励振線形予測)符号化がある(例えば、非特許文献1参照)。CELP符号化は、人間の音声生成モデルを工学的に模擬したモデルに基づき、符号帳(コードブック)に記録されている励振信号を、周期性の強さに対応するピッチフィルタと声道特性に対応する合成フィルタとに通し、その出力信号と入力信号との二乗誤差が聴覚特性の重み付けの下で最小になるように符号化パラメータを決定する方式である。このモデルを用いることにより、CELP符号化では、音声信号を低ビットレートで高音質に符号化することが可能となる。最近の標準音声符号化方式の多くがCELP符号化に基づいており、例えば、ITU(International Telecommunication Union)のG729、G718、又は、3GPP(The 3rd Generation Partnership Project)のAMR、AMR−WB等が代表的例である。
M. R. Schoder and B. S. Atal, "Code-excited linear prediction (CELP); high-quality speech at very low bit rates", Proc. ICASSP 85, pp.937-940, 1985.
しかしながら、CELP符号化は、音声信号に対して低ビットレートで高音質に符号化できる音声コーデックであるものの、音楽信号には適さないモデルに基づいているため、音楽信号に対してCELP符号化を用いると音質が大きく劣化してしまう。
具体的には、CELP符号化は、上述したように、符号帳(コードブック)に記録されている励振信号を、周期性の強さに対応するピッチフィルタと声道特性に対応する合成フィルタとに通して合成信号を生成する。このモデルでは、音声信号のホルマントに対応する共振周波数での高エネルギー成分(スペクトル包絡)、及び、基本周波数の整数倍に現れるピーク性の比較的強い成分(調波構造又はハーモニクス)を表現するには適している。しかし、一般的な音楽信号では、音声信号のようにホルマント又は調波構造が存在するとは限らない。さらに、音楽信号では、音声信号の調波構造よりもピーク性の非常に強い成分が現れるのに対して、CELP符号化ではその成分を的確に表現することができない。
例えば、図1A及び図1Bは、音声信号の母音部を16kHzのサンプリングレートで録音した信号を周波数分析した際のスペクトル(図1Aに示す原信号スペクトル(音声))、及び、その信号をITU−T G718の8kbit/sモードで処理した際の復号音のスペクトル(図1Bに示す復号信号スペクトル(音声))を表す。なお、G718の8kbit/sモードはCELP符号化に基づいた符号化方式である。図1Aに示す原信号スペクトルと図1Bに示す復号信号スペクトルとを比較すると、高域部で若干違いが見られるものの、全体的に非常に似通ったスペクトルであることが分かる。
一方、図1C及び図1Dは、ピアノ音(音楽信号)を16kHzのサンプリングレートで録音した信号を周波数分析した際のスペクトル(図1Cに示す原信号スペクトル(ピアノ))、及び、その信号をITU−T G718の8kbit/sモードで処理した際の復号音のスペクトル(図1Dに示す復号信号スペクトル(ピアノ))を表す。図1Cに示す原信号スペクトルと図1Dに示す復号信号スペクトルとを比較すると、原信号スペクトルでは、スペクトルのピーク(トーン)形状が全体的に明確に現れている。これに対し、復号信号スペクトルでは、1.5kHzあたりからスペクトルのピーク形状が崩れ始め、3.5kHz以上になるとスペクトルの形状が原信号スペクトルと大きく異なってしまっている。このように、復号信号スペクトルのピーク形状が崩れてしまい、スペクトルのピークの山と谷との大きさが抑圧されることで、復号信号を試聴すると雑音的に感じ、音質が大きく劣化する。
そこで、CELP符号化において復号信号の品質を改善する技術として、CELP符号化の復号信号を周波数分析して、サブバンド単位でトーン間の成分を抑圧することにより、音楽信号の音質改善を図る技術が提案されている(例えば、Tommy Vaillancourt, et. al., “Inter-tone noise reduction in a low bit rate CELP decoder”, Proc. ICASSP2009, pp.4113-4116, 2009.を参照)。
しかしながら、この技術では、サブバンド単位でトーン間の成分の抑圧量を決定するため、周波数分解能が低くなる課題がある。さらに、この技術では、復号信号(つまり、品質が劣化している信号)を周波数分析することによりトーン間の成分の抑圧量を算出するため、音質を改善するための正確な抑圧量の算出が困難であるという課題がある。これらより、十分な音質改善効果を得ることができない。
本発明の目的は、音楽信号を符号化する場合でも、復号信号の品質を向上させることができる符号化装置、復号装置、符号化方法及び復号方法を提供することである。
本発明の一態様に係る符号化装置は、入力信号を符号化して第1符号化データを生成する第1符号化手段と、前記第1符号化データを復号して復号信号を生成する復号手段と、前記復号信号と前記入力信号との間におけるスペクトルのピーク成分とフロア成分との比の変動量を示すパラメータを算出する算出手段と、を具備する構成を採る。
本発明の一態様に係る復号装置は、符号化装置において入力信号を符号化して得られた第1符号化データを復号して、復号信号を生成する第1復号手段と、前記復号信号と前記入力信号との間におけるスペクトルのピーク成分とフロア成分との比の変動量を示すパラメータを用いて、前記復号信号のスペクトルのピーク成分の振幅調整を行う調整手段と、を具備する構成を採る。
本発明の一態様に係るスペクトル変動量算出方法は、入力信号を符号化して第1符号化データを生成する符号化ステップと、前記第1符号化データを復号して復号信号を生成する復号ステップと、前記復号信号と前記入力信号との間におけるスペクトルのピーク成分とフロア成分との比の変動量を示すパラメータを算出する算出ステップと、を具備する構成を採る。
本発明の一態様に係るスペクトル振幅調整方法は、符号化装置において入力信号を符号化して得られた第1符号化データを復号して、復号信号を生成する復号ステップと、前記復号信号と前記入力信号との間におけるスペクトルのピーク成分とフロア成分との比の変動量を示すパラメータを用いて、前記復号信号のスペクトルのピーク成分の振幅調整を行う調整ステップと、を具備する。
本発明によれば、音楽信号を符号化する場合でも、復号信号の品質を向上させることができる。
音声信号及び音楽信号における原信号スペクトル及び復号信号スペクトルの形状を示す図 本発明の実施の形態1に係る符号化装置の構成を示すブロック図 本発明の実施の形態1に係る特徴パラメータ符号化部の内部構成を示すブロック図 本発明の実施の形態1に係る復号装置の構成を示すブロック図 本発明の実施の形態1に係る変換係数強調部の内部構成を示すブロック図 本発明の実施の形態1に係る変換係数強調部における処理の流れを示す図 本発明の実施の形態2に係る符号化装置の構成を示すブロック図 本発明の実施の形態2に係る特徴パラメータ符号化部の内部構成を示すブロック図 本発明の実施の形態2に係る復号装置の構成を示すブロック図 本発明の実施の形態2に係る変換係数強調部の内部構成を示すブロック図 本発明の実施の形態3に係る特徴パラメータ符号化部の内部構成を示すブロック図 本発明の実施の形態3に係る変換係数強調部の内部構成を示すブロック図 本発明の実施の形態4に係る符号化装置の構成を示すブロック図 本発明の実施の形態4に係る復号装置の構成を示すブロック図 本発明の実施の形態4に係る変換係数強調部の内部構成を示すブロック図 本発明の実施の形態4に係る変換係数強調部における処理の流れを示す図
以下、本発明の実施の形態について、図面を参照して詳細に説明する。なお、以下の説明では、nを用いた変数(例えば、s(n))は時間領域の信号を表し、kを用いた変数(例えば、S(k))は周波数領域の信号を表す。また、本発明に係る符号化装置には、入力信号として、音声信号又は音楽信号が入力され得る。
(実施の形態1)
図2は、本実施の形態に係る符号化装置の要部構成を示すブロック図である。図2の符号化装置100は、予め設定された時間間隔(フレーム)単位で入力信号に対して符号化処理を行うことでビットストリームを生成し、生成したビットストリームを後述する復号装置へ伝送する。
図2に示す符号化装置100において、CELP符号化部101は、CELP符号化を用いて入力信号の符号化処理を行い、CELP符号化データ(第1符号化データ)を生成する。CELP符号化部101は、CELP符号化データをCELP復号部102及び多重化部107に出力する。
CELP復号部102は、CELP符号化部101から入力されるCELP符号化データに対してCELP復号処理を行い、CELP復号信号を生成する。CELP復号部102は、CELP復号信号をT/F変換部103に出力する。
T/F変換部103は、CELP復号部102から入力されるCELP復号信号を周波数領域に変換してCELP復号変換係数を算出し、CELP復号変換係数を特徴パラメータ符号化部106に出力する。ここでは、周波数領域への変換には、MDCT(Modified Discrete Cosine Transform:修正離散コサイン変換)を用いる。
遅延部104は、CELP符号化部101及びCELP復号部102で生じる遅延に相当する時間だけ入力信号を遅延させ、遅延調整後の入力信号をT/F変換部105に出力する。
T/F変換部105は、遅延部104で遅延調整された入力信号を周波数領域に変換して入力変換係数を算出し、入力変換係数を特徴パラメータ符号化部106に出力する。なお、T/F変換部103と同様、周波数領域への変換には、MDCTを用いる。
特徴パラメータ符号化部106は、T/F変換部103から入力されるCELP復号変換係数、及び、T/F変換部105から入力される入力変換係数を用いて、特徴パラメータの算出及び符号化を行い、特徴パラメータ符号化データ(第2符号化データ)を生成する。ここで、特徴パラメータは、CELP復号信号と入力信号との間におけるスペクトルのピーク成分とフロア成分との比の変動量を示す。特徴パラメータ符号化部106は、特徴パラメータ符号化データを多重化部107に出力する。なお、特徴パラメータ符号化部106における処理の詳細については後述する。
多重化部107は、CELP符号化部101から入力されるCELP符号化データ(第1符号化データ)と特徴パラメータ符号化部106から入力される特徴パラメータ符号化データ(第2符号化データ)とを多重化して、ビットストリームを生成し、ビットストリームを図示しない通信路(transmission channel)に出力する。
次に、図2に示す符号化装置100の特徴パラメータ符号化部106における処理の詳細について説明する。図3は、特徴パラメータ符号化部106の内部構成を示すブロック図である。
図3に示す特徴パラメータ符号化部106において、包絡成分除去部111は、入力変換係数の包絡成分(スペクトルの概形成分)を除去する。例えば、包絡成分除去部111は、入力変換係数を線形領域から対数領域に変換した後に、変換後の入力変換係数に対して移動平均等のスムージング処理を行う。そして、包絡成分除去部111は、スムージング処理後の入力変換係数を対数領域から線形領域に再び変換する。このように、包絡成分除去部111は、対数領域でのスムージング処理を行うことにより、入力変換係数の包絡成分を求めることができる。そして、包絡成分除去部111は、入力変換係数から、求めた包絡成分を除去し、包絡成分除去後の入力変換係数を閾値算出部112及び変換係数分類部113に出力する。
閾値算出部112は、包絡成分除去部111から入力される包絡成分除去後の入力変換係数を用いて、入力変換係数をピーク成分とフロア成分とに分類するための閾値を算出し、算出した閾値を変換係数分類部113に出力する。具体的には、閾値算出部112は、包絡成分除去後の入力変換係数の統計処理を行うことで、閾値を算出する。ここでは、次式(1)に示すように、包絡成分除去後の入力変換係数の絶対値の標準偏差σを用いて閾値Thが算出される場合を一例として説明する。
Figure 0005602769
ここで、cは閾値Thを求めるための係数を表す。また、入力変換係数の絶対値の標準偏差σは、次式(2)に従って算出される。
Figure 0005602769
ここで、S(k)は包絡成分除去後の入力変換係数を表し、Nは入力変換係数の数を表し、Mは包絡成分除去後の入力変換係数の絶対値の平均値を表す。閾値算出部112は、上式(1)及び(2)を用いて閾値Thを算出し、算出した閾値Thを変換係数分類部113に出力する。
変換係数分類部113は、閾値算出部112から入力される閾値Thを用いて、包絡成分除去部111から入力される包絡成分除去後の入力変換係数を、ピーク成分とフロア成分とに分類する。そして、変換係数分類部113は、ピーク成分に分類された入力変換係数を第1変換係数とし、フロア成分として分類された入力変換係数を第2変換係数として特徴パラメータ算出部117にそれぞれ出力する。具体的には、変換係数分類部113は、包絡成分除去後の入力変換係数S(k)の絶対値が閾値Th以上の場合(|S(k)|≧Thの場合)、その入力変換係数S(k)をピーク成分に分類する。一方、変換係数分類部113は、包絡成分除去後の入力変換係数S(k)の絶対値が閾値Th未満の場合(|S(k)|≧Th以外の場合、つまり、|S(k)|<Thの場合)、その入力変換係数S(k)をフロア成分に分類する。
なお、式(1)に示す係数cの大きさは、ピーク成分及びフロア成分の分類に影響を与える。この係数cは、予め設定されている固定値でも、変数でもよい。係数cを変数とする場合は、例えば、CELP符号化のピッチゲインに対応させて変化する変数とすることができる(後述する)。
一方、包絡成分除去部114、閾値算出部115及び変換係数分類部116は、CELP復号変換係数に対して、包絡成分除去部111、閾値算出部112及び変換係数分類部113と同様の処理を行う。すなわち、包絡成分除去部114は、CELP復号変換係数の包絡成分を除去し、閾値算出部115は、包絡成分除去後のCELP復号変換係数をピーク成分とフロア成分とに分類するための閾値を算出し、変換係数分類部116は、包絡成分除去後のCELP復号変換係数をピーク成分とフロア成分とに分類する。そして、変換係数分類部116は、ピーク成分に分類されたCELP復号変換係数を第3変換係数とし、フロア成分として分類されたCELP復号変換係数を第4変換係数として特徴パラメータ算出部117に出力する。
特徴パラメータ算出部117は、変換係数分類部113から入力される第1変換係数、第2変換係数、及び、変換係数分類部116から入力される第3変換係数、第4変換係数を用いて、特徴パラメータを算出する。具体的には、特徴パラメータ算出部117は、包絡成分除去後の入力変換係数のピーク成分(第1変換係数)とフロア成分(第2変換係数)との比、及び、包絡成分除去後のCELP復号変換係数のピーク成分(第3変換係数)とフロア成分(第4変換係数)との比をそれぞれ算出する。そして、特徴パラメータ算出部117は、双方の比の変動量を特徴パラメータとして算出する。
具体的には、特徴パラメータ算出部117は、包絡成分除去後の入力変換係数について、フロア成分の平均エネルギーに対するピーク成分の平均エネルギーの比を求める。例えば、第1変換係数(入力変換係数のピーク成分)をS(k)とし、第2変換係数(入力変換係数のフロア成分)をS(k)とする。この場合、特徴パラメータ算出部117は、次式(3)に従って、第1変換係数S(k)と第2変換係数S(k)との比R12(つまり、入力信号のスペクトルにおけるピーク成分とフロア成分との比)を算出する。
Figure 0005602769
ここで、Nは第1変換係数の数を表し、Nは第2変換係数の数を表す。
同様にして、特徴パラメータ算出部117は、包絡成分除去後のCELP復号変換係数について、フロア成分の平均エネルギーに対するピーク成分の平均エネルギーの比を求める。例えば、第3変換係数(CELP復号変換係数のピーク成分)をS(k)とし、第4変換係数(CELP復号変換係数のフロア成分)をS(k)とする。この場合、特徴パラメータ算出部117は、次式(4)に従って、第3変換係数S(k)と第4変換係数S(k)との比R34(つまり、CELP復号信号のスペクトルにおけるピーク成分とフロア成分との比)を算出する。
Figure 0005602769
ここで、Nは第3変換係数の数を表し、Nは第4変換係数の数を表す。
そして、特徴パラメータ算出部117は、次式(5)に従って、包絡成分除去後の入力変換係数のフロア成分(第2変換係数S(k))の平均エネルギーに対するピーク成分(第1変換係数S(k))の平均エネルギーの比R12と、包絡成分除去後のCELP復号変換係数のフロア成分(第4変換係数S(k))の平均エネルギーに対するピーク成分(第3変換係数S(k))の平均エネルギーの比R34との間の変動量を示す特徴パラメータRを算出する。
Figure 0005602769
つまり、特徴パラメータ算出部117は、CELP復号信号と入力信号との間におけるスペクトルのピーク成分とフロア成分との比の変動量を示す特徴パラメータRを算出する。そして、特徴パラメータ算出部117は、算出した特徴パラメータRを特徴パラメータ符号化部118に出力する。
特徴パラメータ符号化部118は、特徴パラメータ算出部117から入力される特徴パラメータの符号化を行い、特徴パラメータ符号化データを生成する。そして、特徴パラメータ符号化部118は、特徴パラメータ符号化データを、図2に示す多重化部107に出力する。例えば、特徴パラメータ符号化部118は、予め用意されている量子化テーブルと特徴パラメータとのマッチングを行う。そして、特徴パラメータ符号化部118は、量子化テーブルに含まれる複数のパラメータ候補のうち、特徴パラメータとの誤差が最も小さいパラメータ候補を表すインデックスを特徴パラメータ符号化データとして出力する。または、特徴パラメータ符号化部118は、予め設定された算術処理により、特徴パラメータから特徴パラメータ符号化データを直接生成してもよい。
図4は、本実施の形態に係る復号装置の要部構成を示すブロック図である。図4の復号装置200は、符号化装置100(図2)から出力されたビットストリームを入力して復号する。
図4に示す復号装置200において、分離部201は、図示しない通信路(transmission channel)を介して入力されるビットストリームをCELP符号化データと特徴パラメータ符号化データとに分離する。分離部201は、CELP符号化データをCELP復号部202に出力し、特徴パラメータ符号化データを特徴パラメータ復号部204に出力する。
CELP復号部202は、分離部201から入力されるCELP符号化データ(符号化装置100において入力信号を符号化して得られた符号化データ)の復号処理を行い、CELP復号信号を生成し、生成したCELP復号信号をT/F変換部203に出力する。
T/F変換部203は、CELP復号部202から入力されるCELP復号信号を周波数領域に変換してCELP復号変換係数を算出し、CELP復号変換係数を変換係数強調部205に出力する。ここでは、周波数領域への変換には、MDCTを用いる。
特徴パラメータ復号部204は、分離部201から入力される特徴パラメータ符号化データの復号処理を行い、復号特徴パラメータを生成し、生成した復号特徴パラメータを変換係数強調部205に出力する。
変換係数強調部205は、特徴パラメータ復号部204から入力される復号特徴パラメータを用いて、T/F変換部203から入力されるCELP復号変換係数のピーク性を強調する。具体的には、変換係数強調部205は、CELP復号信号と入力信号との間におけるスペクトルのピーク成分とフロア成分との比の変動量を示す復号特徴パラメータを用いて、CELP復号信号のスペクトル(CELP復号変換係数)のピーク成分の振幅調整を行う。変換係数強調部205は、ピーク性を強調後のCELP復号変換係数(以下、強調変換係数)をF/T変換部206に出力する。なお、変換係数強調部205における処理の詳細については後述する。
F/T変換部206は、変換係数強調部205から入力される強調変換係数を時間領域の信号に変換して復号信号を算出し、算出した復号信号を出力する。
次に、図4に示す復号装置200の変換係数強調部205における処理の詳細について説明する。図5は、変換係数強調部205の内部構成を示すブロック図である。
図5に示す変換係数強調部205において、包絡成分除去部211は、包絡成分除去部114(図3)と同様にして、T/F変換部203(図4)から入力されるCELP復号変換係数の包絡成分を除去する。そして、包絡成分除去部211は、包絡成分除去後のCELP復号変換係数を閾値算出部212及び変換係数分類部213に出力する。また、包絡成分除去部211は、CELP復号変換係数の包絡成分及び包絡成分除去後のCELP復号変換係数を包絡成分付与部215に出力する。なお、包絡成分除去部211は、CELP復号変換係数の包絡成分及び包絡成分除去後のCELP復号変換係数を包絡成分付与部215に出力する点において、包絡成分除去部114(図3)と異なる。
閾値算出部212は、閾値算出部115(図3)と同様にして、包絡成分除去部211から入力される包絡成分除去後のCELP復号変換係数を用いて、CELP復号変換係数をピーク成分とフロア成分とに分類するための閾値を算出する。閾値算出部212は、算出した閾値を変換係数分類部213に出力する。
変換係数分類部213は、変換係数分類部116(図3)と同様にして、閾値算出部212から入力される閾値を用いて、包絡成分除去部211から入力される包絡成分除去後のCELP復号変換係数からピーク成分を分類し、ピーク成分に分類されたCELP復号変換係数を第3変換係数として強調部214に出力する。このように、変換係数分類部213は、ピーク成分のみを分類及び出力する点において、変換係数分類部116(図3)と異なる。
強調部214は、特徴パラメータ復号部204(図4)から入力される復号特徴パラメータを用いて、変換係数分類部213から入力される第3変換係数(包絡成分除去後のCELP復号変換係数のピーク成分)を強調する。例えば、強調部214は、次式(6)に示すように、第3変換係数S(k)に復号特徴パラメータRを乗じる。
Figure 0005602769
このようにして、強調部214は、特徴パラメータを用いて、CELP復号信号のスペクトルのピーク成分の振幅調整を行う。そして、強調部214は、強調後の第3変換係数S’(k)を包絡成分付与部215に出力する。
包絡成分付与部215は、強調部214から入力される強調後の第3変換係数に、包絡成分除去部211から入力されるCELP復号変換係数の包絡成分を乗ずることにより、強調後の第3変換係数に包絡成分を付与する。包絡成分付与部215は、包絡成分付与後の第3変換係数をエネルギー調整部216に出力する。
例えば、包絡成分が除去されたCELP復号変換係数をS(k)とする。この場合、包絡成分付与部215は、まず、次式(7)に従って、包絡成分除去後のCELP復号変換係数S(k)の各成分のうち、CELP復号変換係数のピーク成分に対応する位置の成分を、強調後の第3変換係数S’(k)(すなわち、振幅調整されたピーク成分)に置き換えて、変換係数S’(k)を生成する。
Figure 0005602769
ここで、k’はピーク成分に対応する位置を示す。
次いで、包絡成分付与部215は、式(7)に示す変換係数S’(k)に、包絡成分除去部211で求められた包絡成分を乗ずることにより、変換係数S’(k)に包絡成分を付与し、変換係数S’(k)を生成する。そして、包絡成分付与部215は、生成した変換係数S’(k)をエネルギー調整部216に出力する。
エネルギー調整部216は、包絡成分付与部215から入力される変換係数S’(k)のエネルギーが、元のCELP復号変換係数のエネルギーと一致するように、変換係数S’(k)のエネルギーを調整する。そして、エネルギー調整部216は、エネルギー調整後の変換係数S’(k)を強調変換係数として、F/T変換部206(図4)に出力する。
例えば、エネルギー調整部216は、変換係数S’(k)のエネルギーが、元のCELP復号変換係数S(k)のエネルギーと一致するように、次式(8)に従って、エネルギー調整係数gを算出する。
Figure 0005602769
そして、エネルギー調整部216は、次式(9)に示すように、変換係数S’(k)に、エネルギー調整係数gを乗じて、強調変換係数S(k)を生成する。
Figure 0005602769
次に、図6A〜図6Dを用いて、変換係数強調部205(図5)の処理の流れについて詳細に説明する。図6A〜図6Dは、変換係数強調部205に入力されるCELP復号変換係数から強調変換係数が生成されるまでの様子を示している。
具体的には、図6Aに示すように、変換係数強調部205の変換係数分類部213は、包絡成分除去部211で包絡成分が除去されたCELP復号変換係数のうちピーク成分を分類し、第3変換係数を生成する。
次いで、図6Aに示すように、強調部214は、第3変換係数、つまり、包絡成分除去後のCELP復号変換係数のピーク成分の振幅調整を行うことで、ピーク成分を強調する。そして、包絡成分付与部215は、式(7)に従って、包絡成分除去後のCELP復号変換係数のピーク成分を、強調後の第3変換係数に置き換える。これにより、図6Bに示すように、ピーク成分強調後のCELP復号変換係数(式(7)に示すS’(k))が生成される。
次いで、包絡成分付与部215は、図6Bに示すピーク成分強調後のCELP復号変換係数(包絡成分が除去されたCELP復号変換係数)に包絡成分を付与することにより、図6Cに示す変換係数S’(k)を生成する。
そして、エネルギー調整部216は、図6Cに示す変換係数S’(k)のエネルギーがCELP復号変換係数のエネルギーと一致するように、変換係数S’(k)のエネルギー調整を行い、図6Dに示す強調変換係数S(k)を生成する。
このようにして、符号化装置100は、CELP復号信号のスペクトル(CELP復号変換係数)のピーク成分(第3変換係数)とフロア成分(第4変換係数)との比、及び、入力信号のスペクトル(入力変換係数)のピーク成分(第1変換係数)とフロア成分(第2変換係数)との比の間の変動量を特徴パラメータとして算出する。そして、符号化装置100は、特徴パラメータを符号化して得られる特徴パラメータ符号化データを復号装置200に伝送する。一方、復号装置200は、符号化装置100から伝送される特徴パラメータ符号化データを復号して、特徴パラメータ(復号特徴パラメータ)を得て、その特徴パラメータを用いて、CELP復号信号(CELP復号変換係数)のピーク成分(第3変換係数)を強調する(振幅調整を行う)。
つまり、復号装置200は、特徴パラメータを用いて、CELP復号信号のピーク成分とフロア成分との比を制御することで、CELP復号信号のピーク成分とフロア成分との比を、入力信号のピーク成分とフロア成分との比に近づける。これにより、復号信号スペクトルのピーク形状が崩れてしまうこと、及び、スペクトルのピークの山と谷との大きさが抑圧されること(フロア成分の増大)による、CELP復号信号での雑音感が軽減され、復号信号の品質を向上させることが可能となる。
換言すると、符号化装置100は、入力信号を周波数分析して、入力信号のスペクトル(入力変換係数)のピーク性の強さを特徴パラメータとして表し、特徴パラメータを符号化して復号装置200へ伝送する。これにより、復号装置200は、符号化装置100から伝送される特徴パラメータを用いて、入力信号のスペクトル(入力変換係数)のピーク性の強さと同様のピーク性の強さを有する復号信号を生成できるため、復号信号の品質を向上させることができる。すなわち、CELP符号化を行うと復号信号スペクトルのピーク形状が崩れ、フロア成分が増大し、音質が大きく劣化し易い音楽信号に対しても、音質改善効果を得ることができる。
よって、本実施の形態によれば、CELP符号化を用いて音楽信号を符号化する場合でも、復号信号の品質を向上させることができる。
さらに、符号化装置100が、入力信号の周波数成分毎にピーク性の強さを特徴パラメータとして求め、復号装置200が、周波数成分毎にCELP復号信号のピーク性の強さを制御して復号信号を生成することで、音質を改善するための正確な制御が可能となる。これにより、本実施の形態によれば、復号装置200は、周波数成分毎にCELP復号信号のスペクトルのピーク性の強さを制御することができるため、音楽信号の音質改善を図ることができる。
なお、本実施の形態において、符号化装置(特徴パラメータ符号化部)は、特徴パラメータに対して対数変換等の非線形変換を行い、非線形変換後の特徴パラメータに対して符号化処理を行ってもよい。
また、本実施の形態では、包絡成分除去後の変換係数(入力変換係数又はCELP復号変換係数)の絶対値の標準偏差を用いて、変換係数をピーク成分とフロア成分とに分類するための閾値を算出する場合について説明した。しかし、閾値を算出する際、包絡成分除去後の変換係数(入力変換係数又はCELP復号変換係数)の絶対値の平均値を用いてもよい。
なお、本実施の形態では、符号化装置にCELP符号化を用いる構成について説明した。しかし、CELP符号化以外のその他の時間領域の符号化方式、又は、ビットレートの低い符号化方式においても、音楽信号に対する品質が低いという課題がある。そのようなCELP符号化以外の符号化方式に対しても、本発明は適用可能であり、本発明を適用することにより、音楽品質の向上を図ることができる。
また、本発明の特徴は、符号化処理により増大したフロア成分を減衰させて入力信号のスペクトルのピーク性の強さと同様のピーク性の強さを有する復号信号を生成し、品質改善を図る点にある。従って、本実施の形態では、音楽信号に対する有効性を前提に本発明の説明を行っている。しかし、音楽信号に限らず音声信号に対しても、本発明は、フロア成分の減衰による品質改善効果を享受できる。特に、背景雑音などの信号が重畳された音声信号では、符号化処理を行うことでフロア成分が増大する傾向にあり、本発明は、このような場合に対して更に有効である。
(実施の形態2)
本実施の形態では、実施の形態1に加え、さらにCELP符号化におけるピッチゲインを用いて、特徴パラメータを算出する場合について説明する。
以下、本実施の形態について具体的に説明する。図7は、本実施の形態に係る符号化装置の要部構成を示すブロック図である。なお、図7の符号化装置300において、図2に示す符号化装置100と共通する構成部分には、図2と同一の符号を付して説明を省略する。
図7に示す符号化装置300において、CELP復号部301は、CELP符号化部101から入力されるCELP符号化データの復号処理を行い、CELP復号信号を生成し、生成したCELP復号信号をT/F変換部103に出力するとともに、復号処理時に生成されるピッチゲインを復号し、復号後のピッチゲインを特徴パラメータ符号化部302に出力する。ここで、ピッチゲインは、CELP符号化で用いる適応ベクトル(過去の駆動信号を保持する適応符号帳で生成されるベクトル)に乗じられるゲイン値である。また、ピッチゲインは、入力信号の周期性の強さに対応する。例えば、入力信号が母音のように周期性が強い場合には、ピッチゲインは大きくなり、入力信号が子音のように周期性が弱い場合には、ピッチゲインは小さくなるという特徴がある。
特徴パラメータ符号化部302は、T/F変換部103から入力されるCELP復号変換係数、T/F変換部105から入力される入力変換係数、及び、CELP復号部301から入力されるピッチゲインを用いて、特徴パラメータの算出及び符号化を行い、特徴パラメータ符号化データを生成する。
次に、図7に示す符号化装置300の特徴パラメータ符号化部302における処理の詳細について説明する。図8は、特徴パラメータ符号化部302の内部構成を示すブロック図である。なお、図8の特徴パラメータ符号化部302において、図3に示す特徴パラメータ符号化部106と共通する構成部分には、図3と同一の符号を付して説明を省略する。
図8に示す特徴パラメータ符号化部302において、閾値算出部311は、包絡成分除去部111から入力される包絡成分除去後の入力変換係数、及び、CELP復号部301(図7)から入力されるピッチゲインを用いて、入力変換係数をピーク成分とフロア成分とに分類するための閾値を算出する。
ここで、実施の形態1では、閾値算出部112(図3)が、包絡成分除去後の入力変換係数の統計値(入力変換係数の絶対値の標準偏差)に係数cを乗じる場合(式(1))について説明した。これに対して、本実施の形態に係る閾値算出部311は、ピッチゲインを用いて、上記入力変換係数の統計値に乗じる係数の値を調整する。
具体的には、閾値算出部311は、ピッチゲインに対応する係数のテーブルを保持し、テーブルに記憶されている係数の候補群のうち、入力されるピッチゲインに応じた候補を用いる。例えば、ピッチゲインをgとすると、閾値算出部311は、次式(10)に従って、閾値Thを算出する。
Figure 0005602769
ここで、c[]は係数の候補群を記憶しているテーブルを表し、ピッチゲインgが大きいほど大きな係数が選択されるように、テーブルc[]は最小値から最大値の順に係数を記憶している。また、Nはテーブルが記憶している係数(候補)の個数を表し、g_maxはピッチゲインが取り得る最大値を表す。また、関数INT(x)は引数xの整数値を出力する関数を表す。
このように、閾値算出部311は、ピッチゲインgが大きいほど(周期性が強いほど)、閾値算出に用いる係数の値を大きくすることで、変換係数をピーク成分として分類するための閾値Thをより高く設定する。これにより、ピーク性の強い変換係数のみをピーク成分として選択できるようになり、より正確な特徴パラメータの算出を実現することができる。
また、閾値算出部312は、閾値算出部311と同様にして、包絡成分除去部114から入力される包絡成分除去後のCELP復号変換係数、及び、CELP復号部301(図7)から入力されるピッチゲインを用いて、CELP復号変換係数をピーク成分とフロア成分とに分類するための閾値を算出する。
図9は、本実施の形態に係る復号装置の要部構成を示すブロック図である。なお、図9の復号装置400において、図4に示す復号装置200と共通する構成部分には、図4と同一の符号を付して説明を省略する。
図9に示す復号装置400において、CELP復号部401は、CELP復号部301(図7)と同様、CELP符号化データを復号してCELP復号信号を生成するとともに、復号処理時に生成されるピッチゲインを復号し、復号後のピッチゲインを変換係数強調部402に出力する。
変換係数強調部402は、特徴パラメータ復号部204から入力される復号特徴パラメータ及びCELP復号部401から入力されるピッチゲインを用いて、T/F変換部203から入力されるCELP復号変換係数のピーク性を強調する。
次に、図9に示す復号装置400の変換係数強調部402における処理の詳細について説明する。図10は、変換係数強調部402の内部構成を示すブロック図である。なお、図10の変換係数強調部402において、図5に示す変換係数強調部205と共通する構成部分には、図5と同一の符号を付して説明を省略する。
図10に示す変換係数強調部402において、閾値算出部411は、閾値算出部312(図8)と同様にして、包絡成分除去後のCELP復号変換係数、及び、CELP復号部401(図9)から入力されるピッチゲインを用いて、CELP復号変換係数からピーク成分を分類するための閾値(式(10)に示す閾値Th)を算出する。
このようにして、符号化装置300及び復号装置400は、入力信号の周期性の強さに対応するピッチゲインを用いて、CELP符号化によるピーク成分に対する符号化性能を推定し、推定結果に基づいて特徴パラメータの算出処理(具体的には閾値)を制御する。この場合でも、実施の形態1と同様、CELP復号信号での雑音感が軽減され、復号信号の品質を向上させることが可能となる。
さらに、本実施の形態では、符号化装置300は、CELP符号化におけるピッチゲインを用いて特徴パラメータを算出する。これにより、復号装置400は、スペクトルのピーク成分に対するCELP符号化の符号化性能に応じて、CELP復号信号のスペクトルのピーク性の強さを調整することが可能となるため、CELP復号信号の更なる音質改善効果を得ることができる。
よって、本実施の形態によれば、CELP符号化を用いて音楽信号を符号化する場合、実施の形態1よりも更に、復号信号の品質を向上させることができる。
なお、本実施の形態では、入力信号の周期性の強さを測る際にピッチゲインを用いる場合について説明したが、入力信号の周期性の強さを測る際に、ピッチゲインの代わりに、入力信号を相関分析して得られる相関値を用いてもよい。または、ピッチゲインと上記相関値とを組み合わせて、入力信号の周期性の強さを求めてもよい。
(実施の形態3)
実施の形態1及び実施の形態2では、符号化装置は、変換係数(入力変換係数又はCELP復号変換係数)をピーク成分とフロア成分とに分類する際に1つの閾値を用いる場合について説明した。これに対して、本実施の形態では、符号化装置は、変換係数をピーク成分に分類するための閾値、及び、変換係数をフロア成分に分類するための閾値の2つの閾値を用いる場合について説明する。
以下、本実施の形態について具体的に説明する。図11は、本実施の形態に係る符号化装置100(図2)の特徴パラメータ符号化部の内部構成を示すブロック図である。なお、図11の特徴パラメータ符号化部106aにおいて、図3に示す特徴パラメータ符号化部106と共通する構成部分には、図3と同一の符号を付して説明を省略する。
図11に示す特徴パラメータ符号化部106aにおいて、閾値算出部112aは、包絡成分除去部111から入力される包絡成分除去後の入力変換係数を用いて、入力変換係数をピーク成分(第1変換係数)に分類するための第1閾値、及び、入力変換係数をフロア成分(第2変換係数)に分類するための第2閾値を算出する。
例えば、閾値算出部112aは、式(1)と同様にして、次式(11)及び(12)に示すように、包絡成分除去後の入力変換係数の絶対値の標準偏差σを用いて、第1閾値Th及び第2閾値Thを算出する。
Figure 0005602769
Figure 0005602769
ここで、c及びcは第1閾値Th及び第2閾値Thを算出するための係数を表し、次式(13)の関係を有する。
Figure 0005602769
変換係数分類部113aは、閾値算出部112aで算出された第1閾値Th及び第2閾値Thを用いて、包絡成分除去部111から入力される包絡成分除去後の入力変換係数を、ピーク成分(第1変換係数)及びフロア成分(第2変換係数)に分類し、いずれにも属さない成分を、その他の成分としてどちらにも分類しない。具体的には、変換係数分類部113aは、包絡成分除去後の入力変換係数S(k)の絶対値が第1閾値Th以上の場合(つまり、|S(k)|≧Thの場合)、その入力変換係数S(k)をピーク成分(第1変換係数)に分類する。また、変換係数分類部113aは、包絡成分除去後の入力変換係数S(k)の絶対値が第2閾値Th以下の場合(つまり、|S(k)|≦Thの場合)、その入力変換係数S(k)をフロア成分(第2変換係数)に分類する。一方、変換係数分類部113aは、包絡成分除去後の入力変換係数S(k)の絶対値が第1閾値Th未満であり、かつ、第2閾値Thより大きい場合(つまり、Th<|S(k)|<Thの場合)、その入力変換係数S(k)を、その他の成分(ピーク成分及びフロア成分のいずれにも属さない成分)としてどちらにも分類しない。
また、閾値算出部115aは、閾値算出部112aと同様にして、CELP復号変換係数のピーク成分(第3変換係数)を分類するための第3閾値、及び、CELP復号変換係数のフロア成分(第4変換係数)を分類するための第4閾値を算出する。また、変換係数分類部116aは、変換係数分類部113aと同様にして、第3閾値及び第4閾値を用いて、包絡成分除去後のCELP復号変換係数をピーク成分(第3変換係数)及びフロア成分(第4変換係数)に分類し、いずれにも属さない成分を、その他の成分としてどちらにも分類しない。
図12は、本実施の形態に係る復号装置200(図4)の変換係数強調部の内部構成を示すブロック図である。なお、図12の変換係数強調部205aにおいて、図5に示す変換係数強調部205と共通する構成部分には、図5と同一の符号を付して説明を省略する。
図12に示す変換係数強調部205aにおいて、閾値算出部212aは、閾値算出部115a(図11)と同様にして、CELP復号変換係数のピーク成分(第3変換係数)を分類するための第3閾値を算出する。また、変換係数分類部213aは、変換係数分類部116aと同様にして、閾値算出部212aから入力される第3閾値を用いて、CELP復号変換係数からピーク成分(第3変換係数)を分類する。
このようにして、本実施の形態では、符号化装置100(特徴パラメータ符号化部106a)は、2つの閾値を用いることで、ピーク成分及びフロア成分のいずれに属するかを明確に判断できない成分(例えば、Th<|S(k)|<Thを満たす成分)を除外して、特徴パラメータを算出することができる。これにより、符号化装置100は、変換係数(入力変換係数又はCELP復号変換係数)のピーク成分とフロア成分との比を、実施の形態1よりも精度良く算出することができる。つまり、本実施の形態に係る符号化装置100は、特徴パラメータを、実施の形態1よりも精度良く算出することが可能となり、復号装置200において復号される音楽信号の音質改善効果を更に向上することができる。
よって、本実施の形態によれば、CELP符号化を用いて音楽信号を符号化する場合、実施の形態1よりも更に、復号信号の品質を向上させることができる。
(実施の形態4)
本実施の形態では、低位レイヤ(又は基本レイヤ)にCELP符号化を用いて、高位レイヤ(又は拡張レイヤ)に変換符号化を用いるスケーラブル符号化を行う場合について説明する。
以下、本実施の形態について具体的に説明する。図13は、本実施の形態に係る符号化装置の要部構成を示すブロック図である。なお、図13の符号化装置500において、図2に示す符号化装置100と共通する構成部分には、図2と同一の符号を付して説明を省略する。
図13に示す符号化装置500は、少なくとも低位レイヤと高位レイヤとを有するスケーラブル符号化を行う符号化装置である。ここでは、符号化装置500は、低位レイヤにおいて、入力信号をCELP符号化してCELP符号化データ(第1符号化データ)を生成する。また、符号化装置500は、高位レイヤにおいて、CELP符号化データの復号信号と入力信号との差である誤差信号を周波数領域で符号化(変換符号化)して変換符号化データ(第2符号化データ)を生成する。
具体的には、図13の符号化装置500において、減算部501は、遅延部104から入力される遅延調整後の入力信号から、CELP復号部102から入力されるCELP復号信号を減じて、誤差信号を生成し、生成した誤差信号をT/F変換部502に出力する。
T/F変換部502は、減算部501から入力される誤差信号を周波数領域に変換して誤差変換係数を算出し、誤差変換係数を変換符号化部503に出力する。ここでは、周波数領域への変換には、MDCT(Modified Discrete Cosine Transform:修正離散コサイン変換)を用いる。
変換符号化部503は、T/F変換部502から入力される誤差変換係数の符号化処理を行い、変換符号化データを生成する。このとき、高位レイヤにおける符号化部である変換符号化部503は、入力信号の全帯域のうち一部の帯域におけるCELP復号信号と入力信号との差である誤差信号を符号化して、変換符号化データを生成する。変換符号化部503は、生成した変換符号化データを多重化部504に出力する。
多重化部504は、CELP符号化部101から入力されるCELP符号化データと変換符号化部503から入力される変換符号化データとを多重化して、ビットストリームを生成し、ビットストリームを図示しない通信路(transmission channel)を介して復号装置に出力する。
図14は、本実施の形態に係る復号装置の要部構成を示すブロック図である。なお、図14の復号装置600において、図4に示す復号装置200と共通する構成部分には、図4と同一の符号を付して説明を省略する。
図14に示す復号装置600において、分離部601は、図示しない通信路(transmission channel)を介して入力されるビットストリームをCELP符号化データと変換符号化データとに分離する。分離部601は、CELP符号化データをCELP復号部202に出力し、変換符号化データを変換復号部602に出力する。
変換復号部602は、分離部601から入力される変換符号化データの復号処理を行い、復号誤差変換係数を生成し、生成した復号誤差変換係数を変換係数強調部603に出力する。
変換係数強調部603は、まず、T/F変換部203から入力されるCELP復号変換係数及び変換復号部602から入力される復号誤差変換係数を用いて、高位レイヤで品質が改善された帯域における改善量がどの程度であるかを算出する。具体的には、変換係数強調部603は、高位レイヤでCELP復号信号の品質が改善される一部の帯域において、CELP復号信号と、CELP復号信号及び誤差信号を用いて得られる復号変換係数との間における、スペクトルのピーク成分とフロア成分との比の変動量を示す特徴パラメータを算出する。そして、変換係数強調部603は、改善量の算出結果(つまり、特徴パラメータ)に基づいて、CELP復号変換係数を強調する。具体的には、変換係数強調部603は、特徴パラメータを用いて、上記一部の帯域以外の帯域(高位レイヤでCELP復号信号の品質が改善されない帯域)におけるCELP復号信号のスペクトルのピーク成分の振幅調整を行う。変換係数強調部603は、強調後のCELP復号変換係数を強調変換係数として、F/T変換部206に出力する。
次に、図14に示す復号装置600の変換係数強調部603における処理の詳細について説明する。図15は、変換係数強調部603の内部構成を示すブロック図である。なお、図15の変換係数強調部603において、図3に示す特徴パラメータ符号化部106及び図5に示す変換係数強調部205と共通する構成部分には、図3及び図5と同一の符号を付して説明を省略する。
図15に示す変換係数強調部603において、加算部611は、T/F変換部203から入力されるCELP復号変換係数と、変換復号部602から入力される復号誤差変換係数とを加算して、復号変換係数を生成する。この復号変換係数は、図3における入力変換係数(入力信号のスペクトル)に対応する。この加算処理により、CELP復号変換係数では、復号誤差変換係数に対応する帯域の品質が改善される。加算部611は、生成した復号変換係数を、包絡成分除去部612及びエネルギー調整部216に出力する。
包絡成分除去部612は、包絡成分除去部111(図3)と同様にして、加算部611から入力される復号変換係数の包絡成分(スペクトルの概形成分)を除去する。そして、包絡成分除去部612は、包絡成分除去後の復号変換係数を強調変換係数生成部616に出力する。また、包絡成分除去部612は、高位レイヤ(拡張レイヤ)において品質改善された帯域(以下、改善帯域という)に含まれる、包絡成分除去後の復号変換係数を閾値算出部112及び変換係数分類部113に出力する。一方、包絡成分除去部612は、高位レイヤ(拡張レイヤ)において品質改善されていない帯域(以下、非改善帯域という)に含まれる、包絡成分除去後の復号変換係数を閾値算出部613及び変換係数分類部614に出力する。なお、高位レイヤにてCELP復号変換係数の品質改善が為された帯域の復号誤差変換係数には、何らかの値が格納されている。よって、包絡成分除去部612は、復号誤差変換係数の各帯域における成分を調べることにより、どの帯域でCELP復号変換係数の品質改善が為されたかを判断することができる。
よって、図15に示すように、特徴パラメータ算出部117には、改善帯域における復号変換係数(図3における入力変換係数に対応)のピーク成分(第1変換係数(改善帯域))及びフロア成分(第2変換係数(改善帯域))が変換係数分類部113から入力される。
また、閾値算出部115及び変換係数分類部116には、改善帯域における、包絡成分除去後のCELP復号変換係数が入力される。よって、図15に示すように、特徴パラメータ算出部117には、改善帯域におけるCELP復号変換係数のピーク成分(第3変換係数(改善帯域))及びフロア成分(第4変換係数(改善帯域))が変換係数分類部116から入力される。
これにより、特徴パラメータ算出部117は、実施の形態1と同様にして、第1変換係数(改善帯域)、第2変換係数(改善帯域)、第3変換係数(改善帯域)、第4変換係数(改善帯域)を用いて、特徴パラメータを算出する。つまり、特徴パラメータ算出部117は、改善帯域(入力信号の一部の帯域)において、CELP復号変換係数(つまり、CELP復号信号)及び復号誤差変換係数(つまり、誤差信号)を用いて得られる復号変換係数(つまり、復号入力信号)と、CELP復号変換係数(CELP復号信号)との間におけるスペクトルのピーク成分とフロア成分との比の変動量を示す特徴パラメータを算出する。特徴パラメータ算出部117は、算出した特徴パラメータを強調部615に出力する。
一方、閾値算出部613は、閾値算出部112と同様にして、包絡成分除去部612から入力される、非改善帯域に含まれる復号変換係数に対する閾値を算出する。また、変換係数分類部614は、変換係数分類部113と同様にして、閾値算出部613から入力される閾値を用いて、非改善帯域に含まれる復号変換係数からピーク成分を分類し、ピーク成分に対応する復号変換係数である、第1変換係数(非改善帯域)を強調部615に出力する。
強調部615は、特徴パラメータ算出部117から入力される特徴パラメータを用いて、変換係数分類部614から入力される第1変換係数(非改善帯域)を強調する。つまり、強調部615は、特徴パラメータを用いて、入力信号の全帯域のうち改善帯域以外の帯域である非改善帯域におけるCELP復号信号のスペクトル(第1変換係数(非改善帯域))のピーク成分の振幅調整を行う。
すなわち、強調部615は、改善帯域におけるCELP復号信号のスペクトルのピーク成分とフロア成分との比、及び、改善帯域における入力信号のスペクトル(図15では復号変換係数)のピーク成分とフロア成分との比の間の変動量を示す特徴パラメータを用いて、非改善帯域におけるCELP復号信号のスペクトル(CELP復号変換係数)のピーク成分を強調する。強調部615は、強調後の第1変換係数(非改善帯域)を強調変換係数生成部616に出力する。
強調変換係数生成部616は、包絡成分除去部612から入力される包絡成分除去後の復号変換係数のうち、非改善帯域に含まれ、かつ、ピーク成分として判定された成分を、強調部615から入力される強調後の第1変換係数(非改善帯域)(すなわち、振幅調整されたピーク成分)に置き換えて、強調変換係数を生成する。
そして、実施の形態1と同様にして、包絡成分付与部215は、包絡成分除去部612から入力される復号変換係数の包絡成分を用いて、強調変換係数生成部616から入力される強調変換係数に包絡成分を付与し、エネルギー調整部216は、強調変換係数のエネルギー調整を行う。
次に、図16を用いて、変換係数強調部603(図15)の処理の流れについて詳細に説明する。
具体的には、加算部611は、CELP復号変換係数と、図16Aに示す復号誤差変換係数とを加算して、復号変換係数を生成し、包絡成分除去部612は、復号変換係数の包絡成分を除去する。なお、変換係数強調部603では、図16Aに示すように、復号誤差変換係数の値を調べることで、各周波数帯域が改善帯域及び非改善帯域のいずれであるかを判断することができる。
次いで、変換係数分類部113は、図16Bに示す包絡成分除去後の復号変換係数のうち、改善帯域に含まれる復号変換係数をピーク成分(第1変換係数(改善帯域))とフロア成分(第2変換係数(改善帯域))とに分類し、特徴パラメータ算出部117に出力する。同様にして、変換係数分類部116は、図16Cに示す包絡成分除去後のCELP復号変換係数のうち、改善帯域に含まれるCELP復号変換係数をピーク成分(第3変換係数(改善帯域))とフロア成分(第4変換係数(改善帯域))とに分類し、特徴パラメータ算出部117に出力する。
そして、特徴パラメータ算出部117は、第1変換係数(改善帯域)〜第4変換係数(改善帯域)を用いて、特徴パラメータを算出する。
一方、変換係数分類部614は、図16Bに示す包絡成分除去後の復号変換係数のうち、非改善帯域に含まれる復号変換係数のピーク成分(第1変換係数(非改善帯域))を分類して、強調部615に出力する。そして、強調部615は、特徴パラメータ算出部117で算出された特徴パラメータを用いて、非改善帯域に含まれる復号変換係数のピーク成分を強調する。例えば、強調部615は、実施の形態1の式(6)と同様にして、非改善帯域に含まれる復号変換係数のピーク成分(第1変換係数(非改善帯域))に、特徴パラメータを乗算することで強調処理(振幅調整)を行う。
そして、強調変換係数生成部616は、図16Bに示す復号変換係数のうちの非改善帯域に含まれ、かつ、ピーク成分に相当する成分を、強調部615で強調された第1変換係数(非改善帯域)に置き換えることにより、図16Dに示す強調変換係数を生成する。
そして、包絡成分付与部215が、図16Dに示す強調変換係数に包絡成分を付与し、エネルギー調整部216が、強調変換係数のエネルギー調整を行うことにより、図16Eに示す強調変換係数が得られる。
このようにして、復号装置600は、改善帯域におけるCELP復号信号と入力信号(復号変換係数)との間のスペクトルの変動量(ピーク成分とフロア成分との比の変動量)を示す特徴パラメータを用いて、非改善帯域におけるCELP復号信号のピーク成分とフロア成分との比を制御する。すなわち、復号装置600は、非改善帯域におけるCELP復号信号のピーク成分とフロア成分との比を、改善帯域におけるCELP復号信号のピーク成分とフロア成分との比に近づける。これにより、復号装置600は、非改善帯域でも、改善帯域におけるCELP復号信号のスペクトルのピーク性の強さと同様のピーク性の強さを有するCELP復号信号を生成できる。
ここで、スケーラブル符号化において、高位レイヤに十分なビット配分が為されていれば、符号化装置は誤差変換係数の符号化を全帯域で行える。しかし、低ビットレート化を実現するために、高位レイヤのビット配分が少ない場合、符号化装置は誤差変換係数の符号化を一部の帯域でしか行うことができないという制約が生じる。
これに対して、本実施の形態では、高位レイヤで品質改善された帯域(改善帯域)とそれ以外の帯域(非改善帯域)との品質改善量の違いに着目し、復号装置600は、高位レイヤで品質改善された帯域(改善帯域)の改善量を特徴パラメータとして表す。そして、復号装置600は、特徴パラメータに基づいて、高位レイヤで品質改善されなかった帯域(非改善帯域)のピーク性を調整(強調)する。
これにより、本実施の形態では、復号装置600で特徴パラメータを算出することが可能となり、符号化装置500から復号装置600への特徴パラメータの伝送が不要となる。つまり、スケーラブル符号化を行う場合には、ビットレートを増加させることなく、音質改善効果を得ることができる。
このようにして、本実施の形態によれば、低位レイヤと高位レイヤとを有するスケーラブル符号化が行われる際に、CELP符号化を用いて音楽信号を符号化する場合でも、実施の形態1と同様、復号信号の品質を向上させることができる。
以上、本発明の各実施の形態について説明した。
なお、上記実施の形態では、入力信号の全帯域に対して、特徴パラメータの算出、符号化及び変換係数の強調処理を行う場合について説明した。しかし、本発明では、これに限らず、入力信号の全帯域を複数のサブバンドに分割して、各サブバンドについて、特徴パラメータの算出、符号化及び変換係数の強調処理をそれぞれ行う構成でもよい。これにより、復号装置では、変換係数の強調処理をより細かい単位で行うことができるため、音楽信号の音質をさらに改善することができる。
また、上記実施の形態では、特徴パラメータの符号化及び変換係数の強調処理を行う際に、入力変換係数(又は復号変換係数)及びCELP復号変換係数をそのまま用いる場合について説明した。しかし、本発明では、特徴パラメータの符号化及び変換係数の強調処理を行う際に、入力変換係数及びCELP復号変換係数をそのまま用いる代わりに、移動平均等のスムージング処理後の入力変換係数及びCELP復号変換係数を用いてもよい。これにより、入力変換係数及びCELP復号変換係数において、特徴パラメータの符号化及び変換係数の強調処理を行う際に、極端に大きな変換係数から受ける影響を緩和することができ、より安定した符号化処理及び強調処理を行うことができる。これにより、音楽信号の音質をさらに改善することができる。
また、上記実施の形態に係るT/F変換部は、DFT(Discrete Fourier Transform)、FFT(Fast Fourier Transform)、DCT(Discrete Cosine Transform)、MDCT(Modified Discrete Cosine Transform)、フィルタバンク等を使用できる。
また、上記各実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部又は全てを含むように1チップ化されてもよい。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用してもよい。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
2010年1月14日出願の特願2010−006260の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
開示に係る符号化装置、復号装置、符号化方法及び復号方法等は、特に音声・音楽のコーデックに好適である。
100、300、500 符号化装置
200、400、600 復号装置
101 CELP符号化部
102、202、301、401 CELP復号部
103、105、203、502 T/F変換部
104 遅延部
106、106a、302 特徴パラメータ符号化部
107、504 多重化部
201、601 分離部
204 特徴パラメータ復号部
205、205a、402、603 変換係数強調部
206 F/T変換部
111、114、211、612 包絡成分除去部
112、112a、115、115a、212、212a、311、312、411、613 閾値算出部
113、113a、116、116a、213、213a、614 変換係数分類部
117 特徴パラメータ算出部
118 特徴パラメータ符号化部
214、615 強調部
215 包絡成分付与部
216 エネルギー調整部
501 減算部
503 変換符号化部
602 変換復号部
611 加算部
616 強調変換係数生成部

Claims (6)

  1. 入力信号をCELP(Code Excited Linear Prediction)符号化して第1符号化データを生成する第1符号化手段と、
    前記第1符号化データを復号してCELP復号信号を生成する復号手段と、
    前記CELP復号信号のスペクトルのピーク成分とフロア成分との比と、前記入力信号のスペクトルのピーク成分とフロア成分との比、との間の変動量を示すパラメータを算出し符号化して第2符号化データを生成する第2符号化手段と、
    前記第1符号化データおよび前記第2符号化データを多重化して出力する多重化手段と、
    を具備する符号化装置。
  2. 前記第2符号化手段は、前記ピーク成分と前記フロア成分とを、前記CELP符号化におけるピッチゲインに従い決定する、
    請求項1記載の符号化装置。
  3. 請求項1記載の符号化装置から前記第1符号化データおよび前記第2符号化データを受信し分離する分離部と、
    前記第1符号化データを復号して前記CELP復号信号を生成する第1復号手段と、
    前記第2符号化データを復号して前記パラメータを生成する第2復号手段と、
    前記パラメータを用いて、前記CELP復号信号のスペクトルのピーク成分の振幅調整を行う調整手段と、
    を具備する復号装置。
  4. 低位レイヤと高位レイヤとを有するスケーラブル符号化を行う符号化装置の前記低位レイヤにおいて入力信号のCELP(Code Excited Linear Prediction)符号化を行うことにより生成された第1符号化データ、および、前記符号化装置の前記高位レイヤにおいて一部の帯域における前記第1符号化データを復号して得られたCELP復号信号と前記入力信号との差である誤差信号を符号化することにより生成された第2符号化データ、を受信し分離する分離部と、
    前記第1符号化データを復号してCELP復号信号を生成する第1復号手段と、
    前記第2符号化データを復号して、前記誤差信号を得る第2復号手段と、
    前記CELP復号信号のスペクトルのピーク成分とフロア成分との比と、前記CELP復号信号および前記誤差信号を用いて得られる復号信号の前記一部の帯域でのスペクトルのピーク成分とフロア成分との比、との間の変動量を示すパラメータを用いて、前記一部の帯域以外の帯域における前記復号信号のスペクトルのピーク成分の振幅調整を行う調整手段と、
    を具備する復号装置。
  5. 入力信号をCELP(Code Excited Linear Prediction)符号化して第1符号化データを生成するステップと、
    前記第1符号化データを復号してCELP復号信号を生成するステップと、
    前記CELP復号信号のスペクトルのピーク成分とフロア成分との比と、前記入力信号のスペクトルのピーク成分とフロア成分との比、との間の変動量を示すパラメータを算出し符号化して第2符号化データを生成するステップと、
    前記第1符号化データおよび前記第2符号化データを多重化して出力するステップと、
    を具備する符号化方法。
  6. 請求項5記載の符号化方法で符号化した前記第1符号化データおよび前記第2符号化データを受信し分離するステップと、
    前記第1符号化データを復号して前記CELP復号信号を生成するステップと、
    前記第2符号化データを復号して前記パラメータを生成するステップと、
    前記パラメータを用いて、前記CELP復号信号のスペクトルのピーク成分の振幅調整を行うステップと、
    を具備する復号方法。
JP2011549935A 2010-01-14 2011-01-13 符号化装置、復号装置、符号化方法及び復号方法 Expired - Fee Related JP5602769B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011549935A JP5602769B2 (ja) 2010-01-14 2011-01-13 符号化装置、復号装置、符号化方法及び復号方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2010006260 2010-01-14
JP2010006260 2010-01-14
JP2011549935A JP5602769B2 (ja) 2010-01-14 2011-01-13 符号化装置、復号装置、符号化方法及び復号方法
PCT/JP2011/000133 WO2011086923A1 (ja) 2010-01-14 2011-01-13 符号化装置、復号装置、スペクトル変動量算出方法及びスペクトル振幅調整方法

Publications (2)

Publication Number Publication Date
JPWO2011086923A1 JPWO2011086923A1 (ja) 2013-05-16
JP5602769B2 true JP5602769B2 (ja) 2014-10-08

Family

ID=44304199

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011549935A Expired - Fee Related JP5602769B2 (ja) 2010-01-14 2011-01-13 符号化装置、復号装置、符号化方法及び復号方法

Country Status (4)

Country Link
US (1) US8892428B2 (ja)
JP (1) JP5602769B2 (ja)
CN (1) CN102714040A (ja)
WO (1) WO2011086923A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013063688A1 (en) * 2011-11-03 2013-05-10 Voiceage Corporation Improving non-speech content for low rate celp decoder
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
PT3058567T (pt) * 2013-10-18 2017-07-27 ERICSSON TELEFON AB L M (publ) Codificação de posições de picos espectrais
ES2738723T3 (es) * 2014-05-01 2020-01-24 Nippon Telegraph & Telephone Dispositivo de generación de secuencia envolvente combinada periódica, método de generación de secuencia envolvente combinada periódica, programa de generación de secuencia envolvente combinada periódica y soporte de registro
ES2911527T3 (es) 2014-05-01 2022-05-19 Nippon Telegraph & Telephone Dispositivo de descodificación de señales de sonido, método de descodificación de señales de sonido, programa y soporte de registro
PL3139380T3 (pl) * 2014-05-01 2019-09-30 Nippon Telegraph And Telephone Corporation Koder, dekoder, sposób kodowania, sposób dekodowania, program kodujący, program dekodujący i nośnik rejestrujący
US10325609B2 (en) * 2015-04-13 2019-06-18 Nippon Telegraph And Telephone Corporation Coding and decoding a sound signal by adapting coefficients transformable to linear predictive coefficients and/or adapting a code book
JP6962269B2 (ja) * 2018-05-10 2021-11-05 日本電信電話株式会社 ピッチ強調装置、その方法、およびプログラム
CN112639968A (zh) * 2018-08-30 2021-04-09 杜比国际公司 用于控制对经低比特率编码的音频的增强的方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5890108A (en) * 1995-09-13 1999-03-30 Voxware, Inc. Low bit-rate speech coding system and method using voicing probability determination
JP2002099300A (ja) * 2000-09-26 2002-04-05 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化方法及び装置
JP2002123298A (ja) * 2000-10-18 2002-04-26 Nippon Telegr & Teleph Corp <Ntt> 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体
WO2009000073A1 (en) * 2007-06-22 2008-12-31 Voiceage Corporation Method and device for sound activity detection and sound signal classification
WO2009081568A1 (ja) * 2007-12-21 2009-07-02 Panasonic Corporation 符号化装置、復号装置および符号化方法
WO2009084221A1 (ja) * 2007-12-27 2009-07-09 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
WO2010077557A1 (en) * 2008-12-29 2010-07-08 Motorola, Inc. Selective scaling mask computation based on peak detection

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6260009B1 (en) 1999-02-12 2001-07-10 Qualcomm Incorporated CELP-based to CELP-based vocoder packet translation
CN1430204A (zh) 2001-12-31 2003-07-16 佳能株式会社 波形信号分析、基音探测以及句子探测的方法和设备
EP1489599B1 (en) * 2002-04-26 2016-05-11 Panasonic Intellectual Property Corporation of America Coding device and decoding device
KR100446242B1 (ko) 2002-04-30 2004-08-30 엘지전자 주식회사 음성 부호화기에서 하모닉 추정 방법 및 장치
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
KR100851970B1 (ko) * 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
CN101308659B (zh) * 2007-05-16 2011-11-30 中兴通讯股份有限公司 一种基于先进音频编码器的心理声学模型的处理方法
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5890108A (en) * 1995-09-13 1999-03-30 Voxware, Inc. Low bit-rate speech coding system and method using voicing probability determination
JP2002099300A (ja) * 2000-09-26 2002-04-05 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化方法及び装置
JP2002123298A (ja) * 2000-10-18 2002-04-26 Nippon Telegr & Teleph Corp <Ntt> 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体
WO2009000073A1 (en) * 2007-06-22 2008-12-31 Voiceage Corporation Method and device for sound activity detection and sound signal classification
WO2009081568A1 (ja) * 2007-12-21 2009-07-02 Panasonic Corporation 符号化装置、復号装置および符号化方法
WO2009084221A1 (ja) * 2007-12-27 2009-07-09 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
WO2010077557A1 (en) * 2008-12-29 2010-07-08 Motorola, Inc. Selective scaling mask computation based on peak detection

Also Published As

Publication number Publication date
US20120296659A1 (en) 2012-11-22
JPWO2011086923A1 (ja) 2013-05-16
CN102714040A (zh) 2012-10-03
WO2011086923A1 (ja) 2011-07-21
US8892428B2 (en) 2014-11-18

Similar Documents

Publication Publication Date Title
JP5602769B2 (ja) 符号化装置、復号装置、符号化方法及び復号方法
JP6570151B2 (ja) 符号化装置、復号装置、符号化方法および復号方法
KR101414354B1 (ko) 부호화 장치 및 부호화 방법
JP5036317B2 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
RU2667382C2 (ru) Улучшение классификации между кодированием во временной области и кодированием в частотной области
KR102070432B1 (ko) 대역폭 확장을 위한 고주파수 부호화/복호화 방법 및 장치
US8121850B2 (en) Encoding apparatus and encoding method
CN110097896B (zh) 语音处理的清浊音判决方法及装置
WO2007037361A1 (ja) 音声符号化装置および音声符号化方法
JPWO2007043648A1 (ja) 変換符号化装置および変換符号化方法
US20130173275A1 (en) Audio encoding device and audio decoding device
KR20100063127A (ko) 오디오 코딩 시스템내에서 향상 계층을 발생시키는 방법 및 장치
US8909539B2 (en) Method and device for extending bandwidth of speech signal
KR20070121254A (ko) 광대역 부호화 및 복호화 방법 및 장치
WO2006041055A1 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
JP2020204784A (ja) 信号符号化方法及びその装置、並びに信号復号方法及びその装置
JP2009042740A (ja) 符号化装置
CN105765653B (zh) 自适应高通后滤波器
JP5544370B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5711733B2 (ja) 復号装置、符号化装置及びこれらの方法
Żernicki et al. Enhanced coding of high-frequency tonal components in MPEG-D USAC through joint application of ESBR and sinusoidal modeling
KR101804922B1 (ko) 오디오 신호 처리 방법 및 장치
WO2013057895A1 (ja) 符号化装置及び符号化方法
JP3612260B2 (ja) 音声符号化方法及び装置並びに及び音声復号方法及び装置
JPWO2007037359A1 (ja) 音声符号化装置および音声符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140507

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20140604

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140703

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140812

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140820

R150 Certificate of patent or registration of utility model

Ref document number: 5602769

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees