JP2013242514A5 - - Google Patents

Download PDF

Info

Publication number
JP2013242514A5
JP2013242514A5 JP2012254496A JP2012254496A JP2013242514A5 JP 2013242514 A5 JP2013242514 A5 JP 2013242514A5 JP 2012254496 A JP2012254496 A JP 2012254496A JP 2012254496 A JP2012254496 A JP 2012254496A JP 2013242514 A5 JP2013242514 A5 JP 2013242514A5
Authority
JP
Japan
Prior art keywords
time envelope
signal
high frequency
unit
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012254496A
Other languages
English (en)
Other versions
JP2013242514A (ja
JP5997592B2 (ja
Filing date
Publication date
Priority claimed from JP2012254496A external-priority patent/JP5997592B2/ja
Priority to JP2012254496A priority Critical patent/JP5997592B2/ja
Application filed filed Critical
Priority to CN201710052845.9A priority patent/CN107068159B/zh
Priority to EP13781215.2A priority patent/EP2843658A4/en
Priority to EP24191435.7A priority patent/EP4428858A2/en
Priority to PCT/JP2013/061105 priority patent/WO2013161592A1/ja
Priority to CN201380021992.XA priority patent/CN104246876B/zh
Priority to EP22178627.0A priority patent/EP4086898A1/en
Priority to TW102114359A priority patent/TWI576827B/zh
Publication of JP2013242514A publication Critical patent/JP2013242514A/ja
Priority to US14/523,260 priority patent/US9761240B2/en
Publication of JP2013242514A5 publication Critical patent/JP2013242514A5/ja
Publication of JP5997592B2 publication Critical patent/JP5997592B2/ja
Application granted granted Critical
Priority to US15/635,191 priority patent/US10068584B2/en
Priority to US16/047,904 priority patent/US10714113B2/en
Priority to US16/894,748 priority patent/US11562760B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明の音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記低周波数復号部より第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、符号化装置から送信された第2の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定部と、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数復号部から低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡形状を修正された高周波数信号を受け取り、前記低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部と、を備え、前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて時間包絡形状が平坦であると決定された場合、前記生成された高周波数信号のうち、時間セグメント内の任意の前記生成された高周波数信号を使って時間包絡形状を修正し出力する。
また、本発明の音声復号装置において、前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて時間包絡形状が平坦であると決定された場合、xdec(i)(t(l)≦i<t(l+1))を任意の時間セグメント内の高周波数信号としたときに、
Figure 2013242514
を使って得られる信号を、時間包絡形状が修正された高周波数信号として出力することとしてもよい。
また、本発明の音声復号装置は、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部、をさらに備えることとしてもよい。
また、本発明の音声復号装置において、前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づいて、前記高周波数復号部にて高周波数信号を生成する際の中間信号の時間包絡形状を修正し、前記高周波数復号部は、前記時間包絡形状を修正された前記中間信号を用いて、残存する高周波数信号を生成する処理を実施することとしてもよい。
また、本発明の音声復号装置において、前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて時間包絡形状が平坦であると決定された場合、xdec(i) (t(l)≦i<t(l+1))を任意の時間セグメント内の高周波数信号としたときに、
Figure 2013242514

Figure 2013242514
で除した結果に基づいて得られる信号を、時間包絡形状が修正された高周波数信号として出力することとしてもよい。
例えば、前記復号信号の時間包絡形状が平坦と決定された場合、以下の処理により、復号信号の時間包絡形状を修正できる。例えば、当該復号信号xdec(i)に対して、所定の関数Ft(xdec(i))を、
Figure 2013242514
として、x’dec(i)を時間包絡形状が修正された復号信号として出力する。
さらには、例えば前記第1〜第9の実施形態の音声復号装置のように、低周波数復号部で得られた復号結果を利用して高周波数信号を生成する帯域拡張方式で、高周波数信号を生成できる。この際には、帯域拡張方式にて高周波数信号を生成するために必要な情報が符号化系列に含まれる場合、符号化系列のうち当該情報が含まれる部分が高周波数符号化部分となる。そして、符号化系列逆多重化部100aにて分割された当該高周波数符号化部分を復号して帯域拡張方式に必要な情報を得て、高周波数信号を生成する。一方、帯域拡張方式にて高周波数信号を生成するために必要な情報が符号化系列に含まれない場合、符号化系列逆多重化部100aより高周波数復号部100eに入力は無く、所定の処理または低周波数復号部で得られた復号結果を利用した処理によって高周波数信号を生成する。
[第11の実施形態の音声復号装置の第2の変形例]
図75は、第11の実施形態に係る音声復号装置の第1の変形例100Aの構成を示す図である。
本変形例においては、時間包絡修正部380aAは、時間包絡形状決定部120fにて決定される時間包絡形状に基づいて、低周波数復号部100bから出力される低周波数信号の時間包絡の形状を修正し、前記高周波数信号生成情報に基づき高周波数信号を生成すると判断された場合、高周波数復号部100eから出力される高周波数信号の時間包絡の形状も修正する(S380-1a)。
出願人は、上記の目的を達成するために、以下の第1〜第4の態様に係る音声復号装置を発明した。
第1の態様に係る音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、前記符号化された音声信号を含む符号化系列を解析する符号化系列解析部と、前記符号化系列解析部から前記符号化された音声信号を含む符号化系列を受け取り、復号して音声信号を得る音声復号部と、前記符号化系列解析部及び前記音声復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて、復号された音声信号の時間包絡形状を決定する時間包絡形状決定部と、前記時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された音声信号の時間包絡形状を修正し出力する時間包絡修正部と、を備えることを特徴とする。
第2の態様に係る音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第2の情報を受け取り、当該第2の情報に基づいて、復号された低周波数信号の時間包絡形状を決定する低周波数時間包絡形状決定部と、前記低周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正部と、前記低周波数時間包絡修正部から時間包絡形状を修正された低周波数信号を受け取り、前記高周波数復号部から高周波数信号を受け取り、前記時間包絡形状を修正された低周波数信号と前記高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部と、を備えることを特徴とする。
第3の態様に係る音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより第2の情報を受け取り、当該第2の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定部と、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数復号部から低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡形状を修正された高周波数信号を受け取り、前記低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部と、を備えることを特徴とする。
第4の態様に係る音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第2の情報を受け取り、当該第2の情報に基づいて、復号された低周波数信号の時間包絡形状を決定する低周波数時間包絡形状決定部と、前記低周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより第3の情報を受け取り、当該第3の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定部と、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数時間包絡修正部から時間包絡形状を修正された低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡形状を修正された高周波数信号を受け取り、前記時間包絡形状を修正された低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部と、を備えることを特徴とする。
なお、第2又は第4の態様に係る音声復号装置において、前記高周波数復号部は、前記符号化系列逆多重化部、前記低周波数復号部及び前記低周波数時間包絡修正部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成してもよい。
また、第1〜第4の態様に係る音声復号装置において、前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づいて、前記高周波数復号部にて高周波数信号を生成する際の中間信号の時間包絡形状を修正し、前記高周波数復号部は、前記時間包絡形状を修正された前記中間信号を用いて、残存する高周波数信号を生成する処理を実施してもよい。
ここで、前記高周波数復号部は、前記低周波数復号部にて復号された低周波数信号を受け取り、当該信号をサブバンド信号に分割する分析フィルタ部と、少なくとも前記分析フィルタ部で分割されたサブバンド信号を用いて高周波数信号を生成する高周波数信号生成部と、前記高周波数信号生成部で生成された高周波数信号の周波数包絡を調整する周波数包絡調整部と、を備え、前記中間信号は、前記高周波数信号生成部で生成された高周波数信号であってもよい。
上述した第1〜第4の態様に係る音声復号装置の発明は、音声復号方法の発明として捉えることができ、以下のように記述することができる。
第1の態様に係る音声復号方法は、符号化された音声信号を復号して音声信号を出力する音声復号装置、により実行される音声復号方法であって、前記符号化された音声信号を含む符号化系列を解析する符号化系列解析ステップと、解析後の前記符号化された音声信号を含む符号化系列を受け取り、復号して音声信号を得る音声復号ステップと、前記符号化系列解析ステップ及び前記音声復号ステップのうち少なくとも一つで得られた情報を受け取り、当該情報に基づいて、復号された音声信号の時間包絡形状を決定する時間包絡形状決定ステップと、前記時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記復号された音声信号の時間包絡形状を修正し出力する時間包絡修正ステップと、を備えることを特徴とする。
第2の態様に係る音声復号方法は、符号化された音声信号を復号して音声信号を出力する音声復号装置、により実行される音声復号方法であって、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化ステップと、分割により得られた前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた第2の情報を受け取り、当該第2の情報に基づいて、復号された低周波数信号の時間包絡形状を決定する低周波数時間包絡形状決定ステップと、前記低周波数時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正ステップと、前記低周波数時間包絡修正ステップで得られた前記時間包絡形状を修正された低周波数信号を受け取り、前記高周波数復号ステップで得られた高周波数信号を受け取り、前記時間包絡形状を修正された低周波数信号と前記高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成ステップと、を備えることを特徴とする。
第3の態様に係る音声復号方法は、符号化された音声信号を復号して音声信号を出力する音声復号装置、により実行される音声復号方法であって、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化ステップと、分割により得られた前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号ステップと、前記符号化系列逆多重化ステップ、前記低周波数復号ステップ、及び前記高周波数復号ステップのうち少なくとも一つで得られた第2の情報を受け取り、当該第2の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定ステップと、前記高周波数時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正ステップと、前記低周波数復号ステップで得られた低周波数信号を受け取り、前記高周波数時間包絡修正ステップで得られた前記時間包絡形状を修正された高周波数信号を受け取り、前記低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成ステップと、を備えることを特徴とする。
第4の態様に係る音声復号方法は、符号化された音声信号を復号して音声信号を出力する音声復号装置、により実行される音声復号方法であって、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化ステップと、前記符号化系列逆多重化ステップで得られた前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた第2の情報を受け取り、当該第2の情報に基づいて、復号された低周波数信号の時間包絡形状を決定する低周波数時間包絡形状決定ステップと、前記低周波数時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正ステップと、前記符号化系列逆多重化ステップ、前記低周波数復号ステップ、及び前記高周波数復号ステップのうち少なくとも一つより第3の情報を受け取り、当該第3の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定ステップと、前記高周波数時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正ステップと、前記低周波数時間包絡修正ステップで得られた前記時間包絡形状を修正された低周波数信号を受け取り、前記高周波数時間包絡修正ステップで得られた前記時間包絡形状を修正された高周波数信号を受け取り、前記時間包絡形状を修正された低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成ステップと、を備えることを特徴とする。
また、上述した第1〜第4の態様に係る音声復号装置の発明は、音声復号プログラムの発明として捉えることができ、以下のように記述することができる。
第1の態様に係る音声復号プログラムは、符号化された音声信号を復号して音声信号を出力する音声復号装置、に設けられたコンピュータを、前記符号化された音声信号を含む符号化系列を解析する符号化系列解析部と、前記符号化系列解析部から前記符号化された音声信号を含む符号化系列を受け取り、復号して音声信号を得る音声復号部と、前記符号化系列解析部及び前記音声復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて、復号された音声信号の時間包絡形状を決定する時間包絡形状決定部と、前記時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された音声信号の時間包絡形状を修正し出力する時間包絡修正部、として機能させることを特徴とする。
第2の態様に係る音声復号プログラムは、符号化された音声信号を復号して音声信号を出力する音声復号装置、に設けられたコンピュータを、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第2の情報を受け取り、当該第2の情報に基づいて、復号された低周波数信号の時間包絡形状を決定する低周波数時間包絡形状決定部と、前記低周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正部と、前記低周波数時間包絡修正部から時間包絡形状を修正された低周波数信号を受け取り、前記高周波数復号部から高周波数信号を受け取り、前記時間包絡形状を修正された低周波数信号と前記高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部、として機能させることを特徴とする。
第3の態様に係る音声復号プログラムは、符号化された音声信号を復号して音声信号を出力する音声復号装置、に設けられたコンピュータを、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより第2の情報を受け取り、当該第2の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定部と、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数復号部から低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡形状を修正された高周波数信号を受け取り、前記低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部、として機能させることを特徴とする。
第4の態様に係る音声復号プログラムは、符号化された音声信号を復号して音声信号を出力する音声復号装置、に設けられたコンピュータを、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第2の情報を受け取り、当該第2の情報に基づいて、復号された低周波数信号の時間包絡形状を決定する低周波数時間包絡形状決定部と、前記低周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより第3の情報を受け取り、当該第3の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定部と、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数時間包絡修正部から時間包絡形状を修正された低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡形状を修正された高周波数信号を受け取り、前記時間包絡形状を修正された低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部、として機能させることを特徴とする。
出願人は、上記の目的を達成するために、以下の第1〜第4の態様に係る音声符号化装置を発明した。
第1の態様に係る音声符号化装置は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置であって、前記音声信号を符号化する音声符号化部と、前記音声信号の時間包絡情報を算出し符号化する時間包絡情報符号化部と、前記音声符号化部で得られる前記音声信号を含む符号化系列と、前記時間包絡情報符号化部で得られる時間包絡情報の符号化系列とを多重化する符号化系列多重化部と、を備えることを特徴とする。
第2の態様に係る音声符号化装置は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置であって、前記音声信号の低周波数成分を符号化する低周波数符号化部と、前記音声信号の高周波数成分を符号化する高周波数符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、及び当該低周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、低周波数成分の時間包絡情報を算出し符号化する低周波数時間包絡情報符号化部と、前記低周波数符号化部で得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化部で得られる前記高周波数成分を含む符号化系列と、前記低周波数時間包絡情報符号化部で得られる低周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化部と、を備えることを特徴とする。
第3の態様に係る音声符号化装置は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置であって、前記音声信号の低周波数成分を符号化する低周波数符号化部と、前記音声信号の高周波数成分を符号化する高周波数符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、当該低周波数符号化過程で得られる情報、前記高周波数符号化部の符号化結果、及び当該高周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、高周波数成分の時間包絡情報を算出し符号化する高周波数時間包絡情報符号化部と、前記低周波数符号化部で得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化部で得られる前記高周波数成分を含む符号化系列と、前記高周波数時間包絡情報符号化部で得られる高周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化部と、を備えることを特徴とする。
第4の態様に係る音声符号化装置は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置であって、前記音声信号の低周波数成分を符号化する低周波数符号化部と、前記音声信号の高周波数成分を符号化する高周波数符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、及び当該低周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、低周波数成分の時間包絡情報を算出し符号化する低周波数時間包絡情報符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、当該低周波数符号化過程で得られる情報、前記高周波数符号化部の符号化結果、及び当該高周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、高周波数成分の時間包絡情報を算出し符号化する高周波数時間包絡情報符号化部と、前記低周波数符号化部で得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化部で得られる前記高周波数成分を含む符号化系列と、前記低周波数時間包絡情報符号化部で得られる低周波数成分の時間包絡情報の符号化系列と、前記高周波数時間包絡情報符号化部で得られる高周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化部と、を備えることを特徴とする。
上述した第1〜第4の態様に係る音声符号化装置の発明は、音声符号化方法の発明として捉えることができ、以下のように記述することができる。
第1の態様に係る音声符号化方法は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、により実行される音声符号化方法であって、前記音声信号を符号化する音声符号化ステップと、前記音声信号の時間包絡情報を算出し符号化する時間包絡情報符号化ステップと、前記音声符号化ステップで得られる前記音声信号を含む符号化系列と、前記時間包絡情報符号化ステップで得られる時間包絡情報の符号化系列とを多重化する符号化系列多重化ステップと、を備えることを特徴とする。
第2の態様に係る音声符号化方法は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、により実行される音声符号化方法であって、前記音声信号の低周波数成分を符号化する低周波数符号化ステップと、前記音声信号の高周波数成分を符号化する高周波数符号化ステップと、前記音声信号、前記低周波数符号化ステップの符号化結果、及び当該低周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、低周波数成分の時間包絡情報を算出し符号化する低周波数時間包絡情報符号化ステップと、前記低周波数符号化ステップで得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化ステップで得られる前記高周波数成分を含む符号化系列と、前記低周波数時間包絡情報符号化ステップで得られる低周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化ステップと、を備えることを特徴とする。
第3の態様に係る音声符号化方法は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、により実行される音声符号化方法であって、前記音声信号の低周波数成分を符号化する低周波数符号化ステップと、前記音声信号の高周波数成分を符号化する高周波数符号化ステップと、前記音声信号、前記低周波数符号化ステップの符号化結果、当該低周波数符号化過程で得られる情報、前記高周波数符号化ステップの符号化結果、及び当該高周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、高周波数成分の時間包絡情報を算出し符号化する高周波数時間包絡情報符号化ステップと、前記低周波数符号化ステップで得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化ステップで得られる前記高周波数成分を含む符号化系列と、前記高周波数時間包絡情報符号化ステップで得られる高周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化ステップと、を備えることを特徴とする。
第4の態様に係る音声符号化方法は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、により実行される音声符号化方法であって、前記音声信号の低周波数成分を符号化する低周波数符号化ステップと、前記音声信号の高周波数成分を符号化する高周波数符号化ステップと、前記音声信号、前記低周波数符号化ステップの符号化結果、及び当該低周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、低周波数成分の時間包絡情報を算出し符号化する低周波数時間包絡情報符号化ステップと、前記音声信号、前記低周波数符号化ステップの符号化結果、当該低周波数符号化過程で得られる情報、前記高周波数符号化ステップの符号化結果、及び当該高周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、高周波数成分の時間包絡情報を算出し符号化する高周波数時間包絡情報符号化ステップと、前記低周波数符号化ステップで得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化ステップで得られる前記高周波数成分を含む符号化系列と、前記低周波数時間包絡情報符号化ステップで得られる低周波数成分の時間包絡情報の符号化系列と、前記高周波数時間包絡情報符号化ステップで得られる高周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化ステップと、を備えることを特徴とする。
また、上述した第1〜第4の態様に係る音声符号化装置の発明は、音声符号化プログラムの発明として捉えることができ、以下のように記述することができる。
第1の態様に係る音声符号化プログラムは、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、に設けられたコンピュータを、前記音声信号を符号化する音声符号化部と、前記音声信号の時間包絡情報を算出し符号化する時間包絡情報符号化部と、前記音声符号化部で得られる前記音声信号を含む符号化系列と、前記時間包絡情報符号化部で得られる時間包絡情報の符号化系列とを多重化する符号化系列多重化部、として機能させることを特徴とする。
第2の態様に係る音声符号化プログラムは、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、に設けられたコンピュータを、前記音声信号の低周波数成分を符号化する低周波数符号化部と、前記音声信号の高周波数成分を符号化する高周波数符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、及び当該低周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、低周波数成分の時間包絡情報を算出し符号化する低周波数時間包絡情報符号化部と、前記低周波数符号化部で得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化部で得られる前記高周波数成分を含む符号化系列と、前記低周波数時間包絡情報符号化部で得られる低周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化部、として機能させることを特徴とする。
第3の態様に係る音声符号化プログラムは、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、に設けられたコンピュータを、前記音声信号の低周波数成分を符号化する低周波数符号化部と、前記音声信号の高周波数成分を符号化する高周波数符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、当該低周波数符号化過程で得られる情報、前記高周波数符号化部の符号化結果、及び当該高周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、高周波数成分の時間包絡情報を算出し符号化する高周波数時間包絡情報符号化部と、前記低周波数符号化部で得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化部で得られる前記高周波数成分を含む符号化系列と、前記高周波数時間包絡情報符号化部で得られる高周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化部、として機能させることを特徴とする。
第4の態様に係る音声符号化プログラムは、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、に設けられたコンピュータを、前記音声信号の低周波数成分を符号化する低周波数符号化部と、前記音声信号の高周波数成分を符号化する高周波数符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、及び当該低周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、低周波数成分の時間包絡情報を算出し符号化する低周波数時間包絡情報符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、当該低周波数符号化過程で得られる情報、前記高周波数符号化部の符号化結果、及び当該高周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、高周波数成分の時間包絡情報を算出し符号化する高周波数時間包絡情報符号化部と、前記低周波数符号化部で得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化部で得られる前記高周波数成分を含む符号化系列と、前記低周波数時間包絡情報符号化部で得られる低周波数成分の時間包絡情報の符号化系列と、前記高周波数時間包絡情報符号化部で得られる高周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化部、として機能させることを特徴とする。
出願人は、上記の目的を達成するために、さらに以下の第5及び第6の態様に係る音声復号装置を発明した。
第5の態様に係る音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、前記符号化された音声信号を含む符号化系列を、少なくとも符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列に分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより情報を受け取り、復号された低周波数信号及び生成された高周波数信号の時間包絡形状を決定する時間包絡形状決定部と、前記時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正部と、前記時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数時間包絡修正部から時間包絡を修正された低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡を修正された高周波数信号を受け取り、出力する音声信号を合成する低周波数/高周波数信号合成部と、を備えることを特徴とする。
第6の態様に係る音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、前記符号化された音声信号を含む符号化系列を、少なくとも符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列に分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより情報を受け取り、復号された低周波数信号及び生成された高周波数信号の時間包絡形状を決定する時間包絡形状決定部と、前記低周波数復号部から復号された低周波数信号を受け取り、前記高周波数復号部から生成された高周波数信号を受け取り、前記時間包絡形状決定部にて決定された時間包絡形状に基づき、前記復号された低周波数信号及び前記生成された高周波数信号の時間包絡形状を修正し出力する時間包絡修正部と、前記時間包絡修正部から時間包絡を修正された低周波数信号及び高周波数信号を受け取り、出力する音声信号を合成する低周波数/高周波数信号合成部と、を備えることを特徴とする。
なお、第5の態様に係る音声復号装置において、前記高周波数復号部は、前記符号化系列逆多重化部、前記低周波数復号部及び前記低周波数時間包絡修正部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成してもよい。
また、第5の態様に係る音声復号装置において、前記高周波数時間包絡修正部は、前記時間包絡形状決定部にて決定された時間包絡形状に基づいて、前記高周波数復号部にて高周波数信号を生成する際の中間信号の時間包絡形状を修正し、前記高周波数復号部は、前記時間包絡形状を修正された前記中間信号を用いて、残存する高周波数信号を生成する処理を実施してもよい。
また、第6の態様に係る音声復号装置において、前記高周波数復号部は、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成してもよい。
また、第6の態様に係る音声復号装置において、前記時間包絡修正部は、前記時間包絡形状決定部にて決定された時間包絡形状に基づいて、前記高周波数復号部にて高周波数信号を生成する際の中間信号の時間包絡形状を修正し、前記高周波数復号部は、前記時間包絡形状を修正された前記中間信号を用いて、残存する高周波数信号を生成する処理を実施してもよい。
ここで、前記高周波数復号部は、前記低周波数復号部にて復号された低周波数信号を受け取り、当該信号をサブバンド信号に分割する分析フィルタ部と、少なくとも前記分析フィルタ部で分割されたサブバンド信号を用いて高周波数信号を生成する高周波数信号生成部と、前記高周波数信号生成部で生成された高周波数信号の周波数包絡を調整する周波数包絡調整部と、を備え、前記中間信号は、前記高周波数信号生成部で生成された高周波数信号であってもよい。
上述した第5及び第6の態様に係る音声復号装置の発明は、音声復号方法の発明として捉えることができ、以下のように記述することができる。
第5の態様に係る音声復号方法は、符号化された音声信号を復号して音声信号を出力する音声復号装置、により実行される音声復号方法であって、前記符号化された音声信号を含む符号化系列を、少なくとも符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列に分割する符号化系列逆多重化ステップと、分割により得られた前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた情報を受け取り、当該情報に基づいて高周波数信号を生成する高周波数復号ステップと、前記符号化系列逆多重化ステップ、前記低周波数復号ステップ、及び前記高周波数復号ステップのうち少なくとも一つで得られた情報を受け取り、復号された低周波数信号及び生成された高周波数信号の時間包絡形状を決定する時間包絡形状決定ステップと、前記時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正ステップと、前記時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正ステップと、前記低周波数時間包絡修正ステップで得られた時間包絡を修正された低周波数信号を受け取り、前記高周波数時間包絡修正ステップで得られた時間包絡を修正された高周波数信号を受け取り、出力する音声信号を合成する低周波数/高周波数信号合成ステップと、を備えることを特徴とする。
第6の態様に係る音声復号方法は、符号化された音声信号を復号して音声信号を出力する音声復号装置、により実行される音声復号方法であって、前記符号化された音声信号を含む符号化系列を、少なくとも符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列に分割する符号化系列逆多重化ステップと、分割により得られた前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた情報を受け取り、当該情報に基づいて高周波数信号を生成する高周波数復号ステップと、前記符号化系列逆多重化ステップ、前記低周波数復号ステップ、及び前記高周波数復号ステップのうち少なくとも一つで得られた情報を受け取り、復号された低周波数信号及び生成された高周波数信号の時間包絡形状を決定する時間包絡形状決定ステップと、前記低周波数復号ステップで得られた復号された低周波数信号を受け取り、前記高周波数復号ステップで得られた生成された高周波数信号を受け取り、前記時間包絡形状決定ステップにて決定された時間包絡形状に基づき、前記復号された低周波数信号及び前記生成された高周波数信号の時間包絡形状を修正し出力する時間包絡修正ステップと、前記時間包絡修正ステップで得られた時間包絡を修正された低周波数信号及び高周波数信号を受け取り、出力する音声信号を合成する低周波数/高周波数信号合成ステップと、を備えることを特徴とする。
また、上述した第5及び第6の態様に係る音声復号装置の発明は、音声復号プログラムの発明として捉えることができ、以下のように記述することができる。
第5の態様に係る音声復号プログラムは、符号化された音声信号を復号して音声信号を出力する音声復号装置、に設けられたコンピュータを、前記符号化された音声信号を含む符号化系列を、少なくとも符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列に分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより情報を受け取り、復号された低周波数信号及び生成された高周波数信号の時間包絡形状を決定する時間包絡形状決定部と、前記時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正部と、前記時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数時間包絡修正部から時間包絡を修正された低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡を修正された高周波数信号を受け取り、出力する音声信号を合成する低周波数/高周波数信号合成部、として機能させることを特徴とする。
第6の態様に係る音声復号プログラムは、符号化された音声信号を復号して音声信号を出力する音声復号装置、に設けられたコンピュータを、前記符号化された音声信号を含む符号化系列を、少なくとも符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列に分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより情報を受け取り、復号された低周波数信号及び生成された高周波数信号の時間包絡形状を決定する時間包絡形状決定部と、前記低周波数復号部から復号された低周波数信号を受け取り、前記高周波数復号部から生成された高周波数信号を受け取り、前記時間包絡形状決定部にて決定された時間包絡形状に基づき、前記復号された低周波数信号及び前記生成された高周波数信号の時間包絡形状を修正し出力する時間包絡修正部と、前記時間包絡修正部から時間包絡を修正された低周波数信号及び高周波数信号を受け取り、出力する音声信号を合成する低周波数/高周波数信号合成部、として機能させることを特徴とする。

Claims (5)

  1. 符号化された音声信号を復号して音声信号を出力する音声復号装置であって、
    符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、
    前記低周波数復号部より第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、
    符号化装置から送信された第2の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定部と、
    前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、
    前記低周波数復号部から低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡形状を修正された高周波数信号を受け取り、前記低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部と、
    を備え、
    前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて時間包絡形状が平坦であると決定された場合、前記生成された高周波数信号のうち、時間セグメント内の任意の前記生成された高周波数信号を使って時間包絡形状を修正し出力する音声復号装置。
  2. 前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて時間包絡形状が平坦であると決定された場合、xdec(i) (t(l)≦i<t(l+1))を任意の時間セグメント内の高周波数信号としたときに、
    Figure 2013242514
    を使って得られる信号を、時間包絡形状が修正された高周波数信号として出力する、
    ことを特徴とする請求項1に記載の音声復号装置。
  3. 前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部、をさらに備える請求項1または2に記載の音声復号装置。
  4. 前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づいて、前記高周波数復号部にて高周波数信号を生成する際の中間信号の時間包絡形状を修正し、
    前記高周波数復号部は、前記時間包絡形状を修正された前記中間信号を用いて、残存する高周波数信号を生成する処理を実施する、
    ことを特徴とする請求項1〜3の何れか一項に記載の音声復号装置。
  5. 前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて時間包絡形状が平坦であると決定された場合、xdec(i) (t(l)≦i<t(l+1))を任意の時間セグメント内の高周波数信号としたときに、
    Figure 2013242514

    Figure 2013242514
    で除した結果に基づいて得られる信号を、時間包絡形状が修正された高周波数信号として出力する、
    ことを特徴とする請求項1〜4の何れか一項に記載の音声復号装置。
JP2012254496A 2012-04-27 2012-11-20 音声復号装置 Active JP5997592B2 (ja)

Priority Applications (12)

Application Number Priority Date Filing Date Title
JP2012254496A JP5997592B2 (ja) 2012-04-27 2012-11-20 音声復号装置
CN201710052845.9A CN107068159B (zh) 2012-04-27 2013-04-12 声音解码装置
EP13781215.2A EP2843658A4 (en) 2012-04-27 2013-04-12 AUDIO DECODING DEVICE, AUDIO ENCODING DEVICE, AUDIO DECODING METHOD, AUDIO ENCODING METHOD, AUDIO DECODING PROGRAM, AND AUDIO CODING PROGRAM
EP24191435.7A EP4428858A2 (en) 2012-04-27 2013-04-12 Audio decoding device
PCT/JP2013/061105 WO2013161592A1 (ja) 2012-04-27 2013-04-12 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
CN201380021992.XA CN104246876B (zh) 2012-04-27 2013-04-12 声音解码装置、声音编码装置、声音解码方法及声音编码方法
EP22178627.0A EP4086898A1 (en) 2012-04-27 2013-04-12 Audio decoding device
TW102114359A TWI576827B (zh) 2012-04-27 2013-04-23 Sound decoding device
US14/523,260 US9761240B2 (en) 2012-04-27 2014-10-24 Audio decoding device, audio coding device, audio decoding method, audio coding method, audio decoding program, and audio coding program
US15/635,191 US10068584B2 (en) 2012-04-27 2017-06-27 Audio decoding device, audio coding device, audio decoding method, audio coding method, audio decoding program, and audio coding program
US16/047,904 US10714113B2 (en) 2012-04-27 2018-07-27 Audio decoding device, audio coding device, audio decoding method, audio coding method, audio decoding program, and audio coding program
US16/894,748 US11562760B2 (en) 2012-04-27 2020-06-05 Audio decoding device, audio coding device, audio decoding method, audio coding method, audio decoding program, and audio coding program

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012103519 2012-04-27
JP2012103519 2012-04-27
JP2012254496A JP5997592B2 (ja) 2012-04-27 2012-11-20 音声復号装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2016099513A Division JP6200034B2 (ja) 2012-04-27 2016-05-18 音声復号装置

Publications (3)

Publication Number Publication Date
JP2013242514A JP2013242514A (ja) 2013-12-05
JP2013242514A5 true JP2013242514A5 (ja) 2015-10-08
JP5997592B2 JP5997592B2 (ja) 2016-09-28

Family

ID=49482918

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012254496A Active JP5997592B2 (ja) 2012-04-27 2012-11-20 音声復号装置

Country Status (6)

Country Link
US (4) US9761240B2 (ja)
EP (3) EP4086898A1 (ja)
JP (1) JP5997592B2 (ja)
CN (2) CN104246876B (ja)
TW (1) TWI576827B (ja)
WO (1) WO2013161592A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5975243B2 (ja) * 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5997592B2 (ja) 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
JP6200034B2 (ja) * 2012-04-27 2017-09-20 株式会社Nttドコモ 音声復号装置
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
JP6593173B2 (ja) 2013-12-27 2019-10-23 ソニー株式会社 復号化装置および方法、並びにプログラム
JP6035270B2 (ja) * 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US10523383B2 (en) 2014-08-15 2019-12-31 Huawei Technologies Co., Ltd. System and method for generating waveforms and utilization thereof
JP6668372B2 (ja) * 2015-02-26 2020-03-18 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 目標時間領域エンベロープを用いて処理されたオーディオ信号を得るためにオーディオ信号を処理するための装置および方法
JP6511033B2 (ja) * 2016-10-31 2019-05-08 株式会社Nttドコモ 音声符号化装置および音声符号化方法
CN109150320B (zh) * 2018-07-26 2020-10-30 厦门声连网信息科技有限公司 一种声波信号编码、解码方法及装置
CN111092667B (zh) * 2019-12-18 2023-09-01 公安部第三研究所 一种对讲终端音频建立时间的测试方法及测试系统
CN115171709B (zh) * 2022-09-05 2022-11-18 腾讯科技(深圳)有限公司 语音编码、解码方法、装置、计算机设备和存储介质

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5684920A (en) * 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
DE19526366A1 (de) * 1995-07-20 1997-01-23 Bosch Gmbh Robert Verfahren zur Redundanzreduktion bei der Codierung von mehrkanaligen Signalen und Vorrichtung zur Dekodierung von redundanzreduzierten, mehrkanaligen Signalen
JP3283413B2 (ja) 1995-11-30 2002-05-20 株式会社日立製作所 符号化復号方法、符号化装置および復号装置
US5737716A (en) * 1995-12-26 1998-04-07 Motorola Method and apparatus for encoding speech using neural network technology for speech classification
US5825320A (en) * 1996-03-19 1998-10-20 Sony Corporation Gain control method for audio encoding device
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
AUPP829899A0 (en) * 1999-01-27 1999-02-18 Motorola Australia Pty Ltd Method and apparatus for time-warping a digitised waveform to have an approximately fixed period
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
JP3660599B2 (ja) 2001-03-09 2005-06-15 日本電信電話株式会社 音響信号の立ち上がり・立ち下がり検出方法及び装置並びにプログラム及び記録媒体
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP3469567B2 (ja) * 2001-09-03 2003-11-25 三菱電機株式会社 音響符号化装置、音響復号化装置、音響符号化方法及び音響復号化方法
DE60214027T2 (de) * 2001-11-14 2007-02-15 Matsushita Electric Industrial Co., Ltd., Kadoma Kodiervorrichtung und dekodiervorrichtung
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
EP1543307B1 (en) * 2002-09-19 2006-02-22 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method
CN101656073B (zh) * 2004-05-14 2012-05-23 松下电器产业株式会社 解码装置、解码方法以及通信终端和基站装置
GB0421346D0 (en) * 2004-09-24 2004-10-27 Smith Jonathan S R Product representations of amplitude and frequency modulated signals
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
TW200705386A (en) * 2005-01-11 2007-02-01 Agency Science Tech & Res Encoder, decoder, method for encoding/decoding, computer readable media and computer program elements
CN101138274B (zh) * 2005-04-15 2011-07-06 杜比国际公司 用于处理去相干信号或组合信号的设备和方法
WO2006116025A1 (en) * 2005-04-22 2006-11-02 Qualcomm Incorporated Systems, methods, and apparatus for gain factor smoothing
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
WO2007107670A2 (fr) 2006-03-20 2007-09-27 France Telecom Procede de post-traitement d'un signal dans un decodeur audio
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
GB0617086D0 (en) 2006-08-30 2006-10-11 K9 Ind Ltd Bicycle suspension
DE102006049154B4 (de) * 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
JP4984983B2 (ja) * 2007-03-09 2012-07-25 富士通株式会社 符号化装置および符号化方法
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101475724B1 (ko) * 2008-06-09 2014-12-30 삼성전자주식회사 오디오 신호 품질 향상 장치 및 방법
EP2301028B1 (en) * 2008-07-11 2012-12-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus and a method for calculating a number of spectral envelopes
JP5203077B2 (ja) 2008-07-14 2013-06-05 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
US8532998B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
EP2555191A1 (en) * 2009-03-31 2013-02-06 Huawei Technologies Co., Ltd. Method and device for audio signal denoising
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP4921611B2 (ja) 2009-04-03 2012-04-25 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
KR101764926B1 (ko) * 2009-12-10 2017-08-03 삼성전자주식회사 음향 통신을 위한 장치 및 방법
WO2011148230A1 (en) * 2010-05-25 2011-12-01 Nokia Corporation A bandwidth extender
FR2961980A1 (fr) * 2010-06-24 2011-12-30 France Telecom Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
US9237400B2 (en) * 2010-08-24 2016-01-12 Dolby International Ab Concealment of intermittent mono reception of FM stereo radio receivers
TWI516138B (zh) * 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
AU2012218409B2 (en) * 2011-02-18 2016-09-15 Ntt Docomo, Inc. Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program
RU2571561C2 (ru) * 2011-04-05 2015-12-20 Ниппон Телеграф Энд Телефон Корпорейшн Способ кодирования, способ декодирования, кодер, декодер, программа и носитель записи
KR101835327B1 (ko) * 2011-11-18 2018-04-19 엘지전자 주식회사 디스플레이기기 및 디스플레이기기의 컨텐츠 제공 방법
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
JP6035270B2 (ja) 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム

Similar Documents

Publication Publication Date Title
JP2013242514A5 (ja)
US11562760B2 (en) Audio decoding device, audio coding device, audio decoding method, audio coding method, audio decoding program, and audio coding program
AU2012234115B2 (en) Encoding apparatus and method, and program
JP5942358B2 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
KR101736394B1 (ko) 오디오 신호 인코딩/디코딩 방법 및 오디오 신호 인코딩/디코딩 장치
KR101868926B1 (ko) 노이즈 신호 처리 및 생성 방법, 인코더/디코더 및 인코딩/디코딩 시스템
EP3373298B1 (en) Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
RU2016105613A (ru) Аудиокодер, аудиодекодер и связанные способы с использованием двухканальной обработки в инфраструктуре интеллектуального заполнения интервалов отсутствия сигнала
JP2013508761A (ja) マルチモードオーディオコーデックおよびそれに適応されるcelp符号化
RU2013142349A (ru) Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи
JP2011013560A (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置
JP2016500453A (ja) 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加
JP2004138756A (ja) 音声符号化装置、音声復号化装置、音声信号伝送方法及びプログラム
EP2490216B1 (en) Layered speech coding
EP2128854A1 (en) Audio encoding device and audio decoding device
JP2013076871A (ja) 音声符号化装置及びプログラム、音声復号装置及びプログラム、並びに、音声符号化システム
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
JPWO2007037359A1 (ja) 音声符号化装置および音声符号化方法
JP5014493B2 (ja) 符号化方法、符号化装置、およびプログラム
JP2016018042A (ja) 音声復号化装置、音声復号化方法、音声復号化プログラム及び通信機器
JP2009104169A (ja) 音声符号列の変換装置および変換方法
JP2017524157A (ja) 快適雑音生成モード選択のための装置および方法
JP2013167783A (ja) 多チャネル音響システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム