JP2013242514A5 - - Google Patents

Download PDF

Info

Publication number
JP2013242514A5
JP2013242514A5 JP2012254496A JP2012254496A JP2013242514A5 JP 2013242514 A5 JP2013242514 A5 JP 2013242514A5 JP 2012254496 A JP2012254496 A JP 2012254496A JP 2012254496 A JP2012254496 A JP 2012254496A JP 2013242514 A5 JP2013242514 A5 JP 2013242514A5
Authority
JP
Japan
Prior art keywords
time envelope
signal
high frequency
unit
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012254496A
Other languages
English (en)
Other versions
JP5997592B2 (ja
JP2013242514A (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from JP2012254496A external-priority patent/JP5997592B2/ja
Priority to JP2012254496A priority Critical patent/JP5997592B2/ja
Priority to CN201380021992.XA priority patent/CN104246876B/zh
Priority to EP13781215.2A priority patent/EP2843658A4/en
Priority to CN201710052845.9A priority patent/CN107068159B/zh
Priority to EP22178627.0A priority patent/EP4086898A1/en
Priority to PCT/JP2013/061105 priority patent/WO2013161592A1/ja
Priority to TW102114359A priority patent/TWI576827B/zh
Publication of JP2013242514A publication Critical patent/JP2013242514A/ja
Priority to US14/523,260 priority patent/US9761240B2/en
Publication of JP2013242514A5 publication Critical patent/JP2013242514A5/ja
Publication of JP5997592B2 publication Critical patent/JP5997592B2/ja
Application granted granted Critical
Priority to US15/635,191 priority patent/US10068584B2/en
Priority to US16/047,904 priority patent/US10714113B2/en
Priority to US16/894,748 priority patent/US11562760B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明の音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記低周波数復号部より第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、符号化装置から送信された第2の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定部と、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数復号部から低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡形状を修正された高周波数信号を受け取り、前記低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部と、を備え、前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて時間包絡形状が平坦であると決定された場合、前記生成された高周波数信号のうち、時間セグメント内の任意の前記生成された高周波数信号を使って時間包絡形状を修正し出力する。
また、本発明の音声復号装置において、前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて時間包絡形状が平坦であると決定された場合、xdec(i)(t(l)≦i<t(l+1))を任意の時間セグメント内の高周波数信号としたときに、
Figure 2013242514
を使って得られる信号を、時間包絡形状が修正された高周波数信号として出力することとしてもよい。
また、本発明の音声復号装置は、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部、をさらに備えることとしてもよい。
また、本発明の音声復号装置において、前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づいて、前記高周波数復号部にて高周波数信号を生成する際の中間信号の時間包絡形状を修正し、前記高周波数復号部は、前記時間包絡形状を修正された前記中間信号を用いて、残存する高周波数信号を生成する処理を実施することとしてもよい。
また、本発明の音声復号装置において、前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて時間包絡形状が平坦であると決定された場合、xdec(i) (t(l)≦i<t(l+1))を任意の時間セグメント内の高周波数信号としたときに、
Figure 2013242514

Figure 2013242514
で除した結果に基づいて得られる信号を、時間包絡形状が修正された高周波数信号として出力することとしてもよい。
例えば、前記復号信号の時間包絡形状が平坦と決定された場合、以下の処理により、復号信号の時間包絡形状を修正できる。例えば、当該復号信号xdec(i)に対して、所定の関数Ft(xdec(i))を、
Figure 2013242514
として、x’dec(i)を時間包絡形状が修正された復号信号として出力する。
さらには、例えば前記第1〜第9の実施形態の音声復号装置のように、低周波数復号部で得られた復号結果を利用して高周波数信号を生成する帯域拡張方式で、高周波数信号を生成できる。この際には、帯域拡張方式にて高周波数信号を生成するために必要な情報が符号化系列に含まれる場合、符号化系列のうち当該情報が含まれる部分が高周波数符号化部分となる。そして、符号化系列逆多重化部100aにて分割された当該高周波数符号化部分を復号して帯域拡張方式に必要な情報を得て、高周波数信号を生成する。一方、帯域拡張方式にて高周波数信号を生成するために必要な情報が符号化系列に含まれない場合、符号化系列逆多重化部100aより高周波数復号部100eに入力は無く、所定の処理または低周波数復号部で得られた復号結果を利用した処理によって高周波数信号を生成する。
[第11の実施形態の音声復号装置の第2の変形例]
図75は、第11の実施形態に係る音声復号装置の第1の変形例100Aの構成を示す図である。
本変形例においては、時間包絡修正部380aAは、時間包絡形状決定部120fにて決定される時間包絡形状に基づいて、低周波数復号部100bから出力される低周波数信号の時間包絡の形状を修正し、前記高周波数信号生成情報に基づき高周波数信号を生成すると判断された場合、高周波数復号部100eから出力される高周波数信号の時間包絡の形状も修正する(S380-1a)。
出願人は、上記の目的を達成するために、以下の第1〜第4の態様に係る音声復号装置を発明した。
第1の態様に係る音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、前記符号化された音声信号を含む符号化系列を解析する符号化系列解析部と、前記符号化系列解析部から前記符号化された音声信号を含む符号化系列を受け取り、復号して音声信号を得る音声復号部と、前記符号化系列解析部及び前記音声復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて、復号された音声信号の時間包絡形状を決定する時間包絡形状決定部と、前記時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された音声信号の時間包絡形状を修正し出力する時間包絡修正部と、を備えることを特徴とする。
第2の態様に係る音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第2の情報を受け取り、当該第2の情報に基づいて、復号された低周波数信号の時間包絡形状を決定する低周波数時間包絡形状決定部と、前記低周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正部と、前記低周波数時間包絡修正部から時間包絡形状を修正された低周波数信号を受け取り、前記高周波数復号部から高周波数信号を受け取り、前記時間包絡形状を修正された低周波数信号と前記高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部と、を備えることを特徴とする。
第3の態様に係る音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより第2の情報を受け取り、当該第2の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定部と、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数復号部から低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡形状を修正された高周波数信号を受け取り、前記低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部と、を備えることを特徴とする。
第4の態様に係る音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第2の情報を受け取り、当該第2の情報に基づいて、復号された低周波数信号の時間包絡形状を決定する低周波数時間包絡形状決定部と、前記低周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより第3の情報を受け取り、当該第3の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定部と、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数時間包絡修正部から時間包絡形状を修正された低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡形状を修正された高周波数信号を受け取り、前記時間包絡形状を修正された低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部と、を備えることを特徴とする。
なお、第2又は第4の態様に係る音声復号装置において、前記高周波数復号部は、前記符号化系列逆多重化部、前記低周波数復号部及び前記低周波数時間包絡修正部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成してもよい。
また、第1〜第4の態様に係る音声復号装置において、前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づいて、前記高周波数復号部にて高周波数信号を生成する際の中間信号の時間包絡形状を修正し、前記高周波数復号部は、前記時間包絡形状を修正された前記中間信号を用いて、残存する高周波数信号を生成する処理を実施してもよい。
ここで、前記高周波数復号部は、前記低周波数復号部にて復号された低周波数信号を受け取り、当該信号をサブバンド信号に分割する分析フィルタ部と、少なくとも前記分析フィルタ部で分割されたサブバンド信号を用いて高周波数信号を生成する高周波数信号生成部と、前記高周波数信号生成部で生成された高周波数信号の周波数包絡を調整する周波数包絡調整部と、を備え、前記中間信号は、前記高周波数信号生成部で生成された高周波数信号であってもよい。
上述した第1〜第4の態様に係る音声復号装置の発明は、音声復号方法の発明として捉えることができ、以下のように記述することができる。
第1の態様に係る音声復号方法は、符号化された音声信号を復号して音声信号を出力する音声復号装置、により実行される音声復号方法であって、前記符号化された音声信号を含む符号化系列を解析する符号化系列解析ステップと、解析後の前記符号化された音声信号を含む符号化系列を受け取り、復号して音声信号を得る音声復号ステップと、前記符号化系列解析ステップ及び前記音声復号ステップのうち少なくとも一つで得られた情報を受け取り、当該情報に基づいて、復号された音声信号の時間包絡形状を決定する時間包絡形状決定ステップと、前記時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記復号された音声信号の時間包絡形状を修正し出力する時間包絡修正ステップと、を備えることを特徴とする。
第2の態様に係る音声復号方法は、符号化された音声信号を復号して音声信号を出力する音声復号装置、により実行される音声復号方法であって、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化ステップと、分割により得られた前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた第2の情報を受け取り、当該第2の情報に基づいて、復号された低周波数信号の時間包絡形状を決定する低周波数時間包絡形状決定ステップと、前記低周波数時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正ステップと、前記低周波数時間包絡修正ステップで得られた前記時間包絡形状を修正された低周波数信号を受け取り、前記高周波数復号ステップで得られた高周波数信号を受け取り、前記時間包絡形状を修正された低周波数信号と前記高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成ステップと、を備えることを特徴とする。
第3の態様に係る音声復号方法は、符号化された音声信号を復号して音声信号を出力する音声復号装置、により実行される音声復号方法であって、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化ステップと、分割により得られた前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号ステップと、前記符号化系列逆多重化ステップ、前記低周波数復号ステップ、及び前記高周波数復号ステップのうち少なくとも一つで得られた第2の情報を受け取り、当該第2の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定ステップと、前記高周波数時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正ステップと、前記低周波数復号ステップで得られた低周波数信号を受け取り、前記高周波数時間包絡修正ステップで得られた前記時間包絡形状を修正された高周波数信号を受け取り、前記低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成ステップと、を備えることを特徴とする。
第4の態様に係る音声復号方法は、符号化された音声信号を復号して音声信号を出力する音声復号装置、により実行される音声復号方法であって、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化ステップと、前記符号化系列逆多重化ステップで得られた前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた第2の情報を受け取り、当該第2の情報に基づいて、復号された低周波数信号の時間包絡形状を決定する低周波数時間包絡形状決定ステップと、前記低周波数時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正ステップと、前記符号化系列逆多重化ステップ、前記低周波数復号ステップ、及び前記高周波数復号ステップのうち少なくとも一つより第3の情報を受け取り、当該第3の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定ステップと、前記高周波数時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正ステップと、前記低周波数時間包絡修正ステップで得られた前記時間包絡形状を修正された低周波数信号を受け取り、前記高周波数時間包絡修正ステップで得られた前記時間包絡形状を修正された高周波数信号を受け取り、前記時間包絡形状を修正された低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成ステップと、を備えることを特徴とする。
また、上述した第1〜第4の態様に係る音声復号装置の発明は、音声復号プログラムの発明として捉えることができ、以下のように記述することができる。
第1の態様に係る音声復号プログラムは、符号化された音声信号を復号して音声信号を出力する音声復号装置、に設けられたコンピュータを、前記符号化された音声信号を含む符号化系列を解析する符号化系列解析部と、前記符号化系列解析部から前記符号化された音声信号を含む符号化系列を受け取り、復号して音声信号を得る音声復号部と、前記符号化系列解析部及び前記音声復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて、復号された音声信号の時間包絡形状を決定する時間包絡形状決定部と、前記時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された音声信号の時間包絡形状を修正し出力する時間包絡修正部、として機能させることを特徴とする。
第2の態様に係る音声復号プログラムは、符号化された音声信号を復号して音声信号を出力する音声復号装置、に設けられたコンピュータを、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第2の情報を受け取り、当該第2の情報に基づいて、復号された低周波数信号の時間包絡形状を決定する低周波数時間包絡形状決定部と、前記低周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正部と、前記低周波数時間包絡修正部から時間包絡形状を修正された低周波数信号を受け取り、前記高周波数復号部から高周波数信号を受け取り、前記時間包絡形状を修正された低周波数信号と前記高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部、として機能させることを特徴とする。
第3の態様に係る音声復号プログラムは、符号化された音声信号を復号して音声信号を出力する音声復号装置、に設けられたコンピュータを、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより第2の情報を受け取り、当該第2の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定部と、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数復号部から低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡形状を修正された高周波数信号を受け取り、前記低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部、として機能させることを特徴とする。
第4の態様に係る音声復号プログラムは、符号化された音声信号を復号して音声信号を出力する音声復号装置、に設けられたコンピュータを、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第2の情報を受け取り、当該第2の情報に基づいて、復号された低周波数信号の時間包絡形状を決定する低周波数時間包絡形状決定部と、前記低周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより第3の情報を受け取り、当該第3の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定部と、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数時間包絡修正部から時間包絡形状を修正された低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡形状を修正された高周波数信号を受け取り、前記時間包絡形状を修正された低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部、として機能させることを特徴とする。
出願人は、上記の目的を達成するために、以下の第1〜第4の態様に係る音声符号化装置を発明した。
第1の態様に係る音声符号化装置は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置であって、前記音声信号を符号化する音声符号化部と、前記音声信号の時間包絡情報を算出し符号化する時間包絡情報符号化部と、前記音声符号化部で得られる前記音声信号を含む符号化系列と、前記時間包絡情報符号化部で得られる時間包絡情報の符号化系列とを多重化する符号化系列多重化部と、を備えることを特徴とする。
第2の態様に係る音声符号化装置は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置であって、前記音声信号の低周波数成分を符号化する低周波数符号化部と、前記音声信号の高周波数成分を符号化する高周波数符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、及び当該低周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、低周波数成分の時間包絡情報を算出し符号化する低周波数時間包絡情報符号化部と、前記低周波数符号化部で得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化部で得られる前記高周波数成分を含む符号化系列と、前記低周波数時間包絡情報符号化部で得られる低周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化部と、を備えることを特徴とする。
第3の態様に係る音声符号化装置は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置であって、前記音声信号の低周波数成分を符号化する低周波数符号化部と、前記音声信号の高周波数成分を符号化する高周波数符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、当該低周波数符号化過程で得られる情報、前記高周波数符号化部の符号化結果、及び当該高周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、高周波数成分の時間包絡情報を算出し符号化する高周波数時間包絡情報符号化部と、前記低周波数符号化部で得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化部で得られる前記高周波数成分を含む符号化系列と、前記高周波数時間包絡情報符号化部で得られる高周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化部と、を備えることを特徴とする。
第4の態様に係る音声符号化装置は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置であって、前記音声信号の低周波数成分を符号化する低周波数符号化部と、前記音声信号の高周波数成分を符号化する高周波数符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、及び当該低周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、低周波数成分の時間包絡情報を算出し符号化する低周波数時間包絡情報符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、当該低周波数符号化過程で得られる情報、前記高周波数符号化部の符号化結果、及び当該高周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、高周波数成分の時間包絡情報を算出し符号化する高周波数時間包絡情報符号化部と、前記低周波数符号化部で得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化部で得られる前記高周波数成分を含む符号化系列と、前記低周波数時間包絡情報符号化部で得られる低周波数成分の時間包絡情報の符号化系列と、前記高周波数時間包絡情報符号化部で得られる高周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化部と、を備えることを特徴とする。
上述した第1〜第4の態様に係る音声符号化装置の発明は、音声符号化方法の発明として捉えることができ、以下のように記述することができる。
第1の態様に係る音声符号化方法は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、により実行される音声符号化方法であって、前記音声信号を符号化する音声符号化ステップと、前記音声信号の時間包絡情報を算出し符号化する時間包絡情報符号化ステップと、前記音声符号化ステップで得られる前記音声信号を含む符号化系列と、前記時間包絡情報符号化ステップで得られる時間包絡情報の符号化系列とを多重化する符号化系列多重化ステップと、を備えることを特徴とする。
第2の態様に係る音声符号化方法は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、により実行される音声符号化方法であって、前記音声信号の低周波数成分を符号化する低周波数符号化ステップと、前記音声信号の高周波数成分を符号化する高周波数符号化ステップと、前記音声信号、前記低周波数符号化ステップの符号化結果、及び当該低周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、低周波数成分の時間包絡情報を算出し符号化する低周波数時間包絡情報符号化ステップと、前記低周波数符号化ステップで得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化ステップで得られる前記高周波数成分を含む符号化系列と、前記低周波数時間包絡情報符号化ステップで得られる低周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化ステップと、を備えることを特徴とする。
第3の態様に係る音声符号化方法は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、により実行される音声符号化方法であって、前記音声信号の低周波数成分を符号化する低周波数符号化ステップと、前記音声信号の高周波数成分を符号化する高周波数符号化ステップと、前記音声信号、前記低周波数符号化ステップの符号化結果、当該低周波数符号化過程で得られる情報、前記高周波数符号化ステップの符号化結果、及び当該高周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、高周波数成分の時間包絡情報を算出し符号化する高周波数時間包絡情報符号化ステップと、前記低周波数符号化ステップで得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化ステップで得られる前記高周波数成分を含む符号化系列と、前記高周波数時間包絡情報符号化ステップで得られる高周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化ステップと、を備えることを特徴とする。
第4の態様に係る音声符号化方法は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、により実行される音声符号化方法であって、前記音声信号の低周波数成分を符号化する低周波数符号化ステップと、前記音声信号の高周波数成分を符号化する高周波数符号化ステップと、前記音声信号、前記低周波数符号化ステップの符号化結果、及び当該低周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、低周波数成分の時間包絡情報を算出し符号化する低周波数時間包絡情報符号化ステップと、前記音声信号、前記低周波数符号化ステップの符号化結果、当該低周波数符号化過程で得られる情報、前記高周波数符号化ステップの符号化結果、及び当該高周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、高周波数成分の時間包絡情報を算出し符号化する高周波数時間包絡情報符号化ステップと、前記低周波数符号化ステップで得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化ステップで得られる前記高周波数成分を含む符号化系列と、前記低周波数時間包絡情報符号化ステップで得られる低周波数成分の時間包絡情報の符号化系列と、前記高周波数時間包絡情報符号化ステップで得られる高周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化ステップと、を備えることを特徴とする。
また、上述した第1〜第4の態様に係る音声符号化装置の発明は、音声符号化プログラムの発明として捉えることができ、以下のように記述することができる。
第1の態様に係る音声符号化プログラムは、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、に設けられたコンピュータを、前記音声信号を符号化する音声符号化部と、前記音声信号の時間包絡情報を算出し符号化する時間包絡情報符号化部と、前記音声符号化部で得られる前記音声信号を含む符号化系列と、前記時間包絡情報符号化部で得られる時間包絡情報の符号化系列とを多重化する符号化系列多重化部、として機能させることを特徴とする。
第2の態様に係る音声符号化プログラムは、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、に設けられたコンピュータを、前記音声信号の低周波数成分を符号化する低周波数符号化部と、前記音声信号の高周波数成分を符号化する高周波数符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、及び当該低周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、低周波数成分の時間包絡情報を算出し符号化する低周波数時間包絡情報符号化部と、前記低周波数符号化部で得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化部で得られる前記高周波数成分を含む符号化系列と、前記低周波数時間包絡情報符号化部で得られる低周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化部、として機能させることを特徴とする。
第3の態様に係る音声符号化プログラムは、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、に設けられたコンピュータを、前記音声信号の低周波数成分を符号化する低周波数符号化部と、前記音声信号の高周波数成分を符号化する高周波数符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、当該低周波数符号化過程で得られる情報、前記高周波数符号化部の符号化結果、及び当該高周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、高周波数成分の時間包絡情報を算出し符号化する高周波数時間包絡情報符号化部と、前記低周波数符号化部で得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化部で得られる前記高周波数成分を含む符号化系列と、前記高周波数時間包絡情報符号化部で得られる高周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化部、として機能させることを特徴とする。
第4の態様に係る音声符号化プログラムは、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、に設けられたコンピュータを、前記音声信号の低周波数成分を符号化する低周波数符号化部と、前記音声信号の高周波数成分を符号化する高周波数符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、及び当該低周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、低周波数成分の時間包絡情報を算出し符号化する低周波数時間包絡情報符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、当該低周波数符号化過程で得られる情報、前記高周波数符号化部の符号化結果、及び当該高周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、高周波数成分の時間包絡情報を算出し符号化する高周波数時間包絡情報符号化部と、前記低周波数符号化部で得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化部で得られる前記高周波数成分を含む符号化系列と、前記低周波数時間包絡情報符号化部で得られる低周波数成分の時間包絡情報の符号化系列と、前記高周波数時間包絡情報符号化部で得られる高周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化部、として機能させることを特徴とする。
出願人は、上記の目的を達成するために、さらに以下の第5及び第6の態様に係る音声復号装置を発明した。
第5の態様に係る音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、前記符号化された音声信号を含む符号化系列を、少なくとも符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列に分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより情報を受け取り、復号された低周波数信号及び生成された高周波数信号の時間包絡形状を決定する時間包絡形状決定部と、前記時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正部と、前記時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数時間包絡修正部から時間包絡を修正された低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡を修正された高周波数信号を受け取り、出力する音声信号を合成する低周波数/高周波数信号合成部と、を備えることを特徴とする。
第6の態様に係る音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、前記符号化された音声信号を含む符号化系列を、少なくとも符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列に分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより情報を受け取り、復号された低周波数信号及び生成された高周波数信号の時間包絡形状を決定する時間包絡形状決定部と、前記低周波数復号部から復号された低周波数信号を受け取り、前記高周波数復号部から生成された高周波数信号を受け取り、前記時間包絡形状決定部にて決定された時間包絡形状に基づき、前記復号された低周波数信号及び前記生成された高周波数信号の時間包絡形状を修正し出力する時間包絡修正部と、前記時間包絡修正部から時間包絡を修正された低周波数信号及び高周波数信号を受け取り、出力する音声信号を合成する低周波数/高周波数信号合成部と、を備えることを特徴とする。
なお、第5の態様に係る音声復号装置において、前記高周波数復号部は、前記符号化系列逆多重化部、前記低周波数復号部及び前記低周波数時間包絡修正部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成してもよい。
また、第5の態様に係る音声復号装置において、前記高周波数時間包絡修正部は、前記時間包絡形状決定部にて決定された時間包絡形状に基づいて、前記高周波数復号部にて高周波数信号を生成する際の中間信号の時間包絡形状を修正し、前記高周波数復号部は、前記時間包絡形状を修正された前記中間信号を用いて、残存する高周波数信号を生成する処理を実施してもよい。
また、第6の態様に係る音声復号装置において、前記高周波数復号部は、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成してもよい。
また、第6の態様に係る音声復号装置において、前記時間包絡修正部は、前記時間包絡形状決定部にて決定された時間包絡形状に基づいて、前記高周波数復号部にて高周波数信号を生成する際の中間信号の時間包絡形状を修正し、前記高周波数復号部は、前記時間包絡形状を修正された前記中間信号を用いて、残存する高周波数信号を生成する処理を実施してもよい。
ここで、前記高周波数復号部は、前記低周波数復号部にて復号された低周波数信号を受け取り、当該信号をサブバンド信号に分割する分析フィルタ部と、少なくとも前記分析フィルタ部で分割されたサブバンド信号を用いて高周波数信号を生成する高周波数信号生成部と、前記高周波数信号生成部で生成された高周波数信号の周波数包絡を調整する周波数包絡調整部と、を備え、前記中間信号は、前記高周波数信号生成部で生成された高周波数信号であってもよい。
上述した第5及び第6の態様に係る音声復号装置の発明は、音声復号方法の発明として捉えることができ、以下のように記述することができる。
第5の態様に係る音声復号方法は、符号化された音声信号を復号して音声信号を出力する音声復号装置、により実行される音声復号方法であって、前記符号化された音声信号を含む符号化系列を、少なくとも符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列に分割する符号化系列逆多重化ステップと、分割により得られた前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた情報を受け取り、当該情報に基づいて高周波数信号を生成する高周波数復号ステップと、前記符号化系列逆多重化ステップ、前記低周波数復号ステップ、及び前記高周波数復号ステップのうち少なくとも一つで得られた情報を受け取り、復号された低周波数信号及び生成された高周波数信号の時間包絡形状を決定する時間包絡形状決定ステップと、前記時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正ステップと、前記時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正ステップと、前記低周波数時間包絡修正ステップで得られた時間包絡を修正された低周波数信号を受け取り、前記高周波数時間包絡修正ステップで得られた時間包絡を修正された高周波数信号を受け取り、出力する音声信号を合成する低周波数/高周波数信号合成ステップと、を備えることを特徴とする。
第6の態様に係る音声復号方法は、符号化された音声信号を復号して音声信号を出力する音声復号装置、により実行される音声復号方法であって、前記符号化された音声信号を含む符号化系列を、少なくとも符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列に分割する符号化系列逆多重化ステップと、分割により得られた前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた情報を受け取り、当該情報に基づいて高周波数信号を生成する高周波数復号ステップと、前記符号化系列逆多重化ステップ、前記低周波数復号ステップ、及び前記高周波数復号ステップのうち少なくとも一つで得られた情報を受け取り、復号された低周波数信号及び生成された高周波数信号の時間包絡形状を決定する時間包絡形状決定ステップと、前記低周波数復号ステップで得られた復号された低周波数信号を受け取り、前記高周波数復号ステップで得られた生成された高周波数信号を受け取り、前記時間包絡形状決定ステップにて決定された時間包絡形状に基づき、前記復号された低周波数信号及び前記生成された高周波数信号の時間包絡形状を修正し出力する時間包絡修正ステップと、前記時間包絡修正ステップで得られた時間包絡を修正された低周波数信号及び高周波数信号を受け取り、出力する音声信号を合成する低周波数/高周波数信号合成ステップと、を備えることを特徴とする。
また、上述した第5及び第6の態様に係る音声復号装置の発明は、音声復号プログラムの発明として捉えることができ、以下のように記述することができる。
第5の態様に係る音声復号プログラムは、符号化された音声信号を復号して音声信号を出力する音声復号装置、に設けられたコンピュータを、前記符号化された音声信号を含む符号化系列を、少なくとも符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列に分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより情報を受け取り、復号された低周波数信号及び生成された高周波数信号の時間包絡形状を決定する時間包絡形状決定部と、前記時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正部と、前記時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数時間包絡修正部から時間包絡を修正された低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡を修正された高周波数信号を受け取り、出力する音声信号を合成する低周波数/高周波数信号合成部、として機能させることを特徴とする。
第6の態様に係る音声復号プログラムは、符号化された音声信号を復号して音声信号を出力する音声復号装置、に設けられたコンピュータを、前記符号化された音声信号を含む符号化系列を、少なくとも符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列に分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより情報を受け取り、復号された低周波数信号及び生成された高周波数信号の時間包絡形状を決定する時間包絡形状決定部と、前記低周波数復号部から復号された低周波数信号を受け取り、前記高周波数復号部から生成された高周波数信号を受け取り、前記時間包絡形状決定部にて決定された時間包絡形状に基づき、前記復号された低周波数信号及び前記生成された高周波数信号の時間包絡形状を修正し出力する時間包絡修正部と、前記時間包絡修正部から時間包絡を修正された低周波数信号及び高周波数信号を受け取り、出力する音声信号を合成する低周波数/高周波数信号合成部、として機能させることを特徴とする。

Claims (5)

  1. 符号化された音声信号を復号して音声信号を出力する音声復号装置であって、
    符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、
    前記低周波数復号部より第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、
    符号化装置から送信された第2の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定部と、
    前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、
    前記低周波数復号部から低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡形状を修正された高周波数信号を受け取り、前記低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部と、
    を備え、
    前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて時間包絡形状が平坦であると決定された場合、前記生成された高周波数信号のうち、時間セグメント内の任意の前記生成された高周波数信号を使って時間包絡形状を修正し出力する音声復号装置。
  2. 前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて時間包絡形状が平坦であると決定された場合、xdec(i) (t(l)≦i<t(l+1))を任意の時間セグメント内の高周波数信号としたときに、
    Figure 2013242514
    を使って得られる信号を、時間包絡形状が修正された高周波数信号として出力する、
    ことを特徴とする請求項1に記載の音声復号装置。
  3. 前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部、をさらに備える請求項1または2に記載の音声復号装置。
  4. 前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づいて、前記高周波数復号部にて高周波数信号を生成する際の中間信号の時間包絡形状を修正し、
    前記高周波数復号部は、前記時間包絡形状を修正された前記中間信号を用いて、残存する高周波数信号を生成する処理を実施する、
    ことを特徴とする請求項1〜3の何れか一項に記載の音声復号装置。
  5. 前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて時間包絡形状が平坦であると決定された場合、xdec(i) (t(l)≦i<t(l+1))を任意の時間セグメント内の高周波数信号としたときに、
    Figure 2013242514

    Figure 2013242514
    で除した結果に基づいて得られる信号を、時間包絡形状が修正された高周波数信号として出力する、
    ことを特徴とする請求項1〜4の何れか一項に記載の音声復号装置。
JP2012254496A 2012-04-27 2012-11-20 音声復号装置 Active JP5997592B2 (ja)

Priority Applications (11)

Application Number Priority Date Filing Date Title
JP2012254496A JP5997592B2 (ja) 2012-04-27 2012-11-20 音声復号装置
CN201380021992.XA CN104246876B (zh) 2012-04-27 2013-04-12 声音解码装置、声音编码装置、声音解码方法及声音编码方法
EP13781215.2A EP2843658A4 (en) 2012-04-27 2013-04-12 AUDIO DECODING DEVICE, AUDIO ENCODING DEVICE, AUDIO DECODING METHOD, AUDIO ENCODING METHOD, AUDIO DECODING PROGRAM, AND AUDIO CODING PROGRAM
CN201710052845.9A CN107068159B (zh) 2012-04-27 2013-04-12 声音解码装置
EP22178627.0A EP4086898A1 (en) 2012-04-27 2013-04-12 Audio decoding device
PCT/JP2013/061105 WO2013161592A1 (ja) 2012-04-27 2013-04-12 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
TW102114359A TWI576827B (zh) 2012-04-27 2013-04-23 Sound decoding device
US14/523,260 US9761240B2 (en) 2012-04-27 2014-10-24 Audio decoding device, audio coding device, audio decoding method, audio coding method, audio decoding program, and audio coding program
US15/635,191 US10068584B2 (en) 2012-04-27 2017-06-27 Audio decoding device, audio coding device, audio decoding method, audio coding method, audio decoding program, and audio coding program
US16/047,904 US10714113B2 (en) 2012-04-27 2018-07-27 Audio decoding device, audio coding device, audio decoding method, audio coding method, audio decoding program, and audio coding program
US16/894,748 US11562760B2 (en) 2012-04-27 2020-06-05 Audio decoding device, audio coding device, audio decoding method, audio coding method, audio decoding program, and audio coding program

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012103519 2012-04-27
JP2012103519 2012-04-27
JP2012254496A JP5997592B2 (ja) 2012-04-27 2012-11-20 音声復号装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2016099513A Division JP6200034B2 (ja) 2012-04-27 2016-05-18 音声復号装置

Publications (3)

Publication Number Publication Date
JP2013242514A JP2013242514A (ja) 2013-12-05
JP2013242514A5 true JP2013242514A5 (ja) 2015-10-08
JP5997592B2 JP5997592B2 (ja) 2016-09-28

Family

ID=49482918

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012254496A Active JP5997592B2 (ja) 2012-04-27 2012-11-20 音声復号装置

Country Status (6)

Country Link
US (4) US9761240B2 (ja)
EP (2) EP4086898A1 (ja)
JP (1) JP5997592B2 (ja)
CN (2) CN107068159B (ja)
TW (1) TWI576827B (ja)
WO (1) WO2013161592A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5975243B2 (ja) * 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5997592B2 (ja) 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
JP6200034B2 (ja) * 2012-04-27 2017-09-20 株式会社Nttドコモ 音声復号装置
WO2015041070A1 (ja) 2013-09-19 2015-03-26 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
EP3089161B1 (en) 2013-12-27 2019-10-23 Sony Corporation Decoding device, method, and program
JP6035270B2 (ja) * 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US10523383B2 (en) * 2014-08-15 2019-12-31 Huawei Technologies Co., Ltd. System and method for generating waveforms and utilization thereof
CN107517593B (zh) * 2015-02-26 2021-03-12 弗劳恩霍夫应用研究促进协会 用于使用目标时域包络来处理音频信号以获得经处理的音频信号的装置和方法
JP6511033B2 (ja) * 2016-10-31 2019-05-08 株式会社Nttドコモ 音声符号化装置および音声符号化方法
CN109150320B (zh) * 2018-07-26 2020-10-30 厦门声连网信息科技有限公司 一种声波信号编码、解码方法及装置
CN111092667B (zh) * 2019-12-18 2023-09-01 公安部第三研究所 一种对讲终端音频建立时间的测试方法及测试系统
CN115171709B (zh) * 2022-09-05 2022-11-18 腾讯科技(深圳)有限公司 语音编码、解码方法、装置、计算机设备和存储介质

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5684920A (en) * 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
DE19526366A1 (de) * 1995-07-20 1997-01-23 Bosch Gmbh Robert Verfahren zur Redundanzreduktion bei der Codierung von mehrkanaligen Signalen und Vorrichtung zur Dekodierung von redundanzreduzierten, mehrkanaligen Signalen
JP3283413B2 (ja) 1995-11-30 2002-05-20 株式会社日立製作所 符号化復号方法、符号化装置および復号装置
US5737716A (en) * 1995-12-26 1998-04-07 Motorola Method and apparatus for encoding speech using neural network technology for speech classification
US5825320A (en) * 1996-03-19 1998-10-20 Sony Corporation Gain control method for audio encoding device
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
AUPP829899A0 (en) * 1999-01-27 1999-02-18 Motorola Australia Pty Ltd Method and apparatus for time-warping a digitised waveform to have an approximately fixed period
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
JP3660599B2 (ja) 2001-03-09 2005-06-15 日本電信電話株式会社 音響信号の立ち上がり・立ち下がり検出方法及び装置並びにプログラム及び記録媒体
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP3469567B2 (ja) * 2001-09-03 2003-11-25 三菱電機株式会社 音響符号化装置、音響復号化装置、音響符号化方法及び音響復号化方法
EP1701340B1 (en) * 2001-11-14 2012-08-29 Panasonic Corporation Decoding device, method and program
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
CN100492492C (zh) * 2002-09-19 2009-05-27 松下电器产业株式会社 音频解码设备和方法
CN101656074B (zh) * 2004-05-14 2013-01-23 松下电器产业株式会社 音频解码装置、音频解码方法以及通信终端和基站装置
GB0421346D0 (en) * 2004-09-24 2004-10-27 Smith Jonathan S R Product representations of amplitude and frequency modulated signals
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
CN101124727B (zh) * 2005-01-11 2011-11-09 新加坡科技研究局 编码器、解码器以及用于编码/解码的方法
DE602006004959D1 (de) * 2005-04-15 2009-03-12 Dolby Sweden Ab Zeitliche hüllkurvenformgebung von entkorrelierten signalen
PT1875463T (pt) * 2005-04-22 2019-01-24 Qualcomm Inc Sistemas, métodos e aparelho para nivelamento de fator de ganho
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
EP2005424A2 (fr) 2006-03-20 2008-12-24 France Télécom Procede de post-traitement d'un signal dans un decodeur audio
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
GB0617086D0 (en) 2006-08-30 2006-10-11 K9 Ind Ltd Bicycle suspension
DE102006049154B4 (de) * 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
JP4984983B2 (ja) * 2007-03-09 2012-07-25 富士通株式会社 符号化装置および符号化方法
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101475724B1 (ko) * 2008-06-09 2014-12-30 삼성전자주식회사 오디오 신호 품질 향상 장치 및 방법
KR101345695B1 (ko) * 2008-07-11 2013-12-30 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 대역폭 확장 출력 데이터를 생성하기 위한 장치 및 방법
JP5203077B2 (ja) 2008-07-14 2013-06-05 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
WO2010028297A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
KR101320963B1 (ko) * 2009-03-31 2013-10-23 후아웨이 테크놀러지 컴퍼니 리미티드 신호 잡음 제거 방법, 신호 잡음 제거 장치, 및 오디오 디코딩 시스템
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP4921611B2 (ja) 2009-04-03 2012-04-25 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
KR101764926B1 (ko) * 2009-12-10 2017-08-03 삼성전자주식회사 음향 통신을 위한 장치 및 방법
WO2011148230A1 (en) * 2010-05-25 2011-12-01 Nokia Corporation A bandwidth extender
FR2961980A1 (fr) * 2010-06-24 2011-12-30 France Telecom Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
TWI516138B (zh) * 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
JP5581449B2 (ja) * 2010-08-24 2014-08-27 ドルビー・インターナショナル・アーベー Fmステレオ無線受信機の断続的モノラル受信の隠蔽
DK3407352T3 (da) * 2011-02-18 2022-06-07 Ntt Docomo Inc Taleafkoder, talekoder, taleafkodningsfremgangsmåde, talekodningsfremgangsmåde, taleafkodningsprogram og talekodningsprogram
WO2012137617A1 (ja) * 2011-04-05 2012-10-11 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
KR101835327B1 (ko) * 2011-11-18 2018-04-19 엘지전자 주식회사 디스플레이기기 및 디스플레이기기의 컨텐츠 제공 방법
JP5997592B2 (ja) 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
JP6035270B2 (ja) 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム

Similar Documents

Publication Publication Date Title
JP2013242514A5 (ja)
US11562760B2 (en) Audio decoding device, audio coding device, audio decoding method, audio coding method, audio decoding program, and audio coding program
JP6173288B2 (ja) マルチモードオーディオコーデックおよびそれに適応されるcelp符号化
AU2012234115B2 (en) Encoding apparatus and method, and program
JP5942358B2 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
KR101736394B1 (ko) 오디오 신호 인코딩/디코딩 방법 및 오디오 신호 인코딩/디코딩 장치
KR101868926B1 (ko) 노이즈 신호 처리 및 생성 방법, 인코더/디코더 및 인코딩/디코딩 시스템
EP3268960B1 (en) Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
RU2016105613A (ru) Аудиокодер, аудиодекодер и связанные способы с использованием двухканальной обработки в инфраструктуре интеллектуального заполнения интервалов отсутствия сигнала
KR20070092240A (ko) 음성 부호화 장치 및 음성 부호화 방법
RU2013142349A (ru) Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи
JP2011013560A (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置
JP2016500453A (ja) 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加
JP2004138756A (ja) 音声符号化装置、音声復号化装置、音声信号伝送方法及びプログラム
EP2128854A1 (en) Audio encoding device and audio decoding device
JP2013076871A (ja) 音声符号化装置及びプログラム、音声復号装置及びプログラム、並びに、音声符号化システム
EP2490216B1 (en) Layered speech coding
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
JPWO2007037359A1 (ja) 音声符号化装置および音声符号化方法
JP2016018042A (ja) 音声復号化装置、音声復号化方法、音声復号化プログラム及び通信機器
JP2009104169A (ja) 音声符号列の変換装置および変換方法
JP2017524157A (ja) 快適雑音生成モード選択のための装置および方法
JP2013167783A (ja) 多チャネル音響システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム