JP2019144591A - 音声復号装置 - Google Patents

音声復号装置 Download PDF

Info

Publication number
JP2019144591A
JP2019144591A JP2019087812A JP2019087812A JP2019144591A JP 2019144591 A JP2019144591 A JP 2019144591A JP 2019087812 A JP2019087812 A JP 2019087812A JP 2019087812 A JP2019087812 A JP 2019087812A JP 2019144591 A JP2019144591 A JP 2019144591A
Authority
JP
Japan
Prior art keywords
time envelope
signal
frequency signal
modification
speech decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019087812A
Other languages
English (en)
Other versions
JP6793221B2 (ja
Inventor
菊入 圭
Kei Kikuiri
圭 菊入
山口 貴史
Takashi Yamaguchi
貴史 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Publication of JP2019144591A publication Critical patent/JP2019144591A/ja
Application granted granted Critical
Publication of JP6793221B2 publication Critical patent/JP6793221B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】少ない情報量で復号信号の時間包絡形状を修正し知覚される歪みを軽減する。【解決手段】入力される音声信号を符号化して符号化系列を出力する音声符号化装置は、音声信号を符号化する音声符号化部と、音声信号の時間包絡情報を算出し符号化する時間包絡情報符号化部と、音声符号化部で得られる音声信号を含む符号化系列と、時間包絡情報符号化部で得られる時間包絡情報の符号化系列とを多重化する符号化系列多重化部と、を備え、時間包絡情報は、音声信号の高周波数信号の時間包絡の相加平均と相乗平均との比に基づいて生成される。【選択図】図1

Description

本発明は、音声復号装置に関する。
音声信号、音響信号のデータ量を数十分の一に圧縮する音声符号化技術は、信号の伝送・蓄積において極めて重要な技術である。広く利用されている音声符号化技術の例として、時間領域にて信号を符号化する符号励振線形予測符号化(CELP)、周波数領域にて信号を符号化する変換符号励振符号化(TCX)、“ISO/IEC MPEG”で標準化された“MPEG4 AAC”などを挙げることができる。
音声符号化の性能をさらに向上させ、低いビットレートで高い音声品質を得る方法として、音声の低周波成分を用いて高周波成分を生成する帯域拡張技術が近年広く用いられるようになった。帯域拡張技術の代表的な例は“MPEG4 AAC”で利用されるSBR(Spectral Band Replication)技術が挙げられる。
音声符号化においては、入力信号を符号化して得られた符号化系列を復号して得られる復号信号の時間包絡形状が入力信号の時間包絡形状と大きく異なり、歪みとして知覚される場合がある。また、帯域拡張技術を用いる場合には、音声信号の低周波数成分を上記のような音声符号化技術で符号化・復号して得られた信号を用いて高周波数成分を生成するため、同様に高周波数成分の時間包絡形状も異なり、歪みとして知覚される場合がある。
この課題に対する解決手法として、以下の手法が知られている(下記特許文献1参照)。すなわち、高周波数成分を生成するために、任意の時間セグメント内において高周波数成分を周波数帯域に分割し、当該周波数帯域ごとのエネルギーの情報を算出し符号化する際に、当該周波数帯域ごとのエネルギーの情報を上記時間セグメントよりも短い時間セグメント毎に算出・符号化する。この際、上記分割する周波数帯域、及び短い時間セグメントについて、各周波数帯域の帯域幅、及び短い時間セグメントの長さを柔軟に設定できる。これにより、復号装置においては、時間方向については、短い時間セグメント毎に高周波数成分のエネルギーを制御する、すなわち短い時間セグメント毎に高周波数成分の時間包絡を制御することができる。
米国特許第7,191,121号
しかし、上記特許文献1の方法によると、高周波数成分の時間包絡を詳細に制御するためには、非常に短い時間セグメントに区切り、当該短い時間セグメント毎に周波数帯域毎のエネルギー情報を算出・符号化する必要があるため、当該情報の情報量が非常に大きくなり低ビットレートでの符号化が困難になるという問題がある。
上記の問題に鑑み、本発明は、少ない情報量で復号信号の時間包絡形状を修正し知覚される歪みを軽減することを目的とする。
本発明の一実施形態に係る音声符号化装置は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置であって、前記音声信号を符号化する音声符号化部と、前記音声信号の時間包絡情報を算出し符号化する時間包絡情報符号化部と、前記音声符号化部で得られる前記音声信号を含む符号化系列と、前記時間包絡情報符号化部で得られる時間包絡情報の符号化系列とを多重化する符号化系列多重化部と、を備え、前記時間包絡情報は、前記音声信号の高周波数信号の時間包絡の相加平均と相乗平均との比に基づいて生成される。
本発明の一実施形態に係る音声符号化方法は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、により実行される音声符号化方法であって、前記音声信号を符号化する音声符号化ステップと、前記音声信号の時間包絡情報を算出し符号化する時間包絡情報符号化ステップと、前記音声符号化ステップで得られる前記音声信号を含む符号化系列と、前記時間包絡情報符号化ステップで得られる時間包絡情報の符号化系列とを多重化する符号化系列多重化ステップと、を備え、前記時間包絡情報は、前記音声信号の高周波数信号の時間包絡の相加平均と相乗平均との比に基づいて生成される。
本発明によれば、少ない情報量で復号信号の時間包絡形状を修正し知覚される歪みを軽減することができる。
第1の実施形態に係る音声復号装置10の構成を示す図である。 第1の実施形態に係る音声復号装置10の動作を示すフローチャートである。 第1の実施形態に係る音声符号化装置20の構成を示す図である。 第1の実施形態に係る音声符号化装置20の動作を示すフローチャートである。 第1の実施形態に係る音声復号装置の第1の変形例10Aの構成を示す図である。 第1の実施形態に係る音声復号装置の第1の変形例10Aの動作を示すフローチャートである。 第1の実施形態に係る音声復号装置の第2の変形例10Bの構成を示す図である。 第1の実施形態に係る音声復号装置の第3の変形例10Cの構成を示す図である。 第1の実施形態に係る音声符号化装置の第1の変形例20Aの構成を示す図である。 第1の実施形態に係る音声符号化装置の第1の変形例20Aの動作を示すフローチャートである。 第2の実施形態に係る音声復号装置11の構成を示す図である。 第2の実施形態に係る音声復号装置11の動作を示すフローチャートである。 第2の実施形態に係る音声符号化装置21の構成を示す図である。 第2の実施形態に係る音声符号化装置21の動作を示すフローチャートである。 第2の実施形態に係る音声符号化装置の第1の変形例21Aの構成を示す図である。 第2の実施形態に係る音声符号化装置の第1の変形例21Aの動作を示すフローチャートである。 第3の実施形態に係る音声復号装置12の構成を示す図である。 第3の実施形態に係る音声復号装置12の動作を示すフローチャートである。 第3の実施形態に係る音声符号化装置22の構成を示す図である。 第3の実施形態に係る音声符号化装置22の動作を示すフローチャートである。 第3の実施形態に係る音声符号化装置の第1の変形例22Aの構成を示す図である。 第3の実施形態に係る音声符号化装置の第1の変形例22Aの動作を示すフローチャートである。 第3の実施形態に係る音声符号化装置の第2の変形例22Bの構成を示す図である。 第3の実施形態に係る音声符号化装置の第1の変形例22Bの動作を示すフローチャートである。 第4の実施形態に係る音声復号装置13の構成を示す図である。 第4の実施形態に係る音声復号装置13の動作を示すフローチャートである。 第4の実施形態に係る音声符号化装置23の構成を示す図である。 第4の実施形態に係る音声符号化装置23の動作を示すフローチャートである。 第4の実施形態に係る音声復号装置の第1の変形例13Aの構成を示す図である。 第4の実施形態に係る音声復号装置の第1の変形例13Aの動作を示すフローチャートである。 第4の実施形態に係る音声復号装置の第2の変形例13Bの構成を示す図である。 第4の実施形態に係る音声復号装置の第3の変形例13Cの構成を示す図である。 第4の実施形態に係る音声符号化装置の第1の変形例23Aの構成を示す図である。 第4の実施形態に係る音声符号化装置の第1の変形例23Aの動作を示すフローチャートである。 第5の実施形態に係る音声復号装置14の構成を示す図である。 第5の実施形態に係る音声復号装置14の動作を示すフローチャートである。 第5の実施形態に係る音声符号化装置24の構成を示す図である。 第5の実施形態に係る音声符号化装置24の動作を示すフローチャートである。 第5の実施形態に係る音声復号装置の第1の変形例14Aの構成を示す図である。 第5の実施形態に係る音声復号装置の第1の変形例14Aの動作を示すフローチャートである。 第6の実施形態に係る音声復号装置15の構成を示す図である。 第6の実施形態に係る音声復号装置15の動作を示すフローチャートである。 第6の実施形態に係る音声符号化装置25の構成を示す図である。 第6の実施形態に係る音声符号化装置25の動作を示すフローチャートである。 第6の実施形態に係る音声復号装置の第1の変形例15Aの構成を示す図である。 第6の実施形態に係る音声復号装置の第1の変形例15Aの動作を示すフローチャートである。 第7の実施形態に係る音声復号装置16の構成を示す図である。 第7の実施形態に係る音声復号装置の動作を示すフローチャートである。 第7の実施形態に係る音声符号化装置26の構成を示す図である。 第7の実施形態に係る音声符号化装置26の動作を示すフローチャートである。 第7の実施形態に係る音声復号装置の第1の変形例16Aの構成を示す図である。 第7の実施形態に係る音声復号装置の第1の変形例16Aの動作を示すフローチャートである。 第7の実施形態に係る音声符号化装置の第1の変形例26Aの構成を示す図である。 第7の実施形態に係る音声符号化装置の第1の変形例26Aの動作を示すフローチャートである。 第8の実施形態に係る音声復号装置17の構成を示す図である。 第8の実施形態に係る音声復号装置の動作を示すフローチャートである。 第8の実施形態に係る音声符号化装置27の構成を示す図である。 第8の実施形態に係る音声符号化装置27の動作を示すフローチャートである。 第9の実施形態に係る音声復号装置18の構成を示す図である。 第9の実施形態に係る音声復号装置の動作を示すフローチャートである。 第9の実施形態に係る音声符号化装置28の構成を示す図である。 第9の実施形態に係る音声符号化装置28の動作を示すフローチャートである。 第9の実施形態に係る音声復号装置の第1の変形例18Aの構成を示す図である。 第9の実施形態に係る音声復号装置の第1の変形例18Aの動作を示すフローチャートである。 第10の実施形態に係る音声復号装置1の構成を示す図である。 第10の実施形態に係る音声復号装置の動作を示すフローチャートである。 第10の実施形態に係る音声符号化装置2の構成を示す図である。 第10の実施形態に係る音声符号化装置2の動作を示すフローチャートである。 第11の実施形態に係る音声復号装置100の構成を示す図である。 第11の実施形態に係る音声復号装置の動作を示すフローチャートである。 第11の実施形態に係る音声符号化装置200の構成を示す図である。 第11の実施形態に係る音声符号化装置200の動作を示すフローチャートである。 第11の実施形態に係る音声復号装置の第1の変形例100Aの構成を示す図である。 第11の実施形態に係る音声復号装置の第1の変形例100Aの動作を示すフローチャートである。 第11の実施形態に係る音声符号化装置の第1の変形例100Aの構成を示す図である。 第12の実施形態に係る音声復号装置110の構成を示す図である。 第12の実施形態に係る音声復号装置の動作を示すフローチャートである。 第12の実施形態に係る音声符号化装置210の構成を示す図である。 第12の実施形態に係る音声符号化装置210の動作を示すフローチャートである。 第13の実施形態に係る音声復号装置120の構成を示す図である。 第13の実施形態に係る音声復号装置120の動作を示すフローチャートである。 第13の実施形態に係る音声符号化装置220の構成を示す図である。 第13の実施形態に係る音声符号化装置220の動作を示すフローチャートである。 第13の実施形態に係る音声復号装置の第1の変形例120Aの構成を示す図である。 第13の実施形態に係る音声復号装置の第1の変形例120Aの動作を示すフローチャートである。 第13の実施形態に係る音声復号装置の第2の変形例120Bの構成を示す図である。 第13の実施形態に係る音声復号装置の第2の変形例120Bの動作を示すフローチャートである。 第14の実施形態に係る音声復号装置130の構成を示す図である。 第14の実施形態に係る音声復号装置の動作を示すフローチャートである。 第14の実施形態に係る音声符号化装置230の構成を示す図である。 第14の実施形態に係る音声符号化装置230の動作を示すフローチャートである。 第15の実施形態に係る音声復号装置140の構成を示す図である。 第15の実施形態に係る音声復号装置の動作を示すフローチャートである。 第15の実施形態に係る音声符号化装置240の構成を示す図である。 第15の実施形態に係る音声符号化装置240の動作を示すフローチャートである。 第15の実施形態に係る音声復号装置の第1の変形例140Aの構成を示す図である。 第15の実施形態に係る音声復号装置の第1の変形例140Aの動作を示すフローチャートである。 第15の実施形態に係る音声復号装置の第2の変形例140Bの構成を示す図である。 第16の実施形態に係る音声復号装置150の構成を示す図である。 第16の実施形態に係る音声復号装置の動作を示すフローチャートである。 第16の実施形態に係る音声符号化装置250の構成を示す図である。 第16の実施形態に係る音声符号化装置250の動作を示すフローチャートである。 第16の実施形態に係る音声復号装置の第1の変形例150Aの構成を示す図である。 第16の実施形態に係る音声復号装置の第1の変形例150Aの動作を示すフローチャートである。 第16の実施形態に係る音声復号装置の第2の変形例150Bの構成を示す図である。 第17の実施形態に係る音声復号装置160の構成を示す図である。 第17の実施形態に係る音声復号装置の動作を示すフローチャートである。 第17の実施形態に係る音声符号化装置260の構成を示す図である。 第17の実施形態に係る音声符号化装置260の動作を示すフローチャートである。 第17の実施形態に係る音声復号装置の第1の変形例160Aの構成を示す図である。 第17の実施形態に係る音声復号装置の第1の変形例160Aの動作を示すフローチャートである。 第17の実施形態に係る音声復号装置の第2の変形例160Bの構成を示す図である。 第18の実施形態に係る音声復号装置170の構成を示す図である。 第18の実施形態に係る音声復号装置の動作を示すフローチャートである。 第18の実施形態に係る音声符号化装置270の構成を示す図である。 第18の実施形態に係る音声符号化装置270の動作を示すフローチャートである。 第19の実施形態に係る音声復号装置180の構成を示す図である。 第19の実施形態に係る音声復号装置の動作を示すフローチャートである。 第19の実施形態に係る音声符号化装置280の構成を示す図である。 第19の実施形態に係る音声符号化装置280の動作を示すフローチャートである。 第20の実施形態に係る音声復号装置190の構成を示す図である。 第20の実施形態に係る音声復号装置の動作を示すフローチャートである。 第20の実施形態に係る音声符号化装置290の構成を示す図である。 第20の実施形態に係る音声符号化装置290の動作を示すフローチャートである。 第21の実施形態に係る音声復号装置300の構成を示す図である。 第21の実施形態に係る音声復号装置の動作を示すフローチャートである。 第21の実施形態に係る音声符号化装置400の構成を示す図である。 第21の実施形態に係る音声符号化装置400の動作を示すフローチャートである。 第22の実施形態に係る音声復号装置310の構成を示す図である。 第22の実施形態に係る音声復号装置の動作を示すフローチャートである。 第22の実施形態に係る音声符号化装置410の構成を示す図である。 第22の実施形態に係る音声符号化装置410の動作を示すフローチャートである。 第23の実施形態に係る音声復号装置320の構成を示す図である。 第23の実施形態に係る音声復号装置の動作を示すフローチャートである。 第23の実施形態に係る音声符号化装置420の構成を示す図である。 第23の実施形態に係る音声符号化装置420の動作を示すフローチャートである。 第23の実施形態の第1の変形例に係る音声復号装置320Aの構成を示す図である。 第23の実施形態の第1の変形例に係る音声復号装置320Aの動作を示すフローチャートである。 第24の実施形態に係る音声復号装置330の構成を示す図である。 第24の実施形態に係る音声復号装置の動作を示すフローチャートである。 第24の実施形態に係る音声符号化装置430の構成を示す図である。 第24の実施形態に係る音声符号化装置430の動作を示すフローチャートである。 第25の実施形態に係る音声復号装置340の構成を示す図である。 第25の実施形態に係る音声復号装置の動作を示すフローチャートである。 第25の実施形態に係る音声符号化装置440の構成を示す図である。 第25の実施形態に係る音声符号化装置440の動作を示すフローチャートである。 第26の実施形態に係る音声復号装置350の構成を示す図である。 第26の実施形態に係る音声復号装置の動作を示すフローチャートである。 第26の実施形態に係る音声符号化装置450の構成を示す図である。 第26の実施形態に係る音声符号化装置450の動作を示すフローチャートである。 第26の実施形態の第1の変形例に係る音声復号装置350Aの構成を示す図である。 第26の実施形態の第1の変形例に係る音声復号装置350Aの動作を示すフローチャートである。 第7の実施形態に係る音声復号装置の第2の変形例16Bの構成を示す図である。 第7の実施形態に係る音声復号装置の第2の変形例16Bの動作を示すフローチャートである。 第7の実施形態に係る音声復号装置の第3の変形例16Cの構成を示す図である。 第7の実施形態に係る音声復号装置の第3の変形例16Cの動作を示すフローチャートである。 第7の実施形態に係る音声復号装置の第4の変形例16Dの構成を示す図である。 第7の実施形態に係る音声復号装置の第4の変形例16Dの動作を示すフローチャートである。 第7の実施形態に係る音声復号装置の第5の変形例16Eの構成を示す図である。 第7の実施形態に係る音声復号装置の第5の変形例16Eの動作を示すフローチャートである。 第8の実施形態に係る音声復号装置の第1の変形例17Aの構成を示す図である。 第8の実施形態に係る音声復号装置の第1の変形例17Aの動作を示すフローチャートである。 第8の実施形態に係る音声復号装置の第2の変形例17Bの構成を示す図である。 第8の実施形態に係る音声復号装置の第2の変形例17Bの動作を示すフローチャートである。 第8の実施形態に係る音声復号装置の第3の変形例17Cの構成を示す図である。 第8の実施形態に係る音声復号装置の第3の変形例17Cの動作を示すフローチャートである。 第8の実施形態に係る音声復号装置の第4の変形例17Dの構成を示す図である。 第8の実施形態に係る音声復号装置の第4の変形例17Dの動作を示すフローチャートである。 第9の実施形態に係る音声復号装置の第2の変形例18Bの構成を示す図である。 第9の実施形態に係る音声復号装置の第2の変形例18Bの動作を示すフローチャートである。 第9の実施形態に係る音声復号装置の第3の変形例18Cの構成を示す図である。 第9の実施形態に係る音声復号装置の第3の変形例18Cの動作を示すフローチャートである。 第9の実施形態に係る音声復号装置の第4の変形例18Dの構成を示す図である。 第9の実施形態に係る音声復号装置の第4の変形例18Dの動作を示すフローチャートである。 第9の実施形態に係る音声復号装置の第5の変形例18Eの構成を示す図である。 第9の実施形態に係る音声復号装置の第5の変形例18Eの動作を示すフローチャートである。 第9の実施形態に係る音声復号装置の第6の変形例18Fの構成を示す図である。 第9の実施形態に係る音声復号装置の第6の変形例18Fの動作を示すフローチャートである。 第9の実施形態に係る音声復号装置の第7の変形例18Gの構成を示す図である。 第9の実施形態に係る音声復号装置の第7の変形例18Gの動作を示すフローチャートである。 第9の実施形態に係る音声復号装置の第8の変形例18Hの構成を示す図である。 第9の実施形態に係る音声復号装置の第8の変形例18Hの動作を示すフローチャートである。 第9の実施形態に係る音声復号装置の第9の変形例18Iの構成を示す図である。 第9の実施形態に係る音声復号装置の第9の変形例18Iの動作を示すフローチャートである。 第13の実施形態に係る音声復号装置の第3の変形例120Cの構成を示す図である。 第13の実施形態に係る音声復号装置の第3の変形例120Cの動作を示すフローチャートである。 第13の実施形態に係る音声復号装置の第4の変形例120Dの構成を示す図である。 第13の実施形態に係る音声復号装置の第4の変形例120Dの動作を示すフローチャートである。 第13の実施形態に係る音声復号装置の第5の変形例120Eの構成を示す図である。 第13の実施形態に係る音声復号装置の第5の変形例120Eの動作を示すフローチャートである。 第13の実施形態に係る音声復号装置の第6の変形例120Fの構成を示す図である。 第13の実施形態に係る音声復号装置の第6の変形例120Fの動作を示すフローチャートである。 第13の実施形態に係る音声復号装置の第7の変形例120Gの構成を示す図である。 第13の実施形態に係る音声復号装置の第7の変形例120Gの動作を示すフローチャートである。 第13の実施形態に係る音声復号装置の第8の変形例120Hの構成を示す図である。 第13の実施形態に係る音声復号装置の第8の変形例120Hの動作を示すフローチャートである。 第13の実施形態に係る音声復号装置の第9の変形例120Iの構成を示す図である。 第13の実施形態に係る音声復号装置の第9の変形例120Iの動作を示すフローチャートである。 第13の実施形態に係る音声復号装置の第10の変形例120Jの構成を示す図である。 第13の実施形態に係る音声復号装置の第10の変形例120Jの動作を示すフローチャートである。 第13の実施形態に係る音声復号装置の第11の変形例120Kの構成を示す図である。 第13の実施形態に係る音声復号装置の第11の変形例120Kの動作を示すフローチャートである。 第13の実施形態に係る音声復号装置の第12の変形例120Lの構成を示す図である。 第13の実施形態に係る音声復号装置の第12の変形例120Lの動作を示すフローチャートである。 第13の実施形態に係る音声復号装置の第13の変形例120Mの構成を示す図である。 第13の実施形態に係る音声復号装置の第13の変形例120Mの動作を示すフローチャートである。 第13の実施形態に係る音声復号装置の第14の変形例120Nの構成を示す図である。 第13の実施形態に係る音声復号装置の第14の変形例120Nの動作を示すフローチャートである。 第15の実施形態に係る音声復号装置の第3の変形例140Cの構成を示す図である。 第15の実施形態に係る音声復号装置の第3の変形例140Cの動作を示すフローチャートである。 第15の実施形態に係る音声復号装置の第4の変形例140Dの構成を示す図である。 第15の実施形態に係る音声復号装置の第4の変形例140Dの動作を示すフローチャートである。 第15の実施形態に係る音声復号装置の第5の変形例140Eの構成を示す図である。 第15の実施形態に係る音声復号装置の第5の変形例140Eの動作を示すフローチャートである。 第15の実施形態に係る音声復号装置の第6の変形例140Fの構成を示す図である。 第15の実施形態に係る音声復号装置の第6の変形例140Fの動作を示すフローチャートである。 第15の実施形態に係る音声復号装置の第7の変形例140Gの構成を示す図である。 第15の実施形態に係る音声復号装置の第7の変形例140Gの動作を示すフローチャートである。 第15の実施形態に係る音声復号装置の第8の変形例140Hの構成を示す図である。 第15の実施形態に係る音声復号装置の第8の変形例140Hの動作を示すフローチャートである。 第15の実施形態に係る音声復号装置の第9の変形例140Iの構成を示す図である。 第15の実施形態に係る音声復号装置の第9の変形例140Iの動作を示すフローチャートである。 第15の実施形態に係る音声復号装置の第10の変形例140Jの構成を示す図である。 第15の実施形態に係る音声復号装置の第10の変形例140Jの動作を示すフローチャートである。 第15の実施形態に係る音声復号装置の第11の変形例140Kの構成を示す図である。 第15の実施形態に係る音声復号装置の第11の変形例140Kの動作を示すフローチャートである。 第15の実施形態に係る音声復号装置の第12の変形例140Lの構成を示す図である。 第15の実施形態に係る音声復号装置の第12の変形例140Lの動作を示すフローチャートである。 第15の実施形態に係る音声復号装置の第13の変形例140Mの構成を示す図である。 第15の実施形態に係る音声復号装置の第13の変形例140Mの動作を示すフローチャートである。 第15の実施形態に係る音声復号装置の第14の変形例140Nの構成を示す図である。 第15の実施形態に係る音声復号装置の第14の変形例140Nの動作を示すフローチャートである。 第16の実施形態に係る音声復号装置の第3の変形例150Cの構成を示す図である。 第16の実施形態に係る音声復号装置の第3の変形例150Cの動作を示すフローチャートである。 第16の実施形態に係る音声復号装置の第4の変形例150Dの構成を示す図である。 第16の実施形態に係る音声復号装置の第4の変形例150Dの動作を示すフローチャートである。 第16の実施形態に係る音声復号装置の第5の変形例150Eの構成を示す図である。 第16の実施形態に係る音声復号装置の第5の変形例150Eの動作を示すフローチャートである。 第16の実施形態に係る音声復号装置の第6の変形例150Fの構成を示す図である。 第16の実施形態に係る音声復号装置の第6の変形例150Fの動作を示すフローチャートである。 第16の実施形態に係る音声復号装置の第7の変形例150Gの構成を示す図である。 第16の実施形態に係る音声復号装置の第7の変形例150Gの動作を示すフローチャートである。 第16の実施形態に係る音声復号装置の第8の変形例150Hの構成を示す図である。 第16の実施形態に係る音声復号装置の第8の変形例150Hの動作を示すフローチャートである。 第16の実施形態に係る音声復号装置の第9の変形例150Iの構成を示す図である。 第16の実施形態に係る音声復号装置の第9の変形例150Iの動作を示すフローチャートである。 第16の実施形態に係る音声復号装置の第10の変形例150Jの構成を示す図である。 第16の実施形態に係る音声復号装置の第10の変形例150Jの動作を示すフローチャートである。 第16の実施形態に係る音声復号装置の第11の変形例150Kの構成を示す図である。 第16の実施形態に係る音声復号装置の第11の変形例150Kの動作を示すフローチャートである。 第16の実施形態に係る音声復号装置の第12の変形例150Lの構成を示す図である。 第16の実施形態に係る音声復号装置の第12の変形例150Lの動作を示すフローチャートである。 第16の実施形態に係る音声復号装置の第13の変形例150Mの構成を示す図である。 第16の実施形態に係る音声復号装置の第13の変形例150Mの動作を示すフローチャートである。 第16の実施形態に係る音声復号装置の第14の変形例150Nの構成を示す図である。 第16の実施形態に係る音声復号装置の第14の変形例150Nの動作を示すフローチャートである。 第17の実施形態に係る音声復号装置の第3の変形例160Cの構成を示す図である。 第17の実施形態に係る音声復号装置の第3の変形例160Cの動作を示すフローチャートである。 第17の実施形態に係る音声復号装置の第4の変形例160Dの構成を示す図である。 第17の実施形態に係る音声復号装置の第4の変形例160Dの動作を示すフローチャートである。 第17の実施形態に係る音声復号装置の第5の変形例160Eの構成を示す図である。 第17の実施形態に係る音声復号装置の第5の変形例160Eの動作を示すフローチャートである。 第17の実施形態に係る音声復号装置の第6の変形例160Fの構成を示す図である。 第17の実施形態に係る音声復号装置の第6の変形例160Fの動作を示すフローチャートである。 第17の実施形態に係る音声復号装置の第7の変形例160Gの構成を示す図である。 第17の実施形態に係る音声復号装置の第7の変形例160Gの動作を示すフローチャートである。 第17の実施形態に係る音声復号装置の第8の変形例160Hの構成を示す図である。 第17の実施形態に係る音声復号装置の第8の変形例160Hの動作を示すフローチャートである。 第17の実施形態に係る音声復号装置の第9の変形例160Iの構成を示す図である。 第17の実施形態に係る音声復号装置の第9の変形例160Iの動作を示すフローチャートである。 第17の実施形態に係る音声復号装置の第10の変形例160Jの構成を示す図である。 第17の実施形態に係る音声復号装置の第10の変形例160Jの動作を示すフローチャートである。 第17の実施形態に係る音声復号装置の第11の変形例160Kの構成を示す図である。 第17の実施形態に係る音声復号装置の第11の変形例160Kの動作を示すフローチャートである。 第17の実施形態に係る音声復号装置の第12の変形例160Lの構成を示す図である。 第17の実施形態に係る音声復号装置の第12の変形例160Lの動作を示すフローチャートである。 第17の実施形態に係る音声復号装置の第13の変形例160Mの構成を示す図である。 第17の実施形態に係る音声復号装置の第13の変形例160Mの動作を示すフローチャートである。 第17の実施形態に係る音声復号装置の第14の変形例160Nの構成を示す図である。 第17の実施形態に係る音声復号装置の第14の変形例160Nの動作を示すフローチャートである。 第18の実施形態に係る音声復号装置の第1の変形例170Aの構成を示す図である。 第18の実施形態に係る音声復号装置の第1の変形例170Aの動作を示すフローチャートである。 第18の実施形態に係る音声復号装置の第2の変形例170Bの構成を示す図である。 第18の実施形態に係る音声復号装置の第2の変形例170Bの動作を示すフローチャートである。 第18の実施形態に係る音声復号装置の第3の変形例170Cの構成を示す図である。 第18の実施形態に係る音声復号装置の第3の変形例170Cの動作を示すフローチャートである。 第18の実施形態に係る音声復号装置の第4の変形例170Dの構成を示す図である。 第18の実施形態に係る音声復号装置の第4の変形例170Dの動作を示すフローチャートである。 第19の実施形態に係る音声復号装置の第1の変形例180Aの構成を示す図である。 第19の実施形態に係る音声復号装置の第1の変形例180Aの動作を示すフローチャートである。 第19の実施形態に係る音声復号装置の第2の変形例180Bの構成を示す図である。 第19の実施形態に係る音声復号装置の第2の変形例180Bの動作を示すフローチャートである。 第19の実施形態に係る音声復号装置の第3の変形例180Cの構成を示す図である。 第19の実施形態に係る音声復号装置の第3の変形例180Cの動作を示すフローチャートである。 第19の実施形態に係る音声復号装置の第4の変形例180Dの構成を示す図である。 第19の実施形態に係る音声復号装置の第4の変形例180Dの動作を示すフローチャートである。 第20の実施形態に係る音声復号装置の第1の変形例190Aの構成を示す図である。 第20の実施形態に係る音声復号装置の第1の変形例190Aの動作を示すフローチャートである。 第20の実施形態に係る音声復号装置の第2の変形例190Bの構成を示す図である。 第20の実施形態に係る音声復号装置の第2の変形例190Bの動作を示すフローチャートである。 第20の実施形態に係る音声復号装置の第3の変形例190Cの構成を示す図である。 第20の実施形態に係る音声復号装置の第3の変形例190Cの動作を示すフローチャートである。 第20の実施形態に係る音声復号装置の第4の変形例190Dの構成を示す図である。 第20の実施形態に係る音声復号装置の第4の変形例190Dの動作を示すフローチャートである。 第20の実施形態に係る音声復号装置の第5の変形例190Eの構成を示す図である。 第20の実施形態に係る音声復号装置の第5の変形例190Eの動作を示すフローチャートである。 第20の実施形態に係る音声復号装置の第6の変形例190Fの構成を示す図である。 第20の実施形態に係る音声復号装置の第6の変形例190Fの動作を示すフローチャートである。 第20の実施形態に係る音声復号装置の第7の変形例190Gの構成を示す図である。 第20の実施形態に係る音声復号装置の第7の変形例190Gの動作を示すフローチャートである。 第20の実施形態に係る音声復号装置の第8の変形例190Hの構成を示す図である。 第20の実施形態に係る音声復号装置の第8の変形例190Hの動作を示すフローチャートである。 第20の実施形態に係る音声復号装置の第9の変形例190Iの構成を示す図である。 第20の実施形態に係る音声復号装置の第9の変形例190Iの動作を示すフローチャートである。 第21の実施形態に係る音声復号装置の第1の変形例300Aの構成を示す図である。 第21の実施形態に係る音声復号装置の第1の変形例300Aの動作を示すフローチャートである。 第21の実施形態に係る音声復号装置の第2の変形例300Bの構成を示す図である。 第21の実施形態に係る音声復号装置の第2の変形例300Bの動作を示すフローチャートである。 第21の実施形態に係る音声復号装置の第3の変形例300Cの構成を示す図である。 第21の実施形態に係る音声復号装置の第3の変形例300Cの動作を示すフローチャートである。 第21の実施形態に係る音声復号装置の第4の変形例300Dの構成を示す図である。 第21の実施形態に係る音声復号装置の第4の変形例300Dの動作を示すフローチャートである。 第22の実施形態に係る音声復号装置の第1の変形例310Aの構成を示す図である。 第22の実施形態に係る音声復号装置の第1の変形例310Aの動作を示すフローチャートである。 第22の実施形態に係る音声復号装置の第2の変形例310Bの構成を示す図である。 第22の実施形態に係る音声復号装置の第2の変形例310Bの動作を示すフローチャートである。 第22の実施形態に係る音声復号装置の第3の変形例310Cの構成を示す図である。 第22の実施形態に係る音声復号装置の第3の変形例310Cの動作を示すフローチャートである。 第22の実施形態に係る音声復号装置の第4の変形例310Dの構成を示す図である。 第22の実施形態に係る音声復号装置の第4の変形例310Dの動作を示すフローチャートである。 第23の実施形態に係る音声復号装置の第2の変形例320Bの構成を示す図である。 第23の実施形態に係る音声復号装置の第2の変形例320Bの動作を示すフローチャートである。 第23の実施形態に係る音声復号装置の第3の変形例320Cの構成を示す図である。 第23の実施形態に係る音声復号装置の第3の変形例320Cの動作を示すフローチャートである。 第23の実施形態に係る音声復号装置の第4の変形例320Dの構成を示す図である。 第23の実施形態に係る音声復号装置の第4の変形例320Dの動作を示すフローチャートである。 第23の実施形態に係る音声復号装置の第5の変形例320Eの構成を示す図である。 第23の実施形態に係る音声復号装置の第5の変形例320Eの動作を示すフローチャートである。 第23の実施形態に係る音声復号装置の第6の変形例320Fの構成を示す図である。 第23の実施形態に係る音声復号装置の第6の変形例320Fの動作を示すフローチャートである。 第23の実施形態に係る音声復号装置の第7の変形例320Gの構成を示す図である。 第23の実施形態に係る音声復号装置の第7の変形例320Gの動作を示すフローチャートである。 第23の実施形態に係る音声復号装置の第8の変形例320Hの構成を示す図である。 第23の実施形態に係る音声復号装置の第8の変形例320Hの動作を示すフローチャートである。 第23の実施形態に係る音声復号装置の第9の変形例320Iの構成を示す図である。 第23の実施形態に係る音声復号装置の第9の変形例320Iの動作を示すフローチャートである。 第24の実施形態に係る音声復号装置の第1の変形例330Aの構成を示す図である。 第24の実施形態に係る音声復号装置の第1の変形例330Aの動作を示すフローチャートである。 第24の実施形態に係る音声復号装置の第2の変形例330Bの構成を示す図である。 第24の実施形態に係る音声復号装置の第2の変形例330Bの動作を示すフローチャートである。 第24の実施形態に係る音声復号装置の第3の変形例330Cの構成を示す図である。 第24の実施形態に係る音声復号装置の第3の変形例330Cの動作を示すフローチャートである。 第24の実施形態に係る音声復号装置の第4の変形例330Dの構成を示す図である。 第24の実施形態に係る音声復号装置の第4の変形例330Dの動作を示すフローチャートである。 第25の実施形態に係る音声復号装置の第1の変形例340Aの構成を示す図である。 第25の実施形態に係る音声復号装置の第1の変形例340Aの動作を示すフローチャートである。 第25の実施形態に係る音声復号装置の第2の変形例340Bの構成を示す図である。 第25の実施形態に係る音声復号装置の第2の変形例340Bの動作を示すフローチャートである。 第25の実施形態に係る音声復号装置の第3の変形例340Cの構成を示す図である。 第25の実施形態に係る音声復号装置の第3の変形例340Cの動作を示すフローチャートである。 第25の実施形態に係る音声復号装置の第4の変形例340Dの構成を示す図である。 第25の実施形態に係る音声復号装置の第4の変形例340Dの動作を示すフローチャートである。 第26の実施形態に係る音声復号装置の第2の変形例350Bの構成を示す図である。 第26の実施形態に係る音声復号装置の第2の変形例350Bの動作を示すフローチャートである。 第26の実施形態に係る音声復号装置の第3の変形例350Cの構成を示す図である。 第26の実施形態に係る音声復号装置の第3の変形例350Cの動作を示すフローチャートである。 第26の実施形態に係る音声復号装置の第4の変形例350Dの構成を示す図である。 第26の実施形態に係る音声復号装置の第4の変形例350Dの動作を示すフローチャートである。 第26の実施形態に係る音声復号装置の第5の変形例350Eの構成を示す図である。 第26の実施形態に係る音声復号装置の第5の変形例350Eの動作を示すフローチャートである。 第26の実施形態に係る音声復号装置の第6の変形例350Fの構成を示す図である。 第26の実施形態に係る音声復号装置の第6の変形例350Fの動作を示すフローチャートである。 第26の実施形態に係る音声復号装置の第7の変形例350Gの構成を示す図である。 第26の実施形態に係る音声復号装置の第7の変形例350Gの動作を示すフローチャートである。 第26の実施形態に係る音声復号装置の第8の変形例350Hの構成を示す図である。 第26の実施形態に係る音声復号装置の第8の変形例350Hの動作を示すフローチャートである。 第26の実施形態に係る音声復号装置の第9の変形例350Iの構成を示す図である。 第26の実施形態に係る音声復号装置の第9の変形例350Iの動作を示すフローチャートである。 第27の実施形態に係る音声復号装置360の構成を示す図である。 第27の実施形態に係る音声復号装置360の動作を示すフローチャートである。 第27の実施形態に係る音声復号装置の第1の変形例360Aの構成を示す図である。 第27の実施形態に係る音声復号装置の第1の変形例360Aの動作を示すフローチャートである。 第28の実施形態に係る音声復号装置370の構成を示す図である。 第28の実施形態に係る音声復号装置370の動作を示すフローチャートである。 第28の実施形態に係る音声復号装置の第1の変形例370Aの構成を示す図である。 第28の実施形態に係る音声復号装置の第1の変形例370Aの動作を示すフローチャートである。 第29の実施形態に係る音声復号装置380の構成を示す図である。 第29の実施形態に係る音声復号装置380の動作を示すフローチャートである。 第29の実施形態に係る音声復号装置の第1の変形例380Aの構成を示す図である。 第29の実施形態に係る音声復号装置の第1の変形例380Aの動作を示すフローチャートである。 第30の実施形態に係る音声復号装置390の構成を示す図である。 第30の実施形態に係る音声復号装置390の動作を示すフローチャートである。
添付図面を参照しながら本発明の各種の実施形態を説明する。可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。
[第1の実施形態]
図1は、第1の実施形態に係る音声復号装置10の構成を示す図である。音声復号装置10の通信装置は、下記音声符号化装置20から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置10は、図1に示すように、機能的には、符号化系列逆多重化部10a、コア復号部10b、分析フィルタバンク部10c、符号化系列解析部10d、低周波数時間包絡形状決定部10e、低周波数時間包絡修正部10f、高周波数信号生成部10g、復号/逆量子化部10h、周波数包絡調整部10i、及び合成フィルタバンク部10jを備える。各部の機能・動作は、以下、説明する。
図2は、第1の実施形態に係る音声復号装置10の動作を示すフローチャートである。
符号化系列逆多重化部10aは、符号化系列を、低周波数信号を符号化したコア符号化部分、低周波数信号から高周波数信号を生成するための帯域拡張部分、及び低周波数時間包絡形状決定部10eで必要な情報(低周波時間包絡形状に関する情報)に分割する(ステップS10-1)。
符号化系列解析部10dは、符号化系列逆多重化部10aで分割された符号化系列の帯域拡張部分を解析し、高周波数信号生成部10g、及び復号/逆量子化部10hで必要な情報に分割する(ステップS10-2)。
コア復号部10bは、符号化系列逆多重化部10aから符号化系列のコア符号化部分を受け取り復号し、低周波数信号を生成する(ステップS10-3)。
分析フィルタバンク部10cは、前記低周波数信号を複数のサブバンド信号に分割する(ステップS10-4)。
低周波数時間包絡形状決定部10eは、符号化系列解析部10dから低周波時間包絡形状に関する情報を受け取り、当該情報に基づき低周波数信号の時間包絡形状を決定する(ステップS10-5)。例えば、低周波数信号の時間包絡形状を平坦と決定するケース、低周波数信号の時間包絡形状を立ち上がりと決定するケース、低周波数信号の時間包絡形状を立ち下がりと決定するケースが挙げられる。
低周波数時間包絡修正部10fは、低周波数時間包絡形状決定部10eで決定した時間包絡形状に基づいて、分析フィルタバンク部10cから出力される低周波数信号の複数のサブバンド信号の時間包絡の形状を修正する(ステップS10-6)。
例えば、低周波数時間包絡修正部10fは、任意の時間セグメント内の前記低周波数信号の複数のサブバンド信号Xdec,LO(k,i) (0≦k<kx, tE(l)≦i<tE(l+1))に対して、所定の関数F(Xdec,LO(k,i))を用いて以下の式(1)
Figure 2019144591

により得られるX’dec,LO(k,i)を時間包絡形状が修正された低周波数信号のサブバンド信号として出力する。
例えば、前記低周波数信号の時間包絡形状が平坦と決定された場合、以下の処理により、低周波数信号の時間包絡形状を修正できる。
例えば、当該サブバンド信号Xdec,LO(k,i)をBdec,LO(m) (m=0,…,MLO, MLO≧1) (Bdec,LO(0)≧0, Bdec,LO(MLO)<kx)で境界を表されるMLO個の周波数帯域に分割し、m番目の周波数帯域に含まれるサブバンド信号Xdec,LO(k,i) (BLO(m)≦k<BLO(m+1), tE(l)≦i<tE(l+1))に対して、所定の関数F(Xdec,LO(k,i))を、
Figure 2019144591

として、X’dec,LO(k,i)を時間包絡形状が修正された低周波数信号のサブバンド信号として出力する。
また別の例によれば、所定の関数F(Xdec,LO(k,i))を、サブバンド信号Xdec,LO(k,i)に対して平滑化フィルタ処理を施す
Figure 2019144591

(Nfilt≧1)で定義して、X’dec,LO(k,i)を時間包絡形状が修正された低周波数信号のサブバンド信号として出力する。さらに、前記Bdec,LO(m)を用いて境界が表される各周波数帯域内で、フィルタ処理前後のサブバンド信号のパワーをあわせるように処理できる。
また別の例によれば、サブバンド信号Xdec,LO(k,i)を前記Bdec,LO(m)を用いて境界が表される各周波数帯域内で周波数方向に線形予測して線形予測係数αp(m) (m=0,…,MLO-1)を得て、所定の関数F(Xdec,LO(k,i))を、サブバンド信号Xdec,LO(k,i)に対して線形予測逆フィルタ処理を施す
Figure 2019144591

(Npred≧1)で定義して、X’dec,LO(k,i)を時間包絡形状が修正された低周波数信号のサブバンド信号として出力する。
上記の時間包絡形状を平坦に修正する処理の例は、それぞれを組み合わせて実施できる。低周波数時間包絡修正部10fは、低周波数信号の複数のサブバンド信号の時間包絡の形状を平坦に修正する処理を実施し、上記の例に限定されない。
さらには、例えば、前記低周波数信号の時間包絡形状が立ち上がりと決定された場合、以下の処理により、低周波数信号の時間包絡形状を修正できる。
例えば、所定の関数F(Xdec,LO(k,i))をiに対して単調増加する関数incr(i)を用いて
Figure 2019144591

で定義して、X’dec,LO(k,i)を時間包絡形状が修正された低周波数信号のサブバンド信号として出力する。さらに、前記Bdec,LO(m)を用いて境界が表される各周波数帯域内で、時間包絡形状の修正前後のサブバンド信号のパワーをあわせるように処理できる。
低周波数時間包絡修正部10fは、低周波数信号の複数のサブバンド信号の時間包絡の形状を立ち上がりに修正する処理を実施し、上記の例に限定されない。
さらには、例えば、前記低周波数信号の時間包絡形状が立ち下がりと決定された場合、以下の処理により、低周波数信号の時間包絡形状を修正できる。
例えば、所定の関数F(Xdec,LO(k,i))を、iに対して単調減少する関数decr(i)を用いて
Figure 2019144591

で定義して、X’dec,LO(k,i)を時間包絡形状が修正された低周波数信号のサブバンド信号として出力する。さらに、前記Bdec,LO(m)を用いて境界が表される各周波数帯域内で、時間包絡形状の修正前後のサブバンド信号のパワーをあわせるように処理できる。
低周波数時間包絡修正部10fは、低周波数信号の複数のサブバンド信号の時間包絡の形状を立ち下がりに修正する処理を実施し、上記の例に限定されない。
復号/逆量子化部10hは、符号化系列解析部10dから出力された時間/周波数分解能の情報より、高周波数信号の生成/調整処理におけるスケールファクタバンドのデザイン、時間セグメントの長さを決定し、さらに、高周波数信号生成部10gにて生成される高周波数信号に対する、ゲインの情報および当該高周波数信号に付加するノイズ信号の情報を符号化系列解析部10dより受け取り,復号/逆量子化して高周波数信号に対するゲインおよびノイズ信号の大きさを取得する(ステップS10-7)。なお、上記スケールファクタバンドのデザイン、時間セグメントの長さについてあらかじめ決められている場合は決定する必要は無い。
高周波数信号生成部10gは、入力される低周波数信号のサブバンド信号から、符号化系列解析部10dから出力された情報、復号/逆量子化部10hから出力されたスケールファクタバンドのデザイン、時間セグメントの長さのうち少なくとも一つに基づいて、高周波数信号を生成する(ステップS10-8)。本実施形態においては、分析フィルタバンク部10cで分割された低周波数信号のサブバンド信号が入力される。
周波数包絡調整部10iは、復号/逆量子化部10hで取得したゲインおよびノイズ信号の大きさに基づいて、高周波数信号生成部10gにて生成された高周波数信号に対してゲイン調整およびノイズ信号の付加をして高周波数信号の周波数包絡を調整する(ステップS10-9)。さらに、正弦波信号を付加することもでき、当該正弦波信号の付加は符号化系列の帯域拡張部分に含まれる情報に基づいても良い。
合成フィルタバンク部10jは、低周波数時間包絡修正部10fから出力された低周波数信号のサブバンド信号と、周波数包絡調整部10iから出力された高周波数信号のサブバンド信号から時間信号を合成し、出力音声信号として出力する(ステップS10-10)。
ステップS10-1〜S10-4、S10-7〜S10-10の処理は、“ISO/IEC 14496-3”に規定される“SBR”および“Low Delay SBR”の各処理にて対応できる。
図3は、第1の実施形態に係る音声符号化装置20の構成を示す図である。音声符号化装置20の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置20は、図3に示すように、機能的には、ダウンサンプリング部20a、コア符号化部20b、分析フィルタバンク部20c及び20c1、制御パラメータ符号化部20d、包絡算出部20e、量子化/符号化部20f、時間包絡情報符号化部20g、符号化系列多重化部20h、サブバンド信号パワー算出部20j、及びコア復号信号生成部20iを備える。各部の機能・動作は、以下、説明する。
図4は、第1の実施形態に係る音声符号化装置20の動作を示すフローチャートである。
ダウンサンプリング部20aは、入力音声信号をダウンサンプルし、入力音声信号の低周波数信号に相当するダウンサンプル入力音声信号を得る(ステップS20-1)。
コア符号化部20bは、ダウンサンプリング部20aで得られたダウンサンプル信号を符号化し、低周波数信号の符号化系列を生成する(ステップS20-2)。
分析フィルタバンク部20cは、入力音声信号を複数のサブバンド信号に分割する(ステップS20-3)。
制御パラメータ符号化部20dは、音声復号装置10において高周波数信号を生成するために必要な制御パラメータを符号化する(ステップS20-4)。当該パラメータは、例えば時間/周波数分解能の情報を含む。例えば、音声復号装置10の復号/逆量子化部10hでスケールファクタバンドのデザイン、時間セグメントの長さを決定する際に用いる情報を含む。
包絡算出部20eは、分析フィルタバンク部20cで得られたサブバンド信号から、音声復号装置10の復号/逆量子化部10hで復号/逆量子化される高周波数信号に対するゲインおよびノイズ信号の大きさを算出する(ステップS20-5)。
量子化/符号化部20fは、包絡算出部20eにて算出された高周波数信号に対するゲインおよびノイズ信号の大きさを量子化および符号化する(ステップS20-6)。
コア復号信号生成部20iは、コア符号化部20bで符号化された情報を用いて、コア復号信号を生成する(ステップS20-7)。当該処理は、音声復号装置10のコア復号部10bと同様に実施されてもよい。また、コア符号化部20bにおける符号化される前の量子化された情報を用いて、コア復号信号を生成してもよい。また、一部の情報は音声復号装置10のコア復号部10bと異なってもよく、例えばCELP符号化の場合、復号装置における適応符号帳に保持される信号は、過去に復号された励振信号またはそれに所定の処理を施した信号であるが、当該コア復号信号生成部20iでは、入力音声信号を線形予測した後の残差信号であってもよい。
分析フィルタバンク部20c1は、コア復号信号生成部20iで生成されたコア復号信号を複数のサブバンド信号に分割する(ステップS20-8)。当該処理において、コア復号信号からサブバンド信号に分割する際の分解能は、分析フィルタバンク部20cと同じであってもよい。
サブバンド信号パワー算出部20jは、分析フィルタバンク部20c1で得られたコア復号信号のサブバンド信号のパワーを算出する(ステップS20-9)。当該処理は、包絡算出部20eにおける低周波数信号のサブバンド信号のパワーの算出と同様に実施される。
時間包絡情報符号化部20gは、包絡算出部20eにて算出した低周波数信号のサブバンド信号のパワーを用いて低周波数信号の時間包絡を算出し、同様にコア復号信号のサブバンド信号のパワーを用いてコア復号信号の時間包絡を算出し、当該低周波数信号及びコア復号信号の時間包絡より時間包絡情報を算出し符号化する(ステップS20-10)。当該処理において、低周波数信号のサブバンド信号のパワーが算出されていない場合は、時間包絡情報符号化部20gにて低周波数信号のサブバンド信号のパワーを算出してもよく、低周波数信号のサブバンド信号のパワーがどこで算出されるかは限定されない。
例えば、任意の時間セグメントtE(l)≦i<tE(l+1)内でBLO(m) (m=0,…,MLO, MLO≧1) (BLO(0)≧0, BLO(MLO)<kx)で境界を表されるMLO個の周波数帯域に分割し、m番目の周波数帯域に含まれる低周波数信号のサブバンド信号XLO(k,i) (BLO(m)≦k<BLO(m+1), tE(l)≦i<tE(l+1))の時間包絡ELO(k,i)は、前記時間セグメント及び周波数帯域内で正規化した当該低周波数信号のサブバンド信号XLO(k,i)のパワーとして算出できる。
Figure 2019144591

同様に、コア復号信号の時間包絡Edec,LO(k,i)を前記時間セグメント及び周波数帯域内で正規化した当該コア復号信号のサブバンド信号Xdec,LO(k,i)のパワーとして算出できる。
Figure 2019144591

低周波数信号及びコア復号信号のサブバンド信号の時間包絡は、低周波数信号及びコア復号信号のサブバンド信号の大きさの時間方向の変動がわかるパラメータであれば良く、前記の例に限定されない。
例えば、時間包絡情報符号化部20gは時間包絡情報として平坦の程度を表す情報を算出する。例えば、低周波数信号及びコア復号信号のサブバンド信号の時間包絡の分散またはそれに準ずるパラメータを算出する。さらに別の例では、低周波数信号及びコア復号信号のサブバンド信号の時間包絡の相加平均と相乗平均の比またはそれに準ずるパラメータを算出する。この場合、時間包絡情報符号化部20gは、時間包絡情報として当該低周波数信号のサブバンド信号の時間包絡の平坦さを表す情報を算出すればよく、前記の例に限定されない。そして、前記パラメータを符号化する。例えば、低周波数信号とコア復号信号の当該パラメータの差分値またはその絶対値を符号化する。さらに、例えば、低周波数信号の当該パラメータの値または絶対値を符号化する。例えば、時間包絡の平坦さを平坦か否かで表現すれば1ビットで符号化でき、例えば、前記任意の時間セグメント内において前記MLO個の周波数帯域毎に当該情報をMLOビットで符号化できる。時間包絡情報の符号化方法は前記の例に限定されない。
さらに例えば、時間包絡情報符号化部20gは時間包絡情報として立ち上がりの程度を表す情報を算出する。例えば、任意の時間セグメントtE(l)≦i<tE(l+1)内において、低周波数信号のサブバンド信号の時間包絡の時間方向の差分値の最大値を算出する。
Figure 2019144591

さらには、式(9)において、時間包絡に代えて当該時間包絡を時間方向に平滑化したパラメータの時間方向の差分値の最大値を算出できる。
この場合、時間包絡情報符号化部20gは、時間包絡情報として当該低周波数信号のサブバンド信号の時間包絡の立ち上がりの程度を表す情報を算出すればよく、前記の例に限定されない。そして、前記パラメータを符号化する。例えば、低周波数信号とコア復号信号の当該パラメータの差分値またはその絶対値を符号化する。例えば、時間包絡の立ち上がりの程度を立ち上がりか否かで表現すれば1ビットで符号化でき、例えば、前記任意の時間セグメント内において前記MLO個の周波数帯域毎に当該情報をMLOビットで符号化できる。時間包絡情報の符号化方法は前記の例に限定されない。
さらに例えば、時間包絡情報符号化部20gは時間包絡情報として立ち下がりの程度を表す情報を算出する。例えば、任意の時間セグメントtE(l)≦i<tE(l+1)内において、低周波数信号のサブバンド信号の時間包絡の時間方向の差分値の最小値を算出する。
Figure 2019144591

さらには、式(10)において、時間包絡に代えて当該時間包絡を時間方向に平滑化したパラメータの時間方向の差分値の最小値を算出できる。
この場合、時間包絡情報符号化部20gは、時間包絡情報として当該低周波数信号のサブバンド信号の時間包絡の立ち下がりの程度を表す情報を算出すればよく、前記の例に限定されない。そして、前記パラメータを符号化する。例えば、低周波数信号とコア復号信号の当該パラメータの差分値またはその絶対値を符号化する。例えば、時間包絡の立ち下がりの程度を立ち下がりか否かで表現すれば1ビットで符号化でき、例えば、前記任意の時間セグメント内において前記MLO個の周波数帯域毎に当該情報をMLOビットで符号化できる。時間包絡情報の符号化方法は前記の例に限定されない。
前記時間包絡情報として平坦の程度、立ち上がりの程度、及び立下りの程度を表す情報を算出する例において、低周波数信号及びコア復号信号の時間包絡のうち一方のみを用いる場合においては、他方の時間包絡の算出のみに係る各部及び各処理を省略することができる。
符号化系列多重化部20hは、入力される一つ以上の符号化系列または符号化された情報または符号化されたパラメータを多重化して、符号化系列として出力する(ステップS20-11)。ここでは、コア符号化部20bより低周波数信号の符号化系列を受け取り、制御パラメータ符号化部20dより符号化された制御パラメータを受け取り、量子化/符号化部20fより符号化された高周波数信号に対するゲインおよびノイズ信号の大きさを受け取り、時間包絡情報符号化部20gより符号化された時間包絡情報を受け取り、これらを多重化して符号化系列として出力する。
ステップS20-1〜S20-6およびS20-80の処理は、“ISO/IEC 14496-3”に規定される“SBR”および“Low Delay SBR”の符号化器の各処理にて対応できる。
[第1の実施形態の音声復号装置の第1の変形例]
図5は、第1の実施形態に係る音声復号装置の第1の変形例10Aの構成を示す図である。なお、これ以降は、該当の変形例及び実施形態における特徴的な機能・動作について説明し、重複した説明は可能な範囲で省略する。
符号化系列逆多重化部10aAは、符号化系列を、低周波数信号を符号化したコア符号化部分、低周波数信号から高周波数信号を生成するための帯域拡張部分に分割する(ステップS10-1a)。
図6は、第1の実施形態に係る音声復号装置の第1の変形例10Aの動作を示すフローチャートである。
低周波数時間包絡形状決定部10eAは、コア復号部10bから低周波数信号を受け取り、低周波数信号の時間包絡形状を決定する(ステップS10-5a)。
例えば、低周波数信号の時間包絡形状を平坦と決定する。例えば、低周波数信号xdec(t)のパワーまたはそれに準ずるパラメータを算出し、当該パラメータの分散またはそれに準ずるパラメータを算出する。算出したパラメータと所定の閾値とを比較して時間包絡形状が平坦か否かまたは平坦さの程度を決定する。さらに別の例では、低周波数信号xdec(t)のパワーまたはそれに準ずるパラメータの相加平均と相乗平均の比またはそれに準ずるパラメータを算出し、所定の閾値とを比較して時間包絡形状が平坦か否かまたは平坦さの程度を決定する。低周波数信号の時間包絡形状を平坦と決定する方法は上記の例に限定されない。
さらに例えば、低周波数信号の時間包絡形状を立ち上がりと決定する。例えば、低周波数信号xdec(t)のパワーまたはそれに準ずるパラメータを算出し、当該パラメータの時間方向の差分値を算出し、当該差分値の任意の時間セグメント内の最大値を算出する。当該最大値と所定の閾値とを比較して、時間包絡形状が立ち上がりか否かまたは立ち上がりの程度を決定する。低周波数信号の時間包絡形状を立ち上がりと決定する方法は上記の例に限定されない。
さらに例えば、低周波数信号の時間包絡形状を立ち下がりと決定する。例えば、低周波数信号xdec(t)のパワーまたはそれに準ずるパラメータを算出し、当該パラメータの時間方向の差分値を算出し、当該差分値の任意の時間セグメント内の最小値を算出する。当該最小値と所定の閾値とを比較して、時間包絡形状が立ち下がりか否かまたは立ち下がりの程度を決定する。低周波数信号の時間包絡形状を立ち下がりと決定する方法は上記の例に限定されない。
[第1の実施形態の音声復号装置の第2の変形例]
図7は、第1の実施形態に係る音声復号装置の第2の変形例10Bの構成を示す図である。
第1の実施形態に係る音声復号装置の第1の変形例との相違点は、低周波数時間包絡形状決定部10eBが、分析フィルタバンク部10cから低周波数信号の複数のサブバンド信号を受け取り、低周波数信号の時間包絡形状を決定する点である(ステップS10-5a相当処理)。
例えば、低周波数信号の時間包絡形状を平坦と決定する。例えば、任意の時間セグメントtE(l)≦i<tE(l+1)内でBLO(m) (m=0,…,MLO, MLO≧1) (BLO(0)≧0, BLO(MLO)<kx)で境界を表されるMLO個の周波数帯域に分割し、m番目の周波数帯域に含まれる低周波数信号のサブバンド信号Xdec,LO(k,i) (BLO(m)≦k<BLO(m+1), tE(l)≦i<tE(l+1))の時間包絡Edec,LO(k,i)またはそれに準ずるパラメータを求め、所定の閾値と比較して時間包絡形状が平坦か否かまたは平坦さの程度を決定する。時間包絡Edec,LO(k,i)は、例えば式(8)により算出できるが、これに限定されない。さらに別の例では、低周波数信号のサブバンド信号Xdec,LO(k,i) (BLO(m)≦k<BLO(m+1), tE(l)≦i<tE(l+1))の時間包絡Edec,LO(k,i)またはそれに準ずるパラメータの相加平均と相乗平均の比またはそれに準ずるパラメータを算出し、所定の閾値とを比較して時間包絡形状が平坦か否かまたは平坦さの程度を決定する。時間包絡Edec,LO(k,i)は、例えば式(8)により算出できるが、これに限定されない。低周波数信号の時間包絡形状を平坦と決定する方法は上記の例に限定されない。
さらに例えば、低周波数信号の時間包絡形状を立ち上がりと決定する。例えば、任意の時間セグメントtE(l)≦i<tE(l+1)内において、低周波数信号のサブバンド信号Xdec,LO(k,i) (BLO(m)≦k<BLO(m+1), tE(l)≦i<tE(l+1))の時間包絡Edec,LO(k,i)の差分値の最大値を算出する。例えば式(9)により算出できる。当該差分値の最大値を所定の閾値と比較して時間包絡形状が立ち上がりか否かまたは立ち上がりの程度を決定する。さらには、時間包絡に代えて当該時間包絡を時間方向に平滑化したパラメータを用いることができる。低周波数信号の時間包絡形状を立ち上がりと決定する方法は上記の例に限定されない。
さらに例えば、低周波数信号の時間包絡形状を立ち下がりと決定する。低周波数信号のサブバンド信号Xdec,LO(k,i) (BLO(m)≦k<BLO(m+1), tE(l)≦i<tE(l+1))の時間包絡Edec,LO(k,i)の差分値の最小値を算出する。例えば式(10)により算出できる。当該差分値の最小値を所定の閾値と比較して時間包絡形状が立ち下がりか否かまたは立ち下がりの程度を決定する。さらには、時間包絡に代えて当該時間包絡を時間方向に平滑化したパラメータを用いることができる。低周波数信号の時間包絡形状を立ち下がりと決定する方法は上記の例に限定されない。
[第1の実施形態の音声復号装置の第3の変形例]
図8は、第1の実施形態に係る音声復号装置の第3の変形例10Cの構成を示す図である。
低周波数時間包絡形状決定部10eCは、符号化系列解析部10dからの低周波時間包絡形状に関する情報、コア復号部10bからの低周波数信号、分析フィルタバンク部10cからの低周波数信号の複数のサブバンド信号のうち少なくとも一つを受け取り、低周波数信号の時間包絡形状を決定する(図2のステップS10-5に相当)。
例えば、低周波数信号の時間包絡形状を平坦と決定する。この場合、上記第1の実施形態の音声復号装置、当該復号装置の第1及び第2の変形例にて記載の低周波数信号の時間包絡形状を平坦と決定する方法を少なくとも一つ以上組み合わせて時間包絡形状を平坦と決定する。低周波数信号の時間包絡形状を平坦と決定する方法は上記に限定されない。
例えば、低周波数信号の時間包絡形状を立ち上がりと決定する。この場合、上記第1の実施形態の音声復号装置、当該復号装置の第1及び第2の変形例にて記載の低周波数信号の時間包絡形状を立ち上がりと決定する方法を少なくとも一つ以上組み合わせて時間包絡形状を立ち上がりと決定する。低周波数信号の時間包絡形状を立ち上がりと決定する方法は上記に限定されない。
例えば、低周波数信号の時間包絡形状を立ち下がりと決定する。この場合、上記第1の実施形態の音声復号装置、当該復号装置の第1及び第2の変形例にて記載の低周波数信号の時間包絡形状を立ち下がりと決定する方法を少なくとも一つ以上組み合わせて時間包絡形状を立ち下がりと決定する。低周波数信号の時間包絡形状を立ち下がりと決定する方法は上記に限定されない。
[第1の実施形態の音声符号化装置の第1の変形例]
図9は、第1の実施形態に係る音声符号化装置の第1の変形例20Aの構成を示す図である。
図10は、第1の実施形態に係る音声符号化装置の第1の変形例20Aの動作を示すフローチャートである。
時間包絡情報符号化部20gAは、包絡算出部20eにて算出した低周波数信号のサブバンド信号のパワーを用いて低周波数信号の時間包絡を算出し、当該時間包絡より時間包絡情報を符号化する(ステップS20-10a)。当該処理において、低周波数信号のサブバンド信号のパワーが算出されていない場合は、時間包絡情報符号化部20gAにて低周波数信号のサブバンド信号のパワーを算出してもよく、低周波数信号のサブバンド信号のパワーがどこで算出されるかは限定されない。
例えば、時間包絡情報として、時間包絡形状の平坦さの程度を表す情報を算出する。例えば、任意の時間セグメントtE(l)≦i<tE(l+1)内でBLO(m) (m=0,…,MLO, MLO≧1) (BLO(0)≧0, BLO(MLO)<kx)で境界を表されるMLO個の周波数帯域に分割し、m番目の周波数帯域に含まれる低周波数信号のサブバンド信号XLO(k,i) (BLO(m)≦k<BLO(m+1), tE(l)≦i<tE(l+1))の時間包絡ELO(k,i)を式(7)により算出する。また時間包絡ELO(k,i)の算出方法は式(7)に限定されない。時間包絡ELO(k,i)の分散またはそれに準ずるパラメータを算出し、当該パラメータを符号化する。さらに別の例では、時間包絡ELO(k,i)の相加平均と相乗平均の比またはそれに準ずるパラメータを算出し、当該パラメータを符号化する。低周波数信号の時間包絡形状の平坦さの程度を表す情報の算出方法は上記の例に限定されない。
さらに、例えば、時間包絡情報として、時間包絡形状の立ち上がりの程度を表す情報を算出する。例えば、時間包絡ELO(k,i)のの時間方向の差分値を算出し、当該差分値の任意の時間セグメント内の最大値を算出し符号化する。低周波数信号の時間包絡形状を立ち上がりの程度を表す情報の算出方法は上記の例に限定されない。
さらに、例えば、時間包絡情報として、時間包絡形状の立ち下がりの程度を表す情報を算出する。例えば、時間包絡ELO(k,i)のの時間方向の差分値を算出し、当該差分値の任意の時間セグメント内の最小値を算出し符号化する。低周波数信号の時間包絡形状を立ち下がりの程度を表す情報の算出方法は上記の例に限定されない。
[第2の実施形態]
図11は、第2の実施形態に係る音声復号装置11の構成を示す図である。音声復号装置11の通信装置は、下記音声符号化装置21から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置11は、図11に示すように、機能的には、符号化系列逆多重化部10a、コア復号部10b、分析フィルタバンク部10c、符号化系列解析部10d、低周波数時間包絡形状決定部10e、低周波数時間包絡修正部10f、高周波数信号生成部10g、復号/逆量子化部10h、周波数包絡調整部10i、及び合成フィルタバンク部10jを備える。
図12は、第2の実施形態に係る音声復号装置11の動作を示すフローチャートである。
高周波数信号生成部10gの動作における第1の実施形態に係る音声復号装置11の高周波数信号生成部10gとの相違点は、低周波数時間包絡修正部10fで時間包絡形状を修正された低周波数信号のサブバンド信号から高周波数信号を生成する点である。
図13は、第2の実施形態に係る音声符号化装置21の構成を示す図である。音声符号化装置21の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置21は、図13に示すように、機能的には、ダウンサンプリング部20a、コア符号化部20b、分析フィルタバンク部20c及び20c1、制御パラメータ符号化部20d、包絡算出部20e、量子化/符号化部20f、時間包絡情報符号化部21a、符号化系列多重化部20h、サブバンド信号パワー算出部20j、及びコア復号信号生成部20iを備える。
図14は、第2の実施形態に係る音声符号化装置21の動作を示すフローチャートである。
時間包絡情報符号化部21aは、包絡算出部20eにて算出した低周波数信号のサブバンド信号のパワー、高周波数信号のサブバンド信号のパワーを用いて低周波数信号の時間包絡及び高周波数信号の時間包絡を算出し、同様にサブバンド信号パワー算出部20jにて算出されたコア復号信号のサブバンド信号のパワーを用いてコア復号信号の時間包絡を算出し、当該低周波数信号の時間包絡、高周波数信号の時間包絡、及びコア復号信号の時間包絡より時間包絡情報を符号化する(ステップS21-1)。当該処理において、低周波数信号のサブバンド信号のパワーが算出されていない場合は、時間包絡情報符号化部21aにて低周波数信号のサブバンド信号のパワーを算出してもよく、低周波数信号のサブバンド信号のパワーがどこで算出されるかは限定されない。当該処理において、高周波数信号のサブバンド信号のパワーが算出されていない場合は、時間包絡情報符号化部21aにて高周波数信号のサブバンド信号のパワーを算出してもよく、高周波数信号のサブバンド信号のパワーがどこで算出されるかは限定されない。
具体的には、例えば、任意の時間セグメントtE(l)≦i<tE(l+1)内でBLO(m) (m=0,…,MLO, MLO≧1) (BLO(0)≧0, BLO(MLO)<kx)で境界を表されるMLO個の周波数帯域に分割し、m番目の周波数帯域に含まれる低周波数信号のサブバンド信号XLO(k,i) (BLO(m)≦k<BLO(m+1), tE(l)≦i<tE(l+1))の時間包絡ELO(k,i)、及びコア復号信号のサブバンド信号Xdec,LO(k,i) (BLO(m)≦k<BLO(m+1), tE(l)≦i<tE(l+1))の時間包絡Edec,LO(k,i)を、それぞれ式(7)及び式(8)を用いて算出する。同様に、任意の時間セグメントtE(l)≦i<tE(l+1)内でBHI(m) (m=0,…,MHI, MHI≧1) (BHI(0)≧kx, BHI(MHI)<kh)で境界を表されるMHI個の周波数帯域に分割し、m番目の周波数帯域に含まれる高周波数信号のサブバンド信号XHI(k,i) (BHI(m)≦k<BHI(m+1), tE(l)≦i<tE(l+1))の時間包絡EHI(k,i)を算出する。
Figure 2019144591

高周波数信号のサブバンド信号の時間包絡は、高周波数信号のサブバンド信号の大きさの時間方向の変動がわかるパラメータであれば良く、前記の例に限定されない。
例えば、時間包絡情報符号化部21aは時間包絡情報として平坦の程度を表す情報を算出する。例えば、低周波数信号、コア復号信号及び高周波数信号のサブバンド信号の時間包絡の分散またはそれに準ずるパラメータを算出する。さらに別の例では、低周波数信号、コア復号信号及び高周波数信号のサブバンド信号の時間包絡の相加平均と相乗平均の比またはそれに準ずるパラメータを算出する。この場合、時間包絡情報符号化部21aは、時間包絡情報として当該低周波数信号及び高周波数信号のうち少なくとも1つ以上のサブバンド信号の時間包絡の平坦さを表す情報を算出すればよく、前記の例に限定されない。そして、前記パラメータを符号化する。例えば、低周波数信号とコア復号信号の当該パラメータの差分値またはその絶対値を符号化する。さらに、例えば、低周波数信号と高周波数信号の当該パラメータの値または絶対値を符号化する。例えば、時間包絡の平坦さを平坦か否かで表現すれば1ビットで符号化でき、例えば、前記任意の時間セグメント内において前記MLO個の周波数帯域毎に当該情報をMLOビットで符号化できる。時間包絡情報の符号化方法は前記の例に限定されない。
さらに、例えば、時間包絡情報符号化部21aは時間包絡情報として立ち上がりの程度を表す情報を算出する。例えば、任意の時間セグメントtE(l)≦i<tE(l+1)内において、低周波数信号のサブバンド信号の時間包絡の時間方向の差分値の最大値を、式(9)を用いて算出する。同様に、例えば、任意の時間セグメントtE(l)≦i<tE(l+1)内において、高周波数信号のサブバンド信号の時間包絡の時間方向の差分値の最大値を算出する。
Figure 2019144591

さらには、式(12)において、時間包絡に代えて当該時間包絡を時間方向に平滑化したパラメータの時間方向の差分値の最大値を算出できる。この場合、時間包絡情報符号化部21aは、時間包絡情報として当該低周波数信号及び高周波数信号のうち少なくとも1つ以上のサブバンド信号の時間包絡の立ち上がりの程度を表す情報を算出すればよく、前記の例に限定されない。そして、前記パラメータを符号化する。例えば、低周波数信号とコア復号信号の当該パラメータの差分値またはその絶対値を符号化する。さらに、例えば、低周波数信号と高周波数信号の当該パラメータの値を符号化する。例えば、時間包絡の立ち上がりの程度を立ち上がりか否かで表現すれば1ビットで符号化でき、例えば、前記任意の時間セグメント内において前記MLO個の周波数帯域毎に当該情報をMLOビットで符号化できる。時間包絡情報の符号化方法は前記の例に限定されない。
さらに例えば、時間包絡情報符号化部21aは時間包絡情報として立ち下がりの程度を表す情報を算出する。例えば、任意の時間セグメントtE(l)≦i<tE(l+1)内において、低周波数信号のサブバンド信号の時間包絡の時間方向の差分値の最小値を、式(10)を用いて算出する。同様に、例えば、任意の時間セグメントtE(l)≦i<tE(l+1)内において、高周波数信号のサブバンド信号の時間包絡の時間方向の差分値の最小値を算出する。
Figure 2019144591

さらには、式(13)において、時間包絡に代えて当該時間包絡を時間方向に平滑化したパラメータの時間方向の差分値の最小値を算出できる。この場合、時間包絡情報符号化部21aは、時間包絡情報として当該低周波数信号及び高周波数信号のうち少なくとも1つ以上のサブバンド信号の時間包絡の立ち下がりの程度を表す情報を算出すればよく、前記の例に限定されない。そして、前記パラメータを符号化する。例えば、低周波数信号とコア復号信号の当該パラメータの差分値またはその絶対値を符号化する。さらに、例えば、低周波数信号と高周波数信号の当該パラメータの値を符号化する。。例えば、時間包絡の立ち下がりの程度を立ち下がりか否かで表現すれば1ビットで符号化でき、例えば、前記任意の時間セグメント内において前記MLO個の周波数帯域毎に当該情報をMLOビットで符号化できる。時間包絡情報の符号化方法は前記の例に限定されない。
[第2の実施形態の音声符号化装置の第1の変形例]
図15は、第2の実施形態に係る音声符号化装置の第1の変形例21Aの構成を示す図である。
図16は、第2の実施形態に係る音声符号化装置の第1の変形例21Aの動作を示すフローチャートである。
時間包絡情報符号化部21aAは、包絡算出部20eにて算出した入力音声信号のサブバンド信号のパワーを用いて入力音声信号の時間包絡を算出し、当該時間包絡より時間包絡情報を符号化する(ステップS21-1a)。当該処理において、入力音声信号のサブバンド信号のパワーが算出されていない場合は、時間包絡情報符号化部21aAにて入力音声信号のサブバンド信号のパワーを算出してもよく、入力音声信号のサブバンド信号のパワーがどこで算出されるかは限定されない。
例えば、時間包絡情報として、時間包絡形状の平坦さの程度を表す情報を算出する。例えば、任意の時間セグメントtE(l)≦i<tE(l+1)内でBLO(m) (m=0,…,MLO, MLO≧1) (BLO(0)≧0, BLO(MLO)<kx)で境界を表されるMLO個の周波数帯域に分割し、m番目の周波数帯域に含まれる低周波数信号のサブバンド信号XLO(k,i) (BLO(m)≦k<BLO(m+1), tE(l)≦i<tE(l+1))の時間包絡ELO(k,i)を式(7)により算出する。また時間包絡ELO(k,i)の算出方法は式(7)に限定されない。同様に、任意の時間セグメントtE(l)≦i<tE(l+1)内でBHI(m) (m=0,…,MHI, MHI≧1) (BHI(0)≧kx, BHI(MHI)<kh)で境界を表されるMHI個の周波数帯域に分割し、m番目の周波数帯域に含まれる低周波数信号のサブバンド信号XHI(k,i) (BHI(m)≦k<BHI(m+1), tE(l)≦i<tE(l+1))の時間包絡EHI(k,i)を式(11)により算出する。また時間包絡EHI(k,i)の算出方法は式(11)に限定されない。時間包絡ELO(k,i)の分散またはそれに準ずるパラメータ、及び時間包絡EHI(k,i)の分散またはそれに準ずるパラメータのうち少なくとも1つ以上を算出し、当該パラメータをそれぞれ別々にまたは組み合わせて符号化する。さらに別の例では、時間包絡ELO(k,i)の相加平均と相乗平均の比またはそれに準ずるパラメータ、及び時間包絡EHI(k,i)の相加平均と相乗平均の比またはそれに準ずるパラメータを少なくとも1つ以上算出し、当該パラメータをそれぞれ別々にまたは組み合わせて符号化する。時間包絡形状の平坦さの程度を表す情報の算出方法は上記の例に限定されない。
さらに、例えば、時間包絡情報として、時間包絡形状の立ち上がりの程度を表す情報を算出する。例えば、時間包絡ELO(k,i)の時間方向の差分値を算出し、当該差分値の任意の時間セグメント内の最大値を算出する。同様に、時間包絡EHI(k,i)の時間方向の差分値を算出し、当該差分値の任意の時間セグメント内の最大値を算出する。当該パラメータをそれぞれ別々にまたは組み合わせて符号化する。低周波数信号の時間包絡形状を立ち上がりの程度を表す情報の算出方法は上記の例に限定されない。
さらに、例えば、時間包絡情報として、時間包絡形状の立ち下がりの程度を表す情報を算出する。例えば、時間包絡ELO(k,i)の時間方向の差分値を算出し、当該差分値の任意の時間セグメント内の最小値を算出する。同様に、時間包絡EHI(k,i)の時間方向の差分値を算出し、当該差分値の任意の時間セグメント内の最小値を算出する。当該パラメータをそれぞれ別々にまたは組み合わせて符号化する。低周波数信号の時間包絡形状を立ち下がりの程度を表す情報の算出方法は上記の例に限定されない。
当該第2の実施形態の低周波数時間包絡形状決定部10eに対して、本発明の第1の実施形態の第1、第2および第3の変形例が適用できることは明白である。
当該第2の実施形態の音声復号装置11は、本発明の第1の実施形態の音声符号化装置20及びその第1の変形例の音声符号化装置20Aにより符号化された符号化系列を復号できる。
[第3の実施形態]
図17は、第3の実施形態に係る音声復号装置12の構成を示す図である。音声復号装置12の通信装置は、下記音声符号化装置22から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置12は、図17に示すように、機能的には、符号化系列逆多重化部10a、コア復号部10b、分析フィルタバンク部10c、符号化系列解析部10d、低周波数時間包絡形状決定部10e、低周波数時間包絡修正部12a、高周波数信号生成部10g、復号/逆量子化部10h、周波数包絡調整部10i、及び合成フィルタバンク部10jを備える。
図18は、第3の実施形態に係る音声復号装置12の動作を示すフローチャートである。
低周波数時間包絡修正部12aは、低周波数時間包絡形状決定部10eで決定した時間包絡形状に基づいて、コア復号部10bから出力される低周波数信号の時間包絡の形状を修正する(ステップS12-1)。
例えば、低周波数時間包絡修正部12aは、任意の時間セグメントtt,E(l)≦i<tt,E(l+1))内の前記低周波数信号xdec,LO(i)に対して、所定の関数Ft(xdec,LO(i))を用いて以下の式(14)
Figure 2019144591

により得られるx’dec,LO(i)を時間包絡形状が修正された低周波数信号として出力する。
例えば、前記低周波数信号の時間包絡形状が平坦と決定された場合、以下の処理により、低周波数信号の時間包絡形状を修正できる。例えば、当該低周波数信号xdec,LO(i)に対して、所定の関数Ft(xdec,LO(i))を、
Figure 2019144591

として、x’dec,LO(i)を時間包絡形状が修正された低周波数信号として出力する。
また別の例によれば、所定の関数Ft(xdec,LO(i))を、低周波数信号xdec,LO(i)に対して平滑化フィルタ処理を施す
Figure 2019144591

(Nfilt≧1)で定義して、x’dec,LO(i)を時間包絡形状が修正された低周波数信号として出力する。上記の時間包絡形状を平坦に修正する処理の例は、それぞれを組み合わせて実施できる。低周波数時間包絡修正部10fは、低周波数信号の複数のサブバンド信号の時間包絡の形状を平坦に修正する処理を実施し、上記の例に限定されない。
さらには、例えば、前記低周波数信号の時間包絡形状が立ち上がりと決定された場合、以下の処理により、低周波数信号の時間包絡形状を修正できる。例えば、所定の関数Ft(xdec,LO(i))を、iに対して単調増加する関数incr(i)を用いて
Figure 2019144591

で定義して、x’dec,LO(i)を時間包絡形状が修正された低周波数信号として出力する。低周波数時間包絡修正部10fは、低周波数信号の複数のサブバンド信号の時間包絡の形状を立ち上がりに修正する処理を実施し、上記の例に限定されない。
さらには、例えば、前記低周波数信号の時間包絡形状が立ち下がりと決定された場合、以下の処理により、低周波数信号の時間包絡形状を修正できる。例えば、所定の関数Ft(xdec,LO(i))を、iに対して単調減少する関数decr(i)を用いて
Figure 2019144591

で定義して、x’dec,LO(i)を時間包絡形状が修正された低周波数信号として出力する。低周波数時間包絡修正部10fは、低周波数信号の複数のサブバンド信号の時間包絡の形状を立ち下がりに修正する処理を実施し、上記の例に限定されない。
また別の例によれば、低周波数信号が離散フーリエ変換,離散コサイン変換,修正離散コサイン変換に代表される時間周波数変換により周波数領域の変換係数Xdec,LO(k) (0≦k<kx)で表されたときは、所定の関数Ff(Xdec,LO(k))を用いて
Figure 2019144591

により得られるX’dec,LO(k)を時間包絡形状が修正された低周波数信号の周波数領域の変換係数として出力する。
例えば、前記低周波数信号の時間包絡形状が平坦と決定された場合、以下の処理により、低周波数信号の時間包絡形状を修正できる。
BLO(m) (m=0,…,MLO, MLO≧1) (BLO(0)≧0, BLO(MLO)<kx)で境界を表されるMLO個の任意の周波数帯域Bdec,LO(m)をにおいて、周波数方向に線形予測して線形予測係数αp(m) (m=0,…,MLO-1)を得て、所定の関数Ft(Xdec,LO(k))を、変換係数Xdec,LO(k)に対して線形予測逆フィルタ処理を施す
Figure 2019144591

(Npred≧1)で定義して、X’dec,LO(k,i)を時間包絡形状が修正された低周波数信号の変換係数として出力する。
図19は、第3の実施形態に係る音声符号化装置22の構成を示す図である。音声符号化装置22の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置22は、図19に示すように、機能的には、ダウンサンプリング部20a、コア符号化部20b、分析フィルタバンク部20c、制御パラメータ符号化部20d、包絡算出部20e、量子化/符号化部20f、時間包絡算出部22a及び22a1、時間包絡情報符号化部22b、符号化系列多重化部20h、及びコア復号信号生成部20iを備える。
図20は、第3の実施形態に係る音声符号化装置22の動作を示すフローチャートである。
時間包絡算出部22aは、ダウンサンプリング部20aから得られるダウンサンプル信号の時間包絡を算出する(ステップ22-1)。
例えば、任意の時間セグメントtt,E(l)≦i<tt,E(l+1))内のダウンサンプル信号xLO(i)の時間包絡ELO(i)を、当該時間セグメント内で正規化したダウンサンプル信号のパワーとして算出できる。
Figure 2019144591

ダウンサンプル信号の時間包絡は、ダウンサンプル信号の大きさの時間方向の変動がわかるパラメータであれば良く、前記の例に限定されない。
時間包絡算出部22a1は、コア復号信号生成部20iにて生成されたコア復号信号の時間包絡を算出する(ステップ22-2)。コア復号信号の時間包絡は、前記ダウンサンプル信号の時間包絡と同様に算出できる。
例えば、任意の時間セグメントtt,E(l)≦i<tt,E(l+1))内の前記コア復号信号xdec,LO(i)の時間包絡Edec,LO(i)を、当該時間セグメント内で正規化したコア復号信号のパワーとして算出できる。
Figure 2019144591

コア復号信号の時間包絡は、コア復号信号の大きさの時間方向の変動がわかるパラメータであれば良く、前記の例に限定されない。
時間包絡情報符号化部22bは、時間包絡算出部22aで算出されたダウンサンプル信号の時間包絡と、時間包絡算出部22a1で算出されたコア復号信号の時間包絡とを用いて、時間包絡情報を算出し、当該時間包絡より時間包絡情報を符号化する(ステップS22-3)。
例えば、時間包絡情報符号化部22bは時間包絡情報として平坦の程度を表す情報を算出する。例えば、ダウンサンプル信号及びコア復号信号の時間包絡の分散またはそれに準ずるパラメータを算出する。さらに別の例では、ダウンサンプル信号及びコア復号信号のサブバンド信号の時間包絡の相加平均と相乗平均の比またはそれに準ずるパラメータを算出する。この場合、時間包絡情報符号化部22bは、時間包絡情報として当該ダウンサンプル信号の時間包絡の平坦さを表す情報を算出すればよく、前記の例に限定されない。そして、前記パラメータを符号化する。例えば、ダウンサンプル信号とコア復号信号の当該パラメータの差分値またはその絶対値を符号化する。さらに、例えば、ダウンサンプル信号の当該パラメータの値または絶対値を符号化する。例えば、時間包絡の平坦さを平坦か否かで表現すれば1ビットで符号化でき、例えば、前記任意の時間セグメントについては1ビットで符号化できる。時間包絡情報の符号化方法は前記の例に限定されない。
さらに例えば、時間包絡情報符号化部22bは時間包絡情報として立ち上がりの程度を表す情報を算出する。例えば、任意の時間セグメントtt,E(l)≦i<tt,E(l+1)内において、ダウンサンプル信号の時間包絡の時間方向の差分値の最大値を算出する。
Figure 2019144591

さらには、式(23)において、時間包絡に代えて当該時間包絡を時間方向に平滑化したパラメータの時間方向の差分値の最大値を算出できる。この場合、時間包絡情報符号化部22bは、時間包絡情報として当該ダウンサンプル信号の時間包絡の立ち上がりの程度を表す情報を算出すればよく、前記の例に限定されない。そして、前記パラメータを符号化する。例えば、ダウンサンプル信号とコア復号信号の当該パラメータの差分値またはその絶対値を符号化する。例えば、時間包絡の立ち上がりの程度を立ち上がりか否かで表現すれば1ビットで符号化でき、例えば、前記任意の時間セグメントについては1ビットで符号化できる。時間包絡情報の符号化方法は前記の例に限定されない。
さらに例えば、時間包絡情報符号化部20gは時間包絡情報として立ち下がりの程度を表す情報を算出する。例えば、任意の時間セグメントtt,E(l)≦i<tt,E(l+1)内において、低周波数信号のサブバンド信号の時間包絡の時間方向の差分値の最小値を算出する。
Figure 2019144591

さらには、式(24)において、時間包絡に代えて当該時間包絡を時間方向に平滑化したパラメータの時間方向の差分値の最小値を算出できる。この場合、時間包絡情報符号化部22bは、時間包絡情報として当該ダウンサンプル信号の時間包絡の立ち下がりの程度を表す情報を算出すればよく、前記の例に限定されない。そして、前記パラメータを符号化する。例えば、ダウンサンプル信号とコア復号信号の当該パラメータの差分値またはその絶対値を符号化する。例えば、時間包絡の立ち下がりの程度を立ち下がりか否かで表現すれば1ビットで符号化でき、例えば、前記任意の時間セグメントについては1ビットで符号化できる。時間包絡情報の符号化方法は前記の例に限定されない。
前記時間包絡情報として平坦の程度、立ち上がりの程度、及び立下りの程度を表す情報を算出する例において、ダウンサンプル信号及びコア復号信号の時間包絡のうち一方のみを用いる場合においては、他方の時間包絡の算出のみに係る各部及び各処理を省略することができる。
[第3の実施形態の音声符号化装置の第1の変形例]
図21は、第3の実施形態に係る音声符号化装置の第1の変形例22Aの構成を示す図である。
図22は、第3の実施形態に係る音声符号化装置の第1の変形例22Aの動作を示すフローチャートである。
時間包絡情報符号化部22bAは、時間包絡算出部22aにて算出されたダウンサンプル信号の時間包絡より時間包絡情報を算出し、当該時間包絡情報を符号化する(ステップS22-3a)。
例えば、時間包絡情報として、時間包絡形状の平坦さの程度を表す情報を算出する。例えば、任意の時間セグメントtt,E(l)≦i<tt,E(l+1)内のダウンサンプル信号xLO(i) (tt,E(l)≦i<tt,E(l+1))の時間包絡ELO(i)を式(21)により算出する。また時間包絡ELO(i)の算出方法は式(21)に限定されない。時間包絡ELO(i)の分散またはそれに準ずるパラメータを算出し、当該パラメータを符号化する。さらに別の例では、時間包絡ELO(i)の相加平均と相乗平均の比またはそれに準ずるパラメータを算出し、当該パラメータを符号化する。ダウンサンプル信号の時間包絡形状の平坦さの程度を表す情報の算出方法は上記の例に限定されない。
さらに、例えば、時間包絡情報として、時間包絡形状の立ち上がりの程度を表す情報を算出する。例えば、時間包絡ELO(i)のの時間方向の差分値を算出し、当該差分値の任意の時間セグメント内の最大値を算出し符号化する。ダウンサンプル信号の時間包絡形状を立ち上がりの程度を表す情報の算出方法は上記の例に限定されない。
さらに、例えば、時間包絡情報として、時間包絡形状の立ち下がりの程度を表す情報を算出する。例えば、時間包絡ELO(i)のの時間方向の差分値を算出し、当該差分値の任意の時間セグメント内の最小値を算出し符号化する。ダウンサンプル信号の時間包絡形状を立ち下がりの程度を表す情報の算出方法は上記の例に限定されない。
[第3の実施形態の音声符号化装置の第2の変形例]
図23は、第3の実施形態に係る音声符号化装置の第2の変形例22Bの構成を示す図である。
図24は、第3の実施形態に係る音声符号化装置の第2の変形例22Bの動作を示すフローチャートである。
時間包絡算出部22aBは、入力音声信号の時間包絡を算出する(ステップ22-1b)。
例えば、任意の時間セグメントtt,E(l)≦i<tt,E(l+1))内の前記入力信号x(i)の時間包絡E(i)を、当該時間セグメント内で正規化した入力信号のパワーとして算出できる。
Figure 2019144591

入力信号の時間包絡は、入力信号の大きさの時間方向の変動がわかるパラメータであれば良く、前記の例に限定されない。
時間包絡情報符号化部22bBは、時間包絡算出部22aBにて算出された入力音声信号の時間包絡より時間包絡情報を算出し、当該時間包絡情報を符号化する(ステップS22-3b)。
例えば、時間包絡情報として、時間包絡形状の平坦さの程度を表す情報を算出する。例えば、任意の時間セグメントtt,E(l)≦i<tt,E(l+1)内の入力信号x(i) (tt,E(l)≦i<tt,E(l+1))の時間包絡E(i)を式(25)により算出する。また時間包絡E(i)の算出方法は式(25)に限定されない。時間包絡E(i)の分散またはそれに準ずるパラメータを算出し、当該パラメータを符号化する。さらに別の例では、時間包絡E(i)の相加平均と相乗平均の比またはそれに準ずるパラメータを算出し、当該パラメータを符号化する。入力信号の時間包絡形状の平坦さの程度を表す情報の算出方法は上記の例に限定されない。
さらに、例えば、時間包絡情報として、時間包絡形状の立ち上がりの程度を表す情報を算出する。例えば、時間包絡E(i)のの時間方向の差分値を算出し、当該差分値の任意の時間セグメント内の最大値を算出し符号化する。入力信号の時間包絡形状を立ち上がりの程度を表す情報の算出方法は上記の例に限定されない。
さらに、例えば、時間包絡情報として、時間包絡形状の立ち下がりの程度を表す情報を算出する。例えば、時間包絡E(i)のの時間方向の差分値を算出し、当該差分値の任意の時間セグメント内の最小値を算出し符号化する。入力信号の時間包絡形状を立ち下がりの程度を表す情報の算出方法は上記の例に限定されない。
当該第3の実施形態の低周波数時間包絡形状決定部10eに対して、本発明の第1の実施形態の第1、第2、および第3の変形例が適用できることは明白である。
[第4の実施形態]
図25は、第4の実施形態に係る音声復号装置13の構成を示す図である。音声復号装置13の通信装置は、下記音声符号化装置23から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置13は、図25に示すように、機能的には、符号化系列逆多重化部10aA、コア復号部10b、分析フィルタバンク部10c、符号化系列解析部13c、高周波数時間包絡形状決定部13a、時間包絡修正部13b、高周波数信号生成部10g、復号/逆量子化部10h、周波数包絡調整部10i、及び合成フィルタバンク部10jを備える。
図26は、第4の実施形態に係る音声復号装置13の動作を示すフローチャートである。
符号化系列解析部13cは、符号化系列逆多重化部10aAで分割された符号化系列の帯域拡張部分を解析し、高周波数信号生成部10g、復号/逆量子化部10h、高周波数時間包絡形状決定部13aで必要な情報に分割する(ステップS13-3)。
高周波数時間包絡形状決定部13aは、符号化系列解析部13cから高周波時間包絡形状に関する情報を受け取り、当該情報に基づき高周波数信号の時間包絡形状を決定する(ステップS13-1)。例えば、高周波数信号の時間包絡形状を平坦と決定する。さらに、例えば、高周波数信号の時間包絡形状を立ち上がりと決定する。さらに、例えば、高周波数信号の時間包絡形状を立ち下がりと決定する。
時間包絡修正部13bは、高周波数時間包絡形状決定部13aで決定した時間包絡形状に基づいて、分析フィルタバンク部10cから出力され、高周波数信号生成部10gにて高周波数信号の生成に利用する低周波数信号の複数のサブバンド信号の時間包絡の形状を修正する(ステップS13-2)。
例えば、前記高周波数信号の時間包絡形状が平坦と決定された場合、例えば、高周波数信号の生成に利用する低周波数信号に対して、低周波数時間包絡修正部10fが前記低周波数信号の時間包絡形状を平坦にする処理と同様の処理により、高周波数信号の生成に利用する低周波数信号の時間包絡形状を修正できる。
さらに、例えば、前記高周波数信号の時間包絡形状が立ち上がりと決定された場合、例えば、低周波数時間包絡修正部10fが前記低周波数信号の時間包絡形状を立ち上がりにする処理と同様の処理により、高周波数信号の生成に利用する低周波数信号の時間包絡形状を修正できる。
さらに、例えば、前記高周波数信号の時間包絡形状が立ち下がりと決定された場合、例えば、低周波数時間包絡修正部10fが前記低周波数信号の時間包絡形状を立ち下がりにする処理と同様の処理により、高周波数信号の生成に利用する低周波数信号の時間包絡形状を修正できる。
高周波数信号の生成に利用する低周波数信号の時間包絡形状を修正する処理は、上記の例に限定されない。
図27は、第4の実施形態に係る音声符号化装置23の構成を示す図である。音声符号化装置23の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置23は、図27に示すように、機能的には、ダウンサンプリング部20a、コア符号化部20b、分析フィルタバンク部20c及び20c1、制御パラメータ符号化部20d、包絡算出部20e、量子化/符号化部20f、時間包絡情報符号化部23a、符号化系列多重化部20h、サブバンド信号パワー算出部20j、及びコア復号信号生成部20iを備える。
図28は、第4の実施形態に係る音声符号化装置23の動作を示すフローチャートである。
時間包絡情報符号化部23aは、高周波数信号の生成に利用する低周波数信号の時間包絡と高周波数信号の時間包絡のうち少なくとも一つ以上を算出し、さらにサブバンド信号パワー算出部20jにて算出されたコア復号信号のサブバンド信号のパワーを用いてコア復号信号の時間包絡を算出し、当該低周波数信号の時間包絡及び高周波数信号の時間包絡のうち少なくとも一つ以上とコア復号信号の時間包絡より時間包絡情報を符号化する(ステップS23-1)。低周波数信号の時間包絡は、包絡算出部20eにて算出した低周波数信号のサブバンド信号のパワーを用いて低周波数信号の時間包絡を算出する。高周波数信号の時間包絡は、包絡算出部20eにて算出した高周波数信号のサブバンド信号のパワーを用いて高周波数信号の時間包絡を算出する。当該処理において、低周波数信号のサブバンド信号のパワーが算出されていない場合は、時間包絡情報符号化部23aにて低周波数信号のサブバンド信号のパワーを算出でき、低周波数信号のサブバンド信号のパワーがどこで算出されるかは限定されない。さらには、高周波数信号のサブバンド信号のパワーが算出されていない場合は、時間包絡情報符号化部23aにて高周波数信号のサブバンド信号のパワーを算出でき、高周波数信号のサブバンド信号のパワーがどこで算出されるかは限定されない。
例えば、時間包絡情報符号化部20gが前記低周波数信号の時間包絡を算出する処理と同様の処理により、当該高周波数信号の生成に利用する低周波数信号の時間包絡を算出できる。高周波数信号の生成に利用する低周波数信号のサブバンド信号の時間包絡は、当該低周波数信号のサブバンド信号の大きさの時間方向の変動がわかるパラメータであれば良く、前記の例に限定されない。
また、例えば、時間包絡情報符号化部21aが前記高周波数信号の時間包絡を算出する処理と同様の処理により、当該高周波数信号の時間包絡を算出できる。高周波数信号のサブバンド信号の時間包絡は、当該高周波数信号のサブバンド信号の大きさの時間方向の変動がわかるパラメータであれば良く、前記の例に限定されない。
例えば、時間包絡情報符号化部20gが時間包絡情報として平坦の程度を表す情報を算出する処理において、前記低周波数信号サブバンド信号の時間包絡の代わりに、当該高周波数信号の生成に利用する低周波数信号のサブバンド信号の時間包絡を用いることにより、時間包絡情報として平坦の程度を表す情報を算出でき、また当該時間包絡情報を符号化できる。さらには、例えば、時間包絡情報符号化部20gが時間包絡情報として平坦の程度を表す情報を算出する処理において、前記低周波数信号サブバンド信号の時間包絡の代わりに、当該高周波数信号のサブバンド信号の時間包絡を用いることにより、時間包絡情報として平坦の程度を表す情報を算出でき、また当該時間包絡情報を符号化できる。例えば、時間包絡の平坦の程度を平坦か否かで表現すれば1ビットで符号化できる。
さらに、例えば、時間包絡情報符号化部20gが時間包絡情報として立ち上がりの程度を表す情報を算出する処理において、前記低周波数信号サブバンド信号の時間包絡の代わりに、当該高周波数信号の生成に利用する低周波数信号のサブバンド信号の時間包絡を用いることにより、時間包絡情報として立ち上がりの程度を表す情報を算出でき、また当該時間包絡情報を符号化できる。さらには、例えば、時間包絡情報符号化部20gが時間包絡情報として立ち上がりの程度を表す情報を算出する処理において、前記低周波数信号サブバンド信号の時間包絡の代わりに、当該高周波数信号のサブバンド信号の時間包絡を用いることにより、時間包絡情報として立ち上がりの程度を表す情報を算出でき、また当該時間包絡情報を符号化できる。例えば、時間包絡の立ち上がりの程度を立ち上がりか否かで表現すれば1ビットで符号化できる。
さらに、例えば、時間包絡情報符号化部20gが時間包絡情報として立ち下がりの程度を表す情報を算出する処理において、前記低周波数信号サブバンド信号の時間包絡の代わりに、当該高周波数信号の生成に利用する低周波数信号のサブバンド信号の時間包絡を用いることにより、時間包絡情報として立ち下がりの程度を表す情報を算出でき、また当該時間包絡情報を符号化できる。さらには、例えば、時間包絡情報符号化部20gが時間包絡情報として立ち下がりの程度を表す情報を算出する処理において、前記低周波数信号サブバンド信号の時間包絡の代わりに、当該高周波数信号のサブバンド信号の時間包絡を用いることにより、時間包絡情報として立ち下がりの程度を表す情報を算出でき、また当該時間包絡情報を符号化できる。例えば、時間包絡の立ち下がりの程度を立ち下がりか否かで表現すれば1ビットで符号化できる。
なお、時間包絡情報の算出方法、及び符号化方法は前記の例に限定されない。
[第4の実施形態の音声復号装置の第1の変形例]
図29は、第4の実施形態に係る音声復号装置の第1の変形例13Aの構成を示す図である。
図30は、第4の実施形態に係る音声復号装置の第1の変形例13Aの動作を示すフローチャートである。
高周波数時間包絡形状決定部13aAは、コア復号部10bから低周波数信号を受け取り、当該低周波数信号に基づいて高周波数時間包絡形状を決定する(ステップS13-1a)。
例えば、低周波数信号の時間包絡を算出し、当該低周波数時間包絡の形状に基づいて高周波数時間包絡形状を決定する。さらに、例えば、低周波数信号に所定の処理を施した信号の時間包絡を算出し、当該処理済低周波数信号の時間包絡の形状に基づいて高周波数時間包絡形状を決定する。前記所定の処理は、例えばハイパスフィルタ処理であるが、これに限定されない。
例えば、高周波数信号の時間包絡形状を平坦と決定する。例えば、低周波数時間包絡形状決定部10eAが前記低周波数信号の時間包絡形状を平坦と決定する処理と同様に高周波数信号の時間包絡形状を平坦と決定できる。さらに、低周波数時間包絡形状決定部10eAが前記低周波数信号の時間包絡形状を平坦と決定する処理において、前記低周波数信号の時間包絡の代わりに、前記処理済低周波数信号の時間包絡を用いて、高周波数信号の時間包絡形状を平坦と決定できる。高周波数信号の時間包絡形状を平坦と決定する処理は上記の例に限定されない。
さらに、例えば、高周波数信号の時間包絡形状を立ち上がりと決定する。例えば、低周波数時間包絡形状決定部10eAが前記低周波数信号の時間包絡形状を立ち上がりと決定する処理と同様に高周波数信号の時間包絡形状を立ち上がりと決定できる。さらに、低周波数時間包絡形状決定部10eAが前記低周波数信号の時間包絡形状を立ち上がりと決定する処理において、前記低周波数信号の時間包絡の代わりに、前記処理済低周波数信号の時間包絡を用いて、高周波数信号の時間包絡形状を立ち上がりと決定できる。高周波数信号の時間包絡形状を立ち上がりと決定する処理は上記の例に限定されない。
さらに、例えば、高周波数信号の時間包絡形状を立ち下がりと決定する。例えば、低周波数時間包絡形状決定部10eAが前記低周波数信号の時間包絡形状を立ち下がりと決定する処理と同様に高周波数信号の時間包絡形状を立ち下がりと決定できる。さらに、低周波数時間包絡形状決定部10eAが前記低周波数信号の時間包絡形状を立ち下がりと決定する処理において、前記低周波数信号の時間包絡の代わりに、前記処理済低周波数信号の時間包絡を用いて、高周波数信号の時間包絡形状を立ち下がりと決定できる。高周波数信号の時間包絡形状を立ち下がりと決定する処理は上記の例に限定されない。
[第4の実施形態の音声復号装置の第2の変形例]
図31は、第4の実施形態に係る音声復号装置の第2の変形例13Bの構成を示す図である。
第4の実施形態に係る音声復号装置の第1の変形例13Aとの相違点は、高周波数時間包絡形状決定部13aBは、分析フィルタバンク部10cから低周波数信号の複数のサブバンド信号を受け取り、当該低周波数信号の複数のサブバンド信号に基づいて高周波数信号の時間包絡形状を決定する点である(ステップS13-1aに相当の処理)。
例えば、低周波数信号の少なくとも一つ以上のサブバンド信号の時間包絡を算出し、当該低周波数サブバンド信号時間包絡の形状に基づいて高周波数時間包絡形状を決定する。
例えば、高周波数信号の時間包絡形状を平坦と決定する。例えば、低周波数時間包絡形状決定部10eBが前記低周波数信号の時間包絡形状を平坦と決定する処理と同様にして、高周波数信号の時間包絡形状を平坦と決定できる。この際、周波数帯域の境界を表すBLO(m)は、例えば、比較的高い周波数の周波数帯域のみを定義するなどとして、低周波数時間包絡形状決定部10eBと異ならせることができる。高周波数信号の時間包絡形状を平坦と決定する処理は上記の例に限定されない。
さらに、例えば、高周波数信号の時間包絡形状を立ち上がりと決定する。例えば、低周波数時間包絡形状決定部10eBが前記低周波数信号の時間包絡形状を立ち上がりと決定する処理と同様にして、高周波数信号の時間包絡形状を立ち上がりと決定できる。この際、周波数帯域の境界を表すBLO(m)は、例えば、比較的高い周波数の周波数帯域のみを定義するなどとして、低周波数時間包絡形状決定部10eBと異ならせることができる。高周波数信号の時間包絡形状を立ち上がりと決定する処理は上記の例に限定されない。
さらに、例えば、高周波数信号の時間包絡形状を立ち下がりと決定する。例えば、低周波数時間包絡形状決定部10eBが前記低周波数信号の時間包絡形状を立ち下がりと決定する処理と同様にして、高周波数信号の時間包絡形状を立ち下がりと決定できる。この際、周波数帯域の境界を表すBLO(m)は、例えば、比較的高い周波数の周波数帯域のみを定義するなどとして、低周波数時間包絡形状決定部10eBと異ならせることができる。高周波数信号の時間包絡形状を立ち下がりと決定する処理は上記の例に限定されない。
[第4の実施形態の音声復号装置の第3の変形例]
図32は、第4の実施形態に係る音声復号装置の第3の変形例13Cの構成を示す図である。
高周波数時間包絡形状決定部13aCは、符号化系列解析部13cから高周波時間包絡形状に関する情報、コア復号部10bから低周波数信号、分析フィルタバンク部10cから低周波数信号の複数のサブバンド信号のうち少なくとも一つを受け取り、高周波数信号の時間包絡形状を決定する(ステップS13-1に相当の処理)。
例えば、低周波数信号の少なくとも一つ以上のサブバンド信号の時間包絡を算出し、当該低周波数サブバンド信号時間包絡の形状に基づいて高周波数時間包絡形状を決定する。
例えば、高周波数信号の時間包絡形状を平坦と決定する。この場合、上記第4の実施形態の音声復号装置、当該復号装置の第1及び第2の変形例にて記載の高周波数信号の時間包絡形状を平坦と決定する方法を少なくとも一つ以上組み合わせて時間包絡形状を平坦と決定する。高周波数信号の時間包絡形状を平坦と決定する方法は上記に限定されない。
また、例えば、高周波数信号の時間包絡形状を立ち上がりと決定する。この場合、上記第4の実施形態の音声復号装置、当該復号装置の第1及び第2の変形例にて記載の高周波数信号の時間包絡形状を立ち上がりと決定する方法を少なくとも一つ以上組み合わせて時間包絡形状を立ち上がりと決定する。高周波数信号の時間包絡形状を立ち上がりと決定する方法は上記に限定されない。
さらに、例えば、高周波数信号の時間包絡形状を立ち下がりと決定する。この場合、上記第4の実施形態の音声復号装置、当該復号装置の第1及び第2の変形例にて記載の高周波数信号の時間包絡形状を立ち下がりと決定する方法を少なくとも一つ以上組み合わせて時間包絡形状を立ち下がりと決定する。高周波数信号の時間包絡形状を立ち下がりと決定する方法は上記に限定されない。
[第4の実施形態の音声符号化装置の第1の変形例]
図33は、第4の実施形態に係る音声符号化装置の第1の変形例23Aの構成を示す図である。
図34は、第4の実施形態に係る音声符号化装置の第1の変形例23Aの動作を示すフローチャートである。
時間包絡情報符号化部23aAは、低周波数信号の時間包絡と高周波数信号の時間包絡のうち少なくとも一つ以上を算出し、当該低周波数信号及び高周波数信号の時間包絡のうち少なくとも一つ以上より時間包絡情報を算出し符号化する(ステップS23-1a)。低周波数信号の時間包絡は、包絡算出部20eにて算出した低周波数信号のサブバンド信号のパワーを用いて低周波数信号の時間包絡を算出する。高周波数信号の時間包絡は、包絡算出部20eにて算出した高周波数信号のサブバンド信号のパワーを用いて高周波数信号の時間包絡を算出する。当該処理において、低周波数信号のサブバンド信号のパワーが算出されていない場合は、時間包絡情報符号化部23aAにて低周波数信号のサブバンド信号のパワーを算出してもよく、低周波数信号のサブバンド信号のパワーがどこで算出されるかは限定されない。さらには、高周波数信号のサブバンド信号のパワーが算出されていない場合は、時間包絡情報符号化部23aAにて高周波数信号のサブバンド信号のパワーを算出してもよく、高周波数信号のサブバンド信号のパワーがどこで算出されるかは限定されない。
例えば、時間包絡情報として、時間包絡形状の平坦さの程度を表す情報を算出する。例えば、任意の時間セグメントtE(l)≦i<tE(l+1)内でBLO(m) (m=0,…,MLO, MLO≧1) (BLO(0)≧0, BLO(MLO)<kx)で境界を表されるMLO個の周波数帯域に分割し、m番目の周波数帯域に含まれる低周波数信号のサブバンド信号XLO(k,i) (BLO(m)≦k<BLO(m+1), tE(l)≦i<tE(l+1))の時間包絡ELO(k,i)を式(7)により算出する。また時間包絡ELO(k,i)の算出方法は式(7)に限定されない。時間包絡ELO(k,i)の分散またはそれに準ずるパラメータを算出し、当該パラメータを符号化する。さらに別の例では、時間包絡ELO(k,i)の相加平均と相乗平均の比またはそれに準ずるパラメータを算出し、当該パラメータを符号化する。さらには、例えば、任意の時間セグメントtE(l)≦i<tE(l+1)内でBHI(m) (m=0,…,MHI, MH≧1) (BHI(0)≧kx, BHI(MHI)<kh)で境界を表されるMHI個の周波数帯域に分割し、m番目の周波数帯域に含まれる高周波数信号のサブバンド信号XHI(k,i) (BHI(m)≦k<BHI(m+1), tE(l)≦i<tE(l+1))の時間包絡EHI(k,i)を式(11)により算出する。また時間包絡EHI(k,i)の算出方法は式(11)に限定されない。時間包絡EHI(k,i)の分散またはそれに準ずるパラメータを算出し、当該パラメータを符号化する。さらに別の例では、時間包絡EHI(k,i)の相加平均と相乗平均の比またはそれに準ずるパラメータを算出し、当該パラメータを符号化する。時間包絡形状の平坦さの程度を表す情報の算出方法は上記の例に限定されない。
さらに、例えば、時間包絡情報として、時間包絡形状の立ち上がりの程度を表す情報を算出する。例えば、時間包絡ELO(k,i)の時間方向の差分値を算出し、当該差分値の任意の時間セグメント内の最大値を算出し符号化する。さらには、例えば、時間包絡EHI(k,i)の時間方向の差分値を算出し、当該差分値の任意の時間セグメント内の最大値を算出し符号化する。時間包絡形状を立ち上がりの程度を表す情報の算出方法は上記の例に限定されない。
さらに、例えば、時間包絡情報として、時間包絡形状の立ち下がりの程度を表す情報を算出する。例えば、時間包絡ELO(k,i)のの時間方向の差分値を算出し、当該差分値の任意の時間セグメント内の最小値を算出し符号化する。さらには、例えば、時間包絡EHI(k,i)のの時間方向の差分値を算出し、当該差分値の任意の時間セグメント内の最小値を算出し符号化する。
なお、時間包絡形状を立ち下がりの程度を表す情報の算出方法は上記の例に限定されない。前記時間包絡情報として平坦の程度、立ち上がりの程度、及び立下りの程度を表す情報を算出する例において、低周波数信号及び高周波数信号のサブバンド信号の時間包絡のうち一方のみを用いる場合においては、他方の時間包絡の算出のみに係る各部及び各処理を省略することができる。
[第5の実施形態]
図35は、第5の実施形態に係る音声復号装置14の構成を示す図である。音声復号装置14の通信装置は、下記音声符号化装置24から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置14は、図35に示すように、機能的には、符号化系列逆多重化部10aA、コア復号部10b、分析フィルタバンク部10c、符号化系列解析部13c、高周波数信号生成部10g、高周波数時間包絡形状決定部13a、時間包絡修正部14a、復号/逆量子化部10h、周波数包絡調整部10i、及び合成フィルタバンク部10jを備える。
図36は、第5の実施形態に係る音声復号装置14の動作を示すフローチャートである。
時間包絡修正部14aは、高周波数時間包絡形状決定部13aで決定した時間包絡形状に基づいて、高周波数信号生成部10gから出力される高周波数信号の複数のサブバンド信号の時間包絡の形状を修正する(ステップS14-1)。
例えば、任意の時間セグメントtE(l)≦i<tE(l+1)内でBgen,HI(m) (m=0,…,Mgen,HI, Mgen,HI≧1) (Bgen,HI(0)≧kx, Bgen,HI(Mgen,HI)<kh)で境界を表されるMHI個の周波数帯域に分割し、m番目の周波数帯域に含まれる高周波数信号生成部10gから出力される高周波数信号のサブバンド信号Xgen,HI(k,i) (BHI(m)≦k<BHI(m+1), tE(l)≦i<tE(l+1))に対して、所定の関数F(Xgen,HI(k,i))を用いて以下の式(26)
Figure 2019144591

により得られるX’gen,HI(k,i)を時間包絡形状が修正された高周波数信号のサブバンド信号として出力する。
例えば、前記高周波数信号の時間包絡形状が平坦と決定された場合、以下の処理により、当該高周波数信号の時間包絡形状を修正できる。例えば、当該サブバンド信号Xgen,HI(k,i)をBgen,HI(m) (m=0,…,MHI, MHI≧1) (Bgen,HI(0)≧kx, Bgen,HI(MHI)<kh)で境界を表されるMHI個の周波数帯域に分割し、m番目の周波数帯域に含まれるサブバンド信号Xgen,HI(k,i) (BHI(m)≦k<BHI(m+1), tE(l)≦i<tE(l+1))に対して、所定の関数F(Xgen,HI(k,i))を、
Figure 2019144591

(これらを式(27)という。)
として、X’gen,HI(k,i)を時間包絡形状が修正された高周波数信号のサブバンド信号として出力する。
また別の例によれば、所定の関数F(Xgen,HI(k,i))を、サブバンド信号Xgen,HI(k,i)に対して平滑化フィルタ処理を施す
Figure 2019144591

(Nfilt≧1)で定義して、X’gen,HI(k,i)を時間包絡形状が修正された高周波数信号のサブバンド信号として出力する。さらに、前記Bgen,HI(m)を用いて境界が表される各周波数帯域内で、フィルタ処理前後のサブバンド信号のパワーをあわせるように処理できる。
また別の例によれば、前記Bgen,HI(m)を用いて境界が表される各周波数帯域内で、サブバンド信号Xgen,HI(k,i)を周波数方向に線形予測して線形予測係数αp(m) (m=0,…,MHI-1)を得て、所定の関数F(Xgen,HI(k,i))をサブバンド信号Xgen,HI(k,i)に対して線形予測逆フィルタ処理を施す
Figure 2019144591

(Npred≧1)で定義して、X’gen,HI(k,i)を時間包絡形状が修正された高周波数信号のサブバンド信号として出力する。
上記の時間包絡形状を平坦に修正する処理の例は、それぞれを組み合わせて実施できる。時間包絡修正部14aは、高周波数信号の複数のサブバンド信号の時間包絡の形状を平坦に修正する処理を実施し、上記の例に限定されない。
さらには、例えば、前記高周波数信号の時間包絡形状が立ち上がりと決定された場合、以下の処理により、当該高周波数信号の時間包絡形状を修正できる。例えば、所定の関数F(Xgen,HI(k,i))をiに対して単調増加する関数incr(i)を用いて
Figure 2019144591

で定義して、X’gen,HI(k,i)を時間包絡形状が修正された高周波数信号のサブバンド信号として出力する。さらに、前記Bgen,HI(m)を用いて境界が表される各周波数帯域内で、時間包絡形状の修正前後のサブバンド信号のパワーをあわせるように処理できる。
時間包絡修正部14aは、高周波数信号の複数のサブバンド信号の時間包絡の形状を立ち上がりに修正する処理を実施し、上記の例に限定されない。
さらには、例えば、前記高周波数信号の時間包絡形状が立ち下がりと決定された場合、以下の処理により、当該高周波数信号の時間包絡形状を修正できる。例えば、所定の関数F(Xgen,HI(k,i))を、iに対して単調減少する関数decr(i)を用いて
Figure 2019144591

で定義して、X’gen,HI(k,i)を時間包絡形状が修正された高周波数信号のサブバンド信号として出力する。さらに、前記Bgen,HI(m)を用いて境界が表される各周波数帯域内で、時間包絡形状の修正前後のサブバンド信号のパワーをあわせるように処理できる。
時間包絡修正部14aは、高周波数信号の複数のサブバンド信号の時間包絡の形状を立ち下がりに修正する処理を実施し、上記の例に限定されない。
なお、本実施形態における周波数包絡調整部10iを、“ISO/IEC 14496-3”に規定される“SBR”および“Low Delay SBR”における“HF adjustment”にて実現される場合は、時間包絡修正部14aの処理を周波数包絡調整部10iにおいて行うことで演算量の削減ができる。具体的には、例えば、式(27)により時間包絡形状を修正する際に、式(27)内の高周波数信号のサブバンド信号のパワー
Figure 2019144591

の算出は、前記“HF adjustment”において算出されるために省略できる。さらに、前記“HF adjustment”にて“interpolation”を利用しない場合(すなわち、bs_interpol_freq=0の場合)は、式(27)内の高周波数信号のサブバンド信号のパワーの周波数方向の和
Figure 2019144591

の算出は、前記“HF adjustment”において算出されるため、さらに省略できる。
一方、前記“HF adjustment”において前記“interpolation”を利用し時間方向の和、
Figure 2019144591

が算出される場合には、上記和を、前記“HF adjustment”において算出される
Figure 2019144591

の代替量、あるいは近似量として用いることができ、上記和の算出を省略することにより演算量が削減できる。
さらに、時間包絡修正部14aの他の例においても、同様に一部の演算を省略できることは明白である。
なお、本実施形態に係る音声復号装置14の高周波数時間包絡形状決定部13aに対して、本発明の第4の実施形態の音声復号装置の第1、第2、及び第3の変形例が適用できることは明白である。
図37は、第5の実施形態に係る音声符号化装置24の構成を示す図である。音声符号化装置24の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置24は、図37に示すように、機能的には、ダウンサンプリング部20a、コア符号化部20b、分析フィルタバンク部20c、制御パラメータ符号化部20d、包絡算出部20e、量子化/符号化部20f、擬似高周波数信号生成部24a、サブバンド信号パワー算出部24b、時間包絡情報符号化部24c、及び符号化系列多重化部20hを備える。
図38は、第5の実施形態に係る音声符号化装置24の動作を示すフローチャートである。
擬似高周波数信号生成部24aは、分析フィルタバンク部20cで得られる入力音声信号の低周波数信号のサブバンド信号と、制御パラメータ符号化部20dで得られる高周波数信号を生成するために必要な制御パラメータに基づいて、擬似高周波数信号を生成する(ステップS24-1)。当該擬似高周波数信号の生成処理は、高周波数信号生成部10gにおける処理と同様に行われるが、高周波数信号生成部10gではコア復号部10bにて復号された低周波数信号のサブバンド信号から生成されるのに対し、擬似高周波数信号生成部24aでは入力音声信号の低周波数信号のサブバンド信号から生成される点が異なる。なお、擬似高周波数信号生成部24aでは、演算量の削減を目的として、高周波数信号生成部10gでの処理の一部を省略できる。例えば、生成される高周波数信号のトーナリティの調整処理を省略できる。
サブバンド信号パワー算出部24bは、擬似高周波数信号生成部24aにて生成された擬似高周波数信号のサブバンド信号のパワーを算出する(ステップS24-2)。
時間包絡情報符号化部24cは、包絡算出部20eにて算出した高周波数信号のサブバンド信号のパワーを用いて高周波数信号の時間包絡を算出し、サブバンド信号パワー算出部24bにて算出した擬似高周波数信号のサブバンド信号のパワーを用いて擬似高周波数信号の時間包絡を算出し、当該高周波数信号の時間包絡と擬似高周波数信号の時間包絡より時間包絡情報を算出し符号化する(ステップS24-3)。当該処理において、高周波数信号のサブバンド信号のパワーが算出されていない場合は、時間包絡情報符号化部24cにて高周波数信号のサブバンド信号のパワーを算出でき、高周波数信号のサブバンド信号のパワーがどこで算出されるかは限定されない。
例えば、時間包絡情報符号化部21aが前記高周波数信号の時間包絡を算出する処理と同様の処理により、当該高周波数信号の時間包絡を算出できる。高周波数信号のサブバンド信号の時間包絡は、当該高周波数信号のサブバンド信号の大きさの時間方向の変動がわかるパラメータであれば良く、前記の例に限定されない。
例えば、任意の時間セグメントtE(l)≦i<tE(l+1)内でBsim,gen,HI(m) (m=0,…,Msim,gen,HI, Msim,gen,HI≧1) (Bsim,gen,HI(0)≧kx, Bsim,gen,HI(Msim,gen,HI)<kh)で境界を表されるMsim,gen,HI個の周波数帯域に分割し、m番目の周波数帯域に含まれる擬似高周波数信号のサブバンド信号Xsim,gen,HI(k,i) (Bsim,gen,HI(m)≦k<Bsim,gen,HI(m+1), tE(l)≦i<tE(l+1))の時間包絡Esim,gen,HI(k,i)を算出する。
Figure 2019144591

擬似高周波数信号のサブバンド信号の時間包絡は、擬似高周波数信号のサブバンド信号の大きさの時間方向の変動がわかるパラメータであれば良く、前記の例に限定されない。
例えば、時間包絡情報符号化部20gが時間包絡情報として平坦の程度を表す情報を算出する処理において、前記低周波数信号のサブバンド信号の時間包絡の代わりに当該高周波数信号のサブバンド信号の時間包絡を用い、さらに前記コア復号信号のサブバンド信号の時間包絡の代わりに当該擬似高周波数信号のサブバンド信号の時間包絡を用いることにより、時間包絡情報として平坦の程度を表す情報を算出でき、また当該時間包絡情報を符号化できる。例えば、時間包絡の平坦の程度を平坦か否かで表現すれば1ビットで符号化でき、例えば、前記任意の時間セグメント内において前記Msim,gen,HI個の周波数帯域毎に当該情報をMsim,gen,HIビットで符号化できる。
さらに、例えば、時間包絡情報符号化部20gが時間包絡情報として立ち上がりの程度を表す情報を算出する処理において、前記低周波数信号のサブバンド信号の時間包絡の代わりに当該高周波数信号のサブバンド信号の時間包絡を用い、さらに前記コア復号信号のサブバンド信号の時間包絡の代わりに当該擬似高周波数信号のサブバンド信号の時間包絡を用いることにより、時間包絡情報として立ち上がりの程度を表す情報を算出でき、また当該時間包絡情報を符号化できる。例えば、時間包絡の立ち上がりの程度を立ち上がりか否かで表現すれば1ビットで符号化でき、例えば、前記任意の時間セグメント内において前記Msim,gen,HI個の周波数帯域毎に当該情報をMsim,gen,HIビットで符号化できる。
さらに、例えば、時間包絡情報符号化部20gが時間包絡情報として立ち下がりの程度を表す情報を算出する処理において、前記低周波数信号のサブバンド信号の時間包絡の代わりに当該高周波数信号のサブバンド信号の時間包絡を用い、さらに前記コア復号信号のサブバンド信号の時間包絡の代わりに当該擬似高周波数信号のサブバンド信号の時間包絡を用いることにより、時間包絡情報として立ち下がりの程度を表す情報を算出でき、また当該時間包絡情報を符号化できる。例えば、時間包絡の立ち下がりの程度を立ち下がりか否かで表現すれば1ビットで符号化でき、例えば、前記任意の時間セグメント内において前記Msim,gen,HI個の周波数帯域毎に当該情報をMsim,gen,HIビットで符号化できる。
なお、時間包絡情報の算出方法、及び符号化方法は前記の例に限定されない。また、本実施形態の音声符号化装置に対して、本発明の第4の実施形態の音声符号化装置の第1の変形例が適用できることは明白である。
[第5の実施形態の音声復号装置の第1の変形例]
図39は、第5の実施形態に係る音声復号装置の第1の変形例14Aの構成を示す図である。
図40は、第5の実施形態に係る音声復号装置の第1の変形例14Aの動作を示すフローチャートである。
高周波数時間包絡形状決定部14bは、符号化系列解析部13cから高周波時間包絡形状に関する情報、コア復号部10bから低周波数信号、分析フィルタバンク部10cから低周波数信号の複数のサブバンド信号、高周波数信号生成部10gから高周波数信号の複数のサブバンド信号、のうち少なくとも一つを受け取り、高周波数信号の時間包絡形状を決定する(ステップS14-2)。例えば、高周波数信号の時間包絡形状を平坦と決定する。さらに、例えば、高周波数信号の時間包絡形状を立ち上がりと決定する。さらに、例えば、高周波数信号の時間包絡形状を立ち下がりと決定する。本発明第4の実施形態に係る音声復号装置の第3の変形例13Cの高周波数時間包絡形状決定部13aCとの相違点は、入力として高周波数信号生成部10gから高周波数信号の複数のサブバンド信号も許容される点であり、当該高周波数信号のサブバンド信号からも、低周波数信号のサブバンド信号と同様の方法により、高周波数時間包絡形状を決定することができる。
[第6の実施形態]
図41は、第6の実施形態に係る音声復号装置15の構成を示す図である。音声復号装置15の通信装置は、下記音声符号化装置25から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置15は、図41に示すように、機能的には、符号化系列逆多重化部10aA、コア復号部10b、分析フィルタバンク部10c、符号化系列解析部13c、高周波数信号生成部10g、復号/逆量子化部10h、周波数包絡調整部10i、高周波数時間包絡形状決定部13a、時間包絡修正部15a、及び合成フィルタバンク部10jを備える。
図42は、第6の実施形態に係る音声復号装置15の動作を示すフローチャートである。
時間包絡修正部15aは、高周波数時間包絡形状決定部13aで決定した時間包絡形状に基づいて、周波数包絡調整部10iから出力される高周波数信号の複数のサブバンド信号の時間包絡の形状を修正する(ステップS15-1)。
例えば、任意の時間セグメントtE(l)≦i<tE(l+1)内でBHI(m) (m=0,…,MHI, MHI≧1) (BHI(0)≧kx, BHI(MHI)<kh)で境界を表されるMHI個の周波数帯域に分割し、m番目の周波数帯域に含まれる周波数包絡調整部10iから出力される高周波数信号のサブバンド信号Xadj,HI(k,i) (Badj,HI(m)≦k<Badj,HI(m+1), tE(l)≦i<tE(l+1))に対して、所定の関数F(Xadj,HI(k,i))を用いて以下の式(37)
Figure 2019144591

により得られるX’adj,HI(k,i)を時間包絡形状が修正された高周波数信号のサブバンド信号として出力する。
例えば、前記高周波数信号の時間包絡形状が平坦と決定された場合、以下の処理により、当該高周波数信号の時間包絡形状を修正できる。例えば、時間包絡修正部14aにおける時間包絡形状を平坦に修正する処理において、高周波数信号生成部10gから出力される高周波数信号のサブバンド信号の代わりに、当該周波数包絡調整部10iから出力される高周波数信号のサブバンド信号Xadj,HI(k,i)を用いることにより、当該周波数包絡調整部10iから出力される高周波数信号のサブバンド信号Xadj,HI(k,i)の時間包絡形状を平坦に修正できる。時間包絡修正部15aは、高周波数信号の複数のサブバンド信号の時間包絡の形状を平坦に修正する処理を実施し、上記の例に限定されない。
さらに、例えば、前記高周波数信号の時間包絡形状が立ち上がりと決定された場合、以下の処理により、当該高周波数信号の時間包絡形状を修正できる。例えば、時間包絡修正部14aにおける時間包絡形状を立ち上がりに修正する処理において、高周波数信号生成部10gから出力される高周波数信号のサブバンド信号の代わりに、当該周波数包絡調整部10iから出力される高周波数信号のサブバンド信号Xadj,HI(k,i)を用いることにより、当該周波数包絡調整部10iから出力される高周波数信号のサブバンド信号Xadj,HI(k,i)の時間包絡形状を立ち上がりに修正できる。時間包絡修正部15aは、高周波数信号の複数のサブバンド信号の時間包絡の形状を立ち上がりに修正する処理を実施し、上記の例に限定されない。
さらに、例えば、前記高周波数信号の時間包絡形状が立ち下がりと決定された場合、以下の処理により、当該高周波数信号の時間包絡形状を修正できる。例えば、時間包絡修正部14aにおける時間包絡形状を立ち下がりに修正する処理において、高周波数信号生成部10gから出力される高周波数信号のサブバンド信号の代わりに、当該周波数包絡調整部10iから出力される高周波数信号のサブバンド信号Xadj,HI(k,i)を用いることにより、当該周波数包絡調整部10iから出力される高周波数信号のサブバンド信号Xadj,HI(k,i)の時間包絡形状を立ち下がりに修正できる。時間包絡修正部15aは、高周波数信号の複数のサブバンド信号の時間包絡の形状を立ち下がりに修正する処理を実施し、上記の例に限定されない。
なお、本実施形態に係る音声復号装置15の高周波数時間包絡形状決定部13aに対して、本発明の第4の実施形態の音声復号装置の第1、第2、及び第3の変形例、及び本発明第5の実施形態の音声復号装置の第1の変形例が適用できることは明白である。
図43は、第6の実施形態に係る音声符号化装置25の構成を示す図である。音声符号化装置25の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置25は、図43に示すように、機能的には、ダウンサンプリング部20a、コア符号化部20b、分析フィルタバンク部20c、制御パラメータ符号化部20d、包絡算出部20e、量子化/符号化部20f、擬似高周波数信号生成部24a、サブバンド信号パワー算出部24b、周波数包絡調整部25a、時間包絡情報符号化部25b、及び符号化系列多重化部20hを備える。
図44は、第6の実施形態に係る音声符号化装置25の動作を示すフローチャートである。
周波数包絡調整部25aは、制御パラメータ符号化部20dで得られる高周波数信号の周波数包絡調整に必要な制御パラメータと、量子化/符号化部20fで量子化された高周波数信号に対するゲインおよびノイズ信号の大きさに基づいて、擬似高周波数信号生成部24aで生成された擬似高周波数信号の周波数包絡を調整する(ステップS25-1)。当該擬似高周波数信号の周波数包絡調整処理は、周波数包絡調整部10iにおける処理と同様に行われるが、周波数包絡調整部10iでは高周波数信号生成部10gにて生成された高周波数信号のサブバンド信号に対して行うのに対し、周波数包絡調整部25aでは擬似高周波数信号生成部24aにて生成された擬似高周波数信号のサブバンド信号に対して行う点が異なる。なお、周波数包絡調整部25aでは、演算量の削減を目的として、周波数包絡調整部10iでの処理の一部を省略できる。例えば、正弦波信号の付加の処理を省略できる。さらには、例えば、ノイズ信号の付加の処理を省略できる。この場合、ノイズ信号の大きさを調整する処理も省略できる。
時間包絡情報符号化部25bは、包絡算出部20eにて算出した高周波数信号のサブバンド信号のパワーを用いて高周波数信号の時間包絡を算出し、サブバンド信号パワー算出部24bにて算出した周波数包絡調整された擬似高周波数信号のサブバンド信号のパワーを用いて擬似高周波数信号の時間包絡を算出し、当該高周波数信号の時間包絡と擬似高周波数信号の時間包絡より時間包絡情報を符号化する(ステップS25-2)。当該処理において、高周波数信号のサブバンド信号のパワーが算出されていない場合は、時間包絡情報符号化部25bにて高周波数信号のサブバンド信号のパワーを算出でき、高周波数信号のサブバンド信号のパワーがどこで算出されるかは限定されない。
例えば、時間包絡情報符号化部21aが前記高周波数信号の時間包絡を算出する処理と同様の処理により、当該高周波数信号の時間包絡を算出できる。高周波数信号のサブバンド信号の時間包絡は、当該高周波数信号のサブバンド信号の大きさの時間方向の変動がわかるパラメータであれば良く、前記の例に限定されない。
例えば、任意の時間セグメントtE(l)≦i<tE(l+1)内でBsim,adj,HI(m) (m=0,…,Msim,adj,HI, Msim,adj,HI≧1) (Bsim,adj,HI(0)≧kx, Bsim,adj,HI(Msim,adj,HI)<kh)で境界を表されるMsim,adj,HI個の周波数帯域に分割し、m番目の周波数帯域に含まれる擬似高周波数信号のサブバンド信号Xsim,adj,HI(k,i) (Bsim,adj,HI(m)≦k<Bsim,adj,HI(m+1), tE(l)≦i<tE(l+1))の時間包絡Esim,adj,HI(k,i)を算出する。
Figure 2019144591

擬似高周波数信号のサブバンド信号の時間包絡は、擬似高周波数信号のサブバンド信号の大きさの時間方向の変動がわかるパラメータであれば良く、前記の例に限定されない。
例えば、時間包絡情報符号化部20gが時間包絡情報として平坦の程度を表す情報を算出する処理において、前記低周波数信号のサブバンド信号の時間包絡の代わりに当該高周波数信号のサブバンド信号の時間包絡を用い、さらに前記コア復号信号のサブバンド信号の時間包絡の代わりに当該擬似高周波数信号のサブバンド信号の時間包絡を用いることにより、時間包絡情報として平坦の程度を表す情報を算出でき、また当該時間包絡情報を符号化できる。例えば、時間包絡の平坦の程度を平坦か否かで表現すれば1ビットで符号化でき、例えば、前記任意の時間セグメント内において前記Msim,adj,HI個の周波数帯域毎に当該情報をMsim,adj,HIビットで符号化できる。
さらに、例えば、時間包絡情報符号化部20gが時間包絡情報として立ち上がりの程度を表す情報を算出する処理において、前記低周波数信号のサブバンド信号の時間包絡の代わりに当該高周波数信号のサブバンド信号の時間包絡を用い、さらに前記コア復号信号のサブバンド信号の時間包絡の代わりに当該擬似高周波数信号のサブバンド信号の時間包絡を用いることにより、時間包絡情報として立ち上がりの程度を表す情報を算出でき、また当該時間包絡情報を符号化できる。例えば、時間包絡の立ち上がりの程度を立ち上がりか否かで表現すれば1ビットで符号化でき、例えば、前記任意の時間セグメント内において前記Msim,adj,HI個の周波数帯域毎に当該情報をMsim,adj,HIビットで符号化できる。
さらに、例えば、時間包絡情報符号化部20gが時間包絡情報として立ち下がりの程度を表す情報を算出する処理において、前記低周波数信号のサブバンド信号の時間包絡の代わりに当該高周波数信号のサブバンド信号の時間包絡を用い、さらに前記コア復号信号のサブバンド信号の時間包絡の代わりに当該擬似高周波数信号のサブバンド信号の時間包絡を用いることにより、時間包絡情報として立ち下がりの程度を表す情報を算出でき、また当該時間包絡情報を符号化できる。例えば、時間包絡の立ち下がりの程度を立ち下がりか否かで表現すれば1ビットで符号化でき、例えば、前記任意の時間セグメント内において前記Msim,adj,HI個の周波数帯域毎に当該情報をMsim,adj,HIビットで符号化できる。
なお、時間包絡情報の算出方法、及び符号化方法は前記の例に限定されない。また、本実施形態の音声符号化装置に対して、本発明の第4の実施形態の音声符号化装置の第1の変形例が適用できることは明白である。
[第6の実施形態の音声復号装置の第1の変形例]
図45は、第6の実施形態に係る音声復号装置の第1の変形例15Aの構成を示す図である。
図46は、第6の実施形態に係る音声復号装置の第1の変形例15Aの動作を示すフローチャートである。
本変形例においては、周波数包絡調整部10iは高周波数信号を構成する成分のうち少なくとも一つ以上を分離して出力する。例えば、高周波数信号を構成する成分は、低周波数信号より生成された高周波数信号成分、ノイズ信号成分、正弦波信号成分である。
時間包絡修正部15aAは、高周波数時間包絡形状決定部13aで決定した時間包絡形状に基づいて、周波数包絡調整部10iより分離した形で出力された高周波数信号を構成する成分のうち少なくとも一つ以上の時間包絡形状を修正し、時間包絡形状を修正された成分を含む高周波数信号の各成分から高周波数信号を合成する(ステップS15-1a)。
例えば、周波数包絡調整部10iより分離した形で出力された高周波数信号のうち任意の成分の信号のサブバンド信号Xshp,dj,HI(k,i) (Bshp,adj,HI(m)≦k<Bshp,adj,HI(m+1), tE(l)≦i<tE(l+1))に対して、所定の関数F(Xshp,adj,HI(k,i))を用いて以下の式(39)
Figure 2019144591

により、前記高周波数信号のうち任意の成分の信号のサブバンド信号Xshp,dj,HI(k,i)の時間包絡形状を修正した成分のサブバンド信号X’shp,adj,HI(k,i)を得る。そして、当該時間包絡形状を修正した成分のサブバンド信号と時間包絡形状の修正が施されない他の成分の信号とで高周波数信号を合成し、高周波数信号を出力する。
なお、時間包絡形状が修正される成分が複数の場合、それぞれまたはそのうちの一部は異なる時間包絡形状に修正できる。さらに、時間包絡形状が修正される成分の信号は複数の成分の信号の和の信号とすることができ、例えば低周波数信号より生成された高周波数信号成分とノイズ信号成分の和とすることができる。
なお、本変形例に係る音声復号装置15Aの高周波数時間包絡形状決定部13aに対して、本発明の第4の実施形態の音声復号装置の第1、第2、及び第3の変形例、及び本発明第5の実施形態の音声復号装置の第1の変形例が適用できることは明白である。
[第7の実施形態]
図47は、第7の実施形態に係る音声復号装置16の構成を示す図である。音声復号装置16の通信装置は、下記音声符号化装置26から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置16は、図47に示すように、機能的には、符号化系列逆多重化部10a、コア復号部10b、分析フィルタバンク部10c、符号化系列解析部13c、低周波数時間包絡形状決定部10e、低周波数時間包絡修正部10f、高周波数時間包絡形状決定部13a、時間包絡修正部13b、高周波数信号生成部10g、復号/逆量子化部10h、周波数包絡調整部10i、及び合成フィルタバンク部10jを備える。
図48は、第7の実施形態に係る音声復号装置の動作を示すフローチャートである。
なお、本実施形態に係る音声復号装置16の低周波数時間包絡形状決定部10eに対して、本発明の第1の実施形態の音声復号装置の第1、第2、及び第3の変形例が適用できることは明白である。
さらには、本実施形態に係る音声復号装置16の高周波数時間包絡形状決定部13aに対して、本発明の第4の実施形態の音声復号装置の第1、第2、及び第3の変形例が適用できることは明白である。
図49は、第7の実施形態に係る音声符号化装置26の構成を示す図である。音声符号化装置26の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置26は、図49に示すように、機能的には、ダウンサンプリング部20a、コア符号化部20b、分析フィルタバンク部20c及び20c1、制御パラメータ符号化部20d、包絡算出部20e、量子化/符号化部20f、コア復号信号生成部20i、サブバンド信号パワー算出部20j、時間包絡情報符号化部26a、及び符号化系列多重化部20hを備える。
図50は、第7の実施形態に係る音声符号化装置26の動作を示すフローチャートである。
時間包絡情報符号化部26aは、低周波数信号の時間包絡と高周波数信号の時間包絡のうち少なくとも一つ以上を算出し、さらに前記サブバンド信号パワー算出部20jにて算出されたコア復号信号のサブバンド信号のパワーを用いてコア復号信号の時間包絡を算出し、当該低周波数信号の時間包絡及び高周波数信号の時間包絡のうち少なくとも一つ以上とコア復号信号の時間包絡より時間包絡情報を符号化する(ステップS26-1)。
当該時間包絡情報は、低周波数時間包絡情報と高周波数時間包絡情報を含む。
低周波数信号の時間包絡は、包絡算出部20eにて算出した低周波数信号のサブバンド信号のパワーを用いて低周波数信号の時間包絡を算出する。高周波数信号の時間包絡は、包絡算出部20eにて算出した高周波数信号のサブバンド信号のパワーを用いて高周波数信号の時間包絡を算出する。当該処理において、低周波数信号のサブバンド信号のパワーが算出されていない場合は、時間包絡情報符号化部26aにて低周波数信号のサブバンド信号のパワーを算出でき、低周波数信号のサブバンド信号のパワーがどこで算出されるかは限定されない。さらには、高周波数信号のサブバンド信号のパワーが算出されていない場合は、時間包絡情報符号化部26aにて高周波数信号のサブバンド信号のパワーを算出でき、高周波数信号のサブバンド信号のパワーがどこで算出されるかは限定されない。
例えば、時間包絡情報符号化部20gの動作と同様に低周波数時間包絡情報を算出し符号化することができ、時間包絡情報符号化部23aの動作と同様に高周波数時間包絡情報を算出し符号化することができる。当該低周波数時間包絡情報、及び高周波数時間包絡情報の算出符号化は、前記の例に限定されない。
当該低周波数時間包絡情報と当該高周波数時間包絡情報は別々に符号化することもでき、また一緒に符号化することもでき、本発明においては低周波数時間包絡情報及び高周波数時間包絡情報の符号化の方法は限定されない。
例えば、当該低周波数時間包絡情報と当該高周波数時間包絡情報をベクトルとして扱い、ベクトル量子化により符号化することができる。さらに、例えば、当該ベクトルをエントロピー符号化することもできる。
さらには、低周波数時間包絡情報と高周波数時間包絡情報を同一の時間包絡情報とすることもでき、この場合、音声復号装置16の符号化系列解析部10dからは同一の時間包絡情報が低周波数時間包絡情報及び高周波数時間包絡情報として出力される。本発明においては、低周波数時間包絡情報及び高周波数時間包絡情報の形態は限定されない。
[第7の実施形態の音声復号装置の第1の変形例]
図51は、第7の実施形態に係る音声復号装置の第1の変形例16Aの構成を示す図である。
図52は、第7の実施形態に係る音声復号装置の第1の変形例16Aの動作を示すフローチャートである。
高周波数時間包絡形状決定部16aは、符号化系列解析部13cから高周波時間包絡形状に関する情報、コア復号部10bから低周波数信号、分析フィルタバンク部10cから低周波数信号の複数のサブバンド信号、低周波数時間包絡修正部10fから時間包絡形状を修正済みの低周波数信号の複数のサブバンド信号、のうち少なくとも一つを受け取り、高周波数信号の時間包絡形状を決定する(ステップS16-1)。例えば、高周波数信号の時間包絡形状を平坦と決定するケース、高周波数信号の時間包絡形状を立ち上がりと決定するケース、高周波数信号の時間包絡形状を立ち下がりと決定するケースが挙げられる。第4の実施形態に係る音声復号装置の第3の変形例13Cの高周波数時間包絡形状決定部13aCとの相違点は、入力として低周波数時間包絡修正部10fから時間包絡形状を修正済みの低周波数信号の複数のサブバンド信号も許容される点であり、当該低周波数信号のサブバンド信号からも、分析フィルタバンク部10cからの低周波数信号のサブバンド信号と同様の方法により、高周波数時間包絡形状を決定することができる。
[第7の実施形態の音声復号装置の第2の変形例]
図153は、第7の実施形態に係る音声復号装置の第2の変形例16Bの構成を示す図である。
図154は、第7の実施形態に係る音声復号装置の第2の変形例16Bの動作を示すフローチャートである。
本変形例においては、低周波数時間包絡形状決定部16bと前記低周波数時間包絡形状決定部10eCとの相違点は、決定した低周波数包絡形状を時間包絡修正部16cへも通知する点である。低周波数時間包絡形状決定部16bにおける時間包絡形状の決定は、前記の例に加えて、例えば、前記低周波数信号の周波数パワー分布に基づくこともできる。
さらには、前記低周波数時間包絡形状決定部10e、10eA、及び10eBに対しても同様の変形を加えることが可能なことは明白である。
時間包絡修正部16cと前記時間包絡修正部13bとの相違点は、高周波数時間包絡形状決定部13aC(13a、13aA、13aBでもよいことは明白)から受け取る時間包絡形状と低周波数時間包絡形状決定部16bから受け取る時間包絡形状のうち少なくとも一つ以上に基づいて、分析フィルタバンク部10cから出力され高周波数信号生成部10gにて高周波数信号の生成に用いる複数のサブバンド信号の時間包絡の形状を修正する点である(S16-2)。
例えば、低周波数時間包絡形状決定部16bから平坦であるとの時間包絡形状の情報を受け取った場合には、高周波数時間包絡形状決定部13aCから受け取る時間包絡形状によらず、分析フィルタバンク部10cから出力される複数のサブバンド信号の時間包絡の形状を平坦に修正する。更に例えば、低周波数時間包絡形状決定部16bから平坦でないとの時間包絡形状の情報を受け取った場合には、高周波数時間包絡形状決定部13aCから受け取る時間包絡形状によらず、分析フィルタバンク部10cから出力される複数のサブバンド信号の時間包絡の形状を平坦に修正しない。立ち上がり、立ち下がりの場合も同様であり、時間包絡形状は限定されない。
[第7の実施形態の音声復号装置の第3の変形例]
図155は、第7の実施形態に係る音声復号装置の第3の変形例16Cの構成を示す図である。
図156は、第7の実施形態に係る音声復号装置の第3の変形例16Cの動作を示すフローチャートである。
本変形例においては、高周波数時間包絡形状決定部16dと前記高周波数時間包絡形状決定部13aCとの相違点は、決定した高周波数包絡形状を低周波数時間包絡修正部16eへも通知する点である。
高周波数時間包絡形状決定部16dにおける時間包絡形状の決定は、前記の例に加えて、例えば、前記低周波数信号の周波数パワー分布に基づくこともできる。更には、例えば符号化系列解析部13cから得られる高周波数信号の生成の際のフレーム長を用いることができる。例えば、フレーム長が長い場合は平坦である、フレーム長が短い場合は立ち上がりまたは立ち下がりであると決定できる。前記高周波数信号の生成の際のフレーム長の例としては、“ISO/IEC14496-3”に規定される“time border”にて境界を決められる“time segment”の長さが挙げられる。さらには、前記高周波数時間包絡形状決定部13a、13aA、及び13aBに対しても同様の変形を加えることが可能なことは明白である。
低周波数時間包絡修正部16eと前記低周波数時間包絡修正部10fとの相違点は、低周波数時間包絡形状決定部10eC(10e、10eA、10eBでもよいことは明白)から受け取る時間包絡形状と高周波数時間包絡形状決定部16dから受け取る時間包絡形状のうち少なくとも一つ以上に基づいて、分析フィルタバンク部10cから出力される複数のサブバンド信号の時間包絡の形状を修正する点である(S16-3)。
例えば、高周波数時間包絡形状決定部16dから平坦であるとの時間包絡形状の情報を受け取った場合には、低周波数時間包絡形状決定部10eCから受け取る時間包絡形状によらず、分析フィルタバンク部10cから出力される複数のサブバンド信号の時間包絡の形状を平坦に修正する。更に例えば、高周波数時間包絡形状決定部16dから平坦ではないとの時間包絡形状の情報を受け取った場合には、低周波数時間包絡形状決定部10eCから受け取る時間包絡形状によらず、分析フィルタバンク部10cから出力される複数のサブバンド信号の時間包絡の形状を平坦に修正しない。立ち上がり、立ち下がりの場合も同様であり、時間包絡形状は限定されない。
[第7の実施形態の音声復号装置の第4の変形例]
図157は、第7の実施形態に係る音声復号装置の第4の変形例16Dの構成を示す図である。
図158は、第7の実施形態に係る音声復号装置の第4の変形例16Dの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部16b、前記時間包絡修正部16c、前記高周波数時間包絡形状決定部16d、及び前記低周波数時間包絡修正部16eを具備する。
[第7の実施形態の音声復号装置の第5の変形例]
図159は、第7の実施形態に係る音声復号装置の第5の変形例16Eの構成を示す図である。
図160は、第7の実施形態に係る音声復号装置の第5の変形例16Eの動作を示すフローチャートである。
本変形例と前記第7の実施形態に係る音声復号装置16との相違点は、低周波数時間包絡形状決定部10e及び高周波数時間包絡形状決定部13aにかえて時間包絡形状決定部16fを具備する点である。
時間包絡形状決定部16fは、符号化系列逆多重化部10aからの低周波数時間包絡形状に関する情報、コア復号部10bからの低周波数信号、分析フィルタバンク部10cからの低周波数信号の複数のサブバンド信号、符号化系列解析部13cからの高周波数時間包絡形状に関する情報のうち少なくとも一つ以上に基づいて時間包絡形状を決定する(S16-4)。決定した時間包絡形状は、低周波数時間包絡修正部10f、時間包絡修正部13bに通知される。
例えば、時間包絡形状として平坦と決定する。さらに例えば、時間包絡形状として立ち上がりと決定する。さらに例えば、時間包絡形状として立下りと決定する。決定される時間包絡形状は、上記の例に限定されない。
時間包絡形状決定部16fでは、例えば、前記低周波数時間包絡形状決定部10e、10eA、10eB、10eC、及び16b、前記高周波数時間包絡形状決定部13a、13aA、13aB、13aC、及び16dと同様に時間包絡形状を決定できる。時間包絡形状の決定方法は上記の例に限定されない。
[第7の実施形態の音声符号化装置の第1の変形例]
図53は、第7の実施形態に係る音声符号化装置の第1の変形例26Aの構成を示す図である。
図54は、第7の実施形態に係る音声符号化装置の第1の変形例26Aの動作を示すフローチャートである。
時間包絡情報符号化部26aAは、低周波数信号の時間包絡と高周波数信号の時間包絡のうち少なくとも一つ以上を算出し、当該低周波数信号及び高周波数信号の時間包絡のうち少なくとも一つ以上より時間包絡情報を算出し符号化する(ステップS26-1a)。
当該時間包絡情報は、低周波数時間包絡情報と高周波数時間包絡情報を含む。第7の実施形態の音声符号化装置26の時間包絡情報符号化部26aの動作と同様に、当該低周波数時間包絡情報と高周波数時間包絡情報の符号化の方法は限定されない。
低周波数信号の時間包絡は、包絡算出部20eにて算出した低周波数信号のサブバンド信号のパワーを用いて低周波数信号の時間包絡を算出する。
高周波数信号の時間包絡は、包絡算出部20eにて算出した高周波数信号のサブバンド信号のパワーを用いて高周波数信号の時間包絡を算出する。
当該処理において、低周波数信号のサブバンド信号のパワーが算出されていない場合は、時間包絡情報符号化部26aAにて低周波数信号のサブバンド信号のパワーを算出してもよく、低周波数信号のサブバンド信号のパワーがどこで算出されるかは限定されない。
さらには、高周波数信号のサブバンド信号のパワーが算出されていない場合は、時間包絡情報符号化部26aAにて高周波数信号のサブバンド信号のパワーを算出してもよく、高周波数信号のサブバンド信号のパワーがどこで算出されるかは限定されない。
例えば、時間包絡情報符号化部20gAの動作と同様に低周波数時間包絡情報を算出し符号化することができ、時間包絡情報符号化部23aAの動作と同様に高周波数時間包絡情報を算出し符号化することができる。当該低周波数時間包絡情報、及び高周波数時間包絡情報の算出符号化は、前記の例に限定されない。
さらには、第7の実施形態の音声符号化装置26の時間包絡情報符号化部26aの動作と同様に、低周波数時間包絡情報と高周波数時間包絡情報を同一の時間包絡情報とすることもできる。
[第8の実施形態]
図55は、第8の実施形態に係る音声復号装置17の構成を示す図である。音声復号装置17の通信装置は、下記音声符号化装置27から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置17は、図55に示すように、機能的には、符号化系列逆多重化部10a、コア復号部10b、分析フィルタバンク部10c、符号化系列解析部13c、低周波数時間包絡形状決定部10e、低周波数時間包絡修正部10f、高周波数信号生成部10g、高周波数時間包絡形状決定部13a、時間包絡修正部14a、復号/逆量子化部10h、周波数包絡調整部10i、及び合成フィルタバンク部10jを備える。
図56は、第8の実施形態に係る音声復号装置の動作を示すフローチャートである。
なお、本実施形態に係る音声復号装置17の低周波数時間包絡形状決定部10eに対して、本発明の第1の実施形態の音声復号装置の第1、第2、及び第3の変形例が適用できることは明白である。
さらには、本実施形態に係る音声復号装置17の高周波数時間包絡形状決定部13aに対して、本発明の第4の実施形態の音声復号装置の第1、第2、及び第3の変形例、本発明第5の実施形態の音声復号装置の第1の変形例、及び本発明第7の実施形態の音声復号装置の第1の変形例が適用できることは明白である。
図57は、第8の実施形態に係る音声符号化装置27の構成を示す図である。音声符号化装置27の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置27は、図57に示すように、機能的には、ダウンサンプリング部20a、コア符号化部20b、分析フィルタバンク部20c及び20c1、制御パラメータ符号化部20d、包絡算出部20e、量子化/符号化部20f、擬似高周波数信号生成部24a、コア復号信号生成部20i、サブバンド信号パワー算出部20j及び24b、時間包絡情報符号化部27a、及び符号化系列多重化部20hを備える。
図58は、第8の実施形態に係る音声符号化装置27の動作を示すフローチャートである。
時間包絡情報符号化部27aは、入力音声信号の低周波数信号の時間包絡、高周波数信号の時間包絡、コア復号信号の時間包絡、擬似高周波数信号の時間包絡のうち少なくとも一つ以上を算出し、算出された時間包絡より時間包絡情報を符号化する(ステップS27-1)。
当該時間包絡情報は、低周波数時間包絡情報と高周波数時間包絡情報を含む。
低周波数信号の時間包絡は、包絡算出部20eにて算出した低周波数信号のサブバンド信号のパワーを用いて低周波数信号の時間包絡を算出する。高周波数信号の時間包絡は、包絡算出部20eにて算出した高周波数信号のサブバンド信号のパワーを用いて高周波数信号の時間包絡を算出する。当該処理において、低周波数信号のサブバンド信号のパワーが算出されていない場合は、時間包絡情報符号化部27aにて低周波数信号のサブバンド信号のパワーを算出でき、低周波数信号のサブバンド信号のパワーがどこで算出されるかは限定されない。さらには、高周波数信号のサブバンド信号のパワーが算出されていない場合は、時間包絡情報符号化部27aにて高周波数信号のサブバンド信号のパワーを算出でき、高周波数信号のサブバンド信号のパワーがどこで算出されるかは限定されない。
コア復号信号の時間包絡は、前記サブバンド信号パワー算出部20jにて算出されたコア復号信号のサブバンド信号のパワーを用いて算出する。
擬似高周波数信号の時間包絡は、前記サブバンド信号パワー算出部24bにて算出された擬似高周波数信号のサブバンド信号のパワーを用いて算出する。
例えば、時間包絡情報符号化部20gの動作と同様に当該低周波数信号の時間包絡情報を算出し符号化することができ、時間包絡情報符号化部24cの動作と同様に当該高周波数信号の時間包絡情報を算出し符号化することができる。
第7の実施形態の音声符号化装置26の時間包絡情報符号化部26aの動作と同様に、当該低周波数時間包絡情報と高周波数時間包絡情報の算出及び符号化の方法は限定されない。
さらには、第7の実施形態の音声符号化装置26の時間包絡情報符号化部26aと同様に、低周波数時間包絡情報と高周波数時間包絡情報を同一の時間包絡情報とすることもできる。
なお、本実施形態に係る音声符号化装置27に対して、本発明の第7の実施形態の音声符号化装置の第1の変形例が適用できることは明白である。
[第8の実施形態の音声復号装置の第1の変形例]
図161は、第8の実施形態に係る音声復号装置の第1の変形例17Aの構成を示す図である。
図162は、第8の実施形態に係る音声復号装置の第1の変形例17Aの動作を示すフローチャートである。
本変形例においては、時間包絡修正部17aと前記時間包絡修正部14aとの相違点は、高周波数時間包絡形状決定部13aC(13a、13aA、13aBでもよいことは明白)から受け取る時間包絡形状と低周波数時間包絡形状決定部16bから受け取る時間包絡形状のうち少なくとも一つ以上に基づいて、高周波数信号生成部10gから出力される高周波数信号の複数のサブバンド信号の時間包絡の形状を修正する点である(S17-1)。
例えば、低周波数時間包絡形状決定部16bから平坦であるとの時間包絡形状の情報を受け取った場合には、高周波数時間包絡形状決定部13aCから受け取る時間包絡形状によらず、高周波数信号生成部10gから出力される複数のサブバンド信号の時間包絡の形状を平坦に修正する。更に例えば、低周波数時間包絡形状決定部16bから平坦でないとの時間包絡形状の情報を受け取った場合には、高周波数時間包絡形状決定部13aCから受け取る時間包絡形状によらず、高周波数信号生成部10gから出力される複数のサブバンド信号の時間包絡の形状を平坦に修正しない。立ち上がり、立ち下がりの場合も同様であり、時間包絡形状は限定されない。
[第8の実施形態の音声復号装置の第2の変形例]
図163は、第8の実施形態に係る音声復号装置の第2の変形例17Bの構成を示す図である。
図164は、第8の実施形態に係る音声復号装置の第2の変形例17Bの動作を示すフローチャートである。
本変形例と第8の実施形態に係る音声復号装置17との相違点は、高周波数時間包絡形状決定部13aC(13a、13aA、及び13aBでもよいことは明白)、低周波数時間包絡修正部10fにかえて、高周波数時間包絡形状決定部16d、低周波数時間包絡修正部16eを具備する点である。
[第8の実施形態の音声復号装置の第3の変形例]
図165は、第8の実施形態に係る音声復号装置の第3の変形例17Cの構成を示す図である。
図166は、第8の実施形態に係る音声復号装置の第3の変形例17Cの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部16b、前記時間包絡修正部17a、前記高周波数時間包絡形状決定部16d、及び前記低周波数時間包絡修正部16eを具備する。
[第8の実施形態の音声復号装置の第4の変形例]
図167は、第8の実施形態に係る音声復号装置の第4の変形例17Dの構成を示す図である。
図168は、第8の実施形態に係る音声復号装置の第4の変形例17Dの動作を示すフローチャートである。
本変形例と前記第8の実施形態に係る音声復号装置17との相違点は、低周波数時間包絡形状決定部10e及び高周波数時間包絡形状決定部13aにかえて時間包絡形状決定部16fを具備する点である。
[第9の実施形態]
図59は、第9の実施形態に係る音声復号装置18の構成を示す図である。音声復号装置18の通信装置は、下記音声符号化装置28から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置18は、図59に示すように、機能的には、符号化系列逆多重化部10a、コア復号部10b、分析フィルタバンク部10c、符号化系列解析部13c、低周波数時間包絡形状決定部10e、低周波数時間包絡修正部10f、高周波数信号生成部10g、復号/逆量子化部10h、周波数包絡調整部10i、高周波数時間包絡形状決定部13a、時間包絡修正部14a、及び合成フィルタバンク部10jを備える。
図60は、第9の実施形態に係る音声復号装置の動作を示すフローチャートである。
なお、本実施形態に係る音声復号装置18の低周波数時間包絡形状決定部10eに対して、本発明の第1の実施形態の音声復号装置の第1、第2、及び第3の変形例が適用できることは明白である。
さらには、本実施形態に係る音声復号装置18の高周波数時間包絡形状決定部13aに対して、本発明の第4の実施形態の音声復号装置の第1、第2、及び第3の変形例、本発明第5の実施形態の音声復号装置の第1の変形例、及び本発明第7の実施形態の音声復号装置の第1の変形例が適用できることは明白である。
図61は、第9の実施形態に係る音声符号化装置28の構成を示す図である。音声符号化装置28の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置28は、図61に示すように、機能的には、ダウンサンプリング部20a、コア符号化部20b、分析フィルタバンク部20c及び20c1、制御パラメータ符号化部20d、包絡算出部20e、量子化/符号化部20f、擬似高周波数信号生成部24a、周波数包絡調整部25a、コア復号信号生成部20i、サブバンド信号パワー算出部20j及び24b、時間包絡情報符号化部27a、及び符号化系列多重化部20hを備える。
図62は、第9の実施形態に係る音声符号化装置28の動作を示すフローチャートである。
時間包絡情報符号化部28aは、入力音声信号の低周波数信号の時間包絡、高周波数信号の時間包絡、コア復号信号の時間包絡、及び周波数包絡調整された擬似高周波数信号の時間包絡のうち少なくとも一つ以上を算出し、算出された時間包絡より時間包絡情報を符号化する(ステップS28-1)。
当該時間包絡情報は、低周波数時間包絡情報と高周波数時間包絡情報を含む。第7の実施形態の音声符号化装置26の時間包絡情報符号化部26aの動作と同様に、当該低周波数時間包絡情報と高周波数時間包絡情報の符号化の方法は限定されない。
低周波数信号の時間包絡は、包絡算出部20eにて算出した低周波数信号のサブバンド信号のパワーを用いて低周波数信号の時間包絡を算出する。高周波数信号の時間包絡は、包絡算出部20eにて算出した高周波数信号のサブバンド信号のパワーを用いて高周波数信号の時間包絡を算出する。当該処理において、低周波数信号のサブバンド信号のパワーが算出されていない場合は、時間包絡情報符号化部28aにて低周波数信号のサブバンド信号のパワーを算出でき、低周波数信号のサブバンド信号のパワーがどこで算出されるかは限定されない。さらには、高周波数信号のサブバンド信号のパワーが算出されていない場合は、時間包絡情報符号化部28aにて高周波数信号のサブバンド信号のパワーを算出でき、高周波数信号のサブバンド信号のパワーがどこで算出されるかは限定されない。
コア復号信号の時間包絡は、サブバンド信号パワー算出部20jにて算出されたコア復号信号のサブバンド信号のパワーを用いて算出する。
周波数包絡調整された擬似高周波数信号の時間包絡は、サブバンド信号パワー算出部24bにて算出された擬似高周波数信号のサブバンド信号のパワーを用いて算出する。
例えば、時間包絡情報符号化部20gの動作と同様に当該低周波数信号の時間包絡情報を算出し符号化することができ、時間包絡情報符号化部25bの動作と同様に当該高周波数信号の時間包絡情報を算出し符号化することができる。
第7の実施形態の音声符号化装置26の時間包絡情報符号化部26aの動作と同様に、当該低周波数時間包絡情報と高周波数時間包絡情報の算出及び符号化の方法は限定されない。
さらには、第7の実施形態の音声符号化装置26の時間包絡情報符号化部26aと同様に、低周波数時間包絡情報と高周波数時間包絡情報を同一の時間包絡情報とすることもできる。
なお、本実施形態に係る音声符号化装置28に対して、本発明の第7の実施形態の音声符号化装置の第1の変形例が適用できることは明白である。
[第9の実施形態の音声復号装置の第1の変形例]
図63は、第9の実施形態に係る音声復号装置の第1の変形例18Aの構成を示す図である。
図64は、第9の実施形態に係る音声復号装置の第1の変形例18Aの動作を示すフローチャートである。
なお、本変形例に係る音声復号装置18Aの低周波数時間包絡形状決定部10eに対して、本発明の第1の実施形態の音声復号装置の第1、第2、及び第3の変形例が適用できることは明白である。
さらには、本変形例に係る音声復号装置18Aの高周波数時間包絡形状決定部13aに対して、本発明の第4の実施形態の音声復号装置の第1、第2、及び第3の変形例、本発明第5の実施形態の音声復号装置の第1の変形例、及び本発明第7の実施形態の音声復号装置の第1の変形例が適用できることは明白である。
[第9の実施形態の音声復号装置の第2の変形例]
図169は、第9の実施形態に係る音声復号装置の第2の変形例18Bの構成を示す図である。
図170は、第9の実施形態に係る音声復号装置の第2の変形例18Bの動作を示すフローチャートである。
本変形例においては、時間包絡修正部18aと前記時間包絡修正部15aとの相違点は、高周波数時間包絡形状決定部13aC(13a、13aA、13aBでもよいことは明白)から受け取る時間包絡形状と低周波数時間包絡形状決定部16bから受け取る時間包絡形状のうち少なくとも一つ以上に基づいて、周波数包絡調整部10iから出力される高周波数信号の複数のサブバンド信号の時間包絡の形状を修正する点である(S18-1)。
例えば、低周波数時間包絡形状決定部16bから平坦であるとの時間包絡形状の情報を受け取った場合には、高周波数時間包絡形状決定部13aCから受け取る時間包絡形状によらず、周波数包絡調整部10iから出力される複数のサブバンド信号の時間包絡の形状を平坦に修正する。更に例えば、低周波数時間包絡形状決定部16bから平坦でないとの時間包絡形状の情報を受け取った場合には、高周波数時間包絡形状決定部13aCから受け取る時間包絡形状によらず、周波数包絡調整部10iから出力される複数のサブバンド信号の時間包絡の形状を平坦に修正しない。立ち上がり、立ち下がりの場合も同様であり、時間包絡形状は限定されない。
[第9の実施形態の音声復号装置の第3の変形例]
図171は、第9の実施形態に係る音声復号装置の第3の変形例18Cの構成を示す図である。
図172は、第9の実施形態に係る音声復号装置の第3の変形例18Cの動作を示すフローチャートである。
本変形例と第9の実施形態に係る音声復号装置18との相違点は、高周波数時間包絡形状決定部13aC(13a、13aA、及び13aBでもよいことは明白)、低周波数時間包絡修正部10fにかえて、高周波数時間包絡形状決定部16d、低周波数時間包絡修正部16eを具備する点である。
[第9の実施形態の音声復号装置の第4の変形例]
図173は、第9の実施形態に係る音声復号装置の第4の変形例18Dの構成を示す図である。
図174は、第9の実施形態に係る音声復号装置の第4の変形例18Dの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部16b、前記時間包絡修正部18a、前記高周波数時間包絡形状決定部16d、及び前記低周波数時間包絡修正部16eを具備する。
[第9の実施形態の音声復号装置の第5の変形例]
図175は、第9の実施形態に係る音声復号装置の第5の変形例18Eの構成を示す図である。
図176は、第9の実施形態に係る音声復号装置の第5の変形例18Eの動作を示すフローチャートである。
本変形例と前記第9の実施形態に係る音声復号装置18との相違点は、低周波数時間包絡形状決定部10e及び高周波数時間包絡形状決定部13aにかえて時間包絡形状決定部16fを具備する点である。
[第9の実施形態の音声復号装置の第6の変形例]
図177は、第9の実施形態に係る音声復号装置の第6の変形例18Fの構成を示す図である。
図178は、第9の実施形態に係る音声復号装置の第6の変形例18Fの動作を示すフローチャートである。
本変形例においては、時間包絡修正部18aAと前記時間包絡修正部15aAとの相違点は、高周波数時間包絡形状決定部13aC(13a、13aA、13aBでもよいことは明白)から受け取る時間包絡形状と低周波数時間包絡形状決定部16bから受け取る時間包絡形状のうち少なくとも一つ以上に基づいて、周波数包絡調整部10iより分離した形で出力された高周波数信号を構成する成分のうち少なくとも一つ以上の時間包絡形状を修正し、時間包絡形状を修正された成分を含む高周波数信号の各成分から高周波数信号を合成し出力する点である(S18-1a)。
例えば、低周波数時間包絡形状決定部16bから平坦であるとの時間包絡形状の情報を受け取った場合には、高周波数時間包絡形状決定部13aCから受け取る時間包絡形状によらず、周波数包絡調整部10iより分離した形で出力された高周波数信号を構成する成分のうち少なくとも一つ以上の時間包絡形状を平坦に修正する。更に例えば、低周波数時間包絡形状決定部16bから平坦でないとの時間包絡形状の情報を受け取った場合には、高周波数時間包絡形状決定部13aCから受け取る時間包絡形状によらず、周波数包絡調整部10iより分離した形で出力された高周波数信号を構成する成分のうち少なくとも一つ以上の時間包絡形状を平坦に修正しない。立ち上がり、立ち下がりの場合も同様であり、時間包絡形状は限定されない。
[第9の実施形態の音声復号装置の第7の変形例]
図179は、第9の実施形態に係る音声復号装置の第7の変形例18Gの構成を示す図である。
図180は、第9の実施形態に係る音声復号装置の第7の変形例18Gの動作を示すフローチャートである。
本変形例と第9の実施形態の第1の変形例に係る音声復号装置18Aとの相違点は、高周波数時間包絡形状決定部13aC(13a、13aA、及び13aBでもよいことは明白)、低周波数時間包絡修正部10fにかえて、高周波数時間包絡形状決定部16d、低周波数時間包絡修正部16eを具備する点である。
[第9の実施形態の音声復号装置の第8の変形例]
図181は、第9の実施形態に係る音声復号装置の第8の変形例18Hの構成を示す図である。
図182は、第9の実施形態に係る音声復号装置の第8の変形例18Hの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部16b、前記時間包絡修正部18aA、前記高周波数時間包絡形状決定部16d、及び前記低周波数時間包絡修正部16eを具備する。
[第9の実施形態の音声復号装置の第9の変形例]
図183は、第9の実施形態に係る音声復号装置の第9の変形例18Iの構成を示す図である。
図184は、第9の実施形態に係る音声復号装置の第9の変形例18Iの動作を示すフローチャートである。
本変形例と前記第9の実施形態の変形例1に係る音声復号装置18Aとの相違点は、低周波数時間包絡形状決定部10e及び高周波数時間包絡形状決定部13aにかえて時間包絡形状決定部16fを具備する点である。
[第10の実施形態]
図65は、第10の実施形態に係る音声復号装置1の構成を示す図である。音声復号装置1の通信装置は、下記音声符号化装置2から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置1は、図65に示すように、機能的には、符号化系列解析部1a、音声復号部1b、時間包絡形状決定部1c、及び時間包絡修正部1dを備える。
図66は、第10の実施形態に係る音声復号装置1の動作を示すフローチャートである。
符号化系列解析部1aは、符号化系列を解析し、音声符号化部分と時間包絡形状に関する情報に分割する(ステップS1-1)。
音声復号部1bは、符号化系列の音声符号化部分を復号し、復号信号を得る(ステップS1-2)。
時間包絡形状決定部1cは、符号化系列解析部1aで分割された時間包絡形状に関する情報、及び音声復号部1bで得られた復号信号のうち少なくとも一つ以上に基づき、復号信号の時間包絡形状を決定する(ステップS1-3)。
例えば、復号信号の時間包絡形状を平坦と決定する。例えば、復号信号のパワーまたはそれに準ずるパラメータを算出し、当該パラメータの分散またはそれに準ずるパラメータを算出する。算出したパラメータと所定の閾値とを比較して時間包絡形状が平坦か否かまたは平坦さの程度を決定する。さらに別の例では、復号信号のパワーまたはそれに準ずるパラメータの相加平均と相乗平均の比またはそれに準ずるパラメータを算出し、所定の閾値とを比較して時間包絡形状が平坦か否かまたは平坦さの程度を決定する。復号信号の時間包絡形状を平坦と決定する方法は上記の例に限定されない。
さらに、例えば、復号信号の時間包絡形状を立ち上がりと決定する。例えば、復号信号のパワーまたはそれに準ずるパラメータを算出し、当該パラメータの時間方向の差分値を算出し、当該差分値の任意の時間セグメント内の最大値を算出する。当該最大値と所定の閾値とを比較して、時間包絡形状が立ち上がりか否かまたは立ち上がりの程度を決定する。復号信号の時間包絡形状を立ち上がりと決定する方法は上記の例に限定されない。
さらに、例えば、低周波数信号の時間包絡形状を立ち下がりと決定する。例えば、復号信号のパワーまたはそれに準ずるパラメータを算出し、当該パラメータの時間方向の差分値を算出し、当該差分値の任意の時間セグメント内の最小値を算出する。当該最小値と所定の閾値とを比較して、時間包絡形状が立ち下がりか否かまたは立ち下がりの程度を決定する。復号数信号の時間包絡形状を立ち下がりと決定する方法は上記の例に限定されない。
上記の例は、音声復号部1bより、当該復号信号が時間領域の信号として出力されても適用でき、当該復号信号が複数のサブバンド信号として出力されても適用できる。
時間包絡修正部1dは、時間包絡形状決定部1cで決定した時間包絡形状に基づいて、音声復号部1bから出力される復号信号の時間包絡の形状を修正する(ステップS1-4)。
例えば、前記復号信号が複数のサブバンド信号で表される場合、時間包絡修正部1dは、任意の時間セグメント内の前記復号信号の複数のサブバンド信号Xdec(k,i) (0≦k<kh, t(l)≦i<t(l+1))に対して、所定の関数F(Xdec(k,i))を用いて以下の式(40)
Figure 2019144591

により得られるX’dec(k,i)を時間包絡形状が修正された復号信号のサブバンド信号として算出し,当該サブバンド信号より時間領域の信号を合成して出力する。
例えば、前記復号信号の時間包絡形状が平坦と決定された場合、以下の処理により、復号信号の時間包絡形状を修正できる。例えば、当該サブバンド信号Xdec(k,i)をBdec(m) (m=0,…,Mdec, Mdec≧1) (Bdec(0)≧0, Bdec(Mdec)<kh)で境界を表されるMdec個の周波数帯域に分割し、m番目の周波数帯域に含まれるサブバンド信号Xdec(k,i) (Bdec(m)≦k<Bdec(m+1), t(l)≦i<t(l+1))に対して、所定の関数F(Xdec(k,i))を、
Figure 2019144591

として、X’dec(k,i)を時間包絡形状が修正された復号信号のサブバンド信号として算出する。
また別の例によれば、所定の関数F(Xdec(k,i))をサブバンド信号Xdec(k,i)に対して平滑化フィルタ処理を施す
Figure 2019144591

(Nfilt≧1)で定義して、X’dec(k,i)を時間包絡形状が修正された復号信号のサブバンド信号として算出する。さらに、前記Bdec(m)を用いて境界が表される各周波数帯域内で、フィルタ処理前後のサブバンド信号のパワーをあわせるように処理できる。
また別の例によれば、サブバンド信号をXdec(k,i)を前記Bdec(m)を用いて境界が表される各周波数帯域内で周波数方向に線形予測して線形予測係数αp(m) (m=0,…,Mdec-1)を得て、所定の関数F(Xdec(k,i))をサブバンド信号Xdec(k,i)に対して線形予測逆フィルタ処理を施す
Figure 2019144591

(Npred≧1)で定義して、X’dec(k,i)を時間包絡形状が修正された復号信号のサブバンド信号として算出する。
上記の時間包絡形状を平坦に修正する処理の例は、それぞれを組み合わせて実施できる。
時間包絡修正部1dは、復号信号の時間包絡の形状を平坦に修正する処理を実施し、上記の例に限定されない。
さらには、例えば、前記復号信号の時間包絡形状が立ち上がりと決定された場合、以下の処理により、復号信号の時間包絡形状を修正できる。
例えば、所定の関数F(Xdec(k,i))をiに対して単調増加する関数incr(i)を用いて
Figure 2019144591

で定義して、X’dec(k,i)を時間包絡形状が修正された復号信号のサブバンド信号として算出する。さらに、前記Bdec(m)を用いて境界が表される各周波数帯域内で、時間包絡形状の修正前後のサブバンド信号のパワーをあわせるように処理できる。
時間包絡修正部1dは、復号信号の複数のサブバンド信号の時間包絡の形状を立ち上がりに修正する処理を実施し、上記の例に限定されない。
さらには、例えば、前記復号信号の時間包絡形状が立ち下がりと決定された場合、以下の処理により、復号信号の時間包絡形状を修正できる。
例えば、所定の関数F(Xdec(k,i))をiに対して単調減少する関数decr(i)を用いて
Figure 2019144591

で定義して、X’dec(k,i)を時間包絡形状が修正された低周波数信号のサブバンド信号として算出する。さらに、前記Bdec(m)を用いて境界が表される各周波数帯域内で、時間包絡形状の修正前後のサブバンド信号のパワーをあわせるように処理できる。
時間包絡修正部1dは、復号信号の複数のサブバンド信号の時間包絡の形状を立ち下がりに修正する処理を実施し、上記の例に限定されない。
例えば、前記復号信号が時間領域の信号で表される場合、時間包絡修正部1dは、任意の時間セグメント内の前記復号信号xdec(i) (t(l)≦i<t(l+1))に対して、所定の関数Ft(xdec(i))を用いて
Figure 2019144591

により得られるx’dec(i)を時間包絡形状が修正された復号信号として出力する。
例えば、前記復号信号の時間包絡形状が平坦と決定された場合、以下の処理により、復号信号の時間包絡形状を修正できる。
例えば、当該復号信号xdec(i)に対して、所定の関数Ft(xdec(i))を、
Figure 2019144591

として、x’dec(i)を時間包絡形状が修正された復号信号として出力する。
また別の例によれば、所定の関数Ft(xdec(i))を復号信号xdec(i)に対して平滑化フィルタ処理を施す
Figure 2019144591

(Nfilt≧1)で定義して、x’dec(i)を時間包絡形状が修正された復号信号として出力する。
上記の時間包絡形状を平坦に修正する処理の例は、それぞれを組み合わせて実施できる。
さらには、例えば、前記復号信号の時間包絡形状が立ち上がりと決定された場合、以下の処理により、復号信号の時間包絡形状を修正できる。
例えば、所定の関数Ft(xdec(i))を、iに対して単調増加する関数incr(i)を用いて
Figure 2019144591

で定義して、x’dec(i)を時間包絡形状が修正された復号信号として出力する。
時間包絡修正部1dは、復号信号の時間包絡の形状を立ち上がりに修正する処理を実施し、上記の例に限定されない。
さらには、例えば、前記復号信号の時間包絡形状が立ち下がりと決定された場合、以下の処理により、復号信号の時間包絡形状を修正できる。
例えば、所定の関数Ft(xdec(i))を、iに対して単調減少する関数decr(i)を用いて
Figure 2019144591

で定義して、x’dec(i)を時間包絡形状が修正された復号信号として出力する。時間包絡修正部1dは、復号信号の時間包絡の形状を立ち下がりに修正する処理を実施し、上記の例に限定されない。
例えば、前記復号信号が離散フーリエ変換,離散コサイン変換,修正離散コサイン変換に代表される時間周波数変換による周波数領域の変換係数Xdec(k) (0≦k<kh)で表されたときは、所定の関数Ff(Xdec(k))を用いて以下の式(51)
Figure 2019144591

により得られるX’dec(k)を時間包絡形状が修正された復号信号の周波数領域の変換係数として算出し、所定の周波数間変換により時間領域の信号に変換して出力する。
例えば、前記復号信号の時間包絡形状が平坦と決定された場合、以下の処理により、復号信号の時間包絡形状を修正できる。
Bdec(m) (m=0,…,Mdec, Mdec≧1) (Bdec(0)≧0, Bdec(Mdec)<kh)で境界を表されるMdec個の任意の周波数帯域Bdec(m)をにおいて、周波数方向に線形予測して線形予測係数αp(m) (m=0,…,Mdec-1)を得て、所定の関数Ff(Xdec(k))を、変換係数Xdec(k)に対して線形予測逆フィルタ処理を施す
Figure 2019144591

(Npred≧1)で定義して、X’dec(k,i)を時間包絡形状が修正された復号信号の変換係数として算出する。
時間包絡修正部1dは、復号信号の時間包絡の形状を平坦に修正する処理を実施し、上記の例に限定されない。
図67は、第10の実施形態に係る音声符号化装置2の構成を示す図である。音声符号化装置2の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置2は、図67に示すように、機能的には、音声符号化部2a、時間包絡情報符号化部2b、及び符号化系列多重化部2cを備える。
図68は、第10の実施形態に係る音声符号化装置2の動作を示すフローチャートである。
音声符号化部2aは、入力音声信号を符号化する(ステップS2-1)。
時間包絡情報符号化部2bは、入力音声信号、音声符号化部2aにおける入力音声信号の符号化結果を含む符号化過程で得られた情報のうち少なくとも一つ以上に基づき、時間包絡情報を算出し符号化する(ステップS2-2)。
例えば、任意の時間セグメントt(l)≦i<t(l+1))内の時間領域の信号である前記入力音声信号x(i)の時間包絡Et(i)を、当該時間セグメント内で正規化した復号信号のパワーとして算出できる。
Figure 2019144591

さらに、例えば、音声符号化部2aにおいて前記入力音声信号が複数のサブバンドの信号X(k,i)が算出される場合、入力音声信号の時間包絡として、任意の時間セグメントt(l)≦i<t(l+1))内でB(m) (m=0,…,M, M≧1) (B(0)≧0, B(M)<kh)で境界を表されるM個の周波数帯域に分割され、m番目の周波数帯域に含まれる当該入力音声信号のサブバンド信号X(k,i) (B(m)≦k<B(m+1), t(l)≦i<t(l+1))の時間包絡E(k,i)を、当該時間セグメント内で正規化した入力音声信号のサブバンド信号のパワーとして算出できる。
Figure 2019144591

入力音声信号の時間包絡は、入力音声信号の大きさの時間方向の変動がわかるパラメータであれば良く、前記の例に限定されない。
さらに、例えば、音声符号化部2aにおける前記入力音声信号の符号化結果に基づいて復号信号xdec(i)を算出し、任意の時間セグメントt(l)≦i<t(l+1))内の当該復号信号xdec(i)の時間包絡Edec,t(i)を、当該時間セグメント内で正規化した復号信号のパワーとして算出できる。
Figure 2019144591

さらに、例えば、音声符号化部2aにおける前記入力音声信号の符号化過程で、または符号化結果に基づいて復号信号のサブバンド信号Xdec(k,i)が算出される場合、復号信号の時間包絡として、任意の時間セグメントt(l)≦i<t(l+1))内でB(m) (m=0,…,M, M≧1) (B(0)≧0, B(M)<kh)で境界を表されるM個の周波数帯域に分割され、m番目の周波数帯域に含まれる当該入力音声信号のサブバンド信号Xdec(k,i) (B(m)≦k<B(m+1), t(l)≦i<t(l+1))の時間包絡Edec(k,i)を、当該時間セグメント内で正規化した入力音声信号のサブバンド信号のパワーとして算出できる。
Figure 2019144591

例えば、時間包絡情報符号化部2bは時間包絡情報として平坦の程度を表す情報を算出する。例えば、入力音声信号及び復号信号の時間包絡の分散またはそれに準ずるパラメータのうち少なくとも一つ以上を算出する。さらに別の例では、入力音声信号及び復号信号の時間包絡の相加平均と相乗平均の比またはそれに準ずるパラメータのうち少なくとも一つ以上を算出する。この場合、時間包絡情報符号化部2bは、時間包絡情報として当該入力音声信号の時間包絡の平坦さを表す情報を算出すればよく、前記の例に限定されない。そして、前記パラメータを符号化する。例えば、入力音声信号と復号信号の当該パラメータの差分値またはその絶対値を符号化する。さらに、例えば、入力音声信号の当該パラメータの値または絶対値のうち少なくとも一つ以上を符号化する。例えば、時間包絡の平坦さを平坦か否かで表現すれば1ビットで符号化でき、例えば、前記時間領域の入力音声信号については前記任意の時間セグメント内において1ビットで符号化でき、さらに例えば、前記入力音声信号のサブバンド信号の前記M個の周波数帯域毎に当該情報を符号化する際にはMビットで符号化できる。時間包絡情報の符号化方法は前記の例に限定されない。
さらに例えば、時間包絡情報符号化部2bは時間包絡情報として立ち上がりの程度を表す情報を算出する。例えば、任意の時間セグメントt(l)≦i<t(l+1)内において、入力音声信号の時間包絡の時間方向の差分値の最大値を算出する。
Figure 2019144591

さらには、これらの式において、時間包絡に代えて当該時間包絡を時間方向に平滑化したパラメータの時間方向の差分値の最大値を算出できる。
この場合、時間包絡情報符号化部2bは、時間包絡情報として当該入力音声信号の時間包絡の立ち上がりの程度を表す情報を算出すればよく、前記の例に限定されない。そして、前記パラメータを符号化する。例えば、入力音声信号と復号信号の当該パラメータの差分値またはその絶対値のうち少なくとも一つ以上を符号化する。例えば、時間包絡の立ち上がりを立ち上がりか否かで表現すれば1ビットで符号化でき、例えば、前記時間領域の入力音声信号については前記任意の時間セグメント内において1ビットで符号化でき、さらに例えば、前記入力音声信号のサブバンド信号の前記M個の周波数帯域毎に当該情報を符号化する際にはMビットで符号化できる。時間包絡情報の符号化方法は前記の例に限定されない。
さらに例えば、時間包絡情報符号化部2bは時間包絡情報として立ち下がりの程度を表す情報を算出する。例えば、任意の時間セグメントt(l)≦i<t(l+1)内において、入力音声信号の時間包絡の時間方向の差分値の最小値を算出する。
Figure 2019144591

さらには、これらの式において、時間包絡に代えて当該時間包絡を時間方向に平滑化したパラメータの時間方向の差分値の最小値を算出できる。この場合、時間包絡情報符号化部2bは、時間包絡情報として当該入力音声信号のサブバンド信号の時間包絡の立ち下がりの程度を表す情報を算出すればよく、前記の例に限定されない。そして、前記パラメータを符号化する。例えば、入力音声信号と復号信号の当該パラメータの差分値またはその絶対値のうち少なくとも一つ以上を符号化する。例えば、時間包絡の立ち下がりを立ち下がりか否かで表現すれば1ビットで符号化でき、例えば、前記時間領域の入力音声信号については前記任意の時間セグメント内において1ビットで符号化でき、さらに例えば、前記入力音声信号のサブバンド信号の前記M個の周波数帯域毎に当該情報を符号化する際にはMビットで符号化できる。時間包絡情報の符号化方法は前記の例に限定されない。
上記の例では、入力音声信号の時間包絡の代わりに、音声符号化部2aにおいて任意の時間セグメントt(l)≦i<t(l+1)内で当該時間セグメントよりも短い時間セグメントのパワーと相関のある符号化パラメータ(例えば、CELP符号化における符号帳の利得)を用いることができる。
符号化系列多重化部2cは、音声符号化部2aより入力音声信号の符号化系列を受け取り、時間包絡情報符号化部2bより符号化された時間包絡形状情報を受け取り、多重化して符号化系列として出力する(ステップS2-3)。
[第11の実施形態]
図69は、第11の実施形態に係る音声復号装置100の構成を示す図である。音声復号装置100の通信装置は、下記音声符号化装置200から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置100は、図69に示すように、機能的には、符号化系列逆多重化部100a、低周波数復号部100b、低周波数時間包絡形状決定部100c、低周波数時間包絡修正部100d、高周波数復号部100e、及び低周波数/高周波数信号合成部100fを備える。
図70は、第11の実施形態に係る音声復号装置の動作を示すフローチャートである。
符号化系列逆多重化部100aは、符号化系列を、低周波数信号を符号化した低周波数符号化部分と高周波数信号を符号化した高周波数符号化部分に分割する(ステップS100-1)。
低周波数復号部100bは、符号化系列逆多重化部100aにて分割された低周波数符号化部分を復号し、低周波数信号を得る(ステップS100-2)。
低周波数時間包絡形状決定部100cは、符号化系列逆多重化部100aで分割された低周波時間包絡形状に関する情報、及び低周波数復号部100bで得られた低周波数信号のうち少なくとも一つ以上に基づき、低周波数信号の時間包絡形状を決定する(ステップS100-3)。
例えば、低周波数信号の時間包絡形状を平坦と決定するケース、低周波数信号の時間包絡形状を立ち上がりと決定するケース、低周波数信号の時間包絡形状を立ち下がりと決定するケースが挙げられる。
低周波数信号の時間包絡形状の決定は、例えば、時間包絡形状決定部1cにおける復号信号の時間包絡形状の決定処理において、音声復号部1bで得られる復号信号を、低周波数復号部100bで得られた低周波数信号に置き換えることにより実現できる。
低周波数時間包絡修正部100dは、低周波数時間包絡形状決定部100cで決定した時間包絡形状に基づいて、低周波数復号部100bから出力される低周波数信号の時間包絡の形状を修正する(ステップS100-4)。
低周波数信号の時間包絡形状の修正は、例えば、時間包絡修正部1dにおける復号信号の時間包絡形状の修正処理において、音声復号部1bで得られる復号信号を、低周波数復号部100bで得られた低周波数信号に置き換えることにより実現できる。
高周波数復号部100eは、符号化系列逆多重化部100aにて分割された高周波数符号化部分を復号し、高周波数信号を得る(ステップS100-5)。
高周波数復号部100eでの高周波数信号の復号は、高周波数信号を時間領域の信号、サブバンド信号、及び周波数領域の信号のうち少なくとも一つ以上の領域の信号で符号化した符号化系列を復号する方法で実現できる。
さらには、例えば前記第1〜第9の実施形態の音声復号装置のように、低周波数復号部で得られた復号結果を利用して高周波数信号を生成する帯域拡張方式で、高周波数信号を生成できる。この際には、帯域拡張方式にて高周波数信号を生成するために必要な情報が符号化系列に含まれる場合、符号化系列のうち当該情報が含まれる部分が高周波数符号化部分となる。そして、符号化系列逆多重化部100aにて分割された当該高周波数符号化部分を復号して帯域拡張方式に必要な情報を得て、高周波数信号を生成する。一方、帯域拡張方式にて高周波数信号を生成するために必要な情報が符号化系列に含まれない場合、符号化系列逆多重化部100aより高周波数復号部100eに入力は無く、所定の処理または低周波数復号部で得られた復号結果を利用した処理によって高周波数信号を生成する。
低周波数/高周波数信号合成部100fは、低周波数時間包絡修正部100dで時間包絡形状を修正された低周波数信号と、高周波数復号部100eで得られた高周波数信号とを合成して低周波数成分および高周波数成分を含む音声信号を出力する(ステップS100-6)。
図71は、第11の実施形態に係る音声符号化装置200の構成を示す図である。音声符号化装置200の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置200は、図65に示すように、機能的には、低周波数符号化部200a、高周波数符号化部200b、低周波数時間包絡情報符号化部200c、及び符号化系列多重化部200dを備える。
図72は、第11の実施形態に係る音声符号化装置200の動作を示すフローチャートである。
低周波数符号化部200aは、入力音声信号の低周波数成分にあたる低周波数信号を符号化する(ステップS200-1)。
高周波数符号化部200bは、入力音声信号の高周波数成分にあたる高周波数信号を符号化する(ステップS200-2)。
低周波数時間包絡情報符号化部200cは、入力音声信号、低周波数符号化部200aにおける入力音声信号の符号化結果を含む符号化の過程で得られた情報のうち少なくとも一つ以上に基づき、低周波数時間包絡形状情報を算出し符号化する(ステップS200-3)。
低周波数時間包絡形状情報の算出、符号化処理は、例えば、時間包絡情報符号化部2bにおける入力音声信号の時間包絡情報の算出、符号化処理において、入力音声信号に代えて入力音声信号の低周波数信号を、復号信号に代えて低周波数符号化部200aにおける符号化結果を復号して得られる低周波数復号信号を用いることで、同様にして実現できる。
符号化系列多重化部200dは、低周波数符号化部200aより低周波数音声信号の符号化系列を受け取り、高周波数符号化部200bより高周波数音声信号の符号化系列を受け取り、低周波数時間包絡情報符号化部200cより符号化された低周波数時間包絡形状情報を受け取り、多重化して符号化系列として出力する(ステップS200-4)。
[第11の実施形態の音声復号装置の第1の変形例]
図73は、第11の実施形態に係る音声復号装置の第1の変形例100Aの構成を示す図である。
図74は、第11の実施形態に係る音声復号装置の第1の変形例100Aの動作を示すフローチャートである。
高周波数復号部100eAは、符号化系列逆多重化部100aにて分割された高周波数符号化部分を復号し、高周波数信号を得る(ステップS100-5A)。
高周波数復号部100eAでは、高周波数信号の復号において低周波数復号部で得られた低周波数復号信号を利用する際に、低周波数時間包絡修正部100dで時間包絡形状を修正された低周波数信号を利用する点が、高周波数復号部100eと異なる点である。
[第11の実施形態の音声復号装置の第2の変形例]
図75は、第11の実施形態に係る音声復号装置の第1の変形例100Aの構成を示す図である。
第11の実施形態の音声復号装置の第1の変形例との相違点は、低周波数/高周波数信号合成部100fに入力される低周波数信号が、低周波数時間包絡修正部100dからの出力ではなく、低周波数復号部100bからの出力である点である。
[第12の実施形態]
図76は、第12の実施形態に係る音声復号装置110の構成を示す図である。音声復号装置110の通信装置は、下記音声符号化装置210から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置110は、図76に示すように、機能的には、符号化系列逆多重化部110a、低周波数復号部100b、高周波数復号部100e、高周波数時間包絡形状決定部110b、高周波数時間包絡修正部110c、及び低周波数/高周波数信号合成部100fを備える。
図77は、第12の実施形態に係る音声復号装置の動作を示すフローチャートである。
符号化系列逆多重化部110aは、符号化系列を、低周波数符号化部分、高周波数符号化部分、高周波数時間包絡形状に関する情報に分割する(ステップS110-1)。
高周波数時間包絡形状決定部110bは、符号化系列逆多重化部110aで分割された高周波時間包絡形状に関する情報、高周波数復号部100eで得られた高周波数信号、及び低周波数復号部100bで得られた低周波数信号のうち少なくとも一つ以上に基づき、高周波数信号の時間包絡形状を決定する(ステップS110-2)。
例えば、高周波数信号の時間包絡形状を平坦と決定するケース、高周波数信号の時間包絡形状を立ち上がりと決定するケース、高周波数信号の時間包絡形状を立ち下がりと決定するケースが挙げられる。
高周波数信号の時間包絡形状の決定は、例えば、時間包絡形状決定部1cにおける復号信号の時間包絡形状の決定処理において、音声復号部1bで得られる復号信号を、高周波数復号部100eで得られた高周波数信号に置き換えることにより実現できる。また、同様に、音声復号部1bで得られる復号信号を、低周波数復号部100bで得られた低周波数信号に置き換えることにより実現できる。
高周波数時間包絡修正部110cは、高周波数時間包絡形状決定部110bで決定した時間包絡形状に基づいて、高周波数復号部110eから出力される高周波数信号の時間包絡の形状を修正する(ステップS110-3)。例えば、前記高周波数信号の時間包絡形状が平坦と決定された場合、以下の処理により、高周波数信号の時間包絡形状を修正できる。
高周波数信号の時間包絡形状の修正は、例えば、時間包絡修正部1dにおける復号信号の時間包絡形状の修正処理において、音声復号部1bで得られる復号信号を、高周波数復号部100eで得られた高周波数信号に置き換えることにより実現できる。
図78は、第12の実施形態に係る音声符号化装置210の構成を示す図である。音声符号化装置210の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置210は、図78に示すように、機能的には、低周波数符号化部200a、高周波数符号化部200b、高周波数時間包絡情報符号化部210a、及び符号化系列多重化部210bを備える。
図79は、第12の実施形態に係る音声符号化装置210の動作を示すフローチャートである。
高周波数時間包絡情報符号化部210aは、入力音声信号、低周波数符号化部200aにおける入力音声信号の符号化結果を含む符号化の過程で得られた情報、高周波数符号化部200bにおける入力音声信号の符号化結果を含む符号化の過程で得られた情報のうち少なくとも一つ以上に基づき、高周波数時間包絡形状情報を算出し符号化する(ステップS210-1)。
高周波数時間包絡形状情報の算出、符号化処理は、例えば、時間包絡情報符号化部2bにおける入力音声信号の時間包絡情報の算出、符号化処理において、入力音声信号に代えて入力音声信号の高周波数信号を、復号信号に代えて高周波数符号化部200bにおける符号化結果を復号して得られる高周波数復号信号を用いることで、同様にして実現できる。
符号化系列多重化部210bは、低周波数符号化部200aより低周波数音声信号の符号化系列を受け取り、高周波数符号化部200bより高周波数音声信号の符号化系列を受け取り、高周波数時間包絡情報符号化部210aより符号化された高周波数時間包絡形状情報を受け取り、多重化して符号化系列として出力する(ステップS210-2)。
[第13の実施形態]
図80は、第13の実施形態に係る音声復号装置120の構成を示す図である。音声復号装置120の通信装置は、下記音声符号化装置220から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置120は、図80に示すように、機能的には、符号化系列逆多重化部120a、低周波数復号部100b、低周波数時間包絡形状決定部100c、低周波数時間包絡修正部100d、高周波数復号部100e、高周波数時間包絡形状決定部120b、高周波数時間包絡修正部110c、及び低周波数/高周波数信号合成部100fを備える。
図81は、第13の実施形態に係る音声復号装置120の動作を示すフローチャートである。
符号化系列逆多重化部120aは、符号化系列を、低周波数符号化部分、高周波数符号化部分、低周波数時間包絡形状に関する情報、高周波数時間包絡形状に関する情報に分割する(ステップS120-1)。
この際、低周波数時間包絡形状に関する情報、及び高周波数時間包絡形状に関する情報の分割に関して、例えば、別々に符号化された低周波数時間包絡形状に関する情報、及び高周波数時間包絡形状に関する情報を含む符号化系列から分割することもでき、また組み合わせて符号化された周波数時間包絡形状に関する情報、及び高周波数時間包絡形状に関する情報を含む符号化系列から分割することもできる。さらには、例えば、当該低周波数時間包絡形状に関する情報、及び当該高周波数時間包絡形状に関する情報が単一の情報により表され符号化された当該情報を含む符号化系列から分割することもできる。
高周波数時間包絡形状決定部120bは、符号化系列逆多重化部120aで分割された高周波時間包絡形状に関する情報、低周波数復号部100bで得られた低周波数信号、及び低周波数時間包絡修正部100dで時間包絡形状を修正された低周波数信号のうち少なくとも一つ以上に基づき、高周波数信号の時間包絡形状を決定する(ステップS120-2)。
例えば、高周波数信号の時間包絡形状を平坦と決定するケース、高周波数信号の時間包絡形状を立ち上がりと決定するケース、高周波数信号の時間包絡形状を立ち下がりと決定するケースが挙げられる。
高周波数時間包絡形状決定部120bにおける高周波数時間包絡形状の決定処理において、低周波数時間包絡修正部100dで時間包絡形状を修正された低周波数信号に基づく場合は、時間包絡形状決定部1cにおける復号信号の時間包絡形状の決定処理において、音声復号部1bで得られる復号信号を、低周波数時間包絡修正部100dで時間包絡形状を修正された低周波数信号に置き換えることにより実現できる。
図82は、第13の実施形態に係る音声符号化装置220の構成を示す図である。音声符号化装置220の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置220は、図82に示すように、機能的には、低周波数符号化部200a、高周波数符号化部200b、低周波数時間包絡情報符号化部200c、高周波数時間包絡情報符号化部220a、及び符号化系列多重化部220bを備える。
図83は、第13の実施形態に係る音声符号化装置220の動作を示すフローチャートである。
高周波数時間包絡情報符号化部220aは、入力音声信号、低周波数符号化部200aにおける入力音声信号の符号化結果を含む符号化の過程で得られた情報、高周波数符号化部200bにおける入力音声信号の符号化結果を含む符号化の過程で得られた情報、低周波数時間包絡情報符号化部200cにおける低周波数時間包絡情報の符号化結果を含む符号化の過程で得られた情報のうち少なくとも一つ以上に基づき、高周波数時間包絡形状情報を算出し符号化する(ステップS220-1)。
高周波数時間包絡形状情報の算出、符号化処理は、例えば、高周波数時間包絡情報符号化部210aにおける高周波数信号の時間包絡情報の算出、符号化処理と同様にして実現できる。更には、例えば、低周波数時間包絡情報の符号化結果に基づいてもよい。例えば、低周波数時間包絡情報の符号化結果として低周波数時間包絡が平坦であるという結果が得られた場合にのみ、高周波数時間包絡情報として高周波数時間包絡が平坦であるか否かを符号化することができる。
符号化系列多重化部220bは、低周波数符号化部200aより低周波数音声信号の符号化系列を受け取り、高周波数符号化部200bより高周波数音声信号の符号化系列を受け取り、低周波数時間包絡情報符号化部200cより符号化された低周波数時間包絡形状情報を受け取り、高周波数時間包絡情報符号化部210aより符号化された高周波数時間包絡形状情報を受け取り、多重化して符号化系列として出力する(ステップS220-2)。
この際、低周波数時間包絡形状に関する情報、及び高周波数時間包絡形状に関する情報の符号化に関して、例えば、別々に符号化された低周波数時間包絡形状に関する情報、及び高周波数時間包絡形状に関する情報を受け取ることもでき、また組み合わせて符号化された周波数時間包絡形状に関する情報、及び高周波数時間包絡形状に関する情報を受け取ることもできる。さらには、例えば、単一の情報により表され符号化された当該低周波数時間包絡形状に関する情報、及び当該高周波数時間包絡形状に関する情報を受け取ることもできる。
[第13の実施形態の音声復号装置の第1の変形例]
図84は、第13の実施形態に係る音声復号装置の第1の変形例120Aの構成を示す図である。第13の実施形態の音声復号装置120との相違点は、高周波数復号部100eAにて、高周波数信号の復号に低周波数時間包絡修正部100dで時間包絡形状を修正された低周波数信号を利用する点である。
図85は、第13の実施形態に係る音声復号装置の第1の変形例120Aの動作を示すフローチャートである。図85のステップ100-5Aでは、高周波数信号の復号において低周波数復号部100bで得られた低周波数復号信号を利用する際に、低周波数時間包絡修正部100dで時間包絡形状を修正された低周波数信号を利用する。
[第13の実施形態の音声復号装置の第2の変形例]
図86は、第13の実施形態に係る音声復号装置の第2の変形例120Bの構成を示す図である。第13の実施形態の音声復号装置の第1の変形例との相違点は、低周波数/高周波数信号合成部100fに入力される低周波数信号が、低周波数時間包絡修正部100dからの出力ではなく、低周波数復号部100bからの出力である点である。
図87は、第13の実施形態に係る音声復号装置の第2の変形例120Bの動作を示すフローチャートである。図87のステップS100-6では、低周波数復号部100bからの低周波数信号と高周波数時間包絡修正部110cからの高周波数信号とが合成される。
[第13の実施形態の音声復号装置の第3の変形例]
図185は、第13の実施形態に係る音声復号装置の第3の変形例120Cの構成を示す図である。
図186は、第13の実施形態に係る音声復号装置の第3の変形例120Cの動作を示すフローチャートである。
本変形例と前記第13の実施形態に係る音声復号装置120との相違点は、低周波数時間包絡形状決定部100c、高周波数時間包絡修正部110cにかえて、低周波数時間包絡形状決定部120c、高周波数時間包絡修正部120dを具備する点である。
本変形例においては、低周波数時間包絡形状決定部120cと前記低周波数時間包絡形状決定部100cとの相違点は、決定した時間包絡形状を高周波数時間包絡修正部120dへも通知する点である。
高周波数時間包絡修正部120dと前記高周波数時間包絡修正部110cとの相違点は、高周波数時間包絡形状決定部120bにて決定された時間包絡形状と低周波数時間包絡形状決定部120cで決定された時間包絡形状のうち少なくとも一つ以上に基づいて、高周波数復号部100eから出力される高周波数信号の時間包絡の形状を修正する点である(S120-3)。
例えば、低周波数時間包絡形状決定部120cにて時間包絡形状が平坦であると決定された場合には、高周波数時間包絡形状決定部120bにて決定される時間包絡形状によらず、高周波数復号部100eから出力される高周波数信号の時間包絡の形状を平坦に修正する。更に例えば、低周波数時間包絡形状決定部120cにて時間包絡形状が平坦でないと決定された場合には、高周波数時間包絡形状決定部120bにて決定される時間包絡形状によらず、高周波数復号部100eから出力される高周波数信号の時間包絡の形状を平坦に修正しない。立ち上がり、立ち下がりの場合も同様であり、時間包絡形状は限定されない。
[第13の実施形態の音声復号装置の第4の変形例]
図187は、第13の実施形態に係る音声復号装置の第4の変形例120Dの構成を示す図である。
図188は、第13の実施形態に係る音声復号装置の第4の変形例120Dの動作を示すフローチャートである。
本変形例と前記第13の実施形態に係る音声復号装置120との相違点は、高周波数時間包絡形状決定部120b、低周波数時間包絡修正部100dにかえて、高周波数時間包絡形状決定部120bA、低周波数時間包絡修正部120eを具備する点である。
本変形例においては、高周波数時間包絡形状決定部120bAと前記高周波数時間包絡形状決定部120bとの相違点は、決定した時間包絡形状を低周波数時間包絡修正部120eへも通知する点である。
高周波数時間包絡形状決定部120bAにおける時間包絡形状の決定は、前記の例に加えて、例えば、前記低周波数信号の周波数パワー分布に基づくこともできる。更には、例えば符号化系列逆多重化部120aから得られる高周波数信号の復号の際のフレーム長を用いることができる。例えば、フレーム長が長い場合は平坦である、フレーム長が短い場合は立ち上がりまたは立ち下がりであると決定でき、前記高周波数時間包絡形状決定部120bでも同様に決定できる。
低周波数時間包絡修正部120eと前記低周波数時間包絡修正部100dとの相違点は、低周波数時間包絡形状決定部100cにて決定された時間包絡形状と高周波数時間包絡形状決定部120bAで決定された時間包絡形状のうち少なくとも一つ以上に基づいて、低周波数復号部100bから出力される低周波数信号の時間包絡の形状を修正する点である(S120-4)。
例えば、高周波数時間包絡形状決定部120bAにて時間包絡形状が平坦であると決定された場合には、低周波数時間包絡形状決定部100cにて決定される時間包絡形状によらず、低周波数復号部100bから出力される低周波数信号の時間包絡の形状を平坦に修正する。更に例えば、高周波数時間包絡形状決定部120bAにて時間包絡形状が平坦であると決定された場合には、低周波数時間包絡形状決定部100cにて決定される時間包絡形状によらず、低周波数復号部100bから出力される低周波数信号の時間包絡の形状を平坦に修正しない。立ち上がり、立ち下がりの場合も同様であり、時間包絡形状は限定されない。
[第13の実施形態の音声復号装置の第5の変形例]
図189は、第13の実施形態に係る音声復号装置の第5の変形例120Eの構成を示す図である。
図190は、第13の実施形態に係る音声復号装置の第5の変形例120Eの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部120c、前記高周波数時間包絡修正部120d、前記高周波数時間包絡形状決定部120bA、及び前記低周波数時間包絡修正部120eを具備する。
[第13の実施形態の音声復号装置の第6の変形例]
図191は、第13の実施形態に係る音声復号装置の第6の変形例120Fの構成を示す図である。
図192は、第13の実施形態に係る音声復号装置の第6の変形例120Fの動作を示すフローチャートである。
本変形例と前記第13の実施形態に係る音声復号装置120との相違点は、低周波数時間包絡形状決定部100c及び高周波数時間包絡形状決定部120bにかえて時間包絡形状決定部120fを具備する点である。
時間包絡形状決定部120fは、符号化系列逆多重化部120aからの低周波数時間包絡形状に関する情報、高周波数時間包絡形状に関する情報、低周波数復号部100bからの低周波数信号、高周波数復号部100eからの高周波数信号のうち少なくとも一つ以上に基づいて時間包絡形状を決定する(S120-5)。決定した時間包絡形状は、低周波数時間包絡修正部100d、高周波数時間包絡修正部110cに通知される。
例えば、時間包絡形状として平坦と決定する。さらに例えば、時間包絡形状として立ち上がりと決定する。さらに例えば、時間包絡形状として立下りと決定する。決定される時間包絡形状は、上記の例に限定されない。
時間包絡形状決定部120fでは、例えば、前記低周波数時間包絡形状決定部100c、及び120c、前記高周波数時間包絡形状決定部120b、及び120bAと同様に時間包絡形状を決定できる。時間包絡形状の決定方法は上記の例に限定されない。
[第13の実施形態の音声復号装置の第7の変形例]
図193は、第13の実施形態に係る音声復号装置の第7の変形例120Gの構成を示す図である。
図194は、第13の実施形態に係る音声復号装置の第7の変形例120Gの動作を示すフローチャートである。
本変形例と前記第13の実施形態に係る音声復号装置の第1の変形例120Aとの相違点は、低周波数時間包絡形状決定部100c、高周波数時間包絡修正部110cにかえて、低周波数時間包絡形状決定部120c、高周波数時間包絡修正部120dを具備する点である。
[第13の実施形態の音声復号装置の第8の変形例]
図195は、第13の実施形態に係る音声復号装置の第8の変形例120Hの構成を示す図である。
図196は、第13の実施形態に係る音声復号装置の第8の変形例120Hの動作を示すフローチャートである。
本変形例と前記第13の実施形態に係る音声復号装置の第1の変形例120Aとの相違点は、高周波数時間包絡形状決定部120b、低周波数時間包絡修正部100dにかえて、高周波数時間包絡形状決定部120bA、低周波数時間包絡修正部120eを具備する点である。
[第13の実施形態の音声復号装置の第9の変形例]
図197は、第13の実施形態に係る音声復号装置の第9の変形例120Iの構成を示す図である。
図198は、第13の実施形態に係る音声復号装置の第9の変形例120Iの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部120c、前記高周波数時間包絡修正部120d、前記高周波数時間包絡形状決定部120bA、及び前記低周波数時間包絡修正部120eを具備する。
[第13の実施形態の音声復号装置の第10の変形例]
図199は、第13の実施形態に係る音声復号装置の第10の変形例120Jの構成を示す図である。
図200は、第13の実施形態に係る音声復号装置の第10の変形例120Jの動作を示すフローチャートである。
本変形例と前記第13の実施形態に係る音声復号装置の第1の変形例120Aとの相違点は、低周波数時間包絡形状決定部100c及び高周波数時間包絡形状決定部120bにかえて時間包絡形状決定部120fを具備する点である。
[第13の実施形態の音声復号装置の第11の変形例]
図201は、第13の実施形態に係る音声復号装置の第11の変形例120Kの構成を示す図である。
図202は、第13の実施形態に係る音声復号装置の第11の変形例120Kの動作を示すフローチャートである。
本変形例と前記第13の実施形態に係る音声復号装置の第2の変形例120Bとの相違点は、低周波数時間包絡形状決定部100c、高周波数時間包絡修正部110cにかえて、低周波数時間包絡形状決定部120c、高周波数時間包絡修正部120dを具備する点である。
[第13の実施形態の音声復号装置の第12の変形例]
図203は、第13の実施形態に係る音声復号装置の第12の変形例120Lの構成を示す図である。
図204は、第13の実施形態に係る音声復号装置の第12の変形例120Lの動作を示すフローチャートである。
本変形例と前記第13の実施形態に係る音声復号装置の第2の変形例120Bとの相違点は、高周波数時間包絡形状決定部120b、低周波数時間包絡修正部100dにかえて、高周波数時間包絡形状決定部120bA、低周波数時間包絡修正部120eを具備する点である。
[第13の実施形態の音声復号装置の第13の変形例]
図205は、第13の実施形態に係る音声復号装置の第13の変形例120Mの構成を示す図である。
図206は、第13の実施形態に係る音声復号装置の第13の変形例120Mの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部120c、前記高周波数時間包絡修正部120d、前記高周波数時間包絡形状決定部120bA、及び前記低周波数時間包絡修正部120eを具備する。
[第13の実施形態の音声復号装置の第14の変形例]
図207は、第13の実施形態に係る音声復号装置の第14の変形例120Nの構成を示す図である。
図208は、第13の実施形態に係る音声復号装置の第14の変形例120Nの動作を示すフローチャートである。
本変形例と前記第13の実施形態に係る音声復号装置の第2の変形例120Bとの相違点は、低周波数時間包絡形状決定部100c及び高周波数時間包絡形状決定部120bにかえて時間包絡形状決定部120fを具備する点である。
[第14の実施形態]
図88は、第14の実施形態に係る音声復号装置130の構成を示す図である。音声復号装置130の通信装置は、下記音声符号化装置230から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置130は、図88に示すように、機能的には、符号化系列逆多重化部110a、低周波数復号部100b、高周波数時間包絡形状決定部110b、高周波数時間包絡修正部130a、高周波数復号部130b、及び低周波数/高周波数信号合成部100fを備える。
図89は、第13の実施形態に係る音声復号装置の動作を示すフローチャートである。
高周波数時間包絡修正部130aは、高周波数時間包絡形状決定部110bで決定した時間包絡形状に基づいて、高周波数復号部130bに入力される低周波数信号の時間包絡の形状を修正する(ステップS130-1)。高周波数時間包絡修正部130aにおける時間包絡形状の修正は、例えば、時間包絡修正部1dにおける復号信号の時間包絡形状の修正処理において、音声復号部1bで得られる復号信号を、低周波数復号部100bで得られた低周波数信号に置き換えることにより実現できる。
高周波数復号部130bは、符号化系列逆多重化部100aにて分割された高周波数符号化部分を復号し、高周波数信号を得る(ステップS130-2)。
高周波数復号部130bでは、高周波数信号の復号において低周波数復号部で得られた低周波数復号信号を利用する際に、高周波数時間包絡修正部130aで時間包絡形状を修正された低周波数信号を利用する点が高周波数復号部100eと異なる点である。
図90は、第14の実施形態に係る音声符号化装置230の構成を示す図である。音声符号化装置230の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置230は、図90に示すように、機能的には、低周波数符号化部200a、高周波数符号化部200b、高周波数時間包絡情報符号化部230a、及び符号化系列多重化部210bを備える。
図91は、第14の実施形態に係る音声符号化装置230の動作を示すフローチャートである。
高周波数時間包絡情報符号化部230aは、入力音声信号、低周波数符号化部200aにおける入力音声信号の符号化結果を含む符号化の過程で得られた情報、高周波数符号化部200bにおける入力音声信号の符号化結果を含む符号化の過程で得られた情報のうち少なくとも一つ以上に基づき、高周波数時間包絡形状情報を算出し符号化する(ステップS230-1)。
高周波数時間包絡形状情報の算出、符号化処理は、例えば、低周波数時間包絡情報符号化部200cにおける低周波数信号の時間包絡情報の算出、符号化処理と同様にして実現できる。ただし、高周波数時間包絡形状情報の算出、符号化処理は、高周波数符号化部200bにおける入力音声信号の符号化結果を含む符号化の過程で得られた情報をも用いることができる点で、入力音声信号の低周波数復号信号を用いる低周波数信号の時間包絡情報の算出、符号化処理とは異なる。
[第15の実施形態]
図92は、第15の実施形態に係る音声復号装置140の構成を示す図である。音声復号装置140の通信装置は、下記音声符号化装置240から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置140は、図92に示すように、機能的には、符号化系列逆多重化部120a、低周波数復号部100b、低周波数時間包絡形状決定部100c、低周波数時間包絡修正部100d、高周波数時間包絡形状決定部120b、高周波数時間包絡修正部130a、高周波数復号部130b、及び低周波数/高周波数信号合成部100fを備える。
図93は、第15の実施形態に係る音声復号装置の動作を示すフローチャートである。符号化系列逆多重化部120a及び高周波数時間包絡形状決定部120bは、第13の実施形態における符号化系列逆多重化部120a及び高周波数時間包絡形状決定部120bと同様の動作を行う(ステップS120-1、S120-2)。高周波数時間包絡修正部130a及び高周波数復号部130bは、第14の実施形態における高周波数時間包絡修正部130a及び高周波数復号部130bと同様の動作を行う(ステップS130-1、S130-2)。
図94は、第15の実施形態に係る音声符号化装置240の構成を示す図である。音声符号化装置240の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置240は、図94に示すように、機能的には、低周波数符号化部200a、高周波数符号化部200b、低周波数時間包絡情報符号化部200c、高周波数時間包絡情報符号化部220a、及び符号化系列多重化部220bを備える。
図95は、第15の実施形態に係る音声符号化装置240の動作を示すフローチャートである。
[第15の実施形態の音声復号装置の第1の変形例]
図96は、第15の実施形態に係る音声復号装置の第1の変形例140Aの構成を示す図である。
図97は、第15の実施形態に係る音声復号装置の第1の変形例140Aの動作を示すフローチャートである。
高周波数時間包絡修正部140aは、高周波数時間包絡形状決定部120bで決定した時間包絡形状に基づいて、低周波数時間包絡修正部100dにて時間包絡形状を修正された低周波数信号の時間包絡の形状を修正する(ステップS140-1)。高周波数時間包絡修正部130aとの相違点は、入力信号が低周波数時間包絡修正部100dにて時間包絡形状を修正された低周波数信号である点である。
[第15の実施形態の音声復号装置の第2の変形例]
図98は、第15の実施形態に係る音声復号装置の第2の変形例140Bの構成を示す図である。
当該実施形態の音声復号装置の第1の変形例との相違点は、低周波数/高周波数信号合成部100fでの合成処理に用いられる低周波数信号が、低周波数時間包絡修正部100dで時間包絡形状を修正された低周波数信号に代えて、低周波数復号部100bで復号された低周波数信号である点である。
[第15の実施形態の音声復号装置の第3の変形例]
図209は、第15の実施形態に係る音声復号装置の第3の変形例140Cの構成を示す図である。
図210は、第15の実施形態に係る音声復号装置の第3の変形例140Cの動作を示すフローチャートである。
本変形例と前記第15の実施形態に係る音声復号装置140との相違点は、低周波数時間包絡形状決定部100c、高周波数時間包絡修正部130aにかえて、低周波数時間包絡形状決定部120c、高周波数時間包絡修正部140bを具備する点である。
高周波数時間包絡修正部140bと前記高周波数時間包絡修正部130aとの相違点は、高周波数時間包絡形状決定部120bにて決定された時間包絡形状と低周波数時間包絡形状決定部120cで決定された時間包絡形状のうち少なくとも一つ以上に基づいて、高周波数復号部130bへ入力される低周波数信号の時間包絡の形状を修正する点である(S140-2)。
例えば、低周波数時間包絡形状決定部120cにて時間包絡形状が平坦であると決定された場合には、高周波数時間包絡形状決定部120bにて決定される時間包絡形状によらず、高周波数復号部130bへ入力される低周波数信号の時間包絡の形状を平坦に修正する。更に例えば、低周波数時間包絡形状決定部120cにて時間包絡形状が平坦でないと決定された場合には、高周波数時間包絡形状決定部120bにて決定される時間包絡形状によらず、高周波数復号部130bへ入力される低周波数信号の時間包絡の形状を平坦に修正しない。立ち上がり、立ち下がりの場合も同様であり、時間包絡形状は限定されない。
[第15の実施形態の音声復号装置の第4の変形例]
図211は、第15の実施形態に係る音声復号装置の第4の変形例140Dの構成を示す図である。
図212は、第15の実施形態に係る音声復号装置の第4の変形例140Dの動作を示すフローチャートである。
本変形例と前記第15の実施形態に係る音声復号装置140との相違点は、高周波数時間包絡形状決定部120b、低周波数時間包絡修正部100dにかえて、高周波数時間包絡形状決定部120bA、低周波数時間包絡修正部120eを具備する点である。
[第15の実施形態の音声復号装置の第5の変形例]
図213は、第15の実施形態に係る音声復号装置の第5の変形例140Eの構成を示す図である。
図214は、第15の実施形態に係る音声復号装置の第5の変形例140Eの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部120c、前記高周波数時間包絡修正部140b、前記高周波数時間包絡形状決定部120bA、及び前記低周波数時間包絡修正部120eを具備する。
[第15の実施形態の音声復号装置の第6の変形例]
図215は、第15の実施形態に係る音声復号装置の第6の変形例140Fの構成を示す図である。
図216は、第15の実施形態に係る音声復号装置の第6の変形例140Fの動作を示すフローチャートである。
本変形例と前記第15の実施形態に係る音声復号装置140との相違点は、低周波数時間包絡形状決定部100c及び高周波数時間包絡形状決定部120bにかえて時間包絡形状決定部120fを具備する点である。
[第15の実施形態の音声復号装置の第7の変形例]
図217は、第15の実施形態に係る音声復号装置の第7の変形例140Gの構成を示す図である。
図218は、第15の実施形態に係る音声復号装置の第7の変形例140Gの動作を示すフローチャートである。
本変形例と前記第15の実施形態に係る音声復号装置の第1の変形例140Aとの相違点は、低周波数時間包絡形状決定部100c、高周波数時間包絡修正部140aにかえて、低周波数時間包絡形状決定部120c、高周波数時間包絡修正部140bを具備する点である。
本変形例においては、高周波数時間包絡修正部140bは、高周波数時間包絡形状決定部120bにて決定された時間包絡形状と低周波数時間包絡形状決定部120cで決定された時間包絡形状のうち少なくとも一つ以上に基づいて、高周波数復号部130bへ入力される時間包絡形状を修正された低周波数信号の時間包絡の形状を修正する(S140-2)。
[第15の実施形態の音声復号装置の第8の変形例]
図219は、第15の実施形態に係る音声復号装置の第8の変形例140Hの構成を示す図である。
図220は、第15の実施形態に係る音声復号装置の第8の変形例140Hの動作を示すフローチャートである。
本変形例と前記第15の実施形態に係る音声復号装置の第1の変形例140Aとの相違点は、高周波数時間包絡形状決定部120b、低周波数時間包絡修正部100dにかえて、高周波数時間包絡形状決定部120bA、低周波数時間包絡修正部120eを具備する点である。
[第15の実施形態の音声復号装置の第9の変形例]
図221は、第15の実施形態に係る音声復号装置の第9の変形例140Iの構成を示す図である。
図222は、第15の実施形態に係る音声復号装置の第9の変形例140Iの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部120c、前記高周波数時間包絡修正部140b、前記高周波数時間包絡形状決定部120bA、及び前記低周波数時間包絡修正部120eを具備する。
[第15の実施形態の音声復号装置の第10の変形例]
図223は、第15の実施形態に係る音声復号装置の第10の変形例140Jの構成を示す図である。
図224は、第15の実施形態に係る音声復号装置の第10の変形例140Jの動作を示すフローチャートである。
本変形例と前記第15の実施形態に係る音声復号装置の第1の変形例140Aとの相違点は、低周波数時間包絡形状決定部100c及び高周波数時間包絡形状決定部120bにかえて時間包絡形状決定部120fを具備する点である。
[第15の実施形態の音声復号装置の第11の変形例]
図225は、第15の実施形態に係る音声復号装置の第11の変形例140Kの構成を示す図である。
図226は、第15の実施形態に係る音声復号装置の第11の変形例140Kの動作を示すフローチャートである。
本変形例と前記第15の実施形態に係る音声復号装置の第2の変形例140Bとの相違点は、低周波数時間包絡形状決定部100c、高周波数時間包絡修正部140aにかえて、低周波数時間包絡形状決定部120c、高周波数時間包絡修正部140bを具備する点である。
[第15の実施形態の音声復号装置の第12の変形例]
図227は、第15の実施形態に係る音声復号装置の第12の変形例140Lの構成を示す図である。
図228は、第15の実施形態に係る音声復号装置の第12の変形例140Lの動作を示すフローチャートである。
本変形例と前記第15の実施形態に係る音声復号装置の第2の変形例140Bとの相違点は、高周波数時間包絡形状決定部120b、低周波数時間包絡修正部100dにかえて、高周波数時間包絡形状決定部120bA、低周波数時間包絡修正部120eを具備する点である。
[第15の実施形態の音声復号装置の第13の変形例]
図229は、第15の実施形態に係る音声復号装置の第13の変形例140Mの構成を示す図である。
図230は、第15の実施形態に係る音声復号装置の第13の変形例140Mの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部120c、前記高周波数時間包絡修正部140b、前記高周波数時間包絡形状決定部120bA、及び前記低周波数時間包絡修正部120eを具備する。
[第15の実施形態の音声復号装置の第14の変形例]
図231は、第15の実施形態に係る音声復号装置の第14の変形例140Nの構成を示す図である。
図232は、第15の実施形態に係る音声復号装置の第14の変形例140Nの動作を示すフローチャートである。
本変形例と前記第15の実施形態に係る音声復号装置の第2の変形例140Bとの相違点は、低周波数時間包絡形状決定部100c及び高周波数時間包絡形状決定部120bにかえて時間包絡形状決定部120fを具備する点である。
[第16の実施形態]
図99は、第16の実施形態に係る音声復号装置150の構成を示す図である。音声復号装置150の通信装置は、下記音声符号化装置250から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置150は、図99に示すように、機能的には、符号化系列逆多重化部150a、スイッチ群150b,低周波数復号部100b、低周波数時間包絡形状決定部100c、低周波数時間包絡修正部100d、高周波数復号部100e、高周波数時間包絡形状決定部120b、高周波数時間包絡修正部110c、及び低周波数/高周波数信号合成部150cを備える。
図100は、第16の実施形態に係る音声復号装置の動作を示すフローチャートである。
符号化系列逆多重化部150aは、符号化系列を、高周波数信号生成制御情報、低周波数符号化部分、時間包絡形状に関する情報に分割する(ステップS150-1)。
符号化系列逆多重化部150aで得られた高周波数信号生成制御情報に基づき、高周波数信号を生成するか否かを判断する(ステップS150-2)。
高周波数信号を生成する場合、符号化系列逆多重化部150aは、符号化系列から高周波数符号化部分を抽出する(ステップS150-3)。そして、当該符号化系列の高周波数符号化部分を用いて高周波数信号を生成し、さらに高周波数信号の時間包絡形状を決定して、高周波数信号の時間包絡形状を修正する。
なお、ステップS150-2およびS150-3の処理を行う順番については、高周波数時間包絡形状の決定及び高周波数符号化部分を復号の処理の前であればよく、図100のフローチャートの順番に制限されない。
低周波数/高周波数信号合成部150cは、前記高周波数信号生成情報に基づき高周波数信号を生成すると判断された場合、時間包絡形状を修正された低周波数信号と時間包絡形状を修正された高周波数信号から出力音声信号を合成し、前記高周波数信号生成情報に基づき高周波数信号を生成しないと判断された場合、時間包絡形状を修正された低周波数信号から出力音声信号を合成する(ステップS150-4)。ただし、高周波数信号を生成しないと判断された場合で、時間包絡形状を修正された低周波数信号が出力できる状態で低周波数/高周波数信号合成部150cに入力された場合、入力された低周波数信号をそのまま出力することもできる。
図101は、第16の実施形態に係る音声符号化装置250の構成を示す図である。音声符号化装置250の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置250は、図101に示すように、機能的には、高周波数信号生成制御情報符号化部250a、低周波数符号化部200a、高周波数符号化部200b、低周波数時間包絡情報符号化部200c、高周波数時間包絡情報符号化部220a、及び符号化系列多重化部250bを備える。
図102は、第16の実施形態に係る音声符号化装置250の動作を示すフローチャートである。
高周波数信号生成制御情報符号化部250aは、入力音声信号、高周波数信号生成制御指示信号のうち少なくとも一つに基づいて高周波数信号を生成するか否かを決定し、高周波数信号生成制御情報を符号化する(ステップS250-1)。例えば、入力音声信号が高周波数符号化部200bにて符号化する周波数帯域の信号を含む場合は、高周波数信号を生成すると決定することができる。さらに例えば、高周波数信号生成制御指示信号により高周波数信号を生成することを指示された場合は、高周波数信号を生成すると決定することができる。さらに例えば、前記2つの方法を組み合わせることもでき、例えば前記2つの方法のうち少なくとも一つの方法にて高周波数信号を生成すると判断した場合には、高周波数信号を生成すると決定できる。
高周波数信号生成制御情報は、例えば高周波数信号を生成するか否かを1ビットで表すことで符号化できる。
ただし、高周波数信号を生成するか否かの決定、及び高周波数信号生成制御情報の符号化方法は限定されない。
高周波数信号生成制御情報符号化部250aにて高周波数信号を生成すると決定した場合は、高周波数符号化部200bにて入力音声信号の高周波数成分にあたる高周波数信号を符号化し、高周波数時間包絡情報符号化部220aにて高周波数時間包絡形状情報を算出し符号化する。一方、高周波数信号生成制御情報符号化部250aにて高周波数信号を生成しないと判断した場合、前記高周波数信号の符号化及び高周波数時間包絡形状情報の算出、符号化は実施されない(ステップS250-2)。
符号化系列多重化部250cは、高周波数信号生成制御情報符号化部250aより符号化された高周波数信号生成制御情報を受け取り、低周波数符号化部200aより低周波数音声信号の符号化系列を受け取り、低周波数時間包絡情報符号化部200cより符号化された低周波数時間包絡形状情報を受け取り、これらに加えて高周波数信号生成制御情報符号化部250aにて高周波数信号を生成すると決定した場合には、高周波数符号化部200bより高周波数音声信号の符号化系列を、高周波数時間包絡情報符号化部210aより符号化された高周波数時間包絡形状情報を受け取り、多重化して符号化系列として出力する(ステップS250-3)。
高周波数信号生成制御情報符号化部250aにて高周波数信号を生成すると決定した場合には、低周波数時間包絡形状に関する情報、及び高周波数時間包絡形状に関する情報の符号化に関して、例えば、別々に符号化された低周波数時間包絡形状に関する情報、及び高周波数時間包絡形状に関する情報を受け取ることもでき、また低周波数時間包絡形状に関する情報、及び高周波数時間包絡形状に関する情報を組み合わせて符号化された形式で受け取ることもできる。さらには、例えば、単一の情報により表され符号化された当該低周波数時間包絡形状に関する情報、及び当該高周波数時間包絡形状に関する情報を受け取ることもできる。
[第16の実施形態の音声復号装置の第1の変形例]
図103は、第16の実施形態に係る音声復号装置の第1の変形例150Aの構成を示す図である。
図104は、第16の実施形態に係る音声復号装置の第1の変形例150Aの動作を示すフローチャートである。第16の実施形態の音声復号装置150との相違点は、高周波数復号部100eAにて、高周波数信号の復号に低周波数時間包絡修正部100dで時間包絡形状を修正された低周波数信号を利用する点である。図104のステップ100-5Aでは、高周波数信号の復号において低周波数復号部100bで得られた低周波数復号信号を利用する際に、低周波数時間包絡修正部100dで時間包絡形状を修正された低周波数信号を利用する。
なお、ステップS150-2およびS150-3の処理を行う順番については、高周波数時間包絡形状の決定及び高周波数符号化部分を復号の処理の前であればよく、図104のフローチャートの順番に制限されない。
[第16の実施形態の音声復号装置の第2の変形例]
図105は、第16の実施形態に係る音声復号装置の第2の変形例150Bの構成を示す図である。第16の実施形態の音声復号装置の第1の変形例との相違点は、低周波数/高周波数信号合成部150cに入力される低周波数信号が、低周波数時間包絡修正部100dからの出力ではなく、低周波数復号部100bからの出力である点である。
[第16の実施形態の音声復号装置の第3の変形例]
図233は、第16の実施形態に係る音声復号装置の第3の変形例150Cの構成を示す図である。
図234は、第16の実施形態に係る音声復号装置の第3の変形例150Cの動作を示すフローチャートである。
本変形例と前記第16の実施形態に係る音声復号装置150との相違点は、低周波数時間包絡形状決定部100c、高周波数時間包絡修正部110cにかえて、低周波数時間包絡形状決定部120c、高周波数時間包絡修正部120dを具備する点である。
[第16の実施形態の音声復号装置の第4の変形例]
図235は、第16の実施形態に係る音声復号装置の第4の変形例150Dの構成を示す図である。
図236は、第16の実施形態に係る音声復号装置の第4の変形例150Dの動作を示すフローチャートである。
本変形例と前記第16の実施形態に係る音声復号装置150との相違点は、高周波数時間包絡形状決定部120b、低周波数時間包絡修正部100dにかえて、高周波数時間包絡形状決定部120bA、低周波数時間包絡修正部120eを具備する点である。
[第16の実施形態の音声復号装置の第5の変形例]
図237は、第16の実施形態に係る音声復号装置の第5の変形例150Eの構成を示す図である。
図238は、第16の実施形態に係る音声復号装置の第5の変形例150Eの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部120c、前記高周波数時間包絡修正部120d、前記高周波数時間包絡形状決定部120bA、及び前記低周波数時間包絡修正部120eを具備する。
[第16の実施形態の音声復号装置の第6の変形例]
図239は、第16の実施形態に係る音声復号装置の第6の変形例150Fの構成を示す図である。
図240は、第16の実施形態に係る音声復号装置の第6の変形例150Fの動作を示すフローチャートである。
本変形例と前記第16の実施形態に係る音声復号装置150との相違点は、低周波数時間包絡形状決定部100c及び高周波数時間包絡形状決定部120bにかえて時間包絡形状決定部120fを具備する点である。
[第16の実施形態の音声復号装置の第7の変形例]
図241は、第16の実施形態に係る音声復号装置の第7の変形例150Gの構成を示す図である。
図242は、第16の実施形態に係る音声復号装置の第7の変形例150Gの動作を示すフローチャートである。
本変形例と前記第16の実施形態に係る音声復号装置の第1の変形例150Aとの相違点は、低周波数時間包絡形状決定部100c、高周波数時間包絡修正部110cにかえて、低周波数時間包絡形状決定部120c、高周波数時間包絡修正部120dを具備する点である。
[第16の実施形態の音声復号装置の第8の変形例]
図243は、第16の実施形態に係る音声復号装置の第8の変形例150Hの構成を示す図である。
図244は、第16の実施形態に係る音声復号装置の第8の変形例150Hの動作を示すフローチャートである。
本変形例と前記第16の実施形態に係る音声復号装置の第1の変形例150Aとの相違点は、高周波数時間包絡形状決定部120b、低周波数時間包絡修正部100dにかえて、高周波数時間包絡形状決定部120bA、低周波数時間包絡修正部120eを具備する点である。
[第16の実施形態の音声復号装置の第9の変形例]
図245は、第16の実施形態に係る音声復号装置の第9の変形例150Iの構成を示す図である。
図246は、第16の実施形態に係る音声復号装置の第9の変形例150Iの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部120c、前記高周波数時間包絡修正部120d、前記高周波数時間包絡形状決定部120bA、及び前記低周波数時間包絡修正部120eを具備する。
[第16の実施形態の音声復号装置の第10の変形例]
図247は、第16の実施形態に係る音声復号装置の第10の変形例150Jの構成を示す図である。
図248は、第16の実施形態に係る音声復号装置の第10の変形例150Jの動作を示すフローチャートである。
本変形例と前記第16の実施形態に係る音声復号装置の第1の変形例150Aとの相違点は、低周波数時間包絡形状決定部100c及び高周波数時間包絡形状決定部120bにかえて時間包絡形状決定部120fを具備する点である。
[第16の実施形態の音声復号装置の第11の変形例]
図249は、第16の実施形態に係る音声復号装置の第11の変形例150Kの構成を示す図である。
図250は、第16の実施形態に係る音声復号装置の第11の変形例150Kの動作を示すフローチャートである。
本変形例と前記第16の実施形態に係る音声復号装置の第2の変形例150Bとの相違点は、低周波数時間包絡形状決定部100c、高周波数時間包絡修正部110cにかえて、低周波数時間包絡形状決定部120c、高周波数時間包絡修正部120dを具備する点である。
[第16の実施形態の音声復号装置の第12の変形例]
図251は、第16の実施形態に係る音声復号装置の第12の変形例150Lの構成を示す図である。
図252は、第16の実施形態に係る音声復号装置の第12の変形例150Lの動作を示すフローチャートである。
本変形例と前記第16の実施形態に係る音声復号装置の第2の変形例150Bとの相違点は、高周波数時間包絡形状決定部120b、低周波数時間包絡修正部100dにかえて、高周波数時間包絡形状決定部120bA、低周波数時間包絡修正部120eを具備する点である。
[第16の実施形態の音声復号装置の第13の変形例]
図253は、第16の実施形態に係る音声復号装置の第13の変形例150Mの構成を示す図である。
図254は、第16の実施形態に係る音声復号装置の第13の変形例150Mの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部120c、前記高周波数時間包絡修正部120d、前記高周波数時間包絡形状決定部120bA、及び前記低周波数時間包絡修正部120eを具備する。
[第16の実施形態の音声復号装置の第14の変形例]
図255は、第16の実施形態に係る音声復号装置の第14の変形例150Nの構成を示す図である。
図256は、第16の実施形態に係る音声復号装置の第14の変形例150Nの動作を示すフローチャートである。
本変形例と前記第16の実施形態に係る音声復号装置の第2の変形例150Bとの相違点は、低周波数時間包絡形状決定部100c及び高周波数時間包絡形状決定部120bにかえて時間包絡形状決定部120fを具備する点である。
[第17の実施形態]
図106は、第17の実施形態に係る音声復号装置160の構成を示す図である。音声復号装置160の通信装置は、下記音声符号化装置260から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置160は、図106に示すように、機能的には、符号化系列逆多重化部150a、スイッチ群150b、低周波数復号部100b、低周波数時間包絡形状決定部100c、低周波数時間包絡修正部100d、高周波数時間包絡形状決定部120b、高周波数時間包絡修正部130a、高周波数復号部130b、及び低周波数/高周波数信号合成部150cを備える。
図107は、第17の実施形態に係る音声復号装置の動作を示すフローチャートである。なお、ステップS150-2およびS150-3の処理を行う順番については、高周波数時間包絡形状の決定及び高周波数符号化部分を復号の処理の前であればよく、図107のフローチャートの順番に制限されない。
図108は、第17の実施形態に係る音声符号化装置260の構成を示す図である。音声符号化装置260の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置260は、図108に示すように、機能的には、高周波数信号生成制御情報符号化部250a、低周波数符号化部200a、高周波数符号化部200b、低周波数時間包絡情報符号化部200c、高周波数時間包絡情報符号化部220a、及び符号化系列多重化部250bを備える。
図109は、第17の実施形態に係る音声符号化装置260の動作を示すフローチャートである。
[第17の実施形態の音声復号装置の第1の変形例]
図110は、第17の実施形態に係る音声復号装置の第1の変形例160Aの構成を示す図である。
図111は、第17の実施形態に係る音声復号装置の第1の変形例160Aの動作を示すフローチャートである。
当該実施形態の音声復号装置160との相違点は、高周波数時間包絡修正部130aに代えて、第15の実施形態の音声復号装置の第1の変形例で説明した高周波数時間包絡修正部140aを用いている点である。
なお、ステップS150-2およびS150-3の処理を行う順番については、高周波数時間包絡形状の決定及び高周波数符号化部分を復号の処理の前であればよく、図111のフローチャートの順番に制限されない。
[第17の実施形態の音声復号装置の第2の変形例]
図112は、第17の実施形態に係る音声復号装置の第2の変形例170Bの構成を示す図である。
当該実施形態の音声復号装置の第1の変形例160Aとの相違点は、第15の実施形態の音声復号装置の第2の変形例と同様に、低周波数/高周波数信号合成部150cでの合成処理に用いられる低周波数信号が、低周波数時間包絡修正部100dで時間包絡形状を修正された低周波数信号に代えて、低周波数復号部100bで復号された低周波数信号である点である。
[第17の実施形態の音声復号装置の第3の変形例]
図257は、第17の実施形態に係る音声復号装置の第3の変形例160Cの構成を示す図である。
図258は、第17の実施形態に係る音声復号装置の第3の変形例160Cの動作を示すフローチャートである。
本変形例と前記第17の実施形態に係る音声復号装置160との相違点は、低周波数時間包絡形状決定部100c、高周波数時間包絡修正部130aにかえて、低周波数時間包絡形状決定部120c、高周波数時間包絡修正部140bを具備する点である。
[第17の実施形態の音声復号装置の第4の変形例]
図259は、第17の実施形態に係る音声復号装置の第4の変形例160Dの構成を示す図である。
図260は、第17の実施形態に係る音声復号装置の第4の変形例160Dの動作を示すフローチャートである。
本変形例と前記第17の実施形態に係る音声復号装置160との相違点は、高周波数時間包絡形状決定部120b、低周波数時間包絡修正部100dにかえて、高周波数時間包絡形状決定部120bA、低周波数時間包絡修正部120eを具備する点である。
[第17の実施形態の音声復号装置の第5の変形例]
図261は、第17の実施形態に係る音声復号装置の第5の変形例160Eの構成を示す図である。
図262は、第17の実施形態に係る音声復号装置の第5の変形例160Eの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部120c、前記高周波数時間包絡修正部140b、前記高周波数時間包絡形状決定部120bA、及び前記低周波数時間包絡修正部120eを具備する。
[第17の実施形態の音声復号装置の第6の変形例]
図263は、第17の実施形態に係る音声復号装置の第6の変形例160Fの構成を示す図である。
図264は、第17の実施形態に係る音声復号装置の第6の変形例160Fの動作を示すフローチャートである。
本変形例と前記第17の実施形態に係る音声復号装置160との相違点は、低周波数時間包絡形状決定部100c及び高周波数時間包絡形状決定部120bにかえて時間包絡形状決定部120fを具備する点である。
[第17の実施形態の音声復号装置の第7の変形例]
図265は、第17の実施形態に係る音声復号装置の第7の変形例160Gの構成を示す図である。
図266は、第17の実施形態に係る音声復号装置の第7の変形例160Gの動作を示すフローチャートである。
本変形例と前記第17の実施形態に係る音声復号装置の第1の変形例160Aとの相違点は、低周波数時間包絡形状決定部100c、高周波数時間包絡修正部140aにかえて、低周波数時間包絡形状決定部120c、高周波数時間包絡修正部140bを具備する点である。
本変形例においては、高周波数時間包絡修正部140bは、高周波数時間包絡形状決定部120bにて決定された時間包絡形状と低周波数時間包絡形状決定部120cで決定された時間包絡形状のうち少なくとも一つ以上に基づいて、高周波数復号部130bへ入力される時間包絡形状を修正された低周波数信号の時間包絡の形状を修正する(S140-2)。
[第17の実施形態の音声復号装置の第8の変形例]
図267は、第17の実施形態に係る音声復号装置の第8の変形例160Hの構成を示す図である。
図268は、第17の実施形態に係る音声復号装置の第8の変形例160Hの動作を示すフローチャートである。
本変形例と前記第17の実施形態に係る音声復号装置の第1の変形例160Aとの相違点は、高周波数時間包絡形状決定部120b、低周波数時間包絡修正部100dにかえて、高周波数時間包絡形状決定部120bA、低周波数時間包絡修正部120eを具備する点である。
[第17の実施形態の音声復号装置の第9の変形例]
図269は、第17の実施形態に係る音声復号装置の第9の変形例160Iの構成を示す図である。
図270は、第17の実施形態に係る音声復号装置の第9の変形例160Iの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部120c、前記高周波数時間包絡修正部140b、前記高周波数時間包絡形状決定部120bA、及び前記低周波数時間包絡修正部120eを具備する。
[第17の実施形態の音声復号装置の第10の変形例]
図271は、第17の実施形態に係る音声復号装置の第10の変形例160Jの構成を示す図である。
図272は、第17の実施形態に係る音声復号装置の第10の変形例160Jの動作を示すフローチャートである。
本変形例と前記第17の実施形態に係る音声復号装置の第1の変形例160Aとの相違点は、低周波数時間包絡形状決定部100c及び高周波数時間包絡形状決定部120bにかえて時間包絡形状決定部120fを具備する点である。
[第17の実施形態の音声復号装置の第11の変形例]
図273は、第17の実施形態に係る音声復号装置の第11の変形例160Kの構成を示す図である。
図274は、第17の実施形態に係る音声復号装置の第11の変形例160Kの動作を示すフローチャートである。
本変形例と前記第17の実施形態に係る音声復号装置の第2の変形例160Bとの相違点は、低周波数時間包絡形状決定部100c、高周波数時間包絡修正部140aにかえて、低周波数時間包絡形状決定部120c、高周波数時間包絡修正部140bを具備する点である。
[第17の実施形態の音声復号装置の第12の変形例]
図275は、第17の実施形態に係る音声復号装置の第12の変形例160Lの構成を示す図である。
図276は、第17の実施形態に係る音声復号装置の第12の変形例160Lの動作を示すフローチャートである。
本変形例と前記第17の実施形態に係る音声復号装置の第2の変形例160Bとの相違点は、高周波数時間包絡形状決定部120b、低周波数時間包絡修正部100dにかえて、高周波数時間包絡形状決定部120bA、低周波数時間包絡修正部120eを具備する点である。
[第17の実施形態の音声復号装置の第13の変形例]
図277は、第17の実施形態に係る音声復号装置の第13の変形例160Mの構成を示す図である。
図278は、第17の実施形態に係る音声復号装置の第13の変形例160Mの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部120c、前記高周波数時間包絡修正部140b、前記高周波数時間包絡形状決定部120bA、及び前記低周波数時間包絡修正部120eを具備する。
[第17の実施形態の音声復号装置の第14の変形例]
図279は、第17の実施形態に係る音声復号装置の第14の変形例160Nの構成を示す図である。
図280は、第17の実施形態に係る音声復号装置の第14の変形例160Nの動作を示すフローチャートである。
本変形例と前記第17の実施形態に係る音声復号装置の第2の変形例160Bとの相違点は、低周波数時間包絡形状決定部100c及び高周波数時間包絡形状決定部120bにかえて時間包絡形状決定部120fを具備する点である。
[第18の実施形態]
図113は、第18の実施形態に係る音声復号装置170の構成を示す図である。音声復号装置170の通信装置は、下記音声符号化装置270から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置170は、図113に示すように、機能的には、符号化系列逆多重化部170a、スイッチ群170b、コア復号部10b、分析フィルタバンク部10c、符号化系列解析部13c、低周波数時間包絡形状決定部10e、低周波数時間包絡修正部10f、高周波数時間包絡形状決定部13a、時間包絡修正部13b、高周波数信号生成部10g、復号/逆量子化部10h、周波数包絡調整部10i、及び合成フィルタバンク部170cを備える。
図114は、第18の実施形態に係る音声復号装置の動作を示すフローチャートである。
符号化系列逆多重化部170aは、符号化系列を、高周波数信号生成制御情報、低周波数信号を符号化したコア符号化部分、低周波数時間包絡形状決定部10eで必要な時間包絡形状に関する情報に分割する(ステップS170-1)。
符号化系列逆多重化部170aで得られた高周波数信号生成制御情報に基づき,高周波数信号を生成するか否かを判断する(ステップS170-2)。
高周波数信号を生成する場合、符号化系列逆多重化部170aは、符号化系列から低周波数信号から高周波数信号を生成するための帯域拡張部分を抽出し、符号化系列解析部13cは、符号化系列逆多重化部170aで抽出された符号化系列の帯域拡張部分を解析し、高周波数信号生成部10g、及び復号/逆量子化部10hで必要な情報、高周波数時間包絡形状決定部13aで必要な時間包絡形状に関する情報に分割する(ステップS170-3)。そして、当該符号化系列の高周波数符号化部分を用いて高周波数信号を生成し、さらに高周波数信号の時間包絡形状を決定して、高周波数信号の時間包絡形状を修正する。
なお、ステップS170-2およびS170-3の処理を行う順番については、高周波数信号の時間包絡形状の決定および帯域拡張部分の復号・逆量子化の処理の前であればよく、図114のフローチャートの順番に制限されない。
合成フィルタバンク部170cは、前記高周波数信号生成情報に基づき高周波数信号を生成すると判断された場合、時間包絡形状を修正された低周波数サブバンド信号と時間包絡形状を修正された高周波数サブバンド信号から出力音声信号を合成し、前記高周波数信号生成情報に基づき高周波数信号を生成しないと判断された場合、時間包絡形状を修正された低周波数サブバンド信号から出力音声信号を合成する(ステップS170-4)。
なお、本実施形態に係る音声復号装置170の低周波数時間包絡形状決定部10eに対して、本発明の第1の実施形態の音声復号装置の第1、第2、及び第3の変形例が適用できることは明白である。
さらには、本実施形態に係る音声復号装置170の高周波数時間包絡形状決定部13aに対して、本発明の第4の実施形態の音声復号装置の第1、第2、及び第3の変形例、及び本発明第7の実施形態の音声復号装置の第1の変形例が適用できることは明白である。
図115は、第18の実施形態に係る音声符号化装置270の構成を示す図である。音声符号化装置270の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置270は、図115に示すように、機能的には、高周波数信号生成制御情報符号化部270a、ダウンサンプリング部20a、コア符号化部20b、分析フィルタバンク部20c及び20c1、制御パラメータ符号化部20d、包絡算出部20e、量子化/符号化部20f、コア復号信号生成部20i、サブバンド信号パワー算出部20j、時間包絡情報符号化部270b、及び符号化系列多重化部270cを備える。
図116は、第18の実施形態に係る音声符号化装置270の動作を示すフローチャートである。
高周波数信号生成制御情報符号化部270aは、入力音声信号、高周波数信号生成制御指示信号のうち少なくとも一つに基づいて高周波数信号を生成するか否かを決定し、高周波数信号生成制御情報を符号化する(ステップS270-1)。例えば、入力音声信号が量子化/符号化部20fにて量子化・符号化する帯域拡張にて生成される周波数帯域の信号を含む場合は、高周波数信号を生成すると決定することができる。さらに例えば、高周波数信号生成制御指示信号により高周波数信号を生成することを指示された場合は、高周波数信号を生成すると決定することができる。さらに例えば、前記2つの方法を組み合わせることもでき、例えば前記2つの方法のうち少なくとも一つの方法にて高周波数信号を生成すると判断した場合には、高周波数信号を生成すると決定できる。
高周波数信号生成制御情報は、例えば高周波数信号を生成するか否かを1ビットで表すことで符号化できる。
ただし、高周波数信号を生成するか否かの決定、及び高周波数信号生成制御情報の符号化方法は限定されない。
高周波数信号生成制御情報符号化部270aにて高周波数信号を生成すると決定した場合は、帯域拡張にて高周波数信号を生成するのに必要な情報を算出・符号化する。一方、高周波数信号生成制御情報符号化部270aにて高周波数信号を生成しないと判断した場合、前記高周波数信号を生成するのに必要な情報の算出・符号化は実施されない(ステップS270-2)。
時間包絡情報符号化部270bは、高周波数信号生成制御情報符号化部270aにて高周波数信号を生成すると決定した場合は、低周波数信号の時間包絡と高周波数信号の時間包絡のうち少なくとも一つ以上を算出し、さらにサブバンド信号パワー算出部20jにて算出されたコア復号信号のサブバンド信号のパワーを用いてコア復号信号の時間包絡を算出し、当該低周波数信号の時間包絡及び高周波数信号の時間包絡のうち少なくとも一つ以上とコア復号信号の時間包絡より時間包絡情報を符号化する。当該時間包絡情報は、低周波数時間包絡情報と高周波数時間包絡情報を含む。第7の実施形態の音声符号化装置26の時間包絡情報符号化部26aの動作と同様に、当該低周波数時間包絡情報と高周波数時間包絡情報の符号化の方法は限定されない。一方、高周波数信号生成制御情報符号化部270aにて高周波数信号を生成しないと判断した場合は、低周波数信号の時間包絡を算出し、さらにサブバンド信号パワー算出部20jにて算出されたコア復号信号のサブバンド信号のパワーを用いてコア復号信号の時間包絡を算出し、当該低周波数信号の時間包絡とコア復号信号の時間包絡より、低周波数信号に関する時間包絡情報を符号化する(ステップS270-3)。ここで高周波数信号生成制御情報符号化部270aにて高周波数信号を生成しないと判断した場合は、包絡算出部270dは、低周波数信号のサブバンド信号のパワーのみを算出することができ、さらには低周波数信号のサブバンド信号のパワーを算出せずに低周波数信号のサブバンド信号を時間包絡情報符号化部270bに送ることもできる。低周波数信号のサブバンド信号のパワーが算出されていない場合は、時間包絡情報符号化部270bにて低周波数信号のサブバンド信号のパワーを算出してもよく、低周波数信号のサブバンド信号のパワーがどこで算出されるかは限定されない。
符号化系列多重化部270cは、高周波数信号生成制御情報符号化部270aより符号化された高周波数信号生成制御情報を受け取り、コア符号化部20bより低周波数信号の符号化系列を受け取り、時間包絡情報符号化部20gより符号化された時間包絡情報を受け取り、高周波数信号生成制御情報符号化部270aにて高周波数信号を生成すると決定した場合は、制御パラメータ符号化部20dより符号化された制御パラメータをさらに受け取り、量子化/符号化部20fより符号化された高周波数信号に対するゲインおよびノイズ信号の大きさをさらに受け取り、これらを多重化して符号化系列として出力する(ステップS270-4)。
[第18の実施形態の音声復号装置の第1の変形例]
図281は、第18の実施形態に係る音声復号装置の第1の変形例170Aの構成を示す図である。
図282は、第18の実施形態に係る音声復号装置の第1の変形例170Aの動作を示すフローチャートである。
本変形例と第18の実施形態に係る音声復号装置170との相違点は、低周波数時間包絡形状決定部10eC(10e、10eA、及び10eBでもよいことは明白)、時間包絡修正部13bにかえて、低周波数時間包絡形状決定部16b、時間包絡修正部16cを具備する点である。
[第18の実施形態の音声復号装置の第2の変形例]
図283は、第18の実施形態に係る音声復号装置の第2の変形例170Bの構成を示す図である。
図284は、第18の実施形態に係る音声復号装置の第2の変形例170Bの動作を示すフローチャートである。
本変形例と第18の実施形態に係る音声復号装置170との相違点は、高周波数時間包絡形状決定部13aC(13a、13aA、及び13aBでもよいことは明白)、低周波数時間包絡修正部10fにかえて、高周波数時間包絡形状決定部16d、低周波数時間包絡修正部16eを具備する点である。
[第18の実施形態の音声復号装置の第3の変形例]
図285は、第18の実施形態に係る音声復号装置の第3の変形例170Cの構成を示す図である。
図286は、第18の実施形態に係る音声復号装置の第3の変形例170Cの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部16b、前記時間包絡修正部16c、前記高周波数時間包絡形状決定部16d、及び前記低周波数時間包絡修正部16eを具備する。
[第18の実施形態の音声復号装置の第4の変形例]
図287は、第18の実施形態に係る音声復号装置の第4の変形例170Dの構成を示す図である。
図288は、第18の実施形態に係る音声復号装置の第4の変形例170Dの動作を示すフローチャートである。
本変形例と前記第18の実施形態に係る音声復号装置170との相違点は、低周波数時間包絡形状決定部10e及び高周波数時間包絡形状決定部13aにかえて時間包絡形状決定部16fを具備する点である。
[第19の実施形態]
図117は、第19の実施形態に係る音声復号装置180の構成を示す図である。音声復号装置180の通信装置は、下記音声符号化装置280から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置180は、図117に示すように、機能的には、符号化系列逆多重化部170a、スイッチ群170b、コア復号部10b、分析フィルタバンク部10c、符号化系列解析部13c、低周波数時間包絡形状決定部10e、低周波数時間包絡修正部10f、高周波数時間包絡形状決定部13a、高周波数信号生成部10g、時間包絡修正部14a、復号/逆量子化部10h、周波数包絡調整部10i、及び合成フィルタバンク部170cを備える。
図118は、第19の実施形態に係る音声復号装置の動作を示すフローチャートである。なお、ステップS170-2およびS170-3の処理を行う順番については、高周波数信号の時間包絡形状の決定および帯域拡張部分の復号・逆量子化の処理の前であればよく、図118のフローチャートの順番に制限されない。
なお、本実施形態に係る音声復号装置180の低周波数時間包絡形状決定部10eに対して、本発明の第1の実施形態の音声復号装置の第1、第2、及び第3の変形例が適用できることは明白である。
さらには、本実施形態に係る音声復号装置180の高周波数時間包絡形状決定部13aに対して、本発明の第4の実施形態の音声復号装置の第1、第2、及び第3の変形例、本発明第5の実施形態の音声復号装置の第1の変形例、及び本発明第7の実施形態の音声復号装置の第1の変形例が適用できることは明白である。
図119は、第19の実施形態に係る音声符号化装置280の構成を示す図である。音声符号化装置280の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置280は、図119に示すように、機能的には、高周波数信号生成制御情報符号化部270a、ダウンサンプリング部20a、コア符号化部20b、分析フィルタバンク部20c及び20c1、制御パラメータ符号化部20d、包絡算出部270d、量子化/符号化部20f、コア復号信号生成部20i、サブバンド信号パワー算出部20j及び24b、擬似高周波数信号生成部24a、時間包絡情報符号化部280a、及び符号化系列多重化部270cを備える。
図120は、第19の実施形態に係る音声符号化装置280の動作を示すフローチャートである。
高周波数信号生成制御情報符号化部270aにて高周波数信号を生成すると決定した場合は、帯域拡張にて高周波数信号を生成するのに必要な情報を算出・符号化し、さらに擬似高周波数信号を生成し当該擬似高周波数信号の時間包絡を算出する。一方、高周波数信号生成制御情報符号化部270aにて高周波数信号を生成しないと判断した場合、前記帯域拡張にて高周波数信号を生成するのに必要な情報を算出・符号化、及び前記擬似高周波数信号の生成・時間包絡の算出は実施されない(ステップS280-1)。
時間包絡情報符号化部280aは、高周波数信号生成制御情報符号化部270aにて高周波数信号を生成すると決定した場合は、入力音声信号の低周波数信号の時間包絡、高周波数信号の時間包絡、コア復号信号の時間包絡、擬似高周波数信号の時間包絡のうち少なくとも一つ以上を算出し、算出された時間包絡より時間包絡情報を符号化する。当該時間包絡情報は、低周波数時間包絡情報と高周波数時間包絡情報を含む。第7の実施形態の音声符号化装置26の時間包絡情報符号化部26aの動作と同様に、当該低周波数時間包絡情報と高周波数時間包絡情報の符号化の方法は限定されない。一方、高周波数信号生成制御情報符号化部270aにて高周波数信号を生成しないと決定した場合は、入力音声信号の低周波数信号の時間包絡、コア復号信号の時間包絡のうち少なくとも一つ以上を算出し、算出された時間包絡より、低周波数信号に関する時間包絡情報を符号化する(ステップS280-2)。
なお、本実施形態に係る音声符号化装置280に対して、本発明の第7の実施形態の音声符号化装置の第1の変形例が適用できることは明白である。
[第19の実施形態の音声復号装置の第1の変形例]
図289は、第19の実施形態に係る音声復号装置の第1の変形例180Aの構成を示す図である。
図290は、第19の実施形態に係る音声復号装置の第1の変形例180Aの動作を示すフローチャートである。
本変形例と第19の実施形態に係る音声復号装置180との相違点は、低周波数時間包絡形状決定部10eC(10e、10eA、及び10eBでもよいことは明白)、時間包絡修正部14aにかえて、低周波数時間包絡形状決定部16b、時間包絡修正部17aを具備する点である。
[第19の実施形態の音声復号装置の第2の変形例]
図291は、第19の実施形態に係る音声復号装置の第2の変形例180Bの構成を示す図である。
図292は、第19の実施形態に係る音声復号装置の第2の変形例180Bの動作を示すフローチャートである。
本変形例と第19の実施形態に係る音声復号装置180との相違点は、高周波数時間包絡形状決定部13aC(13a、13aA、及び13aBでもよいことは明白)、低周波数時間包絡修正部10fにかえて、高周波数時間包絡形状決定部16d、低周波数時間包絡修正部16eを具備する点である。
[第19の実施形態の音声復号装置の第3の変形例]
図293は、第19の実施形態に係る音声復号装置の第3の変形例180Cの構成を示す図である。
図294は、第19の実施形態に係る音声復号装置の第3の変形例180Cの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部16b、前記時間包絡修正部17a、前記高周波数時間包絡形状決定部16d、及び前記低周波数時間包絡修正部16eを具備する。
[第19の実施形態の音声復号装置の第4の変形例]
図295は、第19の実施形態に係る音声復号装置の第4の変形例180Dの構成を示す図である。
図296は、第19の実施形態に係る音声復号装置の第4の変形例180Dの動作を示すフローチャートである。
本変形例と前記第19の実施形態に係る音声復号装置180との相違点は、低周波数時間包絡形状決定部10e及び高周波数時間包絡形状決定部13aにかえて時間包絡形状決定部16fを具備する点である。
[第20の実施形態]
図121は、第20の実施形態に係る音声復号装置190の構成を示す図である。音声復号装置190の通信装置は、下記音声符号化装置290から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置190は、図121に示すように、機能的には、符号化系列逆多重化部170a、スイッチ群170b、コア復号部10b、分析フィルタバンク部10c、符号化系列解析部13c、低周波数時間包絡形状決定部10e、低周波数時間包絡修正部10f、高周波数時間包絡形状決定部13a、高周波数信号生成部10g、復号/逆量子化部10h、周波数包絡調整部10i、時間包絡修正部15a、及び合成フィルタバンク部170cを備える。
図122は、第20の実施形態に係る音声復号装置の動作を示すフローチャートである。なお、ステップS170-2およびS170-3の処理を行う順番については、高周波数信号の時間包絡形状の決定および帯域拡張部分の復号・逆量子化の処理の前であればよく、図122のフローチャートの順番に制限されない。
なお、本実施形態に係る音声復号装置190の低周波数時間包絡形状決定部10eに対して、本発明の第1の実施形態の音声復号装置の第1、第2、及び第3の変形例が適用できることは明白である。
さらには、本実施形態に係る音声復号装置190の高周波数時間包絡形状決定部13aに対して、本発明の第4の実施形態の音声復号装置の第1、第2、及び第3の変形例、本発明第5の実施形態の音声復号装置の第1の変形例、及び本発明第7の実施形態の音声復号装置の第1の変形例が適用できることは明白である。
図123は、第20の実施形態に係る音声符号化装置290の構成を示す図である。音声符号化装置290の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置290は、図123に示すように、機能的には、高周波数信号生成制御情報符号化部270a、ダウンサンプリング部20a、コア符号化部20b、分析フィルタバンク部20c及び20c1、制御パラメータ符号化部20d、包絡算出部270d、量子化/符号化部20f、コア復号信号生成部20i、サブバンド信号パワー算出部20j及び24b、擬似高周波数信号生成部24a、時間包絡情報符号化部280a、及び符号化系列多重化部270cを備える。
図124は、第20の実施形態に係る音声符号化装置290の動作を示すフローチャートである。
時間包絡情報符号化部290aは、高周波数信号生成制御情報符号化部270aにて高周波数信号を生成すると決定した場合は、入力音声信号の低周波数信号の時間包絡、高周波数信号の時間包絡、コア復号信号の時間包絡、周波数包絡調整された擬似高周波数信号の時間包絡のうち少なくとも一つ以上を算出し、算出された時間包絡より時間包絡情報を符号化する。当該時間包絡情報は、低周波数時間包絡情報と高周波数時間包絡情報を含む。第7の実施形態の音声符号化装置26の時間包絡情報符号化部26aの動作と同様に、当該低周波数時間包絡情報と高周波数時間包絡情報の符号化の方法は限定されない。
一方、高周波数信号生成制御情報符号化部270aにて高周波数信号を生成しないと決定した場合は、入力音声信号の低周波数信号の時間包絡、コア復号信号の時間包絡のうち少なくとも一つ以上を算出し、算出された時間包絡より、低周波数信号に関する時間包絡情報を符号化する(ステップS290-1)。
なお、本実施形態に係る音声符号化装置290に対して、本発明の第7の実施形態の音声符号化装置の第1の変形例が適用できることは明白である。
[第20の実施形態の音声復号装置の第1の変形例]
図297は、第20の実施形態に係る音声復号装置の第1の変形例190Aの構成を示す図である。
図298は、第20の実施形態に係る音声復号装置の第1の変形例190Aの動作を示すフローチャートである。
本変形例と前記第20の実施形態に係る音声復号装置190との相違点は、時間包絡修正部13aにかえて時間包絡修正部15aAを具備する点である。
[第20の実施形態の音声復号装置の第2の変形例]
図299は、第20の実施形態に係る音声復号装置の第2の変形例190Bの構成を示す図である。
図300は、第20の実施形態に係る音声復号装置の第2の変形例190Bの動作を示すフローチャートである。
本変形例と第20の実施形態に係る音声復号装置190との相違点は、低周波数時間包絡形状決定部10eC(10e、10eA、及び10eBでもよいことは明白)、時間包絡修正部15aにかえて、低周波数時間包絡形状決定部16b、時間包絡修正部18aを具備する点である。
[第20の実施形態の音声復号装置の第3の変形例]
図301は、第20の実施形態に係る音声復号装置の第3の変形例190Cの構成を示す図である。
図302は、第20の実施形態に係る音声復号装置の第3の変形例190Cの動作を示すフローチャートである。
本変形例と第20の実施形態に係る音声復号装置190との相違点は、高周波数時間包絡形状決定部13aC(13a、13aA、及び13aBでもよいことは明白)、低周波数時間包絡修正部10fにかえて、高周波数時間包絡形状決定部16d、低周波数時間包絡修正部16eを具備する点である。
[第20の実施形態の音声復号装置の第4の変形例]
図303は、第20の実施形態に係る音声復号装置の第4の変形例190Dの構成を示す図である。
図304は、第20の実施形態に係る音声復号装置の第4の変形例190Dの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部16b、前記時間包絡修正部18a、前記高周波数時間包絡形状決定部16d、及び前記低周波数時間包絡修正部16eを具備する。
[第20の実施形態の音声復号装置の第5の変形例]
図305は、第20の実施形態に係る音声復号装置の第5の変形例190Eの構成を示す図である。
図306は、第20の実施形態に係る音声復号装置の第5の変形例190Eの動作を示すフローチャートである。
本変形例と前記第20の実施形態に係る音声復号装置190との相違点は、低周波数時間包絡形状決定部10e及び高周波数時間包絡形状決定部13aにかえて時間包絡形状決定部16fを具備する点である。
[第20の実施形態の音声復号装置の第6の変形例]
図307は、第20の実施形態に係る音声復号装置の第6の変形例190Fの構成を示す図である。
図308は、第20の実施形態に係る音声復号装置の第6の変形例190Fの動作を示すフローチャートである。
本変形例と第20の実施形態の第1の変形例に係る音声復号装置190Aとの相違点は、低周波数時間包絡形状決定部10eC(10e、10eA、及び10eBでもよいことは明白)、時間包絡修正部15aAにかえて、低周波数時間包絡形状決定部16b、時間包絡修正部18aAを具備する点である。
[第20の実施形態の音声復号装置の第7の変形例]
図309は、第20の実施形態に係る音声復号装置の第7の変形例190Gの構成を示す図である。
図310は、第20の実施形態に係る音声復号装置の第7の変形例190Gの動作を示すフローチャートである。
本変形例と第20の実施形態の第1の変形例に係る音声復号装置190Aとの相違点は、高周波数時間包絡形状決定部13aC(13a、13aA、及び13aBでもよいことは明白)、低周波数時間包絡修正部10fにかえて、高周波数時間包絡形状決定部16d、低周波数時間包絡修正部16eを具備する点である。
[第20の実施形態の音声復号装置の第8の変形例]
図311は、第20の実施形態に係る音声復号装置の第8の変形例190Hの構成を示す図である。
図312は、第20の実施形態に係る音声復号装置の第8の変形例190Hの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部16b、前記時間包絡修正部18aA、前記高周波数時間包絡形状決定部16d、及び前記低周波数時間包絡修正部16eを具備する。
[第20の実施形態の音声復号装置の第9の変形例]
図313は、第20の実施形態に係る音声復号装置の第9の変形例190Iの構成を示す図である。
図314は、第20の実施形態に係る音声復号装置の第9の変形例190Iの動作を示すフローチャートである。
本変形例と前記第20の実施形態の第1の変形例に係る音声復号装置190Aとの相違点は、低周波数時間包絡形状決定部10e及び高周波数時間包絡形状決定部13aにかえて時間包絡形状決定部16fを具備する点である。
[第21の実施形態]
図125は、第21の実施形態に係る音声復号装置300の構成を示す図である。音声復号装置300の通信装置は、下記音声符号化装置400から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置300は、図125に示すように、機能的には、符号化系列逆多重化部10a、コア復号部10b、分析フィルタバンク部10c、符号化系列解析部13c、低周波数時間包絡形状決定部10e、低周波数時間包絡修正部10f、高周波数時間包絡形状決定部13a、時間包絡修正部300a、高周波数信号生成部10g、復号/逆量子化部10h、周波数包絡調整部10i、及び合成フィルタバンク部10jを備える。
図126は、第21の実施形態に係る音声復号装置の動作を示すフローチャートである。
時間包絡修正部300aは、高周波数時間包絡形状決定部13aで決定した時間包絡形状に基づいて、低周波数時間包絡修正部10fから出力され、高周波数信号生成部10gにて高周波数信号の生成に利用する時間包絡形状を修正された低周波数信号の複数のサブバンド信号の時間包絡の形状を修正する(ステップS300-1)。時間包絡修正部13bとの相違点は、入力される信号が分析フィルタバンク部10cから出力される低周波数信号の複数のサブバンド信号に代わって、低周波数時間包絡修正部10fから出力される時間包絡形状を修正された低周波数信号の複数のサブバンド信号である点である。時間包絡修正部13bにおける時間包絡の修正処理において、分析フィルタバンク部10cから出力される低周波数信号の複数のサブバンド信号を、低周波数時間包絡修正部10fから出力される時間包絡形状を修正された低周波数信号の複数のサブバンド信号にかえることにより実現できる。
なお、本実施形態に係る音声復号装置300の低周波数時間包絡形状決定部10eに対して、本発明の第1の実施形態の音声復号装置の第1、第2、及び第3の変形例が適用できることは明白である。
さらには、本実施形態に係る音声復号装置300の高周波数時間包絡形状決定部13aに対して、本発明の第4の実施形態の音声復号装置の第1、第2、及び第3の変形例、及び本発明第7の実施形態の音声復号装置の第1の変形例が適用できることは明白である。
図127は、第21の実施形態に係る音声符号化装置400の構成を示す図である。音声符号化装置400の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置400は、図127に示すように、機能的には、ダウンサンプリング部20a、コア符号化部20b、分析フィルタバンク部20c及び20c1、制御パラメータ符号化部20d、包絡算出部20e、量子化/符号化部20f、コア復号信号生成部20i、サブバンド信号パワー算出部20j、時間包絡情報符号化部400a、及び符号化系列多重化部20hを備える。
図128は、第21の実施形態に係る音声符号化装置400の動作を示すフローチャートである。
時間包絡情報符号化部400aは、低周波数信号の時間包絡と高周波数信号の時間包絡のうち少なくとも一つ以上を算出し、さらにサブバンド信号パワー算出部20jにて算出されたコア復号信号のサブバンド信号のパワーを用いてコア復号信号の時間包絡を算出し、当該低周波数信号の時間包絡及び高周波数信号の時間包絡のうち少なくとも一つ以上とコア復号信号の時間包絡より時間包絡情報を符号化する(ステップS400-1)。当該時間包絡情報は、低周波数時間包絡情報と高周波数時間包絡情報を含む。第7の実施形態の音声符号化装置26の時間包絡情報符号化部26aの動作と同様に、当該低周波数時間包絡情報と高周波数時間包絡情報の符号化の方法は限定されない。時間包絡情報符号化部26aとの相違点は、高周波数信号に関する時間包絡情報を算出する場合には、コア復号信号の時間包絡と低周波数信号に関する時間包絡情報のうち少なくとも一つ以上を用いて、時間包絡形状を修正されたコア復号信号の時間包絡を用いることができる点である。なお、高周波数信号の時間包絡情報は、低周波数信号の時間包絡情報を元に生成可能である。
[第21の実施形態の音声復号装置の第1の変形例]
図315は、第21の実施形態に係る音声復号装置の第1の変形例300Aの構成を示す図である。
図316は、第21の実施形態に係る音声復号装置の第1の変形例300Aの動作を示すフローチャートである。
本変形例と第21の実施形態に係る音声復号装置300との相違点は、低周波数時間包絡形状決定部10eC(10e、10eA、及び10eBでもよいことは明白)、時間包絡修正部300aにかえて、低周波数時間包絡形状決定部16b、時間包絡修正部300aAを具備する点である。
本変形例においては、時間包絡修正部300aAと前記時間包絡修正部300aとの相違点は、高周波数時間包絡形状決定部13aC(13a、13aA、13aBでもよいことは明白)から受け取る時間包絡形状と低周波数時間包絡形状決定部16bから受け取る時間包絡形状のうち少なくとも一つ以上に基づいて、低周波数時間包絡修正部10fから出力され、高周波数信号生成部10gにて高周波数信号の生成に利用する時間包絡形状を修正された低周波数信号の複数のサブバンド信号の時間包絡の形状を修正する点である(S300-1a)。
[第21の実施形態の音声復号装置の第2の変形例]
図317は、第21の実施形態に係る音声復号装置の第2の変形例300Bの構成を示す図である。
図318は、第21の実施形態に係る音声復号装置の第2の変形例300Bの動作を示すフローチャートである。
本変形例と第21の実施形態に係る音声復号装置300との相違点は、高周波数時間包絡形状決定部13aC(13a、13aA、及び13aBでもよいことは明白)、低周波数時間包絡修正部10fにかえて、高周波数時間包絡形状決定部16d、低周波数時間包絡修正部16eを具備する点である。
[第21の実施形態の音声復号装置の第3の変形例]
図319は、第21の実施形態に係る音声復号装置の第3の変形例300Cの構成を示す図である。
図320は、第21の実施形態に係る音声復号装置の第3の変形例300Cの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部16b、前記時間包絡修正部300aA、前記高周波数時間包絡形状決定部16d、及び前記低周波数時間包絡修正部16eを具備する。
[第21の実施形態の音声復号装置の第4の変形例]
図321は、第21の実施形態に係る音声復号装置の第4の変形例300Dの構成を示す図である。
図322は、第21の実施形態に係る音声復号装置の第4の変形例300Dの動作を示すフローチャートである。
本変形例と前記第21の実施形態に係る音声復号装置300との相違点は、低周波数時間包絡形状決定部10e及び高周波数時間包絡形状決定部13aにかえて時間包絡形状決定部16fを具備する点である。
[第22の実施形態]
図129は、第22の実施形態に係る音声復号装置310の構成を示す図である。音声復号装置310の通信装置は、下記音声符号化装置410から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置310は、図129に示すように、機能的には、符号化系列逆多重化部10a、コア復号部10b、分析フィルタバンク部10c、符号化系列解析部13c、低周波数時間包絡形状決定部10e、低周波数時間包絡修正部10f、高周波数時間包絡形状決定部13a、高周波数信号生成部10g、時間包絡修正部14a、復号/逆量子化部10h、周波数包絡調整部10i、及び合成フィルタバンク部10jを備える。
図130は、第22の実施形態に係る音声復号装置の動作を示すフローチャートである。
本発明第8の実施形態の音声復号装置17との相違点は、高周波数信号生成部10gが、分析フィルタバンク部10cから出力される低周波数信号の複数のサブバンド信号に代えて、低周波数時間包絡修正部10fから出力される時間包絡形状を修正された低周波数信号の複数のサブバンド信号を用いて高周波数信号を生成する点である。
なお、本実施形態に係る音声復号装置310の低周波数時間包絡形状決定部10eに対して、本発明の第1の実施形態の音声復号装置の第1、第2、及び第3の変形例が適用できることは明白である。
さらには、本実施形態に係る音声復号装置310の高周波数時間包絡形状決定部13aに対して、本発明の第4の実施形態の音声復号装置の第1、第2、及び第3の変形例、本発明第5の実施形態の音声復号装置の第1の変形例、及び本発明第7の実施形態の音声復号装置の第1の変形例が適用できることは明白である。
図131は、第19の実施形態に係る音声符号化装置410の構成を示す図である。音声符号化装置410の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置410は、図131に示すように、機能的には、ダウンサンプリング部20a、コア符号化部20b、分析フィルタバンク部20c及び20c1、制御パラメータ符号化部20d、包絡算出部270d、量子化/符号化部20f、コア復号信号生成部20i、サブバンド信号パワー算出部20j及び24b、擬似高周波数信号生成部410b、時間包絡情報符号化部410a、及び符号化系列多重化部270cを備える。
図132は、第22の実施形態に係る音声符号化装置410の動作を示すフローチャートである。
時間包絡情報符号化部410aは、入力音声信号の低周波数信号の時間包絡、コア復号信号の時間包絡のうち少なくとも一つ以上を算出し、算出された時間包絡より、低周波数信号に関する時間包絡情報を符号化する(ステップS410-1)。
擬似高周波数信号生成部410bは、分析フィルタバンク部20cで得られる入力音声信号の低周波数信号のサブバンド信号と、制御パラメータ符号化部20dで得られる高周波数信号を生成するために必要な制御パラメータに基づいて、擬似高周波数信号を生成する(ステップS410-2)。擬似高周波数信号生成部24aとの相違点は、擬似高周波数信号を生成する際に、時間包絡情報符号化部410aにて符号化された低周波数信号に関する時間包絡情報を用いて、分析フィルタバンク部20cで得られる入力音声信号の低周波数信号のサブバンド信号を修正することができる点である。
時間包絡情報符号化部410aは、入力音声信号の高周波数信号の時間包絡、擬似高周波数信号の時間包絡のうち少なくとも一つ以上を算出し、算出された時間包絡より、高周波数信号に関する時間包絡情報を符号化する(ステップS410-3)。
なお、時間包絡情報符号化部410aは、低周波数信号に関する時間包絡情報と高周波数信号に関する時間包絡情報とを別々に符号化した符号化系列として出力することができ、また当該低周波数信号に関する時間包絡情報と高周波数信号に関する時間包絡情報とをあわせて符号化した符号化系列として出力することもでき、本発明において時間包絡情報の符号化系列の形式は限定されない。また、第7の実施形態の音声符号化装置26の時間包絡情報符号化部26aの動作と同様に、当該低周波数時間包絡情報と高周波数時間包絡情報の符号化の方法は限定されない。
なお、擬似高周波数信号生成部410bにて擬似高周波数信号を生成する際に、時間包絡情報符号化部410aにて符号化された低周波数信号に関する時間包絡情報を用いない場合は、時間包絡情報符号化部410aはステップS410-1及びS410-3の処理を一緒に実施することができる。例えば、時間包絡情報符号化部27aと同様にして、入力音声信号の低周波数信号の時間包絡、高周波数信号の時間包絡、コア復号信号の時間包絡、擬似高周波数信号の時間包絡のうち少なくとも一つ以上を算出し、算出された時間包絡より、時間包絡情報を符号化することができる。
なお、本実施形態に係る音声符号化装置410に対して、本発明の第7の実施形態の音声符号化装置の第1の変形例が適用できることは明白である。また、高周波数信号の時間包絡情報は、低周波数信号の時間包絡情報を元に生成可能である。
[第22の実施形態の音声復号装置の第1の変形例]
図323は、第22の実施形態に係る音声復号装置の第1の変形例310Aの構成を示す図である。
図324は、第22の実施形態に係る音声復号装置の第1の変形例310Aの動作を示すフローチャートである。
本変形例と第22の実施形態に係る音声復号装置310との相違点は、低周波数時間包絡形状決定部10eC(10e、10eA、及び10eBでもよいことは明白)、時間包絡修正部14aにかえて、低周波数時間包絡形状決定部16b、時間包絡修正部17aを具備する点である。
[第22の実施形態の音声復号装置の第2の変形例]
図325は、第22の実施形態に係る音声復号装置の第2の変形例310Bの構成を示す図である。
図326は、第22の実施形態に係る音声復号装置の第2の変形例310Bの動作を示すフローチャートである。
本変形例と第22の実施形態に係る音声復号装置310との相違点は、高周波数時間包絡形状決定部13aC(13a、13aA、及び13aBでもよいことは明白)、低周波数時間包絡修正部10fにかえて、高周波数時間包絡形状決定部16d、低周波数時間包絡修正部16eを具備する点である。
[第22の実施形態の音声復号装置の第3の変形例]
図327は、第22の実施形態に係る音声復号装置の第3の変形例310Cの構成を示す図である。
図328は、第22の実施形態に係る音声復号装置の第3の変形例310Cの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部16b、前記時間包絡修正部17a、前記高周波数時間包絡形状決定部16d、及び前記低周波数時間包絡修正部16eを具備する。
[第22の実施形態の音声復号装置の第4の変形例]
図329は、第22の実施形態に係る音声復号装置の第4の変形例310Dの構成を示す図である。
図330は、第22の実施形態に係る音声復号装置の第4の変形例310Dの動作を示すフローチャートである。
本変形例と前記第22の実施形態に係る音声復号装置310との相違点は、低周波数時間包絡形状決定部10e及び高周波数時間包絡形状決定部13aにかえて時間包絡形状決定部16fを具備する点である。
[第23の実施形態]
図133は、第23の実施形態に係る音声復号装置320の構成を示す図である。音声復号装置320の通信装置は、下記音声符号化装置420から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置320は、図133に示すように、機能的には、符号化系列逆多重化部10a、コア復号部10b、分析フィルタバンク部10c、符号化系列解析部13c、低周波数時間包絡形状決定部10e、低周波数時間包絡修正部10f、高周波数信号生成部10g、復号/逆量子化部10h、周波数包絡調整部10i、高周波数時間包絡形状決定部13a、時間包絡修正部14a、及び合成フィルタバンク部10jを備える。
図134は、第23の実施形態に係る音声復号装置の動作を示すフローチャートである。
前記第9の実施形態の音声復号装置18との相違点は、高周波数信号生成部10gが、分析フィルタバンク部10cから出力される低周波数信号の複数のサブバンド信号に代えて、低周波数時間包絡修正部10fから出力される時間包絡形状を修正された低周波数信号の複数のサブバンド信号を用いて高周波数信号を生成する点である。
なお、本実施形態に係る音声復号装置320の低周波数時間包絡形状決定部10eに対して、本発明の第1の実施形態の音声復号装置の第1、第2、及び第3の変形例が適用できることは明白である。
さらには、本実施形態に係る音声復号装置320の高周波数時間包絡形状決定部13aに対して、本発明の第4の実施形態の音声復号装置の第1、第2、及び第3の変形例、本発明第5の実施形態の音声復号装置の第1の変形例、及び本発明第7の実施形態の音声復号装置の第1の変形例が適用できることは明白である。
図135は、第23の実施形態に係る音声符号化装置420の構成を示す図である。音声符号化装置420の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置420は、図135に示すように、機能的には、ダウンサンプリング部20a、コア符号化部20b、分析フィルタバンク部20c及び20c1、制御パラメータ符号化部20d、包絡算出部20e、量子化/符号化部20f、擬似高周波数信号生成部410b、周波数包絡調整部25a、コア復号信号生成部20i、サブバンド信号パワー算出部20j及び24b、時間包絡情報符号化部420a、及び符号化系列多重化部20hを備える。
図136は、第23の実施形態に係る音声符号化装置420の動作を示すフローチャートである。
時間包絡情報符号化部420aは、入力音声信号の高周波数信号の時間包絡、波数包絡調整された擬似高周波数信号の時間包絡のうち少なくとも一つ以上を算出し、算出された時間包絡より、高周波数信号に関する時間包絡情報を符号化する(ステップS420-1)。
なお、時間包絡情報符号化部420aは、低周波数信号に関する時間包絡情報と高周波数信号に関する時間包絡情報とを別々に符号化した符号化系列として出力することができ、また当該低周波数信号に関する時間包絡情報と高周波数信号に関する時間包絡情報とをあわせて符号化した符号化系列として出力することもでき、本発明において時間包絡情報の符号化系列の形式は限定されない。また、第7の実施形態の音声符号化装置26の時間包絡情報符号化部26aの動作と同様に、当該低周波数時間包絡情報と高周波数時間包絡情報の符号化の方法は限定されない。
なお、前記第22の実施形態に係る音声符号化装置410と同様に、時間包絡情報符号化部420aはステップS410-1及びS420-1の処理を一緒に実施することができる。また、本実施形態に係る音声符号化装置420に対して、本発明の第7の実施形態の音声符号化装置の第1の変形例が適用できることは明白である。また、高周波数信号の時間包絡情報は、低周波数信号の時間包絡情報を元に生成可能である。
[第23の実施形態の音声復号装置の第1の変形例]
図137は、第23の実施形態の第1の変形例に係る音声復号装置320Aの構成を示す図である。
図138は、第23の実施形態の第1の変形例に係る音声復号装置320Aの動作を示すフローチャートである。
前記第23の実施形態に係る音声復号装置320との相違点は、時間包絡修正部15aに代えて、時間包絡修正部15aAを用いている点である。
なお、本変形例に係る音声復号装置320Aの低周波数時間包絡形状決定部10eに対して、本発明の第1の実施形態の音声復号装置の第1、第2、及び第3の変形例が適用できることは明白である。
さらには、本変形例に係る音声復号装置320Aの高周波数時間包絡形状決定部13aに対して、本発明の第4の実施形態の音声復号装置の第1、第2、及び第3の変形例、本発明第5の実施形態の音声復号装置の第1の変形例、及び本発明第7の実施形態の音声復号装置の第1の変形例が適用できることは明白である。
[第23の実施形態の音声復号装置の第2の変形例]
図331は、第23の実施形態に係る音声復号装置の第2の変形例320Bの構成を示す図である。
図332は、第23の実施形態に係る音声復号装置の第2の変形例320Bの動作を示すフローチャートである。
本変形例と第23の実施形態に係る音声復号装置320との相違点は、低周波数時間包絡形状決定部10eC(10e、10eA、及び10eBでもよいことは明白)、時間包絡修正部15aにかえて、低周波数時間包絡形状決定部16b、時間包絡修正部18aを具備する点である。
[第23の実施形態の音声復号装置の第3の変形例]
図333は、第23の実施形態に係る音声復号装置の第3の変形例320Cの構成を示す図である。
図334は、第23の実施形態に係る音声復号装置の第3の変形例320Cの動作を示すフローチャートである。
本変形例と第23の実施形態に係る音声復号装置320との相違点は、高周波数時間包絡形状決定部13aC(13a、13aA、及び13aBでもよいことは明白)、低周波数時間包絡修正部10fにかえて、高周波数時間包絡形状決定部16d、低周波数時間包絡修正部16eを具備する点である。
[第23の実施形態の音声復号装置の第4の変形例]
図335は、第23の実施形態に係る音声復号装置の第4の変形例320Dの構成を示す図である。
図336は、第23の実施形態に係る音声復号装置の第4の変形例320Dの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部16b、前記時間包絡修正部18a、前記高周波数時間包絡形状決定部16d、及び前記低周波数時間包絡修正部16eを具備する。
[第23の実施形態の音声復号装置の第5の変形例]
図337は、第23の実施形態に係る音声復号装置の第5の変形例320Eの構成を示す図である。
図338は、第23の実施形態に係る音声復号装置の第5の変形例320Eの動作を示すフローチャートである。
本変形例と前記第23の実施形態に係る音声復号装置320との相違点は、低周波数時間包絡形状決定部10e及び高周波数時間包絡形状決定部13aにかえて時間包絡形状決定部16fを具備する点である。
[第23の実施形態の音声復号装置の第6の変形例]
図339は、第23の実施形態に係る音声復号装置の第6の変形例320Fの構成を示す図である。
図340は、第23の実施形態に係る音声復号装置の第6の変形例320Fの動作を示すフローチャートである。
本変形例と第23の実施形態の第1の変形例に係る音声復号装置320Aとの相違点は、低周波数時間包絡形状決定部10eC(10e、10eA、及び10eBでもよいことは明白)、時間包絡修正部15aAにかえて、低周波数時間包絡形状決定部16b、時間包絡修正部18aAを具備する点である。
[第23の実施形態の音声復号装置の第7の変形例]
図341は、第23の実施形態に係る音声復号装置の第7の変形例320Gの構成を示す図である。
図342は、第23の実施形態に係る音声復号装置の第7の変形例320Gの動作を示すフローチャートである。
本変形例と第23の実施形態の第1の変形例に係る音声復号装置320Aとの相違点は、高周波数時間包絡形状決定部13aC(13a、13aA、及び13aBでもよいことは明白)、低周波数時間包絡修正部10fにかえて、高周波数時間包絡形状決定部16d、低周波数時間包絡修正部16eを具備する点である。
[第23の実施形態の音声復号装置の第8の変形例]
図343は、第23の実施形態に係る音声復号装置の第8の変形例320Hの構成を示す図である。
図344は、第23の実施形態に係る音声復号装置の第8の変形例320Hの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部16b、前記時間包絡修正部18aA、前記高周波数時間包絡形状決定部16d、及び前記低周波数時間包絡修正部16eを具備する。
[第23の実施形態の音声復号装置の第9の変形例]
図345は、第23の実施形態に係る音声復号装置の第9の変形例320Iの構成を示す図である。
図346は、第23の実施形態に係る音声復号装置の第9の変形例320Iの動作を示すフローチャートである。
本変形例と前記第23の実施形態の第1の変形例に係る音声復号装置320Aとの相違点は、低周波数時間包絡形状決定部10e及び高周波数時間包絡形状決定部13aにかえて時間包絡形状決定部16fを具備する点である。
[第24の実施形態]
図139は、第24の実施形態に係る音声復号装置330の構成を示す図である。音声復号装置330の通信装置は、下記音声符号化装置430から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置330は、図139に示すように、機能的には、符号化系列逆多重化部170a、スイッチ群170b、コア復号部10b、分析フィルタバンク部10c、符号化系列解析部13c、低周波数時間包絡形状決定部10e、低周波数時間包絡修正部10f、高周波数時間包絡形状決定部13a、時間包絡修正部300a、高周波数信号生成部10g、復号/逆量子化部10h、周波数包絡調整部10i、及び合成フィルタバンク部170cを備える。
図140は、第24の実施形態に係る音声復号装置の動作を示すフローチャートである。なお、ステップS170-2およびS170-3の処理を行う順番については、高周波数信号の時間包絡形状の決定および帯域拡張部分の復号・逆量子化の処理の前であればよく、図140のフローチャートの順番に制限されない。
なお、本変形例に係る音声復号装置330の低周波数時間包絡形状決定部10eに対して、本発明の第1の実施形態の音声復号装置の第1、第2、及び第3の変形例が適用できることは明白である。
さらには、本変形例に係る音声復号装置330の高周波数時間包絡形状決定部13aに対して、本発明の第4の実施形態の音声復号装置の第1、第2、及び第3の変形例、及び本発明第7の実施形態の音声復号装置の第1の変形例が適用できることは明白である。
図141は、第24の実施形態に係る音声符号化装置430の構成を示す図である。音声符号化装置430の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置430は、図141に示すように、機能的には、高周波数信号生成制御情報符号化部270a、ダウンサンプリング部20a、コア符号化部20b、分析フィルタバンク部20c及び20c1、制御パラメータ符号化部20d、包絡算出部20e、量子化/符号化部20f、コア復号信号生成部20i、サブバンド信号パワー算出部20j、時間包絡情報符号化部400a、及び符号化系列多重化部270cを備える。
図142は、第24の実施形態に係る音声符号化装置430の動作を示すフローチャートである。時間包絡情報符号化部400aは、ステップS400-1にて時間包絡情報を算出・符号化する。なお、高周波数信号の時間包絡情報は、低周波数信号の時間包絡情報を元に生成可能である。
[第24の実施形態の音声復号装置の第1の変形例]
図347は、第24の実施形態に係る音声復号装置の第1の変形例330Aの構成を示す図である。
図348は、第24の実施形態に係る音声復号装置の第1の変形例330Aの動作を示すフローチャートである。
本変形例と第24の実施形態に係る音声復号装置330との相違点は、低周波数時間包絡形状決定部10eC(10e、10eA、及び10eBでもよいことは明白)、時間包絡修正部300aにかえて、低周波数時間包絡形状決定部16b、時間包絡修正部300aAを具備する点である。
[第24の実施形態の音声復号装置の第2の変形例]
図349は、第24の実施形態に係る音声復号装置の第2の変形例330Bの構成を示す図である。
図350は、第24の実施形態に係る音声復号装置の第2の変形例330Bの動作を示すフローチャートである。
本変形例と第24の実施形態に係る音声復号装置330との相違点は、高周波数時間包絡形状決定部13aC(13a、13aA、及び13aBでもよいことは明白)、低周波数時間包絡修正部10fにかえて、高周波数時間包絡形状決定部16d、低周波数時間包絡修正部16eを具備する点である。
[第24の実施形態の音声復号装置の第3の変形例]
図351は、第24の実施形態に係る音声復号装置の第3の変形例330Cの構成を示す図である。
図352は、第24の実施形態に係る音声復号装置の第3の変形例330Cの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部16b、前記時間包絡修正部300aA、前記高周波数時間包絡形状決定部16d、及び前記低周波数時間包絡修正部16eを具備する。
[第24の実施形態の音声復号装置の第4の変形例]
図353は、第24の実施形態に係る音声復号装置の第4の変形例330Dの構成を示す図である。
図354は、第24の実施形態に係る音声復号装置の第4の変形例330Dの動作を示すフローチャートである。
本変形例と前記第24の実施形態に係る音声復号装置330との相違点は、低周波数時間包絡形状決定部10e及び高周波数時間包絡形状決定部13aにかえて時間包絡形状決定部16fを具備する点である。
[第25の実施形態]
図143は、第25の実施形態に係る音声復号装置340の構成を示す図である。音声復号装置340の通信装置は、下記音声符号化装置440から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置340は、図143に示すように、機能的には、符号化系列逆多重化部170a、スイッチ群170b、コア復号部10b、分析フィルタバンク部10c、符号化系列解析部13c、低周波数時間包絡形状決定部10e、低周波数時間包絡修正部10f、高周波数時間包絡形状決定部13a、時間包絡修正部14a、高周波数信号生成部10g、復号/逆量子化部10h、周波数包絡調整部10i、及び合成フィルタバンク部170cを備える。
図144は、第25の実施形態に係る音声復号装置の動作を示すフローチャートである。なお、ステップS170-2およびS170-3の処理を行う順番については、高周波数信号の時間包絡形状の決定および帯域拡張部分の復号・逆量子化の処理の前であればよく、図144のフローチャートの順番に制限されない。
なお、本変形例に係る音声復号装置340の低周波数時間包絡形状決定部10eに対して、本発明の第1の実施形態の音声復号装置の第1、第2、及び第3の変形例が適用できることは明白である。
さらには、本変形例に係る音声復号装置340の高周波数時間包絡形状決定部13aに対して、本発明の第4の実施形態の音声復号装置の第1、第2、及び第3の変形例、本発明第5の実施形態の音声復号装置の第1の変形例、及び本発明第7の実施形態の音声復号装置の第1の変形例が適用できることは明白である。
図145は、第25の実施形態に係る音声符号化装置440の構成を示す図である。音声符号化装置440の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置440は、図145に示すように、機能的には、高周波数信号生成制御情報符号化部270a、ダウンサンプリング部20a、コア符号化部20b、分析フィルタバンク部20c及び20c1、制御パラメータ符号化部20d、包絡算出部20e、量子化/符号化部20f、コア復号信号生成部20i、サブバンド信号パワー算出部20j及び24b、擬似高周波数信号生成部410b、時間包絡情報符号化部410a、並びに、符号化系列多重化部270cを備える。
図146は、第25の実施形態に係る音声符号化装置440の動作を示すフローチャートである。なお、本実施形態に係る音声符号化装置440に対して、本発明の第7の実施形態の音声符号化装置の第1の変形例が適用できることは明白である。また、高周波数信号の時間包絡情報は、低周波数信号の時間包絡情報を元に生成可能である。
[第25の実施形態の音声復号装置の第1の変形例]
図355は、第25の実施形態に係る音声復号装置の第1の変形例340Aの構成を示す図である。
図356は、第25の実施形態に係る音声復号装置の第1の変形例340Aの動作を示すフローチャートである。
本変形例と第25の実施形態に係る音声復号装置340との相違点は、低周波数時間包絡形状決定部10eC(10e、10eA、及び10eBでもよいことは明白)、時間包絡修正部14aにかえて、低周波数時間包絡形状決定部16b、時間包絡修正部17aを具備する点である。
[第25の実施形態の音声復号装置の第2の変形例]
図357は、第25の実施形態に係る音声復号装置の第2の変形例340Bの構成を示す図である。
図358は、第25の実施形態に係る音声復号装置の第2の変形例340Bの動作を示すフローチャートである。
本変形例と第25の実施形態に係る音声復号装置340との相違点は、高周波数時間包絡形状決定部13aC(13a、13aA、及び13aBでもよいことは明白)、低周波数時間包絡修正部10fにかえて、高周波数時間包絡形状決定部16d、低周波数時間包絡修正部16eを具備する点である。
[第25の実施形態の音声復号装置の第3の変形例]
図359は、第25の実施形態に係る音声復号装置の第3の変形例340Cの構成を示す図である。
図360は、第25の実施形態に係る音声復号装置の第3の変形例340Cの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部16b、前記時間包絡修正部17a、前記高周波数時間包絡形状決定部16d、及び前記低周波数時間包絡修正部16eを具備する。
[第25の実施形態の音声復号装置の第4の変形例]
図361は、第25の実施形態に係る音声復号装置の第4の変形例340Dの構成を示す図である。
図362は、第25の実施形態に係る音声復号装置の第4の変形例340Dの動作を示すフローチャートである。
本変形例と前記第25の実施形態に係る音声復号装置340との相違点は、低周波数時間包絡形状決定部10e及び高周波数時間包絡形状決定部13aにかえて時間包絡形状決定部16fを具備する点である。
[第26の実施形態]
図147は、第26の実施形態に係る音声復号装置350の構成を示す図である。音声復号装置350の通信装置は、下記音声符号化装置450から出力される多重化された符号化系列を受信し、更に、復号した音声信号を外部に出力する。音声復号装置350は、図147に示すように、機能的には、符号化系列逆多重化部170a、スイッチ群170b、コア復号部10b、分析フィルタバンク部10c、符号化系列解析部13c、低周波数時間包絡形状決定部10e、低周波数時間包絡修正部10f、高周波数時間包絡形状決定部13a、高周波数信号生成部10g、復号/逆量子化部10h、周波数包絡調整部10i、時間包絡修正部15a、及び合成フィルタバンク部170cを備える。
図148は、第26の実施形態に係る音声復号装置の動作を示すフローチャートである。なお、ステップS170-2およびS170-3の処理を行う順番については、高周波数信号の時間包絡形状の決定および帯域拡張部分の復号・逆量子化の処理の前であればよく、図148のフローチャートの順番に制限されない。
なお、本実施形態に係る音声復号装置350の低周波数時間包絡形状決定部10eに対して、本発明の第1の実施形態の音声復号装置の第1、第2、及び第3の変形例が適用できることは明白である。
さらには、本実施形態に係る音声復号装置350の高周波数時間包絡形状決定部13aに対して、本発明の第4の実施形態の音声復号装置の第1、第2、及び第3の変形例、本発明第5の実施形態の音声復号装置の第1の変形例、及び本発明第7の実施形態の音声復号装置の第1の変形例が適用できることは明白である。
図149は、第26の実施形態に係る音声符号化装置450の構成を示す図である。音声符号化装置450の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された符号化系列を外部に出力する。音声符号化装置450は、図149に示すように、機能的には、高周波数信号生成制御情報符号化部270a、ダウンサンプリング部20a、コア符号化部20b、分析フィルタバンク部20c及び20c1、制御パラメータ符号化部20d、包絡算出部270d、量子化/符号化部20f、コア復号信号生成部20i、サブバンド信号パワー算出部20j及び24b、擬似高周波数信号生成部410b、時間包絡情報符号化部420a、並びに、符号化系列多重化部270cを備える。
図150は、第26の実施形態に係る音声符号化装置450の動作を示すフローチャートである。なお、本実施形態に係る音声符号化装置450に対して、本発明の第7の実施形態の音声符号化装置の第1の変形例が適用できることは明白である。また、高周波数信号の時間包絡情報は、低周波数信号の時間包絡情報を元に生成可能である。
[第26の実施形態の音声復号装置の第1の変形例]
図151は、第26の実施形態の第1の変形例に係る音声復号装置350Aの構成を示す図である。
図152は、第26の実施形態の第1の変形例に係る音声復号装置350Aの動作を示すフローチャートである。なお、ステップS170-2およびS170-3の処理を行う順番については、高周波数信号の時間包絡形状の決定および帯域拡張部分の復号・逆量子化の処理の前であればよく、図152のフローチャートの順番に制限されない。
前記第26の実施形態に係る音声復号装置350との相違点は、時間包絡修正部15aに代えて、時間包絡修正部15aAを用いている点である。
なお、本変形例に係る音声復号装置350Aの低周波数時間包絡形状決定部10eに対して、本発明の第1の実施形態の音声復号装置の第1、第2、及び第3の変形例が適用できることは明白である。
さらには、本変形例に係る音声復号装置350Aの高周波数時間包絡形状決定部13aに対して、本発明の第4の実施形態の音声復号装置の第1、第2、及び第3の変形例、本発明第5の実施形態の音声復号装置の第1の変形例、及び本発明第7の実施形態の音声復号装置の第1の変形例が適用できることは明白である。
[第26の実施形態の音声復号装置の第2の変形例]
図363は、第26の実施形態に係る音声復号装置の第2の変形例350Bの構成を示す図である。
図364は、第26の実施形態に係る音声復号装置の第2の変形例350Bの動作を示すフローチャートである。
本変形例と第26の実施形態に係る音声復号装置350との相違点は、低周波数時間包絡形状決定部10eC(10e、10eA、及び10eBでもよいことは明白)、時間包絡修正部15aにかえて、低周波数時間包絡形状決定部16b、時間包絡修正部18aを具備する点である。
[第26の実施形態の音声復号装置の第3の変形例]
図365は、第26の実施形態に係る音声復号装置の第3の変形例350Cの構成を示す図である。
図366は、第26の実施形態に係る音声復号装置の第3の変形例350Cの動作を示すフローチャートである。
本変形例と第26の実施形態に係る音声復号装置350との相違点は、高周波数時間包絡形状決定部13aC(13a、13aA、及び13aBでもよいことは明白)、低周波数時間包絡修正部10fにかえて、高周波数時間包絡形状決定部16d、低周波数時間包絡修正部16eを具備する点である。
[第26の実施形態の音声復号装置の第4の変形例]
図367は、第26の実施形態に係る音声復号装置の第4の変形例350Dの構成を示す図である。
図368は、第26の実施形態に係る音声復号装置の第4の変形例350Dの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部16b、前記時間包絡修正部18a、前記高周波数時間包絡形状決定部16d、及び前記低周波数時間包絡修正部16eを具備する。
[第26の実施形態の音声復号装置の第5の変形例]
図369は、第26の実施形態に係る音声復号装置の第5の変形例350Eの構成を示す図である。
図370は、第26の実施形態に係る音声復号装置の第5の変形例350Eの動作を示すフローチャートである。
本変形例と前記第26の実施形態に係る音声復号装置350との相違点は、低周波数時間包絡形状決定部10e及び高周波数時間包絡形状決定部13aにかえて時間包絡形状決定部16fを具備する点である。
[第26の実施形態の音声復号装置の第6の変形例]
図371は、第26の実施形態に係る音声復号装置の第6の変形例350Fの構成を示す図である。
図372は、第26の実施形態に係る音声復号装置の第6の変形例350Fの動作を示すフローチャートである。
本変形例と第26の実施形態の第1の変形例に係る音声復号装置350Aとの相違点は、低周波数時間包絡形状決定部10eC(10e、10eA、及び10eBでもよいことは明白)、時間包絡修正部15aAにかえて、低周波数時間包絡形状決定部16b、時間包絡修正部18aAを具備する点である。
[第26の実施形態の音声復号装置の第7の変形例]
図373は、第26の実施形態に係る音声復号装置の第7の変形例350Gの構成を示す図である。
図374は、第26の実施形態に係る音声復号装置の第7の変形例350Gの動作を示すフローチャートである。
本変形例と第26の実施形態の第1の変形例に係る音声復号装置350Aとの相違点は、高周波数時間包絡形状決定部13aC(13a、13aA、及び13aBでもよいことは明白)、低周波数時間包絡修正部10fにかえて、高周波数時間包絡形状決定部16d、低周波数時間包絡修正部16eを具備する点である。
[第26の実施形態の音声復号装置の第8の変形例]
図375は、第26の実施形態に係る音声復号装置の第8の変形例350Hの構成を示す図である。
図376は、第26の実施形態に係る音声復号装置の第8の変形例350Hの動作を示すフローチャートである。
本変形例においては、前記低周波数時間包絡形状決定部16b、前記時間包絡修正部18aA、前記高周波数時間包絡形状決定部16d、及び前記低周波数時間包絡修正部16eを具備する。
[第26の実施形態の音声復号装置の第9の変形例]
図377は、第26の実施形態に係る音声復号装置の第9の変形例350Iの構成を示す図である。
図378は、第26の実施形態に係る音声復号装置の第9の変形例350Iの動作を示すフローチャートである。
本変形例と前記第26の実施形態の第1の変形例に係る音声復号装置350Aとの相違点は、低周波数時間包絡形状決定部10e及び高周波数時間包絡形状決定部13aにかえて時間包絡形状決定部16fを具備する点である。
[第27の実施形態の音声復号装置]
図379は、第27の実施形態に係る音声復号装置360の構成を示す図である。
図380は、第27の実施形態に係る音声復号装置360の動作を示すフローチャートである。
時間包絡修正部360aは、低周波数時間包絡形状決定部10eC(10e、10eA、10eBでも良いことは明白)から受け取る時間包絡形状と、高周波数時間包絡形状決定部13aC(13a、13aA、13aBでもよいことは明白)から受け取る時間包絡形状のうち少なくとも一つ以上に基づいて、分析フィルタバンク部10cから出力される低周波数信号の複数のサブバンド信号と周波数包絡調整部10iから出力される高周波数信号の複数のサブバンド信号の時間包絡の形状を修正する(S360-1)。
周波数包絡調整部10iから出力される高周波数信号の複数のサブバンド信号の時間包絡形状の修正では、周波数包絡調整部10iより分離した形で出力された高周波数信号を構成する成分のうち少なくとも一つ以上の時間包絡形状を修正してもよい。
低周波数時間包絡形状決定部10eC(10e、10eA、10eBでも良いことは明白)から受け取る時間包絡形状と高周波数時間包絡形状決定部13aC(13a、13aA、13aBでもよいことは明白)から受け取る時間包絡形状は同一であってもよく、異なってもよい。
[第27の実施形態の音声復号装置の第1の変形例]
図381は、第27の実施形態に係る音声復号装置の第1の変形例360Aの構成を示す図である。
図382は、第27の実施形態に係る音声復号装置の第1の変形例360Aの動作を示すフローチャートである。
本変形例と前記第27の実施形態に係る音声復号装置360との相違点は、低周波数時間包絡形状決定部10eC(10e、10eA、10eBでも良いことは明白)及び高周波数時間包絡形状決定部13aC(13a、13aA、13aBでもよいことは明白)にかえて時間包絡形状決定部360bを具備する点である。
時間包絡決定部360bは、符号化系列逆多重化部10aからの低周波時間包絡形状に関する情報、コア復号部10bからの低周波数信号、分析フィルタバンク部10cからの低周波数信号の複数のサブバンド信号、符号化系列解析部13cからの高周波時間包絡形状に関する情報のうち少なくとも一つに基づいて時間包絡形状を決定する(S360-2)。
決定される時間包絡形状は、低周波数信号と高周波数信号のそれぞれに対して異なってもよく、また低周波数信号と高周波数信号に対して同一で単一の時間包絡形状であってもよい。
時間包絡修正部360aAは、前記時間包絡形状決定部360bから受け取る時間包絡形状に基づいて、分析フィルタバンク部10cから出力される低周波数信号の複数のサブバンド信号と周波数包絡調整部10iから出力される高周波数信号の複数のサブバンド信号の時間包絡の形状を修正する(S360-1a)。
周波数包絡調整部10iから出力される高周波数信号の複数のサブバンド信号の時間包絡形状の修正では、周波数包絡調整部10iより分離した形で出力された高周波数信号を構成する成分のうち少なくとも一つ以上の時間包絡形状を修正してもよい。
[第28の実施形態の音声復号装置]
図383は、第28の実施形態に係る音声復号装置370の構成を示す図である。
図384は、第28の実施形態に係る音声復号装置370の動作を示すフローチャートである。
時間包絡修正部370aは、低周波数時間包絡形状決定部10eC(10e、10eA、10eBでも良いことは明白)から受け取る時間包絡形状と、高周波数時間包絡形状決定部13aC(13a、13aA、13aBでもよいことは明白)から受け取る時間包絡形状のうち少なくとも一つ以上に基づいて、分析フィルタバンク部10cから出力される低周波数信号の複数のサブバンド信号の時間包絡の形状を修正し、前記高周波数信号生成情報に基づき高周波数信号を生成すると判断された場合、周波数包絡調整部10iから出力される高周波数信号の複数のサブバンド信号の時間包絡の形状も修正する(S370-1)。
周波数包絡調整部10iから出力される高周波数信号の複数のサブバンド信号の時間包絡形状の修正では、周波数包絡調整部10iより分離した形で出力された高周波数信号を構成する成分のうち少なくとも一つ以上の時間包絡形状を修正してもよい。
[第28の実施形態の音声復号装置の第1の変形例]
図385は、第28の実施形態に係る音声復号装置の第1の変形例370Aの構成を示す図である。
図386は、第28の実施形態に係る音声復号装置の第1の変形例370Aの動作を示すフローチャートである。
本変形例と前記第28の実施形態に係る音声復号装置370との相違点は、低周波数時間包絡形状決定部10eC(10e、10eA、10eBでも良いことは明白)及び高周波数時間包絡形状決定部13aC(13a、13aA、13aBでもよいことは明白)にかえて時間包絡形状決定部360bを具備する点である。
時間包絡修正部370aAは、前記時間包絡形状決定部360bから受け取る時間包絡形状に基づいて、分析フィルタバンク部10cから出力される低周波数信号の複数のサブバンド信号の時間包絡の形状を修正し、前記高周波数信号生成情報に基づき高周波数信号を生成すると判断された場合、周波数包絡調整部10iから出力される高周波数信号の複数のサブバンド信号の時間包絡の形状を修正する(S360-1a)。
周波数包絡調整部10iから出力される高周波数信号の複数のサブバンド信号の時間包絡形状の修正では、周波数包絡調整部10iより分離した形で出力された高周波数信号を構成する成分のうち少なくとも一つ以上の時間包絡形状を修正してもよい。
[第29の実施形態の音声復号装置]
図387は、第29の実施形態に係る音声復号装置380の構成を示す図である。
図388は、第29の実施形態に係る音声復号装置380の動作を示すフローチャートである。
時間包絡修正部380aは、低周波数時間包絡形状決定部100cで決定される時間包絡形状と、高周波数時間包絡形状決定部110bで決定される時間包絡形状のうち少なくとも一つ以上に基づいて、低周波数復号部100bから出力される低周波数信号と高周波数復号部100eから出力される高周波数信号の時間包絡の形状を修正する(S380-1)。
低周波数時間包絡形状決定部100cで決定される時間包絡形状と高周波数時間包絡形状決定部110bで決定される時間包絡形状は同一であってもよく、異なってもよい。
[第29の実施形態の音声復号装置の第1の変形例]
図389は、第29の実施形態に係る音声復号装置の第1の変形例380Aの構成を示す図である。
図390は、第29の実施形態に係る音声復号装置の第1の変形例380Aの動作を示すフローチャートである。
本変形例と前記第29の実施形態に係る音声復号装置380との相違点は、低周波数時間包絡形状決定部100c及び高周波数時間包絡形状決定部110bにかえて時間包絡形状決定部120fを、時間包絡修正部380aにかえて時間包絡修正部380aAを具備する点である。
時間包絡修正部380aAは、前記時間包絡形状決定部120fにて決定される時間包絡形状に基づいて、低周波数復号部100bから出力される低周波数信号と高周波数復号部100eから出力される高周波数信号の時間包絡の形状を修正する(S380-1a)。
[第30の実施形態の音声復号装置]
図391は、第30の実施形態に係る音声復号装置390の構成を示す図である。
図392は、第30の実施形態に係る音声復号装置390の動作を示すフローチャートである。
本変形例においては、時間包絡修正部380aAは、時間包絡形状決定部120fにて決定される時間包絡形状に基づいて、低周波数復号部100bから出力される低周波数信号の時間包絡の形状を修正し、前記高周波数信号生成情報に基づき高周波数信号を生成すると判断された場合、高周波数復号部100eから出力される高周波数信号の時間包絡の形状も修正する(S380-1a)。
出願人は、上記の目的を達成するために、以下の第1〜第4の態様に係る音声復号装置を発明した。
第1の態様に係る音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、前記符号化された音声信号を含む符号化系列を解析する符号化系列解析部と、前記符号化系列解析部から前記符号化された音声信号を含む符号化系列を受け取り、復号して音声信号を得る音声復号部と、前記符号化系列解析部及び前記音声復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて、復号された音声信号の時間包絡形状を決定する時間包絡形状決定部と、前記時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された音声信号の時間包絡形状を修正し出力する時間包絡修正部と、を備えることを特徴とする。
第2の態様に係る音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第2の情報を受け取り、当該第2の情報に基づいて、復号された低周波数信号の時間包絡形状を決定する低周波数時間包絡形状決定部と、前記低周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正部と、前記低周波数時間包絡修正部から時間包絡形状を修正された低周波数信号を受け取り、前記高周波数復号部から高周波数信号を受け取り、前記時間包絡形状を修正された低周波数信号と前記高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部と、を備えることを特徴とする。
第3の態様に係る音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより第2の情報を受け取り、当該第2の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定部と、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数復号部から低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡形状を修正された高周波数信号を受け取り、前記低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部と、を備えることを特徴とする。
第4の態様に係る音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第2の情報を受け取り、当該第2の情報に基づいて、復号された低周波数信号の時間包絡形状を決定する低周波数時間包絡形状決定部と、前記低周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより第3の情報を受け取り、当該第3の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定部と、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数時間包絡修正部から時間包絡形状を修正された低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡形状を修正された高周波数信号を受け取り、前記時間包絡形状を修正された低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部と、を備えることを特徴とする。
なお、第2又は第4の態様に係る音声復号装置において、前記高周波数復号部は、前記符号化系列逆多重化部、前記低周波数復号部及び前記低周波数時間包絡修正部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成してもよい。
また、第1〜第4の態様に係る音声復号装置において、前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づいて、前記高周波数復号部にて高周波数信号を生成する際の中間信号の時間包絡形状を修正し、前記高周波数復号部は、前記時間包絡形状を修正された前記中間信号を用いて、残存する高周波数信号を生成する処理を実施してもよい。
ここで、前記高周波数復号部は、前記低周波数復号部にて復号された低周波数信号を受け取り、当該信号をサブバンド信号に分割する分析フィルタ部と、少なくとも前記分析フィルタ部で分割されたサブバンド信号を用いて高周波数信号を生成する高周波数信号生成部と、前記高周波数信号生成部で生成された高周波数信号の周波数包絡を調整する周波数包絡調整部と、を備え、前記中間信号は、前記高周波数信号生成部で生成された高周波数信号であってもよい。
上述した第1〜第4の態様に係る音声復号装置の発明は、音声復号方法の発明として捉えることができ、以下のように記述することができる。
第1の態様に係る音声復号方法は、符号化された音声信号を復号して音声信号を出力する音声復号装置、により実行される音声復号方法であって、前記符号化された音声信号を含む符号化系列を解析する符号化系列解析ステップと、解析後の前記符号化された音声信号を含む符号化系列を受け取り、復号して音声信号を得る音声復号ステップと、前記符号化系列解析ステップ及び前記音声復号ステップのうち少なくとも一つで得られた情報を受け取り、当該情報に基づいて、復号された音声信号の時間包絡形状を決定する時間包絡形状決定ステップと、前記時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記復号された音声信号の時間包絡形状を修正し出力する時間包絡修正ステップと、を備えることを特徴とする。
第2の態様に係る音声復号方法は、符号化された音声信号を復号して音声信号を出力する音声復号装置、により実行される音声復号方法であって、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化ステップと、分割により得られた前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた第2の情報を受け取り、当該第2の情報に基づいて、復号された低周波数信号の時間包絡形状を決定する低周波数時間包絡形状決定ステップと、前記低周波数時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正ステップと、前記低周波数時間包絡修正ステップで得られた前記時間包絡形状を修正された低周波数信号を受け取り、前記高周波数復号ステップで得られた高周波数信号を受け取り、前記時間包絡形状を修正された低周波数信号と前記高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成ステップと、を備えることを特徴とする。
第3の態様に係る音声復号方法は、符号化された音声信号を復号して音声信号を出力する音声復号装置、により実行される音声復号方法であって、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化ステップと、分割により得られた前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号ステップと、前記符号化系列逆多重化ステップ、前記低周波数復号ステップ、及び前記高周波数復号ステップのうち少なくとも一つで得られた第2の情報を受け取り、当該第2の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定ステップと、前記高周波数時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正ステップと、前記低周波数復号ステップで得られた低周波数信号を受け取り、前記高周波数時間包絡修正ステップで得られた前記時間包絡形状を修正された高周波数信号を受け取り、前記低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成ステップと、を備えることを特徴とする。
第4の態様に係る音声復号方法は、符号化された音声信号を復号して音声信号を出力する音声復号装置、により実行される音声復号方法であって、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化ステップと、前記符号化系列逆多重化ステップで得られた前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた第2の情報を受け取り、当該第2の情報に基づいて、復号された低周波数信号の時間包絡形状を決定する低周波数時間包絡形状決定ステップと、前記低周波数時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正ステップと、前記符号化系列逆多重化ステップ、前記低周波数復号ステップ、及び前記高周波数復号ステップのうち少なくとも一つより第3の情報を受け取り、当該第3の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定ステップと、前記高周波数時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正ステップと、前記低周波数時間包絡修正ステップで得られた前記時間包絡形状を修正された低周波数信号を受け取り、前記高周波数時間包絡修正ステップで得られた前記時間包絡形状を修正された高周波数信号を受け取り、前記時間包絡形状を修正された低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成ステップと、を備えることを特徴とする。
また、上述した第1〜第4の態様に係る音声復号装置の発明は、音声復号プログラムの発明として捉えることができ、以下のように記述することができる。
第1の態様に係る音声復号プログラムは、符号化された音声信号を復号して音声信号を出力する音声復号装置、に設けられたコンピュータを、前記符号化された音声信号を含む符号化系列を解析する符号化系列解析部と、前記符号化系列解析部から前記符号化された音声信号を含む符号化系列を受け取り、復号して音声信号を得る音声復号部と、前記符号化系列解析部及び前記音声復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて、復号された音声信号の時間包絡形状を決定する時間包絡形状決定部と、前記時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された音声信号の時間包絡形状を修正し出力する時間包絡修正部、として機能させることを特徴とする。
第2の態様に係る音声復号プログラムは、符号化された音声信号を復号して音声信号を出力する音声復号装置、に設けられたコンピュータを、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第2の情報を受け取り、当該第2の情報に基づいて、復号された低周波数信号の時間包絡形状を決定する低周波数時間包絡形状決定部と、前記低周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正部と、前記低周波数時間包絡修正部から時間包絡形状を修正された低周波数信号を受け取り、前記高周波数復号部から高周波数信号を受け取り、前記時間包絡形状を修正された低周波数信号と前記高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部、として機能させることを特徴とする。
第3の態様に係る音声復号プログラムは、符号化された音声信号を復号して音声信号を出力する音声復号装置、に設けられたコンピュータを、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより第2の情報を受け取り、当該第2の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定部と、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数復号部から低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡形状を修正された高周波数信号を受け取り、前記低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部、として機能させることを特徴とする。
第4の態様に係る音声復号プログラムは、符号化された音声信号を復号して音声信号を出力する音声復号装置、に設けられたコンピュータを、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより第2の情報を受け取り、当該第2の情報に基づいて、復号された低周波数信号の時間包絡形状を決定する低周波数時間包絡形状決定部と、前記低周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより第3の情報を受け取り、当該第3の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定部と、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数時間包絡修正部から時間包絡形状を修正された低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡形状を修正された高周波数信号を受け取り、前記時間包絡形状を修正された低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部、として機能させることを特徴とする。
出願人は、上記の目的を達成するために、以下の第1〜第4の態様に係る音声符号化装置を発明した。
第1の態様に係る音声符号化装置は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置であって、前記音声信号を符号化する音声符号化部と、前記音声信号の時間包絡情報を算出し符号化する時間包絡情報符号化部と、前記音声符号化部で得られる前記音声信号を含む符号化系列と、前記時間包絡情報符号化部で得られる時間包絡情報の符号化系列とを多重化する符号化系列多重化部と、を備えることを特徴とする。
第2の態様に係る音声符号化装置は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置であって、前記音声信号の低周波数成分を符号化する低周波数符号化部と、前記音声信号の高周波数成分を符号化する高周波数符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、及び当該低周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、低周波数成分の時間包絡情報を算出し符号化する低周波数時間包絡情報符号化部と、前記低周波数符号化部で得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化部で得られる前記高周波数成分を含む符号化系列と、前記低周波数時間包絡情報符号化部で得られる低周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化部と、を備えることを特徴とする。
第3の態様に係る音声符号化装置は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置であって、前記音声信号の低周波数成分を符号化する低周波数符号化部と、前記音声信号の高周波数成分を符号化する高周波数符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、当該低周波数符号化過程で得られる情報、前記高周波数符号化部の符号化結果、及び当該高周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、高周波数成分の時間包絡情報を算出し符号化する高周波数時間包絡情報符号化部と、前記低周波数符号化部で得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化部で得られる前記高周波数成分を含む符号化系列と、前記高周波数時間包絡情報符号化部で得られる高周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化部と、を備えることを特徴とする。
第4の態様に係る音声符号化装置は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置であって、前記音声信号の低周波数成分を符号化する低周波数符号化部と、前記音声信号の高周波数成分を符号化する高周波数符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、及び当該低周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、低周波数成分の時間包絡情報を算出し符号化する低周波数時間包絡情報符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、当該低周波数符号化過程で得られる情報、前記高周波数符号化部の符号化結果、及び当該高周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、高周波数成分の時間包絡情報を算出し符号化する高周波数時間包絡情報符号化部と、前記低周波数符号化部で得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化部で得られる前記高周波数成分を含む符号化系列と、前記低周波数時間包絡情報符号化部で得られる低周波数成分の時間包絡情報の符号化系列と、前記高周波数時間包絡情報符号化部で得られる高周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化部と、を備えることを特徴とする。
上述した第1〜第4の態様に係る音声符号化装置の発明は、音声符号化方法の発明として捉えることができ、以下のように記述することができる。
第1の態様に係る音声符号化方法は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、により実行される音声符号化方法であって、前記音声信号を符号化する音声符号化ステップと、前記音声信号の時間包絡情報を算出し符号化する時間包絡情報符号化ステップと、前記音声符号化ステップで得られる前記音声信号を含む符号化系列と、前記時間包絡情報符号化ステップで得られる時間包絡情報の符号化系列とを多重化する符号化系列多重化ステップと、を備えることを特徴とする。
第2の態様に係る音声符号化方法は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、により実行される音声符号化方法であって、前記音声信号の低周波数成分を符号化する低周波数符号化ステップと、前記音声信号の高周波数成分を符号化する高周波数符号化ステップと、前記音声信号、前記低周波数符号化ステップの符号化結果、及び当該低周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、低周波数成分の時間包絡情報を算出し符号化する低周波数時間包絡情報符号化ステップと、前記低周波数符号化ステップで得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化ステップで得られる前記高周波数成分を含む符号化系列と、前記低周波数時間包絡情報符号化ステップで得られる低周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化ステップと、を備えることを特徴とする。
第3の態様に係る音声符号化方法は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、により実行される音声符号化方法であって、前記音声信号の低周波数成分を符号化する低周波数符号化ステップと、前記音声信号の高周波数成分を符号化する高周波数符号化ステップと、前記音声信号、前記低周波数符号化ステップの符号化結果、当該低周波数符号化過程で得られる情報、前記高周波数符号化ステップの符号化結果、及び当該高周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、高周波数成分の時間包絡情報を算出し符号化する高周波数時間包絡情報符号化ステップと、前記低周波数符号化ステップで得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化ステップで得られる前記高周波数成分を含む符号化系列と、前記高周波数時間包絡情報符号化ステップで得られる高周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化ステップと、を備えることを特徴とする。
第4の態様に係る音声符号化方法は、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、により実行される音声符号化方法であって、前記音声信号の低周波数成分を符号化する低周波数符号化ステップと、前記音声信号の高周波数成分を符号化する高周波数符号化ステップと、前記音声信号、前記低周波数符号化ステップの符号化結果、及び当該低周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、低周波数成分の時間包絡情報を算出し符号化する低周波数時間包絡情報符号化ステップと、前記音声信号、前記低周波数符号化ステップの符号化結果、当該低周波数符号化過程で得られる情報、前記高周波数符号化ステップの符号化結果、及び当該高周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、高周波数成分の時間包絡情報を算出し符号化する高周波数時間包絡情報符号化ステップと、前記低周波数符号化ステップで得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化ステップで得られる前記高周波数成分を含む符号化系列と、前記低周波数時間包絡情報符号化ステップで得られる低周波数成分の時間包絡情報の符号化系列と、前記高周波数時間包絡情報符号化ステップで得られる高周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化ステップと、を備えることを特徴とする。
また、上述した第1〜第4の態様に係る音声符号化装置の発明は、音声符号化プログラムの発明として捉えることができ、以下のように記述することができる。
第1の態様に係る音声符号化プログラムは、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、に設けられたコンピュータを、前記音声信号を符号化する音声符号化部と、前記音声信号の時間包絡情報を算出し符号化する時間包絡情報符号化部と、前記音声符号化部で得られる前記音声信号を含む符号化系列と、前記時間包絡情報符号化部で得られる時間包絡情報の符号化系列とを多重化する符号化系列多重化部、として機能させることを特徴とする。
第2の態様に係る音声符号化プログラムは、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、に設けられたコンピュータを、前記音声信号の低周波数成分を符号化する低周波数符号化部と、前記音声信号の高周波数成分を符号化する高周波数符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、及び当該低周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、低周波数成分の時間包絡情報を算出し符号化する低周波数時間包絡情報符号化部と、前記低周波数符号化部で得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化部で得られる前記高周波数成分を含む符号化系列と、前記低周波数時間包絡情報符号化部で得られる低周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化部、として機能させることを特徴とする。
第3の態様に係る音声符号化プログラムは、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、に設けられたコンピュータを、前記音声信号の低周波数成分を符号化する低周波数符号化部と、前記音声信号の高周波数成分を符号化する高周波数符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、当該低周波数符号化過程で得られる情報、前記高周波数符号化部の符号化結果、及び当該高周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、高周波数成分の時間包絡情報を算出し符号化する高周波数時間包絡情報符号化部と、前記低周波数符号化部で得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化部で得られる前記高周波数成分を含む符号化系列と、前記高周波数時間包絡情報符号化部で得られる高周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化部、として機能させることを特徴とする。
第4の態様に係る音声符号化プログラムは、入力される音声信号を符号化して符号化系列を出力する音声符号化装置、に設けられたコンピュータを、前記音声信号の低周波数成分を符号化する低周波数符号化部と、前記音声信号の高周波数成分を符号化する高周波数符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、及び当該低周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、低周波数成分の時間包絡情報を算出し符号化する低周波数時間包絡情報符号化部と、前記音声信号、前記低周波数符号化部の符号化結果、当該低周波数符号化過程で得られる情報、前記高周波数符号化部の符号化結果、及び当該高周波数符号化過程で得られる情報のうち少なくとも一つ以上に基づいて、高周波数成分の時間包絡情報を算出し符号化する高周波数時間包絡情報符号化部と、前記低周波数符号化部で得られる前記低周波数成分を含む符号化系列と、前記高周波数符号化部で得られる前記高周波数成分を含む符号化系列と、前記低周波数時間包絡情報符号化部で得られる低周波数成分の時間包絡情報の符号化系列と、前記高周波数時間包絡情報符号化部で得られる高周波数成分の時間包絡情報の符号化系列とを多重化する符号化系列多重化部、として機能させることを特徴とする。
出願人は、上記の目的を達成するために、さらに以下の第5及び第6の態様に係る音声復号装置を発明した。
第5の態様に係る音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、前記符号化された音声信号を含む符号化系列を、少なくとも符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列に分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより情報を受け取り、復号された低周波数信号及び生成された高周波数信号の時間包絡形状を決定する時間包絡形状決定部と、前記時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正部と、前記時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数時間包絡修正部から時間包絡を修正された低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡を修正された高周波数信号を受け取り、出力する音声信号を合成する低周波数/高周波数信号合成部と、を備えることを特徴とする。
第6の態様に係る音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、前記符号化された音声信号を含む符号化系列を、少なくとも符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列に分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより情報を受け取り、復号された低周波数信号及び生成された高周波数信号の時間包絡形状を決定する時間包絡形状決定部と、前記低周波数復号部から復号された低周波数信号を受け取り、前記高周波数復号部から生成された高周波数信号を受け取り、前記時間包絡形状決定部にて決定された時間包絡形状に基づき、前記復号された低周波数信号及び前記生成された高周波数信号の時間包絡形状を修正し出力する時間包絡修正部と、前記時間包絡修正部から時間包絡を修正された低周波数信号及び高周波数信号を受け取り、出力する音声信号を合成する低周波数/高周波数信号合成部と、を備えることを特徴とする。
なお、第5の態様に係る音声復号装置において、前記高周波数復号部は、前記符号化系列逆多重化部、前記低周波数復号部及び前記低周波数時間包絡修正部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成してもよい。
また、第5の態様に係る音声復号装置において、前記高周波数時間包絡修正部は、前記時間包絡形状決定部にて決定された時間包絡形状に基づいて、前記高周波数復号部にて高周波数信号を生成する際の中間信号の時間包絡形状を修正し、前記高周波数復号部は、前記時間包絡形状を修正された前記中間信号を用いて、残存する高周波数信号を生成する処理を実施してもよい。
また、第6の態様に係る音声復号装置において、前記高周波数復号部は、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成してもよい。
また、第6の態様に係る音声復号装置において、前記時間包絡修正部は、前記時間包絡形状決定部にて決定された時間包絡形状に基づいて、前記高周波数復号部にて高周波数信号を生成する際の中間信号の時間包絡形状を修正し、前記高周波数復号部は、前記時間包絡形状を修正された前記中間信号を用いて、残存する高周波数信号を生成する処理を実施してもよい。
ここで、前記高周波数復号部は、前記低周波数復号部にて復号された低周波数信号を受け取り、当該信号をサブバンド信号に分割する分析フィルタ部と、少なくとも前記分析フィルタ部で分割されたサブバンド信号を用いて高周波数信号を生成する高周波数信号生成部と、前記高周波数信号生成部で生成された高周波数信号の周波数包絡を調整する周波数包絡調整部と、を備え、前記中間信号は、前記高周波数信号生成部で生成された高周波数信号であってもよい。
上述した第5及び第6の態様に係る音声復号装置の発明は、音声復号方法の発明として捉えることができ、以下のように記述することができる。
第5の態様に係る音声復号方法は、符号化された音声信号を復号して音声信号を出力する音声復号装置、により実行される音声復号方法であって、前記符号化された音声信号を含む符号化系列を、少なくとも符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列に分割する符号化系列逆多重化ステップと、分割により得られた前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた情報を受け取り、当該情報に基づいて高周波数信号を生成する高周波数復号ステップと、前記符号化系列逆多重化ステップ、前記低周波数復号ステップ、及び前記高周波数復号ステップのうち少なくとも一つで得られた情報を受け取り、復号された低周波数信号及び生成された高周波数信号の時間包絡形状を決定する時間包絡形状決定ステップと、前記時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正ステップと、前記時間包絡形状決定ステップにて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正ステップと、前記低周波数時間包絡修正ステップで得られた時間包絡を修正された低周波数信号を受け取り、前記高周波数時間包絡修正ステップで得られた時間包絡を修正された高周波数信号を受け取り、出力する音声信号を合成する低周波数/高周波数信号合成ステップと、を備えることを特徴とする。
第6の態様に係る音声復号方法は、符号化された音声信号を復号して音声信号を出力する音声復号装置、により実行される音声復号方法であって、前記符号化された音声信号を含む符号化系列を、少なくとも符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列に分割する符号化系列逆多重化ステップと、分割により得られた前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号ステップと、前記符号化系列逆多重化ステップ及び前記低周波数復号ステップのうち少なくとも一つで得られた情報を受け取り、当該情報に基づいて高周波数信号を生成する高周波数復号ステップと、前記符号化系列逆多重化ステップ、前記低周波数復号ステップ、及び前記高周波数復号ステップのうち少なくとも一つで得られた情報を受け取り、復号された低周波数信号及び生成された高周波数信号の時間包絡形状を決定する時間包絡形状決定ステップと、前記低周波数復号ステップで得られた復号された低周波数信号を受け取り、前記高周波数復号ステップで得られた生成された高周波数信号を受け取り、前記時間包絡形状決定ステップにて決定された時間包絡形状に基づき、前記復号された低周波数信号及び前記生成された高周波数信号の時間包絡形状を修正し出力する時間包絡修正ステップと、前記時間包絡修正ステップで得られた時間包絡を修正された低周波数信号及び高周波数信号を受け取り、出力する音声信号を合成する低周波数/高周波数信号合成ステップと、を備えることを特徴とする。
また、上述した第5及び第6の態様に係る音声復号装置の発明は、音声復号プログラムの発明として捉えることができ、以下のように記述することができる。
第5の態様に係る音声復号プログラムは、符号化された音声信号を復号して音声信号を出力する音声復号装置、に設けられたコンピュータを、前記符号化された音声信号を含む符号化系列を、少なくとも符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列に分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより情報を受け取り、復号された低周波数信号及び生成された高周波数信号の時間包絡形状を決定する時間包絡形状決定部と、前記時間包絡形状決定部にて決定された時間包絡形状に基づき前記復号された低周波数信号の時間包絡形状を修正し出力する低周波数時間包絡修正部と、前記時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数時間包絡修正部から時間包絡を修正された低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡を修正された高周波数信号を受け取り、出力する音声信号を合成する低周波数/高周波数信号合成部、として機能させることを特徴とする。
第6の態様に係る音声復号プログラムは、符号化された音声信号を復号して音声信号を出力する音声復号装置、に設けられたコンピュータを、前記符号化された音声信号を含む符号化系列を、少なくとも符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列に分割する符号化系列逆多重化部と、前記符号化系列逆多重化部から前記符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記符号化系列逆多重化部及び前記低周波数復号部のうち少なくとも一つより情報を受け取り、当該情報に基づいて高周波数信号を生成する高周波数復号部と、前記符号化系列逆多重化部、前記低周波数復号部、及び前記高周波数復号部のうち少なくとも一つより情報を受け取り、復号された低周波数信号及び生成された高周波数信号の時間包絡形状を決定する時間包絡形状決定部と、前記低周波数復号部から復号された低周波数信号を受け取り、前記高周波数復号部から生成された高周波数信号を受け取り、前記時間包絡形状決定部にて決定された時間包絡形状に基づき、前記復号された低周波数信号及び前記生成された高周波数信号の時間包絡形状を修正し出力する時間包絡修正部と、前記時間包絡修正部から時間包絡を修正された低周波数信号及び高周波数信号を受け取り、出力する音声信号を合成する低周波数/高周波数信号合成部、として機能させることを特徴とする。
本発明の音声復号装置は、符号化された音声信号を復号して音声信号を出力する音声復号装置であって、符号化された低周波数信号の情報を含む符号化系列を受け取り、復号して低周波数信号を得る低周波数復号部と、前記低周波数復号部より第1の情報を受け取り、当該第1の情報に基づいて高周波数信号を生成する高周波数復号部と、符号化装置から送信された第2の情報に基づいて、生成された高周波数信号の時間包絡形状を決定する高周波数時間包絡形状決定部と、前記高周波数時間包絡形状決定部にて決定された時間包絡形状に基づき前記生成された高周波数信号の時間包絡形状を修正し出力する高周波数時間包絡修正部と、前記低周波数復号部から低周波数信号を受け取り、前記高周波数時間包絡修正部から時間包絡形状を修正された高周波数信号を受け取り、前記低周波数信号と前記時間包絡形状を修正された高周波数信号とを合成することで、出力する音声信号を得る低周波数/高周波数信号合成部と、を備え、前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて時間包絡形状が平坦であると決定された場合、前記生成された高周波数信号のうち、時間セグメント内の任意の前記生成された高周波数信号を使って時間包絡形状を修正し出力し、前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて時間包絡形状が平坦であると決定された場合、xdec(i)(t(l)≦i<t(l+1))を任意の時間セグメント内の高周波数信号としたときに、
Figure 2019144591

を使って得られる信号を、時間包絡形状が修正された高周波数信号として出力する。
また、本発明の音声復号装置は、前記符号化された音声信号を含む符号化系列を、少なくとも、符号化された前記音声信号の低周波数信号の情報を含む符号化系列と、符号化された前記音声信号の高周波数信号の情報を含む符号化系列とに分割する符号化系列逆多重化部、をさらに備えることとしてもよい。
また、本発明の音声復号装置において、前記高周波数時間包絡修正部は、前記高周波数時間包絡形状決定部にて時間包絡形状が平坦であると決定された場合、xdec(i) (t(l)≦i<t(l+1))を任意の時間セグメント内の高周波数信号としたときに、
Figure 2019144591


Figure 2019144591

で除した結果に基づいて得られる信号を、時間包絡形状が修正された高周波数信号として出力することとしてもよい。
1、10、11、12、13、14、15、15A、16、17、18、18A、100、110、120、130、140、150、160、170、180、190、190A、300、310、320、320A、330、340、350、350A、360、370、380、390…音声復号装置、1a、10d、13c…符号化系列解析部、1b…音声復号部、1c、16f、120f、360b…時間包絡形状決定部、1d、13a、13b、14a、15a、15aA、16c、17a、18a、18aA、300a、300aA、360a、360aA、370a、370aA、380a、380aA…時間包絡修正部、2、20、20A、21、22、23、24、25、26、27、28、200、210、220、230、240、250、260、270、280、290、400、410、420、430、440、450…音声符号化装置、2a…音声符号化部、2b、20g、20gA、21a、21aA、22b、22bA、22bB、23a、23aA、24c、25b、26a、26aA、27a、28a、270b、280a、290a、400a、410a、420a…時間包絡情報符号化部、2c、20h、200d、210b、220b、250b、250c、270c…符号化系列多重化部、10a、10aA、100a、110a、120a、150a、170a…符号化系列逆多重化部、10b…コア復号部、10c、20c、20c1…分析フィルタバンク部、10e、10eA、10eB、10eC、16b、100c、120c…低周波数時間包絡形状決定部、10f、12a、16e、100d、120e…低周波数時間包絡修正部、10g…高周波数信号生成部、10h…復号/逆量子化部、10i、25a…周波数包絡調整部、10j、170c…合成フィルタバンク部、13a、13aA、13aB、13aC、14b、16a、16d、110b、120b、120bA…高周波数時間包絡形状決定部、20a…ダウンサンプリング部、20b…コア符号化部、20d…制御パラメータ符号化部、20e、270d…包絡算出部、20f…量子化/符号化部、20i…コア復号信号生成部、20j、24b…サブバンド信号パワー算出部、22a、22a1、22aB…時間包絡算出部、24a、410b…擬似高周波数信号生成部、100b…低周波数復号部、100e、110e、130b…高周波数復号部、100f、150c…低周波数/高周波数信号合成部、110c、120d、130a、140a、140b…高周波数時間包絡修正部、150b、170b…スイッチ群、200a…低周波数符号化部、200b…高周波数符号化部、200c…低周波数時間包絡情報符号化部、210a、220a、230a…高周波数信号生成制御情報符号化部、250a、270a…高周波数信号生成制御情報符号化部、360b…時間包絡決定部。

Claims (2)

  1. 入力される音声信号を符号化して符号化系列を出力する音声符号化装置であって、
    前記音声信号を符号化する音声符号化部と、
    前記音声信号の時間包絡情報を算出し符号化する時間包絡情報符号化部と、
    前記音声符号化部で得られる前記音声信号を含む符号化系列と、前記時間包絡情報符号化部で得られる時間包絡情報の符号化系列とを多重化する符号化系列多重化部と、
    を備え、
    前記時間包絡情報は、前記音声信号の高周波数信号の時間包絡の相加平均と相乗平均との比に基づいて生成される、
    音声符号化装置。
  2. 入力される音声信号を符号化して符号化系列を出力する音声符号化装置、により実行される音声符号化方法であって、
    前記音声信号を符号化する音声符号化ステップと、
    前記音声信号の時間包絡情報を算出し符号化する時間包絡情報符号化ステップと、
    前記音声符号化ステップで得られる前記音声信号を含む符号化系列と、前記時間包絡情報符号化ステップで得られる時間包絡情報の符号化系列とを多重化する符号化系列多重化ステップと、
    を備え、
    前記時間包絡情報は、前記音声信号の高周波数信号の時間包絡の相加平均と相乗平均との比に基づいて生成される、
    音声符号化方法。

JP2019087812A 2012-04-27 2019-05-07 音声復号装置 Active JP6793221B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012103519 2012-04-27
JP2012103519 2012-04-27

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017161393A Division JP6526126B2 (ja) 2012-04-27 2017-08-24 音声復号装置

Publications (2)

Publication Number Publication Date
JP2019144591A true JP2019144591A (ja) 2019-08-29
JP6793221B2 JP6793221B2 (ja) 2020-12-02

Family

ID=57009077

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2016099513A Active JP6200034B2 (ja) 2012-04-27 2016-05-18 音声復号装置
JP2017161393A Active JP6526126B2 (ja) 2012-04-27 2017-08-24 音声復号装置
JP2019087812A Active JP6793221B2 (ja) 2012-04-27 2019-05-07 音声復号装置

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2016099513A Active JP6200034B2 (ja) 2012-04-27 2016-05-18 音声復号装置
JP2017161393A Active JP6526126B2 (ja) 2012-04-27 2017-08-24 音声復号装置

Country Status (1)

Country Link
JP (3) JP6200034B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002268657A (ja) * 2001-03-09 2002-09-20 Nippon Telegr & Teleph Corp <Ntt> 音響信号の立ち上がり・立ち下がり検出方法及び装置並びにプログラム及び記録媒体
JP2005530206A (ja) * 2002-06-17 2005-10-06 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 合成されたスペクトル成分に適合するようにデコードされた信号の特性を使用するオーディオコーディングシステム
JP2008513848A (ja) * 2005-07-13 2008-05-01 シーメンス アクチエンゲゼルシヤフト 音声信号の帯域幅を疑似的に拡張するための方法および装置
JP2009545778A (ja) * 2006-07-31 2009-12-24 クゥアルコム・インコーポレイテッド 非アクティブフレームの広帯域符号化および復号化を行うためのシステム、方法、および装置
US20100063812A1 (en) * 2008-09-06 2010-03-11 Yang Gao Efficient Temporal Envelope Coding Approach by Prediction Between Low Band Signal and High Band Signal
JP2011034046A (ja) * 2009-04-03 2011-02-17 Ntt Docomo Inc 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、音声符号化プログラム及び音声復号プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751926B (zh) * 2008-12-10 2012-07-04 华为技术有限公司 信号编码、解码方法及装置、编解码系统
CN101770776B (zh) * 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统
JP4921611B2 (ja) * 2009-04-03 2012-04-25 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002268657A (ja) * 2001-03-09 2002-09-20 Nippon Telegr & Teleph Corp <Ntt> 音響信号の立ち上がり・立ち下がり検出方法及び装置並びにプログラム及び記録媒体
JP2005530206A (ja) * 2002-06-17 2005-10-06 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 合成されたスペクトル成分に適合するようにデコードされた信号の特性を使用するオーディオコーディングシステム
JP2008513848A (ja) * 2005-07-13 2008-05-01 シーメンス アクチエンゲゼルシヤフト 音声信号の帯域幅を疑似的に拡張するための方法および装置
JP2009545778A (ja) * 2006-07-31 2009-12-24 クゥアルコム・インコーポレイテッド 非アクティブフレームの広帯域符号化および復号化を行うためのシステム、方法、および装置
US20100063812A1 (en) * 2008-09-06 2010-03-11 Yang Gao Efficient Temporal Envelope Coding Approach by Prediction Between Low Band Signal and High Band Signal
JP2011034046A (ja) * 2009-04-03 2011-02-17 Ntt Docomo Inc 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、音声符号化プログラム及び音声復号プログラム

Also Published As

Publication number Publication date
JP2017204010A (ja) 2017-11-16
JP2016173595A (ja) 2016-09-29
JP6200034B2 (ja) 2017-09-20
JP6793221B2 (ja) 2020-12-02
JP6526126B2 (ja) 2019-06-05

Similar Documents

Publication Publication Date Title
JP5997592B2 (ja) 音声復号装置
JP6673957B2 (ja) 帯域幅拡張のための高周波数符号化/復号化方法及びその装置
US10366696B2 (en) Speech decoder with high-band generation and temporal envelope shaping
US10311884B2 (en) Advanced quantizer
JP6980871B2 (ja) 信号符号化方法及びその装置、並びに信号復号方法及びその装置
JP2016505168A (ja) 音声信号復号化または符号化の時間領域レベル調整
JP6200034B2 (ja) 音声復号装置
EP1497631A1 (en) Generating lsf vectors
JP2003233397A (ja) オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置
CN110998722B (zh) 低复杂性密集瞬态事件检测和译码
Nagisetty et al. Super-wideband fine spectrum quantization for low-rate high-quality MDCT coding mode of the 3GPP EVS codec
Wang et al. A new bit-allocation algorithm for AAC encoder based on linear prediction

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190507

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200317

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200518

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201013

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201109

R150 Certificate of patent or registration of utility model

Ref document number: 6793221

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250