JP5281169B2 - 過渡信号符号化方法及び装置、復号化方法及び装置、並びに処理システム - Google Patents

過渡信号符号化方法及び装置、復号化方法及び装置、並びに処理システム Download PDF

Info

Publication number
JP5281169B2
JP5281169B2 JP2011539886A JP2011539886A JP5281169B2 JP 5281169 B2 JP5281169 B2 JP 5281169B2 JP 2011539886 A JP2011539886 A JP 2011539886A JP 2011539886 A JP2011539886 A JP 2011539886A JP 5281169 B2 JP5281169 B2 JP 5281169B2
Authority
JP
Japan
Prior art keywords
subframe
signal
amplitude value
time envelope
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011539886A
Other languages
English (en)
Other versions
JP2012511184A (ja
Inventor
リュウ、ツェシン
チェン、ロンイン
ミャオ、レイ
フ、チェン
シャオ、ウェイ
タッデイ エルブ、マルセル
チャン、チン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=42316246&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP5281169(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2012511184A publication Critical patent/JP2012511184A/ja
Application granted granted Critical
Publication of JP5281169B2 publication Critical patent/JP5281169B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Description

本発明は、通信技術の分野に関し、特に、過渡信号符号化方法及び装置、復号化方法及び装置、並びに処理システムに関する。
発話(スピーチ)信号を符号化するためのビットレート数の制限と人間の聴覚特性への影響とにより、音声(オーディオ)符号化アルゴリズムにおいては、発話信号内の低周波帯域情報が常に最初に符号化される。狭帯域発話と比較して、広帯域発話は、より完全かつより自然な特性を有し、従って、発話信号を伝送するための帯域幅を増加させることによって音響品質を向上させることが可能である。発話信号を符号化するためのビットレート数が小さい場合、発話信号の帯域幅範囲を拡張し、発話信号の品質を向上させるために、帯域幅拡張技術を採用することが可能である。
近年、帯域幅拡張技術は、大幅に発展し、低音用スピーカの音響増強及び符号化された声及び音声(coded voice and audio)の高周波強調を含むいくつかの分野において商業用途が見出された。
現在の帯域幅拡張方法の中では、低周波帯域情報の符号化技術が既存の符号化及び復号化を採用し、高周波帯域情報の符号化及び復号化のプロセスの間、高周波帯域情報を符号化するために少数のビットが一般に採用され、復号化端において高周波帯域情報は高周波帯域と低周波帯域との間の相関を使用することによって回復される。
本発明の実施において、発明者は、過渡信号が非過渡信号の特性とは異なる以下の特性を有することを見出した。時間領域において過渡信号の信号エネルギーは大きな瞬時変化を有し、一方、周波数領域において過渡信号の周波数スペクトルは滑らかである。従来技術では、過渡信号の時間エンベロープ(time envelope)は修正されず、そして、フレームごとの時間−周波数変換及び周波数エンベロープの処理などの信号符号化プロセスにおける処理の影響により、過渡信号はプリエコーを生成する可能性があり、従って、従来技術は、復号化端において回復される過渡信号の効果が十分ではないという欠点を有する。
本発明は、過渡信号の回復の品質を向上させるように構成された過渡信号符号化方法及び装置、復号化方法及び装置、並びに処理システムに関する。
本発明の一実施形態は、過渡信号符号化方法を提供し、この方法は、
入力過渡信号の全てのサブフレームの時間エンベロープから、最大振幅値を有する最大時間エンベロープが位置している基準サブフレームを取得することと、
第1の差が予め設定された第1の閾値より大きくなるように基準サブフレームより前の各サブフレームの時間エンベロープの振幅値を調節することと、ここで、第1の差は、基準サブフレームより前の各サブフレームの時間エンベロープの振幅値と、最大時間エンベロープの振幅値との間の差であり、
調節された時間エンベロープをビットストリームに書き込むことと、を含む。
本発明の一実施形態は、過渡信号復号化方法を更に提供し、この方法は、
過渡信号の信号タイプを有する予め取得された信号の全てのサブフレームの時間エンベロープから、最大振幅値を有する最大時間エンベロープが位置している基準サブフレームを取得することと、
第1の差が予め設定された第1の閾値より大きくなるように基準サブフレームより前の各サブフレームの時間エンベロープの振幅値を調節することと、ここで、第1の差は、基準サブフレームより前の各サブフレームの時間エンベロープの振幅値と、最大時間エンベロープの振幅値との間の差であり、
調節された時間エンベロープに従って予め取得された時間領域信号を修正して、回復された過渡信号を取得することと、を含む。
本発明の一実施形態は、過渡信号符号化装置を更に提供し、この装置は、
入力過渡信号の全てのサブフレームの時間エンベロープから、最大振幅値を有する最大時間エンベロープが位置している基準サブフレームを取得するように構成された基準サブフレーム取得モジュールと、
第1の差が予め設定された第1の閾値より大きくなるように基準サブフレームより前の各サブフレームの時間エンベロープの振幅値を調節するように構成された第1の振幅値調節モジュールと(ここで、第1の差は、基準サブフレームより前の各サブフレームの時間エンベロープの振幅値と、最大時間エンベロープの振幅値との間の差であり)、
調節された時間エンベロープをビットストリームに書き込むように構成されたビットストリーム書き込みモジュールと、を含む。
本発明の一実施形態は、過渡信号復号化装置を更に提供し、この装置は、
過渡信号の信号タイプを有する予め取得された信号の全てのサブフレームの時間エンベロープから、最大振幅値を有する最大時間エンベロープが位置している基準サブフレームを取得するように構成された基準サブフレーム取得モジュールと、
第1の差が予め設定された第1の閾値より大きくなるように基準サブフレームより前の各サブフレームの時間エンベロープの振幅値を調節するように構成された第1の振幅値調節モジュールと(ここで、第1の差は、基準サブフレームより前の各サブフレームの時間エンベロープの振幅値と、最大時間エンベロープの振幅値との間の差であり)、
調節された時間エンベロープに従って予め取得された時間領域信号を修正して、回復された過渡信号を取得するように構成された時間領域信号修正モジュールと、を含む。
本発明の一実施形態は、過渡信号処理システムを更に提供し、このシステムは、
入力過渡信号の全てのサブフレームの時間エンベロープから、最大振幅値を有する最大時間エンベロープが位置している基準サブフレームを取得し、第1の差が予め設定された第1の閾値より大きくなるように基準サブフレームより前の各サブフレームの時間エンベロープの振幅値を調節し、調節された時間エンベロープをビットストリームに書き込むように構成された過渡信号符号化装置と(ここで、第1の差は、基準サブフレームより前の各サブフレームの時間エンベロープの振幅値と、最大時間エンベロープの振幅値との間の差であり)、
受信したビットストリームの時間エンベロープに従って予め取得された時間領域信号を修正して、回復された過渡信号を取得するように構成された過渡信号復号化装置と、を含む。
本発明の一実施形態は、別の過渡信号処理システムを更に提供し、このシステムは、
過渡信号の各サブフレームの時間エンベロープをビットストリームに書き込むように構成された過渡信号符号化装置と、
受信したビットストリームの信号の全てのサブフレームの時間エンベロープから、最大振幅値を有する最大時間エンベロープが位置している基準サブフレームを取得し、第1の差が予め設定された第1の閾値より大きくなるように基準サブフレームより前の各サブフレームの時間エンベロープの振幅値を調節し、調節された時間エンベロープに従って予め取得された時間領域信号を修正して、回復された過渡信号を取得するように構成された過渡信号復号化装置と、を含み、ここで、第1の差は、基準サブフレームより前の各サブフレームの時間エンベロープの振幅値と、最大時間エンベロープの振幅値との間の差である。
本発明の過渡信号符号化方法及び装置、復号化方法及び装置、並びに処理システムによれば、過渡信号の特性に従って時間エンベロープが修正され、その結果、最大振幅値を有する時間エンベロープの振幅値と、最大振幅値を有する時間エンベロープに対応するサブフレームより前のその他のサブフレームの時間エンベロープの振幅値との間の差がより明確になり、これにより、過渡信号の回復の効果が向上する。
本発明による技術的解決法をより明確にするために、本発明の実施形態又は従来技術を示す添付の図面について、以下に概説する。明らかに、添付の図面は、例示のみを目的とするものであり、当業者は、いかなる創造的な活動も行うことなく、そのような添付の図面から、その他の図面を導き出すことが可能である。
本発明の第1の実施形態による過渡信号符号化方法のフローチャートである。 本発明の第2の実施形態による過渡信号符号化方法のフローチャートである。 本発明の第2の実施形態による過渡信号の時間エンベロープを修正する符号化端の一実施形態のブロック図である。 本発明の第3の実施形態による過渡信号復号化方法のフローチャートである。 本発明の第4の実施形態による過渡信号復号化方法のフローチャートである。 本発明の第4の実施形態による過渡信号の時間エンベロープを修正する復号化端の一実施形態のブロック図である。 本発明の第5の実施形態による過渡信号符号化装置の概略構成図である。 本発明の第6の実施形態による過渡信号符号化装置の概略構成図である。 本発明の第7の実施形態による過渡信号復号化装置の概略構成図である。 本発明の第8の実施形態による過渡信号復号化装置の概略構成図である。 本発明の第9の実施形態による過渡信号処理システムの概略構成図である。
本発明の技術的解決法について、更に、添付の図面及び以下の実施形態を参照して詳細に説明する。本発明の実施形態による技術的解決法について、添付の図面を参照して、以下に、明確かつ完全に説明する。説明する実施形態は、本発明の実施形態の全てではなく、一部にすぎないということは明らかである。当業者によって、本発明の実施形態に基づいて、創造的な活動なしに得られる、他の全ての実施形態は、本発明の保護範囲内に入る。
図1は、本発明の第1の実施形態による過渡信号符号化方法のフローチャートである。図1に示すように、本方法は以下のステップを含む。
ステップ11において、入力過渡信号の全てのサブフレームの時間エンベロープから、最大振幅値を有する時間エンベロープ(すなわち、最大時間エンベロープ)が位置しているサブフレームが取得され、ここで、このサブフレームは、本発明の実施形態において記載される基準サブフレームである。
入力信号を符号化するためのビット数が不十分である場合、高周波帯域情報を符号化するプロセスの間、少数のビットが高周波帯域の重要な情報を符号化するために一般に採用され、利用可能なビットの数が一定である場合、高周波帯域情報をより良好に回復するために、異なるタイプの信号に対して異なる符号化技術が採用されるように、入力信号が分類されてもよく、例えば、入力信号が過渡信号と非過渡信号とに分類されてもよい。本実施形態は、主に過渡信号の処理に関する。
本発明の実施形態による時間エンベロープを取得する方法は、入力信号を1つ以上のサブフレームに分割し、各サブフレームのエネルギー情報、例えば、各サブフレームのエネルギーと各サブフレームのエネルギー情報の平方根とを取得して、エネルギー情報を取得し、取得されたエネルギー情報を使用することによって入力時間領域信号の波形特性又は振幅トレンドを概略的に表すことを含む。
過渡信号の時間エンベロープが取得された後、時間エンベロープは過渡信号の特性に従って修正されてもよく、その結果、修正された時間エンベロープ内で過渡信号に含まれるサブフレームの時間エンベロープの振幅値の間の差がより明確になり、これは、最大振幅値を有する時間エンベロープの振幅値とその他の時間エンベロープの振幅値との間の差がより明確になるという点で特に表され、過渡信号の特性が強調される。
ステップ13において、第1の差が予め設定された第1の閾値より大きくなるように基準サブフレームより前の各サブフレームの時間エンベロープの振幅値が調節され、ここで、第1の差は、基準サブフレームより前の各サブフレームの時間エンベロープの振幅値と、最大時間エンベロープの振幅値との間の差である。
第1の閾値は、以下の方法によって決定されてもよい。すなわち、基準サブフレームより前の各サブフレームの時間エンベロープの振幅値を元の振幅値の1/8〜1/2に減少させ、サブフレームの時間エンベロープの調節された振幅値と基準サブフレームの時間エンベロープの振幅値との間の差を取得し、その差を第1の閾値として使用してもよい。
ステップ15において、調節された時間エンベロープがビットストリームに書き込まれる。
本技術的解決法に基づいて、時間エンベロープの調節は、基準サブフレームより後の各サブフレームの時間エンベロープの平均振幅値を計算し、平均振幅値が予め設定された基準値以下である場合、第2の差が予め設定された第2の閾値より大きくなるように基準サブフレームより後の各サブフレームの時間エンベロープの振幅値を調節することを更に含んでもよく、ここで、第2の差は、基準サブフレームより後の各サブフレームの時間エンベロープの振幅値と、最大時間エンベロープの振幅値との間の差である。
予め設定された基準値は、基準サブフレームの時間エンベロープの振幅値の1/3〜3/5であるように選択されてもよく、第2の閾値は、以下の方法によって決定されてもよい。すなわち、基準サブフレームより後の各サブフレームの時間エンベロープの振幅値を元の振幅値の1/8〜1/2に減少させ、サブフレームの時間エンベロープの調節された振幅値と、基準サブフレームの時間エンベロープの振幅値との間の差を取得し、その差を第2の閾値として使用してもよい。
基準サブフレーム以外の各サブフレームの時間エンベロープの振幅値が調節された後に、本技術的解決法における時間領域信号の調節は、過渡信号の各サブフレームの調節された時間エンベロープの平均エネルギーが予め設定された第3の閾値より大きくなるように基準サブフレームの時間エンベロープの振幅値を調節することを更に含んでもよい。
第3の閾値は、以下の条件を満たす範囲から選択されてもよい。過渡信号の各サブフレームの調節された時間エンベロープの平均エネルギーが、各サブフレームの調節された時間エンベロープの平均エネルギーと同等であり、例えば、前者は、後者の0.8〜1.2倍である。
復号化端において回復される過渡信号の品質を向上させるために、過渡信号に対応する時間エンベロープはより細かく符号化される必要がある。本実施形態では、過渡信号に対応する時間エンベロープを細かく符号化するプロセスの間、非過渡信号と区別される過渡信号の特性に従って、過渡信号の時間エンベロープが修正されてもよく、その結果、過渡信号によって含まれるサブフレームの時間エンベロープの振幅値の間の差がより明確になり、これにより、復号化端において回復される過渡信号の品質が向上する。
本実施形態では、過渡信号の時間エンベロープが過渡信号の特性に従って修正され、過渡信号のサブフレームの時間エンベロープの振幅値の間の差が拡大され、修正された時間エンベロープ情報が復号化端に送信され、従って、ビット数を消費することなく、過渡信号の位置情報が符号化され、符号化された位置情報が復号化端に送信され、すなわち、復号化端において回復される過渡信号の品質を向上させる技術的効果が、符号化端によって必要とされるビット数を増加させることなく実現されることが可能である。
図2は、本発明の第2の実施形態による過渡信号符号化方法のフローチャートである。図2に示すように、本方法は以下のステップを含む。
ステップ21において、入力信号が低周波帯域信号と高周波帯域信号とに分解され、低周波帯域信号に関しては、ステップ23が実行され、高周波帯域信号に関しては、ステップ25が実行される。
ステップ23において、入力信号内の低周波帯域信号のパラメータがビットストリームに入力され、ステップ217が実行される。
本実施形態では、低周波帯域信号(広帯域信号)のパラメータは、符号器を介してビットストリームに入力される。
ステップ25において、入力信号(高周波信号)の信号タイプが判定され、信号タイプ情報がビットストリームに入力され、ここで、信号タイプ情報は、入力信号(すなわち、現在符号化されている信号)が過渡信号であるか又は非過渡信号であるかを示すように構成される。
入力信号の信号タイプをより正確に判定するために、ステップ25は、ステップ2501〜2509(図示せず)を含んでもよい。
ステップ2501において、高周波帯域信号内の予め設定された数の連続したフレームを使用してロングフレームが形成され、ロングフレームの平均エネルギーが計算される。
ロングフレームを形成する一様式では、現在のフレームと現在フレームより前の2つのフレームとを含む3つの連続したフレームが結合されてロングフレームを形成し、又は、現在のフレームと現在のフレームより前のフレームと現在のフレームより後のフレームとを含む3つの連続したフレームが結合されてロングフレームを形成し、又は、いくつかのその他の連続したフレームが結合されてロングフレームを形成する。ロングフレームの平均エネルギーは、式(1)に従って計算されてもよい。
Figure 0005281169
式(1)において、gainは、ロングフレームの平均エネルギーであり、x[i]は、時間領域信号のi番目のサンプリング点の信号値であり、Nは、ロングフレーム全体のサンプリング点の総数である。
ステップ2503において、ロングフレームはいくつかのサブフレームに分割され、各サブフレームの平均エネルギーが計算される。
本実施形態では、各フレームが5msのフレーム長を有すると仮定され、その場合、ロングフレームのフレーム長は15msであり、ロングフレームのフレーム長は480のサンプリング点を含み、そして、ロングフレームが12のサブフレームに分割される場合、各サブフレームのフレーム長は40サンプリング点である。各サブフレームの平均エネルギーsub_gain[i]が計算される。
ステップ2505において、第3の差及び第4の差がそれぞれ計算され、ここで、第3の差は、各サブフレームの平均エネルギーと、ロングフレームの平均エネルギーとの間の最大差であり、第3の差は、式(2)に従って計算され、第4の差は、2つの連続したサブフレームの平均エネルギーの間の最大差であり、第4の差は、式(3)に従って計算される。
Figure 0005281169
式(2)において、sub_gain[i]は、各サブフレームの平均エネルギーを表し、gainは、ロングフレームの平均エネルギーを表し、max_deviationは、各サブフレームの平均エネルギーと、ロングフレームの平均エネルギーとの間の最大差、すなわち、本発明の実施形態における第3の差を表す。
Figure 0005281169
式(3)において、sub_gain[i]及びsub_gain[i+1]はそれぞれ、2つの連続したサブフレームの平均エネルギーを表し、max_riseは、ロングフレーム内の2つの連続したサブフレームの平均エネルギーの間の最大差、すなわち、本発明の実施形態における第4の差を表す。
ステップ2507において、ロングフレームの平均エネルギーが第4の閾値と比較され、第3の差が第5の閾値と比較され、第4の差が第6の閾値と比較され、ロングフレームの平均エネルギーが第4の閾値より大きく、第3の差が第5の閾値より大きく、かつ、第4の差が第6の閾値より大きい場合(すなわち、式(4)が満たされる場合)、高周波帯域信号は過渡信号であると判定され、それ以外の場合、高周波帯域信号は非過渡信号であると判定される。
Figure 0005281169
式(4)において、α1は、第4の閾値を表し、α2は、第5の閾値を表し、α3は、第6の閾値を表す。α1、α2、及びα3の値は、入力過渡信号の振幅と相互に関連があり、過渡信号の全体的振幅が大きい場合、α1、α2、及びα3の値は大きく、過渡信号の全体的振幅が小さい場合、α1、α2、及びα3の値は小さい。例えば、過渡信号の時間エンベロープの基準パワーレベルが−26dBである場合、α1、α2、及びα3の値は、5<α1<10、2<α2<5、1<α3<3の範囲内にある。
ステップ2509において、取得されたカテゴリ情報がビットストリームに入力され、カテゴリ情報は、過渡信号情報と非過渡信号情報とを含み、そして、ステップ217が実行される。過渡信号に関しては、ステップ27が実行され、非過渡信号に関しては、非過渡信号の時間エンベロープと周波数領域エンベロープとが、従来技術における方法を使用することによって取得されてもよく、これについてはここでは繰り返さない。
入力信号を分類する方法は、本発明による時間エンベロープの修正と組み合わせて使用されてもよく、更に、過渡信号の各サブフレームの時間エンベロープが修正されない場合、入力信号を分類する方法は、従来技術における過渡信号を符号化する方法と組み合わせて使用されてもよく、この場合、過渡信号の識別の正確さはやはり向上させられることが可能であり、これにより、復号化端における過渡信号の回復の効果が向上するということに留意されたい。
ステップ26において、入力信号の各サブフレームの時間エンベロープがそれぞれ計算され、入力信号の信号タイプが過渡信号である場合、ステップ27が実行され、入力信号の信号タイプが非過渡信号である場合、ステップ29が実行される。
ステップ27において、過渡信号の時間エンベロープが修正される。
過渡信号の特性を強調するために、過渡信号の時間エンベロープが修正され、例えば、最大振幅値を有する時間エンベロープに対して振幅値を増加させる修正が実行され、かつ/又は、その他の時間エンベロープに対して振幅値を減少させる修正が実行される。具体的には、ステップ27は、ステップ2701〜ステップ2719を含んでもよい。図3は、本発明の第2の実施形態による過渡信号の時間エンベロープを修正する符号化端の一実施形態のブロック図である。図3に示すように、過渡信号の時間エンベロープに対して実行される修正は、ステップ2701〜ステップ2719を含む。
ステップ2701において、過渡信号の各サブフレームの時間エンベロープが計算されて、各サブフレームの時間エンベロープtEnv[i]が取得される。
ステップ2703において、ステップ2701で取得されたサブフレームの時間エンベロープを調べることによって、最大時間エンベロープが位置しているサブフレームとそのサブフレームに対応する位置情報とが取得され、ここで、そのサブフレームは、本発明の実施形態における基準サブフレームであり、説明の便宜のために、基準サブフレームの位置情報は、以下ではposと表される。
ステップ2705において、現在のサブフレームの位置情報(i)が基準サブフレームの位置情報(pos)と比較され、現在のサブフレームが基準サブフレームより前(すなわち、i<pos)である場合、ステップ2707が実行され、それ以外の場合、ステップ2709が実行される。
ステップ2707において、現在のサブフレームの時間エンベロープに対して振幅値を減少させる修正が実行されて、第1の修正されたエンベロープが取得され、ステップ2719が実行される。振幅値を減少させる比率は、サブフレームに対応する時間エンベロープの振幅値と、基準サブフレームに対応する時間エンベロープの振幅値との間の差に従って決定されてもよく、差が大きい場合、振幅値を減少させる小さな比率が選択されてもよく、それ以外の場合、振幅値を減少させる大きな比率が選択されてもよい。図3は、現在のサブフレームの時間エンベロープの値を2で割る修正を示し、その結果、現在のサブフレームの修正された時間エンベロープ(すなわち、本発明の実施形態における、第1の修正されたエンベロープ)は、修正の前の時間エンベロープの1/2であるように減少させられ、すなわち、
Figure 0005281169
,
となり、上式で、tEnv[i]’は、現在のサブフレームの修正された時間エンベロープを表し、tEnv[i]は、修正の前の、現在のサブフレームの時間エンベロープを表す。
ステップ2709において、基準サブフレームより後の各サブフレームの時間エンベロープの平均値
Figure 0005281169
が計算される。
Figure 0005281169
Figure 0005281169

基準サブフレームより後の各サブフレームの時間エンベロープの平均値と予め設定された基準値との間の差が大きい場合、これは、元の信号の最大時間エンベロープに対応する基準サブフレームがその後のサブフレームと比較して急峻に変化したことを示し、そして、回復された信号が元の特性を満たすことを可能にするために、サブフレームは修正されてもよい。基準サブフレームより後の各サブフレームの時間エンベロープの平均値と予め設定された基準値との間の差が小さい場合、これは、元の信号の最大時間エンベロープに対応する基準サブフレームがその後のサブフレームと比較して急峻に変化していないことを示し、この場合、サブフレームは修正されなくてもよい。好ましくは、予め設定された基準値は、過渡信号の最大時間エンベロープの1/3〜3/5である。
ステップ2713において、現在のサブフレームの位置情報が基準サブフレームの位置情報と比較されて、現在のサブフレームが基準サブフレームであるかどうかが判定され、そうである場合、ステップ2715が実行され、それ以外の場合、ステップ2717が実行される。
ステップ2715において、基準サブフレームに対応する時間エンベロープに対して振幅値を増加させる修正が実行されて、第2の修正されたエンベロープが取得され、ステップ2719が実行される。
図3は、現在のサブフレームの時間エンベロープの値に√2を掛ける修正を示し、その結果、基準サブフレームの修正された時間エンベロープ(すなわち、本発明の実施形態における第2の修正されたエンベロープ)は、修正の前の時間エンベロープの√2倍であるように増加させられ、すなわち、
Figure 0005281169

となり、上式で、tEnv[pos]’は、基準サブフレームの修正された時間エンベロープを表し、tEnv[pos]は、修正の前の基準サブフレームの時間エンベロープを表す。
ステップ2717において、現在のサブフレームの時間エンベロープに対して振幅値を減少させる修正が実行されて、第3の修正されたエンベロープが取得され、ステップ2719が実行される。振幅値を減少させる比率は、サブフレームに対応する時間エンベロープの振幅値と基準サブフレームに対応する時間エンベロープの振幅値との間の差に従って決定されてもよく、差が大きい場合、振幅値を減少させる小さな比率が選択されてもよく、それ以外の場合、振幅値を減少させる大きな比率が選択されてもよい。
図3は、現在のサブフレームの時間エンベロープの値を2で割る修正を示し、その結果、現在のサブフレームの修正された時間エンベロープ(すなわち、本発明の実施形態における第3の修正されたエンベロープ)は、修正の前の時間エンベロープの1/2であるように減少させられ、すなわち、
Figure 0005281169

となり、上式で、tEnv[i]’は、現在のサブフレームの修正された時間エンベロープを表し、tEnv[i]は、修正の前の現在のサブフレームの時間エンベロープを表す。
ステップ2719において、ステップ2707で取得された第1の修正されたエンベロープと、ステップ2715で取得された第2の修正されたエンベロープと、ステップ2717で取得された第3の修正されたエンベロープとが結合されて、過渡信号の修正された時間エンベロープが取得される。
ステップ2701〜ステップ2719を介して過渡信号の時間エンベロープの修正が完了し、過渡信号の修正された時間エンベロープが取得される。
ステップ211において、入力信号内の高周波帯域信号に対して時間−周波数変換が実行されて、高周波帯域信号の周波数領域信号が取得される。
過渡信号の周波数領域エンベロープが取得される場合、高速フーリエ変換(FFT)及び変形離散コサイン変換(MDCT)などの変換方法を介して過渡信号に対応する時間領域信号が周波数領域に変換されて、周波数領域内の過渡信号に対応する周波数領域信号が取得される。
ステップ211及びステップ25の時間順序に対して制限は課されない。
ステップ213において、周波数領域信号の各サブ帯域の周波数領域エンベロープが計算されて、高周波帯域信号の周波数領域エンベロープが取得される。
本発明の実施形態における周波数領域エンベロープは、周波数領域信号を1つ以上のサブ帯域に分割し、各サブ帯域のエネルギー情報を又は各サブ帯域のエネルギー情報の平方根を取得し、取得されたエネルギー情報又は取得されたエネルギー情報の平方根を使用することによって、周波数領域信号の波形特性又は振幅トレンドを概略的に表すことを意味する。従って、周波数領域信号は1つ以上のサブ帯域に分割され、各サブ帯域のエネルギー情報又は各サブ帯域のエネルギー情報の平方根が取得され、取得されたエネルギー情報又は取得されたエネルギー情報の平方根を使用することによって、周波数領域信号の各サブ帯域の周波数領域エンベロープが取得される。
ステップ215において、取得された高周波帯域信号の周波数領域エンベロープが定量化され、次に、ビットストリームに追加され、ステップ217が実行される。
ステップ217において、低周波帯域信号のパラメータと、高周波帯域信号の信号タイプ情報と、周波数領域エンベロープと、修正された時間エンベロープとが追加されたビットストリームが復号化端に送信され、ここで、信号タイプ情報は、現在符号化されている信号が過渡信号であるか又は非過渡信号であるかを示すように構成され、その結果、復号化端は、信号タイプ情報に従って、復号化されている現在の信号のタイプを判定することが可能である。
本実施形態では、現在の高周波帯域信号の信号タイプが判定される際に、高周波帯域信号内のいくつかの連続したフレームの情報を結合することによって、過渡信号の識別が実行され、従って、過渡信号の識別の正確さが向上し、過渡信号はより正確に入力高周波帯域信号から分離されることが可能であり、更に、本実施形態では、分離された過渡信号に対応する時間エンベロープが修正され、その結果、過渡信号のサブフレームの時間エンベロープの振幅値の間の差がより明確になり、これにより、復号化端において回復される過渡信号の品質が向上する。
図4は、本発明の第3の実施形態による過渡信号復号化方法のフローチャートである。図4に示すように、本方法は以下のステップを含む。
ステップ41において、過渡信号の信号タイプを有する予め取得された信号の全てのサブフレームの時間エンベロープから、最大振幅値を有する時間エンベロープ(すなわち、最大時間エンベロープ)が位置しているサブフレームが取得され、ここで、このサブフレームは、本発明の実施形態において記載される基準サブフレームである。
過渡信号の時間エンベロープの修正は、符号化端又は復号化端において実行されてもよい。本実施形態では、復号化端において過渡信号の特性に従って時間エンベロープが修正され、その結果、修正された時間エンベロープにおいて、過渡信号のサブフレームの最大振幅値を有する時間エンベロープの振幅値と、その他のエンベロープの振幅値との間の差がより明確になり、過渡信号の特性が強調される。
ステップ43において、第1の差が予め設定された第1の閾値より大きくなるように基準サブフレームより前の各サブフレームの時間エンベロープの振幅値が調節され、ここで、第1の差は、基準サブフレームより前の各サブフレームの時間エンベロープの振幅値と、最大時間エンベロープの振幅値との間の差である。
第1の閾値は、以下の方法によって決定されてもよい。すなわち、基準サブフレームより前の各サブフレームの時間エンベロープの振幅値を元の振幅値の1/8〜1/2に減少させ、サブフレームの時間エンベロープの調節された振幅値と基準サブフレームの時間エンベロープの振幅値との間の差を取得し、その差を第1の閾値として使用してもよい。
本技術的解決法に基づいて、時間エンベロープの調節は、基準サブフレームより後の各サブフレームの時間エンベロープの平均振幅値を計算し、平均振幅値が予め設定された基準値以下である場合、第2の差が予め設定された第2の閾値より大きくなるように基準サブフレームより後の各サブフレームの時間エンベロープの振幅値を調節することを更に含んでもよく、ここで、第2の差は、基準サブフレームより後の各サブフレームの時間エンベロープの振幅値と、最大時間エンベロープの振幅値との間の差である。
予め設定された基準値は、基準サブフレームの時間エンベロープの振幅値の1/3〜3/5であるように選択されてもよく、第2の閾値は、以下の方法によって決定されてもよい。すなわち、基準サブフレームより後の各サブフレームの時間エンベロープの振幅値を元の振幅値の1/8〜1/2に減少させ、サブフレームの時間エンベロープの調節された振幅値と、基準サブフレームの時間エンベロープの振幅値との間の差を取得し、その差を第2の閾値として使用してもよい。
基準サブフレーム以外の各サブフレームの時間エンベロープの振幅値が調節された後に、本技術的解決法における時間領域信号の調節は、過渡信号の各サブフレームの調節された時間エンベロープの平均エネルギーが予め設定された第3の閾値より大きくなるように基準サブフレームの時間エンベロープの振幅値を調節することを更に含んでもよい。
第3の閾値は、以下の条件を満たす範囲から選択されてもよい。過渡信号の各サブフレームの調節された時間エンベロープの平均エネルギーが各サブフレームの調節された時間エンベロープの平均エネルギーと同等であり、例えば、前者は、後者の0.8〜1.2倍である。
ステップ45において、調節された時間エンベロープに従って、予め取得された時間領域信号が修正されて、回復された過渡信号が取得される。
符号化端からのビットストリームが復号化されて、過渡信号の信号タイプを有する信号の各サブ帯域の周波数領域エンベロープが取得される。正規化された低周波帯域の周波数領域信号又はランダムノイズから周波数領域励起信号が取得され、周波数領域励起信号と周波数領域エンベロープとに従って周波数領域信号が生成され、周波数領域信号に対して周波数−時間変換が実行されて、時間領域信号が取得される。次に、時間領域信号は、修正された時間エンベロープに従って修正され、その結果、復号化端において過渡信号が回復される。
本実施形態では、復号化端において過渡信号の時間エンベロープが修正され、その結果、修正された時間エンベロープにおいて最大振幅値を有する時間エンベロープの振幅値とその他の時間エンベロープの振幅値との間の差がより明確になって、過渡信号の特性が強調され、これにより、復号化端において回復される過渡信号の品質が向上する。
図5は、本発明の第4の実施形態による過渡信号復号化方法のフローチャートである。図5に示すように、本方法は以下のステップを含む。
ステップ51において、符号化端からのビットストリームが復号化されて、高周波帯域信号の時間エンベロープと信号タイプ情報とが取得され、信号タイプが過渡信号である場合、ステップ52が実行され、信号タイプが非過渡信号である場合、ステップ518が実行される。
ステップ52において、取得された信号タイプ情報が信号タイプが過渡信号であることを示す場合、時間エンベロープが修正されて、修正された時間エンベロープが取得され、ステップ518が実行される。
過渡信号の特性を強調するために、現在の信号タイプが過渡信号である場合、時間エンベロープが修正される。最大振幅値を有する時間エンベロープに対して振幅値を増加させる修正が実行され、かつ/又は、その他の時間エンベロープに対して振幅値を減少させる修正が実行される。ステップ52は、ステップ5201〜ステップ5219を含んでもよい。図6は、本発明の第4の実施形態による過渡信号の時間エンベロープを修正する復号化端の一実施形態のブロック図である。図6に示すように、現在の信号タイプが過渡信号である場合、復号化端によって時間エンベロープに対して実行される修正は、ステップ5201〜ステップ5219を含む。
ステップ5201において、符号化端からのビットストリームが復号化されて、高周波帯域信号の各サブフレームの時間エンベロープと信号タイプ情報とが取得される。信号タイプ情報がビットストリーム内の現在の信号のタイプが過渡信号であることを示す場合、ステップ5203が実行されて、時間エンベロープが修正され、信号タイプ情報がビットストリーム内の現在の信号のタイプが非過渡信号であることを示す場合、従来技術における復号化方法を使用することによって信号が復号化されて、非過渡信号が回復され、これについてはここでは繰り返さない。
ステップ5203において、ステップ5201で取得されたサブフレームの時間エンベロープを調べることによって、最大時間エンベロープが位置しているサブフレームとそのサブフレームに対応する位置情報とが取得され、ここで、そのサブフレームは本発明の実施形態における基準サブフレームであり、説明の便宜のために、基準サブフレームの位置情報は以下ではposと表される。
ステップ5205において、現在のサブフレームの位置情報(i)が基準サブフレームの位置情報(pos)と比較され、現在のサブフレームが基準サブフレームより前(すなわち、i<pos)である場合、ステップ5207が実行され、それ以外の場合、ステップ5209が実行される。
ステップ5207において、現在のサブフレームの時間エンベロープに対して振幅値を減少させる修正が実行されて、第1の修正されたエンベロープが取得され、ステップ5219が実行される。
例えば、現在のサブフレームの時間エンベロープの値を4で割る修正が採用され、その結果、現在のサブフレームの修正された時間エンベロープ(すなわち、本発明の実施形態における、第1の修正されたエンベロープ)は、修正の前の時間エンベロープの1/4であるように減少させられ、すなわち、
Figure 0005281169

となり、上式で、tEnv[i]’は、現在のサブフレームの修正された時間エンベロープを表し、tEnv[i]は、修正の前の現在のサブフレームの時間エンベロープを表す。
Figure 0005281169
Figure 0005281169
ステップ5213において、現在のサブフレームの位置情報が基準サブフレームの位置情報と比較されて、現在のサブフレームが基準サブフレームであるかどうかが判定され、そうである場合、ステップ5215が実行され、それ以外の場合、ステップ5217が実行される。
ステップ5215において、基準サブフレームに対応する時間エンベロープに対して振幅値を増加させる修正が実行されて、第2の修正されたエンベロープが取得され、ステップ5219が実行される。
例えば、現在のサブフレームの時間エンベロープの値に√3を掛ける修正が実行され、その結果、基準サブフレームの修正された時間エンベロープ(すなわち、本発明の実施形態における第2の修正されたエンベロープ)は、修正の前の時間エンベロープの√3倍であるように増加させられ、すなわち、
Figure 0005281169

となり、上式で、tEnv[pos]’は、基準サブフレームの修正された時間エンベロープを表し、tEnv[pos]は、修正の前の基準サブフレームの時間エンベロープを表す。
ステップ5217において、現在のサブフレームの時間エンベロープに対して振幅値を減少させる修正が実行されて、第3の修正されたエンベロープが取得され、ステップ5219が実行される。
例えば、現在のサブフレームの時間エンベロープの値を4で割る修正が採用され、その結果、現在のサブフレームの修正された時間エンベロープ(すなわち、本発明の実施形態における第3の修正されたエンベロープ)は、修正の前の時間エンベロープの1/4であるように減少させられ、すなわち、
Figure 0005281169

となり、上式で、tEnv[i]’は、現在のサブフレームの修正された時間エンベロープを表し、tEnv[i]は、修正の前の現在のサブフレームの時間エンベロープを表す。
ステップ5219において、ステップ5207で取得された第1の修正されたエンベロープと、ステップ5215で取得された第2の修正されたエンベロープと、ステップ5217で取得された第3の修正されたエンベロープと、ステップ5211における修正条件を満たさず且つ時間領域修正を受けていない時間エンベロープとが結合されて、過渡信号の修正された時間エンベロープが取得される。
ステップ5201〜ステップ5219を介して過渡信号の時間エンベロープの修正が完了し、過渡信号の修正された時間エンベロープが取得される。
ステップ53において、符号化端からのビットストリームが復号化されて、低周波帯域信号が取得され、ステップ519が実行される。
本実施形態では、ビットストリーム内の低周波帯域信号は、復号器によって復号化される。
ステップ51及びステップ53の時間順序に対して制限は課されない。
ステップ55において、高周波帯域信号の周波数領域励起信号が生成される。
高周波帯域信号の周波数領域励起信号は、正規化された低周波帯域の周波数領域信号又はランダムノイズから取得される。
ステップ57において、符号化端からのビットストリームが復号化されて、高周波帯域信号の各サブ帯域の周波数領域エンベロープが取得される。
ステップ55及びステップ57の時間順序に対して制限は課されない。
ステップ59において、高周波帯域信号の各サブ帯域の周波数領域エンベロープを使用することによって、周波数領域励起信号が修正される。
修正の目的は、回復された周波数スペクトルのエネルギーが実際の高周波帯域スペクトルのエネルギーと同等であることを可能にすることである。
ステップ511において、修正された周波数領域励起信号に従って、高周波帯域の周波数領域信号が生成され、高周波帯域の周波数領域信号は、式(5)に従って計算されてもよい。
Figure 0005281169
式(5)において、exc[i]は、周波数領域励起信号を表し、fEnv[j]は、周波数領域エンベロープを表し、spectrum[i]は、高周波帯域の周波数領域信号を表す。
ステップ513において、生成された高周波帯域の周波数領域信号に対して周波数−時間変換が実行される。
ステップ515において、時間領域信号が生成される。高周波帯域信号のタイプが過渡信号である場合、ステップ516が実行され、高周波帯域信号が非過渡信号である場合、ステップ517が実行される。
ステップ516において、過渡信号の信号タイプを有する時間領域信号が調節されて、調節された時間領域信号signal’[i]が取得される。
基準サブフレーム内の予め設定された数のサンプリング点が選択され、第5の差が第7の閾値より大きくなるように選択されたサンプリング点のそれぞれの信号振幅が調節され、ここで、第5の差は、選択されたサンプリング点のそれぞれの信号振幅値と、基準サブフレームの最大振幅値との間の差である。
第7の閾値は、以下の範囲から選択されてもよい。選択されたサンプリング点の振幅を元の振幅の1/2であるように減少させ、サンプリング点の調節された振幅と基準サブフレームに含まれるサンプリング点の振幅のうちの最大振幅との間の差を取得する。
最大振幅値を有する時間エンベロープが位置しているサブフレームに含まれる予め設定された数のサンプリング点が選択され、サンプリング点の信号振幅が減少させられて、時間領域信号が調節される。時間領域信号の調節の特定の方法、及び、調節されることが必要とされる予め設定された数のサンプリング点は、主に元の入力信号の特性に依存する。
例えば、時間領域信号の調節の間、最大振幅値を有する時間エンベロープが位置しているサブフレームに含まれる予め設定された数のサンプリング点が順次選択され、例えば、最大振幅値を有する時間エンベロープが位置している基準サブフレームに対応する時間領域信号に含まれる最初の1/4サブフレーム長内のサンプリング点が選択され、選択されたサンプリング点の振幅値が2で割られる。符号化端及び復号化端において、複数のビットがフラグ情報を伝送するために使用されることが可能である場合、それらのビット位置は復号化端にフラグ情報を運ぶために使用されてもよく、例えば、符号化端がフラグ情報を伝送するための1つのビットを有する場合、復号化端はそのフラグビットに従って予め設定された数のサンプリング点を調節するかどうかを判定してもよく、符号化端がフラグ情報を運ぶための複数のビット位置を有する場合、復号化端は受信したフラグビットに従ってどのサンプリング点が調節される必要があるかを判定してもよく、符号化端がフラグ情報を運ぶための十分なビット位置を有する場合、復号化端は受信したフラグ情報に従って各サンプリング点が調節される必要があるかどうかを判定してもよい。
時間領域信号を調節する方法は、本発明による時間エンベロープの修正と組み合わせて使用されてもよく、更に、過渡信号の各サブフレームの時間エンベロープが修正されない場合、時間領域信号を調節する方法は、従来技術における過渡信号を符号化する方法と組み合わせて使用されてもよく、この場合、過渡信号の特性はやはり強調されることが可能であり、これにより、過渡信号の回復の効果が向上するということに留意されたい。
ステップ517において、取得された時間領域信号signal’[i]が正規化される。
ステップ518において、ステップ52で取得された修正された時間エンベロープを使用することによって、過渡信号の信号タイプを有する正規化された時間領域信号が修正されて、回復された過渡信号が取得され、そして、ステップ51で取得された非過渡信号の信号タイプを有する時間エンベロープ信号を使用することによって、対応する時間領域信号が修正されて、回復された非過渡信号が取得される。
過渡信号の信号タイプを有する正規化された時間領域信号は、式(6)に従って修正されてもよい。
Figure 0005281169
式(6)において、signal’[i]は、修正された時間領域信号を表し、tEnv[j]は、修正された時間エンベロープを表し、tEnv[j]’は、修正された時間領域信号(signal’[i])の時間エンベロープを表し、signal[i]は、高周波帯域信号の時間領域信号を表す。
ステップ519において、回復された低周波帯域信号と高周波帯域信号とが結合されて、出力広周波数帯域信号が取得され、ここで、回復された高周波帯域信号は、回復された過渡信号と回復された非過渡信号とを含む。
本実施形態では、ステップ51、ステップ57、及びステップ53の時間順序に対して制限は課されない。
本実施形態では、復号化端における復号化を介して取得される高周波帯域信号内の過渡信号に対応する時間エンベロープが修正され、その結果、過渡信号に対応する全てのサブフレームの時間エンベロープの振幅値の間の差がより明確になり、これにより、復号化端において回復される過渡信号の品質が向上し、更に、本実施形態では、時間エンベロープを使用することによって時間領域信号が修正される前に、最大時間エンベロープを有するサブフレームの時間領域信号より前のサンプリング点の振幅が減少させられて、過渡信号の特性が強調され、これにより、出力信号内の過渡信号の出力効果が大幅に向上する。
図7は、本発明の第5の実施形態による過渡信号符号化装置の概略構成図である。図7に示すように、本実施形態の過渡信号符号化装置は、基準サブフレーム取得モジュール71と、第1の振幅値調節モジュール72と、ビットストリーム書き込みモジュール73とを含む。
基準サブフレーム取得モジュール71は、入力過渡信号の全てのサブフレームの時間エンベロープから、最大振幅値を有する時間エンベロープ(すなわち、最大時間エンベロープ)が位置している基準サブフレームを取得するように構成される。
第1の振幅値調節モジュール72は、第1の差が予め設定された第1の閾値より大きくなるように基準サブフレームより前の各サブフレームの時間エンベロープの振幅値を調節するように構成され、ここで、第1の差は、基準サブフレームより前の各サブフレームの時間エンベロープの振幅値と、最大時間エンベロープの振幅値との間の差である。第1の閾値は、以下の方法によって決定されてもよい。すなわち、基準サブフレームより前の各サブフレームの時間エンベロープの振幅値を元の振幅値の1/8〜1/2に減少させ、サブフレームの時間エンベロープの調節された振幅値と、基準サブフレームの時間エンベロープの振幅値との間の差を取得し、その差を第1の閾値として使用してもよい。
ビットストリーム書き込みモジュール73は、調節された時間エンベロープをビットストリームに書き込むように構成される。
本技術的解決法に基づいて、本実施形態の過渡信号符号化装置は、平均振幅値計算モジュール74と、第2の振幅値調節モジュール75と、第3の振幅値調節モジュール76とを更に含む。
平均振幅値計算モジュール74は、基準サブフレームより後の各サブフレームの時間エンベロープの平均振幅値を計算するように構成される。
第2の振幅値調節モジュール75は、平均振幅値が予め設定された基準値以下である場合、第2の差が予め設定された第2の閾値より大きくなるように基準サブフレームより後の各サブフレームの時間エンベロープの振幅値を調節するように構成され、ここで、第2の差は、基準サブフレームより後の各サブフレームの時間エンベロープの振幅値と、最大時間エンベロープの振幅値との間の差である。予め設定された基準値は、基準サブフレームの時間エンベロープの振幅値の1/3〜3/5であるように選択されてもよく、第2の閾値は、以下の方法によって決定されてもよい。すなわち、基準サブフレームより後の各サブフレームの時間エンベロープの振幅値を元の振幅値の1/8〜1/2に減少させ、サブフレームの時間エンベロープの調節された振幅値と基準サブフレームの時間エンベロープの振幅値との間の差を取得し、その差を第2の閾値として使用してもよい。
第3の振幅値調節モジュール76は、基準サブフレーム以外の各サブフレームの時間エンベロープの振幅値が調節された後、過渡信号の各サブフレームの調節された時間エンベロープの平均エネルギーが予め設定された第3の閾値より大きくなるように基準サブフレームの時間エンベロープの振幅値を調節するように構成される。第3の閾値は、以下の条件を満たす範囲から選択されてもよい。過渡信号の各サブフレームの調節された時間エンベロープの平均エネルギーが、各サブフレームの調節された時間エンベロープの平均エネルギーと同等であり、例えば、前者は、後者の0.8〜1.2倍である。
本実施形態では、過渡信号に対応する時間エンベロープを細かく符号化するプロセスの間、第1の振幅値調節モジュールが、過渡信号の特性に従って、過渡信号の時間エンベロープを修正することができ、その結果、過渡信号によって含まれるサブフレームの時間エンベロープの振幅値の間の差がより明確になり、これにより、復号化端において回復される過渡信号の品質が向上する。
図8は、本発明の第6の実施形態による過渡信号符号化装置の概略構成図である。図7の実施形態とは異なり、本実施形態の過渡信号符号化装置は、信号タイプ判定モジュール77を更に含む。
信号タイプ判定モジュール77は、入力信号の信号タイプを判定し、信号タイプ情報を符号化ビットストリームに書き込むように構成され、ここで、信号タイプは、過渡信号又は非過渡信号を含む。
信号タイプ判定モジュール77は、ロングフレーム平均エネルギー計算ユニット771と、サブフレーム平均エネルギー計算ユニット772と、差計算ユニット773と、信号タイプ判定ユニット774とを含んでもよい。
ロングフレーム平均エネルギー計算ユニット771は、入力信号内の予め設定された数の連続したフレームを使用してロングフレームを形成し、ロングフレームの平均エネルギーを計算するように構成される。
サブフレーム平均エネルギー計算ユニット772は、ロングフレームを複数のサブフレームに分割し、各サブフレームの平均エネルギーを計算するように構成される。
差計算ユニット773は、第3の差及び第4の差をそれぞれ計算するように構成され、ここで、第3の差は、各サブフレームの平均エネルギーとロングフレームの平均エネルギーとの間の最大差であり、第4の差は、2つの連続したサブフレームの平均エネルギーの間の最大差である。
信号タイプ判定ユニット774は、ロングフレームの平均エネルギーが第4の閾値より大きく、第3の差が第5の閾値より大きく、かつ、第4の差が第6の閾値より大きい場合、入力信号は過渡信号であると判定し、それ以外の場合、入力信号は非過渡信号であると判定するように構成される。
本実施形態では、現在の高周波帯域信号の信号タイプが判定される際に、高周波帯域信号内のいくつかの連続したフレームの情報を結合することによって、過渡信号の識別が実行され、従って、過渡信号の識別の正確さが向上し、過渡信号はより正確に入力高周波帯域信号から分離されることが可能であり、更に、本実施形態では、分離された過渡信号に対応する時間エンベロープが修正され、その結果、過渡信号のサブフレームの時間エンベロープの振幅値の間の差がより明確になり、これにより、復号化端において回復される過渡信号の品質が向上する。
図9は、本発明の第7の実施形態による過渡信号復号化装置の概略構成図である。図9に示すように、本実施形態の過渡信号符号化装置は、基準サブフレーム取得モジュール91と、第1の振幅値調節モジュール92と、時間領域信号修正モジュール93とを含む。
基準サブフレーム取得モジュール91は、過渡信号の信号タイプを有する予め取得された信号の全てのサブフレームの時間エンベロープから、最大振幅値を有する時間エンベロープ(すなわち、最大時間エンベロープ)が位置している基準サブフレームを取得するように構成される。
第1の振幅値調節モジュール92は、第1の差が予め設定された第1の閾値より大きくなるように基準サブフレームより前の各サブフレームの時間エンベロープの振幅値を調節するように構成され、ここで、第1の差は、基準サブフレームより前の各サブフレームの時間エンベロープの振幅値と、最大時間エンベロープの振幅値との間の差である。
時間領域信号修正モジュール93は、調節された時間エンベロープに従って、予め取得された時間領域信号を修正して、回復された過渡信号を取得するように構成される。
本実施形態では、復号化端における時間エンベロープ修正モジュールによって、過渡信号の時間エンベロープが修正され、その結果、修正された時間エンベロープ内で最大振幅値を有する時間エンベロープの振幅値とその他のエンベロープの振幅値との間の差がより明確になって、過渡信号の特性が強調され、これにより、復号化端において回復される過渡信号の品質が向上する。
図10は、本発明の第8の実施形態による過渡信号復号化装置の概略構成図である。図9の実施形態とは異なり、本実施形態の過渡信号復号化装置は、平均振幅値計算モジュール94と、第2の振幅値調節モジュール95と、第3の振幅値調節モジュール96とを更に含む。
平均振幅値計算モジュール94は、基準サブフレームより後の各サブフレームの時間エンベロープの平均振幅値を計算するように構成される。
第2の振幅値調節モジュール95は、平均振幅値が予め設定された基準値以下である場合、第2の差が予め設定された第2の閾値より大きくなるように基準サブフレームより後の各サブフレームの時間エンベロープの振幅値を調節するように構成され、ここで、第2の差は、基準サブフレームより後の各サブフレームの時間エンベロープの振幅値と、最大時間エンベロープの振幅値との間の差である。
第3の振幅値調節モジュール96は、基準サブフレーム以外の各サブフレームの時間エンベロープの振幅値が調節された後、過渡信号の各サブフレームの調節された時間エンベロープの平均エネルギーが予め設定された第3の閾値より大きくなるように基準サブフレームの時間エンベロープの振幅値を調節するように構成される。
本技術的解決法に基づいて、本実施形態の過渡信号復号化装置は、時間領域信号調節モジュール97を更に含んでもよい。
時間領域信号調節モジュール97は、基準サブフレーム内の予め設定された数のサンプリング点を選択し、第5の差が第7の閾値より大きくなるように選択されたサンプリング点のそれぞれの信号振幅を調節するように構成され、ここで、第5の差は、選択されたサンプリング点のそれぞれの信号振幅値と、基準サブフレームの最大振幅値との間の差である。
本実施形態では、復号化端における復号化を介して取得される高周波帯域信号内の過渡信号に対応する時間エンベロープが修正され、その結果、過渡信号に対応する全てのサブフレームの時間エンベロープの振幅値の間の差がより明確になり、これにより、復号化端において回復される過渡信号の品質が向上し、更に、本実施形態では、時間エンベロープを使用することによって時間領域信号が修正される前に、最大時間エンベロープを有するサブフレームの時間領域信号より前のサンプリング点の振幅が減少させられて、過渡信号の特性が強調され、これにより、出力信号内の過渡信号の出力効果が大幅に向上する。
図11は、本発明の第9の実施形態による過渡信号処理システムの概略構成図である。図11に示すように、本発明の過渡信号処理システムは、過渡信号符号化装置111と、過渡信号復号化装置112とを含む。
過渡信号の時間エンベロープの修正は、符号化端において実行されてもよい。
過渡信号符号化装置111は、入力過渡信号の全てのサブフレームの時間エンベロープから、最大振幅値を有する時間エンベロープ(すなわち、最大時間エンベロープ)が位置している基準サブフレームを取得し、第1の差が予め設定された第1の閾値より大きくなるように基準サブフレームより前の各サブフレームの時間エンベロープの振幅値を調節し、調節された時間エンベロープをビットストリームに書き込むように構成され、ここで、第1の差は、基準サブフレームより前の各サブフレームの時間エンベロープの振幅値と、最大時間エンベロープの振幅値との間の差である。
過渡信号復号化装置112は、受信されたビットストリーム内の時間エンベロープに従って、予め取得された時間領域信号を修正して、回復された過渡信号を取得するように構成される。
本実施形態では、過渡信号の時間エンベロープが符号化端において修正され、過渡信号の全てのサブフレームの時間エンベロープのうちの最大振幅値を有する時間エンベロープの振幅値とその他の時間エンベロープの振幅値との間の差が拡大されて、過渡信号の特性が強調され、これにより、復号化端において回復される過渡信号の品質が向上する。
本実施形態の過渡信号処理システムにおいて、過渡信号符号化装置111の特定の詳細な構成に関しては、図7及び図8の実施形態の説明が参照されてもよく、過渡信号の時間エンベロープの修正の特定の原理に関しては、図1〜図3の実施形態の説明が参照されてもよく、これらについてはここでは繰り返さない。
あるいは、過渡信号の時間エンベロープ修正は、復号化端において実行されてもよい。
過渡信号符号化装置111は、過渡信号の各サブフレームの時間エンベロープをビットストリームに書き込むように構成される。
過渡信号復号化装置112は、受信されたビットストリーム内の信号の全てのサブフレームの時間エンベロープから、最大振幅値を有する最大時間エンベロープが位置している基準サブフレームを取得し、第1の差が予め設定された第1の閾値より大きくなるように基準サブフレームより前の各サブフレームの時間エンベロープの振幅値を調節し、調節された時間エンベロープに従って、予め取得された時間領域信号を修正して、回復された過渡信号を取得するように構成され、ここで、第1の差は、基準サブフレームより前の各サブフレームの時間エンベロープの振幅値と、最大時間エンベロープの振幅値との間の差である。
本実施形態では、過渡信号の時間エンベロープが復号化端において修正され、過渡信号の全てのサブフレームの時間エンベロープのうちの最大振幅値を有する時間エンベロープの振幅値と、その他の時間エンベロープの振幅値との間の差が拡大されて、過渡信号の特性が強調され、これにより、復号化端において回復される過渡信号の品質が向上する。
本実施形態の過渡信号処理システムにおいて、過渡信号復号化装置112の特定の詳細な構成に関しては、図9及び図10の実施形態の説明が参照されてもよく、過渡信号の時間エンベロープの修正の特定の原理に関しては、図4〜図6の実施形態の説明が参照されてもよく、これらについてはここでは繰り返さない。
添付の図面は、好ましい実施形態の概略図にすぎず、添付の図面におけるモジュール又はプロセスは本発明を実施するために必須ではない、ということを当業者は理解されたい。
実施形態による装置内のモジュールは、実施形態の説明に従って、実施形態の装置内に分散されてもよく、又は、それに対応して、本実施形態とは異なる1つ以上の装置内に配置されてもよいということを当業者は理解されたい。上記の実施形態のモジュールは、1つのモジュールとして結合されてもよく、又は、複数のサブモジュールに更に分割されてもよい。
本発明の上記の実施形態の順序番号は説明の便宜のためのものにすぎず、実施形態のうちの選好を意味するものではない。
本発明の実施形態による方法のステップの全て又は一部は関連するハードウェアに指示するプログラムによって実施されてもよいということを当業者は理解されたい。プログラムはコンピュータ読み取り可能な記憶媒体内に記憶されてもよい。プログラムが実行された場合、本発明の実施形態による方法のステップが実行される。記憶媒体は、ROM、RAM、磁気ディスク、及び光ディスクなどのプログラムコードを記憶することが可能な任意の媒体であってもよい。
最後に、上記の実施形態は、本発明の技術的解決法を説明するために提供されたにすぎず、本発明を限定することを意図するものではないということに留意されたい。本発明について、前述の実施形態を参照して詳細に説明してきたが、前述の実施形態において説明した技術的解決法に対して修正が行われてもよく、又は、技術的解決法におけるいくつかの技術的特徴に対して均等な置換が行われてもよい(そのような修正又は置換が、対応する技術的解決法の本質が本発明の精神及び範囲を逸脱することを引き起こさない限り)、ということを当業者は理解されたい

Claims (19)

  1. 入力信号のうち過渡信号の信号タイプを有する信号の全てのサブフレームの時間エンベロープから、最大振幅値を有する最大時間エンベロープが位置している基準サブフレームを取得することと、
    前記基準サブフレームより前の各サブフレームの時間エンベロープの振幅値と前記最大時間エンベロープの振幅値との間の差である第1の差が予め設定された第1の閾値より大きくなるように前記基準サブフレームより前の各サブフレームの時間エンベロープの振幅値を調節することと、
    前記調節された時間エンベロープをビットストリームに書き込むことと、
    を含む、過渡信号符号化方法。
  2. 前記基準サブフレームより後の各サブフレームの時間エンベロープの平均振幅値を計算することと、
    前記平均振幅値が予め設定された基準値以下である場合、前記基準サブフレームより後の各サブフレームの時間エンベロープの振幅値と前記最大時間エンベロープの振幅値との間の差である第2の差が予め設定された第2の閾値より大きくなるように前記基準サブフレームより後の各サブフレームの時間エンベロープの振幅値を調節することと、
    を更に含む、
    請求項1に記載の過渡信号符号化方法。
  3. 前記基準サブフレーム以外の各サブフレームの時間エンベロープの振幅値を調節した後に、前記過渡信号の各サブフレームの調節された時間エンベロープの平均エネルギーが予め設定された第3の閾値より大きくなるように前記基準サブフレームの時間エンベロープの振幅値を調節することを更に含む、
    請求項2に記載の過渡信号符号化方法。
  4. 入力信号の過渡信号又は非過渡信号からなる信号タイプを判定し、信号タイプ情報を符号化ビットストリームに書き込むことを更に含む、
    請求項1に記載の過渡信号符号化方法。
  5. 前記入力信号の信号タイプを判定することは、
    前記入力信号内の予め設定された数の連続したフレームを使用してロングフレームを形成し、前記ロングフレームの平均エネルギーを計算することと、
    前記ロングフレームを複数のサブフレームに分割し、各サブフレームの平均エネルギーを計算することと、
    各サブフレームの平均エネルギーと前記ロングフレームの平均エネルギーとの間の最大差である第3の差、及び、2つの連続したサブフレームの平均エネルギーの間の最大差である第4の差をそれぞれ計算することと、
    前記ロングフレームの平均エネルギーが第4の閾値より大きく、前記第3の差が第5の閾値より大きく、かつ、前記第4の差が第6の閾値より大きい場合、前記入力信号は過渡信号であると判定し、そうでない場合、前記入力信号は非過渡信号であると判定することと、を含む、
    請求項4に記載の過渡信号符号化方法。
  6. 過渡信号の信号タイプを有する予め取得された信号の全てのサブフレームの時間エンベロープから、最大振幅値を有する最大時間エンベロープが位置している基準サブフレームを取得することと、
    前記基準サブフレームより前の各サブフレームの時間エンベロープの振幅値と前記最大時間エンベロープの振幅値との間の差である第1の差が予め設定された第1の閾値より大きくなるように前記基準サブフレームより前の各サブフレームの時間エンベロープの振幅値を調節することと、
    前記調節された時間エンベロープに従って予め取得された時間領域信号を修正して、回復された過渡信号を取得することと、
    を含む、過渡信号復号化方法。
  7. 前記基準サブフレームより後の各サブフレームの時間エンベロープの平均振幅値を計算することと、
    前記平均振幅値が予め設定された基準値以下である場合、前記基準サブフレームより後の各サブフレームの時間エンベロープの振幅値と前記最大時間エンベロープの振幅値との間の差である第2の差が予め設定された第2の閾値より大きくなるように前記基準サブフレームより後の各サブフレームの時間エンベロープの振幅値を調節することと、
    を更に含む、
    請求項6に記載の過渡信号復号化方法。
  8. 前記基準サブフレーム以外の各サブフレームの時間エンベロープの振幅値が調節された後に、前記過渡信号の各サブフレームの調節された時間エンベロープの平均エネルギーが予め設定された第3の閾値より大きくなるように前記基準サブフレームの時間エンベロープの振幅値を調節することを更に含む、
    請求項7に記載の過渡信号復号化方法。
  9. 前記調節された時間エンベロープに従って予め取得された時間領域信号を修正する前に、
    前記基準サブフレームの予め設定された数のサンプリング点を選択することと、
    前記選択されたサンプリング点のそれぞれの信号振幅値と前記基準サブフレームの最大振幅値との間の差である第5の差が第7の閾値より大きくなるように前記選択されたサンプリング点のそれぞれの信号振幅を調節することと、
    を更に含む、
    請求項6に記載の過渡信号復号化方法。
  10. 入力信号のうち過渡信号の信号タイプを有する信号の全てのサブフレームの時間エンベロープから、最大振幅値を有する最大時間エンベロープが位置している基準サブフレームを取得するように構成された基準サブフレーム取得モジュールと、
    前記基準サブフレームより前の各サブフレームの時間エンベロープの振幅値と前記最大時間エンベロープの振幅値との間の差である第1の差が予め設定された第1の閾値より大きくなるように前記基準サブフレームより前の各サブフレームの時間エンベロープの振幅値を調節するように構成された第1の振幅値調節モジュールと、
    調節された時間エンベロープをビットストリームに書き込むように構成されたビットストリーム書き込みモジュールと、
    を備える過渡信号符号化装置。
  11. 前記基準サブフレームより後の各サブフレームの時間エンベロープの平均振幅値を計算するように構成された平均振幅値計算モジュールと、
    前記平均振幅値が予め設定された基準値以下である場合、前記基準サブフレームより後の各サブフレームの時間エンベロープの振幅値と前記最大時間エンベロープの振幅値との間の差である第2の差が予め設定された第2の閾値より大きくなるように前記基準サブフレームより後の各サブフレームの時間エンベロープの振幅値を調節するように構成された第2の振幅値調節モジュールと、
    を更に備える、
    請求項10に記載の過渡信号符号化装置。
  12. 前記基準サブフレーム以外の各サブフレームの時間エンベロープの振幅値が調節された後、前記過渡信号の各サブフレームの調節された時間エンベロープの平均エネルギーが予め設定された第3の閾値より大きくなるように前記基準サブフレームの時間エンベロープの振幅値を調節するように構成された第3の振幅値調節モジュールを更に備える、
    請求項11に記載の過渡信号符号化装置。
  13. 入力信号の過渡信号又は非過渡信号からなる信号タイプを判定し、信号タイプ情報を符号化ビットストリームに書き込むように構成された信号タイプ判定モジュールを更に備える、
    請求項12に記載の過渡信号符号化装置。
  14. 前記信号タイプ判定モジュールは、
    前記入力信号の予め設定された数の連続したフレームを使用してロングフレームを形成し、前記ロングフレームの平均エネルギーを計算するように構成されたロングフレーム平均エネルギー計算ユニットと、
    前記ロングフレームを複数のサブフレームに分割し、各サブフレームの平均エネルギーを計算するように構成されたサブフレーム平均エネルギー計算ユニットと、
    各サブフレームの平均エネルギーと前記ロングフレームの平均エネルギーとの間の最大差である第3の差、及び、2つの連続したサブフレームの平均エネルギーの間の最大差である第4の差をそれぞれ計算するように構成された差計算ユニットと、
    前記ロングフレームの平均エネルギーが第4の閾値より大きく、前記第3の差が第5の閾値より大きく、かつ、前記第4の差が第6の閾値より大きい場合、前記入力信号は過渡信号であると判定し、そうでない場合、前記入力信号は非過渡信号であると判定するように構成された信号タイプ判定ユニットと、
    を備える、
    請求項13に記載の過渡信号符号化装置。
  15. 過渡信号の信号タイプを有する予め取得された信号の全てのサブフレームの時間エンベロープから、最大振幅値を有する最大時間エンベロープが位置している基準サブフレームを取得するように構成された基準サブフレーム取得モジュールと、
    前記基準サブフレームより前の各サブフレームの時間エンベロープの振幅値と前記最大時間エンベロープの振幅値との間の差である第1の差が予め設定された第1の閾値より大きくなるように前記基準サブフレームより前の各サブフレームの時間エンベロープの振幅値を調節するように構成された第1の振幅値調節モジュール
    前記調節された時間エンベロープに従って予め取得された時間領域信号を修正して、回復された過渡信号を取得するように構成された時間領域信号修正モジュールと、
    を備える過渡信号復号化装置。
  16. 前記基準サブフレームより後の各サブフレームの時間エンベロープの平均振幅値を計算するように構成された平均振幅値計算モジュールと、
    前記平均振幅値が予め設定された基準値以下である場合、前記基準サブフレームより後の各サブフレームの時間エンベロープの振幅値と前記最大時間エンベロープの振幅値との間の差である第2の差が予め設定された第2の閾値より大きくなるように前記基準サブフレームより後の各サブフレームの時間エンベロープの振幅値を調節するように構成された第2の振幅値調節モジュールと、
    を更に備える、
    請求項15に記載の過渡信号復号化装置。
  17. 請求項10〜14のいずれかに記載の過渡信号符号化装置と、
    回復された過渡信号を取得するよう、受信したビットストリーム内の時間エンベロープ に従って予め取得された時間領域信号を修正するように構成された過渡信号復号化装置と
    を備える過渡信号処理システム。
  18. ビットストリームに過渡信号の各サブフレームの時間エンベロープを書き込むように構 成された過渡信号符号化装置と、
    請求項15又は16に記載の過渡信号復号化装置と、
    を備える過渡信号処理システム。
  19. コンピュータプロセッサにより実行されるとき、コンピュータプロセッサに請求項1〜 9のいずれかに記載の方法の工程を行わせるコンピュータプログラムを格納するコンピュ ータ読取可能媒体。
JP2011539886A 2008-12-29 2009-12-29 過渡信号符号化方法及び装置、復号化方法及び装置、並びに処理システム Active JP5281169B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN200810247009.7 2008-12-29
CN2008102470097A CN101770776B (zh) 2008-12-29 2008-12-29 瞬态信号的编码方法和装置、解码方法和装置及处理系统
PCT/CN2009/076194 WO2010078816A1 (zh) 2008-12-29 2009-12-29 瞬态信号的编码方法和装置、解码方法和装置及处理系统

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2013108638A Division JP6110212B2 (ja) 2008-12-29 2013-05-23 過渡信号符号化方法、復号化方法、及びコンピュータ読取可能媒体

Publications (2)

Publication Number Publication Date
JP2012511184A JP2012511184A (ja) 2012-05-17
JP5281169B2 true JP5281169B2 (ja) 2013-09-04

Family

ID=42316246

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2011539886A Active JP5281169B2 (ja) 2008-12-29 2009-12-29 過渡信号符号化方法及び装置、復号化方法及び装置、並びに処理システム
JP2013108638A Active JP6110212B2 (ja) 2008-12-29 2013-05-23 過渡信号符号化方法、復号化方法、及びコンピュータ読取可能媒体

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2013108638A Active JP6110212B2 (ja) 2008-12-29 2013-05-23 過渡信号符号化方法、復号化方法、及びコンピュータ読取可能媒体

Country Status (11)

Country Link
US (1) US8063809B2 (ja)
EP (4) EP2352145B1 (ja)
JP (2) JP5281169B2 (ja)
KR (1) KR101168645B1 (ja)
CN (1) CN101770776B (ja)
ES (2) ES2540075T3 (ja)
FI (1) FI3910630T3 (ja)
HU (1) HUE062878T2 (ja)
PL (1) PL3910630T3 (ja)
PT (1) PT3910630T (ja)
WO (1) WO2010078816A1 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101763856B (zh) * 2008-12-23 2011-11-02 华为技术有限公司 信号分类处理方法、分类处理装置及编码系统
CN101770776B (zh) 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
CN102436820B (zh) 2010-09-29 2013-08-28 华为技术有限公司 高频带信号编码方法及装置、高频带信号解码方法及装置
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CN102466764B (zh) * 2010-11-03 2015-08-19 北京普源精电科技有限公司 一种频谱超限测量模板的生成方法和装置
DE102011011530B4 (de) * 2011-02-17 2013-05-08 Karlsruher Institut für Technologie Verfahren zur Reduktion von Ultraschalldaten
JP5807453B2 (ja) * 2011-08-30 2015-11-10 富士通株式会社 符号化方法、符号化装置および符号化プログラム
JP6200034B2 (ja) * 2012-04-27 2017-09-20 株式会社Nttドコモ 音声復号装置
EP2972503A4 (en) * 2013-03-14 2016-10-26 Inova Ltd SOURCE ENCODERS THAT CAN BE CONFIGURED FOR SEISMIC SYSTEMS
WO2014210284A1 (en) 2013-06-27 2014-12-31 Dolby Laboratories Licensing Corporation Bitstream syntax for spatial voice coding
WO2015017223A1 (en) 2013-07-29 2015-02-05 Dolby Laboratories Licensing Corporation System and method for reducing temporal artifacts for transient signals in a decorrelator circuit
US9666202B2 (en) 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
EP3048609A4 (en) 2013-09-19 2017-05-03 Sony Corporation Encoding device and method, decoding device and method, and program
MX2016008172A (es) 2013-12-27 2016-10-21 Sony Corp Metodo y aparato de decodificacion, y programa.
CN105096957B (zh) * 2014-04-29 2016-09-14 华为技术有限公司 处理信号的方法及设备
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
US10411866B2 (en) 2014-12-08 2019-09-10 Lg Electronics Inc. Method for receiving control information in wireless communication system, and apparatus therefor
US9595269B2 (en) * 2015-01-19 2017-03-14 Qualcomm Incorporated Scaling for gain shape circuitry
ES2837107T3 (es) 2015-02-26 2021-06-29 Fraunhofer Ges Forschung Aparato y método para procesar una señal de audio para obtener una señal de audio procesada usando una envolvente en el dominio del tiempo objetivo
CN106126164B (zh) * 2016-06-16 2019-05-17 Oppo广东移动通信有限公司 一种音效处理方法及终端设备
US10381020B2 (en) * 2017-06-16 2019-08-13 Apple Inc. Speech model-based neural network-assisted signal enhancement
JP7426772B2 (ja) 2018-07-25 2024-02-02 株式会社プロテリアル 巻磁心の製造方法および巻磁心
CN112629637B (zh) * 2020-11-27 2021-10-26 华南理工大学 一种高频底座力天平信号的时域校准方法

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5199082A (en) * 1989-09-11 1993-03-30 U.S. Philips Corp. Method of detecting an amplitude transient in a field of elements having a multivalent amplitude distribution, device suitable for performing the method, and video system including the device
US5960390A (en) * 1995-10-05 1999-09-28 Sony Corporation Coding method for using multi channel audio signals
US5659622A (en) 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5825320A (en) * 1996-03-19 1998-10-20 Sony Corporation Gain control method for audio encoding device
DE19647399C1 (de) * 1996-11-15 1998-07-02 Fraunhofer Ges Forschung Gehörangepaßte Qualitätsbeurteilung von Audiotestsignalen
US6314369B1 (en) 1998-07-02 2001-11-06 Kabushikikaisha Equos Research Communications navigation system, and navigation base apparatus and navigation apparatus both used in the navigation system
US6122610A (en) 1998-09-23 2000-09-19 Verance Corporation Noise suppression for low bitrate speech coder
US6314396B1 (en) * 1998-11-06 2001-11-06 International Business Machines Corporation Automatic gain control in a speech recognition system
CN1154975C (zh) * 2000-03-15 2004-06-23 皇家菲利浦电子有限公司 用于声频编码的拉盖尔函数
US7930170B2 (en) * 2001-01-11 2011-04-19 Sasken Communication Technologies Limited Computationally efficient audio coder
CN1312662C (zh) * 2001-05-10 2007-04-25 杜比实验室特许公司 通过降低前噪声改善音频编码系统的瞬时性能的方法
CN1165036C (zh) * 2001-11-02 2004-09-01 北京阜国数字技术有限公司 一种基于自适应阀值和典型样本预测的块长选择方法
JP2003216188A (ja) * 2002-01-25 2003-07-30 Matsushita Electric Ind Co Ltd オーディオ信号符号化方法、符号化装置、及び記憶媒体
JP2003233395A (ja) * 2002-02-07 2003-08-22 Matsushita Electric Ind Co Ltd オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システム
JP2003271191A (ja) 2002-03-15 2003-09-25 Toshiba Corp 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム
JP4083449B2 (ja) * 2002-03-19 2008-04-30 日鉱金属株式会社 CdTe単結晶の製造方法
SG108862A1 (en) 2002-07-24 2005-02-28 St Microelectronics Asia Method and system for parametric characterization of transient audio signals
JP4101123B2 (ja) * 2003-06-19 2008-06-18 シャープ株式会社 符号化装置及び符号化方法
US7672838B1 (en) * 2003-12-01 2010-03-02 The Trustees Of Columbia University In The City Of New York Systems and methods for speech recognition using frequency domain linear prediction polynomials to form temporal and spectral envelopes from frequency domain representations of signals
DE102004009954B4 (de) * 2004-03-01 2005-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals
US20090070118A1 (en) 2004-11-09 2009-03-12 Koninklijke Philips Electronics, N.V. Audio coding and decoding
US7627481B1 (en) * 2005-04-19 2009-12-01 Apple Inc. Adapting masking thresholds for encoding a low frequency transient signal in audio data
KR100803205B1 (ko) * 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
JP2007079306A (ja) * 2005-09-15 2007-03-29 Victor Co Of Japan Ltd 音声信号処理装置及び音声信号処理方法
US7546237B2 (en) 2005-12-23 2009-06-09 Qnx Software Systems (Wavemakers), Inc. Bandwidth extension of narrowband speech
ES2383365T3 (es) * 2007-03-02 2012-06-20 Telefonaktiebolaget Lm Ericsson (Publ) Post-filtro no causal
CN101308655B (zh) 2007-05-16 2011-07-06 展讯通信(上海)有限公司 一种音频编解码方法与装置
ES2898865T3 (es) * 2008-03-20 2022-03-09 Fraunhofer Ges Forschung Aparato y método para sintetizar una representación parametrizada de una señal de audio
CN101770776B (zh) 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统

Also Published As

Publication number Publication date
KR101168645B1 (ko) 2012-07-25
EP2352145B1 (en) 2015-04-01
EP2352145A4 (en) 2012-05-02
HUE062878T2 (hu) 2023-12-28
JP2012511184A (ja) 2012-05-17
CN101770776B (zh) 2011-06-08
US20110251846A1 (en) 2011-10-13
KR20110084962A (ko) 2011-07-26
ES2948521T3 (es) 2023-09-13
EP2352145A1 (en) 2011-08-03
PL3910630T3 (pl) 2023-08-21
EP3910630A1 (en) 2021-11-17
EP2808867A1 (en) 2014-12-03
PT3910630T (pt) 2023-07-19
EP4191583A1 (en) 2023-06-07
JP2013156667A (ja) 2013-08-15
CN101770776A (zh) 2010-07-07
WO2010078816A1 (zh) 2010-07-15
EP3910630B1 (en) 2023-04-19
FI3910630T3 (fi) 2023-07-18
ES2540075T3 (es) 2015-07-08
JP6110212B2 (ja) 2017-04-05
US8063809B2 (en) 2011-11-22

Similar Documents

Publication Publication Date Title
JP5281169B2 (ja) 過渡信号符号化方法及び装置、復号化方法及び装置、並びに処理システム
JP7177185B2 (ja) 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス
KR102367538B1 (ko) 다중 채널 신호 인코딩 방법 및 인코더
JP5267362B2 (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置
JP2016191934A (ja) 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法
TW201413707A (zh) 訊框錯誤隱藏方法以及音訊解碼方法
JP2019152878A (ja) 時間領域デコーダによって復号化された時間領域励振の一般のオーディオ合成物を修正するための方法および装置
WO2010066158A1 (zh) 信号编码、解码方法及装置、编解码系统
EP3671737A1 (en) Noise signal processing method, noise signal generation method, encoder, decoder, and encoding and decoding system
JP2023055951A (ja) マルチチャネル信号を符号化する方法及びエンコーダ
WO2010072115A1 (zh) 信号分类处理方法、分类处理装置及编码系统
EP3457402A1 (en) Signal processing method and device adaptive to noise environment and terminal device employing same
WO2015027168A1 (en) Method and system for speech intellibility enhancement in noisy environments
US10332527B2 (en) Method and apparatus for encoding and decoding audio signal
WO2017193551A1 (zh) 多声道信号的编码方法和编码器
US20220208201A1 (en) Apparatus and method for comfort noise generation mode selection
Singh et al. Design of Medium to Low Bitrate Neural Audio Codec
Zhao RETRACTED: Quality Correction for Songs of the War of Resistance Based on Computer Audio Technology
CN114783449A (zh) 神经网络训练方法、装置、电子设备及介质
CN116129918A (zh) 一种提高音频编码质量的方法
Deepa et al. The Influence of Speech Enhancement Algorithm in Speech Compression with Voice Excited Linear Predictive Coding
de Oliveira et al. A Full Frequency Masking Vocoder for Legal Eavesdropping Conversation Recording

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110608

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110608

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121211

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130312

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130312

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130319

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130423

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130523

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5281169

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250