JP6496328B2 - 符号化/復号化方法、装置及びシステム - Google Patents

符号化/復号化方法、装置及びシステム Download PDF

Info

Publication number
JP6496328B2
JP6496328B2 JP2016574888A JP2016574888A JP6496328B2 JP 6496328 B2 JP6496328 B2 JP 6496328B2 JP 2016574888 A JP2016574888 A JP 2016574888A JP 2016574888 A JP2016574888 A JP 2016574888A JP 6496328 B2 JP6496328 B2 JP 6496328B2
Authority
JP
Japan
Prior art keywords
signal
audio signal
characteristic factor
encoding
frequency band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016574888A
Other languages
English (en)
Other versions
JP2017525992A (ja
Inventor
▲賓▼ 王
▲賓▼ 王
▲澤▼新 ▲劉▼
▲澤▼新 ▲劉▼
磊 苗
磊 苗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=54936715&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP6496328(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2017525992A publication Critical patent/JP2017525992A/ja
Application granted granted Critical
Publication of JP6496328B2 publication Critical patent/JP6496328B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、オーディオ信号処理技術に関し、特に時間ドメインに基づく符号化/復号化方法、装置及びシステムに関する。
チャネル容量及び記憶空間を節約するために、人間の耳がオーディオ信号の低周波数情報より高周波数情報に敏感でないことを考慮して、通常では高周波数情報はカットされ、減少したオーディオ品質を生じる。したがって、カットされた高周波数情報を再現するために帯域幅拡張技術が導入され、これにより、オーディオ品質を改善する。符号化性能が確保されつつレートが増加すると、符号化され得る高周波数部分のより広い帯域は、受信機がより広い帯域及びより高い品質のオーディオ信号を取得することを可能にする。
従来技術では、高レートの条件では、入力オーディオ信号の周波数スペクトルは、帯域幅拡張技術を使用することにより全帯域において符号化され得る。符号化の基本的な原理は、入力オーディオ信号の全帯域信号を取得するために、帯域通過フィルタ(Band Pass Filter、略してBPF)を使用することにより入力オーディオ信号において帯域通過フィルタリング処理を実行し、全帯域信号のエネルギーEner0を取得するために、全帯域信号においてエネルギー計算を実行し、高周波数帯域符号化情報を取得するために、超広帯域(Super Wide Band、略してSWB)時間帯域拡張(Time Band Extension、略してTBE)エンコーダを使用することにより高周波数帯域信号を符号化し、高周波数帯域信号に従って、全帯域信号を予測するために使用される全帯域線形予測符号化(Linear Predictive Coding、略してLPC)係数及び全帯域(Full Band、略してFB)励振(Excitation)信号を決定し、予測全帯域信号を取得するために、LPC係数及びFB励振信号に従って予測処理を実行し、ディエンファシス(de-emphasis)処理を受けた予測全帯域信号のエネルギーEner1を決定するために、予測全帯域信号においてディエンファシス処理を実行し、Ener0に対するEner1のエネルギー比を計算することである。高周波数帯域符号化情報及びエネルギー比は、デコーダに送信され、これにより、デコーダは、高周波数帯域符号化情報及びエネルギー比に従って入力オーディオ信号の全帯域信号を復元し、入力オーディオ信号を復元することができる。
前述の解決策では、デコーダにより復元された入力オーディオ信号は、比較的ひどい信号歪みを有する傾向がある。
本発明の実施例は、デコーダにより復元された入力オーディオ信号が比較的ひどい信号歪みを有する傾向があるという従来技術の問題を軽減又は解決するための符号化/復号化方法、装置及びシステムを提供する。
第1の態様によれば、本発明は、符号化装置により、入力オーディオ信号の特徴的ファクタを取得するために、入力オーディオ信号の低周波数帯域信号を符号化するステップと、符号化装置により、第1の全帯域信号を取得するために、入力オーディオ信号の高周波数帯域信号において符号化及びスペクトル拡散予測を実行するステップと、符号化装置により、第1の全帯域信号においてディエンファシス処理を実行するステップであり、ディエンファシス処理のディエンファシスパラメータは、特徴的ファクタに従って決定されるステップと、符号化装置により、ディエンファシス処理を受けた第1の全帯域信号の第1のエネルギーを計算するステップと、符号化装置により、第2の全帯域信号を取得するために、入力オーディオ信号において帯域通過フィルタリング処理を実行するステップと、符号化装置により、第2の全帯域信号の第2のエネルギーを計算するステップと、符号化装置により、第1の全帯域信号の第1のエネルギーに対する第2の全帯域信号の第2のエネルギーのエネルギー比を計算するステップと、符号化装置により、入力オーディオ信号を符号化することから生じたビットストリームを復号化装置に送信するステップであり、ビットストリームは、入力オーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含むステップとを含む符号化方法を提供する。
第1の態様を参照して、第1の態様の第1の可能な実現方式では、この方法は、符号化装置により、特徴的ファクタの量を取得するステップと、符号化装置により、特徴的ファクタ及び特徴的ファクタの量に従って特徴的ファクタの平均値を決定するステップと、符号化装置により、特徴的ファクタの平均値に従ってディエンファシスパラメータを決定するステップとを更に含む。
第1の態様又は第1の態様の第1の可能な実現方式を参照して、第1の態様の第2の可能な実現方式では、符号化装置により、第1の全帯域信号を取得するために、入力オーディオ信号の高周波数帯域信号において符号化及びスペクトル拡散予測を実行するステップは、符号化装置により、高周波数帯域信号に従って、全帯域信号を予測するために使用されるLPC係数及び全帯域励振信号を決定するステップと、符号化装置により、第1の全帯域信号を取得するために、LPC係数及び全帯域励振信号において符号化処理を実行するステップとを含む。
第1の態様又は第1の態様の第1若しくは第2の可能な実現方式のいずれか1つを参照して、第1の態様の第3の可能な実現方式では、符号化装置により、第1の全帯域信号においてディエンファシス処理を実行するステップは、符号化装置により、第1の全帯域信号において周波数スペクトル移動修正を実行し、修正された第1の全帯域信号において周波数スペクトル反映処理を実行するステップと、符号化装置により、周波数スペクトル反映処理を受けた第1の全帯域信号においてディエンファシス処理を実行するステップとを含む。
第1の態様又は第1の態様の第1〜第3の可能な実現方式のいずれか1つを参照して、第1の態様の第4の可能な実現方式では、特徴的ファクタは、オーディオ信号の特徴を反映するために使用され、音声ファクタ、スペクトル傾斜、短期平均エネルギー又は短期ゼロ交差率を含む。
第2の態様によれば、本発明は、復号化装置により、符号化装置により送信されたオーディオ信号ビットストリームを受信するステップであり、オーディオ信号ビットストリームは、オーディオ信号ビットストリームに対応するオーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含むステップと、復号化装置により、低周波数帯域信号を取得するために、特徴的ファクタを使用することによりオーディオ信号ビットストリームにおいて低周波数帯域復号化を実行するステップと、復号化装置により、高周波数帯域信号を取得するために、高周波数帯域符号化情報を使用することによりオーディオ信号ビットストリームにおいて高周波数帯域復号化を実行するステップと、復号化装置により、第1の全帯域信号を取得するために、高周波数帯域信号においてスペクトル拡散予測を実行するステップと、復号化装置により、第1の全帯域信号においてディエンファシス処理を実行するステップであり、ディエンファシス処理のディエンファシスパラメータは、特徴的ファクタに従って決定されるステップと、復号化装置により、ディエンファシス処理を受けた第1の全帯域信号の第1のエネルギーを計算するステップと、復号化装置により、オーディオ信号ビットストリームに含まれるエネルギー比、ディエンファシス処理を受けた第1の全帯域信号及び第1のエネルギーに従って第2の全帯域信号を取得するステップであり、エネルギー比は、第1のエネルギーに対する第2の全帯域信号のエネルギーのエネルギー比であるステップと、復号化装置により、第2の全帯域信号、低周波数帯域信号及び高周波数帯域信号に従ってオーディオ信号ビットストリームに対応するオーディオ信号を復元するステップとを含む復号化方法を提供する。
第2の態様を参照して、第2の態様の第1の可能な実現方式では、この方法は、復号化装置により、復号化を通じて特徴的ファクタの量を取得するステップと、復号化装置により、特徴的ファクタ及び特徴的ファクタの量に従って特徴的ファクタの平均値を決定するステップと、復号化装置により、特徴的ファクタの平均値に従ってディエンファシスパラメータを決定するステップとを更に含む。
第2の態様又は第2の態様の第1の可能な実現方式を参照して、第2の態様の第2の可能な実現方式では、復号化装置により、第1の全帯域信号を取得するために、高周波数帯域信号においてスペクトル拡散予測を実行するステップは、復号化装置により、高周波数帯域信号に従って、全帯域信号を予測するために使用されるLPC係数及び全帯域励振信号を決定するステップと、復号化装置により、第1の全帯域信号を取得するために、LPC係数及び全帯域励振信号において符号化処理を実行するステップとを含む。
第2の態様又は第2の態様の第1若しくは第2の可能な実現方式のいずれか1つを参照して、第2の態様の第3の可能な実現方式では、復号化装置により、第1の全帯域信号においてディエンファシス処理を実行するステップは、復号化装置により、第1の全帯域信号において周波数スペクトル移動修正を実行し、修正された第1の全帯域信号において周波数スペクトル反映処理を実行するステップと、復号化装置により、周波数スペクトル反映処理を受けた第1の全帯域信号においてディエンファシス処理を実行するステップとを含む。
第2の態様又は第2の態様の第1〜第3の可能な実現方式のいずれか1つを参照して、第2の態様の第4の可能な実現方式では、特徴的ファクタは、オーディオ信号の特徴を反映するために使用され、音声ファクタ、スペクトル傾斜、短期平均エネルギー又は短期ゼロ交差率を含む。
第3の態様によれば、本発明は、入力オーディオ信号の特徴的ファクタを取得するために、入力オーディオ信号の低周波数帯域信号を符号化するように構成された第1の符号化モジュールと、第1の全帯域信号を取得するために、入力オーディオ信号の高周波数帯域信号において符号化及びスペクトル拡散予測を実行するように構成された第2の符号化モジュールと、第1の全帯域信号においてディエンファシス処理を実行するように構成されたディエンファシス処理モジュールであり、ディエンファシス処理のディエンファシスパラメータは、特徴的ファクタに従って決定されるディエンファシス処理モジュールと、ディエンファシス処理を受けた第1の全帯域信号の第1のエネルギーを計算するように構成された計算モジュールと、第2の全帯域信号を取得するために、入力オーディオ信号において帯域通過フィルタリング処理を実行するように構成された帯域通過処理モジュールとを含み、計算モジュールは、第2の全帯域信号の第2のエネルギーを計算し、第1の全帯域信号の第1のエネルギーに対する第2の全帯域信号の第2のエネルギーのエネルギー比を計算するように更に構成され、入力オーディオ信号を符号化することから生じたビットストリームを復号化装置に送信するように構成された送信モジュールであり、ビットストリームは、入力オーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含む送信モジュールを含む符号化装置を提供する。
第3の態様を参照して、第3の態様の第1の可能な実現方式では、符号化装置は、特徴的ファクタの量を取得し、特徴的ファクタ及び特徴的ファクタの量に従って特徴的ファクタの平均値を決定し、特徴的ファクタの平均値に従ってディエンファシスパラメータを決定するように構成されたディエンファシスパラメータ決定モジュールを更に含む。
第3の態様又は第3の態様の第1の可能な実現方式を参照して、第3の態様の第2の可能な実現方式では、第2の符号化モジュールは、高周波数帯域信号に従って、全帯域信号を予測するために使用されるLPC係数及び全帯域励振信号を決定し、第1の全帯域信号を取得するために、LPC係数及び全帯域励振信号において符号化処理を実行するように具体的に構成される。
第3の態様又は第3の態様の第1若しくは第2の可能な実現方式のいずれか1つを参照して、第3の態様の第3の可能な実現方式では、ディエンファシス処理モジュールは、第2の符号化モジュールにより取得された第1の全帯域信号において周波数スペクトル移動修正を実行し、修正された第1の全帯域信号において周波数スペクトル反映処理を実行し、周波数スペクトル反映処理を受けた第1の全帯域信号においてディエンファシス処理を実行するように具体的に構成される。
第3の態様又は第3の態様の第1〜第3の可能な実現方式のいずれか1つを参照して、第3の態様の第4の可能な実現方式では、特徴的ファクタは、オーディオ信号の特徴を反映するために使用され、音声ファクタ、スペクトル傾斜、短期平均エネルギー又は短期ゼロ交差率を含む。
第4の態様によれば、本発明は、符号化装置により送信されたオーディオ信号ビットストリームを受信するように構成された受信モジュールであり、オーディオ信号ビットストリームは、オーディオ信号ビットストリームに対応するオーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含む受信モジュールと、低周波数帯域信号を取得するために、特徴的ファクタを使用することによりオーディオ信号ビットストリームにおいて低周波数帯域復号化を実行するように構成された第1の復号化モジュールと、高周波数帯域信号を取得するために、高周波数帯域符号化情報を使用することによりオーディオ信号ビットストリームにおいて高周波数帯域復号化を実行し、第1の全帯域信号を取得するために、高周波数帯域信号においてスペクトル拡散予測を実行するように構成された第2の復号化モジュールと、第1の全帯域信号においてディエンファシス処理を実行するように構成されたディエンファシス処理モジュールであり、ディエンファシス処理のディエンファシスパラメータは、特徴的ファクタに従って決定されるディエンファシス処理モジュールと、ディエンファシス処理を受けた第1の全帯域信号の第1のエネルギーを計算し、オーディオ信号ビットストリームに含まれるエネルギー比、ディエンファシス処理を受けた第1の全帯域信号及び第1のエネルギーに従って第2の全帯域信号を取得するように構成された計算モジュールであり、エネルギー比は、第1のエネルギーに対する第2の全帯域信号のエネルギーのエネルギー比である計算モジュールと、第2の全帯域信号、低周波数帯域信号及び高周波数帯域信号に従ってオーディオ信号ビットストリームに対応するオーディオ信号を復元するように構成された復元モジュールとを含む復号化装置を提供する。
第4の態様を参照して、第4の態様の第1の可能な実現方式では、復号化装置は、復号化を通じて特徴的ファクタの量を取得し、特徴的ファクタ及び特徴的ファクタの量に従って特徴的ファクタの平均値を決定し、特徴的ファクタの平均値に従ってディエンファシスパラメータを決定するように構成されたディエンファシスパラメータ決定モジュールを更に含む。
第4の態様又は第4の態様の第1の可能な実現方式を参照して、第4の態様の第2の可能な実現方式では、第2の復号化モジュールは、高周波数帯域信号に従って、全帯域信号を予測するために使用されるLPC係数及び全帯域励振信号を決定し、第1の全帯域信号を取得するために、LPC係数及び全帯域励振信号において符号化処理を実行するように具体的に構成される。
第4の態様又は第4の態様の第1若しくは第2の可能な実現方式のいずれか1つを参照して、第4の態様の第3の可能な実現方式では、ディエンファシス処理モジュールは、第1の全帯域信号において周波数スペクトル移動修正を実行し、修正された第1の全帯域信号において周波数スペクトル反映処理を実行し、周波数スペクトル反映処理を受けた第1の全帯域信号においてディエンファシス処理を実行するように具体的に構成される。
第4の態様又は第4の態様の第1〜第3の可能な実現方式のいずれか1つを参照して、第4の態様の第4の可能な実現方式では、特徴的ファクタは、オーディオ信号の特徴を反映するために使用され、音声ファクタ、スペクトル傾斜、短期平均エネルギー又は短期ゼロ交差率を含む。
第5の態様によれば、本発明は、第3の態様又は第3の態様の第1〜第4の可能な実現方式のいずれか1つによる符号化装置と、第4の態様又は第4の態様の第1〜第4の可能な実現方式のいずれか1つによる復号化装置とを含む符号化/復号化システムを提供する。
本発明の実施例において提供されるコーデック方法、装置及びシステムによれば、ディエンファシス処理は、入力オーディオ信号の特徴的ファクタに従って決定されたディエンファシスパラメータを使用することにより全帯域信号において実行され、次に、全帯域信号は符号化されてデコーダに送信され、これにより、デコーダは、入力オーディオ信号の特徴的ファクタに従って全帯域信号において対応するディエンファシス復号化処理を実行し、入力オーディオ信号を復元する。これは、デコーダにより復元されたオーディオ信号が信号歪みを有する傾向があるという従来技術の問題を解決し、符号化性能を向上させるためにオーディオ信号の特徴的ファクタに従って全帯域信号において適応的なディエンファシス処理を実現し、これにより、デコーダにより復元された入力オーディオ信号は、比較的高い忠実度を有し、元の信号により近い。
本発明の実施例又は従来技術における技術的解決策をより明確に説明するために、以下に、実施例又は従来技術を説明するために必要な添付図面を簡単に紹介する。明らかに、以下の説明における添付図面は、本発明のいくつかの実施例を示しており、当業者は、創造的取り組みを行うことなく、依然としてこれらの添付図面から他の図面を導き得る。
本発明の実施例による符号化方法の実施例のフローチャートである。 本発明の実施例による復号化方法の実施例のフローチャートである。 本発明の実施例による符号化装置の実施例1の概略構成図である。 本発明の実施例による復号化装置の実施例1の概略構成図である。 本発明の実施例による符号化装置の実施例2の概略構成図である。 本発明の実施例による復号化装置の実施例2の概略構成図である。 本発明による符号化/復号化システムの実施例の概略構成図である。
本発明の実施例の目的、技術的解決策及び利点をより明確にするために、以下に、本発明の実施例における添付図面を参照して本発明の実施例における技術的解決策を明確且つ完全に説明する。明らかに、説明する実施例は、本発明の実施例の全てではなく、一部である。創造的取り組みを行うことなく本発明の実施例に基づいて当業者により取得される全ての他の実施例は、本発明の保護範囲内に入るものとする。
図1は、本発明の実施例による符号化方法の実施例の概略フローチャートである。図1に示すように、方法の実施例は以下のステップを含む。
S101:符号化装置は、入力オーディオ信号の特徴的ファクタを取得するために、入力オーディオ信号の低周波数帯域信号を符号化する。
符号化される信号は、オーディオ信号である。特徴的ファクタは、オーディオ信号の特徴を反映するために使用され、“音声ファクタ”、“スペクトル傾斜”、“短期平均エネルギー”又は“短期ゼロ交差率”を含むが、これらに限定されない。特徴的ファクタは、入力オーディオ信号の低周波数帯域信号を符号化することにより、符号化装置により取得されてもよい。具体的には、一例として音声ファクタを使用すると、音声ファクタは、低周波数帯域信号を符号化することにより取得された低周波数帯域符号化情報から抽出されたピッチ周期、代数コードブック及びこれらのそれぞれの利得に従って計算を通じて取得されてもよい。
S102:符号化装置は、第1の全帯域信号を取得するために、入力オーディオ信号の高周波数帯域信号において符号化及びスペクトル拡散予測を実行する。
高周波数帯域信号が符号化された場合、高周波数帯域符号化情報が更に取得される。
S103:符号化装置は、第1の全帯域信号においてディエンファシス処理を実行し、ディエンファシス処理のディエンファシスパラメータは、特徴的ファクタに従って決定される。
S104:符号化装置は、ディエンファシス処理を受けた第1の全帯域信号の第1のエネルギーを計算する。
S105:符号化装置は、第2の全帯域信号を取得するために、入力オーディオ信号において帯域通過フィルタリング処理を実行する。
S106:符号化装置は、第2の全帯域信号の第2のエネルギーを計算する。
S107:符号化装置は、第1の全帯域信号の第1のエネルギーに対する第2の全帯域信号の第2のエネルギーのエネルギー比を計算する。
S108:符号化装置は、入力オーディオ信号を符号化することから生じたビットストリームを復号化装置に送信し、ビットストリームは、入力オーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含む。
さらに、方法の実施例は、符号化装置により、特徴的ファクタの量を取得するステップと、符号化装置により、特徴的ファクタ及び特徴的ファクタの量に従って特徴的ファクタの平均値を決定するステップと、符号化装置により、特徴的ファクタの平均値に従ってディエンファシスパラメータを決定するステップとを更に含む。
具体的には、符号化装置は、特徴的ファクタの1つを取得してもよい。特徴的ファクタが音声ファクタである例を使用すると、符号化装置は、音声ファクタの量を取得し、音声ファクタ及び音声ファクタの量に従って入力オーディオ信号の音声ファクタの平均値を決定し、音声ファクタの平均値に従ってディエンファシスパラメータを更に決定する。
さらに、S102において第1の全帯域信号を取得するために、入力オーディオ信号の高周波数帯域信号において符号化及びスペクトル拡散予測を実行するステップは、符号化装置により、高周波数帯域信号に従って、全帯域信号を予測するために使用されるLPC係数及び全帯域励振信号を決定するステップと、符号化装置により、第1の全帯域信号を取得するために、LPC係数及び全帯域励振信号において符号化処理を実行するステップとを含む。
さらに、S103は、符号化装置により、第1の全帯域信号において周波数スペクトル移動修正を実行し、修正された第1の全帯域信号において周波数スペクトル反映処理を実行するステップと、符号化装置により、周波数スペクトル反映処理を受けた第1の全帯域信号においてディエンファシス処理を実行するステップとを含む。
任意選択で、S103の後に、方法の実施例は、符号化装置により、ディエンファシス処理を受けた第1の全帯域信号においてアップサンプリング及び帯域通過処理を実行するステップを更に含み、対応して、S104は、符号化装置により、ディエンファシス処理、アップサンプリング及び帯域通過処理を受けた第1の全帯域信号の第1のエネルギーを計算するステップを含む。
方法の実施例の具体的な実現方式について、特徴的ファクタが音声ファクタである例を使用することにより以下に説明する。他の特徴的ファクタについては、これらの実現処理は同様であり、詳細については更に説明しない。
具体的には、入力オーディオ信号を受信した後に、符号化装置の信号符号化装置は、入力オーディオ信号から、対応する周波数スペクトル範囲が[0,f1]である低周波数帯域信号を抽出し、入力オーディオ信号の音声ファクタを取得するために、低周波数帯域信号を符号化する。具体的には、信号符号化装置は、低周波数帯域符号化情報を取得するために、低周波数帯域信号を符号化し、音声ファクタを取得するために、低周波数帯域符号化情報に含まれるピッチ周期、代数コードブック及びこれらのそれぞれの利得に従って計算し、音声ファクタに従ってディエンファシスパラメータを決定する。信号符号化装置は、入力オーディオ信号から、対応する周波数スペクトル範囲が[f1,f2]である高周波数帯域信号を抽出し、高周波数帯域符号化情報を取得するために、高周波数帯域信号において符号化及びスペクトル拡散予測を実行し、高周波数帯域信号に従って、全帯域信号を予測するために使用されるLPC係数及び全帯域励振信号を決定し、予測された第1の全帯域信号を取得するために、LPC係数及び全帯域励振信号において符号化処理を実行し、第1の全帯域信号においてディエンファシス処理を実行し、ディエンファシス処理のディエンファシスパラメータは、音声ファクタに従って決定される。第1の全帯域信号が決定された後に、周波数スペクトル移動修正及び周波数スペクトル反映処理が第1の全帯域信号において実行されてもよく、次に、ディエンファシス処理が実行されてもよい。任意選択で、アップサンプリング及び帯域通過フィルタリング処理が、ディエンファシス処理を受けた第1の全帯域信号において実行されてもよい。その後、符号化装置は、処理された第1の全帯域信号の第1のエネルギーEner0を計算し、周波数スペクトル範囲が[f2,f3]である第2の全帯域信号を取得するために、入力オーディオ信号において帯域通過フィルタリング処理を実行し、第2の全帯域信号の第2のエネルギーEner1を決定し、Ener0に対するEner1のエネルギー比(ratio)を決定し、入力オーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を、入力オーディオ信号を符号化することから生じたビットストリームに含め、ビットストリームを復号化装置に送信し、これにより、復号化装置は、受信したビットストリーム、特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比に従ってオーディオ信号を復元する。
一般的に、48キロヘルツ(Kilo Hertz、略してKHz)の入力オーディオ信号では、入力オーディオ信号の低周波数帯域信号の対応する周波数スペクトル範囲[0,f1]は、具体的には[0,8KHz]でもよく、入力オーディオ信号の高周波数帯域信号の対応する周波数スペクトル範囲[f1,f2]は、具体的には[8KHz,16KHz]でもよい。第2の全帯域信号に対応する、対応する周波数スペクトル範囲[f2,f3]は、具体的には[16KHz,20KHz]でもよい。以下に、一例として具体的な周波数スペクトル範囲を使用することにより、方法の実施例の実現方式を具体的に説明する。本発明は、この実現方式に適用可能であるが、これに限定されない点に留意すべきである。
具体的な実現では、[0,8KHz]に対応する低周波数帯域信号は、低周波数帯域符号化情報を取得するために、符号励振線形予測(Code Excited Linear Prediction、略してCELP)コア(core)エンコーダを使用することにより符号化されてもよい。コアエンコーダにより使用される符号化アルゴリズムは、既存の代数符号励振線形予測(Algebraic Code Excited Linear Prediction、略してACELP)アルゴリズムでもよいが、これに限定されない。
ピッチ周期、代数コードブック及びこれらのそれぞれの利得は、低周波数帯域符号化情報から抽出され、音声ファクタ(voice_factor)は、既存のアルゴリズムを使用することによる計算を通じて取得され、アルゴリズムの詳細については更に説明しない。音声ファクタが決定された後に、ディエンファシスパラメータを計算するために使用されるディエンファシスファクタμが決定される。以下に、一例として音声ファクタを使用することにより、ディエンファシスファクタμが決定される計算処理を詳細に説明する。
取得された音声ファクタの量Mがまず決定され、通常では、これは4又は5でもよい。M個の音声ファクタは加算及び平均化され、これにより、音声ファクタの平均値varvoiceshapeを決定する。ディエンファシスファクタμは、平均値に従って決定され、ディエンファシスパラメータH(Z)は、以下の式(1)により示されるように、μに従って更に取得されてもよい。
H(Z)=1/(1-μZ-1) (1)
ここで、H(Z)はZドメインにおける伝達関数の表現であり、Z-1は遅延単位を表し、μはvarvoiceshapeに従って決定される。varvoiceshapeに関するいずれかの値がμとして選択されてもよく、これは、具体的にはμ=varvoiceshape3、μ=varvoiceshape2、μ=varvoiceshape、又はμ=1-varvoiceshapeでもよいが、これらに限定されない。
[8KHz,16KHz]に対応する高周波数帯域信号は、超広帯域(Super Wide Band)時間帯域拡張(Time Band Extention、略してTBE)エンコーダを使用することにより符号化されてもよい。これは、高周波数帯域励振信号を復元するために、コアエンコーダからピッチ期間、代数コードブック及びこれらのそれぞれの利得を抽出し、高周波数帯域LPC係数を取得するためのLPC分析を実行するために、高周波数帯域信号成分を抽出し、復元された高周波数帯域信号を取得するために、高周波数帯域励振信号及び高周波数帯域LPC係数を統合し、利得調整パラメータgainを取得するために、復元された高周波数帯域信号を入力オーディオ信号内の高周波数帯域信号と比較し、高周波数帯域符号化情報を取得するために、少量のビットを使用することにより、高周波数帯域LPC係数及び利得パラメータgainを量子化することを含む。
さらに、SWBエンコーダは、入力オーディオ信号の高周波数帯域信号に従って、全帯域信号を予測するために使用される全帯域LPC係数及び全帯域励振信号を決定し、予測された第1の全帯域信号を取得するために、全帯域LPC係数及び全帯域励振信号において統合処理を実行し、次に、周波数スペクトル移動修正が、以下の式(2)を使用することにより第1の全帯域信号において実行されてもよい。
S2k=S1k×cos(2×PI×fn×k/fs) (2)
ここで、kは第kの時間サンプル点を表し、kは正の整数であり、S2は周波数スペクトル移動修正の後の第1の周波数スペクトル信号であり、S1は第1の全帯域信号であり、PIは円の直径に対する円の円周の比であり、fnは周波数スペクトルが移動する必要のある距離がn個の時間サンプル点であることを示し、nは正の整数であり、fsは信号サンプリングレートを表す。
周波数スペクトル移動修正の後に、周波数スペクトル反映処理を受けた第1の全帯域信号S3を取得するために、S2において周波数スペクトル反映処理が実行され、周波数スペクトル移動の前後の対応する時間サンプル点の周波数スペクトル信号の振幅が反映される。周波数スペクトル反映の実現方式は、一般的な周波数スペクトル反映と同じでもよく、これにより、周波数スペクトルは、元の周波数スペクトルの構成と同じ構成に配置され、詳細については更に説明しない。
その後、ディエンファシス処理を受けた第1の全帯域信号S4を取得するために、音声ファクタに従って決定されたディエンファシスパラメータH(Z)を使用することによりS3においてディエンファシス処理が実行され、次に、S4のエネルギーEner0が決定される。具体的には、ディエンファシス処理は、ディエンファシスパラメータを有するディエンファシスフィルタを使用することにより実行されてもよい。
任意選択で、S4が取得された後に、アップサンプリング処理を受けた第1の全帯域信号S5を取得するために、ディエンファシス処理を受けた第1の全帯域信号S4において、ゼロ挿入を用いることによりアップサンプリング処理が実行されてもよく、次に、第1の全帯域信号S6を取得するために、[16KHz,20KHz]の通過範囲を有する帯域通過フィルタ(Band Pass Filter、略してBPF)を使用することによりS5において帯域通過フィルタリング処理が実行されてもよく、次に、S6のエネルギーEner0が決定される。アップサンプリング及び帯域通過処理は、ディエンファシス処理を受けた第1の全帯域信号において実行され、次に、第1の全帯域信号のエネルギーが決定され、これにより、高周波数帯域拡張信号の周波数スペクトルエネルギー及び周波数スペクトル構成が、符号化性能を向上させるために調整されてもよい。
第2の全帯域信号は、[16KHz,20KHz]の通過範囲を有する帯域通過フィルタ(Band Pass Filter、略してBPF)を使用することにより入力オーディオ信号において帯域通過フィルタリング処理を実行することで、符号化装置により取得されてもよい。第2の全帯域信号が取得された後に、符号化装置は、第2の全帯域信号のエネルギーEner1を決定し、エネルギーEner0に対するエネルギーEner1の比を計算する。エネルギー比において量子化処理が実行された後に、入力オーディオ信号のエネルギー比、特徴的ファクタ及び高周波数帯域符号化情報は、ビットストリームにパッケージ化され、復号化装置に送信される。
従来技術では、ディエンファシスフィルタリングパラメータH(Z)のディエンファシスファクタμは通常では固定値を有し、入力オーディオ信号の信号タイプは考慮されず、その結果、復号化装置により復元された入力オーディオ信号が信号歪みを有する傾向があることを生じる。
方法の実施例によれば、ディエンファシス処理は、入力オーディオ信号の特徴的ファクタに従って決定されたディエンファシスパラメータを使用することにより全帯域信号において実行され、次に、全帯域信号は符号化されてデコーダに送信され、これにより、デコーダは、入力オーディオ信号の特徴的ファクタに従って全帯域信号において対応するディエンファシス復号化処理を実行し、入力オーディオ信号を復元する。これは、デコーダにより復元されたオーディオ信号が信号歪みを有する傾向があるという従来技術の問題を解決し、符号化性能を向上させるためにオーディオ信号の特徴的ファクタに従って全帯域信号において適応的なディエンファシス処理を実現し、これにより、デコーダにより復元された入力オーディオ信号は、比較的高い忠実度を有し、元の信号により近い。
図2は、本発明の実施例による復号化方法の実施例のフローチャートであり、図1に示す方法の実施例に対応するデコーダ側の方法の実施例である。図2に示すように、方法の実施例は以下のステップを含む。
S201:復号化装置は、符号化装置により送信されたオーディオ信号ビットストリームを受信し、オーディオ信号ビットストリームは、オーディオ信号ビットストリームに対応するオーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含む。
特徴的ファクタは、オーディオ信号の特徴を反映するために使用され、“音声ファクタ”、“スペクトル傾斜”、“短期平均エネルギー”又は“短期ゼロ交差率”を含むが、これらに限定されない。特徴的ファクタは、図1に示す方法の実施例における特徴的ファクタと同じであり、詳細については再び説明しない。
S202:復号化装置は、低周波数帯域信号を取得するために、特徴的ファクタを使用することによりオーディオ信号ビットストリームにおいて低周波数帯域復号化を実行する。
S203:復号化装置は、高周波数帯域信号を取得するために、高周波数帯域符号化情報を使用することによりオーディオ信号ビットストリームにおいて高周波数帯域復号化を実行する。
S204:復号化装置は、第1の全帯域信号を取得するために、高周波数帯域信号においてスペクトル拡散予測を実行する。
S205:復号化装置は、第1の全帯域信号においてディエンファシス処理を実行し、ディエンファシス処理のディエンファシスパラメータは、特徴的ファクタに従って決定される。
S206:復号化装置は、ディエンファシス処理を受けた第1の全帯域信号の第1のエネルギーを計算する。
S207:復号化装置は、オーディオ信号ビットストリームに含まれるエネルギー比、ディエンファシス処理を受けた第1の全帯域信号及び第1のエネルギーに従って第2の全帯域信号を取得し、エネルギー比は、第1のエネルギーに対する第2の全帯域信号のエネルギーのエネルギー比である。
S208:復号化装置は、第2の全帯域信号、低周波数帯域信号及び高周波数帯域信号に従ってオーディオ信号ビットストリームに対応するオーディオ信号を復元する。
さらに、方法の実施例は、復号化装置により、復号化を通じて特徴的ファクタの量を取得するステップと、復号化装置により、特徴的ファクタ及び特徴的ファクタの量に従って特徴的ファクタの平均値を決定するステップと、復号化装置により、特徴的ファクタの平均値に従ってディエンファシスパラメータを決定するステップとを更に含む。
さらに、S204は、復号化装置により、高周波数帯域信号に従って、全帯域信号を予測するために使用されるLPC係数及び全帯域励振信号を決定するステップと、復号化装置により、第1の全帯域信号を取得するために、LPC係数及び全帯域励振信号において符号化処理を実行するステップとを含む。
さらに、S205は、復号化装置により、第1の全帯域信号において周波数スペクトル移動修正を実行し、修正された第1の全帯域信号において周波数スペクトル反映処理を実行するステップと、復号化装置により、周波数スペクトル反映処理を受けた第1の全帯域信号においてディエンファシス処理を実行するステップとを含む。
任意選択で、S205の後に、方法の実施例は、復号化装置により、ディエンファシス処理を受けた第1の全帯域信号においてアップサンプリング及び帯域通過フィルタリング処理を実行するステップを更に含み、対応して、S206は、復号化装置により、ディエンファシス処理、アップサンプリング及び帯域通過処理を受けた第1の全帯域信号の第1のエネルギーを決定するステップを含む。
方法の実施例は、図1に示す方法の実施例における技術的解決策に対応する。方法の実施例の具体的な実現方式について、特徴的ファクタが音声ファクタである例を使用することにより説明する。他の特徴的ファクタについては、これらの実現処理は同様であり、詳細については更に説明しない。
具体的には、復号化装置は、符号化装置により送信されたオーディオ信号ビットストリームを受信し、オーディオ信号ビットストリームは、オーディオ信号ビットストリームに対応するオーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含む。その後、復号化装置は、オーディオ信号ビットストリームからオーディオ信号の特徴的ファクタを抽出し、低周波数帯域信号を取得するために、オーディオ信号の特徴的ファクタを使用することによりオーディオ信号ビットストリームにおいて低周波数帯域復号化を実行し、高周波数帯域信号を取得するために、高周波数帯域符号化情報を使用することによりオーディオ信号ビットストリームにおいて高周波数帯域復号化を実行する。復号化装置は、特徴的ファクタに従ってディエンファシスパラメータを決定し、第1の全帯域信号S1を取得するために、復号化を通じて取得された高周波数帯域信号に従って全帯域信号予測を実行し、周波数スペクトル移動修正処理を受けた第1の全帯域信号S2を取得するために、S1において周波数スペクトル移動修正処理を実行し、信号S3を取得するために、S2において周波数スペクトル反映処理を実行し、信号S4を取得するために、特徴的ファクタに従って決定されたディエンファシスパラメータを使用することによりS3においてディエンファシス処理を実行し、S4の第1のエネルギーEner0を計算する。任意選択で、復号化装置は、信号S5を取得するために、信号S4においてアップサンプリング処理を実行し、信号S6を取得するために、S5において帯域通過フィルタリング処理を実行し、次に、S6の第1のエネルギーEner0を計算する。その後、第2の全帯域信号は、信号S4又はS6、Ener0及び受信したエネルギー比に従って取得され、オーディオ信号ビットストリームに対応するオーディオ信号は、復号化を通じて取得された第2の全帯域信号、低周波数帯域信号及び高周波数帯域信号に従って復元される。
具体的な実現では、低周波数帯域復号化は、低周波数帯域信号を取得するために、特徴的ファクタを使用することによりオーディオ信号ビットストリームにおいてcoreデコーダにより実行されてもよい。高周波数帯域復号化は、高周波数帯域信号を取得するために、高周波数帯域符号化情報においてSWBデコーダにより実行されてもよい。高周波数帯域信号が取得された後に、第1の全帯域信号を取得するために、スペクトル拡散予測は、高周波数帯域信号に従って直接実行されるか、或いは高周波数帯域信号が減衰ファクタにより乗算された後に実行され、周波数スペクトル移動修正処理、周波数スペクトル反映処理及びディエンファシス処理が第1の全帯域信号において実行される。任意選択で、ディエンファシス処理を受けた第1の周波数帯域信号においてアップサンプリング処理及び帯域通過フィルタリング処理が実行される。具体的な実現では、図1に示す方法の実施例のものと同様の実現方式が処理のために使用されてもよく、詳細については再び説明しない。
信号S4又はS6、Ener0及び受信したエネルギー比に従って第2の全帯域信号を取得することは、具体的には、第2の全帯域信号のエネルギーEner1=Ener0×Rを復元するために、エネルギー比R及び第1のエネルギーEner0に従って第1の全帯域信号においてエネルギー調整を実行し、第1の全帯域信号の周波数スペクトル及びエネルギーEner1に従って第2の全帯域信号を取得することである。
方法の実施例によれば、復号化装置は、オーディオ信号ビットストリームに含まれるオーディオ信号の特徴的ファクタを使用することによりディエンファシスパラメータを決定し、全帯域信号においてディエンファシス処理を実行し、特徴的ファクタを使用することによる復号化を通じて低周波数帯域信号を取得し、これにより、復号化装置により復元されたオーディオ信号は、元の入力オーディオ信号により近く、より高い忠実度を有する。
図3は、本発明の実施例による符号化装置の実施例1の概略構成図である。図3に示すように、符号化装置300は、第1の符号化モジュール301と、第2の符号化モジュール302と、ディエンファシス処理モジュール303と、計算モジュール304と、帯域通過処理モジュール305と、送信モジュール306とを含む。第1の符号化モジュール301は、入力オーディオ信号の特徴的ファクタを取得するために、入力オーディオ信号の低周波数帯域信号を符号化するように構成され、特徴的ファクタは、オーディオ信号の特徴を反映するために使用され、音声ファクタ、スペクトル傾斜、短期平均エネルギー又は短期ゼロ交差率を含み、第2の符号化モジュール302は、第1の全帯域信号を取得するために、入力オーディオ信号の高周波数帯域信号において符号化及びスペクトル拡散予測を実行するように構成され、ディエンファシス処理モジュール303は、第1の全帯域信号においてディエンファシス処理を実行するように構成され、ディエンファシス処理のディエンファシスパラメータは、特徴的ファクタに従って決定され、計算モジュール304は、ディエンファシス処理を受けた第1の全帯域信号の第1のエネルギーを計算するように構成され、帯域通過処理モジュール305は、第2の全帯域信号を取得するために、入力オーディオ信号において帯域通過フィルタリング処理を実行するように構成され、計算モジュール304は、第2の全帯域信号の第2のエネルギーを計算し、第1の全帯域信号の第1のエネルギーに対する第2の全帯域信号の第2のエネルギーのエネルギー比を計算するように更に構成され、送信モジュール306は、入力オーディオ信号を符号化することから生じたビットストリームを復号化装置に送信するように構成され、ビットストリームは、入力オーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含む。
さらに、符号化装置300は、特徴的ファクタの量を取得し、特徴的ファクタ及び特徴的ファクタの量に従って特徴的ファクタの平均値を決定し、特徴的ファクタの平均値に従ってディエンファシスパラメータを決定するように構成されたディエンファシスパラメータ決定モジュール307を更に含む。
さらに、第2の符号化モジュール302は、高周波数帯域信号に従って、全帯域信号を予測するために使用されるLPC係数及び全帯域励振信号を決定し、第1の全帯域信号を取得するために、LPC係数及び全帯域励振信号において符号化処理を実行するように具体的に構成される。
さらに、ディエンファシス処理モジュール303は、第2の符号化モジュール302により取得された第1の全帯域信号において周波数スペクトル移動修正を実行し、修正された第1の全帯域信号において周波数スペクトル反映処理を実行し、周波数スペクトル反映処理を受けた第1の全帯域信号においてディエンファシス処理を実行するように具体的に構成される。
この実施例において提供される符号化装置は、図1に示す方法の実施例における技術的解決策を実行するように構成されてもよい。これらの実現原理及び技術的効果は同様であり、詳細については再び説明しない。
図4は、本発明の実施例による復号化装置の実施例1の概略構成図である。図4に示すように、復号化装置400は、受信モジュール401と、第1の復号化モジュール402と、第2の復号化モジュール403と、ディエンファシス処理モジュール404と、計算モジュール405と、復元モジュール406とを含む。受信モジュール401は、符号化装置により送信されたオーディオ信号ビットストリームを受信するように構成され、オーディオ信号ビットストリームは、オーディオ信号ビットストリームに対応するオーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含み、特徴的ファクタは、オーディオ信号の特徴を反映するために使用され、音声ファクタ、スペクトル傾斜、短期平均エネルギー又は短期ゼロ交差率を含み、第1の復号化モジュール402は、低周波数帯域信号を取得するために、特徴的ファクタを使用することによりオーディオ信号ビットストリームにおいて低周波数帯域復号化を実行するように構成され、第2の復号化モジュール403は、高周波数帯域信号を取得するために、高周波数帯域符号化情報を使用することによりオーディオ信号ビットストリームにおいて高周波数帯域復号化を実行し、第1の全帯域信号を取得するために、高周波数帯域信号においてスペクトル拡散予測を実行するように構成され、ディエンファシス処理モジュール404は、第1の全帯域信号においてディエンファシス処理を実行するように構成され、ディエンファシス処理のディエンファシスパラメータは、特徴的ファクタに従って決定され、計算モジュール405は、ディエンファシス処理を受けた第1の全帯域信号の第1のエネルギーを計算し、オーディオ信号ビットストリームに含まれるエネルギー比、ディエンファシス処理を受けた第1の全帯域信号及び第1のエネルギーに従って第2の全帯域信号を取得するように構成され、エネルギー比は、第1のエネルギーに対する第2の全帯域信号のエネルギーのエネルギー比であり、復元モジュール406は、第2の全帯域信号、低周波数帯域信号及び高周波数帯域信号に従ってオーディオ信号ビットストリームに対応するオーディオ信号を復元するように構成される。
さらに、復号化装置400は、復号化を通じて特徴的ファクタの量を取得し、特徴的ファクタ及び特徴的ファクタの量に従って特徴的ファクタの平均値を決定し、特徴的ファクタの平均値に従ってディエンファシスパラメータを決定するように構成されたディエンファシスパラメータ決定モジュール407を更に含む。
さらに、第2の復号化モジュール403は、高周波数帯域信号に従って、全帯域信号を予測するために使用されるLPC係数及び全帯域励振信号を決定し、第1の全帯域信号を取得するために、LPC係数及び全帯域励振信号において符号化処理を実行するように具体的に構成される。
さらに、ディエンファシス処理モジュール404は、第1の全帯域信号において周波数スペクトル移動修正を実行し、修正された第1の全帯域信号において周波数スペクトル反映処理を実行し、周波数スペクトル反映処理を受けた第1の全帯域信号においてディエンファシス処理を実行するように具体的に構成される。
この実施例において提供される復号化装置は、図2に示す方法の実施例における技術的解決策を実行するように構成されてもよい。これらの実現原理及び技術的効果は同様であり、詳細については再び説明しない。
図5は、本発明の実施例による符号化装置の実施例2の概略構成図である。図5に示すように、符号化装置500は、プロセッサ501と、メモリ502と、通信インタフェース503とを含む。プロセッサ501、メモリ502及び通信インタフェース503は、バス(図面に示す太い実線)を用いて接続される。
通信インタフェース503は、オーディオ信号の入力を受信し、復号化装置と通信するように構成される。メモリ502は、プログラムコードを記憶するように構成される。プロセッサ501は、図1に示す方法の実施例における技術的解決策を実行するために、メモリ502に記憶されたプログラムコードを呼び出すように構成される。これらの実現原理及び技術的解決策は同様であり、詳細については再び説明しない。
図6は、本発明の実施例による復号化装置の実施例2の概略構成図である。図6に示すように、復号化装置600は、プロセッサ601と、メモリ602と、通信インタフェース603とを含む。プロセッサ601、メモリ602及び通信インタフェース603は、バス(図面に示す太い実線)を用いて接続される。
通信インタフェース603は、符号化装置と通信し、復元されたオーディオ信号を出力するように構成される。メモリ602は、プログラムコードを記憶するように構成される。プロセッサ601は、図2に示す方法の実施例における技術的解決策を実行するために、メモリ602に記憶されたプログラムコードを呼び出すように構成される。これらの実現原理及び技術的解決策は同様であり、詳細については再び説明しない。
図7は、本発明の実施例による符号化/復号化システムの実施例の概略構成図である。図7に示すように、コーデックシステム700は、符号化装置701と、復号化装置702とを含む。符号化装置701及び復号化装置702は、それぞれ図3に示す符号化装置及び図4に示す復号化装置でもよく、それぞれ図1及び図2に示す方法の実施例における技術的解決策を実行するように構成されてもよい。これらの実現原理及び技術的解決策は同様であり、詳細については再び説明しない。
前述の実施例の説明により、当業者は、本発明がハードウェア、ファームウェア又はこれらの組み合わせにより実現されてもよいことを明確に認識し得る。本発明がソフトウェアにより実現される場合、前述の機能は、コンピュータ読み取り可能媒体に記憶されてもよく、或いはコンピュータ読み取り可能媒体内の1つ以上の命令又はコードとして送信されてもよい。コンピュータ読み取り可能媒体は、コンピュータ記憶媒体と、通信媒体とを含み、通信媒体は、コンピュータプログラムが1つの場所から他に送信されることを可能にするいずれかの媒体を含む。記憶媒体は、コンピュータにアクセス可能ないずれか利用可能な媒体でもよい。以下に例を提供するが、限定を課すものではない。コンピュータ読み取り可能媒体は、RAM、ROM、EEPROM、CD-ROM又は他の光ディスクストレージ若しくはディスク記憶媒体、又は他の磁気記憶デバイス、又は命令若しくはデータ構造の形式で予期されるプログラムコードを搬送又は記憶することができ、コンピュータによりアクセスされることができる他の媒体を含んでもよい。さらに、いずれかの接続は、コンピュータ読み取り可能媒体として適切に定義されてもよい。例えば、ソフトウェアが同軸ケーブル、光ファイバ/ケーブル、ツイストペア、デジタル加入者線(DSL)、又は赤外線、無線及びマイクロ波のような無線技術を使用することによりウェブサイト、サーバ又は他の遠隔ソースから送信される場合、同軸ケーブル、光ファイバ/ケーブル、ツイストペア、DSL、又は赤外線、無線及びマイクロ波のような無線技術は、媒体の定義に含まれる。例えば、本発明により使用されるディスク(Disk)及びディスク(disc)は、コンパクトディスクCD、レーザーディスク、光ディスク、デジタル多目的ディスク(DVD)フロッピーディスク、ブルーレイディスクを含み、ディスク(disk)は、概して磁気手段によりデータをコピーし、ディスク(disc)は、レーザー手段により光学的にデータをコピーする。前述の組み合わせもまた、コンピュータ読み取り可能媒体の保護範囲内に含まれるべきである。
さらに、実施例に応じて、この明細書に記載されるいずれかの方法のいくつかの動作又はイベントは、異なる順序に従って実行されてもよく、或いは追加、結合又は省略されてもよい(例えば、或る特定の目的を実現するために、全ての記載の動作又はイベントが必要であるとは限らない)。さらに、或る実施例では、動作又はイベントは、複数のプロセッサによりハイパースレッディング処理、中断処理又は同時処理を受けてもよく、同時処理は、非順次的実行でもよい。さらに、明瞭性を考慮して、本発明の特定の実施例は、単一のステップ又はモジュールの機能として記載されるが、本発明の技術は、前述の複数のステップ又はモジュールの組み合わせの実行でもよいことが認識されるべきである。
最後に、前述の実施例は、本発明を限定するのとは別に、本発明の技術的解決策を説明することを単に意図する。本発明について前述の実施例を参照して詳細に説明したが、当業者は、本発明の実施例の技術的解決策の範囲を逸脱することなく、依然として前述の実施例において説明した技術的対策に変更を行ってもよく、或いはその一部又は全部の技術的特徴に等価置換を行ってもよいことを認識するべきである。

Claims (21)

  1. 符号化装置により、入力オーディオ信号の特徴的ファクタを取得するために、前記入力オーディオ信号の低周波数帯域信号を符号化するステップであり、前記入力オーディオ信号は、第1の周波数スペクトル範囲を有する前記低周波数帯域信号と、第2の周波数スペクトル範囲を有する高周波数帯域信号と、前記第2の周波数スペクトル範囲より高い第3の周波数スペクトル範囲を有する第2の信号とを含むステップと、
    前記符号化装置により、前記第3の周波数スペクトル範囲を有する第1の信号を取得するために、前記入力オーディオ信号の前記高周波数帯域信号において符号化及びスペクトル拡散予測を実行するステップと、
    前記符号化装置により、前記第1の信号においてディエンファシス処理を実行するステップであり、前記ディエンファシス処理のディエンファシスパラメータは、前記特徴的ファクタに従って決定されるステップと、
    前記符号化装置により、ディエンファシス処理を受けた前記第1の信号の第1のエネルギーを計算するステップと、
    前記符号化装置により、前記第3の周波数スペクトル範囲を有する前記第2の信号を取得するために、前記入力オーディオ信号において帯域通過フィルタリング処理を実行するステップと、
    前記符号化装置により、前記第2の信号の第2のエネルギーを計算するステップと、
    前記符号化装置により、前記第1の信号の前記第1のエネルギーに対する前記第2の信号の前記第2のエネルギーのエネルギー比を計算するステップと、
    前記符号化装置により、前記入力オーディオ信号を符号化することから生じたビットストリームを復号化装置に送信するステップであり、前記ビットストリームは、前記入力オーディオ信号の前記特徴的ファクタ、高周波数帯域符号化情報及び前記エネルギー比を含むステップと
    を含む符号化方法。
  2. 前記符号化装置により、特徴的ファクタの量を取得するステップと、
    前記符号化装置により、前記特徴的ファクタ及び前記特徴的ファクタの前記量に従って前記特徴的ファクタの平均値を決定するステップと、
    前記符号化装置により、前記特徴的ファクタの前記平均値に従って前記ディエンファシスパラメータを決定するステップと
    を更に含む、請求項1に記載の方法。
  3. 前記符号化装置により、前記第3の周波数スペクトル範囲を有する第1の信号を取得するために、前記入力オーディオ信号の前記高周波数帯域信号においてスペクトル拡散予測を実行する前記ステップは、
    前記符号化装置により、前記高周波数帯域信号に従って、全帯域信号を予測するために使用される線形予測符号化(LPC)係数及び全帯域励振信号を決定するステップと、
    前記符号化装置により、前記第1の信号を取得するために、前記LPC係数及び前記全帯域励振信号において符号化処理を実行するステップと
    を含む、請求項1又は2に記載の方法。
  4. 前記符号化装置により、前記第1の信号においてディエンファシス処理を実行する前記ステップは、
    前記符号化装置により、前記第1の信号において周波数スペクトル移動修正を実行し、前記修正された第1の信号において周波数スペクトル反映処理を実行するステップであり、前記周波数スペクトル移動修正は、以下の式
    S2k=S1k×cos(2×PI×fn×k/fs)
    を使用することにより前記第1の信号において実行され、kは第kの時間サンプル点を表し、kは正の整数であり、S2は前記周波数スペクトル移動修正の後の第1の周波数スペクトル信号であり、S1は前記第1の信号であり、PIは円の直径に対する円の円周の比であり、fnは周波数スペクトルが移動する必要のある距離がn個の時間サンプル点であることを示し、nは正の整数であり、fsは信号サンプリングレートを表すステップと、
    前記符号化装置により、周波数スペクトル反映処理を受けた前記第1の信号において前記ディエンファシス処理を実行するステップと
    を含む、請求項1乃至3のうちいずれか1項に記載の方法。
  5. 前記特徴的ファクタは、前記オーディオ信号の特徴を反映するために使用され、音声ファクタ、スペクトル傾斜、短期平均エネルギー又は短期ゼロ交差率を含む、請求項1乃至4のうちいずれか1項に記載の方法。
  6. 復号化装置により、符号化装置により送信されたオーディオ信号ビットストリームを受信するステップであり、前記オーディオ信号ビットストリームは、前記オーディオ信号ビットストリームに対応するオーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含むステップと、
    前記復号化装置により、第1の周波数スペクトル範囲を有する低周波数帯域信号を取得するために、前記特徴的ファクタを使用することにより前記オーディオ信号ビットストリームにおいて低周波数帯域復号化を実行するステップと、
    前記復号化装置により、第2の周波数スペクトル範囲を有する高周波数帯域信号を取得するために、前記高周波数帯域符号化情報を使用することにより前記オーディオ信号ビットストリームにおいて高周波数帯域復号化を実行するステップと、
    前記復号化装置により、前記第2の周波数スペクトル範囲より高い第3の周波数スペクトル範囲を有する第1の信号を取得するために、前記高周波数帯域信号においてスペクトル拡散予測を実行するステップと、
    前記復号化装置により、前記第1の信号においてディエンファシス処理を実行するステップであり、前記ディエンファシス処理のディエンファシスパラメータは、前記特徴的ファクタに従って決定されるステップと、
    前記復号化装置により、ディエンファシス処理を受けた前記第1の信号の第1のエネルギーを計算するステップと、
    前記復号化装置により、前記オーディオ信号ビットストリームに含まれる前記エネルギー比、ディエンファシス処理を受けた前記第1の信号及び前記第1のエネルギーに従って、前記第3の周波数スペクトル範囲を有する第2の信号を取得するステップであり、前記エネルギー比は、前記第1のエネルギーに対する前記第2の信号のエネルギーのエネルギー比であるステップと、
    前記復号化装置により、前記第2の信号、前記低周波数帯域信号及び前記高周波数帯域信号に従って前記オーディオ信号ビットストリームに対応する前記オーディオ信号を復元するステップと
    を含む復号化方法。
  7. 前記復号化装置により、復号化を通じて特徴的ファクタの量を取得するステップと、
    前記復号化装置により、前記特徴的ファクタ及び前記特徴的ファクタの前記量に従って前記特徴的ファクタの平均値を決定するステップと、
    前記復号化装置により、前記特徴的ファクタの前記平均値に従って前記ディエンファシスパラメータを決定するステップと
    を更に含む、請求項6に記載の方法。
  8. 前記復号化装置により、前記第3の周波数スペクトル範囲を有する第1の信号を取得するために、前記高周波数帯域信号においてスペクトル拡散予測を実行するステップは、
    前記復号化装置により、前記高周波数帯域信号に従って、全帯域信号を予測するために使用される線形予測符号化(LPC)係数及び全帯域励振信号を決定するステップと、
    前記復号化装置により、前記第1の信号を取得するために、前記LPC係数及び前記全帯域励振信号において符号化処理を実行するステップと
    を含む、請求項6又は7に記載の方法。
  9. 前記復号化装置により、前記第1の信号においてディエンファシス処理を実行するステップは、
    前記復号化装置により、前記第1の信号において周波数スペクトル移動修正を実行し、前記修正された第1の信号において周波数スペクトル反映処理を実行するステップであり、前記周波数スペクトル移動修正は、以下の式
    S2k=S1k×cos(2×PI×fn×k/fs)
    を使用することにより前記第1の信号において実行され、kは第kの時間サンプル点を表し、kは正の整数であり、S2は前記周波数スペクトル移動修正の後の第1の周波数スペクトル信号であり、S1は前記第1の信号であり、PIは円の直径に対する円の円周の比であり、fnは周波数スペクトルが移動する必要のある距離がn個の時間サンプル点であることを示し、nは正の整数であり、fsは信号サンプリングレートを表すステップと、
    前記復号化装置により、周波数スペクトル反映処理を受けた前記第1の信号において前記ディエンファシス処理を実行するステップと
    を含む、請求項6乃至8のうちいずれか1項に記載の方法。
  10. 前記特徴的ファクタは、前記オーディオ信号の特徴を反映するために使用され、音声ファクタ、スペクトル傾斜、短期平均エネルギー又は短期ゼロ交差率を含む、請求項6乃至9のうちいずれか1項に記載の方法。
  11. 入力オーディオ信号の特徴的ファクタを取得するために、前記入力オーディオ信号の低周波数帯域信号を符号化するように構成された第1の符号化モジュールであり、前記入力オーディオ信号は、第1の周波数スペクトル範囲を有する前記低周波数帯域信号と、第2の周波数スペクトル範囲を有する高周波数帯域信号と、前記第2の周波数スペクトル範囲より高い第3の周波数スペクトル範囲を有する第2の信号とを含む第1の符号化モジュールと、
    前記第3の周波数スペクトル範囲を有する第1の信号を取得するために、前記入力オーディオ信号の前記高周波数帯域信号において符号化及びスペクトル拡散予測を実行するように構成された第2の符号化モジュールと、
    前記第1の信号においてディエンファシス処理を実行するように構成されたディエンファシス処理モジュールであり、前記ディエンファシス処理のディエンファシスパラメータは、前記特徴的ファクタに従って決定されるディエンファシス処理モジュールと、
    ディエンファシス処理を受けた前記第1の信号の第1のエネルギーを計算するように構成された計算モジュールと、
    前記第3の周波数スペクトル範囲を有する前記第2の信号を取得するために、前記入力オーディオ信号において帯域通過フィルタリング処理を実行するように構成された帯域通過処理モジュールと
    を含み、
    前記計算モジュールは、前記第2の信号の第2のエネルギーを計算し、前記第1の信号の前記第1のエネルギーに対する前記第2の信号の前記第2のエネルギーのエネルギー比を計算するように更に構成され、
    前記入力オーディオ信号を符号化することから生じたビットストリームを復号化装置に送信するように構成された送信モジュールであり、前記ビットストリームは、前記入力オーディオ信号の前記特徴的ファクタ、高周波数帯域符号化情報及び前記エネルギー比を含む送信モジュール
    を含む符号化装置。
  12. 特徴的ファクタの量を取得し、前記特徴的ファクタ及び前記特徴的ファクタの前記量に従って前記特徴的ファクタの平均値を決定し、前記特徴的ファクタの前記平均値に従って前記ディエンファシスパラメータを決定するように構成されたディエンファシスパラメータ決定モジュールを更に含む、請求項11に記載の符号化装置。
  13. 前記第2の符号化モジュールは、前記高周波数帯域信号に従って、全帯域信号を予測するために使用される線形予測符号化(LPC)係数及び全帯域励振信号を決定し、前記第1の信号を取得するために、前記LPC係数及び前記全帯域励振信号において符号化処理を実行するように構成される、請求項11又は12に記載の符号化装置。
  14. 前記ディエンファシス処理モジュールは、前記第2の符号化モジュールにより取得された前記第1の信号において周波数スペクトル移動修正を実行し、前記周波数スペクトル移動修正は、以下の式
    S2k=S1k×cos(2×PI×fn×k/fs)
    を使用することにより前記第1の信号において実行され、kは第kの時間サンプル点を表し、kは正の整数であり、S2は前記周波数スペクトル移動修正の後の第1の周波数スペクトル信号であり、S1は前記第1の信号であり、PIは円の直径に対する円の円周の比であり、fnは周波数スペクトルが移動する必要のある距離がn個の時間サンプル点であることを示し、nは正の整数であり、fsは信号サンプリングレートを表し、前記修正された第1の信号において周波数スペクトル反映処理を実行し、周波数スペクトル反映処理を受けた前記第1の信号において前記ディエンファシス処理を実行するように構成される、請求項11乃至13のうちいずれか1項に記載の符号化装置。
  15. 前記特徴的ファクタは、前記オーディオ信号の特徴を反映するために使用され、音声ファクタ、スペクトル傾斜、短期平均エネルギー又は短期ゼロ交差率を含む、請求項11乃至14のうちいずれか1項に記載の符号化装置。
  16. 符号化装置により送信されたオーディオ信号ビットストリームを受信するように構成された受信モジュールであり、前記オーディオ信号ビットストリームは、前記オーディオ信号ビットストリームに対応するオーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含む受信モジュールと、
    第1の周波数スペクトル範囲を有する低周波数帯域信号を取得するために、前記特徴的ファクタを使用することにより前記オーディオ信号ビットストリームにおいて低周波数帯域復号化を実行するように構成された第1の復号化モジュールと、
    第2の周波数スペクトル範囲を有する高周波数帯域信号を取得するために、前記高周波数帯域符号化情報を使用することにより前記オーディオ信号ビットストリームにおいて高周波数帯域復号化を実行し、前記第2の周波数スペクトル範囲より高い第3の周波数スペクトル範囲を有する第1の信号を取得するために、前記高周波数帯域信号においてスペクトル拡散予測を実行するように構成された第2の復号化モジュールと、
    前記第1の信号においてディエンファシス処理を実行するように構成されたディエンファシス処理モジュールであり、前記ディエンファシス処理のディエンファシスパラメータは、前記特徴的ファクタに従って決定されるディエンファシス処理モジュールと、
    ディエンファシス処理を受けた前記第1の信号の第1のエネルギーを計算し、前記オーディオ信号ビットストリームに含まれる前記エネルギー比、ディエンファシス処理を受けた前記第1の信号及び前記第1のエネルギーに従って、前記第3の周波数スペクトル範囲を有する第2の信号を取得するように構成された計算モジュールであり、前記エネルギー比は、前記第1のエネルギーに対する前記第2の信号のエネルギーのエネルギー比である計算モジュールと、
    前記第2の信号、前記低周波数帯域信号及び前記高周波数帯域信号に従って前記オーディオ信号ビットストリームに対応する前記オーディオ信号を復元するように構成された復元モジュールと
    を含む復号化装置。
  17. 復号化を通じて特徴的ファクタの量を取得し、前記特徴的ファクタ及び前記特徴的ファクタの前記量に従って前記特徴的ファクタの平均値を決定し、前記特徴的ファクタの前記平均値に従って前記ディエンファシスパラメータを決定するように構成されたディエンファシスパラメータ決定モジュールを更に含む、請求項16に記載の復号化装置。
  18. 前記第2の復号化モジュールは、前記高周波数帯域信号に従って、全帯域信号を予測するために使用される線形予測符号化(LPC)係数及び全帯域励振信号を決定し、前記第1の信号を取得するために、前記LPC係数及び前記全帯域励振信号において符号化処理を実行するように構成される、請求項16又は17に記載の復号化装置。
  19. 前記ディエンファシス処理モジュールは、前記第1の信号において周波数スペクトル移動修正を実行し、前記周波数スペクトル移動修正は、以下の式
    S2k=S1k×cos(2×PI×fn×k/fs)
    を使用することにより前記第1の信号において実行され、kは第kの時間サンプル点を表し、kは正の整数であり、S2は前記周波数スペクトル移動修正の後の第1の周波数スペクトル信号であり、S1は前記第1の信号であり、PIは円の直径に対する円の円周の比であり、fnは周波数スペクトルが移動する必要のある距離がn個の時間サンプル点であることを示し、nは正の整数であり、fsは信号サンプリングレートを表し、前記修正された第1の信号において周波数スペクトル反映処理を実行し、周波数スペクトル反映処理を受けた前記第1の信号において前記ディエンファシス処理を実行するように構成される、請求項16乃至18のうちいずれか1項に記載の復号化装置。
  20. 前記特徴的ファクタは、前記オーディオ信号の特徴を反映するために使用され、音声ファクタ、スペクトル傾斜、短期平均エネルギー又は短期ゼロ交差率を含む、請求項16乃至19のうちいずれか1項に記載の復号化装置。
  21. コンピュータに対して請求項1乃至11のうちいずれか1項に記載の方法を実行させるプログラム。
JP2016574888A 2014-06-26 2015-03-20 符号化/復号化方法、装置及びシステム Active JP6496328B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410294752.3 2014-06-26
CN201410294752.3A CN105225671B (zh) 2014-06-26 2014-06-26 编解码方法、装置及系统
PCT/CN2015/074704 WO2015196835A1 (zh) 2014-06-26 2015-03-20 编解码方法、装置及系统

Publications (2)

Publication Number Publication Date
JP2017525992A JP2017525992A (ja) 2017-09-07
JP6496328B2 true JP6496328B2 (ja) 2019-04-03

Family

ID=54936715

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016574888A Active JP6496328B2 (ja) 2014-06-26 2015-03-20 符号化/復号化方法、装置及びシステム

Country Status (15)

Country Link
US (3) US9779747B2 (ja)
EP (2) EP3637416A1 (ja)
JP (1) JP6496328B2 (ja)
KR (1) KR101906522B1 (ja)
CN (2) CN105225671B (ja)
AU (1) AU2015281686B2 (ja)
BR (1) BR112016026440B8 (ja)
CA (1) CA2948410C (ja)
DE (2) DE202015009916U1 (ja)
HK (1) HK1219802A1 (ja)
MX (1) MX356315B (ja)
MY (1) MY173513A (ja)
RU (1) RU2644078C1 (ja)
SG (1) SG11201609523UA (ja)
WO (1) WO2015196835A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112015018023B1 (pt) * 2013-01-29 2022-06-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Aparelho e método para sintetizar um sinal de áudio, decodificador, codificador e sistema
CN105978540B (zh) * 2016-05-26 2018-09-18 英特格灵芯片(天津)有限公司 一种连续时间信号的去加重处理电路及其方法
CN106601267B (zh) * 2016-11-30 2019-12-06 武汉船舶通信研究所 一种基于超短波fm调制的语音增强方法
CN112885364B (zh) * 2021-01-21 2023-10-13 维沃移动通信有限公司 音频编码方法和解码方法、音频编码装置和解码装置

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000134105A (ja) 1998-10-29 2000-05-12 Matsushita Electric Ind Co Ltd オーディオ変換符号化に用いられるブロックサイズを決定し適応させる方法
US6912496B1 (en) * 1999-10-26 2005-06-28 Silicon Automation Systems Preprocessing modules for quality enhancement of MBE coders and decoders for signals having transmission path characteristics
US6931373B1 (en) * 2001-02-13 2005-08-16 Hughes Electronics Corporation Prototype waveform phase modeling for a frequency domain interpolative speech codec system
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US9886959B2 (en) * 2005-02-11 2018-02-06 Open Invention Network Llc Method and system for low bit rate voice encoding and decoding applicable for any reduced bandwidth requirements including wireless
US20070147518A1 (en) 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
KR100789368B1 (ko) * 2005-05-30 2007-12-28 한국전자통신연구원 잔차 신호 부호화 및 복호화 장치와 그 방법
WO2007040364A1 (en) * 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US20070299655A1 (en) * 2006-06-22 2007-12-27 Nokia Corporation Method, Apparatus and Computer Program Product for Providing Low Frequency Expansion of Speech
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
JP4850086B2 (ja) 2007-02-14 2012-01-11 パナソニック株式会社 Memsマイクロホン装置
JP4984983B2 (ja) * 2007-03-09 2012-07-25 富士通株式会社 符号化装置および符号化方法
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
WO2009029035A1 (en) 2007-08-27 2009-03-05 Telefonaktiebolaget Lm Ericsson (Publ) Improved transform coding of speech and audio signals
EP2077551B1 (en) * 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
KR101413968B1 (ko) 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
US8433582B2 (en) 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
JP4818335B2 (ja) * 2008-08-29 2011-11-16 株式会社東芝 信号帯域拡張装置
JP5423684B2 (ja) * 2008-12-19 2014-02-19 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
US8457688B2 (en) * 2009-02-26 2013-06-04 Research In Motion Limited Mobile wireless communications device with voice alteration and related methods
CN101521014B (zh) * 2009-04-08 2011-09-14 武汉大学 音频带宽扩展编解码装置
EP2249334A1 (en) * 2009-05-08 2010-11-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio format transcoder
MX2012011943A (es) 2010-04-14 2013-01-24 Voiceage Corp Libro de códigos de innovacion combinado, flexible y escalable para uso en codificador y decodificador celp.
TWI516138B (zh) * 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
CN102800317B (zh) 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
EP2791937B1 (en) * 2011-11-02 2016-06-08 Telefonaktiebolaget LM Ericsson (publ) Generation of a high band extension of a bandwidth extended audio signal
FR2984580A1 (fr) 2011-12-20 2013-06-21 France Telecom Procede de detection d'une bande de frequence predeterminee dans un signal de donnees audio, dispositif de detection et programme d'ordinateur correspondant
CN102737646A (zh) * 2012-06-21 2012-10-17 佛山市瀚芯电子科技有限公司 单一麦克风的实时动态语音降噪方法
CN103928029B (zh) 2013-01-11 2017-02-08 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
CN103928031B (zh) 2013-01-15 2016-03-30 华为技术有限公司 编码方法、解码方法、编码装置和解码装置

Also Published As

Publication number Publication date
MX356315B (es) 2018-05-23
EP3133600A4 (en) 2017-05-10
US10339945B2 (en) 2019-07-02
CN105225671A (zh) 2016-01-06
BR112016026440B1 (pt) 2022-09-20
US20190333528A1 (en) 2019-10-31
AU2015281686A1 (en) 2016-12-01
BR112016026440A2 (ja) 2017-08-15
EP3637416A1 (en) 2020-04-15
JP2017525992A (ja) 2017-09-07
KR20160145799A (ko) 2016-12-20
HK1219802A1 (zh) 2017-04-13
DE202015009942U1 (de) 2021-10-01
SG11201609523UA (en) 2016-12-29
US20170110137A1 (en) 2017-04-20
BR112016026440B8 (pt) 2023-03-07
MX2016015526A (es) 2017-04-25
EP3133600B1 (en) 2019-08-28
CN105225671B (zh) 2016-10-26
CA2948410A1 (en) 2015-12-30
US10614822B2 (en) 2020-04-07
DE202015009916U1 (de) 2021-08-04
AU2015281686B2 (en) 2018-02-01
MY173513A (en) 2020-01-30
US20170372715A1 (en) 2017-12-28
KR101906522B1 (ko) 2018-10-10
EP3133600A1 (en) 2017-02-22
CN106228991A (zh) 2016-12-14
CA2948410C (en) 2018-09-04
CN106228991B (zh) 2019-08-20
WO2015196835A1 (zh) 2015-12-30
US9779747B2 (en) 2017-10-03
RU2644078C1 (ru) 2018-02-07

Similar Documents

Publication Publication Date Title
CA2483791C (en) Method and device for efficient frame erasure concealment in linear predictive based speech codecs
US10614822B2 (en) Coding/decoding method, apparatus, and system for audio signal
JP6076247B2 (ja) ディジタルオーディオ信号エンコーダでのノイズシェーピングフィードバックループの制御
EP1316087B1 (fr) Dissimulation d'erreurs de transmission dans un signal audio
EP2277172B1 (fr) Dissimulation d'erreur de transmission dans un signal audionumerique dans une structure de decodage hierarchique
WO2012050784A2 (en) Progressive encoding of audio
RU2622863C2 (ru) Эффективное ослабление опережающего эха в цифровом звуковом сигнале
JP5457171B2 (ja) オーディオデコーダ内で信号を後処理する方法
JP5295372B2 (ja) デジタルオーディオ信号におけるプリエコーの減衰
JP6109968B2 (ja) 補間係数セットを決定するためのシステムおよび方法
KR102099293B1 (ko) 오디오 인코더 및 오디오 신호를 인코딩하는 방법
Simkus et al. Error resilience enhancement for a robust adpcm audio coding scheme

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180502

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181016

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190308

R150 Certificate of patent or registration of utility model

Ref document number: 6496328

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250