JP6414635B2 - オーディオコーディング方法および装置 - Google Patents

オーディオコーディング方法および装置 Download PDF

Info

Publication number
JP6414635B2
JP6414635B2 JP2017519760A JP2017519760A JP6414635B2 JP 6414635 B2 JP6414635 B2 JP 6414635B2 JP 2017519760 A JP2017519760 A JP 2017519760A JP 2017519760 A JP2017519760 A JP 2017519760A JP 6414635 B2 JP6414635 B2 JP 6414635B2
Authority
JP
Japan
Prior art keywords
audio frame
spectral tilt
frame
tilt frequency
linear prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017519760A
Other languages
English (en)
Other versions
JP2017524164A (ja
Inventor
▲澤▼新 ▲劉▼
▲澤▼新 ▲劉▼
▲賓▼ 王
▲賓▼ 王
磊 苗
磊 苗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2017524164A publication Critical patent/JP2017524164A/ja
Application granted granted Critical
Publication of JP6414635B2 publication Critical patent/JP6414635B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、通信分野に関し、特に、オーディオコーディング方法および装置に関する。
技術の絶え間ない進化によって、ユーザは、電子デバイスのオーディオ品質に対してますます高い要求を持っている。オーディオ品質を改善する主な方法は、オーディオの帯域幅を改善することである。電子デバイスが、オーディオの帯域幅を増加させるために、従来のコーディング方式でオーディオをコーディングするのであれば、コーディングされたオーディオの情報のビットレートが大幅に増加する。したがって、コーディングされたオーディオの情報が、2つの電子デバイス間で送信される場合、比較的広いネットワーク送信帯域幅が占有される。したがって、対処されるべき問題は、コーディングされたオーディオの情報のビットレートが不変のまま、または、ビットレートが僅かにしか変化せずに、より広い帯域幅を有するオーディオをコーディングすることである。この問題のために、提案される解決策は、帯域幅拡張技術を使用することである。帯域幅拡張技術は、時間領域帯域幅拡張技術および周波数領域帯域幅拡張技術に分けられる。本発明は、時間領域帯域幅拡張技術に関する。
時間領域帯域幅拡張技術では、オーディオにおける各オーディオフレームの線形予測コーディング(LPC, Linear Predictive Coding)係数、線形スペクトルペア(LSP, Linear Spectral Pairs)係数、イミッタンススペクトルペア(ISP, Immittance Spectral Pairs)係数、または、線形スペクトル周波数(LSF, Linear Spectral Frequency)係数のような線形予測パラメータが、一般に、線形予測アルゴリズムを使用することによって計算される。オーディオにおいてコーディング送信が実行される場合、オーディオは、オーディオにおける各オーディオフレームの線形予測パラメータに従ってコーディングされる。しかしながら、コーデック誤り精度要件が比較的高いケースでは、このコーディング方式は、オーディオフレーム間のスペクトルの不連続を引き起こす。
本発明の実施形態は、オーディオコーディング方法および装置を提供する。より広い帯域幅を有するオーディオは、ビットレートが不変のまま、または、ビットレートが僅かにしか変化せずにコーディングされ得、オーディオフレーム間のスペクトルは、より安定である。
第1の態様によれば、本発明の実施形態は、
各オーディオフレームについて、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、または、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定した場合、第2の修正重みを決定するステップであって、あらかじめ設定された修正条件は、オーディオフレームの信号特性が、このオーディオフレームの前のオーディオフレームの信号特性に類似していることを判定するために使用される、決定するステップと、
決定された第1の修正重みまたは決定された第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正するステップと、
修正されたオーディオフレームの線形予測パラメータに従って、オーディオフレームをコーディングするステップと、を含むオーディオコーディング方法を提供する。
第1の態様を参照して、第1の態様の第1の可能な実施方式では、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するステップは、
以下の式を使用することによって、オーディオフレームのLSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するステップを含む。
Figure 0006414635
ここで、w[i]は、第1の修正重みであり、lsf_new_diff[i]は、オーディオフレームのLSF差分であり、lsf_old_diff[i]は、このオーディオフレームの前のオーディオフレームのLSF差分であり、iは、LSF差分の次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。
第1の態様、または、第1の態様の第1の可能な実施方式を参照して、第1の態様の第2の可能な実施方式では、第2の修正重みを決定するステップは、
第2の修正重みを、あらかじめ設定された修正重み値として決定するステップを含み、あらかじめ設定された修正重み値は0よりも大きく、1以下である。
第1の態様、第1の態様の第1の可能な実施方式、または、第1の態様の第2の可能な実施方式を参照して、第1の態様の第3の可能な実施方式では、決定された第1の修正重みに従ってオーディオフレームの線形予測パラメータを修正するステップは、
以下の式を使用することによって、第1の修正重みに従って、オーディオフレームの線形予測パラメータを修正するステップを含む。
L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i]、
ここで、w[i]は、第1の修正重みであり、L[i]は、修正されたオーディオフレームの線形予測パラメータであり、L_new[i]は、オーディオフレームの線形予測パラメータであり、L_old[i]は、このオーディオフレームの前のオーディオフレームの線形予測パラメータであり、iは、線形予測パラメータの次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。
第1の態様、第1の態様の第1の可能な実施方式、第1の態様の第2の可能な実施方式、または、第1の態様の第3の可能な実施方式を参照して、第1の態様の第4の可能な実施方式では、決定された第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正するステップは、
以下の式を使用することによって、第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正するステップを含む。
L[i]=(1-y)*L_old[i]+y*L_new[i]、
ここで、yは、第2の修正重みであり、L[i]は、修正されたオーディオフレームの線形予測パラメータであり、L_new[i]は、オーディオフレームの線形予測パラメータであり、L_old[i]は、このオーディオフレームの前のオーディオフレームの線形予測パラメータであり、iは、線形予測パラメータの次数であり、iの値は、0からM-1の範囲にあり、Mは、線形予測パラメータの次数である。
第1の態様、第1の態様の第1の可能な実施方式、第1の態様の第2の可能な実施方式、第1の態様の第3の可能な実施方式、または第1の態様の第4の可能な実施方式を参照して、第1の態様の第5の可能な実施方式では、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定するステップは、オーディオフレームが、過渡的フレームではないことを判定するステップを含み、過渡的フレームは、非摩擦音から摩擦音への過渡的フレーム、または、摩擦音から非摩擦音への過渡的フレームを含み、
オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定するステップは、オーディオフレームが、過渡的フレームであることを判定するステップを含む。
第1の態様の第5の可能な実施方式を参照して、第1の態様の第6の可能な実施方式では、オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであることを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、オーディオフレームのコーディングタイプが過渡的であることとを判定するステップを含み、
オーディオフレームが、摩擦音から非摩擦音への過渡的フレームではないことを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、オーディオフレームのコーディングタイプが過渡的ではないことを判定するステップを含む。
第1の態様の第5の可能な実施方式を参照して、第1の態様の第7の可能な実施方式では、オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであることを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満であることとを判定するステップを含み、
オーディオフレームが摩擦音から非摩擦音への過渡的フレームではないことを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満ではないことを判定するステップを含む。
第1の態様の第5の可能な実施方式を参照して、第1の態様の第8の可能な実施方式では、オーディオフレームが、非摩擦音から摩擦音への過渡的フレームであることを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満であり、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つであり、オーディオフレームのスペクトルチルト周波数が、第4のスペクトルチルト周波数しきい値よりも大きいことを判定するステップを含み、
オーディオフレームが非摩擦音から摩擦音への過渡的フレームではないことを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満ではなく、ならびに/または、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つではなく、ならびに/または、オーディオフレームのスペクトルチルト周波数が、第4のスペクトルチルト周波数しきい値よりも大きくないことを判定するステップを含む。
第1の態様の第5の可能な実施方式を参照して、第1の態様の第9の可能な実施方式では、オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであることを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きく、オーディオフレームのコーディングタイプが過渡的であることを判定するステップを含む。
第1の態様の第5の可能な実施方式を参照して、第1の態様の第10の可能な実施方式では、オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであることを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満であることとを判定するステップを含む。
第1の態様の第5の可能な実施方式を参照して、第1の態様の第11の可能な実施方式では、オーディオフレームが非摩擦音から摩擦音への過渡的フレームであることを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満であること、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つであること、ならびに、オーディオフレームのスペクトルチルト周波数が、第4のスペクトルチルト周波数しきい値よりも大きいことを判定するステップを含む。
第2の態様によれば、本発明の実施形態は、決定ユニット、修正ユニット、およびコーディングユニットを含むオーディオコーディング装置を提供し、
決定ユニットは、各オーディオフレームについて、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するか、または、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定した場合、第2の修正重みを決定するように構成され、あらかじめ設定された修正条件は、オーディオフレームの信号特性が、このオーディオフレームの前のオーディオフレームの信号特性に類似していることを判定するために使用され、
修正ユニットは、決定ユニットによって決定された第1の修正重みまたは第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正するように構成され、
コーディングユニットは、修正されたオーディオフレームの線形予測パラメータに従って、オーディオフレームをコーディングするように構成され、修正された線形予測パラメータは、修正ユニットによる修正後に取得される。
第2の態様を参照して、第2の態様の第1の可能な実施方式では、決定ユニットは特に、以下の式を使用することによって、オーディオフレームのLSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するように構成される。
Figure 0006414635
ここで、w[i]は、第1の修正重みであり、lsf_new_diff[i]は、オーディオフレームのLSF差分であり、lsf_old_diff[i]は、このオーディオフレームの前のオーディオフレームのLSF差分であり、iは、LSF差分の次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。
第2の態様、または、第2の態様の第1の可能な実施方式を参照して、第2の態様の第2の可能な実施方式では、決定ユニットは特に、第2の修正重みを、あらかじめ設定された修正重み値として決定するように構成され、あらかじめ設定された修正重み値は、0よりも大きく、1以下である。
第2の態様、第2の態様の第1の可能な実施方式、または第2の態様の第2の可能な実施方式を参照して、第2の態様の第3の可能な実施方式では、修正ユニットは特に、以下の式を使用することによって、第1の修正重みに従って、オーディオフレームの線形予測パラメータを修正するように構成される。
L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i]、
ここで、w[i]は、第1の修正重みであり、L[i]は、修正されたオーディオフレームの線形予測パラメータであり、L_new[i]は、オーディオフレームの線形予測パラメータであり、L_old[i]は、このオーディオフレームの前のオーディオフレームの線形予測パラメータであり、iは、線形予測パラメータの次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。
第2の態様、第2の態様の第1の可能な実施方式、第2の態様の第2の可能な実施方式、または、第2の態様の第3の可能な実施方式を参照して、第2の態様の第4の可能な実施方式では、修正ユニットは特に、以下の式を使用することによって、第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正するように構成される。
L[i]=(1-y)*L_old[i]+y*L_new[i]、
ここで、yは、第2の修正重みであり、L[i]は、修正されたオーディオフレームの線形予測パラメータであり、L_new[i]は、オーディオフレームの線形予測パラメータであり、L_old[i]は、このオーディオフレームの前のオーディオフレームの線形予測パラメータであり、iは、線形予測パラメータの次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。
第2の態様、第2の態様の第1の可能な実施方式、第2の態様の第2の可能な実施方式、第2の態様の第3の可能な実施方式、または、第2の態様の第4の可能な実施方式を参照して、第2の態様の第5の可能な実施方式では、決定ユニットは特に、オーディオにおける各オーディオフレームについて、オーディオフレームが、過渡的フレームではないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、オーディオフレームが、過渡的フレームであることを判定した場合、第2の修正重みを決定するように構成され、過渡的フレームは、非摩擦音から摩擦音への過渡的フレーム、または、摩擦音から非摩擦音への過渡的フレームを含む。
第2の態様の第5の可能な実施方式を参照して、第2の態様の第6の可能な実施方式では、決定ユニットは特に、
オーディオにおける各オーディオフレームについて、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、オーディオフレームのコーディングタイプが、過渡的ではないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きく、オーディオフレームのコーディングタイプが過渡的であることを判定した場合、第2の修正重みを決定するように構成される。
第2の態様の第5の可能な実施方式を参照して、第2の態様の第7の可能な実施方式では、決定ユニットは特に、
オーディオにおける各オーディオフレームについて、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満ではないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って第1の修正重みを決定し、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きく、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満であることを判定した場合、第2の修正重みを決定するように構成される。
第2の態様の第5の可能な実施方式を参照して、第2の態様の第8の可能な実施方式では、決定ユニットは特に、
オーディオにおける各オーディオフレームについて、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満ではなく、ならびに/または、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つではなく、ならびに/または、オーディオフレームのスペクトルチルトが、第4のスペクトルチルトしきい値よりも大きくないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分および前のオーディオフレームのLSF差分に従って第1の修正重みを決定し、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満であり、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つであり、オーディオフレームのスペクトルチルト周波数が、第4のスペクトルチルト周波数しきい値よりも大きいことを判定した場合、第2の修正重みを決定するように構成される。
本発明の実施形態では、オーディオにおける各オーディオフレームについて、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足すると判定された場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って第1の修正重みが決定されるか、または、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないと判定された場合、第2の修正重みが決定され、あらかじめ設定された修正条件は、オーディオフレームの信号特性が、このオーディオフレームの前のオーディオフレームの信号特性に類似していることを判定するために使用され、オーディオフレームの線形予測パラメータは、決定された第1の修正重みまたは決定された第2の修正重みによって修正され、オーディオフレームは、修正されたオーディオフレームの線形予測パラメータに従ってコーディングされる。このように、オーディオフレームの信号特性が、このオーディオフレームの前のオーディオフレームの信号特性に類似しているか否かに従って、異なる修正重みが決定され、オーディオフレームの線形予測パラメータが修正され、これによって、オーディオフレーム間のスペクトルが、より安定になる。さらに、オーディオフレームは、修正されたオーディオフレームの線形予測パラメータに従ってコーディングされ、これによって、ビットレートが変化しないことを保証しながら、デコードによって復元されるスペクトルのフレーム間連続性が強化される。したがって、デコードによって復元されたスペクトルは、オリジナルのスペクトルに接近し、コーディングパフォーマンスが改善される。
本発明の実施形態における技術的解決策をより明確に説明するために、以下は、本実施形態を説明するために必要とされる添付図面を簡単に紹介する。明らかに、以下の説明における添付図面は、単に本発明のいくつかの実施形態しか図示しておらず、当業者であれば、創造的な努力なくこれら添付図面から他の図面を導出し得る。
本発明の実施形態に従うオーディオコーディング方法の概要フローチャートである。 実際のスペクトルとLSF差分との比較の図である。 本発明の実施形態に従うオーディオコーディング方法のアプリケーションシナリオの例を示す図である。 本発明の実施形態に従うオーディオコーディング装置の概要構成図である。 本発明の実施形態に従う電子デバイスの概要構成図である。
以下は、本発明の実施形態における添付図面を参照して本発明の実施形態における技術的解決策を明確に説明する。明らかに、説明された実施形態は、本発明の実施形態のすべてではなく単なる一部である。創造的な努力なく本発明の実施形態に基づいて当業者によって取得される他のすべての実施形態は、本発明の保護範囲内にあるものとする。
本発明の実施形態に従うオーディオデコーディング方法のフローチャートである図1を参照されたい。この方法は以下を含む。
ステップ101:オーディオにおける各オーディオフレームについて、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定した場合、電子デバイスは、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するか、または、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定した場合、電子デバイスは、第2の修正重みを決定し、あらかじめ設定された修正条件は、オーディオフレームの信号特性が、このオーディオフレームの前のオーディオフレームの信号特性に類似していることを判定するために使用される。
ステップ102:電子デバイスは、決定された第1の修正重みまたは決定された第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正する。
線形予測パラメータは、LPC、LSP、ISP、LSF等を含み得る。
ステップ103:電子デバイスは、修正されたオーディオフレームの線形予測パラメータに従ってオーディオフレームをコーディングする。
この実施形態では、オーディオにおける各オーディオフレームについて、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定した場合、電子デバイスは、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するか、または、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定した場合、電子デバイスは、第2の修正重みを決定し、電子デバイスは、決定された第1の修正重みまたは決定された第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正し、修正されたオーディオフレームの線形予測パラメータに従って、オーディオフレームをコーディングする。このように、オーディオフレームの信号特性が、このオーディオフレームの前のオーディオフレームの信号特性に類似しているか否かに従って、異なる修正重みが決定され、オーディオフレームの線形予測パラメータが修正され、これによって、オーディオフレーム間のスペクトルが、より安定になる。それに加えて、オーディオフレームの信号特性が、このオーディオフレームの前のオーディオフレームの信号特性に類似しているか否かに従って、異なる修正重みが決定され、これら信号特性が類似していない場合に決定される第2の修正重みは、可能な限り1に近くなり得る。これによって、オーディオフレームの信号特性が、このオーディオフレームの前のオーディオフレームの信号特性に類似していない場合、オーディオフレームのオリジナルのスペクトル特性が、可能な限り維持されるようなり、したがって、コーディングされたオーディオの情報がデコードされた後に取得されたオーディオの聴覚品質は、より良好である。
ステップ101において、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足するか否かを電子デバイスがどのようにして判定するのかの特定の実施は、修正条件の特定の実施に関連している。例を使用することによって、以下に説明が提供される。
可能な実施方式において、修正条件は、オーディオフレームが、過渡的フレームではないのであれば、
オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを、電子デバイスによって判定するステップは、オーディオフレームが、過渡的フレームではないことを判定するステップを含み得、過渡的フレームは、非摩擦音から摩擦音への過渡的フレーム、または、摩擦音から非摩擦音への過渡的フレームを含み、
オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを、電子デバイスによって判定するステップは、オーディオフレームが過渡的フレームであることを判定するステップを含み得る。
可能な実施方式では、オーディオフレームが摩擦音から非摩擦音への過渡的フレームであるか否かを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいか否かと、オーディオフレームのコーディングタイプが過渡的であるか否かとを判定することによって実施され得る。特に、オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであることを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、オーディオフレームのコーディングタイプが過渡的であることとを判定するステップを含み得、オーディオフレームが、摩擦音から非摩擦音への過渡的フレームではないことを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、オーディオフレームのコーディングタイプが過渡的ではないことを判定するステップを含み得る。
別の可能な実施方式では、オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであるか否かを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1の周波数しきい値よりも大きいか否かを判定することと、オーディオフレームのスペクトルチルト周波数が、第2の周波数しきい値未満であるか否かを判定することと、によって実施され得る。特に、オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであることを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満であることとを判定するステップを含み得、オーディオフレームが、摩擦音から非摩擦音への過渡的フレームではないことを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満ではないことを判定するステップを含み得る。第1のスペクトルチルト周波数しきい値および第2のスペクトルチルト周波数しきい値の特定の値は、本発明のこの実施形態において限定されず、第1のスペクトルチルト周波数しきい値と第2のスペクトルチルト周波数しきい値との値の関係は、限定されない。オプションで、本発明の実施形態では、第1のスペクトルチルト周波数しきい値の値は、5.0であり得、本発明の別の実施形態では、第2のスペクトルチルト周波数しきい値の値は、1.0であり得る。
可能な実施方式では、オーディオフレームが、非摩擦音から摩擦音への過渡的フレームであるか否かを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第3の周波数しきい値未満であるか否かを判定すること、前のオーディオフレームのコーディングタイプが、有声(Voiced)、一般的(Generic)、過渡的(Transition)、およびオーディオ(Audio)の4つのタイプのうちの1つであるか否かを判定すること、ならびに、オーディオフレームのスペクトルチルト周波数が、第4の周波数しきい値よりも大きいか否かを判定すること、によって実施され得る。特に、オーディオフレームが非摩擦音から摩擦音への過渡的フレームであることを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満であること、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つであること、ならびに、オーディオフレームのスペクトルチルトが、第4のスペクトルチルトしきい値より大きいことを判定するステップを含み得、オーディオフレームが非摩擦音から摩擦音への過渡的フレームではないことを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満ではないこと、ならびに/または、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つではないこと、ならびに/または、オーディオフレームのスペクトルチルト周波数が、第4のスペクトルチルト周波数しきい値よりも大きくないことを判定するステップを含み得る。第3のスペクトルチルト周波数しきい値および第4のスペクトルチルト周波数しきい値の特定の値は、本発明のこの実施形態において限定されず、第3のスペクトルチルト周波数しきい値と第4のスペクトルチルト周波数しきい値との値の関係は、限定されない。本発明の実施形態では、第3のスペクトルチルト周波数しきい値の値は、3.0であり得、本発明の別の実施形態では、第4のスペクトルチルト周波数しきい値の値は、5.0であり得る。
ステップ101において、オーディオフレームのLSF差分と、前のオーディオフレームのLSF差分とに従って、電子デバイスによって、第1の修正重みを決定するステップは、
電子デバイスによって、以下の式を使用することによって、オーディオフレームのLSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するステップを含み得る。
Figure 0006414635
ここで、w[i]は、第1の修正重みであり、lsf_new_diff[i]は、オーディオフレームのLSF差分であり、lsf_new_diff[i]=lsf_new[i]-lsf_new[i-1]であり、lsf_new[i]は、オーディオフレームのi次LSFパラメータであり、lsf_new[i-1]は、オーディオフレームの(i-1)次LSFパラメータであり、lsf_old_diff[i]は、このオーディオフレームの前のオーディオフレームのLSF差分であり、lsf_old_diff[i]=lsf_old[i]-lsf_old[i-1]であり、lsf_old[i]は、このオーディオフレームの前のオーディオフレームのi次LSFパラメータであり、lsf_old[i-1]は、このオーディオフレームの前のオーディオフレームの(i-1)次LSF差分であり、iは、LSFパラメータの次数およびLSF差分の次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。
前述した式の原理は以下の通りである。
実際のスペクトルとLSF差分との比較の図である図1Aを参照されたい。図から理解され得るように、オーディオフレームにおけるLSF差分lsf_new_diff[i]は、オーディオフレームにおけるスペクトルエネルギ傾向を反映する。より小さなlsf_new_diff[i]は、より大きな、対応する周波数ポイントのスペクトルエネルギを示す。
より小さなw[i]=lsf_new_diff[i]/lsf_old_diff[i]は、lsf_new[i]に対応する周波数ポイントにおける、前のフレームと現在のフレームとの間の、より大きなスペクトルエネルギ差と、オーディオフレームのスペクトルエネルギが、前のオーディオフレームに対応する周波数ポイントのスペクトルエネルギよりもはるかに大きいこととを示す。
より小さなw[i]=lsf_old_diff[i]/lsf_new_diff[i]は、lsf_new[i]に対応する周波数ポイントにおける、前のフレームと現在のフレームとの間の、より小さなスペクトルエネルギ差と、オーディオフレームのスペクトルエネルギが、前のオーディオフレームに対応する周波数ポイントのスペクトルエネルギよりもはるかに小さいこととを示す。
したがって、前のフレームと現在のフレームとの間のスペクトルを安定にするために、w[i]は、オーディオフレームlsf_new[i]の重みとして使用され得、1-w[i]は、前のオーディオフレームに対応する周波数ポイントの重みとして使用され得る。詳細は、式2に示される。
ステップ101において、電子デバイスによって、第2の修正重みを決定するステップは、
電子デバイスによって、第2の修正重みを、あらかじめ設定された修正重み値として決定するステップを含み得、あらかじめ設定された修正重み値は、0よりも大きく、1以下である。
好適には、あらかじめ設定された修正重み値は、1に近い値である。
ステップ102において、電子デバイスによって、決定された第1の修正重みに従って、オーディオフレームの線形予測パラメータを修正するステップは、
以下の式を使用することによって、第1の修正重みに対応するオーディオフレームの線形予測パラメータを修正するステップを含み得る。
L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i]、式2
ここで、w[i]は、第1の修正重みであり、L[i]は、修正されたオーディオフレームの線形予測パラメータであり、L_new[i]は、オーディオフレームの線形予測パラメータであり、L_old[i]は、このオーディオフレームの前のオーディオフレームの線形予測パラメータであり、iは、線形予測パラメータの次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。
ステップ102において、電子デバイスによって、決定された第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正するステップは、
以下の式を使用することによって、第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正するステップを含み得る。
L[i]=(1-y)*L_old[i]+y*L_new[i]、式3
ここで、yは、第2の修正重みであり、L[i]は、修正されたオーディオフレームの線形予測パラメータであり、L_new[i]は、オーディオフレームの線形予測パラメータであり、L_old[i]は、このオーディオフレームの前のオーディオフレームの線形予測パラメータであり、iは、線形予測パラメータの次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。
ステップ103において、電子デバイスは特に、修正されたオーディオフレームの線形予測パラメータに従ってオーディオフレームをどのようにコーディングするかに関し、関連する時間領域帯域幅拡張技術を参照されたい。本発明では、詳細は説明されない。
本発明のこの実施形態におけるオーディオコーディング方法は、図2に図示された時間領域帯域幅拡張方法へ適用され得る。時間領域帯域幅拡張方法では、
オリジナルのオーディオ信号は、低帯域信号および高帯域信号へ分割され、
低帯域信号については、低帯域信号コーディング、低帯域励起信号前処理、LP合成、ならびに時間領域エンベロープ計算および量子化のような処理が、連続的に実行され、
高帯域信号については、高帯域信号前処理、LP分析、およびLPC量子化のような処理が、連続的に実行され、
低帯域信号コーディングの結果、LPC量子化の結果、ならびに、時間領域エンベロープ計算および量子化の結果に従って、オーディオ信号に対してMUXが実行される。
LPC量子化は、本発明のこの実施形態におけるステップ101およびステップ102に対応し、オーディオ信号に対して実行されるMUXは、本発明のこの実施形態におけるステップ103に対応する。
本発明の実施形態に従うオーディオコーディング装置の概要構成図である図3を参照されたい。装置は、電子デバイス内に配置され得る。装置300は、決定ユニット310、修正ユニット320、およびコーディングユニット330を含み得る。
決定ユニット310は、オーディオにおける各オーディオフレームについて、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、または、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定した場合、第2の修正重みを決定するように構成され、あらかじめ設定された修正条件は、オーディオフレームの信号特性が、このオーディオフレームの前のオーディオフレームの信号特性に類似していることを判定するために使用される。
修正ユニット320は、決定ユニット310によって決定された第1の修正重みまたは第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正するように構成される。
コーディングユニット330は、修正されたオーディオフレームの線形予測パラメータに従って、オーディオフレームをコーディングするように構成され、修正された線形予測パラメータは、修正ユニット320による修正後に取得される。
オプションで、決定ユニット310は特に、以下の式を使用することによって、オーディオフレームのLSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するように構成され得る。
Figure 0006414635
ここで、w[i]は、第1の修正重みであり、lsf_new_diff[i]は、オーディオフレームのLSF差分であり、lsf_old_diff[i]は、このオーディオフレームの前のオーディオフレームのLSF差分であり、iは、LSF差分の次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。
オプションで、決定ユニット310は特に、第2の修正重みを、あらかじめ設定された修正重み値として決定するように構成され、あらかじめ設定された修正重み値は、0よりも大きく、1以下である。
オプションで、修正ユニット320は特に、以下の式を使用することによって、第1の修正重みに従って、オーディオフレームの線形予測パラメータを修正するように構成され得る。
L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i]、
ここで、w[i]は、第1の修正重みであり、L[i]は、修正されたオーディオフレームの線形予測パラメータであり、L_new[i]は、オーディオフレームの線形予測パラメータであり、L_old[i]は、このオーディオフレームの前のオーディオフレームの線形予測パラメータであり、iは、線形予測パラメータの次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。
オプションで、修正ユニット320は特に、以下の式を使用することによって、第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正するように構成され得る。
L[i]=(1-y)*L_old[i]+y*L_new[i]、
ここで、yは、第2の修正重みであり、L[i]は、修正されたオーディオフレームの線形予測パラメータであり、L_new[i]は、オーディオフレームの線形予測パラメータであり、L_old[i]は、このオーディオフレームの前のオーディオフレームの線形予測パラメータであり、iは、線形予測パラメータの次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。
オプションで、決定ユニット310は特に、オーディオにおける各オーディオフレームについて、オーディオフレームが、過渡的フレームではないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するか、または、オーディオフレームが、過渡的フレームであることを判定した場合、第2の修正重みを決定するように構成され得、過渡的フレームは、非摩擦音から摩擦音への過渡的フレーム、もしくは、摩擦音から非摩擦音への過渡的フレームを含む。
オプションで、決定ユニット310は特に、オーディオにおける各オーディオフレームについて、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、オーディオフレームのコーディングタイプが、過渡的ではないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、オーディオフレームのコーディングタイプが過渡的であることとを判定した場合、第2の修正重みを決定するように構成され得る。
オプションで、決定ユニット310は特に、オーディオにおける各オーディオフレームについて、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満ではないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満であることとを判定した場合、第2の修正重みを決定するように構成され得る。
オプションで、決定ユニット310は特に、オーディオにおける各オーディオフレームについて、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満ではないこと、ならびに/または、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオのうちの1つではないこと、ならびに/または、オーディオフレームのスペクトルチルトが、第4のスペクトルチルトしきい値よりも大きくないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満であること、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つであること、ならびに、オーディオフレームのスペクトルチルト周波数が、第4のスペクトルチルト周波数しきい値よりも大きいことを判定した場合、第2の修正重みを決定するように構成され得る。
この実施形態では、オーディオにおける各オーディオフレームについて、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定した場合、電子デバイスは、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するか、または、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定した場合、電子デバイスは、第2の修正重みを決定し、電子デバイスは、決定された第1の修正重みもしくは決定された第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正し、修正されたオーディオフレームの線形予測パラメータに従って、オーディオフレームをコーディングする。このように、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足するか否かに従って、異なる修正重みが決定され、オーディオフレームの線形予測パラメータが修正され、これによって、オーディオフレーム間のスペクトルが、より安定になる。さらに、電子デバイスは、修正されたオーディオフレームの線形予測パラメータに従ってオーディオフレームをコーディングする。したがって、より広い帯域幅を有するオーディオは、ビットレートが不変のまま、または、ビットレートが僅かにしか変化せずにコーディングされることが保証され得る。
本発明の実施形態に従う第1のノードの構成図である図4を参照されたい。第1のノード400は、プロセッサ410、メモリ420、トランシーバ430、およびバス440を含む。
プロセッサ410、メモリ420、およびトランシーバ430は、バス440を使用することによって互いに接続され、バス440は、ISAバス、PCIバス、EISAバス等であり得る。バスは、アドレスバス、データバス、制御バス等へ分類され得る。表示の容易のために、図4におけるバスは、1つの太線のみを使用して表現されるが、これは、1つのみのバス、または、1つのタイプのみのバスしか存在しないことを示してない。
メモリ420は、プログラムを記憶するように構成される。特に、プログラムは、プログラムコードを含み得、プログラムコードは、コンピュータ操作命令を含む。メモリ420は、高速RAMメモリを含み得、さらに、少なくとも1つの磁気ディスクメモリのような不揮発性メモリ(non-volatile memory)を含み得る。
トランシーバ430は、他のデバイスを接続し、他のデバイスと通信するように構成される。
プロセッサ410は、プログラムコードを実行し、オーディオにおける各オーディオフレームについて、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するか、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定した場合、第2の修正重みを決定するように構成され、あらかじめ設定された修正条件は、オーディオフレームの信号特性が、このオーディオフレームの前のオーディオフレームの信号特性に類似していることを判定するために使用され、プロセッサ410はさらに、決定された第1の修正重みまたは決定された第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正し、修正されたオーディオフレームの線形予測パラメータに従って、オーディオフレームをコーディングするように構成される。
オプションで、プロセッサ410は特に、以下の式を使用することによって、オーディオフレームのLSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するように構成され得る。
Figure 0006414635
ここで、w[i]は、第1の修正重みであり、lsf_new_diff[i]は、オーディオフレームのLSF差分であり、lsf_old_diff[i]は、このオーディオフレームの前のオーディオフレームのLSF差分であり、iは、LSF差分の次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。
オプションで、プロセッサ410は特に、第2の修正重みを1として決定するか、または、
第2の修正重みを、あらかじめ設定された修正重み値として決定するように構成され得、あらかじめ設定された修正重み値は、0よりも大きく、1以下である。
オプションで、プロセッサ410は特に、以下の式を使用することによって、第1の修正重みに従って、オーディオフレームの線形予測パラメータを修正するように構成され得る。
L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i]、
ここで、w[i]は、第1の修正重みであり、L[i]は、修正されたオーディオフレームの線形予測パラメータであり、L_new[i]は、オーディオフレームの線形予測パラメータであり、L_old[i]は、このオーディオフレームの前のオーディオフレームの線形予測パラメータであり、iは、線形予測パラメータの次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。
オプションで、プロセッサ410は特に、以下の式を使用することによって、第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正するように構成され得る。
L[i]=(1-y)*L_old[i]+y*L_new[i]、
ここで、yは、第2の修正重みであり、L[i]は、修正されたオーディオフレームの線形予測パラメータであり、L_new[i]は、オーディオフレームの線形予測パラメータであり、L_old[i]は、このオーディオフレームの前のオーディオフレームの線形予測パラメータであり、iは、線形予測パラメータの次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。
オプションで、プロセッサ410は特に、オーディオにおける各オーディオフレームについて、オーディオフレームが、過渡的フレームではないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するか、または、オーディオフレームが、過渡的フレームであることを判定した場合、第2の修正重みを決定するように構成され得、過渡的フレームは、非摩擦音から摩擦音への過渡的フレーム、もしくは、摩擦音から非摩擦音への過渡的フレームを含む。
オプションで、プロセッサ410は特に、
オーディオにおける各オーディオフレームについて、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/もしくは、オーディオフレームのコーディングタイプが、過渡的ではないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、オーディオフレームのコーディングタイプが過渡的であることとを判定した場合、第2の修正重みを決定するか、または、
オーディオにおける各オーディオフレームについて、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/もしくは、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満ではないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満であることとを判定した場合、第2の修正重みを決定するように構成され得る。
オプションで、プロセッサ410は特に、
オーディオにおける各オーディオフレームについて、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満ではないこと、ならびに/または、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つではないこと、ならびに/または、オーディオフレームのスペクトルチルトが、第4のスペクトルチルトしきい値よりも大きくないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満であること、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオのうちの1つであること、ならびに、オーディオフレームのスペクトルチルト周波数が、第4のスペクトルチルト周波数しきい値よりも大きいことを判定した場合、第2の修正重みを決定するように構成され得る。
この実施形態では、オーディオにおける各オーディオフレームについて、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定した場合、電子デバイスは、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、または、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定した場合、電子デバイスは、第2の修正重みを決定し、電子デバイスは、決定された第1の修正重みもしくは決定された第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正し、修正されたオーディオフレームの線形予測パラメータに従って、オーディオフレームをコーディングする。このように、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足するか否かに従って、異なる修正重みが決定され、オーディオフレームの線形予測パラメータが修正され、これによって、オーディオフレーム間のスペクトルが、より安定になる。さらに、電子デバイスは、修正されたオーディオフレームの線形予測パラメータに従ってオーディオフレームをコーディングする。したがって、より広い帯域幅を有するオーディオは、ビットレートが不変のまま、または、ビットレートが僅かにしか変化せずにコーディングされることが保証され得る。
当業者は、本発明の実施形態における技術は、必要な一般的なハードウェアプラットフォームに加えて、ソフトウェアによって実施され得ることを明確に理解し得る。そのような理解に基づいて、本発明の技術的解決策は本質的に、または、従来技術に寄与する部分は、ソフトウェア製品の形式で実施され得る。ソフトウェア製品は、ROM/RAM、ハードディスク、もしくは光ディスクのような記憶媒体に記憶され、実施形態において説明された方法、または、本発明の実施形態のいくつかの部分を実行するように(パーソナルコンピュータ、サーバ、もしくはネットワークデバイスであり得る)コンピュータデバイスに命令するためのいくつかの命令を含む。
本明細書では、これら実施形態は、進行的な方式で説明される。実施形態と同じまたは類似の部分について互いに参照がなされ得る。各実施形態は、他の実施形態からの相違に焦点を置く。特に、システム実施形態は、基本的に、方法実施形態に類似しており、したがって、簡潔に説明される。関連部分について、方法実施形態の一部における説明に対する参照がなされ得る。
前述した説明は、本発明の実施方式であるが、本発明の保護範囲を制限するように意図されていない。本発明の精神および原理から逸脱することなくなされる任意の修正、等価な置換、または改良も、本発明の保護範囲内にあるものとする。
300 装置
310 決定ユニット
320 修正ユニット
330 コーディングユニット
400 第1のノード
410 プロセッサ
420 メモリ
430 トランシーバ
440 バス

Claims (22)

  1. オーディオコーディング方法であって、
    各オーディオフレームについて、前記オーディオフレームの信号特性と、前記オーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定した場合、前記オーディオフレームの線形スペクトル周波数LSF差分と、前記前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、または、前記オーディオフレームの信号特性と、前記前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定した場合、第2の修正重みを決定するステップであって、前記あらかじめ設定された修正条件は、前記オーディオフレームの前記信号特性が、前記前のオーディオフレームの前記信号特性に類似していることを判定するために使用される、決定するステップと、
    前記決定された第1の修正重みまたは前記決定された第2の修正重みに従って、前記オーディオフレームの線形予測パラメータを修正するステップと、
    修正された前記オーディオフレームの線形予測パラメータに従って、前記オーディオフレームをコーディングするステップと、
    を備えるオーディオコーディング方法。
  2. 前記オーディオフレームの線形スペクトル周波数LSF差分と、前記前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するステップは、
    以下の式を使用することによって、前記オーディオフレームの前記LSF差分と、前記前のオーディオフレームの前記LSF差分とに従って、前記第1の修正重みを決定するステップを備え、
    Figure 0006414635
    ここで、w[i]は、前記第1の修正重みであり、lsf_new_diff[i]は、前記オーディオフレームの前記LSF差分であり、lsf_old_diff[i]は、前記前のオーディオフレームの前記LSF差分であり、iは、前記LSF差分の次数であり、iの値は、0からM-1までの範囲にあり、Mは、前記線形予測パラメータの次数である、請求項1に記載の方法。
  3. 前記第2の修正重みを決定するステップは、
    前記第2の修正重みを、あらかじめ設定された修正重み値として決定するステップを備え、前記あらかじめ設定された修正重み値は、0よりも大きく、1以下である、請求項1または2に記載の方法。
  4. 前記決定された第1の修正重みに従って、前記オーディオフレームの線形予測パラメータを修正するステップは、
    以下の式を使用することによって、前記第1の修正重みに従って、前記オーディオフレームの前記線形予測パラメータを修正するステップを備え、
    L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i]、
    ここで、w[i]は、前記第1の修正重みであり、L[i]は、前記修正された前記オーディオフレームの線形予測パラメータであり、L_new[i]は、前記オーディオフレームの前記線形予測パラメータであり、L_old[i]は、前記前のオーディオフレームの線形予測パラメータであり、iは、前記線形予測パラメータの次数であり、前記iの値は、0からM-1までの範囲にあり、Mは、前記線形予測パラメータの前記次数である、請求項1から3のいずれか一項に記載の方法。
  5. 前記決定された第2の修正重みに従って、前記オーディオフレームの線形予測パラメータを修正するステップは、
    以下の式を使用することによって、前記第2の修正重みに従って、前記オーディオフレームの前記線形予測パラメータを修正するステップを備え、
    L[i]=(1-y)*L_old[i]+y*L_new[i]、
    ここで、yは、前記第2の修正重みであり、L[i]は、前記修正された前記オーディオフレームの線形予測パラメータであり、L_new[i]は、前記オーディオフレームの前記線形予測パラメータであり、L_old[i]は、前記前のオーディオフレームの前記線形予測パラメータであり、iは、前記線形予測パラメータの前記次数であり、前記iの値は、0からM-1までの範囲にあり、Mは、前記線形予測パラメータの前記次数である、請求項1から4のいずれか一項に記載の方法。
  6. 前記オーディオフレームの信号特性と、前記前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定するステップは、前記オーディオフレームが、過渡的フレームではないことを判定するステップを備え、前記過渡的フレームは、非摩擦音から摩擦音への過渡的フレーム、または、摩擦音から非摩擦音への過渡的フレームを備え、
    前記オーディオフレームの信号特性と、前記前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定するステップは、前記オーディオフレームが過渡的フレームであることを判定するステップを備える、請求項1から5のいずれか一項に記載の方法。
  7. 前記オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであることを判定するステップは、前記前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、前記オーディオフレームのコーディングタイプが過渡的であることとを判定するステップを備え、
    前記オーディオフレームが、摩擦音から非摩擦音への過渡的フレームではないことを判定するステップは、前記前のオーディオフレームの前記スペクトルチルト周波数が、前記第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、前記オーディオフレームの前記コーディングタイプが過渡的ではないことを判定するステップを備える、請求項6に記載の方法。
  8. 前記オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであることを判定するステップは、前記前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、前記オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満であることとを判定するステップを備え、
    前記オーディオフレームが、摩擦音から非摩擦音への過渡的フレームではないことを判定するステップは、前記前のオーディオフレームの前記スペクトルチルト周波数が、前記第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、前記オーディオフレームの前記スペクトルチルト周波数が、前記第2のスペクトルチルト周波数しきい値未満ではないことを判定するステップを備える、請求項6に記載の方法。
  9. 前記オーディオフレームが、非摩擦音から摩擦音への過渡的フレームであることを判定するステップは、前記前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満であることと、前記前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つであることと、前記オーディオフレームのスペクトルチルト周波数が、第4のスペクトルチルト周波数しきい値よりも大きいこととを判定するステップを備え、
    前記オーディオフレームが、非摩擦音から摩擦音への過渡的フレームではないことを判定するステップは、前記前のオーディオフレームのスペクトルチルト周波数が、前記第3のスペクトルチルト周波数しきい値未満ではないこと、ならびに/または、前記前のオーディオフレームの前記コーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つではないこと、ならびに/または、前記オーディオフレームの前記スペクトルチルト周波数が、前記第4のスペクトルチルト周波数しきい値よりも大きくないことを判定するステップを備える、請求項6に記載の方法。
  10. 前記オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであることを判定するステップは、前記前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、前記オーディオフレームのコーディングタイプが過渡的であることとを判定するステップを備える、請求項6に記載の方法。
  11. 前記オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであることを判定するステップは、前記前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、前記オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満であることとを判定するステップを備える、請求項6に記載の方法。
  12. 前記オーディオフレームが、非摩擦音から摩擦音への過渡的フレームであることを判定するステップは、前記前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満であることと、前記前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つであることと、前記オーディオフレームのスペクトルチルト周波数が、第4のスペクトルチルト周波数しきい値よりも大きいこととを判定するステップを備える、請求項6に記載の方法。
  13. オーディオコーディング装置であって、決定ユニット、修正ユニット、およびコーディングユニットを備え、
    前記決定ユニットは、各オーディオフレームについて、前記オーディオフレームの信号特性と、前記オーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定した場合、前記オーディオフレームの線形スペクトル周波数LSF差分と、前記前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するか、または、前記オーディオフレームの信号特性と、前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定した場合、第2の修正重みを決定するように構成され、前記あらかじめ設定された修正条件は、前記オーディオフレームの前記信号特性が、前記前のオーディオフレームの前記信号特性に類似していることを判定するために使用され、
    前記修正ユニットは、前記決定ユニットによって決定された前記第1の修正重みまたは前記第2の修正重みに従って、前記オーディオフレームの線形予測パラメータを修正するように構成され、
    前記コーディングユニットは、修正された前記オーディオフレームの線形予測パラメータに従って、前記オーディオフレームをコーディングするように構成され、前記修正された線形予測パラメータは、前記修正ユニットによる修正後に取得される、オーディオコーディング装置。
  14. 前記決定ユニットは特に、以下の式を使用することによって、前記オーディオフレームの前記LSF差分と、前記前のオーディオフレームの前記LSF差分とに従って、前記第1の修正重みを決定するように構成され、
    Figure 0006414635
    ここで、w[i]は、前記第1の修正重みであり、lsf_new_diff[i]は、前記オーディオフレームの前記LSF差分であり、lsf_old_diff[i]は、前記前のオーディオフレームの前記LSF差分であり、iは、前記LSF差分の次数であり、iの値は、0からM-1までの範囲にあり、Mは、前記線形予測パラメータの次数である、請求項13に記載の装置。
  15. 前記決定ユニットは特に、前記第2の修正重みを、あらかじめ設定された修正重み値として決定するように構成され、前記あらかじめ設定された修正重み値は、0よりも大きく、1以下である、請求項13または14に記載の装置。
  16. 前記修正ユニットは特に、以下の式を使用することによって、前記第1の修正重みに従って、前記オーディオフレームの前記線形予測パラメータを修正するように構成され、
    L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i]、
    ここで、w[i]は、前記第1の修正重みであり、L[i]は、前記修正された前記オーディオフレームの線形予測パラメータであり、L_new[i]は、前記オーディオフレームの前記線形予測パラメータであり、L_old[i]は、前記前のオーディオフレームの線形予測パラメータであり、iは、前記線形予測パラメータの次数であり、前記iの値は、0からM-1までの範囲にあり、Mは、前記線形予測パラメータの前記次数である、請求項13または14に記載の装置。
  17. 前記修正ユニットは特に、以下の式を使用することによって、前記第2の修正重みに従って、前記オーディオフレームの前記線形予測パラメータを修正するように構成され、
    L[i]=(1-y)*L_old[i]+y*L_new[i]、
    ここで、yは、前記第2の修正重みであり、L[i]は、前記修正された前記オーディオフレームの線形予測パラメータであり、L_new[i]は、前記オーディオフレームの前記線形予測パラメータであり、L_old[i]は、前記前のオーディオフレームの前記線形予測パラメータであり、iは、前記線形予測パラメータの前記次数であり、前記iの値は、0からM-1までの範囲にあり、Mは、前記線形予測パラメータの前記次数である、請求項13から16のいずれか一項に記載の装置。
  18. 前記決定ユニットは特に、各オーディオフレームについて、前記オーディオフレームが、過渡的フレームではないことを判定した場合、前記オーディオフレームの前記線形スペクトル周波数LSF差分と、前記前のオーディオフレームの前記LSF差分とに従って、前記第1の修正重みを決定し、前記オーディオフレームが、過渡的フレームであることを判定した場合、前記第2の修正重みを決定するように構成され、前記過渡的フレームは、非摩擦音から摩擦音への過渡的フレーム、または、摩擦音から非摩擦音への過渡的フレームを備える、請求項13から17のいずれか一項に記載の装置。
  19. 前記決定ユニットは特に、
    各オーディオフレームについて、前記前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、前記オーディオフレームのコーディングタイプが、過渡的ではないことを判定した場合、前記オーディオフレームの前記線形スペクトル周波数LSF差分と、前記前のオーディオフレームの前記LSF差分とに従って、前記第1の修正重みを決定し、前記前のオーディオフレームの前記スペクトルチルト周波数が、前記第1のスペクトルチルト周波数しきい値よりも大きいことと、前記オーディオフレームの前記コーディングタイプが過渡的であることとを判定した場合、前記第2の修正重みを決定するように構成された、請求項18に記載の装置。
  20. 前記決定ユニットは特に、
    各オーディオフレームについて、前記前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、前記オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満ではないことを判定した場合、前記オーディオフレームの前記線形スペクトル周波数LSF差分と、前記前のオーディオフレームの前記LSF差分とに従って、前記第1の修正重みを決定し、前記前のオーディオフレームの前記スペクトルチルト周波数が、前記第1のスペクトルチルト周波数しきい値よりも大きいことと、前記オーディオフレームの前記スペクトルチルト周波数が、前記第2のスペクトルチルト周波数しきい値未満であることとを判定した場合、前記第2の修正重みを決定するように構成された、請求項18に記載の装置。
  21. 前記決定ユニットは特に、
    各オーディオフレームについて、前記前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満ではないこと、ならびに/または、前記前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つではないこと、ならびに/または、前記オーディオフレームのスペクトルチルトが、第4のスペクトルチルトしきい値よりも大きくないことを判定した場合、前記オーディオフレームの前記線形スペクトル周波数LSF差分および前記前のオーディオフレームの前記LSF差分に従って、前記第1の修正重みを決定し、前記前のオーディオフレームの前記スペクトルチルト周波数が、前記第3のスペクトルチルト周波数しきい値未満であること、前記前のオーディオフレームの前記コーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つであること、ならびに、前記オーディオフレームの前記スペクトルチルト周波数が、前記第4のスペクトルチルト周波数しきい値よりも大きいことを判定した場合、前記第2の修正重みを決定するように構成された、請求項18に記載の装置。
  22. 請求項1から12のいずれか一項に記載の方法を実行するように作成されたプログラムが記録されているコンピュータ読取可能な媒体。
JP2017519760A 2014-06-27 2015-03-23 オーディオコーディング方法および装置 Active JP6414635B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN201410299590.2 2014-06-27
CN201410299590 2014-06-27
CN201410426046.XA CN105225670B (zh) 2014-06-27 2014-08-26 一种音频编码方法和装置
CN201410426046.X 2014-08-26
PCT/CN2015/074850 WO2015196837A1 (zh) 2014-06-27 2015-03-23 一种音频编码方法和装置

Publications (2)

Publication Number Publication Date
JP2017524164A JP2017524164A (ja) 2017-08-24
JP6414635B2 true JP6414635B2 (ja) 2018-10-31

Family

ID=54936716

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017519760A Active JP6414635B2 (ja) 2014-06-27 2015-03-23 オーディオコーディング方法および装置

Country Status (9)

Country Link
US (4) US9812143B2 (ja)
EP (3) EP3937169A3 (ja)
JP (1) JP6414635B2 (ja)
KR (3) KR101888030B1 (ja)
CN (2) CN106486129B (ja)
ES (2) ES2882485T3 (ja)
HU (1) HUE054555T2 (ja)
PL (1) PL3340242T3 (ja)
WO (1) WO2015196837A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6082126B2 (ja) * 2013-01-29 2017-02-15 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 音声信号を合成するための装置及び方法、デコーダ、エンコーダ、システム及びコンピュータプログラム
CN106486129B (zh) * 2014-06-27 2019-10-25 华为技术有限公司 一种音频编码方法和装置
CN114898761A (zh) * 2017-08-10 2022-08-12 华为技术有限公司 立体声信号编解码方法及装置
WO2019142513A1 (ja) * 2018-01-17 2019-07-25 日本電信電話株式会社 符号化装置、復号装置、摩擦音判定装置、これらの方法及びプログラム
CN111602197B (zh) * 2018-01-17 2023-09-05 日本电信电话株式会社 解码装置、编码装置、它们的方法以及计算机可读记录介质
JP7130878B2 (ja) * 2019-01-13 2022-09-05 華為技術有限公司 高分解能オーディオコーディング
CN110390939B (zh) * 2019-07-15 2021-08-20 珠海市杰理科技股份有限公司 音频压缩方法和装置

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW224191B (ja) 1992-01-28 1994-05-21 Qualcomm Inc
JP3270922B2 (ja) * 1996-09-09 2002-04-02 富士通株式会社 符号化,復号化方法及び符号化,復号化装置
US6233550B1 (en) * 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US6199040B1 (en) * 1998-07-27 2001-03-06 Motorola, Inc. System and method for communicating a perceptually encoded speech spectrum signal
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6385573B1 (en) * 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6449590B1 (en) * 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
US6493665B1 (en) * 1998-08-24 2002-12-10 Conexant Systems, Inc. Speech classification and parameter weighting used in codebook search
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
US6330533B2 (en) 1998-08-24 2001-12-11 Conexant Systems, Inc. Speech encoder adaptively applying pitch preprocessing with warping of target signal
US6188980B1 (en) * 1998-08-24 2001-02-13 Conexant Systems, Inc. Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients
AU4072400A (en) * 1999-04-05 2000-10-23 Hughes Electronics Corporation A voicing measure as an estimate of signal periodicity for frequency domain interpolative speech codec system
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
US6931373B1 (en) * 2001-02-13 2005-08-16 Hughes Electronics Corporation Prototype waveform phase modeling for a frequency domain interpolative speech codec system
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
CN1420487A (zh) * 2002-12-19 2003-05-28 北京工业大学 1kb/s线谱频率参数的一步插值预测矢量量化方法
US7720683B1 (en) * 2003-06-13 2010-05-18 Sensory, Inc. Method and apparatus of specifying and performing speech recognition operations
CN1677491A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
BRPI0510303A (pt) * 2004-04-27 2007-10-02 Matsushita Electric Ind Co Ltd dispositivo de codificação escalável, dispositivo de decodificação escalável, e seu método
US8938390B2 (en) * 2007-01-23 2015-01-20 Lena Foundation System and method for expressive language and developmental disorder assessment
NZ562182A (en) * 2005-04-01 2010-03-26 Qualcomm Inc Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal
DK1875463T3 (en) * 2005-04-22 2019-01-28 Qualcomm Inc SYSTEMS, PROCEDURES AND APPARATUS FOR AMPLIFIER FACTOR GLOSSARY
US8510105B2 (en) * 2005-10-21 2013-08-13 Nokia Corporation Compression and decompression of data vectors
JP4816115B2 (ja) * 2006-02-08 2011-11-16 カシオ計算機株式会社 音声符号化装置及び音声符号化方法
CN1815552B (zh) * 2006-02-28 2010-05-12 安徽中科大讯飞信息科技有限公司 基于线谱频率及其阶间差分参数的频谱建模与语音增强方法
US8532984B2 (en) 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
WO2008032828A1 (fr) * 2006-09-15 2008-03-20 Panasonic Corporation Dispositif de codage audio et procédé de codage audio
KR100862662B1 (ko) 2006-11-28 2008-10-10 삼성전자주식회사 프레임 오류 은닉 방법 및 장치, 이를 이용한 오디오 신호복호화 방법 및 장치
WO2008091947A2 (en) * 2007-01-23 2008-07-31 Infoture, Inc. System and method for detection and analysis of speech
EP2945158B1 (en) 2007-03-05 2019-12-25 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for smoothing of stationary background noise
US8126707B2 (en) * 2007-04-05 2012-02-28 Texas Instruments Incorporated Method and system for speech compression
CN101114450B (zh) * 2007-07-20 2011-07-27 华中科技大学 一种语音编码选择性加密方法
BRPI0904958B1 (pt) * 2008-07-11 2020-03-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Aparelho e método para calcular dados de extensão de largura de banda usando um quadro controlado por inclinação espectral
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
CN102436820B (zh) * 2010-09-29 2013-08-28 华为技术有限公司 高频带信号编码方法及装置、高频带信号解码方法及装置
KR101747917B1 (ko) 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
CA2833868C (en) 2011-04-21 2019-08-20 Samsung Electronics Co., Ltd. Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefor
CN102664003B (zh) * 2012-04-24 2013-12-04 南京邮电大学 基于谐波加噪声模型的残差激励信号合成及语音转换方法
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
CN106486129B (zh) * 2014-06-27 2019-10-25 华为技术有限公司 一种音频编码方法和装置

Also Published As

Publication number Publication date
KR20180089576A (ko) 2018-08-08
US20200027468A1 (en) 2020-01-23
US11133016B2 (en) 2021-09-28
EP3136383A1 (en) 2017-03-01
EP3136383B1 (en) 2017-12-27
ES2659068T3 (es) 2018-03-13
CN105225670B (zh) 2016-12-28
CN105225670A (zh) 2016-01-06
PL3340242T3 (pl) 2021-12-06
WO2015196837A1 (zh) 2015-12-30
KR101888030B1 (ko) 2018-08-13
ES2882485T3 (es) 2021-12-02
JP2017524164A (ja) 2017-08-24
US10460741B2 (en) 2019-10-29
EP3937169A2 (en) 2022-01-12
US9812143B2 (en) 2017-11-07
US20170372716A1 (en) 2017-12-28
EP3340242B1 (en) 2021-05-12
US20170076732A1 (en) 2017-03-16
KR20170003969A (ko) 2017-01-10
CN106486129B (zh) 2019-10-25
KR101990538B1 (ko) 2019-06-18
EP3340242A1 (en) 2018-06-27
KR102130363B1 (ko) 2020-07-06
KR20190071834A (ko) 2019-06-24
HUE054555T2 (hu) 2021-09-28
EP3937169A3 (en) 2022-04-13
CN106486129A (zh) 2017-03-08
US20210390968A1 (en) 2021-12-16
EP3136383A4 (en) 2017-03-08

Similar Documents

Publication Publication Date Title
JP6414635B2 (ja) オーディオコーディング方法および装置
CA2827000C (en) Apparatus and method for error concealment in low-delay unified speech and audio coding (usac)
US10381014B2 (en) Generation of comfort noise
US9892739B2 (en) Bandwidth extension audio decoding method and device for predicting spectral envelope
JP5619177B2 (ja) 低域オーディオ信号の帯域拡張
JP6170172B2 (ja) 符号化モード決定方法及び該装置、オーディオ符号化方法及び該装置、並びにオーディオ復号化方法及び該装置
BR112015014956B1 (pt) Método de codificação de sinal de áudio, método de decodificação de sinal de áudio, aparelho de codificação de sinal de áudio e aparelho de decodificação de sinal de áudio
US11749295B2 (en) Pitch emphasis apparatus, method and program for the same
JP6517300B2 (ja) 信号処理方法及び装置
EP3076390B1 (en) Method and device for decoding speech and audio streams
US11037583B2 (en) Detection of music segment in audio signal
JP6584431B2 (ja) 音声情報を用いる改善されたフレーム消失補正
JP6264673B2 (ja) ロストフレームを処理するための方法および復号器
US8160869B2 (en) Method and apparatus for encoding continuation sinusoid signal information of audio signal and method and apparatus for decoding same

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180904

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180918

R150 Certificate of patent or registration of utility model

Ref document number: 6414635

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250