JP6125031B2 - オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置 - Google Patents

オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置 Download PDF

Info

Publication number
JP6125031B2
JP6125031B2 JP2015543256A JP2015543256A JP6125031B2 JP 6125031 B2 JP6125031 B2 JP 6125031B2 JP 2015543256 A JP2015543256 A JP 2015543256A JP 2015543256 A JP2015543256 A JP 2015543256A JP 6125031 B2 JP6125031 B2 JP 6125031B2
Authority
JP
Japan
Prior art keywords
signal
factor
excitation signal
band
emphasis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015543256A
Other languages
English (en)
Other versions
JP2016505873A (ja
Inventor
▲澤▼新 ▲劉▼
▲澤▼新 ▲劉▼
▲賓▼ 王
▲賓▼ 王
磊 苗
磊 苗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2016505873A publication Critical patent/JP2016505873A/ja
Application granted granted Critical
Publication of JP6125031B2 publication Critical patent/JP6125031B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Description

この出願は、2013年1月11日に“AUDIO SIGNAL ENCODING AND DECODING METHOD, AND AUDIO SIGNAL ENCODING AND DECODING APPARATUS”という題で中国専利局に出願された中国特許出願第201310010936.8号の優先権を主張し、その全内容を援用する。
本発明は、通信技術の分野に関し、特に、オーディオ信号符号化方法、オーディオ信号復号化方法、オーディオ信号符号化装置、オーディオ信号復号化装置、送信機、受信機及び通信システムに関する。
通信技術の絶え間ない進展により、ユーザは、音声品質に対してますます高い要件を課している。一般的に、音声品質は、音声品質の帯域幅を増加させることにより改善される。帯域幅が増加した情報が従来の符号化方法で符号化された場合、ビットレートはかなり増加し、その結果、現在のネットワーク帯域幅の制限条件のため、符号化を実施することが困難になる。従って、符号化は、ビットレートが変化しない場合又はわずかに変化する場合に帯域幅が広くなる信号において実行される必要があり、この問題への対策は、帯域幅拡張(帯域拡張、bandwidth extension)技術を使用することである。帯域幅拡張技術は、時間ドメイン又は周波数ドメインで行われてもよく、本発明では、帯域幅拡張は時間ドメインで行われる。
時間ドメインで帯域幅拡張を実行する基本的な原理は、2つの異なる処理方法が低帯域信号と高帯域信号とに使用されることにある。元の信号の低帯域信号では、符号化は、様々なエンコーダ(符号化器)を使用することにより要件に従ってエンコーダ側で実行される。デコーダ(復号化器)側では、エンコーダ側のエンコーダに対応するデコーダが低帯域信号を復号化及び復元するために使用される。高帯域信号では、エンコーダ側で、低帯域信号に使用されたエンコーダが、高帯域励起信号(excitation signal)を予測するために低周波数符号化パラメータを取得するために使用される。例えば、線形予測符号化(LCP:linear Predictive Coding)分析は、高周波数LPC係数を取得するために、元の信号の高帯域信号で実行される。高帯域励起信号は、予測された高帯域信号を取得するために、LPC係数に従って決定された合成フィルタを使用することによりフィルタリングされる。予測された高帯域信号は、高周波数利得パラメータを取得するために、元の信号の高帯域信号と比較される。高周波数利得パラメータ及びLPC係数は、高帯域信号を復元するために、デコーダ側に伝送される。デコーダ側では、低帯域信号の復号化中に励起された低周波数符号化パラメータが、高帯域励起信号を復元するために使用される。LPC係数は、合成フィルタを生成するために使用される。高帯域励起信号は、予測された高帯域信号を復元するために、合成フィルタを使用することによりフィルタリングされる。予測された高帯域信号は、最終的な高帯域信号を取得するために、高周波数利得パラメータを使用することにより調整される。高帯域信号及び低帯域信号は、最終的な出力信号を取得するために結合される。
時間ドメインで帯域幅拡張を実行する前述の技術では、高帯域信号は、特定のレートの条件で復元される。しかし、性能インジケータは不足している。復元した出力信号の周波数スペクトルを元の信号の周波数スペクトルと比較することにより、一般的な期間の有声音では、復元された高帯域信号に極めて強いハーモニック成分(harmonic component)が常に存在することが分かる。しかし、本当の音声信号の高帯域信号は、極めて強いハーモニック特性を有さない。従って、この差は、復元された信号の音が出るときに明らかな機械音が存在することを生じる。
本発明の実施例の目的は、復元された信号の機械音を低減又は除去するための、時間ドメインで帯域幅拡張を実行する前述の技術を改善することである。
本発明の実施例は、復元された信号の機械音を低減又は除去することにより、符号化及び復号化性能を改善することができるオーディオ信号符号化方法、オーディオ信号復号化方法、オーディオ信号符号化装置、オーディオ信号復号化装置、送信機、受信機及び通信システムを提供する。
第1の態様によれば、オーディオ信号符号化方法が提供され、符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割し、低帯域信号を符号化して低周波数符号化パラメータを取得し、低周波数符号化パラメータに従って音声度ファクタを計算し、低周波数符号化パラメータに従って高帯域励起信号を予測し、音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用され、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けし、合成励起信号と高帯域信号とに基づいて高周波数符号化パラメータを取得することを含む。
第1の態様を参照して、第1の態様の実装方法では、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けすることは、プリエンファシス雑音を取得するために、ランダム雑音においてプリエンファシスファクタを使用することによりランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行し、プリエンファシス励起信号を生成するために、音声度ファクタを使用することにより高帯域励起信号とプリエンファシス雑音とを重み付けし、合成励起信号を取得するために、プリエンファシス励起信号においてデエンファシスファクタを使用することによりプリエンファシス励起信号の高周波数部分を下げるためのデエンファシス動作を実行することを含んでもよい。
第1の態様及び前述の実装方法を参照して、第1の態様の他の実装方法では、デエンファシスファクタは、プリエンファシスファクタと、プリエンファシス励起信号におけるプリエンファシス雑音の割合とに基づいて決定されてもよい。
第1の態様及び前述の実装方法を参照して、第1の態様の他の実装方法では、低周波数符号化パラメータは、ピッチ期間を含んでもよく、合成励起信号を取得するために、音声度ファクタを使用することにより予測された高帯域励起信号とランダム雑音とを重み付けすることは、ピッチ期間を使用することにより音声度ファクタを変更し、合成励起信号を取得するために、変更された音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けすることを含んでもよい。
第1の態様及び前述の実装方法を参照して、第1の態様の他の実装方法では、低周波数符号化パラメータは、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間とを含んでもよく、低周波数符号化パラメータに従って高帯域励起信号を予測することは、ピッチ期間を使用することにより音声度ファクタを変更し、重み付け結果を取得するために、変更された音声度ファクタを使用することにより代数コードブックとランダム雑音とを重み付けし、高帯域励起信号を予測するために、重み付け結果及び代数コードブック利得の積と、適応コードブック及び適応コードブック利得の積とを加算することを含んでもよい。
第1の態様及び前述の実装方法を参照して、第1の態様の他の実装方法では、ピッチ期間を使用することにより音声度ファクタを変更することは、以下の式:
Figure 0006125031
に従って実行されてもよい。ただし、voice_facは音声度ファクタであり、T0はピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは変更された音声度ファクタである。
第1の態様及び前述の実装方法を参照して、第1の態様の他の実装方法では、オーディオ信号符号化方法は、符号化されたビットストリームをデコーダ側に送信するために、低周波数符号化パラメータと高周波数符号化パラメータとに従って符号化されたビットストリームを生成することを更に含んでもよい。
第2の態様によれば、オーディオ信号復号化方法が提供され、符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別し、低周波数符号化パラメータを復号化して低帯域信号を取得し、低周波数符号化パラメータに従って音声度ファクタを計算し、低周波数符号化パラメータに従って高帯域励起信号を予測し、音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用され、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けし、合成励起信号と高周波数符号化パラメータとに基づいて高帯域信号を取得し、低帯域信号と高帯域信号とを結合して最終的な復号化された信号を取得することを含む。
第2の態様を参照して、第2の態様の実装方法では、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けすることは、プリエンファシス雑音を取得するために、ランダム雑音においてプリエンファシスファクタを使用することによりランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行し、プリエンファシス励起信号を生成するために、音声度ファクタを使用することにより高帯域励起信号とプリエンファシス雑音とを重み付けし、合成励起信号を取得するために、プリエンファシス励起信号においてデエンファシスファクタを使用することによりプリエンファシス励起信号の高周波数部分を下げるためのデエンファシス動作を実行することを含んでもよい。
第2の態様及び前述の実装方法を参照して、第2の態様の他の実装方法では、デエンファシスファクタは、プリエンファシスファクタと、プリエンファシス励起信号におけるプリエンファシス雑音の割合とに基づいて決定されてもよい。
第2の態様及び前述の実装方法を参照して、第2の態様の他の実装方法では、低周波数符号化パラメータは、ピッチ期間を含んでもよく、合成励起信号を取得するために、音声度ファクタを使用することにより予測された高帯域励起信号とランダム雑音とを重み付けすることは、ピッチ期間を使用することにより音声度ファクタを変更し、合成励起信号を取得するために、変更された音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けすることを含んでもよい。
第2の態様及び前述の実装方法を参照して、第2の態様の他の実装方法では、低周波数符号化パラメータは、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間とを含んでもよく、低周波数符号化パラメータに従って高帯域励起信号を予測することは、ピッチ期間を使用することにより音声度ファクタを変更し、重み付け結果を取得するために、変更された音声度ファクタを使用することにより代数コードブックとランダム雑音とを重み付けし、高帯域励起信号を予測するために、重み付け結果及び代数コードブック利得の積と、適応コードブック及び適応コードブック利得の積とを加算することを含んでもよい。
第2の態様及び前述の実装方法を参照して、第2の態様の他の実装方法では、ピッチ期間を使用することにより音声度ファクタを変更することは、以下の式:
Figure 0006125031
に従って実行される。ただし、voice_facは音声度ファクタであり、T0はピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは変更された音声度ファクタである。
第3の態様によれば、オーディオ信号符号化装置が提供され、符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割するように構成された分割ユニットと、低帯域信号を符号化して低周波数符号化パラメータを取得するように構成された低周波数符号化ユニットと、低周波数符号化パラメータに従って音声度ファクタを計算するように構成された計算ユニットであり、音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用される計算ユニットと、低周波数符号化パラメータに従って高帯域励起信号を予測するように構成された予測ユニットと、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けするように構成された合成ユニットと、合成励起信号と高帯域信号とに基づいて高周波数符号化パラメータを取得するように構成された高周波数符号化ユニットとを含む。
第3の態様を参照して、第3の態様の実装方法では、合成ユニットは、プリエンファシス雑音を取得するために、ランダム雑音においてプリエンファシスファクタを使用することによりランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行するように構成されたプリエンファシス構成要素と、プリエンファシス励起信号を生成するために、音声度ファクタを使用することにより高帯域励起信号とプリエンファシス雑音とを重み付けするように構成された重み付け構成要素と、合成励起信号を取得するために、プリエンファシス励起信号においてデエンファシスファクタを使用することによりプリエンファシス励起信号の高周波数部分を下げるためのデエンファシス動作を実行するように構成されたデエンファシス構成要素とを含んでもよい。
第3の態様及び前述の実装方法を参照して、第3の態様の他の実装方法では、デエンファシスファクタは、プリエンファシスファクタと、プリエンファシス励起信号におけるプリエンファシス雑音の割合とに基づいて決定される。
第3の態様及び前述の実装方法を参照して、第3の態様の他の実装方法では、低周波数符号化パラメータは、ピッチ期間を含んでもよく、合成ユニットは、ピッチ期間を使用することにより音声度ファクタを変更するように構成された第1の変更構成要素と、合成励起信号を取得するために、変更された音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けするように構成された重み付け構成要素とを含んでもよい。
第3の態様及び前述の実装方法を参照して、第3の態様の他の実装方法では、低周波数符号化パラメータは、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間とを含んでもよく、予測ユニットは、ピッチ期間を使用することにより音声度ファクタを変更するように構成された第2の変更構成要素と、重み付け結果を取得するために、変更された音声度ファクタを使用することにより代数コードブックとランダム雑音とを重み付けし、高帯域励起信号を予測するために、重み付け結果及び代数コードブック利得の積と、適応コードブック及び適応コードブック利得の積とを加算するように構成された予測構成要素とを含んでもよい。
第3の態様及び前述の実装方法を参照して、第3の態様の他の実装方法では、第1の変更構成要素及び第2の変更構成要素のうち少なくとも1つは、以下の式:
Figure 0006125031
に従って音声度ファクタを変更してもよい。ただし、voice_facは音声度ファクタであり、T0はピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは変更された音声度ファクタである。
第3の態様及び前述の実装方法を参照して、第3の態様の他の実装方法では、オーディオ信号符号化装置は、符号化されたビットストリームをデコーダ側に送信するために、低周波数符号化パラメータと高周波数符号化パラメータとに従って符号化されたビットストリームを生成するように構成されたビットストリーム生成ユニットを更に含んでもよい。
第4の態様によれば、オーディオ信号復号化装置が提供され、符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別するように構成された区別ユニットと、低周波数符号化パラメータを復号化して低帯域信号を取得するように構成された低周波数復号化ユニットと、低周波数符号化パラメータに従って音声度ファクタを計算するように構成された計算ユニットであり、音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用される計算ユニットと、低周波数符号化パラメータに従って高帯域励起信号を予測するように構成された予測ユニットと、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けするように構成された合成ユニットと、合成励起信号と高周波数符号化パラメータとに基づいて高帯域信号を取得するように構成された高周波数復号化ユニットと、低帯域信号と高帯域信号とを結合して最終的な復号化された信号を取得するように構成された結合ユニットとを含む。
第4の態様を参照して、第4の態様の実装方法では、合成ユニットは、プリエンファシス雑音を取得するために、ランダム雑音においてプリエンファシスファクタを使用することによりランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行するように構成されたプリエンファシス構成要素と、プリエンファシス励起信号を生成するために、音声度ファクタを使用することにより高帯域励起信号とプリエンファシス雑音とを重み付けするように構成された重み付け構成要素と、合成励起信号を取得するために、プリエンファシス励起信号においてデエンファシスファクタを使用することによりプリエンファシス励起信号の高周波数部分を下げるためのデエンファシス動作を実行するように構成されたデエンファシス構成要素とを含んでもよい。
第4の態様及び前述の実装方法を参照して、第4の態様の他の実装方法では、デエンファシスファクタは、プリエンファシスファクタと、プリエンファシス励起信号におけるプリエンファシス雑音の割合とに基づいて決定される。
第4の態様及び前述の実装方法を参照して、第4の態様の他の実装方法では、低周波数符号化パラメータは、ピッチ期間を含んでもよく、合成ユニットは、ピッチ期間を使用することにより音声度ファクタを変更するように構成された第1の変更構成要素と、合成励起信号を取得するために、変更された音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けするように構成された重み付け構成要素とを含んでもよい。
第4の態様及び前述の実装方法を参照して、第4の態様の他の実装方法では、低周波数符号化パラメータは、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間とを含んでもよく、予測ユニットは、ピッチ期間を使用することにより音声度ファクタを変更するように構成された第2の変更構成要素と、重み付け結果を取得するために、変更された音声度ファクタを使用することにより代数コードブックとランダム雑音とを重み付けし、高帯域励起信号を予測するために、重み付け結果及び代数コードブック利得の積と、適応コードブック及び適応コードブック利得の積とを加算するように構成された予測構成要素とを含んでもよい。
第4の態様及び前述の実装方法を参照して、第4の態様の他の実装方法では、第1の変更構成要素及び第2の変更構成要素のうち少なくとも1つは、以下の式:
Figure 0006125031
に従って音声度ファクタを変更してもよい。ただし、voice_facは音声度ファクタであり、T0はピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは変更された音声度ファクタである。
第5の態様によれば、送信機が提供され、第3の態様によるオーディオ信号符号化装置と、ビットストリームを生成してビットストリームを送信するために、オーディオ信号符号化装置により生成された高周波数符号化パラメータ及び低周波数符号化パラメータのビット割り当てを実行するように構成された送信ユニットとを含む。
第6の態様によれば、受信機が提供され、ビットストリームを受信してビットストリームから符号化された情報を抽出するように構成された受信ユニットと、第4の態様によるオーディオ信号復号化装置とを含む。
第7の態様によれば、通信システムが提供され、第5の態様による送信機又は第6の態様による受信機を含む。
本発明の実施例の前述の技術的対策では、符号化及び復号化の間に、高帯域励起信号及びランダム雑音は、合成励起信号を取得するために、音声度ファクタを使用することにより重み付けされ、高帯域信号の特性が、音声信号に基づいてより正確に示され得る。これにより、符号化及び復号化効果を改善し得る。
本発明の実施例の技術的対策を更に明確に説明するために、実施例又は従来技術を説明するために必要な添付図面を簡単に紹介する。明らかに、以下の説明における添付図面は、本発明の単にいくつかの実施例を示しているに過ぎず、当業者は、依然として創造的取り組みを行うことなく、これらの図面から他の図面を導くことができる。
本発明の実施例によるオーディオ信号符号化方法の概略フローチャート 本発明の実施例によるオーディオ信号復号化方法の概略フローチャート 本発明の実施例によるオーディオ信号符号化装置の概略ブロック図 本発明の実施例によるオーディオ信号符号化装置における予測ユニット及び合成ユニットの概略ブロック図 本発明の実施例によるオーディオ信号復号化装置の概略ブロック図 本発明の実施例による送信機の概略ブロック図 本発明の実施例による受信機の概略ブロック図 本発明の実施例による装置の概略ブロック図
以下に、本発明の実施例の添付図面を参照して、本発明の実施例の技術的対策を明確且つ完全に説明する。明らかに、記載の実施例は、本発明の実施例の全てではなく、一部に過ぎない。創造的取り組みを行うことなく、本発明の実施例に基づいて当業者により得られる全ての他の実施例は、本発明の保護範囲内に入るものとする。
デジタル信号処理の分野では、様々な電子デバイス(例えば、移動電話、無線装置、パーソナルデジタルアシスタント(PDA:personal digital assistant)、ハンドヘルド又はポータブルコンピュータ、GPS受信機/ナビゲータ、カメラ、オーディオ/ビデオプレイヤ、ビデオカメラ、ビデオレコーダ及び監視デバイス)にオーディオコーデックが広く適用されている。一般的に、この種類の電子デバイスは、オーディオ信号の符号化及び復号化を実施するオーディオエンコーダ又はオーディオデコーダを含み、オーディオエンコーダ又はオーディオデコーダは、デジタル回路又はチップ(例えば、デジタルシグナルプロセッサ(DSP:digital signal processor))により直接実現されてもよく、ソフトウェアコードのプロセスを実行するようにプロセッサを駆動するソフトウェアコードを使用することにより実現されてもよい。
更に、オーディオコーデック並びにオーディオ符号化及び復号化方法はまた、GSM(登録商標)、符号分割多重アクセス(CDMA:Code Division Multiple Access)システム、広帯域符号分割多重アクセス(WCDMA(登録商標):Wideband Code Division Multiple Access)、GPRS(General Packet Radio Service)、及びLTE(Long Term Evolution)のような様々な通信システムに適用されてもよい。
図1は、本発明の実施例によるオーディオ信号符号化方法100の概略フローチャートである。オーディオ信号符号化方法は、符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割し(ステップ110)、低帯域信号を符号化して低周波数符号化パラメータを取得し(ステップ120)、低周波数符号化パラメータに従って音声度ファクタ(voiced degree factor)を計算し、低周波数符号化パラメータに従って高帯域励起信号を予測し、音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用され(ステップ130)、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けし(ステップ140)、合成励起信号と高帯域信号とに基づいて高周波数符号化パラメータを取得する(ステップ150)ことを含む。
ステップ110において、符号化される時間ドメイン信号は、低帯域信号と高帯域信号に分割される。分割は、低帯域信号と高帯域信号とが別々に処理され得るように、時間ドメイン信号を処理のために2つの信号に分割することである。分割は、いずれかの従来又は将来の分割技術を使用することにより実施されてもよい。ここでの低周波数の意味は、高周波数の意味に対して相対的なものである。例えば、周波数閾値が設定されてもよく、周波数閾値より低い周波数は低周波数であり、周波数閾値より高い周波数は高周波数である。実際には、周波数閾値は要件に従って設定されてもよく、信号における低帯域信号成分及び高帯域信号成分も、分割を実施するために、他の方法を使用することにより区別されてもよい。
ステップ120において、低帯域信号は、低周波数符号化パラメータを取得するように符号化される。符号化により、低帯域信号は、低周波数符号化パラメータを取得するように処理され、これにより、デコーダ側は、低周波数符号化パラメータに従って低帯域信号を復元する。低周波数符号化パラメータは、低帯域信号を復元するためにデコーダ側により必要とされるパラメータである。一例として、符号化は、ACELP(Algebraic Code Excited Linear Prediction)アルゴリズムを使用したエンコーダ(ACELPエンコーダ)を使用することにより実行されてもよく、この場合に取得される低周波数符号化パラメータは、例えば、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間とを含んでもよく、また、他のパラメータを含んでもよい。低周波数符号化パラメータは、低帯域信号を復元するためにデコーダ側に伝送される。更に、代数コードブック及び適応コードブックがエンコーダ側からデコーダ側に伝送される場合、代数コードブックインデックス及び適応コードブックインデックスが伝送されてもよく、デコーダ側は、復元を実施するために、代数コードブックインデックス及び適応コードブックインデックスに従って、対応する代数コードブック及び適応コードブックを取得する。
実際には、低帯域信号は、要件に従って適切な符号化技術を使用することにより符号化されてもよい。符号化技術が変化する場合、低周波数符号化パラメータの構成も変化してもよい。本発明のこの実施例では、ACELPアルゴリズムを使用した符号化技術が説明の一例として使用される。
ステップ130において、音声度ファクタは、低周波数符号化パラメータに従って計算され、高帯域励起信号は、低周波数符号化パラメータに従って予測される。音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用される。従って、ステップ130は、低周波数符号化パラメータから音声度ファクタと高帯域励起信号とを取得するために使用される。音声度ファクタ及び高帯域励起信号は、高帯域信号の異なる特性を示すために使用される。すなわち、入力信号の高周波数特性がステップ130において取得され、これにより、高周波数特性が、高帯域信号の符号化のために使用される。ACELPアルゴリズムを使用した符号化技術は、音声度ファクタと高帯域励起信号との双方の計算を説明するために、以下で一例として使用される。
音声度ファクタvoice_facは、以下の式(1):
Figure 0006125031
に従って計算されてもよい。ただし、eneradpは適応コードブックのエネルギーであり、enercbは代数コードブックのエネルギーであり、a、b及びcは予め設定された値である。パラメータa、b及びcは、以下の規則に従って設定される。voice_facの値は0と1との間であり、音声度ファクタvoice_facの特性がより良く示されるように、線形変化(liner change)のvoice_factorは非線形変化(non-linear change)のvoice_facに変化する。
更に、音声度ファクタvoice_facが高帯域信号の特性をより良く示すことを可能にするために、音声度ファクタは、低周波数符号化パラメータのピッチ期間を使用することにより更に変更されてもよい。一例として、式(1)の音声度ファクタvoice_facは、以下の式(2)に従って更に変更されてもよい。
Figure 0006125031
ただし、voice_facは音声度ファクタであり、T0はピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは変更された音声度ファクタである。一例として、式(2)の全てのパラメータの値は以下の通りでもよい。a1=0.0126、b1=1.23、a2=0.0087、b2=0、threshold_min=57.75、及びthreshold_max=115.5。パラメータ値は単なる例であり、要件に従って他の値が設定されてもよい。変更されていない音声度ファクタに比べて、変更された音声度ファクタは、高帯域信号により示される音声特性の程度を更に正確に示すことができ、これにより、一般的な期間の音声信号が拡張された後に導入される機械音を弱めるのに役立ち得る。
高帯域励起信号Exは、以下の式(3)又は式(4)に従って計算されてもよい。
Figure 0006125031
Figure 0006125031
ただし、FixCBは代数コードブックであり、シードはランダム雑音であり、gcは代数コードブック利得であり、AdpCBは適応コードブックであり、gaは適応コードブック利得である。式(3)又は(4)において、代数コードブックFixCB及びランダム雑音のシードは、重み付け結果を取得するために、音声度ファクタを使用することにより重み付けされることが分かり得る。高帯域励起信号Exを取得するために、重み付け結果及び代数コードブック利得gcの積と、適応コードブックAdpCB及び適応コードブック利得gaの積とが加算される。或いは、式(3)又は(4)において、音声度ファクタvoice_facは、高帯域信号により示される音声特性の程度を更に正確に示すために、式(2)の変更された音声度ファクタvoice_fac_Aで置換されてもよい。すなわち、音声信号の高帯域信号は、更に現実的に示され、これにより、符号化効果を改善する。
音声度ファクタ及び高帯域励起信号を計算する前述の方法は単なる例であり、本発明のこの実施例を限定することを意図するものではない点に留意すべきである。ACELPアルゴリズムを使用しない他の符号化技術では、音声度ファクタ及び高帯域励起信号は、他の方法を使用することにより計算されてもよい。
ステップ140において、高帯域励起信号及びランダム雑音は、合成励起信号を取得するために、音声度ファクタを使用することにより重み付けされる。前述のように、従来技術では、一般的な期間の音声信号では、低周波数符号化パラメータに従って予測された高帯域励起信号の周期が極めて強いため、復元されたオーディオ信号の音が出るときに強い機械音が存在する。ステップ140により、低帯域信号及び雑音に従って予測された高帯域励起信号は、音声度ファクタを使用することにより重み付けされる。このことは、低周波数符号化パラメータに従って予測された高帯域励起信号の周期を弱めることができ、これにより、復元されたオーディオ信号における機械音を弱めることができる。
の計算を説明するために、以下で一例として使用される。
重み付けは、要件に従って適切な重みを使用することにより実施されてもよい。一例として、合成励起信号SExは以下の式(5)に従って取得されてもよい。
Figure 0006125031
ただし、Exは高帯域励起信号であり、シードはランダム雑音であり、voice_facは音声度ファクタであり、pow1は高帯域励起信号のエネルギーであり、pow2はランダム雑音のエネルギーである。或いは、式(5)において、音声度ファクタvoice_facは、音声信号の高帯域信号を更に正確に示すために、式(2)の変更された音声度ファクタvoice_fac_Aで置換されてもよく、これにより、符号化効果を改善してもよい。式(2)においてa1=0.0126、b1=1.23、 a2=0.0087、b2=0、threshold_min=57.75、及びthreshold_max=115.5であり、合成励起信号SExが式(5)に従って取得される場合、ピッチ期間T0がthreshold_maxより大きくthreshold_minより小さい高帯域励起信号は、大きい重みを有し、他の高帯域励起信号は小さい重みを有する。要件に従って、合成励起信号はまた、式(5)に加えて他の方法を使用することにより計算されてもよい点に留意すべきである。
更に、高帯域励起信号及びランダム雑音が音声度ファクタを使用することにより重み付けされる場合、事前にランダム雑音においてプリエンファシスが実行されてもよく、重み付けの後にランダム雑音においてデエンファシスが実行されてもよい。特に、ステップ140は、プリエンファシス雑音を取得するために、ランダム雑音においてプリエンファシスファクタを使用することによりランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行し、プリエンファシス励起信号を生成するために、音声度ファクタを使用することにより高帯域励起信号とプリエンファシス雑音とを重み付けし、合成励起信号を取得するために、プリエンファシス励起信号においてデエンファシスファクタを使用することによりプリエンファシス励起信号の高周波数部分を下げるためのデエンファシス動作を実行することを含んでもよい。一般的な有声音では、雑音成分は、通常では低周波数から高周波数に強くなる。このことに基づいて、プリエンファシス動作は、有声音の雑音信号特性を正確に示すために、ランダム雑音において実行される。すなわち、雑音の高周波数部分が改善され、雑音の低周波数部分が下げられる。プリエンファシス動作の一例として、プリエンファシス動作は、以下の式(6)を使用することによりランダム雑音seed(n)で実行されてもよい。
Figure 0006125031
ただし、n=1,2,...Nであり、αはプリエンファシスファクタであり、0<α<1である。プリエンファシスファクタは、有声音の雑音信号特性を正確に示すために、ランダム雑音の特性に基づいて適切に設定されてもよい。プリエンファシス動作が式(6)を使用することにより実行される場合、デエンファシス動作は、以下の式(7)を使用することによりプリエンファシス励起信号S(i)で実行されてもよい。
Figure 0006125031
ただし、n=1,2,...Nであり、βはデエンファシスファクタである。前述の式(6)に示すプリエンファシス動作は単なる例であり、実際には、プリエンファシスは他の方法を使用することにより実行されてもよい点に留意すべきである。更に、使用されるプリエンファシス動作が変化する場合、デエンファシス動作も対応して変化する必要がある。デエンファシスファクタβは、プリエンファシスファクタαと、プリエンファシス励起信号におけるプリエンファシス雑音の割合とに基づいて決定されてもよい。一例として、高帯域励起信号及びプリエンファシス雑音が音声度ファクタを使用することにより式(5)に従って重み付けされる場合(この場合、プリエンファシス励起信号が取得され、デエンファシスがプリエンファシス励起信号で実行された後にのみ合成励起信号が取得される)、デエンファシスファクタβは、以下の式(8)又は式(9)に従って決定されてもよい。
Figure 0006125031
Figure 0006125031
ステップ150において、高周波数符号化パラメータは、合成励起信号と高帯域信号とに基づいて取得される。一例として、高周波数符号化パラメータは、高周波数利得パラメータと、高周波数LPC係数とを含む。高周波数LPC係数は、元の信号の高帯域信号でLPC分析を実行することにより取得されてもよい。予測された高帯域信号は、高帯域励起信号がLPC係数に従って決定された合成フィルタを使用することによりフィルタリングされた後に取得される。高周波数利得パラメータは、予測された高帯域信号と元の信号の高帯域信号とを比較することにより取得される。高周波数利得パラメータ及びLPC係数は、高帯域信号を復元するためにデコーダ側に伝送される。更に、高周波数符号化パラメータはまた、様々な従来又は将来の技術を使用することにより取得されてもよく、合成励起信号と高帯域信号とに基づいて高周波数符号化パラメータを取得する特定の方法は、本発明への限定を構成するものではない。低周波数符号化パラメータ及び高周波数符号化パラメータが取得された後に、信号の符号化が実施され、これにより、信号が復元のためにデコーダ側に伝送され得る。
低周波数符号化パラメータ及び高周波数符号化パラメータが取得された後に、オーディオ信号符号化方法100は、符号化されたビットストリームをデコーダ側に送信するために、低周波数符号化パラメータと高周波数符号化パラメータとに従って符号化されたビットストリームを生成することを更に含んでもよい。
本発明のこの実施例の前述のオーディオ信号符号化方法では、高帯域励起信号及びランダム雑音は、合成励起信号を取得するために、音声度ファクタを使用することにより重み付けされ、高帯域信号の特性が、音声信号に基づいてより正確に示され得る。これにより、符号化効果を改善し得る。
図2は、本発明の実施例によるオーディオ信号復号化方法200の概略フローチャートである。オーディオ信号復号化方法は、符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別し(ステップ210)、低周波数符号化パラメータを復号化して低帯域信号を取得し(ステップ220)、低周波数符号化パラメータに従って音声度ファクタを計算し、低周波数符号化パラメータに従って高帯域励起信号を予測し、音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用され(ステップ230)、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けし(ステップ240)、合成励起信号と高周波数符号化パラメータとに基づいて高帯域信号を取得し(ステップ250)、低帯域信号と高帯域信号とを結合して最終的な復号化された信号を取得する(ステップ260)ことを含む。
ステップ210において、低周波数符号化パラメータ及び高周波数符号化パラメータは、符号化された情報において区別される。低周波数符号化パラメータ及び高周波数符号化パラメータは、エンコーダ側から伝送され、低帯域信号と高帯域信号とを復元するために使用されるパラメータである。低周波数符号化パラメータは、例えば、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間と、他のパラメータを含んでもよく、高周波数符号化パラメータは、例えば、LPC係数と、高周波数利得パラメータと、他のパラメータとを含んでもよい。更に、低周波数符号化パラメータ及び高周波数符号化パラメータは、代替として異なる符号化技術に従って他のパラメータを含んでもよい。
ステップ220において、低周波数符号化パラメータは、低帯域信号を取得するために復号化される。特定の復号化モードは、エンコーダ側の符号化方法に対応する。一例として、符号化がエンコーダ側でACELPアルゴリズムを使用したACELPエンコーダを使用することにより実行される場合、ステップ220において低帯域信号を取得するためにACELPデコーダが使用される。
ステップ230において、音声度ファクタは、低周波数符号化パラメータに従って計算され、高帯域励起信号は、低周波数符号化パラメータに従って予測される。音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用される。ステップ230は、高周波数特性が高帯域信号の復号化(又は復元)に使用されるように、低周波数符号化パラメータに従って符号化された信号の高周波数特性を取得するために使用される。ACELPアルゴリズムを使用した符号化技術に対応する復号化技術が以下の説明において一例として使用される。
音声度ファクタvoice_facは、前述の式(1)に従って計算されてもよく、高帯域信号の特性をより良く示すために、音声度ファクタvoice_facは、低周波数符号化パラメータのピッチ期間を使用することにより、前述の式(2)に示すように変更されてもよく、変更された音声度ファクタvoice_fac_Aが取得されてもよい。変更されていない音声度ファクタvoice_facに比べて、変更された音声度ファクタvoice_fac_Aは、高帯域信号により示される音声特性の程度を更に正確に示すことができ、これにより、一般的な期間の音声信号が拡張された後に導入される機械音を弱めるのに役立ち得る。
高帯域励起信号Exは、前述の式(3)又は式(4)に従って計算されてもよい。すなわち、代数コードブック及びランダム雑音は、重み付け結果を取得するために、音声度ファクタを使用することにより重み付けされ、高帯域励起信号Exを取得するために、重み付け結果及び代数コードブック利得の積と、適応コードブック及び適応コードブック利得の積とが加算される。同様に、音声度ファクタvoice_facは、復号化効果を更に改善するために、式(2)の変更された音声度ファクタvoice_fac_Aで置換されてもよい。
音声度ファクタ及び高帯域励起信号を計算する前述の方法は単なる例であり、本発明のこの実施例を限定することを意図するものではない点に留意すべきである。ACELPアルゴリズムを使用しない他の符号化技術では、音声度ファクタ及び高帯域励起信号は、他の方法を使用することにより計算されてもよい。
ステップ230の説明については、図1を参照したステップ130の前述の説明を参照されたい。
ステップ240において、高帯域励起信号及びランダム雑音は、合成励起信号を取得するために、音声度ファクタを使用することにより重み付けされる。ステップ240により、低周波数符号化パラメータ及び雑音に従って予測された高帯域励起信号は、音声度ファクタを使用することにより重み付けされる。このことは、低周波数符号化パラメータに従って予測された高帯域励起信号の周期を弱めることができ、これにより、復元されたオーディオ信号における機械音を弱めることができる。
一例として、ステップ240において、合成励起信号SEexは、前述の式(5)に従って取得されてもよく、式(5)の音声度ファクタvoice_facは、音声信号の高帯域信号を更に正確に示すために、式(2)の変更された音声度ファクタvoice_fac_Aで置換されてもよく、これにより、符号化効果を改善してもよい。要件に従って、合成励起信号はまた、他の方法を使用することにより計算されてもよい。
更に、高帯域励起信号及びランダム雑音が音声度ファクタvoice_fac(又は変更された音声度ファクタvoice_fac_A)を使用することにより重み付けされる場合、事前にランダム雑音においてプリエンファシスが実行されてもよく、重み付けの後にランダム雑音においてデエンファシスが実行されてもよい。特に、ステップ240は、プリエンファシス雑音を取得するために、ランダム雑音においてプリエンファシスファクタαを使用することによりランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行し(例えば、プリエンファシス動作は式(6)を使用することにより実施される)、プリエンファシス励起信号を生成するために、音声度ファクタを使用することにより高帯域励起信号とプリエンファシス雑音とを重み付けし、合成励起信号を取得するために、プリエンファシス励起信号においてデエンファシスファクタβを使用することによりプリエンファシス励起信号の高周波数部分を下げるためのデエンファシス動作を実行する(例えば、デエンファシス動作は式(7)を使用することにより実施される)ことを含んでもよい。プリエンファシスファクタαは、有声音の雑音信号特性を更に正確に示すために、要件に従って予め選択されてもよい。すなわち、雑音の高周波数部分は強い信号を有し、雑音の低周波数部分は弱い信号を有する。更に、他の種類の雑音が使用されてもよく、この場合、プリエンファシスファクタαは、一般的な有声音の雑音特性を示すために、対応して変化する必要がある。デエンファシスファクタβは、プリエンファシスファクタαと、プリエンファシス励起信号におけるプリエンファシス雑音の割合とに基づいて決定されてもよい。一例として、デエンファシスファクタβは、前述の式(8)又は式(9)に従って決定されてもよい。
ステップ240の説明については、図1を参照したステップ140の前述の説明を参照されたい。
ステップ250において、高帯域信号は、合成励起信号と高周波数符号化パラメータとに基づいて取得される。ステップ250は、エンコーダ側における合成励起信号と高帯域信号とに基づいて高周波数符号化パラメータを取得する逆の処理で実施される。一例として、高周波数符号化パラメータは、高周波数利得パラメータと高周波数LPC係数とを含む。合成フィルタは、高周波数符号化パラメータのLPC係数を使用することにより生成されてもよい。予測された高帯域信号は、ステップ240において取得された合成励起信号が合成フィルタによりフィルタリングされた後に復元される。最終的な高帯域信号は、予測された高帯域信号が高周波数符号化パラメータの高周波数利得パラメータを使用することにより調整された後に取得される。更に、ステップ240は、様々な従来又は将来の技術を使用することにより実施されてもよく、合成励起信号と高周波数符号化パラメータとに基づいて高帯域信号を取得する特定の方法は、本発明への限定を構成するものではない。
ステップ260において、低帯域信号及び高帯域信号は、最終的な復号化された信号を取得するために結合される。この結合方法は、図1のステップ110における分割方法に対応し、これにより、最終的な出力信号を取得するために復号化が実施される。
本発明のこの実施例の前述のオーディオ信号復号化方法では、高帯域励起信号及びランダム雑音は、合成励起信号を取得するために、音声度ファクタを使用することにより重み付けされ、高帯域信号の特性が、音声信号に基づいてより正確に示され得る。これにより、復号化効果を改善し得る。
図3は、本発明の実施例によるオーディオ信号符号化装置300の概略ブロック図である。オーディオ信号符号化装置300は、符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割するように構成された分割ユニット310と、低帯域信号を符号化して低周波数符号化パラメータを取得するように構成された低周波数符号化ユニット320と、低周波数符号化パラメータに従って音声度ファクタを計算するように構成された計算ユニット330であり、音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用される計算ユニット330と、低周波数符号化パラメータに従って高帯域励起信号を予測するように構成された予測ユニット340と、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けするように構成された合成ユニット350と、合成励起信号と高帯域信号とに基づいて高周波数符号化パラメータを取得するように構成された高周波数符号化ユニット360とを含む。
入力された時間ドメイン信号を受信した後に、分割ユニット310は、いずれかの従来又は将来の分割技術を使用することにより、分割を実施してもよい。ここでの低周波数の意味は、高周波数の意味に対して相対的なものである。例えば、周波数閾値が設定されてもよく、周波数閾値より低い周波数は低周波数であり、周波数閾値より高い周波数は高周波数である。実際には、周波数閾値は要件に従って設定されてもよく、信号における低帯域信号成分及び高帯域信号成分も、分割を実施するために、他の方法を使用することにより区別されてもよい。
低周波数符号化ユニット320は、例えば、ACELPアルゴリズムを使用したACELPエンコーダを使用することにより符号化を実行してもよく、この場合に取得される低周波数符号化パラメータは、例えば、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間とを含んでもよく、また、他のパラメータを含んでもよい。実際には、低帯域信号は、要件に従って適切な符号化技術を使用することにより符号化されてもよい。符号化技術が変化する場合、低周波数符号化パラメータの構成も変化してもよい。取得された低周波数符号化パラメータは、低帯域信号を復元するために必要となるパラメータであり、低帯域信号を復元するためにデコーダに伝送される。
計算ユニット330は、低周波数符号化パラメータに従って、符号化された信号の高周波数特性を示すために使用されるパラメータ、すなわち、音声度ファクタを計算する。特に、計算ユニット330は、低周波数符号化ユニット320を使用することにより取得された低周波数符号化パラメータに従って音声度ファクタvoice_facを計算し、例えば、前述の式(1)に従って音声度ファクタvoice_facを計算してもよい。音声度ファクタは、合成励起信号を取得するために使用される。合成励起信号は、高帯域信号の符号化のために、高周波数符号化ユニット360に伝送される。図4は、本発明の実施例によるオーディオ信号符号化装置の予測ユニット340及び合成ユニット350の概略ブロック図である。
予測ユニット340は、図4の予測構成要素460を単に含んでもよく、図4の第2の変更構成要素450と予測構成要素460との双方を含んでもよい。
高帯域信号の特性をより良く示すために、一般的な期間の音声信号が拡張された後に導入される機械音を弱めるため、例えば、第2の変更構成要素450は、前述の式(2)に従って低周波数符号化パラメータのピッチ期間T0を使用することにより音声度ファクタvoice_facを変更し、変更された音声度ファクタvoice_fac_A2を取得する。
例えば、予測構成要素460は、前述の式(3)又は式(4)に従って高帯域励起信号Exを計算する。すなわち、予測構成要素460は、重み付け結果を取得するために、変更された音声度ファクタvoice_fac_A2を使用することにより低周波数符号化パラメータの代数コードブックとランダム雑音とを重み付けし、高帯域励起信号Exを取得するために、重み付け結果及び代数コードブック利得の積と、適応コードブック及び適応コードブック利得の積とを加算する。予測構成要素460はまた、重み付け結果を取得するために、計算ユニット330により計算された音声度ファクタvoice_facを使用することにより低周波数符号化パラメータの代数コードブックとランダム雑音とを重み付けしてもよい。この場合、第2の変更構成要素450は省略されてもよい。予測構成要素460は、他の方法を使用することにより高帯域励起信号Exを計算してもよい。
一例として、合成ユニット350は、図4のプリエンファシス構成要素410と、重み付け構成要素420と、デエンファシス構成要素430とを含んでもよく、図4の第1の変更構成要素440と重み付け構成要素420とを含んでもよく、更に、プリエンファシス構成要素410と、重み付け構成要素420と、デエンファシス構成要素430と、第1の変更構成要素440とを含んでもよい。
例えば、式(6)を使用することにより、プリエンファシス構成要素410は、プリエンファシス雑音PEnoiseを取得するために、ランダム雑音においてプリエンファシスファクタαを使用することによりランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行する。ランダム雑音は、予測構成要素460に入力されるランダム雑音と同じでもよい。プリエンファシスファクタαは、有声音の雑音信号特性を更に正確に示すために、要件に従って予め選択されてもよい。すなわち、雑音の高周波数部分は強い信号を有し、雑音の低周波数部分は弱い信号を有する。他の種類の雑音が使用される場合、プリエンファシスファクタαは、一般的な有声音の雑音特性を示すために、対応して変化する必要がある。
重み付け構成要素420は、プリエンファシス励起信号PEExを生成するために、変更された音声度ファクタvoice_fac_A1を使用することにより、予測構成要素460からの高帯域励起信号Exとプリエンファシス構成要素410からのプリエンファシス雑音PEnoiseとを重み付けするように構成される。一例として、重み付け構成要素420は、前述の式(5)に従ってプリエンファシス励起信号PEExを取得してもよく(変更された音声度ファクタvoice_fac_A1が音声度ファクタvoice_facと置換するために使用される)、他の方法を使用することによりプリエンファシス励起信号を計算してもよい。変更された音声度ファクタvoice_fac_A1は、第1の変更構成要素440を使用することにより生成される。第1の変更構成要素440は、変更された音声度ファクタvoice_fac_A1を取得するために、ピッチ期間を使用することにより音声度ファクタを変更する。第1の変更構成要素440により実行される変更動作は、第2の変更構成要素450により実行される変更動作と同じでもよく、第2の変更構成要素450の変更動作と異なってもよい。すなわち、第1の変更構成要素440は、前述の式(2)に加えて他の式を使用することにより、ピッチ期間に基づいて音声度ファクタvoice_facを変更してもよい。
例えば、式(7)を使用することにより、デエンファシス構成要素430は、合成励起信号SExを取得するために、重み付け構成要素420からのプリエンファシス励起信号PEExにおいてデエンファシスファクタβを使用することにより、プリエンファシス励起信号PEExの高周波数部分を下げるためのデエンファシス動作を実行する。デエンファシスファクタβは、プリエンファシスファクタαと、プリエンファシス励起信号におけるプリエンファシス雑音の割合とに基づいて決定されてもよい。一例として、デエンファシスファクタβは、前述の式(8)又は式(9)に従って決定されてもよい。
前述のように、変更された音声度ファクタvoice_fac_A1又はvoice_fac_A2を置換するために、計算ユニット330により出力された音声度ファクタvoice_facは、重み付け構成要素420若しくは予測構成要素460又は双方に提供されてもよい。更に、プリエンファシス構成要素410及びデエンファシス構成要素430は削除されてもよく、重み付け構成要素420が、合成励起信号を取得するために、変更された音声度ファクタ(又は音声度ファクタvoice_fac)を使用することにより高帯域励起信号Exとランダム雑音とを重み付けする。
予測ユニット340又は合成ユニット350の説明については、図1を参照した130及び140の前述の説明を参照されたい。
高周波数符号化ユニット360は、合成励起信号SExと分割ユニット310からの高帯域信号とに基づいて高周波数符号化パラメータを取得する。一例として、高周波数符号化ユニット360は、高帯域信号でLPC分析を実行することにより高周波数LPC係数を取得し、高帯域励起信号がLPC係数に従って決定された合成フィルタを使用することによりフィルタリングされた後に、予測された高帯域信号を取得し、予測された高帯域信号と分割ユニット310からの高帯域信号とを比較することにより高周波数利得パラメータを取得する。高周波数利得パラメータ及びLPC係数は、高周波数符号化パラメータの構成要素である。更に、高周波数符号化ユニット360はまた、様々な従来又は将来の技術を使用することにより高周波数符号化パラメータを取得してもよく、合成励起信号と高帯域信号とに基づいて高周波数符号化パラメータを取得する特定の方法は、本発明への限定を構成するものではない。低周波数符号化パラメータ及び高周波数符号化パラメータが取得された後に、信号の符号化が実施され、これにより、信号が復元のためにデコーダ側に伝送され得る。
任意選択で、オーディオ信号符号化装置300は、符号化されたビットストリームをデコーダ側に送信するために、低周波数符号化パラメータと高周波数符号化パラメータとに従って符号化されたビットストリームを生成するように構成されたビットストリーム生成ユニット370を更に含んでもよい。
図3に示すオーディオ信号符号化装置の各ユニットにより実行される動作については、図1のオーディオ信号符号化方法を参照した説明を参照されたい。
本発明のこの実施例の前述のオーディオ信号符号化装置では、合成ユニット350は、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けし、高帯域信号の特性が、音声信号に基づいてより正確に示され得る。これにより、符号化効果を改善し得る。
図5は、本発明の実施例によるオーディオ信号復号化装置500の概略ブロック図である。オーディオ信号復号化装置500は、符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別するように構成された区別ユニット510と、低周波数符号化パラメータを復号化して低帯域信号を取得するように構成された低周波数復号化ユニット520と、低周波数符号化パラメータに従って音声度ファクタを計算するように構成された計算ユニット530であり、音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用される計算ユニット530と、低周波数符号化パラメータに従って高帯域励起信号を予測するように構成された予測ユニット540と、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けするように構成された合成ユニット550と、合成励起信号と高周波数符号化パラメータとに基づいて高帯域信号を取得するように構成された高周波数復号化ユニット560と、低帯域信号と高帯域信号とを結合して最終的な復号化された信号を取得するように構成された結合ユニット570とを含む。
符号化された信号を受信した後に、区別ユニット510は、低周波数復号化ユニット520のために符号化された信号における低周波数符号化パラメータを提供し、高周波数復号化ユニット560のために符号化された信号における高周波数符号化パラメータを提供する。低周波数符号化パラメータ及び高周波数符号化パラメータは、エンコーダ側から伝送され、低帯域信号と高帯域信号とを復元するために使用されるパラメータである。低周波数符号化パラメータは、例えば、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間と、他のパラメータを含んでもよく、高周波数符号化パラメータは、例えば、LPC係数と、高周波数利得パラメータと、他のパラメータとを含んでもよい。
低周波数復号化ユニット520は、低帯域信号を取得するために低周波数符号化パラメータを復号化する。特定の復号化モードは、エンコーダ側の符号化方法に対応する。更に、低周波数復号化ユニット520は、計算ユニット530及び予測ユニット540のために代数コードブック、代数コードブック利得、適応コードブック、適応コードブック利得又はピッチ期間のような低周波数符号化パラメータを更に提供する。計算ユニット530及び予測ユニット540は、区別ユニット510から必要な低周波数符号化パラメータを直接取得してもよい。
計算ユニット530は、低周波数符号化パラメータに従って音声度ファクタを計算するように構成される。音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用される。特に、計算ユニット530は、低周波数復号化ユニット520を使用することにより取得された低周波数符号化パラメータに従って音声度ファクタvoice_facを計算してもよく、例えば、計算ユニット530は、前述の式(1)に従って音声度ファクタvoice_facを計算してもよい。音声度ファクタは、合成励起信号を取得するために使用される。合成励起信号は、高帯域信号を取得するために高周波数復号化ユニット560に伝送される。
予測ユニット540及び合成ユニット550は、それぞれ図3のオーディオ信号符号化装置300の予測ユニット340及び合成ユニット350と同じである。従って、予測ユニット540及び合成ユニット550の構成については、図4の説明を参照されたい。例えば、1つの実装では、予測ユニット540は、第2の変更構成要素450と予測構成要素460との双方を含む。他の実装では、予測ユニット540は、単に予測構成要素460を含む。合成ユニット550については、1つの実装では、合成ユニット550は、プリエンファシス構成要素410と、重み付け構成要素420と、デエンファシス構成要素430とを含む。他の実装では、合成ユニット550は、第1の変更構成要素440と重み付け構成要素420とを含む。更に他の実装では、合成ユニット550は、プリエンファシス構成要素410と、重み付け構成要素420と、デエンファシス構成要素430と、第1の変更構成要素440とを含む。
高周波数復号化ユニット560は、合成励起信号と高周波数符号化パラメータとに基づいて高帯域信号を取得する。高周波数復号化ユニット560は、オーディオ信号符号化装置300の高周波数符号化ユニットの符号化技術に対応する復号化技術を使用することにより復号化を実行する。一例として、高周波数復号化ユニット560は、高周波数符号化パラメータのLPC係数を使用することにより合成フィルタを生成し、合成ユニット550からの合成励起信号が合成フィルタを使用することによりフィルタリングされた後に、予測された高帯域信号を復元し、予測された高帯域信号が高周波数符号化パラメータの高周波数利得パラメータを使用することにより調整された後に、最終的な高帯域信号を取得する。更に、高周波数復号化ユニット560はまた、様々な従来又は将来の技術を使用することにより実施されてもよく、特定の復号化技術は本発明への限定を構成するものではない。
結合ユニット570は、低帯域信号と高帯域信号とを結合し、最終的な復号化された信号を取得する。結合ユニット570の結合方法は、図3において分割ユニット310が分割動作を実行する分割方法に対応し、これにより、最終的な出力信号を取得するために復号化が実施される。
本発明のこの実施例の前述のオーディオ信号復号化装置では、高帯域励起信号及びランダム雑音は、合成励起信号を取得するために、音声度ファクタを使用することにより重み付けされ、高帯域信号の特性が、音声信号に基づいてより正確に示され得る。これにより、復号化効果を改善し得る。
図6は、本発明の実施例による送信機600の概略ブロック図である。図6の送信機600は、図3に示すオーディオ信号符号化装置300を含んでもよく、従って、繰り返しの説明は適宜省略される。更に、送信機600は、ビットストリームを生成してビットストリームを送信するために、オーディオ信号符号化装置300により生成された高周波数符号化パラメータ及び低周波数符号化パラメータのビット割り当てを実行するように構成された送信ユニット610を更に含んでもよい。
図7は、本発明の実施例による受信機700の概略ブロック図である。図7の受信機700は、図5に示すオーディオ信号復号化装置500を含んでもよく、従って、繰り返しの説明は適宜省略される。更に、受信機700は、処理のためにオーディオ信号復号化装置500のために符号化された信号を提供するために、符号化された信号を受信する受信ユニット710を更に含んでもよい。
本発明の他の実施例では、通信システムが更に提供され、通信システムは、図6を参照して説明した送信機600又は図7を参照して説明した受信機700を含んでもよい。
図8は、本発明の他の実施例による装置の概略ブロック図である。図8の装置800は、前述の方法の実施例のステップ及び方法を実施するように構成されてもよい。装置800は、様々な通信システムにおける基地局又は端末に適用されてもよい。図8の実施例では、装置800は、送信回路802と、受信回路803と、符号化プロセッサ804と、復号化プロセッサ805と、処理ユニット806と、メモリ807と、アンテナ801とを含む。処理ユニット806は、装置800の動作を制御し、処理ユニット806はまた、中央処理装置(CPU:Central Processing Unit)と呼ばれてもよい。メモリ807は、読み取り専用メモリとランダムアクセスメモリとを含んでもよく、処理ユニット806のための命令及びデータを提供する。メモリ807の一部は、不揮発性ランダムアクセスメモリ(NVRAM:nonvolatile random access memory)を更に含んでもよい。特定の用途では、装置800は、移動電話のような無線通信デバイス内に構築されてもよく、装置800自体が無線通信デバイスでもよい。装置800は、装置800と遠隔位置との間のデータ送信及び受信を可能にするために、送信回路802と受信回路803とを収容するキャリアを更に含んでもよい。送信回路802及び受信回路803は、アンテナ801に結合されてもよい。装置800の構成要素は、バスシステム809を使用することにより一緒に結合される。データバスに加えて、バスシステム809は、電力バスと、制御バスと、状態信号バスとを更に含む。しかし、説明を簡潔にするため、様々なバスは図面においてバスシステム809として示される。装置800は、信号を処理する処理ユニット806を更に含んでもよく、更に、装置800は、符号化プロセッサ804と復号化プロセッサ805とを更に含む。
本発明の前述の実施例に開示されたオーディオ信号符号化方法は、符号化プロセッサ804に適用されてもよく、符号化プロセッサ804により実施されてもよい。本発明の前述の実施例に開示されたオーディオ信号復号化方法は、復号化プロセッサ805に適用されてもよく、復号化プロセッサ805により実施されてもよい。符号化プロセッサ804及び復号化プロセッサ805は、集積回路チップでもよく、信号処理機能を有する。実施プロセスにおいて、前述の方法は、符号化プロセッサ804又は復号化プロセッサ805のハードウェアの集積論理回路を用いて行われてもよく、ソフトウェアの形式の命令を用いて行われてもよい。これらの命令は、プロセッサ806と協力することにより実施又は制御されてもよい。本発明の実施例に開示された方法を実行するように構成された前述の復号化プロセッサは、汎用プロセッサ、デジタルシグナルプロセッサ(DSP:digital signal processor)、特定用途向け集積回路(ASIC:application specific integrated circuit)、フィールドプログラマブルゲートアレイ(FPGA:field programmable gate array)若しくは他のプログラム可能な論理コンポーネント、ディスクリート・ゲート(discrete gate)若しくはトランジスタ論理コンポーネント、又はディスクリート・ハードウェア・アセンブリでもよい。復号化プロセッサは、本発明の実施例に開示された方法、ステップ及び論理ブロック図を実施又は実行してもよい。汎用プロセッサは、マイクロプロセッサでもよく、プロセッサはまた、いずれかの従来のプロセッサ、変換器等でもよい。本発明の実施例を参照して開示された方法のステップは、ハードウェア復号化プロセッサを使用することにより直接実行されて行われてもよく、復号化プロセッサのハードウェアモジュール及びソフトウェアモジュールの組み合わせを使用することにより実行されて行われてもよい。ソフトウェアモジュールは、ランダムアクセスメモリ、フラッシュメモリ、読み取り専用メモリ、プログラム可能読み取り専用メモリ、電気的消去可能プログラム可能メモリ、又はレジスタのような当該技術分野において成熟した記憶媒体に存在してもよい。記憶媒体は、メモリ807に存在し、符号化プロセッサ804又は復号化プロセッサ805はメモリ807からの情報を読み取り、符号化プロセッサ804又は復号化プロセッサ805のハードウェアと組み合わせて前述の方法を行う。例えば、メモリ807は、符号化又は復号化の間に使用するため、符号化プロセッサ804又は復号化プロセッサ805のために低周波数符号化パラメータを提供するため、取得された低周波数符号化パラメータを格納してもよい。
例えば、図3のオーディオ信号符号化装置300は、符号化プロセッサ804により実装されてもよく、図5のオーディオ信号復号化装置500は、復号化プロセッサ805により実装されてもよい。更に、図4の予測ユニット及び合成ユニットは、プロセッサ806により実装されてもよく、符号化プロセッサ804又は復号化プロセッサ805により実装されてもよい。
更に、例えば、図6の送信機610は、符号化プロセッサ804、送信回路802、アンテナ801等により実装されてもよい。図7の受信機710は、アンテナ801、受信回路803、復号化プロセッサ805等により実装されてもよい。しかし、前述の例は単なる例であり、本発明の実施例をこの特定の実装形式に限定することを意図するものではない。
特に、メモリ807は、プロセッサ806及び/又は符号化プロセッサ804が以下の動作、すなわち、符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割し、低帯域信号を符号化して低周波数符号化パラメータを取得し、低周波数符号化パラメータに従って音声度ファクタを計算し、低周波数符号化パラメータに従って高帯域励起信号を予測し、音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用され、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けし、合成励起信号と高帯域信号とに基づいて高周波数符号化パラメータを取得することを実施可能にする命令を格納する。メモリ807は、プロセッサ806又は復号化プロセッサ805が以下の動作、すなわち、符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別し、低周波数符号化パラメータを復号化して低帯域信号を取得し、低周波数符号化パラメータに従って音声度ファクタを計算し、低周波数符号化パラメータに従って高帯域励起信号を予測し、音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用され、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けし、合成励起信号と高周波数符号化パラメータとに基づいて高帯域信号を取得し、低帯域信号と高帯域信号とを結合して最終的な復号化された信号を取得することを実施可能にする命令を格納する。
本発明の実施例による通信システム又は通信装置は、前述のオーディオ信号符号化装置300、送信機600、オーディオ信号復号化装置500、受信機700等の一部又は全部を含んでもよい。
当業者は、この明細書に開示された実施例に記載の例と組み合わせて、ユニット及びアルゴリズムのステップが、電子ハードウェアにより実施されてもよく、コンピュータソフトウェアと電子ハードウェアとの組み合わせにより実施されてもよいことを認識し得る。機能がハードウェアにより実行されるかソフトウェアにより実行されるかは、技術的対策の特定の用途及び設計上の制約条件に依存する。当業者は、特定の用途毎に記載の機能を実施するために異なる方法を使用してもよいが、これは、この実施が本発明の範囲を超えるものとして考えられるべきではない。
便宜上の説明及び簡潔な説明の目的で、前述のシステム、装置及びユニットの詳細な動作処理について、前述の方法の実施例の対応する処理に参照が行われてもよいことが、当業者に明確に分かる。詳細はここでは再び説明しない。
この出願で提供される複数の実施例では、開示のシステム、装置及び方法は、他の方法で実施されてもよいことが分かる。例えば、記載された装置の実施例は単なる例である。例えば、ユニット分割は単なる論理的な機能分割であり、実際の実装では他の分割でもよい。例えば、複数のユニット又はコンポーネントは他のシステムに結合又は統合されてもよく、いくつかの機能は無視されてもよく実行されなくてもよい。
別々の部分として記載したユニットは、物理的に別々でもよく別々でなくてもよく、ユニットとして表示された部分は物理的ユニットでもよく物理的ユニットでなくてもよく、1つの位置に存在してもよく、複数のネットワークユニットに分散されてもよい。ユニットの一部又は全部は、実施例の対策の目的を実現するために、実際のニーズに従って選択されてもよい。
機能がソフトウェア機能ユニットの形式で実装されて独立したプロダクトとして販売又は使用される場合、機能はコンピュータ読み取り可能媒体に格納されてもよい。このような理解に基づいて、本発明の技術的対策は、基本的に、或いは従来技術に寄与する部分は、或いは技術的対策の一部は、ソフトウェアプロダクトの形式で実装されてもよい。ソフトウェアプロダクトは、記憶媒体に格納され、コンピュータデバイス(パーソナルコンピュータ、サーバ又はネットワークデバイスでもよい)に対して本発明の実施例に記載の方法のステップの全部又は一部を実行するように命令する複数の命令を含む。前述の記憶媒体は、USBフラッシュドライブ、取り外し可能ハードディスク、読み取り専用メモリ(ROM:Read-Only Memory)、ランダムアクセスメモリ(RAM:Random Access Memory)、磁気ディスク又は光ディスクのような、プログラムコードを格納することができるいずれかの媒体を含む。
前述の説明は、本発明の単に特定の実装方法に過ぎず、本発明の保護範囲を限定することを意図するものではない。本発明に開示された技術的範囲内で当業者により容易に理解できる如何なる変更又は置換も、本発明の保護範囲内に入るものとする。従って、本発明の保護範囲は、特許請求の範囲の保護範囲に従うものとする。

Claims (26)

  1. 符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割するステップと、
    前記低帯域信号を符号化して低周波数符号化パラメータを取得するステップと、
    前記低周波数符号化パラメータに従って音声度ファクタを計算し、前記低周波数符号化パラメータに従って高帯域励起信号を予測するステップであり、前記音声度ファクタは、前記高帯域信号により示される音声特性の程度を示すために使用されるステップと、
    合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするステップと、
    前記合成励起信号と前記高帯域信号とに基づいて高周波数符号化パラメータを取得するステップと
    を有し、
    合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするステップは、
    プリエンファシス雑音を取得するために、前記ランダム雑音においてプリエンファシスファクタを使用することにより前記ランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行するステップと、
    プリエンファシス励起信号を生成するために、前記音声度ファクタを使用することにより前記高帯域励起信号と前記プリエンファシス雑音とを重み付けするステップと、
    前記合成励起信号を取得するために、前記プリエンファシス励起信号においてデエンファシスファクタを使用することにより前記プリエンファシス励起信号の高周波数部分を下げるためのデエンファシス動作を実行するステップと
    を有するオーディオ信号符号化方法。
  2. 前記デエンファシスファクタは、前記プリエンファシスファクタと、前記プリエンファシス励起信号における前記プリエンファシス雑音の割合とに基づいて決定される、請求項に記載の方法。
  3. 符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割するステップと、
    前記低帯域信号を符号化して低周波数符号化パラメータを取得するステップと、
    前記低周波数符号化パラメータに従って音声度ファクタを計算し、前記低周波数符号化パラメータに従って高帯域励起信号を予測するステップであり、前記音声度ファクタは、前記高帯域信号により示される音声特性の程度を示すために使用されるステップと、
    合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするステップと、
    前記合成励起信号と前記高帯域信号とに基づいて高周波数符号化パラメータを取得するステップと
    を有し、
    前記低周波数符号化パラメータは、ピッチ期間を有し、
    合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするステップは、
    前記ピッチ期間を使用することにより前記音声度ファクタを変更するステップと、
    前記合成励起信号を取得するために、変更された音声度ファクタを使用することにより前記高帯域励起信号と前記ランダム雑音とを重み付けするステップと
    を有するオーディオ信号符号化方法
  4. 符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割するステップと、
    前記低帯域信号を符号化して低周波数符号化パラメータを取得するステップと、
    前記低周波数符号化パラメータに従って音声度ファクタを計算し、前記低周波数符号化パラメータに従って高帯域励起信号を予測するステップであり、前記音声度ファクタは、前記高帯域信号により示される音声特性の程度を示すために使用されるステップと、
    合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするステップと、
    前記合成励起信号と前記高帯域信号とに基づいて高周波数符号化パラメータを取得するステップと
    を有し、
    前記低周波数符号化パラメータは、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間とを有し、
    前記低周波数符号化パラメータに従って高帯域励起信号を予測するステップは、
    前記ピッチ期間を使用することにより前記音声度ファクタを変更するステップと、
    重み付け結果を取得するために、変更された音声度ファクタを使用することにより前記代数コードブックと前記ランダム雑音とを重み付けし、前記高帯域励起信号を予測するために、前記重み付け結果及び前記代数コードブック利得の積と、前記適応コードブック及び前記適応コードブック利得の積とを加算するステップと
    を有するオーディオ信号符号化方法
  5. 前記ピッチ期間を使用することにより前記音声度ファクタを変更するステップは、
    以下の式:
    Figure 0006125031
    に従って実行され、ただし、voice_facは前記音声度ファクタであり、T0は前記ピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれ前記ピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは前記変更された音声度ファクタである、請求項4に記載の方法。
  6. 前記ピッチ期間を使用することにより前記音声度ファクタを変更するステップは、
    以下の式:
    Figure 0006125031
    に従って実行され、ただし、voice_facは前記音声度ファクタであり、T0は前記ピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれ前記ピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは前記変更された音声度ファクタである、請求項に記載の方法。
  7. 符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別するステップと、
    前記低周波数符号化パラメータを復号化して低帯域信号を取得するステップと、
    前記低周波数符号化パラメータに従って音声度ファクタを計算し、前記低周波数符号化パラメータに従って高帯域励起信号を予測するステップであり、前記音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用されるステップと、
    合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするステップと、
    前記合成励起信号と前記高周波数符号化パラメータとに基づいて前記高帯域信号を取得するステップと、
    前記低帯域信号と前記高帯域信号とを結合して最終的な復号化された信号を取得するステップと
    を有し、
    合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするステップは、
    プリエンファシス雑音を取得するために、前記ランダム雑音においてプリエンファシスファクタを使用することにより前記ランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行するステップと、
    プリエンファシス励起信号を生成するために、前記音声度ファクタを使用することにより前記高帯域励起信号と前記プリエンファシス雑音とを重み付けするステップと、
    前記合成励起信号を取得するために、前記プリエンファシス励起信号においてデエンファシスファクタを使用することにより前記プリエンファシス励起信号の高周波数部分を下げるためのデエンファシス動作を実行するステップと
    を有するオーディオ信号復号化方法。
  8. 前記デエンファシスファクタは、前記プリエンファシスファクタと、前記プリエンファシス励起信号における前記プリエンファシス雑音の割合とに基づいて決定される、請求項に記載の方法。
  9. 符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別するステップと、
    前記低周波数符号化パラメータを復号化して低帯域信号を取得するステップと、
    前記低周波数符号化パラメータに従って音声度ファクタを計算し、前記低周波数符号化パラメータに従って高帯域励起信号を予測するステップであり、前記音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用されるステップと、
    合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするステップと、
    前記合成励起信号と前記高周波数符号化パラメータとに基づいて前記高帯域信号を取得するステップと、
    前記低帯域信号と前記高帯域信号とを結合して最終的な復号化された信号を取得するステップと
    を有し、
    前記低周波数符号化パラメータは、ピッチ期間を有し、
    合成励起信号を取得するために、前記音声度ファクタを使用することにより前記予測された高帯域励起信号とランダム雑音とを重み付けするステップは、
    前記ピッチ期間を使用することにより前記音声度ファクタを変更するステップと、
    前記合成励起信号を取得するために、変更された音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするステップと
    を有するオーディオ信号復号化方法
  10. 符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別するステップと、
    前記低周波数符号化パラメータを復号化して低帯域信号を取得するステップと、
    前記低周波数符号化パラメータに従って音声度ファクタを計算し、前記低周波数符号化パラメータに従って高帯域励起信号を予測するステップであり、前記音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用されるステップと、
    合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするステップと、
    前記合成励起信号と前記高周波数符号化パラメータとに基づいて前記高帯域信号を取得するステップと、
    前記低帯域信号と前記高帯域信号とを結合して最終的な復号化された信号を取得するステップと
    を有し、
    前記低周波数符号化パラメータは、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間とを有し、
    前記低周波数符号化パラメータに従って高帯域励起信号を予測するステップは、
    前記ピッチ期間を使用することにより前記音声度ファクタを変更するステップと、
    重み付け結果を取得するために、変更された音声度ファクタを使用することにより前記代数コードブックと前記ランダム雑音とを重み付けするステップと、
    前記高帯域励起信号を予測するために、前記重み付け結果及び前記代数コードブック利得の積と、前記適応コードブック及び前記適応コードブック利得の積とを加算するステップと
    を有するオーディオ信号復号化方法
  11. 前記ピッチ期間を使用することにより前記音声度ファクタを変更するステップは、
    以下の式:
    Figure 0006125031
    に従って実行され、ただし、voice_facは前記音声度ファクタであり、T0は前記ピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれ前記ピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは前記変更された音声度ファクタである、請求項10に記載の方法。
  12. 前記ピッチ期間を使用することにより前記音声度ファクタを変更するステップは、
    以下の式:
    Figure 0006125031
    に従って実行され、ただし、voice_facは前記音声度ファクタであり、T0は前記ピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれ前記ピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは前記変更された音声度ファクタである、請求項に記載の方法。
  13. 符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割するように構成された分割ユニットと、
    前記低帯域信号を符号化して低周波数符号化パラメータを取得するように構成された低周波数符号化ユニットと、
    前記低周波数符号化パラメータに従って音声度ファクタを計算するように構成された計算ユニットであり、前記音声度ファクタは、前記高帯域信号により示される音声特性の程度を示すために使用される計算ユニットと、
    前記低周波数符号化パラメータに従って高帯域励起信号を予測するように構成された予測ユニットと、
    合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするように構成された合成ユニットと、
    前記合成励起信号と前記高帯域信号とに基づいて高周波数符号化パラメータを取得するように構成された高周波数符号化ユニットと
    を有し、
    前記合成ユニットは、
    プリエンファシス雑音を取得するために、前記ランダム雑音においてプリエンファシスファクタを使用することにより前記ランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行するように構成されたプリエンファシス構成要素と、
    プリエンファシス励起信号を生成するために、前記音声度ファクタを使用することにより前記高帯域励起信号と前記プリエンファシス雑音とを重み付けするように構成された重み付け構成要素と、
    前記合成励起信号を取得するために、前記プリエンファシス励起信号においてデエンファシスファクタを使用することにより前記プリエンファシス励起信号の高周波数部分を下げるためのデエンファシス動作を実行するように構成されたデエンファシス構成要素と
    を有するオーディオ信号符号化装置。
  14. 前記デエンファシスファクタは、前記プリエンファシスファクタと、前記プリエンファシス励起信号における前記プリエンファシス雑音の割合とに基づいて決定される、請求項13に記載の装置。
  15. 符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割するように構成された分割ユニットと、
    前記低帯域信号を符号化して低周波数符号化パラメータを取得するように構成された低周波数符号化ユニットと、
    前記低周波数符号化パラメータに従って音声度ファクタを計算するように構成された計算ユニットであり、前記音声度ファクタは、前記高帯域信号により示される音声特性の程度を示すために使用される計算ユニットと、
    前記低周波数符号化パラメータに従って高帯域励起信号を予測するように構成された予測ユニットと、
    合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするように構成された合成ユニットと、
    前記合成励起信号と前記高帯域信号とに基づいて高周波数符号化パラメータを取得するように構成された高周波数符号化ユニットと
    を有し、
    前記低周波数符号化パラメータは、ピッチ期間を有し、
    前記合成ユニットは、
    前記ピッチ期間を使用することにより前記音声度ファクタを変更するように構成された第1の変更構成要素と、
    前記合成励起信号を取得するために、変更された音声度ファクタを使用することにより前記高帯域励起信号と前記ランダム雑音とを重み付けするように構成された重み付け構成要素と
    を有するオーディオ信号符号化装置
  16. 符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割するように構成された分割ユニットと、
    前記低帯域信号を符号化して低周波数符号化パラメータを取得するように構成された低周波数符号化ユニットと、
    前記低周波数符号化パラメータに従って音声度ファクタを計算するように構成された計算ユニットであり、前記音声度ファクタは、前記高帯域信号により示される音声特性の程度を示すために使用される計算ユニットと、
    前記低周波数符号化パラメータに従って高帯域励起信号を予測するように構成された予測ユニットと、
    合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするように構成された合成ユニットと、
    前記合成励起信号と前記高帯域信号とに基づいて高周波数符号化パラメータを取得するように構成された高周波数符号化ユニットと
    を有し、
    前記低周波数符号化パラメータは、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間とを有し、
    前記予測ユニットは、
    前記ピッチ期間を使用することにより前記音声度ファクタを変更するように構成された第2の変更構成要素と、
    重み付け結果を取得するために、変更された音声度ファクタを使用することにより前記代数コードブックと前記ランダム雑音とを重み付けし、前記高帯域励起信号を予測するために、前記重み付け結果及び前記代数コードブック利得の積と、前記適応コードブック及び前記適応コードブック利得の積とを加算するように構成された予測構成要素と
    を有するオーディオ信号符号化装置
  17. 下の式:
    Figure 0006125031
    に従って前記音声度ファクタを変更し、ただし、voice_facは前記音声度ファクタであり、T0は前記ピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれ前記ピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは前記変更された音声度ファクタである、請求項15に記載の装置。
  18. 以下の式:
    Figure 0006125031
    に従って前記音声度ファクタを変更し、ただし、voice_facは前記音声度ファクタであり、T0は前記ピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれ前記ピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは前記変更された音声度ファクタである、請求項16に記載の装置。
  19. 符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別するように構成された区別ユニットと、
    前記低周波数符号化パラメータを復号化して低帯域信号を取得するように構成された低周波数復号化ユニットと、
    前記低周波数符号化パラメータに従って音声度ファクタを計算するように構成された計算ユニットであり、前記音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用される計算ユニットと、
    前記低周波数符号化パラメータに従って高帯域励起信号を予測するように構成された予測ユニットと、
    合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするように構成された合成ユニットと、
    前記合成励起信号と前記高周波数符号化パラメータとに基づいて前記高帯域信号を取得するように構成された高周波数復号化ユニットと、
    前記低帯域信号と前記高帯域信号とを結合して最終的な復号化された信号を取得するように構成された結合ユニットと
    を有し、
    前記合成ユニットは、
    プリエンファシス雑音を取得するために、前記ランダム雑音においてプリエンファシスファクタを使用することにより前記ランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行するように構成されたプリエンファシス構成要素と、
    プリエンファシス励起信号を生成するために、前記音声度ファクタを使用することにより前記高帯域励起信号と前記プリエンファシス雑音とを重み付けするように構成された重み付け構成要素と、
    前記合成励起信号を取得するために、前記プリエンファシス励起信号においてデエンファシスファクタを使用することにより前記プリエンファシス励起信号の高周波数部分を下げるためのデエンファシス動作を実行するように構成されたデエンファシス構成要素と
    を有するオーディオ信号復号化装置。
  20. 前記デエンファシスファクタは、前記プリエンファシスファクタと、前記プリエンファシス励起信号における前記プリエンファシス雑音の割合とに基づいて決定される、請求項19に記載の装置。
  21. 符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別するように構成された区別ユニットと、
    前記低周波数符号化パラメータを復号化して低帯域信号を取得するように構成された低周波数復号化ユニットと、
    前記低周波数符号化パラメータに従って音声度ファクタを計算するように構成された計算ユニットであり、前記音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用される計算ユニットと、
    前記低周波数符号化パラメータに従って高帯域励起信号を予測するように構成された予測ユニットと、
    合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするように構成された合成ユニットと、
    前記合成励起信号と前記高周波数符号化パラメータとに基づいて前記高帯域信号を取得するように構成された高周波数復号化ユニットと、
    前記低帯域信号と前記高帯域信号とを結合して最終的な復号化された信号を取得するように構成された結合ユニットと
    を有し、
    前記低周波数符号化パラメータは、ピッチ期間を有し、
    前記合成ユニットは、
    前記ピッチ期間を使用することにより前記音声度ファクタを変更するように構成された第1の変更構成要素と、
    前記合成励起信号を取得するために、変更された音声度ファクタを使用することにより前記高帯域励起信号と前記ランダム雑音とを重み付けするように構成された重み付け構成要素と
    を有するオーディオ信号復号化装置
  22. 符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別するように構成された区別ユニットと、
    前記低周波数符号化パラメータを復号化して低帯域信号を取得するように構成された低周波数復号化ユニットと、
    前記低周波数符号化パラメータに従って音声度ファクタを計算するように構成された計算ユニットであり、前記音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用される計算ユニットと、
    前記低周波数符号化パラメータに従って高帯域励起信号を予測するように構成された予測ユニットと、
    合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするように構成された合成ユニットと、
    前記合成励起信号と前記高周波数符号化パラメータとに基づいて前記高帯域信号を取得するように構成された高周波数復号化ユニットと、
    前記低帯域信号と前記高帯域信号とを結合して最終的な復号化された信号を取得するように構成された結合ユニットと
    を有し、
    前記低周波数符号化パラメータは、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間とを有し、
    前記予測ユニットは、
    前記ピッチ期間を使用することにより前記音声度ファクタを変更するように構成された第2の変更構成要素と、
    重み付け結果を取得するために、変更された音声度ファクタを使用することにより前記代数コードブックと前記ランダム雑音とを重み付けし、前記高帯域励起信号を予測するために、前記重み付け結果及び前記代数コードブック利得の積と、前記適応コードブック及び前記適応コードブック利得の積とを加算するように構成された予測構成要素と
    を有するオーディオ信号復号化装置
  23. 下の式:
    Figure 0006125031
    に従って前記音声度ファクタを変更し、ただし、voice_facは前記音声度ファクタであり、T0は前記ピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれ前記ピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは前記変更された音声度ファクタである、請求項21に記載の装置。
  24. 以下の式:
    Figure 0006125031
    に従って前記音声度ファクタを変更し、ただし、voice_facは前記音声度ファクタであり、T0は前記ピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれ前記ピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは前記変更された音声度ファクタである、請求項22に記載の装置。
  25. コンピュータに対して請求項1ないしのうちいずれか1項に記載の方法を実行させるプログラムを記録したコンピュータ読み取り可能記憶媒体。
  26. コンピュータに対して請求項ないし12のうちいずれか1項に記載の方法を実行させるプログラムを記録したコンピュータ読み取り可能記憶媒体。
JP2015543256A 2013-01-11 2013-07-22 オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置 Active JP6125031B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201310010936.8 2013-01-11
CN201310010936.8A CN103928029B (zh) 2013-01-11 2013-01-11 音频信号编码和解码方法、音频信号编码和解码装置
PCT/CN2013/079804 WO2014107950A1 (zh) 2013-01-11 2013-07-22 音频信号编码和解码方法、音频信号编码和解码装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2017074548A Division JP6364518B2 (ja) 2013-01-11 2017-04-04 オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置

Publications (2)

Publication Number Publication Date
JP2016505873A JP2016505873A (ja) 2016-02-25
JP6125031B2 true JP6125031B2 (ja) 2017-05-10

Family

ID=51146227

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2015543256A Active JP6125031B2 (ja) 2013-01-11 2013-07-22 オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置
JP2017074548A Active JP6364518B2 (ja) 2013-01-11 2017-04-04 オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2017074548A Active JP6364518B2 (ja) 2013-01-11 2017-04-04 オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置

Country Status (8)

Country Link
US (3) US9805736B2 (ja)
EP (2) EP3467826A1 (ja)
JP (2) JP6125031B2 (ja)
KR (2) KR20170054580A (ja)
CN (2) CN103928029B (ja)
HK (1) HK1199539A1 (ja)
SG (1) SG11201503286UA (ja)
WO (1) WO2014107950A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160145799A (ko) * 2014-06-26 2016-12-20 후아웨이 테크놀러지 컴퍼니 리미티드 코딩/디코딩 방법, 장치 및 시스템

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL4053838T3 (pl) * 2008-12-15 2023-11-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy
CN103426441B (zh) 2012-05-18 2016-03-02 华为技术有限公司 检测基音周期的正确性的方法和装置
CN103928029B (zh) * 2013-01-11 2017-02-08 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
US9384746B2 (en) * 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
WO2015079946A1 (ja) * 2013-11-29 2015-06-04 ソニー株式会社 周波数帯域拡大装置および方法、並びにプログラム
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
CN106328153B (zh) * 2016-08-24 2020-05-08 青岛歌尔声学科技有限公司 电子通信设备语音信号处理系统、方法和电子通信设备
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
EP3903309B1 (en) * 2019-01-13 2024-04-24 Huawei Technologies Co., Ltd. High resolution audio coding
CN112767954A (zh) * 2020-06-24 2021-05-07 腾讯科技(深圳)有限公司 音频编解码方法、装置、介质及电子设备

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02230300A (ja) * 1989-03-03 1990-09-12 Nec Corp 音声合成器
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JPH0954600A (ja) * 1995-08-14 1997-02-25 Toshiba Corp 音声符号化通信装置
WO1997012328A1 (en) 1995-09-25 1997-04-03 Adobe Systems Incorporated Optimum access to electronic documents
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US7260523B2 (en) * 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
WO2002029782A1 (en) * 2000-10-02 2002-04-11 The Regents Of The University Of California Perceptual harmonic cepstral coefficients as the front-end for speech recognition
US6691085B1 (en) 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
EP1383113A1 (fr) * 2002-07-17 2004-01-21 STMicroelectronics N.V. Procédé et dispositif d'encodage de la parole à bande élargie capable de contrôler indépendamment les distorsions à court terme et à long terme
EP1383109A1 (fr) * 2002-07-17 2004-01-21 STMicroelectronics N.V. Procédé et dispositif d'encodage de la parole à bande élargie
KR100503415B1 (ko) * 2002-12-09 2005-07-22 한국전자통신연구원 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법
US7024358B2 (en) * 2003-03-15 2006-04-04 Mindspeed Technologies, Inc. Recovering an erased voice frame with time warping
KR20070115637A (ko) 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US20070299655A1 (en) * 2006-06-22 2007-12-27 Nokia Corporation Method, Apparatus and Computer Program Product for Providing Low Frequency Expansion of Speech
FR2907586A1 (fr) * 2006-10-20 2008-04-25 France Telecom Synthese de blocs perdus d'un signal audionumerique,avec correction de periode de pitch.
US8417520B2 (en) * 2006-10-20 2013-04-09 France Telecom Attenuation of overvoicing, in particular for the generation of an excitation at a decoder when data is missing
KR101565919B1 (ko) * 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
KR101379263B1 (ko) 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
JP5164970B2 (ja) * 2007-03-02 2013-03-21 パナソニック株式会社 音声復号装置および音声復号方法
CN101256771A (zh) * 2007-03-02 2008-09-03 北京工业大学 嵌入式编码、解码方法、编码器、解码器及系统
CN101414462A (zh) * 2007-10-15 2009-04-22 华为技术有限公司 音频编码方法和多点音频信号混音控制方法及相应设备
US9177569B2 (en) * 2007-10-30 2015-11-03 Samsung Electronics Co., Ltd. Apparatus, medium and method to encode and decode high frequency signal
KR101373004B1 (ko) * 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
WO2009081568A1 (ja) * 2007-12-21 2009-07-02 Panasonic Corporation 符号化装置、復号装置および符号化方法
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
KR100998396B1 (ko) * 2008-03-20 2010-12-03 광주과학기술원 프레임 손실 은닉 방법, 프레임 손실 은닉 장치 및 음성송수신 장치
CN101572087B (zh) * 2008-04-30 2012-02-29 北京工业大学 嵌入式语音或音频信号编解码方法和装置
EP2360687A4 (en) 2008-12-19 2012-07-11 Fujitsu Ltd VOICE BAND EXTENSION DEVICE AND VOICE BAND EXTENSION METHOD
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
US8718804B2 (en) * 2009-05-05 2014-05-06 Huawei Technologies Co., Ltd. System and method for correcting for lost data in a digital audio signal
CN101996640B (zh) * 2009-08-31 2012-04-04 华为技术有限公司 频带扩展方法及装置
MY166169A (en) * 2009-10-20 2018-06-07 Fraunhofer Ges Forschung Audio signal encoder,audio signal decoder,method for encoding or decoding an audio signal using an aliasing-cancellation
US8484020B2 (en) * 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
CN102800317B (zh) 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
US9251800B2 (en) * 2011-11-02 2016-02-02 Telefonaktiebolaget L M Ericsson (Publ) Generation of a high band extension of a bandwidth extended audio signal
CN103928029B (zh) * 2013-01-11 2017-02-08 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
US9728200B2 (en) * 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
DK3537437T3 (da) * 2013-03-04 2021-05-31 Voiceage Evs Llc Anordning og fremgangsmåde til reduktion af kvantiseringsstøj i en tidsdomæneafkoder
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
CN108172239B (zh) * 2013-09-26 2021-01-12 华为技术有限公司 频带扩展的方法及装置
ES2760573T3 (es) * 2013-10-31 2020-05-14 Fraunhofer Ges Forschung Decodificador de audio y método para proveer una información de audio decodificada usando un ocultamiento de error que modifica una señal de excitación de dominio de tiempo
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160145799A (ko) * 2014-06-26 2016-12-20 후아웨이 테크놀러지 컴퍼니 리미티드 코딩/디코딩 방법, 장치 및 시스템
KR101906522B1 (ko) 2014-06-26 2018-10-10 후아웨이 테크놀러지 컴퍼니 리미티드 코딩/디코딩 방법, 장치 및 시스템
US10339945B2 (en) 2014-06-26 2019-07-02 Huawei Technologies Co., Ltd. Coding/decoding method, apparatus, and system for audio signal
US10614822B2 (en) 2014-06-26 2020-04-07 Huawei Technologies Co., Ltd. Coding/decoding method, apparatus, and system for audio signal

Also Published As

Publication number Publication date
EP3467826A1 (en) 2019-04-10
JP2016505873A (ja) 2016-02-25
JP2017138616A (ja) 2017-08-10
CN105976830A (zh) 2016-09-28
BR112015014956A2 (pt) 2017-07-11
US10373629B2 (en) 2019-08-06
CN103928029A (zh) 2014-07-16
KR101736394B1 (ko) 2017-05-16
WO2014107950A1 (zh) 2014-07-17
US9805736B2 (en) 2017-10-31
EP2899721A1 (en) 2015-07-29
KR20170054580A (ko) 2017-05-17
US20190355378A1 (en) 2019-11-21
EP2899721B1 (en) 2018-09-12
US20150235653A1 (en) 2015-08-20
US20180018989A1 (en) 2018-01-18
KR20150070398A (ko) 2015-06-24
CN103928029B (zh) 2017-02-08
HK1199539A1 (en) 2015-07-03
CN105976830B (zh) 2019-09-20
BR112015014956A8 (pt) 2019-10-15
SG11201503286UA (en) 2015-06-29
EP2899721A4 (en) 2015-12-09
JP6364518B2 (ja) 2018-07-25

Similar Documents

Publication Publication Date Title
JP6364518B2 (ja) オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置
JP6574820B2 (ja) 高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス
JP6616470B2 (ja) 符号化方法、復号化方法、符号化装置及び復号化装置
RU2702265C1 (ru) Способ и устройство обработки сигналов
US20190057706A1 (en) Signal Encoding And Decoding Methods and Devices
CN111710342B (zh) 编码装置、解码装置、编码方法、解码方法及程序
WO2008092719A1 (en) Audio quantization
US11776553B2 (en) Audio signal encoding method and apparatus

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160930

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170404

R150 Certificate of patent or registration of utility model

Ref document number: 6125031

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250