JP6469664B2 - ハイバンド励振信号を生成するための混合係数の推定 - Google Patents
ハイバンド励振信号を生成するための混合係数の推定 Download PDFInfo
- Publication number
- JP6469664B2 JP6469664B2 JP2016521680A JP2016521680A JP6469664B2 JP 6469664 B2 JP6469664 B2 JP 6469664B2 JP 2016521680 A JP2016521680 A JP 2016521680A JP 2016521680 A JP2016521680 A JP 2016521680A JP 6469664 B2 JP6469664 B2 JP 6469664B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- highband
- mixing
- mixing factor
- band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000002156 mixing Methods 0.000 title claims description 248
- 230000005284 excitation Effects 0.000 title claims description 169
- 230000005236 sound signal Effects 0.000 claims description 58
- 238000000034 method Methods 0.000 claims description 54
- 230000009466 transformation Effects 0.000 claims description 22
- 238000001514 detection method Methods 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 239000000203 mixture Substances 0.000 description 6
- 230000002441 reversible effect Effects 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/087—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
- Amplitude Modulation (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Description
[0001]本出願は、参照によってすべての内容が組み込まれる、2013年10月11日に出願された「ESTIMATION OF MIXING FACTORS TO GENERATE HIGH−BAND EXCITATION SIGNAL」という名称の米国仮特許出願第61/889,727号、および2014年10月8日に出願された「ESTIMATION OF MIXING FACTORS TO GENERATE HIGH−BAND EXCITATION SIGNAL」という名称の米国非仮特許出願第14/509,676号の優先権を主張するものである。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[C1]
音声エンコーダにおいて、オーディオ信号のハイバンド部分に基づいてハイバンド残余信号を生成することと、
前記オーディオ信号のローバンド部分に少なくとも部分的に基づいて、高調波的に拡張された信号を生成することと、
前記ハイバンド残余信号と、前記高調波的に拡張された信号と、変調されたノイズとに基づいて混合係数を決定することと、ここにおいて、前記変調されたノイズは、前記高調波的に拡張された信号とホワイトノイズとに少なくとも部分的に基づく、
を備える方法。
[C2]
前記混合係数は、閉ループ分析を使用して調節される、
C1に記載の方法。
[C3]
前記閉ループ分析を使用して前記混合係数を調節することは、
前記ハイバンド残余信号をハイバンド励振信号と比較することと、ここにおいて、前記ハイバンド励振信号は、前記混合係数と、前記高調波的に拡張された信号と、前記変調されたノイズとに基づいて生成される、
前記比較に基づいて誤差信号を生成することと、
前記誤差信号に基づいて前記混合係数を調節することと、を備える、
C2に記載の方法。
[C4]
前記混合係数と、前記高調波的に拡張された信号と、前記変調されたノイズとに少なくとも部分的に基づいてハイバンド励振信号を生成することをさらに備える、
C1に記載の方法。
[C5]
前記ハイバンド励振信号の時間特性が前記ハイバンド残余信号の時間特性と厳密に一致する、
C4に記載の方法。
[C6]
前記ハイバンド励振信号を生成することは、
第1のスケーリングされた信号を生成するために、前記混合係数に従って前記高調波的に拡張された信号をスケーリングすることと、
第2のスケーリングされた信号を生成するために、前記混合係数に基づいて前記変調されたノイズをスケーリングすることと、
前記第1のスケーリングされた信号と前記第2のスケーリングされた信号とを結合することとを備える、
C4に記載の方法。
[C7]
前記混合係数は、前記ハイバンド残余信号と前記ハイバンド励振信号との差の平均2乗誤差に基づいて調節される、C4に記載の方法。
[C8]
前記混合係数は、少なくとも、ローバンド有声化、ローバンドチルト、またはそれらの任意の組合せに基づいてさらに調節される、C7に記載の方法。
[C9]
第2の混合係数を生成するために、第1の混合係数を選択的に増分または減分することをさらに備え、
前記混合係数は、前記第1の混合係数に基づいた前記平均2乗誤差が前記第2の混合係数に基づいた前記平均2乗誤差よりも小さいという決定に応答して、前記第1の混合係数に対応し、
前記混合係数は、前記第2の混合係数に基づいた前記平均2乗誤差が前記第1の混合係数に基づいた前記平均2乗誤差よりも小さいという決定に応答して、前記第2の混合係数に対応する、
C7に記載の方法。
[C10]
前記ハイバンド残余信号を生成するために、前記オーディオ信号の前記ハイバンド部分に対して線形予測分析を実施することと、
ローバンド残余信号を生成するために、前記オーディオ信号の前記ローバンド部分に対して線形予測分析を実施することと、
ローバンド励振信号を生成するために前記ローバンド残余信号を量子化することと、
前記高調波的に拡張された信号を生成するために、前記ローバンド励振信号に対して非線形フィルタリング操作を実施することと、をさらに備える、
C1に記載の方法。
[C11]
前記混合係数を受信機にビットストリームの一部として送信することをさらに備える、
C1に記載の方法。
[C12]
オーディオ信号のハイバンド部分に基づいてハイバンド残余信号を生成するための線形予測分析フィルタと、
前記オーディオ信号のローバンド部分に少なくとも部分的に基づいて、高調波的に拡張された信号を生成するための非線形変換生成器と、
前記ハイバンド残余信号と、前記高調波的に拡張された信号と、変調されたノイズとに基づいて混合係数を決定するための混合係数計算器と、ここにおいて、前記変調されたノイズは、前記高調波的に拡張された信号とホワイトノイズとに少なくとも部分的に基づく、
を備える装置。
[C13]
前記混合係数は閉ループ分析を使用して調節される、
C12に記載の装置。
[C14]
誤差検出回路と、前記閉ループ分析を使用して前記混合係数を調節するための誤差最小化計算器とをさらに備え、
前記誤差検出回路は、前記ハイバンド残余信号をハイバンド励振信号と比較するように構成され、前記ハイバンド励振信号は、前記混合係数と、前記高調波的に拡張された信号と、前記変調されたノイズとに基づいて生成され、
前記誤差最小化計算器は、
前記比較に基づいて誤差信号を生成し、
前記誤差信号に基づいて前記混合係数を調節するように構成される、
C13に記載の装置。
[C15]
前記混合係数と、前記高調波的に拡張された信号と、前記変調されたノイズとに少なくとも部分的に基づいてハイバンド励振信号を生成するためのハイバンド励振生成器をさらに備える、
C14に記載の装置。
[C16]
前記ハイバンド励振信号の時間特性が前記ハイバンド残余信号の時間特性と厳密に一致する、
C15に記載の装置。
[C17]
前記ハイバンド励振生成器は、
第1のスケーリングされた信号を生成するために前記混合係数に従って前記高調波的に拡張された信号をスケーリングするための第1の乗算器と、
第2のスケーリングされた信号を生成するために前記混合係数に基づいて前記変調されたノイズをスケーリングするための第2の乗算器と、
前記第1のスケーリングされた信号と前記第2のスケーリングされた信号とを結合するための混合器とを備える、
C15に記載の装置。
[C18]
前記混合係数は、前記ハイバンド残余信号と前記ハイバンド励振信号との差の平均2乗誤差に基づいて調節される、
C15に記載の装置。
[C19]
前記混合係数は、少なくとも、ローバンド有声化、ローバンドチルト、またはそれらの任意の組合せに基づいてさらに調節される、
C18に記載の装置。
[C20]
第2の混合係数を生成するために第1の混合係数を選択的に増分または減分するように構成された誤差制御器をさらに備え、
前記混合係数は、前記第1の混合係数に基づいた前記平均2乗誤差が前記第2の混合係数に基づいた前記平均2乗誤差よりも小さいという決定に応答して、前記第1の混合係数に対応し、
前記混合係数は、前記第2の混合係数に基づいた前記平均2乗誤差が前記第1の混合係数に基づいた前記平均2乗誤差よりも小さいという決定に応答して、前記第2の混合係数に対応する、
C18に記載の装置。
[C21]
さらに、前記ハイバンド残余信号を生成するために、前記オーディオ信号の前記ハイバンド部分に対して第1の線形予測分析を実施するように構成された第1の線形予測分析フィルタと。
ローバンド残余信号を生成するために、前記オーディオ信号の前記ローバンド部分に対して第2の線形予測分析を実施するように構成された第2の線形予測分析フィルタと、
ローバンド励振信号を生成するために前記ローバンド残余信号を量子化するように構成された量子化器と、
前記高調波的に拡張された信号を生成するために、前記ローバンド励振信号に対して非線形フィルタリング操作を実施するための非線形変換生成器と、を備える、
C12に記載の装置。
[C22]
前記混合係数を受信機にビットストリームの一部として送信するための送信機をさらに備える、
C12に記載の装置。
[C23]
音声エンコーダにおいてプロセッサによって実行されたときに、前記プロセッサに、
オーディオ信号のハイバンド部分に基づいてハイバンド残余信号を生成することと、
前記オーディオ信号のローバンド部分に少なくとも部分的に基づいて、高調波的に拡張された信号を生成することと、
前記ハイバンド残余信号と、前記高調波的に拡張された信号と、変調されたノイズとに基づいて混合係数を決定することと、ここにおいて、前記変調されたノイズは、前記高調波的に拡張された信号とホワイトノイズとに少なくとも部分的に基づく、
を行わせる命令を備える非一時的コンピュータ可読媒体。
[C24]
前記混合係数は閉ループ分析を使用して調節される、
C23に記載の非一時的コンピュータ可読媒体。
[C25]
前記閉ループ分析を使用して前記混合係数を調節することは、
前記ハイバンド残余信号をハイバンド励振信号と比較することと、ここにおいて、前記ハイバンド励振信号は、前記混合係数と、前記高調波的に拡張された信号と、前記変調されたノイズとに基づいて生成される、
前記比較に基づいて誤差信号を生成することと、
前記誤差信号に基づいて前記混合係数を調節することと、を備える、
C24に記載の非一時的コンピュータ可読媒体。
[C26]
前記プロセッサによって実行されるとき、前記プロセッサに、前記混合係数と、前記高調波的に拡張された信号と、前記変調された信号とに少なくとも部分的に基づいて、ハイバンド励振信号を生成することを行わせる命令をさらに備える、
C23に記載の非一時的コンピュータ可読媒体。
[C27]
前記ハイバンド励振信号の時間特性が前記ハイバンド残余信号の時間特性と厳密に一致する、
C26に記載の非一時的コンピュータ可読媒体。
[C28]
オーディオ信号のハイバンド部分に基づいてハイバンド残余信号を生成するための手段と、
前記オーディオ信号のローバンド部分に少なくとも部分的に基づいて、高調波的に拡張された信号を生成するための手段と、
前記ハイバンド残余信号と、前記高調波的に拡張された信号と、変調されたノイズとに基づいて混合係数を決定するための手段と、ここにおいて、前記変調されたノイズは、前記高調波的に拡張された信号とホワイトノイズとに少なくとも部分的に基づく、
を備える装置。
[C29]
前記混合係数は、閉ループ分析を使用して調節される、C28に記載の装置。
[C30]
前記閉ループ分析を使用して前記混合係数を調節することは、
前記ハイバンド残余信号をハイバンド励振信号と比較することと、ここにおいて、前記ハイバンド励振信号は、前記混合係数と、前記高調波的に拡張された信号と、前記変調されたノイズとに基づいて生成される、
前記比較に基づいて誤差信号を生成することと、
前記誤差信号に基づいて前記混合係数を調節することと、を備える、
C29に記載の装置。
[C31]
前記混合係数と、前記高調波的に拡張された信号と、前記変調されたノイズとに少なくとも部分的に基づいてハイバンド励振信号を生成するための手段をさらに備える、
C28に記載の装置。
[C32]
前記ハイバンド励振信号の時間特性が前記ハイバンド残余信号の時間特性と厳密に一致する、
C31に記載の装置。
[C33]
ローバンド励振信号とハイバンドサイド情報とを含む符号化された信号を音声デコーダにて受信することと、
ここにおいて、前記ハイバンドサイド情報は混合係数を含み、
ここにおいて、前記混合係数は、ハイバンド残余信号と、高調波的に拡張された信号と、変調されたノイズとに基づいて決定される、
前記ハイバンドサイド情報と前記ローバンド励振信号とに基づいてハイバンド励振信号を生成することと、
を備える方法。
[C34]
ローバンド励振信号とハイバンドサイド情報とを含む符号化された信号を受信することと、
ここにおいて、前記ハイバンドサイド情報は混合係数を含み、
ここにおいて、前記混合係数は、ハイバンド残余信号と、高調波的に拡張された信号と、変調されたノイズとに基づいて決定される、
前記ハイバンドサイド情報と前記ローバンド励振信号とに基づいてハイバンド励振信号を生成することと、を行うように構成された音声デコーダを備える装置。
[C35]
音声エンコーダにおいてプロセッサによって実行されたときに、前記プロセッサに、
ローバンド励振信号とハイバンドサイド情報とを含む符号化された信号を受信することと、
ここにおいて、前記ハイバンドサイド情報は混合係数を含み、
ここにおいて、前記混合係数は、ハイバンド残余信号と、高調波的に拡張された信号と、変調されたノイズとに基づいて決定される、
前記ハイバンドサイド情報と前記ローバンド励振信号とに基づいてハイバンド励振信号を生成することと、
を行わせる命令を備える非一時的コンピュータ可読媒体。
[C36]
ローバンド励振信号とハイバンドサイド情報とを含む符号化された信号を受信するための手段と、
ここにおいて、前記ハイバンドサイド情報は混合係数を含み、
ここにおいて、前記混合係数は、ハイバンド残余信号と、高調波的に拡張された信号と、変調されたノイズとに基づいて決定される、
前記ハイバンドサイド情報と前記ローバンド励振信号とに基づいてハイバンド励振信号を生成するための手段と、
を備える装置。
Claims (12)
- 音声エンコーダにおいて、オーディオ信号のハイバンド部分に基づいてハイバンド残余信号を生成することと、
前記オーディオ信号のローバンド励振信号に少なくとも部分的に基づいて、高調波的に拡張された信号を生成することと、
前記ハイバンド残余信号と、前記高調波的に拡張された信号と、変調されたノイズとに基づいて混合係数を決定することと、ここにおいて、前記変調されたノイズは、前記高調波的に拡張された信号とホワイトノイズとに少なくとも部分的に基づき、前記混合係数は、閉ループ分析を使用して調節され、前記閉ループ分析を使用して前記混合係数を調節することは、
前記ハイバンド残余信号をハイバンド励振信号と比較することと、
前記比較に基づいて誤差信号を生成することと、
前記誤差信号に基づいて前記混合係数を調節することと、を備える、
前記混合係数に基づいてスケーリングされた前記高調波的に拡張された信号に対応する第1の信号と、前記混合係数に基づいてスケーリングされた前記変調されたノイズに対応する第2の信号とを結合することに基づいて前記ハイバンド励振信号を生成することと、
前記オーディオ信号の前記ローバンド励振信号と前記混合係数を含むハイバンドサイド情報とを含む信号を前記音声エンコーダの出力信号として出力することと、
を備える方法。 - 前記誤差信号に基づいて前記混合係数を調節することは、前記混合係数が、前記ハイバンド残余信号と前記ハイバンド励振信号との差の平均2乗誤差に基づいて調節されることを備える、請求項1に記載の方法。
- 前記混合係数は、ローバンド有声化、ローバンドチルト、またはそれらの任意の組合せに基づいてさらに調節される、請求項2に記載の方法。
- 前記ハイバンド残余信号と前記ハイバンド励振信号との差の平均2乗誤差に基づいて、第2の混合係数を生成するために、第1の混合係数を選択的に増分または減分することをさらに備え、
前記混合係数は、前記第1の混合係数に基づいた前記平均2乗誤差が前記第2の混合係数に基づいた前記平均2乗誤差よりも小さいという決定に応答して、前記第1の混合係数に対応し、
前記混合係数は、前記第2の混合係数に基づいた前記平均2乗誤差が前記第1の混合係数に基づいた前記平均2乗誤差よりも小さいという決定に応答して、前記第2の混合係数に対応する、
請求項2に記載の方法。 - 前記混合係数を受信機にビットストリームの一部として送信することをさらに備える、
請求項1に記載の方法。 - オーディオ信号のハイバンド部分に基づいてハイバンド残余信号を生成するための線形予測分析フィルタと、
前記オーディオ信号のローバンド励振信号に少なくとも部分的に基づいて、高調波的に拡張された信号を生成するための非線形変換生成器と、
前記ハイバンド残余信号と、前記高調波的に拡張された信号と、変調されたノイズとに基づいて混合係数を決定するための混合係数計算器と、ここにおいて、前記変調されたノイズは、前記高調波的に拡張された信号とホワイトノイズとに少なくとも部分的に基づき、前記混合係数は閉ループ分析を使用して調節される、
誤差検出回路と、前記閉ループ分析を使用して前記混合係数を調節するための誤差最小化計算器と、ここにおいて、前記誤差検出回路は、前記ハイバンド残余信号をハイバンド励振信号と比較するように構成され、
前記誤差最小化計算器は、
前記比較に基づいて誤差信号を生成し、
前記誤差信号に基づいて前記混合係数を調節するように構成される、
ハイバンド励振信号を生成するためのハイバンド励振生成器と、前記ハイバンド励振生成器は、前記混合係数に基づいてスケーリングされた前記高調波的に拡張された信号に対応する第1の信号と、前記混合係数に基づいてスケーリングされた前記変調されたノイズに対応する第2の信号とを結合するための混合器を含む、
前記オーディオ信号の前記ローバンド励振信号と前記混合係数を含むハイバンドサイド情報とを含む信号は出力信号として出力される、
を備える装置。 - 前記混合係数は、前記ハイバンド残余信号と前記ハイバンド励振信号との差の平均2乗誤差に基づいて調節され、前記装置は、
前記ハイバンド残余信号と前記ハイバンド励振信号との差の平均2乗誤差に基づいて、第2の混合係数を生成するために第1の混合係数を選択的に増分または減分するように構成された誤差制御器をさらに備え、
前記混合係数は、前記第1の混合係数に基づいた前記平均2乗誤差が前記第2の混合係数に基づいた前記平均2乗誤差よりも小さいという決定に応答して、前記第1の混合係数に対応し、
前記混合係数は、前記第2の混合係数に基づいた前記平均2乗誤差が前記第1の混合係数に基づいた前記平均2乗誤差よりも小さいという決定に応答して、前記第2の混合係数に対応する、
請求項6に記載の装置。 - 前記混合係数を受信機にビットストリームの一部として送信するための送信機をさらに備える、
請求項6に記載の装置。 - ローバンド励振信号とハイバンドサイド情報とを含む符号化された信号を音声デコーダにて受信することと、
ここにおいて、前記ハイバンドサイド情報は混合係数を含み、
ここにおいて、前記混合係数は、ハイバンド残余信号と、第1の高調波的に拡張された信号と、第1の変調されたノイズとに基づき、
前記ローバンド励振信号に基づく第2の高調波的に拡張された信号に対応する第1の信号と、前記第2の高調波的に拡張された信号とホワイトノイズとに基づく第2の変調されたノイズに対応する第2の信号とを混合することによって、ハイバンド励振信号を生成することと、ここにおいて、前記第2の高調波的に拡張された信号は、前記混合係数に基づいてスケーリングされ、前記第2の変調されたノイズは、前記混合係数に基づいてスケーリングされる、
前記ローバンド励振信号と、前記第1の信号と前記第2の信号と混合することによって生成された前記ハイバンド励振信号に基づいて、オーディオ信号を再構成することと、
を備える方法。 - ローバンド励振信号とハイバンドサイド情報とを含む符号化された信号を受信することと、
ここにおいて、前記ハイバンドサイド情報は混合係数を含み、
ここにおいて、前記混合係数は、ハイバンド残余信号と、第1の高調波的に拡張された信号と、第1の変調されたノイズとに基づき、
前記ローバンド励振信号に基づく第2の高調波的に拡張された信号に対応する第1の信号と、前記第2の高調波的に拡張された信号とホワイトノイズとに基づく第2の変調されたノイズに対応する第2の信号とを混合することによって、ハイバンド励振信号を生成することと、ここにおいて、前記第2の高調波的に拡張された信号は、前記混合係数に基づいてスケーリングされ、前記第2の変調されたノイズは、前記混合係数に基づいてスケーリングされる、
前記ローバンド励振信号と、前記第1の信号と前記第2の信号と混合することによって生成された前記ハイバンド励振信号に基づいて、オーディオ信号を再構成することと、
を行うように構成された音声デコーダを備える装置。 - 音声エンコーダにおいてプロセッサによって実行されたときに、前記プロセッサに、請求項1乃至5のいずれかに記載の方法を行わせる命令を備える非一時的コンピュータ可読媒体。
- 音声デコーダにおいてプロセッサによって実行されたときに、前記プロセッサに、請求項9に記載の方法を行わせる命令を備える非一時的コンピュータ可読媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361889727P | 2013-10-11 | 2013-10-11 | |
US61/889,727 | 2013-10-11 | ||
US14/509,676 US10083708B2 (en) | 2013-10-11 | 2014-10-08 | Estimation of mixing factors to generate high-band excitation signal |
US14/509,676 | 2014-10-08 | ||
PCT/US2014/059901 WO2015054492A1 (en) | 2013-10-11 | 2014-10-09 | Estimation of mixing factors to generate high-band excitation signal |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016532886A JP2016532886A (ja) | 2016-10-20 |
JP2016532886A5 JP2016532886A5 (ja) | 2017-10-26 |
JP6469664B2 true JP6469664B2 (ja) | 2019-02-13 |
Family
ID=52810390
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016521680A Active JP6469664B2 (ja) | 2013-10-11 | 2014-10-09 | ハイバンド励振信号を生成するための混合係数の推定 |
Country Status (21)
Country | Link |
---|---|
US (2) | US10083708B2 (ja) |
EP (1) | EP3055861B1 (ja) |
JP (1) | JP6469664B2 (ja) |
KR (1) | KR101941755B1 (ja) |
CN (2) | CN105612578B (ja) |
AU (2) | AU2014331890B2 (ja) |
CA (1) | CA2925573C (ja) |
CL (1) | CL2016000818A1 (ja) |
DK (1) | DK3055861T3 (ja) |
ES (1) | ES2660605T3 (ja) |
HK (1) | HK1220033A1 (ja) |
HU (1) | HUE036838T2 (ja) |
MX (1) | MX354886B (ja) |
MY (1) | MY182788A (ja) |
NZ (1) | NZ717750A (ja) |
PH (1) | PH12016500506A1 (ja) |
RU (1) | RU2672179C2 (ja) |
SA (1) | SA516370877B1 (ja) |
SG (1) | SG11201601790QA (ja) |
SI (1) | SI3055861T1 (ja) |
WO (1) | WO2015054492A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR3011408A1 (fr) * | 2013-09-30 | 2015-04-03 | Orange | Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard |
US10083708B2 (en) | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
US10163447B2 (en) * | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
US9984699B2 (en) | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US10217468B2 (en) * | 2017-01-19 | 2019-02-26 | Qualcomm Incorporated | Coding of multiple audio signals |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
WO2020157888A1 (ja) * | 2019-01-31 | 2020-08-06 | 三菱電機株式会社 | 周波数帯域拡張装置、周波数帯域拡張方法、及び周波数帯域拡張プログラム |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6141638A (en) | 1998-05-28 | 2000-10-31 | Motorola, Inc. | Method and apparatus for coding an information signal |
US7117146B2 (en) | 1998-08-24 | 2006-10-03 | Mindspeed Technologies, Inc. | System for improved use of pitch enhancement with subcodebooks |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
GB2342829B (en) | 1998-10-13 | 2003-03-26 | Nokia Mobile Phones Ltd | Postfilter |
CA2252170A1 (en) | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
US6449313B1 (en) | 1999-04-28 | 2002-09-10 | Lucent Technologies Inc. | Shaped fixed codebook search for celp speech coding |
US6704701B1 (en) | 1999-07-02 | 2004-03-09 | Mindspeed Technologies, Inc. | Bi-directional pitch enhancement in speech coding systems |
AU2001241475A1 (en) | 2000-02-11 | 2001-08-20 | Comsat Corporation | Background noise reduction in sinusoidal based speech coding systems |
AU2001287970A1 (en) | 2000-09-15 | 2002-03-26 | Conexant Systems, Inc. | Short-term enhancement in celp speech coding |
US6760698B2 (en) | 2000-09-15 | 2004-07-06 | Mindspeed Technologies Inc. | System for coding speech information using an adaptive codebook with enhanced variable resolution scheme |
US6766289B2 (en) | 2001-06-04 | 2004-07-20 | Qualcomm Incorporated | Fast code-vector searching |
JP3457293B2 (ja) | 2001-06-06 | 2003-10-14 | 三菱電機株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
US6993207B1 (en) | 2001-10-05 | 2006-01-31 | Micron Technology, Inc. | Method and apparatus for electronic image processing |
US7146313B2 (en) | 2001-12-14 | 2006-12-05 | Microsoft Corporation | Techniques for measurement of perceptual audio quality |
CA2501368C (en) * | 2002-10-11 | 2013-06-25 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
US7047188B2 (en) | 2002-11-08 | 2006-05-16 | Motorola, Inc. | Method and apparatus for improvement coding of the subframe gain in a speech coding system |
US7788091B2 (en) | 2004-09-22 | 2010-08-31 | Texas Instruments Incorporated | Methods, devices and systems for improved pitch enhancement and autocorrelation in voice codecs |
JP2006197391A (ja) | 2005-01-14 | 2006-07-27 | Toshiba Corp | 音声ミクシング処理装置及び音声ミクシング処理方法 |
UA92742C2 (ru) * | 2005-04-01 | 2010-12-10 | Квелкомм Инкорпорейтед | Способ и устройство для кодирования речевых сигналов с расщеплением полосы |
KR100956877B1 (ko) | 2005-04-01 | 2010-05-11 | 콸콤 인코포레이티드 | 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치 |
US8280730B2 (en) | 2005-05-25 | 2012-10-02 | Motorola Mobility Llc | Method and apparatus of increasing speech intelligibility in noisy environments |
WO2007087824A1 (de) * | 2006-01-31 | 2007-08-09 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und anordnungen zur audiosignalkodierung |
DE102006022346B4 (de) | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
US8682652B2 (en) | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
US9009032B2 (en) | 2006-11-09 | 2015-04-14 | Broadcom Corporation | Method and system for performing sample rate conversion |
US20100332223A1 (en) | 2006-12-13 | 2010-12-30 | Panasonic Corporation | Audio decoding device and power adjusting method |
US20080208575A1 (en) | 2007-02-27 | 2008-08-28 | Nokia Corporation | Split-band encoding and decoding of an audio signal |
ES2592416T3 (es) * | 2008-07-17 | 2016-11-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Esquema de codificación/decodificación de audio que tiene una derivación conmutable |
PL4231291T3 (pl) * | 2008-12-15 | 2024-04-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
US8484020B2 (en) | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
JP5812998B2 (ja) | 2009-11-19 | 2015-11-17 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | オーディオコーデックにおけるラウドネスおよびシャープネスの補償のための方法および装置 |
CA2792452C (en) | 2010-03-09 | 2018-01-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing an input audio signal using cascaded filterbanks |
US9443534B2 (en) * | 2010-04-14 | 2016-09-13 | Huawei Technologies Co., Ltd. | Bandwidth extension system and approach |
US8600737B2 (en) | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
US8924200B2 (en) * | 2010-10-15 | 2014-12-30 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
US8738385B2 (en) | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
TR201815402T4 (tr) * | 2010-10-25 | 2018-11-21 | Voiceage Corp | Düşük bit hızları ve düşük gecikmede genel audio sinyallerinin kodlanması. |
WO2012158157A1 (en) | 2011-05-16 | 2012-11-22 | Google Inc. | Method for super-wideband noise supression |
CN102802112B (zh) | 2011-05-24 | 2014-08-13 | 鸿富锦精密工业(深圳)有限公司 | 具有音频文件格式转换功能的电子装置 |
US9070361B2 (en) | 2011-06-10 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component |
CN104221081B (zh) * | 2011-11-02 | 2017-03-15 | 瑞典爱立信有限公司 | 带宽扩展音频信号的高频带扩展的生成 |
CN104221082B (zh) * | 2012-03-29 | 2017-03-08 | 瑞典爱立信有限公司 | 谐波音频信号的带宽扩展 |
US9601125B2 (en) | 2013-02-08 | 2017-03-21 | Qualcomm Incorporated | Systems and methods of performing noise modulation and gain adjustment |
US10083708B2 (en) | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
-
2014
- 2014-10-08 US US14/509,676 patent/US10083708B2/en active Active
- 2014-10-09 KR KR1020167011467A patent/KR101941755B1/ko active IP Right Grant
- 2014-10-09 MY MYPI2016701042A patent/MY182788A/en unknown
- 2014-10-09 CA CA2925573A patent/CA2925573C/en active Active
- 2014-10-09 WO PCT/US2014/059901 patent/WO2015054492A1/en active Application Filing
- 2014-10-09 NZ NZ717750A patent/NZ717750A/en unknown
- 2014-10-09 CN CN201480055318.8A patent/CN105612578B/zh active Active
- 2014-10-09 EP EP14786583.6A patent/EP3055861B1/en active Active
- 2014-10-09 MX MX2016004535A patent/MX354886B/es active IP Right Grant
- 2014-10-09 AU AU2014331890A patent/AU2014331890B2/en active Active
- 2014-10-09 HU HUE14786583A patent/HUE036838T2/hu unknown
- 2014-10-09 DK DK14786583.6T patent/DK3055861T3/en active
- 2014-10-09 SG SG11201601790QA patent/SG11201601790QA/en unknown
- 2014-10-09 SI SI201430590T patent/SI3055861T1/en unknown
- 2014-10-09 ES ES14786583.6T patent/ES2660605T3/es active Active
- 2014-10-09 RU RU2016116044A patent/RU2672179C2/ru active
- 2014-10-09 CN CN201910859726.3A patent/CN110634503B/zh active Active
- 2014-10-09 JP JP2016521680A patent/JP6469664B2/ja active Active
-
2016
- 2016-03-15 PH PH12016500506A patent/PH12016500506A1/en unknown
- 2016-04-05 SA SA516370877A patent/SA516370877B1/ar unknown
- 2016-04-08 CL CL2016000818A patent/CL2016000818A1/es unknown
- 2016-07-06 HK HK16107897.1A patent/HK1220033A1/zh unknown
-
2018
- 2018-05-23 US US15/987,840 patent/US10410652B2/en active Active
-
2019
- 2019-05-31 AU AU2019203827A patent/AU2019203827B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6469664B2 (ja) | ハイバンド励振信号を生成するための混合係数の推定 | |
JP6345780B2 (ja) | ハイバンドコーディングにおける選択的位相補償 | |
JP6752936B2 (ja) | ノイズ変調とゲイン調整とを実行するシステムおよび方法 | |
JP6262337B2 (ja) | ハイバンド時間的特性の改善された追跡のための利得形状推定 | |
JP2016541032A5 (ja) | ||
JP2016541032A (ja) | ハイバンド信号モデリング | |
AU2014331903A1 (en) | Gain shape estimation for improved tracking of high-band temporal characteristics | |
RU2667973C2 (ru) | Способы и системы переключения технологий кодирования в устройстве |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160623 Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160624 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170913 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170913 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20180129 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20180208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180518 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180821 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181218 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190116 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6469664 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |