JP2016507087A - 利得制御を行うシステムおよび方法 - Google Patents
利得制御を行うシステムおよび方法 Download PDFInfo
- Publication number
- JP2016507087A JP2016507087A JP2015556928A JP2015556928A JP2016507087A JP 2016507087 A JP2016507087 A JP 2016507087A JP 2015556928 A JP2015556928 A JP 2015556928A JP 2015556928 A JP2015556928 A JP 2015556928A JP 2016507087 A JP2016507087 A JP 2016507087A
- Authority
- JP
- Japan
- Prior art keywords
- gain
- lsp
- audio signal
- frame
- interval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 100
- 230000005236 sound signal Effects 0.000 claims abstract description 153
- 230000004044 response Effects 0.000 claims abstract description 67
- 238000009499 grossing Methods 0.000 claims abstract description 48
- 238000001228 spectrum Methods 0.000 claims abstract description 32
- 230000008859 change Effects 0.000 claims description 73
- 230000005284 excitation Effects 0.000 claims description 19
- 238000001514 detection method Methods 0.000 claims description 18
- 230000006978 adaptation Effects 0.000 claims description 5
- 230000003044 adaptive effect Effects 0.000 claims description 4
- 230000000875 corresponding effect Effects 0.000 description 70
- 238000012360 testing method Methods 0.000 description 28
- 238000012545 processing Methods 0.000 description 11
- 230000001939 inductive effect Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 6
- 230000007704 transition Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 101000712600 Homo sapiens Thyroid hormone receptor beta Proteins 0.000 description 1
- 101150049692 THR4 gene Proteins 0.000 description 1
- 102100033451 Thyroid hormone receptor beta Human genes 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Control Of Amplification And Gain Control (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Telephone Function (AREA)
- Stereophonic System (AREA)
- Noise Elimination (AREA)
Abstract
Description
[0001]本出願は、共通に所有される2013年2月8日に出願された米国仮特許出願第61/762,803号および2013年8月5日に出願された米国特許出願第13/959,090号に基づく優先権を主張し、参照によりその全体が明示的に本明細書に援用される。
[0071]図6を参照すると、ワイヤレス通信デバイスの特定の例示の実施形態を示すブロック図が示されており、全体が600と表記されている。このデバイス600は、メモリ632に結合されたプロセッサ610(たとえば中央演算処理装置(CPU)、デジタルシグナルプロセッサ(DSP)など)を含む。メモリ632は、図3〜図5の方法など、本明細書で開示されている方法および処理を実行するためにプロセッサ610および/または符号化器/復号器(CODEC)634によって実行可能な命令660を含み得る。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[C1]
音声信号のフレームに関連付けられた線スペクトル対(LSP)間隔に基づいて、前記音声信号がアーティファクト生成条件に対応する成分を含むと決定することと、
前記音声信号が前記成分を含むと決定することに応答して、前記音声信号に対応する利得パラメータを調整することと、を備える方法。
[C2]
前記LSP間隔は、前記音声信号のフレームに関連付けられている、C1に記載の方法。
[C3]
前記LSP間隔は、前記音声信号の前記フレームの高帯域部分の複数のLSPに対応する複数のLSP間隔のうちの最小のLSP間隔である、C2に記載の方法。
[C4]
前記音声信号は、前記LSP間隔が第1の閾値未満であることに応答して前記成分を含むと決定される、C2に記載の方法。
[C5]
前記音声信号は、前記LSP間隔が第2の閾値未満であることと平均LSP間隔が第3の閾値未満であることとに応答して前記成分を含むと決定され、ここにおいて、前記平均LSP間隔は前記フレームに関連付けられた前記LSP間隔と前記音声信号の少なくとも1つの他のフレームに関連付けられた少なくとも1つの他のLSP間隔とに基づく、C2に記載の方法。
[C6]
前記音声信号は、
1)前記LSP間隔が第2の閾値未満であることと、
2)平均LSP間隔が第3の閾値未満であること、または
前記音声信号の別のフレームに対応する利得減衰が有効化されていることのうちの少なくとも1つにと応答して、前記成分を含むと決定され、前記別のフレームは前記音声信号の前記フレームに先行する、C2に記載の方法。
[C7]
前記利得パラメータを調整することは、前記音声信号のフレームに対応する利得値における、より高速の変化を低減するために利得平滑化を有効にすることを含む、C1に記載の方法。
[C8]
前記利得平滑化は、前記フレームに関連付けられた前記利得値と前記音声信号の別のフレームに対応する別の利得値との加重平均を決定すること、を含むC7に記載の方法。
[C9]
前記利得平滑化は、前記フレームに関連付けられた第1の線スペクトル対(LSP)変化レートが第4の閾値未満であり、前記フレームに関連付けられた第2のLSP変化レートが第5の閾値未満であることに応答して有効にされる、C7に記載の方法。
[C10]
前記第1のLSP変化レートは、前記第2のLSP変化レートよりも低速の適応レートに対応する、C9に記載の方法。
[C11]
前記利得パラメータを調整することは、前記音声信号のフレームに対応する利得値を低減するために利得減衰を有効にすることを含む、C1に記載の方法。
[C12]
前記利得減衰は、前記利得値に指数演算を適用することを含む、C11に記載の方法。
[C13]
前記利得減衰は、前記利得値に線形演算を適用することを含む、C11に記載の方法。
[C14]
前記利得減衰は、
第1の利得条件が満たされていることに応答して前記利得値に指数演算を適用することと、
第2の利得条件が満たされていることに応答して前記利得値に線形演算を適用することとを含む、C11に記載の方法。
[C15]
前記第1の利得条件は、平均LSP間隔が第6の閾値未満であることを含み、ここにおいて、前記平均LSP間隔は前記フレームに関連付けられた前記LSP間隔と前記音声信号の少なくとも1つの他のフレームに関連付けられた少なくとも1つの他のLSP間隔とに基づく、C14に記載の方法。
[C16]
前記第2の利得条件は、前記音声信号の別のフレームに対応する利得減衰が有効化されていることを含み、前記別のフレームは前記音声信号に先行する、C14に記載の方法。
[C17]
前記アーティファクト生成条件は、高帯域雑音に対応する、C1に記載の方法。
[C18]
音声信号のフレームに関連付けられた線スペクトル対(LSP)間隔を少なくとも1つの閾値と比較することと、
前記比較の結果に少なくとも部分的に基づいて前記音声信号に対応する音声符号化利得パラメータを調整することと、を備える方法。
[C19]
前記LSP間隔は、前記音声信号の前記フレームの高帯域部分の複数のLSPに対応する複数のLSP間隔のうちの最小のLSP間隔である、C18に記載の方法。
[C20]
前記利得パラメータを調整することは、前記LSP間隔が第1の閾値未満であることに応答して利得減衰を有効にすることを含む、C18に記載の方法。
[C21]
前記利得パラメータを調整することは、前記LSP間隔が第2の閾値未満であることと平均LSP間隔が第3の閾値未満であることとに応答して利得減衰を有効にすることを含み、ここにおいて前記平均LSP間隔は前記フレームに関連付けられた前記LSP間隔と前記音声信号の少なくとも1つの他のフレームに関連付けられた少なくとも1つの他のLSP間隔とに基づく、C18に記載の方法。
[C22]
前記利得パラメータを調整することは、利得減衰が有効にされている場合に、
第1の利得条件が満たされていることに応答して、前記利得パラメータの値に指数演算を適用することと、
第2の利得条件が満たされていることに応答して、前記利得パラメータの前記値に線形演算を適用することと、を含むC18に記載の方法。
[C23]
前記利得パラメータを調整することは、前記音声信号のフレームに対応する前記利得値における、より高速の変化を低減するために利得平滑化を有効にすることを含む、C18に記載の方法。
[C24]
前記利得平滑化は、前記フレームに関連付けられた前記利得値と前記音声信号の別のフレームに対応する別の利得値とを含む利得値の加重平均を決定することを含む、C23に記載の方法。
[C25]
前記利得平滑化は、前記フレームに関連付けられた第1の線スペクトル対(LSP)変化レートが第4の閾値未満であることと、前記フレームに関連付けられた第2のLSP変化レートが第5の閾値未満であることとに応答して有効にされ、ここにおいて、前記第1のLSP変化レートは前記第2のLSP変化レートよりも低速な適応レートである、C24に記載の方法。
[C26]
音声信号のフレームに関連付けられた線スペクトル対(LSP)間隔に基づいて前記音声信号がアーティファクト生成条件に対応する成分を含むと決定するように構成された雑音検出回路と、
前記雑音検出回路に応答し、前記音声信号が前記成分を含むと決定することに応答して前記音声信号に対応する利得パラメータを調整するように構成された利得減衰および平滑化回路と、を備える装置。
[C27]
前記音声信号を受信し、前記音声信号の低帯域部分と前記音声信号の高帯域部分とを生成するように構成された解析フィルタバンクと、
前記低帯域部分に基づいて低帯域ビットストリームを生成するように構成された低帯域解析回路と、
前記高帯域部分と前記低帯域部分に関連付けられた低帯域励起とに基づいて高帯域サイド情報を生成するように構成された高帯域解析回路と、ここにおいて、前記利得パラメータを含む利得情報が前記高帯域サイド情報に含まれる、
出力ビットストリームを生成するために前記低帯域ビットストリームと前記高帯域サイド情報とを多重化するように構成されたマルチプレクサと、をさらに備えるC26に記載の装置。
[C28]
音声信号のフレームに関連付けられた線スペクトル対(LSP)間隔に基づいて、前記音声信号がアーティファクト生成条件に対応する成分を含むと決定するための手段と、
前記音声信号が前記成分を含むと決定することに応答して前記音声信号に対応する利得パラメータを調整するための手段と、を備える装置。
[C29]
前記音声信号の低帯域部分と前記音声信号の高帯域部分とを生成するための手段と、
前記低帯域部分に基づいて低帯域ビットストリームを生成するための手段と、
前記高帯域部分と前記低帯域部分に関連付けられた低帯域励起とに基づいて高帯域サイド情報を生成するための手段と、ここにおいて、前記利得パラメータを含む利得情報が前記高帯域サイド情報に含まれる、
出力ビットストリームを生成するために前記低帯域ビットストリームと前記高帯域サイド情報とを多重化するための手段と、を備えるC28に記載の装置。
[C30]
コンピュータによって実行されると、前記コンピュータに、
音声信号に対応する音声信号のフレームに関連付けられた線スペクトル対(LSP)間隔に基づいて、前記音声信号がアーティファクト生成条件に対応する成分を含むと決定させ、
前記音声信号が前記成分を含むと決定することに応答して前記音声信号に対応する利得パラメータを調整させる命令、を備える非一時的コンピュータ可読媒体。
[C31]
前記LSP間隔は、前記音声信号の前記フレームの高帯域部分の複数のLSPに対応する複数のLSP間隔のうちの最小のLSP間隔である、C30に記載のコンピュータ可読媒体。
[C32]
前記利得パラメータを調整することは、前記LSP間隔が第1の閾値未満であることに応答して利得減衰を有効にすることを含む、C30に記載のコンピュータ可読媒体。
[C33]
前記利得パラメータを調整することは、前記LSP間隔が第2の閾値未満であることと平均LSP間隔が第3の閾値未満であることとに応答して利得減衰を有効にすることを含み、ここにおいて、前記平均LSP間隔は前記フレームに関連付けられた前記LSP間隔と前記音声信号の少なくとも1つの他のフレームに関連付けられた少なくとも1つの他のLSP間隔とに基づく、C30に記載のコンピュータ可読媒体。
[C34]
前記利得パラメータを調整することは、利得減衰が有効にされている場合に、
第1の利得条件が満たされていることに応答して、前記利得パラメータの値に指数演算を適用することと、
第2の利得条件が満たされていることに応答して、前記利得パラメータの前記値に線形演算を適用することと、を含むC30に記載のコンピュータ可読媒体。
[C35]
前記利得パラメータを調整することは、前記音声信号のフレームに対応する前記利得値における、より高速の変化を低減するために利得平滑化を有効にすることを含む、C30に記載のコンピュータ可読媒体。
[C36]
前記利得平滑化は、前記フレームに関連付けられた前記利得値と前記音声信号の別のフレームに対応する別の利得値とを含む利得値の加重平均を決定することを含む、C35に記載のコンピュータ可読媒体。
[C37]
前記利得平滑化は、前記フレームに関連付けられた第1の線スペクトル対(LSP)変化レートが第4の閾値未満であることと、前記フレームに関連付けられた第2のLSP変化レートが第5の閾値未満であることとに応答して有効にされ、ここにおいて、前記第1のLSP変化レートは前記第2のLSP変化レートよりも低速な適応レートである、C36に記載のコンピュータ可読媒体。
Claims (37)
- 音声信号のフレームに関連付けられた線スペクトル対(LSP)間隔に基づいて、前記音声信号がアーティファクト生成条件に対応する成分を含むと決定することと、
前記音声信号が前記成分を含むと決定することに応答して、前記音声信号に対応する利得パラメータを調整することと、を備える方法。 - 前記LSP間隔は、前記音声信号のフレームに関連付けられている、請求項1に記載の方法。
- 前記LSP間隔は、前記音声信号の前記フレームの高帯域部分の複数のLSPに対応する複数のLSP間隔のうちの最小のLSP間隔である、請求項2に記載の方法。
- 前記音声信号は、前記LSP間隔が第1の閾値未満であることに応答して前記成分を含むと決定される、請求項2に記載の方法。
- 前記音声信号は、前記LSP間隔が第2の閾値未満であることと平均LSP間隔が第3の閾値未満であることとに応答して前記成分を含むと決定され、ここにおいて、前記平均LSP間隔は前記フレームに関連付けられた前記LSP間隔と前記音声信号の少なくとも1つの他のフレームに関連付けられた少なくとも1つの他のLSP間隔とに基づく、請求項2に記載の方法。
- 前記音声信号は、
1)前記LSP間隔が第2の閾値未満であることと、
2)平均LSP間隔が第3の閾値未満であること、または
前記音声信号の別のフレームに対応する利得減衰が有効化されていることのうちの少なくとも1つにと応答して、前記成分を含むと決定され、前記別のフレームは前記音声信号の前記フレームに先行する、請求項2に記載の方法。 - 前記利得パラメータを調整することは、前記音声信号のフレームに対応する利得値における、より高速の変化を低減するために利得平滑化を有効にすることを含む、請求項1に記載の方法。
- 前記利得平滑化は、前記フレームに関連付けられた前記利得値と前記音声信号の別のフレームに対応する別の利得値との加重平均を決定すること、を含む請求項7に記載の方法。
- 前記利得平滑化は、前記フレームに関連付けられた第1の線スペクトル対(LSP)変化レートが第4の閾値未満であり、前記フレームに関連付けられた第2のLSP変化レートが第5の閾値未満であることに応答して有効にされる、請求項7に記載の方法。
- 前記第1のLSP変化レートは、前記第2のLSP変化レートよりも低速の適応レートに対応する、請求項9に記載の方法。
- 前記利得パラメータを調整することは、前記音声信号のフレームに対応する利得値を低減するために利得減衰を有効にすることを含む、請求項1に記載の方法。
- 前記利得減衰は、前記利得値に指数演算を適用することを含む、請求項11に記載の方法。
- 前記利得減衰は、前記利得値に線形演算を適用することを含む、請求項11に記載の方法。
- 前記利得減衰は、
第1の利得条件が満たされていることに応答して前記利得値に指数演算を適用することと、
第2の利得条件が満たされていることに応答して前記利得値に線形演算を適用することとを含む、請求項11に記載の方法。 - 前記第1の利得条件は、平均LSP間隔が第6の閾値未満であることを含み、ここにおいて、前記平均LSP間隔は前記フレームに関連付けられた前記LSP間隔と前記音声信号の少なくとも1つの他のフレームに関連付けられた少なくとも1つの他のLSP間隔とに基づく、請求項14に記載の方法。
- 前記第2の利得条件は、前記音声信号の別のフレームに対応する利得減衰が有効化されていることを含み、前記別のフレームは前記音声信号に先行する、請求項14に記載の方法。
- 前記アーティファクト生成条件は、高帯域雑音に対応する、請求項1に記載の方法。
- 音声信号のフレームに関連付けられた線スペクトル対(LSP)間隔を少なくとも1つの閾値と比較することと、
前記比較の結果に少なくとも部分的に基づいて前記音声信号に対応する音声符号化利得パラメータを調整することと、を備える方法。 - 前記LSP間隔は、前記音声信号の前記フレームの高帯域部分の複数のLSPに対応する複数のLSP間隔のうちの最小のLSP間隔である、請求項18に記載の方法。
- 前記利得パラメータを調整することは、前記LSP間隔が第1の閾値未満であることに応答して利得減衰を有効にすることを含む、請求項18に記載の方法。
- 前記利得パラメータを調整することは、前記LSP間隔が第2の閾値未満であることと平均LSP間隔が第3の閾値未満であることとに応答して利得減衰を有効にすることを含み、ここにおいて前記平均LSP間隔は前記フレームに関連付けられた前記LSP間隔と前記音声信号の少なくとも1つの他のフレームに関連付けられた少なくとも1つの他のLSP間隔とに基づく、請求項18に記載の方法。
- 前記利得パラメータを調整することは、利得減衰が有効にされている場合に、
第1の利得条件が満たされていることに応答して、前記利得パラメータの値に指数演算を適用することと、
第2の利得条件が満たされていることに応答して、前記利得パラメータの前記値に線形演算を適用することと、を含む請求項18に記載の方法。 - 前記利得パラメータを調整することは、前記音声信号のフレームに対応する前記利得値における、より高速の変化を低減するために利得平滑化を有効にすることを含む、請求項18に記載の方法。
- 前記利得平滑化は、前記フレームに関連付けられた前記利得値と前記音声信号の別のフレームに対応する別の利得値とを含む利得値の加重平均を決定することを含む、請求項23に記載の方法。
- 前記利得平滑化は、前記フレームに関連付けられた第1の線スペクトル対(LSP)変化レートが第4の閾値未満であることと、前記フレームに関連付けられた第2のLSP変化レートが第5の閾値未満であることとに応答して有効にされ、ここにおいて、前記第1のLSP変化レートは前記第2のLSP変化レートよりも低速な適応レートである、請求項24に記載の方法。
- 音声信号のフレームに関連付けられた線スペクトル対(LSP)間隔に基づいて前記音声信号がアーティファクト生成条件に対応する成分を含むと決定するように構成された雑音検出回路と、
前記雑音検出回路に応答し、前記音声信号が前記成分を含むと決定することに応答して前記音声信号に対応する利得パラメータを調整するように構成された利得減衰および平滑化回路と、を備える装置。 - 前記音声信号を受信し、前記音声信号の低帯域部分と前記音声信号の高帯域部分とを生成するように構成された解析フィルタバンクと、
前記低帯域部分に基づいて低帯域ビットストリームを生成するように構成された低帯域解析回路と、
前記高帯域部分と前記低帯域部分に関連付けられた低帯域励起とに基づいて高帯域サイド情報を生成するように構成された高帯域解析回路と、ここにおいて、前記利得パラメータを含む利得情報が前記高帯域サイド情報に含まれる、
出力ビットストリームを生成するために前記低帯域ビットストリームと前記高帯域サイド情報とを多重化するように構成されたマルチプレクサと、をさらに備える請求項26に記載の装置。 - 音声信号のフレームに関連付けられた線スペクトル対(LSP)間隔に基づいて、前記音声信号がアーティファクト生成条件に対応する成分を含むと決定するための手段と、
前記音声信号が前記成分を含むと決定することに応答して前記音声信号に対応する利得パラメータを調整するための手段と、を備える装置。 - 前記音声信号の低帯域部分と前記音声信号の高帯域部分とを生成するための手段と、
前記低帯域部分に基づいて低帯域ビットストリームを生成するための手段と、
前記高帯域部分と前記低帯域部分に関連付けられた低帯域励起とに基づいて高帯域サイド情報を生成するための手段と、ここにおいて、前記利得パラメータを含む利得情報が前記高帯域サイド情報に含まれる、
出力ビットストリームを生成するために前記低帯域ビットストリームと前記高帯域サイド情報とを多重化するための手段と、を備える請求項28に記載の装置。 - コンピュータによって実行されると、前記コンピュータに、
音声信号に対応する音声信号のフレームに関連付けられた線スペクトル対(LSP)間隔に基づいて、前記音声信号がアーティファクト生成条件に対応する成分を含むと決定させ、
前記音声信号が前記成分を含むと決定することに応答して前記音声信号に対応する利得パラメータを調整させる命令、を備える非一時的コンピュータ可読媒体。 - 前記LSP間隔は、前記音声信号の前記フレームの高帯域部分の複数のLSPに対応する複数のLSP間隔のうちの最小のLSP間隔である、請求項30に記載のコンピュータ可読媒体。
- 前記利得パラメータを調整することは、前記LSP間隔が第1の閾値未満であることに応答して利得減衰を有効にすることを含む、請求項30に記載のコンピュータ可読媒体。
- 前記利得パラメータを調整することは、前記LSP間隔が第2の閾値未満であることと平均LSP間隔が第3の閾値未満であることとに応答して利得減衰を有効にすることを含み、ここにおいて、前記平均LSP間隔は前記フレームに関連付けられた前記LSP間隔と前記音声信号の少なくとも1つの他のフレームに関連付けられた少なくとも1つの他のLSP間隔とに基づく、請求項30に記載のコンピュータ可読媒体。
- 前記利得パラメータを調整することは、利得減衰が有効にされている場合に、
第1の利得条件が満たされていることに応答して、前記利得パラメータの値に指数演算を適用することと、
第2の利得条件が満たされていることに応答して、前記利得パラメータの前記値に線形演算を適用することと、を含む請求項30に記載のコンピュータ可読媒体。 - 前記利得パラメータを調整することは、前記音声信号のフレームに対応する前記利得値における、より高速の変化を低減するために利得平滑化を有効にすることを含む、請求項30に記載のコンピュータ可読媒体。
- 前記利得平滑化は、前記フレームに関連付けられた前記利得値と前記音声信号の別のフレームに対応する別の利得値とを含む利得値の加重平均を決定することを含む、請求項35に記載のコンピュータ可読媒体。
- 前記利得平滑化は、前記フレームに関連付けられた第1の線スペクトル対(LSP)変化レートが第4の閾値未満であることと、前記フレームに関連付けられた第2のLSP変化レートが第5の閾値未満であることとに応答して有効にされ、ここにおいて、前記第1のLSP変化レートは前記第2のLSP変化レートよりも低速な適応レートである、請求項36に記載のコンピュータ可読媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361762803P | 2013-02-08 | 2013-02-08 | |
US61/762,803 | 2013-02-08 | ||
US13/959,090 | 2013-08-05 | ||
US13/959,090 US9741350B2 (en) | 2013-02-08 | 2013-08-05 | Systems and methods of performing gain control |
PCT/US2013/053791 WO2014123578A1 (en) | 2013-02-08 | 2013-08-06 | Systems and methods of performing gain control |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016507087A true JP2016507087A (ja) | 2016-03-07 |
JP2016507087A5 JP2016507087A5 (ja) | 2017-02-09 |
JP6185085B2 JP6185085B2 (ja) | 2017-08-23 |
Family
ID=51298065
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015556928A Active JP6185085B2 (ja) | 2013-02-08 | 2013-08-06 | 利得制御を行うシステムおよび方法 |
Country Status (24)
Country | Link |
---|---|
US (1) | US9741350B2 (ja) |
EP (1) | EP2954524B1 (ja) |
JP (1) | JP6185085B2 (ja) |
KR (1) | KR101783114B1 (ja) |
CN (1) | CN104956437B (ja) |
AU (1) | AU2013377884B2 (ja) |
BR (1) | BR112015019056B1 (ja) |
CA (1) | CA2896811C (ja) |
DK (1) | DK2954524T3 (ja) |
ES (1) | ES2618258T3 (ja) |
HK (1) | HK1211376A1 (ja) |
HR (1) | HRP20170232T1 (ja) |
HU (1) | HUE031736T2 (ja) |
IL (1) | IL239718A (ja) |
MY (1) | MY183416A (ja) |
PH (1) | PH12015501694A1 (ja) |
PT (1) | PT2954524T (ja) |
RS (1) | RS55653B1 (ja) |
RU (1) | RU2643454C2 (ja) |
SG (1) | SG11201505066SA (ja) |
SI (1) | SI2954524T1 (ja) |
UA (1) | UA114027C2 (ja) |
WO (1) | WO2014123578A1 (ja) |
ZA (1) | ZA201506578B (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
US10163453B2 (en) * | 2014-10-24 | 2018-12-25 | Staton Techiya, Llc | Robust voice activity detector system for use with an earphone |
US10346125B2 (en) * | 2015-08-18 | 2019-07-09 | International Business Machines Corporation | Detection of clipping event in audio signals |
BR112017024480A2 (pt) | 2016-02-17 | 2018-07-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | pós-processador, pré-processador, codificador de áudio, decodificador de áudio e métodos relacionados para aprimoramento do processamento transiente |
CN106067847B (zh) * | 2016-05-25 | 2019-10-22 | 腾讯科技(深圳)有限公司 | 一种语音数据传输方法及装置 |
EP3288031A1 (en) | 2016-08-23 | 2018-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding an audio signal using a compensation value |
CN108011686B (zh) * | 2016-10-31 | 2020-07-14 | 腾讯科技(深圳)有限公司 | 信息编码帧丢失恢复方法和装置 |
WO2021260683A1 (en) * | 2020-06-21 | 2021-12-30 | Biosound Ltd. | System, device and method for improving plant growth |
CN113473316B (zh) * | 2021-06-30 | 2023-01-31 | 苏州科达科技股份有限公司 | 音频信号处理方法、装置及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04230800A (ja) * | 1990-05-28 | 1992-08-19 | Matsushita Electric Ind Co Ltd | 音声信号処理装置 |
JP2000221998A (ja) * | 1999-01-28 | 2000-08-11 | Matsushita Electric Ind Co Ltd | 音声符号化方法及び音声符号化装置 |
WO2012110447A1 (en) * | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6263307B1 (en) | 1995-04-19 | 2001-07-17 | Texas Instruments Incorporated | Adaptive weiner filtering using line spectral frequencies |
US6453289B1 (en) | 1998-07-24 | 2002-09-17 | Hughes Electronics Corporation | Method of noise reduction for speech codecs |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
CA2399706C (en) | 2000-02-11 | 2006-01-24 | Comsat Corporation | Background noise reduction in sinusoidal based speech coding systems |
AU2002218520A1 (en) * | 2000-11-30 | 2002-06-11 | Matsushita Electric Industrial Co., Ltd. | Audio decoder and audio decoding method |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
CN102592604A (zh) * | 2005-01-14 | 2012-07-18 | 松下电器产业株式会社 | 可扩展性解码装置及可扩展性解码方法 |
BRPI0608269B8 (pt) | 2005-04-01 | 2019-09-03 | Qualcomm Inc | método e aparelho para quantização vetorial de uma representação de envelope espectral |
TR201821299T4 (tr) | 2005-04-22 | 2019-01-21 | Qualcomm Inc | Kazanç faktörü yumuşatma için sistemler, yöntemler ve aparat. |
US8725499B2 (en) | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
CA2670973C (en) * | 2006-11-30 | 2016-10-11 | Anthony Bongiovi | System and method for digital signal processing |
US20080208575A1 (en) | 2007-02-27 | 2008-08-28 | Nokia Corporation | Split-band encoding and decoding of an audio signal |
CN100585699C (zh) * | 2007-11-02 | 2010-01-27 | 华为技术有限公司 | 一种音频解码的方法和装置 |
DE112007003716T5 (de) * | 2007-11-26 | 2011-01-13 | Fujitsu Ltd., Kawasaki | Klangverarbeitungsvorrichtung, Korrekturvorrichtung, Korrekturverfahren und Computergrogramm |
US8554551B2 (en) * | 2008-01-28 | 2013-10-08 | Qualcomm Incorporated | Systems, methods, and apparatus for context replacement by audio level |
EP2211335A1 (en) * | 2009-01-21 | 2010-07-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal |
US8484020B2 (en) * | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
US8869271B2 (en) | 2010-02-02 | 2014-10-21 | Mcafee, Inc. | System and method for risk rating and detecting redirection activities |
US8600737B2 (en) * | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
US8381276B2 (en) | 2010-08-23 | 2013-02-19 | Microsoft Corporation | Safe URL shortening |
WO2012158157A1 (en) | 2011-05-16 | 2012-11-22 | Google Inc. | Method for super-wideband noise supression |
-
2013
- 2013-08-05 US US13/959,090 patent/US9741350B2/en active Active
- 2013-08-06 BR BR112015019056-1A patent/BR112015019056B1/pt active IP Right Grant
- 2013-08-06 SG SG11201505066SA patent/SG11201505066SA/en unknown
- 2013-08-06 KR KR1020157023782A patent/KR101783114B1/ko active IP Right Grant
- 2013-08-06 MY MYPI2015702274A patent/MY183416A/en unknown
- 2013-08-06 WO PCT/US2013/053791 patent/WO2014123578A1/en active Application Filing
- 2013-08-06 RU RU2015138122A patent/RU2643454C2/ru active
- 2013-08-06 ES ES13753223.0T patent/ES2618258T3/es active Active
- 2013-08-06 PT PT137532230T patent/PT2954524T/pt unknown
- 2013-08-06 UA UAA201508663A patent/UA114027C2/uk unknown
- 2013-08-06 SI SI201330520A patent/SI2954524T1/sl unknown
- 2013-08-06 CA CA2896811A patent/CA2896811C/en active Active
- 2013-08-06 RS RS20170102A patent/RS55653B1/sr unknown
- 2013-08-06 AU AU2013377884A patent/AU2013377884B2/en active Active
- 2013-08-06 CN CN201380071693.7A patent/CN104956437B/zh active Active
- 2013-08-06 HU HUE13753223A patent/HUE031736T2/en unknown
- 2013-08-06 JP JP2015556928A patent/JP6185085B2/ja active Active
- 2013-08-06 EP EP13753223.0A patent/EP2954524B1/en active Active
- 2013-08-06 DK DK13753223.0T patent/DK2954524T3/en active
-
2015
- 2015-06-30 IL IL239718A patent/IL239718A/en active IP Right Grant
- 2015-07-31 PH PH12015501694A patent/PH12015501694A1/en unknown
- 2015-09-07 ZA ZA2015/06578A patent/ZA201506578B/en unknown
- 2015-12-07 HK HK15112044.4A patent/HK1211376A1/xx unknown
-
2017
- 2017-02-13 HR HRP20170232TT patent/HRP20170232T1/hr unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04230800A (ja) * | 1990-05-28 | 1992-08-19 | Matsushita Electric Ind Co Ltd | 音声信号処理装置 |
JP2000221998A (ja) * | 1999-01-28 | 2000-08-11 | Matsushita Electric Ind Co Ltd | 音声符号化方法及び音声符号化装置 |
WO2012110447A1 (en) * | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6185085B2 (ja) | 利得制御を行うシステムおよび方法 | |
JP6456847B2 (ja) | 利得決定のためにフィルタリングを実施するシステムおよび方法 | |
JP6262337B2 (ja) | ハイバンド時間的特性の改善された追跡のための利得形状推定 | |
US9293143B2 (en) | Bandwidth extension mode selection | |
JP6526096B2 (ja) | 平均符号化レートを制御するためのシステムおよび方法 | |
JP6469664B2 (ja) | ハイバンド励振信号を生成するための混合係数の推定 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160707 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160707 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170106 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20170106 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20170228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170307 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170516 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170627 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170726 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6185085 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |