JP6892491B2 - 会話/音声信号処理方法および符号化装置 - Google Patents
会話/音声信号処理方法および符号化装置 Download PDFInfo
- Publication number
- JP6892491B2 JP6892491B2 JP2019198664A JP2019198664A JP6892491B2 JP 6892491 B2 JP6892491 B2 JP 6892491B2 JP 2019198664 A JP2019198664 A JP 2019198664A JP 2019198664 A JP2019198664 A JP 2019198664A JP 6892491 B2 JP6892491 B2 JP 6892491B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- harmonized
- conversation
- wideband
- broadband
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 19
- 230000005236 sound signal Effects 0.000 claims description 75
- 238000000034 method Methods 0.000 claims description 67
- 230000001052 transient effect Effects 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 7
- 230000002040 relaxant effect Effects 0.000 claims 1
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 2
- 235000019987 cider Nutrition 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
もし、第1の広帯域会話/音声信号が調和信号であるならば、第2の広帯域会話/音声信号が調和信号であると決定するための決定条件を、前記第2の広帯域会話/音声信号が調和信号であると決定する可能性を上昇させるように第1の決定条件を取得するために、調整する調整ステップであり、第1の広帯域会話信号が広帯域スイッチング前の信号であり、第2の広帯域会話信号が広帯域スイッチング後の信号である、調整ステップと、
第1の決定条件に従って、第2の広帯域会話/音声信号が調和信号であるか否かを決定する決定ステップと、を備える。
第1の広帯域会話/音声信号が調和信号であるならば、第2の広帯域会話/音声信号が調和信号であると決定するための決定条件を、前記第2の広帯域会話/音声信号が調和信号であると決定する可能性を上昇させるように第1の決定条件を取得するために、調整するように構成された決定条件調整モジュールであり、第1の広帯域会話信号が広帯域スイッチング前の信号であり、第2の広帯域会話信号が広帯域スイッチング後の信号である、決定条件調整モジュールと、
第1の決定条件に従って、第2の広帯域会話/音声信号が調和信号であるか否かを決定するように構成された信号タイプ決定モジュールと、を備える。
その後、エンコーダは、符号化された信号をデコーダに送信し得、デコーダは、調和信号および非調和信号を復元するために、符号化された信号を受信した後、符号化された信号を復号化するために対応する復号化方法を使用し得る。信号特徴の点において、調和信号と非調和信号との間には著しい差が存在するので、2つの信号の出力は、デコーダにおいてユーザによって聞かれる会話/音声信号を断続的にする。非調和信号、すなわち、ノイズ信号と、過渡信号と、コモン信号の3つの信号タイプの間のスイッチングに関しては、デコーダ機器について、復号化された会話/音声信号は、著しく影響されない。
第2の広帯域会話/音声信号が調和信号であると決定する可能性を減少させるように第2の決定条件を取得するために、調和信号決定条件を調整する調整ステップと、第2の決定条件に従って、第2の広帯域会話/音声信号が調和信号であるか否かをさらに決定する決定ステップと、をさらに含み得る。
Claims (23)
- 会話/音声信号処理方法であって、
もし、第1の広帯域会話/音声信号が調和信号であるならば、第2の広帯域会話/音声信号が調和信号であると決定する可能性を上昇させるように第1の決定条件を取得するために、前記第2の広帯域会話/音声信号が調和信号であると決定するための決定条件を調整する調整ステップであって、前記第1の広帯域会話/音声信号は、広帯域スイッチング前の会話/音声信号であり、前記第2の広帯域会話/音声信号は、広帯域スイッチング後の会話/音声信号であり、前記第1の広帯域会話/音声信号は、超広帯域信号であり、前記スイッチング後の前記第2の広帯域会話/音声信号は、広帯域信号である、または、前記第1の広帯域会話/音声信号は、広帯域信号であり、前記スイッチング後の前記第2の広帯域会話/音声信号は、超広帯域信号である、調整ステップと、
前記第1の決定条件に従って、前記第2の広帯域会話/音声信号が調和信号であるか否かを決定する決定ステップと、を備える
方法。 - 請求項1に記載の方法であって、第2の広帯域会話/音声信号が調和信号であると決定する可能性を上昇させるように第1の決定条件を取得するために、前記第2の広帯域会話/音声信号が調和信号であると決定するための決定条件を調整する前記調整ステップが、
前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件を緩和する緩和ステップであり、緩和された決定条件が前記第1の決定条件として使用される、緩和ステップを含む、
方法。 - 請求項2に記載の方法であって、前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件を緩和する前記緩和ステップが、
前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件における調和周波数帯域量閾値および最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を減少させる減少ステップを含み、
前記第1の決定条件に従って、前記第2の広帯域会話/音声信号が調和信号であるか否かを決定する前記決定ステップが、
前記第2の広帯域会話/音声信号の調和周波数帯域量および最大ピーク値パラメータを計算する計算ステップと、
もし、前記調和周波数帯域量が減少した調和周波数帯域量閾値より大きい、および/または、前記最大ピーク値パラメータが減少した最大ピーク値パラメータ閾値より大きいならば、前記第2の広帯域会話/音声信号が調和信号であると決定する決定ステップと、を含む、
方法。 - 請求項3に記載の方法であって、
前記調和周波数帯域量と、前記最大ピーク値パラメータと、前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件との間の関係に従って、調和モードカウント値を更新する更新ステップをさらに備え、
もし、前記調和周波数帯域量が前記減少した調和周波数帯域量閾値以下であり、かつ、前記最大ピーク値パラメータが前記減少した最大ピーク値パラメータ閾値以下であるならば、前記方法は、
もし、前記調和モードカウント値がプリセット値より大きいならば、前記第2の広帯域会話/音声信号が調和信号であると決定する決定ステップをさらに備える、
方法。 - 請求項4に記載の方法であって、前記調和周波数帯域量と、前記最大ピーク値パラメータと、前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件との間の関係に従って、調和モードカウント値を更新する前記更新ステップは、
もし、前記調和周波数帯域量が前記調和周波数帯域量閾値より大きく、かつ、前記最大ピーク値パラメータが前記最大ピーク値パラメータ閾値より大きいならば、前記調和モードカウント値を増加させる増加ステップと、
もし、前記調和周波数帯域量が前記調和周波数帯域量閾値以下である、および/または、前記最大ピーク値パラメータが前記最大ピーク値パラメータ閾値以下であるならば、前記調和モードカウント値を減少させる減少ステップと、を含む、
方法。 - 請求項4または5に記載の方法であって、前記第1の広帯域会話/音声信号は広帯域信号であり、前記第2の広帯域会話/音声信号は超広帯域信号であり、前記第1の決定条件に従って、前記第2の広帯域会話/音声信号が調和信号であるか否かを決定する決定ステップの前に、前記方法は、
前記超広帯域信号の時間包絡線パラメータを計算する計算ステップと、過渡信号決定条件における包絡線閾値を増加させる増加ステップと、
もし、前記時間包絡線パラメータが増加した包絡線閾値以上であるならば、前記超広帯域信号が過渡信号であると決定する決定ステップと、
もし、前記時間包絡線パラメータが前記増加した包絡線閾値未満であるならば、前記超広帯域信号が過渡信号ではないとデフォルトで決定し、前記広帯域信号のグローバルエネルギーに対する前記超広帯域信号のグローバルエネルギーの比がプリセット範囲に含まれるとデフォルトで決定するステップと、をさらに備える、
方法。 - 請求項6に記載の方法であって、過渡信号決定条件における包絡線閾値を増加させる増加ステップは、具体的には、
もし、前記広帯域信号が調和信号であるならば、前記包絡線閾値を3倍に増加させる増加ステップと、
もし、前記広帯域信号が非調和信号であるならば、前記包絡線閾値を2倍に増加させる増加ステップである、
方法。 - 請求項1乃至7のいずれか1項に記載の方法であって、
もし、前記第1の広帯域会話/音声信号が調和信号ではないならば、第2の広帯域会話/音声信号が調和信号であると決定する可能性を低下させるように第2の決定条件を取得するために、前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件を調整する調整ステップと、
前記第2の決定条件に従って、前記第2の広帯域会話/音声信号が調和信号であるか否かを決定する決定ステップと、をさらに備える、
方法。 - 請求項8に記載の方法であって、第2の広帯域会話/音声信号が調和信号であると決定する可能性を低下させるように第2の決定条件を取得するために、前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件を調整する前記調整ステップは、
前記第2の広帯域会話/音声信号が調和信号であると決定する前記決定条件における調和周波数帯域量閾値および最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を増加させる増加ステップを含み、
前記第2の決定条件に従って、前記第2の広帯域会話/音声信号が調和信号であるか否かを決定する前記決定ステップは、
前記第2の広帯域会話/音声信号の調和周波数帯域量および最大ピーク値パラメータを計算する計算ステップと、
もし、前記調和周波数帯域量が増加した調和周波数帯域量閾値より大きい、および/または、前記最大ピーク値パラメータが増加した最大ピーク値パラメータ閾値より大きいならば、前記第2の広帯域会話/音声信号が調和信号であると決定する決定ステップと、を含む、
方法。 - 請求項1乃至7のいずれか1項に記載の方法であって、
もし、前記第1の広帯域会話/音声信号が調和信号ではないならば、前記第2の広帯域会話/音声信号が非調和信号であると決定する決定ステップをさらに備える、
方法。 - 請求項1または2に記載の方法であって、前記第1の決定条件に従って、前記第2の広帯域会話/音声信号が調和信号であるか否かを決定する前記決定ステップは、
前記第1の決定条件に従って、前記第2の広帯域会話/音声信号が調和信号であると決定する決定ステップを含む、
方法。 - 符号化装置であって、
もし、第1の広帯域会話/音声信号が調和信号であるならば、第2の広帯域会話/音声信号が調和信号であると決定する可能性を上昇させるように第1の決定条件を取得するために、前記第2の広帯域会話/音声信号が調和信号であると決定する決定条件を調整するように構成されている決定条件調整モジュールであり、前記第1の広帯域会話/音声信号は、広帯域スイッチング前の会話/音声信号であり、前記第2の広帯域会話/音声信号は、広帯域スイッチング後の会話/音声信号であり、前記第1の広帯域会話/音声信号は、超広帯域信号であり、前記スイッチング後の前記第2の広帯域会話/音声信号は、広帯域信号である、または、前記第1の広帯域会話/音声信号は、広帯域信号であり、前記スイッチング後の前記第2の広帯域会話/音声信号は、超広帯域信号である、決定条件調整モジュールと、
前記第1の決定条件に従って、前記第2の広帯域会話/音声信号が調和信号であるか否かを決定するように構成されている信号タイプ決定モジュールと、を備える
装置。 - 請求項12に記載の装置であって、前記決定条件調整モジュールは、具体的には、前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件を緩和するように構成され、緩和された決定条件が前記第1の決定条件として使用される、
装置。 - 請求項13に記載の装置であって、前記決定条件調整モジュールは、具体的には、前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件における調和周波数帯域量閾値および最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を減少させるように構成され、
前記信号タイプ決定モジュールは、
前記第2の広帯域会話/音声信号の調和周波数帯域量および最大ピーク値パラメータを計算するように構成された計算ユニットと、
もし、前記調和周波数帯域量が減少した調和周波数帯域量閾値より大きい、および/または、前記最大ピーク値パラメータが減少した最大ピーク値パラメータ閾値より大きいならば、前記第2の広帯域会話/音声信号が調和信号であると決定するように構成されている処理ユニットと、を含む、
装置。 - 請求項14に記載の装置であって、前記装置は、
前記調和周波数帯域量と、前記最大ピーク値パラメータと、前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件との間の関係に従って、調和モードカウント値を更新するように構成されている調和モード更新モジュールをさらに備え、
前記信号タイプ決定モジュールは、もし、前記調和周波数帯域量が前記減少した調和周波数帯域量閾値以下であり、前記最大ピーク値パラメータが前記減少した最大ピーク値パラメータ閾値以下であり、前記調和モードカウント値がプリセット値より大きいならば、前記第2の広帯域会話/音声信号が調和信号であると決定するようにさらに構成されている、
装置。 - 請求項15に記載の装置であって、前記調和モード更新モジュールは、具体的には、もし、前記調和周波数帯域量が前記調和周波数帯域量閾値より大きく、かつ、前記最大ピーク値パラメータが前記最大ピーク値パラメータ閾値より大きいならば、前記調和モードカウント値を増加させ、もし、前記調和周波数帯域量が前記調和周波数帯域量閾値以下である、および/または、前記最大ピーク値パラメータが前記最大ピーク値パラメータ閾値以下であるならば、前記調和モードカウント値を減少させるように構成されている、
装置。 - 請求項14または15に記載の装置であって、前記第1の広帯域会話/音声信号は広帯域信号であり、前記第2の広帯域会話/音声信号は超広帯域信号であり、前記決定条件調整モジュールは、前記超広帯域信号の時間包絡線パラメータを計算し、過渡信号決定条件における包絡線閾値を増加させるように、もし、前記時間包絡線パラメータが増加した包絡線閾値以上であるならば、前記超広帯域信号が過渡信号であると決定するように、そして、もし、前記時間包絡線パラメータが前記増加した包絡線閾値未満であるならば、前記超広帯域信号が過渡信号ではないとデフォルトで決定し、前記広帯域信号のグローバルエネルギーに対する前記超広帯域信号のグローバルエネルギーの比がプリセット範囲に含まれるとデフォルトで決定するように構成されている、
装置。 - 請求項17に記載の装置であって、前記決定条件調整モジュールは、具体的には、もし、前記広帯域信号が調和信号であるならば、前記包絡線閾値を3倍に増加させるように、もし、前記広帯域信号が非調和信号であるならば、前記包絡線閾値を2倍に増加させるように構成されている、
装置。 - 請求項12乃至18のいずれか1項に記載の装置であって、前記決定条件調整モジュールは、もし、前記第1の広帯域会話/音声信号が調和信号ではないならば、前記第2の広帯域会話/音声信号が調和信号であると決定する可能性を低下させるように第2の決定条件を取得するために、前記調和信号決定条件を調整するようにさらに構成され、
前記信号タイプ決定モジュールは、前記第2の決定条件に従って、前記第2の広帯域会話/音声信号が調和信号であるか否かを決定するようにさらに構成されている、
装置。 - 請求項19に記載の装置であって、前記決定条件調整モジュールは、具体的には、前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件における調和周波数帯域量閾値および最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を増加させるように構成され、
前記信号タイプ決定モジュールは、具体的には、前記第2の広帯域会話/音声信号の調和周波数帯域量および最大ピーク値パラメータを計算し、もし、前記調和周波数帯域量が増加した調和周波数帯域量閾値より大きい、および/または、前記最大ピーク値パラメータが増加した最大ピーク値パラメータ閾値より大きいならば、前記第2の広帯域会話/音声信号が調和信号であると決定するように構成されている、
装置。 - 請求項12乃至18のいずれか1項に記載の装置であって、前記信号タイプ決定モジュールは、もし、前記第1の広帯域会話/音声信号が調和信号ではないならば、前記第2の広帯域会話/音声信号が非調和信号であると決定するようにさらに構成されている、
装置。 - 請求項12または13に記載の装置であって、前記信号タイプ決定モジュールは、具体的には、前記第1の決定条件に従って、前記第2の広帯域会話/音声信号が調和信号であると決定するように構成されている、
装置。 - プログラムが記録されている、コンピュータ読み取り可能な記憶媒体であって、前記プログラムは、請求項1乃至11のいずれかの方法をコンピュータに実行させる、
記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210223014.0A CN103516440B (zh) | 2012-06-29 | 2012-06-29 | 语音频信号处理方法和编码装置 |
CN201210223014.0 | 2012-06-29 | ||
JP2017066354A JP6612808B2 (ja) | 2012-06-29 | 2017-03-29 | 会話/音声信号処理方法および符号化装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017066354A Division JP6612808B2 (ja) | 2012-06-29 | 2017-03-29 | 会話/音声信号処理方法および符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020024461A JP2020024461A (ja) | 2020-02-13 |
JP6892491B2 true JP6892491B2 (ja) | 2021-06-23 |
Family
ID=49782211
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015518805A Active JP6359529B2 (ja) | 2012-06-29 | 2013-06-06 | 会話/音声信号処理方法および符号化装置 |
JP2017066354A Active JP6612808B2 (ja) | 2012-06-29 | 2017-03-29 | 会話/音声信号処理方法および符号化装置 |
JP2019198664A Active JP6892491B2 (ja) | 2012-06-29 | 2019-10-31 | 会話/音声信号処理方法および符号化装置 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015518805A Active JP6359529B2 (ja) | 2012-06-29 | 2013-06-06 | 会話/音声信号処理方法および符号化装置 |
JP2017066354A Active JP6612808B2 (ja) | 2012-06-29 | 2017-03-29 | 会話/音声信号処理方法および符号化装置 |
Country Status (7)
Country | Link |
---|---|
US (2) | US10056090B2 (ja) |
EP (3) | EP3376499B1 (ja) |
JP (3) | JP6359529B2 (ja) |
KR (6) | KR102005967B1 (ja) |
CN (1) | CN103516440B (ja) |
ES (3) | ES2930240T3 (ja) |
WO (1) | WO2014000559A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103516440B (zh) * | 2012-06-29 | 2015-07-08 | 华为技术有限公司 | 语音频信号处理方法和编码装置 |
MX353200B (es) * | 2014-03-14 | 2018-01-05 | Ericsson Telefon Ab L M | Método y aparato de codificación de audio. |
CN106303878A (zh) * | 2015-05-22 | 2017-01-04 | 成都鼎桥通信技术有限公司 | 一种啸叫检测和抑制方法 |
US10431242B1 (en) * | 2017-11-02 | 2019-10-01 | Gopro, Inc. | Systems and methods for identifying speech based on spectral features |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0029048B1 (en) * | 1979-05-28 | 1985-05-29 | The University Of Melbourne | Speech processor |
US5574724A (en) * | 1995-05-26 | 1996-11-12 | Lucent Technologies Inc. | Adjustment of call bandwidth during a communication call |
US20050065786A1 (en) * | 2003-09-23 | 2005-03-24 | Jacek Stachurski | Hybrid speech coding and system |
FI115329B (fi) * | 2000-05-08 | 2005-04-15 | Nokia Corp | Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin |
KR100462611B1 (ko) * | 2002-06-27 | 2004-12-20 | 삼성전자주식회사 | 하모닉 성분을 이용한 오디오 코딩방법 및 장치 |
FI119533B (fi) * | 2004-04-15 | 2008-12-15 | Nokia Corp | Audiosignaalien koodaus |
EP1791116B1 (en) * | 2004-09-17 | 2011-11-23 | Panasonic Corporation | Scalable voice encoding apparatus, scalable voice decoding apparatus, scalable voice encoding method, scalable voice decoding method, communication terminal apparatus, and base station apparatus |
KR100707174B1 (ko) * | 2004-12-31 | 2007-04-13 | 삼성전자주식회사 | 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법 |
US8311840B2 (en) * | 2005-06-28 | 2012-11-13 | Qnx Software Systems Limited | Frequency extension of harmonic signals |
JP5009910B2 (ja) | 2005-07-22 | 2012-08-29 | フランス・テレコム | レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法 |
CA2558595C (en) * | 2005-09-02 | 2015-05-26 | Nortel Networks Limited | Method and apparatus for extending the bandwidth of a speech signal |
KR101131880B1 (ko) * | 2007-03-23 | 2012-04-03 | 삼성전자주식회사 | 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치 |
EP2207166B1 (en) * | 2007-11-02 | 2013-06-19 | Huawei Technologies Co., Ltd. | An audio decoding method and device |
CN101903945B (zh) * | 2007-12-21 | 2014-01-01 | 松下电器产业株式会社 | 编码装置、解码装置以及编码方法 |
CN101662288B (zh) * | 2008-08-28 | 2012-07-04 | 华为技术有限公司 | 音频编码、解码方法及装置、系统 |
US8515747B2 (en) * | 2008-09-06 | 2013-08-20 | Huawei Technologies Co., Ltd. | Spectrum harmonic/noise sharpness control |
CN101763856B (zh) * | 2008-12-23 | 2011-11-02 | 华为技术有限公司 | 信号分类处理方法、分类处理装置及编码系统 |
JP4945586B2 (ja) * | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
CN101964189B (zh) | 2010-04-28 | 2012-08-08 | 华为技术有限公司 | 语音频信号切换方法及装置 |
WO2011156905A2 (en) * | 2010-06-17 | 2011-12-22 | Voiceage Corporation | Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands |
US20120029926A1 (en) * | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals |
KR102070430B1 (ko) * | 2011-10-21 | 2020-01-28 | 삼성전자주식회사 | 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치 |
CN103999153B (zh) * | 2011-10-24 | 2017-03-01 | Lg电子株式会社 | 用于以带选择的方式量化语音信号的方法和设备 |
GB2502800B (en) * | 2012-06-07 | 2015-05-20 | Jaguar Land Rover Ltd | Crane and related method of operation |
CN103516440B (zh) * | 2012-06-29 | 2015-07-08 | 华为技术有限公司 | 语音频信号处理方法和编码装置 |
BR122020016403B1 (pt) * | 2013-06-11 | 2022-09-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | Aparelho de decodificação de sinal de áudio, aparelho de codificação de sinal de áudio, método de decodificação de sinal de áudio e método de codificação de sinal de áudio |
US9564141B2 (en) * | 2014-02-13 | 2017-02-07 | Qualcomm Incorporated | Harmonic bandwidth extension of audio signals |
US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
-
2012
- 2012-06-29 CN CN201210223014.0A patent/CN103516440B/zh active Active
-
2013
- 2013-06-06 KR KR1020187028697A patent/KR102005967B1/ko active IP Right Grant
- 2013-06-06 ES ES20150138T patent/ES2930240T3/es active Active
- 2013-06-06 KR KR1020177030314A patent/KR101907494B1/ko active Application Filing
- 2013-06-06 WO PCT/CN2013/076862 patent/WO2014000559A1/zh active Application Filing
- 2013-06-06 KR KR1020157000174A patent/KR101689138B1/ko active IP Right Grant
- 2013-06-06 KR KR1020167035415A patent/KR101790680B1/ko active IP Right Grant
- 2013-06-06 EP EP17195365.6A patent/EP3376499B1/en active Active
- 2013-06-06 ES ES13810131.6T patent/ES2654488T3/es active Active
- 2013-06-06 EP EP13810131.6A patent/EP2851897B1/en active Active
- 2013-06-06 EP EP20150138.4A patent/EP3748634B1/en active Active
- 2013-06-06 ES ES17195365T patent/ES2779857T3/es active Active
- 2013-06-06 KR KR1020197021968A patent/KR102165827B1/ko active IP Right Grant
- 2013-06-06 KR KR1020207028813A patent/KR102331531B1/ko active IP Right Grant
- 2013-06-06 JP JP2015518805A patent/JP6359529B2/ja active Active
-
2014
- 2014-12-05 US US14/562,494 patent/US10056090B2/en active Active
-
2017
- 2017-03-29 JP JP2017066354A patent/JP6612808B2/ja active Active
-
2018
- 2018-07-31 US US16/051,139 patent/US11107486B2/en active Active
-
2019
- 2019-10-31 JP JP2019198664A patent/JP6892491B2/ja active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6892491B2 (ja) | 会話/音声信号処理方法および符号化装置 | |
JP6378274B2 (ja) | 音声/オーディオ信号処理方法および装置 | |
JP6462653B2 (ja) | オーディオ・データを処理するための方法、装置、及びシステム | |
JP2011158906A (ja) | 変換補間によるオーディオパケット損失補償 | |
WO2012100557A1 (zh) | 一种带宽扩展方法及装置 | |
CN105761724B (zh) | 一种语音频信号处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191120 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200923 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20201223 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210319 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210427 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210527 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6892491 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |