JP6892491B2 - 会話/音声信号処理方法および符号化装置 - Google Patents

会話/音声信号処理方法および符号化装置 Download PDF

Info

Publication number
JP6892491B2
JP6892491B2 JP2019198664A JP2019198664A JP6892491B2 JP 6892491 B2 JP6892491 B2 JP 6892491B2 JP 2019198664 A JP2019198664 A JP 2019198664A JP 2019198664 A JP2019198664 A JP 2019198664A JP 6892491 B2 JP6892491 B2 JP 6892491B2
Authority
JP
Japan
Prior art keywords
signal
harmonized
conversation
wideband
broadband
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019198664A
Other languages
English (en)
Other versions
JP2020024461A (ja
Inventor
晨 胡
晨 胡
▲澤▼新 ▲劉▼
▲澤▼新 ▲劉▼
磊 苗
磊 苗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2020024461A publication Critical patent/JP2020024461A/ja
Application granted granted Critical
Publication of JP6892491B2 publication Critical patent/JP6892491B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

本出願は、2012年6月29日付けで出願された、“会話/音声信号処理方法および符号化装置”と題する中国特許出願第CN201210223014.0号に基づく優先権を主張し、この中国出願は、全体として参照することにより本明細書に援用される。
本発明は、通信技術に関し、特に、会話/音声信号処理方法および符号化装置に関する。
デジタル通信分野では、携帯電話通信、音声およびビデオ会議、放送テレビ、およびマルチメディアエンターテイメントのような会話、画像、音声、およびビデオ伝送に対する巨大なアプリケーション需要がある。会話/音声信号は、デジタル化され、通信ネットワークを使用することにより一方の端末から別の端末へ転送される。本明細書において端末は、携帯電話、デジタル電話端末、またはその他のタイプの会話および音声端末であり得る。デジタル電話端末は、たとえば、VOIP電話機、ISDN電話機、コンピュータ、またはケーブル通信電話機であり得る。会話/音声信号の格納または伝送プロセスにおいて占有される資源を削減するために、会話/音声信号は、送信端で圧縮され、受信端に送信され、受信端は、解凍処理によって会話/音声信号を復元し、会話/音声信号を再生する。
実際の会話通信処理においては、会話/音声信号の帯域幅は、頻繁に変化する。会話/音声信号の帯域幅変化をもたらす原因は、ネットワーク状態の変化であり得、会話/音声信号自体の帯域幅変化であり得、または、高周波信号と低周波信号との間で会話/音声信号の切り換えを引き起こし得る別の要因であり得る。会話/音声信号が高周波と低周波との間で切り換わる処理は、広帯域スイッチングと呼ばれる。
具体的には、ネットワーク状態は、頻繁に変化し、ネットワーク帯域幅は、ネットワーク状態が悪化するにつれて狭くなる。その結果、ネットワーク帯域幅の変化に伴って、会話/音声信号もまた、高周波信号と低周波信号との間で切り換わる必要がある。ネットワーク帯域幅が狭くなるとき、会話/音声信号は、高周波信号から低周波信号に変化する必要があり、ネットワーク状況が回復したとき、会話/音声信号は、低周波信号から高周波信号に回復する必要がある。高周波信号および低周波信号の帯域幅サイズは、相対的な概念である。たとえば、高周波信号の帯域幅が0〜16kHzであり、低周波信号の帯域幅が0〜8kHzであり、または、高周波信号の帯域幅が0〜8kHzであり、低周波信号の帯域幅が0〜4kHzであり、高周波信号は、超広帯域信号でもあり、低周波信号は、広帯域信号でもある。
しかし、エンコーダで、従来技術を使用することにより広帯域スイッチングが実行された後、デコーダでは、不連続な会話/音声信号の問題が頻繁に発生し、その結果、音声通信サービス品質が下がる。
本発明の実施形態は、広帯域スイッチングに基づく会話/音声信号処理方法と符号化装置とを提供する。
本発明の実施形態は、広帯域スイッチングに基づく会話/音声信号処理方法を提供し、該方法は、
もし、第1の広帯域会話/音声信号が調和信号であるならば、第2の広帯域会話/音声信号が調和信号であると決定するための決定条件を、前記第2の広帯域会話/音声信号が調和信号であると決定する可能性を上昇させるように第1の決定条件を取得するために、調整する調整ステップであり、第1の広帯域会話信号が広帯域スイッチング前の信号であり、第2の広帯域会話信号が広帯域スイッチング後の信号である、調整ステップと、
第1の決定条件に従って、第2の広帯域会話/音声信号が調和信号であるか否かを決定する決定ステップと、を備える。
本発明の実施形態は、符号化装置をさらに提供し、該符号化装置は、
第1の広帯域会話/音声信号が調和信号であるならば、第2の広帯域会話/音声信号が調和信号であると決定するための決定条件を、前記第2の広帯域会話/音声信号が調和信号であると決定する可能性を上昇させるように第1の決定条件を取得するために、調整するように構成された決定条件調整モジュールであり、第1の広帯域会話信号が広帯域スイッチング前の信号であり、第2の広帯域会話信号が広帯域スイッチング後の信号である、決定条件調整モジュールと、
第1の決定条件に従って、第2の広帯域会話/音声信号が調和信号であるか否かを決定するように構成された信号タイプ決定モジュールと、を備える。
本発明の実施形態においては、符号化装置は、広帯域スイッチング前の第1の広帯域会話/音声信号が調和信号であるか否かを決定することができ、第1の広帯域会話/音声信号が調和信号であると決定されたとき、第2の広帯域会話/音声信号が調和信号であると決定する可能性をできるだけ上昇させるように第2の広帯域会話/音声信号が調和信号であるか否かを決定する条件を緩和するために、広帯域スイッチング後の第2の広帯域会話/音声信号の調和信号決定条件を調整する方法を使用することができる。従って、本発明の実施形態においては、広帯域スイッチングの場合に、会話/音声信号の信号タイプは、復号化器装置によって復号化される会話/音声信号の連続性ができるだけ確保され、会話通信サービス品質をさらに改善するように、スイッチングの前後で、できるだけ一致するように保たれる。
本発明の実施形態または従来技術における技術的解決手法をより明瞭に説明するために、実施形態または従来技術を説明するため必要とされる添付図面を以下で簡単に紹介する。当然ながら、以下の説明における添付図面は、本発明のいくつかの実施形態を示し、当業者は、創造的な努力なしでこれらの添付図面から他の図面をさらに導出し得る。
本発明による会話/音声信号処理方法の第1の実施形態のフローチャートである。 本発明による会話/音声信号処理方法の第2の実施形態のフローチャートである。 本発明による会話/音声信号処理方法の第3の実施形態のフローチャートである。 本発明による会話/音声信号処理方法の第4の実施形態のフローチャートである。 本発明による会話/音声信号処理方法の第5の実施形態のフローチャートである。 本発明による符号化装置が配置されたエンコーダ機器の概略構成図である。 本発明による符号化装置の第1の実施形態の概略構成図である。 本発明による符号化装置の第2の実施形態の概略構成図である。
本発明の実施形態の目的、技術的解決手法、および利点をより明瞭にするために、以下では、本発明の実施形態における添付図面を参照して本発明の実施形態における技術的解決手法を明瞭かつ完全に説明する。当然ながら、説明された実施形態は、本発明の実施形態の全部というよりもむしろ一部である。創造的な努力なしで本発明の実施形態に基づいて当業者によって達成されるすべての他の実施形態は、本発明の保護範囲に含まれる。
本発明による会話/音声信号処理方法は、音声コーダに適用され得る。デジタル信号処理の分野においては、音声コーデックは、様々な電子機器、たとえば、携帯電話、無線装置、個人情報端末(PDA)、ハンドヘルドもしくはポータブルコンピュータ、GPS受信機/ナビゲータ、カメラ、音声/ビデオプレーヤ、カムコーダ、ビデオレコーダ、および監視機器に広く適用される。通常、このタイプの電子機器は、音声コーダまたは音声デコーダを含み、音声コーダもしくはデコーダは、デジタル回路もしくはチップ、たとえば、DSP(デジタル信号プロセッサ)によって直接実装され得、または、ソフトウェアコードにおけるプロセスを実行するようにプロセッサを駆動するソフトウェアコードによって実装され得る。
図1は、本発明による会話/音声信号処理方法の第1の実施形態のフローチャートである。図1に示されるように、本実施形態による方法は、以下を含み得る。
ステップ101:第1の広帯域会話/音響信号が調和信号であるならば、第2の広帯域会話/音声信号が調和信号であると決定するための決定条件を、第2の広帯域会話/音声信号が調和信号であると決定する可能性を上昇させるように第1の決定条件を取得するために、調整する。
第1の広帯域会話/音声信号は、広帯域スイッチング前の会話/音声信号であり、第2の広帯域会話/音声信号は、広帯域スイッチング後の会話/音声信号である。
ステップ102:第1の決定条件に従って、第2の広帯域会話/音声信号が調和信号であるか否かを決定する。
具体的には、高周波信号は、超広帯域信号であり得、また、低周波信号は、広帯域信号であり得る。当業者は、要件に従って、或る帯域幅レンジより上の信号を超広帯域信号として、そして、或る帯域幅レンジ以下の信号を高帯域幅信号として自ら定義し得る。たとえば、0〜8kHzの帯域幅レンジより上の信号が超広帯域信号であり、そして、0〜8kHzの帯域幅レンジ以下の信号が広帯域信号である、と設定され得る。エンコーダでの符号化中に、超広帯域信号は、調和信号、コモン信号、過渡信号およびノイズ信号に分類され得、広帯域信号は、調和信号およびコモン信号に分類され得る。
本実施形態における第1の広帯域会話/音声信号は、超広帯域信号であり得、スイッチング後の第2の広帯域会話/音声信号は、広帯域信号であり得、または、第1の広帯域会話/音声信号は、広帯域信号であり得、スイッチング後の第2の広帯域会話/音声信号は、超広帯域信号であり得る。超広帯域信号について、その信号タイプは、調和信号、コモン信号、過渡信号、およびノイズ信号のうちの1つであり得、広帯域信号について、その信号タイプは、調和信号およびコモン信号のうちの1つであり得る。超広帯域信号について、符号化装置は、超広帯域信号の信号タイプを決定するために超広帯域信号に対応する調和信号決定条件を使用し得、広帯域信号について、符号化装置は、広帯域信号の信号タイプを決定するために広帯域信号に対応する調和信号決定条件を使用し得る。従来技術において、超広帯域信号に対応する調和信号決定条件および広帯域信号に対応する調和信号決定条件はいずれも、調和信号の決定中に、前のフレームの信号に関する情報を基準情報として使用する必要がある。
発明者は、従来技術の実施プロセスにおいて、エンコーダでの広帯域スイッチングの場合、もし、広帯域スイッチング前の会話/音声信号が超広帯域信号の調和信号もしくは広帯域信号の調和信号であるならば、断続的な会話がデコーダで頻繁に発生し、このことは、それによって、ユーザの通常の通信に影響を与え、会話通信サービス品質を下げることに気付いた。
入念な研究の後、発明者は、前述の問題の主要因が、超広帯域信号に対応する調和信号決定条件および広帯域信号に対応する調和信号決定条件がいずれも、調和信号の決定中に、前のフレームの信号に関する情報を基準情報として使用することが必要であるが、しかし、広帯域スイッチングが発生するとき、信号帯域幅が変化するので、広帯域スイッチングの前後の信号のエネルギーおよび周波数帯域が著しく異なることにある、ということに気付いた。この変化に基づいて、もし、符号化装置が、広帯域スイッチング前の信号を、広帯域スイッチング後の信号のタイプを決定するための基準情報としてそれでもなお使用するならば、符号化装置は、広帯域スイッチング中に信号タイプの切り換えを実行し得る。たとえば、広帯域スイッチング前の会話/音声信号は、調和信号であり、しかし、広帯域スイッチング後の会話/音声信号は、過渡信号であると決定され得る。エンコーダは、広帯域スイッチング前の調和信号を符号化するために調和信号の符号化方法を使用し得、広帯域スイッチング後の非調和信号を符号化するために非調和信号の符号化方法を使用し得る。
その後、エンコーダは、符号化された信号をデコーダに送信し得、デコーダは、調和信号および非調和信号を復元するために、符号化された信号を受信した後、符号化された信号を復号化するために対応する復号化方法を使用し得る。信号特徴の点において、調和信号と非調和信号との間には著しい差が存在するので、2つの信号の出力は、デコーダにおいてユーザによって聞かれる会話/音声信号を断続的にする。非調和信号、すなわち、ノイズ信号と、過渡信号と、コモン信号の3つの信号タイプの間のスイッチングに関しては、デコーダ機器について、復号化された会話/音声信号は、著しく影響されない。
従って、本実施形態においては、符号化装置は、広帯域スイッチング前の第1の広帯域会話/音声信号が調和信号であるか否かを決定することができる。もし、広帯域スイッチング前の第1の広帯域会話/音声信号が調和信号であるならば、符号化装置は、広帯域スイッチング後の第2の広帯域会話/音声信号が調和信号であると決定する可能性を上昇させるために、調和信号決定条件を調整する方式を使用し得る。従って、広帯域スイッチングの場合、会話/音声信号の信号タイプは、会話/音声信号の連続性をできるだけ確保するために、デコーダ機器で受信された会話/音声信号の信号タイプが広帯域スイッチングの前後で一致するように、すなわち、同じ復号化方式が復号化のため使用できるように、広帯域スイッチング後の会話/音声信号の決定中にできるだけ変更されない。第2の広帯域会話/音声信号の信号タイプは、スイッチング後の第2の広帯域会話/音声信号が緩和させられた調和信号決定条件を満たさないときに限り、すなわち、第2の広帯域会話/音声信号中の調和成分がかなり少ないときに限り、変更される。本実施形態では、もし、第1の広帯域会話/音声信号が超広帯域信号であるならば、第2の広帯域会話/音声信号は、広帯域信号であり、もし、第1の広帯域会話/音声信号が広帯域信号であるならば、第2の広帯域会話/音声信号は、超広帯域信号である。
第1の広帯域会話/音声信号が超広帯域信号であり、第2の広帯域会話/音声信号が広帯域信号である一例においては、符号化装置は、広帯域スイッチング前の超広帯域信号が調和信号であるか否かを決定するために超広帯域信号に対応する調和信号決定条件を使用し得、非調和信号は、過渡信号、ノイズ信号およびコモン信号のうちの1つである。もし、決定の結果が調和信号であるならば、符号化装置は、第1の決定条件を取得するために広帯域信号に対応する調和信号決定条件を緩和し得、第1の決定条件に従って、広帯域スイッチング後の広帯域信号が調和信号であるか否かを決定し得る。広帯域信号に対応する調和信号決定条件が緩和されるので、スイッチング後の広帯域信号が調和信号であると決定する可能性が増加され、そのため、広帯域スイッチング前後の信号タイプができるだけ変えられることがなく、さらに、デコーダ機器によって復号化された会話/音声信号の連続性ができるだけ確保される。
なお、当業者は、超広帯域信号に対応する調和信号決定条件および広帯域信号に対応する調和信号決定条件を、会話/音声信号処理方法に従って設計し得、または、規格に規定された調和信号決定条件を使用し得、本実施形態において限定されることはない。
本実施形態においては、符号化装置は、広帯域スイッチング前の第1の広帯域会話/音声信号が調和信号であるか否かを決定することができ、第1の広帯域会話/音声信号が調和信号であると決定されたとき、第2の広帯域会話/音声信号が調和信号であると決定する可能性をできるだけ上昇させるように、広帯域スイッチング後の第2の会話/音声信号が調和信号であるか否かを決定する条件を緩和するために、広帯域スイッチング後の第2の広帯域会話/音声信号の調和信号決定条件を調整する方式を使用することができる。従って、本実施形態においては、広帯域スイッチングの場合、会話/音声信号の信号タイプは、デコーダ機器によって復号化された会話/音声信号の連続性ができるだけ確保され、さらに、会話通信サービス品質が改善されるように、スイッチングの前後で、できるだけ一致するように保たれる。
図1に示された方法実施形態に基づいて、もし、符号化装置が第1の広帯域会話/音声信号は調和信号ではないと決定するならば、符号化装置が図1に示された方法実施形態におけるステップ102を実行する前に、該方法は、
第2の広帯域会話/音声信号が調和信号であると決定する可能性を減少させるように第2の決定条件を取得するために、調和信号決定条件を調整する調整ステップと、第2の決定条件に従って、第2の広帯域会話/音声信号が調和信号であるか否かをさらに決定する決定ステップと、をさらに含み得る。
具体的には、もし、符号化装置が広帯域スイッチング前の第1の広帯域会話/音声信号は調和信号ではないと決定するならば、符号化装置は、第2の広帯域会話/音声信号が調和信号であると決定する可能性を減少させるように第2の広帯域会話/音声信号が調和信号であると決定するための決定閾値を増加させるために、調和信号決定条件を調整する方式を使用し得る。すなわち、もし、広帯域スイッチング前の第1の広帯域会話/音声信号が非調和信号、たとえば、ノイズ信号、過渡信号、もしくはコモン信号であるならば、大部分は、調和信号決定閾値を増加させることにより、広帯域スイッチング後の第2の広帯域会話/音声信号は、調和信号ではなく、ノイズ信号、過渡信号、またはコモン信号であると決定され得る。エンコーダは、できるだけ、広帯域スイッチング中に会話/音声信号の信号タイプを変えることがなく、デコーダによって復号化された会話/音声信号の連続性は、できるだけ確保されることができる。
前述のとおり、もし、第1の広帯域会話/音声信号が超広帯域信号であるならば、第2の広帯域会話/音声信号は広帯域信号であり、もし、第1の広帯域会話/音声信号が広帯域信号であるならば、第2の広帯域会話/音声信号は超広帯域信号である。以下では、異なった広帯域スイッチング状況に対して異なった実施形態を使用することにより、本発明の技術的解決手法について詳細に説明する。
第一に、以下の実施形態において使用される、超広帯域信号に対応する調和信号決定条件および非調和信号決定条件と、広帯域信号に対応する調和信号決定条件および非調和信号決定条件とを詳細に説明する。なお、以下の実施形態では、会話/音声信号が調和信号であるか、または、非調和信号であるかを決定するために実施例として、規格に規定された信号タイプ決定条件が使用される。当業者は、これらの決定条件が会話/音声信号処理方法に従って変えられ得ることを理解し得る。
超広帯域信号について、超広帯域信号の信号タイプを決定するために、以下の方法が使用され得る。
(1)時間ドメイン信号の複数のセグメントを取得し、時間ドメイン信号の各セグメントに対する時間包絡線パラメータを決定するするために、現在の会話/音声信号を複数の信号セグメントに分割する。オプション的に、時間ドメイン信号の各セグメントに対する時間包絡線パラメータ値が決定される前に、時間ドメイン信号の各セグメントは、時間包絡線パラメータ値を決定するため使用される時間ドメイン信号を取得するために、会話/音声信号全体における、時間ドメイン信号の各セグメントの重要度に従って、比例係数が乗じられることもあり得る。
(2)時間ドメイン信号の複数の時間包絡線パラメータ値のうちの1つの時間包絡線パラメータ値が、会話/音声信号の数個の前の包絡線値の加重和を実行し、その後、この結果にプリセット値を乗じることにより取得される所定の包絡線閾値T1より大きいか否かを決定する。
(3)もし、少なくとも1つの時間包絡線閾値がT1より大きいならば、現在の会話/音声信号は過渡信号であると決定する。
ステップ1からステップ3は、過渡信号決定条件である。
(4)もし、いずれの時間包絡線閾値もT1より大きくないならば、現在の会話/音声信号の周波数ドメイン信号を複数の周波数帯域に分割し、各周波数帯域の1つの周波数ドメイン振幅ピーク値を計算し、その後、周波数ドメイン振幅ピーク値、複数の周波数帯域の周波数ドメイン振幅ピーク値の平均値、および周波数帯域幅に従って、各周波数帯域の調和特性値を計算する。
(5)各周波数帯域の調和特性値が所定の閾値より大きいか否か、および、各周波数帯域の周波数ドメイン振幅ピーク値が所定の閾値T2より大きいか否か、を決定する。もし、各周波数帯域の調和特性値および各周波数帯域の周波数ドメイン振幅ピーク値が共に所定の閾値より大きいならば、周波数帯域が調和周波数帯域であると決定し、ステップ6を実行し、そうでないならば、調和特性値が所定の閾値T3未満であるか否かをさらに決定する。もし、調和特性値が所定の閾値T3未満であるならば、周波数帯域がノイズ周波数帯域であると決定し、そうでないならば、周波数帯域がコモン周波数帯域であると決定する。
(6)最大ピーク値パラメータの値、すなわち、あらゆる周波数帯域の振幅ピーク値の最大値を決定し、調和周波数帯域の量およびノイズ周波数帯域の量を計算し、前の会話/音声信号のグローバルエネルギーに対する現在の会話/音声信号のグローバルエネルギーの比を計算する。
(7)最大ピーク値パラメータの値が所定の閾値T4より大きいか否か、調和周波数帯域の量が所定の閾値T5より大きいか否か、および、グローバルエネルギー比が所定の閾値レンジ(T6,T7)に含まれるか否か、を決定する。もし、すべての決定結果が肯定的であるならば、現在の会話/音声信号は調和信号であると決定し、調和モードカウンタを更新し、たとえば、調和モードカウンタのカウント値に1を加える。
(8)3つすべての決定条件が肯定的であるとは限らないならば、調和モードカウンタを更新し、たとえば、調和モードカウンタのカウント値から1を減算し、この場合、調和モードカウント値が所定の閾値T8より大きいか否かを決定する。もし、肯定的であるならば、現在の会話/音声信号は調和信号であると決定する。
ステップ4からステップ8は、調和信号決定条件である。
なお、調和モードカウンタは、オプション的な機能である。現在の会話/音声信号の最大ピーク値パラメータの値が所定の閾値T4以下であり、調和周波数帯域の量が所定の閾値T5以下であり、グローバルエネルギー比が所定のレンジ(T6,T7)に含まれないとき、調和モードカウンタは、現在の会話/音声信号が調和信号であるか否かを決定する基準として使用され得る。もし、前に累積された調和信号の量が所定の閾値T8を超えるならば、それは、連続的な会話/音声信号が一層高い可能性で調和信号であることを示し、この場合、上記3つの条件が満たされなくても、現在の会話/音声信号が調和信号であると決定されることもあり得る。
(9)もし、そうでないならば、ノイズ周波数帯域の量および別のノイズ関連パラメータが条件を満たすか否かをさらに決定する。もし、ノイズ周波数帯域の量および別のノイズ関連パラメータが条件を満たすならば、現在の会話/音声信号はノイズ信号であると決定し、そうでないならば、現在の会話/音声信号はコモン信号であると決定する。
広帯域信号について、調和信号およびコモン信号だけが識別される必要がある。しかし、広帯域スイッチングプロセスにおいて、調和信号決定条件は、超広帯域信号を決定する原理に類似し、具体的には、以下のとおりである。
現在の会話/音声信号が調和信号であるか否かを決定するとき、符号化装置は、調和周波数帯域の量および最大ピーク値パラメータの値がそれぞれ所定の閾値T4およびT5より大きいか否かを決定することだけが必要であり、もし、肯定的であるならば、現在の会話/音声信号が調和信号であると決定し、調和モードカウンタの値を増加させ、たとえば、調和モードカウンタのカウント値に1を加算し、あるいは、もし、両方が同時に満たされることができないならば、調和モードカウンタの値を減少させ、たとえば、調和モードカウンタのカウント値から1を減算し、その後、調和モードカウンタのカウント値が所定の閾値T8より大きいか否かを決定し、もし、肯定的であるならば、現在の会話/音声信号は調和信号であると決定し、または、もし、否定的であるならば、現在の会話/音声信号はコモン信号であると決定する。
広帯域信号および超広帯域信号の信号タイプの決定についての上記説明に基づいて、以下では、本発明の技術的解決手法について詳細に説明する。
図2は、本発明による会話/音声信号処理方法の第2の実施形態のフローチャートである。本実施形態においては、第1の広帯域会話/音声信号は超広帯域信号であり、第2の広帯域会話/音声信号は広帯域信号であり、広帯域スイッチングは、超広帯域信号から広帯域信号への切り換えである。図2に示されるように、本実施形態における方法は、以下を含む。
ステップ201:調和周波数帯域の量および広帯域スイッチング後の広帯域信号のサイダピーク値パラメータを計算する。
このステップは、上記ステップ6を使用することにより実装され得、従って、さらなる詳細は、ここでは説明しない。
ステップ202:調和周波数帯域の量、最大ピーク値パラメータ、および広帯域信号のための調和信号決定条件に従って調和モードカウント値を更新する。
このステップは、たとえば、上記ステップ7を使用することにより実装され得る。なお、広帯域信号について、グローバルエネルギー比は計算される必要がないが、調和モードカウンタを更新できるように、広帯域信号のための調和信号決定条件における調和周波数帯域の量および最大ピーク値パラメータの決定だけが使用される。もし、調和周波数帯域の量が所定の閾値T5より大きく、かつ、最大ピーク値パラメータが所定の閾値T4より大きいならば、広帯域スイッチング後の広帯域信号が調和信号であると決定され得、その後、1が調和モードカウンタの値に加算され得、もし、調和周波数帯域量が所定の閾値T5以下である、および/または、最大ピーク値パラメータが所定の閾値T4以下であるならば、広帯域スイッチング後の広帯域信号は、非調和信号であると決定され得、その後、1が調和モードカウンタの値から減算され得る。従って、広帯域スイッチング後の広帯域信号が調和信号であるか、または、非調和信号であるかを決定することは、広帯域信号の客観的信号タイプに基づいており、この広帯域信号の更新された調和モードカウントは、後続の会話/音声信号の決定中に基準として使用されることのできる、前の会話/音声信号の客観的情報であることを学ぶことができる。
ステップ203:広帯域スイッチング前の超広帯域信号が調和信号であるか否かを決定する。もし、肯定的であるならば、ステップ204を実行し、もし、否定的であるならば、ステップ206を実行する。
なお、ステップ203は、ステップ204より前に実行される必要があるが、必ずしもステップ201またはステップ202の後に実行されない。実際の処理プロセスでは、ステップ203は、広帯域スイッチングの前に実行されることができる。
ステップ204:広帯域信号のための調和信号決定条件における調和周波数帯域量閾値および最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を下げる。
広帯域スイッチング前の超広帯域信号は、調和信号であるので、広帯域スイッチング後の広帯域信号が調和信号であると決定する条件は、ステップ204において緩和される必要がある。本実施形態においては、広帯域信号のための調和信号決定条件における調和周波数帯域量閾値T5および最大ピーク値パラメータ閾値T4のうちの少なくとも一方の閾値は、減少させられ得る。T4およびT5を共に減少させる調整方式について、調和信号決定条件の緩和度は、T4だけ、もしくは、T5だけを減少させる調整方式と比べると、相対的により大きいことが理解され得る。本実施形態においては、減少した調和周波数帯域量閾値は、T51<T5であるT51として表され、減少した最大ピーク値パラメータ閾値は、T41<T4であるT41として表される。たとえば、T51は、T5の半分であり得、T41は、T4の半分であり得る。
当業者は、T51およびT41の具体的な値は、調和信号決定要件に従って設定され得ることを理解し得る。たとえば、もし、或る調和特徴をもつ広帯域信号が調和信号であるとできるだけ決定される必要があるならば、T51およびT41は、より小さい値に調整され得、それによって、調和信号決定条件を大幅に緩和する。
ステップ205:もし、調和周波数帯域の量が、減少した調和周波数帯域量閾値より大きい、および/または、最大ピーク値パラメータが、減少した最大ピーク値パラメータ閾値より大きいならば、広帯域信号は調和信号であると決定する。
調和信号決定条件が緩和された後、もし、調和周波数帯域量がT51より大きい、および、最大ピーク値パラメータがT41より大きいという2つの条件のうちのいずれかの条件が満たされるならば、広帯域スイッチング後の広帯域信号は調和信号であると決定されることができる。なお、調和信号が従来技術において実行されるとき、調和周波数帯域量がT51より大きい、および、最大ピーク値パラメータがT41より大きいという2つの条件が共に満たされる必要があるが、本実施形態においては、決定閾値T5およびT4が減少させられるだけでなく、広帯域スイッチング後の信号は、調和周波数帯域量がT51より大きい、および、最大ピーク値パラメータがT41より大きいという2つの条件のうちのいずれかの条件が満たされたときに調和信号であると決定され得、それによって、調和信号決定条件がさらに緩和される。
調和周波数帯域量がT51以下であり、最大ピーク値パラメータがT41以下である、すなわち、上記2つの条件がいずれも満たされない場合、本実施形態においては、決定は、調和モードカウンタの値に従って実行され得る。もし、調和モードカウント値がプリセット値T8より大きいならば、広帯域スイッチング後の広帯域信号は、調和信号である。
ステップ206:広帯域信号のための調和信号決定条件における調和周波数帯域領域値および最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を増加させる。
広帯域スイッチング前の超広帯域信号は、非調和信号、たとえば、過渡信号であるので、広帯域スイッチング後の広帯域信号が調和信号であると決定する条件は、ステップ206において増加させられる必要がある。本実施形態においては、広帯域信号のための調和信号決定条件における調和周波数帯域量閾値T5および最大ピーク値パラメータ閾値T4のうちの少なくとも一方の閾値が、増加させられ得る。T4およびT5を共に増加させる調整方式について、調和信号決定条件の増加度は、T4だけを増加、もしくは、T5だけを増加させる調整方式と比べると、相対的により大きいことが理解され得る。本実施形態においては、増加した調和周波数帯域量閾値は、T52<T5であるT52として表され、増加した最大ピーク値パラメータ閾値は、T42<T4であるT42として表される。たとえば、T51は、T5の2倍であり得、T41は、T4の2倍であり得る。
当業者は、T52およびT42の具体的な値もまた調和信号決定要件に従って設定され得ることを理解し得る。たとえば、もし、比較的多数の調和特徴をもつ広帯域信号が調和信号であると決定されることが必要であるならば、T52およびT42は、歴然たる調和特徴をもつ広帯域が調和信号と決定され得るように、より大きい値に調整され得る。
ステップ207:もし、調和周波数帯域の量が増加した調和周波数帯域量閾値より大きい、および/または、最大ピーク値パラメータが増加した最大ピーク値パラメータ閾値より大きいならば、広帯域信号は調和信号であると決定する。
調和信号決定条件が増加させられた後、もし、調和周波数帯域量がT52より大きい、および、最大ピーク値パラメータがT42より大きいという2つの条件のうちのいずれかの条件が満たされるならば、広帯域スイッチング後の広帯域信号は調和信号であると決定され得る。
調和周波数帯域の量がT52以下であり、かつ、最大ピーク値パラメータがT42以下である、すなわち、上記2つの条件がいずれも満たされない場合、本実施形態において、調和モードカウンタの値に従って決定が行われることもあり得る。もし、調和モードカウント値がプリセット値T8より大きいならば、広帯域スイッチング後の広帯域信号は調和信号であると決定されることもあり得る。
本実施形態において、広帯域スイッチングがエンコーダで発生するとき、符号化装置は、広帯域スイッチング前の超広帯域信号が調和信号であるか、または、非調和信号であるかを決定することができ、もし、超広帯域信号が調和信号であるならば、符号化装置は、広帯域スイッチング後の広帯域信号が調和信号であるとできるだけ決定するように、信号の調和成分を表すために使用される調和周波数帯域量および/または最大ピーク値パラメータの閾値を低下させ得、もし、超広帯域信号が非調和信号であるならば、符号化装置は、広帯域スイッチング後の広帯域信号が非調和信号であるとできるだけ決定するように、調和周波数帯域量および/または最大ピーク値パラメータのため使用される決定閾値を上昇させ得る。加えて、調和信号決定条件が調整された後、たとえ、広帯域スイッチング後の広帯域信号が上記条件を満たさなくても、決定は、調和モードカウンタを用いてさらに実行され得る。従って、本実施形態においては、広帯域スイッチング中に、信号タイプは、できるだけ変えられることがなく、従って、デコーダで受信された会話/音声信号の連続性ができるだけ確保され得る。
図3は、本発明による会話/音声信号処理方法の第3の実施形態のフローチャートである。本実施形態においては、第1の広帯域会話/音声信号は広帯域信号であり、第2の広帯域会話/音声信号は超広帯域信号であり、広帯域スイッチングは、広帯域信号から超広帯域信号への切り換えである。図3に示されるように、本実施形態における方法は、以下を含み得る。
ステップ301:広帯域スイッチング後の超広帯域信号の調和周波数帯域の量および最大ピーク値パラメータを計算し、超広帯域信号に対する調和周波数帯域の量、最大ピーク値パラメータ、および調和信号決定条件に従って、調和モードカウント値を更新する。
ステップ301について、超広帯域信号の信号タイプを決定するプロセスに関連する上記実装を参照するので、詳細は、ここでは説明しない。
ステップ302:超広帯域信号が過渡信号ではないことをデフォルトで決定し、広帯域スイッチング前の広帯域信号のグローバルエネルギーに対する超広帯域信号のグローバルエネルギーの比がプリセット範囲に含まれることをデフォルトで決定する。
本実施形態において、広帯域スイッチングは、広帯域信号から超広帯域信号へのスイッチングであり、超広帯域信号は、4個の信号タイプを含み、広帯域信号のための調和信号決定条件と比べると、広帯域スイッチング前の広帯域信号のグローバルエネルギーに対する広帯域スイッチング後の超広帯域信号のグローバルエネルギーの比が、超広帯域信号のための調和信号決定条件として追加されている。従って、本実施形態においては、決定条件を簡単化するために、ステップ1からステップ3は、実行されないことがあり得、ステップ302において、広帯域スイッチング後の超広帯域信号は、過渡信号ではないとデフォルトで決定され、広帯域スイッチング前の広帯域信号のグローバルエネルギーに対する広帯域スイッチング後の超広帯域信号のグローバルエネルギーの比は、プリセットレンジ(T6,T7)に含まれるとデフォルトでまた決定され得る。
ステップ303:広帯域スイッチング前の広帯域信号が調和信号であるか否かを決定する。もし、肯定的であるならば、ステップ304を実行し、もし、否定的であるならば、ステップ306を実行する。
ステップ304:超広帯域信号のための調和信号決定条件における調和周波数帯域量閾値および最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を低下させる。
広帯域スイッチング前の広帯域信号が調和信号であるので、広帯域スイッチング後の超広帯域信号が調和信号であると決定する条件は、ステップ304において緩和される必要がある。本実施形態においては、超広帯域信号のための調和信号決定条件における調和周波数帯域量閾値T5および最大ピーク値パラメータ閾値T4のうちの少なくとも一方の閾値が減少させられ得る。減少した調和周波数帯域量閾値は、T51としてまた表され、減少した最大ピーク値パラメータ閾値は、T41としてまた表される。
ステップ305:もし、調和周波数帯域の量が減少した調和周波数帯域量閾値より大きい、および/または、最大ピーク値パラメータが減少した最大ピーク値パラメータ閾値より大きいならば、超広帯域信号は調和信号であると決定する。
調和信号決定条件が緩和された後、もし、調和周波数帯域の量が減少した調和周波数帯域量閾値より大きい、および、最大ピーク値パラメータが減少した最大ピーク値パラメータ閾値より大きいという2つの条件のうちのいずれかの条件が満たされるならば、広帯域スイッチング後の超広帯域信号は調和信号であると決定され得る。
調和周波数帯域の量がT52以下であり、かつ、最大ピーク値パラメータがT42以下である、すなわち、上記2つの条件がいずれも満たされない場合、本実施形態において、調和モードカウンタの値に従って決定が行われることもあり得る。もし、調和モードカウント値がプリセット値T8より大きいならば、広帯域スイッチング後の超広帯域信号は調和信号である。
ステップ306:超広帯域信号のための調和信号決定条件における調和周波数帯域量閾値および最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を増加させる。
ステップ307:もし、調和周波数帯域の量が増加した調和周波数帯域閾値より大きい、および/または、最大ピーク値パラメータが増加した最大ピーク値パラメータ閾値より大きい場合、超広帯域信号は調和信号であると決定する。
調和信号決定条件が増加させられた後、もし、調和周波数帯域の量が、増加した調和周波数帯域量閾値T52より大きい、および、最大ピーク値パラメータが、増加した最大ピーク値パラメータ閾値T42より大きい、という2つの条件のうちのいずれかの条件が満たされるならば、広帯域スイッチング後の超広帯域信号は調和信号であると決定され得る。
調和周波数帯域の量がT52以下であり、かつ、最大ピーク値パラメータがT42以下である、すなわち、上記2つの条件のいずれもが満たされない場合、本実施形態においては、調和モードカウンタの値に従って決定が実行されることもあり得る。もし、調和モードカウント値がプリセット値T8より大きいならば、広帯域スイッチング後の超広帯域信号は調和信号であると決定されることもあり得る。
代替的に、本実施形態においては、ステップ1から3は、広帯域スイッチング後の超広帯域信号が過渡信号であるか否かを決定するために、実行されることもあり得る。加えて、信号連続性を確保するために、過渡信号決定条件は、実際に相対的に著しい過渡特徴を有する超広帯域信号が過渡信号であると決定され得るように、本実施形態においては増加され得る。
実際の実装においては、符号化装置は、超広帯域信号の時間包絡線パラメータを計算するために以下のステップ1を使用し、時間系列包絡線閾値T1をステップ2において増加させ得、増加した包絡線閾値は、T11として表され得、もし、時間包絡線パラメータがT11より大きいならば、超広帯域信号が過渡信号であると決定され得る。たとえば、もし、広帯域スイッチング前の広帯域信号が調和信号であるならば、包絡線閾値は、3倍に増加され得、もし、広帯域スイッチング前の広帯域信号が非調和信号であるならば、包絡線閾値は、2倍に増加され得る。
本実施形態においては、広帯域スイッチングがエンコーダで発生するとき、符号化装置は、広帯域スイッチング前の広帯域信号が調和信号であるか、または、非調和信号であるかを決定し得、もし、広帯域信号が調和信号であるならば、符号化装置は、広帯域スイッチング後の超広帯域信号が調和信号であるとできるだけ決定されるように、信号の調和成分を表すため使用される調和周波数帯域量および/または最大ピーク値パラメータの決定閾値を低下させ得、もし、広帯域信号が非調和信号であるならば、符号化装置は、広帯域スイッチング後の超広帯域信号が非調和信号であるとできるだけ決定されるように、調和周波数帯域量および/または最大ピーク値パラメータのため使用される決定閾値を上昇させ得る。加えて、調和信号決定条件が調整された後、たとえ、広帯域スイッチング後の超広帯域信号が上記条件を満たすことがなくても、決定は、調和モードカウンタを用いてさらに実行されることがあり得る。従って、本実施形態においては、広帯域スイッチング中に、信号タイプは、できるだけ変えられることがなく、従って、デコーダで受信された会話/音声信号の連続性は、できるだけ確保され得る。
図4は、本発明による広帯域スイッチングに基づく信号処理方法の第4の実施形態のフローチャートである。本実施形態においては、第1の広帯域会話/音声信号は超広帯域信号であり、第2の広帯域会話/音声信号は広帯域信号であり、広帯域スイッチングは、超広帯域信号から広帯域信号への切り換えである。図4に示されるように、本実施形態における方法は、以下を含み得る。
ステップ401:広帯域スイッチング後の広帯域信号の調和周波数帯域の量および最大ピーク値パラメータを計算する。
ステップ402:調和周波数帯域の量、最大ピーク値パラメータ、および広帯域信号のための調和信号決定条件に従って調和モードカウント値を更新する。
ステップ403:広帯域スイッチング前の超広帯域信号が調和信号であるか否かを決定する。もし、肯定的であるならば、ステップ404を実行し、もし、否定的であるならば、ステップ405を実行する。
ステップ401から403について、図2に示された実施形態におけるステップ201からステップ203を実行するプロセスを参照するので、詳細は、ここでは説明しない。
ステップ404:広帯域スイッチング後の広帯域信号が調和信号であると決定する。
ステップ405:広帯域スイッチング後の広帯域信号が非調和信号であると決定する。
本実施形態と図2に示された方法実施形態との間の違いは、図2に示された方法実施形態においては、広帯域スイッチング後の広帯域信号が調和信号であるか否かを決定するステップは、調和信号決定条件における決定閾値を調整することにより実行され、本実施形態においては、調和信号決定条件は、広帯域スイッチング前の超広帯域信号が調和信号である限り、広帯域スイッチング後の広帯域信号が調和信号であることがまた強制的に決定され、広帯域スイッチング前の超広帯域信号が非調和信号である限り、広帯域スイッチング後の広帯域信号が非調和信号であることがまた強制的に決定されるように調整されることにある。
本実施形態においては、広帯域スイッチングがエンコーダで発生するとき、符号化装置は、広帯域スイッチング前の超広帯域信号が調和信号であるか、または、非調和信号であるかを決定し得、もし、超広帯域信号が調和信号であるならば、符号化装置は、広帯域スイッチング後の広帯域信号が調和信号であると強制的に決定し、もし、超広帯域信号が非調和信号であるならば、符号化装置は、広帯域スイッチング後の広帯域信号が非調和信号であると強制的に決定する。従って、本実施形態においては、広帯域スイッチング中に、信号タイプが変えられることがなく、従って、会話/音声信号の連続性は、デコーダで受信された会話/音声信号に対してできるだけ確保され得る。
図5は、本発明による広帯域スイッチングに基づく信号処理方法の第5の実施形態のフローチャートである。本実施形態においては、第1の広帯域会話/音声信号は、広帯域信号であり、第2の広帯域会話/音声信号は、超広帯域信号であり、広帯域スイッチングは、広帯域信号から超広帯域信号への切り換えである。図5に示されるように、本実施形態における方法は、以下を含み得る。
ステップ501:広帯域スイッチング後の超広帯域信号の調和周波数帯域の量および最大ピーク値パラメータを計算し、超広帯域信号に対する調和周波数帯域の量、最大ピーク値パラメータ、および調和信号決定条件に従って、調和モードカウント値を更新する。
ステップ502:超広帯域信号が過渡信号ではないことをデフォルトで決定し、広帯域スイッチング前の広帯域信号のグローバルエネルギーに対する超広帯域信号のグローバルエネルギーの比がプリセット範囲に含まれることをデフォルトで決定する。
ステップ503:広帯域スイッチング前の広帯域信号が調和信号であるか否かを決定する。もし、肯定的であるならば、ステップ504を実行し、もし、否定的であるならば、ステップ505を実行する。
ステップ501から503について、図3に示された実施形態におけるステップ301からステップ303を実行するプロセスを参照するので、さらなる詳細は、ここでは説明しない。
ステップ504:広帯域スイッチング後の超広帯域信号が調和信号であると決定する。
ステップ505:広帯域スイッチング後の超広帯域信号が非調和信号であると決定する。
本実施形態と図3に示された方法実施形態との間の違いは、図3に示された方法実施形態においては、広帯域スイッチング後の超広帯域信号が調和信号であるか否かを決定するステップは、調和信号決定条件における決定閾値を調整することによって実行され、本実施形態においては、調和信号決定条件は、広帯域スイッチング前の広帯域信号が調和信号である限り、広帯域スイッチング後の超広帯域信号が調和信号であることがまた強制的に決定され、広帯域スイッチング前の広帯域信号が非調和信号である限り、広帯域スイッチング後の超広帯域信号が非調和信号であることがまた強制的に決定されるように調整されることにある。
本実施形態においては、広帯域スイッチングがエンコーダで発生するとき、符号化装置は、広帯域スイッチング前の広帯域信号が調和信号であるか、または、非調和信号であるかを決定し得、もし、広帯域信号が調和信号であるならば、符号化装置は、広帯域スイッチング後の超広帯域信号が調和信号であると強制的に決定し、もし、広帯域信号が非調和信号であるならば、符号化装置は、広帯域スイッチング後の超広帯域信号が非調和信号であると強制的に決定する。従って、本実施形態においては、広帯域スイッチング中に、信号タイプが変えられることがなく、従って、会話/音声信号の連続性は、デコーダで受信された会話/音声信号に対してできるだけ確保され得る。
本方法実施形態に関連して、本発明は、端末機器、ネットワーク機器、またはテスト機器内に置かれ得る符号化装置をさらに提供する。符号化装置は、ハードウェア回路によって実装され得、または、ハードウェアと連携するソフトウェアによって実装され得る。たとえば、図6を参照すると、プロセッサは、会話/音声信号の処理を実装するために符号化装置を呼び出す。符号化装置は、方法実施形態における様々な方法およびプロセスを実行し得る。符号化装置は、決定条件調整モジュールおよび信号タイプ決定モジュールを含み得る。
図7は、本発明による符号化装置の第1の実施形態の概略構成図である。図7に示されるように、本実施形態における符号化装置は、決定条件調整モジュール11と、信号タイプ決定モジュール12とを含む。決定条件調整モジュール11は、もし、第1の広帯域会話/音声信号が調和信号であるならば、第2の広帯域会話/音声信号が調和信号であると決定する可能性を上昇させるように第1の決定条件を取得するために、第2の広帯域会話/音声信号が調和信号であると決定するための決定条件を調整するように構成されており、ここで、第1の広帯域会話/音声信号は、広帯域スイッチング前の会話/音声信号であり、第2の広帯域会話/音声信号は、広帯域スイッチング後の会話/音声信号である。信号タイプ決定モジュール12は、第1の決定条件に従って、第2の会話/音声信号が調和信号であるか否かを決定するように構成されている。
具体的には、決定条件調整モジュール11は、第2の広帯域会話/音声信号が調和信号であると決定するための決定条件を緩和するように構成され、ここで、緩和された決定信号は第1の決定条件として使用される。
図8は、本発明の符号化装置による第2の実施形態の概略構成図である。図8に示されるように、図7に示された装置のモジュールに加えて、本実施形態における装置は、調和モード更新モジュール13をさらに含む。
本実施形態においては、決定条件調整モジュール11は、具体的には、第2の広帯域会話/音声信号が調和信号であると決定するための決定条件における調和周波数帯域量閾値および最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を低下させるように構成され、それに応じて、信号タイプ決定モジュール12は、計算ユニット121と、処理ユニット122とを含み得、計算ユニット121は、第2の広帯域会話/音声信号の調和周波数帯域量および最大ピーク値パラメータを計算するように構成され、処理ユニット122は、もし、調和周波数帯域量が減少した調和周波数帯域量閾値より大きい、および/または、最大ピーク値パラメータが減少した最大ピーク値パラメータ閾値より大きいならば、第2の広帯域会話/音声信号が調和信号であると決定するように構成されている。
調和モード更新モジュール13は、調和周波数帯域量と、最大ピーク値パラメータと、第2の広帯域会話/音声信号が調和信号であると決定するための決定条件との間の関係に従って、調和モードカウント値を更新するように構成され、それに応じて、信号タイプ決定モジュール12は、もし、調和周波数帯域量が減少した調和周波数帯域量閾値以下であり、かつ、最大ピーク値パラメータが減少した最大ピーク値パラメータ閾値以下であるならば、第2の広帯域会話/音声信号が調和信号であると決定するようにさらに構成されている。
さらに、調和モード更新モジュール13は、具体的には、もし、調和周波数帯域量が調和周波数帯域量閾値より大きく、かつ、最大ピーク値パラメータが最大ピーク値パラメータ閾値より大きいならば、調和モードカウント値を増加させ、もし、調和周波数帯域量が調和周波数帯域量閾値以下であり、および/または、最大ピーク値パラメータが最大ピーク値パラメータ閾値以下であるならば、調和モードカウント値を減少させるように構成されている。
広帯域スイッチングが広帯域信号から超広帯域信号への切り換えである、すなわち、第1の広帯域会話/音声信号が広帯域信号であり、第2の広帯域会話/音声信号が広帯域信号である場合、決定条件調整モジュール11は、超広帯域信号の時間包絡線パラメータを計算し、過渡信号決定条件における包絡線閾値を増加させ、もし、時間包絡線パラメータが増加した包絡線閾値以上であるならば、超広帯域信号が過渡信号であると決定し、もし、時間包絡線パラメータが増加した包絡線閾値未満であるならば、超広帯域信号が過渡信号ではないことをデフォルトで決定し、広帯域信号のグローバルエネルギーに対する超広帯域信号のグローバルエネルギーの比がプリセット範囲に含まれるとデフォルトで決定するようにさらに構成されている。実際の実装においては、決定条件調整モジュール11は、具体的には、もし、広帯域信号が調和信号であるならば、包絡線閾値を3倍に増加させ、もし、広帯域信号が非調和信号であるならば、包絡線閾値を2倍に増加させるように構成されている。
本発明による符号化装置の別の実施形態においては、図7に示された符号化装置実施形態に基づいて、信号タイプ決定モジュール12は、具体的には、第1の決定条件に従って、第2の広帯域会話/音声信号が調和信号であると決定するように構成され得、または、信号タイプ決定モジュール12は、もし、第1の広帯域会話/音声信号が調和信号ではないならば、第2の広帯域会話/音声信号が非調和信号であると決定するようにさらに構成される。
本発明による符号化装置のさらに別の実施形態においては、図7に示された符号化装置に基づいて、決定条件調整モジュール11は、もし、第1の広帯域会話/音声信号が調和信号ではないならば、第2の広帯域会話/音声信号が調和信号であると決定する可能性を低下させるように第2の決定条件を取得するために、調和信号決定条件を調整するようにさらに構成され、それに応じて、信号タイプ決定モジュール12は、第2の決定条件に従って、第2の広帯域会話/音声信号が調和信号であるか否かを決定するようにさらに構成されている。具体的には、決定条件調整モジュール11は、第2の広帯域会話/音声信号が調和信号であると決定するための決定条件における調和周波数帯域量閾値および最大ピーク値パラメータ閾値のうちの少なくとも一方を増加させるように構成され、それに応じて、信号タイプ決定モジュール12は、具体的には、もし、調和周波数帯域量が増加した調和周波数帯域量閾値より大きい、および/または、最大ピーク値パラメータが増加した最大ピーク値パラメータ閾値より大きいならば、第2の広帯域会話/音声信号が調和信号であると決定するように構成されている。
本発明の上記実施形態における符号化装置は、図1から図5に示された方法実施形態における技術的解決手法を対応して実行し得、これらの実装原理および技術的効果は、類似する。従って、さらなる詳細は、ここでは説明しない。
当業者は、方法実施形態のステップの全部または一部が、関連したハードウェアに命令するプログラムによって実装され得ることを理解し得る。プログラムは、コンピュータ読み取り可能な記憶媒体に記憶され得る。プログラムが実行されるとき、方法実施形態のステップが実行される。上記記憶媒体は、ROM、RAM、磁気ディスク、または光ディスクのようなプログラムコードを格納し得るいかなる媒体も含む。
最後に、上記実施形態は、本発明を限定するためにではなく、本発明の技術的解決手法について説明するためにだけ意図されていることに注意すべきである。本発明は、上記実施形態に関連して詳細に説明されているが、当業者は、本発明の実施形態の技術的解決手法の範囲から逸脱することなく、上記実施形態において説明された技術的解決手法に修正を行い得ること、または、これらの技術的解決手法のある種の技術的特徴に等価な置換を行い得ることを理解すべきである。

Claims (23)

  1. 会話/音声信号処理方法であって、
    もし、第1の広帯域会話/音声信号が調和信号であるならば、第2の広帯域会話/音声信号が調和信号であると決定する可能性を上昇させるように第1の決定条件を取得するために、前記第2の広帯域会話/音声信号が調和信号であると決定するための決定条件を調整する調整ステップであって、前記第1の広帯域会話/音声信号は、広帯域スイッチング前の会話/音声信号であり、前記第2の広帯域会話/音声信号は、広帯域スイッチング後の会話/音声信号であり、前記第1の広帯域会話/音声信号は、超広帯域信号であり、前記スイッチング後の前記第2の広帯域会話/音声信号は、広帯域信号である、または、前記第1の広帯域会話/音声信号は、広帯域信号であり、前記スイッチング後の前記第2の広帯域会話/音声信号は、超広帯域信号である、調整ステップと、
    前記第1の決定条件に従って、前記第2の広帯域会話/音声信号が調和信号であるか否かを決定する決定ステップと、を備える
    方法。
  2. 請求項1に記載の方法であって、第2の広帯域会話/音声信号が調和信号であると決定する可能性を上昇させるように第1の決定条件を取得するために、前記第2の広帯域会話/音声信号が調和信号であると決定するための決定条件を調整する前記調整ステップが、
    前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件を緩和する緩和ステップであり、緩和された決定条件が前記第1の決定条件として使用される、緩和ステップを含む、
    方法。
  3. 請求項2に記載の方法であって、前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件を緩和する前記緩和ステップが、
    前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件における調和周波数帯域量閾値および最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を減少させる減少ステップを含み、
    前記第1の決定条件に従って、前記第2の広帯域会話/音声信号が調和信号であるか否かを決定する前記決定ステップが、
    前記第2の広帯域会話/音声信号の調和周波数帯域量および最大ピーク値パラメータを計算する計算ステップと、
    もし、前記調和周波数帯域量が減少した調和周波数帯域量閾値より大きい、および/または、前記最大ピーク値パラメータが減少した最大ピーク値パラメータ閾値より大きいならば、前記第2の広帯域会話/音声信号が調和信号であると決定する決定ステップと、を含む、
    方法。
  4. 請求項3に記載の方法であって、
    前記調和周波数帯域量と、前記最大ピーク値パラメータと、前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件との間の関係に従って、調和モードカウント値を更新する更新ステップをさらに備え、
    もし、前記調和周波数帯域量が前記減少した調和周波数帯域量閾値以下であり、かつ、前記最大ピーク値パラメータが前記減少した最大ピーク値パラメータ閾値以下であるならば、前記方法は、
    もし、前記調和モードカウント値がプリセット値より大きいならば、前記第2の広帯域会話/音声信号が調和信号であると決定する決定ステップをさらに備える、
    方法。
  5. 請求項4に記載の方法であって、前記調和周波数帯域量と、前記最大ピーク値パラメータと、前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件との間の関係に従って、調和モードカウント値を更新する前記更新ステップは、
    もし、前記調和周波数帯域量が前記調和周波数帯域量閾値より大きく、かつ、前記最大ピーク値パラメータが前記最大ピーク値パラメータ閾値より大きいならば、前記調和モードカウント値を増加させる増加ステップと、
    もし、前記調和周波数帯域量が前記調和周波数帯域量閾値以下である、および/または、前記最大ピーク値パラメータが前記最大ピーク値パラメータ閾値以下であるならば、前記調和モードカウント値を減少させる減少ステップと、を含む、
    方法。
  6. 請求項4または5に記載の方法であって、前記第1の広帯域会話/音声信号は広帯域信号であり、前記第2の広帯域会話/音声信号は超広帯域信号であり、前記第1の決定条件に従って、前記第2の広帯域会話/音声信号が調和信号であるか否かを決定する決定ステップの前に、前記方法は、
    前記超広帯域信号の時間包絡線パラメータを計算する計算ステップと、過渡信号決定条件における包絡線閾値を増加させる増加ステップと、
    もし、前記時間包絡線パラメータが増加した包絡線閾値以上であるならば、前記超広帯域信号が過渡信号であると決定する決定ステップと、
    もし、前記時間包絡線パラメータが前記増加した包絡線閾値未満であるならば、前記超広帯域信号が過渡信号ではないとデフォルトで決定し、前記広帯域信号のグローバルエネルギーに対する前記超広帯域信号のグローバルエネルギーの比がプリセット範囲に含まれるとデフォルトで決定するステップと、をさらに備える、
    方法。
  7. 請求項6に記載の方法であって、過渡信号決定条件における包絡線閾値を増加させる増加ステップは、具体的には、
    もし、前記広帯域信号が調和信号であるならば、前記包絡線閾値を3倍に増加させる増加ステップと、
    もし、前記広帯域信号が非調和信号であるならば、前記包絡線閾値を2倍に増加させる増加ステップである、
    方法。
  8. 請求項1乃至7のいずれか1項に記載の方法であって、
    もし、前記第1の広帯域会話/音声信号が調和信号ではないならば、第2の広帯域会話/音声信号が調和信号であると決定する可能性を低下させるように第2の決定条件を取得するために、前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件を調整する調整ステップと、
    前記第2の決定条件に従って、前記第2の広帯域会話/音声信号が調和信号であるか否かを決定する決定ステップと、をさらに備える、
    方法。
  9. 請求項8に記載の方法であって、第2の広帯域会話/音声信号が調和信号であると決定する可能性を低下させるように第2の決定条件を取得するために、前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件を調整する前記調整ステップは、
    前記第2の広帯域会話/音声信号が調和信号であると決定する前記決定条件における調和周波数帯域量閾値および最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を増加させる増加ステップを含み、
    前記第2の決定条件に従って、前記第2の広帯域会話/音声信号が調和信号であるか否かを決定する前記決定ステップは、
    前記第2の広帯域会話/音声信号の調和周波数帯域量および最大ピーク値パラメータを計算する計算ステップと、
    もし、前記調和周波数帯域量が増加した調和周波数帯域量閾値より大きい、および/または、前記最大ピーク値パラメータが増加した最大ピーク値パラメータ閾値より大きいならば、前記第2の広帯域会話/音声信号が調和信号であると決定する決定ステップと、を含む、
    方法。
  10. 請求項1乃至7のいずれか1項に記載の方法であって、
    もし、前記第1の広帯域会話/音声信号が調和信号ではないならば、前記第2の広帯域会話/音声信号が非調和信号であると決定する決定ステップをさらに備える、
    方法。
  11. 請求項1または2に記載の方法であって、前記第1の決定条件に従って、前記第2の広帯域会話/音声信号が調和信号であるか否かを決定する前記決定ステップは、
    前記第1の決定条件に従って、前記第2の広帯域会話/音声信号が調和信号であると決定する決定ステップを含む、
    方法。
  12. 符号化装置であって、
    もし、第1の広帯域会話/音声信号が調和信号であるならば、第2の広帯域会話/音声信号が調和信号であると決定する可能性を上昇させるように第1の決定条件を取得するために、前記第2の広帯域会話/音声信号が調和信号であると決定する決定条件を調整するように構成されている決定条件調整モジュールであり、前記第1の広帯域会話/音声信号は、広帯域スイッチング前の会話/音声信号であり、前記第2の広帯域会話/音声信号は、広帯域スイッチング後の会話/音声信号であり、前記第1の広帯域会話/音声信号は、超広帯域信号であり、前記スイッチング後の前記第2の広帯域会話/音声信号は、広帯域信号である、または、前記第1の広帯域会話/音声信号は、広帯域信号であり、前記スイッチング後の前記第2の広帯域会話/音声信号は、超広帯域信号である、決定条件調整モジュールと、
    前記第1の決定条件に従って、前記第2の広帯域会話/音声信号が調和信号であるか否かを決定するように構成されている信号タイプ決定モジュールと、を備える
    装置。
  13. 請求項12に記載の装置であって、前記決定条件調整モジュールは、具体的には、前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件を緩和するように構成され、緩和された決定条件が前記第1の決定条件として使用される、
    装置。
  14. 請求項13に記載の装置であって、前記決定条件調整モジュールは、具体的には、前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件における調和周波数帯域量閾値および最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を減少させるように構成され、
    前記信号タイプ決定モジュールは、
    前記第2の広帯域会話/音声信号の調和周波数帯域量および最大ピーク値パラメータを計算するように構成された計算ユニットと、
    もし、前記調和周波数帯域量が減少した調和周波数帯域量閾値より大きい、および/または、前記最大ピーク値パラメータが減少した最大ピーク値パラメータ閾値より大きいならば、前記第2の広帯域会話/音声信号が調和信号であると決定するように構成されている処理ユニットと、を含む、
    装置。
  15. 請求項14に記載の装置であって、前記装置は、
    前記調和周波数帯域量と、前記最大ピーク値パラメータと、前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件との間の関係に従って、調和モードカウント値を更新するように構成されている調和モード更新モジュールをさらに備え、
    前記信号タイプ決定モジュールは、もし、前記調和周波数帯域量が前記減少した調和周波数帯域量閾値以下であり、前記最大ピーク値パラメータが前記減少した最大ピーク値パラメータ閾値以下であり、前記調和モードカウント値がプリセット値より大きいならば、前記第2の広帯域会話/音声信号が調和信号であると決定するようにさらに構成されている、
    装置。
  16. 請求項15に記載の装置であって、前記調和モード更新モジュールは、具体的には、もし、前記調和周波数帯域量が前記調和周波数帯域量閾値より大きく、かつ、前記最大ピーク値パラメータが前記最大ピーク値パラメータ閾値より大きいならば、前記調和モードカウント値を増加させ、もし、前記調和周波数帯域量が前記調和周波数帯域量閾値以下である、および/または、前記最大ピーク値パラメータが前記最大ピーク値パラメータ閾値以下であるならば、前記調和モードカウント値を減少させるように構成されている、
    装置。
  17. 請求項14または15に記載の装置であって、前記第1の広帯域会話/音声信号は広帯域信号であり、前記第2の広帯域会話/音声信号は超広帯域信号であり、前記決定条件調整モジュールは、前記超広帯域信号の時間包絡線パラメータを計算し、過渡信号決定条件における包絡線閾値を増加させるように、もし、前記時間包絡線パラメータが増加した包絡線閾値以上であるならば、前記超広帯域信号が過渡信号であると決定するように、そして、もし、前記時間包絡線パラメータが前記増加した包絡線閾値未満であるならば、前記超広帯域信号が過渡信号ではないとデフォルトで決定し、前記広帯域信号のグローバルエネルギーに対する前記超広帯域信号のグローバルエネルギーの比がプリセット範囲に含まれるとデフォルトで決定するように構成されている、
    装置。
  18. 請求項17に記載の装置であって、前記決定条件調整モジュールは、具体的には、もし、前記広帯域信号が調和信号であるならば、前記包絡線閾値を3倍に増加させるように、もし、前記広帯域信号が非調和信号であるならば、前記包絡線閾値を2倍に増加させるように構成されている、
    装置。
  19. 請求項12乃至18のいずれか1項に記載の装置であって、前記決定条件調整モジュールは、もし、前記第1の広帯域会話/音声信号が調和信号ではないならば、前記第2の広帯域会話/音声信号が調和信号であると決定する可能性を低下させるように第2の決定条件を取得するために、前記調和信号決定条件を調整するようにさらに構成され、
    前記信号タイプ決定モジュールは、前記第2の決定条件に従って、前記第2の広帯域会話/音声信号が調和信号であるか否かを決定するようにさらに構成されている、
    装置。
  20. 請求項19に記載の装置であって、前記決定条件調整モジュールは、具体的には、前記第2の広帯域会話/音声信号が調和信号であると決定するための前記決定条件における調和周波数帯域量閾値および最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を増加させるように構成され、
    前記信号タイプ決定モジュールは、具体的には、前記第2の広帯域会話/音声信号の調和周波数帯域量および最大ピーク値パラメータを計算し、もし、前記調和周波数帯域量が増加した調和周波数帯域量閾値より大きい、および/または、前記最大ピーク値パラメータが増加した最大ピーク値パラメータ閾値より大きいならば、前記第2の広帯域会話/音声信号が調和信号であると決定するように構成されている、
    装置。
  21. 請求項12乃至18のいずれか1項に記載の装置であって、前記信号タイプ決定モジュールは、もし、前記第1の広帯域会話/音声信号が調和信号ではないならば、前記第2の広帯域会話/音声信号が非調和信号であると決定するようにさらに構成されている、
    装置。
  22. 請求項12または13に記載の装置であって、前記信号タイプ決定モジュールは、具体的には、前記第1の決定条件に従って、前記第2の広帯域会話/音声信号が調和信号であると決定するように構成されている、
    装置。
  23. プログラムが記録されている、コンピュータ読み取り可能な記憶媒体であって、前記プログラムは、請求項1乃至11のいずれかの方法をコンピュータに実行させる、
    記憶媒体。
JP2019198664A 2012-06-29 2019-10-31 会話/音声信号処理方法および符号化装置 Active JP6892491B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201210223014.0A CN103516440B (zh) 2012-06-29 2012-06-29 语音频信号处理方法和编码装置
CN201210223014.0 2012-06-29
JP2017066354A JP6612808B2 (ja) 2012-06-29 2017-03-29 会話/音声信号処理方法および符号化装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017066354A Division JP6612808B2 (ja) 2012-06-29 2017-03-29 会話/音声信号処理方法および符号化装置

Publications (2)

Publication Number Publication Date
JP2020024461A JP2020024461A (ja) 2020-02-13
JP6892491B2 true JP6892491B2 (ja) 2021-06-23

Family

ID=49782211

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2015518805A Active JP6359529B2 (ja) 2012-06-29 2013-06-06 会話/音声信号処理方法および符号化装置
JP2017066354A Active JP6612808B2 (ja) 2012-06-29 2017-03-29 会話/音声信号処理方法および符号化装置
JP2019198664A Active JP6892491B2 (ja) 2012-06-29 2019-10-31 会話/音声信号処理方法および符号化装置

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2015518805A Active JP6359529B2 (ja) 2012-06-29 2013-06-06 会話/音声信号処理方法および符号化装置
JP2017066354A Active JP6612808B2 (ja) 2012-06-29 2017-03-29 会話/音声信号処理方法および符号化装置

Country Status (7)

Country Link
US (2) US10056090B2 (ja)
EP (3) EP3376499B1 (ja)
JP (3) JP6359529B2 (ja)
KR (6) KR102005967B1 (ja)
CN (1) CN103516440B (ja)
ES (3) ES2930240T3 (ja)
WO (1) WO2014000559A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103516440B (zh) * 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
MX353200B (es) * 2014-03-14 2018-01-05 Ericsson Telefon Ab L M Método y aparato de codificación de audio.
CN106303878A (zh) * 2015-05-22 2017-01-04 成都鼎桥通信技术有限公司 一种啸叫检测和抑制方法
US10431242B1 (en) * 2017-11-02 2019-10-01 Gopro, Inc. Systems and methods for identifying speech based on spectral features

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0029048B1 (en) * 1979-05-28 1985-05-29 The University Of Melbourne Speech processor
US5574724A (en) * 1995-05-26 1996-11-12 Lucent Technologies Inc. Adjustment of call bandwidth during a communication call
US20050065786A1 (en) * 2003-09-23 2005-03-24 Jacek Stachurski Hybrid speech coding and system
FI115329B (fi) * 2000-05-08 2005-04-15 Nokia Corp Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin
KR100462611B1 (ko) * 2002-06-27 2004-12-20 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
EP1791116B1 (en) * 2004-09-17 2011-11-23 Panasonic Corporation Scalable voice encoding apparatus, scalable voice decoding apparatus, scalable voice encoding method, scalable voice decoding method, communication terminal apparatus, and base station apparatus
KR100707174B1 (ko) * 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
US8311840B2 (en) * 2005-06-28 2012-11-13 Qnx Software Systems Limited Frequency extension of harmonic signals
JP5009910B2 (ja) 2005-07-22 2012-08-29 フランス・テレコム レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法
CA2558595C (en) * 2005-09-02 2015-05-26 Nortel Networks Limited Method and apparatus for extending the bandwidth of a speech signal
KR101131880B1 (ko) * 2007-03-23 2012-04-03 삼성전자주식회사 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치
EP2207166B1 (en) * 2007-11-02 2013-06-19 Huawei Technologies Co., Ltd. An audio decoding method and device
CN101903945B (zh) * 2007-12-21 2014-01-01 松下电器产业株式会社 编码装置、解码装置以及编码方法
CN101662288B (zh) * 2008-08-28 2012-07-04 华为技术有限公司 音频编码、解码方法及装置、系统
US8515747B2 (en) * 2008-09-06 2013-08-20 Huawei Technologies Co., Ltd. Spectrum harmonic/noise sharpness control
CN101763856B (zh) * 2008-12-23 2011-11-02 华为技术有限公司 信号分类处理方法、分类处理装置及编码系统
JP4945586B2 (ja) * 2009-02-02 2012-06-06 株式会社東芝 信号帯域拡張装置
CN101964189B (zh) 2010-04-28 2012-08-08 华为技术有限公司 语音频信号切换方法及装置
WO2011156905A2 (en) * 2010-06-17 2011-12-22 Voiceage Corporation Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands
US20120029926A1 (en) * 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals
KR102070430B1 (ko) * 2011-10-21 2020-01-28 삼성전자주식회사 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치
CN103999153B (zh) * 2011-10-24 2017-03-01 Lg电子株式会社 用于以带选择的方式量化语音信号的方法和设备
GB2502800B (en) * 2012-06-07 2015-05-20 Jaguar Land Rover Ltd Crane and related method of operation
CN103516440B (zh) * 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
BR122020016403B1 (pt) * 2013-06-11 2022-09-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Aparelho de decodificação de sinal de áudio, aparelho de codificação de sinal de áudio, método de decodificação de sinal de áudio e método de codificação de sinal de áudio
US9564141B2 (en) * 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation

Also Published As

Publication number Publication date
EP2851897A1 (en) 2015-03-25
JP2020024461A (ja) 2020-02-13
KR20200118252A (ko) 2020-10-14
KR20190091374A (ko) 2019-08-05
CN103516440B (zh) 2015-07-08
CN103516440A (zh) 2014-01-15
JP6612808B2 (ja) 2019-11-27
KR20170120209A (ko) 2017-10-30
US11107486B2 (en) 2021-08-31
KR20150021100A (ko) 2015-02-27
US20180336910A1 (en) 2018-11-22
KR102005967B1 (ko) 2019-07-31
ES2654488T3 (es) 2018-02-13
ES2779857T3 (es) 2020-08-20
KR102165827B1 (ko) 2020-10-14
EP2851897A4 (en) 2015-06-24
KR20160150107A (ko) 2016-12-28
KR101689138B1 (ko) 2016-12-23
EP3748634A1 (en) 2020-12-09
EP3376499B1 (en) 2020-01-08
EP3748634B1 (en) 2022-08-10
KR102331531B1 (ko) 2021-12-01
US20150095038A1 (en) 2015-04-02
JP2017134412A (ja) 2017-08-03
JP2015526754A (ja) 2015-09-10
WO2014000559A1 (zh) 2014-01-03
KR101907494B1 (ko) 2018-10-12
EP3376499A1 (en) 2018-09-19
JP6359529B2 (ja) 2018-07-18
ES2930240T3 (es) 2022-12-09
US10056090B2 (en) 2018-08-21
KR20180112121A (ko) 2018-10-11
KR101790680B1 (ko) 2017-10-26
EP2851897B1 (en) 2017-11-15

Similar Documents

Publication Publication Date Title
JP6892491B2 (ja) 会話/音声信号処理方法および符号化装置
JP6378274B2 (ja) 音声/オーディオ信号処理方法および装置
JP6462653B2 (ja) オーディオ・データを処理するための方法、装置、及びシステム
JP2011158906A (ja) 変換補間によるオーディオパケット損失補償
WO2012100557A1 (zh) 一种带宽扩展方法及装置
CN105761724B (zh) 一种语音频信号处理方法和装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191120

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200923

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20201223

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210319

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210427

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210527

R150 Certificate of patent or registration of utility model

Ref document number: 6892491

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250