JP2002540441A5 - - Google Patents

Download PDF

Info

Publication number
JP2002540441A5
JP2002540441A5 JP2000584462A JP2000584462A JP2002540441A5 JP 2002540441 A5 JP2002540441 A5 JP 2002540441A5 JP 2000584462 A JP2000584462 A JP 2000584462A JP 2000584462 A JP2000584462 A JP 2000584462A JP 2002540441 A5 JP2002540441 A5 JP 2002540441A5
Authority
JP
Japan
Prior art keywords
information
correlation value
voice
noise information
normalized correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000584462A
Other languages
English (en)
Other versions
JP4025018B2 (ja
JP2002540441A (ja
Filing date
Publication date
Priority claimed from US09/434,787 external-priority patent/US6424938B1/en
Application filed filed Critical
Publication of JP2002540441A publication Critical patent/JP2002540441A/ja
Publication of JP2002540441A5 publication Critical patent/JP2002540441A5/ja
Application granted granted Critical
Publication of JP4025018B2 publication Critical patent/JP4025018B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Description

【特許請求の範囲】
【請求項1】
音声信号の符号化に際して音声信号中において雑音情報よりも高い伝送ビットレートを必要とする非音声情報を保存する方法であって、
音声信号が、音声情報または雑音情報のいずれを含むかを示す第1の決定を行う過程と、
音声信号が、雑音情報よりも高い伝送ビットレートを必要とする非音声情報を含むか否かの第2の決定を行う過程と、
前記第2の決定に応答して、雑音情報を示す前記第1の決定を選択的に無効にする過程とを有し、
前記第2の決定を行う過程において、所与の期間中に、最大振幅の正規化相関値が所定の閾値を超えるフレームの数が所定数を超える場合に、雑音情報よりも高い伝送ビットレートを必要とする非音声情報を含むと決定する方法。
【請求項2】
前記第2の決定を行う過程において、最大振幅の正規化相関値が所定の閾値を超えるフレームの連続する数が所定数を超える場合に、雑音情報よりも高い伝送ビットレートを必要とする非音声情報を含むと決定することを特徴とする請求項1記載の方法。
【請求項3】
それぞれのフレームについて、音声信号の開ループ長時間予測相関分析において得られた正規化相関値を用いて計算される候補値の集合から、前記最大振幅の正規化相関値が選択されることを特徴とする請求項1記載の方法。
【請求項4】
それぞれのフレームについて、音声信号をハイパスフィルタ処理した後にハイパスフィルタ処理された音声信号に対して相関分析を適用することにより算出された複数の正規化相関値から、前記最大振幅の正規化相関値が選択されることを特徴とする請求項1記載の方法。
【請求項5】
音声信号に含まれる雑音情報よりも高い伝送ビットレートを必要とする非音声情報を保存するために音声信号符号化器において使用する装置(10)であって、
音声信号(12)を受信し、音声信号(12)が音声情報または雑音情報のいずれを含むかを示す第1の決定を行う選別器(16)と、
音声信号(12)を受信し、音声信号(12)が雑音情報よりも高い伝送ビットレートを必要とする非音声情報を含むか否かの第2の決定を行う検出器(14)と、
前記選別器(16)および前記検出器(14)と結合され、前記第1の決定を示す情報を出力に選択的に供給するように動作可能である論理回路(18)とを有して構成され、
前記第2の決定を行う検出器(14)において、所与の期間中に、最大振幅の正規化相関値が所定の閾値を超えるフレームの数が所定数を超えて、雑音情報よりも高い伝送ビットレートを必要とする非音声情報を含むと決定された場合に、前記論理回路(18)において、雑音情報を示す前記第1の決定が無効にされる装置。
【請求項6】
前記第2の決定を行う検出器(14)において、最大振幅の正規化相関値が所定の閾値を超えるフレームの連続する数が所定数を超える場合に、雑音情報よりも高い伝送ビットレートを必要とする非音声情報を含むと決定されることを特徴とする請求項5記載の装置。
【請求項7】
それぞれのフレームについて、音声信号の開ループ長時間予測相関分析において得られた正規化相関値を用いて計算される候補値の集合から、前記最大振幅の正規化相関値が選択されることを特徴とする請求項5記載の装置。
【請求項8】
それぞれのフレームについて、音声信号をハイパスフィルタ処理した後にハイパスフィルタ処理された音声信号に対して相関分析を適用することにより算出された複数の正規化相関値から、前記最大振幅の正規化相関値が選択されることを特徴とする請求項1記載の方法。
【請求項9】
複数のフレームに分割される音声信号の符号化に際して音声信号中において雑音情報よりも高い伝送ビットレートを必要とする非音声情報を保存する方法であって、
音声信号が音声情報または雑音情報のいずれを含むかを示す第1の決定を行う過程と、
それぞれのフレームについて、ハイパスフィルタ処理された音声信号についての最大正規化相関値を表す数値を検出することで数値の第1のシーケンスを作成する過程と、
該第1のシーケンスの数値に対して平滑化フィルタリング処理を適用することでそれぞれ得られる数値の第2のシーケンスを作成する過程と、
第2のシーケンスの数値を少なくとも1つの閾値と比較することで、雑音情報よりも高い伝送ビットレートを必要とする非音声情報を含む音声信号であるか否かを示す第2の決定を行う過程と、
前記第2の決定に応答して、雑音情報を示す前記第1の決定を選択的に無効にする過程とを有する方法。
【請求項10】
最大正規化相関値を表す数値を検出する前記過程が、音声信号の相関分析から得られる数値を対象として実行されることを特徴とする請求項9に記載の方法。
【請求項11】
それぞれのフレームについて、ハイパスフィルタ処理された音声信号についての最大正規化相関値を表す数値が、音声信号の開ループ長時間予測相関分析において得られた正規化相関値を用いて計算される候補値の集合から選択されることを特徴とする請求項9に記載の方法。
【請求項12】
最大正規化相関値を表す数値を検出する前記過程が、音声信号をハイパスフィルタ処理した後にハイパスフィルタ処理された音声信号に対して相関分析を適用することを含むことを特徴とする請求項9に記載の方法。
【請求項13】
最大正規化相関値を表す数値を検出する前記過程において、それぞれのフレームについて、ハイパスフィルタ処理された音声信号についての最大正規化相関値を表す数値が、最大振幅の正規化相関値であることを特徴とする請求項9記載の方法。
JP2000584462A 1998-11-23 1999-11-12 音声信号の改善された音声/雑音選別のための複合信号活動検出 Expired - Lifetime JP4025018B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US10955698P 1998-11-23 1998-11-23
US60/109,556 1998-11-23
US09/434,787 1999-11-05
US09/434,787 US6424938B1 (en) 1998-11-23 1999-11-05 Complex signal activity detection for improved speech/noise classification of an audio signal
PCT/SE1999/002073 WO2000031720A2 (en) 1998-11-23 1999-11-12 Complex signal activity detection for improved speech/noise classification of an audio signal

Publications (3)

Publication Number Publication Date
JP2002540441A JP2002540441A (ja) 2002-11-26
JP2002540441A5 true JP2002540441A5 (ja) 2007-08-30
JP4025018B2 JP4025018B2 (ja) 2007-12-19

Family

ID=26807081

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000584462A Expired - Lifetime JP4025018B2 (ja) 1998-11-23 1999-11-12 音声信号の改善された音声/雑音選別のための複合信号活動検出

Country Status (15)

Country Link
US (1) US6424938B1 (ja)
EP (1) EP1224659B1 (ja)
JP (1) JP4025018B2 (ja)
KR (1) KR100667008B1 (ja)
CN (2) CN1828722B (ja)
AR (1) AR030386A1 (ja)
AU (1) AU763409B2 (ja)
BR (1) BR9915576B1 (ja)
CA (1) CA2348913C (ja)
DE (1) DE69925168T2 (ja)
HK (1) HK1097080A1 (ja)
MY (1) MY124630A (ja)
RU (1) RU2251750C2 (ja)
WO (1) WO2000031720A2 (ja)
ZA (1) ZA200103150B (ja)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6424938B1 (en) * 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
US6633841B1 (en) 1999-07-29 2003-10-14 Mindspeed Technologies, Inc. Voice activity detection speech coding to accommodate music signals
US6694012B1 (en) * 1999-08-30 2004-02-17 Lucent Technologies Inc. System and method to provide control of music on hold to the hold party
US20030205124A1 (en) * 2002-05-01 2003-11-06 Foote Jonathan T. Method and system for retrieving and sequencing music by rhythmic similarity
US20040064314A1 (en) * 2002-09-27 2004-04-01 Aubert Nicolas De Saint Methods and apparatus for speech end-point detection
EP1569200A1 (en) * 2004-02-26 2005-08-31 Sony International (Europe) GmbH Identification of the presence of speech in digital audio data
EP1861846B1 (en) * 2005-03-24 2011-09-07 Mindspeed Technologies, Inc. Adaptive voice mode extension for a voice activity detector
US8874437B2 (en) * 2005-03-28 2014-10-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal for voice quality enhancement
ATE409937T1 (de) * 2005-06-20 2008-10-15 Telecom Italia Spa Verfahren und vorrichtung zum senden von sprachdaten zu einer fernen einrichtung in einem verteilten spracherkennungssystem
KR100785471B1 (ko) 2006-01-06 2007-12-13 와이더댄 주식회사 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US9966085B2 (en) * 2006-12-30 2018-05-08 Google Technology Holdings LLC Method and noise suppression circuit incorporating a plurality of noise suppression techniques
JP5395066B2 (ja) 2007-06-22 2014-01-22 ヴォイスエイジ・コーポレーション 音声区間検出および音声信号分類ための方法および装置
JP5461421B2 (ja) * 2007-12-07 2014-04-02 アギア システムズ インコーポレーテッド 保留音楽のエンドユーザ制御
US20090154718A1 (en) * 2007-12-14 2009-06-18 Page Steven R Method and apparatus for suppressor backfill
DE102008009719A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
WO2009110738A2 (ko) * 2008-03-03 2009-09-11 엘지전자(주) 오디오 신호 처리 방법 및 장치
RU2452042C1 (ru) * 2008-03-04 2012-05-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для обработки аудиосигнала
ES2379761T3 (es) 2008-07-11 2012-05-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Proporcinar una señal de activación de distorsión de tiempo y codificar una señal de audio con la misma
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
KR101251045B1 (ko) * 2009-07-28 2013-04-04 한국전자통신연구원 오디오 판별 장치 및 그 방법
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
CN102044243B (zh) * 2009-10-15 2012-08-29 华为技术有限公司 语音激活检测方法与装置、编码器
CN104485118A (zh) 2009-10-19 2015-04-01 瑞典爱立信有限公司 用于语音活动检测的检测器和方法
CA2778342C (en) * 2009-10-19 2017-08-22 Martin Sehlstedt Method and background estimator for voice activity detection
US20110178800A1 (en) * 2010-01-19 2011-07-21 Lloyd Watts Distortion Measurement for Noise Suppression System
JP5609737B2 (ja) * 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN102237085B (zh) * 2010-04-26 2013-08-14 华为技术有限公司 音频信号的分类方法及装置
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
DK3493205T3 (da) 2010-12-24 2021-04-19 Huawei Tech Co Ltd Fremgangsmåde og indretning til adaptiv detektion af stemmeaktivitet i et lydindgangssignal
EP2477188A1 (en) 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
WO2012127278A1 (en) * 2011-03-18 2012-09-27 Nokia Corporation Apparatus for audio signal processing
CN103187065B (zh) 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和系统
US9208798B2 (en) 2012-04-09 2015-12-08 Board Of Regents, The University Of Texas System Dynamic control of voice codec data rate
ES2604652T3 (es) * 2012-08-31 2017-03-08 Telefonaktiebolaget Lm Ericsson (Publ) Método y dispositivo para detectar la actividad vocal
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
AU2013366642B2 (en) 2012-12-21 2016-09-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals
EP2936486B1 (en) 2012-12-21 2018-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Comfort noise addition for modeling background noise at low bit-rates
MY181026A (en) * 2013-06-21 2020-12-16 Fraunhofer Ges Forschung Apparatus and method realizing improved concepts for tcx ltp
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
CN110265059B (zh) 2013-12-19 2023-03-31 瑞典爱立信有限公司 估计音频信号中的背景噪声
WO2016033364A1 (en) 2014-08-28 2016-03-03 Audience, Inc. Multi-sourced noise suppression
KR102299330B1 (ko) * 2014-11-26 2021-09-08 삼성전자주식회사 음성 인식 방법 및 그 전자 장치
US10978096B2 (en) * 2017-04-25 2021-04-13 Qualcomm Incorporated Optimized uplink operation for voice over long-term evolution (VoLte) and voice over new radio (VoNR) listen or silent periods
CN113345446B (zh) * 2021-06-01 2024-02-27 广州虎牙科技有限公司 音频处理方法、装置、电子设备和计算机可读存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58143394A (ja) * 1982-02-19 1983-08-25 株式会社日立製作所 音声区間の検出・分類方式
US5276765A (en) * 1988-03-11 1994-01-04 British Telecommunications Public Limited Company Voice activity detection
ATE294441T1 (de) * 1991-06-11 2005-05-15 Qualcomm Inc Vocoder mit veränderlicher bitrate
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5930749A (en) * 1996-02-02 1999-07-27 International Business Machines Corporation Monitoring, identification, and selection of audio signal poles with characteristic behaviors, for separation and synthesis of signal contributions
US6570991B1 (en) * 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
US6097772A (en) * 1997-11-24 2000-08-01 Ericsson Inc. System and method for detecting speech transmissions in the presence of control signaling
US6188980B1 (en) * 1998-08-24 2001-02-13 Conexant Systems, Inc. Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6173257B1 (en) * 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
US6424938B1 (en) * 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal

Similar Documents

Publication Publication Date Title
JP2002540441A5 (ja)
EP2162881B1 (en) Voice activity detection with improved music detection
US10360921B2 (en) Method and apparatus for determining coding mode
JP4025018B2 (ja) 音声信号の改善された音声/雑音選別のための複合信号活動検出
JP4778010B2 (ja) 減少レート、可変レートの音声分析合成を実行する方法及び装置
RU2001117231A (ru) Обнаружение активности сложного сигнала для усовершенствованной классификации речи/шума в аудио-сигнале
JP2008503783A (ja) オーディオ信号のエンコーディングにおけるコーディング・モデルの選択
CA1184657A (en) Digital speech processing using linear prediction process
CN107331386B (zh) 音频信号的端点检测方法、装置、处理系统及计算机设备
RU2003119971A (ru) Способ улучшенного обнаружения ошибок скорости в приемниках с переменной скоростью и устройство для его осуществления
US6226607B1 (en) Method and apparatus for eighth-rate random number generation for speech coders
RU2127912C1 (ru) Способ обнаружения и кодирования и/или декодирования стационарных фоновых звуков и устройство для кодирования и/или декодирования стационарных фоновых звуков
CN1447963A (zh) 语音编码中噪音鲁棒分类方法
US5632004A (en) Method and apparatus for encoding/decoding of background sounds
JPH0341838B2 (ja)
GB2357683A (en) Voiced/unvoiced determination for speech coding
KR950022502A (ko) 음송 신호 전송 장치 및 방법
CA1301338C (en) Frame comparison method for word recognition in high noise environments
JP2656069B2 (ja) 音声検出装置
JPH10222194A (ja) 音声符号化における有声音と無声音の識別方法
TW200507527A (en) Barker code detector
JPH0522153A (ja) 音声符号化回路
JPH0467200A (ja) 有音区間判定方法
JP2602641B2 (ja) 音声符号化方式
JPH0637734A (ja) 音声伝送方式