JP4739023B2 - デジタル音声信号におけるクリッキングノイズ検出 - Google Patents
デジタル音声信号におけるクリッキングノイズ検出 Download PDFInfo
- Publication number
- JP4739023B2 JP4739023B2 JP2005507732A JP2005507732A JP4739023B2 JP 4739023 B2 JP4739023 B2 JP 4739023B2 JP 2005507732 A JP2005507732 A JP 2005507732A JP 2005507732 A JP2005507732 A JP 2005507732A JP 4739023 B2 JP4739023 B2 JP 4739023B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- energy
- signal section
- section
- sections
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 95
- 238000001514 detection method Methods 0.000 title claims description 44
- 238000000034 method Methods 0.000 claims abstract description 80
- 238000011156 evaluation Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 11
- 108010076504 Protein Sorting Signals Proteins 0.000 description 6
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000001747 exhibiting effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/24—Signal processing not specific to the method of recording or reproducing; Circuits therefor for reducing noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
- G10L2025/786—Adaptive threshold
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Circuit For Audible Band Transducer (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Amplifiers (AREA)
- Noise Elimination (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
Description
Claims (18)
- 少なくとも1つのプロセッサを用いてデジタル音声信号における少なくとも1つのノイズ信号を検出する方法であって、
前記デジタル音声信号を複数の連続する信号セクションに分割するステップと、
前記少なくとも1つのプロセッサによって、前記複数の連続する信号セクションの各信号セクションについてエネルギーコンテンツを決定するステップと、
前記各信号セクションのエネルギーコンテンツとエネルギー閾値とを比較するステップと、
前記複数の連続する信号セクションから、前記エネルギー閾値より高いエネルギーコンテンツを有する少なくとも1つの高エネルギー信号セクションであって、前記エネルギー閾値より低いエネルギーコンテンツを有する少なくとも1つの先行する信号セクションと、前記エネルギー閾値より低いエネルギーコンテンツを有する少なくとも1つの後続する信号セクションとを有する高エネルギー信号セクションを検出するステップと、
前記少なくとも1つの先行する信号セクションの第1の数、前記少なくとも1つの高エネルギー信号セクションの第2の数、及び前記少なくとも1つの後続する信号セクションの第3の数を計数するステップと、
前記第1の数、第2の数及び第3の数に基づき、前記少なくとも1つの高エネルギー信号セクションが前記少なくとも1つのノイズ信号を表すか判断するステップと、
を有することを特徴とする方法。 - 請求項1記載の方法であって、
前記複数の連続する信号セクションの各信号セクションについて計算される前記エネルギーコンテンツを利用したヒストグラム法、バックグラウンドレベル及び前記デジタル音声信号のノイズレベルと有効信号レベルとの間の比に少なくとも部分的に基づき、前記デジタル音声信号から連続的に前記エネルギー閾値を決定するステップをさらに有することを特徴とする方法。 - 請求項1記載の方法であって、
前記複数の連続する信号セクションの各信号セクションの期間は、2〜10ミリ秒であることを特徴とする方法。 - 請求項1記載の方法であって、
前記複数の連続する信号セクションの各信号セクションの期間は、5ミリ秒であることを特徴とする方法。 - 請求項1記載の方法であって、
前記第1の数が9以上であって、前記第2の数が3〜7であって、前記第3の数が30以上であるとき、前記少なくとも1つの高エネルギー信号セクションは前記少なくとも1つのノイズ信号を表すと判断されることを特徴とする方法。 - 請求項1記載の方法であって、
少なくとも1つのさらなる高エネルギー信号セクションが、前記エネルギー閾値より低いエネルギーコンテンツを有する前記少なくとも1つの後続する信号セクションに後続するか判断するステップをさらに有し、
前記第2の数の計数は、前記少なくとも1つの高エネルギー信号セクションと前記少なくとも1つのさらなる高エネルギー信号セクションとを計数することを含む、
ことを特徴とする方法。 - デジタル音声信号におけるノイズ信号を検出する装置であって、
前記デジタル音声信号を複数の信号セクションに分割するよう構成される分割回路と、
前記複数の信号セクションのエネルギーコンテンツを決定するよう構成される決定回路と、
エネルギー閾値に関して前記複数の信号セクションの各信号セクションのエネルギーコンテンツを評価するよう構成される評価回路と、
前記複数の信号セクションから、前記エネルギー閾値より高いエネルギーコンテンツを有する少なくとも1つの高エネルギー信号セクションと、前記少なくとも1つの高エネルギー信号セクションに先行し、前記エネルギー閾値より低いエネルギーコンテンツを有する少なくとも1つの先行する信号セクションと、前記少なくとも1つの高エネルギー信号セクションに後続し、前記エネルギー閾値より低いエネルギーコンテンツを有する少なくとも1つの後続する信号セクションとの出現を検出するよう構成される検出回路と、
先行する信号セクションの第1の数、高エネルギー信号セクションの第2の数、及び後続する信号セクションの第3の数を計数する計数回路と、
を有し、
前記第1の数、第2の数及び第3の数に基づき、前記少なくとも1つの高エネルギー信号セクションが前記少なくとも1つのノイズ信号を表すか判断されることを特徴とする装置。 - 請求項8記載の装置であって、
前記デジタル音声信号より少ないノイズを有する出力音声信号を供給するよう構成される供給回路をさらに有することを特徴とする装置。 - デジタル音声信号を複数の信号セクションに分割するステップと、
前記複数の信号セクションの各信号セクションについて決定されたエネルギーコンテンツとエネルギー閾値とを比較するステップと、
前記複数の信号セクションから、前記エネルギー閾値より高いエネルギーコンテンツを有する少なくとも1つの高エネルギー信号セクションであって、前記エネルギー閾値より低いエネルギーコンテンツを有する少なくとも1つの先行する信号セクションと、前記エネルギー閾値より低いエネルギーコンテンツを有する少なくとも1つの後続する信号セクションとを有する高エネルギー信号セクションを検出するステップと、
前記少なくとも1つの先行する信号セクションの第1の数、前記少なくとも1つの高エネルギー信号セクションの第2の数、及び前記少なくとも1つの後続する信号セクションの第3の数を計数するステップと、
前記第1の数、第2の数及び第3の数に基づき、前記少なくとも1つの高エネルギー信号セクションが前記少なくとも1つのノイズ信号を表すか判断するステップと、
をコンピュータに実行させるためのプログラムを記録したコンピュータ可読記憶媒体。 - 請求項10記載のコンピュータ可読記憶媒体であって、
前記プログラムは、前記複数の信号セクションの各信号セクションについて計算される前記エネルギーコンテンツを利用したヒストグラム法、バックグラウンドレベル及び前記デジタル音声信号のノイズレベルと有効信号レベルとの間の比に少なくとも部分的に基づき、前記デジタル音声信号から連続的に前記エネルギー閾値を決定するステップを前記コンピュータにさらに実行させることを特徴とするコンピュータ可読記憶媒体。 - 請求項10記載のコンピュータ可読記憶媒体であって、
前記複数の信号セクションの各信号セクションの期間は、2〜10ミリ秒であることを特徴とするコンピュータ可読記憶媒体。 - 請求項10記載のコンピュータ可読記憶媒体であって、
前記複数の信号セクションの各信号セクションの期間は、5ミリ秒であることを特徴とするコンピュータ可読記憶媒体。 - 請求項10記載のコンピュータ可読記憶媒体であって、
前記第1の数が9以上であって、前記第2の数が3〜7であって、前記第3の数が30以上であるとき、前記少なくとも1つの高エネルギー信号セクションは前記少なくとも1つのノイズ信号を表すと判断されることを特徴とするコンピュータ可読記憶媒体。 - 請求項10記載のコンピュータ可読記憶媒体であって、
前記プログラムは、少なくとも1つのさらなる高エネルギー信号セクションが、前記エネルギー閾値より低いエネルギーコンテンツを有する前記少なくとも1つの後続する信号セクションに後続するか判断するステップをさらに有し、
前記第2の数の計数は、前記少なくとも1つの高エネルギー信号セクションと前記少なくとも1つのさらなる高エネルギー信号セクションとを計数することを含む、
ことを特徴とするコンピュータ可読記憶媒体。 - 請求項8記載の装置であって、
前記分割回路、前記決定回路、前記評価回路、前記検出回路及び前記計数回路の1以上は、少なくとも1つのプログラムされたプロセッサにより実現されることを特徴とする装置。 - 請求項9記載の装置であって、
前記供給回路は、少なくとも1つのプログラムされたプロセッサにより実現されることを特徴とする装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/IB2003/003356 WO2005017878A1 (en) | 2003-08-18 | 2003-08-18 | Clicking noise detection in a digital audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007516450A JP2007516450A (ja) | 2007-06-21 |
JP4739023B2 true JP4739023B2 (ja) | 2011-08-03 |
Family
ID=34179247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005507732A Expired - Fee Related JP4739023B2 (ja) | 2003-08-18 | 2003-08-18 | デジタル音声信号におけるクリッキングノイズ検出 |
Country Status (8)
Country | Link |
---|---|
US (1) | US7729906B2 (ja) |
EP (1) | EP1661125B1 (ja) |
JP (1) | JP4739023B2 (ja) |
CN (1) | CN100559470C (ja) |
AT (1) | ATE369602T1 (ja) |
AU (1) | AU2003249441A1 (ja) |
DE (1) | DE60315522T2 (ja) |
WO (1) | WO2005017878A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100677126B1 (ko) * | 2004-07-27 | 2007-02-02 | 삼성전자주식회사 | 레코더 기기의 잡음 제거 장치 및 그 방법 |
DE502006004136D1 (de) * | 2005-04-28 | 2009-08-13 | Siemens Ag | Verfahren und vorrichtung zur geräuschunterdrückung |
US8149227B2 (en) * | 2008-04-03 | 2012-04-03 | Livescribe, Inc. | Removing click and friction noise in a writing device |
US8213635B2 (en) * | 2008-12-05 | 2012-07-03 | Microsoft Corporation | Keystroke sound suppression |
GB2474076B (en) | 2009-10-05 | 2014-03-26 | Sonnox Ltd | Audio repair methods and apparatus |
CN110868266B (zh) * | 2019-10-31 | 2022-01-28 | 维沃移动通信有限公司 | 一种电子设备及信息处理方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06311121A (ja) * | 1993-03-19 | 1994-11-04 | Philips Electron Nv | 音声信号内のパルス状妨害信号の検出方法および装置 |
WO1998041978A1 (fr) * | 1997-03-19 | 1998-09-24 | Hitachi, Ltd. | Procede et dispositif destines a detecter des points de depart et de terminaison d'une section son dans une sequence video |
US6032048A (en) * | 1997-03-17 | 2000-02-29 | Ericsson Inc. | Method and apparatus for compensating for click noise in an FM receiver |
JP2002006890A (ja) * | 2000-06-23 | 2002-01-11 | Uniden Corp | 音声信号品質改善装置 |
JP2002006891A (ja) * | 2000-06-23 | 2002-01-11 | Uniden Corp | 音声信号品質改善装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5728409A (en) * | 1980-07-28 | 1982-02-16 | Sony Corp | Muting circuit |
JP4040125B2 (ja) * | 1996-09-18 | 2008-01-30 | ソニー株式会社 | 音声信号記録装置 |
-
2003
- 2003-08-18 JP JP2005507732A patent/JP4739023B2/ja not_active Expired - Fee Related
- 2003-08-18 AT AT03818092T patent/ATE369602T1/de not_active IP Right Cessation
- 2003-08-18 US US10/568,641 patent/US7729906B2/en active Active
- 2003-08-18 AU AU2003249441A patent/AU2003249441A1/en not_active Abandoned
- 2003-08-18 WO PCT/IB2003/003356 patent/WO2005017878A1/en active IP Right Grant
- 2003-08-18 CN CNB038271761A patent/CN100559470C/zh not_active Expired - Lifetime
- 2003-08-18 DE DE60315522T patent/DE60315522T2/de not_active Expired - Lifetime
- 2003-08-18 EP EP03818092A patent/EP1661125B1/en not_active Expired - Lifetime
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06311121A (ja) * | 1993-03-19 | 1994-11-04 | Philips Electron Nv | 音声信号内のパルス状妨害信号の検出方法および装置 |
US6032048A (en) * | 1997-03-17 | 2000-02-29 | Ericsson Inc. | Method and apparatus for compensating for click noise in an FM receiver |
WO1998041978A1 (fr) * | 1997-03-19 | 1998-09-24 | Hitachi, Ltd. | Procede et dispositif destines a detecter des points de depart et de terminaison d'une section son dans une sequence video |
JP2002006890A (ja) * | 2000-06-23 | 2002-01-11 | Uniden Corp | 音声信号品質改善装置 |
JP2002006891A (ja) * | 2000-06-23 | 2002-01-11 | Uniden Corp | 音声信号品質改善装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2007516450A (ja) | 2007-06-21 |
US7729906B2 (en) | 2010-06-01 |
CN100559470C (zh) | 2009-11-11 |
DE60315522T2 (de) | 2008-04-30 |
US20060287857A1 (en) | 2006-12-21 |
AU2003249441A1 (en) | 2005-03-07 |
DE60315522D1 (de) | 2007-09-20 |
EP1661125A1 (en) | 2006-05-31 |
ATE369602T1 (de) | 2007-08-15 |
EP1661125B1 (en) | 2007-08-08 |
WO2005017878A1 (en) | 2005-02-24 |
CN1860528A (zh) | 2006-11-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0077194B1 (en) | Speech recognition system | |
US7756707B2 (en) | Signal processing apparatus and method | |
US7133826B2 (en) | Method and apparatus using spectral addition for speaker recognition | |
US8971549B2 (en) | Audio signal processing apparatus, audio signal processing method, and program | |
US7359856B2 (en) | Speech detection system in an audio signal in noisy surrounding | |
JP2008508564A (ja) | スピーチエンドポインタ | |
JP3105465B2 (ja) | 音声区間検出方法 | |
CN105706167A (zh) | 有语音的话音检测方法和装置 | |
JP4739023B2 (ja) | デジタル音声信号におけるクリッキングノイズ検出 | |
US6757651B2 (en) | Speech detection system and method | |
JP7490199B2 (ja) | 学習済みオートエンコーダ、学習済みオートエンコーダの生成方法、非定常振動の検出方法、非定常振動の検出装置、並びにコンピュータプログラム | |
US6704671B1 (en) | System and method of identifying the onset of a sonic event | |
JP5815435B2 (ja) | 音源位置判定装置、音源位置判定方法、プログラム | |
US20220165289A1 (en) | Methods and systems for processing recorded audio content to enhance speech | |
JP5961530B2 (ja) | 音響モデル生成装置とその方法とプログラム | |
CN115731943A (zh) | 一种爆音检测方法、爆音检测系统、存储介质和电子设备 | |
JP5852550B2 (ja) | 音響モデル生成装置とその方法とプログラム | |
JP5166195B2 (ja) | 音響分析パラメータ生成方法とその装置と、プログラムと記録媒体 | |
KR20200026587A (ko) | 음성 구간을 검출하는 방법 및 장치 | |
JP4242320B2 (ja) | 音声認識方法、その装置およびプログラム、その記録媒体 | |
US20230269546A1 (en) | Method for eliminating acoustic reverberation in an audio signal, and hearing instrument | |
JP2666296B2 (ja) | 音声認識装置 | |
JP2019184867A (ja) | 符号化音判定プログラム、符号化音判定方法、及び符号化音判定装置 | |
Tuononen et al. | Automatic voice activity detection in different speech applications | |
CN116825142A (zh) | 自适应参数投票机制的语音端点检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060816 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20090715 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100308 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100308 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110329 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110427 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4739023 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140513 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |