JP2011048369A - オーディオデータストリーム中のクリック音の除去 - Google Patents
オーディオデータストリーム中のクリック音の除去 Download PDFInfo
- Publication number
- JP2011048369A JP2011048369A JP2010187051A JP2010187051A JP2011048369A JP 2011048369 A JP2011048369 A JP 2011048369A JP 2010187051 A JP2010187051 A JP 2010187051A JP 2010187051 A JP2010187051 A JP 2010187051A JP 2011048369 A JP2011048369 A JP 2011048369A
- Authority
- JP
- Japan
- Prior art keywords
- click
- data
- value
- instruction
- stored
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000009467 reduction Effects 0.000 title description 2
- 238000000034 method Methods 0.000 claims abstract description 14
- 230000003111 delayed effect Effects 0.000 claims abstract description 12
- 230000004044 response Effects 0.000 claims description 19
- 238000001514 detection method Methods 0.000 claims description 11
- 238000003708 edge detection Methods 0.000 claims description 9
- 230000000630 rising effect Effects 0.000 claims description 5
- 230000008859 change Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012966 insertion method Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/24—Signal processing not specific to the method of recording or reproducing; Circuits therefor for reducing noise
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/22—Signal processing not specific to the method of recording or reproducing; Circuits therefor for reducing distortions
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/34—Muting amplifier when no signal is present or when only weak signals are present, or caused by the presence of noise signals, e.g. squelch systems
- H03G3/345—Muting during a short period of time when noise pulses are detected, i.e. blanking
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
- G11B2020/10537—Audio or video recording
- G11B2020/10546—Audio or video recording specifically adapted for audio data
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
- G11B2020/10537—Audio or video recording
- G11B2020/10546—Audio or video recording specifically adapted for audio data
- G11B2020/10555—Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account
- G11B2020/10583—Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account parameters controlling audio interpolation processes
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/34—Muting amplifier when no signal is present or when only weak signals are present, or caused by the presence of noise signals, e.g. squelch systems
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Complex Calculations (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】本発明の一実施形態によれば、オーディオデータのサンプルは、所定数のサンプルを格納するスライドウィンドウ内で、所定量の遅延を受ける。上記スライドウィンドウ内で遅延後データ中のクリック音の存在が検出されると、対応するオーディオデータが、オーディオデータストリームから得られた代替データによって置き換えられる。
【選択図】図1
Description
データシフトウィンドウのウィンドウサイズ=10ms
α=0.85/ms
γ=2
b=0.85/ms
λ=0.3
タイムアウト=60ms
y(n)=h(n)・p(n)+(1−h(n))・d(n)
ここで、h(n)=(N−n)/Nであり、Nは、10ms間のウィンドウ中のデータ数を表し、p(n)は、拡張ピッチ信号を表し、かつd(n)は、ポップ及びクリックノイズ後の音声データを表す。
2 クリック検出回路
3 信号追加回路
4 マルチプレクサ
5 データシフトウィンドウ
6 Maxユニット
7 1次フィルタ
8 比較部
9 マルチプレクサ
10 ピーク値メモリ
11 Maxユニット
12 カウンタ
13 エッジ検出部
14 平均ピーク値メモリ
15 タイムアウト回路
Claims (13)
- オーディオデータストリーム中のクリック音を減少させる方法であって、
所定数のサンプルを格納するスライドウィンドウ内で、オーディオデータのサンプルを所定量だけ遅延させる段階と、
スライドウィンドウ内の現在のサンプル一式のうちの最大値とスケーリング係数を適用されたサンプルから得られたフィルタ後値と比較することによって、前記スライドウィンドウ内の遅延後データ中のクリック音の存在を検出する段階と、
クリック音に対応する遅延後データ中のオーディオデータを代替データに置き換える段階と
を有し、
前記最大値が前記スケーリング係数を適用されたフィルタ後値よりも小さい場合、ネガティブクリック指示が生成され、かつ格納されたピーク値がゼロに達するまで係数βだけ減らされ、
前記最大値が適切なスケーリング係数を適用されたフィルタ後値及び格納されたピーク値の両方よりも大きい場合、ポジティブクリック指示が生成され、かつ格納されたピーク値が現在の最大値及び現在の格納されたピーク値のうちの大きい方の値に設定され、
カウンタが、ポジティブクリック指示に応答してインクリメントされ、かつネガティブクリック指示に応答してデクリメントされ、
立ち上がりエッジ及び降下エッジに応答するエッジ検出部が、カウンタのインクリメントに応答してクリック開始指示を与え、かつカウンタのデクリメントに応答してクリック終了指示を与えることを特徴とする方法。 - クリック終了指示に応答して、クリック開始時のサンプルの値が、前記フィルタ後値を生成するためにフィルタに入力されることを特徴とする請求項1に記載の方法。
- カウンタが所定値よりも大きいカウントに達した場合、クリック無し指示が生成されることを特徴とする請求項2に記載の方法。
- クリック指示に応答して、クリック指示より前に保存された通常データと固定数のサンプルによって遅延を受けたデータとの相関の最大値が、クリック期間内の時間ウィンドウ内で決定され、
ピッチ期間が、前記時間ウィンドウ内のデータから抽出され、
対応するピッチデータを使用して、代替データを生成することを特徴とする請求項1に記載の方法。 - 延長ピッチ期間に対応するデータが、クリック後のデータでスケーリング及び重み付けされ、挿入されたデータと通常オーディオデータとの間の平滑な切り換えを形成することを特徴とする請求項4に記載の方法。
- オーディオデータストリーム中のクリックを減少させるための装置であって、
スライドウィンドウ中の遅延後の一連のサンプルを格納する遅延ユニットと、
スライドウィンドウ内の現在のサンプル一式のうちの最大値とスケーリング係数を適用されたサンプルから得られたフィルタ後値との比較により、前記格納された一連のサンプル中のクリックを検出するクリック検出部と、
クリックの持続期間分だけ前記オーディオデータストリーム内のサンプルを置き換える代替データを生成するユニットと、
クリックの持続期間の間、前記遅延後のオーディオデータストリームを前記代替データで置き換えるマルチプレクサと
を具備し、
前記クリック検出部は、
スライドウィンドウ上の一連のサンプルを格納するメモリと、
前記サンプルをフィルタリングし、フィルタ後値を生成するフィルタと、
前記格納された一連のサンプルのうちの現在の最大値とスケーリング係数を適用された前記フィルタ後値とを比較し、格納された値の現在の最大値がスケーリング係数を適用されたフィルタ後値よりも小さい場合、ネガティブクリック指示を生成し、かつ格納された値の現在の最大値がスケーリング係数を適用されたフィルタ後値及びスケーリング係数を適用された格納されたピーク値よりも大きい場合、ポジティブクリック指示を生成する比較部と、
ポジティブクリック指示に応答してインクリメントされ、かつネガティブクリック指示に応答してデクリメントされるカウンタと、
立ち上がりエッジ及び降下エッジに応答し、カウンタのインクリメントエッジに応答してクリック開始指示を与え、かつカウンタのデクリメントエッジに応答してクリック終了指示を与えるエッジ検出部と
をさらに具備することを特徴とする装置。 - マルチプレクサが、ネガティブクリック指示が存在する場合、スケーリング係数で前記ピーク値をゼロに達するまで減少させるように構成されることを特徴とする請求項6に記載の装置。
- マルチプレクサが、ポジティブクリック指示が存在する場合、格納されたピーク値を、格納された値の現在の最大値及び現在の格納されたピーク値のうちの大きい方の値に設定するように構成されることを特徴とする請求項7に記載の装置。
- カウンタのカウントが所定の値を超えた場合、エッジ検出部の出力に優先するクリック無し指示を生成するタイムアウトユニットをさらに具備することを特徴とする請求項6に記載の装置。
- クリック直前の履歴通常データとクリックの間に取得されたデータとの相関を取り、前記相関から前記代替データを得る相関部をさらに具備することを特徴とする請求項6に記載の装置。
- 相関データからピッチ期間を抽出するユニットと、
クリックの持続期間のピッチ期間を延長するユニットと、
クリックに続く時間ウィンドウ中のデータで格納されたピッチデータを重み付けするユニットと
をさらに具備することを特徴とする請求項10に記載の装置。 - ピッチデータが、所定の比率で縮小されることを特徴とする請求項11に記載の装置。
- 代替データが、以下の式
y(n)=h(n)・p(n)+(1−h(n))・d(n)
に従って重み付けされ、
ここで、h(n)=(N−n)/Nであり、
Nは、時間ウィンドウ中のデータサンプル数を表し、p(n)は、拡張ピッチデータを表し、かつd(n)は、クリックイベントのオーディオデータを表すことを特徴とする請求項12に記載の装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB0914802.4 | 2009-08-25 | ||
GB0914802A GB2472992A (en) | 2009-08-25 | 2009-08-25 | Reduction of clicking sounds in audio data streams |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011048369A true JP2011048369A (ja) | 2011-03-10 |
JP5091290B2 JP5091290B2 (ja) | 2012-12-05 |
Family
ID=41171862
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010187051A Active JP5091290B2 (ja) | 2009-08-25 | 2010-08-24 | オーディオデータストリーム中のクリック音の除去 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8311229B2 (ja) |
JP (1) | JP5091290B2 (ja) |
GB (1) | GB2472992A (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3093848A1 (en) * | 2015-05-13 | 2016-11-16 | Thomson Licensing | Attenuating method and corresponding device |
WO2020094263A1 (en) | 2018-11-05 | 2020-05-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10162501A (ja) * | 1996-12-03 | 1998-06-19 | Sony Corp | 音声情報伝送方法、音声情報伝送装置および音声記録装置 |
JP2001346147A (ja) * | 2000-05-31 | 2001-12-14 | Fujitsu Ltd | 映像・音声再生装置及び映像・音声再生方法 |
JP2003295899A (ja) * | 2002-03-28 | 2003-10-15 | Fujitsu Ltd | 音声入力装置 |
JP2009122596A (ja) * | 2007-11-19 | 2009-06-04 | Nec Corp | 雑音消去装置、雑音消去方法および雑音消去プログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4076969A (en) * | 1975-04-07 | 1978-02-28 | Singer & Singer | Impulse noise reduction system |
DE3028334C2 (de) * | 1980-07-25 | 1983-01-05 | Polygram Gmbh, 2000 Hamburg | Verfahren zum Beseitigen oder Unterdrücken von akustischen Störsignalen bei für den Wiedergabevorgang aufzubereitenden Audioprogrammen |
JPS6035838A (ja) * | 1983-08-08 | 1985-02-23 | Victor Co Of Japan Ltd | パルス性雑音の低減装置 |
TW237587B (ja) * | 1993-03-19 | 1995-01-01 | Philips Electronics Nv | |
DE19736517A1 (de) * | 1997-08-22 | 1999-02-25 | Alsthom Cge Alcatel | Verfahren zur Reduzierung von Störungen bei der Übertragung eines elektrischen Nachrichtensignals |
JP3675179B2 (ja) * | 1998-07-17 | 2005-07-27 | 三菱電機株式会社 | オーディオ信号の雑音除去装置 |
-
2009
- 2009-08-25 GB GB0914802A patent/GB2472992A/en not_active Withdrawn
-
2010
- 2010-08-17 US US12/858,045 patent/US8311229B2/en active Active
- 2010-08-24 JP JP2010187051A patent/JP5091290B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10162501A (ja) * | 1996-12-03 | 1998-06-19 | Sony Corp | 音声情報伝送方法、音声情報伝送装置および音声記録装置 |
JP2001346147A (ja) * | 2000-05-31 | 2001-12-14 | Fujitsu Ltd | 映像・音声再生装置及び映像・音声再生方法 |
JP2003295899A (ja) * | 2002-03-28 | 2003-10-15 | Fujitsu Ltd | 音声入力装置 |
JP2009122596A (ja) * | 2007-11-19 | 2009-06-04 | Nec Corp | 雑音消去装置、雑音消去方法および雑音消去プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5091290B2 (ja) | 2012-12-05 |
US20110051945A1 (en) | 2011-03-03 |
US8311229B2 (en) | 2012-11-13 |
GB0914802D0 (en) | 2009-09-30 |
GB2472992A (en) | 2011-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7672840B2 (en) | Voice speed control apparatus | |
EP2868073B1 (en) | Echo control through hidden audio signals | |
TWI518676B (zh) | 低複雜度聽覺事件邊界檢測技術 | |
EP1986419A1 (en) | Scene change detection device, coding device, and scene change detection method | |
JP2006189907A (ja) | 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ | |
JP5490704B2 (ja) | ハウリング抑圧装置、ハウリング抑圧方法、プログラム、及び集積回路 | |
JP6174856B2 (ja) | 雑音抑制装置、その制御方法、及びプログラム | |
EP2656341A1 (en) | A method and an apparatus for performing a voice activity detection | |
KR100806155B1 (ko) | 오디오 속도 변환을 가능하게 하는 방법 및 시스템 | |
JP5091290B2 (ja) | オーディオデータストリーム中のクリック音の除去 | |
CN110858487A (zh) | 一种音频信号缩放处理方法及装置 | |
US9734840B2 (en) | Signal processing device, imaging apparatus, and signal-processing program | |
JP2010019901A (ja) | ディジタル音響信号処理方法及び処理装置 | |
CN116189700A (zh) | 一种通信系统啸叫检测方法和装置 | |
CN111477246A (zh) | 语音处理方法、装置及智能终端 | |
JP2007072005A (ja) | 非定常雑音判別方法、その装置、そのプログラム及びその記録媒体 | |
US5388221A (en) | Adaptive digital audio interpolation system | |
US8214066B1 (en) | System and method for controlling noise in real-time audio signals | |
CN113470680B (zh) | 声音信号处理系统及方法 | |
JP6381367B2 (ja) | 音声処理装置、音声処理方法、及び、プログラム | |
JP5418204B2 (ja) | 背景雑音レベル推定装置、方法及びプログラム | |
JP5346230B2 (ja) | 話速変換装置 | |
JP2014232267A (ja) | 信号処理装置、撮像装置、およびプログラム | |
JP2004239930A (ja) | パケット損失補償におけるピッチ検出方法と装置 | |
JP4593217B2 (ja) | リミッタ・コンプレッサ装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110523 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120809 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120814 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120913 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150921 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5091290 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150921 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |