JP6061476B2 - 音声処理装置 - Google Patents
音声処理装置 Download PDFInfo
- Publication number
- JP6061476B2 JP6061476B2 JP2012046791A JP2012046791A JP6061476B2 JP 6061476 B2 JP6061476 B2 JP 6061476B2 JP 2012046791 A JP2012046791 A JP 2012046791A JP 2012046791 A JP2012046791 A JP 2012046791A JP 6061476 B2 JP6061476 B2 JP 6061476B2
- Authority
- JP
- Japan
- Prior art keywords
- noise
- signal
- section
- voice
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 claims description 94
- 238000000034 method Methods 0.000 claims description 66
- 230000003287 optical effect Effects 0.000 claims description 28
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000003384 imaging method Methods 0.000 description 67
- 230000008569 process Effects 0.000 description 49
- 238000001514 detection method Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 14
- 230000009467 reduction Effects 0.000 description 14
- 238000004590 computer program Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000011946 reduction process Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000011109 contamination Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- G—PHYSICS
- G03—PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
- G03B—APPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
- G03B31/00—Associated working of cameras or projectors with sound-recording or sound-reproducing means
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0224—Processing in the time domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0356—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for synchronising with other signals, e.g. video signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Studio Devices (AREA)
- Camera Bodies And Camera Details Or Accessories (AREA)
Description
図2は、本実施例の撮像装置1および撮像レンズ2の機能ブロックを示す図である。
図2において、撮像装置1は、焦点検出部12、露出検出部13、撮像素子6、A/D変換部20、画像処理部21、記録処理部23、メモリ24、カメラシステム制御部25、マイク7、音声処理部26、操作部27、表示部22を有する。一方、撮像レンズ2は、撮像光学系3、レンズシステム制御部28、焦点レンズ駆動部9a、ブレ補正駆動部9b、絞り駆動部9cを有する。
本実施例の予測処理44aについては、後述する。
まず、音声処理部26が実行する予測処理について説明する。
予測処理は、例えば、「ITU−T Recommendation G.711−Appendix I」に開示されている信号処理技術を用いている。この技術では、雑音の含まれる区間(雑音発生区間)の信号の近傍の所定区間(参照区間)の信号に基づいて、演算処理により雑音発生区間と置換するための信号を生成する。これにより、雑音やパケットのロスが起きた区間の信号を補間することができる。この演算処理は、例えば、参照区間の信号のピッチ検出を行い、検出されたピッチで参照区間の信号を繰り返した信号を生成してもよい。すなわち、予測処理とは、雑音発生区間の信号をその近傍の所定区間の信号に基づいて生成された信号により置換することで、雑音発生区間の雑音を低減させた信号を取得する処理である。
図9において51は雑音の混入の無い信号区間を、52a,52bは雑音発生区間を示す。また、63は52aを予測処理するために用いる参照区間を、54aは52aの予測処理後の信号を示している。また、65は52bを予測処理するために用いる参照区間を、54bは52bの予測処理後の信号を示している。
図9の信号は図8と同じく雑音52a,52bが時間的に近接して発生した例である。
一方、雑音区間52bを処理する際には、同様にして参照区間65から信号54bを生成する。
図10(a)は処理前の波形を示す。
図10(b)は時間的に前方にある雑音を処理した後の波形を示す。
図10(c)は時間的に後方にある雑音を処理した後の波形を示す。
このような処理を繰り返し実行することにより、本実施例の撮像装置1は、雑音を低減しているのである。
図13(a)は処理前の波形を示す。
図13(b)は時間的に前方にある雑音を処理した後の波形を示す。
図13(c)は時間的に後方にある雑音を処理した後の波形を示す。
このような処理によって、さらに雑音低減後の音声信号の音質を向上させることができる。
図15(a)は処理前の波形を示す。
図15(b)は時間的に前方にある雑音を処理した後の波形を示す。
図15(c)は時間的に後方にある雑音を処理した後の波形を示す。
図15(d)は時間的に前方にある雑音を再度処理した後の波形を示す。
図15(e)は1回目の時間的に前方にある雑音を処理による信号の変化(図15(a)と図15(b)の波形の差)を示す。
上述の実施形態は、システム或は装置のコンピュータ(或いはCPU、MPU等)によりソフトウェア的に実現することも可能である。従って、上述の実施形態をコンピュータで実現するために、該コンピュータに供給されるコンピュータプログラム自体も本発明を実現するものである。つまり、上述の実施形態の機能を実現するためのコンピュータプログラム自体も本発明の一つである。
Claims (7)
- 音声信号を取得する取得手段と、
前記取得手段により取得された前記音声信号のうち雑音の含まれる雑音区間の前方の所定区間及び後方の所定区間の音声信号を用いて補間用の信号を生成し、前記補間用の信号によって前記雑音区間の音声信号を補間することにより前記音声信号に含まれる雑音を低減する音声処理手段とを有し、
前記音声処理手段は、前記取得手段により取得された前記音声信号のうち前記雑音区間の前方の所定区間と後方の所定区間のいずれか一方の区間に雑音が含まれ、他方の区間に雑音が含まれていない場合は、前記他方の区間の音声信号を用い、前記一方の区間の音声信号を用いることなく前記補間用の信号を生成することを特徴とする音声処理装置。 - 音声信号を取得する取得手段と、
前記取得手段により取得された前記音声信号のうち雑音の含まれる雑音区間の前方の第1の所定区間及び後方の第2の所定区間の音声信号を用いて補間用の信号を生成し、前記補間用の信号によって前記雑音区間の音声信号を補間することにより前記音声信号に含まれる雑音を低減する音声処理手段とを有し、
前記音声処理手段は、前記第1の所定区間に雑音が含まれ、前記第2の所定区間に雑音が含まれない場合、前記第2の所定区間の音声信号を用い、前記第1の所定区間の音声信号を用いることなく前記補間用の信号を生成し、前記第2の所定区間に雑音が含まれ、前記第1の所定区間に雑音が含まれない場合、前記第1の所定区間の音声信号を用い、前記第2の所定区間の音声信号を用いることなく前記補間用の信号を生成することを特徴とする音声処理装置。 - 前記取得手段により取得された前記音声信号のうち前記雑音区間を判定する判定手段を有することを特徴とする請求項1または2に記載の音声処理装置。
- 被写体の光学像を取得して光電変換素子に入力する光学手段と、
前記光学手段の駆動を制御する制御手段とを有し、
前記判定手段は、前記制御手段により前記光学手段を駆動する指示に基づいて、前記雑音区間を判定することを特徴とする請求項3に記載の音声処理装置。 - 音声信号を取得する取得手段を有する音声処理装置を制御する方法であって、
前記取得手段により取得された前記音声信号のうち雑音の含まれる雑音区間の前方の所定区間および後方の所定区間の音声信号を用いて補間用の信号を生成し、前記補間用の信号によって前記雑音区間の音声信号を補間することにより、前記音声信号に含まれる雑音を低減する音声処理ステップを有し、
前記音声処理ステップは、前記取得手段により取得された前記音声信号のうち前記雑音区間の前方の所定区間と後方の所定区間のいずれか一方の区間に雑音が含まれ、他方の区間に雑音が含まれていない場合は、前記他方の区間の音声信号を用い、前記一方の区間の音声信号を用いること無く前記補間用の信号を生成することを特徴とする音声処理装置の制御方法。 - 音声信号を取得する取得手段を有する音声処理装置を制御する方法であって、
前記取得手段により取得された前記音声信号のうち雑音の含まれる雑音区間の前方の第1の所定区間および後方の第2の所定区間の音声信号を用いて補間用の信号を生成し、前記補間用の信号によって前記雑音区間の音声信号を補間することにより、前記音声信号に含まれる雑音を低減する音声処理ステップを有し、
前記音声処理ステップは、前記第1の所定区間に雑音が含まれ、前記第2の所定区間に雑音が含まれない場合、前記第2の所定区間の音声信号を用い、前記第1の所定区間の音声信号を用いることなく前記補間用の信号を生成し、前記第2の所定区間に雑音が含まれ、前記第1の所定区間に雑音が含まれない場合、前記第1の所定区間の音声信号を用い、前記第2の所定区間の音声信号を用いることなく前記補間用の信号を生成することを特徴とする音声処理装置の制御方法。 - コンピュータを請求項1から4のいずれか1項に記載の各手段として動作させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012046791A JP6061476B2 (ja) | 2012-03-02 | 2012-03-02 | 音声処理装置 |
US13/779,605 US9275624B2 (en) | 2012-03-02 | 2013-02-27 | Audio processing apparatus |
CN201310067156.7A CN103297687B (zh) | 2012-03-02 | 2013-03-04 | 音频处理设备及其控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012046791A JP6061476B2 (ja) | 2012-03-02 | 2012-03-02 | 音声処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013182185A JP2013182185A (ja) | 2013-09-12 |
JP6061476B2 true JP6061476B2 (ja) | 2017-01-18 |
Family
ID=49042855
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012046791A Active JP6061476B2 (ja) | 2012-03-02 | 2012-03-02 | 音声処理装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9275624B2 (ja) |
JP (1) | JP6061476B2 (ja) |
CN (1) | CN103297687B (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012203040A (ja) * | 2011-03-23 | 2012-10-22 | Canon Inc | 音声信号処理装置、及びその制御方法 |
US9667857B2 (en) * | 2014-10-09 | 2017-05-30 | Panasonic Intellectual Property Management Co., Ltd. | Imaging apparatus with adjustable noise level reduction |
JP2021115429A (ja) * | 2020-01-27 | 2021-08-10 | 国立大学法人大阪大学 | 信号計測システム、計測信号処理装置及びプログラム |
JP7566552B2 (ja) | 2020-09-25 | 2024-10-15 | キヤノン株式会社 | 音声処理装置、制御方法、およびプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3596978B2 (ja) * | 1996-05-14 | 2004-12-02 | 株式会社ルネサステクノロジ | 音声再生装置 |
JP4466384B2 (ja) | 2005-01-19 | 2010-05-26 | カシオ計算機株式会社 | 電子カメラ、ノイズ低減装置及びノイズ低減方法 |
US7596231B2 (en) * | 2005-05-23 | 2009-09-29 | Hewlett-Packard Development Company, L.P. | Reducing noise in an audio signal |
JP2008053802A (ja) | 2006-08-22 | 2008-03-06 | Sony Corp | 記録装置、ノイズ除去方法、ノイズ除去装置 |
JP5351644B2 (ja) | 2009-07-27 | 2013-11-27 | キヤノン株式会社 | 音声記録装置及び方法、ならびに撮像装置 |
JP5538918B2 (ja) * | 2010-01-19 | 2014-07-02 | キヤノン株式会社 | 音声信号処理装置、音声信号処理システム |
JP5529635B2 (ja) * | 2010-06-10 | 2014-06-25 | キヤノン株式会社 | 音声信号処理装置および音声信号処理方法 |
-
2012
- 2012-03-02 JP JP2012046791A patent/JP6061476B2/ja active Active
-
2013
- 2013-02-27 US US13/779,605 patent/US9275624B2/en active Active
- 2013-03-04 CN CN201310067156.7A patent/CN103297687B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN103297687A (zh) | 2013-09-11 |
CN103297687B (zh) | 2016-10-05 |
US20130230189A1 (en) | 2013-09-05 |
US9275624B2 (en) | 2016-03-01 |
JP2013182185A (ja) | 2013-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5594133B2 (ja) | 音声信号処理装置、音声信号処理方法及びプログラム | |
JP5529635B2 (ja) | 音声信号処理装置および音声信号処理方法 | |
JP5351644B2 (ja) | 音声記録装置及び方法、ならびに撮像装置 | |
US8698911B2 (en) | Sound recording device, imaging device, photographing device, optical device, and program | |
JP6061476B2 (ja) | 音声処理装置 | |
JP6610725B2 (ja) | 音処理装置および音処理プログラム | |
JP5963430B2 (ja) | 撮像装置、音声処理装置、及びそれらの制御方法 | |
JP5278477B2 (ja) | 信号処理装置、撮像装置、および、信号処理プログラム | |
US9288370B2 (en) | Imaging apparatus and audio processing apparatus | |
JP5932399B2 (ja) | 撮像装置及び音声処理装置 | |
JP5839795B2 (ja) | 撮像装置および情報処理システム | |
JP5158054B2 (ja) | 録音装置、撮像装置、および、プログラム | |
JP6144945B2 (ja) | 信号処理装置及び方法 | |
JP2012185445A (ja) | 信号処理装置、撮像装置、及び、プログラム | |
JP5473786B2 (ja) | 音声信号処理装置、及びその制御方法 | |
JP2012165219A (ja) | 撮像装置 | |
JP5736839B2 (ja) | 信号処理装置、撮像装置、及びプログラム | |
JP2018207316A (ja) | 音声処理装置及びその制御方法 | |
JP6731772B2 (ja) | 電子機器及び制御方法 | |
JP2016054462A (ja) | 電子機器及び制御方法 | |
JP2013178456A (ja) | 信号処理装置、カメラおよび信号処理プログラム | |
JP2016018082A (ja) | 音声処理装置及び方法、並びに撮像装置 | |
JP2017204715A (ja) | 電子機器及び制御方法 | |
JP2016053697A (ja) | 電子機器及び制御方法 | |
JP2013222179A (ja) | 録音ノイズ低減装置および光学機器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150302 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160405 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160602 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161115 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161213 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6061476 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |