JP5489778B2 - 情報処理装置およびその処理方法 - Google Patents
情報処理装置およびその処理方法 Download PDFInfo
- Publication number
- JP5489778B2 JP5489778B2 JP2010040598A JP2010040598A JP5489778B2 JP 5489778 B2 JP5489778 B2 JP 5489778B2 JP 2010040598 A JP2010040598 A JP 2010040598A JP 2010040598 A JP2010040598 A JP 2010040598A JP 5489778 B2 JP5489778 B2 JP 5489778B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- voice
- mask information
- frequency
- frequency band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000010365 information processing Effects 0.000 title claims description 98
- 238000003672 processing method Methods 0.000 title claims 8
- 238000001228 spectrum Methods 0.000 claims description 16
- 238000004458 analytical method Methods 0.000 claims description 10
- 230000003595 spectral effect Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims 2
- 238000000034 method Methods 0.000 description 104
- 230000005540 biological transmission Effects 0.000 description 65
- 238000012545 processing Methods 0.000 description 41
- 230000000873 masking effect Effects 0.000 description 33
- 238000001514 detection method Methods 0.000 description 31
- 238000010586 diagram Methods 0.000 description 25
- 230000010354 integration Effects 0.000 description 21
- 238000009434 installation Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 10
- 230000002238 attenuated effect Effects 0.000 description 8
- 238000012544 monitoring process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000035945 sensitivity Effects 0.000 description 3
- 206010011469 Crying Diseases 0.000 description 2
- 206010039740 Screaming Diseases 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02087—Noise filtering the noise being separate speech, e.g. cocktail party
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Telephonic Communication Services (AREA)
Description
図1(a)は、本発明に係る情報処理システムの一例を模式的に示す図である。
H(t) = αM(t)+βM(t−1)+γM(t−2)
尚、H(t)は、注目する時点tの音をマスクする処理に使用するマスク情報であり、M(t)、M(t−1)、M(t−2)は、時点t、t−1、t−2において収録された音に対応するマスク情報とする。また、α+β+γ=1とする。
第1の実施形態では、各収録装置が情報処理装置を有し、収録した音をマスクする処理を実行していたが、本発明はこれに限るものではない。本実施形態においては、異なる位置に設置された複数のマイクロフォンが収録した音データがストレージサーバ等に保存されている場合に、他マイクロフォンが収録した音データから生成したマスク情報を使ってマスクする処理を行う。
本実施形態は、第1の実施形態に加え、音声区間の特徴に応じてマスクする処理を実行するか否かを判別する。また、収録装置の設置位置や方向や音量に基づいて、マスク情報を送信する収録装置を選択する。また、収録装置間の距離に応じてマスク情報を修正する特徴を有する。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (14)
- 第1の収録装置から収録された第1の音と、前記第1の収録装置と異なる第2の収録装置から収録され、かつ、前記第1の音と同じ音源の音を含む第2の音とを取得する取得手段と、
前記第1の音を周波数分析して、声を示す周波数帯域を決定する決定手段と、
前記第2の音を示す周波数成分のうち、前記周波数帯域の周波数成分を変更する変更手段と、
前記周波数帯域の周波数成分が変更された前記第2の音を出力する出力手段とを有する情報処理装置。 - 前記変更手段は、前記第2の音を示す周波数成分のうち、前記周波数帯域の周波数成分を減衰させること特徴とする請求項1に記載の情報処理装置。
- 前記決定手段は、前記第1の音を周波数分析して得たスペクトル包絡のホルマントに基づく周波数帯域を、声を示す周波数帯域として決定することを特徴とする請求項1または請求項2に記載の情報処理装置。
- 前記決定手段は、前記第1の音を周波数分析して得たスペクトル包絡のホルマントのピークを含む周波数帯域を、声を示す周波数帯域として決定することを特徴とする請求項3に記載の情報処理装置。
- 前記第2の音は、前記第1の音が収録された時間に対応する時間に収録された音であることを特徴とする請求項1乃至請求項4のいずれか1項に記載の情報処理装置。
- 前記第1の音が収録された時間に対応する時間とは、前記第1の音が収録された時間とおなじ時間であることを特徴とする請求項5に記載の情報処理装置。
- 音の周波数成分を変更する情報処理装置の処理方法であって、
取得手段が、第1の収録装置から収録された第1の音と、前記第1の収録装置と異なる第2の収録装置から収録され、かつ、前記第1の音と同じ音源の音を含む第2の音とを取得する取得工程と、
決定手段が、前記第1の音を周波数分析して、声を示す周波数帯域を決定する決定工程と、
変更手段が、前記第2の音を示す周波数成分のうち、前記周波数帯域の周波数成分を変更する変更工程と、
出力手段が、前記周波数帯域の周波数成分が変更された前記第2の音を出力する出力工程とを有する処理方法。 - 前記変更工程は、前記第2の音を示す周波数成分のうち、前記周波数帯域の周波数成分を減衰させること特徴とする請求項7に記載の処理方法。
- 前記決定工程は、前記第1の音を周波数分析して得たスペクトル包絡のホルマントに基づく周波数帯域を、声を示す周波数帯域として決定することを特徴とする請求項7または請求項8に記載の処理方法。
- 前記決定工程は、前記第1の音を周波数分析して得たスペクトル包絡のホルマントのピークを含む周波数帯域を、声を示す周波数帯域として決定することを特徴とする請求項9に記載の処理方法。
- 前記第2の音は、前記第1の音が収録された時間に対応する時間に収録された音であることを特徴とする請求項7乃至請求項10のいずれか1項に記載の処理方法。
- 前記第1の音が収録された時間に対応する時間とは、前記第1の音が収録された時間とおなじ時間であることを特徴とする請求項11に記載の処理方法。
- コンピュータを、請求項1乃至5の何れか1項に記載の情報処理装置が有する各手段として機能させるためのコンピュータプログラム。
- 請求項13に記載のコンピュータプログラムを格納した、コンピュータ読み取り可能な記憶媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010040598A JP5489778B2 (ja) | 2010-02-25 | 2010-02-25 | 情報処理装置およびその処理方法 |
US13/033,438 US8635064B2 (en) | 2010-02-25 | 2011-02-23 | Information processing apparatus and operation method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010040598A JP5489778B2 (ja) | 2010-02-25 | 2010-02-25 | 情報処理装置およびその処理方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2011175182A JP2011175182A (ja) | 2011-09-08 |
JP2011175182A5 JP2011175182A5 (ja) | 2013-04-04 |
JP5489778B2 true JP5489778B2 (ja) | 2014-05-14 |
Family
ID=44477243
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010040598A Expired - Fee Related JP5489778B2 (ja) | 2010-02-25 | 2010-02-25 | 情報処理装置およびその処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8635064B2 (ja) |
JP (1) | JP5489778B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013247456A (ja) * | 2012-05-24 | 2013-12-09 | Toshiba Corp | 音響処理装置、音響処理方法、音響処理プログラムおよび音響処理システム |
CN105049807B (zh) | 2015-07-31 | 2018-05-18 | 小米科技有限责任公司 | 监控画面声音采集方法及装置 |
CN106128448A (zh) * | 2016-08-30 | 2016-11-16 | 金嵩 | 一种新型球场用声音收集器 |
JP2020170467A (ja) * | 2019-04-05 | 2020-10-15 | 株式会社Preferred Networks | 情報処理システム、ロボット、遠隔操作装置、情報処理方法及びプログラム |
CN111028858B (zh) * | 2019-12-31 | 2022-02-18 | 云知声智能科技股份有限公司 | 一种人声起止时间检测方法及装置 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2408500A (en) * | 1999-01-07 | 2000-07-24 | Tellabs Operations, Inc. | Method and apparatus for adaptively suppressing noise |
US8254617B2 (en) * | 2003-03-27 | 2012-08-28 | Aliphcom, Inc. | Microphone array with rear venting |
JP2002152397A (ja) * | 2000-11-10 | 2002-05-24 | Honda Motor Co Ltd | 通話装置 |
JP2002251199A (ja) * | 2001-02-27 | 2002-09-06 | Ricoh Co Ltd | 音声入力情報処理装置 |
US7099821B2 (en) * | 2003-09-12 | 2006-08-29 | Softmax, Inc. | Separation of target acoustic signals in a multi-transducer arrangement |
JP4761506B2 (ja) * | 2005-03-01 | 2011-08-31 | 国立大学法人北陸先端科学技術大学院大学 | 音声処理方法と装置及びプログラム並びに音声システム |
JP4734627B2 (ja) * | 2005-03-22 | 2011-07-27 | 国立大学法人山口大学 | スピーチプライバシー保護装置 |
US7464029B2 (en) * | 2005-07-22 | 2008-12-09 | Qualcomm Incorporated | Robust separation of speech signals in a noisy environment |
US8194880B2 (en) * | 2006-01-30 | 2012-06-05 | Audience, Inc. | System and method for utilizing omni-directional microphones for speech enhancement |
JP2007243856A (ja) * | 2006-03-13 | 2007-09-20 | Yamaha Corp | マイクロホンユニット |
JP4910765B2 (ja) * | 2007-02-27 | 2012-04-04 | ヤマハ株式会社 | サウンドマスキングシステム及びマスキングサウンド生成装置 |
JP5103974B2 (ja) * | 2007-03-22 | 2012-12-19 | ヤマハ株式会社 | マスキングサウンド生成装置、マスキングサウンド生成方法およびプログラム |
US20080312916A1 (en) * | 2007-06-15 | 2008-12-18 | Mr. Alon Konchitsky | Receiver Intelligibility Enhancement System |
US8175871B2 (en) * | 2007-09-28 | 2012-05-08 | Qualcomm Incorporated | Apparatus and method of noise and echo reduction in multiple microphone audio systems |
US8175291B2 (en) * | 2007-12-19 | 2012-05-08 | Qualcomm Incorporated | Systems, methods, and apparatus for multi-microphone based speech enhancement |
US8812309B2 (en) * | 2008-03-18 | 2014-08-19 | Qualcomm Incorporated | Methods and apparatus for suppressing ambient noise using multiple audio signals |
JP5453740B2 (ja) * | 2008-07-02 | 2014-03-26 | 富士通株式会社 | 音声強調装置 |
US8311817B2 (en) * | 2010-11-04 | 2012-11-13 | Audience, Inc. | Systems and methods for enhancing voice quality in mobile device |
-
2010
- 2010-02-25 JP JP2010040598A patent/JP5489778B2/ja not_active Expired - Fee Related
-
2011
- 2011-02-23 US US13/033,438 patent/US8635064B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US8635064B2 (en) | 2014-01-21 |
JP2011175182A (ja) | 2011-09-08 |
US20110208516A1 (en) | 2011-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9595259B2 (en) | Sound source-separating device and sound source-separating method | |
US20220159403A1 (en) | System and method for assisting selective hearing | |
US7092882B2 (en) | Noise suppression in beam-steered microphone array | |
EP2192794B1 (en) | Improvements in hearing aid algorithms | |
US9536523B2 (en) | Method and system for identification of speech segments | |
JP5489778B2 (ja) | 情報処理装置およびその処理方法 | |
US8532987B2 (en) | Speech masking and cancelling and voice obscuration | |
EP2492912B1 (en) | Sound processing apparatus, sound processing method and hearing aid | |
US20200184991A1 (en) | Sound class identification using a neural network | |
US20210158828A1 (en) | Audio processing device, image processing device, microphone array system, and audio processing method | |
CN107910011A (zh) | 一种语音降噪方法、装置、服务器及存储介质 | |
KR102191736B1 (ko) | 인공신경망을 이용한 음성향상방법 및 장치 | |
EP2881948A1 (en) | Spectral comb voice activity detection | |
WO2015157458A1 (en) | Methods and systems for improved measurement, entity and parameter estimation, and path propagation effect measurement and mitigation in source signal separation | |
US10547956B2 (en) | Method of operating a hearing aid, and hearing aid | |
KR20240033108A (ko) | 음성인식 오디오 시스템 및 방법 | |
JP2003514412A (ja) | 音源が一対のマイクロフォンから近いか遠いかを判断する方法 | |
US9699549B2 (en) | Audio capturing enhancement method and audio capturing system using the same | |
JP2021511755A (ja) | 音声認識オーディオシステムおよび方法 | |
CN107124647A (zh) | 一种全景视频录制时自动生成字幕文件的方法及装置 | |
US8793128B2 (en) | Speech signal processing system, speech signal processing method and speech signal processing method program using noise environment and volume of an input speech signal at a time point | |
EP3671271A2 (en) | Near ultrasound based proximity sensing for mobile devices | |
JP2018132737A (ja) | 収音装置、プログラム及び方法、並びに、判定装置、プログラム及び方法 | |
US11443760B2 (en) | Active sound control | |
Yaguchi et al. | Replay attack detection using generalized cross-correlation of stereo signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130214 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130214 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140128 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140225 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5489778 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |