JP6844149B2 - 利得調整装置および利得調整プログラム - Google Patents
利得調整装置および利得調整プログラム Download PDFInfo
- Publication number
- JP6844149B2 JP6844149B2 JP2016164153A JP2016164153A JP6844149B2 JP 6844149 B2 JP6844149 B2 JP 6844149B2 JP 2016164153 A JP2016164153 A JP 2016164153A JP 2016164153 A JP2016164153 A JP 2016164153A JP 6844149 B2 JP6844149 B2 JP 6844149B2
- Authority
- JP
- Japan
- Prior art keywords
- gain
- frequency
- frequency spectrum
- level difference
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001228 spectrum Methods 0.000 claims description 142
- 238000004364 calculation method Methods 0.000 claims description 61
- 238000012545 processing Methods 0.000 claims description 48
- 230000005236 sound signal Effects 0.000 claims description 45
- 238000000926 separation method Methods 0.000 claims description 15
- 230000005540 biological transmission Effects 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims 1
- 238000000034 method Methods 0.000 description 48
- 238000006243 chemical reaction Methods 0.000 description 36
- 238000012937 correction Methods 0.000 description 21
- 238000009499 grossing Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 238000012546 transfer Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 3
- 230000005534 acoustic noise Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/568—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/01—Aspects of volume control, not necessarily automatic, in sound systems
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
図1は、第1の実施形態における、利得調整装置の利用形態の一例を示す概念図である。図1の概念図は、話者10、話者11、マイク1、マイク2、コンピュータ12を有する。図1において、話者10の近傍にマイク1が設置され、話者11の近傍にマイク2が設置されている。話者10および話者11により発話された音声は、マイク1およびマイク2により受信される。話者10および話者11は音声を出力する音源の例である。マイク1およびマイク2は、受信した音声を電気信号に変換し、変換した電気信号をコンピュータ12に入力する。マイク1およびマイク2は、例えばあらかじめ録音された音声信号を出力する出力装置であってもよい。利得調整装置は、例えばコンピュータ12にインストールされたソフトウェアプログラムとして機能的に実現される。
図11は、第2の実施形態における、自動利得調整装置の機能ブロック図の一例である。自動利得調整装置17aは、周波数変換部20および21、発話状態推定部22a、レベル差推定部23a、利得算出部24a、減衰量比記憶部51a、利得付加部27aおよび28a、逆変換部29および30を有する。
|rn(l,k)-Rn(k)|≦TH2の場合、VAn(l,k)=VAn(l-1,k)、F(l,k)=0
利得算出部24bは利得GAn(l,k)について、算出した補正量VAn(l,k)に基づき、GAn(l,k)=1-VAn(l,k)/Xn(l,k)により算出する。
インターネット網140は複数の通信装置が優先または無線で接続可能なインターネット通信網の概念図である。本実施例においてインターネット網140は、収録装置129から受信した音声ファイルをサーバ13に送信する。
3:音声収集システム
12:コンピュータ
13:サーバ
14:演算処理部
15、16:AD変換部
17:自動利得調整装置
18:音源処理部
19:音声ファイル変換部
20、21:周波数変換部
22:発話状態推定部
23:レベル差推定部
24:利得算出部
25、26:雑音推定部
27、28:利得付加部
29、30:逆変換部
Claims (4)
- 複数の出力装置からそれぞれ出力される音声信号を周波数スペクトルにそれぞれ変換する周波数変換部と、
前記周波数スペクトルの比較結果に基づき、前記周波数スペクトルの推定レベル差値を算出するレベル差推定部と、
前記周波数スペクトル、および前記推定レベル差値に基づき、前記周波数スペクトルに対する利得をそれぞれ算出する利得算出部と、
発話者から前記出力装置までの伝達過程における所定周波数での減衰量に対する各周波数での減衰量の比率である、減衰量比を記憶する減衰量比記憶部と、
を有し、
前記利得算出部は、前記周波数スペクトル、前記推定レベル差値、および前記減衰量比に基づき前記周波数スペクトルに対する利得を算出する、利得調整装置。 - 複数の出力装置からそれぞれ出力される音声信号を周波数スペクトルにそれぞれ変換する周波数変換部と、
前記周波数スペクトルが単数音源からの音声信号を含む区間における前記周波数スペクトルに基づき、前記周波数スペクトルの推定レベル差値を算出するレベル差推定部と、
前記周波数スペクトル、および前記推定レベル差値に基づき、前記周波数スペクトルに対する利得をそれぞれ算出する利得算出部と、
前記利得算出部により算出された利得に応じて利得調整された前記周波数スペクトルに対し音源分離処理を実行することにより、前記周波数スペクトルにおいて前記単数音源に所望信号以外の音声信号を含む区間において、前記所望信号を抽出する音声処理部をさらに備える
利得調整装置。 - 複数の出力装置からそれぞれ出力される音声信号の利得を調整する装置の利得調整プログラムであって、前記装置に、
前記複数の出力装置からそれぞれ出力される前記音声信号を周波数スペクトルにそれぞれ周波数変換し、
前記周波数スペクトルの比較結果に基づき、前記周波数スペクトルの推定レベル差値を算出し、
発話者から前記出力装置までの伝達過程における所定周波数での減衰量に対する各周波数での減衰量の比率である減衰量比と、前記周波数スペクトルと、および前記推定レベル差値とに基づき、前記周波数スペクトルの利得を算出する、
処理を実行させる、利得調整プログラム。 - 複数の出力装置からそれぞれ出力される音声信号の利得を調整する装置の利得調整プログラムであって、前記装置に、
前記複数の出力装置からそれぞれ出力される前記音声信号を周波数スペクトルにそれぞれ周波数変換し、
前記周波数スペクトルが単数音源からの音声信号を含む区間における前記周波数スペクトルに基づき、前記周波数スペクトルの推定レベル差値を算出し、
前記周波数スペクトル、および前記推定レベル差値に基づき、前記周波数スペクトルに対する利得をそれぞれ算出し、
前記算出された利得に応じて利得調整された前記周波数スペクトルに対し音源分離処理を実行することにより、前記周波数スペクトルにおいて前記単数音源に所望信号以外の音声信号を含む区間において、前記所望信号を抽出する、
処理を実行させる、利得調整プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016164153A JP6844149B2 (ja) | 2016-08-24 | 2016-08-24 | 利得調整装置および利得調整プログラム |
US15/672,405 US10014838B2 (en) | 2016-08-24 | 2017-08-09 | Gain adjustment apparatus and gain adjustment method |
EP17186408.5A EP3288030B1 (en) | 2016-08-24 | 2017-08-16 | Gain adjustment apparatus and gain adjustment method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016164153A JP6844149B2 (ja) | 2016-08-24 | 2016-08-24 | 利得調整装置および利得調整プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018031897A JP2018031897A (ja) | 2018-03-01 |
JP6844149B2 true JP6844149B2 (ja) | 2021-03-17 |
Family
ID=59631662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016164153A Active JP6844149B2 (ja) | 2016-08-24 | 2016-08-24 | 利得調整装置および利得調整プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10014838B2 (ja) |
EP (1) | EP3288030B1 (ja) |
JP (1) | JP6844149B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111009259B (zh) * | 2018-10-08 | 2022-09-16 | 杭州海康慧影科技有限公司 | 一种音频处理方法和装置 |
CN110060690B (zh) * | 2019-04-04 | 2023-03-24 | 南京邮电大学 | 基于STARGAN和ResNet的多对多说话人转换方法 |
CN112929790B (zh) * | 2021-01-20 | 2022-02-01 | 四川湖山电器股份有限公司 | 一种单发双收红外话筒音量自适应电路 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3619461B2 (ja) * | 2001-02-08 | 2005-02-09 | 日本電信電話株式会社 | 多チャネル雑音抑圧装置、その方法、そのプログラム及びその記録媒体 |
JP4457221B2 (ja) | 2003-08-29 | 2010-04-28 | 学校法人早稲田大学 | 音源分離方法およびそのシステム、並びに音声認識方法およびそのシステム |
JP2007129373A (ja) | 2005-11-01 | 2007-05-24 | Univ Waseda | マイクロフォン感度調整方法およびそのシステム |
JP2007266937A (ja) * | 2006-03-28 | 2007-10-11 | Pioneer Electronic Corp | 案内音声ミキシング装置 |
JP5197458B2 (ja) * | 2009-03-25 | 2013-05-15 | 株式会社東芝 | 受音信号処理装置、方法およびプログラム |
JP4906908B2 (ja) * | 2009-11-30 | 2012-03-28 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 目的音声抽出方法、目的音声抽出装置、及び目的音声抽出プログラム |
JP5645393B2 (ja) * | 2009-11-30 | 2014-12-24 | キヤノン株式会社 | 音声信号処理装置 |
KR101670313B1 (ko) * | 2010-01-28 | 2016-10-28 | 삼성전자주식회사 | 음원 분리를 위해 자동적으로 문턱치를 선택하는 신호 분리 시스템 및 방법 |
JP5532518B2 (ja) * | 2010-06-25 | 2014-06-25 | ヤマハ株式会社 | 周波数特性制御装置 |
WO2012023268A1 (ja) | 2010-08-16 | 2012-02-23 | 日本電気株式会社 | 多マイクロホン話者分類装置、方法およびプログラム |
KR101305373B1 (ko) * | 2011-12-16 | 2013-09-06 | 서강대학교산학협력단 | 관심음원 제거방법 및 그에 따른 음성인식방법 |
US9674607B2 (en) | 2014-01-28 | 2017-06-06 | Mitsubishi Electric Corporation | Sound collecting apparatus, correction method of input signal of sound collecting apparatus, and mobile equipment information system |
-
2016
- 2016-08-24 JP JP2016164153A patent/JP6844149B2/ja active Active
-
2017
- 2017-08-09 US US15/672,405 patent/US10014838B2/en active Active
- 2017-08-16 EP EP17186408.5A patent/EP3288030B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP3288030B1 (en) | 2019-08-07 |
JP2018031897A (ja) | 2018-03-01 |
EP3288030A1 (en) | 2018-02-28 |
US20180062597A1 (en) | 2018-03-01 |
US10014838B2 (en) | 2018-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100860805B1 (ko) | 음성 강화 시스템 | |
US8473291B2 (en) | Sound processing apparatus, apparatus and method for controlling gain, and computer program | |
JP4279357B2 (ja) | 特に補聴器における雑音を低減する装置および方法 | |
GB2577824A (en) | Earbud speech estimation | |
KR100883712B1 (ko) | 음원 방향 추정 방법, 및 음원 방향 추정 장치 | |
US8509451B2 (en) | Noise suppressing device, noise suppressing controller, noise suppressing method and recording medium | |
US9082411B2 (en) | Method to reduce artifacts in algorithms with fast-varying gain | |
US8126176B2 (en) | Hearing aid | |
US8391471B2 (en) | Echo suppressing apparatus, echo suppressing system, echo suppressing method and recording medium | |
JP6668995B2 (ja) | 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム | |
JP6135106B2 (ja) | 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム | |
JP6844149B2 (ja) | 利得調整装置および利得調整プログラム | |
JP6840302B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
CN112272848A (zh) | 使用间隙置信度的背景噪声估计 | |
JP6794887B2 (ja) | 音声処理用コンピュータプログラム、音声処理装置及び音声処理方法 | |
CN111508512A (zh) | 语音信号中的摩擦音检测 | |
JP2008005094A (ja) | エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体 | |
JP5076974B2 (ja) | 音処理装置およびプログラム | |
JP4478045B2 (ja) | エコー消去装置、エコー消去方法、エコー消去プログラムおよびその記録媒体 | |
JP7013789B2 (ja) | 音声処理用コンピュータプログラム、音声処理装置及び音声処理方法 | |
JP2005157086A (ja) | 音声認識装置 | |
CN112133320A (zh) | 语音处理装置及语音处理方法 | |
JP2017009657A (ja) | 音声強調装置、および音声強調方法 | |
JP6729186B2 (ja) | 音声処理プログラム、音声処理方法及び音声処理装置 | |
CN115240700B (zh) | 一种声学设备及其声音处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20180528 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190513 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200324 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200518 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20201027 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201218 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20201218 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20210104 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20210105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210126 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210208 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6844149 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |