JP2018031897A - 利得調整装置、利得調整方法および利得調整プログラム - Google Patents
利得調整装置、利得調整方法および利得調整プログラム Download PDFInfo
- Publication number
- JP2018031897A JP2018031897A JP2016164153A JP2016164153A JP2018031897A JP 2018031897 A JP2018031897 A JP 2018031897A JP 2016164153 A JP2016164153 A JP 2016164153A JP 2016164153 A JP2016164153 A JP 2016164153A JP 2018031897 A JP2018031897 A JP 2018031897A
- Authority
- JP
- Japan
- Prior art keywords
- gain
- frequency spectrum
- level difference
- gain adjustment
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers without distortion of the input signal
- H03G3/20—Automatic control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/568—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/01—Aspects of volume control, not necessarily automatic, in sound systems
Abstract
【解決手段】利得調整装置は、音声信号を出力する複数の出力装置と、複数の出力装置それぞれから出力される音声信号を周波数スペクトルにそれぞれ変換する周波数変換部と、周波数スペクトルの比較結果に基づき、周波数スペクトルの推定レベル差値を算出するレベル差推定部と、周波数スペクトルおよび推定レベル差値に基づき、周波数スペクトルに対する利得をそれぞれ算出する利得算出部とを有する。
【選択図】図1
Description
図1は、第1の実施形態における、利得調整装置の利用形態の一例を示す概念図である。図1の概念図は、話者10、話者11、マイク1、マイク2、コンピュータ12を有する。図1において、話者10の近傍にマイク1が設置され、話者11の近傍にマイク2が設置されている。話者10および話者11により発話された音声は、マイク1およびマイク2により受信される。話者10および話者11は音声を出力する音源の例である。マイク1およびマイク2は、受信した音声を電気信号に変換し、変換した電気信号をコンピュータ12に入力する。マイク1およびマイク2は、例えばあらかじめ録音された音声信号を出力する出力装置であってもよい。利得調整装置は、例えばコンピュータ12にインストールされたソフトウェアプログラムとして機能的に実現される。
図11は、第2の実施形態における、自動利得調整装置の機能ブロック図の一例である。自動利得調整装置17aは、周波数変換部20および21、発話状態推定部22a、レベル差推定部23a、利得算出部24a、減衰量比記憶部51a、利得付加部27aおよび28a、逆変換部29および30を有する。
|rn(l,k)-Rn(k)|≦TH2の場合、VAn(l,k)=VAn(l-1,k)、F(l,k)=0
利得算出部24bは利得GAn(l,k)について、算出した補正量VAn(l,k)に基づき、GAn(l,k)=1-VAn(l,k)/Xn(l,k)により算出する。
インターネット網140は複数の通信装置が優先または無線で接続可能なインターネット通信網の概念図である。本実施例においてインターネット網140は、収録装置129から受信した音声ファイルをサーバ13に送信する。
3:音声収集システム
12:コンピュータ
13:サーバ
14:演算処理部
15、16:AD変換部
17:自動利得調整装置
18:音源処理部
19:音声ファイル変換部
20、21:周波数変換部
22:発話状態推定部
23:レベル差推定部
24:利得算出部
25、26:雑音推定部
27、28:利得付加部
29、30:逆変換部
Claims (9)
- 音声信号を出力する複数の出力装置と、
前記複数の出力装置からそれぞれ出力される音声信号を周波数スペクトルにそれぞれ変換する周波数変換部と、
前記周波数スペクトルの比較結果に基づき、前記周波数スペクトルの推定レベル差値を算出するレベル差推定部と、
前記周波数スペクトル、および前記推定レベル差値に基づき、前記周波数スペクトルに対する利得をそれぞれ算出する利得算出部と
を有する利得調整装置。 - 前記レベル差推定部は、前記周波数スペクトルの差分の所定の帯域での平均値に基づいて前記推定レベル差値を算出する、請求項1に記載の利得調整装置。
- 前記出力装置から出力される前記音声信号の背景雑音量を推定する背景雑音推定部をさらに有し、前記利得算出部は、前記周波数スペクトル、前記推定レベル差値、および前記背景雑音量に基づき前記周波数スペクトルに対する利得を算出する、請求項1に記載の利得調整装置。
- 発話者から前記出力装置までの伝達過程における所定周波数での減衰量に対する各周波数での減衰量の比率である、減衰量比を記憶する減衰量比記憶部をさらに有し、
前記利得算出部は、前記周波数スペクトル、前記推定レベル差値、および前記減衰量比に基づき前記周波数スペクトルに対する利得を算出する、請求項1に記載の利得調整装置。 - 前記利得算出部は、前記推定レベル差に基づき周辺環境の変動を検知し、前記周辺環境の検知結果に応じて前記周波数スペクトルに対する利得を算出する、請求項1に記載の利得調整装置。
- 前記レベル差推定部は、前記周波数スペクトルが単数音源からの音声信号を含む区間における前記周波数スペクトルに基づいて、前記推定レベル差値を算出する
請求項1に記載の利得調整装置。 - 前記利得算出部により算出された利得に応じて利得調整された前記周波数スペクトルに対し音源分離処理を実行することにより、前記周波数スペクトルにおいて前記単数音源に所望信号以外の音声信号を含む区間において、前記所望信号を抽出する音声処理部をさらに備える
請求項6に記載の利得調整装置。 - 複数の出力装置からそれぞれ出力される音声信号の利得を調整する装置の利得調整方法であって、前記装置が、
前記複数の出力装置から出力した前記音声信号を周波数スペクトルにそれぞれ周波数変換し、
前記周波数スペクトルの比較結果に基づき、前記周波数スペクトルの推定レベル差値を算出し、
前記周波数スペクトル、および前記推定レベル差値に基づき、前記周波数スペクトルの利得を算出する
処理を実行する、利得調整方法。 - 複数の出力装置からそれぞれ出力される音声信号の利得を調整する装置の利得調整プログラムであって、前記装置に、
前記複数の出力装置から出力した前記音声信号を周波数スペクトルにそれぞれ周波数変換し、
前記周波数スペクトルの比較結果に基づき、前記周波数スペクトルの推定レベル差値を算出し、
前記周波数スペクトル、および前記推定レベル差値に基づき、前記周波数スペクトルの利得を算出する
処理を実行させる、利得調整プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016164153A JP6844149B2 (ja) | 2016-08-24 | 2016-08-24 | 利得調整装置および利得調整プログラム |
US15/672,405 US10014838B2 (en) | 2016-08-24 | 2017-08-09 | Gain adjustment apparatus and gain adjustment method |
EP17186408.5A EP3288030B1 (en) | 2016-08-24 | 2017-08-16 | Gain adjustment apparatus and gain adjustment method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016164153A JP6844149B2 (ja) | 2016-08-24 | 2016-08-24 | 利得調整装置および利得調整プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018031897A true JP2018031897A (ja) | 2018-03-01 |
JP6844149B2 JP6844149B2 (ja) | 2021-03-17 |
Family
ID=59631662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016164153A Active JP6844149B2 (ja) | 2016-08-24 | 2016-08-24 | 利得調整装置および利得調整プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10014838B2 (ja) |
EP (1) | EP3288030B1 (ja) |
JP (1) | JP6844149B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111009259B (zh) * | 2018-10-08 | 2022-09-16 | 杭州海康慧影科技有限公司 | 一种音频处理方法和装置 |
CN110060690B (zh) * | 2019-04-04 | 2023-03-24 | 南京邮电大学 | 基于STARGAN和ResNet的多对多说话人转换方法 |
CN112929790B (zh) * | 2021-01-20 | 2022-02-01 | 四川湖山电器股份有限公司 | 一种单发双收红外话筒音量自适应电路 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002236500A (ja) * | 2001-02-08 | 2002-08-23 | Nippon Telegr & Teleph Corp <Ntt> | 多チャネル雑音抑圧装置、その方法、そのプログラム及びその記録媒体 |
JP2007266937A (ja) * | 2006-03-28 | 2007-10-11 | Pioneer Electronic Corp | 案内音声ミキシング装置 |
JP2010232717A (ja) * | 2009-03-25 | 2010-10-14 | Toshiba Corp | 受音信号処理装置、方法およびプログラム |
JP2011119783A (ja) * | 2009-11-30 | 2011-06-16 | Canon Inc | 音声信号処理装置 |
JP2012010154A (ja) * | 2010-06-25 | 2012-01-12 | Yamaha Corp | 周波数特性制御装置 |
WO2015114674A1 (ja) * | 2014-01-28 | 2015-08-06 | 三菱電機株式会社 | 集音装置、集音装置の入力信号補正方法および移動機器情報システム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4457221B2 (ja) | 2003-08-29 | 2010-04-28 | 学校法人早稲田大学 | 音源分離方法およびそのシステム、並びに音声認識方法およびそのシステム |
JP2007129373A (ja) | 2005-11-01 | 2007-05-24 | Univ Waseda | マイクロフォン感度調整方法およびそのシステム |
JP4906908B2 (ja) * | 2009-11-30 | 2012-03-28 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 目的音声抽出方法、目的音声抽出装置、及び目的音声抽出プログラム |
KR101670313B1 (ko) * | 2010-01-28 | 2016-10-28 | 삼성전자주식회사 | 음원 분리를 위해 자동적으로 문턱치를 선택하는 신호 분리 시스템 및 방법 |
WO2012023268A1 (ja) | 2010-08-16 | 2012-02-23 | 日本電気株式会社 | 多マイクロホン話者分類装置、方法およびプログラム |
KR101305373B1 (ko) * | 2011-12-16 | 2013-09-06 | 서강대학교산학협력단 | 관심음원 제거방법 및 그에 따른 음성인식방법 |
-
2016
- 2016-08-24 JP JP2016164153A patent/JP6844149B2/ja active Active
-
2017
- 2017-08-09 US US15/672,405 patent/US10014838B2/en active Active
- 2017-08-16 EP EP17186408.5A patent/EP3288030B1/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002236500A (ja) * | 2001-02-08 | 2002-08-23 | Nippon Telegr & Teleph Corp <Ntt> | 多チャネル雑音抑圧装置、その方法、そのプログラム及びその記録媒体 |
JP2007266937A (ja) * | 2006-03-28 | 2007-10-11 | Pioneer Electronic Corp | 案内音声ミキシング装置 |
JP2010232717A (ja) * | 2009-03-25 | 2010-10-14 | Toshiba Corp | 受音信号処理装置、方法およびプログラム |
JP2011119783A (ja) * | 2009-11-30 | 2011-06-16 | Canon Inc | 音声信号処理装置 |
JP2012010154A (ja) * | 2010-06-25 | 2012-01-12 | Yamaha Corp | 周波数特性制御装置 |
WO2015114674A1 (ja) * | 2014-01-28 | 2015-08-06 | 三菱電機株式会社 | 集音装置、集音装置の入力信号補正方法および移動機器情報システム |
Also Published As
Publication number | Publication date |
---|---|
US20180062597A1 (en) | 2018-03-01 |
JP6844149B2 (ja) | 2021-03-17 |
US10014838B2 (en) | 2018-07-03 |
EP3288030B1 (en) | 2019-08-07 |
EP3288030A1 (en) | 2018-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100860805B1 (ko) | 음성 강화 시스템 | |
US8473291B2 (en) | Sound processing apparatus, apparatus and method for controlling gain, and computer program | |
JP4886715B2 (ja) | 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体 | |
JP6668995B2 (ja) | 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム | |
JP6290429B2 (ja) | 音声処理システム | |
JP6135106B2 (ja) | 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム | |
JP6844149B2 (ja) | 利得調整装置および利得調整プログラム | |
JP2014122939A (ja) | 音声処理装置および方法、並びにプログラム | |
EP3669780A1 (en) | Methods, devices and system for a compensated hearing test | |
CN112272848A (zh) | 使用间隙置信度的背景噪声估计 | |
WO2014168021A1 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
US10951978B2 (en) | Output control of sounds from sources respectively positioned in priority and nonpriority directions | |
WO2020110228A1 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
JP6638248B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声信号処理装置 | |
WO2012070684A1 (ja) | 信号処理装置、信号処理方法、及び信号処理プログラム | |
JP7013789B2 (ja) | 音声処理用コンピュータプログラム、音声処理装置及び音声処理方法 | |
US10607628B2 (en) | Audio processing method, audio processing device, and computer readable storage medium | |
JP6729186B2 (ja) | 音声処理プログラム、音声処理方法及び音声処理装置 | |
US20160005418A1 (en) | Signal processor and method therefor | |
JP6631127B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声処理装置 | |
JP5339849B2 (ja) | 音声明瞭度改善方法および音声明瞭度改善システム | |
US10109291B2 (en) | Noise suppression device, noise suppression method, and computer program product | |
JP7264594B2 (ja) | 残響抑制装置及び補聴器 | |
US20130304462A1 (en) | Signal processing apparatus and method and program | |
JP6544182B2 (ja) | 音声処理装置、プログラム及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20180528 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190513 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200324 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200518 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20201027 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201218 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20201218 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20210104 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20210105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210126 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210208 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6844149 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |