JP2017187746A - 音声処理システムおよび音声処理方法 - Google Patents
音声処理システムおよび音声処理方法 Download PDFInfo
- Publication number
- JP2017187746A JP2017187746A JP2017029724A JP2017029724A JP2017187746A JP 2017187746 A JP2017187746 A JP 2017187746A JP 2017029724 A JP2017029724 A JP 2017029724A JP 2017029724 A JP2017029724 A JP 2017029724A JP 2017187746 A JP2017187746 A JP 2017187746A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- power
- speech
- reverberation
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title description 19
- 238000003672 processing method Methods 0.000 title 1
- 230000008859 change Effects 0.000 claims description 69
- 238000005259 measurement Methods 0.000 claims description 33
- 230000005236 sound signal Effects 0.000 claims description 31
- 238000000034 method Methods 0.000 claims description 30
- 230000004044 response Effects 0.000 claims description 15
- 230000003111 delayed effect Effects 0.000 abstract description 5
- 230000006872 improvement Effects 0.000 abstract description 5
- 230000004075 alteration Effects 0.000 abstract 2
- 230000006870 function Effects 0.000 description 57
- 230000000873 masking effect Effects 0.000 description 13
- 230000007423 decrease Effects 0.000 description 12
- 230000003595 spectral effect Effects 0.000 description 12
- 230000000694 effects Effects 0.000 description 11
- 238000012986 modification Methods 0.000 description 11
- 230000004048 modification Effects 0.000 description 11
- 230000002829 reductive effect Effects 0.000 description 10
- 238000009499 grossing Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 230000001629 suppression Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000005070 sampling Methods 0.000 description 8
- 239000000654 additive Substances 0.000 description 7
- 230000000996 additive effect Effects 0.000 description 7
- 238000009826 distribution Methods 0.000 description 7
- 238000012886 linear function Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 230000007774 longterm Effects 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 230000009467 reduction Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000013179 statistical model Methods 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000002411 adverse Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000006227 byproduct Substances 0.000 description 2
- 230000001364 causal effect Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000005314 correlation function Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 208000032041 Hearing impaired Diseases 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000004800 variational method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
提供する。
【解決手段】音声理解度向上システムは、音声入力部、向上済み音声出力部、音声入力部から受信された音声を、向上済み音声出力部によって向上された音声に変換するプロセッサとを備える。プロセッサは、音声入力部から受信された音声のフレームを抽出する、フレーム重要性の測定値を計算する、残響するときの音声のフレームパワーに対する後発残響に起因する寄与を推定する、所定のフレームパワーを計算することと、所定のフレームパワーが、後発残響に起因する寄与が臨界値を超えて増大することに伴って、抽出されたフレームのパワーに対する所定のフレームパワーの比を低下させるように構成される、音声入力部から受信された音声のフレームに、変更されたフレームパワーを生成する変更を適用する、変更が、所定のフレームパワーを使用して計算される。
【選択図】図8
Description
向上されるべき音声を受信するための音声入力部と、
向上された音声を出力する向上済み音声出力部と、
音声入力部から受信された音声を、向上済み音声出力部によって出力されるべき向上された音声に変換するように構成されたプロセッサと
を備え、プロセッサは、
i)音声入力部から受信された音声のフレームを抽出することと、
ii)フレーム重要性の測定値を計算することと、
iii)残響するときの音声のフレームパワーに対する後発残響に起因する寄与を推定することと、
iv)所定のフレームパワーを計算することと、所定のフレームパワーが、抽出されたフレームのパワー、フレーム重要性の測定値、および後発残響に起因する寄与の関数であり、関数が、後発残響に起因する寄与が臨界値
v)音声入力部から受信された音声のフレームに、変更されたフレームパワーを生成する変更を適用することと、ここにおいて、変更が、所定のフレームパワーを使用して計算される、
を行うように構成される。
向上されるべき音声を受信するための音声入力部と、
向上された音声を出力する向上済み音声出力部と、
音声入力部から受信された音声を、向上済み音声出力部によって出力されるべき向上された音声に変換するように構成されたプロセッサと
を備え、プロセッサは、
i)音声入力部から受信された音声のフレームを抽出することと、
ii)フレーム重要性の測定値を計算することと、
iii)残響するときの音声のフレームパワーに対する後発残響に起因する寄与lを推定することと、
iv)ペナルティ項Tに従って歪み測定値を最小化する所定のフレームパワーを計算することと、ここにおいて、Tが、(a)後発残響に起因する寄与l、(b)抽出されたフレームのパワーに対する所定のフレームパワーの比、および(c)乗数λの関数であり、ここにおいて、関数が、臨界値
v)音声入力部から受信された音声のフレームに、変更されたフレームパワーを生成する変更を適用することと、ここにおいて、変更が、所定のフレームパワーを使用して計算される、
を行うように構成される。
(a)2つ以上の周波数帯域の各々における抽出されたフレームパワーの割合を計算することと、
(b)抽出されたフレームパワーの事前決定された割合に対応する最高パワー帯域に対応する抽出されたフレームの周波数帯域を決定することと、
(c)後発残響信号の概算値を生成することと、
(d)(b)において決定された周波数帯域の各々における後発残響信号のパワーの割合を計算することと、
を備え、残響するときの音声のフレームパワーに対する後発残響に起因する寄与が、(d)において計算された周波数帯域の各々における後発残響信号のパワーの合計として推定される。
音声入力部から受信された音声のオーバーラップフレームを抽出すること
を備え、プロセッサは、
vi)抽出されたフレームのパワーに対する変更されたフレームパワーの比が1よりも小さく、lが
新しい変更された音声信号を出力するために、変更された以前のフレームを備える変更された音声信号に、ステップv)から出力された変更されたフレームをオーバーラップ加算することを備えることができ、ここにおいて、時間スケール変更を適用することは、
新しい変更された音声信号の最後のセグメントと新しい変更された音声信号の複数のターゲットセグメントの各々との間の相関を計算することと、ここにおいて、ターゲットセグメントが、新しい変更された音声信号の一連の先行セグメントに対応する、
最も高い相関値に対応するターゲットセグメントを決定することと、
ターゲットセグメントの相関値がしきい値よりも大きい場合に、
新しい変更された音声信号のターゲットセグメントから終わりまでの新しい変更された音声信号のセクションを複製することと、
この複製されたセクションを、新しい変更された音声信号の最後のセグメントにオーバーラップ加算することと
を備える。
向上されるべき音声を受信するステップと、
受信された音声のフレームを抽出するステップと、
フレーム重要性の測定値を計算するステップと、
残響するときの音声のフレームパワーに対する後発残響に起因する寄与を推定するステップと、
所定のフレームパワーを計算するステップと、所定のフレームパワーが、抽出されたフレームのパワー、フレーム重要性の測定値、および後発残響に起因する寄与の関数であり、関数が、後発残響への寄与が臨界値
音声入力部から受信された音声のフレームに、変更されたフレームパワーを生成する変更を適用するステップと、ここにおいて、変更が、所定のフレームパワーを使用して計算される、
を備える。
が決定される。
Claims (20)
- 音声を向上させるための音声理解度向上システムであって、
向上されるべき音声を受信するための音声入力部と、
前記向上された音声を出力する向上済み音声出力部と、
前記音声入力部から受信された音声を、前記向上済み音声出力部によって出力されるべき向上された音声に変換するように構成されたプロセッサと
を備え、前記プロセッサは、
i)前記音声入力部から受信された前記音声のフレームを抽出することと、
ii)フレーム重要性の測定値を計算することと、
iii)残響するときの前記音声のフレームパワーに対する後発残響に起因する寄与を推定することと、
iv)所定のフレームパワーを計算することと、前記所定のフレームパワーが、前記抽出されたフレームのパワー、前記フレーム重要性の前記測定値、および後発残響に起因する前記寄与の関数であり、前記関数が、後発残響に起因する前記寄与が臨界値
v)前記音声入力部から受信された前記音声の前記フレームに、変更されたフレームパワーを生成する変更を適用することと、ここにおいて、前記変更が、前記所定のフレームパワーを使用して計算される、
を行うように構成される、音声理解度向上システム。 - 音声を向上させるための音声理解度向上システムであって、
向上されるべき音声を受信するための音声入力部と、
前記向上された音声を出力する向上済み音声出力部と、
前記音声入力部から受信された音声を、前記向上済み音声出力部によって出力されるべき向上された音声に変換するように構成されたプロセッサと
を備え、前記プロセッサは、
i)前記音声入力部から受信された前記音声のフレームを抽出することと、
ii)フレーム重要性の測定値を計算することと、
iii)残響するときの前記音声のフレームパワーに対する後発残響に起因する寄与lを推定することと、
iv)ペナルティ項Tに従って歪み測定値を最小化する所定のフレームパワーを計算することと、ここにおいて、Tが、(a)後発残響に起因する前記寄与l、(b)前記抽出されたフレームのパワーに対する前記所定のフレームパワーの比、および(c)乗数λの関数であり、ここにおいて、前記関数が、臨界値
v)前記音声入力部から受信された前記音声の前記フレームに、変更されたフレームパワーを生成する変更を適用することと、ここにおいて、前記変更が、前記所定のフレームパワーを使用して計算される、
を行うように構成される、音声理解度向上システム。 -
- w=2である、請求項3に記載のシステム。
- 前記所定のフレームパワーは、λが前記フレーム重要性の前記測定値の関数であることに従って計算される、請求項2から4のいずれかに記載のシステム。
- 前記フレーム重要性の前記測定値は、前記フレームのメルケプストラムと以前のフレームのメルケプストラムとの相違性の測定値である、請求項1または5に記載のシステム。
- 後発残響に起因する前記寄与は、衰退関数で振幅変調されたパルス列として環境のインパルス応答をモデル化することによって推定される、請求項1から6のいずれかに記載のシステム。
- 前記所定のフレームパワーは、
- 前記第1の境界条件は、
- λは
- λ1およびλ2は、xの関数としての前記所定のフレームパワーおよび前記関数y=xの前記交差点が前記フレーム重要性に依存するように計算される、請求項10に記載のシステム。
- iii)は、
(a)2つ以上の周波数帯域の各々における前記抽出されたフレームの前記フレームパワーの割合を計算することと、
(b)前記抽出されたフレームパワーの事前決定された割合に対応する最高パワー帯域に対応する前記抽出されたフレームの前記周波数帯域を決定することと、
(c)後発残響信号の概算値を生成することと、
(d)(b)において決定された前記周波数帯域の各々における前記後発残響信号のパワーの割合を計算することと、
を備え、残響するときの前記音声の前記フレームパワーに対する後発残響に起因する前記寄与が、(d)において計算された前記周波数帯域の各々における前記後発残響信号のパワーの合計として推定される、請求項1から11のいずれかに記載のシステム。 - 前記変更の変化率は、
- 前記音声入力部から受信された前記音声の前記フレームに適用される前記変更は、
- フレームに関するφの値は、前記フレームの何らかの特性に基づいて、2つ以上の値から選択される、請求項14に記載のシステム。
- ステップi)は、
前記音声入力部から受信された前記音声のオーバーラップフレームを抽出すること
を備え、前記プロセッサは、
vi)前記抽出されたフレームの前記パワーに対する前記変更されたフレームパワーの比が1よりも小さく、lが
- ステップvi)は、
新しい変更された音声信号を出力するために、変更された以前のフレームを備える変更された音声信号に、ステップv)から出力された前記変更されたフレームをオーバーラップ加算することを備え、時間スケール変更を適用することは、
前記新しい変更された音声信号の最後のセグメントと前記新しい変更された音声信号の複数のターゲットセグメントの各々との間の相関を計算することと、ここにおいて、前記ターゲットセグメントが、前記新しい変更された音声信号の一連の先行セグメントに対応する、
最も高い相関値に対応するターゲットセグメントを決定することと、
前記ターゲットセグメントの前記相関値がしきい値よりも大きい場合に、
前記新しい変更された音声信号の前記ターゲットセグメントから終わりまでの前記新しい変更された音声信号のセクションを複製することと、
この複製されたセクションを、前記新しい変更された音声信号の最後のセグメントにオーバーラップ加算することと
を備える、請求項16に記載のシステム。 - 前記しきい値は、前記ターゲットセグメントが前記最後のセグメントである場合の前記相関値とΩとの積であり、ここで、Ω∈(0,1)である、請求項17に記載のシステム。
- 音声を向上させる方法であって、
向上されるべき音声を受信するステップと、
前記受信された音声のフレームを抽出するステップと、
フレーム重要性の測定値を計算するステップと、
残響するときの前記音声のフレームパワーに対する後発残響に起因する寄与を推定するステップと、
所定のフレームパワーを計算するステップと、前記所定のフレームパワーが、前記抽出されたフレームのパワー、前記フレーム重要性の前記測定値、および後発残響に起因する前記寄与の関数であり、前記関数が、後発残響への前記寄与が臨界値
音声入力部から受信された前記音声の前記フレームに、変更されたフレームパワーを生成する変更を適用するステップと、ここにおいて、前記変更が、前記所定のフレームパワーを使用して計算される、
を備える方法。 - 請求項19に記載の方法をコンピュータに実行させるように構成されたコンピュータ可読コードを備えるキャリア媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1605750.7 | 2016-04-04 | ||
GB1605750.7A GB2549103B (en) | 2016-04-04 | 2016-04-04 | A speech processing system and speech processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017187746A true JP2017187746A (ja) | 2017-10-12 |
JP6325138B2 JP6325138B2 (ja) | 2018-05-16 |
Family
ID=59846771
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017029724A Active JP6325138B2 (ja) | 2016-04-04 | 2017-02-21 | 音声処理システムおよび音声処理方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10438604B2 (ja) |
JP (1) | JP6325138B2 (ja) |
GB (1) | GB2549103B (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11069334B2 (en) | 2018-08-13 | 2021-07-20 | Carnegie Mellon University | System and method for acoustic activity recognition |
EP3624113A1 (en) | 2018-09-13 | 2020-03-18 | Nxp B.V. | Apparatus for processing a signal |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007065285A (ja) * | 2005-08-31 | 2007-03-15 | Takayuki Arai | 音声信号処理方法、装置及びプログラム |
JP2008058900A (ja) * | 2006-09-04 | 2008-03-13 | Internatl Business Mach Corp <Ibm> | 残響除去における低コストのフィルタ係数決定法 |
JP2010091897A (ja) * | 2008-10-10 | 2010-04-22 | Kyushu Univ | 音声信号強調装置 |
JP2015169901A (ja) * | 2014-03-10 | 2015-09-28 | ヤマハ株式会社 | 音響処理装置 |
JP2016505896A (ja) * | 2013-01-08 | 2016-02-25 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 背景ノイズにおけるスピーチ了解度を増幅及び圧縮により向上させる装置と方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103067821B (zh) * | 2012-12-12 | 2015-03-11 | 歌尔声学股份有限公司 | 一种基于双麦克的语音混响消减方法和装置 |
FR3009121B1 (fr) * | 2013-07-23 | 2017-06-02 | Arkamys | Procede de suppression de la reverberation tardive d'un signal sonore |
DK2835986T3 (en) * | 2013-08-09 | 2018-01-08 | Oticon As | Hearing aid with input transducer and wireless receiver |
US9538297B2 (en) * | 2013-11-07 | 2017-01-03 | The Board Of Regents Of The University Of Texas System | Enhancement of reverberant speech by binary mask estimation |
-
2016
- 2016-04-04 GB GB1605750.7A patent/GB2549103B/en active Active
-
2017
- 2017-02-21 JP JP2017029724A patent/JP6325138B2/ja active Active
- 2017-03-01 US US15/446,828 patent/US10438604B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007065285A (ja) * | 2005-08-31 | 2007-03-15 | Takayuki Arai | 音声信号処理方法、装置及びプログラム |
JP2008058900A (ja) * | 2006-09-04 | 2008-03-13 | Internatl Business Mach Corp <Ibm> | 残響除去における低コストのフィルタ係数決定法 |
JP2010091897A (ja) * | 2008-10-10 | 2010-04-22 | Kyushu Univ | 音声信号強調装置 |
JP2016505896A (ja) * | 2013-01-08 | 2016-02-25 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 背景ノイズにおけるスピーチ了解度を増幅及び圧縮により向上させる装置と方法 |
JP2015169901A (ja) * | 2014-03-10 | 2015-09-28 | ヤマハ株式会社 | 音響処理装置 |
Also Published As
Publication number | Publication date |
---|---|
GB2549103B (en) | 2021-05-05 |
GB2549103A (en) | 2017-10-11 |
US10438604B2 (en) | 2019-10-08 |
US20170287498A1 (en) | 2017-10-05 |
JP6325138B2 (ja) | 2018-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8271277B2 (en) | Dereverberation apparatus, dereverberation method, dereverberation program, and recording medium | |
KR101266894B1 (ko) | 특성 추출을 사용하여 음성 향상을 위한 오디오 신호를 프로세싱하기 위한 장치 및 방법 | |
JP6169849B2 (ja) | 音響処理装置 | |
KR102132500B1 (ko) | 조화성 기반 단일 채널 음성 품질 추정 기법 | |
US11133019B2 (en) | Signal processor and method for providing a processed audio signal reducing noise and reverberation | |
US20190080709A1 (en) | Spectral Estimation Of Room Acoustic Parameters | |
ES2966063T3 (es) | Separación de fuentes mediante una estimación y control de la calidad de sonido | |
JP7059301B2 (ja) | 音響信号の人為的帯域幅制限処理に関する所定の特性を決定するための装置および方法 | |
Tsilfidis et al. | Automatic speech recognition performance in different room acoustic environments with and without dereverberation preprocessing | |
Kumar | Comparative performance evaluation of MMSE-based speech enhancement techniques through simulation and real-time implementation | |
JP5645419B2 (ja) | 残響除去装置 | |
Chetupalli et al. | Late reverberation cancellation using Bayesian estimation of multi-channel linear predictors and student's t-source prior | |
JP6325138B2 (ja) | 音声処理システムおよび音声処理方法 | |
Morita et al. | Robust voice activity detection based on concept of modulation transfer function in noisy reverberant environments | |
Xu et al. | Deep noise suppression maximizing non-differentiable PESQ mediated by a non-intrusive PESQNet | |
Chen et al. | Speech dereverberation method based on spectral subtraction and spectral line enhancement | |
JP2024526679A (ja) | 発話向上のためのデータ増強 | |
Nathwani et al. | Joint source separation and dereverberation using constrained spectral divergence optimization | |
Kamarudin et al. | Acoustic echo cancellation using adaptive filtering algorithms for Quranic accents (Qiraat) identification | |
Prasad et al. | Two microphone technique to improve the speech intelligibility under noisy environment | |
Coldenhoff et al. | Multi-Channel Mosra: Mean Opinion Score and Room Acoustics Estimation Using Simulated Data and A Teacher Model | |
JP5815614B2 (ja) | 残響抑圧装置とその方法と、プログラムとその記録媒体 | |
GB2537923A (en) | A speech processing system and speech processing method | |
WO2022190245A1 (ja) | 騒音抑圧装置、騒音抑圧方法、及び騒音抑圧プログラム | |
JP7380361B2 (ja) | 雑音推定装置、雑音推定プログラム、雑音推定方法、及び収音装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180313 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180411 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6325138 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |