JP2015161911A - 音声明瞭化装置及びそのためのコンピュータプログラム - Google Patents
音声明瞭化装置及びそのためのコンピュータプログラム Download PDFInfo
- Publication number
- JP2015161911A JP2015161911A JP2014038786A JP2014038786A JP2015161911A JP 2015161911 A JP2015161911 A JP 2015161911A JP 2014038786 A JP2014038786 A JP 2014038786A JP 2014038786 A JP2014038786 A JP 2014038786A JP 2015161911 A JP2015161911 A JP 2015161911A
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- speech
- envelope
- peak
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004590 computer program Methods 0.000 title claims description 6
- 238000001228 spectrum Methods 0.000 claims abstract description 132
- 238000000605 extraction Methods 0.000 claims abstract description 31
- 230000005236 sound signal Effects 0.000 claims abstract description 29
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 12
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 12
- 238000005352 clarification Methods 0.000 claims description 29
- 230000003595 spectral effect Effects 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 12
- 230000007613 environmental effect Effects 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 4
- 230000002708 enhancing effect Effects 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 59
- 230000001965 increasing effect Effects 0.000 abstract description 10
- 230000003044 adaptive effect Effects 0.000 abstract description 7
- 238000000034 method Methods 0.000 description 19
- 238000009499 grossing Methods 0.000 description 13
- 230000006978 adaptation Effects 0.000 description 11
- 230000008447 perception Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 238000007493 shaping process Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 4
- 230000002194 synthesizing effect Effects 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/0332—Details of processing therefor involving modification of waveforms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R27/00—Public address systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/15—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2227/00—Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
- H04R2227/009—Signal processing in [PA] systems to enhance the speech intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】音声明瞭化装置250は、対象とする音声信号254のスペクトルに対して、当該スペクトルのスペクトル包絡の局所的なピークに接する、又はそれらに沿った、スペクトル包絡のピークの概形を表す曲線を抽出する包絡面抽出部292と、該包絡面抽出部292が抽出した曲線に基づいて音声信号254のスペクトルを変形する雑音適応処理部300と、雑音適応処理部300によって変形されたスペクトルに基づいて明瞭化された音声のための変換後音声信号260を生成する正弦波音声合成処理部305とを含む。
【選択図】図7
Description
以下に説明する実施の形態は、音声明瞭化の技術として2つを採用している。1つは、スペクトルの包絡線に基づくスペクトル・シェーピングによる雑音特性への音声の適応技術である。他の1つは雑音中の音声の知覚にさして影響を与えない調波を間引き、間引かれた調波のエネルギを他の重要な成分に再配分する技術である。
スペクトルの包絡線に基づくスペクトル・シェーピングによる音声の明瞭化技術は、以下のようにして音声の明瞭化を行なう。
図2に、音声のスペクトログラム60とその包絡面62との例を示す。図2では、両者を見やすくするために包絡面62を便宜上実際よりも80dB上方に描画している。実際には、両者は、スペクトログラム60のピークが包絡面62に下側から接するような関係にある。なお図2では、周波数軸はバーク尺度周波数で示され、縦軸は対数パワーを示してある。周波数軸にメル尺度やバルク尺度、ERB尺度といった知覚的又は音響心理学的尺度を用いることで、音声の明瞭性を左右する低周波域のスペクトルを重視した包絡面の抽出を行なうことができる。この包絡面62は、既に述べたようにスペクトログラム60の変化に対して比較的緩やかな包絡となるようにとってあり、以下に述べるように特に周波数方向よりも時間軸方法においてその変化が緩やかとなっている。
式(1)(2)及び(3)のLu,vには本実施の形態では次式を用いる。
包絡面を雑音に対して適応化するためには、雑音スペクトルを得る必要がある。本実施の形態では、マイクにより周囲の雑音を収集し、そのパワースペクトル|Yk,m|2を逐次計算し、ローパスフィルタに通す等して時間方向に平滑化したスペクトル ̄Yk,mを得る。本実施の形態では、次式を用いてこの平滑化を行なう。
上記したスペクトル・シェーピングにより、雑音環境下でも音声を明瞭化できる。しかし本実施の形態では、音声の合成時に、音声の明瞭性に対する影響が小さい調波を間引き、間引かれた調波のエネルギを、残された調波に集中することで知覚音量を増大させ、さらなる明瞭性向上をねらう。このとき、残される調波の数は一定数以下に制限する。この目的のため、音声合成には正弦波合成を用いる。
以上の原理に基づく本実施の形態に係る音声明瞭化装置の構成について説明する。図7を参照して、この実施の形態に係る音声明瞭化装置250は、音声合成処理部252により合成された合成音声信号254と、マイク258により集音された周囲の雑音を示す雑音信号256とを入力とし、合成音声信号254を雑音信号256に対して適応化することにより、合成音声信号254による音声よりも明瞭な変換後音声信号260を出力するためのものである。
音声明瞭化装置250は以下のように動作する。音声合成処理部252は図示しない音声発生の指示を受けて音声合成を行ない、合成音声信号254を出力しスペクトログラム抽出部290に与える。スペクトログラム抽出部290は、この合成音声信号254からスペクトログラムを抽出し包絡面抽出部292と雑音適応処理部300とに与える。包絡面抽出部292は、スペクトログラム抽出部290から与えられたスペクトログラムからその包絡面を抽出し雑音適応処理部300に与える。
上記した音声明瞭化装置250は、実質的には、コンピュータハードウェアと、コンピュータハードウェアと協働するコンピュータプログラムとにより実現できる。ここで、包絡面抽出部292、雑音適応処理部300を実現するプログラムは、それぞれ1.1.1〜1.1.2、及び1.1.3に説明した処理を実行するものを利用できる。
図8は、上記した音声明瞭化装置250を実現するコンピュータシステム330の内部構成を示す。
32、132 音声信号
34 変換音声信号
40 フィルタリング部
42 ダイナミックレンジ圧縮処理部
60 スペクトログラム
62 包絡面
70、80 スペクトル(スペクトログラム)
72、92、102、136、134 包絡線
130 雑音信号
256 雑音信号
258 マイク
260 変換後音声信号
290 スペクトログラム抽出部
296 パワースペクトル計算処理部
292 包絡面抽出部
298 平滑化処理部
300 雑音適応処理部
302 調波間引き処理部
304 パワー再配分処理部
305 正弦波音声合成処理部
330 コンピュータシステム
340 コンピュータ
344 スピーカ
Claims (6)
- 明瞭な音声を生成する音声明瞭化装置であって、
対象とする音声信号のスペクトルに対して、当該スペクトルのスペクトル包絡の複数個の局所的なピークに沿った曲線で表されるピーク概形を抽出するピーク概形抽出手段と、
該ピーク概形抽出手段が抽出したピーク概形に基づいて前記音声信号のスペクトルを変形するスペクトル変形手段と、
該スペクトル変形手段によって変形されたスペクトルに基づいて音声を生成する音声合成手段とを含む音声明瞭化装置。 - 前記ピーク概形抽出手段は、対象とする音声信号のスペクトログラムに対して、時間・周波数領域において当該スペクトログラムの包絡の複数個の局所的なピークに沿った曲面を抽出し、抽出した曲面から各時刻における前記ピーク概形を得ることを特徴とする、請求項1に記載の音声明瞭化装置。
- 前記ピーク概形抽出手段は、周波数の知覚的又は音響心理学的な尺度に基づいて前記ピーク概形を抽出することを特徴とする、請求項1または2に記載の音声明瞭化装置。
- 前記スペクトル変形手段は、前記ピーク概形抽出手段が抽出した前記ピーク概形に基づいて、前記音声信号のスペクトルのピークを強調するスペクトルピーク強調手段を含むことを特徴とする、請求項1に記載の音声明瞭化装置。
- 前記スペクトル変形手段は、
音声を送出する環境又はその類似環境で集音した環境音に対してそのスペクトルを抽出する環境音スペクトル抽出手段と、
前記ピーク概形抽出手段が抽出した前記ピーク概形と、前記環境音スペクトル抽出手段が抽出した環境音スペクトルとに基づいて前記音声信号のスペクトルを変形する手段とを含むことを特徴とする請求項1又は4に記載の音声明瞭化装置。 - コンピュータにより実行されると、請求項1〜請求項5のいずれかに記載の全ての手段として当該コンピュータを機能させる、コンピュータプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014038786A JP6386237B2 (ja) | 2014-02-28 | 2014-02-28 | 音声明瞭化装置及びそのためのコンピュータプログラム |
US15/118,687 US9842607B2 (en) | 2014-02-28 | 2015-02-12 | Speech intelligibility improving apparatus and computer program therefor |
EP15755932.9A EP3113183B1 (en) | 2014-02-28 | 2015-02-12 | Speech intelligibility improving apparatus and computer program therefor |
PCT/JP2015/053824 WO2015129465A1 (ja) | 2014-02-28 | 2015-02-12 | 音声明瞭化装置及びそのためのコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014038786A JP6386237B2 (ja) | 2014-02-28 | 2014-02-28 | 音声明瞭化装置及びそのためのコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015161911A true JP2015161911A (ja) | 2015-09-07 |
JP6386237B2 JP6386237B2 (ja) | 2018-09-05 |
Family
ID=54008788
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014038786A Active JP6386237B2 (ja) | 2014-02-28 | 2014-02-28 | 音声明瞭化装置及びそのためのコンピュータプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US9842607B2 (ja) |
EP (1) | EP3113183B1 (ja) |
JP (1) | JP6386237B2 (ja) |
WO (1) | WO2015129465A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI622978B (zh) * | 2017-02-08 | 2018-05-01 | 宏碁股份有限公司 | 語音信號處理裝置及語音信號處理方法 |
US10939862B2 (en) | 2017-07-05 | 2021-03-09 | Yusuf Ozgur Cakmak | System for monitoring auditory startle response |
US11883155B2 (en) | 2017-07-05 | 2024-01-30 | Yusuf Ozgur Cakmak | System for monitoring auditory startle response |
US11141089B2 (en) | 2017-07-05 | 2021-10-12 | Yusuf Ozgur Cakmak | System for monitoring auditory startle response |
JP6849978B2 (ja) * | 2017-08-04 | 2021-03-31 | 日本電信電話株式会社 | 音声明瞭度計算方法、音声明瞭度計算装置及び音声明瞭度計算プログラム |
EP3573059B1 (en) * | 2018-05-25 | 2021-03-31 | Dolby Laboratories Licensing Corporation | Dialogue enhancement based on synthesized speech |
US11172294B2 (en) * | 2019-12-27 | 2021-11-09 | Bose Corporation | Audio device with speech-based audio signal processing |
EP4134954B1 (de) * | 2021-08-09 | 2023-08-02 | OPTImic GmbH | Verfahren und vorrichtung zur audiosignalverbesserung |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61286900A (ja) * | 1985-06-14 | 1986-12-17 | ソニー株式会社 | 信号処理装置 |
JPH09244694A (ja) * | 1996-03-05 | 1997-09-19 | Nippon Telegr & Teleph Corp <Ntt> | 声質変換方法 |
JP2010055002A (ja) * | 2008-08-29 | 2010-03-11 | Toshiba Corp | 信号帯域拡張装置 |
US20120265534A1 (en) * | 2009-09-04 | 2012-10-18 | Svox Ag | Speech Enhancement Techniques on the Power Spectrum |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE9415T1 (de) * | 1980-12-09 | 1984-09-15 | The Secretary Of State For Industry In Her Britannic Majesty's Government Of The United Kingdom Of Great Britain And | Spracherkennungssystem. |
US4827516A (en) * | 1985-10-16 | 1989-05-02 | Toppan Printing Co., Ltd. | Method of analyzing input speech and speech analysis apparatus therefor |
FR2715755B1 (fr) * | 1994-01-28 | 1996-04-12 | France Telecom | Procédé et dispositif de reconnaissance de la parole. |
US6993480B1 (en) * | 1998-11-03 | 2006-01-31 | Srs Labs, Inc. | Voice intelligibility enhancement system |
US6904405B2 (en) * | 1999-07-17 | 2005-06-07 | Edwin A. Suominen | Message recognition using shared language model |
JP3770204B2 (ja) * | 2002-05-22 | 2006-04-26 | 株式会社デンソー | 脈波解析装置及び生体状態監視装置 |
EP1850328A1 (en) | 2006-04-26 | 2007-10-31 | Honda Research Institute Europe GmbH | Enhancement and extraction of formants of voice signals |
US20080312916A1 (en) | 2007-06-15 | 2008-12-18 | Mr. Alon Konchitsky | Receiver Intelligibility Enhancement System |
US9336785B2 (en) * | 2008-05-12 | 2016-05-10 | Broadcom Corporation | Compression for speech intelligibility enhancement |
US9117455B2 (en) * | 2011-07-29 | 2015-08-25 | Dts Llc | Adaptive voice intelligibility processor |
-
2014
- 2014-02-28 JP JP2014038786A patent/JP6386237B2/ja active Active
-
2015
- 2015-02-12 WO PCT/JP2015/053824 patent/WO2015129465A1/ja active Application Filing
- 2015-02-12 US US15/118,687 patent/US9842607B2/en not_active Expired - Fee Related
- 2015-02-12 EP EP15755932.9A patent/EP3113183B1/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61286900A (ja) * | 1985-06-14 | 1986-12-17 | ソニー株式会社 | 信号処理装置 |
JPH09244694A (ja) * | 1996-03-05 | 1997-09-19 | Nippon Telegr & Teleph Corp <Ntt> | 声質変換方法 |
JP2010055002A (ja) * | 2008-08-29 | 2010-03-11 | Toshiba Corp | 信号帯域拡張装置 |
US20120265534A1 (en) * | 2009-09-04 | 2012-10-18 | Svox Ag | Speech Enhancement Techniques on the Power Spectrum |
Also Published As
Publication number | Publication date |
---|---|
EP3113183B1 (en) | 2019-07-03 |
US20170047080A1 (en) | 2017-02-16 |
JP6386237B2 (ja) | 2018-09-05 |
EP3113183A1 (en) | 2017-01-04 |
EP3113183A4 (en) | 2017-07-26 |
US9842607B2 (en) | 2017-12-12 |
WO2015129465A1 (ja) | 2015-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6386237B2 (ja) | 音声明瞭化装置及びそのためのコンピュータプログラム | |
Ma et al. | Objective measures for predicting speech intelligibility in noisy conditions based on new band-importance functions | |
RU2552184C2 (ru) | Устройство для расширения полосы частот | |
Li et al. | An auditory-based feature extraction algorithm for robust speaker identification under mismatched conditions | |
JP5666444B2 (ja) | 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法 | |
JP5127754B2 (ja) | 信号処理装置 | |
US8359195B2 (en) | Method and apparatus for processing audio and speech signals | |
Kim et al. | Nonlinear enhancement of onset for robust speech recognition. | |
US10636433B2 (en) | Speech processing system for enhancing speech to be outputted in a noisy environment | |
US20210193149A1 (en) | Method, apparatus and device for voiceprint recognition, and medium | |
TW201308316A (zh) | 適應性聲音清晰度處理器 | |
JP2007523374A (ja) | 自動音声認識器のためのトレーニングデータを生成する方法およびシステム | |
US10176824B2 (en) | Method and system for consonant-vowel ratio modification for improving speech perception | |
Alam et al. | Robust feature extraction based on an asymmetric level-dependent auditory filterbank and a subband spectrum enhancement technique | |
Ngo et al. | Increasing speech intelligibility and naturalness in noise based on concepts of modulation spectrum and modulation transfer function | |
JP2012181561A (ja) | 信号処理装置 | |
Kaur et al. | Optimizing feature extraction techniques constituting phone based modelling on connected words for Punjabi automatic speech recognition | |
CN114333874B (zh) | 处理音频信号的方法 | |
JP3916834B2 (ja) | 雑音が付加された周期波形の基本周期あるいは基本周波数の抽出方法 | |
Nasreen et al. | Speech analysis for automatic speech recognition | |
Wu et al. | Robust target feature extraction based on modified cochlear filter analysis model | |
Zheng et al. | Bandwidth extension WaveNet for bone-conducted speech enhancement | |
JPH07146700A (ja) | ピッチ強調方法および装置ならびに聴力補償装置 | |
JP2013117556A (ja) | 韻律変換装置およびそのプログラム | |
CN112908351A (zh) | 一种音频变调方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180417 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180508 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180731 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180809 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6386237 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |