JP6849978B2 - 音声明瞭度計算方法、音声明瞭度計算装置及び音声明瞭度計算プログラム - Google Patents
音声明瞭度計算方法、音声明瞭度計算装置及び音声明瞭度計算プログラム Download PDFInfo
- Publication number
- JP6849978B2 JP6849978B2 JP2019534607A JP2019534607A JP6849978B2 JP 6849978 B2 JP6849978 B2 JP 6849978B2 JP 2019534607 A JP2019534607 A JP 2019534607A JP 2019534607 A JP2019534607 A JP 2019534607A JP 6849978 B2 JP6849978 B2 JP 6849978B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- feature amount
- intelligibility
- signal
- clean
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004364 calculation method Methods 0.000 title claims description 143
- 238000000034 method Methods 0.000 claims description 58
- 238000001228 spectrum Methods 0.000 claims description 50
- 230000002123 temporal effect Effects 0.000 claims description 41
- 230000008569 process Effects 0.000 claims description 28
- 238000000605 extraction Methods 0.000 claims description 26
- 238000011156 evaluation Methods 0.000 claims description 19
- 230000006835 compression Effects 0.000 claims description 16
- 238000007906 compression Methods 0.000 claims description 16
- 239000000284 extract Substances 0.000 claims description 5
- 238000012545 processing Methods 0.000 description 41
- 238000002474 experimental method Methods 0.000 description 21
- 238000012986 modification Methods 0.000 description 17
- 230000004048 modification Effects 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 230000001629 suppression Effects 0.000 description 12
- 230000035945 sensitivity Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 208000032041 Hearing impaired Diseases 0.000 description 6
- 238000003672 processing method Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000011410 subtraction method Methods 0.000 description 2
- 206010011878 Deafness Diseases 0.000 description 1
- 241001074085 Scophthalmus aquosus Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004870 electrical engineering Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Description
本発明の実施の形態について説明する。本発明の実施の形態では、GEDI手法を採用したGEDI音声明瞭度計算装置について説明する。
次に、GEDI音声明瞭度計算装置12について説明する。図2は、図1に示すGEDI音声明瞭度計算装置12の機能を模式的に示す図である。
次に、図2に示すGEDI音声明瞭度計算装置12の処理について説明する。図3は、実施の形態に係る音声明瞭度計算処理の処理手順を示すフローチャートである。
本実施の形態に示す手法を用いた聴取実験を行った。評価は、スペクトル減算法(SS)とウィナーフィルタ型の雑音抑圧処理手法(WF)とを用いた。音声試料として、親密度別単語了解度試験用音声データセット(FW07)に収録されている男性話者(mis)の4モーラ単語音声を使用した。音声試料に重畳する雑音としてピンク雑音を使用し、信号対雑音比(Signal-to-Noise Ratio:SNR)を−6dBから3dBの間で3dB毎に変化させた。この雑音重畳音声を原音声として(以降において「Unprocessed」という。)、上記の音声強調処理を行った。提示される音声刺激の総数は、5種類の条件(Unprocessed、SS(1,0)、WF(0,0) PSM、WF(0,1) PSM、WF(0,2) PSM)及び4種類のSNR(−6,−3,0,3dB)から構成される計400個とした。
このように、本実施の形態に係るGEDI音声明瞭度計算装置では、クリーン音声の時間的な振幅包絡信号と強調音声の時間的な振幅包絡信号の差分から、強調音声に含まれる歪み成分(eD)を推定し、歪み成分とクリーン音声の特徴量を用いて音声品質客観評価指標である音声明瞭度を計算する基となるSDRenvを計算する。
次に、実施の形態の変形例1について説明する。本変形例1では、SDRenvの計算方法の他の例について説明する。
次に、実施の形態の変形例2について説明する。本変形例2は、雑音が非定常な場合に、より頑健な音声明瞭度推定方法を与える。図5は、実施の形態の変形例2に係るGEDI音声明瞭度計算装置の機能を模式的に示す図である。
次に、図5に示すGEDI音声明瞭度計算装置12Aの処理について説明する。図6は、実施の形態の変形例2に係る音声明瞭度計算処理の処理手順を示すフローチャートである。
図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部又は任意の一部が、CPU及び当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
図7は、プログラムが実行されることにより、GEDI音声明瞭度計算装置12が実現されるコンピュータの一例を示す図である。コンピュータ1000は、例えば、メモリ1010、CPU1020を有する。また、コンピュータ1000は、ハードディスクドライブインタフェース1030、ディスクドライブインタフェース1040、シリアルポートインタフェース1050、ビデオアダプタ1060、ネットワークインタフェース1070を有する。これらの各部は、バス1080によって接続される。
12,12A GEDI音声明瞭度計算装置
12P 音声明瞭度計算装置
121 動的圧縮型ガンマチャープフィルタバンク
122 振幅包絡信号抽出部
123 歪み信号抽出部
124 変調スペクトル計算部
125,125A 変調フィルタバンク
126,126A SDRenv計算部
127 感度指標変換部
128 音声明瞭度変換部
129 音声明瞭度出力部
Claims (15)
- 音声明瞭度計算装置が実行する音声明瞭度計算方法であって、
複数のフィルタバンクを用いて、入力されたクリーン音声の特徴量と強調音声の特徴量とを求め、求めたクリーン音声の特徴量と強調音声の特徴量との差分成分を基に、音声品質の客観評価指標である音声明瞭度を計算する音声明瞭度計算工程と、
前記音声明瞭度計算工程において計算された前記音声明瞭度を出力する工程と、
を含み、
前記音声明瞭度計算工程は、
前記クリーン音声の特徴量と前記強調音声の特徴量との時間的な振幅包絡信号の差分を基に、時間的な歪み信号を求める工程と、
前記歪み信号と前記クリーン音声の時間的な振幅包絡信号とを基に、前記差分成分として、前記クリーン音声と前記歪み信号との信号対歪み比(Signal-to-Distortion Ratio:SDR)を計算する工程と、
を含んだことを特徴とする音声明瞭度計算方法。 - 音声明瞭度計算装置が実行する音声明瞭度計算方法であって、
複数のフィルタバンクを用いて、入力されたクリーン音声の特徴量と強調音声の特徴量とを求め、求めたクリーン音声の特徴量と強調音声の特徴量との差分成分を基に、音声品質の客観評価指標である音声明瞭度を計算する音声明瞭度計算工程と、
前記音声明瞭度計算工程において計算された前記音声明瞭度を出力する工程と、
を含み、
前記音声明瞭度計算工程は、
前記クリーン音声の特徴量と前記強調音声の特徴量とを基に、時間的な歪み信号を求める工程と、
前記歪み信号から得た変調パワースペクトルと前記クリーン音声から得た変調パワースペクトルとを基に、前記差分成分として、前記クリーン音声と前記歪み信号との信号対歪み比(SDR)を計算する工程と、
を含んだことを特徴とする音声明瞭度計算方法。 - 音声明瞭度計算装置が実行する音声明瞭度計算方法であって、
複数のフィルタバンクを用いて、入力されたクリーン音声の特徴量と強調音声の特徴量とを求め、求めたクリーン音声の特徴量と強調音声の特徴量との差分成分を基に、音声品質の客観評価指標である音声明瞭度を計算する音声明瞭度計算工程と、
前記音声明瞭度計算工程において計算された前記音声明瞭度を出力する工程と、
を含み、
前記音声明瞭度計算工程は、
第1のフィルタバンクに基づく前記クリーン音声の特徴量と前記強調音声の特徴量との時間的な振幅包絡信号の差分を基に時間的な歪み信号を抽出する工程と、
前記クリーン音声の時間的な振幅包絡信号、前記強調音声の時間的な振幅包絡信号および前記時間的な歪み信号を基に、第2のフィルタバンクを用いて前記クリーン音声に対応する変調パワースペクトルと前記歪み信号に対応する変調パワースペクトルとを計算する工程と、
前記クリーン音声に対応する変調パワースペクトルと前記歪み信号に対応する変調パワースペクトルとを基に、前記差分成分として、前記クリーン音声と前記歪み信号との信号対歪み比(SDR)を計算する工程と、
を含んだことを特徴とする音声明瞭度計算方法。 - 音声明瞭度計算装置が実行する音声明瞭度計算方法であって、
複数のフィルタバンクを用いて、入力されたクリーン音声の特徴量と強調音声の特徴量とを求め、求めたクリーン音声の特徴量と強調音声の特徴量との差分成分を基に、音声品質の客観評価指標である音声明瞭度を計算する音声明瞭度計算工程と、
前記音声明瞭度計算工程において計算された前記音声明瞭度を出力する工程と、
を含み、
前記音声明瞭度計算工程は、
第1のフィルタバンクに基づく前記クリーン音声の特徴量と前記強調音声の特徴量との時間的な振幅包絡信号の差分を基に時間的な歪み信号を抽出する工程と、
前記クリーン音声の時間的な振幅包絡信号および前記時間的な歪み信号にフーリエ変換を適用することにより、それぞれに対応する変調パワースペクトルを計算する工程と、
前記クリーン音声の変調パワースペクトルと前記歪み信号の変調パワースペクトルとに第2のフィルタバンクで重み付けを行う工程と、
前記差分成分として、重み付けされた前記クリーン音声と前記歪み信号との信号対歪み比(SDR)を計算する工程と、
を含んだことを特徴とする音声明瞭度計算方法。 - 前記第1のフィルタバンクが出力した振幅包絡の情報を用いて、前記クリーン音声の特徴量と前記強調音声の特徴量との時間的な振幅包絡信号を計算する工程をさらに含んだことを特徴とする請求項3または4に記載の音声明瞭度計算方法。
- 前記第1のフィルタバンクは、動的圧縮型ガンマチャープフィルタバンクであることを特徴とする請求項3〜5のいずれか一つに記載の音声明瞭度計算方法。
- 前記第2のフィルタバンクは、変調周波数領域のバンドパスフィルタバンクであることを特徴とする請求項3〜5のいずれか一つに記載の音声明瞭度計算方法。
- 複数のフィルタバンクを用いて、入力されたクリーン音声の特徴量と強調音声の特徴量とを求め、求めたクリーン音声の特徴量と強調音声の特徴量との差分成分を基に、音声品質の客観評価指標である音声明瞭度を計算する音声明瞭度計算部と、
前記音声明瞭度計算部が計算した前記音声明瞭度を出力する出力部と、
を有し、
前記音声明瞭度計算部は、
前記クリーン音声の特徴量と前記強調音声の特徴量との時間的な振幅包絡信号の差分を基に、時間的な歪み信号を求める歪み信号抽出部と、
前記歪み信号と前記クリーン音声の時間的な振幅包絡信号とを基に、前記差分成分として、前記クリーン音声と前記歪み信号との信号対歪み比(SDR)を計算するSDR env 計算部と、
を有することを特徴とする音声明瞭度計算装置。 - 複数のフィルタバンクを用いて、入力されたクリーン音声の特徴量と強調音声の特徴量とを求め、求めたクリーン音声の特徴量と強調音声の特徴量との差分成分を基に、音声品質の客観評価指標である音声明瞭度を計算する音声明瞭度計算部と、
前記音声明瞭度計算部が計算した前記音声明瞭度を出力する出力部と、
を有し、
前記音声明瞭度計算部は、
前記クリーン音声の特徴量と前記強調音声の特徴量とを基に、時間的な歪み信号を求める歪み信号抽出部と、
前記歪み信号から得た変調パワースペクトルと前記クリーン音声から得た変調パワースペクトルとを基に、前記差分成分として、前記クリーン音声と前記歪み信号との信号対歪み比(SDR)を計算するSDR env 計算部と、
を有することを特徴とする音声明瞭度計算装置。 - 複数のフィルタバンクを用いて、入力されたクリーン音声の特徴量と強調音声の特徴量とを求め、求めたクリーン音声の特徴量と強調音声の特徴量との差分成分を基に、音声品質の客観評価指標である音声明瞭度を計算する音声明瞭度計算部と、
前記音声明瞭度計算部が計算した前記音声明瞭度を出力する出力部と、
を有し、
前記音声明瞭度計算部は、
第1のフィルタバンクに基づく前記クリーン音声の特徴量と前記強調音声の特徴量との時間的な振幅包絡信号の差分を基に時間的な歪み信号を抽出する歪み信号抽出部と、
前記クリーン音声の時間的な振幅包絡信号、前記強調音声の時間的な振幅包絡信号および前記時間的な歪み信号を基に、前記クリーン音声に対応する変調パワースペクトルと前記歪み信号に対応する変調パワースペクトルとを計算する第2のフィルタバンクと、
前記クリーン音声に対応する変調パワースペクトルと前記歪み信号に対応する変調パワースペクトルとを基に、前記差分成分として、前記クリーン音声と前記歪み信号とのSDRを計算するSDR env 計算部と、
を有することを特徴とする音声明瞭度計算装置。 - 複数のフィルタバンクを用いて、入力されたクリーン音声の特徴量と強調音声の特徴量とを求め、求めたクリーン音声の特徴量と強調音声の特徴量との差分成分を基に、音声品質の客観評価指標である音声明瞭度を計算する音声明瞭度計算部と、
前記音声明瞭度計算部が計算した前記音声明瞭度を出力する出力部と、
を有し、
前記音声明瞭度計算部は、
第1のフィルタバンクに基づく前記クリーン音声の特徴量と前記強調音声の特徴量との時間的な振幅包絡信号を基に、前記強調音声に含まれる歪み信号を抽出する歪み信号抽出部と、
前記クリーン音声と前記強調音声との前記時間的な振幅包絡信号と、前記歪み信号とを用いて前記クリーン音声と前記歪み信号とに重み付けを行う第2のフィルタバンクと、
前記特徴量の差分成分として、重み付けされた前記クリーン音声と前記歪み信号との信号対歪み比(SDR)を計算するSDR env 計算部と、
を有することを特徴とする音声明瞭度計算装置。 - 前記第1のフィルタバンクが出力した振幅包絡の情報を用いて、前記クリーン音声の特徴量と前記強調音声の特徴量との時間的な振幅包絡信号を計算する振幅包絡信号抽出部をさらに有することを特徴とする請求項10または11に記載の音声明瞭度計算装置。
- 前記第1のフィルタバンクは、動的圧縮型ガンマチャープフィルタバンクであることを特徴とする請求項10〜12のいずれか一つに記載の音声明瞭度計算装置。
- 前記第2のフィルタバンクは、変調周波数領域のバンドパスフィルタバンクであることを特徴とする請求項10〜12のいずれか一つに記載の音声明瞭度計算装置。
- コンピュータを、請求項8〜14のいずれか一つに記載の音声明瞭度計算装置として機能させるための音声明瞭度計算プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017151370 | 2017-08-04 | ||
JP2017151370 | 2017-08-04 | ||
PCT/JP2018/029317 WO2019027053A1 (ja) | 2017-08-04 | 2018-08-03 | 音声明瞭度計算方法、音声明瞭度計算装置及び音声明瞭度計算プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019027053A1 JPWO2019027053A1 (ja) | 2020-07-09 |
JP6849978B2 true JP6849978B2 (ja) | 2021-03-31 |
Family
ID=65233188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019534607A Active JP6849978B2 (ja) | 2017-08-04 | 2018-08-03 | 音声明瞭度計算方法、音声明瞭度計算装置及び音声明瞭度計算プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11462228B2 (ja) |
JP (1) | JP6849978B2 (ja) |
WO (1) | WO2019027053A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230282226A1 (en) * | 2020-08-04 | 2023-09-07 | Sony Group Corporation | Signal processing device and method, and program |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006133431A2 (en) * | 2005-06-08 | 2006-12-14 | The Regents Of The University Of California | Methods, devices and systems using signal processing algorithms to improve speech intelligibility and listening comfort |
EP2708040B1 (en) * | 2011-05-11 | 2019-03-27 | Robert Bosch GmbH | System and method for emitting and especially controlling an audio signal in an environment using an objective intelligibility measure |
JP6386237B2 (ja) * | 2014-02-28 | 2018-09-05 | 国立研究開発法人情報通信研究機構 | 音声明瞭化装置及びそのためのコンピュータプログラム |
EP3220661B1 (en) * | 2016-03-15 | 2019-11-20 | Oticon A/s | A method for predicting the intelligibility of noisy and/or enhanced speech and a binaural hearing system |
-
2018
- 2018-08-03 JP JP2019534607A patent/JP6849978B2/ja active Active
- 2018-08-03 WO PCT/JP2018/029317 patent/WO2019027053A1/ja active Application Filing
- 2018-08-03 US US16/636,032 patent/US11462228B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US11462228B2 (en) | 2022-10-04 |
WO2019027053A1 (ja) | 2019-02-07 |
US20210375300A1 (en) | 2021-12-02 |
JPWO2019027053A1 (ja) | 2020-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Reddy et al. | An individualized super-Gaussian single microphone speech enhancement for hearing aid users with smartphone as an assistive device | |
Schädler et al. | Matrix sentence intelligibility prediction using an automatic speech recognition system | |
JP5665977B2 (ja) | 試験音声信号の雑音を除去する結果として試験雑音除去音声信号内で減衰したスペクトル成分を復元するための方法 | |
Tsao et al. | Generalized maximum a posteriori spectral amplitude estimation for speech enhancement | |
JP5542206B2 (ja) | オーディオ・システムの知覚品質を判定する方法およびシステム | |
US20210193149A1 (en) | Method, apparatus and device for voiceprint recognition, and medium | |
Schwerin et al. | An improved speech transmission index for intelligibility prediction | |
Kressner et al. | Evaluating the generalization of the hearing aid speech quality index (HASQI) | |
Kumar | Comparative performance evaluation of MMSE-based speech enhancement techniques through simulation and real-time implementation | |
Saeidi et al. | Feature extraction using power-law adjusted linear prediction with application to speaker recognition under severe vocal effort mismatch | |
Harlander et al. | Sound quality assessment using auditory models | |
Taal et al. | A low-complexity spectro-temporal distortion measure for audio processing applications | |
Yamamoto et al. | GEDI: Gammachirp envelope distortion index for predicting intelligibility of enhanced speech | |
Chennupati et al. | Significance of phase in single frequency filtering outputs of speech signals | |
Islam et al. | Supervised single channel speech enhancement based on stationary wavelet transforms and non-negative matrix factorization with concatenated framing process and subband smooth ratio mask | |
Mourad | Speech enhancement based on stationary bionic wavelet transform and maximum a posterior estimator of magnitude-squared spectrum | |
TWI767696B (zh) | 自我語音抑制裝置及方法 | |
JP6849978B2 (ja) | 音声明瞭度計算方法、音声明瞭度計算装置及び音声明瞭度計算プログラム | |
Gomez et al. | Improving objective intelligibility prediction by combining correlation and coherence based methods with a measure based on the negative distortion ratio | |
JPWO2007094463A1 (ja) | 信号歪み除去装置、方法、プログラム及びそのプログラムを記録した記録媒体 | |
Nguyen et al. | Improvement in bone-conducted speech restoration using linear prediction and long short-term memory model | |
EP4177885A1 (en) | Quantifying signal purity by means of machine learning | |
Bogdanova et al. | Objective quality evaluation of speech band-limited signals | |
Wakabayashi | Speech enhancement using harmonic-structure-based phase reconstruction | |
Shankar et al. | Real-time single-channel deep neural network-based speech enhancement on edge devices |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200117 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20200117 |
|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20200117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210224 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210225 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6849978 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |