JP2008070564A - 音声強調装置、音声登録装置、音声強調プログラム、音声登録プログラム、音声強調方法および音声登録方法 - Google Patents
音声強調装置、音声登録装置、音声強調プログラム、音声登録プログラム、音声強調方法および音声登録方法 Download PDFInfo
- Publication number
- JP2008070564A JP2008070564A JP2006248587A JP2006248587A JP2008070564A JP 2008070564 A JP2008070564 A JP 2008070564A JP 2006248587 A JP2006248587 A JP 2006248587A JP 2006248587 A JP2006248587 A JP 2006248587A JP 2008070564 A JP2008070564 A JP 2008070564A
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- speech
- waveform
- data
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 125
- 238000012937 correction Methods 0.000 claims abstract description 100
- 238000004364 calculation method Methods 0.000 claims description 57
- 238000013500 data storage Methods 0.000 claims description 55
- 238000001514 detection method Methods 0.000 claims description 43
- 238000012545 processing Methods 0.000 claims description 38
- 230000000737 periodic effect Effects 0.000 claims description 28
- 238000005259 measurement Methods 0.000 claims description 11
- 238000005273 aeration Methods 0.000 claims description 6
- 230000002194 synthesizing effect Effects 0.000 claims description 5
- 238000000926 separation method Methods 0.000 claims description 4
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 238000003786 synthesis reaction Methods 0.000 claims description 3
- 230000002496 gastric effect Effects 0.000 claims description 2
- 230000002950 deficient Effects 0.000 abstract 2
- 238000002372 labelling Methods 0.000 description 10
- 230000000241 respiratory effect Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 210000003041 ligament Anatomy 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 241000255925 Diptera Species 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 235000002639 sodium chloride Nutrition 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
- G10L21/057—Time compression or expansion for improving intelligibility
- G10L2021/0575—Aids for the handicapped in speaking
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electrophonic Musical Instruments (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Recording Or Reproducing By Magnetic Means (AREA)
Abstract
【解決手段】本発明の音声強調装置は、子音や無声母音が不明瞭であったり、耳障りであったりする音声を入力として、該音声強調装置において、音声を音素に分解し、各音素を無声破裂音、有声破裂音、無声摩擦音、有声摩擦音、破擦音、無声母音のいずれかに分類し、各音素の修正の必要性の判定に応じて各音素を修正することによって、子音や無声母音が明瞭で、耳障りのないクリアな音声の出力が得られるようにした。
【選択図】 図1
Description
前記音声データを音素に分解する音素境界情報とともに入力された該音声データの波形特徴量を該音素毎に算出する波形特徴量算出手段と、
前記波形特徴量算出手段によって算出された前記波形特徴量に基づいて前記音素毎に前記音声データの修正の必要性を判定する修正判定手段と、
前記修正判定手段によって修正の必要性があると判定された前記音素毎の音声データを、音素別波形データ記憶手段に予め記憶されている波形データを用いて修正する波形修正手段と
を備えたことを特徴とする音声強調装置。
前記波形特徴量算出手段は、前記有声/無声境界情報出力手段によって出力された前記有声/無声境界情報とともに入力された前記音声データの波形特徴量を前記音素毎に算出することを特徴とする付記1に記載の音声強調装置。
前記波形特徴量算出手段は、前記音素識別情報出力手段によって出力された前記音素識別情報の境界情報とともに入力された前記音声データの波形特徴量を前記音素毎に算出することを特徴とする付記1に記載の音声強調装置。
前記入力された音声データを、前記音素境界情報に基づいて前記音素に分割する音声データ分割手段と、
前記音声データ分割手段によって分割された前記音素に基づいて該音素の振幅値、振幅変動率および周期性波形の有無を測定する振幅変動測定手段と、
前記振幅変動測定手段によって測定された前記振幅値および前記振幅変動率と、前記音声データ分割手段によって分割された前記音素とに基づいて該音素の破裂部および帯気部を検出する破裂部/帯気部検出手段と、
前記破裂部/帯気部検出手段による検出結果と、前記振幅変動測定手段によって測定された前記振幅値、前記振幅変動率および前記周期性波形の有無とに基づいて前記音素の音素種別を分類する音素分類手段と、
前記音素分類手段によって分類された前記音素それぞれに特徴量を算出する音素別特徴量算出手段と
をさらに備えたことを特徴とする付記2または3に記載の音声強調装置。
前記修正判定手段は、前記波形特徴量算出手段によって算出された前記波形特徴量とともに、前記音素環境検出手段による検出結果に基づいて前記音素毎に前記音声データの修正の必要性を判定することを特徴とする付記4、5または6に記載の音声強調装置。
前記入力された音声データと、該音声データのテキストデータを言語処理することによって出力された音素列とに基づいて該音声データに音素識別情報を付与し、該音素識別情報の境界を判定して該音素識別情報の境界情報を前記音素境界情報として出力する音素識別情報出力手段と、
前記音素識別情報出力手段によって出力された前記音素識別情報の境界情報とともに入力された前記音声データの波形特徴量を該音素毎に算出する波形特徴量算出手段と、
前記波形特徴量算出手段によって算出された前記波形特徴量に基づいて前記音声データが所定条件を充足するか否かを前記音素毎に判定する条件充足性判定手段と、
前記条件充足性判定手段によって前記所定条件を充足すると判定された前記音素毎の音声データを、前記音素別波形データ記憶手段に登録する音素別波形データ登録手段と
を備えたことを特徴とする音声登録装置。
前記音声データを音素に分解する音素境界情報とともに入力された該音声データの波形特徴量を該音素毎に算出する波形特徴量算出手順と、
前記波形特徴量算出手順によって算出された前記波形特徴量に基づいて前記音素毎に前記音声データの修正の必要性を判定する修正判定手順と、
前記修正判定手順によって修正の必要性があると判定された前記音素毎の音声データを、音素別波形データ記憶手順に予め記憶されている波形データを用いて修正する波形修正手順と
を前記コンピュータ・システムに実行させることを特徴とする音声強調プログラム。
前記波形特徴量算出手順は、前記有声/無声境界情報出力手順によって出力された前記有声/無声境界情報とともに入力された前記音声データの波形特徴量を前記音素毎に算出することを特徴とする付記10に記載の音声強調プログラム。
前記波形特徴量算出手順は、前記音素識別情報出力手順によって出力された前記音素識別情報の境界情報とともに入力された前記音声データの波形特徴量を前記音素毎に算出することを特徴とする付記10に記載の音声強調プログラム。
前記入力された音声データを、前記音素境界情報に基づいて前記音素に分割する音声データ分割手順と、
前記音声データ分割手順によって分割された前記音素に基づいて該音素の振幅値、振幅変動率および周期性波形の有無を測定する振幅変動測定手順と、
前記振幅変動測定手順によって測定された前記振幅値および前記振幅変動率と、前記音声データ分割手順によって分割された前記音素とに基づいて該音素の破裂部および帯気部を検出する破裂部/帯気部検出手順と、
前記破裂部/帯気部検出手順による検出結果と、前記振幅変動測定手順によって測定された前記振幅値、前記振幅変動率および前記周期性波形とに基づいて前記音素の音素種別を分類する音素分類手順と、
前記音素分類手順によって分類された前記音素それぞれに特徴量を算出する音素別特徴量算出手順と
をさらに含んだことを特徴とする付記11または12に記載の音声強調プログラム。
前記修正判定手順は、前記波形特徴量算出手順によって算出された前記波形特徴量とともに、前記音素環境検出手順による検出結果に基づいて前記音素毎に前記音声データの修正の必要性を判定することを特徴とする付記13、14または15に記載の音声強調プログラム。
コンピュータ・システムに実行させる音声登録プログラムであって、
前記入力された音声データと、該音声データのテキストデータを言語処理することによって出力された音素列とに基づいて該音声データに音素識別情報を付与し、該音素識別情報の境界を判定して該音素識別情報の境界情報を前記音素境界情報として出力する音素識別情報出力手順と、
前記音素識別情報出力手順によって出力された前記音素識別情報の境界情報とともに入力された前記音声データの波形特徴量を該音素毎に算出する波形特徴量算出手順と、
前記波形特徴量算出手順によって算出された前記波形特徴量に基づいて前記音声データが所定条件を充足するか否かを前記音素毎に判定する条件充足性判定手順と、
前記条件充足性判定手順によって前記所定条件を充足すると判定された前記音素毎の音声データを、前記音素別波形データ記憶手順に登録する音素別波形データ登録手順と
を前記コンピュータ・システムに実行させることを特徴とする音声登録プログラム。
前記音声データを音素に分解する音素境界情報とともに入力された該音声データの波形特徴量を該音素毎に算出する波形特徴量算出工程と、
前記波形特徴量算出工程によって算出された前記波形特徴量に基づいて前記音素毎に前記音声データの修正の必要性を判定する修正判定工程と、
前記修正判定工程によって修正の必要性があると判定された前記音素毎の音声データを、音素別波形データ記憶工程に予め記憶されている波形データを用いて修正する波形修正工程と
を含んだことを特徴とする音声強調方法。
前記入力された音声データと、該音声データのテキストデータを言語処理することによって出力された音素列とに基づいて該音声データに音素識別情報を付与し、該音素識別情報の境界を判定して該音素識別情報の境界情報を前記音素境界情報として出力する音素識別情報出力工程と、
前記音素識別情報出力工程によって出力された前記音素識別情報の境界情報とともに入力された前記音声データの波形特徴量を該音素毎に算出する波形特徴量算出工程と、
前記波形特徴量算出工程によって算出された前記波形特徴量に基づいて前記音声データが所定条件を充足するか否かを前記音素毎に判定する条件充足性判定工程と、
前記条件充足性判定工程によって前記所定条件を充足すると判定された前記音素毎の音声データを、前記音素別波形データ記憶工程に登録する音素別波形データ登録工程と
を含んだことを特徴とする音声登録方法。
101 波形特徴量算出部
101a 音素分割部
101b 振幅変動測定部
101c 破裂部/帯気部検出部
101d 音素分類部
101e 音素別特徴量算出部
101f 音素環境検出部
102 修正判定部
102a 音素別データ分配部
102b 無声破裂音判定部
102c 有声破裂音判定部
102d 無声摩擦音判定部
102e 有声摩擦音判定部
102f 破擦音判定部
102g 周期性波形判定部
103 有声/無声判定部
104 波形修正部
105 音素別波形データ格納部
106 波形生成部
107 言語処理部
108 音素ラベリング部
200 音声登録装置
201 波形特徴量算出部
201a 音素分割部
201b 振幅変動測定部
201c 破裂部/帯気部検出部
201d 音素分類部
201e 音素別特徴量算出部
201f 音素環境検出部
202 登録判定部
202a 音素別データ分配部
202b 無声破裂音判定部
202c 有声破裂音判定部
202d 無声摩擦音判定部
202e 有声摩擦音判定部
202f 破擦音判定部
202g 周期性波形判定部
204 波形登録部
205 音素別波形データ格納部
207 言語処理部
208 音素ラベリング部
Claims (10)
- 入力された音声データの不明瞭部分を修正して出力する音声強調装置であって、
前記音声データを音素に分解する音素境界情報とともに入力された該音声データの波形特徴量を該音素毎に算出する波形特徴量算出手段と、
前記波形特徴量算出手段によって算出された前記波形特徴量に基づいて前記音素毎に前記音声データの修正の必要性を判定する修正判定手段と、
前記修正判定手段によって修正の必要性があると判定された前記音素毎の音声データを、音素別波形データ記憶手段に予め記憶されている波形データを用いて修正する波形修正手段と
を備えたことを特徴とする音声強調装置。 - 前記音声データの有声/無声の区切りを判定して有声/無声境界情報を前記音素境界情報として出力する有声/無声境界情報出力手段をさらに備え、
前記波形特徴量算出手段は、前記有声/無声境界情報出力手段によって出力された前記有声/無声境界情報とともに入力された前記音声データの波形特徴量を前記音素毎に算出することを特徴とする請求項1に記載の音声強調装置。 - 前記入力された音声データと、該音声データのテキストデータを言語処理することによって出力された音素列とに基づいて該音声データに音素識別情報を付与し、該音素識別情報の境界を判定して該音素識別情報の境界情報を前記音素境界情報として出力する音素識別情報出力手段をさらに備え、
前記波形特徴量算出手段は、前記音素識別情報出力手段によって出力された前記音素識別情報の境界情報とともに入力された前記音声データの波形特徴量を前記音素毎に算出することを特徴とする請求項1に記載の音声強調装置。 - 前記波形特徴量算出手段は、
前記入力された音声データを、前記音素境界情報に基づいて前記音素に分割する音声データ分割手段と、
前記音声データ分割手段によって分割された前記音素に基づいて該音素の振幅値、振幅変動率および周期性波形の有無を測定する振幅変動測定手段と、
前記振幅変動測定手段によって測定された前記振幅値および前記振幅変動率と、前記音声データ分割手段によって分割された前記音素とに基づいて該音素の破裂部および帯気部を検出する破裂部/帯気部検出手段と、
前記破裂部/帯気部検出手段による検出結果と、前記振幅変動測定手段によって測定された前記振幅値、前記振幅変動率および前記周期性波形の有無とに基づいて前記音素の音素種別を分類する音素分類手段と、
前記音素分類手段によって分類された前記音素それぞれに特徴量を算出する音素別特徴量算出手段と
をさらに備えたことを特徴とする請求項2または3に記載の音声強調装置。 - 前記音素境界情報と、前記修正判定手段による判定結果とに基づいて、前記入力された音声データと、前記波形修正手段によって修正された前記音素毎の音声データとを合成した音声データを出力する出力音声データ合成手段をさらに備えたことを特徴とする請求項1〜4のいずれか一つに記載の音声強調装置。
- 入力された音声データを音素別波形データ記憶手段に登録する音声登録装置であって、
前記入力された音声データと、該音声データのテキストデータを言語処理することによって出力された音素列とに基づいて該音声データに音素識別情報を付与し、該音素識別情報の境界を判定して該音素識別情報の境界情報を前記音素境界情報として出力する音素識別情報出力手段と、
前記音素識別情報出力手段によって出力された前記音素識別情報の境界情報とともに入力された前記音声データの波形特徴量を該音素毎に算出する波形特徴量算出手段と、
前記波形特徴量算出手段によって算出された前記波形特徴量に基づいて前記音声データが所定条件を充足するか否かを前記音素毎に判定する条件充足性判定手段と、
前記条件充足性判定手段によって前記所定条件を充足すると判定された前記音素毎の音声データを、前記音素別波形データ記憶手段に登録する音素別波形データ登録手段と
を備えたことを特徴とする音声登録装置。 - 入力された音声データの不明瞭部分を修正して出力する音声強調手順をコンピュータ・システムに実行させる音声強調プログラムであって、
前記音声データを音素に分解する音素境界情報とともに入力された該音声データの波形特徴量を該音素毎に算出する波形特徴量算出手順と、
前記波形特徴量算出手順によって算出された前記波形特徴量に基づいて前記音素毎に前記音声データの修正の必要性を判定する修正判定手順と、
前記修正判定手順によって修正の必要性があると判定された前記音素毎の音声データを、音素別波形データ記憶手順に予め記憶されている波形データを用いて修正する波形修正手順と
を前記コンピュータ・システムに実行させることを特徴とする音声強調プログラム。 - 入力された音声データを音素別波形データ記憶手順に登録する音声登録手順を
コンピュータ・システムに実行させる音声登録プログラムであって、
前記入力された音声データと、該音声データのテキストデータを言語処理することによって出力された音素列とに基づいて該音声データに音素識別情報を付与し、該音素識別情報の境界を判定して該音素識別情報の境界情報を前記音素境界情報として出力する音素識別情報出力手順と、
前記音素識別情報出力手順によって出力された前記音素識別情報の境界情報とともに入力された前記音声データの波形特徴量を該音素毎に算出する波形特徴量算出手順と、
前記波形特徴量算出手順によって算出された前記波形特徴量に基づいて前記音声データが所定条件を充足するか否かを前記音素毎に判定する条件充足性判定手順と、
前記条件充足性判定手順によって前記所定条件を充足すると判定された前記音素毎の音声データを、前記音素別波形データ記憶手順に登録する音素別波形データ登録手順と
を前記コンピュータ・システムに実行させることを特徴とする音声登録プログラム。 - 入力された音声データの不明瞭部分を修正して出力する音声強調方法であって、
前記音声データを音素に分解する音素境界情報とともに入力された該音声データの波形特徴量を該音素毎に算出する波形特徴量算出工程と、
前記波形特徴量算出工程によって算出された前記波形特徴量に基づいて前記音素毎に前記音声データの修正の必要性を判定する修正判定工程と、
前記修正判定工程によって修正の必要性があると判定された前記音素毎の音声データを、音素別波形データ記憶工程に予め記憶されている波形データを用いて修正する波形修正工程と
を含んだことを特徴とする音声強調方法。 - 入力された音声データを音素別波形データ記憶工程に登録する音声登録方法であって、
前記入力された音声データと、該音声データのテキストデータを言語処理することによって出力された音素列とに基づいて該音声データに音素識別情報を付与し、該音素識別情報の境界を判定して該音素識別情報の境界情報を前記音素境界情報として出力する音素識別情報出力工程と、
前記音素識別情報出力工程によって出力された前記音素識別情報の境界情報とともに入力された前記音声データの波形特徴量を該音素毎に算出する波形特徴量算出工程と、
前記波形特徴量算出工程によって算出された前記波形特徴量に基づいて前記音声データが所定条件を充足するか否かを前記音素毎に判定する条件充足性判定工程と、
前記条件充足性判定工程によって前記所定条件を充足すると判定された前記音素毎の音声データを、前記音素別波形データ記憶工程に登録する音素別波形データ登録工程と
を含んだことを特徴とする音声登録方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006248587A JP4946293B2 (ja) | 2006-09-13 | 2006-09-13 | 音声強調装置、音声強調プログラムおよび音声強調方法 |
EP07113439A EP1901286B1 (en) | 2006-09-13 | 2007-07-30 | Speech enhancement apparatus, speech recording apparatus, speech enhancement program, speech recording program, speech enhancing method, and speech recording method |
US11/882,312 US8190432B2 (en) | 2006-09-13 | 2007-07-31 | Speech enhancement apparatus, speech recording apparatus, speech enhancement program, speech recording program, speech enhancing method, and speech recording method |
CN2007101466988A CN101145346B (zh) | 2006-09-13 | 2007-08-24 | 语音增强设备和语音记录设备及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006248587A JP4946293B2 (ja) | 2006-09-13 | 2006-09-13 | 音声強調装置、音声強調プログラムおよび音声強調方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008070564A true JP2008070564A (ja) | 2008-03-27 |
JP4946293B2 JP4946293B2 (ja) | 2012-06-06 |
Family
ID=38691794
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006248587A Expired - Fee Related JP4946293B2 (ja) | 2006-09-13 | 2006-09-13 | 音声強調装置、音声強調プログラムおよび音声強調方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8190432B2 (ja) |
EP (1) | EP1901286B1 (ja) |
JP (1) | JP4946293B2 (ja) |
CN (1) | CN101145346B (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010087171A1 (ja) * | 2009-01-29 | 2010-08-05 | パナソニック株式会社 | 補聴器および補聴処理方法 |
JP2014232245A (ja) * | 2013-05-30 | 2014-12-11 | 日本電信電話株式会社 | 音声明瞭化装置、方法及びプログラム |
JP2016018042A (ja) * | 2014-07-07 | 2016-02-01 | 沖電気工業株式会社 | 音声復号化装置、音声復号化方法、音声復号化プログラム及び通信機器 |
JP2017037250A (ja) * | 2015-08-12 | 2017-02-16 | 日本電信電話株式会社 | 音声強調装置、音声強調方法及び音声強調プログラム |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8046218B2 (en) | 2006-09-19 | 2011-10-25 | The Board Of Trustees Of The University Of Illinois | Speech and method for identifying perceptual features |
WO2010003068A1 (en) * | 2008-07-03 | 2010-01-07 | The Board Of Trustees Of The University Of Illinois | Systems and methods for identifying speech sound features |
WO2010078938A2 (de) * | 2008-12-18 | 2010-07-15 | Forschungsgesellschaft Für Arbeitsphysiologie Und Arbeitsschutz E. V. | Verfahren und vorrichtung zum verarbeiten von akustischen sprachsignalen |
AU2010347009B2 (en) * | 2010-02-24 | 2014-05-22 | Sivantos Pte. Ltd. | Method for training speech recognition, and training device |
DE102010041435A1 (de) * | 2010-09-27 | 2012-03-29 | Siemens Medical Instruments Pte. Ltd. | Verfahren zum Rekonstruieren eines Sprachsignals und Hörvorrichtung |
US9158759B2 (en) | 2011-11-21 | 2015-10-13 | Zero Labs, Inc. | Engine for human language comprehension of intent and command execution |
US9961442B2 (en) | 2011-11-21 | 2018-05-01 | Zero Labs, Inc. | Engine for human language comprehension of intent and command execution |
JP6284003B2 (ja) * | 2013-03-27 | 2018-02-28 | パナソニックIpマネジメント株式会社 | 音声強調装置及び方法 |
US9384731B2 (en) * | 2013-11-06 | 2016-07-05 | Microsoft Technology Licensing, Llc | Detecting speech input phrase confusion risk |
US8719032B1 (en) | 2013-12-11 | 2014-05-06 | Jefferson Audio Video Systems, Inc. | Methods for presenting speech blocks from a plurality of audio input data streams to a user in an interface |
US9472182B2 (en) * | 2014-02-26 | 2016-10-18 | Microsoft Technology Licensing, Llc | Voice font speaker and prosody interpolation |
US9666204B2 (en) | 2014-04-30 | 2017-05-30 | Qualcomm Incorporated | Voice profile management and speech signal generation |
US10332520B2 (en) | 2017-02-13 | 2019-06-25 | Qualcomm Incorporated | Enhanced speech generation |
TWI672690B (zh) * | 2018-03-21 | 2019-09-21 | 塞席爾商元鼎音訊股份有限公司 | 人工智慧語音互動之方法、電腦程式產品及其近端電子裝置 |
CN110322885B (zh) * | 2018-03-28 | 2023-11-28 | 达发科技股份有限公司 | 人工智能语音互动的方法、电脑程序产品及其近端电子装置 |
WO2019216037A1 (ja) * | 2018-05-10 | 2019-11-14 | 日本電信電話株式会社 | ピッチ強調装置、その方法、プログラム、および記録媒体 |
WO2019245916A1 (en) * | 2018-06-19 | 2019-12-26 | Georgetown University | Method and system for parametric speech synthesis |
CN110097874A (zh) * | 2019-05-16 | 2019-08-06 | 上海流利说信息技术有限公司 | 一种发音纠正方法、装置、设备以及存储介质 |
CN112863531A (zh) * | 2021-01-12 | 2021-05-28 | 蒋亦韬 | 通过计算机识别后重新生成进行语音音频增强的方法 |
CN113035223B (zh) * | 2021-03-12 | 2023-11-14 | 北京字节跳动网络技术有限公司 | 音频处理方法、装置、设备及存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6126099A (ja) * | 1984-07-16 | 1986-02-05 | シャープ株式会社 | 音声基本周波数抽出方法 |
JPH0283595A (ja) * | 1988-09-21 | 1990-03-23 | Matsushita Electric Ind Co Ltd | 音声認識方法 |
JPH02203399A (ja) * | 1989-02-01 | 1990-08-13 | Nec Corp | 音声符号化方式 |
JPH0916193A (ja) * | 1995-06-30 | 1997-01-17 | Hitachi Ltd | 話速変換装置 |
JPH1078798A (ja) * | 1996-09-05 | 1998-03-24 | Kazuhiko Shoji | 音声信号処理装置 |
JP2000066694A (ja) * | 1998-08-21 | 2000-03-03 | Sanyo Electric Co Ltd | 音声合成装置および音声合成方法 |
JP2002014689A (ja) * | 2000-06-01 | 2002-01-18 | Avaya Technology Corp | デジタルに圧縮されたスピーチの了解度を向上させる方法および装置 |
JP2002268672A (ja) * | 2001-03-13 | 2002-09-20 | Atr Onsei Gengo Tsushin Kenkyusho:Kk | 音声データベース用文セットの選択方法 |
JP2003345373A (ja) * | 2002-05-29 | 2003-12-03 | Matsushita Electric Ind Co Ltd | 音声合成装置及び音声明瞭化方法 |
WO2004066271A1 (ja) * | 2003-01-20 | 2004-08-05 | Fujitsu Limited | 音声合成装置,音声合成方法および音声合成システム |
JP2007511793A (ja) * | 2003-11-14 | 2007-05-10 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号処理システム及び方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4783807A (en) * | 1984-08-27 | 1988-11-08 | John Marley | System and method for sound recognition with feature selection synchronized to voice pitch |
CN85100180B (zh) * | 1985-04-01 | 1987-05-13 | 清华大学 | 一种利用计算机对汉语语音进行识别的装置 |
US5146502A (en) * | 1990-02-26 | 1992-09-08 | Davis, Van Nortwick & Company | Speech pattern correction device for deaf and voice-impaired |
JPH08275087A (ja) | 1995-04-04 | 1996-10-18 | Matsushita Electric Ind Co Ltd | 音声加工テレビ |
US5799276A (en) * | 1995-11-07 | 1998-08-25 | Accent Incorporated | Knowledge-based speech recognition system and methods having frame length computed based upon estimated pitch period of vocalic intervals |
US6006175A (en) * | 1996-02-06 | 1999-12-21 | The Regents Of The University Of California | Methods and apparatus for non-acoustic speech characterization and recognition |
GB9811019D0 (en) * | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
US6795807B1 (en) * | 1999-08-17 | 2004-09-21 | David R. Baraff | Method and means for creating prosody in speech regeneration for laryngectomees |
US6510407B1 (en) * | 1999-10-19 | 2003-01-21 | Atmel Corporation | Method and apparatus for variable rate coding of speech |
JP3730461B2 (ja) * | 1999-10-28 | 2006-01-05 | 山洋電気株式会社 | 防水型ブラシレスファンモータ |
US7216079B1 (en) * | 1999-11-02 | 2007-05-08 | Speechworks International, Inc. | Method and apparatus for discriminative training of acoustic models of a speech recognition system |
JP3728172B2 (ja) * | 2000-03-31 | 2005-12-21 | キヤノン株式会社 | 音声合成方法および装置 |
US6728680B1 (en) * | 2000-11-16 | 2004-04-27 | International Business Machines Corporation | Method and apparatus for providing visual feedback of speed production |
JP2004004952A (ja) | 2003-07-30 | 2004-01-08 | Matsushita Electric Ind Co Ltd | 音声合成装置および音声合成方法 |
US20070038455A1 (en) * | 2005-08-09 | 2007-02-15 | Murzina Marina V | Accent detection and correction system |
-
2006
- 2006-09-13 JP JP2006248587A patent/JP4946293B2/ja not_active Expired - Fee Related
-
2007
- 2007-07-30 EP EP07113439A patent/EP1901286B1/en not_active Expired - Fee Related
- 2007-07-31 US US11/882,312 patent/US8190432B2/en not_active Expired - Fee Related
- 2007-08-24 CN CN2007101466988A patent/CN101145346B/zh not_active Expired - Fee Related
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6126099A (ja) * | 1984-07-16 | 1986-02-05 | シャープ株式会社 | 音声基本周波数抽出方法 |
JPH0283595A (ja) * | 1988-09-21 | 1990-03-23 | Matsushita Electric Ind Co Ltd | 音声認識方法 |
JPH02203399A (ja) * | 1989-02-01 | 1990-08-13 | Nec Corp | 音声符号化方式 |
JPH0916193A (ja) * | 1995-06-30 | 1997-01-17 | Hitachi Ltd | 話速変換装置 |
JPH1078798A (ja) * | 1996-09-05 | 1998-03-24 | Kazuhiko Shoji | 音声信号処理装置 |
JP2000066694A (ja) * | 1998-08-21 | 2000-03-03 | Sanyo Electric Co Ltd | 音声合成装置および音声合成方法 |
JP2002014689A (ja) * | 2000-06-01 | 2002-01-18 | Avaya Technology Corp | デジタルに圧縮されたスピーチの了解度を向上させる方法および装置 |
JP2002268672A (ja) * | 2001-03-13 | 2002-09-20 | Atr Onsei Gengo Tsushin Kenkyusho:Kk | 音声データベース用文セットの選択方法 |
JP2003345373A (ja) * | 2002-05-29 | 2003-12-03 | Matsushita Electric Ind Co Ltd | 音声合成装置及び音声明瞭化方法 |
WO2004066271A1 (ja) * | 2003-01-20 | 2004-08-05 | Fujitsu Limited | 音声合成装置,音声合成方法および音声合成システム |
JP2007511793A (ja) * | 2003-11-14 | 2007-05-10 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号処理システム及び方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010087171A1 (ja) * | 2009-01-29 | 2010-08-05 | パナソニック株式会社 | 補聴器および補聴処理方法 |
US8374877B2 (en) | 2009-01-29 | 2013-02-12 | Panasonic Corporation | Hearing aid and hearing-aid processing method |
JP2014232245A (ja) * | 2013-05-30 | 2014-12-11 | 日本電信電話株式会社 | 音声明瞭化装置、方法及びプログラム |
JP2016018042A (ja) * | 2014-07-07 | 2016-02-01 | 沖電気工業株式会社 | 音声復号化装置、音声復号化方法、音声復号化プログラム及び通信機器 |
JP2017037250A (ja) * | 2015-08-12 | 2017-02-16 | 日本電信電話株式会社 | 音声強調装置、音声強調方法及び音声強調プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20080065381A1 (en) | 2008-03-13 |
EP1901286A3 (en) | 2008-07-30 |
CN101145346A (zh) | 2008-03-19 |
EP1901286B1 (en) | 2013-03-06 |
EP1901286A2 (en) | 2008-03-19 |
US8190432B2 (en) | 2012-05-29 |
CN101145346B (zh) | 2010-10-13 |
JP4946293B2 (ja) | 2012-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4946293B2 (ja) | 音声強調装置、音声強調プログラムおよび音声強調方法 | |
US7979274B2 (en) | Method and system for preventing speech comprehension by interactive voice response systems | |
US20050119890A1 (en) | Speech synthesis apparatus and speech synthesis method | |
US7526430B2 (en) | Speech synthesis apparatus | |
JP4878538B2 (ja) | 音声合成装置 | |
US20050171778A1 (en) | Voice synthesizer, voice synthesizing method, and voice synthesizing system | |
JP2007086316A (ja) | 音声合成装置、音声合成方法、音声合成プログラムおよび音声合成プログラムを記憶したコンピュータ読み取り可能な記憶媒体 | |
Ernestus et al. | Qualitative and quantitative aspects of phonetic variation in Dutch eigenlijk | |
JP4564416B2 (ja) | 音声合成装置および音声合成プログラム | |
JP2010117528A (ja) | 声質変化判定装置、声質変化判定方法、声質変化判定プログラム | |
JP4744338B2 (ja) | 合成音声生成装置 | |
JP3159930B2 (ja) | 音声処理装置のピッチ抽出方法 | |
JP2008116643A (ja) | 音声生成装置 | |
JP2012042974A (ja) | 音声合成装置 | |
JP6044490B2 (ja) | 情報処理装置、話速データ生成方法、及びプログラム | |
EP1543503B1 (en) | Method for controlling duration in speech synthesis | |
JP2010175717A (ja) | 音声合成装置 | |
JP6807491B1 (ja) | 補聴器用合成音声セットの修正方法 | |
WO2011030424A1 (ja) | 音声合成装置およびプログラム | |
JP2005181998A (ja) | 音声合成装置および音声合成方法 | |
JP3235747B2 (ja) | 音声合成装置及び音声合成方法 | |
JP2010008922A (ja) | 音声処理装置、音声処理方法及びプログラム | |
JP2809769B2 (ja) | 音声合成装置 | |
JP2015049309A (ja) | 情報処理装置、話速データ生成方法、及びプログラム | |
JP2001134276A (ja) | 音声文字化誤り検出装置および記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090512 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110328 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110412 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110607 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120207 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120220 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150316 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |