JP4516157B2 - 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム - Google Patents
音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム Download PDFInfo
- Publication number
- JP4516157B2 JP4516157B2 JP2009554815A JP2009554815A JP4516157B2 JP 4516157 B2 JP4516157 B2 JP 4516157B2 JP 2009554815 A JP2009554815 A JP 2009554815A JP 2009554815 A JP2009554815 A JP 2009554815A JP 4516157 B2 JP4516157 B2 JP 4516157B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- ratio
- noise
- input signal
- band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012937 correction Methods 0.000 title claims description 137
- 238000004458 analytical method Methods 0.000 title claims description 85
- 238000000034 method Methods 0.000 title claims description 26
- 230000015572 biosynthetic process Effects 0.000 title claims description 21
- 238000003786 synthesis reaction Methods 0.000 title claims description 21
- 238000004364 calculation method Methods 0.000 claims description 65
- 230000000737 periodic effect Effects 0.000 claims description 58
- 238000005311 autocorrelation function Methods 0.000 claims description 40
- 238000001228 spectrum Methods 0.000 claims description 40
- 238000005314 correlation function Methods 0.000 claims description 32
- 238000010606 normalization Methods 0.000 claims description 21
- 230000001755 vocal effect Effects 0.000 claims description 17
- 238000009826 distribution Methods 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 29
- 230000006870 function Effects 0.000 description 20
- 238000012545 processing Methods 0.000 description 8
- 230000008602 contraction Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 3
- 210000001260 vocal cord Anatomy 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- MQJKPEGWNLWLTK-UHFFFAOYSA-N Dapsone Chemical compound C1=CC(N)=CC=C1S(=O)(=O)C1=CC=C(N)C=C1 MQJKPEGWNLWLTK-UHFFFAOYSA-N 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012888 cubic function Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
図1は、本発明の実施の形態1における音声分析装置100の機能的な構成の一例を示すブロック図である。
雑音区間識別部101は、入力信号を所定の時間ごとに複数のフレームに分割し、分割されたそれぞれのフレームが、背景雑音のみが表された雑音区間としての背景雑音フレームであるか、背景雑音および音声が表された音声区間としての音声フレームであるかを識別する。
有声無声判定部102は、雑音区間識別部101によって音声フレームであると識別されたフレームにおける入力信号で表される音声が、有声音であるか無声音であるかを判定する。判定の方法は特に限定しない。例えば、音声の自己相関関数や変形相関関数のピークの大きさが予め定めたしきい値を超える場合に、有声音であると判定してもよい。
基本周波数正規化部103は、有声無声判定部102で有声フレームであると識別されたフレームにおける入力信号で表される音声の基本周波数を分析する。分析の方法は特に限定しない。例えば、雑音の混入した音声に対して頑健な基本周波数分析方法である、瞬時周波数に基づく基本周波数分析方法(非特許文献2:T.Abe,T.Kobayashi,S.Imai,“Robust pitch estimation with harmonic enhancement in noisy environment based on instantaneous frequency”,ASVA 97,423−430(1996))を用いてもよい。
周波数帯域分割部104は、基本周波数正規化部103により基本周波数を正規化された音声、および雑音区間識別部101により背景雑音フレームであると識別されたフレームにおける背景雑音を、予め決定された複数の周波数帯域である分割帯域ごとの帯域通過信号に分割する。
相関関数算出部105a、105b、105cは、周波数帯域分割部104により分割された各帯域通過信号の自己相関関数を算出する。i番目の帯域通過信号をxi(n)とすると、xi(n)の自己相関関数φi(m)は式1で表すことができる。
SNR算出部106a、106b、106cは、背景雑音フレームにおける入力信号から分割された各帯域通過信号のパワーを算出し、算出されたパワーを示す値を保持すると共に、新たな背景雑音フレームのパワーを算出した場合、新たに算出されたパワーを示す値で保持されている値を更新する。これにより、SNR算出部106a、106b、106cには、直近の背景雑音のパワーが保持される。
補正量決定部107a、107b、107cは、SNR算出部106a、106b、106cにより算出されたSN比に基づいて、非周期成分比率算出部108a、108b、108cが算出する非周期成分比率の補正量を決定する。
非周期成分比率算出部108a、108b、108cは、相関関数算出部105a、105b、105cにより算出された自己相関関数と、補正量決定部107a、107b、107cにより決定された補正量とに基づいて非周期成分比率を算出する。
以下に、本発明の音声分析装置の応用例として、分析で得られた非周期成分比率を用いて合成音声を生成する音声分析合成装置および方法について説明する。
声道特徴分析部501は、第2入力信号で表される第2音声に対して線形予測分析を行う。線形予測分析は、音声波形のある標本値ynをそれより前のp個の標本値から予測する処理であり、予測に用いるモデル式は式5のように表せる。
逆フィルタ部502は、声道特徴分析部501により分析された線形予測係数を用いて、その周波数応答の逆特性を持つフィルタを形成し、第2入力信号で表される第2音声をフィルタリングすることにより、音声の音源波形を抽出する。
図10(a)は、逆フィルタ部502から出力された波形の一例を示す図である。図10(b)は、その振幅スペクトルを示す図である。
合成部504は、声道特徴分析部501により分析されたフィルタを、音源モデル化部により分析された音源パラメータに基づく音源で駆動し、合成音声を生成する。このとき、本発明の音声分析装置により分析された非周期成分比率を用いて、音源波形の位相情報を変換することにより、第1音声に含まれる非周期成分を合成音声中に再現する。音源波形の生成方法の一例について、詳細を図12(a)〜図12(c)を用いて説明する。
実施の形態1では、雑音により音声の自己相関値が影響を受ける量(すなわち、音声について算出される自己相関値と前記音声と雑音との混合音について算出される自己相関値との差の大きさ)と、前記音声と前記雑音とのSN比との間に、適切な補正規則情報(例えば、3次多項式で表される近似関数)で表すことができる一定の関係があることを説明した。
101 雑音区間識別部
102 有声無声判定部
103 基本周波数正規化部
104、104x、104y 周波数帯域分割部
105a、105b、105c、105x、105y 相関関数算出部
106、106a、106b、106c SNR算出部
107a、107b、107c 補正量決定部
108a、108b、108c 非周期成分比率算出部
200 補正規則情報生成装置
301 補正規則情報生成部
302 加算器
303 差分器
500 音声分析合成装置
501 声道特徴分析部
502 逆フィルタ部
503 音源モデル化部
504 合成部
505 非周期成分スペクトル算出部
901 時間軸伸縮部
902 帯域分割部
903a、903b、903n 相関関数算出部
904 境界周波数算出部
Claims (15)
- 背景雑音と音声との混合音を表す入力信号から、前記音声に含まれる非周期成分を分析する音声分析装置であって、
前記入力信号を、複数の周波数帯域における帯域通過信号に周波数分割する周波数帯域分割部と、
前記入力信号が前記背景雑音のみを表す雑音区間と、前記入力信号が前記背景雑音および前記音声を表す音声区間とを識別する雑音区間識別部と、
前記音声区間における前記入力信号から分割された各帯域通過信号のパワーと、前記雑音区間における前記入力信号から分割された各帯域通過信号のパワーとの比であるSN比を算出するSNR算出部と、
前記音声区間における前記入力信号から分割された各帯域通過信号の自己相関関数を算出する相関関数算出部と、
前記算出されたSN比に基づいて、非周期成分比率に関する補正量を決定する補正量決定部と、
前記決定された補正量と、前記算出された自己相関関数とに基づいて、前記音声に含まれる非周期成分比率を、前記複数の周波数帯域についてそれぞれ算出する非周期成分比率算出部と
を備える音声分析装置。 - 前記補正量決定部は、前記算出されたSN比が小さいほど大きな補正量を、前記非周期成分比率に関する補正量として決定する
請求項1に記載の音声分析装置。 - 前記非周期成分比率算出部は、前記入力信号の基本周波数の1周期の時間シフトにおける前記自己相関関数の値から前記補正量を減じた補正相関値が小さいほど大きな比率を、前記非周期成分比率として算出する
請求項1に記載の音声分析装置。 - 前記補正量決定部は、SN比と補正量との対応を表す補正規則情報を予め保持し、前記算出されたSN比に対応する補正量を前記補正規則情報から参照し、参照された補正量を前記非周期成分比率に関する補正量として決定する
請求項1に記載の音声分析装置。 - 前記補正量決定部は、音声の自己相関値と前記音声に既知のSN比の雑音を重畳した場合の自己相関値との差に基づいて学習されたSN比と補正量との関係を表す近似関数を前記補正規則情報として予め保持し、前記算出されたSN比から前記近似関数の値を算出し、算出された値を前記非周期成分比率に関する補正量として決定する
請求項1に記載の音声分析装置。 - さらに、前記音声の基本周波数を予め定められたターゲット周波数に正規化する基本周波数正規化部を備え、
前記非周期成分比率算出部は、前記基本周波数が正規化された後の音声を用いて、前記非周期成分比率を算出する
請求項1に記載の音声分析装置。 - 前記基本周波数正規化部は、前記音声の基本周波数を、前記音声の所定の単位の基本周波数の平均値に正規化する
請求項6に記載の音声分析装置。 - 前記所定の単位は、音素、音節、モーラ、アクセント句、フレーズ、全文のいずれかである
請求項7に記載の音声分析装置。 - 背景雑音と第1音声との混合音を表す第1入力信号から、前記第1音声に含まれる非周期成分を分析して、前記分析された非周期成分を第2入力信号により表される第2音声に合成する音声分析合成装置であって、
前記第1入力信号を、複数の周波数帯域における帯域通過信号に周波数分割する周波数帯域分割部と、
前記第1入力信号が前記背景雑音のみを表す雑音区間と、前記第1入力信号が前記背景雑音および前記音声を表す音声区間とを識別する雑音区間識別部と、
前記音声区間における前記第1入力信号から分割された各帯域通過信号のパワーと、前記雑音区間における前記第1入力信号から分割された各帯域通過信号のパワーとの比であるSN比を算出するSNR算出部と、
前記音声区間における前記第1入力信号から分割された各帯域通過信号の自己相関関数を算出する相関関数算出部と、
前記算出されたSN比に基づいて、非周期成分比率に関する補正量を決定する補正量決定部と、
前記決定された補正量と、前記算出された自己相関関数とに基づいて、前記第1音声に含まれる非周期成分比率を、前記複数の周波数帯域についてそれぞれ算出する非周期成分比率算出部と、
前記複数の周波数帯域についてそれぞれ算出された非周期成分比率に基づいて非周期成分の周波数分布を表す非周期成分スペクトルを算出する非周期成分スペクトル算出部と、
前記第2音声に関する声道特徴を分析する声道特徴分析部と、
前記分析された声道特徴の逆特性と用いて前記第2音声を逆フィルタリングすることにより、前記第2音声の音源波形を抽出する逆フィルタ部と、
前記抽出された音源波形をモデル化する音源モデル化部と、
前記分析された声道特徴と、前記モデル化された音源特徴と、前記算出された非周期成分スペクトルとに基づいて音声を合成する合成部と
を備える音声分析合成装置。 - 音声を表す入力信号と雑音を表す入力信号とを、それぞれ同じ複数の周波数帯域である分割帯域ごとの帯域通過信号に周波数分割する周波数帯域分割部と、
分割された前記各帯域通過信号から、前記分割帯域ごとに、異なる複数の時間区間のそれぞれにおける前記音声のパワーと前記雑音のパワーとの比であるSN比を算出するSNR算出部と、
分割された前記各帯域通過信号から、前記分割帯域ごとに、前記複数の時間区間のそれぞれにおける前記音声の自己相関値および前記雑音の自己相関値を算出する相関関数算出部と、
算出された前記SN比、前記音声の自己相関値、および前記雑音の自己相関値から、前記分割帯域ごとに、前記音声の自己相関値と前記雑音の自己相関値との差と、前記SN比との対応を表す補正規則情報を生成する補正規則情報生成部と
を備える補正規則情報生成装置。 - 請求項1に記載の音声分析装置と、
請求項10に記載の補正規則情報生成装置とを備え、
前記音声分析装置は、算出されたSN比に対応する補正量を、前記補正規則情報生成装置で生成された補正規則情報から参照し、参照された補正量を非周期成分比率に関する補正量として決定する
音声分析システム。 - 背景雑音と音声との混合音を表す入力信号から、前記音声に含まれる非周期成分を分析する音声分析方法であって、
前記入力信号を、複数の周波数帯域における帯域通過信号に分割する周波数帯域分割ステップと、
前記入力信号が前記背景雑音のみを表す雑音区間と、前記入力信号が前記背景雑音および前記音声を表す音声区間とを識別する雑音区間識別ステップと、
前記音声区間における前記入力信号から分割された各帯域通過信号のパワーと、前記雑音区間における前記入力信号から分割された各帯域通過信号のパワーとの比であるSN比を算出するSNR算出ステップと、
前記音声区間における前記入力信号から分割された各帯域通過信号の自己相関関数を算出する相関関数算出ステップと、
前記算出されたSN比に基づいて、非周期成分比率に関する補正量を決定する補正量決定ステップと、
前記決定された補正量と、前記算出された自己相関関数とに基づいて、前記音声に含まれる非周期成分比率を、前記複数の周波数帯域についてそれぞれ算出する非周期成分比率算出ステップと
を備える音声分析方法。 - 音声を表す入力信号と雑音を表す入力信号とを、それぞれ同じ複数の周波数帯域である分割帯域ごとの帯域通過信号に周波数分割する周波数帯域分割ステップと、
分割された前記各帯域通過信号から、前記分割帯域ごとに、異なる複数の時間区間のそれぞれにおける前記音声のパワーと前記雑音のパワーとの比であるSN比を算出するSNR算出ステップと、
分割された前記各帯域通過信号から、前記分割帯域ごとに、前記複数の時間区間のそれぞれにおける前記音声の自己相関値および前記雑音の自己相関値を算出する相関関数算出ステップと、
算出された前記SN比、前記音声の自己相関値、および前記雑音の自己相関値から、前記分割帯域ごとに、前記音声の自己相関値と前記雑音の自己相関値との差と、前記SN比との対応を表す補正規則情報を生成する補正規則情報生成ステップと
を含む補正規則情報生成方法。 - 背景雑音と音声との混合音を表す入力信号から、前記音声に含まれる非周期成分を分析するための、コンピュータ実行可能なプログラムであって、
前記入力信号を、複数の周波数帯域における帯域通過信号に分割する周波数帯域分割ステップと、
前記入力信号が前記背景雑音のみを表す雑音区間と、前記入力信号が前記背景雑音および前記音声を表す音声区間とを識別する雑音区間識別ステップと、
前記音声区間における前記入力信号から分割された各帯域通過信号のパワーと、前記雑音区間における前記入力信号から分割された各帯域通過信号のパワーとの比であるSN比を算出するSNR算出ステップと、
前記音声区間における前記入力信号から分割された各帯域通過信号の自己相関関数を算出する相関関数算出ステップと、
前記算出されたSN比に基づいて、非周期成分比率に関する補正量を決定する補正量決定ステップと、
前記決定された補正量と、前記算出された自己相関関数とに基づいて、前記音声に含まれる非周期成分比率を、前記複数の周波数帯域についてそれぞれ算出する非周期成分比率算出ステップと
をコンピュータに実行させることを特徴とするプログラム。 - 音声を表す入力信号と雑音を表す入力信号とを、それぞれ同じ複数の周波数帯域である分割帯域ごとの帯域通過信号に周波数分割する周波数帯域分割ステップと、
分割された前記各帯域通過信号から、前記分割帯域ごとに、異なる複数の時間区間のそれぞれにおける前記音声のパワーと前記雑音のパワーとの比であるSN比を算出するSNR算出ステップと、
分割された前記各帯域通過信号から、前記分割帯域ごとに、前記複数の時間区間のそれぞれにおける前記音声の自己相関値および前記雑音の自己相関値を算出する相関関数算出ステップと、
算出された前記SN比、前記音声の自己相関値、および前記雑音の自己相関値から、前記分割帯域ごとに、前記音声の自己相関値と前記雑音の自己相関値との差と、前記SN比との対応を表す補正規則情報を生成する補正規則情報生成ステップと
をコンピュータに実行させることを特徴とするプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008237050 | 2008-09-16 | ||
JP2008237050 | 2008-09-16 | ||
PCT/JP2009/004514 WO2010032405A1 (ja) | 2008-09-16 | 2009-09-11 | 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP4516157B2 true JP4516157B2 (ja) | 2010-08-04 |
JPWO2010032405A1 JPWO2010032405A1 (ja) | 2012-02-02 |
Family
ID=42039255
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009554815A Expired - Fee Related JP4516157B2 (ja) | 2008-09-16 | 2009-09-11 | 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20100217584A1 (ja) |
JP (1) | JP4516157B2 (ja) |
CN (1) | CN101983402B (ja) |
WO (1) | WO2010032405A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9251782B2 (en) | 2007-03-21 | 2016-02-02 | Vivotext Ltd. | System and method for concatenate speech samples within an optimal crossing point |
US8898055B2 (en) * | 2007-05-14 | 2014-11-25 | Panasonic Intellectual Property Corporation Of America | Voice quality conversion device and voice quality conversion method for converting voice quality of an input speech using target vocal tract information and received vocal tract information corresponding to the input speech |
WO2013018294A1 (ja) * | 2011-08-01 | 2013-02-07 | パナソニック株式会社 | 音声合成装置および音声合成方法 |
KR101402805B1 (ko) * | 2012-03-27 | 2014-06-03 | 광주과학기술원 | 음성분석장치, 음성합성장치, 및 음성분석합성시스템 |
CN107359880B (zh) * | 2012-10-01 | 2020-08-25 | 日本电信电话株式会社 | 编码方法、编码装置以及记录介质 |
JP6305694B2 (ja) * | 2013-05-31 | 2018-04-04 | クラリオン株式会社 | 信号処理装置及び信号処理方法 |
US10909996B2 (en) * | 2013-07-18 | 2021-02-02 | Nippon Telegraph And Telephone Corporation | Linear prediction analysis device, method, program, and storage medium |
US10134423B2 (en) | 2013-12-06 | 2018-11-20 | Tata Consultancy Services Limited | System and method to provide classification of noise data of human crowd |
ES2796310T3 (es) * | 2015-03-24 | 2020-11-26 | Really Aps | Reutilización de textil tejido o tricotado usado |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007156337A (ja) * | 2005-12-08 | 2007-06-21 | Nippon Telegr & Teleph Corp <Ntt> | 音声信号分析装置、音声信号分析方法、音声信号分析プログラム、自動音声認識装置、自動音声認識方法及び自動音声認識プログラム |
JP2007199663A (ja) * | 2006-01-26 | 2007-08-09 | Samsung Electronics Co Ltd | ハーモニックとサブハーモニックの比率を用いたピッチ検出方法およびピッチ検出装置 |
Family Cites Families (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3808370A (en) * | 1972-08-09 | 1974-04-30 | Rockland Systems Corp | System using adaptive filter for determining characteristics of an input |
US3978287A (en) * | 1974-12-11 | 1976-08-31 | Nasa | Real time analysis of voiced sounds |
US4069395A (en) * | 1977-04-27 | 1978-01-17 | Bell Telephone Laboratories, Incorporated | Analog dereverberation system |
US4301329A (en) * | 1978-01-09 | 1981-11-17 | Nippon Electric Co., Ltd. | Speech analysis and synthesis apparatus |
US4720865A (en) * | 1983-06-27 | 1988-01-19 | Nec Corporation | Multi-pulse type vocoder |
US4630304A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic background noise estimator for a noise suppression system |
US5054072A (en) * | 1987-04-02 | 1991-10-01 | Massachusetts Institute Of Technology | Coding of acoustic waveforms |
US5023910A (en) * | 1988-04-08 | 1991-06-11 | At&T Bell Laboratories | Vector quantization in a harmonic speech coding arrangement |
US5400434A (en) * | 1990-09-04 | 1995-03-21 | Matsushita Electric Industrial Co., Ltd. | Voice source for synthetic speech system |
JPH04264597A (ja) * | 1991-02-20 | 1992-09-21 | Fujitsu Ltd | 音声符号化装置および音声復号装置 |
JP3278863B2 (ja) * | 1991-06-05 | 2002-04-30 | 株式会社日立製作所 | 音声合成装置 |
US5504833A (en) * | 1991-08-22 | 1996-04-02 | George; E. Bryan | Speech approximation using successive sinusoidal overlap-add models and pitch-scale modifications |
FR2687496B1 (fr) * | 1992-02-18 | 1994-04-01 | Alcatel Radiotelephone | Procede de reduction de bruit acoustique dans un signal de parole. |
CA2153170C (en) * | 1993-11-30 | 2000-12-19 | At&T Corp. | Transmitted noise reduction in communications systems |
JP2906968B2 (ja) * | 1993-12-10 | 1999-06-21 | 日本電気株式会社 | マルチパルス符号化方法とその装置並びに分析器及び合成器 |
US5574824A (en) * | 1994-04-11 | 1996-11-12 | The United States Of America As Represented By The Secretary Of The Air Force | Analysis/synthesis-based microphone array speech enhancer with variable signal distortion |
FR2727236B1 (fr) * | 1994-11-22 | 1996-12-27 | Alcatel Mobile Comm France | Detection d'activite vocale |
US5774846A (en) * | 1994-12-19 | 1998-06-30 | Matsushita Electric Industrial Co., Ltd. | Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus |
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
JP3266819B2 (ja) * | 1996-07-30 | 2002-03-18 | 株式会社エイ・ティ・アール人間情報通信研究所 | 周期信号変換方法、音変換方法および信号分析方法 |
US6490562B1 (en) * | 1997-04-09 | 2002-12-03 | Matsushita Electric Industrial Co., Ltd. | Method and system for analyzing voices |
US6078885A (en) * | 1998-05-08 | 2000-06-20 | At&T Corp | Verbal, fully automatic dictionary updates by end-users of speech synthesis and recognition systems |
JP4308345B2 (ja) * | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
US6289309B1 (en) * | 1998-12-16 | 2001-09-11 | Sarnoff Corporation | Noise spectrum tracking for speech enhancement |
US6510409B1 (en) * | 2000-01-18 | 2003-01-21 | Conexant Systems, Inc. | Intelligent discontinuous transmission and comfort noise generation scheme for pulse code modulation speech coders |
WO2001059766A1 (en) * | 2000-02-11 | 2001-08-16 | Comsat Corporation | Background noise reduction in sinusoidal based speech coding systems |
EP1160764A1 (en) * | 2000-06-02 | 2001-12-05 | Sony France S.A. | Morphological categories for voice synthesis |
US20030179888A1 (en) * | 2002-03-05 | 2003-09-25 | Burnett Gregory C. | Voice activity detection (VAD) devices and methods for use with noise suppression systems |
US6640208B1 (en) * | 2000-09-12 | 2003-10-28 | Motorola, Inc. | Voiced/unvoiced speech classifier |
US6801887B1 (en) * | 2000-09-20 | 2004-10-05 | Nokia Mobile Phones Ltd. | Speech coding exploiting the power ratio of different speech signal components |
US7363219B2 (en) * | 2000-09-22 | 2008-04-22 | Texas Instruments Incorporated | Hybrid speech coding and system |
US6941263B2 (en) * | 2001-06-29 | 2005-09-06 | Microsoft Corporation | Frequency domain postfiltering for quality enhancement of coded speech |
US7065486B1 (en) * | 2002-04-11 | 2006-06-20 | Mindspeed Technologies, Inc. | Linear prediction based noise suppression |
US20040024596A1 (en) * | 2002-07-31 | 2004-02-05 | Carney Laurel H. | Noise reduction system |
US6917688B2 (en) * | 2002-09-11 | 2005-07-12 | Nanyang Technological University | Adaptive noise cancelling microphone system |
US7092529B2 (en) * | 2002-11-01 | 2006-08-15 | Nanyang Technological University | Adaptive control system for noise cancellation |
US7970606B2 (en) * | 2002-11-13 | 2011-06-28 | Digital Voice Systems, Inc. | Interoperable vocoder |
CN100365704C (zh) * | 2002-11-25 | 2008-01-30 | 松下电器产业株式会社 | 声音合成方法以及声音合成装置 |
JP4490090B2 (ja) * | 2003-12-25 | 2010-06-23 | 株式会社エヌ・ティ・ティ・ドコモ | 有音無音判定装置および有音無音判定方法 |
US9318119B2 (en) * | 2005-09-02 | 2016-04-19 | Nec Corporation | Noise suppression using integrated frequency-domain signals |
WO2007052612A1 (ja) * | 2005-10-31 | 2007-05-10 | Matsushita Electric Industrial Co., Ltd. | ステレオ符号化装置およびステレオ信号予測方法 |
US7366658B2 (en) * | 2005-12-09 | 2008-04-29 | Texas Instruments Incorporated | Noise pre-processor for enhanced variable rate speech codec |
JP4264841B2 (ja) * | 2006-12-01 | 2009-05-20 | ソニー株式会社 | 音声認識装置および音声認識方法、並びに、プログラム |
US7873114B2 (en) * | 2007-03-29 | 2011-01-18 | Motorola Mobility, Inc. | Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate |
KR100918762B1 (ko) * | 2007-05-28 | 2009-09-24 | 삼성전자주식회사 | 통신 시스템에서 신호 대 간섭 및 잡음비 추정 장치 및 방법 |
CN101589430B (zh) * | 2007-08-10 | 2012-07-18 | 松下电器产业株式会社 | 声音分离装置、声音合成装置及音质变换装置 |
US8954324B2 (en) * | 2007-09-28 | 2015-02-10 | Qualcomm Incorporated | Multiple microphone voice activity detector |
US8374854B2 (en) * | 2008-03-28 | 2013-02-12 | Southern Methodist University | Spatio-temporal speech enhancement technique based on generalized eigenvalue decomposition |
US20090248411A1 (en) * | 2008-03-28 | 2009-10-01 | Alon Konchitsky | Front-End Noise Reduction for Speech Recognition Engine |
US8392181B2 (en) * | 2008-09-10 | 2013-03-05 | Texas Instruments Incorporated | Subtraction of a shaped component of a noise reduction spectrum from a combined signal |
WO2010035438A1 (ja) * | 2008-09-26 | 2010-04-01 | パナソニック株式会社 | 音声分析装置および音声分析方法 |
US20100145687A1 (en) * | 2008-12-04 | 2010-06-10 | Microsoft Corporation | Removing noise from speech |
EP2242185A1 (en) * | 2009-04-15 | 2010-10-20 | ST-NXP Wireless France | Noise suppression |
WO2011004579A1 (ja) * | 2009-07-06 | 2011-01-13 | パナソニック株式会社 | 声質変換装置、音高変換装置および声質変換方法 |
JP5606764B2 (ja) * | 2010-03-31 | 2014-10-15 | クラリオン株式会社 | 音質評価装置およびそのためのプログラム |
-
2009
- 2009-09-11 WO PCT/JP2009/004514 patent/WO2010032405A1/ja active Application Filing
- 2009-09-11 CN CN2009801117005A patent/CN101983402B/zh not_active Expired - Fee Related
- 2009-09-11 JP JP2009554815A patent/JP4516157B2/ja not_active Expired - Fee Related
-
2010
- 2010-05-04 US US12/773,168 patent/US20100217584A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007156337A (ja) * | 2005-12-08 | 2007-06-21 | Nippon Telegr & Teleph Corp <Ntt> | 音声信号分析装置、音声信号分析方法、音声信号分析プログラム、自動音声認識装置、自動音声認識方法及び自動音声認識プログラム |
JP2007199663A (ja) * | 2006-01-26 | 2007-08-09 | Samsung Electronics Co Ltd | ハーモニックとサブハーモニックの比率を用いたピッチ検出方法およびピッチ検出装置 |
Also Published As
Publication number | Publication date |
---|---|
US20100217584A1 (en) | 2010-08-26 |
JPWO2010032405A1 (ja) | 2012-02-02 |
CN101983402B (zh) | 2012-06-27 |
CN101983402A (zh) | 2011-03-02 |
WO2010032405A1 (ja) | 2010-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4516157B2 (ja) | 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム | |
Airaksinen et al. | Quasi closed phase glottal inverse filtering analysis with weighted linear prediction | |
Drugman et al. | A comparative study of glottal source estimation techniques | |
US9368103B2 (en) | Estimation system of spectral envelopes and group delays for sound analysis and synthesis, and audio signal synthesis system | |
JP5961950B2 (ja) | 音声処理装置 | |
US8280724B2 (en) | Speech synthesis using complex spectral modeling | |
Alku et al. | Closed phase covariance analysis based on constrained linear prediction for glottal inverse filtering | |
Erro et al. | Weighted frequency warping for voice conversion. | |
JP2013057735A (ja) | 音声合成用の隠れマルコフモデル学習装置及び音声合成装置 | |
JP2018004870A (ja) | 音声合成装置および音声合成方法 | |
Raitio et al. | Phase perception of the glottal excitation and its relevance in statistical parametric speech synthesis | |
JP4469986B2 (ja) | 音響信号分析方法および音響信号合成方法 | |
Airaksinen et al. | Quadratic programming approach to glottal inverse filtering by joint norm-1 and norm-2 optimization | |
Degottex et al. | A measure of phase randomness for the harmonic model in speech synthesis | |
US7822599B2 (en) | Method for synthesizing speech | |
Raitio et al. | Phase perception of the glottal excitation of vocoded speech | |
US10354671B1 (en) | System and method for the analysis and synthesis of periodic and non-periodic components of speech signals | |
Tabet et al. | Speech analysis and synthesis with a refined adaptive sinusoidal representation | |
JP5573529B2 (ja) | 音声処理装置およびプログラム | |
JP4963345B2 (ja) | 音声合成方法及び音声合成プログラム | |
Banerjee et al. | Procedure for cepstral analysis in tracing unique voice segments | |
Jung et al. | Pitch alteration technique in speech synthesis system | |
Youcef et al. | A tutorial on speech synthesis models | |
JP6213217B2 (ja) | 音声合成装置及び音声合成用コンピュータプログラム | |
Li et al. | Reconstruction of pitch for whisper-to-speech conversion of Chinese |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100413 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100513 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4516157 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130521 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130521 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |