JPS6055400A - 音声信号分析方法 - Google Patents
音声信号分析方法Info
- Publication number
- JPS6055400A JPS6055400A JP58163482A JP16348283A JPS6055400A JP S6055400 A JPS6055400 A JP S6055400A JP 58163482 A JP58163482 A JP 58163482A JP 16348283 A JP16348283 A JP 16348283A JP S6055400 A JPS6055400 A JP S6055400A
- Authority
- JP
- Japan
- Prior art keywords
- power
- data
- analysis
- resolution
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(l) 発明の技術分野
本発明は、音声認識装Pi′雪にa5いて人力フ′1声
信号の特徴抽出をする際に行う当該音声信号の分析方法
に関づ°る。
信号の特徴抽出をする際に行う当該音声信号の分析方法
に関づ°る。
(2) 技術の費用
一般に音声認識装置は、人力づ゛る音声信号を分析しC
当該音声信号の特徴抽出を行ない、この抽出した特徴デ
ータを予め登録した合声γ−タと比較し、当該特徴デー
タにより近い音声1−タをM ’fkデータどジるよう
にし゛(いる。イしC1このにうな音声認識装置では、
より多くの小冊の認識、成るいは単名節の認識更には)
−シ続音等の認識可能なものが要望されている。
当該音声信号の特徴抽出を行ない、この抽出した特徴デ
ータを予め登録した合声γ−タと比較し、当該特徴デー
タにより近い音声1−タをM ’fkデータどジるよう
にし゛(いる。イしC1このにうな音声認識装置では、
より多くの小冊の認識、成るいは単名節の認識更には)
−シ続音等の認識可能なものが要望されている。
に;)従来技術と問題点
従来、音声認識装置にお【ノる入力音声(ffi ”j
の払 分析力→どして、例えば、33〜・:つ0ブt・ネル稈
1qのアナ目グ・フィルり・バンク又は、ディジタル・
フィルタ・パンクにJ、す?I ?’スペク1ヘルの概
形情報をめるもの、或いは、線型予測分411(IPc
分析)により音声スペクトル11■形’li’i報をめ
るものがある。このJ:うにめられたスペクトル4度形
情報は、f′、J音1、”ifiに、J、−)で識別で
きる100単詔程度の詔常を扱う音声認識では、有効な
音声信号の分(;1情報ど2ffiるが、1000 j
lt語以上の飴色を扱う音声認識、或いは中音fi?)
、連続合等の音声認識では、母音特徴に加えてその子音
特徴をも抽出しなければ各音声の識別ができないことか
ら、当該多数単語等を扱う音声認識装置での適用が困難
であった。
の払 分析力→どして、例えば、33〜・:つ0ブt・ネル稈
1qのアナ目グ・フィルり・バンク又は、ディジタル・
フィルタ・パンクにJ、す?I ?’スペク1ヘルの概
形情報をめるもの、或いは、線型予測分411(IPc
分析)により音声スペクトル11■形’li’i報をめ
るものがある。このJ:うにめられたスペクトル4度形
情報は、f′、J音1、”ifiに、J、−)で識別で
きる100単詔程度の詔常を扱う音声認識では、有効な
音声信号の分(;1情報ど2ffiるが、1000 j
lt語以上の飴色を扱う音声認識、或いは中音fi?)
、連続合等の音声認識では、母音特徴に加えてその子音
特徴をも抽出しなければ各音声の識別ができないことか
ら、当該多数単語等を扱う音声認識装置での適用が困難
であった。
そこで、上記子゛音特徴をも抽出できる更に分解能の高
い分析方法としては、入力音声信号からの数百点以上の
リーンプリングデータに基づく高分解能FFT (高速
ノーり1変1!#)が考えられる。この高分解能FFT
によれば、入力音声信号を高い分解能でスペク]・ル分
析できることから、当該音声信号の母音及び子音の特m
仙出ができ、比較的多い数の単tR識別も可能となるし
かしながら、通常前えうるハードウェアで実現する高分
解能「1:Tを音声信号の全領域で行なおうとすると、
での実行lL’1間が音声の55牛時間を上回ってしま
い、実時間での処理が困肩1であり、更にこの高分解能
1− F T’を実時間で実行させるためには高価な専
用ハードウェアが必要となるという欠点があった。
い分析方法としては、入力音声信号からの数百点以上の
リーンプリングデータに基づく高分解能FFT (高速
ノーり1変1!#)が考えられる。この高分解能FFT
によれば、入力音声信号を高い分解能でスペク]・ル分
析できることから、当該音声信号の母音及び子音の特m
仙出ができ、比較的多い数の単tR識別も可能となるし
かしながら、通常前えうるハードウェアで実現する高分
解能「1:Tを音声信号の全領域で行なおうとすると、
での実行lL’1間が音声の55牛時間を上回ってしま
い、実時間での処理が困肩1であり、更にこの高分解能
1− F T’を実時間で実行させるためには高価な専
用ハードウェアが必要となるという欠点があった。
(3) 発明の目的
本発明は」二にに鑑みてなされたものぐ、?′!1声の
母音特徴及び子音特徴を実時間で分析する手段をJ:り
安価に実現τすることのでいる?η音声3号の分析方法
を提供覆ることを目的としCいる。
母音特徴及び子音特徴を実時間で分析する手段をJ:り
安価に実現τすることのでいる?η音声3号の分析方法
を提供覆ることを目的としCいる。
(5) 発明の4fi成
イしく、上記目的を達成りるため、音声15号の母音部
分は比較的音声パワーが大きく、当該子音部分は比較的
音声パワーが小さくなることに鑑み、予め音声パワー領
域として、該パワーの人δさに応じ−て、 ’+:’r
+パ「ノー領域、中パ1ノー領域、及び低パワー領域の
三領域を定め、入力音声信号より得られた音声パワーか
、高パワー領域に屈する11.!lに当該音声信号を母
音の音声仁1号ど1C低分解能力411シ、中バ1ノー
領域に属りる時に該?3声信y3を子音の音戸1信弓ど
じ(品分IIr〆能分(;iし、低パワー領域に屈−り
る1、1に当該人力音声信号を無音声信号と判定して音
声信号の分析を行なわtL:いJ、うにしたもの(・あ
る1、(6) 発明の実施例 以下本発明の実施例を図面に基づいて説明りる。第1図
は本発明に係るa j’!’ 14号分析方法に従って
、作動りる音声信号分析装置の一実施例を示ブブロツク
図である。
分は比較的音声パワーが大きく、当該子音部分は比較的
音声パワーが小さくなることに鑑み、予め音声パワー領
域として、該パワーの人δさに応じ−て、 ’+:’r
+パ「ノー領域、中パ1ノー領域、及び低パワー領域の
三領域を定め、入力音声信号より得られた音声パワーか
、高パワー領域に屈する11.!lに当該音声信号を母
音の音声仁1号ど1C低分解能力411シ、中バ1ノー
領域に属りる時に該?3声信y3を子音の音戸1信弓ど
じ(品分IIr〆能分(;iし、低パワー領域に屈−り
る1、1に当該人力音声信号を無音声信号と判定して音
声信号の分析を行なわtL:いJ、うにしたもの(・あ
る1、(6) 発明の実施例 以下本発明の実施例を図面に基づいて説明りる。第1図
は本発明に係るa j’!’ 14号分析方法に従って
、作動りる音声信号分析装置の一実施例を示ブブロツク
図である。
同図において、1は音声入力用のマイク、2は増幅器、
3はVンブルホールド回路、4はA/D変換器、5はバ
ッフ1メモリであり、マイク1から入力する音声信号が
j′曽幅器2にJ、って増幅された後、ザンブル小−ル
ド回路3によって所定周期(例えば、1o071sec
) i+3にリンブリングされ、このリンプリングデ
ータがA/D変換器4を介しC順次バラツノ・メしり(
うに格納されるようになっCいる。
3はVンブルホールド回路、4はA/D変換器、5はバ
ッフ1メモリであり、マイク1から入力する音声信号が
j′曽幅器2にJ、って増幅された後、ザンブル小−ル
ド回路3によって所定周期(例えば、1o071sec
) i+3にリンブリングされ、このリンプリングデ
ータがA/D変換器4を介しC順次バラツノ・メしり(
うに格納されるようになっCいる。
また、6はバッフアメ七り5に(6納されているデータ
Xiを、適宜例えば32アータずつ読み出し、 副線回路、7は予めP II :> l) iどなるし
きい値ph、plが定めてあり、パワ−n1n回路6が
らの音声パワーデータPjど該しきい値PIE。
Xiを、適宜例えば32アータずつ読み出し、 副線回路、7は予めP II :> l) iどなるし
きい値ph、plが定めてあり、パワ−n1n回路6が
らの音声パワーデータPjど該しきい値PIE。
1〕女とを比較りる比較器、8はバッーノアメ−[す5
に格納した1ノンブリングデータのうち例えば32個の
データを用い、32点にF T 、’;l nを行う低
分解能分析回路、9はバッフアメ[す5に格納した1ノ
ンプリングデータのうち例えば1024個のデータを用
い、1024点FFT訓幹を行う高分解能分析回路、1
0はU口発生回路であり、パ1ノー計算回路6から出力
される音戸1パヮーデークPjが1つj :> Pl+
ノド、3.1)(l r I)、i < I’l+
17)どき、PJ<Puのとぎにぞれ・ε゛れ比較器7
がらの指令にJ、り但分解能分4fi I’!l路E3
、高分解能分析回路り、げ口発生回路1oが起動ηるよ
うになっ(いる。尚1.比較器7に設定されるしきい値
pl+、1つ愛(〈[)h)は実験的に定められるしの
(゛あり、明らかに異なる1ζ1?゛1、及び了?°−
の音声パワーに基ついて、PI+を越える高パワー領域
を母?清のへ〇jiパワー領域、1)11以ト、[)女
以上となる中バ1ノー領域を子畠の音声バ「ノー領域、
再にPJを下回るIltパソー領域を無名声パワー領域
どしている。
に格納した1ノンブリングデータのうち例えば32個の
データを用い、32点にF T 、’;l nを行う低
分解能分析回路、9はバッフアメ[す5に格納した1ノ
ンプリングデータのうち例えば1024個のデータを用
い、1024点FFT訓幹を行う高分解能分析回路、1
0はU口発生回路であり、パ1ノー計算回路6から出力
される音戸1パヮーデークPjが1つj :> Pl+
ノド、3.1)(l r I)、i < I’l+
17)どき、PJ<Puのとぎにぞれ・ε゛れ比較器7
がらの指令にJ、り但分解能分4fi I’!l路E3
、高分解能分析回路り、げ口発生回路1oが起動ηるよ
うになっ(いる。尚1.比較器7に設定されるしきい値
pl+、1つ愛(〈[)h)は実験的に定められるしの
(゛あり、明らかに異なる1ζ1?゛1、及び了?°−
の音声パワーに基ついて、PI+を越える高パワー領域
を母?清のへ〇jiパワー領域、1)11以ト、[)女
以上となる中バ1ノー領域を子畠の音声バ「ノー領域、
再にPJを下回るIltパソー領域を無名声パワー領域
どしている。
次に、第1図に示′?I装置の作動につい(−説明する
。第2図は、音声信号をサンプリングした後の作動を示
す−フローチ1?−1〜であり、木)[1−チ17−1
−に従って音声信号の分析が行なわれる。
。第2図は、音声信号をサンプリングした後の作動を示
す−フローチ1?−1〜であり、木)[1−チ17−1
−に従って音声信号の分析が行なわれる。
まず、マイク1から人力する音声信号をリンプリングレ
ー1−10K l−1z (100μsec毎)テ゛リ
ーンブリングし、当該リンプリングアータがバッフ戸メ
モリ5に順次格納されてゆく1.ぞの過程で、まず、第
3図に示りJ、うにバラフッ・メモリ5内の初めから3
2データ(1フレーム)かパワー4界回路6に入力し、
パワーti停回路OC゛の前記(1)式に従う演鈴結果
P、i(1つJ iii g)■)がP女≦Pj≦pl
+どなると、比較器7からの指令により、高分解能分析
回路9が起W)」L、バッファメモリ5から−1−記パ
ワー訓讐に用いた32データを含む1024テータ(3
2フレーム)を人力して1024点F「−「4井、すな
わら高分解能の分析を行ない、その分析結果を出力りる
。次にバッファメモリ5内の次の32データ(1フレー
ム)がパワ−4筒回路6に入力し、パワーも1弾回路6
での演紳結果Pjが(Pj計算■)がPj>[〕第1ど
なると、比較器7からの指令にJ、す、低分解能分析回
路8が起!’、II L、バッフj・メしり5から上記
パワー61算に用いた(32)−夕を人力して、32点
1:F]甜算、りなわら低分解能の分(hを()4fい
、−ぞの分析結果を出力りる3、また、バ゛ ラフ1メ
ヒリ!〕内の更に次の32データ(1フレー11)がパ
1ノー51樟回路0に人力し、パ1ノーtI停回路(3
での(す■綿結果Pj(r−’j甜t、> ()]))
がP、i<Pi2ど4【ると、比較器7からの指令によ
り、Ll」発生回路10が起動し、Uロデータを出力、
りなわら当該高声データを無FS !” Iハ翼としく
その分析出力をhなう。
ー1−10K l−1z (100μsec毎)テ゛リ
ーンブリングし、当該リンプリングアータがバッフ戸メ
モリ5に順次格納されてゆく1.ぞの過程で、まず、第
3図に示りJ、うにバラフッ・メモリ5内の初めから3
2データ(1フレーム)かパワー4界回路6に入力し、
パワーti停回路OC゛の前記(1)式に従う演鈴結果
P、i(1つJ iii g)■)がP女≦Pj≦pl
+どなると、比較器7からの指令により、高分解能分析
回路9が起W)」L、バッファメモリ5から−1−記パ
ワー訓讐に用いた32データを含む1024テータ(3
2フレーム)を人力して1024点F「−「4井、すな
わら高分解能の分析を行ない、その分析結果を出力りる
。次にバッファメモリ5内の次の32データ(1フレー
ム)がパワ−4筒回路6に入力し、パワーも1弾回路6
での演紳結果Pjが(Pj計算■)がPj>[〕第1ど
なると、比較器7からの指令にJ、す、低分解能分析回
路8が起!’、II L、バッフj・メしり5から上記
パワー61算に用いた(32)−夕を人力して、32点
1:F]甜算、りなわら低分解能の分(hを()4fい
、−ぞの分析結果を出力りる3、また、バ゛ ラフ1メ
ヒリ!〕内の更に次の32データ(1フレー11)がパ
1ノー51樟回路0に人力し、パ1ノーtI停回路(3
での(す■綿結果Pj(r−’j甜t、> ()]))
がP、i<Pi2ど4【ると、比較器7からの指令によ
り、Ll」発生回路10が起動し、Uロデータを出力、
りなわら当該高声データを無FS !” Iハ翼としく
その分析出力をhなう。
以■ζ同様に、則1次バツノi・メしり55内の32.
i’−タ(1)1ノーム)イ゛′つによるバ[)=51
停がi′iナワれ、該r’1j”パ■ノー1〕jがI)
、i :> p I+ ’、tらば32 点F F
1’ it C’W、P u ≦Pj ≦I〕l+なら
ば(例エバP J ni IJ (41) 1024点
F F T ii口卆、1〕j<2丈ならば、10デー
タ出力がなされ、例えば、入力する単音節吉川信号に第
3りるづべての100μsec毎の音声データについて
の上記分析結果が当該単音節音声信号の特徴抽出データ
となる。
i’−タ(1)1ノーム)イ゛′つによるバ[)=51
停がi′iナワれ、該r’1j”パ■ノー1〕jがI)
、i :> p I+ ’、tらば32 点F F
1’ it C’W、P u ≦Pj ≦I〕l+なら
ば(例エバP J ni IJ (41) 1024点
F F T ii口卆、1〕j<2丈ならば、10デー
タ出力がなされ、例えば、入力する単音節吉川信号に第
3りるづべての100μsec毎の音声データについて
の上記分析結果が当該単音節音声信号の特徴抽出データ
となる。
ここで、通常前えうるハードウェアで構成した低分解能
分析回路8、高分解能分析回路9におけるFFT計算時
間は、32点の場合的470μsec 、、10.24
点のj54合約30m SOc、と4Tるが、平均的な
1発声中に含まれる無音声区間(Pj<p!l>が全区
間のj)0%、l」音区間(P j > P l+ −
)が40%、子音区間(P’u ≦Pj ≦Pt+)が
10%とりるど、1ナンブリンクuyr間3.2m s
ec。
分析回路8、高分解能分析回路9におけるFFT計算時
間は、32点の場合的470μsec 、、10.24
点のj54合約30m SOc、と4Tるが、平均的な
1発声中に含まれる無音声区間(Pj<p!l>が全区
間のj)0%、l」音区間(P j > P l+ −
)が40%、子音区間(P’u ≦Pj ≦Pt+)が
10%とりるど、1ナンブリンクuyr間3.2m s
ec。
(100,cz’sec、X 32)の1フレームデー
タを分析づるための平均処理時間TSは T S−(OX o、!i+ 0.47 X O,4+
30X (11)−3,2m5ec。
タを分析づるための平均処理時間TSは T S−(OX o、!i+ 0.47 X O,4+
30X (11)−3,2m5ec。
となり、音声信号の実時間で゛の分析が川面となる。
(尚、無音声区間での分析+cli間はケ]」どし−(
いる。) また、バッフアメ七り5の8吊につい゛(者えると、高
分解能分析を行なう間(30mseC,)にリンプリン
グされるデータ数は (10x 103 x 30x 10−3 ) = 3
00個となり、このデータ数からこの間に不要となるデ
ータ32個を差し引さ、2G8個のデータが−(配高分
解能分析を行なう間に増えることになる。
いる。) また、バッフアメ七り5の8吊につい゛(者えると、高
分解能分析を行なう間(30mseC,)にリンプリン
グされるデータ数は (10x 103 x 30x 10−3 ) = 3
00個となり、このデータ数からこの間に不要となるデ
ータ32個を差し引さ、2G8個のデータが−(配高分
解能分析を行なう間に増えることになる。
一般に、」′?)は10フレーム以上゛つづかないこと
を考慮すれば、バッフアメ七り;)の8早は、高分醒能
分41i 11.1iに必要’、r1024個のノ゛−
タ分に 2〔;8x 10= 2680個のデータ分を
加え、++704の容重1があれば−1づンCある。
を考慮すれば、バッフアメ七り;)の8早は、高分醒能
分41i 11.1iに必要’、r1024個のノ゛−
タ分に 2〔;8x 10= 2680個のデータ分を
加え、++704の容重1があれば−1づンCある。
上記のように、本発明の音声(A舅分411方法に従つ
C作動(]る第1図に示した装置i/((は、低分解1
1ヒ分析回路ε3、及び高分解能弁41Hijl路9を
111に、!1速江1り処理を行うバードウ1jI構成
にし4〔く(ち、全体どし支の分(11を高声が光Uら
れイ)実11.j間で実<−JrlることがでさるJ、
う(ごkる。
C作動(]る第1図に示した装置i/((は、低分解1
1ヒ分析回路ε3、及び高分解能弁41Hijl路9を
111に、!1速江1り処理を行うバードウ1jI構成
にし4〔く(ち、全体どし支の分(11を高声が光Uら
れイ)実11.j間で実<−JrlることがでさるJ、
う(ごkる。
(7) 発明の詳細
な説明してさたように、本発明によれば、音声信号の・
う15低分解能ぐ一1分分析可能な母?1区間、高分解
能が必要な子音区間、分析の必要のない無音区間を、そ
れぞれ音声パワーによって判定し、該判定効果に基づい
て、高分解能分析、低分解能分析、及び無音声15号判
定を行なうJ:うにした!こめ、特に高速演粋処理を行
なわなくても、音声信号を実時間で分41I?Iること
ができるようになる。
う15低分解能ぐ一1分分析可能な母?1区間、高分解
能が必要な子音区間、分析の必要のない無音区間を、そ
れぞれ音声パワーによって判定し、該判定効果に基づい
て、高分解能分析、低分解能分析、及び無音声15号判
定を行なうJ:うにした!こめ、特に高速演粋処理を行
なわなくても、音声信号を実時間で分41I?Iること
ができるようになる。
第1図は、本発明に係る音声信号分析方法に従って作動
を行なう音声分析装動の一実施例を示り゛ブI」ツク図
、第2図は、第1図に示づ一装置1′りにJ3けるデー
タサンブリング後の作動を示ずフ1]−ヂ17−1〜、
第3図は第1図に示81装置にお1ノるデータ(ノンブ
リング後の作動状態の一例を示す説明図である、。 1・・・マイク 2・・・増幅器 3・・・リンプルホールド回路 4・・・A/D変換器 5・・・バッノアメしり6・・
・パワー計算回路 7・・・比較器8・・・低分解能分
析回路 9・・・高分解能分析回路10・・・ゼロ発l
生回路 特 許 出願人 富士通株式会え1
を行なう音声分析装動の一実施例を示り゛ブI」ツク図
、第2図は、第1図に示づ一装置1′りにJ3けるデー
タサンブリング後の作動を示ずフ1]−ヂ17−1〜、
第3図は第1図に示81装置にお1ノるデータ(ノンブ
リング後の作動状態の一例を示す説明図である、。 1・・・マイク 2・・・増幅器 3・・・リンプルホールド回路 4・・・A/D変換器 5・・・バッノアメしり6・・
・パワー計算回路 7・・・比較器8・・・低分解能分
析回路 9・・・高分解能分析回路10・・・ゼロ発l
生回路 特 許 出願人 富士通株式会え1
Claims (1)
- 予め音声パワー領域とじて、該パワーの大ぎさに応じて
、高パワー領域、中パワー領域、及び低パワー領域の三
領域を定め、入力音声信号より得られた音声パワーが、
高パワー領域に屈Jる時に当該音声信号を母音の音声信
号としC低分解能分析し、中パワー領域に屈づる時に該
音声信号を子音の音声信号として高分解面分(41し、
低パワー領域に屈する時に当該入力音声f3号を無音声
信号ど判定し°C音声信号の分析を行なわないことを特
徴とする音声信号分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58163482A JPS6055400A (ja) | 1983-09-06 | 1983-09-06 | 音声信号分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58163482A JPS6055400A (ja) | 1983-09-06 | 1983-09-06 | 音声信号分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6055400A true JPS6055400A (ja) | 1985-03-30 |
Family
ID=15774707
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58163482A Pending JPS6055400A (ja) | 1983-09-06 | 1983-09-06 | 音声信号分析方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6055400A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100793624B1 (ko) * | 2000-09-14 | 2008-01-11 | 에프엠씨 테크놀로지스 에스.아. | 제품하역조립체 |
-
1983
- 1983-09-06 JP JP58163482A patent/JPS6055400A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100793624B1 (ko) * | 2000-09-14 | 2008-01-11 | 에프엠씨 테크놀로지스 에스.아. | 제품하역조립체 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lobanov | Classification of Russian vowels spoken by different speakers | |
US20010010039A1 (en) | Method and apparatus for mandarin chinese speech recognition by using initial/final phoneme similarity vector | |
JPS6055400A (ja) | 音声信号分析方法 | |
Tzudir et al. | Low-resource dialect identification in Ao using noise robust mean Hilbert envelope coefficients | |
Fu et al. | Classification of voiceless fricatives through spectral moments | |
Rana et al. | Effect of windowing on the calculation of MFCC statistical parameter for different gender in Hindi speech | |
JPH05307395A (ja) | 音声合成装置 | |
JPH0193799A (ja) | 音声ピッチ変換方法 | |
Jyotishi et al. | A novel feature for nasalised vowels and characteristic analysis of nasal filter | |
Panat et al. | Affective state analysis of speech for speaker verification: Experimental study, design and development | |
Glinski | Diphone speech synthesis based on a pitch-adaptive short-time Fourier transform | |
JPH0194398A (ja) | 音声標準パターンの作成方法 | |
JPS5854400A (ja) | 音声出力編集方式 | |
JPH0756590A (ja) | 音声合成装置、音声合成方法及び記録媒体 | |
Zhang et al. | Speaker idiosyncratic intensity and mouth opening-closing variations: the case of English | |
Waardenburg et al. | The automatic recognition of stop consonants using hidden Markov models | |
JP2880508B2 (ja) | 音声の規則合成装置 | |
JP2861005B2 (ja) | 音声蓄積再生装置 | |
Nakamoto et al. | The KanNon system displaying speech signals | |
JP2665902B2 (ja) | 音声合成/認識方法 | |
JPS5995597A (ja) | 音声特徴パラメ−タ作成方式 | |
JPS59157698A (ja) | 音声合成装置 | |
JPS5816295A (ja) | 音声分析合成方式 | |
JPS63223696A (ja) | 音声パタ−ン作成方式 | |
Kumar et al. | Recognition of consonants using an ARMA model of the speech signal |