JPS5895398A - 音声メッセージ識別方法 - Google Patents

音声メッセージ識別方法

Info

Publication number
JPS5895398A
JPS5895398A JP19355581A JP19355581A JPS5895398A JP S5895398 A JPS5895398 A JP S5895398A JP 19355581 A JP19355581 A JP 19355581A JP 19355581 A JP19355581 A JP 19355581A JP S5895398 A JPS5895398 A JP S5895398A
Authority
JP
Japan
Prior art keywords
code
pattern
input
value
voice message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP19355581A
Other languages
English (en)
Other versions
JPS6331797B2 (ja
Inventor
湯浅 啓義
大村 皓一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP19355581A priority Critical patent/JPS5895398A/ja
Publication of JPS5895398A publication Critical patent/JPS5895398A/ja
Publication of JPS6331797B2 publication Critical patent/JPS6331797B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は被制御機器を音声メツセージによって操作する
ための音声メツセージ識別方式に関するものであり、そ
の目的とするところは、所要メtり容量が小さくてすみ
、しかも高速度で照合処理を行なうことができるように
した音声メツセージ識別方式を提供するにある。
以下本発明の構成を図示実施例によって説明する。第1
図は本発明による音声メツセージ識別装置のハードウェ
ア的な概略構成を示すブロック図であり、第3図は同装
置の処理機能をブロック化して示したものである。まず
第1図において音声はマイク+11から入り、づリアシ
づ(2)で高域強調され、LOGアyづ13)で対数変
換されてデシベル値に比例する出力になり、ACアンづ
(4)で交流成分のみが増幅される。次に低周波用フィ
ルタJs yり15)で低周波成分(I KH,以下)
をとり出し、高周波用フイI+7タバシク(61で高周
波成分(5KHz〜12KHz)をとり出す。フィルタ
バンクi51 t6)は各帯域毎に帯域フィルタ(Fl
)(F2)、整流回路(DI) (D2)、積分回路よ
りなる平均化回路(Ml)(M2)で構成されている。
低周波用フィルタバンクの積分回路(Ml)は時定数5
〜10 msθC程度、高周波用フィルタバンクの積分
回路(M2)は時定数1〜2.m5ec程度に設定され
ている。両フィルタバシク151 telの各出力は差
動アシづ(7)に入力され、その出力すなわち高周波成
分と低周波成分の差が時定数20m5ec程度の積分回
路よりなる平均化回路(8)で平均化される。
この平均化回路(8)から出力されるアナロジ信号波形
y (tlは入力音声中に含まれる有声音■と無声音U
の比率を表わしている。第2図(al (blは当社の
音声制御式あんま椅子の音声入力例「もみ下げセット」
に対するアナ0ジ信号波形y(t)を示したものであり
、本実施例では有声音Vはプラス、無声音Uはマイナス
の値をとっている。この信号電圧y (t)をV判定回
路(9)およびU判定回路110)に加え、りDツク発
生回路和からの90ツクCKによって一定周期毎にサン
づり二ノタする。両判定回路j91 +101にはそれ
ぞれ基準電圧RVおよびRUが加えられ、サンづリンジ
時にアナロジ信号電圧がづラス側の基準電圧RV以上で
あれば有声音V1マイナス側の基準電圧RU以下であれ
ば無声音USRVとRUとの間の値であれば無音Sと判
定する。第2図(al (blにおいて、z (tlは
信号処理回路+123から得られるVU判定出力信号を
示しており、無声音Uに対しては−1、無音Sに対して
は0、有声音に対しては+1の値をとるようになってい
る。なお第2図(alはLOGアンづ(3)を使用した
場合を、また同図(b)はLOGアップ(3)を除去し
た場合をそれぞれ示しており、両者を比較すわば明らか
なように、入力音声をフィルタバンク+51 +61の
前でLOG変換しておくと、有声音■と無声音Uの識別
を確実に行なえるものである。
次にLOG′Pυづ13)を通す前のつりアンづ12)
の出力は、例えばO−0,5KH2の帯域フィルタ(F
、)、整流回路(D3)、平均化回路(Ml)からなる
フィルタバンク(13)と、0.5〜1.0KH2の帯
域フィルタ(F4)、整流回路(D4)、平均化回路(
M4)からなるフイ1しタバンク(14)によって各周
波数飴域の特性成分を抽出される。フィルタバンク(1
3)の出力である低域音VI。
と、フィルタバンクQ41の出力である高域音vHとは
差動アンづ(15)により比較され、平均化回路θ6)
により平均化される。平均化回路(16)の出力はりD
ツクCKに同期して動作する嶌VL判定回路07)およ
びV、(+判定回路α句にそれぞれ入力され、平均化回
路(16)の:出力電圧が基準電圧RLよりも低いとV
L酸成分判定され、また基準電圧RHよシも高いとvH
酸成分判定され、RLとRHO間であり、ば中域音vM
と判定される。信号処理回路(19)はVHlvL、お
よびvMの各成分を、そhそれ+1.0.−1  の出
力に3値化するものである。
信号I!L理1o1路H(++i)の各出力はI10ホ
ートレ0)を介してCPUt2幻に読み込まれるもので
あり、読み込tiたデータは一旦入力パターンメtり翰
に格納さり。
、標準パターンメモリ(23jに記憶さhている複数個
の標準パターンのうちどれに一番近いかを照合判定され
て、その照合判定結果に基いて被制御機器(24)を制
御するようになっている。これらの照合判定動作等はC
PU(21)とjoタラムROM Ig5j、およびワ
ー+ングRA M +26)を有するマイクロコンヒユ
ータレηにより行なっているものである。
次に第3図は本発明による音声メツセージ識別装置の音
声メツセージ識別処理機能をづロック化して示したもの
である。同図に示すように音声メツセージ識別装置は音
響処理部シ杓と、周波数分析部(29)と、符号化処理
部(30) 七、照合判定部(31)とから構成さhて
いる。このうち音響処理部(2ねと周波数分析部(29
)については、第1図の説明において詳述したような構
成を有しており、フィルタバンク(5)(6)およびフ
ィルタバンク[13H+41の後段に接続された判定回
路(32+331は差動アシづill U5)から信号
処理回路HQ9)までの回路によって構成されているも
のである。またI10ボート+20+よりも後段の回路
は上述のようにマイクロコンヒユータレにより構成され
ている。符号化処理部(30jにおいて、(34Iは無
音区間を検出するためのSカウンタであり、有声音vt
たは無声音Uが検出さiするとリセットされて音声入力
動作を開始させ、その後無音Sが一定時間(約0.2秒
)以上続くとカラシトアラづして音声入力動作を停止す
るようになっている。音声入力動作は5〜2Q m5e
cのサンづリシジ周期(実施例では5mBeQの周期)
に従って行なわれ、一方の判定回路t32)からは有声
音V、無声音U、および無音Sの各符号とその継続時間
とが入力されてメ七りに格納され、才だ他方の判定回路
(33)からは高域音VH−,中域音vM、および低域
音vLの各符号とその継続時間とが入力されてメモリに
格納されるようになっている。このようにしてメ七りに
一旦格納さhた信号は波形整形処理部(3均(36)に
より整形処理される第4図(a)は波形整形処理部(3
0において波形整形される曲の信号波形を示しており、
また第4図(b)は波形整形処理さiた後の信号波形を
示している。波形整形処理は第4図(alの矢印a1に
示すように、有声音Vまたは無声音Uの継続時間の短い
もの全無音Sとする第1の処理と、第4図(a)の矢印
a2〜a6に示すように、有声辞Vまたは無声音Uの継
続時間が比較的長いものの次に来る無音Sの期間が短く
、かつ無音Sに続く次の符号が無音Sの前の符号と同じ
であれは、無音Sを消すようにする第2の処理とから構
成されているものである。第5図はかかる波形整形処理
部(3均における波形整形処理の手順を示すフローチャ
ートである。
この)0−チャートは、符号V、U、Sとその継続時間
とのリスト形式によりメtりに格納されたデータを演算
処理して新たなリスト形式のデータを作成し、P)びメ
tりに格納するためのづ0クラムを示している。まず整
形前のリストはその最初の符号がSであるか否かを判定
し、最初の符号がSでなければその継続時間が基準値T
1よシも大きいかどうかを判定さhる。継続時間が基準
値Tlよりも大きくなければ、その符号VまたはUを符
J8Sに変換して符号Sとその継続時間を整形後のリス
トとしてメモリに書き込む。また継続時間が基準値Tt
よりも大きければ、その符J8′vまたはU七その継続
時間とを整形後のリストとしてぞの才捷転写する。そし
て次の符号Sの継続時間が基準値Txよりも短いかどう
かを判定し、基準値T2よりも短かければ、その符号S
の次の符号は符号SのtTJの行゛号と同じであるかど
うかを判定する。同じでなけhば符号Sとその継続時間
とをその寸ま整形受のリストに転写する。また同じであ
わば符号Sを前後の符号UまたはVに変えて、その変え
た後の符号とその継続時間とを整形後のリストとしてメ
tりに書き込む。さらに次の符号S Kっ1ハでその継
続時間が基準値T2よりも短いか否かを再び判定する。
以上の演算処理動作は整形前のすべてのリストが変換処
理さね、る捷で続けられるものであり、変換処理が終了
すると整形後のリストの最後の符号がSであるかどうか
を判定し、最後の符号かSであればその符号Sを整形後
のリストから除去して、再び最後の符号がSであるかど
うかを判定する。しかして最後の符号がSでなくなれば
一連の波形整形処理動作を終了するものであり、このと
きにメ[りには、第4図(b)に示すような波形整形処
理さり、た1δりが符号U、V、Sとその継続時間との
リスト形式で格納されていることになる。また他方の波
形整形処理MS+36+においても同様の演算処理動作
が行なわり、るものであり、■符号vHおよび符号VL
のうち継続時間の短いものを符号vMに変換する動作と
、■符号vHと符号vHとの間に挾捷ハた継続時間の短
い符号VMを符号vHに変換する03作と、■符号VL
と符号vLとの間に挾オれた継続時間の短い符号vMを
符8vLに変換する動作とを行なうものである。
次に第6図は上記波形整形処理部側(361Kより形成
された2系統のリストを1系統のリストにまとめるため
の]′Jポジット符号化処理部07)の処理動作を示す
フD−チ1フートである。その動作について説明すると
、まず波形整形処理部(3(へ)によって形成された符
号U、V、Sとその継続時間のリストを調べて、最初の
符号がUまたはSであるかどうかを判定する。最初の符
号がUまたはSであれば、その符号UまたはSとその継
続時間とがコンポジット符号リストとしてメtりにその
まま転写さf)る。寸だ最初の符号がUまたはSではな
くてVであるときには、波形整形処理部(30に1つて
形成された符号VH+ vM+ vLとその紺、続時間
のリストを調べて、符号■の縦組:時間中にまず礼号v
Hが含寸冶ているかどうかを判定して含捷れている場合
には、符号VHとその継続時間とをコシポジット符号リ
ス1〜としてメtりに転写する。甘た符号vMおXひv
Lについても、符号Vの継続時間中に含−まれている場
合には符号VM、VLとその継続時間とが七ねそれ]ン
ホジット符号リストとしてメtりに転写さhる。
以上の工うにしてコシポジット符号リストが得られるも
のであるが、本実施例の1うに、符号V、U、Sの系統
と、符号vHjVM、vLの系統とについて別々に波形
整形処理を行なってから、コシポジット符号化する方法
(第7図(al参照)の他に、v;7図(b)に示すよ
うに先にコシポジット符号化を行なってから波形整形処
理を行なう方法もあり得るものである。この場合には符
号tJ、V、V、。
VLの各論理値に基いて第1表に示すような論理演算を
行なうことによりコシポジット符号化を行なうものであ
る。
第  1  表 次に第8図は、階層化処理部の樽の処理動作を示すフ0
−チセートである。階層化処理部(381は後段の照合
判定部+31)におけるパターシ照合を音声の構造に合
わせて段階的に行ない得るようにするためにコシポジッ
ト符号リストから第1階層リストと第2階層リストとを
作成するものである。このうち第1階層リストについて
は、符号U、V、Sとその継続時間のみからなる符号リ
ストと同一であるので、波形(「形処理部ばの出力リス
1−をその1甘転写するか、あるいはコンポジット符号
リストにおける符号vH・vM+ v、、をすべで符号
y K !き換えることによって容易に得られるもので
ある。次に第2階層リストについては]ンボジット符号
リストのうち−続きの符号VH,VL、VMとその継続
時間からなる符号リストを転写することによって得られ
るものである。したがって第1階層リストの中に符号■
がn個含まれているものとすると、第2階層リストもま
たn個得られるようになっている。
さらに第9図は、上述のようにして得られた第1階層リ
ストと第2階層リストについて符号の継続時間を正規化
するための正規化処理部(39)の処理動作を示すフ0
−チセートである。正規化処理部(39)は符号U、V
、Sとその継続時間からなる第1階層リストと、符号v
H+ VM + v、、とその継続時間からなるn個の
第2階層リストについてその継続時間の総和が一定にな
るように時間軸上の正規化を行なうものである。第2表
は@1階層リストにっいて1.符号V、U、Sとその継
続時間Tkおよび旧規化された継続時間T8の関係を示
したものであり、継続時間Tkはサンプル個数に対応し
ている。
gg2表 かかる正規化処理動作をig図のつD−チャートによっ
て説明す力、ば、まず符号U、S、Vの全継続時間Tk
の総和ΣTl((−16623)を求めて、これから正
規化係数Ps−1000/ΣTkを求める。
次に各符号U、V、Sについてその継続時間Tk(j)
に正規化係数P6を乗算して正規化された継続時間Te
1)を順に求めて行くものである。以上のようにして@
1階層リストについての継続時間の正規化動作が完了す
ると、n個の第2階層リストについてそれぞれ同様の操
作により継続時間の正規化処理を行なうものである。第
3表(a)〜(d)は、第1階層リスト(第2表参照)
に含まれる4個の符号Vについて作成された第2階層リ
ストとその正規化された継続時間とをそれぞれ示したも
のである第3表(−) 第  3  表 (b) 第3表(Q) 第 3表(d) 第3表(、)は第2表に示す第1階層リストの最初の符
号V(継続時間3415 )に対応する第2階層リスト
Vtを示しており、以下順に第3表(b)〜(alは継
続時間が3621 、1437.2637の各符号Vに
対応する第2階層リストV2〜V4を示している。以上
のようにして継続時間の正規化を行なうと、発声速度の
影響を受けにくくなるので、認識率を高めることができ
るものである。なお第2表及び第3表に示した継続時間
Tkのデータは音声メツセージ「せなかをさすれ。」を
50μsecのサンつり:7ジパルスを用いて分析した
場合のシ三ユレーショシザー夕であって、5m5ecの
サンづリシグパルスを用いて分析を行なう場合には継続
時間(すなわちすニア″jリーJジ個数)は表の値の1
00分の1になるものである。
以上のようにして正規化された第1階層リストの符号U
、V、S、および第2階層リストの符号vH1vM、v
Lハ、3値打号化処理部(40)において+1、o、−
iの3値打号に変換されるものである。
すなわち、まず第1階層リストにおける符号Vは+1.
符’+Uは−1,符号Sは0にそれぞれ対応させ、また
第2階層リストにおける符号vHは+1、符号vMはO
6符号vLは−1にそれぞれ対応させるものである。こ
のようにすれば、距離計算照合部(41)において標準
パターンメモリ(42)の内容と第1階層リストおよび
第2階層リストの内容とを照合するときに計算速度を著
しく高速化することができるものである。すなわち距離
計算照合部(41)は標研パターンメtすI42)に記
憶された+1.0.−1の3値化されたデータと3値打
号化処理部(40)から出力されるデータとの相互相関
係数を求めるようになっているものであるが、データが
+1,01−1の3通りしかないために、数値の乗算を
必要とせず、単なる論理演算と加減算とによってきわめ
て高速度で相互相関係数を計算することができるもので
ある。各標準パターンについてそhぞれ計算された相互
相関係数は1次階層識別部(4:llと2次階層識別部
144)に記憶さh1判定処理部・14句において大小
関係を比較さtr、相互相関係数が大きいものほど似た
パターンであると判定されるものである。
ここに相互相関係数とは、時間もの変化に対する標準パ
ターンの値の変化をf+(tlとし、1次階層リストや
2次階層リストのような入カバターンの値の変化を12
(tlとしたときr(次式で与えられるものである。
第10 (ai (h)は時間tの変化に対する杼準バ
ターyの値の変化f t(t)と、入カバターンの値の
変化f2(1)とをそれぞれ示すものであり、同図に示
すように、7’1(t)とfx(tlとは+1.0.−
1の3通りの値しかとらないので、両者の積f +(t
) f 2ft)の値も+1゜0、−1のいす力かの値
しか吉らないことになシ、このために相互相関係数の計
算は非常に容易になるものである。かかる相互相関係数
112(τ)はマイクロコシピユータを用いて計算する
場合には、実用上次式のような数値演算により充分に計
算できるものである。
ところで相互相関係数f=t(τ)は互いに乗算される
棚部パター′Jfl(t)七人カバターy fx (を
−τ)との位相差τの関数となっており、ある特定の位
相差τにおいて最大の値をとるようになっている。そこ
で距離計算照合部(41)においてはこの相互相関係数
flz(τ)が最大になる点を求めて、その最大値を各
標準パターンについて計算し、1次および2次階層識別
部[43)+441にそれぞれ記憶させ、最後に判定処
理部I4均においてその大小関係を比較して入カバター
ンに最も近い標桑バ9−ンを判定1−でいるものである
ところで、本発明の実施例においては音声メツセージか
ら抽出した符号パターンを標準パターンと照合する際に
、符号パターンを1次階層リストと2次階層リストとに
分離して、1次階層リストに関する照合を行なった後に
、2次階層リストに関する照合を行なう工うにして、照
合処理を段階的に行なっているが、これは音声の巨視的
な横・造に対応する特徴を先に抽出した後で、次に音声
の微視的な特徴に対応する特徴を抽出するようにした方
が、音声の認識を効率的に、カ・つ確実に行なうことが
できるからである。第11図は音声の特赦を階層化して
友わしたものであり、音声はまず声帯振動を伴う有声音
■と、声帯振動を伴わない無声音Uとに大きく分類され
、有声音Vは顎の開きの広いa声音/a/夕1し−づと
、顎の開きの狭い有声音/1/グ11.−づとに分類さ
れる。顎の開きの広い有声音は上述の高域音vHに対応
し、音声の第1ホルマントの周波数が比較的高く、その
周波数帯域は500 Hz〜IKHzに多く分布してい
る。また顎の開きの狭い有声音は上述の低域音vLに対
応し、音声の第1ホ)レマントの周波数が比較的低く、
その周波数帯域はO〜500H2に多く分布している。
顎の開きの広い有声音には、母音/8./ 、 /り/
、/ε/などがあり、また顎の開きの狭い有声音には、
母音/i/ 、 /e/ 、 10/ 、 /u/や、
鼻子音や、その他の有声子音などがある。また無声音U
には定常的な無声音すなわち無声摩擦音UPと、過渡的
な無声音すなわち伊声破裂音UBとがある。
しかして、音声メツセージを1語1語明確に認識しよう
とすれば、これらの音声の各特徴をすべて識別する必要
があるが、照明器具や自動扉、あるいはあんま椅子など
を音声メツセージを用いて制御する場合には、すべての
子音および母音を完全に識別する必要はなく、もう少し
巨視的な特徴を抽出するだけでも充分に実用になるもの
である。このような音声の特徴を巨視的な特徴から11
に列挙して行くと次のようになる8 1)有声音■であるか!rIt声音Uであるか。かかる
特徴は音声の周波数スペクト1しの中に低域成分(IK
H,以下)が多いか、高域iえ分(5にトI2〜12K
H2)が多いか((よって判定できる。
2)有声W V ”’Cあねば、顎の開きの広い有声音
Vll (/a7ジ;し−づ)であるか、顎の開きの狭
い有声音V1.(/i/ジ1[、−づ)であるか。かか
る特徴は有声音の周e1.数スペクト11.中に高域音
VH(500H2−I K、 Ih )か多いか、低域
音Vl、 (0〜500 Hz )が多いかによって判
定できる。
3)無声音Uであわば、郁声摩擦音UFであるか、無声
破裂音UBであるか。かかる特徴は無声音が定常的で冴
、るか、過渡的であるかによって判定できる。すなわち
力1声音Uの継続時間が長いか短いかによって判定でき
る。
4)音声メツセージの中で、各特徴vI■、vL、(J
B、UF−等の占める時間、捷たは音声メツセージの継
続時間の中で占y)る割合。かかる特徴は上述の第1階
層リストや第2階層リストにおける継続時間を参胆すh
ば判定できる。
その他にも、音声の第2ホルマントが高いか低いかによ
って前古の母音(/j、/ 、 /e/に対応)と高舌
の母音(/u/、10/に対応)とを識別することがで
きるが、そこ1で微視的な特徴を抽出しなくても、機器
を制御するための音声メツセージは充分に認識できるも
のである。
例えば第12図は、あんま椅子用の音声人力/5ena
kaosasure/の周波数スペクトルの例であり、
音声入力を20KH,でサンづリングしたものを200
サンプル(10meec)をi’:lレ−ムとして、2
0次のLPG分析を行なったものであるが、無声音/S
/は5KH2以上にパワーが集中しており、また有声音
はI KH2以下にパワーの山があることがわかる。さ
らに有声音では/a/ 、 10/のパワーは500 
Hz 〜I K Hzに集中し、/n/ 、 /u/は
0〜500 H2にパワーが集中していることがわかる
。さらに有声音は、同一のスペクトルが各音素に対応し
て数個(数十m5ec)続いていることがわかる。
捷た第13図(alは上記と同じ音声入力に対する有声
音成分Vと無声音成分Uとの変化を示してお如、第13
図(b)は有声音のなかの高域成分vHと低域成分vL
との変化を示しているものであるが、まず第13図(a
lにおいては無声音/s/ 、 /に/に対応する部分
がUを示し、/na/ 、 /ao/ 、 /a/ 、
/ure/に対応する部分がF!A確にVを示している
。、また第13図(b)においては/n/ 、 /sa
/ に対応する部分がVl、で、/a/ 、 /ao/
 、 /e/に対応する部分がvHになっている。した
がって、上述したように有声音V1無声音U1無音Sに
対応する1次階層リストと、有声音のなかの託域音VH
2中域音VM、低域音V、に対応する2次階層リストを
予め記憶された標準パターンと照合すれば、大抵の音声
メツセージは識別できるものである。
ところが以上のことはあくまでも一般論であって、音声
メツセージの発声者が異なる場合や、あるいは同一の発
声者においても発声速度を変えた如発声の態様を変えた
りした場合には、音節中の無声破裂音を検出できなかっ
たり、あるいは音節中の無声音に挾thた有声音が無声
音化したりするような現象が生じるために、音声メツセ
ージの様々な発声態様にすべて対応できるような標準パ
ターンを作成する必要がある。本実施例にあってはこの
ような微妙な発声の変化による入カバターンの変u1が
あっても音声メツセージを正しく認識できるようになっ
ているものである。すなわち本実施例においては、標準
パターンとして例えば第14図に示すように符号C1,
Ct 、 Ca 、 Ct 、 Cs 、C6の時系列
からなる基本パターンの他に、符号C24、符号C45
のような分岐へターυを付加して、入カバターンを符号
C+ + C24+ Cs 、 C6の時系列からなる
第1の派生パターンや、符号C1,C鵞+ Cs 、C
as 、C6の時系列からなる第2の派生パターンと照
合することも可能と1〜で、音声メツセージの認識率を
高めているものである。
以下具体的な例を挙げながら、標準パターンを構成する
基本パターンと分岐パターン、および派生パターンの概
念について説明する。
音声の入力パターンが変動する最も典型的な例としては
、まず第1に無声破裂音/p/ 、 /l/ 、 /に
/の欠落現象が挙げられる。すなわち第13図(a)を
参照すればわかるように、無声破裂音/に/は過渡的な
無声音であるためにその継続時間が短く、非常に検出し
にくいものである。これに比べると無声摩擦音/6/は
定常的な伸声音であるために第13図(a)に示すよう
にその絹;続時間が長く、その検出が容易である。この
ためにサンづリシジ周期を若干長くすると、無声摩擦音
/s/は検出できても無声破裂音/に/は検出できない
場合が生じ得る。
第15図はこの点を考慮に入れて上記音声入力/5en
akaos’asure/の第1階層リストに対する標
準八ツ−シを構成1〜たものであり、符号U。
S、Vt、S、U、S、VM、S、U、S、Vi、S 
、U、 S 、 V4  の時系列からなる基本パター
ンの他に、符号V1とv2とで侠まれる符号S、U、S
の継続時間に等しい符号Sからなる分岐パターンを設け
たものである。したがって、音声の符号化された入カバ
ターンは1.上記八本ノ軒々−ンと照合されるのみなら
す、分岐パターンによって生じる符号U、 S 、 V
l 、 S 、 VM 、 S 、 U 、 S 、 
VB 、 S 、 U 。
S 、 V4  からなる派生パターンとも照合される
ものであり、したがって無声破裂音/に/が入カッ\タ
ーンから欠落するようなことがあっても音声メッシージ
を正しく認識することができるものである。なお@15
図中に記載した数字■、■は同一の話者の5回の発声パ
ターンを分析した結果、基本パターンに一致した場合が
4回、派生パターンに一致した場合が1回あったという
ことを示すものである。以上のようにs成することによ
り、無声破裂音41/ 、 /l/ 、/に/を聞き落
とすような事態を防止できるものである。
次に第16図(a)〜(c)は音声入力/5enaka
osasure/に含まれる4個の有声音V+−v4に
ついて、それぞり。の2次階層リストに対する標準パタ
ーンを作成した例を示している。このうち第1番目の有
声音V】Kついて説明すると、その基本パターンは符J
j+VM l ”L l ”M I VHI VM I
 vL O時系列カラ構成されており、さちに符号vM
からなる3個の分岐パターンを有している8したがって
この場合には、符号vM、vL、VM、vLの時系列か
らなる第10派生パターシと、符号VPi”L+”M+
VL、vM (7)時系列からなる第2の派生パターン
と、符号vM + Vl、−* vM+ VH、VMの
時系列からなる第3の派生ノーターンとが形成されるも
のである。第16図(alに記載さhた数字■、■、■
などは前と同様に分岐の回数を示している。なお各分岐
パターンの継続時間は、分岐パターyに入らずに基本パ
ターンをその甘ま進んだ場合の継続時間と等しくなって
いる。以上のように標準パターンを構成することにより
、第2階層リストにおける符号VH9Vン1.vLが少
々変動−しても確実に音声メツセージの認識ができるよ
うになっている。
ところでこのような第2階層リストにおける符号VH9
VM、vLの変動の仕方は多種子様であり、−例を挙げ
ると(1′l VL −VH系列がvL−νM系列にな
る場合(例、/ s e n a k a /の/na
/)、(01Vy、 −VM系列がvL−vL系列にな
る場合(例、/ s a s u r e /の/ r
e/ ) 、I)’1) VL −VM系列がVL−V
H系列になる場合(例、/ t o m a r e 
/の/re/)、ヒIVH−vL系列がVHVM系列に
なる場合(例、/5enaka/I) / a k /
 )、紺)符号vHがvL −vH系列になる場合(例
、/sa/)、(へ)符号vHがvL−VH−VL系列
になる場合(例/kata/の7k a t/ )など
の例がある。これらの符号VH,VM、VLの変動の規
則を整理すると犬体次の2つの場合に分類される。
1)前後の音韻の相互作用により、符号VHとVMおよ
び符号VLとVMの相互の入れ代わりが生じること。す
なわち、VH−VL系列がVH−VM系列またはVM 
−Vl系列になり得ること。およびVr。
−VH系列がVL −VM系列またはVM −VH系列
になり得ること。
2)符号VHが前後や、無声音の影響を受けて、符号V
Hの前または後あるいは前後双方に符号Vl、が付加さ
れること。すなわち、符号VHが、VL −VH系列、
VH−VL系列、まタハvt、 −VH−VL系列に入
れ代わること。
音声の入カバターンが変動する他の例としては、母音の
無声化現象が挙げられる。例えば日本人の場合、「私(
ワタクシ)」という言葉を7w a t akusi/
と正確に発音する人よりはむしろ、母音/U/を飛ばし
て/wataksi/ と発音する人の方が多いもので
ある。これは母音/u/が無声破裂音/に/と無声摩擦
音/8/に挾まれているからであり、一般に■無声破裂
音UBと無声破裂音UBに挾まれた1個の母音(例えば
/kiQpu/の/1/)や、■無声破裂音UBと無声
摩擦音UFとに挾まれた1個の母音(例えば/ wa 
ta ku s i/の/u/ ) 、および■無声音
と有声子音に挾まれた1個の母音などは無声化する傾向
が非常に強い。その他にも無声音Uと無音Sの間に挾ま
れた1個の母音(例えば、/d。
ulii a/の/a/)も無声化する傾向が若干ある
。そこで一般に無声音と無声音の間、および無声音と無
声音の間、ならびに無声音と有声子音の間に挾まれた1
個の母音については、その母音の部分を有声音Vとする
基本パターンの他に、その母音の部分を無声音Uとする
分岐パターンを標準パターンに付加しておき、上記特定
の母音が有声音Vとして明瞭に発音さhた場合におあて
は基本パターンにより照合判定することができ、また上
記特定の母音があたかも無声音Uであるかのように不明
瞭に発音された場合においては派生パターンにより照合
判定できるようにしておけば、音声メツセージの認識率
を高くすることができるものである。
次にこのような基本パターンおよび分岐パターンを有す
る標準l\ターシを作成する方法について説明する。標
準パターンを作成する方法には大別して2つの方法があ
り、1つは音声メツセージを構成する個々の音素符号お
よびその継続時間を十−ボード等から入力し、分岐処理
づDグラムにより基本ノーターyおよび分岐1\ターン
を自動的に作1戊する方法であり、もう1つは同一の音
声メツセージを発声の仕方を変えたシあるいは発声者を
変えたりしながら複数回登録し、共通する性質を基本パ
ターンとし、共通しない特異な性質を分岐パターンとし
て登録する学習登録方式であシ、前者は演絆法的なもの
であり後者は帰納法的なものである0 まず前者の方法は、例えば第17図に示すように+−ボ
ード閃)から/lit/、/θ/ 、 /n/ 、 /
a/ 、 /に/ 、 /a/ 、 10/ 、 /e
/ 、 /a/ 、 /a/ 、 /u/ 、 、/r
/ 、 /e/などの各音素符号とその継続時間とを順
次入力して行く方法であり、寸ず各音素符号が有声音V
であるか否かを判定し、有声音Vであれば母音7a/に
ついては符号vHを割り当て、母音/1/と有声子音/
m/、/b/については符号Vr、を割り当て、その他
の有声子音や母音/e/ 、 /u/ 、 10/につ
いては、符号VH9vM、vLのいずれにもなり得るも
のとして分岐I\ターンを作成する。また無声音には符
号Uを、さらに無音には符号Sをそのまま割り当てるよ
うにする。次に継続時間を入力して継続時間の短い無声
音、すなわち無声破裂音については符号Uからなる基本
パターコノの他に、符号Sからなる分岐パターンを付加
する。さらに符号系列を入力して、無声音と無音または
無声音あるいは有声子音とに挾まれた単母音には、符号
Vからなる基本パターンの他に符号Uからなる分岐パタ
ーンを付加するものである。以上のようにすれば、音声
メツセージの認識率を高めるような分岐パターンを基本
パターンに付加した標準J\クーンを自動的に作成する
ことができるものである。
次に学習登録方式について説明する。第18図(al〜
(c)は第2階層リストに対応する符号vH,vM。
VL  75Aらなる標準パターンを作成する場合を示
しており、印119図はその作成手順を示すフローチャ
ートである。まず第18図(alに示すように同一の言
葉を複数回登録し、正規化された時間を10の領域に分
割し、同じ時間領域で符号が変化しない部分を核パター
ンとし、同じ時間領域で符号が変化する部分をvMとす
る。この時点で@18図(biに示すXうな学習基本パ
ターyが作成される。次に同じ時間領域でvMがVLK
なる部分にはVLの分岐パターンを付加する。また同じ
時間領域でvMかvHになる部分にはvHの分岐パター
ンを作成する。さらに同じ時間領域でvHにもvLにも
なる部分はvMの寸まにしておく。この時点で第18図
(c)に示すような分岐パターンを有する学習標準パタ
ーyが形成される。こう1−で得られた学習標準パター
ンは標準バターyメtす4zK登8記憶さhるようにな
っているものである。
しかして本実施例においては、かかる学習登録方式と非
学習登録方式とを折衷した登録処理部(4G)を設けて
おり、第20図にそのフ【コーチャー1−を示す。まず
登録処理部(46)に入力されたチークは第1階層リス
トの内に、S −[1−V系列またはS−■系列がある
か否かを判定され、もしあれば5−U−V系列とS−V
系列のいずれの符号系列をも含むような標準バターyが
形成される。次に第2階層リストについては上述の第1
9図に示すような学習上−ドにより標準パターンを作成
する場合と非学習℃−ドにより標準パターンを作成する
場合とを切シ換え得るようになっ−Cおり、一方のモー
ドでうまく行かないときには他方のモードを使用できる
ようになっている。しかして学習t−ドの動作について
は第19図の)0−チャートにょシすでに説明したので
、非学習七−ドによって第2階層リストに対する標準パ
ターンを作成する場合の動作について、第21図のフロ
ーチャートによシ説明する。まず第2階層リストの最初
の符号がvLであれば、基本パターン5T−v、、と派
生パターンS T −VMとを含む標準パターンを作成
する。
また最初の符号がVHであれば基本パター?7ST−V
L−VHの他に、2つの派生パターン5 T −V M
 −VHとST−vL−VMとを含む標準パターンを作
成する。さらに最初の符号がvMであれば基本パターン
ST−VMのみの標準パターンを作成する。次に最後の
符号が■H2VL、vMのうちのいずれであるか、およ
び最初の符号と最後の符号との間に含まれる各符号がv
L −vH系列か、V■r −vL系列かに応じてそれ
ぞれ、第21図のフローチャートに記載したような分岐
パターシ付きの標準パターンが自動的に形成されるもの
である。
ところでこのようにして第2階層リストに対する標準パ
ターンを作成する場合には、符号vHと符号vLの識別
を正しく行なう必要がある。上述のように符号vHは高
域有声音(/a/グループ)に対応し、符号vLは低域
有声音(/i/ジルーづ)に対応するものであるが、本
発明者らの開発した分析装置にあっては第22図に示す
ようにvH分析系とvL分析系の出力のバランスを調節
するバランス調節用の可変抵抗VRtとオフセット調節
用の可変抵抗VR,とを設けて、母音/&/を発生した
ときには必ず符号VHが検出され、母音/i/を発声し
たときには必ず符号vLが検出されるようにしているも
のである。ところが厳密には話者の個性によってこのバ
ラシスの最適値は異なることがある。そこで本発明者ら
は、母音/e/を自然に発生したときにvH7vL差信
号がゼロになる工うにバランス調整すればよいことを見
出したものである。第23図はその原理を示すものであ
り、同図に示すように母音/a/の第1ホルマントは5
00Hz〜lKH2に分布し、母音/i/の第1ホルマ
ントは0〜500H2に分布しているものであるが、母
音/θ/の第1ホルマントは大体その中間に位置してい
る。したがって母音/e/を基準にしてvHとVLのバ
ランス調整を行なうとバランスの最適値が得らハるもの
である。
最後に2次階層リストについて各符号■H+ ”M +
vLの継続時間等を考慮に入れた照合の方法について説
明する。第24図は2次階層リストの3通りの照合識別
方法を示すフローチャートであシ、最も適当ないずれか
1つの方法を選択して使用するものである。まず第1の
方法は1つの音声メツセージに含まれる複数個の有声音
V、−%について、その中に含まれている符号で最も多
いものはvHであるかvMであるかvLであるかを照合
するものであり、また第2の方法は各有声音Vl” V
nに含まれているvHの割合が入力パターンと標準パタ
ーンとで一致するか否かを照合するものであり、さらに
第3の方法は入カバターンにおけるvMが標準ノ\タコ
ンのvHまたはvLに合致するものの数と、標準パター
ンにおけるvMが入力パターンのvHまたはvLに合致
するものの数とをリストアツブして照合するものである
。しかして音声メツセージ中のすべての有声音v1〜v
nについて、上記3種類の照合方法のうち最も適当ない
ずれか1つの照合方法を用いて入力パターンと複数の標
準パターンとを照合し、最もよく特徴の一致する標準パ
ターンを判定するようにしているものである。
本発明は以上のように構成されており、音声入力から異
なる周波数成分を取シ出すフィルタの差信号出力を複数
の基準値と比較して、この基準値との大小関係に応じて
それぞれ別々の符号を入力された音声メツセージに対し
て割り当てることにより、上記各符号の時系列からなる
入カバターンを作成するようにしたものであるから、フ
ィルタの差信号出力の大小により、2以上の周波数領域
におけるパワー分布の差を検出することができ、したが
って各周波数領域におけるフィルタの出力をそのまま入
力データとする場合に比べると、音声信号の特徴をより
圧縮された形式で抽出することができ、このために入力
パターンと照合する標準パターンを記憶しておくための
メモリの容量を小さくすることができると共に、照合処
理をも高速化することができるという利点がある。
また併合発明にあっては、音声入力から異なる周波数成
分を取り出すフィルタの差信号出力を第1および第2の
基準値と比較することによシ、入力された音声メツセー
ジに対して数値+1.−1、Oの時系列からなる入カバ
ターンを作成し、同じく数値+1.−1.0からなる標
準パターンとの相互相関係数を計算することによシ照合
処理を行なうようにしたものであるから、照合すべきデ
ータは+1 、0、−1の3通如しかなく、しかも両者
の積は必ず+1.0.−1のいずれかになるので、特別
な乗算ルーチンなどを使用しなくても、単なる論理演算
と加減算のみによってきわめて高速度で相互相関係数を
計算することができ、したがって照合処理動作を蓄しく
高速化することができるという利点を有するものである
なお上記音声メツt−!;識別方式において、有声音の
エネル千が集中するIKHz以下の低周波成分を抽出す
るフィルタと、無声音のエネ1し千が集中する2KHz
〜12KHzの高周波成分を抽出するフィルタとの差信
号出力を分析することにより数値+1.−1.0をそれ
ぞれ有声音、無声音、および無音に対応させるようにし
、また有声音の区間においては、母音/a/のような高
域有声音のエネルfが集中する5(IOI(、〜IKH
,の成分を抽出するフィルタと、母音/1/のような低
域有声音のエネル甲が集中する500Hz以下の成分を
抽出するフイIt、夕の差信号出力を分析して、高域有
声音、低域有声音、および中域有声音をそれぞれ数値上
、−1,OK対応させるようにすれば、音声の構造に応
じた照合動作を行なうことができるので認識率を著しく
高めることができるものである。
【図面の簡単な説明】
第1図は本発明による音声メツセージ識別装置の概略構
成を示すづO・ツク図、第2図(al (h)は同上の
動作波形図、gg3図は同上の音声メツセージ識別処理
動作をブロック化して示した図、第4図(al(blは
同上の波形整形処理部の動作を示す波形図、第5図は同
上の波形整形処理部の動作を示す流れ図、第6図は同上
のwyポジット符号化処理部の動作を示すフローチャー
ト、第7図fa) (b)は同上の符号化処理部のブロ
ック図、第8図は同上の階層化処理部の動作を示す流れ
図、第9図は同上の正規化処理部の動作を示す流れ図、
第10図(a) (b’lは距離計算照合部の動作を示
す波形図、@11図は音声の特徴を階層化して示した図
、第12図は音声の周波数スペクトルを示す図、第13
図(al (b)は音声から抽出した信号の波形図、第
14図は同上の装置における分岐照合処理の原理を示す
図、第15図は音声の第1階層リストを示す図、第16
図(at〜(d)は音声のSg2階層リストを示す図、
第17図は音声の標準パターンを作成する装置の動作を
示す流れ図、@18図61 (b) (clは学習登録
方式の原理を示す図、第19図は学習登録方式の動作を
示す図、第20図は本発明の装置における登録処理部の
動作を示す流れ図、第21図は同上の非学習登録処理の
動作を示す流れ図、第22図は同上の音声分析部の回路
図、第23図は母音/a/ 、/i/、/e/の第1ホ
ルマントの周波数分布を示す図、@24図は本発明にお
ける判定処理部の動作を示す流れ図である。(5)+6
1 oa o4)はフィルタパシク\(4o)は3値打
号化処理部である。 代理人 弁理士  石 1)長 七 戴17 [:tfニ ー682− 第22図 0          500Hz         
lK1−12第24野1 手続補正書(自発) 昭和56年12J”J:IJ日 1、事件の表示 昭和56年特許願第193555号 2、発 明の名称 音声メツセージ識別方式 3、補正をする者 事件との関係 特許出願人性  所
  大阪府門真市太字門真1048番地名 称 (58
3)松下電工株式会社 代表者神 前 善 − 4、代理人 郵便番号 530 5、補正命令の日付 自     発 訂     正     書 出願番号 特m昭56−193555’+1、本願明細
書第24頁第4行目の全文を次のように訂正致し甘す。 [とができるものである。第25図(a)は母音/a/
、/i/、/ u /、/e/、10/の調音点を示し
ており、同図(b)は母音の第1ホルマントと第2ホル
マントの周波数分布を示している(電子通信学会(三浦
博士監修〕「新版聴覚と音声」のp363〜p364エ
リ引用)。また第26図は日本語の母音の第1ホルマン
トおよび第2ホルマントの分布を男声および女声の場合
について各別に示しだものである。第25図(b)およ
び第26図に示された第2ホルマントの分布を見れば明
らかなように約0.8〜1.81(Hzの帯域フィルタ
と約1゜8〜3.2 KHzの帯域フィルタの出力とを
分析すれば、第2ホルマントの位置を検出することがで
き、これによって舌の位置の前後に対応した特徴をも抽
出することができるものである。もつともそこ捷で微視
的な特徴を抽出しな」 2、同上第38頁@is行目の「ものである。」の後に
次の文を挿入致します。 [さらに入カバターンと標準J\ターンとの一致度合を
各すyづルごとに対応する点数+1.0、−1で評価し
、合計点数で判定することもh]能である。第4表はか
かる点数付けの方法を示すものであり、その基本的な考
え方は上述の3値化された符号同士の相互相関係数を計
算する場合とほとんど同じである。しかして第4表の規
則に従って点数付けを行ない、各サー)プル毎に計算し
た点数の総計が予め定められた所定値以上であるときに
は一致すると判定し、所定値以下であるときには一致し
ないと判定するものである。したがってサンプルの合計
が1000であるとすると、パターンが完全に一致した
ときには点数の合計は1000となるものである。 第  4  表 」 3、同上第42頁第14行目の1である。」の前に、[
、第25図(a)は母音の調音点を示す図、同図(b)
および第26図は第1ホルマシトおよび第2ホルマント
の周波数分布を示す図Iを挿入致し贅4、添付図面中、
第25図および第26図を別紙のように追加致します。 代理人 弁理士  石 1)長 七 (4) 第25図 (b) 第26図 創ホルマ〕ト(にHz)

Claims (1)

  1. 【特許請求の範囲】 +11  音声入力から異なる周波数成分を取り出すフ
    ィルタの差1蕃号出力を複数の基準値と比較して、この
    基準値との大小関係に応じてそhぞれ別々の符号を入力
    された音声メツセージに対して割り当てることにより、
    上記各符号の時系列からなる入力パターンを作成し、こ
    の入カバターンを予め記録さhている棧数頷の標準パタ
    ーンと照合して入カバターンとの距離が最小となる標準
    パターンを入力メッセージとして識別することを特徴と
    する音声メッセー、;識別方式8 12)音声入力から異なる周波数成分を取り出すフィル
    タの差信号出力が第1の基準値以上のときには数値+1
    を、第2の基準値以下のときには数値−1を、@1の基
    準値以下でかつ@2の基準値以上のときには数イ「0を
    それぞM ”%lJり当てることにより、入力された音
    声メツセージに対して数値+1.−1.Oの時系列から
    なる入力パターンを作成し、この入カバターンと予め記
    録されている数値+1.−1.0の時系列からなる複数
    種の標準パターンとの相互相関係数を計算し、入カバタ
    ーンと標準パターンとの位相差を変化させた場合におけ
    る相互相関係数の最大値を最大相互相関係数とし、この
    最大相互相関係数が最大となる標桑パターンを入力メツ
    セージとして識別することを特徴とする音声メツセージ
    識別方式。 (3)有声音のエネルギが集中するI KH2以下の低
    周波成分を抽出するフィルタと、無声音のエネ1し甲が
    集中する2KH2〜12KH,の高周波成分を抽出する
    フィルタとの差信号出力を第1および第2の基準値と比
    較するようにして成ることを特徴とする特許請求の範囲
    第2項記載の音声メツセージ識別方式。 (4)  有声音の区間においては、母音/a/のよう
    な高域有声音のエネルギが集中する500KHz〜IK
    H,の成分を抽出するフィルタと、母音/1/ののよう
    な低域有声音のエネルギが集中する500H2以下の成
    分を抽出するフィルタの差信号出力を第1および第2の
    基準値と比較するようにして成ることを特徴とする特許
    請求の範囲第2項記載の音声メツセージ識別方式。
JP19355581A 1981-11-30 1981-11-30 音声メッセージ識別方法 Granted JPS5895398A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19355581A JPS5895398A (ja) 1981-11-30 1981-11-30 音声メッセージ識別方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19355581A JPS5895398A (ja) 1981-11-30 1981-11-30 音声メッセージ識別方法

Publications (2)

Publication Number Publication Date
JPS5895398A true JPS5895398A (ja) 1983-06-06
JPS6331797B2 JPS6331797B2 (ja) 1988-06-27

Family

ID=16309989

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19355581A Granted JPS5895398A (ja) 1981-11-30 1981-11-30 音声メッセージ識別方法

Country Status (1)

Country Link
JP (1) JPS5895398A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4949361A (ja) * 1972-09-19 1974-05-13
JPS4999203A (ja) * 1972-12-29 1974-09-19
JPS5085203A (ja) * 1973-11-29 1975-07-09

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4949361A (ja) * 1972-09-19 1974-05-13
JPS4999203A (ja) * 1972-12-29 1974-09-19
JPS5085203A (ja) * 1973-11-29 1975-07-09

Also Published As

Publication number Publication date
JPS6331797B2 (ja) 1988-06-27

Similar Documents

Publication Publication Date Title
Farrús et al. Using jitter and shimmer in speaker verification
JPS5944639B2 (ja) 音声による異同認識方式における標準パタ−ン更新方法
Lee et al. Tone recognition of isolated Cantonese syllables
CN101346758A (zh) 感情识别装置
Sigmund Voice recognition by computer
Sharma et al. Automatic evaluation of song intelligibility using singing adapted STOI and vocal-specific features
Raso et al. Modeling the prosodic forms of Discourse Markers
Deekshitha et al. Broad phoneme classification using signal based features
Gupta et al. Autoassociative neural network models for online speaker verification using source features from vowels
JP2844817B2 (ja) 発声練習用音声合成方式
Blevins Phonetically-based sound patterns: Typological tendencies or phonological universals
JPS5895398A (ja) 音声メッセージ識別方法
JPS6331798B2 (ja)
JPS5895400A (ja) 音声メツセ−ジ識別方式
Ramteke et al. Efficient model for numerical text-to-speech synthesis system in Marathi, Hindi and English languages
Arslan Foreign accent classification in American English
Hlaing et al. Myanmar speech synthesis system by using phoneme concatenation method
Do et al. Vietnamese Text-To-Speech system with precise tone generation
Altamrah et al. An acoustic analysis and comparison of two unique and almost identical arabic emphatic phonemes
Beke et al. Phonetic analysis and automatic prediction of vowel duration in Hungarian spontaneous speech
Lienard Speech characterization from a rough spectral analysis
JPS59192298A (ja) 音声メツセ−ジ識別方式
Roux On vowel identification and phonological theory
Ghosh et al. End-to-End Acoustic Feedback in Language Learning for Correcting Devoiced French Final-Fricatives
Datta et al. Time Domain Representation of Speech Sounds