JPS6055400A

JPS6055400A - 音声信号分析方法

Info

Publication number: JPS6055400A
Application number: JP58163482A
Authority: JP
Inventors: 奈良　泰弘; 小林　敦仁
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1983-09-06
Filing date: 1983-09-06
Publication date: 1985-03-30

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（ｌ）　発明の技術分野本発明は、音声認識装Ｐｉ′雪にａ５いて人力フ′１声
信号の特徴抽出をする際に行う当該音声信号の分析方法
に関づ°る。

（２）　技術の費用一般に音声認識装置は、人力づ゛る音声信号を分析しＣ
当該音声信号の特徴抽出を行ない、この抽出した特徴デ
ータを予め登録した合声γ−タと比較し、当該特徴デー
タにより近い音声１−タをＭ　’ｆｋデータどジるよう
にし゛（いる。イしＣ１このにうな音声認識装置では、
より多くの小冊の認識、成るいは単名節の認識更には）
−シ続音等の認識可能なものが要望されている。

に；）従来技術と問題点従来、音声認識装置にお【ノる入力音声（ｆｆｉ　”ｊ
の払分析力→どして、例えば、３３〜・：つ０ブｔ・ネル稈
１ｑのアナ目グ・フィルり・バンク又は、ディジタル・
フィルタ・パンクにＪ、す？Ｉ　？’スペク１ヘルの概
形情報をめるもの、或いは、線型予測分４１１（ＩＰｃ
分析）により音声スペクトル１１■形’ｌｉ’ｉ報をめ
るものがある。このＪ：うにめられたスペクトル４度形
情報は、ｆ′、Ｊ音１、”ｉｆｉに、Ｊ、−）で識別で
きる１００単詔程度の詔常を扱う音声認識では、有効な
音声信号の分（；１情報ど２ｆｆｉるが、１０００　ｊ
ｌｔ語以上の飴色を扱う音声認識、或いは中音ｆｉ？）
、連続合等の音声認識では、母音特徴に加えてその子音
特徴をも抽出しなければ各音声の識別ができないことか
ら、当該多数単語等を扱う音声認識装置での適用が困難
であった。

そこで、上記子゛音特徴をも抽出できる更に分解能の高
い分析方法としては、入力音声信号からの数百点以上の
リーンプリングデータに基づく高分解能ＦＦＴ　（高速
ノーり１変１！＃）が考えられる。この高分解能ＦＦＴ
によれば、入力音声信号を高い分解能でスペク］・ル分
析できることから、当該音声信号の母音及び子音の特ｍ
仙出ができ、比較的多い数の単ｔＲ識別も可能となるし
かしながら、通常前えうるハードウェアで実現する高分
解能「１：Ｔを音声信号の全領域で行なおうとすると、
での実行ｌＬ’１間が音声の５５牛時間を上回ってしま
い、実時間での処理が困肩１であり、更にこの高分解能
１−　Ｆ　Ｔ’を実時間で実行させるためには高価な専
用ハードウェアが必要となるという欠点があった。

（３）　発明の目的本発明は」二にに鑑みてなされたものぐ、？′！１声の
母音特徴及び子音特徴を実時間で分析する手段をＪ：り
安価に実現τすることのでいる？η音声３号の分析方法
を提供覆ることを目的としＣいる。

（５）　発明の４ｆｉ成イしく、上記目的を達成りるため、音声１５号の母音部
分は比較的音声パワーが大きく、当該子音部分は比較的
音声パワーが小さくなることに鑑み、予め音声パワー領
域として、該パワーの人δさに応じ−て、　’＋：’ｒ
＋パ「ノー領域、中パ１ノー領域、及び低パワー領域の
三領域を定め、入力音声信号より得られた音声パワーか
、高パワー領域に屈する１１．！ｌに当該音声信号を母
音の音声仁１号ど１Ｃ低分解能力４１１シ、中バ１ノー
領域に属りる時に該？３声信ｙ３を子音の音戸１信弓ど
じ（品分ＩＩｒ〆能分（；ｉし、低パワー領域に屈−り
る１、１に当該人力音声信号を無音声信号と判定して音
声信号の分析を行なわｔＬ：いＪ、うにしたもの（・あ
る１、（６）　発明の実施例以下本発明の実施例を図面に基づいて説明りる。第１図
は本発明に係るａ　ｊ’！’　１４号分析方法に従って
、作動りる音声信号分析装置の一実施例を示ブブロツク
図である。

同図において、１は音声入力用のマイク、２は増幅器、
３はＶンブルホールド回路、４はＡ／Ｄ変換器、５はバ
ッフ１メモリであり、マイク１から入力する音声信号が
ｊ′曽幅器２にＪ、って増幅された後、ザンブル小−ル
ド回路３によって所定周期（例えば、１ｏ０７１ｓｅｃ
　）　ｉ＋３にリンブリングされ、このリンプリングデ
ータがＡ／Ｄ変換器４を介しＣ順次バラツノ・メしり（
うに格納されるようになっＣいる。

また、６はバッフアメ七り５に（６納されているデータ
Ｘｉを、適宜例えば３２アータずつ読み出し、副線回路、７は予めＰ　ＩＩ　：＞　ｌ）　ｉどなるし
きい値ｐｈ、ｐｌが定めてあり、パワ−ｎ１ｎ回路６が
らの音声パワーデータＰｊど該しきい値ＰＩＥ。

１〕女とを比較りる比較器、８はバッーノアメ−［す５
に格納した１ノンブリングデータのうち例えば３２個の
データを用い、３２点にＦ　Ｔ　、’；ｌ　ｎを行う低
分解能分析回路、９はバッフアメ［す５に格納した１ノ
ンプリングデータのうち例えば１０２４個のデータを用
い、１０２４点ＦＦＴ訓幹を行う高分解能分析回路、１
０はＵ口発生回路であり、パ１ノー計算回路６から出力
される音戸１パヮーデークＰｊが１つｊ　：＞　Ｐｌ＋
　ノド、３．１）（ｌ　ｒ　Ｉ）、ｉ　＜　Ｉ’ｌ＋　
１７）どき、ＰＪ＜Ｐｕのとぎにぞれ・ε゛れ比較器７
がらの指令にＪ、り但分解能分４ｆｉ　Ｉ’！ｌ路Ｅ３
、高分解能分析回路り、げ口発生回路１ｏが起動ηるよ
うになっ（いる。尚１．比較器７に設定されるしきい値
ｐｌ＋、１つ愛（〈［）ｈ）は実験的に定められるしの
（゛あり、明らかに異なる１ζ１？゛１、及び了？°−
の音声パワーに基ついて、ＰＩ＋を越える高パワー領域
を母？清のへ〇ｊｉパワー領域、１）１１以ト、［）女
以上となる中バ１ノー領域を子畠の音声バ「ノー領域、
再にＰＪを下回るＩｌｔパソー領域を無名声パワー領域
どしている。

次に、第１図に示′？Ｉ装置の作動につい（−説明する
。第２図は、音声信号をサンプリングした後の作動を示
す−フローチ１？−１〜であり、木）［１−チ１７−１
−に従って音声信号の分析が行なわれる。

まず、マイク１から人力する音声信号をリンプリングレ
ー１−１０Ｋ　ｌ−１ｚ　（１００μｓｅｃ毎）テ゛リ
ーンブリングし、当該リンプリングアータがバッフ戸メ
モリ５に順次格納されてゆく１．ぞの過程で、まず、第
３図に示りＪ、うにバラフッ・メモリ５内の初めから３
２データ（１フレーム）かパワー４界回路６に入力し、
パワーｔｉ停回路ＯＣ゛の前記（１）式に従う演鈴結果
Ｐ、ｉ（１つＪ　ｉｉｉ　ｇ）■）がＰ女≦Ｐｊ≦ｐｌ
＋どなると、比較器７からの指令により、高分解能分析
回路９が起Ｗ）」Ｌ、バッファメモリ５から−１−記パ
ワー訓讐に用いた３２データを含む１０２４テータ（３
２フレーム）を人力して１０２４点Ｆ「−「４井、すな
わら高分解能の分析を行ない、その分析結果を出力りる
。次にバッファメモリ５内の次の３２データ（１フレー
ム）がパワ−４筒回路６に入力し、パワーも１弾回路６
での演紳結果Ｐｊが（Ｐｊ計算■）がＰｊ＞［〕第１ど
なると、比較器７からの指令にＪ、す、低分解能分析回
路８が起！’、ＩＩ　Ｌ、バッフｊ・メしり５から上記
パワー６１算に用いた（３２）−夕を人力して、３２点
１：Ｆ］甜算、りなわら低分解能の分（ｈを（）４ｆい
、−ぞの分析結果を出力りる３、また、バ゛　ラフ１メ
ヒリ！〕内の更に次の３２データ（１フレー１１）がパ
１ノー５１樟回路０に人力し、パ１ノーｔＩ停回路（３
での（す■綿結果Ｐｊ（ｒ−’ｊ甜ｔ、＞　（）］））
がＰ、ｉ＜Ｐｉ２ど４【ると、比較器７からの指令によ
り、Ｌｌ」発生回路１０が起動し、Ｕロデータを出力、
りなわら当該高声データを無ＦＳ　！”　Ｉハ翼としく
その分析出力をｈなう。

以■ζ同様に、則１次バツノｉ・メしり５５内の３２．
ｉ’−タ（１）１ノーム）イ゛′つによるバ［）＝５１
停がｉ′ｉナワれ、該ｒ’１ｊ”パ■ノー１〕ｊがＩ）
　、ｉ　：＞　ｐ　Ｉ＋　’、ｔらば３２　点Ｆ　Ｆ　
１’　ｉｔ　Ｃ’Ｗ、Ｐ　ｕ　≦Ｐｊ　≦Ｉ〕ｌ＋なら
ば（例エバＰ　Ｊ　ｎｉ　ＩＪ　（４１）　１０２４点
Ｆ　Ｆ　Ｔ　ｉｉ口卆、１〕ｊ＜２丈ならば、１０デー
タ出力がなされ、例えば、入力する単音節吉川信号に第
３りるづべての１００μｓｅｃ毎の音声データについて
の上記分析結果が当該単音節音声信号の特徴抽出データ
となる。

ここで、通常前えうるハードウェアで構成した低分解能
分析回路８、高分解能分析回路９におけるＦＦＴ計算時
間は、３２点の場合的４７０μｓｅｃ　、、１０．２４
点のｊ５４合約３０ｍ　ＳＯｃ、と４Ｔるが、平均的な
１発声中に含まれる無音声区間（Ｐｊ＜ｐ！ｌ＞が全区
間のｊ）０％、ｌ」音区間（Ｐ　ｊ　＞　Ｐ　ｌ＋　−
）が４０％、子音区間（Ｐ’ｕ　≦Ｐｊ　≦Ｐｔ＋）が
１０％とりるど、１ナンブリンクｕｙｒ間３．２ｍ　ｓ
ｅｃ。

（１００，ｃｚ’ｓｅｃ、Ｘ　３２）の１フレームデー
タを分析づるための平均処理時間ＴＳはＴ　Ｓ−（ＯＸ　ｏ、！ｉ＋　０．４７　Ｘ　Ｏ，４＋
３０Ｘ　（１１）−３，２ｍ５ｅｃ。

となり、音声信号の実時間で゛の分析が川面となる。

（尚、無音声区間での分析＋ｃｌｉ間はケ］」どし−（
いる。）また、バッフアメ七り５の８吊につい゛（者えると、高
分解能分析を行なう間（３０ｍｓｅＣ，）にリンプリン
グされるデータ数は（１０ｘ　１０３　ｘ　３０ｘ　１０−３　）　＝　３
００個となり、このデータ数からこの間に不要となるデ
ータ３２個を差し引さ、２Ｇ８個のデータが−（配高分
解能分析を行なう間に増えることになる。

一般に、」′？）は１０フレーム以上゛つづかないこと
を考慮すれば、バッフアメ七り；）の８早は、高分醒能
分４１ｉ　１１．１ｉに必要’、ｒ１０２４個のノ゛−
タ分に　２〔；８ｘ　１０＝　２６８０個のデータ分を
加え、＋＋７０４の容重１があれば−１づンＣある。

上記のように、本発明の音声（Ａ舅分４１１方法に従つ
Ｃ作動（］る第１図に示した装置ｉ／（（は、低分解１
１ヒ分析回路ε３、及び高分解能弁４１Ｈｉｊｌ路９を
１１１に、！１速江１り処理を行うバードウ１ｊＩ構成
にし４〔く（ち、全体どし支の分（１１を高声が光Ｕら
れイ）実１１．ｊ間で実＜−ＪｒｌることがでさるＪ、
う（ごｋる。

（７）　発明の詳細な説明してさたように、本発明によれば、音声信号の・
う１５低分解能ぐ一１分分析可能な母？１区間、高分解
能が必要な子音区間、分析の必要のない無音区間を、そ
れぞれ音声パワーによって判定し、該判定効果に基づい
て、高分解能分析、低分解能分析、及び無音声１５号判
定を行なうＪ：うにした！こめ、特に高速演粋処理を行
なわなくても、音声信号を実時間で分４１Ｉ？Ｉること
ができるようになる。

【図面の簡単な説明】

第１図は、本発明に係る音声信号分析方法に従って作動
を行なう音声分析装動の一実施例を示り゛ブＩ」ツク図
、第２図は、第１図に示づ一装置１′りにＪ３けるデー
タサンブリング後の作動を示ずフ１］−ヂ１７−１〜、
第３図は第１図に示８１装置にお１ノるデータ（ノンブ
リング後の作動状態の一例を示す説明図である、。１・・・マイク　２・・・増幅器３・・・リンプルホールド回路４・・・Ａ／Ｄ変換器　５・・・バッノアメしり６・・
・パワー計算回路　７・・・比較器８・・・低分解能分
析回路　９・・・高分解能分析回路１０・・・ゼロ発ｌ
生回路特　許　出願人　富士通株式会え１

Claims

【特許請求の範囲】

予め音声パワー領域とじて、該パワーの大ぎさに応じて
、高パワー領域、中パワー領域、及び低パワー領域の三
領域を定め、入力音声信号より得られた音声パワーが、
高パワー領域に屈Ｊる時に当該音声信号を母音の音声信
号としＣ低分解能分析し、中パワー領域に屈づる時に該
音声信号を子音の音声信号として高分解面分（４１し、
低パワー領域に屈する時に当該入力音声ｆ３号を無音声
信号ど判定し°Ｃ音声信号の分析を行なわないことを特
徴とする音声信号分析方法。