JPS6055400A - 音声信号分析方法 - Google Patents

音声信号分析方法

Info

Publication number
JPS6055400A
JPS6055400A JP58163482A JP16348283A JPS6055400A JP S6055400 A JPS6055400 A JP S6055400A JP 58163482 A JP58163482 A JP 58163482A JP 16348283 A JP16348283 A JP 16348283A JP S6055400 A JPS6055400 A JP S6055400A
Authority
JP
Japan
Prior art keywords
power
data
analysis
resolution
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58163482A
Other languages
English (en)
Inventor
奈良 泰弘
小林 敦仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58163482A priority Critical patent/JPS6055400A/ja
Publication of JPS6055400A publication Critical patent/JPS6055400A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (l) 発明の技術分野 本発明は、音声認識装Pi′雪にa5いて人力フ′1声
信号の特徴抽出をする際に行う当該音声信号の分析方法
に関づ°る。
(2) 技術の費用 一般に音声認識装置は、人力づ゛る音声信号を分析しC
当該音声信号の特徴抽出を行ない、この抽出した特徴デ
ータを予め登録した合声γ−タと比較し、当該特徴デー
タにより近い音声1−タをM ’fkデータどジるよう
にし゛(いる。イしC1このにうな音声認識装置では、
より多くの小冊の認識、成るいは単名節の認識更には)
−シ続音等の認識可能なものが要望されている。
に;)従来技術と問題点 従来、音声認識装置にお【ノる入力音声(ffi ”j
の払 分析力→どして、例えば、33〜・:つ0ブt・ネル稈
1qのアナ目グ・フィルり・バンク又は、ディジタル・
フィルタ・パンクにJ、す?I ?’スペク1ヘルの概
形情報をめるもの、或いは、線型予測分411(IPc
分析)により音声スペクトル11■形’li’i報をめ
るものがある。このJ:うにめられたスペクトル4度形
情報は、f′、J音1、”ifiに、J、−)で識別で
きる100単詔程度の詔常を扱う音声認識では、有効な
音声信号の分(;1情報ど2ffiるが、1000 j
lt語以上の飴色を扱う音声認識、或いは中音fi?)
、連続合等の音声認識では、母音特徴に加えてその子音
特徴をも抽出しなければ各音声の識別ができないことか
ら、当該多数単語等を扱う音声認識装置での適用が困難
であった。
そこで、上記子゛音特徴をも抽出できる更に分解能の高
い分析方法としては、入力音声信号からの数百点以上の
リーンプリングデータに基づく高分解能FFT (高速
ノーり1変1!#)が考えられる。この高分解能FFT
によれば、入力音声信号を高い分解能でスペク]・ル分
析できることから、当該音声信号の母音及び子音の特m
仙出ができ、比較的多い数の単tR識別も可能となるし
かしながら、通常前えうるハードウェアで実現する高分
解能「1:Tを音声信号の全領域で行なおうとすると、
での実行lL’1間が音声の55牛時間を上回ってしま
い、実時間での処理が困肩1であり、更にこの高分解能
1− F T’を実時間で実行させるためには高価な専
用ハードウェアが必要となるという欠点があった。
(3) 発明の目的 本発明は」二にに鑑みてなされたものぐ、?′!1声の
母音特徴及び子音特徴を実時間で分析する手段をJ:り
安価に実現τすることのでいる?η音声3号の分析方法
を提供覆ることを目的としCいる。
(5) 発明の4fi成 イしく、上記目的を達成りるため、音声15号の母音部
分は比較的音声パワーが大きく、当該子音部分は比較的
音声パワーが小さくなることに鑑み、予め音声パワー領
域として、該パワーの人δさに応じ−て、 ’+:’r
+パ「ノー領域、中パ1ノー領域、及び低パワー領域の
三領域を定め、入力音声信号より得られた音声パワーか
、高パワー領域に屈する11.!lに当該音声信号を母
音の音声仁1号ど1C低分解能力411シ、中バ1ノー
領域に属りる時に該?3声信y3を子音の音戸1信弓ど
じ(品分IIr〆能分(;iし、低パワー領域に屈−り
る1、1に当該人力音声信号を無音声信号と判定して音
声信号の分析を行なわtL:いJ、うにしたもの(・あ
る1、(6) 発明の実施例 以下本発明の実施例を図面に基づいて説明りる。第1図
は本発明に係るa j’!’ 14号分析方法に従って
、作動りる音声信号分析装置の一実施例を示ブブロツク
図である。
同図において、1は音声入力用のマイク、2は増幅器、
3はVンブルホールド回路、4はA/D変換器、5はバ
ッフ1メモリであり、マイク1から入力する音声信号が
j′曽幅器2にJ、って増幅された後、ザンブル小−ル
ド回路3によって所定周期(例えば、1o071sec
 ) i+3にリンブリングされ、このリンプリングデ
ータがA/D変換器4を介しC順次バラツノ・メしり(
うに格納されるようになっCいる。
また、6はバッフアメ七り5に(6納されているデータ
Xiを、適宜例えば32アータずつ読み出し、 副線回路、7は予めP II :> l) iどなるし
きい値ph、plが定めてあり、パワ−n1n回路6が
らの音声パワーデータPjど該しきい値PIE。
1〕女とを比較りる比較器、8はバッーノアメ−[す5
に格納した1ノンブリングデータのうち例えば32個の
データを用い、32点にF T 、’;l nを行う低
分解能分析回路、9はバッフアメ[す5に格納した1ノ
ンプリングデータのうち例えば1024個のデータを用
い、1024点FFT訓幹を行う高分解能分析回路、1
0はU口発生回路であり、パ1ノー計算回路6から出力
される音戸1パヮーデークPjが1つj :> Pl+
 ノド、3.1)(l r I)、i < I’l+ 
17)どき、PJ<Puのとぎにぞれ・ε゛れ比較器7
がらの指令にJ、り但分解能分4fi I’!l路E3
、高分解能分析回路り、げ口発生回路1oが起動ηるよ
うになっ(いる。尚1.比較器7に設定されるしきい値
pl+、1つ愛(〈[)h)は実験的に定められるしの
(゛あり、明らかに異なる1ζ1?゛1、及び了?°−
の音声パワーに基ついて、PI+を越える高パワー領域
を母?清のへ〇jiパワー領域、1)11以ト、[)女
以上となる中バ1ノー領域を子畠の音声バ「ノー領域、
再にPJを下回るIltパソー領域を無名声パワー領域
どしている。
次に、第1図に示′?I装置の作動につい(−説明する
。第2図は、音声信号をサンプリングした後の作動を示
す−フローチ1?−1〜であり、木)[1−チ17−1
−に従って音声信号の分析が行なわれる。
まず、マイク1から人力する音声信号をリンプリングレ
ー1−10K l−1z (100μsec毎)テ゛リ
ーンブリングし、当該リンプリングアータがバッフ戸メ
モリ5に順次格納されてゆく1.ぞの過程で、まず、第
3図に示りJ、うにバラフッ・メモリ5内の初めから3
2データ(1フレーム)かパワー4界回路6に入力し、
パワーti停回路OC゛の前記(1)式に従う演鈴結果
P、i(1つJ iii g)■)がP女≦Pj≦pl
+どなると、比較器7からの指令により、高分解能分析
回路9が起W)」L、バッファメモリ5から−1−記パ
ワー訓讐に用いた32データを含む1024テータ(3
2フレーム)を人力して1024点F「−「4井、すな
わら高分解能の分析を行ない、その分析結果を出力りる
。次にバッファメモリ5内の次の32データ(1フレー
ム)がパワ−4筒回路6に入力し、パワーも1弾回路6
での演紳結果Pjが(Pj計算■)がPj>[〕第1ど
なると、比較器7からの指令にJ、す、低分解能分析回
路8が起!’、II L、バッフj・メしり5から上記
パワー61算に用いた(32)−夕を人力して、32点
1:F]甜算、りなわら低分解能の分(hを()4fい
、−ぞの分析結果を出力りる3、また、バ゛ ラフ1メ
ヒリ!〕内の更に次の32データ(1フレー11)がパ
1ノー51樟回路0に人力し、パ1ノーtI停回路(3
での(す■綿結果Pj(r−’j甜t、> ()]))
がP、i<Pi2ど4【ると、比較器7からの指令によ
り、Ll」発生回路10が起動し、Uロデータを出力、
りなわら当該高声データを無FS !” Iハ翼としく
その分析出力をhなう。
以■ζ同様に、則1次バツノi・メしり55内の32.
i’−タ(1)1ノーム)イ゛′つによるバ[)=51
停がi′iナワれ、該r’1j”パ■ノー1〕jがI)
 、i :> p I+ ’、tらば32 点F F 
1’ it C’W、P u ≦Pj ≦I〕l+なら
ば(例エバP J ni IJ (41) 1024点
F F T ii口卆、1〕j<2丈ならば、10デー
タ出力がなされ、例えば、入力する単音節吉川信号に第
3りるづべての100μsec毎の音声データについて
の上記分析結果が当該単音節音声信号の特徴抽出データ
となる。
ここで、通常前えうるハードウェアで構成した低分解能
分析回路8、高分解能分析回路9におけるFFT計算時
間は、32点の場合的470μsec 、、10.24
点のj54合約30m SOc、と4Tるが、平均的な
1発声中に含まれる無音声区間(Pj<p!l>が全区
間のj)0%、l」音区間(P j > P l+ −
)が40%、子音区間(P’u ≦Pj ≦Pt+)が
10%とりるど、1ナンブリンクuyr間3.2m s
ec。
(100,cz’sec、X 32)の1フレームデー
タを分析づるための平均処理時間TSは T S−(OX o、!i+ 0.47 X O,4+
30X (11)−3,2m5ec。
となり、音声信号の実時間で゛の分析が川面となる。
(尚、無音声区間での分析+cli間はケ]」どし−(
いる。) また、バッフアメ七り5の8吊につい゛(者えると、高
分解能分析を行なう間(30mseC,)にリンプリン
グされるデータ数は (10x 103 x 30x 10−3 ) = 3
00個となり、このデータ数からこの間に不要となるデ
ータ32個を差し引さ、2G8個のデータが−(配高分
解能分析を行なう間に増えることになる。
一般に、」′?)は10フレーム以上゛つづかないこと
を考慮すれば、バッフアメ七り;)の8早は、高分醒能
分41i 11.1iに必要’、r1024個のノ゛−
タ分に 2〔;8x 10= 2680個のデータ分を
加え、++704の容重1があれば−1づンCある。
上記のように、本発明の音声(A舅分411方法に従つ
C作動(]る第1図に示した装置i/((は、低分解1
1ヒ分析回路ε3、及び高分解能弁41Hijl路9を
111に、!1速江1り処理を行うバードウ1jI構成
にし4〔く(ち、全体どし支の分(11を高声が光Uら
れイ)実11.j間で実<−JrlることがでさるJ、
う(ごkる。
(7) 発明の詳細 な説明してさたように、本発明によれば、音声信号の・
う15低分解能ぐ一1分分析可能な母?1区間、高分解
能が必要な子音区間、分析の必要のない無音区間を、そ
れぞれ音声パワーによって判定し、該判定効果に基づい
て、高分解能分析、低分解能分析、及び無音声15号判
定を行なうJ:うにした!こめ、特に高速演粋処理を行
なわなくても、音声信号を実時間で分41I?Iること
ができるようになる。
【図面の簡単な説明】
第1図は、本発明に係る音声信号分析方法に従って作動
を行なう音声分析装動の一実施例を示り゛ブI」ツク図
、第2図は、第1図に示づ一装置1′りにJ3けるデー
タサンブリング後の作動を示ずフ1]−ヂ17−1〜、
第3図は第1図に示81装置にお1ノるデータ(ノンブ
リング後の作動状態の一例を示す説明図である、。 1・・・マイク 2・・・増幅器 3・・・リンプルホールド回路 4・・・A/D変換器 5・・・バッノアメしり6・・
・パワー計算回路 7・・・比較器8・・・低分解能分
析回路 9・・・高分解能分析回路10・・・ゼロ発l
生回路 特 許 出願人 富士通株式会え1

Claims (1)

    【特許請求の範囲】
  1. 予め音声パワー領域とじて、該パワーの大ぎさに応じて
    、高パワー領域、中パワー領域、及び低パワー領域の三
    領域を定め、入力音声信号より得られた音声パワーが、
    高パワー領域に屈Jる時に当該音声信号を母音の音声信
    号としC低分解能分析し、中パワー領域に屈づる時に該
    音声信号を子音の音声信号として高分解面分(41し、
    低パワー領域に屈する時に当該入力音声f3号を無音声
    信号ど判定し°C音声信号の分析を行なわないことを特
    徴とする音声信号分析方法。
JP58163482A 1983-09-06 1983-09-06 音声信号分析方法 Pending JPS6055400A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58163482A JPS6055400A (ja) 1983-09-06 1983-09-06 音声信号分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58163482A JPS6055400A (ja) 1983-09-06 1983-09-06 音声信号分析方法

Publications (1)

Publication Number Publication Date
JPS6055400A true JPS6055400A (ja) 1985-03-30

Family

ID=15774707

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58163482A Pending JPS6055400A (ja) 1983-09-06 1983-09-06 音声信号分析方法

Country Status (1)

Country Link
JP (1) JPS6055400A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100793624B1 (ko) * 2000-09-14 2008-01-11 에프엠씨 테크놀로지스 에스.아. 제품하역조립체

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100793624B1 (ko) * 2000-09-14 2008-01-11 에프엠씨 테크놀로지스 에스.아. 제품하역조립체

Similar Documents

Publication Publication Date Title
Lobanov Classification of Russian vowels spoken by different speakers
US20010010039A1 (en) Method and apparatus for mandarin chinese speech recognition by using initial/final phoneme similarity vector
JPS6055400A (ja) 音声信号分析方法
Tzudir et al. Low-resource dialect identification in Ao using noise robust mean Hilbert envelope coefficients
Fu et al. Classification of voiceless fricatives through spectral moments
Rana et al. Effect of windowing on the calculation of MFCC statistical parameter for different gender in Hindi speech
JPH05307395A (ja) 音声合成装置
JPH0193799A (ja) 音声ピッチ変換方法
Jyotishi et al. A novel feature for nasalised vowels and characteristic analysis of nasal filter
Panat et al. Affective state analysis of speech for speaker verification: Experimental study, design and development
Glinski Diphone speech synthesis based on a pitch-adaptive short-time Fourier transform
JPH0194398A (ja) 音声標準パターンの作成方法
JPS5854400A (ja) 音声出力編集方式
JPH0756590A (ja) 音声合成装置、音声合成方法及び記録媒体
Zhang et al. Speaker idiosyncratic intensity and mouth opening-closing variations: the case of English
Waardenburg et al. The automatic recognition of stop consonants using hidden Markov models
JP2880508B2 (ja) 音声の規則合成装置
JP2861005B2 (ja) 音声蓄積再生装置
Nakamoto et al. The KanNon system displaying speech signals
JP2665902B2 (ja) 音声合成/認識方法
JPS5995597A (ja) 音声特徴パラメ−タ作成方式
JPS59157698A (ja) 音声合成装置
JPS5816295A (ja) 音声分析合成方式
JPS63223696A (ja) 音声パタ−ン作成方式
Kumar et al. Recognition of consonants using an ARMA model of the speech signal