JPH0476600A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPH0476600A
JPH0476600A JP2190163A JP19016390A JPH0476600A JP H0476600 A JPH0476600 A JP H0476600A JP 2190163 A JP2190163 A JP 2190163A JP 19016390 A JP19016390 A JP 19016390A JP H0476600 A JPH0476600 A JP H0476600A
Authority
JP
Japan
Prior art keywords
feature
pattern
similarity
stable
comparison
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2190163A
Other languages
English (en)
Inventor
Takashi Miki
三木 敬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2190163A priority Critical patent/JPH0476600A/ja
Publication of JPH0476600A publication Critical patent/JPH0476600A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は音声認識方式に閘するものである。
(従来の技術) 音声認識方式はコンピュータその他のfi々の機器の有
力な入力手段として利用され始めている。
第5図は特開昭60−213417号に示されるような
従来の認識装置の典型例のブロック図である。音声入力
端子501がら入力された音声信号は、分析部502に
おいで特徴を表わす特徴ベクトルの時系列に変換される
。特徴ベクトルとしては、中心周波数の異なるp個のバ
ントパスフィルタ群によって抽出された帯域内周波数成
分をフレームと呼ばれる小時間毎に取り出したちのsl
を使用する。ここでtはフレーム番号、Jはバントパス
フィルタの番号である。
$t・(Stl、St2.・・・、5tj−1,S土」
)     (J・1,2. ・・・、p)ざらに、分
析部502ては、フレーム毎のパワー9士も同時に算出
する。
ローカルど−り算出部503では、フレーム毎に前述の
特徴ベクトルから最小自乗近似直線を算出し、この最小
自乗近似直線を基準として周波数方向で極大となるチャ
ネルに対応する成分を1にし、それ以外の成分を○にし
て得られるローカルビークパタンルを求める。
音声区間検出部504では、分析部502からのパワー
Piに基づいて音声区間すなわち音声の始端フレ一ムA
(t=a)および音声の終端フレームB(t=b)を決
定する。
このパワーによる音声始端終端の決定アルゴリズムにつ
いては、fff願昭5e−108668号に開示されて
いるような方法をはじめとして種々の方法が提案されて
おり、何れかの適切な方法で区間決定を行なっている。
線形伸縮部505ては、音声区間検出部504にて検出
された音声始端Aから音声終端Bまでのローカルビーク
パタンルの系列を一定フレーム数に時間軸線形伸縮し、
ローカルビークパタンを主成する。
音声始端から音声終端までの特徴ベクトル系列を一定フ
レーム数に伸縮したものをパタンと呼ぶ。
この線形伸縮部505における伸縮処理は、後述するマ
ツチングを行ない易くし、ざらに後述する比較パタンの
アドレッシングを容易に行なえるようにしたものである
次に時間軸線形伸縮の方法についで説明する。
ここでは、−例として、32フレームに伸縮する場合を
考える。線形伸縮後のフレーム番号をt’  (t’ 
=1.32)としフレームt゛に対応する線形伸縮前の
フレーム番号11 の式から算出する。但し、(1)式において[]はガウ
ス記号を表わす。
結果として、音声パタン Sa $a+’1.−.  St、=−、$b−1.$
bは線形伸縮されて、 $1  $2.・・・、  St、  ・・・、  S
31.$32なる特徴ベクトル系列、すなわちパタンと
なる。
以後、特にことわりかない限り、線形伸縮後のフレーム
番号で話を進める。
次に比較パタンメモリ一部506の機能についで説明す
る。
話者を激定する特定話者音声認識ては、認識対象となる
単語(以下、カテゴリと称する)を予め発声しく学習音
声と称する)、同一の音声分析を施して求められたロー
カルビークパタン(比較パタンと称する)を格納してお
く必要かある。比較パタンメモリ一部506にはこのよ
うな比較パタンか格納されている。この比較パタンの格
納動作そ登録処理と呼ぶ。パタン類似度計算部508て
は、認識させようとする入力音声から生成された入力パ
タンと比較パタンとの類似度肝L7a行なつゎ 類似度計算は公知の手法であるDPマツチングや、特開
昭60−213418号に示されるような簡便な線形マ
ツチングをはじめとして種々の方法か提案されており、
何れかの適切な方法で類似度計算か行なわれる。
この類似度計算部508から出力されるカテゴリ毎の類
似度を用いで、判定部509ては、その最大類似度を与
える比較パタンに与えられたカテゴリ名を認識結果とし
て出力する。
(発明か解決しようとする課題) 上述した従来の認識装置は、通常の音声認識装置で使わ
れているようなスペクトルの形状を与えるベクトルを類
似度計算に用いずに、音声スペクトルのビークを与える
位曹のみよりなるローカルビーウヘクトルを類似度算出
に用いているため、高雑音環境下での認識性能か比較的
保たれる反面、静かなところて音声を入力しても高い認
識性能を得られなかった。
この発明の目的は、高雑音下でも、静かなところの区別
なく、すなわち使用環境にかかわらす、何処でも高い認
識性能か得られる音声認識方式を提案するものである。
(課題を解決するための手段) この目的の達成を図るため、この認識方式では次のよう
な手段t=hる。
(a)入力信号を周波数分析し、該入力信号の特徴を表
わす特徴ベクトルおよび該入力信号の強さを表わすパワ
ーをフレームと称する一定時間間隔で算出する手段と、 (b)前記特徴ベクトルから背景雑音に影響されにくい
部分のみを取り出した安定′8黴ベクトルをフレーム間
隔て算出する手段と、 (c)前記パワーおよび特徴ベクトルから音声区間を定
める音声の始端と終端を検出する音声区間検出手段と、 (d)前記特徴ベクトルおよび前記安定特徴ベクトルの
各々の系列から、音声区間の特徴パタンおよび安定特徴
パタンをそれぞれ生成する線形伸縮手段と、 (e)前記音声区間以外の音声か存在しない区間の雑音
パワーと前記パワーから算出される信号/雑音レシオを
算出し、重み係数L+を決定する手段と、 (f)予め認識対象語毎に1回もしくは複数回の学習用
音声に対し前記(a)項から(d)項までの処理もしく
は類似した処理によって生成された特徴パタンおよび安
定特徴パタンをそれぞれ比較特徴パタンおよび比較安定
特徴パタンとして格納する比較パタンメモリ一部をもち
、 (g)認識させようとする入力音声に対して前記(a)
項から(e)項までの処理によって入力重み係数、入力
特徴パタンおよび入力安定特徴パタンを求める処理と、 (h)前記入力特徴パタンと前記比較特黴パタンを照合
し特徴パタン類似度を算出し、ざらに前記入力安定特徴
パタンと前記比較安定特徴パタンを照合し安定特徴パタ
ン類似度を算出するパタン照合部と、 (i)前記特徴パタン類似度と前記安定特徴パタン類似
度を前記入力型み係数で重み付けした総合パタン類似度
か最大となる比較特徴パタンもしくは比較安定特徴パタ
ンに付与されたカテゴリ名を認識結果とする判定を行な
う。
(作用) 上述した構成によれば、 音声スペクトルの厳密な形状を与える特徴量と、音声ス
ペクトルのピークを与える位置のみよりなるローカルビ
ークベクトルのような概形vI微量の両者を用い、さら
に、音声入力時の背景雑音レベルを求め、 背景雑音レベルか小さい場合には厳密な形状を与える特
徴量に重みを大きくし、より高精度な認識性能か得られ
るようにし、 逆に、背景雑音レベルか大きい場合には、概形形状を与
える特徴量に重みを大きくし、高雑音環境下での認識性
能も確保できるようにしたものである。
従って、すなわち使用環境にかかわらす、何処でも高い
認識性能か得られる。
(実施例) 以下、図面を参照して、この発明の実施例について述へ
る。
第1図は、登録動作を行なう特定話者認識方式に適用し
たこの発明の詳細な説明に供する、音声認識装百ヲ示す
ブロック図であって、]01は音声入力端子、102は
分析部、103は安定特徴ベクトル算出部、104は音
声区間検出部、105は線形伸縮部、106は比較パタ
ンメモリ一部、107は重み係数算出部、108はパタ
ン照合部、109は判定部である。
音声入力端子101から入力された音声信号は、分析部
102において特徴を表わす特徴ベクトルの時系列に変
換される。特徴ベクトルの導出方法には、中心周波数が
少しづつ異なる複数のバンドパス群を用いる方法や、F
FT (高速フーリエ変換)によるスペクトル分析を用
いるもの等々が考えられるが、ここではバントパスフィ
ルタ群を使用する方法を例に挙げる。
音声信号は、分析部102にてアナログ・テジタル変換
された後、各バンドパスフィルタによってその周波数成
分のみを抽出する。このようにして各バンドパスフィル
タによって振り分けられたデータの系列をチャネルと称
する。各チャネル毎のフィルタの出力に対して整流して
絶対値を取りフレーム単位でその平均値を算出する。こ
の算出値を帯域パワーと呼ぶ。今を番目のフレーム、j
番目のチャネルの帯域パワーVAtjとする。
次にフレーム毎に当該フレームのパワーP↑を算出する
。パワーptは次式(2)で与えられる。
さらに、Atjを対数変換し特徴ベクトルCtを求める
C±(ctl、Ct2.  ・・・、Ctp1.Ctp
)特徴ベクトルCtは次式(3)で与えられる。
安定特徴ベクトル算出部103ては、特徴ベクトルから
比較的背景雑音に影1ii′されにくい安定な特徴を算
出する処理部である。従って、音声スペクトルのあおま
かな形状を捉えたものになる。ここでは、その安定な特
徴の一つとしてローカルビークベクトルを用いた例を示
す。ローカルビークベクトルを算出するに当り、先ず、
特徴へクトルCtの最小自乗近似直線Ytt求める。最
小自乗近似直線Ytは次式(4)によって与えられる。
Yt(j)=jUt+Vt 2tj=Ctj+Y±(〕) ・・・(5) 次に、次式(6)のような判断に基づいて、この正蜆化
特徴ヘウトルZjコがらローカルビークヘクトルIRt Rt・(Rtl、Rt2.・・・、Rtp−1,Rtp
)を算出する。
・・・(4) さらに、この最小自乗近似直線を用いて次式(5)によ
り正規化特徴へクトルZtjを算出する。
1・ それ以外 但し、 ZiO,−、Zif”1.  m、−QQ  :  j
=1.2.−、P−1,P・・・(6) このIRt %ローカルビークヘクトルまたは安定特徴
ベクトルと呼ぶ。
音声区間検出部]04では、分析部102からのパワー
Piに基づいて音声区間すなわち音声の始端フレームA
(t=a)および音声の終端フレーム8(t=b)を決
定する。
このパワーによる音声始端終端の決定アルゴリズムにつ
いては、特願昭59−108668号に開示されている
ような方法をはじめとして、種々の方法が提案されてお
り、何れかの適切な方法て区間決定を行なっている。
線形伸縮部105ては、音声区間検出部104にて検出
された音声始端へから音声終端Bまての特徴ベクトル$
tおよび安定特徴へクトルIRtの系列を一定フレーム
数に時間軸線形伸縮し、それぞれ特徴パタンおよび安定
特徴パタンを生成する。
この線形伸縮部105にあける伸縮処理は、後述するマ
ツチングを行ない易くし、ざらに後述する比較特徴パタ
ンもしくは比較安定特徴パタンのアトレ・ンシングを容
易に行なえるようにしたものである。
次に、時間軸線形伸縮の方法について説明する。ここで
は、説明の為に32フレームに伸縮する場合を考える。
線形伸縮後のフレーム番号をt’  (t’ =1.3
2)とし、フレームt′に対応する線形伸縮前のフレー
ム番号tを の式から算出する。但し、(7)式において[]はガウ
ス記号を表わす。
結果として、特徴ベクトル系列および安定特徴ベクトル
系列 Sa、Sa◆I、=−、st、m、$b−1.$b(特
徴ベクトル系列) Pa、lRa◆1.− 、I’tt、−、Rb−1,1
Rb(安定特徴ベクトル系列) は線形伸縮されて、 SL$2.−・・、St、−・・、$31.$32(特
徴パタン) lR1,lR2,・・・、lRt、・・・1R31,F
132(安定特徴パタン) なる特徴パタンaよび安定特徴パタンとなる。以後、特
に断わりがない限り、線形伸縮後のフレーム番号で話を
進める。
次に、比較パタンメモリ一部106の機能について説明
する。
話者を限定する特定話者音声認識では、認識対象となる
単語(以下、カテゴリと称する)を予め発声しく学習音
声と称する)、同一の音声分析を施して求められた特徴
パタンと安定特徴パタンを格納しておく処理か必要とな
る。この処理は登録処理と呼ばれる。学習音声から得ら
れた特徴パタンと安定特徴パタンをそれぞれ比較特徴パ
タンと比較安定特徴パタンと呼ぶ。比較パタンメモリ部
106にはこのような比較特徴パタンと比較安定特徴パ
タンを格納するためのメモ;ノーである。
この実施例では説明の簡単化のため、1カテコワ当り1
回の学習音声を発声する場合を取り上げる。カテゴリの
総数%Nとした場合、比較パタンメモリー106にはN
個の比較特徴パタンX$’ t (n= 1.2.−、
N)とN個の比較安定特徴パタンXIR’ t (n=
 1.2.−、N)か格納される。
次に、認識動作について説明する。
音声入力端子101から入力された認識対象の音声信号
は、分析部102で入力特徴ベクトルCtおよび入力パ
ワーIPtに変換される。さらに、安定特徴ヘクトル算
出部103において入力安定′P!徴ベクトル1日士か
算出される。一方、音声区間検出部104ては、分析部
102からのパワーIPtに基づいて音声区間を決定す
る。線形伸縮部105ては音声区間の入力特徴ベクトル
系列Ctと入力安定特徴ベクトル系列IRtそ一定長に
時間軸線形伸縮し、入力特徴パタンIC1および入力安
定特徴パタンIIRt%生成する。重み係数算出部10
7ては、音声区間以外の音声か存在しない区間のパワー
より算出される雑音パワーと音声区間のパワーから算出
される信号レベルを求め、信号/雑音レシオを算出し、
その結果に基づき、入力重み係数口を決める。雑音パワ
ーNmeanは、例えば、次式(8)で算出される。
Nmean=0.l   Σ   IPtt=a−10 ・・・(8) 信号レベルVmaxは次式(g)で算出される。但し、
maxは最大重を求める閑散である。
Vmax=max  IPt  ;t=a、ai、−、
b−1,b    −(g)信号/雑音レシオSNは次
式(10)で求められる。
5N=lOlock(Vmax/Nmean)・・・(
10) 信号/雑音レシオSNは音声入力時の背景雑音レベルの
指数といえる。ざらに、このSNから第2図に示される
閑散により、入力重み係数UU求める。
音声のパタン同士の比較では、両者の時間的な対応をと
る必要かある。最適な対応をとりなから、両パタン間の
類似度を算出する代表的な方法に特公昭50−2139
41号に開示されているような、通称DPマツチング方
法かある。パタン照合部108では、このようなりPマ
ツチング法もしくはその他の好適な方法を用いて入力パ
タンと比較パタンとの類似度計算を行なう。この場合の
パタン照合フローを第4図に示す。
この実施例では類似度計算にDPマツチングを使用した
例を示す。先ず、特徴ベクトル間の類似度を定義する。
入力特徴ベクトルI3iと比較特徴ベクトルX$” j
との特徴ベクトル類似度d (I$i、X$’ j)お
よび入力安定特徴ヘクトル1日lと比較安定特徴ベクト
ルXIR’jとの安定特徴ベクトル類似度d (IIR
i、XlRnコ)を式(11)、(12)で示す。ここ
て、右肩添え字tはベクトルの結方を、(X、  ソ)
はベクトル×、ソの内積を、lxlはベクトル×の長さ
(ノルム)を表わす。
第3図は、パタン間の類似度を算出する際の入力パタン
と比較パタンの時間的な対応を取るための説明図てあつ
、横軸は入力パタンのフレーム時間点t=iを表わし、
縦軸は比較パタンのフレム時周点t−jを採って示しで
ある。ここで、便宜上、入力パタン01番目のフレーム
時間点て、かつ、比較パタンの3番目のフレーム時間点
について論じる場合、単に”格子点(i、j)において
”という表現を用いる。
ざらに、説明の茫めに、特徴ベクトル類似NcJ Cl
Sx、XF3’ J)’j:類似度ds’  (i。
〕)および安定特徴ヘクトル類似度d (IRi。
XIR’j)%類似度dr’  (i、j)と呼zく。
さて、類似度ds″ (i、j)を用いて最適パスの算
出を行なう手法について説明する。
最適パスとは、格子点(1,1)から格子点(32,3
2)に至るあらゆる経路の中で、経距上の格子点(i、
j)に対応する類似度ds’  (i、j)の累積和か
最も太きくなるような経路である。この最適パスを探索
する手法かDPマツチング手法である。格子点(i、j
)における累積類似度Ds・ (i、j)を・・・(1
3) と定める。また、初期値を、 Ds″(0,j)−Ds’(i、o)−Ds’(i、−
1)=  −c。
但し、 Ds’(0,0)=0 ・・・(14) できる。
以上の演算%N個の比較パタン全てについて行ない、N
個の特徴パタン類似度DDs (n)と安定特徴パタン
類似度DDr(n)を求める。
判定部709では、パタン照合部で求められた両パタン
類似度を入力重み付は係数口で重み付けを行ない、総合
パタン類似度DDD (n)を算出する。
と定める。
式(13)の処理を第4図に示される順序で計算しでい
くと、最後の格子点(32,32)における累積類似度
Ds’  (32,32)か最適パス上の累積類似度と
なる。この類似度を特徴パタン類似度DDs (n)と
称する。
DDD(n)−uDDs(n)(1−u)DDr(n)
−(I6)さらに、N個の総合パタン類似度DDD (
n)中で最大となるパタンの番号n。jX ’W検索す
る。
DDs(n)Ds’(32,32) ・・・(15) 全く同様な計算で、類似度dr’  (i、j)を用い
て安定特徴パタン類似度DDr(n)も算出そして、n
 maxに対応するカテゴリ名Cnmaxか認識結果と
なり、タト部ホスト機器に出力する。
但し、入力重み係数口か負の@を持つ場合には、判定不
能であるとして以後の処理をせす、判定不能信号を外部
ホスト機器に出力する(雑音レベルか大きすぎる、また
は音声か小さすぎる場合)。
以上の説明では2つの特徴量、特徴ベクトル、安定特徴
ベクトルについて別々に照合して2つのパタン類似度を
求めて判定部でそれらのパタン類似度を統合した総合パ
タン類似度を算出しでいたか、パタン照合部で両特徴パ
タンを統合した形の統合パタン類似度を算出してしまう
手法を用いでもよい。
この手法ではパタン照合部における2つの特徴ベクトル
間の類似度を最初に統合した統合特徴ヘクトル類似度t
dw’  (i、j)V式(18)のこと〈求める。
dwn(i、D=  uds’(i、j)(1−u)d
r″(i、D   −(1B)その後は、先に説明した
DPマツチングの手法IN個の比較パタン全てについて
適用し、N個の統合特徴パタン類似度DDw (n)を
算出する。
判定部109ては、N個の統合パタン類似度DDw (
n)中で最大となるパタンの番号n□8を検索する。
そして、n□、8に対応するカテゴリ名Cn□88か認
識結果となり、外部ホスト機器に出力する。
但し、入力重み係数口か負の値を持つ場合には、判定不
能であるとしてパタン照合処理以後の処理をせす、判定
不能信号を外部ホスト機器に出力する(雑音レベルか大
きすぎる、または音声が小さすぎる場合)。
ざらに、先の2つの最終的な類似度、統合パタン類似度
DDw (n)および総合パタン類似度DDD (n)
を併用して認識判定を行なう手法も考えられる。その場
合の認識判定処理は、例えば次のようにする。
n、、、、 = arg max(DDw(n)+DD
D(n))    −(20)そしてnff1llXに
対応するカテゴリ名Cn□1xか認識結果となり、外部
ホスト機器に出力する。但し、入力重み係数口か負の値
を持つ場合には、判定不能であるとしてパタン照合処理
以後の処理をせす、判定不能信号を外部ホスト機器に出
力する(雑音レベルが大きすぎる、または音声か小さす
ぎる場合)。
(発明の効果) 上述した説明からも明らかなように、この発明によれば
、 音声スペクトルの厳ヱな形状を与える特徴量と、音声ス
ペクトルのピークを与える位置のみよりなるローカルビ
ークヘクトルのような概形精微量の両者を用い、ざらに
、音声入力時の背景雑音レベルを求め、背景雑音レベル
か小さい場合には、!密な形状を与える特徴量に重みを
大きくし、より高精度な認識性能か得られるようにし、
逆に、背景雑音レベルか大きい場合には、概形形状を与
える特徴量に重みを大きくし、高雑音環境下での認識性
能も確保できるようにしたものである。
従って、高雑音下でも、静かなところの区別なく、すな
わち使用環境にかかわらす、何処でも高い認識性能か得
られる音声認識装置か実現できる。
【図面の簡単な説明】
第1図は、この発明の第一の笑施例を示すブロック図、 第2図は、信号/雑音レシオと重み係数の関係を示した
図、 第3図は、入力パタンと比較パタンの時閉関係の対応を
示した図、 第4図は、パタン照合の計算のフローを示す図、 第5図は、従来の認識装置のプロ・ンク図てある。 ○1・・・音声入力端子、102・・・分析部03・・
・安定特徴ベクトル算出部 04・・・音声区間検出部 05・・・線形伸縮部 06・・・比較パタンメモリ一部 07・・・重み係数算出部 08・・・パタン照合部、109・・・判定部。

Claims (3)

    【特許請求の範囲】
  1. (1)(a)入力信号を周波数分析し、該入力信号の特
    徴を表わす特徴ベクトル、および該入力信号の強さを表
    わすパワーをフレームと称する一定時間間隔で算出する
    分析部と、(b)前記特徴ベクトルから背景雑音に影響
    されにくい部分のみを取り出した安定特徴ベクトルをフ
    レーム間隔で算出する安定特徴ベクトル算出部と、 (c)前記パワーおよび特徴ベクトルから音声区間を定
    める音声の始端と終端を検出する音声区間検出部と、 (d)前記特徴ベクトルおよび前記安定特徴ベクトルの
    各々の系列から、音声区間の特徴パタンおよび安定特徴
    パタンをそれぞれ生成する線形伸縮部と、 (e)前記音声区間以外の音声が存在しない区間の雑音
    パワーと前記パワーから算出される信号/雑音レシオを
    算出し、重み係数を決定する重み係数算出部と、 (f)予め認識対象語毎に1回もしくは複数回の学習用
    音声に対し前記(a)項から(d)項までの処理もしく
    は類似した処理によって生成された特徴パタンおよび安
    定特徴パタンをそれぞれ比較特徴パタンおよび比較安定
    特徴パタンとして格納する比較パタンメモリー部と、 (g)認識させようとする入力音声に対して前記(a)
    項から(e)項までの処理によって入力重み係数、入力
    特徴パタンおよび入力安定特徴パタンを求める処理と、 (h)前記入力特徴パタンと前記比較特徴パタンを照合
    し特徴パタン類似度を算出し、さらに前記入力安定特徴
    パタンと前記比較安定特徴パタンを照合し安定特徴パタ
    ン類似度を算出するパタン照合部とを具え、 (i)前記特徴パタン類似度と前記安定特徴パタン類似
    度を前記入力重み係数で重み付けした総合パタン類似度
    が最大となる比較特徴パタンもしくは比較安定特徴パタ
    ンに付与されたカテゴリ名を認識結果とする音声認識方
    式。
  2. (2)前記入力特徴パタンと前記比較特徴パタンおよび
    前記入力安定特徴パタンと前記比較安定特徴パタンをそ
    れぞれ照合する際に、入力特徴ベクトルと比較特徴ベク
    トルとの類似度すなわち特徴ベクトル類似度と、 入力安定特徴ベクトルと比較安定特徴ベクトルとの類似
    度すなわち安定特徴ベクトル類似度を前記重み係数で重
    み付けした統合ベクトル類似度を計算し、当該統合ベク
    トル類似度に基づいて入力音声と比較音声との統合パタ
    ン類似度を計算し、当該統合パタン類似度が最大となる
    比較特徴パタンもしくは比較安定特徴パタンに付与され
    たカテゴリ名を認識結果とする請求項1に記載の音声認
    識方式。
  3. (3)前記総合パタン類似度および前記統合パタン類似
    度の双方を用いて認識判定を行なう請求項1に記載の音
    声認識方式。
JP2190163A 1990-07-18 1990-07-18 音声認識方式 Pending JPH0476600A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2190163A JPH0476600A (ja) 1990-07-18 1990-07-18 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2190163A JPH0476600A (ja) 1990-07-18 1990-07-18 音声認識方式

Publications (1)

Publication Number Publication Date
JPH0476600A true JPH0476600A (ja) 1992-03-11

Family

ID=16253479

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2190163A Pending JPH0476600A (ja) 1990-07-18 1990-07-18 音声認識方式

Country Status (1)

Country Link
JP (1) JPH0476600A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005506758A (ja) * 2001-10-01 2005-03-03 ゲンケイ アクティーゼルスカブ 一時的に暗号鍵を作成することによる、デジタル認証、暗号化、署名のためのシステム、携帯端末、及び方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005506758A (ja) * 2001-10-01 2005-03-03 ゲンケイ アクティーゼルスカブ 一時的に暗号鍵を作成することによる、デジタル認証、暗号化、署名のためのシステム、携帯端末、及び方法

Similar Documents

Publication Publication Date Title
Ouyang et al. A fully convolutional neural network for complex spectrogram processing in speech enhancement
US4918735A (en) Speech recognition apparatus for recognizing the category of an input speech pattern
US5749072A (en) Communications device responsive to spoken commands and methods of using same
JP3584458B2 (ja) パターン認識装置およびパターン認識方法
KR100699622B1 (ko) 음성 신호를 구분 및 인식하기 위한 시스템 및 방법
JPH02238495A (ja) 時系列信号認識装置
US5963904A (en) Phoneme dividing method using multilevel neural network
JPH0566795A (ja) 雑音抑圧装置とその調整装置
JPH1083194A (ja) 話し手照合システムのための2段階群選択方法
Gurbuz et al. Application of affine-invariant Fourier descriptors to lipreading for audio-visual speech recognition
JP2870224B2 (ja) 音声認識方法
US4426551A (en) Speech recognition method and device
JPH01296299A (ja) 音声認識装置
Do et al. Speech source separation using variational autoencoder and bandpass filter
Erell et al. Estimation using log-spectral-distance criterion for noise-robust speech recognition
JPH02165388A (ja) パターン認識方式
JPH0476600A (ja) 音声認識方式
JP3163109B2 (ja) 多方向同時収音式音声認識方法
Sivaram et al. Mixture of Auto-Associative Neural Networks for Speaker Verification.
Liztio et al. Gender identification based on speech recognition using backpropagation neural network
JP2002123286A (ja) 音声認識方法
JPH04184400A (ja) 雑音除去装置
Renisha et al. Cascaded Feedforward Neural Networks for speaker identification using Perceptual Wavelet based Cepstral Coefficients
Higashiguchi et al. A personal authentication system based on pinna related transfer function
JPS63502304A (ja) 高雑音環境における言語認識のためのフレ−ム比較法