JPS6210697A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS6210697A
JPS6210697A JP60150697A JP15069785A JPS6210697A JP S6210697 A JPS6210697 A JP S6210697A JP 60150697 A JP60150697 A JP 60150697A JP 15069785 A JP15069785 A JP 15069785A JP S6210697 A JPS6210697 A JP S6210697A
Authority
JP
Japan
Prior art keywords
feature data
frame
distance
data block
frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60150697A
Other languages
English (en)
Inventor
納田 重利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP60150697A priority Critical patent/JPS6210697A/ja
Publication of JPS6210697A publication Critical patent/JPS6210697A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、例えば特定話者の音声を単語単位で認識す
るのに通用される音声認識装置に関する。
〔発明の概要〕
この発明は、離散的な周波数スペクトルにより表現され
る多次元ベクトルの軌跡の長さに略々比例する適応な分
割数によって時間軸の正規化処理を行って特徴データを
抽出する手段ををする音声認識装置のパターンマツチン
グ判定器において、スイングサーチを行いながら、サー
チ幅に略々比例しかつ入力パターンを構成するフレーム
数に略々反比例する重み係数を求め、スイングサーチに
より得られるフレーム間距離にこの重み係数を乗じて距
離計算処理を行うことにより、入力パターンを構成する
フレーム数に応じてみかけ上マツチング手法を変化させ
て認識率の低下を防止するようにしたものである。
〔従来の技術〕
従来の音声認識装置は、音声入力部としてのマイクロホ
ン、前処理回路、音響分析器、特徴データ抽出器、登録
パターンメモリ及びパターンマツチング判定器等により
構成されている。
マイクロホンから人力される音声信号が前処理回路にお
いて、音声認識に必要とされる帯域に制限され、A/D
変換器によりディジタル音声信号とされる。このディジ
タル音声信号が音響分析器に供給される。
音響分析器において、音声信号が周波数スペクトルに変
換され、例えば対数軸上で一定間隔となるように周波数
スペクトルのレベルが正規化され、離散的な周波数スペ
クトルデータが発生される。
この周波数スペクトルデータ列が単位時間(フレーム周
期)毎に1つのフレームデータとして出力される。即ち
、フレーム周期毎の1フレームのデータがNチャンネル
の周波数スペクトルデータとされ、N次元ベクトルによ
り表現されるパラメータとして切り出され、特徴データ
抽出器に供給される。
特徴データ抽出器において、隣り合うフレームデータの
距離が計算される。対応するチャンネルのスペクトルデ
ータの差の絶対値が夫々求められ、その総和がフレーム
間距離とされる。
更に、夫々のフレーム間距離の総和が求められ、音声信
号の始端フレームから終端フレームまでのN次元ベクト
ルの軌跡長が求められる。そして最も語数が多く長い音
声の場合に特徴を抽出するのに必要な所定の分割数でも
って軌跡長が等分割され、その分割点に対応したフレー
ムデータのみが特徴データとして抽出され、話者の音声
の発生速度変動に影響されることがないように時間軸が
正規化されて出力される。
この特徴データが登録時においては、登録パターンメモ
リに登録特徴データブロック(標準パターン)として記
憶される。認識時においては、入力音声信号が前述した
処理を経て、入力特徴データブロック(入力パターン)
とされ、パターンマツチング判定器に供給され、入力特
徴データブロックと登録特徴データブロックとの間のパ
ターンマツチングが行われる。
パターンマツチング判定器において、人力特徴データブ
ロックと登録特徴データブロックの間のマツチング距離
が算出される。例えば、特徴データ抽出器において1個
のフレームデータが抽出され、0〜(1−1)フレーム
により特徴データブロックが構成される。登録特徴デー
タブロックを構成するフレームデータと入力特徴データ
ブロックを構成するフレームデータとの間で、スイング
サーチが行われながら対応するフレーム間の距離が計算
される。
例えば、i番目のフレーム間距離SD、をnをチャンネ
ル番号とし、入力特徴データブロックのスペクトルデー
タをS!Rとし、登録特徴データブロックのスペクトル
データRi nとし、サーチ幅を1としてスイングサー
チを用いて絶対値距離により算出すると で求められる。即ち、入力特徴データブロックのi番目
のフレームと登録特徴データブロックの(i−1)番目
のフレーム、入力特徴データブロックのi番目のフレー
ムと登録特徴データブロックのi番目のフレーム、入力
特徴データブロックのi番目のフレームと登録特徴デー
タブロックの(i+1)番目フレームの夫々の間の対応
するチャンネルの差の絶対値の総和が求められ、得られ
た3つの値のうちで最小となる値がフレーム開路@S 
D、とされる。
そして、入力特徴データブロックの全てのフレームに関
して、スイングサーチされながら登録特徴データブロッ
クのフレームとの間のフレーム間距離SD、が求められ
、このフレーム間距離SD盈の(i=1−1)までの総
和、即ち、マツチング距離が求められる。他の登録特徴
データブロックに関しても、同様にマツチング距離が求
められ、マツチング距離が最小で十分に距離が近いもの
と判断される登録特徴データブロックに対応する単語が
認識結果として出力される。
〔発明が解決しようとする問題点〕
従来の音声認識装置のパターンマツチング判定器におけ
るスイングサーチ用を用いたフレーム間距離は前述した
ようにサーチ幅(v=m)に応じて入力特徴データブロ
ックのi番目のフレームに登録特徴データブロックの(
i−m)〜(i+m)までのフレームを対応させ、その
夫々のフレーム間における絶対値距離の総和が最小とな
るものを選択し、フレーム間距離とするものである。
しかし、例えば特徴データ抽出器において離散的な周波
数スペクトルにより表現される多次元ベクトルの軌跡の
長さに応じて分割数が可変とされ、音声の語長に応じて
特徴データが抽出される方式においては、スイングサー
チを用いず単純に入力特徴データブロックのi番目のフ
レームに対して登録特徴データブロックのi番目のフレ
ームを対応させてフレーム間距離を求める方が良い場合
がある。つまり、特徴データブロックのフレーム数が少
ない場合には、各フレームデータが強い独自の特徴を示
しており、特徴データブロック全体として誤差が少ない
ために入力特徴データブロックのi番目のフレームに対
して登録特徴データブロックのi番目のフレームを対応
させてフレーム間距離を求める方が良い。もし、スイン
グサーチを行って入力特徴データブロックのi番目のフ
レームと登録特徴データブロックのi番目のフレームで
ないフレームとのフレーム間距離が選択された場合には
、誤ったマツチング距離が算出され認識率が低下するお
それが高い。また、特徴データブロックのフレーム数が
多い場合には、特徴データブロック全体として誤差が多
く含まれているためむしろ積極的にスイングサーチを行
ってフレーム間距離ををもとめる方が良い。
また、従来のスイングサーチでは入力特徴データブロッ
クのフレームに対して求められた複数のフレーム間距離
の夫々が同等に扱われていたため、誤差を多く含んだマ
ツチング距離が算出される可能性があった。
従って、この発明の目的は、サーチ幅に略々比例し、且
つ入力特徴データブロックを構成するフレーム数に略々
反比例する重み係数をスイングサーチにより得られるフ
レーム間距離に夫々乗じて距離計算処理を行い、入力特
徴データブロックを構成するフレーム数に応じてみかけ
上マツチング手法を変化させ、認識率の低下を防止する
ことができる音声認識装置を提供することにある。
〔問題点を解決するための手段〕
この発明は、入力音声信号をスペクトル変換等音声認識
に必要な前処理を行う音響分析手段5と、音響分析手段
5の出力データが供給され、適応な分割数によって時間
軸の正規化処理を行い、特徴データを抽出する特徴デー
タ抽出手段6と、特徴データが標準パターンとして記憶
されるメモリ7と、 特徴データ抽出手段6からの入力パターンと、メモリ7
から読み出された標準パターンとが供給され、入力パタ
ーンを構成するフレームとサーチ幅に応じた個数の標準
パターンの複数個のフレームとを対応させて夫々のフレ
ーム間距離を求めると共に、サーチ幅に略々比例し且つ
入力パターンを構成するフレーム数に略々反比例する重
み係数を求め、重み係数が乗算若しくは加算されたフレ
ーム間距離を用いて入力パターンと標準パターンとの距
離計算処理を行い、距離計算処理の結果に基づいてマツ
チング判定するパターンマツチング判定手段8と、 からなることを特徴とする音声認識装置である。
〔作用〕
パターンマツチング判定器8において、入力特徴データ
ブロックのフレームに対してサーチ幅に応じて登録特徴
データブロックのフレームが複数個対応させられ、夫々
のフレーム間に関してフレーム間距離が求められると共
に、サーチ幅に略々比例しかつ入力特徴データブロック
の構成フレーム数に略々反比例する重み係数が求められ
、この重み係数が対応するフレーム間距離に夫々乗ぜら
れ、得られた乗算結果中の最小となるフレーム間距離が
選択されて累算されることによりマツチング距離が算出
され、求められたマツチング距離に基づいてマツチング
判定が行われる。
〔実施例〕
以下、この発明の一実施例を図面を参照して説明する。
第1図は、この発明の一実施例を示すもので、第1図に
おいて、lが音声入力部としてのマイクロホンを示して
いる。
マイクロホン1からのアナログ音声信号がフィルタ2に
供給される。フィルタ2は、例えばカットオフ周波数7
.5に11□のローパスフィルタであり、音声信号がフ
ィルタ2において、音声認識に必要とされる7、5にH
2以下の帯域に制限され、この音声信号がアンプ3を介
してA/D変換器4に供給される。
A/D変換器4は、例えば、サンプリング周波数12.
5KH2の8ピッl−A/D変換器であり、音声信号が
A/D変換器4において、アナログ−ディジタル変換さ
れて、8ビツトのディジタル信号とされ、音響分析器5
に供給される。
音響分析器5は、音声信号を周波数スペクトルに変換し
て、例えば、Nチャンネルのスペクトルデータ列を発生
するものである。音響分析器5において、音声信号が演
算処理により周波数スペクトルに変換され、例えば対数
軸上で一定間隔となるN個の周波数を代表値とするスペ
クトルデータ列が得られる。従って、音声信号がNチャ
ンネルの離散的な周波数スペクトルの大きさによって表
現される。そして、単位時間(フレーム周期)毎にNチ
ャンネルのスペクトルデータ列が一つのフレームデータ
として出力される。即ち、フレーム周期毎に音声信号が
N次元ベクトルにより表現されるパラメータとして切り
出され、特徴データ抽出器6に供給される。
特徴データ抽出器6において、隣り合うフレームデータ
の距離が計算される。対応するチャンネルのスペクトル
データの差の絶対値が夫々求められ、その総和がフレー
ム間距離とされる。
更に、夫々のフレーム間距離の総和が求められ、音声信
号の始端フレームから終端フレームまでのN次元ベクト
ルの軌跡長が求められる。そしてこの軌跡長に略々比例
した分割数でもって軌跡長が分割され、その分割点に対
応したフレームデータのみが特徴データとして抽出され
る。即ち、話者の音声の発生速度変動に影響されること
がないように時間軸が正規化され、強い独自の特徴を示
すフレームデータが音声の語長に応じた数だけ抽出され
て出力される。
この特徴データが登録時においては、登録パターンメモ
リ7に供給され、登録特徴データブロックとして記憶さ
れる。認識時においては、入力音声信号が前述した処理
を経て、入力特徴データブロックとされ、パターンマツ
チング判定器8に供給される。
パターンマツチング判定器8において、人力特徴データ
ブロックのフレーム数と略々等しいフレーム数の登録特
徴データブロックのみが比較の対象とされ、入力特徴デ
ータブロックと登録特徴データブロックの間において、
パターンマツチングが行われる。
第2図は、パターンマツチング判定器8の一例を示し、
第2図に示すようにフレーム距離計算回路109重み係
数計算回路119重み付は回路13、最小値抽出回路1
4.マツチング距離計算回路15及び最小距離判定回路
16によりパターンマツチング判定器8が構成される。
フレーム距離計算回路10に特徴データ抽出器6から入
力特徴データブロックが供給されると共に、登録パター
ンメモリ7から比較の対象となる入力特徴データブロッ
クのフレーム数に略々等しい登録特徴データブロックが
フレーム距離計算回路10に供給される。
フレーム距離計算回路10において、入力特徴データブ
ロック側のi番目のフレームに登録特徴データブロック
側のi番目のフレーム及びi番目のフレームに近接した
複数のフレームを対応させ、その夫々の間のフレーム間
距離の計算が行われる。
例えば、対応させるフレーム幅即ち、サーチ幅Vが(v
=1)とされた場合には、第3図に示すように入力特徴
データブロックのi番目のフレームに対して、登録特徴
データプロ・ツクの(i −1)フレーム、iフレーム
及び(i + l)フレームが対応され、夫々の間のフ
レーム間距離が算出される。また、サーチ幅(v=2)
とされた場合には、入力特徴データブロックのi番目の
フレームる対して特徴データブロックの(+−2)フレ
ーム〜(i+2)フレームが対応され、その夫々の間の
フレーム間距離が算出され、サーチ幅(V=m)とされ
た場合には特徴データブロックの(i−m)〜(i+m
)フレームが対応し、(2m+1)個のフレーム間距離
が夫々算出される。
計算処理により得られた(2m+1)個のフレーム間距
離データのうちで、入力特徴データブロック側のi番目
のフレームに対する登録特徴データ側のi番目のフレー
ムのフレーム間距離データが最小値抽出回路14に供給
され、他の2m個のフレーム間距離データが重み付は回
路13に供給される。また、入力特徴データブロックの
フレーム数を示すフレーム数データが重み係数計算回路
11に供給される。
重み係数計算回路11は、入力端子12を有しており、
この入力端子12を介して適当な値に設定されたサーチ
幅データが重み係数計算回路11に供給される。重み係
数計算回路11において、サーチ幅Vの増加に対して、
第4図Aに示すように増加し、入力特徴データブロック
のフレーム数1の増加に対して第4図Bに示すように減
少する重み係数がフレーム数データ及びサーチ幅データ
に基づいて計算される。
フレーム数■とサーチ幅Vの関数である重み係数W (
VI 11 が例えば、aを適当な定数とした場合、W
 (9,11= 1 + all+ v/1により算出
され、(v−1)〜(v=m)までのm個の重み係数デ
ータが重み付は回路13に供給される。
重み付は回路13において、フレーム間距離データと重
み係数データとの乗算がなされる。入力特徴データブロ
ック側のi番目のフレームと登録特徴データブロック側
の(i−1)フレーム及び(i+1)フレームとのフレ
ーム間距離の夫々にv=1として求められた重み係数W
+1.1)が乗ぜられ、入力特徴データブロック側のi
番目のフレームと登録特徴データブロック側の(i−2
)フレーム及び(i+2)フレームとのフレーム間距離
の夫々にv=2として求められた重み係数W、2゜1、
が乗ぜられ、以下同様にフレーム間距離に重み係数が乗
ぜられ、両端に位置する(i−m)フレーム及び(i+
m)フレームのフレーム間距離の夫々にv=m’として
求められた重み係数W +11111、が乗ぜられ、こ
の夫々に重み係数が乗ぜられた2m個のフレーム間距離
データがフレーム間距離データとして最小値抽出回路1
4に供給される。
最小値抽出回路14において、(2m+ 1)個のフレ
ーム間距離データの夫々が比較され、最小値となるフレ
ーム間距離データが入力特徴データブロックのi番目の
フレームに対するフレーム間距離とされ、フレーム間距
離データがマツチング距離計算回路15に供給される。
マツチング距離計算回路15において、順次供給される
フレーム間距離データが累算され、入力特徴データブロ
ックの最大フレームN −1)まで、フレーム間距離デ
ータが累算されると、この累算値がマツチング距離デー
タとされ、マツチング距離データが最小距離判定回路1
6に供給される。同様に、フレーム数が略々等しい他の
登録特徴データブロックと入力特徴データブロックとの
間において、マツチング距離が算出されてマツチング距
離データが最小距離判定回路16に供給される。
最小距離判定回路16は、マツチング距離が最小で十分
に距離が近いものと判断される登録特徴データブロック
に対応する単語を認識結果として出力する。
上述のこの発明の一実施例におけるパターンマツチング
判定器8のフレーム距離計算口!10゜重み付は回路1
3.最小値抽出回路14及びマツチング距離計算回路1
5の動作を例えばサーチ幅Vを1として第6図に示すフ
ローチャートを参照して説明する。
登録パターンメモリ7から入力特徴データブロックのフ
レーム数と略々等しい登録特徴データブロックがフレー
ム距離計算回路10に供給されると共に、入力特徴デー
タブロックがフレーム距離計算回路10に供給される。
フレーム距離計算回路10において、入力特徴データブ
ロックと登録特徴データブロックとの間でステップ■及
び■の処理が行われる。
まず、フレーム番号を示す変数iが0に初期設定される
と共にスイングサーチを用いて求められるフレーム間距
離の累算値りが0に初期設定される(ステップ■)。ス
テップ■において、入力特徴データブロックの(i=0
)フレームと登録特徴データブロックの(i−0+1)
フレームとのフレーム間距離SD、。がnチャンネル番
号としてで求められ、対応するチャンネルのスペクトル
データの差の絶対値のθチャンネル−(N−1)チャン
ネルまでの総和がフレーム間距離SD、。とされる。ま
た、同様に入力特徴データブロックの(i=0)フレー
ムと登録特徴データブロックの(i=0)フレームとの
フレーム間距離SD2゜がで求められる。
そして重み付は回路13においてステップ■の処理が行
われる。ステップ■において、サーチ幅V及び入力特徴
データを構成するフレーム数■の関数である1より大き
な重み係数 W (V、 +1  = L +a/ I −+−t/
rが5DIOに乗ぜられ、重み係数が乗ぜられた値が新
たなフレーム間距離SD、。とされる。
最小値抽出回路14において、ステップ■の処理が行わ
れる。ステップ■において、入力特徴データブロックの
(i−0)フレームに対する2つのフレーム間距離S 
D +。及びSDt。が比較され、小さい方が入力特徴
データブロックの(i=o)フレームに対するフレーム
間距離SD、とされる。
マツチング距離計算回路15において、ステップ■〜■
の処理が行われる。ステップ■において、入力特徴デー
タブロックの(i=o)フレームに対するフレーム間距
離SD6がスイングサーチを用いて求められるフレーム
間距離の累算値D (=0+SD、)とされる。フレー
ム番号を示す変数iと最大フレーム(I−1)とが比較
され(ステップ■)、iがインクリメントされて(i=
1)(ステップ■)とされ、次の(i=1)フレームの
スイングサーチを用いて求められるフレーム間距離のS
D、の計算処理(ステップ■〜■)に移行する。
入力特徴データブロックの(i=1)フレームと登録特
徴データブロックの(i=1+1)フレームとのフレー
ム間距離SD、、、入カ特徴データブロックの(i=1
)フレームと登録特徴データブロックの(i=l)フレ
ームとのフレーム間距離SD、、及び入力特徴データブ
ロックの(i=1)フレームと登録特徴データブロック
のN=1−1)フレームとのフレーム間距離SDs+が
、で求められる(ステップ■)。
フレーム間距離S D、、及びSO2,に1より大きな
重み係数W (v+ l 1 が共に乗ぜられ新たなフ
レーム間距離SD、及びSD3+とされる(ステップ■
)。フレーム間距離S Dz、  S Dz+及ヒS 
Dz+のうちで最小のものが入力特徴データブロックの
(i = 1)7レームに対するフレーム間距離SD、
とされる(ステップ■)。このフレーム間距離SD、が
ステップ■において前回の計算により求められたDに加
算され、新たなスイングサーチにより求められるフレー
ム間距離の累算値りが算出される。
更にiがインクリメントされ、上述したステップ■〜■
の処理が繰り返し行われ、フレーム番号を示す変数iが
最大フレーム(1−1)となると計算が終了する。この
時のフレーム間距離の累算値りがマツチング距離とされ
る。入力特徴データブロックのフレーム数と略々等しい
他の登録特徴データブロックとの間においても、同様に
マツチング距離が算出される。
第5図は、サーチ幅(V=1)とした時のスイングサー
チによりマツチング距離が算出される過程の一例を示す
ものである。第5図において縦軸が登録特徴データブロ
ックのフレーム番号を示し、横軸が入力特徴データブロ
ックのフレーム番号を示している。第5図中の細線20
上の点がサーチ幅(V=1)の対応するフレーム番号を
表し、第5図中の細線Zl上の点がサーチ幅(v−0)
の対応するフレーム番号を表し、第5図中の細線22上
の点がサーチ幅(v=1)の対応するフレーム番号を表
し、第5図中の実線23上の点がマツチング距離計算に
採用されたフレーム番号を示している。
第5図に示す場合においては、入力特徴データブロック
の(i=o)フレームに対してはフレーム間距離SD、
。が選択され、入力特徴データブロックの(i=1)フ
レーム、  (i=2)フレーム及び(i=3)フレー
ムに対しては、フレーム間距離5D21.SD2□及び
5Dz3が選択され、マツチング距離が(S D、。+
S D21 + S Dt□+5Dzs+ S D 2
4+・・・+S D*、I−z+ ” S DZII−
11)により算出される。
尚、この発明は、ハードワイヤードの構成に限らず、マ
イクロコンピュータ又はマイクロプログラム方式を用い
てソフトウェアにより処理を行うようにしても良い。
〔発明の効果〕
この発明では、パターンマツチング判定器において、入
力特徴データブロックのフレームに対してサーチ幅に応
じて登録特徴データブロックのフレームが複数個対応さ
せられ、夫々のフレーム間に関してフレーム間距離が求
められると共に、サーチ幅に略々比例し、かつ入力特徴
データブロックを構成するフレーム数に略々反比例する
重み係数が求められ、この重み係数が対応するフレーム
間距離に夫々乗ぜられ、得られた一乗算結果中の最小と
なるフレーム間距離が選択されて累算されることにより
マツチング距離が算出され、求められたマツチング距離
に基づいてマツチング判定が行われる。
従って、この発明に依れば、入力特徴データブロックを
構成するフレーム数に応じてみかけ上マツチング手法が
変化し、フレーム数が少ない場合には、入力特徴データ
ブロックのi番目のフレームと登録特徴データブロック
のi番目のフレームとを対応させて単純にフレーム間距
離を求める処理が行われ、また、フレーム数が多い場合
には、従来のスイングサーチと同様の処理が行われ、認
識率の低下が防止される。
また、この発明に依れば、サーチ幅に応じて重み係数が
乗ぜられることにより、サーチ幅(v=0)の入力特徴
データブロックのi番目のフレームと登録特徴データブ
ロックのi番目のフレームとのフレーム間距離が重視さ
れ、マツチング距離の誤差が低減される。
【図面の簡単な説明】
第1図はこの発明の一実施例の全体の構成を示すブロッ
ク図、第2図はこの発明の一実施例におけるパターンマ
ツチング判定器のブロック図、第3図はこの発明の一実
施例におけるパターンマツチング判定器のフレーム距離
計算回路の説明に用いる路線図、第4図A及び第4図B
はこの発明の一実施例におけるパターンマツチング判定
器の重み係数計算回路の説明に用いる路線図、第5図は
この発明の一実施例におけるパターンマツ1チング判定
器の動作説明に用いる路線図、第6図はこの発明の一実
施例におけるパターンマツチング判定器の動作説明に用
いるフローチャートである。 図面における主要な符号の説明 1:マイクロホン、  5:音響分析器。 6:特徴データ抽出器、  7:登録パターンメモリ、
  8:パターンマツチング判定器。 1(lフレーム距離計算回路、  11:重み係数計算
回路、  13:重み付は回路。 14:最小値抽出回路、  15:マソチング距離計算
回路、  16:最小距離判定回路。

Claims (1)

  1. 【特許請求の範囲】 入力音声信号をスペクトル変換等音声認識に必要な前処
    理を行う音響分析手段と、 上記音響分析手段の出力データが供給され、適応な分割
    数によって時間軸の正規化処理を行い、特徴データを抽
    出する特徴データ抽出手段と、上記特徴データが標準パ
    ターンとして記憶されるメモリと、 上記特徴データ抽出手段からの入力パターンと上記メモ
    リから読み出された上記標準パターンとが供給され、上
    記入力パターンを構成するフレームとサーチ幅に応じた
    個数の上記標準パターンの複数個のフレームとを対応さ
    せて夫々のフレーム間距離を求めると共に、上記サーチ
    幅に略々比例し且つ上記入力パターンを構成するフレー
    ム数に略々反比例する重み係数を求め、上記重み係数が
    乗算若しくは加算されたフレーム間距離を用いて、上記
    入力パターンと上記標準パターンとの距離計算処理を行
    い、上記距離計算処理の結果に基づいてマッチング判定
    するパターンマッチング判定手段と、 からなることを特徴とする音声認識装置。
JP60150697A 1985-07-09 1985-07-09 音声認識装置 Pending JPS6210697A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60150697A JPS6210697A (ja) 1985-07-09 1985-07-09 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60150697A JPS6210697A (ja) 1985-07-09 1985-07-09 音声認識装置

Publications (1)

Publication Number Publication Date
JPS6210697A true JPS6210697A (ja) 1987-01-19

Family

ID=15502452

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60150697A Pending JPS6210697A (ja) 1985-07-09 1985-07-09 音声認識装置

Country Status (1)

Country Link
JP (1) JPS6210697A (ja)

Similar Documents

Publication Publication Date Title
US4624010A (en) Speech recognition apparatus
CN106653056B (zh) 基于lstm循环神经网络的基频提取模型及训练方法
EP0219712B1 (en) Method of and system for speech recognition
US4426551A (en) Speech recognition method and device
JPS5844500A (ja) 音声認識方式
JPH02157800A (ja) 特徴抽出方式
JPS6210697A (ja) 音声認識装置
JP2019132948A (ja) 音声変換モデル学習装置、音声変換装置、方法、及びプログラム
JPS625298A (ja) 音声認識装置
JPS62113197A (ja) 音声認識装置
JPS625299A (ja) 音声認識装置
JPS62105199A (ja) 音声認識装置
JPS60166993A (ja) 単語音声認識装置
JPS61290496A (ja) 音声認識装置
JPS61292695A (ja) 音声認識装置
JPH0454960B2 (ja)
JPS6225799A (ja) 音声認識装置
JP3023135B2 (ja) 音声認識装置
JPS6225798A (ja) 音声認識装置
JP3298658B2 (ja) 音声認識方式
JPH0461359B2 (ja)
JP2668877B2 (ja) 音源正規化方法
JPS63104099A (ja) 音声認識装置
JPS63121100A (ja) 音声認識装置における特徴パタ−ン抽出方法
JPS59204895A (ja) 音声認識装置