JPS625298A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS625298A
JPS625298A JP60143376A JP14337685A JPS625298A JP S625298 A JPS625298 A JP S625298A JP 60143376 A JP60143376 A JP 60143376A JP 14337685 A JP14337685 A JP 14337685A JP S625298 A JPS625298 A JP S625298A
Authority
JP
Japan
Prior art keywords
data
distance
average value
frame
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60143376A
Other languages
English (en)
Inventor
納田 重利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP60143376A priority Critical patent/JPS625298A/ja
Publication of JPS625298A publication Critical patent/JPS625298A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、例えば特定話者の音声を単語単位で認識す
るのに適用される音声認識装置に関する。
〔発明の概要〕
この発明は、例えば特定話者の音声を単語単位で認識す
るのに適用される音声認識装置のパターンマツチング判
定器において、標準パターンと入力パターンとの間で対
応するフレームの距離計算を行う際に、入カスベクトル
データの平均値と入カスベクトルデータの夫々とを比較
すると共に、標準パターンのスペクトルデータの平均値
とスペクトルデータの夫々とを比較し、共に平均値より
小さいチャンネルに関しては、1以下の重み係数を乗じ
て外来ノイズの影響を大きく受ける恐れが大きいスペク
トルデータを見かけ上小さくしてフレーム間距離を求め
、更にその総和を求めてマツチング距離を算出してマツ
チング判定を行うことにより、外来ノイズの影響を軽減
させ、認識率の低下を防止するようにしたものである。
〔従来の技術〕
従来の音声認識装置は、音声入力部としてのマイクロホ
ン、前処理回路、音響分析器、特徴データ抽出器、登録
パターンメモリ及びパターンマツチング判定器等により
構成されている。
マイクロホンから入力される音声信号が前処理回路にお
いて、音声認識に必要とされる帯域に制限され、A/D
変換器によりディジタル音声信号とされる。このディジ
タル音声信号が音響分析器に供給される。
音響分析器において、音声信号が周波数スペクトルに変
換され、例えば対数軸上で一定間隔となるように周波数
スペクトルのレベルが正規化され、離散的な周波数スペ
クトルデータが発生される。
この周波数スペクトルデータ列が単位時間(フレーム周
期)毎に1つのフレームデータとして出力される。即ち
、フレーム周期毎の1フレー“ムのデータがNチャンネ
ルの周波数スペクトルデータとされ、N次元ベクトルに
より表現されるパラメータとして切り出され、特徴デー
タ抽出器に供給される。
特徴データ抽出器において、隣り合うフレームデータの
距離が計算される。対応するチャンネルのスペクトルデ
ータの差の絶対値が夫々求められ、その総和がフレーム
間距離とされる。
更に、夫々のフレーム間距離の総和が求められ、音声信
号の始端フレームから終端フレームまでのN次元ベクト
ルの軌跡長が求められる。そして最も語数が多く長い音
声の場合に特徴を抽出するのに必要な所定の分割数でも
って軌跡長が等分割され、その分割点に対応したフレー
ムデータのみが特徴データとして抽出され、話者の音声
の発生速度変動に影響されることがないように時間軸が
正規化されて出力される。
この特徴データが登録時においては、登録パターンメモ
リに登録特徴データブロック(標準パターン)として記
憶される。認識時においては、入力音声信号が前述した
処理を経て、入力特徴データブロックとされ、パターン
マツチング判定器に供給され、入力特徴データブロック
と登録特徴データブロックとの間のパターンマツチング
が行われる。
パターンマツチング判定器において、入力特徴データブ
ロックと登録特徴データブロックの間のマツチング距離
が算出される。例えば、特徴データ抽出器において1個
のフレームデータが抽出され、0〜(1−1’)フレー
ムにより特徴データブロックが構成される。登録特徴デ
ータブロックを構成するフレームデータと入力特徴デー
タブロックを構成するフレームデータとの間で、対応す
るフレーム間の距離が計算される。
例えば、i番目のフレーム間距離り、はnをチャンネル
番号とし、入力特徴データブロック9スペクトルデータ
をS inとし、登録特徴データブロックのスペクトル
データをRiとすると、次式のように絶対値距離として
算出される。
そして全ての対応するフレームに関してフレーム間距離
DIが求められ、更にこのフレーム間距離り籠の(i−
1−1)までの総和即ち、マツチング距離が求められる
。他の登録特徴データブロックに関しても、同様にマツ
チング距離が求められ、マツチング距離が最小で十分に
距離が近いものと判断される登録特徴データブロックに
対応する単語が認識結果として出力される。
〔発明が解決しようとする問題点〕
従来の音声認識装置のパターンマツチング判定器におけ
るフレーム間距離は前述したように対応するフレーム及
びチャンネルのスペクトルデータの差の絶対値の総和と
して算出される。しかし、音声信号中に種々の外来ノイ
ズが混入している場合には、小さな値のスペクトルデー
タがノイズの影響を大きく受けてばらつくことが起こる
。このため、フレーム間距離に誤差が含まれ、その総和
によるマツチング距離に誤差が含まれるものとなる。こ
れは認識率の低下の原因となるものであった。
従って、この発明の目的は、音声信号中に種々の外来ノ
イズが混入した場合においても、パターンマツチングの
際に、スペクトルデータに重みを乗じてマツチング距離
計算処理を行い、外来ノイズの影響を軽減させ、認識率
の低下を防止することができる音声認識装置を提供する
ことにある。
〔問題点を解決するための手段〕
この発明は、入力音声信号をスペクトル変換等音声認識
に必要な前処理を行う音響分析手段5と、音響分析手段
5の出力データが供給され、出力データから特徴データ
を抽出する特徴データ抽出手段6と、 特徴データが標準パターンとして記憶されるメモリ7と
、 特徴データ抽出手段6からの入力パターンと、メモリ7
から読み出された標準パターンとが供給され、入力パタ
ーンを構成する夫々のフレームのスペクトルデータの平
均値Siを求めてスペクトルデータの夫々と比較すると
共に、標準パターンを構成する夫々のフレームのスペク
トルデータの平均値りを求めてスペクトルデータの夫々
と比較し、入力パターンを構成するスペクトルデータが
平均値S!より小さくかつ標準パターンを構成するスペ
クトルデータが平均値!?、より小さいチャンネルに関
しては、1以下の重み係数を乗じて入力パターンと標準
パターンとの距離計算処理を行い、距離計算処理の結果
に基づいてマツチング判定するパターンマツチング判定
手段8と、からなることを特徴とする音声認識装置であ
る。
(作用〕 パターンマツチング判定器8において、登録特徴データ
ブロックと入力特徴データブロックとの間て対応するフ
レーム毎に各々のスペクトルデータの平均値S籠及びi
tが求められ、平均値m+と入カスベクトルデータの夫
々とが比較されると共に平均値Riと登録スペクトルデ
ータの夫々とが比較され、共に平均値より小さくなるチ
ャンネルに関しては、1以下の重み係数が乗じられてフ
レーム間距離が求められ、フレーム間距離の総和により
マツチング距離が算出され、求められたマツチング距離
に基づいてマツチング判定が行われる。
〔実施例〕
以下、この発明の一実施例を図面を参照して説明する。
第1図は、この発明の一実施例を示すもので、第1図に
おいて、1が音声入力部としてのマイクロホンを示して
いる。
マイクロホン1からのアナログ音声信号がフィルタ2に
供給される。フィルタ2は、例えばカットオフ周波数が
7.5 KH2のローパスフィルタであり、音声信号が
フィルタ2により帯域制限され、この音声信号がアンプ
3を介してA/D変換器4に供給される。
A/D変換器4は、例えば、サンプリング周波数12.
5KH2の8ビツトA/D変換器であり、音声信号がA
/D変換器4において、アナログ−ディジタル変換され
て、8ビツトのディジタル信号とされ、音響分析器5に
供給される。
音響分析器5は、音声信号を周波数スペクトルに変換し
て、例えば、Nチャンネルのスペクトルデータ列を発生
するものである。音響分析器5において、音声信号が演
算処理により周波数スペクトルに変換され、例えば対数
軸上で一定間隔となるN個の周波数を代表値とするスペ
クトルデータ列が得られる。従って、音声信号がNチャ
ンネルの離散的な周波数スペクトルの大きさによって表
現される。そして、単位時間(フレーム周期)毎にNチ
ャンネルのスペクトルデータ列が一つのフレームデータ
として出力される。即ち、フレーム周期毎に音声信号が
N次元ベクトルにより表現されるパラメータとして切り
出され、特徴データ抽出器6に供給される。
特徴データ抽出器6において、隣り合うフレームデータ
の距離が計算される。対応するチャンネルのスペクトル
データの差の絶対値が夫々求められ、その総和がフレー
ム間距離とされる。
更に、夫々のフレーム間距離の総和が求められ、音声信
号の始端フレームから終端フレームまでのN次元ベクト
ルの軌跡長が求められる。そして最も語数が多く長い音
声の場合に特徴を抽出するのに必要な所定の分割数でも
って軌跡長が等分割され、その分割点に対応したフレー
ムデータのみが特徴データとして抽出され、話者の音声
の発生速度変動に影響されることがないように時間軸が
正規化されて出力される。
例えば、特徴データ抽出器6において、第2図に示すよ
うに1個のフレームデータが抽出され、各々が0〜(N
−1)チャンネルのデータにより構成されるフレームデ
ータが0フレーム〜(I−1)フレームまで抽出される
この特徴データが登録時においては、登録パターンメモ
リ7に登録特徴データブロックとして記憶される。認識
時においては、入力音声信号が前述した処理を経て、入
力特徴データブロックとされ、パターンマツチング判定
器8に供給され、入力特徴データブロックと全ての登録
データブロックとの間においてパターンマツチングが行
われる。
第3図はパターンマツチング判定器8の一例を示し、第
3図に示すように、平均値計算回路10、フレーム距離
計算回路11、マツチング距離計算回路12及び最小距
離判定回路13によりパターンマツチング判定器8が構
成される。
平均値計算回路10に特徴データ抽出器6から入力特徴
データブロックが供給されると共に、登録パターンメモ
リ7から比較の対象となる登録特徴データブロックが平
均値計算回路10に供給される。
平均値計算回路10において、入力特徴データブロック
を構成する各フレームの入カスベクトルデータの平均値
が1フレーム毎に計算され、その時のフレームデータと
共に、この入カスベクトルデータの平均値データがフレ
ーム距離計算回路11に供給される。また、平均値計算
回路10において、登録特徴データブロックを構成する
各フームの登録スペクトルデータの平均値が1フレーム
毎に計算され、その時のフームデータと共に、この登録
スペクトルデータの平均値データがフレーム距離計算回
路11に供給される。
フレーム距離計算回路11において、入力特徴データブ
ロックと登録特徴データブロックの互いに対応するフレ
ーム間の距離計算が行われる。距離計算の際には、入カ
スベクトルデータの平均値と入カスベクトルデータの夫
々とが比較されると共に登録スペクトルデータの平均値
と登録スペクトルデータの夫々とが比較され、共に平均
値未満となるチャンネルに関しては、1以下の適当な値
の重み係数が乗じられてフレーム間距離が算出される。
例えば、フレーム距離計算回路11に第4図に示すよう
な0チヤンネル〜15チヤンネルの16個の入カスベク
トルデータと入カスベクトルの平均値データが供給され
ると共に、第5図に示すような0チヤンネル〜15チヤ
ンネルの16個の登録スペクトルデータと登録スペクト
ルの平均値データが供給されるものとする。この場合に
おいては、フレーム距離計算回路11の処理により、入
カスベクトルの平均値未満でかつ登録スペクトルの平均
値未満となるチャンネル即ち、(0,4゜5.6.7,
10.14.15)チャンネル間の計算に関しては、1
以下の重み定数が乗ぜられ、他の(1,2,3,8,9
,11,12,13)チャンネル間の計算においては、
そのままで計算がなされ、外来ノイズの影響を大きく受
けて誤差が大きく含まれる恐れが大きいスペクトルデー
タが見かけ上小さくされてフレーム間距離が求められる
フレーム距離計算回路11において得られた入力特徴デ
ータブロックと登録データブロックの間の対応するフレ
ームのフレーム間距離データがマッチング距離計算回路
12に供給される。
マツチング距離計算回路12において、順次供給される
フレーム間距離データが累算され、最大フレーム(1−
1)までのフレーム間距離データが累算され、この累算
値がマツチング距離データとされ、マツチング距離デー
タが最小距離判定回路13に供給される。同様に全ての
登録特徴データブロックと、入力特徴データブロックと
の間においてマツチング距離が算出されてマツチング距
離データが最小距離判定回路13に供給される。
最小距離判定回路13は、マツチング距離が最小で十分
に距離が近いものと判断される登録特徴データブロック
に対応する単語を認識結果として出力する。
上述のこの発明の一実施例におけるパターンマツチング
判定器8の平均値計算回路10及びフレーム距離計算回
路11の動作を第4図に示すフローチャートを参照して
説明する。
登録パターンメモリ7から登録特徴データブロックが平
均値計算回路10に供給されると共に特徴データ抽出器
6から入力特徴データブロックが平均値計算回路10に
供給される。平均値計算回路10において、各々の特徴
データブロックに関してフレーム毎にステップ■及び■
の処理が行われる。
i番目のフレームに関して、まずチャンネル番号を示す
変数nが0に初期設定されると共に同一チャンネル間の
絶対値距離の累算値りがOに初期設定される(ステップ
■)。ステップ■において、N個のチャンネルにより構
成される入カスベクトルデータ列の平均値$ムが で求められる。また、N個のチャンネルにより構成され
る登録スペクトルデータ列の平均値Riが、で求められ
る。そして、フレーム距離計算回路11において、ステ
ップ■〜■の処理が行われる。
ステップ■において、i番目のフレームの(n=0)チ
ャンネルの絶対値和MD0が求められ(ステップ■)、
(n=o)チャンネルの入カスベクトルデータ5l(1
と入カスベクトルデータ列の平均値Siとが比較される
(ステップ■)。
入カスベクトルデータS盈。が平均値39以上の場合に
は、ステップ■の処理に移行し、絶対値距離D0が絶対
値距離の累算値1) (= Q + Do )とされる
。また、入カスベクトルデータSt。が平均値S五未満
の場合は、ステップ■において(n=O)チャンネルの
登録スペクトルデータRi゜と登録スペクトルデータ列
の平均値Riとが比較され、スペクトルデータRi゜が
平均値RL以上の場合はステップ■の処理に移行し、絶
対値距離D0が絶対値距離の累算値D(=O+DO)と
される。
また、登録スペクトルデータRi゜が平均値未満の場合
は、ステップ■において、1以下の重み定数W(0≦W
く1)が絶対値距離D0に乗ぜられ、重みが乗ぜられた
値D0 ・Wが絶対値距離D0とされ、ステップ■にお
いて、この絶対値距離D0が絶対値距離の累算値D (
=O+Do )とされる。
チャンネル番号を示す変数nと最大チャンネル(N−1
)とが比較され(ステップ■)、nがインクリメントさ
れて(n=1)(ステップ■)とされ、次の(n=1)
チャンネルの絶対値距離D1の計算に移行し、上述した
ステップ■〜■の処理が行われ、絶対値距離D1が求め
られてステップ■において、前回の計算により求められ
たDにDlが加算され、新たな絶対値距離の累算値りが
算出される。
更にnがインクリメントされ、上述したステップ■〜■
の処理が繰り返し行われ、(Si−<’l;t)、(R
z、<Ri )が共に成立する時のみ1以下の重み定数
Wが絶対値距離D7に乗ぜられ、また、(Sz、<!;
門) 、  (R−t−<1’L )が一方でも成立し
ない時には、重み定数Wが乗算されない。
チャンネル番号を示す変数nが最大チャンネル(N−1
)となるとi番目のフレームの計算処理が終了される。
終了時に得られた絶対値距離の累算値りがフレーム間距
離りえとされ、次のフレームにおいて同様にフレーム間
距離が算出される。
尚、この発明は、ハードワイヤードの構成に限らず、マ
イクロコンピュータ又はマイクロプログラム方式を用い
てソフトウェアにより処理を行うようにしても良い。
〔発明の効果〕
この発明では、パターンマツチング判定器において、登
録特徴データブロックと、人力特徴データブロックとの
間で対応するフレーム毎に各々めスペクトルデータ列の
平均値$1及び貴重が求められ、平均値S+ と入カス
ベクトルデータの夫々とが比較されると共に平均値りと
登録スペクトルデータの夫々とが比較され、共に平均値
より小さくなるチャンネルに関しては、1以下の重み係
数が乗じられてフレーム間距離が求められ、フレーム間
距離の総和よりマツチング距離が算出され、求められた
マツチング距離に基づいてマツチング判定が行われる。
従うて、この発明に依れば、外来ノイズの影響を大きく
受けるおそれが高いチャンネル間の距離を見かけ上小さ
くするようにしてフレーム間の距離を求めることができ
、外来ノイズの影響による誤差が低減された形でマツチ
ング距離が算出され、認識率の低下が防止される。
また、この発明は、’(Sムn〈sり 、 (Rlll
く’ni>の両者が成立する時のチャンネル間の絶対値
距離をフレーム間距離の計算の際に軽視しているので、
上述の条件のうちの一方が成立する時に同様の処理を行
うのと異なり、信頼性が高いチャンネル間の絶対値距離
を捨ててしまうような問題が生じない利点がある。
【図面の簡単な説明】
第1図はこの発明の一実施例の全体の構成を示すブロッ
ク図、第2図はこの発明の一実施例における特徴データ
ブロックのデータ構成の説明に用いる路線図、第3図は
この発明の一実施例におけるパターンマツチング判定器
のブロック図、第4図及び第5図はこの発明の一実施例
におけるパターンマツチング判定器の動作説明に用いる
路線図、第6図はこの発明の一実施例におけるパターン
マツチング判定器の平均値計算回路及びフレーム距離計
算回路の動作説明に用いるフローチャートである。 図面における主要な符号の説明 l:マイクロホン、  5:音響分析器、6:特徴デー
タ抽出器、7:登録パターンメモリ、8:パターンマツ
チング判定器、 10:平均値計算回路、11:フレーム距離計算回路、
12:マツチング距離計算回路、 13:最小距離判定回路。

Claims (1)

  1. 【特許請求の範囲】 入力音声信号をスペクトル変換等音声認識に必要な前処
    理を行う音響分析手段と、 上記音響分析手段の出力データが供給され、上記出力デ
    ータから特徴データを抽出する特徴データ抽出手段と、 上記特徴データが標準パターンとして記憶されるメモリ
    と、 上記特徴データ抽出手段からの入力パターンと上記メモ
    リから読み出された上記標準パターンとが供給され、上
    記入力パターンを構成する夫々のフレームのスペクトル
    データの平均値@S@_iを求めてスペクトルデータの
    夫々と比較すると共に、上記標準パターンを構成する夫
    々のフレームのスペクトルデータの平均値@R@_iを
    求めてスペクトルデータの夫々と比較し、上記入力パタ
    ーンを構成するスペクトルデータが上記平均値@S@_
    iより小さくかつ上記標準パターンを構成するスペクト
    ルデータが上記平均値@R@_iより小さいチャンネル
    に関しては、1以下の重み係数を乗じて上記入力パター
    ンと上記標準パターンとの距離計算処理を行い、上記距
    離計算処理の結果に基づいてマッチング判定するパター
    ンマッチング判定手段と、 からなることを特徴とする音声認識装置。
JP60143376A 1985-06-29 1985-06-29 音声認識装置 Pending JPS625298A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60143376A JPS625298A (ja) 1985-06-29 1985-06-29 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60143376A JPS625298A (ja) 1985-06-29 1985-06-29 音声認識装置

Publications (1)

Publication Number Publication Date
JPS625298A true JPS625298A (ja) 1987-01-12

Family

ID=15337342

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60143376A Pending JPS625298A (ja) 1985-06-29 1985-06-29 音声認識装置

Country Status (1)

Country Link
JP (1) JPS625298A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4898033A (en) * 1987-09-24 1990-02-06 Kabushiki Kaisha Tokai-Rika-Denki-Seisakusho Acceleration sensor
JPH06274193A (ja) * 1993-03-17 1994-09-30 Nippon Steel Corp データベース検索システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4898033A (en) * 1987-09-24 1990-02-06 Kabushiki Kaisha Tokai-Rika-Denki-Seisakusho Acceleration sensor
JPH06274193A (ja) * 1993-03-17 1994-09-30 Nippon Steel Corp データベース検索システム

Similar Documents

Publication Publication Date Title
EP0219712B1 (en) Method of and system for speech recognition
CN106653056B (zh) 基于lstm循环神经网络的基频提取模型及训练方法
US4516215A (en) Recognition of speech or speech-like sounds
JPH0465392B2 (ja)
JPS625298A (ja) 音声認識装置
JP3266124B2 (ja) アナログ信号中の類似波形検出装置及び同信号の時間軸伸長圧縮装置
JPS625299A (ja) 音声認識装置
JPS62113197A (ja) 音声認識装置
JPS6210697A (ja) 音声認識装置
JP3023135B2 (ja) 音声認識装置
JPS6225798A (ja) 音声認識装置
JPH0556520B2 (ja)
JPS60166993A (ja) 単語音声認識装置
JPS63104099A (ja) 音声認識装置
JPS6295598A (ja) 音声認識装置
JP2002372982A (ja) 音響信号分析方法及び装置
JPS6225799A (ja) 音声認識装置
JPS62159195A (ja) 音声パタン作成方法
JPS62105199A (ja) 音声認識装置
JP2668877B2 (ja) 音源正規化方法
JPS63121100A (ja) 音声認識装置における特徴パタ−ン抽出方法
JP3002200B2 (ja) 音声認識
JPS61290496A (ja) 音声認識装置
JPS61292695A (ja) 音声認識装置
JPH0454960B2 (ja)