JPS59172698A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS59172698A
JPS59172698A JP58048103A JP4810383A JPS59172698A JP S59172698 A JPS59172698 A JP S59172698A JP 58048103 A JP58048103 A JP 58048103A JP 4810383 A JP4810383 A JP 4810383A JP S59172698 A JPS59172698 A JP S59172698A
Authority
JP
Japan
Prior art keywords
distance
word
standard
monosyllabic
cumulative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58048103A
Other languages
English (en)
Other versions
JPH0449719B2 (ja
Inventor
英一 坪香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP58048103A priority Critical patent/JPS59172698A/ja
Publication of JPS59172698A publication Critical patent/JPS59172698A/ja
Publication of JPH0449719B2 publication Critical patent/JPH0449719B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は音声認識装置、特に単汗節音声と単語音声の両
方を認識て゛きる音声認識装置に関する。
従来例の構成とその問題点 仮名漢字変換機能付のワードプロセッサの仮名キーホー
ドの代りに区切って発声した単音節を認識する単音節音
声認識装置を用いた音声入力ワードプロセッサが既に製
品化されている。
この場合、音声認識は、使用者が予め自分の戸・を標準
パターンとして登録してふ゛かねはならないいわゆる特
定話者向のものである。このとき、し改行」、「削除」
、「変換」等のファンクション機能や、その他頻出単語
を単語音声として晋声入力で行うために(は、単音節に
ついての標準パターンのみならず単語についても標準パ
ターンとして特徴ベクトルの系列を登録しておかなけれ
ばならない。このため、単語の数が増加すると記憶容量
が増加し、また、計算量も、入カバターンの特徴ベクト
ルと、単音節および単語の特徴ベクトル系列との距離計
算を行なわねばならないため、非常に増加するという問
題があった。
発明の目的 本発明は以上の問題全解消し、記憶容量およびi’i1
算喰の増大を抑えつつ、単音節および単語の認識を行う
ことができる音声認識装置を提供することを目的とする
発明の構成 本発明の音声認識装#ば、単音節標準パターンを予め登
録しておき、区切って発声された単音節の認識を行うと
ともに単語標準パターンを単音節標準パターンの結合パ
ターンとし、単音節毎に求めたベクトル間距離を用いて
単語認識を行うように構成し、単音節の認識と単語の認
識をともに行えるようにしたものである。
実施例の説明 以下、本発明の実施例について説明するがその前にパタ
ーンマツチングによる単語音声認識装置について説明す
る。この装置の一般的な構成は次のようなものである。
入力音声信号を、フィルタバンク、周波数分析LPG分
析等によって特徴ベクトルの系列に変換する特徴抽出手
段と、予め発声され、この特徴抽出手段により抽出され
た特徴ベクトルの系列1識単語全部について標準パター
ンとして登録しておく標準パターン記憶手段と、認識さ
ぜるべく発声さn、前記特徴抽出手段にょシ抽出された
入力バター/と前記標準パターン記憶手段に記憶されて
いる標準パターンの全てと特徴ベクトルの系列としての
類似度あるいは距離を計算するパターン比較手段と、パ
ターン比較の結果、最も類似度の高かった(距離の小さ
かった)標準パターンに対応する単語に’FJ識結果と
して判定出方する判定手段からなる。
このとき、同一話者が同一の単語を発声しても発声の都
IW、その発声時間長が異るので、前記パターン比較手
段で標準パターンと入カバターンの比較を行う際には、
両者の時間軸を伸縮させ、両者のパターン長を揃えて比
較する必要がある。その際、発声時間長の変化は、発声
単語の各部で一様に生じているのではないので、各部を
不均一に伸縮する必髪がある。
これを1火で表現したのが第1図である。第1図(a)
において横軸は入カバターンT二a、 a、、・・・a
■(aよけ入カバターンの第1フレームの特徴ベクトル
)に対応するl座標、縦軸は標準パターンHn=b? 
brI2 ・・・b¥n(昭1は標準パターンR1の第
1フレームの特徴ベクトル)に対応するコ座標を表す。
入カバターンTと標準パターンHn とを時間軸を非線
形に伸縮してマツチングするとはこの格トゲラフ上にお
いて、両パターンの各特徴ベクトルの対応関係を示す径
I[!1151を、両パターンの、系列としての距離が
最小になるという評価基準のもとで見出し、そのときの
距離を両パターンの距離とする。この計算を効率的に行
う方法として動的計画法を用いる方法が良く知られてお
り、DPマツチングと呼ばれている。
この径路を決める際には音声の性質を考1這して制限条
件を設ける。第1図(b)id傾斜制限と呼はれる径路
選択の条件の一例である。即ち、この例では点(i、j
)へ径る径路は、点(i−2,1−1)から点(i−1
,j)を通る径路が、点(i−1゜コー1)からの径路
か、点(i−1,j−1)から点(i、j−1)’i通
る径路かの何れかの径路しか収り得ないことを意味して
おり、入カバターンと標準パターンの始端と終端は必ず
対応させるという条件をつけれは、前記マツチングの径
路は第1図(a)の斜線の部分に制限される。この制−
限は、いかに時間軸が伸縮するとはいっても、同一単語
に対してはそれ程極端に伸縮するはずはないという事実
からあまり極端な対応づけが生じないようにするためで
ある。
両系列間の距離は、入力ベクトルa工と標準パターンベ
クトルbr のベクトル間距離d”(i、j )のui
J 記径路に沿う重み付平均として定義される。
このとき径路に沿う重みの和が径路の選ばれ方に依らず
一定になるようにしておけばDPマツチングの手l去が
1史える○ 第2図は単音節音声標準パターンを結合することによっ
て構成した単語標準パターンと入カバターフのマツチン
グの様子を図示したものである。
同図において、Rq(1) 、 Rq(29、Rq(3
脣単音節q(す。
q(2) 、 q(lの標準パターンを意味し、この例
は単音節q(’) 、 (1(2+ 、 q(3)  
から成る単語の標準パターンと入カバターンをマツチン
グする場合を示している。MiJ記説明に従ってマツチ
ング径路は、例えば2のようになる。
以下、11J記したパターンマツチングの手法を用いた
本発明の実施例について説明する。
第3図は本発明の一実施例を示すブ02り図である。図
において、3は音声信号の入力端子、4はフィルタバン
ク等で構成された、入力音声信号全特徴ベクトルの系列
に変換する特徴抽出部である06(は単音節標準パター
ン記憶部であって、各単音節の特徴ベクトルの系列に変
換されたパターンが記憶される。6はベクトル間距離計
算部であって、単音節標準パターン記憶部5の標準パタ
ーンRnk構成するベクトル叶と入カバターンを構成す
るベクトルa、の距離dn(i、j)を計算する。’i
−(”il 、’iz 、”’ 、2Li7り 、”j
 −(b+1’b”  、・−9’?IL!:fルトキ
、dn (i、j)U2 最も簡単には、 d・(・、j)−f”l・1k−bjkll(=1 で与えら扛る。
7(I′iベクトル間距離記憶部であって、ベクトル間
距離計算部6で計算された結果全記憶している08は単
音節累積距離計算部であって、各単音節について第1フ
レームから現フレーム1での累積距離(dn(i、j)
のマツチング径路に沿う重みイ」和)を求める。マツチ
ング径路の拘束条件として第1図(′b)を採用し、各
径路に沿う重み件数を同図の径路上に付した数値とする
と、座標(j−、j)における標準パターンHnに対す
る累積距離Dn(i、j)11.次のように与えられる
・−・・・(1) 9は単音節判定部であって、D”(I、Jn)が最小に
なるnl令とするとき8升 に対応する単音節を認識結
果とする。
10は単語辞書であって、認識単語がそれを表わす単音
節の記号の列としてキーホード等で入力することにより
檗備されている。11は単語累積距離計算部であって、
マツチングさせたい単語に対し、単語、r、¥書1Qで
指定される単音節の順序に従って、ベクトル間距離計算
部7に記憶されている。既に消算済のベクトル間距離を
読み出してきて、単語としての点(i、j)1での累積
距離全1;1曽、する。即ち、例えば第2図において、
第1フレームにおいて、n二1,2.・・・N(Nは単
音節数)に対して単音節標準パターンRn−br br
、・・bJnのそれぞれのベクトルb、と入カバターン
T=aia2・・・a■  の第1フレームのベクトル
八〇とのベクトル間距離dn(i、、 j )は既に単
音節認識の際に計算法であるがら、Bq(η Hq(2
1,RQ(5)のトル間距離は新たに計算する必要はな
い。単語判定部12は入力が完了した後、単語累積距離
計算部11で得られたそれぞれの単語に対する最終累積
距離のうち、最小値を与えるものを単語の認識結果とし
て判定する。13は単音節・単語識別部であって、入力
された音声が単音節であったが、単語であったかを識別
する。これは、キーボードから指定することもできるが
、自動的に行うには音声区間の長さにより判定すること
もできる。即ち、単音節よりも単語の方が発声時間が長
いので、入力信号の電力から通常の方法で求められた音
声区間が予め定められた閾値を越えるが否かに、J:9
単語か単音節かを判定できる。14は、認識結果切換部
であって、単音節・単語識別tfB 13の#、′i果
に応じて単音節判定部9が、単語判足部12の出力を・
明り換えるものである。15は認識結果の出力端r−て
゛ある。
本実施例のように、入力のフレーム毎にすべての!1′
l音節、単詔毎にベクトル間距離、累積距離のδ1算を
完了させてゆけば、入力が終了すると同時に認識結果が
得られるようになる。このとき径路選択の拘束条件を第
1図(b)とすれば、式(1)からも明1つかなように
、ベクトル間距離記憶部7は、フレーム1の処理におい
て必要とされるベクトル間距離を記憶しておけばよいの
であって第1フレームト第i−1フレームのものたけ記
憶していれはよい。丑だ、累積距離については、単音節
に対するもの、単語に対するもの共に、第1−1フレー
ム(!: 第1 2フレームのものたけ記憶していれば
よい。1だ、累積距離については、単音節に対するもの
、単語に対するもの共に、第1−1フレームと@1−2
フレームのものたけ記憶していればよい。なお、これら
累積距離の記憶部は単語累積距離言」狗−都8.単語累
積距離計算部11に含まれており、図示していない。
なお、本実施例では、単音節判定部9と単語判定部12
のように判定部を単杼節と単語の場合について分け、単
音節・単語識別部9により人力7り声が単音節か単語の
何れであったかを識別し、1j、3識結果切換部14で
AiJ記両判定部の何れかの判定結果を出力する構成と
したが、他の実施例として、判定部全1つたけ設け、単
音節累積距離計算部8と単語累積距離計算部11の出力
を区別することなく距離が最も小さくなる標準パターン
に対応する単音節あるいは単語を認識結果として出力す
るようにも構成できる。その場合は単音節・単語識別部
13、認識結果切換部14は不要となる。
なお、以上説明した実施例の各構成要素は、ソフトウェ
ア手段によりその機能全実現することも可能である。
発明の効果 本発明の音声認識装置は、単音節標準パターンを予め登
録しておき、区切って発声された単音節の認識を行うと
ともに単語標準パターンを単音節標準パターンの結合パ
ターンとし、単音節毎に求められプこベクトル間距離を
用いて単語累積距離を1えめるようにイ1/)成1〜だ
ので、単音節音声認識と単1.1′−1音声認識の両方
が可能となり、日本語ワードフ。
「」セーリ−や74″声タイプライタ全実現する場合、
わざわざ単行節音声の他に単語音声を標準・ぐターンと
して登録する必安はなく、単音節音声を登録しておくた
けでファクションキーに相当する単語や、頻出する単語
等は単語認識でも入力可ホけすることができ、その価値
は高い。
【図面の簡単な説明】
第1図ta) 、 (b)ばDPマツチングの原理を説
明する図、第2図は本発明の詳細な説明する図、第3図
−一本発明における一実施例の音声認識装置の構成全示
すブoツタ図である。 4・・・・特徴抽出部、5・・・単音節標準)Zターン
記憶部、6・・・・・ベクトル間距離計算部、7・・・
・・・ベクトル間距離記憶部、8・・・・・・単音節累
積距離計算部、9・・・・単音節判定部、10・・・・
・・単語辞書、11 ・・・・頃語累積距離計算部、1
2・・・・単語判定部。 第1図 入〃ハV−シ 第2図 4人力八゛ター゛/

Claims (1)

  1. 【特許請求の範囲】 入力音声信号全特徴ベクトルの系列a1a2・・・a工
    ・・alよりなる入カバターンTに変換する特徴抽出手
    段と、第n曝音節の単音節音声信号を特徴−ベクトルの
    系列br′Iす・・・bn′1n(たたし、n=1゜2
    、・・・、N)に変換した標準バター/R”を記憶する
    標準パターン記憶手段と、この標準パターン記憶手段の
    各標準パターンR(n=1.2.・・・。 N)を構成する特徴ベクトルb、(コー1.2゜・・ 
    5n )のそれぞれと前記入カバターンTの第1フレー
    ムの¥f徴ベクトルa□とのベクトル間距離dn(i、
    j)を計算するベクトル間距離計算手段と、…J=tベ
    クトル間距離dn(1,3)から前記人カバターンTと
    前記標準パターンR11の系列間の距咄(11−54算
    する単音節累積距離計算手段と、前記弔音節標準・・タ
    ーンの結合として表わされた単1i1.i 標d)!′
    −ハターンとMiJ記入カバターンの系列間の累積距離
    を求める単語累積距離割算手段と、前記単語累積距離計
    算手段丑たは単語累積距離計算手段の結果から、前記入
    カバターンTに最も距離的に近い単音節または単語標準
    パターン全判定する判定手段とを備えたことを特徴とす
    る音声認識装置。
JP58048103A 1983-03-22 1983-03-22 音声認識装置 Granted JPS59172698A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58048103A JPS59172698A (ja) 1983-03-22 1983-03-22 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58048103A JPS59172698A (ja) 1983-03-22 1983-03-22 音声認識装置

Publications (2)

Publication Number Publication Date
JPS59172698A true JPS59172698A (ja) 1984-09-29
JPH0449719B2 JPH0449719B2 (ja) 1992-08-12

Family

ID=12793975

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58048103A Granted JPS59172698A (ja) 1983-03-22 1983-03-22 音声認識装置

Country Status (1)

Country Link
JP (1) JPS59172698A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0562610U (ja) * 1992-02-05 1993-08-20 住金鋼材工業株式会社 フラットデッキ
JPH06185154A (ja) * 1992-12-18 1994-07-05 Sumitomo Densetsu Kk 線状体付設用支持装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0562610U (ja) * 1992-02-05 1993-08-20 住金鋼材工業株式会社 フラットデッキ
JPH06185154A (ja) * 1992-12-18 1994-07-05 Sumitomo Densetsu Kk 線状体付設用支持装置

Also Published As

Publication number Publication date
JPH0449719B2 (ja) 1992-08-12

Similar Documents

Publication Publication Date Title
JP3803029B2 (ja) 音声認識装置
JPH0422276B2 (ja)
JPH0372998B2 (ja)
JP2010020102A (ja) 音声認識装置、音声認識方法及びコンピュータプログラム
KR100930714B1 (ko) 음성인식 장치 및 방법
JP4966324B2 (ja) 音声翻訳装置、および方法
JPH0247760B2 (ja)
JPS59172698A (ja) 音声認識装置
JP3790038B2 (ja) サブワード型不特定話者音声認識装置
KR102299269B1 (ko) 음성 및 스크립트를 정렬하여 음성 데이터베이스를 구축하는 방법 및 장치
JP3914709B2 (ja) 音声認識方法およびシステム
JP2002091484A (ja) 言語モデル生成装置及びこれを用いた音声認識装置、言語モデル生成方法及びこれを用いた音声認識方法、並びに言語モデル生成プログラムを記録したコンピュータ読み取り可能な記録媒体及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2004309928A (ja) 音声認識装置、電子辞書装置、音声認識方法、検索方法、及びプログラム
JPH0823758B2 (ja) 話者適応形音声認識装置
JPH11311994A (ja) 情報処理装置および方法、並びに提供媒体
JP2980382B2 (ja) 話者適応音声認識方法および装置
JP3315565B2 (ja) 音声認識装置
JP3881155B2 (ja) 音声認識方法及び装置
JP5152016B2 (ja) 音声認識用辞書作成装置及び音声認識用辞書作成方法
JP2003345384A (ja) 音声認識装置、音声認識方法および音声認識プログラム
JPS62144200A (ja) 連続音声認識装置
JPS60164800A (ja) 音声認識装置
JPS6073592A (ja) 特定話者用音声認識装置
JPS62111295A (ja) 音声認識装置
JPS62294298A (ja) 音声入力装置