JPS61143797A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS61143797A
JPS61143797A JP59265755A JP26575584A JPS61143797A JP S61143797 A JPS61143797 A JP S61143797A JP 59265755 A JP59265755 A JP 59265755A JP 26575584 A JP26575584 A JP 26575584A JP S61143797 A JPS61143797 A JP S61143797A
Authority
JP
Japan
Prior art keywords
word
pattern
distance
standard
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59265755A
Other languages
English (en)
Inventor
樺澤 哲
英一 坪香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59265755A priority Critical patent/JPS61143797A/ja
Publication of JPS61143797A publication Critical patent/JPS61143797A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は音声認識装置、特に単音節音声と単語音声の両
方を認識できる音声認識装置に関する。
従来の技術 従来のこの種の音声認識装置は、例えばNEC技報(江
袋林蔵ほか、「DP−200音声入力装置とその応用J
 vol 、3642 、 pp、y○−79(198
3))に示されているように、第3図のような構造にな
っていた。
すなわち、音声入力端子31、入力音声信号を特徴ベク
トルの系列から成る入力バタンに変換する特徴抽出部3
2、単音節音声離散発声モード或いは単語離散発声モー
ド或いは単語連続発声モードのモード選択部33、単音
節標準バタンを記憶する単音節標準バタン記憶部34、
単語標準バタンを記憶する単語標準バタン記憶部35、
前記単音節標準パタン或いは前記単語標準パタンを構成
する各ベクトルと前記入力バタンを構成する各ベクトル
のベクトル間距離を計算するベクトル間距離計算部36
、前記ベクトル間距離を記憶するベクトル間距離記憶部
37、前記モード選択部33で選択された前記モードに
おいて前記ベクトル間距離から前記単音節標準パタンと
前記入カッくタンとのバタン間の累積距離或いは前記単
語標準パタンと前記入力バタンとのバタン間の累積距離
を計算する累積距離計算部38、前記モード選択部33
で選択された前記モードにおいて前記累積距離計算部3
8の結果に基づいて入力バタンに最も近い前記単音節標
準パタン或いは前記単語標準パタン或いは前記単語標準
パタンの連鎖を判定する判定部39から構成され、入力
された単音節音声或いは単語音声を、前記各モードにお
いてそれぞれの標準バタン記憶部で記憶されている標準
バタンとマツチングすることにより入力音声を認識を行
うようになっている。
発明が解決しようとする問題点 しかし、ワードプロセッサの仮名キーボードの代わりに
、このような構成の音声認識装置を使用して仮名文字列
や単語或いは文節等を入力する際、出現頻度の高い語粟
であっても前記単語標準バタン記憶部45に登録されて
いない語粟については、毎回、前記単音節路数発声モー
ドで仮名文字一つずつを単音節音声で区切って入力しな
ければならず、入力速度が非常に遅いだけでなく、発声
が不自然で使用者に余分な負荷を強いるという問題があ
った。
そこで、本発明は、一旦単音節音声で入力された語葉に
ついては、次回入力される場合は単語モードで入力可能
とすることにより、入力速度を高速化し使用者の負荷を
軽くして、入力方法を改善するものである。
問題点を解決するための手段 そして上記問題点を解決する本発明の技術的な手段は、
単語を構成する各単音節を表わす記号列(例えば、文字
記号列)で表わされた単語辞書に登録されていない語粟
ついて、単音節を区切って発声して入力することにより
前記単語辞書に付加する語粟付加部を設けたことにある
作  用 この技術的手段による作用は次のようになる。
すなわち、頻出語常については、従来どおり単語音声入
力可能である。一方、使用者にとって頻出語粱であるに
もかかわらず単語辞書に登録されていない語粟について
、本発明では、一旦単音節音声で入力された語粟を語檗
付加部で単語辞書に付加することにより、次回からは同
じ語檗を単音節音声ではなく単語音声として入力できる
ようになる。
この結果、従来、使用者にとって頻出語案であるにもか
かわらず毎回単音節音声を区切って入力する必要は解消
され、一旦単音節音声を区切って−人力すれば、次回か
らは同じ語粟を単語音声で入力することができ、入力速
度を高速化し使用者の負荷を軽くして、入力方法を改善
することができるのである。
実施例 以下、本発明の実施例について説明するが、その前にバ
タンマツチングによる単語音声認識装置について説明す
る。この装置の一般的な構成は次のようなものである。
入力音声信号を、フィルタバンク、筒波畝分析LPC分
析等によって特徴ベクトルの系列に変換する特徴抽出手
段と、予め発声され、この特徴抽出手段により抽出され
た特徴ベクトルの系列を認識単語全部について標準パタ
ーンとして登録しておぐ標準パターン記憶手段と、認識
させるべく発声され、前記特徴抽出手段により抽出され
た入カバターンと前記標準パターン記憶手段に記憶され
ている標準パターンの全てと特徴ベクトルの系列として
の類似度あるいは距離を計算するパターン比較手段と、
パターン比較の結果、最も類似度の高かった(距離の小
さかった)標準パターンに対応する単語を認識結果とし
て1」定出力する判定手段からなる。
このとき、同一話者が同一の単語を発声しても発声の都
度、その発声時間長が異るので、前記パターン比較手段
で標準パターンと入カバターンの比較を行う際には、両
者の時間軸を伸縮させ、両者のパターン長を揃えて比較
する必要がある。その際、発声時間長の変化は、発声単
語の各部で一味に生じているのではないので、谷部を不
均一に伸縮する必要がある。
これを図で表現したのが第4図である。第4図fa)に
おいては横軸は人カバターンA=a1a2・・・・・・
a工(’aiは入カバターンの第iフレームの特徴ベク
トル)K対応するl座標、H1軸はは標準パターン1n
=r1 r2°−r)(r、は標準バターyR”の第j
)レームの特徴ベクトル)に対応するj座標を表す。
入カバターンAと標準パターンHn とを時間軸を非線
形に伸縮してマツチングするとはこの格子グラフ上にお
いて、両パターンの各特徴ベクトルの対応関係を示す径
路1を、両パターンの、系列としての距離が最小になる
という評価基準のもとで見出し、そのときの距離を両パ
ターンの距離とする。この計算を効率的に行う方法とし
て動的計画法を用いる方法が良く知られており、DPマ
ツチングと呼ばれている。
この径路を決める際には音声の性質を考慮して制限条件
を設ける。第4図(b)は頑斜制限と呼ばれる径路選択
の条件の一例である。即ち、この例では点(i、j)へ
至る径路は、点(i−2,ii)から点(i−1,j)
を通る径路が、点(’−1+j−1)からの径路か、点
(’−’+51)から点(i 、 j−1)を通る径路
かの何れかの径路しか取シ得ないことを意味しており、
入カバターンと標準パターンの始端と終端は必ず対応さ
せるという条件をつければ、前記マツチングの径路は第
4図(a)の斜縁の部分に制限される。この制限は、い
かに時間軸が伸縮するとはいっても、同一単語に対して
はそれ程極端に伸縮するはずはないという事実からあま
り極端な対応づけが生じないようにするためである。
両系列間の距離は、入力ベクトルa、と標準パターンベ
クトルr5  のベクトル間距離dn(i、j)の前記
径路に沿う重み付平均として定義される。
このとき径路に沿う重みの和が径路の選ばれ方に恢らず
一定になるようにしておけばDPマツチングの手法が使
える。
第5図は単音節音声標準パターンを結合することによっ
て構成した単語標準パターンと入カバターンのマツチン
グの様子を図ボしたものである。
同図におじで、Hq(1) 、 nq(2+、 Rq(
31は単音節q(D 。
q(21、qf31の標準パターンを意味し、この例は
単音節q(+1.q(21、q(31から成る単語の標
準パターンと入カバターンをマツチングする場合を示し
ている。前記説明に従ってマツチング径路は、例えば2
のようになる。
以下、前記したパターンマツチングの手法を用いた本発
明の実施例について説明する。
第1図は本発明の一実施例を示すブロック図である。同
図において、1は音声信号の入力端子、2はフィルタバ
ンク等で構成された、入力音声信号を特徴ベクトルの系
列に変換する特徴抽出部である。3は音節標準バタン記
憶部であって、各音節の特徴ベクトルの系列に変換され
た標準バタンか記憶される。ここで、音節標準バタンと
しては、単音節標準バタンのみと定義しても、或いは単
音節を連続発声した際に生じる調音結合(ある単音節音
声を単独で発声した場合の特徴ベクトルに対し、連続発
声された単音節音声の特徴ベクトルがその単音節音声の
前後の音声の影響を受けて変化する現象)を考慮して、
単音節標準バタン及びVCV音節標準バタン(v:母音
、C:子音)と定義しても長いが、以下の説明は単音節
標準バタンのみと定義する。ただし、音節として単音節
標準バタン及びvCv音節標準バタンと定義した場合に
は、単音節の認識には単音節標準バタンのみで光分であ
るが、単語認識の場合に単音節標準バタンだけでな(V
CV音節を用いることができ、前記調音結合の問題を解
消することができる。
さて、4はベクトル間距離計算部であって、音節標準バ
タン記憶部3の標準バタンRn を構成するベクトルr
j  と入力バタンAi構成するベクトルa、のベクト
ル間距離d”(i、i)’に計算するOいま、”i”(
”il 、”i2.””” 、”1fl)lrj = 
(r”i’1゜rj2+ ”’ ”’ * ”Tl、 
)とするとき、d”(i、J)は最も簡単には、 で与えられる。6はベクトル間距離記憶部であって、ベ
クトル間距離計算部4で計算された結果を記憶している
。6は単音節累積距離計算部であって、谷単音節につい
て第1フレームから現フレームまでの累積距離(d”(
i 、 j )のマツチング径路に沿う恵み付き和)を
求める。マツチング径路の拘束条件として第4図(bJ
を採用し、各径路に沿う重み係数を同図の径路上に付し
た数値とすると、座標(i、j)における標準バタンf
Lnに対する累積距離D” (i 、 j )は次のよ
うに与えられる。
・・・・・・・・・・・・・・・・・・(2)7は単音
節判定部であって、D”(I、In)が取手になる・を
沓とするとき高に対応する単音節を認識結果とする。8
は単語区切シ検出部であって、例えば前記入力バタンの
電力を用いて各入力音声の無音時間長を求め、この無音
時間長が所定の時間長以上(すなわち、閾値Ti(以上
)の場合に単胎区切り検出信号を出力する。すなわち、
前記無音時間長が閾値TH以下であれば、直前に入力さ
れた音声は単語を構成する音声の一部であると見做し、
単語区切りとしない。この様な短い無音時間長とは、例
えば「かっこう」という音声の促音「っ」の部分に相当
したシ、或いは単語を構成する仮名文字を単音節音声で
リズム良く区切って、発声した場合の単音節音声間の無
音部分に相当する。9は単音節認識結果記憶部であって
、前記単音節判定部7で得られた単音節認識結果を単音
節を表わす記号(例えば、文字記号)の形式で記憶し、
前記単語区切シ検出部8から前記単語区切り検出信号が
入力された時点で、それまで記憶していた単音節認識結
果(例えば、文字記号列)4=(bl 、b2. ++
+ e b1、 ・++ I bx)(bx=単音節認
識結果)及び各単音節認識結果のもつ累積距離の合計値
DBを出力する。1oは単語辞書であって、語粱がそれ
を構成する単音節の記号列(例えば、文字記号列)とし
てキーボード等で入力することによシ予め準備されてい
る。1)は単語累積距離計算部であって、マツチングさ
せたい単語に対し、単語辞書10で指定される単音節の
順序に従って、ベクトル間距離記憶部5に記憶されてい
る、既に計算所のベクトル間距離を読み出してきて、単
語としての点(i、j)までの累積距離を計算する〇即
ち、例えば第6図において、第iフレームにおいて、n
=1.2.・・・、N(Nは音節標準バタン数)に対し
て音節標準パターンRn=r1r2・・・rTnのそれ
ぞれのベクトルrj  と入カバターンA−a1a2・
・・a工の第iフレームのベクトルai  とのベクト
ル間距離”(’ I J )は既に単音節認識の際に計
算済であるから、R(T(1)、Rq(21、ELq(
5の結合パタy Rqfll■kLqf2)■kLq+
31 = 、CI(1)、qfll 1、、 、((;
、1.、 rq(21rq(21・+・rr為rq(5
1、q?5− 、q、% トa1トノヘクトル間距離は
新たに計算する必要はない。単語判定部12は入力が完
了した後、単語累積距離計算部1)で得られたそれぞれ
の単語に対する最終累積距離のうち、最小値を与えるも
のを単語の認識結果として判定し、認識結果C及び認識
結果DCのもつ累積距離を出力する。13は認識結果出
力部であって、前記単音節認識結果記憶部9から前記B
及び前記DBを受け、また前記単語判定部12から前記
C及び前記DcfI:受け、前記DBと前記Daの大小
比較を行って、Dc≦DBであれば前記C(単語認識結
果)を認識結果Tとして出力端子16から出力すると同
時に14で示される語粟付加部に出力し、一方DC,>
DBであれば前記B(単音節認識結果の列)f!:認識
結果Tとして出力端子16から出力すると同時に、胎霊
付加部14に出力する。更に、出力端子16から結果を
出力すると同時に15で示されるクリア信号発生部を駆
動させる為の駆動信号を出力するQ14は語粟付加部で
あって、前記認識結果出力部13からの認識結果T(例
えば、文字記号列で表わされている)を前記単語辞書1
0に付加(登録)する。16はクリア信号発生部であっ
て、前記認識結果出力部13から前記駆動信号を与えら
れた時点で前記単音節認識結果記憶部9の内容をクリア
する為の信号を発生する。16は認識結果の出力端子で
ある0 次に本発明の他の実施例について説明する。
第2図は他の実施例を示しており、前記第1の実施例の
単語区切り検出部8では入力バタンから例えば電力を求
めて単語区切!7を自動的に検出しているのに対し、本
実施例で示されている単語区切り検出部17は、音声認
識装置本体の外部(すなわち、単語区切9恢出部駆動信
号の入力端子18)からの駆動信号で単語区切9信号を
発生する。すなわち、第2図において、1〜7及び9〜
16で示される各部は前記第1の実施例と全く同様に動
作し、17で示される単語区切り検出部は前記の動作を
する。18は単語区切り検出部駆動信号の入力端子であ
る。
以上のように、本実施例によれば、単語を構成する各単
音節を表わす記号列(例えば、文字記号列)で表わされ
た単語辞書に登録されていない語t’を単音節を区切っ
て発声することにより入力された語tを単語辞書に付加
することによって、音声認識装置の使用者にとっては頻
出語粟であるにもかかわらず、単語辞書に登録されてい
ない語粱である為に、毎回単音節を区切って発声させる
という負荷を解消し、入力速度を高速化すると共に入力
方法を改善できるものである。
なお、本実施例では、単音節判定部7と単語判定部12
のように判定部を単音節と単語の場合について分けた構
成としたが、他の実施例として、判定部全1つだけ設け
、単音節累積距離計算部6と単語累積距離計算部1)の
出力を区別することなく距離が最も小さくなる標準パタ
ーンに対応する単音節あるいは単語を認識結果Uとして
出力し、前記単音節ga結果記憶部9では、前記単語区
切9検出部8(或いは17)からの前記単語区切り信号
が入力されるまで保持しておき、前記検出信号を受けた
時点で保持内容を前記語粟付加部14及び前記出力端子
16に出力と共に保持内容をクリアするというようにも
構成できる。このような構成では、第1図の認識結果出
力部13は不要となる。
また、以上説明した実施例の各構成要素は、ソフトウェ
ア手段によりその機能を実現することも可能である。
発明の効果 本発明の音声認識装置は、単語を構成する各車音節を表
わす記号列(例えば、文字記号列)で表わされた単語辞
書に登録されていない語檗を単音節を区切って発声する
ことにより入力された語粟全付加する語葉付加部を設け
たことによって、音声認識装置の使用者にとっては頻出
語粱であるにもかかわらず、単語辞書に登録されていな
い語檗である為に、毎回単音節を区切って発声させると
いう負荷を解消し、入力速度を高速化すると共に入力方
法を改善できるものである。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
本発明の他の実施例t−尽すブロック図、第3図は従来
例を示すブロック図、第4図fa) 、 (1))はD
Pマツチングの原理を説明する図、第6図は本発明の実
施例において音節標準パタンを用いて単語音声を認識す
る原理を説明する図である。 2・・・・・・特徴抽出部、3・・・・・・標準バタン
記憶部、4・・・・・・ベクトル間距離計算部、6・・
・・・・ベクトル間距離記憶部、6・・・・・・単音節
累積距離計算部、7・・・・・・単音節判定部%8,1
7・・・・・・単語区切り検出部9・・・・・・単音節
認識結果記憶部、10・・・・・・単語辞書、1・・・
・・・単語累積距離計算部、12・・・・・・単語判定
部、13・・・・・・認識結果出力部、14・・・・・
・語葉付加部、16・・・・・・クリア信号発生部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 第4図 (+−/、j−2ン 第5図 スDバター゛/

Claims (2)

    【特許請求の範囲】
  1. (1)入力音声信号を特徴ベクトルの系列(a_1、a
    _2、……、a_i、……、a_I)より成る入力パタ
    ンAに変換する特徴抽出手段と、音節の標準パタンR^
    n=(r^n_2、r^n_2、……、r^n_j、…
    …、r^n_J_n)(n=1、2、……、N)を記憶
    する標準パタン記憶手段と、語彙を記憶する単語辞書と
    、前記標準パタンR^nを構成する特徴ベクトルr^n
    _j(j=1、2、……、J_n)のそれぞれと前記入
    力パタンAの第iフレームの特徴ベクトルa_iとのベ
    クトル間距離d^n(i、j)を計算するベクトル間距
    離計算手段と、前記ベクトル間距離d^n(i、j)か
    ら前記入力パタンAと前記標準パタンR^nのうち単音
    節標準パタンとのパタン間距離を計算する単音節累積距
    離計算手段と、前記単音節累積距離計算手段で得られる
    前記パタン間距離に基づいて前記入力パタンAに最も近
    い単音節を判定する単音節判定手段と、単語区切り信号
    を発生する単語区切り信号発生手段と、前記単音節判定
    手段の結果を記憶する単音節認識結果記憶手段と、前記
    標準パタンの結合として表わされた単語標準パタンと前
    記入力パタンのそれぞれを構成する各ベクトル間の前記
    ベクトル間距離d^n(i、j)の累積距離を計算する
    単語累積距離計算手段と、前記単語累積距離計算手段の
    結果に基づいて前記単語辞書の中から語彙を決定する単
    語判定手段と、前記単音節認識結果記憶手段で記憶され
    ている内容を前記単語辞書に付加する語彙付加手段とを
    備えたことを特徴とする音声認識装置。
  2. (2)単語区切り信号発生手段は、音声認識装置本体外
    部からの信号により単語区切り信号を発生する特許請求
    の範囲第(1)項記載の音声認識装置。
JP59265755A 1984-12-17 1984-12-17 音声認識装置 Pending JPS61143797A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59265755A JPS61143797A (ja) 1984-12-17 1984-12-17 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59265755A JPS61143797A (ja) 1984-12-17 1984-12-17 音声認識装置

Publications (1)

Publication Number Publication Date
JPS61143797A true JPS61143797A (ja) 1986-07-01

Family

ID=17421558

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59265755A Pending JPS61143797A (ja) 1984-12-17 1984-12-17 音声認識装置

Country Status (1)

Country Link
JP (1) JPS61143797A (ja)

Similar Documents

Publication Publication Date Title
JP4351385B2 (ja) 連続および分離音声を認識するための音声認識システム
JPH0876788A (ja) 音声認識における混同しやすい語の検出方法
JP2003316386A (ja) 音声認識方法および音声認識装置および音声認識プログラム
JPS58102299A (ja) 部分単位音声パタン発生装置
KR100930714B1 (ko) 음성인식 장치 및 방법
Boite et al. A new approach towards keyword spotting.
JPS63165900A (ja) 会話音声認識方式
JPS61143797A (ja) 音声認識装置
JP2980382B2 (ja) 話者適応音声認識方法および装置
JPH11311994A (ja) 情報処理装置および方法、並びに提供媒体
JPS61143796A (ja) 音声認識装置
JPH1097270A (ja) 音声認識装置
JP3299170B2 (ja) 音声登録認識装置
JP2574242B2 (ja) 音声入力装置
JPS62294298A (ja) 音声入力装置
JPS60164800A (ja) 音声認識装置
JPS61165798A (ja) 音声認識装置
JP3231365B2 (ja) 音声認識装置
JPS61212900A (ja) 音声認識装置
JPS61165799A (ja) 音声認識装置
JP2862306B2 (ja) 音声認識装置
JPH06337700A (ja) 音声合成装置
JPH0527794A (ja) 音声認識方式
JPH067359B2 (ja) 音声認識装置
JPH0827640B2 (ja) 音声認識装置