JPS63236094A - 音声認識方法 - Google Patents

音声認識方法

Info

Publication number
JPS63236094A
JPS63236094A JP62070922A JP7092287A JPS63236094A JP S63236094 A JPS63236094 A JP S63236094A JP 62070922 A JP62070922 A JP 62070922A JP 7092287 A JP7092287 A JP 7092287A JP S63236094 A JPS63236094 A JP S63236094A
Authority
JP
Japan
Prior art keywords
phoneme
duration
word
addition
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62070922A
Other languages
English (en)
Inventor
康弘 小森
哲夫 小坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP62070922A priority Critical patent/JPS63236094A/ja
Publication of JPS63236094A publication Critical patent/JPS63236094A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音韻表記の単語辞書と入力音声をフレーム毎
に各音韻の信頼性の系列から、DPにより単語の類似度
を求め、その際に各音韻の継続時間を考慮しながら、単
語を認識する単語認識方法に関する。
〔従来の技術〕
従来の音声認識法を大きくわけると以下の2種類になる
1)単語を単位とした認識法 2)単語より小さい単位、例えば音韻を単位とした認識
法 第1の方式は、単語全体の特徴パラメータを標準パタン
として持ち、入力音声とのパタンマツチングをDPを用
いて行うことで認識し、〜数百語程度の単語認識におい
て、高い認識率を得ている。しかし、この方法では認識
する単語全てを、発生による登録が必要であり、手間が
かかり、単語を標準パタンとしているため、単語辞書の
容量が大きくなるなどの点で1000語以上の人語量の
認識には適さない。第2の方式は音韻毎に標準パタンを
持つため、単語辞書は音韻表記て登録すればよいので登
録の手間もかからず容量も小さくて済むので、第1の方
式に対して人語量に向いている。
第2の方式では、まずセグメンテーションをして各音韻
の存在区間を定めた後に、音韻の認識を行うのが一般的
である。一方、これに対し、認識する単語を仮定し、こ
の単語に含まれる音韻の標準パタンを用いて入力音声の
特徴パラメータとマツチングを行い、各音韻のフレーム
毎の信頼性・(得点)を計算する。更に各音韻の得点を
基に単語全体の得点をDPにより求める認識方式がある
後者の方法においては、単語に必要な音韻の標準パタン
しか用いないため、セグメンテーションを先に行う方法
に比べて、音韻の付加、脱落が起りに<<、認識の精度
は上がる。ここで用いるDPマツチングを以下に示す。
この方法での類似度の計算式は例えば以下の漸下式によ
って求めることができる。
S (V、 X) −g (I+1. J+1) /J
            ■ここで I : 音韻記号
列の長さ J : 入力音声のフレーム数 ■= 音韻記号列(vl、・・・、■2.・・・7厘)
X: 特徴時系列(Xl、・・・+Xl+・・・、XJ
)g(i、D  :  DPの累積距離 S(V、X):VとXの類似度 d(ilj):vlとXjノ類似度 この結果、得られた類似度を基に単語の認識を行う。
〔発明が解決しようとしている問題点〕上記の漸下式の
ように各音韻毎の継続時間を全く考慮しないDPにおけ
る類似度計算により単語認識をおこなうと、第4図に示
す様に、発声されたデータが/ a z a b u 
/であり、辞書内には[azabuJとrabujが存
在して、音韻の得点をフレーム毎に計算したら図のよう
になったと仮定すると、razabuJと[abu]の
得点は等しくなり、誤認識の可能性がでて(る。又、辞
書中に「OiJと「OOl」の2単語が存在する場合も
同様、継続時間を考慮しなければ、全く2つの差は表わ
れない。これらの問題を解決する手段として、DP計算
の窓制限を厳しくする方法もあるが、−単語が長く、ア
クセントのある単語などの場合、単語内での音韻の時間
変化が大きく、画一的な窓で制限するのは危険を伴う。
従って、窓制限はあまり厳しくすることはできなくなり
、前述した従来のDPによる類似度計算法の欠点の根本
的解決にはなっていない。
〔問題点を解決するための手段(及び作用)〕本発明に
よれば、各音韻の長さを考慮したDPのパスに加減点の
操作を加えて、単語の類似度を計算し、前述の問題点を
解決する単語認識率の向上を目的とした音声認識方法を
提案する。
〔作用〕
これによって、各音韻の継続時間を考慮したDPを行う
ことを可能にし、類似度計算を、より精密に行うことが
できる。
〔実施例〕
第1−1図は本発明の構成図、第1−2図は本発明の制
御フローチャートである。1は音声を入力する音声入力
部で、2は音響処理部である。音声入力部lで入力され
た(SL)音声は、S2において音響処理部2において
一定時間(フレーム)毎に分析を行い、音響パラメータ
を出力する(S3)。4は音韻識別部で、上記音響パラ
メータを入力し、5のRAMIに記憶された音韻標準パ
タンを用いてフレーム毎に各音韻側の信頼性を示す音韻
スコアを求める(S4)。
6のRAM2に格納された単語辞書は、音韻記号列によ
って登録されていて、S4で求めた音韻スコアとの類似
度計算を行う(S5)ことにより単語スコアを求める(
S6)。類似度計算部7は単語辞書6と音韻スコア(S
4)のDPにより実現され、従来のマツチングに音韻継
続時間加減点テーブル(類似度計算部7のRAMII等
ζ′こ格納されている)を用いることにより、DPの累
積計算中に、各音韻の継続時間長を考慮に入れることを
可能にしている。
第1−1図中、3は前述した類似度に基づいて得られた
単語認識結果を出力する出力部である。8は装置(シス
テム)全体を制御する制御部である。
9は各制御用データを記憶するRAM、10は装置の立
ち上げ等に必要なプログラムを格納したディスクである
次に、類似度計算(S5)の方法を以下に説明する。簡
単のため、第2図に示す最も簡単なりPで説明を行う。
S (V、 X) = g (1+1. J+1) /
J           (1)g (i、 D −d
 (i、 D ここで if   (g (i−1,j−1)2g (i、 j
−1)十P(Vi、 C1))  (3)then  
  Ci = φ : 1se Ci二Ci+1  + g (0,O)−φ                
     (4)g (i、 O) −g (0,D 
=−■              (5)0<i≦I
、  O<j≦J 但し、 I : 音韻記号列の長さ J : 入力音声のフレーム数 ■= 音韻記号列(vr + V 2 + ・・’+ 
vl、 ”・、 Vl)X: 入力音声の特徴時系列(
X+ + X 2 +・・・、X2.・・・、 XJ)
g(i、D  :  DPの累積距離 S(V、X):VとXの類似度 d(’、J)  :  VlとX、の類似度C+  :
  Vlの継続長カウンタ(初期状態は全てφ)P (
Ci、 Vi) :音韻■1の継続長によって決まる加
減点上述の漸化式によりDPの計算を行う。このDPを
第2図にて説明を行う。
図中のフレーム毎音韻スコアは第1−2図の84に当り
、式中のd(i、Dである。■は単語辞書から仮定され
た単語で、Cは単語中の各音韻毎の継、続時間のカウン
タである。このカウンタCiはg(i、j)を求める際
に、g(i、j−1)よりのパスが選ばれた時Ciに1
を加える。g(i−1゜j−1)よりのパスが選ばれた
時は、C1=Oを代入する。g(i、Dを求める時の距
離は、音韻スコアのjフレームにおける音韻Viのスコ
アd (i、 j)で求める。式(2)におけるP (
Ci、  Vi)の求め方について第3図で示す。各音
韻毎に、最小継続時間、最大継続時間、平均継続時間な
どは、統計的に求めることができる。そこで、各音韻毎
に第3図のような加減点テーブル(類似度計算部7、R
AMII内)を作成し、P (Ci、 Vi)を決定す
る。
本音細別の加減点テーブルを用いれば、ある音韻に関し
て、最大継続時間を越えると大きく減点され、DPのパ
スが次の音韻に選択され、ある音韻は、できるだけ平均
的な時間長だけDPのパスで継続しようと選択される。
第3図のテーブルはd(+、 Dが最大lOを取る場合
の加減点の例である。
前実施例においては、最も簡単なりPパスにおいて説明
をおこなったが、同音韻への遷移のあるDPパスが存在
すれば、本発明は用いることができ、同音韻への遷移の
パスの場合、カウンタに1を加え、その他の音韻への遷
移のパスであればカウンタに0を代入する。又、音声の
自動ラベリングシステムの1部に用いることができるも
のである。
〔発明の効果〕
本発明を用いることにより、各音韻の継続時間を考慮し
たDPを行うことを可能にし、類似度計算をより精密に
行える効果がある。
【図面の簡単な説明】
第1−1図は本発明適用の構成ブロック図、第1−2図
は制御フローチャート、 第2図はDPの例を示す図、 第3図はある音韻の継続長を考慮した加減点のテーブル
の説明図、 第4図は従来例の説明図、 8はCPU。 7は類似度計算部、 6は単語辞書。

Claims (2)

    【特許請求の範囲】
  1. (1)一定時間(フレーム)毎に分析され、特徴パラメ
    ータの時系列に変換された入力音声から、フレーム毎に
    各音韻毎に音韻の信頼性を求める各音韻の標準パタンと
    音韻記号によって表記された単語辞書を持ち、入力音声
    と登録単語との類似度を計算するに当って、入力単語を
    仮定し、その単語に含まれる音韻の標準パタンを用いて
    単語を認識する方法において、ダイナミックプログラミ
    ング(DP)により類似度を計算する際、音韻毎の継続
    時間長を考慮し、DPのパス毎に加減点を設ける手段を
    有する音声認識方法。
  2. (2)DPのパス毎の加減点を設けるために、仮定され
    た入力単語の音韻毎にフレーム継続カウンタを設け、各
    音韻のカウンタの値により、DPにより同音韻の継続長
    を判断し、各音韻の継続長による加減点を示したテーブ
    ルよりDPのパス毎の加減点を与え、DP計算を進めて
    いくことを特徴とした特許請求の範囲第1項に記載の音
    声認識方法。
JP62070922A 1987-03-25 1987-03-25 音声認識方法 Pending JPS63236094A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62070922A JPS63236094A (ja) 1987-03-25 1987-03-25 音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62070922A JPS63236094A (ja) 1987-03-25 1987-03-25 音声認識方法

Publications (1)

Publication Number Publication Date
JPS63236094A true JPS63236094A (ja) 1988-09-30

Family

ID=13445480

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62070922A Pending JPS63236094A (ja) 1987-03-25 1987-03-25 音声認識方法

Country Status (1)

Country Link
JP (1) JPS63236094A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5444817A (en) * 1991-10-02 1995-08-22 Matsushita Electric Industrial Co., Ltd. Speech recognizing apparatus using the predicted duration of syllables

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5444817A (en) * 1991-10-02 1995-08-22 Matsushita Electric Industrial Co., Ltd. Speech recognizing apparatus using the predicted duration of syllables

Similar Documents

Publication Publication Date Title
JPH04362699A (ja) 音声認識方法及び装置
JPS63236094A (ja) 音声認識方法
JPS6147999A (ja) 音声認識装置
JPS60164800A (ja) 音声認識装置
JPH01138596A (ja) 音声認識装置
JPS63161499A (ja) 音声認識装置
JPS6312000A (ja) 音声認識装置
JPH06149289A (ja) 音声認識装置
JPS632100A (ja) 音声認識装置
JPH0632006B2 (ja) 音声認識装置
JPH0554678B2 (ja)
JPS6118758B2 (ja)
JPH08110797A (ja) パターンマッチング装置
JPH01285995A (ja) 音声認識装置
JPH07104680B2 (ja) パタンマツチング装置
JPS62294298A (ja) 音声入力装置
JPS607492A (ja) 単音節音声認識方式
JPS60203993A (ja) 音声認識方法
JPH045398B2 (ja)
JPS63236095A (ja) 音声認識方法
JPS5975298A (ja) 音声認識方法
JPS6140686A (ja) 標準パタ−ン登録方式
JPS6283798A (ja) 連続音声認識装置
JPS60229099A (ja) 音声認識方式
JPH01253799A (ja) 音声の認識方法