JPS632100A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS632100A
JPS632100A JP61146682A JP14668286A JPS632100A JP S632100 A JPS632100 A JP S632100A JP 61146682 A JP61146682 A JP 61146682A JP 14668286 A JP14668286 A JP 14668286A JP S632100 A JPS632100 A JP S632100A
Authority
JP
Japan
Prior art keywords
duration
vowel
memory
speaker
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61146682A
Other languages
English (en)
Inventor
貞治 江守
弘 岡本
西山 敏雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP61146682A priority Critical patent/JPS632100A/ja
Publication of JPS632100A publication Critical patent/JPS632100A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声認識装置に係り、不特定話者の音声認識に
好適な音声認識装置に関する。
〔従来の技術〕
不特定話者音声認識において、主に話者による認識の違
いは母音テンプレートの組(A、I、U。
E、O,NN)の発声方法及び発声母音の継続時間の違
いに起因している。母音の発声方法の違いに対しては、
代表的な話者毎に母音テンプレートの組を設け、声音入
力した最も類似度の高い母音テンプレートの組の選択ま
たは類似度の高い母音組をもとにしてより近い母音組へ
の修音等により対処が可能である(日本音響学会音声研
究会資料583−48 (1983−12))。−方、
母音の継続長については、従来は平均的な最大または最
小の母音継続長を標準、継続長(の組)として与えるこ
とで対処していた(日本音響学会音声研究会資料S−8
2−62(DEC,20,1982)、電子通信学会論
文誌’84/6  Vol、j67−DNo、6)。
〔発明が解決しようとする問題点〕
上記従来技術の平均的な最大または最小の母音継続長を
標準継続長とする方法は、話者の発声速度の違いによる
母音の継続長の違いに柔軟に対処することが雅しく、認
識率の低下を招いていた。
更に、長母音/短母音の継続音が話者の発声速度により
ばらつくことから、長母音の最小継続音と短母音の最大
継続長が逆転してしまい、長母音/短母音の判別に支障
をきたすという欠点があった。
また、1度の音声入力で認識に失敗した場合は再入力を
要求することが必要になるが、−般に再発声時の発声速
度は1度目の発声速度に比べ遅くなることが多く、固定
的な標準継続長の範囲では対応が難しくなるという欠点
があった。
本発明の目的は、上記従来技術の欠点に鑑み、話者発声
速度に追随して、話者の発声速度の早い場合には母音の
継続長を短く、また遅い場合は継続長を長くすることに
より、話者の違いによる母音継続長を変えるとともに、
長母音/単母音の判断を効率よく実現することにより音
声認識装置の認識率を向上させることにある。
〔問題点を解決するための手段〕
本発明の音声認識装置は、入力された声音の特徴データ
の時系列を格納する特徴データメモリ。
母音の標準継続長を格納する標準継続長メモリ。
話者に適応した母音の継続長を格納する話者用継続長メ
モリ、音素または音素連鎖単位の認識規則を用いて声音
を認識する認識処理部などを備えている。
〔作 用〕
話者の発声速度は母音の継続長の長短に依存する。そこ
で、特徴データメモリから読み出した声音特徴データの
時系列に対し、認識処理部では、話者用継続長メモリの
当該話者に適応した母音継続長を基に、音素または音素
連鎖単位の認T1規則を用いて母音区間抽出及び類似度
計算により音声認識処理を行う。そして、正しく認識で
きた場合には、そこで求められた母音継続長と話者用継
続長メモリから求められる母音継続長と標準m 41 
長メモリから求められる母音継続長とをもとに新シい母
音継続長を計算し、新しい母音継続長として話者用継続
長メモリに格納する。
〔実施例〕
以下、本発明の一実施例について図面により詳述する。
第1図は本発明の一実施例のブロック図を示す。
A/D変換部1は話者が発声した音声入力をディジタル
音声に変換する。特徴抽出部2はディジタル声音に対し
て特徴抽出処理を施こし、音声特徴データの時系列を出
力する。音声認識袋[3は声音特徴データを入力して音
声認識処理を実行し、単語等の認識結果を単語仮説生成
部(音素指定部)4を通して出力する。単語仮説生成部
4は認識対象となる単語仮説を基に該単語を構成する音
素を逐次音声認識装置3に供給する。
音声認識装置3は、入力された音声の特徴データの時系
列を格納する特徴データメモリ31、母音の標準継続長
を格納する標準継続長メモリ32゜話者に適応した継続
長を格納する話者用継続長メモリ33、及び音素または
音素連鎖単位の認識規則を用いて音声を認識する認識処
理部34とから構成される。認識処理部34は、特徴デ
ータメモリ31に格納された音声の時系列の特徴データ
に対して、単語仮説生成部4から供給される音素が存在
すると仮定して、入力された音声の特徴データの時系列
から、音素の認識に必要な認識規則(パワー、LPGケ
プストラム等の時系列の立ち上がり、立ち下がり等の変
化等に関する規則)を利用して、音声の継続領域及び類
似度を求め、該音素の存在を判断する処理を行う、この
種の音声認識処理は1例えば日本音響学会音声研究会資
料S−82−62(DEC,20,1982)、電子通
信学会論文誌’84/6 Vol、j 67−D No
6に記載されている。
本発明においては、特に母音の音素の認識を行う場合、
メモリ32.33に格納されている母音音素の標準6継
続長並びに話者用の継続長を利用し、入力した音声の特
徴時系列から、音素の存在領域の検索範囲を制限して所
定の認識規則を適用することにより、母音音素の継続領
域を求めると共に、入力した母音の継続長を基に新たな
話者用の母音継続長を求めて、認識処理計算量の削減と
認識率の向上を図るものである。以下に第2図のフロー
チャートにより本発明の内容を詳述する。
認識処理部34では、各々の母音の音素の継続領域を求
めるにあたり、話者用継続長メモリ33にデータが格納
されていない場合には標準継続長メモリ32から、また
は話者用継続長メモリ33にデータが格納されている場
合には該話者用継続長メモリ33から、最大/最小の母
音継続長を読出し、母音継続長の許容する範囲内で、前
述のようにLIP識規則を利用して母音の母音継続領域
を求め、該領域の類似度を所定規則により計算して、音
声認識処理を実行する。これにより正しく認識できた場
合には、ここで求められた母音継続長と(データが格納
されている場合には)話者用継続長メモリ33内の母音
継続長と標準継続長メモリ“32内の母音継続長との重
み付きの加重平均をとることにより新しい話者用継続長
を求め、より発声者の発声速度に適応した母音継続長と
して新たに話者用継続長メモリ33に格納する。この場
合。
求められた母音継続長の重みが大きすぎると、特殊な母
音継続長だった場合に、それ以外の母音発声部分で認識
できなくなり、認識率を低下させることを生じる。この
ため、新たに母音音素の継続長を求めるにあたり、適当
な重みに設定する必要がある。
一方、該音素を正しく認識できなかった場合には、まず
母音の音素の継続長は正しいが音声特徴の時系列には該
音素が存在しなかったと判断して。
この情報を単語仮説生成部4に報告する。ここで、単語
仮説生成部4は別の単語の存在を仮定して、新たな音素
の存在を仮定し、別の単語を構成する音素を認識処理部
34に供給し、上記の認識処理を継続する。
全ての単語仮説に対しても正しく認識できないと判断さ
れた場合は、母音の音素の継続長が不適切であったか、
発声者の発響が不正確だったことになる。
母音の音素の継続長が不適切だった場合には、例えば、
■ボトムアップ的に母音らしさを検知する方法(電子通
信学論文誌″85/9  Vol、j68−DNo、9
)の手法を利用して母音継続長を求めるか、または、■
標準母音継続長または話者用母音継続長のデータに一定
率(0,7〜1.3)をかけるかすること等によ・り母
音継続長を修正し。
該母音音素の継続長を新たな継続長に置き換えて、再度
全ての単語の仮説に対して前述の認識処理を繰り返す。
更に、上記のいずれの方法でも認識できなかった場合に
は、発声者の発声が不正確だったとして再発声を要求す
る。その場合、−般に再発声する音声はより正確かつゆ
っくり発声されることから、標準継続長メモリ32また
は話者用継続長メモリ33に記述された継続長に一定値
の加算または一定率(1以上の数)の掛算を行って、前
回発声した母音継続長を伸ばし、新しい継続長をもとに
認識処理を行う。
また、長母音/単母音の継続長は話者の発声速度間でバ
ラツキがあることから、長母音/単母音の標準継続長を
標準継続長メモリ32に格納し、話者毎に話者用継続長
メモリ33を設け、長母音の音素を認識する場合には長
母音の継続長で、また単母音の音素を認識する場合には
単母音の継続長で認識処理を行えばよい。
ここでは、話者用継続長メモリ33の話者毎の利用方法
/管理方法についての具体的な説明は省略したが、不特
定話者を対象とした一連の会話に際して、認識を開始す
るにあたり、最初は標i’(1!継続畏メモリ32のみ
から認識を開始して1話者適応しつつ話者用継続長を求
め、認識を行って行くうちに認識率の向上を図っていき
、会話が終了すると話者用の継続長をリセッ1〜させる
方法がある。
−方、該音声認識装置が特定の複数話者からしか使われ
ない場合には1話者毎に話者用継続長メモリ33を準備
して認識処理に利用する方法もある。
また、ここでは母音の継続長が話者により偏ることを利
用することとして母音の場合のみについての説明を行っ
たが、子音と母音をまとめて継続領域を求めるような認
識規則の場合にも適用でき、その場合には子音の継続長
に上記の母音継続長のデータを加えてそれをまとめて子
音と母音の継続長とすればよい。
また、ここでは母音音素の継続長を最大値または最小値
で規定される場合について説明を行ったが、母音音素の
継続長を区間として指定してもよい。
〔発明の効果〕
以上説明したように、本発明を適用することにより、ゆ
っくり発声する話者に対しても早く発声する話者に対し
ても、該話者に適応することが可能であり、音声認識装
置の認識率を向上させることができる。
【図面の簡単な説明】
第1図は本発明の一実施例のブロック図、第2図は本発
明における処理手順の一例を示すフローチャートである
。 1・・・A/D変換池部、 2・・・特徴抽出部。 3・・・音声認識装置、 31・・・特徴データメモリ
、32・・・標準継続長メモリ、 33・・・話者用継
続長メモリ、 34・・・認識処理部、 4・・・単語
仮説生成部。

Claims (1)

    【特許請求の範囲】
  1. (1)入力された音声の特徴データの時系列を格納する
    特徴データメモリと、母音の標準継続長を格納する標準
    継続長メモリと、話者に適応した母音の継続長を格納す
    る話者用継続長メモリと、音素または音素連鎖単位の認
    識規則を用いて音声を認識する認識処理部とを具備し、
    前記認識処理部では、前記特徴データメモリから読出さ
    れた特徴データの時系列に対し、前記話者用継続長メモ
    リから読みだされた母音継続長を基に認識規則を用いて
    母音区間抽出及び類似度計算により音声認識処理を行う
    と共に、正しく認識できた場合には、そこで求められた
    母音継続長と前記話者用継続長メモリから求められた母
    音継続長と前記標準継続長メモリから求められる母音継
    続長とをもとに新しい母音継続長を計算し、新しい母音
    継続長として前記話者用継続長メモリに格納する処理を
    行うことを特徴とする音声認識装置。
JP61146682A 1986-06-23 1986-06-23 音声認識装置 Pending JPS632100A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61146682A JPS632100A (ja) 1986-06-23 1986-06-23 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61146682A JPS632100A (ja) 1986-06-23 1986-06-23 音声認識装置

Publications (1)

Publication Number Publication Date
JPS632100A true JPS632100A (ja) 1988-01-07

Family

ID=15413203

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61146682A Pending JPS632100A (ja) 1986-06-23 1986-06-23 音声認識装置

Country Status (1)

Country Link
JP (1) JPS632100A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6449097A (en) * 1987-08-20 1989-02-23 Fujitsu Ltd Voice recognition system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6449097A (en) * 1987-08-20 1989-02-23 Fujitsu Ltd Voice recognition system

Similar Documents

Publication Publication Date Title
JP5282737B2 (ja) 音声認識装置および音声認識方法
US9165555B2 (en) Low latency real-time vocal tract length normalization
EP2048655B1 (en) Context sensitive multi-stage speech recognition
US7299179B2 (en) Three-stage individual word recognition
US20030069729A1 (en) Method of assessing degree of acoustic confusability, and system therefor
JPS6336676B2 (ja)
JP2007047412A (ja) 認識文法モデル作成装置、認識文法モデル作成方法、および、音声認識装置
JPS61219099A (ja) 音声認識装置
JP2005148342A (ja) 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体
JP3444108B2 (ja) 音声認識装置
JP2001312293A (ja) 音声認識方法およびその装置、並びにコンピュータ読み取り可能な記憶媒体
JPS632100A (ja) 音声認識装置
JP2001005483A (ja) 単語音声認識方法及び単語音声認識装置
JPH067346B2 (ja) 音声認識装置
JP3100208B2 (ja) 音声認識装置
JPH05303391A (ja) 音声認識装置
JP3291073B2 (ja) 音声認識方式
JPH11184492A (ja) 話者認識装置及びその方法
JPS63161499A (ja) 音声認識装置
JPS60164800A (ja) 音声認識装置
JPS607492A (ja) 単音節音声認識方式
JPS6312000A (ja) 音声認識装置
JPS63217399A (ja) 音声区間検出装置
JPS58159598A (ja) 単音節音声認識方式
JP2000242292A (ja) 音声認識方法、この方法を実施する装置およびこの方法を実行するプログラムを記憶した記憶媒体