JPS62235992A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPS62235992A
JPS62235992A JP61078823A JP7882386A JPS62235992A JP S62235992 A JPS62235992 A JP S62235992A JP 61078823 A JP61078823 A JP 61078823A JP 7882386 A JP7882386 A JP 7882386A JP S62235992 A JPS62235992 A JP S62235992A
Authority
JP
Japan
Prior art keywords
syllable
recognition
feature
patterns
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61078823A
Other languages
English (en)
Other versions
JPH067349B2 (ja
Inventor
外川 文雄
徹 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP61078823A priority Critical patent/JPH067349B2/ja
Priority to US07/034,060 priority patent/US4908864A/en
Publication of JPS62235992A publication Critical patent/JPS62235992A/ja
Publication of JPH067349B2 publication Critical patent/JPH067349B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、入力されなた音声を音節単位に認識する日本
語音声認識装置などに有利に用いられる音声認識方式に
関する。
背景技術 入力された音声を音節単位に認識する日本語音声認識入
力装置などに用いられる従来からの音声認識方式で曇は
、連続音声を音節に分解して切り出された音節を主とし
てパターンマツチングによって認識する場合、発声のば
らつきや調音結合と呼ばれる前後の音の影響による変形
などによる音節認識率の低下を、各音節に複数個の特徴
線糸パターンを持たせることで防いでいる。また、それ
らの特徴標準パターンを入力された新しいパターンで更
新することにより認識率を向上させている。
発明が解決しようとする問題点 上記先行技術では、各音節の標準パターン数が設定され
ておらず、したがって入力される音節の頻度に応じて学
習が進行していくと、各17節のパターン数に偏りが生
じて、入力頻度の低い音部の認識が極端に悪(なる。
本発明の目的は、上述の技術的課題を解決し、特徴標準
パターンの音節が占めるパターン配分が入力頻度に依存
して偏ることの無いようにして、認識率の変動を可及的
に小さくし、認識精度が向上するようにした音声認識方
式を提供することである。
問題点を解決するための手段 本発明は、入力された音声を予め登録された複r&種類
の音節の特徴標準パターンとの類似度計算によって音節
1…位に認識し、その結果を辞書との照合もしくはキー
ボードなどの外部指示捏作によって修正して最終的な入
力を得るようにした音声認識方式において、 音節毎に特徴標準パターンの最大パターン数を設定し、 認識に最小限必要な特徴標準パターンを初期に登録した
後、入力時に各音節の前記最大パターン数を越えない範
囲で、入力された特徴パターンを自動登録して特徴標準
パターンを更新するようにしたことを特徴とする音声認
識方式である。
作  用 本発明に従えば、調音結合による直後の音韻からの影響
を受けやすく統計的に認識率の悪い音節で、入力の頻度
が高い音節 (たとえば単母音、有声破裂音、う打音な
ど)は最大パターン数を高い値に設定し、逆の場合に当
てはまる音節 (たとえば「じゃ」などのよう音からな
る摩擦音、「びや」などの破裂音)は低い値を設定して
効率良く特徴標準パターンを構成し、各音節に固有に与
えられrこ数を越えない範囲で入力時の自動登録によっ
て1、テ徴標帛パターンの追加・更新・削除が行なわれ
る。
これによって特徴標式−パターンの音節が占めるパター
ン配分が入力頻度によって偏ることなく、したがって認
識率の変動を可及的に小さく抑えることができ、安定し
た音声認識状態を得ることができる。
実施例 第1図は本発明の一実施例の日本語音声人力装ra1の
構成を示すブロック図であり、第2図は日本語音声入力
装置1における音声認識処理の手順を示すフローチャー
トである。この日本語音声入力装置1は、連続的に発声
された音声を音節単位に認識し、この認識結果を辞書に
よって修正した後、単語などの単位で外部装置に転送す
る機能を有している。
先ず、ステップn1からステップn2に移り、音声信号
が入力される。すなわち発声され入力された音声は、マ
イクロホン2を介してアナログ入力部3に入力され、こ
のアナログ人力g3内の増幅器4によって増幅された後
、アナログ/デフタル変換器5によってデジタル信号に
変換され、そのデジタル信号が音声分析部6および音節
セグメンテーション部7に入力される。
次にステップ112からステップn3に移り、音ツ処理
および音節の切り出し処理が行なわれる。すなわち音声
分析部6では、入力音声を1611Is程度のフレーム
に分はスペクトル分析を社ない、8Ios程度の間隔で
音節セグメンテーシシン部7に音節のセグメンテーシヨ
ンに必要な特徴パラメータを転送する。音節セグメンテ
ーシθン部7では、音声分析部6からの種々の特徴パラ
メータをリング状の特徴パターンバッファ8に一時記憶
しながら音節を切り出して各音節の特徴をパターン化し
て特徴パターンメモリ9に記憶rる。特徴パターンバッ
ファ8は複数の音節を記憶することができるように構成
され、でいる。音節セグノンテーシタン部7の処理は、
中央路l!!装置(以下CPUと言う)10からの命令
により開始・停止が制御11されるように構成されてい
る。
次にステップn4で音節の認識処理が行なわれ、ステッ
プn5  では認識結果候補が選ばれる。すなわち、音
節認識部11では、各音節の特徴パターンと、特徴標準
パターンメモリ12に予め記憶されているすべてのvf
m 標準パターンとのパターン距離計算を行ない、類似
頻度の高い順に候補を出す、同種の音部名を持つ候補を
統合し音節認識結果として認識結果メモリ13に記憶す
る。
次にステップn6  で音ffrJ認識結果の誤りを修
正処理し、ステップn7  で確定された音節認識結果
を導き出す、すなわち音節認識部11内の修正処理部1
1aでは、言語処理用評言メモリ14に記憶した辞書を
用いて音節認識結果の誤りを自動的に(1正する。ある
いは操作者自身がキーボード15によって、入力音声に
対する認識候補から正しい候補を選択したり、また誤り
箇所を直接修正する場合もある。このようにして確定さ
れた正しい結果は、漢字に変換されて文字列として出力
される。
次にステップn8で学習処理が行なわ紅、ステップn9
  で処理が終了する。すなわち音節認:!#、部11
内の学習制御1fflS11bでは、確定文字列により
認識結果を分析して更新される学習9報、具体的には認
識貢献度カウンタ16のカウント値と、メモリ17に記
憶されている最近の認識q況とに基づいて、入力された
各音節の特徴パターンを学習するか杏かを判定rる。学
習すると判定された音節については、入力された音節の
特徴パターンを特徴標準パターンとして追加するが、あ
るいは人力音節と同−音部名の特徴標準パターンの中で
最も悪いパターンすなわち認n貢献度カウンタ16のカ
ウント値が最小である認ajt献度が最も低いパターン
をその音節の特徴パターンで置換するか、その特徴パタ
ーンを用いて平均化の操作を行なうなどしてその特徴P
j、Rヘパターンを更新する。また、認識貢献度が極端
に低い特徴標準パターンは削除する場合もある。
なお、各音節の最大標準パターン数は、音節の最大パタ
ーン数テーブル18に記vLされている。
また音声分析部6以外は、すべてCPU10によって制
御されている。
第3図は前記ステップn8  の標準パターン学習処理
のさらに詳細な処理手順を示すフローチャートである。
初期のn声登録で満たされない空の1、)全標準パター
ン領域の認a貢献度カウンタ16は、予めすべてCre
sの値にセットされている。ここでCrcsは、未登録
パターンにセットされるカウンタリセット値を示す。
修正処理部11aで確定されたf’f ff1i S 
i nにより各音節の認識結果を分析し、ステップ+a
 1  で認、電兵献度カウンタ16を更新する。たと
えば第1表に示すように候補順位に応じて増減量を与え
カウンタの増減を行なう、すなわち候補順位が第1位の
特徴標準パターンが分析結果により正解の場合は、該特
徴標準パターンに対応する認識貢献度カウンタの値を4
だけインクリメントし、分析結果により誤りの場合は、
該認識貢献度カウンタの値を4だけデクリメントする。
第 1 表 第 2 表 たとえば正解音節が1゛い」の場合の例が12表に示さ
れζいる。すなわち正解音節「い」の認識の上位候補と
なったパターンに対して、認識貢献度カウンタcjの値
を増減している。ここでCjは、標準パターンPjに対
応する認2に貢献度カウンタを示す。
次にステップ1112  では、更新された認a貢献度
カウンタCkの値が削除するための閾値(tl+以下で
あるか否かが判断され、そうであるときはステップ−3
で認:a貢献度カウンタCkに対応する1、テ徴標準パ
ターンPkを削除する。同時にステップIa4で現在の
特徴標準パターン数nを1減らし、ステップ1115 
 でそのパターン領域の認a貢献度カウンタCkをCr
ccにリセットする。
次にステップm2  で、更新された認n貢献度カウン
タCkの値が削除するための閾値CLh以下でないとき
はステップm6  に移り、メモリ17からの最近の認
識状況データに基づいて、入力された各音節を学習する
か否かがt++定される。学習rると判定された場合、
ステップII+7  で確定音節S;【1と同−音部名
の特徴標準パターンのうち、最小値を示す認識貢献)文
カウンタCωに対応する1、デ徴標鵡パターンP−を求
める。この特徴標準パターンP111は、同一カテゴリ
で認a貢献度が最も低いものである。
次にステップl118で、音節Sinに関する現パター
ン数nが、予め定めた最大数M未満か否かが1゛り定さ
れる。n<Mの場合はステップ19に移り、11Ti記
ステンブ鴻7 で求めた最小値を示す認識貢献度カウン
タC+aのカウントf直が、空のパターン頌域をもつ認
a貢献度カウンタの値Cresより大きいか否が判定さ
れ、大きいときにはステップml。
で入力特徴パターンPinを特徴標準パターンP(n+
1)として追加する。そしてステップl1111で現パ
ターン数11を1だけインクリメントし、ステップ10
12で特徴標準パターンP(n+1)に対応する認、1
1貢献度カウンタCnの値をC5etにセットする。こ
こでC5et1.を追加あるいは更新された特徴標準パ
ターンにセットされるカウンタ値を示す。
mj記スステップm8.11=Mの場合はステップm1
3で特徴標準パターンPu+を更新する。また前記ステ
ップ+69で、if?i記ステップm7で求めた最小値
を示す認識貢献度カウンタC+aの値がCresよりも
小さいときには、ステップ11113  でその特徴認
識パターンPmを更新する。更新後も前記ステップl1
112と同様にステップω14で、その認識貢献度カウ
ンタCmの値をC5eLにセットする。
最後にステップ11115  で同−音節名に属するパ
ターンの各認識貢献度カウンタの平均値がカウンタの中
央値になるように第1式によってカウンタ値をシフトし
て値のバランス化を図る。これは、累積される認識貢献
度を同一カテゴリ内で正規化するものである。
Ci’ =Ci+(Ci/L−Ccen)   =・(
1)Ci′  はバランス化後の認識貢献度カウンタの
値を示し、Ciはバランス化前の認a貢献度カウンタの
値を示し、Lは同−音節名の特徴標準パターン数を示し
、Ccenはカウンタ変数の中央値を示す。
音節Sinが 「イ」で、CLb=Oで、Cres=2
0で、C5eL=50とし、入力された音節の新しい特
徴パターンを[いinJとしたときの、特徴線糸パター
ンの追加の例が第3a表および第3b表に示されている
。また更新の例が第4a表および第4b表に示されてい
る。さらに削除の例が第5a表および第5IJ表に示さ
れている。
(1)追加 第3a表は学習前の状態を示しており、学習後は第3b
表に示されるように特徴標準パターン「い5」が追加さ
れている。
(以下余白) 第  3 a  表 第   3 Ll  表 第  4a  表 第  4b  表 (2)更新 第4a表は学習前の状態を示しており、学習後は第3b
表の第2列に示されるように特徴標準パターン「い、」
が更新され、がっPt53列に示されるようにバランス
化が行なわれる。
(3)削除 f:tSSlI表は学習前の状態を示しており、学習後
は第5b表のm2列に示されるように特徴標儂パターン
「い2」が削除され、かつ第3列に示されるようにバラ
ンス化が行なわれる。
第5a表 第  5b   3 次にrjSA図を参照して、本発明によれば第4図に示
すように、たとえば、学習後の特徴標準バタ節のjの待
像標準パターン数k[jJは第4図で示すように本発明
によれば、k[jl= m[jlであるが、各音節に最
大数を設定しない従来の場合にはfmA図(2)で示す
よう1こ、k[jJ)鴎[jlであった9k[jl(譲
[jlであったりする。
このようにして本発明では最低限必要な音節のパターン
を特徴標準パターンとして初期登録すれば、各音節毎に
設定された特徴標準パターンの最大数の範囲内で、認:
a貢献度の低い特徴標準パターンを優先して追加/更M
/削除の基本4作を行なうことによって特徴標準パター
ンの最適化を図ることができる。
第5図は11種の文章(1文章は平均650音節からな
る)を入力したときの各文章毎の音節の平均認識率を示
すグラフであり、第6図は特徴標準パターンの総数およ
び学習された人力音節の個数の推移を示すグラフである
。ここでは、初期登録で590個の音節パターンを特徴
標準パターンとして登録した後、各音節の特(1m標準
パターンの最大数(総数1020個)を設定して上記の
文章を読み上げた1名の話者について測定した。ただし
削除の処理は行なっていない。入力文章数が増すにつれ
て特徴標準パターンが成長して1020個に近付いてい
くようすが分かる。たとえば、第2文章を入力したとき
のパターン学習回数(第3ずのステップm(+の処理を
通過した音節数)約300回に対して追加や更新が行な
われてパターン増加数は約100個である1文章を多く
入力してぃくと平均認a率が高くなって学習の効果が現
れている。
【図面の簡単な説明】
tjSi図は本発明の一実施例の日本語音声入力装r!
11の構成を示すブロック図、第2図は日本語音声入力
装置1における音声認識処理の手順を示すフローチャー
ト、第3図はステップn8  の標準パターン学習処理
のさらに詳細な処理手順を示す70−チャート、第4図
は本発明と従来技術を比較した図、第5図は11種の文
章(1文章は平均650音節からなる)を入力したとき
の各文章毎の音節の平均認識率を示すグラフ、第6図は
特徴標僧パターンの総数JJよび学習された入力音節の
個数の推移を示すグラフである。 1・・・日本語音声入力装置、2・・・マイクロホン、
6・・・n声分析部、7・・・音節セグメンテーシaン
部、8・・・特徴ハパターンバッ7T、9・・・特徴パ
ターン、10・CPU、 11−fTffli認識部、
11 a −修正処理部、111)・・・学習制御部、
12・・・特徴標準パターン、13・・・認識結果メモ
リ、14・・・言語処理用辞書メモリ、15・・・キー
ボード、16・・・認識貢献度カウンタ、17・・・最
近の認識状況メモリ、18・・・音節の最大パターン数
テーブル、M・・・各音節の最大パターン数

Claims (1)

  1. 【特許請求の範囲】 入力された音声を予め登録された複数種類の音節の特徴
    標準パターンとの類似度計算によって音節単位に認識し
    、その結果を辞書との照合もしくはキーボードなどの外
    部指示操作によって修正して最終的な入力を得るように
    した音声認識方式において、 音節毎に特徴標準パターンの最大パターン数を設定し、 認識に最小限必要な特徴標準パターンを初期に登録した
    後、入力時に各音節の前記最大パターン数を越えない範
    囲で、入力された特徴パターンを自動登録して特徴標準
    パターンを更新するようにしたことを特徴とする音声認
    識方式。
JP61078823A 1986-04-05 1986-04-05 音声認識方式 Expired - Fee Related JPH067349B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP61078823A JPH067349B2 (ja) 1986-04-05 1986-04-05 音声認識方式
US07/034,060 US4908864A (en) 1986-04-05 1987-04-02 Voice recognition method and apparatus by updating reference patterns

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61078823A JPH067349B2 (ja) 1986-04-05 1986-04-05 音声認識方式

Publications (2)

Publication Number Publication Date
JPS62235992A true JPS62235992A (ja) 1987-10-16
JPH067349B2 JPH067349B2 (ja) 1994-01-26

Family

ID=13672550

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61078823A Expired - Fee Related JPH067349B2 (ja) 1986-04-05 1986-04-05 音声認識方式

Country Status (1)

Country Link
JP (1) JPH067349B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008090272A (ja) * 2006-09-29 2008-04-17 Honda Research Inst Europe Gmbh 子供に向けられた発話を使用してモデル・ベースの音声の区分化をブートストラップすること、および認識システム
WO2008087934A1 (ja) * 2007-01-16 2008-07-24 Nec Corporation 拡張認識辞書学習装置と音声認識システム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5766497A (en) * 1980-10-14 1982-04-22 Fujitsu Ltd Voice registration pattern adding system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5766497A (en) * 1980-10-14 1982-04-22 Fujitsu Ltd Voice registration pattern adding system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008090272A (ja) * 2006-09-29 2008-04-17 Honda Research Inst Europe Gmbh 子供に向けられた発話を使用してモデル・ベースの音声の区分化をブートストラップすること、および認識システム
WO2008087934A1 (ja) * 2007-01-16 2008-07-24 Nec Corporation 拡張認識辞書学習装置と音声認識システム
JP5240457B2 (ja) * 2007-01-16 2013-07-17 日本電気株式会社 拡張認識辞書学習装置と音声認識システム
US8918318B2 (en) 2007-01-16 2014-12-23 Nec Corporation Extended recognition dictionary learning device and speech recognition system

Also Published As

Publication number Publication date
JPH067349B2 (ja) 1994-01-26

Similar Documents

Publication Publication Date Title
US9558741B2 (en) Systems and methods for speech recognition
US5127055A (en) Speech recognition apparatus & method having dynamic reference pattern adaptation
JP4657736B2 (ja) ユーザ訂正を用いた自動音声認識学習のためのシステムおよび方法
Zue et al. The MIT SUMMIT speech recognition system: A progress report
US20200082808A1 (en) Speech recognition error correction method and apparatus
KR20230040951A (ko) 음성 인식 방법, 장치 및 디바이스, 및 저장 매체
JPS62235998A (ja) 音節識別方式
DE3778579D1 (de) Ausbildung von in einem spracherkennungssystem verwandten markov-modellen.
JPS61177493A (ja) 音声認識方法
US7280963B1 (en) Method for learning linguistically valid word pronunciations from acoustic data
CN110473527B (zh) 一种语音识别的方法和系统
JP6230606B2 (ja) 精度スコアを使用した音声認識性能を予測するための方法およびシステム
KR20200030354A (ko) 사용자 정의 단어에 기초하여 음성 인식 결과의 보정 처리를 수행하는 음성 인식 처리 장치 및 그 동작 방법
CN114530145B (zh) 语音识别结果纠错方法及装置、计算机可读存储介质
Kienappel et al. Designing very compact decision trees for grapheme-to-phoneme transcription.
KR102187528B1 (ko) 도메인 기반의 음성 인식 모델의 최적화가 가능한 음성 인식 장치 및 그 동작 방법
KR20120052591A (ko) 연속어 음성인식 시스템에서 오류수정 장치 및 방법
JPS62235992A (ja) 音声認識方式
CN111627445A (zh) 一种用于场地或人员的匹配方法和系统
KR102217621B1 (ko) 사용자 발화의 오류를 교정하는 방법 및 장치
JP2002215184A (ja) 音声認識装置、及びプログラム
KR102632872B1 (ko) 음성인식 오류 교정 방법 및 그 시스템
JP3353334B2 (ja) 音声認識装置
JP2001005483A (ja) 単語音声認識方法及び単語音声認識装置
JP2018066788A (ja) 音素列処理装置、音素列処理装置の制御方法、制御プログラム、処理実行装置、処理実行装置の制御方法、制御プログラム、および処理実行システム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees