JPS59170893A - 単語音声認識方法 - Google Patents

単語音声認識方法

Info

Publication number
JPS59170893A
JPS59170893A JP58043239A JP4323983A JPS59170893A JP S59170893 A JPS59170893 A JP S59170893A JP 58043239 A JP58043239 A JP 58043239A JP 4323983 A JP4323983 A JP 4323983A JP S59170893 A JPS59170893 A JP S59170893A
Authority
JP
Japan
Prior art keywords
phoneme
recognized
recognition
word
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58043239A
Other languages
English (en)
Other versions
JPH0126080B2 (ja
Inventor
入間野 孝雄
秋場 国夫
金指 久則
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP58043239A priority Critical patent/JPS59170893A/ja
Publication of JPS59170893A publication Critical patent/JPS59170893A/ja
Publication of JPH0126080B2 publication Critical patent/JPH0126080B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、入力音声に対して先ず音素認識を行ない、こ
の認識音素系列を、音素表記された単語辞書と照合して
単語を認識する単語音声認識方法に関するものである。
従来例の構成とその問題点 第1図は従来の単語音声認識方法を示している。
以下にこの従来例について第1図とともに説明する。第
1図に示すように、入力音声に対し先ず分析を行ない、
この人力す一声の%徴を抽出しで、入力音声を構成する
音素を認識する。この認識された詮索系列を、単語辞1
゛中の各i!lY:書項目の辞書−詮索系列と照合し、
2つの音素系列間の類似度を、音素のコンツユ−ジョン
マトリクス(ConfusionMatrix、以下C
,M。と略す)を用いて、各音素間の認識イ催率を求め
ることにより算出し、音素系列間の類似度が最大となる
辞J項目をもって昭識単詔とするものである。
第1表は、前記単語音声認識方法に用いる単語辞書の=
−例を示しており、各即語は第2表に示す音素表記法に
従って表記されている。第3表は、前記C,M、の一部
を示しており、縦は単1i辞1中の音素を示し、横は認
識音素を示している。第3表中の数字は、単語辞書中の
各音素がどのような音素に認識されるかの確率を係で示
したものである。例えば第3表において、単語辞書中の
音素AがAと認識される確率は90チ、0に認識される
確率は3%、UK認識される雁木は2係、脱落する確率
は2チ・・・等を示している。
第  1  表 第2表 第  3  表 次に上記従来例の欠点について述べる。上記従来例にお
いて、あるコンテキスト中のある音素の音素認識傾向が
、その音素の平均(コンデキストを考慮しない)の音素
認識傾向と異なる時、そのコンテキストを含む単語の誤
認識が多くなるという欠点があった。この欠点について
、例を用いて説明する。入力単語がヨヨギ(辞書音素系
列はJOJOG*I )で、その認識音素系列がNUU
G*Iである場合、音素の対応関係は第2図に示すごと
くである。第3表に示すようにOがUとなる確率は8%
と低く、こえが2絹もあるJOJOG*IとNUUG*
Iは類似度が低いということになる。そのため、この従
来例においては、NIJUG*Iはルモイ(辞書音素系
列はRυ・MOI )に誤認識されていた。ところが、
JOJOG*Iの場合、JとOの調音結合のため0がU
と認識されることが多く、これが原因で、ヨヨギの単語
認識率は低いものであった。
上記従来例の欠点を除去する一つの方法は、全ての音素
、全てのコンテキストに完全に対応(〜たC、M、を作
成し、それを用いて類似度を計算することである。この
ようにすれば、キ胎認識率ひよ、原理的に、確実に上昇
する。しかし、C,M、の容量、 C,M、作成に必要
な音声データ量も著しく犬きくなシ、実現は不可能であ
る。
発明の目的 本発明は上記従来例の欠点を除去するものであp1単語
認識率向上を目的とするものである。
発明の構成 本発明は、上記目的を達成するために、調音結合の強い
コンテキストにおいては注目する音素のみならず、その
前後の音素の柚類毎に別項目としたC、M、とし、調刊
結合の強くないコンテキスl−においでは、C,M、容
量節約のため、前後の音素の種類にかかわシなく、注目
する音素の種類毎に別項目と17た構成のC、M、を用
いるものでおる。
ぞハにより、前記従来例で述べたような、ヨヨギのよう
に調音結合の強いコンテキストを含む単紹が染中的に誤
認識することを防ぎ、その結果、平均の単相認識率を向
上させる効果のあるものである。
実施例の説明 以下に本発明の一実施例の構成(でついて説明する。
本実施例における単語認識方法は、前記従来例を改良し
グこものであり、認識アルゴリズムの概要ケよ、従来例
と同様、第1図で表わされる。
本実施例の、前記従来例と異なるところは、C,M、の
構成法である。
本実施例においては、先ず予備実験によシ、調音結合の
強いコンテキストとして、第4表に示すコンテキストを
ピ゛ツクアップし、これらコンテキストに対し、前後の
音素毎に別項目としたC、M。
を作成する。作成し九〇、M、の一部分を第5表に示す
。第5表中の数字は、第3Pの場合と同様、辞書の夫々
の音素がどのような音素に認識されるかの確率をチで示
したものである。しかし、第5表が第3表と異なるのは
、前後の音素の種類によpc、M、が別項目となってい
ることであり、例えば第5表において、Aが先行するO
がAに認識される確率は1チ、0に認識される確率は9
7%、Uに認識される確率は0チ、脱落する確率は1q
6・・・等である。第4表、及び第5表における全音素
という場合、その音素が何であるかによってC,M。
(ぽ別項目としない。
第  4  表 第  5  表 本実施例において、調音結合の強くないコンテキスト、
すなわち第4表に示す以外のコンテキストの場合には、
第3表に示す従来のC,M。をそのまま用いる。
認識音素系列と辞書音素系列の類似度を計算する時、音
素間の認識確率の値を用いるが、本実施例では、先ず第
5表に示す前後の音素毎に別項目とし7たC、M、を参
照し、該当するコンテキストがあればその項目の値を用
い、該当するコンテキストがなければ、第3表に示す従
来とl1iJ A;’AlAiI後の音素を考慮しない
C、M 、を用り)る。またJOJOG″工における1
番目のOは、Jが先行し7、力・つJ75二後絖するの
で、第5表に示すC,M、にj、・いて2項目に該当す
る。このよ5な場合、*、実施f/l) Vこシ・い−
Cは、値の大きい刀を用いる。すな4′)ち、J75x
ss<1′するOがUとなる確率181、J力;後続す
るO力くUとなる確率25%でおるが、JOJOG”I
の1弔9目のOがUとなる確率は25%とみなして#頁
イ以度を割算する。
本実施例による効果を、従来例の1IIJ U ’6f
iiのイタ1]を用いて説明する。入力単語がJOJO
c”Iで、認識音素系列が工柑UG才Iである場合、音
素の対しム[男係t」二従来例と同じく第2図に示すよ
うになる。ここで第5表に示すC,M、より0JOG*
1の第1のOカニUと認識される確率は25φ、第2の
075i Uと認−される確率は18チとな払従米法で
求めたO力;Uになる確率8チと比べ、夫々約31角、
21音のイ直となる。これにより、本実施例による、J
OJOG*IとNUUG*Iの類似度は、従来例により
求めた類イ以Ifよ−り大きな値となる。
なお、本実施例における、R山40IとNUUG*Iの
類似度は、従来例の場合と、はとんど等し、い値となる
0 以上により本実施例においては、入カ単語ヨヨギの認識
音素系列がNtJUG*Iであっても、正I−7<ヨヨ
ギに単語認識されるようになシ、従来と比ベヨヨギの牟
詔認識率は向上する。
本実施例における、前後の音素の種類毎に別項目とした
C、M。は、対象とするコンテキストの種類を、調音結
合の強いものに限定したため、C,M。
容メーは前記従来例と比べ25チ増にとどまる。
発明の効果 本発明は」二記のような構成であって、以下に示す効果
が得られるものである。すなわち、調音結合の強いコン
デキストに対して、注目する音素の種類だけでなく、前
後の音素の種類毎に別項目としたC、M、を用いること
にょ)、調音結合のため類型的な音素誤認識を生じゃす
い単語の誤認識を減少させ、ぞハにより、従来より窩い
単相認識率を得ることができる。
なお、本発明による単語音声認識力法は、孤立単語の認
識に限定されない。単語辞書との照合により入力音声を
認識する方法を行なう限り、連続発声単語1文章の認識
にも通用さ7″しるものである。
【図面の簡単な説明】
第1図は、従来例、及び本発明の実施例におりる単語音
声認識力法のアルゴリズムの概略図、第2図は、人力単
語ヨヨギ(JOJOGJ )の13iffλ音j系列が
NUUG*Iである鳴合の務素の対応関係をシJζす図
である。 特許出願人 電子針穴様基本技術研究組合ゝ  111
セ1 代理人星 野 恒 司、’、−1+J 杏−87

Claims (1)

    【特許請求の範囲】
  1. 入力音声に対して音素認識を行なって認識音素系列を得
    、この認識音素系列と、音素表記された単語辞−書の各
    辞書項目の辞書音素系列との類似度を、音素のコンフユ
    ージヨンマトリクスを用いて割算して単語を認識する場
    合に、調音結合の強いコンテキストにおいては注目する
    音素のみならずその前後の音素の種類毎に別項目とした
    コンフユージヨンマトリクスを用い、その他のコンデキ
    ストにおいては、前後の音素の種類にかかわシなく、注
    目する音素の種類毎に別項目とした構成のコンフユージ
    ヨンマトリクスを用いることを特徴とする単語音声認識
    方法。
JP58043239A 1983-03-17 1983-03-17 単語音声認識方法 Granted JPS59170893A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58043239A JPS59170893A (ja) 1983-03-17 1983-03-17 単語音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58043239A JPS59170893A (ja) 1983-03-17 1983-03-17 単語音声認識方法

Publications (2)

Publication Number Publication Date
JPS59170893A true JPS59170893A (ja) 1984-09-27
JPH0126080B2 JPH0126080B2 (ja) 1989-05-22

Family

ID=12658345

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58043239A Granted JPS59170893A (ja) 1983-03-17 1983-03-17 単語音声認識方法

Country Status (1)

Country Link
JP (1) JPS59170893A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63250698A (ja) * 1987-04-08 1988-10-18 松下通信工業株式会社 音声認識装置
JPH0293598A (ja) * 1988-09-30 1990-04-04 Mitsubishi Electric Corp 音声認識装置及び学習方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63250698A (ja) * 1987-04-08 1988-10-18 松下通信工業株式会社 音声認識装置
JPH0293598A (ja) * 1988-09-30 1990-04-04 Mitsubishi Electric Corp 音声認識装置及び学習方法
JP2629890B2 (ja) * 1988-09-30 1997-07-16 三菱電機株式会社 音声認識装置及び学習方法

Also Published As

Publication number Publication date
JPH0126080B2 (ja) 1989-05-22

Similar Documents

Publication Publication Date Title
JP4115723B2 (ja) 音声入力によるテキスト検索装置
JPS59170893A (ja) 単語音声認識方法
Zheng A syllable-synchronous network search algorithm for word decoding in Chinese speech recognition
KR102618219B1 (ko) 사전 학습된 언어 모델의 파라미터 및 사전 학습 단어장을미세 조정하는 방법 및 사전 학습된 언어 모델의 파라미터 및 사전 학습 단어장을 미세 조정하기 위한 전자 장치
JPS60164800A (ja) 音声認識装置
JPS59143200A (ja) 連続音声認識装置
JPS63161499A (ja) 音声認識装置
JPS6225797A (ja) 音声認識装置
JPS60147797A (ja) 音声認識装置
JPS5872995A (ja) 単語音声認識方法
JP3033132B2 (ja) 言語処理装置
JPS58195895A (ja) 単語音声認識装置
JPS61281298A (ja) 音声認識装置
JPS6225796A (ja) 音声認識装置
Singh et al. Implications of the perception of similarities for phonetic theory
JPH0552506B2 (ja)
JPH0158520B2 (ja)
JPS5968794A (ja) 単語音声認識方法
JPS6126095A (ja) 単語間距離の自動算出方法
JPS6069694A (ja) 語頭子音のセグメンテ−ション法
JPS5968795A (ja) 単語音声認識方法
JPS63250698A (ja) 音声認識装置
JPS6338720B2 (ja)
JPS63158599A (ja) 単語検出方式
JPS62223798A (ja) 音声認識装置