JPH04180097A - 単語音声認識装置 - Google Patents

単語音声認識装置

Info

Publication number
JPH04180097A
JPH04180097A JP2309295A JP30929590A JPH04180097A JP H04180097 A JPH04180097 A JP H04180097A JP 2309295 A JP2309295 A JP 2309295A JP 30929590 A JP30929590 A JP 30929590A JP H04180097 A JPH04180097 A JP H04180097A
Authority
JP
Japan
Prior art keywords
word
vowel
character string
pattern
storage means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2309295A
Other languages
English (en)
Inventor
Mitsuhiro Inazumi
満広 稲積
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2309295A priority Critical patent/JPH04180097A/ja
Publication of JPH04180097A publication Critical patent/JPH04180097A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、音声による入力単語を認識する単語音声認識
装置に関するものである。
[従来の技術] 従来の単語音声認識装置は、入力された単語全体の音声
特徴を抽出し、その特徴列をあらかじめ登録しておいた
認識すべき単語特徴のそれぞれと比較し、それらがある
判断基準において相互に類似していると考えられる1つ
以上の単語を認識結果とするようなものであった。
第2図はそのような従来の装置の模式図を示したもので
ある。
第2図の番号9は音声入力手段を、10は9により入力
された音声から音声特徴を抽出する音声特徴抽出手段を
、11は10により抽出された特徴を新規登録単語とし
て処理するか、あるいは認識対象として処理するか等の
認識登録動作制御手段を、12は10からの特徴列を認
識対象として記憶する登録単語特徴記憶手段を、13は
10により生成された音声特徴を12の登録単語の特徴
とを比較するパタンマツチング手段を、14は13によ
るマツチング結果を提示する認識結果提示手段を模式的
に示す。
[発明が解決しようとする課題] しかし、この従来例のような単語音声認識装置は、単語
の全体を認識対象として取り扱うため、不特定話者にお
いてはもちろんの事ながら、同一話者内においても種々
の要因による変動を補償しなけらばならない。
同一話者における変動の多くは発話の速度に起因するも
のであり、これはDPマツチング等の手法により補償す
る事ができる。  しかし、これらはそのためにある程
度の処理時間を必要とする。
不特定話者に変動を補償する際には、より複雑な処理が
必要であり、数100人規模のデータによる共通の特徴
の抽出と、さらにいくらかの話者適応処理が必要となる
。 このような場合においては、新しい単語を追加登録
すると言う事には非常に多量の作業を必要とする。
本発明が解決しようとする課題はこのようなものであり
、その目的とするところは、より少ない計算量において
認識を可能にし、かつ不特定話者の単語認識においても
、より容易に新規単語登録を可能とするものである。
[課題を解決するための手段1 第1図は本発明の概念の模式図である。
図に示すように、本発明は、音声による単語を認識する
単語音声認識装置において、その装置が少なくとも ア)、音声入力手段1と、 イ)、ア)により入力された音声から、その音声中に含
まれる母音の特徴列を抽出する母音特徴抽出手段2と、 つ)、認識すべき単語を文字列として登録する登録単語
文字列入力手段3と、 工)、つ)により入力された文字列を変形母音化するた
めの文字列変形規則記憶手段4と、オ)、つ)により入
力された文字列を、工)による規則により変形する文字
列変形母音化手段5と、 力)、オ)により生成された登録単語パタンを記憶する
登録単語母音パタン記憶手段6と、キ)、イ)により抽
出された母音特徴と、力)に記憶された登録単語母音パ
タンを冗長にパタンマツチングする冗長パタンマツチン
グ手段7と、 り)、キ)による冗長パタンマツチングの結果を提示選
択する候補単語提示選択手段9、をその構成中に含む事
を特徴とする単語音声認識装置である。
[実施例コ 以下に本発明の一実施例の概念図である第1図をもとに
本発明の動作を詳細に説明する。
先ず単語音声は音声入力手段1により入力される。 例
えば、A/D変換されたディジタルデータとして入力さ
れる。 その後それよりFFTバンドパスフィルター出
力や、あるいはLPCケプストラム係数等として、特徴
ベクトルが生成される。 従来例においては単語全体に
おけるそれら特徴ベクトルが認識のためのデータとして
用いられるが1、本発明においては従来例とは異なり、
その入力単語音声中の母音特徴を持つ部分が母音特徴抽
出手段2により抽出され、それが認識のためのデータと
なる。
例えば、入力音声単語が「こんにちは」であれば(10
/ /i/ /i/ /a/ ) と言うような母音特
徴が抽出される事になる。 しかし、現実の場合におい
てはこのように正確なものではなく、多くの欠落や挿入
誤りが含まれた母音特徴が抽出される事になる。
一方認識すべき単語のデータは、登録単語文字列入力手
段3において入力される。 その後その入力された文字
列は、文字列変形規則記憶手段4に記憶された規則に従
って、文字列変形母音化手段5により変形れる。
具体的な変形操作の例としては、最も単純なものは文字
列の中から母音だけを抽出すると言う規則である。 例
えば「秋」 (aki)と言う文字列から母音(a±)
だけを取り出すと言うような規則である。
上記の規則は非常に単純なものであるが、多くの場合よ
り複雑な変形を伴う規則が必要となる。
つまりある音素はその置かれている環境、具体的にはど
のように連続した音素の中に置かれたかによって、文字
列の表記とは異なった音に発音される。
それらの変形規則の具体的な例をいくつかあげれば、 (a 土)−>(ae  主) (Oi)  −> (Oa ei)または (o e 
1)(i a i) −> (i e 1)(y)  
 −> (i e)   または (e)等がある。
この規則を用いれば「貝J(kai)は(a 荘1では
なく(ae±)となる。
これらの規則により、表記上では同じ母音パタンを持つ
単語でも区別が可能となる。 例えば、上にあげた「秋
J(aki)と「貝J(kai)は同じ母音パタン(a
 i )を持つが、変形規則が適用された後においては
「秋」の変形母音パタンは(a i ”)のままである
が、「貝」の変形母音パタンは(a ei ) となり
区別される事になる。
このように変形母音化された登録単語は登録単語母音パ
タン記憶手段6に記憶される。
認識時においては、先に述べた母音特徴抽出手段2によ
り抽出された入力単語の特徴と、登録単語母音パタン記
憶手段中の登録単語とは、7の冗長パタンマツチング手
段において、その類似度が判断される。
このように冗長なパタンマツチングが必要であるのは、
先に述べたように、現実に入力されたデータには普通い
くらかの欠落や挿入誤りがあるからである。
その後、パタンマツチングにより類似していると判断さ
れた1つ以上の候補単語が候補単語提示選択手段8にお
いて提示され選択される。
[発明の効果] 以上述べてきたように本発明の単語音声認識装置におい
ては、単語音声の全体の特徴ではなく、その中の母音特
徴のみについてパタンマツチングを行うので、従来例に
比較して非常に高速の処理が可能である。
また、不特定話者に対応した単語音声認識装置に本発明
を適用する際にも、本発明の認識の単位は母音であるの
で、従来例のように新規登録単語について数100人の
データを収集する必要はなく母音のデータだけでよい事
になる。 もちろんこのデータはあらかじめ1度だけ用
意すればよいものであり、従来例のように単語を追加す
る度に行う必要はない。
その結果、本発明によれば従来例に比較して小規模なハ
ードウェアにより、かつより柔軟な単語音声認識装置を
実現できるものである。
【図面の簡単な説明】
第1図は本発明による単語音声認識装置の概念の模式図
である。 第2図は従来例の単語音声認識装置の概念の模式図であ
る。 l:音声入力手段 2:母音特徴抽出手段 3:登録単語文字列入力手段 4:文字列変形規則記憶手段 5:文字列変形母音化手段 6:登録単語母音パタン記憶手段 7:冗長パタンマツチング手段 8:候補単語提示選択手段 9:音声入力手段 lO:音声特徴抽出手段 ユ1:認識登録動作制御手段 l2:登録単語特徴記憶手段 13:パタンマツチング手段 14:認識結果提示手段 以上 出願人 セイコーエプソン株式会社 代理人 弁理士 鈴木喜三部 他1名 第1図

Claims (1)

  1. 【特許請求の範囲】 音声による単語を認識する単語音声認識装置において、
    その装置が少なくとも ア)、音声入力手段と、 イ)、ア)により入力された音声から、その音声中に含
    まれる母音の特徴列を抽出する母音特徴抽出手段と、 ウ)、認識すべき単語を文字列として登録する登録単語
    文字列入力手段と、 エ)、ウ)により入力された文字列を変形母音化するた
    めの文字列変形規則記憶手段と、 オ)、ウ)により入力された文字列を、エ)による規則
    により変形する文字列変形母音化手段と、 カ)、オ)により生成された登録単語パタンを記憶する
    登録単語母音パタン記憶手段と、 キ)、イ)により抽出された母音特徴と、カ)に記憶さ
    れた登録単語母音パタンを冗長にパタンマッチングする
    冗長パタンマッチング手段と、 ク)、キ)による冗長パタンマッチングの結果を提示選
    択する候補単語提示選択手段、 をその構成中に含む事を特徴とする単語音声認識装置。
JP2309295A 1990-11-15 1990-11-15 単語音声認識装置 Pending JPH04180097A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2309295A JPH04180097A (ja) 1990-11-15 1990-11-15 単語音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2309295A JPH04180097A (ja) 1990-11-15 1990-11-15 単語音声認識装置

Publications (1)

Publication Number Publication Date
JPH04180097A true JPH04180097A (ja) 1992-06-26

Family

ID=17991286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2309295A Pending JPH04180097A (ja) 1990-11-15 1990-11-15 単語音声認識装置

Country Status (1)

Country Link
JP (1) JPH04180097A (ja)

Similar Documents

Publication Publication Date Title
US10074363B2 (en) Method and apparatus for keyword speech recognition
Campbell et al. Language recognition with support vector machines
US5787230A (en) System and method of intelligent Mandarin speech input for Chinese computers
US8731928B2 (en) Speaker adaptation of vocabulary for speech recognition
US7295979B2 (en) Language context dependent data labeling
JP2955297B2 (ja) 音声認識システム
JPH04180097A (ja) 単語音声認識装置
Barnard et al. Phone recognition for spoken web search
JP6991409B2 (ja) 情報処理装置、プログラム及び情報処理方法
JPH0736481A (ja) 補完音声認識装置
JPH1097270A (ja) 音声認識装置
JPH0827638B2 (ja) 音素を単位とした音声認識装置
JP3033132B2 (ja) 言語処理装置
JPS62226196A (ja) 標準パタン逐次学習方式
JPS6312000A (ja) 音声認識装置
JPH04301695A (ja) 音声認識装置の辞書制御方式
JPS6033599A (ja) 音声認識装置
JPS60182499A (ja) 音声認識装置
JPS63161498A (ja) 音声情報入力装置
Akintola et al. Speech Processing Algorithm for Automatic Speaker Recognition-Based Telephone Voice Dialing in Yorùbá
JPS62217297A (ja) 単語音声認識装置
JPS60150098A (ja) 音声認識装置
JPS6180298A (ja) 音声認識装置
JPH0362279B2 (ja)
JPS59113499A (ja) 音声入力方式