JPS63168697A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS63168697A
JPS63168697A JP62000715A JP71587A JPS63168697A JP S63168697 A JPS63168697 A JP S63168697A JP 62000715 A JP62000715 A JP 62000715A JP 71587 A JP71587 A JP 71587A JP S63168697 A JPS63168697 A JP S63168697A
Authority
JP
Japan
Prior art keywords
dictionary
patterns
similarity
pattern
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62000715A
Other languages
English (en)
Other versions
JPH0462679B2 (ja
Inventor
本多 由美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62000715A priority Critical patent/JPS63168697A/ja
Publication of JPS63168697A publication Critical patent/JPS63168697A/ja
Publication of JPH0462679B2 publication Critical patent/JPH0462679B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 音声認識装置において、運用時の音声認識率を上げよう
とすると、辞書作成時の音声発声回数が増えると云う問
題を解決する為に、同時に複数個の特徴パラメータを作
成する並列標本化処理部を設けることにより、上記並列
標本化処理部で作成された複数個の特徴パラメータの類
似度を、パラメータ照合部で識別し、該類似度によって
、1つ。
又は、複数個の特徴パラメータを選択的に音声辞書に記
憶するようにしたものである。
〔産業上の利用分野〕
本発明は、特定話者用の音声認識装置に係り、特にその
音声辞書作成方式に関する。
最近の計算機システムの処理能力(実時間で音声データ
を処理できる性能)の向上と、経済化。
小型化等に伴って、音声をデータとして入力し、処理す
ることが盛んになってきた。
その−例として、工場における仕分は作業とか、ファク
トリオートメーション(FA)での製品検査結果データ
の人力作業等の為の音声認識装置がある。
該仕分は作業等においては、例えば、キーボード(KB
)により、仕分はデータを入力する方法もあるが、該工
場の環境(例えば、粉塵1作業者の服装、キーボード(
KB)迄の距離が遠い、或いは、特定の操作者が必要等
)によっては、該キーボード(KB)を工場内に設置す
ることが困難なことが多い。
従って、直接、音声によって該仕分はデータ等を入力で
きることが望ましい。
この場合に必要となる、特定話者用の音声認識装置は、
該特定話者毎の辞書を作成する為に、ユーザ(特定話者
)は単語、単音節の単位で、何回かの発声をしなければ
ならないが、該辞書作成の為の発声は、上記仕分は作業
と云った、直接の業務には関係しないので、発声回数が
増えると、ユーザにとって負担の多いものとなる。
この為、発声回数を増やさずに、認識率の良い辞書を作
成する方式が必要とされる。
〔従来の技術と発明が解決しようとする問題点〕第3図
は、従来の音声認識装置の構成例を示した図である。
先ず、入力音声6が帯域フィルタ群1に入ると、パラメ
ータ作成部2において、該発声された音声に対応して、
それぞれの音声の特徴パラメータパターンrX(1)、
X(2)、−・・、X(n) J 7が作成される。
従来の音声認識装置においては、該パラメータ作成部2
で作成される特徴パラメータパターン(以下、パターン
と云う)は、1つの発声で、1つのパターンしか出力さ
れないので、辞書作成部3においては、該作成されたパ
ターンを、当該音声の標準パターンとして、辞書5に登
録していた。
当該音声認識装置を運用する場合には、運用時に発声さ
れた音声6のパターン7をパラメータ作成部2で作成し
、予め、登録されている上記辞書5内のパターンと、パ
ターン照合部4で、例えば、パターンマツチ法で比較し
、距離の最も短いパターンを選択して、該パターンに対
応する音声を認識していた。
従って、従来方式においても、1つの単語について、複
数回発声されると、複数個のパターンが辞書5に登録さ
れており、その複数個のパターンの内、一致するものが
あると、該一致したパターンに対応する音声を認識する
方法は採っていた。
然して、一般に、音声の子音部分等は、周波数帯域毎の
音声パワーが急激に変化する為に、帯域フィルタ群1の
出力をどのようなタイミングでサンプリングするかで、
該作成されるパターンに違いのでる場合がある。
そのような音声に対して、音声認識時の入力音声が、辞
書作成時のパターンと異なるタイミングでサンプリング
されると、正しく認識することができない。
前述のように、従来の音声認識装置での辞書作成方法で
は、パラメータ作成部2が、1つの音声入力にたいして
、1パターンしか作成しない為、上記サンプリングのタ
イミングの違いによる誤認識を防ぐ為には、該サンプリ
ングの時間間隔を短(する方法と、同じ音声を数回発声
して、1音声に複数個のパターンを作成する方法が考え
られる。
然し、サンプリングの間隔を狭めたのでは、該1音声に
関するパターンが増加するので、辞書5が大きくなり、
サンプリングのタイミングによる影響の少ない音声につ
いては無駄なパターンを登録することになる上、音声認
識時のパターンの照合にかかる時間も長くなると云った
問題があった。
又、同じ音声を数回発声して、複数個のパターンを作成
する方法は、ユーザに対する負荷が大きく、認識時と同
じタイミングのパターンが作成できるとは限らないと云
う問題があった。
本発明は上記従来の欠点に鑑み、音声発声回数を増やす
ことなく、運用時の音声認識率を向上させる辞書を作成
する手段を備えた音声認識装置を提供することを目的と
するものである。
〔問題点を解決するための手段〕
第1図は本発明の音声認識装置の構成例を示した図であ
る。
本発明においては、 入力音声を認識する帯域フィルタ群1と、該帯域フィル
タ群1からの出力を時間標本化して、特徴パラメータの
時系列データを作成するパラメータ作成部2と、 該パラメータ作成部2で作成した音声の特徴パラメータ
を記憶する辞書作成部3と、 であって・ 上記パラメータ作成部2に、同時に複数個の特徴パラメ
ータを作成する並列標本化処理部21と、合部4で識別
し、該類似度によって、1つ、又は、複数個の特徴パラ
メータを選択して記憶する記憶パターン選択処理部31
とを設けて、 入力された音声の特徴パラメータを選択的に記憶するよ
うに構成する。
〔作用〕
即ち、本発明によれば、音声認識装置において、運用時
の音声認識率を上げようとすると、辞書作成時の音声発
声回数が増えると云う問題を解決する為に、同時に複数
個の特徴パラメータを作成する並列標本化処理部を設け
ることにより、上記並列標本化処理部で作成された複数
個の特徴パラメータの類似度を、パラメータ照合部で識
別し、該類似度によって、1つ、又は、複数個の特徴パ
ラメータを選択的に音声辞書に記憶するようにしたもの
であるので、1音声の発声によって、サンプリングのタ
イミングが確実に異なるパターンを並行して作成でき、
子音部のように、音声パワーが急激に変化する音声に対
しても、音声発声回数を増やさずに、音声の特徴を辞書
に反映させることができ、特定話者の負荷は従来と変わ
らずに、認識率を向上させることができる他、サンプリ
ングのタイミングによるパターンの影響が少ない音声に
関しては、1パターンのみを辞書に登録するので、不必
要な辞書領域の拡大を防ぎ、認識時のパターンの照合時
間も短くて済むと云う効果がある。
〔実施例〕
以下本発明の実施例を図面によって詳述する。
前述の第1図が、本発明の音声認識装置の構成例を示し
た図であり、第2図は本発明の一実施例を模式的に示し
た図であり、第1図における並列標本化処理部21.及
び記憶パターン選択処理部31が本発明を実施するのに
必要な手段である。尚、企図を通して同じ符号は同じ対
象物を示している。
以下、第1図、第2図によって、本発明の音声認識装置
における辞書作成方式を説明する。
本発明を実施しても、運用時の音声認識方式は、特に、
従来方式と変わることはないので、ここでは、音声が発
声されたときの辞書5への登録方式を中心にして説明す
る。
先ず、第1図において、本発明のパラメータ作成部2は
、例えば、従来の半分の時間間隔で、帯域フィルタ群1
の出力をサンプリングし、時系列のサンプリングデータ
rX(1)、X(2)、−−、X(2n−1)、X(2
nNを作成し、並列標本化処理部21において、交互に
サンプリングし直して、確実にタイミングのずれた、2
つのパターン[χ(1)、χ(3)、−・−、X(2n
−1)」と、r X (2) 、 X (4) 、−−
、X (2n) Jを作成する。
この2種類のパターンは、それぞれは従来と同じ時間間
隔でサンプリングしたパターンと精度等の面で変わるこ
とはない。
パターン照合部4は、この2種類のパターンを例えば、
パターンマツチ法で照合し、その類似度を求める。
辞書作成部3の記憶パターン選択処理部31においては
、上記類似度を基に、辞書5に記憶させるパターンを、
2個、又は1個選択し、辞書作成部3がそれを辞書5に
記憶する。
具体的には、サンプリングのタイミングによる影♂の大
きい、例えば、子音部分等の音声については、該類似度
が小さいことを認識して、該2種類のパターンを記tα
し、該影響の小さい音声については、類似度は大きいの
で、該2種類のパターンの内の1パターンのみを記憶す
る。このような辞書作成方式を採ることにより、該辞書
5を効率良く作成することができる。
次に、第2図によって、本発明による辞書作成方式をよ
り具体的に説明する。
本図において、91.95は帯域フィルタ群1に入力さ
れた音声の波形を示している。パラメータ作成部2は、
上記帯域フィルタ群1から出力された波形91.又は9
5の音声を時系列に交互にサンプリングして、2種類の
パターン92.93.又は96.97を作成する。
次のパターン照合部4は、この2種類のパターンを照合
し、類似度94.又は98  を出力する。辞書作成部
3は、この類似度を基に、上記2種類のパターンの違い
が大きいと判断すると、該2種類とも辞書5に記憶し、
該2種類のパターンの違いが小さいと判断すると、一方
のみを記憶する。
本図に示した例においては、サンプリングのタイミング
の影響を受は易い入力音声91に対するパターン92.
95の類似度は、例えば、10゛と小さいことが記憶パ
ターン選択処理部31で認識されることにより、辞書5
には、2つのパターンが記憶されるが、サンプリングの
タイミングの影響が少ない入力音声95に対するパター
ン96.97の類似度は、例えば、90゛と大きいこと
が記憶パターン選択処理部31で認識されることにより
、辞書5には、2つのパターンの内の、何れか1つが記
憶される。
このようにして、生成された辞書5を備えた音声認識装
置を運用する場合には、パラメータ作成部2が出力する
2種類のパターンの内、1パターンのみが、辞書5に登
録されている標準パターンと、パターンマツチ法により
照合されて類似度が求められ、一致出力が得られたパタ
ーンに対応する音声を認識する。このとき、2種類のパ
ターンが登録されている音声に対しては、該2種類の何
れかと一致出力が得られるので、バ°ラメータ作成部2
が出力したもう一方のパターンと、辞書5に登録されて
いる標準パターンとを照合する必要はない。
又、辞書5も必要な部分しか増えていないので、照合時
間の増加を必要最小限に抑えることができる。
このように、本発明は、入力音声を、例えば、従来の半
分の時間間隔でサンプリングし、そのサンプリングデー
タを時系列に並べたものを、交互にサンプリングし直し
て、確実にタイミングのずれた2種類のパターンを作成
し、その類似度を求め、類似度が小さいパターンについ
ては、両方のパターンを、該類似度が大きいパターンに
ついては、一方のパターンのみを辞書に記憶するように
した所に特徴がある。
尚、本実施例においては、入力音声を、従来の半分の時
間間隔でサンプリングし、得られたサンプリングデータ
を交互にサンプリングし直して、2種類のパターンを作
成する例で説明したが、本発明の趣旨から考えて、2種
類に限定する必要はな(、一般に、複数種類のパターン
を作成しても良いことは云う迄もないことである。
〔発明の効果〕
以上、詳細に説明したように、°本発明の音声認識装置
は、音声認識装置において、運用時の音声認識率を上げ
ようとすると、辞書作成時の音声発声回数が増えると云
う問題を解決する為に、同時に複数個の特徴パラメータ
を作成する並列標本化処理部を設けることにより、上記
並列標本化処理部で作成された複数個の特徴バラメーク
の類似度を、パラメータ照合部で識別し、該類似度によ
って、1つ、又は、複数個の特徴パラメータを選択的に
音声辞書に記憶するようにしたものであるので、1音声
の発声によって、サンプリングのタイミングが確実に異
なるパターンを並行して作成でき、子音部のように、音
声パワーが急激に変化する音声に対しても、音声発声回
数を増やさずに、音声の特徴を辞書に反映させることが
でき、特定話者の負荷は従来と変わらずに、認識率を向
上させることができる他、サンプリングのタイミングに
よるパターンの影響が少ない音声に関しては、1パター
ンのみを辞書に登録するので、不必要な辞書領域の拡大
を防ぎ、認識時のパターンの照合時間も短くて済むと云
う効果がある。
【図面の簡単な説明】 第1図は本発明の音声認識装置の構成例を示した図。 第2図は本発明の一実施例を模式的に示した図。 第3図は従来の音声認識装置の構成例を示した図。 である。 図面において、 1は帯域フィルタ群、 2はパラメータ作成部。 21は並列標本化処理部、3は辞書作成部。 31は記憶パターン選択処理部。 4はパターン照合部、 5は音声辞書、又は辞書。 6は入力音声。 7.71.72はパラメータパターン、又はパターン。 91.95は入力音声波形。 92.93.又は96.97は2種類のパラメータパタ
ーン。 94.98は類似度。 をそれぞれ示す。 オ\弓むeFJ、tyr  音声を乙言代M、1の7横
仄ゴク・1け、した図第 1 図 A力音声Rm         ノ?う/−タノザター
ン〜グjンL・イご aft σつ −°う?施介・l
 乞R丁(白′プ に i、L r:  βう32 図 イχ来、17V音戸ん巴願メI 第 f)オ精戊混す?示した図 3  図

Claims (1)

  1. 【特許請求の範囲】 入力音声を認識する帯域フィルタ群(1)と、該帯域フ
    ィルタ群(1)からの出力を時間標本化して、特徴パラ
    メータの時系列データを作成するパラメータ作成部(2
    )と、 該パラメータ作成部(2)で作成した音声の特徴パラメ
    ータを記憶する辞書作成部(3)と、2種類の特徴パラ
    メータを照合して類似度を求めるパターン照合部(4)
    とを備えた音声認識装置であって、 上記パラメータ作成部(2)に、同時に複数個の特徴パ
    ラメータを作成する並列標本化処理部(21)と、 上記並列標本化処理部(21)で作成された複数個の特
    徴パラメータの類似度を、上記パターン照合部(4)で
    識別し、該類似度によって、1つ、又は、複数個の特徴
    パラメータを選択して記憶する記憶パターン選択処理部
    (31)とを設けて、入力された音声の特徴パラメータ
    を選択的に記憶することを特徴とする音声認識装置。
JP62000715A 1987-01-06 1987-01-06 音声認識装置 Granted JPS63168697A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62000715A JPS63168697A (ja) 1987-01-06 1987-01-06 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62000715A JPS63168697A (ja) 1987-01-06 1987-01-06 音声認識装置

Publications (2)

Publication Number Publication Date
JPS63168697A true JPS63168697A (ja) 1988-07-12
JPH0462679B2 JPH0462679B2 (ja) 1992-10-07

Family

ID=11481456

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62000715A Granted JPS63168697A (ja) 1987-01-06 1987-01-06 音声認識装置

Country Status (1)

Country Link
JP (1) JPS63168697A (ja)

Also Published As

Publication number Publication date
JPH0462679B2 (ja) 1992-10-07

Similar Documents

Publication Publication Date Title
EP0339891B1 (en) Speech processing apparatus
JPS63220298A (ja) 音声認識における単語候補削減装置
JPS597998A (ja) 連続音声認識装置
JPS63168697A (ja) 音声認識装置
JPH09179578A (ja) 単音節認識装置
JPS6126678B2 (ja)
JPH0554116B2 (ja)
JPS63118198A (ja) 音声認識装置
JPS61165797A (ja) 音声認識装置
JP2547541B2 (ja) 単音節音声認識装置
JPS6167896A (ja) 音声認識方法
JPS6287993A (ja) 音声認識装置
JPS62204299A (ja) 音声認識装置
JPS63218999A (ja) 音声認識装置
JPS63155195A (ja) 音声認識装置
JPS63137298A (ja) 単語音声認識装置
JPS6346499A (ja) 大語▲い▼単語音声認識方式
JPS62217297A (ja) 単語音声認識装置
JPS60201396A (ja) 音声辞書の学習方式
JPS61281298A (ja) 音声認識装置
JPS59176791A (ja) 音声登録方式
JPS60241097A (ja) 音声認識応用装置
JPS6383800A (ja) 音声認識装置
JPS61235899A (ja) 音声認識装置
JPS6236699A (ja) 音声識別装置