JPH0462679B2 - - Google Patents

Info

Publication number
JPH0462679B2
JPH0462679B2 JP62000715A JP71587A JPH0462679B2 JP H0462679 B2 JPH0462679 B2 JP H0462679B2 JP 62000715 A JP62000715 A JP 62000715A JP 71587 A JP71587 A JP 71587A JP H0462679 B2 JPH0462679 B2 JP H0462679B2
Authority
JP
Japan
Prior art keywords
dictionary
feature parameters
patterns
similarity
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP62000715A
Other languages
English (en)
Other versions
JPS63168697A (ja
Inventor
Yumi Honda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62000715A priority Critical patent/JPS63168697A/ja
Publication of JPS63168697A publication Critical patent/JPS63168697A/ja
Publication of JPH0462679B2 publication Critical patent/JPH0462679B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔概要〕 音声認識装置において、運用時の音声認識率を
上げようとすると、辞書作成時の音声発声回数が
増えると云う問題を解決する為に、同時に複数個
の特徴パラメータを作成する並列標本化処理部を
設けることにより、上記並列標本化処理部で作成
された複数個の特徴パラメータの類似度を、パラ
メータ照合部で識別し、該類似度によつて、1
つ、又は、複数個の特徴パラメータを選択的に音
声辞書に記憶するようにしたものである。
〔産業上の利用分野〕
本発明は、特定話者用の音声認識装置に係り、
特にその音声辞書作成方式に関する。
最近の計算機システムの処理能力(実時間で音
声データを処理できる性能)の向上と、経済化、
小型化等に伴つて、音声をデータとして入力し、
処理することが盛んになつてきた。
その一例として、工場における仕分け作業と
か、フアクトリオートメーシヨン(FA)での製
品検査結果データの入力作業等の為の音声認識装
置がある。
該仕分け作業等においては、例えば、キーボー
ド(KB)により、仕分けデータを入力する方法
もあるが、該工場の環境(例えば、粉塵、作業者
の服装、キーボード(KB)迄の距離が遠い、或
いは、特定の操作者が必要等)によつては、該キ
ーボード(KB)を工場内に設置することが困難
なことが多い。従つて、直接、音声によつて該仕
分けデータ等を入力できることが望ましい。
この場合に必要となる、特定話者用の音声認識
装置は、該特定話者毎の辞書を作成する為に、ユ
ーザ(特定話者)は単語、単音節の単位で、何回
かの発声をしなければならないが、該辞書作成の
為の発声は、上記仕分け作業と云つた、直接の業
務には関係しないので、発声回数が増えると、ユ
ーザにとつて負担の多いものとなる。
この為、発声回数を増やさずに、認識率の良い
辞書を作成する方式が必要とされる。
〔従来の技術と発明が解決しようとする問題点〕
第3図は、従来の音声認識装置の構成例を示し
た図である。
先ず、入力音声6が帶域フイルタ群1に入る
と、パラメータ作成部2において、該発声された
音声に対応して、それぞれの音声の特徴パラメー
タパターン「X(1)、X(2)、…X(n)」7が作成され
る。
従来の音声認識装置においては、該パラメータ
作成部2で作成される特徴パラメータパターン
(以下、パターンと云う)は、1つの発声で、1
つのパターンしか出力されないので、辞書作成部
3においては、該作成されたパターンを、当該音
声の標準パターンとして、辞書5に登録してい
た。
当該音声認識装置を運用する場合には、運用時
に発声された音声6のパターン7をパラメータ作
成部2で作成し、予め、登録されている上記辞書
5内のパターンと、パターン照合部4で、例え
ば、パターンマツチ法で比較し、距離の最も短い
パターンを選択して、該パターンに対応する音声
を認識していた。
従つて、従来方式においても、1つの単語につ
いて、複数回発声されると、複数個のパターンが
辞書5に登録されており、その複数個のパターン
の内、一致するものがあると、該一致したパター
ンに対応する音声を認識する方法は採つていた。
然して、一般に、音声の子音部分等は、周波数
帶域毎の音声パワーが急激に変化する為に、帶域
フイルタ群1の出力をどのようなタイミングでサ
ンプリングするかで、該作成されるパターンに違
いのでる場合がある。
そのような音声に対して、音声認識時の入力音
声が、辞書作成時のパターンと異なるタイミング
でサンプリングされると、正しく認識することが
できない。
前述のように、従来の音声認識装置での辞書作
成方法では、パラメータ作成部2が、1つの音声
入力にたいして、1パターンしか作成しない為、
上記サンプリングのタイミングの違いによる誤認
識を防ぐ為には、該サンプリングの時間間隔を短
くする方法と、同じ、音声を数回発声して、1音
声に複数個のパターンを作成する方法が考えられ
る。
然し、サンプリングの間隔を狭めたのでは、該
1音声に関するパターンが増加するので、辞書5
が大きくなり、サンプリングのタイミングによる
影響の少ない音声については無駄なパターンを登
録することになる上、音声認識時のパターンの照
合にかかる時間も長くなると云つた問題があつ
た。
又、同じ音声を数回発声して、複数個のパター
ンを作成する方法は、ユーザに対する負荷が大き
く、認識時と同じタイミングのパターンが作成で
きるとは限らないと云う問題があつた。
本発明は上記従来の欠点に鑑み、音声発声回数
を増やすことなく、運用時の音声認識率を向上さ
せる辞書を作成する手段を備えた音声認識装置を
提供することを目的とするものである。
〔問題点を解決するための手段〕
第1図は本発明の音声認識装置の構成例を示し
た図である。
本発明においては、 入力音声を認識する帶域フイルタ群1と、 該帶域フイルタ群1からの出力を時間標本化し
て、特徴パラメータの時系列データを作成するパ
ラメータ作成部2と、 該パラメータ作成部2で作成した音声の特徴パ
ラメータを記憶する辞書作成部3と、 2種類の特徴パラメータを照合して類似度を求
めるパターン照合部4とを備えた音声認識装置で
あつて、 上記パラメータ作成部2に、同時に複数個の特
徴パラメータを作成する並列標本化処理部21
と、 上記並列標本化処理部21で作成された複数個
の特徴パラメータの類似度を、上記パターン照合
部4で識別し、該類似度によつて、1つ、又は、
複数個の特徴パラメータを選択して記憶パターン
選択処理部31とを設けて、 入力された音声の特徴パラメータを選択的に記
憶するように構成する。
〔作用〕
即ち、本発明によれば、音声認識装置におい
て、運用時の音声認識率を上げようとすると、辞
書作成時の音声発声回数が増えると云う問題を解
決する為に、同時に複数個の特徴パラメータを作
成する並列標本化処理部を設けることにより、上
記並列標本化処理部で作成された複数個の特徴パ
ラメータの類似度を、パラメータ照合部で識別
し、該類似度によつて、1つ、又は、複数個の特
徴パラメータを選択的に音声辞書に記憶するよう
にしたものであるので、1音声の発声によつて、
サンプリングのタイミングが確実に異なるパター
ンを並行して作成でき、子音部のように、音声パ
ワーが急激に変化する音声に対しても、音声発声
回数を増やさずに、音声の特徴を辞書に反映させ
ることができ、特定話者の負荷は従来と変わらず
に、認識率を向上させることができる他、サンプ
リングのタイミングによるパターンの影響が少な
い音声に関しては、1パターンのみを辞書に登録
するので、不必要な辞書領域の拡大を防ぎ、認識
時のパターンの照合時間も短くて済むと云う効果
がある。
〔実施例〕
以下本発明の実施例を図面によつて詳述する。
前述の第1図が、本発明の音声認識装置の構成
例を示した図であり、第2図は本発明の一実施例
を模式的に示した図であり、第1図おける並列標
本化処理部21、及び記憶パターン選択処理部3
1が本発明を実施するのに必要な手段である。
尚、全図を通して同じ符号は同じ対象物を示して
いる。
以下、第1図、第2図によつて、本発明の音声
認識装置における辞書作成方式を説明する。
本発明を実施しても、運用時の音声認識方式
は、特に、従来方式と変わることはないので、こ
こでは、音声が発声かれたときの辞書5への登録
方式を中心にして説明する。
先ず、第1図において、本発明のパラメータ作
成部2は、例えば、従来の半分の時間間隔で、帶
域フイルタ群1の出力をサンプリングし、時系列
のサンプリングデータ「X(1)、X(2)、…、X(2n
−1)、X(2n)」を作成し、並列標本化処理部2
1において、交互にサンプリングし直して、確実
にタイミングのずれた、2つのパターン「X(1)、
X(3)、…、X(2n−1)」と、「X(2)、X(4)、…、
X(2n)」を作成する。
この2種類のパターンは、それぞれは従来と同
じ時間間隔でサンプリングしたパターンと精度等
の面で変わることはない。
パターン照合部4は、この2種類のパターンを
例えば、パターンマツチ法で照合し、その類似度
を求める。
辞書作成部3の記憶パターン選択処理部31に
おいては、上記類似度を基に、辞書5に記憶させ
るパターンを、2個、又は1個選択し、辞書作成
部3がそれを辞書5に記憶する。
具体的には、サンプリングのタイミングによる
影響の大きい、例えば、子音部分等の音声につい
ては、該類似度が小さいことを認識して、該2種
類のパターンを記憶し、該影響の小さい音声につ
いては、類似度は大きいので、該2種類のパター
ンの内の1パターンのみを記憶する。このような
辞書作成方式を採ることにより、該辞書5を効率
良く作成することができる。
次に、第2図によつて、本発明による辞書作成
方式をより具体的に説明する。
本図において、91,95は帶域フイルタ群1
に入力された音声の波形を示している。パラメー
タ作成部2は、上記帶域フイルタ群1から出力さ
れた波形91、又は95の音声を時系列に交互に
サンプリングして、2種類のパターン92,9
3、又は96,97を作成する。
次のパターン照合部4は、この2種類のパター
ンを照合し、類似度94、又は98を出力する。
辞書作成部3は、この類似度を基に、上記2種類
のパターンの違いが大きいと判断すると、該2種
類とも辞書5に記憶し、該2種類のパターンの違
いが小さいと判断すると、一方のみを記憶する。
本図に示した例においては、サンプリングのタ
イミングの影響を受け易い入力音声91に対する
パターン92,95の類似度は、例えば、‘10'
と小さいことが記憶パターン選択処理部31で認
識されることにより、辞書5には、2つのパター
ンが記憶されるが、サンプリングのタイミングの
影響が少ない入力音声95に対するパターン9
6,97の類似度は例えば、‘90'と大きいこと
が記憶パターン選択処理部31で認識されること
により、辞書5には、2つのパターンの内の、何
れか1つが記憶される。
このようにして、生成された辞書5を備えた音
声認識装置を運用する場合には、パラメータ作成
部2が出力する2種類のパターンの内、1パター
ンのみが、辞書5に登録されている標準パターン
と、パターンマツチ法により照合されて類似度が
求められ、一致出力が得られたパターンに対応す
る音声を認識する。このとき、2種類のパターン
が登録されている音声に対しては、該2種類の何
れかと一致出力が得られるので、パラメータ作成
部2が出力したもう一方のパターンと、辞書5に
登録されている標準パターンとを照合する必要は
ない。
又、辞書5も必要な部分しか増えていないの
で、照合時間の増加を必要最小限に抑えることが
できる。
このように、本発明は、入力音声を、例えば、
従来の半分の時間間隔でサンプリングし、そのサ
ンプリングデータを時系列に並べたものを、交互
にサンプリングし直して、確実にタイミングのず
れた2種類のパターンを作成し、その類似度を求
め、類似度が小さいパターンについては、両方の
パターンを、該類似度が大きいパターンについて
は、一方のパターンのみを辞書に記憶するように
した所に特徴がある。
尚、本実施例においては、入力音声を、従来の
半分の時間間隔でサンプリングし、得られたサン
プリングデータを交互にサンプリングし直して、
2種類のパターンを作成する例で説明したが、本
発明の趣旨から考えて、2種類に限定する必要は
なく、一般に、複数種類のパターンを作成しても
良いことは云う迄もないことである。
〔発明の効果〕
以上、詳細に説明したように、本発明の音声認
識装置は、音声認識装置において、運用時の音声
認識率を上げようとすると、辞書作成時の音声発
声回数が増えると云う問題を解決する為に、同時
に複数個の特徴パラメータを作成する並列標本化
処理部を設けることにより、上記並列標本化処理
部で作成された複数個の特徴パラメータの類似度
を、パラメータ照合部で識別し、該類似度によつ
て、1つ、又は、複数個の特徴パラメータを選択
的に音声辞書に記憶するようにしたものであるの
で、1音声の発声によつて、サンプリングのタイ
ミングが確実に異なるパターンを並行して作成で
き、子音部のように、音声パワーが急激に変化す
る音声に対しても、音声発声回数を増やさずに、
音声の特徴を辞書に反映させることができ、特定
話者の負荷は従来と変わらずに、認識率を向上さ
せることができる他、サンプリングのタイミング
によるパターンの影響が少ない音声に関しては、
1パターンのみを辞書に登録するので、不必要な
辞書領域の拡大を防ぎ、認識時のパターンの照合
時間も短くて済むと云う効果がある。
【図面の簡単な説明】
第1図は本発明の音声認識装置の構成例を示し
た図、第2図は本発明の一実施例を模式的に示し
た図、第3図は従来の音声認識装置の構成例を示
した図、である。 図面において、1は帶域フイルタ群、2はパラ
メータ作成部、21は並列標本化処理部、3は辞
書作成部、31は記憶パターン選択処理部、4は
パターン照合部、5は音声辞書、又は辞書、6は
入力音声、7,71,72はパラメータパター
ン、又はパターン、91,95は入力音声波形、
92,93、又は96,97は2種類のパラメー
タパターン、94,98は類似度、をそれぞれ示
す。

Claims (1)

  1. 【特許請求の範囲】 1 入力音声を認識する帶域フイルタ郡1と、 該帶域フイルタ群1からの出力を時間標本化し
    て、特徴パラメータの時系列データを作成するパ
    ラメータ作成部2と、 該パラメータ作成部2で作成した音声の特徴パ
    ラメータを記憶する辞書作成部3と、 2種類の特徴パラメータを照合して類似度を求
    めるパターン照合部4とを備えた音声認識装置で
    あつて、 上記パラメータ作成部2に、同時に複数個の特
    徴パラメータを作成する並列標本化処理部21
    と、 上記並列標本化処理部21で作成された複数個
    の特徴パラメータの類似度を、上記パターン照合
    部4で識別し、該類似度によつて、1つ、又は、
    複数個の特徴パラメータを選択して記憶する記憶
    パターン選択処理部31とを設けて、 入力された音声の特徴パラメータを選択的に記
    憶することを特徴とする音声認識装置。
JP62000715A 1987-01-06 1987-01-06 音声認識装置 Granted JPS63168697A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62000715A JPS63168697A (ja) 1987-01-06 1987-01-06 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62000715A JPS63168697A (ja) 1987-01-06 1987-01-06 音声認識装置

Publications (2)

Publication Number Publication Date
JPS63168697A JPS63168697A (ja) 1988-07-12
JPH0462679B2 true JPH0462679B2 (ja) 1992-10-07

Family

ID=11481456

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62000715A Granted JPS63168697A (ja) 1987-01-06 1987-01-06 音声認識装置

Country Status (1)

Country Link
JP (1) JPS63168697A (ja)

Also Published As

Publication number Publication date
JPS63168697A (ja) 1988-07-12

Similar Documents

Publication Publication Date Title
US6553342B1 (en) Tone based speech recognition
JPH09325798A (ja) 音声認識装置
JPH07219579A (ja) 音声認識装置
JPS597998A (ja) 連続音声認識装置
US4790017A (en) Speech processing feature generation arrangement
JPH0462679B2 (ja)
JP2820093B2 (ja) 単音節認識装置
JPH1083195A (ja) 入力言語認識装置及び入力言語認識方法
JPS63186298A (ja) 単語音声認識装置
KR19990015122A (ko) 음성 인식 방법
JPH04324499A (ja) 音声認識装置
JPS59176791A (ja) 音声登録方式
JP2547541B2 (ja) 単音節音声認識装置
JPH01219797A (ja) 音声認識装置
JPS61165797A (ja) 音声認識装置
JPS62111295A (ja) 音声認識装置
JPS6312000A (ja) 音声認識装置
JPH07146696A (ja) 音声認識における単語テンプレートの自動作成方法
JPS6383800A (ja) 音声認識装置
McPherson et al. Research and Development in Speech
JPS6167896A (ja) 音声認識方法
JPH02116899A (ja) 音声認識装置
JPS6287993A (ja) 音声認識装置
JPS61165796A (ja) 音声認識装置
JPS63318600A (ja) 音声認識方式