JPH01253799A - 音声の認識方法 - Google Patents

音声の認識方法

Info

Publication number
JPH01253799A
JPH01253799A JP63081381A JP8138188A JPH01253799A JP H01253799 A JPH01253799 A JP H01253799A JP 63081381 A JP63081381 A JP 63081381A JP 8138188 A JP8138188 A JP 8138188A JP H01253799 A JPH01253799 A JP H01253799A
Authority
JP
Japan
Prior art keywords
speech
pattern
input
cumulative value
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63081381A
Other languages
English (en)
Inventor
Yumi Honda
本多 由美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63081381A priority Critical patent/JPH01253799A/ja
Publication of JPH01253799A publication Critical patent/JPH01253799A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (概要) 音声の認識方法に係り、特に入力された音声のパターン
と既知の複数の音声のパターンとを比較して、類似する
パターンである音声を入力された音声と認識する方法に
関し、 類似称呼の単語であっても高い認識率を得ることができ
るようにすることを目的とし、入力された音声のパター
ンと既知の複数の音声パターンとを比較して、類似する
パターンである音声を認識結果として出力する音声認識
方法を、入力された音声の経時的な変化パターンと、既
知の音声の経時的な変化パターンの差を累積して第1の
累積値を得るとともに、入力された音声の経時的な変化
パターンを予め決められた複数のフレームに分割し、各
フレーム毎に対応する既知の音声の経時的な変化パター
ンと比較し、その差が予め決められた閾値より大きいフ
レームの数を累積して第2の累積値を得、前記第1およ
び第2の累積値より入力された音声を認識するように構
成する。
〔産業上の利用分野〕
本発明は、音声認識装置における音声認識方法に係り、
特に類似する単語、熟語を発声した場合における音声認
識を正確に行う認識方法に関するものである。
音声認識技術の発達により、データ入力装置として音声
認識装置が実用化されてきており、色々な分野において
音声認識装置が使用されるようになってきた。
従来の音声認識は、例えば、数字や、゛はい′“いいえ
、“イエスパ、゛ノー”°などの極めて対象が限られて
おり、比較的容易に認識できるものに限られていたが、
最近になって認識すべき語が増加してきている。
そこで問題となってきたのが、類似語間での音声の認識
を正確に行うことである。
この問題に対して、認識対象語を発声の異なる同義語と
するとか、語の読み方を区別が付くように違いを強調し
た発声をする等の方法で対応を採ってきたが、音声認識
が多くの分野で使用されるようになっている今日ではこ
れらの方法を強制することは困難になっている。
従って、通常発声していると同じ発声で類似語を正確に
認識することが要望されている。
〔従来の技術〕
近年音声認識技術の発達によりデータ入力装置として音
声認識装置が実用化されている。このような、音声認識
装置として例えば、集配物を目的地別に区分けする、区
分はシステム等において指示者が発する目的地に関する
音声を認識して、集配物をその目的地別に区分けするも
のがある。
従来このような、システムに使用される音声の認識方法
としては次のようなものがある。これは、予め指示者の
複数の目的地に関する音声を登録してこの入力音声デー
タを周波帯域毎の音圧レベルの時間的変化を元に辞書パ
ターンを作成しておき、音声認識時に入力された入力音
声と、この辞書パターンとを比較して、入力された音声
に一番近似した辞書の内容であると認識するようにした
ものである。このような音声の認識方法として次のよう
なものがある。第5図は従来の音声認識方法を示すフロ
ーチャートである。入力された音声を例えば10m5e
cを単位時間とするフレームに分割しておき、登録した
辞書の時間等の基準にあわせて補正した後、先ず第1の
辞書パターンを呼出し、累積値をOに設定して(STI
)フレーム毎に入力された音声のパターンと、辞書に登
録されたパターンとの差(距離)を累積していき(Sr
1) 、全てのフレームについてこれを実行する(Sr
1)。そして上記の処理を全ての辞書について実行しく
5T4)、すべての辞書について累積値を得、これらの
累積値を比較して累積値が最小となる辞書の内容を上記
の入力された音声の内容であると認識する(Sr1)よ
うにしている。
〔発明が解決しようとする課題〕
以上のように、従来の音声認識方法においては、認識す
べき音声の全体の特徴である累積値が、全体として最も
少ない既知の音声を認識結果とするようにしているため
、特に類似語間においては正確な認識を行うことが出来
ないという問題がある。
即ち、累積値を使用すると、局部的に異なるパターンで
あっても他の部分で極めて類似していると、累積値の結
果では差が大きくならない。
特に、パターンの異なる部分の長さに対して全体のパタ
ーンが長い時にはその傾向が大きく現れる。
従って、局部的にしか相違しない複数の既知の音声パタ
ーンが辞書に格納されている場合には、誤認識する確率
が高くなるという問題がある。
例えば、子音は一般には発声時間が短く、発音が不安定
になりやすいので、子音のみが異なる単語、「イシカワ
」と「イチカワ」との判別は上記理由により非常に難し
い。
そこで本発明は、類似の単語であっても高い認識率を得
ることができる音声の認識方法を提供することを目的と
する。
〔課題を解決するための手段〕
本発明にあって、上記の課題を解決するための手段は、
第1図に示すように入力された音声のパターンと既知の
複数の音声パターンとを比較して、類似するパターンで
ある音声を認識結果として出力する音声認識方法であっ
て、入力された音声の経時的な変化パターンと、既知の
音声の経時的な変化パターンの差を累積して第1の累積
値を得るとともに、入力された音声の経時的な変化パタ
ーンを予め決められた複数のフレームに分割し、各フレ
ーム毎に対応する既知の音声の経時的な変化パターンと
比較し、その差が予め決められた閾値より大きいフレー
ムの数を累積して第2の累積値を得、前記第1および第
2の累積値より入力された音声を認識するように構成す
ることである。
〔作用〕
本発明によれば、入力された音声の認識は、入力された
音声の経時的な変化パターンと、既知の音声の経時的な
変化パターンの差を累積して第1の累積値を得るととも
に、入力された音声の経時的な変化パターンを予め決め
られた複数のフレームに分割し、各フレーム毎に対応す
る既知の音声の経時的な変化パターンと比較し、その差
が予め決められた閾値より大きいフレームの数を累積し
て第2の累積値を得、前記第1および第2の累積値より
なされるから、局所的にしか相違しない複数の既知の音
声パターンが辞書に格納されている場合、即ち類似の単
語間であっても高い認識率で音声を認識することができ
る。
〔実施例〕
以下本発明に係る音声の認識方法の実施例を図面に基づ
いて説明する。
第2図乃至第4図は本発明に係る音声の認識方法の実施
例を示すものである。第2図は本実施例に係る音声の処
理方法を示すフローチャートである。本実施例において
、辞書パターンは、従来と同様に、予め必要な数の目的
値に関する指示者の音声を登録して、この入力音声デー
タを周波帯域毎の音圧レベルの時間的変化を元に作成し
ている。
そして音声の識別時に入力された音声を例えば10m5
ecを単位時間とするフレームに分割しておき、登録し
た辞書の時間等の基準にあわせて補正した後、以下の処
理を実行する。
■ 比較すべき第1の辞書パターンを設定する。
■ 第1の累積値としての辞書パターンと入力音声パタ
ーンの差の累積値に初期値0を設定すると共に、所定の
第1の閾値な越えたフレームの数を累積する第2の累積
値に初期値0を設定する。
■ 対応フレームの辞書パターンの値と入力音声の値か
ら距離を算出し第1の累積値に加算する。
■ 上記の距離が第1の閾値を越えているか否かを判定
する。
■ 上記の距離が第1の閾値を越えていたら上記の第2
の累積値に1を累積する。
■ 当該辞書パターンと入力音声パターンの全部のフレ
ームについて上記■乃至■の処理を実行する。
■ すべての辞書パターンについて上記■乃至■の処理
を実行する。
■ 上記第1の累積値の値で予め定めた第2の閾値以下
である辞書パターンを求める。
■ ■で求めた辞書パターンが複数であるか単数である
かを判定する。
■ ■で辞書パターンが単数であると判定したときにそ
の辞書パターンの内容を入力した音声の内容であると認
識する。
■ ■て辞書パターンが複数であるときは第2の累積値
が最小である辞書パターンの内容が入力された辞書パタ
ーンの内容であると認識する。
これらの処理は例えば第3図に示すような音声認識装置
で実行される。同図において1は複数の辞書パターンを
格納している辞書部、2は入力された音声を周波数帯域
に分割する帯域フィルタ群、3は帯域フィルタ群からの
分割された音声から特徴パターンを作成する音響処理部
、4は上述した■〜■を行う距離計算部、5は上述した
■〜■を行う類似度判定部である。
また、6は辞書作成部で、音声認識装置を使用する前に
指示者から必要な音声を入力させ、音響処理部から出力
されるそれらの特徴パターンにより辞書部に入力する辞
書パターンを作成するものである。
本実施例に音声認識方法によって例えば係る入力音声「
イシカワ」を認識する例を説明する、第4図に示すよう
に入力する音声は例えば第4 図(a)に示すような音
声パターンであったとする。この時この音声パターンで
類似する辞書パターンとして「イシカワ」と「イチカワ
」とが有り、夫々第4図(b)及び(C)に示すような
辞書パターンである時、各フレーム間の距離は第4図(
d)及び(e)に示すようになる。そして、これらを累
積した結果、即ち上述の第1の累積値は第4図(f)及
び(g)のとおりであり、例えば辞書パターン「イシカ
ワ」の累積値は“”100”であり、辞書パターン「イ
チカワ」の累積値“90”°であったとする。従来の音
声認識方法であれば少ない累積値を有する「イチカワ」
と誤って認識するが、本実施例に係る音声の認識方法に
よれば、この2つの辞書パターンに関する第2の累積値
を調べ、辞書パターン「イシカヮ」のフレーム累積値は
゛0パであり、辞書パターン「イチカワ」のフレーム累
積値が“5°”であったことから少ないフレーム累積値
である「イシカワ」と認識し正しい結果を得る。
従って本実施例によれば、極めて類似した入力音声を認
識しなければならないばあいにおいても、高い割合で音
声を正確に認識することができる。
〔発明の効果〕
以上説明したように、本発明によれば入力された音声の
パターンと既知の複数の音声のパターンとを比較して、
類似するパターンである音声を入力された音声と認識音
声の認識方法を2つの異なった基準により判定して認識
するようにしたから類似称呼の単語であっても高い認識
率を得ることができるという効果を奏する。
【図面の簡単な説明】
第1図は本発明の原理図、第2図は本発明に係る音声の
認識方法の実施例を示すフローチャート、第3図は第2
図に示した実施例が適用される音声認識装置を示すブロ
ック図、第4図は第2図に示した実施例の具体的な作動
例を示した図、第5図は従来の音声の認識方法を示すフ
ローチャートである。 第 1 図 本発明のT鬼例 第2図 イ(発明か11削さ叡シ牧! 第3高 E、に−

Claims (2)

    【特許請求の範囲】
  1. (1)入力された音声のパターンと既知の複数の音声パ
    ターンとを比較して、類似するパターンである音声を認
    識結果として出力する音声認識方法であって、 入力された音声の経時的な変化パターンと、既知の音声
    の経時的な変化パターンの差を累積して第1の累積値を
    得るとともに、 入力された音声の経時的な変化パターンを予め決められ
    た複数のフレームに分割し、各フレーム毎に対応する既
    知の音声の経時的な変化パターンと比較し、その差が予
    め決められた閾値より大きいフレームの数を累積して第
    2の累積値を得、前記第1および第2の累積値より入力
    された音声を認識するようにしたことを特徴とする音声
    認識方法。
  2. (2)前記第1の累積値より入力された音声の認識候補
    を決定し、 前記認識候補の数が複数である場合に、前記第2の累積
    値が最小の音声の認識候補を認識結果として決定するこ
    とを特徴とする請求項1記載の音声認識方法。
JP63081381A 1988-04-04 1988-04-04 音声の認識方法 Pending JPH01253799A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63081381A JPH01253799A (ja) 1988-04-04 1988-04-04 音声の認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63081381A JPH01253799A (ja) 1988-04-04 1988-04-04 音声の認識方法

Publications (1)

Publication Number Publication Date
JPH01253799A true JPH01253799A (ja) 1989-10-11

Family

ID=13744720

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63081381A Pending JPH01253799A (ja) 1988-04-04 1988-04-04 音声の認識方法

Country Status (1)

Country Link
JP (1) JPH01253799A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100482313B1 (ko) * 1996-12-30 2005-07-21 엘지전자 주식회사 이중유사도비교를통한음성인식방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100482313B1 (ko) * 1996-12-30 2005-07-21 엘지전자 주식회사 이중유사도비교를통한음성인식방법

Similar Documents

Publication Publication Date Title
EP0504485A2 (en) A speaker-independent label coding apparatus
US5621849A (en) Voice recognizing method and apparatus
JPS62217295A (ja) 音声認識方式
US8589162B2 (en) Method, system and computer program for enhanced speech recognition of digits input strings
JPH04255900A (ja) 音声認識装置
JPH01253799A (ja) 音声の認識方法
KR100211067B1 (ko) 핵심어간의 유사도를 이용한 핵심어 검출 방법
JPS6315296A (ja) 音声認識装置
JPH0585917B2 (ja)
JPH06348291A (ja) 単語音声認識方法
KR20040100592A (ko) 이동 기기에서의 실시간 화자독립가변어 음성인식 방법
JPH0632006B2 (ja) 音声認識装置
JPH0316040B2 (ja)
JPH0380299A (ja) 単語音声予備選択方式
JPH0454960B2 (ja)
JPS60115996A (ja) 音声認識装置
JPH0713590A (ja) 音声認識方式
JPH06100919B2 (ja) 音声認識装置
JPH06100918B2 (ja) 音声認識装置
Nurul et al. Distinctive phonetic feature (DPF) based phone segmentation using 2-stage multilayer neural networks
JPS6310840B2 (ja)
JPS63236094A (ja) 音声認識方法
JPH0569440B2 (ja)
JPS6157996A (ja) 音声認識方式
JPH0464076B2 (ja)