JPS59224900A - 音声認識方法 - Google Patents

音声認識方法

Info

Publication number
JPS59224900A
JPS59224900A JP58099960A JP9996083A JPS59224900A JP S59224900 A JPS59224900 A JP S59224900A JP 58099960 A JP58099960 A JP 58099960A JP 9996083 A JP9996083 A JP 9996083A JP S59224900 A JPS59224900 A JP S59224900A
Authority
JP
Japan
Prior art keywords
noise
phoneme
phonemes
standard
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58099960A
Other languages
English (en)
Other versions
JPH0690631B2 (ja
Inventor
冨田 和行
竹内 亜紀彦
良平 中津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Nippon Telegraph and Telephone Corp
Original Assignee
Fujitsu Ltd
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Nippon Telegraph and Telephone Corp filed Critical Fujitsu Ltd
Priority to JP58099960A priority Critical patent/JPH0690631B2/ja
Publication of JPS59224900A publication Critical patent/JPS59224900A/ja
Publication of JPH0690631B2 publication Critical patent/JPH0690631B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 発明の技術分野 本発明は、電話による音声応答システムに用いられるよ
うな不特定話者方式の音声認識装置において、入力音声
の有音区間にはさまれた無音部における環境雑音の特性
を、認識処理において考慮し、マツチング性能を改善し
た音声認識方式に関する。
技術の背景 不特定話者を対象とする音声認識装置の中で。
特に入力音声を音素に分解して認識する方式のものにお
いては、標準パターンを音素単位で有している。他方、
入力音声には、無音区間が多く含まれている。例えば、
数字6の発声音「ロクjは。
ROとKUの間に無音部がある。したがって音素を単位
として認識を行う方式では、音素標準パターンの1つと
して雑音に対応した標準パターンを持ち、かつ認識対象
語は雑音音素も含めた形で音素系列表記を行い記憶して
おく。このような方式において無音部を含んだ語が正し
く認識されるためには、この無音部において雑音に対応
する標準パターンとの距離が小さい値である必要がある
しかし、電話による音声応答システムに用いられる場合
など、実際には周囲雑音が環境により大幅に変動するた
め、無音区間において必ずしも雑音に対応した標準パタ
ーンとの距離値が小さい値をとるとは限らず、これが認
識誤りの原因となる問題点があった。
そのため1本発明は、このような無音部において、雑音
の標準パターンとの距離が大きくなることをさけるため
話者の発声直前の環境雑音を収集して、パラメータ分析
したものを雑音に対応した標準パターンとして用いるこ
とにより、マツチング特性を向上させた音声認識方式を
提供するものである。
そして9本発明は、その構成として、認識単語中に現わ
れる音素を標準パターンとして予め認識装置に登録して
おき、入力音声をある時間間隔で切出し、上記標準パタ
ーンとの距離を求め、更(り音素系列で表現しである認
識対象語とマツチングをとる不特定話者音声認識方式に
おいて1話者の発声前に、環境雑音を収集し、これを雑
音音素として定義される音素標準パターンの1つとして
登録することにより、入力音声の無音区間に含まれる環
境雑音を雑音音素に対応づけて認識処理することを特徴
としている。
以下に9本発明を実施例にしたがって説明する。
第1図は実施例装置の構成図である。図において、1は
アナログ部であり、入力音声をA/D変換してデジタル
信号化する。2は音声分析部であり、入力デジタル音声
信号を数十ミリ秒のフレーム周期毎に、線型予測分析等
を用いてパラメータ分析し、特徴パラメータを計算する
。3は音声バッファであり、フレーム周期毎の入力音声
の特徴パラメータを格納する。4は音素標準パターン・
メモリであり、音素の標準となるパラメータを格納した
メモリである。5は距離計算部であり、音声バッファ3
中の入力音声の特徴パラメータと。
音素標準パターン・メモリ4中の音素標準パラメータと
の距離計算を、フレーム毎に行なう。6は単語辞書メモ
リであり、音素系列で表現された単語が格納されている
。7はマツチング部であり。
距離計算部5からの距離計算された音素の系列と。
単語辞書メモリ6からの各単語の音素系列との間で、D
P−マツチングのような照合を行ない、最小距離をもつ
単語を認識結果として出力する。8は制御部であり9本
発明では、特に音声入力前に環境雑音を測定して、雑音
音素のパラメータを標準パターン・メモリに加える設定
制御を行なう。
次に動作例を説明する。第2図(α)は、中間に無音部
を有する入力音声の一例を示す。図において。
無音部は、環境雑音にしたがったレベルを示している。
yl、 y、、 y3.・・・・・・、1%は、フレー
ム毎に分析されたパラメータ系列である。
たとえば、中間に無音部υを有する入力音声「イI」チ
」が入力された場合9次のような音素標準パターンを用
いて、距離計算とマツチング処理を行ない、最適マツチ
ングを求めた結果を第2図(b)に示す。
音素名   パラメータ i       I ch      CH 、N α      A 無音     X 上側のように、数字1を「イロチ」と無音部1−1を挾
んで発声されたときに、正しく音声認識されるためには
、無音期間のパラメータuiが、無音の音素標準パター
ンXに対して、距離計算結果が最短距離を示さなければ
ならない。しかし、一般に環境雑音は、千差万別である
そのため、無音に相当する雑音音素として、−律に単一
のパターンを適用することをせずに、音声入力される直
前の話者の周囲の環境雑音を収集し、第1図の音声分析
部2によりパラメータ分析したものを、音素標準パター
ン・メモリ4に雑音音素パラメータとして登録する。
環境雑音の収集、登録処理は、牙2図(α)に示すよう
な有音部区間を検出するパワー閾値を決定するた′めに
、音声入力開始前に通常行なわれる雑音測定の際に、制
御部8内の雑音音素設定ルーチンにより、同時に行なわ
れる。
しかし、雑音測定時に、誤って音声や突発的な大きな音
響が混入したときには、それを雑音として登録するのは
、認識性能を低下させることになるので、避けなければ
ならない。
このため、雑音として許容できる一定基準を設け、これ
から外れるものを排除する。たとえば。
複数人の話者の無音区間を分析し、これを予め雑音音素
の基準パターンとして登録しておく。雑音測定時に入力
された信号の分析パラメータは、まず雑音音素基準パタ
ーンとの距離計算により異常の有無が調べられる。距離
が一定の開直を超えて離れている場合には、それを採用
せずに再度雑音測定を指示する。牙3図は、制御部8内
の処理手順を示す。
雑音音素の基準パターンは、音素標準パターン・メモリ
4内の特定番地に格納されており、制御部8の雑音音素
設定ルーチンのみによって呼び出■ されることができる。
発明の効果 本発明によれば、入力音声中の無音区間が環境雑音から
とられた雑音音素標準パターンによって対応づけられる
ため、高いマツチング精度の音声認識結果を得ることが
できる。
【図面の簡単な説明】
牙1図は実施例装置の構成図、牙2図はその動作説明図
、牙3図は雑音音素標準パターン設定手順を説明するフ
ロー図である。 図中、1はアナログ部、2は音声分析部、3は音声バッ
ファ、4は音素標準パターン・メモリ。 5は距離計算部、6は単語辞書メモリ、7はマツチング
部、8は雑音音素設定を含む制御部を示す。 特許出願人 富士通株式会社(外1名)代理人弁理士 
 長谷用 文 廣(外1名)千1図 オZ図 1v、yA −−−−−−’−−−−−−−−−−−−
v、、l第3図 −644−

Claims (2)

    【特許請求の範囲】
  1. (1)  認識単語中に現われる音素を標準パターンと
    して予め認識装置に登録しておき、入力音声をある時間
    間隔で切出し、上記標準パターンとの距離を求め、更に
    音素系列で表現しである認識対象語とマツチングをとる
    不特定話者音声認識方式において9話者の発声前に、環
    境雑音を収集し、これを雑音音素として定義される音素
    標準パターンの1つとして登録することにより、入力音
    声の無音区間に含まれる環境雑音を雑音音素に対応づけ
    て認識処理することを特徴とする音声認識方式。
  2. (2)前記″;+P(1)項において、収集された環境
    雑音と、予め定められた基準となる雑音との間で、その
    パラメータ間距離が一定の大きさを超える場合に、雑音
    音素としての標準パターンの登録を禁止することを特徴
    とする音声認識方式。
JP58099960A 1983-06-03 1983-06-03 音声認識方法 Expired - Lifetime JPH0690631B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58099960A JPH0690631B2 (ja) 1983-06-03 1983-06-03 音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58099960A JPH0690631B2 (ja) 1983-06-03 1983-06-03 音声認識方法

Publications (2)

Publication Number Publication Date
JPS59224900A true JPS59224900A (ja) 1984-12-17
JPH0690631B2 JPH0690631B2 (ja) 1994-11-14

Family

ID=14261244

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58099960A Expired - Lifetime JPH0690631B2 (ja) 1983-06-03 1983-06-03 音声認識方法

Country Status (1)

Country Link
JP (1) JPH0690631B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6391700A (ja) * 1986-10-06 1988-04-22 シャープ株式会社 音声認識装置
JPS644798A (en) * 1987-06-29 1989-01-09 Nec Corp Voice recognition equipment
JPH0283593A (ja) * 1988-09-20 1990-03-23 Nec Corp ノイズ適応形音声認識装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6391700A (ja) * 1986-10-06 1988-04-22 シャープ株式会社 音声認識装置
JPH0558556B2 (ja) * 1986-10-06 1993-08-26 Sharp Kk
JPS644798A (en) * 1987-06-29 1989-01-09 Nec Corp Voice recognition equipment
JPH0283593A (ja) * 1988-09-20 1990-03-23 Nec Corp ノイズ適応形音声認識装置

Also Published As

Publication number Publication date
JPH0690631B2 (ja) 1994-11-14

Similar Documents

Publication Publication Date Title
JP3180655B2 (ja) パターンマッチングによる単語音声認識方法及びその方法を実施する装置
EP0077194B1 (en) Speech recognition system
US4720863A (en) Method and apparatus for text-independent speaker recognition
US7624015B1 (en) Recognizing the numeric language in natural spoken dialogue
JPH09500223A (ja) 多言語音声認識システム
JPS6247320B2 (ja)
US7181395B1 (en) Methods and apparatus for automatic generation of multiple pronunciations from acoustic data
KR19980070329A (ko) 사용자 정의 문구의 화자 독립 인식을 위한 방법 및 시스템
US5751898A (en) Speech recognition method and apparatus for use therein
WO1983002190A1 (en) A system and method for recognizing speech
Hirschberg et al. Generalizing prosodic prediction of speech recognition errors
JP3523382B2 (ja) 音声認識装置及び音声認識方法
JPS59224900A (ja) 音声認識方法
JP3125928B2 (ja) 音声認識装置
JPH0997095A (ja) 音声認識装置
JPH0640274B2 (ja) 音声認識装置
JPS62111295A (ja) 音声認識装置
JPH0316038B2 (ja)
JPS59170894A (ja) 音声区間の切り出し方式
JP2004004182A (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JPS6370298A (ja) 促音認識装置
JPH0519784A (ja) 音声認識装置
JPS63259689A (ja) 音声認識応答装置
JPH0573035B2 (ja)
JPS6228480B2 (ja)