JPH04275600A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH04275600A
JPH04275600A JP6120091A JP6120091A JPH04275600A JP H04275600 A JPH04275600 A JP H04275600A JP 6120091 A JP6120091 A JP 6120091A JP 6120091 A JP6120091 A JP 6120091A JP H04275600 A JPH04275600 A JP H04275600A
Authority
JP
Japan
Prior art keywords
speech
pattern
section
vowel
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6120091A
Other languages
English (en)
Inventor
Mitsugi Matsushita
貢 松下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP6120091A priority Critical patent/JPH04275600A/ja
Publication of JPH04275600A publication Critical patent/JPH04275600A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【技術分野】本発明は、音声認識装置、より詳細には、
自動車の中、工場の中などのような騒音の大きな環境で
の音声認識技術に関する。
【0002】
【従来技術】従来の音声認識システムでは、発声者が発
声した音声の存在する区間を検出し、その検出された区
間全ての音声のパターンを用いて認識処理を行っている
。しかし、この方法では、周囲の騒音が大きい場合、誤
認識することが多くなってしまう。これは、周囲の騒音
が大きい場合、子音のような音声パワーが小さな区間を
検出できなかったり、逆に音声区間の前後の騒音を音声
区間と間違って検出したりする音声区間の誤検出の問題
や、子音のような音声パワーが小さな区間に騒音が重畳
されることによって音声のパターンが崩れてしまう問題
によるものである。このような問題の対策方法としては
、例えば、特開昭59−211100号公報に記載のよ
うな登録型音声認識方法がある。この方法は、入力音声
に混入する騒音が低レベルの場合は、子音部と母音部を
含んだ音声パターンで認識処理を行い、騒音が低レベル
の場合は、母音部の音声パターンのみで認識処理を行う
ものである。しかし、この方法では、騒音が高レベルの
場合“根室(ねむろ)”と“目黒(めぐろ)”のように
母音部が同じ単語の認識ができないという欠点がある。
【0003】
【目的】本発明は、上述のごとき実情に鑑みてなされた
もので、母音部のパターンのみを用いて、認識処理を行
い、複数の候補を選んだ後に、子音部も含む全音声区間
のパターンを用いて、再度認識処理を行うことにより、
周囲の騒音が大きい場合の、音声認識率の低下を少なく
するようにすることを目的としてなされたものである。
【0004】
【構成】本発明は、上記目的を達成するために、(1)
音声を入力する音声入力部と、前記音声入力部より入力
された入力信号の特徴量を求める特徴量抽出部と、前記
特徴量から、音声の入力パターンを生成するパターン生
成部と、予め登録された音声の標準パターンを記憶する
標準パターンメモリと、前記パターン生成部で得られた
入力パターンと前記標準パターンメモリに記憶されてい
る標準パターンとを用いて認識処理を行う認識部とを有
する音声認識装置において、入力信号の母音部を検出す
る母音検出部を有し、前記母音検出部で母音部と検出さ
れた区間のパターンのみを用いて、認識処理を行い、複
数の候補を選んだ後に、子音部も含む全音声区間パター
ンを用いて、再度認識処理を行うことを特徴としたもの
であり、更には、(2)前記(1)に記載の音声認識装
置において、母音部と検出された区間のパターンのみを
用いて、認識処理を行い、複数の候補を選んだ際、第1
候補の類似度が非常に高い場合や第1候補の類似度と第
2候補の類似度の差や比が大きい場合は、この第1候補
を認識処理結果として出力し、子音部も含む全音声区間
のパターンを用いての認識処理は行わないこと、或いは
、(3)前記(1)に記載の音声認識装置において、周
囲の騒音のレベルが、予め定められていた閾値以下の場
合は、最初から、母音部と子音部を含む全音声区間のパ
ターンを用いて認識処理を行うこと、或いは、(4)前
記(1)又は(2)又は(3)に記載の音声認識装置に
、雑音除去装置を組み合わせたことを特徴としたもので
ある。以下、本発明の実施例に基づいて説明する。
【0005】図1は、請求項1に記載の発明の一実施例
を説明するためのブロック図、図2はその動作原理を説
明するためのフローチャートで、図中、1は音声入力部
、2は特徴量抽出部、3は母音区間検出部、4は母音区
間パターン生成部、5は標準パターンメモリ部、6は第
1音声認識部、7は音声区間検出部、8は音声区間パタ
ーン生成部、9は第2音声認識部である。
【0006】音声入力部1は、マイクロフォンのような
音響・電気信号変換器を用いて、音声を電気信号s(t
)に変換する。特徴量抽出部2は、バンドパスフィルタ
群、或いは、FFTなどを用いて、音声入力部1で得ら
れた電気信号s(t)の10msec程度の短時間周波
数スペクトルS(t,f)などの特徴量を抽出する。母
音区間検出部3は、入力された音声が母音区間であるか
どうかを検出するもので、例えば、音声入力部1で得ら
れた信号s(t)の絶対値の短時間平均値が予め定めら
れていた閾値Th1より大きく、且つ、特徴量抽出部2
で得られたS(t,f)の各母音のホルマント周波数近
傍のエネルギーが予め定められていた閾値以上の場合、
その区間を母音区間とする方法がある。母音区間パター
ン生成部4は、母音区間検出部3で母音と検出された区
間の特徴量S(t,f)から例えば公知のBTSP(B
inary Time Spectrum Patte
rn)音声認識方式(「2値のTSPを用いた単語音声
認識システムの開発」安田 他、電気学会論文誌C10
8巻、昭和63年10月号p.858〜865記載)の
音声パターン生成法に従って、母音区間の音声パターン
を生成する。標準パターンメモリ部5は、例えば公知の
BTSP音声認識方式の標準パターン形式になっている
音声の標準パターンを記憶する。ここで記憶される標準
パターンは、母音部のみの区間の標準パターンと、子音
部と母音部を含む区間の標準パターンの2種類がある。
【0007】第1音声認識部6は、母音区間パターン生
成部4で生成された母音区間パターンと前記標準パター
ンメモリ部5に記憶された母音部のみの区間の標準パタ
ーンとで公知のBTSP音声認識方式の認識処理に従っ
て認識処理を行い、認識対象の全単語から複数の候補を
選ぶ。音声区間検出部7は、入力された音声が(子音も
含む)音声区間中であるかどうかを検出するもので、例
えば、音声入力部1で得られた信号s(t)の絶対値の
短時間平均値が予め定められていた閾値Th2(Th2
≦Th1)より大きい場合その区間を音声区間とする方
法がある。音声区間パターン生成部8は、音声区間検出
部7で音声と検出された区間の特徴量S(t,f)から
公知のBTSP音声認識方式の音声パターン生成法に従
って、音声区間の音声パターンを生成する。第2音声認
識部9は、音声区間パターン生成部4で生成された音声
区間パターンと前記標準パターンメモリ部5に記憶され
た子音部と母音部を含む音声区間の標準パターンの中の
第1音声認識部6で複数の候補に選ばれたパターンだけ
とで公知のBTSP音声認識方の認識処理に従って認識
処理を行う。
【0008】図3は、請求項2項に記載の発明の一実施
例を説明するためのブロック図、図4はその動作原理を
説明するためのフローチャートで、図中、10は認識処
理終了判断部で、その他、図1の示した発明と同様の作
用をする部分には図1と同一の参照番号が付してある。 而して、この発明において、認識処理終了判断部10は
、第1音声認識部6で選ばれた複数の候補の認識結果を
用いて、母音部と子音部を含む音声区間での認識処理を
行うかどうかを判断するもので、例えば、第1音声認識
部6で、上位3つの候補が選ばれ、その認識得点Pt1
,Pt2,Pt3(数字は認識順位を意味する)が得ら
れた場合に、Pt1が予め定められた閾値以上、或いは
、Pt1とPt2の差や比が予め定められた閾値以上の
場合、第1候補を認識結果として出力し、母音部と子音
部を含む音声区間での認識処理は行なわない。この場合
、音声区間検出部7、音声区間パターン生成部8、第2
音声認識部9は動作しないことになる。
【0009】図5は、請求項3に記載の発明の一実施例
を説明するためのブロック図、図6はその動作原理を説
明するためのフローチャートで、図中、11は雑音レベ
ル判断部で、その他、図1に示した発明と同様の作用を
する部分には図1と同一の参照番号が付してある。而し
て、この発明において、雑音レベル判断部11は、周囲
の騒音のレベルが高レベルであるか、低レベルであるか
を判断するもので、例えば、音声入力を行っていない区
間における音声入力部1の入力信号s(t)の絶対値の
短時間平均値が予め定められた閾値以下の場合、周囲の
騒音のレベルを低レベルと判断し、母音区間のみの認識
処理は行わず、最初から、母音部と子音部を含む区間で
の認識処理を行う。この場合、母音区間検出部3、母音
区間パターン生成部4、第1認識部6は動作しないこと
になる。
【0010】図7は、請求項3に記載の発明の一実施例
を説明するためのブロック図、図8はその動作原理を説
明するためのフローチャートで、図中、12は雑音除去
部で、その他、図1に示した発明と同一の作用をする部
分には図1と同一の参照番号が付してある。而して、こ
の発明において、雑音除去部12は、音声入力部1で入
力される信号から信号中に含まれる雑音成分を除去する
もので、例えば、音声入力を行っていない区間における
特徴量抽出部2の出力SN(t,f)を用いて、(tは
時間、fは周波数)、 N(f)=ΣtSN(t,f) で、周囲の騒音の特徴量を求め、これを雑音成分N(f
)と推定し、音声入力中の特徴量SS(t,f)から、
S(t,f)=SS(t,f)−N(f)で、雑音除去
を行った音声の特徴量S(t,f)を求め、以降の認識
処理には、この特徴量を用いる。
【0011】なお、以上に説明した実施例で用いた、母
音区間検出部3の母音検出方法、母音区間パターン生成
部4、音声区間パターン生成部8のパターン生成方法、
標準パターンメモリ部5のパターン形式、音声区間検出
部7の音声区間検出方法、第1音声認識部6、第2音声
認識部9の認識処理方法、雑音除去部12の雑音除去方
法などに他の公知の方法を用いても本発明を実施するこ
とができることは容易に理解できる。
【0012】
【効果】以上の説明から明らかなように、本発明による
と、以下のような効果がある。 (1)請求項1の発明に対応する作用効果本発明では、
まず、母音部と検出された区間のパターンのみを用いて
、認識処理を行い、複数の候補を選んだ後に、子音部も
含む全音声区間のパターンを用いて、再度認識処理を行
うようにしているので、周囲の騒音の影響で、子音部の
検出ができなかったり、子音部のパターンが崩れた場合
でも音声認識率の低下を少なくすることができる。 (2)請求項2の発明に対応する作用効果本発明では、
母音部と検出された区間のパターンのみを用いて、認識
処理を行い、複数の候補を選んだ際、第1候補の類似度
が非常に高い場合や第1候補の類似度と第2候補の類似
度の差や比が大きい場合は、この第1候補を認識処理結
果として出力し、子音部も含む全音声区間のパターンを
用いての認識処理は行わないようにしているので、請求
項1の発明よりも無駄な処理が少なくなる。 (3)請求項3の発明に対応する作用効果周囲の騒音の
レベルが、予め定められていた閾値以下の場合は、最初
から、母音部と子音部を含む全音声区間のパターンを用
いて認識処理を行うようにしているので、請求項1の発
明よりも無駄な処理が少なくなる。 (4)請求項4の発明に対応する作用効果請求項1又は
2又は3に記載の音声認識装置に、雑音除去装置を組み
合わせているので、高騒音下でも認識可能な音声認識装
置が実現する。
【図面の簡単な説明】
【図1】  請求項1に記載した発明の一実施例を説明
するためのブロック図である。
【図2】  図1の動作説明をするためのフローチャー
トである。
【図3】  請求項2に記載した発明の一実施例を説明
するためのブロック図である。
【図4】  図3の動作説明をするためのフローチャー
トである。
【図5】  請求項3に記載した発明の一実施例を説明
するためのブロック図である。
【図6】  図5の動作説明をするためのフローチャー
トである。
【図7】  請求項4に記載した発明の一実施例を説明
するためのブロック図である。
【図8】  図7の動作説明をするためのフローチャー
トである。
【符号の説明】
1…音声入力部、2…特徴量抽出部、3…母音区間検出
部、4…母音区間パターン生成部、5…標準パターンメ
モリ部、6…第1音声認識部、7…音声区間検出部、8
…音声区間パターン生成部、9…第2音声認識部、10
…認識処理終了判断部、11…雑音レベル判断部、12
…雑音除去部。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】  音声を入力する音声入力部と、前記音
    声入力部より入力された入力信号の特徴量を求める特徴
    量抽出部と、前記特徴量から、音声の入力パターンを生
    成するパターン生成部と、予め登録された音声の標準パ
    ターンを記憶する標準パターンメモリと、前記パターン
    生成部で得られた入力パターンと前記標準パターンメモ
    リに記憶されている標準パターンとを用いて認識処理を
    行う認識部とを有する音声認識装置において、入力信号
    の母音部を検出する母音検出部を有し、前記母音検出部
    で母音部と検出された区間のパターンのみを用いて認識
    処理を行って複数の候補を選んだ後に、子音部も含む全
    音声区間パターンを用いて、再度認識処理を行うことを
    特徴とする音声認識装置。
  2. 【請求項2】  請求項1に記載の音声認識装置におい
    て、母音部と検出された区間のパターンのみを用いて認
    識処理を行って複数の候補を選んだ際、第1候補の類似
    度が非常に高い場合や第1候補の類似度と第2候補の類
    似度の差や比が大きい場合は、この第1候補を認識処理
    結果として出力し、子音部も含む全音声区間のパターン
    を用いての認識処理は行わないことを特徴とする音声認
    識装置。
  3. 【請求項3】  請求項1に記載の音声認識装置におい
    て、周囲の騒音のレベルが予め定められていた閾値以下
    の場合は、最初から、母音部と子音部を含む全音声区間
    のパターンを用いて認識処理を行うことを特徴とする音
    声認識装置。
  4. 【請求項4】  請求項1又は2又は3に記載の音声認
    識装置に、雑音除去装置を組み合わせたことを特徴とす
    る音声認識装置。
JP6120091A 1991-03-01 1991-03-01 音声認識装置 Pending JPH04275600A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6120091A JPH04275600A (ja) 1991-03-01 1991-03-01 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6120091A JPH04275600A (ja) 1991-03-01 1991-03-01 音声認識装置

Publications (1)

Publication Number Publication Date
JPH04275600A true JPH04275600A (ja) 1992-10-01

Family

ID=13164304

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6120091A Pending JPH04275600A (ja) 1991-03-01 1991-03-01 音声認識装置

Country Status (1)

Country Link
JP (1) JPH04275600A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003504653A (ja) * 1999-07-01 2003-02-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ノイズのある音声モデルからのロバスト音声処理
KR100741166B1 (ko) * 2004-11-09 2007-07-20 주식회사 세영 인조석재 제조 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003504653A (ja) * 1999-07-01 2003-02-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ノイズのある音声モデルからのロバスト音声処理
JP4818556B2 (ja) * 1999-07-01 2011-11-16 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 確率論的ロバスト音声処理
KR100741166B1 (ko) * 2004-11-09 2007-07-20 주식회사 세영 인조석재 제조 방법

Similar Documents

Publication Publication Date Title
JP3162994B2 (ja) 音声のワードを認識する方法及び音声のワードを識別するシステム
JPH04275600A (ja) 音声認識装置
JPH05119792A (ja) 音声認識装置
JPH0558553B2 (ja)
JPH0922296A (ja) 感性情報入力処理装置及びその処理方法
JP2006039382A (ja) 音声認識装置
CN107039046B (zh) 一种基于特征融合的语音声效模式检测方法
JP3114757B2 (ja) 音声認識装置
JP2007248529A (ja) 音声認識装置、音声認識プログラム、及び音声動作可能な装置
JPH1097269A (ja) 音声検出装置及び方法
Gulzar et al. An improved endpoint detection algorithm using bit wise approach for isolated, spoken paired and Hindi hybrid paired words
JPH04324499A (ja) 音声認識装置
JP2666296B2 (ja) 音声認識装置
KR960001950B1 (ko) 음성인식방법 및 그 장치
JPS6126678B2 (ja)
JP2017068153A (ja) 半導体装置、システム、電子機器、及び、音声認識方法
JPS6239899A (ja) 会話音声理解方法
JPS59195300A (ja) 音声認識装置
JPS6335995B2 (ja)
JPH026079B2 (ja)
JPH026078B2 (ja)
JPH0316038B2 (ja)
JPH01158499A (ja) 定常雑音除去方式
Hussain et al. A Framework for Music-Speech Segregation using Music Fingerprinting and Acoustic Echo Cancellation Principle
JPS6312000A (ja) 音声認識装置