JPH0430040B2 - - Google Patents

Info

Publication number
JPH0430040B2
JPH0430040B2 JP56121632A JP12163281A JPH0430040B2 JP H0430040 B2 JPH0430040 B2 JP H0430040B2 JP 56121632 A JP56121632 A JP 56121632A JP 12163281 A JP12163281 A JP 12163281A JP H0430040 B2 JPH0430040 B2 JP H0430040B2
Authority
JP
Japan
Prior art keywords
noise
section
input
speech
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP56121632A
Other languages
English (en)
Other versions
JPS5823098A (ja
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to JP56121632A priority Critical patent/JPS5823098A/ja
Publication of JPS5823098A publication Critical patent/JPS5823098A/ja
Publication of JPH0430040B2 publication Critical patent/JPH0430040B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 この発明は電話回線を経由して、電話機から入
力した音声を認識する音声認識装置に関するもの
である。
第1図に一般的な音声認識装置の構成を示す。
信号入力端子1から入力された音声を含んだ信号
は入力部2でデジタル信号に変換され、分析部3
に送られる。分析部3では一定長のフレーム毎に
パワーの計算、特徴パラメータの計算を行うとと
もに、パワーの値をもとに音声区間を検出し音声
を抽出する。音声認識部4では分析部3で抽出さ
れた音声を、標準パタン格納部5に記憶されてい
る標準パタンと照合して認識を行う。その認識方
法としては単語単位に認識を行う方法、音素、音
節等を単位とした標準パタンと単語辞書とを並用
して認識を行う方法等がある。主制御部6は各部
分の制御を行う。
前記音声区間の検出を行うにはあらかじめ入力
された雑音のパワーを測定し、その測定値から音
声抽出用のしきい値を定める方法がよく用いられ
る。音声抽出用のしきい値決定の一例を第2図に
示す。第2図で横軸は時間、縦軸はパワーを示し
ている。この場合雑音レベルをNとすると音声抽
出用しきい値Tは T=N+d (d:一定値) (1) として定める。このしきい値Tより大きな区間を
音声区間とする。このような方法を用いた場合入
力信号の音声対雑音比(以下S/N比と呼ぶ)の
変動範囲が広いと音声区間の検出を誤るおそれが
ある。例えば(1)式のdの値をS/N比の悪い入力
を想定して小さく決めると、S/N比の良い入力
では周囲の人の話し声、靴音等を信号として拾い
易く、誤動作をする場合がある。
また標準パタン格納部5に記憶しておく標準パ
タンの作成法として音声入力時の周囲雑音等を考
慮してHoth(ホス雑音:室内雑音を代表するも
の)等の雑音を付加した音声データから標準パタ
ンを作成する方法がある。しかし一般に認識のた
めに入力音声と共に入力される雑音の性質が、標
準パタン作成時の雑音の性質と違えば認識性能は
劣化する。従つて各種特性の異なつた周囲雑音の
もとで発声された音声を認識する場合に、一定の
安定した認識率を得ることが困難となる。
この発明はこれらの欠点を除去するため音声認
識装置に対して電話回線を経由して入力される音
声を含んだ入力信号に一定規準の雑音を付加する
機能を持たせ、入力信号のS/N比の変動範囲を
おさえ音声抽出の安定化をはかるとともに標準パ
タン作成時と同じ性質の一定規準の雑音を付加す
ることにより認識性能を向上させることを目的と
している。
この発明の実施例を第3図〜第5図に示す。第
3図は入力部2においてアナログ的に雑音を加え
る例を示し、信号入力端子1から入力された信号
は、雑音発生器7から発生された標準パタン作成
時に印加した雑音と同種の雑音と入力部2内の加
算回路8で加算処理される。その加算された信号
はバンドパスフイルタ9を経てAD変換器10に
送られる。AD変換器10の出力は分析部3へ供
給される。雑音発生器7のレベルはあらかじめ入
力系及び標準パタン作成系を考慮して適切なS/
N比となるように設定されているものとする。
入力音声をI、入力音声に重畳される雑音を
Ni、標準パタンをS、標準パタンに加算する一
定規準の雑音をNtとする。
上限値予測条件として、 Nt>Ni 信号条件として、 標準パタン=S+Nt 入力パタン=I+Ni+Nt≒I+Nt 上記の関係となる入力条件を満足する入力系を構
成する。
この例では入力される信号に常にあるレベルを
もつた雑音が印加されるためS/N比の変動範囲
の広い入力に対してその変動範囲をおさえること
となり音声抽出の安定化がはかれるとともに、標
準パタン作成時と同質の雑音を付加しているため
認識性能の向上がはかれる。
第4図は入力部2においてデジタル的に雑音を
加える例を示し、信号入力端子1から入力された
信号は入力部2内でバンドパスフイルタ9を経て
AD変換器10でデジタル信号に変換され、その
デジタル信号は雑音信号発生部11で発生される
雑音のデジタル信号と加算器12で加算処理され
る。その加算出力は分析部3へ送られる。
雑音発生部11は雑音を発生する装置でなく雑
音波形を記憶する記憶装置を読出すようにし、こ
の場合分析部3ではフレーム毎に処理を行うので
1フレーム分の雑音の波形を記憶しておけばよ
い。効果等は第3図に示した例と同様である。
第5図は分析部3において、入力信号に雑音波
形を加えることに相当する処理を特徴パラメータ
について行う例を示し、この例では特徴パラメー
タとして音声波の自己相関関数を用いている。入
力部2でデジタル信号に変換された入力信号は分
析部3内の相関関数計算部13に送られ、波形の
自己相関関数が計算される。雑音相関関数記憶部
14では雑音が相関関数の形で記憶されており、
この雑音相関関数は得られた入力音声の相関関数
と雑音付加演算部15で加算処理が行われる。い
ま入力波形をxi、その相関関数を{v〓}P〓=1、加え
る雑音の波形をni、その相関関数を{w〓}P〓=1
すると入力波に雑音を加えた波形の相関関数u〓は u〓=N-〓 〓i=0 (xi+vi)(xi+〓+ni+〓) =N-〓 〓i=0 xixi+〓+N-〓 〓i=0 vini+〓+N-〓 〓i=0 xi+〓viN-〓 〓i=0 xini+〓=v〓+
w〓 (2) となる。つまり相関関数上での加算は波形上での
加算に相当することになる。ここにpは相関関数
の次数であり、Nはデータ系列の個数である。音
声抽出部16では雑音を含んだ入力信号の音声区
間を検出し、音声の抽出を行う。
この例では入力部2で入力信号に雑音を加えた
のと同等の処理を分析部3で行つている。効果等
については第3図、第4図に示した場合と同様で
ある。
以上説明したようにこの発明は入力部または分
析部において雑音付加機能を有する音声認識装置
であり、電話回線を経由して入力される信号に雑
音を付加あるいはそれと同等の処理を行い、S/
N比の変動範囲の広い入力信号に対してその変動
範囲をおさえ、音声抽出の安定化をはかるととも
に、標準パタン作成時に付加した雑音と同質の雑
音を付加することにより認識性能を向上させるこ
とができる。
なお第2図に示した音声抽出用のしきい値の定
め方はあくまで、この発明の効果を説明するため
の一例であつて他の方法の場合にもこの発明は有
効に適用できることは明らかである。さらに第3
図〜第5図に示した実施例についてもこの発明を
説明するための例にすぎず、この発明の根本思想
は電話回線を経由して入力される入力信号に雑音
を付加することであつて、例えば第5図において
特徴パラメータは相関関数以外であつても加算処
理を他の演算に置きかえればよいことは明らかで
ある。またこの発明は音声認識装置ばかりでなく
入力信号から音声を抽出し種々の制御を行う他の
装置にも広く応用できる。
【図面の簡単な説明】
第1図は従来の音声認識装置の構成を示すブロ
ツク図、第2図は音声抽出用のしきい値の定める
一方法の概念を示す波形図、第3図は入力部にお
いてアナログ的に雑音を加える場合のこの発明の
一実施例の構成を示すブロツク図、第4図は入力
部においてデジタル的に雑音を付加する場合のこ
の発明の一実施例の構成を示すブロツク図、第5
図は分析部において雑音付加と同等の処理を行う
場合のこの発明の一実施例の構成を示すブロツク
図である。 1……信号入力端子、2……入力部、3……分
析部、4……音声認識部、5……標準パタン格納
部、6……主制御部、7……雑音発生器、8……
加算回路、9……バンドパスフイルタ、10……
AD変換器、11……雑音信号発生部、12……
加算器、13……相関関数計算部、14……雑音
相関関数記憶部、15……雑音付加演算部、16
……音声抽出部。

Claims (1)

    【特許請求の範囲】
  1. 1 電話回線を経由して入力される音声を含む入
    力信号をデイジタル信号に変換する入力部と、そ
    の変換されたデイジタル信号から特徴パラメータ
    を抽出する分析部と、入力信号の音声対雑音比の
    変動範囲をおさえるレベルの既知の性質の雑音信
    号を加算した音声の標準パタンが格納されている
    標準パタン格納部と、前記標準パタンに加算した
    雑音信号と同じ雑音信号を発生させ前記入力部又
    は前記分析部入力信号に波形上又は特徴パラメー
    タ上で加算する手段を有する雑音発生部と、前記
    分析部で抽出された特徴パラメータと前記標準パ
    タン格納部からの特徴パラメータとを照合して入
    力信号の音声を認識する音声認識部とで構成され
    たことを特徴とする音声認識装置。
JP56121632A 1981-08-03 1981-08-03 音声認識装置 Granted JPS5823098A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56121632A JPS5823098A (ja) 1981-08-03 1981-08-03 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56121632A JPS5823098A (ja) 1981-08-03 1981-08-03 音声認識装置

Publications (2)

Publication Number Publication Date
JPS5823098A JPS5823098A (ja) 1983-02-10
JPH0430040B2 true JPH0430040B2 (ja) 1992-05-20

Family

ID=14816064

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56121632A Granted JPS5823098A (ja) 1981-08-03 1981-08-03 音声認識装置

Country Status (1)

Country Link
JP (1) JPS5823098A (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60182011U (ja) * 1984-05-16 1985-12-03 株式会社ニコン 眼科装置
JPH01319099A (ja) * 1988-06-17 1989-12-25 Matsushita Electric Ind Co Ltd 音声認識装置
JP2658426B2 (ja) * 1989-09-26 1997-09-30 松下電器産業株式会社 音声認識方法
JPH04119415U (ja) * 1991-04-03 1992-10-26 株式会社ミツトヨ 顕微鏡
JPH0643892A (ja) * 1992-02-18 1994-02-18 Matsushita Electric Ind Co Ltd 音声認識方法
JP4182444B2 (ja) 2006-06-09 2008-11-19 ソニー株式会社 信号処理装置、信号処理方法、及びプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55117197A (en) * 1979-03-01 1980-09-09 Mitsubishi Electric Corp Voice input device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55117197A (en) * 1979-03-01 1980-09-09 Mitsubishi Electric Corp Voice input device

Also Published As

Publication number Publication date
JPS5823098A (ja) 1983-02-10

Similar Documents

Publication Publication Date Title
US4829578A (en) Speech detection and recognition apparatus for use with background noise of varying levels
EP0077194B1 (en) Speech recognition system
JPH0990974A (ja) 信号処理方法
US6029130A (en) Integrated endpoint detection for improved speech recognition method and system
JPH0430040B2 (ja)
Tüske et al. Robust voice activity detection based on the entropy of noise-suppressed spectrum
JP3354252B2 (ja) 音声認識装置
JP2797861B2 (ja) 音声検出方法および音声検出装置
JPH0643892A (ja) 音声認識方法
JP3588929B2 (ja) 音声認識装置
JP2000099099A (ja) データ再生装置
JPH03114100A (ja) 音声区間検出装置
JP2559475B2 (ja) 音声検出方式
JP2557497B2 (ja) 男女声の識別方法
JPH1097269A (ja) 音声検出装置及び方法
JP2666296B2 (ja) 音声認識装置
JP3411074B2 (ja) 母音区間検出装置及び母音区間検出方法
JPH0651792A (ja) 音声認識装置
JP2844592B2 (ja) 離散単語音声認識装置
JP2599974B2 (ja) 音声検出方式
JPH039400A (ja) 音声認識装置
JPS6061800A (ja) 音声認識方式
JPH0731506B2 (ja) 音声認識方法
JPS5925240B2 (ja) 音声区間の語頭検出方式
JPH03233600A (ja) 音声切り出し方法及び音声認識装置