JPH02183299A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH02183299A
JPH02183299A JP1001396A JP139689A JPH02183299A JP H02183299 A JPH02183299 A JP H02183299A JP 1001396 A JP1001396 A JP 1001396A JP 139689 A JP139689 A JP 139689A JP H02183299 A JPH02183299 A JP H02183299A
Authority
JP
Japan
Prior art keywords
syllable
word
pattern
speech
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1001396A
Other languages
English (en)
Inventor
Takayuki Fujimoto
教幸 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1001396A priority Critical patent/JPH02183299A/ja
Publication of JPH02183299A publication Critical patent/JPH02183299A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [概 要] 音節を登録パタンとし、これを連結して疑似的な単語登
録パタンを生成し、該単55登録パタンと未知入力音声
とを照合することiこより音声を認識する装置に関し、 車路登録パタンの精度を高めて、認識性能の向上を図る
ことを目的とし、 音節パタン辞書の充実のための学習に際して、入力音声
と登録されている音節パタンを連結して疑似的に生成し
た単語パタンとを照合し条件、へを満せば可とし、該学
習のための入力音声と上記単語パタンとの照合に際し、
条件へを満たさない場合入力を不可とする第一の照合手
段と、通常の音声認識に際し入力音声と登録されている
音節パタンを連結して擬似的に生成した単語パタンとを
照合する前記条件Aより緩やかな条件を有する第二の照
合手段とを設けることにより構成する。
[産業上の利用分野コ 本発明は音声認識装置に関し、特に、音節を登録パタン
とし、これを連結することで疑似的な単1吾登録パタン
をつくり、未知入力単語音声と照合して、認識結果を得
る、音声認識装置に係る。
「従来の技術] 第2図は従来の音声認識装置の構成の例を示す図であっ
て、51はマイクロホン、52はパラメータ抽出部、5
3は区間検出部、54は切換部、55(よ主制御部、5
6はデイスプレィ、57は学習用単語辞書、58は認識
対象単語辞書、59は音節パタン辞書、60は音節パタ
ン抽出部、61は照合部を表わしている。
同図において、初期登録時には、学習用単語辞書57か
ら読み出されデイスプレィ56に表示された音節を使用
者が発声すると、これがマイクロホン51によって音声
電流に変換されパラメータ抽出部52に入力される。
該パラメータ抽出部52は入力された音声電流をA/D
変換した後、周波数分析等の処理を行なってパラメータ
を抽出する。
区間検出部53はパラメータ抽出部52の出力から区間
の検出を行ない、登録すべき音節を取り出す。
切換部54は区間検出部53の出力を図中の英字符Aで
示す側に接続し、前記音節を音節パタン辞859に登録
する。
このような作業を反復して行なうことにより、音節パタ
ン辞書59には必要な各種の音節パタンか登録される。
音節パタン辞書は、更に学習によって、新たに音節パタ
ンか追加もしくは平均化されて、より充実した内容を存
するものとなる。
上記学習は、学習用単語辞書57から読み出されて、デ
イスプレィ56上に表示された単語を使用者が発音する
ことによって行なわれる。
この場合も、前記初期登録時と同様にマイクロホン51
によって音声電流に変換され、パラメータ抽出部52、
区間検出部53を経て、切換・部54に達した各音節が
、英字符Bで示す側のルートで照合部61に送られる。
照合FA61は、これらの音節からなる単語と、該当す
る学習用単語から音節パタン抽出部60が抽出した音節
パタンに相当する音節パタンを音節パタン辞書59から
読み出して連結し、疑似的に生成した単語とを照合して
、その結果を出力する。主制御11部55はその結果に
応じて、必要な音節を音節パタン辞書に追加登録する。
実際の音声認識に際しては、学習時と同様の経路により
照合部61に入力された未知の単語と、認識対象単語辞
書58から音節パタン抽出部60が抽出した音節に相当
する音節パタン辞書59の中の音節パタンを連結して、
疑似的に生成した単語とを照合し、適合するものを候補
として選出して、その中から、最も距離の近い単語を認
識結果として出力する。
[発明が解決しようとする課題] 人間が発声する音声は、表記で表わすと同じものでも、
発声毎にその音声パタンか違っている。
発声毎の音声パタンの違いは、時間構造の違い(車路長
の違い、単語内の個々の音節長の違い等)と、スペクト
ル構造の違い(鼻音化、無声化、調音結合の度合いの違
い等)に大別される。そのため、音声認識に際しては、
上記時間構造の違いについては、パターンマツチングに
時間軸を非線形に伸縮して登録音声パタンと未知入力音
声パタン間の類似度(もしくは距離)を求める手法が採
用されることが多い。
特に、動的計画法(DP法)は時間軸を非線形に伸縮し
て類似度を求める方法として良く知られている。
また、スペクトル構造の違いについては、離散で発声し
た音節パタンと単語中の音節パタンか大きく違うため離
散で発声した音節パタンを連結して単語パタンを合成し
ても、実際の単語パタンと大きく食い違うため、誤認識
もしくはりジエクトとなることが多い。
そのため、音節パタン辞書に登録する音節パタンを単語
中から認11時と同様の照合方法を用いて切り出す方法
が考えられている。
前記、従来の技術として説明した音声認識装置もこのよ
うな方式を採ったものである。
しかし、このような従来の音声認識装置においても、単
語中から登録パタンを抽出するさい、切り出し誤りや発
声ミスにより、必ずしも品質の良い登録パタンができる
とは限らなかった。
切り出し誤りを減らす方法として、入力パタン中のパワ
ーのデイツプ部には子音が存在するとか、スペクトルの
高域成分が強い部分は、摩擦性の子音(さ行の子音や、
た行の子音等)が存在するといった条件をもうけて、D
P照合等を行なう方法はあるが、認識時の発声が標準的
でなかったり、ノイズが付加していた場合には逆効果と
なることがあり、厳しい制限をもう、けることができな
かった。
本発明はこのような従来の問題点に鑑み、音節パタン辞
書に登録する音節パタン(登録テンプレート)の品質を
向上せしめて高い認1通性能を得ることのできる音声認
識装置を提供することを目的としている。
[課題を解決するための手段] 本発明によれば、上述の目的は前記特許請求の範囲に記
載した手段により達成される。
すなわら、本発明は、!l135よりも小さい音声の単
位を登録の基本単位上し、該基本719位を連結するこ
とによって、疑似的な単語登録パタンを生成し、該単語
登録パタンと入力された未知の単語音声とを照合するこ
とにより該未知の車路音声を認識する如く構成されてい
て、前記基本単位は予め特定の音節あるいは車路につい
て使用者が発声した結果より求められる音声情報から抽
出する音声認識装置において、音節パタン辞書の充実の
ための学習に際して、入力音声と登録されている音節パ
タンを連結して疑似的1ご生成した単語パタンとを照合
し条件Aを満せば可とし、該学習のための入力音声と上
記単語パタンとの照合iこ際し、条件Aを満たさない場
合入力を不可とする第一の照合手段と、通常の音声認識
に際し、入力音声と登録されている音節パタンを連結し
て疑似的に生成した単語パタンとを照合する前記条件へ
より緩やかな条件を有する第二の照合手段とを設けた音
声認識装置である。
5作 用] 本発明の音声認識装置において:よ、学習時には音節パ
タン辞書に格納されている音節を連結して疑似的に生成
した単5Sパタンと入力された音声パタンとの照合に際
し、予め定めた厳格な条件によって、照合を行なう。そ
して、もし、適合するものが存在しない場合にはこれを
リジェクトし、使用者に再発声を促す。そして、その結
果に応じて登録音節パタンを追加する。
これにより、音節パタン辞書に登録される音節パタン(
登録テンプレート)の品質を向上せしめることができる
そして、実際の認識時には、学習の場合より緩やかな条
件によって照合を行なうので、発声が45$的でなかっ
たり、ノイズが付加しているような場合でも正しい認1
通結果を得ることができる。
[実施例] 第1図は本発明の一実施例のブロック図であって、音声
認識装置の構成を示しており、■はマイクロホン、2は
パラメータ抽出部、3は区間検出部、4は切換部、5は
主制御部、6はデイスプレイ、7は学習用単語辞書、8
は認識対象単語辞書、9は音節パタン辞書、IOは音節
パタン抽出部、11.12は照合部を表わしている。
同図において、初期登録時には、学習用単語辞書7から
読み出されデイスプレィ6に表示された音節を使用者が
発声すると、これがマイクロホンlによって音声電流に
変換され、パラメータ抽出部2に入力される。
該パラメータ抽出部2は入力された音声電流をA/D変
換した後、周波数分析等の処理を行なってパラメータを
抽出する。
区間検出部3はパラメータ抽出部52の出力から区間の
検出を行ない、音節を取り出す。
切換部4は区間検出部3の出力を、図中の英字符へで示
す側に接続し、前記音節を音節パタン辞a9に登録する
このような作業を反復して行なうことにより、音節パタ
ン辞占9には必要な各種の音節パタンか登録される。
音節パタン辞書は、更に学習に新たな音節パタンが追加
されて、より、充実した内容を有するものとなる。
上記学習は、学習用単語辞書57から読み出されて、デ
イスプレィ6上に表示された単語を使用者が発音するこ
とによって行なわれる。
この場合も、前記初期登録時と同様にマイクロホン1に
よって音声電流に変換されパラメータ抽出部2、区間検
出部3を経て、切換部4に達した各音節が、英字群Bで
示す側のルートに切り換えられ照合部11に送られる。
照合allは照合i1i’B12よりも、厳格な条件の
もとでDP照合を行なう。
その条件は下記のとおりである。
■ 入力の語頭、語尾以外に無音区間が存在する場合は
、その無音直後の部分には、無声破裂子音のみを対応付
ける。
■ 入力の無音区間以外の部分には、無声破裂子音の先
頭を対応付けない。
照合部61は、これらの条件のもとで入力された単語と
、1亥当する学習用単語から音節パタン抽出部60が抽
出した音節パタンに相当する音節パタンを音節パタン辞
書59から読み出して連結し疑似的に生成した単語とを
照合し、その結果を出力する。
このとき、もしDPババス存在しない場合にはリジェク
トして、使用者に再発声を促す。
実際の音声AR2に際しては、マイクロホンlより入力
された音声が、学習時と同様な経路を経て切換部4に達
し、これが、該切換部4によって英字群Cで示す側に切
り換えられ、照合部12に入力される。
照合部12は、前記照合部11の場合より緩やかな条件
でDP照合を行なう。
その条件は下記のとおりである。
■ 入力の語頭、語尾以外に無音区間が存在する場合は
、その無音直後の部分には、音節の先頭のみを対応付け
る。
■ 入力のパワーがしきい値12以上の部分には、無声
破裂子音の先頭を対応付けない。
(ただし、IIを無音と有音を判定するしきい値とする
と、R2>1.である。)このような条件のもとで、未
知の単語と、認識対象単語辞書8から音節パタン抽出部
lOが抽出した音節に参目当する音節パタン辞書9の中
の音節パタンを連結して疑似的に生成した単語とを照合
し、適合するものを候補として選出して、その中から最
も距離の近い単語を認識結果として出力する。
以上説明した実施例にふいては、学習時の照合条件とし
て、 ■ 入力の語頭、語尾以外に無音区間が存在する場合は
、その無音直後の部分には、無声破裂子音のみを対応付
ける。
■ 入力の無音区間以外の部分には、無音破裂子音の先
頭を対応付けない。
と言う例について示しているが、本発明における学習時
の照合条件はこれに限るものではなく、他の条件による
ことも可能である。
また、通常の認識時の照合条件についても、前述の条件
に限るものではなく、学習時の照合条件より緩やかにす
ることによって、目的を達し得るものである。
[発明の効果] 以上説明したように、本発明によれば、音節パタン辞書
に登録する音節パタンの品質を高いものとなし得るから
、認1瀧性能の高い音声認識装置を構成し得る利点があ
る。
【図面の簡単な説明】
第1図は本発明の一実施例のブロック図、第2図は従来
の音声認識装置の構成の例を示す図である。 l・・・・・・マイクロホン、2・・・・・・パラメー
タ抽出部、3・・・・・・区間検出部、4・・・・・・
切換部、5・・・・・・主制御部、6・・・・・・デイ
スプレィ、7・・・・・・学習用単語辞書、8・・・・
・・認識対象単語辞書、9・・・・・・音節パタン辞書
、IO・・・・・・音節パタン抽出部、11゜12・・
・・・・照合部

Claims (1)

  1. 【特許請求の範囲】  単語よりも小さい音声の単位を登録の基本単位とし、
    該基本単位を連結することによって、疑似的な単語登録
    パタンを生成し、該単語登録パタンと入力された未知の
    単語音声とを照合することにより該未知の単語音声を認
    識する如く構成されていて、前記基本単位は予め特定の
    音節あるいは単語について使用者が発声した結果より求
    められる音声情報から抽出する音声認識装置において、 音節パタン辞書の充実のための学習に際して、入力音声
    と登録されている音節パタンを連結して疑似的に生成し
    た単語パタンとを照合し条件Aを満せば可とし、該学習
    のための入力音声と上記単語パタンとの照合に際し、条
    件Aを満たさない場合入力を不可とする、第一の照合手
    段と、 通常の音声認識に際し、入力音声と登録されている音節
    パタンを連結して疑似的に生成した単語パタンとを照合
    する前記条件Aより緩やかな条件を有する第二の照合手
    段とを設けたことを特徴とする音声認識装置。
JP1001396A 1989-01-10 1989-01-10 音声認識装置 Pending JPH02183299A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1001396A JPH02183299A (ja) 1989-01-10 1989-01-10 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1001396A JPH02183299A (ja) 1989-01-10 1989-01-10 音声認識装置

Publications (1)

Publication Number Publication Date
JPH02183299A true JPH02183299A (ja) 1990-07-17

Family

ID=11500331

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1001396A Pending JPH02183299A (ja) 1989-01-10 1989-01-10 音声認識装置

Country Status (1)

Country Link
JP (1) JPH02183299A (ja)

Similar Documents

Publication Publication Date Title
JPS62232691A (ja) 音声認識装置
JP3039634B2 (ja) 音声認識装置
JPH0283593A (ja) ノイズ適応形音声認識装置
JP3378547B2 (ja) 音声認識方法及び装置
JPH02183299A (ja) 音声認識装置
KR100673834B1 (ko) 문맥 요구형 화자 독립 인증 시스템 및 방법
JP2813209B2 (ja) 大語彙音声認識装置
JP3039453B2 (ja) 音声認識装置
JPH10116093A (ja) 音声認識装置
JPH08314490A (ja) ワードスポッティング型音声認識方法と装置
JPH0736481A (ja) 補完音声認識装置
JP2757356B2 (ja) 単語音声認識方法および装置
JP2001013983A (ja) 音声合成を用いた音声認識装置および音声認識方法
JPH1097270A (ja) 音声認識装置
JP3357752B2 (ja) パターンマッチング装置
JP2004309654A (ja) 音声認識装置
JPS62217297A (ja) 単語音声認識装置
JPH06337700A (ja) 音声合成装置
KR19990050440A (ko) 유성음, 무성음, 묵음 구간 정보를 이용한 음성인식방법 및 음성인식장치
JPS6180298A (ja) 音声認識装置
JPS60170900A (ja) 音節音声標準パタン登録方式
JPS6312000A (ja) 音声認識装置
JPS607492A (ja) 単音節音声認識方式
JPH0695684A (ja) 音声認識システム
JPH0827640B2 (ja) 音声認識装置