JPH02272495A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH02272495A
JPH02272495A JP1093604A JP9360489A JPH02272495A JP H02272495 A JPH02272495 A JP H02272495A JP 1093604 A JP1093604 A JP 1093604A JP 9360489 A JP9360489 A JP 9360489A JP H02272495 A JPH02272495 A JP H02272495A
Authority
JP
Japan
Prior art keywords
section
speech
voice
output
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1093604A
Other languages
English (en)
Inventor
Motoaki Koyama
元昭 児山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1093604A priority Critical patent/JPH02272495A/ja
Priority to EP19900106553 priority patent/EP0392365A3/en
Priority to KR1019900005151A priority patent/KR900016943A/ko
Publication of JPH02272495A publication Critical patent/JPH02272495A/ja
Priority to US07/953,777 priority patent/US5222147A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Navigation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の目的〕 (産業上の利用分野) 本発明は音声録音再生装置を具備した音声認識装置に関
する。
(従来の技術) 従来の音声認識装置は第9図に示すように、音響分析部
1、音声区間検出部2、標準パタン3、類似度計算部4
、認識結果判定部5を具備していた。即ち、音声が入力
されると、音響分析部1で音声特徴パラメータに変換さ
れ、この音声特徴パラメータは音声区間検出部2から類
似度計算部4へ入力され、標準パタン3との類似度を計
算する。
その類似度値は認識結果判定部5へ送られ、認識結果が
求められて出力される。その中には、音声応答装置6を
備え、認識結果判定部5の出力に従って音声を出力する
機能を持つものがあった。
このため、従来の音声認識装置では、認識結果を音声で
返答したり、音声入力のガイダンスを行うことができた
。しかし、音声認識結果が誤っていたときに、音声認識
装置の使用者は、いかなる理由で音声認識装置が誤L1
m!L、たかわからなかった。そのため、誤認識の次の
発声方法へのフィードバックがかからないので再び誤認
識を生じる可能性が高かった。
(発明が解決しようとする課題) この発明は、上記問題にかんがみてなされたもので、音
声認識の結果が誤認識となった場合、その原因が、音声
区間検出誤りかどうかを使用者が判定できる音声認識装
置を提供することを目的とする。
〔発明の構成〕
(課題を解決するための手段と作用) 本発明は上記目的を達成するために、音声入力を特徴パ
ラメータに変換する音響分析部と、音声入力を録音再生
する録音再生装置と、音声入力の音声区間を検出する音
声区間検出部と、標準パタンと、上記標準パタンと音声
入力から抽出された特徴パラメータとのマツチングをと
る類似度計算部と、上記類似度計算部の出力である類似
度値から音声認識結果の判定を行う認識結果判定部を具
備した音声認識装置において、音声区間検出部が録音再
生装置を制御することを特徴とするもので、音声認識又
は音声認識装置の標準パタンを登録しようとしたときに
入力した音声を録音し、音声認識又は音声登録に用いる
ため音声区間検出部が切り出した音声区間を再生して、
使用者に、自分の発声した音声の音声区間検出誤りをし
ていないか知らせることを特徴とするものである。
(実施例) 以下、この発明の実施例を第1図〜第8図を参照して説
明する。第1図、第3図は入力された音声が音響分析部
11に入り、その出力が音声区間検出部12に入る。第
2図、第4図は、入力された音声は音声区間検出部12
で音声区間の検出をした後に、音響分析部11に入る。
第1図、第3図では音声区間検出部12から出力された
音声の特徴パラメータは、類似度計算部14に入る。第
2図、第4図では、音響分析部11の出力である音声の
特徴パラメータは類似度計算部14に入る。第1図、第
2図、第3図、第4図共、類似度計算部14では入力さ
れた音声の特徴パラメータと、標準パタン13の出力を
入力として、認識結果判定部15に類似度値を送出する
。認識結果判定部15は類似度計算部14の出力である
類似度値を入力として認識結果を出力する。第1図、第
2図は音声入力を入力とし。
音声区間検出部12の制御を受ける録音再生装置17を
具備する。第3図、第4図は、音響分析部11の出力を
入力とし、音声区間検出部12の制御を受ける録音再生
装置17を具備する。第3図、第4図の録音再生袋[1
7は音声の特徴パラメータを音声に変換して録音する。
第1図、第2図、第3図、第4図は標準パタンの登録機
能を持たない音声認識装置である。
第5図は標準パタンの登録機能付きの音声認識装置であ
る。第5図の音響分析部1、音声区間検出部12.録音
再生袋w117の構成は、第1図と同じである。音声区
間検出部12の出力には切換え装置18があり、登録時
には標準パタン13へ、認識時には、類似度計算部14
への入力と切換えられるようになっている。標準パタン
13.類似度計算部14゜認識結果判定部15の構成は
、第1図と同じである。
次に実施例の音声認識装置の動作について説明する。ま
ず第1図では音声が入力されると、音響分析部11で音
声特徴パラメータに変換され、音声区間検出部12に入
る。一方、音声入力は録音再生装置17にも入力され、
音声区間検出部12から制御を受け、検出された音声区
間だけを再生する。検出された音声の特徴パラメータは
、音声区間検出部12から類似度計算部14へ入力され
、標準パタン13との類似度を計算する。その類似度値
は認識結果判定部15へ送られ、認識結果が求められて
、出力される0次に第2図の動作を説明する。入力音声
はまず、音声区間検出部12と録音再生装置17に入力
され、音声区間検出部12が検出した音声区間の音声を
録音再生袋W117が再生する。音声区間検出部12で
検出された音声は音響分析部11に入り、音声の特徴パ
ラメータに変換され類似度計算部14に入力される。以
後の処理は、第1図と同じである。次に第3図の動作を
説明する。音声入力は、まず音響分析部11に入り、音
声特徴パラメータに変換され、そのパラメータは、録音
再生装置17と、音声区間検出部12に入力される。音
声区間検出部12は入力された音声の特徴パラメータか
ら音声区間を検出し、録音再生装置17を制御して、検
出された区間の音声を再生させる。類似度計算部14以
降の処理は第1図と同じである0次に第4図の動作を説
明する。音声入力は、音声区間検出部12に入り、音声
区間の検出を行う、検出された音声は、音響分析部11
に入力され、音声の特徴パラメータ8に変換されて、録
音再生装置17に入力される。録音再生装置17では、
音声区間検出部12の制御の下で、検出された音声区間
を再生する。類似度計算部以降は第1図と同じ動作であ
る1次に第5図の動作の説明をする。第5図では切換え
装置18により切換えて、まず標準パタンの登録を行い
、その後で認識を行う、登録時には音声区間検出部12
の出力が標準パタン13へ加えられ標準パタンの登録を
行い、登録された標準パタンと同一の音声区間を再生す
る。認識時には音声区間検出部12の出力が類似度計算
部14へ加えられ認識を行う、この場合、検出された区
間の音声を再生することもできるし、再生しないことも
できる。
以上のような実施例の音声認識装置では、まず。
第1図〜第8図の装置では、認識時に、認識に用いた音
声区間め音声が再生されるため、誤認識を生じたときに
それが音声区間検出誤りのためか、それ以外かの判断を
話者が行うことができ、再発声のときのフィードバック
となる。例えば「いち」と発声して、「ち」と再生され
、認識結果が誤ったときに話者は「い」を強く発声し直
せば誤認識をくり返す確率が小さくなると判断できる。
このため、複数回発声したときの正答率が高くなるし、
話者に安心感を与える0次に第5図のように登録時に、
登録された音声を再生確認することで、不良標準パタン
の登録を防ぐことができ、認識性能の向上が望める。従
来例では、誤認識の1〜2割が音声区間検出誤りである
から、音声区間検出誤りを取り除くことで、例えば95
%の認識率が96%へと向上する。
次に第5図の実施例の他の例として、登録と認識の切換
え装置18と、音声入力端子19の間を、第2図〜第4
図に対応させた第5図〜第8図のようにすることも可能
である。
〔発明の効果〕
以上説明したように、本発明は、音声区間検出部が録音
再生装置を制御して1区間検出をした音声のみを再生す
るため、話者は音声認識装置が音声区間検出誤りを犯し
たかどうかがわかる。よって音声認識装置が誤認識を犯
したときでも、その原因が音声区間検出誤りであったと
きには、それ以降の発声方法を、音声区間検出誤りがな
いように話者が工夫することが可能となり、同じ認識誤
りを生じることが少くなるという効果がある。
【図面の簡単な説明】
第1図〜第8図はそれぞれ本発明の実施例を示すブロッ
ク図、第9図は従来の音声認識応答装置のブロック図で
ある。 11・・・音響分析部、12・・・音声区間検出部、1
3・・・標準パタン、   14・・・類似度計算部、
15・・・認識結果判定部、 17・・・録音再生装置
、18・・・切換え装置、   19・・・音声入力端
子。

Claims (6)

    【特許請求の範囲】
  1. (1)音声入力を録音再生する録音再生装置と、前記音
    声入力を特徴パラメータに変換する音響分析部と、この
    音響分析部の出力が加えられ音声入力の音声区間を検出
    する音声区間検出部と、この音声区間検出部からの出力
    である音声入力から抽出された特徴パラメータと標準パ
    タンとのマッチングをとる類似度計算部と、この類似度
    計算部の出力である類似度値から音声認識結果の判定を
    行なう認識結果判定部とを具備した音声認識装置におい
    て、前記音声区間検出部で検出された音声区間だけ前記
    録音再生装置が音声を再生することを特徴とする音声認
    識装置。
  2. (2)音声入力を録音再生する録音再生装置と、前記音
    声入力の音声区間を検出する音声区間検出部と、この音
    声区間検出部からの出力が加えられ音声入力を特徴パラ
    メータに変換する音響分析部と、この音響分析部の出力
    である音声入力から抽出された特徴パラメータと標準パ
    タンとのマッチングをとる類似度計算部と、この類似度
    計算部の出力である類似度値から音声認識結果の判定を
    行なう認識結果判定部とを具備した音声認識装置におい
    て、前記音声区間検出部で検出された音声区間だけ前記
    録音再生装置が音声を再生することを特徴とする音声認
    識装置。
  3. (3)音声入力を特徴パラメータに変換する音響分析部
    と、この音響分析部の出力が加えられ音声入力の音声区
    間を検出する音声区間検出部と、この音声区間検出部か
    らの出力及び前記音響分析部の出力が加えられ音声入力
    を録音再生する録音再生装置と、前記音声区間検出部か
    らの出力である音声入力から抽出された特徴パラメータ
    と標準パタンとのマッチングをとる類似度計算部と、こ
    の類似度計算部の出力である類似度値から音声認識結果
    の判定を行なう認識結果判定部とを具備した音声認識装
    置において、前記音声区間検出部で検出された音声区間
    だけ前記録音再生装置が音声を再生することを特徴とす
    る音声認識装置。
  4. (4)音声入力の音声区間を検出する音声区間検出部と
    、この音声区間検出部からの出力が加えられ音声入力を
    特徴パラメータに変換する音響分析部と、この音響分析
    部の出力及び前記音声区間検出部からの出力が加えられ
    音声入力を録音再生する録音再生装置と、前記音響分析
    部の出力である音声入力から抽出された特徴パラメータ
    と標準パタンとのマッチングをとる類似度計算部と、こ
    の類似度計算部の出力である類似度値から音声認識結果
    の判定を行なう認識結果判定部とを具備した音声認識装
    置において、前記音声区間検出部で検出された音声区間
    だけ前記録音再生装置が音声を再生することを特徴とす
    る音声認識装置。
  5. (5)音声区間検出部の出力が加えられ標準パタンの登
    録をする場合と音声区間検出部の出力を類似度計算部に
    入力する場合とに切換える切換え装置を有することを特
    徴とする請求項1又は3記載の音声認識装置。
  6. (6)音響分析部の出力が加えられ標準パタンの登録を
    する場合と音響分析部の出力を類似度計算部に入力する
    場合とに切換える切換え装置を有することを特徴とする
    請求項2又は4記載の音声認識装置。
JP1093604A 1989-04-13 1989-04-13 音声認識装置 Pending JPH02272495A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP1093604A JPH02272495A (ja) 1989-04-13 1989-04-13 音声認識装置
EP19900106553 EP0392365A3 (en) 1989-04-13 1990-04-05 Speech recognition lsi system including recording/reproduction device
KR1019900005151A KR900016943A (ko) 1989-04-13 1990-04-13 음성인식장치
US07/953,777 US5222147A (en) 1989-04-13 1992-09-30 Speech recognition LSI system including recording/reproduction device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1093604A JPH02272495A (ja) 1989-04-13 1989-04-13 音声認識装置

Publications (1)

Publication Number Publication Date
JPH02272495A true JPH02272495A (ja) 1990-11-07

Family

ID=14086932

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1093604A Pending JPH02272495A (ja) 1989-04-13 1989-04-13 音声認識装置

Country Status (3)

Country Link
EP (1) EP0392365A3 (ja)
JP (1) JPH02272495A (ja)
KR (1) KR900016943A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008256802A (ja) * 2007-04-02 2008-10-23 Fujitsu Ten Ltd 音声認識装置および音声認識方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5345536A (en) * 1990-12-21 1994-09-06 Matsushita Electric Industrial Co., Ltd. Method of speech recognition

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5862699A (ja) * 1981-10-09 1983-04-14 シャープ株式会社 音声認識装置
JPS5988799A (ja) * 1982-11-15 1984-05-22 株式会社日立製作所 音声パタン登録方式
JPS5988798A (ja) * 1982-11-15 1984-05-22 株式会社日立製作所 音声認識処理方式
JPS59147397A (ja) * 1983-02-10 1984-08-23 株式会社日立製作所 音声認識制御方式
JPS59195295A (ja) * 1983-04-20 1984-11-06 株式会社リコー 音声認識辞書登録方式
JPS6194095A (ja) * 1984-10-16 1986-05-12 株式会社リコー 音声認識装置
JPS63173097A (ja) * 1987-01-13 1988-07-16 松下電器産業株式会社 登録型音声認識装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB974850A (en) * 1963-06-12 1964-11-11 Standard Telephones Cables Ltd Speech recognition system
US3582559A (en) * 1969-04-21 1971-06-01 Scope Inc Method and apparatus for interpretation of time-varying signals
JPH0792673B2 (ja) * 1984-10-02 1995-10-09 株式会社東芝 認識用辞書学習方法
AT390685B (de) * 1988-10-25 1990-06-11 Philips Nv System zur textverarbeitung

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5862699A (ja) * 1981-10-09 1983-04-14 シャープ株式会社 音声認識装置
JPS5988799A (ja) * 1982-11-15 1984-05-22 株式会社日立製作所 音声パタン登録方式
JPS5988798A (ja) * 1982-11-15 1984-05-22 株式会社日立製作所 音声認識処理方式
JPS59147397A (ja) * 1983-02-10 1984-08-23 株式会社日立製作所 音声認識制御方式
JPS59195295A (ja) * 1983-04-20 1984-11-06 株式会社リコー 音声認識辞書登録方式
JPS6194095A (ja) * 1984-10-16 1986-05-12 株式会社リコー 音声認識装置
JPS63173097A (ja) * 1987-01-13 1988-07-16 松下電器産業株式会社 登録型音声認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008256802A (ja) * 2007-04-02 2008-10-23 Fujitsu Ten Ltd 音声認識装置および音声認識方法

Also Published As

Publication number Publication date
KR900016943A (ko) 1990-11-14
EP0392365A3 (en) 1991-12-27
EP0392365A2 (en) 1990-10-17

Similar Documents

Publication Publication Date Title
JP3263392B2 (ja) テキスト処理装置
EP0077194B1 (en) Speech recognition system
JPH02272495A (ja) 音声認識装置
JPH04318900A (ja) 多方向同時収音式音声認識方法
JPS6332394B2 (ja)
JPS6367197B2 (ja)
JP2754960B2 (ja) 音声認識装置
JPH03160499A (ja) 音声認識装置
JPH0119597B2 (ja)
JP4146949B2 (ja) 音声処理装置
JP2000148187A (ja) 話者認識方法、その方法を用いた装置及びそのプログラム記録媒体
JPH05197385A (ja) 音声認識装置
JPH0754434B2 (ja) 音声認識装置
JP2004219471A (ja) 音声認識装置
JPS60205600A (ja) 音声認識装置
JPH02178699A (ja) 音声認識装置
JPH0652479B2 (ja) 音声分析方式
JP2000155600A (ja) 音声認識システムおよび入力音声レベル警告方法
JPS61285495A (ja) 音声認識装置
JPH02162399A (ja) 音声認識装置
JPH07210186A (ja) 音声登録装置
JPH0199094A (ja) 音声認識装置
JPH03155599A (ja) 音声認識装置
JPH04178699A (ja) 音声認識方法及び装置
JPH0261847A (ja) テープデッキ装置