JP2002041085A - 音声認識装置及び記録媒体 - Google Patents

音声認識装置及び記録媒体

Info

Publication number
JP2002041085A
JP2002041085A JP2000220564A JP2000220564A JP2002041085A JP 2002041085 A JP2002041085 A JP 2002041085A JP 2000220564 A JP2000220564 A JP 2000220564A JP 2000220564 A JP2000220564 A JP 2000220564A JP 2002041085 A JP2002041085 A JP 2002041085A
Authority
JP
Japan
Prior art keywords
recognition
pattern matching
word
specific word
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000220564A
Other languages
English (en)
Other versions
JP3567864B2 (ja
Inventor
Norihide Kitaoka
教英 北岡
Hiroshi Ono
宏 大野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP2000220564A priority Critical patent/JP3567864B2/ja
Priority to DE10134908A priority patent/DE10134908B4/de
Priority to US09/907,594 priority patent/US6937982B2/en
Publication of JP2002041085A publication Critical patent/JP2002041085A/ja
Application granted granted Critical
Publication of JP3567864B2 publication Critical patent/JP3567864B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3605Destination input or retrieval
    • G01C21/3608Destination input or retrieval using speech input, e.g. using speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Automation & Control Theory (AREA)
  • General Physics & Mathematics (AREA)
  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Abstract

(57)【要約】 【課題】 入力音声信号の認識結果を外部機器の動作制
御に供する場合に、入力音声信号を当該外部機器の異常
動作を招く単語として誤認識する可能性を低くするこ
と。 【解決手段】 パターンマッチング部21は、特徴抽出
部20で抽出された入力音声信号についてのLPCケプ
ストラム係数の時系列データと、辞書部に予め記憶され
ている認識対象語彙の標準パターンとのパターンマッチ
ングを行う。認識対象語彙の標準パターンとしては、ボ
イスコマンドとして外部機器に与えられたときにこれが
動作不都合状態を起こす可能性がある特定単語及びこれ
と反対の意味を持つ第2の特定単語にそれぞれ対応した
標準パターンの他に、特定単語及び第2の特定単語と類
似した音声群にそれぞれ対応した標準パターンの集団が
認識対象候補集団として用意される。パターンマッチン
グ部21は、パターンマッチング時に、LPCケプスト
ラム係数の時系列データとの一致度合いが高い標準パタ
ーンが認識対象候補集団中に存在する場合に、第2の特
定単語を認識結果として出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、マン−マシン・イ
ンタフェースとして使用される音声認識装置及びその音
声認識装置の主要部の機能をコンピュータシステムにお
いて実現するためのプログラム及びデータを記録した記
録媒体に関する。
【0002】
【発明が解決しようとする課題】マイクロホンを通じて
入力された音声を認識する音声認識装置にあっては、入
力音声信号を分析した特徴パラメータと、辞書部に記憶
されている認識対象語彙の比較対象パターンとを比較す
ることにより、認識対象語彙中から比較結果が近い一つ
(または複数)の単語を選択して出力する構成とされる
ものであるが、この場合、入力された音声が認識対象語
彙中に存在しない場合でも、何れかの類似単語を選択し
て出力する構成が一般的となっている。また、このよう
な誤認識の他に、周囲雑音などに起因して入力音声信号
とは異なる単語を出力してしまうという誤認識も不可避
であるという一般的事情もある。このため、音声認識装
置の出力により外部機器の動作制御を行う際には、上記
のように入力音声信号が誤認識された場合に、外部機器
の動作に重大な悪影響を及ぼす可能性が出てくるもので
あり、その一例として、以下のような事例が考えられ
る。
【0003】例えば、操作信号の音声入力並びにユーザ
(車両運転者)側への質問、返答などの音声出力を行う
ボイスコントロール機能付きのカーナビゲーション装置
において、周知のルート探索動作により設定されたルー
トを地図画面により案内させながら目的地へ向かって車
両を走行させている途中で、ユーザが表示地図の縮小を
意図して「しゅくしょう」というボイスコマンドを発声
した場合に、装置側でこれを「じたく」と誤認識する可
能性がある。この場合、仮に、カーナビゲーション装置
が音声入力に応じて当該音声入力による指令内容を直ち
に実行する構成であった場合には、上記のような誤認識
が行われたときに、目的地までの設定ルートを破棄して
自宅までのルート探索動作が行われることになり、結果
的に、ユーザの意図に反して目的地までの設定ルートが
破棄されてしまう。そこで、実際には、装置側では「自
宅を目的地に設定します」、「よろしいですか?」と返
答し、ユーザ側に確認を求める構成とされる。従って、
ユーザ側では、上記確認を求められたときに「いいえ」
と答えれば、装置側では自宅までのルート探索動作を行
うことなく待機するようになり、改めて表示地図を縮小
するためのボイスコマンドを入力すれば良い。しかし、
ここでユーザ側が慌てて「しゅくしょう」などと発声し
た場合には、装置側でこれを「はい」と誤認識する可能
性が生じ、このような場合には目的地までの設定ルート
がユーザの意図に反して破棄されてしまうという問題点
を引き起こす。
【0004】要するに、音声認識装置の認識対象語彙中
に、誤認識されることで、外部機器の動作に不都合が生
じたり、外部機器がユーザの意図に反した動作を行う可
能性がある単語が存在することがあり、従って、音声認
識装置においては、上記のような誤認識に起因して外部
機器が不用意な動作をする事態を未然に防止できる技術
を採用することが望ましいものである。
【0005】そこで、本発明の目的は、入力音声信号を
認識結果を外部機器の動作制御に供する場合に、その入
力音声信号を当該外部機器の異常動作を招く単語として
誤認識する可能性を低くできて、外部機器が不用意な動
作をする事態を未然に防止可能になる音声認識装置並び
に上記誤認識の可能性を低くできる音声認識動作をコン
ピュータシステムにおいて実現可能なプログラム及びデ
ータを記録した記録媒体を提供することにある。
【0006】
【課題を解決するための手段】上記目的を達成するため
に請求項1に記載した手段を採用できる。この手段は、
音響分析手段、特徴抽出手段及びパターンマッチング手
段を備えており、話者による入力音声信号を音響分析す
ると共に、その分析結果に基づいて入力音声信号の特徴
パラメータを抽出し、抽出された特徴パラメータと予め
記憶されている認識対象語彙の比較対象パターンとのパ
ターンマッチングを行って一致度合いが高い単語を認識
結果とするものであり、その認識結果を外部機器の動作
制御に供するようになる。この場合、パターンマッチン
グ手段は、パターンマッチング時において、認識結果の
候補となった単語の認識信頼性が低く、且つその候補単
語が外部機器の動作に悪影響を及ぼす可能性がある特定
の単語であった場合には、その特定単語を避けた単語を
出力する。この結果、入力音声信号が外部機器に悪影響
を及ぼす単語として誤認識される可能性が低くなるか
ら、その外部機器が不用意な動作をする事態を未然に防
止できるようになる。
【0007】請求項2記載の手段によれば、パターンマ
ッチング手段は、パターンマッチング時において、前記
認識信頼性が低い状態の候補単語が外部機器の機能低下
を招く可能性がある特定の単語であった場合には、その
特定単語を避けた単語を出力するから、その外部機器の
機能が不用意に低下される事態を未然に防止できるよう
になる。
【0008】前記目的を達成するために請求項3に記載
した手段を採用することもできる。この手段において
も、音響分析手段、特徴抽出手段及びパターンマッチン
グ手段を備えており、話者による入力音声信号を音響分
析すると共に、その分析結果に基づいて入力音声信号の
特徴パラメータを抽出し、抽出された特徴パラメータと
予め記憶されている認識対象語彙の比較対象パターンと
のパターンマッチングを行って一致度合いが高い単語を
認識結果とするものであり、その認識結果を外部機器の
動作制御に供するようになる。この場合、パターンマッ
チング手段は、パターンマッチング時において、認識結
果の候補となった単語の認識信頼性が低く、且つその候
補単語が外部機器を話者の意図と異なる状態で動作させ
る可能性がある特定の単語であった場合には、その特定
単語を避けた単語を出力する。この結果、入力音声信号
が、外部機器を話者の意図と異なる状態で動作させる事
態を招く単語として誤認識される可能性が低くなるか
ら、その外部機器が不用意な動作をする事態を未然に防
止できるようになる。
【0009】請求項4記載の手段によれば、パターンマ
ッチング手段は、パターンマッチング時において、前記
認識信頼性が低い状態の候補単語が外部機器の設定内容
の変更という動作不都合状態を招く可能性がある特定の
単語であった場合には、その特定単語を避けた単語を出
力するから、その外部機器の設定内容が不用意に変更さ
れる事態を未然に防止できるようになる。
【0010】請求項5記載の手段によれば、信頼度推定
手段が、音響分析手段、特徴抽出手段あるいはパターン
マッチング手段の少なくとも何れかにおいて得られる所
定の信頼度評価用特徴量に基づき、前記認識結果の絶対
的な信頼度を推定する。ここで、パターンマッチングに
より得られる尤度(確からしさ)は、比較対象パターン
との一致度合いを示すものであって、あくまでも相対的
なものである。つまり、パターンマッチング時において
尤度が一番大きなものを認識結果として選択したとして
も、それは相対的に一致度合いが高いだけであり、実際
の入力音声信号に対して、その認識結果がどの程度正し
いかという判断に関しては適切な評価ができない。この
ような事情に対処するために、この手段では、パターン
マッチング手段での認識結果を絶対的な観点で評価可能
な「信頼度」という指標を、音響分析手段、特徴抽出手
段あるいはパターンマッチング手段の少なくとも何れか
において得られる所定の信頼度評価用特徴量に基づいて
推定するようにしたものである。
【0011】そして、パターンマッチング手段は、パタ
ーンマッチング時において前記特定単語の認識結果の信
頼度を信頼度推定手段から取り込むと共に、その信頼度
が所定レベル以下であった場合に、特定単語の認識信頼
性が低いと判断して、当該特定単語を避けた認識結果を
出力する。要するに、入力音声信号が特定単語であるか
否かを絶対的な指標である「信頼度」により評価し、そ
の評価に基づき入力音声信号が特定単語であるとの確信
を持てない場合には、当該特定単語以外の単語が認識結
果として出力されるものであり、結果的に、外部機器が
不用意な動作をする事態を効果的に防止できるようにな
る。
【0012】請求項6に記載したように、前記絶対的な
信頼度を、パターンマッチング手段による認識結果が正
解である確率に基づいて推定することが考えられる。こ
のようにすれば、信頼度を直観的且つ定量的に把握でき
るようになり、上記認識結果を利用するアプリケーショ
ンを実際に構築する際に便利になる。
【0013】前記目的を達成するために、請求項7ある
いは請求項9に記載した手段を採用することができる。
これらの手段においても、音響分析手段、特徴抽出手段
及びパターンマッチング手段を備えており、話者による
入力音声信号を音響分析すると共に、その分析結果に基
づいて入力音声信号の特徴パラメータを抽出し、抽出さ
れた特徴パラメータと予め記憶されている認識対象語彙
の比較対象パターンとのパターンマッチングを行って一
致度合いが高い単語を認識結果とするものであり、その
認識結果を外部機器の動作制御に供するようになる。こ
の場合、認識対象語彙の比較対象パターンとして、前記
外部機器の動作に悪影響を及ぼす可能性がある特定の単
語、あるいは外部機器を話者の意図と異なる状態で動作
させる可能性がある特定の単語に対応した比較対象パタ
ーンの他に、その特定単語と類似した音声群に対応した
比較対象パターンの集団が認識対象候補集団として用意
されており、パターンマッチング手段は、パターンマッ
チング時において、入力音声信号から抽出された特徴パ
ラメータとの一致度合いが高い比較対象パターンが上記
認識対象候補集団中に存在する場合に、前記特定単語を
避けた単語を出力する。
【0014】ここで、認識対象語彙の比較対象パターン
中に、特定単語に対応した比較対象パターンの他に、そ
の特定単語と類似した音声群に対応した比較対象パター
ンの集団が用意された場合には、入力音声信号が特定単
語であると認識される特徴空間が限定されることにな
る。このような状態は、特定単語以外の単語が当該特定
単語と認識される可能性が相対的に低くなった状態に相
当するようになり、このときには、当該特定単語を避け
た単語を出力する確率が高くなる。この結果、入力音声
信号が、外部機器に悪影響を及ぼす単語あるいは外部機
器を話者の意図と異なる状態で動作させる事態を招く単
語として誤認識される可能性が低くなるから、その外部
機器が不用意な動作をする事態を効果的に防止可能とな
る。
【0015】請求項8記載の手段によれば、認識対象候
補集団として、外部機器の機能低下を招く特定の単語と
類似した音声群に対応した比較対象パターンの集団が用
意されるから、入力音声信号が、外部機器の機能低下を
招く単語として誤認識されることに起因して当該外部機
器が不用意な動作をする事態を効果的に防止可能とな
る。
【0016】請求項10記載の手段によれば、認識対象
候補集団として、外部機器の設定内容の変更を招く可能
性がある特定の単語と類似した音声群に対応した比較対
象パターンの集団が用意されるから、入力音声信号が、
外部機器の設定内容の変更を招く単語として誤認識され
ることに起因して当該外部機器が不用意な動作をする事
態を効果的に防止可能となる。
【0017】請求項11記載の手段によれば、認識対象
語彙の比較対象パターン中には、前記特定単語及び当該
特定単語と反対の意味を持つ第2の特定単語にそれぞれ
に対応した比較対象パターンの他に、上記特定単語と類
似した音声群及び上記第2の特定単語と類似した音声群
にそれぞれ対応した比較対象パターンの集団が認識対象
候補集団として用意され、パターンマッチング手段は、
パターンマッチング時において、入力音声信号から抽出
された特徴パラメータとの一致度合いが高い比較対象パ
ターンが上記認識対象候補集団中に存在する場合に、上
記第2の特定単語を認識結果として出力する。
【0018】つまり、この手段によれば、パターンマッ
チング手段でのパターンマッチング時において、第2の
特定単語に多くの言い換えが用意された状態と等価とな
って、入力音声信号が特定単語であると認識される特徴
空間が限定されると共に、第2の特定単語であると認識
される特徴空間が拡大されることになる。このような状
態は、特定単語以外の単語が当該特定単語と認識される
可能性が相対的に低くなった状態に相当するようにな
り、このときには、当該特定単語と反対の意味の第2の
特定単語を出力する確率が高くなるから、外部機器が不
用意な動作をする事態を効果的に防止可能となる。
【0019】請求項12に記載したように、パターンマ
ッチング手段が、前記特定単語を避けた認識結果を出力
する動作を、外部機器における所定の動作制御を許容す
るか否かの確認のために話者による音声入力を求める場
面で行う構成とした場合には、外部機器の動作の有無を
最終的に確認するための入力音声信号が誤認識される可
能性が小さくなるため、その外部機器の不用意な動作を
防止する上で有益となる。
【0020】請求項13に記載した手段によれば、ナビ
ゲーション装置のボイスコントロールが可能になると共
に、入力音声信号の誤認識に起因した装置の誤動作を効
果的に防止できるようになる。
【0021】請求項14に記載したように、上記した音
声認識装置におけるパターンマッチング手段の機能は、
その機能をコンピュータシステムにて実現するためプロ
グラム及びデータを記録した記録媒体により得ることが
できる。この場合、例えば、CD−ROM、DVD−R
OM、不揮発性メモリ(EEPROMなど)、フロッピ
ー(登録商標)ディスク、光磁気ディスク、ハードディ
スクなど、多様な記録媒体を利用でき、その記録媒体に
記録されたプログラム及びデータを必要に応じてコンピ
ュータシステム側に読み込み、そのプログラム及びデー
タに従った情報処理を実行することによりパターンマッ
チング手段の機能を実現できる。
【0022】請求項15に記載したように、上記パター
ンマッチング手段の機能の他に、音声認識装置における
前記信頼度推定手段の機能をコンピュータシステムにて
実現するためのプログラム及びデータを記録した記録媒
体を用意することもできる。この場合にも、多様な記録
媒体を利用でき、その記録媒体に記録されたプログラム
及びデータを必要に応じてコンピュータシステム側に読
み込み、そのプログラム及びデータに従った情報処理を
実行することによりパターンマッチング手段並びに信頼
度推定手段の機能を実現できる。
【0023】
【発明の実施の形態】(第1の実施の形態)以下、本発
明をカーナビゲーション装置に適用した第1実施例につ
いて図1ないし図4を参照しながら説明する。図4に
は、カーナビゲーション装置1を含む全体の電気的構成
が概略的に示されている。この図4において、カーナビ
ゲーション装置1は、位置検出器2、地図データ入力器
3、操作スイッチ群4、これらに接続されたマイクロコ
ンピュータを主体として成る制御回路5、この制御回路
5に接続された外部メモリ6、例えばフルカラー液晶デ
ィスプレイから成る表示装置7、リモコンセンサ8、対
話制御部9、音声合成部10、例えばアンプ内蔵型のス
ピーカ11を備えた構成となっている。
【0024】位置検出器2は、周知構成の地磁気センサ
12、ジャイロセンサ13、距離センサ14、及びGP
S衛星からの電波に基づいて車両の位置を検出するため
のGPS受信機15を有しており、これら各センサ12
〜15は、車両の適宜部所に設置される。前記制御回路
5は、位置検出器2の各センサ12〜15が性質の異な
る誤差を有しているため、各々補間しながら使用するよ
うに構成されており、これらセンサ12〜15からの入
力に基づいて、車両の現在位置、進行方向、速度や走行
距離などを高精度で検出する。
【0025】前記地図データ入力器3は、道路地図デー
タや、位置検出精度の向上のための所謂マップマッチン
グ用データなどを含む各種データを記憶した記憶媒体か
らデータを入力するためのドライブ装置から成り、その
記憶媒体としては、例えばCD−ROMやDVD−RO
Mなどの大容量記憶媒体が用いられる。尚、前記道路地
図データは、道路形状、道路幅、道路名、建造物、各種
施設、それらの電話番号、地名、地形などのデータを含
むと共に、その道路地図を前記表示装置7の表示画面上
に再生するためのデータを含んで構成されている。
【0026】前記操作スイッチ群4は、ユーザ(運転
者)が、目的地の指定や、表示装置7に表示される道路
地図の選択などの各種のコマンドを入力するための各種
のメカニカルスイッチから構成されている。また、この
操作スイッチ群4の一部は、前記表示装置7の画面上に
設けられたタッチスイッチ(図示せず)からも構成され
るようになっている。そして、操作スイッチ群4と同等
の機能を有するリモートコントロール端末16(以下、
リモコンと称する)も設けられており、このリモコン1
6からの操作信号が、前記リモコンセンサ8により検出
されるようになっている。
【0027】前記表示装置7の画面には、各種縮尺の道
路地図が表示されると共に、その表示に重ね合わせて、
車両の現在位置及び進行方向を示すポインタが表示され
るようになっている。また、ユーザが目的地などを入力
するための各種の入力用画面や、各種のメッセージやイ
ンフォメーションなども表示されるようになっている。
さらには、目的地までの案内を行うルートガイダンス機
能の実行時には、道路地図に重ね合わせて進むべき経路
などが表示されるようになっている。
【0028】そして、前記制御回路5は、地図データ入
力器3からの道路地図データに基づいて表示装置7に道
路地図を表示させると共に、位置検出器2の検出出力に
基づいて車両の現在位置及び進行方向を示すポインタを
表示させるようになっている。このとき、車両の現在位
置を道路地図上に表示するップマッチングが行われるよ
うになっている。また、ユーザのコマンド入力に基づい
て、表示装置7に表示させる地図の種類(縮尺)の切替
えなどを行うようになっている。
【0029】さらに、制御回路5は、ユーザによる目的
地の入力に基づいて、自動ルート探索及びルートガイダ
ンスの機能を実行するようになっている。詳しい説明は
省略するが、自動ルート探索の機能は、車両の現在位置
からユーザにより入力された目的地までの推奨する走行
経路を自動的に算出するものであり、ルートガイダンス
の機能は、上述のように、表示装置7の画面にその走行
経路を表示して目的地まで案内するものであり、このと
き、対話制御部9を通じて音声合成部10の音声合成機
能を制御することにより、例えば「200m先の交差点
を左です」といった音声をスピーカ11から出力させる
音声案内も併せて行うことができるようになっている。
【0030】上記対話制御部9には、マイクロホン17
を介して入力された音声信号を認識するための音声認識
装置18からの認識結果が与えられるようになってい
る。この音声認識装置18は、カーナビゲーション装置
1に対するコマンド(周知の行き先検索指示、リルート
指示、表示地図の縮尺変更指示など)の入力や目的地
(自宅、登録ポインドなど)の指示などを、前記操作ス
イッチ群4あるいはリモコン16の手動操作に代えて、
ユーザ(運転者)が前方を見たまま音声入力することに
よって同様に行い得るようにしたものであり、これによ
り、安全性、利便性を向上させるための装置として設け
られている。尚、図示しないが、マイクロホン17は、
車両の例えばステアリングコラムカバーの上面部や運転
席側のサンバイザーなどの運転者の音声を拾いやすい位
置に設けられるものである。
【0031】図1には、上記音声認識装置18の概略構
成が機能ブロックの組合わせにより示されており、以下
これについて説明する。図1において、音声認識装置1
8は、音響分析部19と、特徴抽出部20と、パターン
マッチング部21とを備えた構成となっている。尚、こ
れら音響分析部19、特徴抽出部20、パターンマッチ
ング部21は、それぞれ本発明でいう音響分析手段、特
徴抽出手段、パターンマッチング手段に相当する。
【0032】音響分析部19は、マイクロホン17を介
して入力されたアナログ音声信号を、例えば12kHz
程度のサンプリング周期でデジタル信号に変換し、その
変換信号をオーバーラップさせながら一定時間毎に順次
所定長さのフレーム信号として切り出す。そして、フレ
ーム毎のデジタル音声入力信号にフーリエ変換を行うこ
とによって、入力音声信号の音声スペクトルを求め、さ
らに、その音声スペクトルの振幅の2乗を計算して短時
間音声パワースペクトルを得る。そして、このように得
たパワースペクトルに対し逆フーリエ変換を施して自己
相関係数を求め、この自己相関係数を用いたLPC分析
を行ってLPC係数を計算するものであり、そのLPC
係数は特徴抽出部20へ順次送られる。
【0033】特徴抽出部20は、音響分析部19から送
られてきたLPC係数に基づいて、フレーム毎のスペク
トル上の特徴パラメータとしてのLPCケプストラム係
数を計算するものであり、このLPCケプストラム係数
はパターンマッチング部21へ順次送られる。
【0034】パターンマッチング部21は、辞書部に予
め計算して記憶しておいた認識対象語彙の標準パターン
(特徴パラメータ系列:本発明でいう比較対象パターン
に相当)と、特徴抽出部20から送られてきたLPCケ
プストラム係数の時系列データとの間でパターンマッチ
ング(類似度計算)を行う。この場合、音声認識のアル
ゴリズムとして周知のHMM(隠れマルコフモデル)な
どによって、時系列データをいくつかの区間に分け、各
区間が辞書データとして格納されているどの音声に類似
しているかを、例えば尤度比に基づいて求める。
【0035】ここで、パターンマッチング部21は、基
本的には、認識対象語彙のうち、上記のような計算によ
り得られた類似度が最も高い単語(または類似度が上位
の複数の単語)を認識結果として決定し、その認識結果
を対話制御部9へ出力する動作を行うものであるが、本
実施例では、認識対象語彙の標準パターン(比較対象パ
ターン)として以下に述べるような「認識対象候補集
団」を用意した構成に大きな特徴を有するものである。
【0036】即ち、上記認識対象候補集団としては、ボ
イスコマンドとしてカーナビゲーション装置1に与えら
れたときに、そのカーナビゲーション装置1の動作に機
能低下などの悪影響を及ぼす可能性や、カーナビゲーシ
ョン装置1がユーザ(話者)の意図と異なる状態で動作
する可能性がある特定の単語(つまり、非常に高い認識
率が要求される単語)と類似した音声群に対応した標準
パターンの集団を含んだものが用意され、また、必要に
応じて、上記特定単語と類似した音声群に対応した標準
パターンの集団に加えて、当該特定単語と反対の意味を
持つ第2の特定単語と類似した音声群に対応した標準パ
ターンの集団も含んだものが用意される。尚、ここでい
う「類似」とは「似ているが異なる」という意味であ
る。
【0037】要するに、上記特定単語としては、カーナ
ビゲーション装置1が当該特定単語に対応したボイスコ
マンドを受けたときに取り返しのつかない動作(例え
ば、ルート探索動作により設定された目的地までのルー
トの破棄を含む動作)を実行する単語が選定される。ま
た、上記第2の特定単語と類似した音声群に対応した標
準パターンの集団も含んだ認識対象候補集団が必要とな
る具体的な例としては、以下のような事例が考えられ
る。
【0038】即ち、カーナビゲーション装置1におい
て、目的地までの設定ルートの変更を伴うボイスコマン
ド(例えば、「リルート」、「自宅」、「家に帰る」、
「行き先変更」など)が入力された場合には、ユーザに
対して、設定ルートを変更する制御(つまり既設定ルー
トの破棄)を本当に行っても良いか否かを確認するため
に、ユーザによる音声入力を求める音声ガイダンスを発
するものであり、この音声ガイダンスに対して、ユーザ
ー側では「はい」/「いいえ」、「YES」/「NO」
などのような二者択一のボイスコマンドを返答すること
になる。この場合の「はい」あるいは「YES」が上記
特定単語に相当し、「いいえ」あるいは「NO」が上記
第2の特定単語に相当するものであり、このような二者
択一態様のボイスコマンドが入力される場合には、第2
の特定単語と類似した音声群に対応した標準パターンの
集団も含んだ状態の認識対象候補集団が必要になる。
【0039】そして、この場合において、パターンマッ
チング部21は、認識結果の候補中に認識対象候補集団
中の標準パターンに対応した音声が存在する場合に前記
第2の特定単語を認識結果として出力する構成となって
いる。
【0040】具体的には、例えば、特定単語が「YE
S」であった場合には、これと反対の意味を持つ「N
O」が第2の特定単語とされるものであり、前記認識対
象候補集団には、「YES」及び「NO」と類似した例
えば、/j//*//s/ 、/j//e//*/ 、/au/、/uu/、……(但
し、* は任意の母音あるいは子音が当てはまるという意
味)という音声群に対応した標準パターンを含めた状態
とされる。
【0041】従って、この例のように、「YES」とい
う特定単語について上記のような「NO」と類似した音
声群に対応した標準パターンの集団を含めた認識対象候
補集団が用意された場合には、パターンマッチング部2
1でのパターンマッチング時において、「YES」と反
対の意味の「NO」に多くの言い換えが用意された状態
と等価となって、ユーザによる入力音声信号が「YE
S」であると認識される特徴空間が図2(a)に示すよ
うに限定されることになる(○印が「YES」に対応し
た標準パターン、×印が「NO」に対応した標準パター
ン並びに認識対象候補集団中の各標準パターンに相
当)。その結果、入力音声信号が「YES」であるとの
確信が低い場合に、これと反対の意味を持つ「NO」を
認識結果として出力する確率が高くなり、これによりカ
ーナビゲーション装置1がユーザにとって不用意な動作
をする事態を効果的に防止可能となる。
【0042】因みに、従来構成では、ユーザによる入力
音声信号が「YES」であると認識される特徴空間が図
2(b)に示すように広くなるため、例えば、「YE
S」以外の音声を発生したときに「YES」と誤認識さ
れる率が高くなるものである。このような事象を確認す
るために、本件発明者は、図1に示す基本構成を有する
音声認識装置18において、実際に「YES」、「N
O」と発生したときに「YES」、「NO」の認識結果
がそれぞれ出力される率、並びに「YES」、「NO」
以外の音声を発生したときに「YES」の認識結果が出
力される率を、認識対象語彙の標準パターンとして前述
した認識対象候補集団を用意しない場合(従来構成に相
当)と用意した場合とについて実験により求めた。その
実験結果をまとめた図3に示すように、認識対象候補集
団を用意していない『対策前』の認識率と、当該認識対
象候補集団を用意した『対策後』の認識率との間には大
きな差が出ることが判明した。尚、図3中には、実験サ
ンプル数と該当出力数との関係も示した。要するに、こ
の図3からは、本実施例の構成によれば、「NO」の認
識率が向上すること、「YES」及び「NO」と無関係
の音声を「NO」と認識する確率が上がること、「YE
S」の認識率には影響しないことが分かる。
【0043】尚、ここでは、前記認識対象候補集団中
に、第2の特定単語(「NO」が一例)と類似した音声
群に対応した標準パターンの集団も含めた構成について
言及したが、これらの標準パターンの集団は、認識対象
候補集団中に必要に応じて含める構成とすれば良いもの
である(少なくとも、特定単語と類似した音声群に対応
した標準パターンの集団を認識対象候補集団中に含める
構成とすれば良い)。
【0044】以上要するに、上記した本実施例の構成に
よれば、カーナビゲーション装置1側において設定ルー
トを変更する制御を本当に行っても良いか否かを確認す
るために、ユーザによる音声入力を求める音声ガイダン
スを発する場面において、ユーザによる入力音声信号が
設定ルートの変更を許容する特定単語(実施例では「Y
ES」)であるとの確信が低い場合に、当該特定単語と
反対に意味を持つ第2の特定単語(実施例では「N
O」)を出力する確率が高くなり、これによりカーナビ
ゲーション装置1が、ユーザの意図に反した不用意な動
作をする事態を効果的に防止可能になるものである。
【0045】(第2の実施の形態)図5には本発明の第
2実施例が示されており、以下これについて前記第1実
施例と異なる部分のみ説明する。
【0046】この第2実施例では、前記第1実施例にお
けるパターンマッチング部21とは異なる処理動作を行
うパターンマッチング部21′(パターンマッチング手
段に相当)を設け、このパターンマッチング部21′で
のパターンマッチング動作に供するための認識対象語彙
の標準パターンに対応した辞書データとして、第1実施
例における認識対象候補集団を用意することなく、一般
的な辞書データを用意している。また、本実施例では、
音響分析部19、特徴抽出部20あるいはパターンマッ
チング部21′の少なくとも何れかにおいて得られる所
定の信頼度評価用特徴量に基づき、パターンマッチング
部21′による絶対的な信頼度を推定する信頼度推定手
段を設ける構成としている。
【0047】具体的には、例えば図5に示すように、音
声認識装置18中に信頼度推定手段として正解確率推定
部22が設けられる。この正解確率推定部22は、パタ
ーンマッチング部21′にて得られた認識結果の信頼度
を適切に評価可能な指標として、その認識結果の正解確
率を推定し、当該パターンマッチング部21′にフィー
ドバックする構成となっている。上記正解確率推定部2
2は、例えば、パターンマッチング部21′から「信頼
度評価用特徴量」として得られる単語と音節連接モデル
の尤度比や単語内の音節の継続時間の分散に基づいて認
識結果の正解確率の推定を行うもので、詳しくは、本発
明の出願人と同一人の出願に関わる特願平11−359
076号(発明の名称:音声認識装置及び記録媒体)に
記載された技術を使用する。
【0048】尚、ここでは、信頼度評価用特徴量をパタ
ーンマッチング部21から得る構成としたが、図5に破
線で示すように、音響分析部19や特徴抽出部20から
得るようにしても良い。その場合、音響分析部19から
得る「信頼度評価用特徴量」としては、音響分析自体の
成功度合いを示す特徴量が考えられ、例えばノイズ度合
いやLPC残差が挙げられる。また、特徴抽出部20に
て得られる「信頼度評価用特徴量」としてはケプストラ
ム係数が考えられる。
【0049】パターンマッチング部21′は、パターン
マッチング時において、認識結果の候補中に前記第1実
施例で述べたような特定単語(非常に高い認識率が要求
される単語)が含まれる場合に、その特定単語の認識結
果の信頼度を示す正確確率を正確確率推定部22から取
り込むと共に、その正確確率が所定レベル(このレベル
は実験的に求めることができる)以下であった場合に、
当該特定単語の認識信頼性が低いと判断し、その特定単
語を避けた他の単語を認識結果として出力する構成とな
っている。
【0050】要するに、パターンマッチング部21′
は、辞書部に予め計算して記憶しておいた認識対象語彙
の標準パターンと、特徴抽出部20から送られてきたL
PCケプストラム係数の時系列データとの間でのパター
ンマッチング時において、認識結果の候補となった単語
の認識信頼性が絶対的に低く、且つその候補単語が特定
の単語(カーナビゲーション装置1の動作に機能低下な
どの悪影響を及ぼしたり、カーナビゲーション装置1が
設定内容の不用意に変更などユーザの意図と異なる状態
で動作する可能性がある単語)であった場合に、その特
定単語を避けた単語を出力する動作を行うものである。
【0051】この結果、本実施例によれば、入力音声
が、カーナビゲーション装置1の動作不都合状態(機能
低下や設定内容の変更)を招く可能性がある特定の単語
として誤認識される可能性が低くなるから、カーナビゲ
ーション装置1が不用意な動作をする事態を未然に防止
できるようになる。また、この場合には、パターンマッ
チング部21′での認識結果の絶対的な信頼度を、その
認識結果が正解である確率に基づいて推定する構成とな
っているから、その認識結果の信頼度を直観的且つ定量
的に把握できるようになり、当該認識結果を利用するア
プリケーションを実際に構築する際に便利になる。
【0052】尚、本実施例において、認識結果の絶対的
な信頼度を推定する正確確率推定部22は以下のような
事情に対処して設けられるものである。即ち、パターン
マッチングにより得られる尤度(確からしさ)は、標準
パターン(比較対象パターン)との一致度合いを示すも
のであって、あくまでも相対的なものである。つまり、
パターンマッチング時において尤度が一番大きなものを
認識結果として選択したとしても、それは相対的に一致
度合いが高いだけであり、実際の入力音声信号に対し
て、その認識結果がどの程度正しいかという判断に関し
ては適切な評価ができない。このような事情に対処する
ために、本実施例では、パターンマッチング手段21′
での認識結果を絶対的な観点で評価可能な「信頼度」と
いう指標を、音響分析部19、特徴抽出部20あるいは
パターンマッチング部21′の少なくとも何れかにおい
て得られる所定の「信頼度評価用特徴量」に基づいて推
定するようにしたものである。
【0053】(その他の実施の形態)尚、本発明は上記
した各実施例に限定されるものではなく、次のような変
形または拡張が可能である。第1実施例におけるパター
ンマッチング部21の機能をコンピュータシステムにて
実現するために必要な処理プログラム並びに認識対象語
彙の標準パターンや認識対象候補集団などのデータを記
録した記録媒体を、CD−ROM、DVD−ROM、不
揮発性メモリ(EEPROMなど)、フロッピーディス
ク、光磁気ディスク、ハードディスクなど、多様な記録
媒体を利用して提供することができる。さらに、第2実
施例におけるパターンマッチング部21′及び正解確率
推定部22の機能をコンピュータシステムにて実現する
ために必要な処理プログラム並びに認識対象語彙の標準
パターンやその他の必要なデータを記録した記録媒体も
同様に提供することもできる。第2実施例では、パター
ンマッチング部21′による認識結果の絶対的な信頼度
を推定する信頼度推定手段として正解確率推定部22を
用いる構成としたが、これ以外の手段を採用することも
可能である。さらに、動作制御対象の外部機器として、
個人が携帯するモバイル型ナビゲーション装置、あるい
はその他の一般的な機器を選定することができる。
【図面の簡単な説明】
【図1】本発明の第1実施例を示す音声認識装置の概略
的な機能ブロック図
【図2】音声信号を認識をする特徴空間の例を模式的に
示す図
【図3】実験結果を示す図
【図4】全体の電気的構成を概略的に示す機能ブロック
【図5】本発明の第2実施例を示す図1相当図
【符号の説明】
1はカーナビゲーション装置、9は対話制御部、17は
マイクロホン、18は音声認識装置、19は音響分析部
(音響分析手段)、20は特徴抽出部(特徴抽出手
段)、21、21′はパターンマッチング部(パターン
マッチング手段)、22は正解確率推定部(信頼度推定
手段)を示す。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/06 G10L 3/00 521V 15/00 551Q Fターム(参考) 2F029 AA02 AB01 AB05 AB13 AC02 AC09 AC18 AC20 5D015 AA03 BB01 HH13 HH16 KK02 LL02 5D045 AB21 5H180 AA01 BB13 CC12 CC27 FF04 FF05 FF22 FF25 FF33 FF38

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 話者により入力された音声信号を音響分
    析する音響分析手段と、 この音響分析手段での分析結果に基づいて入力音声信号
    の特徴パラメータを抽出する特徴抽出手段と、 この特徴抽出手段で抽出された特徴パラメータと予め記
    憶されている認識対象語彙の比較対象パターンとのパタ
    ーンマッチングを行って一致度合いが高い単語を認識結
    果として出力するパターンマッチング手段とを備え、 前記パターンマッチング手段による認識結果を外部機器
    の動作制御に供する音声認識装置において、 前記パターンマッチング手段は、前記パターンマッチン
    グ時に、認識結果の候補となった単語の認識信頼性が低
    く、且つその候補単語が前記外部機器の動作に悪影響を
    及ぼす可能性がある特定の単語であった場合には、その
    特定単語を避けた単語を出力する構成とされることを特
    徴とする音声認識装置。
  2. 【請求項2】 請求項1記載の音声認識装置において 前記パターンマッチング手段は、前記認識信頼性が低い
    状態の候補単語が前記外部機器の機能低下を招く可能性
    がある特定の単語であった場合には、その特定単語を避
    けた単語を出力することを特徴とする音声認識装置。
  3. 【請求項3】 話者により入力された音声信号を音響分
    析する音響分析手段と、 この音響分析手段での分析結果に基づいて入力音声信号
    の特徴パラメータを抽出する特徴抽出手段と、 この特徴抽出手段で抽出された特徴パラメータと予め記
    憶されている認識対象語彙の比較対象パターンとのパタ
    ーンマッチングを行って一致度合いが高い単語を認識結
    果として出力するパターンマッチング手段とを備え、 前記パターンマッチング手段による認識結果を外部機器
    の動作制御に供する音声認識装置において、 前記パターンマッチング手段は、前記パターンマッチン
    グ時に、認識結果の候補となった単語の認識信頼性が低
    く、且つその候補単語が前記外部機器を話者の意図と異
    なる状態で動作させる可能性がある特定の単語であった
    場合には、その特定単語を避けた単語を出力する構成と
    されることを特徴とする音声認識装置。
  4. 【請求項4】 請求項3記載の音声認識装置において 前記パターンマッチング手段は、前記認識信頼性が低い
    状態の候補単語が前記外部機器の設定内容の変更を招く
    可能性がある特定の単語であった場合には、その特定単
    語を避けた単語を出力することを特徴とする音声認識装
    置。
  5. 【請求項5】 前記音響分析手段、特徴抽出手段あるい
    はパターンマッチング手段の少なくとも何れかにおいて
    得られる所定の信頼度評価用特徴量に基づき、前記パタ
    ーンマッチング手段による認識結果の絶対的な信頼度を
    推定する信頼度推定手段を備え、 前記パターンマッチング手段は、前記パターンマッチン
    グ時において前記特定単語の認識結果の信頼度を前記信
    頼度推定手段から取り込むと共に、その信頼度が所定レ
    ベル以下であった場合に、その特定単語の認識信頼性が
    低いと判断することを特徴とする請求項1ないし4の何
    れかに記載の音声認識装置。
  6. 【請求項6】 請求項5記載の音声認識装置において、 前記信頼度推定手段は、前記絶対的な信頼度を、前記パ
    ターンマッチング手段による認識結果が正解である確率
    に基づいて推定することを特徴とする音声認識装置。
  7. 【請求項7】 話者により入力された音声信号を音響分
    析する音響分析手段と、 この音響分析手段での分析結果に基づいて入力音声信号
    の特徴パラメータを抽出する特徴抽出手段と、 この特徴抽出手段で抽出された特徴パラメータと予め記
    憶されている認識対象語彙の比較対象パターンとのパタ
    ーンマッチングを行って一致度合いが高い単語を認識結
    果として出力するパターンマッチング手段とを備え、 前記パターンマッチング手段による認識結果を外部機器
    の動作制御に供する音声認識装置において、 前記認識対象語彙の比較対象パターンとして、前記外部
    機器の動作に悪影響を及ぼす可能性がある特定の単語に
    対応した比較対象パターンの他に、その特定単語と類似
    した音声群に対応した比較対象パターンの集団が認識対
    象候補集団として用意され、 前記パターンマッチング手段は、前記パターンマッチン
    グ時において、前記特徴抽出手段で抽出された特徴パラ
    メータとの一致度合いが高い比較対象パターンが前記認
    識対象候補集団中に存在する場合に、前記特定単語を避
    けた単語を出力することを特徴とする音声認識装置。
  8. 【請求項8】 請求項7記載の音声認識装置において前
    記認識対象候補集団として、前記外部機器の機能低下を
    招く特定の単語と類似した音声群に対応した比較対象パ
    ターンの集団が用意されることを特徴とする音声認識装
    置。
  9. 【請求項9】 話者により入力された音声信号を音響分
    析する音響分析手段と、 この音響分析手段での分析結果に基づいて入力音声信号
    の特徴パラメータを抽出する特徴抽出手段と、 この特徴抽出手段で抽出された特徴パラメータと予め記
    憶されている認識対象語彙の比較対象パターンとのパタ
    ーンマッチングを行って一致度合いが高い単語を認識結
    果として出力するパターンマッチング手段とを備え、 前記パターンマッチング手段による認識結果を外部機器
    の動作制御に供する音声認識装置において、 前記認識対象語彙の比較対象パターンとして、前記外部
    機器を話者の意図と異なる状態で動作させる可能性があ
    る特定の単語に対応した比較対象パターンの他に、その
    特定単語と類似した音声群に対応した比較対象パターン
    の集団が認識対象候補集団として用意され、 前記パターンマッチング手段は、前記パターンマッチン
    グ時において、前記特徴抽出手段で抽出された特徴パラ
    メータとの一致度合いが高い比較対象パターンが前記認
    識対象候補集団中に存在する場合に、前記特定単語を避
    けた単語を出力することを特徴とする音声認識装置。
  10. 【請求項10】 請求項9記載の音声認識装置において
    前記認識対象候補集団として、前記外部機器の設定内容
    の変更を招く可能性がある特定の単語と類似した音声群
    に対応した比較対象パターンの集団が用意されることを
    特徴とする音声認識装置。
  11. 【請求項11】 前記認識対象語彙の比較対象パターン
    として、前記特定単語及び当該特定単語と反対の意味を
    持つ第2の特定単語にそれぞれ対応した比較対象パター
    ンの他に、上記特定単語と類似した音声群及び上記第2
    の特定単語と類似した音声群にそれぞれ対応した比較対
    象パターンの集団が認識対象候補集団として用意され、 前記パターンマッチング手段は、前記パターンマッチン
    グ時に、前記特徴抽出手段で抽出された特徴パラメータ
    との一致度合いが高い比較対象パターンが前記認識対象
    候補集団中に存在する場合に、前記第2の特定単語を認
    識結果として出力することを特徴とする請求項7ないし
    10の何れかに記載の音声認識装置。
  12. 【請求項12】 前記パターンマッチング手段は、前記
    特定単語を避けた認識結果を出力する動作を、前記外部
    機器における所定の動作制御を許容するか否かの確認の
    ために話者による音声入力を求める場面で行うように構
    成されていることを特徴とする請求項1ないし11の何
    れかに記載の音声認識装置。
  13. 【請求項13】 前記パターンマッチング手段による認
    識結果により動作制御される外部機器はナビゲーション
    装置であることを特徴とする請求項1ないし12の何れ
    かに記載の音声認識装置。
  14. 【請求項14】 請求項1ないし13の何れかに記載さ
    れた音声認識装置におけるパターンマッチング手段の機
    能をコンピュータシステムにおいて実現するためのプロ
    グラム及びデータを記録した記録媒体。
  15. 【請求項15】 請求項1ないし13の何れかに記載さ
    れた音声認識装置におけるパターンマッチング手段の機
    能並びに請求項5または6に記載された音声認識装置に
    おける信頼度推定手段の機能をコンピュータシステムに
    おいて実現するためのプログラム及びデータを記録した
    記録媒体。
JP2000220564A 2000-07-21 2000-07-21 音声認識装置及び記録媒体 Expired - Fee Related JP3567864B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2000220564A JP3567864B2 (ja) 2000-07-21 2000-07-21 音声認識装置及び記録媒体
DE10134908A DE10134908B4 (de) 2000-07-21 2001-07-18 Spracherkennungsvorrichtung und Verfahren, welche zwei gegenteilige Wörter verwenden
US09/907,594 US6937982B2 (en) 2000-07-21 2001-07-19 Speech recognition apparatus and method using two opposite words

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000220564A JP3567864B2 (ja) 2000-07-21 2000-07-21 音声認識装置及び記録媒体

Publications (2)

Publication Number Publication Date
JP2002041085A true JP2002041085A (ja) 2002-02-08
JP3567864B2 JP3567864B2 (ja) 2004-09-22

Family

ID=18715149

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000220564A Expired - Fee Related JP3567864B2 (ja) 2000-07-21 2000-07-21 音声認識装置及び記録媒体

Country Status (3)

Country Link
US (1) US6937982B2 (ja)
JP (1) JP3567864B2 (ja)
DE (1) DE10134908B4 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006106761A (ja) * 2004-10-08 2006-04-20 Samsung Electronics Co Ltd 多段階音声認識装置及び多段階音声認識方法
JP2009251019A (ja) * 2008-04-01 2009-10-29 Toyota Motor Corp 音声認識装置

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2440463C (en) * 2001-04-19 2010-02-02 Simon Nicholas Downey Speech recognition
EP1505571A4 (en) * 2002-04-12 2007-02-21 Mitsubishi Electric Corp AUTONAVIGATION SYSTEM AND VOICE RECOGNITION DEVICE FOR THIS
US7398209B2 (en) 2002-06-03 2008-07-08 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
JP4363076B2 (ja) * 2002-06-28 2009-11-11 株式会社デンソー 音声制御装置
US7693720B2 (en) 2002-07-15 2010-04-06 Voicebox Technologies, Inc. Mobile systems and methods for responding to natural language speech utterance
US7640160B2 (en) 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7620549B2 (en) 2005-08-10 2009-11-17 Voicebox Technologies, Inc. System and method of supporting adaptive misrecognition in conversational speech
US7949529B2 (en) 2005-08-29 2011-05-24 Voicebox Technologies, Inc. Mobile systems and methods of supporting natural language human-machine interactions
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
US7818176B2 (en) 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
JP4225356B2 (ja) * 2007-04-09 2009-02-18 トヨタ自動車株式会社 車両用ナビゲーション装置
US9423996B2 (en) * 2007-05-03 2016-08-23 Ian Cummings Vehicle navigation user interface customization methods
US8140335B2 (en) 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US8589161B2 (en) 2008-05-27 2013-11-19 Voicebox Technologies, Inc. System and method for an integrated, multi-modal, multi-device natural language voice services environment
US9305548B2 (en) 2008-05-27 2016-04-05 Voicebox Technologies Corporation System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8326637B2 (en) 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
US9171541B2 (en) 2009-11-10 2015-10-27 Voicebox Technologies Corporation System and method for hybrid processing in a natural language voice services environment
US8914287B2 (en) * 2010-12-31 2014-12-16 Echostar Technologies L.L.C. Remote control audio link
US9341492B2 (en) * 2011-11-10 2016-05-17 Mitsubishi Electric Corporation Navigation device, navigation method, and navigation program
WO2013069172A1 (ja) * 2011-11-10 2013-05-16 三菱電機株式会社 ナビゲーション装置および方法
US9898459B2 (en) 2014-09-16 2018-02-20 Voicebox Technologies Corporation Integration of domain information into state transitions of a finite state transducer for natural language processing
CN107003996A (zh) 2014-09-16 2017-08-01 声钰科技 语音商务
WO2016061309A1 (en) 2014-10-15 2016-04-21 Voicebox Technologies Corporation System and method for providing follow-up responses to prior natural language inputs of a user
CN104316073B (zh) * 2014-11-12 2017-06-16 沈阳美行科技有限公司 一种用户自定义引导方位的方法
US10431214B2 (en) 2014-11-26 2019-10-01 Voicebox Technologies Corporation System and method of determining a domain and/or an action related to a natural language input
US10614799B2 (en) 2014-11-26 2020-04-07 Voicebox Technologies Corporation System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance
WO2018023106A1 (en) 2016-07-29 2018-02-01 Erik SWART System and method of disambiguating natural language processing requests
CN109215679A (zh) * 2018-08-06 2019-01-15 百度在线网络技术(北京)有限公司 基于用户情绪的对话方法和装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01116700A (ja) 1987-10-30 1989-05-09 Fujitsu Ltd 音声認識制御方式
JPH03248199A (ja) 1990-02-26 1991-11-06 Ricoh Co Ltd 音声認識方式
US5305244B2 (en) * 1992-04-06 1997-09-23 Computer Products & Services I Hands-free user-supported portable computer
US5566272A (en) * 1993-10-27 1996-10-15 Lucent Technologies Inc. Automatic speech recognition (ASR) processing using confidence measures
JP3384165B2 (ja) 1995-02-01 2003-03-10 トヨタ自動車株式会社 音声認識装置
JPH09244691A (ja) * 1996-03-07 1997-09-19 Nippon Telegr & Teleph Corp <Ntt> 入力音声リジェクト方法およびこの方法を実施する装置
US5950160A (en) * 1996-10-31 1999-09-07 Microsoft Corporation Method and system for displaying a variable number of alternative words during speech recognition
DE19646634A1 (de) * 1996-11-12 1998-05-14 Bosch Gmbh Robert Verfahren zur Befehlseingabe mit Sprache
GB9701866D0 (en) * 1997-01-30 1997-03-19 British Telecomm Information retrieval
JPH11337365A (ja) 1998-05-29 1999-12-10 Clarion Co Ltd ナビゲーションシステム及び方法並びにナビゲーション用ソフトウェアを記録した記録媒体
US6192337B1 (en) * 1998-08-14 2001-02-20 International Business Machines Corporation Apparatus and methods for rejecting confusible words during training associated with a speech recognition system
JP2000069348A (ja) * 1998-08-20 2000-03-03 Canon Inc 撮像装置
DE19939705A1 (de) * 1999-08-18 2001-03-08 Deutsche Telekom Ag Vorrichtung zur Spracherkennung
JP2001222291A (ja) 2000-02-08 2001-08-17 Kenwood Corp 音声認識装置を用いた制御装置
JP2002021121A (ja) 2000-07-07 2002-01-23 Shin Caterpillar Mitsubishi Ltd 建設機械における操作レバー割り当て方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006106761A (ja) * 2004-10-08 2006-04-20 Samsung Electronics Co Ltd 多段階音声認識装置及び多段階音声認識方法
US8370159B2 (en) 2004-10-08 2013-02-05 Samsung Electronics Co., Ltd. Multi-layered speech recognition apparatus and method
US8380517B2 (en) 2004-10-08 2013-02-19 Samsung Electronics Co., Ltd. Multi-layered speech recognition apparatus and method
US8892425B2 (en) 2004-10-08 2014-11-18 Samsung Electronics Co., Ltd. Multi-layered speech recognition apparatus and method
JP2009251019A (ja) * 2008-04-01 2009-10-29 Toyota Motor Corp 音声認識装置

Also Published As

Publication number Publication date
US20020010579A1 (en) 2002-01-24
DE10134908A1 (de) 2002-04-25
JP3567864B2 (ja) 2004-09-22
US6937982B2 (en) 2005-08-30
DE10134908B4 (de) 2013-05-08

Similar Documents

Publication Publication Date Title
JP2002041085A (ja) 音声認識装置及び記録媒体
US10446155B2 (en) Voice recognition device
JP4304952B2 (ja) 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム
US8005673B2 (en) Voice recognition device, voice recognition method, and voice recognition program
JP4859982B2 (ja) 音声認識装置
US9123327B2 (en) Voice recognition apparatus for recognizing a command portion and a data portion of a voice input
JP5677650B2 (ja) 音声認識装置
JP4466379B2 (ja) 車載音声認識装置
JP2002091466A (ja) 音声認識装置
CN108352167B (zh) 包括可佩戴设备的车辆语音识别
JP4770374B2 (ja) 音声認識装置
JP5772214B2 (ja) 音声認識装置
US20110218809A1 (en) Voice synthesis device, navigation device having the same, and method for synthesizing voice message
JP3700533B2 (ja) 音声認識装置及び処理システム
JP4938719B2 (ja) 車載情報システム
KR100677711B1 (ko) 음성 인식 장치, 기억 매체 및 네비게이션 장치
JP2006039954A (ja) データベース検索装置、プログラム及びナビゲーション装置
JPH09114487A (ja) 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車
JP2006084664A (ja) 音声認識装置および音声認識プログラム
JP4093394B2 (ja) 音声認識装置
JP2005283646A (ja) 音声認識率推定装置
JP2001005480A (ja) ユーザー発音判定装置及び記録媒体
JPH0854894A (ja) 音声処理装置
JPH10133683A (ja) 音声認識・合成方法及び音声認識・合成装置
JPH09113287A (ja) 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20031209

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040318

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040525

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040607

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100625

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110625

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110625

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120625

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120625

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130625

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140625

Year of fee payment: 10

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees