JPH11231894A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH11231894A
JPH11231894A JP10035818A JP3581898A JPH11231894A JP H11231894 A JPH11231894 A JP H11231894A JP 10035818 A JP10035818 A JP 10035818A JP 3581898 A JP3581898 A JP 3581898A JP H11231894 A JPH11231894 A JP H11231894A
Authority
JP
Japan
Prior art keywords
data
voice
recognition
input
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10035818A
Other languages
English (en)
Inventor
Isamu Tateno
勇 立野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP10035818A priority Critical patent/JPH11231894A/ja
Publication of JPH11231894A publication Critical patent/JPH11231894A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Traffic Control Systems (AREA)

Abstract

(57)【要約】 【課題】 階層構造データを音声認識する際に、非上位
階層データが入力された場合であっても階層構造データ
を確実に素早く認識できるようにする。 【解決手段】 使用者が階層構造データの中間階層デー
タ及び下位階層データを音声入力したときは(S13:
YES)、音声入力した中間階層データ及び下位階層デ
ータを保持すると共に、上位階層データを入力するよう
に音声案内する(S15)。これにより、使用者は上位
階層データを音声入力するようになるので、音声入力さ
れた上位階層データと記憶している中間階層データ及び
下位階層データとから階層構造データを確定し、該当す
る地図画面することができる(S7)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力音声と予め辞
書手段に記憶されている複数の比較対象パターン候補と
を比較して類似度の高いものを認識結果として出力する
ような音声認識装置に関する。
【0002】
【従来の技術】従来より、入力音声から判読されたデー
タを予め記憶してある標準パターンと比較し、その類似
度が最大となる標準パターンを認識結果とする音声認識
装置が実用化されている。
【0003】
【発明が解決しようとする課題】このような音声認識装
置において、地名のように認識対象が例えば上位階層デ
ータ、中間階層データ、下位階層データのような階層構
造データとなっているものを、一括入力できる構成が考
えられる。
【0004】しかしながら、階層構造データを一括入力
できる反面、使用者にとってはかえって使い勝手が悪化
する場合がある。例えば、ナビゲーションシステムにお
いて、都道府県名(上位階層データ)、市区郡町村名
(中間階層データ)、町域名(大字、小字、番地等)
(下位階層データ)の各階層データを一括入力すること
になるが、使用者は上位階層データから下位階層データ
に順序立てて入力せざるを得ず、中間階層データからの
入力が不可能である。例えば、「府中市」と言って音声
入力した場合、上位階層データの都道府県名が「東京
都」なのか、「広島県」なのかを確定することができな
い。また、「府中」とだけ音声入力した場合、「府中」
の属性を確定することができず、住所データ(府中市)
なのか、施設データ(府中競馬場)なのかが不明のた
め、「府中」を確実に判別することができない。
【0005】また、ナビゲーションシステム以外のシス
テムにおいても、音声認識装置の認識対象とする階層構
造データにおける上位階層データを省略した方が自然な
場合、或いは上位階層データを忘れてしまったり、知ら
ない場合においては中間階層データからの音声入力でも
判別できることが望ましい。
【0006】本発明は上記事情に鑑みてなされたもの
で、その目的は、階層構造データを音声認識する際に、
途中の階層データ(非上位階層データ)が入力された場
合であっても階層構造データを確実に認識することが可
能となる音声認識装置を提供することにある。
【0007】
【課題を解決するための手段】請求項1の発明によれ
ば、使用者が音声入力すると、音声入力手段は、入力音
声を音声信号に変換する。そして、認識手段は、音声入
力手段からの音声信号を、予め辞書手段に記憶されてい
る複数の比較対象パターン候補と比較して類似度の高い
ものを認識結果とする。
【0008】ここで、音声案内手段は、認識手段による
認識結果が複数の語を階層的につなぎ合わせた階層構造
データにおける非上位階層データ、即ち中間階層デー
タ、下位階層データなどであったときは上位階層データ
を確定するための問い掛けを音声案内する。これによ
り、認識手段は、音声案内手段による音声案内に応じて
入力された音声データに基づいて上位階層データを確実
に音声認識することができる。
【0009】請求項2の発明によれば、使用者が非上位
階層データを音声入力すると、属性確定手段は、認識手
段による認識結果に基づいて音声データの属性を確定す
る。そして、音声案内手段は、属性確定手段が確定した
属性の上位階層データを入力することを問い掛ける。
【0010】つまり、音声認識した非上位階層データが
例えば「府中市」であるときは、「府中市」は地名デー
タに属し、その上位階層データは都道府県であることか
ら、「都道府県名を入力して下さい」と音声案内する。
これにより、使用者が「東京都」と音声入力したとき
は、「東京都 府中市」と確定することができる。
【0011】請求項3の発明によれば、認識手段が音声
入力された非上位階層データを認識できたときは、上位
階層候補検索手段は、非上位階層データに基づいて上位
階層候補を検索する。そして、音声案内手段は、上位階
層候補検索手段が検索した上位階層データを順に問い掛
ける。
【0012】つまり、音声認識した非上位階層データが
例えば「府中市」であるときは、「府中市」の上位階層
データは「東京都」と「広島県」と検索することができ
るので、「東京都ですか」、「広島県ですか」と順に問
い掛ける。これにより、使用者が「東京都ですか」とい
う問い掛けに対して、「はい」と返答したときは、「東
京都 府中市」と確定することができる。
【0013】
【発明の実施の形態】(第1の実施の形態)以下、本発
明をカーナビゲーションに適用した第1の実施の形態を
図面を参照して説明する。図1は本発明の概略構成を示
すブロック図である。この図1において、カーナビゲー
ションシステム1は、位置検出器2、地図データ入力器
3、操作スイッチ群4、これらに接続された制御回路
5、この制御回路5に接続された外部メモリ6、表示装
置7、リモコンセンサ8及び音声認識装置9を備えて構
成されている。制御回路5はマイクロコンピュータを主
体として構成されており、内部には、周知のCPU、R
OM、RAM、I/O及びこれらの構成を接続するバス
ライン(何れも図示せず)が備えられている。
【0014】位置検出器2は、周知構成の地磁気センサ
10、ジャイロスコープ11、距離センサ12、及び衛
星からの電波に基づいて車両の位置を検出するGPS
(Global Positioning System )のためのGPS受信機
13を有している。制御回路5は、位置検出器2の各セ
ンサが性質の異なる誤差を有しているため、各々補間し
ながら使用するように構成されている。
【0015】地図データ入力器3は、位置検出の精度向
上のための所謂マップマッチング用データ、地図データ
及び目印データを含む各種データを入力するための装置
である。そのための媒体としては、CD−ROMを用い
るのが一般的であるが、メモリカードなどの他の媒体を
用いるようにしてもよい。
【0016】表示装置7はカラー表示機能を備えてお
り、その画面には、位置検出器2から入力された車両現
在位置マークと、地図データ入力器3より入力された地
図データと、さらに地図上に表示する誘導経路や後述す
る設定地点の目印などの付加データとを重ねて表示する
ようになっている。
【0017】また、カーナビゲーションシステム1は、
リモートコントロール端末14(以下、リモコンと称す
る)に対する操作によりリモコンセンサ8から、或いは
操作スイッチ群4により目的地の位置を入力すると、現
在位置からその目的地までの最適な経路を自動的に選択
して誘導経路を形成して表示する所謂経路案内機能も備
えている。このような自動的に最適な経路を設定する手
法は、ダイクストラ法などの手法が知られている。操作
スイッチ群4は、例えば、表示装置7と一体になったタ
ッチスイッチ若しくはメカニカルスイッチなどが用いら
れ、各種入力に使用される。
【0018】そして、音声認識装置9は、上記操作スイ
ッチ群4或いはリモコン14が手動操作により目的地な
どを指示するために用いられるのに対して、使用者が音
声で入力することによっても同様に目的地などを指示す
ることができるようにするための装置として設けられて
いる。
【0019】この音声認識装置9は、対話制御部15
(音声案内手段、属性確定手段、上位階層候補検索手段
に相当)、音声合成部16、音声認識部17(認識手
段、辞書手段に相当)、音声入力部18、マイク19
(音声入力手段に相当)、PTT(Push-To-Talk)スイ
ッチ20、スピーカ21を備えて構成されている。
【0020】音声認識部17は、音声入力部18から入
力された音声データ(入力音声)を、対話制御部15か
らの指示により入力音声の認識処理を行い、その認識結
果を対話制御部15に返す。即ち、音声入力部18から
取得した音声データに対し、記憶している辞書データを
用いて照合を行い、複数の比較対象パターン候補と比較
して類似度の高い上位比較対象パターンを対話制御部1
5へ出力する。入力音声中の単語系列の認識は、音声入
力部18から入力された音声データを順次音響分析して
音響特徴量(例えばケプストラム)を抽出し、この音響
分析によって得られた音響的特徴量時系列データを得
る。そして、周知のDPマッチング法によって、この時
系列データをいくつかの区間に分け、各区間が辞書デー
タとして格納されたどの単語に対応しているかを求め
る。
【0021】また、音声入力部18は、マイク19にて
取り込んだ周囲の音声をデジタルデータに変換して音声
認識部17に出力するものである。本実施の形態におい
ては、使用者がPTTスイッチ20を押しながらマイク
19を介して音声を入力するようになっている。具体的
には、音声入力部18は、PTTスイッチ20が押され
たかどうかを判断しており、PTTスイッチ20が押さ
れていない場合には、その音声入力処理を実行しないよ
うにしている。従って、PTTスイッチ20が押されて
いる間にマイク19を介して入力された音声データのみ
が音声認識部17へ出力されることになる。
【0022】ここで、音声認識部17と対話制御部15
について説明する。図2は、音声認識部17及び対話制
御部15の詳細構成を示したものである。まず、図2に
示す構成では、音声認識部17が照合部22と辞書部2
3とで構成されており、対話制御部15が記憶部24、
入力部25、後処理部26及び辞書制御部27で構成さ
れている。音声認識部17においては、照合部22が、
音声入力部18から取得した音声データに対し、辞書部
23内に記憶されている辞書データを用いて照合を行う
のであるが、その照合部における照合処理に先立って、
対話制御部15の辞書制御部27が辞書に記憶されてい
る辞書データの制御を行う。具体的には、記憶部24に
記憶されている参照データを参照して省略可能な上位階
層リストを作成し、その省略可能な上位階層部分を辞書
部23内に記憶されている辞書データから一時的に省略
する。このように辞書制御がなされた辞書データを用い
て照合部22が照合処理を実行するものである。
【0023】そして、照合部22にて複数の比較対象パ
ターン候補と比較されて類似度が高いとされた上位比較
対象パターンは、対話制御部15の記憶部へ出力される
こととなる。
【0024】ところで、本実施の形態の辞書部23に記
憶されている辞書データは、比較対象パターン候補とな
る語彙そのもののデータだけでなく、その比較対処パタ
ーンとなる語彙が複数の語を階層的につなぎ合わせたも
のである場合には、その階層構造を示すデータも記憶さ
れている。具体的には、語彙を構成する音節データが図
3に示すように木(tree)構造の各辺(図3において矢印
(→)で示す)に割り付けられている。尚、図3におい
て、一重丸(○)は頂点を表し、二重丸(◎)は受理頂
点、即ち単語に対する頂点を表す。
【0025】この場合、図3に示す例では、矢印Aで示
す頂点が「根」となり、そこから先行順走査(preoder t
raversal) にしたがって各辺に割り付けられた音節を辿
ることで単語が完成する。ここで、先行順走査とは、根
を訪問し、次に子を根とする部分木を順番に走査(この
走査も先行順走査である)していくことを指す。尚、こ
こで、「親」とは直前の頂点、「子」とは次の頂点を意
味する。
【0026】つまり、図3に示す具体例では、「根」と
なる頂点(矢印Aで示す)から順に辿ると、「とうきょ
うと」となって矢印Bで示す受理頂点となる。従って、
「とうきょうと(東京都)」で一つの認識対象単語とな
る。そして、さらにその矢印Bで示す受理頂点を経由し
て「ふちゅうし」となって矢印Cで示す受理頂点とな
る。従って、「とうきょうとふちゅうし(東京都府中
市)」でも一つの認識対象単語となる。さらに矢印Cで
示す受理頂点を経由して「子」の頂点がある。図3では
図示しないが「***ちょう」と辿ったところに受理頂
点があるため、「とうきょうとふちゅうし***ちょう
(東京都府中市***町)でも一つの認識対象単語であ
る。さらに、受理頂点を経由して「孫」となって受理頂
点となり、その孫により町域名(大字、小字、番地名)
が認識される。
【0027】この場合には、例えば「とうきょうとふち
ゅうし***ちょう***ばんち(東京都府中市***
町***番地)」という一つの認識対象単語は、「とう
きょうと(東京都)」と「ふちゅうし(府中市)」と
「***ちょう(***町)」と「***ばんち(番
地)」という4つの語が階層的につなぎ合わせたもので
ある。従って、このように4階層となっているというこ
とが図3に矢印B,Cで示す受理頂点の存在によって分
る。本実施の形態では、図4に示すように都道府県名を
示す語が上位階層、市区郡町村名を示す語が中間階層、
町域名を示す語が下位階層に設定されている。この場
合、中間階層にあっては、「府中市」だけでは中間階層
を確定することができず、「府中市***町」で中間階
層を確定できることになる。
【0028】以上は辞書部23に記憶されている辞書デ
ータの説明として、東京都府中市***町***番地と
いう具体例で示したが、基本的には都道府県を上位階層
とし、市区群町村レベルを中間階層、町域(字、番地)
レベルを下位階層として他の地名についてもデータが設
定されている。
【0029】上述したように、音声認識部17において
は、照合部22が、音声入力部18から取得した音声デ
ータに対し、辞書部23内に記憶されている複数の比較
対象パターン候補と比較して類似度の高い上位比較対象
パターンを対話制御部15の記憶部24へ出力する。そ
して、記憶部24では、この上位比較対象パターンを記
憶しておく。また、入力部25は制御回路5からの外部
状況を入力するのであるが、その入力した外部状況も記
憶部24に記憶される。この場合の外部状況とは、上述
した位置検出器2によって検出した位置に基づく現在値
のデータである。尚、この記憶部24に記憶された上位
比較対象パターンや入力した外部状況である現在データ
などは、所定の確定指示がなされた場合にはクリアされ
る。
【0030】そして、後処理部26では、例えば上記所
定の確定指示がなされた場合に制御回路5へデータを送
って所定の処理をするように指示する「確定後処理」を
実行したり、或いは音声合成部16へ音声データを送っ
て発音させるように指示する処理を実行する。尚、この
場合の制御回路5へ送るデータとしては、最終的な認識
結果としての上位比較対象パターンの全てでもよいし、
或いはその内の最上位のものだけでもよい。
【0031】次に、本実施の形態のカーナビゲーション
システム1の動作について説明する。尚、音声認識装置
9に関係する部分が特徴であるので、カーナビゲーショ
ンシステムとしての一般的な動作を簡単に説明した後、
音声認識装置9に関係する部分の動作について詳しく説
明する。
【0032】カーナビゲーションシステム1の電源オン
後に、表示装置7上に表示されるメニューから、運転者
がリモコン14(操作スイッチ群4でも同様に操作でき
る。以後の説明においても同じ)により、案内経路を表
示装置7に表示させるために経路情報表示処理を選択し
た場合、或いは音声認識装置9を介して希望するメニュ
ーをマイク19を介して音声入力することで、対話制御
部15から制御回路5へ、リモコン14に対する操作に
より選択されるのと同様の指示がなされた場合、次のよ
うな処理を実施する。
【0033】即ち、運転者が表示装置7上の地図に基づ
いて、音声或いはリモコン14などの操作によって目的
地を入力すると、位置検出器2により車両の現在地が求
められ、目的地と現在地との間に、ダイクストラ法によ
りコスト計算して、現在地から目的地までの最も短距離
の経路を誘導経路として求める処理が行われる。そし
て、表示装置7上の道路地図に重ねて誘導経路を表示し
て、運転者に適切なルートを案内する。このような誘導
経路を求める計算処理や案内処理は一般的によく知られ
た処理であるので説明は省略する。
【0034】次に、カーナビゲーションシステム1にお
ける動作について、上述の経路案内のための目的地を音
声入力する場合を例にとって説明する。図5は、その場
合の処理を示すフローチャートである。
【0035】まず、使用者による音声入力を受け付ける
(S1)。つまり、上述したように、PTTスイッチ2
0が押されている間にマイク19を介して入力された音
声データのみが音声入力部18から音声認識部17に出
力されるので、この音声入力部18からの音声入力を受
け付ける。
【0036】ここで、使用者が例えば「東京都 府中市
朝日町 ***番地」と音声入力したときは、入力デー
タが地名データであることを確認してから(S2:YE
S)、地名データに対応した辞書データに基づいて照合
開始頂点の決定を次のように行う。つまり、図3に示す
辞書データの場合は、上述したように、図3中の矢印A
で示す頂点が「根」となり、そこから先行順走査にした
がって各辺に割り付けられた音節を辿ることで単語が完
成する。
【0037】次に音声認識処理を実行する。基本的に
は、取得した音声データに対して辞書部23内に記憶さ
れている辞書データを用いて照合を行う。そして、照合
開始頂点から始まる単語との照合結果により「東京都
府中市朝日町 ***番地」を認識することができる。
この場合、音声認識したデータは地名データであり、か
つ先頭のデータから上位階層データ、中間階層データ、
下位階層データであるので(S5:YES)、「東京都
府中市朝日町 ***番地を表示します」と音声案内
してから(S6)、該当する地図画面を表示する(S
7)。
【0038】また、使用者が「東京都」と上位階層デー
タのみ音声入力したときは(S4:NO)、「東京都」
という上位階層データを保持してから(S8)、「市町
村名を入力下さい」と音声案内する(S9)。
【0039】その後、またはステップS9の後、使用者
が「府中市朝日町」と音声入力したときは、フローチャ
ートには示していないが保持データ及び音声データの階
層を判断する。この場合、上位階層データを既に保持し
ていることから、ステップS3を飛越してステップS4
に移行することにより音声データが中間階層データであ
ることを確認してから(S4:YES)、さらに下位階
層データが入力しないことを判断し(S5:NO)、上
位階層データ及び中間階層データを保持してから(S1
0)、「大字、番地を入力下さい」と音声案内する(S
11)。
【0040】その後、またはステップS11の後、使用
者が「***番地」と音声入力したときは、上位階層デ
ータ及び中間階層データを既に保持していることから、
ステップS3及びS4を飛越してステップS5に移行す
ることにより音声データが下位階層データであることを
確認する(S5:YES)。続いて、全ての階層データ
を階層的につなぎ合わせることにより「東京都 府中市
朝日町 ***番地を表示します」と音声案内してから
(S6)、該当する地図画面を表示する(S7)。
【0041】また、使用者が「東京都 府中市朝日町」
と上位階層データ及び中間階層データのみ音声入力した
ときは(S5:NO)、「東京都 府中市朝日町」とい
う上位階層データ及び中間階層データを保持してから
(S10)、「大字、番地を入力下さい」と音声案内し
(S11)、その後、使用者が「***番地」を入力し
たところで(S5:YES)、全ての階層データをつな
ぎ合わせることにより該当する地図画面を表示する(S
7)。
【0042】ところで、使用者によっては「東京都」と
いう上位階層データの音声入力を省略して「府中市朝日
町」という中間階層データから音声入力する場合があ
る。この場合、「府中市朝日町」が地名データであるこ
とは確定することはできるものの、「府中市朝日町」の
上位階層データが「東京都」なのか、「広島」なのかを
確定することができない。さらには、「府中」とだけ音
声入力された場合は、「府中」が住所データなのか、施
設データ(例えば「府中競馬場(東京競馬場)」)なの
か、属性を含めて確定することができない。
【0043】そこで、本実施の形態の音声認識装置にあ
っては、例えば音声入力が「府中」だけであると認識し
た場合は、属性が確定できないことから、属性を確定す
るための問い返す音声ガイド機能を付加すると共に、属
性が地名データであると確定できたときは、上位階層デ
ータを問い返す音声入力ガイド機能を付加した。
【0044】即ち、音声入力された地名データが「府中
市朝日町」と中間階層データのみであったときは(S1
3:NO)、中間階層データである「府中市朝日町」を
保持してから(S17)、「都道府県名と大字、番地を
入力下さい」と音声案内する(S18)。
【0045】ここで、使用者が「東京都 ***番地」
と音声入力したときは、上位階層データ、中間階層デー
タ、下位階層データを階層的につなぎ合わせることがで
きるので(S5:YES)、「東京都 府中市朝日町
***番地を表示します」と音声案内してから(S
6)、該当する地図データを表示する(S7)。
【0046】また、音声入力された地名データが「府中
市朝日町 ***番地」と中間階層データ及び下位階層
データであったときは、先頭データは中間階層データと
判断すると共に(S12:YES)、続くデータは下位
階層データであると判断し(S13:YES)、中間階
層データ及び下位階層データを保持してから(S1
4)、「都道府県名を入力下さい」と音声案内する(S
15)。
【0047】使用者が「東京都」と上位階層データを音
声入力すると、中間階層データ及び下位階層データが既
に保持されていることから、上位階層データ、中間階層
データ、下位階層データを階層的につなぎ合わせること
ができるので(S5:YES)、「東京都 府中市朝日
町、***番地を表示します」と音声案内してから(S
6)、該当する地図データを表示する(S7)。
【0048】また、使用者が下位階層データである「*
**番地」とだけ音声入力したときは(S12:N
O)、適切に入力されていないと判断して、「もう一度
入力下さい」と音声案内する(S16)。
【0049】一方、使用者が音声入力した音声データが
地名データ以外の場合は、データが階層構造を有してい
ないことから、その音声データの属性に適したモードを
実行する(S2:NO)。
【0050】このような第1の実施の形態によれば、使
用者がカーナビゲーションシステム1において目的地を
音声入力により設定する際に、地名データの中間階層デ
ータから音声入力した場合は、上位階層データを確定で
きるように「都道府県名を入力下さい」と音声案内する
ようにしたので、使用者は直ちに上位階層データを音声
入力することができる。従って、中間階層データから音
声入力し続けた場合は、階層構造データを確定すること
ができない従来構成のものと違って、階層構造データを
確定することができ、以て目的地の画面表示動作を確実
に素早く行うことができる。
【0051】(第2の実施の形態)音声認識部17に
は、中間階層データである市区郡町村名が確定したとこ
ろで、上位階層データである都道府県名を検索し、確定
できた上位階層データを問い掛ける機能が備えられてい
る(上位階層候補検索手段に相当)。
【0052】即ち、中間階層データとして「東京都 府
中市朝日町」が確定したときは、「東京都ですか」と問
い掛け、「はい」と返答すれば、「東京都 府中市朝日
町」を確定することができる。従って、下位階層データ
である「***番地」も確定したところで該当する地図
画面を表示する。このとき、「東京都ですか」と問い掛
けに対して、「いいえ」と返答したときは、「広島県で
すか」と問い掛け、「はい」と返答したときは、「広島
県 府中市」を確定すると共に下位階層データを確定し
たところで該当する地図画面を表示する。
【0053】尚、「東京都」という問い掛けに対して
「広島県」と返答したときは、「広島県 府中市朝日
町」を確定する。また、「競馬場」と返答したときは、
音声データの属性は施設データであると判断し、「東京
都 府中競馬場」を確定する。
【0054】この第2の実施の形態によれば、中間階層
データの音声認識に基づいて上位階層データを検索した
ときは、検索した上位階層データを順に問い掛けること
により上位階層データを確定するようにしたので、第1
の実施の形態と同様に、音声入力により上位階層データ
を確実に素早く音声認識することができる。
【0055】本発明は、上記実施の形態にのみ限定され
るものではなく、次のように変形または拡張できる。上
述した音声案内内容としては、学習データ、或いは前回
データ、さらには使用者が設定したデータであってもよ
い。属性を問い返すガイド機能としては、問い返す属性
の優先順位は、現在自走中の都道府県、或いは市区郡町
村でもよい。また、過去の学習結果から優先順位を決定
するようにしてもよい。
【0056】音声入力が認識できなかったときは、使用
者に音声入力対象の属性を問い返すガイド機能を設ける
ようにしてもよい。音声入力の認識の結果、例えば「府
中市」と確定できたものの「***町」までは確定でき
ず、複数の単語(例えば「府中市 朝日町」、「府中市
***町」が該当すると判断した場合は、単語を「府
中市」と「***町」と詳細化することにより該当する
単語を探索するようにしてもよい。
【0057】音声認識装置の適用としては、空調システ
ムに適用して、音声入力により設定温度、空調モード
(冷房、暖房、ドライ)の選択、或いは風向モードの選
択を行うようにしてもよい。さらには、カーオーディ
オ、パワウインドの開閉、ミラーの角度調整に適用する
ようにしてもよい。ナビゲーションシステムや空調シス
テムを、例えば携帯型ナビゲーションシステム或いは屋
内用空調装置などのように車載機器以外に適用してもよ
い。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態における全体構成を
示すブロック図
【図2】音声認識部及び対話制御部を詳細に示すブロッ
ク図
【図3】辞書データを説明するための図
【図4】階層レベルとレベルとの関係を示す図
【図5】全体の動作を示すフローチャート
【符号の説明】
1はカーナビゲーションシステム、15は対話制御部
(音声案内手段、属性確定手段、上位階層候補検索手
段)、17は音声認識部(認識手段、辞書手段)、19
はマイク(音声入力手段)である。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力音声を音声信号に変換するための音
    声入力手段と、 この音声入力手段からの音声信号を、予め辞書手段に記
    憶されている複数の比較対象パターン候補と比較して類
    似度の高いものを認識結果とする認識手段とを備えた音
    声認識装置において、 前記認識手段による認識結果が複数の語を階層的につな
    ぎ合わせた階層構造データにおける非上位階層データで
    あったときは上位階層データを確定するための問い掛け
    を音声案内する音声案内手段を備え、 前記認識手段は、前記音声案内手段による音声案内に応
    じて入力された音声データに基づいて上位階層データを
    音声認識することを特徴とする音声認識装置。
  2. 【請求項2】 前記認識手段による認識結果に基づいて
    音声データの属性を確定する属性確定手段を備え、 前記音声案内手段は、前記属性確定手段が確定した属性
    の上位階層データを入力するように問い掛けることによ
    り音声案内することを特徴とする請求項1記載の音声認
    識装置。
  3. 【請求項3】 前記認識手段が非上位階層データを認識
    できたときは、当該上位階層データの上位階層候補を検
    索する上位階層候補検索手段を備え、 前記音声案内手段は、前記上位階層候補検索手段が検索
    した上位階層データを順に問い掛けることにより音声案
    内することを特徴とする請求項1記載の音声認識装置。
JP10035818A 1998-02-18 1998-02-18 音声認識装置 Pending JPH11231894A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10035818A JPH11231894A (ja) 1998-02-18 1998-02-18 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10035818A JPH11231894A (ja) 1998-02-18 1998-02-18 音声認識装置

Publications (1)

Publication Number Publication Date
JPH11231894A true JPH11231894A (ja) 1999-08-27

Family

ID=12452534

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10035818A Pending JPH11231894A (ja) 1998-02-18 1998-02-18 音声認識装置

Country Status (1)

Country Link
JP (1) JPH11231894A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004526196A (ja) * 2001-02-28 2004-08-26 ヴォイス−インサイト 情報システムにアクセスする自然言語問合せシステム
JP2009237385A (ja) * 2008-03-28 2009-10-15 Mitsubishi Electric Information Systems Corp 音声文字変換装置、音声文字変換方法及び音声文字変換プログラム
US7818171B2 (en) 2006-03-31 2010-10-19 Denso Corporation Speech recognition apparatus and speech recognition program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004526196A (ja) * 2001-02-28 2004-08-26 ヴォイス−インサイト 情報システムにアクセスする自然言語問合せシステム
US7818171B2 (en) 2006-03-31 2010-10-19 Denso Corporation Speech recognition apparatus and speech recognition program
DE102007015497B4 (de) * 2006-03-31 2014-01-23 Denso Corporation Spracherkennungsvorrichtung und Spracherkennungsprogramm
JP2009237385A (ja) * 2008-03-28 2009-10-15 Mitsubishi Electric Information Systems Corp 音声文字変換装置、音声文字変換方法及び音声文字変換プログラム

Similar Documents

Publication Publication Date Title
JP4304952B2 (ja) 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム
US6064323A (en) Navigation apparatus, navigation method and automotive vehicles
JPH09292255A (ja) ナビゲーション方法及び装置
JP2002123290A (ja) 音声認識装置ならびに音声認識方法
JP4930486B2 (ja) 音声認識システム及びナビゲーション装置
JP4258890B2 (ja) 音声認識装置、その装置を用いたナビゲーションシステム
JP3849283B2 (ja) 音声認識装置
JP2001027540A (ja) 音声認識機能を用いたナビゲーション方法
JP3890774B2 (ja) ナビゲーションシステム
JPH11231894A (ja) 音声認識装置
JP2947143B2 (ja) 音声認識装置及びナビゲーション装置
JP3818352B2 (ja) ナビゲーション装置及び記憶媒体
JP3296783B2 (ja) 車載用ナビゲーション装置および音声認識方法
JP3700533B2 (ja) 音声認識装置及び処理システム
JP4705398B2 (ja) 音声案内装置、音声案内装置の制御方法及び制御プログラム
JPH08328584A (ja) 音声認識装置、音声認識方法及びナビゲーション装置
JP2001075589A (ja) 音声認識方法及び音声認識装置
JP3759313B2 (ja) 車載用ナビゲーション装置
JP3911835B2 (ja) 音声認識装置及びナビゲーションシステム
JP2005114964A (ja) 音声認識方法および音声認識処理装置
WO2006028171A1 (ja) データ提示装置、データ提示方法、データ提示プログラムおよびそのプログラムを記録した記録媒体
JPH09114491A (ja) 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車
JP3358498B2 (ja) 音声認識装置及びナビゲーションシステム
JP3654262B2 (ja) 音声認識装置及びナビゲーションシステム
JP2003005781A (ja) 音声認識機能付き制御装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040428

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060712

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060808

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061004

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061114

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070313