JPH09114487A - 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車 - Google Patents

音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車

Info

Publication number
JPH09114487A
JPH09114487A JP7267541A JP26754195A JPH09114487A JP H09114487 A JPH09114487 A JP H09114487A JP 7267541 A JP7267541 A JP 7267541A JP 26754195 A JP26754195 A JP 26754195A JP H09114487 A JPH09114487 A JP H09114487A
Authority
JP
Japan
Prior art keywords
voice
recognized
recognition
recognition target
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7267541A
Other languages
English (en)
Other versions
JP2947143B2 (ja
Inventor
Kazuo Ishii
和夫 石井
Eiji Yamamoto
英二 山本
Miyuki Tanaka
幸 田中
Hiroshi Tsunoda
弘史 角田
Koji Asano
康治 浅野
Hiroaki Ogawa
浩明 小川
Masanori Omote
雅則 表
Katsuki Minamino
活樹 南野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP7267541A priority Critical patent/JP2947143B2/ja
Priority to US08/731,158 priority patent/US6067521A/en
Priority to KR1019960046103A priority patent/KR100455108B1/ko
Publication of JPH09114487A publication Critical patent/JPH09114487A/ja
Priority to US09/108,826 priority patent/US6253174B1/en
Application granted granted Critical
Publication of JP2947143B2 publication Critical patent/JP2947143B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Traffic Control Systems (AREA)
  • Instructional Devices (AREA)
  • Navigation (AREA)

Abstract

(57)【要約】 【課題】 自動車の運転などを邪魔することなく、ナビ
ゲーション装置の高度な操作が簡単にできるようにす
る。 【解決手段】 音声信号入力手段に音声信号が入力され
てから所定時間以内に再び音声信号が入力したことを判
断する判断手段14と、この判断手段が所定時間以内の
入力を判断したとき、音声処理部で認識できる認識対象
語から、前回認識された音声の認識対象語を除いて、音
声認識処理を行う制御手段14とを備えた。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば自動車に搭
載させて道路地図などを表示させるナビゲーション装置
に適用して好適な音声認識装置及び音声認識方法、その
音声認識装置と組み合わされたナビゲーション装置及び
ナビゲート方法、並びにこれらの装置が搭載された自動
車に関する。
【0002】
【従来の技術】従来、自動車などに搭載させるナビゲー
ション装置が各種開発されている。このナビゲーション
装置は、例えば道路地図データが記憶されたCD−RO
Mなどの大容量データ記憶手段と、現在位置の検出手段
と、検出した現在位置の近傍の道路地図を、データ記憶
手段から読出したデータに基づいて表示させるディスプ
レイ装置とで構成される。この場合、現在位置の検出手
段としては、GPS(Global Positioning System )と
称される測位用の人工衛星を使用した測位システムを使
用したものや、車両の走行方向,走行速度などの情報に
基づいて出発地点から現在位置の変化を追跡する自律航
法によるものなどがある。
【0003】また、ディスプレイ装置に表示される地図
としては、キー操作などを行うことで、現在位置の近傍
だけでなく、地図データが用意されている限りは、所望
の位置の地図を表示させることができるようにしてあ
る。
【0004】このようなナビゲーション装置の場合に
は、例えば自動車用の場合、運転席の近傍にディスプレ
イ装置を設置して、運転者が走行中や信号停止などの一
時停止中に現在位置の近傍の地図を見れるようにするの
が一般的である。
【0005】
【発明が解決しようとする課題】ところで、このような
ナビゲーション装置は、自動車の運転などを邪魔しない
で操作できるようにする必要があり、例えば走行中は複
雑な操作を禁止するようにしてある。即ち、このような
ナビゲーション装置を車両に設置する場合には、何らか
の走行状態検出部(例えば自動車のパーキングブレーキ
スイッチ)と接続して、この検出部の状態により車両が
停止していることが検出されるときだけ、全ての操作が
できるように設定し、停止してない状態(即ち走行中)
には、複雑なキー操作を禁止するように設定してある。
【0006】ところが、このように走行中に表示地図を
切換える等の操作ができないのは不便であり、走行中で
あっても、運転を邪魔することなく、高度な操作ができ
るようにすることが要請されている。
【0007】本発明はかかる点に鑑み、自動車の運転な
どを邪魔することなく、ナビゲーション装置などの各種
装置の高度な操作が簡単にできるようにすることを目的
とする。
【0008】
【課題を解決するための手段】本発明の音声認識装置
は、音声信号入力手段に音声信号が入力されてから所定
時間以内に再び音声信号が入力したことを判断する判断
手段と、この判断手段が所定時間以内の入力を判断した
とき、音声処理部で認識できる認識対象語から、前回認
識された音声の認識対象語を除いて、音声認識処理を行
う制御手段とを備えたものである。
【0009】本発明の音声認識装置によると、認識され
る音声が一回目で正しく認識されなく、認識される音声
を言い直したとき、最初に誤って認識された認識対象語
が、音声処理部で認識できる認識対象語の候補から除か
れるので、正しく認識される可能性が高くなる。
【0010】また本発明の音声認識方法は、入力した音
声信号から予め決められた複数の認識対象語の音声を認
識し、この認識した認識対象語の音声を出力すると共
に、この音声認識から所定時間以内に、再度入力した音
声信号から複数の認識対象語の音声を認識するとき、前
回認識された音声の認識対象語を除いて、音声認識処理
を行うようにしたものである。
【0011】本発明の音声認識方法によると、認識され
る音声が一回目で正しく認識されなく、認識される音声
を言い直したとき、最初に誤って認識された認識対象語
が、認識できる認識対象語の候補から除かれるので、正
しく認識される可能性が高くなる。
【0012】また本発明のナビゲーション装置は、音声
信号入力手段に音声信号が入力されてから所定時間以内
に再び音声信号が入力したことを判断する判断手段と、
この判断手段が所定時間以内の入力を判断したとき、音
声処理部で認識できる認識対象語から、前回認識された
音声の認識対象語を除いて、音声認識処理を行う制御手
段とを備えたものである。
【0013】本発明のナビゲーション装置によると、認
識される音声が一回目で正しく認識されなく、認識され
る音声を言い直したとき、最初に誤って認識された認識
対象語が、認識できる認識対象語の候補から除かれるの
で、正しく認識されて、正しい地図表示などのナビゲー
ション装置としての動作が行われる可能性が高くなる。
また本発明のナビゲート方法は、入力した音声信号から
特定の地域の音声を含む予め決められた複数の認識対象
語の音声を認識する場合に、前回の音声認識から所定時
間以内に、再度入力した音声信号から複数の認識対象語
の音声を認識するとき、前回認識された音声の認識対象
語を除いて、音声認識処理を行うようにしたものであ
る。
【0014】本発明のナビゲート方法によると、認識さ
れる音声が一回目で正しく認識されなく、認識される音
声を言い直したとき、最初に誤って認識された認識対象
語が、認識できる認識対象語の候補から除かれるので、
正しく認識されて、正しい地図表示などのナビゲートが
行われる可能性が高くなる。
【0015】また本発明の自動車は、車内の所定位置に
配された表示手段に、入力した音声の認識に基づいて地
図を表示させる装置を備えた自動車において、音声信号
入力手段に音声信号が入力されてから所定時間以内に再
び音声信号が入力したことを判断する判断手段と、この
判断手段が所定時間以内の入力を判断したとき、音声処
理部で認識できる認識対象語から、前回認識された音声
の認識対象語を除いて、音声認識処理を行う制御手段と
を備えたものである。
【0016】本発明の自動車によると、入力した音声の
認識に基づいて地図を表示させる場合に、認識される音
声が一回目で正しく認識されなく、認識される音声を言
い直したとき、最初に誤って認識された認識対象語が、
認識できる認識対象語の候補から除かれるので、正しく
認識されて、正しい地図表示が行われる可能性が高くな
る。
【0017】
【発明の実施の形態】以下、本発明の一実施例を、添付
図面を参照して説明する。
【0018】本例においては、自動車に搭載されるナビ
ゲーション装置に適用したもので、まず図2,図3を参
照して本例の装置の自動車への設置状態を説明する。図
2に示すように、自動車50は、ハンドル51が運転席
52の前方に取付けられ、基本的には、運転席52に着
席した運転者がナビゲーション装置の操作を行うように
したものである。但し、この自動車50内の他の同乗者
が操作する場合もある。そして、ナビゲーション装置の
本体20及びこのナビゲーション装置本体20に接続さ
れた音声認識装置10は、自動車50内の任意の空間
(例えば後部のトランク内)に設置され、後述する測位
信号受信用アンテナ21が車体の外側(或いはリアウィ
ンドウの内側などの車内)に取付けてある。
【0019】そして、図3に運転席の近傍を示すよう
に、ハンドル51の脇には、後述するトークスイッチ1
8やナビゲーション装置の操作キー27が配置され、こ
れらのスイッチやキーは、運転中に操作されても支障が
ないように配置してある。また、ナビゲーション装置に
接続されたディスプレイ装置40が、運転者の前方の視
界を妨げない位置に配置してある。また、ナビゲーショ
ン装置20内で音声合成された音声信号を出力させるス
ピーカ32が、運転者に出力音声が届く位置(例えばデ
ィスプレイ装置40の脇など)に取付けてある。
【0020】また、本例のナビゲーション装置は音声入
力ができるようにしてあり、そのためのマイクロフォン
11が、運転席52の前方のフロントガラス上部に配さ
れたサンバイバイザ53に取付けてあり、運転席52に
着席した運転者の話し声を拾うようにしてある。
【0021】また、本例のナビゲーション装置本体20
は、この自動車のエンジン制御用コンピュータ54と接
続してあり、エンジン制御用コンピュータ54から車速
に比例したパルス信号が供給されるようにしてある。
【0022】次に、本例のナビゲーション装置の内部の
構成について図1を参照して説明すると、本例において
は、音声認識装置10をナビゲーション装置20と接続
して構成させたもので、音声認識装置10は、マイクロ
フォン11が接続してある。このマイクロフォン11と
しては、例えば指向性が比較的狭く設定されて、自動車
の運転席に着席した者の話し声だけを良好に拾うような
ものを使用し、例えば後述するトークスイッチ18が押
されてオン状態となっている間だけ電源が投入されて音
声を拾う動作を行うようにしてある。
【0023】そして、このマイクロフォン11が拾って
得た音声信号を、アナログ/デジタル変換器12に供給
し、所定のサンプリング周波数のデジタル音声信号に変
換する。そして、このアナログ/デジタル変換器12が
出力するデジタル音声信号を、DSP(デジタル・シグ
ナル・プロセッサ)と称される集積回路構成のデジタル
音声処理回路13に供給する。このデジタル音声処理回
路13では、帯域分割,フィルタリングなどの処理で、
デジタル音声信号をベクトルデータとし、このベクトル
データを音声認識回路14に供給する。
【0024】この音声認識回路14には音声認識データ
記憶用ROM15が接続され、デジタル音声処理回路1
3から供給されるベクトルデータとの所定の音声認識ア
ルゴリズム(例えばHMM:隠れマルコフモデル)に従
った認識動作を行い、ROM15に記憶された音声認識
用音韻モデルから候補を複数選定し、その候補の中で最
も一致度の高い音韻モデルに対応して記憶された文字デ
ータを読出す。なお、本例の音声認識回路14は、音声
認識装置10内の各部の処理の制御を行う制御手段とし
ても機能するようにしてあり、後述するトークスイッチ
18の操作についても、この音声認識回路14が判断す
るようにしてある。
【0025】ここで、本例の音声認識データ記憶用RO
M15のデータ記憶状態について説明すると、本例の場
合には、地名と、ナビゲーション装置の操作を指示する
言葉だけを認識するようにしてあり、地名としては、図
4に記憶エリアの設定状態を示すように、国内の都道府
県と、市区町村の名前だけを登録させてあり、各都道府
県と市区町村毎に、その地名の文字コードと、地名を音
声認識させるためのデータである音韻モデルが記憶させ
てある。
【0026】なお、例えば日本国内の場合には、全国の
市区町村の数は約3500であり、この約3500の地
名が記憶されることになる。但し、「××町」の地名の
場合には、「××マチ」と発音した場合のデータと、
「××チョウ」と発音した場合のデータとの双方が記憶
させてある。同様に、「××村」の地名の場合には、
「××ソン」と発音した場合のデータと、「××ムラ」
と発音した場合のデータとの双方が記憶させてある。
【0027】また、都道府県の境界に隣接した位置の市
区町村などのように、都道府県名を間違えて覚える可能
性の高い市区町村名については、間違えやすい都道府県
名を付与させて登録させてある。即ち、例えば正しい例
である「カナガワケン カワサキシ(神奈川県川崎
市)」と登録させると共に、間違った例である隣接した
都道府県名を付与させた「トウキョウト カワサキシ
(東京都川崎市)」としても登録させる。
【0028】また、ナビゲーション装置の操作を指示す
る言葉としては、「目的地」,「出発地」,「経由
地」,「自宅」などの表示位置を指示する言葉や、「今
何時」(現在時刻を聞く指令),「今どこ」(現在位置
を聞く指令),「次は」(次の交差点を聞く指令),
「あとどれくらい」(目的地までの距離を聞く指令),
「速度は」(現在速度を聞く指令),「高度は」(現在
の高度を聞く指令),「進行方向は」(進行方向を聞く
指令),「一覧表」(認識できる指令の一覧表をディス
プレイに表示させるための指令)等のその他の各種操作
指令を行う言葉の文字コードと、その言葉に対応する音
韻モデルが記憶させてある。
【0029】そして、音声認識回路14で、入力ベクト
ルデータから、所定の音声認識アルゴリズムを経て得ら
れた認識結果に一致する、音韻モデルに対応した文字コ
ードが、地名の文字コードである場合には、この文字コ
ードを、ROM15から読出す。そして、この読出され
た文字コードを、経緯度変換回路16に供給する。この
経緯度変換回路16には経緯度変換データ記憶用ROM
17が接続され、音声認識回路14から供給される文字
データに対応した経緯度データ及びその付随データをR
OM17から読出す。
【0030】なお、本例の音声認識回路14には、認識
結果を一時的に記憶するメモリ(図示せず)が備えら
れ、このメモリ内に認識結果を履歴リストとして記憶さ
せるようにしてある。また、認識処理時に、最も一致度
が高い音声から順にある程度まで一致する音声について
までのデータを、候補リストとして記憶させるようにし
てある。この履歴リストや候補リストは、記憶されてか
らある程度の時間が経過すると消去される。
【0031】ここで、本例の経緯度変換データ記憶用R
OM17のデータ記憶状態について説明すると、本例の
場合には、音声認識データ記憶用ROM15に記憶され
た地名の文字コードと同じ文字コード毎に記憶エリアが
設定され、図5に示すように、各文字コード毎に、その
文字で示される地名の緯度と経度のデータと、付随する
データとして表示スケールのデータとが記憶させてあ
る。また、音声認識データ記憶用ROM15から読出さ
れた文字コードとしては、カタカナによる文字コードと
してあるが、この経緯度変換データ記憶用ROM17に
は、発音を文字列で示すカタカナによる文字コードの他
に、表示用の漢字,平仮名,カタカナ等を使用した文字
コードについても記憶させてある。
【0032】なお、本例の場合には、地名毎の緯度と経
度のデータとしては、その地名で示される地域の役所
(市役所,区役所,町役場,村役場)の所在地の絶対位
置を示す緯度と経度のデータとしてある。また、付随デ
ータとして、表示用の文字コードと表示スケールのデー
タを、緯度と経度のデータと共に出力するようにしてあ
る。この表示スケールのデータとしては、その地名で示
される地域の大きさに応じて設定された表示スケールの
データとしてあり、例えば数段階に表示スケールを指示
するデータとしてある。
【0033】そして、経緯度変換データ記憶用ROM1
7から読出された経緯度データ及びその付随データを、
音声認識装置10の出力として出力端子10aに供給す
る。また、音声認識回路14で一致が検出された入力音
声の文字コードのデータを、音声認識装置10の出力と
して出力端子10bに供給する。この出力端子10a,
10bに得られるデータは、ナビゲーション装置20に
供給する。
【0034】なお、本例の音声認識装置10には、ロッ
クされない開閉スイッチ(即ち押されたときだけオン状
態になるスイッチ)であるトークスイッチ18が接続さ
れ、このトークスイッチ18が少なくとも300m秒以
上継続して押されている間に、マイクロフォン11が拾
った音声信号だけを、アナログ/デジタル変換器12か
ら経緯度変換回路16までの回路で上述した処理を行う
ようにしてある。この音声認識装置10内での処理は、
音声認識回路14の制御に基づいて行われ、トークスイ
ッチ18の状態についても、音声認識回路14が判断す
るようにしてある。
【0035】そして本例においては、音声認識回路14
で所定時間以内(例えば10秒以内)に、再度入力した
音声の認識処理が行われた場合において、このとき認識
した音声が、音声認識回路14内のメモリに記憶された
履歴リストに記憶されているとき、この認識音声を履歴
リストから削除し、削除された履歴リストの最も高い順
位に記憶された音声を、音声認識したと判断するように
してある。また、このような処理が複数回(例えば5
回)連続して行われたときには、候補となる認識音声の
データを候補リストから読出して、ナビゲーション装置
20側に供給し、ナビゲーション装置20に接続された
ディスプレイ装置40に候補リストを表示させるように
してある。これらの処理の詳細については、後述する。
【0036】また、本例の音声認識装置10内の音声認
識回路14からは、端子10bを介してナビゲーション
装置20側に上述した文字コード以外の各種制御データ
についても伝送できるようにしてあり、例えば音声出力
処理や地図データの作成処理を中断させる制御データを
ナビゲーション装置20側に送ることもある。
【0037】次に、音声認識装置10と接続されたナビ
ゲーション装置20の構成について説明する。このナビ
ゲーション装置20は、GPS用アンテナ21を備え、
このアンテナ21が受信したGPS用衛星からの測位用
信号を、現在位置検出回路22で受信処理し、この受信
したデータを解析して、現在位置を検出する。この検出
した現在位置のデータとしては、そのときの絶対的な位
置である緯度と経度のデータである。
【0038】そして、この検出した現在位置のデータ
を、演算回路23に供給する。この演算回路23は、ナ
ビゲーション装置20による動作を制御するシステムコ
ントローラとして機能する回路で、道路地図データが記
憶されたCD−ROM(光ディスク)がセットされて、
このCD−ROMの記憶データを読出すCD−ROMド
ライバ24と、データ処理に必要な各種データを記憶す
るRAM25と、このナビゲーション装置が搭載された
車両の動きを検出する車速センサ26と、操作キー27
とが接続させてある。そして、現在位置などの経緯度の
座標データが得られたとき、CD−ROMドライバ24
にその座標位置の近傍の道路地図データを読出す制御を
行う。そして、CD−ROMドライバ24で読出した道
路地図データをRAM25に一時記憶させ、この記憶さ
れた道路地図データを使用して、道路地図を表示させる
ための表示データを作成する。このときには、自動車内
の所定位置に配置された操作キー27の操作などにより
設定された表示スケール(縮尺)で地図を表示させるよ
うな表示データとする。
【0039】そして、演算回路23で作成された表示デ
ータを、映像信号生成回路28に供給し、この映像信号
生成回路28で表示データに基づいて所定のフォーマッ
トの映像信号を生成させ、この映像信号を出力端子20
cに供給する。
【0040】そして、この出力端子20cから出力され
る映像信号を、ディスプレイ装置40に供給し、このデ
ィスプレイ装置40で映像信号に基づいた受像処理を行
い、ディスプレイ装置40の表示パネルに道路地図など
を表示させる。
【0041】そして、このような現在位置の近傍の道路
地図を表示させる他に、操作キー27の操作などで指示
された位置の道路地図なども、演算回路23の制御に基
づいて表示できるようにしてある。また、操作キー27
の操作などに基づいて、「目的地」,「出発地」,「経
由地」,「自宅」などの特定の座標位置を登録すること
ができるようにしてある。この特定の座標位置を登録し
た場合には、その登録した座標位置のデータ(経度と緯
度のデータ)をRAM25に記憶させる。
【0042】また、車速センサ26が自動車の走行を検
出したときには、演算回路23が操作キー27の操作の
内の比較的簡単な操作以外の操作を受け付けないように
してある。
【0043】また、このナビゲーション装置20は、自
律航法部29を備え、自動車側のエンジン制御用コンピ
ュータ等から供給される車速に対応したパルス信号に基
づいて、自動車の正確な走行速度を演算すると共に、自
律航法部29内のジャイロセンサの出力に基づいて進行
方向を検出し、速度と進行方向に基づいて決められた位
置からの自律航法による現在位置の測位を行う。例えば
現在位置検出回路22で位置検出ができない状態になっ
たとき、最後に現在位置検出回路22で検出できた位置
から、自律航法による測位を行う。
【0044】また、演算回路23には音声合成回路31
が接続させてあり、演算回路23で音声による何らかの
指示が必要な場合には、音声合成回路31でこの指示す
る音声の合成処理を実行させ、音声合成回路31に接続
されたスピーカ32から音声を出力させるようにしてあ
る。例えば、「目的地に近づきました」,「進行方向は
左です」などのナビゲーション装置として必要な各種指
示を音声で行うようにしてある。また、この音声合成回
路31では、音声認識装置10で認識した音声を、供給
される文字データに基づいて音声合成処理して、スピー
カ32から音声として出力させるようにしてある。その
処理については後述する。
【0045】ここで、このナビゲーション装置20は、
音声認識装置10の出力端子10a,10bから出力さ
れる経緯度データとその付随データ及び文字コードのデ
ータが供給される入力端子20a,20bを備え、この
入力端子20a,20bに得られる経緯度データとその
付随データ及び文字コードのデータを、演算回路23に
供給する。
【0046】そして、演算回路23では、この経緯度デ
ータなどが音声認識装置10側から供給されるとき、そ
の経度と緯度の近傍の道路地図データをCD−ROMド
ライバ24でディスクから読出す制御を行う。そして、
CD−ROMドライバ24で読出した道路地図データを
RAM25に一時記憶させ、この記憶された道路地図デ
ータを使用して、道路地図を表示させるための表示デー
タを作成する。このときには、供給される経度と緯度が
中心に表示される表示データとすると共に、経緯度デー
タに付随する表示スケールで指示されたスケール(縮
尺)で地図を表示させるような表示データとする。
【0047】そして、この表示データに基づいて、映像
信号生成回路28で映像信号を生成させ、ディスプレイ
装置40に、音声認識装置10から指示された座標位置
の道路地図を表示させる。
【0048】また、音声認識装置10の出力端子10b
からナビゲーション装置の操作を指示する言葉の文字コ
ードが供給される場合には、その操作を指示する言葉の
文字コードを演算回路23で判別すると、対応した制御
を演算回路23が行うようにしてある。この場合、「目
的地」,「出発地」,「経由地」,「自宅」などの表示
位置を指示する言葉の文字コードである場合には、この
表示位置の座標がRAM25に登録されているか否か判
断した後、登録されている場合には、その位置の近傍の
道路地図データをCD−ROMドライバ24でディスク
から読出す制御を行う。
【0049】また、演算回路23に音声認識装置10か
ら、認識した音声の発音を示す文字コードのデータが供
給されるときには、その文字コードで示される言葉を、
音声合成回路31で合成処理させ、音声合成回路31に
接続されたスピーカ32から音声として出力させるよう
にしてある。例えば、音声認識装置10側で「トウキョ
ウト ブンキョウク(東京都文京区)」と音声認識した
とき、この認識した発音の文字列のデータに基づいて
「トウキョウト ブンキョウク」と発音させる音声信号
を生成させる合成処理を、音声合成回路31で行い、そ
の生成された音声信号をスピーカ32から出力させる。
【0050】この場合、本例においては音声認識装置1
0で音声認識を行った場合に、ナビゲーション装置20
の端子20aに経度,緯度のデータが供給されるのと、
端子20bに認識した音声の発音を示す文字コードのデ
ータが供給されるのが、ほぼ同時であるが、演算回路2
3では最初に音声合成回路31で認識した言葉を音声合
成させる処理を実行させ、次に経度,緯度のデータに基
づいた道路地図の表示データの作成処理を実行させるよ
うにしてある。
【0051】次に、本例の音声認識装置10とナビゲー
ション装置20を使用して、道路地図表示などを行う場
合の動作を説明する。まず、音声認識装置10での音声
認識動作を、図6のフローチャートに示すと、最初にト
ークスイッチ18がオンか否か判断し(ステップ10
1)、このトークスイッチ18がオンとなったことを判
別した場合には、そのオンとなった期間にマイクロフォ
ン11が拾った音声信号を、アナログ/デジタル変換器
12でサンプリングさせ、デジタル音声処理回路13で
処理させて、ベクトルデータ化させる(ステップ10
2)。そして、このベクトルデータに基づいて音声認識
回路14で音声認識処理させる(ステップ103)。
【0052】ここで、音声認識データ記憶用ROM15
に記憶された地名(即ち予め登録された地名)の音声を
認識したか否か判断し(ステップ104)、登録された
地名の音声を認識した場合には、認識した地名を発音さ
せるための文字データをROM15から読出して出力端
子10bから出力させる(ステップ105)と共に、認
識した地名の経度,緯度のデータを経緯度変換回路16
に接続された経緯度変換データ記憶用ROM17から読
出す(ステップ106)。ここでの地名の音声認識とし
ては、本例のROM15に登録された地名が、国内の都
道府県と、市区町村の名前であるので、例えば「××県
××市」と言う音声や、「××市 ××区」(ここで
は区の場合には都道府県を省略しても認識できるように
してある)と言う音声を認識する。
【0053】そして、認識した音声に基づいて読出した
経度,緯度のデータと付随データとを、出力端子10a
から出力させる(ステップ107)。
【0054】そして、ステップ104で、登録された地
名の音声を認識できなかった場合には、地名以外の登録
された特定の音声を認識したか否か判断する(ステップ
108)。ここで、地名以外の登録された特定の音声を
認識した場合には、識別した音声に対応した文字コード
を判別し(ステップ109)、その判別した文字コード
を出力端子10bから出力させる(ステップ110)。
【0055】また、ステップ108で地名以外の登録さ
れた特定の音声も認識できなかった場合には、このとき
の処理を終了する。或いは、音声認識できなかったこと
を、ナビゲーション装置20側に指示し、音声合成回路
31での音声合成又はディスプレイ装置40で表示され
る文字などで警告する。
【0056】次に、ナビゲーション装置20側での動作
を、図7のフローチャートに示すと、まず演算回路23
では現在位置の表示モードが設定されているか否か判断
する(ステップ201)。そして、現在位置の表示モー
ドが設定されていると判断したときには、現在位置検出
回路22で現在位置の測位を実行させ(ステップ20
2)、その測位した現在位置の近傍の道路地図データを
CD−ROMから読出させ(ステップ203)、その読
出した道路地図データに基づいた道路地図の表示処理を
行い、ディスプレイ装置40に対応した座標位置の道路
地図を表示させる(ステップ204)。
【0057】そして、ステップ201で現在位置の表示
モードが設定されてないと判断したとき、或いはステッ
プ204での現在位置の道路地図の表示処理が終了し、
その道路地図が表示された状態となっているときに、音
声認識装置10から入力端子20a,20bを介して経
度,緯度データなどが供給されるか否か判断する(ステ
ップ205)。ここで、経度,緯度データとそれに付随
する文字データなどが供給されたことを判別したときに
は、まず端子20bを介して供給される発音用の文字コ
ードを音声合成回路31に供給して、音声認識装置10
で認識した音声を音声合成させてスピーカ32から出力
させる(ステップ206)。続いて、経度,緯度データ
で示される位置の近傍の道路地図データをCD−ROM
から読出させ(ステップ207)、その読出した道路地
図データに基づいた道路地図の表示処理を行い、ディス
プレイ装置40に対応した座標位置の道路地図を表示さ
せる(ステップ208)。
【0058】そして、ステップ205で音声認識装置1
0から経度,緯度データが供給されないと判断したと
き、或いはステップ208での指定された地名の道路地
図の表示処理が終了し、その道路地図が表示された状態
となっているときに、音声認識装置10から入力端子2
0bを介して表示位置を直接指示する文字コードが供給
されるか否か判断する(ステップ209)。そして、端
子20bから文字コードが供給されたと判断したときに
は、その文字コードを音声合成回路31に供給して、音
声認識装置10で認識した音声をスピーカ32から出力
させる(ステップ210)。そして次に、ステップ20
9で表示位置を直接指示する文字コード(即ち「目的
地」,「出発地」,「経由地」,「自宅」などの言葉)
を判別したときには、これらの文字で指示された座標位
置がRAM25に登録されているか否か判断し(ステッ
プ211)、登録されている場合には、その登録された
座標位置である経度,緯度データで示される位置の近傍
の道路地図データをCD−ROMから読出させ(ステッ
プ212)、その読出した道路地図データに基づいた道
路地図の表示処理を行い、ディスプレイ装置40に対応
した座標位置の道路地図を表示させ(ステップ21
3)、この表示が行われた状態で、ステップ201の判
断に戻る。
【0059】そして、ステップ209で表示位置を直接
指示する文字コードが音声認識装置10から供給されな
いと判断したときには、操作キー27の操作により、表
示位置を指定する操作があるか否か演算回路23で判断
する(ステップ214)。そして、この表示位置を指定
する操作がある場合には、車速センサ26の検出データ
を判断して、現在車両が走行中か否か判断する(ステッ
プ215)。そして、走行中であると演算回路23が判
断したときには、そのときの操作を無効とし、ステップ
201の判断に戻る(このとき何らかの警告を行うよう
にしても良い)。
【0060】そして、車両が走行中でないと判断したと
きに、ステップ211に移り、登録された座標があるか
否か判断した後、登録された座標位置がある場合には、
その位置の道路地図の表示処理(ステップ212,21
3)を行った後、ステップ201の判断に戻る。
【0061】そして、ステップ211で「目的地」,
「出発地」,「経由地」,「自宅」などの対応した位置
の座標の登録がない場合には、音声合成回路31での音
声合成又はディスプレイ装置40での文字表示で、未登
録を警告させ(ステップ216)、ステップ201の判
断に戻る。
【0062】なお、この図7のフローチャートでは、地
図表示に関係する処理について説明したが、音声認識装
置10側から地図表示以外の操作を指示する音声を認識
した結果による文字コードが供給される場合には、演算
回路23の制御に基づいて、対応した処理を行うように
してある。例えば、「イマナンジ」などと認識して文字
コードが供給されるとき、演算回路23の制御に基づい
て、現在時刻を発音させる音声を音声合成回路31で合
成させてスピーカ32から出力させるようにしてある。
その他の指令についても、回答の音声を音声合成回路3
1で合成させてスピーカ32から出力させるか、或いは
該当する表示をディスプレイ装置40で行うように処理
する。
【0063】以上のように処理されることで、音声入力
により表示位置を全国どこでも自由に設定することがで
き、簡単に所望の位置の道路地図を表示させることがで
きる。即ち、例えば操作者がトークスイッチ18を押し
ながら、マイクロフォン11に向かって「××県 ××
市」や「××市 ××区」と話すだけで、その音声が認
識されて、その地域の道路地図が表示されるので、キー
操作で位置の指示などを行う必要がなく、例えばキー操
作が困難な状況であっても、ナビゲーション装置の操作
ができる。この場合、本例においては音声認識装置10
で認識する地名の音声を、国内の都道府県と、市区町村
の名前に限定したので、認識する音声の数が比較的少な
い数(約3500)に制限され、音声認識装置10内の
音声認識回路14で比較的少ない処理量による短時間で
の音声認識処理で、地名を認識でき、入力した音声によ
り指示された地図が表示されるまでの時間を短縮するこ
とができると共に、認識する地名の数が限定されること
で、認識率自体も向上する。
【0064】ここで本例においては、以上説明した音声
入力があって認識処理が行われた後に、再度音声入力が
あったとき、その認識処理時に過去の認識結果を参照す
るようにしてある。以下、その処理を図8のフローチャ
ートに示す。
【0065】まず、前回の音声認識処理から充分な時間
(例えば数分)が経過している場合には、音声認識回路
14内の履歴リストをクリアし(ステップ301)、そ
の後発話が開始、即ちトークスイッチ18がオン状態に
なったか否か判断し(ステップ302)、発話が開始さ
れたと判断すると、前回の発話から所定時間Th(ここ
では10秒)が経過しているか否か判断し(ステップ3
03)、経過している場合には音声認識回路14内の履
歴リストをクリアする(ステップ304)。そして、前
回の発話から所定時間Thが経過してない場合には、履
歴リストをクリアしない。
【0066】そして次に、音声認識回路14の制御に基
づいて、入力された音声の認識処理を行う(ステップ3
05)。そして、この認識結果で得られた候補の音声デ
ータと、履歴リストにある音声データとを照合し、履歴
リストに同じデータがある場合には、そのデータを認識
された候補の中から削除する(ステップ306)。そし
て、このときの残りの候補のデータの中で、最も認識度
(一致度)が高かったデータを、認識された結果とし
て、ナビゲーション装置20の音声合成回路31に供給
し、スピーカ32から音声として出力させる(ステップ
307)。そして、この認識された結果が地域を示す音
声(即ち本例の場合には都道府県名及び市区町村名)で
ある場合には、その市区町村を表示させる地図を、ナビ
ゲーション装置20内での処理でディスプレイ装置40
に表示させる(ステップ308)。そして、このとき認
識された結果を、履歴リストに追加し(ステップ30
9)、ステップ302に戻り、次の発話開始まで待機す
る。
【0067】このように制御されることで、発話を一定
時間内(例えば10秒以内)に続けて行われたときに
は、言い直されたと見なされて、前回の認識結果の一位
候補が認識対象語から外れることになり、言い直しても
間違った地名が再度認識されて、所望の地名が認識され
ない事故を防止できる。例えば、似た地名として「横浜
市神奈川区」と「横浜市金沢区」が存在するが、音声入
力をした者が「横浜市神奈川区」と話した場合に、「横
浜市金沢区」と誤認識されたとする。このとき、同じ発
音を繰り返すことで、なにも対処しない場合には再度
「横浜市金沢区」と誤認識される可能性が高いが、ここ
では二回目の音声入力時には履歴リストに「横浜市金沢
区」の発音が既にあるので、この「横浜市金沢区」が認
識対象語から外れることになる。そして、二位の候補に
「横浜市神奈川区」があったとき、この「横浜市神奈川
区」が一位の候補に繰り上がることになり、「横浜市神
奈川区」が認識されたと判断され、結果として言い直し
た場合には誤認識が防止されたことになり、それだけ認
識率を向上させることができる。
【0068】なお、ここでは10秒程度の一定時間以内
に言い直した場合に限定したので、一度認識対象語から
外れた言葉であっても、直ぐに言い直した場合以外は、
認識でき、この点から認識率が悪くなることはない。
【0069】そして本例においては、このような言い直
しが繰り返された場合には、音声入力だけによる正確な
認識は困難であると判断して、そのときの候補リストの
データをナビゲーション装置20に供給して、ナビゲー
ション装置20内で認識される可能性のある候補を一覧
表で表示させる映像信号を作成させて、その一覧表をデ
ィスプレイ装置40に表示させるようにしてある。
【0070】図9のフローチャートは、この場合の処理
を示したもので、まず前回の音声認識処理から充分な時
間(例えば数分)が経過している場合には、音声認識回
路14内の履歴リストをクリアし(ステップ401)、
その後発話が開始、即ちトークスイッチ18がオン状態
になったか否か判断し(ステップ402)、発話が開始
されたと判断すると、前回の発話から所定時間Th(こ
こでは10秒)が経過しているか否か判断し(ステップ
403)、経過している場合には音声認識回路14内の
履歴リストをクリアする(ステップ404)。そして、
前回の発話から所定時間Thが経過してない場合には、
履歴リストをクリアしない。
【0071】そして次に、音声認識回路14の制御に基
づいて、入力された音声の認識処理を行う(ステップ4
05)。そして、この認識結果で得られた候補の音声デ
ータと、履歴リストにある音声データとを照合し、履歴
リストに同じデータがある場合には、そのデータを認識
された候補の中から削除する(ステップ406)。そし
て次に、履歴リストの項目数がN個(ここでは5個)以
上か否か判断する(ステップ407)。そして、N個以
上でない場合(即ちN回連続して発話がされてない場
合)には、ステップ408に移って、このときの残りの
候補のデータの中で、最も認識度(一致度)が高かった
データを、認識された結果として、ナビゲーション装置
20の音声合成回路31に供給し、スピーカ32から音
声として出力させる。そして、この認識された結果が地
域を示す音声(即ち本例の場合には都道府県名及び市区
町村名)である場合には、その市区町村を表示させる地
図を、ナビゲーション装置20内での処理でディスプレ
イ装置40に表示させる(ステップ409)。そして、
このとき認識された結果を、履歴リストに追加し(ステ
ップ410)、ステップ402に戻り、次の発話開始ま
で待機する。
【0072】そして、ステップ407で履歴リストの項
目数がN個であると判断された場合(即ちN回連続して
発話がされた場合)には、ステップ411に移って、候
補リストの表示処理を行う。即ち、ここまでの認識処理
で認識された候補のデータを、音声認識回路14内の候
補リスト用メモリから読出し、このデータをナビゲーシ
ョン装置20に供給して、ナビゲーション装置20内の
映像信号生成回路28で候補リストの映像信号を生成さ
せ、その映像信号をディスプレイ装置40に供給して、
候補リストをディスプレイ装置40に表示させる。
【0073】このときの候補リストは、例えば図10に
示すように表示される。即ち、最も一致度が高かった順
に、一位の候補から五位程度までの候補まで表示させる
(スクロール操作などでより下位の候補まで表示させる
ようにしても良い)。このとき、地名の候補と、コマン
ドの候補とは異なる態様で表示する(例えば文字の表示
色を変える)ようにしてある。図10の例では、字体を
変えて表示させてある。
【0074】そして、この候補リストが表示された最初
の段階では、このリスト内の候補の内の一位の候補に、
選択されたことを示す印aを付与するようにしてある。
この選択する候補を示す印aは、操作キー27の操作に
よるスクロール操作で、移動させることができるが、次
にこのスクロール操作が行われたか否か判断する(ステ
ップ412)。ここで、スクロール操作が行われた場合
には、選択される候補に付与する印aの位置を移動させ
る(ステップ413)。
【0075】この状態で、操作キー27の中の決定用の
ボタンが押されたか否か判断する(ステップ414)。
この決定用のボタンが押されたと判断したときには、そ
のとき印aで示された候補が選択されたと判断し、その
候補に関するデータ(経緯度のデータ,音声出力用の文
字データなど)の読出しを音声認識装置10側に指示
し、その読出されたデータをナビゲーション装置20側
に供給させる。そして、その供給されたデータに基づい
て、音声合成回路31で、音声合成処理を行って、地名
をスピーカ32から音声として出力させる(ステップ4
15)。そして、供給された経緯度のデータに基づい
て、該当する位置の道路地図を表示させる映像信号を作
成させ、ディスプレイ装置40に選択された候補の地図
を表示させ(ステップ416)。そして、このとき選択
された結果を、履歴リストに追加し(ステップ41
7)、ステップ402に戻り、次の発話開始まで待機す
る。
【0076】そして、ステップ414で決定用のボタン
が押さないと判断された場合には、その後発話が開始、
即ちトークスイッチ18がオン状態になったか否か判断
し(ステップ418)、発話が開始されたと判断する
と、候補リストの表示を中止させて、ステップ403の
処理に戻る。そして、ステップ418で発話が開始され
ないと判断した場合には、ステップ411での候補リス
トの表示が開始されてから、所定時間Td(このTdは
例えば10秒程度の時間)が経過したか否か判断し(ス
テップ419)、この時間Tdが経過してない場合に
は、ステップ412の処理に戻り、候補リストが表示さ
れた状態を継続させる。そして、ステップ419で所定
時間Tdが経過したと判断したときには、ステップ41
2でスクロール操作が行われたか否か判断し(ステップ
420)、スクロール操作が行われた場合には、ステッ
プ412の処理に戻り、候補リストが表示された状態を
継続させる。
【0077】そして、ステップ420でスクロール操作
が行われてないと判断したときには、ステップ408に
移って、候補リストの一位の結果を音声で出力させ、こ
の一位の地名の地図を表示させる。
【0078】このように短時間に所定回(ここでは5
回)繰り返し音声入力があった場合には、このときの連
続的な入力音声信号により認識された認識対象語を、認
識度が高い順に一覧表示され、そのときの認識状態が容
易に判断できるようになると共に、その一覧表示された
中から言葉を選択できるので、音声入力による認識が困
難な場合の対処が簡単な操作で容易にできるようにな
る。
【0079】なお、図8や図9のフローチャートでは、
選択された候補が地名であり、その地名に基づいて地図
表示が行われる場合について説明したが、選択された候
補が何らかの指令(コマント)である場合には、地図表
示の代わりに対応した指令を実行させるものである。
【0080】また、上述した図8のステップ306及び
図9のステップ406の処理では、認識結果から候補リ
ストにあるものを単純に削除するようにしたが、何らか
の指令(コマンド)である場合には、その言葉を候補リ
ストから外さないようにしても良い。即ち、ステップ3
06やステップ406の代わりに、図11に示すステッ
プ501,ステップ502の処理を行うようにしても良
い。即ち、ステップ501で認識結果が地名か否か判断
し、ここで地名と判断した場合だけステップ502で認
識結果の候補から履歴リストにあるものを削除するよう
にし、認識結果が地名以外のコマンドなどである場合に
はステップ502での削除をしないで次のステップに進
むようにする。このようにすることで、何らかの指令を
行う音声の場合には、何度繰り返しても、その音声が入
力される毎に認識され、対応した動作が実行されるよう
になる。例えば、「イマナンジ」と音声で認識させて、
その結果を音声で「××時××分です」と出力させた場
合に、その時刻の音声を聞き逃した場合には、続けて再
度「イマナンジ」と音声で認識させることがあるが、こ
の場合でも、その結果が再度音声で「××時××分で
す」と出力され、対応した制御が良好に行われるように
なる。
【0081】また、候補リストを図10に示すように一
覧表示させた場合には、この一覧表示された認識対象語
を、音声合成回路31での音声合成処理で、順にスピー
カ32から音声として出力させるようにしても良い。こ
のようにすることで、ディスプレイ装置40の表示を見
なくても、認識対象語の候補が判り、ナビゲーション装
置としての使い勝手が向上する。
【0082】なお、上述実施例では音声認識装置で認識
する地名を、国内の都道府県と、市区町村の名前に限定
したが、より細かい地名や目標物の名前などまで認識す
るようにしても良い。但し、認識できる地名などを多く
すると、それだけ音声認識に必要な処理量と処理時間が
多く必要になり、認識率を高くするためからも、市区町
村の名前程度に限定するのが最も好ましい。
【0083】また、上述実施例では各地名毎の中心の座
標を、その地域の役所(市役所,区役所,町役場,村役
場)の所在地の絶対位置を示す緯度と経度のデータとし
たが、その他の位置を示す緯度と経度のデータとしても
良い。例えば、単純にその地域(市区町村)の中心の緯
度と経度のデータとしても良い。
【0084】また、このように中心の緯度と経度のデー
タを記憶させる代わりに、その地域の東西南北の端部の
座標位置のデータを記憶させるようにしても良い。この
場合には、東西の経度と南北の緯度の4つのデータがあ
れば良い。
【0085】また、上述実施例では音声認識装置内の音
声認識回路14で、認識した音声を文字コードに変換し
てから、この文字コードを経緯度変換回路16で経度,
緯度のデータに変換するようにしたが、認識した音声よ
り直接経度,緯度のデータに変換するようにしても良
い。また、このように直接経度,緯度のデータに変換さ
せない場合でも、これらの変換データを記憶するROM
15とROM17は、同一のメモリで構成させて、例え
ば地名の記憶エリアを共用するようにしても良い。
【0086】また、上述実施例ではGPSと称される測
位システムを使用したナビゲーション装置に適用した
が、他の測位システムによるナビゲーション装置にも適
用できることは勿論である。
【0087】
【発明の効果】本発明の音声認識装置によると、認識さ
れる音声が一回目で正しく認識されなく、認識される音
声を言い直したとき、最初に誤って認識された認識対象
語が、音声処理部で認識できる認識対象語の候補から除
かれるので、正しく認識される可能性が高くなり、認識
率を実質的に向上させることができる。
【0088】また、この場合に認識される音声として、
特定の地域及び所定のコマンドを示す認識対象語が用意
された場合に、前回認識された音声の認識対象語が、所
定のコマンドを示す音声であるとき、この認識対象語
を、音声認識できる認識対象語から除かないようにした
ことで、地域を示す音声の場合にだけ、候補から除く処
理が行われ、同じコマンドを繰り返し音声入力させた場
合の誤動作を防止することができる。
【0089】また、所定回数繰り返し音声入力があった
場合には、このときの連続的な入力音声信号により認識
された認識対象語を、認識度が高い順に一覧表示させ、
その表示の中から選択させることで、繰り返し誤認識さ
れる場合であっても、簡単に対処ができるようになる。
【0090】また本発明の音声認識方法によると、認識
される音声が一回目で正しく認識されなく、認識される
音声を言い直したとき、最初に誤って認識された認識対
象語が、認識できる認識対象語の候補から除かれるの
で、正しく認識される可能性が高くなる。
【0091】また本発明のナビゲーション装置による
と、認識される音声が一回目で正しく認識されなく、認
識される音声を言い直したとき、最初に誤って認識され
た認識対象語が、認識できる認識対象語の候補から除か
れるので、正しく認識されて、正しい地図表示などのナ
ビゲーション装置としての動作が行われる可能性が高く
なる。
【0092】また、この場合に認識される音声として、
特定の地域及び所定のコマンドを示す認識対象語が用意
された場合に、前回認識された音声の認識対象語が、所
定のコマンドを示す音声であるとき、この認識対象語
を、音声認識できる認識対象語から除かないようにした
ことで、地域を示す音声の場合にだけ、候補から除く処
理が行われ、同じコマンドを繰り返し音声入力させた場
合のナビゲーション装置としての誤動作を防止すること
ができる。
【0093】また、所定回数繰り返し音声入力があった
場合には、このときの連続的な入力音声信号により認識
された認識対象語を、認識度が高い順に一覧表示させる
ことで、そのときの認識状態が容易に判断できれように
なる。
【0094】また、一覧表示された認識対象語を、上記
音声出力部から順に音声として出力するようにしたこと
で、表示状態を見なくても、音声により認識対象語が判
るようになる。
【0095】また、所定の操作手段の操作に基づいて一
覧表示された認識対象語の中から選択できるようにした
ことで、繰り返し誤認識される場合であっても、簡単に
必要な認識対象語を探して、その語による地図表示など
ができるようになる。
【0096】また、一覧表示された状態で、所定の操作
手段の操作が所定時間ないとき、一覧表示された認識対
象語の中で、認識された可能性が最も高い候補の認識対
象語を、自動的に選択するようにしたことで、一覧表示
から地図表示への切換えを適切な態様で行えるようにな
る。
【0097】さらに、一覧表示が行われている間に、音
声信号入力手段に音声信号が入力されたとき、この入力
された音声信号の音声認識処理を音声処理部で行うよう
にしたことで、一覧表示を確認した上で再度音声を入力
させた場合の対処ができるようになり、音声入力による
操作が良好にできるようになる。
【0098】また本発明のナビゲート方法によると、認
識される音声が一回目で正しく認識されなく、認識され
る音声を言い直したとき、最初に誤って認識された認識
対象語が、認識できる認識対象語の候補から除かれるの
で、正しく認識されて、正しい地図表示などのナビゲー
トが行われる可能性が高くなる。
【0099】また本発明の自動車によると、入力した音
声の認識に基づいて地図を表示させる場合に、認識され
る音声が一回目で正しく認識されなく、認識される音声
を言い直したとき、最初に誤って認識された認識対象語
が、認識できる認識対象語の候補から除かれるので、正
しく認識されて、正しい地図表示が行われる可能性が高
くなる。
【図面の簡単な説明】
【図1】本発明の一実施例を示す構成図である。
【図2】一実施例の装置を自動車に組み込んだ状態を示
す斜視図である。
【図3】一実施例の装置を自動車に組み込んだ場合の運
転席の近傍を示す斜視図である。
【図4】一実施例による音声認識用メモリの記憶エリア
構成を示す説明図である。
【図5】一実施例による経緯度変換用メモリの記憶エリ
ア構成を示す説明図である。
【図6】一実施例の音声認識による処理を示すフローチ
ャートである。
【図7】一実施例のナビゲーション装置での表示処理を
示すフローチャートである。
【図8】一実施例の音声認識の再実行時の処理を示すフ
ローチャートである。
【図9】一実施例の音声認識を複数回実行したときの処
理を示すフローチャートである。
【図10】一実施例による候補リストの表示例を示す説
明図である。
【図11】一実施例の履歴リスト削除時の処理例を示す
フローチャートである。
【符号の説明】
10 音声認識装置 11 マイクロフォン 12 アナログ/デジタル変換器 13 デジタル音声処理回路(DSP) 14 音声認識回路 15 音声認識データ記憶用ROM 16 経緯度変換回路 17 経緯度変換データ記憶用ROM 18 トークスイッチ 20 ナビゲーション装置 23 演算回路 24 CD−ROMドライバ 25 RAM 26 車速センサ 27 操作キー 28 映像信号生成回路 31 音声合成回路 32 スピーカ 40 ディスプレイ装置 50 自動車
フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G09B 29/10 G09B 29/10 A (72)発明者 角田 弘史 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 浅野 康治 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 小川 浩明 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 表 雅則 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 南野 活樹 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 音声信号入力手段と、 該音声信号入力手段に入力された音声信号から、予め決
    められた複数の認識対象語の音声を認識する処理を行う
    音声処理部と、 該音声処理部が認識した認識対象語の音声を出力する音
    声出力部と、 上記音声信号入力手段に音声信号が入力されてから所定
    時間以内に再び音声信号が入力したことを判断する判断
    手段と、 この判断手段が所定時間以内の入力を判断したとき、上
    記音声処理部で認識できる認識対象語から、前回認識さ
    れた音声の認識対象語を除いて、音声認識処理を行う制
    御手段とを備えた音声認識装置。
  2. 【請求項2】 音声信号入力手段と、 該音声信号入力手段に入力された音声信号から、少なく
    とも特定の地域及び所定のコマンドを示す認識対象語の
    音声を認識する処理を行う音声処理部と、 該音声処理部が認識した認識対象語の音声を出力する音
    声出力部と、 上記音声信号入力手段に音声信号が入力されてから所定
    時間以内に再び音声信号が入力したことを判断する判断
    手段と、 この判断手段が所定時間以内の入力を判断したとき、上
    記音声処理部で認識できる認識対象語から、前回認識さ
    れた音声の認識対象語を除いて、音声認識処理を行うと
    共に、前回認識された音声の認識対象語が、所定のコマ
    ンドを示す音声であるとき、この認識対象語を、音声認
    識できる認識対象語から除かないようにした制御手段を
    備えた音声認識装置。
  3. 【請求項3】 音声信号入力手段と、 該音声信号入力手段に入力された音声信号から、複数の
    認識対象語の音声を認識する処理を行う音声処理部と、 該音声処理部が認識した認識対象語の音声を出力する音
    声出力部と、 所定時間以内に上記音声信号入力手段に所定数の複数単
    位の音声信号が連続的に入力されたことを判断する判断
    手段と、 この判断手段が所定時間以内の所定数の複数単位の音声
    信号の入力を判断したとき、このときの連続的な入力音
    声信号により認識された認識対象語を、認識度が高い順
    に一覧表示させる表示手段と、 該表示手段に表示された認識対象語の中から選択する選
    択手段と、 上記表示手段での一覧表示が一定時間経過して上記選択
    手段での選択がないとき、上記表示手段に表示された認
    識対象語の中の最も認識度が高い認識対象語を自動的に
    選択する制御手段とを備えた音声認識装置。
  4. 【請求項4】 上記一覧表示された認識対象語を、上記
    音声出力部から順に音声として出力するようにした請求
    項3記載の音声認識装置。
  5. 【請求項5】 入力した音声信号から予め決められた複
    数の認識対象語の音声を認識し、 この認識した認識対象語の音声を出力すると共に、 この音声認識から所定時間以内に、再度入力した音声信
    号から上記複数の認識対象語の音声を認識するとき、 前回認識された音声の認識対象語を除いて、音声認識処
    理を行うようにした音声認識方法。
  6. 【請求項6】 音声信号入力手段と、 該音声信号入力手段に入力された音声信号から、特定の
    地域を示す音声を含む予め決められた複数の認識対象語
    の音声を認識処理する音声処理部と、 該音声処理部が認識した認識対象語の音声を出力する音
    声出力部と、 上記音声処理部が認識した特定の地域のデータを、この
    地域の絶対的な座標位置データに変換する変換部と、 地図データの記憶手段と、 上記変換部で変換された座標位置データで示される位置
    の地図データを上記記憶手段から読出して、地図表示用
    映像信号を作成する地図データ読出し手段と、 上記音声信号入力手段に音声信号が入力されてから所定
    時間以内に再び音声信号が入力したことを判断する判断
    手段と、 この判断手段が所定時間以内の入力を判断したとき、上
    記音声処理部で認識できる認識対象語から、前回認識さ
    れた音声の認識対象語を除いて、音声認識処理を行う制
    御手段とを備えたナビゲーション装置。
  7. 【請求項7】 音声信号入力手段と、 該音声信号入力手段に入力された音声信号から、特定の
    地域を示す音声を含む予め決められた複数の認識対象語
    の音声を認識処理する音声処理部と、 該音声処理部が認識した認識対象語の音声を出力する音
    声出力部と、 上記音声処理部が認識した特定の地域のデータを、この
    地域の絶対的な座標位置データに変換する変換部と、 地図データの記憶手段と、 上記変換部で変換された座標位置データで示される位置
    の地図データを上記記憶手段から読出して、地図表示用
    映像信号を作成する地図データ読出し手段と、 上記音声信号入力手段に音声信号が入力されてから所定
    時間以内に再び音声信号が入力したことを判断する判断
    手段と、 この判断手段が所定時間以内の入力を判断したとき、前
    回認識された音声の認識対象語が特定の地域を示す音声
    である場合に、上記音声処理部で認識できる認識対象語
    から、前回認識された音声の認識対象語を除いて、音声
    認識処理を行う制御手段とを備えたナビゲーション装
    置。
  8. 【請求項8】 音声信号入力手段と、 該音声信号入力手段に入力された音声信号から、特定の
    地域の音声を含む予め決められた複数の認識対象語の音
    声を認識処理する音声処理部と、 該音声処理部が認識した認識対象語の音声を出力する音
    声出力部と、 上記音声処理部が認識した特定の地域のデータを、この
    地域の絶対的な座標位置データに変換する変換部と、 地図データの記憶手段と、 上記変換部で変換された座標位置データで示される位置
    の地図データを上記記憶手段から読出して、地図表示用
    映像信号を作成する映像信号作成手段と、 所定時間以内に上記音声信号入力手段に所定数の複数単
    位の音声信号が連続的に入力されたことを判断する判断
    手段と、 この判断手段が所定時間以内の所定数の複数単位の音声
    信号の入力を判断したとき、上記映像信号作成手段で、
    このときの連続的な入力音声信号により認識された認識
    対象語を一覧表示させる映像信号を作成させる制御手段
    とを備えたナビゲーション装置。
  9. 【請求項9】 上記一覧表示された認識対象語を、上記
    音声出力部から順に音声として出力するようにした請求
    項8記載のナビゲーション装置。
  10. 【請求項10】 所定の操作手段の操作に基づいて、上
    記一覧表示された認識対象語より、上記変換部に供給す
    る特定の地域のデータを選択するようにした請求項8記
    載のナビゲーション装置。
  11. 【請求項11】 上記所定の操作手段の操作が所定時間
    ないとき、上記一覧表示された認識対象語の中で、認識
    された可能性が最も高い候補の認識対象語を、変換部に
    供給する特定の地域のデータとするようにした請求項1
    0記載のナビゲーション装置。
  12. 【請求項12】 上記一覧表示された映像信号を作成中
    に、 上記音声信号入力手段に音声信号が入力されたとき、こ
    の入力された音声信号の音声認識処理を上記音声処理部
    で行うようにした請求項8記載のナビゲーション装置。
  13. 【請求項13】 入力した音声信号から特定の地域を示
    す音声を含む予め決められた複数の認識対象語の音声を
    認識し、 この認識した認識対象語の音声を出力し、 この認識した特定の地域のデータを、この地域の絶対的
    な座標位置データに変換し、 この変換された座標位置データで示される位置の地図デ
    ータを表示し、 この音声認識から所定時間以内に、再度入力した音声信
    号から上記複数の認識対象語の音声を認識するとき、 前回認識された音声の認識対象語を除いて、音声認識処
    理を行うようにしたナビゲート方法。
  14. 【請求項14】 車内の所定位置に配された表示手段
    に、地図を表示させる装置を備えた自動車において、 音声信号入力手段と、 該音声信号入力手段に入力された音声信号から、特定の
    地域を示す音声を含む予め決められた複数の認識対象語
    の音声を認識処理する音声処理部と、 該音声処理部が認識した認識対象語の音声を出力する音
    声出力部と、 上記音声処理部が認識した特定の地域のデータを、この
    地域の絶対的な座標位置データに変換する変換部と、 地図データの記憶手段と、 上記変換部で変換された座標位置データで示される位置
    の地図データを上記記憶手段から読出して、地図表示用
    映像信号を作成して上記表示手段に表示させる地図デー
    タ読出し手段と、 上記音声信号入力手段に音声信号が入力されてから所定
    時間以内に再び音声信号が入力したことを判断する判断
    手段と、 この判断手段が所定時間以内の入力を判断したとき、上
    記音声処理部で認識できる認識対象語から、前回認識さ
    れた音声の認識対象語を除いて、音声認識処理を行う制
    御手段とを備えた自動車。
JP7267541A 1995-10-13 1995-10-16 音声認識装置及びナビゲーション装置 Expired - Lifetime JP2947143B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP7267541A JP2947143B2 (ja) 1995-10-16 1995-10-16 音声認識装置及びナビゲーション装置
US08/731,158 US6067521A (en) 1995-10-16 1996-10-10 Interrupt correction of speech recognition for a navigation device
KR1019960046103A KR100455108B1 (ko) 1995-10-13 1996-10-15 음성인식장치,음성인식방법,지도표시장치,네비게이션장치,네비게이션방법및네비게이션기능을갖춘자동차
US09/108,826 US6253174B1 (en) 1995-10-16 1998-07-01 Speech recognition system that restarts recognition operation when a new speech signal is entered using a talk switch

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7267541A JP2947143B2 (ja) 1995-10-16 1995-10-16 音声認識装置及びナビゲーション装置

Publications (2)

Publication Number Publication Date
JPH09114487A true JPH09114487A (ja) 1997-05-02
JP2947143B2 JP2947143B2 (ja) 1999-09-13

Family

ID=17446259

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7267541A Expired - Lifetime JP2947143B2 (ja) 1995-10-13 1995-10-16 音声認識装置及びナビゲーション装置

Country Status (1)

Country Link
JP (1) JP2947143B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1138994A (ja) * 1997-07-17 1999-02-12 Denso Corp 音声認識装置及びナビゲーションシステム
JPH11125533A (ja) * 1997-10-21 1999-05-11 Sony Corp ナビゲーション装置及びナビゲート方法
JP2007094001A (ja) * 2005-09-29 2007-04-12 Konami Digital Entertainment:Kk 音声情報処理装置、音声情報処理方法、ならびに、プログラム
JP2008164809A (ja) * 2006-12-27 2008-07-17 Denso Corp 音声認識装置
JP2016075728A (ja) * 2014-10-03 2016-05-12 株式会社日立製作所 設備点検支援装置
CN108133706A (zh) * 2017-12-21 2018-06-08 深圳市沃特沃德股份有限公司 语义识别方法及装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3654262B2 (ja) * 2002-05-09 2005-06-02 株式会社デンソー 音声認識装置及びナビゲーションシステム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1138994A (ja) * 1997-07-17 1999-02-12 Denso Corp 音声認識装置及びナビゲーションシステム
JPH11125533A (ja) * 1997-10-21 1999-05-11 Sony Corp ナビゲーション装置及びナビゲート方法
JP2007094001A (ja) * 2005-09-29 2007-04-12 Konami Digital Entertainment:Kk 音声情報処理装置、音声情報処理方法、ならびに、プログラム
JP4722652B2 (ja) * 2005-09-29 2011-07-13 株式会社コナミデジタルエンタテインメント 音声情報処理装置、音声情報処理方法、ならびに、プログラム
JP2008164809A (ja) * 2006-12-27 2008-07-17 Denso Corp 音声認識装置
JP2016075728A (ja) * 2014-10-03 2016-05-12 株式会社日立製作所 設備点検支援装置
CN108133706A (zh) * 2017-12-21 2018-06-08 深圳市沃特沃德股份有限公司 语义识别方法及装置
CN108133706B (zh) * 2017-12-21 2020-10-27 深圳市沃特沃德股份有限公司 语义识别方法及装置

Also Published As

Publication number Publication date
JP2947143B2 (ja) 1999-09-13

Similar Documents

Publication Publication Date Title
US6253174B1 (en) Speech recognition system that restarts recognition operation when a new speech signal is entered using a talk switch
JP2907079B2 (ja) ナビゲーション装置,ナビゲート方法及び自動車
US5956684A (en) Voice recognition apparatus, voice recognition method, map displaying apparatus, map displaying method, navigation apparatus, navigation method and car
JPH09292255A (ja) ナビゲーション方法及び装置
JP2947143B2 (ja) 音声認識装置及びナビゲーション装置
JP3892338B2 (ja) 単語辞書登録装置および単語登録用プログラム
JP3677833B2 (ja) ナビゲーション装置,ナビゲート方法及び自動車
JP2000338993A (ja) 音声認識装置、その装置を用いたナビゲーションシステム
JP3818352B2 (ja) ナビゲーション装置及び記憶媒体
JPH09114488A (ja) 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車
JP2877045B2 (ja) 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車
JPH08328584A (ja) 音声認識装置、音声認識方法及びナビゲーション装置
JP2005227369A (ja) 音声認識装置および方法と車載ナビゲーション装置
JPWO2006028171A1 (ja) データ提示装置、データ提示方法、データ提示プログラムおよびそのプログラムを記録した記録媒体
JPH09113287A (ja) 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車
KR100455108B1 (ko) 음성인식장치,음성인식방법,지도표시장치,네비게이션장치,네비게이션방법및네비게이션기능을갖춘자동차
JPH09114485A (ja) 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車
JP3484818B2 (ja) 音声認識装置及びナビゲーション装置
JPH09114369A (ja) ナビゲーション装置,ナビゲート方法及び自動車
JPH1062198A (ja) ナビゲーション装置
JPH09114490A (ja) 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車
JP2000074685A (ja) 車載装置における検索方法と車載ナビゲーション装置
JP2003015688A (ja) 音声認識方法および装置
JPH08166797A (ja) 音声対話型制御システム
KR100466737B1 (ko) 네비게이션장치,네비게이션방법및자동차

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080702

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090702

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100702

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100702

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110702

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120702

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120702

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130702

Year of fee payment: 14

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term