JPH1062199A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH1062199A
JPH1062199A JP8222651A JP22265196A JPH1062199A JP H1062199 A JPH1062199 A JP H1062199A JP 8222651 A JP8222651 A JP 8222651A JP 22265196 A JP22265196 A JP 22265196A JP H1062199 A JPH1062199 A JP H1062199A
Authority
JP
Japan
Prior art keywords
speech recognition
dictionary
voice
recognition
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8222651A
Other languages
English (en)
Inventor
Shigeo Onoki
重夫 大野木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP8222651A priority Critical patent/JPH1062199A/ja
Publication of JPH1062199A publication Critical patent/JPH1062199A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Instructional Devices (AREA)
  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Abstract

(57)【要約】 【課題】 従来は、音声辞書の登録内容を地域でグルー
プ分けした上で、現在位置に基づく優先順位で音声辞書
のグループを決定しているために、優先順位の低いグル
ープとされた内容を音声入力しようとする場合、音声認
識を早急に行うことができない。 【解決手段】 複数の認識対象語、又はこの複数の認識
対象語に加えて複数の認識対象語を所定ルールでまとめ
る複数の総括語とよりなる音声認識辞書M0を生成する
辞書生成手段M2を有し、音声入力が総括語と認識され
たとき、認識された総括語でまとめられている複数の認
識対象語、又はこの複数の認識対象語に加えて複数の認
識対象語をまとめる下位の複数の総括語とよりなる音声
認識辞書M0を生成して多層構造の音声認識辞書を用い
て音声認識を行う。このため、1つの音声認識辞書の語
彙数が少なくなり、音声入力の認識率が向上する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声認識装置に関
し、音声入力を認識する装置に関する。
【0002】
【従来の技術】従来より、音声によって入力される指示
を認識し、その指示で車載用ナビゲーション装置を操作
する音声認識装置がある。例えば特開平7−64480
号公報には、音声による入力語のデータと、音声辞書に
複数登録されているナビゲーション用地図の表示内容な
どの車載情報処理装置の操作内容に係る語彙の基準デー
タとを比較照合して、両データの一致度をみて入力語を
認識する車載情報処理用音声認識装置で、地域に応じて
登録内容がグループ分けされた音声辞書と、車両の地図
上における現在位置を求めるナビゲーション装置と、そ
のナビゲーション装置によって求められている現在位置
に対する距離にもとづいて、入力語を認識する際に用い
る音声辞書のグループを優先順位をもって決定する音声
辞書アクセス制御手段を用いることが記載されている。
【0003】
【発明が解決しようとする課題】従来装置では、音声辞
書の登録内容を地域でグループ分けした上で、ナビゲー
ション装置で求められた現在位置に基づく優先順位で音
声辞書のグループを決定しているために、優先順位の低
いグループとされた内容を音声入力しようとする場合、
音声認識を早急に行うことができず、操作性が悪化する
という問題があった。
【0004】本発明は、上記の点に鑑みなされたもの
で、音声認識辞書を多層構造とすることで音声認識率が
高く、早急かつ確実に音声入力を認識できる音声認識装
置を提供することを目的とする。
【0005】
【課題を解決するための手段】請求項1に記載の発明
は、図1(A)に示すように、認識手段M1で、音声入
力を音声認識辞書M0とマッチングして認識する音声認
識装置において、複数の認識対象語、又はこの複数の認
識対象語に加えて複数の認識対象語を所定ルールでまと
める複数の総括語とよりなる音声認識辞書M0を生成す
る辞書生成手段M2を有し、音声入力が上記総括語と認
識されたとき、認識された総括語でまとめられている複
数の認識対象語、又はこの複数の認識対象語に加えて複
数の認識対象語をまとめる下位の複数の総括語とよりな
る音声認識辞書M0を生成して多層構造の音声認識辞書
を用いて音声認識を行う。
【0006】このように、複数の認識対象語と複数の総
括語とよりなる音声認識辞書とを生成し、音声入力が総
括語のときはその総括語から複数の認識対象語と下位の
複数の総括語とよりなる音声認識辞書を生成することに
より多層構造の音声認識辞書を用いるため、1つの音声
認識辞書の語彙数が少なくなり、音声入力の認識率が向
上して音声入力を早急かつ確実に認識できる。
【0007】請求項2に記載の発明は、図1(B)に示
すように、請求項1記載の音声認識装置において、前記
辞書生成手段で生成する複数の対象語、又はこの複数の
認識対象語と複数の総括語に対応して音声入力に対する
案内を行う案内手段M3を有する。
【0008】このように、生成する音声認識辞書に対応
して、どのような音声入力を行うかを案内するため、音
声認識辞書に合わせた音声を入力することができ、更に
音声入力の認識率が向上する。請求項3に記載の発明
は、請求項1又は2記載の音声認識装置において、前記
辞書生成手段M2は、現在位置に基づき目的地の候補名
を複数の認識対象語として生成する。
【0009】このため、現在位置に近い目的地について
は少ない回数の音声認識で認識できる。
【0010】
【発明の実施の形態】図2は本発明装置を適用した車載
ナビゲーション装置の一実施例のブロック図を示す。同
図中、CD−ROM装置10は音声認識辞書データベー
スのCD−ROM12及び地図データベースのCD−R
OM14を内蔵している。制御部16の制御により、C
D−ROM装置10がCD−ROM12から読み出した
音声認識辞書データはメモリ18に格納され、またCD
−ROM装置10がCD−ROM14から読み出した地
図データはメモリ20に格納される。
【0011】現在位置標定部22はGPSアンテナ23
を含むGPS(グローバル・ポジショニング・システ
ム)装置と、車速センサや車輪速センサや地磁気センサ
等の各種自律走行用センサ部とより構成されている。G
PS装置は少なくとも3個のGPS衛星からの信号を受
信して、各衛星の位置及び各衛星までの距離を算出し、
三角測量の原理によって自車の緯度経度を標定する。ま
た、自律走行用センサ部の各センサの出力に基づいて、
GPS衛星からの信号が受信できなくなっても自車両の
位置を算出することができる。例えば、車輪速センサ出
力により自車両が単位時間にどのくらい移動したかを算
出し、車輪速センサと地磁気センサの出力により自車両
がどのくらい進行方向を変化させたかを算出する。また
進行方向の変化はジャイロシステムによって行っても良
い。この現在位置標定部22で得た現在位置は制御部1
6に通知される。
【0012】マイクロホン24は運転者の発声した音声
入力を音声信号に変換する。この音声信号はA/Dコン
バータ26でディジタル化されて制御部16に供給され
る。制御部16は上記の音声入力データが入力される
と、メモリ18に格納されている音声認識辞書データに
基づいて音声認識を行う。また、制御部16は操作部2
8よりのコマンド入力及び音声認識結果に基づいて音声
合成部30に対して音声出力の指示を行う。音声合成部
30はこの指示に従って音声信号を合成して出力する。
この音声信号はアンプ32で増幅されてスピーカ34に
供給され、発音される。
【0013】また、制御部16は現在位置標定部22で
得た現在位置や音声認識で得た目的地の位置を表示する
ための地図データをCD−ROM14からメモリ20に
読み出し、メモリ20から画像生成部38に供給する。
画像生成部38は供給される地図データから表示用の映
像信号を生成してディスプレイ40に供給し、ディスプ
レイ40に地図が表示される。
【0014】操作部28は例えば図3に示す如く、ステ
アリングホイール50の側部に取り付けられている。操
作部28にはトリガスイッチ28a,リターンスイッチ
28b,アップスイッチ28c,ダウンスイッチ28d
が設けられている。トリガスイッチ28aは決定を入力
するためのスイッチである。リターンスイッチ28bは
上の階層に戻ることを入力するためのスイッチである。
アップスイッチ28c及びダウンスイッチ28dは複数
の候補のうちのいずれか1つを選択する場合に、アップ
スイッチ28cで1つ前の候補に選択を移行させるとき
に使用し、ダウンスイッチ28dで1つ後の候補に選択
を移行させるときに使用する。
【0015】ここで、本発明においては例えば図4に示
す如く3階層に分けて音声認識を行う。これは音声入力
とマッチングされる音声認識辞書の語彙数が多くなると
認識率が悪化するため階層構造として1階層当りの語彙
数を少なくしている。階層1では認識対象語として車両
の現在位置を中心とする所定距離K1(例えばK1は3
0km)内の近隣施設名と、複数の認識対象語をまとめる
総括語として施設ジャンル名とを持つ音声認識辞書を用
いる。
【0016】近隣施設名としては、駅、役所、警察、病
院、デパート、ホール、インターチェンジ、サービスエ
リア、パーキングエリア等であり、これらの施設名には
夫々の位置情報(例えば緯度経度)が付加されている。
施設ジャンル名としては、空港、ゴルフ場、動植物園、
公園、美術館、博物館、水族館、名所、温泉、スキー
場、寺社、遊園地、ホテル、キャンプ場等であり、これ
らは各ジャンルについて複数の施設があるため位置情報
は付加されてない。
【0017】このように階層1は位置情報を持つ施設名
と、位置情報を持たない施設ジャンル名とから構成され
ているため、施設名が音声入力された場合はその位置情
報から地図表示が可能であるが、施設ジャンル名が音声
入力された場合には、その入力された施設ジャンルの内
のどの施設かを特定するために階層2に進む。また、上
記の階層1の音声入力を促すために例えば「お近くの利
用施設名又は利用される施設の種類を発声して下さ
い。」等のガイドアナウンスを行う。
【0018】次に階層2では認識対象語として車両の現
在位置を中心とする所定距離K2(K2≧K1であり、
例えばK2=100km)内の音声入力で選択されたジャ
ンルの施設名と、総括語として全国の都道府県名とを持
つ音声認識辞書を用いる。選択されたジャンルが駅であ
り、現在位置が皇居付近であれば、選択されたジャンル
の施設名としては東京駅、有楽町駅、新橋駅等であり、
これらの施設名には夫々の位置情報(例えば緯度経度)
が付加されている。都道府県名は東京、神奈川、千葉等
であり、これらの地域には複数の施設があるため位置情
報は付加されてない。
【0019】このように階層2は位置情報を持つ施設名
と、位置情報を持たない都道府県名とから構成されてい
るため、施設名が音声入力された場合はその位置情報か
ら地図表示が可能であるが、都道府県名が音声入力され
た場合には、その入力された都道府県の内のどの施設か
を特定するために階層3に進む。また、上記の階層2の
音声入力を促すために例えば「お近くの利用施設名又は
都道府県名を発声して下さい。」等のガイドアナウンス
を行う。なお、都道府県名を選択しただけでは選択しよ
うとする施設の数が多すぎる場合には市区群名まで選択
するようにしても良い。
【0020】次に階層3では認識対象語として音声入力
で選択されたジャンル及び都道府県等の地域の施設名の
音声認識辞書を用いる。選択されたジャンルが駅であ
り、都道府県名が東京都であれば、施設名としては東京
駅、有楽町駅、新橋駅等であり、これらの施設名には夫
々の位置情報(例えば緯度経度)が付加されている。
【0021】このように階層3は位置情報を持つ施設名
から構成されているため、施設名が音声入力された場合
はその位置情報から地図表示が可能である。また、上記
の階層3の音声入力を促すために例えば「利用される施
設名を発声して下さい。」等のガイドアナウンスを行
う。
【0022】図5は制御部16が実行する音声認識処理
のフローチャートを示す。この処理は電源の投入により
開始する。同図中、ステップS10では現在位置標定部
22で得た現在位置を読み取る。また、ステップS12
で階層iに1をセットする。次にステップS14に進ん
で階層iのガイドアナウンスを行うための指示を音声合
成部30に対して出力し、ガイドアナウンスを発音させ
る。また、ステップS16で階層iの音声認識辞書を生
成するためCD−ROM装置10をアクセスしてCD−
ROM12から必要な音声認識辞書データを読み出し、
生成された音声認識辞書はメモリ18に格納される。
【0023】この後、ステップS18で操作部28のト
リガスイッチ28aが押されるのを待つ。トリガスイッ
チ28aが押されてオンとなると、ステップS20で、
このトリガスイッチ28aが押されている間にマイク2
4で収音された音声の音声入力データが取り込まれる。
そしてステップS22で取り込まれた音声入力データが
メモリ18に格納されている階層iの音声認識辞書とマ
ッチングされて音声認識が行われる。次のステップS2
4では音声入力が認識されたか否かを判別し、認識され
なかった場合はステップS26で「もう一度繰り返し発
声して下さい」等の再トライアナウンスを行うための指
示を音声合成部30に対して出力し、このアナウンスを
発音させてステップS24に進む。
【0024】ステップS24で音声入力が認識された場
合はステップS28に進み、「○○を入力しました」等
の確認アナウンスを行うための指示を音声合成部30に
対して出力し、この確認アナウンスを発声させる。これ
と共に、認識結果の取り込みを行う。ここで、施設名が
音声入力された場合にはその施設名の選択が行われる。
なお、確認アナウンス内の○○は認識した音声入力その
ものである。
【0025】ステップS28を実行するとステップS3
0に進み、認識された音声入力が位置情報を持つ施設名
であるか否かを判別する。音声入力が施設名の場合はス
テップS32に進んで地図表示を行い、音声入力が施設
名でない場合はステップS34に進む。音声入力が設定
名でない、つまり、施設ジャンル名、又は都道府県名の
場合は階層iが1又は2であるためステップS34で階
層iを1だけインクリメントしてステップS14に進
む。
【0026】ステップS32では認識された施設名に付
加された位置情報からこの位置を中心とする地図を表示
するためCD−ROM装置10をアクセスしてCD−R
OM14から上記の地図データを読み出してメモリ20
に格納し、画像生成部38にメモリ20の地図データを
ディスプレイ40に表示するよう指示を出す。これによ
って音声入力された施設を中心とする地図がディスプレ
イ40に表示され、制御部16は処理を終了する。
【0027】ところで、ステップS32の前処理とし
て、例えば階層2又は3における音声入力で施設名「東
京駅」、「上野駅」、「新宿駅」等の候補の中から「東
京駅」が認識された場合、ディスプレイ40に図6に示
すように候補の施設名60〜62を表示し、音声入力に
より選択した施設名60を例えば反転表示する。この状
態で図3に示すダウンスイッチ28dを押して1つ後
(下方)の施設名61に選択変更し、またアップスイッ
チ28cを押して1つ前(上方)の施設名に選択変更す
る。そしてトリガスイッチ28aを押すことにより選択
している施設名の地図表示を決定する構成としても良
い。なお、選択変更された施設名の確認アナウンスを行
っても良い。
【0028】上記のステップS14が案内手段M3に対
応し、ステップS16が辞書生成手段M2に対応し、ス
テップS22が認識手段M1に対応する。このように、
複数の認識対象語としての施設名と複数の総括語として
の施設ジャンル名や都道府県名とよりなる音声認識辞書
とを生成し、音声入力が総括語のときはその総括語から
複数の認識対象語と下位の複数の総括語とよりなる音声
認識辞書を生成することにより多層構造の音声認識辞書
を用いるため、1つの音声認識辞書の語彙数が少なくな
り、音声入力の認識率が向上して音声入力を早急かつ確
実に認識できる。
【0029】また、生成する音声認識辞書に対応して、
どのような音声入力を行うかを案内するため、音声認識
辞書に合わせた音声を入力することができ、更に音声入
力の認識率が向上する。更に、音声認識辞書には、現在
位置から所定距離内の施設名が認識対象語として含まれ
ているので、現在位置に近い目的地については少ない回
数の音声認識で認識できる。
【0030】
【発明の効果】上述の如く、請求項1に記載の発明は、
音声入力を音声認識辞書とマッチングして認識する音声
認識装置において、複数の認識対象語、又はこの複数の
認識対象語に加えて複数の認識対象語を所定ルールでま
とめる複数の総括語とよりなる音声認識辞書を生成する
辞書生成手段を有し、音声入力が上記総括語と認識され
たとき、認識された総括語でまとめられている複数の認
識対象語、又はこの複数の認識対象語に加えて複数の認
識対象語をまとめる、下位の複数の総括語とよりなる音
声認識辞書を生成して多層構造の音声認識辞書を用いて
音声認識を行う。
【0031】このように、複数の認識対象語と複数の総
括語とよりなる音声認識辞書とを生成し、音声入力が総
括語のときはその総括語から複数の認識対象語と下位の
複数の総括語とよりなる音声認識辞書を生成することに
より多層構造の音声認識辞書を用いるため、1つの音声
認識辞書の語彙数が少なくなり、音声入力の認識率が向
上して音声入力を早急かつ確実に認識できる。
【0032】また、請求項2に記載の発明は、請求項1
記載の音声認識装置において、前記辞書生成手段で生成
する複数の対象語、又はこの複数の認識対象語と複数の
総括語に対応して音声入力に対する案内を行う案内手段
を有する。このように、生成する音声認識辞書に対応し
て、どのような音声入力を行うかを案内するため、音声
認識辞書に合わせた音声を入力することができ、更に音
声入力の認識率が向上する。
【0033】また、請求項3に記載の発明は、請求項1
又は2記載の音声認識装置において、前記辞書生成手段
M2は、現在位置に基づき目的地の候補名を複数の認識
対象語として生成する。このため、現在位置に近い目的
地については少ない回数の音声認識で認識できる。
【図面の簡単な説明】
【図1】本発明の原理図である。
【図2】本発明装置のブロック図である。
【図3】操作部の平面図である。
【図4】音声認識辞書データの階層構造を説明するため
の図である。
【図5】音声認識処理のフローチャートである。
【図6】画像表示を示す図である。
【符号の説明】
10 CD−ROM装置 12,14 CD−ROM 16 制御部 18,20 メモリ 22 現在位置標定部 24 マイクロホン 26 A/Dコンバータ 28 操作部 30 音声合成部 32 アンプ 34 スピーカ 38 画像生成部 40 ディスプレイ M0 音声認識辞書 M1 認識手段 M2 辞書生成手段 M3 案内手段
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G10L 3/00 561 G10L 3/00 561G

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 音声入力を音声認識辞書とマッチングし
    て認識する音声認識装置において、 複数の認識対象語、又はこの複数の認識対象語に加えて
    複数の認識対象語を所定ルールでまとめる複数の総括語
    とよりなる音声認識辞書を生成する辞書生成手段を有
    し、 音声入力が上記総括語と認識されたとき、認識された総
    括語でまとめられている複数の認識対象語、又はこの複
    数の認識対象語に加えて複数の認識対象語をまとめる下
    位の複数の総括語とよりなる音声認識辞書を生成して多
    層構造の音声認識辞書を用いて音声認識を行うことを特
    徴とする音声認識装置。
  2. 【請求項2】 請求項1記載の音声認識装置において、 前記辞書生成手段で生成する複数の対象語、又はこの複
    数の認識対象語と複数の総括語に対応して音声入力に対
    する案内を行う案内手段を有することを特徴とする音声
    認識装置。
  3. 【請求項3】 請求項1又は2記載の音声認識装置にお
    いて、 前記辞書生成手段は、現在位置に基づき目的地名を複数
    の認識対象語として生成することを特徴とする音声認識
    装置。
JP8222651A 1996-08-23 1996-08-23 音声認識装置 Pending JPH1062199A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8222651A JPH1062199A (ja) 1996-08-23 1996-08-23 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8222651A JPH1062199A (ja) 1996-08-23 1996-08-23 音声認識装置

Publications (1)

Publication Number Publication Date
JPH1062199A true JPH1062199A (ja) 1998-03-06

Family

ID=16785801

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8222651A Pending JPH1062199A (ja) 1996-08-23 1996-08-23 音声認識装置

Country Status (1)

Country Link
JP (1) JPH1062199A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001083988A (ja) * 1999-09-09 2001-03-30 Xanavi Informatics Corp 音声検索装置、音声検索のための制御プログラムとデータを記録した記録媒体、および、音声認識ナビゲーション装置
JP2005148724A (ja) * 2003-10-21 2005-06-09 Zenrin Datacom Co Ltd 音声認識を用いた情報入力を伴う情報処理装置
JP2006098331A (ja) * 2004-09-30 2006-04-13 Clarion Co Ltd ナビゲーション装置、ナビゲーション方法及びナビゲーションプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001083988A (ja) * 1999-09-09 2001-03-30 Xanavi Informatics Corp 音声検索装置、音声検索のための制御プログラムとデータを記録した記録媒体、および、音声認識ナビゲーション装置
JP4642953B2 (ja) * 1999-09-09 2011-03-02 クラリオン株式会社 音声検索装置、および、音声認識ナビゲーション装置
JP2005148724A (ja) * 2003-10-21 2005-06-09 Zenrin Datacom Co Ltd 音声認識を用いた情報入力を伴う情報処理装置
JP2006098331A (ja) * 2004-09-30 2006-04-13 Clarion Co Ltd ナビゲーション装置、ナビゲーション方法及びナビゲーションプログラム

Similar Documents

Publication Publication Date Title
US5274560A (en) Sensor free vehicle navigation system utilizing a voice input/output interface for routing a driver from his source point to his destination point
US6064323A (en) Navigation apparatus, navigation method and automotive vehicles
KR100556050B1 (ko) 적어도위치및/또는거리이름들을위한입력시스템
US5592389A (en) Navigation system utilizing audio CD player for data storage
US6480786B2 (en) Method and system for route guiding
US6836822B1 (en) Apparatus for and method of retrieving information
JPH09114489A (ja) 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車
JP4642953B2 (ja) 音声検索装置、および、音声認識ナビゲーション装置
JP2003323192A (ja) 単語辞書登録装置および単語辞書登録方法
JPH1062199A (ja) 音声認識装置
JPH08202386A (ja) 音声認識方法、音声認識装置、およびナビゲーション装置
JP2947143B2 (ja) 音声認識装置及びナビゲーション装置
JP4661379B2 (ja) 車載音声認識装置
JPH09114491A (ja) 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車
JP3925368B2 (ja) 制御システム
JPH08328584A (ja) 音声認識装置、音声認識方法及びナビゲーション装置
KR101804766B1 (ko) 음성 인식 장치, 이를 포함하는 차량 및 그 제어방법
WO2006028171A1 (ja) データ提示装置、データ提示方法、データ提示プログラムおよびそのプログラムを記録した記録媒体
KR100466737B1 (ko) 네비게이션장치,네비게이션방법및자동차
JP2000074685A (ja) 車載装置における検索方法と車載ナビゲーション装置
JPH09114488A (ja) 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車
JP4219047B2 (ja) ナビゲーション装置、及び目的地設定方法
JP2877045B2 (ja) 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車
JPH10307039A (ja) 情報検索装置及びナビゲーション装置における情報入力装置、並びに情報検索方法、並びにナビゲーション装置における情報入力制御プログラムが記録されたコンピュータ読み取り可能な記録媒体
JPH09114485A (ja) 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車