JP2000089782A

JP2000089782A - 音声認識装置と方法、ナビゲーションシステム、及び記録媒体

Info

Publication number: JP2000089782A
Application number: JP10262682A
Authority: JP
Inventors: Noriyuki Tsunashima; 則幸綱嶋
Original assignee: Kenwood KK
Current assignee: Kenwood KK
Priority date: 1998-09-17
Filing date: 1998-09-17
Publication date: 2000-03-31

Abstract

(57)【要約】【課題】発声回数を削減して、簡単に検索結果を得
る。【解決手段】地名認識用の辞書は、都道府県、市区
郡、区町村字毎に相互に関連付けて形成される。利用頻
度の高い場所の地名の辞書を予め辞書登録部１５に登録
しておく。話者は、通常、都道府県名、市区郡名、区町
村字名の順で地名を発声する。制御部１４は、最初の単
語を都道府県認識辞書と比較し、特定した都道府県の市
区郡認識辞書を辞書登録部１５に登録し、次の入力音声
と比較し、特定した市区郡の区町村字認識辞書を辞書登
録部１５に登録し、次の入力音声と比較し、区町村字を
特定する。辞書登録部１５に登録されている地名を発声
する場合には、都道府県名や市区郡名を省略できる。制
御部１４は、入力音声を都道府県認識辞書で認識できな
い時は、登録されている市区郡認識辞書を用いて認識
し、認識できないときは、登録されている区町村字認識
辞書を用いて認識する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声認識に用いる
認識辞書を入れ替えて、順次認識を行って、検索対象を
特定する検索装置と検索方法に関し、特に、検索時の発
声回数、認識辞書の入れ替え回数を低減することができ
る音声認識装置と方法、及びそれらを用いたナビゲーシ
ョンシステムに関する。

【０００２】

【従来の技術】認識対象の語彙を認識するための辞書
（認識辞書）を自動的に入れ替えて、入力音声を認識す
る音声認識装置が知られている。この種の音声認識装置
の認識辞書は、広分類項目の辞書の各語彙に狭分類項目
の辞書が、階層的に関連づけられて構成されている。ユ
ーザは、目的の検索事項が特定されるまで、広分類項目
から狭分類項目に複数個の語彙を順番に発声して、音声
認識装置は、辞書を順次入れ替えながら、入力音声を認
識する。

【０００３】このような、音声認識装置の動作を、図６
を参照して、地名検索する場合を例に説明する。

【０００４】音声認識装置は、起動されると、広分類項
目辞書である「都道府県」の辞書を認識辞書として登録
する（ステップＳ１）。

【０００５】続いて、音声の入力を待機する（ステップ
Ｓ２）。

【０００６】音声が入力されると、「都道府県」の認識
辞書を用いて、入力音声を認識し、音声に一致する語彙
を検索する（ステップＳ３）。認識辞書に音声と一致す
る語彙を発見すると、その語彙に関連付いた辞書を識別
し、「市区郡」の辞書と、「都道府県」の辞書とを入れ
替える（ステップＳ４，Ｓ５）。例えばユーザが「東
京」と発声すると、「東京の市区郡」の辞書が辞書登録
される。

【０００７】以下、「都道府県」の検索と同様にして、
「市区郡」の検索（ステップＳ６〜Ｓ８）及び「区町村
字」（ステップＳ９〜Ｓ１２）の検索を行う。以上３回
の全ての検索で、認識辞書にユーザの発声した地名と一
致する語彙を発見すれば、目的とする地域の地名が出力
される（ステップＳ１３）。いずれか一回の検索で該当
する語彙が見つからないときは、都道府県の地名検索か
らやり直すこととなる（ステップＳ４，Ｓ８，Ｓ１
２）。

【０００８】

【発明が解決しようとする課題】上述の従来技術では、
ユーザが頻繁に検索する事項も、ほとんど検索すること
のない事項と同等に扱われている。このため、頻繁に検
索する事項でも、一定の回数の発声を行わなければなら
ず、煩瑣であった。

【０００９】全ての登録語彙を最初から認識処理の対象
として認識辞書を作成しておくことも可能であるが、認
識率が低下し、認識応答時間が長くかかるという欠点が
ある。また、記憶装置の容量が大きくなってしまう。

【００１０】同様の問題は、広分類項目から狭分類項目
に複数個の語彙を順番に発声し、認識装置が、辞書を順
次入れ替えて、入力音声を認識するタイプの音声認識装
置に共通に存在する。

【００１１】本発明は、上記実状に鑑みてなされたもの
で、簡単な処理で検索結果を得られる音声認識装置と方
法及びナビゲーションシステムを提供することを目的と
する。また、本発明は、特定の検索事項については、ユ
ーザの発声回数を削減して、簡単に検索結果を得られる
音声認識装置と方法及びナビゲーションシステムを提供
することを目的とする。

【００１２】

【課題を解決するための手段】本発明の第１の観点に係
る音声認識装置は、音声を入力する入力手段と、下位の
辞書が直近の上位の辞書の各語彙に対応付けられて階層
化された音声認識用の複数の辞書の全体を格納する辞書
格納手段と、前記辞書格納手段に格納されている辞書の
うち、各階層の予め定められた少なくとも一部の辞書
を、音声認識の開始前に、音声認識の処理に使用するた
めの認識辞書として保持する辞書保持手段と、前記入力
手段が入力した音声と前記辞書保持手段の保持する辞書
が所有する語彙との比較を上位の辞書から順次行い、あ
る階層の辞書内に入力音声に該当する語彙を検出する
と、その語彙に対応付けられた１階層下位の辞書を前記
辞書保持手段にロードして、次に入力された音声をロー
ドした辞書に基づいて認識し、ある階層の辞書内に一致
する語彙を検出できないときに、その辞書よりも１階層
下位の辞書を用いて入力音声の認識処理を行う認識手段
と、前記認識手段の認識結果を出力する出力手段と、を
備えることを特徴とする。

【００１３】この構成において、通常は、話者は、上位
から順に語彙を発声する。認識手段は、最初の入力音声
を、最上位の辞書と比較して認識し、入力音声と一致す
る語彙を検出すると、認識結果に対応する下位の辞書を
辞書格納手段から辞書保持手段にロードし、次の入力音
声と比較して認識する。以後、同様の動作を繰り返す。
一方、認識手段は、入力音声と一致する語彙を検出でき
ないと、順次下位の辞書を用いて認識を行う。このた
め、例えば、辞書保持手段に予め登録されている辞書に
含まれている語彙については、任意の階層の語彙を入力
すれば、対応する階層の辞書で認識される。従って、全
ての語彙を順次入力しなくても、適当な語彙を入力する
だけで、対応する認識結果を出力することができ、話者
の発話回数を低減できる。辞書保持手段に、比較的頻繁
に利用する語彙群の辞書を起動時等に、予め登録してお
くことにより、発話回数を大幅に低減できる。

【００１４】前記認識手段は、ある階層の辞書内に一致
する語彙を検出できず、下位の階層の辞書を用いて入力
音声を認できた時に、ファイルの階層構造より、上位の
語彙を特定する手段を含むことが望ましい。これによ
り、上位又は下位の語彙を入力するだけで、上位の対応
する語彙をも特定することができる。

【００１５】さらに、各階層の予め定められた辞書を前
記辞書保持手段に、音声認識の開始前に、ロードする事
前ロード手段をさらに備えることが望ましい。

【００１６】前記事前ロード手段は、ユーザの入力に基
づいて、各階層の辞書を特定してロードする手段を備え
てもよい。この際、ユーザの下位の語彙の入力に基づい
て、上位の階層の辞書を特定してロードする手段を備え
ることが望ましい。

【００１７】本発明の第２の観点に係るナビゲーション
システムは、音声入力された地名を、広域から狭域に階
層化して構成された辞書のうちロードされた辞書を用い
て認識し、認識された地名が表す地域内の地名を含む辞
書を次にロードして、ロードした辞書を次に入力された
音声の認識に使用することにより、広域から狭域に向け
て順次入力された地名を、階層化された辞書を順次ロー
ドしながら認識し、認識した地域の地図を表示するもの
であり、各階層の予め定められた辞書を、音声認識処理
の開始前に、音声認識用の辞書として保持する辞書保持
手段と、入力音声と前記辞書保持手段が保持する辞書と
を比較し、ある階層の辞書内に一致する地名を検出でき
ないときに、下位の階層の辞書を用いて入力音声を認識
し、ある階層の辞書内に一致する地名を検出したとき
に、その地名が表す地域に属す地名を格納した下位の辞
書をロードして次の入力音声の認識に使用する認識手段
と、地図データを格納する地図記憶手段と、前記認識手
段の認識結果に対応する地域の地図を前記地図記憶手段
から読み出して表示する表示手段と、を備えることを特
徴とする。

【００１８】この構成において、話者は、上位（例え
ば、都道府県名）から順に地名を発声する。認識手段
は、最初の入力音声を、最上位の辞書（例えば、都道府
県名認識用の辞書）と比較して認識し、入力音声と一致
する語彙を検出すると、認識結果に対応する下位の辞書
（例えば、区市郡名認識用の辞書）を辞書格納手段から
辞書保持手段にロードし、次の入力音声と比較して認識
する。以後、同様の動作を繰り返す。一方、認識手段
は、入力音声と一致する語彙を検出できないと、順次下
位の辞書を用いて認識を行う。このため、例えば、辞書
保持手段に予め登録されている辞書に含まれている地名
については、上位から順番に発声しなくても、任意の階
層の地名を入力すれば、対応する階層の辞書で認識され
る。従って、話者の発話回数を低減できる。辞書保持手
段に、自宅の地名等の比較的頻繁に利用する地名用の辞
書を、起動時等に予め登録しておくことにより、発話回
数を大幅に低減できる。

【００１９】また、前記認識手段は、ある階層の辞書内
に一致する地名を検出できず、下位の階層の辞書を用い
て入力音声を認識できた時に、ファイルの階層構造よ
り、上位の語彙を特定する手段を含むことが望ましい。

【００２０】さらに、各階層の予め定められた辞書を前
記辞書保持手段に、音声認識の開始前に、ロードする事
前ロード手段をさらに備えることが望ましい。

【００２１】本発明の第３の観点に係る音声認識方法
は、階層化された辞書を使用して、階層順に入力される
一連の音声により特定される情報を特定する方法であっ
て、実質的に最初の入力音声を最上位層の辞書を参照し
て認識し、該辞書内に該当する語彙を検出できなかった
時に、予め格納されている次の階層の辞書を用いて認識
処理を行い、認識できるまで辞書の階層を変更して認識
処理を行い、入力音声をいずれかの階層の辞書を参照し
て認識できたときに、認識した語彙に対応する下位の辞
書をロードして、ロードした辞書を用いて次の入力音声
の認識を行う、ことにより、階層化された一連の語彙の
全てを入力しなくても、認識を可能としたことを特徴と
する。

【００２２】本発明の第４の観点に係る記録媒体はコン
ピュータを、音声を入力する入力手段、下位の辞書が直
近の上位の辞書の各語彙に対応付けられて階層化された
音声認識用の複数の辞書を格納する辞書格納手段、前記
辞書格納手段に格納されている辞書のうち、各階層の予
め定められた少なくとも１つの辞書を、音声認識の開始
前に、音声認識の処理に使用するための認識辞書として
保持する辞書保持手段、入力手段が入力した音声と辞書
保持手段の保持する辞書が所有する語彙との比較を行
い、任意の各階層の辞書内に入力音声に該当する語彙を
検出すると、その語彙に対応付けられた下位の辞書を辞
書保持手段にロードして次に入力された音声をロードし
た辞書に基づいて認識し、ある階層の辞書内に一致する
語彙を検出できないときに、１階層下位の辞書を用いて
入力音声を認識する認識手段、認識手段の認識結果を出
力する出力手段、として機能させるためのプログラムを
記録し、機械読み取りが可能であることを特徴とする。

【００２３】

【発明の実施の形態】本発明の実施の形態にかかる音声
認識装置及び方法を、ナビゲーションシステムに応用し
た例を参照して、詳細に説明する。

【００２４】この実施の形態のナビゲーションシステム
１０は、図１に示すように、入力部１１と、出力部１２
と、地図格納部１３と、制御部１４と、辞書登録部１５
と、辞書格納部１６と、から構成される。

【００２５】入力部１１は、マイクロホン等の音声を電
気信号に変換する音声入力部と、タッチパネルディスプ
レイ等の画面への接触を感知して、電気信号を発生する
位置入力装置とから構成される。

【００２６】出力部１２は、スピーカ等の音声出力装置
や、液晶ディスプレイ等の表示装置から構成され、この
ナビゲーションシステム１０の検索結果出力部であり、
制御部１４から送られる認識結果（地名）に従って、地
図格納部１３から該当する地図を検索し、索出した地図
を表示する。

【００２７】地図格納部１３は、磁気ディスク装置やＣ
Ｄ−ＲＯＭ（コンパクトディスクＲＯＭ）装置等から構
成され、地図データを格納し、出力部１２から指示され
た地域の地図を出力部１２に供給する。

【００２８】制御部１４は、ＣＰＵ、ＤＳＰなどから構
成され、このナビゲーションシステム全体の動作を制御
及び実行するためのものであり、辞書登録部１５に登録
される認識辞書をもとに認識処理を行い、結果を出力部
１２に出力する。

【００２９】辞書登録部１５は、半導体メモリ等から構
成され、辞書格納部１６に格納されている音声認識用の
複数の辞書（認識辞書）のうち、その時点で認識に使用
するものを認識辞書として登録する。辞書格納部１６
は、磁気ディスク装置やＣＤ−ＲＯＭ等から構成され、
音声認識に用いる認識辞書の全てを格納している。

【００３０】図２は、辞書格納部１６に格納されている
認識辞書の構成を示す。図示するように、この認識辞書
は、広分類項目辞書に相当する都道府県認識辞書１６ａ
と、中分類項目辞書に相当する市区郡認識辞書１６ｂ
と、狭分類項目辞書に相当する区町村字認識辞書１６ｃ
とから構成されている。都道府県認識辞書１６ａは、都
道府県名毎に、その都道府県を表す音声を認識するため
の特徴パターン（マッチングパターン）の組を記憶す
る。市区郡認識辞書１６ｂは、各都道府県に関連付けら
れた複数の辞書から構成され、各辞書は、対応する都道
府県内の市区郡毎に、その市区郡を表す音声を認識する
ための特徴パターンの組を記憶する。区町村字認識辞書
１６ｃは、各市区郡に関連付けられた複数の辞書から構
成され、各辞書は、対応する市区郡内の区町村字毎に、
その区町村字を表す音声を認識するための特徴パターン
の組を記憶する。

【００３１】図３に、辞書登録部１５の構成を示す。図
示するように、辞書登録部１５は、辞書項目の階層ごと
に割り当てられた辞書登録領域１５ａ，１５ｂ，１５
ｃ，・・・から構成される。辞書登録領域１５ａ，１５
ｂ，１５ｃ，・・・は、それぞれ、辞書項目の各階層に属
する１つの辞書を認識辞書として登録することができ
る。都道府県認識辞書登録領域１５ａには、都道府県認
識辞書１６ａが登録され、市区郡認識辞書登録領域１５
ｂには、市区郡認識辞書１６ｂが登録され、区町村字認
識辞書登録領域１５ｃには、区町村字認識辞書１６ｃが
登録される。

【００３２】以下に、図４を参照して、上述の構成を有
するナビゲーションシステム１０の動作を説明する。ナ
ビゲーションシステム１０は、起動時等に、比較的頻繁
に使用する地名（自宅の住所や、頻繁に訪れる地域の地
名等）を入力し、対応する認識辞書を予め登録しておく
ことにより、ユーザの発話回数の低減と高速認識を可能
とするシステムである。

【００３３】ナビゲーションシステム１０の制御部１４
は、起動されると、図４に示すフローチャートに示す動
作を開始し、比較的頻繁に使用する地名（ここでは、自
宅の住所とする）の入力を待機する。

【００３４】ユーザは、入力部１１から、自宅の住所を
「都道府県」、「市区郡」、「区町村字」を含んだ形で
順次入力する（ステップＳ２０）。住所の入力は、例え
ば、入力部１１のタッチパネル等を使用して行ってもよ
く、或いは音声で入力してもよい。ここでは具体例とし
て、ユーザの住所が「東京都渋谷区道玄坂」であるとす
る。

【００３５】制御部１４は、辞書格納部１６に指令を出
し、都道府県認識辞書１６ａを辞書登録部１５の都道府
県認識辞書登録領域１５ａに登録する。次に、制御部１
４は、ユーザの入力した都道府県名「東京」に対応する
市区郡認識辞書１６ｂを辞書登録部１５の市区郡認識辞
書登録領域１５ｂに登録する。さらに制御部１４は、ユ
ーザの入力した市区町村名「渋谷」に対応する区町村字
認識辞書１６ｃを区町村字認識辞書登録部１５の区町村
字認識辞書登録領域１５ｃに登録させる（ステップＳ２
１）。以上の処理により、辞書登録部１５に認識辞書の
事前登録が完了する。

【００３６】次に、制御部１４は、入力部１１からの音
声信号を待機する（ステップＳ２２）。ここで、ユーザ
が、例えば、「愛知県岡崎市大和町」地域の地図を見た
いため、「愛知」、「岡崎」、「大和」と順次発声した
とする。

【００３７】入力部１１は、この音声をピックアップ
し、特徴ベクトルを抽出し、制御部１４に供給する。制
御部１４は、辞書登録部１５の都道府県認識辞書登録領
域１５ａを参照し、最初に入力された「愛知」の特徴ベ
クトルに合致する特徴ベクトルを有する地名を検索する
（ステップＳ２３）。

【００３８】制御部１４は、地名「愛知」を都道府県認
識辞書登録領域１５ａに登録されている都道府県認識辞
書１６ａから検出し（ステップＳ２４）、辞書登録部１
５の市区郡認識辞書登録領域１５ｂに、愛知県内の市区
郡名を認識するための市区郡認識辞書１６ｂを登録する
（ロードする）（ステップＳ２５）。制御部１４は次の
音声入力を待機する（ステップＳ２６）。

【００３９】ユーザが「岡崎」と発声すると、制御部１
４は、市区郡認識辞書登録領域１５ｂに登録されている
市区郡認識辞書１６ｂを参照し、「岡崎」の特徴ベクト
ルに合致する特徴ベクトルを有する地名を検索する（ス
テップＳ２７）。

【００４０】制御部１４は、入力された「岡崎」に対応
する地名を市区郡認識辞書登録領域１５ｂに登録されて
いる市区郡認識辞書１６ｂで検出し（ステップＳ２
８）、区町村字認識辞書１６ｃのうちの、市名「岡崎」
に対応するものを、辞書登録部１５の区町村字認識辞書
登録領域１５ｃに登録する（ロードする）（ステップＳ
２９）。続いて、制御部１４は次の音声入力を待機する
（ステップＳ３０）。

【００４１】ユーザが「大和」と発声すると、制御部１
４は、辞書登録部１５を参照し、「大和」に一致する語
彙を検索する（ステップＳ３１）。

【００４２】制御部１４は、町名「大和」を区町村字認
識辞書登録領域１５ｃに登録されている区町村字認識辞
書１６ｃで検出する（ステップＳ３２）。このようにし
て、制御部１４は、入力された音声が都道府県「愛
知」、市区郡「岡崎」、区町村字「大和」であることを
判別すると、認識した地名を出力部１２に供給する。出
力部１２は、対応する地図を地図格納部１３より読み出
して、表示する（ステップＳ３３）。

【００４３】その後、処理は、ステップＳ２１にリター
ンし、辞書登録部１５に登録されている辞書を元の辞書
（ステップＳ２０で入力した地名に対応する認識辞書）
に戻して、次の音声の入力を待機する。

【００４４】以上のように、目的とする地名の都道府県
名と、始めに登録した地名の都道府県名とが異なると
き、ユーザは、従来と同様、３回発声することにより、
目的の地域の地図を表示させることができる。

【００４５】一方、ユーザの目的とする地域が「東京都
文京区千駄木」であるとする。この場合、ユーザは、都
道府県名「東京」から発声してもよいが、市区郡名「文
京」から発声してもよい。

【００４６】ユーザが都道府県名「東京」から発声した
ときの動作は、上述の「愛知県岡崎市大和町」を目的の
地域とした場合の動作と同様である。ただし、都道府県
名「東京」に対応する「市区郡名」の辞書の入れ替えは
行われない。

【００４７】ユーザが市区郡名「文京」から発声したと
きの動作を以下に説明する。

【００４８】ユーザが「文京」と発声すると、都道府県
認識辞書登録領域１５ａを参照し、「文京」に一致する
語彙を検索する（ステップＳ２３）。

【００４９】制御部１４は、語彙「文京」を都道府県認
識辞書登録領域１５ａで検出できず（ステップＳ２
４）、次に、市区郡認識辞書登録領域１５ｂを参照し、
一致する語彙を検索する（ステップＳ３４）。ここで、
制御部１４は、市区郡認識辞書１６ｂ内に該当する地名
を検出し、入力された語彙がこれが市区郡の階層に属す
る語彙「文京」であると判別する（ステップＳ３５）。

【００５０】続いて、制御部１４は、市区郡名「文京」
に対応する区町村字認識辞書１６ｃを区町村字認識辞書
登録領域１５ｃに登録し（ステップＳ２９）、次の音声
入力を待つ（ステップＳ３０）。

【００５１】次に、ユーザが「千駄木」と発声すると、
制御部１４は区町村字認識辞書１６ｃを参照し、「千駄
木」に一致する語彙を検索する（ステップＳ３１）。

【００５２】制御部１４は、語彙「千駄木」に一致する
語彙を区町村字認識辞書登録領域１５ｃ内に検出する
（ステップＳ３２）。制御部１４は、検出した地名が
「文京」区と「千駄木」であることから、対応する都道
府県が「東京」都であることを判別し、東京都文京区千
駄木の地名を出力部１２に供給する。出力部１２は、対
応する地図を地図格納部１３から読み出して、出力部１
２に表示する（ステップＳ３３）。

【００５３】その後、処理は、ステップＳ２１にリター
ンする。

【００５４】以上のように、目的とする地名の都道府県
名と、初めに登録した地名の都道府県名とが同一である
とき、ユーザは、２回発声することにより、目的の地域
の地図を表示させることができる。

【００５５】さらに一方、ユーザの目的とする地域が
「東京都渋谷区神宮前」であるとする。この場合、ユー
ザは、都道府県名「東京」から発声してもよいし、市区
郡名「渋谷」から発声してもよいが、区町村字名「神宮
前」から発声してもよい。

【００５６】ユーザが都道府県名「東京」から発声した
ときの動作は、上述の「愛知県岡崎市大和町」を目的の
地域とする場合の動作と同様である。ただし、都道府県
名「東京」に対応する市区郡認識辞書１６ｂ、及び市区
郡「渋谷」に対応する区町村字認識辞書１６ｃの入れ替
え（ロード）は行われない。

【００５７】ユーザが市区郡名「渋谷」から発声したと
きの動作は、上述の「東京都文京区千駄木」を目的の地
域とする場合の動作である同様である。ただし、市区郡
名「渋谷」に対応する区町村字認識辞書１６ｃの入れ替
え（ロード）は行われない。

【００５８】ユーザが「神宮前」と発声すると、制御部
１４は、この入力を取り込み（ステップＳ２２）、辞書
登録部１５に格納されている都道府県認識辞書１６ａを
参照し、「神宮前」に一致する語彙を検索する（ステッ
プＳ２３）。

【００５９】制御部１４は、語彙「神宮前」を都道府県
認識辞書登録領域１５ａで検出できず（ステップＳ２
４）、市区郡認識辞書登録領域１５ｂに登録されている
市区郡認識辞書１６ｂを参照し、一致する語彙を検索す
る（ステップＳ３５）。この例では、制御部１４は、市
区郡認識辞書登録領域１５ｂでも語彙「神宮前」を検出
できず（ステップＳ３５）、区町村字認識辞書登録領域
１５ｃに登録されている区町村字認識辞書１６ｃを参照
し、一致する語彙を検索する（ステップＳ３６）。制御
部１４は、区町村字認識辞書登録領域１５ｃに登録され
ている区町村字認識辞書１６ｃ内に一致する語彙「神宮
前」を検出する（ステップＳ３７）。

【００６０】制御部１４は、入力語彙「神宮前」を検出
した区町村字認識辞書１６ｃから上位にリンクを辿っ
て、市区郡名が「渋谷」区、都道府県が「東京」都であ
るこを判別し、地名を出力部１２に供給する。出力部１
２は、対応する地域の地図を地図格納部１３より取り出
して出力部１２に表示する（ステップＳ３３）。その
後、処理は、ステップＳ２１にリターンし、辞書登録部
１５に登録されている辞書を元の辞書（ステップＳ２０
で入力した地名に対応する認識辞書）に戻して、次の音
声の入力を待機する。

【００６１】以上のように、目的とする地名の都道府県
名と市区郡名とが、初めに登録した地名の都道府県名及
び市区郡名と同一であるとき、ユーザは、１回の発声の
みで、目的の地域の地図を表示させることができる。

【００６２】上述した実施の形態により、頻繁に検索す
る検索対象を最初に入力しておけば、ユーザは１回発声
するだけで、目的とする資料を取り出すことができ、検
索が簡単になる。

【００６３】なお、この発明は、上記実施の形態に限定
されず、種々の変形及び応用が可能である。例えば、上
記実施の形態では、ステップＳ２０で、ユーザが比較的
頻繁に使用する地名を「都道府県」、「市区郡」、「区
町村字」を含んだ形で順次入力するとしたが、「市区
郡」のみの形で入力することにより検索を行うこともで
きる。この場合の動作を図５に示す。ここでは具体例と
して、ユーザが始めに入力する地名が「渋谷区」であ
り、目的とする地名が「東京都渋谷区道玄坂」であると
する。

【００６４】ユーザは、入力部１１から、「渋谷」と入
力する（ステップＳ４０）。制御部１４は、辞書格納部
１６に指令を出し、市区郡名「渋谷」に対応する都道府
県名を検索する（ステップＳ４１）。制御部１４は、辞
書格納部１６に指令を出し、都道府県認識辞書１６ａを
辞書登録部１５の都道府県認識辞書登録領域１５ａに登
録する（ステップＳ４２）。次に、制御部１４は、ユー
ザの入力した市区郡名「渋谷」に対応する区町村字認識
辞書１６ｃを辞書登録部１５の区町村字認識辞書登録領
域１５ｃに登録する（ステップＳ４３）。以上の処理に
より、辞書登録部１５には、市区郡認識辞書登録領域１
５ｂに登録する辞書がない形で事前登録が完了する。

【００６５】ユーザが「道玄坂」と発声すると、制御部
１４は、語彙「道玄坂」を都道府県認識辞書登録領域１
５ａで検出できず（ステップＳ２４）、次に、市区郡認
識辞書登録領域１５ｂを参照せず、区町村字認識辞書登
録領域１５ｃを参照し、一致する語彙を検索する（ステ
ップＳ４４）。ここで、制御部１４は、区町村字認識辞
書１６ｃに該当する地名を検出し（ステップＳ４５）、
入力された語彙が区町村字の階層に属する語彙「道玄
坂」であると判別する（ステップＳ４５）。制御部１４
は、検出した地名が「道玄坂」であり、ユーザが音声認
識による検索の前に入力した地名「渋谷」区と、それに
対応する都道府県が「東京」都であるという検索結果よ
り、東京都渋谷区道玄坂近郊の地図を、地図格納部１３
から読み出して、出力部１２に表示する（ステップＳ３
３）。

【００６６】ユーザが渋谷区内にある区町村字名以外の
地名を検索する場合は、音声入力を都道府県名から始
め、以下の音声認識装置の動作は上述の実施の形態で都
道府県名から発声した場合と同様である（ステップＳ２
３〜ステップＳ３３）。

【００６７】ユーザが渋谷区内にある区町村字名以外の
地名を検索する場合に、音声入力を都道府県名から始め
なかったときは、制御部１４は都道府県認識辞書登録領
域１５ａで語彙を検出できない（ステップＳ２４）。さ
らに、制御部１４は区町村字認識辞書登録領域１５ｃで
も検出できず（ステップＳ４５）、ステップＳ２１にリ
ターンする。

【００６８】このような構成によれば、最初に市区郡名
のみを入力しておただけでも、その市区郡内の区町村字
については、１回の発声で地図を取り出すことができ、
検索が簡単となる。

【００６９】また、上記実施の形態では、システムの起
動時に、ユーザの入力に基づいて各階層の辞書を１セッ
トずつ辞書保持部１５に登録したが、予め固定的に辞書
を登録しておいてもよい。また、複数セットの辞書を登
録できるようにしてもよい。さらに、さらに、最初に辞
書保持部１５に登録した辞書は削除することなく保持し
てもよい。また、地名の入力方法も、特定の手法に限定
されず、任意である。例えば、ＧＰＳ（グローバルポジ
ショニングシステム）を使用し、その時点の位置の地名
の辞書を登録してもよい。また、手入力でも、音声入力
でもかまわない。さらに、上記実施の形態の音声認識用
の辞書の構成も、一例であり、上記構成に限定されるも
のではない。また、地図の読み出しは、出力部１２が行
うとしたが、制御部１４が地図格納部１３から、検索し
た地名に対応する地図を読み出して、出力部１２に表示
させてもよい。

【００７０】本発明は地名の検索に限定されず、様々な
認識及び検索に応用可能である。例えば、検索結果とし
て出力するものが、大学の研究室案内であるとし、「大
学名」、「学部名」、「学科名」、「研究室名」の４つ
の階層として辞書を作成して検索を行うことができる。

【００７１】また、本発明の辞書登録部の構成は、音声
認識を用いない通常の検索装置にも適用でき、これによ
り、頻繁に検索する事項の検索の手間を軽減することが
できる。

【００７２】また、このシステムは専用のシステムによ
らず、通常のコンピュータを用いても実現可能である。
即ち、コンピュータに、上述の各処理を実行させるため
のプログラムや音声認識用の辞書を記録媒体（フロッピ
ーディスク、ＣＤ−ＲＯＭ、ＭＯ、ＲＯＭ等）に格納し
て配布し、これをコンピュータにインストールしてＯＳ
（オペレーティングシステム）上で、動作させることに
より、コンピュータを上述の音声認識システム、音声認
識検索システム、ナビゲーションシステムとして機能さ
せることが可能である。

【００７３】

【発明の効果】以上の説明のように、本発明は、音声認
識装置において認識処理を行うための認識辞書の構成
を、頻繁に検索する事項に合わせた構成にすることによ
り、検索のための命令入力回数を低減することができ
る。

【図面の簡単な説明】

【図１】この発明の実施の形態にかかるナビゲーション
システムの構成を示すブロック図である。

【図２】この発明の実施の形態にかかるナビゲーション
システムの認識辞書の構成を示す図である。

【図３】この発明の実施の形態にかかるナビゲーション
システムの辞書登録部の構成を示す図である。

【図４】この発明の実施の形態にかかるナビゲーション
システムの動作を説明するためのフローチャートであ
る。

【図５】この発明の他の実施の形態にかかるナビゲーシ
ョンシステムの動作を説明するためのフローチャートで
ある。

【図６】従来の技術におけるナビゲーションシステムの
動作を説明するためのフローチャートである。

【符号の説明】

１０ナビゲーションシステム１１入力部１２出力部１３地図格納部１４制御部１５辞書登録部１５ａ都道府県認識辞書登録領域１５ｂ市区郡認識辞書登録領域１５ｃ区町村字認識辞書登録領域１６辞書格納部１６ａ都道府県認識辞書１６ｂ市区郡認識辞書１６ｃ区町村字認識辞書

Claims

【特許請求の範囲】

【請求項１】音声を入力する入力手段と、下位の辞書が直近の上位の辞書の各語彙に対応付けられ
て階層化された音声認識用の複数の辞書の全体を格納す
る辞書格納手段と、前記辞書格納手段に格納されている辞書のうち、各階層
の予め定められた少なくとも一部の辞書を、音声認識の
開始前に、音声認識の処理に使用するための認識辞書と
して保持する辞書保持手段と、前記入力手段が入力した音声と前記辞書保持手段の保持
する辞書が所有する語彙との比較を上位の辞書から順次
行い、ある階層の辞書内に入力音声に該当する語彙を検
出すると、その語彙に対応付けられた１階層下位の辞書
を前記辞書保持手段にロードして、次に入力された音声
をロードした辞書に基づいて認識し、ある階層の辞書内
に一致する語彙を検出できないときに、その辞書よりも
１階層下位の辞書を用いて入力音声の認識処理を行う認
識手段と、前記認識手段の認識結果を出力する出力手段と、を備えることを特徴とする音声認識装置。
【請求項２】前記認識手段は、ある階層の辞書内に一致
する語彙を検出できず、下位の階層の辞書を用いて入力
音声を認できた時に、ファイルの階層構造より、上位の
語彙を特定する手段を含む、ことを特徴とする請求項１に記載の音声認識装置。
【請求項３】各階層の予め定められた辞書を前記辞書保
持手段に、音声認識の開始前に、ロードする事前ロード
手段をさらに備えることを特徴とする請求項１又は２に
記載の音声認識装置。
【請求項４】前記事前ロード手段は、ユーザの入力に基
づいて、各階層の辞書を特定してロードする手段を備え
る、ことを特徴とする請求項３に記載の音声認識装置。
【請求項５】前記事前ロード手段は、ユーザの下位の語
彙の入力に基づいて、上位の階層の辞書を特定してロー
ドする手段を備える、ことを特徴とする請求項４に記載
の音声認識装置。
【請求項６】音声入力された地名を、広域から狭域に階
層化して構成された辞書のうちロードされた辞書を用い
て認識し、認識された地名が表す地域内の地名を含む辞
書を次にロードして、ロードした辞書を次に入力された
音声の認識に使用することにより、広域から狭域に向け
て順次入力された地名を、階層化された辞書を順次ロー
ドしながら認識し、認識した地域の地図を表示するナビ
ゲーションシステムにおいて、各階層の予め定められた辞書を、音声認識処理の開始前
に、音声認識用の辞書として保持する辞書保持手段と、入力音声と前記辞書保持手段が保持する辞書とを比較
し、ある階層の辞書内に一致する地名を検出できないと
きに、下位の階層の辞書を用いて入力音声を認識し、あ
る階層の辞書内に一致する地名を検出したときに、その
地名が表す地域に属す地名を格納した下位の辞書をロー
ドして次の入力音声の認識に使用する認識手段と、地図データを格納する地図記憶手段と、前記認識手段の認識結果に対応する地域の地図を前記地
図記憶手段から読み出して表示する表示手段と、を備えることを特徴とするナビゲーションシステム。
【請求項７】前記認識手段は、ある階層の辞書内に一致
する地名を検出できず、下位の階層の辞書を用いて入力
音声を認識できた時に、ファイルの階層構造より、上位
の語彙を特定する手段を含む、ことを特徴とする請求項６に記載のナビゲーションシス
テム。
【請求項８】各階層の予め定められた辞書を前記辞書保
持手段に、音声認識の開始前に、ロードする事前ロード
手段をさらに備えることを特徴とする請求項６又は７に
記載のナビゲーションシステム。
【請求項９】階層化された辞書を使用して、階層順に入
力される一連の音声により特定される情報を特定する方
法であって、実質的に最初の入力音声を最上位層の辞書を参照して認
識し、該辞書内に該当する語彙を検出できなかった時
に、予め格納されている次の階層の辞書を用いて認識処
理を行い、認識できるまで辞書の階層を変更して認識処
理を行い、入力音声をいずれかの階層の辞書を参照して認識できた
ときに、認識した語彙に対応する下位の辞書をロードし
て、ロードした辞書を用いて次の入力音声の認識を行
う、ことにより、階層化された一連の語彙の全てを入力しな
くても、認識を可能としたことを特徴とする音声認識方
法。
【請求項１０】コンピュータを、音声を入力する入力手段、下位の辞書が直近の上位の辞書の各語彙に対応付けられ
て階層化された音声認識用の複数の辞書を格納する辞書
格納手段、辞書格納手段に格納されている辞書のうち、各階層の予
め定められた少なくとも１つの辞書を、音声認識の開始
前に、音声認識の処理に使用するための認識辞書として
保持する辞書保持手段、入力手段が入力した音声と辞書保持手段の保持する辞書
が所有する語彙との比較を行い、任意の各階層の辞書内
に入力音声に該当する語彙を検出すると、その語彙に対
応付けられた下位の辞書を辞書保持手段にロードして次
に入力された音声をロードした辞書に基づいて認識し、
ある階層の辞書内に一致する語彙を検出できないとき
に、１階層下位の辞書を用いて入力音声を認識する認識
手段、認識手段の認識結果を出力する出力手段、として機能させるためのプログラムを記録した機械読み
取り可能な記録媒体。