JP2002123284A

JP2002123284A - 音声認識装置ならびに方法

Info

Publication number: JP2002123284A
Application number: JP2000312476A
Authority: JP
Inventors: Hiroshi Saito; 宏斎藤
Original assignee: Pioneer Electronic Corp
Current assignee: Pioneer Corp
Priority date: 2000-10-12
Filing date: 2000-10-12
Publication date: 2002-04-26
Anticipated expiration: 2020-10-12
Also published as: US20020046028A1; DE60109105T2; DE60109105D1; EP1197950A2; EP1197950A3; JP4283984B2; US6961706B2; EP1197950B1

Abstract

(57)【要約】【課題】階層的に絞込条件を入力して地点指定を行う
際に、システムにユーザが知らない絞込条件の入力が要
求された場合でも、地点指定を行うための以降の継続す
るステップに進むことのできる仕組みを構築し、操作
性、ならびに応答性の改善をはかる。【解決手段】階層構造をなす複数の音声認識辞書の中
から基準音声情報を抽出し、抽出された基準音声情報と
入力された音声とを比較することにより音声を認識する
音声認識に関し、所定の音声認識辞書に階層飛ばしを示
す基準音声情報を用意し、階層飛ばしを示す基準音声情
報に相当する入力を認識した際に、比較対対象となって
いた基準音声情報の下位階層に属する音声認識辞書の一
部を抽出して音声認識を行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、ユーザにより入力
された音声を認識して機器の制御を行う音声認識装置な
らびに音声認識方法に関するもので、特に音声入力操作
の改善をはかるものである。

【０００２】

【従来の技術】所望の地点を指定して目的地として設定
し、車両の現在位置から目的地までの経路を探索し、こ
れをその現在位置を含む地図と共にディスプレイ上に表
示させることにより、目的地までの誘導を行うカーナビ
ゲーションとして、近年、マイクを用いて、入力された
ユーザの音声を認識し、認識された音声によって各種操
作を行えるようにした音声操作機能付きのものが登場し
てきた。

【０００３】カーナビゲーションにおける音声操作によ
る地点の指定は、学校、病院、駅といった対照地点に存
在する施設の種別や、地点の住所などを、ガイダンスメ
ッセージに応じて順次音声を発話して入力し、最終的に
地点の固有名称を発話することにより行われている。こ
のように、発話毎の認識対象語句を設定し、続く認識対
象語句の絞込みを行うことにより、認識率の確保を図っ
ている。

【０００４】目的地設定手順の一例を説明する。初期の
段階では、音声認識システム側では、カーナビゲーショ
ンを操作するための制御コマンド認識対象語句とした”
制御コマンド辞書”が設定されており、ユーザが「目的
地設定」とコマンドを発話することでシステムに目的地
までの経路設定を行う意思を伝える。続いて目的地とな
る具体的な地点を指定する必要があるが、カーナビゲー
ションに用意されている地点が膨大であるため、一度の
音声操作で指定することは認識率やメモリサイズの制約
から実用的でない。そこで、指定対象となる地点の数の
絞込みを行う。

【０００５】はじめに対象地点に存在する施設の種別
（以下ジャンルと称する）での絞込みを行う。音声認識
辞書を”制御コマンド辞書”から”ジャンル名称辞書”
に入れ替え、（1）「ジャンルの名称をどうぞ」とガイダ
ンスメッセージを出力し、ユーザに対してジャンルの発
話を促す。これに対してユーザがジャンルとして例えば
（2）「教育施設」と発話すると音声認識システムが発話
を認識する。更なる絞込みを行うため教育施設に属する
更に詳細なサブジャンルを指定するように、音声認識辞
書を”ジャンル名称辞書”から”教育施設に属するサブ
ジャンル名称辞書”に入れ替え、（3）「次のジャンルの
名称をどうぞ」とガイダンスメッセージを出力し、ユー
ザに対してサブジャンル名称の発話を促す。これに対し
てユーザがサブジャンルとして例えば（4）「大学」と発
話すると音声認識システムが発話を認識する。

【０００６】サブジャンルが確定すると、更に、地域で
の絞込みを行う。音声認識辞書を”サブジャンル名称辞
書”から”都道府県名称辞書”に入れ替え、（5）「都道
府県名をどうぞ」とガイダンスメッセージを出力し、ユ
ーザに対して都道府県名の発話を促す。これに対してユ
ーザが、例えば（6）「東京都」と発話すると音声認識シ
ステムが発話を「東京都」と認識する。サブジャンルが
「大学」でかつ都道府県名が「東京都」だった場合、更に詳
細に市区町村名を指定するように、あらかじめシステム
側で決められている。そのため、音声認識辞書を”都道
府県名称辞書”から”東京都の市区町村名辞書”に入れ
替え、（7）「市区町村名をどうぞ」とガイダンスメッセ
ージを出力し、ユーザに対して市区町村名の発話を促
す。これに対してユーザが例えば（8）「新宿区」と発話
すると音声認識システムが発話を認識する。

【０００７】システム側は音声認識辞書を”東京都の市
区町村名辞書から”東京都新宿区に存在しかつ大学に属
する施設名称を認識対象語句とした”大学名称辞書”に
入れ替え、（9）「名称をどうぞ」とガイダンスメッセー
ジを出力し、指定地点の具体的名称の発話を促す。ここ
で、ユーザが「○○大学」と発話すると音声認識システム
が認識しナビゲーションが○○大学を目的地として設定
する。このように対象地点の条件を入力して、対象地点
の数を減らして、絞込まれた対象地点の固有名称の入力
が行われる。

【０００８】

【発明が解決しようとする課題】ところで、上述した絞
込条件や条件の入力の順序は予決められているため、ユ
ーザが知らない条件の入力が催促されるという事態が発
生する。その際にユーザがその催促に応答できなかった
場合、以降継続する絞込条件の入力を行うステップへ進
むことができなくなってしまう。そのため、目的とする
対象地点の具体的名称を発話することなく、地点の指定
を断念しなければならないことになり、操作性や応答性
の面で難があった。

【０００９】本発明は上記事情に鑑みてなされたもので
あり、システムから求められた条件の入力を飛ばして、
続く条件の入力へ進むための基準音声情報（以下階層飛
ばし語句と称する）として「わからない」、「バス」などを
用意しておき、ユーザの階層飛ばし語句の入力を受け
て、地点の指定を行うための以降の継続するステップに
進むことのできる仕組みを構築し、操作性や応答性の改
善をはかった音声認識装置ならびに音声認識方法を提供
することを目的とする。

【００１０】

【課題を解決するための手段】上述した課題を解決する
ために請求項１に記載の発明は、複数の基準音声信号を
有する複数の音声認識辞書を互いに階層的に関連付けて
記憶した階層辞書部と、前記階層辞書部から適切な音声
認識辞書を抽出する抽出手段と、前記抽出された音声認
識辞書を記憶する一覧記憶手段と、音声を入力する音声
入力手段と、入力された音声と前記一覧記憶手段に記憶
されている音声認識辞書内の基準音声情報とを比較する
ことによって入力された前記音声を認識する認識手段
と、認識された前記音声に相当する基準音声情報の下位
階層に属する音声認識辞書を抽出手段が抽出し、抽出さ
れた音声認識辞書を前記一覧記憶手段が更新記憶する音
声認識装置であって、所定の音声認識辞書に階層飛ばし
を示す基準音声情報が用意されており、前記認識手段が
階層飛ばしを示す基準音声情報に相当する音声の入力を
認識した際に、前記一覧記憶手段に記憶されていた基準
音声情報の下位階層に属する音声認識辞書を前記抽出手
段が抽出し、前記一覧記憶手段に更新記憶することを特
徴する。

【００１１】請求項２に記載の発明は、請求項１に記載
の音声認識装置において、前記音声認識辞書として、施
設の種別名を記憶した種別辞書と、前記施設の種別に属
する施設名を記憶した地点辞書とを備えることを特徴と
する。

【００１２】請求項３に記載の発明は、請求項１に記載
の音声認識装置において、前記音声認識辞書として、地
域名を記憶した地域辞書と、いずれかの地域に存在する
施設の施設名を記憶した地点辞書とを備えることを特徴
とする。

【００１３】請求項４に記載の発明は、請求項１に記載
の音声認識装置において、前記音声認識辞書として、地
域名を記憶した地域辞書と、前記施設の種別名を記憶し
た種別辞書と、いずれかの地域に存在するとともにいず
れかの種別に属する施設の施設名を記憶した地点辞書と
を備え、前記種別名選択階層にて階層飛ばしを示す基準
音声情報が認識された後、前記抽出手段が前記地域辞書
を抽出することを特徴とする。

【００１４】請求項５に記載の発明は、請求項１に記載
の音声認識装置において、前記認識手段によって認識さ
れた前記基準音声情報の下位階層に属する音声認識辞書
の中の基準音声情報の数を判定する数判断手段と、入力
された音声を記憶する入力音声記憶手段と、前記入力音
声記憶手段に記憶されている音声と一覧記憶手段に記憶
されている基準音声情報とを前記認識手段が順次比較す
ることにより、類似する基準音声情報を認識し、類似す
る基準音声情報を記憶する類似ワード記憶手段とを備え
た音声認識装置であって、前記数判断手段において、認
識された音声に相当する基準音声情報の下位階層に属す
る音声認識辞書内の基準音声情報の語句の数が基準値を
超えているか判断する判断手段を備え、前記所定数以上
と判断されたとき、前記抽出手段が下位階層に属する前
記音声認識辞書の一部の音声認識辞書を抽出して前記一
覧記憶手段に記憶し、前記認識手段が前記一覧記憶手段
に記憶されている基準音声情報との比較を終了した後、
前記抽出手段が下位階層に属する前記音声認識辞書のう
ち未抽出の辞書を抽出し、前記一覧記憶手段が更新記憶
するとともに、前記認識手段が前記一覧記憶手段内に更
新記憶された辞書に属する基準音声情報と前記入力音声
記憶手段に記憶されている音声とを順次比較し、類似す
る基準音声情報を認識し、類似ワード記憶手段が新たに
認識された類似する前記基準音声情報を追加記憶するこ
とを特徴とする。

【００１５】請求項６に記載の発明は、請求項５に記載
の音声認識装置において、前記類似ワード記憶手段に記
憶された全ての類似ワードにおける一つを前記認識手段
が認識し、認識結果とすることを特徴とする。

【００１６】請求項７に記載の発明は、請求項５に記載
の音声認識装置において、前記一覧記憶手段に記憶され
ている基準音声情報の内、複数の類似する基準音声情報
を前記類似ワード記憶手段に記憶し、前記類似ワード記
憶手段に記憶された全ての類似する基準音声情報のなか
から更に認識結果を選出する選出手段を備えることを特
徴とする。

【００１７】上述した課題を解決するために、請求項８
に記載の発明は、複数の基準音声情報を有する複数の音
声認識辞書を記憶した階層辞書部と、前記複数の音声認
識辞書のうち１の辞書を抽出する抽出手段と、抽出され
た前記辞書を記憶する一覧記憶手段と、音声を入力する
音声入力手段と、入力された音声を記憶する入力音声記
憶手段と、前記入力音声記憶手段に記憶されている音声
と前記一覧記憶手段に記憶されている基準音声情報と順
次比較し、類似する基準音声情報を認識する認識手段
と、類似する前記基準音声情報を記憶する類似ワード記
憶手段とを備えた音声認識装置であって、前記一覧記憶
手段に記憶されている辞書に属する全ての基準音声情報
と前記入力音声記憶手段に記憶されている音声との比較
を前記認識手段が終了した後、前記抽出手段が音声認識
辞書から未抽出の辞書を抽出し、前記一覧記憶手段が更
新記憶するとともに、前記認識手段が前記一覧記憶手段
に更新記憶された辞書に属する基準音声情報と前記入力
音声記憶手段に記憶されている音声との比較をして類似
する基準音声情報を認識し、前記類似ワード記憶手段が
新たに認識した類似する基準音声情報を追加記憶するこ
とを特徴とする。

【００１８】請求項９に記載の発明は、請求項８に記載
の音声認識装置において、前記類似ワード記憶手段に記
憶されている複数の基準音声情報の中から、更に認識結
果を選出する選出手段を備えたことを特徴とする。

【００１９】上記構成により、指定地点の絞込みをおこ
なう際に、ユーザが知らない条件の入力をシステムから
求められた場合に、階層飛ばしを示す基準音声情報
（「わからない」と発話）を入力ことにより、検索を継
続することができ、操作性ならびに応答性の改善がはか
れる。なお、この場合、絞込条件は予めシステムによっ
て設定されていた数より少なくなってしまうため、最終
的に名称を発話する際の認識対照語句の数が大きくな
り、認識率が低下する可能性はあるが、検索を継続する
ことが可能となり、操作性、応答性の面での効果が大き
い。また、認識対象語句の増加により、メモリの容量が
問題となるが、複数に分けて認識処理を行うことでこれ
を回避することができる。

【００２０】上述した課題を解決するために、請求項１
０に記載の発明は、階層構造をなす複数の音声認識辞書
の中から基準音声情報を抽出し、抽出された基準音声情
報と入力された音声とを比較することにより音声を認識
する音声認識方法であって、所定の音声認識辞書に階層
飛ばしを示す基準音声情報が用意されており、前記階層
飛ばしを示す基準音声情報に相当する音声の入力を認識
した際に、比較対象となっていた基準音声情報の下位階
層に属する音声認識辞書の一部を抽出して音声認識を行
うことを特徴とする。

【００２１】請求項１１に記載の発明は、請求項１０に
記載の音声認識方法において、認識された基準音声情報
の下位階層に属する音声認識辞書の中の基準音声情報の
数を判断し、その数が基準値を超えていると判断された
とき、下位階層に属する前記音声認識辞書の一部を抽出
して、比較することにより類似する基準音声情報を認識
し、抽出された基準音声情報との比較が終了した後、下
位階層に属する前記音声認識辞書の中から未抽出の音声
認識辞書を抽出し、比較することにより類似する基準音
声情報を認識し、複数の類似する前記基準音声情報の中
から、入力された音声に相当する基準音声情報をさらに
選出することを特徴とする。

【００２２】上述した課題を解決するために、請求項１
２に記載の発明は、複数の基準音声情報を有する複数の
音声認識辞書の中から１つの音声認識辞書を抽出し、抽
出された音声認識辞書内の基準音声情報と入力された音
声を比較し、抽出された前記音声認識辞書による基準音
声情報との比較が終了した後、前記１つの音声認識辞書
と異なる他の音声認識辞書を抽出し、抽出された音声認
識辞書内の基準音声情報を、比較対象の基準音声情報と
して更新すると共に、更新された基準音声情報と前記入
力された音声とを比較することにより、入力された前記
音声を認識することを特徴とする。

【００２３】

【発明の実施の形態】以下、本発明の実施例を示す図面
を参照しつつ詳細に説明する。

【００２４】カーナビゲーション装置に設けられた音声
認識装置の一実施形態を示すブロック図を図１に示す。
本発明の音声認識装置は、マイク１００と、特徴量計算
部１０１と、認識部１０２と、ＲＡＭ１０３と、認識辞
書記憶部１０４と、認識辞書選択部１０５と、特徴量記
憶部１０６と、認識結果記憶部１０７と、認識結果統合
部１０８と、音声合成部１０９と、制御部１１０と、ス
ピーカ１１１と、結果表示部１１２と、検索部１１３で
構成される。

【００２５】マイク１００はユーザが発話した音声を入
力し、特徴量計算機１０１に出力する。

【００２６】特徴量計算部１０１は、マイク１００によ
って取り込まれた音声信号をＰＣＭ（Pulse Code Mod
ulation）データに変換し、当該ＰＣＭデータを音声認
識に適した特徴量に変換し、認識部１０２と特徴利用記
憶部１０６へ出力する。特徴量記憶部１０６は、計算さ
れた特徴量を記憶するとともに認識部１０２へ供給す
る。

【００２７】認識辞書記憶部１０４は、認識対象語句と
なる複数の基準音声情報を有する複数の音声認識辞書を
互いに階層的に関連付けて記憶しているものである。辞
書の種類として、複数の絞込条件毎に設けられた絞込条
件辞書と、絞込条件の組み合わせによって分類される最
終的な地点名称辞書とがある。地点名称辞書とは、例え
ば、”○○県××市に存在する教育施設に属する大学の
全ての大学名称を示す基準音声情報を有する辞書”や”
○○県××市に存在する病院に属する診療所の全ての診
療所名称を示す基準音声情報を有する辞書”等、各地点
に存在する具体的な各々の施設の名称を示す基準音声情
報を記憶したものである。また、絞込条件辞書として
は、地点検索を行うための都道府県名称等広い地域を示
す地域名称を示す基準音声情報を記憶した都道府県名称
辞書や、各都道府県毎に設けられ、各都道府県に属する
市区町村名等狭い地域を示す地域名称を示す基準音声情
報を記憶した市区町村名所辞書や、指定地点に存在する
施設の種類等の大分類ジャンル名称を示す基準音声情報
を記憶したジャンル名称辞書、及び、それぞれの大分類
ジャンル毎に設けられ、各大分類ジャンルに属するサブ
ジャンル名称を示す基準音声情報を記憶したサブジャン
ル名称辞書等がある。

【００２８】なお、一般的に最下層の地点名称の総数は
極めて多く、音声認識辞書用のＲＡＭの容量及び認識率
の点から、一度に認識する数としては実用的でないた
め、各地点名称辞書の地点名称の数（サイズ）がそれぞ
れ利用可能なＲＡＭ１０３の容量によって決定される基
準数未満となるように、上述のように音声認識辞書が階
層構造をなすとともに、複数の絞込条件の組合わせ毎に
地点名称を分類し、分類毎に地点名称辞書が設けられて
いる。

【００２９】認識辞書選択部１０５は、制御部１１０か
らの認識対象とする音声認識辞書の抽出等の指令に応じ
て、認識辞書記憶部１０４の中から認識対象とする音声
認識辞書を選択して抽出し、ＲＡＭ１０３に供給する。
ＲＡＭ１０３は、音声認識辞書が供給される毎に、認識
対象となる基準音声情報を供給された音声認識辞書のも
のに更新記憶する。

【００３０】認識部１０２は、入力音声が変換された特
徴量もしくは特徴量記憶部１０６に記憶された入力音声
が変換された特徴量と、ＲＡＭ１０３にロードされた音
声認識辞書中の基準音声情報との類似度を計算し、類似
度の高い基準音声情報及びその類似度（スコア）を認識
結果として、認識結果記憶部１０７及び制御部１１０に
出力する。認識結果記憶部１０７には、認識部１０２に
より認識された認識結果（絞込条件または地点名称）も
しくは制御部１１０から供給された認識結果を記憶する
とともに、認識結果統合部１０８及び制御部１１０に出
力する。認識結果統合部１０８は、認識結果記憶部１０
７に複数の地点名称が認識結果として記憶されている場
合に、類似度の高い方からＫ個を決定し新たな認識結果
として、制御部１１０へ供給する。そして、制御部１１
０は、認識結果統合部１０８から供給された新たな認識
結果を、第２認識結果として記憶更新すべく認識結果記
憶部１０７に出力する。

【００３１】音声合成部１０９は、制御部１１０からの
指令によって、ガイダンスメッセージやエコーバック用
の合成音声を作成し、スピーカ１１１に供給する。スピ
ーカ１１１は音声合成部１０９から供給された音声を出
力する。

【００３２】検索部１１１は、図示せぬ地図データ等の
データベースを備えており、制御部１１０からの指令に
よって、音声認識によって最終的に指定された地点の所
在地図や住所や電話番号やサービス内容等の詳細な施設
情報をデータベースから検索する。結果表示部１１２
は、音声操作を行う際の認識結果、認識対象語句、ガイ
ダンスメッセージ、エコーバック等とともに、検索部１
１１によって検索された詳細な施設情報を表示するディ
スプレイである。

【００３３】制御部１１０は、上述した各構成から出力
される出力結果に応じて各構成を制御するものである。
即ち、制御部１１０は、音声操作による地点の指定がな
される際に、まず、ジャンル名称辞書を認識辞書選択部
１０５が認識辞書記憶部１０４から取り出し、ＲＡＭ１
０３に認識対象となる基準音声情報として設定するよう
に制御する。更に、認識部１０２から得られる認識結果
や認識結果記憶部１０７に記憶された認識結果（絞込条
件）を基に、適切な音声認識辞書を抽出すべく認識辞書
選択部１０５への指示を行うとともに、音声合成部１０
９へガイダンスメッセージの作成を指示する。

【００３４】また、認識結果統合部１０８から供給され
た新たな認識結果を、現在の認識結果として記憶更新す
べく認識結果記憶部１０７に出力する。更に、最終的な
認識結果（地点名称）を受けて、合成音声による認識結
果のエコーバック、結果表示部１１２への結果表示、検
索部１１３への検索指示等を行う。制御部１１０の動作
の詳細についてはフローチャートを用いて後述する。

【００３５】ここで、認識辞書記憶部１０４に記憶され
ている複数の音声認識辞書が、互いに関連付けられて階
層構造を形成している様を図２乃至図４を用いて説明す
る。

【００３６】なお、図２乃至図４は音声認識辞書の具体
例の一部のみが示されている。まず、最上位の第１階層
の辞書として、階層飛ばし語句としての「わからない」及
び「駅名」、「病院」、「宿泊施設」などのジャンル名称を示
す基準音声情報を有するジャンル名称辞書（図２の２０
０、図３の３００、図４の４００）が設けられている。

【００３７】第１階層に続く第２階層の辞書として、駅
名、病院、宿泊施設などの各ジャンル名称に属するサブ
ジャンル名称を示す基準音声情報を有する、サブジャン
ル名称辞書（図２の２０１、図３の３０２乃至３０５、
図４の４０２乃至４０５）が、ジャンル名称毎に設けら
れている。また、サブジャンル名称を示す基準音声情報
としては、例えば、病院のサブジャンル名称辞書では、
診療所、内科、外科等に相当するサブジャンル名称を示
す基準音声情報、及び階層飛ばし語句としての「わから
ない」を示す基準音声情報がある。

【００３８】更に、第２階層のサブジャンル名称辞書に
続く第３階層の辞書として、日本全国の都道府県名称を
示す基準音声情報及び階層飛ばし語句としての「わから
ない」を示す基準音声情報を有する都道府県名称辞書
（図２の２０２、図３の３０６、図４の４０６）が設け
られている。

【００３９】また、第３階層の都道府県名称辞書に続く
第４階層の辞書として、各都道府県に存在する市区町村
名称を示す基準音声情報及び階層飛ばし語句としての
「わからない」を示す基準音声情報を有する市区町村名称
辞書（図２の２０３、図３の３０８乃至３１１、図４の
４０８乃至４１１）が、各都道府県名称毎に設けられて
いる。

【００４０】そして、最下位の第５階層の辞書として、
具体的な地点を示す該地点に存在する施設の固有名称な
どの地点名称（目的語）を示す基準音声情報を有する地
点名称辞書（図２の２０４乃至２１０、図３の３１２乃
至３１９、図４１３乃至４２０）が、第１階層から第４
階層の絞込条件の組合わせ毎に設けられている。

【００４１】以下に順次条件の絞込みを行い、地点の指
定を行う検索手順の例について説明する。〔例１〕本例
は、システムから催促それる絞込条件をユーザが全て把
握している場合の検索手順の例であり、ここでは埼玉県
川越市の病院（診療所）の栗田医院を指定する例を、図
２を用いて説明する。なお、図２における太線の矢印に
て検索手順を示す。

【００４２】はじめに対象地点に存在する施設の種別
（以下ジャンルと称する）での絞り込みを行う。”ジャ
ンル名称辞書”２００を用意するとともに、（1）「ジャ
ンルの名称をどうぞ」とガイダンスメッセージを出力
し、ユーザに対してジャンル名称の発話を促す。これに
対してユーザがジャンル名称として例えば（2）「病院」
と発話すると、音声認識システムが”ジャンル名称辞
書”２００を認識対象として発話を認識する。

【００４３】更なる絞込みを行うため、認識対象の”ジ
ャンル名称辞書”２００を”病院のサブジャンル名称辞
書”２０１に入れ替えるとともに、（3）「次のジャンル
の名称をどうぞ」とガイダンスメッセージを出力し、ユ
ーザに対してサブジャンル名称の発話を促す。これに対
してユーザがサブジャンル名称として例えば（4）「診療
所」と発話すると、音声認識システムが”病院のサブジ
ャンル名称辞書”２０１を認識対象として発話を認識す
る。

【００４４】サブジャンルが確定すると、更に地域での
絞込みを行う。認識対象の”病院のサブジャンル名称辞
書”２０１を”都道府県名称辞書”２０２に入れ替える
とともに、（5）「都道府県名をどうぞ」とガイダンスメ
ッセージを出力し、ユーザに対して都道府県名称の発話
を促す。これに対してユーザが都道府県名称として例え
ば（6）「埼玉県」と発話すると、音声認識システムが”
都道府県名称辞書”２０２を認識対象として発話を認識
する。

【００４５】都道府県が確定すると、更に詳細な地域で
の絞込みを行う。認識対象の”都道府県名称辞書”２０
２を”埼玉県の市町村名称辞書”２０３に入れ替えると
ともに、（7）「市区町村名をどうぞ」とガイダンスメッ
セージを出力し、ユーザに対して市区町村名称の発話を
促す。これに対してユーザが市区町村名称として例えば
（8）「川越市」と発話すると、音声認識システムが”埼
玉県の市町村名称辞書”２０３を認識対象として発話を
認識する。

【００４６】ここで、システム側は認識対象の”埼玉県
の市町村名称辞書”２０３を”埼玉県の川越市の診療所
の地点名称辞書”２０４に入れ替えるとともに、（9）
「名称をどうぞ」とガイダンスメッセージを出力し、指定
地点の具体的名称の発話を促す。これに対してユーザが
地点名称として（10）「栗田医院」と発話すると、音声認
識システムが”埼玉県の川越市の病院の診療所の地点名
称辞書”２０４を認識対象として発話を認識する。

【００４７】〔例２〕本例は、システムから催促される
絞込条件のうち対象地点が存在する市区町村名称をユー
ザが把握していない場合の検策手順の例であり、ここで
は埼玉県の病院（診療所）の小林医院を指定する例を示
す。なお、本例の検索手順を図３（ａ）における太線の
矢印にて示す。

【００４８】はじめに、対象地点に存在する施設の種別
（以下ジャンルと称する）での絞込みを行う。”ジャン
ル名称辞書”３００を用意するとともに、（1）「ジャン
ルの名称をどうぞ」とガイダンスメッセージを出力し、
ユーザに対してジャンル名称の発話を促す。これに対し
てユーザがジャンル名称として例えば（2）「病院」と発
話すると、音声認識が”ジャンル名称辞書”３００を認
識対象として発話を認識する。

【００４９】更なる絞込みを行うため、認識対象の”ジ
ャンル名称辞書”３００を”病院のサブジャンル名称辞
書”３０３に入れ替えるとともに、（3）「次のジャンル
の名称をどうぞ」とガイダンスメッセージを出力し、ユ
ーザに対してサブジャンル名称の発話を促す。これに対
してユーザがサブジャンル名称として例えば（4）「診療
所」と発話すると、音声認識システムが”病院のサブジ
ャンル名称辞書”３０３を認識対象として発話を認識す
る。

【００５０】サブジャンルが確定すると、更に地域での
絞込みを行う。認識対象の”病院のサブジャンル名称辞
書”３０３を”都道府県名称辞書”３０６に入れ替える
とともに、（5）「都道府県名をどうぞ」とガイダンスメ
ッセージを出力し、ユーザに対して都道府県名称の発話
を促す。これに対してユーザが都道府県名称として例え
ば（6）「埼玉県」と発話すると、音声認識システムが”
都道府県名称辞書”３０６を認識対象として発話を認識
する。

【００５１】都道府県が確定すると、更に詳細な地域で
の絞込みを行う。認識対象の”都道府県名称辞書”３０
６を”埼玉県の市町村名称辞書”３０９に入れ替えると
ともに、（7）「市区町村名をどうぞ」とガイダンスメッ
セージを出力し、ユーザに対して市区町村名称の発話を
促す。これに対してユーザが市区町村名称を把握してお
らず（8）「わからない」と階層飛ばし語句を発話する
と、”埼玉県の市町村名称辞書”３０９を認識対象とし
て発話を認識する。

【００５２】第４階層にて階層飛ばし語句が発話された
場合は、システム側は、第４階層の”埼玉県の市町村名
称辞書”３０９内の市町村名称の入力を催促せずに第４
階層の辞書の絞込条件の入力を飛ばし、第４階層にて”
埼玉県の市町村名称辞書”３０９内の全ての市町村名称
を絞込条件として入力されたものとし、第５階層の辞書
として”埼玉県の全ての市町村の病院の診療所の辞書”
３１３乃至３１６を抽出してまとめて”埼玉県の病院の
診療所の辞書”３１２を作成し、認識対象の”埼玉県の
市町村名称辞書”３０９を”埼玉県の病院の診療所の辞
書”３１２に入れ替えるとともに、（9）「名称をどう
ぞ」とガイダンスメーセージを出力し、指定地点の具体
名称の発話を促す。これに対してユーザが地点名称とし
て（10）「小林医院」と発話すると、音声認識システム
が”埼玉県の病院の診療所の辞書”３１２を認識対象と
して発話を認識する。

【００５３】尚、上述の図３（ａ）は、ある階層での絞
込条件の入力の際に飛ばし語句を発話すると、その階層
での絞込条件の入力を飛ばして、すぐ下位の階層に進み
絞込条件の入力を催促する例である。しかしながら、ジ
ャンル名称が不明な時はサブジャンル名称も不明である
可能性が高く、また、都道府県名称が不明な時は市区町
村名称も不明な可能性が高いため、図３（ｂ）に示すよ
うに、所定の階層にて飛ばし語句を発話した場合すぐ下
位の階層へ進むのではなく、階層飛ばし語句の階層に応
じて、２つ下の階層へ進むなどするように飛ばし先を設
定することも考えられる。

【００５４】〔例３〕本例は、システムから催促される
絞込条件のうち対象地点に存在する施設のサブジャンル
をユーザが把握していない場合の検索手順の例であり、
ここでは埼玉県川越市の病院の斉藤医院を指定する例を
示す。なお、本例の検索手順を図４における太線の矢印
にて示す。

【００５５】はじめに対象地点に存在する施設の種別
（以下ジャンルと称する）での絞込みを行う。”ジャン
ル名称辞書”４００を用意するとともに、（1）「ジャン
ルの名称をどうぞ」とガイダンスメッセージを出力し、
ユーザに対してジャンル名称の発話を促す。これに対し
てユーザがジャンル名称として例えば（2）「病院」と発
話すると、音声認識システムが”ジャンル名称辞書”４
００を認識対象として発話を認識する。

【００５６】更なる絞込みを行うため、認識対象の”ジ
ャンル名称辞書”４００を”病院のサブジャンル名称辞
書”４０３に入れ替えるとともに、（3）「次のジャンル
の名称をどうぞ」とガイダンスメッセージを出力し、ユ
ーザに対してサブジャンル名称の発話を促す。これに対
してユーザがサブジャンル名称を把握しておらず（4）
「わからない」と階層飛ばし語句を発話すると、音声認識
システムが”病院のサブジャンル名称辞書”４０３を認
識対象として発話を認識する。

【００５７】第２階層にて階層飛ばし語句が発話された
場合は、システム側は、第２階層の”病院のサブジャン
ル名称辞書”４０３内のサブジャンル名称の入力を催促
せずに第２階層の辞書の絞込条件の入力を飛ばし、第２
階層にて”病院のサブジャンル名称辞書”４０３内の全
てのサブジャンル名称を絞込条件として入力されたもの
として、第３階層の認識対象の辞書として”病院のサブ
ジャンル名称辞書”４０３を”都道府県名称辞書”４０
６に入れ替えるとともに、（5）「都道府県名をどうぞ」
とガイダンスメッセージを出力し、ユーザに対して都道
府県名称の発話を促す。これに対してユーザが都道府県
名称として例えば（6）「埼玉県」と発話すると、音声認
識システムが”都道府県名称辞書”４０６を認識対象と
して発話を認識する。

【００５８】都道府県が確定すると、更に詳細な地域で
の絞込みを行う。認識対象の”都道府県名称辞書”４０
６を”埼玉県の市町村名称辞書”４０９に入れ替えると
ともに、（7）「市区町村名をどうぞ」とガイダンスメッ
セージを出力し、ユーザに対して市区町村名称の発話を
促す。これに対してユーザが市区町村名称として例えば
（8）「川越市」と発話すると、音声認識システムが”埼
玉県の市町村名称辞書”４０９を認識対象として発話を
認識する。

【００５９】ここで、システム側は、”埼玉県の川越市
の病院の辞書全て”４１７乃至４２０を抽出しまとめ
て”埼玉県川越市の病院の辞書”４１３を作成し、認識
対象の”埼玉県の市町村名称辞書”３０９を”埼玉県川
越市の病院の辞書”４１３に入れ替えるとともに、
（9）「名称をどうぞ」とガイダンスメッセージを出力
し、指定地点の具体的名称の発話を促す。これに対して
ユーザが地点名称として（10）「斉藤医院」と発話する
と、音声認識システムが”埼玉県川越市の病院の辞書”
４１３を認識対象として発話を認識する。

【００６０】図５乃至図７は、本発明実施形態の動作を
説明するために引用したフローチャートである。

【００６１】以下、図５乃至図７に示すフローチャート
を参照しながら、図１乃至図３に示す本発明実施形態の
動作について詳細に説明する。

【００６２】図５において、まず制御部１１０は、図示
せぬ発話ボタン等によりユーザからの音声入力による地
点検索の検索開始要求がなされることを検出する。（ス
テップＳ５００）。検出されなければ（ステップＳ５０
０ＮＯ）待機する。検出されたら（ステップＳ５００
ＹＥＳ）認識結果記憶部１０７に記憶されている前回
の絞込条件、すなわちジャンル名称、サブジャンル名
称、都道府県名称、市区町村名称、及び指定地点の固有
名称を全てクリアする（ステップＳ５０１）。認識辞書
記憶部１０４に記憶された音声認識辞書の中からジャン
ル名称辞書を認識辞書選択部１０５に抽出させ、ジャン
ル名称辞書内の各ジャンル名称を認識対象語句とすべく
各ジャンル名称を示す基準音声情報をＲＡＭ１０３にロ
ードする（ステップＳ５０２）。

【００６３】制御部１１０は、ユーザにより発話された
入力音声（ジャンル名または「わからない」）に対し、Ｒ
ＡＭ１０３にロードされた音声認識辞書を対象として認
識部１０２に認識処理を行わせ、認識結果を制御部１１
０へ出力させる（ステップＳ５０３）。ステップＳ５０
３で得られた認識結果が「わからない」等の階層飛ばし語
句の場合、（ステップＳ５０４ＹＥＳ）、ステップＳ
５０５のジャンル名称による絞込条件の設定処理を飛ば
して、ステップＳ５０６の処理へ進む。一方、ステップ
Ｓ５０３で得られた認識結果が、いずれのジャンル名称
であつた場合、（ステップＳ５０４ＮＯ）、認識され
たジャンル名称を絞込条件として認識結果記憶部１０７
に記憶する（ステップＳ５０５）。

【００６４】続いて、制御部１１０は、認識辞書記憶部
１０４に記憶されている音声認識辞書の中から、認識辞
書選択部１０５に現在ＲＡＭ１０３に認識対象語句とし
て記憶されているジャンル名称辞書に続く下位階層に属
するサブジャンル名称辞書を抽出させ、抽出されたサブ
ジャンル名称辞書内のサブジャンル名称を認識対象語句
とすべく各サブジャンル名称を示す基準音声情報をＲＡ
Ｍ１０３にロードする（ステップＳ５０６）。なお、こ
こでロードされるサブジャンル名称は、ステップＳ５０
３での認識結果が「わからない」等の階層飛ばし語句で
あった場合、ステップＳ５０２にてＲＡＭ１０３に認識
対象語句としてセットされていたジャンル名辞書内の基
準音声情報に属する下位階層に相当する全てのサブジャ
ンル名辞書を選択するため、すべてのサブジャンル名称
を認識対象語句としてＲＡＭ１０３にロードする。一
方、ステップＳ５０３での認識結果が何らかのジャンル
名称であった場合、認識されたジャンル名称に属するサ
ブジャンル名称の音声認識辞書を選択して、選択された
サブジャンル名称辞書内のサブジャンル名称を対象語句
としてＲＡＭ１０３にロードする。

【００６５】ユーザにより発話された入力音声（サブジ
ャンル名または「わからない」）に対し、ＲＡＭ１０３
にロードされた音声認識辞書を対象として認識部１０２
に認識処理を行わせ、認識結果を制御部１１０へ出力さ
せる（ステップＳ５０７）。

【００６６】ステップＳ５０７にて得られた認識結果が
「わからない」等の階層飛ばし語句の場合は、（ステッ
プＳ５０８ＹＥＳ）、ステップＳ５０９のサブジャン
ル名称による絞込条件の設定処理を飛ばして、ステップ
Ｓ５１０に進む。一方、ステップＳ５０７にて得られた
認識結果が、いずれかのサブジャンル名称であった場
合、（ステップＳ５０８ＮＯ）、認識されたサブジャ
ンル名称を絞込条件として認識結果記憶部１０７に設定
する（ステップＳ５０９）。

【００６７】認識辞書記憶部１０４に記憶された音声認
識辞書の中から、都道府県名称辞書を認識辞書選択部１
０５に抽出させ、抽出させた都道府県名称辞書内の都道
府県名称を認識対象語句とすべく各都道府県名称を示す
基準音声情報をＲＡＭ１０３にロードする（ステップＳ
５１０）。なお、ここでロードされる都道府県名称は、
ステップＳ５０７での認識結果が「わからない」等の階
層飛ばし語句あった場合も、何らかのサブジャンル名で
あった場合も、都道府県名称辞書を選択して、選択され
た都道府県名称辞書内の都道府県名称を認識対象語句と
してＲＡＭ１０３にロードする。

【００６８】ユーザにより発話された入力音声（都道府
県名称または「わからない」）に対し、ＲＡＭ１０３に
ロードされた音声認識辞書を対象として認識部１０２に
認識処理を行わせ、認識結果を制御部１１０へ出力させ
る（ステップＳ５１１）。ステップＳ５１１で得られた
認識結果が「わからない」等の階層飛ばし語句の場合は
（ステップＳ５１２ＹＥＳ）、ステップＳ５１３の都
道府県名称による絞込条件の設定処理を飛ばして、ステ
ップＳ５１４に進む。一方、ステップＳ５１１で得られ
た認識結果がいずれかの都道府県名称であった場合（ス
テップＳ５１２ＮＯ）、認識された都道府県を絞込条件
として認識結果記憶部１０７に設定する（ステップＳ５
１３）。

【００６９】認識辞書記憶部１０４に記憶された音声認
識辞書の中から、認識辞書選択部１０５に市区町村名称
辞書を抽出させ、市区町村名称を認識対象語句とすべく
各市区町村名称を示す基準音声情報をＲＡＭ１０３にロ
ードする（ステップＳ５１４）。

【００７０】なお、ここでロードされる市区町村名称
は、ステップＳ５１１での認識結果が「わからない」等
の階層飛ばし語句あった場合、ステップＳ５１０にてセ
ットされていた全国全ての都道府県名称辞書内の基準音
声情報に属する下位階層に相当する全国全ての市区町村
名称辞書を選択して、すべての市区町村名称を認識対象
語句としてＲＡＭ１０３にロードする。一方、ステップ
Ｓ５１１での認識結果が何らかの都道府県名であった場
合、認識された都道府県に存在する市区町村の音声認識
辞書を抽出させ、抽出された市区町村名称辞書内の市区
町村名称を認識対象語句としてＲＡＭ１０３にロードす
る。

【００７１】ユーザにより発話された入力音声（市区町
村名称または「わからない」）に対し、ＲＡＭ１０３に
ロードされた音声認識辞書を対象として認識部１０２に
認識処理を行わせ、認識結果を制御部１１０へ出力させ
る。（ステップＳ５１５）。ステップＳ５１５で得られ
た認識結果が「わからない」等の階層飛ばし語句の場合
は（ステップＳ５１６ＹＥＳ）、ステップＳ５１７の
市区町村名称による絞込条件の設定処理を飛ばしてステ
ップＳ５１８へ進む。一方、ステップＳ５１５で得られ
た認識結果がいずれかの市区町村名であった場合（ステ
ップＳ５１６ＮＯ）、認識された市区町村を絞込条件と
して認識結果記憶部１０７に設定する（ステップＳ５１
７）。

【００７２】認識辞書記憶部１０４に記憶された音声認
識辞書でステップＳ５０５、Ｓ５０９、Ｓ５１３、Ｓ５
１７の処理で認識結果記憶部１０７に記憶された絞込条
件を満たす地点名称辞書内の基準音声情報の数（サイ
ズ）の総和を計算する（ステップＳ５１８）。地点名称
辞書のサイズの総和が、ＲＡＭ１０３の容量に応じて設
定された基準数を越える場合は（ステップＳ５１９Ｎ
Ｏ）、認識対象となる全ての地点名称辞書に対して複数
回認識処理を行う（ステップＳ５２０）。地点名称辞書
のサイズの総和がＲＡＭ１０３の容量以下の場合は（ス
テップＳ５１９ＹＥＳ）、記憶された絞込条件を満たす
全ての地点名称辞書内の地点名称を認識対象語句とすべ
く各地点名称を示す基準音声情報をＲＡＭ１０３にロー
ドし（ステップＳ５２１）、通常の認識処理を行う（ス
テップＳ５２２）。そして、ステップＳ５２０またはス
テップＳ５２２で得られた認識結果である地点名称を出
力させる（ステップＳ５２３）。

【００７３】尚、上述のフローチャートでは、絞込条件
としてジャンル名称の入力を飛ばした場合、即ちステッ
プＳ５０３で得られた認識結果が「わからない」等の階層
飛ばし語句であった場合（ステップＳ５０４ＹＥ
Ｓ）、ステップＳ５０５のジャンる名称による絞込条件
の設定処理のみを飛ばして、ステップＳ５０６の処理へ
進むようになっているが、上述の例に限らず、ジャンル
名称がわからない場合サブジャンル名称もわからない可
能性が高いため、サブジャンル名称の入力も飛ばして、
ステップＳ５１０の処理へ進むようにしてもよい。

【００７４】図５の示すステップＳ５０３、Ｓ５０７、
Ｓ５１１、Ｓ５１５、Ｓ５２２におけるユーザにより入
力された音声に対する認識部１０２の各認識処理の詳細
手順について、図６のフローチャートを用いて説明す
る。

【００７５】図６において、マイク１００からの音声の
入力が開始されたか否かを判断する（ステップＳ６０
０）。音声の入力の検出方法としては、特微量計算部１
０１にて、予め音圧レベルに関する閾値と基準時間とを
記憶しておき、マイク１００からの入力信号の音圧レベ
ルと閾値とを比較し、入力信号が所定の閾値を越えた状
態が、基準時間以上継続した場合に、音声の入力が開始
されたとみなす等の方法が考えられる。

【００７６】音声開始が検出されると、特徴量計算部１
０１にて入力音声を音声認識に適した特徴量に変換させ
（ステップＳ６０１）、特徴量記憶部１０６に記憶させ
るとともに、特徴量計算部１０１から認識部１０２に供
給させる。認識部１０２にて、供給された特徴量とＲＡ
Ｍ１０３にロードされている各基準音声情報との類似度
を計算する（ステップＳ６０２）。そして、音声の入力
が終了されたか否かを判断する（ステップＳ６０３）。
尚、音声の終了の検出方法としては、特微量計算部１０
１にて、予め音圧レベルに関する閾値と基準時間とを記
憶しておき、マイク１００からの入力信号の音圧レベル
と閾値をそれぞれ比較し、入力信号が閾値以下の状態が
所定時間以上続いた場合に、音声の入力が終了したとみ
なす等の方法が考えられる。

【００７７】音声が終了していないと判断された場合
（ステップＳ６０３ＮＯ）、ステップＳ６０１の処理
へ戻る。一方、音声が終了したと判断された場合（ステ
ップＳ６０３ＹＥＳ）、ステップＳ６０２にて求めら
れた類似度の高い基準音声情報とその類似度とを対応づ
けて認識結果として、制御部１１０及び認識結果記憶部
１０７に出力し、認識結果記憶部１０７に記憶させる
（ステップＳ６０４）。

【００７８】図５のフローチャートにて述べた、ステッ
プＳ５１８にて求められた地点名称辞書のサイズの総和
が、ＲＡＭ１０３の容量に入りきらない場合（ステップ
Ｓ５１９ＮＯ）に、ステップＳ５２０にて行われる複
数回認識処理について、図７のフローチャートを用いて
説明する。複数回認識処理とは、１回の入力音声に対し
て認識対象とする辞書（Ｎ個）を切り替えながら認識処
理を繰り返し、それぞれの辞書に対する認識結果を統合
し、最終的に全体としての認識結果を決定することであ
る。

【００７９】図７において、認識辞書記憶部１０４に記
憶された辞書でステップＳ５０５、Ｓ５０９、Ｓ５１
３、Ｓ５１７の処理において認識結果記憶部１０７に記
憶された絞込条件を満たす地点名称辞書の数（Ｎ）をカ
ウントする（ステップＳ７００）。続いて辞書番号ｎ＝
１とする。（ステップＳ７０１）。ここで、絞込条件を
満たす地点名称辞書のうち、管理番号が一番若い地点名
称辞書を辞書番号１の地点名称辞書とし、認識辞書選択
部１０５に辞書番号ｎ（＝１）番目の地点名称辞書を認
識辞書記憶部１０４から抽出させ、抽出した地点名称辞
書の地点名称を認識対象語句とすべく各地点名称を示す
基準音声情報をＲＡＭ１０３にロードする（ステップＳ
７０２）。ここで、管理番号とは、認識辞書記憶部１０
４に記憶された音声認識辞書各々に順番につけられた番
号のことである。

【００８０】次に、マイク１００から音声の入力が開始
されたか否かを判断する（ステップＳ７０３）。音声の
入力の検出方法としては、特徴量計算部１０１にて、予
め音圧レベルに関する閾値と基準時間とを記憶してお
き、マイク１００からの入力信号の音圧レベルと閾値を
それぞれ比較し、入力信号が所定の閾値を越えた状態
が、基準時間以上継続した場合に、音声の入力が開始さ
れたとみなす等の方法が考えられる。

【００８１】音声開始が検出されると、特徴量計算部１
０１にて入力音声を音声認識に適した特徴量に変換させ
（ステップＳ７０４）、特徴量記憶部１０６に記憶させ
（ステッフ゜Ｓ７０５）、特徴量記憶部１０６から認識
部１０２に供給させる。認識部１０２にて、供給された
特徴量とＲＡＭ１０３にロードされている全ての基準音
声情報との類似度を計算させる（ステップＳ７０６）。
そして、音声の入力が終了したか否かを判断する（ステ
ップＳ７０７）。

【００８２】尚、音声の終了の検出方法としては、特徴
量抽出部１０１にて、予め音圧レベルに関する閾値と基
準時間とを記憶しておき、マイク１００からの入力信号
の音圧レベルと閾値をそれぞれ比較し、入力信号が所定
の閾値以下の状態が所定時間続いた場合に、音声の入力
が終了したとみなす等の方法が考えられる。

【００８３】音声が終了していないと判断された場合
（ステップＳ７０７ＮＯ）、ステップＳ７０４の処理
へ戻る。一方、音声の終了したと判断された場合（ステ
ップＳ７０７ＹＥＳ）、ステップＳ７０６にて求めら
れた類似度の高い順にＫ個の基準音声情報を、その類似
度とを対応づけて辞書番号ｎ＝１の地点名称辞書の認識
結果として、認識結果記憶部１０７に出力し、認識結果
記憶部１０７に記憶させる（ステップＳ７０８）。な
お、Ｋは１以上の整数であり、適宜システム設計者によ
って設定される値である。

【００８４】続いて辞書番号ｎ＝２とする（ステップＳ
７０９）。辞書番号ｎが、ステップＳ７００にてカウン
トした認識対象辞書数（N）より大きいか否かが判断さ
れる（ステップＳ７１０）。辞書番号ｎが認識対象辞書
数（Ｎ）以下であれば（ステップＳ７１０ＮＯ）、ス
テップＳ７１１の処理へ進む。絞込条件を満たす地点名
称辞書のうち、管理番号がｎ番目に若い地点名称辞書を
辞書番号＝ｎの地点名称辞書とし、認識辞書選択部１０
５に辞書番号（ｎ）の地点名称辞書を認識辞書記憶部１
０４から抽出させ、抽出した地点名称辞書の地点名称を
認識対照語句とすべく各地点名称を示す基準音声情報を
ＲＡＭ１０３にロードする（ステップＳ７１１）。

【００８５】入力音声の特徴量は既に特徴量記憶部１０
６に記憶されているので、そこから認識部１０２へ供給
し認識部１０２にて、供給された特徴量とＲＡＭ１０３
にロードされている全ての基準音声情報との類似度を計
算させる（ステップＳ７１２）。ステップＳ７１２にて
求められた類似度の高い順にＫ個の基準音声情報を、そ
の類似度とを対応づけて辞書番号ｎの地点名称辞書の認
識結果として、認識結果記憶部１０７に出力し、認識結
果記憶部１０７に記憶させる（ステップＳ７１３）。そ
して、辞書番号ｎを＝ｎ＋１にインクリメントとする
（ステップＳ７１４）。以下、ステップＳ７１０にて辞
書番号ｎが認識対象辞書数（Ｎ）を越えると判断される
まで、ステップＳ７１１〜ステップＳ７１４の処理を繰
り返す。

【００８６】一方、辞書番号ｎが認識対象辞書数（Ｎ）
より大きければ（ステップＳ７１０ＹＥＳ）、ステップ
Ｓ７１５の処理へ進む。ステップＳ７１５では認識結果
統合部１０８によって認識結果記憶部１０７に記憶され
たＫ×Ｎ個の認識結果の中から類似度の高い順に第Ｋ個
を第２認識結果として選択して、制御部１１０に出力さ
せ、認識結果記憶手段１０７に更新記憶させる。尚、Ｋ
が１の場合は、ステップＳ７１５にて認識結果が１つ特
定されるが、Ｋが２以上の場合は、Ｋ個の第２認識結果
の中から、さらに１つを選択させるため、Ｋ個の第２認
識結果を制御部１１０に出力し、結果表示部１１２にＫ
個の地点名称を表示させ、図示せぬ操作釦にて選択させ
るようにする。もしくは、類似度が一番高いものを認識
結果としてスピーカ１１１及び結果表示部１１２を用い
てユーザに提示し、ユーザのＮＯ等の発話に応じて、続
いて高い類似度のものを同様に提示し、ユーザが操作も
しくはＹＥＳ等と発話されるまで順次提示して、認識結
果から一つを決定するようにしてもよい。

【００８７】なお、階層飛ばし語句としては、「わから
ない」という言葉は一例であり、システムが要求してい
る情報をユーザが有していないことを表現する言葉であ
れば良く、例えば「パス」「次」等複数であっても良い。ま
た、絞込の条件も「ジャンル名称」「サブジャンル名称」
「都道府県名称」「市区町村名称」に限定されるものではな
く、「地名名称」や「郵便番号」などでもよい。

【００８８】

【発明の効果】以上説明のように本発明によれば、指定
地点の絞込みをおこなう際に、ユーザが知らない条件の
入力をシステムから求められた場合に、階層飛ばしを示
す基準音声情報（「わからない」と発話）を入力ことに
より、検索を継続することができ、操作性ならびに応答
性の改善がはかれる。

【００８９】なお、この場合、絞込条件は予めシステム
によって設定されていた数より少なくなってしまうた
め、最終的に名称を発話する際の認識対照語句の数が大
きくなり、認識率が低下する可能性はあるが、検索を継
続することが可能となり、操作性、応答性の面での効果
が大きい。また、認識対象語句の増加により、メモリの
容量が問題となるが、複数に分けて認識処理を行うこと
でこれを回避することができる。

【図面の簡単な説明】

【図１】本発明における音声認識装置の実施形態を示
すブロック図である。

【図２】本発明において使用される階層構造を持つ音
声認識辞書の階層辞書ツリーの一例を示す図である。

【図３】本発明において使用される階層構造を持つ音
声認識辞書の階層辞書ツリーの一例を示す図である。

【図４】本発明において使用される階層構造を持つ音
声認識辞書の階層辞書ツリーの一例を示す図である。

【図５】本発明実施形態の音声認識処理による地点検
索の動作を説明するために引用したフローチャートであ
る。

【図６】本発明実施形態の音声認識処理動作を説明す
るために引用したフローチャートである。

【図７】本発明実施形態の複数回認識処理動作を説明
するために引用したフローチャートである。

【符号の説明】

１００…マイク、１０１…特徴量計算部、１０２…認識
部、１０３…ＲＡＭ、１０４…認識辞書記憶部、１０５
…認識辞書選択部、１０６…特徴量記憶部、１０７…認
識結果記憶部、１０８…認識結果統合部、１０９…音声
合成部、１１０…制御部、１１１…スピーカ、１１２…
結果表示部、１１３…検索部

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ０８Ｇ 1/0969

Claims

【特許請求の範囲】

【請求項１】複数の基準音声信号を有する複数の音声
認識辞書を互いに階層的に関連付けて記憶した階層辞書
部と、前記階層辞書部から適切な音声認識辞書を抽出す
る抽出手段と、前記抽出された音声認識辞書を記憶する
一覧記憶手段と、音声を入力する音声入力手段と、入力
された音声と前記一覧記憶手段に記憶されている音声認
識辞書内の基準音声情報とを比較することによって入力
された前記音声を認識する認識手段と、認識された前記
音声に相当する基準音声情報の下位階層に属する音声認
識辞書を抽出手段が抽出し、抽出された音声認識辞書を
前記一覧記憶手段が更新記憶する音声認識装置であっ
て、所定の音声認識辞書に階層飛ばしを示す基準音声情報が
用意されており、前記認識手段が階層飛ばしを示す基準
音声情報に相当する音声の入力を認識した際に、前記一
覧記憶手段に記憶されていた基準音声情報の下位階層に
属する音声認識辞書を前記抽出手段が抽出し、前記一覧
記憶手段に更新記憶することを特徴する音声認識装置。
【請求項２】前記音声認識辞書として、施設の種別名
を記憶した種別辞書と、前記施設の種別に属する施設名
を記憶した地点辞書とを備えることを特徴とする請求項
１に記載の音声認識装置。
【請求項３】前記音声認識辞書として、地域名を記憶
した地域辞書と、いずれかの地域に存在する施設の施設
名を記憶した地点辞書とを備えることを特徴とする請求
項１に記載の音声認識装置。
【請求項４】前記音声認識辞書として、地域名を記憶
した地域辞書と、前記施設の種別名を記憶した種別辞書
と、いずれかの地域に存在するとともにいずれかの種別
に属する施設の施設名を記憶した地点辞書とを備え、前記種別名選択階層にて階層飛ばしを示す基準音声情報
が認識された後、前記抽出手段が前記地域辞書を抽出す
ることを特徴とする請求項１に記載の音声認識装置。
【請求項５】前記認識手段によって認識された前記基
準音声情報の下位階層に属する音声認識辞書の中の基準
音声情報の数を判定する数判断手段と、入力された音声
を記憶する入力音声記憶手段と、前記入力音声記憶手段
に記憶されている音声と一覧記憶手段に記憶されている
基準音声情報とを前記認識手段が順次比較することによ
り、類似する基準音声情報を認識し、類似する基準音声
情報を記憶する類似ワード記憶手段とを備えた音声認識
装置であって、前記数判断手段において、認識された音声に相当する基
準音声情報の下位階層に属する音声認識辞書内の基準音
声情報の語句の数が基準値を超えているか判断する判断
手段を備え、前記所定数以上と判断されたとき、前記抽出手段が下位
階層に属する前記音声認識辞書の一部の音声認識辞書を
抽出して前記一覧記憶手段に記憶し、前記認識手段が前記一覧記憶手段に記憶されている基準
音声情報との比較を終了した後、前記抽出手段が下位階
層に属する前記音声認識辞書のうち未抽出の辞書を抽出
し、前記一覧記憶手段が更新記憶するとともに、前記認識手段が前記一覧記憶手段内に更新記憶された辞
書に属する基準音声情報と前記入力音声記憶手段に記憶
されている音声とを順次比較し、類似する基準音声情報
を認識し、類似ワード記憶手段が新たに認識された類似する前記基
準音声情報を追加記憶することを特徴とする請求項１に
記載の音声認識装置。
【請求項６】前記類似ワード記憶手段に記憶された全
ての類似ワードにおける一つを前記認識手段が認識し、
認識結果とすることを特徴とする請求項５に記載の音声
認識装置。
【請求項７】前記一覧記憶手段に記憶されている基準
音声情報の内、複数の類似する基準音声情報を前記類似
ワード記憶手段に記憶し、前記類似ワード記憶手段に記
憶された全ての類似する基準音声情報のなかから更に認
識結果を選出する選出手段を備えることを特徴とする請
求項５に記載の音声認識装置。
【請求項８】複数の基準音声情報を有する複数の音声
認識辞書を記憶した階層辞書部と、前記複数の音声認識
辞書のうち１の辞書を抽出する抽出手段と、抽出された
前記辞書を記憶する一覧記憶手段と、音声を入力する音
声入力手段と、入力された音声を記憶する入力音声記憶
手段と、前記入力音声記憶手段に記憶されている音声と
前記一覧記憶手段に記憶されている基準音声情報と順次
比較し、類似する基準音声情報を認識する認識手段と、
類似する前記基準音声情報を記憶する類似ワード記憶手
段とを備えた音声認識装置であって、前記一覧記憶手段に記憶されている辞書に属する全ての
基準音声情報と前記入力音声記憶手段に記憶されている
音声との比較を前記認識手段が終了した後、前記抽出手
段が音声認識辞書から未抽出の辞書を抽出し、前記一覧
記憶手段が更新記憶するとともに、前記認識手段が前記一覧記憶手段に更新記憶された辞書
に属する基準音声情報と前記入力音声記憶手段に記憶さ
れている音声との比較をして類似する基準音声情報を認
識し、前記類似ワード記憶手段が新たに認識した類似する基準
音声情報を追加記憶することを特徴とする音声認識装
置。
【請求項９】前記類似ワード記憶手段に記憶されてい
る複数の基準音声情報の中から、更に認識結果を選出す
る選出手段を備えたことを特徴とする請求項８に記載の
音声認識装置。
【請求項１０】階層構造をなす複数の音声認識辞書の
中から基準音声情報を抽出し、抽出された基準音声情報
と入力された音声とを比較することにより音声を認識す
る音声認識方法であって、所定の音声認識辞書に階層飛ばしを示す基準音声情報が
用意されており、前記階層飛ばしを示す基準音声情報に
相当する音声の入力を認識した際に、比較対象となって
いた基準音声情報の下位階層に属する音声認識辞書の一
部を抽出して音声認識を行うことを特徴とする音声認識
方法。
【請求項１１】認識された基準音声情報の下位階層に
属する音声認識辞書の中の基準音声情報の数を判断し、
その数が基準値を超えていると判断されたとき、下位階
層に属する前記音声認識辞書の一部を抽出して、比較す
ることにより類似する基準音声情報を認識し、抽出され
た基準音声情報との比較が終了した後、下位階層に属する前記音声認識辞書の中から未抽出の音
声認識辞書を抽出し、比較することにより類似する基準
音声情報を認識し、複数の類似する前記基準音声情報の中から、入力された
音声に相当する基準音声情報をさらに選出することを特
徴とする請求項１０に記載の音声認識方法。
【請求項１２】複数の基準音声情報を有する複数の音
声認識辞書の中から１つの音声認識辞書を抽出し、抽出
された音声認識辞書内の基準音声情報と入力された音声
を比較し、抽出された前記音声認識辞書による基準音声
情報との比較が終了した後、前記１つの音声認識辞書と
異なる他の音声認識辞書を抽出し、抽出された音声認識
辞書内の基準音声情報を、比較対象の基準音声情報とし
て更新すると共に、更新された基準音声情報と前記入力
された音声とを比較することにより、入力された前記音
声を認識することを特徴とする音声認識方法。