JPH11231886A

JPH11231886A - 登録名称認識装置

Info

Publication number: JPH11231886A
Application number: JP10035816A
Authority: JP
Inventors: Eiji Sofue; 栄二祖父江
Original assignee: Denso Corp
Current assignee: Denso Corp
Priority date: 1998-02-18
Filing date: 1998-02-18
Publication date: 1999-08-27

Abstract

(57)【要約】【課題】登録されている名称等の文字列のテキストを
表示した場合にユーザーの受ける印象を良くし、また、
名称を登録する際の手間を簡単にする。【解決手段】本発明の登録名称認識装置は、仮名文字
にアルファベット文字や漢字や記号等を加えた文字で名
称等の文字列のテキストを入力する入力手段を備え、入
力された前記テキストを記憶するテキスト記憶手段１２
を備え、入力された前記テキストに基づいて仮名文字を
並べて構成された前記テキストの読みを生成する読み生
成手段１１を備え、生成された前記テキストの読みを記
憶する読み記憶手段を備えて構成されている。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、例えばカーナビゲ
ーション装置に目的地等の名称をユーザーが登録する際
に使用するための装置であって、登録した名称を音声で
認識可能にするための装置である登録名称認識装置に関
する。

【０００２】

【従来の技術】例えば自動車のＥＭＶ（エレクトロマル
チビジョン）システムには、ディスプレイ、キーボー
ド、カーナビゲーション装置、音声認識装置等が組み込
まれている。このようなＥＭＶシステムにおいては、目
的地や施設名等の名称を多数登録することが可能に構成
されていると共に、登録されている多数の名称のうちの
所望の１つをユーザーが音声で選択することが可能に構
成されている。この場合、ＥＭＶシステムの音声認識装
置は、ユーザーが発生した音声（名称の音声）を入力す
ると共に、この入力した音声と、登録されている名称と
を比較（照合）し、一致度合いが最も高いものを認識結
果として出力（選択）するように構成されている。

【０００３】ここで、名称を登録する方法として、音声
パターンで登録する方法と、文字列のテキストで登録す
る方法がある。このうち、音声パターンで登録する方法
は、音声パターンのデータ量が非常に多いため大容量の
記憶装置が必要であると共に、登録されている名称を確
認するには、すべての名称を音声で再生して出力させる
必要があり、確認がかなり面倒である。これに対して、
テキストで登録する方法は、テキストのデータ量が少な
いため小容量の記憶装置で十分であると共に、登録され
ている名称を確認するにはすべての名称をディスプレイ
に表示してやるだけで済むから、確認が簡単である。こ
のため、一般的に、テキストで登録する方法が採用され
ている。

【０００４】

【発明が解決しようとする課題】名称をテキストで登録
する場合、従来においては、キーボードを使用して仮名
文字（カタカナ）でテキストを入力するようにしてい
た。しかし、上記従来構成の場合、登録したい名称が例
えば「ＡＮＡホテル」であったとすると、「アナホテ
ル」または「エイエヌエイホテル」で登録しなければな
らないため、ディスプレイに上記名称を表示するような
場合、ユーザーが表示された名称を読み難いとか、ユー
ザーが受ける印象があまり良くないという問題があっ
た。

【０００５】この問題を解消するために、仮名文字にア
ルファベット文字や漢字や記号等の文字を加えた文字で
名称の文字列のテキストを入力可能なように構成するこ
とが考えられる。しかし、このように構成した場合、登
録したテキストの読みがわからないため、登録した名称
のテキストを音声認識可能にするためには、名称のテキ
ストの読みを仮名文字で別途入力しなければならない。
このため、名称を登録する際に必要な手間がかなり面倒
になるという新たな問題が生ずる。

【０００６】そこで、本発明の目的は、登録されている
名称等の文字列のテキストを表示した場合にユーザーの
受ける印象を良くすることができ、しかも、名称を登録
する際に必要な手間を簡単化することができる登録名称
認識装置を提供することにある。

【０００７】

【課題を解決するための手段】請求項１の発明によれ
ば、仮名文字にアルファベット文字や漢字や記号等を加
えた文字で名称等の文字列のテキストを入力する入力手
段を備えたから、登録されている名称等の文字列のテキ
ストを表示した場合に、ユーザーが受ける印象を良くす
ることができる。そして、この構成の場合、入力された
テキストに基づいて仮名文字を並べて構成されたテキス
トの読みを生成する読み生成手段と、生成されたテキス
トの読みを記憶する読み記憶手段とを備えた。これによ
り、テキストの読みを入力する作業を省略できるので、
名称を登録する際に必要な手間が簡単になる。

【０００８】さて、上記構成の場合、読み生成手段によ
り自動的に生成されたテキストの読みが、ユーザーが希
望する読みでない場合がある。これに対して、請求項２
の発明によれば、テキストの読みから音声を合成すると
共に、合成した音声を出力し、この出力した音声がテキ
ストの読みとして適しているか否かをユーザーに問い合
わせ、更に、出力された音声がテキストの読みとして適
していない旨の応答があったときに、異なる読み方のテ
キストの読みを生成するように構成した。これにより、
ユーザーが希望するテキストの読みを登録することがで
きる。

【０００９】更に、読み生成手段により自動的に生成さ
れた複数のテキストの読みがいずれもユーザーが希望す
る読みでない場合がある。これに対して、請求項３の発
明によれば、読み生成手段により生成された複数のテキ
ストの読みがいずれもテキストの読みとして適していな
い旨の応答があったときに、テキストの読みを入力する
読み入力手段を備える構成とした。これにより、ユーザ
ーが希望する読みを確実に登録することができる。

【００１０】

【発明の実施の形態】以下、本発明をＥＭＶ（エレクト
ロマルチビジョン）システムに適用した一実施例につい
て、図面を参照しながら説明する。まず、図２はＥＭＶ
システム１の全体構成を概略的に示すブロック図であ
る。この図２に示すように、ＥＭＶシステム１は、音声
認識装置２、ナビゲーション装置３、ディスプレイ４、
キーボード部５及び電話制御装置６を備えて構成されて
いる。そして、音声認識装置２には、マイク７とＰＴＴ
（Push-To-Talk）スイッチ８とスピーカ９とが接続され
ている。

【００１１】上記ＥＭＶシステム１を構成する各部分に
ついて具体的に説明する。まず、ディスプレイ４は、例
えば液晶ディスプレイ等で構成されており、カラー表示
が可能で地図等を明確に表示できる表示装置である。キ
ーボード部５は、上記ディスプレイ４の画面の上面に設
けられたタッチスイッチ（タッチパネル）と、上記画面
の周辺部に設けられたプッシュスイッチ等から構成され
ている。

【００１２】また、ナビゲーション装置３は、図１に示
すように、入出力処理部１０、変換部１１、記憶部１
２、表示部１３、ナビゲーション処理部１４、位置検出
器１５、地図データ入力器１６及びリモコンセンサ１７
等から構成されている。ここで、位置検出器１５は、地
磁気センサやジャイロスコープや距離センサやＧＰＳ受
信機（いずれも図示しない）等を組み合わせたもの、ま
たは、その一部で構成されており、車両の現在位置を検
出して現在位置検出信号を出力する機能を有している。

【００１３】また、地図データ入力器１６は、地図デー
タやマップマッチングデータ等を入力するための装置で
ある。上記地図データ等のデータは、例えばＣＤ−ＲＯ
Ｍ等からなる記録媒体に記録されている。リモコンセン
サ１７は、ユーザーにより操作されるリモコン（図示し
ない）から送信された送信信号を受信する受信機であ
る。ナビゲーション処理部１４は、ユーザーにより目的
地が設定されたときに、現在位置から目的地までの最適
経路を選択設定する機能や、現在位置を地図上に位置付
けるマップマッチング処理を実行する機能等を有してい
る。

【００１４】更に、入出力処理部１０は、ユーザーによ
りキーボード部５やリモコンが操作されたときに、キー
ボード部５やリモコンセンサ１７から出力される各種の
操作信号を入力する回路である。この場合、例えばナビ
ゲーション処理を指令するコマンドや目的地等を入力す
るモード（画面）において、入出力処理部１０に操作信
号として上記コマンド等が入力された場合、そのコマン
ド等はナビゲーション処理部１４へ与えられるようにな
っている。また、名称等の文字列のテキストを登録する
モードにおいて、入出力処理部１０に操作信号として上
記テキストが入力された場合、そのテキストは変換部１
１及び記憶部１２へ与えれられるようになっている。

【００１５】更にまた、表示部１３は、入出力処理部１
０から与えられた表示データをディスプレイ４に表示す
る機能を有している。例えば、ユーザーがキーボード部
５を操作して名称等の文字列のテキストを入力する際に
は、ディスプレイ４に仮名文字（カタカナ）、アルファ
ベット文字、漢字、記号等が適宜表示されるように構成
されている。これにより、仮名文字にアルファベット文
字や漢字や記号等を加えた文字で名称等の文字列のテキ
ストを入力することができるように構成されている。
尚、漢字を入力する際には、いわゆる仮名漢字変換処理
等を用いることが好ましい。上記構成の場合、キーボー
ド部５、ディスプレイ４、入出力処理部１０及び表示部
１３等から入力手段が構成されている。

【００１６】さて、変換部１１は、入出力処理部１０を
通して与えられた上記テキスト（即ち、仮名文字にアル
ファベット文字や漢字や記号等を加えた文字で構成され
た文字列）に基づいて、仮名文字を並べて構成された上
記テキストの読みを生成する機能を有している。この場
合、変換部１１が読み生成手段を構成している。このテ
キストの読みを生成する機能については、後述する。ま
た、記憶部１２に与えられた上記テキストは、記憶部１
２に記憶されるように構成されている。上記記憶部１２
がテキスト記憶手段を構成している。尚、記憶部１２
は、ＲＡＭや不揮発性メモリ（例えばＥＥＰＲＯＭ）等
のメモリにより構成されている。

【００１７】さて、上記変換部１１により生成されたテ
キストの読みは、ユーザーが希望する読みであるか否か
を確認する処理を行うために、音声認識装置２へ与えら
れるように構成されている。次に、上記音声認識装置２
について、図３及び図４を参照して説明する。

【００１８】図３に示すように、音声認識装置２は、制
御部１８、音声入力部１９、音声認識部２０及び音声合
成部２１から構成されている。ここで、制御部１８は、
音声認識装置２の動作全般を制御する機能を有してお
り、前記ナビゲーション装置３の変換部１１により生成
されたテキストの読みはこの制御部１８に与えられる。
上記制御部１８は、与えられたテキストの読みを音声合
成部２１へ送る。この音声合成部２１は、上記テキスト
の読みから音声を合成し、この合成した音声をスピーカ
９から出力して発声するように構成されている。この場
合、音声合成部２１が音声合成手段を構成し、スピーカ
９が音声出力手段を構成している。

【００１９】そして、スピーカ９から出力された音声、
即ち、テキストの読みが、ユーザーが希望する読みであ
るか否かをユーザが応答する処理は、ユーザーが音声で
応答しても良いし、キーボード部５を操作して応答して
も良いように構成されている。この応答処理について
は、後述する。

【００２０】また、音声入力部１９は、ユーザーが発し
た音声をマイク７を介して入力し、音声データ（例えば
デジタルデータ）を出力するように構成されている。こ
の場合、音声入力部１９は、ユーザーによりＰＴＴスイ
ッチ８が押し下げ操作されている間だけ、ユーザーが発
した音声を入力して音声データを出力するようになって
いる。即ち、ＰＴＴスイッチ８が押し下げ操作されてい
る間だけ、ユーザーが発した音声の音声認識処理が実行
されるように構成されている。

【００２１】上記音声入力部１９から出力された音声デ
ータは、音声認識部２０に与えられるようになってい
る。この音声認識部２０は、与えられた音声データ（入
力した音声）を制御部１８からの指示に従って音声認識
処理を行い、その音声認識結果を制御部１８へ出力する
機能を有している。そして、音声認識部２０は、具体的
には、図４に示すように、照合部２２及び辞書部２３か
ら構成されている。

【００２２】ここで、辞書部２３には、認識対象語彙及
びそのその構造から構成された辞書データが記憶されて
いる。更に、この辞書部２３の辞書データには、ユーザ
ーにより登録された名称等の文字列のテキストの読みが
加えられて記憶されている。この場合、辞書部２３が読
み記憶手段を構成している。

【００２３】また、照合部２２は、音声入力部１９から
与えられた音声データに対して、上記辞書部２３に記憶
されている辞書データを用いて照合（認識）を行うよう
に構成されている。この場合、音声データと辞書データ
内の複数の比較対象パターン候補とを比較して一致度の
高い上位比較対象パターンを、認識結果として制御部１
８へ出力するように構成されている。尚、上記した照合
処理としては、既に知られている照合処理用の制御プロ
グラムを使用すれば良い。

【００２４】更にまた、照合部２２は、上記した照合
（認識）処理に先立って、制御部１８に記憶されている
認識率を向上させるためのデータを参照して、学習処理
を行い、最も入力音声に近い言葉を辞書部２３の辞書デ
ータから選択するように構成されている。尚、認識率を
向上させるためのデータは、例えば過去実行した照合結
果（認識回数等）や外部の状況を示すデータ等であり、
これらデータは制御部１８に記憶されている。

【００２５】次に、上記構成の作用、具体的には、ユー
ザーが名称等の文字列のテキストを登録する場合の動作
について、図５も参照して説明する。図５のフローチャ
ートは、ナビゲーション装置３及び音声認識装置２を動
作させる制御プログラムのうちの上記テキストを登録す
る処理の制御部分の内容を示している。

【００２６】さて、上記テキストを登録する処理が開始
されると、まず図５のステップＳ１において、ユーザー
によりキーボード部５が操作されて名称等の文字列のテ
キストが入力される。この場合、ディスプレイ４には、
名称等の文字列のテキストを登録するための画面が表示
されると共に、ユーザーにより入力されたテキストが表
示されるように構成されている。そして、入力されたテ
キストは、ナビゲーション装置３の入出力処理部１０を
通って、記憶部１２へ送られ、ここに登録（記憶）され
るようになっている。

【００２７】これと共に、上記入力されたテキストは、
ナビゲーション装置３の入出力処理部１０を通って、変
換部１１へ送られ、この変換部１１は、上記テキストの
読みを生成する（ステップＳ２）。ここでは、テキスト
として例えば「ＡＮＡホテル」が入力されたとすると、
このテキストのうちのアルファベット部分について上記
変換部１１によって１文字ずつ読みが作成されるように
構成されている。この場合、変換部１１は、テキスト
「ＡＮＡホテル」の読みとして、例えば「エイエヌエイ
ホテル」という読みを生成するように構成されている。

【００２８】次に、上記生成された読み「エイエヌエイ
ホテル」が上記テキスト「ＡＮＡホテル」の読みとして
適しているか否かをユーザーに問い合わせる処理が実行
される。具体的には、まず、生成された読み「エイエヌ
エイホテル」から音声が合成されると共に、この合成音
声がスピーカ９から発生されるようになっている（ステ
ップＳ３）。この場合、変換部１１にて生成された上記
読み「エイエヌエイホテル」は、音声認識装置２の制御
部１８を通って音声合成部２１へ送られ、ここで音声に
合成され、この合成された音声はスピーカ９から発声さ
れるように構成されている。更に、ここで発声される音
声は、上記読み「エイエヌエイホテル」に、その読みで
良いか否かを問い合わせる音声「デスカ」が加わった音
声となっている。この場合、音声認識装置２の制御部１
８と音声合成部２１とスピーカ９とにより問い合わせ手
段が構成されている。

【００２９】そして、ステップＳ４へ進み、上記読み
「エイエヌエイホテル」がテキスト「ＡＮＡホテル」の
読みとして適しているか否かについて、ユーザーにより
応答されるのを待つ。この場合、ユーザーは、音声で
「ハイ」または「イイエ」と応答するように構成されて
いる。尚、ユーザーがキーボード部５の応答用のキー
（「ハイキー」または「イイエキー」）を操作すること
により、応答するように構成しても良い。

【００３０】上記ステップＳ４において、今、ユーザー
がＰＴＴスイッチ８を操作しながら音声で「ハイ」と応
答したとすると、この音声「ハイ」は、マイク７を介し
て音声認識装置２の音声入力部１９へ入力され、音声認
識部２０により「ハイ」という肯定の言葉として認識さ
れる。そして、この認識結果は、制御部１８へ送られ、
該制御部１８によりユーザーが上記読み「エイエヌエイ
ホテル」を肯定していることが認識される。これによ
り、ステップＳ４にて「ＹＥＳ」へ進み、制御部１８
は、上記読み「エイエヌエイホテル」を上記テキスト
「ＡＮＡホテル」の読みとして辞書部２３の辞書データ
に登録（記憶）するように構成されている（ステップＳ
５）。

【００３１】一方、上記ステップＳ４において、ユーザ
ーがＰＴＴスイッチ８を操作しながら音声で「イイエ」
と応答したとすると、この音声「イイエ」は、マイク７
を介して音声認識装置２の音声入力部１９へ入力され、
音声認識部２０により「イイエ」という否定の言葉とし
て認識される。そして、この認識結果は、制御部１８へ
送られ、該制御部１８によりユーザーが上記読み「エイ
エヌエイホテル」を否定していることが認識される。こ
れにより、制御部１８は、上記読み「エイエヌエイホテ
ル」を上記テキスト「ＡＮＡホテル」の読みとして辞書
部２３の辞書データに登録しないように構成されてい
る。

【００３２】続いて、上記ユーザーの否定の意思は、制
御部１８からナビゲーション装置３の変換部１１へ送ら
れる。すると、上記ステップＳ４にて「ＮＯ」へ進み、
上記変換部１１は、上記テキスト「ＡＮＡホテル」の読
みとして、「エイエヌエイホテル」とは異なる読みを生
成する。具体的には、変換部１１は、上記テキストのう
ちのアルファベット部分について例えばローマ字読みす
ることによって読みを作成するように構成されている。
この場合、変換部１１は、テキスト「ＡＮＡホテル」の
異なる読みとして、「アナホテル」という読みを生成す
る（ステップＳ６）。

【００３３】そして、上記生成された読み「アナホテ
ル」が上記テキスト「ＡＮＡホテル」の読みとして適し
ているか否かをユーザーに問い合わせる処理が実行され
る。具体的には、ステップＳ７へ進み、上記生成された
読み「アナホテル」から音声が合成されると共に、この
合成音声がスピーカ９から発生される。尚、ここで発声
される音声には、上記読み「アナホテル」に、その読み
で良いか否かを問い合わせる音声「デスカ」が加わった
音声となっている。続いて、ステップＳ８へ進み、上記
読み「アナホテル」がテキスト「ＡＮＡホテル」の読み
として適しているか否かについて、ユーザーが応答する
のを待つ。

【００３４】ここで、今、ユーザーがＰＴＴスイッチ８
を操作しながら音声で「ハイ」と応答したとすると、こ
の音声「ハイ」は、マイク７を介して音声認識装置２の
音声入力部１９へ入力され、音声認識部２０により「ハ
イ」という肯定の言葉として認識される。そして、この
認識結果は、制御部１８へ送られ、該制御部１８により
ユーザーが上記読み「アナホテル」を肯定していること
が認識される。これにより、ステップＳ８にて「ＹＥ
Ｓ」へ進み、制御部１８は、上記読み「アナホテル」を
上記テキスト「ＡＮＡホテル」の読みとして辞書部２３
の辞書データに登録（記憶）するように構成されている
（ステップＳ５）。尚、上記「ＹＥＳ」の場合、ナビゲ
ーション装置３にも上記ユーザーの肯定が通知されて登
録を完了するようになっている。

【００３５】また、上記ステップＳ８において、ユーザ
ーがＰＴＴスイッチ８を操作しながら音声で「イイエ」
と応答したとすると、この音声「イイエ」は、マイク７
を介して音声認識装置２の音声入力部１９へ入力され、
音声認識部２０により「イイエ」という否定の言葉とし
て認識される。そして、この認識結果は、制御部１８へ
送られ、該制御部１８によりユーザーが上記読み「アナ
ホテル」を否定していることが認識される。これによ
り、制御部１８は、上記読み「アナホテル」を上記テキ
スト「ＡＮＡホテル」の読みとして辞書部２３の辞書デ
ータに登録しないように構成されている。

【００３６】続いて、上記ユーザーの否定の意思は、制
御部１８からナビゲーション装置３の変換部１１へ送ら
れる。すると、上記ステップＳ８にて「ＮＯ」へ進み、
上記変換部１１は、テキスト「ＡＮＡホテル」の読みを
生成する処理を止めて、その旨を入出力制御部１０へ送
る。これにより、入出力制御部１０は、表示部１３を介
してディスプレイ４に「読みを入力させる画面」を表示
すると共に、ユーザーが例えばキーボード部５を操作し
て読みを入力するのを待つように構成されている（ステ
ップＳ９）。尚、ユーザーによる読みの入力方法とし
て、上記キーボード部５に代えて、音声で入力するよう
に構成することも好ましい構成である。

【００３７】ここで、ユーザーにより読みが入力される
と、その入力された読みは、入出力制御部１０から変換
部１１を通り、音声認識装置２の制御部１８へ送られ
る。そして、制御部１８は、上記入力された読みを辞書
部２３の辞書データ内に登録するように構成されている
（ステップＳ５）。

【００３８】そして、ユーザーが名称等のテキストの登
録処理を更に続けるときには、ステップＳ１０にて「Ｙ
ＥＳ」へ進み、ステップＳ１へ戻って上述した処理を繰
り返すように構成されている。一方、ユーザーが名称等
のテキストの登録処理を終えるとき（終了操作を行なっ
たとき）には、ステップＳ１０にて「ＮＯ」へ進み、登
録処理を終了する。

【００３９】尚、上述したテキストの登録処理において
は、仮名文字にアルファベット文字が混じったテキスト
について説明したが、漢字や記号等が混じったテキスト
についても、ほぼ同様な登録制御を実行することができ
る。このような漢字や記号等が混じったテキストの場合
には、変換部１１によって、入力されたテキストのうち
の漢字や記号部分について、アルゴリズムで適当な読み
を生成するように構成すれば良い。上記アルゴリズムと
しては、例えば漢字や記号とその読みとを対応させた読
みの辞書を用意し、この辞書を参照して読みを生成する
ようなアルゴリズムを用いることが好ましい。

【００４０】また、上記実施例のＥＭＶシステム１に
は、電話制御装置６が備わっている。このため、ＥＭＶ
システム１は、電話番号のリストを登録することが可能
に構成されている。この電話番号のリストを登録する処
理は、上述した名称等のテキストを登録する処理とほぼ
同じ処理である。

【００４１】具体的には、ユーザーにより、電話番号と
人名と住所等のテキストをキーボード部５を操作するこ
とにより入力させ、入力したテキストをナビゲーション
装置３の記憶部１２に登録する。このとき、人名と住所
等については、仮名文字にアルファベット文字や漢字や
記号等を加えた文字で入力できるように構成する。そし
て、電話番号と人名と住所等の各テキストの読みを変換
部１１により自動的に生成し、この生成した読みをユー
ザーが希望する読みであるか否かを確認し、希望する読
みであるときに、上記生成した読みを音声認識装置２の
辞書部２３に登録するように構成されている。

【００４２】尚、希望する読みでないときは、上記生成
した読みと異なる読みを変換部１１により新たに生成
し、この生成した読みをユーザーが希望する読みである
か否かを再度確認し、希望する読みであるときに、上記
新たに生成した読みを音声認識装置２の辞書部２３に登
録するように構成されている。また、生成した２つの読
みがいずれも希望する読みでないときは、ユーザーが希
望する読みをユーザーにより入力させ、この入力された
読みを音声認識装置２の辞書部２３に登録するように構
成されている。以下、ユーザーが希望する件数の電話番
号のリストが登録されるまで、上述した登録処理が繰り
返されるように構成されている。

【００４３】そして、上記実施例においては、電話を使
用する場合、ユーザーが例えば相手先の人名を音声で指
定すると、その人名の音声が音声認識装置２により認識
されると共に、この認識された人名に対応する電話番号
がナビゲーション装置３の記憶部１２内の電話番号のリ
ストから検索され、更に、この検索された電話番号で電
話制御装置６が駆動制御されてダイヤル動作が自動的に
実行されるように構成されている。

【００４４】このような構成の本実施例によれば、仮名
文字にアルファベット文字や漢字や記号等を加えた文字
で名称等の文字列のテキストを入力して登録できるよう
に構成したので、登録されている名称等の文字列のテキ
ストをディスプレイ４に表示したような場合に、ユーザ
がそのテキストを読み易くなると共に、ユーザーが受け
る印象を向上させることができる。そして、上記実施例
の場合、入力されたテキストに基づいて仮名文字を並べ
て構成されたテキストの読みを自動的に生成すると共
に、この生成されたテキストの読みを音声認識装置２の
辞書部２３に記憶するように構成した。これにより、ユ
ーザーはテキストの読みを入力する作業を省略できるの
で、名称を登録する際に必要な作業が簡単になる。

【００４５】また、上記実施例では、自動的に生成され
たテキストの読みから音声を合成すると共に、この合成
した音声をスピーカ９から出力し、この出力した音声が
テキストの読みとして適しているか否かをユーザーに問
い合わせ、更に、出力された音声がテキストの読みとし
て適していない旨の応答があったときに、異なる読み方
のテキストの読みを自動的に生成するように構成した。
これにより、自動的に生成されたテキストの読みが、ユ
ーザーが希望する読みでない場合には、異なる読みをユ
ーザーが希望する読みとして登録することができ、使い
勝手がより一層良くなる。

【００４６】更に、上記実施例では、自動的に生成され
た２つのテキストの読みがいずれもユーザーが希望する
読みでない場合、即ち、自動的に生成された２つのテキ
ストの読みがいずれもテキストの読みとして適していな
い旨の応答があったときに、ユーザーによりテキストの
読みを入力可能に構成した。これにより、ユーザーが希
望する読みを確実に登録することができる。

【００４７】尚、上記実施例では、ユーザーが名称等の
文字列のテキストを入力する際、キーボード部５を操作
して入力するように構成したが、これに限られるもので
はなく、音声で入力するように構成しても良いし、ま
た、音声とキーボード部を併用して入力するように構成
しても良い。更に、ナビゲーション装置３を動作させる
ためのコマンドや目的地等を入力する場合、キーボード
部５を操作したり、音声で入力したり、音声とキーボー
ド部を併用したりするように構成することが好ましい。

【００４８】また、上記実施例では、テキストの読みを
自動的に生成する場合に、ユーザーが希望するものでな
いとき、２個の読みを生成するように構成したが、３個
以上の読みを生成するように構成しても良い。更に、上
記実施例では、音声認識装置２とナビゲーション装置３
を別体の装置として構成したが、これに代えて、音声認
識装置とナビゲーション装置を一体の装置として構成し
ても良い。更にまた、上記実施例のＥＭＶシステム１に
カーエアコンやカーオーディオ機器等を制御する機能を
持たせ、カーエアコンやカーオーディオ機器や他の車載
機器の操作指令等を音声で入力可能なように構成しても
良い。

【００４９】尚、上記実施例では、本発明の登録名称認
識装置をＥＭＶシステム１に適用したが、これに限られ
るものではなく、例えば携帯型ナビゲーション装置や屋
内用空調装置、屋内用電話、携帯電話等に適用しても良
い。

【図面の簡単な説明】

【図１】ナビゲーション装置のブロック図

【図２】本発明の一実施例を示すＥＭＶシステムのブロ
ック図

【図３】音声認識装置のブロック図

【図４】音声認識部のブロック図

【図５】フローチャート

【符号の説明】

１はＥＭＶシステム、２は音声認識装置、３はナビゲー
ション装置、４はディスプレイ、５はキーボード部、６
は電話制御装置、７はマイク、８はＰＴＴスイッチ、９
はスピーカ、１０は入出力処理部、１１は変換部（読み
生成手段）、１２は記憶部（テキスト記憶手段）、１３
は表示部、１４はナビゲーション処理部、１５は位置検
出器、１６は地図データ入力部、１７はリモコンセン
サ、１８は制御部、１９は音声入力部、２０は音声認識
部、２１は音声合成部、２２は照合部、２３は辞書部
（読み記憶手段）を示す。

フロントページの続き (51)Int.Cl.⁶ 識別記号ＦＩＧ１０Ｌ 5/02 Ｇ１０Ｌ 5/02 Ｊ // Ｇ０６Ｆ 3/16 ３３０Ｇ０６Ｆ 3/16 ３３０Ａ

Claims

【特許請求の範囲】

【請求項１】仮名文字にアルファベット文字や漢字や
記号等を加えた文字で名称等の文字列のテキストを入力
する入力手段と、入力された前記テキストを記憶するテキスト記憶手段
と、入力された前記テキストに基づいて仮名文字を並べて構
成された前記テキストの読みを生成する読み生成手段
と、生成された前記テキストの読みを記憶する読み記憶手段
とを備えてなる登録名称認識装置。
【請求項２】前記テキストの読みから音声を合成する
音声合成手段と、合成された音声を出力する音声出力手段と、出力された音声が前記テキストの読みとして適している
か否かを問い合わせる問い合わせ手段と、出力された音声が前記テキストの読みとして適している
旨または適していない旨の応答を行う応答手段とを備
え、前記読み生成手段は、出力された音声が前記テキストの
読みとして適していない旨の応答があったときに、異な
る読み方の前記テキストの読みを生成するように構成さ
れていることを特徴とする請求項１記載の登録名称認識
装置。
【請求項３】前記読み生成手段により生成された複数
の前記テキストの読みがいずれも前記テキストの読みと
して適していない旨の応答があったときに、前記テキス
トの読みを入力する読み入力手段を備えたことを特徴と
する請求項２記載の登録名称認識装置。