JPH11231886A - 登録名称認識装置 - Google Patents

登録名称認識装置

Info

Publication number
JPH11231886A
JPH11231886A JP10035816A JP3581698A JPH11231886A JP H11231886 A JPH11231886 A JP H11231886A JP 10035816 A JP10035816 A JP 10035816A JP 3581698 A JP3581698 A JP 3581698A JP H11231886 A JPH11231886 A JP H11231886A
Authority
JP
Japan
Prior art keywords
reading
text
unit
voice
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10035816A
Other languages
English (en)
Inventor
Eiji Sofue
栄二 祖父江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP10035816A priority Critical patent/JPH11231886A/ja
Publication of JPH11231886A publication Critical patent/JPH11231886A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Instructional Devices (AREA)

Abstract

(57)【要約】 【課題】 登録されている名称等の文字列のテキストを
表示した場合にユーザーの受ける印象を良くし、また、
名称を登録する際の手間を簡単にする。 【解決手段】 本発明の登録名称認識装置は、仮名文字
にアルファベット文字や漢字や記号等を加えた文字で名
称等の文字列のテキストを入力する入力手段を備え、入
力された前記テキストを記憶するテキスト記憶手段12
を備え、入力された前記テキストに基づいて仮名文字を
並べて構成された前記テキストの読みを生成する読み生
成手段11を備え、生成された前記テキストの読みを記
憶する読み記憶手段を備えて構成されている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えばカーナビゲ
ーション装置に目的地等の名称をユーザーが登録する際
に使用するための装置であって、登録した名称を音声で
認識可能にするための装置である登録名称認識装置に関
する。
【0002】
【従来の技術】例えば自動車のEMV(エレクトロマル
チビジョン)システムには、ディスプレイ、キーボー
ド、カーナビゲーション装置、音声認識装置等が組み込
まれている。このようなEMVシステムにおいては、目
的地や施設名等の名称を多数登録することが可能に構成
されていると共に、登録されている多数の名称のうちの
所望の1つをユーザーが音声で選択することが可能に構
成されている。この場合、EMVシステムの音声認識装
置は、ユーザーが発生した音声(名称の音声)を入力す
ると共に、この入力した音声と、登録されている名称と
を比較(照合)し、一致度合いが最も高いものを認識結
果として出力(選択)するように構成されている。
【0003】ここで、名称を登録する方法として、音声
パターンで登録する方法と、文字列のテキストで登録す
る方法がある。このうち、音声パターンで登録する方法
は、音声パターンのデータ量が非常に多いため大容量の
記憶装置が必要であると共に、登録されている名称を確
認するには、すべての名称を音声で再生して出力させる
必要があり、確認がかなり面倒である。これに対して、
テキストで登録する方法は、テキストのデータ量が少な
いため小容量の記憶装置で十分であると共に、登録され
ている名称を確認するにはすべての名称をディスプレイ
に表示してやるだけで済むから、確認が簡単である。こ
のため、一般的に、テキストで登録する方法が採用され
ている。
【0004】
【発明が解決しようとする課題】名称をテキストで登録
する場合、従来においては、キーボードを使用して仮名
文字(カタカナ)でテキストを入力するようにしてい
た。しかし、上記従来構成の場合、登録したい名称が例
えば「ANAホテル」であったとすると、「アナホテ
ル」または「エイエヌエイホテル」で登録しなければな
らないため、ディスプレイに上記名称を表示するような
場合、ユーザーが表示された名称を読み難いとか、ユー
ザーが受ける印象があまり良くないという問題があっ
た。
【0005】この問題を解消するために、仮名文字にア
ルファベット文字や漢字や記号等の文字を加えた文字で
名称の文字列のテキストを入力可能なように構成するこ
とが考えられる。しかし、このように構成した場合、登
録したテキストの読みがわからないため、登録した名称
のテキストを音声認識可能にするためには、名称のテキ
ストの読みを仮名文字で別途入力しなければならない。
このため、名称を登録する際に必要な手間がかなり面倒
になるという新たな問題が生ずる。
【0006】そこで、本発明の目的は、登録されている
名称等の文字列のテキストを表示した場合にユーザーの
受ける印象を良くすることができ、しかも、名称を登録
する際に必要な手間を簡単化することができる登録名称
認識装置を提供することにある。
【0007】
【課題を解決するための手段】請求項1の発明によれ
ば、仮名文字にアルファベット文字や漢字や記号等を加
えた文字で名称等の文字列のテキストを入力する入力手
段を備えたから、登録されている名称等の文字列のテキ
ストを表示した場合に、ユーザーが受ける印象を良くす
ることができる。そして、この構成の場合、入力された
テキストに基づいて仮名文字を並べて構成されたテキス
トの読みを生成する読み生成手段と、生成されたテキス
トの読みを記憶する読み記憶手段とを備えた。これによ
り、テキストの読みを入力する作業を省略できるので、
名称を登録する際に必要な手間が簡単になる。
【0008】さて、上記構成の場合、読み生成手段によ
り自動的に生成されたテキストの読みが、ユーザーが希
望する読みでない場合がある。これに対して、請求項2
の発明によれば、テキストの読みから音声を合成すると
共に、合成した音声を出力し、この出力した音声がテキ
ストの読みとして適しているか否かをユーザーに問い合
わせ、更に、出力された音声がテキストの読みとして適
していない旨の応答があったときに、異なる読み方のテ
キストの読みを生成するように構成した。これにより、
ユーザーが希望するテキストの読みを登録することがで
きる。
【0009】更に、読み生成手段により自動的に生成さ
れた複数のテキストの読みがいずれもユーザーが希望す
る読みでない場合がある。これに対して、請求項3の発
明によれば、読み生成手段により生成された複数のテキ
ストの読みがいずれもテキストの読みとして適していな
い旨の応答があったときに、テキストの読みを入力する
読み入力手段を備える構成とした。これにより、ユーザ
ーが希望する読みを確実に登録することができる。
【0010】
【発明の実施の形態】以下、本発明をEMV(エレクト
ロマルチビジョン)システムに適用した一実施例につい
て、図面を参照しながら説明する。まず、図2はEMV
システム1の全体構成を概略的に示すブロック図であ
る。この図2に示すように、EMVシステム1は、音声
認識装置2、ナビゲーション装置3、ディスプレイ4、
キーボード部5及び電話制御装置6を備えて構成されて
いる。そして、音声認識装置2には、マイク7とPTT
(Push-To-Talk)スイッチ8とスピーカ9とが接続され
ている。
【0011】上記EMVシステム1を構成する各部分に
ついて具体的に説明する。まず、ディスプレイ4は、例
えば液晶ディスプレイ等で構成されており、カラー表示
が可能で地図等を明確に表示できる表示装置である。キ
ーボード部5は、上記ディスプレイ4の画面の上面に設
けられたタッチスイッチ(タッチパネル)と、上記画面
の周辺部に設けられたプッシュスイッチ等から構成され
ている。
【0012】また、ナビゲーション装置3は、図1に示
すように、入出力処理部10、変換部11、記憶部1
2、表示部13、ナビゲーション処理部14、位置検出
器15、地図データ入力器16及びリモコンセンサ17
等から構成されている。ここで、位置検出器15は、地
磁気センサやジャイロスコープや距離センサやGPS受
信機(いずれも図示しない)等を組み合わせたもの、ま
たは、その一部で構成されており、車両の現在位置を検
出して現在位置検出信号を出力する機能を有している。
【0013】また、地図データ入力器16は、地図デー
タやマップマッチングデータ等を入力するための装置で
ある。上記地図データ等のデータは、例えばCD−RO
M等からなる記録媒体に記録されている。リモコンセン
サ17は、ユーザーにより操作されるリモコン(図示し
ない)から送信された送信信号を受信する受信機であ
る。ナビゲーション処理部14は、ユーザーにより目的
地が設定されたときに、現在位置から目的地までの最適
経路を選択設定する機能や、現在位置を地図上に位置付
けるマップマッチング処理を実行する機能等を有してい
る。
【0014】更に、入出力処理部10は、ユーザーによ
りキーボード部5やリモコンが操作されたときに、キー
ボード部5やリモコンセンサ17から出力される各種の
操作信号を入力する回路である。この場合、例えばナビ
ゲーション処理を指令するコマンドや目的地等を入力す
るモード(画面)において、入出力処理部10に操作信
号として上記コマンド等が入力された場合、そのコマン
ド等はナビゲーション処理部14へ与えられるようにな
っている。また、名称等の文字列のテキストを登録する
モードにおいて、入出力処理部10に操作信号として上
記テキストが入力された場合、そのテキストは変換部1
1及び記憶部12へ与えれられるようになっている。
【0015】更にまた、表示部13は、入出力処理部1
0から与えられた表示データをディスプレイ4に表示す
る機能を有している。例えば、ユーザーがキーボード部
5を操作して名称等の文字列のテキストを入力する際に
は、ディスプレイ4に仮名文字(カタカナ)、アルファ
ベット文字、漢字、記号等が適宜表示されるように構成
されている。これにより、仮名文字にアルファベット文
字や漢字や記号等を加えた文字で名称等の文字列のテキ
ストを入力することができるように構成されている。
尚、漢字を入力する際には、いわゆる仮名漢字変換処理
等を用いることが好ましい。上記構成の場合、キーボー
ド部5、ディスプレイ4、入出力処理部10及び表示部
13等から入力手段が構成されている。
【0016】さて、変換部11は、入出力処理部10を
通して与えられた上記テキスト(即ち、仮名文字にアル
ファベット文字や漢字や記号等を加えた文字で構成され
た文字列)に基づいて、仮名文字を並べて構成された上
記テキストの読みを生成する機能を有している。この場
合、変換部11が読み生成手段を構成している。このテ
キストの読みを生成する機能については、後述する。ま
た、記憶部12に与えられた上記テキストは、記憶部1
2に記憶されるように構成されている。上記記憶部12
がテキスト記憶手段を構成している。尚、記憶部12
は、RAMや不揮発性メモリ(例えばEEPROM)等
のメモリにより構成されている。
【0017】さて、上記変換部11により生成されたテ
キストの読みは、ユーザーが希望する読みであるか否か
を確認する処理を行うために、音声認識装置2へ与えら
れるように構成されている。次に、上記音声認識装置2
について、図3及び図4を参照して説明する。
【0018】図3に示すように、音声認識装置2は、制
御部18、音声入力部19、音声認識部20及び音声合
成部21から構成されている。ここで、制御部18は、
音声認識装置2の動作全般を制御する機能を有してお
り、前記ナビゲーション装置3の変換部11により生成
されたテキストの読みはこの制御部18に与えられる。
上記制御部18は、与えられたテキストの読みを音声合
成部21へ送る。この音声合成部21は、上記テキスト
の読みから音声を合成し、この合成した音声をスピーカ
9から出力して発声するように構成されている。この場
合、音声合成部21が音声合成手段を構成し、スピーカ
9が音声出力手段を構成している。
【0019】そして、スピーカ9から出力された音声、
即ち、テキストの読みが、ユーザーが希望する読みであ
るか否かをユーザが応答する処理は、ユーザーが音声で
応答しても良いし、キーボード部5を操作して応答して
も良いように構成されている。この応答処理について
は、後述する。
【0020】また、音声入力部19は、ユーザーが発し
た音声をマイク7を介して入力し、音声データ(例えば
デジタルデータ)を出力するように構成されている。こ
の場合、音声入力部19は、ユーザーによりPTTスイ
ッチ8が押し下げ操作されている間だけ、ユーザーが発
した音声を入力して音声データを出力するようになって
いる。即ち、PTTスイッチ8が押し下げ操作されてい
る間だけ、ユーザーが発した音声の音声認識処理が実行
されるように構成されている。
【0021】上記音声入力部19から出力された音声デ
ータは、音声認識部20に与えられるようになってい
る。この音声認識部20は、与えられた音声データ(入
力した音声)を制御部18からの指示に従って音声認識
処理を行い、その音声認識結果を制御部18へ出力する
機能を有している。そして、音声認識部20は、具体的
には、図4に示すように、照合部22及び辞書部23か
ら構成されている。
【0022】ここで、辞書部23には、認識対象語彙及
びそのその構造から構成された辞書データが記憶されて
いる。更に、この辞書部23の辞書データには、ユーザ
ーにより登録された名称等の文字列のテキストの読みが
加えられて記憶されている。この場合、辞書部23が読
み記憶手段を構成している。
【0023】また、照合部22は、音声入力部19から
与えられた音声データに対して、上記辞書部23に記憶
されている辞書データを用いて照合(認識)を行うよう
に構成されている。この場合、音声データと辞書データ
内の複数の比較対象パターン候補とを比較して一致度の
高い上位比較対象パターンを、認識結果として制御部1
8へ出力するように構成されている。尚、上記した照合
処理としては、既に知られている照合処理用の制御プロ
グラムを使用すれば良い。
【0024】更にまた、照合部22は、上記した照合
(認識)処理に先立って、制御部18に記憶されている
認識率を向上させるためのデータを参照して、学習処理
を行い、最も入力音声に近い言葉を辞書部23の辞書デ
ータから選択するように構成されている。尚、認識率を
向上させるためのデータは、例えば過去実行した照合結
果(認識回数等)や外部の状況を示すデータ等であり、
これらデータは制御部18に記憶されている。
【0025】次に、上記構成の作用、具体的には、ユー
ザーが名称等の文字列のテキストを登録する場合の動作
について、図5も参照して説明する。図5のフローチャ
ートは、ナビゲーション装置3及び音声認識装置2を動
作させる制御プログラムのうちの上記テキストを登録す
る処理の制御部分の内容を示している。
【0026】さて、上記テキストを登録する処理が開始
されると、まず図5のステップS1において、ユーザー
によりキーボード部5が操作されて名称等の文字列のテ
キストが入力される。この場合、ディスプレイ4には、
名称等の文字列のテキストを登録するための画面が表示
されると共に、ユーザーにより入力されたテキストが表
示されるように構成されている。そして、入力されたテ
キストは、ナビゲーション装置3の入出力処理部10を
通って、記憶部12へ送られ、ここに登録(記憶)され
るようになっている。
【0027】これと共に、上記入力されたテキストは、
ナビゲーション装置3の入出力処理部10を通って、変
換部11へ送られ、この変換部11は、上記テキストの
読みを生成する(ステップS2)。ここでは、テキスト
として例えば「ANAホテル」が入力されたとすると、
このテキストのうちのアルファベット部分について上記
変換部11によって1文字ずつ読みが作成されるように
構成されている。この場合、変換部11は、テキスト
「ANAホテル」の読みとして、例えば「エイエヌエイ
ホテル」という読みを生成するように構成されている。
【0028】次に、上記生成された読み「エイエヌエイ
ホテル」が上記テキスト「ANAホテル」の読みとして
適しているか否かをユーザーに問い合わせる処理が実行
される。具体的には、まず、生成された読み「エイエヌ
エイホテル」から音声が合成されると共に、この合成音
声がスピーカ9から発生されるようになっている(ステ
ップS3)。この場合、変換部11にて生成された上記
読み「エイエヌエイホテル」は、音声認識装置2の制御
部18を通って音声合成部21へ送られ、ここで音声に
合成され、この合成された音声はスピーカ9から発声さ
れるように構成されている。更に、ここで発声される音
声は、上記読み「エイエヌエイホテル」に、その読みで
良いか否かを問い合わせる音声「デスカ」が加わった音
声となっている。この場合、音声認識装置2の制御部1
8と音声合成部21とスピーカ9とにより問い合わせ手
段が構成されている。
【0029】そして、ステップS4へ進み、上記読み
「エイエヌエイホテル」がテキスト「ANAホテル」の
読みとして適しているか否かについて、ユーザーにより
応答されるのを待つ。この場合、ユーザーは、音声で
「ハイ」または「イイエ」と応答するように構成されて
いる。尚、ユーザーがキーボード部5の応答用のキー
(「ハイキー」または「イイエキー」)を操作すること
により、応答するように構成しても良い。
【0030】上記ステップS4において、今、ユーザー
がPTTスイッチ8を操作しながら音声で「ハイ」と応
答したとすると、この音声「ハイ」は、マイク7を介し
て音声認識装置2の音声入力部19へ入力され、音声認
識部20により「ハイ」という肯定の言葉として認識さ
れる。そして、この認識結果は、制御部18へ送られ、
該制御部18によりユーザーが上記読み「エイエヌエイ
ホテル」を肯定していることが認識される。これによ
り、ステップS4にて「YES」へ進み、制御部18
は、上記読み「エイエヌエイホテル」を上記テキスト
「ANAホテル」の読みとして辞書部23の辞書データ
に登録(記憶)するように構成されている(ステップS
5)。
【0031】一方、上記ステップS4において、ユーザ
ーがPTTスイッチ8を操作しながら音声で「イイエ」
と応答したとすると、この音声「イイエ」は、マイク7
を介して音声認識装置2の音声入力部19へ入力され、
音声認識部20により「イイエ」という否定の言葉とし
て認識される。そして、この認識結果は、制御部18へ
送られ、該制御部18によりユーザーが上記読み「エイ
エヌエイホテル」を否定していることが認識される。こ
れにより、制御部18は、上記読み「エイエヌエイホテ
ル」を上記テキスト「ANAホテル」の読みとして辞書
部23の辞書データに登録しないように構成されてい
る。
【0032】続いて、上記ユーザーの否定の意思は、制
御部18からナビゲーション装置3の変換部11へ送ら
れる。すると、上記ステップS4にて「NO」へ進み、
上記変換部11は、上記テキスト「ANAホテル」の読
みとして、「エイエヌエイホテル」とは異なる読みを生
成する。具体的には、変換部11は、上記テキストのう
ちのアルファベット部分について例えばローマ字読みす
ることによって読みを作成するように構成されている。
この場合、変換部11は、テキスト「ANAホテル」の
異なる読みとして、「アナホテル」という読みを生成す
る(ステップS6)。
【0033】そして、上記生成された読み「アナホテ
ル」が上記テキスト「ANAホテル」の読みとして適し
ているか否かをユーザーに問い合わせる処理が実行され
る。具体的には、ステップS7へ進み、上記生成された
読み「アナホテル」から音声が合成されると共に、この
合成音声がスピーカ9から発生される。尚、ここで発声
される音声には、上記読み「アナホテル」に、その読み
で良いか否かを問い合わせる音声「デスカ」が加わった
音声となっている。続いて、ステップS8へ進み、上記
読み「アナホテル」がテキスト「ANAホテル」の読み
として適しているか否かについて、ユーザーが応答する
のを待つ。
【0034】ここで、今、ユーザーがPTTスイッチ8
を操作しながら音声で「ハイ」と応答したとすると、こ
の音声「ハイ」は、マイク7を介して音声認識装置2の
音声入力部19へ入力され、音声認識部20により「ハ
イ」という肯定の言葉として認識される。そして、この
認識結果は、制御部18へ送られ、該制御部18により
ユーザーが上記読み「アナホテル」を肯定していること
が認識される。これにより、ステップS8にて「YE
S」へ進み、制御部18は、上記読み「アナホテル」を
上記テキスト「ANAホテル」の読みとして辞書部23
の辞書データに登録(記憶)するように構成されている
(ステップS5)。尚、上記「YES」の場合、ナビゲ
ーション装置3にも上記ユーザーの肯定が通知されて登
録を完了するようになっている。
【0035】また、上記ステップS8において、ユーザ
ーがPTTスイッチ8を操作しながら音声で「イイエ」
と応答したとすると、この音声「イイエ」は、マイク7
を介して音声認識装置2の音声入力部19へ入力され、
音声認識部20により「イイエ」という否定の言葉とし
て認識される。そして、この認識結果は、制御部18へ
送られ、該制御部18によりユーザーが上記読み「アナ
ホテル」を否定していることが認識される。これによ
り、制御部18は、上記読み「アナホテル」を上記テキ
スト「ANAホテル」の読みとして辞書部23の辞書デ
ータに登録しないように構成されている。
【0036】続いて、上記ユーザーの否定の意思は、制
御部18からナビゲーション装置3の変換部11へ送ら
れる。すると、上記ステップS8にて「NO」へ進み、
上記変換部11は、テキスト「ANAホテル」の読みを
生成する処理を止めて、その旨を入出力制御部10へ送
る。これにより、入出力制御部10は、表示部13を介
してディスプレイ4に「読みを入力させる画面」を表示
すると共に、ユーザーが例えばキーボード部5を操作し
て読みを入力するのを待つように構成されている(ステ
ップS9)。尚、ユーザーによる読みの入力方法とし
て、上記キーボード部5に代えて、音声で入力するよう
に構成することも好ましい構成である。
【0037】ここで、ユーザーにより読みが入力される
と、その入力された読みは、入出力制御部10から変換
部11を通り、音声認識装置2の制御部18へ送られ
る。そして、制御部18は、上記入力された読みを辞書
部23の辞書データ内に登録するように構成されている
(ステップS5)。
【0038】そして、ユーザーが名称等のテキストの登
録処理を更に続けるときには、ステップS10にて「Y
ES」へ進み、ステップS1へ戻って上述した処理を繰
り返すように構成されている。一方、ユーザーが名称等
のテキストの登録処理を終えるとき(終了操作を行なっ
たとき)には、ステップS10にて「NO」へ進み、登
録処理を終了する。
【0039】尚、上述したテキストの登録処理において
は、仮名文字にアルファベット文字が混じったテキスト
について説明したが、漢字や記号等が混じったテキスト
についても、ほぼ同様な登録制御を実行することができ
る。このような漢字や記号等が混じったテキストの場合
には、変換部11によって、入力されたテキストのうち
の漢字や記号部分について、アルゴリズムで適当な読み
を生成するように構成すれば良い。上記アルゴリズムと
しては、例えば漢字や記号とその読みとを対応させた読
みの辞書を用意し、この辞書を参照して読みを生成する
ようなアルゴリズムを用いることが好ましい。
【0040】また、上記実施例のEMVシステム1に
は、電話制御装置6が備わっている。このため、EMV
システム1は、電話番号のリストを登録することが可能
に構成されている。この電話番号のリストを登録する処
理は、上述した名称等のテキストを登録する処理とほぼ
同じ処理である。
【0041】具体的には、ユーザーにより、電話番号と
人名と住所等のテキストをキーボード部5を操作するこ
とにより入力させ、入力したテキストをナビゲーション
装置3の記憶部12に登録する。このとき、人名と住所
等については、仮名文字にアルファベット文字や漢字や
記号等を加えた文字で入力できるように構成する。そし
て、電話番号と人名と住所等の各テキストの読みを変換
部11により自動的に生成し、この生成した読みをユー
ザーが希望する読みであるか否かを確認し、希望する読
みであるときに、上記生成した読みを音声認識装置2の
辞書部23に登録するように構成されている。
【0042】尚、希望する読みでないときは、上記生成
した読みと異なる読みを変換部11により新たに生成
し、この生成した読みをユーザーが希望する読みである
か否かを再度確認し、希望する読みであるときに、上記
新たに生成した読みを音声認識装置2の辞書部23に登
録するように構成されている。また、生成した2つの読
みがいずれも希望する読みでないときは、ユーザーが希
望する読みをユーザーにより入力させ、この入力された
読みを音声認識装置2の辞書部23に登録するように構
成されている。以下、ユーザーが希望する件数の電話番
号のリストが登録されるまで、上述した登録処理が繰り
返されるように構成されている。
【0043】そして、上記実施例においては、電話を使
用する場合、ユーザーが例えば相手先の人名を音声で指
定すると、その人名の音声が音声認識装置2により認識
されると共に、この認識された人名に対応する電話番号
がナビゲーション装置3の記憶部12内の電話番号のリ
ストから検索され、更に、この検索された電話番号で電
話制御装置6が駆動制御されてダイヤル動作が自動的に
実行されるように構成されている。
【0044】このような構成の本実施例によれば、仮名
文字にアルファベット文字や漢字や記号等を加えた文字
で名称等の文字列のテキストを入力して登録できるよう
に構成したので、登録されている名称等の文字列のテキ
ストをディスプレイ4に表示したような場合に、ユーザ
がそのテキストを読み易くなると共に、ユーザーが受け
る印象を向上させることができる。そして、上記実施例
の場合、入力されたテキストに基づいて仮名文字を並べ
て構成されたテキストの読みを自動的に生成すると共
に、この生成されたテキストの読みを音声認識装置2の
辞書部23に記憶するように構成した。これにより、ユ
ーザーはテキストの読みを入力する作業を省略できるの
で、名称を登録する際に必要な作業が簡単になる。
【0045】また、上記実施例では、自動的に生成され
たテキストの読みから音声を合成すると共に、この合成
した音声をスピーカ9から出力し、この出力した音声が
テキストの読みとして適しているか否かをユーザーに問
い合わせ、更に、出力された音声がテキストの読みとし
て適していない旨の応答があったときに、異なる読み方
のテキストの読みを自動的に生成するように構成した。
これにより、自動的に生成されたテキストの読みが、ユ
ーザーが希望する読みでない場合には、異なる読みをユ
ーザーが希望する読みとして登録することができ、使い
勝手がより一層良くなる。
【0046】更に、上記実施例では、自動的に生成され
た2つのテキストの読みがいずれもユーザーが希望する
読みでない場合、即ち、自動的に生成された2つのテキ
ストの読みがいずれもテキストの読みとして適していな
い旨の応答があったときに、ユーザーによりテキストの
読みを入力可能に構成した。これにより、ユーザーが希
望する読みを確実に登録することができる。
【0047】尚、上記実施例では、ユーザーが名称等の
文字列のテキストを入力する際、キーボード部5を操作
して入力するように構成したが、これに限られるもので
はなく、音声で入力するように構成しても良いし、ま
た、音声とキーボード部を併用して入力するように構成
しても良い。更に、ナビゲーション装置3を動作させる
ためのコマンドや目的地等を入力する場合、キーボード
部5を操作したり、音声で入力したり、音声とキーボー
ド部を併用したりするように構成することが好ましい。
【0048】また、上記実施例では、テキストの読みを
自動的に生成する場合に、ユーザーが希望するものでな
いとき、2個の読みを生成するように構成したが、3個
以上の読みを生成するように構成しても良い。更に、上
記実施例では、音声認識装置2とナビゲーション装置3
を別体の装置として構成したが、これに代えて、音声認
識装置とナビゲーション装置を一体の装置として構成し
ても良い。更にまた、上記実施例のEMVシステム1に
カーエアコンやカーオーディオ機器等を制御する機能を
持たせ、カーエアコンやカーオーディオ機器や他の車載
機器の操作指令等を音声で入力可能なように構成しても
良い。
【0049】尚、上記実施例では、本発明の登録名称認
識装置をEMVシステム1に適用したが、これに限られ
るものではなく、例えば携帯型ナビゲーション装置や屋
内用空調装置、屋内用電話、携帯電話等に適用しても良
い。
【図面の簡単な説明】
【図1】ナビゲーション装置のブロック図
【図2】本発明の一実施例を示すEMVシステムのブロ
ック図
【図3】音声認識装置のブロック図
【図4】音声認識部のブロック図
【図5】フローチャート
【符号の説明】
1はEMVシステム、2は音声認識装置、3はナビゲー
ション装置、4はディスプレイ、5はキーボード部、6
は電話制御装置、7はマイク、8はPTTスイッチ、9
はスピーカ、10は入出力処理部、11は変換部(読み
生成手段)、12は記憶部(テキスト記憶手段)、13
は表示部、14はナビゲーション処理部、15は位置検
出器、16は地図データ入力部、17はリモコンセン
サ、18は制御部、19は音声入力部、20は音声認識
部、21は音声合成部、22は照合部、23は辞書部
(読み記憶手段)を示す。
フロントページの続き (51)Int.Cl.6 識別記号 FI G10L 5/02 G10L 5/02 J // G06F 3/16 330 G06F 3/16 330A

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 仮名文字にアルファベット文字や漢字や
    記号等を加えた文字で名称等の文字列のテキストを入力
    する入力手段と、 入力された前記テキストを記憶するテキスト記憶手段
    と、 入力された前記テキストに基づいて仮名文字を並べて構
    成された前記テキストの読みを生成する読み生成手段
    と、 生成された前記テキストの読みを記憶する読み記憶手段
    とを備えてなる登録名称認識装置。
  2. 【請求項2】 前記テキストの読みから音声を合成する
    音声合成手段と、 合成された音声を出力する音声出力手段と、 出力された音声が前記テキストの読みとして適している
    か否かを問い合わせる問い合わせ手段と、 出力された音声が前記テキストの読みとして適している
    旨または適していない旨の応答を行う応答手段とを備
    え、 前記読み生成手段は、出力された音声が前記テキストの
    読みとして適していない旨の応答があったときに、異な
    る読み方の前記テキストの読みを生成するように構成さ
    れていることを特徴とする請求項1記載の登録名称認識
    装置。
  3. 【請求項3】 前記読み生成手段により生成された複数
    の前記テキストの読みがいずれも前記テキストの読みと
    して適していない旨の応答があったときに、前記テキス
    トの読みを入力する読み入力手段を備えたことを特徴と
    する請求項2記載の登録名称認識装置。
JP10035816A 1998-02-18 1998-02-18 登録名称認識装置 Pending JPH11231886A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10035816A JPH11231886A (ja) 1998-02-18 1998-02-18 登録名称認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10035816A JPH11231886A (ja) 1998-02-18 1998-02-18 登録名称認識装置

Publications (1)

Publication Number Publication Date
JPH11231886A true JPH11231886A (ja) 1999-08-27

Family

ID=12452475

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10035816A Pending JPH11231886A (ja) 1998-02-18 1998-02-18 登録名称認識装置

Country Status (1)

Country Link
JP (1) JPH11231886A (ja)

Cited By (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6952675B1 (en) 1999-09-10 2005-10-04 International Business Machines Corporation Methods and apparatus for voice information registration and recognized sentence specification in accordance with speech recognition
US6983248B1 (en) 1999-09-10 2006-01-03 International Business Machines Corporation Methods and apparatus for recognized word registration in accordance with speech recognition
WO2007066433A1 (ja) * 2005-12-07 2007-06-14 Mitsubishi Electric Corporation 音声認識装置
WO2008150003A1 (ja) * 2007-06-06 2008-12-11 Nec Corporation キーワード抽出モデル学習システム、方法およびプログラム
JP5335165B2 (ja) * 2011-06-14 2013-11-06 三菱電機株式会社 発音情報生成装置、車載情報装置およびデータベース生成方法
JP2015512062A (ja) * 2012-03-02 2015-04-23 アップル インコーポレイテッド 名前発音システム及び方法
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant

Cited By (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6983248B1 (en) 1999-09-10 2006-01-03 International Business Machines Corporation Methods and apparatus for recognized word registration in accordance with speech recognition
US6952675B1 (en) 1999-09-10 2005-10-04 International Business Machines Corporation Methods and apparatus for voice information registration and recognized sentence specification in accordance with speech recognition
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
WO2007066433A1 (ja) * 2005-12-07 2007-06-14 Mitsubishi Electric Corporation 音声認識装置
US8060368B2 (en) 2005-12-07 2011-11-15 Mitsubishi Electric Corporation Speech recognition apparatus
WO2008150003A1 (ja) * 2007-06-06 2008-12-11 Nec Corporation キーワード抽出モデル学習システム、方法およびプログラム
JP5360414B2 (ja) * 2007-06-06 2013-12-04 日本電気株式会社 キーワード抽出モデル学習システム、方法およびプログラム
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
JP5335165B2 (ja) * 2011-06-14 2013-11-06 三菱電機株式会社 発音情報生成装置、車載情報装置およびデータベース生成方法
JP2015512062A (ja) * 2012-03-02 2015-04-23 アップル インコーポレイテッド 名前発音システム及び方法
US11069336B2 (en) 2012-03-02 2021-07-20 Apple Inc. Systems and methods for name pronunciation
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US10904611B2 (en) 2014-06-30 2021-01-26 Apple Inc. Intelligent automated assistant for TV user interactions
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US11069347B2 (en) 2016-06-08 2021-07-20 Apple Inc. Intelligent automated assistant for media exploration
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback

Similar Documents

Publication Publication Date Title
JPH11231886A (ja) 登録名称認識装置
JP6570651B2 (ja) 音声対話装置および音声対話方法
JP2003337042A (ja) ナビゲ−ション装置
JP2004029270A (ja) 音声制御装置
JP2003114698A (ja) コマンド受付装置及びプログラム
JP2002116793A (ja) データ入力システム及びその方法
JP3726783B2 (ja) 音声認識装置
JP4702081B2 (ja) 文字入力装置
JP3718088B2 (ja) 音声認識修正方式
KR20190057493A (ko) 외국인 한글 학습자용 키패드 시스템
JP3285821B2 (ja) タイ文字入力装置及びその制御プログラムを記憶した媒体
JP2000250587A (ja) 音声認識装置及び音声認識翻訳装置
JPH11231889A (ja) 音声認識装置
JP4093394B2 (ja) 音声認識装置
KR20080052306A (ko) 네비게이션 시스템에 이용되는 음성 인식 방법 및 장치
JP3911835B2 (ja) 音声認識装置及びナビゲーションシステム
JP2001249682A (ja) 登録名称の読み入力装置
JPH11120176A (ja) 通訳装置及び方法並びに通訳装置制御プログラムを記憶した媒体
JP2007193184A (ja) 音声住所認識装置
JPH11305790A (ja) 音声認識装置
JP2000250592A (ja) 音声認識操作システム
JPH08137385A (ja) 会話装置
KR100665820B1 (ko) 이동통신단말기 및 문자입력방법
JP2003140682A (ja) 音声認識装置及び音声辞書作成方法
JP4203984B2 (ja) 音声入力装置及び音声入力受付方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040421

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060526

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060822

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061219