JPH11231886A - 登録名称認識装置 - Google Patents
登録名称認識装置Info
- Publication number
- JPH11231886A JPH11231886A JP10035816A JP3581698A JPH11231886A JP H11231886 A JPH11231886 A JP H11231886A JP 10035816 A JP10035816 A JP 10035816A JP 3581698 A JP3581698 A JP 3581698A JP H11231886 A JPH11231886 A JP H11231886A
- Authority
- JP
- Japan
- Prior art keywords
- reading
- text
- unit
- voice
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Instructional Devices (AREA)
Abstract
表示した場合にユーザーの受ける印象を良くし、また、
名称を登録する際の手間を簡単にする。 【解決手段】 本発明の登録名称認識装置は、仮名文字
にアルファベット文字や漢字や記号等を加えた文字で名
称等の文字列のテキストを入力する入力手段を備え、入
力された前記テキストを記憶するテキスト記憶手段12
を備え、入力された前記テキストに基づいて仮名文字を
並べて構成された前記テキストの読みを生成する読み生
成手段11を備え、生成された前記テキストの読みを記
憶する読み記憶手段を備えて構成されている。
Description
ーション装置に目的地等の名称をユーザーが登録する際
に使用するための装置であって、登録した名称を音声で
認識可能にするための装置である登録名称認識装置に関
する。
チビジョン)システムには、ディスプレイ、キーボー
ド、カーナビゲーション装置、音声認識装置等が組み込
まれている。このようなEMVシステムにおいては、目
的地や施設名等の名称を多数登録することが可能に構成
されていると共に、登録されている多数の名称のうちの
所望の1つをユーザーが音声で選択することが可能に構
成されている。この場合、EMVシステムの音声認識装
置は、ユーザーが発生した音声(名称の音声)を入力す
ると共に、この入力した音声と、登録されている名称と
を比較(照合)し、一致度合いが最も高いものを認識結
果として出力(選択)するように構成されている。
パターンで登録する方法と、文字列のテキストで登録す
る方法がある。このうち、音声パターンで登録する方法
は、音声パターンのデータ量が非常に多いため大容量の
記憶装置が必要であると共に、登録されている名称を確
認するには、すべての名称を音声で再生して出力させる
必要があり、確認がかなり面倒である。これに対して、
テキストで登録する方法は、テキストのデータ量が少な
いため小容量の記憶装置で十分であると共に、登録され
ている名称を確認するにはすべての名称をディスプレイ
に表示してやるだけで済むから、確認が簡単である。こ
のため、一般的に、テキストで登録する方法が採用され
ている。
する場合、従来においては、キーボードを使用して仮名
文字(カタカナ)でテキストを入力するようにしてい
た。しかし、上記従来構成の場合、登録したい名称が例
えば「ANAホテル」であったとすると、「アナホテ
ル」または「エイエヌエイホテル」で登録しなければな
らないため、ディスプレイに上記名称を表示するような
場合、ユーザーが表示された名称を読み難いとか、ユー
ザーが受ける印象があまり良くないという問題があっ
た。
ルファベット文字や漢字や記号等の文字を加えた文字で
名称の文字列のテキストを入力可能なように構成するこ
とが考えられる。しかし、このように構成した場合、登
録したテキストの読みがわからないため、登録した名称
のテキストを音声認識可能にするためには、名称のテキ
ストの読みを仮名文字で別途入力しなければならない。
このため、名称を登録する際に必要な手間がかなり面倒
になるという新たな問題が生ずる。
名称等の文字列のテキストを表示した場合にユーザーの
受ける印象を良くすることができ、しかも、名称を登録
する際に必要な手間を簡単化することができる登録名称
認識装置を提供することにある。
ば、仮名文字にアルファベット文字や漢字や記号等を加
えた文字で名称等の文字列のテキストを入力する入力手
段を備えたから、登録されている名称等の文字列のテキ
ストを表示した場合に、ユーザーが受ける印象を良くす
ることができる。そして、この構成の場合、入力された
テキストに基づいて仮名文字を並べて構成されたテキス
トの読みを生成する読み生成手段と、生成されたテキス
トの読みを記憶する読み記憶手段とを備えた。これによ
り、テキストの読みを入力する作業を省略できるので、
名称を登録する際に必要な手間が簡単になる。
り自動的に生成されたテキストの読みが、ユーザーが希
望する読みでない場合がある。これに対して、請求項2
の発明によれば、テキストの読みから音声を合成すると
共に、合成した音声を出力し、この出力した音声がテキ
ストの読みとして適しているか否かをユーザーに問い合
わせ、更に、出力された音声がテキストの読みとして適
していない旨の応答があったときに、異なる読み方のテ
キストの読みを生成するように構成した。これにより、
ユーザーが希望するテキストの読みを登録することがで
きる。
れた複数のテキストの読みがいずれもユーザーが希望す
る読みでない場合がある。これに対して、請求項3の発
明によれば、読み生成手段により生成された複数のテキ
ストの読みがいずれもテキストの読みとして適していな
い旨の応答があったときに、テキストの読みを入力する
読み入力手段を備える構成とした。これにより、ユーザ
ーが希望する読みを確実に登録することができる。
ロマルチビジョン)システムに適用した一実施例につい
て、図面を参照しながら説明する。まず、図2はEMV
システム1の全体構成を概略的に示すブロック図であ
る。この図2に示すように、EMVシステム1は、音声
認識装置2、ナビゲーション装置3、ディスプレイ4、
キーボード部5及び電話制御装置6を備えて構成されて
いる。そして、音声認識装置2には、マイク7とPTT
(Push-To-Talk)スイッチ8とスピーカ9とが接続され
ている。
ついて具体的に説明する。まず、ディスプレイ4は、例
えば液晶ディスプレイ等で構成されており、カラー表示
が可能で地図等を明確に表示できる表示装置である。キ
ーボード部5は、上記ディスプレイ4の画面の上面に設
けられたタッチスイッチ(タッチパネル)と、上記画面
の周辺部に設けられたプッシュスイッチ等から構成され
ている。
すように、入出力処理部10、変換部11、記憶部1
2、表示部13、ナビゲーション処理部14、位置検出
器15、地図データ入力器16及びリモコンセンサ17
等から構成されている。ここで、位置検出器15は、地
磁気センサやジャイロスコープや距離センサやGPS受
信機(いずれも図示しない)等を組み合わせたもの、ま
たは、その一部で構成されており、車両の現在位置を検
出して現在位置検出信号を出力する機能を有している。
タやマップマッチングデータ等を入力するための装置で
ある。上記地図データ等のデータは、例えばCD−RO
M等からなる記録媒体に記録されている。リモコンセン
サ17は、ユーザーにより操作されるリモコン(図示し
ない)から送信された送信信号を受信する受信機であ
る。ナビゲーション処理部14は、ユーザーにより目的
地が設定されたときに、現在位置から目的地までの最適
経路を選択設定する機能や、現在位置を地図上に位置付
けるマップマッチング処理を実行する機能等を有してい
る。
りキーボード部5やリモコンが操作されたときに、キー
ボード部5やリモコンセンサ17から出力される各種の
操作信号を入力する回路である。この場合、例えばナビ
ゲーション処理を指令するコマンドや目的地等を入力す
るモード(画面)において、入出力処理部10に操作信
号として上記コマンド等が入力された場合、そのコマン
ド等はナビゲーション処理部14へ与えられるようにな
っている。また、名称等の文字列のテキストを登録する
モードにおいて、入出力処理部10に操作信号として上
記テキストが入力された場合、そのテキストは変換部1
1及び記憶部12へ与えれられるようになっている。
0から与えられた表示データをディスプレイ4に表示す
る機能を有している。例えば、ユーザーがキーボード部
5を操作して名称等の文字列のテキストを入力する際に
は、ディスプレイ4に仮名文字(カタカナ)、アルファ
ベット文字、漢字、記号等が適宜表示されるように構成
されている。これにより、仮名文字にアルファベット文
字や漢字や記号等を加えた文字で名称等の文字列のテキ
ストを入力することができるように構成されている。
尚、漢字を入力する際には、いわゆる仮名漢字変換処理
等を用いることが好ましい。上記構成の場合、キーボー
ド部5、ディスプレイ4、入出力処理部10及び表示部
13等から入力手段が構成されている。
通して与えられた上記テキスト(即ち、仮名文字にアル
ファベット文字や漢字や記号等を加えた文字で構成され
た文字列)に基づいて、仮名文字を並べて構成された上
記テキストの読みを生成する機能を有している。この場
合、変換部11が読み生成手段を構成している。このテ
キストの読みを生成する機能については、後述する。ま
た、記憶部12に与えられた上記テキストは、記憶部1
2に記憶されるように構成されている。上記記憶部12
がテキスト記憶手段を構成している。尚、記憶部12
は、RAMや不揮発性メモリ(例えばEEPROM)等
のメモリにより構成されている。
キストの読みは、ユーザーが希望する読みであるか否か
を確認する処理を行うために、音声認識装置2へ与えら
れるように構成されている。次に、上記音声認識装置2
について、図3及び図4を参照して説明する。
御部18、音声入力部19、音声認識部20及び音声合
成部21から構成されている。ここで、制御部18は、
音声認識装置2の動作全般を制御する機能を有してお
り、前記ナビゲーション装置3の変換部11により生成
されたテキストの読みはこの制御部18に与えられる。
上記制御部18は、与えられたテキストの読みを音声合
成部21へ送る。この音声合成部21は、上記テキスト
の読みから音声を合成し、この合成した音声をスピーカ
9から出力して発声するように構成されている。この場
合、音声合成部21が音声合成手段を構成し、スピーカ
9が音声出力手段を構成している。
即ち、テキストの読みが、ユーザーが希望する読みであ
るか否かをユーザが応答する処理は、ユーザーが音声で
応答しても良いし、キーボード部5を操作して応答して
も良いように構成されている。この応答処理について
は、後述する。
た音声をマイク7を介して入力し、音声データ(例えば
デジタルデータ)を出力するように構成されている。こ
の場合、音声入力部19は、ユーザーによりPTTスイ
ッチ8が押し下げ操作されている間だけ、ユーザーが発
した音声を入力して音声データを出力するようになって
いる。即ち、PTTスイッチ8が押し下げ操作されてい
る間だけ、ユーザーが発した音声の音声認識処理が実行
されるように構成されている。
ータは、音声認識部20に与えられるようになってい
る。この音声認識部20は、与えられた音声データ(入
力した音声)を制御部18からの指示に従って音声認識
処理を行い、その音声認識結果を制御部18へ出力する
機能を有している。そして、音声認識部20は、具体的
には、図4に示すように、照合部22及び辞書部23か
ら構成されている。
びそのその構造から構成された辞書データが記憶されて
いる。更に、この辞書部23の辞書データには、ユーザ
ーにより登録された名称等の文字列のテキストの読みが
加えられて記憶されている。この場合、辞書部23が読
み記憶手段を構成している。
与えられた音声データに対して、上記辞書部23に記憶
されている辞書データを用いて照合(認識)を行うよう
に構成されている。この場合、音声データと辞書データ
内の複数の比較対象パターン候補とを比較して一致度の
高い上位比較対象パターンを、認識結果として制御部1
8へ出力するように構成されている。尚、上記した照合
処理としては、既に知られている照合処理用の制御プロ
グラムを使用すれば良い。
(認識)処理に先立って、制御部18に記憶されている
認識率を向上させるためのデータを参照して、学習処理
を行い、最も入力音声に近い言葉を辞書部23の辞書デ
ータから選択するように構成されている。尚、認識率を
向上させるためのデータは、例えば過去実行した照合結
果(認識回数等)や外部の状況を示すデータ等であり、
これらデータは制御部18に記憶されている。
ザーが名称等の文字列のテキストを登録する場合の動作
について、図5も参照して説明する。図5のフローチャ
ートは、ナビゲーション装置3及び音声認識装置2を動
作させる制御プログラムのうちの上記テキストを登録す
る処理の制御部分の内容を示している。
されると、まず図5のステップS1において、ユーザー
によりキーボード部5が操作されて名称等の文字列のテ
キストが入力される。この場合、ディスプレイ4には、
名称等の文字列のテキストを登録するための画面が表示
されると共に、ユーザーにより入力されたテキストが表
示されるように構成されている。そして、入力されたテ
キストは、ナビゲーション装置3の入出力処理部10を
通って、記憶部12へ送られ、ここに登録(記憶)され
るようになっている。
ナビゲーション装置3の入出力処理部10を通って、変
換部11へ送られ、この変換部11は、上記テキストの
読みを生成する(ステップS2)。ここでは、テキスト
として例えば「ANAホテル」が入力されたとすると、
このテキストのうちのアルファベット部分について上記
変換部11によって1文字ずつ読みが作成されるように
構成されている。この場合、変換部11は、テキスト
「ANAホテル」の読みとして、例えば「エイエヌエイ
ホテル」という読みを生成するように構成されている。
ホテル」が上記テキスト「ANAホテル」の読みとして
適しているか否かをユーザーに問い合わせる処理が実行
される。具体的には、まず、生成された読み「エイエヌ
エイホテル」から音声が合成されると共に、この合成音
声がスピーカ9から発生されるようになっている(ステ
ップS3)。この場合、変換部11にて生成された上記
読み「エイエヌエイホテル」は、音声認識装置2の制御
部18を通って音声合成部21へ送られ、ここで音声に
合成され、この合成された音声はスピーカ9から発声さ
れるように構成されている。更に、ここで発声される音
声は、上記読み「エイエヌエイホテル」に、その読みで
良いか否かを問い合わせる音声「デスカ」が加わった音
声となっている。この場合、音声認識装置2の制御部1
8と音声合成部21とスピーカ9とにより問い合わせ手
段が構成されている。
「エイエヌエイホテル」がテキスト「ANAホテル」の
読みとして適しているか否かについて、ユーザーにより
応答されるのを待つ。この場合、ユーザーは、音声で
「ハイ」または「イイエ」と応答するように構成されて
いる。尚、ユーザーがキーボード部5の応答用のキー
(「ハイキー」または「イイエキー」)を操作すること
により、応答するように構成しても良い。
がPTTスイッチ8を操作しながら音声で「ハイ」と応
答したとすると、この音声「ハイ」は、マイク7を介し
て音声認識装置2の音声入力部19へ入力され、音声認
識部20により「ハイ」という肯定の言葉として認識さ
れる。そして、この認識結果は、制御部18へ送られ、
該制御部18によりユーザーが上記読み「エイエヌエイ
ホテル」を肯定していることが認識される。これによ
り、ステップS4にて「YES」へ進み、制御部18
は、上記読み「エイエヌエイホテル」を上記テキスト
「ANAホテル」の読みとして辞書部23の辞書データ
に登録(記憶)するように構成されている(ステップS
5)。
ーがPTTスイッチ8を操作しながら音声で「イイエ」
と応答したとすると、この音声「イイエ」は、マイク7
を介して音声認識装置2の音声入力部19へ入力され、
音声認識部20により「イイエ」という否定の言葉とし
て認識される。そして、この認識結果は、制御部18へ
送られ、該制御部18によりユーザーが上記読み「エイ
エヌエイホテル」を否定していることが認識される。こ
れにより、制御部18は、上記読み「エイエヌエイホテ
ル」を上記テキスト「ANAホテル」の読みとして辞書
部23の辞書データに登録しないように構成されてい
る。
御部18からナビゲーション装置3の変換部11へ送ら
れる。すると、上記ステップS4にて「NO」へ進み、
上記変換部11は、上記テキスト「ANAホテル」の読
みとして、「エイエヌエイホテル」とは異なる読みを生
成する。具体的には、変換部11は、上記テキストのう
ちのアルファベット部分について例えばローマ字読みす
ることによって読みを作成するように構成されている。
この場合、変換部11は、テキスト「ANAホテル」の
異なる読みとして、「アナホテル」という読みを生成す
る(ステップS6)。
ル」が上記テキスト「ANAホテル」の読みとして適し
ているか否かをユーザーに問い合わせる処理が実行され
る。具体的には、ステップS7へ進み、上記生成された
読み「アナホテル」から音声が合成されると共に、この
合成音声がスピーカ9から発生される。尚、ここで発声
される音声には、上記読み「アナホテル」に、その読み
で良いか否かを問い合わせる音声「デスカ」が加わった
音声となっている。続いて、ステップS8へ進み、上記
読み「アナホテル」がテキスト「ANAホテル」の読み
として適しているか否かについて、ユーザーが応答する
のを待つ。
を操作しながら音声で「ハイ」と応答したとすると、こ
の音声「ハイ」は、マイク7を介して音声認識装置2の
音声入力部19へ入力され、音声認識部20により「ハ
イ」という肯定の言葉として認識される。そして、この
認識結果は、制御部18へ送られ、該制御部18により
ユーザーが上記読み「アナホテル」を肯定していること
が認識される。これにより、ステップS8にて「YE
S」へ進み、制御部18は、上記読み「アナホテル」を
上記テキスト「ANAホテル」の読みとして辞書部23
の辞書データに登録(記憶)するように構成されている
(ステップS5)。尚、上記「YES」の場合、ナビゲ
ーション装置3にも上記ユーザーの肯定が通知されて登
録を完了するようになっている。
ーがPTTスイッチ8を操作しながら音声で「イイエ」
と応答したとすると、この音声「イイエ」は、マイク7
を介して音声認識装置2の音声入力部19へ入力され、
音声認識部20により「イイエ」という否定の言葉とし
て認識される。そして、この認識結果は、制御部18へ
送られ、該制御部18によりユーザーが上記読み「アナ
ホテル」を否定していることが認識される。これによ
り、制御部18は、上記読み「アナホテル」を上記テキ
スト「ANAホテル」の読みとして辞書部23の辞書デ
ータに登録しないように構成されている。
御部18からナビゲーション装置3の変換部11へ送ら
れる。すると、上記ステップS8にて「NO」へ進み、
上記変換部11は、テキスト「ANAホテル」の読みを
生成する処理を止めて、その旨を入出力制御部10へ送
る。これにより、入出力制御部10は、表示部13を介
してディスプレイ4に「読みを入力させる画面」を表示
すると共に、ユーザーが例えばキーボード部5を操作し
て読みを入力するのを待つように構成されている(ステ
ップS9)。尚、ユーザーによる読みの入力方法とし
て、上記キーボード部5に代えて、音声で入力するよう
に構成することも好ましい構成である。
と、その入力された読みは、入出力制御部10から変換
部11を通り、音声認識装置2の制御部18へ送られ
る。そして、制御部18は、上記入力された読みを辞書
部23の辞書データ内に登録するように構成されている
(ステップS5)。
録処理を更に続けるときには、ステップS10にて「Y
ES」へ進み、ステップS1へ戻って上述した処理を繰
り返すように構成されている。一方、ユーザーが名称等
のテキストの登録処理を終えるとき(終了操作を行なっ
たとき)には、ステップS10にて「NO」へ進み、登
録処理を終了する。
は、仮名文字にアルファベット文字が混じったテキスト
について説明したが、漢字や記号等が混じったテキスト
についても、ほぼ同様な登録制御を実行することができ
る。このような漢字や記号等が混じったテキストの場合
には、変換部11によって、入力されたテキストのうち
の漢字や記号部分について、アルゴリズムで適当な読み
を生成するように構成すれば良い。上記アルゴリズムと
しては、例えば漢字や記号とその読みとを対応させた読
みの辞書を用意し、この辞書を参照して読みを生成する
ようなアルゴリズムを用いることが好ましい。
は、電話制御装置6が備わっている。このため、EMV
システム1は、電話番号のリストを登録することが可能
に構成されている。この電話番号のリストを登録する処
理は、上述した名称等のテキストを登録する処理とほぼ
同じ処理である。
人名と住所等のテキストをキーボード部5を操作するこ
とにより入力させ、入力したテキストをナビゲーション
装置3の記憶部12に登録する。このとき、人名と住所
等については、仮名文字にアルファベット文字や漢字や
記号等を加えた文字で入力できるように構成する。そし
て、電話番号と人名と住所等の各テキストの読みを変換
部11により自動的に生成し、この生成した読みをユー
ザーが希望する読みであるか否かを確認し、希望する読
みであるときに、上記生成した読みを音声認識装置2の
辞書部23に登録するように構成されている。
した読みと異なる読みを変換部11により新たに生成
し、この生成した読みをユーザーが希望する読みである
か否かを再度確認し、希望する読みであるときに、上記
新たに生成した読みを音声認識装置2の辞書部23に登
録するように構成されている。また、生成した2つの読
みがいずれも希望する読みでないときは、ユーザーが希
望する読みをユーザーにより入力させ、この入力された
読みを音声認識装置2の辞書部23に登録するように構
成されている。以下、ユーザーが希望する件数の電話番
号のリストが登録されるまで、上述した登録処理が繰り
返されるように構成されている。
用する場合、ユーザーが例えば相手先の人名を音声で指
定すると、その人名の音声が音声認識装置2により認識
されると共に、この認識された人名に対応する電話番号
がナビゲーション装置3の記憶部12内の電話番号のリ
ストから検索され、更に、この検索された電話番号で電
話制御装置6が駆動制御されてダイヤル動作が自動的に
実行されるように構成されている。
文字にアルファベット文字や漢字や記号等を加えた文字
で名称等の文字列のテキストを入力して登録できるよう
に構成したので、登録されている名称等の文字列のテキ
ストをディスプレイ4に表示したような場合に、ユーザ
がそのテキストを読み易くなると共に、ユーザーが受け
る印象を向上させることができる。そして、上記実施例
の場合、入力されたテキストに基づいて仮名文字を並べ
て構成されたテキストの読みを自動的に生成すると共
に、この生成されたテキストの読みを音声認識装置2の
辞書部23に記憶するように構成した。これにより、ユ
ーザーはテキストの読みを入力する作業を省略できるの
で、名称を登録する際に必要な作業が簡単になる。
たテキストの読みから音声を合成すると共に、この合成
した音声をスピーカ9から出力し、この出力した音声が
テキストの読みとして適しているか否かをユーザーに問
い合わせ、更に、出力された音声がテキストの読みとし
て適していない旨の応答があったときに、異なる読み方
のテキストの読みを自動的に生成するように構成した。
これにより、自動的に生成されたテキストの読みが、ユ
ーザーが希望する読みでない場合には、異なる読みをユ
ーザーが希望する読みとして登録することができ、使い
勝手がより一層良くなる。
た2つのテキストの読みがいずれもユーザーが希望する
読みでない場合、即ち、自動的に生成された2つのテキ
ストの読みがいずれもテキストの読みとして適していな
い旨の応答があったときに、ユーザーによりテキストの
読みを入力可能に構成した。これにより、ユーザーが希
望する読みを確実に登録することができる。
文字列のテキストを入力する際、キーボード部5を操作
して入力するように構成したが、これに限られるもので
はなく、音声で入力するように構成しても良いし、ま
た、音声とキーボード部を併用して入力するように構成
しても良い。更に、ナビゲーション装置3を動作させる
ためのコマンドや目的地等を入力する場合、キーボード
部5を操作したり、音声で入力したり、音声とキーボー
ド部を併用したりするように構成することが好ましい。
自動的に生成する場合に、ユーザーが希望するものでな
いとき、2個の読みを生成するように構成したが、3個
以上の読みを生成するように構成しても良い。更に、上
記実施例では、音声認識装置2とナビゲーション装置3
を別体の装置として構成したが、これに代えて、音声認
識装置とナビゲーション装置を一体の装置として構成し
ても良い。更にまた、上記実施例のEMVシステム1に
カーエアコンやカーオーディオ機器等を制御する機能を
持たせ、カーエアコンやカーオーディオ機器や他の車載
機器の操作指令等を音声で入力可能なように構成しても
良い。
識装置をEMVシステム1に適用したが、これに限られ
るものではなく、例えば携帯型ナビゲーション装置や屋
内用空調装置、屋内用電話、携帯電話等に適用しても良
い。
ック図
ション装置、4はディスプレイ、5はキーボード部、6
は電話制御装置、7はマイク、8はPTTスイッチ、9
はスピーカ、10は入出力処理部、11は変換部(読み
生成手段)、12は記憶部(テキスト記憶手段)、13
は表示部、14はナビゲーション処理部、15は位置検
出器、16は地図データ入力部、17はリモコンセン
サ、18は制御部、19は音声入力部、20は音声認識
部、21は音声合成部、22は照合部、23は辞書部
(読み記憶手段)を示す。
Claims (3)
- 【請求項1】 仮名文字にアルファベット文字や漢字や
記号等を加えた文字で名称等の文字列のテキストを入力
する入力手段と、 入力された前記テキストを記憶するテキスト記憶手段
と、 入力された前記テキストに基づいて仮名文字を並べて構
成された前記テキストの読みを生成する読み生成手段
と、 生成された前記テキストの読みを記憶する読み記憶手段
とを備えてなる登録名称認識装置。 - 【請求項2】 前記テキストの読みから音声を合成する
音声合成手段と、 合成された音声を出力する音声出力手段と、 出力された音声が前記テキストの読みとして適している
か否かを問い合わせる問い合わせ手段と、 出力された音声が前記テキストの読みとして適している
旨または適していない旨の応答を行う応答手段とを備
え、 前記読み生成手段は、出力された音声が前記テキストの
読みとして適していない旨の応答があったときに、異な
る読み方の前記テキストの読みを生成するように構成さ
れていることを特徴とする請求項1記載の登録名称認識
装置。 - 【請求項3】 前記読み生成手段により生成された複数
の前記テキストの読みがいずれも前記テキストの読みと
して適していない旨の応答があったときに、前記テキス
トの読みを入力する読み入力手段を備えたことを特徴と
する請求項2記載の登録名称認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10035816A JPH11231886A (ja) | 1998-02-18 | 1998-02-18 | 登録名称認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10035816A JPH11231886A (ja) | 1998-02-18 | 1998-02-18 | 登録名称認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH11231886A true JPH11231886A (ja) | 1999-08-27 |
Family
ID=12452475
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10035816A Pending JPH11231886A (ja) | 1998-02-18 | 1998-02-18 | 登録名称認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH11231886A (ja) |
Cited By (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6952675B1 (en) | 1999-09-10 | 2005-10-04 | International Business Machines Corporation | Methods and apparatus for voice information registration and recognized sentence specification in accordance with speech recognition |
US6983248B1 (en) | 1999-09-10 | 2006-01-03 | International Business Machines Corporation | Methods and apparatus for recognized word registration in accordance with speech recognition |
WO2007066433A1 (ja) * | 2005-12-07 | 2007-06-14 | Mitsubishi Electric Corporation | 音声認識装置 |
WO2008150003A1 (ja) * | 2007-06-06 | 2008-12-11 | Nec Corporation | キーワード抽出モデル学習システム、方法およびプログラム |
JP5335165B2 (ja) * | 2011-06-14 | 2013-11-06 | 三菱電機株式会社 | 発音情報生成装置、車載情報装置およびデータベース生成方法 |
JP2015512062A (ja) * | 2012-03-02 | 2015-04-23 | アップル インコーポレイテッド | 名前発音システム及び方法 |
US9668024B2 (en) | 2014-06-30 | 2017-05-30 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9865248B2 (en) | 2008-04-05 | 2018-01-09 | Apple Inc. | Intelligent text-to-speech conversion |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9966060B2 (en) | 2013-06-07 | 2018-05-08 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9971774B2 (en) | 2012-09-19 | 2018-05-15 | Apple Inc. | Voice-based media searching |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US9986419B2 (en) | 2014-09-30 | 2018-05-29 | Apple Inc. | Social reminders |
US10049675B2 (en) | 2010-02-25 | 2018-08-14 | Apple Inc. | User profiling for voice input processing |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10079014B2 (en) | 2012-06-08 | 2018-09-18 | Apple Inc. | Name recognition system |
US10089072B2 (en) | 2016-06-11 | 2018-10-02 | Apple Inc. | Intelligent device arbitration and control |
US10169329B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Exemplar-based natural language processing |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10269345B2 (en) | 2016-06-11 | 2019-04-23 | Apple Inc. | Intelligent task discovery |
US10297253B2 (en) | 2016-06-11 | 2019-05-21 | Apple Inc. | Application integration with a digital assistant |
US10318871B2 (en) | 2005-09-08 | 2019-06-11 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US10354011B2 (en) | 2016-06-09 | 2019-07-16 | Apple Inc. | Intelligent automated assistant in a home environment |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10521466B2 (en) | 2016-06-11 | 2019-12-31 | Apple Inc. | Data driven natural language event detection and classification |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10706841B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Task flow identification based on user intent |
US10733993B2 (en) | 2016-06-10 | 2020-08-04 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10791176B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US10795541B2 (en) | 2009-06-05 | 2020-10-06 | Apple Inc. | Intelligent organization of tasks items |
US10810274B2 (en) | 2017-05-15 | 2020-10-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11080012B2 (en) | 2009-06-05 | 2021-08-03 | Apple Inc. | Interface for a virtual digital assistant |
-
1998
- 1998-02-18 JP JP10035816A patent/JPH11231886A/ja active Pending
Cited By (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6983248B1 (en) | 1999-09-10 | 2006-01-03 | International Business Machines Corporation | Methods and apparatus for recognized word registration in accordance with speech recognition |
US6952675B1 (en) | 1999-09-10 | 2005-10-04 | International Business Machines Corporation | Methods and apparatus for voice information registration and recognized sentence specification in accordance with speech recognition |
US10318871B2 (en) | 2005-09-08 | 2019-06-11 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
WO2007066433A1 (ja) * | 2005-12-07 | 2007-06-14 | Mitsubishi Electric Corporation | 音声認識装置 |
US8060368B2 (en) | 2005-12-07 | 2011-11-15 | Mitsubishi Electric Corporation | Speech recognition apparatus |
WO2008150003A1 (ja) * | 2007-06-06 | 2008-12-11 | Nec Corporation | キーワード抽出モデル学習システム、方法およびプログラム |
JP5360414B2 (ja) * | 2007-06-06 | 2013-12-04 | 日本電気株式会社 | キーワード抽出モデル学習システム、方法およびプログラム |
US9865248B2 (en) | 2008-04-05 | 2018-01-09 | Apple Inc. | Intelligent text-to-speech conversion |
US10795541B2 (en) | 2009-06-05 | 2020-10-06 | Apple Inc. | Intelligent organization of tasks items |
US11080012B2 (en) | 2009-06-05 | 2021-08-03 | Apple Inc. | Interface for a virtual digital assistant |
US11423886B2 (en) | 2010-01-18 | 2022-08-23 | Apple Inc. | Task flow identification based on user intent |
US10706841B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Task flow identification based on user intent |
US10049675B2 (en) | 2010-02-25 | 2018-08-14 | Apple Inc. | User profiling for voice input processing |
JP5335165B2 (ja) * | 2011-06-14 | 2013-11-06 | 三菱電機株式会社 | 発音情報生成装置、車載情報装置およびデータベース生成方法 |
JP2015512062A (ja) * | 2012-03-02 | 2015-04-23 | アップル インコーポレイテッド | 名前発音システム及び方法 |
US11069336B2 (en) | 2012-03-02 | 2021-07-20 | Apple Inc. | Systems and methods for name pronunciation |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US10079014B2 (en) | 2012-06-08 | 2018-09-18 | Apple Inc. | Name recognition system |
US9971774B2 (en) | 2012-09-19 | 2018-05-15 | Apple Inc. | Voice-based media searching |
US9966060B2 (en) | 2013-06-07 | 2018-05-08 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US10169329B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Exemplar-based natural language processing |
US10904611B2 (en) | 2014-06-30 | 2021-01-26 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9668024B2 (en) | 2014-06-30 | 2017-05-30 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9986419B2 (en) | 2014-09-30 | 2018-05-29 | Apple Inc. | Social reminders |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US11500672B2 (en) | 2015-09-08 | 2022-11-15 | Apple Inc. | Distributed personal assistant |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11526368B2 (en) | 2015-11-06 | 2022-12-13 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
US11069347B2 (en) | 2016-06-08 | 2021-07-20 | Apple Inc. | Intelligent automated assistant for media exploration |
US10354011B2 (en) | 2016-06-09 | 2019-07-16 | Apple Inc. | Intelligent automated assistant in a home environment |
US10733993B2 (en) | 2016-06-10 | 2020-08-04 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US11037565B2 (en) | 2016-06-10 | 2021-06-15 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US11152002B2 (en) | 2016-06-11 | 2021-10-19 | Apple Inc. | Application integration with a digital assistant |
US10521466B2 (en) | 2016-06-11 | 2019-12-31 | Apple Inc. | Data driven natural language event detection and classification |
US10089072B2 (en) | 2016-06-11 | 2018-10-02 | Apple Inc. | Intelligent device arbitration and control |
US10297253B2 (en) | 2016-06-11 | 2019-05-21 | Apple Inc. | Application integration with a digital assistant |
US10269345B2 (en) | 2016-06-11 | 2019-04-23 | Apple Inc. | Intelligent task discovery |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US10791176B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US11405466B2 (en) | 2017-05-12 | 2022-08-02 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US10810274B2 (en) | 2017-05-15 | 2020-10-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH11231886A (ja) | 登録名称認識装置 | |
JP6570651B2 (ja) | 音声対話装置および音声対話方法 | |
JP2003337042A (ja) | ナビゲ−ション装置 | |
JP2004029270A (ja) | 音声制御装置 | |
JP2002116793A (ja) | データ入力システム及びその方法 | |
JP3726783B2 (ja) | 音声認識装置 | |
KR102035087B1 (ko) | 외국인 한글 학습자용 키패드 시스템 | |
JP4702081B2 (ja) | 文字入力装置 | |
JP3718088B2 (ja) | 音声認識修正方式 | |
JP3285821B2 (ja) | タイ文字入力装置及びその制御プログラムを記憶した媒体 | |
JP2000250587A (ja) | 音声認識装置及び音声認識翻訳装置 | |
JPH11231889A (ja) | 音声認識装置 | |
JP4093394B2 (ja) | 音声認識装置 | |
KR20080052306A (ko) | 네비게이션 시스템에 이용되는 음성 인식 방법 및 장치 | |
JP3911835B2 (ja) | 音声認識装置及びナビゲーションシステム | |
JP2001249682A (ja) | 登録名称の読み入力装置 | |
JP2001216130A (ja) | 音声入力装置 | |
JP2007193184A (ja) | 音声住所認識装置 | |
JPH11305790A (ja) | 音声認識装置 | |
JP2000250592A (ja) | 音声認識操作システム | |
JPH08137385A (ja) | 会話装置 | |
JP2003140682A (ja) | 音声認識装置及び音声辞書作成方法 | |
JP4203984B2 (ja) | 音声入力装置及び音声入力受付方法 | |
JP2008233009A (ja) | カーナビゲーション装置及びカーナビゲーション装置用プログラム | |
JPH1195792A (ja) | 音声処理装置および文字入力方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040421 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060526 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060530 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060822 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061219 |