JP2003529229A - 認識可能な名前ライブラリを有する自動応答装置 - Google Patents
認識可能な名前ライブラリを有する自動応答装置Info
- Publication number
- JP2003529229A JP2003529229A JP2000608579A JP2000608579A JP2003529229A JP 2003529229 A JP2003529229 A JP 2003529229A JP 2000608579 A JP2000608579 A JP 2000608579A JP 2000608579 A JP2000608579 A JP 2000608579A JP 2003529229 A JP2003529229 A JP 2003529229A
- Authority
- JP
- Japan
- Prior art keywords
- name
- objects
- library
- voice input
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004044 response Effects 0.000 claims description 14
- 238000000034 method Methods 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 230000015654 memory Effects 0.000 description 3
- 230000003936 working memory Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 102100031083 Uteroglobin Human genes 0.000 description 1
- 108090000203 Uteroglobin Proteins 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/30—Aspects of automatic or semi-automatic exchanges related to audio recordings in general
- H04M2203/306—Prerecordings to be used during a voice call
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/30—Aspects of automatic or semi-automatic exchanges related to audio recordings in general
- H04M2203/308—Personal name recording
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4931—Directory assistance systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/527—Centralised call answering arrangements not requiring operator intervention
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/53—Centralised arrangements for recording incoming messages, i.e. mailbox systems
- H04M3/533—Voice mail systems
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Sub-Exchange Stations And Push- Button Telephones (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
に情報の検索、再生及びナビゲーション用にASRを使用する自動電話交換プラ
ットフォーム(台)に関するものである。
る能力を有している。これにより、例えば所定の被呼出しパーティが応答できな
い際に、被呼出しパーティの実際の声でプロンプトを再生するようにシステムを
制御することができる。この動作は通常、ユーザが録音したオーディオファイル
を記憶し、そして所定事象の際にこのファイルを検索することによって達成され
る。上述の再生技法が所望されているが、実際には多くのユーザが自分の発声情
報を記録する時間を取ることがない。実際に、こうしたシステムを病院またはホ
テルで使用するような一部の環境では、ユーザが期間中にシステムへのアクセス
を要求することがなく、このためユーザが自分の発声情報をシステム内に記録す
る動機を有しない。これらの場合においては、ユーザ識別情報の再生は、2つの
方法のうち1つのみによって達成することができる。これらの方法は、オペレー
タにユーザの名前を個別に記憶させる仕事を引き受けさせて、かなり労働集約型
となりうる方法か、あるいはユーザの名前をアナウンスする他の手段をデフォル
トとしてシステムに強制する方法のいずれかである。通常、このデフォルト動作
はテキスト(文字列)−音声プロセッサによって実行され、これは許容しがたい
結果をもたらす。特にテキスト−音声プロセッサは、所定の名前、とりわけ外国
に由来する名前については正確な発音を提供することができない。本発明はこの
問題に応えるものである。
トフォーム(例えば自動応答装置)を提供することにある。一般的名前ライブラ
リは、この交換プラットフォームに関連するか、あるいはこの交換プラットフォ
ーム上で動作する電話ベースのASRアプリケーションによって認識されるべき
ものと想定される一般的なオブジェクト(例えば名前、製品識別子、色、等)を
表現するオーディオファイルの大規模データベースを具えている。個々のオーデ
ィオファイルは圧縮フォーマットで記憶されることが好ましい。ASR応用品が
オブジェクトファイル(例えばユーザの名前)の再生を必要とする際にいつも、
システムはまず、ユーザが必要な発声サンプルを録音しているか否かを特定する
。録音している場合には、ユーザの実際の発声を出力する。しかしユーザの実際
の発声サンプルが利用不可能な場合、あるいは録音されていない場合には、AS
Rアプリケーションはデータベースにアクセスしてオブジェクトファイルを検索
して、これから適切な出力列を構築する。
したいと望み、かつこの人が応答できない場合には、ボイスメールシステムが"y
our call to 'Mary Smith' cannot be completed, if you'd like to leave a m
essage, press 1"(「メリースミスさんをお呼びすることができませんでした。
メッセージがございましたら1を押して下さい。」)と応答する。このメッセー
ジでは、ユーザ自身の声の'Mary Smith'のプロンプトが存在しない場合には、シ
ステムが'Mary'及び'Smith'という2つの別個のオブジェクトエントリを一般的
名前ライブラリ内で検索して、これらのオブジェクトを連結させて、'Mary Smit
h'を出力する。利用可能なライブラリオブジェクトが使用できないか、あるいは
不十分なものである場合には、テキスト−音声プロセッサをバックアップのアナ
ウンスメカニズムとして使用することができる。
、イントラネット等のデータネットワーク経由でこれにアクセスすることができ
る。このライブラリは個々の発呼に応じてアクセスすることができるか、あるい
はライブラリ内のオブジェクトの副集合を、所定の応答装置にダウンロードする
ことができる。データベース内のエントリ数が増大すればするほど、ライブラリ
の集中統括管理が好ましくなる。
名前ライブラリから検索して、再組み立て(通常、連結によって)して出力する
。名前ライブラリは、私設構内交換機へのフロントエンド(前処理)及びバック
エンド(後処理)としての特定のユーティリティを有して、ディレクトリ支援、
ボイスメールのルーティング(ルート割り当て)、等を行う。
点を述べたものである。これらの目的は単に、本発明の明らかな特徴及び応用を
表わすものとして構成したものである。本明細書に開示した発明を、異なる方法
で応用するか、あるいは変形することによって、幾多の有益な結果を達成するこ
とができる。従って、本発明をより良く理解するための詳細な説明及び本発明の
他の目的については、以下の好適な実施例で記述する。
事項として、図1に、本発明を実施することができる既知のコンピュータアーキ
テクチャを示す。コンピュータ100は、多数の電話回線110上で、ユーザと
の声による対話に使用するものである。コンピュータ100は、発呼者が言った
ことを自動的に認識して、発呼者と対話するためのプロンプトを再生することが
できる。コンピュータ100は、シングルボードコンピュータのような汎用コン
ピュータにデータバス125上で結合された1つ以上の電話インタフェース13
0を含む。汎用コンピュータ120は、汎用プロセッサ122と、DRAMのよ
うな作業メモリ124と、磁気ディスクのような不揮発性プログラムメモリ12
6とを含む。この代わりに、プログラムメモリが他のコンピュータ上に存在して
、データネットワーク上でこれにアクセスすることもできる。電話インタフェー
ス130は、発呼者がコンピュータと対話するための電話回線110へのインタ
フェースを提供するものである。また1つ以上のDSPプラットフォーム140
も、データバス125上で汎用コンピュータ120に結合されている。DSPプ
ラットフォーム140は、好ましくはTDMバスである第2バス150上で電話
インタフェースに結合されている。TDMバス150は、DSPプラットフォー
ム140と電話インタフェース130との間で、ディジタル化した音声を搬送す
ることができる。各DSPプラットフォーム140は、多数のDSPプロセッサ
142、作業メモリ144、データバス125へのデータバスインタフェース1
46、及びデータバス150への音声インタフェース148を含む。汎用プロセ
ッサ122はインテル社のペンティアム、データバス125はISAバス、DS
Pプラットフォーム140はダイアロジック社製造のAntaresDSPプラットフ
ォーム(モデル2000/30、2000/50、6000)、そしてTDMバス150は、サンプ
リングレート8kHzでサンプリングして8ビットサンプルに符号化した電話信号
を搬送するSCSIバスである。各AntaresDSPプラットフォームは、4つの
DSPプロセッサ122、テキサスインスツルメンツ社製造のTMS320C1プロセッ
サを含む。作業メモリ144は、DSP1個当り512KBのスタティックRAM、
及び4個のDSPプロセッサ142が共用する4MBのダイナミックRAMである
。電話インタフェース130は、いくつかの異なるタイプのもの、例えばダイア
ロジック社製造のインタフェース(型番D41ESC、D160SC、及びD112SC)である。
D112SCインタフェースは、例えば12本のアナログ電話回線をサポートする。D
SPプラットフォーム上の各DSPプロセッサは、所定の電話チャネルに関連し
ていることが好ましい。
の比較的小さい断片中に話しているに過ぎない。残りの時間は、プロンプトまた
は他の情報を発呼者に対して再生すること、あるいは、例えば発呼者のために情
報を検索する間のような無音の休止期間によって消費される。このため所望すれ
ば、発呼者が話しているか、あるいはプロンプトまたは情報を再生しているかに
かかわわらず、1個のDSPを各電話の対話用に割り当てることができる。
動応答プラットフォーム10が私設構内交換機(PBX)内に設けられている。
プラットフォーム10は、スイッチ12、コントローラ14、Vpro/Continuous
speech recognition(連続音声認識)、VR/Continuous speech recognition、ま
たはSpeech Wave Standard speech recognition(音声波標準音声認識)のよう
なASRアプリケーション16を含む種々のアプリケーションを具え、これらの
アプリケーションはすべて、テキサス州ダラスのボイスコントロールシステム社
から入手できる。もちろん、所定の音声認識アプリケーションのいずれを利用す
ることもできる。また前記プラットフォームは、音声メッセージの記憶、検索及
び転送用のボイスメールアプリケーション18を含む。
り例えば、応答装置が入り発呼に応答して、冒頭の挨拶を再生して、名前/内線
を要求して、この発呼をこの内線に転送する。応答装置が発呼に応答する際に、
外線発呼者は通常、名前用のプロンプトで入力待ちされる。名前の確認上、所定
の外線発呼者は、対応する内線に転送される。既知の従来法では、応答装置は通
常、"did you say −"(「−でよろしいですか。」)というプロンプトで名前の
確認を助長する。システムのユーザは通常、自分の"did you say −"プロンプト
を録音及び再録音する目的で、ボイスメールシステムへのアクセス権を有してい
る。
25を含む。ライブラリ25は圧縮オーディオファイル27のデータベースであ
ることが好ましく、各ファイルがASRによって認識されるべきオブジェクトに
対応していることが好ましい。これにより、単なる代表例としてのボイスメール
の例では、ファイル27は一般的的な名前を多数収集したものから成る。この収
集はオフラインの方法、即ちコンピュータエントリ(タイプ入力)、音声入力事
項(発声入力)、あるいは両者をある程度組合わせて行うことが好ましい。ライ
ブラリが応答装置にとって利用可能になった際には、既に一般的な名前が、AS
Rアプリケーションによる取得用に録音、圧縮、記憶及び索引付けされている。
名前のデータベースを考えれば、所定の名前は1つ以上の写しの組を有すること
ができ、これは名前の音声的な綴りである。このことは、方言、地域の音声パタ
ーン、話者の出身、等の違いにより、所定の名前に異なる発音が有りうる場合に
望ましい。このため本発明によれば、一組のオブジェクトインスタンスによって
、例えば"Smith"のような所定の一般的な名前を識別することができ、これらの
各インスタンスは名前の異なる発音を反映したものである。
、システムが使用する"did you say"プロンプト及び他のこうしたプロンプトに
対して自分の名前の入力をすることが免除される。所定のユーザが、自分に関連
するメールボックス用に自分の名前を録音していない場合でも、テキスト−音声
処理に頼らずに、システムが自然な音の音声応答(特にユーザの名前)を返すこ
とができる。
イル(例えばwavファイル)として記憶する。しかし本発明は特定の圧縮技法に
限定されるものではない。このため圧縮は、ADPCM、PCM、μ-law、a-l
aw、あるいは他の既知の、または後に開発されるいずれの圧縮ルーチンにも、も
とづくことができる。これに加えて特定のファイルを、例えばアレイとして、リ
ンクリストとして、等のようないずれの好都合なフォーマットに整えることがで
きる。ライブラリのサイズが大きくなるほど、リレーショナルデータベース管理
システム(RDBMS)を使用して、ライブラリを構成するファイルの記憶、検
索、サーブ(要求処理)を管理することが好ましい。1つの実施例では、ディレ
クトリサービス(例えばLDAP)をフロントエンドとして含むリレーショナル
データベース内にオーディオファイルを記憶する。これにより、インターネット
またはイントラネットのようなネットワーク経由で、ライブラリにアクセスする
ことができるようになる。リレーショナルデータベースは、Oracle、Sybase、ま
たは他のいずれのサードパーティ販売元からも供給を受けることができる。
ットフォーム30a〜30nが、ディレクトリサーバを通してライブラリに選択
的にアクセスする。プラットフォーム30は、コンピュータネットワーク32経
由でディレクトリサーバにアクセスする。マネージャ34はライブラリへのアク
セスを制御し管理するものであり、これはサーバコンピュータとすることができ
る。
ーチャートである。このルーチンは、"did you say −"メッセージを発行すべく
要求された際にステップ40から始まる。しかし、本実施例は単なる例示であり
、本発明の範疇に属する、任意数の他のプロンプトのために、あるいは他の目的
のためにライブラリにアクセスできることは、当業者にとって明らかである。ス
テップ42では、ユーザ自身の声のオーディオファイルが、このプロンプトを満
足するか否かを特定するためのテストを実行する。満足する場合には、このルー
チンはステップ44に進み、ユーザが予め録音した名前でプロンプトを発行する
。しかしステップ42でのテストの結果が否(N)である場合には、このルーチ
ンはステップ45に進んで、所望の名前を具えたオブジェクトがライブラリ内で
利用可能か否かをテストする。利用可能な場合には、このルーチンはステップ4
6に進んで、1つ以上のオブジェクトの組を名前ライブラリから検索する。上述
のように、名前ライブラリを前記プラットフォーム、あるいは遠隔的に(例えば
コンピュータネットワーク上で)アクセス可能なプラットフォームに関連づける
ことができる。また検索ステップ中に、このルーチンはオブジェクトの写し(所
定の名前についての)を文法解析して、この名前に対して所定の発音が使用され
ることを保証することもできる。ステップ48では、必要に応じてオブジェクト
を組み立てる。通常このステップは、名と姓との連結(ボイスメールの場合)を
含む。ステップ50では、組み立てた構成要素をプロンプトとして出力する。
ライブラリから入手できないことを示す否(N)である場合には、このルーチン
は52に進んで、名前のテキスト(文字列)−音声の変換を生成する。ステップ
54では、このルーチンはテキスト−音声プロセッサを用いて、"did you say"
プロンプトを出力する。しかし以上のことから明らかなように、テキスト−音声
のプロセスは、最終手段として使用するに過ぎず、これにおいてはユーザも名前
ライブラリも、プロンプトを完成させるためのオーディオファイルを提供するこ
とができない。
応じて利用可能にすることができる。これにより、ボイスメール機能を提供する
所定の第1応答装置が一組目のオブジェクト(一組の固有名詞に対応する)を利
用可能にして、音声ベースのオーダエントリ(注文受付け)兼確認システムが二
組目のオブジェクト(一組の製品名に対応する)を利用可能にすることができる
。本発明の特定の応用がボイスメール、オーダエントリ、等に限定されないこと
は、当業者にとって明らかである。名前ライブラリのサイズが大きくなるほど、
一般的名前ライブラリの恩恵を受ける多種のアプリケーションがありうる。
ることが好ましい。このため、本発明の好適な一実施例は、汎用コンピュータの
ランダムアクセスメモリ内に存在するコードモジュール内の一組の命令(プログ
ラムコード)として実現される。コンピュータの要求があるまで、これら一組の
命令を、他のコンピュータメモリ、例えばハードディスクドライブ、あるいは光
ディスク(結果的にCD−ROMドライブで使用する)またはフロッピー(登録
商標)ディスク(結果的にフロッピーディスクドライブで使用する)のようなリ
ムーバブル(交換可能)メモリ内に記憶するか、あるいはインターネットまたは
他のコンピュータネットワーク経由でダウンロードすることができる。これに加
えて、以上の記述では、これら種々の方法を慣例のように、選択的に動作するコ
ンピュータで実現し、あるいはソフトウエアで再構成しているが、こうした方法
をハードウエア、ファームウエア、あるいは要求される方法のステップを実行す
べく、より特化した機器または装置によって実施しうることは、当業者が認識し
うることである。
ュータのブロック図である。
図である。
にアクセス可能にした本発明の変形例の簡略化ブロック図である。
ローチャートである。
Claims (18)
- 【請求項1】 プロセッサと、電話に応答する手段と、挨拶を再生する手段と、
名前を要求する手段と、音声入力事項を確認する手段と、発呼者を所定の内線に
転送する手段とを有する自動応答装置において、この自動応答装置が: 各々のオブジェクトが名前を表現する多数のオブジェクトオーディオファイル
を記憶した一般的名前ライブラリと; 前記プロセッサによって操作可能であり、音声入力事項を確認する要求に応答
し、(a)前記音声入力事項が自分の名前を録音したユーザを識別するものである
か否かを特定して、(b)前記特定の結果が否である場合には、1つ以上のオブジ
ェクトの組を前記一般的名前ライブラリから選択的に検索して、(c)前記1つ以
上のオブジェクトの組を出力する制御手段と を具えることを特徴とする自動応答装置。 - 【請求項2】 前記1つ以上のオブジェクトを出力するステップが、少なくとも
第1及び第2オブジェクトを列に組み立てるステップを含むことを特徴とする請
求項1に記載の自動応答装置。 - 【請求項3】 前記第1及び第2オブジェクトを、連結によって組み立てること
を特徴とする請求項2に記載の自動応答装置。 - 【請求項4】 前記第1及び第2オブジェクトがそれぞれ、被呼出しパーティの
名及び姓であることを特徴とする請求項3に記載の自動応答装置。 - 【請求項5】 前記制御手段がさらに、所定のオブジェクトを前記一般的名前ラ
イブラリから入手できない場合に、音声入力事項のテキスト−音声の変換を生成
することを含むことを特徴とする請求項1に記載の自動応答装置。 - 【請求項6】 前記オーディオファイルを、前記一般的名前ライブラリ内に圧縮
フォーマットで記憶することを特徴とする請求項1に記載の自動応答装置。 - 【請求項7】 プロセッサと、電話に応答する手段と、挨拶を再生する手段と、
名前を要求する手段と、音声入力事項を確認する手段と、発呼者を所定の内線に
転送する手段とを具えた少なくとも1つの自動応答装置と; 各々が名前を表現する多数のオブジェクトオーディオファイルを記憶した一般
的名前ライブラリと; 音声入力事項を確認する要求に応答し、(a)前記音声入力事項が自分の名前を
録音したシステムユーザを識別するものであるか否かを特定して、(b)前記特定
の結果が否である場合には、1つ以上のオブジェクトの組を前記一般的名前ライ
ブラリから選択的に検索して、(c)前記1つ以上のオブジェクトの組を出力する
制御手段と を具えることを特徴とするシステム。 - 【請求項8】 前記1つ以上のオブジェクトを出力するステップが、少なくとも
第1及び第2オブジェクトを列に組み立てるステップを含むことを特徴とする請
求項7に記載のシステム。 - 【請求項9】 前記第1及び第2オブジェクトを、連結によって組み立てること
を特徴とする請求項8に記載のシステム。 - 【請求項10】 前記一般的名前ライブラリを、前記自動応答装置に隣接して配
置したことを特徴とする請求項7に記載のシステム。 - 【請求項11】 前記一般的名前ライブラリを、前記自動応答装置から遠隔的に
配置して、コンピュータネットワークを介して該ライブラリにアクセスすること
を特徴とする請求項7に記載のシステム。 - 【請求項12】 さらに少なくとも第2自動応答装置を含み、前記第1及び第2
自動応答装置が、前記一般的名前ライブラリを共用することを特徴とする請求項
7に記載のシステム。 - 【請求項13】 前記オーディオファイルを、前記一般的名前ライブラリ内に圧
縮形態で記憶することを特徴とする請求項7に記載のシステム。 - 【請求項14】 音声入力事項を確認する要求に応答して、ユーザが自分の名前
を予め録音しているか否かを特定するステップと; 前記ユーザが自分の名前を予め録音している場合には、前記ユーザが予め録音
した名前を用いて前記音声入力事項を確認するステップと; 前記ユーザが自分の名前を予め録音していない場合には、一般的な名前オブジ
ェクトの一般的名前ライブラリから入手できる情報を用いて、前記音声入力事項
を確認することができるか否かを特定するステップと; 前記情報を用いて前記音声入力事項を確認することができる場合には、1つ以
上のオブジェクトの組を、前記一般的名前ライブラリから検索するステップと; 前記オブジェクトの組から得られた所定の名前を出力するステップと を具えることを特徴とする音声入力事項の確認方法。 - 【請求項15】 前記所定の名前を出力するステップがさらに、前記所定の名前
を、少なくとも第1及び第2オブジェクトから組み立てるステップを含むことを
特徴とする請求項14に記載の方法。 - 【請求項16】 前記第1及び第2オブジェクトを、連結によって組み立てるこ
とを特徴とする請求項15に記載の方法。 - 【請求項17】 さらに、 一般的な名前オブジェクトの一般的名前ライブラリから入手できる情報を用い
て前記音声入力事項を確認することができない場合には、前記音声入力事項のテ
キスト−音声の変換を生成するステップと; 前記テキスト−音声の変換を出力するステップと を含むことを特徴とする請求項14に記載の方法。 - 【請求項18】 前記オブジェクトのうちの少なくとも1つが、関連する一組の
オブジェクトインスタンスを有し、各オブジェクトインスタンスが名前の所定の
発音を表現するものであることを特徴とする請求項14に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/276,928 US6502075B1 (en) | 1999-03-26 | 1999-03-26 | Auto attendant having natural names database library |
US09/276,928 | 1999-03-26 | ||
PCT/EP2000/002754 WO2000059193A1 (en) | 1999-03-26 | 2000-03-23 | Auto attendant with library of recognisable names |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003529229A true JP2003529229A (ja) | 2003-09-30 |
Family
ID=23058677
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000608579A Pending JP2003529229A (ja) | 1999-03-26 | 2000-03-23 | 認識可能な名前ライブラリを有する自動応答装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US6502075B1 (ja) |
EP (1) | EP1084563A1 (ja) |
JP (1) | JP2003529229A (ja) |
KR (1) | KR20010052414A (ja) |
CN (1) | CN1336069A (ja) |
WO (1) | WO2000059193A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011511537A (ja) * | 2008-01-24 | 2011-04-07 | アルカテル−ルーセント ユーエスエー インコーポレーテッド | 発話名の発音の音声版を提供するシステムおよび方法 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050119875A1 (en) * | 1998-03-25 | 2005-06-02 | Shaefer Leonard Jr. | Identifying related names |
US7013280B2 (en) * | 2001-02-27 | 2006-03-14 | International Business Machines Corporation | Disambiguation method and system for a voice activated directory assistance system |
CN100592385C (zh) * | 2004-08-06 | 2010-02-24 | 摩托罗拉公司 | 用于对多语言的姓名进行语音识别的方法和系统 |
US8005849B2 (en) * | 2006-08-31 | 2011-08-23 | Red Hat, Inc. | Database access server with reformatting |
CA2795812A1 (en) * | 2010-04-07 | 2011-10-13 | Max Value Solutions INTL, LLC | Method and system for name pronunciation guide services |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5210520A (en) * | 1987-07-15 | 1993-05-11 | Housley Todd B | Programmable doorbell control |
WO1993013518A1 (en) * | 1991-12-31 | 1993-07-08 | Digital Sound Corporation | Voice controlled messaging system and processing method |
US5483579A (en) * | 1993-02-25 | 1996-01-09 | Digital Acoustics, Inc. | Voice recognition dialing system |
NZ294296A (en) * | 1994-10-25 | 1999-04-29 | British Telecomm | Speech recognition for voice operated telephone services includes comparison against stored lists of expected words |
US5651055A (en) * | 1995-06-29 | 1997-07-22 | Lucent Technologies Inc. | Digital secretary |
US5794249A (en) * | 1995-12-21 | 1998-08-11 | Hewlett-Packard Company | Audio/video retrieval system that uses keyword indexing of digital recordings to display a list of the recorded text files, keywords and time stamps associated with the system |
US5892814A (en) * | 1995-12-29 | 1999-04-06 | Northern Telecom Limited | Flexible, tapeless, personalized auto-attendant telephone |
JPH09292255A (ja) * | 1996-04-26 | 1997-11-11 | Pioneer Electron Corp | ナビゲーション方法及び装置 |
FI101333B (fi) * | 1996-09-02 | 1998-05-29 | Nokia Mobile Phones Ltd | Puhekomennoilla ohjattava telepäätelaite |
US5875448A (en) * | 1996-10-08 | 1999-02-23 | Boys; Donald R. | Data stream editing system including a hand-held voice-editing apparatus having a position-finding enunciator |
US6021181A (en) * | 1997-02-24 | 2000-02-01 | Wildfire Communications, Inc. | Electronic voice mail message handling system |
US6041300A (en) | 1997-03-21 | 2000-03-21 | International Business Machines Corporation | System and method of using pre-enrolled speech sub-units for efficient speech synthesis |
US6173266B1 (en) * | 1997-05-06 | 2001-01-09 | Speechworks International, Inc. | System and method for developing interactive speech applications |
US6075844A (en) * | 1997-11-18 | 2000-06-13 | At&T Corp. | Messaging system with remote messaging recording device where the message is routed based on the spoken name of the recipient |
-
1999
- 1999-03-26 US US09/276,928 patent/US6502075B1/en not_active Expired - Lifetime
-
2000
- 2000-03-23 CN CN00800895A patent/CN1336069A/zh active Pending
- 2000-03-23 KR KR1020007013351A patent/KR20010052414A/ko not_active Application Discontinuation
- 2000-03-23 JP JP2000608579A patent/JP2003529229A/ja active Pending
- 2000-03-23 EP EP00922564A patent/EP1084563A1/en not_active Withdrawn
- 2000-03-23 WO PCT/EP2000/002754 patent/WO2000059193A1/en not_active Application Discontinuation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011511537A (ja) * | 2008-01-24 | 2011-04-07 | アルカテル−ルーセント ユーエスエー インコーポレーテッド | 発話名の発音の音声版を提供するシステムおよび方法 |
Also Published As
Publication number | Publication date |
---|---|
EP1084563A1 (en) | 2001-03-21 |
CN1336069A (zh) | 2002-02-13 |
KR20010052414A (ko) | 2001-06-25 |
US6502075B1 (en) | 2002-12-31 |
WO2000059193A1 (en) | 2000-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0780829B1 (en) | Method for automatic speech recognition in telephony | |
JP3873131B2 (ja) | 電話メッセージの転記のために使用される編集システム及び方法 | |
US5651055A (en) | Digital secretary | |
EP0735736B1 (en) | Method for automatic speech recognition of arbitrary spoken words | |
US5797124A (en) | Voice-controlled voice mail having random-order message retrieval based on played spoken identifier list | |
US6651042B1 (en) | System and method for automatic voice message processing | |
US4623761A (en) | Telephone operator voice storage and retrieval system | |
TW401673B (en) | System and method for automatic call and data transfer processing | |
US6370237B1 (en) | Voice activated dialing with reduced storage requirements | |
US20040021765A1 (en) | Speech recognition system for managing telemeetings | |
US7382867B2 (en) | Variable data voice survey and recipient voice message capture system | |
US6148285A (en) | Allophonic text-to-speech generator | |
US6397182B1 (en) | Method and system for generating a speech recognition dictionary based on greeting recordings in a voice messaging system | |
US6502075B1 (en) | Auto attendant having natural names database library | |
AU763704B2 (en) | A transaction processing system with voice recognition and verification | |
WO2005011242A1 (en) | Annotations addition to documents rendered via text-to-speech conversion over a voice connection | |
US7206390B2 (en) | Simulated voice message by concatenating voice files | |
Billi et al. | Interactive voice technology at work: The CSELT experience | |
US20020091530A1 (en) | Interactive voice response system and method having voice prompts with multiple voices for user guidance | |
JPH1125112A (ja) | 対話音声処理方法及び装置、記録媒体 | |
US6947969B2 (en) | System and method for accessing voice messaging system data | |
US7470850B2 (en) | Interactive voice response method and apparatus | |
EP0942575A2 (en) | Adaptive telephone answering system | |
AU2003100447B4 (en) | Automated transcription process | |
Chatzi et al. | " Wire Communications Laboratory (WCL), Electrical & Computer Engineering Dept. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070323 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20070323 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070711 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090724 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090804 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100202 |