JP2003529229A - 認識可能な名前ライブラリを有する自動応答装置 - Google Patents

認識可能な名前ライブラリを有する自動応答装置

Info

Publication number
JP2003529229A
JP2003529229A JP2000608579A JP2000608579A JP2003529229A JP 2003529229 A JP2003529229 A JP 2003529229A JP 2000608579 A JP2000608579 A JP 2000608579A JP 2000608579 A JP2000608579 A JP 2000608579A JP 2003529229 A JP2003529229 A JP 2003529229A
Authority
JP
Japan
Prior art keywords
name
objects
library
voice input
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000608579A
Other languages
English (en)
Inventor
エス テリー キム
イェー フォスター ピーター
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Electronics NV filed Critical Philips Electronics NV
Publication of JP2003529229A publication Critical patent/JP2003529229A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/30Aspects of automatic or semi-automatic exchanges related to audio recordings in general
    • H04M2203/306Prerecordings to be used during a voice call
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/30Aspects of automatic or semi-automatic exchanges related to audio recordings in general
    • H04M2203/308Personal name recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4931Directory assistance systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/527Centralised call answering arrangements not requiring operator intervention
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/533Voice mail systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Sub-Exchange Stations And Push- Button Telephones (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

(57)【要約】 自動電話交換プラットフォーム(例えば自動応答装置)は、これに関連する一般的名前ライブラリを有するものである。一般的名前ライブラリは、前記プラットフォームが有するか、あるいは前記プラットフォーム上で実行される電話ベースのASRアプリケーションによって認識されるべきものと想定される一般的なオブジェクトを表現するオーディオファイルから成る。ASRアプリケーションがオブジェクトファイル(例えばメールボックスに関連するユーザの名前)の再生を要求する際にいつも、システムはまず、ユーザが自分の声のサンプルを録音しているか否かを特定する。録音している場合には、ユーザの実際の声を出力する。しかしユーザの実際の声のサンプルが利用不可能であるか、あるいは録音されていない場合には、ASRアプリケーションはデータベースにアクセスして、オブジェクトファイルを検索して、このオブジェクトファイルから適切な出力列を構築する。

Description

【発明の詳細な説明】
【0001】 (技術分野) 本発明は概して、自動音声認識(ASR)用の応用品に関するものであり、特
に情報の検索、再生及びナビゲーション用にASRを使用する自動電話交換プラ
ットフォーム(台)に関するものである。
【0002】 (背景技術) 慣例のボイスメールシステムは、再生及びアナウンス用にユーザの声を録音す
る能力を有している。これにより、例えば所定の被呼出しパーティが応答できな
い際に、被呼出しパーティの実際の声でプロンプトを再生するようにシステムを
制御することができる。この動作は通常、ユーザが録音したオーディオファイル
を記憶し、そして所定事象の際にこのファイルを検索することによって達成され
る。上述の再生技法が所望されているが、実際には多くのユーザが自分の発声情
報を記録する時間を取ることがない。実際に、こうしたシステムを病院またはホ
テルで使用するような一部の環境では、ユーザが期間中にシステムへのアクセス
を要求することがなく、このためユーザが自分の発声情報をシステム内に記録す
る動機を有しない。これらの場合においては、ユーザ識別情報の再生は、2つの
方法のうち1つのみによって達成することができる。これらの方法は、オペレー
タにユーザの名前を個別に記憶させる仕事を引き受けさせて、かなり労働集約型
となりうる方法か、あるいはユーザの名前をアナウンスする他の手段をデフォル
トとしてシステムに強制する方法のいずれかである。通常、このデフォルト動作
はテキスト(文字列)−音声プロセッサによって実行され、これは許容しがたい
結果をもたらす。特にテキスト−音声プロセッサは、所定の名前、とりわけ外国
に由来する名前については正確な発音を提供することができない。本発明はこの
問題に応えるものである。
【0003】 (発明の開示) 本発明の目的は、関連する一般的名前ライブラリを有する自動電話交換プラッ
トフォーム(例えば自動応答装置)を提供することにある。一般的名前ライブラ
リは、この交換プラットフォームに関連するか、あるいはこの交換プラットフォ
ーム上で動作する電話ベースのASRアプリケーションによって認識されるべき
ものと想定される一般的なオブジェクト(例えば名前、製品識別子、色、等)を
表現するオーディオファイルの大規模データベースを具えている。個々のオーデ
ィオファイルは圧縮フォーマットで記憶されることが好ましい。ASR応用品が
オブジェクトファイル(例えばユーザの名前)の再生を必要とする際にいつも、
システムはまず、ユーザが必要な発声サンプルを録音しているか否かを特定する
。録音している場合には、ユーザの実際の発声を出力する。しかしユーザの実際
の発声サンプルが利用不可能な場合、あるいは録音されていない場合には、AS
Rアプリケーションはデータベースにアクセスしてオブジェクトファイルを検索
して、これから適切な出力列を構築する。
【0004】 これにより例えば、呼出しパーティが"Mary Smith(メリースミス)"さんと話
したいと望み、かつこの人が応答できない場合には、ボイスメールシステムが"y
our call to 'Mary Smith' cannot be completed, if you'd like to leave a m
essage, press 1"(「メリースミスさんをお呼びすることができませんでした。
メッセージがございましたら1を押して下さい。」)と応答する。このメッセー
ジでは、ユーザ自身の声の'Mary Smith'のプロンプトが存在しない場合には、シ
ステムが'Mary'及び'Smith'という2つの別個のオブジェクトエントリを一般的
名前ライブラリ内で検索して、これらのオブジェクトを連結させて、'Mary Smit
h'を出力する。利用可能なライブラリオブジェクトが使用できないか、あるいは
不十分なものである場合には、テキスト−音声プロセッサをバックアップのアナ
ウンスメカニズムとして使用することができる。
【0005】 一般的名前ライブラリを中央に配置して、一組の応答装置が、インターネット
、イントラネット等のデータネットワーク経由でこれにアクセスすることができ
る。このライブラリは個々の発呼に応じてアクセスすることができるか、あるい
はライブラリ内のオブジェクトの副集合を、所定の応答装置にダウンロードする
ことができる。データベース内のエントリ数が増大すればするほど、ライブラリ
の集中統括管理が好ましくなる。
【0006】 このため本発明の好適例によれば、所望の出力の個別構成要素オブジェクトを
名前ライブラリから検索して、再組み立て(通常、連結によって)して出力する
。名前ライブラリは、私設構内交換機へのフロントエンド(前処理)及びバック
エンド(後処理)としての特定のユーティリティを有して、ディレクトリ支援、
ボイスメールのルーティング(ルート割り当て)、等を行う。
【0007】 以上のことは、本発明の目的及び特徴に該当することについてのいくつかの要
点を述べたものである。これらの目的は単に、本発明の明らかな特徴及び応用を
表わすものとして構成したものである。本明細書に開示した発明を、異なる方法
で応用するか、あるいは変形することによって、幾多の有益な結果を達成するこ
とができる。従って、本発明をより良く理解するための詳細な説明及び本発明の
他の目的については、以下の好適な実施例で記述する。
【0008】 (発明を実施するための最良の形態) 以下、本発明の実施例について図面を参照して説明する。 音声認識を電話ベースの入力に応用することは、既知の従来技法である。背景
事項として、図1に、本発明を実施することができる既知のコンピュータアーキ
テクチャを示す。コンピュータ100は、多数の電話回線110上で、ユーザと
の声による対話に使用するものである。コンピュータ100は、発呼者が言った
ことを自動的に認識して、発呼者と対話するためのプロンプトを再生することが
できる。コンピュータ100は、シングルボードコンピュータのような汎用コン
ピュータにデータバス125上で結合された1つ以上の電話インタフェース13
0を含む。汎用コンピュータ120は、汎用プロセッサ122と、DRAMのよ
うな作業メモリ124と、磁気ディスクのような不揮発性プログラムメモリ12
6とを含む。この代わりに、プログラムメモリが他のコンピュータ上に存在して
、データネットワーク上でこれにアクセスすることもできる。電話インタフェー
ス130は、発呼者がコンピュータと対話するための電話回線110へのインタ
フェースを提供するものである。また1つ以上のDSPプラットフォーム140
も、データバス125上で汎用コンピュータ120に結合されている。DSPプ
ラットフォーム140は、好ましくはTDMバスである第2バス150上で電話
インタフェースに結合されている。TDMバス150は、DSPプラットフォー
ム140と電話インタフェース130との間で、ディジタル化した音声を搬送す
ることができる。各DSPプラットフォーム140は、多数のDSPプロセッサ
142、作業メモリ144、データバス125へのデータバスインタフェース1
46、及びデータバス150への音声インタフェース148を含む。汎用プロセ
ッサ122はインテル社のペンティアム、データバス125はISAバス、DS
Pプラットフォーム140はダイアロジック社製造のAntaresDSPプラットフ
ォーム(モデル2000/30、2000/50、6000)、そしてTDMバス150は、サンプ
リングレート8kHzでサンプリングして8ビットサンプルに符号化した電話信号
を搬送するSCSIバスである。各AntaresDSPプラットフォームは、4つの
DSPプロセッサ122、テキサスインスツルメンツ社製造のTMS320C1プロセッ
サを含む。作業メモリ144は、DSP1個当り512KBのスタティックRAM、
及び4個のDSPプロセッサ142が共用する4MBのダイナミックRAMである
。電話インタフェース130は、いくつかの異なるタイプのもの、例えばダイア
ロジック社製造のインタフェース(型番D41ESC、D160SC、及びD112SC)である。
D112SCインタフェースは、例えば12本のアナログ電話回線をサポートする。D
SPプラットフォーム上の各DSPプロセッサは、所定の電話チャネルに関連し
ていることが好ましい。
【0009】 多くの音声ベースの電話アプリケーションにおいて、発呼者は電話発信の時間
の比較的小さい断片中に話しているに過ぎない。残りの時間は、プロンプトまた
は他の情報を発呼者に対して再生すること、あるいは、例えば発呼者のために情
報を検索する間のような無音の休止期間によって消費される。このため所望すれ
ば、発呼者が話しているか、あるいはプロンプトまたは情報を再生しているかに
かかわわらず、1個のDSPを各電話の対話用に割り当てることができる。
【0010】 図2に、本発明の好適な実施例の簡略化ブロック図を示す。本実施例では、自
動応答プラットフォーム10が私設構内交換機(PBX)内に設けられている。
プラットフォーム10は、スイッチ12、コントローラ14、Vpro/Continuous
speech recognition(連続音声認識)、VR/Continuous speech recognition、ま
たはSpeech Wave Standard speech recognition(音声波標準音声認識)のよう
なASRアプリケーション16を含む種々のアプリケーションを具え、これらの
アプリケーションはすべて、テキサス州ダラスのボイスコントロールシステム社
から入手できる。もちろん、所定の音声認識アプリケーションのいずれを利用す
ることもできる。また前記プラットフォームは、音声メッセージの記憶、検索及
び転送用のボイスメールアプリケーション18を含む。
【0011】 この応答装置は、種々のオペレータ扱い機能を提供するものである。これによ
り例えば、応答装置が入り発呼に応答して、冒頭の挨拶を再生して、名前/内線
を要求して、この発呼をこの内線に転送する。応答装置が発呼に応答する際に、
外線発呼者は通常、名前用のプロンプトで入力待ちされる。名前の確認上、所定
の外線発呼者は、対応する内線に転送される。既知の従来法では、応答装置は通
常、"did you say −"(「−でよろしいですか。」)というプロンプトで名前の
確認を助長する。システムのユーザは通常、自分の"did you say −"プロンプト
を録音及び再録音する目的で、ボイスメールシステムへのアクセス権を有してい
る。
【0012】 本発明によれば、自動応答プラットフォームはさらに、一般的名前ライブラリ
25を含む。ライブラリ25は圧縮オーディオファイル27のデータベースであ
ることが好ましく、各ファイルがASRによって認識されるべきオブジェクトに
対応していることが好ましい。これにより、単なる代表例としてのボイスメール
の例では、ファイル27は一般的的な名前を多数収集したものから成る。この収
集はオフラインの方法、即ちコンピュータエントリ(タイプ入力)、音声入力事
項(発声入力)、あるいは両者をある程度組合わせて行うことが好ましい。ライ
ブラリが応答装置にとって利用可能になった際には、既に一般的な名前が、AS
Rアプリケーションによる取得用に録音、圧縮、記憶及び索引付けされている。
名前のデータベースを考えれば、所定の名前は1つ以上の写しの組を有すること
ができ、これは名前の音声的な綴りである。このことは、方言、地域の音声パタ
ーン、話者の出身、等の違いにより、所定の名前に異なる発音が有りうる場合に
望ましい。このため本発明によれば、一組のオブジェクトインスタンスによって
、例えば"Smith"のような所定の一般的な名前を識別することができ、これらの
各インスタンスは名前の異なる発音を反映したものである。
【0013】 一般的な名前をライブラリ25内にオフラインで作成して記憶することにより
、システムが使用する"did you say"プロンプト及び他のこうしたプロンプトに
対して自分の名前の入力をすることが免除される。所定のユーザが、自分に関連
するメールボックス用に自分の名前を録音していない場合でも、テキスト−音声
処理に頼らずに、システムが自然な音の音声応答(特にユーザの名前)を返すこ
とができる。
【0014】 1つの実施例では、名前オブジェクトから成るオーディオファイルを圧縮ファ
イル(例えばwavファイル)として記憶する。しかし本発明は特定の圧縮技法に
限定されるものではない。このため圧縮は、ADPCM、PCM、μ-law、a-l
aw、あるいは他の既知の、または後に開発されるいずれの圧縮ルーチンにも、も
とづくことができる。これに加えて特定のファイルを、例えばアレイとして、リ
ンクリストとして、等のようないずれの好都合なフォーマットに整えることがで
きる。ライブラリのサイズが大きくなるほど、リレーショナルデータベース管理
システム(RDBMS)を使用して、ライブラリを構成するファイルの記憶、検
索、サーブ(要求処理)を管理することが好ましい。1つの実施例では、ディレ
クトリサービス(例えばLDAP)をフロントエンドとして含むリレーショナル
データベース内にオーディオファイルを記憶する。これにより、インターネット
またはイントラネットのようなネットワーク経由で、ライブラリにアクセスする
ことができるようになる。リレーショナルデータベースは、Oracle、Sybase、ま
たは他のいずれのサードパーティ販売元からも供給を受けることができる。
【0015】 本発明の広域分散型の応用を図3に示す。本実施例では、一組の自動応答プラ
ットフォーム30a〜30nが、ディレクトリサーバを通してライブラリに選択
的にアクセスする。プラットフォーム30は、コンピュータネットワーク32経
由でディレクトリサーバにアクセスする。マネージャ34はライブラリへのアク
セスを制御し管理するものであり、これはサーバコンピュータとすることができ
る。
【0016】 図4は、名前ライブラリに選択的にアクセスする音声再生ルーチン簡略化フロ
ーチャートである。このルーチンは、"did you say −"メッセージを発行すべく
要求された際にステップ40から始まる。しかし、本実施例は単なる例示であり
、本発明の範疇に属する、任意数の他のプロンプトのために、あるいは他の目的
のためにライブラリにアクセスできることは、当業者にとって明らかである。ス
テップ42では、ユーザ自身の声のオーディオファイルが、このプロンプトを満
足するか否かを特定するためのテストを実行する。満足する場合には、このルー
チンはステップ44に進み、ユーザが予め録音した名前でプロンプトを発行する
。しかしステップ42でのテストの結果が否(N)である場合には、このルーチ
ンはステップ45に進んで、所望の名前を具えたオブジェクトがライブラリ内で
利用可能か否かをテストする。利用可能な場合には、このルーチンはステップ4
6に進んで、1つ以上のオブジェクトの組を名前ライブラリから検索する。上述
のように、名前ライブラリを前記プラットフォーム、あるいは遠隔的に(例えば
コンピュータネットワーク上で)アクセス可能なプラットフォームに関連づける
ことができる。また検索ステップ中に、このルーチンはオブジェクトの写し(所
定の名前についての)を文法解析して、この名前に対して所定の発音が使用され
ることを保証することもできる。ステップ48では、必要に応じてオブジェクト
を組み立てる。通常このステップは、名と姓との連結(ボイスメールの場合)を
含む。ステップ50では、組み立てた構成要素をプロンプトとして出力する。
【0017】 ステップ45でのテストの結果が、1つ以上の必要な名前オブジェクトが名前
ライブラリから入手できないことを示す否(N)である場合には、このルーチン
は52に進んで、名前のテキスト(文字列)−音声の変換を生成する。ステップ
54では、このルーチンはテキスト−音声プロセッサを用いて、"did you say"
プロンプトを出力する。しかし以上のことから明らかなように、テキスト−音声
のプロセスは、最終手段として使用するに過ぎず、これにおいてはユーザも名前
ライブラリも、プロンプトを完成させるためのオーディオファイルを提供するこ
とができない。
【0018】 本発明によれば、名前ライブラリまたはその一部分を、自動応答装置が必要に
応じて利用可能にすることができる。これにより、ボイスメール機能を提供する
所定の第1応答装置が一組目のオブジェクト(一組の固有名詞に対応する)を利
用可能にして、音声ベースのオーダエントリ(注文受付け)兼確認システムが二
組目のオブジェクト(一組の製品名に対応する)を利用可能にすることができる
。本発明の特定の応用がボイスメール、オーダエントリ、等に限定されないこと
は、当業者にとって明らかである。名前ライブラリのサイズが大きくなるほど、
一般的名前ライブラリの恩恵を受ける多種のアプリケーションがありうる。
【0019】 図4の機能を提供する制御ルーチンは、コンピュータソフトウエアで実現され
ることが好ましい。このため、本発明の好適な一実施例は、汎用コンピュータの
ランダムアクセスメモリ内に存在するコードモジュール内の一組の命令(プログ
ラムコード)として実現される。コンピュータの要求があるまで、これら一組の
命令を、他のコンピュータメモリ、例えばハードディスクドライブ、あるいは光
ディスク(結果的にCD−ROMドライブで使用する)またはフロッピー(登録
商標)ディスク(結果的にフロッピーディスクドライブで使用する)のようなリ
ムーバブル(交換可能)メモリ内に記憶するか、あるいはインターネットまたは
他のコンピュータネットワーク経由でダウンロードすることができる。これに加
えて、以上の記述では、これら種々の方法を慣例のように、選択的に動作するコ
ンピュータで実現し、あるいはソフトウエアで再構成しているが、こうした方法
をハードウエア、ファームウエア、あるいは要求される方法のステップを実行す
べく、より特化した機器または装置によって実施しうることは、当業者が認識し
うることである。
【図面の簡単な説明】
【図1】 多数の電話回線からの音声入力認識用のマイクロプロセッサ型コンピ
ュータのブロック図である。
【図2】 本発明の好適な一実施例を自動応答装置と組合わせた簡略化ブロック
図である。
【図3】 一般的名前ライブラリを集中管理して、一組の応答装置によってこれ
にアクセス可能にした本発明の変形例の簡略化ブロック図である。
【図4】 名前ライブラリに選択的にアクセスする音声再生ルーチンの簡略化フ
ローチャートである。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04Q 3/58 101 G10L 3/00 551A (72)発明者 ピーター イェー フォスター オランダ国 5656 アーアー アインドー フェン プロフ ホルストラーン 6 Fターム(参考) 5D015 AA03 BB01 KK02 KK04 LL12 5D045 AA01 5K015 AA06 GA07 HA01 5K024 AA76 BB01 BB02 CC01 DD04 EE09 FF06 GG03 GG07 5K049 AA01 AA15 BB04 BB12 CC10 CC11 EE02 EE13 FF01 GG07 KK01

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 プロセッサと、電話に応答する手段と、挨拶を再生する手段と、
    名前を要求する手段と、音声入力事項を確認する手段と、発呼者を所定の内線に
    転送する手段とを有する自動応答装置において、この自動応答装置が: 各々のオブジェクトが名前を表現する多数のオブジェクトオーディオファイル
    を記憶した一般的名前ライブラリと; 前記プロセッサによって操作可能であり、音声入力事項を確認する要求に応答
    し、(a)前記音声入力事項が自分の名前を録音したユーザを識別するものである
    か否かを特定して、(b)前記特定の結果が否である場合には、1つ以上のオブジ
    ェクトの組を前記一般的名前ライブラリから選択的に検索して、(c)前記1つ以
    上のオブジェクトの組を出力する制御手段と を具えることを特徴とする自動応答装置。
  2. 【請求項2】 前記1つ以上のオブジェクトを出力するステップが、少なくとも
    第1及び第2オブジェクトを列に組み立てるステップを含むことを特徴とする請
    求項1に記載の自動応答装置。
  3. 【請求項3】 前記第1及び第2オブジェクトを、連結によって組み立てること
    を特徴とする請求項2に記載の自動応答装置。
  4. 【請求項4】 前記第1及び第2オブジェクトがそれぞれ、被呼出しパーティの
    名及び姓であることを特徴とする請求項3に記載の自動応答装置。
  5. 【請求項5】 前記制御手段がさらに、所定のオブジェクトを前記一般的名前ラ
    イブラリから入手できない場合に、音声入力事項のテキスト−音声の変換を生成
    することを含むことを特徴とする請求項1に記載の自動応答装置。
  6. 【請求項6】 前記オーディオファイルを、前記一般的名前ライブラリ内に圧縮
    フォーマットで記憶することを特徴とする請求項1に記載の自動応答装置。
  7. 【請求項7】 プロセッサと、電話に応答する手段と、挨拶を再生する手段と、
    名前を要求する手段と、音声入力事項を確認する手段と、発呼者を所定の内線に
    転送する手段とを具えた少なくとも1つの自動応答装置と; 各々が名前を表現する多数のオブジェクトオーディオファイルを記憶した一般
    的名前ライブラリと; 音声入力事項を確認する要求に応答し、(a)前記音声入力事項が自分の名前を
    録音したシステムユーザを識別するものであるか否かを特定して、(b)前記特定
    の結果が否である場合には、1つ以上のオブジェクトの組を前記一般的名前ライ
    ブラリから選択的に検索して、(c)前記1つ以上のオブジェクトの組を出力する
    制御手段と を具えることを特徴とするシステム。
  8. 【請求項8】 前記1つ以上のオブジェクトを出力するステップが、少なくとも
    第1及び第2オブジェクトを列に組み立てるステップを含むことを特徴とする請
    求項7に記載のシステム。
  9. 【請求項9】 前記第1及び第2オブジェクトを、連結によって組み立てること
    を特徴とする請求項8に記載のシステム。
  10. 【請求項10】 前記一般的名前ライブラリを、前記自動応答装置に隣接して配
    置したことを特徴とする請求項7に記載のシステム。
  11. 【請求項11】 前記一般的名前ライブラリを、前記自動応答装置から遠隔的に
    配置して、コンピュータネットワークを介して該ライブラリにアクセスすること
    を特徴とする請求項7に記載のシステム。
  12. 【請求項12】 さらに少なくとも第2自動応答装置を含み、前記第1及び第2
    自動応答装置が、前記一般的名前ライブラリを共用することを特徴とする請求項
    7に記載のシステム。
  13. 【請求項13】 前記オーディオファイルを、前記一般的名前ライブラリ内に圧
    縮形態で記憶することを特徴とする請求項7に記載のシステム。
  14. 【請求項14】 音声入力事項を確認する要求に応答して、ユーザが自分の名前
    を予め録音しているか否かを特定するステップと; 前記ユーザが自分の名前を予め録音している場合には、前記ユーザが予め録音
    した名前を用いて前記音声入力事項を確認するステップと; 前記ユーザが自分の名前を予め録音していない場合には、一般的な名前オブジ
    ェクトの一般的名前ライブラリから入手できる情報を用いて、前記音声入力事項
    を確認することができるか否かを特定するステップと; 前記情報を用いて前記音声入力事項を確認することができる場合には、1つ以
    上のオブジェクトの組を、前記一般的名前ライブラリから検索するステップと; 前記オブジェクトの組から得られた所定の名前を出力するステップと を具えることを特徴とする音声入力事項の確認方法。
  15. 【請求項15】 前記所定の名前を出力するステップがさらに、前記所定の名前
    を、少なくとも第1及び第2オブジェクトから組み立てるステップを含むことを
    特徴とする請求項14に記載の方法。
  16. 【請求項16】 前記第1及び第2オブジェクトを、連結によって組み立てるこ
    とを特徴とする請求項15に記載の方法。
  17. 【請求項17】 さらに、 一般的な名前オブジェクトの一般的名前ライブラリから入手できる情報を用い
    て前記音声入力事項を確認することができない場合には、前記音声入力事項のテ
    キスト−音声の変換を生成するステップと; 前記テキスト−音声の変換を出力するステップと を含むことを特徴とする請求項14に記載の方法。
  18. 【請求項18】 前記オブジェクトのうちの少なくとも1つが、関連する一組の
    オブジェクトインスタンスを有し、各オブジェクトインスタンスが名前の所定の
    発音を表現するものであることを特徴とする請求項14に記載の方法。
JP2000608579A 1999-03-26 2000-03-23 認識可能な名前ライブラリを有する自動応答装置 Pending JP2003529229A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/276,928 US6502075B1 (en) 1999-03-26 1999-03-26 Auto attendant having natural names database library
US09/276,928 1999-03-26
PCT/EP2000/002754 WO2000059193A1 (en) 1999-03-26 2000-03-23 Auto attendant with library of recognisable names

Publications (1)

Publication Number Publication Date
JP2003529229A true JP2003529229A (ja) 2003-09-30

Family

ID=23058677

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000608579A Pending JP2003529229A (ja) 1999-03-26 2000-03-23 認識可能な名前ライブラリを有する自動応答装置

Country Status (6)

Country Link
US (1) US6502075B1 (ja)
EP (1) EP1084563A1 (ja)
JP (1) JP2003529229A (ja)
KR (1) KR20010052414A (ja)
CN (1) CN1336069A (ja)
WO (1) WO2000059193A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011511537A (ja) * 2008-01-24 2011-04-07 アルカテル−ルーセント ユーエスエー インコーポレーテッド 発話名の発音の音声版を提供するシステムおよび方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050119875A1 (en) * 1998-03-25 2005-06-02 Shaefer Leonard Jr. Identifying related names
US7013280B2 (en) * 2001-02-27 2006-03-14 International Business Machines Corporation Disambiguation method and system for a voice activated directory assistance system
CN100592385C (zh) * 2004-08-06 2010-02-24 摩托罗拉公司 用于对多语言的姓名进行语音识别的方法和系统
US8005849B2 (en) * 2006-08-31 2011-08-23 Red Hat, Inc. Database access server with reformatting
CA2795812A1 (en) * 2010-04-07 2011-10-13 Max Value Solutions INTL, LLC Method and system for name pronunciation guide services

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5210520A (en) * 1987-07-15 1993-05-11 Housley Todd B Programmable doorbell control
WO1993013518A1 (en) * 1991-12-31 1993-07-08 Digital Sound Corporation Voice controlled messaging system and processing method
US5483579A (en) * 1993-02-25 1996-01-09 Digital Acoustics, Inc. Voice recognition dialing system
NZ294296A (en) * 1994-10-25 1999-04-29 British Telecomm Speech recognition for voice operated telephone services includes comparison against stored lists of expected words
US5651055A (en) * 1995-06-29 1997-07-22 Lucent Technologies Inc. Digital secretary
US5794249A (en) * 1995-12-21 1998-08-11 Hewlett-Packard Company Audio/video retrieval system that uses keyword indexing of digital recordings to display a list of the recorded text files, keywords and time stamps associated with the system
US5892814A (en) * 1995-12-29 1999-04-06 Northern Telecom Limited Flexible, tapeless, personalized auto-attendant telephone
JPH09292255A (ja) * 1996-04-26 1997-11-11 Pioneer Electron Corp ナビゲーション方法及び装置
FI101333B (fi) * 1996-09-02 1998-05-29 Nokia Mobile Phones Ltd Puhekomennoilla ohjattava telepäätelaite
US5875448A (en) * 1996-10-08 1999-02-23 Boys; Donald R. Data stream editing system including a hand-held voice-editing apparatus having a position-finding enunciator
US6021181A (en) * 1997-02-24 2000-02-01 Wildfire Communications, Inc. Electronic voice mail message handling system
US6041300A (en) 1997-03-21 2000-03-21 International Business Machines Corporation System and method of using pre-enrolled speech sub-units for efficient speech synthesis
US6173266B1 (en) * 1997-05-06 2001-01-09 Speechworks International, Inc. System and method for developing interactive speech applications
US6075844A (en) * 1997-11-18 2000-06-13 At&T Corp. Messaging system with remote messaging recording device where the message is routed based on the spoken name of the recipient

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011511537A (ja) * 2008-01-24 2011-04-07 アルカテル−ルーセント ユーエスエー インコーポレーテッド 発話名の発音の音声版を提供するシステムおよび方法

Also Published As

Publication number Publication date
EP1084563A1 (en) 2001-03-21
CN1336069A (zh) 2002-02-13
KR20010052414A (ko) 2001-06-25
US6502075B1 (en) 2002-12-31
WO2000059193A1 (en) 2000-10-05

Similar Documents

Publication Publication Date Title
EP0780829B1 (en) Method for automatic speech recognition in telephony
JP3873131B2 (ja) 電話メッセージの転記のために使用される編集システム及び方法
US5651055A (en) Digital secretary
EP0735736B1 (en) Method for automatic speech recognition of arbitrary spoken words
US5797124A (en) Voice-controlled voice mail having random-order message retrieval based on played spoken identifier list
US6651042B1 (en) System and method for automatic voice message processing
US4623761A (en) Telephone operator voice storage and retrieval system
TW401673B (en) System and method for automatic call and data transfer processing
US6370237B1 (en) Voice activated dialing with reduced storage requirements
US20040021765A1 (en) Speech recognition system for managing telemeetings
US7382867B2 (en) Variable data voice survey and recipient voice message capture system
US6148285A (en) Allophonic text-to-speech generator
US6397182B1 (en) Method and system for generating a speech recognition dictionary based on greeting recordings in a voice messaging system
US6502075B1 (en) Auto attendant having natural names database library
AU763704B2 (en) A transaction processing system with voice recognition and verification
WO2005011242A1 (en) Annotations addition to documents rendered via text-to-speech conversion over a voice connection
US7206390B2 (en) Simulated voice message by concatenating voice files
Billi et al. Interactive voice technology at work: The CSELT experience
US20020091530A1 (en) Interactive voice response system and method having voice prompts with multiple voices for user guidance
JPH1125112A (ja) 対話音声処理方法及び装置、記録媒体
US6947969B2 (en) System and method for accessing voice messaging system data
US7470850B2 (en) Interactive voice response method and apparatus
EP0942575A2 (en) Adaptive telephone answering system
AU2003100447B4 (en) Automated transcription process
Chatzi et al. " Wire Communications Laboratory (WCL), Electrical & Computer Engineering Dept.

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070323

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20070323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070711

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090804

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100202