JPH09186770A - 電話における自動音声認識のための方法 - Google Patents

電話における自動音声認識のための方法

Info

Publication number
JPH09186770A
JPH09186770A JP8341417A JP34141796A JPH09186770A JP H09186770 A JPH09186770 A JP H09186770A JP 8341417 A JP8341417 A JP 8341417A JP 34141796 A JP34141796 A JP 34141796A JP H09186770 A JPH09186770 A JP H09186770A
Authority
JP
Japan
Prior art keywords
voice
cpu
service system
input
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8341417A
Other languages
English (en)
Other versions
JP4247929B2 (ja
Inventor
Roger Borgan Garberg
ボアガン ガーバーグ ロジャー
Michael Allen Yudkowsky
エム.ユドコウスキー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Publication of JPH09186770A publication Critical patent/JPH09186770A/ja
Application granted granted Critical
Publication of JP4247929B2 publication Critical patent/JP4247929B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/38Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections
    • H04M3/382Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections using authorisation codes or passwords
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42204Arrangements at the exchange for service or number selection by voice
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q3/00Selecting arrangements
    • H04Q3/42Circuit arrangements for indirect selecting controlled by common circuits, e.g. register controller, marker
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/60Medium conversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2242/00Special services or facilities
    • H04M2242/22Automatic class or number identification arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/38Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections
    • H04M3/382Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections using authorisation codes or passwords
    • H04M3/385Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections using authorisation codes or passwords using speech signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42025Calling or Called party identification service
    • H04M3/42034Calling party identification service
    • H04M3/42059Making use of the calling party identifier
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4931Directory assistance systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q3/00Selecting arrangements
    • H04Q3/72Finding out and indicating number of calling subscriber

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Security & Cryptography (AREA)
  • Telephonic Communication Services (AREA)

Abstract

(57)【要約】 【課題】 音声作動サービスシステムにおいて迅速且つ
容易に音声認識テンプレートのデータベースを確立でき
る方法とシステムを提供する。 【解決手段】 音声作動電気通信サービスシステムに音
声認識テンプレートのデータベースを構築させるための
付加データを利用する本発明の方法では、第1の入力を
求め、第1の入力は電気通信ネットワークのユーザの特
徴を識別する。第1の入力は、例えば、電気通信ネット
ワークのユーザの電話番号である。次いで、付加データ
ベース内で第1の入力に関連した付加情報が、識別さ
れ、付加データベースから検索される。付加情報は、例
えば、電気通信ネットワークのユーザに関連した本文の
名前データである。この付加情報は次いで、音声認識テ
ンプレートを生成するために利用される。音声認識テン
プレートはその後、第2の入力を認識するために使用さ
れる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、自動音声認識に関
するものである。より詳しくは、本発明は自動音声認識
(ASR)システムに関連した拡張電気通信サービス設
備に関するものである。
【0002】
【従来の技術】多くの用途において、繰り返しのタスク
を自動化するためにコンピュータを使用することは、タ
スクがより迅速に効率的に行うことができるので、有利
なことである。音声認識は、音声技術の1つであり、人
々が発語を使用してコンピュータと対話できるものであ
る。音声認識は、しかしながら、異なる人々の間で音声
特性とパターンの固有の変化があるために、開発中の技
術である。
【0003】音声認識の1つの用途として電話ネットワ
ークにおけるものがある。自動音声認識(ASR)シス
テムを使用することで、人々は、押しボタンコードを押
したりオペレータの仲介なしに、種々の電話サービスあ
るいは機能を利用することができる。例えば、音声認識
は、ダイヤル処理に使用することができて、電話のユー
ザは電話番号を思い出したり、見たり、あるいは尋ねた
りする必要がなくなる。ユーザインターフェースの物理
的な操作の代わりに音声を使用できる機能に故に、電気
通信が進歩する際にASR技術に対する要求が高まって
いる。一般的に、通信において使用されるASRシステ
ムには2種類のもの、つまり、話者に依存するものと話
者依存しないものがある。
【0004】話者に依存する自動音声認識システムの1
つの典型例においては、話者の音声パターンに応答する
ために、特定の話者により「訓練された」コンピュータ
を使用している。この場合、訓練のプロセスは、アナロ
グの音声入力を発生するために音(例えば、単語)を発
語すること、音声入力を信号データに変換すること、音
を表すテンプレートを発生すること、およびコンピュー
タに動作を教唆する指示のような適当な特定の応答デー
タにインデックス付けしたテンプレートを蓄積するこ
と、を含んでいる。
【0005】リアルタイムでの動作の間において、話者
により話された単語はASRシステム内でデジタル化さ
れるとともに話者の従属した音声認識テンプレートのセ
ットと比較され、話された単語とテンプレートとの間で
合致があった場合には、コンピュータにより特定の応答
がなされる。話者に依存するASRシステムは、訓練プ
ロセスを調整することができる場合、つまり、同じ個人
が多くの機会にシステムにアクセスする初期段階で使用
される。
【0006】個々の訓練が調整されない用途に対して
は、一般的は話者に依存しないASRシステムが使用さ
れている。話者に依存しないASRシステムの典型的な
例では、コンピュータを、多くの異なる人々により話さ
れた単語の一部を表す、複合のテンプレートつまりクラ
スタを蓄積するために使用している。単語の一部である
これらのテンプレートは同様にサブワードと称される。
テンプレートは、音声特定における多くの発音と変形の
広い範囲を表す、多くのデータサンプル(例えば、複数
の話者により話された単語)から派生される。話者に依
存しない音声認識システムは話者による特別な訓練なし
に、広い範囲の人々と対話できる。
【0007】音声認識が採用されている1つの一般的な
領域として、音声作動式の(voice-driven)電気通信サ
ービスがある。音声作動式の電気通信サービスの1例と
して、上記で簡単に説明した音声ダイアル機能がある。
音声ダイヤルにおいては、加入者は他の相手に対する出
接続呼を、呼び出される相手を識別するキーワードを単
に話すだけで開始する。例えば、加入者がJohnso
nの名前の相手を呼び出したい場合、加入者は単に「J
ohnson」の単語を電話に向かって話すだけで良
い。このようなケースでは、音声作動式のサービス装置
は、一般的には、加入者の電話内あるいはネットワーク
のサービスプロバイダの場所にあり、Johnsonの
電話番号のために適切なダイヤル信号を発生するため、
キーワードを認識するために音声認識を行う。音声ダイ
ヤルは、ダイヤル操作を手動でする必要および電話番号
を思い出す必要をなくすことができる。
【0008】音声ダイヤルに加えて、他の音声作動式の
電気通信サービスでは、コマンドとキーワードが提案さ
れている。コマンドは実行されるべき動作を識別し、ま
たキーワードは実行されるコマンドに関連する相手を識
別するためのものである。例えば、会議呼は、加入者が
現在の電話会話に別の相手を加えあるいは会議する方法
である。音声作動式の会議呼は、加入者が会議コマンド
および加えるべき相手の名前だけを唱える必要がある。
例えば、加入者が現在Johnsonとの呼を維持して
おり、また電話呼に他の相手Perezを加えあるいは
会議したい場合を考える。音声作動式の会議呼を使用し
て、加入者は「会議」の口頭のコマンドを発行する。音
声作動サービスは次いで、可聴のプロンプト「誰との会
議」で応答し、加入者は「Perez」と答える。通信
サービスシステムは次いで、Perezの電話番号にダ
イヤルし、Perezが応答した場合、Perezを呼
に加える。上記したようなビデオ作動式の通信サービス
は市場で利用可能である。例えば、Massachus
etts、LexingtonのWildfireAs
sociatesのWildfire(登録商標)Sy
stemは、このような音声作動式のサービスをいくつ
か提供している。
【0009】
【発明が解決しようとする課題】このようなシステムに
関連した欠点は、このようなサービスを行うために必要
な音声識別テンプレートを求めるための方法である。音
声作動式のサービスは、加入者が通信する相手に対応す
る音声認識テンプレートの集合体へのアクセスを必要と
する。このテンプレートの集合体は典型的には、各相手
の名前の音声認識テンプレートを相手の電話番号に関連
させたデータベースにより具体化される。よって、例え
ば、音声ダイヤル装置が「Perez」の名前を認識す
ることにより「Perez」のような音声コマンドを処
理し、またPerezの名前を表す音声認識テンプレー
トに関連した電話番号を調べる。したがって、音声作動
システムは、加入者によりしばしば呼される番号のリス
トおよび各番号に関連したいーアートあるいは名前の音
声識別テンプレートを含むデータベースを維持しなけれ
ばならない。
【0010】典型的な従来技術では、このようなデータ
ベース情報は複雑な話者に依存する訓練工程によって加
入者により提供される。特定の相手に対応するデータベ
ースのエントリ、レコード、を確立するために、加入者
は一般的には、例えば「Johnson」や「Pere
z」のようなキーワードないし名前を、ASRシステム
が音声認識テンプレート、あるいはキーワードあるいは
名前に関連したサブワード転写を確立するまで発音しな
ければならない。このような工程は時間がかかるだけで
なく、音声作動サービスが制限され、加入者がすでにデ
ータベース内に「入力」した人だけに関してしか使用で
きなくなる。さらに、得られたテンプレートは話者に依
存するテンプレートであり、換言すれば、加入者の音声
特性に依存したテンプレートである。この結果、他の話
者からの音声を認識させる場合にはエラーが起こってし
まう。
【0011】したがって、サブワード転写および関連す
る電話番号のデータベースを確立するためのより便利な
プロセス、より詳しくは、話者に依存しないテンプレー
トを使用したデータベースを確立するプロセスの必要性
がある。
【0012】
【課題を解決するための手段】上記の課題は、音声作動
サービスシステムが迅速且つ容易に音声認識テンプレー
トのデータベースを確立することができるために付加デ
ータを利用する、本発明の方法とシステムにより解決さ
れる。このような付加データは、多くのあるいはすべて
の加入者の入接続呼および出接続呼に関連した本文名前
データ(textual name data )を含んでいる。本文名前
データは、テキスト−音声(text-to-speech)方法を使
用して音声認識テンプレートを発生するために使用され
る。数字および音声認識テンプレートは次いで、相手に
関するビデオ作動サービスを容易化するためにデータベ
ース内に記録される。
【0013】特に、本発明の方法は、第1の入力を求め
ることを含んでおり、第1の入力は電気通信ネットワー
クのユーザのアスペクトを識別するものである。次い
で、付加データベース内の第1の入力に関連した付加情
報が識別され、また付加データベースから検索される。
この付加情報は次いで、音声認識テンプレートを生成す
るために利用される。音声認識テンプレートは、その
後、第2の入力を認識するために使用される。第2の入
力は、話された発語を含み、また付加情報を表す情報を
含んでいる。
【0014】例示的な実施の形態では、加入者の電話呼
は、本発明の拡張された音声作動式のサービスシステム
を通って経路指定される。発呼者あるいは自動ライン識
別機能により提供された電話番号に基づいて、電話番号
に関連した本文名前データを検索するために、システム
は付加データベースにアクセスする(例えば、逆ディレ
クトリ検索)。本文名前データは次いで、音声認識テン
プレートを発生するために、テキスト−音声システムに
より処理される。音声認識テンプレートは次いで加入者
の特定のデータベース内に蓄積される。加入者はその
後、呼をするために音声作動コマンドを呼び出し、ある
いは相手の名前に関連してコマンドを話すことで相手に
関する音声作動サービスを呼び出す。サービスシステム
は、加入者により話された相手の名前をデータベース情
報を使用して認識するために、音声認識機を採用してい
る。
【0015】上記の特徴および利点は、その特徴および
利点とともに、添付図面を参照した以下の説明から当業
者により明らかなものとなる。
【0016】
【発明の実施の形態】図1は、ネットワークサービスシ
ステム10、外部交換機20、および公衆電話ネットワ
ーク(PSTN)30を含む、通信ネットワークを示し
たものである。PSTN30は、複数の加入者セット、
例えば加入者セット32および34にに接続されてい
る。本発明による、拡張された音声作動サービスは、サ
ービスプロバイダにより維持され、以下に説明する、ネ
ットワークサービス10を通して一般的に提供される。
【0017】一般的に、外部交換機20は、1985年
7月−8月のAT&T Technical Jour
nalのVol.64の第1303−1564頁、19
81年11月のBell Laboratories
Recordの第258頁、および1981年12月の
Bell Laboratories Recordの
第290頁に記載され、ATT&Tにより製造される、
E5ESS(登録商標)Switchのような、分散制
御、自局側デジタル交換機である。あるいは、外部交換
機は、Nothern Telecomから入手可能な
モデルDSM−100のような他のデジタル交換機の製
品であっても良い。ネットワークサービスシステム10
は、データトランク22およびアナログないし音声トラ
ンク24を経て、外部交換機20に接続された交換構造
体11を含んでいる。音声トランク24は、複数のアナ
ログ音声チャネル、例えば250チャネルを供給するた
めに動作可能である。データトランク22は外部交換機
20のデータ制御インターフェース、例えば5ESS
(登録商標)交換システムのPROXYインタフェース
に接続されている。同様なインターフェースは、Nor
thern TelecomのDMS−100上にも存
在している。
【0018】交換構造体11は、音声トランク24上の
複数の音声チャネルに接続され、またデータトランク2
2にさらに接続された、デジタル交換構造体である。交
換構造体11に加えて、ネットワークサービスシステム
10はさらに、複数、つまりN個のサービス回路121
…12N および制御器13を含んでいる。サービス回路
121 …12N は、図1の通信システムの加入者に1つ
またはそれより多くの拡張サービスを提供するために動
作する回路であり、また図2にさらに詳細に説明されて
いる。制御器13は、本実施の形態では、コンピュータ
を含んでおり、またネットワークサービスシステム10
の動作の全体の制御を行う。
【0019】交換構造体11は、N個のサービス回路1
1 …12N に対応する複数の音声ライン141 …14
N を通して接続されている。交換構造体11、サービス
回路121 …12N のそれぞれ、および制御器13は、
データ通信の目的で、ローカルエリアネットワーク(L
AN)15を介して接続されている。
【0020】図2は、図1のネットワークサービス10
において使用されるサービス回路121 の一例を示した
ものである。サービス回路121 だけを詳細に示した
が、他のサービス回路122 …12N も好ましくは同じ
あるいは同様な構造であり、同様に動作する。サービス
回路121 は、アナログラインインターフェース51、
ASR回路52、再生/記録回路53、CPU回路5
4、およびLANインターフェース55を含んでおり、
これらは全てデータバス56上でデータ通信するために
相互接続されている。アナログラインインターフェース
51、ASR回路52および再生/記録回路53はさら
に、音声バス57を経て、音声信号と通信するために接
続されている。
【0021】アナログラインインターフェース51は音
声ライン141 と音声バス57との間のインターフェー
スとして機能する。サービス回路121 内で行われる全
ての音声通信動作は、アナログラインインターフェース
51を通って外部回路と音声信号を交換する。アナログ
ラインインターフェース51は例えば、Dialogi
cから入手可能なモデルLSI120カードである。A
SR回路52は、以下に説明する、音声作動通信サービ
スを実行するために必要な、音声認識機能を行う、自動
音声認識回路である。ASR回路52の構造と動作は図
3に関連して以下にさらに詳しく説明する。再生/記録
回路53は、予め記録されあるいは自動的に記録された
メッセージの両方を再生し、また入接続されたメッセー
ジを記録する。再生/記録回路53は好ましくは,Di
alogicから入手可能なモデルD/8xカードであ
る。LANインターフェース55は、図1のLAN15
とサービス回路121 のデータバス56との間のデータ
インターフェースを提供するべく動作する。LANイン
ターフェース55は好ましくは、市場で入手可能なイー
サネットインターフェースである。
【0022】CPU回路54はCPU、ランダムアクセ
スメモリのような揮発性メモリ、および1つまたはそれ
より多くのディスクドライブないし他の同様な記憶装置
を含んでいる。CPUは好ましくはIntel 804
86マイクロプロセッサを含むが、他のプロセッサでも
使用可能である。一般的に、CPU回路54内のCPU
は、ディスクドライブ、あるいは図1の制御コンピュー
タ13のいずれから揮発性メモリ内にロードされたプロ
グラムを実行する。CPUは、本発明の拡張された、音
声作動の通信サービスを提供するべく、サービス回路1
1 を制御するために、例えば、図3A、図4、および
図6に関連して以下に説明された動作を含むプログラム
を実行する。CPU回路54は、好ましくは、Dial
ogicから入手可能なモデルCAT 1010 CP
Uである。
【0023】図3は、図1に示した、ASR回路52の
例示的な実施の形態の簡略化されたブロックダイヤグラ
ムを示したものである。話者に依存しないか話者に依存
する音声認識のいずれかの機能を有する、ASRシステ
ム110は、システムの全体の制御をするためのCPU
202を含んでいる。CPU202は参照番号203に
より全体を示された複数のデータバスを有している。ま
た、ランダムアクセスメモリ(RAM)204、リード
オンリーメモリ(ROM9206、再生/記録回路53
により提供されないグリーティングやプロンプトを発行
する音声発生ユニット218も含まれている。最後に、
公知のように、書かれたテキストをサブワード転写に転
写するためにテキスト−音声(TTS)システム219
が設けられている(CPU202とRAM204と通信
する)。
【0024】RAM204はバス203によりCPU2
02に接続されており、図2の音声バス57により提供
された音声信号のような音声データを一時的に蓄積す
る。RAM204はさらに、音声認識テンプレート、お
よび特に、話者に依存するテンプレート214および話
者に依存しないテンプレート216を一時的に記憶す
る。ROM206は、内部データバス203によりCP
U202に同様に接続され、音声認識アルゴリズム20
8およびサブワードのモデル210を含む、音声認識お
よび検証データを永久的に記憶する。この例示的な実施
の形態では、サブワードを基盤として音声認識アルゴリ
ズム208が利用されているが、他のてきとうな音声認
識の技術を用いることも可能である。
【0025】サブワードは、例えば単語のような、より
大きい音声のセグメントを形成するために、他のユニッ
トに結合することができる、音声の小さいユニットのセ
ットの1つを参照する用語である。例えば、発音された
「operator」の音声上のセグメントは、「a
a」、「p」、「axr」、「ey」、「dx」、およ
び「axr」である。サブワードのモデル210は、従
来のオフラインのプロセスにおいて話者の発語のサンプ
ルから派生された、音声認識分類データを使用してコン
パイルされる。オフラインのプロセスの間は、言語の全
てのサブワードを示すように選択された単語は、多数の
訓練された話者(例えば、1000人)により話され
る。発語は、発語の内容の書かれたテキストを発生する
訓練された個々の人間により処理される。
【0026】サブワードのモデル210は、多数の話者
により話された単語の特性の分布を表している。モデル
210は、訓練された話者(つまり、生粋のアメリカ
人、カスチール人のスペイン語会話母集団)により表さ
れる同じ話者の母集団として機能し、ASRシステムへ
の広範囲のアクセスのために使用することができる。話
者に依存したないテンプレート216は、サブワード、
あるいは予期する発語あるいは熟語を示すサブワード転
記のリストである。話者に依存しないテンプレート21
6は、書かれた単語または熟語の予期された発音を例証
するサブワード転記を発生するため、TTSシステム2
19により書かれたテキストを処理することで生成され
る。一般的には、音声認識アルゴリズム208に利用可
能な多数のテンプレートがRAMメモリ204内に蓄積
される。アルゴリズム208のタスクは、話された発語
内のサブワードにどのテンプレートが最も近似して合致
するかを選択することである。話者に依存するテンプレ
ート214は、話者が、話者に依存する訓練として知ら
れているプロセス内で単語または熟語を発語することで
発生される。
【0027】リアルタイムでの音声認識動作の間におい
て、発語は、サブワードのモデル210を使用して、音
声認識アルゴリズム208により処理される。発語は、
サブワードのリストが発生されるように、サブワードの
モデル210と比較される。このサブワードのリスト
は、話者に依存しないテンプレート216および話者に
依存するテンプレート214により提供されたリスト
と、公知の技術を使用して、合致される。音声認識アル
ゴリズム208はこの合致の結果を報告する。複雑さが
変化するいくつかの公知の音声認識アルゴリズムは、サ
ブワードのモデル210、話者に依存するテンプレート
214、話者に依存しないテンプレート216を使用し
て、発語を認識するために使用される。
【0028】音声発生ユニット218は、音声を合成す
るために音声出力信号を発生するべく動作する。特に、
音声発生ユニット218は、話者に依存しないテンプレ
ート216の1つのようなサブワード転記を受領し、ま
た公知の方法でこれから音声出力信号を発生するために
動作する。音声出力信号は、増幅されて音声受信器に提
供されたときには、サブワード転記に対応する可聴信号
を生成する信号である。音声発生器ユニットは、例え
ば、話者に依存しないテンプレート216がそのために
存在する相手の名前の可聴の発音を容易化するために使
用される。
【0029】図1、図2および図3に示されたネットワ
ークサービスシステム10は、多くのことのなかでも特
に、拡張された音声作動サービスを提供するために動作
する。このようなサービスは、改良された音声ダイヤ
ル、音声作動式の会議呼、音声作動式のメッセージ通信
および他のサービスを含むものである。このようなサー
ビスの基本的なバリエーションは、Wildfire
(登録商標)システムのような、従来技術のシステムに
おいて公知であり、採用されている。本発明は、このよ
うなサービスを、音声認識テンプレートを入力するプロ
セスを簡略化することで、著しく高めるようにしたもの
である。本発明は、ASRシステムを訓練するための時
間がかかるプロセスに加入者が係る必要をなくすもので
ある。
【0030】図1、図2および図3の種々の構成要素
は、大体、次のような態様で動作する。まず、加入者セ
ット34に関連した加入者が図1のシステム10によっ
て提供される音声作動式の通信サービスに加入したとす
る。動作の一例として、電話加入者セット32を使用す
る電気通信ネットワークのユーザは電話加入者セット3
4またはこの近くに位置する加入者に電話呼を発生す
る。加入者への呼をここで、入接続呼と称する。入接続
呼はPSTN30を経て外部交換機20に経路指定され
る。外部交換機20は次いで、この呼をネットワークサ
ービスシステム10を通り、アナログライン24を通っ
て経路指定する。交換構造体11は、制御コンピュータ
13の監視下、入接続呼を予め選択されたサービス回路
12X にライン14X 上で切換え経路指定する。この呼
は、次いで、公知のように、ライン14X 、交換構造体
11、音声トランク24、交換機20およびPSTN3
0を経て加入者セット34に戻される。この実施の形態
では、加入者からの全ての呼および加入者への全ての呼
は同じサービス回路12X を通って経路指定される。
【0031】呼の工程の間、サービスユニット12X
は、図のCPU54の監視下で、音声ダイヤル、音声作
動式の会議呼、あるいは音声作動式のメッセージ検討を
含む、本発明による音声作動式の電気通信サービスを提
供する。このようなサービスを容易化するために、サー
ビス回路12X は外部交換機20からの呼に関連するデ
ータを同様に受領する。特に、交換構造体11はこのよ
うなデータをデータトランク22上で交換機20から受
領する。制御コンピュータ13の指示の下で、交換構造
体11はデータを対応するサービス回路12X にLAN
15を経由して経路指定する。サービス回路12X 内で
は、データはデータバス56上でLANインターフェー
ス55を通って提供される。同様に、音声認識のために
必要とされる音声信号および音声作動サービスを提供す
るために必要とされるメッセージ通信は、音声ライン1
X からアナログラインインターフェース51を通っ
て、音声バス57上で提供される。
【0032】CPU回路54のCPUは図4および図5
に例示されたフローダイヤグラムにしたがって動作し、
拡張された音声作動サービスを提供する。特に、図4と
図5は入接続呼を取り扱う際のCPUの一例の動作を、
また図6は加入者開始のサービスを取り扱う際のCPU
の一例の動作を、それぞれ示したものである。加入者開
始のサービスは、電話のオフフックを行うような、加入
者の動作により起動される、音声作動式のサービスであ
る。図4、図5および図6については以下に説明する。
このような動作は一例であり、当業者は本発明の原理を
実行する、他の工程および動作を容易に案出できる。
【0033】いずれの場合でも、本発明の重要な特徴に
は、加入者の音声認識テンプレートのデータベースが発
生され維持されることが含まれる。加入者のデータベー
スは、1つまたはそれより多くのレコードを含んでお
り、各レコードは、図1の電話加入者セット32に対応
するユーザのような、他の電気通信ネットワークのユー
ザに関連している。データベースの各レコードは、特定
のユーザの電話番号およびユーザの名前に対応する音声
認識テンプレートを含んでいる。このようなレコード
は、電話番号に名前を関連付けさせる音声作動サービス
において使用される。
【0034】本発明によれば、CPU回路54のCPU
は、このようなデータベースのレコードを、複雑な訓練
工程なしに、自動的に発生する。好ましくは、CPU
は、呼に関連した相手に対する従来のレコードが存在し
ない場合には、各入接続される電話呼あるいは出接続さ
れる電話呼に対してデータベースのレコードを自動的に
発生する。図3Aの下側は、各入接続呼および出接続呼
に対応するデータベースのレコードを発生するために、
上記のシステムにより実行される操作のフローダイヤグ
ラムを示したものである。
【0035】まず、ステップ350において、CPU回
路54のCPUは接続アドレスを求める。この接続アド
レス、この実施の形態においては、入接続呼あるいは出
接続呼に対する電話番号である。呼が出接続の場合に
は、CPUは好ましくは呼ばれた相手の番号を加入者に
よりダイヤルあるいは話された数字から求める。上記し
たように、全ての加入者の入接続呼および出接続呼はサ
ービス回路12X を通って経路指定される。この結果、
ダイヤルされた数字は、外部交換機20から、図1のデ
ータトランク22、交換構造体11、LAN15、図2
のLANインターフェース55を経由して求められる。
呼が入接続の場合、CPUは、好ましくは、発呼者ID
のようなサービスを可能とする、入接続する発呼者のラ
イン識別(「ICLID」)として知られている交換機
20より入手可能な情報から発呼者の番号を求める。I
CLID情報はまた、同じ経路で交換機20から入手可
能である。発呼者の番号がICLIDから求めることが
できない場合、発呼者はその電話番号を話すように促さ
れる。このような場合は以下に図4に関連して説明す
る。
【0036】次に、ステップ351において、CPU3
51は、相手に関する情報を求めるために付加のデータ
ベースを利用する。この実施の形態においては、CPU
は、入接続する発呼者の名前、あるいは少なくとも電話
番号に通常関連した人の名前に対応するテキストデータ
を求めるために、電話番号を使用して逆のデータベース
探索を行う。このような場合、付加データベースは、P
STNサービスプロバイダにより維持されるカスタマデ
ータベース、あるいはPhoneDisk(登録商標)
のような、複数の電話リストを含むCO−ROMデータ
ベースである。付加データベースがPSTNカスタマデ
ータベースの場合、CPUはデータライン22および交
換機20を通ってデータベースと通信する。
【0037】他の実施の形態として、交換機20は発呼
者に対応する本文名前データを直接提供する。この場
合、ステップ350と351は、CPU回路54のCP
Uではなくて、交換機20あるいはPSTN30のいず
れかの内部に位置されたCPUにより実行される。
【0038】いずれの場合でも、ステップ352におい
て、CPUはASR回路523に、発呼者の名前の音声
認識テンプレートを発生するように指示する。この実施
の形態によれば、音声認識テンプレートは、入接続され
る発呼者の最初と最後の名前のサブワード転記から構成
される。特に、CPUは、発呼者の名前に対応するテキ
ストデータを図3に例示した、ASR52のテキスト−
音声(TTS)システム219に提供する。TTS21
9は次いで、本文名前のサブワード転記を発生する。A
SR52は、得られたサブワード転記をCPUに提供す
る。その後、ステップ354において、CPUは、電話
番号、名前テキストデータ、および名前サブワード転記
を使用して、加入者のデータベース内にレコードを生成
する。加入者データベースは次いで、CPUが例えば音
声ダイヤルのようなビデオ作動サービスを行うのを補助
するために使用される。
【0039】上記したステップは、本発明による音声作
動式の電気通信サービスシステム内でのCPUの一般的
な動作を述べたものである。明らかなように、図3Aに
関連して上記で説明した操作は、図4、図5および図6
に関して以下に説明する特別の音声作動サービスに組み
込まれる。
【0040】図4、図5および図6は、加入者のデータ
ベースを発生して本発明による拡張された音声作動サー
ビスを提供する際の、CPU回路54のCPUの動作を
流れを示したものである。これらの動作は、CPUによ
り、図1、図2および図3に示されたネットワークサー
ビスの他の構成要素に関連して実行される。なお、図1
に関連して上記で説明されたのと同様な機能を有する拡
張されたビデオ作動サービスの他の構成によって、図
4、図5および図6に例示された動作を容易に実行する
ことができる。
【0041】図4は、入接続呼、つまり、加入者により
受領された呼に関連してCPUにより行われる動作の流
れを例示したものである。一般的には、各入接続呼に対
して、CPUは、当該発呼者に対応するデータレコード
が既に存在する場合を除き、発呼者に対応するデータレ
コードを生成する。このデータレコードは、テキストデ
ータでの発呼者の名前、発呼者の名前のサブワード転
記、および発呼者の電話番号を含んでいる。加えて、図
2のサービス回路121 の再生/記録回路53は、後述
するいつくかの状況において、発呼者からのメッセージ
を記録する。いずれの場合でも、CPUはレコードを加
入者のデータベースの一部として生成し維持する。この
ようにして、拡張された音声作動サービスシステムは、
従来技術いおいて必要とされた、広範囲にわたる訓練工
程なしに、他の相手の名前を認識するために、「訓練さ
れる」。
【0042】ステップ302において、CPUは、入接
続呼の存在を示す信号を受領する。次いで、ステップ3
04において、CPUは加入者ラインが使用中かどう
か、つまり、加入者がすでに呼に関係しているかどうか
を判定する。全ての加入者の呼が通常はCPUにより監
視されているので、CPUは加入者ラインが使用中かど
うかを容易に判定できる。加入者ラインが使用中の場
合、CPUはステップ306において、図5に関連して
以下に説明する、呼待ち工程を実行する。しかしなが
ら、加入者ラインが使用中でないと判定された場合、C
PUはステップ308に進む。ステップ308では、C
PUは入接続呼が加入者により応答されたかどうかを判
定する。ステップ308において、加入者が予め判定さ
れた数の呼出信号内で呼に応答しない場合、CPUは、
ステップ310において開始される、Take_Mes
sageルーチンの実行に進む。一方、加入者が予め判
定された数の呼出信号内で呼に応答した場合、CPU
は、呼を処理するためにステップ332に進む。
【0043】ステップ310でのTake_Messa
geルーチンでは、CPUは発呼者の電話番号がICL
IDあるいは他から入手可能かどうかを判定する。現在
の時点では、このようなサービスは、入接続呼の電話番
号を識別するために、特に、長距離電話呼あるいはイン
ターラータ電話呼(interlata telephone call)に対し
ては必ずしも必要でない。ステップ310において、発
呼者の電話番号が入手可能である場合、CPUはステッ
プ316に直接進む。しかしながら、電話番号が入手で
きない場合、CPUはまず、ステップ314を実行し、
発呼者にはその電話番号が求められる。このため、ステ
ップ314において、CPUは再生/記録回路53に、
記録されたアナウンスを再生するように指示し、発呼者
に電話キー、あるいは数字を話すこと電話番号を入力す
るように促す。発呼者が数字を話すことで番号を通知し
た場合、CPUは、ASR回路52に、番号を判定する
ために音声認識を行うことを指示する。いずれの場合で
も、発呼者の電話番号が検索された場合には、CPU
は、次いでステップ316に進む。
【0044】ステップ316では、CPUは、加入者が
発呼者に関連した現存のデータベースを有しているかど
うかを判定する。所定の時間経過後、加入者のデータ
は、加入者に呼を行った相手、あるいは加入者からの呼
を受けた相手のような、いくつかの相手に関連するレコ
ードを含むようになる。この結果、他の人の中で、いず
れかの特定の入接続呼びに関連した番号がすでにある場
合がある。したがって、ステップ316において、CP
Uは発呼者の電話暗号を現存する加入者のデータベース
記録と合致させるための努力をする。
【0045】ステップ316においてCPUが加入者デ
ータベースが発呼者に関連したレコードを含んでいると
判定した場合、後述するようにCPUはステップ324
に直接進む。しかしながら、CPUが加入者のデータベ
ースが入接続呼に対応する電話番号に関連したレコード
を含んでいないと判定した場合、CPUはステップ31
8を実行する。ステップ318において、CPUは、入
接続する発呼者の電話番号を使用して、発呼者に対応す
るデータベースレコードを自動的に発生する。好ましく
は、各レコードは、次のフィールド、つまり、テキスト
データでの発呼者の名前、発呼者の最初と最後の名前の
サブワード転記、および発呼者の電話番号を含んでい
る。ステップ318においてレコードが生成された場
合、CPUはステップ324を実行する。
【0046】ステップ324において、CPUは図2の
再生/記録回路53に、発呼者からのメッセージを促
し、記録するように命令する。メッセージが完了する
と、CPUは次いで、ステップ326を実行し、記録さ
れたメッセージが発呼者に関連したデータベース入力に
論理的に関連付けされる。CPUは次いで、その呼に対
する動作を終了する。
【0047】上記したステップの一例の手順において、
Johnsonが加入者に呼びを行い、その加入者が予
め判定された数、例えば5回の呼出しに電話に応答しな
い場合を仮定として考える。CPUはJohnsonの
番号をICLID技術により求め、また加入者がJoh
nsonに対するデータベース入力を既に有していると
判定する。CPUは次いで、Johnsonにメッセー
ジを残すことを指示する。メッセージが一旦記録された
場合、CPUはこのメッセージをJohnsonに対す
るメッセージにタグを付ける、つまり論理的に関連付け
させる。記録されたメッセージをデータベース入力に関
連付けさせる理由は、以下に説明するように、音声コマ
ンドを使用してメッセージを検索できるようにするため
である。
【0048】図4の説明に戻り、ステップ332で始ま
るステップの手順、加入者が入接続呼に加入者が応答し
たとき、つまりステップ308における応答が「ye
s」である場合に行われるものである。次のステップ
は、呼が継続中において入接続する発呼者に関連したデ
ータベースのレコードを移すために必要なデータを求め
るためのものである。このため、ステップ332におい
て、CPUはまず、ステップ310において説明したの
と同じ方法を採用して、発呼者の電話番号が入手可能か
どうかを判定する。発呼者の電話番号が入手可能である
場合には、次いで、ステップ334において、CPUは
加入者のデータベースが発呼者に関連したレコードを含
んでいるかどうかを判定する。含んでいる場合、CPU
は、ステップ344に示し、以下に図6に関連して詳細
に説明する、通常の呼処理を進める。
【0049】しかしながら、ステップ334において、
加入者のデータベースが発呼者に関連したレコードを含
んでいないことが判定され、次いで、CPUはステップ
336を実行する。ステップ336において、CPU
は、新しいデータベースのレコードを発生する。このた
め、CPUはステップ351、352および354に示
された方法を使用してレコードを発生する。ステップ3
36の後、CPUは通常の呼処理を進めるためにステッ
プ344に進む。
【0050】ステップ332を再度参照して、入接続さ
れる発呼者の電話番号がICLIDあるいは同様なサー
ビスから容易に入手できないと判定された場合、CPU
は、CPUが加入者から発呼者の名前と番号を呼が終了
した後に引き出すことを示す、フラグGet_Info
をセットする。このようにして、CPUは、入接続する
発呼者から電話番号が入手できない場合でも、入接続呼
に対応するデータベースのレコードを発生する。フラグ
がセットされた後、CPUは、通常の呼処理を進めるた
めに、ステップ344を実行する。呼が終了したときに
は、加入者に対して名前と発呼者の番号が促され、また
対応するデータベースのレコードが生成される。呼が終
了した後にこのような情報を加入者に促すことを避ける
ために、データベースのレコードを生成することが好ま
しくない場合がある。このような場合には、CPUはG
et_Infoのフラグをセットせず、またデータベー
スのレコードを生成しない。
【0051】いずれの場合でも、本発明の1つの特徴に
したがって、呼が応答されたかどうかに拘らず、全部な
いしほとんどの入接続呼に対する音声認識テンプレート
を含むデータベースのレコードが、図4の方法によって
発生される。加えて、図4の方法は、本発明の他の特徴
にしたがって、応答されない呼に対するメッセージを記
録する。
【0052】図5は、本発明による、呼待ち工程におい
てCPUが行う動作のシーケンスを例示したものであ
る。ステップ402において、CPUは入接続ラインと
の通信を直接セットアップする。この時点において、入
接続する発呼者は加入者のラインに接続されていない。
ここで、このような動作は、サービス回路12X が少な
くとも2つの音声ラインにアクセスすることを必要とす
る。入接続する発呼者と通信しながら、加入者の通常の
ラインを使用中とするために、1つの音声ラインは通常
の加入者電話呼を受けながら、他の音声ラインはサービ
ス回路12X により使用される。
【0053】ステップ402において入接続する発呼者
との通信がセットアップされたならば、CPUはステッ
プ404を実行する。ステップ404において、CPU
は発呼者の番号が入手可能かどうかを判定する。ステッ
プ310に関連して説明したように、CPUはICLI
Dあるいは同様なサービスを発呼者の電話番号を識別す
るために利用する。電話番号が入手可能な場合、CPU
はステップ410に直接進む。しかしながら、電話番号
が入手可能でない場合、CPUはまずステップ408を
実行して、発呼者にその電話番号を求める。特に、CP
Uは、図4のステップ314に関連して上記で説明した
各方法のいずれかにより番号を求める。ステップ408
の後、CPUはステップ410に進む。ステップ410
において、CPUは加入者のデータベースが発呼者に関
連したレコードを含むかどうかを判定する。含む場合に
は、ステップ414において、CPUは加入者のライン
に接続し、加入者に発呼者の名前が通知される。発呼者
の名前を通知するために、CPUはASR回路52の音
声発生ユニット218に、発呼者に関連したデータベー
スのレコードからのサブワード転写を使用して音声出力
信号を発生するように命令する。音声出力信号は、次い
で、加入者ライン上で加入者に提供される。
【0054】しかしながら、ステップ410において、
CPUが加入者のデータベースが入接続する発呼者に対
応するレコードを含んでいないと判定した場合には、C
PUはステップ412を実行する。ステップ412にお
いて、CPUは、入接続する発呼者の電話番号を使用し
て発呼者に関連したデータベースのレコードを自動的に
発生する。ステップ412において利用されるデータベ
ースのレコード発生方法を図8にさらに詳しく示した。
レコードが一旦発生されると、CPUはステップ414
に進み、また上記したように、加入者に入接続呼を通知
し、また発呼者から検索した名前を告げる。
【0055】ステップ414において発呼者が通知され
た後、ステップ416においてCPUは加入者が入接続
呼に応答するかどうかを判定するために待機する。加入
者は、フックスイッチを叩くか、あるいは口頭ないしキ
ーパッドのコマンドのいずれかにより、その希望の信号
をCPUに送る。加入者が入接続呼に応答しないことを
示した場合には、CPUは図4のステップ324に戻る
ことで発呼者からのメッセージ受けるなどの処理を進め
る。一方、加入者が入接続呼に応答することを選択した
場合、CPUはステップ418において外部交換機20
に所望の接続を行うコマンドを供給する。その後、CP
Uは通常の呼処理機能を実行する。
【0056】本発明の他の長所および特徴は、加入者に
著しく拡張された応答サービスを提供する機能である。
上記したように、CPUにより行われるTake_Me
ssageルーチンは、加入者のデータベースのレコー
ドの1つに各記録メッセージを関連付けする。入接続す
る発呼者が現存するデータベースレコードを有していな
い場合には、発呼者に対して1つが生成される。いずれ
の場合でも、本発明の方法は、メッセージを残す人のサ
ブワード転記および電話番号を識別するデータに直接関
連したメッセージを提供する。この結果、メッセージを
聞いたならば、ユーザは、以下に図6に関連して説明す
るように、メッセージを残す人の番号をダイヤルするこ
とをCPUに指示する音声コマンドを容易に使用するこ
とができる。
【0057】図6は、加入者セットのオフフックを行う
ことで加入者がサービスを使用することを開始した時
に、CPUにより実行される動作の一例のシーケンスを
例示したものである。特に、加入者は一般的に、出接続
電話呼を行うか、あるいはメッセージを検索すること
で、サービスを開始する。したがって、図6は、本発明
によるメッセージ検索方法およびダイアル方法の両方を
例示したものである。メッセージ通信システムに関連す
る図6における動作は、図4の関連して上記で説明した
Take_Messageに関連して動作することが望
まれる。したがって、記録されたメッセージの全部では
ないがほとんどが、メッセージを残した発呼者に対応す
る加入者データベース内のレコードに関連している。
【0058】ステップ502において、加入者がオフフ
ックし、これによりCPUを含むネットワークサービス
システム10が起動する。次いで、ステップ504にお
いて、加入者が蓄積されたメッセージの検討を要求した
かどうかが、CPUにより判定される。このため、CP
Uは、図2のASR回路52に、「messages」
あるいは「review messages」のような
コマンドに対する加入者ライン上での監視をするように
命令する。加入者がメッセージを検討することを要求し
た場合、システムは、公知の可聴通知方法を使用して、
加入者になんらなのメッセージを通知する。ユーザがメ
ッセージの検討を要求しない場合、あるいはメッセージ
がない場合、CPUはステップ506に進む。ステップ
506から開始し、CPUはダイヤル方法の性能を監視
する。
【0059】ステップ506において、CPUは加入者
が音声ダイヤル機能を有しているかどうかを判定する。
加入者は典型的には、単に被呼者の名前を大声で話すこ
とで音声ダイヤル動作を呼び出す。このため、CPUお
よびASR回路52は公知の方法で、呼ばれる相手の名
前の発語の表示を検出するために動作する。加入者のデ
ータベース内の現存するサブワード転記に対応するもの
として、発語が認識された場合、CPUは音声ダイヤル
を行うためにステップ518を実行する。音声ダイヤル
動作において、CPUは、認識されたサブワード転記を
含むデータベースのレコードと関連した電話番号を検索
する。電話番号が検索された場合、この番号がダイヤル
され、またCPUは通常のセル処理をステップ520に
おいて実行する。このような音声ダイヤル動作は公知で
ある。例えば、米国特許第5、301、227号の第6
欄から第8欄の第50行には、蓄積されたサブワード転
記を採用して音声認識を行い、また電話番号のダイヤル
を行う適当な音声ダイヤル動作が記載されている。当業
者であれば、適当な音声ダイヤル動作を本発明に容易に
組み込むことができる。
【0060】ステップ506において、CPUが加入者
が音声ダイヤル機能を有していないと判定した場合、加
入者は、通常の状況下で、他の音声コマンドを発行する
か、あるいは出接続呼のために電話番号を手動でダイヤ
ルする。したがって、ステップ506における回答がn
oである場合、CPUはステップ522に進む。
【0061】ステップ522において、CPUは、加入
者が手動で出接続呼をダイヤルしたことを判定し、次い
でCPUはステップ524に進む。ここで、加入者が音
声コマンドを発行した場合、CPUはコマンドに含まれ
るサービスを行うためにステップ526に進む。例え
ば、加入者は「conference」のコマンドを話
し、これにより音声作動の会議呼サービスが開始され
る。当業者には、このようなサービスを容易に実施する
ことができる。
【0062】ステップ524を再度参照して、手動での
ダイヤル操作が完了したならば、CPUは、ダイヤルさ
れた番号と関連したデータベースのレコードが存在する
かどうかを判定する。存在する場合、CPUはステップ
520に進んで通常の呼処理動作を行う。存在しない場
合、CPUはステップ528に進む。ステップ528に
おいて、CPUは、手動でダイヤルされた電話番号に対
応する新しいベースレコードを発生する。このため、C
PUは上記したように、図8のステップ351、352
および354を実行する。新しいデータベースのレコー
ドが生成されたならば、CPUはステップ520におい
て通常の呼処理ルーチンを実行する。
【0063】上記した方法により、加入者は、すべての
手動でダイヤルされた出接続呼に対する電話番号、本文
名前データ、および音声認識テンプレートを自動的に発
生することができる。つまり、加入者は電話番号を単に
ダイヤルするだけで、システムを「訓練する」ことがで
きる。このような簡単化された訓練方法により従来のシ
ステムに比べて大幅は改良が図られる。
【0064】ステップ504を再度参照して、ユーザが
そのメッセージを要求したとCPUが判定した場合、C
PUはステップ508を実行する。ステップ508にお
いて、CPUはASR回路52に対して、再生/記録回
路53に関連してメッセージの要約を再生するように指
示する。このメッセージの要約は、最後にメッセージを
検討してからの、メッセージを残した相手の名前の順次
的なリストを含んでいる。メッセージの要約は、例え
ば、「Johnsonからのメッセージ、Perezか
らのメッセージ、メッセージ終り」のように構成され
る。再生/記録回路52はこのようなメッセージを、J
ohnsonやPerezのような名前を除いて、予め
記録されたシーケンスとして提供する。名前を挿入する
ため、ASR回路52は、各記録されたメッセージに論
理的に関連付けされたデータベース入力に対するサブワ
ード転記を使用して音声を発生する。
【0065】メッセージの要約が提供されたならば、ス
テップ510において、1つまたはそれより多くのメッ
セージに関して加入者からの口頭の指示が受領されたか
どうかをCPUは判定する。このため、CPUはASR
回路52と関連して動作し、加入者の発語を蓄積された
コマンドあるいは名前に一致するために音声認識技術を
使用して、有効な口頭のコメントが与えられたかどうか
を判定する。有効な口頭のコマンドの一例として、「P
erez」あるいは「Johnson」のようなメッセ
ージのヘッダにおいて識別されたいずれかの発呼者の名
前、あるいは「消去」ないし「セーブ」のような他のコ
マンドを暗唱することが挙げられる。したがって、ステ
ップ510において、「Perez」や「Johnso
n」のような名前を識別する口頭のコマンドを受領した
ことをCPUが判定した場合には、CPUはステップ5
12に進む。あるいは、ステップ510において、CP
Uは、メッセージサービスを維持する他のコマンドを受
領したと判定した場合には、ステップ514に進む。最
後に、ステップ510において、CPUは、「呼」コマ
ンドを受領したと判定した場合、加入者に「誰からの呼
?」の促し、音声ダイヤルを実行するためにステップ5
06に進む。
【0066】ステップ510において加入者の相手の名
前の発語によりメッセージ検索が要求された場合、CP
Uはステップ512において加入者の発語内で認識され
たサブワード転記に関連したメッセージにアクセスす
る。例えば、加入者が「Johnson」と発語し、ま
たステップ510で「Johnson」が認識された場
合には、CPUはJohnsonに対するサブワード転
記に関連したメッセージにアクセスする。したがって、
CPUはJohnsonからのメッセージにアクセスし
再生するように再生/記録回路53に命令する。ステッ
プ512の後、CPUはステップ516においてユーザ
に次のコマンドを促す。CPUは次いで、ステップ51
0に戻り、以下の処理を行う。
【0067】ステップ510において他のコマンドが要
求された場合、ステップ514においてCPUは加入者
の発語内で識別される要求されたコマンドを遂行する。
このため、CPUは、与えられたコマンドに関連するよ
り多くの情報を要求する。例えば、コマンドが「セー
ブ」である場合、CPUは再生/記録回路53に対し
て、ユーザに「誰からのメッセージをセーブ?」を質問
するように促す。このような場合、CPUは次いで、名
前を認識し、また認識された名前に対応するメッセージ
について要求されたコマンドを実行する。ステップ51
4の後、CPUはユーザに対して、ステップ516にお
いて次のコマンドを促す。CPUは次いで、ステップ5
10に戻り、その後の処理を行う。
【0068】ここで、上記に代えて、加入者は、ステッ
プ510、512、514および516の間のいずれか
の時点で、「呼」のような音声コマンドを発行すること
で音声ダイアラーを呼出すようにしても良い。この場
合、CPUは次いで、音声ダイアルを行うために直ちに
ステップ506に戻る。
【0069】図4、図5および図6に記載した、一例の
拡張された音声作動式の電気通信サービスシステムは、
現存のシステムに対していくつかの改良点がある。被呼
者あるいは発呼者の名前の本文データを検索し、またこ
れから音声認識データを発生することで、音声認識プレ
ートの加入者のデータベースは迅速および容易に移植さ
れる。一般的には、従来技術では、このようなデータを
得るために広範囲の訓練工程に依存している。各データ
ベースのレコードが繰り返しの加入者の発語および関連
した電話番号の加入者の知識を必要とすることから、こ
れらの工程における加入者の手間が多大である。対照的
に、本発明の方法と装置では、入接続呼と出接続呼の間
に自動的にデータベースレコードを移植している。さら
に、本発明では、上記した拡張されたメッセージ機能お
よび呼待ち機能が提供される。
【0070】本発明の別の実施の形態において、サービ
スユニットは、加入者の呼履歴を使用して加入者のデー
タベースを自動的に移植するように動作する。例えば、
CPUは、図1のPSTN30から、加入者により多く
呼ばれるN個の電話番号を求める。CPUは次いで、音
声認識テンプレートおよびN個の最も多く呼ばれた番号
のそれぞれの電話番号を含むデータベースレコードを発
生する。この別の実施の形態は、図3のステップ350
を、加入者により最も多く呼ばれたN個の電話番号に対
する図1のPSTN30への問い合わせを含むステップ
に置き換えることで達成される。次いで、ステップ35
1から354がN個の電話番号のそれぞれに対して繰り
返される。このような実施の形態は、加入者に、音声作
動サービスにより使用される即席のデータベースを提供
することができる。もちろん、この実施の形態と図4、
図5および図6の実施の形態を一緒に組み合わせても良
い。
【0071】他の実施の形態では、図1と図2のサービ
ス回路121 …12N により実行されるサービスおよび
機能が、加入者セット32内ないしこれに近接した加入
者装置により実行される。このような実施の形態は図7
に関連して以下に簡単に説明する。
【0072】図7は、本発明による、拡張された音声作
動の通信サービスを提供するように動作する、加入者セ
ット700を示したものである。加入者セット700
は、統合サービスデジタル通信網(「ISDN」)ライ
ン701、ISDNラインインターフェース702、A
SR回路703、CPU回路704、音声バス705お
よびデータバス706を含んでいる。ISDNラインは
ISDNインターフェース702を、図1の外部交換機
20のような外部交換機(図示せず)に接続する。IS
DNラインは、少なくとも2つのデジタル音声信号チャ
ネルおよびデータチャネルを提供するように動作する。
音声チャネルは音声信号を通信するために好ましくは使
用され、またデータチャネルは、ICLID情報および
外部交換機から入手可能な他のデータのような、呼情報
データを通信するために好ましくは使用される。
【0073】データバス716はISDNインターフェ
ース702、ASR回路703およびCPU回路704
の間のデータ接続を提供する。音声バス705は、AS
R回路703への音声信号通信を提供する。CPU回路
704は図2に関連して上記で説明したCPU回路54
と同様な回路である。同様に、ASR回路703は、図
2に関連して上記で説明したASR回路52と同様なも
のである。
【0074】動作中は、CPU回路704のCPUおよ
びASR703は、図2、図3、図4、図5、図6およ
び図8に関連して上記で説明したのと実質的に同じ態様
でで動作する。この実施の形態においては、しかしなが
ら、入接続呼および出接続呼は、本発明の目的のために
図1および図2のサービス回路12X を通って経路指定
されない。その代わりに、入接続呼はデジタルISDN
の音声チャネル上で直接加入者に供給される。また、本
発明を実施するのに必要なデータ通信は、ISDNのデ
ータチャネル上で伝送される。例えば、図3に例示した
フローダイヤグラムを実行する。ステップ350におい
て、回路704のCPUは好ましくはデータチャネル上
で発呼者識別情報を受領する。ステップ351におい
て、CPU回路704は、外部交換機およびISDNデ
ータチャネルを経てPSTNから付加データベースから
の情報を要求し受領する。ここで、ISDN音声チャネ
ルは、本発明により容易化される上記した拡張された音
声作動のサービスの一部としての、呼会議および呼待ち
をサポートする。
【0075】このような実施の形態は、ISDNライン
を含む高性能の消費者側の設備が必要であるので、現在
の時点では、あまり好ましいものではない。しかしなが
ら、このような実施の形態が技術進歩によりコスト効率
の良いものとなった場合、サービスプロバイダの宅内装
置上での拡張された音声作動の通信サービスを提供する
ことができる。
【0076】以上、本発明の実施の形態を説明したが、
これらの実施の形態は例示的なものである。当業者であ
れば、本発明の原理および範囲内で他の実施の形態を容
易に案出できる。例えば、上記実施の形態はPSTNを
基礎とする電話システムについてのものであるが、本発
明は、インターネットのような、音声(およびデータ)
通信をサポートする他の通信ネットワークにも容易に適
用できる。このような他のネットワークでは、電話番号
の代わりに電気通信ネットワークのユーザ(あるいは入
接続する発呼者)を識別するためにネットワークアドレ
スのような他の種類の接続アドレスが使用される。さら
に、上記した方法により発生された音声認識テンプレー
トも同様に加入者の発語により変更され補足される。例
えば、図6のステップ506において、加入者が相手の
名前を音声ダイヤルのために話した場合、ASR回路5
2はこの発語を音声認識テンプレートを変更するために
使用し、あるいは、その相手に関連する加入者のデータ
ベースレコード内の、話者に依存する音声認識テンプレ
ートに単に追加する。このような点は当業者には容易に
実施できる。
【0077】さらに、電気通信ネットワークのユーザを
識別するために接続アドレスを使用することは、一例に
すぎない。他の実施の形態においては、ユーザのクレジ
ットカード番号、あるいは自宅の住所を電気通信ネット
ワークのユーザを識別するために使用することもでき
る。このようなシステムでは、本発明によるシステムに
音声認識テンプレートを改良させるために、付加のデー
タベースがクレジットカード番号あるいは自宅の住所を
ネットワークのユーザに関連する本文情報に相互関連付
けする。実際には、ユーザの名前を表す本文を結合する
データベースがある限り、電気通信ネットワークのユー
ザを識別するあらゆる入力を使用することができる。
【図面の簡単な説明】
【図1】ネットワークサービスシステム、外部交換器、
公衆電話交換ネットワークを含む、通信ネットワークを
例示した説明図。
【図2】本発明によるビデオ作動式の電気通信サービス
を提供する例示的なサービス回路を例示した説明図。
【図3】図2のサービス回路の一部を構成するASR回
路の例示的な実施の形態のダイヤグラムである。
【図4】入接続呼に関連して本発明においてCPUの動
作により実行される動作の不ローの説明図である。
【図5】呼待の場合で、本発明において動作するCPU
の動作の例示的な手順を例示した説明図。
【図6】本発明において加入者により生じたサービス回
路の軌道によりCPUによって行われる動作の例示的な
シーケンスの説明図。
【図7】本発明により、拡張された音声作動通信サービ
スを提供するために動作可能な加入者のセットを例示し
た説明図。
【図8】本発明により各入接続あるいは出接続に対応す
るデータベースレコードを発生するために、図2のサー
ビス回路のCPUにより実行される機能のフローダイヤ
グラムである。
【符号の説明】
10 ネットワークサービスシステム 20 外部交換機 22 データトランク 24 音声トランク 30 公衆電話ネットワーク(PSTN)
───────────────────────────────────────────────────── フロントページの続き (72)発明者 エム.ユドコウスキー アメリカ合衆国 60645 イリノイズ,シ カゴ,ウエスト ファーゴ 2952

Claims (34)

    【特許請求の範囲】
  1. 【請求項1】 自動音声認識(ASR)システムを含む
    システムにおいて、ASRシステムの能力を拡張するた
    めに付加データベースに記憶された情報を利用する方法
    において、 a) 電気通信ネットワークのユーザのアスペクトを識
    別する第1の入力を求めるステップ、 b) 付加データベース内に蓄積された、第1の入力に
    関連した本文情報からなる付加情報を識別し検索するス
    テップ、 c) 付加データベースから検索された追加情報から派
    生された音声認識テンプレートを生成するステップ、お
    よび d) 発語を構成するとともに付加情報を示す情報を含
    む、第2の入力を認識するために音声認識テンプレート
    を使用するステップからなることを特徴とする方法。
  2. 【請求項2】 a)ステップが、電気通信ネットワーク
    のユーザに関連した接続アドレスを求めることをさらに
    含むことを特徴とする請求項1記載の方法。
  3. 【請求項3】 a)ステップが、電気通信ネットワーク
    のユーザからの入接続呼に対応する公衆電話交換ネット
    ワーク設備からの入接続呼の発呼者のライン識別情報を
    求めることをさらに含むことを特徴とする請求項2記載
    の方法。
  4. 【請求項4】 ステップa)が、電気通信ネットワーク
    のユーザへの出接続呼におけるダイヤルされた電話番号
    を求めることをさらに含むことを特徴とする請求項2記
    載の方法。
  5. 【請求項5】 ステップa)が、第1の入力を生成する
    ために発語を求めるとともに発語を認識することをさら
    に含むことを特徴とする請求項1記載の方法。
  6. 【請求項6】 付加情報が本文情報を含む、またステッ
    プ(c)が付加情報のサブワード転写を発生するために
    テキスト−音声システムを使用するステップをさらに含
    むことを特徴とする請求項1記載の方法。
  7. 【請求項7】 第1の入力と音声認識テンプレートを含
    む、加入者のデータベースのための記録を生成するステ
    ップをさらに含むことを特徴とする請求項1記載の方
    法。
  8. 【請求項8】 ステップe)が、第2の入力を認識した
    後に電気通信ネットワークのユーザを含めた通信サービ
    スを行うことをさらに含むことを特徴とする請求項1記
    載の方法。
  9. 【請求項9】 ステップe)が、電気通信ネットワーク
    のユーザにより発生された記録メッセージを検索するこ
    とをさらに含むことを特徴とする請求項8記載の方法。
  10. 【請求項10】 ステップe)が、電気通信ネットワー
    クのユーザに関連した電話番号に自動的にダイアルする
    ことをさらに含むことを特徴とする請求項8記載の方
    法。
  11. 【請求項11】 電話ネットワークにおいて、ASRシ
    ステムの能力を拡張するために付加(追加)データベー
    スに記憶された情報を利用する方法において、 a)発呼者からの入接続呼を受信するステップ、 b)発呼者に関連した電話番号を求めるステップ、 c)電話番号をインデックスとして使用して付加データ
    内に蓄積された付加情報を検索するステップ、 d)付加データベースから検索された本文データに対応
    する音声認識テンプレートを生成するステップ、および e)音声認識テンプレートおよび発呼者に関連した電話
    番号を蓄積するステップからなることを特徴とする方
    法。
  12. 【請求項12】 音声認識テンプレートからなる、付加
    情報のサブワード転写を発生するためにテキスト−音声
    システムを使用するステップをさらに含むことを特徴と
    する請求項11記載の方法。
  13. 【請求項13】 音声認識アルゴリズムおよび音声認識
    テンプレートを使用して、発呼者を識別する情報を含む
    第2の発語を認識するステップをさらに含むことを特徴
    とする請求項11記載の方法。
  14. 【請求項14】 電気通信ネットワークに関して使用さ
    れる音声作動サービスシステムにおいて、 a)テキスト−音声システムを含み、発語を1つまたは
    それより多くの音声認識テンプレートと比較することに
    より発語を認識するために動作する自動音声認識回路、 b)自動音声認識回路に接続され、第1の入力を求める
    ために動作するコンピュータ処理ユニットをからなり、 前記第1の入力は電気通信ネットワークのユーザのアス
    ペクトを識別し、またコンピュータ処理ユニットはさら
    に第1の入力に関連した第1のデータベースからの本文
    情報を検索するために動作可能であり、 またテキスト−音声システムが本文情報から音声認識テ
    ンプレートを発生するために動作することを特徴とする
    音声作動サービスシステム。
  15. 【請求項15】 自動音声認識回路が第2の入力を認識
    するためにさらに動作可能であり、前記第2の入力が本
    文情報を表す情報を含む発語からなることを特徴とする
    請求項14記載の音声作動サービスシステム。
  16. 【請求項16】 コンピュータ処理ユニットが第1の入
    力を検索するために動作可能であり、第1の入力が電気
    通信ネットワークのユーザに関連した接続アドレスから
    なることを特徴とする請求項14記載の音声作動サービ
    スシステム。
  17. 【請求項17】 コンピュータ処理ユニットが第1の入
    力を検索するためにさらに動作可能であり、第1の入力
    が電気通信ネットワークのユーザに関連した電話番号を
    含む接続アドレスからなることを特徴とする請求項16
    記載の音声作動サービスシステム。
  18. 【請求項18】 コンピュータ処理ユニットが第1のデ
    ータベースから本文情報を検索するためにさらに動作可
    能であり、第1のデータベースが本文名前情報を複数の
    電気通信ネットワークのユーザに対する電話番号情報と
    関連させる情報を含んでいることを特徴とする請求項1
    7記載の音声作動サービスシステム。
  19. 【請求項19】 コンピュータ処理ユニットが、本文情
    報および音声認識テンプレートからなる加入者データベ
    ースレコードを発生するためにさらに動作可能であるこ
    とを特徴とする請求項14記載の音声作動サービスシス
    テム。
  20. 【請求項20】 コンピュータ処理ユニットが、加入者
    データベースレコードを使用した音声ダイヤルを含む複
    数の音声作動サービスを行うためにさらに動作可能であ
    ることを特徴とする請求項19記載の音声作動サービス
    システム。
  21. 【請求項21】 前記自動音声認識回路が音声発生器を
    さらに含み、前記音声発生器は本文情報を表す音声出力
    信号を発生するために動作可能であることを特徴とする
    請求項21記載の音声作動サービスシステム。
  22. 【請求項22】 コンピュータ処理ユニットが、加入者
    ラインが電話呼を維持しているときに音声発生器が本文
    情報を表す音声出力信号を加入者に提供させるために、
    動作可能であることを特徴とする請求項21記載の音声
    作動サービスシステム。
  23. 【請求項23】 電気通信ネットワークに関して使用さ
    れる音声作動サービスシステムにおいて、 a)コンピュータ処理ユニットにより実行されるプログ
    ラムを含むメモリ、 b)メモリにその内部のプログラムを実行するために作
    動的に接続され、メモリ内のプログラムを次のために実
    行する中央処理ユニット(CPU)、 電気通信ネットワークのユーザのアスペクトを識別す
    る、第1の入力を求め、 第1の入力に関連した、本文情報からなる付加データを
    検索し、 自動音声認識回路に付加データから音声認識テンプレー
    トを発生することを命令し、および自動音声認識回路に
    音声認識テンプレートを使用して発語からなる第2の入
    力を認識することを命令することを特徴とする音声作動
    サービスシステム。
  24. 【請求項24】 付加データから音声認識テンプレート
    を発生し、また音声認識テンプレートを使用して第2の
    入力を認識するために動作可能な自動音声認識システム
    をさらに含むことを特徴とする請求項23記載の音声作
    動サービスシステム。
  25. 【請求項25】 CPUが、電気通信ネットワークのユ
    ーザの接続アドレスの形態で第1の入力を求めるために
    メモリ内のプログラムを実行するためにさらに動作可能
    であることを特徴とする請求項23記載の音声作動サー
    ビスシステム。
  26. 【請求項26】 CPUが、認識された第2の入力を使
    用して音声ダイヤルサービスを行うためにメモリ内のプ
    ログラムを実行するためにさらに動作可能であることを
    特徴とする請求項25記載の音声作動サービスシステ
    ム。
  27. 【請求項27】 CPUが、電気通信ネットワークのユ
    ーザの接続アドレスをおよび発生された音声認識テンプ
    レート含むデータベースレコードを発生するためにメモ
    リ内のプログラムを実行するようにさらに動作可能であ
    ることを特徴とする請求項25記載の音声作動サービス
    システム。
  28. 【請求項28】 CPUが、複数のレコードを含むデー
    タベースを発生し維持するためにさらに動作可能であ
    り、各レコードは、電気通信ネットワークのユーザに対
    応するともに、電気通信ネットワークのユーザに関連し
    た接続アドレスおよび電気通信ネットワークのユーザに
    関連した音声認識テンプレートを含むことを特徴とする
    請求項27記載の音声作動サービスシステム。
  29. 【請求項29】 電気通信ネットワークおよびCPUに
    作動的に接続された再生/記録回路をさらに含み、前記
    再生/記録回路は電気通信ネットワークのユーザに記録
    された通知を再生するとともに電気通信ネットワークの
    ユーザにより話された発語を記録するように動作可能で
    あることを特徴とする請求項23記載の音声作動サービ
    スシステム。
  30. 【請求項30】 CPUがさらに、 電気通信ネットワークのユーザがメッセージを残してお
    くために指示し記録された通知を再生するように再生/
    記録回路に命令し、 電気通信ネットワークのユーザからの発語を記録するよ
    うに再生/記録回路に命令し、および記録された発語を
    音声認識テンプレートに関連付けさせるように動作可能
    であることを特徴とする請求項29記載の音声作動サー
    ビスシステム。
  31. 【請求項31】 CPUがさらに、ASR回路に、加入
    者により提供された第2の発語を音声認識テンプレート
    を使用して認識させるために動作可能であり、および認
    識された第2の発語が音声認識テンプレートに対応する
    場合には電気通信ネットワークのユーザからの記録され
    た発語を再生するように再生/記録回路に命令するよう
    に動作可能であることを特徴とする請求項30記載の音
    声作動サービスシステム。
  32. 【請求項32】 CPUがさらに、電気通信ネットワー
    クのユーザから加入者への入接続呼の間において、第1
    の入力を求めるために、メモリ内のプログラムを実行す
    るために動作可能であることを特徴とする請求項23記
    載の音声作動サービスシステム。
  33. 【請求項33】 CPUがさらに、第1の入力が電気通
    信ネットワークのユーザの電話番号であるときに第1の
    入力を求めるためにメモリ内のプログラムを実行するた
    めに動作可能であることを特徴とする請求項32記載の
    音声作動サービスシステム。
  34. 【請求項34】 CPUがさらに、外部交換器から提供
    されるデータを使用して電気通信ネットワークのユーザ
    の電話番号を求めるために、メモリ内のプログラムを実
    行するために動作可能であることを特徴とする請求項3
    3記載の音声作動サービスシステム。
JP34141796A 1995-12-21 1996-12-20 電話における自動音声認識のための方法 Expired - Lifetime JP4247929B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/576740 1995-12-21
US08/576,740 US5822727A (en) 1995-03-30 1995-12-21 Method for automatic speech recognition in telephony

Publications (2)

Publication Number Publication Date
JPH09186770A true JPH09186770A (ja) 1997-07-15
JP4247929B2 JP4247929B2 (ja) 2009-04-02

Family

ID=24305793

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34141796A Expired - Lifetime JP4247929B2 (ja) 1995-12-21 1996-12-20 電話における自動音声認識のための方法

Country Status (3)

Country Link
US (1) US5822727A (ja)
EP (1) EP0780829B1 (ja)
JP (1) JP4247929B2 (ja)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6041109A (en) * 1995-12-29 2000-03-21 Mci Communications Corporation Telecommunications system having separate switch intelligence and switch fabric
US6073101A (en) * 1996-02-02 2000-06-06 International Business Machines Corporation Text independent speaker recognition for transparent command ambiguity resolution and continuous access control
US5943648A (en) * 1996-04-25 1999-08-24 Lernout & Hauspie Speech Products N.V. Speech signal distribution system providing supplemental parameter associated data
WO1998000958A1 (en) 1996-06-28 1998-01-08 Advanced Micro Devices, Inc. Telephone calling party announcement system and method
US6018568A (en) * 1996-09-25 2000-01-25 At&T Corp. Voice dialing system
GB9620082D0 (en) 1996-09-26 1996-11-13 Eyretel Ltd Signal monitoring apparatus
US6108630A (en) * 1997-12-23 2000-08-22 Nortel Networks Corporation Text-to-speech driven annunciation of caller identification
US6775264B1 (en) * 1997-03-03 2004-08-10 Webley Systems, Inc. Computer, internet and telecommunications based network
US8209184B1 (en) * 1997-04-14 2012-06-26 At&T Intellectual Property Ii, L.P. System and method of providing generated speech via a network
US5897616A (en) 1997-06-11 1999-04-27 International Business Machines Corporation Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases
US6418461B1 (en) 1997-10-06 2002-07-09 Mci Communications Corporation Intelligent call switching node in an intelligent distributed network architecture
US6094574A (en) * 1997-10-31 2000-07-25 Vance; Kenneth Ronald Alpha enhanced paging and voice mail system and method
US6173041B1 (en) 1997-11-13 2001-01-09 Advanced Micro Devices, Inc. System and method for reducing call interruptions on a telephone
US6178230B1 (en) 1997-11-13 2001-01-23 Advanced Micro Devices, Inc. System and method for identifying a callee of an incoming telephone call
GB9800590D0 (en) * 1998-01-13 1998-03-11 Bae Sema Ltd Intelligent human computer interface system
EP0942575A3 (en) * 1998-03-12 2001-11-14 Novcom N.V. Adaptive telephone answering system
US6332023B1 (en) * 1998-06-04 2001-12-18 Mci Communications Corporation Method of and system for providing services in a communications network
CA2362195A1 (en) * 1999-02-01 2000-08-24 Webley Systems, Inc. Speech-recognition-based phone numbering plan
US7203296B2 (en) * 1999-04-16 2007-04-10 Sbc Properties, L.P. Method, system, and article for placing a telephone call to a previously-called party
US7689416B1 (en) 1999-09-29 2010-03-30 Poirier Darrell A System for transferring personalize matter from one computer to another
US6510414B1 (en) 1999-10-05 2003-01-21 Cisco Technology, Inc. Speech recognition assisted data entry system and method
US6526377B1 (en) * 1999-11-02 2003-02-25 Intel Corporation Virtual presence
US6721705B2 (en) 2000-02-04 2004-04-13 Webley Systems, Inc. Robust voice browser system and voice activated device controller
US7516190B2 (en) 2000-02-04 2009-04-07 Parus Holdings, Inc. Personal voice-based information retrieval system
WO2001063942A2 (en) 2000-02-25 2001-08-30 Pulsar Communications, Inc. Enhanced telecommunications services
US6829344B1 (en) 2000-03-17 2004-12-07 Lucent Technologies Inc Methods and devices for forwarding identification data
US7047196B2 (en) 2000-06-08 2006-05-16 Agiletv Corporation System and method of voice recognition near a wireline node of a network supporting cable television and/or video delivery
FR2810185A1 (fr) * 2000-06-09 2001-12-14 France Telecom Procede et dispositif de gestion de mise en relation telephonique sans divulgation de numero de telephone
US6907111B1 (en) 2000-08-09 2005-06-14 Bellsouth Intellectual Property Corporation Network and method for providing a name and number delivery telecommunications services with automatic speech recognition capability
US6826529B1 (en) 2000-08-09 2004-11-30 Bellsouth Intellectual Property Corporation Network and method for providing a call screening telecommunications service with automatic speech recognition capability
US6873686B1 (en) 2000-08-09 2005-03-29 Bellsouth Intellectual Property Corporation Network and method for providing a calling name telecommunications service with automatic speech recognition capability
US6505163B1 (en) * 2000-08-09 2003-01-07 Bellsouth Intellectual Property Corporation Network and method for providing an automatic recall telecommunications service with automatic speech recognition capability
US6778640B1 (en) * 2000-08-09 2004-08-17 Bellsouth Intellectual Property Corporation Network and method for providing a user interface for a simultaneous ring telecommunications service with automatic speech recognition capability
US8041023B1 (en) * 2000-09-29 2011-10-18 Aspect Software, Inc. System and method of using a phone to access information in a call center
US20020069057A1 (en) * 2000-12-05 2002-06-06 Kapust Gregory J. Methods for peer to peer sharing of voice enabled document templates
US6788767B2 (en) * 2000-12-28 2004-09-07 Gateway, Inc. Apparatus and method for providing call return service
US7305345B2 (en) * 2001-02-15 2007-12-04 Livewire Acquisition, Inc. Methods, systems, and computer program products for providing automated customer service via an intelligent virtual agent that is trained using customer-agent conversations
US8095370B2 (en) 2001-02-16 2012-01-10 Agiletv Corporation Dual compression voice recordation non-repudiation system
US7139704B2 (en) * 2001-11-30 2006-11-21 Intel Corporation Method and apparatus to perform speech recognition over a voice channel
US20030108046A1 (en) * 2001-12-06 2003-06-12 Simeone John B. Interface device
US7162414B2 (en) * 2001-12-07 2007-01-09 Intel Corporation Method and apparatus to perform speech recognition over a data channel
US7197132B2 (en) 2002-03-21 2007-03-27 Rockwell Electronic Commerce Technologies, Llc Adaptive transaction guidance
US7103168B2 (en) * 2002-04-16 2006-09-05 Bellsouth Intellectual Property Corporation Methods and systems for implementing personal dialing plans
DE10238285A1 (de) * 2002-08-21 2004-03-04 Siemens Ag Verfahren und Vorrichtung zum Bereitstellen von Konferenzen
US7606718B2 (en) * 2003-05-05 2009-10-20 Interactions, Llc Apparatus and method for processing service interactions
US9710819B2 (en) * 2003-05-05 2017-07-18 Interactions Llc Real-time transcription system utilizing divided audio chunks
US8223944B2 (en) * 2003-05-05 2012-07-17 Interactions Corporation Conference call management system
US7765153B2 (en) * 2003-06-10 2010-07-27 Kagi, Inc. Method and apparatus for verifying financial account information
US7243072B2 (en) * 2003-06-27 2007-07-10 Motorola, Inc. Providing assistance to a subscriber device over a network
US20050149327A1 (en) * 2003-09-11 2005-07-07 Voice Signal Technologies, Inc. Text messaging via phrase recognition
US20060026097A1 (en) * 2004-07-30 2006-02-02 Kagi, Inc. Method and apparatus for verifying a financial instrument
US7636426B2 (en) * 2005-08-10 2009-12-22 Siemens Communications, Inc. Method and apparatus for automated voice dialing setup
US7588181B2 (en) 2005-09-07 2009-09-15 Ty Shipman Method and apparatus for verifying the legitamacy of a financial instrument
US20070217396A1 (en) * 2006-03-14 2007-09-20 Aibelive Co., Ltd. Method and apparatus for making VoIP connection through network
US20100164914A1 (en) * 2007-02-13 2010-07-01 Ntera Limited Voltage feedback circuit for active matrix reflective display devices
US8060366B1 (en) 2007-07-17 2011-11-15 West Corporation System, method, and computer-readable medium for verbal control of a conference call
US8489398B1 (en) 2011-01-14 2013-07-16 Google Inc. Disambiguation of spoken proper names
US9286894B1 (en) 2012-01-31 2016-03-15 Google Inc. Parallel recognition

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5301227A (en) * 1989-04-17 1994-04-05 Sanyo Electic Co., Ltd. Automatic dial telephone
US5181238A (en) * 1989-05-31 1993-01-19 At&T Bell Laboratories Authenticated communications access service
US5058152A (en) * 1989-12-12 1991-10-15 The Telephone Connection Anonymous interactive telephone system having direct connect feature
US5127043A (en) * 1990-05-15 1992-06-30 Vcs Industries, Inc. Simultaneous speaker-independent voice recognition and verification over a telephone network
US5517558A (en) * 1990-05-15 1996-05-14 Voice Control Systems, Inc. Voice-controlled account access over a telephone network
US5303299A (en) * 1990-05-15 1994-04-12 Vcs Industries, Inc. Method for continuous recognition of alphanumeric strings spoken over a telephone network
US5125022A (en) * 1990-05-15 1992-06-23 Vcs Industries, Inc. Method for recognizing alphanumeric strings spoken over a telephone network
US5282243A (en) * 1990-07-03 1994-01-25 At&T Bell Laboratories Recording of automatic number identification to identify lost customers
US5165095A (en) * 1990-09-28 1992-11-17 Texas Instruments Incorporated Voice telephone dialing
JP2880592B2 (ja) * 1990-10-30 1999-04-12 インターナショナル・ビジネス・マシーンズ・コーポレイション 複合音声情報の編集装置および方法
US5276731A (en) * 1991-04-26 1994-01-04 Rolm Company Method and apparatus for handling incoming telephone calls
US5212730A (en) * 1991-07-01 1993-05-18 Texas Instruments Incorporated Voice recognition of proper names using text-derived recognition models
US5333173A (en) * 1991-10-15 1994-07-26 Bell Atlantic Network Services, Inc. Personal checkup service and equipment
CA2088080C (en) * 1992-04-02 1997-10-07 Enrico Luigi Bocchieri Automatic speech recognizer
US5297183A (en) * 1992-04-13 1994-03-22 Vcs Industries, Inc. Speech recognition system for electronic switches in a cellular telephone or personal communication network
JP3144595B2 (ja) * 1992-05-08 2001-03-12 ソニー株式会社 音声アダプタ
US5287403A (en) * 1992-07-22 1994-02-15 At&T Bell Laboratories Method and apparatus for processing telephone calls charged to credit cards
US5325421A (en) * 1992-08-24 1994-06-28 At&T Bell Laboratories Voice directed communications system platform
US5436957A (en) * 1992-12-24 1995-07-25 Bell Atlantic Network Services, Inc. Subscriber control of access restrictions on a plurality of the subscriber's telephone lines
US5311594A (en) * 1993-03-26 1994-05-10 At&T Bell Laboratories Fraud protection for card transactions
US5479489A (en) * 1994-11-28 1995-12-26 At&T Corp. Voice telephone dialing architecture
US5724481A (en) * 1995-03-30 1998-03-03 Lucent Technologies Inc. Method for automatic speech recognition of arbitrary spoken words

Also Published As

Publication number Publication date
JP4247929B2 (ja) 2009-04-02
EP0780829A3 (en) 1998-10-07
US5822727A (en) 1998-10-13
EP0780829B1 (en) 2011-09-28
EP0780829A2 (en) 1997-06-25

Similar Documents

Publication Publication Date Title
JP4247929B2 (ja) 電話における自動音声認識のための方法
US5651055A (en) Digital secretary
US5797124A (en) Voice-controlled voice mail having random-order message retrieval based on played spoken identifier list
US5594784A (en) Apparatus and method for transparent telephony utilizing speech-based signaling for initiating and handling calls
US6049594A (en) Automatic vocabulary generation for telecommunications network-based voice-dialing
EP0935378B1 (en) System and methods for automatic call and data transfer processing
US8964949B2 (en) Voice response apparatus and method of providing automated voice responses with silent prompting
US7599474B2 (en) Voice recognition for filtering and announcing message
JP3561076B2 (ja) 任意に話された単語の自動通話認識方法
US7127400B2 (en) Methods and systems for personal interactive voice response
US5930336A (en) Voice dialing server for branch exchange telephone systems
US6563911B2 (en) Speech enabled, automatic telephone dialer using names, including seamless interface with computer-based address book programs
US8145495B2 (en) Integrated voice navigation system and method
US6671354B2 (en) Speech enabled, automatic telephone dialer using names, including seamless interface with computer-based address book programs, for telephones without private branch exchanges
US20020091530A1 (en) Interactive voice response system and method having voice prompts with multiple voices for user guidance
Tschirgi et al. Speech technology and applications in the intelligent network
CA2256781A1 (en) Method and apparatus for automatically dialling a desired telephone number using speech commands
JPH03157696A (ja) 音声応答認識方式
MXPA97005352A (en) Automatic generation of vocabulary for dialing via voice based on telecommunication network
Park et al. Membering TM: A Conference Call Service with Speaker-Independent Name Dialing on AIN

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050216

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20050516

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20050519

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050905

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051205

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060320

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060619

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060818

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20060929

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080826

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080829

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090109

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120123

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130123

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term