JP2000507021A - モジュール式会話構造に基づくような両面音声の形態における人間―機械会話を実行する方法および装置 - Google Patents

モジュール式会話構造に基づくような両面音声の形態における人間―機械会話を実行する方法および装置

Info

Publication number
JP2000507021A
JP2000507021A JP10529154A JP52915498A JP2000507021A JP 2000507021 A JP2000507021 A JP 2000507021A JP 10529154 A JP10529154 A JP 10529154A JP 52915498 A JP52915498 A JP 52915498A JP 2000507021 A JP2000507021 A JP 2000507021A
Authority
JP
Japan
Prior art keywords
sub
conversations
conversation
interface
siblings
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10529154A
Other languages
English (en)
Inventor
ホルガー ウェルネル ブレーデ
ノラフ スフルール
イェンス フリードマン マルスフネル
ハラルト オースト
デル オルモ エンリケ マルティ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Electronics NV filed Critical Philips Electronics NV
Publication of JP2000507021A publication Critical patent/JP2000507021A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Exchange Systems With Centralized Control (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Machine Translation (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

(57)【要約】 トランザクション環境において機械−制御の人間−機械会話を実行するために、アクセス呼を受けるステップと、会話構造において、出力音声項目によって前記アクセス呼に質問し、実際のトランザクションインスタンスを確定するその後に受けた人間音声項目を検査するステップと、前記出力音声項目を前記検査にしたがって、肯定的トランザクション結果を達成するか、他の場合、失敗の場合において前記会話を抜け出すまで、発生するステップとを実行する。特に、前記会話を、階層的に配置されると共に呼び出し可能な、各々の互いに独立したビルディングブロックを構成するサブ会話から構成し、これらのサブ会話を、肯定的結果が問題のサブ会話によって得られた場合、特定の結果を発生するように配置し、これらのサブ会話が、階層的に上位のサブ会話と互いに結合するインタフェースを提供し、その結果として、全体としての前記構造が、サブ会話の選択に基づいて形成されると共に、前記構造におけるサブ会話の各々によって要求された部分的結果に排他的に基づいて形成されるようにした。

Description

【発明の詳細な説明】 モジュール式会話構造に基づくような両面音声の形態における人間−機械会話を 実行する方法および装置発明の背景 本発明は、請求の範囲の序文に詳述したような方法に関係する。種々のシステ ムが、人間のユーザを、双方向音声チャネルを保持する機械に向かい合わせ、人 間の音声を解析し、理解し、機械が発生した音声で返答するようになってきた。 この処理の性質は、経済的なことであり、物理的項目またはサーバは、顧客によ って注文され、顧客に引き渡される。代わりに、前記処理を、公共輸送機関、天 気予報等に関係するような問い合わせとしてもよい。依然として他の形式の処理 も同様に可能である。人間の音声の認識は、それ自体の解析が複雑であり、前記 音声が種々の異なったレベルにおいてそれ自体しばしば矛盾する、すなわち、単 語が欠落または過剰になるかもしれず、実際の句が自己矛盾または結論のでない ものであるかもしれず、個々の文が互いを無意味にするかもしれないため、技術 的に厳しい問題を残している。したがって、本発明は、あるいは種々の他の目的 に再利用されるならば、正確に作動していることを示すシステムのこのような要 素を金塊として考えるべきである。発明の要約 したがって、特に、本発明の目的は、会話開発において、そして多会話システ ムの使用において、証明されたビルディングブロックの再利用をできるだけ多く し、全体としての構造を前記システムの適切な説明を通じて個々の問題に対して 作り変え、前記構造の構成をモジュール式会話の使用を通じて容易にすることで ある。したがって、その一態様によれば、本発明は、請求の範囲1の特徴部分に したがって特徴づけられる。種々の異なる会話または1つの会話の異なる部分は 、同一または同一に近い特徴を有するユーザ情報から抽出しようとし、サブ会話 の再利用は、いわば、ビルディングブロックに基づいて、より容易な開発を可能 にすることがわかっている。 有利に、階層の最高レベルにおけるすべてのサブ会話は、アクセス可能にする ための同形のインタフェースを有し、前記インタフェースは、身元と、一定の受 け取り可能なエンティティと、より高いレベルのサブ会話に対して示される可変 出力エンティティとを特定する。このように、種々のサブ会話間の相互通信を、 標準的且つ同じ様に構成することができ、再び、会話の開発または修正を簡単に する。 有利に、少なくとも1つの会話は、並列に配置された2つの同胞を有し、これ らにおいて、同じ出力結果に達することを保証するが、これらに対して、各々、 種々の異なる手続きを使用する。このように、種々の反対の情況を、必要ならば 、異なる認識アルゴリズムまたは個々のサブ会話の異なる構造を使用して矯正す ることができる。個々のサブ会話の実行中または、これらの各々連続する実行中 の情況変化の場合において、利用可能なサブ会話間の最適な選択を行うことがで きる。 本発明は、前記方法を実行する装置にも関係する。本発明の他の有利な態様を 、従属する請求の範囲において列挙した。 図面の簡単な説明 本発明のこれらおよび他の態様および利点を、以下の好適実施形態の開示を参 照して、特に、添付した図面の参照と共により詳細に考察する。 図1は、発明のシステムの全体的なブロック図を示す。 図2は、会話システムの構造を示す。 図3は、サブ会話から構成されたアプリケーションのリストを示す。 好適実施形態の詳細な説明 以下に、最初に、本発明の一般的な構成を、全体的なハードウェアの見地から 説明する。次に、サブ会話および同胞を有する内部構造を考察する。 図1は、本発明によるシステムの全体的なブロック図である。項目20は、公 衆電話との相互連絡を表わす。ブロック24は、このネットに対する標準的なイ ンタフェースを表わし、アナログネットに対して、前記ネットからのアナログ音 声を受け、標本化することを許可する。ブロック20は、受けた音声を認識する サブシステムである。それ自身については、音声認識は、すべて本願の譲受人に 対する米国特許出願番号第07/860,199号、米国特許出願番号第08/ 425,305号、、米国特許出願番号第08/312,495号、米国特許出 願番号第08/563,853号、米国特許出願番号第08/203,105号 および米国特許出願番号第08/587,190号のような種々の文献において 開示されている。音声認識は、本譲受人に対する米国特許出願番号第08/69 6,431号および米国特許出願番号第08/778,795号のような種々の 文献において開示されている。 ブロック28は、受けた音声項目の理解を行う会話制御サブシステムであり、 音声項目の意図が特定の処理結果に達すると、処理メモリ30に記録する。ブロ ック30は、ユーザの要求の部分を、これらが認識される限り格納し、明らかな 限り、最適の進歩に達するために、機械がどのような方針で次に進むかの指示を 格納するように構成されたトランザクションメモリである。また、最終的なトラ ンザクションを、その後のトランザクションのために記録してもよい。前記トラ ンザクションの性質それ自体を、さらには考察しない。格納フォーマットを、ア プリケーションに対して適切にすべきである。情報システムにおいて、前記項目 は、ユーザによって要求された情報の正確な性質を特定してもよく、それらの完 全な明細がわかった後に、前記システムが背後のデーータベースにアクセスし、 その後、メモリ30における情報を消去してもよい。 ブロック29は、前記メモリから、他の質問や、不完全および最終的な情報の ような、ユーザに出力すべき情報を受ける。ブロック27において、これらを音 声項目の列に変換し、ブロック25において実際の音に変換する。このように、 前記システムは、インタフェース20において音声メッセージを出力し、ユーザ からさらに必要とするような情報を引き出し、その結果、ユーザとの双方向音声 会話を行うことができる。当然、上述した種々のブロックは、ハードウェアおよ びソフトウェア構成要素を具える。 ブロック36は、特定のアプリケーションのための特別な機能キーを設けても よいが、標準的な英数字としてもよいユーザキーボードである。このキーボード を、種々の支援およびシステム管理タスクをもたらすために、オペレータによっ て使用することができる。ブロック34は、前記システムのユーザが意図するタ スクの実行の軌跡を保持するメモリの内容を示す標準的な表示画面である。項目 32は、通常、システムオペレータによって直接制御することができる項目を相 互接続する局所通信システムである。項目38は、その改善されたトランザクシ ョンを支持する、ある量のユーザ音声を格納する中間メモリである。項目33は 、前記背後データベースか、最終的なサービス提供者への接続である。 図2は、個々のサブ会話60ないし86の階層構造に基づく会話システムの一 例である。最初に、最高サブ会話MAIN 60がある。個々のサブ会話の正確 な機能は、簡潔にするために、ここでは考えない。図示するように、どのサブ会 話が、次のより低い階層レベルにおける0以上のそれに接続されたサブ会話を有 してもよい。原理的に、この数は自由である。図示するように、サブ会話62は 、インタフェース88およびボディ90を有する。メエンサブ会話60を除いて 、すべての他のサブ会話は、他で説明する同一の構造を有するこのようなインタ フェースを有する。メインサブ会話60は、アプリケーションプログラムの起動 時に自動的にアクセスされ、したがって、特定のインタフェースを必要としない 。メインサブ会話の開始時に、1つ以上の直接接続されたサブ会話62,72, 78に、前記会話の進行中にアクセスしてもよい。2つ以上のこのようなサブ会 話が同時に活性である場合、これらの間の時間逐次的実行を任意にしてもよい。 これは、このような同時活性化サブ会話が、前記階層の異なるレベルにおけるも のであっても真である。個々のサブ会話は、1つ以上のその直接下位のサブ会話 をすぐに呼ぶことができ、この場合において、後者のサブ会話の2つ以上の場合 が活性化できる。サブ会話62にアクセスするときに、下位のサブ会話66はす ぐに自動的にアクセスされ、これをサブ会話62のボタンにおける特別な矢印に よって示す。同様な関係が、サブ会話80および84間に存在する。通常、すべ てのサブ会話は互いに異なり、このことをどのような特別な方法においても示さ ない。例外として、サブ会話74および84は互いに同一であり、これを下部の 左手角における特別な記号によって示す。前記階層における異なった位置におけ る同じサブ会話の取り扱いは、もちろん、必要な格納領域を減らし、これらの物 理的な存在は1つのみ必要である。 さらに、一般的にすべての会話は、内部に単一の機構を有する。例外として、 サブ会話76は、内部に同胞と呼ばれる2つの別個の部分を有する。個々のサブ 会話の同胞の各々を、成功の場合、他の方法において、同一の結果を導くように 配置する。例えば、部分89は、48または、8および4として表わされる数を 認識することができる。他方において、部分91は、48のように個々の数字か ら排他的に成る個々のシーケンスにおいて認識してもよい。同胞の制御の下での 認識が不十分なように進む場合、問題のサブ会話は、問題のサブ会話に属するあ る特定の同胞から他の同胞に切り替えてもよい。同様に、サブ会話64は、4つ の同胞を有する。その使用の一例は、株式仲買人トランザクションへの指示の認 識としてもよく、ここで、命令、買う対売るの認識がきわめて関係する。しかし ながら、多くの言語において、これらの2つの言葉は、互いにまったくよく類似 している。したがって、認識が実行できるが最適ではない場合に可能性のある問 題を検知すときか、代わりにまったく自動的に、前記システムは、他の言語にお けるバージョンがすでに認識された後に、個々の同胞の英語バージョンに切り替 える。ある状況において、並列な4つの同胞の対策は、価値がある。 図3は、種々のサブ会話から形成されたアプリケーションのリストである。サ ブ会話は、以下の通りである。 −1−日付;このサブ会話は、ユーザに唯一の日付を与え、存在しない日付のよ うなユーザ入力エラーを処理することを可能にし、ヨーロッパにおいて2または 3(ドイツ)日の連続である「クリスマス」のような曖昧さを解決する。 −2−時間;これは、時間間隔の唯一の記述を与える。 −3−クレジットカード番号;これは、繰り返し要求されるクレジットカード番 号を与える。 −4−口座番号;これは、繰り返し要求される口座番号を与える。 −5−名前;これは、サブ会話の進行の状態に応じで、連続音声の認識、1単語 認識または綴り認識を使用する名前を与える。 −6−住所;これは、例えば、名前、通り、町および郵便番号から成る完全な住 所を与える。このサブ会話を、構成部品として会話#5および#7を使用して形 成してもよい。 −7−町の名前;これは、#5の下で特定された認識形式を使用して町の名前を 与える。 −8−製品名;これは、#5の下で特定された認識形式を使用して製品の一般的 な名前を与える。 −9−発呼者確認;これは、発呼者の唯一の確認に必要なすべての情報を与える 。このサブ会話を、アプリケーション#4および#5を使用して形成してもよい 。 −10−情報出力;これは、その任意の繰り返しを含む必要な情報を発呼者に出 力する。 −11−金額;このサブ会話の結果は、金額の指定である。 −12−注文番号;これは、注文番号の出力を与える。 本願の主要な支えによれば、また、一般的に使用されるとして、サブ会話は、 2つの側からの発音を含む。本発明の拡張によれば、図2に示す個々のモジュー ルは、機械音声出力を与えることのみに限定してもよく、インタフェースのよう なモジュールの残りの特徴を、他のモジュールに関して同じにしてもよい。ユー ザに対して視覚的効果をまったく示さない1つ以上のモジュールを有することも 可能である。簡潔にするために、すべてのこのようなモジュールを、以後サブ会 話と呼ぶ。 次に、前記アプリケーションは、以下の通りである。 −A−製品情報;これは、発呼者が個々の製品のある指定された特性について質 問することを許可する。 −B−会社発呼ルータ;これは、入り呼が宛先を部分的にのみ指定する場合、電 話または他の発呼形式を個々の人物または部門に転送することを許可する。 −C−積送り情報;これは、発呼者に個々の積送りの状態について質問させるか 、システム管理者にこのような積送りに属するデータを入力または変更させる。 −D−ホットライン;問題または特別なアクセス形式のための特別なサポート設 備。 −E−電話注文処理;これは、発呼者が個々の製品に対する注文を行い、指定す ることを許可する。 −F−コンピュータチケット−電話;これは、ユーザに、コンピュータ支援アプ リケーションにおいて電話をかけさせる。 −G−旅行者情報;これは、発呼者が、旅行者情報質問をこの質問の個々の特徴 に関して指定することを許可する。 −H−飛行機旅行情報システム;これは、発呼者が、飛行機旅行目的地、航路、 飛行情報および料金について質問することを許可する。 −I−列車情報システム;列車相互接続システム用の同上。 −J−テレバンキング;これは、発呼者が、(金の移動、支払、セキュリティの 売買のような)テレバンキングとして知られるようになってきた銀行サービスの 制限された選択を注文することを許可する。 −K−イエローページ;これは、発呼者が、いわゆる電話のイエローページまた は同様の人名簿において公開されている情報を要求することを許可する。 −L−人名簿サービス;これは。発呼者が、電話帳または同様の人名簿から情報 を要求することを許可し、名前、住所、電話番号等のような種々の異なる項目パ ラメータを使用する。図3は、個々のアプリケーションを指定する各ラインにお いて、バツ印によって、このアプリケーションを形成するために使用することが でき、この形成をモジュール式サブ会話を使用することによって容易にすること ができるサブ会話を示す。 会話、サブ会話および同胞 以下に、最初に、本発明の概念的な態様を考察する。ここで、個々のアプリケ ーションを、サブ会話またはHDDLモジュールから形成し、これらは会話構造 において相互にリンク可能である。ここで、HDDLは、高レベル会話定義言語 である。ある会話は、呼を通じて他の会話を使用することができ、これらは、こ れらの呼可能性の効力によって、サブ会話と呼ばれる。このように、全体的なサ ービスの一部である特定の活動またはサービスを、前記会話構造においてカプセ ル化することができる。例として、ホームバンキングアプリケーションは、通常 、個々の顧客のPIN番号を知る必要がある。ここで、前記システムは、前記会 話のこの部分を実行する間、認識問題を経験すると仮定すると、ここでは、本発 明により、前記システムは、実際の発呼者をより良く理解するために、同じサブ 会話内で、現在使用されているバージョンまたは同胞の代わりに、他のバージョ ンまたは同胞を呼ぶことができる。一実施形態によれば、新たな同胞は元の同胞 の 繰り返しまたは鏡でもよく、前記認識をより正確に実行してもよい。他の実施形 態において、ユーザに対する機械音声出力を、より遅くする。第3の実施形態に おいて、前記サブ会話は、元のバージョンにおいては存在しない追加の単語また は文を導入し、前記サブ会話をより明らかにする。このような追加の表現は、経 験していないユーザに与えられている例を表わしてもよい。ここで、カプセル化 は、前記サブ会話の機能が同じままであるが、実際の実装のみが変化することを 意味する。上述した同胞の概念は、設計者が、同じ会話機能を各々異なるように 実装することを可能にし、人間のユーザに対する同じ音声出力を保持するか、保 持しない。想像される結果は、種々の同胞間で同じである。複数の同胞が無い会 話は、語義において、1つの同胞のみを有する会話である。前記最高レベル会話 は、考察した実施形態において、前記同胞特徴を持たないことに注意されたい。 以下に、サブ会話を疑似コードにおいて示し、ヘッダ、ボディおよびテイルの 形態において明らかにする。 第2例: 上記において、DIALOGUEで開始する第2ラインは、種々のサブ会話間で実際的 に同一のインタフェースを表わし、前記サブ会話を名前によって呼び、この場合 において、同じラインにおいて与えられたパラメータは、前記インタフェースを 表わす。前記パラメータ値を、前記サブ会話に与えてもよい。代わりに、前記サ ブ会話は、これらのパラメータ値を、前記インタフェースに入力するために発生 してもよい。この特定の例において、Booleanは排他的に入力される。Integer & result量は、ユーザとの関係において変化してもよい。 前記ヘッダにおける識別子は、前記サブ会話の名前を特定し、テイルにおいて 指定された名前と同じである。キーワードメインは、前記アプリケーションの起 動時に呼ばれる前記構造のインタフェース無しメインサブ会話を示し、アプリケ ーションごとに正確に1つのメインサブ会話を有し、アーギュメントリストを持 たない。他のサブ会話の任意の数は許可される。前記サブ会話ボディを1つ以上 の同胞で置き換えることができる場合、前記同胞の名前を、前記サブ会話のヘッ ダにおいてキーワードSIBLINGの後に示す。サブ会話あたり同胞の内の1つを標 準的な実装とし、サブ会話呼が特定の同胞を指定しない場合に使用する。前記標 準的な同胞の名前を、単語「ELDEST」の後に続ける。メインサブ会話や形式アー ギュメントのようなすべての他の概念は、同胞を持たないサブ会話に関してこれ らの意味において類似している。その順番の同胞をセクションに分割できること に注意されたい。 トランザクションセクション このセクションは、図1に取り上げたブロックの外側のすべてである外界に対 するプログラミングインタフェースを可能にし、クラス宣言を使用する。トラン ザクションクラスがオブジェクト指向HDDLプログラムにおいて規定された後 、 この形式またはクラスのオブジェクトを規定することができるが、これらのオブ ジェクトは実際のセクションにおいて現れなければならない。本明細書において 、以下に、classという単語が続く言葉はオブジェクトの形式を規定し、instanc eという単語が続く言葉はインスタンスを規定する。 前記サブ会話がACTIVEモードに入った場合、各々の宣言されたインスタンスに 対して、クラスの名前を図1におけるシステムに渡し、適切なトランザクション オブジェクトを形成する。このオブジェクトは、前記サブ会話がその後に不活性 になった場合、前記システムによって破壊される。 このメソッド宣言における識別子、例えばMyClassは、メソッドの名前を規定 する。次に、トランザクションクラスメソッドのパラメータを宣言するパラメー タリストが続き、基本的な形式、boolean,integer,floatおよびStringに制 限する。これらを、適切なC++形式にマッピングする。トランザクションクラ スのメソッドが呼ばれた場合、形式アーギュメント名を使用することによって、 関連したHDDLパラメータ値がシステムトランザクションサーバに渡され、こ れは、形式パラメータ名を指定しなければならないことを意味する。前記形式メ ソッドアーギュメントにおける項目&以前は、C++における基準パラメータ創 造に対して同様の意味を有する。要素&が含まれない場合、前記関連するパラメ ータの値が渡され、デフォルトの値呼び出しを使用する。しかしながら、&が宣 言された場合、前記値は参照呼び出しとして渡される。後者は可変パラメータで あり、結果値を与えるために使用される。 トランザクションオブジェクトの定義を、キーワードEXPORTによって拡 張することができる。このように規定されたオブジェクトを、他のサブ会話にお いて使用することができる。前記オブジェクトがキーワードEXPORTによっ て拡張された場合、前記システムは新たなオブジェクトを形成しない。代わりに 、前記クラス名が、対応するEXPORT定義において規定されたのと同じ名前 のオブジェクトを呼ぶ。前記トランザクション文を、以下に、ACTIONセク ションにおいても説明する。種々のインスタンスを使用し、種々のメソッド(in it,set,get)を呼んでもよい。 サブ会話の制御 HDDL言語は、サブ会話を使用および処理するための多数の文を含む。これ らの文を、A.サブ会話モードの設定 B.サブ会話の終了 C.同胞間の切り替え D,サブ会話の呼び出し/活性化 に使用する。 サブ会話を可視にするために、呼び出しまたは活性化をしなければならない。 これらの動作の双方は、親サブ会話の一部である。ACTIVATE文は、前記 親会話の、サブ会話を活性化する条件付き動作である、いわゆるコンダクション (condaction)において生じてもよく、そのUSESセクションにお いて生じてもよい。CALL文は、コンダクションのみにおいて生じてもよい。 LISTEN文は、サブ会話をリスニングモードに設定するのに使用される。U SESセクションにおいて、または、前記親サブ会話のコンダクション内で生じ ることができる。ACTIVATEおよびLISTEN文を使用し、個々の同胞 を指定することができる。関連した親が活性化した場合、サブ会話に対して初期 モードをすぐに規定することができる。 ・サブ会話の活性化 サブ会話の音声理解セクションおよび会話制御セクションの双方を切り替える ために、後者を最初にACTIVATE文によって活性化しなければならない。 前記リスニングモードにおいて、前記音声理解セクションのみが活性化し、この とき前記会話制御セクションは不活性である。前記活性化を、実際のアーギュメ ントリストによってもよらなくても行うことが出来る。すなわち、 すべてのパラメータ値の欠乏は、空の括弧の原因となる。前記サブ会話がすで にリスニングまたは活性化されており、ACTIVATE文がアーギュメントリ ストによって使用されている場合、問題のサブ会話は最初に不活性化し、次に新 たなパラメータによって再び活性化する。結果として、前記サブ会話は、その現 在の内部状態を失う。前記サブ会話が既にリスニングモードである場合、種々の 「アーギュメント無し」を選択してもよい。このとき前記サブ会話は、リスニン グモードから活性モードに「促進」される。結果として、そのコンダクションは 可視になり、前記リスニングモードからの異なった同胞が明白に指定されなけれ ば、同胞の変数はそれらの実際の値を保つ。前記ACTIVATE文の第1の種 類が選択され、同胞が指定されない場合、前記サブ会話のELDEST同胞が再 活性化する。しかしながら特定の同胞が指定された場合、後者が代わりに再活性 化する。しかしながら、問題のサブ会話が既に活性モードにあり、「アーギュメ ントリスト無し」種類が選択され、特定の同胞を指定する場合、または、問題の 同胞が既に実行している場合、前記サブ会話はその内部状態を保持する。次の実 行可能コンダクションが、HDDL評価戦略にしたがって決定された場合、その 戦略を記述する後者のサブ会話のコンダクションと、その現在活性の同胞のコン ダクションとは、前記サブ会話がちょうど活性化したかのように、最も高い「テ キスト順序」を有する。種々のサブ会話が同時に活性であってもよく、すなわち 、これらの実行の逐次的順序は、衝突が生じない限り、一般的にあまり重要では ない。 逆に、実行同胞から異なった同胞を選択する「アーギュメントリスト無し」種 類が選択された場合、前記サブ会話は、以下のスイッチ文にしたがって、前のも のに切り替わる。同胞が指定されず、前記サブ会話が予め不活性である場合、E LDEST同胞が活性化する。 サブ会話呼び出し。 サブ会話を活性化する場合、コンダクションにおいて規定された変数は、参照 パラメータとして渡されない。サブ会話が呼ばれた場合、活性モードになる。A CTIVATE文を通じての切り替えと異なっている本願の新たな範囲を規定す る。 CALL DialogA:siblingName(arguent list); Call DialogA:siblingName; CALL文は、呼ばれたサブ会話の言語理解部分および会話制御部分と、すべ てのその同胞とを、USESセクションにおいて指定されたこれらの初期状態に したがって活性化する。 ここで再び、前記名前および関連するインスタンスを、前記インタフェースに おいて指定する。これは、所定の呼ぶ範囲において、その後に活性化した前記呼 ばれたサブ会話とその同胞とのすべてのデータと、適切ならば、これらのリスニ ングサブ会話とが、可視になることを意味する。前記呼ばれた範囲が終了した場 合、前の範囲が復帰し、前記CALL文の後の次の文が実行される。リスニングモードへの設定 LISTEN文は、指定されたサブ会話をリスニングモードに設定する。 LISTEN文に対する必要条件は、指定されたサブ会話の前のモードに応じ て異なる。 I.前記サブ会話が不活性の場合、前記文はこれをリスニングモードに設定し、 その後、初期モードLISTENまたはACTIVEを有するUSESセクショ ンにおいて指定されたすべてのサブ会話がリスニングモードに設定する。 II.前記サブ会話がすでにリスニングの場合、前記文は、現在実行しているもの 以外の指定された同胞のみに作用する。 III.前記サブ会話が活性の場合、これをリスニングモードにリセットする。同 じ同胞を使用する場合、すべてのその現在活性のサブ会話もリスニングモードに 設定される。 ・サブ会話の不活性化 DEACTIVE文は、前記サブ会話のモードを、その同胞のすべてと共に、 不活性モードに設定する。 DEACTIVATE DialogA; 会話が活性またはリスニングモードから不活性モードに設定された場合、すべ てのそのサブ会話も不活性モードに設定される。サブ会話のデフォルトモードが 不活性である場合、DEACTIVATEキーワードを会話のUSESセクショ ン内で使用する必要はない。 サブ会話の終了 一度サブ会話が呼ばれると、4つの異なる方法においで終了することができる 。 I.前記サブ会話におけるRETURN文によって。 II.すべての状態がFALSEと判断するため、現在の動的範囲において状態を 実行できない場合に生じる[無条件に戻る]によって。 III.前記親サブ会話を経ての不活性化。 IV.全体のアプリケーションを終了するBYE文によって、すなわち、後者の2 つは、前記無条件に戻るを含む。 サブ会話の切り替え SWITCH文を使用し、サブ文書をその同胞の1つに切り替える。 SWITCH SiblingA; ここで、前記サブ会話の現在の実装は、前記指定された同胞(ここでは、Sibl ingA)において規定された実装によって完全に置き換わる。前記スイッチサブ会 話によって活性化されたサブ会話が(反復的に)不活性化するため、前記現在の 範囲における他のサブ会話も作用される。双方の実装が同じインタフェースを共 有し、これは他のサブ会話に対して可視である唯一の構成要素であるため、この 特定の手順は、完全に信頼できる。これは、前記スイッチサブ会話が活性化する か、他のサブ会話によって呼ばれた場合、前記スイッチの後、前記活性化または 呼びサブ会話に対して変化が影響しないことを意味する。 問題検知 HDDLアプリケーションにおいて、問題検知メカニズムは、前記プログラム がサブ会話の進行を監視することを可能にする。この監視から得られた結果を通 じて、問題検知は、前記プログラムが、現在の状況にしたがって前記会話の流れ を調節するか否かを決定することを可能にする。前記会話の監視は、前記システ ム動作の特定の特徴をチェックし、この動作を構成されたシステム値として反映 させることによって達成される。一例は、特定の質問に対する繰り返しの数であ る。次にこの値は、前記会話の流れにおけるなんらかのその後の瞬時において、 HDDLプログラムに対して利用可能になる。 ・同胞の切り替え 関連した「切り替え」メカニズムは、全体の会話が問題の認識に応じてインお よびアウトに切り替わることを可能にする。このメカニズムは、サブ会話同胞を そのオブジェクトとして使用し、そのいくつかの実装を、ある特定のサブ会話に 与えてもよく、各々が異なる動作を示す。このメカニズムは、前記会話の流れに おけるなんらかの悪化に反応する手段を形成する。例えば、種々の異なる同胞を 、良質の会話と、ある程度劣っている会話と、劣質の会話とによって各々使用す ることができる。言語理解が悪化すると、サブ会話はそれ自身を劣質言語理解を 処理するバージョンに切り替えることができ、例えば、ユーザに、意図された言 い回しを話すように頼んでもよい。前記会話が再び改善されると、問題のサブ会 話は、それ自身を、より良く理解するより良質のバージョンに切り替えもどすこ とができる。この切り替えは、前記構造のサブ会話の各々によって要求された部 分的な結果に基づいて、前記会話それ自身によってのみ行うことができる。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 マルスフネル イェンス フリードマン オランダ国 5656 アーアー アインドー フェン プロフ ホルストラーン 6 (72)発明者 オースト ハラルト オランダ国 5656 アーアー アインドー フェン プロフ ホルストラーン 6 (72)発明者 マルティ デル オルモ エンリケ オランダ国 5656 アーアー アインドー フェン プロフ ホルストラーン 6

Claims (1)

  1. 【特許請求の範囲】 1.トランザクション環境において機械−制御の人間−機械会話を実行する方法 であって、該方法が、 アクセス呼を受けるステップと、 会話構造において、出力音声項目によって前記アクセス呼に質問し、実際の トランザクションインスタンスを確定するその後に受けた人間音声項目を検査 するステップと、前記出力音声項目を前記検査にしたがって、肯定的トランザ クション結果を達成するか、他の場合、失敗の場合において前記会話を抜け出 すまで、発生するステップとを具える方法において、前記会話を、階層的に配 置されると共に呼び出し可能な、各々の互いに独立したビルディングブロック を構成するサブ会話から構成し、これらのサブ会話を、肯定的結果が問題のサ ブ会話によって得られた場合、特定の結果を発生するように配置し、これらの サブ会話が、階層的に上位のサブ会話と互いに結合するインタフェースを提供 し、その結果として、全体としての前記構造が、サブ会話の選択に基づいて形 成されると共に、前記構造におけるサブ会話の各々によって要求された部分的 結果に排他的に基づいて形成されるようにしたことを特徴とする方法。 2.請求の範囲1に記載の方法において、前記階層の非最上レベルにおけるすべ てのサブ会話が、アクセス可能である同じインタフェースを有し、前記インタ フェースが識別子と、固定された受け取り可能なエンティティと、より高いレ ベルのサブ会話に送るための可変出力エンティティとを指定することを特徴と する方法。 3.請求の範囲1または2に記載の方法において、少なくとも1つのサブ会話が 、並列に配置された2つの同胞を有し、これらにおいて、同じ出力結果を得る ことを保証するが、これらに対して各々種々の異なった手順を使用することを 特徴とする方法。 4.請求の範囲3に記載の方法において、1つのサブ会話に属する各々異なる同 胞間の直接の切り替えを可能にしたことを特徴とする方法。 5.請求の範囲1ないし4のいずれか1つに記載の方法において、最高レベルの サブ会話に、問題の会話構造に属するアプリケーションから直接アクセスする ことを特徴とする方法。 6.請求の範囲1ないし5のいずれか1つに記載の方法において、対応するよう にインタフェースするが、機械音声出力を提供しない少なくとも1つの特別な 疑似サブ会話を前記構造に導入したことを特徴とする方法。 7.請求の範囲1ないし6のいずれか1つに記載の方法において、少なくとも1 つのサブ会話を、前記構造における2個所以上に同様に配置したことを特徴と する方法。 8.請求の範囲1ないし7のいずれか1つに記載の方法において、少なくとも1 つのサブ会話が、2つ以上のインスタンスにおいて、1つ下位のサブ会話を処 理することを特徴とする方法。 9 請求の範囲1ないし8のいずれか1つに記載の方法において、同じサブ会話 の複数のインスタンスの同時活性を可能にしたことを特徴とする方法。 10.請求の範囲1ないし9のいずれか1つに記載の方法を実行し、トランザクシ ョン環境において、機械−制御の人間−機械会話を実行するように配置された 装置であって、該装置が、 アクセス呼を受ける入力手段と、 対話構造において出力音声項目によって前記アクセス呼に質問する双方向音 声チャネル手段と、この手段に相互接続された、実際のトランザクションイン スタンスを確定する受けた人間音声項目を検査する検査手段と、この手段に相 互接続された、前記出力音声項目を前記検査にしたがって、肯定的トランザク ション結果を達成するか、他の場合、失敗の場合において前記会話を抜け出す まで、出力する出力手段とを具える装置において、 階層的に配置されると共に呼び出し可能な、各々の互いに独立したビルディ ングブロックを構成するサブ会話から前記会話を、階層的アクセスを通じて構 成する、種々のサブ会話を格納する格納手段を具え、これらのサブ会話を、肯 定的結果が問題のサブ会話によって得られた場合、特定の結果を発生するよう に配置し、これらのサブ会話が、階層的に上位のサブ会話と互いに結合するイ ンタフェースを提供し、その結果として、全体としての前記構造が、サブ会話 の選択に基づいて形成されると共に、前記構造におけるサブ会話の各々によっ て要求された部分的結果に排他的に基づいて形成されるようにしたことを特徴 とする装置。 11.請求の範囲10に記載の装置において、前記階層の非最上レベルにおけるす べてのサブ会話が、アクセス可能である同じインタフュースを有し、前記イン タフェースが識別子と、固定された受け取り可能なエンティティと、より高い レベルのサブ会話に送るための可変出力エンティティとを指定するようにした ことを特徴とする装置。 12.請求の範囲10または11に記載の装置において、少なくとも1つのサブ会 話が、並列に格納された2つの同胞を有し、これらにおいて、同じ出力結果を 得ることを保証するが、これらに対して各々種々の異なった手順を使用するよ うにしたことを特徴とする装置。 13.請求の範囲12に記載の装置において、1つのサブ会話に属する各々異なる 同胞間の直接の切り替えに対する要求を検知する検知手段を有することを特徴 とする装置。 14.請求の範囲10ないし13のいずれか1つに記載の装置において、最高レベ ルのサブ会話に、問題の会話構造に属するアプリケーションから直接アクセス するようにしたことを特徴とする装置。
JP10529154A 1997-01-09 1998-01-07 モジュール式会話構造に基づくような両面音声の形態における人間―機械会話を実行する方法および装置 Pending JP2000507021A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP97200050 1997-01-09
EP97200050.9 1997-01-09
PCT/IB1998/000006 WO1998031007A2 (en) 1997-01-09 1998-01-07 Method and apparatus for executing a human-machine dialogue in the form of two-sided speech as based on a modular dialogue structure

Publications (1)

Publication Number Publication Date
JP2000507021A true JP2000507021A (ja) 2000-06-06

Family

ID=8227917

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10529154A Pending JP2000507021A (ja) 1997-01-09 1998-01-07 モジュール式会話構造に基づくような両面音声の形態における人間―機械会話を実行する方法および装置

Country Status (4)

Country Link
US (1) US6035275A (ja)
EP (1) EP0922279A3 (ja)
JP (1) JP2000507021A (ja)
WO (1) WO1998031007A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003005786A (ja) * 2001-06-18 2003-01-08 Oki Electric Ind Co Ltd 音声対話インターフェース装置

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19615693C1 (de) * 1996-04-19 1997-12-11 Siemens Ag Vorrichtung und Verfahren zur Aktionsermittlung
AU758006B2 (en) * 1997-05-06 2003-03-13 Speechworks International, Inc. System and method for developing interactive speech applications
JPH11224179A (ja) * 1998-02-05 1999-08-17 Fujitsu Ltd 対話インタフェース・システム
US6144938A (en) 1998-05-01 2000-11-07 Sun Microsystems, Inc. Voice user interface with personality
JP2002527829A (ja) * 1998-10-09 2002-08-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 自動照会方法およびシステム
JP4176228B2 (ja) * 1999-03-15 2008-11-05 株式会社東芝 自然言語対話装置及び自然言語対話方法
US6408272B1 (en) 1999-04-12 2002-06-18 General Magic, Inc. Distributed voice user interface
US20050091057A1 (en) * 1999-04-12 2005-04-28 General Magic, Inc. Voice application development methodology
US20050261907A1 (en) * 1999-04-12 2005-11-24 Ben Franklin Patent Holding Llc Voice integration platform
EP1045374B1 (en) * 1999-04-13 2010-08-11 Sony Deutschland GmbH Merging of speech interfaces for concurrent use of devices and applications
TW501046B (en) * 1999-06-11 2002-09-01 Ind Tech Res Inst A portable dialogue manager
US6523004B1 (en) * 1999-07-19 2003-02-18 International Business Machines Corporation Method and apparatus for disambiguating lists of elements for speech interfaces
US6665644B1 (en) * 1999-08-10 2003-12-16 International Business Machines Corporation Conversational data mining
EP1224797A1 (en) * 1999-10-01 2002-07-24 Bevocal, Inc. Vocal interface system and method
US6587818B2 (en) * 1999-10-28 2003-07-01 International Business Machines Corporation System and method for resolving decoding ambiguity via dialog
US6622119B1 (en) * 1999-10-30 2003-09-16 International Business Machines Corporation Adaptive command predictor and method for a natural language dialog system
US7392185B2 (en) 1999-11-12 2008-06-24 Phoenix Solutions, Inc. Speech based learning/training system using semantic decoding
US6665640B1 (en) 1999-11-12 2003-12-16 Phoenix Solutions, Inc. Interactive speech based learning/training system formulating search queries based on natural language parsing of recognized user queries
US7725307B2 (en) * 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US9076448B2 (en) * 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
US7050977B1 (en) 1999-11-12 2006-05-23 Phoenix Solutions, Inc. Speech-enabled server for internet website and method
US6633846B1 (en) 1999-11-12 2003-10-14 Phoenix Solutions, Inc. Distributed realtime speech recognition system
US6615172B1 (en) 1999-11-12 2003-09-02 Phoenix Solutions, Inc. Intelligent query engine for processing voice based queries
EP1102241A1 (en) * 1999-11-19 2001-05-23 Medical Development & Technology Information Division B.V. Adaptive voice-controlled dialogue system
US7024363B1 (en) * 1999-12-14 2006-04-04 International Business Machines Corporation Methods and apparatus for contingent transfer and execution of spoken language interfaces
US7286990B1 (en) * 2000-01-21 2007-10-23 Openwave Systems Inc. Universal interface for voice activated access to multiple information providers
US7047196B2 (en) * 2000-06-08 2006-05-16 Agiletv Corporation System and method of voice recognition near a wireline node of a network supporting cable television and/or video delivery
FR2810185A1 (fr) * 2000-06-09 2001-12-14 France Telecom Procede et dispositif de gestion de mise en relation telephonique sans divulgation de numero de telephone
US8095370B2 (en) * 2001-02-16 2012-01-10 Agiletv Corporation Dual compression voice recordation non-repudiation system
US6625613B2 (en) 2001-02-26 2003-09-23 Motorola, Inc. Automatic generation of SQL for frame completion
US6839896B2 (en) * 2001-06-29 2005-01-04 International Business Machines Corporation System and method for providing dialog management and arbitration in a multi-modal environment
US7133830B1 (en) 2001-11-13 2006-11-07 Sr2, Inc. System and method for supporting platform independent speech applications
US7149287B1 (en) 2002-01-17 2006-12-12 Snowshore Networks, Inc. Universal voice browser framework
US20050080628A1 (en) * 2003-10-10 2005-04-14 Metaphor Solutions, Inc. System, method, and programming language for developing and running dialogs between a user and a virtual agent
US8332226B1 (en) * 2005-01-07 2012-12-11 At&T Intellectual Property Ii, L.P. System and method of dynamically modifying a spoken dialog system to reduce hardware requirements
US8745086B2 (en) 2008-12-05 2014-06-03 New BIS Safe Luxco S.á.r.l. Methods, apparatus and systems for data visualization and related applications
US10474439B2 (en) * 2016-06-16 2019-11-12 Microsoft Technology Licensing, Llc Systems and methods for building conversational understanding systems

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5309355A (en) * 1984-05-24 1994-05-03 Lockwood Lawrence B Automated sales system
EP0175503A1 (en) * 1984-09-06 1986-03-26 BRITISH TELECOMMUNICATIONS public limited company Method and apparatus for use in interactive dialogue
US5548681A (en) * 1991-08-13 1996-08-20 Kabushiki Kaisha Toshiba Speech dialogue system for realizing improved communication between user and system
DE69232407T2 (de) * 1991-11-18 2002-09-12 Toshiba Kawasaki Kk Sprach-Dialog-System zur Erleichterung von Rechner-Mensch-Wechselwirkung
DE4138016A1 (de) * 1991-11-19 1993-05-27 Philips Patentverwaltung Einrichtung zur erzeugung einer ansageinformation
JPH06259090A (ja) * 1993-03-09 1994-09-16 Nec Corp 音声対話システム
US5694558A (en) * 1994-04-22 1997-12-02 U S West Technologies, Inc. Method and system for interactive object-oriented dialogue management
EP0849723A3 (en) * 1996-12-20 1998-12-30 ATR Interpreting Telecommunications Research Laboratories Speech recognition apparatus equipped with means for removing erroneous candidate of speech recognition

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003005786A (ja) * 2001-06-18 2003-01-08 Oki Electric Ind Co Ltd 音声対話インターフェース装置

Also Published As

Publication number Publication date
EP0922279A2 (en) 1999-06-16
WO1998031007A3 (en) 1998-10-22
WO1998031007A2 (en) 1998-07-16
US6035275A (en) 2000-03-07
EP0922279A3 (en) 1999-09-01

Similar Documents

Publication Publication Date Title
JP2000507021A (ja) モジュール式会話構造に基づくような両面音声の形態における人間―機械会話を実行する方法および装置
US10755046B1 (en) Applied artificial intelligence technology for conversational inferencing
EP1891625B1 (en) Dialogue management using scripts
CA2497866C (en) A development system for a dialog system
US6246981B1 (en) Natural language task-oriented dialog manager and method
US8001469B2 (en) Automatic generation of interactive systems from a formalized description language
US6311159B1 (en) Speech controlled computer user interface
US6505162B1 (en) Apparatus and method for portable dialogue management using a hierarchial task description table
US8160883B2 (en) Focus tracking in dialogs
US20120209613A1 (en) Method and arrangement for managing grammar options in a graphical callflow builder
US7024368B1 (en) Man-machine dialogue system, controls dialogue between system and user using dialogue specification employing augmented transition networks propagating tokens
US20060230410A1 (en) Methods and systems for developing and testing speech applications
US20060206299A1 (en) Dialogue flow interpreter development tool
US20050080628A1 (en) System, method, and programming language for developing and running dialogs between a user and a virtual agent
US20030061029A1 (en) Device for conducting expectation based mixed initiative natural language dialogs
EP1277201A1 (en) Web-based speech recognition with scripting and semantic objects
JP2001209393A (ja) 自然言語入力方法及び装置
JP2007122747A (ja) ダイアログフローインタプリタ
Galley et al. Hybrid natural language generation for spoken dialogue systems
US7853451B1 (en) System and method of exploiting human-human data for spoken language understanding systems
WO2002089113A1 (en) System for generating the grammar of a spoken dialogue system
EP1301921B1 (en) Interactive dialogues
Melin ATLAS: A generic software platform for speech technology based applications
Cenek Hybrid dialogue management in frame-based dialogue system exploiting VoiceXML
KR100249517B1 (ko) 서비스 개발 환경 시스템에서의 코드 생성 방법