JP7263370B2 - 会話エージェント学習モデルを動的に構築して構成する方法、コンピュータ・プログラム、およびシステム - Google Patents

会話エージェント学習モデルを動的に構築して構成する方法、コンピュータ・プログラム、およびシステム Download PDF

Info

Publication number
JP7263370B2
JP7263370B2 JP2020538061A JP2020538061A JP7263370B2 JP 7263370 B2 JP7263370 B2 JP 7263370B2 JP 2020538061 A JP2020538061 A JP 2020538061A JP 2020538061 A JP2020538061 A JP 2020538061A JP 7263370 B2 JP7263370 B2 JP 7263370B2
Authority
JP
Japan
Prior art keywords
conversational
learning model
model
agent learning
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020538061A
Other languages
English (en)
Other versions
JP2021512393A (ja
Inventor
シアーノ、ジウセップ
ピシェッティ、ルイージ
マレーラ、ピエトロ
モデオ、レオナルド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2021512393A publication Critical patent/JP2021512393A/ja
Application granted granted Critical
Publication of JP7263370B2 publication Critical patent/JP7263370B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/02User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/216Handling conversation history, e.g. grouping of messages in sessions or threads

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本明細書に記載されたさまざまな実施形態は、一般に、会話エージェント学習モデル(例えば、ボット・モデル、チャットボット・モデル、または会話モデル)に関する。より詳細には、さまざまな実施形態は、会話エージェント学習モデルを動的に構築して構成する手法について説明する。
クライアントの対話を容易にする目的で、ますます頻繁に、コグニティブ・コンピューティング手法が採用されている。コグニティブ・コンピューティング・モデルの問題領域のアスペクトを支える知識ベースは、従来、本質的に静的であり、管理者による常時監視および介入を必要とする。さらに、コグニティブ・コンピューティング・モデルに関する欠陥は、従来、直接的な人間の介入を余儀なくさせる。
会話エージェント学習モデルを動的に構築して構成する方法、コンピュータ・プログラム、およびシステムを提供する。
本明細書に記載されたさまざまな実施形態は、会話エージェント学習モデルを動的に構築して構成する手法を提供する。関連する方法は、情報のコーパスを取り出すことを含んでよい。この情報のコーパスは、ソーシャル・ネットワークまたはアプリケーションからのデータを含む、リポジトリのセットおよび外部データからの記録を含んでよい。この方法は、取り出された情報のコーパスに基づいて会話エージェント学習モデルを構成することをさらに含んでよい。この方法は、会話エージェント学習モデルと複数のクライアントの間の対話を容易にすることによって、会話エージェント学習モデルを展開することをさらに含んでよい。この方法は、情報のコーパスに対する変更に対処するように、会話エージェント学習モデルを更新することをさらに含んでよい。
一実施形態によれば、この方法は、会話エージェント学習モデルと複数のクライアントの間の対話の結果として受信された情報に基づいて、会話エージェント学習モデルにおける少なくとも1つの欠陥を識別することと、少なくとも1つの欠陥に対処するように、会話エージェント学習モデルを更新することとを、さらに含んでよい。追加の実施形態では、この方法は、ドメイン管理者から入力を受信して、会話エージェント学習モデルと複数のクライアントの間の対話を改良することをさらに含んでよい。さらに別の実施形態では、情報のコーパスに対する変更に対処するように会話エージェント学習モデルを更新するステップが、新しい社会的傾向に基づいて、会話エージェント学習モデルの少なくとも1つのアスペクトを動的に調整することを含んでよい。さらに別の実施形態では、情報のコーパスに対する変更に対処するように会話エージェント学習モデルを更新するステップが、新しい技術の導入に基づいて、会話エージェント学習モデルの少なくとも1つのアスペクトを動的に調整することを含んでよい。
一実施形態によれば、情報のコーパスを取り出すステップが、複数の問題を識別することと、複数の問題にそれぞれ対応する複数の解決策を識別することとを含んでよい。情報のコーパスを取り出すステップは、複数の問題または複数の解決策に関連付けられたクライアントのコンテンツを識別することと、複数の解決策に関連付けられたランク付けを識別することとを、さらに含んでよい。さらに別の実施形態では、会話エージェント学習モデルを構成するステップが、複数の問題に基づいて複数の意図を導出することを含んでよい。複数の意図の各々は、目的または目標を示してよい。会話エージェント学習モデルを構成するステップは、複数の実体を導出することをさらに含んでよい。複数の実体の各々は、複数の意図のうちの1つまたは複数に対処するために、複数の解決策に基づいて少なくとも1つのアクションの選択を可能にするオブジェクト・クラスまたはデータ型であってよい。会話エージェント学習モデルを構成するステップは、複数のダイアログ部分を決定することをさらに含んでよい。複数のダイアログ部分の各々は、少なくとも1つのアクションを複数の実体のうちの1つまたは複数に適用することの結果として、複数の意図のうちの1つまたは複数に対処するための会話テキストを含んでよい。さらに別の実施形態では、少なくとも1つの欠陥に対処するように会話エージェント学習モデルを更新するステップが、少なくとも1つの新しい意図を複数の意図に組み込むこと、または少なくとも1つの新しい実体を複数の実体に組み込むことを含んでよい。
さらに別の実施形態によれば、会話エージェント学習モデルを展開するステップが、少なくとも1つのモデル・インスタンスを初期化することを含んでよい。少なくとも1つのモデル・インスタンスは、複数のクライアントのうちの少なくとも1つにアクセスできる少なくとも1つの会話インターフェイスを含んでよい。会話エージェント学習モデルを展開するステップは、会話エージェント学習モデルのアスペクトに基づいて、会話コンテンツから導出された少なくとも1つの意図および会話コンテンツから導出された少なくとも1つの実体を含む、少なくとも1つの会話インターフェイスを介して受信された会話コンテンツを分類することをさらに含んでよい。会話エージェント学習モデルを展開するステップは、会話コンテンツの分類に基づいて、複数のダイアログ部分のうちの少なくとも1つのダイアログ部分を含んでいる会話出力を決定することをさらに含んでよい。さらに別の実施形態では、会話出力が、構造化されていないダイアログを含んでよい。さらに別の実施形態では、会話エージェント学習モデルを展開するステップが、会話コンテンツに対する少なくとも1つの変更に応答して、会話コンテンツから導出された少なくとも1つの意図を更新することと、更新された少なくとも1つの意図に基づいて少なくとも1つのダイアログ部分を更新することとを、さらに含んでよい。
さらに別の実施形態によれば、会話出力は、少なくとも1つのアクションを会話コンテンツから導出された少なくとも1つの実体に適用することによって、会話コンテンツから導出された少なくとも1つの意図に対処するために、会話テキストを含んでよい。さらに別の実施形態では、会話コンテンツを分類するステップが、会話コンテンツから導出された少なくとも1つの意図を、複数の意図のうちの少なくとも1つの意図に関連付けることと、会話コンテンツから導出された少なくとも1つの実体を、複数の実体のうちの少なくとも1つの実体に関連付けることとを含んでよい。さらに別の実施形態では、会話コンテンツを分類するステップが、会話コンテンツが構造化されていないコンテンツを含んでいるということの決定に応答して、少なくとも1つの認識手法を構造化されていないコンテンツに適用して、統一されたテキストベースのアーチファクトを生成することと、人工知能コンピューティング・システムを介して、統一されたテキストベースのアーチファクトの意味解析を実行して、構造化されていないコンテンツを分類することとを含んでよい。
さらに別の実施形態によれば、会話エージェント学習モデルを構成するステップが、情報のコーパスが構造化されていないコンテンツを含んでいるということの決定に応答して、少なくとも1つの認識手法を構造化されていないコンテンツに適用して、統一されたテキストベースのアーチファクトを生成することと、人工知能コンピューティング・システムを介して、統一されたテキストベースのアーチファクトの意味解析を実行して、構造化されていないコンテンツを分類することと、構造化されていないコンテンツの分類に基づいて会話エージェント学習モデルを更新することとを含んでよい。
追加の実施形態は、プログラム命令が具現化されているコンピュータ可読記憶媒体を含んでいるコンピュータ・プログラム製品を含む。そのような実施形態によれば、プログラム命令は、コンピューティング・デバイスに前述した方法の1つまたは複数のステップを実行させるように、コンピューティング・デバイスによって実行可能であってよい。さらに別の実施形態は、プロセッサおよびアプリケーション・プログラムを格納しているメモリを備えているシステムを含み、このアプリケーション・プログラムは、プロセッサ上で実行された場合に、前述した方法の1つまたは複数のステップを実行する。
前述した態様が実現される方法が詳細に理解され得るように、添付の図面を参照することによって、上で簡単に要約された実施形態のより詳細な説明が得られる。
ただし、添付の図面が本発明の典型的な実施形態のみを示しており、したがって本発明の範囲の限定と見なされるべきではなく、本発明が他の同じように効果的な実施形態を認めることができるということに、注意する。
一実施形態による、会話エージェント学習モデルに関するクライアント/サーバ構成を示すコンピューティング・インフラストラクチャの図である。 一実施形態による、会話エージェント学習モデルに関する概略図である。 一実施形態による、会話エージェント学習モデルを構築する方法を示す図である。 一実施形態による、情報のコーパスを取り出す方法を示す図である。 一実施形態による、会話エージェント学習モデルを構成する方法を示す図である。 一実施形態による、会話エージェント学習モデルを展開する方法を示す図である。 一実施形態による、会話コンテンツを分類する方法を示す図である。 さらに別の実施形態による、会話コンテンツを分類する方法を示す図である。 さらに別の実施形態による、会話エージェント学習モデルを構成する方法を示す図である。
本明細書に記載されたさまざまな実施形態は、会話エージェント学習モデルを動的に構築して構成する手法を説明する。さまざまな実施形態によれば、ドメイン管理者の継続的介入なしで、会話エージェント学習モデルのさまざまなアスペクトが構築されて更新されてよい。ドメイン管理者は、必要に応じて会話エージェント学習モデルのアスペクトを改良してよい。
本明細書に記載されたさまざまな実施形態は、従来手法を上回る利点を有することができる。具体的には、さまざまな実施形態は、会話エージェント学習モデルの問題領域のアスペクトを支える情報のコーパスを自律的に取り出すことによって、そのようなモデルの動的な自律的構成および更新を可能にする。さらに、さまざまな実施形態に従って会話エージェント学習モデルを構成するために取り出された情報のコーパスは、複数の情報ソースを組み込んでよい。そのような情報ソースは、知識ベースおよび解析情報を含むことができるリポジトリのセット、ならびにソーシャル・ネットワーキング・データを含むことができる外部データ・ソース含んでよい。さらに、さまざまな実施形態に従う複数のクライアントと会話エージェント学習モデルの各インスタンスとの間の会話のやりとりは、構造化されたテキスト・コンテンツに加えて、構造化されていないコンテンツ(例えば、視聴覚的アスペクト)を含むことがある。さらに、組み込まれた情報ソースが複数のクライアントの各々に固有のデータを含むことがあるため、さまざまな実施形態に従う会話エージェント学習モデルは、クライアントの必要性に合わせてモデルのアスペクトを調整するために、クライアント固有の情報を利用してよい。さまざまな実施形態に従う会話エージェント学習モデルのアスペクトをカスタマイズするための自動化の発達および能力の向上は、従来の認識モデルに対するクライアントの満足の向上および顧客関係管理プロセスの改善をもたらすことができる。さまざまな実施形態の一部は、そのようなすべての利点を含まなくてよく、そのような利点は、必ずしもすべての実施形態に必須ではない。
以下では、本発明のさまざまな実施形態に対する参照が行われる。しかし、本発明が特定の説明された実施形態に限定されないということが、理解されるべきである。代わりに、以下の特徴および要素の任意の組み合わせが、異なる実施形態に関連しているかどうかに関わらず、本発明を実施および実践するよう企図される。さらに、実施形態は、他の可能な解決策を上回る利点または従来技術を上回る利点あるいはその両方を実現することができるが、特定の実施形態によって特定の利点が実現されるかどうかは、限定ではない。したがって、以下の態様、特徴、実施形態、および利点は、単に例示であり、特許請求の範囲において明示的に示されている場合を除き、添付の特許請求の範囲の要素または限定とは見なされない。同様に、「本発明」への参照は、特許請求の範囲において明示的に示されている場合を除き、本明細書で開示されたいずれかの発明の対象の一般化と解釈されてはならず、添付の特許請求の範囲の要素または限定と見なされてはならない。
本発明は、任意の可能な統合の技術的詳細レベルで、システム、方法、またはコンピュータ・プログラム製品、あるいはその組み合わせであってよい。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を含んでいるコンピュータ可読記憶媒体を含んでよい。
コンピュータ可読記憶媒体は、命令実行デバイスによって使用するための命令を保持および格納できる有形のデバイスであることができる。コンピュータ可読記憶媒体は、例えば、電子ストレージ・デバイス、磁気ストレージ・デバイス、光ストレージ・デバイス、電磁ストレージ・デバイス、半導体ストレージ・デバイス、またはこれらの任意の適切な組み合わせであってよいが、これらに限定されない。コンピュータ可読記憶媒体のさらに具体的な例の非網羅的リストは、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM:random access memory)、読み取り専用メモリ(ROM:read-only memory)、消去可能プログラマブル読み取り専用メモリ(EPROM:erasable programmable read-only memoryまたはフラッシュ・メモリ)、スタティック・ランダム・アクセス・メモリ(SRAM:static random access memory)、ポータブル・コンパクト・ディスク読み取り専用メモリ(CD-ROM:compact disc read-only memory)、デジタル多用途ディスク(DVD:digital versatile disk)、メモリ・スティック、フロッピー(R)・ディスク、パンチカードまたは命令が記録されている溝の中の隆起構造などの機械的にエンコードされるデバイス、およびこれらの任意の適切な組み合わせを含む。本明細書において使用されるとき、コンピュータ可読記憶媒体は、それ自体が、電波またはその他の自由に伝搬する電磁波、導波管またはその他の送信媒体を伝搬する電磁波(例えば、光ファイバ・ケーブルを通過する光パルス)、あるいはワイヤを介して送信される電気信号などの一過性の信号であると解釈されるべきではない。
本明細書に記載されたコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体から各コンピューティング・デバイス/処理デバイスへ、またはネットワーク(例えば、インターネット、ローカル・エリア・ネットワーク、広域ネットワーク、または無線ネットワーク、あるいはその組み合わせ)を介して外部コンピュータまたは外部ストレージ・デバイスへダウンロードされ得る。このネットワークは、銅伝送ケーブル、光伝送ファイバ、無線送信、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはその組み合わせを備えてよい。各コンピューティング・デバイス/処理デバイス内のネットワーク・アダプタ・カードまたはネットワーク・インターフェイスは、コンピュータ可読プログラム命令をネットワークから受信し、それらのコンピュータ可読プログラム命令を各コンピューティング・デバイス/処理デバイス内のコンピュータ可読記憶媒体に格納するために転送する。
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ(ISA:instruction-set-architecture)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、あるいは、Smalltalk(R)、C++などのオブジェクト指向プログラミング言語、および「C」プログラミング言語または同様のプログラミング言語などの従来の手続き型プログラミング言語を含む1つまたは複数のプログラミング言語の任意の組み合わせで記述されたソース・コードまたはオブジェクト・コードであってよい。コンピュータ可読プログラム命令は、ユーザのコンピュータ上で全体的に実行すること、ユーザのコンピュータ上でスタンドアロン・ソフトウェア・パッケージとして部分的に実行すること、ユーザのコンピュータ上およびリモート・コンピュータ上でそれぞれ部分的に実行すること、あるいはリモート・コンピュータ上またはサーバ上で全体的に実行することができる。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク(LAN:local area network)または広域ネットワーク(WAN:wide area network)を含む任意の種類のネットワークを介してユーザのコンピュータに接続されてよく、または接続は、(例えば、インターネット・サービス・プロバイダを使用してインターネットを介して)外部コンピュータに対して行われてよい。一部の実施形態では、本発明の態様を実行するために、例えばプログラマブル論理回路、フィールドプログラマブル・ゲート・アレイ(FPGA:field-programmable gate arrays)、またはプログラマブル・ロジック・アレイ(PLA:programmable logic arrays)を含む電子回路は、コンピュータ可読プログラム命令の状態情報を利用することによって、電子回路をカスタマイズするためのコンピュータ可読プログラム命令を実行してよい。
本発明の態様は、本明細書において、本発明の実施形態による、方法、装置(システム)、およびコンピュータ・プログラム製品のフローチャート図またはブロック図あるいはその両方を参照して説明される。フローチャート図またはブロック図あるいはその両方の各ブロック、ならびにフローチャート図またはブロック図あるいはその両方に含まれるブロックの組み合わせが、コンピュータ可読プログラム命令によって実装され得るということが理解されるであろう。
これらのコンピュータ可読プログラム命令は、コンピュータまたはその他のプログラム可能なデータ処理装置のプロセッサを介して実行される命令が、フローチャートまたはブロック図あるいはその両方のブロックに指定される機能/動作を実施する手段を作り出すべく、汎用コンピュータ、専用コンピュータ、または他のプログラム可能なデータ処理装置のプロセッサに提供されてマシンを作り出すものであってよい。これらのコンピュータ可読プログラム命令は、命令が格納されたコンピュータ可読記憶媒体がフローチャートまたはブロック図あるいはその両方のブロックに指定される機能/動作の態様を実施する命令を含んでいる製品を備えるように、コンピュータ可読記憶媒体に格納され、コンピュータ、プログラム可能なデータ処理装置、または他のデバイス、あるいはその組み合わせに特定の方式で機能するように指示できるものであってもよい。
コンピュータ可読プログラム命令は、コンピュータ上、その他のプログラム可能な装置上、またはその他のデバイス上で実行される命令が、フローチャートまたはブロック図あるいはその両方のブロックに指定される機能/動作を実施するように、コンピュータ実装プロセスを生成すべく、コンピュータ、その他のプログラム可能なデータ処理装置、またはその他のデバイスに読み込まれ、コンピュータ上、その他のプログラム可能な装置上、またはその他のデバイス上で一連の動作可能なステップを実行させるものであってもよい。
図内のフローチャートおよびブロック図は、本発明のさまざまな実施形態による、システム、方法、およびコンピュータ・プログラム製品の可能な実装のアーキテクチャ、機能、および動作を示す。これに関連して、フローチャートまたはブロック図内の各ブロックは、規定された論理機能を実装するための1つまたは複数の実行可能な命令を備える、命令のモジュール、セグメント、または部分を表してよい。一部の代替の実装では、ブロックに示された機能は、図に示された順序とは異なる順序で発生してよい。例えば、連続して示された2つのブロックは、実際には、含まれている機能に応じて、実質的に同時に実行されるか、または場合によっては逆の順序で実行されてよい。ブロック図またはフローチャート図あるいはその両方の各ブロック、ならびにブロック図またはフローチャート図あるいはその両方に含まれるブロックの組み合わせは、規定された機能または動作を実行するか、または専用ハードウェアとコンピュータ命令の組み合わせを実行する専用ハードウェアベースのシステムによって実装され得るということにも注意する。
本明細書に記載されたさまざまな実施形態は、クラウド・コンピューティング・インフラストラクチャを介してエンド・ユーザに提供されてよい。クラウド・コンピューティングとは、通常、ネットワークを経由したサービスとしての、拡張可能な計算リソースの提供のことを指す。さらに正式には、クラウド・コンピューティングは、計算リソースとその基盤になる技術アーキテクチャ(例えば、サーバ、ストレージ、ネットワーク)の間の抽象化を提供する計算能力として定義されてよく、構成可能な計算リソースの共有プールへの便利なオンデマンドのネットワーク・アクセスを可能にし、管理上の手間またはサービス・プロバイダとのやりとりを最小限に抑えて、これらの計算リソースを迅速にプロビジョニングおよび解放することができる。したがって、クラウド・コンピューティングは、計算リソースの提供に使用される基盤になる物理的システム(またはそのようなシステムの位置)に関わらず、ユーザがクラウド内の仮想計算リソース(例えば、ストレージ、データ、アプリケーション、および完全に仮想化されたコンピューティング・システム)にアクセスできるようにする。
通常、クラウドの計算リソースは、利用回数制料金でユーザに提供され、実際に使用された計算リソース(例えば、ユーザによって消費されたストレージ空間の量、またはユーザによってインスタンス化された仮想化システムの数)についてのみ、ユーザに料金が請求される。ユーザは、インターネットを経由して、クラウドに存在するリソースのいずれかに、いつでも、どこからでもアクセスすることができる。本開示との関連では、本明細書に記載されたさまざまな実施形態に従ってアプリケーションを実行するクライアント・コンピューティング・システムまたはサーバ・システムのワークロードが、コンピューティング・クラウドに展開されてよい。さらに、クラウドベースのデータベース・システム、仮想マシン、およびさまざまなその他のサーバ・アプリケーションが、そのようなワークロードの管理に使用されてよい。
特定の実施形態は、会話エージェント学習モデルを構築して構成する手法を説明する。しかし、本明細書に記載された手法が、本明細書において具体的に説明された目的に加えて、さまざまな目的に適応されてよいということが、理解されるべきである。したがって、特定の実施形態への参照は、例示として含まれており、限定するものではない。
図1は、一実施形態による、コンピューティング・インフラストラクチャ100を示している。図に示されているように、コンピューティング・インフラストラクチャ100は、クライアント・コンピューティング・システム105、モデル・システム・インターフェイス135、モデル・サーバ・システム137、外部ソース165(例えば、ソーシャル・ネットワークまたはソーシャル・アプリケーションあるいはその両方)、および外部サービス・プロバイダ167(例えば、SaaS(software as a service)の形態での外部チャットボット・サービスのプロバイダ)を含んでおり、これらの各々が、通信ネットワーク175に接続されてよい。クライアント・コンピューティング・システム105およびモデル・サーバ・システム137が図1に示されているが、コンピューティング・インフラストラクチャ100は、任意の数のコンピューティング・システムを含んでよく、さらに具体的には、任意の数のクライアント・システムまたはサーバ・システムあるいはその両方を含んでよい。
例示的に、クライアント・コンピューティング・システム105は、メモリ107、ストレージ109、クライアント入出力(I/O:input/output)デバイス・インターフェイス111、中央処理装置(CPU:central processing unit)113、およびクライアント・ネットワーク・インターフェイス115を含んでよく、これらのすべてが、相互接続117(例えば、バス)を介して相互接続されてよい。単一のコンピューティング・システムとして示されているが、クライアント・コンピューティング・システム105は、単一のクライアントまたは複数のクライアントの代表として含まれている。一実施形態では、クライアント・コンピューティング・システム105は、シン・クライアントであってよい。メモリ107は、クライアント・アプリケーション119を含んでよい。クライアント・アプリケーション119は、モデル・サーバ・システム137およびその他のコンピューティング・システムとインターフェイスをとるように構成されたオンライン・アプリケーションまたはネットワーク・アプリケーションであってよい。クライアント・アプリケーション119は、アプリケーション・インターフェイス121を含んでよい。アプリケーション・インターフェイス121は、モデル・サーバ・システム137を介して構築または構成された会話エージェント学習モデルの1つまたは複数の他のアスペクトと対話するためのモデル・インスタンス123(例えば、会話エージェント・インスタンス、ボット・インスタンス、またはチャットボット・インスタンス)を含んでよい。モデル・インスタンス123は、クライアントと会話エージェント学習モデルの間の対話を容易にするためのさまざまな要素(例えば、テキスト・ボックス、ラジオ・ボタン、ドロップ・ダウン・メニューなど)を含んでいるグラフィカル・ユーザ・インターフェイス(GUI:graphical user interface)を含んでよい。追加的または代替的に、モデル・インスタンス123は、クライアントと会話エージェント学習モデルの間の対話を容易にするためのコマンド・ライン・インターフェイスを含んでよい。ストレージ109は、クライアント・アプリケーション119に関連付けられたクライアント・アプリケーション・データ125を含んでよい。クライアント・アプリケーション・データ125は、クライアントとモデル・インスタンス123の間のいずれかの対話に関する情報を含んでよい。クライアントI/Oデバイス・インターフェイス111は、1つまたは複数のクライアントI/Oデバイス127に通信によって結合されてよい。CPU113は、単一のCPU、複数のCPU、複数のプロセッシング・コアを含んでいる単一のCPUなどの代表として図1に含まれている。クライアント・ネットワーク・インターフェイス115は、ネットワーク175を介してモデル・サーバ・システム137からデータを受信してよく、モデル・サーバ・システム137にデータを送信してよい。クライアント・コンピューティング・システム105は、コンピューティング・インフラストラクチャ100内の他のサーバ・システムとインターフェイスをとるように構成されてよく、またはコンピューティング・インフラストラクチャ100の外部のサーバ・システムとインターフェイスをとるように構成されてよく、あるいはその両方であってよい。
モデル・システム・インターフェイス135は、クライアント・コンピューティング・システム105、およびモデル・サーバ・システム137とインターフェイスをとる任意のその他のコンピューティング・システムに関するサービス・マネージャまたはコントロール・デスク・マネージャとして機能してよい。モデル・システム・インターフェイス135は、ネットワーク175を介して、モデル・サーバ・システム137との間の通信を容易にしてよい。具体的には、モデル・システム・インターフェイス135は、ネットワーク175を介してクライアント・コンピューティング・システム105からデータを受信してよく、クライアント・コンピューティング・システム105にデータを送信してよい。一実施形態によれば、モデル・システム・インターフェイス135は、個別のプロセッサ、メモリ、またはストレージ、あるいはその組み合わせを含む、モデル・サーバ・システム137から分離しているコンピューティング・システムであってよい。代替として、モデル・システム・インターフェイス135は、モデル・サーバ・システム137の構成要素(例えば、ソフトウェア・アプリケーションまたはハードウェアの実体あるいはその両方)であってよい。
モデル・サーバ・システム137は、メモリ139、ストレージ141、サーバI/Oデバイス・インターフェイス143、およびCPU145を含んでよく、これらのすべてが、相互接続147(例えば、バス)を介して相互接続されてよい。単一のコンピューティング・システムとして示されているが、モデル・サーバ・システム137は、単一のサーバ・システムまたは複数のサーバ・システムの代表として含まれている。モデル・サーバ・システム137は、自動サービス管理システムであってよい。メモリ139は、モデル・アドバイザ149およびデータベース管理システム(DBMS:database management system)151を含んでよい。本明細書においてさらに説明されるように、モデル・アドバイザ149は、本明細書に記載されたさまざまな実施形態に従って会話エージェント学習モデルを構築して構成するためのアプリケーションであってよい。DBMS151は、単一のデータベース管理システムまたは複数のデータベース管理システムの代表として含まれている。ストレージ141は、モデル・アドバイザ・データ153、モデル・ポリシー155、およびリポジトリのセット157を含んでよい。モデル・アドバイザ149は、クライアント・コンピューティング・システム105またはその他のコンピューティング・システムあるいはその両方との対話に基づいて、モデル・アドバイザ・データ153を生成して処理してよい。モデル・アドバイザ・データ153は、「オンプレミス」のチャットボット・サービスを含むことがある複数のモデル・サービスを含んでよい。モデル・アドバイザ・データ153は、外部サービス・プロバイダ167を介して提供される外部モデル・サービスへの1つまたは複数の参照を、さらに含んでよい。モデル・アドバイザ・データ153は、そのような外部モデル・サービスに関する情報をさらに含んでよい。そのような外部モデル・サービスは、SaaS(software as a service)の形態であってよい。モデル・アドバイザ149は、データベース照会要求(例えば、クライアント・コンピューティング・システム105から受信された照会)をDBMS151に送信してよく、DBMS151は、例えばリポジトリのセット157内のデータに基づいて、そのような照会を処理してよい。DBMS151は、リポジトリのセット157を管理するように構成されたソフトウェア・アプリケーションを含んでよい。
リポジトリのセット157は、1つまたは複数のリレーショナル・データベースを含んでよい。さらに、リポジトリのセット157は、1つまたは複数のオントロジー・ツリーまたはその他のオントロジー構造を含んでよい。図1はリポジトリのセット157のうちの4つのリポジトリを示しているが、コンピューティング・インフラストラクチャ100は任意の数のリポジトリを含んでよい。一実施形態によれば、DBMS151は、ネットワーク175を介して1つまたは複数の要求をリモート・データベース(図示されていない)に送信してよい。サーバI/Oデバイス・インターフェイス143は、1つまたは複数のサーバI/Oデバイス159に通信によって結合されてよい。CPU145は、単一のCPU、複数のCPU、複数のプロセッシング・コアを含んでいる単一のCPUなどの代表として図1に含まれている。モデル・アドバイザ149は、クライアント・コンピューティング・システム105によってモデル・サーバ・システム137に送信された要求を受け取ってよく、モデル・システム・インターフェイス135を介してデータをクライアント・コンピューティング・システム105にさらに送信してよい。外部ソース165または外部サービス・プロバイダ167あるいはその両方が、モデル・システム・インターフェイス135を介して、外部データをモデル・アドバイザ149に送信するか、またはその他の方法でモデル・アドバイザ149と通信してよい。
一実施形態では、会話エージェント学習モデルの構築および構成に関連する1つまたは複数の機能が、モデル・サーバ・システム137の外部で実行されてよい。そのような実施形態によれば、モデル・アドバイザ149が、モデルの構成に関連する情報または結果を取得するために、モデル・サーバ・システム137の外部のアプリケーションと通信してよい。さらに、そのような実施形態によれば、モデル・サーバ・システム137の外部のデータベース管理システムおよび1つまたは複数のデータベースが、モデルの構成に必要な情報または能力を、モデル・サーバ・システム137のモデル・アドバイザ149またはその他のコンポーネントに提供してよい。
図2は、一実施形態による、会話エージェント学習モデルに関する概略図180を示している。図に示されているように、クライアント185~185は、各クライアント・コンピューティング・システムで、各クライアント・アプリケーションを介して提示されるアプリケーション・インターフェイス121~121を介して、モデル・インスタンス123~123と対話してよい。モデル・アドバイザ149は、データをモデル・システム・インターフェイス135から受信し、データをモデル・システム・インターフェイス135に送信することによって、モデル・インスタンス123~123を介してクライアント185~185と対話してよい。したがって、モデル・システム・インターフェイス135は、クライアント185~185とモデル・アドバイザ149の間の通信を容易にすることができる。さらに、モデル・アドバイザ149は、モデル・システム・インターフェイス135を介して、外部データを外部ソース165から取得するか、またはその他の方法で外部ソース165と通信してよい。具体的には、モデル・アドバイザ149は、外部ソース165からのデータ抽出を容易にすることができるプラグイン195を介して、そのような外部データを取得してよい。例えば、プラグイン195のうちの1つまたは複数は、解析または処理あるいはその両方のためにコンテンツをモデル・アドバイザ149に送信できるように、ソーシャル・ネットワークまたはソーシャル・アプリケーションからのユーザのコンテンツ(例えば、ユーザのコメント、写真など)の抽出を容易にすることができる。さらに、モデル・アドバイザ149は、モデル・システム・インターフェイス135を介して外部モデル・サービス167と通信してよい。代替の実施形態によれば、モデル・アドバイザ149は、外部ソース165または外部モデル・サービス167あるいはその両方から、外部データを直接取得してよい。
さらに、図2に示されているように、モデル・システム・インターフェイス135は、クライアント185~185とリポジトリのセット157の間の通信を容易にすることができる。加えて、モデル・アドバイザ149は、リポジトリのセット157のうちの1つまたは複数と通信してよい。具体的には、リポジトリ157は、過去のクライアントの入力、コメントなどの、クライアント185~185のうちの1つまたは複数に関連付けられたデータを含んでいる、クライアント・データ・リポジトリであってよい。リポジトリ157は、知識ベースを含んでいる知識ベース・リポジトリであってよい。そのような知識ベースは、各問題(例えば、モデル・インスタンス123~123のうちの1つまたは複数を介して1つまたは複数のクライアント・コンピューティング・システムから受信されてよい、クライアントの照会、不具合、または作業、あるいはその組み合わせ)に対応するさまざまな解決策の記録を含んでよい。そのような知識ベースは、会話エージェント学習モデルとクライアント185~185のうちの1つまたは複数の間の対話の1つまたは複数のアスペクトに基づく解析情報と、リポジトリ・データ、外部データ、およびクライアント情報(例えば、サービス・デスクの解析)を含む会話エージェント学習モデルの一般的なアスペクトに関する解析情報とを、さらに含んでよい。さらに、モデル・アドバイザ149は、クライアントのサービス要求に応答して、少なくとも1つのモデル・サービスを選択するプロセスの間に、そのような知識ベースを調べてよい。リポジトリ157は、インシデントおよび変更のデータベースを含むことができるインシデント/変更リポジトリであってよい。インシデントおよび変更のデータベースは、すべての未解決の問題または解決済みの問題あるいはその両方の記録を含んでよい。リポジトリ157は、1つまたは複数のログを含んでいるログ・リポジトリであってよい。1つまたは複数のログは、1つまたは複数のクライアント185~185とモデル・サーバ・システム137の間の追跡された情報の交換の記録をそれぞれ含んでよい。リポジトリのセット157のうちのリポジトリ157~157は、単なる例である。代替の実施形態では、リポジトリのセット157は、リポジトリ157~157のサブセットまたは追加のリポジトリあるいはその両方を含んでよい。
さらに、図2に示されているように、モデル・アドバイザ149は、モデル・ポリシー155を調べるか、または更新するか、あるいはその両方を実行してよい。モデル・ポリシー155は、モデル・インスタンス123~123のうちの1つまたは複数または会話エージェント学習モデルのその他のアスペクト(リポジトリのセット157内のコンテンツなど)を更新する方法または更新するタイミングあるいはその両方示すルールのセットを含んでよい。一実施形態では、モデル・ポリシー155は、1つまたは複数のモデルのアスペクトに関する1つまたは複数の周期的更新ポリシーを指示する1つまたは複数のルールを含んでよい。そのような1つまたは複数の周期的更新ポリシーは、1つまたは複数の指定された周期的な時間間隔で、1つまたは複数のモデルのアスペクトの更新を指示してよい。追加的または代替的に、そのような1つまたは複数の周期的更新ポリシーは、知識ベースに対する変更に基づいて、または解析情報(例えば、サービス・デスクの解析)に基づいて、あるいはその両方に基づいて、1つまたは複数のモデルのアスペクトの更新を指示してよい。さらに別の実施形態では、モデル・ポリシー155は、1つまたは複数の管理上の更新ポリシーを指示する1つまたは複数のルールを含んでよい。そのような1つまたは複数の管理上の更新ポリシーは、会話エージェント学習モデルに関連付けられたドメイン管理者の判断で、1つまたは複数のモデルのアスペクトの更新を指示してよい。
モデル・アドバイザ149、モデル・システム・インターフェイス135、モデル・ポリシー155、リポジトリのセット157、およびモデル・インスタンス123~123は、本明細書に記載されたさまざまな実施形態に従って、会話エージェント学習モデルの主要なコンポーネントを構成してよい。図2に示された概略図180は、モデルのコンポーネントの例示的な構成を示している。モデルのコンポーネントの代替の構成が、さまざまな実施形態の保護される範囲に含まれるということが、意図される。
図3は、会話エージェント学習モデルを構築する方法200を示している。方法200および本明細書に記載された他の方法に関連付けられた1つまたは複数のステップは、クライアント/サーバコンピューティング環境(例えば、コンピューティング・インフラストラクチャ100)で実行されてよい。追加的または代替的に、方法200および本明細書に記載された他の方法に関連付けられた1つまたは複数のステップは、クラウド・コンピューティング環境の1つまたは複数のワークロード内で実行されてよい。追加的または代替的に、方法200および本明細書に記載された他の方法に関連付けられた1つまたは複数のステップは、ピアツーピア・ネットワーク環境内で実行されてよく、その場合、本明細書に記載された方法のステップのうちの1つまたは複数が、ピア・コンピューティング・システムのピア・アプリケーションを介して実行されてよい。
サーバ・システムのモデル・アドバイザ(例えば、モデル・サーバ・システム137のモデル・アドバイザ149)は、方法200に従って、処理を容易にすることができる。方法200は、ステップ205で開始してよく、ステップ205で、モデル・アドバイザが情報のコーパスを取り出してよい。この情報のコーパスは、ソーシャル・ネットワークまたはアプリケーション(例えば、外部ソース165)からのデータを含む、リポジトリのセット(例えば、リポジトリのセット157)および外部データからの記録を含んでよい。一実施形態では、リポジトリのセットは、クライアント・データ・リポジトリ(例えば、リポジトリ157)、知識ベース・リポジトリ(例えば、リポジトリ157)、インシデント/変更リポジトリ(例えば、リポジトリ157)、またはログ・リポジトリ(例えば、リポジトリ157)、あるいはその組み合わせを含んでよい。情報のコーパスの1つまたは複数のアスペクトが、モデル・アドバイザに関連付けられたデータ(例えば、モデル・アドバイザ・データ153)内で格納されるか、または参照されてよい。ステップ205に従って情報のコーパスを取り出すことに関する実施形態は、図4に関して説明される。
ステップ210で、モデル・アドバイザが、取り出された情報のコーパスに基づいて会話エージェント学習モデルを構成してよい。ステップ210に従って、モデル・アドバイザは、ステップ205で取り出された情報のコーパスに基づいて、会話エージェント学習モデルにアスペクトを入力してよい。一実施形態では、モデル・アドバイザは、情報のコーパスに基づくアスペクトをモデル・アドバイザに関連付けられたデータに追加することによって、モデルにデータを入力してよい。さらに、そのようなモデル・アドバイザ・データは、情報のコーパスに対する更新に基づいて、またはさらなるモデルの構成に基づいて、あるいはその両方に基づいて、更新されてよい。ステップ210に従って会話エージェント学習モデルを構成することに関する実施形態が、図5に関して説明される。ステップ210に従って会話エージェント学習モデルを構成することに関するさらに別の実施形態が、図9に関して説明される。
ステップ215で、モデル・アドバイザが、会話エージェント学習モデルと複数のクライアント(例えば、クライアント185~185)の間の対話を容易にすることによって、会話エージェント学習モデルを展開してよい。ステップ215に従って、モデル・アドバイザは、モデル・システム・インターフェイス(例えば、モデル・システム・インターフェイス135)を介して対話を容易にしてよい。モデル・システム・インターフェイスは、サービス・マネージャまたはコントロール・デスク・マネージャであってよい。前述したように、モデル・アドバイザ、モデル・システム・インターフェイス、モデル・ポリシー(例えば、モデル・ポリシー155)、リポジトリのセット、およびモデル・インスタンス(例えば、モデル・インスタンス123~123)は、本明細書に記載されたさまざまな実施形態に従って、会話エージェント学習モデルの主要なコンポーネントを構成してよい。ステップ215に従って会話エージェント学習モデルを展開することに関する実施形態が、図6に関して説明される。
ステップ220で、モデル・アドバイザが、情報のコーパスに対する変更に対処するように、会話エージェント学習モデルを更新してよい。ステップ220でモデル・アドバイザは、1つの変更または複数の変更に対処するように、モデルを更新してよい。ステップ220で対処される1つまたは複数の変更は、変更、追加、または削除、あるいはその組み合わせを含んでよい。一実施形態では、モデル・アドバイザは、新しい社会的傾向に基づいて、会話エージェント学習モデルの少なくとも1つのアスペクトを動的に調整することによって、情報のコーパスに対する変更に対処するように、会話エージェント学習モデルを更新してよい。例えば、新しい社会的傾向は、視聴覚的媒体を介して、またはソーシャル・メディアを介して明らかにされてよい。会話エージェント学習モデルをソーシャル・メディアと統合することによって、またはその他の方法でソーシャル・ネットワークもしくはアプリケーションにアクセスすることによって(例えば、外部ソース165と通信することによって)、モデル・アドバイザは、新しい社会的/文化的嗜好に基づいてモデルを動的に調整してよい。具体的には、モデル・アドバイザは、ソーシャル・ネットワークまたはソーシャル・アプリケーションにおいて明らかにされた1つまたは複数の言語の傾向、1つまたは複数の文化的傾向、または1つまたは複数の行動の傾向、あるいはその組み合わせに基づいて、モデル・インスタンスにおいて複数のクライアントのうちのクライアントに提示されるダイアログ部分を調整してよい。例えば、クライアントAが10代であることが決定されたときに、モデル・アドバイザは、10代の会話と一致するダイアログ部分(例えば、「それは格好良い」)をクライアントAに提示してよい。したがって、モデル・アドバイザは、モデルの対話の文脈において、クライアントの親密さおよび快適さを増やすことができる。
さらに別の実施形態によれば、モデル・アドバイザは、技術的進歩に基づいて会話エージェント学習モデルを更新してよい。1つのそのような実施形態では、モデル・アドバイザは、新しい技術の導入に基づいて、会話エージェント学習モデルの少なくとも1つのアスペクトを動的に調整することによって、情報のコーパスに対する変更に対処するように、会話エージェント学習モデルを更新してよい。例えば、世界市場への暗号通貨(例えば、ビットコイン)の導入に基づいて、請求書の支払いの作業または問題に対処するために、会話エージェント学習モデルは、従来の支払い方法に加えて、暗号通貨を介して支払いを容易にするダイアログ部分、または暗号通貨に関する質問に対処するダイアログ部分、あるいはその両方を、モデル・インスタンス内でクライアントBに提示してよい。それに応じて、モデル・インスタンスを通じて、クライアントBは、暗号通貨を介して支払う選択肢を有してよい。別のそのような実施形態では、モデル・アドバイザは、既存の技術の改良に基づいて、会話エージェント学習モデルの少なくとも1つのアスペクトを動的に調整することによって、情報のコーパスに対する変更に対処するように、会話エージェント学習モデルを更新してよい。さらに別の実施形態によれば、ステップ220での会話エージェント学習モデルの更新に基づいて、モデル・アドバイザがモデルを再構成し、再展開するように、方法200が、任意選択的にステップ210に戻ってよい。
任意選択的に、ステップ225で、モデル・アドバイザが、会話エージェント学習モデルと複数のクライアントの間の対話の結果として受信された情報に基づいて、会話エージェント学習モデルにおける少なくとも1つの欠陥を識別してよい。対話の結果として受信されたそのような情報は、複数のクライアントのうちの1つまたは複数に関連付けられた会話コンテンツまたは一般的な情報あるいはその両方を含んでよい。会話エージェント学習モデルにおける欠陥は、例えば、これまで発生しなかった対象、またはモデルとの関連において追跡もしくはアクセスするための情報が相対的に少ないか、もしくはそのような情報が存在しない対象、あるいはその両方を含んでよい。モデル・アドバイザは、会話エージェント学習モデルと複数のクライアントの間の対話を介して、そのような欠陥を識別してよい。任意選択的に、ステップ230で、モデル・アドバイザが、少なくとも1つの欠陥に対処するように、会話エージェント学習モデルを更新してよい。モデル・アドバイザは、新しい情報をモデル構造内の既存のカテゴリに追加してよい。追加的または代替的に、モデル・アドバイザは、1つまたは複数の新しいカテゴリを決定してよく、そのような新しいカテゴリをモデル構造に埋め込んでよい。モデル・アドバイザは、そのような新しいカテゴリを自律的に(すなわち、ドメイン管理者から介入されずに)埋め込んでよい。モデル・アドバイザは、リポジトリのセットおよび外部データを検索し、1つまたは複数の機械学習手法を新たに発見された情報に適用することによって、そのような1つまたは複数の新しいカテゴリを決定してよい。一実施形態では、ステップ230での会話エージェント学習モデルの更新に基づいて、モデル・アドバイザがモデルを再構成し、再展開するように、方法200が、任意選択的にステップ210に戻ってよい。
会話エージェント学習モデルの構成および展開は、主に動的かつ自律的である(すなわち、人間の介入を必要としない)が、任意選択的にステップ235で、モデル・アドバイザは、ドメイン管理者(例えば、ドメイン専門家)から入力を受信し、会話エージェント学習モデルと複数のクライアントの間の対話を改良してよい。したがって、そのようなドメイン管理者は、複数のクライアントのうちの1つまたは複数で初期化されたモデル・インスタンスのうちの1つまたは複数に関するエンドユーザ・エクスペリエンスを改善することができる。追加的または代替的に、そのようなドメイン管理者は、モデル構造内のカテゴリを追加または更新してよい。追加的または代替的に、そのようなドメイン管理者は、モデルにデータを入力する目的で、新しいソースへのアクセスを容易にすることができる。一実施形態では、ステップ235での会話エージェント学習モデルの改良に基づいて、モデル・アドバイザがモデルを再構成し、再展開するように、方法200が、任意選択的にステップ210に戻ってよい。さらに別の実施形態では、モデル・アドバイザは、ステップ220の前、または任意選択的なステップ225および230の前、あるいはその両方において、任意選択的なステップ235を実行してよい。
図4は、一実施形態による、情報のコーパスを取り出す方法300を示している。方法300は、方法200のステップ205に関する実施形態例を提供する。方法300は、ステップ305で開始してよく、ステップ305で、モデル・アドバイザが複数の問題を識別してよい。複数の問題は、解決されるべき不具合または実行されるべき作業あるいはその両方を含んでよい。複数の問題のうちの1つまたは複数は、クライアントの関心事に基づいてよい。モデル・アドバイザは、リポジトリのセットのうちのクライアント・データ・リポジトリまたはインシデント/変更リポジトリあるいはその両方を調べることによって、複数の問題を識別してよい。ステップ310で、モデル・アドバイザが、複数の問題にそれぞれ対応する(例えば、複数の問題にそれぞれ対処する)複数の解決策を識別してよい。モデル・アドバイザは、リポジトリのセットのうちの知識ベース・リポジトリを調べることによって、複数の解決策を識別してよい。ステップ315で、モデル・アドバイザが、複数の問題または複数の解決策に関連付けられたクライアントのコンテンツを識別してよい。そのようなクライアントのコンテンツは、複数の問題に関連付けられているか、または複数の解決策に関連付けられているか、あるいはその両方である、テキスト・コンテンツもしくは視聴覚的コンテンツ、クライアントの対話ログ、またはクライアントのコメント、あるいはその組み合わせを含んでよい。モデル・アドバイザは、リポジトリのセットのうちのクライアント・データ・リポジトリまたはログ・リポジトリあるいはその両方を調べることによって、そのようなクライアントのコンテンツを識別してよい。ステップ320で、モデル・アドバイザが、複数の解決策に関連付けられたランク付けを識別してよい。そのようなランク付けは、クライアントによって提供されたランク付け、統計に基づくランク付け、または外部ソースからのランク付け(ソーシャル・メディアからのランク付けなど)、あるいはその組み合わせを含んでよい。モデル・アドバイザは、情報のコーパスからデータを取得するモデル・サービスを構成するとき、または選択するときに、そのようなランク付けを評価してよい。モデル・アドバイザは、上で示された特定のリポジトリを調べることによって、方法300に従ってアスペクトを識別してよいが、モデル・アドバイザは、ステップ305~320でさまざまなアスペクトを識別するために、リポジトリのセットのうちのリポジトリの任意の組み合わせを調べてよい。さらに、方法300のステップは、リポジトリのセットおよび外部データの両方の記録に関連付けられてよい。ステップ305~320でさまざまなアスペクトを識別することとの関連において、モデル・アドバイザは、ソーシャル・チャネルのランク付けなどに関するソーシャル・ネットワーキング・データを提供できる外部ソースを調べてよい。
図5は、一実施形態による、会話エージェント学習モデルを構成する方法400を示している。方法400は、方法200のステップ210に関する実施形態例を提供する。方法400は、ステップ405で開始してよく、ステップ405で、モデル・アドバイザは、複数の問題に基づいて複数の意図を導出してよく、これらの複数の意図の各々は、目的または目標を示す。例えば、複数の意図のうち、モデル・アドバイザによって導出される意図は、請求書の支払いであってよい。ステップ410で、モデル・アドバイザは、複数の実体を導出してよい。複数の実体の各々は、複数の意図のうちの1つまたは複数に対処するために、複数の解決策に基づいて少なくとも1つのアクションの選択を可能にするオブジェクト・クラスまたはデータ型であってよい。支払いの例によれば、モデル・アドバイザは、導出された請求書の支払いの意図から、請求書を実体として導出してよい。請求書を実体として導出することは、次に、モデル・アドバイザが、導出された請求書の支払いの意図に対処するために、導出された請求書に関する少なくとも1つのアクション(例えば、クライアントの請求書の支払いを処理すること)を選択できるようにしてよい。ステップ415で、モデル・アドバイザは、複数のダイアログ部分を決定してよい。モデル・アドバイザは、ステップ405で導出された複数の意図に基づいて、かつステップ410で導出された複数の実体に基づいて、複数のダイアログ部分を決定してよい。複数のダイアログ部分の各々は、少なくとも1つのアクションを複数の実体のうちの1つまたは複数に適用することの結果として、複数の意図のうちの1つまたは複数に対処するための会話テキストを含んでよい。モデル・アドバイザは、複数のクライアントのうちの1つまたは複数の会話履歴を調べることに基づいて、ダイアログ部分を決定してよい。追加的または代替的に、モデル・アドバイザは、複数のクライアントのうちの1つまたは複数のソーシャル・チャネルの対話(例えば、ソーシャル・ネットワーキング活動)に基づいて、ダイアログ部分を決定してよい。モデル・アドバイザは、クライアント・データ・リポジトリを介して、またはログ・リポジトリを介して、あるいはその両方を介して、そのような会話履歴またはソーシャル・チャネルの対話あるいはその両方にアクセスしてよい。支払いの例によれば、モデル・アドバイザは、導出された請求書の支払いの意図に対処するために、1つまたは複数の請求書の支払い処理アクションを導出された請求書に適用することの結果として、1つまたは複数のダイアログ部分を決定してよい。そのような1つまたは複数のダイアログ部分は、会話エージェント学習モデルと複数のクライアントの間の対話の文脈において、複数のクライアントのうちの1つまたは複数に提示されてよい。1つまたは複数の請求書の支払い処理アクションを適用することの結果として決定された例示的なダイアログ部分は、「あなたの請求書が処理されました」を含んでよい。さらに、モデル・アドバイザによって決定された1つまたは複数のダイアログ部分は、導出された実体に関する情報の提供をさらに含んでよい。支払いの例によれば、モデル・アドバイザは、請求書に関する情報を含んでいるダイアログ部分(例えば、「請求書の上部に、50.00ドルの支払い金額を示しています」)を提供してよい。
一実施形態では、方法200の任意選択的なステップ230で、モデル・アドバイザは、少なくとも1つの新しい意図を、ステップ405で導出された複数の意図に組み込むことによって、または少なくとも1つの新しい実体を、ステップ410で導出された複数の実体に組み込むことによって、任意選択的なステップ225で識別された少なくとも1つの欠陥に対処するように、会話エージェント学習モデルを更新してよい。モデル・アドバイザは、実施形態に従って少なくとも1つの新しい意図または少なくとも1つの新しい実体あるいはその両方を組み込むことによって、会話エージェント学習モデルと複数のクライアントの間の対話の文脈においてまだ対処されていないか、対処中であるカテゴリを考慮してよい。さらに、実施形態によれば、モデル・アドバイザは、少なくとも1つの新しいダイアログ部分を、ステップ415で決定された複数のダイアログ部分に組み込むことによって、少なくとも1つの欠陥に対処してよい。少なくとも1つの新しいダイアログ部分は、少なくとも1つの新しい意図のうちの1つまたは複数に対処するために、会話テキストを含んでよい。さらに、そのような会話テキストは、少なくとも1つの新しい実体のうちの1つまたは複数への1つまたは複数のアクションの適用を反映してよい。そのような組み込みは、モデル・ポリシーに従って、動的かつ自律的(すなわち、ドメイン管理者の介入なしで更新される)であってよい。例えば、モデル・アドバイザは、クライアントと会話エージェント学習モデルの間の対話が進行するにつれて、新しい意図または実体あるいはその両方を識別してよく、1つまたは複数のアクションを処理し、新たに識別された意図または実体あるいはその両方に適用してよい。さらに、モデル・アドバイザは、構造化されたチャネル(例えば、正式な記録)および構造化されていないチャネル(例えば、ソーシャル・メディアのデータ)の両方との対話を介して可能性のある新しいモデルのアスペクトを識別することの結果として、そのような組み込みを実行してよい。さらに、少なくとも1つの新しい意図、少なくとも1つの新しい実体、または少なくとも1つの新しいダイアログ部分、あるいはその組み合わせを組み込むことに加えて、モデル・アドバイザは、モデル・ポリシーに従って、会話エージェント学習モデルの既存のアスペクトを動的かつ自律的に更新してよい。したがって、モデル・アドバイザは、会話エージェント学習モデルを「改良」してよい。モデル・アドバイザは会話エージェント学習モデルのアスペクトを自律的に追加または更新することができるが、ドメイン管理者は、そのような追加または更新を監視し、必要に応じて改良するために、介入してよい。
図6は、一実施形態による、会話エージェント学習モデルを展開する方法500を示している。方法500は、方法200のステップ215に関する実施形態例を提供する。方法500はステップ505で開始してよく、ステップ505で、モデル・アドバイザが少なくとも1つのモデル・インスタンス(例えば、モデル・インスタンス123)を初期化してよく、これらの少なくとも1つのモデル・インスタンスは、複数のクライアントのうちの少なくとも1つにアクセスできる少なくとも1つの会話インターフェイスを含む。少なくとも1つのモデル・インスタンスは、チャットボット・インスタンスまたはボット・インスタンスの代替の形態あるいはその両方を含んでよい。モデル・アドバイザは、複数のクライアントのうちの1つまたは複数から受信された1つまたは複数のサービス要求(例えば、1つまたは複数の照会)に応答して、少なくとも1つのモデル・インスタンスを初期化してよい。ステップ510で、会話エージェント学習モデルのアスペクトに基づいて、モデル・アドバイザが、少なくとも1つの会話インターフェイスを介して複数のクライアントのうちの1つまたは複数から受信された会話コンテンツを分類してよい。会話コンテンツは、複数のクライアントのうちの1つまたは複数から受信された任意の会話入力または任意のその他の入力を含んでよい。会話コンテンツを分類することは、モデル・アドバイザによって会話コンテンツから導出された少なくとも1つの意図を分類することを伴ってよい。会話コンテンツを分類することは、モデル・アドバイザによって会話コンテンツから導出された少なくとも1つの実体を分類することをさらに伴ってよい。モデル・アドバイザは、会話コンテンツを分類することとの関連において、クライアント固有の情報を考慮してよい。具体的には、複数のクライアントのうちのクライアントと会話エージェント学習モデルの間の対話の文脈において、モデル・アドバイザは、クライアントに関連付けられたプロファイル・データにアクセスしてよい。モデル・アドバイザは、クライアント・データ・リポジトリから、または例えばクライアントに関連付けられたソーシャル・ネットワーキング・データを提供できる外部ソースから、あるいはその両方から、そのようなプロファイル・データにアクセスしてよい。プロファイル・データによって、モデル・アドバイザがクライアントの嗜好を検出できることがあるため、モデル・アドバイザは、そのようなプロファイル・データにアクセスすることによって、クライアントを含んでいる会話コンテンツから意図または実体あるいはその両方をさらに正確に導出することができてよい。ステップ510に従って会話コンテンツを分類することに関する実施形態は、図7に関して説明される。ステップ510に従って会話コンテンツを分類することに関するさらに別の実施形態は、図8に関して説明される。
ステップ515で、会話コンテンツの分類に基づいて、モデル・アドバイザが、ステップ415で決定された複数のダイアログ部分のうちの少なくとも1つのダイアログ部分を含んでいる会話出力を決定してよい。モデル・アドバイザは、少なくとも1つのモデル・インスタンスに含まれている少なくとも1つの会話インターフェイスを介して、複数のクライアントのうちの1つまたは複数への会話出力の提示を容易にすることができる。モデル・アドバイザは、会話出力を決定することとの関連において、クライアント固有の情報を考慮してよい。モデル・アドバイザは、クライアントに関連付けられたプロファイル・データにアクセスすることによって、そのようなクライアントにより適した1つまたは複数のダイアログ部分を決定することができてよい。例えば、モデル・アドバイザは、プロファイル・データに基づいて、クライアントCが相対的に若く、特定の分野で働いているということを決定することによって、クライアントCに向けられる会話出力が、クライアントCの年齢および職業を考慮して適切であるということを保証してよい。
任意選択的に、ステップ520で、モデル・アドバイザが、会話コンテンツに対して追加が行われたかどうかを判定してよい。具体的には、そのような追加は、複数のクライアントのうちのクライアントの要求に基づいて意図に追加される新しい代替または動的なものを含んでよい。ステップ520で、会話コンテンツに対して追加が行われなかったということを決定したときに、モデル・アドバイザがステップ520を繰り返してよい。代替の実施形態では、ステップ520で、会話コンテンツに対して追加が行われなかったということを決定したときに、方法500が終了してよい。ステップ520で、会話コンテンツに対して少なくとも1つの変更(例えば、追加、修正、または削除、あるいはその組み合わせ)が行われたということを決定したときに、方法500がステップ525に進んでよく、ステップ525で、モデル・アドバイザが、少なくとも1つの変更に基づいて会話コンテンツから導出された少なくとも1つの意図を更新してよい。更新された少なくとも1つの意図に基づいて、ステップ530で、モデル・アドバイザが、ステップ515で会話出力の一部として決定された少なくとも1つのダイアログ部分を更新してよい。ステップ530で、モデル・アドバイザは、ステップ415で決定された複数のダイアログ部分のうちの1つまたは複数の他のダイアログ部分を決定することによって、または1つまたは複数の新しいダイアログ部分を決定することによって、あるいはその両方によって、少なくとも1つのダイアログ部分を更新してよい。ステップ520および525は、モデル・アドバイザが、会話コンテンツから導出された少なくとも1つの意図に対する更新に基づいて、会話出力に含まれている少なくとも1つのダイアログ部分を動的に調整できるようにしてよい。具体的には、モデル・アドバイザが会話コンテンツから意図を導出したときに、モデル・アドバイザは、この意図に対処するためにダイアログ部分を決定してよいが、新しい代替または動的なものがこの意図に追加された場合、または会話コンテンツに対する変更の結果として、この意図がその他の方法で変更された場合、モデル・アドバイザは、最初に決定されたダイアログ部分に対する対応する変更を決定してよい。したがって、モデル・アドバイザは、「認知的推論(cognitive inference)」を介して、会話コンテンツに対する変更に動的に対処してよい。一実施形態によれば、ステップ525で、モデル・アドバイザが、会話コンテンツから導出された少なくとも1つの実体をさらに更新してよい。
一実施形態では、ステップ515で決定された会話出力は、少なくとも1つのアクションを会話コンテンツから導出された少なくとも1つの実体に適用することによって、会話コンテンツから導出された少なくとも1つの意図に対処するために、会話テキストを含んでよい。そのような会話テキストは、会話コンテンツから導出された少なくとも1つの意図に、直接関連してよい。追加的または代替的に、そのような会話テキストは、少なくとも1つのモデル・インスタンスと対話する複数のクライアントのうちの1つまたは複数の1つまたは複数の周辺的な関心事に対処してよい。さらに別の実施形態では、ステップ515で決定された会話出力が、構造化されていないダイアログを含んでよい。そのような構造化されていないダイアログは、構造化されていないテキストまたは視聴覚的コンテンツあるいはその両方を含んでよい。追加的または代替的に、そのような構造化されていないダイアログは、1つまたは複数の表意文字(例えば、絵文字)または顔文字を含んでよい。追加的または代替的に、そのような構造化されていないダイアログは「リッチ・ダイアログ(rich dialog)」を含んでよく、リッチ・ダイアログは、コンテンツ・タイプの拡張配列に基づく対話として定義されてよい。そのような「リッチ・ダイアログ」は、すべて構造化されていないコンテンツを含んでよく、または代替として、構造化されたコンテンツおよび構造化されていないコンテンツの組み合わせを含んでよい。そのような実施形態によれば、モデル・アドバイザは、構造化されていないダイアログを分類し、構造化されていないダイアログを少なくとも1つのダイアログ部分に組み込むことによって、ステップ515で会話出力に含められる少なくとも1つのダイアログ部分を決定してよい。したがって、モデル・アドバイザは、少なくとも1つのモデル・インスタンスに含まれている少なくとも1つの会話インターフェイスを介して、複数のクライアントのうちの1つまたは複数への構造化されていないダイアログを含む少なくとも1つのダイアログ部分の提示を容易にすることができる。
図7は、一実施形態による、会話コンテンツを分類する方法600を示している。方法600は、方法500のステップ510に関する実施形態例を提供する。方法600は、ステップ605で開始してよく、ステップ605で、モデル・アドバイザが、会話エージェント学習モデルを構成することとの関連において、会話コンテンツから導出された少なくとも1つの意図を、ステップ405で導出された複数の意図のうちの少なくとも1つの意図に関連付けてよい。一実施形態では、モデル・アドバイザは、会話エージェント学習モデルの構成中に導出された複数の意図のうちの各意図との、会話コンテンツから導出された少なくとも1つの意図の比較(例えば、反復的比較)の結果として、そのような関連付けを行ってよい。モデル・アドバイザは、文字列照合(例えば、文字列照合アルゴリズムを介して)または自然言語処理あるいはその両方の適用によって、そのような比較を実行してよい。ステップ610で、モデル・アドバイザが、会話エージェント学習モデルを構成することとの関連において、会話コンテンツから導出された少なくとも1つの実体を、ステップ410で導出された複数の実体のうちの少なくとも1つの実体に関連付けてよい。一実施形態では、モデル・アドバイザは、会話エージェント学習モデルの構成中に導出された複数の実体のうちの各実体との、会話コンテンツから導出された少なくとも1つの実体の比較(例えば、反復的比較)の結果として、そのような関連付けを行ってよい。モデル・アドバイザは、文字列照合(例えば、文字列照合アルゴリズムを介して)または自然言語処理あるいはその両方の適用によって、そのような比較を実行してよい。追加的または代替的に、モデル・アドバイザは、会話コンテンツから導出された少なくとも1つの意図または少なくとも1つの実体あるいはその両方を分類するために、ステップ605および610との関連において、その他の分類方法またはアルゴリズムを適用してよい。
図8は、一実施形態による、会話コンテンツを分類する方法700を示している。方法700は、方法500のステップ510に関する実施形態例をさらに提供する。方法700は、ステップ705で開始してよく、ステップ705で、モデル・アドバイザは、少なくとも1つの会話インターフェイスを介して複数のクライアントのうちの1つまたは複数から受信された会話コンテンツが構造化されていないコンテンツを含んでいるかどうかを判定してよい。方法700との関連において、構造化されていないコンテンツは、構造化されていない文書または書式を含んでよい。方法700との関連において、構造化されていないコンテンツは、音声、画像、またはビデオ、あるいはその組み合わせなどの、視聴覚的コンテンツをさらに含んでよい。方法700との関連において、構造化されていないコンテンツは、1つまたは複数の表意文字(例えば、絵文字)または顔文字をさらに含んでよい。ステップ705で、会話コンテンツが構造化されていないコンテンツを含んでいないということを決定したときに、モデル・アドバイザがステップ705を繰り返してよい。代替の実施形態では、ステップ705で、会話コンテンツが構造化されていないコンテンツを含んでいないということを決定したときに、方法700が終了してよい。会話コンテンツが構造化されていないコンテンツを含んでいるということを決定したときに、方法700がステップ710に進んでよく、ステップ710で、モデル・アドバイザが少なくとも1つの認識手法を構造化されていないコンテンツに適用して、統一されたテキストベースのアーチファクト(すなわち、メタコンテンツ)を生成してよい。そのような少なくとも1つの認識手法は、光学式文字認識(OCR:optical character recognition)、光学式マーク認識(OMR:optical mark recognition)、知的文字認識(ICR:intelligent character recognition)、画像認識、音声テキスト変換、およびビデオ・テキスト変換(video-to-text)から成る群から選択された1つまたは複数の手法を含んでよい。ステップ715で、モデル・アドバイザが、人工知能コンピューティング・システムを介して統一されたテキストベースのアーチファクトの意味解析を実行し、構造化されていないコンテンツを分類してよい。意味解析は、1つまたは複数の新しいトピックまたはその他のアスペクトの決定をもたらしてよく、この決定によって、統一されたテキストベースのアーチファクトの1つまたは複数のアスペクトを分類する。テキストベースのアーチファクトの解析の結果として、構造化されていないコンテンツの分類に基づいて、モデル・アドバイザが、構造化されていないコンテンツに対処するための会話出力を作成してよい。
例えば、モデル・アドバイザは、クライアントDにアクセスできる会話インターフェイスを介して、クライアントDからチェック・グラフィック(check graphic)の形態で会話コンテンツを受信したときに、ステップ705に従って、クライアントDからの会話コンテンツが構造化されていないコンテンツを含んでいるということを決定してよい。その後、モデル・アドバイザは、ステップ710に従って画像認識を適用し、請求書の支払いに基づいて統一されたテキストベースのアーチファクトを決定してよい。モデル・アドバイザは、請求書の支払いに関連するテキストベースのアーチファクトに関して意味解析を実行し、チェック・グラフィックを請求書の支払いの意図に関連付けることによって、チェック・グラフィックを分類してよい。したがって、モデル・アドバイザは、クライアントDにアクセスできる会話インターフェイスを介して提示されるダイアログ部分の形態で、クライアントDが請求書の支払いを処理する意思を確認することを要求する会話出力を作成してよい。
図9は、一実施形態による、会話エージェント学習モデルを構成する方法800を示している。方法800は、方法200のステップ210に関する実施形態例をさらに提供する。方法800は、ステップ805で開始してよく、ステップ805で、モデル・アドバイザが、情報のコーパスが構造化されていないコンテンツを含んでいるかどうかを判定してよい。方法800との関連において、構造化されていないコンテンツは、構造化されていない文書または書式を含んでよい。方法800との関連において、構造化されていないコンテンツは、音声、画像、またはビデオ、あるいはその組み合わせなどの、視聴覚的コンテンツをさらに含んでよい。方法800との関連において、構造化されていないコンテンツは、1つまたは複数の表意文字(例えば、絵文字)または顔文字をさらに含んでよい。方法800との関連において、構造化されていないコンテンツは、ソーシャル・メディアの反応のコンテンツ(例えば、「いいね」、「よくないね」などを組み込んでいるコンテンツ)をさらに含んでよい。ステップ805で、情報のコーパスが構造化されていないコンテンツを含んでいないということを決定したときに、モデル・アドバイザがステップ805を繰り返してよい。代替の実施形態では、ステップ805で、情報のコーパスが構造化されていないコンテンツを含んでいないということを決定したときに、方法800が終了してよい。情報のコーパスが構造化されていないコンテンツを含んでいるということを決定したときに、方法800がステップ810に進んでよく、ステップ810で、モデル・アドバイザが少なくとも1つの認識手法を構造化されていないコンテンツに適用して、統一されたテキストベースのアーチファクト(すなわち、メタコンテンツ)を生成してよい。そのような少なくとも1つの認識手法は、光学式文字認識(OCR)、光学式マーク認識(OMR)、知的文字認識(ICR)、画像認識、音声テキスト変換、およびビデオ・テキスト変換から成る群から選択された1つまたは複数の手法を含んでよい。ステップ815で、モデル・アドバイザが、人工知能コンピューティング・システムを介して統一されたテキストベースのアーチファクトの意味解析を実行し、構造化されていないコンテンツを分類してよい。意味解析は、1つまたは複数の新しいトピックまたはその他のアスペクトの決定をもたらしてよく、この決定によって、統一されたテキストベースのアーチファクトの1つまたは複数のアスペクトを分類する。ステップ820で、モデル・アドバイザが、構造化されていないコンテンツの分類に基づいて会話エージェント学習モデルを更新してよい。具体的には、ステップ820で、モデル・アドバイザが、ステップ815で実行された意味解析に基づいて、新しいトピックまたはその他のアスペクトを会話エージェント学習モデルに追加してよく、新しいトピックまたはその他のアスペクトとの関連において、構造化されていないコンテンツを分類してよい。追加的または代替的に、ステップ820で、モデル・アドバイザが、ステップ815で実行された意味解析に基づいて、会話エージェント学習モデルの既存のトピックまたはその他のアスペクトを更新してよく、新たに更新されたトピックまたはその他のアスペクトとの関連において、構造化されていないコンテンツを分類してよい。モデル・アドバイザは、ステップ820に従って会話エージェント学習モデルを更新することによって、構造化されていないコンテンツの1つまたは複数の種類との互換性を保証するように、モデルを適応させてよい。
本発明のさまざまな実施形態の説明は、例示の目的で提示されているが、網羅的であることは意図されておらず、開示された実施形態に限定されない。説明された実施形態に対して行われるあらゆる種類の変更および同等の構成は、本発明の保護される範囲に含まれるべきである。したがって、本発明の範囲は、「発明を実施するための形態」に関連して後に続く特許請求の範囲に従って、最も広く説明されるべきであり、おそらくすべての同等の変形および同等の構成を対象にするべきである。記載された実施形態の範囲および思想を逸脱することなく多くの変更および変形が可能であることは、当業者にとって明らかであろう。本明細書で使用された用語は、実施形態の原理、実際の適用、または市場で見られる技術を超える技術的改良を最も適切に説明するため、または他の当業者が本明細書に記載された実施形態を理解できるようにするために選択されている。

Claims (20)

  1. プロセッサとメモリを有するコンピュータの情報処理により、会話エージェント学習モデルを動的に構築する方法であって、
    情報のコーパスを取り出すことであって、前記情報のコーパスが、ソーシャル・ネットワークまたはアプリケーションからのデータを含む、リポジトリのセットおよび外部データからの記録を含んでいる、前記取り出すことと、
    前記取り出された情報のコーパスに基づいて前記会話エージェント学習モデルを構成することと、
    前記会話エージェント学習モデルと複数のクライアントの間の対話を容易にすることによって、前記会話エージェント学習モデルを展開することと、
    前記対話の結果として受信された情報に基づいて、前記会話エージェント学習モデルにおける少なくとも1つの欠陥を識別することであって、前記欠陥はこれまで発生しなかった対象、または会話エージェント学習モデルとの関連において追跡もしくはアクセスするための情報が相対的に少ないか、もしくはそのような情報が存在しない対象、あるいはその両方を含む、識別することと、
    前記少なくとも1つの欠陥に対処するように前記会話エージェント学習モデルを更新することと
    前記情報のコーパスに対する変更に対処するように前記会話エージェント学習モデルを更新することと
    を含んでいる、方法。
  2. ドメイン管理者から入力を受信して、前記対話を改良することをさらに含んでいる、請求項1に記載の方法。
  3. 前記情報のコーパスに対する変更に対処するように前記会話エージェント学習モデルを更新することが、新しい社会的傾向に基づいて、前記会話エージェント学習モデルの少なくとも1つのアスペクトを動的に調整することを含んでいる、請求項1に記載の方法。
  4. 前記情報のコーパスに対する変更に対処するように前記会話エージェント学習モデルを更新することが、新しい技術の導入に基づいて、前記会話エージェント学習モデルの少なくとも1つのアスペクトを動的に調整することを含んでいる、請求項1に記載の方法。
  5. 前記情報のコーパスを取り出すことが、
    複数の問題を識別することと、
    前記複数の問題にそれぞれ対応する複数の解決策を識別することと、
    前記複数の問題または前記複数の解決策に関連付けられたクライアントのコンテンツを識別することと、
    前記複数の解決策に関連付けられたランク付けを識別することと
    を含んでいる、請求項1に記載の方法。
  6. 前記会話エージェント学習モデルを構成することが、
    前記複数の問題に基づいて複数の意図を導出することであって、前記複数の意図の各々が目的または目標を示す、前記導出することと、
    複数の実体を導出することであって、前記複数の実体の各々が、前記複数の意図のうちの1つまたは複数に対処するために、前記複数の解決策に基づいて少なくとも1つのアクションの選択を可能にするオブジェクト・クラスまたはデータ型である、前記導出することと、
    複数のダイアログ部分を決定することであって、前記複数のダイアログ部分の各々が、前記少なくとも1つのアクションを前記複数の実体のうちの1つまたは複数に適用することの結果として、前記複数の意図のうちの1つまたは複数に対処するための会話テキストを含んでいる、前記決定することと
    を含んでいる、請求項に記載の方法。
  7. 少なくとも1つの欠陥に対処するように前記会話エージェント学習モデルを更新することが、少なくとも1つの新しい意図を前記複数の意図に組み込むこと、または少なくとも1つの新しい実体を前記複数の実体に組み込むことを含んでいる、請求項に記載の方法。
  8. 前記会話エージェント学習モデルを展開することが、
    少なくとも1つのモデル・インスタンスを初期化することであって、前記少なくとも1つのモデル・インスタンスが、前記複数のクライアントのうちの少なくとも1つにアクセスできる少なくとも1つの会話インターフェイスを含んでいる、前記初期化することと、
    前記会話エージェント学習モデルのアスペクトに基づいて、会話コンテンツから導出された少なくとも1つの意図および前記会話コンテンツから導出された少なくとも1つの実体を含む、前記少なくとも1つの会話インターフェイスを介して受信された会話コンテンツを分類することと、
    前記会話コンテンツの前記分類に基づいて、前記複数のダイアログ部分のうちの少なくとも1つのダイアログ部分を含んでいる会話出力を決定することと
    を含んでいる、請求項に記載の方法。
  9. 前記会話エージェント学習モデルを展開することが、
    前記会話コンテンツに対する少なくとも1つの変更に応答して、
    前記会話コンテンツから導出された前記少なくとも1つの意図を更新することと、
    前記更新された少なくとも1つの意図に基づいて前記少なくとも1つのダイアログ部分を更新することと
    をさらに含んでいる、請求項に記載の方法。
  10. 前記会話出力が、少なくとも1つのアクションを前記会話コンテンツから導出された前記少なくとも1つの実体に適用することによって、前記会話コンテンツから導出された前記少なくとも1つの意図に対処するために、会話テキストを含んでいる、請求項に記載の方法。
  11. 前記会話出力が、構造化されていないダイアログを含んでいる、請求項に記載の方法。
  12. 前記会話コンテンツを分類することが、
    前記会話コンテンツから導出された前記少なくとも1つの意図を、前記複数の意図のうちの少なくとも1つの意図に関連付けることと、
    前記会話コンテンツから導出された前記少なくとも1つの実体を、前記複数の実体のうちの少なくとも1つの実体に関連付けることと
    を含んでいる、請求項に記載の方法。
  13. 前記会話コンテンツを分類することが、
    前記会話コンテンツが構造化されていないコンテンツを含んでいるということの決定に応答して、
    少なくとも1つの認識手法を前記構造化されていないコンテンツに適用して、統一されたテキストベースのアーチファクトを生成することと、
    人工知能コンピューティング・システムを介して前記統一されたテキストベースのアーチファクトの意味解析を実行し、前記構造化されていないコンテンツを分類することと
    を含んでいる、請求項に記載の方法。
  14. 前記会話エージェント学習モデルを構成することが、
    前記情報のコーパスが構造化されていないコンテンツを含んでいるということの決定に応答して、
    少なくとも1つの認識手法を前記構造化されていないコンテンツに適用して、統一されたテキストベースのアーチファクトを生成することと、
    人工知能コンピューティング・システムを介して前記統一されたテキストベースのアーチファクトの意味解析を実行し、前記構造化されていないコンテンツを分類することと、
    前記構造化されていないコンテンツの前記分類に基づいて前記会話エージェント学習モデルを更新することと
    を含んでいる、請求項1に記載の方法。
  15. コンピュータ・プログラムであって、請求項1ないし14のいずれか1項に記載の方法の各ステップをコンピュータに実行させるための、コンピュータ・プログラム。
  16. 請求項15に記載のコンピュータ・プログラムを記録した、コンピュータ可読記憶媒体。
  17. システムであって、
    プロセッサと、
    アプリケーション・プログラムを格納しているメモリと
    を備え、前記アプリケーション・プログラムが、前記プロセッサ上で実行された場合に、会話エージェント学習モデルを動的に構築する動作を実行し、前記動作が、
    情報のコーパスを取り出すことであって、前記情報のコーパスが、ソーシャル・ネットワークまたはアプリケーションからのデータを含む、リポジトリのセットおよび外部データからの記録を含んでいる、前記取り出すことと、
    前記取り出された情報のコーパスに基づいて前記会話エージェント学習モデルを構成することと、
    前記会話エージェント学習モデルと複数のクライアントの間の対話を容易にすることによって、前記会話エージェント学習モデルを展開することと、
    前記対話の結果として受信された情報に基づいて、前記会話エージェント学習モデルにおける少なくとも1つの欠陥を識別することであって、前記欠陥はこれまで発生しなかった対象、または会話エージェント学習モデルとの関連において追跡もしくはアクセスするための情報が相対的に少ないか、もしくはそのような情報が存在しない対象、あるいはその両方を含む、識別することと、
    前記情報のコーパスに対する変更に対処するように前記会話エージェント学習モデルを更新することと
    を含んでいる、システム。
  18. 前記動作が、
    ドメイン管理者から入力を受信して、前記対話を改良することをさらに含んでいる、請求項17に記載のシステム。
  19. 前記情報のコーパスを取り出すことが、
    複数の問題を識別することと、
    前記複数の問題にそれぞれ対応する複数の解決策を識別することと、
    前記複数の問題または前記複数の解決策に関連付けられたクライアントのコンテンツを識別することと、
    前記複数の解決策に関連付けられたランク付けを識別することと
    を含んでいる、請求項17に記載のシステム。
  20. 前記会話エージェント学習モデルを構成することが、
    前記複数の問題に基づいて複数の意図を導出することであって、前記複数の意図の各々が目的または目標を示す、前記導出することと、
    複数の実体を導出することであって、前記複数の実体の各々が、前記複数の意図のうちの1つまたは複数に対処するために、前記複数の解決策に基づいて少なくとも1つのアクションの選択を可能にするオブジェクト・クラスまたはデータ型である、前記導出することと、
    複数のダイアログ部分を決定することであって、前記複数のダイアログ部分の各々が、前記少なくとも1つのアクションを前記複数の実体のうちの1つまたは複数に適用することの結果として、前記複数の意図のうちの1つまたは複数に対処するための会話テキストを含んでいる、前記決定することと
    を含んでいる、請求項19に記載のシステム。
JP2020538061A 2018-02-01 2019-01-21 会話エージェント学習モデルを動的に構築して構成する方法、コンピュータ・プログラム、およびシステム Active JP7263370B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/886,686 US11886823B2 (en) 2018-02-01 2018-02-01 Dynamically constructing and configuring a conversational agent learning model
US15/886,686 2018-02-01
PCT/IB2019/050478 WO2019150222A1 (en) 2018-02-01 2019-01-21 Dynamically constructing and configuring a conversational agent learning model

Publications (2)

Publication Number Publication Date
JP2021512393A JP2021512393A (ja) 2021-05-13
JP7263370B2 true JP7263370B2 (ja) 2023-04-24

Family

ID=67392504

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020538061A Active JP7263370B2 (ja) 2018-02-01 2019-01-21 会話エージェント学習モデルを動的に構築して構成する方法、コンピュータ・プログラム、およびシステム

Country Status (6)

Country Link
US (1) US11886823B2 (ja)
JP (1) JP7263370B2 (ja)
CN (1) CN111566637A (ja)
DE (1) DE112019000206T5 (ja)
GB (1) GB2584239B (ja)
WO (1) WO2019150222A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11188809B2 (en) * 2017-06-27 2021-11-30 International Business Machines Corporation Optimizing personality traits of virtual agents
CN112883024A (zh) * 2018-04-27 2021-06-01 华为技术有限公司 一种模型更新方法、装置及系统
US11257496B2 (en) * 2018-09-26 2022-02-22 [24]7.ai, Inc. Method and apparatus for facilitating persona-based agent interactions with online visitors
US10999433B2 (en) * 2018-11-30 2021-05-04 Verizon Patent And Licensing Inc. Interpretation of user interaction using model platform
US11762670B2 (en) 2020-02-26 2023-09-19 Red Hat, Inc. Testing and selection of efficient application configurations
US20230274095A1 (en) * 2021-01-11 2023-08-31 Gotlt! Inc. Autonomous conversational ai system without any configuration by a human
KR20220123170A (ko) * 2021-02-28 2022-09-06 조지수 인공지능 아바타 튜터를 활용한 회화 학습 시스템 및 그 방법

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010079574A (ja) 2008-09-25 2010-04-08 Taito Corp デジタルストーリー提供システム、デジタルストーリー提供方法、及びこの方法をコンピュータシステムに実行させるためのコンピュータプログラム
JP2011501847A (ja) 2007-10-17 2011-01-13 アイティーアイ・スコットランド・リミテッド コンピュータで実現される方法
US20130282417A1 (en) 2012-04-20 2013-10-24 Lithium Technologies, Inc. System and method for providing a social customer care system
JP2016012197A (ja) 2014-06-27 2016-01-21 株式会社東芝 対話装置、方法およびプログラム
US20170180276A1 (en) 2015-12-21 2017-06-22 Google Inc. Automatic suggestions and other content for messaging applications
WO2017163515A1 (ja) 2016-03-24 2017-09-28 ソニー株式会社 情報処理システム、情報処理装置、情報処理方法、および記録媒体
JP2017215971A (ja) 2015-09-08 2017-12-07 アップル インコーポレイテッド メディア環境内におけるインテリジェント自動アシスタント
JP2019518292A (ja) 2016-04-11 2019-06-27 フェイスブック,インク. 会話サンプルに基づいて自然言語機械学習を使用してユーザ要求に応答する技術

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020072916A1 (en) * 2000-12-08 2002-06-13 Philips Electronics North America Corporation Distributed speech recognition for internet access
GB2372864B (en) * 2001-02-28 2005-09-07 Vox Generation Ltd Spoken language interface
US7606714B2 (en) 2003-02-11 2009-10-20 Microsoft Corporation Natural language classification within an automated response system
US20050197825A1 (en) * 2004-03-05 2005-09-08 Lucent Technologies Inc. Personal digital assistant with text scanner and language translator
US20070168480A1 (en) 2006-01-13 2007-07-19 Microsoft Corporation Interactive Robot Creation
US9318108B2 (en) * 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8630961B2 (en) 2009-01-08 2014-01-14 Mycybertwin Group Pty Ltd Chatbots
US8818926B2 (en) 2009-09-29 2014-08-26 Richard Scot Wallace Method for personalizing chat bots
CN102314440B (zh) 2010-06-30 2016-06-08 百度在线网络技术(北京)有限公司 利用网络维护语言模型库的方法和系统
EP2839391A4 (en) * 2012-04-20 2016-01-27 Maluuba Inc CONVERSATION AGENT
US8762302B1 (en) * 2013-02-22 2014-06-24 Bottlenose, Inc. System and method for revealing correlations between data streams
US9330659B2 (en) * 2013-02-25 2016-05-03 Microsoft Technology Licensing, Llc Facilitating development of a spoken natural language interface
US9189742B2 (en) * 2013-11-20 2015-11-17 Justin London Adaptive virtual intelligent agent
CA2835368A1 (en) * 2013-11-27 2015-05-27 Akademia Gorniczo-Hutnicza Im. Stanislawa Staszica W Krakowie System and method for providing a dialog with a user
US10621653B2 (en) * 2014-03-31 2020-04-14 Monticello Enterprises LLC System and method for providing payments for users in connection with a device software module having a payment application programming interface
US9547471B2 (en) * 2014-07-03 2017-01-17 Microsoft Technology Licensing, Llc Generating computer responses to social conversational inputs
US10116596B2 (en) 2014-09-29 2018-10-30 International Business Machines Corporation Personalizing data system components and data sources as chatbots in a group chat session
US9647968B2 (en) 2015-03-25 2017-05-09 Pypestream Inc Systems and methods for invoking chatbots in a channel based communication system
CN106294418B (zh) 2015-05-25 2019-08-30 北京大学 检索方法和检索系统
CN106055623A (zh) 2016-05-26 2016-10-26 《中国学术期刊(光盘版)》电子杂志社有限公司 一种跨语言推荐方法和系统
CN106844333A (zh) 2016-12-20 2017-06-13 竹间智能科技(上海)有限公司 一种基于语义及语法结构的语句分析方法及系统
CN106997375B (zh) 2017-02-28 2020-08-18 浙江大学 基于深度学习的客服回复推荐方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011501847A (ja) 2007-10-17 2011-01-13 アイティーアイ・スコットランド・リミテッド コンピュータで実現される方法
JP2010079574A (ja) 2008-09-25 2010-04-08 Taito Corp デジタルストーリー提供システム、デジタルストーリー提供方法、及びこの方法をコンピュータシステムに実行させるためのコンピュータプログラム
US20130282417A1 (en) 2012-04-20 2013-10-24 Lithium Technologies, Inc. System and method for providing a social customer care system
JP2016012197A (ja) 2014-06-27 2016-01-21 株式会社東芝 対話装置、方法およびプログラム
JP2017215971A (ja) 2015-09-08 2017-12-07 アップル インコーポレイテッド メディア環境内におけるインテリジェント自動アシスタント
US20170180276A1 (en) 2015-12-21 2017-06-22 Google Inc. Automatic suggestions and other content for messaging applications
WO2017163515A1 (ja) 2016-03-24 2017-09-28 ソニー株式会社 情報処理システム、情報処理装置、情報処理方法、および記録媒体
JP2019518292A (ja) 2016-04-11 2019-06-27 フェイスブック,インク. 会話サンプルに基づいて自然言語機械学習を使用してユーザ要求に応答する技術

Also Published As

Publication number Publication date
DE112019000206T5 (de) 2020-08-06
US20190238487A1 (en) 2019-08-01
GB202012150D0 (en) 2020-09-16
WO2019150222A1 (en) 2019-08-08
CN111566637A (zh) 2020-08-21
US11886823B2 (en) 2024-01-30
GB2584239B (en) 2022-03-02
GB2584239A (en) 2020-11-25
JP2021512393A (ja) 2021-05-13

Similar Documents

Publication Publication Date Title
JP7263370B2 (ja) 会話エージェント学習モデルを動的に構築して構成する方法、コンピュータ・プログラム、およびシステム
US11106877B2 (en) Dynamic text generation for social media posts
US10587920B2 (en) Cognitive digital video filtering based on user preferences
US11651032B2 (en) Determining semantic content of textual clusters
US20210133557A1 (en) Cognitive data pseudonymization
US10931767B2 (en) Prioritizing social media posts and recommending related actions
US10599777B2 (en) Natural language processing with dynamic pipelines
US11683283B2 (en) Method for electronic messaging
US10834227B2 (en) Conversational agent learning model service selection to address a client service request
US11205138B2 (en) Model quality and related models using provenance data
JP2019510282A (ja) グロッサリを用いたストリーミング分析アプリケーションの生成
US11875121B2 (en) Generating responses for live-streamed questions
US20200150981A1 (en) Dynamic Generation of User Interfaces Based on Dialogue
US20220083881A1 (en) Automated analysis generation for machine learning system
US11620334B2 (en) Commercial video summaries using crowd annotation
US11526559B2 (en) Content filtering based on user state
US11631488B2 (en) Dialogue generation via hashing functions
TWI814394B (zh) 電子系統、電腦實施方法及電腦程式產品
TWI818695B (zh) 用於反事實對話模擬之電腦實施方法、電腦程式產品及電腦系統
WO2022206307A1 (en) Method for electronic messaging using image based noisy content
US11630865B2 (en) User reaction based information options
US11676596B2 (en) Dialog shortcuts for interactive agents
US11210709B2 (en) Methods and systems for generating personalized call-to-action elements
US20220414168A1 (en) Semantics based search result optimization
US20220353210A1 (en) Altering automated conversation systems

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210324

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210623

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20220502

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220727

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230328

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230412

R150 Certificate of patent or registration of utility model

Ref document number: 7263370

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150