JP2023545947A - 意図シーディングを介して会話データから意図をマイニングすることによるボットオーサリングに関するシステム及び方法 - Google Patents

意図シーディングを介して会話データから意図をマイニングすることによるボットオーサリングに関するシステム及び方法 Download PDF

Info

Publication number
JP2023545947A
JP2023545947A JP2023519241A JP2023519241A JP2023545947A JP 2023545947 A JP2023545947 A JP 2023545947A JP 2023519241 A JP2023519241 A JP 2023519241A JP 2023519241 A JP2023519241 A JP 2023519241A JP 2023545947 A JP2023545947 A JP 2023545947A
Authority
JP
Japan
Prior art keywords
intent
customer
utterance
salient
seed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023519241A
Other languages
English (en)
Inventor
ジョージ、バジル
スンダラム、ラマスブラマニアン
Original Assignee
ジェネシス クラウド サービシーズ インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ジェネシス クラウド サービシーズ インコーポレイテッド filed Critical ジェネシス クラウド サービシーズ インコーポレイテッド
Publication of JP2023545947A publication Critical patent/JP2023545947A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • G06Q30/015Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
    • G06Q30/016After-sales
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/02User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Finance (AREA)
  • Evolutionary Computation (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Fuzzy Systems (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

会話型ボットをオーサリングするための方法であって、会話データを受信することと、シード意図ラベルとサンプル意図を有する発話とを有するシード意図を含むシード意図データを受信することと、意図マイニングアルゴリズムを使用して、会話データをマイニングして、シード意図に関連付ける新しい発話を決定することと、シード意図に関連付けられたマイニングされた新しい発話を含むようにシード意図データを拡張することと、拡張されたシード意図データを会話型ボットにアップロードすることと、を含む、方法。意図マイニングアルゴリズムは、意図を有する発話を識別することと、候補意図を識別することと、シード意図の各々について、サンプル意図を有する発話からシード意図代替を識別することと、意図を有する発話の候補意図と、シード意図代替との間の意味的類似度の度合いを決定することを介して、会話データからの意図を有する発話をシード意図に関連付けることと、を含むことができる。【選択図】図9

Description

(関連出願の相互参照)
本出願は、2021年3月31日に出願された「SYSTEMS AND METHODS RELATING TO BOT AUTHORING BY MINING INTENTS FROM NATURAL LANGUAGE CONVERSATIONS」と題する係属中の米国特許出願第17/218,456号に変換された、2020年9月25日に米国特許商標庁に出願された「SYSTEMS AND METHODS RELATING TO BOT AUTHORING AND/OR AUTOMATING THE MINING OF INTENTS FROM CONVERSATION DATA VIA INTENT SEEDING」と題する米国特許仮出願第63/083,561号の利益を主張する。
本発明は、概して、インターネットベースのサービスオプションを介した顧客支援など顧客関係管理の分野における電気通信システムに関する。より詳細には、限定するものではないが、本発明は、ボットオーサリングワークフローを自動化し、かつ/又は意図シーディングプロセスを使用して自然言語会話データから意図及び関連付けられた発話をマイニングするための意図マイニングプロセスを実装するためのシステム及び方法に関する。
本発明は、会話型ボットをオーサリングするためのコンピュータ実装方法を含み、意図シーディングを使用した意図マイニングが提供される。本方法は、会話データを受信することであって、会話データが、会話から導出されたテキストを含み、会話の各々が、顧客と顧客サービス担当者との間のものである、受信することと、シード意図を含み得るシード意図データを受信することであって、シード意図の各々が、シード意図ラベルと、シード意図に関連付けられたサンプル意図を有する発話とを含む、受信することと、意図マイニングアルゴリズムを使用して、会話データを自動的にマイニングして、シード意図に関連付ける新しい発話を決定することと、シード意図に関連付けられたマイニングされた新しい発話を含むようにシード意図データを拡張することと、拡張されたシード意図データを会話型ボットにアップロードし、会話型ボットを使用して他の顧客との自動化された会話を行うことと、を含むことができる。意図マイニングアルゴリズムは、会話データの会話内で発生する発話を分析して、意図を有する発話を識別することを含むことができる。発話は各々、会話内のターンを含むことができ、それによって、顧客は、顧客発話の形態で、又は顧客サービス担当者は、顧客サービス担当者発話の形態で、通信している。意図を有する発話は、意図を表現する可能性が高いと決定された発話のうちの1つとして定義され得る。意図マイニングアルゴリズムは、識別された意図を有する発話を分析して、候補意図を識別することを更に含むことができる。候補意図は各々、目的又はタスクを記述するワード若しくはフレーズを含み得るアクションと、アクションが動作するオブジェクト又は物事を記述するワード若しくはフレーズを含み得るオブジェクトとの2つの部分を有する、意図を有する発話のうちの1つ内で発生するテキストフレーズであるものとして識別される。意図マイニングアルゴリズムは、シード意図の各々について、シード意図に関連付けられたサンプル意図を有する発話からシード意図代替を識別することを更に含むことができる。シード意図代替は、目的又はタスクを記述するワード若しくはフレーズを含み得るアクションと、アクションが動作するオブジェクト又は物事を記述するワード若しくはフレーズを含み得るオブジェクトとの2つの部分を含み得る、サンプル意図を有する発話のうちの1つ内で発生するテキストフレーズであるものとして識別される。意図マイニングアルゴリズムは、意図を有する発話内に存在する候補意図と、シード意図ラベルの各々に属するシード意図代替との間の意味的類似度の度合いを決定することを介して、会話データからの意図を有する発話をシード意図に関連付けることを更に含むことができる。
本出願のこれら及び他の特徴は、図面及び添付の特許請求の範囲と併せて、例示的な実施形態の以下の詳細な記載を検討することにより、より明らかになるであろう。
本発明のより完全な理解は、本発明が、同様の参照記号が同様の構成要素を示す添付図面と併せて考慮されるときに、以下の詳細な記載を参照することによってより良好に理解されるため、より容易に明らかになるであろう。
本発明の例示的な実施形態による、及び/又は本発明の例示的な実施形態が可能にされ得る若しくは実施され得るコンピューティングデバイスの概略ブロック図を示す。 本発明の例示的な実施形態による、及び/又は本発明の例示的実施形態が可能にされ得る若しくは実施され得る通信インフラストラクチャ又はコンタクトセンターの概略ブロック図を示す。 本発明の実施形態による、チャットシステムの一部として動作するチャットサーバの更なる詳細を示す概略ブロック図である。 本発明の実施形態によるチャットモジュールの概略ブロック図である。 本発明の実施形態による例示的な顧客チャットインターフェースである。 本発明の実施形態による顧客自動化システムのブロック図である。 本発明の実施形態による、顧客のためにインタラクションを自動化するための方法のフローチャートである。 会話型ボットをオーサリングするためのワークフローである。 本発明による意図マイニングのための例示的なフローチャートである。 本発明による、意図をシーディングすることによる意図マイニングのための例示的なフローチャートである。
本発明の原理の理解を促進する目的で、ここでは図面に例解される例示的な実施形態を参照し、具体的な文言を使用してその記載を行う。しかしながら、実施例において提供される詳細な材料が、本発明を実施するために必要とされない場合があることは、当業者には明らかであろう。他の例では、本発明を不明瞭にすることを避けるために、周知の材料又は方法は、詳細には記載されていない。追加的に、本明細書に提示されるように、提供される実施例又は本発明の原理の適用における更なる修正は、当業者に通常想起されるように企図される。
本明細書で使用される場合、非限定的な実施例及び例示を指定する言語は、「例えば(e.g.)」、「すなわち(i.e.)」、「例えば(for example)」、「例えば(for instance)」などを含む。更に、本明細書を通じて、「実施形態」、「一実施形態」、「本実施形態」、「例示的な実施形態」、「特定の実施形態」などへの言及は、所与の実施例に関連して記載の特定の特徴、構造、又は特性が、本発明の少なくとも1つの実施形態に含まれ得ることを意味する。したがって、「実施形態」、「一実施形態」、「本実施形態」、「例示的な実施形態」、「特定の実施形態」などの語句の出現は、必ずしも同じ実施形態又は実施例を指すわけではない。更に、特定の特徴、構造又は特性は、1つ以上の実施形態若しくは実施例において、任意の好適な組み合わせ及び/又は部分的組み合わせで組み合わされ得る。
当業者は、本開示から、種々の実施形態が、多くの異なるタイプのデータ処理機器を使用してコンピュータ実装され得、実施形態は、装置、方法、又はコンピュータプログラム製品として実装されることを認識するであろう。したがって、例示的な実施形態は、完全にハードウェアの実施形態、完全にソフトウェアの実施形態、又はソフトウェア態様とハードウェア態様とを組み合わせた実施形態の形態をとり得る。例示的な実施形態は、更に、任意の有形の表現媒体においてコンピュータ使用可能プログラムコードによって具現化されるコンピュータプログラム製品の形態をとり得る。いずれの場合も、例示的な実施形態は、概して「モジュール」、「システム」、又は「方法」と称され得る。
図に提供されるフローチャート及びブロック図は、本発明の例示的な実施形態によるシステム、方法、及びコンピュータプログラム製品の可能な実装のアーキテクチャ、機能、及び動作を例解する。この点に関して、フローチャート及び/又はブロック図の各ブロック又はそれらのブロックの組み合わせは、指定された論理機能を実装するための1つ以上の実行可能命令を有するプログラムコードのモジュール、セグメント、又は部分を表し得ることが理解されるであろう。同様に、フローチャート及び/又はブロック図のブロックの各々又はそれらのブロックの組み合わせは、特定の動作又は機能を実行する専用ハードウェアベースのシステム又は専用ハードウェアとコンピュータ命令との組み合わせによって実装され得ることが理解されるであろう。そのようなコンピュータプログラム命令はまた、コンピュータ可読媒体内のプログラム命令が、フローチャート及び/又はブロック図の各ブロック又はそれらのブロックの組み合わせで指定された機能又は動作が実装される命令を含む製品を作り出すように、コンピュータ又は他のプログラム可能データ処理装置に特定の方法で機能するように指示することができるコンピュータ可読媒体内に記憶され得る。
コンピューティングデバイス
本発明のシステム及び方法は、適切なソフトウェアプログラムを実行する、多くの異なる形態のデータ処理機器、例えば、デジタルマイクロプロセッサ及び関連メモリを使用してコンピュータ実装され得ることが理解されるであろう。背景として、図1は、本発明の実施形態による、及び/又は、それらの実施形態が可能にされ得る若しくは実施され得る例示的なコンピューティングデバイス100の概略ブロック図を例解する。図1は、非限定的な実施例として提供されることを理解されたい。
コンピューティングデバイス100は、例えば、ファームウェア(例えば、特定用途向け集積回路)、ハードウェア、又はソフトウェア、ファームウェア、及びハードウェアの組み合わせを介して実装され得る。以下の図におけるサーバ、コントローラ、スイッチ、ゲートウェイ、エンジン、及び/又はモジュール(集合的にサーバ又はモジュールと称され得る)の各々は、コンピューティングデバイス100のうちの1つ以上を介して実装され得ることが理解されるであろう。実施例として、様々なサーバは、本明細書に記載の様々な機能を実行するためにコンピュータプログラム命令を実行し、かつ他のシステム又はモジュールと相互作用し得る、1つ以上のコンピューティングデバイス100のうちの1つ以上のプロセッサ上で動作するプロセスであり得る。特に限定されない限り、複数のコンピューティングデバイスに関連して記載される機能は、単一のコンピューティングデバイスに統合され得るか、又は単一のコンピューティングデバイスに関連して記載される様々な機能は、いくつかのコンピューティングデバイスにわたって分散され得る。更に、以下の図に記載されたコンピューティングシステム、例えば、図2のコンタクトセンターシステム200などに関連して、それの様々なサーバ及びコンピュータデバイスは、ローカルコンピューティングデバイス100(すなわち、現場で若しくはコンタクトセンターエージェントと同じ物理的場所で)、リモートコンピューティングデバイス100(すなわち、現場から離れて若しくはクラウドコンピューティング環境において、例えば、ネットワークを介してコンタクトセンターに接続されたリモートデータセンターにおいて)又はそれらのいくつかの組み合わせ上に位置し得る。現場から離れたコンピューティングデバイス上に位置するサーバによって提供される機能は、あたかもそのようなサーバが現場にあるかのように、仮想プライベートネットワーク(virtual private network、VPN)を介してアクセスされ、及び提供され得、又は機能は、拡張可能マークアップ言語(extensible markup language、XML)、JSONなどを介してデータを交換することによってなど、様々なプロトコルを使用してインターネット上でアクセスされるサービスとしてのソフトウェア(software as a service、SaaS)を使用して提供され得る。
例解された実施例に示されるように、コンピューティングデバイス100は、中央処理ユニット(central processing unit、CPU)又はプロセッサ105及びメインメモリ110を含み得る。コンピューティングデバイス100はまた、記憶デバイス115と、リムーバブルメディアインターフェース120と、ネットワークインターフェース125と、I/Oコントローラ130と、示されるように、表示デバイス135Aと、キーボード135Bと、ポインティングデバイス135Cとを含み得る、1つ以上の入力/出力(input/output、I/O)デバイス135とを含み得る。コンピューティングデバイス100は、更に、メモリポート140、ブリッジ145、I/Oポート、1つ以上の追加の入力/出力デバイス135D、135E、135F、及びプロセッサ105と通信するキャッシュメモリ150など、追加の要素を含み得る。
プロセッサ105は、メインメモリ110からフェッチされた命令に応答し、及び処理する任意の論理回路であり得る。例えば、プロセス105は、集積回路、例えば、マイクロプロセッサ、マイクロコントローラ、若しくはグラフィック処理ユニットによって、又はフィールドプログラマブルゲートアレイ若しくは特定用途向け集積回路において実装され得る。示されるように、プロセッサ105は、二次バス又はバックサイドバスを介してキャッシュメモリ150と直接通信し得る。キャッシュメモリ150は、典型的には、メインメモリ110よりも速い応答時間を有する。メインメモリ110は、データを記憶することが可能であり、記憶されたデータが中央処理ユニット105によって直接アクセスされることを可能にする1つ以上のメモリチップであり得る。記憶デバイス115は、スケジューリングタスク及びシステムリソースへのアクセスを制御するオペレーティングシステム、及び他のソフトウェアのための記憶装置を提供し得る。特に限定されない限り、コンピューティングデバイス100は、本明細書に記載の機能性を実行することが可能なオペレーティングシステム及びソフトウェアを含み得る。
例解された実施例において示されるように、コンピューティングデバイス100は、多種多様なI/Oデバイス135を含み得、それらのうちの1つ以上は、I/Oコントローラ130を介して接続され得る。入力デバイスは、例えば、キーボード135Bと、ポインティングデバイス135C、例えば、マウス又は光学ペンを含み得る。出力デバイスは、例えば、ビデオ表示デバイスと、スピーカと、プリンタとを含み得る。I/Oデバイス135及び/又はI/Oコントローラ130は、複数の表示デバイスの使用を可能にするための好適なハードウェア及び/又はソフトウェアを含み得る。コンピューティングデバイス100はまた、ディスクドライブ、USBポート、又はコンピュータ可読メディアからデータを読み取るか、若しくはコンピュータ可読メディアにデータを書き込むための好適な任意の他のデバイスなど、1つ以上のリムーバブルメディアインターフェース120をサポートし得る。より概して、I/Oデバイス135は、本明細書に記載の機能を実行するための任意の従来のデバイスを含み得る。
コンピューティングデバイス100は、任意のワークステーション、デスクトップコンピュータ、ラップトップ若しくはノートブックコンピュータ、サーバマシン、仮想マシン、モバイル若しくはスマートフォン、ポータブル電気通信デバイス、メディア再生デバイス、ゲームシステム、モバイルコンピューティングデバイス、又は本書に記載の動作及び機能を実行することが可能である、任意の他のタイプのコンピューティング、電気通信、若しくはメディアデバイスであり得るが、これらに限定されない。コンピューティングデバイス100は、ネットワークによって接続された、又はネットワークを介して他のシステム及びリソースに接続された複数のデバイスを含む。本明細書で使用される場合、ネットワークは、1つ以上の他のコンピューティングデバイス、マシン、クライアント、クライアントノード、クライアントマシン、クライアントコンピュータ、クライアントデバイス、エンドポイント、又はエンドポイントノードと通信する、1つ以上のコンピューティングデバイス、マシン、クライアント、クライアントノード、クライアントマシン、クライアントコンピュータ、クライアントデバイス、エンドポイント、又はエンドポイントノードを含む。例えば、ネットワークは、プライベート又は公衆交換電話網(public switched telephone network、PSTN)、無線キャリアネットワーク、ローカルエリアネットワーク(local area network、LAN)、プライベート広域ネットワーク(wide area network、WAN)、インターネットなどの公衆WANなどであってもよく、適切な通信プロトコルを使用して接続が確立される。より一般的には、特に限定されない限り、コンピューティングデバイス100は、任意の従来の通信プロトコルを使用して任意のタイプのネットワークを介して他のコンピューティングデバイス100と通信し得ることを理解されたい。更に、ネットワークは、様々なネットワーク構成要素が仮想化される仮想ネットワーク環境であり得る。例えば、様々なマシンは、物理マシン上で動作するソフトウェアベースのコンピュータとして実装された仮想マシンであってもよく、又は複数の仮想マシンが同じホスト物理マシン上で動作する「ハイパーバイザ」タイプの仮想化が使用されてもよい。他のタイプの仮想化も企図される。
コンタクトセンター
ここで図2を参照すると、本発明の例示的な実施形態による、及び/又は本発明の例示的な実施形態が可能にされ得る若しくは実施され得る通信インフラストラクチャ又はコンタクトセンターシステム200が示されている。本明細書では、「コンタクトセンターシステム」という用語は、図2に示すシステム及び/又はその構成要素を指すために使用される一方、「コンタクトセンター」という用語は、より一般的に、コンタクトセンターシステム、これらのシステムを動作させる顧客サービスプロバイダ、及び/又はそれらに関連付けられた組織若しくは企業を指すために使用されることを理解されたい。したがって、特に限定されない限り、「コンタクトセンター」という用語は、概して、コンタクトセンターシステム(コンタクトセンターシステム200など)、関連する顧客サービスプロバイダ(コンタクトセンターシステム200を通して顧客サービスを提供する特定の顧客サービスプロバイダなど)、並びに顧客サービスが代理で提供されている組織又は企業を指す。
背景として、顧客サービスプロバイダは、概して、コンタクトセンターを通して多くのタイプのサービスを提供する。そのようなコンタクトセンターは、従業員若しくは顧客サービスエージェント(又は単に「エージェント」)が配置され得、エージェントは、会社、企業、政府機関、又は組織(以下、互換的に「組織」又は「企業」と称される)と、ユーザ、個人、又は顧客などの人々(以下、互換的に「個人」又は「顧客」と称される)との間のインターフェースとして機能する。例えば、コンタクトセンターのエージェントは、購入の決定、注文の受け付け、又は既に受け取った製品若しくはサービスに関する問題を解決する際に顧客を支援することができる。コンタクトセンター内では、コンタクトセンターエージェントと外部エンティティ又は顧客との間のそのようなインタラクションは、例えば、音声(例えば、電話コール又は音声オーバーIP、すなわち、VoIPコール)、ビデオ(例えば、ビデオ会議)、テキスト(例えば、電子メール及びテキストチャット)、画面共有、コブラウジングなどを介してのような、様々な通信チャネルを介して行われ得る。
運用上、コンタクトセンターは、一般に、コストを最小限に抑えながら、質の高いサービスを顧客に提供するように努力する。例えば、コンタクトセンターが動作する1つの方法が、ライブエージェントとの全顧客インタラクションを取り扱うことである。このアプローチは、サービス品質の観点から十分に成功し得る一方、エージェントの労働の高いコストに起因して、法外に高価となる可能性が高いであろう。このため、ほとんどのコンタクトセンターは、ライブエージェントの代わりに、例えば、双方向音声応答(interactive voice response、IVR)システム、双方向メディア応答(interactive media response、IMR)システム、インターネットロボット、すなわち、「ボット」、自動チャットモジュール、すなわち、「チャットボット」など、あるレベルの自動プロセスを利用する。多くの場合、これは、自動プロセスが、特定のタイプのインタラクションを取り扱うのに非常に効率的であり、ライブエージェントの必要性を低減するのに効果的であり得るため、成功戦略であることが証明されている。そのような自動化により、コンタクトセンターが、人間のエージェントの使用をより困難な顧客インタラクションに標的化することを可能にする一方で、自動プロセスは、より反復的又は日常的なタスクを取り扱う。更に、自動プロセスは、効率を最適化し、繰り返し性を促進する方法で構造化され得る。人間のエージェント、すなわち、ライブエージェントは、特定の質問に応える、若しくは特定の詳細を徹底的に追及することを忘れ得るが、そのような誤りは、典型的には、自動プロセスの使用を通して回避される。顧客サービスプロバイダは、顧客とインタラクションする自動プロセスにますます依存する一方、顧客によるそのような技術の使用は、はるかに未発達のままである。したがって、インタラクションのコンタクトセンター側では、IVRシステム、IMRシステム、及び/又はボットが使用されて、インタラクションの部分を自動化する一方、顧客側のアクションは、顧客が手動で実施するままである。
図2を具体的に参照して、コンタクトセンターシステム200は、様々なタイプのサービスを顧客に提供するために、顧客サービスプロバイダによって使用され得る。例えば、コンタクトセンターシステム200は、自動プロセス(若しくはボット)又は人間のエージェントが顧客と通信するインタラクションに携わる、及びインタラクションを管理するために使用され得る。理解されるように、コンタクトセンターシステム200は、企業を通して利用可能な製品及びサービスに関連する販売及び顧客サービスの機能を実施するためのビジネス又は企業の社内施設であり得る。別の態様では、コンタクトセンターシステム200は、別の組織に代わってサービスを提供するように契約するサードパーティサービスプロバイダによって運用され得る。更に、コンタクトセンターシステム200は、企業又はサードパーティサービスプロバイダ専用の機器上に配備され、かつ/又は、例えば、複数の企業のために複数のコンタクトセンターをサポートするためのインフラストラクチャを備えたプライベート若しくはパブリッククラウド環境などのリモートコンピューティング環境内に配備され得る。コンタクトセンターシステム200は、構内で若しくはリモートで、又はそれらの何らかの組み合わせで実行され得るソフトウェアアプリケーション若しくはプログラムを含み得る。更に、コンタクトセンターシステム200の様々な構成要素は、様々な地理的位置にわたって分散され得、必ずしも単一の場所又はコンピューティング環境に含まれるわけではないことを理解されたい。
更に、特に別様に限定されない限り、本発明のコンピューティング要素のいずれかは、クラウドベース又はクラウドコンピューティング環境内に実装され得ることを理解されたい。本明細書で使用される場合、「クラウドコンピューティング」又は単に「クラウド」は、仮想化を介して迅速にプロビジョンされ、最小限の管理努力若しくはサービスプロバイダインタラクションでリリースされ、次いで適宜スケーリングされることができる、構成可能なコンピューティングリソース(例えば、ネットワーク、サーバ、記憶装置、アプリケーション、及びサービス)の共有プールへのユビキタスで便利なオンデマンドのネットワークアクセスを可能にするためのモデルとして定義される。クラウドコンピューティングは、様々な特性(例えば、オンデマンドセルフサービス、広域ネットワークアクセス、リソースプーリング、迅速な弾力性、測定可能なサービスなど)、サービスモデル(例えば、サービスとしてのソフトウェア(「SaaS」)、サービスとしてのプラットフォーム(Platform as a Service、「PaaS」)、サービスとしてのインフラストラクチャ(Infrastructure as a Service、「IaaS」)、及び配備モデル(例えば、プライベートクラウド、コミュニティクラウド、パブリッククラウドなど)で構成され得る。「サーバレスアーキテクチャ」としばしば称されるクラウド実行モデルは、一般に、所望の機能を達成するために、リモートサーバの割り当て及びプロビジョニングを動的に管理するサービスプロバイダを含む。
図2の例解された実施例によると、コンタクトセンター200の構成要素又はモジュールは、複数の顧客デバイス205A、205B、205Cと、通信ネットワーク(又は単に「ネットワーク」)210と、スイッチ/メディアゲートウェイ212と、コールコントローラ214と、双方向メディア応答(IMR)サーバ216と、ルーティングサーバ218と、記憶デバイス220と、統計(又は「stat」)サーバ226と、ワークビン(workbin)232A、232B、232Cをそれぞれ含む複数のエージェントデバイス230A、230B、230Cと、マルチメディア/ソーシャルメディアサーバ234と、知識システム238に結合された知識管理サーバ236と、チャットサーバ240と、ウェブサーバ242と、インタラクション(又は「iXn」)サーバ244と、ユニバーサルコンタクトサーバ(又は、「universal contact server、UCS」)246と、レポーティングサーバ248と、メディアサービスサーバ249と、分析モジュール250と、を含み得る。図2に関連して、又は以下の図のいずれかに記載されるコンピュータ実装構成要素、モジュール、若しくはサーバのいずれかは、例えば、図1のコンピューティングデバイス100などのタイプのコンピューティングデバイスを介して実装され得ることを理解されたい。理解されるように、コンタクトセンターシステム200は、一般に、電話、電子メール、チャット、又は他の通信機構を介したサービスの配信を可能にするために、リソース(例えば、人材、コンピュータ、電気通信機器など)を管理する。そのようなサービスは、コンタクトセンターのタイプに応じて変化し得、例えば、顧客サービス、ヘルプデスク機能、緊急応答、テレマーケティング、受注などを含み得る。
コンタクトセンターシステム200からサービスを受けることを所望する顧客は、顧客デバイス205を介して、コンタクトセンターシステム200へのインバウンド通信(例えば、電話コール、電子メール、チャットなど)を開始し得る。図2は、3つのそのような顧客デバイス、すなわち、顧客デバイス205A、205B、及び205Cを示すが、任意の数が存在し得ることを理解されたい。顧客デバイス205は、例えば、電話、スマートフォン、コンピュータ、タブレット、又はラップトップなどの通信デバイスであり得る。本明細書に記載の機能によれば、顧客は、一般に、顧客デバイス205を使用して、電話コール、電子メール、チャット、テキストメッセージ、ウェブブラウジングセッション、及び他のマルチメディアトランザクションなど、コンタクトセンターシステム200との通信を開始、管理、及び実行し得る。
顧客デバイス205に対するインバウンド及びアウトバウンド通信は、典型的には、ネットワークの性質が使用されている顧客デバイスのタイプ及び通信の形態に依存している、ネットワーク210を横断し得る。一例として、ネットワーク210としては、電話、セルラ、及び/又はデータサービスの通信ネットワークが挙げられ得る。ネットワーク210は、プライベート若しくは公衆交換電話網(PSTN)、ローカルエリアネットワーク(LAN)、プライベートワイドエリアネットワーク(WAN)、及び/又はインターネットなどのパブリックWANであり得る。更に、ネットワーク210は、符号分割多重アクセス(code division multiple access、CDMA)ネットワーク、モバイル通信のためのグローバルシステム(global system for mobile communications、GSM)ネットワーク、又は3G、4G、LTE、5Gなどを含むが、これらに限定されない、当該技術分野で慣用の任意の無線ネットワーク/技術を含む、無線キャリアネットワークを含み得る。
スイッチ/メディアゲートウェイ212に関して、それは、顧客とコンタクトセンターシステム200との間の電話コールを受信及び伝送するために、ネットワーク210に結合され得る。スイッチ/メディアゲートウェイ212としては、センター内でのエージェントレベルルーティングのための中央スイッチとして機能するように構成された電話スイッチ又は通信スイッチが挙げられ得る。スイッチは、ハードウェアスイッチングシステムであるか、又はソフトウェアを介して実装され得る。例えば、スイッチ215は、自動コールディストリビュータ、構内交換機(private branch exchange、PBX)、IPベースのソフトウェアスイッチ、及び/若しくは顧客からインターネットソース型インタラクション並びに/又は電話網ソース型インタラクションを受信し、これらのインタラクションを、例えば、エージェントデバイス230のうちの1つにルーティングするように構成された専用ハードウェア及びソフトウェアを有する任意の他のスイッチを含み得る。したがって、一般に、スイッチ/メディアゲートウェイ212は、顧客デバイス205とエージェントデバイス230との間の接続を確立することによって、顧客とエージェントとの間の音声接続を確立する。
更に示すように、スイッチ/メディアゲートウェイ212は、例えば、コンタクトセンターシステム200のスイッチと他のルーティング、監視、及び通信処理構成要素との間のアダプタ又はインターフェースとして機能するコールコントローラ214に結合され得る。コールコントローラ214は、PSTNコール、VoIPコールなどを処理するように構成され得る。例えば、コールコントローラ214は、スイッチ/メディアゲートウェイ及び他の構成要素とインターフェースするためのコンピュータ電話統合(computer-telephone integration、CTI)ソフトウェアを含み得る。コールコントローラ214は、セッション開始プロトコル(session initiation protocol、SIP)コールを処理するためのSIPサーバを含み得る。コールコントローラ214はまた、顧客の電話番号、IPアドレス、又は電子メールアドレスなどの入来インタラクションに関するデータを抽出し、次いで、インタラクションを処理する際に、これらを他のコンタクトセンター構成要素と通信することができる。
双方向メディア応答(IMR)サーバ216に関して、それは、自己ヘルプ又は仮想アシスタント機能を可能にするように構成され得る。具体的には、IMRサーバ216は、IMRサーバ216が音声に制限されず、様々なメディアチャネルもカバーし得ることを除いて、双方向音声応答(IVR)サーバと同様であり得る。音声を説明する例では、IMRサーバ216は、顧客に顧客のニーズを問い合わせるためのIMRスクリプトで構成され得る。例えば、銀行のコンタクトセンターは、顧客が自分の預金残高を取得したい場合は「1を押す」ように、IMRスクリプトを介して顧客に伝え得る。IMRサーバ216との継続的なインタラクションを介して、顧客は、エージェントと話をする必要なしに、サービスを受けることできる。IMRサーバ216はまた、通信が、適切なリソースにルーティングされ得るように、顧客がコンタクトセンターに接触している理由を確認するように構成され得る。
ルーティングサーバ218に関して、それは、入来インタラクションをルーティングするように機能し得る。例えば、インバウンド通信が、人間のエージェントによって処理されるべきであることが決定されると、ルーティングサーバ218内の機能は、最も適切なエージェントを選択して、通信をそのエージェントにルーティングし得る。このエージェント選択は、どの利用可能なエージェントが通信を取り扱うために最適であるかに基づき得る。より具体的には、適切なエージェントの選択は、ルーティングサーバ218によって実装されるルーティング戦略又はアルゴリズムに基づき得る。これを行う際に、ルーティングサーバ218は、入来インタラクションに関連するデータ、例えば、特定の顧客、利用可能なエージェント、及びインタラクションのタイプに関連するデータを問い合わせし得、このデータは、以下でより記載されるように、特定のデータベースに記憶され得る。エージェントが選択されると、ルーティングサーバ218は、コールコントローラ214とインタラクションして、入来インタラクションを、対応するエージェントデバイス230にルーティング(すなわち、接続)し得る。この接続の一部として、顧客に関する情報が、選択されたエージェントに、それらのエージェントデバイス230を介して提供され得る。この情報は、エージェントが顧客に提供できるサービスを強化することを意図している。
データ記憶に関して、コンタクトセンターシステム200は、データをコンタクトセンターの機能に関連する1つ以上のデータベースに記憶するための、概して、記憶デバイス220によって表される、1つ以上の大容量記憶デバイスを含み得る。例えば、記憶デバイス220は、顧客データベース222に維持される顧客データを記憶し得る。そのような顧客データは、顧客プロファイル、連絡先情報、サービスレベル合意書(service level agreement、SLA)、並びにインタラクション履歴(例えば、以前のインタラクションの性質、処分データ、待ち時間、処理時間、及び顧客の問題を解決するためにコンタクトセンターによって取られたアクションを含む、特定の顧客との以前のインタラクションの詳細)を含み得る。別の実施例として、記憶デバイス220は、エージェントデータをエージェントデータベース223に記憶し得る。コンタクトセンターシステム200によって維持されるエージェントデータは、エージェント可用性及びエージェントプロファイル、スケジュール、スキル、処理時間などを含み得る。別の実施例として、記憶デバイス220は、インタラクションデータをインタラクションデータベース224に記憶し得る。インタラクションデータは、顧客とコンタクトセンターとの間の多数の過去のインタラクションに関連するデータを含み得る。より一般的には、特に指定されない限り、記憶デバイス220は、データベースを含み、かつ/又は本明細書に記載の情報のタイプのいずれかに関連するデータを記憶するように構成され得、これらのデータベース及び/又はデータは、本明細書に記載の機能を容易にする方法で、コンタクトセンターシステム200の他のモジュール又はサーバにアクセス可能であることを理解されたい。例えば、コンタクトセンターシステム200のサーバ又はモジュールは、その中に記憶されたデータを検索するか、又は記憶するためにデータをそこに伝送するために、そのようなデータベースを問い合わせし得る。記憶デバイス220は、例えば、任意の従来の記憶媒体の形態をとり得、ローカルに収容されるか、又はリモート位置から操作され得る。一例として、データベースは、Cassandraデータベース、NoSQLデータベース、又はSQLデータベースであり、Oracle、IBM DB2、Microsoft SQLサーバ、又はMicrosoft Access、PostgreSQLなどのデータベース管理システムによって管理され得る。
statサーバ226に関して、それは、コンタクトセンターシステム200の性能及び動作態様に関連するデータを記録及び集計するように構成され得る。そのような情報は、statサーバ226によってコンパイルされ、他のサーバ及びモジュール、例えば、レポーティングサーバ248に利用可能にされ得、次いで、レポーティングサーバ248は、データを使用して、コンタクトセンターの動作態様を管理し、本明細書に記載の機能に従って自動化されたアクションを実行するために使用されるレポートを作り出し得る。そのようなデータは、コンタクトセンターのリソースの状態、例えば、平均待ち時間、破棄率、エージェントの占有率、及び本明細書に記載の機能が必要とするであろうその他に関連し得る。
コンタクトセンター200のエージェントデバイス230は、本明細書に記載の機能を容易にする方法で、コンタクトセンターシステム200の様々な構成要素及びモジュールとインタラクションするように構成された通信デバイスであり得る。例えば、エージェントデバイス230は、通常の電話コール又はVoIPコールに適合された電話を含み得る。エージェントデバイス230は、コンタクトセンターシステム200のサーバと通信し、動作に関連付けられたデータ処理を実施し、本明細書に記載の機能に従って、音声、チャット、電子メール、及び他のマルチメディア通信機構を介して顧客とインターフェース接続するように構成されたコンピューティングデバイスを更に含み得る。図2は、3つのそのようなエージェントデバイス、すなわち、エージェントデバイス230A、230B、及び230Cを示すが、任意の数が存在し得ることを理解されたい。
マルチメディア/ソーシャルメディアサーバ234に関して、それは、顧客デバイス205及び/又はサーバ242との(音声以外の)メディアインタラクションを容易にするように構成され得る。そのようなメディアインタラクションは、例えば、電子メール、音声メール、チャット、ビデオ、テキストメッセージング、ウェブ、ソーシャルメディア、コブラウジングなどに関連し得る。マルチメディア/ソーシャルメディアサーバ234は、マルチメディアイベント及び通信を受信、処理、及び転送するための専用ハードウェア及びソフトウェアを有する、当該技術分野で慣用の任意のIPルータの形態をとり得る。
知識管理サーバ234に関して、それは、顧客と知識システム238との間のインタラクションを容易にするように構成され得る。概して、知識システム238は、質問又はクエリを受信し、それに応じて回答を提供することができるコンピュータシステムであり得る。知識システム238は、コンタクトセンターシステム200の一部として含まれるか、又はサードパーティによってリモートで操作され得る。知識システム238は、当該技術分野で既知のように、参考資料として知識システム238に提出された百科事典、辞書、ニュースワイヤ記事、文学作品、又は他の文書など情報源から情報を取得することによって、自然言語で提示された質問に回答することができる人工知能コンピュータシステムを含み得る。実施例として、知識システム238は、IBM Watson又は同様のシステムとして具現化され得る。
チャットサーバ240に関して、それは、顧客との電子チャット通信を実施し、調整し(orchestrate)、及び管理するように構成され得る。一般に、チャットサーバ240は、チャット会話を実装及び維持し、チャットトランスクリプトを生成するように構成されている。そのようなチャット通信は、顧客が、自動化されたチャットボット、人間のエージェント、又はその両方と通信するような方法で、チャットサーバ240によって行われ得る。例示的な実施形態では、チャットサーバ240は、チャットボット及び利用可能な人間のエージェントの間にチャット会話をディスパッチするチャットオーケストレーションサーバとして機能し得る。そのような場合、チャットサーバ240の処理ロジックは、利用可能なチャットリソース間でインテリジェントなワークロード分配を活用するために、そのように駆動されるルールであり得る。チャットサーバ240は更に、顧客デバイス205又はエージェントデバイス230のいずれかで生成されるそれらのユーザインターフェース(UIとも称する)を含む、チャット機能に関連するUIを実装し、管理し、及び促進し得る。チャットサーバ240は、特定の顧客との単一のチャットセッション内で、例えば、チャットセッションが、チャットボットから人間のエージェントに、又は人間のエージェントからチャットボットに転送するように、チャットを自動ソースと人間ソースとの間で転送するように構成され得る。チャットサーバ240はまた、例えば、関連する記事へのリンクが提供され得るように、チャット中に顧客によって提示された問い合わせに対する提案及び回答を受信するために、知識管理サーバ234及び知識システム238に結合され得る。
ウェブサーバ242に関して、そのようなサーバは、Facebook、Twitter、Instagramなど、顧客が予約購読する(subscribe)様々なソーシャルインタラクションサイトのサイトホストを提供するために含まれ得る。コンタクトセンターシステム200の一部として示されているが、ウェブサーバ242は、サード-パーティによって提供され得、及び/又はリモートで維持され得ることを理解されたい。ウェブサーバ242はまた、コンタクトセンターシステム200によってサポートされている企業又は組織のウェブページを提供し得る。例えば、顧客は、ウェブページを閲覧して、特定の企業の製品及びサービスに関する情報を受信し得る。そのような企業のウェブページ内で、例えば、ウェブチャット、音声、又は電子メールを介して、コンタクトセンターシステム200とのインタラクションを開始するための機構が提供され得る。そのような機構の一例が、ウェブサーバ242上にホストされるウェブページ又はウェブサイト上に展開され得るウィジェットである。本明細書で使用される場合、ウィジェットは、特定の機能を実施するユーザインターフェース構成要素を指す。いくつかの実装例では、ウィジェットは、インターネットを介して顧客に表示されたウェブページ上にオーバーレイされ得るグラフィカルユーザインターフェースコントロールを含み得る。ウィジェットは、ウィンドウ又はテキストボックスなどに情報を示すか、又はファイルを共有若しくは開くこと、又は通信を開始することなど、特定の機能にユーザがアクセスすることを可能にするボタン又は他のコントロールを含み得る。いくつかの実装例では、ウィジェットは、コンパイルなしで別個のウェブページ内にインストールされ、かつ実行され得るコードの可搬部分を有するユーザインターフェース構成要素を含む。いくつかのウィジェットは、対応する又は追加のユーザインターフェースを含み得、様々なローカルリソース(例えば、顧客デバイス上のカレンダー若しくはコンタクト情報)又はネットワークを介してリモートリソース(例えば、インスタントメッセージング、電子メール、又はソーシャルネットワーキングアップデート)にアクセスするように構成され得る。
インタラクション(iXn)サーバ244に関して、それは、コンタクトセンターの延期可能なアクティビティ、及び完了のための、そのアクティビティの人間のエージェントへのルーティングを管理するように構成され得る。本明細書で使用される場合、延期可能なアクティビティとは、オフラインで実行されることができるバックオフィスワーク、例えば、電子メールに対応すること、訓練に参加すること、及び顧客とのリアルタイム通信を伴わない他のアクティビティを含む。実施例として、インタラクション(iXn)サーバ244は、延期可能なアクティビティの各々を処理するのに適したエージェントを選択するために、ルーティングサーバ218とインタラクションするように構成され得る。特定のエージェントに割り当てられると、延期可能なアクティビティは、それが選択されたエージェントのエージェントデバイス230上に表示されるように、そのエージェントにプッシュされる。延期可能なアクティビティは、選択されたエージェントが完了させるタスクとして、ワークビン232に表示され得る。ワークビン232の機能は、例えば、リンクリスト、アレイなどのような任意の従来のデータ構造を介して実装され得る。エージェントデバイス230の各々は、エージェントデバイス230A、230B、及び230Cにそれぞれ維持されているワークビン232A、232B、及び232Cを伴うワークビン232を含み得る。実施例として、ワークビン232は、対応するエージェントデバイス230のバッファメモリに維持され得る。
ユニバーサルコンタクトサーバ(universal contact server、UCS)246に関して、それは、顧客データベース222に記憶された情報を検索し、及び/又はそこに記憶するために情報をそこに伝送するように構成され得る。例えば、UCS246は、特定の顧客とのチャットがどのように処理されたかに関する履歴を維持することを容易にするために、チャット機能の一部として利用され得、次いで、この履歴は、将来のチャット通信をどのように処理すべきかに関する参照として使用され得る。より一般的には、UCS246は、好ましいメディアチャネル及びコンタクトする最良の時間などの顧客選好の履歴を維持することを容易にするように構成され得る。これを行うために、UCS246は、例えば、エージェントからのコメント、顧客通信履歴などに関するデータなど、各顧客のインタラクション履歴に関連するデータを識別するように構成され得る。これらのデータタイプの各々は、次に、顧客データベース222又は他のモジュールに記憶されて、本明細書に記載の機能が必要とするときに、検索され得る。
レポーティングサーバ248に関して、それは、統計サーバ226又は他のソースによってコンパイル及び集計されたデータからレポートを生成するように構成され得る。そのようなレポートは、準リアルタイムレポート又は履歴レポートを含み、例えば、平均待ち時間、破棄率、エージェントの占有率など、コンタクトセンターリソース及び性能特性の状態に関係し得る。レポートは、自動的に、又は要求元(例えば、エージェント、管理者、コンタクトセンターアプリケーションなど)からの特定の要求に応じて生成され得る。次いで、レポートは、本明細書に記載の機能に従って、コンタクトセンターの動作を管理するために使用され得る。
メディアサービスサーバ249に関して、それは、コンタクトセンター機能をサポートするために、オーディオ及び/又はビデオサービスを提供するように構成され得る。本明細書に記載の機能によると、そのような機能は、IVR若しくはIMRシステムのプロンプト(例えば、オーディオファイルの再生)、保留音、音声メール/単一パーティの記録、マルチパーティの記録(例えば、オーディオ及び/又はビデオコールの)、音声認識、デュアルトーンマルチ周波数(dual tone multi frequency、DTMF)認識、ファックス、オーディオ及びビデオトランスコーディング、セキュアなリアルタイム転送プロトコル(secure real-time transport protocol、SRTP)、電話会議、ビデオ会議、コーチング(例えば、コーチが顧客とエージェントとの間のインタラクションを立ち聞きするための、及び顧客がコメントを聞くことなしに、コーチがエージェントにコメントを提供するためのサポート)、コール分析、キーワードスポッティングなどを含み得る。
分析モジュール250に関して、それは、本明細書に記載の機能が必要とし得る場合に、複数の異なるデータソースから受信されたデータに対して分析を実行するためのシステム及び方法を提供するように構成され得る。例示的な実施形態によれば、分析モジュール250はまた、例えば、顧客データ、エージェントデータ、及びインタラクションデータなどの収集されたデータに基づいて、予測器又はモデル252を生成、更新、訓練、及び修正し得る。モデル252は、顧客又はエージェントの行動モデルを含み得る。行動モデルは、様々な状況で、例えば、顧客又はエージェントの行動を予測するために使用され得、それにより、本発明の実施形態が、そのような予測に基づいてインタラクションを調整するか、又は将来のインタラクションの予測される特性に備えてリソースを割り当てることを可能にし、それにより、全体的なコンタクトセンター性能及び顧客体験を改善する。分析モジュール250は、コンタクトセンターの一部であると示されているが、そのような行動モデルはまた、顧客システム(又は本明細書でも使用されているように、インタラクションの「顧客側」)に実装されて、顧客の利益のために使用され得ることが理解されよう。
例示的な実施形態によれば、分析モジュール250は、顧客データベース222及びエージェントデータベース223を含む記憶デバイス220に記憶されたデータへのアクセスを有し得る。分析モジュール250はまた、インタラクション及びインタラクション内容(例えば、その中に検出されたインタラクション及びイベントのトランスクリプト)、インタラクションメタデータ(例えば、顧客識別子、エージェント識別子、インタラクションの媒体、インタラクションの長さ、インタラクション開始及び終了時間、部門、タグ付きカテゴリ)、及びアプリケーション設定(例えば、コンタクトセンターを通るインタラクション経路)に関連するデータを記憶するインタラクションデータベース224へのアクセスを有し得る。更に、以下でより論じられるように、分析モジュール250は、例えば、機械学習技法を適用することによって、アルゴリズム及びモデル252を開発及び訓練する際に使用するために、記憶デバイス220内に記憶されたデータを検索するように構成され得る。
含まれるモデル252のうちの1つ以上は、顧客若しくはエージェントの挙動、及び/又はコンタクトセンターの動作及び性能に関連する態様を予測するように構成され得る。更に、モデル252のうちの1つ以上は、自然言語処理に使用されて、例えば、意図認識などを含み得る。モデル252は、1)システムを記述する既知の第1原理方程式、2)経験的モデルをもたらすデータ、又は3)既知の第1原理方程式及びデータの組み合わせに基づいて開発され得る。本実施形態で使用するためのモデルを開発する際に、第1原理方程式は、多くの場合利用可能でないか又は容易に導出されないため、収集及び記憶されたデータに基づいて経験的モデルを構築することが一般的に好ましくあり得る。複雑系の操作変数/外乱変数と制御変数との間の関係を適切に捕捉するために、モデル252が非線形であることが好ましいことがあり得る。これは、非線形モデルが、本明細書で論じられるものなどの複雑系に一般的である、操作変数/外乱変数と制御変数との間の直線関係ではなく、曲線関係を示す可能性があるためである。前述の要件を考慮すると、機械学習又はニューラルネットワークベースのアプローチは、現在、モデル252を実装するための好ましい実施形態である。例えば、ニューラルネットワークは、高度な回帰アルゴリズムを使用して、経験的データに基づいて開発され得る。
分析モジュール250は、オプティマイザ254を更に含み得る。理解されるように、オプティマイザを使用して、制約のセットが適用される「コスト関数」対象を最小化することができ、コスト関数は、所望の目的又はシステム動作の数学的表現である。モデル252は非線形であり得るため、オプティマイザ254は、非線形プログラミングオプティマイザであり得る。しかしながら、本発明は、以下に限定されないが、線形プログラミング、二次プログラミング、混合整数非線形プログラミング、確率的プログラミング、グローバル非線形プログラミング、遺伝的アルゴリズム、粒子/スワーム技法などを含む様々な異なるタイプの最適化アプローチを個別に又は組み合わせて使用することによって実装され得ることが企図される。
いくつかの例示的な実施形態によれば、モデル252及びオプティマイザ254は、最適化システム255内で一緒に使用され得る。例えば、分析モジュール250は、最適化システム255を、コンタクトセンターの性能及び動作の態様が最適化されるか、又は少なくとも強化される最適化プロセスの一部として利用し得る。これは、例えば、顧客体験、エージェント体験、インタラクションルーティング、自然言語処理、意図認識、又は自動プロセスに関連する他の機能に関連する態様を含み得る。
図2(並びに本明細書に含まれる他の図)の様々な構成要素、モジュール、及び/又はサーバは各々、コンピュータプログラム命令を実行し、かつ本明細書に説明される様々な機能を実施するために、他のシステム構成要素と相互作用する1つ以上のプロセッサを含み得る。そのようなコンピュータプログラム命令は、例えば、ランダムアクセスメモリ(random-access memory、RAM)などの標準のメモリデバイスを使用して実装されるメモリ内に記憶されるか、又は例えば、CD-ROM、フラッシュドライブなどの他の非一時的コンピュータ可読媒体に記憶され得る。サーバの各々の機能は、特定のサーバによって提供されるものとして記載されているが、当業者は、様々なサーバの機能が、組み合わされるか若しくは単一のサーバに統合され得るか、又は特定のサーバの機能が、本発明の範囲から逸脱することなく、1つ以上の他のサーバにわたって分散され得ることを理解するべきである。更に、「インタラクション」及び「通信」という用語は、互換的に使用され、概して、電話コール(PSTN若しくはVoIPコール)、電子メール、Vメール、ビデオ、チャット、画面共有、テキストメッセージ、ソーシャルメディアメッセージ、WebRTCコールなどを含むが、これらに限定されない、任意の通信チャネルを使用する任意のリアルタイム及び非リアルタイムのインタラクションを指す。コンタクトシステム200の構成要素へのアクセス及びコンタクトシステム200の構成要素の制御は、顧客デバイス205及び/又はエージェントデバイス230上に生成され得るユーザインターフェース(user interface、UI)を通して影響を受けることがある。既に述べたように、コンタクトセンターシステム200は、クラウドベースの環境又はクラウドコンピューティング環境などで一部又は全ての構成要素がリモートでホストされるハイブリッドシステムとして運用され得る。
チャットシステム
図3、図4及び図5を参照すると、チャットシステム及びチャットボットの様々な態様が示されている。理解されるように、本実施形態は、概して、異なる当事者間のテキストメッセージの交換を可能にする、そのようなチャット機能を含むか、又はそのようなチャット機能によって可能にされ得る。これらの当事者は、顧客及びエージェントなどの生きている人、並びにボット又はチャットボットなどの自動化されたプロセスを含み得る。
背景として、ボット(「インターネットボット」としても知られている)は、インターネット上で自動化されたタスク又はスクリプトを実行するソフトウェアアプリケーションである。典型的には、ボットは、単純かつ構造的に反復的なタスクを、人にとって可能であるよりもはるかに高いレートで実行する。チャットボットは、特定のタイプのボットであり、本明細書で使用される場合、聴覚方法又はテキスト方法を介して会話を行うソフトウェア及び/又はハードウェアの一部として定義される。理解されるように、チャットボットは、人間が会話相手としてどのように振舞うかを説得力のある方法でシミュレートするように設計されている。チャットボットは、典型的には、顧客サービス又は情報取得など様々な実用的な目的のためにダイアログシステムで使用される。いくつかのチャットボットは、洗練された自然言語処理システムを使用するが、より単純なチャットボットは、入力内のキーワードをスキャンし、次いで、一致するキーワード又は言い回しパターンに基づいてデータベースから応答を選択する。
本発明の説明を更に続ける前に、いずれかの前の図において説明済みの参照システム構成要素、例えば、モジュール、サーバ、及び他の構成要素に関して注記する。今後言及する場合に、前の図において使用された対応する数値識別子が含まれるかどうかにかかわらず、言及は、前の図において説明された例を包含するものであり、特に具体的に限定されない限り、当業者によって理解されるように、所望の機能を満たすことができるそれらの実施例又は他の従来技術のいずれかに従って実装され得ることを理解されたい。したがって、例えば、今後の「コンタクトセンターシステム」への言及は、図2の例示的な「コンタクトセンターシステム200」及び/又はコンタクトセンターシステムを実装するための他の従来技術を指すものとして理解されるべきである。追加の例として、以下での「顧客デバイス」、「エージェントデバイス」、「チャットサーバ」、又は「コンピューティングデバイス」に対する今後の言及は、それぞれ図1~図2の例示的な「顧客デバイス205」、「エージェントデバイス230」、「チャットサーバ240」、又は「コンピューティングデバイス200」、並びに同じ機能を満たすための従来技術を指すものとして理解されるべきである。
次に、チャット機能及びチャットボットについて、図3、図4、及び図5にそれぞれ示すチャットサーバ、チャットボット、及びチャットインターフェースの例示的な実施形態を参照しながら、より具体的に説明する。これらの例は、コンタクトセンター側で実装されるチャットシステムに関して提供されるが、そのようなチャットシステムは、インタラクションの顧客側で使用されてもよい。したがって、図3、図4、及び図5の例示的なチャットシステムは、顧客のためにコンタクトセンターのエージェント及びチャットボットとインタラクションするように構成された顧客側チャットボットの使用を含む、類似の顧客側実装のために修正され得ることを理解されたい。チャット機能は、テキスト-スピーチ変換及び/又はスピーチ-テキスト変換を介して音声通信によって利用され得ることを更に理解されたい。
ここで特に図3を参照すると、チャットシステム及び機能を実装するために使用され得るチャットサーバ240のより詳細なブロック図が提供されている。チャットサーバ240は、顧客がデータ通信ネットワーク210を介して顧客によって操作される顧客デバイス205に結合され得る(すなわち、電子通信し得る)。チャットサーバ240は、例えば、自動化されたチャット及び人間のエージェントとのチャットの両方を含む、顧客とのチャット会話を実装及び編成するためのコンタクトセンターの一部として、企業によって操作され得る。自動化されたチャットに関して、チャットサーバ240は、チャット会話に携わるためにコンピュータプログラム命令を用いて構成されている、チャット自動化モジュール又はチャットボット260A~260C(260と総称する)をホストし得る。したがって、チャットサーバ240は、概して、顧客デバイス205とエージェントデバイス230又はチャットボット260との間でのテキストベースの通信又はチャット通信の交換を含む、チャット機能を実装する。以下でより詳細に論じるように、チャットサーバ240は、チャット機能を容易にする、顧客デバイス205及びエージェントデバイス230のそれぞれにおいて特定のUIを生成するための顧客インターフェースモジュール265と、エージェントインターフェースモジュール266と、を含み得る。
チャットボット260に関して、各々は、要求に従って起動される実行可能プログラムとして動作することができる。例えば、チャットサーバ240は、双方向音声応答(IVR)機能のために、VoiceXMLファイルをメディアサーバにロードすることに類似して、チャットボット260の実行エンジンとして動作し得る。ロード及びアンロードは、双方向音声応答の文脈でVoiceXMLスクリプトが制御され得る方法に類似して、チャットサーバ240によって制御され得る。チャットサーバ240は、IVRの文脈で顧客データキャプチャと同様に、統一された方法で顧客データを取得し、収集する手段を更に提供し得る。そのようなデータは、同じチャットボット、異なるチャットボット、エージェントチャット、又は更には異なるメディアタイプであるかどうかにかかわらず、記憶され、共有され、後続の会話において利用され得る。例示的な実施形態では、チャットサーバ240は、あるチャットボットから別のチャットボットに、又はあるチャットボットから人間のエージェントにインタラクションが転送又は移行されるときに、様々なチャットボット260間でのデータの共有を調整するように構成されている。特定のチャットボットとのインタラクション中に取得されたデータは、第2のチャットボット又は人間のエージェントの呼び出し要求と共に転送され得る。
例示的な実施形態では、チャットボット260の数は、チャットサーバ240の設計及び機能に応じて変化し得、図3に図示される数に限定されない。更に、異なるチャットボットが異なるプロファイルを有するように作成されてもよく、そのプロファイルは、特定のチャット又は特定の顧客の主題に一致するように選択され得る。例えば、特定のチャットボットのプロファイルは、特定の顧客の好みに向けられた特定の主題又は通信スタイルに関して顧客を支援するための専門知識を含むことができる。より具体的には、あるチャットボットは、第1の通信トピック(例えば、ビジネスでの新しいアカウントの開設)に携わるように設計され得、別のチャットボットは、第2の通信トピック(例えば、ビジネスによって提供される製品又はサービスに関する技術的サポート)に携わるように設計され得る。あるいは、チャットボットは、様々な方言若しくは俗語を用いるように構成されるか、又は様々な個性若しくは特性を有し得る。特定タイプの顧客に応えるプロファイルを有するチャットボットが関与することにより、より効果的な通信及び結果が可能になり得る。チャットボットプロファイルは、人口統計情報、インタラクション履歴、又はソーシャルメディア上で利用可能なデータなど、他の当事者について知られている情報に基づいて選択され得る。チャットサーバ240は、より専門的なチャットボットを呼び出すためには顧客に関する情報が不十分である場合に呼び出されるデフォルトのチャットボットをホストし得る。任意選択的に、異なるチャットボットは、顧客選択可能であってもよい。例示的な実施形態では、チャットボット260のプロファイルは、記憶デバイス220内でホストされるプロファイルデータベースに記憶され得る。そのようなプロファイルとしては、チャットボットの個性、人口統計、専門知識の領域などが挙げられ得る。
顧客インターフェースモジュール265及びエージェントインターフェースモジュール266は、顧客とチャットボット260又は人間のエージェントとの間のチャット通信を容易にするユーザインターフェース(UI)を、顧客デバイス205上に表示するために生成するように構成され得る。同様に、エージェントインターフェースモジュール266は、エージェントデバイス230を動作させるエージェントと顧客との間のチャット通信を容易にする特定のUIをエージェントデバイス230上に生成することができる。エージェントインターフェースモジュール266はまた、エージェントがチャットボット260と顧客との間で進行中のチャットの状況を監視することを可能にするUIをエージェントデバイス230上で生成することができる。例えば、顧客インターフェースモジュール265は、チャットセッション中に、顧客デバイス205上で特定のUIを生成するように構成された信号を顧客デバイス205に伝送することができ、これは、チャットボット260又は人間のエージェントから送信されているテキストメッセージの表示、並びに顔文字又はアニメーションなどのテキストメッセージに付随するように意図された他の非テキストグラフィックスを含み得る。同様に、エージェントインターフェースモジュール266は、チャットセッション中に、エージェントデバイス230上でUIを生成するように構成されているエージェントデバイス230に信号を伝送することができる。そのようなUIは、顧客への送信テキストメッセージに付随する非テキストグラフィックスのエージェント選択を容易にするインターフェースを含むことができる。
例示的な実施形態では、チャットサーバ240は、メディア層、メディア制御層、及び(IVRメディアサーバ上でのVoiceXMLの実行と同様に)IMRサーバ216によって実行されるチャットボットを用いて、層状アーキテクチャで実装され得る。上述したように、チャットサーバ240は、知識管理サーバ234とインタラクションして、知識情報についてサーバに問い合わせるように構成され得る。例えば、クエリは、チャット中に顧客から受信した質問に基づき得る。次いで、知識管理サーバ234から受信した応答は、チャット応答の一部として顧客に提供され得る。
ここで特に図4を参照すると、例示的なチャット自動化モジュール又はチャットボット260のブロック図が提供されている。図示のように、チャットボット260は、テキスト分析モジュール270、ダイアログマネージャ272、及び出力ジェネレータ274を含む、いくつかのモジュールを含むことができる。チャットボットの動作性のより詳細な説明において、例えば、意図認識に関連するモジュール、テキスト-スピーチ変換又はスピーチ-テキスト変換モジュール、並びにエージェント又は顧客プロファイルに記憶された情報に従うスクリプト記憶、検索、及びデータフィールド処理に関連するモジュールを含む、他のサブシステム又はモジュールが説明され得ることが理解されるであろう。しかしながら、そのようなトピックは、本開示の他の領域において(例えば、図6及び図7に関連して)より完全に網羅されており、したがって、ここでは繰り返さない。それにもかかわらず、これらの領域で行われる開示は、本明細書で説明される機能に従ってチャットボットの動作性に対して類似の方法で使用され得ることを理解されたい。
テキスト分析モジュール270は、自然言語を分析し、理解するように構成され得る。これに関して、テキスト分析モジュールは、言語の辞書、構文パーサー、意味的パーサー、及び顧客デバイス205によって提供されたフレーズを構文的及び意味的内部表現に分割するための文法規則を用いて構成され得る。テキスト分析モジュールの構成は、チャットボットに関連する特定のプロファイルに依存する。例えば、特定のワードは、あるチャットボットの辞書には含まれるが、別のチャットボットの辞書からは除外され得る。
ダイアログマネージャ272は、テキスト分析モジュール270から構文的表現及び意味的表現を受信し、決定規則セットに基づいて会話の大まかな流れを管理する。この点に関して、ダイアログマネージャ272は、会話の履歴及び状態を維持し、それらに基づいて、アウトバウンド通信を生成する。通信は、ダイアログマネージャ272によって選択された特定の会話経路のスクリプトに従い得る。以下で更に詳細に説明するように、会話経路は、会話の特定の目的又はトピックの理解に基づいて選択され得る。会話経路のスクリプトは、例えば、アーティフィシャルインテリジェンスマークアップランゲージ(Artificial Intelligence Markup Language、AIML)、SCXMLなど、当該技術分野において従来の様々な言語及びフレームワークのいずれかを使用して生成され得る。
チャット会話中、ダイアログマネージャ272は、会話フロー/スクリプトの特定の時点で適切とみなされる応答を選択し、出力ジェネレータ274に応答を出力する。例示的な実施形態では、ダイアログマネージャ272はまた、選択された応答の信頼度をコンピュータ処理し、信頼度をエージェントデバイス230に提供するように構成され得る。チャット通信における全てのセグメント、ステップ、又は入力は、考えられる応答の対応するリストを有し得る。応答は、トピック(好適なテキスト分析及びトピック検出スキームを使用して決定される)に基づいて分類され、提案される次のアクションが割り当てられ得る。アクションとしては、例えば、回答を伴う応答、追加の質問、支援する人間のエージェントへの転送などが挙げられ得る。信頼度は、検出、分析、及び顧客入力に対する応答が適切かどうか、又は人間のエージェントが関与するべきかどうかをシステムが決定することを支援するために利用され得る。例えば、閾値信頼度は、1つ以上のビジネスルールに基づいて、人間のエージェントを介入させるために割り当てられ得る。例示的な実施形態では、信頼度は、顧客フィードバックに基づいて決定され得る。説明されるように、ダイアログマネージャ272によって選択された応答は、知識管理サーバ234によって提供される情報を含み得る。
例示的な実施形態では、出力ジェネレータ274は、ダイアログマネージャ272によって提供される応答の意味的表現を取得し、チャットボットのプロファイル又は個性に当該応答をマッピングし(例えば、チャットボットの方言、語彙、又は個性に従って応答の言語を調整することによる)、顧客デバイス205に表示される出力テキストを出力する。出力テキストは、チャットボットと対話している顧客が、人間のエージェントではなく、自動プロセスと対話していることを認識しないように、意図的に提示され得る。理解されるように、他の実施形態によると、出力テキストは、顧客のユーザインターフェースに組み込まれた、顔文字又はアニメーションなど視覚表現とリンクされ得る。
ここで図5を参照すると、チャット機能282の例示的な実装を有するウェブページ280が提示されている。ウェブページ280は、例えば、企業ウェブサイトに関連しており、ウェブページを訪問している将来の顧客及び現在の顧客と、企業に関連するコンタクトセンターとの間のインタラクションを開始することが意図され得る。理解されるように、チャット機能282は、ラップトップ、タブレットデバイス、又はスマートフォンなどのパーソナルコンピューティングデバイスを含む、任意のタイプの顧客デバイス205上で生成され得る。更に、チャット機能282は、ウェブページ内のウィンドウとして生成されてもよく、又は全画面インターフェースとして実装されてもよい。図示の例のように、チャット機能282は、ウェブページ280の定められた部分に含まれ得、例えば、上記のシステム及び構成要素、並びに/又は任意の他の従来の手段を介して、ウィジェットとして実装され得る。一般に、チャット機能282は、顧客がコンタクトセンターに配信するテキストメッセージを入力するための例示的な方法を含むことができる。
一例として、ウェブページ280は、チャットボット又はライブエージェントとチャットするための通信チャネルを提供する顧客デバイスなどの顧客デバイスを介して顧客によってアクセスされ得る。例示的な実施形態では、示されるように、チャット機能282は、顧客デバイスのディスプレイ上に、本明細書では顧客チャットインターフェース284と称されるユーザインターフェースを生成することを含む。顧客チャットインターフェース284は、例えば、既に説明したチャットサーバなど、チャットサーバの顧客インターフェースモジュールによって生成され得る。説明されるように、顧客インターフェースモジュール265は、例えば、この例では、「Kate」という名前のチャットボット又はエージェントである、チャットソースによって発信されたチャットメッセージの内容に従って、所望の顧客チャットインターフェース284を生成するように構成されている顧客デバイス205に信号を送信し得る。顧客チャットインターフェース284は、指定領域又はウィンドウ内に含まれ得、当該ウィンドウは、ウェブページ280の指定部分を占める。顧客チャットインターフェース284はまた、テキスト表示領域286を含むことができ、テキスト表示領域286は、受信及び送信されたテキストメッセージの時系列表示に専用の領域である。顧客チャットインターフェース284は、顧客が彼らの次のメッセージのテキストを入力する指定領域であるテキスト入力領域288を更に含む。理解されるように、他の構成も可能である。
顧客自動化システム
本発明の実施形態は、顧客サービスプロバイダ又はコンタクトセンターとのインタラクションの様々な段階の間の顧客アクションを自動化及び拡張するためのシステム及び方法を含む。理解されるように、インタラクションのそれらの様々な段階は、コンタクト前段階、コンタクト中段階、及びコンタクト後段階(又は、それぞれ、インタラクション前段階、インタラクション中段階、及びインタラクション後段階)として分類され得る。ここで図6を特に参照すると、本発明の実施形態と共に使用され得る例示的な顧客自動化システム300が示されている。顧客自動化システム300がどのように機能するかをより良く説明するために、例えば、顧客がコンタクトセンターとインタラクションするときに、顧客アクションを自動化するための例示的な方法のフローチャート350を提供する図7も参照する。顧客自動化に関する更なる情報は、2018年10月4日に出願された「System and Method for Customer Experience Automation」と題する米国出願第16/151,362号に提供されており、その内容は参照により本明細書に組み込まれる。
図6の顧客自動化システム300は、本明細書で使用される場合、顧客サービスプロバイダ又はコンタクトセンターとのインタラクションにおいて顧客のために取られるアクションの自動化を指す、顧客側自動化のために一般的に使用され得るシステムを表す。そのようなインタラクションは、「顧客-コンタクトセンターインタラクション」又は単に「顧客インタラクション」と称されることもある。更に、そのような顧客-コンタクトセンターインタラクションを論じる際に、「コンタクトセンター」又は「顧客サービスプロバイダ」への言及は、一般に、ユーザ又は顧客がそれらとのビジネス、取引、業務、又は他の利害関係を有する組織又は企業(例えば、ビジネス、政府機関、非営利団体、学校など)に関連付けられた任意の顧客サービス部門又は他のサービスプロバイダを指すことが意図されていることを理解されたい。
例示的な実施形態では、顧客自動化システム300は、モバイルデバイス若しくは他のコンピューティングデバイス、クラウドコンピューティングデバイス(例えば、ネットワークを介して顧客デバイス205に接続されたコンピュータサーバ)、又はそれらの組み合わせ上で実行されるソフトウェアプログラム若しくはアプリケーションとして実装され得る(例えば、システムのいくつかのモジュールがローカルアプリケーションに実装され、他のモジュールがクラウドに実装される。便宜上、実施形態は主に、顧客デバイス205上で実行されるアプリケーションを介した実装の文脈で説明される。しかしながら、本実施形態はそれに限定されないことを理解されたい。
顧客自動化システム300は、いくつかの構成要素又はモジュールを含んでもよい。図6の図示された例では、顧客自動化システム300は、ユーザインターフェース305、自然言語処理(natural language processing、NLP)モジュール310、意図推論モジュール315、スクリプト記憶モジュール320、スクリプト処理モジュール325、顧客プロファイルデータベース又はモジュール(又は単に「顧客プロファイル」)330、通信マネージャモジュール335、テキスト-スピーチ変換モジュール340、スピーチ-テキスト変換モジュール342、及びアプリケーションプログラミングインターフェース(API)345を含み、これらの各々は、図7のフローチャート350も参照しながらより詳細に説明される。顧客自動化システム300の構成要素及びそれに関連付けられた機能のいくつかは、図3、図4、及び図5に関連して上述したチャットボットシステムと重複し得ることが理解されよう。顧客自動化システム300及びそのようなチャットボットシステムが、顧客側実装の一部として一緒に採用される場合、そのような重複は、2つのシステム間のリソースの共有を含み得る。
動作の一例では、ここで図7のフローチャート350を特に参照すると、顧客自動化システム300は、最初のステップ又は動作355において入力を受信することができる。そのような入力は、いくつかのソースから来てもよい。例えば、入力の主要なソースは顧客であってもよく、そのような入力は顧客デバイスを介して受信される。入力はまた、他の当事者、特に、顧客デバイスを通して顧客と対話する当事者から受信されたデータを含んでもよい。例えば、コンタクトセンターから顧客に送信される情報又は通信は、入力の態様を提供することができる。いずれの場合も、入力は、自由スピーチ又はテキスト(例えば、構造化されていない自然言語入力)の形態で提供され得る。入力はまた、顧客デバイス上で受信又は記憶される他の形態のデータを含んでもよい。
フロー図350を続けると、動作360において、顧客自動化システム300は、NLPモジュール310を使用して入力の自然言語をパースし、そこから、意図推論モジュール315を使用して意図を推論する。例えば、入力が顧客からのスピーチとして提供される場合、スピーチは、NLPモジュール310による構文解析の一部としてスピーチ-テキスト変換システム(大規模語彙連続音声認識すなわちLVCSRシステムなど)によってテキストに書き換えられてもよい。書き換えは、顧客デバイス205上でローカルに実行されてもよく、又はスピーチは、クラウドベースのサーバによるテキストへの変換のためにネットワークを介して送信されてもよい。特定の実施形態では、例えば、意図推論モジュール315は、人工知能又は機械学習技法を使用して、提供された入力のテキストから顧客の意図を自動的に推論することができる。そのような人工知能技法は、例えば、顧客入力から1つ以上のキーワードを識別することと、所与のキーワードに対応する潜在的な意図のデータベースを検索することと、を含み得る。潜在的な意図及び意図に対応するキーワードのデータベースは、履歴インタラクション記録の集合から自動的にマイニングされ得る。顧客自動化システム300が入力から意図を理解できない場合、いくつかの意図の選択が、ユーザインターフェース305において顧客に提供されてもよい。次いで、顧客は、代替のうちの1つを選択することによって彼らの意図を明確にし得るか、又は他の代替が提供されることを要求し得る。
顧客の意図が決定された後、フローチャート350は動作365に進み、顧客自動化システム300は、所与の意図に関連付けられたスクリプトをロードする。そのようなスクリプトは、例えば、スクリプト記憶モジュール320に記憶され、そこから取り出されてもよい。そのようなスクリプトは、コマンド若しくは動作のセット、予め書かれたスピーチ若しくはテキスト、及び/又はパラメータ若しくはデータのフィールド(「データフィールド」とも呼ばれる)を含むことができ、これらは、顧客のためにアクションを自動化することを要求されるデータを表す。例えば、スクリプトは、顧客の意図によって指定された問題を解決するために必要とされるコマンド、テキスト、及びデータフィールドを含むことができる。スクリプトは、特定のコンタクトセンターに固有であり、特定の問題を解決するように調整されてもよい。スクリプトは、いくつかの方法で編成することができ、例えば、特定の組織に関係する全てのスクリプトが、共通の特徴を定義する共通の「親」スクリプトから導出される場合など、階層的に編成することができる。スクリプトは、以前の顧客インタラクションからのデータ、アクション、及びダイアログをマイニングすることによって作り出され得る。具体的には、特定の問題の解決を求める要求中に行われた一連のステートメントは、顧客と顧客サービスプロバイダとの間の履歴インタラクションの集合から自動的にマイニングされ得る。2014年1月12日に米国特許商標庁に出願された米国特許出願第14/153,049号「Computing Suggested Actions in Caller Agent Phone Calls By Using Real-Time Speech Analytics and Real-Time Desktop Analytics」に記載されている、コンタクトセンターエージェント側から記述されたようなステートメント及びコメントの有効なシーケンスを自動的にマイニングするためのシステム及び方法が採用されてもよく、この開示全体は、参照により本明細書に組み込まれる。
スクリプトが取り出されると、フローチャート350は動作370に進み、顧客自動化システム300は、スクリプトを処理又は「ロード」する。このアクションは、スクリプト処理モジュール325によって実行されてもよく、スクリプト処理モジュール325は、スクリプトのデータフィールドに顧客に関する適切なデータを記入することによってそれを実行する。より具体的には、スクリプト処理モジュール325は、予想されるインタラクションに関連する顧客データを抽出することができ、その関連性は、顧客の意図に対応するものとして選択されたスクリプトによって事前に決定される。スクリプト内のデータフィールドの多くに対するデータは、顧客プロファイル330内に記憶されたデータから取り出されたデータと共に自動的にロードされてもよい。理解されるように、顧客プロファイル330は、顧客に関連する特定のデータ、例えば、顧客の名前、生年月日、住所、口座番号、認証情報、及び顧客サービスインタラクションに関連する他のタイプの情報を記憶することができる。顧客プロファイル330内に記憶するために選択されたデータは、顧客が以前のインタラクションで使用したデータに基づいてもよく、及び/又は顧客によって直接取得されたデータ値を含んでもよい。データフィールドに関する曖昧さ又はスクリプト内の情報の欠落がある場合、スクリプト処理モジュール325は、顧客が必要とされる情報を手動で入力することを促して可能にする機能を含むことができる。
再びフローチャート350を参照すると、動作375において、ロードされたスクリプトは、顧客サービスプロバイダ又はコンタクトセンターに送信され得る。以下で更に論じるように、ロードされたスクリプトは、顧客のためにコンタクトセンターとのインタラクションの少なくとも一部を自動化するのに必要なコマンド及び顧客データを含むことができる。例示的な実施形態では、コンタクトセンターと直接インタラクションするために、API345が使用される。コンタクトセンターは、それらのシステムに一般的な要求を行うためのプロトコルを定義することができ、API345は、これを行うように構成される。そのようなAPIは、拡張マークアップ言語(XML)を使用するSimple Object Access Protocol(SOAP)、XML又はJavaScript Object Notation(JSON)を使用してフォーマットされたメッセージを有するRepresentational State Transfer(REST)APIなど、様々な標準プロトコルを介して実装され得る。したがって、顧客自動化システム300は、コンタクトセンターとの通信のための定義されたプロトコルに従ってフォーマットされたメッセージを自動的に生成することができ、メッセージは、フォーマットされたメッセージの適切な部分に、スクリプトによって指定された情報を含む。
意図マイニング自動化を使用したボットオーサリング
近年の人工知能(Artificial Intelligence、AI)及びコンピューティング技術におけるいくつかのブレークスルーと共に、人間との自然言語会話に携わることができるアプリケーション、自動化システム、チャットボット又はボットに対する関心が高まっている。近年では、人間と自然に会話することができ、かつセルフサービス方式で多種多様なタスクを実行することができる、AI型チャットボット及び仮想アシスタントの採用が非常に成長していることが目撃されている。そのような会話型ボットは、最初にユーザの入力を分析し、次いでその入力の意味を理解しようと試みることによって動作する。これは、自然言語理解(又は「Natural Language Understanding、NLU」)と称され、通常、ユーザの意図又は「インテント」と、ユーザの入力発話内の特定のキーワード又は「エンティティ」との識別を伴う。意図及びエンティティが決定されると、ボットは、適切なフォローアップアクションでユーザに応答することができる。
様々な機械学習アルゴリズムが、NLUモデルを訓練するために使用される。訓練は通常、自然言語入力に存在するパターンを認識し、かつそれらを予め定義された意図のセットに関連付けるようにシステムに教示することを伴う。訓練データの品質は、モデル性能を決定する際の重要な要因である。入力の発話が適切な多様性を有する十分に大きいデータセットは、良好なNLUモデルを構築するために重要である。
本明細書で使用される場合、「ボットオーサリング」という用語は、NLU能力を有する会話型ボット又はチャットボットを作成するプロセスを指す。このプロセスは、一般に、意図を定義すること、エンティティを識別すること、発話を定式化すること、NLUモデルを訓練すること、ボットをテストすること、及び最後にそれを公開することを伴う。これは、通常、完了するのに数週間又は数ヶ月を要し得る、ほとんど手動のプロセスである。一般に、意図を識別し、発話を定式化することは、この時間の大部分を要する。組織は、それらの顧客とコンタクトセンターエージェントなどの顧客サポートスタッフとの間の大量のチャット会話を既に所有している場合があるが、意図及び発話を識別するためにこれらの生のチャットトランスクリプトを手動で調べるプロセスは、時間と費用の両方がかかる。
本明細書で使用される場合、意図マイニングエンジン又はプロセス(一般的に「意図マイニングプロセス」と称され得る)は、ボットオーサリングワークフローをより効率的にするシステム又は方法である。理解されるように、本発明の意図マイニングプロセスは、何万もの会話から意図をマイニングすることによって機能し、それぞれに属する強固で多様な発話のセットを見つける。更に、意図マイニングプロセスは、会話分析を提供することによって会話への洞察を得るのに役立つ。それはまた、ボットオーサーに、意図を分析し、かつ修正を行う機会を提供する。最後に、これらの意図及び発話は、Genesys Dialog Engine、GoogleのDialogflow、及びAmazon Lexにおいて商業的に入手可能なものなど、多様なチャットボットオーサリングプラットフォームにエクスポートされてもよい。理解されるように、これにより、全体的な開発時間を大幅に短縮する柔軟で効率的なボットオーサリングワークフローがもたらされる。
次に図8を参照すると、本発明の意図マイニングプロセス(又は単に「本意図マイニングプロセス」)を使用するボットオーサリングワークフロー400の様々な段階又はステップが示されている。ワークフロー400を開始するために、会話又は会話データがマイニングのためにインポートされ得る。そのような会話データは、エージェントと顧客との間で以前に発生したインタラクションからなり得る。そのような会話データは、複数の往復のメッセージングターンからなる自然言語会話であり得る。会話は、例えば、チャットインターフェースを介して、テキストを通して、又は音声通話を介して行われている場合がある。後者の場合、会話は、マイニングが始まる前に、音声認識を介してテキストに書き換えられ得る。
最初のステップ405において、ボットオーサリングワークフロー400は、意図マイニングプロセスで使用するための会話データ(すなわち、会話テキストデータ)をインポートすることを含むことができる。これは、いくつかの方法で行うことができる。例えば、会話データは、マイニングされるべき会話を含む(JSONのようなサポートされるフォーマットの)テキストファイルを介してインポートされてもよい。会話データはまた、クラウドストレージからインポートされてもよい。
ステップ410において、ボットオーサリングワークフロー400は、会話データから意図をマイニングすることを含むことができる。以下の図9及び図10に関連して説明するように、意図は、意図マイニングアルゴリズムに従ってマイニングされてもよい。
ステップ415において、ボットオーサリングワークフロー400は、マイニングされた意図をテストすることを含むことができる。これは、意図マイニングプロセスの出力と対話することを含んでもよい。すなわち、ワークフローのこの段階で、ボットオーサーは、マイニングされた出力とインタラクションして編集を行い、この編集は、意図及び関連付けられた発話を、訓練のためにボットにエクスポートする前に微調整及びプルーニングすることを含み得る。ボットオーサーは、マイニングされた出力に対して、例えば、意図及びその意図に属する発話を選択すること、2つ以上の意図を単一の意図にマージすることによって、それらの選択された発話をマージしたものを生じさせ得ること、意図を複数の意図に分割することによって、対応する発話を分割したものを生じさせること、及び意図ラベルをリネームすることなど、様々なアクションを実行することができる。このビジネスロジック主導型プロセスの終わりに、修正された意図及び関連付けられた発話のセットが作り出され、次いで、これらを使用してチャットボットを訓練することができる。
ステップ420において、ボットオーサリングワークフロー400は、マイニングされた意図及び発話をボットにインポートすることを含むことができる。例えば、マイニングされた意図は、会話型ボットにアップロードされてもよく、会話型ボットは、顧客との自動化された会話を行うために使用されてもよい。本意図マイニングプロセスは、マイニング又は修正された意図及び発話をボットに追加するための複数の方法を提供することができる。データは、好都合なレビューのためにCSVフォーマットでダウンロードされてもよい。データはまた、複数のボットフォーマットにエクスポートされてもよく、このようにして、Genesys Dialog Engine、GoogleのDialogflow、又はAmazon Lexなど、より多種多様な会話型AIチャットボットサービスへのサポートを提供することができる。
ボットオーサリングプロセスはまた、追加のステップを含むことができる。いくつかの実施形態によれば、本意図マイニングプロセスは、既に上述したステップに著しく関与し、後の開発段階にはあまり関与しない場合がある。これらの後のステップは、任意選択の編集ステップと、ボット設計ステップと、最後に、最終テスト及び公開ステップとを含むことができる。
次に図9を参照すると、本意図マイニングエンジン又はプロセス500を実装するための例示的なアルゴリズムについて次に説明する。理解されるように、このアルゴリズムは、いくつかのステップにおおよそ分解されてもよく、これらのステップは、本明細書では、1)意図を有する発話を識別すること、2)候補意図を生成すること、3)顕著意図を識別すること、4)意図の意味的グループ化、5)意図ラベリング、及び6)発話-意図関連付け、として参照される。他のステップは、発話内の個人的に識別可能な情報のマスキングを含んでもよい。別の追加のステップは、意図分析のコンピュータ処理を含んでもよい。次に、これらのステップについて論じる。理解されるように、ステップは、インポートされた会話データ、例えば、顧客サービス担当者又はエージェントと対話する顧客間の自然言語会話を含むデータに関連して説明されるが、プロセスはまた、他のタイプのユーザ及び会話タイプを伴う他の文脈にも適用可能であり得ることを理解されたい。
第1のステップ505に従って、本意図マイニングプロセスは、会話データを処理して、意図を有するターン又は発話を識別する。本明細書で使用される場合、意図を有する発話は、顧客の意図を含むか又は記述する可能性が高いと決定される発話である。したがって、本意図マイニングプロセスにおけるこの最初のステップは、所与の会話から意図を有する発話を識別することである。例えば、会話は、通常、(自動化されたシステム又はボット又は人間のエージェントを含み得る)エージェント及び顧客などの複数の当事者からの複数のメッセージターン又は発話からなる。
一例として、ボット生成メッセージは次のように見える場合がある:「Hello,thank you for contacting us.All chats may be monitored or recorded for quality and training purposes.We will be with you shortly to help you with your request」。そのようなボット生成メッセージは、一般的である傾向があり、かつ会話に見られる意図に光を投じないので、安全に破棄され得る。実際の会話は、エージェント又は顧客のいずれかが実質的な通信又はメッセージを送信することから始まる。例えば、インタラクション中に、顧客は、顧客ケアに接触する理由又は「意図」を説明することができる。後続のエージェント-顧客会話ターンは、顧客によって表現されたこの意図に基づいて行われる。
現実世界の顧客-エージェント会話の分析から、本発明は、意図を有する発話を識別するためのいくつかのヒューリスティック又は戦略を含む。例えば、意図を有するターンは、通常、会話の顧客側の始まりの方に発生することが観察されている。したがって、意図を識別するためには、一般に、最初の顧客発話のうちのいくつかのみを処理する必要があり、会話の残りは破棄することができる。これは更に、システムのレイテンシ及びメモリフットプリントを低減するのに役立つ。更に、ワードカウント制約を使用して、他の発話を、顧客の意図を含む可能性が低いものとして破棄することができる。
例として、意図を有する発話の識別は、以下を含むことができる。会話における連続した顧客発話のセットが選択される。このセットは、会話の開始内で発生する顧客の発話を含むことができる。更に、ワードカウント制約を使用して、この初期セット内の顧客発話の一部を不適格とすることができる。すなわち、適格であるためには、各ターン内のワードの数は、最小閾値より大きくなければならない。そのようなワードカウント又は長さ制約は、「Hello」、「Hi there」、「How are you?」などのような慣習的な挨拶など、意図マイニング目的に無関係であるいくつかの顧客ターンを破棄するのに役立つ。例えば、この最小ワードカウント閾値は、2~5に設定されてもよい。
本意図マイニングプロセスは、意図を有するターンの連続する顧客ターンからの発話を、単一の組み合わされた発話に連結することができる。これが行われる前に、より長い文は一貫性がないか又はノイズの多い結果を作り出す傾向があるので、顧客ターンの各々は、最大長閾値に基づいてプルーニングされてもよい。一例として、発話当たりのワードの最大数を50ワードに設定することができる。したがって、このステップの最後に、顧客によって表現された意図を含む可能性が高い各会話から、組み合わされた発話が得られる。会話が上記の基準を満たすメッセージターンを含まない場合、その会話は、それから組み合わされた発話を得ることなく破棄されてもよい。本意図マイニングプロセスは、数百又は数千もの会話から優勢な意図を取得するために使用されるので、顧客意図が複数の会話にわたって繰り返されることが安全に仮定され得る。したがって、上記のヒューリスティック基準を満たさない会話は、意図識別におけるより大きい堅牢性のために、システムの機能に影響を及ぼすことなく破棄され得る。
第2のステップ510に従って、候補意図が、組み合わされた発話の分析に基づいて生成される。すなわち、意図を有するターンからの発話が会話から取得され、組み合わされると、次のタスクは、本明細書では「候補意図」と称される、可能な又は可能性の高い意図を識別することを含む。本明細書で使用される場合、候補意図は、1)有形の目的、タスク、又は活動を表すワード若しくはフレーズであるアクションと、2)アクションが作用又は動作する、ワード又はフレーズを表すオブジェクトとの2つの部分からなるテキストフレーズである。
発話からこれらのアクション-オブジェクトペアを得るための様々な方法が存在する。理解されるように、選択は、特定の言語に対して利用可能な言語モデル及びリソースに依存し得る。典型的には、例えば、構文依存パーサー(syntactic dependency parser)を使用して、発話の文法構造を分析し、「ヘッド」ワードと「トークン」又はこれらのヘッドを修飾するワードとの間の関係を取得する。発話のトークンとそれらのヘッドとの間のこれらの関係は、それらの品詞(POS)タグと共に、所与の発話に対する潜在的な意図又は候補意図を識別するために使用される。
一例として、そのようなアクション-オブジェクトペアを取得するプロセスは、以下を含むことができる。最初に、依存パーサーを使用して、発話内の全てのトークンとヘッドとのペアを取得することができる。それらから、トークンのPOSタグと、それぞれ名詞及び動詞であるその関連するヘッドとを有するペアが選択される。ユニバーサルPOSタグの使用は、システム言語をアグノスティックにし、したがって複数の言語ドメインに拡張可能にするのに役立つ。
「アクション」部分は、通常、関連するPOSタグとして「動詞」を有するトークンである。トークンが「助詞」トークンを有する「基本動詞」である場合、トークンは、発話の「句動詞」を形成する。関連付けられた「助詞」トークンも動詞トークンと共に含まれる。したがって、句動詞全体が、候補意図のアクション部分になる。「オブジェクト」部分は、通常、関連するPOSタグとして「名詞」を有するトークンである。トークンが「複合」の一部であり、全ての構成要素であるトークンが「名詞」POSタグを有する場合、この複合全体がオブジェクトとみなされる。同様に、トークンが形容詞修飾句の一部である場合、この句全体がオブジェクトとみなされる。トークンが並置修飾子に関連付けられている場合、後者を構成する全てのトークンは、現在のトークンに付加されて、候補意図のオブジェクト部分が形成される。ユニバーサルPOSタグのみが言語に対して利用可能であり、ユニバーサル依存性が利用可能でない場合、「動詞」トークン及び「名詞」トークンは、それぞれ、アクション部分及びオブジェクト部分とみなされる。次のステップとして、アクション-オブジェクト順序付きペアは、候補意図をより標準的な形式に変換するために、レンマ化されてもよい。更なる正規化のために、レンマ化されたペアのケースを下げることができる。
したがって、1つ以上の正規化されたアクション-オブジェクトペアを各発話から取得することができ、これらは、会話の候補意図を一緒に形成する。そのようなペアが取得されない場合、その発話は破棄される。このことを念頭に置いて、以下の第1の例示的な発話を検討されたい:「I’m looking to contact the instructor for this course.Can you provide his email please?」この場合、候補意図は、「contact instructor」及び「provide email」を含み得る。以下の第2の例示的な発話を検討されたい:「I just finished my bachelor’s program yesterday on my account it says you must complete a graduation application,but when I click it goes to a page that says messages and only shows potential scholarships what should I do?」。この場合、候補意図は、「finish program」、「complete graduation application」、「say message」、及び「show potential scholarship」を含み得る。
第3のステップ515に従って、顕著意図が識別される。本明細書で使用される場合、「顕著意図」という用語は、前のステップにおいて識別された候補意図からの、意図の絞り込まれたリストを指し、その絞り込みは、例えば、関連性、重要性、確定性、及び/又は注目性に基づく。したがって、候補意図のセットから、顧客の実際の意図を記述する意図が、顕著意図として識別される。理解されるように、このタスクは必ずしも簡単ではない。場合によっては、顧客の意図は、本質的に暗示的である場合がある。しかしながら、他の場合には、特に複数の候補意図を含む発話では、顧客の実際の意図に関して異なる意見が存在する場合がある。
上で提供された例を検討されたい。第1の発話例の場合、「contact instructor」と「provide email」の両方が顧客の意図を記述していると主張することができる。また、第2の発話例の場合、顧客は、自分の学士課程を終了し、卒業申込みを完了している間に問題に直面している。この意図はより暗示的であるが、最も近い明示的近似は、候補意図「complete graduation application」であり得る。第1の発話の意図として「contact instructor」が選択されるべきか「provide email」が選択されるべきか、又は更には第2の発話の意図として「finish program」が選択されるべきか「complete graduation application」が選択されるべきかの決定は、どんなアルゴリズムの定式化によるよりも、ビジネスロジックによってより良好に決定される場合がある。すなわち、ボットオーサーは、適切なビジネスロジックを適用して、そのような意図に関する最終決定に達することができる。ボットオーサーはまた、特定のビジネスドメイン内で適切なビジネス目的又は目標を達成するために、複数の意図を保持するか、又は更には意図の階層を記述することを選択することができる。
ボットオーサリングプロセスをより効率的にすることが目的であるので、本意図マイニングプロセスは、候補意図のリストを最も顕著なものに絞り込むことができ、次いで、ボットオーサーは、それらを適切性についてレビューすることができる。そのような場合、顕著性は、異なる基準に基づいて複数の方法で定義され得る。例えば、例示的な実施形態によれば、発話のセット全体における候補意図の頻度は、顕著性の指標とすることができ、すなわち、候補意図の数が多いほど、関連性がより高い。本発明の他の実施形態によれば、潜在的意味解析(Latent Semantic Analysis、LSA)に基づく基準を使用して、顕著意図を見つけることができる。LSAは、自然言語理解(NLU)タスクにおいて使用されるトピックモデリング技法である。これを行うために、候補意図アクション-オブジェクトペアに関して記述された各発話は、文書として考慮される。次に、LSAは、これらの文書とそれらが含む用語(すなわち、アクション-オブジェクトペア)との間の関係を、文書とそれらに含まれる用語とに関連する概念のセットを作り出すことによって分析する。各概念は、関連付けられた重みを有する候補意図に関して記述される。これらの重みは、各概念グループ内の候補意図の相対的な顕著性への洞察を提供する。
一例として、本発明によれば、顕著意図を識別するプロセスは、以下を含むことができる。最初に、LSAは、LSA構成要素の数が所定の制限、例えば50に設定された状態で、候補意図アクション-オブジェクトペアに関して記述された発話に適用される。次いで、各概念グループの候補意図が、それらの重みに関して降順でソートされ、上位の候補意図、例えば、上位5つが選択される。次いで、各概念グループから得られた選択された候補意図が照合され、それらの重みに関して降順に配列される。次に、重複エントリが破棄され、より高い重みを有するエントリが保持される。次いで、これらのうちの所定の数が、顕著候補意図又は単に「顕著意図」とみなされ得る。所定の数は、マイニングされる必要がある意図の最大数に基づき得る。例えば、この最大数の意図は、現実世界のコンタクトセンターインタラクションパターンに基づいて本意図マイニングプロセスによって決定されてもよく、又は、適切なビジネスロジック及び使用事例に基づいてボットオーサーによって選択されてもよい。
第4のステップ520に従って、顕著意図が意味的にグループ化される。理解されるように、候補意図を生成するために発話の構文構造のみが使用されるので、システムによって識別された顕著意図の多くが意味において類似している可能性がある。したがって、意味的に類似した顕著意図は、最適なダウンストリーム機能のために一緒にグループ化され得る。本意図マイニングプロセスの出力は、自然言語理解(NLU)モデルを訓練するために使用されてもよく、NLUモデルは、その場合、自然言語チャットボットの「頭脳」を効果的に形成する。これらのモデルが多様な発話に関連付けられた意図を識別するためには、NLUモデルは、構文的に異なるが、意味的に類似した発話によって訓練されなければならない。したがって、ボットオーサリングプロセスは、適切な多様性を有する発話に関連付けられている意図の作成を可能にしなければならない。意味的に類似した顕著意図のグループ化は、マイニングされた意図においてこの多様性を作り出すのに役立つ。
このステップは、一般に、顕著意図間の意味的類似度を計算することを含み、これは、一例として、以下のように完了され得る。最初に、顕著意図のテキストに関連付けられた埋め込み又はワード埋め込みがコンピュータ処理される。理解されるように、そのような埋め込みは、意味的に類似するテキストが類似する埋め込みを有するように、対象テキスト、例えば、ワード、フレーズ、又は文を表す。そのようなワード埋め込みは、一般に、符号化プロセスを介してテキストデータを数値フォーマットに変換することを含み、様々な従来の符号化技法を使用して、テキストデータからそのようなワード埋め込みを抽出することができる。次いで、埋め込みを効率的に比較して、テキスト間の意味的類似度の尺度を決定することができる。一例として、グローバルベクトル(又は「Global Vector、GloVe」)は、ワードのベクトル表現を取得するために使用され得るアルゴリズムである。GloVeモデルは、例えば、300次元を有してもよい。例示的な実施形態では、顕著意図のワード埋め込みは、構成要素であるトークンのGloVe埋め込みの逆文書頻度(Inverse Document Frequency、IDF)加重平均を使用してコンピュータ処理されてもよい。理解されるように、IDFは、用語が所与の文書コーパスにおいて一般的であるのか、又は希少であるのかに関する尺度を反映する数値統計である。このように使用されると、全ての候補意図又は顕著意図の集合を、ここではIDFコンピュータ処理の目的のための文書コーパスとみなすことができる。
顕著意図のテキストに対するワード埋め込みが取得されると、ワード埋め込みは、顕著意図のペア間の意味的類似度を計算するために使用され得る。一例として、コサイン類似度を使用して、より高い次元空間におけるワード埋め込み間の意味的近さの尺度を提供することができる。これが得られると、次いで、顕著意図は、0~1の範囲に設定され得る所定の類似度閾値より大きい埋め込みのコサイン類似度を有するペアに従ってグループ化され得る。理解されるように、この閾値が高いほど、より顕著でない意図が一緒にグループ化され、それによって、より均質なグループが作り出され、一方、閾値が低いほど、より意味的に多様な意図が一緒にグループ化され、より均質でないグループが作り出され得る。上述した最大意図を選択する場合のように、この均質性値は、ボットオーサーによって選択されたシステムにおいて(例えば、0.8に)予め設定されてもよい。後者の場合、ボットオーサーは、複数の出力意図及び発話の組み合わせを見て、最適なボット結果に適した値を選択することができ得る。
第5のステップ525に従って、意図ラベルが識別される。グループ化された顕著意図(又は「顕著意図グループ」)の各々は、最終的に、マイニングされている意図(又は「マイニングされた意図」)になり得る。したがって、これらの顕著意図グループの各々について、意図ラベルが選ばれて、マイニングされた意図のラベル又は識別子として働く。例示的な実施形態によれば、このラベル付けは、所与の顕著意図グループ内の顕著意図の各々のIDFをコンピュータ処理することによって行われてもよい。この計算のために、候補意図に関して記述された発話は、文書とみなされ、単一のユニットとみなされたアクション-オブジェクトペアは、構成要素であるトークンとみなされる。次いで、最も高い計算されたIDFを有する各グループの顕著意図が、グループの意図見本又は「意図ラベル」にされ、一方、グループ内の他の顕著意図は、「意図代替」と称される。
第6のステップ530に従って、発話は、マイニングされた意図(この時点で意図ラベル及びそれぞれの顕著意図グループによって反映された、マイニングされた意図の各々)に関連付けられる。理解されるように、この次のステップは、マイニングされた意図の各々に関連付けられる発話を決定する。前のステップと同様に、埋め込みを使用する意味的類似度技法もここで使用することができる。例えば、意味的類似度は、意図を有する発話の各々から導出された候補意図と、所与の顕著意図グループ内の顕著意図の各々との間でコンピュータ処理される。次いで、発話は、その構成要素である候補意図のいずれかの類似度が、その顕著意図グループの顕著意図に対して最高であり、また、最小閾値(例えば、0.8)を上回ると決定された場合、その所与の顕著意図グループ(マイニングされた意図又は単純に意図とも称され得る)に関連付けられる。更に、顕著意図グループの各々に関して、各特定の顕著意図グループとの最も高い類似度を作り出した意図を有する発話の候補意図は、「意図補助」として、その特定の顕著意図グループに持ち込まれ得る。ここでも、最小閾値が必要とされてもよい。したがって、このステップ内で、特定の意図を有する発話は、顕著意図グループのうちの1つに関連付けられ、その特定の意図を有する発話の構成要素である候補意図は、意図補助としてそれぞれの顕著意図グループに関連付けられる。したがって、マイニングされた各意図は、前述のように、意図ラベル、並びに1つ以上の意図代替及び/又は1つ以上の意図補助を含むことができる。理解されるように、そのような定式化は、単一の意図を有する発話が複数の意図グループに関連付けられる可能性を妨げない。これは、単一の意図を有する発話が、複数のマイニングされた意図にわたって異なるものに意図補助として追加される複数の候補意図を有し得るためである。これは、ダウンストリーム機能においてより大きい柔軟性及び堅牢性を導入する。ボットオーサーは、1つ以上のグループからのそのような発話を保持又は破棄することを選択することができる。複数の意図にわたって繰り返される発話は、NLUモデルに対して、それらに存在する固有の混乱について教示するのに役立ち、したがって、より現実的で堅牢なモデルを構築するのに役立つことが観察されている。
別のステップ(図なし)によれば、発話内の個人的に識別可能な情報が除去又はマスキングされる。顧客のプライバシーを確保するために、関連付けられた発話内に存在する全ての個人的に識別可能な情報がマスキングされる。もちろん、このステップは、入力会話が本意図マイニングプロセスに提供される前に匿名化される場合には省略することができる。このような個人的に識別可能な情報としては、顧客名、電話番号、電子メールアドレス、社会保障などが挙げられ得る。これに加えて、地理的位置、日付及び数字に関連するエンティティは、追加の予防措置としてマスキングされ得る。例えば、この発話「Hi,I need to book a flight from Washington D.C.to Miami on August 15 under the name of John Honai.」を検討されたい。マスキングの後、発話は、「Hi,I need to book a flight from<GEO><GEO>to<GEO>on<DATE><DATE>under the name of<PERSON><PERSON>.」になり得る。プライバシーを保護することに加えて、そのようなマスキングは、ボットオーサーが意図の発話内に存在する異なるエンティティを迅速に識別することを可能にし得る。これは、ボットオーサーが、同様の発話であるが、これらのエンティティに対するスロット値が変化する発話を作成するのに役立ち得る。これは、発話におけるより大きい多様性につながり、より良いNLUモデルの作成に更に役立つ。
別の可能なステップ(図示せず)によれば、意図分析をコンピュータ処理することができる。すなわち、意図及び関連付けられた発話をマイニングすることとは別に、本意図マイニングプロセスはまた、企業が顧客インタラクションパターンを識別するのを支援する、会話データに関連する分析及びメトリックを作り出し得る。2つのそのようなメトリックは以下の通りである。
第1の分析は、意図ボリューム分析であり、これは、会話が特定の意図を扱う程度に関する分析である。この分析は、百分率で表すこともできる。意図ボリューム分析は、会話データ内の意図の発生頻度に基づいて、意図の相対的な重要性を理解するのを支援することができる。各会話から単一の発話のみが取られるので、このメトリックは、本質的に、各意図に属する発話の数になる。
第2の分析は、意図持続時間分析であり、これは、特定の意図を扱う会話の持続時間に関する分析である。この分析は、百分率で表すこともできる。理解されるように、このメトリックは、意図に関連付けられた総会話時間に基づいて意図を比較するのに役立つ。会話に要する時間は、最後の顧客/エージェントタイムスタンプと最初の顧客/エージェントタイムスタンプとの差としてコンピュータ処理される。意図に属する個々の会話の持続時間の合計は、その意図の持続時間を与える。理解されるように、このタイプの分析は、ボットオーサー及びビジネスが顧客及びコンタクトセンタースタッフをより良く理解するのを支援することができる。
ここで、会話型ボット及び意図マイニングをオーサリングするための方法について説明する。本方法は、会話データを受信することであって、会話データが、顧客と顧客サービス担当者との間の会話から導出されたテキストを含む、受信することと、意図マイニングアルゴリズムを使用して、会話データから意図を自動的にマイニングすることであって、マイニングされた意図の各々が、意図ラベル、意図代替、及び関連付けられた発話を含む、マイニングすることと、マイニングされた意図を会話型ボットにアップロードし、会話型ボットを使用して他の顧客との自動化された会話を行うことと、を含み得る。
例示的な実施形態によれば、意図マイニングアルゴリズムは、会話データの会話内で発生する発話を分析して、意図を有する発話を識別することを含むことができる。発話は各々、会話内のターンを含むことができ、それによって、顧客は、顧客発話の形態で、又は顧客サービス担当者は、顧客サービス担当者発話の形態で、通信している。また、意図を有する発話は、意図を表現する可能性が高いと決定された発話の1つとして定義される。意図マイニングアルゴリズムは、識別された意図を有する発話を分析して、候補意図を識別することを更に含むことができる。候補意図は各々、目的又はタスクを記述するワード又はフレーズを含み得るアクションと、アクションが動作するオブジェクト又は物事を記述するワード又はフレーズを含み得るオブジェクトとの2つの部分を有する、意図を有する発話のうちの1つ内で発生するテキストフレーズであるものとして識別され得る。意図マイニングアルゴリズムは、1つ以上の基準に従って、候補意図から顕著意図を選択することを更に含むことができる。意図マイニングアルゴリズムは、選択された顕著意図を、顕著意図間の意味的類似度の度合いに従って顕著意図グループにグループ化することを更に含むことができる。意図マイニングアルゴリズムは、顕著意図グループの各々について、顕著意図のうちの1つを意図ラベルとして選択し、顕著意図のうちの他のものを意図代替として指定することを更に含むことができる。意図マイニングアルゴリズムは、意図を有する発話内に存在する候補意図と、顕著意図グループの各々内の意図代替との間の意味的類似度の度合いを決定することを介して、意図を有する発話を顕著意図グループに関連付けることを更に含むことができる。マイニングされた意図は各々、顕著意図グループのうちの所与の1つであって、各々が、意図ラベルとして選択された顕著意図のうちの1つ、及び代替意図として指定された顕著意図のうちの他のものによって定義される、所与の1つと、顕著意図グループのうちの所与の1つに関連付けられた意図を有する発話とを含むことができる。
例示的な実施形態によれば、意図を有する発話を識別するステップは、顧客発話の第1の部分を、意図を有する発話として選択し、会話データ内の顧客発話の第2の部分を破棄することを含むことができる。顧客発話の第1の部分は、会話の各々の始めに発生する所定の数の連続する顧客発話として定義されてもよく、第2の部分は、会話の各々の残りとして定義されてもよい。
例示的な実施形態によれば、意図を有する発話を識別するステップは、ワードカウント制約を満たさない顧客発話の第1の部分内の顧客発話を破棄することを更に含むことができる。ワードカウント制約は、最小ワードカウント制約であって、最小ワードカウント制約より少ないワードを有する顧客発話の第1の部分内の顧客発話が破棄される、最小ワードカウント制約、及び/又は最大ワードカウント制約であって、最大ワードカウント制約より多いワードを有する顧客発話の第1の部分内の顧客発話が破棄される、最大ワードカウント制約を含むことができる。最小ワードカウント制約は、2~5ワードの値を含むことができる。最大ワードカウント制約は、40~50ワードの値を含むことができる。
例示的な実施形態によれば、意図を有する発話を識別するステップは、会話の各々の第1の部分内で発生する顧客発話を、組み合わされた顧客発話に連結することを含むことができる。
例示的な実施形態によれば、候補意図を識別するステップは、構文依存パーサーを使用して、意図を有する発話の文法構造を分析して、ヘッド-トークンペアを識別することであって、各ヘッド-トークンペアが、トークンワードによって修飾されたヘッドワードを含む、識別することと、意図を有する発話の品詞をタグ付けするために品詞(以下、「POS」)タグ付けを使用し、ヘッドワードのPOSタグが名詞タグを含み得、かつトークンワードのPOSタグが動詞タグを含み得るヘッド-トークンペアを候補意図として識別することと、を含むことができる。
例示的な実施形態によれば、候補意図から顕著意図を選択するステップは、候補意図のうち、意図を有する発話において候補意図のうちの他のものより頻繁に現れると決定されたものを選択することを含むことができる。顕著意図が候補意図から選択される1つ以上の基準は、潜在的意味解析(LSA)に基づく基準を含み得る。候補意図から顕著意図を選択するステップは、候補意図のそれぞれのものに対応する文書を有する文書のセットを生成することであって、文書の各々が、候補意図のうちの対応する1つによって定義されるアクション-オブジェクトペアをカバーする、生成することと、文書のセットに含まれるアクション-オブジェクトペアに現れる用語に基づいて概念グループを生成することと、概念グループの各々についての候補意図の各々について重み値を計算することであって、重み値が、文書のうちの所与の1つの候補意図と、概念グループのうちの所与の1つとの間の関連性の度合いを測定する、計算することと、顕著意図として、概念グループの各々における所定の数の候補意図を選択し、それに基づいてより高い度合いの関連性を示す重み値を作り出すことと、を含むことができる。
例示的な実施形態によれば、意味的類似度の度合いに従って顕著意図をグループ化するステップは、顕著意図の各々について埋め込みを計算することであって、埋め込みが、意味的に類似するテキストが類似する符号化表現を有するテキストの符号化表現を含み得る、計算することと、計算された埋め込みを比較して、顕著意図のペア間の意味的類似度の度合いを決定することと、所定の閾値を上回る意味的類似度の度合いを有する顕著意図をグループ化することと、を含むことができる。埋め込みは、顕著意図の構成要素であるヘッド-トークンペアのグローバルベクトル埋め込みの逆文書頻度(IDF)平均として計算されてもよい。計算された埋め込みを比較することは、コサイン類似度を含むことができる。
例示的な実施形態によれば、顕著意図グループの各々に意図識別子をラベル付けするステップは、顕著意図グループの各々内で顕著意図のうちの代表的な1つを選択することを含むことができる。
例示的な実施形態によれば、会話データからの発話を顕著意図グループに関連付けるステップは、顕著意図グループの各々に関連して意図を有する発話の各々をカバーするために第1のプロセスを繰り返し実行することを含むことができる。第1及び第2の顕著意図グループと、第1及び第2の候補意図を含む第1の意図を有する発話とを伴う例示的な第1のケースに関連して記述される場合、第1のプロセスは、第1及び第2の候補意図の各々と、第1の顕著意図グループ内の意図代替の各々との間の意味的類似度の度合いをコンピュータ処理することと、第1及び第2の候補意図の各々と、第2の顕著意図グループ内の意図代替の各々との間の意味的類似度の度合いをコンピュータ処理することと、意図代替のうちのどれが最も高いコンピュータ処理された意味的類似度の度合いを作り出したかを決定することと、第1の意図を有する発話を、第1及び第2の顕著意図グループのうち、最も高いコンピュータ処理された意味的類似度の度合いを作り出すと決定された意図代替を含む方に関連付けることと、を含むことができる。会話データからの発話を顕著意図グループに関連付けるステップは、最も高いコンピュータ処理された意味的類似度の度合いが所定の類似度閾値も超えることが分かった場合にのみ、最も高いコンピュータ処理された意味的類似度の度合いを作り出す意図代替を関連付けることを更に含むことができる。
次に図10を参照すると、代替ボットオーサリングワークフローの様々な段階が示されており、図9に関連して上記で開示された意図マイニング方法は、意図プロセスのシーディングによって拡張されている。意図シーディングプロセスを使用する意図マイニングのプロセスは、簡単な紹介の後に以下で論じられる。参照を区別するのを容易にするために、意図シーディングを使用する意図マイニングのプロセスは、以降、「シーディングによる意図マイニングプロセス」又は単に「シーディングによる意図マイニング」と称され、一方、図9に関連して上記で開示された意図マイニング(すなわち、シーディングを伴わない意図マイニング)の前述のプロセスは、以降、「一般的な意図マイニングプロセス」又は単に「一般的な意図マイニング」と称される。
通常の動作モードでは、一般的な意図マイニングは、意図ラベル及びそれに関連付けられた発話の両方の意図を、エージェント-顧客会話の集合などの会話データからマイニングする。既に論じたように、このプロセスは、会話の構文構造及び意味内容によって案内される。例えば、構文依存関係及びPOSタグを使用して、会話内の意図を有する発話から候補意図を見つけることができ、潜在的意味解析(LSA)のような方法を使用して、発話から顕著意図を絞り込むことができる。次いで、意図ラベル、意図代替、及び意図補助は、意味的に類似する顕著意図を関連付けることによって取得され、これは、発話を特定の意図にリンクするのに役立つ。既に開示されているように、ボットオーサーは、一般的な意図マイニングを介してマイニングされたデータを使用して、NLUモデルを訓練することができ、次いで、NLUモデルが会話型ボットにパワーを供給する。
意図マイニングのこの一般的なフレームワークは、ボットオーサーが会話データ内に典型的に存在する意図に気づいていないという仮定、及び/又はNLUモデルが会話又は同様の会話ドメインの集合に関してまだ開発されていないという仮定から進行することが理解されよう。したがって、一般的な意図マイニングプロセス、例えば、上記で開示された意図マイニングエンジンを使用するプロセスは、本質的に、事前のドメイン知識なしで始まり、データの会話内容のみに基づいて意図を導出又はマイニングする。
しかしながら、多くの場合、この仮定は当てはまらない。すなわち、ボットオーサーは、特定のドメイン内の意図に関する知識を既に有している場合がある。そのような場合、ボットオーサーは、特定の会話に通常存在するか、又は特定の会話ドメインに存在することが予想される意図を理解することができる。これは、例えば、銀行又は旅行ドメインにおいて真であり得る。更に、多くの場合、NLUモデルは既に訓練されている場合があり、旅行又は銀行ボットのようなボットは、ボットオーサーによって既に公開されている。そのようなシナリオでは、既存のドメイン知識を使用して、意図シーディングプロセスを使用することによって、特定の意図をマイニングするように意図マイニングプロセスを案内することができる。理解されるように、シーディングによる意図マイニングの一部として、既存のドメイン知識は、シード意図データの形態でマイニングプロセスに供給される。そのようなシード意図データは、「シード意図」又は「シード意図ラベル」と称され得る意図ラベルと、各々に関連付けられたサンプル発話とから構成され得る。次いで、本意図マイニングプロセスは、このシード意図データを使用して、シード意図の各々について会話データからより多くの発話をマイニングする一方で、会話データ内で見つけることができる任意の他の顕著意図についての発話も見つける。上述したように、このマイニングプロセスは、本明細書では「シーディングによる意図マイニングプロセス」又は単に「シーディングによる意図マイニング」と称される。
理解されるように、シーディングによる意図マイニングは、ボットオーサーがシード意図に属するより多くの発話を迅速に識別するのを支援することができ、このことは、NLUモデルを訓練又は改善するために使用され得る。そのようなシステムは、所与のシード意図に加えて他の顕著意図をマイニングすることができるので、このプロセスは、ボットオーサーが異なる時間フレームに対して変化する顧客意図を識別するのに役立ち得る。
上述した一般的な意図マイニング方法と同様に、意図をシーディングする意図マイニングのプロセスは、会話データをインポートすることを介して開始され得る。概して、シーディングによる本意図マイニングの他のステップは、一般的な意図マイニングに関連して上記で開示されたステップと同じ又は同様であり得る。したがって、簡潔な説明のために、シーディングによる意図マイニングが、図9に関連して上記で提示された一般的な意図マイニングプロセスとは異なる領域に主に注目する。
本発明によれば、シーディングによる意図マイニングは、シード意図データを使用する。シード意図データは、本明細書で使用される場合、1つ以上のシード意図と、1つ以上のシード意図の各々について、関連するサンプル発話のセットとを含む。シーディングによる意図マイニングは、次いで、シード意図データを会話データと共に処理して、シード意図に関連付けるための意図代替及び/又は他の発話を取得する。そのような意図代替は、上記のセクションで与えられた候補意図を生成するのとほぼ同じ方法で取得される。この場合、シード意図及び関連付けられたサンプル発話は、会話データ内で顧客によって提供される意図を有する発話とみなされる。それらから取得された正規化されたアクション-オブジェクトペアは、各シード意図の意図代替を構成する。
各シード意図に対して意図代替が取得されると、図9に関連して上記で説明したように、会話データから導出された候補意図のセットからシード意図補助が識別される。シード意図補助を見つけ、発話及びシード意図を関連付けるステップに関して、シーディングによる意図マイニングプロセスは、一般的な意図マイニングプロセスにおいて上述したものと同じ又は同様であり得る。前のセクションと同様に、埋め込みを使用する意味的類似度技法もここで使用することができる。類似度は、意図を有する発話の各々の候補意図と、各シード意図の意図代替との間でコンピュータ処理され得る。意図を有する発話は、a)意図を有する発話の構成要素である候補意図のいずれかの意味的類似度が、そのシード意図の意図代替に対して最も高く、b)意味的類似度が最小閾値を上回る(例えば、0.8のスコアを上回る)と決定された場合、シード意図に関連付けられる。更に、前述のように、シード意図のうちの1つに関して最高の類似度スコアを作り出す候補意図は、「意図補助」として、又はより具体的には、「シード意図補助」としてシード意図に持ち込まれる。
シーディングによる意図マイニングはまた、シード意図データにおいて識別された意図とは異なる、会話データ内に見出される他の顕著意図を導出することを含むことができる。そのような顕著意図を識別することに関して、シーディングによる意図マイニングプロセスは、一般的な意図マイニングプロセスにおいて上述したものと同じ又は同様であり得る。すなわち、候補意図が識別され、次いで、概念グループ内のものが重みに関してソートされ、グループからの所定の数のより高い重み付けされた候補意図が選択される。これらの選択された候補意図のうち、重複エントリは破棄され、より高い重みを有するエントリが、保持されるエントリとなる。このステップを完了する際に、シーディングによる意図マイニングプロセスは、一般的な意図マイニングに関して上記で開示されたものからの追加の手順を含むことができる。具体的には、この追加の手順は、シード意図補助として既に識別されている、識別された候補意図のいずれかを破棄することを含む。
次のステップは、マイニングされた意図に関連付けられた発話を見つけることである。前のセクションと同様に、埋め込みを使用する意味的類似度技法がここで使用される。類似度は、発話の候補意図と全てのグループの意図との間でコンピュータ処理される。発話は、その構成要素である候補意図のいずれかの類似度が、そのグループの意図に対して最も高く、かつ最小閾値(例えば、0.8)を上回る場合、意図グループに関連付けられる。最も高い類似度を作り出した候補意図は、グループに持ち込まれ、「意図補助」と呼ばれる。シード意図補助として既に識別されている候補意図は、この実行から破棄される。
シーディングを伴わない意図マイニング(すなわち、図9に関連して説明された一般的な意図マイニングプロセス)、及びシーディングを伴う意図マイニング(すなわち、図10に関連して説明されたシーディングによる意図マイニングプロセス)に関して上記で議論される機能が与えられると、いくつかの異なる使用事例又は用途が可能であることを理解されたい。第1のケースでは、意図マイニングは、シーディングなしで実行される。これは、所与の会話データから、顕著意図及びそれに関連付けられた発話をマイニングするために使用され得る。第2のケースは、一般的な意図マイニングとシーディングによる意図マイニングとが実行される混在したケースを含む。理解されるように、このケースを所与の会話データに対して使用して、顕著意図及び関連付けられた発話の両方、並びにシード意図の所与のセットに関連付けるためのより多くの発話をマイニングすることができる。第3のケースでは、シーディングを伴う意図マイニングは、意図シードの所定のセットに集中したマイニングを提供するために使用される。この最後のケースを使用して、所定のセット内のシード意図の各々に関連付けるための追加の発話をマイニングすることができる。
特に図10を参照すると、意図シードを使用した意図マイニングのための方法600が提供されている。例示的な実施形態では、方法600は、シード意図を受信する最初のステップ605を含む。シード意図の各々は、意図ラベル、及びサンプル意図を有する発話を含む。ステップ610において、会話データから意図を有する発話が識別される。ステップ615において、意図を有する発話から候補意図が選択される。ステップ620において、サンプル意図を有する発話からシード意図代替が識別される。次いで、ステップ625において、新しい発話がシード意図に関連付けられる。次にこれらのステップについて、以下の実施例においてより詳細に説明する。
例示的な実施形態によれば、意図シーディングを使用して会話型ボット及び意図マイニングをオーサリングするためのコンピュータ実装方法が提供される。本方法は、会話データを受信することであって、会話データが、会話から導出されたテキストを含み、会話の各々が、顧客と顧客サービス担当者との間のものである、受信することと、シード意図を含み得るシード意図データを受信することであって、シード意図の各々が、シード意図ラベルと、シード意図に関連付けられたサンプル意図を有する発話とを含む、受信することと、意図マイニングアルゴリズムを使用して、会話データを自動的にマイニングして、シード意図に関連付けるべき新しい発話を決定することと、シード意図に関連付けられたマイニングされた新しい発話を含むようにシード意図データを拡張することと、拡張されたシード意図データを会話型ボットにアップロードし、会話型ボットを使用して他の顧客との自動化された会話を行うことと、を含むことができる。
シード意図を用いたマイニングの場合、意図マイニングアルゴリズムは、会話データの会話内で発生する発話を分析して、意図を有する発話を識別することを含むことができる。発話は各々、会話内のターンを含むことができ、それによって、顧客は、顧客発話の形態で、又は顧客サービス担当者は、顧客サービス担当者発話の形態で、通信している。意図を有する発話は、意図を表現する可能性が高いと決定された発話のうちの1つとして定義され得る。意図マイニングアルゴリズムは、識別された意図を有する発話を分析して、候補意図を識別することを更に含むことができる。候補意図は各々、目的又はタスクを記述するワード又はフレーズを含み得るアクションと、アクションが動作するオブジェクト又は物事を記述するワード又はフレーズを含み得るオブジェクトとの2つの部分を有する、意図を有する発話のうちの1つ内で発生するテキストフレーズであるものとして識別される。意図マイニングアルゴリズムは、シード意図の各々について、シード意図に関連付けられたサンプル意図を有する発話からシード意図代替を識別することを更に含むことができる。シード意図代替は、目的又はタスクを記述するワード又はフレーズを含み得るアクションと、アクションが動作するオブジェクト又は物事を記述するワード又はフレーズを含み得るオブジェクトとの2つの部分を含み得る、サンプル意図を有する発話のうちの1つ内で発生するテキストフレーズであるとして識別される。意図マイニングアルゴリズムは、意図を有する発話内に存在する候補意図と、シード意図ラベルの各々に属するシード意図代替との間の意味的類似度の度合いを決定することを介して、会話データからの意図を有する発話をシード意図に関連付けることを更に含むことができる。
例示的な実施形態によれば、意図を有する発話を識別するステップは、顧客発話の第1の部分を、意図を有する発話として選択し、会話データ内の顧客発話の第2の部分を破棄することを含むことができる。顧客発話の第1の部分は、会話の各々の始めに発生する所定の数の連続する顧客発話として定義されてもよく、第2の部分は、会話の各々の残りとして定義されてもよい。意図を有する発話を識別するステップは、ワードカウント制約を満たさない顧客発話の第1の部分内の顧客発話を破棄することを更に含むことができる。ワードカウント制約は、最小ワードカウント制約であって、最小ワードカウント制約より少ないワードを有する顧客発話の第1の部分内の顧客発話が破棄される、最小ワードカウント制約、及び/又は最大ワードカウント制約であって、最大ワードカウント制約より多いワードを有する顧客発話の第1の部分内の顧客発話が破棄される、最大ワードカウント制約を含むことができる。
例示的な実施形態によれば、候補意図を識別するステップは、構文依存パーサーを使用して、意図を有する発話の文法構造を分析して、ヘッド-トークンペアを識別することであって、各ヘッド-トークンペアが、トークンワードによって修飾されたヘッドワードを含む、識別することと、意図を有する発話の品詞をタグ付けするために品詞(以下、「POS」)タグ付けを使用し、ヘッドワードのPOSタグが名詞タグを含み得、かつトークンワードのPOSタグが動詞タグを含み得るヘッド-トークンペアを候補意図として識別することと、を含むことができる。
例示的な実施形態によれば、シード意図代替を識別するステップは、構文依存パーサーを使用して、サンプル意図を有する発話の文法構造を分析して、ヘッド-トークンペアを識別することであって、各ヘッド-トークンペアが、トークンワードによって修飾されたヘッドワードを含む、識別することと、サンプル意図を有する発話の品詞をタグ付けするために品詞(以下、「POS」)タグ付けを使用し、ヘッドワードのPOSタグが名詞タグを含み得、かつトークンワードのPOSタグが動詞タグを含み得るヘッド-トークンペアを候補意図として識別することと、を含むことができる。
例示的な実施形態によれば、会話データからの意図を有する発話をシード意図に関連付けるステップは、シード意図の各々に関連して意図を有する発話の各々をカバーするために第1のプロセスを繰り返し実行することを含むことができ、第1及び第2のシード意図、並びに第1及び第2の候補意図を含む第1の意図を有する発話を伴う例示的な第1のケースに関連して記述される場合。第1のプロセスは、第1及び第2の候補意図の各々と、第1のシード意図内の意図代替の各々との間の意味的類似度の度合いをコンピュータ処理することと、第1及び第2の候補意図の各々と、第2のシード意図内の意図代替の各々との間の意味的類似度の度合いをコンピュータ処理することと、意図代替のうちのどれが最も高いコンピュータ処理された意味的類似度の度合いを作り出したかを決定することと、第1の意図を有する発話を、第1及び第2のシード意図のうち、最も高いコンピュータ処理された意味的類似度の度合いを作り出すと決定された意図代替を含む方に関連付けることと、を含むことができる。
代替使用事例では、本発明の方法は、意図マイニングアルゴリズムを使用して、シード意図の所与のセットに関連付けるための新しい発話をマイニングすることと共に、新しい意図を自動的にマイニングすることを含む。そのような場合、本方法は、マイニングされた新しい意図を含むようにシード意図データを拡張することを含むことができる。この場合、意図マイニングアルゴリズムは、1つ以上の基準に従って、シード意図のうちの1つにまだ関連付けられていない意図を有する発話(以下、「関連付けられていない意図を有する発話」)内に存在する候補意図から顕著意図を選択することと、選択された顕著意図を、顕著意図間の意味的類似度の度合いに従って顕著意図グループにグループ化することと、顕著意図グループの各々について、顕著意図のうちの1つを意図ラベルとして選択し、他の顕著意図を意図代替として指定することと、関連付けられていない意図を有する発話内に存在する候補意図と、顕著意図グループの各々内の意図代替との間の意味的類似度の度合いを決定することを介して、会話データからの関連付けられていない意図を有する発話を顕著意図グループに関連付けることと、を更に含むことができる。新しいマイニングされた意図は各々、顕著意図グループのうちの所与の1つであって、各々が、意図ラベルとして選択された顕著意図のうちの1つ、及び代替意図として指定された顕著意図のうちの他のものによって定義される、所与の1つと、顕著意図グループのうちの所与の1つに関連付けられるようになる、関連付けられていない意図を有する発話とを含むことができる。
例示的な実施形態によれば、候補意図を識別するステップは、構文依存パーサーを使用して、意図を有する発話の文法構造を分析して、ヘッド-トークンペアを識別することであって、各ヘッド-トークンペアが、トークンワードによって修飾されたヘッドワードを含む、識別することと、意図を有する発話の品詞をタグ付けするために品詞(以下、「POS」)タグ付けを使用し、ヘッドワードのPOSタグが名詞タグを含み得、かつトークンワードのPOSタグが動詞タグを含み得るヘッド-トークンペアを候補意図として識別することと、を含むことができる。
例示的な実施形態によれば、顕著意図が候補意図から選択される1つ以上の基準は、潜在的意味解析(LSA)に基づく基準を含むことができる。候補意図から顕著意図を選択するステップは、候補意図のそれぞれのものに対応する文書を有する文書のセットを生成することであって、文書の各々が、候補意図のうちの対応する1つによって定義されるアクション-オブジェクトペアをカバーする、生成することと、文書のセットに含まれるアクション-オブジェクトペアに現れる用語に基づいて概念グループを生成することと、概念グループの各々についての候補意図の各々について重み値を計算することであって、重み値が、文書のうちの所与の1つの候補意図と、概念グループのうちの所与の1つとの間の関連性の度合いを測定する、計算することと、顕著意図として、概念グループの各々における所定の数の候補意図を選択し、それに基づいてより高い度合いの関連性を示す重み値を作り出すことと、を含むことができる。
例示的な実施形態によれば、意味的類似度の度合いに従って顕著意図をグループ化するステップは、顕著意図の各々について埋め込みを計算することであって、埋め込みが、意味的に類似するテキストが類似する符号化表現を有するテキストの符号化表現を含み得る、計算することと、計算された埋め込みを比較して、顕著意図のペア間の意味的類似度の度合いを決定することと、所定の閾値を上回る意味的類似度の度合いを有する顕著意図をグループ化することと、を含むことができる。埋め込みは、顕著意図の構成要素であるヘッド-トークンペアのグローバルベクトル埋め込みの逆文書頻度(IDF)平均として計算される。計算された埋め込みを比較することは、コサイン類似度を含むことができる。
例示的な実施形態によれば、会話データからの関連付けられていない意図を有する発話を、顕著意図グループに関連付けるステップは、顕著意図グループの各々に関連して、関連付けられていない意図を有する発話の各々をカバーするために第1のプロセスを繰り返し実行することを含むことができる。第1及び第2の顕著意図グループ、並びに第1及び第2の候補意図を含む第1の関連付けられていない意図を有する発話を伴う例示的な第1のケースに関連して記述される場合、第1のプロセスは、第1及び第2の候補意図の各々と、第1の顕著意図グループ内の意図代替の各々との間の意味的類似度の度合いをコンピュータ処理することと、第1及び第2の候補意図の各々と、第2の顕著意図グループ内の意図代替の各々との間の意味的類似度の度合いをコンピュータ処理することと、意図代替のうちのどれが最も高いコンピュータ処理された意味的類似度の度合いを作り出したかを決定することと、第1の関連付けられていない意図を有する発話を、第1及び第2の顕著意図グループのうち、最も高いコンピュータ処理された意味的類似度の度合いを作り出すと決定された意図代替を含む方に関連付けることと、を含むことができる。
当業者には理解されるように、いくつかの例示的な実施形態に関連して上述した多くの様々な特徴及び構成は、本発明の他の可能な実施形態を形成するために、更に選択的に適用され得る。簡潔にするために、及び当業者の能力を考慮して、可能な反復の各々は、詳細に提供又は論じられないが、以下のいくつかの請求項によって包含される全ての組み合わせ及び可能な実施形態又はその他のものは、本出願の一部であることが意図される。更に、本発明の様々な例示的な実施形態の上記の記載から、当業者は、改良、変更、及び修正を理解するであろう。当業者の技能の範囲内のそのような改良、変更及び修正もまた、添付の特許請求の範囲によって網羅されることが意図される。更に、上記は、本出願の説明された実施形態のみに関するものであり、以下の特許請求の範囲及びその均等物によって定義される本出願の趣旨及び範囲から逸脱することなく、本明細書において多数の変更及び修正を行うことができることは明らかであろう。

(関連出願の相互参照)
本出願は、2021年3月31日に出願された「SYSTEMS AND METHODS RELATING TO BOT AUTHORING BY MINING INTENTS FROM NATURAL LANGUAGE CONVERSATIONS」と題する係属中の米国特許出願第17/218,456号に変換された、2020年9月25日に米国特許商標庁に出願された「SYSTEMS AND METHODS RELATING TO BOT AUTHORING AND/OR AUTOMATING THE MINING OF INTENTS FROM NCONVERSATION DATA VIA INTENT SEEDING」と題する米国特許仮出願第63/083,561号に関する。
本発明は、概して、インターネットベースのサービスオプションを介した顧客支援など顧客関係管理の分野における電気通信システムに関する。より詳細には、限定するものではないが、本発明は、ボットオーサリングワークフローを自動化し、かつ/又は意図シーディングプロセスを使用して自然言語会話データから意図及び関連付けられた発話をマイニングするための意図マイニングプロセスを実装するためのシステム及び方法に関する。
本発明は、会話型ボットをオーサリングするためのコンピュータ実装方法を含み、意図シーディングを使用した意図マイニングが提供される。本方法は、会話データを受信することであって、会話データが、会話から導出されたテキストを含み、会話の各々が、顧客と顧客サービス担当者との間のものである、受信することと、シード意図を含み得るシード意図データを受信することであって、シード意図の各々が、シード意図ラベルと、シード意図に関連付けられたサンプル意図を有する発話とを含む、受信することと、意図マイニングアルゴリズムを使用して、会話データを自動的にマイニングして、シード意図に関連付ける新しい発話を決定することと、シード意図に関連付けられたマイニングされた新しい発話を含むようにシード意図データを拡張することと、拡張されたシード意図データを会話型ボットにアップロードし、会話型ボットを使用して他の顧客との自動化された会話を行うことと、を含むことができる。意図マイニングアルゴリズムは、会話データの会話内で発生する発話を分析して、意図を有する発話を識別することを含むことができる。発話は各々、会話内のターンを含むことができ、それによって、顧客は、顧客発話の形態で、又は顧客サービス担当者は、顧客サービス担当者発話の形態で、通信している。意図を有する発話は、意図を表現する可能性が高いと決定された発話のうちの1つとして定義され得る。意図マイニングアルゴリズムは、識別された意図を有する発話を分析して、候補意図を識別することを更に含むことができる。候補意図は各々、目的又はタスクを記述するワード若しくはフレーズを含み得るアクションと、アクションが動作するオブジェクト又は物事を記述するワード若しくはフレーズを含み得るオブジェクトとの2つの部分を有する、意図を有する発話のうちの1つ内で発生するテキストフレーズであるものとして識別される。意図マイニングアルゴリズムは、シード意図の各々について、シード意図に関連付けられたサンプル意図を有する発話からシード意図代替を識別することを更に含むことができる。シード意図代替は、目的又はタスクを記述するワード若しくはフレーズを含み得るアクションと、アクションが動作するオブジェクト又は物事を記述するワード若しくはフレーズを含み得るオブジェクトとの2つの部分を含み得る、サンプル意図を有する発話のうちの1つ内で発生するテキストフレーズであるものとして識別される。意図マイニングアルゴリズムは、意図を有する発話内に存在する候補意図と、シード意図ラベルの各々に属するシード意図代替との間の意味的類似度の度合いを決定することを介して、会話データからの意図を有する発話をシード意図に関連付けることを更に含むことができる。
本出願のこれら及び他の特徴は、図面及び添付の特許請求の範囲と併せて、例示的な実施形態の以下の詳細な記載を検討することにより、より明らかになるであろう。
本発明のより完全な理解は、本発明が、同様の参照記号が同様の構成要素を示す添付図面と併せて考慮されるときに、以下の詳細な記載を参照することによってより良好に理解されるため、より容易に明らかになるであろう。
本発明の例示的な実施形態による、及び/又は本発明の例示的な実施形態が可能にされ得る若しくは実施され得るコンピューティングデバイスの概略ブロック図を示す。 本発明の例示的な実施形態による、及び/又は本発明の例示的実施形態が可能にされ得る若しくは実施され得る通信インフラストラクチャ又はコンタクトセンターの概略ブロック図を示す。 本発明の実施形態による、チャットシステムの一部として動作するチャットサーバの更なる詳細を示す概略ブロック図である。 本発明の実施形態によるチャットモジュールの概略ブロック図である。 本発明の実施形態による例示的な顧客チャットインターフェースである。 本発明の実施形態による顧客自動化システムのブロック図である。 本発明の実施形態による、顧客のためにインタラクションを自動化するための方法のフローチャートである。 会話型ボットをオーサリングするためのワークフローである。 本発明による意図マイニングのための例示的なフローチャートである。 本発明による、意図をシーディングすることによる意図マイニングのための例示的なフローチャートである。
本発明の原理の理解を促進する目的で、ここでは図面に例解される例示的な実施形態を参照し、具体的な文言を使用してその記載を行う。しかしながら、実施例において提供される詳細な材料が、本発明を実施するために必要とされない場合があることは、当業者には明らかであろう。他の例では、本発明を不明瞭にすることを避けるために、周知の材料又は方法は、詳細には記載されていない。追加的に、本明細書に提示されるように、提供される実施例又は本発明の原理の適用における更なる修正は、当業者に通常想起されるように企図される。
本明細書で使用される場合、非限定的な実施例及び例示を指定する言語は、「例えば(e.g.)」、「すなわち(i.e.)」、「例えば(for example)」、「例えば(for instance)」などを含む。更に、本明細書を通じて、「実施形態」、「一実施形態」、「本実
施形態」、「例示的な実施形態」、「特定の実施形態」などへの言及は、所与の実施例に関連して記載の特定の特徴、構造、又は特性が、本発明の少なくとも1つの実施形態に含まれ得ることを意味する。したがって、「実施形態」、「一実施形態」、「本実施形態」、「例示的な実施形態」、「特定の実施形態」などの語句の出現は、必ずしも同じ実施形態又は実施例を指すわけではない。更に、特定の特徴、構造又は特性は、1つ以上の実施形態若しくは実施例において、任意の好適な組み合わせ及び/又は部分的組み合わせで組み合わされ得る。
当業者は、本開示から、種々の実施形態が、多くの異なるタイプのデータ処理機器を使用してコンピュータ実装され得、実施形態は、装置、方法、又はコンピュータプログラム製品として実装されることを認識するであろう。したがって、例示的な実施形態は、完全にハードウェアの実施形態、完全にソフトウェアの実施形態、又はソフトウェア態様とハードウェア態様とを組み合わせた実施形態の形態をとり得る。例示的な実施形態は、更に、任意の有形の表現媒体においてコンピュータ使用可能プログラムコードによって具現化されるコンピュータプログラム製品の形態をとり得る。いずれの場合も、例示的な実施形態は、概して「モジュール」、「システム」、又は「方法」と称され得る。
図に提供されるフローチャート及びブロック図は、本発明の例示的な実施形態によるシステム、方法、及びコンピュータプログラム製品の可能な実装のアーキテクチャ、機能、及び動作を例解する。この点に関して、フローチャート及び/又はブロック図の各ブロック又はそれらのブロックの組み合わせは、指定された論理機能を実装するための1つ以上の実行可能命令を有するプログラムコードのモジュール、セグメント、又は部分を表し得ることが理解されるであろう。同様に、フローチャート及び/又はブロック図のブロックの各々又はそれらのブロックの組み合わせは、特定の動作又は機能を実行する専用ハードウェアベースのシステム又は専用ハードウェアとコンピュータ命令との組み合わせによって実装され得ることが理解されるであろう。そのようなコンピュータプログラム命令はまた、コンピュータ可読媒体内のプログラム命令が、フローチャート及び/又はブロック図の各ブロック又はそれらのブロックの組み合わせで指定された機能又は動作が実装される命令を含む製品を作り出すように、コンピュータ又は他のプログラム可能データ処理装置に特定の方法で機能するように指示することができるコンピュータ可読媒体内に記憶され得る。
コンピューティングデバイス
本発明のシステム及び方法は、適切なソフトウェアプログラムを実行する、多くの異なる形態のデータ処理機器、例えば、デジタルマイクロプロセッサ及び関連メモリを使用してコンピュータ実装され得ることが理解されるであろう。背景として、図1は、本発明の実施形態による、及び/又は、それらの実施形態が可能にされ得る若しくは実施され得る例示的なコンピューティングデバイス100の概略ブロック図を例解する。図1は、非限定的な実施例として提供されることを理解されたい。
コンピューティングデバイス100は、例えば、ファームウェア(例えば、特定用途向け集積回路)、ハードウェア、又はソフトウェア、ファームウェア、及びハードウェアの組み合わせを介して実装され得る。以下の図におけるサーバ、コントローラ、スイッチ、ゲートウェイ、エンジン、及び/又はモジュール(集合的にサーバ又はモジュールと称され得る)の各々は、コンピューティングデバイス100のうちの1つ以上を介して実装され得ることが理解されるであろう。実施例として、様々なサーバは、本明細書に記載の様々な機能を実行するためにコンピュータプログラム命令を実行し、かつ他のシステム又はモジュールと相互作用し得る、1つ以上のコンピューティングデバイス100のうちの1つ以上のプロセッサ上で動作するプロセスであり得る。特に限定されない限り、複数のコンピューティングデバイスに関連して記載される機能は、単一のコンピューティングデバイスに統合され得るか、又は単一のコンピューティングデバイスに関連して記載される様々な機能は、いくつかのコンピューティングデバイスにわたって分散され得る。更に、以下の図に記載されたコンピューティングシステム、例えば、図2のコンタクトセンターシステム200などに関連して、それの様々なサーバ及びコンピュータデバイスは、ローカルコンピューティングデバイス100(すなわち、現場で若しくはコンタクトセンターエージェントと同じ物理的場所で)、リモートコンピューティングデバイス100(すなわち、現場から離れて若しくはクラウドコンピューティング環境において、例えば、ネットワークを介してコンタクトセンターに接続されたリモートデータセンターにおいて)又はそれらのいくつかの組み合わせ上に位置し得る。現場から離れたコンピューティングデバイス上に位置するサーバによって提供される機能は、あたかもそのようなサーバが現場にあるかのように、仮想プライベートネットワーク(virtual private network、VPN
)を介してアクセスされ、及び提供され得、又は機能は、拡張可能マークアップ言語(extensible markup language、XML)、JSONなどを介してデータを交換することによってなど、様々なプロトコルを使用してインターネット上でアクセスされるサービスとしてのソフトウェア(software as a service、SaaS)を使用して提供され得る。
例解された実施例に示されるように、コンピューティングデバイス100は、中央処理ユニット(central processing unit、CPU)又はプロセッサ105及びメインメモ
リ110を含み得る。コンピューティングデバイス100はまた、記憶デバイス115と、リムーバブルメディアインターフェース120と、ネットワークインターフェース125と、I/Oコントローラ130と、示されるように、表示デバイス135Aと、キーボード135Bと、ポインティングデバイス135Cとを含み得る、1つ以上の入力/出力(input/output、I/O)デバイス135とを含み得る。コンピューティングデバイス100は、更に、メモリポート140、ブリッジ145、I/Oポート、1つ以上の追加の入力/出力デバイス135D、135E、135F、及びプロセッサ105と通信するキャッシュメモリ150など、追加の要素を含み得る。
プロセッサ105は、メインメモリ110からフェッチされた命令に応答し、及び処理する任意の論理回路であり得る。例えば、プロセス105は、集積回路、例えば、マイクロプロセッサ、マイクロコントローラ、若しくはグラフィック処理ユニットによって、又はフィールドプログラマブルゲートアレイ若しくは特定用途向け集積回路において実装され得る。示されるように、プロセッサ105は、二次バス又はバックサイドバスを介してキャッシュメモリ150と直接通信し得る。キャッシュメモリ150は、典型的には、メインメモリ110よりも速い応答時間を有する。メインメモリ110は、データを記憶することが可能であり、記憶されたデータが中央処理ユニット105によって直接アクセスされることを可能にする1つ以上のメモリチップであり得る。記憶デバイス115は、スケジューリングタスク及びシステムリソースへのアクセスを制御するオペレーティングシステム、及び他のソフトウェアのための記憶装置を提供し得る。特に限定されない限り、コンピューティングデバイス100は、本明細書に記載の機能性を実行することが可能なオペレーティングシステム及びソフトウェアを含み得る。
例解された実施例において示されるように、コンピューティングデバイス100は、多種多様なI/Oデバイス135を含み得、それらのうちの1つ以上は、I/Oコントローラ130を介して接続され得る。入力デバイスは、例えば、キーボード135Bと、ポインティングデバイス135C、例えば、マウス又は光学ペンを含み得る。出力デバイスは、例えば、ビデオ表示デバイスと、スピーカと、プリンタとを含み得る。I/Oデバイス135及び/又はI/Oコントローラ130は、複数の表示デバイスの使用を可能にするための好適なハードウェア及び/又はソフトウェアを含み得る。コンピューティングデバイス100はまた、ディスクドライブ、USBポート、又はコンピュータ可読メディアからデータを読み取るか、若しくはコンピュータ可読メディアにデータを書き込むための好適な任意の他のデバイスなど、1つ以上のリムーバブルメディアインターフェース120をサポートし得る。より概して、I/Oデバイス135は、本明細書に記載の機能を実行するための任意の従来のデバイスを含み得る。
コンピューティングデバイス100は、任意のワークステーション、デスクトップコンピュータ、ラップトップ若しくはノートブックコンピュータ、サーバマシン、仮想マシン、モバイル若しくはスマートフォン、ポータブル電気通信デバイス、メディア再生デバイス、ゲームシステム、モバイルコンピューティングデバイス、又は本書に記載の動作及び機能を実行することが可能である、任意の他のタイプのコンピューティング、電気通信、若しくはメディアデバイスであり得るが、これらに限定されない。コンピューティングデバイス100は、ネットワークによって接続された、又はネットワークを介して他のシステム及びリソースに接続された複数のデバイスを含む。本明細書で使用される場合、ネットワークは、1つ以上の他のコンピューティングデバイス、マシン、クライアント、クライアントノード、クライアントマシン、クライアントコンピュータ、クライアントデバイス、エンドポイント、又はエンドポイントノードと通信する、1つ以上のコンピューティングデバイス、マシン、クライアント、クライアントノード、クライアントマシン、クライアントコンピュータ、クライアントデバイス、エンドポイント、又はエンドポイントノードを含む。例えば、ネットワークは、プライベート又は公衆交換電話網(public switched telephone network、PSTN)、無線キャリアネットワーク、ローカルエリアネ
ットワーク(local area network、LAN)、プライベート広域ネットワーク(wide area network、WAN)、インターネットなどの公衆WANなどであってもよく、適切な通
信プロトコルを使用して接続が確立される。より一般的には、特に限定されない限り、コンピューティングデバイス100は、任意の従来の通信プロトコルを使用して任意のタイプのネットワークを介して他のコンピューティングデバイス100と通信し得ることを理解されたい。更に、ネットワークは、様々なネットワーク構成要素が仮想化される仮想ネットワーク環境であり得る。例えば、様々なマシンは、物理マシン上で動作するソフトウェアベースのコンピュータとして実装された仮想マシンであってもよく、又は複数の仮想マシンが同じホスト物理マシン上で動作する「ハイパーバイザ」タイプの仮想化が使用されてもよい。他のタイプの仮想化も企図される。
コンタクトセンター
ここで図2を参照すると、本発明の例示的な実施形態による、及び/又は本発明の例示的な実施形態が可能にされ得る若しくは実施され得る通信インフラストラクチャ又はコンタクトセンターシステム200が示されている。本明細書では、「コンタクトセンターシステム」という用語は、図2に示すシステム及び/又はその構成要素を指すために使用される一方、「コンタクトセンター」という用語は、より一般的に、コンタクトセンターシステム、これらのシステムを動作させる顧客サービスプロバイダ、及び/又はそれらに関連付けられた組織若しくは企業を指すために使用されることを理解されたい。したがって、特に限定されない限り、「コンタクトセンター」という用語は、概して、コンタクトセンターシステム(コンタクトセンターシステム200など)、関連する顧客サービスプロバイダ(コンタクトセンターシステム200を通して顧客サービスを提供する特定の顧客サービスプロバイダなど)、並びに顧客サービスが代理で提供されている組織又は企業を指す。
背景として、顧客サービスプロバイダは、概して、コンタクトセンターを通して多くのタイプのサービスを提供する。そのようなコンタクトセンターは、従業員若しくは顧客サービスエージェント(又は単に「エージェント」)が配置され得、エージェントは、会社、企業、政府機関、又は組織(以下、互換的に「組織」又は「企業」と称される)と、ユーザ、個人、又は顧客などの人々(以下、互換的に「個人」又は「顧客」と称される)との間のインターフェースとして機能する。例えば、コンタクトセンターのエージェントは、購入の決定、注文の受け付け、又は既に受け取った製品若しくはサービスに関する問題を解決する際に顧客を支援することができる。コンタクトセンター内では、コンタクトセンターエージェントと外部エンティティ又は顧客との間のそのようなインタラクションは、例えば、音声(例えば、電話コール又は音声オーバーIP、すなわち、VoIPコール)、ビデオ(例えば、ビデオ会議)、テキスト(例えば、電子メール及びテキストチャット)、画面共有、コブラウジングなどを介してのような、様々な通信チャネルを介して行われ得る。
運用上、コンタクトセンターは、一般に、コストを最小限に抑えながら、質の高いサービスを顧客に提供するように努力する。例えば、コンタクトセンターが動作する1つの方法が、ライブエージェントとの全顧客インタラクションを取り扱うことである。このアプローチは、サービス品質の観点から十分に成功し得る一方、エージェントの労働の高いコストに起因して、法外に高価となる可能性が高いであろう。このため、ほとんどのコンタクトセンターは、ライブエージェントの代わりに、例えば、双方向音声応答(interactive voice response、IVR)システム、双方向メディア応答(interactive media response、IMR)システム、インターネットロボット、すなわち、「ボット」、自動チャットモジュール、すなわち、「チャットボット」など、あるレベルの自動プロセスを利用する。多くの場合、これは、自動プロセスが、特定のタイプのインタラクションを取り扱うのに非常に効率的であり、ライブエージェントの必要性を低減するのに効果的であり得るため、成功戦略であることが証明されている。そのような自動化により、コンタクトセンターが、人間のエージェントの使用をより困難な顧客インタラクションに標的化することを可能にする一方で、自動プロセスは、より反復的又は日常的なタスクを取り扱う。更に、自動プロセスは、効率を最適化し、繰り返し性を促進する方法で構造化され得る。人間のエージェント、すなわち、ライブエージェントは、特定の質問に応える、若しくは特定の詳細を徹底的に追及することを忘れ得るが、そのような誤りは、典型的には、自動プロセスの使用を通して回避される。顧客サービスプロバイダは、顧客とインタラクションする自動プロセスにますます依存する一方、顧客によるそのような技術の使用は、はるかに未発達のままである。したがって、インタラクションのコンタクトセンター側では、IVRシステム、IMRシステム、及び/又はボットが使用されて、インタラクションの部分を自動化する一方、顧客側のアクションは、顧客が手動で実施するままである。
図2を具体的に参照して、コンタクトセンターシステム200は、様々なタイプのサービスを顧客に提供するために、顧客サービスプロバイダによって使用され得る。例えば、コンタクトセンターシステム200は、自動プロセス(若しくはボット)又は人間のエージェントが顧客と通信するインタラクションに携わる、及びインタラクションを管理するために使用され得る。理解されるように、コンタクトセンターシステム200は、企業を通して利用可能な製品及びサービスに関連する販売及び顧客サービスの機能を実施するためのビジネス又は企業の社内施設であり得る。別の態様では、コンタクトセンターシステム200は、別の組織に代わってサービスを提供するように契約するサードパーティサービスプロバイダによって運用され得る。更に、コンタクトセンターシステム200は、企業又はサードパーティサービスプロバイダ専用の機器上に配備され、かつ/又は、例えば、複数の企業のために複数のコンタクトセンターをサポートするためのインフラストラクチャを備えたプライベート若しくはパブリッククラウド環境などのリモートコンピューティング環境内に配備され得る。コンタクトセンターシステム200は、構内で若しくはリモートで、又はそれらの何らかの組み合わせで実行され得るソフトウェアアプリケーション若しくはプログラムを含み得る。更に、コンタクトセンターシステム200の様々な構成要素は、様々な地理的位置にわたって分散され得、必ずしも単一の場所又はコンピューティング環境に含まれるわけではないことを理解されたい。
更に、特に別様に限定されない限り、本発明のコンピューティング要素のいずれかは、クラウドベース又はクラウドコンピューティング環境内に実装され得ることを理解されたい。本明細書で使用される場合、「クラウドコンピューティング」又は単に「クラウド」は、仮想化を介して迅速にプロビジョンされ、最小限の管理努力若しくはサービスプロバイダインタラクションでリリースされ、次いで適宜スケーリングされることができる、構成可能なコンピューティングリソース(例えば、ネットワーク、サーバ、記憶装置、アプリケーション、及びサービス)の共有プールへのユビキタスで便利なオンデマンドのネットワークアクセスを可能にするためのモデルとして定義される。クラウドコンピューティングは、様々な特性(例えば、オンデマンドセルフサービス、広域ネットワークアクセス、リソースプーリング、迅速な弾力性、測定可能なサービスなど)、サービスモデル(例えば、サービスとしてのソフトウェア(「SaaS」)、サービスとしてのプラットフォーム(Platform as a Service、「PaaS」)、サービスとしてのインフラストラク
チャ(Infrastructure as a Service、「IaaS」)、及び配備モデル(例えば、プラ
イベートクラウド、コミュニティクラウド、パブリッククラウドなど)で構成され得る。「サーバレスアーキテクチャ」としばしば称されるクラウド実行モデルは、一般に、所望の機能を達成するために、リモートサーバの割り当て及びプロビジョニングを動的に管理するサービスプロバイダを含む。
図2の例解された実施例によると、コンタクトセンター200の構成要素又はモジュールは、複数の顧客デバイス205A、205B、205Cと、通信ネットワーク(又は単に「ネットワーク」)210と、スイッチ/メディアゲートウェイ212と、コールコントローラ214と、双方向メディア応答(IMR)サーバ216と、ルーティングサーバ218と、記憶デバイス220と、統計(又は「stat」)サーバ226と、ワークビン(workbin)232A、232B、232Cをそれぞれ含む複数のエージェントデバイス230A、230B、230Cと、マルチメディア/ソーシャルメディアサーバ234と、知識システム238に結合された知識管理サーバ236と、チャットサーバ240と、ウェブサーバ242と、インタラクション(又は「iXn」)サーバ244と、ユニバーサルコンタクトサーバ(又は、「universal contact server、UCS」)246と、レポーティングサーバ248と、メディアサービスサーバ249と、分析モジュール250と、を含み得る。図2に関連して、又は以下の図のいずれかに記載されるコンピュータ実装構成要素、モジュール、若しくはサーバのいずれかは、例えば、図1のコンピューティングデバイス100などのタイプのコンピューティングデバイスを介して実装され得ることを理解されたい。理解されるように、コンタクトセンターシステム200は、一般に、電話、電子メール、チャット、又は他の通信機構を介したサービスの配信を可能にするために、リソース(例えば、人材、コンピュータ、電気通信機器など)を管理する。そのようなサービスは、コンタクトセンターのタイプに応じて変化し得、例えば、顧客サービス、ヘルプデスク機能、緊急応答、テレマーケティング、受注などを含み得る。
コンタクトセンターシステム200からサービスを受けることを所望する顧客は、顧客デバイス205を介して、コンタクトセンターシステム200へのインバウンド通信(例えば、電話コール、電子メール、チャットなど)を開始し得る。図2は、3つのそのような顧客デバイス、すなわち、顧客デバイス205A、205B、及び205Cを示すが、任意の数が存在し得ることを理解されたい。顧客デバイス205は、例えば、電話、スマートフォン、コンピュータ、タブレット、又はラップトップなどの通信デバイスであり得る。本明細書に記載の機能によれば、顧客は、一般に、顧客デバイス205を使用して、電話コール、電子メール、チャット、テキストメッセージ、ウェブブラウジングセッション、及び他のマルチメディアトランザクションなど、コンタクトセンターシステム200との通信を開始、管理、及び実行し得る。
顧客デバイス205に対するインバウンド及びアウトバウンド通信は、典型的には、ネットワークの性質が使用されている顧客デバイスのタイプ及び通信の形態に依存している、ネットワーク210を横断し得る。一例として、ネットワーク210としては、電話、セルラ、及び/又はデータサービスの通信ネットワークが挙げられ得る。ネットワーク210は、プライベート若しくは公衆交換電話網(PSTN)、ローカルエリアネットワーク(LAN)、プライベートワイドエリアネットワーク(WAN)、及び/又はインターネットなどのパブリックWANであり得る。更に、ネットワーク210は、符号分割多重アクセス(code division multiple access、CDMA)ネットワーク、モバイル通信
のためのグローバルシステム(global system for mobile communications、GSM)ネ
ットワーク、又は3G、4G、LTE、5Gなどを含むが、これらに限定されない、当該技術分野で慣用の任意の無線ネットワーク/技術を含む、無線キャリアネットワークを含み得る。
スイッチ/メディアゲートウェイ212に関して、それは、顧客とコンタクトセンターシステム200との間の電話コールを受信及び伝送するために、ネットワーク210に結合され得る。スイッチ/メディアゲートウェイ212としては、センター内でのエージェントレベルルーティングのための中央スイッチとして機能するように構成された電話スイッチ又は通信スイッチが挙げられ得る。スイッチは、ハードウェアスイッチングシステムであるか、又はソフトウェアを介して実装され得る。例えば、スイッチ215は、自動コールディストリビュータ、構内交換機(private branch exchange、PBX)、IPベ
ースのソフトウェアスイッチ、及び/若しくは顧客からインターネットソース型インタラクション並びに/又は電話網ソース型インタラクションを受信し、これらのインタラクションを、例えば、エージェントデバイス230のうちの1つにルーティングするように構成された専用ハードウェア及びソフトウェアを有する任意の他のスイッチを含み得る。したがって、一般に、スイッチ/メディアゲートウェイ212は、顧客デバイス205とエージェントデバイス230との間の接続を確立することによって、顧客とエージェントとの間の音声接続を確立する。
更に示すように、スイッチ/メディアゲートウェイ212は、例えば、コンタクトセンターシステム200のスイッチと他のルーティング、監視、及び通信処理構成要素との間のアダプタ又はインターフェースとして機能するコールコントローラ214に結合され得る。コールコントローラ214は、PSTNコール、VoIPコールなどを処理するように構成され得る。例えば、コールコントローラ214は、スイッチ/メディアゲートウェイ及び他の構成要素とインターフェースするためのコンピュータ電話統合(computer-telephone integration、CTI)ソフトウェアを含み得る。コールコントローラ214は、セッション開始プロトコル(session initiation protocol、SIP)コールを処理す
るためのSIPサーバを含み得る。コールコントローラ214はまた、顧客の電話番号、IPアドレス、又は電子メールアドレスなどの入来インタラクションに関するデータを抽出し、次いで、インタラクションを処理する際に、これらを他のコンタクトセンター構成要素と通信することができる。
双方向メディア応答(IMR)サーバ216に関して、それは、自己ヘルプ又は仮想アシスタント機能を可能にするように構成され得る。具体的には、IMRサーバ216は、IMRサーバ216が音声に制限されず、様々なメディアチャネルもカバーし得ることを除いて、双方向音声応答(IVR)サーバと同様であり得る。音声を説明する例では、IMRサーバ216は、顧客に顧客のニーズを問い合わせるためのIMRスクリプトで構成され得る。例えば、銀行のコンタクトセンターは、顧客が自分の預金残高を取得したい場合は「1を押す」ように、IMRスクリプトを介して顧客に伝え得る。IMRサーバ216との継続的なインタラクションを介して、顧客は、エージェントと話をする必要なしに、サービスを受けることできる。IMRサーバ216はまた、通信が、適切なリソースにルーティングされ得るように、顧客がコンタクトセンターに接触している理由を確認するように構成され得る。
ルーティングサーバ218に関して、それは、入来インタラクションをルーティングするように機能し得る。例えば、インバウンド通信が、人間のエージェントによって処理されるべきであることが決定されると、ルーティングサーバ218内の機能は、最も適切なエージェントを選択して、通信をそのエージェントにルーティングし得る。このエージェント選択は、どの利用可能なエージェントが通信を取り扱うために最適であるかに基づき得る。より具体的には、適切なエージェントの選択は、ルーティングサーバ218によって実装されるルーティング戦略又はアルゴリズムに基づき得る。これを行う際に、ルーティングサーバ218は、入来インタラクションに関連するデータ、例えば、特定の顧客、利用可能なエージェント、及びインタラクションのタイプに関連するデータを問い合わせし得、このデータは、以下でより記載されるように、特定のデータベースに記憶され得る。エージェントが選択されると、ルーティングサーバ218は、コールコントローラ214とインタラクションして、入来インタラクションを、対応するエージェントデバイス230にルーティング(すなわち、接続)し得る。この接続の一部として、顧客に関する情報が、選択されたエージェントに、それらのエージェントデバイス230を介して提供され得る。この情報は、エージェントが顧客に提供できるサービスを強化することを意図している。
データ記憶に関して、コンタクトセンターシステム200は、データをコンタクトセンターの機能に関連する1つ以上のデータベースに記憶するための、概して、記憶デバイス220によって表される、1つ以上の大容量記憶デバイスを含み得る。例えば、記憶デバイス220は、顧客データベース222に維持される顧客データを記憶し得る。そのような顧客データは、顧客プロファイル、連絡先情報、サービスレベル合意書(service level agreement、SLA)、並びにインタラクション履歴(例えば、以前のインタラクシ
ョンの性質、処分データ、待ち時間、処理時間、及び顧客の問題を解決するためにコンタクトセンターによって取られたアクションを含む、特定の顧客との以前のインタラクションの詳細)を含み得る。別の実施例として、記憶デバイス220は、エージェントデータをエージェントデータベース223に記憶し得る。コンタクトセンターシステム200によって維持されるエージェントデータは、エージェント可用性及びエージェントプロファイル、スケジュール、スキル、処理時間などを含み得る。別の実施例として、記憶デバイス220は、インタラクションデータをインタラクションデータベース224に記憶し得る。インタラクションデータは、顧客とコンタクトセンターとの間の多数の過去のインタラクションに関連するデータを含み得る。より一般的には、特に指定されない限り、記憶デバイス220は、データベースを含み、かつ/又は本明細書に記載の情報のタイプのいずれかに関連するデータを記憶するように構成され得、これらのデータベース及び/又はデータは、本明細書に記載の機能を容易にする方法で、コンタクトセンターシステム200の他のモジュール又はサーバにアクセス可能であることを理解されたい。例えば、コンタクトセンターシステム200のサーバ又はモジュールは、その中に記憶されたデータを検索するか、又は記憶するためにデータをそこに伝送するために、そのようなデータベースを問い合わせし得る。記憶デバイス220は、例えば、任意の従来の記憶媒体の形態をとり得、ローカルに収容されるか、又はリモート位置から操作され得る。一例として、データベースは、Cassandraデータベース、NoSQLデータベース、又はSQLデータベースであり、Oracle、IBM DB2、Microsoft SQLサーバ、又はMicrosoft Access、PostgreSQLなどのデータベース管理システムによって管理され得る。
statサーバ226に関して、それは、コンタクトセンターシステム200の性能及び動作態様に関連するデータを記録及び集計するように構成され得る。そのような情報は、statサーバ226によってコンパイルされ、他のサーバ及びモジュール、例えば、レポーティングサーバ248に利用可能にされ得、次いで、レポーティングサーバ248は、データを使用して、コンタクトセンターの動作態様を管理し、本明細書に記載の機能に従って自動化されたアクションを実行するために使用されるレポートを作り出し得る。そのようなデータは、コンタクトセンターのリソースの状態、例えば、平均待ち時間、破棄率、エージェントの占有率、及び本明細書に記載の機能が必要とするであろうその他に関連し得る。
コンタクトセンター200のエージェントデバイス230は、本明細書に記載の機能を容易にする方法で、コンタクトセンターシステム200の様々な構成要素及びモジュールとインタラクションするように構成された通信デバイスであり得る。例えば、エージェントデバイス230は、通常の電話コール又はVoIPコールに適合された電話を含み得る。エージェントデバイス230は、コンタクトセンターシステム200のサーバと通信し、動作に関連付けられたデータ処理を実施し、本明細書に記載の機能に従って、音声、チャット、電子メール、及び他のマルチメディア通信機構を介して顧客とインターフェース接続するように構成されたコンピューティングデバイスを更に含み得る。図2は、3つのそのようなエージェントデバイス、すなわち、エージェントデバイス230A、230B、及び230Cを示すが、任意の数が存在し得ることを理解されたい。
マルチメディア/ソーシャルメディアサーバ234に関して、それは、顧客デバイス205及び/又はサーバ242との(音声以外の)メディアインタラクションを容易にするように構成され得る。そのようなメディアインタラクションは、例えば、電子メール、音声メール、チャット、ビデオ、テキストメッセージング、ウェブ、ソーシャルメディア、コブラウジングなどに関連し得る。マルチメディア/ソーシャルメディアサーバ234は、マルチメディアイベント及び通信を受信、処理、及び転送するための専用ハードウェア及びソフトウェアを有する、当該技術分野で慣用の任意のIPルータの形態をとり得る。
知識管理サーバ234に関して、それは、顧客と知識システム238との間のインタラクションを容易にするように構成され得る。概して、知識システム238は、質問又はクエリを受信し、それに応じて回答を提供することができるコンピュータシステムであり得る。知識システム238は、コンタクトセンターシステム200の一部として含まれるか、又はサードパーティによってリモートで操作され得る。知識システム238は、当該技術分野で既知のように、参考資料として知識システム238に提出された百科事典、辞書、ニュースワイヤ記事、文学作品、又は他の文書など情報源から情報を取得することによって、自然言語で提示された質問に回答することができる人工知能コンピュータシステムを含み得る。実施例として、知識システム238は、IBM Watson又は同様のシステムとして具現化され得る。
チャットサーバ240に関して、それは、顧客との電子チャット通信を実施し、調整し(orchestrate)、及び管理するように構成され得る。一般に、チャットサーバ240
は、チャット会話を実装及び維持し、チャットトランスクリプトを生成するように構成されている。そのようなチャット通信は、顧客が、自動化されたチャットボット、人間のエージェント、又はその両方と通信するような方法で、チャットサーバ240によって行われ得る。例示的な実施形態では、チャットサーバ240は、チャットボット及び利用可能な人間のエージェントの間にチャット会話をディスパッチするチャットオーケストレーションサーバとして機能し得る。そのような場合、チャットサーバ240の処理ロジックは、利用可能なチャットリソース間でインテリジェントなワークロード分配を活用するために、そのように駆動されるルールであり得る。チャットサーバ240は更に、顧客デバイス205又はエージェントデバイス230のいずれかで生成されるそれらのユーザインターフェース(UIとも称する)を含む、チャット機能に関連するUIを実装し、管理し、及び促進し得る。チャットサーバ240は、特定の顧客との単一のチャットセッション内で、例えば、チャットセッションが、チャットボットから人間のエージェントに、又は人間のエージェントからチャットボットに転送するように、チャットを自動ソースと人間ソースとの間で転送するように構成され得る。チャットサーバ240はまた、例えば、関連する記事へのリンクが提供され得るように、チャット中に顧客によって提示された問い合わせに対する提案及び回答を受信するために、知識管理サーバ234及び知識システム238に結合され得る。
ウェブサーバ242に関して、そのようなサーバは、Facebook、Twitter、Instagramなど、顧客が予約購読する(subscribe)様々なソーシャルイ
ンタラクションサイトのサイトホストを提供するために含まれ得る。コンタクトセンターシステム200の一部として示されているが、ウェブサーバ242は、サード-パーティによって提供され得、及び/又はリモートで維持され得ることを理解されたい。ウェブサーバ242はまた、コンタクトセンターシステム200によってサポートされている企業又は組織のウェブページを提供し得る。例えば、顧客は、ウェブページを閲覧して、特定の企業の製品及びサービスに関する情報を受信し得る。そのような企業のウェブページ内で、例えば、ウェブチャット、音声、又は電子メールを介して、コンタクトセンターシステム200とのインタラクションを開始するための機構が提供され得る。そのような機構の一例が、ウェブサーバ242上にホストされるウェブページ又はウェブサイト上に展開され得るウィジェットである。本明細書で使用される場合、ウィジェットは、特定の機能を実施するユーザインターフェース構成要素を指す。いくつかの実装例では、ウィジェットは、インターネットを介して顧客に表示されたウェブページ上にオーバーレイされ得るグラフィカルユーザインターフェースコントロールを含み得る。ウィジェットは、ウィンドウ又はテキストボックスなどに情報を示すか、又はファイルを共有若しくは開くこと、又は通信を開始することなど、特定の機能にユーザがアクセスすることを可能にするボタン又は他のコントロールを含み得る。いくつかの実装例では、ウィジェットは、コンパイルなしで別個のウェブページ内にインストールされ、かつ実行され得るコードの可搬部分を有するユーザインターフェース構成要素を含む。いくつかのウィジェットは、対応する又は追加のユーザインターフェースを含み得、様々なローカルリソース(例えば、顧客デバイス上のカレンダー若しくはコンタクト情報)又はネットワークを介してリモートリソース(例えば、インスタントメッセージング、電子メール、又はソーシャルネットワーキングアップデート)にアクセスするように構成され得る。
インタラクション(iXn)サーバ244に関して、それは、コンタクトセンターの延期可能なアクティビティ、及び完了のための、そのアクティビティの人間のエージェントへのルーティングを管理するように構成され得る。本明細書で使用される場合、延期可能なアクティビティとは、オフラインで実行されることができるバックオフィスワーク、例えば、電子メールに対応すること、訓練に参加すること、及び顧客とのリアルタイム通信を伴わない他のアクティビティを含む。実施例として、インタラクション(iXn)サーバ244は、延期可能なアクティビティの各々を処理するのに適したエージェントを選択するために、ルーティングサーバ218とインタラクションするように構成され得る。特定のエージェントに割り当てられると、延期可能なアクティビティは、それが選択されたエージェントのエージェントデバイス230上に表示されるように、そのエージェントにプッシュされる。延期可能なアクティビティは、選択されたエージェントが完了させるタスクとして、ワークビン232に表示され得る。ワークビン232の機能は、例えば、リンクリスト、アレイなどのような任意の従来のデータ構造を介して実装され得る。エージェントデバイス230の各々は、エージェントデバイス230A、230B、及び230Cにそれぞれ維持されているワークビン232A、232B、及び232Cを伴うワークビン232を含み得る。実施例として、ワークビン232は、対応するエージェントデバイス230のバッファメモリに維持され得る。
ユニバーサルコンタクトサーバ(universal contact server、UCS)246に関して、それは、顧客データベース222に記憶された情報を検索し、及び/又はそこに記憶するために情報をそこに伝送するように構成され得る。例えば、UCS246は、特定の顧客とのチャットがどのように処理されたかに関する履歴を維持することを容易にするために、チャット機能の一部として利用され得、次いで、この履歴は、将来のチャット通信をどのように処理すべきかに関する参照として使用され得る。より一般的には、UCS246は、好ましいメディアチャネル及びコンタクトする最良の時間などの顧客選好の履歴を維持することを容易にするように構成され得る。これを行うために、UCS246は、例えば、エージェントからのコメント、顧客通信履歴などに関するデータなど、各顧客のインタラクション履歴に関連するデータを識別するように構成され得る。これらのデータタイプの各々は、次に、顧客データベース222又は他のモジュールに記憶されて、本明細書に記載の機能が必要とするときに、検索され得る。
レポーティングサーバ248に関して、それは、統計サーバ226又は他のソースによってコンパイル及び集計されたデータからレポートを生成するように構成され得る。そのようなレポートは、準リアルタイムレポート又は履歴レポートを含み、例えば、平均待ち時間、破棄率、エージェントの占有率など、コンタクトセンターリソース及び性能特性の状態に関係し得る。レポートは、自動的に、又は要求元(例えば、エージェント、管理者、コンタクトセンターアプリケーションなど)からの特定の要求に応じて生成され得る。次いで、レポートは、本明細書に記載の機能に従って、コンタクトセンターの動作を管理するために使用され得る。
メディアサービスサーバ249に関して、それは、コンタクトセンター機能をサポートするために、オーディオ及び/又はビデオサービスを提供するように構成され得る。本明細書に記載の機能によると、そのような機能は、IVR若しくはIMRシステムのプロンプト(例えば、オーディオファイルの再生)、保留音、音声メール/単一パーティの記録、マルチパーティの記録(例えば、オーディオ及び/又はビデオコールの)、音声認識、デュアルトーンマルチ周波数(dual tone multi frequency、DTMF)認識、ファッ
クス、オーディオ及びビデオトランスコーディング、セキュアなリアルタイム転送プロトコル(secure real-time transport protocol、SRTP)、電話会議、ビデオ会議、コ
ーチング(例えば、コーチが顧客とエージェントとの間のインタラクションを立ち聞きするための、及び顧客がコメントを聞くことなしに、コーチがエージェントにコメントを提供するためのサポート)、コール分析、キーワードスポッティングなどを含み得る。
分析モジュール250に関して、それは、本明細書に記載の機能が必要とし得る場合に、複数の異なるデータソースから受信されたデータに対して分析を実行するためのシステム及び方法を提供するように構成され得る。例示的な実施形態によれば、分析モジュール250はまた、例えば、顧客データ、エージェントデータ、及びインタラクションデータなどの収集されたデータに基づいて、予測器又はモデル252を生成、更新、訓練、及び修正し得る。モデル252は、顧客又はエージェントの行動モデルを含み得る。行動モデルは、様々な状況で、例えば、顧客又はエージェントの行動を予測するために使用され得、それにより、本発明の実施形態が、そのような予測に基づいてインタラクションを調整するか、又は将来のインタラクションの予測される特性に備えてリソースを割り当てることを可能にし、それにより、全体的なコンタクトセンター性能及び顧客体験を改善する。分析モジュール250は、コンタクトセンターの一部であると示されているが、そのような行動モデルはまた、顧客システム(又は本明細書でも使用されているように、インタラクションの「顧客側」)に実装されて、顧客の利益のために使用され得ることが理解されよう。
例示的な実施形態によれば、分析モジュール250は、顧客データベース222及びエージェントデータベース223を含む記憶デバイス220に記憶されたデータへのアクセスを有し得る。分析モジュール250はまた、インタラクション及びインタラクション内容(例えば、その中に検出されたインタラクション及びイベントのトランスクリプト)、インタラクションメタデータ(例えば、顧客識別子、エージェント識別子、インタラクションの媒体、インタラクションの長さ、インタラクション開始及び終了時間、部門、タグ付きカテゴリ)、及びアプリケーション設定(例えば、コンタクトセンターを通るインタラクション経路)に関連するデータを記憶するインタラクションデータベース224へのアクセスを有し得る。更に、以下でより論じられるように、分析モジュール250は、例えば、機械学習技法を適用することによって、アルゴリズム及びモデル252を開発及び訓練する際に使用するために、記憶デバイス220内に記憶されたデータを検索するように構成され得る。
含まれるモデル252のうちの1つ以上は、顧客若しくはエージェントの挙動、及び/又はコンタクトセンターの動作及び性能に関連する態様を予測するように構成され得る。更に、モデル252のうちの1つ以上は、自然言語処理に使用されて、例えば、意図認識などを含み得る。モデル252は、1)システムを記述する既知の第1原理方程式、2)経験的モデルをもたらすデータ、又は3)既知の第1原理方程式及びデータの組み合わせに基づいて開発され得る。本実施形態で使用するためのモデルを開発する際に、第1原理方程式は、多くの場合利用可能でないか又は容易に導出されないため、収集及び記憶されたデータに基づいて経験的モデルを構築することが一般的に好ましくあり得る。複雑系の操作変数/外乱変数と制御変数との間の関係を適切に捕捉するために、モデル252が非線形であることが好ましいことがあり得る。これは、非線形モデルが、本明細書で論じられるものなどの複雑系に一般的である、操作変数/外乱変数と制御変数との間の直線関係ではなく、曲線関係を示す可能性があるためである。前述の要件を考慮すると、機械学習又はニューラルネットワークベースのアプローチは、現在、モデル252を実装するための好ましい実施形態である。例えば、ニューラルネットワークは、高度な回帰アルゴリズムを使用して、経験的データに基づいて開発され得る。
分析モジュール250は、オプティマイザ254を更に含み得る。理解されるように、オプティマイザを使用して、制約のセットが適用される「コスト関数」対象を最小化することができ、コスト関数は、所望の目的又はシステム動作の数学的表現である。モデル252は非線形であり得るため、オプティマイザ254は、非線形プログラミングオプティマイザであり得る。しかしながら、本発明は、以下に限定されないが、線形プログラミング、二次プログラミング、混合整数非線形プログラミング、確率的プログラミング、グローバル非線形プログラミング、遺伝的アルゴリズム、粒子/スワーム技法などを含む様々な異なるタイプの最適化アプローチを個別に又は組み合わせて使用することによって実装され得ることが企図される。
いくつかの例示的な実施形態によれば、モデル252及びオプティマイザ254は、最適化システム255内で一緒に使用され得る。例えば、分析モジュール250は、最適化システム255を、コンタクトセンターの性能及び動作の態様が最適化されるか、又は少なくとも強化される最適化プロセスの一部として利用し得る。これは、例えば、顧客体験、エージェント体験、インタラクションルーティング、自然言語処理、意図認識、又は自動プロセスに関連する他の機能に関連する態様を含み得る。
図2(並びに本明細書に含まれる他の図)の様々な構成要素、モジュール、及び/又はサーバは各々、コンピュータプログラム命令を実行し、かつ本明細書に説明される様々な機能を実施するために、他のシステム構成要素と相互作用する1つ以上のプロセッサを含み得る。そのようなコンピュータプログラム命令は、例えば、ランダムアクセスメモリ(random-access memory、RAM)などの標準のメモリデバイスを使用して実装されるメモリ内に記憶されるか、又は例えば、CD-ROM、フラッシュドライブなどの他の非一時的コンピュータ可読媒体に記憶され得る。サーバの各々の機能は、特定のサーバによって提供されるものとして記載されているが、当業者は、様々なサーバの機能が、組み合わされるか若しくは単一のサーバに統合され得るか、又は特定のサーバの機能が、本発明の範囲から逸脱することなく、1つ以上の他のサーバにわたって分散され得ることを理解するべきである。更に、「インタラクション」及び「通信」という用語は、互換的に使用され、概して、電話コール(PSTN若しくはVoIPコール)、電子メール、Vメール、ビデオ、チャット、画面共有、テキストメッセージ、ソーシャルメディアメッセージ、WebRTCコールなどを含むが、これらに限定されない、任意の通信チャネルを使用する任意のリアルタイム及び非リアルタイムのインタラクションを指す。コンタクトシステム200の構成要素へのアクセス及びコンタクトシステム200の構成要素の制御は、顧客デバイス205及び/又はエージェントデバイス230上に生成され得るユーザインターフェース(user interface、UI)を通して影響を受けることがある。既に述べたように、コンタクトセンターシステム200は、クラウドベースの環境又はクラウドコンピューティング環境などで一部又は全ての構成要素がリモートでホストされるハイブリッドシステムとして運用され得る。
チャットシステム
図3、図4及び図5を参照すると、チャットシステム及びチャットボットの様々な態様が示されている。理解されるように、本実施形態は、概して、異なる当事者間のテキストメッセージの交換を可能にする、そのようなチャット機能を含むか、又はそのようなチャット機能によって可能にされ得る。これらの当事者は、顧客及びエージェントなどの生きている人、並びにボット又はチャットボットなどの自動化されたプロセスを含み得る。
背景として、ボット(「インターネットボット」としても知られている)は、インターネット上で自動化されたタスク又はスクリプトを実行するソフトウェアアプリケーションである。典型的には、ボットは、単純かつ構造的に反復的なタスクを、人にとって可能であるよりもはるかに高いレートで実行する。チャットボットは、特定のタイプのボットであり、本明細書で使用される場合、聴覚方法又はテキスト方法を介して会話を行うソフトウェア及び/又はハードウェアの一部として定義される。理解されるように、チャットボットは、人間が会話相手としてどのように振舞うかを説得力のある方法でシミュレートするように設計されている。チャットボットは、典型的には、顧客サービス又は情報取得など様々な実用的な目的のためにダイアログシステムで使用される。いくつかのチャットボットは、洗練された自然言語処理システムを使用するが、より単純なチャットボットは、入力内のキーワードをスキャンし、次いで、一致するキーワード又は言い回しパターンに基づいてデータベースから応答を選択する。
本発明の説明を更に続ける前に、いずれかの前の図において説明済みの参照システム構成要素、例えば、モジュール、サーバ、及び他の構成要素に関して注記する。今後言及する場合に、前の図において使用された対応する数値識別子が含まれるかどうかにかかわらず、言及は、前の図において説明された例を包含するものであり、特に具体的に限定されない限り、当業者によって理解されるように、所望の機能を満たすことができるそれらの実施例又は他の従来技術のいずれかに従って実装され得ることを理解されたい。したがって、例えば、今後の「コンタクトセンターシステム」への言及は、図2の例示的な「コンタクトセンターシステム200」及び/又はコンタクトセンターシステムを実装するための他の従来技術を指すものとして理解されるべきである。追加の例として、以下での「顧客デバイス」、「エージェントデバイス」、「チャットサーバ」、又は「コンピューティングデバイス」に対する今後の言及は、それぞれ図1~図2の例示的な「顧客デバイス205」、「エージェントデバイス230」、「チャットサーバ240」、又は「コンピューティングデバイス200」、並びに同じ機能を満たすための従来技術を指すものとして理解されるべきである。
次に、チャット機能及びチャットボットについて、図3、図4、及び図5にそれぞれ示すチャットサーバ、チャットボット、及びチャットインターフェースの例示的な実施形態を参照しながら、より具体的に説明する。これらの例は、コンタクトセンター側で実装されるチャットシステムに関して提供されるが、そのようなチャットシステムは、インタラクションの顧客側で使用されてもよい。したがって、図3、図4、及び図5の例示的なチャットシステムは、顧客のためにコンタクトセンターのエージェント及びチャットボットとインタラクションするように構成された顧客側チャットボットの使用を含む、類似の顧客側実装のために修正され得ることを理解されたい。チャット機能は、テキスト-スピーチ変換及び/又はスピーチ-テキスト変換を介して音声通信によって利用され得ることを更に理解されたい。
ここで特に図3を参照すると、チャットシステム及び機能を実装するために使用され得るチャットサーバ240のより詳細なブロック図が提供されている。チャットサーバ240は、顧客がデータ通信ネットワーク210を介して顧客によって操作される顧客デバイス205に結合され得る(すなわち、電子通信し得る)。チャットサーバ240は、例えば、自動化されたチャット及び人間のエージェントとのチャットの両方を含む、顧客とのチャット会話を実装及び編成するためのコンタクトセンターの一部として、企業によって操作され得る。自動化されたチャットに関して、チャットサーバ240は、チャット会話に携わるためにコンピュータプログラム命令を用いて構成されている、チャット自動化モジュール又はチャットボット260A~260C(260と総称する)をホストし得る。したがって、チャットサーバ240は、概して、顧客デバイス205とエージェントデバイス230又はチャットボット260との間でのテキストベースの通信又はチャット通信の交換を含む、チャット機能を実装する。以下でより詳細に論じるように、チャットサーバ240は、チャット機能を容易にする、顧客デバイス205及びエージェントデバイス230のそれぞれにおいて特定のUIを生成するための顧客インターフェースモジュール265と、エージェントインターフェースモジュール266と、を含み得る。
チャットボット260に関して、各々は、要求に従って起動される実行可能プログラムとして動作することができる。例えば、チャットサーバ240は、双方向音声応答(IVR)機能のために、VoiceXMLファイルをメディアサーバにロードすることに類似して、チャットボット260の実行エンジンとして動作し得る。ロード及びアンロードは、双方向音声応答の文脈でVoiceXMLスクリプトが制御され得る方法に類似して、チャットサーバ240によって制御され得る。チャットサーバ240は、IVRの文脈で顧客データキャプチャと同様に、統一された方法で顧客データを取得し、収集する手段を更に提供し得る。そのようなデータは、同じチャットボット、異なるチャットボット、エージェントチャット、又は更には異なるメディアタイプであるかどうかにかかわらず、記憶され、共有され、後続の会話において利用され得る。例示的な実施形態では、チャットサーバ240は、あるチャットボットから別のチャットボットに、又はあるチャットボットから人間のエージェントにインタラクションが転送又は移行されるときに、様々なチャットボット260間でのデータの共有を調整するように構成されている。特定のチャットボットとのインタラクション中に取得されたデータは、第2のチャットボット又は人間のエージェントの呼び出し要求と共に転送され得る。
例示的な実施形態では、チャットボット260の数は、チャットサーバ240の設計及び機能に応じて変化し得、図3に図示される数に限定されない。更に、異なるチャットボットが異なるプロファイルを有するように作成されてもよく、そのプロファイルは、特定のチャット又は特定の顧客の主題に一致するように選択され得る。例えば、特定のチャットボットのプロファイルは、特定の顧客の好みに向けられた特定の主題又は通信スタイルに関して顧客を支援するための専門知識を含むことができる。より具体的には、あるチャットボットは、第1の通信トピック(例えば、ビジネスでの新しいアカウントの開設)に携わるように設計され得、別のチャットボットは、第2の通信トピック(例えば、ビジネスによって提供される製品又はサービスに関する技術的サポート)に携わるように設計され得る。あるいは、チャットボットは、様々な方言若しくは俗語を用いるように構成されるか、又は様々な個性若しくは特性を有し得る。特定タイプの顧客に応えるプロファイルを有するチャットボットが関与することにより、より効果的な通信及び結果が可能になり得る。チャットボットプロファイルは、人口統計情報、インタラクション履歴、又はソーシャルメディア上で利用可能なデータなど、他の当事者について知られている情報に基づいて選択され得る。チャットサーバ240は、より専門的なチャットボットを呼び出すためには顧客に関する情報が不十分である場合に呼び出されるデフォルトのチャットボットをホストし得る。任意選択的に、異なるチャットボットは、顧客選択可能であってもよい。例示的な実施形態では、チャットボット260のプロファイルは、記憶デバイス220内でホストされるプロファイルデータベースに記憶され得る。そのようなプロファイルとしては、チャットボットの個性、人口統計、専門知識の領域などが挙げられ得る。
顧客インターフェースモジュール265及びエージェントインターフェースモジュール266は、顧客とチャットボット260又は人間のエージェントとの間のチャット通信を容易にするユーザインターフェース(UI)を、顧客デバイス205上に表示するために生成するように構成され得る。同様に、エージェントインターフェースモジュール266は、エージェントデバイス230を動作させるエージェントと顧客との間のチャット通信を容易にする特定のUIをエージェントデバイス230上に生成することができる。エージェントインターフェースモジュール266はまた、エージェントがチャットボット260と顧客との間で進行中のチャットの状況を監視することを可能にするUIをエージェントデバイス230上で生成することができる。例えば、顧客インターフェースモジュール265は、チャットセッション中に、顧客デバイス205上で特定のUIを生成するように構成された信号を顧客デバイス205に伝送することができ、これは、チャットボット260又は人間のエージェントから送信されているテキストメッセージの表示、並びに顔文字又はアニメーションなどのテキストメッセージに付随するように意図された他の非テキストグラフィックスを含み得る。同様に、エージェントインターフェースモジュール266は、チャットセッション中に、エージェントデバイス230上でUIを生成するように構成されているエージェントデバイス230に信号を伝送することができる。そのようなUIは、顧客への送信テキストメッセージに付随する非テキストグラフィックスのエージェント選択を容易にするインターフェースを含むことができる。
例示的な実施形態では、チャットサーバ240は、メディア層、メディア制御層、及び(IVRメディアサーバ上でのVoiceXMLの実行と同様に)IMRサーバ216によって実行されるチャットボットを用いて、層状アーキテクチャで実装され得る。上述したように、チャットサーバ240は、知識管理サーバ234とインタラクションして、知識情報についてサーバに問い合わせるように構成され得る。例えば、クエリは、チャット中に顧客から受信した質問に基づき得る。次いで、知識管理サーバ234から受信した応答は、チャット応答の一部として顧客に提供され得る。
ここで特に図4を参照すると、例示的なチャット自動化モジュール又はチャットボット260のブロック図が提供されている。図示のように、チャットボット260は、テキスト分析モジュール270、ダイアログマネージャ272、及び出力ジェネレータ274を含む、いくつかのモジュールを含むことができる。チャットボットの動作性のより詳細な説明において、例えば、意図認識に関連するモジュール、テキスト-スピーチ変換又はスピーチ-テキスト変換モジュール、並びにエージェント又は顧客プロファイルに記憶された情報に従うスクリプト記憶、検索、及びデータフィールド処理に関連するモジュールを含む、他のサブシステム又はモジュールが説明され得ることが理解されるであろう。しかしながら、そのようなトピックは、本開示の他の領域において(例えば、図6及び図7に関連して)より完全に網羅されており、したがって、ここでは繰り返さない。それにもかかわらず、これらの領域で行われる開示は、本明細書で説明される機能に従ってチャットボットの動作性に対して類似の方法で使用され得ることを理解されたい。
テキスト分析モジュール270は、自然言語を分析し、理解するように構成され得る。これに関して、テキスト分析モジュールは、言語の辞書、構文パーサー、意味的パーサー、及び顧客デバイス205によって提供されたフレーズを構文的及び意味的内部表現に分割するための文法規則を用いて構成され得る。テキスト分析モジュールの構成は、チャットボットに関連する特定のプロファイルに依存する。例えば、特定のワードは、あるチャットボットの辞書には含まれるが、別のチャットボットの辞書からは除外され得る。
ダイアログマネージャ272は、テキスト分析モジュール270から構文的表現及び意味的表現を受信し、決定規則セットに基づいて会話の大まかな流れを管理する。この点に関して、ダイアログマネージャ272は、会話の履歴及び状態を維持し、それらに基づいて、アウトバウンド通信を生成する。通信は、ダイアログマネージャ272によって選択された特定の会話経路のスクリプトに従い得る。以下で更に詳細に説明するように、会話経路は、会話の特定の目的又はトピックの理解に基づいて選択され得る。会話経路のスクリプトは、例えば、アーティフィシャルインテリジェンスマークアップランゲージ(Artificial Intelligence Markup Language、AIML)、SCXMLなど、当該技術分野
において従来の様々な言語及びフレームワークのいずれかを使用して生成され得る。
チャット会話中、ダイアログマネージャ272は、会話フロー/スクリプトの特定の時点で適切とみなされる応答を選択し、出力ジェネレータ274に応答を出力する。例示的な実施形態では、ダイアログマネージャ272はまた、選択された応答の信頼度をコンピュータ処理し、信頼度をエージェントデバイス230に提供するように構成され得る。チャット通信における全てのセグメント、ステップ、又は入力は、考えられる応答の対応するリストを有し得る。応答は、トピック(好適なテキスト分析及びトピック検出スキームを使用して決定される)に基づいて分類され、提案される次のアクションが割り当てられ得る。アクションとしては、例えば、回答を伴う応答、追加の質問、支援する人間のエージェントへの転送などが挙げられ得る。信頼度は、検出、分析、及び顧客入力に対する応答が適切かどうか、又は人間のエージェントが関与するべきかどうかをシステムが決定することを支援するために利用され得る。例えば、閾値信頼度は、1つ以上のビジネスルールに基づいて、人間のエージェントを介入させるために割り当てられ得る。例示的な実施形態では、信頼度は、顧客フィードバックに基づいて決定され得る。説明されるように、ダイアログマネージャ272によって選択された応答は、知識管理サーバ234によって提供される情報を含み得る。
例示的な実施形態では、出力ジェネレータ274は、ダイアログマネージャ272によって提供される応答の意味的表現を取得し、チャットボットのプロファイル又は個性に当該応答をマッピングし(例えば、チャットボットの方言、語彙、又は個性に従って応答の言語を調整することによる)、顧客デバイス205に表示される出力テキストを出力する。出力テキストは、チャットボットと対話している顧客が、人間のエージェントではなく、自動プロセスと対話していることを認識しないように、意図的に提示され得る。理解されるように、他の実施形態によると、出力テキストは、顧客のユーザインターフェースに組み込まれた、顔文字又はアニメーションなど視覚表現とリンクされ得る。
ここで図5を参照すると、チャット機能282の例示的な実装を有するウェブページ280が提示されている。ウェブページ280は、例えば、企業ウェブサイトに関連しており、ウェブページを訪問している将来の顧客及び現在の顧客と、企業に関連するコンタクトセンターとの間のインタラクションを開始することが意図され得る。理解されるように、チャット機能282は、ラップトップ、タブレットデバイス、又はスマートフォンなどのパーソナルコンピューティングデバイスを含む、任意のタイプの顧客デバイス205上で生成され得る。更に、チャット機能282は、ウェブページ内のウィンドウとして生成されてもよく、又は全画面インターフェースとして実装されてもよい。図示の例のように、チャット機能282は、ウェブページ280の定められた部分に含まれ得、例えば、上記のシステム及び構成要素、並びに/又は任意の他の従来の手段を介して、ウィジェットとして実装され得る。一般に、チャット機能282は、顧客がコンタクトセンターに配信するテキストメッセージを入力するための例示的な方法を含むことができる。
一例として、ウェブページ280は、チャットボット又はライブエージェントとチャットするための通信チャネルを提供する顧客デバイスなどの顧客デバイスを介して顧客によってアクセスされ得る。例示的な実施形態では、示されるように、チャット機能282は、顧客デバイスのディスプレイ上に、本明細書では顧客チャットインターフェース284と称されるユーザインターフェースを生成することを含む。顧客チャットインターフェース284は、例えば、既に説明したチャットサーバなど、チャットサーバの顧客インターフェースモジュールによって生成され得る。説明されるように、顧客インターフェースモジュール265は、例えば、この例では、「Kate」という名前のチャットボット又はエージェントである、チャットソースによって発信されたチャットメッセージの内容に従って、所望の顧客チャットインターフェース284を生成するように構成されている顧客デバイス205に信号を送信し得る。顧客チャットインターフェース284は、指定領域又はウィンドウ内に含まれ得、当該ウィンドウは、ウェブページ280の指定部分を占める。顧客チャットインターフェース284はまた、テキスト表示領域286を含むことができ、テキスト表示領域286は、受信及び送信されたテキストメッセージの時系列表示に専用の領域である。顧客チャットインターフェース284は、顧客が彼らの次のメッセージのテキストを入力する指定領域であるテキスト入力領域288を更に含む。理解されるように、他の構成も可能である。
顧客自動化システム
本発明の実施形態は、顧客サービスプロバイダ又はコンタクトセンターとのインタラクションの様々な段階の間の顧客アクションを自動化及び拡張するためのシステム及び方法を含む。理解されるように、インタラクションのそれらの様々な段階は、コンタクト前段階、コンタクト中段階、及びコンタクト後段階(又は、それぞれ、インタラクション前段階、インタラクション中段階、及びインタラクション後段階)として分類され得る。ここで図6を特に参照すると、本発明の実施形態と共に使用され得る例示的な顧客自動化システム300が示されている。顧客自動化システム300がどのように機能するかをより良く説明するために、例えば、顧客がコンタクトセンターとインタラクションするときに、顧客アクションを自動化するための例示的な方法のフローチャート350を提供する図7も参照する。顧客自動化に関する更なる情報は、2018年10月4日に出願された「System and Method for Customer Experience Automation」と題する米国出願第16/151,362号に提供されている。
図6の顧客自動化システム300は、本明細書で使用される場合、顧客サービスプロバイダ又はコンタクトセンターとのインタラクションにおいて顧客のために取られるアクションの自動化を指す、顧客側自動化のために一般的に使用され得るシステムを表す。そのようなインタラクションは、「顧客-コンタクトセンターインタラクション」又は単に「顧客インタラクション」と称されることもある。更に、そのような顧客-コンタクトセンターインタラクションを論じる際に、「コンタクトセンター」又は「顧客サービスプロバイダ」への言及は、一般に、ユーザ又は顧客がそれらとのビジネス、取引、業務、又は他の利害関係を有する組織又は企業(例えば、ビジネス、政府機関、非営利団体、学校など)に関連付けられた任意の顧客サービス部門又は他のサービスプロバイダを指すことが意図されていることを理解されたい。
例示的な実施形態では、顧客自動化システム300は、モバイルデバイス若しくは他のコンピューティングデバイス、クラウドコンピューティングデバイス(例えば、ネットワークを介して顧客デバイス205に接続されたコンピュータサーバ)、又はそれらの組み合わせ上で実行されるソフトウェアプログラム若しくはアプリケーションとして実装され得る(例えば、システムのいくつかのモジュールがローカルアプリケーションに実装され、他のモジュールがクラウドに実装される。便宜上、実施形態は主に、顧客デバイス205上で実行されるアプリケーションを介した実装の文脈で説明される。しかしながら、本実施形態はそれに限定されないことを理解されたい。
顧客自動化システム300は、いくつかの構成要素又はモジュールを含んでもよい。図6の図示された例では、顧客自動化システム300は、ユーザインターフェース305、自然言語処理(natural language processing、NLP)モジュール310、意図推論
モジュール315、スクリプト記憶モジュール320、スクリプト処理モジュール325、顧客プロファイルデータベース又はモジュール(又は単に「顧客プロファイル」)330、通信マネージャモジュール335、テキスト-スピーチ変換モジュール340、スピーチ-テキスト変換モジュール342、及びアプリケーションプログラミングインターフェース(API)345を含み、これらの各々は、図7のフローチャート350も参照しながらより詳細に説明される。顧客自動化システム300の構成要素及びそれに関連付けられた機能のいくつかは、図3、図4、及び図5に関連して上述したチャットボットシステムと重複し得ることが理解されよう。顧客自動化システム300及びそのようなチャットボットシステムが、顧客側実装の一部として一緒に採用される場合、そのような重複は、2つのシステム間のリソースの共有を含み得る。
動作の一例では、ここで図7のフローチャート350を特に参照すると、顧客自動化システム300は、最初のステップ又は動作355において入力を受信することができる。そのような入力は、いくつかのソースから来てもよい。例えば、入力の主要なソースは顧客であってもよく、そのような入力は顧客デバイスを介して受信される。入力はまた、他の当事者、特に、顧客デバイスを通して顧客と対話する当事者から受信されたデータを含んでもよい。例えば、コンタクトセンターから顧客に送信される情報又は通信は、入力の態様を提供することができる。いずれの場合も、入力は、自由スピーチ又はテキスト(例えば、構造化されていない自然言語入力)の形態で提供され得る。入力はまた、顧客デバイス上で受信又は記憶される他の形態のデータを含んでもよい。
フロー図350を続けると、動作360において、顧客自動化システム300は、NLPモジュール310を使用して入力の自然言語をパースし、そこから、意図推論モジュール315を使用して意図を推論する。例えば、入力が顧客からのスピーチとして提供される場合、スピーチは、NLPモジュール310による構文解析の一部としてスピーチ-テキスト変換システム(大規模語彙連続音声認識すなわちLVCSRシステムなど)によってテキストに書き換えられてもよい。書き換えは、顧客デバイス205上でローカルに実行されてもよく、又はスピーチは、クラウドベースのサーバによるテキストへの変換のためにネットワークを介して送信されてもよい。特定の実施形態では、例えば、意図推論モジュール315は、人工知能又は機械学習技法を使用して、提供された入力のテキストから顧客の意図を自動的に推論することができる。そのような人工知能技法は、例えば、顧客入力から1つ以上のキーワードを識別することと、所与のキーワードに対応する潜在的な意図のデータベースを検索することと、を含み得る。潜在的な意図及び意図に対応するキーワードのデータベースは、履歴インタラクション記録の集合から自動的にマイニングされ得る。顧客自動化システム300が入力から意図を理解できない場合、いくつかの意図の選択が、ユーザインターフェース305において顧客に提供されてもよい。次いで、顧客は、代替のうちの1つを選択することによって彼らの意図を明確にし得るか、又は他の代替が提供されることを要求し得る。
顧客の意図が決定された後、フローチャート350は動作365に進み、顧客自動化システム300は、所与の意図に関連付けられたスクリプトをロードする。そのようなスクリプトは、例えば、スクリプト記憶モジュール320に記憶され、そこから取り出されてもよい。そのようなスクリプトは、コマンド若しくは動作のセット、予め書かれたスピーチ若しくはテキスト、及び/又はパラメータ若しくはデータのフィールド(「データフィールド」とも呼ばれる)を含むことができ、これらは、顧客のためにアクションを自動化することを要求されるデータを表す。例えば、スクリプトは、顧客の意図によって指定された問題を解決するために必要とされるコマンド、テキスト、及びデータフィールドを含むことができる。スクリプトは、特定のコンタクトセンターに固有であり、特定の問題を解決するように調整されてもよい。スクリプトは、いくつかの方法で編成することができ、例えば、特定の組織に関係する全てのスクリプトが、共通の特徴を定義する共通の「親」スクリプトから導出される場合など、階層的に編成することができる。スクリプトは、以前の顧客インタラクションからのデータ、アクション、及びダイアログをマイニングすることによって作り出され得る。具体的には、特定の問題の解決を求める要求中に行われた一連のステートメントは、顧客と顧客サービスプロバイダとの間の履歴インタラクションの集合から自動的にマイニングされ得る。2014年1月12日に米国特許商標庁に出願された米国特許出願第14/153,049号「Computing Suggested Actions in Caller Agent Phone Calls By Using Real-Time Speech Analytics and Real-Time Desktop Analytics」に記載されている、コンタクトセンターエージェント側から記述されたようなステートメント及びコメントの有効なシーケンスを自動的にマイニングするためのシステム及び方法が採用されてもよい。
スクリプトが取り出されると、フローチャート350は動作370に進み、顧客自動化システム300は、スクリプトを処理又は「ロード」する。このアクションは、スクリプト処理モジュール325によって実行されてもよく、スクリプト処理モジュール325は、スクリプトのデータフィールドに顧客に関する適切なデータを記入することによってそれを実行する。より具体的には、スクリプト処理モジュール325は、予想されるインタラクションに関連する顧客データを抽出することができ、その関連性は、顧客の意図に対応するものとして選択されたスクリプトによって事前に決定される。スクリプト内のデータフィールドの多くに対するデータは、顧客プロファイル330内に記憶されたデータから取り出されたデータと共に自動的にロードされてもよい。理解されるように、顧客プロファイル330は、顧客に関連する特定のデータ、例えば、顧客の名前、生年月日、住所、口座番号、認証情報、及び顧客サービスインタラクションに関連する他のタイプの情報を記憶することができる。顧客プロファイル330内に記憶するために選択されたデータは、顧客が以前のインタラクションで使用したデータに基づいてもよく、及び/又は顧客によって直接取得されたデータ値を含んでもよい。データフィールドに関する曖昧さ又はスクリプト内の情報の欠落がある場合、スクリプト処理モジュール325は、顧客が必要とされる情報を手動で入力することを促して可能にする機能を含むことができる。
再びフローチャート350を参照すると、動作375において、ロードされたスクリプトは、顧客サービスプロバイダ又はコンタクトセンターに送信され得る。以下で更に論じるように、ロードされたスクリプトは、顧客のためにコンタクトセンターとのインタラクションの少なくとも一部を自動化するのに必要なコマンド及び顧客データを含むことができる。例示的な実施形態では、コンタクトセンターと直接インタラクションするために、API345が使用される。コンタクトセンターは、それらのシステムに一般的な要求を行うためのプロトコルを定義することができ、API345は、これを行うように構成される。そのようなAPIは、拡張マークアップ言語(XML)を使用するSimple
Object Access Protocol(SOAP)、XML又はJavaScript Object Notation(JSON)を使用してフォーマットされたメッセージを有するRepresentational State Transfer(REST)APIなど、様々な標準プロトコルを介して実装され得る。したがって、顧客自動化システム300は、コンタクトセンターとの通信のための定義されたプロトコルに従ってフォーマットされたメッセージを自動的に生成することができ、メッセージは、フォーマットされたメッセージの適切な部分に、スクリプトによって指定された情報を含む。
意図マイニング自動化を使用したボットオーサリング
近年の人工知能(Artificial Intelligence、AI)及びコンピューティング技術に
おけるいくつかのブレークスルーと共に、人間との自然言語会話に携わることができるアプリケーション、自動化システム、チャットボット又はボットに対する関心が高まっている。近年では、人間と自然に会話することができ、かつセルフサービス方式で多種多様なタスクを実行することができる、AI型チャットボット及び仮想アシスタントの採用が非常に成長していることが目撃されている。そのような会話型ボットは、最初にユーザの入力を分析し、次いでその入力の意味を理解しようと試みることによって動作する。これは、自然言語理解(又は「Natural Language Understanding、NLU」)と称され、通常、ユーザの意図又は「インテント」と、ユーザの入力発話内の特定のキーワード又は「エンティティ」との識別を伴う。意図及びエンティティが決定されると、ボットは、適切なフォローアップアクションでユーザに応答することができる。
様々な機械学習アルゴリズムが、NLUモデルを訓練するために使用される。訓練は通常、自然言語入力に存在するパターンを認識し、かつそれらを予め定義された意図のセットに関連付けるようにシステムに教示することを伴う。訓練データの品質は、モデル性能を決定する際の重要な要因である。入力の発話が適切な多様性を有する十分に大きいデータセットは、良好なNLUモデルを構築するために重要である。
本明細書で使用される場合、「ボットオーサリング」という用語は、NLU能力を有する会話型ボット又はチャットボットを作成するプロセスを指す。このプロセスは、一般に、意図を定義すること、エンティティを識別すること、発話を定式化すること、NLUモデルを訓練すること、ボットをテストすること、及び最後にそれを公開することを伴う。これは、通常、完了するのに数週間又は数ヶ月を要し得る、ほとんど手動のプロセスである。一般に、意図を識別し、発話を定式化することは、この時間の大部分を要する。組織は、それらの顧客とコンタクトセンターエージェントなどの顧客サポートスタッフとの間の大量のチャット会話を既に所有している場合があるが、意図及び発話を識別するためにこれらの生のチャットトランスクリプトを手動で調べるプロセスは、時間と費用の両方がかかる。
本明細書で使用される場合、意図マイニングエンジン又はプロセス(一般的に「意図マイニングプロセス」と称され得る)は、ボットオーサリングワークフローをより効率的にするシステム又は方法である。理解されるように、本発明の意図マイニングプロセスは、何万もの会話から意図をマイニングすることによって機能し、それぞれに属する強固で多様な発話のセットを見つける。更に、意図マイニングプロセスは、会話分析を提供することによって会話への洞察を得るのに役立つ。それはまた、ボットオーサーに、意図を分析し、かつ修正を行う機会を提供する。最後に、これらの意図及び発話は、Genesys Dialog Engine、GoogleのDialogflow、及びAmazon Lexにおいて商業的に入手可能なものなど、多様なチャットボットオーサリングプラットフォームにエクスポートされてもよい。理解されるように、これにより、全体的な開発時間を大幅に短縮する柔軟で効率的なボットオーサリングワークフローがもたらされる。
次に図8を参照すると、本発明の意図マイニングプロセス(又は単に「本意図マイニングプロセス」)を使用するボットオーサリングワークフロー400の様々な段階又はステップが示されている。ワークフロー400を開始するために、会話又は会話データがマイニングのためにインポートされ得る。そのような会話データは、エージェントと顧客との間で以前に発生したインタラクションからなり得る。そのような会話データは、複数の往復のメッセージングターンからなる自然言語会話であり得る。会話は、例えば、チャットインターフェースを介して、テキストを通して、又は音声通話を介して行われている場合がある。後者の場合、会話は、マイニングが始まる前に、音声認識を介してテキストに書き換えられ得る。
最初のステップ405において、ボットオーサリングワークフロー400は、意図マイニングプロセスで使用するための会話データ(すなわち、会話テキストデータ)をインポートすることを含むことができる。これは、いくつかの方法で行うことができる。例えば、会話データは、マイニングされるべき会話を含む(JSONのようなサポートされるフォーマットの)テキストファイルを介してインポートされてもよい。会話データはまた、クラウドストレージからインポートされてもよい。
ステップ410において、ボットオーサリングワークフロー400は、会話データから意図をマイニングすることを含むことができる。以下の図9及び図10に関連して説明するように、意図は、意図マイニングアルゴリズムに従ってマイニングされてもよい。
ステップ415において、ボットオーサリングワークフロー400は、マイニングされた意図をテストすることを含むことができる。これは、意図マイニングプロセスの出力と対話することを含んでもよい。すなわち、ワークフローのこの段階で、ボットオーサーは、マイニングされた出力とインタラクションして編集を行い、この編集は、意図及び関連付けられた発話を、訓練のためにボットにエクスポートする前に微調整及びプルーニングすることを含み得る。ボットオーサーは、マイニングされた出力に対して、例えば、意図及びその意図に属する発話を選択すること、2つ以上の意図を単一の意図にマージすることによって、それらの選択された発話をマージしたものを生じさせ得ること、意図を複数の意図に分割することによって、対応する発話を分割したものを生じさせること、及び意図ラベルをリネームすることなど、様々なアクションを実行することができる。このビジネスロジック主導型プロセスの終わりに、修正された意図及び関連付けられた発話のセットが作り出され、次いで、これらを使用してチャットボットを訓練することができる。
ステップ420において、ボットオーサリングワークフロー400は、マイニングされた意図及び発話をボットにインポートすることを含むことができる。例えば、マイニングされた意図は、会話型ボットにアップロードされてもよく、会話型ボットは、顧客との自動化された会話を行うために使用されてもよい。本意図マイニングプロセスは、マイニング又は修正された意図及び発話をボットに追加するための複数の方法を提供することができる。データは、好都合なレビューのためにCSVフォーマットでダウンロードされてもよい。データはまた、複数のボットフォーマットにエクスポートされてもよく、このようにして、Genesys Dialog Engine、GoogleのDialogflow、又はAmazon Lexなど、より多種多様な会話型AIチャットボットサービスへのサポートを提供することができる。
ボットオーサリングプロセスはまた、追加のステップを含むことができる。いくつかの実施形態によれば、本意図マイニングプロセスは、既に上述したステップに著しく関与し、後の開発段階にはあまり関与しない場合がある。これらの後のステップは、任意選択の編集ステップと、ボット設計ステップと、最後に、最終テスト及び公開ステップとを含むことができる。
次に図9を参照すると、本意図マイニングエンジン又はプロセス500を実装するための例示的なアルゴリズムについて次に説明する。理解されるように、このアルゴリズムは、いくつかのステップにおおよそ分解されてもよく、これらのステップは、本明細書では、1)意図を有する発話を識別すること、2)候補意図を生成すること、3)顕著意図を識別すること、4)意図の意味的グループ化、5)意図ラベリング、及び6)発話-意図関連付け、として参照される。他のステップは、発話内の個人的に識別可能な情報のマスキングを含んでもよい。別の追加のステップは、意図分析のコンピュータ処理を含んでもよい。次に、これらのステップについて論じる。理解されるように、ステップは、インポートされた会話データ、例えば、顧客サービス担当者又はエージェントと対話する顧客間の自然言語会話を含むデータに関連して説明されるが、プロセスはまた、他のタイプのユーザ及び会話タイプを伴う他の文脈にも適用可能であり得ることを理解されたい。
第1のステップ505に従って、本意図マイニングプロセスは、会話データを処理して、意図を有するターン又は発話を識別する。本明細書で使用される場合、意図を有する発話は、顧客の意図を含むか又は記述する可能性が高いと決定される発話である。したがって、本意図マイニングプロセスにおけるこの最初のステップは、所与の会話から意図を有する発話を識別することである。例えば、会話は、通常、(自動化されたシステム又はボット又は人間のエージェントを含み得る)エージェント及び顧客などの複数の当事者からの複数のメッセージターン又は発話からなる。
一例として、ボット生成メッセージは次のように見える場合がある:「Hello,thank you for contacting us.All chats may be monitored or recorded for quality and training purposes.We will be with you
shortly to help you with your request」。そのようなボット生成メッセージは、一般的である傾向があり、かつ会話に見られる意図に光を投じないので、安全に破棄され得る。実際の会話は、エージェント又は顧客のいずれかが実質的な通信又はメッセージを送信することから始まる。例えば、インタラクション中に、顧客は、顧客ケアに接触する理由又は「意図」を説明することができる。後続のエージェント-顧客会話ターンは、顧客によって表現されたこの意図に基づいて行われる。
現実世界の顧客-エージェント会話の分析から、本発明は、意図を有する発話を識別するためのいくつかのヒューリスティック又は戦略を含む。例えば、意図を有するターンは、通常、会話の顧客側の始まりの方に発生することが観察されている。したがって、意図を識別するためには、一般に、最初の顧客発話のうちのいくつかのみを処理する必要があり、会話の残りは破棄することができる。これは更に、システムのレイテンシ及びメモリフットプリントを低減するのに役立つ。更に、ワードカウント制約を使用して、他の発話を、顧客の意図を含む可能性が低いものとして破棄することができる。
例として、意図を有する発話の識別は、以下を含むことができる。会話における連続した顧客発話のセットが選択される。このセットは、会話の開始内で発生する顧客の発話を含むことができる。更に、ワードカウント制約を使用して、この初期セット内の顧客発話の一部を不適格とすることができる。すなわち、適格であるためには、各ターン内のワードの数は、最小閾値より大きくなければならない。そのようなワードカウント又は長さ制約は、「Hello」、「Hi there」、「How are you?」などのような慣習的な挨拶など、意図マイニング目的に無関係であるいくつかの顧客ターンを破棄するのに役立つ。例えば、この最小ワードカウント閾値は、2~5に設定されてもよい。
本意図マイニングプロセスは、意図を有するターンの連続する顧客ターンからの発話を、単一の組み合わされた発話に連結することができる。これが行われる前に、より長い文は一貫性がないか又はノイズの多い結果を作り出す傾向があるので、顧客ターンの各々は、最大長閾値に基づいてプルーニングされてもよい。一例として、発話当たりのワードの最大数を50ワードに設定することができる。したがって、このステップの最後に、顧客によって表現された意図を含む可能性が高い各会話から、組み合わされた発話が得られる。会話が上記の基準を満たすメッセージターンを含まない場合、その会話は、それから組み合わされた発話を得ることなく破棄されてもよい。本意図マイニングプロセスは、数百又は数千もの会話から優勢な意図を取得するために使用されるので、顧客意図が複数の会話にわたって繰り返されることが安全に仮定され得る。したがって、上記のヒューリスティック基準を満たさない会話は、意図識別におけるより大きい堅牢性のために、システムの機能に影響を及ぼすことなく破棄され得る。
第2のステップ510に従って、候補意図が、組み合わされた発話の分析に基づいて生成される。すなわち、意図を有するターンからの発話が会話から取得され、組み合わされると、次のタスクは、本明細書では「候補意図」と称される、可能な又は可能性の高い意図を識別することを含む。本明細書で使用される場合、候補意図は、1)有形の目的、タスク、又は活動を表すワード若しくはフレーズであるアクションと、2)アクションが作用又は動作する、ワード又はフレーズを表すオブジェクトとの2つの部分からなるテキストフレーズである。
発話からこれらのアクション-オブジェクトペアを得るための様々な方法が存在する。理解されるように、選択は、特定の言語に対して利用可能な言語モデル及びリソースに依存し得る。典型的には、例えば、構文依存パーサー(syntactic dependency parser)
を使用して、発話の文法構造を分析し、「ヘッド」ワードと「トークン」又はこれらのヘッドを修飾するワードとの間の関係を取得する。発話のトークンとそれらのヘッドとの間のこれらの関係は、それらの品詞(POS)タグと共に、所与の発話に対する潜在的な意図又は候補意図を識別するために使用される。
一例として、そのようなアクション-オブジェクトペアを取得するプロセスは、以下を含むことができる。最初に、依存パーサーを使用して、発話内の全てのトークンとヘッドとのペアを取得することができる。それらから、トークンのPOSタグと、それぞれ名詞及び動詞であるその関連するヘッドとを有するペアが選択される。ユニバーサルPOSタグの使用は、システム言語をアグノスティックにし、したがって複数の言語ドメインに拡張可能にするのに役立つ。
「アクション」部分は、通常、関連するPOSタグとして「動詞」を有するトークンである。トークンが「助詞」トークンを有する「基本動詞」である場合、トークンは、発話の「句動詞」を形成する。関連付けられた「助詞」トークンも動詞トークンと共に含まれる。したがって、句動詞全体が、候補意図のアクション部分になる。「オブジェクト」部分は、通常、関連するPOSタグとして「名詞」を有するトークンである。トークンが「複合」の一部であり、全ての構成要素であるトークンが「名詞」POSタグを有する場合、この複合全体がオブジェクトとみなされる。同様に、トークンが形容詞修飾句の一部である場合、この句全体がオブジェクトとみなされる。トークンが並置修飾子に関連付けられている場合、後者を構成する全てのトークンは、現在のトークンに付加されて、候補意図のオブジェクト部分が形成される。ユニバーサルPOSタグのみが言語に対して利用可能であり、ユニバーサル依存性が利用可能でない場合、「動詞」トークン及び「名詞」トークンは、それぞれ、アクション部分及びオブジェクト部分とみなされる。次のステップとして、アクション-オブジェクト順序付きペアは、候補意図をより標準的な形式に変換するために、レンマ化されてもよい。更なる正規化のために、レンマ化されたペアのケースを下げることができる。
したがって、1つ以上の正規化されたアクション-オブジェクトペアを各発話から取得することができ、これらは、会話の候補意図を一緒に形成する。そのようなペアが取得されない場合、その発話は破棄される。このことを念頭に置いて、以下の第1の例示的な発話を検討されたい:「I’m looking to contact the instructor for this course.Can you provide
his email please?」この場合、候補意図は、「contact instructor」及び「provide email」を含み得る。以下の第2の例示的な発話を検討されたい:「I just finished my bachelor’s program yesterday on my account it says you must complete a graduation application,but when I click it goes to a page that says messages and only shows potential scholarships what should I do?」。この場合、候補意図は、「finish program」、「complete graduation application」、「say message」、及び「show potential scholarship」を含み得る。
第3のステップ515に従って、顕著意図が識別される。本明細書で使用される場合、「顕著意図」という用語は、前のステップにおいて識別された候補意図からの、意図の絞り込まれたリストを指し、その絞り込みは、例えば、関連性、重要性、確定性、及び/又は注目性に基づく。したがって、候補意図のセットから、顧客の実際の意図を記述する意図が、顕著意図として識別される。理解されるように、このタスクは必ずしも簡単ではない。場合によっては、顧客の意図は、本質的に暗示的である場合がある。しかしながら、他の場合には、特に複数の候補意図を含む発話では、顧客の実際の意図に関して異なる意見が存在する場合がある。
上で提供された例を検討されたい。第1の発話例の場合、「contact instructor」と「provide email」の両方が顧客の意図を記述していると主張することができる。また、第2の発話例の場合、顧客は、自分の学士課程を終了し、卒業申込みを完了している間に問題に直面している。この意図はより暗示的であるが、最も近い明示的近似は、候補意図「complete graduation application」であり得る。第1の発話の意図として「contact instructor」が選択されるべきか「provide email」が選択されるべきか、又は更には第2の発話の意図として「finish program」が選択されるべきか「complete graduation application」が選択されるべきかの決定は、どんなアルゴリズムの定式化によるよりも、ビジネスロジックによってより良好に決定される場合がある。すなわち、ボットオーサーは、適切なビジネスロジックを適用して、そのような意図に関する最終決定に達することができる。ボットオーサーはまた、特定のビジネスドメイン内で適切なビジネス目的又は目標を達成するために、複数の意図を保持するか、又は更には意図の階層を記述することを選択することができる。
ボットオーサリングプロセスをより効率的にすることが目的であるので、本意図マイニングプロセスは、候補意図のリストを最も顕著なものに絞り込むことができ、次いで、ボットオーサーは、それらを適切性についてレビューすることができる。そのような場合、顕著性は、異なる基準に基づいて複数の方法で定義され得る。例えば、例示的な実施形態によれば、発話のセット全体における候補意図の頻度は、顕著性の指標とすることができ、すなわち、候補意図の数が多いほど、関連性がより高い。本発明の他の実施形態によれば、潜在的意味解析(Latent Semantic Analysis、LSA)に基づく基準を使用して、顕著意図を見つけることができる。LSAは、自然言語理解(NLU)タスクにおいて使用されるトピックモデリング技法である。これを行うために、候補意図アクション-オブジェクトペアに関して記述された各発話は、文書として考慮される。次に、LSAは、これらの文書とそれらが含む用語(すなわち、アクション-オブジェクトペア)との間の関係を、文書とそれらに含まれる用語とに関連する概念のセットを作り出すことによって分析する。各概念は、関連付けられた重みを有する候補意図に関して記述される。これらの重みは、各概念グループ内の候補意図の相対的な顕著性への洞察を提供する。
一例として、本発明によれば、顕著意図を識別するプロセスは、以下を含むことができる。最初に、LSAは、LSA構成要素の数が所定の制限、例えば50に設定された状態で、候補意図アクション-オブジェクトペアに関して記述された発話に適用される。次いで、各概念グループの候補意図が、それらの重みに関して降順でソートされ、上位の候補意図、例えば、上位5つが選択される。次いで、各概念グループから得られた選択された候補意図が照合され、それらの重みに関して降順に配列される。次に、重複エントリが破棄され、より高い重みを有するエントリが保持される。次いで、これらのうちの所定の数が、顕著候補意図又は単に「顕著意図」とみなされ得る。所定の数は、マイニングされる必要がある意図の最大数に基づき得る。例えば、この最大数の意図は、現実世界のコンタクトセンターインタラクションパターンに基づいて本意図マイニングプロセスによって決定されてもよく、又は、適切なビジネスロジック及び使用事例に基づいてボットオーサーによって選択されてもよい。
第4のステップ520に従って、顕著意図が意味的にグループ化される。理解されるように、候補意図を生成するために発話の構文構造のみが使用されるので、システムによって識別された顕著意図の多くが意味において類似している可能性がある。したがって、意味的に類似した顕著意図は、最適なダウンストリーム機能のために一緒にグループ化され得る。本意図マイニングプロセスの出力は、自然言語理解(NLU)モデルを訓練するために使用されてもよく、NLUモデルは、その場合、自然言語チャットボットの「頭脳」を効果的に形成する。これらのモデルが多様な発話に関連付けられた意図を識別するためには、NLUモデルは、構文的に異なるが、意味的に類似した発話によって訓練されなければならない。したがって、ボットオーサリングプロセスは、適切な多様性を有する発話に関連付けられている意図の作成を可能にしなければならない。意味的に類似した顕著意図のグループ化は、マイニングされた意図においてこの多様性を作り出すのに役立つ。
このステップは、一般に、顕著意図間の意味的類似度を計算することを含み、これは、一例として、以下のように完了され得る。最初に、顕著意図のテキストに関連付けられた埋め込み又はワード埋め込みがコンピュータ処理される。理解されるように、そのような埋め込みは、意味的に類似するテキストが類似する埋め込みを有するように、対象テキスト、例えば、ワード、フレーズ、又は文を表す。そのようなワード埋め込みは、一般に、符号化プロセスを介してテキストデータを数値フォーマットに変換することを含み、様々な従来の符号化技法を使用して、テキストデータからそのようなワード埋め込みを抽出することができる。次いで、埋め込みを効率的に比較して、テキスト間の意味的類似度の尺度を決定することができる。一例として、グローバルベクトル(又は「Global Vector
、GloVe」)は、ワードのベクトル表現を取得するために使用され得るアルゴリズムである。GloVeモデルは、例えば、300次元を有してもよい。例示的な実施形態では、顕著意図のワード埋め込みは、構成要素であるトークンのGloVe埋め込みの逆文書頻度(Inverse Document Frequency、IDF)加重平均を使用してコンピュータ処理されてもよい。理解されるように、IDFは、用語が所与の文書コーパスにおいて一般的であるのか、又は希少であるのかに関する尺度を反映する数値統計である。このように使用されると、全ての候補意図又は顕著意図の集合を、ここではIDFコンピュータ処理の目的のための文書コーパスとみなすことができる。
顕著意図のテキストに対するワード埋め込みが取得されると、ワード埋め込みは、顕著意図のペア間の意味的類似度を計算するために使用され得る。一例として、コサイン類似度を使用して、より高い次元空間におけるワード埋め込み間の意味的近さの尺度を提供することができる。これが得られると、次いで、顕著意図は、0~1の範囲に設定され得る所定の類似度閾値より大きい埋め込みのコサイン類似度を有するペアに従ってグループ化され得る。理解されるように、この閾値が高いほど、より顕著でない意図が一緒にグループ化され、それによって、より均質なグループが作り出され、一方、閾値が低いほど、より意味的に多様な意図が一緒にグループ化され、より均質でないグループが作り出され得る。上述した最大意図を選択する場合のように、この均質性値は、ボットオーサーによって選択されたシステムにおいて(例えば、0.8に)予め設定されてもよい。後者の場合、ボットオーサーは、複数の出力意図及び発話の組み合わせを見て、最適なボット結果に適した値を選択することができ得る。
第5のステップ525に従って、意図ラベルが識別される。グループ化された顕著意図(又は「顕著意図グループ」)の各々は、最終的に、マイニングされている意図(又は「マイニングされた意図」)になり得る。したがって、これらの顕著意図グループの各々について、意図ラベルが選ばれて、マイニングされた意図のラベル又は識別子として働く。例示的な実施形態によれば、このラベル付けは、所与の顕著意図グループ内の顕著意図の各々のIDFをコンピュータ処理することによって行われてもよい。この計算のために、候補意図に関して記述された発話は、文書とみなされ、単一のユニットとみなされたアクション-オブジェクトペアは、構成要素であるトークンとみなされる。次いで、最も高い計算されたIDFを有する各グループの顕著意図が、グループの意図見本又は「意図ラベル」にされ、一方、グループ内の他の顕著意図は、「意図代替」と称される。
第6のステップ530に従って、発話は、マイニングされた意図(この時点で意図ラベル及びそれぞれの顕著意図グループによって反映された、マイニングされた意図の各々)に関連付けられる。理解されるように、この次のステップは、マイニングされた意図の各々に関連付けられる発話を決定する。前のステップと同様に、埋め込みを使用する意味的類似度技法もここで使用することができる。例えば、意味的類似度は、意図を有する発話の各々から導出された候補意図と、所与の顕著意図グループ内の顕著意図の各々との間でコンピュータ処理される。次いで、発話は、その構成要素である候補意図のいずれかの類似度が、その顕著意図グループの顕著意図に対して最高であり、また、最小閾値(例えば、0.8)を上回ると決定された場合、その所与の顕著意図グループ(マイニングされた意図又は単純に意図とも称され得る)に関連付けられる。更に、顕著意図グループの各々に関して、各特定の顕著意図グループとの最も高い類似度を作り出した意図を有する発話の候補意図は、「意図補助」として、その特定の顕著意図グループに持ち込まれ得る。ここでも、最小閾値が必要とされてもよい。したがって、このステップ内で、特定の意図を有する発話は、顕著意図グループのうちの1つに関連付けられ、その特定の意図を有する発話の構成要素である候補意図は、意図補助としてそれぞれの顕著意図グループに関連付けられる。したがって、マイニングされた各意図は、前述のように、意図ラベル、並びに1つ以上の意図代替及び/又は1つ以上の意図補助を含むことができる。理解されるように、そのような定式化は、単一の意図を有する発話が複数の意図グループに関連付けられる可能性を妨げない。これは、単一の意図を有する発話が、複数のマイニングされた意図にわたって異なるものに意図補助として追加される複数の候補意図を有し得るためである。これは、ダウンストリーム機能においてより大きい柔軟性及び堅牢性を導入する。ボットオーサーは、1つ以上のグループからのそのような発話を保持又は破棄することを選択することができる。複数の意図にわたって繰り返される発話は、NLUモデルに対して、それらに存在する固有の混乱について教示するのに役立ち、したがって、より現実的で堅牢なモデルを構築するのに役立つことが観察されている。
別のステップ(図なし)によれば、発話内の個人的に識別可能な情報が除去又はマスキングされる。顧客のプライバシーを確保するために、関連付けられた発話内に存在する全ての個人的に識別可能な情報がマスキングされる。もちろん、このステップは、入力会話が本意図マイニングプロセスに提供される前に匿名化される場合には省略することができる。このような個人的に識別可能な情報としては、顧客名、電話番号、電子メールアドレス、社会保障などが挙げられ得る。これに加えて、地理的位置、日付及び数字に関連するエンティティは、追加の予防措置としてマスキングされ得る。例えば、この発話「Hi,I need to book a flight from Washington
D.C.to Miami on August 15 under the name of John Honai.」を検討されたい。マスキングの後、発話は、「Hi,I need to book a flight from<GEO><GEO>to<GEO>on<DATE><DATE>under the name of<PERSON><PERSON>.」になり得る。プライバシーを保護することに加えて、そのようなマスキングは、ボットオーサーが意図の発話内に存在する異なるエンティティを迅速に識別することを可能にし得る。これは、ボットオーサーが、同様の発話であるが、これらのエンティティに対するスロット値が変化する発話を作成するのに役立ち得る。これは、発話におけるより大きい多様性につながり、より良いNLUモデルの作成に更に役立つ。
別の可能なステップ(図示せず)によれば、意図分析をコンピュータ処理することができる。すなわち、意図及び関連付けられた発話をマイニングすることとは別に、本意図マイニングプロセスはまた、企業が顧客インタラクションパターンを識別するのを支援する、会話データに関連する分析及びメトリックを作り出し得る。2つのそのようなメトリックは以下の通りである。
第1の分析は、意図ボリューム分析であり、これは、会話が特定の意図を扱う程度に関する分析である。この分析は、百分率で表すこともできる。意図ボリューム分析は、会話データ内の意図の発生頻度に基づいて、意図の相対的な重要性を理解するのを支援することができる。各会話から単一の発話のみが取られるので、このメトリックは、本質的に、各意図に属する発話の数になる。
第2の分析は、意図持続時間分析であり、これは、特定の意図を扱う会話の持続時間に関する分析である。この分析は、百分率で表すこともできる。理解されるように、このメトリックは、意図に関連付けられた総会話時間に基づいて意図を比較するのに役立つ。会話に要する時間は、最後の顧客/エージェントタイムスタンプと最初の顧客/エージェントタイムスタンプとの差としてコンピュータ処理される。意図に属する個々の会話の持続時間の合計は、その意図の持続時間を与える。理解されるように、このタイプの分析は、ボットオーサー及びビジネスが顧客及びコンタクトセンタースタッフをより良く理解するのを支援することができる。
ここで、会話型ボット及び意図マイニングをオーサリングするための方法について説明する。本方法は、会話データを受信することであって、会話データが、顧客と顧客サービス担当者との間の会話から導出されたテキストを含む、受信することと、意図マイニングアルゴリズムを使用して、会話データから意図を自動的にマイニングすることであって、マイニングされた意図の各々が、意図ラベル、意図代替、及び関連付けられた発話を含む、マイニングすることと、マイニングされた意図を会話型ボットにアップロードし、会話型ボットを使用して他の顧客との自動化された会話を行うことと、を含み得る。
例示的な実施形態によれば、意図マイニングアルゴリズムは、会話データの会話内で発生する発話を分析して、意図を有する発話を識別することを含むことができる。発話は各々、会話内のターンを含むことができ、それによって、顧客は、顧客発話の形態で、又は顧客サービス担当者は、顧客サービス担当者発話の形態で、通信している。また、意図を有する発話は、意図を表現する可能性が高いと決定された発話の1つとして定義される。意図マイニングアルゴリズムは、識別された意図を有する発話を分析して、候補意図を識別することを更に含むことができる。候補意図は各々、目的又はタスクを記述するワード又はフレーズを含み得るアクションと、アクションが動作するオブジェクト又は物事を記述するワード又はフレーズを含み得るオブジェクトとの2つの部分を有する、意図を有する発話のうちの1つ内で発生するテキストフレーズであるものとして識別され得る。意図マイニングアルゴリズムは、1つ以上の基準に従って、候補意図から顕著意図を選択することを更に含むことができる。意図マイニングアルゴリズムは、選択された顕著意図を、顕著意図間の意味的類似度の度合いに従って顕著意図グループにグループ化することを更に含むことができる。意図マイニングアルゴリズムは、顕著意図グループの各々について、顕著意図のうちの1つを意図ラベルとして選択し、顕著意図のうちの他のものを意図代替として指定することを更に含むことができる。意図マイニングアルゴリズムは、意図を有する発話内に存在する候補意図と、顕著意図グループの各々内の意図代替との間の意味的類似度の度合いを決定することを介して、意図を有する発話を顕著意図グループに関連付けることを更に含むことができる。マイニングされた意図は各々、顕著意図グループのうちの所与の1つであって、各々が、意図ラベルとして選択された顕著意図のうちの1つ、及び代替意図として指定された顕著意図のうちの他のものによって定義される、所与の1つと、顕著意図グループのうちの所与の1つに関連付けられた意図を有する発話とを含むことができる。
例示的な実施形態によれば、意図を有する発話を識別するステップは、顧客発話の第1の部分を、意図を有する発話として選択し、会話データ内の顧客発話の第2の部分を破棄することを含むことができる。顧客発話の第1の部分は、会話の各々の始めに発生する所定の数の連続する顧客発話として定義されてもよく、第2の部分は、会話の各々の残りとして定義されてもよい。
例示的な実施形態によれば、意図を有する発話を識別するステップは、ワードカウント制約を満たさない顧客発話の第1の部分内の顧客発話を破棄することを更に含むことができる。ワードカウント制約は、最小ワードカウント制約であって、最小ワードカウント制約より少ないワードを有する顧客発話の第1の部分内の顧客発話が破棄される、最小ワードカウント制約、及び/又は最大ワードカウント制約であって、最大ワードカウント制約より多いワードを有する顧客発話の第1の部分内の顧客発話が破棄される、最大ワードカウント制約を含むことができる。最小ワードカウント制約は、2~5ワードの値を含むことができる。最大ワードカウント制約は、40~50ワードの値を含むことができる。
例示的な実施形態によれば、意図を有する発話を識別するステップは、会話の各々の第1の部分内で発生する顧客発話を、組み合わされた顧客発話に連結することを含むことができる。
例示的な実施形態によれば、候補意図を識別するステップは、構文依存パーサーを使用して、意図を有する発話の文法構造を分析して、ヘッド-トークンペアを識別することであって、各ヘッド-トークンペアが、トークンワードによって修飾されたヘッドワードを含む、識別することと、意図を有する発話の品詞をタグ付けするために品詞(以下、「POS」)タグ付けを使用し、ヘッドワードのPOSタグが名詞タグを含み得、かつトークンワードのPOSタグが動詞タグを含み得るヘッド-トークンペアを候補意図として識別することと、を含むことができる。
例示的な実施形態によれば、候補意図から顕著意図を選択するステップは、候補意図のうち、意図を有する発話において候補意図のうちの他のものより頻繁に現れると決定されたものを選択することを含むことができる。顕著意図が候補意図から選択される1つ以上の基準は、潜在的意味解析(LSA)に基づく基準を含み得る。候補意図から顕著意図を選択するステップは、候補意図のそれぞれのものに対応する文書を有する文書のセットを生成することであって、文書の各々が、候補意図のうちの対応する1つによって定義されるアクション-オブジェクトペアをカバーする、生成することと、文書のセットに含まれるアクション-オブジェクトペアに現れる用語に基づいて概念グループを生成することと、概念グループの各々についての候補意図の各々について重み値を計算することであって、重み値が、文書のうちの所与の1つの候補意図と、概念グループのうちの所与の1つとの間の関連性の度合いを測定する、計算することと、顕著意図として、概念グループの各々における所定の数の候補意図を選択し、それに基づいてより高い度合いの関連性を示す重み値を作り出すことと、を含むことができる。
例示的な実施形態によれば、意味的類似度の度合いに従って顕著意図をグループ化するステップは、顕著意図の各々について埋め込みを計算することであって、埋め込みが、意味的に類似するテキストが類似する符号化表現を有するテキストの符号化表現を含み得る、計算することと、計算された埋め込みを比較して、顕著意図のペア間の意味的類似度の度合いを決定することと、所定の閾値を上回る意味的類似度の度合いを有する顕著意図をグループ化することと、を含むことができる。埋め込みは、顕著意図の構成要素であるヘッド-トークンペアのグローバルベクトル埋め込みの逆文書頻度(IDF)平均として計算されてもよい。計算された埋め込みを比較することは、コサイン類似度を含むことができる。
例示的な実施形態によれば、顕著意図グループの各々に意図識別子をラベル付けするステップは、顕著意図グループの各々内で顕著意図のうちの代表的な1つを選択することを含むことができる。
例示的な実施形態によれば、会話データからの発話を顕著意図グループに関連付けるステップは、顕著意図グループの各々に関連して意図を有する発話の各々をカバーするために第1のプロセスを繰り返し実行することを含むことができる。第1及び第2の顕著意図グループと、第1及び第2の候補意図を含む第1の意図を有する発話とを伴う例示的な第1のケースに関連して記述される場合、第1のプロセスは、第1及び第2の候補意図の各々と、第1の顕著意図グループ内の意図代替の各々との間の意味的類似度の度合いをコンピュータ処理することと、第1及び第2の候補意図の各々と、第2の顕著意図グループ内の意図代替の各々との間の意味的類似度の度合いをコンピュータ処理することと、意図代替のうちのどれが最も高いコンピュータ処理された意味的類似度の度合いを作り出したかを決定することと、第1の意図を有する発話を、第1及び第2の顕著意図グループのうち、最も高いコンピュータ処理された意味的類似度の度合いを作り出すと決定された意図代替を含む方に関連付けることと、を含むことができる。会話データからの発話を顕著意図グループに関連付けるステップは、最も高いコンピュータ処理された意味的類似度の度合いが所定の類似度閾値も超えることが分かった場合にのみ、最も高いコンピュータ処理された意味的類似度の度合いを作り出す意図代替を関連付けることを更に含むことができる。
次に図10を参照すると、代替ボットオーサリングワークフローの様々な段階が示されており、図9に関連して上記で開示された意図マイニング方法は、意図プロセスのシーディングによって拡張されている。意図シーディングプロセスを使用する意図マイニングのプロセスは、簡単な紹介の後に以下で論じられる。参照を区別するのを容易にするために、意図シーディングを使用する意図マイニングのプロセスは、以降、「シーディングによる意図マイニングプロセス」又は単に「シーディングによる意図マイニング」と称され、一方、図9に関連して上記で開示された意図マイニング(すなわち、シーディングを伴わない意図マイニング)の前述のプロセスは、以降、「一般的な意図マイニングプロセス」又は単に「一般的な意図マイニング」と称される。
通常の動作モードでは、一般的な意図マイニングは、意図ラベル及びそれに関連付けられた発話の両方の意図を、エージェント-顧客会話の集合などの会話データからマイニングする。既に論じたように、このプロセスは、会話の構文構造及び意味内容によって案内される。例えば、構文依存関係及びPOSタグを使用して、会話内の意図を有する発話から候補意図を見つけることができ、潜在的意味解析(LSA)のような方法を使用して、発話から顕著意図を絞り込むことができる。次いで、意図ラベル、意図代替、及び意図補助は、意味的に類似する顕著意図を関連付けることによって取得され、これは、発話を特定の意図にリンクするのに役立つ。既に開示されているように、ボットオーサーは、一般的な意図マイニングを介してマイニングされたデータを使用して、NLUモデルを訓練することができ、次いで、NLUモデルが会話型ボットにパワーを供給する。
意図マイニングのこの一般的なフレームワークは、ボットオーサーが会話データ内に典型的に存在する意図に気づいていないという仮定、及び/又はNLUモデルが会話又は同様の会話ドメインの集合に関してまだ開発されていないという仮定から進行することが理解されよう。したがって、一般的な意図マイニングプロセス、例えば、上記で開示された意図マイニングエンジンを使用するプロセスは、本質的に、事前のドメイン知識なしで始まり、データの会話内容のみに基づいて意図を導出又はマイニングする。
しかしながら、多くの場合、この仮定は当てはまらない。すなわち、ボットオーサーは、特定のドメイン内の意図に関する知識を既に有している場合がある。そのような場合、ボットオーサーは、特定の会話に通常存在するか、又は特定の会話ドメインに存在することが予想される意図を理解することができる。これは、例えば、銀行又は旅行ドメインにおいて真であり得る。更に、多くの場合、NLUモデルは既に訓練されている場合があり、旅行又は銀行ボットのようなボットは、ボットオーサーによって既に公開されている。そのようなシナリオでは、既存のドメイン知識を使用して、意図シーディングプロセスを使用することによって、特定の意図をマイニングするように意図マイニングプロセスを案内することができる。理解されるように、シーディングによる意図マイニングの一部として、既存のドメイン知識は、シード意図データの形態でマイニングプロセスに供給される。そのようなシード意図データは、「シード意図」又は「シード意図ラベル」と称され得る意図ラベルと、各々に関連付けられたサンプル発話とから構成され得る。次いで、本意図マイニングプロセスは、このシード意図データを使用して、シード意図の各々について会話データからより多くの発話をマイニングする一方で、会話データ内で見つけることができる任意の他の顕著意図についての発話も見つける。上述したように、このマイニングプロセスは、本明細書では「シーディングによる意図マイニングプロセス」又は単に「シーディングによる意図マイニング」と称される。
理解されるように、シーディングによる意図マイニングは、ボットオーサーがシード意図に属するより多くの発話を迅速に識別するのを支援することができ、このことは、NLUモデルを訓練又は改善するために使用され得る。そのようなシステムは、所与のシード意図に加えて他の顕著意図をマイニングすることができるので、このプロセスは、ボットオーサーが異なる時間フレームに対して変化する顧客意図を識別するのに役立ち得る。
上述した一般的な意図マイニング方法と同様に、意図をシーディングする意図マイニングのプロセスは、会話データをインポートすることを介して開始され得る。概して、シーディングによる本意図マイニングの他のステップは、一般的な意図マイニングに関連して上記で開示されたステップと同じ又は同様であり得る。したがって、簡潔な説明のために、シーディングによる意図マイニングが、図9に関連して上記で提示された一般的な意図マイニングプロセスとは異なる領域に主に注目する。
本発明によれば、シーディングによる意図マイニングは、シード意図データを使用する。シード意図データは、本明細書で使用される場合、1つ以上のシード意図と、1つ以上のシード意図の各々について、関連するサンプル発話のセットとを含む。シーディングによる意図マイニングは、次いで、シード意図データを会話データと共に処理して、シード意図に関連付けるための意図代替及び/又は他の発話を取得する。そのような意図代替は、上記のセクションで与えられた候補意図を生成するのとほぼ同じ方法で取得される。この場合、シード意図及び関連付けられたサンプル発話は、会話データ内で顧客によって提供される意図を有する発話とみなされる。それらから取得された正規化されたアクション-オブジェクトペアは、各シード意図の意図代替を構成する。
各シード意図に対して意図代替が取得されると、図9に関連して上記で説明したように、会話データから導出された候補意図のセットからシード意図補助が識別される。シード意図補助を見つけ、発話及びシード意図を関連付けるステップに関して、シーディングによる意図マイニングプロセスは、一般的な意図マイニングプロセスにおいて上述したものと同じ又は同様であり得る。前のセクションと同様に、埋め込みを使用する意味的類似度技法もここで使用することができる。類似度は、意図を有する発話の各々の候補意図と、各シード意図の意図代替との間でコンピュータ処理され得る。意図を有する発話は、a)意図を有する発話の構成要素である候補意図のいずれかの意味的類似度が、そのシード意図の意図代替に対して最も高く、b)意味的類似度が最小閾値を上回る(例えば、0.8のスコアを上回る)と決定された場合、シード意図に関連付けられる。更に、前述のように、シード意図のうちの1つに関して最高の類似度スコアを作り出す候補意図は、「意図補助」として、又はより具体的には、「シード意図補助」としてシード意図に持ち込まれる。
シーディングによる意図マイニングはまた、シード意図データにおいて識別された意図とは異なる、会話データ内に見出される他の顕著意図を導出することを含むことができる。そのような顕著意図を識別することに関して、シーディングによる意図マイニングプロセスは、一般的な意図マイニングプロセスにおいて上述したものと同じ又は同様であり得る。すなわち、候補意図が識別され、次いで、概念グループ内のものが重みに関してソートされ、グループからの所定の数のより高い重み付けされた候補意図が選択される。これらの選択された候補意図のうち、重複エントリは破棄され、より高い重みを有するエントリが、保持されるエントリとなる。このステップを完了する際に、シーディングによる意図マイニングプロセスは、一般的な意図マイニングに関して上記で開示されたものからの追加の手順を含むことができる。具体的には、この追加の手順は、シード意図補助として既に識別されている、識別された候補意図のいずれかを破棄することを含む。
次のステップは、マイニングされた意図に関連付けられた発話を見つけることである。前のセクションと同様に、埋め込みを使用する意味的類似度技法がここで使用される。類似度は、発話の候補意図と全てのグループの意図との間でコンピュータ処理される。発話は、その構成要素である候補意図のいずれかの類似度が、そのグループの意図に対して最も高く、かつ最小閾値(例えば、0.8)を上回る場合、意図グループに関連付けられる。最も高い類似度を作り出した候補意図は、グループに持ち込まれ、「意図補助」と呼ばれる。シード意図補助として既に識別されている候補意図は、この実行から破棄される。
シーディングを伴わない意図マイニング(すなわち、図9に関連して説明された一般的な意図マイニングプロセス)、及びシーディングを伴う意図マイニング(すなわち、図10に関連して説明されたシーディングによる意図マイニングプロセス)に関して上記で議論される機能が与えられると、いくつかの異なる使用事例又は用途が可能であることを理解されたい。第1のケースでは、意図マイニングは、シーディングなしで実行される。これは、所与の会話データから、顕著意図及びそれに関連付けられた発話をマイニングするために使用され得る。第2のケースは、一般的な意図マイニングとシーディングによる意図マイニングとが実行される混在したケースを含む。理解されるように、このケースを所与の会話データに対して使用して、顕著意図及び関連付けられた発話の両方、並びにシード意図の所与のセットに関連付けるためのより多くの発話をマイニングすることができる。第3のケースでは、シーディングを伴う意図マイニングは、意図シードの所定のセットに集中したマイニングを提供するために使用される。この最後のケースを使用して、所定のセット内のシード意図の各々に関連付けるための追加の発話をマイニングすることができる。
特に図10を参照すると、意図シードを使用した意図マイニングのための方法600が提供されている。例示的な実施形態では、方法600は、シード意図を受信する最初のステップ605を含む。シード意図の各々は、意図ラベル、及びサンプル意図を有する発話を含む。ステップ610において、会話データから意図を有する発話が識別される。ステップ615において、意図を有する発話から候補意図が選択される。ステップ620において、サンプル意図を有する発話からシード意図代替が識別される。次いで、ステップ625において、新しい発話がシード意図に関連付けられる。次にこれらのステップについて、以下の実施例においてより詳細に説明する。
例示的な実施形態によれば、意図シーディングを使用して会話型ボット及び意図マイニングをオーサリングするためのコンピュータ実装方法が提供される。本方法は、会話データを受信することであって、会話データが、会話から導出されたテキストを含み、会話の各々が、顧客と顧客サービス担当者との間のものである、受信することと、シード意図を含み得るシード意図データを受信することであって、シード意図の各々が、シード意図ラベルと、シード意図に関連付けられたサンプル意図を有する発話とを含む、受信することと、意図マイニングアルゴリズムを使用して、会話データを自動的にマイニングして、シード意図に関連付けるべき新しい発話を決定することと、シード意図に関連付けられたマイニングされた新しい発話を含むようにシード意図データを拡張することと、拡張されたシード意図データを会話型ボットにアップロードし、会話型ボットを使用して他の顧客との自動化された会話を行うことと、を含むことができる。
シード意図を用いたマイニングの場合、意図マイニングアルゴリズムは、会話データの会話内で発生する発話を分析して、意図を有する発話を識別することを含むことができる。発話は各々、会話内のターンを含むことができ、それによって、顧客は、顧客発話の形態で、又は顧客サービス担当者は、顧客サービス担当者発話の形態で、通信している。意図を有する発話は、意図を表現する可能性が高いと決定された発話のうちの1つとして定義され得る。意図マイニングアルゴリズムは、識別された意図を有する発話を分析して、候補意図を識別することを更に含むことができる。候補意図は各々、目的又はタスクを記述するワード又はフレーズを含み得るアクションと、アクションが動作するオブジェクト又は物事を記述するワード又はフレーズを含み得るオブジェクトとの2つの部分を有する、意図を有する発話のうちの1つ内で発生するテキストフレーズであるものとして識別される。意図マイニングアルゴリズムは、シード意図の各々について、シード意図に関連付けられたサンプル意図を有する発話からシード意図代替を識別することを更に含むことができる。シード意図代替は、目的又はタスクを記述するワード又はフレーズを含み得るアクションと、アクションが動作するオブジェクト又は物事を記述するワード又はフレーズを含み得るオブジェクトとの2つの部分を含み得る、サンプル意図を有する発話のうちの1つ内で発生するテキストフレーズであるとして識別される。意図マイニングアルゴリズムは、意図を有する発話内に存在する候補意図と、シード意図ラベルの各々に属するシード意図代替との間の意味的類似度の度合いを決定することを介して、会話データからの意図を有する発話をシード意図に関連付けることを更に含むことができる。
例示的な実施形態によれば、意図を有する発話を識別するステップは、顧客発話の第1の部分を、意図を有する発話として選択し、会話データ内の顧客発話の第2の部分を破棄することを含むことができる。顧客発話の第1の部分は、会話の各々の始めに発生する所定の数の連続する顧客発話として定義されてもよく、第2の部分は、会話の各々の残りとして定義されてもよい。意図を有する発話を識別するステップは、ワードカウント制約を満たさない顧客発話の第1の部分内の顧客発話を破棄することを更に含むことができる。ワードカウント制約は、最小ワードカウント制約であって、最小ワードカウント制約より少ないワードを有する顧客発話の第1の部分内の顧客発話が破棄される、最小ワードカウント制約、及び/又は最大ワードカウント制約であって、最大ワードカウント制約より多いワードを有する顧客発話の第1の部分内の顧客発話が破棄される、最大ワードカウント制約を含むことができる。
例示的な実施形態によれば、候補意図を識別するステップは、構文依存パーサーを使用して、意図を有する発話の文法構造を分析して、ヘッド-トークンペアを識別することであって、各ヘッド-トークンペアが、トークンワードによって修飾されたヘッドワードを含む、識別することと、意図を有する発話の品詞をタグ付けするために品詞(以下、「POS」)タグ付けを使用し、ヘッドワードのPOSタグが名詞タグを含み得、かつトークンワードのPOSタグが動詞タグを含み得るヘッド-トークンペアを候補意図として識別することと、を含むことができる。
例示的な実施形態によれば、シード意図代替を識別するステップは、構文依存パーサーを使用して、サンプル意図を有する発話の文法構造を分析して、ヘッド-トークンペアを識別することであって、各ヘッド-トークンペアが、トークンワードによって修飾されたヘッドワードを含む、識別することと、サンプル意図を有する発話の品詞をタグ付けするために品詞(以下、「POS」)タグ付けを使用し、ヘッドワードのPOSタグが名詞タグを含み得、かつトークンワードのPOSタグが動詞タグを含み得るヘッド-トークンペアを候補意図として識別することと、を含むことができる。
例示的な実施形態によれば、会話データからの意図を有する発話をシード意図に関連付けるステップは、シード意図の各々に関連して意図を有する発話の各々をカバーするために第1のプロセスを繰り返し実行することを含むことができ、第1及び第2のシード意図、並びに第1及び第2の候補意図を含む第1の意図を有する発話を伴う例示的な第1のケースに関連して記述される場合。第1のプロセスは、第1及び第2の候補意図の各々と、第1のシード意図内の意図代替の各々との間の意味的類似度の度合いをコンピュータ処理することと、第1及び第2の候補意図の各々と、第2のシード意図内の意図代替の各々との間の意味的類似度の度合いをコンピュータ処理することと、意図代替のうちのどれが最も高いコンピュータ処理された意味的類似度の度合いを作り出したかを決定することと、第1の意図を有する発話を、第1及び第2のシード意図のうち、最も高いコンピュータ処理された意味的類似度の度合いを作り出すと決定された意図代替を含む方に関連付けることと、を含むことができる。
代替使用事例では、本発明の方法は、意図マイニングアルゴリズムを使用して、シード意図の所与のセットに関連付けるための新しい発話をマイニングすることと共に、新しい意図を自動的にマイニングすることを含む。そのような場合、本方法は、マイニングされた新しい意図を含むようにシード意図データを拡張することを含むことができる。この場合、意図マイニングアルゴリズムは、1つ以上の基準に従って、シード意図のうちの1つにまだ関連付けられていない意図を有する発話(以下、「関連付けられていない意図を有する発話」)内に存在する候補意図から顕著意図を選択することと、選択された顕著意図を、顕著意図間の意味的類似度の度合いに従って顕著意図グループにグループ化することと、顕著意図グループの各々について、顕著意図のうちの1つを意図ラベルとして選択し、他の顕著意図を意図代替として指定することと、関連付けられていない意図を有する発話内に存在する候補意図と、顕著意図グループの各々内の意図代替との間の意味的類似度の度合いを決定することを介して、会話データからの関連付けられていない意図を有する発話を顕著意図グループに関連付けることと、を更に含むことができる。新しいマイニングされた意図は各々、顕著意図グループのうちの所与の1つであって、各々が、意図ラベルとして選択された顕著意図のうちの1つ、及び代替意図として指定された顕著意図のうちの他のものによって定義される、所与の1つと、顕著意図グループのうちの所与の1つに関連付けられるようになる、関連付けられていない意図を有する発話とを含むことができる。
例示的な実施形態によれば、候補意図を識別するステップは、構文依存パーサーを使用して、意図を有する発話の文法構造を分析して、ヘッド-トークンペアを識別することであって、各ヘッド-トークンペアが、トークンワードによって修飾されたヘッドワードを含む、識別することと、意図を有する発話の品詞をタグ付けするために品詞(以下、「POS」)タグ付けを使用し、ヘッドワードのPOSタグが名詞タグを含み得、かつトークンワードのPOSタグが動詞タグを含み得るヘッド-トークンペアを候補意図として識別することと、を含むことができる。
例示的な実施形態によれば、顕著意図が候補意図から選択される1つ以上の基準は、潜在的意味解析(LSA)に基づく基準を含むことができる。候補意図から顕著意図を選択するステップは、候補意図のそれぞれのものに対応する文書を有する文書のセットを生成することであって、文書の各々が、候補意図のうちの対応する1つによって定義されるアクション-オブジェクトペアをカバーする、生成することと、文書のセットに含まれるアクション-オブジェクトペアに現れる用語に基づいて概念グループを生成することと、概念グループの各々についての候補意図の各々について重み値を計算することであって、重み値が、文書のうちの所与の1つの候補意図と、概念グループのうちの所与の1つとの間の関連性の度合いを測定する、計算することと、顕著意図として、概念グループの各々における所定の数の候補意図を選択し、それに基づいてより高い度合いの関連性を示す重み値を作り出すことと、を含むことができる。
例示的な実施形態によれば、意味的類似度の度合いに従って顕著意図をグループ化するステップは、顕著意図の各々について埋め込みを計算することであって、埋め込みが、意味的に類似するテキストが類似する符号化表現を有するテキストの符号化表現を含み得る、計算することと、計算された埋め込みを比較して、顕著意図のペア間の意味的類似度の度合いを決定することと、所定の閾値を上回る意味的類似度の度合いを有する顕著意図をグループ化することと、を含むことができる。埋め込みは、顕著意図の構成要素であるヘッド-トークンペアのグローバルベクトル埋め込みの逆文書頻度(IDF)平均として計算される。計算された埋め込みを比較することは、コサイン類似度を含むことができる。
例示的な実施形態によれば、会話データからの関連付けられていない意図を有する発話を、顕著意図グループに関連付けるステップは、顕著意図グループの各々に関連して、関連付けられていない意図を有する発話の各々をカバーするために第1のプロセスを繰り返し実行することを含むことができる。第1及び第2の顕著意図グループ、並びに第1及び第2の候補意図を含む第1の関連付けられていない意図を有する発話を伴う例示的な第1のケースに関連して記述される場合、第1のプロセスは、第1及び第2の候補意図の各々と、第1の顕著意図グループ内の意図代替の各々との間の意味的類似度の度合いをコンピュータ処理することと、第1及び第2の候補意図の各々と、第2の顕著意図グループ内の意図代替の各々との間の意味的類似度の度合いをコンピュータ処理することと、意図代替のうちのどれが最も高いコンピュータ処理された意味的類似度の度合いを作り出したかを決定することと、第1の関連付けられていない意図を有する発話を、第1及び第2の顕著意図グループのうち、最も高いコンピュータ処理された意味的類似度の度合いを作り出すと決定された意図代替を含む方に関連付けることと、を含むことができる。
当業者には理解されるように、いくつかの例示的な実施形態に関連して上述した多くの様々な特徴及び構成は、本発明の他の可能な実施形態を形成するために、更に選択的に適用され得る。簡潔にするために、及び当業者の能力を考慮して、可能な反復の各々は、詳細に提供又は論じられないが、以下のいくつかの請求項によって包含される全ての組み合わせ及び可能な実施形態又はその他のものは、本出願の一部であることが意図される。更に、本発明の様々な例示的な実施形態の上記の記載から、当業者は、改良、変更、及び修正を理解するであろう。当業者の技能の範囲内のそのような改良、変更及び修正もまた、添付の特許請求の範囲によって網羅されることが意図される。更に、上記は、本出願の説明された実施形態のみに関するものであり、以下の特許請求の範囲及びその均等物によって定義される本出願の趣旨及び範囲から逸脱することなく、本明細書において多数の変更及び修正を行うことができることは明らかであろう。

Claims (26)

  1. 会話型ボットをオーサリングするためのコンピュータ実装方法であって、
    会話から導出されたテキストを含み、前記会話の各々が、顧客と顧客サービス担当者との間のものである会話データを受信することと、
    シード意図を含むシード意図データを受信することであって、前記シード意図の各々が、シード意図ラベルと、前記シード意図に関連付けられたサンプル意図を有する発話とを含む、受信することと、
    意図マイニングアルゴリズムを使用して、前記会話データを自動的にマイニングして、前記シード意図に関連付ける新しい発話を決定することと、
    前記シード意図に関連付けられたマイニングされた前記新しい発話を含むように前記シード意図データを拡張することと
    前記拡張されたシード意図データを前記会話型ボットにアップロードし、前記会話型ボットを使用して他の顧客との自動化された会話を行うことと、を含み、
    前記意図マイニングアルゴリズムは、
    前記会話データの前記会話内で発生する発話を分析して、意図を有する発話を識別することであって、
    前記発話が各々、前記会話内のターンを含み、それによって、前記顧客が、顧客発話の形態で、又は前記顧客サービス担当者が、顧客サービス担当者発話の形態で、通信しており、
    意図を有する発話は、意図を表現する可能性が高いと決定された前記発話のうちの1つとして定義される、識別することと、
    識別された前記意図を有する発話を分析して、候補意図を識別することであって、前記候補意図が各々、目的又はタスクを記述するワード若しくはフレーズを含むアクションと、前記アクションが動作するオブジェクト又は物事を記述するワード若しくはフレーズを含むオブジェクトとの2つの部分を有する、前記意図を有する発話のうちの1つ内で発生するテキストフレーズであるものとして識別される、識別することと、
    前記シード意図の各々について、前記シード意図に関連付けられた前記サンプル意図を有する発話からシード意図代替を識別することであって、前記シード意図代替が、目的又はタスクを記述するワード若しくはフレーズを含むアクションと、前記アクションが動作するオブジェクト又は物事を記述するワード若しくはフレーズを含むオブジェクトとの2つの部分を含む、前記サンプル意図を有する発話のうちの1つ内で発生するテキストフレーズであるものとして識別される、識別することと、
    前記意図を有する発話内に存在する前記候補意図と、前記シード意図ラベルの各々に属する前記シード意図代替との間の意味的類似度の度合いを決定することを介して、前記会話データからの前記意図を有する発話を前記シード意図に関連付けることと、を含む、方法。
  2. 前記意図を有する発話を前記識別することが、前記顧客発話の第1の部分を、前記意図を有する発話として選択し、前記会話データ内の前記顧客発話の第2の部分を破棄することを含み、
    顧客発話の前記第1の部分が、前記会話の各々の始めに発生する所定の数の連続する顧客発話として定義され、前記第2の部分が、前記会話の各々の残りとして定義される、請求項1に記載の方法。
  3. 前記意図を有する発話を前記識別することが、ワードカウント制約を満たさない顧客発話の前記第1の部分内の前記顧客発話を破棄することを更に含み、
    前記ワードカウント制約は、
    最小ワードカウント制約であって、最小ワードカウント制約より少ないワードを有する顧客発話の前記第1の部分内の前記顧客発話が破棄される、最小ワードカウント制約と、
    最大ワードカウント制約であって、前記最大ワードカウント制約より多くのワードを有する顧客発話の前記第1の部分内の前記顧客発話が破棄される、最大ワードカウント制約と、を含む、請求項2に記載の方法。
  4. 候補意図を前記識別することは、
    構文依存パーサーを使用して、前記意図を有する発話の文法構造を分析して、ヘッド-トークンペアを識別することであって、各ヘッド-トークンペアが、トークンワードによって修飾されたヘッドワードを含む、識別することと、
    前記意図を有する発話の品詞をタグ付けするために品詞(以下、「POS」)タグ付けを使用し、前記ヘッドワードの前記POSタグが名詞タグを含み、かつ前記トークンワードの前記POSタグが動詞タグを含む前記ヘッド-トークンペアを前記候補意図として識別することと、を含む、請求項1に記載の方法。
  5. シード意図代替を前記識別することは、
    構文依存パーサーを使用して、前記サンプル意図を有する発話の文法構造を分析して、ヘッド-トークンペアを識別することであって、各ヘッド-トークンペアが、トークンワードによって修飾されたヘッドワードを含む、識別することと、
    前記サンプル意図を有する発話の品詞をタグ付けするために品詞(以下、「POS」)タグ付けを使用し、前記ヘッドワードの前記POSタグが名詞タグを含み、かつ前記トークンワードの前記POSタグが動詞タグを含む前記ヘッド-トークンペアを前記候補意図として識別することと、を含む、請求項1に記載の方法。
  6. 前記会話データからの前記意図を有する発話を前記シード意図に前記関連付けることは、前記シード意図の各々に関連して前記意図を有する発話の各々をカバーするために第1のプロセスを繰り返し実行することを含み、第1及び第2のシード意図と、第1及び第2の候補意図を含む第1の意図を有する発話とを伴う例示的な第1のケースに関連して記述される場合、前記第1のプロセスが、
    前記第1及び第2の候補意図の各々と、前記第1のシード意図内の前記意図代替の各々との間の意味的類似度の度合いをコンピュータ処理することと、
    前記第1及び第2の候補意図の各々と、前記第2のシード意図内の前記意図代替の各々との間の意味的類似度の度合いをコンピュータ処理することと、
    前記意図代替のうちのどれが最も高いコンピュータ処理された前記意味的類似度の度合いを作り出したかを決定することと、
    前記第1の意図を有する発話を、前記第1及び第2のシード意図のうち、最も高いコンピュータ処理された前記意味的類似度の度合いを作り出すと決定された前記意図代替を含む方に関連付けることと、を含む、請求項5に記載の方法。
  7. 前記意図マイニングアルゴリズムを使用して、新しい意図を自動的にマイニングすることであって、マイニングされた前記新しい意図の各々が、意図ラベル、意図代替、及び関連付けられた発話を含む、マイニングすることと、
    マイニングされた前記新しい意図を含むように前記シード意図データを拡張することと、を更に含み、
    前記意図マイニングアルゴリズムが、
    1つ以上の基準に従って、前記シード意図のうちの1つにまだ関連付けられていない前記意図を有する発話(以下、「関連付けられていない意図を有する発話」)内に存在する前記候補意図から顕著意図を選択することと、
    選択された前記顕著意図を、前記顕著意図間の意味的類似度の度合いに従って顕著意図グループにグループ化することと、
    前記顕著意図グループの各々について、前記顕著意図のうちの1つを前記意図ラベルとして選択し、他の前記顕著意図を意図代替として指定することと、
    前記関連付けられていない意図を有する発話内に存在する前記候補意図と、前記顕著意図グループの各々内の前記意図代替との間の意味的類似度の度合いを決定することを介して、前記会話データからの前記関連付けられていない意図を有する発話を前記顕著意図グループに関連付けることと、を更に含む、請求項1に記載の方法。
  8. 前記新しいマイニングされた意図は各々、
    前記顕著意図グループのうちの所与の1つであって、各々が、
    前記意図ラベルとして選択された前記顕著意図のうちの前記1つ、及び
    前記代替意図として指定された前記顕著意図のうちの前記他のものによって定義される、所与の1つと、
    前記顕著意図グループのうちの前記所与の1つに関連付けられるようになる、前記関連付けられていない意図を有する発話とを含む、請求項7に記載の方法。
  9. 候補意図を前記識別することは、
    構文依存パーサーを使用して、前記意図を有する発話の文法構造を分析して、ヘッド-トークンペアを識別することであって、各ヘッド-トークンペアが、トークンワードによって修飾されたヘッドワードを含む、識別することと、
    前記意図を有する発話の品詞をタグ付けするために品詞(以下、「POS」)タグ付けを使用し、前記ヘッドワードの前記POSタグが名詞タグを含み、かつ前記トークンワードの前記POSタグが動詞タグを含む前記ヘッド-トークンペアを前記候補意図として識別することと、を含む、請求項8に記載の方法。
  10. 前記候補意図から前記顕著意図を前記選択することは、
    前記候補意図のそれぞれのものに対応する文書を有する文書のセットを生成することであって、前記文書の各々が、前記候補意図のうちの前記対応する1つによって定義されるアクション-オブジェクトペアをカバーする、生成することと、
    前記文書のセットに含まれる前記アクション-オブジェクトペアに現れる用語に基づいて概念グループを生成することと、
    前記概念グループの各々についての前記候補意図の各々について重み値を計算することであって、前記重み値が、前記文書のうちの所与の1つの前記候補意図と、前記概念グループのうちの所与の1つとの間の関連性の度合いを測定する、計算することと、
    前記顕著意図として、前記概念グループの各々における所定の数の前記候補意図を選択し、それに基づいてより高い度合いの関連性を示す重み値を作り出すことと、を含む、請求項9に記載の方法。
  11. 前記意味的類似度の度合いに従って前記顕著意図を前記グループ化することは、
    前記顕著意図の各々について埋め込みを計算することであって、埋め込みが、意味的に類似するテキストが類似の符号化表現を有するテキストの符号化表現を含む、計算することと、
    計算された前記埋め込みを比較して、前記顕著意図のペア間の前記意味的類似度の度合いを決定することと、
    所定の閾値を上回る意味的類似度の度合いを有する前記顕著意図をグループ化することと、を含む、請求項10に記載の方法。
  12. 前記埋め込みが、前記顕著意図の構成要素である前記ヘッド-トークンペアのグローバルベクトル埋め込みの逆文書頻度平均として計算され、
    計算された前記埋め込みを前記比較することが、コサイン類似度を含む、請求項11に記載の方法。
  13. 前記会話データからの前記関連付けられていない意図を有する発話を前記顕著意図グループに前記関連付けることは、前記顕著意図グループの各々に関連して、前記関連付けられていない意図を有する発話の各々をカバーするために第1のプロセスを繰り返し実行することを含み、第1及び第2の顕著意図グループと、第1及び第2の候補意図を含む第1の関連付けられていない意図を有する発話とを伴う例示的な第1のケースに関連して記述される場合、前記第1のプロセスが、
    前記第1及び第2の候補意図の各々と、前記第1の顕著意図グループ内の前記意図代替の各々との間の意味的類似度の度合いをコンピュータ処理することと、
    前記第1及び第2の候補意図の各々と、前記第2の顕著意図グループ内の前記意図代替の各々との間の意味的類似度の度合いをコンピュータ処理することと、
    前記意図代替のうちのどれが最も高いコンピュータ処理された前記意味的類似度の度合いを作り出したかを決定することと、
    前記第1の関連付けられていない意図を有する発話を、前記第1及び第2の顕著意図グループのうち、最も高いコンピュータ処理された前記意味的類似度の度合いを作り出すと決定された前記意図代替を含む方に関連付けることと、を含む、請求項8に記載の方法。
  14. 会話型ボットをオーサリングする態様を自動化するためのシステムであって、前記システムが、
    プロセッサと、
    メモリと、を備え、前記メモリが、命令を記憶し、前記命令は、前記プロセッサによって実行されるときに、前記プロセッサに、
    会話から導出されたテキストを含み、前記会話の各々が、顧客と顧客サービス担当者との間のものである会話データを受信することと、
    シード意図を含むシード意図データを受信することであって、前記シード意図の各々が、シード意図ラベルと、前記シード意図に関連付けられたサンプル意図を有する発話とを含む、受信することと、
    意図マイニングアルゴリズムを使用して、前記会話データを自動的にマイニングして、前記シード意図に関連付ける新しい発話を決定することと、
    前記シード意図に関連付けられた、マイニングされた前記新しい発話を含むように前記シード意図データを拡張することと
    前記拡張されたシード意図データを前記会話型ボットにアップロードし、前記会話型ボットを使用して他の顧客との自動化された会話を行うことと、を実行させ、
    前記意図マイニングアルゴリズムは、
    前記会話データの前記会話内で発生する発話を分析して、意図を有する発話を識別することであって、
    前記発話が各々、前記会話内のターンを含み、それによって、前記顧客が、顧客発話の形態で、又は前記顧客サービス担当者が、顧客サービス担当者発話の形態で、通信しており、
    意図を有する発話は、意図を表現する可能性が高いと決定された前記発話のうちの1つとして定義される、識別することと、
    識別された前記意図を有する発話を分析して、候補意図を識別することであって、前記候補意図が各々、目的又はタスクを記述するワード若しくはフレーズを含むアクションと、前記アクションが動作するオブジェクト又は物事を記述するワード若しくはフレーズを含むオブジェクトとの2つの部分を有する、前記意図を有する発話のうちの1つ内で発生するテキストフレーズであるものとして識別される、識別することと、
    前記シード意図の各々について、前記シード意図に関連付けられた前記サンプル意図を有する発話からシード意図代替を識別することであって、前記シード意図代替が、目的又はタスクを記述するワード若しくはフレーズを含むアクションと、前記アクションが動作するオブジェクト又は物事を記述するワード若しくはフレーズを含むオブジェクトとの2つの部分を含む、前記サンプル意図を有する発話のうちの1つ内で発生するテキストフレーズであるものとして識別される、識別することと、
    前記意図を有する発話内に存在する前記候補意図と、前記シード意図ラベルの各々に属する前記シード意図代替との間の意味的類似度の度合いを決定することを介して、前記会話データからの前記意図を有する発話を前記シード意図に関連付けることと、を含む、システム。
  15. 前記意図を有する発話を前記識別することが、前記顧客発話の第1の部分を、前記意図を有する発話として選択し、前記会話データ内の前記顧客発話の第2の部分を破棄することを含み、
    顧客発話の前記第1の部分が、前記会話の各々の始めに発生する所定の数の連続する顧客発話として定義され、前記第2の部分が、前記会話の各々の残りとして定義される、請求項14に記載のシステム。
  16. 前記意図を有する発話を前記識別することが、ワードカウント制約を満たさない顧客発話の前記第1の部分内の前記顧客発話を破棄することを更に含み、
    前記ワードカウント制約は、
    最小ワードカウント制約であって、前記最小ワードカウント制約より少ないワードを有する顧客発話の前記第1の部分内の前記顧客発話が破棄される、最小ワードカウント制約と、
    最大ワードカウント制約であって、前記最大ワードカウント制約より多くのワードを有する顧客発話の前記第1の部分内の前記顧客発話が破棄される、最大ワードカウント制約と、を含む、請求項15に記載のシステム。
  17. 候補意図を前記識別することは、
    構文依存パーサーを使用して、前記意図を有する発話の文法構造を分析して、ヘッド-トークンペアを識別することであって、各ヘッド-トークンペアが、トークンワードによって修飾されたヘッドワードを含む、識別することと、
    前記意図を有する発話の品詞をタグ付けするために品詞(以下、「POS」)タグ付けを使用し、前記ヘッドワードの前記POSタグが名詞タグを含み、かつ前記トークンワードの前記POSタグが動詞タグを含む前記ヘッド-トークンペアを前記候補意図として識別することと、を含む、請求項14に記載のシステム。
  18. シード意図代替を前記識別することは、
    構文依存パーサーを使用して、前記サンプル意図を有する発話の文法構造を分析して、ヘッド-トークンペアを識別することであって、各ヘッド-トークンペアが、トークンワードによって修飾されたヘッドワードを含む、識別することと、
    前記サンプル意図を有する発話の品詞をタグ付けするために品詞(以下、「POS」)タグ付けを使用し、前記ヘッドワードの前記POSタグが名詞タグを含み、かつ前記トークンワードの前記POSタグが動詞タグを含む前記ヘッド-トークンペアを前記候補意図として識別することと、を含む、請求項14に記載のシステム。
  19. 前記会話データからの前記意図を有する発話を前記シード意図に前記関連付けることは、前記シード意図の各々に関連して前記意図を有する発話の各々をカバーするために第1のプロセスを繰り返し実行することを含み、第1及び第2のシード意図と、第1及び第2の候補意図を含む第1の意図を有する発話をと伴う例示的な第1のケースに関連して記述される場合、前記第1のプロセスが、
    前記第1及び第2の候補意図の各々と、前記第1のシード意図内の前記意図代替の各々との間の意味的類似度の度合いをコンピュータ処理することと、
    前記第1及び第2の候補意図の各々と、前記第2のシード意図内の前記意図代替の各々との間の意味的類似度の度合いをコンピュータ処理することと、
    前記意図代替のうちのどれが最も高いコンピュータ処理された前記意味的類似度の度合いを作り出したかを決定することと、
    前記第1の意図を有する発話を、前記第1及び第2のシード意図のうち、最も高いコンピュータ処理された前記意味的類似度の度合いを作り出すと決定された前記意図代替を含む方に関連付けることと、を含む、請求項18に記載のシステム。
  20. 前記意図マイニングアルゴリズムを使用して、新しい意図を自動的にマイニングすることであって、マイニングされた前記新しい意図の各々が、意図ラベル、意図代替、及び関連付けられた発話を含む、マイニングすることと、
    マイニングされた前記新しい意図を含むように前記シード意図データを拡張することと、を更に含み、
    前記意図マイニングアルゴリズムは、
    1つ以上の基準に従って、前記シード意図のうちの1つにまだ関連付けられていない前記意図を有する発話(以下、「関連付けられていない意図を有する発話」)内に存在する前記候補意図から顕著意図を選択することと、
    選択された前記顕著意図を、前記顕著意図間の意味的類似度の度合いに従って顕著意図グループにグループ化することと、
    前記顕著意図グループの各々について、前記顕著意図のうちの1つを前記意図ラベルとして選択し、他の前記顕著意図を意図代替として指定することと、
    前記関連付けられていない意図を有する発話内に存在する前記候補意図と、前記顕著意図グループの各々内の前記意図代替との間の意味的類似度の度合いを決定することを介して、前記会話データからの前記関連付けられていない意図を有する発話を前記顕著意図グループに関連付けることと、を更に含む、請求項14に記載のシステム。
  21. 前記新しいマイニングされた意図は各々、
    前記顕著意図グループのうちの所与の1つであって、各々が、
    前記意図ラベルとして選択された前記顕著意図のうちの前記1つ、及び
    前記代替意図として指定された前記顕著意図のうちの前記他のものによって定義される、所与の1つと、
    前記顕著意図グループのうちの前記所与の1つに関連付けられるようになる、前記関連付けられていない意図を有する発話とを含む、請求項20に記載のシステム。
  22. 候補意図を前記識別することは、
    構文依存パーサーを使用して、前記意図を有する発話の文法構造を分析して、ヘッド-トークンペアを識別することであって、各ヘッド-トークンペアが、トークンワードによって修飾されたヘッドワードを含む、識別することと、
    前記意図を有する発話の品詞をタグ付けするために品詞(以下、「POS」)タグ付けを使用し、前記ヘッドワードの前記POSタグが名詞タグを含み、かつ前記トークンワードの前記POSタグが動詞タグを含む前記ヘッド-トークンペアを前記候補意図として識別することと、を含む、請求項21に記載のシステム。
  23. 前記候補意図から前記顕著意図を前記選択することは、
    前記候補意図のそれぞれのものに対応する文書を有する文書のセットを生成することであって、前記文書の各々が、前記候補意図のうちの前記対応する1つによって定義されるアクション-オブジェクトペアをカバーする、生成することと、
    前記文書のセットに含まれる前記アクション-オブジェクトペアに現れる用語に基づいて概念グループを生成することと、
    前記概念グループの各々についての前記候補意図の各々について重み値を計算することであって、前記重み値が、前記文書のうちの所与の1つの前記候補意図と、前記概念グループのうちの所与の1つとの間の関連性の度合いを測定する、計算することと、
    前記顕著意図として、前記概念グループの各々における所定の数の前記候補意図を選択し、それに基づいてより高い度合いの関連性を示す重み値を作り出すことと、を含む、請求項22に記載のシステム。
  24. 前記意味的類似度の度合いに従って前記顕著意図を前記グループ化することは、
    前記顕著意図の各々について埋め込みを計算することであって、埋め込みが、意味的に類似するテキストが類似の符号化表現を有するテキストの符号化表現を含む、計算することと、
    計算された前記埋め込みを比較して、前記顕著意図のペア間の前記意味的類似度の度合いを決定することと、
    所定の閾値を上回る意味的類似度の度合いを有する前記顕著意図をグループ化することと、を含む、請求項23に記載のシステム。
  25. 前記埋め込みが、前記顕著意図の構成要素である前記ヘッド-トークンペアのグローバルベクトル埋め込みの逆文書頻度平均として計算され、
    計算された前記埋め込みを前記比較することが、コサイン類似度を含む、請求項24に記載のシステム。
  26. 前記会話データからの前記関連付けられていない意図を有する発話を前記顕著意図グループに前記関連付けることは、前記顕著意図グループの各々に関連して、前記関連付けられていない意図を有する発話の各々をカバーするために第1のプロセスを繰り返し実行することを含み、第1及び第2の顕著意図グループと、第1及び第2の候補意図を含む第1の関連付けられていない意図を有する発話とを伴う例示的な第1のケースに関連して記述される場合、前記第1のプロセスが、
    前記第1及び第2の候補意図の各々と、前記第1の顕著意図グループ内の前記意図代替の各々との間の意味的類似度の度合いをコンピュータ処理することと、
    前記第1及び第2の候補意図の各々と、前記第2の顕著意図グループ内の前記意図代替の各々との間の意味的類似度の度合いをコンピュータ処理することと、
    前記意図代替のうちのどれが最も高いコンピュータ処理された前記意味的類似度の度合いを作り出したかを決定することと、
    前記第1の関連付けられていない意図を有する発話を、前記第1及び第2の顕著意図グループのうち、最も高いコンピュータ処理された前記意味的類似度の度合いを作り出すと決定された前記意図代替を含む方に関連付けることと、を含む、請求項21に記載のシステム。
JP2023519241A 2020-09-25 2021-09-27 意図シーディングを介して会話データから意図をマイニングすることによるボットオーサリングに関するシステム及び方法 Pending JP2023545947A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063083561P 2020-09-25 2020-09-25
US63/083,561 2020-09-25
PCT/US2021/052127 WO2022067149A1 (en) 2020-09-25 2021-09-27 Systems and methods relating to bot authoring by mining intents from conversation data using known intents for associated sample utterances

Publications (1)

Publication Number Publication Date
JP2023545947A true JP2023545947A (ja) 2023-11-01

Family

ID=78463917

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2023519241A Pending JP2023545947A (ja) 2020-09-25 2021-09-27 意図シーディングを介して会話データから意図をマイニングすることによるボットオーサリングに関するシステム及び方法
JP2023519243A Pending JP2023543032A (ja) 2020-09-25 2021-09-27 自然言語会話から意図をマイニングすることによるボットオーサリングに関するシステム及び方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023519243A Pending JP2023543032A (ja) 2020-09-25 2021-09-27 自然言語会話から意図をマイニングすることによるボットオーサリングに関するシステム及び方法

Country Status (7)

Country Link
US (2) US11798539B2 (ja)
EP (2) EP4217908A1 (ja)
JP (2) JP2023545947A (ja)
CN (2) CN116324792A (ja)
AU (2) AU2021347371A1 (ja)
CA (2) CA3193583A1 (ja)
WO (2) WO2022067148A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11657811B2 (en) * 2020-09-21 2023-05-23 International Business Machines Corporation Modification of voice commands based on sensitivity
US11798549B2 (en) * 2021-03-19 2023-10-24 Mitel Networks Corporation Generating action items during a conferencing session
US20220398524A1 (en) * 2021-06-11 2022-12-15 Aktify, Inc. Consumer interaction agent management platform
US20230008868A1 (en) * 2021-07-08 2023-01-12 Nippon Telegraph And Telephone Corporation User authentication device, user authentication method, and user authentication computer program
US20230027936A1 (en) * 2021-07-23 2023-01-26 Verizon Patent And Licensing Inc. Conversational interaction entity testing
CN117407835B (zh) * 2023-12-15 2024-03-12 四川易利数字城市科技有限公司 一种数据要素需求挖掘方法
CN117672227B (zh) * 2024-01-25 2024-04-05 深圳市音随我动科技有限公司 基于智能音箱的问答控制方法、装置、计算机设备和介质

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030167167A1 (en) * 2002-02-26 2003-09-04 Li Gong Intelligent personal assistants
US7606714B2 (en) * 2003-02-11 2009-10-20 Microsoft Corporation Natural language classification within an automated response system
JP2011501847A (ja) * 2007-10-17 2011-01-13 アイティーアイ・スコットランド・リミテッド コンピュータで実現される方法
US8688453B1 (en) * 2011-02-28 2014-04-01 Nuance Communications, Inc. Intent mining via analysis of utterances
US9959340B2 (en) * 2012-06-29 2018-05-01 Microsoft Technology Licensing, Llc Semantic lexicon-based input method editor
US10354677B2 (en) * 2013-02-28 2019-07-16 Nuance Communications, Inc. System and method for identification of intent segment(s) in caller-agent conversations
WO2014144949A2 (en) * 2013-03-15 2014-09-18 Apple Inc. Training an at least partial voice command system
US9772994B2 (en) 2013-07-25 2017-09-26 Intel Corporation Self-learning statistical natural language processing for automatic production of virtual personal assistants
US9886950B2 (en) 2013-09-08 2018-02-06 Intel Corporation Automatic generation of domain models for virtual personal assistants
US9596349B1 (en) 2015-06-29 2017-03-14 State Farm Mutual Automobile Insurance Company Voice and speech recognition for call center feedback and quality assurance
US9473637B1 (en) * 2015-07-28 2016-10-18 Xerox Corporation Learning generation templates from dialog transcripts
DK201670540A1 (en) * 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US20180253638A1 (en) * 2017-03-02 2018-09-06 Accenture Global Solutions Limited Artificial Intelligence Digital Agent
US10224032B2 (en) * 2017-04-19 2019-03-05 International Business Machines Corporation Determining an impact of a proposed dialog act using model-based textual analysis
DK201770427A1 (en) * 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
US10923109B2 (en) * 2017-08-02 2021-02-16 [24]7.ai, Inc. Method and apparatus for training of conversational agents
US11507756B2 (en) * 2017-12-05 2022-11-22 discourse.ai, Inc. System and method for estimation of interlocutor intents and goals in turn-based electronic conversational flow
US10498898B2 (en) 2017-12-13 2019-12-03 Genesys Telecommunications Laboratories, Inc. Systems and methods for chatbot generation
US20200012673A1 (en) * 2018-07-03 2020-01-09 University Of Waterloo System, method and computer program product for query clarification
US11257496B2 (en) * 2018-09-26 2022-02-22 [24]7.ai, Inc. Method and apparatus for facilitating persona-based agent interactions with online visitors
US11164574B2 (en) * 2019-01-03 2021-11-02 International Business Machines Corporation Conversational agent generation
US10839168B2 (en) * 2019-02-19 2020-11-17 International Business Machines Corporation Dynamic automation of pipeline creation
US10445745B1 (en) 2019-03-26 2019-10-15 Fmr Llc Computer systems and methods for efficient query resolution by customer representatives
US11200886B2 (en) * 2019-04-02 2021-12-14 Accenture Global Solutions Limited System and method for training a virtual agent to identify a user's intent from a conversation
US11487948B2 (en) * 2020-02-19 2022-11-01 Conduent Business Services, Llc Method and system for automated autonomous intent mining
US10978053B1 (en) * 2020-03-03 2021-04-13 Sas Institute Inc. System for determining user intent from text

Also Published As

Publication number Publication date
CN116324792A (zh) 2023-06-23
US20220101839A1 (en) 2022-03-31
EP4217907A1 (en) 2023-08-02
WO2022067148A1 (en) 2022-03-31
CA3193586A1 (en) 2022-03-31
US11514897B2 (en) 2022-11-29
CA3193583A1 (en) 2022-03-31
AU2021350115A1 (en) 2023-06-08
JP2023543032A (ja) 2023-10-12
EP4217908A1 (en) 2023-08-02
US11798539B2 (en) 2023-10-24
US20220101838A1 (en) 2022-03-31
CN116235177A (zh) 2023-06-06
WO2022067149A1 (en) 2022-03-31
AU2021347371A1 (en) 2023-06-08

Similar Documents

Publication Publication Date Title
US11301908B2 (en) System and method for providing contextual summaries in interaction transfer
US10951768B2 (en) Measuring cognitive capabilities of automated resources and related management thereof in contact centers
US11514897B2 (en) Systems and methods relating to bot authoring by mining intents from natural language conversations
JP7309047B2 (ja) ボット通信を容易にするシステム及び方法
US20210157989A1 (en) Systems and methods for dialog management
US11363141B2 (en) Systems and methods relating to asynchronous resolution of customer requests in contact center
CA3176197A1 (en) System and method for personalization as a service
CN117795941A (zh) 与预测性路由和占用率平衡有关的系统和方法
US20220366427A1 (en) Systems and methods relating to artificial intelligence long-tail growth through gig customer service leverage
US11763318B2 (en) Systems and methods relating to providing chat services to customers
US20230315998A1 (en) Systems and methods relating to mining topics in conversations

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20230615

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20230720

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230530