JP2022552129A

JP2022552129A - 機械学習を用いたロボティックプロセスオートメーションのワークフローの自動アクティブ化および構成

Info

Publication number: JP2022552129A
Application number: JP2022520179A
Authority: JP
Inventors: シング，プラブディープ; マクゴネル，アントン
Original assignee: UiPath Inc
Current assignee: UiPath Inc
Priority date: 2019-10-15
Filing date: 2020-08-13
Publication date: 2022-12-15
Also published as: US20210110207A1; EP4046083A4; WO2021076209A1; CN114586040A; KR20220078588A; EP4046083A1

Abstract

機械学習（ＭＬ）を使用するロボティックプロセスオートメーション（ＲＰＡ）ワークフローの自動アクティブ化および構成が開示される。ＲＰＡワークフローの１つまたは複数の部分は、１つまたは複数の確率論的ＭＬモデルに基づいてオンまたはオフにすることができる。ＲＰＡロボットは、パラメータを修正し、提供する特定のリソースの量を決定し、より最適なしきい値を決定するなどのように構成され得る。したがって、ＭＬを実装するそのようなＲＰＡワークフローは、決定論的論理と確率論的論理の両方のハイブリッドであってもよく、ＭＬモデルの再訓練、信頼度しきい値の調整、ローカル／グローバル信頼度しきい値の使用、ローカル信頼度しきい値のための修飾子の提供または調整、ＭＬモデル性能を監視する監視システムの実装などによって経時的に学習および改善することができる。

Description

（関連出願の相互参照）
本出願は、２０１９年１２月９日に出願された米国非仮特許出願第１６／７０７，８１４号および２０１９年１０月１５日に出願された米国仮特許出願第６２／９１５，３７９号の利益を主張する。これらの先願の主題は、その全体が参照により本明細書に組み込まれる。

本発明は、一般に、ロボティックプロセスオートメーション（ＲＰＡ）に関し、より具体的には、機械学習（ＭＬ）を使用したＲＰＡワークフローの自動アクティブ化および構成に関する。

現在のＲＰＡワークフローは本質的に決定論的である。言い換えれば、ワークフローは、フローチャートと同様の一連の論理ステップに従う。しかしながら、この決定論的論理は、すべての状況、特に経時的に変化する状況に最適ではない場合がある。したがって、改善されたソリューションが有益であり得る。

本発明の特定の実施形態は、現在のＲＰＡ技術によってまだ完全に識別、認識、または解決されていない当技術分野の問題および必要性に対するソリューションを提供することができる。例えば、本発明のいくつかの実施形態は、ＭＬを使用するＲＰＡワークフローの自動アクティブ化および構成に関する。

一実施形態では、コンピュータにより実施される方法は、ＲＰＡワークフローの確率論的アクティビティを遂行する場合に、ＲＰＡロボットによって少なくとも１つのＭＬモデルを呼び出すステップと、ＲＰＡロボットによって、少なくとも１つのＭＬモデルから少なくとも１つの信頼度値を受信するステップと、を含む。少なくとも１つの信頼度値が信頼度しきい値を超えない場合に、コンピュータにより実施される方法は、ＲＰＡロボットによって、確率論的アクティビティの後のワークフローセクションをオフにするか、取得しないか、または論理的に回避するステップを含む。少なくとも１つの信頼度値が信頼度しきい値を超える場合に、コンピュータにより実施される方法は、ＲＰＡロボットによって確率論的アクティビティの後のワークフローセクションをオンにするか、取得するか、または論理的に従うステップと、ＲＰＡロボットによって確率論的アクティビティに続くワークフローセクションを遂行するステップと、を含む。

別の実施形態では、コンピュータプログラムは、非一時的コンピュータ可読媒体上で具現化される。プログラムは、少なくとも１つのプロセッサに、ＲＰＡワークフローの確率論的アクティビティを遂行する場合に、ＭＬモデルを呼び出させ、ＭＬモデルから信頼度値を受信させるように構成される。信頼度値が信頼度しきい値を超えない場合に、プログラムは、少なくとも１つのプロセッサに、確率論的アクティビティの後のワークフローセクションをオフにさせるか、取得させないか、または論理的に回避させるように構成される。信頼度値が信頼度しきい値を超える場合に、プログラムは、少なくとも１つのプロセッサに、確率論的アクティビティの後のワークフローセクションをオンにさせ、取得させ、または論理的に従わせ、確率論的アクティビティの後のワークフローセクションを遂行させるように構成される。

さらに別の実施形態では、コンピュータにより実施される方法は、ＲＰＡワークフローの確率論的アクティビティを遂行する場合に、ＲＰＡロボットによって少なくとも１つのＭＬモデルを呼び出すステップと、ＲＰＡロボットによって、少なくとも１つのＭＬモデルから少なくとも１つの信頼度値を受信するステップと、を含む。コンピュータにより実施される方法はまた、ＲＰＡロボットによって、少なくとも１つの信頼度値を複数の信頼度しきい値範囲と比較するステップを含む。少なくとも１つの信頼度値が信頼度しきい値範囲内に入る場合に、コンピュータにより実施される方法は、ＲＰＡロボットによって、その信頼度しきい値範囲についての確率論的アクティビティの後のワークフローセクションをオンにするか、取得するか、または論理的に従うステップと、ＲＰＡロボットによって、その信頼度しきい値範囲についての確率論的アクティビティに続いてワークフローセクションを遂行するステップと、を含む。

本発明の特定の実施形態の利点が容易に理解されるように、上記で簡単に説明した本発明のより具体的な説明は、添付の図面に示されている特定の実施形態を参照することによって提供される。これらの図面は、本発明の典型的な実施形態のみを示しており、したがってその範囲を限定するものと見なされるべきではないことを理解されたいが、本発明は、添付の図面を使用することによって追加の具体性および詳細を伴って説明および説明される。

本発明の一実施形態による、ＲＰＡシステムを示すアーキテクチャ図である。

本発明の一実施形態による、展開されたＲＰＡシステムを示すアーキテクチャ図である。

本発明の一実施形態による、デザイナ、アクティビティ、およびドライバの間の関係を示すアーキテクチャ図である。

本発明の一実施形態による、ＭＬを使用してＲＰＡワークフローを自動的にアクティブ化および構成するように構成されたコンピューティングシステムを示すアーキテクチャ図である。

本発明の一実施形態による、自動アクティブ化のためにＭＬを使用するＲＰＡワークフローを示す図である。

本発明の一実施形態による、ＭＬを使用してＲＰＡワークフローを自動的にアクティブ化および構成するためのプロセスを示すフローチャートである。

本発明の一実施形態による、ＭＬを使用してＲＰＡワークフローを自動的にアクティブ化および構成するための別のプロセス８００を示すフローチャートである。

いくつかの実施形態は、ＭＬを使用するＲＰＡワークフローの自動アクティブ化および構成に関する。いくつかの実施形態では、ＲＰＡワークフローの１つまたは複数の部分は、１つまたは複数の確率論的ＭＬモデルに基づいてオンまたはオフにすることができる。特定の実施形態では、ＭＬモデルは、パラメータを修正し、提供する特定のリソースの量（例えば、どれだけの電流を送るか、ダムを通してどれだけの水を許容するか、製品をいくらの価格に設定するか、など）を決定し、より最適なしきい値を決定するなどするように構成され得る。したがって、ＭＬを実装するそのようなＲＰＡワークフローは、決定論的論理と確率論的論理の両方のハイブリッドであってもよく、ＭＬモデルの再訓練、信頼度しきい値の調整、ローカル／グローバル信頼度しきい値の使用、ローカル信頼度しきい値のための修飾子の提供または調整、ＭＬモデル性能を監視する監視システムの実装などによって経時的に学習および改善することができる。

ワークフローは、それぞれがより大きなタスクのより細かい部分を達成する一連のアクティビティを含む。典型的には、アクティビティは、別のアクティビティに直接つながるか、または関連する静的条件が満たされたときにシーケンスのセクションにつながる条件分岐論理に従う。しかしながら、いくつかの実施形態は、例えば、常に次のアクティビティに進むか、または決定論的条件に基づいてアクティビティを選択するのではなく、信頼区間を使用するなど、学習された確率論的しきい値に基づいてワークフローの一部が有効（すなわち、「アクティブ化」）であるか無効であるかを制御する訓練可能／再訓練可能ＭＬモデルを利用する。そのようなアクティブ化しきい値は、ワークフローを遂行するロボットからのデータに基づいて経時的に学習および／または再構成することができる。例えば、ＲＰＡロボットは、決定論的な方法で実行されるワークフローから開始し、次いで、ワークフローの１つまたは複数のセクションを経時的にオンまたはオフにすること、アクティビティパラメータを修正すること、１つまたは複数のリソースの提供量を決定すること、しきい値を変更すること、またはこれらの任意の組み合わせを学習することができる。

しきい値は、重要性、リスク、コスト、生命に対する危険性などの１つまたは複数の要因に基づいて設定されてもよい。例えば、ミッションクリティカルシステムのしきい値は非常に高くてもよい（例えば、９９．９９９９％）。いくつかの実施形態では、しきい値自体は経時的に学習される。例えば、顧客のアクションが人間のチェックアウト店員を有するのではなくカメラおよび他のセンサによって監視される自動小売システムのコンテキストでは、ユーザーによって取られた製品が検出されるのに十分高いが、かなりの数の誤判定（すなわち、ユーザーが商品を手に取ったときに検出されるが、その後に、それを店舗内の別の場所に戻すか、または残すような場合など、ユーザーが商品を持って店舗から出なかった商品について課金される）が発生するほど高くはないように、信頼区間をバランスさせることが望ましい場合がある。このような店舗の事業目的は、消費者が持ち去った商品を可能な限り多く検出することであるが、消費者が再び店舗に戻る可能性が高く、ネガティブな経験や、実際に購入しようとしなかった商品の返金を求める煩わしさのために店舗を避けない程度に誤判定率を低く保つことである。

そのようなシナリオでは、システムは、８０％（例えば、ユーザーが実際に商品を手に取り、その商品を持って店を出たという信頼度）の初期信頼区間を有することができる。ある期間の後に、データ解析は、支払いのない製品（すなわち、商品が検出されずに店舗から出て行く顧客）の１０％の損失が発生したことを明らかにすることができる。データ解析はまた、報告された誤判定率が０．１％であったことを明らかにすることができる。より高い誤判定率が許容可能であるが、製品損失率が許容不可能であると企業が判断した場合、ＭＬモデルの信頼区間は増加され得る。あるいは、ＭＬモデルには、最大許容誤判定率および製品損失率が提供され得、それに応じてＭＬモデル信頼区間を自動的に増加させ得る（例えば、８５％まで上げる）。これは、誤判定率が許容できなくなるまで定期的に行われ、誤判定率が最大許容率に向かって収束するまで定期的に下降、上昇などを行うことができる。例えば、これは、ユーザーが商品を拾い上げたという９９％の信頼度および１％の誤判定率に収束することができる。そのようなシステムはまた、経時的な検出率の変化（例えば、センサの劣化または故障による精度の低下、新しいセンサの実装による精度の向上など）を検出することができ、それに応じて信頼区間を調整することができる。

特定の実施形態では、ワークフローの一部をオンにするかどうかは、擬似乱数を計算し、その数をＭＬモデル（例えば、少なくともしきい値がある場合には、ワークフローの部分はオンにされ、そうでない場合には、ワークフローの部分は追従されない）からの信頼度値と比較することによって決定することができる。この場合、ロボットによって遂行されるワークフローは、遂行ごとに異なってもよい。これは、例えば群挙動において有益であり得る。多数のドローンが配備されるシナリオ（例えば、１００、１，０００など。）では、異なるランダムな効果を有することが望ましい場合がある。例えば、ドローン群がコンサート照明に使用されており、曲にビートが発生するたびにドローンの７０％がランダムに青、２０％がランダムに黄、１０％がランダムに赤で光ることが望ましい場合には、これは確率論的ワークフローにおける信頼度しきい値範囲を使用して実施することができる。これは、複数のゲートを有するゲート機構を提供する。そのような実施形態は、強化学習を介して訓練されてもよく、システムは、指定された制約を有する新しい状態を探索し、報酬関数が「勝利」状態を求めるために使用される。例えば、報酬関数は、拍手の音量を増加させることを含むことができ、新しいパターンを探索することができ、拍手を増加させるドローンパターンの特性を学習することができる。

いくつかの実施形態では、複数のＭＬモデルの「ローカル」信頼区間に基づく「グローバル」信頼度値を使用することができる。例えば、３つの異なるＭＬモデル１、２、および３が画像認識などのタスクに使用され得るが、ＭＬモデルは異なる結果を提供することができる。ＭＬモデル１および３が、画像内の対象物がそれぞれ９０％および８０％の信頼度を有する犬であると判定するが、ＭＬモデルは、対象物が９０％の信頼度を有する猫であると判定し、肯定検出のためのグローバル信頼度しきい値要件が５０％である場合を考える。対象物は犬として明確に識別される（（０．９＋０．０＋０．７）／３＝０．５３３３３）が、猫としての識別（（０．０＋０．８＋０．０）／３＝０．２６６６７）は失敗する。これは、ＭＬモデルが同様のシナリオに適用され得るが、異なるコンテキストにおいて適用され得る転移学習に幾分類似している。

異なるＭＬモデルはまた、特定のタスクに対して異なる精度を有することができる。したがって、特定の実施形態では、１つまたは複数のモデルの信頼区間に重み付けすることができる。例えば、請求書処理の場合、各モデルの精度に基づいて、ＭＬモデル１に１００％の修飾子を割り当てることができ、ＭＬモデル２に７０％の修飾子を割り当てることができ、ＭＬモデル３に５０％の修飾子を割り当てることができる。しかしながら、画像検出の場合、精度および修飾子は異なっていてもよい。

特定の実施形態では、ＭＬモデルは、ＭＬモデルを使用する展開されたロボットが意図したように動作していることを保証するために、監視システムによって監視することができる。これは、ミッションクリティカルシステムにとって特に有益であり得る。例えば、特定の条件下で飛行面を自動的に制御するために航空機内でロボットが使用される場合には、航空機の動作パラメータを監視することができる。展開されたロボットが動作している航空機から収集されたデータをレビューするとき、監視者システムは、ロボットが飛行面制御を開始した直後に制御輪を引き戻す傾向がある一部のパイロットなどの統計的に有意な異常を判定することができる。次いで、管理者システムは、ワークフローの一部を無効にする、ロボットを完全に無効にする、検出された状態のパイロットに可能な修正を伴う警告を提供するなどをロボットに命令することができる。

図１は、本発明の一実施形態による、ＲＰＡシステム１００を示すアーキテクチャ図である。ＲＰＡシステム１００は、開発者がワークフローを設計および実装することを可能にするデザイナ１１０を含む。デザイナ１１０は、アプリケーション統合、ならびに第三者アプリケーション、管理情報技術（ＩＴ）タスク、およびビジネスＩＴプロセスを自動化するためのソリューションを提供することができる。デザイナ１１０は、ビジネスプロセスのグラフィカル表現である自動化プロジェクトの開発を容易にすることができる。簡単に言えば、デザイナ１１０は、ワークフローおよびロボットの開発およびデプロイメントを容易にする。

自動化プロジェクトは、本明細書で「アクティビティ」と定義される、ワークフローで開発されたステップのカスタムセット間の遂行順序および関係の制御を開発者に与えることによって、ルールベースのプロセスの自動化を可能にする。デザイナ１１０の一実施形態の一商用例は、ＵｉＰａｔｈＳｔｕｄｉｏ（商標）である。各アクティビティは、ボタンのクリック、ファイルの読み取り、ログパネルへの書き込みなどのアクションを含むことができる。いくつかの実施形態では、ワークフローはネストまたは埋め込みされてもよい。

いくつかのタイプのワークフローは、シーケンス、フローチャート、有限状態機械（ＦＳＭ）、および／またはグローバル例外ハンドラを含むことができるが、これらに限定されない。シーケンスは、ワークフローを乱すことなく１つのアクティビティから別のアクティビティへの流れを可能にする線形プロセスに特に適することができる。フローチャートは、より複雑なビジネスロジックに特に適しており、複数の分岐論理演算子を介してより多様な方法で決定の統合およびアクティビティの接続を可能にする。ＦＳＭは、大規模なワークフローに特に適している場合がある。ＦＳＭは、条件（すなわち、遷移）またはアクティビティによってトリガされる有限数の状態をそれらの遂行において使用することができる。グローバル例外ハンドラは、遂行エラーに遭遇したときのワークフローの挙動を判定し、プロセスをデバッグするのに特に適することができる。

ワークフローがデザイナ１１０で開発されると、ビジネスプロセスの遂行は、デザイナ１１０で開発されたワークフローを遂行する１つまたは複数のロボット１３０を編成するコンダクタ１２０によって編成される。コンダクタ１２０の一実施形態の一商用例は、ＵｉＰａｔｈオーケストレータ（商標）である。コンダクタ１２０は、環境内のリソースの作成、監視、およびデプロイメントの管理を容易にする。コンダクタ１２０は、第三者のソリューションおよびアプリケーションとの統合ポイントとして機能することができる。

コンダクタ１２０は、集中ポイントからロボット１３０を接続し遂行するすべてのロボット１３０を管理することができる。管理され得るロボット１３０のタイプは、これらに限定されないが、アテンディッドロボット１３２、アンアテンディッドロボット１３４、開発ロボット（アンアテンディッドロボット１３４と同様であるが、開発および試験の目的で使用される）、および非生産ロボット（アテンディッドロボット１３２と同様であるが、開発および試験の目的で使用される）を含む。アテンディッドロボット１３２は、ユーザーイベントによってトリガされ、同じコンピューティングシステム上で人間と一緒に動作する。アテンディッドロボット１３２は、集中プロセスデプロイメントおよび記録媒体のためのコンダクタ１２０と共に使用することができる。アテンディッドロボット１３２は、人間のユーザーが様々なタスクを達成するのを助けることができ、ユーザーイベントによってトリガすることができる。いくつかの実施形態では、プロセスは、このタイプのロボットのコンダクタ１２０から開始することができず、および／またはロックされた画面の下で実行することができない。特定の実施形態では、アテンディッドロボット１３２は、ロボットトレイまたはコマンドプロンプトからのみ起動することができる。いくつかの実施形態では、アテンディッドロボット１３２は人間の監督下で動作するべきである。

アンアテンディッドロボット１３４は、仮想環境で無人で動作し、多くのプロセスを自動化することができる。アンアテンディッドロボット１３４は、リモート遂行、監視、スケジューリング、および作業待ち行列のサポートの提供を担当することができる。いくつかの実施形態では、すべてのロボットタイプのデバッグを、デザイナ１１０で実行することができる。アテンディッドロボットおよびアンアテンディッドロボットの両方は、メインフレーム、ウェブアプリケーション、ＶＭ、エンタープライズアプリケーション（例えば、ＳＡＰ（登録商標）、ＳａｌｅｓＦｏｒｃｅ（登録商標）、Ｏｒａｃｌｅ（登録商標）などによって製造されたもの）、およびコンピューティングシステムアプリケーション（例えば、デスクトップおよびラップトップアプリケーション、モバイルデバイスアプリケーション、ウェアラブルコンピュータアプリケーションなど）を含むがこれらに限定されない様々なシステムおよびアプリケーションを自動化することができる。

コンダクタ１２０は、プロビジョニング、デプロイメント、構成、キューイング、監視、ロギング、および／または相互接続性の提供を含むがこれらに限定されない様々な機能を有することができる。プロビジョニングは、ロボット１３０とコンダクタ１２０（例えば、ウェブアプリケーション）との間の接続の作成および保守を含むことができる。デプロイメントは、遂行のために割り当てられたロボット１３０へのパッケージバージョンの正しい配信を保証することを含むことができる。構成は、ロボット環境およびプロセス構成の維持および配信を含むことができる。キューイングは、キューおよびキュー項目の管理を提供することを含むことができる。監視は、ロボット識別データを追跡し、ユーザー権限を維持することを含むことができる。ロギングは、データベース（例えば、ＳＱＬデータベース）および／または別のストレージ機構（例えば、大規模なデータセットを格納し、迅速にクエリする能力を提供するＥｌａｓｔｉｃＳｅａｒｃｈ（登録商標））へのログの格納およびインデックス付けを含むことができる。コンダクタ１２０は、第三者のソリューションおよび／またはアプリケーションのための通信の集中ポイントとして作用することによって相互接続性を提供することができる。

ロボット１３０は、デザイナ１１０に構築されたワークフローを実行する遂行エージェントである。ロボット１３０のいくつかの実施形態の一商用例は、ＵｉＰａｔｈＲｏｂｏｔｓ（商標）である。いくつかの実施形態では、ロボット１３０は、デフォルトでＭｉｃｒｏｓｏｆｔＷｉｎｄｏｗｓ（登録商標）ＳｅｒｖｉｃｅＣｏｎｔｒｏｌＭａｎａｇｅｒ（ＳＣＭ）管理サービスをインストールする。結果として、そのようなロボット１３０は、ローカルシステムアカウントの下でインタラクティブなＷｉｎｄｏｗｓ（登録商標）セッションを開き、Ｗｉｎｄｏｗｓ（登録商標）サービスの権利を有することができる。

いくつかの実施形態では、ロボット１３０は、ユーザーモードで設置することができる。このようなロボット１３０の場合、これは、所与のロボット１３０が設置されているユーザーと同じ権利を有することを意味する。この特徴は、その最大の可能性で各機械の完全な利用を保証する高密度（ＨＤ）ロボットにも利用可能であり得る。いくつかの実施形態では、任意のタイプのロボット１３０をＨＤ環境で構成することができる。

いくつかの実施形態におけるロボット１３０は、各々が特定の自動化タスク専用であるいくつかのコンポーネントに分割される。いくつかの実施形態におけるロボットコンポーネントは、ＳＣＭ管理ロボットサービス、ユーザーモードロボットサービス、エグゼキュータ、エージェント、およびコマンドラインを含むが、これらに限定されない。ＳＣＭ管理ロボットサービスは、Ｗｉｎｄｏｗｓ（登録商標）セッションを管理および監視し、コンダクタ１２０と遂行ホスト（すなわち、ロボット１３０が遂行されるコンピューティングシステム）との間のプロキシとして機能する。これらのサービスは、ロボット１３０の資格情報で信頼され、管理する。コンソールアプリケーションは、ローカルシステムの下でＳＣＭによって起動される。

いくつかの実施形態におけるユーザーモードロボットサービスは、Ｗｉｎｄｏｗｓ（登録商標）セッションを管理および監視し、コンダクタ１２０と遂行ホストとの間のプロキシとして機能する。ユーザーモードロボットサービスは、ロボット１３０のための資格情報を信頼し管理することができる。ＳＣＭ管理ロボットサービスがインストールされていない場合、Ｗｉｎｄｏｗｓ（登録商標）アプリケーションを自動的に起動することができる。

エグゼキュータは、Ｗｉｎｄｏｗｓ（登録商標）セッション下で所与のジョブを実行することができる（すなわち、エグゼキュータはワークフローを遂行することができる）。エグゼキュータは、モニターごとのドット／インチ（ＤＰＩ）設定を認識することができる。エージェントは、システムトレイウィンドウに利用可能なジョブを表示するＷｉｎｄｏｗｓ（登録商標）ＰｒｅｓｅｎｔａｔｉｏｎＦｏｕｎｄａｔｉｏｎ（ＷＰＦ）アプリケーションであってもよい。エージェントは、サービスのクライアントであってもよい。エージェントは、ジョブの開始または停止および設定の変更を要求することができる。コマンドラインは、サービスのクライアントである。コマンドラインは、ジョブの開始を要求し、その出力を待つことができるコンソールアプリケーションである。

上記で説明したようにロボット１３０のコンポーネントを分割することは、開発者、サポートユーザー、およびコンピューティングシステムが各コンポーネントが実行しているものをより容易に実行、識別、および追跡するのに役立つ。このようにして、エグゼキュータおよびサービスに対して異なるファイアウォールルールを設定するなど、特別な挙動をコンポーネントごとに構成することができる。エグゼキュータは、いくつかの実施形態では、モニターごとにＤＰＩ設定を常に認識することができる。結果として、ワークフローは、それらが作成されたコンピューティングシステムの構成にかかわらず、任意のＤＰＩで遂行され得る。いくつかの実施形態では、デザイナ１１０からのプロジェクトは、ブラウザのズームレベルとは無関係であってもよい。ＤＰＩを認識していない、または意図的に認識していないとマークされたアプリケーションの場合、いくつかの実施形態ではＤＰＩを無効にすることができる。

図２は、本発明の一実施形態による、展開されたＲＰＡシステム２００を示すアーキテクチャ図である。いくつかの実施形態では、ＲＰＡシステム２００は、図１のＲＰＡシステム１００であってもよいし、その一部であってもよい。クライアント側、サーバー側、またはその両方は、本発明の範囲から逸脱することなく、任意の所望の数のコンピューティングシステムを含むことができることに留意されたい。クライアント側では、ロボットアプリケーション２１０は、エグゼキュータ２１２と、エージェント２１４と、デザイナ２１６と、を含む。しかしながら、いくつかの実施形態では、デザイナ２１６は、コンピューティングシステム２１０上で実行されていなくてもよい。エグゼキュータ２１２は、実行中のプロセスである。図２に示すように、いくつかのビジネスプロジェクトが同時に実行されてもよい。エージェント２１４（例えば、Ｗｉｎｄｏｗｓ（登録商標）サービス）は、この実施形態ではすべてのエグゼキュータ２１２に対する単一の接続ポイントである。この実施形態におけるすべてのメッセージは、データベースサーバー２４０、インデクササーバー２５０、またはその両方を介してそれらをさらに処理するコンダクタ２３０にログされる。図１に関して上述したように、エグゼキュータ２１２はロボットコンポーネントであってもよい。

いくつかの実施形態では、ロボットは、機械名とユーザー名との間の関連付けを表す。ロボットは、複数のエグゼキュータを同時に管理することができる。同時に実行される複数のインタラクティブなセッション（例えば、Ｗｉｎｄｏｗｓ（登録商標）Ｓｅｒｖｅｒ２０１２）をサポートするコンピューティングシステムでは、複数のロボットが同時に実行され、それぞれが一意のユーザー名を使用して別々のＷｉｎｄｏｗｓ（登録商標）セッションで実行されてもよい。これは、上記ではＨＤロボットと呼ばれる。

エージェント２１４はまた、ロボットのステータス（例えば、ロボットがまだ機能していることを示す「ハートビート」メッセージを定期的に送信する）を送信し、遂行されるパッケージの必要なバージョンをダウンロードする役割も担う。エージェント２１４とコンダクタ２３０との間の通信は、いくつかの実施形態では常にエージェント２１４によって開始される。通知シナリオでは、エージェント２１４は、ロボットにコマンド（例えば、始動、停止など）を送信するためにコンダクタ２３０によって後で使用されるＷｅｂＳｏｃｋｅｔチャネルを開くことができる。

サーバー側には、プレゼンテーション層（ウェブアプリケーション２３２、オープンデータプロトコル（ＯＤａｔａ）代表状態転送（ＲＥＳＴ）アプリケーション・プログラミング・インターフェース（ＡＰＩ）エンドポイント２３４、ならびに通知および監視２３６）、サービス層（ＡＰＩ実装／ビジネスロジック２３８）、永続層（データベースサーバー２４０、インデクササーバー２５０）が含まれる。コンダクタ２３０は、ウェブアプリケーション２３２、ＯＤａｔａＲＥＳＴＡＰＩエンドポイント２３４、通知および監視２３６、ならびにＡＰＩ実装／ビジネスロジック２３８を含む。いくつかの実施形態では、ユーザーがコンダクタ２２０のインターフェース内で（例えば、ブラウザ２２０を介して）実行するほとんどのアクションは、様々なＡＰＩを呼び出すことによって実行される。そのようなアクションは、本発明の範囲から逸脱することなく、ロボット上のジョブの開始、キュー内のデータの追加／削除、無人で実行するためのジョブのスケジューリングなどを含むことができるが、これらに限定されない。ウェブアプリケーション２３２は、サーバープラットフォームのビジュアル層である。この実施形態では、ウェブアプリケーション２３２は、ハイパーテキストマークアップ言語（ＨＴＭＬ）およびＪａｖａＳｃｒｉｐｔ（ＪＳ）を使用する。しかしながら、本発明の範囲から逸脱することなく、任意の所望のマークアップ言語、スクリプト言語、または任意の他のフォーマットを使用することができる。ユーザーは、コンダクタ２３０を制御するための様々なアクションを実行するために、この実施形態ではブラウザ２２０を介してウェブアプリケーション２３２からのウェブページとインタラクトする。例えば、ユーザーは、ロボットグループを作成し、ロボットにパッケージを割り当て、ロボットごとおよび／またはプロセスごとにログを解析し、ロボットを起動および停止することなどができる。

ウェブアプリケーション２３２に加えて、コンダクタ２３０はまた、ＯＤａｔａＲＥＳＴＡＰＩエンドポイント２３４を公開するサービス層を含む。しかしながら、本発明の範囲から逸脱することなく、他のエンドポイントが含まれてもよい。ＲＥＳＴＡＰＩは、ウェブアプリケーション２３２とエージェント２１４の両方によって消費される。エージェント２１４は、この実施形態ではクライアントコンピュータ上の１つまたは複数のロボットの管理者である。

この実施形態におけるＲＥＳＴＡＰＩは、構成、ロギング、監視、およびキューイング機能をカバーする。構成エンドポイントは、いくつかの実施形態では、アプリケーションユーザー、権限、ロボット、アセット、リリース、および環境を定義および構成するために使用され得る。例えば、エラー、ロボットによって送信された明示的なメッセージ、および他の環境固有の情報などの様々な情報をログに記録するために、ＲＥＳＴエンドポイントをロギングすることができる。開始ジョブコマンドがコンダクタ２３０内で使用される場合に遂行されるべきパッケージバージョンをクエリするために、デプロイメントＲＥＳＴエンドポイントがロボットによって使用されてもよい。ＲＥＳＴエンドポイントをキューイングすることは、キューにデータを追加すること、キューからトランザクションを取得すること、トランザクションの状態を設定することなど、キューおよびキュー項目管理を担当することができる。

ＲＥＳＴエンドポイントの監視は、ウェブアプリケーション２３２およびエージェント２１４を監視することができる。通知監視ＡＰＩ２３６は、エージェント２１４の登録、エージェント２１４への構成設定の配信、ならびにサーバーおよびエージェント２１４からの通知の送信／受信に使用されるＲＥＳＴエンドポイントであってもよい。通知監視ＡＰＩ２３６はまた、いくつかの実施形態では、ＷｅｂＳｏｃｋｅｔ通信を使用してもよい。

永続層は、この実施形態におけるサーバーのペア、すなわちデータベースサーバー２４０（例えば、ＳＱＬサーバー）およびインデクササーバー２５０を含む。この実施形態におけるデータベースサーバー２４０は、ロボット、ロボットグループ、関連するプロセス、ユーザー、役割、スケジュールなどの構成を格納する。この情報は、いくつかの実施形態ではウェブアプリケーション２３２を介して管理される。データベースサーバー２４０は、キューおよびキュー項目を管理することができる。いくつかの実施形態では、データベースサーバー２４０は、（インデクササーバー２５０に加えて、またはその代わりに）ロボットによって記録されたメッセージを格納することができる。

インデクササーバー２５０は、いくつかの実施形態ではオプションであり、ロボットによって記録された情報を格納し、インデックス付けする。特定の実施形態では、インデクササーバー２５０は、構成設定を通じて無効にすることができる。いくつかの実施形態では、インデクササーバー２５０は、オープンソースプロジェクトのフルテキスト検索エンジンであるＥｌａｓｔｉｃＳｅａｒｃｈ（登録商標）を使用する。ロボット（例えば、ログメッセージまたは行書き込みのようなアクティビティを使用する）によってログされたメッセージは、ロギングＲＥＳＴエンドポイントを介してインデクササーバー２５０に送信されてもよく、そこでそれらは将来の利用のためにインデックス付けされる。

図３は、本発明の一実施形態による、デザイナ３１０、アクティビティ３２０、３３０、およびドライバ３４０の間の関係３００を示すアーキテクチャ図である。上記により、開発者は、デザイナ３１０を使用して、ロボットによって遂行されるワークフローを開発する。ワークフローは、ユーザー定義のアクティビティ３２０およびＵＩ自動化アクティビティ３３０を含むことができる。いくつかの実施形態は、本明細書ではコンピュータビジョン（ＣＶ）と呼ばれる、画像内の非テキスト視覚コンポーネントを識別することができる。そのようなコンポーネントに関係するいくつかのＣＶアクティビティは、クリック、タイプ、テキストを取得、ホバー、要素存在、リフレッシュ範囲、ハイライトなどを含み得るが、これらに限定されない。いくつかの実施形態では、クリックは、例えば、ＣＶ、光学文字認識（ＯＣＲ）、ファジー文字マッチング、およびマルチアンカーを使用して要素を識別し、それをクリックする。タイプは、上記および要素内のタイプを使用して要素を識別することができる。テキストを取得し、ＯＣＲを使用して特定のテキストの位置を識別し、それをスキャンすることができる。ホバーは、要素を識別し、それをホバーすることができる。要素が存在することは、上述した技術を使用して、画面上に要素が存在するかどうかをチェックすることができる。いくつかの実施形態では、デザイナ３１０に実装することができるアクティビティは、数百または数千であってもよい。しかしながら、本発明の範囲から逸脱することなく、任意の数および／またはタイプのアクティビティが利用可能であり得る。

ＵＩ自動化アクティビティ３３０は、下位レベルコード（例えば、ＣＶアクティビティ）に書き込まれ、画面とのインタラクションを容易にする特別な低レベルのアクティビティのサブセットである。ＵＩ自動化アクティビティ３３０は、ロボットが所望のソフトウェアとインタラクトすることを可能にするドライバ３４０を介したこれらのインタラクションを容易にする。例えば、ドライバ３４０は、ＯＳドライバ３４２、ブラウザドライバ３４４、ＶＭドライバ３４６、エンタープライズアプリケーションドライバ３４８などを含んでもよい。

ドライバ３４０は、フックを探し、キーを監視するなど、低レベルでＯＳとインタラクトすることができる。それらは、Ｃｈｒｏｍｅ（登録商標）、ＩＥ（登録商標）、Ｃｉｔｒｉｘ（登録商標）、ＳＡＰ（登録商標）などとの統合を容易にすることができる。例えば、「クリック」アクティビティは、ドライバ３４０を介してこれらの異なるアプリケーションで同じ役割を実行する。

図４は、本発明の一実施形態による、ＲＰＡシステム４００を示すアーキテクチャ図である。いくつかの実施形態では、ＲＰＡシステム４００は、図１および／または図２のＲＰＡシステム１００および／または２００であり得るか、それらを含み得る。ＲＰＡシステム４００は、ロボットを実行する複数のクライアントコンピューティングシステム４１０を含む。コンピューティングシステム４１０は、その上で実行されるウェブアプリケーションを介してコンダクタコンピューティングシステム４２０と通信することができる。次に、コンダクタコンピューティングシステム４２０は、データベースサーバー４３０および任意選択のインデクササーバー４４０と通信することができる。

図１および図３に関して、これらの実施形態ではウェブアプリケーションが使用されているが、本発明の範囲から逸脱することなく、任意の適切なクライアント／サーバーソフトウェアを使用できることに留意されたい。例えば、コンダクタは、クライアントコンピューティングシステム上の非ウェブベースのクライアントソフトウェアアプリケーションと通信するサーバー側アプリケーションを実行することができる。

図５は、本発明の一実施形態による、ＭＬを使用してＲＰＡワークフローを自動的にアクティブ化および構成するように構成されたコンピューティングシステム５００を示すアーキテクチャ図である。いくつかの実施形態では、コンピューティングシステム５００は、本明細書に図示および／または記載されたコンピューティングシステムのうちの１つまたは複数であってもよい。コンピューティングシステム５００は、情報を通信するためのバス５０５または他の通信機構と、情報を処理するためにバス５０５に結合されたプロセッサ５１０と、を含む。プロセッサ５１０は、中央プロセッシングユニット（ＣＰＵ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、グラフィックスプロセッシングユニット（ＧＰＵ）、それらの複数のインスタンス、および／またはそれらの任意の組み合わせを含む、任意のタイプの汎用または専用プロセッサであってもよい。プロセッサ５１０はまた、複数の処理コアを有してもよく、コアの少なくともいくつかは、特定の機能を実行するように構成されてもよい。いくつかの実施形態では、複数並列処理が使用されてもよい。特定の実施形態では、プロセッサ５１０の少なくとも一方は、生体ニューロンを模倣する処理要素を含むニューロモーフィック回路であってもよい。いくつかの実施形態では、ニューロモーフィック回路は、フォンノイマンコンピューティングアーキテクチャの典型的なコンポーネントを必要としない場合がある。

コンピューティングシステム５００は、プロセッサ５１０によって遂行される情報および命令を格納するためのメモリ５１５をさらに含む。メモリ５１５は、ランダムアクセスメモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、フラッシュメモリ、キャッシュ、磁気もしくは光ディスクなどの静的ストレージ、または任意の他のタイプの非一時的コンピュータ可読媒体、またはそれらの組み合わせの任意の組み合わせで構成することができる。非一時的コンピュータ可読媒体は、プロセッサ５１０によってアクセス可能な任意の利用可能な媒体であってもよく、揮発性媒体、不揮発性媒体、またはその両方を含んでもよい。媒体はまた、取り外し可能、取り外し不能、またはその両方であってもよい。

さらに、コンピューティングシステム５００は、無線接続および／または有線接続を介して通信ネットワークへのアクセスを提供するためのトランシーバなどの通信デバイス５２０を含む。いくつかの実施形態では、通信デバイス５２０は、周波数分割多元接続（ＦＤＭＡ）、シングルキャリアＦＤＭＡ（ＳＣ－ＦＤＭＡ）、時分割多元接続（ＴＤＭＡ）、符号分割多元接続（ＣＤＭＡ）、直交周波数分割多重方式（ＯＦＤＭ）、直交周波数分割多元接続（ＯＦＤＭＡ）、移動体用グローバルシステム（ＧＳＭ）通信、汎用パケット無線サービス（ＧＰＲＳ）、ユニバーサル移動体通信システム（ＵＭＴＳ）、ｃｄｍａ２０００、広帯域ＣＤＭＡ（Ｗ－ＣＤＭＡ）、高速ダウンリンクパケットアクセス（ＨＳＤＰＡ）、高速アップリンクパケットアクセス（ＨＳＵＰＡ）、高速パケットアクセス（ＨＳＰＡ）、ロングタームエボリューション（ＬＴＥ）、ＬＴＥアドバンスト（ＬＴＥ－Ａ）、８０２．１１ｘ、Ｗｉ－Ｆｉ、Ｚｉｇｂｅｅ、超広帯域無線（ＵＷＢ）、８０２．１６ｘ、８０２．１５、ホームノードＢ（ＨｎＢ）、Ｂｌｕｅｔｏｏｔｈ、無線周波数識別（ＲＦＩＤ）、赤外線データ協会（ＩｒＤＡ）、近距離通信（ＮＦＣ）、第５世代（５Ｇ）、新無線（ＮＲ）、それらの任意の組み合わせ、ならびに／あるいは本発明の範囲から逸脱することなく、任意の他の現在存在する、または将来実施される通信規格および／またはプロトコルを使用するように構成されてもよい。いくつかの実施形態では、通信デバイス５２０は、本発明の範囲から逸脱することなく、単一、アレイ、位相、切り替え、ビームフォーミング、ビームステア、それらの組み合わせ、および／または任意の他のアンテナ構成である１つまたは複数のアンテナを含むことができる。

プロセッサ５１０はさらに、バス５０５を介して、プラズマディスプレイ、液晶ディスプレイ（ＬＣＤ）、発光ダイオード（ＬＥＤ）ディスプレイ、電界放出ディスプレイ（ＦＥＤ）、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、フレキシブルＯＬＥＤディスプレイ、フレキシブル基板ディスプレイ、プロジェクションディスプレイ、４Ｋディスプレイ、高精細ディスプレイ、Ｒｅｔｉｎａ（登録商標）ディスプレイ、インプレーンスイッチング（ＩＰＳ）ディスプレイ、またはユーザーに情報を表示するための任意の他の適切なディスプレイなどのディスプレイ５２５にさらに結合される。ディスプレイ５２５は、抵抗性、容量性、表面弾性波（ＳＡＷ）容量性、赤外線、光学イメージング、分散信号技術、音響パルス認識、フラストレート全内部反射などを使用して、タッチ（触覚）ディスプレイ、３次元（３Ｄ）タッチディスプレイ、マルチ入力タッチディスプレイ、マルチタッチディスプレイなどとして構成され得る。本発明の範囲から逸脱することなく、任意の適切なディスプレイデバイスおよび触覚Ｉ／Ｏが使用され得る。

キーボード５３０およびコンピュータマウス、タッチパッドなどのカーソル制御デバイス５３５は、ユーザーがコンピューティングシステムとインターフェースすることを可能にするためにバス５０５にさらに結合される。しかしながら、特定の実施形態では、物理的なキーボードおよびマウスが存在しなくてもよく、ユーザーは、ディスプレイ５２５および／またはタッチパッド（図示せず）のみを介してデバイスとインタラクトすることができる。入力デバイスの任意のタイプおよび組み合わせを、設計上の選択事項として使用することができる。特定の実施形態では、物理的入力デバイスおよび／またはディスプレイは存在しない。例えば、ユーザーは、それと通信する別のコンピューティングシステムを介してコンピューティングシステム５００と遠隔でインタラクトすることができ、またはコンピューティングシステム５００は自律的に動作することができる。

メモリ５１５は、プロセッサ５１０によって遂行されると機能を提供するソフトウェアモジュールを格納する。モジュールは、コンピューティングシステム５００のためのオペレーティングシステム５４０を含む。モジュールは、本明細書に記載のプロセスまたはその派生物の全部または一部を実行するように構成された自動ワークフローアクティブ化および構成モジュール５４５をさらに含む。コンピューティングシステム５００は、追加の機能を含む１つまたは複数の追加の機能モジュール５５０を含むことができる。

当業者は、「システム」が、本発明の範囲から逸脱することなく、サーバー、組込みコンピューティングシステム、パーソナルコンピュータ、コンソール、パーソナルデジタルアシスタント（ＰＤＡ）、携帯電話、タブレットコンピューティングデバイス、量子コンピューティングシステム、もしくは任意の他の適切なコンピューティングデバイス、またはデバイスの組み合わせとして具現化され得ることを理解するであろう。上記の機能を「システム」によって実行されるものとして提示することは、本発明の範囲を決して限定することを意図するものではなく、本発明の多くの実施形態の一例を提供することを意図している。実際、本明細書に開示する方法、システム、および装置は、クラウドコンピューティングシステムを含むコンピューティング技術と一致する局所化された形態および分散された形態で実装されてもよい。

本明細書に記載されたシステム特徴のいくつかは、それらの実施態様の独立性をより具体的に強調するために、モジュールとして提示されていることに留意されたい。例えば、モジュールは、カスタムの超大規模集積（ＶＬＳＩ）回路またはゲートアレイ、ロジックチップ、トランジスタ、または他のディスクリートコンポーネントなどの既製の半導体を含むハードウェア回路として実装されてもよい。モジュールはまた、フィールドプログラマブルゲートアレイ、プログラマブルアレイロジック、プログラマブルロジックデバイス、グラフィックスプロセッシングユニットなどのプログラマブルハードウェアデバイスに実装されてもよい。

モジュールはまた、様々なタイプのプロセッサによって遂行するためのソフトウェアに少なくとも部分的に実装されてもよい。遂行可能コードの識別されたユニットは、例えば、オブジェクト、プロシージャ、または関数として編成することができるコンピュータ命令の１つまたは複数の物理ブロックまたは論理ブロックを含むことができる。それにもかかわらず、識別されたモジュールの遂行可能ファイルは、物理的に共に配置される必要はないが、論理的に共に結合されたときにモジュールを含み、モジュールの記載された目的を達成する異なる場所に格納された異なる命令を含むことができる。さらに、モジュールは、コンピュータ可読媒体に格納されてもよく、それは、例えば、ハードディスクドライブ、フラッシュデバイス、ＲＡＭ、テープ、および／または本発明の範囲から逸脱することなくデータを格納するために使用される任意の他のそのような非一時的コンピュータ可読媒体であってもよい。

実際、遂行可能コードのモジュールは、単一の命令、または多くの命令であってもよく、いくつかの異なるコードセグメント、異なるプログラム、およびいくつかのメモリデバイスに分散されてもよい。同様に、操作データは、本明細書ではモジュール内で識別および図示されてもよく、任意の適切な形態で具現化され、任意の適切なタイプのデータ構造内に編成されてもよい。操作データは、単一のデータセットとして収集されてもよく、または異なるストレージデバイスを含む異なる場所に分散されてもよく、少なくとも部分的に、システムまたはネットワーク上の電子信号としてのみ存在してもよい。

図６は、本発明の一実施形態による、自動アクティブ化のためにＭＬを使用するＲＰＡワークフロー６００を示す。ＲＰＡワークフロー６００において、決定論的アクティビティ１６１０は常に決定論的アクティビティ２６２０をもたらし、決定論的アクティビティ２６２０は常に確率論的アクティビティ６３０をもたらす。しかしながら、確率論的アクティビティ６３０は、ＭＬモデル６４０を使用してデータを処理し、信頼度値を返す。例えば、ＭＬモデル６４０が画像内の車を認識するように訓練され、信頼度しきい値が７０％である場合には、ＲＰＡワークフロー６００は、この７０％信頼度しきい値が満たされた場合にのみ決定論的アクティビティ３６５０に進み、決定論的アクティビティ４６６０に進む。この意味で、ＲＰＡワークフロー６００を遂行するロボットは、信頼度しきい値およびＭＬモデル６４０からの出力に基づいてステップ６５０および６６０をオンまたはオフにする。時間の経過と共に、信頼度しきい値は、それが適用されるシナリオによりよく適合するように修正されてもよく、ＭＬモデルは、より正確になるように再訓練などされてもよい。

複数のＭＬモデルが使用されるいくつかの実施形態では、各ＭＬモデルからの信頼度値を組み合わせて、確率論的アクティビティの信頼度しきい値と比較されるグローバル信頼度値を決定することができる。特定の実施形態では、グローバル信頼度値は、各ＭＬモデルの信頼度値にそれぞれの重みを適用し、重み付き信頼度値を組み合わせることによって決定される。例えば、３つのＭＬモデルが使用される場合、第１のＭＬモデルからの信頼度値に５０％の重みが適用され得、第２のＭＬモデルからの信頼度値に３０％の重みが適用され得、第３のＭＬモデルからの信頼度値に２０％の重みが適用され得る。

図７は、本発明の一実施形態による、ＭＬを使用してＲＰＡワークフローを自動的にアクティブ化および構成するためのプロセス７００を示すフローチャートである。プロセスは、７１０において、複数の決定論的アクティビティと、ＭＬモデルを呼び出す少なくとも１つの確率論的アクティビティと、を含むＲＰＡワークフローを生成することから始まる。その後に、ワークフローを実施するＲＰＡロボットが７２０で生成される。７３０において、ＭＬモデルが呼び出され、ＭＬモデルから信頼度値が受信される。７４０において信頼度値が信頼度しきい値を超えない場合（例えば、ＭＬモデルからの単一の信頼度値、複数のＭＬモデルからのグローバル信頼度値など）には、７５０において、確率論的アクティビティに続くワークフローセクションはオフにされるか、取得されないか、または論理的に回避される。任意選択的に、信頼度しきい値は、７６０において上昇および下降されてもよい。特定の実施形態では、システムは、ワークフローのプロセスが所定の回数実行されるまで、所定の時間が経過するまでなど、信頼度しきい値を修正するのを待つことができる。

７４０で信頼度値が信頼度しきい値を超える場合には、７７０で確率論的アクティビティに続くワークフローのセクションがオンにされるか、取得されるか、または論理的に有効にされ、７８０で確率論的アクティビティが実行された後のワークフローセクションが遂行される。任意選択的に、信頼度しきい値は、７６０において上昇および下降されてもよい。

いくつかの実施形態では、信頼度しきい値の修正は、ＭＬモデルの欠陥のために所望の結果を達成しない可能性がある。例えば、上記の自動小売システムの例を挙げると、所定の数の調整（例えば２０）後に購入する商品を取るユーザーの信頼度しきい値に対する変更にかかわらず、誤判定率が許容できないほど高いままである（例えば、５％）場合を考える。７９０において、ＭＬモデルの少なくとも一方が所望の結果を達成していないと判定することができる。次いで、７９５でＭＬモデルを再訓練することができる。ＲＰＡロボットが判定を行う場合、ステップ７９０は、ＲＰＡロボットが、ＭＬモデルの再訓練が実行されるべきであるという指示をサーバーに送信することを含むことができる。

図８は、本発明の一実施形態による、ＭＬを使用してＲＰＡワークフローを自動的にアクティブ化および構成するための別のプロセス８００を示すフローチャートである。プロセスは、８１０において、複数の決定論的アクティビティと、ＭＬモデルを呼び出す少なくとも１つの確率論的アクティビティとを含むＲＰＡワークフローを生成することから始まる。８２０において、ＭＬモデルが呼び出され、ＭＬモデルから信頼度値が受信される。

信頼度値が受信された後に、８３０において、信頼度値が複数の信頼度しきい値範囲と比較される。次いで、８４０において、信頼度値が入る信頼度しきい値範囲に対応する確率論的アクティビティ後のワークフローの後続のセクションが遂行される。任意選択的に、８５０において、信頼度範囲のうちの１つまたは複数を修正することができる。１つまたは複数の信頼度範囲の変更は、勝利状態が達成されるまで繰り返されてもよい。

いくつかの実施形態では、決定論的アクティビティと確率論的アクティビティとのより複雑な混合をワークフローで使用することができる。実際、本発明の範囲から逸脱することなく、決定論的アクティビティおよび確率論的アクティビティの任意のタイプおよび組み合わせを採用することができる。実際、特定の実施形態では、ワークフローのいくつかの部分は図７と同様であり得るが、他の部分は図８と同様であり得る。

図７および図８で実行されるプロセスステップは、本発明の実施形態に従って、プロセッサが図７および図８で説明したプロセスの少なくとも一部を実行するための命令を符号化するコンピュータプログラムによって実行されてもよい。コンピュータプログラムは、非一時的コンピュータ可読媒体上で具現化されてもよい。コンピュータ可読媒体は、ハードディスクドライブ、フラッシュデバイス、ＲＡＭ、テープ、および／またはデータを格納するために使用される任意の他のそのような媒体または媒体の組み合わせであってもよいが、これらに限定されない。コンピュータプログラムは、コンピュータ可読媒体に格納することもできる、図７および図８で説明したプロセスステップの全部または一部を実施するようにコンピューティングシステムのプロセッサ（例えば、図５のコンピューティングシステム５００のプロセッサ５１０）を制御するための符号化命令を含むことができる。

コンピュータプログラムは、ハードウェア、ソフトウェア、またはハイブリッド実装で実施することができる。コンピュータプログラムは、互いに動作可能に通信し、表示するために情報または命令を渡すように設計されたモジュールから構成することができる。コンピュータプログラムは、汎用コンピュータ、ＡＳＩＣ、または任意の他の適切なデバイス上で動作するように構成することができる。

本発明の様々な実施形態のコンポーネントは、本明細書の図に一般的に記載および図示するように、多種多様な異なる構成で配置および設計されてもよいことが容易に理解されよう。したがって、添付の図面に表される本発明の実施形態の詳細な説明は、特許請求される本発明の範囲を限定することを意図するものではなく、本発明の選択された実施形態を単に代表するものである。

本明細書を通して説明される本発明の特徴、構造、または特性は、１つまたは複数の実施形態において任意の適切な方法で組み合わせることができる。例えば、本明細書全体を通して「特定の実施形態」、「いくつかの実施形態」、または同様の文言への言及は、実施形態に関連して説明される特定の特徴、構造、または特性が本発明の少なくとも１つの実施形態に含まれることを意味する。したがって、本明細書全体を通して、「特定の実施形態では」、「いくつかの実施形態では」、「他の実施形態では」というフレーズ、または同様の文言の出現は、必ずしもすべてが同じ実施形態のグループを指すわけではなく、記載された特徴、構造、または特性は、１つまたは複数の実施形態において任意の適切な方法で組み合わせることができる。

本明細書を通して特徴、利点、または同様の文言を参照することは、本発明で実現され得る特徴および利点のすべてが本発明の任意の単一の実施形態であるべきであること、または本発明の任意の単一の実施形態であることを意味するものではないことに留意されたい。むしろ、特徴および利点に言及する文言は、一実施形態に関連して説明される特定の特徴、利点、または特性が本発明の少なくとも１つの実施形態に含まれることを意味すると理解される。したがって、本明細書を通して、特徴および利点、ならびに同様の文言の説明は、必ずしもそうとは限らないが、同じ実施形態を参照することができる。

さらに、本発明の記載された特徴、利点、および特性は、１つまたは複数の実施形態において任意の適切な方法で組み合わせることができる。当業者は、特定の実施形態の特定の特徴または利点の１つまたは複数なしで本発明を実施できることを認識するであろう。他の例では、本発明のすべての実施形態には存在しない可能性がある特定の実施形態において、追加の特徴および利点が認識され得る。

当業者は、上述の本発明が、異なる順序のステップ、および／または開示されているものとは異なる構成のハードウェア要素を用いて実施され得ることを容易に理解するであろう。したがって、本発明をこれらの好ましい実施形態に基づいて説明してきたが、本発明の趣旨および範囲内に留まりながら、特定の修正、変形、および代替構築が明らかであることは、当業者には明らかであろう。したがって、本発明の範囲を決定するために、添付の特許請求の範囲を参照すべきである。

Claims

コンピュータにより実施される方法であって、
ＲＰＡワークフローの確率論的アクティビティを実行する場合に、ロボティックプロセスオートメーション（ＲＰＡ）ロボットによって、少なくとも１つの機械学習（ＭＬ）モデルを呼び出すステップと、
前記ＲＰＡロボットによって、前記少なくとも１つのＭＬモデルから少なくとも１つの信頼度値を受信するステップと、
前記少なくとも１つの信頼度値が信頼度しきい値を超えない場合に、前記ＲＰＡロボットによって、前記確率論的アクティビティの後のワークフローセクションをオフにするか、取得しないか、または論理的に回避するステップと、
前記少なくとも１つの信頼度値が前記信頼度しきい値を超える場合に、
前記ＲＰＡロボットによって、前記確率論的アクティビティの後のワークフローセクションをオンにするか、取得するか、または論理的に従うステップと、
前記ＲＰＡロボットによって、前記確率論的アクティビティに続いて前記ワークフローセクションを遂行するステップと、を含む、コンピュータにより実施される方法。
複数の決定論的アクティビティと、前記少なくとも１つのＭＬモデルを呼び出すように構成された前記少なくとも１つの確率論的アクティビティと、を含む前記ＲＰＡワークフローを生成するステップと、
前記生成されたＲＰＡワークフローを実施する前記ＲＰＡロボットを生成するステップと、
をさらに含む、請求項１に記載のコンピュータにより実施される方法。
前記ワークフローのプロセスが所定の回数実行された後に、または所定の時間が経過した後に、前記ＲＰＡロボットによって、前記信頼度しきい値を上昇または下降させるステップをさらに含む、
請求項１に記載のコンピュータにより実施される方法。
前記ＲＰＡロボットによる前記信頼度しきい値の前記上昇または下降は、勝利状態が達成されるまで繰り返される、請求項３に記載のコンピュータにより実施される方法。
前記ＲＰＡロボットによって、前記少なくとも１つのＭＬモデルが前記信頼度しきい値に対する所定数の修正後に結果を達成していないと判定するステップと、
前記少なくとも１つのＭＬモデルを再訓練するステップと、
をさらに含む、請求項３に記載のコンピュータにより実施される方法。
前記ＲＰＡロボットは、アクティビティパラメータを修正するか、特定のリソースの提供量を決定するか、より最適な信頼度しきい値を決定するか、またはこれらの任意の組み合わせを行うように構成される、請求項１に記載のコンピュータにより実施される方法。
前記ＲＰＡロボットが複数のＭＬモデルを呼び出し、各ＭＬモデルからの前記信頼度値が組み合わされて、前記確率論的アクティビティの前記信頼度しきい値と比較されるグローバル信頼度値を決定する、請求項１に記載のコンピュータにより実施される方法。
前記グローバル信頼度値は、前記信頼度値にそれぞれの重みを適用し、重み付き信頼度値を組み合わせることによって決定される、請求項７に記載のコンピュータにより実施される方法。
非一時的コンピュータ可読媒体に格納されたコンピュータプログラムであって、前記プログラムは、少なくとも１つのプロセッサに、
ＲＰＡワークフローの確率論的アクティビティを遂行する場合に機械学習（ＭＬ）モデルを呼び出させ、
前記ＭＬモデルから信頼度値を受信させ、
前記信頼度値が信頼度しきい値を超えない場合に、前記確率論的アクティビティの後のワークフローセクションをオフにさせるか、取得させないか、または論理的に回避させ、
前記信頼度値が前記信頼度しきい値を超える場合に、
前記確率論的アクティビティの後のワークフローセクションをオンにさせるか、取得させるか、または論理的に従わせ、
前記確率論的アクティビティに続いて前記ワークフローセクションを遂行させるように構成される、コンピュータプログラム。
前記プログラムは、前記少なくとも１つのプロセッサに、
前記ワークフローのプロセスが所定の回数実行された後に、または所定の時間が経過した後に、前記信頼度しきい値を上昇または下降させるようにさらに構成される、請求項９に記載のコンピュータプログラム。
前記信頼度しきい値の前記上昇または下降は、勝利状態が達成されるまで繰り返される、請求項１０に記載のコンピュータプログラム。
前記プログラムは、前記少なくとも１つのプロセッサに、
前記ＭＬモデルが前記信頼度しきい値に対する所定数の修正後に結果を達成していないと判定させ、
前記ＭＬモデルを再訓練するようにサーバーに指示を提供させるようにさらに構成される、請求項１０に記載のコンピュータプログラム。
前記プログラムは、前記少なくとも１つのプロセッサに、
アクティビティパラメータを修正させるか、特定のリソースの提供量を決定させるか、より最適な信頼度しきい値を決定させるか、またはこれらの任意の組み合わせを行わせるようにさらに構成される、請求項９に記載のコンピュータプログラム。
コンピュータにより実施される方法であって、
ＲＰＡワークフローの確率論的アクティビティを実行する場合に、ロボティックプロセスオートメーション（ＲＰＡ）ロボットによって、少なくとも１つの機械学習（ＭＬ）モデルを呼び出すステップと、
前記ＲＰＡロボットによって、前記少なくとも１つのＭＬモデルから少なくとも１つの信頼度値を受信するステップと、
前記ＲＰＡロボットによって、前記少なくとも１つの信頼度値を複数の信頼度しきい値範囲と比較するステップと、
前記少なくとも１つの信頼度値が信頼度しきい値範囲内にある場合に、
前記ＲＰＡロボットによって、前記信頼度しきい値範囲についての前記確率論的アクティビティの後のワークフローセクションをオンにするか、取得するか、または論理的に従うステップと、
前記ＲＰＡロボットによって、前記信頼度しきい値範囲についての前記確率論的アクティビティに続いて前記ワークフローセクションを遂行するステップと、を含む、コンピュータにより実施される方法。
複数の決定論的アクティビティと、前記少なくとも１つのＭＬモデルを呼び出すように構成された前記少なくとも１つの確率論的アクティビティと、を含む前記ＲＰＡワークフローを生成するステップと、
前記生成されたＲＰＡワークフローを実施する前記ＲＰＡロボットを生成するステップと、
をさらに含む、請求項１４に記載のコンピュータにより実施される方法。
前記ワークフローのプロセスが所定の回数実行された後に、または所定の時間が経過した後に、前記ＲＰＡロボットによって、前記信頼度しきい値範囲のうちの１つまたは複数を修正するステップをさらに含む、
請求項１４に記載のコンピュータにより実施される方法。
前記ＲＰＡロボットによる前記１つまたは複数の信頼度しきい値範囲の前記修正は、勝利状態が達成されるまで繰り返される、請求項１６に記載のコンピュータにより実施される方法。
前記ＲＰＡロボットによって、前記少なくとも１つのＭＬモデルが前記信頼度しきい値に対する所定数の修正後に結果を達成していないと判定するステップと、
前記少なくとも１つのＭＬモデルを再訓練するステップと、
をさらに含む、請求項１６に記載のコンピュータにより実施される方法。
前記ＲＰＡロボットは、アクティビティパラメータを修正するか、特定のリソースの提供量を決定するか、より最適な信頼度しきい値を決定するか、またはこれらの任意の組み合わせを行うように構成される、請求項１４に記載のコンピュータにより実施される方法。
前記ＲＰＡロボットが複数のＭＬモデルを呼び出し、各ＭＬモデルからの前記信頼度値が組み合わされて、前記確率論的アクティビティの前記信頼度しきい値範囲と比較されるグローバル信頼度値を決定し、
前記グローバル信頼度値は、前記信頼度値にそれぞれの重みを適用し、重み付き信頼度値を組み合わせることによって決定される、
請求項１４に記載のコンピュータにより実施される方法。