JP2022168859A

JP2022168859A - コンピュータ実装方法、コンピュータプログラム、及びシステム（予測クエリ処理）

Info

Publication number: JP2022168859A
Application number: JP2022071984A
Authority: JP
Inventors: リカオ; Li Cao; シュオリ; Shuo Li; シャオボワン; Xiaobo Wang; シンペンリウ; Xin Peng Liu; シェンヤンスン; sheng yan Sun
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2021-04-26
Filing date: 2022-04-25
Publication date: 2022-11-08
Also published as: CN115248815A; US11645283B2; US20220342887A1

Abstract

【課題】アクセス経路の選択を改善することが可能なコンピュータ実装方法、コンピュータプログラム及びシステム（予測クエリ処理）を提供する。【解決手段】方法は、入力変数を含むクエリステートメント表現を含む着信クエリステートメントを受信する段階３００２と、入力変数に関連した入力変数値を予測する段階３００４と、予測済みの入力変数値に依存した着信クエリステートメントのランタイム実行用のアクセス経路を選択する段階３０１０と、選択されたアクセス経路を使用して、着信クエリステートメントのランタイム実行を遂行する段階と、を含む。【選択図】図３

Description

データベースは、コンピュータシステムから電子的にアクセスされるデータの編成された収集物によって定義され得る。データベースは、関連したデータベース管理システム（ＤＢＭＳ）を有し得る。データベースのデータは、データの行及び列を有する一連のテーブルにおいて編成され得る。データベーステーブルは、同様にして、１又は複数のインデックスを含み得る。インデックスは、データベーステーブルへのアクセスを改善するデータ構造によって提供され得る。

構造化クエリ言語（ＳＱＬ）は、データベース管理システム（ＤＢＭＳ）においてプログラミングデータ管理に使用されるドメイン固有言語である。ＳＱＬクエリステートメントは、ＩＮＳＥＲＴクエリ動作、ＵＰＤＡＴＥクエリ動作、ＳＥＬＥＣＴクエリ動作、及びＤＥＬＥＴＥクエリ動作等の様々なデータベース演算のパフォーマンスに使用され得る。ＩＮＳＥＲＴ動作は、レコードをデータベーステーブルに入力するパフォーマンスに使用され得、ＳＥＬＥＣＴ動作は、データベーステーブルからデータを取得するために使用され得、ＵＰＤＡＴＥ動作は、データベーステーブル内の値を変更するために使用され得、ＤＥＬＥＴＥ動作は、データをデータベーステーブルから除去するために使用され得る。

ＳＱＬは、相関的なデータスツール管理システム（ＲＤＳＭＳ）のデータをプログラミング及び管理するために使用され得る。ＳＱＬは、構造化データを処理するために使用され得る。ここで、定義される関係は、トレーニング済みの異なるエンティティ若しくはデータの変数又はその両方である。ＳＱＬは、データクエリ言語（ＤＱＬ）、データ定義言語（ＤＤＬ）、データ制御言語（ＤＣＬ）、及びデータ操作言語（ＤＭＬ）を含む様々なサブ言語を含み得る。ＳＱＬの使用と共に、例えば、データクエリ、データ操作（挿入、更新、若しくは削除又はその組み合わせ）、データ定義（スキーマ作成及び修正）、及びデータアクセス制御を含む様々な演算が、データベース上で遂行され得る。

データ構造は、コンピュータシステムの演算を改善するために使用されている。データ構造は、改善されたコンピュータシステムの演算についてのコンピュータ環境におけるデータの編成を指す。データ構造タイプは、コンテナ、リスト、スタック、キュー、テーブル、及びグラフを含む。データ構造は、例えば、アルゴリズム効率、メモリ利用効率、保全性、及び信頼性の観点から、コンピュータシステムの演算を改善するために使用されている。

人工知能（ＡＩ）は、マシンによって示される知能を指す。人工知能（ＡＩ）リサーチは、検索及び数理最適化、ニューラルネットワーク、並びに確率を含む。人工知能（ＡＩ）ソリューションは、コンピュータサイエンス、数学、心理学、言語学、統計学、及び神経科学に及ぶ様々な異なる科学技術の領域におけるリサーチから導出された特徴を含む。機械学習は、明示的にプログラム化されることなくコンピュータに学習する能力を与える研究分野として、説明されている。

アクセス経路の選択が、クエリステートメントの入力変数に関連したクエリステートメントの入力変数値を予測することを含む方法を使用することにより改善され得る。

一態様において、方法の提供を通じて、先行技術の欠点が克服され、追加の利点が提供される。方法は、例えば、着信クエリステートメントを受信する段階であって、着信クエリステートメントは、入力変数を含むクエリステートメント表現を含む、受信する段階と、入力変数に関連した入力変数値を予測する段階と、予測済みの入力変数値に依存したクエリステートメントのランタイム実行用のアクセス経路を選択する段階と、選択されたアクセス経路を使用して、クエリステートメントのランタイム実行を遂行する段階とを含み得る。

他の態様において、コンピュータプログラム製品が提供され得る。コンピュータプログラム製品は、１又は複数の処理回路によって可読であり、方法を遂行するために１又は複数のプロセッサによる実行のための命令を格納するコンピュータ可読記憶媒体を含み得る。方法は、例えば、着信クエリステートメントを受信する段階であって、着信クエリステートメントは、入力変数を含むクエリステートメント表現を含む、受信する段階と、入力変数に関連した入力変数値を予測する段階と、予測済みの入力変数値に依存したクエリステートメントのランタイム実行用のアクセス経路を選択する段階と、選択されたアクセス経路を使用して、クエリステートメントのランタイム実行を遂行する段階とを含み得る。

さらなる態様において、システムが提供され得る。システムは、例えば、メモリを含み得る。さらに、システムは、メモリと通信する１又は複数のプロセッサを含み得る。さらに、システムは、方法を遂行すべく、メモリを介して１又は複数のプロセッサによって実行可能であるプログラム命令を含み得る。方法は、例えば、着信クエリステートメントを受信する段階であって、着信クエリステートメントは、入力変数を含むクエリステートメント表現を含む、受信する段階と、入力変数に関連した入力変数値を予測する段階と、予測済みの入力変数値に依存したクエリステートメントのランタイム実行用のアクセス経路を選択する段階と、選択されたアクセス経路を使用して、クエリステートメントのランタイム実行を遂行する段階とを含み得る。

一態様において、方法の提供を通じて、先行技術の欠点が克服され、追加の利点が提供される。方法は、例えば、着信クエリステートメントを受信する段階であって、着信クエリステートメントは、入力変数を含むクエリステートメント表現を含む、受信する段階と、クエリステートメントのランタイム実行用のアクセス経路を選択する段階と、選択されたアクセス経路を使用して、クエリステートメントのランタイム実行を遂行する段階であって、クエリステートメントのランタイム実行を遂行する段階は、入力変数に対する入力変数値を決定する段階を有する、遂行する段階と、予測モデルをトレーニングするためのトレーニングデータとして、決定された入力変数値を適用する段階であって、予測モデルは、入力変数に関連した入力変数値についての予測を返答するように構成される、適用する段階と、着信クエリステートメントの後続のインスタンスを受信する段階であって、着信クエリステートメントは、入力変数を含むクエリステートメント表現を含む、受信する段階と、着信クエリステートメントの後続のインスタンスにおける入力変数の入力変数値を予測すべく、予測モデルを問い合わせる段階と、予測済みの入力変数値に依存したクエリステートメントの後続のインスタンスのランタイム実行用のアクセス経路を選択する段階と、選択されたアクセス経路を使用して、クエリステートメントの後続のインスタンスのランタイム実行を遂行する段階とを含み得る。

他の態様において、コンピュータプログラム製品が、提供され得る。コンピュータプログラム製品は、１又は複数の処理回路によって可読であり、方法を遂行するために１又は複数のプロセッサによる実行のための命令を格納するコンピュータ可読記憶媒体を含み得る。方法は、例えば、着信クエリステートメントを受信する段階であって、着信クエリステートメントは、入力変数を含むクエリステートメント表現を含む、受信する段階と、クエリステートメントのランタイム実行用のアクセス経路を選択する段階と、選択されたアクセス経路を使用して、クエリステートメントのランタイム実行を遂行する段階であって、クエリステートメントのランタイム実行を遂行する段階は、入力変数に対する入力変数値を決定する段階を有する、遂行する段階と、予測モデルをトレーニングするためのトレーニングデータとして、決定された入力変数値を適用する段階であって、予測モデルは、入力変数に関連した入力変数値についての予測を返答するように構成される、適用する段階と、着信クエリステートメントの後続のインスタンスを受信する段階であって、着信クエリステートメントは、入力変数を含むクエリステートメント表現を含む、受信する段階と、着信クエリステートメントの後続のインスタンスにおける入力変数の入力変数値を予測すべく、予測モデルを問い合わせる段階と、予測済みの入力変数値に依存したクエリステートメントの後続のインスタンスのランタイム実行用のアクセス経路を選択する段階と、選択されたアクセス経路を使用して、クエリステートメントの後続のインスタンスのランタイム実行を遂行する段階とを含み得る。

さらなる態様において、システムが提供され得る。システムは、例えば、メモリを含み得る。さらに、システムは、メモリと通信する１又は複数のプロセッサを含み得る。さらに、システムは、方法を遂行すべく、メモリを介して１又は複数のプロセッサによって実行可能であるプログラム命令を含み得る。方法は、例えば、着信クエリステートメントを受信する段階であって、着信クエリステートメントは、入力変数を含むクエリステートメント表現を含む、受信する段階と、クエリステートメントのランタイム実行用のアクセス経路を選択する段階と、選択されたアクセス経路を使用して、クエリステートメントのランタイム実行を遂行する段階であって、クエリステートメントのランタイム実行を遂行する段階は、入力変数に対する入力変数値を決定する段階を有する、遂行する段階と、予測モデルをトレーニングするためのトレーニングデータとして、決定された入力変数値を適用する段階であって、予測モデルは、入力変数に関連した入力変数値についての予測を返答するように構成される、適用する段階と、着信クエリステートメントの後続のインスタンスを受信する段階であって、着信クエリステートメントは、入力変数を含むクエリステートメント表現を含む、受信する段階と、着信クエリステートメントの後続のインスタンスにおける入力変数の入力変数値を予測すべく、予測モデルを問い合わせる段階と、予測済みの入力変数値に依存したクエリステートメントの後続のインスタンスのランタイム実行用のアクセス経路を選択する段階と、選択されたアクセス経路を使用して、クエリステートメントの後続のインスタンスのランタイム実行を遂行する段階とを含み得る。

追加機能が、本明細書に記載されている技術によって実現される。方法、コンピュータプログラム製品、及びシステムを含むがこれらに限定されない他の実施形態及び態様が、本明細書で詳細に説明され、請求項に係る発明の一部とみなされる。

本発明の１又は複数の態様が、具体的に指摘され、本明細書の結論において特許請求の範囲における例として、明確に請求される。本発明の前述及び他のオブジェクト、特徴、及び利点は、添付図面と併せて以下の詳細な説明から明らかになる。

一実施形態に係る、データベースシステム、管理者システム、企業システム、及び管理者のクライアントコンピュータデバイスを有するシステムを示す。

一実施形態に係る、相互作用するデータベースシステムによるパフォーマンスのための方法を説明するフローチャートである。

一実施形態に係る、データベースシステムによるパフォーマンスのための方法を説明するフローチャートである。

一実施形態に係る、クエリステートメントの処理の複数の反復に応答して、データベーステーブルによって示され得る傾向の例を示す。

一実施形態に係る、予測モデルを示す。

一実施形態に係る、離散フーリエ変換解析による出力を示す。

クエリステートメントの連続的なランタイム実行にわって、ランタイムに決定された入力変数値によって定義される時系列の例を示す。

一実施形態に係る、ホールドアウトデータによって定義されたグラウンドトゥルースデータと比較されるように、クエリステートメントの入力変数の入力変数値を予測すべく、トレーニング済みの予測モデルの出力予測を説明する比較データを示す。

一実施形態に係る、コンピューティングノードを示す。

一実施形態に係る、クラウドコンピューティング環境を示す。

一実施形態に係る、抽象化モデルレイヤを示す。

図１の一実施形態において、データベースの応答時間を改善する際に使用されるシステム１００が記載されている。一実施形態によれば、システム１００は、関連したデータレポジトリ１０８を有する管理者システム１１０と、企業システム１２０Ａ－１２０Ｚと、管理者のクライアントコンピュータデバイス１３０と、データベースシステム１４０とを含み得る。一実施形態によれば、管理者システム１１０、企業システム１２０Ａ－１２０Ｚ、管理者のクライアントコンピュータデバイス１３０、及びデータベースシステム１４０は、コンピューティングノードベースのデバイス及びシステムによって提供され得、ネットワーク１９０を介して互いと通信し得る。ネットワーク１９０は、物理ネットワーク若しくは仮想ネットワーク又はその両方であり得る。物理ネットワークは、例えば、コンピュータサーバ及びコンピュータクライアント等の、多数のコンピュータノード又はシステムを接続する物理遠隔通信ネットワークであり得る。仮想ネットワークは、例えば、多数の物理ネットワーク又はその一部を、論理仮想ネットワークに統合し得る。他の例において、多数の仮想ネットワークは、単一の物理ネットワークにわたって定義され得る。

一実施形態によれば、管理者システム１１０、企業システム１２０Ａ－１２０Ｚ、管理者のクライアントコンピュータデバイス１３０、及びデータベースシステム１４０のそれぞれは、互いの外側に位置し得、例えば、異なる物理的なコンピューティングノード等の異なるコンピューティングノードに配置される。一実施形態によれば、管理者システム１１０、企業システム１２０Ａ－１２０Ｚ、管理者のクライアントコンピュータデバイス１３０、及びデータベースシステム１４０のうちの１又は複数は、管理者システム１１０、企業システム１２０Ａ－１２０Ｚ、又は管理者のクライアントコンピュータデバイス１２０、又はデータベースシステム１４０のうちの少なくとも１つに配置され得る。

一実施形態によれば、データベースシステム１４０は、構造化クエリ言語（ＳＱＬ）ベースのクエリステートメントに応答することができるＳＱＬデータベースシステムによって提供され得る。システム１００を使用している過程で、データベースシステム１４０は、企業システム１３０Ａ－１３０Ｚの１又は複数の企業システムからクエリを受信し得る。データベースシステム１４０によって受信されたクエリは、ＳＱＬステートメント等のクエリステートメントの形態を取り得る。データベースシステム１４０は、データベース１３６及びデータベース管理システム（ＤＢＭＳ）１４００を含み得る。データベース１３６は、テーブル３１２１及びインデックス３１２２を含み得る。テーブル３１２１は、データをデータの列及び行に論理的に編成し得る。テーブル内のデータの行は、レコードを定義し得る。テーブル３１２１の各テーブルは、０又はそれより多くのインデックス３１２２のインデックスをそれに関連付け得る。

本明細書の実施形態によって、クエリステートメントを処理する既存のアプローチを用いて、ランタイム実行処理を遂行する際に使用されるアクセス経路が、クエリステートメントの入力変数に関連したクエリステートメントの入力変数値を決定する時刻より前に選択され得ることを認識する。アクセス経路の複数の候補を選択することは、アクセス経路の候補がスコアリングされ得るコスト解析の対象であり得る。本明細書の実施形態によって、アクセス経路の選択が、クエリステートメントの入力変数に関連したクエリステートメントの入力変数値を予測することを含む方法を使用することにより改善され得ることを認識する。一実施形態によれば、ＤＢＭＳ１４００は、（ａ）クエリステートメントの入力変数に関連したクエリステートメントの入力変数値を予測することと、（ｂ）予測済みのクエリステートメントの入力変数値に依存して、アクセス経路の候補からアクセス経路を選択することとを行うように構成され得る。１つの具体的な実施形態によれば、ＤＢＭＳ１４００は、（ａ）クエリステートメントの入力変数に関連したクエリステートメントの入力変数値を予測することと、（ｂ）予測済みのクエリステートメントの入力変数値に依存して、アクセス経路の候補をスコアリングする際に使用されるフィルタ因子を選択することと、（ｃ）適用されたフィルタ因子を使用してアクセス経路の候補のコストスコアリングを遂行することと、（ｄ）コストスコアリングに基づいて、アクセス経路の候補からアクセス経路を選択することとを行うように構成され得る。

アクセス経路は、（ａ）アクセス方法の特性、（ｂ）結合順序の特性、（ｃ）結合方法の特性、及び／又は、（ｄ）ソート選択特性のうちの１又は複数によって特徴付けられ得る。

（ａ）アクセス方法の特性は、ベーステーブルにアクセスする方式を指し得る。一実施形態によれば、以下の２つの方法が存在し得る。（１）テーブルスキャン（リレーショナルスキャン）：最初の行から最後の行まで、本ベーステーブルからレコードをスキャンし、ＳＱＬにおいて指定された述部を修飾する行をピックアップすることを指し得る。（２）インデックススキャン：ベーステーブル内のレコードにアクセスするインデックスを使用することを指し得る。一実施形態によれば、テーブルスキャンを遂行するデータベースは、例えば、テーブルの全ての行を読み取り得、１又は複数の選択基準をテーブル内の行に適用し得る。テーブル内の行は、保証された順序ではなく処理され得るが、通常、連続的に処理され得る。特定のクエリステートメント値について、テーブルスキャンは、行の非同期的なプリフェッチングによって、ページＩ／Ｏ動作を減らし得る。一実施形態によれば、生産データベースは、処理のために、メインメモリ内に可能な限り多くの行をもたらす大きいＩ／Ｏを要求し得、テーブルスキャン動作がメモリ内にページングされている行を待機しないことを保証するために、データを非同期的にプリフェッチングし得る。インデックススキャンによれば、データベースは、例えば、指定されたインデックスの範囲内の行をスキャンすることによって、修飾行のセットを縮小すするインデックスにアクセスし得る。インデックスの指定された範囲内の行をスキャンするとき、生産データベースは、インデックス列が比較されているクエリステートメントの値によってインデックススキャンの範囲を決定し得る。インデックスのみのスキャンの場合において、要求されたデータの全てがインデックス内にあるので、生産データベースは、インデックスされたテーブルにアクセスしなくてよい。

（ｂ）結合順序の特性は、２のベーステーブルの結合、例えば、内部結合（ＩｎｎｅｒＪｏｉｎ）又は外部結合（ＯｕｔｅｒＪｏｉｎ）の結合'順序'を指し得る。

（ｃ）結合方法の特性は、結合の間、２つのテーブルを接続する方式を指し得る。一実施形態によれば、結合方法は、例えば、ネストループ結合（ＮｅｓｔＬｏｏｐＪｏｉｎ）、マージソート結合（ＭｅｒｇｅＳｏｒｔＪｏｉｎ）、ハイブリッド結合（ＨｙｂｒｉｄＪｏｉｎ）、若しくはハッシュ結合（ＨｙｂｒｉｄＪｏｉｎ）又はその組み合わせを含み得る。図６は、一例として、ネストループ結合を示す。ネストループ結合によれば、例えば、外部テーブルのアクセスされる行ごとに内部テーブルのスキャン、又は、外部テーブルのアクセスされる行ごとに内部テーブルに対するインデックス検索が遂行され得る。

（ｄ）ソート特性は、データベース内のソート動作を指し得る。例示的なものは、例えば、ＧＲＯＵＰＢＹ、ＯＲＤＥＲＢＹ動作を含み得る。

ＤＢＭＳ１４００によって処理されるクエリステートメントは、クエリステートメントのランタイム実行の間、入力変数値によって置換される１又は複数の入力変数を含み得る。入力変数は、ホスト変数又はパラメータマーカーによって提供され得る。クエリステートメントは、静的なクエリステートメント若しくは動的なクエリステートメント又はその両方を含み得る。静的なクエリステートメントは、ホスト変数によって提供される入力変数を含み得、動的なクエリステートメントは、パラメータマーカーによって提供される入力変数を含み得る。ホスト変数は、例えば、ＰＬ／Ｉ変数、Ｃ変数、フォートラン変数、ＲＥＸＸ変数、Ｊａｖａ（登録商標）変数、ＣＯＢＯＬデータ項目、又はアセンブラ言語のストレージ領域等のホスト言語における変数を指し得る。ホスト変数は、例えば、ＳＱＬ拡張を使用して宣言された変数からＳＱＬプリコンパイラによって生成されたホスト言語構造を指し得る。アプリケーションは、パラメータマーカーを適用変数に関連付け得る。パラメータマーカーは、その値がステートメントの実行の間に取得されるクエリステートメントにおけるプレースホルダによって提供され得る。

例示的なクエリステートメントが、以下のテーブルＡに記載される。
［テーブルＡ］

テーブルＡの例において、クエリステートメント表現"ＡＮＤＯ＿ＯＲＤＥＲＤＡＴＥ＞＝？"、"ＡＮＤＯ＿ＯＲＤＥＲＤＡＴＥ＜？"、及び"ＡＮＤＬ＿ＲＥＴＵＲＮＦＬＡＧ＝？"は、テーブルＡのクエリステートメントのランタイム実行の間に決定される入力変数値と置換される、それぞれの入力変数を含む。

本明細書の実施形態は、クエリステートメントの１又は複数のクエリステートメントの入力変数値を予測することと、クエリステートメントの入力変数値に依存したクエリステートメントのランタイム実行用のアクセス経路を選択することとを含み得る。本明細書の実施形態は、クエリステートメントのランタイム実行より前にクエリステートメントの１又は複数のクエリステートメントの入力変数値を予測することと、クエリステートメントの入力変数値に依存したクエリステートメントのランタイム実行用のアクセス経路を選択することとを含み得る。本明細書の実施形態は、クエリステートメントのランタイム実行の間に１又は複数のクエリステートメントの入力変数値を決定することより前に、クエリステートメントの１又は複数のクエリステートメントの入力変数値を予測することと、クエリステートメントの入力変数値に依存したクエリステートメントのランタイム実行用のアクセス経路を選択することとを含み得る。

本明細書の実施形態によれは、クエリステートメントの処理の既存のアプローチの課題を認識する。クエリステートメントの処理の１つの既存のアプローチによれば、データベースシステムは、異なる生成されたアクセス経路の候補を分析すべく、束縛時間処理の間に、コスト解析に基づいてランタイム実行処理を遂行する際に使用されるアクセス経路を確立し得る。静的なクエリステートメントの場合において、既存のアプローチによれば、生産データベースは、特定の静的なクエリステートメントの第１の受け取りに応答して、アクセス経路を確立するために束縛時間処理を遂行し得、特定の静的なクエリステートメントの後続の受け取りに応答して、ランタイム実行を遂行するために確立されたアクセス経路を使用し得る。動的なクエリステートメントの場合において、既存のアプローチによれば、データベースは、特定の動的なクエリステートメントの第１の受け取り及びそれぞれの後続の受け取りに応答して、アクセス経路を確立するために束縛時間処理を遂行し得る。静的なクエリステートメントを処理する場合又は動的なクエリステートメントを処理する場合のいずれかにおいて、既存のアプローチによる生産データベースは、束縛時間処理の間にアクセス経路を確立し得、ランタイム処理の間に確立されたアクセス経路に従って、クエリステートメントを実行し得る。

本明細書の実施形態によれば、クエリステートメントの入力変数値は、束縛時間処理の間、未知であり得るが、確立されたアクセス経路のパフォーマンスは、クエリステートメントのランタイム実行に対する実行ランタイム時より後に決定及び返答される、異なるクエリステートメントの入力変数値に対して顕著に変化し得ることを認識する。本明細書の実施形態によれば、最適化されたアクセス経路を選択するためのアクセス経路の選択が、ランタイム実行の間のその決定より前に入力変数値を予測し、予測済みの入力変数値に依存したクエリステートメントのランタイム実行用のアクセス経路を選択することによって、顕著に改善され得ることを認識する。本明細書の実施形態によれば、予測済みの入力変数値に依存したアクセス経路を選択するによって、最適化されたパフォーマンスを示す可能性が高いアクセス経路が選択されることをもたらし得ることを認識する。

ＤＢＭＳ１４００は、クエリステートメントを処理するためのクエリ処理プロセス１４１、及びロギングプロセス１４２を含む様々なプロセスを実行し得る。クエリステートメントを処理するためのクエリ処理プロセス１４１を実行するＤＢＭＳ１４００は、クエリステートメントの束縛時間処理を遂行し、クエリステートメントのランタイム実行処理を遂行するＤＢＭＳ１４００を含み得る。クエリステートメントの束縛時間処理を遂行する際に、ＤＢＭＳ１４００は、クエリステートメントに対する予測済みの入力変数値に依存したクエリステートメントを実行するためのアクセス経路を選択し得る。クエリステートメントの入力変数値を予測することについて、ＤＢＭＳ１４００は、クエリステートメント及び関連した入力変数を識別し得、クエリステートメントに関連した予測モデル及び予測済みの入力変数値の返答用の関連した入力変数を問い合わせ得る。クエリステートメントを識別することについて、ＤＢＭＳ１４００は、クエリステートメントに関連したメタデータを検査することを遂行し得る。メタデータを検査することは、着信クエリステートメントのメタデータを、ＤＢＭＳ１４００のデータレポジトリ１３８のメタデータを識別するクエリステートメントに相互参照することを含み得る。

ＤＢＭＳ１４００のデータレポジトリ１３８は、クエリステートメントの処理の際に使用されるデータを含む様々なデータを格納し得る論理データレポジトリであり得る。クエリステートメントの領域３１３１内のデータレポジトリ１３８は、データレポジトリ１３８によって処理されている過去のクエリステートメントを識別する、識別メタデータを格納し得る。データベースシステム１４０の展開期間の間に、共通クエリステートメントが、データベースシステム１４０の展開期間において数百回、又は、数千回、又はそれ以上処理され得ることが予測され得る。その演算中のデータベースシステム１４０は、例えば、数十、数百、又は数千の異なるクエリステートメントを同時に処理し得る。クエリステートメントを識別するメタデータは、例えば、任意の割り当てられた識別ラベル、若しくは、クエリステートメントのスキーマの検査によって抽出されたスキーマ署名識別子又はその両方を含み得る。クエリステートメントの領域３１３１内の固有のクエリステートメントを識別するメタデータの各インスタンスに関連して、識別されたクエリステートメントの属性を指定する属性データが格納され得る。属性データは、例えば、クエリステートメントの１又は複数の入力変数に対する識別子、及び、１又は複数の入力変数に関連した予測モデルの識別子を含み得る。

モデル領域３１３２において、データレポジトリ１３８は、入力変数を含むクエリステートメント表現に関連した、トレーニングされ、且つ、アクティブな予測モデルを格納し得る。モデル領域３１３２に格納されている、トレーニングされ、且つ、アクティブな予測モデルは、クエリステートメント表現の入力変数に関連したクエリステートメントの入力変数値を予測し得る。システム１００は、アクティブであると決定されるホスト変数値を予測し、精度を満たす閾値に従って予測を遂行するための予測モデルのトレーニングに関する管理者システム１１０が、データレポジトリ１３８に格納するために、アクティブな予測モデルをデータベースシステム１４０にプッシュし得るように動作可能であり得る。

ロギング領域３１３３において、データレポジトリ１３８は、クエリステートメントの過去の実行から再調整されたロギングデータを格納し得る。ロギングデータは、クエリステートメントに関連した過去の入力変数値を含み得る。ロギングデータはまた、例えば、時間全体にわたるテーブルのサイズ、クエリステートメントの実行から返答された返答データセットのサイズ、及びクエリステートメントの過去の実行から返答された過去のテーブルレコードの識別子を示す統計上のロギングデータを含み得る。

決定データ構造領域３１３４において、データレポジトリ１３８は、受信したクエリステートメントを評価する際にＤＢＭＳ１４００によって使用される決定データ構造を格納し得る。そのような決定データ構造の例は、アクセス経路の候補のコストスコアリングを容易にするマッピング決定データ構造を含み得る。そのようなマッピング決定データ構造は、クエリステートメント表現をフィルタ因子の値にマッピングするマッピング決定データ構造を含み得る。

着信クエリステートメントを処理するためのクエリ処理プロセス１４１を実行するときのＤＢＭＳ１４００は、クエリステートメント及び１又は複数の関連した入力変数値を識別するとすぐに、データレポジトリ１３８のモデル領域３１３２を検査し得、クエリステートメントの１又は複数の入力変数値に対する予測を返答し得る、クエリステートメントの任意のアクティブな予測モデルを識別し得る。クエリステートメントの入力変数値を予測するアクティブな予測モデルを識別するとすぐに、ＤＢＭＳ１４００は、入力変数に関連した予測済みのクエリステートメントの入力変数値を返答するアクティブな予測モデルを問い合わせ得る。ＤＢＭＳ１４００は、次に、入力変数に関連した予測済みのクエリステートメントの入力変数値に依存したクエリステートメントを実行するためのアクセス経路を選択し得る。

１つの具体的な実施形態において、ＤＢＭＳ１４００は、予測済みの入力変数値を使用してアクセス経路のそれぞれの候補のコストスコアリングを遂行し得、スコアに依存したクエリステートメントの実行のために、アクセス経路の候補のうちの１を選択し得る。

クエリ処理プロセス１４１を実行するＤＢＭＳ１４００は、アクセス経路を選択するとすぐに、選択されたアクセス経路を使用して、クエリステートメントのランタイム実行処理を遂行し得る。

ロギングプロセス１４２を実行するＤＢＭＳ１４００は、ＤＢＭＳ１４００によって実行された実行クエリステートメントに関するロギングデータを生成し得る。ＤＢＭＳ１４００によって処理されたそれぞれのクエリステートメントに対するロギングデータは、クエリステートメントの入力変数に関連した入力変数値を含み得る。ロギングデータはまた、例えば、時間全体にわたるテーブルのサイズ、クエリステートメントの実行から返答された返答データセットのサイズ、及びクエリステートメントの過去の実行から返答された過去のテーブルレコードの識別子を示す統計上のロギングデータを含み得る。ロギングプロセス１４２を実行するＤＢＭＳ１４００は、生成されたロギングデータをデータレポジトリ１３８のロギング領域３１３３に格納し得、入力変数に関連したクエリステートメントの入力変数値を予測する予測モデルをトレーニングする際に管理者システム１１０によって使用される、選択済みのロギングデータを管理者システム１１０にプッシュし得る。ロギングプロセス１４２を実行するＤＢＭＳ１４００は、管理者システム１１０による処理のために、ロギングプロセス１４２によって生成されたロギングデータを反復的に送信するＤＢＭＳ１４００を含み得る。ロギングプロセス１４２を実行するＤＢＭＳ１４００は、ある時間間隔で、又は、代替的に、それぞれの着信クエリステートメントを実行した終わりで、ロギングデータを管理者システム１１０に送信し得る。ＤＢＭＳ１４００によって送信されるロギングデータは、クエリステートメントの１又は複数の入力変数のそれぞれについて、クエリステートメントの実行によって返答される、決定された入力変数値を指定するロギングデータを含み得る。決定された入力変数値は、クエリステートメントの実行ランタイムの間に決定され得る。

管理者システム１１０がロギングデータを受け取るとすぐに、管理者システム１１０は、予測モデルをトレーニングすべく、受信したロギングデータを使用し得る。管理者システム１１０によってトレーニング済みの予測モデルは、クエリステートメントの入力変数に関連したクエリステートメントの入力変数値を予測する予測モデルを含み得る。図１に示されるような管理者システム１１０は、予測モデルをトレーニングし、クエリステートメントを処理するためにクエリ処理プロセス１４１を遂行する際にデータベースシステム１４０によって使用されるアクティブなトレーニング済みの予測モデルをプッシュすることを担当し得る。

データレポジトリ１０８内の管理者システム１１０は、管理者システム１１０によるトレーニングの対象となる予測モデルをモデル領域２１２１に含み得る。決定データ構造領域２１２２において、データレポジトリ１０８は、管理者システム１１０による動作決定の返答の際に使用される決定データ構造を格納し得る。動作決定は、例えば、予測モデルをアクティブにする動作決定を含み得る。予測モデルは、予測モデルが精度のレベルを満たす閾値を示す予測を生成するときにアクティブになり得る。

ロギング領域２１２３内のデータレポジトリ１０８は、クエリステートメントの過去の実行について、入力変数に関連した過去のクエリステートメントの入力変数値を指定するロギングデータを格納し得る。ロギングデータは、ＤＢＭＳ１４００によるロギングプロセス１４２のパフォーマンスにより、ＤＢＭＳ１４００からデータベースシステム１４０が受信したロギングデータを含み得る。管理者システム１１０は、クエリステートメントの入力変数に関連したホスト変数値を予測する予測モデルをトレーニングするために、ロギング領域２１２３のロギングデータを使用し得る。機械学習プロセス１１１を実行する管理者システム１１０は、モデル領域２１２１の予測モデルをトレーニングし得る。データベースシステム１４０によって処理されるそれぞれのクエリステートメントは、ホスト変数値がクエリステートメントのランタイム実行の間の入力変数の置換に対して決定される、１又は複数の入力変数を含み得る。モデル領域２１２１内のデータレポジトリ１０８は、データベースシステム１４０によって処理されるそれぞれのクエリステートメントに関連したそれぞれの入力変数ごとに予測モデルを格納し得る。

機械学習プロセス１１１を実行する管理者システム１１０は、データベースシステム１４０によって処理されるそれぞれのクエリステートメントの入力変数に関連した、説明された予測モデルを反復的にトレーニングし得る。機械学習プロセス１１１を実行する管理者システム１１０は、ＤＢＭＳ１４００から直近に受信した受信済みのロギングデータを使用して、それぞれの説明されたモデルを反復的にトレーニングする管理者システム１１０を含み得る。ロギングデータは、クエリステートメントの入力変数とデータベースシステム１４０によって処理されたクエリステートメントの直近の実行から決定された入力変数値との間でデータをマッピングすることを含み得る。動作決定プロセス１１２を実行する管理者システム１１０は、特定の予測モデルが閾値の精度条件を満たすクエリステートメントの入力変数値に対する予測を返答していることを決定する管理者システム１１０を含み得る。そのような動作決定を遂行することについて、動作決定プロセス１１２を実行する管理者システム１１０は、予測モデルに関連してホールドアウトデータによって定義されたグラウンドトゥルースデータに対して、予測モデルによって生成された予測を検査し得る。

動作決定プロセス１１２を実行する管理者システム１１０は、予測モデルが閾値の精度条件を満たす予測を返答しているか否かを決定することに応じて、予測モデルに関連したアクティブ／非アクティブなフラグ状態ラベルを制御する管理者システム１１０を含み得る。動作決定プロセス１１２を実行する管理者システム１１０は、予測モデルに関連したアクティブな状態ラベルによって指定され得るように、予測モデルが閾値の精度を満たす予測を生成している、という決定に応じて、動作決定を返答し、モデル領域３１３２に格納するためにアクティブなトレーニング済みの予測モデルをデータベースシステム１４０にプッシュし得る。データベースシステム１４０に一旦プッシュされると、クエリ処理プロセス１４１を実行するデータベースシステム１４０は、着信クエリステートメントを処理する際に、アクティブな予測モデルを使用し得る。

図２のフローチャートを参照すると、企業システム１２０Ａ－１２０Ｚ及び管理者システム１１０と相互作用する、データベースシステム１４０によるパフォーマンスのための方法が、説明される。ブロック１２０１では、企業システム１２０Ａ－１２０Ｚは、データベースシステム１４０による受け取りのために、トランザクションクエリデータを反復的に送信し得る。ブロック１２０１で送信されるトランザクションクエリデータは、複数の企業システムからのクエリステートメントによって定義され得る。それぞれのクエリステートメントを受け取るとすぐに、ブロック１４０１でのデータベースシステム１４０は、クエリ処理ブロック１４０１を遂行し得る。ブロック１４０１でクエリ処理プロセスを遂行するＤＢＭＳ１４００は、図１に関連して説明されたクエリ処理プロセス１４１を遂行するＤＢＭＳを含み得る。ブロック１４０１でのＤＢＭＳ１４００は、束縛時間処理及びクエリステートメントのランタイム実行を遂行し得る。束縛時間処理において、ＤＢＭＳ１４００は、コスト解析を使用してアクセス経路の様々な候補をスコアリングし得、コスト解析に基づいてアクセス経路の候補のうちの１つを選択し得る。ランタイム実行の間、ＤＢＭＳ１４００は、選択されたアクセス経路を使用するクエリステートメントを実行し得る。本明細書で記載されているように、アクセス経路を選択することは、クエリステートメントの入力変数に関連した予測済みのクエリステートメントの入力変数値に依存して遂行され得る。ＤＢＭＳ１４００は、クエリステートメントの束縛時間処理の間、クエリステートメントの１又は複数の入力変数に関連した１又は複数の入力変数値を予測し得、アクセス経路の候補のコストスコアリングのパフォーマンスにおいて予測済みの入力変数値を使用し得る。コストスコアリングに基づいて、ＤＢＭＳ１４００は、１又は複数の予測済みの入力変数値に依存したクエリステートメントのランタイム実行用のアクセス経路の候補からアクセス経路を選択し得る。

図３は、ＤＢＭＳ１４００がクエリ処理ブロック１４０１で束縛時間処理を遂行する方法３０００の一例を説明するフローチャートを示す。図３で説明される方法３０００のブロック３００２では、ＤＢＭＳ１４００は、企業システム１２０Ａ－１２０Ｚの企業システムからクエリステートメントを受信し得る。

ブロック３００４では、ＤＢＭＳ１４００は、ブロック３００４で受信した着信クエリステートメントを識別し得る。一実施形態によれば、データベースシステム１４０のデータレポジトリ１３８は、クエリステートメントの領域３１３１に、ＤＢＭＳ１４００によって処理された過去のクエリステートメントの識別メタデータを格納し得る。メタデータは、それぞれのクエリステートメントに割り当てられた、任意の割り当てられたメタデータであり得、及び／又は、クエリステートメントの処理によって外挿された、外挿されたメタデータであり得る。着信クエリステートメントを識別することについて、ＤＢＭＳ１４００は、着信クエリステートメントのメタデータの検査を遂行し得る。検査することは、着信クエリステートメントのメタデータを、過去のクエリステートメントを識別するクエリステートメントの領域３１３１のメタデータにマッチングすることを含み得る。着信クエリステートメントのメタデータは、クエリステートメントに割り当てられた、割り当てられたメタデータ、又は、クエリステートメントの処理によって外挿された、外挿されたメタデータを含み得る。外挿されたメタデータは、着信クエリステートメントのスキーマの検査によって返答されたスキーム署名メタデータを含み得る。ブロック３００４でクエリステートメントを識別すると共に、ＤＢＭＳ１４００は、クエリステートメントの１又は複数の入力変数を識別し得る。識別されたクエリステートメントの１又は複数の入力変数を識別するＤＢＭＳ１４００は、データレポジトリ１３８のクエリステートメントの領域３１３１に格納されている１又は複数の入力変数の識別子を検索するＤＢＭＳ１４００を含み得る。

ブロック３００４でクエリステートメントを識別するとすぐに、ＤＢＭＳ１４００は、ブロック３００６に進み得る。ブロック３００６では、ＤＢＭＳ１４００は、ブロック３００４で識別されたクエリステートメントに関連した１又は複数の予測モデルを問い合わせ得る。クエリステートメントの領域３１３１において、データレポジトリ１３８は、クエリステートメントに対する入力変数を識別する識別データ、及び、そのようなクエリステートメントに関連した入力変数値を予測するためにモデル領域３１３２に格納されているそのような入力変数に関連した予測モデルに対する識別子を含む、クエリステートメントの属性を指定するそれぞれ識別された過去のクエリステートメントデータを格納し得る。それぞれのクエリステートメントは、１個からＮ個の入力変数を有し得、それぞれのクエリステートメントの入力変数ごとに予測モデルがシステム１００内に提供され得る。データレポジトリ１３８内で、それぞれのクエリステートメントごとに、クエリステートメントの領域３１３１は、クエリステートメント内で入力変数表現を指定するデータを格納し得る。

ブロック３００６では、ＤＢＭＳ１４００は、クエリステートメントの１又は複数の入力変数に対して予測済みのクエリステートメントの入力変数値を返答すべく、ブロック３００４で識別されたクエリステートメントに関連した１又は複数のアクティブな予測モデルを問い合わせ得る。１又は複数の予測モデルを問い合わせすることは、コンテキストパラメータ値のセットを含む予測モデルのクエリデータを使用することを含み得る。コンテキストパラメータ値のセットは、ブロック３００２で受信した受信クエリステートメントに関連した作業負荷の属性を指定し得る。コンテキストパラメータ値のセットは、ブロック３００２で受信したクエリステートメントを含む、企業システムから受信したメッセージから抽出され得る。本明細書におけるアクティブな予測モデルは、精度のレベルを満たす閾値内で予測を生成している予測モデルを指し得る。ブロックでは、ＤＢＭＳ１４００は、着信クエリステートメントのそれぞれの入力変数に関連したそれぞれの予測モデルについてアクティブ／非アクティブなフラグ状態を検査し得、フラグ状態がアクティブである、という決定に応じて、それぞれのクエリステートメントについてアクティブな予測モデルを選択的にクエリし得る。システム１００は、予測モデルが閾値の精度レベルを有する予測を生成している、という決定に応じて、予測モデルのフラグ状態をアクティブに設定し得る。

ブロック３００６が完了したことに応じて、ＤＢＭＳ１４００は、ブロック３００８に進み得る。ブロック３００８では、ＤＢＭＳ１４００は、アクセス経路の複数の候補のコストスコアリングを遂行し得る。一態様において、スコアリングのパフォーマンスは、述部入力変数値に依存し得る。一態様において、複数のアクセス経路のスコアリングは、予測済みの入力変数値に依存して適用され得るフィルタ因子に依存し得る。

一実施形態によれば、アクセス経路の幾つかの候補のそれぞれに関連しているコストスコアリングを遂行するためのＤＢＭＳ１４００は、それぞれのアクセス経路に関連した合計コストをスコアリングし得る。適用され得る一スコアリング方法によれば、合計コスト値をアクセス経路の候補に割り当てるためのＤＢＭＳ１４００は、ＣＰＵコスト因子及びＩ／Ｏコスト因子を割り当て得る。ＣＰＵコスト因子のサブコンポーネントは、例えば、ベースコスト、ページコスト、スキャンコスト、及び行コストを含み得る。決定データ構造領域３１３４に格納されている決定データ構造をマッピングするコストによれば、予測済みの入力変数値に基づいて割り当てられたクエリステートメント表現に対して割り当てられたフィルタ因子は、アクセスされる行の数を推定するために使用され得、これは、ベースコスト、ページコスト、スキャンコスト、行コストに対する影響を推定し得、したがって、ＣＰＵコスト及びＩ／Ｏコストに対する影響を推定し得る。したがって、クエリステートメント表現に対して割り当てられたフィルタ因子は、アクセス経路の候補のコストスコアリングに割り当てされた合計コストに影響を与え得る。

ＳＱＬ内の述部は、ＷＨＥＲＥ節又はＨＡＶＩＮＧ節等の真／偽条件を指し得る。ＳＱＬ述部は、既存のクエリステートメントにおける節、関数、及びＳＱＬ表現の最後尾で発見され得る。一態様において、述部は、真（ＴＲＵＥ）、偽（ＦＡＬＳＥ）、又は未知（ＵＮＫＮＯＷＮ）と評価する表現を指し得る。述部は、例えば、ＷＨＥＲＥ節及びＨＡＶＩＮＧ節の検索条件、ＦＲＯＭ節の結合条件、並びに、ブール値が要求される他の構成で使用され得る。

述部のフィルタ因子は、述部が真であるテーブル内の行の割合を推定する、０．０から１．０までの数を指し得る。それらの行は、当該述部によって修飾されると言われている。例えば、データベースシステムが、データベース１３６のテーブルＴの列Ｃ１が、５個の異なる値Ａ、Ｂ、Ｃ、Ｄ、Ｅのうちの１個のみを含むと決定し得ると仮定する。その他の情報がない場合、データベースシステムは、行の５分の１が、列Ｃ１内の可能な値Ａ、Ｂ、Ｃ、Ｄ、又はＥのうちの任意の１つを含むと推定し得る。したがって、説明されたシナリオにおいて、デフォルトの入力変数を決定データ構造領域３１３４に格納されているデータをマッピングするフィルタ因子に使用するＤＢＭＳ１４００は、テーブルＴの述部Ｃ１＝'Ｘ'に対してフィルタ因子０．２を割り当て得る。

さらなる例示のために、処理のためのクエリステートメントは、テーブルＢに示されるような形態を取り得る。
［テーブルＢ］

ここで、"Ｘ"が未知であり、値Ａ、Ｂ、Ｃ、Ｄ、又はＥを想定し得る。 'Ｘ'が未知である、説明されるシナリオにおいて、デフォルトの入力変数を決定データ構造領域３１３４に格納されている決定データ構造をマッピングするフィルタ因子に使用するＤＢＭＳ１４００は、未知の変数'Ｘ'を有する述部Ｃ１＝'Ｘ'に対して０．２のフィルタ因子を割り当て得る。決定データ構造領域３１３４に格納されている決定データ構造をマッピングするフィルタ因子への説明されたデフォルトの入力変数は、以下の関連性を格納し得る。Ｃ１＝'Ｘ'であるＣ１の任意の値に対してフィルタ因子０．２を割り当てる。しかしながら、本明細書の実施形態によれば、入力変数の値が正確に予測され得る場合、フィルタ因子がより正確に割り当てられ得ることを認識する。

一実施形態において、データベースシステム１４０は、説明されるシナリオにおいて、データベース１３６内のテーブルＴの列Ｃ１を検査することによって、フィルタ因子が、決定データ構造領域３１３４への格納のために、テーブルＣの決定データ構造によって定義されたデータをマッピングするフィルタ因子への異なる入力変数値に従って、Ｃ１＝'Ｘ'の様々な異なる可能な入力変数値に対して割り当てられ得ることを決定し得る。
［テーブルＣ］

データベースシステム１４０は、データベースシステム１４０によって処理されているそれぞれの入力変数に対してテーブルＣに示されるようにデータ構造をマッピングする異なる入力変数値のフィルタ因子を反復的に更新すべく、入力変数によって参照されるデータベース１３６のテーブルを、反復的に、例えば、定期的に、検査するように構成され得る。テーブルＣを参照すると、異なる入力変数値を、テーブルＣのデータ決定データ構造をマッピングするフィルタ因子に使用するＤＢＭＳ１４００は、Ｃ１＝'Ａ'である場合に０．７５のフィルタ因子を割り当て得、Ｃ１＝'Ｂ'である場合に０．１５のフィルタ因子を割り当て得、Ｃ１＝'Ｃ'である場合に０．０５のフィルタ因子を割り当て得、Ｃ１＝'Ｄ'である場合に０．０３のフィルタ因子を割り当て得、Ｃ１＝'Ｅ'である場合に０．０２のフィルタ因子を割り当て得る。

ＤＢＭＳ１４００は、テーブルＣに関連して説明されるように予測済みの入力変数値に依存したフィルタ因子を割り当て得、割り当てられたフィルタ因子を参照テーブルの返答データセットの行の数を推定するために使用し得、アクセス経路の候補のスコアリングのパフォーマンスにおいて返答される、推定された行の数を適用し得る。

ブロック３００８で、一実施形態に係るＤＢＭＳ１４００は、ブロック３００６でクエリステートメントの１又は複数の入力変数値を予測したことに応じて、未知の入力変数値を、テーブルＢを参照して説明される、決定データ構造をマッピングするデフォルトのフィルタ因子（例えば、未知の変数Ｃ１＝'Ｘ'に対して適用される０．２のフィルタ因子）に使用するではなく、テーブルＣに従って特徴付けられた決定データ構造を使用して決定された１又は複数の異なる入力変数値のフィルタ因子を適用し得る。本明細書の実施形態によれば、テーブルＣに関連して説明されるように、異なる入力変数値を、決定データ構造をマッピングするフィルタ因子に使用することによって、選択されたアクセス経路が、異なる入力変数値を、決定データ構造をマッピングするフィルタ因子に使用することなく選択されたアクセス経路に対して、パフォーマンスを改善するように、アクセス経路を選択することを改善し得ることを認識する。

一実施形態によれば、データベースシステム１４０は、入力変数に関連したテーブルのテーブル傾向特性を検出することに依存したアクセス経路の候補のコストスコアリングを遂行し得る。入力変数に関連したテーブルは、アクセスされたテーブル行によって定義されるデータセットが、入力変数を有するクエリステートメント表現の実行に応答して返答されるテーブルを指し得る。

ブロック３００８では、ＤＢＭＳ１４００は、ブロック３００６で返答された、予測済みのクエリステートメントの入力変数値に依存したクエリステートメントの実行によってアクセスされる、テーブルの１又は複数のテーブル傾向分類を決定し得る。ブロック３００８では、ＤＢＭＳ１４００は、ブロック３００６で返答された、予測済みの入力変数値を使用して入力変数値に関連した特定のテーブルから返答される予測済みの返答データセットを検査し得、結果として生じる返答データセットを、前のタイムスロットに関するロギング領域３１３３内で参照された特定のテーブルに対する過去の返答データセットと比較し得る。ブロック３００８では、ＤＢＭＳ１４００は、処理されている着信クエリステートメントによって参照されるテーブルのテーブル傾向分類を決定すべく、ロギング領域３１３３のテーブルメトリクスロギングデータを検査し得、アクセス経路の候補のコストスコアリングのパフォーマンス及びアクセス経路の選択においてテーブル傾向分類を使用し得る。データレポジトリ１３８のロギング領域３１３３に格納されているロギングデータは、１又は複数の入力変数を有するクエリステートメントの実行に応答して返答された、過去のテーブル識別子及びテーブル行の過去の範囲を指定する、テーブルメトリクスロギングデータを含み得る。

予測済みの入力変数値を使用して返答された、予測済みの返答データセットに基づいて、ＤＢＭＳ１４００は、特定の１又は複数の傾向分類を有するものとして、クエリステートメント表現の実行によって参照されるテーブルを分類し得る。ＤＢＭＳ１４００は、次に、予測済みの入力変数値に依存し、且つ、決定されたテーブル傾向分類に依存したアクセス経路の候補のコストスコアリングを遂行し得る。

可能なテーブル傾向分類は、例えば、フィルタ因子の安定、フィルタ因子の変更、返答データセットの安定、返答データセットの変更、返答データセットサイズの安定、返答データセットサイズの変更を含み得る。実行されるときに入力変数を有するクエリステートメント表現は、クエリステートメントに関連した参照テーブルから返答されるテーブル行（レコード）によって定義される返答データセットをもたらし得る。図４に関連して説明されるように、本明細書の実施形態は、予測済みの入力変数値に基づいてアクセス経路の選択を遂行する際に、返答データセット４００４の時系列データ及びそのような返答データセットに関連した参照テーブル４００２を使用し得る。図４に示される返答データセット４００４は、入力変数を含むクエリステートメント表現のパフォーマンスによって、関連したテーブル４００２から返答されたテーブルデータの行を指し得る。

図４を参照すると、テーブル傾向Ａ、テーブル傾向Ｂ、及びテーブル傾向Ｃ等の傾向は、それぞれの入力変数を含む異なる例示的なクエリステートメント表現によって参照される異なるテーブルに関して識別され得る。時刻ｔ＝Ｔ－３と時刻ｔ＝Ｔとの間で、傾向Ａに示されるテーブル４００２のテーブル行のサイズが拡大し得、返答データセット４００４が安定し得る、すなわち、（同一の指定されたタイムスタンプの範囲の）同一のデータセット４００４が、タイムスロットごとに返答され得る。傾向レベルＡで示されるシナリオにおいて、ＤＢＭＳ１４００は、安定した返答データセット及び変更（具体的には、縮小）充填因子を有するものとして、傾向Ａに関連したクエリステートメント表現の参照テーブル４００２を分類し得る。

図４の傾向レベルＢで示されるシナリオにおいて、参照テーブル４００２のテーブルサイズは、タイムスロットを進めることによって一定に保ち得、タイムスロットごとの返答データセット４００４のサイズは、異なるタイムスロットを通して一貫性を保ち得る。そのようなシナリオにおいて、ＤＢＭＳ１４００は、安定したサイズの返答データセット４００４及び安定したフィルタ因子、並びに、変更した返答データセットを有するものとして、参照テーブル４００２を分類し得る。

傾向レベルＣで示されるシナリオにおいて、ＤＢＭＳ１４００は、安定した期間、及び、安定したフィルタ因子、安定した返答データセットのサイズ、並びに、変更した返答データセット４００４を有するものとして、参照テーブル４００２を分類し得る。例えば、データベースシステム１４０が、定期的に、例えば、１日ごとに、テーブル４００２の行サイズを自動的に減らし得る場合、傾向Ｃが生じ得る。傾向Ｃは、例えば、トランザクションデータが、予め定められた期間、例えば、先月のみ利用可能にし得る場合、銀行アプリケーションにおいて共通であり得る。そのようなシナリオにおいて、ＤＢＭＳ１４００は、日が進む毎にテーブルから１つのテーブル行を除去し得る。

図４に示される説明された傾向Ａ、傾向Ｂ、及び傾向Ｃのそれぞれにおいて、タイムスロットＴは、ブロック３００６で返答された、予測済みのクエリステートメントの入力変数値を使用して予測された、ＤＢＭＳ１４００によって予測済みのデータセットの返答に関連した次の期間のタイムスロットを指し得る。タイムスロットＴ－１は、ロギングデータがデータレポジトリ１３８のロギング領域３１３３内に存在する、現在のクエリステートメントの直近の実行のタイムスロットを指し得る。タイムスロットＴ－２及びタイムスロットＴ－３は、ロギングデータがデータレポジトリ１３８のロギング領域３１３３内に存在する、現在のクエリステートメントの次の事前の実行のタイムスロットを指し得る。ブロック３００８では、ＤＢＭＳ１４００は、処理されている着信クエリステートメントによって参照されるテーブルのテーブル傾向分類を決定すべく、ロギング領域３１３３のテーブルメトリクスロギングデータを検査し得、アクセス経路の候補のコストスコアリングのパフォーマンス及びアクセス経路の選択においてテーブル傾向分類を使用し得る。

テーブルＣを参照して説明されるように、アクセス経路の候補のコストスコアリングのパフォーマンスにおいて、ＤＢＭＳ１４００は、フィルタ因子が、参照テーブルの返答された行の数を推定するために使用され得る、予測済みの入力変数値に依存したフィルタ因子を適用し得、推定されたデータセットの行の数は、アクセス経路の候補のスコアリングのパフォーマンスに使用され得る。一実施形態において、図４に関連して説明されるように、返答された行の数が、予測済みの入力変数値に基づくテーブル傾向分類を使用して予測され得る場合、ＤＢＭＳ１４００は、返答された行推定に変換するためにフィルタ因子を指定することなく、テーブルから返答される予測済みの行の数を、アクセス経路のスコアリングへの入力として、直接使用し得る。

テーブルＤは、決定されたテーブル傾向分類に依存したアクセス経路の候補のコストスコアリング方法を確立すべく、動作決定の返答に使用され得る決定データ構造を示す。
［テーブルＤ］

図４及びテーブルＤを参照すると、（フィルタ因子を使用して返答データセットの行の数を推定することとは対照的に）返答される行の数を予測することを含むアクセス経路のコストスコアリング方法の適用をもたらす行１の条件は、傾向Ａが検出され、傾向Ａに関連したテーブル傾向分類が適用される場合に適用され得、フィルタ因子を使用すること含むアクセス経路のコストスコアリング方法の適用をもたらす行２の条件は、図４で説明されるような傾向Ｂ又は傾向Ｃが検出され、傾向Ｂ又は傾向Ｃに関連したテーブル傾向分類が適用される場合に適用され得る。

本明細書で記載されるように、ブロック３００８でアクセス経路の候補のコストスコアリングを遂行することに応答して、ＤＢＭＳ１４００は、処理されている着信クエリステートメントのランタイム実行のパフォーマンス用のアクセス経路を選択すべく、ブロック３０１０に進み得る。ブロック３０１０では、ＤＢＭＳ１４００は、処理されている着信クエリステートメントのランタイム実行のパフォーマンス用のアクセス経路として、ブロック３００８で遂行されたコストスコアリングに従って最も低いコストスコアを有するアクセス経路の候補を選択し得る。

ブロック３００８でのアクセス経路の候補のコストスコアリングのパフォーマンス及びブロック３０１０でのクエリステートメントのランタイム実行の際に使用するためのアクセス経路の選択に応じて、ＤＢＭＳ１４００は、現在のクエリステートメントのランタイム実行を遂行することに進み得る。クエリステートメントのランタイム実行の間、ＤＢＭＳ１４００は、クエリステートメントの１又は複数の入力変数に関連する１又は複数の予測済みのクエリステートメントの入力変数値に依存してブロック３０１０で選択された、選択されたアクセス経路を使用して、処理されている受信したクエリステートメントを実行し得る。

ブロック１４０１を完了し得る、クエリステートメントの実行が完了するとすぐに、ＤＢＭＳ１４００は、ブロック１４０２に進み得る。ブロック１４０２では、ＤＢＭＳ１４００は、処理されたばかりのクエリステートメントに関するロギングデータを収集すべく、ロギング動作を遂行し得る。クエリステートメントに対するロギングデータは、クエリステートメントのランタイム実行の間にＤＢＭＳ１４００によって決定及び返答された、決定及び返答された入力変数値に関連したクエリステートメントの入力変数のリストを含み得る。ロギングデータはまた、１又は複数の入力変数を有するクエリステートメントの実行に応答して返答された、テーブル識別子及びテーブル行の範囲を指定する、テーブルメトリクスロギングデータを含み得る。ブロック１４０１及びブロック３００８を反復中のＤＢＭＳ１４００は、ブロック３００８でテーブル分類を決定するために、説明されたテーブルメトリクスデータを検査し得る。ブロック１４０２では、ＤＢＭＳ１４００は、収集されたロギングデータをＤＢＭＳ１４００のロギング領域３１３３に格納し得る。

ブロック１４０２では、ＤＢＭＳ１４００は、機械学習処理のパフォーマンスに使用するために管理者システム１１０が受け取るために、ロギングデータを管理者システム１１０に送信し得る。ブロック１４０２でロギングデータを送信することが、例えば、それぞれのクエリステートメントのランタイム実行の完了時に、又は、一実施形態において、周期的な時間間隔で、遂行され得る。ブロック１４０２で送信されたロギングデータを受け取ったことに応答して、管理者システム１１０は、ブロック１１０１で、ブロック１４０２で送信された入力変数値のロギングデータを使用して、１又は複数の機械学習モデルのトレーニングを遂行し得る。

管理者システム１１０は、ブロック１１０１で、クエリステートメントの入力変数を、クエリステートメントのランタイム実行の間に決定される、決定された入力変数値にマッピングするマッピングロギングデータを使用して複数の予測モデルをトレーニングし得る。一実施形態によれば、システム１００は、入力変数値がクエリステートメント表現の実行で返答される入力変数を含む、クエリステートメントのクエリステートメント表現ごとに予測モデルを提供し得る。管理者システム１１０は、機械学習プロセス１１１を実行し得る。トレーニングブロック１１０１では、管理者システム１１０は、図５に示されるように、トレーニングデータを予測モデル５００２に適用し得る。

予測モデル５００２をトレーニングするためのトレーニングデータは、（ａ）コンテキストパラメータ及び（ｂ）決定された入力変数値の時系列データの反復を含み得る。トレーニングデータの反復は、データベースシステム１４０によってブロック１４０２で送信され、且つ、管理者システム１１０によって受信されるロギングデータから取得され得る。トレーニングデータの反復は、追加的に又は代替的に、データベースシステム１４０に従構成される追加の１又は複数のデータベースシステムによって送信され、且つ、管理者システム１１０によって受信されるロギングデータを含み得る。コンテキストパラメータ値のセット（ａ）が、ブロック１２０１で企業システム１２０Ａ－１２０Ｚによって送信されるトランザクションクエリデータを含むメッセージデータから取得され得る。本明細書の実施形態によれば、クエリステートメントを含むメッセージが、ブロック１２０１でトランザクションクエリデータを送信する企業システム１２０Ａ－１２０Ｚの作業負荷及び特定の企業システムを示し得るコンテキストデータを含み得ることを認識する。

本明細書の実施形態によれば、１つの特定の作業負荷及び企業システムに関連したクエリステートメントが、複数の異なる企業システム１２０Ａ－１２０Ｚからのクエリステートメントより予想可能パターンを示す可能性が高い場合があることも認識する。したがって、本明細書の実施形態は、予測モデル５００２が、決定された時系列データに関連する作業負荷及び企業システムを示すコンテンツデータに依存した作業負荷傾向を学習し得るように、コンテキストパラメータ値のセットを使用して予測モデル５００２をトレーニングすることを含み得る。

コンテキストパラメータ値のセットは、企業システム１２０Ａ－１２０Ｚから受信したクエリステートメントを含むメッセージデータからＤＢＭＳ１４００によって抽出されたパラメータ値のセットを含み得る。コンテキストパラメータ値のセットに使用するためのパラメータ値は、１又は複数の、例えば、会計情報、収集名、接続タイプ、相互関係情報、ＬＵ名、ネットＩＤ、パッケージ名、遂行、プレーン名、優先度、プロシージャ名、プロセス名、スケジューリング環境、サブシステム収集名、サブシステムインスタンス、サブシステムパラメータ、Ｓｙｓｐｌｅｘ名、システム名、トランザクションクラス／ジョブクラス、トランザクション名／ジョブ名、若しくは、ユーザＩＤ又はその組み合わせを含み得る。

予測モデル５００２は、一旦トレーニングされると、クエリデータに応答することができる。予測モデル５００２をクエリするためのクエリデータは、ブロック１４０１（図２）での処理及び図３を参照して説明されるように処理３００による対象である、受信した着信クエリステートメントに関連した現在の作業負荷の属性を指定するコンテキストパラメータ値のセットを含み得る。トレーニング済みの予測モデル５００２が、データベースシステム１４０の動作中の様々な時刻、例えば、クエリステートメントが処理されているとき、及び、予測モデル５００２が精度のレベルを満たす閾値を有する予測を生成しているか否かを決定するために予測モデル５００２がテストされているときにも、ブロック１４０１でクエリされ得る。

様々な機械学習モデリング技術が、過去の入力変数値に依存した次の入力変数値を予測する予測モデルをプロビジョニングするために使用され得る。適用され得る機械学習モデル化方法は、例えば、フーリエ変換解析曲線フィッティング、ニューラルネットワーク、サポートベクターマシン、線形回帰、及び同類のものを含み得る。機械学習方法論が組み合わせられ得、例えば、一例によれば、ディープフーリエニューラルネットワークが、時系列データを曲線フィッティングするために使用され得る。本明細書の実施形態によれば、時系列の入力変数値が、フーリエ変換の機械学習方法を含む様々な曲線フィッティング方法論によるモデリングの対象であり得る周期的なパターンを示し得ることを認識する。フーリエ変換の機械学習方法が、フーリエ変換の原理に基づいて、曲線を時系列データにフィッティングするために使用され得る。

経時的に実行されるクエリステートメントに対する入力変数値によって提供される時系列データを曲線フィッティングするためのフーリエ変換ベースの機械学習方法を適用するに、管理者システム１１０は、離散フーリエ変換解析を使用して、異なる文字列を分離し得る。図６を参照すると、経時的に入力変数値が決定される一連のランタイム実行によって提供される入力時系列トレーニングデータ６００２に対して遂行される離散フーリエ変換解析は、コンポーネントの周波数信号６００４、６００６、６００８を提供し得る。入力時系列の周波数領域表現６０１０は、コンポーネント周波数で、ピークを示し得る。一旦コンポーネント周波数が決定されると、ランダムフォレストの機械学習プロセスが、様々なコンポーネント周波数に対する重みを決定するために使用され得る。

本明細書の実施形態によれば、経時的な一連の入力変数値によって定義される時系列データは、場合によっては、永続的に周期的でなくてよく、むしろ、選択期間中にのみ周期性を示し得、他の期間では非周期的、例えば、ランダムな挙動、を示し得ることを認識する。幾つかの時系列の入力変数値は、周期的な挙動の後に非周期的な挙動が続くことを示し得る。すなわち、タイムスロットの最初のセットについて、時系列の入力変数値は、周期的なパターンを示し得、タイムスロットの次に続くセットにおいて、入力変数値は、非周期的なパターンを示し得る。本明細書の実施形態によれば、入力変数に関連した入力変数値が時系列で表される精度が、入力変数時系列の周期性のレベルに依存し得ることを認識する。

図７及び図８を参照すると、データプロットが示される。図７において、周期的なパターンを示す経時的な入力変数値の時系列が示され、図８において、予測モデルを使用して図７の時系列データに対する予測の精度を示すプロットが示される。本明細書の実施形態によれば、クエリステートメントの特定の入力変数に対する入力変数値の時系列データが永続的に周期的ではなく選択的に周期的であり得るので、周期的な入力変数値が全ての時刻で精度のレベルを満たす閾値内で予想可能でなくてよく、むしろ、展開期間の選択されたタイムスロットにおいて精度のレベルを満たす閾値内で予想可能であってよいことを認識する。

一実施形態によれば、管理者システム１１０は、経時的トレーニングする対象である、予測モデル５００２のそれぞれのインスタンスを反復的にテストし、当該予測モデルが精度のレベルを満たす閾値に従って予測を生成しているか否かを反復的に解明するように構成され得る。テスティングブロック１１０２では、管理者システム１１０は、クエリステートメントの入力変数に関連した入力変数値を予測するよう構成される１又は複数の予測モデルをテストし得る。

テスティングブロック１１０２でテストすることを遂行するために、管理者システム１１０は、（ａ）問い合わせに応答して１又は複数の予測モデルによって出力された、予測済みの入力変数値を、（ｂ）１又は複数の予測モデルをトレーニング及びテストするために使用されるロギングデータのホールドアウトデータによって定義されたグラウンドトゥルースデータと比較し得る。テスティングブロック１１０２では、管理者システム１１０は、予測モデルが、精度のレベルを満たす閾値を用いて現在予測を生成しているか否かを示す、トレーニングされているそれぞれの予測モデルごとに、アクティブ／非アクティブな状態フラグを適切に設定し得る。

予測モデルが精度のレベルを満たす閾値内で予測を出力しているか否かを決定するために、様々な方法が使用され得る。例えば、管理者システム１１０は、テスティングブロック１１０２で、トレーニング済みの予測モデルによって出力された予測値をホールドアウトデータによって定義されたグラウンドトゥルースデータと比較するために、１又は複数の時系列モデルの品質測定を適用し得る。予測値をグラウンドトゥルースデータと比較するために適用される測定は、例えば、平均平方誤差（ＭＳＥ）、平均絶対パーセント誤差（ＭＡＰＥ）、若しくは、二乗平均平方根誤差（ＲＭＳＥ）又はその組み合わせを含み得る。一実施形態によれば、着信クエリステートメントを受信する段階であって、着信クエリステートメントは、入力変数を含むクエリステートメント表現を含む、受信する段階と、入力変数に関連した入力変数値を予測する段階と、予測済みの入力変数値に依存したクエリステートメントのランタイム実行用のアクセス経路を選択する段階と、選択されたアクセス経路を使用して、クエリステートメントのランタイム実行を遂行する段階とを備え、入力変数に関連した入力変数値を予測する段階は、予測済みの入力変数値の返答用の予測モデルを問い合わせる段階を有し、予測モデルは、入力変数に対して決定された過去の入力変数値を含むトレーニングデータを用いてトレーニングされ、方法は、予測モデルが、精度のレベルを満たす閾値に従って予測を返答しているか否かを決定する段階を備え、方法は、予測モデルが精度のレベルを満たす閾値に従って予測を返答している、という決定に応じて予測モデルを問い合わせる手順を遂行する段階を備え、予測モデルが、精度のレベルを満たす閾値に従って予測を返答しているか否かを決定する段階は、予測モデルを使用して返答された予報を、過去の入力変数値を含むトレーニングデータのホールドアウトデータによって定義されたグラウンドトゥルースデータと比較する段階を有する、方法が本明細書に記載されている。

管理者システム１１０は、動作決定ブロック１１０３で、１又は複数のトレーニング済みの予測モデルに対するアクティブ／非アクティブな状態フラグを設定し、クエリ処理のパフォーマンスにおける入力変数値に関して予測を返答するためにＤＢＭＳ１４００による使用のために、１又は複数のトレーニング済みの予測モデルをデータベースシステム１４０にプッシュするよう動作決定を返答し得る。動作決定ブロック１１０３では、管理者システム１１０は、予測モデルをテストすると、モデルが精度のレベルを満たす閾値を用いて予測を生成していることを示すとき、予測モデルの状態フラグをアクティブにセットし得、ブロック１１０２で予測モデルをテストすると、予測モデルが精度のレベルを満たす閾値内で予測を生成していないことを示すとき、状態フラグを非アクティブに設定し得る。

動作決定ブロック１１０３では、管理者システム１１０は、予測モデルが、その状態フラグを読み取ることによって決定され得るように、現在アクティブであるという条件で、予測モデル５００２のインスタンスをデータベースシステム１４０にプッシュするよう動作決定を返答し得、ブロック１１０３で、状態フラグを読み取ることによって決定され得るように、予測モデルが非アクティブであるという条件で、トレーニング済みの予測モデルをデータベースシステム１４０にプッシュすることを避けるよう動作決定を返答し得る。トレーニング済みの予測モデルを選択的にプッシュすることによって、コンピュータシステムのパフォーマンスを改善し得る。トレーニング済みの予測モデルをＤＢＭＳ１４００にプッシュすることによって、予測済みの入力変数値を返答するためのデータ取得時間を改善し得る。トレーニング済みのモデルをプッシュすることによって、ストレージリソースの利用を選択的に減らし得る。

動作決定ブロック１１０３が完了するとすぐに、管理者システム１１０は、ブロック１１０４に進み得る。ブロック１１０４では、管理者システム１１０は、ＤＢＭＳ１４００のデータレポジトリ１３８のモデル領域３１３２に格納するために、１又は複数のトレーニング済みのアクティブなモデルを定義するモデルデータをデータベースシステム１４０に送信し得る。ブロック１１０４で送信されたモデルデータを用いて、管理者システム１１０は、アクティブ（精度を満たす閾値を用いて予測を生成する）であるか非アクティブ（精度を満たす閾値を用いて予測を生成していない）であるかにかかわらず、ブロック１１０１で管理者システム１１０によってトレーニングされている予測モデル５００２のインスタンスごとに状態データを送信し得る。

したがって、ブロック１１０４で送信された状態データを受け取るとすぐに、ＤＢＭＳ１４００は、予測モデルがアクティブ（精度のレベルを満たす閾値に従って予測を生成する）であるか、非アクティブ（精度のレベルを満たす閾値に従って予測を生成していない）であるかを示す管理者システム１１０によってトレーニングされている全ての予測モデルの状態に関する総合的な情報を有する。ブロック１４０３で送信されたモデル及び状態データを受け取るとすぐに、モデル領域３１３２の全ての予測モデルに関連したアクティブ／非アクティブな状態が更新されるように、且つ、モデル領域３１３２が、モデル領域３１３２のアクティブな予測モデルごとに、トレーニングブロック１１０１の直近の反復でトレーニングされ、送信ブロック１１０４の直近の反復でＤＢＭＳ１４００にプッシュされるアクティブなモデルの直近の更新済みのバージョンを含むように、ＤＢＭＳ１４００は、ブロック１４０３で、データレポジトリ１３８のモデル領域３１３２を更新し得る。

図３のフローチャートのブロック３００６に返答することによって、ＤＢＭＳ１４００は、ブロック３００６で、予測モデルがアクティブであるか非アクティブであるかを決定すべく、ブロック３００２で受信したクエリステートメントの入力変数ごとに、アクティブ／非アクティブなフラグ状態インジケータを検査し得る。予測モデルがアクティブである場合、ＤＢＭＳ１４００は、ブロック３００６で、クエリステートメント表現の入力変数に関連した入力変数値に関する予測を返答すべく、アクティブな予測モデルを問い合わせ得、その後、ブロック３００８に進んで、コスト解析の対象であるアクセス経路の複数の候補から選択されたアクセス経路の返答において、返答された予測済みの入力変数値を使用し得る。

しかしながら、ＤＢＭＳ１４００が、ブロック３００６で、アクティブ／非アクティブなフラグ状態インジケータを検査し、クエリステートメントの特定の入力変数に関連した特定の予測モデルが非アクティブであると決定した場合、ＤＢＭＳ１４００は、当該特定の入力変数について、デフォルトの動作を遂行し得る。デフォルトの動作によれば、ＤＢＭＳ１４００は、テーブルＣの決定データ構造をマッピングするフィルタ因子への異なる入力変数値に関連して説明されているように、プロセスを使用する任意の割り当てられたフィルタ因子の値を変更することなく、未知の入力変数値を使用するデフォルトのフィルタ因子の値を、テーブルＢを参照して説明された、決定データ構造をマッピングするデフォルトのフィルタ因子に適用し得る。

説明された動作によれば、ＤＢＭＳ１４００は、クエリステートメントの入力変数に関連した予測モデルを、選択的にのみ問い合わせ得、したがって、特定の入力変数に対して経時的に入力変数値を指定する時系列データが、十分に予想可能であり、閾値の精度レベルを満たしていると決定されるという条件で、選択的に予測された入力変数値に依存したアクセス経路の選択を選択的に修正し得る。

説明されたシナリオによれば、特定のクエリステートメントが第１の入力変数及び第２の入力変数を含み得ることが分かり得る。一例において、クエリステートメントの第１の入力変数及び第２の入力変数に対する予測済みの入力変数値を返答すべく、第１の予測モデル及び第２の予測モデルが確立され得る。一シナリオによれば、テスティングブロック１１０２で第１の予測モデルをテストすることによって、第１の入力変数に対する予測モデルが、精度のレベルを満たす閾値に従って予測を成功裏に返答することを示し得、その一方で、管理者システム１１０によってテスティングブロック１１０２で第２の予測モデルをテストすることによって、第２の予測モデルが精度のレベルを満たす閾値に従って入力変数値に対する予測を生成していないことを示し得る。説明されたシナリオにおいて、第１の予測モデルは、動作決定ブロック１１０３で管理者システム１１０によってアクティブにラベル付けされ得、第２の予測モデルは、動作決定ブロック１１０３で管理者システム１１０によって非アクティブにラベル付けされ得る。ブロック１１０４では、管理者システム１１０は、説明されたシナリオにおいて、第１の予測モデル及び第２の予測モデルごとに、第１の予測モデルに対する直近の利用可能なトレーニングデータでトレーニングされたトレーニング済みの予測モデルによって定義されたモデルデータ及び状態フラグインジケータをプッシュし得る。第１の予測モデルに対するフラグ状態インジケータは、第１の予測モデルがアクティブであることを示し得、第２の予測モデルに対するフラグ状態インジケータは、第２の予測モデルが非アクティブであることを示し得る。

クエリステートメントをブロック１４０１でクエリ処理するとすぐに、ＤＢＭＳ１４００は、ブロック３００６で、アクティブ／非アクティブな状態インジケータを検査し得、第１の予測モデルがアクティブであり、第２の予測モデルが非アクティブであることを決定し得る。説明されたシナリオにおいて、第１の入力変数及び第２の入力変数を有するクエリステートメントを処理する際のＤＢＭＳ１４００は、第１の入力変数に対する予測済みの入力変数値の返答のために第１の予測モデルをクエリし得、第２の入力変数については、（第２の予測モデルが非アクティブであるので）入力変数値に関して予測を返答するために任意の予測モデルをクエリすることを回避し得る。説明されたシナリオにおいて、デフォルトの動作は、第２の入力変数に対して続行し、ＤＢＭＳ１４００は、第２の入力変数を有するクエリステートメント表現に依存して割り当てられたフィルタ因子の値を調整しない。第２の入力変数について、ＤＢＭＳ１４００は、未知の入力変数値を、テーブルＢを参照して説明された決定データ構造をマッピングするデフォルトのフィルタ因子に使用して割り当てられたフィルタ因子を決定し得る。しかしながら、現在、十分に予想可能である第１の入力変数を含むクエリステートメント表現について、ＤＢＭＳ１４００は、テーブルＣ及びテーブルＤ、並びに、図３のフローチャートに関連して説明された方式で、割り当てられたフィルタ因子の値を調整し得る。現在、十分に予想可能である第１の入力変数を含むクエリステートメント表現について、ＤＢＭＳ１４００は、テーブルＣに関連して説明されるように、異なる入力変数値を、データ構造をマッピングするフィルタ因子に使用してフィルタ因子の値を割り当て得る。着信クエリステートメントを受信する段階であって、着信クエリステートメントは、入力変数を含むクエリステートメント表現を含む、受信する段階と、入力変数に関連した入力変数値を予測する段階と、予測済みの入力変数値に依存したクエリステートメントのランタイム実行用のアクセス経路を選択する段階と、選択されたアクセス経路を使用して、クエリステートメントのランタイム実行を遂行する段階とを備え、入力変数に関連した入力変数値を予測する段階は、予測済みの入力変数値の返答用の予測モデルを問い合わせる段階を有し、予測モデルは、入力変数に対して決定された過去の入力変数値を含むトレーニングデータを用いてトレーニングされ、クエリステートメントは、第２の入力変数を有する第２のクエリステートメント表現を含み、第２の入力変数に対して決定された過去の入力変数値を含むトレーニングデータを用いてトレーニングされている第２の予測モデルは、クエリステートメントの第２の入力変数に関連し、方法は、予測モデルが、精度のレベルを満たす閾値に従って予測を返答しているか否かを決定する段階と、第２の予測モデルが、精度のレベルを満たす予測閾値に従って予測を返答しているか否かを決定する段階とを備え、方法は、予測モデルが精度のレベルを満たす閾値に従って予測を返答している、という決定に応じて予測モデルを問い合わせる手順を遂行する段階を備え、方法は、第２の予測モデルが精度のレベルを満たす予測閾値に従って予測を返答できていない、という決定に応じて、第２の入力変数に対する第２の入力変数値の予測の返答なしに、第２の入力変数用のデフォルトのフィルタ因子を割り当てる段階を備え、予測済みの入力変数値に依存したクエリステートメントのランタイム実行用のアクセス経路を選択する段階は、予測済みの入力変数値に依存し、且つ、デフォルトのフィルタ因子に依存した、クエリステートメントのランタイム実行用のアクセス経路を選択する段階を有する、方法が本明細書に記載されている。

本明細書の特定の実施形態によれば、コンピューティングの利点を含む、コンピュータシステムの分野で生じする課題を対処するための様々な技術的なコンピューティングの利点及び実際の適用を提供し得る。本明細書の実施形態は、パフォーマンスを改善したデータベースによって定義されるコンピュータシステムを含む。一態様によれば、クエリステートメントの入力変数値は、機械学習によってトレーニングされる予測モデルを使用して予測され得る。返答された予測は、割り当てられたフィルタ因子を調整するために使用され得、調整済みのフィルタ因子は、アクセス経路のコスト解析のスコアリング及びアクセス経路の選択のために使用され得る。返答される予測は、入力変数に関連したテーブルに対するテーブル傾向を分類するために使用され得、分類されたテーブル傾向は、アクセス経路のコスト解析のスコアリング及びアクセス経路の選択のために使用され得る。一実施形態によれば、アクセス経路の選択が、クエリステートメントの入力変数に関連して入力変数値を予測するトレーニング済みの予測モデルの問い合わせによって返答される予測済みのクエリステートメントの入力変数値に依存して遂行され得る。一実施形態によれば、入力変数に関連した入力変数値を予測するトレーニング済みの予測モデルは、予測モデルを使用することにより返答されて予測の精度のレベルを決定するためにテストを繰り返して受け得る。一実施形態によれば、状態フラグは、予測モデルのアクティブ／非アクティブな状態を示すそれぞれの予測モデルに関連し得る。予測モデルに関連した状態フラグは、予測モデルが精度のレベルを満たす閾値に従って予測を返答するときにアクティブであり得、フラグ状態は、予測モデルが精度のレベルを満たす閾値を示していない予測を返答しているときに非アクティブに設定され得る。クエリステートメントの入力変数を処理する際に、データベース管理システムは、予測モデルが非アクティブであるかアクティブであるかに依存した入力変数に関連した入力変数値に対する予測を返答する予測モデルを選択的に問い合わせ得る。データベース管理システムは、入力変数値が、現在、精度のレベルを満たす閾値内で予想可能であると決定されるという条件で、選択的に予測された入力変数値に依存したアクセス経路の選択を遂行し得る。

図９～図１１は、本明細書で記載されている１又は複数の態様に従って、コンピュータシステム及びクラウドコンピューティングを含む、コンピューティングの様々な態様を示す。

本開示は、クラウドコンピューティングに関する詳細な説明を含むが、本明細書に記載された教示の実装は、クラウドコンピューティング環境に限定されないことを予め理解されたい。むしろ、本発明の実施形態は、現在知られている、又は後に開発される任意の他のタイプのコンピューティング環境と連動して実装可能である。

クラウドコンピューティングは、最小限の管理労力又はサービスのプロバイダとの相互作用で、迅速にプロビジョニング及びリリースされ得る、構成可能なコンピューティングリソース（例えば、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想マシン、及びサービス）の共有プールへの簡便なオンデマンドネットワークアクセスを可能にするサービス配信のモデルである。このクラウドモデルは、少なくとも５つの特性、少なくとも３つのサービスモデル、及び少なくとも４つの展開モデルを含み得る。

特性は、以下のとおりである。

オンデマンドセルフサービス：クラウド消費者は、サービスのプロバイダとの人的交流を要求することなく、必要に応じて自動的に、サーバ時間及びネットワークストレージ等のコンピューティング機能を一方的にプロビジョニングすることができる。

広範なネットワークアクセス：機能がネットワークを通じて利用可能であり、異機種環境にあるシンクライアントプラットフォーム又はシッククライアントプラットフォーム（例えば、携帯電話、ラップトップ、及びＰＤＡ）による使用を促進する標準メカニズムを通じてアクセスされる。

リソースプール：異なる物理リソース及び仮想リソースが要求に従って動的に割り当て及び再割り当てされることで、マルチテナントモデルを使用して複数の消費者にサービス提供すべく、プロバイダのコンピューティングリソースがプールされている。消費者は、概して、提供されるリソースの正確な位置に対する制御も知識も有していないが、より高い抽象化レベルで位置（例えば、国、州、又はデータセンタ）を指定でき得るという点で、位置の独立性が存在する。

迅速な順応性：機能が迅速に、且つ、順応的に、場合によっては、自動的にプロビジョニングされ、素早くスケールアウトし得、迅速にリリースされて素早くにスケールインし得る。消費者には、プロビジョニングに利用可能な機能がしばしば無制限に見え、任意の時間に任意の量を購入できる。

測定されるサービス：クラウドシステムは、サービスのタイプ（例えば、ストレージ、処理、帯域幅、及びアクティブなユーザアカウント）に適切なある抽象化レベルで計測機能を活用することによって、リソースの使用を自動的に制御及び最適化する。リソース使用率が、監視、制御、及び報告され、利用されるサービスのプロバイダ及び消費者の両方に対して透明性を提供し得る。

サービスモデルは、以下のとおりである。

ＳｏｆｔｗａｒｅａｓａＳｅｒｖｉｃｅ（ＳａａＳ）：消費者に提供される機能は、クラウドインフラストラクチャ上で実行するプロバイダのアプリケーションを使用することである。アプリケーションは、ウェブブラウザ（例えば、ウェブベースの電子メール）等のシンクライアントインタフェースを通じて様々なクライアントデバイスからアクセス可能である。消費者は、限定されたユーザ固有のアプリケーション構成設定は例外かもしれないが、ネットワーク、サーバ、オペレーティングシステム、ストレージ、又はさらなる個々のアプリケーション機能を含む、基礎となるクラウドインフラストラクチャを管理も制御もしない。

ＰｌａｔｆｏｒｍａｓａＳｅｒｖｉｃｅ（ＰａａＳ）：消費者に提供される機能は、プロバイダによってサポートされているプログラミング言語及びツールを使用して作成される、消費者によって作成又は取得されたアプリケーションをクラウドインフラストラクチャ上に展開することである。消費者は、ネットワーク、サーバ、オペレーティングシステム、又はストレージを含む、基礎となるクラウドインフラストラクチャを管理も制御もしないが、展開されたアプリケーション、及び、場合によっては環境構成をホスティングするアプリケーションを制御する。

ＩｎｆｒａｓｔｒｕｃｔｕｒｅａｓａＳｅｒｖｉｃｅ（ＩａａＳ）：消費者に提供される機能は、処理、ストレージ、ネットワーク、及び他の基本的なコンピューティングリソースをプロビジョニングすることである。ここでは、消費者は、オペレーティングシステム及びアプリケーションを含み得る、任意のソフトウェアを展開及び実行できる。消費者は、基礎となるクラウドインフラストラクチャを管理も制御もしないが、オペレーティングシステム、ストレージ、展開されたアプリケーションを制御し、場合によっては、ネットワーキングコンポーネント（例えば、ホストファイアウォール）の選択を限定的に制御する。

展開モデルは、以下のとおりである。

プライベートクラウド：クラウドインフラストラクチャは、ある組織のためだけに動作する。それは、組織又は第三者によって管理され得、オンプレミス又はオフプレミスで存在し得る。

コミュニティクラウド：クラウドインフラストラクチャは、幾つかの組織によって共有され、共有の関心事（例えば、ミッション、セキュリティ要件、ポリシー、及びコンプライアンスの考慮事項）を有する特定のコミュニティをサポートする。それは、組織又は第三者によって管理され得、オンプレミス又はオフプレミスで存在し得る。

パブリッククラウド：クラウドインフラストラクチャは、一般大衆又は大規模な業界団体に利用可能にされ、クラウドサービスを販売する組織によって所有される。

ハイブリッドクラウド：クラウドインフラストラクチャは、固有のエンティティのままであるが、データ及びアプリケーションのポータビリティ（例えば、クラウド間の負荷分散のためのクラウドバースト）を可能にする標準化技術又は特許技術によって結び付けられている、２又はそれより多くのクラウド（プライベート、コミュニティ、又はパブリック）の構成物である。

クラウドコンピューティング環境は、ステートレス、弱連結性、モジュール方式、及びセマンティック相互運用性に重点を置いたサービス指向である。クラウドコンピューティングの中心は、相互接続されたノードのネットワークを備えるインフラストラクチャである。

ここで、図９を参照すると、コンピューティングノードの一例の概略図が示されている。コンピューティングノード１０は、クラウドコンピューティングノードとしての使用に適切なコンピューティングノードの一例にすぎず、本明細書で説明される本発明の実施形態の使用又は機能の範囲に関してあらゆる限定を示唆することを意図していない。とにかく、コンピューティングノード１０は、上記の任意の機能を実装される、及び／又は、当該任意の機能を遂行する能力がある。コンピューティングノード１０は、クラウドコンピューティング環境内のクラウドコンピューティングノードとして実装され得、又は、クラウドコンピューティング環境以外のコンピューティング環境内のコンピューティングノードとして実装され得る。

コンピューティングノード１０において、多数の他の汎用コンピューティングシステム又は特殊目的コンピューティングシステムの環境又は構成で動作可能であるコンピュータシステム１２が存在する。コンピュータシステム１２と共に使用するのに適切であり得る周知のコンピューティングシステム、環境、及び／又は及び構成の例は、パーソナルコンピュータシステム、サーバコンピュータシステム、シンクライアント、シッククライアント、ハンドヘルド又はラップトップデバイス、マルチプロセッサシステム、マイクロプロセッサベースシステム、セットトップボックス、プログラム可能な消費者向け電子機器、ネットワークＰＣ、ミニコンピュータシステム、メインフレームコンピュータシステム、及び、任意の上記のシステム又はデバイスを含む分散型クラウドコンピューティング環境、並びに、同類のものを含み得るがこれらに限定されない。

コンピュータシステム１２は、コンピュータシステムによって実行されている、プログラム処理等のコンピュータシステム実行可能命令の一般的状況において、説明され得る。概して、プログラム処理は、特定のタスクを遂行する又は特定の抽象データタイプを実装する、ルーチン、プログラム、オブジェクト、コンポーネント、ロジック、データ構造等を含み得る。コンピュータシステム１２は、タスクが通信ネットワークを通じて接続されているリモート処理デバイスによって遂行される分散型クラウドコンピューティング環境で実施され得る。分散型クラウドコンピューティング環境において、プログラム処理は、メモリストレージデバイスを含む、ローカルコンピュータシステムのストレージ媒体及びリモートコンピュータシステムのストレージ媒体に位置し得る。

図９に示されるように、コンピューティングノード１０内のコンピュータシステム１２は、コンピューティングデバイスの形態で示されている。コンピュータシステム１２のコンポーネントは、１又は複数のプロセッサ１６、システムメモリ２８、及びシステムメモリ２８を含む様々なシステムコンポーネントをプロセッサ１６に連結するバス１８を含み得るがこれらに限定されない。一実施形態において、コンピューティングノード１０は、非クラウドコンピューティング環境のコンピューティングノードである。一実施形態において、図８～図９に関連して本明細書で記載されているように、コンピューティングノード１０は、クラウドコンピューティング環境のコンピューティングノードである。

バス１８は、メモリバス又はメモリコントローラ、ペリフェラルバス、アクセラレーテッドグラフィックスポート、及び任意の様々なバスアーキテクチャを使用するプロセッサ又はローカルバスを含む、任意の幾つかのタイプのバス構造のうちの１又は複数を表す。限定的なものではなく、例示的なものとして、そのようなアーキテクチャは、業界標準アーキテクチャ（ＩＳＡ）バス、マイクロチャネルアーキテクチャ（ＭＣＡ）バス、エンハンスドＩＳＡ（ＥＩＳＡ）バス、ビデオエレクトロニクススタンダーズアソシエーション（ＶＥＳＡ）ローカルバス、及びペリフェラルコンポーネントインターコネクト（ＰＣＩ）バスを含む。

コンピュータシステム１２は、通常、様々なコンピュータシステム可読媒体を含む。そのような媒体は、コンピュータシステム１２によってアクセス可能な任意の利用可能な媒体であり得、それは、揮発性媒体及び不揮発性媒体の両方、取り外し可能な媒体及び取り外し不可能な媒体の両方を含み得る。

システムメモリ２８は、ランダムアクセスメモリ（ＲＡＭ）３０若しくはキャッシュメモリ３２又はその組み合わせ等の揮発性メモリの形態のコンピュータシステム可読媒体を含み得る。コンピュータシステム１２は、他の取り外し可能／取り外し不可能な、揮発性／不揮発性のコンピュータシステムストレージ媒体をさらに含み得る。単なる例示的なものとして、ストレージシステム３４が、取り外し不可能、不揮発性の磁気媒体（示されていないが、通常「ハードドライブ」と称される）から読み取り、当該磁気媒体に書き込むために提供され得る。示されていないが、取り外し可能、不揮発性の磁気ディスク（例えば、「フロッピディスク」）から読み取り、当該磁気ディスクに書き込むための磁気ディスクドライブ、及びＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、又は他の光媒体等の取り外し可能、不揮発性の光学ディスクから読み取り、当該光学ディスクに書き込むための光学ディスクドライブが提供され得る。そのような場合には、それぞれは、１又は複数のメディアインタフェースによって、バス１８に接続され得る。以下でさらに示され、説明されるように、メモリ２８は、本発明の実施形態の機能を実行するように構成される、（例えば、少なくとも１つの）プログラム処理のセットを有する少なくとも１つのプログラム製品を含み得る。

オペレーティングシステム、１又は複数のアプリケーションプログラム、他のプログラム処理、及びプログラムデータだけでなく、（少なくとも１つの）プログラム処理４２のセットを有する１又は複数のプログラム４０が、限定的なものではなく、例示的なものとして、メモリ２８に格納され得る。プログラム処理４２を含む１又は複数のプログラム４０は、概して、本明細書で記載されている機能を実行し得る。一実施形態において、データベースシステム１４０は、１又は複数のコンピューティングノード１０を含み得、図３の方法３００に関連して説明された機能、及び図４のフローチャートに記載されているように、データベースシステム１４０に関連して説明された機能を遂行するための１又は複数のプログラム４０を含み得る。一実施形態において、管理者システム１１０は、１又は複数のコンピューティングノード１０を含み得、図２のフローチャートに記載されているように、管理者システム１１０に関連して説明された機能を遂行するための１又は複数のプログラム４０を含み得る。一実施形態において、１又は複数のクライアントＵＥデバイス１２０Ａ－１２０Ｚは、１又は複数のコンピューティングノード１０を含み得、図２のフローチャートに記載されているように、１又は複数のＵＥデバイス１２０Ａ－１２０Ｚに関連して説明された機能を遂行するための１又は複数のプログラム４０を含み得る。一実施形態において、図１に示されるコンピューティングノードベースのシステム及びデバイスは、そのようなコンピューティングノードベースのシステム及びデバイスに関連して説明された機能を遂行するための１又は複数のプログラムを含み得る。

コンピュータシステム１２はまた、キーボード、ポインティングデバイス、ディスプレイ２４等、ユーザがコンピュータシステム１２と相互作用することを可能にする１又は複数のデバイス、及び／又は、コンピュータシステム１２が１又は複数の他のコンピューティングデバイスと通信することを可能にする任意のデバイス（例えば、ネットワークカード、モデム等）等の１又は複数の外部デバイス１４と通信し得る。そのような通信は、入力／出力（Ｉ／Ｏ）インタフェース２２を介して発生し得る。依然として、さらに、コンピュータシステム１２は、ネットワークアダプタ２０を介して、ローカルエリアネットワーク（ＬＡＮ）、一般的な広域ネットワーク（ＷＡＮ）、若しくは、パブリックネットワーク（例えば、インターネット）又はその組み合わせ等の１又は複数のネットワークと通信し得る。示されるように、ネットワークアダプタ２０は、バス１８を介して、コンピュータシステム１２の他のコンポーネントを通信する。示されていないが、他のハードウェア若しくはソフトウェアコンポーネント又はその組み合わせが、コンピュータシステム１２と共に使用され得ることが理解されるべきである。例としては、マイクロコード、デバイスドライバ、冗長処理ユニット、外部ディスクドライブアレイ、ＲＡＩＤシステム、テープドライブ、及びデータアーカイバルストレージシステム等を含むが、これらに限定されない。ユーザインタフェース機能を提供するように構成され得る外部デバイス１４及びディスプレイ２４を有することに加えて、又はその代わりに、一実施形態におけるコンピューティングノード１０は、バス１８に接続されているディスプレイ２５を含み得る。一実施形態において、ディスプレイ２５は、タッチスクリーンディスプレイとして構成され得、ユーザインタフェース機能を提供するように構成され得、例えば、仮想キーボード機能及び合計データの入力を容易にし得る。一実施形態におけるコンピュータシステム１２はまた、バス１８に接続されている１又は複数のセンサデバイス２７を含み得る。１又は複数のセンサデバイス２７は、代替的には、Ｉ／Ｏインタフェース２２を通じて接続され得る。１又は複数のセンサデバイス２７は、一実施形態においてグローバルポジショニングセンサ（ＧＰＳ）デバイスを含み得、コンピューティングノード１０の位置を提供するように構成され得る。一実施形態において、１又は複数のセンサデバイス２７は、代替的に又はさらに、例えば、１又は複数のカメラ、ジャイロスコープ、温度センサ、湿度センサ、パルスセンサ、血圧（ｂｐ）センサ、又は、オーディオ入力デバイスを含み得る。コンピュータシステム１２は、１又は複数のネットワークアダプタ２０を含み得る。図１０において、コンピューティングノード１０は、クラウドコンピューティング環境において実装されているものとして説明されており、したがって、図１０の状況下では、クラウドコンピューティングノードと称される。

ここで、図１０を参照すると、例示的なクラウドコンピューティング環境５０が示される。示されるように、クラウドコンピューティング環境５０は、例えば、パーソナルデジタルアシスタント（ＰＤＡ）又は携帯電話５４Ａ、デスクトップコンピュータ５４Ｂ、ラップトップコンピュータ５４Ｃ、及び／又は、自動車コンピュータシステム５４Ｎ等のクラウド消費者によって使用されるローカルコンピューティングデバイスが通信し得る、１又は複数のクラウドコンピューティングノード１０を備える。ノード１０は、互いと通信し得る。それらは、上述のようなプライベートクラウド、コミュニティクラウド、パブリッククラウド、若しくはハイブリッドクラウド、又はそれらの組み合わせ等の１又は複数のネットワークにおいて、物理的に又は仮想的にグループ化（不図示）され得る。これにより、クラウドコンピューティング環境５０が、クラウド消費者がローカルコンピューティングデバイス上でリソースを維持する必要がないサービスとして、インフラストラクチャ、プラットフォーム、若しくは、ソフトウェア又はその組み合わせを提供することを可能にする。図１０に示されるコンピューティングデバイス５４Ａ－Ｎのタイプは、単に例示を意図するものであり、コンピューティングノード１０及びクラウドコンピューティング環境５０は、（例えば、ウェブブラウザを使用して）任意のタイプのネットワークネットワークアドレス可能な接続又はその組み合わせを介して、任意のタイプのコンピュータ化されたデバイスと通信し得ることが理解されたい。

ここで、図１１を参照すると、クラウドコンピューティング環境５０（図１０）によって提供される機能抽象化レイヤのセットが示される。図１１に示されるコンポーネント、レイヤ、及び機能は、単に例示を意図するものであり、本発明の実施形態がそれらに限定されないことが予め理解されるべきである。示されるように、以下のレイヤ及び対応する機能が提供される。

ハードウェア及びソフトウェアレイヤ６０は、ハードウェアコンポーネント及びソフトウェアコンポーネントを含む。ハードウェアコンポーネントの例は、メインフレーム６１、ＲＩＳＣ（ＲｅｄｕｃｅｄＩｎｓｔｒｕｃｔｉｏｎＳｅｔＣｏｍｐｕｔｅｒ）アーキテクチャベースのサーバ６２、サーバ６３、ブレードサーバ６４、ストレージデバイス６５、並びに、ネットワークコンポーネント及びネットワーキングコンポーネント６６を含む。幾つかの実施形態において、ソフトウェアコンポーネントは、ネットワークアプリケーションサーバソフトウェア６７及びデータベースソフトウェア６８を含む。

仮想化レイヤ７０は、仮想サーバ７１、仮想ストレージ７２、仮想プライベートネットワークを含む仮想ネットワーク７３、仮想アプリケーション及びオペレーティングシステム７４、並びに仮想クライアント７５である、仮想エンティティの例が提供され得る抽象化レイヤを提供する。

一例において、管理レイヤ８０は、以下で説明される機能を提供し得る。リソースプロビジョニング８１は、クラウドコンピューティング環境内でタスクを遂行するために利用される、コンピューティングリソース及び他のリソースの動的な調達を提供する。計測及び価格設定８２は、リソースがクラウドコンピューティング環境内で利用されるときのコスト追跡、及び、これらのリソースの消費に対する課金又は請求書を提供する。一例において、これらのリソースは、アプリケーションソフトウェアライセンスを備え得る。セキュリティは、クラウド消費者及びタスクに対する本人確認、並びに、データ及び他のリソースに対する保護を提供する。ユーザポータル８３は、消費者及びシステム管理者に対してクラウドコンピューティング環境へのアクセスを提供する。サービスレベル管理８４は、要求されるサービスレベルが満たされるように、クラウドコンピューティングのリソース割り当て及び管理を提供する。サービス品質保証（ＳＬＡ）プランニング及び履行８５は、将来の要件がＳＬＡに従って予測されるクラウドコンピューティングリソースの事前の取り決め及び調達を提供する。

作業負荷レイヤ９０は、クラウドコンピューティング環境が利用され得る機能の例を提供する。本レイヤから提供され得る作業負荷及び機能の例は、マッピング及びナビゲーション９１、ソフトウェア開発及びライフサイクル管理９２、仮想教室教育の配信９３、データ分析処理９４、トランザクション処理９５、並びに、本明細書に記載されている、予測済みの入力変数及びアクセス経路の選択のための処理コンポーネント９６を含む。処理コンポーネント９６は、図９において説明されている１又は複数のプログラム４０を使用することにより実装され得る。

本発明は、任意の可能な技術的詳細レベルの統合における、システム、方法、及び／又はコンピュータプログラム製品であり得る。コンピュータプログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を有するコンピュータ可読記憶媒体（又は媒体）を含み得る。

コンピュータ可読記憶媒体は、命令実行デバイスによる使用のために命令を保持及び格納し得る有形のデバイスであり得る。コンピュータ可読記憶媒体は、例えば、電子ストレージデバイス、磁気ストレージデバイス、光学ストレージデバイス、電磁ストレージデバイス、半導体ストレージデバイス、又は前述のストレージデバイスの任意の適切な組み合わせであり得るが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例の包括的でないリストは、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、リードオンリメモリ（ＲＯＭ）、消去可能プログラマブルリードオンリメモリ（ＥＰＲＯＭ又はフラッシュメモリ）、スタティックランダムアクセスメモリ（ＳＲＡＭ）、ポータブルコンパクトディスクリードオンリメモリ（ＣＤ－ＲＯＭ）、デジタル多用途ディスク（ＤＶＤ）、メモリスティック、フロッピディスク、パンチカード若しくは記録された命令を有する溝内の隆起構造等の機械的にエンコードされたデバイス、及び前述のものの任意の適切な組み合わせを含む。コンピュータ可読記憶媒体は、本明細書において使用されるとき、電波若しくは他の自由に伝搬する電磁波、導波路若しくは他の伝送媒体を伝搬する電磁波（例えば、光ファイバケーブルを通過する光パルス）、又は有線で伝送される電気信号等、それ自体が一時的な信号であるとして解釈されない。

本明細書で説明されるコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体からそれぞれのコンピューティング／処理デバイスにダウンロードし得、又は、ネットワーク、例えば、インターネット、ローカルエリアネットワーク、広域ネットワーク、若しくは無線ネットワーク又はその組み合わせ、を介して、外部のコンピュータ若しくは外部ストレージデバイスにダウンロードし得る。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイコンピュータ、若しくは、エッジサーバ又はその組み合わせを備え得る。それぞれのコンピューティング／処理デバイス内のネットワークアダプタカード又はネットワークインタフェースは、ネットワークからコンピュータ可読プログラム命令を受信し、それぞれのコンピューティング／処理デバイス内のコンピュータ可読記憶媒体に格納するためにコンピュータ可読プログラム命令を転送する。

本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャ（ＩＳＡ）命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路用の構成データ、又は、Ｓｍａｌｌｔａｌｋ（登録商標）、Ｃ＋＋若しくは同類のもの等のオブジェクト指向プログラミング言語、若しくは「Ｃ」プログラミング言語若しくは同様のプログラミング言語等の手続き型プログラミング言語を含む、１若しくは複数のプログラミング言語の任意の組み合わせで記述されたソースコード若しくはオブジェクトコードのいずれかであり得る。コンピュータ可読プログラム命令は、ユーザのコンピュータ上で完全に実行してもよく、スタンドアロンソフトウェアパッケージとしてユーザのコンピュータ上で部分的に実行してもよく、ユーザのコンピュータ上で部分的に、且つ、リモートコンピュータ上で部分的に実行してもよく、リモートコンピュータ又はサーバ上で完全に実行してもよい。後者のシナリオにおいて、リモートコンピュータは、ローカルエリアネットワーク（ＬＡＮ）又は広域ネットワーク（ＷＡＮ）を含む任意のタイプのネットワークを通じてユーザのコンピュータに接続し得、又は、その接続が、（例えば、インターネットサービスプロバイダを使用してインターネットを通じて）外部コンピュータに対して行われ得る。幾つかの実施形態において、例えば、プログラマブルロジック回路、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、又はプログラマブルロジックアレイ（ＰＬＡ）を含む電子回路は、本発明の態様を遂行するために、コンピュータ可読プログラム命令の状態情報を利用することによってコンピュータ可読プログラム命令を実行して、電子回路をパーソナライズし得る。

本発明の態様が、本発明の実施形態に係る方法、装置（システム）及びコンピュータプログラム製品のフローチャート図及び／又はブロック図に関連して本明細書で説明されている。フローチャート図及び／又はブロック図のそれぞれのブロック、並びに、フローチャート図及び／又はブロック図のブロックの組み合わせは、コンピュータ可読プログラム命令によって実装され得ることが理解されたい。

これらのコンピュータ可読プログラム命令は、マシンを生成すべくコンピュータのプロセッサ又は他のプログラマブルデータ処理装置に提供され得、その結果、コンピュータのプロセッサ又は他のプログラマブルデータ処理装置を介して実行する命令が、フローチャート及び／又はブロック図のブロック若しくは複数のブロックにおいて指定された機能／動作を実装するための手段を作成する。コンピュータ、プログラマブルデータ処理装置、及び／又は他のデバイスに特定の方式で機能するよう命令し得るこれらのコンピュータ可読プログラム命令はまた、コンピュータ可読記憶媒体に格納され得、その結果、その中に格納された命令を有するコンピュータ可読記憶媒体は、フローチャート及び／又はブロック図のブロック若しくは複数のブロックにおいて指定された機能／動作の態様を実装する命令を含む製品を備える。

コンピュータ可読プログラム命令はまた、コンピュータ、他のプログラマブルデータ処理装置、又は他のデバイス上にロードされて、コンピュータ、他のプログラマブル装置、又は他のデバイス上で一連の動作段階を遂行させて、コンピュータ実装処理を生成し得、その結果、コンピュータ、他のプログラマブル装置、又は他のデバイス上で実行する命令は、フローチャート及び／又はブロック図のブロック若しくは複数のブロックにおいて指定される機能／動作を実装する。

図におけるフローチャート及びブロック図は、本発明の様々な実施形態に係るシステム、方法、及びコンピュータプログラム製品の可能な実装のアーキテクチャ、機能、及び動作を示す。この関連で、フローチャート又はブロック図におけるそれぞれのブロックは、モジュール、セグメント、又は指定された論理機能を実装するための１又は複数の実行可能命令を備える命令の一部を表し得る。幾つかの代替的な実装において、ブロックに記される機能は、図に記される順序とは異なる順序で行われ得る。例えば、連続して示される２個のブロックが、実際には、１つの段階として実現されてもよく、部分的又は全体的に時間重複する方式で同時に又は実質的に同時に実行されてもよく、ブロックが関連する機能に依存して逆の順序で実行される場合があってもよい。ブロック図及び／又はフローチャート図のそれぞれのブロック、並びに、ブロック図及び／又はフローチャート図におけるブロックの組み合わせは、指定された機能若しくは動作を遂行する、又は、特殊目的ハードウェア及びコンピュータ命令の組み合わせを実行する特殊目的ハードウェアベースのシステムによって実装され得ることも留意されたい。

本明細書で使用される用語は、特定の実施形態を説明することのみを目的としており、限定することを意図していない。本明細書で使用されるように、単数形の「ａ」、「ａｎ」、及び「ｔｈｅ」は、文脈がそうでないことを明確に示していない限り、複数形も含むことを意図している。用語「備える（ｃｏｍｐｒｉｓｅ）」（及び「ｃｏｍｐｒｉｓｅｓ」及び「ｃｏｍｐｒｉｓｉｎｇ」等のｃｏｍｐｒｉｓｅの任意の形態）、用語「有する（ｈａｖｅ）」（及び「ｈａｓ」及び「ｈａｖｉｎｇ」等のｈａｖｅの任意の形態）、用語「含む（ｉｎｃｌｕｄｅ）」（及び「ｉｎｃｌｕｄｅｓ」及び「ｉｎｃｌｕｄｉｎｇ」等のｉｎｃｌｕｄｅの任意の形態）、並びに、用語「含むｃｏｎｔａｉｎ」（及び「ｃｏｎｔａｉｎｓ」及び「ｃｏｎｔａｉｎｉｎｇ」等のｃｏｎｔａｉｎの任意の形態）は、オープンエンドな連結動詞であることがさらに理解されたい。結果として、１若しくは複数の段階若しくは要素を「備える（ｃｏｍｐｒｉｓｅ）」、「有する（ｈａｖｅ）」、「含む（ｉｎｃｌｕｄｅ）」若しくは「含む（ｃｏｎｔａｉｎ）」方法又はデバイスは、それらの１若しくは複数の段階又は要素を保有するが、それらの１若しくは複数の段階又は要素のみを保有すること限定されない。同様に、１若しくは複数の特徴を「備える（ｃｏｍｐｒｉｓｅ）」、「有する（ｈａｖｅ）」、「含む（ｉｎｃｌｕｄｅ）」若しくは「含む（ｃｏｎｔａｉｎ）」方法の段階若しくはデバイスの要素は、それらの１又は複数の特徴を保有するが、それらの１又は複数の特徴のみを保有することに限定されない。本明細書における用語「に基づいて（ｂａｓｅｄｏｎ）」の形態は、要素が部分的に基づいている場合の関係、及び、要素が完全に基づいている場合の関係を包含する。特定の数の要素を有するものとして説明された方法、製品、及びシステムは、特定の数より少ない又は多い要素で実施され得る。さらに、特定の方法で構成されるデバイス又は構造は、少なくともその方法で構成されるが、列挙されていない方法でも構成されてよい。

本開示の説明によって明示的に示されているか、本質的に導出されているかにかかわらず、本明細書で記載されている数値、及び、他の値は、用語「約（ａｂｏｕｔ）」によって修正されると考えられる。本明細書で使用されるように、用語「約（ａｂｏｕｔ）」は、そのように修正された数値を含む許容範囲及び値、当該修正された数値までの許容範囲及び値を含むべく、修正された値の数値境界を定義するが、これらに限定されない。すなわち、数値は、明確に示される実際の値、及び、本開示において示され、及び／又は説明された実際の値の少数、分数、若しくは他の倍数である又はあり得る他の値を含み得る。

以下の特許請求の範囲における全ての手段又は段階プラス機能要素の対応する構造、材料、動作、及び均等物は、もしあれば、具体的に請求されているように、他の請求されている要素との組み合わせで、機能を遂行するための任意の構造、材料、又は動作を含むものとして意図されている。本明細書で記載された説明は、例示及び説明を目的として提示されてきたが、開示された形態を網羅又は限定することを意図しない。本開示の範囲及び趣旨から逸脱することなく、多くの修正及び変形は、当業者に明らかであるだろう。本明細書に記載された１又は複数の態様及び実際のアプリケーションの原理を最良に説明するため、且つ、当業者が様々な修正を含む様々な実施形態について本明細書で説明されるような１又は複数の態様を理解することを可能するために選択及び説明された実施形態は、予期され特定の使用に適合している。

Claims

着信クエリステートメントを受信する段階であって、前記着信クエリステートメントは、入力変数を含むクエリステートメント表現を含む、受信する段階と、
前記入力変数に関連した入力変数値を予測する段階と、
予測済みの前記入力変数値に依存した前記着信クエリステートメントのランタイム実行用のアクセス経路を選択する段階と、
前記選択されたアクセス経路を使用して、前記着信クエリステートメントのランタイム実行を遂行する段階と
を備える、コンピュータ実装方法。
前記入力変数に関連した前記入力変数値を前記予測する段階は、予測済みの前記入力変数値の返答用の予測モデルを問い合わせる段階であって、前記予測モデルは、前記入力変数に対して決定された過去の入力変数値を含むトレーニングデータを用いてトレーニングされている、問い合わせる段階を有する、請求項１に記載のコンピュータ実装方法。
前記入力変数に関連した前記入力変数値を前記予測する段階は、予測済みの前記入力変数値の返答用の予測モデルを問い合わせる段階であって、前記予測モデルは、前記入力変数に対して決定された過去の入力変数値を含むトレーニングデータを用いてトレーニングされている、問い合わせる段階を有し、予測済みの前記入力変数値の返答用の前記予測モデルを前記問い合わせる段階は、前記受信した着信クエリステートメントに関連した作業負荷の属性を指定するコンテキストパラメータ値のセットを含むクエリデータを使用して前記予測モデルを問い合わせる段階を含み、前記コンテキストパラメータ値のセットは、前記着信クエリステートメントを含む企業システムから受信したメッセージから抽出されている、請求項１に記載のコンピュータ実装方法。
前記入力変数に関連した前記入力変数値を前記予測する段階は、予測済みの前記入力変数値の返答用の予測モデルを問い合わせる段階であって、前記予測モデルは、前記入力変数に対して決定された過去の入力変数値を含むトレーニングデータを用いてトレーニングされている、問い合わせる段階を有し、前記コンピュータ実装方法は、前記予測モデルが、精度のレベルを満たす閾値に従って予測を返答しているか否かを決定する段階を備え、前記コンピュータ実装方法は、前記予測モデルが精度のレベルを満たす前記閾値に従って予測を返答している、という決定に応じて前記予測モデルを前記問い合わせる段階を遂行する段階を備える、請求項１に記載のコンピュータ実装方法。
前記入力変数に関連した前記入力変数値を前記予測する段階は、予測済みの前記入力変数値の返答用の予測モデルを問い合わせる段階であって、前記予測モデルは、前記入力変数に対して決定された過去の入力変数値を含むトレーニングデータを用いてトレーニングされている、問い合わせる段階を有し、前記コンピュータ実装方法は、前記予測モデルが、精度のレベルを満たす閾値に従って予測を返答しているか否かを決定する段階を備え、前記コンピュータ実装方法は、前記予測モデルが精度のレベルを満たす前記閾値に従って予測を返答している、という決定に応じて前記予測モデルを前記問い合わせる段階を遂行する段階を備え、前記予測モデルが、精度のレベルを満たす閾値に従って予測を返答しているか否かを前記決定する段階は、前記予測モデルを使用して返答された予報を、過去の入力変数値を含む前記トレーニングデータのホールドアウトデータによって定義されたグラウンドトゥルースデータと比較する段階を有する、請求項１に記載のコンピュータ実装方法。
前記入力変数に関連した前記入力変数値を前記予測する段階は、予測済みの前記入力変数値の返答用の予測モデルを問い合わせる段階であって、前記予測モデルは、前記入力変数に対して決定された過去の入力変数値を含むトレーニングデータを用いてトレーニングされている、問い合わせる段階を有し、前記着信クエリステートメントは、第２の入力変数を有する第２のクエリステートメント表現を含み、前記コンピュータ実装方法は、第２の入力変数値に関連した前記第２の入力変数値の返答用の第２の予測モデルを問い合わせる段階を備え、予測済みの前記入力変数値に依存した前記着信クエリステートメントのランタイム実行用の前記アクセス経路を前記選択する段階は、予測済みの前記入力変数値に依存し、且つ、前記第２の入力変数値に依存した、前記着信クエリステートメントのランタイム実行用の前記アクセス経路を選択する段階を有する、請求項１に記載のコンピュータ実装方法。
前記入力変数に関連した前記入力変数値を前記予測する段階は、予測済みの前記入力変数値の返答用の予測モデルを問い合わせる段階であって、前記予測モデルは、前記入力変数に対して決定された過去の入力変数値を含むトレーニングデータを用いてトレーニングされている、問い合わせる段階を有し、前記着信クエリステートメントは、第２の入力変数を有する第２のクエリステートメント表現を含み、前記第２の入力変数に対して決定された過去の入力変数値を含むトレーニングデータを用いてトレーニングされている第２の予測モデルは、前記着信クエリステートメントの前記第２の入力変数に関連しており、前記コンピュータ実装方法は、前記予測モデルが、精度のレベルを満たす閾値に従って予測を返答しているか否かを決定する段階と、前記第２の予測モデルが、精度のレベルを満たす予測閾値に従って予測を返答しているか否かを決定する段階とを備え、前記コンピュータ実装方法は、前記予測モデルが精度のレベルを満たす前記閾値に従って予測を返答している、という決定に応じて前記予測モデルを前記問い合わせる段階を遂行する段階を備え、前記コンピュータ実装方法は、前記第２の予測モデルが精度のレベルを満たす前記予測閾値に従って予測を返答できていない、という決定に応じて、前記第２の入力変数に対する第２の入力変数値の予測の返答なしに、前記第２の入力変数用のデフォルトのフィルタ因子を割り当てる段階を備え、予測済みの前記入力変数値に依存した前記着信クエリステートメントのランタイム実行用の前記アクセス経路を前記選択する段階は、予測済みの前記入力変数値に依存し、且つ、前記デフォルトのフィルタ因子に依存した、前記着信クエリステートメントのランタイム実行用の前記アクセス経路を選択する段階を有する、請求項１に記載のコンピュータ実装方法。
アクセス経路を前記選択する段階は、アクセス経路の複数の候補のコストスコアリングを遂行する段階と、前記着信クエリステートメントのランタイム実行用の前記アクセス経路として、前記アクセス経路の複数の候補のうちの最も低いコストのアクセス経路を識別する段階とを有し、前記コンピュータ実装方法は、前記入力変数値に関連したテーブル用のテーブル傾向分類を決定すべく、過去のデータを検査する段階を備え、前記アクセス経路の複数の候補のコストスコアリングを前記遂行する段階は、前記テーブル傾向分類に依存した前記アクセス経路の複数の候補のコストスコアリングを遂行する段階を有する、請求項１から７のいずれか一項に記載のコンピュータ実装方法。
前記予測する段階は、機械学習によってトレーニングされている予測モデルを問い合わせる段階を有する、請求項１に記載のコンピュータ実装方法。
前記予測する段階は、機械学習によってトレーニングされている予測モデルを問い合わせる段階を有し、前記コンピュータ実装方法は、前記着信クエリステートメントの前記ランタイム実行の間、予測済みの前記入力変数値に関連した前記入力変数値を決定する段階と、前記予測モデルをトレーニングすべく、前記決定された入力変数値を使用する段階とをさらに備える、請求項１に記載のコンピュータ実装方法。
前記予測する段階は、前記着信クエリステートメントのランタイム実行の前のインスタンスに関連した入力変数値によって定義された時系列データを曲線フィッティングすべく、機械学習によってトレーニングされている予測モデルを問い合わせる段階を有する、請求項１に記載のコンピュータ実装方法。
前記予測する段階は、時系列データによって提供されたトレーニングデータを曲線フィッティングすべく、フーリエ解析ベースの機械学習によってトレーニングされている予測モデルを問い合わせる段階を有し、前記時系列データは、前記着信クエリステートメントのランタイム実行の前のインスタンスに関連した入力変数値によって定義されている、請求項１に記載のコンピュータ実装方法。
１又は複数のプロセッサに、
着信クエリステートメントを受信する手順であって、前記着信クエリステートメントは、入力変数を含むクエリステートメント表現を含む、受信する手順と、
前記入力変数に関連した入力変数値を予測する手順と、
予測済みの前記入力変数値に依存した前記着信クエリステートメントのランタイム実行用のアクセス経路を選択する手順と、
前記選択されたアクセス経路を使用して、前記着信クエリステートメントのランタイム実行を遂行する手順と
を実行させる、コンピュータプログラム。
前記入力変数に関連した前記入力変数値を前記予測する手順は、予測済みの前記入力変数値の返答用の予測モデルを問い合わせる手順であって、前記予測モデルは、前記入力変数に対して決定された過去の入力変数値を含むトレーニングデータを用いてトレーニングされている、問い合わせる手順を有する、請求項１３に記載のコンピュータプログラム。
前記入力変数に関連した前記入力変数値を前記予測する手順は、予測済みの前記入力変数値の返答用の予測モデルを問い合わせる手順であって、前記予測モデルは、前記入力変数に対して決定された過去の入力変数値を含むトレーニングデータを用いてトレーニングされている、問い合わせる手順を有し、予測済みの前記入力変数値の返答用の前記予測モデルを前記問い合わせる手順は、前記受信した着信クエリステートメントに関連した作業負荷の属性を指定するコンテキストパラメータ値のセットを含むクエリデータを使用して前記予測モデルを問い合わせる手順を含み、前記コンテキストパラメータ値のセットは、前記着信クエリステートメントを含む企業システムから受信したメッセージから抽出されている、請求項１３に記載のコンピュータプログラム。
前記入力変数に関連した前記入力変数値を前記予測する手順は、予測済みの前記入力変数値の返答用の予測モデルを問い合わせる手順であって、前記予測モデルは、前記入力変数に対して決定された過去の入力変数値を含むトレーニングデータを用いてトレーニングされている、問い合わせる手順を有し、前記コンピュータプログラムは、前記１又は複数のプロセッサに、前記予測モデルが、精度のレベルを満たす閾値に従って予測を返答しているか否かを決定する手順を実行させ、前記コンピュータプログラムは、前記１又は複数のプロセッサに、前記予測モデルが精度のレベルを満たす前記閾値に従って予測を返答している、という決定に応じて前記予測モデルを前記問い合わせる手順を遂行する手順を実行させる、請求項１３に記載のコンピュータプログラム。
前記入力変数に関連した前記入力変数値を前記予測する手順は、予測済みの前記入力変数値の返答用の予測モデルを問い合わせる手順であって、前記予測モデルは、前記入力変数に対して決定された過去の入力変数値を含むトレーニングデータを用いてトレーニングされている、問い合わせる手順を有し、前記コンピュータプログラムは、前記１又は複数のプロセッサに、前記予測モデルが、精度のレベルを満たす閾値に従って予測を返答しているか否かを決定する手順を実行させ、前記コンピュータプログラムは、前記１又は複数のプロセッサに、前記予測モデルが精度のレベルを満たす前記閾値に従って予測を返答している、という決定に応じて前記予測モデルを前記問い合わせる手順を遂行する手順を実行させ、前記予測モデルが、精度のレベルを満たす閾値に従って予測を返答しているか否かを前記決定する手順は、前記予測モデルを使用して返答された予報を、過去の入力変数値を含む前記トレーニングデータのホールドアウトデータによって定義されたグラウンドトゥルースデータと比較する手順を有する、請求項１３に記載のコンピュータプログラム。
前記入力変数に関連した前記入力変数値を前記予測する手順は、予測済みの前記入力変数値の返答用の予測モデルを問い合わせる手順であって、前記予測モデルは、前記入力変数に対して決定された過去の入力変数値を含むトレーニングデータを用いてトレーニングされている、問い合わせる手順を有し、前記着信クエリステートメントは、第２の入力変数を有する第２のクエリステートメント表現を含み、前記第２の入力変数に対して決定された過去の入力変数値を含むトレーニングデータを用いてトレーニングされている第２の予測モデルは、前記着信クエリステートメントの前記第２の入力変数に関連しており、前記コンピュータプログラムは、前記１又は複数のプロセッサに、前記予測モデルが、精度のレベルを満たす閾値に従って予測を返答しているか否かを決定する手順と、前記第２の予測モデルが、精度のレベルを満たす予測閾値に従って予測を返答しているか否かを決定する手順とを実行させ、前記コンピュータプログラムは、前記１又は複数のプロセッサに、前記予測モデルが精度のレベルを満たす前記閾値に従って予測を返答している、という決定に応じて前記予測モデルを前記問い合わせる手順を遂行する手順を実行させ、前記コンピュータプログラムは、前記１又は複数のプロセッサに、前記第２の予測モデルが精度のレベルを満たす前記予測閾値に従って予測を返答できていない、という決定に応じて、前記第２の入力変数に対する第２の入力変数値の予測の返答なしに、前記第２の入力変数用のデフォルトのフィルタ因子を割り当てる手順を実行させ、予測済みの前記入力変数値に依存した前記着信クエリステートメントのランタイム実行用の前記アクセス経路を前記選択する手順は、予測済みの前記入力変数値に依存し、且つ、前記デフォルトのフィルタ因子に依存した、前記着信クエリステートメントのランタイム実行用の前記アクセス経路を選択する手順を有する、請求項１３に記載のコンピュータプログラム。
メモリと、
前記メモリと通信する少なくとも１つのプロセッサと、
着信クエリステートメントを受信する段階であって、前記着信クエリステートメントは、入力変数を含むクエリステートメント表現を含む、受信する段階と、
前記入力変数に関連した入力変数値を予測する段階と、
予測済みの前記入力変数値に依存した前記着信クエリステートメントのランタイム実行用のアクセス経路を選択する段階と、
前記選択されたアクセス経路を使用して、前記着信クエリステートメントのランタイム実行を遂行する段階と
を備える、方法を遂行すべく、前記メモリを介して１又は複数のプロセッサによって実行可能であるプログラム命令と
を備える、システム。
着信クエリステートメントを受信する段階であって、前記着信クエリステートメントは、入力変数を含むクエリステートメント表現を含む、受信する段階と、
前記着信クエリステートメントのランタイム実行用のアクセス経路を選択する段階と、
前記選択されたアクセス経路を使用して、前記着信クエリステートメントのランタイム実行を遂行する段階であって、前記着信クエリステートメントのランタイム実行を前記遂行する段階は、前記入力変数に対する入力変数値を決定する段階を有する、遂行する段階と、
予測モデルをトレーニングするためのトレーニングデータとして、前記決定された入力変数値を適用する段階であって、前記予測モデルは、前記入力変数に関連した入力変数値についての予測を返答するように構成される、適用する段階と、
前記着信クエリステートメントの後続のインスタンスを受信する段階であって、前記着信クエリステートメントは、前記入力変数を含む前記クエリステートメント表現を含む、受信する段階と、
前記着信クエリステートメントの前記後続のインスタンスにおける前記入力変数の入力変数値を予測すべく、前記予測モデルを問い合わせる段階と、
予測済みの前記入力変数値に依存した前記着信クエリステートメントの前記後続のインスタンスのランタイム実行用のアクセス経路を選択する段階と、
前記選択されたアクセス経路を使用して、前記着信クエリステートメントの前記後続のインスタンスのランタイム実行を遂行する段階と
を備える、コンピュータ実装方法。
前記コンピュータ実装方法は、前記予測モデルが、精度のレベルを満たす閾値に従って予測を返答しているか否かを決定する段階を備え、前記コンピュータ実装方法は、前記予測モデルが精度のレベルを満たす前記閾値に従って予測を返答している、という決定に応じて前記予測モデルを前記問い合わせる段階を遂行する段階を備える、請求項２０に記載のコンピュータ実装方法。
前記コンピュータ実装方法は、前記予測モデルが、精度のレベルを満たす閾値に従って予測を返答しているか否かを決定する段階を備え、前記コンピュータ実装方法は、前記予測モデルが精度のレベルを満たす前記閾値に従って予測を返答している、という決定に応じて前記予測モデルを前記問い合わせる段階を遂行する段階を備え、前記予測モデルが、精度のレベルを満たす閾値に従って予測を返答しているか否かを前記決定する段階は、前記予測モデルを使用して返答された予報を、前記予測モデルをトレーニングするために使用された過去の入力変数値を含む前記トレーニングデータのホールドアウトデータによって定義されたグラウンドトゥルースデータと比較する段階を有する、請求項２０に記載のコンピュータ実装方法。
メモリと、
前記メモリと通信する少なくとも１つのプロセッサと、
着信クエリステートメントを受信する段階であって、前記着信クエリステートメントは、入力変数を含むクエリステートメント表現を含む、受信する段階と、
前記着信クエリステートメントのランタイム実行用のアクセス経路を選択する段階と、
前記選択されたアクセス経路を使用して、前記着信クエリステートメントのランタイム実行を遂行する段階であって、前記着信クエリステートメントのランタイム実行を前記遂行する段階は、前記入力変数に対する入力変数値を決定する段階を有する、遂行する段階と、
予測モデルをトレーニングするためのトレーニングデータとして、前記決定された入力変数値を適用する段階であって、前記予測モデルは、前記入力変数に関連した入力変数値についての予測を返答するように構成される、適用する段階と、
前記着信クエリステートメントの後続のインスタンスを受信する段階であって、前記着信クエリステートメントは、前記入力変数を含む前記クエリステートメント表現を含む、受信する段階と、
前記着信クエリステートメントの前記後続のインスタンスにおける前記入力変数の入力変数値を予測すべく、前記予測モデルを問い合わせる段階と、
予測済みの前記入力変数値に依存した前記着信クエリステートメントの前記後続のインスタンスのランタイム実行用のアクセス経路を選択する段階と、
前記選択されたアクセス経路を使用して、前記着信クエリステートメントの前記後続のインスタンスのランタイム実行を遂行する段階と
を備える、方法を遂行すべく、前記メモリを介して１又は複数のプロセッサによって実行可能であるプログラム命令と
を備える、システム。
前記方法は、前記予測モデルが、精度のレベルを満たす閾値に従って予測を返答しているか否かを決定する段階を備え、前記方法は、前記予測モデルが精度のレベルを満たす前記閾値に従って予測を返答している、という決定に応じて前記予測モデルを前記問い合わせる段階を遂行する段階を備える、請求項２３に記載のシステム。
前記方法は、前記予測モデルが、精度のレベルを満たす閾値に従って予測を返答しているか否かを決定する段階を備え、前記方法は、前記予測モデルが精度のレベルを満たす前記閾値に従って予測を返答している、という決定に応じて前記予測モデルを前記問い合わせる段階を遂行する段階を備え、前記予測モデルが、精度のレベルを満たす閾値に従って予測を返答しているか否かを前記決定する段階は、前記予測モデルを使用して返答された予報を、前記予測モデルをトレーニングするために使用された過去の入力変数値を含む前記トレーニングデータのホールドアウトデータによって定義されたグラウンドトゥルースデータと比較する段階を有する、請求項２３に記載のシステム。