JP2021500639A - 多段階パターン発見およびビジュアル分析推奨のための予測エンジン - Google Patents

多段階パターン発見およびビジュアル分析推奨のための予測エンジン Download PDF

Info

Publication number
JP2021500639A
JP2021500639A JP2020517214A JP2020517214A JP2021500639A JP 2021500639 A JP2021500639 A JP 2021500639A JP 2020517214 A JP2020517214 A JP 2020517214A JP 2020517214 A JP2020517214 A JP 2020517214A JP 2021500639 A JP2021500639 A JP 2021500639A
Authority
JP
Japan
Prior art keywords
data
visualization
prediction engine
variable
storage medium
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020517214A
Other languages
English (en)
Other versions
JP2021500639A5 (ja
JPWO2019084187A5 (ja
Inventor
ロープ、ダニエル、ジェイ.
ベリッジ、アンドリュー、ジェイ.
オコネル、マイケル
パオリーニ、ガイア、ヴァレリア
ラジデブ、ディビャジョッティー、ピタンバーラル
Original Assignee
ティブコ ソフトウェア インク
ティブコ ソフトウェア インク
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ティブコ ソフトウェア インク, ティブコ ソフトウェア インク filed Critical ティブコ ソフトウェア インク
Publication of JP2021500639A publication Critical patent/JP2021500639A/ja
Publication of JP2021500639A5 publication Critical patent/JP2021500639A5/ja
Publication of JPWO2019084187A5 publication Critical patent/JPWO2019084187A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Medical Informatics (AREA)
  • Library & Information Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【解決手段】 本開示は、解釈プログラムおよび可視化生成プログラムを含むデータ構造を解釈する予測エンジンに関する。解釈プログラムは、標的特徴データと他の特徴データとの間の変数依存性の認識に基づいて標的特徴データと他の特徴データとの間の関係パターンを特定し、少なくとも1つのメタデータ特徴セットおよび結果測定基準を生成する。可視化生成プログラムは、少なくとも1つのメタデータ特徴セットおよび結果測定基準に基づいて、少なくとも1つの可視化を推奨できる。解釈プログラムは、変数選択、相互関連検出、およびパターン発見並びに順位付けを実行する複数段階を有する。さらに、予測エンジンは、データタイプ、階層データ構造、固有値、欠損値、日付/時間データのうちの少なくとも1つに従ってデータ構造をソートおよび分類並びにフィルタするように構成されたデータ準備プログラムを含んでいる。【選択図】 図2

Description

関連出願の相互参照
本出願は、「Multistage Pattern Discovery for Visual Analytics Recommendations(ビジュアル分析推奨のための多段階パターン発見)」と題する2017年10月24日付で出願された米国特許仮出願第62/576,187号に対して優先権を主張するものであり、その全体の内容がすべての目的において参照として本明細書に組み込まれる。
本発明は、一般的に人工知能アルゴリズムおよび予測エンジン、特に多段階パターン発見およびビジュアル分析推奨のための予測エンジンに関する。
予測および可視化解析は多くの領域において使用されるツールである。政府、公共エンジン、およびビジネスは、ビックデータを管理および解釈するのに斯かるツールを使用する。斯かるツールは、大量のデータを解釈し、ユーザが統治決定および管理決定を行う手助けとして使用できるデータに関する情報を提供するので、大いに有益であり得る。しかし、当業界の現在の状態では、斯かるツールには多くの欠点が存在する。例えば、斯かるツールは一定基準では使用されておらず、各領域に特有なものであり、深い理解度はほとんどまたは全く提供しない。従って、当業界にける現在の予測および可視化解析ツールの改善が求められている。
本明細書に記載した本開示は、データ構造からデータを準備し、標的特徴変数と他の特徴変数との間の関連パターンを特定し、当該関連パターンに基づいて可視化を推奨するように構成された機構を有するコンピュータ装置を有する。
1つの観点において、本開示は、解釈プログラム(interpreter)と、可視化生成プログラム(visualization generator)とを含む、データ構造を解釈するための予測エンジンに関する。解釈プログラムは、標的特徴データと他の特徴データとの間の変数依存性の認識に基づいて標的特徴変数と他の特徴変数との間の関連パターンを特定するように構成されている。可視化生成プログラムは、少なくとも1つのメタデータ特徴セットおよびそれに関連する結果測定基準(associated result metrics)に基づいて、少なくとも1つの可視化を推奨するように構成されている。
いくつかの実施形態において、解釈プログラムは、変数選択、相互関連検出、パターン発見、および順位付けを実行するための多段階を含んでいる。変数依存性は、線形、非線形関係、および非ランダムパターンのうちの1つである。いくつかの実施形態において、予測エンジンは、データタイプ、階層データ構造、固有値、欠損値、日付/時間データのうちの少なくとも1つに基づいて、データ構造をソート、分類、およびフィルタするように構成されたデータ準備プログラムを含んでいる。いくつかの実施形態において、解釈プログラムは、統計的検定を実行して相互関連効果が有意であるかどうかを決定するようにさらに構成されている。いくつかの実施形態においては、可視化生成プログラムは、多変数図表および二変数図表のうちの少なくとも1つ若しくはそれ以上を生成する。いくつかの実施形態において、可視化生成プログラムは、発見的規則を適用して少なくとも1つの可視化を推奨するようにさらに構成されている。
別の観点において、本開示は、予測エンジンを動作させてデータ構造を解釈する方法に関する。当該方法には、標的特徴データと他の特徴データとの間の変数依存性の認識に基づいて標的特徴データと他の特徴データとの間の関連パターンを特定する工程と、少なくとも1つのメータデータ特徴セットおよびそれに関連する結果測定基準を生成する工程と、前記少なくとも1つのメータデータ特徴セットおよび前記関連の結果測定基準に基づいて少なくとも1つの可視化を推奨する工程とが含まれる。
当該方法は、第一の段階、第二の段階、第三の段階を実行する工程を含んでおり、変数選択、相互関連検出、パターン発見、および順位付けは、前記特定する工程および前記生成する工程において実行される。変数依存性は線形、非線形関係、および非ランダムパターンのうちの1つである。当該方法は、データタイプ、階層データ構造、固有値、欠損値、および日付/時間データのうちの少なくとも1つに基づいて、データ構造をソート、分類、およびフィルタする工程を有していてもよい。当該方法は、相互関連効果が有意であるかどうかを決定するために統計的検定を実行する工程を含んでいてもよい。さらに、当該方法は、さらに、多変数図表および二変数図表のうちの少なくとも1つ若しくはそれ以上を生成する工程を有する。
さらなる観点において、本開示は、(予測エンジンを動作させてデータ構造を解釈するための、プロセッサによって実行可能な)コンピュータ命令のセットを有する非一時的コンピュータ可読記憶媒体に関する。コンピュータ命令は、標的特徴データと他の特徴データとの間の変数依存性の認識に基づいて標的特徴データと他の特徴データの間の関連パターンを特定し、少なくとも1つのメータデータ特徴セットおよびそれに関連する結果測定基準を生成し、当該少なくとも1つのメータデータ特徴セットおよび関連の結果測定基準に基づいて少なくとも1つの可視化を推奨するように構成されている。
追加のコンピュータ命令は、変数選択、相互関連検出、パターン発見、および順位付けが実行される多段階において、前記関係パターンを特定し、前記前記少なくとも1つのメタデータ特徴セットおよび前記関連する結果測定基準を生成し、および/またはデータタイプ、階層データ構造、固有値、欠損値、日付/時間データのうちの少なくとも1つに基づいて、データ構造をソート、分類、およびフィルタし、および/または多変数図表および二変数図表のうちの少なくとも1つ若しくはそれ以上を生成し、および/または発見的規則を適用して少なくとも1つの可視化を推奨するように構成されていてもよい。変数依存性は、線形、非線形関係、および非ランダムパターンのうちの1つである。
追加の実施形態、利点、および新規な特徴について、以下の詳細な説明に記載する。
本開示の特徴および利点のさらなる完全な理解のため、以下の詳細な説明とともに添付の図面が参照されるが、その場合、異なる図面において対応する参照番号はそれらの対応する部分を表すものである。
図1は、特定の例示的実施形態に従って、多段階、機械学習、予測エンジンアルゴリズムに関連付けられたデータ解釈および可視化機能を概説するフローダイアグラムである。 図2は、、特定の例示的実施形態に従う、多段階、機械学習、予測エンジンアルゴリズムの図面である。 図3−7、8A−8B、9A−9Bは、予測エンジンによって生成された可視化の図面である。 図3−7、8A−8B、9A−9Bは、予測エンジンによって生成された可視化の図面である。 図3−7、8A−8B、9A−9Bは、予測エンジンによって生成された可視化の図面である。 図3−7、8A−8B、9A−9Bは、予測エンジンによって生成された可視化の図面である。 図3−7、8A−8B、9A−9Bは、予測エンジンによって生成された可視化の図面である。 図3−7、8A−8B、9A−9Bは、予測エンジンによって生成された可視化の図面である。 図3−7、8A−8B、9A−9Bは、予測エンジンによって生成された可視化の図面である。 図3−7、8A−8B、9A−9Bは、予測エンジンによって生成された可視化の図面である。 図3−7、8A−8B、9A−9Bは、予測エンジンによって生成された可視化の図面である。 図10は、特定の例示的実施形態に従って、コンピュータおよびシステムアプリを説明するブロック図である。
本開示の種々の実施形態の作成および使用が以下に詳細に考察されるが、本開示は適用可能な多くの発明的概念を提供するものであり、それらは多種多様な特定のコンテキストで具体化可能であることは理解されるべきである。本明細書で考察されている特定の実施形態は単に例示目的に過ぎず、本開示の範囲を制限するものではない。明瞭化を期するため、実際に実行される特徴の全てが本開示には記載されていないかもしれない。斯かる実際の実施形態の開発において、開発者の特定の目標、例えば、実行毎に異なるであろうシステム関連およびビジネス関連の制約の遵守を達成するため、実行に特有の数多くの決定がなされなければならないことは、勿論理解されるであろう。さらに、斯かる開発は複雑で時間のかかるものであるかもしれないが、本開示の恩恵に浴する当業者にとっては日常業務となるものであろうことは理解されるであろう。
データ可視化推奨システムは様々な方法で作成可能である。例えば、一般ユーザは事前作製の可視化によりデータの図面を迅速に取得することができるが、データフィールド間のアルゴリズム関係を発見したり表示したりはできない。別の方法は統計的分析である。統計的分析および可視化は特定の数学的関係を表現しデータサイエンティストに意味のある方法でそれを表示できるが、ビジネスユーザに一般的な深い理解を提供するようには設計されていない。換言すれば、斯かるツールは、任意のビジネス領域をカバーするのに十分柔軟な可視化であって、関心ある特徴および関係を最初から示し得る十分な情報を有する可視化をビジネスユーザに提供する一般的機能が欠如している。斯かる機能がなければ、営業活動にとって貴重な深い理解は得られないであろう。別の方法は事前に規定された分析的ルーチンである。その結果は特定の可視化(または音声)で表示される。これは領域が特定されている場合にのみ効果的である。加えて、当業界の可視化推奨システムは、変数メタデータのみを一般的に使用する。データ内の関係は調べられない。
種々の実施形態において、データ内の関係は、本明細書開示の予測エンジンアルゴリズムによって調べられる。種々の実施形態において、機械学習の複数段階が、発見的可視化システムに影響を及ぼし得る有益な変数セットおよび測定基準を決定するのに使用される。種々の実施形態において、機械学習アルゴリズムの結果は、可視化内のパターンを示すための可視化装飾のヒントを提供するのに使用される。多段階アプローチは、可視化推奨に使用されるパターンを発見するのに使用される。標準ビジネス図表としてビジネスユーザに分析的見通しを提供する方法において、多段階機械学習と発見的に選択される事前作成可視化が組み合わされてもよい。本明細書開示の機械学習アルゴリズムは、発見的可視化推奨が行う変数役割選択に影響を及ぼし得る選択変数内パターンを発見する。機械学習アルゴリズムは、特定のパターンまたは外れ値をユーザに例示するのに役立つ可視化装飾も提案する。
本明細書記載の標的変数と言う用語は、変形物がデータ内の他の変数によっても記載可能な、データ表内の特定の関心属性(特徴とも呼ばれる)を意味する。この標的変数に関連付けられたデータは、データ表の記録内の他の変数のデータと比較される。
図1を参照すると、この図は、特定の例示的実施形態に従って、多段階、機械学習、予測エンジンアルゴリズムに関連付けられたデータ解釈および可視化機能を概説する、一般的に10で示されるフローダイアグラムである。フローダイアグラム10は、機械学習によって増強された発見的可視化レコメンダーによって、多段階予測エンジンに関連付けられた特徴を特定する。フローダイアグラム10は、データ準備12、発見14、および発見的可視化推奨16のセクションを含む。
データ準備12はデータ準備特徴を記載するものであり、データは、データの質、従ってアルゴリズムの予測機能を改善する調整を行うため、事前に処理される。本質的に、データは、データタイプ、階層データ構造、固有値、欠損値、日付/時間データのうちの少なくとも1つに従ってデータ構造をソートおよび分類並びにフィルタすることにより準備される。生データはデータタイプおよび階層によって特定され、固有性、欠損、および時間の特徴のうち少なくとも1つを有するものとしてさらに特定できる。調整は、欠損データを有する変数に適用したり(例えば、除去または補間値代入)、固有値の閾値を超えるカテゴリー変数に適用したり(例えば、除去または再編成のための記録)でき、1つの値しか有しない変数は無視できる。これは、十分な情報を含まない変数、または標的の予測子よりもむしろラベルとなる可能性の高いカテゴリーを排除するためである。ユーザーが上述の理由のいずれかにより排除された標的を選択する場合、深い理解は得られない(すなわち、ユーザーは標的変数に関する標準のヒストグラムまたは棒グラフを見る)であろう。
日付/時間データタイプの変数は、その日付階層(例えば、年度、月など)の潜在的トップ要素に変換できる。種々の実施形態において、複数レベルの階層が生成可能である。最初の日付変数は廃棄してもよい。トップ階層要素が日付変数となる。数値変数は複数の技法を用いてビンに入れ、結果を集積できるので、結果の強固さが増大する。これは変数変換と呼ばれてもよい。加えて、アルゴリズムは変数を自動的に変換し、統計メタデータに基づいて他の計算を正規化したり、ビンに入れたり、適用したり(すなわち、最少/最大、モーメント、パーセント、頻度数などを決定)できる。多過ぎるレベルを有するカテゴリー変数は特徴有意性に人工的に大きい影響を及ぼし得る。従って、レベル数を減少させるために再編成が行われてもよい。再編成を決定するのに、特定の閾値の使用または頻度分布の調査を含む種々の方法が使用できる。カテゴリー変数の固有値が数えられてもよい。この方法は、データ準備工程における変数の取り扱い方法の決定に役立つ。ランダムデータを含む新しい変数は、データ準備中、ベースライン信号対ノイズ目的でデータ表に挿入されてもよい。この技法は、明示的検定を提供しない分析ルーチン用に、関係の有意閾値を決定するメカニズムを提供する。
データが準備されたら、選択標的用のデータ発見14が予測エンジンアルゴリズムによって実行される。これには、機械学習アルゴリズム、例えば、ランダムフォレスト、勾配ブースティングツリーなど、あるいは統計的方法、例えば、ピアソン相関、クラメールのV、ANOVAなどが使用できる。標的と他の変数との間の関係が計算され順位付けされる。有意でない関係は使用されない。変数順位付けは、関係を超えた調査結果、例えば、特定の注釈の数および関連性などを考慮に入れることができる。変数順位付けは、2変数および3変数関係に関する単一の順位付け尺度である。変数関係アルゴリズムは、任意のカラムセット間の関係を決定できる。生成された変数順位付けは、入力として16に提供される。
次に、14により生成される情報は、良好な可視化を選択する発見的規則を通して、再優良可視化に適用できる。いくつかの可視化候補が生成でき、劣等な選択は、14で提供され可視化発見的方法と組み合わされた規則に基づいて、フィルタ―を通して除去される。それがグローバルスコアリングまたは順位付けと組み合わされる。斯かる規則は、可視化タイプ、軸、および注釈を決定するのに使用される。グローバルスコアリング(すなわち順位付け)は生成されたグラフに適用され、その結果、可視化の網羅的リストが表示できる。
予測エンジンアルゴリズムの強みは、関係が線形、非線形、クラスター、あるいはそれ以外であるか否かに無関係であることである。それは、任意の興味ある関係(予測子カラムの値が特定の非ランダム方法で標的カラムの値を駆動する関係)を見つけることができる。予測プロセスにおける段階の使用は、組み合わされたやり方によって関係、相互関連、およびパターンの発見を可能にするので、予測エンジンアルゴリズムの結果が差別化される。予測エンジンアルゴリズムは、線形/非線形関係の発見並びにパターンおよび外れ値の表示が可能である。
図2を参照すると、特定の例示的実施形態に従って、多段階、機械学習、予測エンジンアルゴリズムが図示されており、この図は一般的に40で示される。アルゴリズム40は、ユーザー消費に値するキュレーションおよび可視化に関して深い理解を生成するため、複数段階で利用できる。アルゴリズム40は、データ準備12機能、発見14機能、および発見的可視化推奨16機能を有している。発見14は、選択フィールド要素、段階1(変数選択要素44)、段階2(相互関連検出要素46)、および段階3(パターン発見/順位付け要素)を含む。
これらの段階において、機械学習ツール、例えば、ランダムフォレスト、GBM(勾配ブースティングマシーン)、ANOVA(分散分析)、統計的有意差検定などが使用できる。斯かる段階の出力は、可視化推奨16に影響を及ぼすのに使用できる。1つの特定のアルゴリズムを別のアルゴリズムに対して使用すれば、カスタム化が可能なパラメータ表示ができるようになる。例えば、特定のデータセットに関して、いくつかの方法は他の方法よりも有効である。その結果がビジネス問題に関して不適切であれば、この段階の使用として、異なる技法が選択可能である。変数は、標的変数との関係の強さに従って順位付けが可能である。
一般的に、アルゴリズム40はユーザーデータのサンプルを取り、データ準備を実行するので、それにより、その後の分析段階の操作が効率的かつさらに有効なやり方で行えるようになる。準備技法は以下のうちの1つ以上を有していてもよい。
・変数タイプ発見:カテゴリー/連続タイプを決定すると共に、整数値として暗号化されているカテゴリー変数などの課題を説明する。
・欠損データ処理:連続変数のために補間値を代入(例えば、カテゴリーデータのために欠損カテゴリーを追加)。
・変数変換:統計メタデータに基づいて他の計算を正規化したり、ビンに入れたり、適用したり(すなわち、最少/最大、モーメント、パーセント、頻度数などを決定)するための自動変数変換。
次に、ユーザーは、関心のある特定の標的変数(すなわち、選択フィールド42)を選択してもよい。いくつかの実施形態において、これは、アルゴリズム40がユーザーに要求する唯一の入力であってもよい。アルゴリズム40は、データ準備後の変数により、何ら有益な理解とはならないであろう変数(例えば、一定値を有する変数や欠損値の多過ぎる変数など)を除去したり、フラグを立てたりできるようになる。
種々の実施形態において、アルゴリズム40は、ユーザー選択の変数における変動性を最も良く説明する変数を決定するための、データ準備に使用される機械学習機能を含んでいる(段階1:変数選択44)。段階1では、ユーザー選択の標的変数に独立的に関連付けられた変数を見つける。これは、選択された変数に対して独立的に関連付けられた変数間の二変数図表の場合に有用である。図2に示されるように、斯かる関連性を決定するのに、変数選択機能が使用できる。段階2の相互関連検出(interaction detection)46において、斯かる変数の組み合わせが発見される。それらを併用することにより、ユーザー選択の変数の変分が、個別に考慮された場合よりもさらに良く説明できる。斯かる変数セットは、多変数可視化に使用できる。例えば、段階1で発見された変数の全てのペアが調査できる。さらに、図2に示されるように、予測モデリングまたは統計的技法(ANOVAなど)が段階2で使用できる。段階3のパターン発見/順位付け48において、相互関連効果が有意であるか否かを決定するため、統計的有意性検定が実行できる。相互関連効果が有意であることが見い出されたら、3つの変数のセットが、多変数可視化内での使用のために保持される。段階3において、アルゴリズム40は、変数間の有意に重要な関係を見つける。ここで使用される技法には、変数重要度技法、統計的仮説検定、単純ピアソン相関などが含まれる。同様に、2つ(またはそれ以上)の変数間の相互関連効果の有意性を決定するのに、任意の再優良な統計的処理が使用できる。
多段階プロセスの結果は、変数セットおよび結果測定基準のリストであり、適切な可視化を画定するため、可視化推奨システム16によって使用可能である。結果測定基準は、発見的可視化推奨に影響を及ぼして変数間の関係をより良く表示するのに使用できる。例えば、発見的可視化推奨規則により、1つの変数をキャプションを有する色変数としてX軸に適用すると言う任意の決定が行われてもよい。機械学習測定基準は、斯かる変数の1つに関して、Y軸変数に密接な関係を有していることを示していてもよく、その結果、ビジネス見通しをさらに良く表示するための図表構成を推奨システムが選択できるようになっていてもよい。
加えて、発見的可視化推奨16は、外れ値(すなわち、異常値)を検出し、調査結果(最終可視化で修飾可能)を表示するのに、測定基準を使用してもよい。例えば、カテゴリー/連続変数セットが存在する場合、カテゴリー変数の所定のカテゴリーが他のカテゴリーと比較して異常に大きいことがルーチンによって決定できる。発見的可視化推奨16は、この情報を用いて、このカテゴリーを棒グラフで強調したり、ドットプロットで点を強調したりできる。別の例は日付/時間範囲のメタデータからの特徴抽出(例えば、年度、月など)であり、これは、単一の日付/時間変数に関して、ヒートマップ可視化構築のための最善の集合を見つけるのに使用される。別の例は、異なるレベル数および外れ値の存否に関するメタデータであり、これは、連続/連続変数ペアのための最も適切な可視化として、ボックスプロット、棒グラフ、またはヒートマップ可視化間の選別格付けに使用される。外れ値検出の方法は、変数の性質次第ではあるが数多く存在する。それらは検出改善目的で組み合わされる。例えば、連続/連続変数ペアに関しては、一連のグリッドベースおよび回帰ベースの方法が使用できる。カテゴリー/カテゴリー変数ペアに関しては、相互頻度分布および情報内容が稀なレベルを強調するのに使用できる。
図3〜9を参照すると、これらの図は、特定の例示的実施形態による、予測エンジン40によって生成された可視化を示している。標的属性変数と表内の他の属性変数との間の線形、非線形関係、および任意の非ランダムパターンを決定するため、記録表が標的変数を用いてどのように処理および解釈されているかをこれらの図は示している。
図10を参照すると、この図は、例示的実施形態による、コンピュータ装置100およびシステムアプリケーションモジュール200を示している。コンピュータ装置100は、種々のコンピュータ、モバイル装置、ラップトップコンピュータ、サーバー、組込み型システム、および本明細書記載のコンピュータシステムのいずれにも対応可能である。モジュール200は、本明細書記載の種々の方法および処理機能を実行するコンピュータ装置100の機能を簡便化するように設計された、1つ以上のハードウェアまたはソフトウェア要素(例えば、他のOSアプリケーション、ユーザー/核空間アプリケーションなど)を有していてもよい。コンピュータ装置100は、種々の内部構成要素または付加構成要素、例えば、プロセッサ110、システムバス120、システムメモリ130、記憶媒体140、入力/出力インターフェース150、およびネットワーク170(携帯/GPS、ブルートゥース(登録商標)、WIFIなど)との通信用のネットワークインターフェース160を含んでいてもよい。
コンピュータ装置は、従来のコンピュータシステム、組込み型コントローラ、ラップトップ、サーバー、モバイル装置、スマートフォン、ウェアラブルコンピュータ、カスタム化された装置、任意の他のハードウェアプラットフォーム、またはそれらの任意の組み合わせまたは複合として実行可能である。コンピュータ装置は、分散型システム(データネットワークまたはバスシステムを通して相互連結された複数のコンピュータ装置を用いて機能するように構成されたシステム)であってよい。
プロセッサ110は、本明細書記載の操作および機能を実行し、要求フローおよびアドレス対応を管理し、計算を実行し、コマンドを生成するため、コード命令を実行するように設計されていてもよい。プロセッサ110は、コンピュータ装置内の構成要素の作動を監視/制御するように構成されていてもよい。プロセッサ110は、汎用プロセッサ、プロセッサコア、マルチプロセッサ、再構成可能プロセッサ、マイクロコントローラ、デジタルシグナルプロセッサ(DSP)、アプリケーション特有集積回路(ASIC)、コントローラ、ゲート論理、個別のハードウェア構成要素、任意の他の処理装置、またはそれらの任意の組み合わせまたは複合であってよい。プロセッサ110は、単一の処理装置、複数の処理装置、単一の処理コア、複数の処理コア、特定目的処理コア、コプロセッサ、またはそれらの任意の組み合わせであってよい。特定の実施形態によれば、プロセッサ110はコンピュータ装置100の他の構成要素と共に、1つ以上の他のコンピュータ装置内で実行されるソフトウェアベースまたはハードウェアベースの可視化コンピュータ装置であってよい。
システムメモリ130は、非揮発性メモリ、例えば、読み取り専用メモリ(ROM)、プログラム可能読み取り専用メモリ(PROM)、消去可能プログラム可能読み取り専用メモリ(EPROM)、フラッシュメモリ、または印可電力を用いてまたはそれ無しにプログラム命令またはデータを記憶可能な任意の他の装置を有していてもよい。システムメモリ130は、揮発性メモリ、例えば、ランダムアクセスメモリ(RAM)、静的ランダムアクセスメモリ(SRAM)、動的ランダムアクセスメモリ(DRAM)、同期動的ランダムアクセスメモリ(SDRAM)などを含んでいてもよい。システムメモリ130を実行するのに、他のタイプのRAMを用いてもよい。システムメモリ130は、単一のメモリモジュールまたは複数のメモリモジュールを用いて実行してもよい。システムメモリ130はコンピュータ装置の一部として示されているが、当業者は、システムメモリ130が、本主題の技術範囲から逸脱することなく、コンピュータ装置100から切り離されていてもよいことを認識するであろう。システムメモリ130は、記憶媒体140などの非揮発性記憶装置を含んでいてもよいこと、あるいは斯かる装置と連携して作動してもよいことも理解されるべきである。
記憶媒体140は、ハードディスク、フロッピディスク、コンパクトディスク読み取り専用メモリ(CD−ROM)、デジタル汎用ディスク(DVD)、ブルーレイディスク、磁気テープ、フラッシュメモリ、他の非揮発性メモリ装置、ソリッドステートドライブ(SSD)、任意の磁気記憶装置、任意の光記憶装置、任意の電気記憶装置、任意の半導体記憶装置、任意の物理ベースの記憶装置、任意の他のデータ記憶装置、またはそれらの任意の組み合わせまたは複合を含んでいてもよい。記憶媒体140は、1つ以上のオペレーティングシステム、アプリケーションプログラムおよびプログラムモジュール、データ、または任意の他の情報を記憶できる。記憶媒体140は、サーバー、データベースサーバー、クラウドストレージ、ネットワーク接続ストレージなどのコンピュータ装置と連通した1つ以上の他のコンピュータ装置の一部であってもよい。
アプリケーションモジュール200および他のOSアプリケーションモジュールは、コンピュータ装置による本明細書記載の種々の方法および処理機能の実行を簡便化するように構成された1つ以上のハードウェアまたはソフトウェア要素を有していてもよい。アプリケーションモジュール200および他のOSアプリケーションモジュールは、システムメモリ130および/または記憶媒体140との関連でソフトウェアまたはファームウェアとして記憶されているアルゴリズムまたは一連の命令を含んでいてもよい。従って、記憶媒体140は、命令またはコードがプロセッサ110によって実行されるために記憶されている機械読み取り可能媒体またはコンピュータ読み取り可能媒体の例を示すものであってよい。機械読み取り可能媒体またはコンピュータ読み取り可能媒体は、一般的に、プロセッサ110に命令を提供するのに使用される任意の媒体(複数も可)を意味するものであってよい。アプリケーションモジュール200および他のOSアプリケーションモジュールに関連付けられた斯かる機械読み取り可能媒体またはコンピュータ読み取り可能媒体は、コンピュータソフトウェア製品を有していてもよい。アプリケーションモジュール200および他のOSアプリケーションモジュールを有するコンピュータソフトウェア製品は、ネットワーク、任意の信号保持媒体、または任意の他の通信技術あるいは引き渡し技術を通して、アプリケーションモジュール200および他のOSアプリケーションモジュールをコンピュータ装置に引き渡すための1つ以上のプロセスまたは方法に関連付けられていてもよい。アプリケーションモジュール200および他のOSアプリケーションモジュールは、ハードウェア回路、またはマイクロコードなどのハードウェア回路を構成する情報、またはFPGAあるいはPLD用の構成情報を有していてもよい。1つの例示的な実施形態において、アプリケーションモジュール200および他のOSアプリケーションモジュールは、本明細書記載のフローチャートおよびコンピュータシステム記載の機能操作を実行可能なアルゴリズムを有していてもよい。
入力/出力(I/O)インターフェース150は、1つ以上の外部装置に連結され、データを1つ以上の外部装置から受信し、データを1つ以上の外部装置へ送信するように構成されていてもよい。斯かる外部装置は、種々の内部装置と共に、周辺装置としても知られているものであってよい。I/Oインターフェース150は、種々の周辺装置をコンピュータ装置またはプロセッサ110に連結するための電気接続並びに物理的接続の両方を含んでいてよい。I/Oインターフェース150は、周辺装置、コンピュータ装置、またはプロセッサ110間で、データ、アドレス、およびコントロールシグナルを通信するように構成されていてもよい。I/Oインターフェース150は、任意の標準インターフェース、例えば、小型コンピュータシステムインターフェース(SCSI)、シリアルアタッチドSCSI(SAS)、ファイバーチャネル、周辺構成要素相互接続装置(PCI)、PCIエクスプレス(PCIe)、シリアルバス、パラレルバス、先端技術付加装置(ATA)、シリアルATA(SATA)、ユニバーサルシリアルバス(USB)、サンダーボルト、ファイアーワイヤ、種々のビデオバスなどを実行するように構成されていてもよい。I/Oインターフェース150は、1つのインターフェースまたはバス技術のみを実行するように構成されていてもよい。あるいは、I/Oインターフェース150は、複数のインターフェースまたはバス技術を実行するように構成されていてもよい。I/Oインターフェース150は、システムバス120の一部として、またはその全部として構成されていてもよいし、あるいはシステムバスと連携して作動するように構成されていてもよい。I/Oインターフェース150は、1つ以上の外部装置、内部装置、コンピュータ装置、またはプロセッサ120間のバッファリング送信用に、1つ以上のバッファを含んでいてもよい。
I/Oインターフェース120は、マウス、タッチスクリーン、スキャナー、電子デジタイザ、センサー、受信機、タッチパッド、タッチボール、カメラ、マイクロホン、キーボード、任意の他の位置決め装置、またはそれらの任意の組み合わせを含む種々の入力装置にコンピュータ装置を連結できる。I/Oインターフェース120は、ビデオ表示器、スピーカー、プリンタ、プロジェクタ、触覚フィードバック装置、自動化制御、ロボット構成要素、アクチュエータ、モーター、ファン、ソレノイド、弁、ポンプ、送信機、シグナルエミッタ、光などを含む種々の出力装置にコンピュータ装置を連結できる。
コンピュータ装置100は、NIC160を通してネットワーク内の1つ以上の他のシステムまたはコンピュータ装置への論理連結を用いることにより、ネットワーク環境での操作が可能である。ネットワークには、広域ネットワーク(WAN)、ローカルエリアネットワーク(LAN)、イントラネット、インターネット、無線アクセスネットワーク、有線ネットワーク、モバイルネットワーク、電話網、光ネットワーク、またはそれらの組み合わせが含まれる。ネットワークは、パケット交換、回路交換、または任意のトポロジーであってもよいし、任意の通信プロトコールを使用してもよい。ネットワーク内の通信リンクは、種々のデジタルまたはアナログ通信媒体、例えば、光ファイバーケーブル、自遊空間光通信、導波管、電気伝導体、無線リンク、アンテナ、ラジオ周波通信機器などを含んでもよい。
プロセッサ110は、システムバス120を通して、本明細書記載のコンピューター装置または種々の周辺機器に属する他の要素に連結可能である。システムバス120は、プロセッサ110内であってもよいし、プロセッサ110外であってもよいし、あるいはその両方であってもよい。いくつかの実施形態によれば、プロセッサ110、コンピュータ装置の他の要素、または本明細書記載の種々の周辺機器は、いずれも、システムオンチップ(SOC)、システムオンパッケージ、ASIC装置などの単一装置に統合してもよいことは理解されるべきである。
種々の実施形態は本明細書記載/図示の機能を具体化したコンピュータプログラムを有しており、コンピュータプログラムは、機械読み取り可能媒体に記憶された命令を含むコンピュータシステムおよび当該命令を実施するプロセッサで実行されるものである。しかし、コンピュータプログラミングで実施形態を実行する方法には多種多様なものがあり得ること、並びに例示的実施形態で特に開示されない限り、実施形態は任意の1つのセットのコンピュータプログラム命令に限定されるように解釈されるべきではないことは理解されるべきである。さらに、熟練したプログラマーであれば、添付のフローチャート、アルゴリズム、およびアプリケーションテキストにおける関連記載に基づいて、開示された実施形態のうちの1つの実施形態を実行するように、斯かるコンピュータプログラムを記述出来るであろう。従って、プログラムコード命令の特定のセットの開示は、実施形態の作成および使用方法の十分な理解にとっては必要なものとは考えられない。さらに、本明細書記載の実施形態の1つ以上の観点がハードウェア、ソフトウェア、またはそれらの組み合わせによって実行され、1つ以上のコンピュータシステムでそれが具体化されてもよいことは、当業者には理解されるであろう。さらに、コンピュータが実行する動作への言及は、(2つ以上のコンピュータが斯かる動作を実行し得るので)単一のコンピュータによって実行されているものと解釈されるべきではない。
本明細書記載の例示的実施形態は、上述の方法および処理機能を実行するコンピュータハードウェアおよびソフトウェアと一緒に使用できる。本明細書記載のシステム、方法、および手順は、プログラム可能コンピュータ、コンピュータ実行可能ソフトウェア、またはデジタル回路構成で具体化できる。ソフトウェアはコンピュータ読み取り可能媒体に記憶させることができる。例えば、コンピュータ読み取り可能媒体には、フロッピーディスク、RAM、ROM、ハードディスク、取り外し可能媒体、フラッシュメモリ、メモリスティック、光媒体、光磁気媒体、CD−ROMなどが含まれてよい。デジタル回路構成には、集積回路、ゲートアレイ、ビルディングブロック論理、フィールドプログラム可能ゲートアレイ(FPGA)などが含まれてよい。
上述の実施形態に記載されている例示的システム、方法、および動作は例示的なものであり、代替実施形態においては、特定の動作は、種々の実施形態の範囲および精神から逸脱することなく、異なる順序で実行されてもよいし、相互に平行して実行されてもよいし、全て省略されてもよいし、および/または異なる例示的実施形態間で組み合わされてもよいし、および/または特定の追加動作が実行されてもよい。従って、斯かる代替実施形態も本明細書記載には含まれる。
本明細書で使用される場合、単数形(「a」、「an」、および「the」)は、文脈によって明白に反対の意味が示されていない限り、複数形も包含していることが意図されている。「有する」および/または「有して」と言う用語は、本明細書で使用される場合、記述された特徴、整数、工程、操作、要素、および/または構成要素の存在を特定するものではあるが、1つ以上の他の特徴、整数、工程、操作、要素、構成要素、および/またはそれらのグループの存在または追加を排除するものでないこともさらに理解されるであろう。本明細書で使用される場合、「および/または」と言う用語には、列挙された関連項目の中の1つ以上の任意のあらゆる組み合わせが含まれる。本明細書で使用される場合、「XとYとの間」および「約XとYとの間」などの句は、XおよびYを包含するものであると解釈されるべきである。本明細書で使用される場合、「約XとYとの間」などの句は「約Xと約Yとの間」を意味する。本明細書で使用される場合、「約XからYまで」などの句は「約Xから約Yまで」を意味する。
本明細書で使用される場合、「ハードウェア」には、個別の構成要素、集積回路、アプリケーション特有の集積回路、フィールドプログラム可能ゲートアレイ、または他の適切なハードウェアが含まれてよい。本明細書で使用される場合、「ソフトウェア」には、1つ以上のプロセッサ(この場合、プロセッサには、1つ以上のマイクロコンピュータまたは他の適切なデータ処理装置、メモリ装置、入出力装置、表示器、キーボードやマウスなどのデータ入力装置、プリンターやスピーカーなどの周辺機器、関連駆動機構、制御カード、電源、ネットワーク装置、ドッキング装置、またはプロセッサあるいは他の装置と連携したソフトウェアシステムの制御下に作動する他の適切な装置が含まれる)上の、1つ以上のオブジェクト、エージェント、スレッド、命令行、サブルーチン、個別のソフトウェアアプリケーション、2つ以上の命令行、または2つ以上のソフトウェアアプリケーションで作動する他の適切なソフトウェア構造、あるいはそれ以外の適切なソフトウェア構造が含まれてよい。1つの例示的な実施形態において、ソフトウェアには、オペレーティングシステムなどの汎用ソフトウェア構造で作動する1つ以上の命令行または他の適切なソフトウェア構造、および特定目的ソフトウェア構造で作動する1つ以上の命令行または他の適切なソフトウェア構造が含まれる。本明細書で使用される場合、「連結する」およびその同起源の用語(「連結」、「連結した」など)には、物理的接続(銅伝導体など)、仮想接続(ランダムに割り当てられたデータメモリ装置のメモリ場所を用いた接続など)、論理接続(半導体装置の論理ゲートを用いた接続など)、他の適切な接続、あるいは斯かる接続の適切な組み合わせが含まれる。「データ」と言う用語は、データを使用、運搬、または記憶するための適切な構造、例えば、データフィールド、データバッファ、データ値および送信側/受信側アドレスデータを有するデータメッセージ、データ値を有し、受信システムまたは構成要素がデータを用いて機能を実行できるようにする1つ以上の演算子を有する制御メッセージ、またはデータ電子処理用の他の適切なハードウェアあるいはソフトウェア構成要素を意味していてもよい。
一般的に、ソフトウェアシステムは、プロセッサ上で所定のデータフィールドに応答して所定の機能を実行するように作動するシステムである。例えば、システムは、それが実行する機能および機能を実行するデータフィールドによって規定できる。本明細書で使用される場合、NAMEシステム(NAMEは、通常、システムによって実行される一般機能の名前である)は、プロセッサ上で作動し、開示されたデータフィールド上で開示された機能を実行するように構成されたソフトウェアシステムを意味する。特定のアルゴリズムが開示されていない限り、当業者に知られている、関連データフィールドを用いて機能を実行するための任意の適切なアルゴリズムが、本開示の範囲内に含まれる。例えば、送信側アドレスフィールド、受信側アドレスフィールド、およびメッセージフィールドを包含するメッセージを生成するメッセージシステムは、プロセッサ(すなわち、プロセッサの適切なシステムまたは装置、例えば、バッファ装置またはバッファシステムから送信側アドレスフィールド、受信側アドレスフィールド、およびメッセージフィールドを取得できるプロセッサ、送信側アドレスフィールド、受信側アドレスフィールド、およびメッセージフィールドを適切な電子メッセージフォーマット(電子メールメッセージ、TCP/IPメッセージ、または送信側アドレスフィールド、受信側アドレスフィールド、およびメッセージフィールドを有する任意の他の適切なメッセージフォーマット)にアセンブルできるプロセッサ、およびネットワークなどの通信媒体を通してプロセッサの電子メッセージ処理システムおよび装置を用いて電子メッセージを送信できるプロセッサ)上で作動するソフトウェを含むであろう。当業者は、(本開示の例示的実施形態を説明する意図を有する)上述の開示に基づいて、特定のアプリケーション用の特定のコーディングを提供でき、当業者でない人(例えば、プログラミングまたは適切なプログラミング言語を用いるプロセッサに不慣れな人)にはテュートリアルを提供しないであろう。機能を実行するための特定のアルゴリズムはフローチャートフォームまたは他の適切なフォーマットで提供でき、データフィールドおよび関連機能は操作の例示的順番で説明できるものであるが、順番は適切に再構成可能であり、明示されていない限り、順番に関する限定は意図されていない。
本開示の実施形態の上述の記載は例示目的のために提供されたものである。それが全てではなく、開示されている正確な形態に本開示を限定するものでもなく、上述の教示に鑑みて改良および変形が可能である、あるいは改良および変形が本開示の実践から取得されるかもしれない。実施形態は、当業者が種々の実施形態において、並びに想定される特定の使用に適切な種々の改良を用いて本開示を活用できるように、本開示の原理およびその実際的なアプリケーションを説明する目的で選択および記載されたものである。設計、操作条件、および実施形態の組み合わせ方において、本開示の範囲から逸脱することなく、他の代用、改良、変更、および省略が行われてもよい。斯かる改良および例示的実施形態並びに他の実施形態の組み合わせは、本記載を参照することにより当業者には明白であろう。従って、添付の特許請求の範囲は、斯かる任意の改良または実施形態を包含するものであると解釈されるべきである。

Claims (20)

  1. データ構造を解釈する予測エンジンであって、
    解釈プログラムであって、標的特徴データと他の特徴データとの間の変数依存性の認識に基づいて標的特徴変数と他の特徴変数との間の関係パターンを特定し、少なくとも1つのメタデータ特徴セットおよびそれに関連する結果測定基準を生成するように構成されているものである、前記解釈プログラムと、
    前記少なくとも1つのメタデータ特徴セットおよび前記関連する結果測定基準に基づいて、少なくとも1つの可視化を推奨するように構成された可視化生成プログラムと
    を有する、予測エンジン。
  2. 請求項1記載の予測エンジンにおいて、前記解釈プログラムは、変数選択、相互関連検出、パターン発見、および順位付けを実行するための多段階を含むものである、予測エンジン。
  3. 請求項1記載の予測エンジンにおいて、前記変数依存性は、線形、非線形関係、および非ランダムパターンのうちの1つである、予測エンジン。
  4. 請求項1記載の予測エンジンにおいて、さらに、
    データタイプ、階層データ構造、固有値、欠損値、日付/時間データのうちの少なくとも1つに基づいて、データ構造をソート、分類、およびフィルタするように構成されたデータ準備プログラムを有するものである、予測エンジン。
  5. 請求項1記載の予測エンジンにおいて、前記解釈プログラムは、さらに、統計的検定を実行して相互関連効果が有意であるかどうかを決定するように構成されているものである、予測エンジン。
  6. 請求項1記載の予測エンジンにおいて、前記可視化生成プログラムは、多変数図表および二変数図表のうちの少なくとも1つ若しくはそれ以上を生成するものである、予測エンジン。
  7. 請求項1記載の予測エンジンにおいて、前記可視化生成プログラムは、さらに、発見的規則を適用して少なくとも1つの可視化を推奨するように構成されているものである、予測エンジン。
  8. 予測エンジンを動作させてデータ構造を解釈する方法であって、
    標的特徴データと他の特徴データとの間の変数依存性の認識に基づいて当該標的特徴データと当該他の特徴データとの間の関係パターンを特定する工程と、
    少なくとも1つのメタデータ特徴セットおよびそれに関連する結果測定基準を生成する工程と、
    前記少なくとも1つのメタデータ特徴セットおよび前記関連する結果測定基準に基づいて、少なくとも1つの可視化を推奨する工程と、
    を有する方法。
  9. 請求項8記載の方法において、前記特定する工程および前記生成する工程は、第一の段階、第二の段階、第三の段階、またはそれ以上の段階で実行されるものであり、これらの段階において変数選択、相互関連検出、およびパターン発見、および順位付けが実行される、方法。
  10. 請求項8記載の方法において、前記前記変数依存性は、線形、非線形関係、または任意の非ランダムパターンのうちの1つである、方法。
  11. 請求項8記載の方法において、さらに、
    データタイプ、階層データ構造、固有値、欠損値、日付/時間データのうちの少なくとも1つに基づいて、データ構造をソート、分類、およびフィルタする工程を有する、方法。
  12. 請求項8記載の方法において、さらに、
    相互関連効果が有意であるかどうかを決定するために統計的検定を実行する工程を有する、方法。
  13. 請求項1記載の方法において、さらに、
    多変数図表および二変数図表のうちの少なくとも1つ若しくはそれ以上を生成する工程を有する、方法。
  14. 予測エンジンを動作させてデータ構造を解釈するための、プロセッサによって実行可能なコンピュータ命令のセットを有する非一時的コンピュータ可読記憶媒体であって、
    標的特徴データと他の特徴データとの間の変数依存性の認識に基づいて当該標的特徴データと当該他の特徴データとの間の関係パターンを特定し、
    少なくとも1つのメタデータ特徴セットおよびそれに関連する結果測定基準を生成し、
    前記少なくとも1つのメタデータ特徴セットおよび前記関連する結果測定基準に基づいて、少なくとも1つの可視化を推奨するように構成された、
    非一時的コンピュータ可読記憶媒体。
  15. 請求項14記載の非一時的コンピュータ可読記憶媒体において、さらに、
    第一の段階、第二の段階、第三の段階、またはそれ以上の段階において、前記関係パターンを特定し、前記前記少なくとも1つのメタデータ特徴セットおよび前記関連する結果測定基準を生成するように構成されたコンピュータ命令を含むものであり、これらの段階において変数選択、相互関連検出、およびパターン発見、および順位付けが実行されるものである、非一時的コンピュータ可読記憶媒体。
  16. 請求項14記載の非一時的コンピュータ可読記憶媒体において、前記前記変数依存性は、線形、非線形関係、または任意の非ランダムパターンのうちの1つである、非一時的コンピュータ可読記憶媒体。
  17. 請求項14記載の非一時的コンピュータ可読記憶媒体において、さらに、
    データタイプ、階層データ構造、固有値、欠損値、日付/時間データのうちの少なくとも1つに基づいて、データ構造をソート、分類、およびフィルタするように構成されたコンピュータ命令を含むものである、非一時的コンピュータ可読記憶媒体。
  18. 請求項14記載の非一時的コンピュータ可読記憶媒体において、さらに、
    相互関連効果が有意であるかどうかを決定するために統計的検定を実行するように構成されたコンピュータ命令を含むものである、非一時的コンピュータ可読記憶媒体。
  19. 請求項14記載の非一時的コンピュータ可読記憶媒体において、さらに、
    多変数図表および二変数図表のうちの少なくとも1つ若しくはそれ以上を生成するように構成されたコンピュータ命令を含むものである、非一時的コンピュータ可読記憶媒体。
  20. 請求項14記載の非一時的コンピュータ可読記憶媒体において、さらに、
    発見的規則を適用して少なくとも1つの可視化を推奨するように構成されたコンピュータ命令を含むものである、非一時的コンピュータ可読記憶媒体。
JP2020517214A 2017-10-24 2018-10-24 多段階パターン発見およびビジュアル分析推奨のための予測エンジン Pending JP2021500639A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762576187P 2017-10-24 2017-10-24
US62/576,187 2017-10-24
US16/168,661 US20190122122A1 (en) 2017-10-24 2018-10-23 Predictive engine for multistage pattern discovery and visual analytics recommendations
US16/168,661 2018-10-23
PCT/US2018/057380 WO2019084187A1 (en) 2017-10-24 2018-10-24 PREDICTIVE ENGINE FOR DISCOVERY OF SEVERAL STEPS AND RECOMMENDATIONS FOR VISUAL ANALYSIS

Publications (3)

Publication Number Publication Date
JP2021500639A true JP2021500639A (ja) 2021-01-07
JP2021500639A5 JP2021500639A5 (ja) 2021-12-02
JPWO2019084187A5 JPWO2019084187A5 (ja) 2022-06-07

Family

ID=66170697

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020517214A Pending JP2021500639A (ja) 2017-10-24 2018-10-24 多段階パターン発見およびビジュアル分析推奨のための予測エンジン

Country Status (5)

Country Link
US (1) US20190122122A1 (ja)
JP (1) JP2021500639A (ja)
CN (1) CN111316191A (ja)
DE (1) DE112018004687T5 (ja)
WO (1) WO2019084187A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230069428A (ko) * 2021-11-12 2023-05-19 주식회사 스타캣 데이터의 타입을 자동으로 판별하여 메타데이터를 생성하는 방법 및 이를 위한 머신러닝/딥러닝 모델을 이용한 데이터 타입 판별 장치

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10824694B1 (en) * 2019-11-18 2020-11-03 Sas Institute Inc. Distributable feature analysis in model training system
CN113076450B (zh) * 2021-03-15 2024-03-22 北京明略软件系统有限公司 一种目标推荐列表的确定方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130103677A1 (en) * 2011-10-25 2013-04-25 International Business Machines Corporation Contextual data visualization
JP2014056573A (ja) * 2012-09-11 2014-03-27 International Business Maschines Corporation 初期データ可視化に基づいた、データのための代替可視化の決定方法
JP2014532235A (ja) * 2011-09-26 2014-12-04 マイクロソフト コーポレーション グラフの推奨
US20170061659A1 (en) * 2015-08-31 2017-03-02 Accenture Global Solutions Limited Intelligent visualization munging

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120221589A1 (en) * 2009-08-25 2012-08-30 Yuval Shahar Method and system for selecting, retrieving, visualizing and exploring time-oriented data in multiple subject records
US10303999B2 (en) * 2011-02-22 2019-05-28 Refinitiv Us Organization Llc Machine learning-based relationship association and related discovery and search engines
US9824471B2 (en) * 2012-09-27 2017-11-21 Oracle International Corporation Automatic generation of hierarchy visualizations
US20150220945A1 (en) * 2014-01-31 2015-08-06 Mastercard International Incorporated Systems and methods for developing joint predictive scores between non-payment system merchants and payment systems through inferred match modeling system and methods
US20150278214A1 (en) * 2014-04-01 2015-10-01 Tableau Software, Inc. Systems and Methods for Ranking Data Visualizations Using Different Data Fields
EP3259679B1 (en) * 2015-02-20 2021-01-20 Hewlett-Packard Development Company, L.P. An automatically invoked unified visualization interface
WO2016133543A1 (en) * 2015-02-20 2016-08-25 Hewlett-Packard Development Company, L.P. Iterative visualization of a cohort for weighted high-dimensional categorical data
WO2016148702A1 (en) * 2015-03-17 2016-09-22 Hewlett-Packard Development Company, L.P. Pixel-based temporal plot of events according to multidimensional scaling values based on event similarities and weighted dimensions
US20160342304A1 (en) * 2015-05-19 2016-11-24 Microsoft Technology Licensing, Llc Dimension-based dynamic visualization
US10607139B2 (en) * 2015-09-23 2020-03-31 International Business Machines Corporation Candidate visualization techniques for use with genetic algorithms
EP3188039A1 (en) * 2015-12-31 2017-07-05 Dassault Systèmes Recommendations based on predictive model
US10997190B2 (en) * 2016-02-01 2021-05-04 Splunk Inc. Context-adaptive selection options in a modular visualization framework
US10685035B2 (en) * 2016-06-30 2020-06-16 International Business Machines Corporation Determining a collection of data visualizations
US10409367B2 (en) * 2016-12-21 2019-09-10 Ca, Inc. Predictive graph selection
US20180254101A1 (en) * 2017-03-01 2018-09-06 Ayasdi, Inc. Healthcare provider claims denials prevention systems and methods
US10685175B2 (en) * 2017-10-21 2020-06-16 ScienceSheet Inc. Data analysis and prediction of a dataset through algorithm extrapolation from a spreadsheet formula
US10621762B2 (en) * 2018-05-14 2020-04-14 Virtualitics, Inc. Systems and methods for high dimensional 3D data visualization
US20200012939A1 (en) * 2018-07-07 2020-01-09 Massachusetts Institute Of Technology Methods and Apparatus for Visualization Recommender
US11238369B2 (en) * 2018-10-01 2022-02-01 International Business Machines Corporation Interactive visualization evaluation for classification models

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014532235A (ja) * 2011-09-26 2014-12-04 マイクロソフト コーポレーション グラフの推奨
US20130103677A1 (en) * 2011-10-25 2013-04-25 International Business Machines Corporation Contextual data visualization
JP2014056573A (ja) * 2012-09-11 2014-03-27 International Business Maschines Corporation 初期データ可視化に基づいた、データのための代替可視化の決定方法
US20170061659A1 (en) * 2015-08-31 2017-03-02 Accenture Global Solutions Limited Intelligent visualization munging

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230069428A (ko) * 2021-11-12 2023-05-19 주식회사 스타캣 데이터의 타입을 자동으로 판별하여 메타데이터를 생성하는 방법 및 이를 위한 머신러닝/딥러닝 모델을 이용한 데이터 타입 판별 장치
KR20230154157A (ko) * 2021-11-12 2023-11-07 주식회사 스타캣 데이터의 타입을 자동으로 판별하여 메타데이터를 생성하는 방법 및 이를 위한 머신러닝/딥러닝 모델을 이용한 데이터 타입 판별 장치
KR20230155390A (ko) * 2021-11-12 2023-11-10 주식회사 스타캣 데이터의 타입을 자동으로 판별하여 메타데이터를 생성하는 방법 및 이를 위한 머신러닝/딥러닝 모델을 이용한 데이터 타입 판별 장치
KR102622434B1 (ko) 2021-11-12 2024-01-09 주식회사 스타캣 데이터의 타입을 자동으로 판별하여 메타데이터를 생성하는 방법 및 이를 위한 머신러닝/딥러닝 모델을 이용한 데이터 타입 판별 장치
KR102622433B1 (ko) 2021-11-12 2024-01-09 주식회사 스타캣 데이터의 타입을 자동으로 판별하여 메타데이터를 생성하는 방법 및 이를 위한 머신러닝/딥러닝 모델을 이용한 데이터 타입 판별 장치
KR102623561B1 (ko) 2021-11-12 2024-01-09 주식회사 스타캣 데이터의 타입을 자동으로 판별하여 메타데이터를 생성하는 방법 및 이를 위한 머신러닝/딥러닝 모델을 이용한 데이터 타입 판별 장치

Also Published As

Publication number Publication date
DE112018004687T5 (de) 2020-06-25
CN111316191A (zh) 2020-06-19
US20190122122A1 (en) 2019-04-25
WO2019084187A1 (en) 2019-05-02

Similar Documents

Publication Publication Date Title
US10970634B2 (en) Methods and systems for capturing analytic model authoring knowledge
US20180129959A1 (en) Methods and systems for programmatically selecting predictive model parameters
US20180137424A1 (en) Methods and systems for identifying gaps in predictive model ontology
US11308418B2 (en) Automatic selection of variables for a machine-learning model
US20150213002A1 (en) Personal emotion state monitoring from social media
CN109409533B (zh) 一种机器学习模型的生成方法、装置、设备及存储介质
US20150142707A1 (en) Method and system for clustering, modeling, and visualizing process models from noisy logs
US11341449B2 (en) Data distillery for signal detection
US10671603B2 (en) Auto query construction for in-database predictive analytics
JP2014056573A (ja) 初期データ可視化に基づいた、データのための代替可視化の決定方法
US10210461B2 (en) Ranking data analytics results using composite validation
WO2015048480A2 (en) Method and system for presenting statistical data in a natural language format
US9996209B2 (en) Techniques for representing and comparing workflows
CN113822440A (zh) 用于确定机器学习样本的特征重要性的方法及系统
AU2013202136A1 (en) Data solutions system
EP3115907A1 (en) Common data repository for improving transactional efficiencies of user interactions with a computing device
JP2021500639A (ja) 多段階パターン発見およびビジュアル分析推奨のための予測エンジン
US10699197B2 (en) Predictive analysis with large predictive models
US9251203B2 (en) User interface for predictive model generation
CN110931084B (zh) 从非结构化文本提取和标准化突变基因用于认知搜索和分析
WO2019104304A1 (en) Accelerated simulation setup process using prior knowledge extraction for problem matching
US20200193230A1 (en) Data Insight Automation
US11379887B2 (en) Methods and systems for valuing patents with multiple valuation models
US10529002B2 (en) Classification of visitor intent and modification of website features based upon classified intent
US11630663B2 (en) Compressing multi-attribute vector into a single eigenvalue for ranking subject matter experts

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211022

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211022

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220530

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221108

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230208

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230407

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230627