JP2008522253A - Kストア(KStore)データアナライザ - Google Patents

Kストア(KStore)データアナライザ Download PDF

Info

Publication number
JP2008522253A
JP2008522253A JP2007540129A JP2007540129A JP2008522253A JP 2008522253 A JP2008522253 A JP 2008522253A JP 2007540129 A JP2007540129 A JP 2007540129A JP 2007540129 A JP2007540129 A JP 2007540129A JP 2008522253 A JP2008522253 A JP 2008522253A
Authority
JP
Japan
Prior art keywords
analysis
data
store
paths
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007540129A
Other languages
English (en)
Inventor
マザガッティ,ジェーン・キャンベル
クラー,ジェーン・バン・キューレン
ファン,トニー・ティー
ディジディアン,ヘイグ・シー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisys Corp
Original Assignee
Unisys Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unisys Corp filed Critical Unisys Corp
Publication of JP2008522253A publication Critical patent/JP2008522253A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees

Abstract

データアナライザインターフェイス、関連メモリ内の少なくとも1つの連動ツリーデータストア、実行される少なくとも1つの解析アプリケーションを含む、メモリを有するコンピュータ装置において解析を行って解析結果を得るデータ解析システムである。本発明のデータ解析システムはまた、少なくとも1つの連動ツリーデータストアがデータアナライザインターフェイスにしたがって複数の連動ツリーデータストアから選択される、複数の連動ツリーデータストアを含む。システムは、少なくとも1つの連動ツリーデータストアがデータアナライザインターフェイスにしたがって複数のデータソースから選択されたデータソースから作成される、複数のデータソースを含むことができる。少なくとも1つの連動ツリーデータストアはさらに、静的連動ツリーデータストアもしくは動的連動ツリーデータストアであることができる。少なくとも1つの連動ツリーデータストアは連続的に新しいデータを記録する。

Description

発明の背景
1.発明の分野
本発明は、コンピューティングに関し、とりわけ、Kストア(KStore)連動ツリーデータ構造におけるデータの関係を解析する方法およびシステムに関する。
2.関連技術の説明
全ての産業の企業は、膨大な量のデータをデータベースに定期的に格納する。格納されたデータは、財政支出に関する経済的なデータから実験中に収集された科学的データまで、多岐にわたる。データベースのユーザはそこで、このデータを取り、価値のある情報を検索することを期待して、データベースにクエリを行い、もしくは問い合わせる。今日のデータベースがいかに維持され、用いられるかに基づき、ユーザがデータベースにクエリを行う時に現れる2つのシナリオがある。
第1のシナリオにおいて、ユーザは、どのタイプの情報がデータベースに含まれるかを知り、探しているデータ間の関係を知り、それを探す方法を知る。第1のシナリオは、最もしばしば、データベースにおける、結果を出すことで知られているシングル解析の適用により特徴づけられる。第1のシナリオの実施例は、ユーザがたとえば、金融機関による利益率増加もしくは細胞膜にわたる化学拡散の変化を示す化学企業の研究データなどの、グラフもしくはチャートを作成しようと望む場合である。解析が適用される時に生じる出力は、既知のデータ間の既知の関係の既知のクエリへの答えである。
第2のシナリオは、ユーザが、データベースもしくは複数のデータベース内のデータ間に、もしあれば、どの関係が存在するかを知らない時に生じる。ユーザは、これらの未知の関係に基づいて質問に答えを見つけるという手強いタスクを提示される。これにより、ユーザは、彼らがデータについて何を知るかではなく、むしろデータについて何を知らないかに、焦点を合わせる必要がある。ユーザがデータマイニングもしくはデータベース内の知識発見(Knowledge Discovery in Database: KDD)と呼ばれる処理を用いるのは、この第2のシナリオにおいてである。解析の適用を通じてのデータベースの検索は、集められるデータについてのユーザの理解を強化する。
データマイニングとは、それによって、データベース保管所に集められ格納された生データがシングルもしくはマルチの解析を用いて解析され、データ間の以前は未知の関係もしくはパターンを見つけられる処理である。クエリの結果は、ユーザがそれについて知るデータのパターンではなく、むしろ結果は、ユーザがそれについて知らないパターン、もしくはしばしば複数のパターンである。シングルもしくはマルチの解析のデータベースへの適用は、理論的には数千のパターンを生成することができるが、ユーザは有用な、もしくは興味のある知識を含む関係のみを検索したいであろう。ユーザがデータベースを検索し、興味のあるパターンを見つけると、ユーザはそこで、適用された解析の検索フィールドを限定し、データマイニングから得られた知識の焦点を特定の変数に合わせることができ、データベースに含まれる知識の理解の特異性もしくは正確さをさらに増大させる。
現在の最先端では、知識についてデータベースを検索する処理は、当業者にとって一般的であり、既知である。まず、データマイナアプリケーションが所与のデータベースに適用される前に、ユーザは、データマイナがどのタイプのデータベースに適用されるかを決定する。データベースの可変タイプの実施例は、保管所などの静的データベース、もしく
はリアルタイムのデータサンプリングに用いられる動的データベースであってよい。ユーザはそこで、どのデータマイナアプリケーションが用いられることができるか、また、興味のない、もしくは不要なパターンの検索を防ぐために最適化が必要であるかを決定する。現在のデータマイナアプリケーションが彼らの特定の状況について存在しないとユーザが決定する場合、ユーザはそこで、彼/彼女のニーズにあったデータマイナアプリケーションを作成する。データマイナはそこで、データベースに、ユーザによって予測されるように可変解析を適用し、そこに興味のある関係を見つけようとする。
現在の技術では、解析の適用は、標準の操作である。まず、ユーザは既存のデータベースを用いるか、もしくは生データを有する新しいデータベースを「蒔く」かしなければならない。そこで、ユーザは、彼の特定のニーズを解決するためにどのタイプのデータが必要とされるかを、決定しなければならない。ユーザはそこで、データベースを検索するスクリプトを考案して実施して必要なデータを検索するか、ユーザは、外部ソースによって既に準備された決まりきったスクリプトを実施するかである。関係データを含まない生データしか投入されていないというデータベースの性質により、解析が適用されるためには、スクリプトはしばしば、検索されたデータを投入されるであろう表のセットアップを要求する。データベースが以前に準備された解析について正しい形状でない場合、データベースは、キーデータがデータマイナによって検索されたインデックスにない場合、再構築される必要があるであろう。一旦、表もしくは複数の表が構築され、検索されたデータが投入されると、スクリプトは情報を調べ、解析によって実施されるアルゴリズムを用いて出力を返す。
大量の複雑なデータを検索する方法は、技術的に全く一般的なことである。たとえば米国特許出願第2004/0010505号「領域固有の解析アプリケーションにおけるデータマイニング自動化の方法およびシステム」は、既定のデータマイニングアルゴリズムを用いてデータスキームからデータを検索する方法を教示する。
米国特許出願第2005/0069863号「臨床診断についての遺伝子表示データを解析するシステムおよび方法」は、見本を分類に分類する分類子を構築する方法、コンピュータプログラム、コンピュータシステムを教示する。分類子はモデルである。各モデルは、複数の検定を含む。各検定は、特定の細胞構成要素の特徴の間の数学的関係(たとえば比率)を特定する。
米国特許出願第2002/0077790号「データマイニングシステムにおけるガウシアン混合モデルを用いた小売り取引の解析」は、ガウシアン混合モデルを用いてデータを解析するコンピュータ実行のデータマイニングシステムを教示する。データはデータベースからアクセスされ、そこで期待―最大化(EM)アルゴリズムが、コンピュータ実行データマイニングシステムにおいて行われ、アクセスされたデータについてガウシアン混合モデルを作成する。EMアルゴリズムは、アクセスされたデータに適合する確率分布の混合を計算することにより、データにおけるクラスタリングを説明する出力を生成する。
解析の現在最先端には、ひいては現在のデータマイニングアプリケーションには、いくつかの限界がある。まずこれは、解析を実施するのに過度の人材を要するであろう。データは集められ、生の形状でデータベースに格納される。データベースが、データベースを検索する決まりきった解析に必要な形状でインデックス化されていない場合、データベース管理者はデータベースを再構成する必要があるか、管理者は解析が特定のデータベースにおいて機能するようこれを修正する必要があるかのいずれかである。このことは、データベース管理者が、ユーザのデータベースがどのように作成されるかを比較し、それを決
まりきった解析が適用できるような方法に変質させる必要があるため、もしくは、企業が解析スクリプトを、これが彼らの特定のデータベースに適用できるように書き換えるプログラマのヘルプを確保する必要があるため、もしくはプログラマが必要とされる変更量に応じて全く新しい解析を書く必要があるであろうため、人材を必要とする。
次に、有用なコンピュータリソースは、計算することから離れ、解析のアプリケーションに再割り当てされる。データベースが特定の解析に適用するのに必要とされる形式にインデックス化されない場合、データベースは再インデックス化されるか、全く再構築されるかする必要があるだろう。解析の適用はしばしば、表の生成を要求する。表が、データベースが新しいデータを含むという決定に基づいて更新される必要がある場合、解析は表に、新しいか更新されたデータのみならず既に検索されたデータも含む全く新しい一連のデータを再投入しなければならない。加えて、異なる解析の続く適用が、既存の表に含まれない情報を要求する場合、新しい表が作成される必要があるか、もしくは既存の表がこの新しい解析について要求されるさらなるデータによって拡張される必要があるかであろう。以前の表が過度の情報を含む場合、もしくは表が新しいデータで更新される、もしくはリフレッシュされる必要がある場合、システムはこれらの表に、以前の解析から持ってこられた追加のデータを不必要に投入する必要があろう。
ここで引用された全ての文献は、参照することによりその全体が本書に援用される。
発明の簡単な概要
解析に関連するメモリを有するコンピュータ装置において、解析を行って解析結果を得るデータ解析システムであって、データ解析システムはデータアナライザインターフェイス、コンピュータ装置の関連メモリ内の少なくとも1つの連動ツリーデータストア、および、コンピュータ装置によって実行される少なくとも1つの解析アプリケーションを含む。本発明のデータ解析システムはまた、複数の連動ツリーデータストアを含み、少なくとも1つの連動ツリーデータストアはデータアナライザインターフェイスにしたがって複数の連動ツリーデータストアから選択される。システムは、複数のデータソースを含むことができ、少なくとも1つの連動ツリーデータストアはデータアナライザインターフェイスにしたがって複数のデータソースから選択されるデータソースから作成される。少なくとも1つの連動ツリーデータストアは、静的連動ツリーデータストアもしくは動的連動ツリーデータストアであってよい。少なくとも1つの連動ツリーデータストアは、新しいデータを連続的に記録する。
少なくとも1つの連動ツリーデータストアは、データの記録を含み、少なくとも1つの連動ツリーデータストアは、データの記録の更新を連続的に受信する。少なくとも1つの解析アプリケーションがデータ解析インターフェイスにしたがって複数の解析アプリケーションから選択される。少なくとも1つの解析アプリケーションは、静的連動ツリーデータストア、もしくは動的連動ツリーデータストアを解析する。少なくとも1つの解析アプリケーションは、和解析などの会計/数学的機能カテゴリ解析、統計的機能カテゴリ解析、分類機能カテゴリ解析、関係機能カテゴリ解析、可視化機能カテゴリ解析、統計的機能カテゴリ解析、メタデータ機能カテゴリ解析、もしくは任意のその他のさらなる機能カテゴリ解析を含む、任意のタイプの解析であってよい。データアナライザインターフェイスは、少なくとも1つの管理アプリケーションへのアクセスを提供する。
解析に関連したメモリを有するデータ処理装置において解析を行って解析結果を得るデータ解析方法は、データ処理装置についてデータアナライザインターフェイスを提供するステップと、少なくとも1つの連動ツリーデータストアをデータ処理装置のメモリに格納するステップとを含む。少なくとも1つの解析アプリケーションが、少なくとも1つの連
動ツリーデータストアにしたがって実行される。データ処理装置の関連するメモリは、複数の連動ツリーデータストアをさらに含み、少なくとも1つの連動ツリーデータストアは、複数の連動ツリーデータストアからデータアナライザインターフェイスにしたがって選択される。データ処理装置は、複数のデータソースをさらに含み、少なくとも1つの連動ツリーデータストアは、複数のデータソースから選択されたデータソースからデータアナライザインターフェイスにしたがって作成される。データ処理装置は、複数の解析アプリケーションを含み、少なくとも1つの解析アプリケーションをデータアナライザインターフェイスにしたがって複数の解析アプリケーションから選択するステップをさらに備える。
Kストアデータアナライザは、Kストア解析と呼ばれる独特な一連の解析の適用と組み合わせて、データをモデル化するKストアを用いることにより、従来の関係データベースを用いるデータ解析もしくはマイニングの従来技術に関連する固有の限界を克服する。これらのKストア解析は、知識ストア(Kストア)連動ツリーデータ構造に含まれる情報を活用する。米国特許出願第10/385,421号「連動ツリーデータストアにデータを格納し、アクセスするシステムおよび方法」および第10/666,382号「連動ツリーデータストアにデータを格納し、アクセスするシステムおよび方法」に開示されるように、Kストアデータ構造は、取引のデータと格納される(関係)データとの間の区別を排除する。
従来技術における限界の多くが克服されるのは、Kストア構造およびこの構造のために特別にデザインされた解析の使用の、この組み合わせを通じてである。第1に、人材コストが削減される。Kストアエンジンが、静的データ、もしくは以前に投入された既存のデータベースからのデータ、もしくは適時に投入される動的データに適用される時、Kストアエンジンは全ての関係をデータエントリ上に作成する。したがって、Kストアエンジンが解析アプリケーションに先立って既にタスクを行っているため、連動ツリーデータストア管理者もしくはユーザは、データが特定の方法でセットアップされていることを検証する必要がない。また、Kストアエンジンが特定のルールに基づいて一貫した方法でデータをモデル化するため、連動ツリーデータストア管理者もしくはユーザは、他ができない一方で一定の解析がデータに適用できるかどうか決定する必要がない。解析はKストアの構造を用いるため、さまざまな組み合わせでの多様な解析が、必要であれば、オリジナルのデータ入力に関わらず、Kストアに適用されることができる。
第2に、コンピュータリソースが、表作成や過度のデータ更新などの処理のために不必要に用いられない。Kストアデータアナライザは、Kストアに既に含まれる関係情報を活用する解析を実施し、従来技術の場合のように表を作成してその情報を決定する必要を除去する。それによりKストア解析がデータを解析する処理は、各解析に表を生成する必要なく、多様な解析の連動ツリーデータストアへの適用を許可する。さらに、表が生成されないため、複数の解析が異なるデータを必要とする時に、ユーザがデータセットに複数の解析を用いたい場合に、有用なコンピューテイングリソースが、表に過度のデータを再投入するために必要とされない。KストアでKストア解析を用いるKストアデータアナライザは、Kストアエンジンが、既にKストア構造を学習し、データ間の全ての可能な関係に基づいて発展させているため、最小のリソースのみを用いる。
本発明が従来技術における限界を克服するため、Kストアデータアナライザは、従来技術のデータマイニング技術においては見られなかった柔軟性と機敏性のレベルをユーザに提供する。全ての解析がKストアエンジンにより情報の同じモデル化において機能するために最適化されるため、多様な組み合わせでの多様な解析が同じデータに表を生成する必要なく適用されるのみならず、同じ解析がまた、多様なKストアに適用されることができる。Kストア解析はまた、構造が投入される間に作動することができるクエリを実施する
柔軟性を提供する。
Kストア解析はまた、人材支援における柔軟性を提供する。Kストア管理者は、データの構造もしくはその中に含まれる情報の理解をわずかしか、もしくは全く必要としないであろう。Kストア解析は、連動ツリーデータストアに投入する一方で、Kストアエンジンが生成する知識に基づいてデータを検索し、解析を実施する。管理者は、任意のKストア解析を用いることができるために、データがKストア構造に配置されたことのみを知る必要があるだろう。
本発明は、以下の図面と併せて説明され、図面においては同様の参照番号が同様の要素を示している。
発明の詳細な説明
ここで図1Aを参照すると、本発明のシステムおよび方法を実行するのに適したKストア環境20の好適な実施形態が示される。「K」とも呼ばれるKストア14aは、Kエンジン11aを手段として、Kストア環境20の残りによってアクセスされる。とりわけ、Kエンジン11aは、データソースアプリケーション8を用いる学習エンジン6、およびアプリケーション10と連動するAPIユーティリティ5と、通信することができる。データソースアプリケーション8およびアプリケーション10の選択は、以下により詳細に説明されるように、データアナライザ12のコントロール下で選択されるであろう。
Kストアエンジンがデータストリームのパーティクルを処理する時、Kストアエンジンは、2つの情報の間の関係に基づきノードを生成することによって、イベントを記録するであろう。2つの情報を接続せずむしろ関係づける、もたらされるノードは、一方のポインタはケースであり、他方は結果である、2つのポインタを含むであろう。同じ2つの情報の間の同じ関係が現れる回数につれ、もしくはより正確には同じノードが学習操作の間に何度も横断される回数につれ、Kストアエンジンはカウンタフィールドを増大させ、同じ関係がKストアに記録された回数を示す。Kストアエンジンは、ポインタを構築し、ノードのカウントを更新するのに加え、また各ノードについて2つのポインタリストをKストア内連動ツリーデータストアに構築するであろう。第1のリストは現在のノードをケースノードとして参照する他のノードへのポインタを含むであろう。他方のポインタリストは、現在のノードを結果ノードとして参照する他のノードへのポインタを含むであろう。
Kストアに表される全てのコンテキスト内の全ての値の全ての可能なカウントを検索することが可能であるため、Kストアは任意の可能な解析、記述、もしくは予測を、静的に、もしくはリアルタイムに、サポートすることができる。したがって、Kストアデータアナライザによって実施されるKストア解析は、知識を含む有用なパターンを、静的もしくは動的なKストアのいずれかからの任意の解析技術を用いて、返すであろう。Kストアデータアナライザは、ノードに含まれるポインタおよびポインタリストからの知識を用いてデータについての関連する情報を検索し、カウントフィールドを用いてこれらの関係の統計的解析を行う。加えて、連動ツリーデータストア内に捕捉されるイベントの配列は、データの解析のためにまた用いられるであろう。
Kストアデータアナライザは、バッチ環境もしくはインタラクティブ環境のいずれかで存在するであろう。Kストアアナライザが用いる、解析、ユーティリティ、およびデータソースを含む多様なKストアアプリケーションがまた、特定のKストア環境の要件に応じて、バッチもしくはインタラクティブモードのいずれかで存在するであろう。好適な実施形態において、Kストアデータアナライザはインタラクティブ環境で用いられ、少なくとも2つのタイプのグラフィカルユーザインターフェイス(GUI)を用いて、ユーザが連
動ツリーデータストアでデータマイニング操作を行うことを支援するであろう。
第1のタイプのGUIは、ユーザにとって現在可能である全ての解析と同様、データソースの定義を含む、管理機能へのアクセスを提供するKストア管理インターフェイスである。このインターフェイスは、アプリケーション10から特定の解析アプリケーションを、データソースアプリケーション8から特定のデータソースを、選択することを含む、データアナライザ12の機能を行う。加えて、インターフェイスは、たとえばKストアデータ構造について持続性を提供する保存/復元ルーティンを含むであろう、Kストアアプリケーション10における解析以外の機能へのアクセスを提供するであろう。
第2のタイプのGUIは、アプリケーション10に示されるように、ユーザ選択の解析アプリケーションについて特定のインターフェイスを提供する。解析インターフェイスについてのフォーマットは、どの解析が選択されたかに依存し、とりわけ現在用いられる焦点変数、任意の制約、要求される結果、およびKストアが何を検索されるかを含む、多様なフィールドもしくは指示を含むであろう。
既述のフィールドおよび指示に加え、ユーザが分類し、結果の知識を所望の特異度に狭めることを支援するため、解析が選択可能な制約リストおよび焦点変数を示すであろう。制約リストは、クエリが処理するであろう記録を限定する変数である制約を含み、一方で焦点は一般的に、通常、一連の制約によって定義されるコンテキスト内にある関心の対象である変数値である。たとえば、ベーシックなクエリは販売された装置の総数を返すことができるかもしれない。解析される記録の総数を減少させるため、ユーザは、セールスマンによって販売された装置の総数を決定するべく、Kストアを特定のセールスマンによって制約することができるかもしれない。前述の実施例において、焦点は販売された装置の数であり、制約は特定のセールスマンであろう。
Kストア解析
Kストア解析は、Kストアエンジンによって記録された情報を用い、この情報を充分に利用する特別な解析スクリプトを実施する。Kストア解析は、変数発現の数やその変数とKストアの残りのデータとの関係などの、Kストアに含まれる情報を用いる。
ここに説明される解析が、本発明の精神と範囲と調和することが可能である全ての解析を包括するものであることを意図しないことが理解されるであろう。むしろ、これらはただ、本発明にしたがって行われるであろう解析の代表であるよう意図される。
Kストア解析は、焦点および可能であれば1以上の制約をKストアに適用することにより、Kストアに対して実施され、結果を得るであろう。Kストア解析によって得られた結果は、リクエストされた結果に基づく。結果は、数値もしくはパーティクルシーケンス値などの値を含む。Kストアによって値が記録される順序はそれ自体、情報であるため、シーケンス情報はまた、解析によって得られるであろう結果である。解析によるシーケンス情報の使用の実施例は、バンキング取引のタイミングの解析である。
Kストア解析は、任意の数の機能カテゴリにグループ化されるであろう。会計/数学的機能カテゴリは、「和」、「個別カウント」、「データ集約」などの解析を含む。統計的機能カテゴリは、「単一変数予測」などの解析を含む。分類機能カテゴリは、「コンテキスト分類」、「ベイズ分類」、「動的デシジョンツリー」などの解析を含む。関係機能カテゴリは、「関連ルール」などの解析を含む。可視化機能カテゴリは、「チャートジェネレータ」および「フィールドチャート」などの解析を含む。メタデータ機能カテゴリは、「制約マネージャ」などの解析を含む。加えて、解析は、ユーザが便利であると感じるであろう任意の基準に基づいたカテゴリに分けられる。たとえば、ユーザは、薬物研究の結
果を解析するユーザにどちらかといえば便利である解析のカテゴリを定義するであろう。ユーザはまた、アミノ酸を研究するユーザにどちらかといえば便利である解析のカテゴリを定義するであろう。したがって、このような機能カテゴリの数は無限である。機能カテゴリおよび各機能カテゴリにおける解析は、図1Aのデータアナライザ12によって格納されてよい。
Kストアユーティリティ
機能解析に加え、Kストアデータアナライザは、多様なツールおよびユーティリティへのアクセスを提供するであろう。これらのユーティリティは、機能の中で特に、データをロード、保存、復元、もしくはシミュレートするために、もしくはKストアに関するGUIアプリケーションを発展させるために、用いられるであろう。
以下の討論において、標本解析およびユーティリティは、定義され、実施例がスクリーンショットと共に用いられ、これらの解析のそれぞれがいかに達成されるかが示されるであろう。実施例は、実施例の包括的なリストであるよう意図されないが、いかにKストア解析がKストア内の情報と連携してデータを解析するかを示すべく、含まれる。
ここで図1Bを参照すると、連動ツリーデータストア250が示される。連動ツリーデータストア250は、Kストアデータアナライザシステム20内に提供されるであろうKストア14a(図1A)の図表示である。連動ツリーデータストア250の構造および機能は、ほぼ、同時係属の、2003年9月19日出願の米国特許出願第10/666,382号および2004年6月29日出願の米国特許出願第10/879,329号に教示されるとおりである。
以下の表に示されるデータ記録などのデータ記録は、連動ツリーデータストア250にインポートされることができる。表に示されるようなデータ記録からK14a(図1A)などのKストアを構築する方法は、前述の特許出願にもまた教示される。
Figure 2008522253
したがって、表の15のデータ記録は、示されるようにデータストア250に格納され
ることができる合計15の取引についての情報を説明する。データストア250の15のデータ記録の存在は、データストア250内のすべての最終結果ノードのカウントの和である思考終了ノード350のカウントによって示される。ここで「取引」の用語は、表のデータ記録に示される試用および完全な販売の両方を含むということが理解されるであろう。
連動ツリーデータストア250内の表の15の取引を表すパスは、「ビル」サブコンポーネントノード252を含むKパス、および「トム」サブコンポーネントノード300を含むKパスを含む。「ビル」パス262、278、290は、BOTノード340からビルサブコンポーネントノード252を経て伸びるパスである。「トム」パス310、328は、BOTノード340からトムサブコンポーネントノード300を経て伸びるKパスである。
連動ツリーデータベース250を用いて、たとえば、Kパス262を参照することで、ビルが火曜日にペンシルヴェニアで6つの販売取引を有したことを決定することが可能である。さらに、Kパス278を参照することで、彼が月曜日にニュージャージーで1つの販売取引を有したことを決定することが可能である。加えて、連動ツリーデータストア250内で「販売」が用いられた回数を決定することにより、ビルまたはトムによって販売されたアイテムの全体数を決定することが可能である。この情報は、販売基本ルートノード346のカウントを得ることによって決定されることができる。販売基本ルートノード346のカウントは9である。
Kストアユーザインターフェイス
図2を参照する。図2は、ユーザがKストア解析およびユーティリティを用いるのにアクセスするであろう、Kストア管理メイン画面710のスクリーンショットである。画面の左手側のツリーパネルは、どのKストアがアクセスされるかを選択するのに用いられるであろう。一連の解析を見るには、ユーザは「解析ビュー」タブ711もしくはシンプルビュータブ713を選択するであろう。本特許の以下で論じられる全てのKストア解析は、このメイン画面からリンクされるであろう。ユーザは任意のネーム/リンクをクリックして、対応する解析をユーザが用いることを可能にする機能画面を開くことができる。たとえば、「単一変数予測」ネーム/リンク712をクリックすると、単一変数予測解析をユーザが用いることを可能にするであろう機能画面が開くであろう。
Kストア解析についての以下の討論において、ユーザはメイン画面710から開始するであろう。
会計/数学的機能カテゴリ
多くの解析が、データに対する基本的な数学関数、たとえばカラムを合計することを提供する。解析のこの機能カテゴリは、「カラム合計、「個別カウント」、「データ集約」の解析を含むであろう。それぞれは以下に論じられる。
カラム合計
「カラム合計」解析は、データセットの数値の和を返すであろう。任意で制約が加えられてデータセットを特定の記録に縮小して合計する。たとえば、カラム合計解析は、トムがいくつのソファを販売したかを計算し、もしくはデータセットが販売量を含む場合、解析は、ビルなどの特定の販売員についての販売量の全体を計算するであろう。ビル基本ルートノード(図示されない)のasResultリストのノードには、ビルサブコンポーネントノード252が続き、ビルを含む一連のKパス、パス262、278、290を決定する。ビルのKパス262、278、290の最終結果ノード264、280、292へ横切ることで、これらのKパスのうちの任意のものがまた値「販売」を含むかどうかの
決定がなされる。したがって、Kパス262、278が値「販売」を含むという決定がなされる。対応する最終結果ノード264、280は、それぞれカウント6と1を有する。加えて、ビルのKパス262、278はまた、量フィールドについてそれぞれ値100と103を含む。したがって、量についての「カラム合計」解析は、(100×6)+(103×1)もしくは703である和を返す。
図3を参照する。図3は、Kストアカラム合計ユーザインターフェイス720のスクリーンショットを示す。この実施例において、ユーザは、週の所与の日について販売の和を計算するであろう。これを行うために、ユーザはカテゴリもしくはカラムを選択し、ステップ1において、カテゴリの名前「量」を選択することで合計する。ユーザはそこで、まずカテゴリ「曜日」722を、次いで値「月曜日」723を選択することにより、任意でデータを制約するであろう。ユーザはそこで、「追加」ボタン724を押すことができる。制約「曜日/月曜日」は、「制約リスト」725に表示される。ユーザはそこで、「和」ボタン726を押すことができる。結果912は結果ボックス728に表示され、計算についての詳細は「詳細」タブ727の下に表示されるであろう。
個別カウント
「個別カウント」解析は、所与のデータセットにおける個別値の数を返す。個別カウントでは、重複値はカウントされない。たとえば、所与の例示的なデータセットにおけるカテゴリもしくは焦点フィールド「販売員」について、2つの値「ビル」と「トム」しかない。「ビル」と「トム」の数百の発現があるであろうが、重複はカウントされない;焦点「販売員」についての2つの個別値のみが返される。
図4を参照する。図4は、Kストア個別カウントユーザインターフェイス730のスクリーンショットを示す。個別カウントを決定するために、ユーザはカテゴリ、この実施例においては「販売員」731を選択する。次のステップは選択的である。この実施例において、ユーザは、値、販売733を有するカテゴリ取引732によって、販売員データをさらに制約することを、それらを選択し追加ボタン734を押すことで、選ぶ。「取引/販売」735は、「制約リスト」ボックス内に表示される。ここで留意すべきは、ユーザは既に制約「州/ニュージャージー」736を入力したことである。したがって、本実施例において、ユーザは、ニュージャージー州でアイテムを販売した異なる販売員のカウントを知りたい。ユーザは「カウント」ボタン737を押すことで続ける。結果は結果ボックス739に、「詳細」タブ738の下で利用可能な計算についてのさらなる情報と共に表示される。本実施例において、1つの個別値739しかなかった、もしくは言い方を変えれば、ニュージャージーには「販売」取引を有する1人の販売員「ビル」しかいなかった。
データ集約
データ集約は、統計的解析などの目的のため情報が集められ、要約(もしくは集約)形状で表現される、任意の処理である。たとえば、毎日の販売データは、月のもしくは年の全量を計算するため集約される。Kストアデータ集約解析フィールドは、記録内のアイテムの共存を見つけ、また、ユーザ定義のクエリに示すように、データに数計算を行う。好適な1実施形態において、これは合計計算を行う。本発明の好適な代替実施形態において、これはとりわけ、平均化、個別カウント、個別カウント割合、個別カウント率、記録カウント、記録カウント割合、記録カウント率などの計算を行うであろう。Kストアデータ集約解析の構造および方法は、特許出願第TN406号「Kストアに適応したデータ集約ユーザインターフェイスおよび解析」に説明された。
当業者により、会計/数学的機能カテゴリにおける任意の数のさらなる解析が、本発明の精神と範囲とに沿って、ユーザによって定義されるということが理解されるであろう。
たとえば、多くのこのような解析が付録において説明される。当業者は、付録にリストアップされていようとなかろうと、会計/数学的機能カテゴリにおける他の解析によって行われる操作を、決定することができる。当業者はそこで、このようなプログラムが他の種類のデータベース技術の明細書にしたがって書かれるのと同じ方法で、Kストア技術の明細書にしたがってプログラムを書いて解析を実施することができる。
統計的機能カテゴリ
統計的計算を行う解析は、このカテゴリに該当する。この機能カテゴリは、解析「単一変数予測」を含む。
単一変数予測
単一変数予測解析は、焦点変数の確率を返す。データセットにおける変数のうち任意の1つは、焦点変数として示されるであろう。焦点変数の確率は、記録の全数にわたって焦点変数を含む記録の数に等しい。予測の範囲は、どの記録が解析のために分離されるかを決定する、通常は1以上の値である制約によって、任意で限定されるであろう。この場合、焦点変数の確率は、一連の制約された記録における記録の全数にわたって、焦点変数を含む記録の数と等しい。
上記のデータ記録の表を用いて、Kストアエンジンをデータに適用すると、Kストアは、表の15の全記録において変数「販売」の9つの発現があることを学習したであろう。したがって、焦点変数として「販売」を選択することで、それが全ての記録において現れる確率は9/15もしくは60%である。ユーザが「ビル」を制約変数として選択すると、「ビル」を含む記録のみが考慮される。Kストアエンジンをデータに適用すると、Kストアは、「ビル」の全部で10の発現において「販売」の7つの発現があることを学習したであろう。したがって、変数「ビル」によって制約される焦点変数「販売」の確率は、7/10もしくは70%である。データセットは複数の変数によって制約されることができる。上記のデータセットを取ると、「ビル」と「火曜日」のコンテキストにおいて、「販売」の確率は100%である。このタイプの解析を用いるいくつかの実施例は、単一変数の確率を見つけること、もしくは動向分析において時間を制約として用いる一連の単一変数予想を用いることである。
図5Aを参照する。図5Aは、Kストア単一変数予測ユーザインターフェイス740のスクリーンショットを示す。ユーザは、ドロップダウンボックスで名前をクリックすることにより、カテゴリ「販売員」741を選択する。そしてユーザは、「ビル」742を「値」ドロップダウンボックスから選択することで、焦点変数を選択する。
図5Bを参照する。図5Bは、Kストア単一変数予測ユーザインターフェイス740の同じスクリーンショットを示す。制約を加えるべく、ユーザは、ステップ2において名前をクリックすることにより、カテゴリ「取引」743を選択する。ユーザはそこで、「値」から制約値「販売」744を選択し、「追加」ボタン745を押す。「取引/販売」746は、「制約リスト」ボックス内に表示される。最終的に、ユーザは「予測」ボタン747を押す。結果である、77.78%(7/9)が、結果ボックス749に現れる。結果に関するさらなる詳細は、詳細ボックス748に現れるであろう。本実施例において、販売員「ビル」について取引「販売」について予測される解析は、77.78%である。
当業者により、統計的機能カテゴリにおける任意の数の追加解析が、本発明の精神と範囲に沿って、ユーザによって定義されるということが理解されるであろう。たとえば、多くのこのような解析が付録において説明される。当業者は、付録にリストアップされていようといまいと、統計的機能カテゴリにおける他の解析によって行われる操作を決定することができる。当業者はそこで、このようなプログラムが他のタイプのデータベース技術
の明細書にしたがって書かれることができるのと同じ方法で、Kストア技術の明細書にしたがった解析を、プログラムを書いて実施することができる。
分類機能カテゴリ
この機能カテゴリは、解析「コンテキスト分類」、「ベイズ分類」、「動的デシジョンツリー」を含み、これらのそれぞれは以下に説明される。分類は、ビジネス決定を行うのに用いられる重要なデータクラスを説明するモデルを抽出するのに用いられることができるデータ解析の形状である。たとえば、分類解析は、銀行ローン適用が安全か危険かをカテゴライズするのに用いられるであろう。
コンテキスト分類
コンテキスト分類解析は、コンテキスト内の標本Xの分類を返す。データセットは、標本内の全ての変数を含む記録のみが考慮され、分類フィールドの最も高い確率変数が選択されるよう、標本変数によって制約される。この解析は、特定のコンテキストのインスタンスがない場合、いかなる値も返さないであろう、したがって、決定が要求される時に用途が限られている。変数は、単一変数予測解析と同様の方法で選択される。上記の例となる記録セットを用いて、標本Xが「ビル」+「月曜日」であった場合、セット内には4つの記録があったであろう。「販売」の確率は、1/4であり、トアイアルの確率は3/4であった。したがって、標本Xの分類は「試用」であった。このタイプの解析は、クレジットリスク解析、チャーン分析、顧客維持などのクエリに用いられることができる。
図6Aを参照する。図6Aは、Kストアコンテキスト分類ユーザインターフェイス750のスクリーンショットを示す。本実施例において、ユーザについての第1のステップは、ドロップダウンで名前をクリックすることで、カテゴリ「取引」751を選択することである。ステップ2はユーザにとって、カテゴリ「販売員」752を選択することである。カテゴリ「販売員」内の利用可能な値は、「ビル」753を含む。「ビル」753が選択されることができ、「追加」ボタン754が押されることができる。「販売員/ビル」は「標本データセット」ボックス755に表示される。
ここで図6Bを参照する。図6Bは、コンテキスト分類解析を行う処理の間のKストアコンテキスト分類ユーザインターフェイス750の他のスクリーンショットを示す。ユーザはさらに、「曜日」756と「月曜日」757を選択し、「追加」ボタン758を押すことにより、標本をさらに制約することができる。標本は定義され、「標本データセット」ボックス759内に表示される。ユーザはそこで、「分類」ボタン760を押すことにより、ステップ3を行う。結果は、結果ボックス762に表示され、このインスタンスでは「試用(75.00%)」である。結果について利用可能なさらなる情報は、「詳細」タブ761の下に見られるであろう。上記に説明されたように、「販売」の確率は1/4であり、試用の確率は3/4であったであろう。したがって、標本Xの分類は「試用」であったであろう。
ベイズ分類
ベイズ分類は、2つの確率モデルの形で提供されることが知られている:ナイーブおよびフルである。このKストア解析はナイーブベイズ確率モデルを用いる。ナイーブベイズは、分類から判断して、データから個々の特性値の確率を推定し、次いで新しい記録を分類するのにこれらの確率を用いることを可能にする技術である。ナイーブベイズ分類は、シンプルな確率的な分類子である。ナイーブベイズ分類子は、しばしば実際には意味を持たない強力な独立仮定を組み込む確率モデルに基づき、したがって(意図的に)ナイーブである。確率モデルはベイズの定理(Thomas Bayesによって認められる)を用いて派生する。これらのナイーブな設計および一見したところ過度に単純化された仮定にもかかわらず、ナイーブベイズ分類子はしばしば、診断および分類タスクなどの多くの
複雑な実世界の状況において、よりよく機能する。
ナイーブベイズ分類解析は、ベイズの定理を用いて標本Xの分類を返す。たとえば、ユーザが、標本データ(販売と試用)のカラム4に示されるクラス変数を用いて標本X(トム、火曜日)を分類したかった場合、ユーザはX変数およびクラスを選択したであろう。Kストアエンジンをデータに適用すると、Kストアは各変数の発現の数および変数と他の変数との関係を学習したであろう。解析は予備計算を行う:
Figure 2008522253
もたらされるP(X|販売)P(販売)=.15×.6=.09およびP(X|試用)P(試用)=.0005×.4=.00002。したがって、ナイーブベイズ分類子はX=「販売」を予測する。「トム」と「火曜日」を考慮して、アイテム「販売」の確率は、「試用」のアイテムについてよりも高い。
図7Aを参照する。図7Aは、Kストアベイズ分類ユーザインターフェイス770のスクリーンショットを示す。ユーザが行う第1のステップは、カテゴリ「取引」771を選択することである。標本X(トム、火曜日)を分類するべく、ユーザはそこでカテゴリ「販売員」772、次いで値「トム」773を選択したであろう。ユーザはそこで「追加」ボタン774を押す。「販売員/トム」775は「標本データセット」ボックスに表示される。
ここで図7Bを参照する。図7Bは、ベイズ分類解析を行う処理の間のKストアベイズ分類ユーザインターフェイス770のさらなるスクリーンショットを示す。ユーザは次に、上記で「トム」について説明されたのと同様のステップを行うことにより、「火曜日」を選択する。これは、前回選択された「販売員/トム」と共に「標本データセット」ボックスに表示される「曜日/火曜日」776に終わる。ユーザはそこで、「分類」ボタン777を押す。結果「販売(8.89%)」778が表示され、詳細な計算は「詳細」タブ779の下に現れる。
動的デシジョンツリー
動的デシジョンツリー解析は、標本Xを分類するのに用いられるであろう所望のデータセットの階層ツリー表示を作成する。ツリーは、単一のルートノードから始まるノードおよび枝から成る。ツリーのノードは、標本の分類においてなされるであろう決定を表す。
ゴールは、最も少ない数の決定を用いて、もしくは言い換えると、最も少ないノードを横切ることで、標本についての分類をできるようにすることである。各決定ノードに続き、データセットが、標本が分類されるまで、より小さなサブセットに区切られる。解析は、残りのカテゴリに解析を行うことでデシジョンツリーを、もしくはツリー端の各ノードにおいて特性を、作成し、解析の結果により、他の一連の枝およびノードが作成される。この処理は、各ツリーパスが所望の分類子カテゴリの値で終了するまで進められる。この方法で、予測(クラス割り当て)は、特定の標本について行われるであろう。図8Aを参照する。
焦点変数もしくは分類変数が選択され、この場合は「販売」である。各ノードにおいて、どのカテゴリ変数を枝について用いるかの決定は、どの変数が最多の焦点変数を含むかに基づく。異なるデシジョンツリーは、各ノードレベルにおいてどのカテゴリを選択するかを決定するのに異なる基準を用いるであろう。初めに、解析は全てのカテゴリを全ての記録にわたって再検討する。「ビル」を含む記録はまた、最多数の「販売」を含む(10の「ビル」の記録のうちの7がまた「販売」を含む)。したがって、「ビル」および「トム」を含むカテゴリもしくはカラムは、第1の枝を作成するのに用いられる。(一連の)「ビル」記録のコンテキストにおいて、「火曜日」記録の6つ全てが販売をまた含むので、「火曜日」と「月曜日」を含むカラムが「ビル」の下に次の枝を作成するのに用いられる。全ての焦点変数が考慮された時、分岐は完了する。「トム」のコンテキストにおいて、「103」および「100」を含むカラムが次の枝を作成するのに用いられる。「ペンシルヴェニア」と「ニュージャージー」を含むカラムは、データ配布が「103」と「100」についてのものと同じである時に、また用いられるであろう。ユーザは、カラム4(販売と試用)のクラス変数を用いて、標本X(ビル、火曜日)を分類したいであろう。分類は、ユーザによって、解析GUIを活用して視覚的に行われるか、解析そのものの返答として提示されるかのいずれかである。この場合、Xは「販売」について100%の確率を有する。このタイプの解析は、クレジットリスク解析、チャーン分析、顧客維持もしくはアドバンストデータ調査などのクエリを行うのに用いられるであろう。
図8Bを参照する。図8Bは、Kストアデシジョンツリーユーザインターフェイス790のスクリーンショットを示す。データセットのツリー表示を作成するために、ユーザの第1のステップは、クラスとして用いられるカテゴリを選択することである。本実施例において、ユーザは、ドロップダウンボックスから「販売員」791を選択する。ユーザはそこで「処理」ボタン792を選択する。部分的なツリー表示がディスプレイ793に見られるであろう。各ノードにおいて、枝についてどのカテゴリ値を用いるかがどのカテゴリ値に基づくかの決定が、分類カテゴリについての最大の情報をもたらすであろう。現在のツリーノードについての分類カテゴリ変数についての情報は、「結果」表794に表示される。本実施例では、「ビル」と「トム」が、焦点もしくは分類カテゴリ内に含まれる変数である。第1のノードにおいて、火曜日と月曜日の値を含む曜日のカテゴリは、販売員についての標本を分類する最も短い枝を提供する。したがって、「火曜日」と「月曜日」の両方を含むカラムが、第1の枝を作成するのに用いられる。ノードを横切るため、ユーザはノードをダブルクリックしてツリー内を前進したり後退したりする。結果ボックス794は、その時の各制約データセットについての値を示す。本実施例において、我々は、ツリーのルートから始まる確率、全ての記録を示す「全て」796を見る。
図8Cを参照する。図8Cは、Kストアデシジョンツリーユーザインターフェイス790の他のスクリーンショットを示す。本実施例において、ユーザは、図8Bから「火曜日」ノード797をダブルクリックした。火曜日の「ビル」の確率が100%(798)であり、火曜日の「トム」の確率が0%(799)であることが、「結果」表において見られる。
各ノードは、その時点までの制約データにおける「ビル」と「トム」の発現を表し、そのノードを選択することは「結果」ボックスの値を変更する。
当業者によって、分類機能カテゴリにおける任意の数の追加の解析が、本発明の精神と範囲に沿って、ユーザによって定義されるということが理解されるであろう。たとえば、多くのこのような解析は付録において説明される。当業者は、付録にリストアップされていようといまいと、分類機能カテゴリにおける他の解析によって行われる操作を決定することができる。当業者はそこで、その他のタイプのデータベース技術の明細書にしたがってそのようなプログラムを書くことができるのと同じ方法で、Kストア技術の明細書にしたがってプログラムを書いて解析を実施することができる。
関連機能カテゴリ
このカテゴリは、データ間の関係を発見するのに用いられるであろう。この機能カテゴリは、解析「関連ルール」および「マーケットバスケット」を含むであろう。
関連ルール
関連ルール解析は、所望のデータセットにおけるアイテム間の興味のある関係を検索し、変数のリストと、変数の結み合わせと、それらの1以上の焦点変数との共起の確率とを返す。この解析の実際的な使用として、関連ルールは、共に現れる傾向のあるイベントを説明する。単一変数予測解析と同様の方法で変数が選択される。このタイプの解析は、アドバンストデータ調査を行うようなクエリについて用いられるであろう。
標本データセットを用いて、焦点変数が「販売」である場合、解析はKストアにおける情報を用い、計算の以下の例を行うであろう:
Figure 2008522253
図9を参照する。図9は、Kストア関連ルールユーザインターフェイス800のスクリーンショットを示す。この実施例について、ユーザが量「103」と構造内のその他の変数との間の関連を見たいと仮定する。ユーザはまず、「フィールド名」ボックスから「量」801を選択し、次いで「変数」ボックス802から「103」を選択する。ユーザはそこで、データをいかに制約するかを選択する。本実施例においては、ユーザは「<75パーセント」803(75%未満)を選択する。ユーザはそこで、「1」を「最大反復レベル」ボックス804に入力することで、反復回数もしくは変数の結合の最大数を選択する。ユーザはそこで、「処理」ボタン805を押す。結果表示806は、75%未満の確率で見つかった変数の結み合わせを示す。「1」である反復を選択し、「販売員/ビル」を前提として「量/103」の確率は、75%未満の確率である他の全ての結合と同じく
、リストアップされる。
マーケットバスケット
マーケットバスケット分析は、どの製品を一緒に販売するかを決定するのに用いられるであろう。データマイニングにおいて、マーケットバスケット分析は、リスト内のどのアイテムが共に現れるかの確率を決定するべくリストを分析するアルゴリズムである。この名前は、全てのアイテムをショッピングカート(「マーケットバスケット」)に入れる、スーパーマーケットにおける人の発想から取られる。マーケットバスケット分析はそこで、どの製品を一緒に販売するかを決定するのに用いられるであろう。結果は、店で、カタログで、もしくは顧客に直接であっても、製品を販売する任意の企業にとってとりわけ有用であろう。たとえば、おむつなど1つのアイテムを購入しにコンビニエンスストアに行く人が、たとえばビールなどの関係のないアイテムを購入する傾向があることを、マーケット研究は示した。
Kストアマーケットバスケット分析は、所与のデータセットにおけるアイテム間の興味のある関係を調査し、変数のリストと、変数の結み合わせと、それらが焦点変数と共起する確率とを返す。
図10Aを参照する。図10Aは、Kストアマーケットバスケットユーザインターフェイス810のスクリーンショットを示す。本実施例についてのデータは、家具店で購入されたアイテムのリストを含む。第1の実施例において、ユーザは、家庭向け娯楽施設が購入された時に、他のどのアイテムが購入されたかを見たい。ユーザは、セールスプロモーションを設計するべく、この情報が欲しいであろう。ユーザはまず、変数のリスト811から「娯楽施設」を選択する。ユーザはそこで、「ステップ2:制約」812において制約を選択することで、結果を縮小する制約を設定する。本実施例において、ユーザは、70%を上回る回数で家庭向け娯楽施設とその他のアイテムが同時に購入されたインスタンスに結果を制約することを選択した。ユーザはこれを>70%を選択することで行う。単一の最も関連するアイテムを決定するべく、ユーザは、「最大反復レベル」ボックス813に「1」を入力し、「処理」ボタン814を押す。結果は「結果」の下に表示される。本実施例において、我々は、購入された全ての家庭向け娯楽施設について、74.061%を上回る回数、ダイニングルームセットがまた購入されたこと(815)を見る。
図10Bを参照する。図10Bは、Kストアマーケットバスケットユーザインターフェイス810のスクリーンショットを示す。家庭向け娯楽施設が購入された時に、どの1つもしくは2つのアイテムが購入されたかを見るため、ユーザは、「最大反復レベル」ボックス816に「2」を入力し、「処理」ボタン817を押す。結果は「結果」ボックス818に表示される。ここで我々は、購入された全ての家庭向け娯楽施設について、89.673%を上回る回数、ソファとラブシート819が同時にまた購入されたことを見る。
当業者によって、関連機能カテゴリ内の任意の数の追加の解析が、本発明の精神と範囲に沿って、ユーザによって定義されるということが理解されるであろう。たとえば、多くのこのような解析は付録において説明される。当業者は、付録にリストアップされていようといまいと、関連機能カテゴリにおける他の解析によって行われる操作を、決定することができる。当業者はそこで、他のタイプのデータベース技術の明細書にしたがってこのようなプログラムが書かれることができるのと同じ方法で、Kストア技術の明細書にしたがってプログラムを書いて解析を実施することができる。
可視化機能カテゴリ
この機能カテゴリは、解析「チャートジェネレータ」および「フィールドチャート」を含むであろう。Kストアチャートジェネレータおよびフィールドチャートの構造および方
法はどちらも、2004年12月16日出願の、米国特許出願第11/014,494号に開示された。
チャートジェネレータ
Kストアチャートジェネレータは、グラフィックディスプレイ装置を有するグラフィカルディスプレイシステムにおける連動ツリーデータストアから、チャートやグラフなどのデータの表示を提供する通常の方法である。Kストアチャートジェネレータ解析はフィールドのカウントと選択された値とをグラフ化する。
フィールドチャート
Kストアフィールドチャート解析は、選択されたカテゴリの発現をグラフ化する。
当業者によって、可視化機能カテゴリにおける任意の数の追加の解析が、本発明の精神と範囲に沿って、ユーザによって定義されることができることが理解されるであろう。たとえば、多くのこのような解析が付録において説明される。当業者は、付録にリストアップされていようといまいと、可視化機能カテゴリにおける他の解析によって行われる操作を、決定することができる。当業者はそこで、その他のタイプのデータベース技術の明細書にしたがってこのようなプログラムが書かれることができるのと同じ方法で、Kストア技術の明細書にしたがってプログラムを書いて解析を実施することができる。
メタデータ機能カテゴリ
この機能カテゴリは、解析「制約マネージャ」を含む。
制約マネージャ
Kストア制約マネージャは、生データにおいては明白でない関連性や関係をユーザが見ることを可能にする。ユーザ定義の「制約」(データセットを、それを含む記録のみに限定する、フィールド値もしくはフィールド名/フィールド値の対)および「フィールドカテゴリ」(その間にユーザ定義の論理的関係を有する制約のセット)の使用を通じて、Kストア制約マネージャ解析は連動ツリーデータストアにおける情報を関連づけることができる。
当業者によって、制約マネジメント機能カテゴリにおける任意の数の追加の解析が、本発明の精神と範囲に沿って、ユーザによって定義されることができることが理解できるであろう。たとえば、多くのこのような解析が付録において説明される。当業者は、付録にリストアップされていようといまいと、制約マネジメント機能カテゴリの他の解析によって行われる操作を、決定することができる。当業者はそこで、他のタイプのデータベース技術の明細書にしたがってこのようなプログラムが書かれることができるのと同じ方法で、Kストア技術の明細書にしたがってプログラムを書いて解析を実施することができる。
Kストアユーティリティ
上記で説明された機能解析に加えて、Kストアデータアナライザは、そのうちのいくつかはデータをロードし、保存し、復元し、シミュレートするのに用いられ、Kストア関連のGUIアプリケーションを発展させるところの、多様なユーティリティへのアクセスを提供する。それらのそれぞれは、以下に簡潔に説明され、その全ては同時係属出願に従属する。
保存と復元
「保存」と「復元」は、連動ツリーデータストアを、メモリから永続的な記憶装置に保存し連動ツリーデータストアを永続的な記憶装置からメモリに復元する、構造および方法に言及する。
この特性を用いるために、ユーザは、Kストア管理メイン画面710(図2)から「ツール」タブ717を選択するであろう。図11を参照する。図11は、Kストア「ツール」タブの可能な内容のスクリーンショット820である。「保存」ボタン821および「復元」ボタン822は、このタプに現れる。
「保存」および「復元」は、2004年10月5日出願の、米国特許出願第10/958,830号「連動ツリーデータベースの保存および復元」に開示された。
データシミュレーションおよびロード
「データシミュレーション」は、データ配列(記録)のインスタンスをランダムに生成するシミュレートされたデータを生成する方法である。シミュレータは、1以上のマルチスレッドを生成して、プロセッサの使用をテストし、もしくは、複数のレジや販売員からのデータをストリーミングすることなどの複雑なデータセットのシミュレーションを許可するよう指示されることができる。このこともまた、異なるソースからの異なるフォーマットのデータを含む、販売データおよび在庫品目からのデータなどのデータセットである、データセットのシミュレーションを許可する。「ロード」は、Kエンジンにデータをロードする方法に言及する。
この特性を用いるべく、ユーザは、Kストア管理メイン画面(図2)から「ツール」タブ717を選択するであろう。再び図11を参照する。図11は、Kストア「ツール」タブ820の内容の可能なスクリーンショットである。「データシミュレーション」ボタンおよびドロップダウン823がこのタブに現れる。
「ロード」を用いるために、ユーザは、図2のKストア管理メイン画面710から「データソース」タブ716を選択するであろう。図12を参照する。図12は、Kストア「データソース」タブ830の内容の可能なスクリーンショットである。データをロードするために、ユーザはネーム/リンク「Kロード」831を選択する。
データシミュレーションの方法は、本出願の出願人所有の、2005年4月13日出願の、米国特許出願第( )号「Kストアに適応したマルチストリームデータシミュレーション」に開示された。
アプリケーションデザイナ
Kストアアプリケーションデザイナは、Kストア解析を、ユーザのライブデータに組み込み、関連させるGUIアプリケーションを設計し、発展させるのに用いられることができる。シングルセッションにおいて、ユーザは、Kストアにロードされたライブプロダクションデータを用いてKストアアプリケーションを設計し、テストすることができる。Kストアの固有のデータ構造のおかげで、データの破損は起こりえない。ユーザは、アプリケーションが設計通りに機能するかどうかを見るのに、ランタイムを待つ必要がない。ユーザはライブデータを用いているので、解析が設計された通りにデータと共に機能するかどうか、およびGUI設計がデータを正確に示すかどうかは、(アプリケーションが構築されると)すぐに明白である。
アプリケーションデザイナはまた、各Kストア解析の背後のコードがいかに機能するかを理解する必要なく、アプリケーションをすぐに発展させる方法およびシステムを提供する。シンプルなドラッグアンドドロップ技術を用いて、プログラマは、Kストア解析を用いるアプリケーションおよび、プログラマがデータ制約を構築し、定義することを可能とするその他のKストアツールを構築することができる。プログラマが理解する必要があるのはただ、どのそれぞれのKストア解析があらかじめプログラムされ、フィールドもしく
はフィールドのグループと関連する時に実現するかである;解析の背後のコードを実際に理解する必要はない。
この特性を用いるべく、ユーザは、Kストア管理メイン画面710(図2)から「ツール」タブ717を選択するであろう。再び図11を参照する。Kストア「ツール」タブの内容がネーム/リンク「アプリケーションデザイナ」824と共に現れる。ユーザはネーム/リンクを選択してKストアアプリケーションデザイナにアクセスするであろう。
Kストアアプリケーションデザイナは、2005年6月10日出願の米国特許出願第11/150,063号「Kストアアプリケーションデザイナ」に開示された。
当業者は、任意の数のこのような解析が着想され、多様なタイプの既知のデータ操作技術において実施されることを理解するであろう。さらに、既知のおよび将来のデータ操作技術において着想され、実施される任意の解析が、連動ツリーデータストアにおいてまた実施されることができることが理解されるであろう。このような解析を実施するために、当業者は、ここに示され、任意のその他の定義された解析が連動ツリーデータストア技術内で実施されることのできる方法を説明する、実施例を用いることができる。
したがって、連動ツリーデータストア内で行われることのできる異なる解析の数は、ユーザが着想し、実施することのできる解析の数によってのみ限定される。当業者が、用いられるデータ構造の明細書にしたがった既知のデータ構造において所望の解析を行う方法を発展させ、実施することができるのと同じように、当業者は、ここに示された解析および当業者に取って既知である任意のその他の技術を発展させる技術を用いて、解析を提供することができる。
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
Figure 2008522253
図1Aは、本発明のシステムおよび方法を実行するのに適したKストアシステムの実施形態のブロック線図表示を示す。 図1Bは、連動ツリーデータベースのグラフィック表示を示す。 図2は、ユーザがアクセスしてKストアデータアナライザを例示化するであろうKストア管理メイン画面として用いるのに、またユーザが解析機能にアクセスするであろうKストア解析ビュータブと共に用いるのに適したグラフィカルユーザインターフェイスのスクリーンショットを示す。 図3は、Kストアカラム合計解析と共に用いて所望のデータセットにおける数値の和を返すのに適したグラフィカルユーザインターフェイスのスクリーンショットを示す。 図4は、Kストア個別カウント解析と共に用いて所望のデータセットにおける個別値のカウントを返すのに適したグラフィカルユーザインターフェイスのスクリーンショットを示す。 図5Aは、焦点変数の確率を返す、Kストア単一変数予測解析と共に用いるのに適したグラフィカルユーザインターフェイスのスクリーンショットを示す。 図5Bは、焦点変数の確率を返す、Kストア単一変数予測解析と共に用いるのに適したグラフィカルユーザインターフェイスのスクリーンショットを示す。 図6Aは、コンテキスト内の標本Xの分類を返す、Kストアコンテキスト分類解析と共に用いるのに適したグラフィカルユーザインターフェイスのスクリーンショットを示す。 図6Bは、コンテキスト内の標本Xの分類を返す、Kストアコンテキスト分類解析と共に用いるのに適したグラフィカルユーザインターフェイスのスクリーンショットを示す。 図7Aは、ベイズの定理を用いて標本Xの分類を返す、Kストアベイズ分類解析と共に用いるのに適したグラフィカルユーザインターフェイスのスクリーンショットを示す。 図7Bは、ベイズの定理を用いて標本Xの分類を返す、Kストアベイズ分類解析と共に用いるのに適したグラフィカルユーザインターフェイスのスクリーンショットを示す。 図8Aは、本発明で用いられる標本データのデシジョンツリーを示す。 図8Bは、標本Xを分類するのに用いられるであろう所望のデータセットのデシジョンツリー表示を作成する、Kストア動的デシジョンツリー解析と共に用いるのに適したグラフィカルユーザインターフェイスのスクリーンショットを示す。 図8Cは、標本Xを分類するのに用いられるであろう所望のデータセットのデシジョンツリー表示を作成する、Kストア動的デシジョンツリー解析と共に用いるのに適したグラフィカルユーザインターフェイスのスクリーンショットを示す。 図9は、変数のリストもしくは変数の組み合わせおよびそれらが焦点変数と共起する確率を返す、Kストア関連ルールセット解析と共に用いるのに適したグラフィカルユーザインターフェイスのスクリーンショットを示す。 図10Aは、変数のリストおよび変数の組み合わせおよびそれらが焦点変数と共起する確率を返す、Kストアマーケットバスケット解析と共に用いるのに適したグラフィカルユーザインターフェイスのスクリーンショットを示す。 図10Bは、変数のリストおよび変数の組み合わせおよびそれらが焦点変数と共起する確率を返す、Kストアマーケットバスケット解析と共に用いるのに適したグラフィカルユーザインターフェイスのスクリーンショットを示す。 図11は、ユーザがアクセスして多様なKストアツールおよびユーティリティを例示化するであろう、Kストアツールタブと共に用いるのに適したグラフィカルユーザインターフェイスのスクリーンショットを示す。 図12は、ユーザがアクセスしてKストアロードユーティリティを例示化するであろう、Kストアデータソースタブと共に用いるのに適したグラフィカルユーザインターフェイスのスクリーンショットを示す。

Claims (85)

  1. 解析に関連するメモリを有するコンピュータ装置において解析を行なって解析結果を得るデータ解析システムであって、前記コンピュータ装置は、
    データアナライザインターフェイスと、
    前記コンピュータ装置の前記関連するメモリ内の少なくとも1つの連動ツリーデータストアと、
    前記コンピュータ装置によって実行される少なくとも1つの解析アプリケーションと、
    を備える、データ解析システム。
  2. 複数の連動ツリーデータストアをさらに備え、前記少なくとも1つの連動ツリーデータストアは、前記データアナライザインターフェイスにしたがって前記複数の連動ツリーデータストアから選択される、請求項1に記載のデータ解析システム。
  3. 複数のデータソースをさらに備え、前記少なくとも1つの連動ツリーデータストアは、前記データアナライザインターフェイスにしたがって前記複数のデータソースから選択されたデータソースから作成される、請求項1に記載のデータ解析システム。
  4. 前記少なくとも1つの連動ツリーデータストアは、静的連動ツリーデータストアをさらに備える、請求項1に記載のデータ解析システム。
  5. 前記少なくとも1つの連動ツリーデータストアは、動的連動ツリーデータストアを備える、請求項1に記載のデータ解析システム。
  6. 前記少なくとも1つの連動ツリーデータストアは連続的に新しいデータを記録する、請求項5に記載のデータ解析システム。
  7. 前記少なくとも1つの連動ツリーデータストアはデータの記録を含み、前記少なくとも1つの連動ツリーデータストアはデータの前記記録の更新を連続的に受け取る、請求項5に記載のデータ解析システム。
  8. 複数の解析アプリケーションを含み、前記少なくとも1つの解析アプリケーションは、前記データアナライザインターフェイスにしたがって前記複数の解析アプリケーションから選択される、請求項1に記載のデータ解析システム。
  9. 前記少なくとも1つの解析アプリケーションは、静的連動ツリーデータストアを解析する、請求項8に記載のデータ解析システム。
  10. 前記少なくとも1つの解析アプリケーションは、動的連動ツリーデータストアを解析する、請求項8に記載のデータ解析システム。
  11. 前記少なくとも1つの解析アプリケーションは、任意のタイプの解析をさらに備える、請求項8に記載のデータ解析システム。
  12. 前記少なくとも1つの解析アプリケーションは、会計/数学的機能カテゴリ解析をさらに備える、請求項11に記載のデータ解析システム。
  13. 前記少なくとも1つの解析アプリケーションは、和解析をさらに備える、請求項12に記載のデータ解析システム。
  14. 前記少なくとも1つの解析アプリケーションは、統計的機能カテゴリ解析をさらに備える、請求項11に記載のデータ解析システム。
  15. 前記少なくとも1つの解析アプリケーションは、分類機能カテゴリ解析をさらに備える、請求項11に記載のデータ解析システム。
  16. 前記少なくとも1つの解析アプリケーションは、関係機能カテゴリ解析をさらに備える、請求項11に記載のデータ解析システム。
  17. 前記少なくとも1つの解析アプリケーションは、可視化機能カテゴリ解析をさらに備える、請求項11に記載のデータ解析システム。
  18. 前記少なくとも1つの解析アプリケーションは、統計的機能カテゴリ解析をさらに備える、請求項11に記載のデータ解析システム。
  19. 前記少なくとも1つの解析アプリケーションは、メタデータ機能カテゴリ解析をさらに備える、請求項11に記載のデータ解析システム。
  20. 前記少なくとも1つの解析アプリケーションは、さらなる機能カテゴリ解析を備える、請求項12に記載のデータ解析システム。
  21. 前記データアナライザインターフェイスは、少なくとも1つの管理アプリケーションへのアクセスを提供する、請求項1に記載のデータ解析システム。
  22. 解析に関連するメモリを有するデータ処理装置において解析を行って解析結果を得るデータ解析方法であって:
    前記データ処理装置にデータアナライザインターフェイスを提供するステップと、
    少なくとも1つの連動ツリーデータストアを前記データ処理装置の前記メモリに格納するステップと、
    前記少なくとも1つの連動ツリーデータストアにしたがって少なくとも1つの解析アプリケーションを実行するステップと、
    を備える、方法。
  23. 前記データ処理装置の前記関連メモリは複数の連動ツリーデータストアを含み、前記データアナライザインターフェイスにしたがって前記複数の連動ツリーデータストアから前記少なくとも1つの連動ツリーデータストアを選択するステップをさらに備える、請求項22に記載のデータ解析方法。
  24. 前記データ解析装置は複数のデータソースを含み、前記データアナライザインターフェイスにしたがって前記複数のデータソースから選択されたデータソースから前記少なくとも1つの連動ツリーデータストアを作成するステップをさらに備える、請求項22に記載のデータ解析方法。
  25. 前記データ処理装置は複数の解析アプリケーションを含み、前記データアナライザインターフェイスにしたがって前記複数の解析アプリケーションから前記少なくとも1つの解析アプリケーションを選択するステップをさらに備える、請求項22に記載のデータ解析方法。
  26. それぞれのKパス(K path)がエンドノードを有する複数のKパス(K paths)を有するKストア(KStore)において、解析を行って解析結果を得る方法で
    あって:
    少なくとも1つの決定パラメータを提供するために、前記複数のKパス(K paths)の少なくとも1つのKパス(K path)にしたがって少なくとも1つのKストアパラメータを決定するステップと、
    前記決定された少なくとも1つの決定パラメータにしたがって前記解析結果を得るステップと、
    を備える、方法。
  27. 前記少なくとも1つのKストア結果はカウントを備える、請求項26に記載の解析を行って解析結果を得る方法。
  28. 前記少なくとも1つのKストア結果は値を備える、請求項26に記載の解析を行って解析結果を得る方法。
  29. 前記少なくとも1つのKストア結果は配列情報を備える、請求項26に記載の解析を行って解析結果を得る方法。
  30. 前記複数のKパスから少なくとも1つの選択Kパスを提供するために、少なくとも1つの制約で前記Kストアを制約するステップを備える、請求項26に記載の解析を行って解析結果を得る方法。
  31. 前記制約するステップは一連の選択Kパスを提供し、さらなる一連の選択Kパスを提供するために少なくとも1つの焦点を前記Kストアに適用するステップを備える、請求項30に記載の解析を行って解析結果を得る方法。
  32. 前記解析は動的Kストアを解析する解析である、請求項26に記載の解析を行って解析結果を得る方法。
  33. 前記解析は会計/数学的機能カテゴリ解析を備える、請求項26に記載の解析を行って解析結果を得る方法。
  34. 前記解析は和解析であり、前記解析結果は複数のパラメータの和を備える、請求項33に記載の解析を行って解析結果を得る方法。
  35. 一連の選択Kパスは:
    前記Kストアを制約して一連の選択Kパスを提供するステップと;
    前記一連の選択Kパスにしたがって複数の前記Kストア結果を決定するステップと;
    前記複数のKストアパラメータの前記Kストアパラメータを合計するステップと、
    をさらに備える、請求項34に記載の解析を行って解析結果を得る方法。
  36. 前記一連のKパスの前記Kパスを横切って前記複数のKストアパラメータを決定するステップをさらに備える、請求項35に記載の解析を行って解析結果を得る方法。
  37. 前記一連の選択Kパスの前記Kパスのそれぞれのエンドノードへ前記一連のKパスの前記Kパスを横切るステップと;
    前記それぞれのエンドノードにしたがって前記複数のKストアパラメータを決定するステップと;
    をさらに備える、請求項36に記載の解析を行って解析結果を得る方法。
  38. 前記一連のKパスの各Kパスのカウントを決定して複数の決定カウントを提供するステ
    ップと;
    前記決定カウントを合計して前記解析結果を提供するステップと;
    をさらに備える、請求項37に記載の解析を行って解析結果を得る方法。
  39. 前記解析は個別のカウント解析であり、前記解析結果は前記Kストアにおける少なくとも1つの個別のパラメータのカウントである、請求項33に記載の解析を行って解析結果を得る方法。
  40. 一連の選択Kパスを提供するために前記Kストアを制約するステップと;
    前記個別のパラメータが前記一連のKパス内で現れる回数を決定するステップと;
    をさらに備える、請求項39に記載の解析を行って解析結果を得る方法。
  41. 複数の個別のパラメータを決定するステップと;
    前記複数の個別のパラメータの各個別の値が前記一連のKパス内で現れる回数を決定するステップと;
    をさらに備える、請求項40に記載の解析を行って解析結果を得る方法。
  42. 前記一連のKパスの前記Kパスの個別のパラメータ横断を行うステップと;
    前記個別の値横断にしたがって前記個別のパラメータが見られた前記回数を決定するステップと;
    をさらに備える、請求項41に記載の解析を行って解析結果を得る方法。
  43. 前記個別の値が現れる前記回数を決定することに先立って前記Kストアにさらなる制約を適用するステップをさらに備える、請求項40に記載の解析を行って解析結果を得る方法。
  44. 前記個別のパラメータが現れる前記回数を決定することに先立って前記Kストアに焦点変数を適用するステップをさらに備える、請求項40に記載の解析を行って解析結果を得る方法。
  45. 前記解析はデータ集約解析を備え、前記解析結果は集約データである、請求項33に記載の解析を行って解析結果を得る方法。
  46. 前記解析は、和解析、個別のグループ解析、集約データ解析から成るグループ内のもの以外の会計/数学的機能カテゴリ解析を備える、請求項33に記載の解析を行って解析結果を得る方法。
  47. 前記Kストアを制約して一連の選択Kパスを提供するステップと;
    前記一連の選択Kパスの少なくとも1つのKパスを横断するステップと;
    をさらに備える、請求項46に記載の解析を行って解析結果を得る方法。
  48. 前記解析は解析の統計的機能カテゴリを備える、請求項26に記載の解析を行って解析結果を得る方法。
  49. 前記解析は単一変数予測解析を備える、請求項48に記載の解析を行って解析結果を得る方法。
  50. 焦点変数を前記Kストアに適用するステップと;
    前記焦点変数にしたがって確率を決定するステップと;
    をさらに備える、請求項49に記載の解析を行って解析結果を得る方法。
  51. 前記Kストアを制約して一連の選択Kパスを提供するステップと;
    前記一連の選択Kパス内の前記焦点変数の個別のカウントを決定するステップと;
    をさらに備える、請求項50に記載の解析を行って解析結果を得る方法。
  52. 前記一連の選択Kパスにおける選択Kパスの数にしたがって前記確率を決定するステップをさらに備える、請求項51に記載の解析を行って解析結果を得る方法。
  53. 前記複数の選択Kパス内におけるKパスの数にしたがって前記確率を決定するステップをさらに備える、請求項51に記載の解析を行って解析結果を得る方法。
  54. 前記個別のカウントを前記決定するステップは:
    一連の選択Kパスの前記Kパスの個別のカウント横断を行うステップと;
    前記焦点変数が前記個別のカウント横断の間に見られる回数をカウントするステップと;
    をさらに備える、請求項51に記載の解析を行って解析結果を得る方法。
  55. 前記解析は、単一変数予測解析から成るグループ内のもの以外の全てのさらなる統計的機能カテゴリ解析を備える、請求項48に記載の解析を行って解析結果を得る方法。
  56. 前記Kストアを制約して一連の選択Kパスを提供するステップと;
    前記一連の選択Kパスの少なくとも1つのKパスを横断するステップと;
    をさらに備える、請求項55に記載の解析を行って解析結果を得る方法。
  57. 前記解析は分類機能カテゴリ解析を備える、請求項26に記載の解析を行って解析結果を得る方法。
  58. 前記解析はコンテキスト分類解析であり、前記解析結果はコンテキスト内の標本の分類である、請求項57に記載の解析を行って解析結果を得る方法。
  59. 標本は標本変数を含み、前記Kストアを前記標本変数で制約するステップを備える、請求項58に記載の解析を行って解析結果を得る方法。
  60. 前記解析は動的デシジョンフリー解析であり、前記解析結果はデータセットの階層ツリー表示である、請求項57に記載の解析を行って解析結果を得る方法。
  61. 前記階層ツリー表示は単一ルートノードを備え、複数の枝が前記単一ルートノードから始まる、請求項60に記載の解析を行って解析結果を得る方法。
  62. 前記解析はベイズ分類解析を備え、前記解析結果は確率である、請求項57に記載の解析を行って解析結果を得る方法。
  63. 前記解析結果は確率的分類を備える、請求項62に記載の解析を行って解析結果を得る方法。
  64. 前記解析は関係機能カテゴリ解析を備える、請求項26に記載の解析を行って解析結果を得る方法。
  65. 前記解析は関連ルールカテゴリ解析を備え、前記解析結果は確率である、請求項64に記載の解析を行って解析結果を得る方法。
  66. 前記確率は焦点変数と共起する変数の確率を備える、請求項65に記載の解析を行って解析結果を得る方法。
  67. 前記解析はマーケットバスケット解析であり、解析結果はしばしば共にグループ化されるアイテムのリストである、請求項66に記載の解析を行って解析結果を得る方法。
  68. 販売取引のリストにしたがってアイテムの前記リストを決定することを備える、請求項67に記載の解析を行って解析結果を得る方法。
  69. 前記解析は可視化カテゴリ解析を備える、請求項26に記載の解析を行って解析結果を得る方法。
  70. 前記解析はチャートジェネレータ解析を備える、請求項69に記載の解析を行って解析結果を得る方法。
  71. 前記解析はフィールドチャート解析を備える、請求項69に記載の解析を行って解析結果を得る方法。
  72. 前記解析はメタデータ機能カテゴリ解析を備える、請求項26に記載の解析を行って解析結果を得る方法。
  73. 前記解析は、会計/数学的機能カテゴリ、統計的機能カテゴリ、分類機能カテゴリ、関係機能カテゴリ、可視化機能カテゴリ、およびメタデータ機能カテゴリ以外のカテゴリ内の全てのさらなる解析を備える、請求項26に記載の解析を行って解析結果を得る方法。
  74. データアナライザと;
    前記データアナライザによって選択されたデータソースと;
    前記データアナライザによって選択された解析アプリケーションと、
    を備える、解析を行って解析結果を得るKストアシステム。
  75. 前記Kストアシステムは複数のデータソースを含み、前記データアナライザによって前記複数のデータソースから選択された選択データソースをさらに備える、請求項74に記載の解析を行うKストアシステム。
  76. 前記Kストアシステムは複数の解析アプリケーションを含み、前記複数の前記データアナライザによって解析アプリケーションから選択された選択解析アプリケーションをさらに備える、請求項74に記載の解析を行うKストアシステム。
  77. 前記Kストアシステムは複数のデータソースと複数の解析とを含み、前記データアナライザによって前記複数のデータソースから選択された選択データソースと、前記データアナライザによって前記複数の解析アプリケーションから選択された選択解析アプリケーションとをさらに備える、請求項74に記載の解析を行うKストアシステム。
  78. 前記Kストアシステムは、前記選択データソースもしくは前記選択解析アプリケーションのうちの少なくとも1つの選択に関して前記データアナライザに指示を提供するAPIユーティリティを含む、請求項77に記載の解析を行うKストアシステム。
  79. 前記選択解析は、解析の会計/数学的機能カテゴリからの解析を備える、請求項77に記載の解析を行うKストアシステム。
  80. 前記選択解析は、解析の統計的機能カテゴリからの解析を備える、請求項77に記載の解析を行うKストアシステム。
  81. 前記選択解析は、解析の分類機能カテゴリからの解析を備える、請求項77に記載の解析を行うKストアシステム。
  82. 前記選択解析は、解析の関係機能カテゴリからの解析を備える、請求項77に記載の解析を行うKストアシステム。
  83. 前記選択解析は、解析の可視化機能カテゴリからの解析を備える、請求項77に記載の解析を行うKストアシステム。
  84. 前記選択解析は、解析のメタデータ機能カテゴリからの解析を備える、請求項77に記載の解析を行うKストアシステム。
  85. 解析の少なくとも1つのカテゴリと前記少なくとも1つのカテゴリの要素を格納する記憶装置をさらに備える、請求項74に記載の解析を行うKストアシステム。
JP2007540129A 2004-11-08 2005-11-07 Kストア(KStore)データアナライザ Withdrawn JP2008522253A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US62592204P 2004-11-08 2004-11-08
US11/212,339 US20060101048A1 (en) 2004-11-08 2005-08-26 KStore data analyzer
PCT/US2005/040261 WO2006052875A2 (en) 2004-11-08 2005-11-07 Kstore data analyzer

Publications (1)

Publication Number Publication Date
JP2008522253A true JP2008522253A (ja) 2008-06-26

Family

ID=36317582

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007540129A Withdrawn JP2008522253A (ja) 2004-11-08 2005-11-07 Kストア(KStore)データアナライザ

Country Status (5)

Country Link
US (1) US20060101048A1 (ja)
EP (1) EP1831797A4 (ja)
JP (1) JP2008522253A (ja)
CA (1) CA2585681A1 (ja)
WO (1) WO2006052875A2 (ja)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080104007A1 (en) * 2003-07-10 2008-05-01 Jerzy Bala Distributed clustering method
US7712054B2 (en) * 2005-10-14 2010-05-04 Sap Ag Populating a table in a business application
WO2007067926A2 (en) * 2005-12-06 2007-06-14 Ingenix, Inc. Analyzing administrative healthcare claims data and other data sources
US7689571B1 (en) * 2006-03-24 2010-03-30 Unisys Corporation Optimizing the size of an interlocking tree datastore structure for KStore
US7543006B2 (en) * 2006-08-31 2009-06-02 International Business Machines Corporation Flexible, efficient and scalable sampling
WO2008042264A2 (en) * 2006-09-29 2008-04-10 Inferx Corporation Distributed method for integrating data mining and text categorization techniques
US7856503B2 (en) * 2006-10-19 2010-12-21 International Business Machines Corporation Method and apparatus for dynamic content generation
US7992126B2 (en) * 2007-02-27 2011-08-02 Business Objects Software Ltd. Apparatus and method for quantitatively measuring the balance within a balanced scorecard
JP2009086721A (ja) * 2007-09-27 2009-04-23 Toshiba Tec Corp 併売関係表示装置及びコンピュータプログラム
US20090144242A1 (en) * 2007-12-03 2009-06-04 Chartsource, Inc., A Delaware Corporation Indexer for searching research data
US20090144241A1 (en) * 2007-12-03 2009-06-04 Chartsource, Inc., A Delaware Corporation Search term parser for searching research data
US20090144222A1 (en) * 2007-12-03 2009-06-04 Chartsource, Inc., A Delaware Corporation Chart generator for searching research data
US20090144243A1 (en) * 2007-12-03 2009-06-04 Chartsource, Inc., A Delaware Corporation User interface for searching research data
US20090144317A1 (en) * 2007-12-03 2009-06-04 Chartsource, Inc., A Delaware Corporation Data search markup language for searching research data
US20090144265A1 (en) * 2007-12-03 2009-06-04 Chartsource, Inc., A Delaware Corporation Search engine for searching research data
US20090144318A1 (en) * 2007-12-03 2009-06-04 Chartsource, Inc., A Delaware Corporation System for searching research data
US8738486B2 (en) * 2007-12-31 2014-05-27 Mastercard International Incorporated Methods and apparatus for implementing an ensemble merchant prediction system
US9396099B2 (en) * 2008-06-24 2016-07-19 International Business Machines Corporation Application state detector and inducer
US8639695B1 (en) * 2010-07-08 2014-01-28 Patent Analytics Holding Pty Ltd System, method and computer program for analysing and visualising data
AU2010202901B2 (en) 2010-07-08 2016-04-14 Patent Analytics Holding Pty Ltd A system, method and computer program for preparing data for analysis
US8443004B2 (en) * 2011-03-30 2013-05-14 Kevin Houzhi Xu System and method for storing and computing business data and logic
US8495018B2 (en) 2011-06-24 2013-07-23 International Business Machines Corporation Transitioning application replication configurations in a networked computing environment
US9268854B2 (en) 2013-03-29 2016-02-23 International Business Machines Corporation Analytics based on pipes programming model
US9305031B2 (en) * 2013-04-17 2016-04-05 International Business Machines Corporation Exiting windowing early for stream computing
US10521866B2 (en) 2013-10-15 2019-12-31 Mastercard International Incorporated Systems and methods for associating related merchants
US11762989B2 (en) 2015-06-05 2023-09-19 Bottomline Technologies Inc. Securing electronic data by automatically destroying misdirected transmissions
US20170163664A1 (en) 2015-12-04 2017-06-08 Bottomline Technologies (De) Inc. Method to secure protected content on a mobile device
US10635694B2 (en) 2015-12-14 2020-04-28 Pivotal Software, Inc. Deploying updates in a distributed database systems
US11163955B2 (en) 2016-06-03 2021-11-02 Bottomline Technologies, Inc. Identifying non-exactly matching text
US11003733B2 (en) 2016-12-22 2021-05-11 Sas Institute Inc. Analytic system for fast quantile regression computation
GB201708818D0 (en) 2017-06-02 2017-07-19 Palantir Technologies Inc Systems and methods for retrieving and processing data
US10678826B2 (en) 2017-07-25 2020-06-09 Sap Se Interactive visualization for outlier identification
CN107622432A (zh) * 2017-07-28 2018-01-23 阿里巴巴集团控股有限公司 商户评价方法及系统
US20190057332A1 (en) * 2017-08-15 2019-02-21 Hybris Ag Modeling associations between multiple products
US10127192B1 (en) * 2017-09-26 2018-11-13 Sas Institute Inc. Analytic system for fast quantile computation
US11030165B2 (en) * 2017-12-11 2021-06-08 Wipro Limited Method and device for database design and creation
US11003999B1 (en) 2018-11-09 2021-05-11 Bottomline Technologies, Inc. Customized automated account opening decisioning using machine learning
US11409990B1 (en) 2019-03-01 2022-08-09 Bottomline Technologies (De) Inc. Machine learning archive mechanism using immutable storage
US11416713B1 (en) 2019-03-18 2022-08-16 Bottomline Technologies, Inc. Distributed predictive analytics data set
CN111598374B (zh) * 2019-05-23 2024-03-19 青岛鼎信通讯股份有限公司 低压交流市电台区智能识别方法
US11687807B1 (en) 2019-06-26 2023-06-27 Bottomline Technologies, Inc. Outcome creation based upon synthesis of history
US11042555B1 (en) 2019-06-28 2021-06-22 Bottomline Technologies, Inc. Two step algorithm for non-exact matching of large datasets
CN112307433B (zh) * 2019-08-01 2023-08-29 深圳莱尔托特科技有限公司 女性用户非常用形体数据可靠性判断方法及装置
US11269841B1 (en) 2019-10-17 2022-03-08 Bottomline Technologies, Inc. Method and apparatus for non-exact matching of addresses
US11526859B1 (en) 2019-11-12 2022-12-13 Bottomline Technologies, Sarl Cash flow forecasting using a bottoms-up machine learning approach
US11532040B2 (en) 2019-11-12 2022-12-20 Bottomline Technologies Sarl International cash management software using machine learning
US11704671B2 (en) 2020-04-02 2023-07-18 Bottomline Technologies Limited Financial messaging transformation-as-a-service
CN111524559B (zh) * 2020-04-23 2023-07-07 浙江省农业科学院 一种化学物对生物的最大无作用浓度的分析方法
US11449870B2 (en) 2020-08-05 2022-09-20 Bottomline Technologies Ltd. Fraud detection rule optimization
US11694276B1 (en) 2021-08-27 2023-07-04 Bottomline Technologies, Inc. Process for automatically matching datasets
US11544798B1 (en) 2021-08-27 2023-01-03 Bottomline Technologies, Inc. Interactive animated user interface of a step-wise visual path of circles across a line for invoice management
CN115758894B (zh) * 2022-11-23 2023-07-14 天津市城市规划设计研究总院有限公司 基于迭代比例更新的人口微观数据逐年反演系统及方法

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5634133A (en) * 1992-01-17 1997-05-27 Compaq Computer Corporation Constraint based graphics system
US5894311A (en) * 1995-08-08 1999-04-13 Jerry Jackson Associates Ltd. Computer-based visual data evaluation
US5758353A (en) * 1995-12-01 1998-05-26 Sand Technology Systems International, Inc. Storage and retrieval of ordered sets of keys in a compact 0-complete tree
US6144962A (en) * 1996-10-15 2000-11-07 Mercury Interactive Corporation Visualization of web sites and hierarchical data structures
US5970490A (en) * 1996-11-05 1999-10-19 Xerox Corporation Integration platform for heterogeneous databases
US6148377A (en) * 1996-11-22 2000-11-14 Mangosoft Corporation Shared memory computer networks
US6233575B1 (en) * 1997-06-24 2001-05-15 International Business Machines Corporation Multilevel taxonomy based on features derived from training documents classification using fisher values as discrimination values
US6356902B1 (en) * 1998-07-28 2002-03-12 Matsushita Electric Industrial Co., Ltd. Method and system for storage and retrieval of multimedia objects
US6635089B1 (en) * 1999-01-13 2003-10-21 International Business Machines Corporation Method for producing composite XML document object model trees using dynamic data retrievals
US6751622B1 (en) * 1999-01-21 2004-06-15 Oracle International Corp. Generic hierarchical structure with hard-pegging of nodes with dependencies implemented in a relational database
US6373484B1 (en) * 1999-01-21 2002-04-16 International Business Machines Corporation Method and system for presenting data structures graphically
US6477683B1 (en) * 1999-02-05 2002-11-05 Tensilica, Inc. Automated processor generation system for designing a configurable processor and method for the same
US6591272B1 (en) * 1999-02-25 2003-07-08 Tricoron Networks, Inc. Method and apparatus to make and transmit objects from a database on a server computer to a client computer
US6920608B1 (en) * 1999-05-21 2005-07-19 E Numerate Solutions, Inc. Chart view for reusable data markup language
US6470344B1 (en) * 1999-05-29 2002-10-22 Oracle Corporation Buffering a hierarchical index of multi-dimensional data
US6381605B1 (en) * 1999-05-29 2002-04-30 Oracle Corporation Heirarchical indexing of multi-attribute data by sorting, dividing and storing subsets
US6711585B1 (en) * 1999-06-15 2004-03-23 Kanisa Inc. System and method for implementing a knowledge management system
US20020029207A1 (en) * 2000-02-28 2002-03-07 Hyperroll, Inc. Data aggregation server for managing a multi-dimensional database and database management system having data aggregation server integrated therein
US6704729B1 (en) * 2000-05-19 2004-03-09 Microsoft Corporation Retrieval of relevant information categories
US20020142783A1 (en) * 2001-03-28 2002-10-03 Yoldi Cesar Sanchez Reduced acquisition time for GPS cold and warm starts
US20020143735A1 (en) * 2001-03-30 2002-10-03 Akin Ayi User scope-based data organization system
US20030009443A1 (en) * 2001-06-15 2003-01-09 Oleg Yatviskiy Generic data aggregation
US6799184B2 (en) * 2001-06-21 2004-09-28 Sybase, Inc. Relational database system providing XML query support
US7027052B1 (en) * 2001-08-13 2006-04-11 The Hive Group Treemap display with minimum cell size
KR100500329B1 (ko) * 2001-10-18 2005-07-11 주식회사 핸디소프트 워크플로우 마이닝 시스템 및 방법
US7085771B2 (en) * 2002-05-17 2006-08-01 Verity, Inc System and method for automatically discovering a hierarchy of concepts from a corpus of documents
US20040015481A1 (en) * 2002-05-23 2004-01-22 Kenneth Zinda Patent data mining
US6785674B2 (en) * 2003-01-17 2004-08-31 Intelitrac, Inc. System and method for structuring data in a computer system
US6768995B2 (en) * 2002-09-30 2004-07-27 Adaytum, Inc. Real-time aggregation of data within an enterprise planning environment
US7020593B2 (en) * 2002-12-04 2006-03-28 International Business Machines Corporation Method for ensemble predictive modeling by multiplicative adjustment of class probability: APM (adjusted probability model)
JP2004185547A (ja) * 2002-12-06 2004-07-02 Hitachi Ltd 医療データ解析システム及び医療データ解析方法
US20040169654A1 (en) * 2003-02-27 2004-09-02 Teracruz, Inc. System and method for tree map visualization for database performance data
US6961733B2 (en) * 2003-03-10 2005-11-01 Unisys Corporation System and method for storing and accessing data in an interlocking trees datastore
JP2004295674A (ja) * 2003-03-27 2004-10-21 Fujitsu Ltd Xml文書解析方法、xml文書検索方法、xml文書解析プログラム、xml文書検索プログラムおよびxml文書検索装置
US7587685B2 (en) * 2004-02-17 2009-09-08 Wallace James H Data exploration system
US7348980B2 (en) * 2004-11-08 2008-03-25 Unisys Corporation Method and apparatus for interface for graphic display of data from a Kstore

Also Published As

Publication number Publication date
EP1831797A2 (en) 2007-09-12
WO2006052875A3 (en) 2009-04-30
WO2006052875A2 (en) 2006-05-18
EP1831797A4 (en) 2009-11-04
CA2585681A1 (en) 2006-05-18
US20060101048A1 (en) 2006-05-11

Similar Documents

Publication Publication Date Title
JP2008522253A (ja) Kストア(KStore)データアナライザ
Kelleher et al. Data science
US11681694B2 (en) Systems and methods for grouping and enriching data items accessed from one or more databases for presentation in a user interface
Brachman et al. Mining business databases
Nisbet et al. Handbook of statistical analysis and data mining applications
US6820089B2 (en) Method and system for simplifying the use of data mining in domain-specific analytic applications by packaging predefined data mining models
US9110957B2 (en) Data mining in a business intelligence document
US9864966B2 (en) Data mining in a business intelligence document
Guruler et al. Modeling student performance in higher education using data mining
Chang et al. Using data mining technology to solve classification problems: A case study of campus digital library
Bhatia et al. Machine Learning with R Cookbook: Analyze data and build predictive models
Adewole et al. Frequent pattern and association rule mining from inventory database using apriori algorithm
Midha et al. A survey on classification techniques in data mining
Pujari et al. Exploiting data mining techniques for improving the efficiency of time series data using spss-clementine
Greiner What is Data Analysis and Data Mining
Baig et al. Data Science for Marketing Analytics: A practical guide to forming a killer marketing strategy through data analysis with Python
Liu Apache spark machine learning blueprints
Sumathi et al. Data warehousing, data mining, and OLAP
Paul et al. Data Mining Tutorial
Zendler et al. Demonstrating the usage of single-case designs in experimental software engineering
Agarwal et al. Data mining and data warehousing
Mandrai et al. A survey of conceptual data mining and applications
Priya Retail Data Analytics Using Graph Database
Veni et al. A review on duo mining techniques
Limsurut et al. Event-based Feature Synthesis: Autonomous Data Science Engine

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20090203