JP2013232183A - データ解決システム - Google Patents

データ解決システム Download PDF

Info

Publication number
JP2013232183A
JP2013232183A JP2013067916A JP2013067916A JP2013232183A JP 2013232183 A JP2013232183 A JP 2013232183A JP 2013067916 A JP2013067916 A JP 2013067916A JP 2013067916 A JP2013067916 A JP 2013067916A JP 2013232183 A JP2013232183 A JP 2013232183A
Authority
JP
Japan
Prior art keywords
analysis
data
data set
module
analysis module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013067916A
Other languages
English (en)
Inventor
Krishnan Karthik
クリシュナン カーティク
Dhingra Deepinder
ディングラ ディーピンダー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mu Sigma Business Solutions Pvt Ltd
Original Assignee
Mu Sigma Business Solutions Pvt Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mu Sigma Business Solutions Pvt Ltd filed Critical Mu Sigma Business Solutions Pvt Ltd
Publication of JP2013232183A publication Critical patent/JP2013232183A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Automatic Analysis And Handling Materials Therefor (AREA)
  • Debugging And Monitoring (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

【課題】再使用可能性を可能にし、新規採用者の手はずを整える時間を低減し、現在のインフラ投資からの価値を最大化するプラットフォームを構築できるシステム及び方法を提供する。
【解決手段】複数のデータセットを複数のソースから受信し、複数のデータセットを解析データセットに変換するように構成されるデータ処理モジュールを使用して、複数のデータセットを解析するように構成される解析モジュールを備える。また、解析データセット内に存在する複数の相関を特定するように構成される探索的解析モジュールであって、複数の相関は、1つ又は複数の解の特定に使用される、探索的解析モジュールを備える。また、解析モジュールに結合され、1人又は複数のユーザーが解析モジュールと対話できるように構成されるグラフィカルユーザーインターフェースと、複数のデータセット及び解析データセットを記憶するように構成される記憶モジュールと、を更に備える。
【選択図】図1

Description

本発明は、データ解決システム及びデータ解決技法に関する。より詳細には、本発明は、複数のソースから受信した幾つかのデータセットを解析して、特定の問題に1つ又は複数の最適解を提供することに関する。
近年、解析業界が成熟し、競争が増すにつれて、解析費用に対する投資利益率(ROI)を正当化し、事業価値を証明する必要性が増している。特に、解析に基づく意志決定の事業問題の範囲及び数は指数的に増大するため、解析を事業の速度に保つことが極めて重要である。今日の急速に成長しているグローバル事業環境では、優れた解析解に対する必要性が以前よりも大きい。
一方、既存の解決策に伴う重要な問題の幾つかは、組織内でベストプラクティスを推進する際の難しさ、並びにチーム間の連携及び相互学習を保証することである。リソース時間を解放し、符号化及び実行から事業解釈に再び目的を持たせる必要性もある。さらに、解析を実行しながらベストプラクティスに少しずつ向かうツールを提供することが望ましい。
したがって、再使用可能性を可能にし、新規採用者の手はずを整える時間を低減し、現在のインフラ投資からの価値を最大化するプラットフォームを構築できるシステム及び方法が必要である。
簡潔にいうと、本発明の一実施の形態によれば、複数のデータセットを解析して、1つ又は複数の問題に対する1つ又は複数の解を特定するシステムが提供される。本システムは、複数のデータセットを複数のソースから受信し、複数のデータセットを解析データセットに変換するように構成されるデータ処理モジュールを使用して、複数のデータセットを解析するように構成される解析モジュールを備える。該解析モジュールは、前記解析データセット内に存在する複数の相関を特定するように構成される探索的解析モジュールであって、前記複数の相関は、前記1つ又は複数の解の特定に使用される、探索的解析モジュールも備える。該システムは、前記解析モジュールに結合され、ユーザーが該解析モジュールと対話できるように構成されるグラフィカルユーザーインターフェースと、前記複数のデータセット及び前記解析データセットを記憶するように構成される記憶モジュールと、を更に備える。
別の実施の形態では、1つ又は複数の永続的なコンピューター可読記憶媒体を備える、1つ又は複数のプロセッサを含むコンピューター実施システムが提供される。該システムは、前記1つ又は複数のプロセッサに、複数のデータセットを複数のソースから受信する動作と、前記複数のデータセットを調整して、解析データセットを生成する動作と、探索的データ解析を前記解析データセットに対して実行して、前記解析データセット内に存在する複数の相関を特定する動作と、を含む動作を実行させるように構成される命令を含む。前記プロセッサは、前記探索的データ解析の結果に基づいて複数のモデルを生成する動作であって、各モデルは、ユーザーにより決定される目標を達成する1つ又は複数の解を提供する、生成する動作を含む動作を更に実行する。
本発明のこれらの特徴、態様及び利点、並びに他の特徴、態様及び利点は、添付の図面を参照しながら以下の詳細な説明が読まれるときに、更に理解が進むことになる。なお、図面において、類似の文字は、図面全体を通して類似の部分を表す。
本技法の態様により実施されるデータ解析システムの一実施形態のブロック図である。 本技法の態様により実施される解析モジュールの一実施形態のブロック図である。 異なるソースからの種々のデータを本技法の態様に従って処理する一方法を示すフローチャートである。 本技法の態様に従って実施される汎用コンピューターのブロック図である。 本技法の態様に従って実施されるグラフィカルユーザーインターフェースのスクリーンショット例を示す。 本技法の態様に従って実施されるグラフィカルユーザーインターフェースのスクリーンショット例を示す。 本技法の態様に従って実施されるグラフィカルユーザーインターフェースのスクリーンショット例を示す。 本技法の態様に従って実施されるグラフィカルユーザーインターフェースのスクリーンショット例を示す。 本技法の態様に従って実施されるグラフィカルユーザーインターフェースのスクリーンショット例を示す。 本技法の態様に従って実施されるグラフィカルユーザーインターフェースのスクリーンショット例を示す。 本技法の態様に従って実施されるグラフィカルユーザーインターフェースのスクリーンショット例を示す。 本技法の態様に従って実施されるグラフィカルユーザーインターフェースのスクリーンショット例を示す。
以下の詳細な説明において、本明細書の一部を形成する添付の図面が参照される。図面では、文脈において別段の指示がない限り、類似の記号は一般的に類似の構成要素を識別する。詳細な説明、図面及び特許請求の範囲において説明される例示的な実施形態は限定することを意図していない。本明細書において提示される発明主題の趣旨又は範囲から逸脱することなく、他の実施形態を利用することができ、他の変更を加えることができる。本明細書において包括的に説明され、図面に示されるような、本開示の態様は、多種多様の異なる構成において配置し、代用し、組み合わせ、切り離し、設計することができ、その全てが本明細書において明確に考慮されていることが容易に理解されよう。
実施形態例は、包括的には、幾つかのソースから受信した複数のデータセットを解析して、1つ又は複数の問題の解を特定するデータ解決システムを対象とする。本明細書で使用される場合、受信されるデータセットは、種々のソーシャルメディアから受信されるデータセット、製品の販売に関するデータセット、特定の製品の販売促進キャンペーンに関して収集されるマーケティングデータ等を指すことができる。
図1は、種々の入力データソースから複数のデータセットを受信するように構成されるデータ解決システムの一実施形態のブロック図である。データ解決システム10は、種々のソースから受信したデータセットを解析して、解析を実行するための、ガイド付きのインタラクティブなホワイトボックス環境を提供するように構成される。データ解決システム10の各ブロックについて更に詳細に後述する。
データ解決システム10は、種々の入力データソース18、20、及び22に接続し、データセット24、26、及び28にそれぞれアクセスするように構成される。データセットの例としては、ソーシャルメディア、売上高、マーケティングチャネル等からのデータセットが挙げられる。一実施形態では、ユーザーは、データセットを取得する入力データソースを選択することができる。本明細書で使用される場合、「ユーザー」という用語は、一般人及び「ユーザー」として動作する他のエンティティを指すことができる。例としては、企業、組織、会社、チーム、又は他の人々のグループが挙げられる。ユーザーが、異なるチャネルを介して受信するデータセットに対してデータ解析を実行するように訓練されたデータアナリストを指すことができることに留意することもできる。
データ解決システム10はグラフィカルユーザーインターフェース12を含み、グラフィカルユーザーインターフェース12は、一人又は複数のユーザーが入力を解析モジュール14に提供できるように構成される。一実施形態では、グラフィカルユーザーインターフェースは、ユーザーが関心のある選択肢を選択できるようにする拡張メニューを含む。
解析モジュール14は、受信したデータセットを解析し、ユーザーにより定義される問題の詳細な統計解析に基づいて最適解を生成するように構成される。そのような問題の例としては、製品販売の主要推進要因を特定すること、又は顧客に影響する主因を特定すること等を挙げることができる。一般に、解析モジュール14は、実行プロセスをガイド付きで効率的なものにするように、解析ノウハウを捕捉して、ワークフローを射影するように構成される。そして、これにより、ユーザーは、洞察収集に費やされる時間を増大させることができる。解析モジュール14は、解析データセットに対して実行された解析の視覚的表現を生成するようにも構成される。
記憶モジュール16は、複数のデータセット及び解析データセットを記憶するように構成される。さらに、記憶モジュール16は、解析モジュールにより生成される視覚的表現を記憶するように構成される。解析モジュールは幾つかのモジュールを含み、各モジュールについて更に詳細に後述する。
図2は、本技法の態様により実施される解析モジュールの一実施形態のブロック図である。上述したように、解析モジュール14は、幾つかのデータセットを解析し、ユーザーにより定義された目標に向けてユーザーが1つ又は複数の解を特定できるようにする1つ又は複数のデータモジュールを生成する。解析モジュール14は、幾つかの統計プロセスを実施して、主要事業意志決定をしながら、ユーザーに恩益のある出力を生成する複数のモジュールを含む。後述するモジュールを、問題を解決するため、又は目標を達成するために必要であるとユーザーが信じる任意の順序で組み合わせることができることに留意することができる。解析モジュール14の各ブロックについて更に詳細に後述する。
データ処理モジュール30は、複数のソースから受信した複数のデータセットを組み合わせて、解析データセットにするように構成される。解析データセットは、解析モジュールに適したフォーマットである。
品質解析モジュール32は、解析データセットの属性を特定するように構成される。例えば、一意値プロビジョニング、データプロファイリング、欠落又は異常値処理、及びデータ変換が、品質解析モジュールにより実行される機能のうちの幾つかである。品質解析モジュールは、コンテンツリポートを生成するように構成され、それにより、データセット内の全ての変数の基本特徴を導出できるようにする。
探索的データ解析(EDA)モジュール34は、解析データセット内に存在する複数の相関を特定するように構成される。一実施形態では、複数の相関を使用して、1つ又は複数の解を特定する。EDAモジュール34は、データセット演算、変数処理、データサマリー、データ探索、及びデータ処理を可能にする。
データセット演算により、解析中の任意の段階でデータセットの追加及びエクスポートが可能になる。このモジュールにより、データセットの変数にわたってデータを解析することも可能になる。EDAにおける変数処理は、数値、文字列、及び変数内の別個の値に基づく手動分類への変数の名前変更及び分類を含む。さらに、EDAにおける変数処理は、分類インジケータ、イベントインジケータ、ビニング、広告ストック変数、lag/lead変換、移動平均等を含む新しい変数作成も含む。
EDAモジュール34の他の能力は、解析データセットの視覚的表現を有するデータサマリー、変数での一意値のカウント、及び広範囲の選択肢を有する統計的サマリーを含む。続けて、データ探索も、EDAのサポートされる主要な能力のうちの1つである。これは視覚化(チャート)及び頻度解析を含むカスタムモジュール等をサポートする。EDAは、データを一変量、多変量、欠落、異常値、及び変換の処理として扱う。
一実施形態では、EDAモジュールは、一変量解析及び二変量解析を解析データセットに対して実施する。一実施形態例では、一変量解析を通じて、解析データセットへの定量的(統計的)解析が実行される。この解析は、適用可能な解析単位の1つの変数及びその属性の記述を用いて実行される。一変量解析では、位置の測定値、分散の測定値、正規性検定、分布、パーセンタイル値、及びそれらの組み合わせのような属性が可能である。別の実施形態例では、探索的解析モジュールは、多変量解析を解析データセットに適用するように構成される。二変量解析は、1つ又は複数の統計属性に関する変動を特定することを含む。
解析モジュール14は、ユーザーが指定した問題に対する1つ又は複数の解の1つ又は複数のモデル表現を生成するように構成されたデータモデリングモジュール36を更に備える。一実施形態では、モデリングモジュール36は、回帰技法を使用して、掘り下げた解析を提供する。一実施形態では、解析データセットの平均、分散、及び共分散に基づいてモデルが生成される。データモデリングモジュールは、多変量処理、新変数作成、及び二変量解析をサポートして、従属変数にわたる独立変数の分布を研究するように構成される。
ステップ幅変数消去、相関及び因子解析に基づく変数セグメント化等のモデル構築選択肢を使用することができ、バイアスされた母集団で構築することができる。それにより、容易に変数をなくして、複数の反復を通して反復し、最適モデルを得ることができる。これは、変数消去のためのアルゴリズム回帰を含み、高度影響統計に基づく多変量異常値診断も含む。
解析モジュール14は、モデル評価及び検証能力を更に提供する。これは、モデル統計、変数統計出力チャート及び表に基づく。正確性及び安定性のために、異なる状況でのサンプル内及びサンプル外検証を有する。ブートストラップを行い、反復にわたりモデル統計を比較することができる。複数のチャンピオンモデルのスコア付け及び出力の比較を提供するモデルスコア付けもサポートされる。
報告モジュール38は、1つのユーザーインターフェースから解析モジュールにより生成されるすべてのリポートへの容易なアクセスを提供する。リポートのタイプの例としては、複数の分類変数の全ての別個のレベルにわたるコンテンツリポート、頻度リポート、一変量サマリーリポート、多変量サマリーリポート等が挙げられる。さらに、異なる変数及び選択肢を有する複数のリポートを生成することができ、Excel、pdf等のフォーマットに直接エクスポートすることができる。
報告モジュールは、ユーザーに対し、よりよい洞察を生成するために、全ての出力が1箇所に収集されることを保証する。異なるリポートを1箇所で報告の枠組み内で見ることができ、結果比較を計算することもできる。結果は、複数のリポートにわたって容易に比較することができる。洞察生成は、この別の特徴である。洞察は、報告の枠組みを使用して迅速に生成することができ、事業論理に容易に関連付けることができる。
図3は、異なるソースからの種々のデータセットが本技法の態様に従って処理される一方法を示すフローチャートである。上述したように、異なるデータセットは、販売、マーケティング、ソーシャルメディアデータベース等からのデータセットを指す。ソーシャルメディアデータを解析するプロセス40について更に詳細に後述する。
ステップ42において、データセットが1つ又は複数の入力データソースから検索される。幾つかのソースから受信したデータセットが解析されて、特定の問題に対する解が求められる。一般に、入力データセットは、或る特定の製品のキーワード、製品名、事業又は組織の名称等を含むことができる。一実施形態では、データセットはテキスト文字列及び数値データを含む。
ステップ44において、受信したデータセットを調整して、解析データセットを生成する。或る特定の条件を適用することにより、データ処理を実行して、新しい変数を作成する。新しいデータセットは、既存のデータセットを操作することにより作成することもできる。
一実施形態例では、データセットへの一変量操作が実行された。一変量操作は、インクリメント動作又はデクリメント動作及び変数を変更する必要がある特定値の選択を含む。別の実施形態例では、データセットへの二変量操作が実行された。二変量操作は、2つ以上の変数のための演算を選択し、演算値を新しい変数に割り当てることにより実行される。
ステップ46において、解析データセットの品質が評価される。品質評価では、演算にとって重要な次元を識別する必要があるとともに、その次元を構成する変数を精密に定義する必要がある。品質評価に使用される因子の例は、正確性、完成度、一貫性、及び適時性である。
ステップ48において、セグメント化モジュールが、属性に基づいて解析データセットをクラスタ化し、属性は、グラフィカルユーザーインターフェースを使用してユーザーにより選択される。
ステップ50において、探索的データ解析が解析データセットに対して実行される。探索的データ解析は、ユーザー定義の問題に対し1つ又は複数の解を求めるのを支援する、解析データセット内に存在する複数の相関を特定する。探索的データ解析により、一変量解析、二変量解析、基本及び高度視覚化、クラスタブ解析、頻度及び属性解析、相関並びに時系列等の複数の解析が可能である。
ステップ52において、データモデルが生成され、1つ又は複数の解が求められる。データモデリングは、回帰技法の掘り下げた解析を提供し、モデル前処理を含む。ステップ54において、リポジトリにより、データ処理ステップ中、品質解析ステップ中、探索的データ解析ステップ中、及びデータモデル生成ステップ中に生成される全てのリポートにアクセスすることができる。
上記の技法は、図1及び図2に示されるデータ解析システムによって実行することができる。上記の技法は、デバイス、システム、方法及び/又はコンピュータープログラム製品として具現することができる。したがって、上記の発明主題のうちの幾つか又は全てをハードウェアにおいて、及び/又はソフトウェア(ファームウェア、常駐ソフトウェア、マイクロコード、状態機械、ゲートアレイ等を含む)において具現することができる。さらに、その発明主題は、命令実行システムによって、又はそれに関連して用いるための媒体内に具現されるコンピューター使用可能プログラムコード又はコンピューター可読プログラムコードを有するコンピューター使用可能記憶媒体又はコンピューター可読記憶媒体上の、解析ツールのようなコンピュータープログラム製品の形をとることができる。この説明の文脈において、コンピューター使用可能媒体又はコンピューター可読媒体は、命令実行システム、装置若しくはデバイスによって、又はそれに関連して用いるためのプログラムを包含するか、記憶するか、通信するか、伝搬させるか、又は輸送することができる任意の媒体とすることができる。
コンピューター使用可能又はコンピューター可読媒体は、例えば、限定はしないが、電子、磁気、光、電磁気、赤外線若しくは半導体システム、装置、デバイス又は伝搬媒体とすることができる。一例であり、限定はしないが、コンピューター可読媒体は、コンピューター記憶媒体及び通信媒体を含むことができる。
発明主題がコンピューター実行可能命令の一般的な状況において具現されるとき、その実施形態は、1つ若しくは複数のシステム、コンピューター又は他のデバイスによって実行されるプログラムモジュールを含むことができる。一般的に、プログラムモジュールは、特定のタスクを実行するか、又は特定の抽象データタイプを実現するルーチン、プログラム、オブジェクト、コンポーネント、データ構造等を含む。通常、プログラムモジュールの機能は種々の実施形態において所望のように組み合わせることもできるし、分散させることもできる。
図4は、種々のソースから検索されたデータセットの特定の問題に対するデータ解を生成するように構成されるコンピューター100の一実施形態を示すブロック図である。コンピューター100は、図3に示されるステップを実行するデータ解析ツールのための命令を実行するように構成される。非常に基本的な構成102では、コンピューター100は通常、1つ又は複数のプロセッサ104と、システムメモリ106とを含む。プロセッサ104とシステムメモリ106との間の通信のためにメモリバス124を用いることができる。
所望の構成に応じて、プロセッサ104は、限定はしないが、マイクロプロセッサ(μP)、マイクロコントローラー(μC)、デジタルシグナルプロセッサ(DSP)、又はそれらの任意の組み合わせを含む、任意のタイプからなることができる。プロセッサ104は、レベル1キャッシュ110及びレベル2キャッシュ112のような1つ又は複数のキャッシュレベル、プロセッサコア114、及びレジスタ116を含むことができる。例示的なプロセッサコア114は、論理演算ユニット(ALU)、浮動小数点ユニット(FPU)、デジタルシグナルプロセッシングコア(DSP Core)又はそれらの任意の組み合わせを含むことができる。プロセッサ104とともに例示的なメモリコントローラー118を用いることができるか、又は実施態様によっては、メモリコントローラー118はプロセッサ104の一体部分とすることができる。
所望の構成に応じて、システムメモリ106は、限定はしないが、揮発性メモリ(RAM等)、不揮発性メモリ(ROM、フラッシュメモリ等)、又はそれらの任意の組み合わせを含む、任意のタイプからなることができる。システムメモリ106は、オペレーティングシステム120、1つ又は複数のアプリケーション122、及びプログラムデータ124を含むことができる。アプリケーション122は、異なるソースから受信した複数のデータセットを解析するように構成されるデータ解析ツール120を含む。プログラムデータ126は、ソーシャルメディアデータ、マーケティングデータ、販売データ等を含むことができる。幾つかの実施形態において、アプリケーション122は、ディスペンシングデバイスと外部実体との間のインタラクションが監視されるように、オペレーティングシステム120上でプログラムデータ126を用いて動作するように構成することができる。この上記の基本構成102は、図4において内側破線内の構成要素によって示される。
コンピューター100は、付加的な機構又は機能、並びに基本構成102と任意の必要とされるデバイス及びインターフェースとの間の通信を容易にするための付加的なインターフェースを有することができる。例えば、ストレージインターフェースバス138を介して基本構成102と1つ又は複数のデータ記憶デバイス132との間の通信を容易にするために、バス/インターフェースコントローラー130を用いることができる。データ記憶デバイス132は、リムーバブル記憶デバイス134、非リムーバブル記憶デバイス136、又はそれらの組み合わせとすることができる。リムーバブル記憶デバイス及び非リムーバブル記憶デバイスの例は、数例を挙げると、フレキシブルディスクドライブ及びハードディスクドライブ(HDD)のような磁気ディスクデバイス、コンパクトディスク(CD)ドライブ又はデジタル多用途ディスク(DVD)ドライブのような光学ディスクドライブ、固体ドライブ(SSD)及びテープドライブを含む。例示的なコンピューター記憶媒体は、コンピューター可読命令、データ構造、プログラムモジュール又は他のデータのような情報を記憶するための任意の方法又は技術において実現される揮発性及び不揮発性のリムーバブル及び非リムーバブル媒体を含むことができる。
システムメモリ106、リムーバブル記憶デバイス134及び非リムーバブル記憶デバイス136がコンピューター記憶媒体の例である。コンピューター記憶媒体は、限定はしないが、RAM、ROM、EEPROM、フラッシュメモリ若しくは他のメモリ技術、CD−ROM、デジタル多用途ディスク(DVD)若しくは他の光学記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置若しくは他の磁気記憶デバイス、又は所望の情報を記憶するために用いることができ、かつコンピューター100によってアクセスすることができる任意の他の媒体を含む。任意のそのようなコンピューター記憶媒体は、コンピューター100の一部とすることができる。
また、コンピューター100は、バス/インターフェースコントローラー130を介して、種々のインターフェースデバイス(例えば、出力デバイス140、周辺機器インターフェース148及び通信デバイス160)から基本構成102への通信を容易にするためのインターフェースバス138も含むことができる。例示的な出力デバイス142は、グラフィックス処理ユニット144及びオーディオ処理ユニット146を含み、それらのユニットは、1つ又は複数のA/Vポート142を介してディスプレイ又はスピーカーのような種々の外部デバイスと通信するように構成することができる。例示的な周辺機器インターフェース148は、シリアルインターフェースコントローラー150又はパラレルインターフェースコントローラー152を含み、それらのコントローラーは1つ又は複数のI/Oポート148を介して入力デバイス(例えば、キーボード、マウス、ペン、音声入力デバイス、タッチ入力デバイス等)又は他の周辺機器デバイス(例えば、プリンター、スキャナー等)のような外部デバイスと通信するように構成することができる。例示的な通信デバイス160はネットワークコントローラー154を含み、このネットワークコントローラーは、1つ又は複数の通信ポート156を介して、ネットワーク通信リンク上で1つ又は複数の他のコンピューター158との通信を容易にするように構成することができる。
ネットワーク通信リンクは、通信媒体の一例とすることができる。通信媒体は通常、搬送波又は他の搬送機構のような、被変調データ信号内のコンピューター可読命令、データ構造、プログラムモジュール又は他のデータによって具現することができ、任意の情報送達媒体を含むことができる。「被変調データ信号」は、その特性のうちの1つ又は複数が、信号内の情報を符号化するように設定又は変更された信号とすることができる。一例であって、限定はしないが、通信媒体は、有線ネットワーク又は直接有線接続のような有線媒体と、音響、無線周波数(RF)、マイクロ波、赤外線(IR)及び他の無線媒体のような無線媒体とを含むことができる。本明細書において用いられるときに、コンピューター可読媒体という用語は、記憶媒体及び通信媒体の両方を含む場合がある。
コンピューター100は、携帯電話、携帯情報端末(PDA)、パーソナルメディアプレーヤーデバイス、無線ウェブウォッチデバイス、パーソナルハンドセットデバイス、特定用途向けデバイス、又は上記の機能のうちのいずれかを含むハイブリッドデバイスのような小さなフォームファクターのポータブル(又は移動)電子デバイスの一部として実現することができる。また、コンピューター100は、ラップトップコンピューター構成及び非ラップトップコンピューター構成の双方を含む、パーソナルコンピューターとして実現することもできる。上記のように、データ解析ツール及びデータ解析システムは、ソーシャルメディアプラットフォームから検索されたソーシャルメディアデータを解析するように構成される。データ解析ツール及びデータ解析システムは、ユーザーが入力データを与え、データ解決システムによって提供される必要な動作を選択するのを容易にするグラフィカルユーザーインターフェースを含むことができる。図5〜図12を参照しながら、幾つかの例示的なユーザーインターフェース画面が以下に示される。
図5は、データアナリスト等であるユーザーが、データセットに対してデータ処理動作を実行して、解析データセットを生成できるようにするグラフィカルユーザーインターフェースのスクリーンショットである。データ処理モジュールは、データアナリストが、画面56に示されるように、新しい変数を追加するか、又は既存のデータセットを操作できるようにする。データアナリストは、データセットに共通の排他的な変数を選択し、検証結果を生成することもできる。データアナリストは、データ処理動作から関連のあるリポートを生成することもできる。
図6は、解析データセットのデータ品質解析の視覚的表現のスクリーンショットである。はっきりと見て取れるように、スクリーンショット58において、品質解析は、一変量サマリーを通じて定量的(統計的)解析をサポートする。一変量サマリーでは、複数の変数の位置の測定値、分散の測定値、正規性検定、分布、パーセントタイル値、及びそれらの組み合わせのような属性が同時に可能になる。
図7は、解析データセットの探索的データ解析の視覚的表現のスクリーンショットである。スクリーンショット60は、確率プロット、ボックスプロット、自己相関プロット、ヒストグラム、平均パーセンタイルプロット、及び標準偏差プロット等の異なるプロットタイプの形態で表現された解析データセットの一変量解析を示す。
同様に、図8のスクリーンショット62は、所与のデータセットの異なる変数の頻度及び属性解析を示す。グラフィカルユーザーインターフェースにより、グラフ又は表フォーマットで視覚化される、頻度、頻度パーセンテージ、別個のカウント、平均等の種々のパラメータを選ぶことが可能になる。図9は、複数の反復でのデータセットの時系列解析を示す。スクリーンショット64は、1回の反復の時系列プロットを示す。
図10は、探索的データ解析の解析結果を表す1つ又は複数のモデルを生成することができるデータモデリングのスクリーンショットである。見て取れるように、図11のスクリーンショット66及び68では、データモデリングにより、線形回帰、ロジスティック回帰、VARMAX、ARIMAX等の種々の分類下でのモデル定義、モデル構築、モデル診断、及びモデルの視覚化履歴が可能になる。モデル構築中、解析データセットの平均、分散、及び共分散に基づいて、1つ又は複数のモデルが生成される。図12は、データアナリストにより種々の段階で行われたデータ解析に基づくコンテンツリポート、平均売り上げリポート等の生成可能な種々のリポート及びチャート又はグラフのスクリーンショット70である。
一般的に、本明細書において、そして特に添付の特許請求の範囲(例えば、添付の特許請求の範囲の本文)において用いられる用語は、包括的に「開放的な(open)」用語として意図されることが当業者には理解されよう(例えば、用語「〜を含んでいる」は、「限定はしないが、〜を含んでいる」と解釈されるべきであり、用語「〜を有する」は「少なくとも〜を有する」と解釈されるべきであり、用語「〜を含む」は、「限定はしないが、〜を含む」と解釈されるべきである等)。具体的な数を請求項の記載(claim recitation)に導入することを意図する場合には、そのような意図が請求項において明示的に記載されることになり、そのような記載がない場合には、そのような意図がないことが当業者には更に理解されよう。
例えば、理解の助けとして、以下の添付の特許請求の範囲は、請求項の記載を導入するために、前置きの言い回し「少なくとも1つ」及び「1つ又は複数の」の使用を含む場合がある。しかしながら、そのような言い回しを使用する場合、同じ請求項が前置きの言い回し「1つ又は複数の」又は「少なくとも1つの」及び数量を特定しない表現(indefinite articles "a" or "an")を含む場合であっても、数量を特定しない表現による請求項の記載の導入が、そのような導入された請求項の記載を含む任意の特定の請求項を、ただ1つのそのような記載を含む実施形態に限定することを意味するように解釈されるべきではない(例えば数量を特定しない表現は、「少なくとも1つの」又は「1つ又は複数の」を意味するものと解釈されるべきである)。同じことは、請求項の記載を導入するために用いられる数量を特定しない表現の使用の場合にも当てはまる。さらに、具体的な数が導入された請求項の記載が明示的に記載される場合であっても、そのような記載が、「少なくとも記載された数」を意味するように解釈されるべきであることが当業者には理解されよう(例えば、他の修飾語を用いない、「2つの記載」のそのままの記載は、少なくとも2つの記載、又は2つ以上の記載を意味する)。
本明細書において、幾つかの実施形態の或る特定の特徴のみが図示及び説明されてきたが、数多くの変更及び変形が当業者には思い浮かぶであろう。それゆえ、添付の特許請求の範囲は、本発明の真の趣旨に入るような全ての変更及び変形を包含することを意図していることを理解されたい。

Claims (15)

  1. 複数のデータセットを解析して、1つ又は複数の問題に対する1つ又は複数の解を特定するシステムであって、
    複数のデータセットを複数のソースから受信するように構成された解析モジュールであって、
    前記複数のデータセットを解析データセットに変換するように構成されるデータ処理モジュール、及び
    前記解析データセット内に存在する複数の相関を特定するように構成される探索的解析モジュールであって、前記複数の相関は、前記1つ又は複数の解の特定に使用される、探索的解析モジュール、
    を使用して、前記複数のデータセットを解析するように構成される解析モジュールと、
    前記解析モジュールに結合され、ユーザーが該解析モジュールと対話できるように構成されるグラフィカルユーザーインターフェースと、
    前記複数のデータセット及び前記解析データセットを記憶するように構成される記憶モジュールと、
    を備える、システム。
  2. 前記解析モジュールは、前記探索的解析モジュールにより生成される前記1つ又は複数の解を表す1つ又は複数のモデルを生成するように構成されるデータモデリングモジュールを更に備える、請求項1に記載のシステム。
  3. 前記1つ又は複数のモデルは、前記解析データセットの平均、分散、及び共分散に基づいて生成される、請求項2に記載のシステム。
  4. 前記解析モジュールは、前記ユーザーが、一箇所で、前記探索的解析モジュール及び前記データモデリングモジュールにより生成される複数のリポートにアクセスすることを可能にするように構成される報告モジュールを更に備える、請求項1に記載のシステム。
  5. 前記解析モジュールは、前記データ処理モジュールに結合され、前記解析データセットの品質を評価するように構成される品質解析モジュールを更に備える、請求項1に記載のシステム。
  6. 前記探索的解析モジュールは、一変量解析を前記解析データセットに適用するように構成され、前記二変量解析は、1つ又は複数の統計属性に従って前記解析データセットを表すことを含む、請求項1に記載のシステム。
  7. 前記探索的解析モジュールは、一変量解析を前記解析データセットに適用するように構成され、前記一変量解析は、1つ又は複数の統計属性に関する変動を特定することを含む、請求項1に記載のシステム。
  8. 前記探索的解析モジュールは、前記解析データセットの視覚的表現を生成するように更に構成される、請求項7に記載のシステム。
  9. 前記解析モジュールは、属性に基づいて前記解析データセットをクラスタ化するように構成されるセグメント化モジュールを更に備え、前記属性は前記ユーザーにより選択される、請求項1に記載のシステム。
  10. 前記解析モジュールが使用する複数の境界パラメータは、前記ユーザーにより定義される、請求項8に記載のシステム。
  11. コンピューター実施システムであって、
    1つ又は複数のプロセッサと、
    命令を含む1つ又は複数の永続的なコンピューター可読記憶媒体と、
    を備え、前記命令は、前記1つ又は複数のプロセッサに、
    複数のデータセットを複数のソースから受信する動作と、
    前記複数のデータセットを調整して、解析データセットを生成する動作と、
    探索的データ解析を前記解析データセットに対して実行して、該解析データセット内に存在する複数の相関を特定する動作と、
    前記探索的データ解析の結果に基づいて複数のモデルを生成する動作であって、各モデルは、ユーザーにより決定される事前定義される目標を達成する1つ又は複数の解を提供する、生成する動作と、
    を含む動作を実行させるように構成される、システム。
  12. 前記解析データセットの品質を評価することを更に含む、請求項11に記載のシステム。
  13. 探索的データ解析及びデータモデリングの複数のリポートを生成することを更に含む、請求項11に記載のシステム。
  14. 前記複数のリポートを記憶して、前記ユーザーが一箇所から前記複数のリポートにアクセスできるようにすることを更に含む、請求項13に記載のシステム。
  15. 前記ユーザーにより選択される属性に基づいて、前記解析データセットをクラスタ化することを更に含む、請求項11に記載のシステム。
JP2013067916A 2012-03-29 2013-03-28 データ解決システム Pending JP2013232183A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
IN1226-CHE-2012 2012-03-29
IN1226CH2012 2012-03-29

Publications (1)

Publication Number Publication Date
JP2013232183A true JP2013232183A (ja) 2013-11-14

Family

ID=48050465

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013067916A Pending JP2013232183A (ja) 2012-03-29 2013-03-28 データ解決システム

Country Status (10)

Country Link
US (1) US20130262348A1 (ja)
EP (1) EP2648152A1 (ja)
JP (1) JP2013232183A (ja)
KR (1) KR20140139521A (ja)
CN (1) CN103440164A (ja)
AU (1) AU2013202136A1 (ja)
BR (1) BR102013007775A2 (ja)
SG (1) SG193764A1 (ja)
WO (1) WO2013144980A2 (ja)
ZA (1) ZA201305211B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230003914A (ko) * 2021-06-30 2023-01-06 (주)브릭 데이터 분포 변환 방법 및 장치

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140195462A1 (en) * 2013-01-10 2014-07-10 Musigma Business Solutions Pvt. Ltd. Data management system and tool
US11309060B2 (en) * 2013-06-24 2022-04-19 Koninklijke Philips N.V. System and method for real time clinical questions presentation and management
CN104751235A (zh) * 2013-12-27 2015-07-01 伊姆西公司 用于数据挖掘的方法和装置
US10346393B2 (en) * 2014-10-20 2019-07-09 International Business Machines Corporation Automatic enumeration of data analysis options and rapid analysis of statistical models
KR101702755B1 (ko) * 2015-06-05 2017-02-03 강원대학교산학협력단 로우 데이터 처리 장치 및 방법
US10579627B2 (en) 2016-01-08 2020-03-03 Microsoft Technology Licensing, Llc Database operation using metadata of data sources
US10929421B2 (en) * 2017-06-08 2021-02-23 Sap Se Suggestion of views based on correlation of data
US11250343B2 (en) 2017-06-08 2022-02-15 Sap Se Machine learning anomaly detection
EP3743826A4 (en) * 2018-01-26 2021-11-10 GE Inspection Technologies, LP AUTONOMOUS PLATFORM FOR HYBRID ANALYSIS MODELING
AU2019212931A1 (en) * 2018-01-29 2020-08-27 Gen-Probe Incorporated Analytical systems and methods
US10445422B2 (en) * 2018-02-09 2019-10-15 Microsoft Technology Licensing, Llc Identification of sets and manipulation of set data in productivity applications
CN108399951B (zh) * 2018-03-12 2022-03-08 东南大学 呼吸机相关性肺炎决策辅助方法、装置、设备及介质
EP3570227A1 (en) * 2018-05-16 2019-11-20 Ernst & Young GmbH Wirtschaftsprüfungsgesellschaft Interactive user interface for regression planning and evaluation system
US10684762B2 (en) * 2018-08-27 2020-06-16 Sap Se Analytics design system
US11057102B2 (en) * 2019-04-18 2021-07-06 Microsoft Technology Licensing, Llc On-platform analytics

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002009772A (ja) * 2000-04-12 2002-01-11 Hewlett Packard Co <Hp> インターネット使用量分析方法
JP2003509747A (ja) * 1999-09-09 2003-03-11 イージス アナリティカル コーポレイション 医薬及びその他のキャピタルインテンシブ製造プロセスの分析、改善のためのシステム。
JP2004133652A (ja) * 2002-10-10 2004-04-30 Business Brain Showa Ota Inc 経営ソリューションシステム、およびコンピュータ・プログラム
JP2009064191A (ja) * 2007-09-05 2009-03-26 Sharp Corp 情報検索支援装置、情報検索支援方法、プログラムおよび記録媒体
JP2009205431A (ja) * 2008-02-27 2009-09-10 Dentsu Inc 情報処理装置、情報処理方法及び情報処理用プログラム
JP2011530138A (ja) * 2008-08-04 2011-12-15 クイッド インコーポレイテッド 事業体の業績分析エンジン

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6768973B1 (en) * 2000-04-12 2004-07-27 Unilever Home & Personal Care Usa, Division Of Conopco, Inc. Method for finding solutions
US6757667B1 (en) * 2000-04-12 2004-06-29 Unilever Home & Personal Care Usa, Division Of Conopco, Inc. Method for optimizing formulations
US7617201B1 (en) * 2001-06-20 2009-11-10 Microstrategy, Incorporated System and method for analyzing statistics in a reporting system
US7284204B2 (en) * 2002-03-29 2007-10-16 International Business Machines Corporation System, method, and visual user interface for evaluating and selecting suppliers for enterprise procurement
WO2004053659A2 (en) * 2002-12-10 2004-06-24 Stone Investments, Inc Method and system for analyzing data and creating predictive models
US20040138933A1 (en) * 2003-01-09 2004-07-15 Lacomb Christina A. Development of a model for integration into a business intelligence system
EP1658567A4 (en) * 2003-07-18 2008-01-30 Commw Scient Ind Res Org METHOD AND SYSTEM FOR SELECTION OF ONE OR MORE VARIABLES FOR USE WITH A STATISTICAL MODEL
US7251578B1 (en) * 2006-03-10 2007-07-31 Yahoo! Inc. Method and system of measuring data quality
US8027864B2 (en) * 2006-11-22 2011-09-27 Proclivity Systems, Inc. System and method for providing e-commerce consumer-based behavioral target marketing reports
US20100121707A1 (en) * 2008-11-13 2010-05-13 Buzzient, Inc. Displaying analytic measurement of online social media content in a graphical user interface
US8756229B2 (en) * 2009-06-26 2014-06-17 Quantifind, Inc. System and methods for units-based numeric information retrieval
US8401984B2 (en) * 2009-08-26 2013-03-19 Yahoo! Inc. Identification and measurement of social influence and correlation
US8554756B2 (en) * 2010-06-25 2013-10-08 Microsoft Corporation Integrating social network data with search results
US9262517B2 (en) * 2010-08-18 2016-02-16 At&T Intellectual Property I, L.P. Systems and methods for social media data mining
US9207251B2 (en) * 2011-04-19 2015-12-08 Roche Molecular Systems, Inc. User interaction with automated analytical apparatus

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003509747A (ja) * 1999-09-09 2003-03-11 イージス アナリティカル コーポレイション 医薬及びその他のキャピタルインテンシブ製造プロセスの分析、改善のためのシステム。
JP2002009772A (ja) * 2000-04-12 2002-01-11 Hewlett Packard Co <Hp> インターネット使用量分析方法
JP2004133652A (ja) * 2002-10-10 2004-04-30 Business Brain Showa Ota Inc 経営ソリューションシステム、およびコンピュータ・プログラム
JP2009064191A (ja) * 2007-09-05 2009-03-26 Sharp Corp 情報検索支援装置、情報検索支援方法、プログラムおよび記録媒体
JP2009205431A (ja) * 2008-02-27 2009-09-10 Dentsu Inc 情報処理装置、情報処理方法及び情報処理用プログラム
JP2011530138A (ja) * 2008-08-04 2011-12-15 クイッド インコーポレイテッド 事業体の業績分析エンジン

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230003914A (ko) * 2021-06-30 2023-01-06 (주)브릭 데이터 분포 변환 방법 및 장치
KR102615133B1 (ko) * 2021-06-30 2023-12-19 (주)브릭 데이터 분포 변환 방법 및 장치

Also Published As

Publication number Publication date
WO2013144980A3 (en) 2013-12-05
ZA201305211B (en) 2014-05-28
BR102013007775A2 (pt) 2018-01-23
SG193764A1 (en) 2013-10-30
EP2648152A1 (en) 2013-10-09
CN103440164A (zh) 2013-12-11
WO2013144980A2 (en) 2013-10-03
AU2013202136A1 (en) 2013-10-17
KR20140139521A (ko) 2014-12-05
US20130262348A1 (en) 2013-10-03

Similar Documents

Publication Publication Date Title
JP2013232183A (ja) データ解決システム
US11361004B2 (en) Efficient data relationship mining using machine learning
US7730023B2 (en) Apparatus and method for strategy map validation and visualization
Khakabimamaghani et al. QuateXelero: an accelerated exact network motif detection algorithm
US11966873B2 (en) Data distillery for signal detection
US20130191395A1 (en) Social media data analysis system and method
Felix et al. The exploratory labeling assistant: Mixed-initiative label curation with large document collections
WO2013161850A1 (ja) テキストマイニングシステム、テキストマイニング方法及びプログラム
US11037096B2 (en) Delivery prediction with degree of delivery reliability
US9760592B2 (en) Metrics management and monitoring system for service transition and delivery management
TW201802709A (zh) 引導分析系統和方法
CN108932320A (zh) 文章搜索方法、装置及电子设备
US20220076157A1 (en) Data analysis system using artificial intelligence
JP2015219901A (ja) 事業問題ネットワーキングシステムおよびツール
Qatawneh The influence of data mining on accounting information system performance: a mediating role of information technology infrastructure
US20170300461A1 (en) Representation of an Interactive Document as a Graph of Entities
JPWO2017203672A1 (ja) アイテム推奨方法、アイテム推奨プログラムおよびアイテム推奨装置
US20080208528A1 (en) Apparatus and method for quantitatively measuring the balance within a balanced scorecard
JP2023118076A (ja) グラフ説明可能人工知能の相関
TW201911083A (zh) 用於回饋及判定之語意屬性的動態合成與暫態叢集之系統及方法
JP6026036B1 (ja) データ分析システム、その制御方法、プログラム、及び、記録媒体
Carbery et al. Missingness analysis of manufacturing systems: a case study
JP5767177B2 (ja) Ictソリューション環境影響評価システムおよび方法
Shaikhislamov et al. Smart Clustering of HPC Applications Using Similar Job Detection Methods
Gadde et al. Estimate House Price Using Machine Learning

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160317

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170306

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170418

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20171121