JP2018521391A - ビッグデータの計算方法及びシステム、プログラムならびに記録媒体 - Google Patents

ビッグデータの計算方法及びシステム、プログラムならびに記録媒体 Download PDF

Info

Publication number
JP2018521391A
JP2018521391A JP2017560572A JP2017560572A JP2018521391A JP 2018521391 A JP2018521391 A JP 2018521391A JP 2017560572 A JP2017560572 A JP 2017560572A JP 2017560572 A JP2017560572 A JP 2017560572A JP 2018521391 A JP2018521391 A JP 2018521391A
Authority
JP
Japan
Prior art keywords
data
instruction information
big data
calculation
case
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017560572A
Other languages
English (en)
Other versions
JP6694447B2 (ja
Inventor
リュウ,ヨン
ルー,シャオフゥイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Publication of JP2018521391A publication Critical patent/JP2018521391A/ja
Application granted granted Critical
Publication of JP6694447B2 publication Critical patent/JP6694447B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本発明は、ビッグデータの計算方法及びシステムを提供し、前記方法は、ビッグデータを計算する指示情報を取得するステップ(S102)と、指示情報に基づいてビッグデータ中の一部のデータを計算し、計算結果を出力するステップ(S104)と、を含む。前記方法及びシステムによれば、従来技術のビッグデータシステムアーキテクチャにおいてタスクの計算を全部完了してこそ結果を提供できることに起因する問題を解決し、さらに、制約条件内で最も大きい可能性で意思決定を協力する効果を達成する。
【選択図】図1

Description

本発明は、通信分野に関し、特にビッグデータの計算方法及びシステムに関する。
Googleを始め、ビッグデータ技術が世界を風靡しており、Hadoopに基づく様々なアプリケーションも百花斉放な局面を呈している。ビッグデータアプリケーションの影響が日に日に拡大されている。機関の推計によると、世界中のデータ総量は隔年倍になる速度で増加されている。つまり、過去2年間で生成されたデータ総量は過去全てのデータ量の合計に相当する。このような背景下で、企業戦略から産業エコシステムまで、学術研究から生産実践まで、都市管理から国家管理まで、いずれも本質的な変化が発生される。
ビッグデータとは、サイズが従来のデータツールの取得、記憶、管理及び分析能力を超えるデータセットであり、必ずしも特定のTB値を超えるデータセットがビッグデータであるわけではない。インターナショナルデータコーポレーション(IDC)は、大容量なデータ規模(Volume)、迅速なデータ転送及び動的データ体系(Velocity)、多様なデータタイプ(Variety)及び巨大なデータ価値(Value)の4つの特徴からビッグデータを定義している。
大規模データの記憶・計算をサポートする必要があるので、ビッグデータの処理は、通常クラスタに基づく分散記憶及び並列コンピューティングアーキテクチャ及びハードウェアプラットフォームを使用する必要がある。上記の問題に対して、オープンソースコミュニティ及び国内外のメーカーは、対応する試みと努力を行っている。ビッグデータ照会分析の典型的なシステムは、HadoopでのHBase及びHive、Facebookにより開発されたCassandra、Google会社のDremel、Cloudera会社のImpalaであり、その以外に、より高い性能のデータ照会分析を実現するために、UC Berkeley AMPLabのメモリに基づいてエンジンSparkを計算するデータ倉庫Sharkのようなメモリに基づく分散データ記憶管理及び照会システムも多く出現された。それ以外に、EMCのGreenPlum、HPのVerticaのようなMPP(massively parallel processing)データベースもある。ビッグデータのバッチ処理に最適な計算モードはMapReduceである。MapReduceは単入力、二段階(Map及びReduce)のデータ処理プロセスである。MapReduceは、簡単で使い勝手がよい特性を有しているために、現在ビッグデータ処理において最も成功し、最も広く受け入れられる主流な並列計算モードになっている。オープンソースコミュニティの努力下で、Hadoopシステムは、現在成熟したビッグデータ処理プラットフォームに発展され、多くのデータ処理ツール及び環境を含む完全なエコシステムに発展されている。Sparkもバッチ処理システムであり、性能の面ではHadoop MapReduceよりあまりに大きい向上があるが、その使い勝手及び安定性は、現在まだHadoop MapReduceに及ばない。
しかし、これらのフレーム、アプリケーション、アルゴリズムは、いずれも最終結果を計算して意思決定者が意思決定(Decision)できるようにさせ、したがって、不完全計算結果のような非常に有用な段階性結果を無視した。現在、これらのフレームのやり方は、いずれも計算タスクの提出前に、タスクの全ての方面を厳密に定義しなければならず、一旦タスクが提出された後は、タスクは元々の設定の規則に従って動作し、タスクが全部完了されてこそ価値のある結果を与えることができる。大量(TB、PB、EBレベル……)及び長時間演算(十数時間乃至数十時間)の背景下で、段階性演算された結果は、意思決定者が分析して意思決定できるようにさせることができる。10T、20T、30T……又は1h、2h、3h……(次元は定義可能である)で演算して得られる結果は、最終的、正確な結果に向かっており、この過程の結果は、意思決定者が分析して意思決定できるようにさせることができる。
法的調査、行方不明者の探し、ひき逃げ、特性商品のフィルタリング等のような大規模データ分析類タスクは、制限時間内で問題を解決する必要があり、通常のビッグデータシステムアーキテクチャにおいては、いずれもタスクの計算を全部完了してこそ結果を提供することができる。したがって、チャンスを逃す虞がある。金融調査、石油探査の方面のような他の商業におけるタスクは、データ量があまりに多く、金融業務、石油業務のような方面では、全面的な分析を行う十分な時間がないので、段階性、ひいてはサンプル統計性の結果であっても、これらの商業意思決定において重要な役割を果たすことができる。
ビッグデータシステムアーキテクチャにおいてタスクの計算を全部完了してこそ結果を提供できることに起因する問題に対して、従来技術には、有効な解決策がまだ提案されていない。
本発明は、少なくとも従来技術のビッグデータシステムアーキテクチャにおいてタスクの計算を全部完了してこそ結果を提供できることに起因する問題を解決するために、ビッグデータの計算方法及びシステムを提供する。
本発明の実施例の一態様によれば、ビッグデータの計算方法が提供され、上記方法は、ビッグデータを計算する指示情報を取得するステップと、上記指示情報に基づいて上記ビッグデータ中の一部のデータを計算し、計算結果を出力するステップとを含む。
選択的に、上記指示情報は、上記計算結果が指定タイプである情報と、所定期間内で上記データを計算する情報と、上記ビッグデータ中の指定データを計算する情報と、予め設定されたデータフィルタリング条件と、のうちの少なくとも1つの情報を含む。
選択的に、上記指示情報に基づいて上記ビッグデータ中の一部のデータを計算し、計算結果を出力するステップは、上記計算結果が指定タイプである場合に、上記ビッグデータの計算を終了するステップ、及び/又は、現在の時間が上記所定期間を超えた後の時間である場合に、上記ビッグデータの計算を終了するステップ、及び/又は、上記指定データの計算が完了した後に、上記ビッグデータの計算を終了するステップを含む。
選択的に、上記データフィルタリング条件は、上記ビッグデータ中の各データ又は各種のデータの優先度を含む。
選択的に、上記指示情報に基づいて上記ビッグデータ中の一部のデータを計算するステップは、上記指示情報に基づいて上記指示情報にマッチングする第1のケースを検索し、アルゴリズムライブラリにおける上記第1のケースに対応する第1の指定アルゴリズムを呼び出して上記ビッグデータを計算するステップ、又は、上記指示情報に基づいて第2のケースを検索し、上記第2のケース及びアルゴリズムライブラリ中の第2の指定アルゴリズムに基づいて総合意思決定して、第3の指定アルゴリズムを得て、上記第3の指定アルゴリズムに従って上記ビッグデータを計算するステップを含む。
選択的に、アルゴリズムライブラリにおける上記第1のケースに対応する第1の指定アルゴリズムを呼び出して上記ビッグデータを計算する前に、上記方法は、上記指示情報にマッチングする上記第1のケースが複数ある場合に、優先度の最も高いケースを選択して上記指示情報にマッチングする第1のケースとするステップを含む。
選択的に、上記方法は、上記計算結果が所定要求を満していない場合に、上記ビッグデータにおける上記一部のデータ以外の残りのデータを計算するステップをさらに含む。
選択的に、ビッグデータを計算する指示情報を取得する方式は、システムの既に定義されたコンテンツから上記指示情報を取得する方式と、入力した上記指示情報を受信する方式と、既存指示情報を修正して上記指示情報を取得する方式と、のうちの少なくとも1つの方式を含む。
本発明の実施例の別の態様によれば、ビッグデータの計算システムがさらに提供され、上記システムは、ビッグデータを計算する指示情報を受信するインタラクティブユニットと、分散ノードに実装されて上記インタラクティブユニットと接続され、上記指示情報を受信して、上記指示情報に基づいて上記ビッグデータ中の一部のデータを計算し、計算結果を出力するコア制御ユニットとを備える。
選択的に、上記指示情報は、上記計算結果が指定タイプである情報と、所定期間内で上記データを計算する情報と、上記ビッグデータ中の指定データを計算する情報と、予め設定されたデータフィルタリング条件と、のうちの少なくとも1つの情報を含む。
選択的に、上記コア制御ユニットは、さらに、上記計算結果が指定タイプである場合に、上記ビッグデータの計算を終了し、及び/又は、現在の時間が上記所定期間を超えた後の時間である場合に、上記ビッグデータの計算を終了し、及び/又は、上記指定データの計算が完了した後に、上記ビッグデータの計算を終了するように構成される。
選択的に、上記データフィルタリング条件は、上記ビッグデータ中の各データ又は各種のデータの優先度を含む。
選択的に、上記システムは、過去ケースライブラリ及びアルゴリズムライブラリ、又は、過去ケースライブラリ、アルゴリズムライブラリ及び実行方案ユニットをさらに含み、上記コア制御ユニットは、上記指示情報に基づいて上記過去ケースライブラリから上記指示情報にマッチングする第1のケースを検索し、上記アルゴリズムライブラリにおける上記第1のケースに対応する第1の指定アルゴリズムを呼び出して上記ビッグデータを計算し、又は、上記コア制御ユニットは、第3の指定アルゴリズムに従って上記ビッグデータを計算し、ここで、上記第3の指定アルゴリズムは、上記実行方案ユニットが上記コア制御ユニットから受信した上記指示情報に基づいて、上記過去ケースライブラリから呼び出した第2のケース及び上記アルゴリズムライブラリから呼び出した第2の指定アルゴリズムに基づいて総合意思決定して得られたものである。
選択的に、上記コア制御ユニットは、さらに、上記指示情報にマッチングする上記第1のケースが複数ある場合に、優先度の最も高いケースを選択して上記指示情報にマッチングする第1のケースとするように構成される。
選択的に、上記コア制御ユニットは、さらに、上記計算結果が所定要求を満していない場合に、上記ビッグデータにおける上記一部のデータ以外の残りのデータを計算するように構成される。
選択的に、上記インタラクティブユニットは、さらに、システムの既に定義されたコンテンツから上記指示情報を取得する方式と、入力した上記指示情報を受信する方式と、既存指示情報を修正して上記指示情報を取得する方式と、のうちの少なくとも1つの方式によって上記指示情報を取得するように構成される。
本発明の実施例によれば、ビッグデータを計算する指示情報を取得し、指示情報に基づいてビッグデータ中の一部のデータを計算し、計算結果を出力することで、従来技術のビッグデータシステムアーキテクチャにおいてタスクの計算を全部完了してこそ結果を提供できることに起因する問題を解決し、さらに、制約条件内で最も大きい可能性で意思決定を協力する効果を達成する。
ここの図面は、本発明に対する更なる理解を提供して、本発明の一部を構成し、本発明の例示的な実施例及びその説明は、本発明を解釈するだけで、本発明を限定するものではない。
本発明の実施例に係るビッグデータの計算方法のフローチャートである。 本発明の実施例に係るビッグデータの計算システムの構成を示すブロック図である。 本発明の実施例に係るビッグデータの計算システムの構成を示すブロック図の一である。 本発明の実施例に係る単一フローのタスク実行のフローチャートである。 本発明の実施例に係るビッグデータ不完全計算のフレームユニット図である。 本発明の実施例に係る動作スケジューリングフローチャートである。 本発明の実施例に係る検索排除の例を示す図である。 本発明の実施例に係る範囲正確の例を示す図である。 本発明の実施例に係る分類計算の例を示す図である。 本発明の実施例に係るまず易後が難しい計算の例を示す図である。
以下、図面を参照しながら実施例を併せて本発明を詳細に説明する。なお、矛盾しない前提で、本発明の実施例及び実施例における特徴を互いに組み合わせてもよい。
本実施例によれば、ビッグデータの計算方法が提供され、図1は、本発明の実施例に係るビッグデータの計算方法のフローチャートであり、図1に示すように、このフローは、下記のステップを含む。
ステップS102:ビッグデータを計算する指示情報を取得する。
ステップS104:指示情報に基づいてビッグデータ中の一部のデータを計算し、計算結果を出力する。
上記のステップによれば、タスクを全部計算せずに、指示情報に基づいてビッグデータ中の一部のデータを計算し、タスクの計算を全部完了してこそ計算結果を提供できる従来技術に対して、上記のステップによれば、従来技術のビッグデータシステムアーキテクチャにおいてタスクの計算を全部完了してこそ結果を提供できることに起因する問題を解決し、さらに、制約条件内で最も大きい可能性で意思決定を協力する効果を達成する。
上記の指示情報は、複数の情報を含むことができ、以下、これについて例を挙げて説明する。選択可能な一実施例では、指示情報は、計算結果が指定タイプである情報と、所定期間内でデータを計算する情報と、ビッグデータ中の指定データを計算する情報と、予め設定されたデータフィルタリング条件と、のうちの1つ又は複数の情報であってもよい。ここで、ビッグデータを計算するときに、出力された計算結果が指定タイプである場合にビッグデータの計算を停止し、ビッグデータを計算するときに、ビッグデータを計算する時間を規定し、所定の時間内でビッグデータを計算して計算結果を出力し、ビッグデータを計算するときに、ビッグデータに含まれる指定データのみを計算して計算結果を出力することを規定する。つまり、計算結果が指定タイプである場合に、このビッグデータの計算を終了し、現在の時間が所定期間を超えた後の時間である場合に、ビッグデータの計算を終了し、指定データの計算が完了した後に、ビッグデータの計算を終了する。したがって、指示情報がビッグデータの計算を制限するように設定することで、ビッグデータの不完全な計算をする効果を実現した。
選択可能な一実施例では、上記のデータフィルタリング条件は、ビッグデータ中の各データ又は各種のデータの優先度であってもよい。例えば、各データ又は各種のデータの優先度は、各データ又は各種のデータの重要度又は取得難易度であってもよい。
上記のステップS104によれば、指示情報に基づいてビッグデータ中の一部のデータを計算し、選択可能な一実施例では、指示情報に基づいて指示情報にマッチングする第1のケースを検索し、アルゴリズムライブラリにおけるこの第1のケースに対応する第1の指定アルゴリズムを呼び出してこのビッグデータを計算してもよく、この指示情報に基づいて第2のケースを検索し、この第2のケース及びアルゴリズムライブラリ中の第2の指定アルゴリズムに基づいて総合意思決定して、第3の指定アルゴリズムを得て、第3の指定アルゴリズムに従ってビッグデータを計算してもよい。履歴方案の再利用によって、方案及びアルゴリズムにおける開発コストを低減させる。以下、予め記憶されたケース及びアルゴリズムライブラリ中の第2の指定アルゴリズムに基づいて総合意思決定することについて例を挙げて説明する。例えば、ユーザが一般的に定義できる入力は、結果コンテンツ、計算次元、フィルタリング条件である。方案ライブラリ履歴ケース(容疑者を探す):ターゲット方位、時間、男性、40歳以上、身長170〜180。すると、再実行の時にユーザがターゲット方位、時間、女性、20歳未満、身長150〜160を入力した場合、方案ライブラリが入力と履歴ライブラリとを比較して、上記の履歴方案が部分的に再利用できることを発見し、まず方案を取得し、方案の設定において異なる部分を修正して新たな方案を生成し、それからコアシステムに渡して実行される。
アルゴリズムライブラリにおけるこの第1のケースに対応する第1の指定アルゴリズムを呼び出してビッグデータを計算する前に、選択可能な一実施例では、指示情報にマッチングするケースが複数ある場合に、優先度の最も高いケースを選択してこの指示情報にマッチングする第1のケースとする。ここで、ケースの優先度は、意思決定者の評価記録により生成される。
選択可能な一実施例では、計算結果が所定要求を満たしていない場合に、ビッグデータにおける既に計算した上記一部のデータ以外の残りのデータを計算する。
上記のステップS102によれば、ビッグデータを計算する指示情報を取得し、選択可能な一実施例では、指示情報を取得する方式は、システムの既に定義されたコンテンツから指示情報を取得する方式と、入力した指示情報を受信する方式、又は、既存指示情報を修正してこの指示情報を取得する方式を含んでもよい。
図2は、本発明の実施例に係るビッグデータの計算システムの構成を示すブロック図であり、図2に示すように、上記システムは、ビッグデータを計算する指示情報を受信するインタラクティブユニット22と、分散ノードに実装されてこのインタラクティブユニットと接続され、指示情報を受信して、指示情報に基づいてこのビッグデータ中の一部のデータを計算し、計算結果を出力するコア制御ユニット24とを備える。
選択的に、指示情報は、計算結果が指定タイプである情報と、所定期間内でこのデータを計算する情報と、ビッグデータ中の指定データを計算する情報と、予め設定されたデータフィルタリング条件と、のうちの少なくとも1つの情報を含む。
選択的に、コア制御ユニット24は、さらに、計算結果が指定タイプである場合に、ビッグデータの計算を終了し、及び/又は、現在の時間が所定期間を超えた後の時間である場合に、ビッグデータの計算を終了し、及び/又は、指定データの計算が完了した後に、ビッグデータの計算を終了するように構成される。
選択的に、データフィルタリング条件は、ビッグデータ中の各データ又は各種のデータの優先度を含む。
図3は、本発明の実施例に係るビッグデータの計算システムの構成を示すブロック図の一であり、図3に示すように、上記システムは、過去ケースライブラリ32及びアルゴリズムライブラリ34、又は、過去ケースライブラリ32、アルゴリズムライブラリ34及び実行方案ユニット36をさらに含み、コア制御ユニット24は、指示情報に基づいて過去ケースライブラリ32から指示情報にマッチングする第1のケースを検索し、アルゴリズムライブラリ34における第1のケースに対応する第1の指定アルゴリズムを呼び出してビッグデータを計算し、又は、コア制御ユニット22は、第3の指定アルゴリズムに従ってビッグデータを計算し、ここで、第3の指定アルゴリズムは、実行方案ユニット36がコア制御ユニット24から受信した指示情報に基づいて、過去ケースライブラリ32から呼び出した第2のケース及びアルゴリズムライブラリ34から呼び出した第2の指定アルゴリズムに基づいて総合意思決定して得られたものである。
選択的に、コア制御ユニット24は、さらに、この指示情報にマッチングするこの第1のケースが複数ある場合に、優先度の最も高いケースを選択してこの指示情報にマッチングする第1のケースとするように構成される。
選択的に、コア制御ユニット24は、さらに、計算結果が所定要求を満たしていない場合に、ビッグデータにおけるこの一部のデータ以外の残りのデータを計算するように構成される。
選択的に、インタラクティブユニット22は、さらに、システムの既に定義されたコンテンツからこの指示情報を取得する方式と、入力したこの指示情報を受信する方式と、既存指示情報を修正してこの指示情報を取得する方式と、のうちの少なくとも1つの方式によってこの指示情報を取得するように構成される。なお、上記のインタラクティブユニット22、コア制御ユニット24、過去ケースライブラリ32、アルゴリズムライブラリ34及び実行方案ユニット36は、ソフトウェア又はハードウェアにより実現することができ、後者の場合、インタラクティブユニット22、コア制御ユニット24、過去ケースライブラリ32、アルゴリズムライブラリ34及び実行方案ユニット36がいずれも同一のプロセッサーに位置するか、又は、インタラクティブユニット22、コア制御ユニット24、過去ケースライブラリ32、アルゴリズムライブラリ34及び実行方案ユニット36がそれぞれ第1のプロセッサー及び第2のプロセッサー等に位置することによって実現することができるが、これらに限定されない。
以下、従来技術に存在する上記の問題に対して、具体的な選択可能な実施例を併せて説明し、下記の選択可能な実施例は、上記の選択可能な実施例及びその選択可能な実施形態を併せている。
一定の制限状況(次元は、時間、データ規模、精度、経済的コストを含む)で必要とされる意思決定に対して、ビッグデータや分散計算手段によって計算を行って、意思決定者が分析して使用されるように、異なる段階的なデータのサポートを提供する。
この選択可能な実施例の技術手段は下記のとおりである。
コアフロー:
1.意思決定ターゲットを定義し、フレームシステムを入力する。
2.フレームシステムが可能な段階ターゲットを自動的に分析し、アルゴリズムを適用させる。
3.システム内部でターゲットに基づいて計算方案を設定し、アルゴリズムの実行を開始する。
4.システムが計算終了設定条件をトリガし、結果を与える。
以下、技術手段について説明する。
3−1.意思決定ターゲットを定義する
(協力を必要とする)意思決定者がUIシステム(フレームインタラクティブユニット)を介して入力する。入力されるコンテンツは、最終ターゲット結果を計算するパターン、計算終了トリガ条件、フィルタリングのために使用される既知の条件を含む。上記の3項のコンテンツはUIを介して選択することができ、システムの既に定義されたコンテンツを選択してもよいし、新たなコンテンツを手動で追加してもよく、又は、固有のコンテンツを修正してもよい。
ここで、計算終了トリガ条件は、計算次元とも称され、システムはこの次元に基づいて段階ターゲットをポジショニングする。次元が時間である場合に、システムは限定時間内で計算を完了する。次元がデータ量である場合に、システムは限定のデータ量を計算した場合に計算を完了する。他の次元は二次開発の方案に応じて人工追加できる。
トリガ条件が1つのシーケンスである場合に、コアフローのステップ2〜4は、シーケンスのトリガ条件の実行が完了されるまで、シーケンスに従ってループで実行する。
3−2.フレームシステムに入力する
フレームインタラクティブユニットがユーザ(意思決定者)の入力したコンテンツをフレームコア制御ユニットに提出する。
3−3.フレームシステムが段階ターゲットを自動的に分析する
この動作の内部フローは、ユーザの入力したコンテンツと「過去ケース集積及び外部成功ケースインポートライブラリ」とを比較することによって最も近いターゲットを確定する。
3項のコンテンツを比較して、完全にマッチングするケースを発見した場合に、システムはケースの方案に従って実行する。3項のコンテンツを比較して最初の2項がマッチングし、第3項がマッチングしない場合は、計算時にまずフィルタリングアルゴリズムを除去し、結果がトリガされるときに特別操作を行う。最初の2項において1項のみが対応するケースが発見され、他の1項が対応するケースが完全にない場合には、対応するケースがあるそのコンテンツに基づいて計算する。全てのコンテンツが対応するケースがない場合には、計算を実行せず、エラーの結果をUIにフィードバックする。
方案をマッチングするとき、複数の方案がマッチングされる場合は、システムは評価の最も高い方案を最優先でマッチングさせ、他の方案は代替方案と称される。方案の評価は意思決定者の評価記録により生成される。実行されるたびに、この評価はそれに応じて変更される。
3−4.フレームシステムが適用なアルゴリズムを自動的に分析する
適用なアルゴリズムの選択は、ケースの実行に基づいている。ケースにはアルゴリズムの選択が明確されている。ここで、フィルタリング条件のアルゴリズムは独立して区分されて存在している。ユーザが入力した第3項のコンテンツにおいて、対応される項目が優先的に対応するフィルタリング条件アルゴリズムを実行する。
3−5.システム内部でターゲットに基づいて計算方案を設定する
システムが段階ターゲットの確認及びアルゴリズムの選択状況に基づいて計算方案を生成する。これを今回の計算ケースとも称する。ケースが最終的に意思決定者により役立つ以上のレベルに評価される場合には、過去ケースライブラリに記憶される。計算方案を生成するとき、複数のアルゴリズム間の順序が転換できる場合に、システムは性能が最適な実行方案を合理的に選択できる。
3−6.アルゴリズムの実行を開始する
システムが方案をクラスタ全体に自動的に配信して実行する。
3−7.システムが計算終了設定条件をトリガし、結果を与える
システムは、終了条件に到達すると、結果が予想に合うかどうかにかかわらず、すぐに結果をフィードバックする。
実際の応用では、コア機能に基づき、この機能を複数回にわたって応用すれば、さらに意思決定に有利である結果を次第に得ることができる。
3−8.時間次元に対して結果を次第に正確させる。
3−8−1.検索排除
ターゲットはビッグデータ中の1つのターゲット又はあるターゲットであり、計算された落札されていないデータブロックは、計算された無結果領域とマークされる。設定の時点が終了すると、これらの無結果領域を段階結果として意思決定者にフィードバックする。意思決定者が依然として意思決定協力の計算を必要とする場合には、2回目の計算を開始することでき、計算の初めに既に完了した結果を排除することができる。このように、意思決定者がもう計算補助を必要としない、又は、計算結果が完全に計算完了されるまで処理を繰り返す。この方案は、指名手配中の犯人の逮捕、ひき逃げの逮捕、迷子を探す等のようなターゲット捜索に用いられる。
3−9.データ量に対して計算結果を次第に与える。
3−9−1.範囲正確
ターゲットはビッグデータ中の全てのデータの計算統計(例えば、平均値、分散等の統計学結果)である。統計学のサンプリング調査の方法を利用する。データを抽出して計算し、計算されたデータはデータソースから他の位置に転送され、次回の計算のデータソースとして使用されない。2回目の計算及び最後の計算終了条件はいずれも検索排除方法に類似している。
3−9−2.分類計算
ユーザが入力するときのフィルタリング条件に、ビッグデータ中のデータがカテゴリ及びカテゴリの主要と副次を区分できると明記されている場合には、カテゴリに従って、まず重要度の高いデータを計算することができる。結果をフィードバックするときは、計算順序に従って、順次にフィードバックする。
3−9−3.まず易後が難しい計算
データソースの取得条件が一致していない場合には、まず取得しやすいデータを計算する。それはデータのダウンロード及びアルゴリズムの計算が異なるハードウェアを使用し、このようにすると性能の向上に有利であるからである。このようなやり方は、データソースが明確なグループを有する場合に行われる。
図4は、本発明の実施例に係る単一フローのタスク実行のフローチャートであり、図4に示すように、内部アルゴリズムの計算時に行う操作フローである。この3つのステップのフローは、全てのトリガ条件が全部トリガされるまで、コア制御ユニットが他のユニットを自動的に呼び出して実行され、全ての演算の実行が全部完了した後に停止するが、例外は、人間がUIを介して直接にタスクを強制停止できる。
図5は、本発明の実施例に係るビッグデータ不完全計算のフレームユニット図であり、以下、図5について説明する。
4−2−1.フレームインタラクティブユニットは、ユーザとコミュニケーションするように構成される。
タスクの開始時に、ユーザがタスク意思決定ターゲットを入力することを支援し、ユーザが選択するためのいくつかの段階ターゲット及び適用なアルゴリズムを提供する。ユーザが実行時間を選択できるように、タスクタイマーを提供する。このユニットはタスクの実行を開始することもでき、タスクを一時停止又は一時終了することもできる。
タスクを実行するときに、即時にフィードバックし、タスクが終了した後に、ユーザが参照して意思決定できるように、いくつかの不完全又は完全な結果を提供する。
4−2−2.フレームコア制御ユニットは、タスクの動作を制御するように構成される。
アルゴリズムの演算を制御する。
結果の出力及び結果のランキングを制御する。
分散クラスタの負荷バランスを制御する。
ユニットは1つの分散されたクラスタである。
4−2−3.タスク実行方案ユニットは、呼び出された過去ケースライブラリデータ及びアルゴリズムライブラリデータを組み合わせて、今回の演算の実行方案を生成するように構成される。
結果によれば、2種類に分けられており、1つは、シーケンスが結果をフィードバックすることであり、もう1つは、次元が終了した後に不完全な結果を返すことである。その他に、段階の定義及びどのような必要な結果をフィードバックするかを設定することができる。
4−2−4.過去ケース集積ライブラリ及び外部成功ケースインポートライブラリ
1次ケースを実行し、ケースの基本情報はケースライブラリに保存されており、意思決定者の評価が付随されている。或いは、外部から他人のケースをインポートすることもできる。このようにすると、過去ケースにより評価の高いケースを再利用できる。また、完全にマッチングしていないケースは実行方案を組み合わせるために使用することができる。
4−2−5.アルゴリズムライブラリ中のアルゴリズムの一部の基本的なアルゴリズムは、フレーム開発者により開発される。他の一部は、具体的な応用需要のある人員により開発されることができる。
図6は、本発明の実施例に係る動作スケジューリングフローチャートであり、図6に示すように、このフローは、下記のステップを含む。
ステップS602:インタラクティブユニットがタスク情報を受信し、コアユニットが動作するように通知する。
ステップS604:コアユニットが、タスク情報に関連する過去ケースの照会を過去ケースライブラリに送信する。完全にマッチングしているケースがある場合に、直接にステップS606を実行してから演算し、ステップS618を実行する。完全にマッチングしていない場合に、ステップS610、ステップS612、ステップS614、ステップS616、ステップS618を実行する。
ステップS606:アルゴリズムライブラリを呼び出す。
ステップS608:フィードバックを照会する。
ステップS610:コアユニットが関連情報(計算終了トリガ条件シーケンスの1つを含む)タスク実行方案ユニットに入力し、ユニットが過去ケースライブラリを呼び出し(ステップS612)、また、アルゴリズムライブラリを呼び出し(ステップS614)、それから全ての情報を総合して実行方案に組み合わせる。
ステップS612:過去ケースを呼び出す。
ステップS614:アルゴリズムライブラリを呼び出す。
ステップS616:実行方案ユニットが実行方案をフィードバックし、コアユニットが実行を開始する。
ステップS618:コアユニットが実行を完了した後に、インタラクティブユニットにフィードバックする。
タスクが多段階複回数タスクである場合、ステップS618が完了した後に、自動的にステップS604の操作を開始し、上記の順序(ステップS602以外)で繰り返しプロセスを行う。
図7は、本発明の実施例に係る検索排除の例を示す図であり、以下、図7に基づいて説明する。
ターゲットの計算は、検索データから1つ又は複数のターゲットを発見することを必要とする。(図7は、ただ1つのターゲットに関する)
(ユーザが入力するコンテンツは単一の明確な結果であり、時間を計算終了トリガ条件とし、フィルタリング条件は実行方案及びアルゴリズムの選択に関しない)
時間を計算終了トリガ条件とし、1回目の計算を完了した後、ターゲットが発見されていない場合に、既に計算されたターゲットのないデータブロックの情報が不完全な結果としてユーザにフィードバックされる。ターゲットが発見された場合には、ターゲットが存在する情報をフィードバックすればよい。
ターゲットが発見された場合に、計算を終了することができ、ターゲットが発見されていない場合には、既に計算を完了したデータソースを排除して次回の計算を行う。
図8は、本発明の実施例に係る範囲正確の例を示す図であり、以下、図8に基づいて説明する。
計算目的は、データソース全体の平均値、和、ある限定カテゴリの平均値、ある限定カテゴリの和等のような統計学において統計可能な結果を統計することである。
(ユーザが入力するコンテンツは単一の統計結果であり、データ量を計算終了トリガ条件とし、フィルタリング条件は実行方案及びアルゴリズムの選択に関しない)
サンプル調査の方法を利用して、全部のデータ中の一部を抽出してデータセット全体の代表として計算する。全部のデータを占めるサンプルの割合が大きいほど、結果が正確であることは明らかである。また、1回計算した後に、既に計算したデータを排除して複数回にわたって計算し続けることもでき、このように、データを繰り返して計算せずに、必要な結果を即時に与えることができるとともに、性能の浪費のない前提下で、結果を次第に正確にさせることができる。
図9は、本発明の実施例に係る分類計算の例を示す図であり、以下、図9に基づいて説明する。
この例の計算目的の結果は限定されない。計算実行方案及びアルゴリズムを確定する際に、計算目的を判断としない。
(ユーザが入力する計算結果パターンは実行方案及びアルゴリズムの選択に関せず、計算終了条件はカテゴリであり、且つ、カテゴリの加入は主要と副次の配列シーケンスに従い、フィルタリング条件は実行方案及びアルゴリズムの選択に関しない)
図10は、本発明の実施例に係るまず易後が難しい計算の例を示す図であり、以下、図10に基づいて説明する。
この例の計算目的の結果は限定されない。計算実行方案及びアルゴリズムを確定する際に、計算目的を判断としない。
(ユーザが入力する計算結果パターンは実行方案及びアルゴリズムの選択に関せず、計算終了条件はデータ群であり、フィルタリング条件はデータ群の区分方法に関する)
データ群の区分方法は、典型的に、データの記憶場所、データソース(異なるオペレータ等)、データの記憶フォーマットであってもよい。
図10の計算プロセスによれば、まず、各グループのデータの1つのセグメント(同じサイズ)を切り出して難易度テスト計算を行う。生成される結果はデータ群の計算順序の整列のために使用され、それから図9のバッチ計算方法を利用して計算することができる。
派生した使用方法:一つのグループのデータの計算が完了する度に、残りのデータがいずれも難易度ランキングを1回行ってもよい。
選択可能な一実施例では、フレームインタラクティブユニットは信頼性の高い機械を必要とするので、2機実装が推奨される。フレームコア制御ユニットは分散実装を実行して、各分散ノードに実装する。内部機構は自動的に1つの管理ノードを選択し、このノードはフル負荷で演算をしない。管理ノードは直接にインタラクティブユニットと通信し、他のノードは、データソースからデータを呼び出す以外には、管理ノード以外の機械と通信しない。タスク実行方案ユニット、アルゴリズムライブラリ、過去ケース集積ライブラリ及び外部成功ケースインポートライブラリは、別々に実装されてもよく、或いは、組み合わせて実装されてもよい。データソースは、hadoopのhdfs、nfs、ftp等のような一般的な形式であってもよい。
以上のように、本発明の実施例に提供されたビッグデータ不完全計算システムによれば、意思決定者が重大な意思決定を行う必要がある場合に、往々として時間のようないろいろな制約条件が存在し、本発明の実施例は、これらの制約条件内で最も大きい可能性で意思決定を協力して、意思決定によるリスクを減少させることができる。それとともに、本発明の実施例は、履歴方案の再利用を提供して、方案及びアルゴリズムにおける開発コストを低減させることができる。履歴方案の累積は、システムの計算成功率及び方案マッチング率を不断に向上させることができる。本発明の実施例は、自己学習及び自己進歩可能なアルゴリズムフレームである。
別の実施例では、上記の実施例及び好ましい実施形態に記載の技術手段を実行するためのソフトウェアをさらに提供する。
別の実施例では、上記のソフトウェアが記憶される記録媒体をさらに提供し、この記録媒体は、光ディスク、フレキシブルディスク、ハードディスク、書き込み消去可能なメモリ等を含むがこれらに限定されない。
また、当業者にとっては、上記の本発明の各モジュール又は各ステップが、汎用の計算装置により実現されることができ、それらは単体の計算装置に集中されてもよく、又は複数の計算装置により構成されたネットワークに分散されてもよく、選択的に、それらは計算装置の実行可能なプログラムコードにより実現されることができ、これによって、それらを記憶装置の中に記憶させて計算装置により実行されることができ、また、場合によっては、こちらの手順と異なる手順で示した又は説明されたステップを実行し、又はそれらをそれぞれの集積回路モジュールに製造し、又はそれらのうちの複数のモジュール又はステップを単体の集積回路モジュールに製造して実現されることができることが明らかなことである。このように、本発明はいずれの特定のハードウェア及びソフトウェアの組み合わせに限定されない。
以上は本発明の好ましい実施例にすぎず、本発明を限定するものではなく、当業者にとっては、本発明は様々な変更及び変化を有してもよい。本発明の精神及び原則を逸脱しない範囲内でのいずれの変更、同等の代替、変形等は全て本発明の範囲に含まれる。
本発明の実施例によれば、ビッグデータを計算する指示情報を取得し、指示情報に基づいてビッグデータ中の一部のデータを計算し、計算結果を出力することで、従来技術のビッグデータシステムアーキテクチャにおいてタスクの計算を全部完了してこそ結果を提供できることに起因する問題を解決し、制約条件内で最も大きい可能性で意思決定を協力する効果を達成する。
本発明は、通信分野に関し、特にビッグデータの計算方法及びシステム、プログラムならびに記録媒体に関する。
本発明は、少なくとも従来技術のビッグデータシステムアーキテクチャにおいてタスクの計算を全部完了してこそ結果を提供できることに起因する問題を解決するために、ビッグデータの計算方法及びシステム、プログラムならびに記録媒体を提供する。
選択的に、上記インタラクティブユニットは、さらに、システムの既に定義されたコンテンツから上記指示情報を取得する方式と、入力した上記指示情報を受信する方式と、既存指示情報を修正して上記指示情報を取得する方式と、のうちの少なくとも1つの方式によって上記指示情報を取得するように構成される。
本発明の別の実施例によれば、プログラムが提供され、前記プログラムは、プロセッサに実行されることにより、上記のビッグデータの計算方法を実現することを特徴とする。
本発明の別の実施例によれば、記録媒体が提供され、前記記録媒体には、上記のプログラムが記録されている。

Claims (16)

  1. ビッグデータを計算する指示情報を取得するステップと、
    前記指示情報に基づいて前記ビッグデータ中の一部のデータを計算し、計算結果を出力するステップと
    を含む
    ビッグデータの計算方法。
  2. 前記指示情報は、前記計算結果が指定タイプである情報と、所定期間内で前記データを計算する情報と、前記ビッグデータ中の指定データを計算する情報と、予め設定されたデータフィルタリング条件と、のうちの少なくとも1つの情報を含む
    請求項1に記載の方法。
  3. 前記指示情報に基づいて前記ビッグデータ中の一部のデータを計算し、計算結果を出力するステップは、
    前記計算結果が指定タイプである場合に、前記ビッグデータの計算を終了するステップ、及び/又は、
    現在の時間が前記所定期間を超えた後の時間である場合に、前記ビッグデータの計算を終了するステップ、及び/又は、
    前記指定データの計算が完了した後に、前記ビッグデータの計算を終了するステップを含む
    請求項2に記載の方法。
  4. 前記データフィルタリング条件は、前記ビッグデータ中の各データ又は各種のデータの優先度を含む
    請求項2に記載の方法。
  5. 前記指示情報に基づいて前記ビッグデータ中の一部のデータを計算するステップは、
    前記指示情報に基づいて前記指示情報にマッチングする第1のケースを検索し、アルゴリズムライブラリにおける前記第1のケースに対応する第1の指定アルゴリズムを呼び出して前記ビッグデータを計算するステップ、又は、
    前記指示情報に基づいて第2のケースを検索し、前記第2のケース及びアルゴリズムライブラリ中の第2の指定アルゴリズムに基づいて総合意思決定して、第3の指定アルゴリズムを得て、前記第3の指定アルゴリズムに従って前記ビッグデータを計算するステップを含む
    請求項1に記載の方法。
  6. アルゴリズムライブラリにおける前記第1のケースに対応する第1の指定アルゴリズムを呼び出して前記ビッグデータを計算する前に、
    前記指示情報にマッチングする前記第1のケースが複数ある場合に、優先度の最も高いケースを選択して前記指示情報にマッチングする第1のケースとするステップを含む
    請求項5に記載の方法。
  7. 前記計算結果が所定要求を満していない場合に、前記ビッグデータにおける前記一部のデータ以外の残りのデータを計算するステップをさらに含む
    請求項1に記載の方法。
  8. ビッグデータを計算する指示情報を取得する方式は、
    システムの既に定義されたコンテンツから前記指示情報を取得する方式と、入力した前記指示情報を受信する方式と、既存指示情報を修正して前記指示情報を取得する方式と、のうちの少なくとも1つの方式を含む
    請求項1〜7のいずれか1項に記載の方法。
  9. ビッグデータを計算する指示情報を受信するインタラクティブユニットと、
    分散ノードに実装されて前記インタラクティブユニットと接続され、前記指示情報を受信して、前記指示情報に基づいて前記ビッグデータ中の一部のデータを計算し、計算結果を出力するコア制御ユニットと
    を備える
    ビッグデータの計算システム。
  10. 前記指示情報は、前記計算結果が指定タイプである情報と、所定期間内で前記データを計算する情報と、前記ビッグデータ中の指定データを計算する情報と、予め設定されたデータフィルタリング条件と、のうちの少なくとも1つの情報を含む
    請求項9に記載のシステム。
  11. 前記コア制御ユニットは、さらに、前記計算結果が指定タイプである場合に、前記ビッグデータの計算を終了し、及び/又は、現在の時間が前記所定期間を超えた後の時間である場合に、前記ビッグデータの計算を終了し、及び/又は、前記指定データの計算が完了した後に、前記ビッグデータの計算を終了するように構成される
    請求項10に記載のシステム。
  12. 前記データフィルタリング条件は、前記ビッグデータ中の各データ又は各種のデータの優先度を含む
    請求項10に記載のシステム。
  13. 前記システムは、過去ケースライブラリ及びアルゴリズムライブラリ、又は、過去ケースライブラリ、アルゴリズムライブラリ及び実行方案ユニットをさらに含み、
    前記コア制御ユニットは、前記指示情報に基づいて前記過去ケースライブラリから前記指示情報にマッチングする第1のケースを検索し、前記アルゴリズムライブラリにおける前記第1のケースに対応する第1の指定アルゴリズムを呼び出して前記ビッグデータを計算し、又は、
    前記コア制御ユニットは、第3の指定アルゴリズムに従って前記ビッグデータを計算し、前記第3の指定アルゴリズムは、前記実行方案ユニットが前記コア制御ユニットから受信した前記指示情報に基づいて、前記過去ケースライブラリから呼び出した第2のケース及び前記アルゴリズムライブラリから呼び出した第2の指定アルゴリズムに基づいて総合意思決定して得られたものである
    請求項9に記載のシステム。
  14. 前記コア制御ユニットは、さらに、前記指示情報にマッチングする前記第1のケースが複数ある場合に、優先度の最も高いケースを選択して前記指示情報にマッチングする第1のケースとするように構成される
    請求項13に記載のシステム。
  15. 前記コア制御ユニットは、さらに、前記計算結果が所定要求を満していない場合に、前記ビッグデータにおける前記一部のデータ以外の残りのデータを計算するように構成される
    請求項9に記載のシステム。
  16. 前記インタラクティブユニットは、さらに、システムの既に定義されたコンテンツから前記指示情報を取得する方式と、入力した前記指示情報を受信する方式と、既存指示情報を修正して前記指示情報を取得する方式と、のうちの少なくとも1つの方式によって前記指示情報を取得するように構成される
    請求項9〜15のいずれか1項に記載のシステム。
JP2017560572A 2015-05-18 2016-01-25 ビッグデータの計算方法及びシステム、プログラムならびに記録媒体 Active JP6694447B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510254618.5A CN106294381A (zh) 2015-05-18 2015-05-18 大数据计算的方法及系统
CN201510254618.5 2015-05-18
PCT/CN2016/072038 WO2016184159A1 (zh) 2015-05-18 2016-01-25 大数据计算的方法及系统

Publications (2)

Publication Number Publication Date
JP2018521391A true JP2018521391A (ja) 2018-08-02
JP6694447B2 JP6694447B2 (ja) 2020-05-13

Family

ID=57319331

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017560572A Active JP6694447B2 (ja) 2015-05-18 2016-01-25 ビッグデータの計算方法及びシステム、プログラムならびに記録媒体

Country Status (5)

Country Link
US (1) US20180165333A1 (ja)
EP (1) EP3299968A4 (ja)
JP (1) JP6694447B2 (ja)
CN (1) CN106294381A (ja)
WO (1) WO2016184159A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017162209A (ja) * 2016-03-09 2017-09-14 富士通株式会社 分散処理実行管理プログラム、分散処理実行管理方法および分散処理実行管理装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109299178B (zh) * 2018-09-30 2020-01-14 北京九章云极科技有限公司 一种模型应用方法和数据分析系统
CN109547557A (zh) * 2018-12-06 2019-03-29 南京邮电大学 工业互联网智能决策方法、可读存储介质和终端
CN109739922A (zh) * 2019-01-10 2019-05-10 江苏徐工信息技术股份有限公司 一种工业数据智能分析系统
CN111241087A (zh) * 2020-03-10 2020-06-05 天津市普迅电力信息技术有限公司 一种基于分布式计算的能源数据自动化处理方法
CN111985098A (zh) * 2020-08-13 2020-11-24 中国科学院软件研究所 一种面向工业大数据的多尺度时变动态可视化方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04169972A (ja) * 1990-11-02 1992-06-17 Hitachi Ltd データベース検索処理方式
JPH05135104A (ja) * 1991-11-11 1993-06-01 Canon Inc 情報検索装置
JP2002278992A (ja) * 2001-03-15 2002-09-27 Hitachi Information Systems Ltd データ検索サーバおよび検索方法、ならびにデータ検索プログラム
JP2004038412A (ja) * 2002-07-01 2004-02-05 Central Res Inst Of Electric Power Ind データマイニング方法およびデータマイニングシステム並びにデータマイニング用プログラム
JP2004139370A (ja) * 2002-10-18 2004-05-13 Hitachi Ltd 大規模データ向け分析方法
US20100145967A1 (en) * 2008-12-10 2010-06-10 Microsoft Corporation Micro-browser viewers and searching
JP2010205218A (ja) * 2009-03-06 2010-09-16 Dainippon Printing Co Ltd データ分析支援装置、データ分析支援システム、データ分析支援方法、及びプログラム
JP2012133608A (ja) * 2010-12-22 2012-07-12 Nec Corp ヒストグラム生成装置、方法及びプログラム
CN104123395A (zh) * 2014-08-13 2014-10-29 北京赛科世纪数码科技有限公司 一种基于大数据的决策方法和系统
WO2015049797A1 (ja) * 2013-10-04 2015-04-09 株式会社日立製作所 データ管理方法、データ管理装置及び記憶媒体

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3049636B2 (ja) * 1995-03-31 2000-06-05 株式会社日立製作所 データ分析方法
US6115712A (en) * 1996-07-12 2000-09-05 International Business Machines Corporation Mechanism for combining data analysis algorithms with databases on the internet
US7340448B2 (en) * 2003-11-13 2008-03-04 International Business Machines Corporation Method, apparatus, and computer program product for implementing enhanced query governor functions
US8005675B2 (en) * 2005-03-17 2011-08-23 Nice Systems, Ltd. Apparatus and method for audio analysis
JP4822863B2 (ja) * 2006-02-08 2011-11-24 富士通株式会社 数値解析データ作成方法及び装置並びにプログラム及び記憶媒体
US8943081B2 (en) * 2008-11-17 2015-01-27 At&T Intellectual Property I, L.P. User-powered recommendation system
US9655518B2 (en) * 2009-03-27 2017-05-23 Braemar Manufacturing, Llc Ambulatory and centralized processing of a physiological signal
US9275102B2 (en) * 2011-07-20 2016-03-01 International Business Machines Corporation System load query governor
US9158814B2 (en) * 2012-03-30 2015-10-13 International Business Machines Corporation Obtaining partial results from a database query
KR102028708B1 (ko) * 2013-01-18 2019-10-07 한국전자통신연구원 대용량 이벤트 파일에서 시간 관계를 병렬 탐사하기 위한 방법
US9165250B2 (en) * 2013-01-30 2015-10-20 Bank Of America Corporation Dynamic incident response
US9665088B2 (en) * 2014-01-31 2017-05-30 Fisher-Rosemount Systems, Inc. Managing big data in process control systems
US9514214B2 (en) * 2013-06-12 2016-12-06 Microsoft Technology Licensing, Llc Deterministic progressive big data analytics
CN103336844B (zh) * 2013-07-22 2016-12-28 广西师范大学 大数据rd分割方法
CN103473378A (zh) * 2013-09-30 2013-12-25 国家电网公司 能够采集多种构造数据源的通用数据采集系统及采集方法
CN104732756A (zh) * 2013-12-24 2015-06-24 中兴通讯股份有限公司 一种利用移动通信数据挖掘进行公交规划的方法
CN104199924B (zh) * 2014-09-01 2018-05-11 北京交通大学长三角研究院 选择具有快照关系的网络表格的方法及装置
US20160085866A1 (en) * 2014-09-23 2016-03-24 Minetta Brook Inc. System for performing text mining and topic discovery for anticipatory identification of emerging trends
CN104484410A (zh) * 2014-12-16 2015-04-01 芜湖乐锐思信息咨询有限公司 应用于大数据系统的数据融合方法及系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04169972A (ja) * 1990-11-02 1992-06-17 Hitachi Ltd データベース検索処理方式
JPH05135104A (ja) * 1991-11-11 1993-06-01 Canon Inc 情報検索装置
JP2002278992A (ja) * 2001-03-15 2002-09-27 Hitachi Information Systems Ltd データ検索サーバおよび検索方法、ならびにデータ検索プログラム
JP2004038412A (ja) * 2002-07-01 2004-02-05 Central Res Inst Of Electric Power Ind データマイニング方法およびデータマイニングシステム並びにデータマイニング用プログラム
JP2004139370A (ja) * 2002-10-18 2004-05-13 Hitachi Ltd 大規模データ向け分析方法
US20100145967A1 (en) * 2008-12-10 2010-06-10 Microsoft Corporation Micro-browser viewers and searching
JP2010205218A (ja) * 2009-03-06 2010-09-16 Dainippon Printing Co Ltd データ分析支援装置、データ分析支援システム、データ分析支援方法、及びプログラム
JP2012133608A (ja) * 2010-12-22 2012-07-12 Nec Corp ヒストグラム生成装置、方法及びプログラム
WO2015049797A1 (ja) * 2013-10-04 2015-04-09 株式会社日立製作所 データ管理方法、データ管理装置及び記憶媒体
CN104123395A (zh) * 2014-08-13 2014-10-29 北京赛科世纪数码科技有限公司 一种基于大数据的决策方法和系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017162209A (ja) * 2016-03-09 2017-09-14 富士通株式会社 分散処理実行管理プログラム、分散処理実行管理方法および分散処理実行管理装置

Also Published As

Publication number Publication date
CN106294381A (zh) 2017-01-04
EP3299968A1 (en) 2018-03-28
US20180165333A1 (en) 2018-06-14
EP3299968A4 (en) 2018-03-28
WO2016184159A1 (zh) 2016-11-24
JP6694447B2 (ja) 2020-05-13

Similar Documents

Publication Publication Date Title
JP6694447B2 (ja) ビッグデータの計算方法及びシステム、プログラムならびに記録媒体
US10817514B2 (en) Splitting of a join operation to allow parallelization
EP3678068A1 (en) Distributed system for executing machine learning and method therefor
US20060100969A1 (en) Learning-based method for estimating cost and statistics of complex operators in continuous queries
US20060136396A1 (en) Self-adjusting database-query optimizer
CN104885078A (zh) 用于大规模并行处理数据库集群中的两阶段查询优化的方法
CN107016018B (zh) 数据库索引创建方法及装置
CN109308303B (zh) 一种基于马尔可夫链的多表连接在线聚集方法
CN110888859B (zh) 一种基于组合深度神经网络的连接基数估计方法
US20060197766A1 (en) System for interpretation of streaming data filters
US20170068710A1 (en) Collecting statistics in unconventional database environments
CN104834754A (zh) 一种基于连接代价的sparql语义数据查询优化方法
EP3232339B1 (en) Method and device for determining sql execution plan
CN115576999B (zh) 基于云平台的任务数据处理方法、装置、设备及存储介质
CN112148942B (zh) 基于数据聚类的业务指标数据分类方法及装置
US20140129531A1 (en) Automatic Entity-Grouping for Scalable OLTP
Wang et al. Adaptive time, monetary cost aware query optimization on cloud database systems
CN104572029A (zh) 一种状态机可拼接性和拼接规则判定方法和装置
CN111723076A (zh) 一种生成数据库索引的方法和装置
CN107133281B (zh) 一种基于分组的全局多查询优化方法
Gao et al. Automatic index selection with learned cost estimator
CN111107493B (zh) 一种移动用户位置预测方法与系统
CN114138330A (zh) 基于知识图谱的代码克隆检测优化方法、装置和电子设备
CN108564135B (zh) 构建骨架程序并实现高性能计算程序运行时间预测的方法
CN113408735A (zh) 用于模型优化的方法、装置以及存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171128

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190806

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20191106

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200407

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200417

R150 Certificate of patent or registration of utility model

Ref document number: 6694447

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250