CN104820661A - 一种基于业务对象的探索式数据分析系统 - Google Patents

一种基于业务对象的探索式数据分析系统 Download PDF

Info

Publication number
CN104820661A
CN104820661A CN201510235011.2A CN201510235011A CN104820661A CN 104820661 A CN104820661 A CN 104820661A CN 201510235011 A CN201510235011 A CN 201510235011A CN 104820661 A CN104820661 A CN 104820661A
Authority
CN
China
Prior art keywords
business object
business
relations
relation
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510235011.2A
Other languages
English (en)
Inventor
柯志超
马小东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SUZHOU GUOYUN DATA TECHNOLOGY Co Ltd
Original Assignee
SUZHOU GUOYUN DATA TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SUZHOU GUOYUN DATA TECHNOLOGY Co Ltd filed Critical SUZHOU GUOYUN DATA TECHNOLOGY Co Ltd
Priority to CN201510235011.2A priority Critical patent/CN104820661A/zh
Publication of CN104820661A publication Critical patent/CN104820661A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本案为一种基于业务对象的探索式数据分析系统,包括:(1)业务对象抽象模块,包括:a)选择任意一个表T,把表T的字段{CM,…,CN}根据其含义抽象成业务对象{OM,…,ON},把其绑定到业务对象{OM,…,ON}上;b)选择另一个表T2,按照步骤a)处理表T2;c)按照步骤b)方法处理所有表;(2)业务对象语义解析引擎,包括:d)选择业务对象集合{O}中的业务对象;e)查找所述I与Y共有的表关系,把符合条件的关系放入关系集R;f)使用最优的路径计算结果并返回;g)在关系集R中的所有可用表,反向解析出Q,把Q中的对象与选择的维度度量对象去重,返回可探索集合对象{O1};h)在{O1}中,找出直接相关业务对象集合{O2},返回{O1}U{O2},成为可探索分析的对象。

Description

一种基于业务对象的探索式数据分析系统
技术领域
本发明涉及数据分析系统,特别是涉及一种基于业务对象的探索式数据分析系统。
背景技术
目前市面上的数据分析工具,处理数据主要有分两种:
1、基于底层表的分析,这样的工具使用门槛高,只有小部分懂得技术的人能使用;
2、配置成业务对象,但是有几个缺点:
(1)对象之间的关联关系需要人为指定;
(2)在业务的配置过程中全程需要业务专家、技术专家、数据模型专家共同参与;
(3)随着业务逐渐增多,对象之间的关系难以维护,一旦出现错误,难以定位;
(4)需求变更时,整个流程要在走一遍,而且修改业务可能引发其他无法预料到的问题;
(5)业务场景固定,只能按照模型设计所支持的场景来,新的需求难以满足。
综上,现有技术中在使用工具做数据分析时,都是事先想好需要做什么分析,这样的缺点是要对数据有足够的理解才能做分析,并且工具只是呈现与统计作用,并没有提供引导用户使用和分析数据的能力。
发明内容
为克服现有技术的不足,本发明的目的在于提供一种基于业务对象的探索式数据分析系统,旨在提供引导用户使用和分析数据的能力。
为实现上述目的,本发明通过以下技术方案实现:
一种基于业务对象的探索式数据分析系统,包括:
(1)业务对象抽象模块,其用于完成对复杂数据关系的业务抽象,这个过程中,用户只需要识别出底层表中每一个字段的含义,把代表相同含义的字段绑定到同一个业务对象上即可,不需要配置任何额外的关联信息,所述业务抽象包括以下步骤:
a)选择任意一个表T,把表T的字段{CM,…,CN }根据其含义抽象成业务对象{OM,…,ON},并且把表与字段信息绑定到所述业务对象{OM,…,ON}上;
b)选择另一个表T2,把表T2的字段{CA,…,CB }根据其含义绑定到对象{OM,...,ON}上;
c)按照步骤b)的方法处理所有表,把相同含义的表和字段绑定到与其含义相对应的业务对象上,形成业务对象集合{O};
(2)业务对象语义解析引擎,其用于把业务对象解析成表与字段关系,梳理表之间的关系,根据用户选择的对象,提供可探索分析对象集合,包括:
d)用户选择所述业务对象集合{O}中的业务对象:维度和度量,语义解析引擎解析出维度对象的表关系集I,度量对象的表关系集Y;
e)查找所述I与Y之间的共有的表关系,并且验证这些共有关系是否符合用户的选择,把所有符合条件的关系放入关系集R;
f)在关系集R中,使用路径优化引擎对其进行排序,使用最优的路径计算结果并返回;
g)在关系集R中的所有可用表,反向解析出这些表上直接配置的其他维度对象集合Q,把Q中的对象与用户选择的维度度量对象去重,返回可探索集合对象{O1};
h)在所述可探索对象集合{O1}中,找出每一个业务对象对应的查找表上配置的直接相关业务对象集合{O2},返回{O1}U{O2}的结果呈现给用户,成为可探索分析的对象。
优选的是,所述的基于业务对象的探索式数据分析系统,其中, M、N为大于等于1的正整数,N大于等于M。
优选的是,所述的基于业务对象的探索式数据分析系统,其中A、B为大于等于1的正整数,B大于等于A。
本发明的有益效果:本案提供了一种新的数据分析方式,通过业务对象抽象模块,把所有复杂的数据关系抽象成有限的业务对象,降低了工具的使用复杂性,并且让使用人员聚焦在业务上,而非技术细节,其优点主要有:
1)本系统以业务对象为出发点,通过语义分析算法分析业务对象背后的数据关系,自动查找数据之间的关联,用户不需要事先想好分析数据的角度与方法,在系统中只需要选择任何一个业务对象作为起点,本系统将探索出与当前选择有关联的其他业务对象,使用者可以选择任意角度分析,任何时候都可以返回上一步分析结果,重新选择其他角度分析;
2)系统通过语义分析算法自动查找数据间的关系,为用户提供可以分析的角度,用户可根据这些角度进行发散;
3)数据之间的关系是复杂的,一个分析结果需要经过多个步骤才能得出,本系统让用户一步一步探索式的分析,更加了解数据的来龙去脉;
4)用户不需要关心数据分析与计算的技术细节,全心投入在如何发掘数据价值上,数据大量的计算与关系探索由系统完成。
附图说明
图1为本发明一实施例所述的基于业务对象的探索式数据分析系统中的系统流程图。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
一种基于业务对象的探索式数据分析系统,该数据分析系统中的系统流程图请参阅附图1,该系统包括:
(1)业务对象抽象模块,其用于完成对复杂数据关系的业务抽象,这个过程中,用户只需要识别出底层表中每一个字段的含义,把代表相同含义的字段绑定到同一个业务对象上即可,不需要配置任何额外的关联信息,所述业务抽象包括以下步骤:
a)选择任意一个表T,把表T的字段{CM,…,CN }根据其含义抽象成业务对象{OM,…,ON},并且把表与字段信息绑定到所述业务对象{OM,…,ON}上;
b)选择另一个表T2,把表T2的字段{CA,…,CB }根据其含义绑定到对象{OM,...,ON}上;
c)按照步骤b)的方法处理所有表,把相同含义的表和字段绑定到与其含义相对应的业务对象上,形成业务对象集合{O};
(2)业务对象语义解析引擎,其用于把业务对象解析成表与字段关系,梳理表之间的关系,根据用户选择的对象,提供可探索分析对象集合,包括:
d)用户选择所述业务对象集合{O}中的业务对象:维度和度量,语义解析引擎解析出维度对象的表关系集I,度量对象的表关系集Y;
e)查找所述I与Y之间的共有的表关系,并且验证这些共有关系是否符合用户的选择,把所有符合条件的关系放入关系集R;
f)在关系集R中,使用路径优化引擎对其进行排序,使用最优的路径计算结果并返回;
g)在关系集R中的所有可用表,反向解析出这些表上直接配置的其他维度对象集合Q,把Q中的对象与用户选择的维度度量对象去重,返回可探索集合对象{O1};
h)在所述可探索对象集合{O1}中,找出每一个业务对象对应的查找表上配置的直接相关业务对象集合{O2},返回{O1}U{O2}的结果呈现给用户,成为可探索分析的对象。
进一步的,其中M、N为大于等于1的正整数,N大于等于M。
进一步的,其中A、B为大于等于1的正整数,B大于等于A。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。

Claims (3)

1.一种基于业务对象的探索式数据分析系统,其特征在于,包括:
(1)业务对象抽象模块,其用于完成对复杂数据关系的业务抽象,所述业务抽象包括以下步骤:
a)选择任意一个表T,把表T的字段{CM,…,CN }根据其含义抽象成业务对象{OM,…,ON},并且把表与字段信息绑定到所述业务对象{OM,…,ON}上;
b)选择另一个表T2,把表T2的字段{CA,…,CB }根据其含义绑定到对象{OM,...,ON}上;
c)按照步骤b)的方法处理所有表,把相同含义的表和字段绑定到与其含义相对应的业务对象上,形成业务对象集合{O};
(2)业务对象语义解析引擎,其用于把业务对象解析成表与字段关系,包括:
d)用户选择所述业务对象集合{O}中的业务对象:维度和度量,语义解析引擎解析出维度对象的表关系集I,度量对象的表关系集Y;
e)查找所述I与Y之间的共有的表关系,并且验证这些共有关系是否符合用户的选择,把所有符合条件的关系放入关系集R;
f)在关系集R中,使用路径优化引擎对其进行排序,使用最优的路径计算结果并返回;
g)在关系集R中的所有可用表,反向解析出这些表上直接配置的其他维度对象集合Q,把Q中的对象与用户选择的维度度量对象去重,返回可探索集合对象{O1};
h)在所述可探索对象集合{O1}中,找出每一个业务对象对应的查找表上配置的直接相关业务对象集合{O2},返回{O1}U{O2}的结果呈现给用户,成为可探索分析的对象。
2.如权利要求1所述的基于业务对象的探索式数据分析系统,其特征在于,其中M、N为大于等于1的正整数,N大于等于M。
3.如权利要求1所述的基于业务对象的探索式数据分析系统,其特征在于,其中A、B为大于等于1的正整数,B大于等于A。
CN201510235011.2A 2015-05-11 2015-05-11 一种基于业务对象的探索式数据分析系统 Pending CN104820661A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510235011.2A CN104820661A (zh) 2015-05-11 2015-05-11 一种基于业务对象的探索式数据分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510235011.2A CN104820661A (zh) 2015-05-11 2015-05-11 一种基于业务对象的探索式数据分析系统

Publications (1)

Publication Number Publication Date
CN104820661A true CN104820661A (zh) 2015-08-05

Family

ID=53730961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510235011.2A Pending CN104820661A (zh) 2015-05-11 2015-05-11 一种基于业务对象的探索式数据分析系统

Country Status (1)

Country Link
CN (1) CN104820661A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105208010A (zh) * 2015-08-28 2015-12-30 苏州国云数据科技有限公司 基于反向ssh的跨局域网远程数据连接方法
CN107908640A (zh) * 2017-09-27 2018-04-13 国网浙江省电力公司杭州供电公司 一种业务实体关系智能探索引擎实现方法
CN112579582A (zh) * 2020-11-30 2021-03-30 贵州力创科技发展有限公司 一种数据分析引擎的数据探索方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080147223A1 (en) * 2006-12-19 2008-06-19 Erickson Steven C Method and system for associating objects in a manufacturing process
US8620956B2 (en) * 2009-06-16 2013-12-31 Microsoft Corporation Educational entity architecture and object model
CN104021156A (zh) * 2014-05-22 2014-09-03 武汉天量数据技术有限公司 一种基于sql语句快速汇总多层事实数据的方法
CN104268275A (zh) * 2014-10-16 2015-01-07 苏州国云数据科技有限公司 一种对数据做业务抽象和路径查找分析的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080147223A1 (en) * 2006-12-19 2008-06-19 Erickson Steven C Method and system for associating objects in a manufacturing process
US8620956B2 (en) * 2009-06-16 2013-12-31 Microsoft Corporation Educational entity architecture and object model
CN104021156A (zh) * 2014-05-22 2014-09-03 武汉天量数据技术有限公司 一种基于sql语句快速汇总多层事实数据的方法
CN104268275A (zh) * 2014-10-16 2015-01-07 苏州国云数据科技有限公司 一种对数据做业务抽象和路径查找分析的方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105208010A (zh) * 2015-08-28 2015-12-30 苏州国云数据科技有限公司 基于反向ssh的跨局域网远程数据连接方法
CN105208010B (zh) * 2015-08-28 2018-07-17 苏州国云数据科技有限公司 基于反向ssh的跨局域网远程数据连接方法
CN107908640A (zh) * 2017-09-27 2018-04-13 国网浙江省电力公司杭州供电公司 一种业务实体关系智能探索引擎实现方法
CN112579582A (zh) * 2020-11-30 2021-03-30 贵州力创科技发展有限公司 一种数据分析引擎的数据探索方法及系统

Similar Documents

Publication Publication Date Title
US11487772B2 (en) Multi-party data joint query method, device, server and storage medium
US20150127677A1 (en) Enterprise graph search based on object and actor relationships
US10157239B2 (en) Finding common neighbors between two nodes in a graph
US9753960B1 (en) System, method, and computer program for dynamically generating a visual representation of a subset of a graph for display, based on search criteria
US20150006316A1 (en) System and method for parallel search on explicitly represented graphs
CN104462084A (zh) 基于多个查询提供搜索细化建议
CN103778251B (zh) 面向大规模rdf图数据的sparql并行查询方法
CN108681603B (zh) 数据库中快速搜索树形结构数据的方法、存储介质
CN110674359B (zh) 多场景展示关系图谱的方法及系统
US11194863B2 (en) Searching method and apparatus, device and non-volatile computer storage medium
US20120203751A1 (en) Capture, Aggregate, and Use Search Activities as a Source of Social Data Within an Enterprise
De Virgilio et al. R2G: a Tool for Migrating Relations to Graphs.
US9183598B2 (en) Identifying event-specific social discussion threads
CN104331491A (zh) 一种组织机构的展示方法及装置
US9721000B2 (en) Generating and using a customized index
CN103440246A (zh) 用于MapReduce的中间结果数据排序方法及系统
US10963963B2 (en) Rule based hierarchical configuration
CN104268275A (zh) 一种对数据做业务抽象和路径查找分析的方法
CN109947804A (zh) 数据集合查询的优化方法、装置、服务器和存储介质
CN104820661A (zh) 一种基于业务对象的探索式数据分析系统
US10210281B2 (en) Method and system for obtaining knowledge point implicit relationship
CN105138527A (zh) 一种数据分类回归方法及装置
US8407255B1 (en) Method and apparatus for exploiting master-detail data relationships to enhance searching operations
CN110059967B (zh) 一种应用于城市辅助决策分析的数据处理方法及装置
CN102750460B (zh) 分层简化大规模图数据的运算方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150805

WD01 Invention patent application deemed withdrawn after publication