CN110413708A - 一种面向业务术语的数据分析系统 - Google Patents
一种面向业务术语的数据分析系统 Download PDFInfo
- Publication number
- CN110413708A CN110413708A CN201910664512.0A CN201910664512A CN110413708A CN 110413708 A CN110413708 A CN 110413708A CN 201910664512 A CN201910664512 A CN 201910664512A CN 110413708 A CN110413708 A CN 110413708A
- Authority
- CN
- China
- Prior art keywords
- data
- data analysis
- service
- tables
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明适用于数据库技术领域,提供了面向业务术语的数据分析系统,包括数据管理端以及数据应用端;数据管理端,用于获取源数据库中的数据表;对所述数据表的类型、关系进行自动识别,并建立对应的多维数据分析模型;将所述多维数据模型及原普通二维表同步至所述数据应用端;数据应用端,用于接收用户输入的业务术语;对业务术语进行识别及将其转化成结构化机器语言,并调取对应的业务数据表以及多维数据模型进行数据分析处理,生成数据分析结果;将所述数据分析结果进行图形化显示。该面向业务术语的数据分析系统大大降低了分析决策的技术门槛以及时间成本,同时提高了决策效率。
Description
技术领域
本发明属于数据库技术领域,尤其涉及一种面向业务术语的数据分析系统。
背景技术
数据仓库是决策支持系统和联机分析应用数据源的结构化数据环境。数据仓库解决从各类源数据库中获取数据,并通过ETL(抽取、转化、加载)过程将数据转化成面向分析星型数据结构。大数据分析是指基于数据仓库加工的特定格式数据,面向业务,做支持决策的各类分析。
现有技术中,在数据仓库、大数据分析领域,已经有成熟的平台可以对数据仓库中的数据进行ETL操作,也有图形化平台可以提供可视化建模及多位透视分析操作;但在操作平台上都没有让使用者完全脱离对技术的依赖,业务人员无法只专注业务,使用门槛高,缺少行业普适性;此外,有很多数据透视的平台,使用者需要手动建模来梳理表之间、字段之间的关系,也必须都手动配置分析条件。
由此可见,现有的数据分析平台存在使用门槛高、缺少行业普适性以及需要手动建模获得数据关系,费时费力,用户体验性差的问题。
发明内容
本发明实施例的目的在于提供一种面向业务术语的数据分析系统,旨在解决现有的数据分析平台存在使用门槛高、缺少行业普适性以及需要手动建模获得数据关系,费时费力,用户体验性差的问题。
本发明实施例是这样实现的,一种面向业务术语的数据分析系统,包括数据管理端以及与所述数据管理端通讯的数据应用端;
所述数据管理端,用于获取源数据库中的数据表;对所述数据表的类型、关系进行自动识别,并建立对应的多维数据分析模型;响应于用户的数据同步操作,将所述数据表以及多维数据分析模型同步至所述数据应用端;
所述数据应用端,用于接收用户输入的业务术语;对所述业务术语进行识别,并转化成结构化机器语言;调取对应的数据表以及多维数据模型,并对所述结构化机器语言进行数据分析处理,生成数据分析结果;将所述数据分析结果进行图形化显示。
本发明实施例提供的面向业务术语的数据分析系统,通过数据管理端对获取的数据表的类型、关系进行识别,并建立对应的多维数据分析模型,并同步给数据应用端;由数据应用端对用户输入的业务术语进行识别,并转化成结构化机器语言;调取对应的数据表以及多维数据模型进行数据分析处理,生成数据分析结果;将所述数据分析结果进行图形化显示;该面向业务术语的数据分析系统大大降低了分析决策的技术门槛以及时间成本,同时提高了决策效率;可以让不懂数据仓库技术的业务人员,用普通熟悉的数据应用端操作界面实现数据分析,以支持业务决策,以使业务人员对技术人员零依赖,在系统享受自助分析服务,真正实现数据自主分析。
附图说明
图1为本发明实施例一提供的面向业务术语的数据分析系统的结构示意图;
图2为本发明实施例一提供的数据管理端的结构示意图;
图3为本发明实施例一提供的数据应用端的结构示意图;
图4为本发明实施例二提供的面向业务术语的数据分析系统的结构示意图;
图5为本发明实施例三提供的面向业务术语的数据分析系统的结构示意图;
图6为本发明实施例四提供的面向业务术语的数据分析系统的结构示意图;
图7为本发明实施例提供的面向业务术语的数据分析系统的查询界面图;
图8为本发明实施例五提供的面向业务术语的数据分析系统的结构示意图;
图9为本发明实施例六提供的面向业务术语的数据分析系统的结构示意图;
图10为本发明实施例七提供的面向业务术语的数据分析系统的结构示意图;
图11为本发明实施例八提供的面向业务术语的数据分析系统的结构示意图;
图12为本发明实施例提供的面向业务术语的数据分析系统的关联分析界面图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。
本发明实施例提供的面向业务术语的数据分析系统,通过数据管理端对获取的数据表的类型、关系进行识别,并建立对应的多维数据分析模型,并同步给数据应用端;由数据应用端对用户输入的业务术语进行识别,并转化成结构化机器语言;调取对应的数据表以及多维数据模型进行数据分析处理,生成数据分析结果;将所述数据分析结果进行图形化显示;该面向业务术语的数据分析系统大大降低了分析决策的技术门槛以及时间成本,同时提高了决策效率;可以让不懂数据仓库技术的业务人员,用普通熟悉的数据应用端操作界面实现数据分析,以支持业务决策,以使业务人员对技术人员零依赖,在系统享受自助分析服务,真正实现数据自主分析。
为了进一步阐述本发明为实现预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明的具体实施方式、结构、特征及其功效,详细说明如下。
图1为本发明实施例一提供的一种面向业务术语的数据分析系统的结构示意图,为了便于说明,仅示出与本发明实施例相关的部分。
在本发明实施例中,所述面向业务术语的数据分析系统,包括数据管理端101以及与所述数据管理端101通讯的数据应用端102。
其中,所述数据管理端101,用于获取源数据库中的数据表;对所述数据表的类型、关系进行自动识别,并建立对应的多维数据分析模型;响应于用户的数据同步操作,将所述数据表以及多维数据分析模型同步至所述数据应用端。
在本发明实施例中,数据管理端主要面向数据库管理员,相对于现有的很多数据透视的平台,使用者需要手动建模来梳理表之间、字段之间的关系,还必须都手动配置分析条件,本发明实施例提供的数据管理端根据从源数据库中所获取的业务数据表组建的源数据库中的数据关系(ER关系、层级关系)进行识别,可以实现自动数据建模。
在本发明实施例中,数据管理端通过图形化界面对源数据库进行连接以及业务数据表的导入;其中,数据表至少包括业务标识、业务用户标识;其中,在实际应用中,同一个行业或者不同行业通常会提供多种业务,为了便于管理,通常会为每种不同的业务分配业务标识,进而通过业务标识来区分不同的业务。需要说明的是,这里的业务通常可以是实际应用中服务类的业务或者商品交易类的业务,当然也可以是其它的业务,具体不做限定。对应的业务标识可以是服务业务标识或者商品交易业务标识,通常为了提高便捷性,甚至也可以是服务或者商品本身的标识,也就是说业务标识可以是服务的标识或者是商品的标识;业务用户标识用于标识使用该业务的用户。在使用某个业务的用户较多时,通常需要为各个不同的用户分配业务用户标识,用来区分使用该业务的不同用户。在实际应用中,该业务用户标识可以是注册使用该业务的用户ID、也可以是唯一标识该用户的其它用户个人信息。
在本发明实施例中,对所述数据表的类型、关系进行自动识别,并建立对应的多维数据分析模型,具体为对数据表的业务标识进行识别,以确定其所属行业,同时根据数据之间的关系识别,建立对应的多维数据分析模型,比如该业务数据大体为汽车行业的,还可以进一步识别出其细化业务,如汽车增量、汽车销售额等,进而根据细化业务一一建立细化多维数据分析模型,各个多维数据分析模型并非独立存在,彼此根据业务分析需求,相互融合贯通。
在本发明实施例中,将所述数据表以及多维数据分析模型同步至所述数据应用端的具体实施方式可以为,将源数据库中的普通数据表(二维表),及数据模型组成的多维表以表文件的形式分主题存储管理,并可一键同步到数据应用端。
所述数据应用端102,用于接收用户输入的业务术语;对所述业务术语进行识别,并转化成结构化机器语言;调取对应的数据表以及多维数据模型,并对所述结构化机器语言进行数据分析处理,生成数据分析结果;将所述数据分析结果进行图形化显示。
在本发明实施例中,数据应用端面向业务人员,相对于现有的操作平台没有让使用者完全脱离对技术的依赖,业务人员没法只专注于业务,使用门槛高,并且用户无法通过业务术语来发送分析指令来获得想要的分析结果,而本发明实施例提供的数据应用端可供用户输入业务术语,并通过业务术语向数据管理端发送分析指令,更智能化。
在本发明实施例中,业务术语是指各个行业通用的业务语言;对所述业务术语进行识别处理,并调取对应的业务数据分析模型,具体为对业务语言即自然语言进行预处理,将其转换为SQL语句,以供识别出其所述行业以及其分析需求信息,进而调取已建立的对应多维数据分析模型。
本发明实施例提供的面向业务术语的数据分析系统,通过数据管理端对获取的数据表的类型、关系进行识别,并建立对应的多维数据分析模型,并同步给数据应用端;由数据应用端对用户输入的业务术语进行识别,并转化成结构化机器语言;调取对应的数据表以及多维数据模型进行数据分析处理,生成数据分析结果;将所述数据分析结果进行图形化显示;该面向业务术语的数据分析系统大大降低了分析决策的技术门槛以及时间成本,同时提高了决策效率;可以让不懂数据仓库技术的业务人员,用普通熟悉的数据应用端操作界面实现数据分析,以支持业务决策,以使业务人员对技术人员零依赖,在系统享受自助分析服务,真正实现数据自主分析。
图2为本发明实施例一提供的数据管理端的结构示意图,为了便于说明,仅示出与本发明实施例相关的部分。
在本发明实施例中,所述数据管理端101,包括数据获取单元201、数据建模单元202以及数据同步单元203。
数据获取单元201,用于获取源数据库中的数据表。
在本发明实施例中,数据表至少包括业务标识、业务用户标识;其中,在实际应用中,同一个行业或者不同行业通常会提供多种业务,为了便于管理,通常会为每种不同的业务分配业务标识,进而通过业务标识来区分不同的业务。需要说明的是,这里的业务通常可以是实际应用中服务类的业务或者商品交易类的业务,当然也可以是其它的业务,具体不做限定。对应的业务标识可以是服务业务标识或者商品交易业务标识,通常为了提高便捷性,甚至也可以是服务或者商品本身的标识,也就是说业务标识可以是服务的标识或者是商品的标识;业务用户标识用于标识使用该业务的用户。在使用某个业务的用户较多时,通常需要为各个不同的用户分配业务用户标识,用来区分使用该业务的不同用户。在实际应用中,该业务用户标识可以是注册使用该业务的用户ID、也可以是唯一标识该用户的其它用户个人信息。
数据建模单元202,用于对所述数据表的类型、关系进行自动识别,并建立对应的多维数据分析模型。
在本发明实施例中,对所述数据表的类型、关系进行自动识别,并建立对应的业务数据分析模型,具体为,自动识别源数据库中表的类型(ods、dwd、dim、还是ads层的表),表跟表之间的主外关系,以及维表内部各字段的层级关系,即对数据表的业务标识进行识别,以确定其所属行业,同时根据业务数据之间的关系识别,建立对应的多维数据分析模型,比如该数据表大体为汽车行业的,还可以进一步识别出其细化业务,如汽车增量、汽车销售额等,进而根据细化业务一一建立细化多维数据分析模型,各个多维数据分析模型并非独立存在,彼此根据业务分析需求,相互融合贯通。
数据同步单元203,用于响应于用户的数据同步操作,将所述数据表以及多维数据模型同步至所述数据应用端。
在本发明实施例中,将所述数据表以及多维数据模型同步至所述数据应用端,具体实现方式可以为,源数据库中的普通数据表(二维表),及数据模型组成的多维表以表文件的形式分主题存储管理,并可一键同步到数据应用端。
图3为本发明实施例一提供的数据应用端的结构示意图,为了便于说明,仅示出与本发明实施例相关的部分。
在本发明实施例中,所述数据应用端102,包括术语接收单元301、术语转换单元302、分析结果生成单元303以及分析结果显示单元304。
术语接收单元301,用于接收用户输入的业务术语。
在本发明实施例中,业务术语是指各个行业通用的业务语言,比如包括一些英文缩写:POP意为卖点广告,又名店头陈设;SWOT是一种分析方法,用来确定企业本身的竞争优势,竞争劣势,机会和威胁,从而将公司的战略与公司内部资源、外部环境有机结合;或者为一些业界常用语言如“浙江省各城市新增车小汽车数”、“车辆流量路口信息分析”以及“小额信贷客户黑名单信息”等等。
术语转换单元302,用于对所述业务术语进行识别,并转化成结构化机器语言。
在本发明实施例中,对所述业务术语进行识别,并转化成结构化机器语言,具体为,该业务术语可以是通过语音输入,将语音输入的业务术语进行实时转化为文字;进而从文字文本中提取表示表名信息的关键字,对数据表进行匹配搜索,找到要分析的数据表进行自动打开操作、以及从文本信息中提取出进行聚合计算的维度关键字,对普通表或维表字段下的字段值进行匹配搜索,找到对应的用来分组聚合的维度字段、以及从文本中提取表示限定条件的关键字,对普通表或维表字段下的字段值进行匹配搜索,找到相应的用来作为条件筛选的字段、以及从文本中提取表示限定条件的关键字,识别含义,对条件筛选字段的条件进行自动设置、以及从文本中分词出指标关键字,跟普通表中的字段,或者事实表中无关联的其它字段名模糊匹配,找到字段及确定计算方式;进而根据提取出的表名信息关键字,可以定位到要分析的业务,其数据来源存在哪个多维表或者普通表中;将上述提取出的“分组聚合维度字段”、“条件限定字段”、“条件限定范围”、“指标字段”、“指标聚合函数”等信息,自动拼接成结构化的SQL查询语句。
分析结果生成单元303,用于调取对应的数据表以及多维数据模型,并对所述结构化机器语言进行数据分析处理,生成数据分析结果。
在本发明实施例中,调取对应的数据表以及多维数据模型,并对所述结构化机器语言进行数据分析处理,生成数据分析结果的具体实施方式可以为根据上述定位的数据表的存储位置,调取对应多维数据分析模型;进而根据多维数据分析模型,对SQL查询语句进行聚合分析计算处理,生成数据分析结果。
分析结果显示单元304,用于将所述数据分析结果进行图形化显示。
在本发明实施例中,对数据分析结果进行图形化显示,包括饼状图、柱状图、曲线图、图表等自定义图形显示。
图4为本发明实施例二提供的面向业务术语的数据分析系统的结构示意图,为了便于说明,仅示出与本发明实施例相关的部分,其与上述实施例一类似,不同之处在于:
在本发明实施例中,所述建模单元202包括识别模块401以及建模模块402。
识别模块401,用于根据人工智能算法对所述数据表的数据类型、ER关系以及层级关系进行识别处理。
算法建模模块402,用于根据所述数据表的数据类型、ER关系以及层级关系,构建多维数据分析模型。
本发明实施例提供的面向业务术语的数据分析系统,通过识别模块根据人工智能算法对所述数据表的数据类型、ER关系以及层级关系进行识别处理;以及由建模模块根据所述数据表的数据类型、ER关系以及层级关系,构建多维数据分析模型,相对于现有的很多数据透视的平台,使用者需要手动建模来梳理表之间、字段之间的关系,还必须都手动配置分析条件,明显更佳智能化,数据分析更准确。
图5为本发明实施例三提供的面向业务术语的数据分析系统的结构示意图,为了便于说明,仅示出与本发明实施例相关的部分,其与上述实施例一类似,不同之处在于:
在本发明实施例中,所述数据同步单元204包括表文件存储模块501以及表文件同步模块502。
表文件存储模块501,用于将所述数据表以及多维数据模型以表文件形式进行分主题存储。
在本发明实施例中,将所述数据表以及多维数据模型以表文件形式进行分主题存储,具体实现方式可为,用操作系统的格式对数据表以及多维数据模型进行文件夹文件目录体系管理,并且根据对应数据表以及多维数据模型的类型进行分主题存储。
表文件同步模块502,用于响应于用户的数据同步操作,将对应的主题的表文件同步至数据应用端。
在本发明实施例中,数据同步操作为一键同步形式实现,如在数据管理端中,在各个表文件中设置功能按键“一键同步”,用户通过图形化界面点击一键同步,即完成将包含有数据表以及多维数据模型的表文件同步到数据应用端中以供用户进行数据分析使用。
本发明实施例提供的面向业务术语的数据分析系统,通过表文件存储模块以及表文件同步模块,可将源数据库中的普通数据表(二维表),及数据模型组成的多维表以表文件的形式分主题存储管理,并可一键同步到数据应用端,有利数据资料的管理,同时分享更便捷,普适性强。
图6为本发明实施例四提供的一种面向业务术语的数据分析系统的结构示意图,为了便于说明,仅示出与本发明实施例相关的部分,其与上述实施例一类似,不同之处在于:
在本发明实施例中,所述术语转换单元302,包括识别模块601、信息提取模块602、数据定位模块603以及语句拼接模块604。
识别模块601,用于将语音输入的业务术语转化成文本信息。
在本发明实施例中,识别模块用于将术语接收单元输入的语音实时转化为文字。
信息提取模块602,用于从所述文本信息中提取表名信息关键字和/或维度关键字和/或限定条件的关键字信息。
在本发明实施例中,从所述文本信息中提取表名信息关键字和/或维度关键字和/或限定条件的关键字信息,具体包括:1)从文本中提取表示表名信息的关键字,对数据表进行匹配搜索,找到要分析的数据表进行自动打开操作;2)从文本信息中提取出进行聚合计算的维度关键字,对普通表或维表字段下的字段值进行匹配搜索,找到对应的用来分组聚合的维度字段;3)从文本中提取表示限定条件的关键字,对普通表或维表字段下的字段值进行匹配搜索,找到相应的用来作为条件筛选的字段;4)从文本中提取表示限定条件的关键字,识别含义,对条件筛选字段的条件进行自动设置;5)
从文本中分词出指标关键字,跟普通表中的字段,或者事实表中无关联的其它字段名模糊匹配,找到字段及确定计算方式;具体可以为如用户输入业务术语为“我想知道2015-2019年浙江省各城市新增小汽车数”,则提取到信息为“浙江省、城市、小汽车数、2015-2019、每年”,见图7所示。
数据定位模块603,用于根据所述表名信息关键字,确定数据表的存储位置。
在本发明实施例中,数据定位模块用于根据信息提取模块提取出的表名信息关键字,可以定位到要分析的业务,其数据来源存在哪个多维表或者普通表中。
语句拼接模块604,用于将所述信息提取模块提取的关键字信息自动拼接成结构化的SQL查询语句。
在本发明实施例中,将所述信息提取模块提取的关键字信息自动拼接成结构化的SQL查询语句,具体为:将信息提取模块提取出的“分组聚合维度字段”、“条件限定字段”、“条件限定范围”、“指标字段”、“指标聚合函数”等信息,自动拼接成结构化的SQL查询语句。
本发明实施例提供的面向业务术语的数据分析系统,可供用户输入业务术语,并通过业务术语向数据管理端发送分析指令;相对于现有的操作平台没有让使用者完全脱离对技术的依赖,业务人员没法只专注于业务,使用门槛高,并且用户无法通过业务术语来发送分析指令来获得想要的分析结果,更智能化。
图8为本发明实施例五提供的一种面向业务术语的数据分析系统的结构示意图,为了便于说明,仅示出与本发明实施例相关的部分,其与上述实施例一类似,不同之处在于:
在本发明实施例中,所述分析结果生成单元303,包括模型调取模块801以及结果生成模块802。
模型调取模块801,用于根据数据定位模块定位到的数据表的存储位置,调取对应多维数据分析模型。
结果生成模块802,用于根据所述多维数据分析模型,对SQL查询语句进行聚合分析计算处理,生成数据分析结果。
本发明实施例提供的面向业务术语的数据分析系统,可供用户通过输入业务术语发送分析指令,得到想要查询的分析结果;相对于现有的操作平台没有让使用者完全脱离对技术的依赖,业务人员没法只专注于业务,使用门槛高,并且用户无法通过业务术语来发送分析指令来获得想要的分析结果,更智能化。
图9为本发明实施例七提供的一种面向业务术语的数据分析系统的结构示意图,为了便于说明,仅示出与本发明实施例相关的部分,其与上述实施例一类似,不同之处在于:
在本发明实施例中,所述数据应用端102,还包括数据分析结果分享单元901。
数据分析结果分享单元901,用于接收用户的数据分析结果分享请求,所述数据分享请求携带有接收终端信息;将所述数据分析结果发送至对应接收终端。
本发明实施例提供的面向业务术语的数据分析系统,通过数据分析结果分享单元,可将不同的数据同步给不同角色用户的客户端,以供分析使用,实现各行业的通用,普适性更强。
图10为本发明实施例八提供的一种面向业务术语的数据分析系统的结构示意图,为了便于说明,仅示出与本发明实施例相关的部分,其与上述实施例一类似,不同之处在于:
在本发明实施例中,所述分析结果显示单元304,包括图表生成模块1001以及数据挖掘模块1002。
图表生成模块1001,用于响应于用户基于图形化界面输入的图表样式定义操作,根据数据分析结果生成自定义图表。
在本发明实施例中,通过图形界面进行数据筛选及图表样式定义,根据用户业务需求实时拼出用户想要的图表,支持图标横、纵坐标的灵活配置。
数据挖掘模块1002,用于对所述自定义图表进行统计函数计算以及统计算法计算,生成决策分析报告并展示。
在本发明实施例中,通过图形界面对数据表中的数据进行统计计算,及常用的算法计算,生成决策分析报告;其中,统计函数计算包括:计数、求平均、求和、求百分位、求同比/环比、求方差/标准差/x协方差等;统计算法模块包括:假设检验、相关分析、多维回归分析、因子/主成分分析、协方差分析、聚类分析、结构方程模型、Apriori算法等。
本发明实施例提供的面向业务术语的数据分析系统,通过图表生成模块响应于用户基于图形化界面输入的图表样式定义操作,根据数据分析结果生成自定义图表,数据挖掘单元对所述自定义图表进行统计函数计算以及统计算法计算,生成决策分析报告并展示;该面向业务术语的数据分析系统大大降低了分析决策的技术门槛以及时间成本,同时提高了决策效率;可以让不懂数据仓库技术的业务人员,用普通熟悉的数据应用端操作界面实现数据分析,以支持业务决策,以使业务人员对技术人员零依赖,在系统享受自助分析服务,真正实现数据自主分析。
图11为本发明实施例六提供的一种面向业务术语的数据分析系统的结构示意图,为了便于说明,仅示出与本发明实施例相关的部分,其与上述实施例一类似,不同之处在于:
在本发明实施例中,所述数据应用端102,还包括排版编辑单元1101。
排版编辑单元1101,用于接收用户自定义输入的排版信息,根据所述排版信息对数据分析结果进行编辑。
在本发明实施例中,根据所述排版信息对数据分析结果进行编辑,即支持用户对分析结果界面的自定义排版编辑,具体为,通过图形界面进行数据筛选及图表样式定义,根据用户业务需求实时拼出用户想要的图表,支持图标横、纵坐标的灵活配置。
另外,用户还可以通过图形界面对多张表进行联结操作,可以自定将图形界面的输入转化成SQL语言,将多张表拼成一张表,在此基础上进行各类指标的查询操作;或者通过图形界面对维度及指标进行自定义操作,以此查看各个维度或组合维度下的各类指标。以此来满足趋势分析、比较分析等可视化分析需求。该功能还支持对维度指标的一键下钻及上卷操作。
在本发明实施例中,当所获得的数据分析结果为多张图表时,通过图形界面对多张表进行联结操作,可以自定将图形界面的输入转化成SQL语言,将多张表拼成一张表,在此基础上进行各类指标的查询操作,如图12所示。
应该理解的是,虽然本发明各实施例的结构框图中的各个结构按照箭头的指示依次显示,但是这些结构并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些结构的执行并没有严格的顺序限制,这些结构可以以其它的解耦股执行。而且,各实施例中的至少一部分结构可以包括多个子解耦股或者多个阶段,这些子结构或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子结构或者阶段的执行顺序也不必然是依次进行,而是可以与其它结构或者其它结构的子结构或者阶段的至少一部分轮流或者交替地执行。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种面向业务术语的数据分析系统,其特征在于,包括数据管理端以及与所述数据管理端通讯的数据应用端;
所述数据管理端,用于获取源数据库中的数据表;对所述数据表的类型、关系进行自动识别,并建立对应的多维数据分析模型;响应于用户的数据同步操作,将所述数据表以及多维数据分析模型同步至所述数据应用端;
所述数据应用端,用于接收用户输入的业务术语;对所述业务术语进行识别,并转化成结构化机器语言;调取对应的数据表以及多维数据模型,并对所述结构化机器语言进行数据分析处理,生成数据分析结果;将所述数据分析结果进行图形化显示。
2.根据权利要求1所述的面向业务术语的数据分析系统,其特征在于,所述数据管理端,包括:
数据获取单元,用于获取源数据库中的数据表;
数据建模单元,用于对所述数据表的类型、关系进行自动识别,并建立对应的多维数据分析模型;以及
数据同步单元,用于响应于用户的数据同步操作,将所述数据表以及多维数据分析模型同步至所述数据应用端。
3.根据权利要求2所述的面向业务术语的数据分析系统,其特征在于,所述数据建模单元,具体包括:
识别模块,用于根据人工智能算法对所述数据表的数据类型、ER关系以及层级关系进行识别处理;以及
建模模块,用于根据所述数据表的数据类型、ER关系以及层级关系,构建多维数据分析模型。
4.根据权利要求2所述的面向业务术语的数据分析系统,其特征在于,所述数据同步单元,具体包括:
表文件存储模块,用于将所述数据表以及多维数据模型以表文件形式进行分主题存储;以及
表文件同步模块,用于响应于用户的数据同步操作,将对应的主题的表文件同步至数据应用端。
5.根据权利要求1所述的面向业务术语的数据分析系统,其特征在于,所述数据应用端,包括:
术语接收单元,用于接收用户输入的业务术语;
术语转换单元,用于对所述业务术语进行识别,并转化成结构化机器语言;
分析结果生成单元,用于调取对应的数据表以及多维数据模型,并对所述结构化机器语言进行数据分析处理,生成数据分析结果;以及
分析结果显示单元,用于将所述数据分析结果进行图形化显示。
6.根据权利要求5所述的面向业务术语的数据分析系统,其特征在于,所述术语转换单元,包括:
识别模块,用于将语音输入的业务术语转化成文本信息;
信息提取模块,用于从所述文本信息中提取表名信息关键字和/或维度关键字和/或限定条件的关键字信息;
数据定位模块,用于根据所述表名信息关键字,确定数据表的存储位置;以及
语句拼接模块,用于将所述信息提取模块提取的关键字信息自动拼接成结构化的SQL查询语句。
7.根据权利要求5所述的面向业务术语的数据分析系统,其特征在于,所述模型调取单元,包括:
模型调取模块,用于根据数据定位模块定位到的数据表的存储位置,调取对应多维数据分析模型;以及
结果生成模块,用于根据所述多维数据分析模型,对SQL查询语句进行聚合分析计算处理,生成数据分析结果。
8.根据权利要求5所述的面向业务术语的数据分析系统,其特征在于,所述分析结果显示单元,具体包括:
图表生成模块,用于响应于用户基于图形化界面输入的图表样式定义操作,根据数据分析结果生成自定义图表;以及
数据挖掘模块,用于对所述自定义图表进行统计函数计算以及统计算法计算,生成决策分析报告并展示。
9.根据权利要求5所述的面向业务术语的数据分析系统,其特征在于,所述数据应用端,还包括:
排版编辑单元,用于接收用户自定义输入的排版信息,根据所述排版信息对数据分析结果进行编辑。
10.根据权利要求5所述的面向业务术语的数据分析系统,其特征在于,所述数据应用端,还包括:
数据分析结果分享单元,用于接收用户的数据分析结果分享请求,所述数据分享请求携带有接收终端信息;将所述数据分析结果发送至对应接收终端。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910664512.0A CN110413708B (zh) | 2019-07-23 | 2019-07-23 | 一种面向业务术语的数据分析系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910664512.0A CN110413708B (zh) | 2019-07-23 | 2019-07-23 | 一种面向业务术语的数据分析系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110413708A true CN110413708A (zh) | 2019-11-05 |
CN110413708B CN110413708B (zh) | 2022-06-21 |
Family
ID=68362558
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910664512.0A Active CN110413708B (zh) | 2019-07-23 | 2019-07-23 | 一种面向业务术语的数据分析系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110413708B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112765282A (zh) * | 2021-01-18 | 2021-05-07 | 恒安嘉新(北京)科技股份公司 | 一种数据联机分析处理方法、装置、设备及存储介质 |
CN113190549A (zh) * | 2021-03-29 | 2021-07-30 | 无锡极数宝大数据科技有限公司 | 多维表数据调取方法、装置、服务器及存储介质 |
CN115438142A (zh) * | 2021-06-02 | 2022-12-06 | 戎易商智(北京)科技有限公司 | 一种对话式交互数据分析报告系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103399926A (zh) * | 2013-08-05 | 2013-11-20 | 河海大学 | 水利普查数据多维分析服务系统及其封装和实现方法 |
US20150100543A1 (en) * | 2012-09-14 | 2015-04-09 | Hitachi, Ltd. | Data analysis method, data analysis device, and storage medium storing processing program for same |
CN104794221A (zh) * | 2015-04-29 | 2015-07-22 | 苏州国云数据科技有限公司 | 一种基于业务对象的多维数据分析系统 |
CN108052542A (zh) * | 2017-11-22 | 2018-05-18 | 链家网(北京)科技有限公司 | 一种基于presto的数据的多维数据的分析方法 |
CN109918453A (zh) * | 2019-02-13 | 2019-06-21 | 中国三峡建设管理有限公司 | 一种以自然语言搜索关系型复杂管理信息系统数据的方法及系统 |
CN110032591A (zh) * | 2018-12-28 | 2019-07-19 | 国网浙江省电力有限公司信息通信分公司 | 一种资产大数据智能分析方法 |
-
2019
- 2019-07-23 CN CN201910664512.0A patent/CN110413708B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150100543A1 (en) * | 2012-09-14 | 2015-04-09 | Hitachi, Ltd. | Data analysis method, data analysis device, and storage medium storing processing program for same |
CN103399926A (zh) * | 2013-08-05 | 2013-11-20 | 河海大学 | 水利普查数据多维分析服务系统及其封装和实现方法 |
CN104794221A (zh) * | 2015-04-29 | 2015-07-22 | 苏州国云数据科技有限公司 | 一种基于业务对象的多维数据分析系统 |
CN108052542A (zh) * | 2017-11-22 | 2018-05-18 | 链家网(北京)科技有限公司 | 一种基于presto的数据的多维数据的分析方法 |
CN110032591A (zh) * | 2018-12-28 | 2019-07-19 | 国网浙江省电力有限公司信息通信分公司 | 一种资产大数据智能分析方法 |
CN109918453A (zh) * | 2019-02-13 | 2019-06-21 | 中国三峡建设管理有限公司 | 一种以自然语言搜索关系型复杂管理信息系统数据的方法及系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112765282A (zh) * | 2021-01-18 | 2021-05-07 | 恒安嘉新(北京)科技股份公司 | 一种数据联机分析处理方法、装置、设备及存储介质 |
CN112765282B (zh) * | 2021-01-18 | 2023-11-28 | 恒安嘉新(北京)科技股份公司 | 一种数据联机分析处理方法、装置、设备及存储介质 |
CN113190549A (zh) * | 2021-03-29 | 2021-07-30 | 无锡极数宝大数据科技有限公司 | 多维表数据调取方法、装置、服务器及存储介质 |
CN115438142A (zh) * | 2021-06-02 | 2022-12-06 | 戎易商智(北京)科技有限公司 | 一种对话式交互数据分析报告系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110413708B (zh) | 2022-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107609052B (zh) | 一种基于语义三角的领域知识图谱的生成方法及装置 | |
US7281001B2 (en) | Data quality system | |
CA2260647C (en) | Agent-based data mining and warehousing | |
CN105069560B (zh) | 一种基于知识库和规则库的履历信息抽取与特征标识分析系统及方法 | |
US10339038B1 (en) | Method and system for generating production data pattern driven test data | |
CN110413708A (zh) | 一种面向业务术语的数据分析系统 | |
Alon et al. | Adversarial laws of large numbers and optimal regret in online classification | |
CN103605651A (zh) | 一种基于olap多维分析的数据处理展现方法 | |
CN108351898A (zh) | 用于结构化多字段文件布局的自动化解释 | |
CN104991955A (zh) | 一种自动构建模板库的方法及系统 | |
CN107633093A (zh) | 一种供电决策知识图谱的构建及其查询方法 | |
CN105868183A (zh) | 一种预测员工离职的方法及装置 | |
CN110888930A (zh) | 基于知识图谱的金融知识查询服务接口设计与实现方法 | |
CN110442730A (zh) | 一种基于deepdive的知识图谱构建方法 | |
CN109254903A (zh) | 一种智能化的日志分析方法及装置 | |
CN108664509A (zh) | 一种即席查询的方法、装置及服务器 | |
CN104965846B (zh) | MapReduce平台上的虚拟人建立方法 | |
CN103473305A (zh) | 一种在统计分析中进行决策流程展示的方法及系统 | |
CN112835784B (zh) | 一种复杂巨系统互操作能力评估及优化方法 | |
CN105677745A (zh) | 一种通用高效自助数据查询系统及实现方法 | |
Ganesh et al. | Mining Entity-Identification Rules for Database Integration. | |
CN100573511C (zh) | 产生分析数据结构的自定义等级体系的系统和方法 | |
CN110175197B (zh) | 一种基于语义物联网的本体构建方法和系统 | |
CN113673889A (zh) | 一种智能化数据资产识别的方法 | |
Vieira et al. | Incremental entity resolution process over query results for data integration systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |