CN111459923A - 移动bi商业智能解决方法及系统 - Google Patents

移动bi商业智能解决方法及系统 Download PDF

Info

Publication number
CN111459923A
CN111459923A CN202010183865.1A CN202010183865A CN111459923A CN 111459923 A CN111459923 A CN 111459923A CN 202010183865 A CN202010183865 A CN 202010183865A CN 111459923 A CN111459923 A CN 111459923A
Authority
CN
China
Prior art keywords
data
mobile
business
business intelligence
submodule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010183865.1A
Other languages
English (en)
Inventor
金家芳
李宁
刘世阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vision Credit Financial Technology Co ltd
Original Assignee
Vision Credit Financial Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vision Credit Financial Technology Co ltd filed Critical Vision Credit Financial Technology Co ltd
Priority to CN202010183865.1A priority Critical patent/CN111459923A/zh
Publication of CN111459923A publication Critical patent/CN111459923A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种移动BI商业智能解决方法及系统,其中方法包括如下步骤:S1用于将数据进行ETL采集的步骤;S2用于将采集到的数据进行数据清洗的步骤;S3用于将清洗后的数据存储并进行公共数据层搭建的步骤;S4用于数据模型搭建的步骤;S5用于前端通过数据接口服务获取后端数据并进行展示的步骤。这样,本发明所提供的一种移动BI商业智能解决方法及系统,使有着强大数据处理分析能力的商业智能软件与先进的移动应用技术相结合,为用户打造全天候、轻量化、易操作的移动分析商务智能解决方案。

Description

移动BI商业智能解决方法及系统
技术领域
本发明涉及计算机软件技术领域,尤其涉及一种移动BI商业智能解决方法及系统。
背景技术
随着信息技术与移动互联网基础的发展,通过数据,快速有效的挖掘其深层价值,为企业策略导向提供有效指引,通过数据驱动业务,均成为了众多企业着重发展的目标。现有技术中的移动BI(Business Intelligence)商务智能系统是通过使用移动终端设备获取数据的,但系统不能完成独立的分析与决策应用,用户获取所需业务数据及分析展现具有时间和空间的局限性,使得移动分析商务智能解决能力差,移动BI的体验感差。
发明内容
本发明的目的是提供一种移动BI商业智能解决方法及系统。
本发明提供了一种移动BI商业智能解决方法,包括如下步骤:S1用于将数据进行ETL采集的步骤;S2用于将采集到的数据进行数据清洗的步骤;S3用于将清洗后的数据存储并进行公共数据层搭建的步骤;S4用于数据模型搭建的步骤;S5用于前端通过数据接口服务获取后端数据并进行展示的步骤。
所述S1用于将数据进行ETL采集的步骤包括:S11用于实时捕捉数据库日志,将各数据同步并输出实时数据统计的步骤;S12用于通过定时链接多个异构数据库进行目标数据汇总抽取的步骤;S13用于通过搭建数据仓库进行全面数据抽取的步骤。所述S2用于将采集到的数据进行数据清洗的步骤包括:S21用于将同业务类型数据进行数据格式转换,统一数据格式的步骤;S22用于通过拉依达准则法对异常值进行检测,并对检测到的异常值进行处理的步骤。所述S3用于将清洗后的数据存储并进行公共数据层搭建的步骤包括:S31用于存放明细数据、维表数据以及公共指标汇总数据,将汇总数据同步至事实表的步骤;S32用于分析出相关和相似的数据并进行组合同步至明细宽表的步骤;S33用于公共指标统一加工并建立一致性纬度的步骤。所述S4用于数据模型搭建的步骤包括:S41用于发掘业务数据标签、属性及关联的步骤;S42用于搭建业务数据模型,制定业务指标,创建数据集市大宽表的步骤。所述S5用于前端通过数据接口服务获取后端数据并进行展示的步骤包括:S51用于将登录状态写入单点登录配置中的步骤;S52用于通过发送登录请求执行单点登录展示的步骤。本发明所提供的移动BI商业智能解决方法,还包括如下步骤:S6用于元数据管理及运行监控管理的步骤;S7用于业务指标监控及预警的步骤。所述S6用于元数据管理及运行监控管理的步骤包括:S61用于通过服务器监控预警并检测服务器异常的步骤;S62用于通过阈值的设置定位异常业务指标的步骤。
本发明提供了一种移动BI商业智能解决系统,包括:用于将数据进行ETL采集的模块;用于将采集到的数据进行数据清洗的模块;用于将清洗后的数据存储并进行公共数据层搭建的模块;用于数据模型搭建的模块;用于前端通过数据接口服务获取后端数据并进行展示的模块。
所述用于将数据进行ETL采集的模块包括:用于实时捕捉数据库日志,将各数据同步并输出实时数据统计的子模块;用于通过定时链接多个异构数据库进行目标数据汇总抽取的子模块;用于通过搭建数据仓库进行全面数据抽取的子模块。所述用于将采集到的数据进行数据清洗的模块包括:用于将同业务类型数据进行数据格式转换,统一数据格式的子模块;用于通过拉依达准则法对异常值进行检测,并对检测到的异常值进行处理的子模块。所述用于将清洗后的数据存储并进行公共数据层搭建的模块包括:用于存放明细数据、维表数据以及公共指标汇总数据,将汇总数据同步至事实表的子模块;用于分析出相关和相似的数据并进行组合同步至明细宽表的子模块;用于公共指标统一加工并建立一致性纬度的子模块。所述用于数据模型搭建的模块包括:用于发掘业务数据标签、属性及关联的子模块;用于搭建业务数据模型,制定业务指标,创建数据集市大宽表的子模块。所述用于前端通过数据接口服务获取后端数据并进行展示的模块包括:用于将登录状态写入单点登录配置中的子模块;用于通过发送登录请求执行单点登录展示的子模块。本发明所提供的移动BI商业智能解决系统,还包括:用于元数据管理及运行监控管理的模块;用于业务指标监控及预警的模块。所述用于元数据管理及运行监控管理的模块包括:用于通过服务器监控预警并检测服务器异常的子模块;用于通过阈值的设置定位异常业务指标的子模块。
本发明提供了一种移动BI商业智能解决方法及系统,通过使用移动终端设备,使得用户能够随时随地获取所需的业务数据及分析展现,完成独立的分析与决策应用,实现决策分析无处不在的实时动态管理。移动BI融合了计算机技术、通信技术、互联网技术,消除了时间和空间的限制,用户可将移动BI作为辅助决策在有力工具。
本发明提供了一种移动BI商业智能解决方法及系统重在体验,可以随时随地访问企业商务智能应用;实时钻取,主题分析,可以实时访问企业数据,并进行透视、钻取等分析;信息定制推送服务,可以根据员工的不同角色、工作习惯、管理特点等,来定制个性化的推送内容、推送方式、推送时间等;及时提醒,监控与预警服务,可以主动将报警信息发送到用户的移动设备,提醒及时采取措施,避免延误;随需定制,个性移动商务智能分析,可以根据用户不同行业不同领域的用户需求,进行个性化开发,满足不同角色需求。
本发明提供了一种移动BI商业智能解决方法及系统,使有着强大数据处理分析能力的商业智能软件与先进的移动应用技术相结合,为用户打造全天候、轻量化、易操作的移动分析商务智能解决方案。
附图说明
图1、2为本发明所提供的一种移动BI商业智能解决方法的示意图;
图3为本发明实施例一所述S1用于将数据进行ETL采集的步骤示意图;
图4为本发明实施例一所述S2用于将采集到的数据进行数据清洗的步骤示意图;
图5为本发明实施例一所述S3用于将清洗后的数据存储并进行公共数据层搭建的步骤示意图;
图6为本发明实施例一所述S4用于数据模型搭建的步骤示意图;
图7为本发明实施例一所述S5用于前端通过数据接口服务获取后端数据并进行展示的步骤示意图;
图8为本发明所提供的一种移动BI商业智能解决方法的部分示意图;
图9为本发明实施例一所述S6用于元数据管理及运行监控管理的步骤示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
如图1、2所示,本实施例提供一种移动BI商业智能解决方法,包括如下步骤:
S1用于将数据进行ETL采集的步骤;
S2用于将采集到的数据进行数据清洗的步骤;
S3用于将清洗后的数据存储并进行公共数据层搭建的步骤;
S4用于数据模型搭建的步骤;
S5用于前端通过数据接口服务获取后端数据并进行展示的步骤。
本领域技术人员可以理解,ETL数据用来描述从来源端经过萃取(extract)、转置(transform)、加载(load)至目的端的过程的数据,实施ETL过程前包括离线数据、前端产品、业务中台、财务数据及数据仓库等数据。本实施例所提供的移动BI商业智能解决方法是指通过使用移动终端设备,使得用户能够随时随地获取所需的业务数据及分析展现,完成独立的分析与决策应用,实现决策分析无处不在的实时动态管理。移动BI融合了计算机技术、通信技术、互联网技术,消除了时间和空间的限制,用户可将移动BI作为辅助决策在有力工具。
本实施例所提供的移动BI商业智能解决方法重在体验,可以随时随地访问企业商务智能应用;实时钻取,主题分析,可以实时访问企业数据,并进行透视、钻取等分析;信息定制推送服务,可以根据员工的不同角色、工作习惯、管理特点等,来定制个性化的推送内容、推送方式、推送时间等;及时提醒,监控与预警服务,可以主动将报警信息发送到用户的移动设备,提醒及时采取措施,避免延误;随需定制,个性移动商务智能分析,可以根据用户不同行业不同领域的用户需求,进行个性化开发,满足不同角色需求。
本实施例所提供的移动BI商业智能解决方法,使有着强大数据处理分析能力的商业智能软件与先进的移动应用技术相结合,为用户打造全天候、轻量化、易操作的移动分析商务智能解决方案。
如图3所示,所述S1用于将数据进行ETL采集的步骤包括:
S11用于实时捕捉数据库日志,将各数据同步并输出实时数据统计的步骤;
S12用于通过定时链接多个异构数据库进行目标数据汇总抽取的步骤;
S13用于通过搭建数据仓库进行全面数据抽取的步骤。
本领域技术人员可以理解,随着业务场景拓展较广,各用户需求不一,各业务系统使用多种类型数据库。因此对同构和异构数据库间数据采集也提出了一定的要求,主要使用三种方法实现不同场景需求:一、OGG同步:通过Orcale OGG软件,对各类型数据库日志进行实时捕捉,变换和投递,实现源数据库与OGG数据服务器的数据同步,保持最少10ms的数据延迟,以满足实时数据统计展示需求,提高数据同步的实时性,提高移动BI解决方法的时效性。二、ODBC链接:通过ODBC定时链接多个异构数据库,按照业务分析模型统计实时业务指标数据并进行汇总抽取,以满足近实时的业务趋势分析需求,达到对指定目标的抽取,保障移动BI解决方法的准时性。三、数据仓库:利用Orcale搭建数据仓库,抽取各业务系统明细数据,记录各业务系统拉链变化数据,以满足复杂业务模型搭建及OLAP多维分析,保障移动BI解决方法的全面性。
如图4所示,所述S2用于将采集到的数据进行数据清洗的步骤包括:
S21用于将同业务类型数据进行数据格式转换,统一数据格式的步骤;
S22用于通过拉依达准则法对异常值进行检测,并对检测到的异常值进行处理的步骤。
本领域技术人员可以理解,拉依达准则是指先假设一组检测数据只含有随机误差,对其进行计算处理得到标准偏差,按一定概率确定一个区间,认为凡超过这个区间的误差,就不属于随机误差而是粗大误差,含有该误差的数据应予以剔除。这种判别处理原理及方法仅局限于对正态或近似正态分布的样本数据处理。由于各系统开发规范不一致及历史原因,会存在大量的不规范数据或多种格式数据,通过数据清洗有利于进行统一规范。数据格式统一是将各个系统同业务类型数据进行数据格式转换,保证数据格式统一,并对无法正常转化的数据进行异常处理。异常值处理是通过拉依达准则法对异常值进行检测,对检测到的异常值处理的方法包括:删除、转换、分组、估算等。异常值包括空值、偏离业务值、字符及数据值有问题的数据;重复、无效的数据。
如图5所示,所述S3用于将清洗后的数据存储并进行公共数据层搭建的步骤包括:
S31用于存放明细数据、维表数据以及公共指标汇总数据,将汇总数据同步至事实表的步骤;
S32用于分析出相关和相似的数据并进行组合同步至明细宽表的步骤;
S33用于公共指标统一加工并建立一致性纬度的步骤。
本领域技术人员可以理解,存放明细数据、维表数据以及公共指标汇总数据,比较多的采用纬度退化的手段,将纬度退化到事实表中,减少关联。组合相关和相似数据,采用明细宽表,减少数据扫描。公共指标统一加工,统一口径,建立逻辑汇总宽表,建立一致性纬度。明细数据、维表数据以及公共指标为用户系统所需的业务数据,每个数据仓库都包含一个或者多个事实数据表。事实数据表可能包含业务销售数据,如现金登记事务所产生的数据,事实数据表通常包含大量的行。事实数据表的主要特点是包含数字数据,并且这些数字信息可以汇总,以提供有关单位作为历史的数据,每个事实数据表包含一个由多个部分组成的索引,该索引包含作为外键的相关性维度表的主键,而维度表包含事实记录的特性。事实数据表不应该包含描述性的信息,也不应该包含除数字度量字段及使事实与维度表中对应项的相关索引字段之外的任何数据。
存放明细数据、维表数据以及公共指标汇总数据,CDM层又细分为DWD层和DWS层,分别是明细宽表层和公共汇总数据层,采取维度模型方法基础,更多采用一些维度退化手法,减少事实表和维度表的关联,容易维度到事实表强化明细事实表的易用性;同时在汇总数据层,加强指标的维度退化,采取更多宽表化的手段构建公共指标数据层,提升公共指标的复用性,减少重复的加工。组合相关和相似数据:采用明细宽表,复用关联计算,减少数据扫描。公共指标统一加工:基于OneData体系构建命名规范、口径一致和算法统一的统计指标;建立逻辑汇总宽表。建立一致性维度:建立一致的数据分析维表,降低数据计算口径不统一的风险。
如图6所示,所述S4用于数据模型搭建的步骤包括:
S41用于发掘业务数据标签、属性及关联的步骤;
S42用于搭建业务数据模型,制定业务指标,创建数据集市大宽表的步骤。
本领域技术人员可以理解,依托于底层公共数据层及原始业务数据清洗,与业务伙伴共同探索发掘业务数据标签、属性及关联,搭建业务数据模型,制定业务指标,创建数据集市大宽表。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。数据集市,也叫数据市场,数据集市就是满足特定的部门或者用户的需求,按照多维的方式进行存储,包括定义维度、需要计算的指标、维度的层次等,生成面向决策分析需求的数据立方体。从范围上来说,数据是从企业范围的数据库、数据仓库,或者是更加专业的数据仓库中抽取出来的。数据中心的重点就在于它迎合了专业用户群体的特殊需求,在分析、内容、表现,以及易用方面。维度建模是专门用于分析型数据库、数据仓库、数据集市建模的方法,维度建模以分析决策的需求出发构建模型,构建的数据模型为分析需求服务,因此它重点解决用户如何更快速完成分析需求,同时还有较好的大规模复杂查询的响应性能。
如图7所示,所述S5用于前端通过数据接口服务获取后端数据并进行展示的步骤包括:
S51用于将登录状态写入单点登录配置中的步骤;
S52用于通过发送登录请求执行单点登录展示的步骤。
本领域技术人员可以理解,本实施例使用开源的Echarts进行移动可视化展示开发,对各种移动设备有良好的兼容性。底层依赖轻量级的Canvas类库ZRender,提供直观,生动,灵活,可高度个性化定制的数据可视化图表。本实施例提供的BI解决方法为用户提供了精美的可视化效果及深入的数据交互功能,强大数据分析功能,方便更加快速的探索挖掘数据变化带来的价值。本实施例提供的BI解决系统通过内嵌于OA系统,实现单点登录展示功能,即在多个应用系统中,只需要登录一次,就可以访问其他相互信任的应用系统,大大的加快了BI查看的便捷性与安全性。
如图8所示,本实施例提供一种移动BI商业智能解决方法,还包括如下步骤:
S6用于元数据管理及运行监控管理的步骤;
S7用于业务指标监控及预警的步骤。
如图9所示,所述S6用于元数据管理及运行监控管理的步骤包括:
S61用于通过服务器监控预警并检测服务器异常的步骤;
S62用于通过阈值的设置定位异常业务指标的步骤。
本领域技术人员可以理解,服务器系统监控是利用Python对服务器数据库进行心跳监控预警,并通过zabbix检测服务器系统异常情况。如有异常发生,通过企业微信快速推送至相关对接人预警信息。实施业务指标监控时,由于用户实时业务变换快速,因此利用Python对重要业务指标进行定制化的实时监控,通过线性回归及拉依达准则法,例如,阈值超过50%则为异常;3倍放大值则为异常,实时快速定位异常业务指标并推送相关业务负责人,对其进行数据下钻分析及后续修正,从而避免带来业务损失。本实施例所采用的移动BI有高可用性及备灾功能,搭建双机进行实时更新备份,并通过心跳监控,如发现服务器数据库异常,通过接口服务快速跳转数据库备机,实现移动app报表的高可用性。元数据模型管理解决架构设计和数据开发的不一致性,是为了约束平台使用者的表名、字段名的规范性,架构师从工具层合理的进行模型分层和统一开发规范,包括两部分,一个是规则配置,另一个是对表名、字段名的定期校验。规则配置:可以配置表名必须由哪几个元素组成,比如表名=数据仓库所属层级+表所属主题+数据更新周期+增量或者全量;定期校验:可以对表名、字段名做定期校验,当表、字段不符合要求的,产生异常提醒,便于开发者更改,提高系统的解决效率。
实施例二
本实施例提供一种移动BI商业智能解决系统,包括:
用于将数据进行ETL采集的模块;
用于将采集到的数据进行数据清洗的模块;
用于将清洗后的数据存储并进行公共数据层搭建的模块;
用于数据模型搭建的模块;
用于前端通过数据接口服务获取后端数据并进行展示的模块。
本领域技术人员可以理解,ETL数据用来描述从来源端经过萃取(extract)、转置(transform)、加载(load)至目的端的过程的数据,实施ETL过程前包括离线数据、前端产品、业务中台、财务数据及数据仓库等数据。本实施例所提供的移动BI商业智能解决方法是指通过使用移动终端设备,使得用户能够随时随地获取所需的业务数据及分析展现,完成独立的分析与决策应用,实现决策分析无处不在的实时动态管理。移动BI融合了计算机技术、通信技术、互联网技术,消除了时间和空间的限制,用户可将移动BI作为辅助决策在有力工具。
本实施例所提供的移动BI商业智能解决方法重在体验,可以随时随地访问企业商务智能应用;实时钻取,主题分析,可以实时访问企业数据,并进行透视、钻取等分析;信息定制推送服务,可以根据员工的不同角色、工作习惯、管理特点等,来定制个性化的推送内容、推送方式、推送时间等;及时提醒,监控与预警服务,可以主动将报警信息发送到用户的移动设备,提醒及时采取措施,避免延误;随需定制,个性移动商务智能分析,可以根据用户不同行业不同领域的用户需求,进行个性化开发,满足不同角色需求。
本实施例所提供的移动BI商业智能解决方法,使有着强大数据处理分析能力的商业智能软件与先进的移动应用技术相结合,为用户打造全天候、轻量化、易操作的移动分析商务智能解决方案。
进一步,所述用于将数据进行ETL采集的模块包括:
用于实时捕捉数据库日志,将各数据同步并输出实时数据统计的子模块;
用于通过定时链接多个异构数据库进行目标数据汇总抽取的子模块;
用于通过搭建数据仓库进行全面数据抽取的子模块。
本领域技术人员可以理解,随着业务场景拓展较广,各用户需求不一,各业务系统使用多种类型数据库。因此对同构和异构数据库间数据采集也提出了一定的要求,主要使用三种方法实现不同场景需求:一、OGG同步:通过Orcale OGG软件,对各类型数据库日志进行实时捕捉,变换和投递,实现源数据库与OGG数据服务器的数据同步,保持最少10ms的数据延迟,以满足实时数据统计展示需求,提高数据同步的实时性,提高移动BI解决系统的时效性。二、ODBC链接:通过ODBC定时链接多个异构数据库,按照业务分析模型统计实时业务指标数据并进行汇总抽取,以满足近实时的业务趋势分析需求,保障移动BI解决系统的准时性。三、数据仓库:利用Orcale搭建数据仓库,抽取各业务系统明细数据,记录各业务系统拉链变化数据,以满足复杂业务模型搭建及OLAP多维分析,保障移动BI解决系统的全面性。
进一步,所述用于将采集到的数据进行数据清洗的模块包括:
用于将同业务类型数据进行数据格式转换,统一数据格式的子模块;
用于通过拉依达准则法对异常值进行检测,并对检测到的异常值进行处理的子模块。
本领域技术人员可以理解,拉依达准则是指先假设一组检测数据只含有随机误差,对其进行计算处理得到标准偏差,按一定概率确定一个区间,认为凡超过这个区间的误差,就不属于随机误差而是粗大误差,含有该误差的数据应予以剔除。这种判别处理原理及方法仅局限于对正态或近似正态分布的样本数据处理。由于各系统开发规范不一致及历史原因,会存在大量的不规范数据或多种格式数据,通过数据清洗有利于进行统一规范。数据格式统一是将各个系统同业务类型数据进行数据格式转换,保证数据格式统一,并对无法正常转化的数据进行异常处理。异常值处理是通过拉依达准则法对异常值进行检测,对检测到的异常值处理的方法包括:删除、转换、分组、估算等。异常值包括空值、偏离业务值、字符及数据值有问题的数据;重复、无效的数据。
进一步,所述用于将清洗后的数据存储并进行公共数据层搭建的模块包括:
用于存放明细数据、维表数据以及公共指标汇总数据,将汇总数据同步至事实表的子模块;
用于分析出相关和相似的数据并进行组合同步至明细宽表的子模块;
用于公共指标统一加工并建立一致性纬度的子模块。
本领域技术人员可以理解,存放明细数据、维表数据以及公共指标汇总数据,比较多的采用纬度退化的手段,将纬度退化到事实表中,减少关联。组合相关和相似数据,采用明细宽表,减少数据扫描。公共指标统一加工,统一口径,建立逻辑汇总宽表,建立一致性纬度。明细数据、维表数据以及公共指标为用户系统所需的业务数据,每个数据仓库都包含一个或者多个事实数据表。事实数据表可能包含业务销售数据,如现金登记事务所产生的数据,事实数据表通常包含大量的行。事实数据表的主要特点是包含数字数据,并且这些数字信息可以汇总,以提供有关单位作为历史的数据,每个事实数据表包含一个由多个部分组成的索引,该索引包含作为外键的相关性维度表的主键,而维度表包含事实记录的特性。事实数据表不应该包含描述性的信息,也不应该包含除数字度量字段及使事实与维度表中对应项的相关索引字段之外的任何数据。
存放明细数据、维表数据以及公共指标汇总数据,CDM层又细分为DWD层和DWS层,分别是明细宽表层和公共汇总数据层,采取维度模型方法基础,更多采用一些维度退化手法,减少事实表和维度表的关联,容易维度到事实表强化明细事实表的易用性;同时在汇总数据层,加强指标的维度退化,采取更多宽表化的手段构建公共指标数据层,提升公共指标的复用性,减少重复的加工。组合相关和相似数据:采用明细宽表,复用关联计算,减少数据扫描。公共指标统一加工:基于OneData体系构建命名规范、口径一致和算法统一的统计指标;建立逻辑汇总宽表。建立一致性维度:建立一致的数据分析维表,降低数据计算口径不统一的风险。
进一步,所述用于数据模型搭建的模块包括:
用于发掘业务数据标签、属性及关联的子模块;
用于搭建业务数据模型,制定业务指标,创建数据集市大宽表的子模块。
本领域技术人员可以理解,依托于底层公共数据层及原始业务数据清洗,与业务伙伴共同探索发掘业务数据标签、属性及关联,搭建业务数据模型,制定业务指标,创建数据集市大宽表。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。数据集市,也叫数据市场,数据集市就是满足特定的部门或者用户的需求,按照多维的方式进行存储,包括定义维度、需要计算的指标、维度的层次等,生成面向决策分析需求的数据立方体。从范围上来说,数据是从企业范围的数据库、数据仓库,或者是更加专业的数据仓库中抽取出来的。数据中心的重点就在于它迎合了专业用户群体的特殊需求,在分析、内容、表现,以及易用方面。维度建模是专门用于分析型数据库、数据仓库、数据集市建模的方法,维度建模以分析决策的需求出发构建模型,构建的数据模型为分析需求服务,因此它重点解决用户如何更快速完成分析需求,同时还有较好的大规模复杂查询的响应性能。
进一步,所述用于前端通过数据接口服务获取后端数据并进行展示的模块包括:
用于将登录状态写入单点登录配置中的子模块;
用于通过发送登录请求执行单点登录展示的子模块。
本领域技术人员可以理解,本实施例使用开源的Echarts进行移动可视化展示开发,对各种移动设备有良好的兼容性。底层依赖轻量级的Canvas类库ZRender,提供直观,生动,灵活,可高度个性化定制的数据可视化图表。本实施例提供的BI解决方法为用户提供了精美的可视化效果及深入的数据交互功能,强大数据分析功能,方便更加快速的探索挖掘数据变化带来的价值。本实施例提供的BI解决系统通过内嵌于OA系统,实现单点登录展示功能,即在多个应用系统中,只需要登录一次,就可以访问其他相互信任的应用系统,大大的加快了BI查看的便捷性与安全性。
进一步,本实施例提供一种移动BI商业智能解决系统,还包括:
用于元数据管理及运行监控管理的模块;
用于业务指标监控及预警的模块。
进一步,所述用于元数据管理及运行监控管理的模块包括:
用于通过服务器监控预警并检测服务器异常的子模块;
用于通过阈值的设置定位异常业务指标的子模块。
本领域技术人员可以理解,服务器系统监控是利用Python对服务器数据库进行心跳监控预警,并通过zabbix检测服务器系统异常情况。如有异常发生,通过企业微信快速推送至相关对接人预警信息。实施业务指标监控时,由于用户实时业务变换快速,因此利用Python对重要业务指标进行定制化的实时监控,通过线性回归及拉依达准则法,例如,阈值超过50%则为异常;3倍放大值则为异常,实时快速定位异常业务指标并推送相关业务负责人,对其进行数据下钻分析及后续修正,从而避免带来业务损失。本实施例所采用的移动BI有高可用性及备灾功能,搭建双机进行实时更新备份,并通过心跳监控,如发现服务器数据库异常,通过接口服务快速跳转数据库备机,实现移动app报表的高可用性。元数据模型管理解决架构设计和数据开发的不一致性,是为了约束平台使用者的表名、字段名的规范性,架构师从工具层合理的进行模型分层和统一开发规范,包括两部分,一个是规则配置,另一个是对表名、字段名的定期校验。规则配置:可以配置表名必须由哪几个元素组成,比如表名=数据仓库所属层级+表所属主题+数据更新周期+增量或者全量;定期校验:可以对表名、字段名做定期校验,当表、字段不符合要求的,产生异常提醒,便于开发者更改,提高系统的解决效率。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (16)

1.一种移动BI商业智能解决方法,其特征在于,包括如下步骤:
S1用于将数据进行ETL采集的步骤;
S2用于将采集到的数据进行数据清洗的步骤;
S3用于将清洗后的数据存储并进行公共数据层搭建的步骤;
S4用于数据模型搭建的步骤;
S5用于前端通过数据接口服务获取后端数据并进行展示的步骤。
2.如权利要求1所述的移动BI商业智能解决方法,其特征在于,所述S1用于将数据进行ETL采集的步骤包括:
S11用于实时捕捉数据库日志,将各数据同步并输出实时数据统计的步骤;
S12用于通过定时链接多个异构数据库进行目标数据汇总抽取的步骤;
S13用于通过搭建数据仓库进行全面数据抽取的步骤。
3.如权利要求2所述的移动BI商业智能解决方法,其特征在于,所述S2用于将采集到的数据进行数据清洗的步骤包括:
S21用于将同业务类型数据进行数据格式转换,统一数据格式的步骤;
S22用于通过拉依达准则法对异常值进行检测,并对检测到的异常值进行处理的步骤。
4.如权利要求3所述的移动BI商业智能解决方法,其特征在于,所述S3用于将清洗后的数据存储并进行公共数据层搭建的步骤包括:
S31用于存放明细数据、维表数据以及公共指标汇总数据,将汇总数据同步至事实表的步骤;
S32用于分析出相关和相似的数据并进行组合同步至明细宽表的步骤;
S33用于公共指标统一加工并建立一致性纬度的步骤。
5.如权利要求4所述的移动BI商业智能解决方法,其特征在于,所述S4用于数据模型搭建的步骤包括:
S41用于发掘业务数据标签、属性及关联的步骤;
S42用于搭建业务数据模型,制定业务指标,创建数据集市大宽表的步骤。
6.如权利要求5所述的移动BI商业智能解决方法,其特征在于,所述S5用于前端通过数据接口服务获取后端数据并进行展示的步骤包括:
S51用于将登录状态写入单点登录配置中的步骤;
S52用于通过发送登录请求执行单点登录展示的步骤。
7.如权利要求1至6种任一项所述的移动BI商业智能解决方法,其特征在于,还包括如下步骤:
S6用于元数据管理及运行监控管理的步骤;
S7用于业务指标监控及预警的步骤。
8.如权利要求7所述的移动BI商业智能解决方法,其特征在于,所述S6用于元数据管理及运行监控管理的步骤包括:
S61用于通过服务器监控预警并检测服务器异常的步骤;
S62用于通过阈值的设置定位异常业务指标的步骤。
9.一种移动BI商业智能解决系统,其特征在于,包括:
用于将数据进行ETL采集的模块;
用于将采集到的数据进行数据清洗的模块;
用于将清洗后的数据存储并进行公共数据层搭建的模块;
用于数据模型搭建的模块;
用于前端通过数据接口服务获取后端数据并进行展示的模块。
10.如权利要求9所述的移动BI商业智能解决系统,其特征在于,所述用于将数据进行ETL采集的模块包括:
用于实时捕捉数据库日志,将各数据同步并输出实时数据统计的子模块;
用于通过定时链接多个异构数据库进行目标数据汇总抽取的子模块;
用于通过搭建数据仓库进行全面数据抽取的子模块。
11.如权利要求10所述的移动BI商业智能解决系统,其特征在于,所述用于将采集到的数据进行数据清洗的模块包括:
用于将同业务类型数据进行数据格式转换,统一数据格式的子模块;
用于通过拉依达准则法对异常值进行检测,并对检测到的异常值进行处理的子模块。
12.如权利要求11所述的移动BI商业智能解决系统,其特征在于,所述用于将清洗后的数据存储并进行公共数据层搭建的模块包括:
用于存放明细数据、维表数据以及公共指标汇总数据,将汇总数据同步至事实表的子模块;
用于分析出相关和相似的数据并进行组合同步至明细宽表的子模块;
用于公共指标统一加工并建立一致性纬度的子模块。
13.如权利要求12所述的移动BI商业智能解决系统,其特征在于,所述用于数据模型搭建的模块包括:
用于发掘业务数据标签、属性及关联的子模块;
用于搭建业务数据模型,制定业务指标,创建数据集市大宽表的子模块。
14.如权利要求13所述的移动BI商业智能解决系统,其特征在于,所述用于前端通过数据接口服务获取后端数据并进行展示的模块包括:
用于将登录状态写入单点登录配置中的子模块;
用于通过发送登录请求执行单点登录展示的子模块。
15.如权利要求9至14任一项所述的移动BI商业智能解决系统,其特征在于,还包括:
用于元数据管理及运行监控管理的模块;
用于业务指标监控及预警的模块。
16.如权利要求15所述的移动BI商业智能解决系统,其特征在于,所述用于元数据管理及运行监控管理的模块包括:
用于通过服务器监控预警并检测服务器异常的子模块;
用于通过阈值的设置定位异常业务指标的子模块。
CN202010183865.1A 2020-03-16 2020-03-16 移动bi商业智能解决方法及系统 Pending CN111459923A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010183865.1A CN111459923A (zh) 2020-03-16 2020-03-16 移动bi商业智能解决方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010183865.1A CN111459923A (zh) 2020-03-16 2020-03-16 移动bi商业智能解决方法及系统

Publications (1)

Publication Number Publication Date
CN111459923A true CN111459923A (zh) 2020-07-28

Family

ID=71685594

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010183865.1A Pending CN111459923A (zh) 2020-03-16 2020-03-16 移动bi商业智能解决方法及系统

Country Status (1)

Country Link
CN (1) CN111459923A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112100264A (zh) * 2020-09-16 2020-12-18 国网辽宁省电力有限公司电力科学研究院 一种电力项目合同监控系统及方法
CN112328706A (zh) * 2020-11-03 2021-02-05 成都中科大旗软件股份有限公司 数仓体系下的维度建模计算方法、计算机设备和存储介质
CN112765232A (zh) * 2021-01-05 2021-05-07 广东核电合营有限公司 核电厂重大设备的数据管理方法及系统
CN113220765A (zh) * 2021-05-13 2021-08-06 广东便捷神科技股份有限公司 一种面向零售终端机成本控制数据仓库的数据组织方法
CN114338469A (zh) * 2021-12-15 2022-04-12 越亮传奇科技股份有限公司 基于分布式的idc机房流量分析方法、装置及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030204487A1 (en) * 2002-04-26 2003-10-30 Sssv Muni Kumar A System of reusable components for implementing data warehousing and business intelligence solutions
US20070021992A1 (en) * 2005-07-19 2007-01-25 Srinivas Konakalla Method and system for generating a business intelligence system based on individual life cycles within a business process
CN109636150A (zh) * 2018-11-30 2019-04-16 南京市城市规划编制研究中心 一种智慧城市“多规合一”评价体系的建立方法及其系统
US20190347590A1 (en) * 2014-03-12 2019-11-14 Bahwan CyberTek Private Limited Intelligent Decision Synchronization in Real Time for both Discrete and Continuous Process Industries

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030204487A1 (en) * 2002-04-26 2003-10-30 Sssv Muni Kumar A System of reusable components for implementing data warehousing and business intelligence solutions
US20070021992A1 (en) * 2005-07-19 2007-01-25 Srinivas Konakalla Method and system for generating a business intelligence system based on individual life cycles within a business process
US20190347590A1 (en) * 2014-03-12 2019-11-14 Bahwan CyberTek Private Limited Intelligent Decision Synchronization in Real Time for both Discrete and Continuous Process Industries
CN109636150A (zh) * 2018-11-30 2019-04-16 南京市城市规划编制研究中心 一种智慧城市“多规合一”评价体系的建立方法及其系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112100264A (zh) * 2020-09-16 2020-12-18 国网辽宁省电力有限公司电力科学研究院 一种电力项目合同监控系统及方法
CN112328706A (zh) * 2020-11-03 2021-02-05 成都中科大旗软件股份有限公司 数仓体系下的维度建模计算方法、计算机设备和存储介质
CN112328706B (zh) * 2020-11-03 2023-10-24 成都中科大旗软件股份有限公司 数仓体系下的维度建模计算方法、计算机设备和存储介质
CN112765232A (zh) * 2021-01-05 2021-05-07 广东核电合营有限公司 核电厂重大设备的数据管理方法及系统
CN112765232B (zh) * 2021-01-05 2024-03-19 广东核电合营有限公司 核电厂重大设备的数据管理方法及系统
CN113220765A (zh) * 2021-05-13 2021-08-06 广东便捷神科技股份有限公司 一种面向零售终端机成本控制数据仓库的数据组织方法
CN114338469A (zh) * 2021-12-15 2022-04-12 越亮传奇科技股份有限公司 基于分布式的idc机房流量分析方法、装置及存储介质

Similar Documents

Publication Publication Date Title
CN111459923A (zh) 移动bi商业智能解决方法及系统
US11194828B2 (en) Method and system for implementing a log parser in a log analytics system
US10282197B2 (en) Open application lifecycle management framework
US7941524B2 (en) System and method for collecting and storing event data from distributed transactional applications
US20170154057A1 (en) Efficient consolidation of high-volume metrics
US7765216B2 (en) Multidimensional analysis tool for high dimensional data
US20030097359A1 (en) Deduplicaiton system
US7647354B2 (en) High-performance change capture for data warehousing
US20180025061A1 (en) Bootstrapping the data lake and glossaries with 'dataset joins' metadata from existing application patterns
US7761455B2 (en) Loading data from a vertical database table into a horizontal database table
US20110153611A1 (en) Extracting data from a report document
US20070005619A1 (en) Method and system for detecting tables to be modified
US9110970B2 (en) Destructuring and restructuring relational data
US20220092062A1 (en) Method and system for implementing a log parser in a log analytics system
US20140337274A1 (en) System and method for analyzing big data in a network environment
CN102376029B (zh) 一种供决策分析用的信息对象模型架构装置及方法
CN114281877A (zh) 一种数据管理系统及方法
US10628421B2 (en) Managing a single database management system
US20090022312A1 (en) Apparatus and method for document synchronization
CN111813870A (zh) 基于统一描述表达的机器学习算法资源共享方法及系统
KR101829198B1 (ko) 보고서의 중요도를 분석하는 메타 데이터 기반 온라인 분석 프로세싱 시스템
CN111125045B (zh) 一种轻量级etl处理平台
US11308115B2 (en) Method and system for persisting data
CN112905565A (zh) 一种数据库管理系统及数据检验方法
US20140089013A1 (en) System and method for synchronizing aggregate financial data with detailed data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200728