CN114942960A - 一种业务数据的可视化应用构建方法 - Google Patents

一种业务数据的可视化应用构建方法 Download PDF

Info

Publication number
CN114942960A
CN114942960A CN202210643600.4A CN202210643600A CN114942960A CN 114942960 A CN114942960 A CN 114942960A CN 202210643600 A CN202210643600 A CN 202210643600A CN 114942960 A CN114942960 A CN 114942960A
Authority
CN
China
Prior art keywords
data
module
business
visualization
carrying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210643600.4A
Other languages
English (en)
Inventor
马军
林峰
金志强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Edle Technology Development Co ltd
Original Assignee
Shenzhen Edle Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Edle Technology Development Co ltd filed Critical Shenzhen Edle Technology Development Co ltd
Priority to CN202210643600.4A priority Critical patent/CN114942960A/zh
Publication of CN114942960A publication Critical patent/CN114942960A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及数据可视化领域,尤其为一种业务数据的可视化应用构建方法,包括收集业务相关数据信息;对收集到的数据信息进行降噪处理,并将数据中不规范的数据规范化;挖掘预处理数据的隐藏数据,再对挖掘处理后的数据进行归类;对处理后的数据进行可视化操作,使数据以特定时间段的形式实现可视化展示。本发明提供的业务数据的可视化应用构建方法,相比传统的用表格或文档展现数据的方式,可视化能将数据以更加直观的方式展现出来,在各类报表和说明性文件中,用直观的图表展现数据,显得简洁、可靠,也使业务中各种冗杂的数据变得简单可视,更加客观、更具说服力。

Description

一种业务数据的可视化应用构建方法
技术领域
本发明涉及数据可视化领域,尤其是一种业务数据的可视化应用构建方法。
背景技术
大数据时代为政府机构、媒体以及企业提供了更多的数据,同时用户数据、社会化媒体平台上的UGC移动终端等也促使数据量得到了大量增长。大数据时代主要强调的是对一些大规模数据进行综合处理,这为大数据带来了一定的机遇,但同时也促使其面临着极大的挑战,在大数据时代下,业务公司频繁使用大量冗杂的业务数据,如何处理这些冗杂的数据,使其变得简单可视,成了最大的问题。因此,大数据时代下的数据可视化成为目前亟需解决的问题。
发明内容
本发明的目的是通过提出一种业务数据的可视化应用构建方法,以解决上述背景技术中提出的缺陷。
本发明采用的技术方案如下:
提供一种业务数据的可视化应用构建方法,包括如下步骤:
步骤一:收集业务相关数据信息;
步骤二:对收集到的数据信息进行降噪处理,并将数据中不规范的数据规范化;
步骤三:挖掘预处理数据的隐藏数据,再对挖掘处理后的数据进行归类;
步骤四:对处理后的数据进行可视化操作,使数据以特定时间段的形式实现可视化展示。
作为本发明的一种优选技术方案,所述业务数据的可视化应用构建方法通过计算机系统进行执行,所述计算机系统包括:
数据收集模块:用于收集业务相关数据;
数据预处理模块:与数据收集模块连接,用于对收集到的数据信息进行降噪处理,并将数据中不规范的数据规范化;
数据二次处理模块:与数据预处理模块连接;用于对预处理后的数据进行隐藏数据挖掘,再对挖掘处理后的数据进行归类;
数据可视化模块:与数据二次处理模块连接,用于对处理好的数据进行可视化处理。
作为本发明的一种优选技术方案:所述数据收集模块包括:
内部数据收集模块:用于收集企业内部业务相关数据;
外部数据收集模块:用于收集企业外部业务相关数据。
作为本发明的一种优选技术方案:所述数据预处理模块包括:
数据降噪模块:与数据收集模块连接,用于对收到的数据进行降噪处理;
数据规范化模块:用于对降噪后的数据进行规范化处理。
作为本发明的一种优选技术方案:所述数据二次模块包括:
数据挖掘模块:与数据预处理模块连接,用于对预处理后的数据进行深度挖掘;
数据归类模块:用于对挖掘后的数据进行归类。
作为本发明的一种优选技术方案:所述数据可视化模块包括:
可视化空间模块:用于选择数据可视化的显示空间;
标记模块:用于通过不同的标记物代表不同类型的数据属性,并以此进行归类;
视觉通道模块:用于展示数据属性的定量信息;
人机交互模块:用于反映数据的数值、特征和模式,以更加直观、易于理解的方式,将数据背后的信息呈现给目标用户,辅助其做出正确的决策。
作为本发明的一种优选技术方案:所述数据降噪模块中,当数据值中有超出大体期望值的数值点出现时,采用均值标准化方法进行处理。
作为本发明的一种优选技术方案:所述均值标准化方法公式如下:
Figure BDA0003685059240000021
式中,xi为某一节点下超出期望值的业务数据值,
Figure BDA0003685059240000022
为数据集的均值,β为数据中的整体标准差。
作为本发明的一种优选技术方案:数据归类模块采用差异模糊化方式对数据进行归类,其中,差异模糊化方式中两个数据的差异度为|ci,cj|,|ci,cj|=1-Sim(ci,cj)=1-(cid+cjd),其中,d为数据的属性个数。
作为本发明的一种优选技术方案:差异度的质心D={x1,x2,…,xn},
Figure BDA0003685059240000023
其中,m为该种属性的取值个数,xik为第i行记录的第k个属性取值。
作为本发明的一种优选技术方案:所述可视化空间模块的显示空间包括一维、二维、三维。
作为本发明的一种优选技术方案:所述标记模块的不同标记物包括点、线、面、体。
本发明提供的业务数据的可视化应用构建方法,相比传统的用表格或文档展现数据的方式,可视化能将数据以更加直观的方式展现出来,用在各类报表和说明性文件中,直观的图表展现数据,显得简洁、可靠,也使业务中各种冗杂的数据变得简单可视,更加客观、更具说服力。
附图说明
图1为本发明优选实施例的方法流程图;
图2为本发明优选实施例的系统构成框图。
图中各个标记的意义为:
110:数据收集模块、111:内部数据收集模块、112:外部数据收集模块;
120:数据预处理模块、121:数据降噪模块、122:数据规范化模块;
130:数据二次处理模块、131:数据挖掘模块、132:数据归类模块;
140:数据可视化模块、141:可视化空间模块、142:标记模块、143:视觉通道模块、144:人机交互模块。
具体实施方式
需要说明的是,在不冲突的情况下,本实施例中的实施例及实施例中的特征可以相互组合,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1-2,本发明优选实施例提供了一种业务数据的可视化应用构建方法,所述业务数据的可视化应用构建方法通过计算机系统进行执行,所述计算机系统包括:数据收集模块 110、数据预处理模块120、数据二次处理模块130和数据可视化模块140。
本实施例中,所述数据收集模块110用于收集企业内、外部相关业务数据,所述数据预处理模块120与数据收集模块110连接,用于对收集到的业务数据进行降噪处理和规范化处理,获得相对规范化的数据;所述数据二次处理模块130与数据预处理模块120连接,用于对数据进行二次处理,对数据进行深度挖掘以及归类;所述数据可视化模块140与数据二次处理模块130连接,用于对数据进行可视化处理,通过绘制图表等方式处理数据使其变得简单、可视化。
本实施例中:所述数据收集模块110包括内部数据收集模块111和外部数据收集模块112,所述内部数据收集模块111用于收集企业内部业务相关数据,所述外部数据收集模块112用于收集企业外部相关业务数据;其中,企业收集的企业内部相关数据,通常来自于企业内部的数据库,例如电脑订单交易时间、交易数量、交易额等;企业外部数据一般来自于竞品或官方,例如竞品数据和官方行业数据等。
本实施例中,所述数据预处理模块120包括数据降噪模块121和数据规范化模块122,所述数据降噪模块121与数据收集模块110连接,用于对收到的数据进行降噪处理;所述数据规范化模块122用于对降噪后的数据进行规范化处理。其中,初步获得的业务相关数据,可能会存在一些数据质量问题,需要我们进行降噪处理,例如我们需要对一组数据进行可视化处理,由于数据收集过程中,存在多种外部因素,数据可能会在小范围内具有一定的数值误差,就需要我们对这组数据进行降噪处理,这时可采用均值标准化法来对数据集进行降噪工作,可令xi为某一节点下超出期望值的业务数据值,
Figure BDA0003685059240000042
为数据集的均值,β为数据中的整体标准差,根据公式
Figure BDA0003685059240000041
则可以得出较为合理的数据值;数据可能还会出现不合理的问题,例如数据重复率过高或者数据不对应的问题,也需要对这些不规范问题进行规范化处理。
本实施例中,所述数据二次处理模块130包括数据挖掘模块131和数据归类模块132。所述数据挖掘模块131与数据预处理模块120连接,用于对预处理后的数据进行深度挖掘;所述数据归类模块132用于对挖掘后的数据进行归类。其中,收集到的数据中可能还会有隐藏数据,此时就需要对预处理后的数据进行挖掘,例如电脑交易量处于中等水平,但交易总额低于平均水平等问题;再对处理完的数据进行归类操作。
其中,数据归类模块132采用差异模糊化方式对数据进行归类,其中,差异模糊化方式中两个数据的差异度为|ci,cj|,|ci,cj|=1-Sim(ci,cj)=1-(cid+cjd),其中,d为数据的属性个数。
差异度的质心D={x1,x2,…,xn},
Figure BDA0003685059240000043
其中,m为该种属性的取值个数,xik为第i行记录的第k个属性取值。
其通过虚拟数字实体化观点为基础,利用实体间的相互约束力和斥力实现集合特征的获取及数据的归类。归类算法归类能力强,具有较强的未知数据识别能力,自适应能力强。
本实施例中,所述数据可视化模块140包括可视化空间模块141、标记模块142、视觉通道模块143和人机交互模块144。所述可视化空间模块141用于选择数据可视化的显示空间;所述标记模块142用于通过不同的标记物代表不同类型的数据属性,并以此进行归类;所述视觉通道模块143用于展示数据属性的定量信息;所述人机交互模块144用于反映数据的数值、特征和模式,以更加直观、易于理解的方式,将数据背后的信息呈现给目标用户,辅助其做出正确的决策。其中,根据二次处理后的数据,进行可视化操作,首先选择数据的可视化空间,再选择合适的标记来代表数据属性,通过合适的视觉通道,实现人机交互。例如将五年内电脑的月交易额数据可视化,可以选择二维平面,并以点作为标记,利用折线统计图反映交易额的变化,与官方数据做作对比,再呈现给目标用户。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (10)

1.一种业务数据的可视化应用构建方法,其特征在于:包括如下步骤:
步骤一:收集业务相关数据信息;
步骤二:对收集到的数据信息进行降噪处理,并将数据中不规范的数据规范化;
步骤三:挖掘预处理数据的隐藏数据,再对挖掘处理后的数据进行归类;
步骤四:对处理后的数据进行可视化操作,使数据以特定时间段的形式实现可视化展示。
2.根据权利要求1所述的业务数据的可视化应用构建方法,其特征在于:所述业务数据的可视化应用构建方法通过计算机系统进行执行,所述计算机系统包括:
数据收集模块(110):用于收集业务相关数据;
数据预处理模块(120):与数据收集模块(110)连接,对收集到的数据信息进行降噪处理,并将数据中不规范的数据规范化;
数据二次处理模块(130):与数据预处理模块(120)连接;对预处理后的数据进行隐藏数据挖掘,再对挖掘处理后的数据进行归类;
数据可视化模块(140):与数据二次处理模块(130)连接,对处理好的数据进行可视化处理。
3.根据权利要求2所述的业务数据的可视化应用构建系统,所述数据收集模块(110)包括:
内部数据收集模块(111):用于收集企业内部业务相关数据;
外部数据收集模块(112):用于收集企业外部业务相关数据。
4.根据权利要求2所述的业务数据的可视化应用构建系统,其特征在于:所述数据预处理模块(120)包括:
数据降噪模块(121):与数据收集模块(110)连接,用于对收到的数据进行降噪处理;
数据规范化模块(122):用于对降噪后的数据进行规范化处理。
5.根据权利要求2所述的业务数据的可视化应用构建系统,其特征在于:所述数据二次处理模块(130)包括:
数据挖掘模块(131):与数据预处理模块(120)连接,用于对预处理后的数据进行深度挖掘;
数据归类模块(132):用于对挖掘后的数据进行归类操作。
6.根据权利要求2所述的业务数据的可视化应用构建系统,其特征在于:所述数据可视化模块(140)包括:
可视化空间模块(141):用于选择数据可视化的显示空间;
标记模块(142):用于通过不同的标记物代表不同类型的数据属性,并以此进行归类;
视觉通道模块(143):用于展示数据属性的定量信息;
人机交互模块(144):用于反映数据的数值、特征和模式,以更加直观、易于理解的方式,将数据背后的信息呈现给目标用户,辅助其做出正确的决策。
7.根据权利要求4所述的业务数据的可视化应用构建系统,其特征在于:所述对收集到的数据信息进行降噪处理的过程中,当数据值中有超出大体期望值的数值点出现时,采用均值标准化方法进行处理。
8.根据权利要求7所述的业务数据的可视化应用构建系统,其特征在于:所述均值标准化方法公式如下:
Figure FDA0003685059230000021
式中,xi为某一节点下超出期望值的业务数据值,
Figure FDA0003685059230000022
为数据集的均值,
Figure FDA0003685059230000023
为数据中的整体标准差。
9.根据权利要求6所述的业务数据的可视化应用构建系统,其特征在于:所述数据归类模块(132)采用差异模糊化方式对数据进行归类,其中,差异模糊化方式中两个数据的差异度为|ci,cj|,|ci,cj|=1-Sim(ci,cj)=1-(cid+cjd),其中,d为数据的属性个数。
10.根据权利要求9所述的业务数据的可视化应用构建系统,其特征在于:所述差异度的质心D={x1,x2,…,xn},
Figure FDA0003685059230000024
其中,m为该种属性的取值个数,xik为第i行记录的第k个属性取值。
CN202210643600.4A 2022-06-09 2022-06-09 一种业务数据的可视化应用构建方法 Pending CN114942960A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210643600.4A CN114942960A (zh) 2022-06-09 2022-06-09 一种业务数据的可视化应用构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210643600.4A CN114942960A (zh) 2022-06-09 2022-06-09 一种业务数据的可视化应用构建方法

Publications (1)

Publication Number Publication Date
CN114942960A true CN114942960A (zh) 2022-08-26

Family

ID=82909597

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210643600.4A Pending CN114942960A (zh) 2022-06-09 2022-06-09 一种业务数据的可视化应用构建方法

Country Status (1)

Country Link
CN (1) CN114942960A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050102292A1 (en) * 2000-09-28 2005-05-12 Pablo Tamayo Enterprise web mining system and method
CN1975720A (zh) * 2006-12-27 2007-06-06 章毅 一种基于Web的数据挖掘系统及其控制方法
US20140095396A1 (en) * 2012-09-28 2014-04-03 Oracle International Corporation Adaptive knowledge navigator
KR20140131327A (ko) * 2012-01-23 2014-11-12 무 시그마 비지니스 솔루션스 피브이티 엘티디 소셜 미디어 데이터 분석 시스템 및 방법
WO2016034139A1 (zh) * 2014-09-04 2016-03-10 国家电网公司 基于gis的综合应急物资可视化系统及方法
CN107704881A (zh) * 2017-10-12 2018-02-16 公安部南昌警犬基地 一种基于动物脑电识别的数据可视化处理方法及装置
CN109857784A (zh) * 2019-02-12 2019-06-07 吉林师范大学 一种大数据统计分析系统
CN114442997A (zh) * 2020-11-04 2022-05-06 上海久湛信息科技有限公司 一种低代码大数据应用发布方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050102292A1 (en) * 2000-09-28 2005-05-12 Pablo Tamayo Enterprise web mining system and method
CN1975720A (zh) * 2006-12-27 2007-06-06 章毅 一种基于Web的数据挖掘系统及其控制方法
KR20140131327A (ko) * 2012-01-23 2014-11-12 무 시그마 비지니스 솔루션스 피브이티 엘티디 소셜 미디어 데이터 분석 시스템 및 방법
US20140095396A1 (en) * 2012-09-28 2014-04-03 Oracle International Corporation Adaptive knowledge navigator
WO2016034139A1 (zh) * 2014-09-04 2016-03-10 国家电网公司 基于gis的综合应急物资可视化系统及方法
CN107704881A (zh) * 2017-10-12 2018-02-16 公安部南昌警犬基地 一种基于动物脑电识别的数据可视化处理方法及装置
CN109857784A (zh) * 2019-02-12 2019-06-07 吉林师范大学 一种大数据统计分析系统
CN114442997A (zh) * 2020-11-04 2022-05-06 上海久湛信息科技有限公司 一种低代码大数据应用发布方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CDA数据分析师: "数据可视化的基本流程", 《HTTPS://ZHUANLAN.ZHIHU.COM/P/81430479》, 9 September 2019 (2019-09-09), pages 1 - 5 *
令狐大智;李陶深;武新丽: "基于相互约束的模糊数据归类算法研究", 《计算机研究与发展》, 24 October 2008 (2008-10-24), pages 247 - 251 *
杨健章;关婷婷;曲婷婷;王璐;: "数据挖掘可视化系统设计与实现", 科技创新与应用, no. 16, 8 June 2015 (2015-06-08) *
陈光;: "基于大数据的数据服务应用研究", 计算机技术与发展, no. 08, 7 March 2018 (2018-03-07) *

Similar Documents

Publication Publication Date Title
CN110781246A (zh) 一种企业关联关系构建方法及系统
CN102508860A (zh) 一种基于xbrl实例文档的数据挖掘方法
CN108241867B (zh) 一种分类方法及装置
CN106991175A (zh) 一种客户信息挖掘方法、装置、设备以及存储介质
CN105426441B (zh) 一种时间序列自动预处理方法
CN110188092B (zh) 一种挖掘人民调解中新型矛盾纠纷的系统及方法
CN116756229B (zh) 一种数据挖掘与可视化的方法
CN111754317A (zh) 一种金融投资数据测评方法及系统
CN112613285A (zh) 一种基于分区域处理的招标文件审查分析方法
CN102663065A (zh) 一种广告位异常数据识别和筛选方法
CN115130847A (zh) 一种设备画像建模方法及系统
CN112989827B (zh) 一种基于多源异构特征的文本数据集质量评估方法
CN112669133A (zh) 一种根据应用场景自动匹配的智能费控报销方法
CN114942960A (zh) 一种业务数据的可视化应用构建方法
CN112632958A (zh) 一种基于合同知识库的合同文件审查分析方法
CN116757881A (zh) 一种基于二维云模型的隧道施工动态风险预警方法及系统
CN116542800A (zh) 基于云端ai技术的智能化财务报表分析系统
Li et al. Traffic peak period detection using traffic index cloud maps
CN115908062A (zh) 一种知识产权全周期管理系统
CN114266472A (zh) 基于Spark的地铁站疏散风险分析方法
CN114312930A (zh) 基于日志数据的列车运行异常诊断方法和装置
CN112487262A (zh) 一种数据处理的方法和装置
CN111899106A (zh) 一种期货大数据可视分析系统
Karnik et al. Data Driven Solution for Enhancing Workover Intervention Activities
CN112818031B (zh) 基于nlp中文分词技术的潜在高耗能企业挖掘方法、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination