CN114996314A - 一种数字探查方法及系统、电子设备、存储介质 - Google Patents

一种数字探查方法及系统、电子设备、存储介质 Download PDF

Info

Publication number
CN114996314A
CN114996314A CN202210679258.3A CN202210679258A CN114996314A CN 114996314 A CN114996314 A CN 114996314A CN 202210679258 A CN202210679258 A CN 202210679258A CN 114996314 A CN114996314 A CN 114996314A
Authority
CN
China
Prior art keywords
data
probing
range
exploration
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210679258.3A
Other languages
English (en)
Inventor
郭淳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Financial Technology Co Ltd
Original Assignee
Bank of China Financial Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Financial Technology Co Ltd filed Critical Bank of China Financial Technology Co Ltd
Priority to CN202210679258.3A priority Critical patent/CN114996314A/zh
Publication of CN114996314A publication Critical patent/CN114996314A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种数字探查方法及系统、电子设备、存储介质,所述系统包括:基础信息管理模块、预置规则集计算模块、数据自由探查模块以及可视化数据探查模块;基础信息管理模块用于维护数据主题模型、探查表范围以及预置规则集;预置规则集计算模块用于基于预置规则集,对当期更新的数据进行计算,得到预置分析数据;数据自由探查模块用于预置分析数据的展示、配置探查规则,以及检索待探查数据范围,并基于探查规则以及探查表范围,对探查数据范围内的数据进行探查,得到并反馈探查结果;可视化探查模块用于响应用户对可视化的预置分析数据或探查结果中的数据的探查查找,对用户选择的探查范围进行探查。

Description

一种数字探查方法及系统、电子设备、存储介质
技术领域
本申请涉及数据管理技术领域,特别涉及一种数字探查方法及系统、电子设备、存储介质。
背景技术
数据资产已经成为企业重要的财富,对数据资产的运用也逐步成为趋势。但是随着数据资产的积累以及参与数据分析人群的扩大,数据的开放却依然没有形成有效的数据分析闭环。
当前具备资产数据探查的工具,如BI工具,主要是侧重对资产数据字典的展示、数据筛选以及数据集分析,偏向于给业务类数据分析人员使用。而另一种则是利用数据资产管理工具进行数据探查,其主要侧重数据标准管理以及元数据管理,偏向数据资产管理部分人员使用。
所以可见现有的工具对于资产数据的管理都相对有限,并且不能很好地同时适用不同的用户。
发明内容
基于上述现有技术的不足,本申请提供了一种数字探查方法及系统、电子设备、存储介质,以解决现有技术无法很好适用不同用户的问题。
为了实现上述目的,本申请提供了以下技术方案:
本申请第二方面提供了一种数字探查系统,包括:
基础信息管理模块、预置规则集计算模块、数据自由探查模块以及可视化数据探查模块;
所述基础信息管理模块用于维护数据主题模型、探查表范围以及预置规则集;其中,所述数据主题模型用于对数据表进行分层以及分领域存储;
所述预置规则集计算模块用于基于所述预置规则集,对当期更新的数据进行计算,得到预置分析数据;
所述数据自由探查模块用于所述预置分析数据的展示、配置探查规则,以及检索待探查数据范围,并基于所述探查规则以及所述探查表范围,对所述探查数据范围内的数据进行探查,得到并反馈探查结果;其中,所述探查规则包括联机探查规则以及异步探查规则;
所述可视化探查模块用于响应用户对可视化的所述预置分析数据或所述探查结果中的数据的探查查找,对所述用户选择的探查范围进行探查。
可选地,在上述的数字探查系统中,还包括:
探查规则固化模块,用于将用户配置的所述联机探查规则以及所述异步探查规则进行固化。
可选地,在上述的数字探查系统中,还包括:
权限控制模块,用于基于用户信息对所述用户访问的数据进行权限控制。
可选地,在上述的数字探查系统中,所述数据自由探查模块基于所述探查规则以及所述探查表范围,对所述探查数据范围内的数据进行探查,得到并反馈探查结果时,用于:
通过联机探查计算引擎基于所述联机探查规则以及所述探查表范围,对所述探查数据范围内的数据进行实时同步探查,得到并反馈实时探查结果,和/或,通过异步探查计算引擎基于所述联机探查规则以及所述探查表范围,对所述探查数据范围内的数据进行异步探查,得到并反馈异步探查结果。
可选地,在上述的数字探查系统中,所述预置规则集计算模块基于所述预置规则集,对当期更新的数据进行计算,得到预置分析数据时,用于:
分别针对所述当期更新数据中的各个数据表,基于所述预置规则集中的各个子规则,对所述数据包进行计算,得到所述数据表对应的所述预置分析数据;其中,所述预置分析数据包括数据表属性信息、数据表统计信息、数据字典类信息、数据血缘分析信息。
可选地,在上述的数字探查系统中,所述可视化探查模块,还用于:
将探查到的数据按照所属的维度,以卡片的方式进行可视化;
响应所述用户对所述卡片中的任意可视化数据的计算操作,对所述可视化数据进行计算,得到计算结果,并利用所述计算结果对所述卡片中的所述可视化数据进行更新。
本申请第二方面提供了一种数字探查方法,包括:
获取当期更新的数据;
将所述当期更新的数据按照维护的数据主题模型进行分层以及分领域存储;
基于所述预置规则集,对所述当期更新的数据进行计算,得到预置分析数据;
将所述预置分析数据进行展示;
当接收到用户的发起检索请求时,响应所述检索请求,检索出待探查数据范围;
基于所述用户配置的探查规则以及所述探查表范围,对所述探查数据范围内的数据进行探查,得到并反馈探查结果;其中,所述探查规则包括联机探查规则以及异步探查规则;
当监测到所述用户对可视化的所述预置分析数据或所述探查结果中的数据的探查操作时,响应所述探查操作,对所述用户选择的探查范围进行探查。
可选地,在上述的数字探查方法中,还包括:
将所述用户配置的所述联机探查规则以及所述异步探查规则进行固化。
可选地,在上述的数字探查方法中,还包括:
基于所述用户信息对所述用户访问的数据进行权限控制。
可选地,在上述的数字探查方法中,所述基于所述探查规则以及所述探查表范围,对所述探查数据范围内的数据进行探查,得到并反馈探查结果,包括:
通过联机探查计算引擎基于所述联机探查规则以及所述探查表范围,对所述探查数据范围内的数据进行实时同步探查,得到并反馈实时探查结果,和/或,通过异步探查计算引擎基于所述联机探查规则以及所述探查表范围,对所述探查数据范围内的数据进行异步探查,得到并反馈异步探查结果。
可选地,在上述的数字探查方法中,所述基于所述预置规则集,对所述当期更新的数据进行计算,得到预置分析数据,包括:
分别针对所述当期更新数据中的各个数据表,基于所述预置规则集中的各个子规则,对所述数据包进行计算,得到所述数据表对应的所述预置分析数据;其中,所述预置分析数据包括数据表属性信息、数据表统计信息、数据字典类信息、数据血缘分析信息。
可选地,在上述的数字探查方法中,还包括:
将探查到的数据按照所属的维度,以卡片的方式进行可视化;
响应所述用户对所述卡片中的任意可视化数据的计算操作,对所述可视化数据进行计算,得到计算结果,并利用所述计算结果对所述卡片中的所述可视化数据进行更新。
本申请第三方面提供了一种电子设备,包括:
存储器和处理器;
其中,所述存储器用于存储程序;
所述处理器用于执行所述程序,所述程序被执行时,具体用于实现如上述任意一项所述的数字探查方法。
本申请第四方面提供了一种计算机存储介质,用于存储计算机程序,所述计算机程序被执行时,用于实现如上述任意一项所述的数字探查方法。
本申请提供的一种数字探查系统,包括基础信息管理模块、预置规则集计算模块、数据自由探查模块以及可视化数据探查模块。基础信息管理模块用于维护数据主题模型、探查表范围以及预置规则集;其中,数据主题模型用于对数据表进行分层以及分领域存储;预置规则集计算模块用于基于预置规则集,对当期更新的数据进行计算,得到预置分析数据;数据自由探查模块用于预置分析数据的展示、配置探查规则,以及检索待探查数据范围,并基于探查规则以及探查表范围,对探查数据范围内的数据进行探查,得到并反馈探查结果;其中,探查规则包括联机探查规则以及异步探查规则;可视化探查模块用于响应用户对可视化的预置分析数据或探查结果中的数据的探查查找,对用户选择的探查范围进行探查。从而通过该系统,用户均可以根据需求配置相应的规则探查到所需要的数据,不再受限与某一类用户,从而可以适用于所有的用户。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种数字探查系统的架构示意图;
图2为本申请实施例提供的一种数字探查方法的流程图;
图3为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本申请实施例提供了一种数字探查系统,如图1所示,具体包括以下单元:
基础信息管理模块、预置规则集计算模块、数据自由探查模块以及可视化数据探查模块。
具体的,基础信息管理模块用于维护数据主题模型、探查表范围以及预置规则集。
其中,数据主题模型用于对数据表进行分层以及分领域存储,即在本申请实施例中,数据表按照主题进行分层、分领域管理,从而还可以提供按主题维护的统计分析。
探查表范围中则维护了各个数据表配置的是否需求进行探查的状态,即在本申请实施例中,配置了数据表是否需要探查的开关,便于探查时,可以进行数据表的过滤,只对需要的数据表进行计算。
维护的预置规则集,则用于对数据进行预置分析。并且,其中的规则支持用户进行调整和新增。具体可以包括数据表属性信息、数据表统计信息、数据字典类信息、数据血缘分析信息的分析规则。
预置规则集计算模块用于基于预置规则集,对当期更新的数据进行计算,得到预置分析数据。
需要说明的是,由于在分析过程中,对于部分类型的数据的使用频率时较高的,所以在本申请实施例中,配置了预置规则集,以在数据更新时,对当前更新的数据进行初步的计算,从而便于用户直接进行获取,或者便于后续直接利益预置分析数据进行进一步处理,有效提供了后续处理的效率。
还需要说明的是,在本申请实施例中,主要处理的为业务数据表中的业务数据,而在处理业务数据过程中,需要结合系统数据表中的系统数据。
可选地,对于不同的数据表,由于存储的数据类型不同,所以预处理的方式也不同,因此在本申请另一实施例中,预置规则集计算模块用于基于预置规则集,对当期更新的数据进行计算,得到预置分析数据时,用于:
分别针对当期更新数据中的各个数据表,基于预置规则集中的各个子规则,对数据包进行计算,得到数据表对应的预置分析数据。
其中,预置分析数据包括数据表属性信息、数据表统计信息、数据字典类信息、数据血缘分析信息。
可选地,数据表属性信息可以包括数据表中文名、英文名、归属数据模型或业务领域、数据来源系统、数据主题、数据表分类,如增量时点、增量时段、全量时段,或称为增量流水表、增转全表、全量表等。所以可以基于系统表空间信息及日常加工的信息统计得到。
数据表统计信息可以包括数据表占用空间大小、数据表分区以及分片占用空间大小、数据最新日期、数据平均更新时间、数据表加工逻辑、数据表规模统计信息。并且,统计的信息根据数据表分类的不同具有不同的统计口径和规则,具体可以包括总记录条数、每日增量变化数据量、每日全量数据、数据变化率、数据波动情况、周期数据变化情况等。
数据字典类信息可以包括字段类型、字段英文名称、字段中文名称、样例数据预览等。
数据血缘分析信息则为把数据从源系统到最终接口指标的整个路径给刻画出来的数据。并且,可以基于加工过程中的前驱、后驱依赖关系自动读取层次结构关系,形成数据流向。
数据自由探查模块用于预置分析数据的展示、配置探查规则,以及检索待探查数据范围,并基于探查规则以及所述探查表范围,对探查数据范围内的数据进行探查,得到并反馈探查结果。
其中,探查规则包括联机探查规则以及异步探查规则。
对于预置分析数据的展示,具体可以利用预置分析数据生成可视化预置分析模型进行展示。并且可选地,在面向不同使用人员时,可以采用简化模式或完全模式进行展示。在简化模式下,针对不同数据库的各个数据字段类型,可以按照可配置化的规则的进行映射转化,将字段简化为字符型、数值型、日期型等特定的类型进行展示,屏蔽晦涩的技术细节。而在完全模式下,则可以显示详细的字段在数据库的实际存储类型及精度。
需要说明的是,对于需要探查的数据,用户可能并不能准确知道是哪个或哪些数据表,所以在本申请实施例中,可以通过录入查询条件的方式,查询出符合查询条件的数据表,然后用户从中选择需要的数据表对其进行探查。可选地,在本申请实施例中,支持按照模型、业务领域进行查询。并且,查询方式可以包括表中的中英文查询、表字段查询、数据源表查询、数据源系统查询等。
而在确定探查数据范围后,就可以对其中的数据进行探查。具体按照探查规则对探查数据范围中属于探查表范围内的数据进行计算,从而得到探查结果。
由于对于部分数据,需求实时获取到,而对于部分数据量较大的数据,则可以选择异步获取,所以在本申请实施例中,具体划分为联机探查和异步探查。相应地,探查规则包括联机探查规则和异步探查规则。因此相应地,在本申请另一实施例中,数据自由探查模块基于探查规则以及探查表范围,对所述探查数据范围内的数据进行探查,得到并反馈探查结果时,具体用于:
通过联机探查计算引擎基于联机探查规则以及探查表范围,对探查数据范围内的数据进行实时同步探查,得到并反馈实时探查结果,和/或,通过异步探查计算引擎基于联机探查规则以及探查表范围,对探查数据范围内的数据进行异步探查,得到并反馈异步探查结果。
其中,联机探查主要适用于对数据表缺乏了解,所以需要通过快速多次的数据探查,对数据分出形成一定的初步认识,如码值类型的分布情况、数值区间范围等。而对于联机规则的配置,用户可以根据探查的数据的类型,配置不同的筛选规则,并且可以将多中筛选条件进行联合,组成联机探查规则,如针对字符类型支持等于、不等于、包含、不包含、正则、空值判断等多条件的联合过滤,针对数值类型、日期类型支持等于、不等于、包含、不包含、区间范围、正则、空值判断等多条件的联合探查规则。
异步探查则主要适用于长期、大数据量的全量分析,所以其支持自定义复杂的探查规则配置,支持固化成定时类任务连续分析统计,支持差异对比。可选地,对于异步探查规则,支持区间类型可设置精确区间段或自动划分区间段数;支持设置日期参照字段、支持探查天数的设置,支持极值、中位数、平均数等各数据统计方法的数据分布计算配置。
需要说明的是,针对联机的数据探查由JAVA计算引擎主导进行抽取计算。针对异步的数据分析由GBASE数据库计算引擎主导进行全量探查分析。并且,联机计算引擎采用多线程并发执行,保证数据返回的高时效。具体的,按照用户配置的联机探查规则,将简化字段类型转化为实际数据库字段类型,针对数据库的每一种数据类型进行对应处理。具体将参与计算与、或、非、包含、等值、区间、正则、分组、函数等各类场景进行解析,以及将相关筛选过滤、选择、判断转化形成数据库语言,并将每个字段的分布情况进行分别计算,获取基于每个唯一键值的数据占比规模,组合拼接成多段SQL语句,然后将相关SQL提交至数据库进行执行,从而获得到是详细的分析报告及卡片式的交互字段分布结果。
对于异步探查引擎,其计算逻辑与联机探查计算引擎相一致,不过其采用的是多线程任务队列机制结合定时任务轮训的处理方式,从实现对数据进行异步处理,并将得到的结果进行存储。
可选地,用户在配置联机探查规则以及异步探查规则进行探查后,若是希望后续还是需要利用当前配置的这两个规则继续进行探查,则可以选择将这两个规则进行固化,因此在本申请另一实施例中,数字探查系统,还可以进一步包括:
探查规则固化模块,用于将用户配置的联机探查规则以及异步探查规则进行固化。
对于可视化探查模块,其用于响应用户对可视化的预置分析数据或探查结果中的数据的探查查找,对用户选择的探查范围进行探查。
需要说明的是,对于预置分析数据和数据自由探查模块得到的探查结果都会进行可视化。而在可视化这些数据后,若是用户想更加具体的了解某一项数据,则可以选择相应的数据,并发起探查。此时可视化探查模块响应用户对可视化的预置分析数据或探查结果中的数据的探查查找,对用户选择的探查范围进行探查,并反馈得到的结果。
可选地,可视化探查模块,还可以进一步用于:将探查到的数据按照所属的维度,以卡片的方式进行可视化,响应用户对卡片中的任意可视化数据的计算操作,对可视化数据进行计算,得到计算结果,并利用计算结果对卡片中的可视化数据进行更新。
在本申请实施例除了相关计算引擎外,逐字段分析外,可视化探查模块会将自由探查的数据以及再次探查的数据以卡片的呈现,并且不同维度的数据以不同的卡片进行可视化,即不仅以字段的方式进行可视化,并且同时以卡片的方式按多个维度进行可视化。例如,按照机构号、ID、文档类型等维度,以不同的卡片进行可视化。
并且,用户可以对卡片上的内容进行操作,此时将实时可视化响应交互计算,并再次刷新可视化展示。可选地,当用户可以选择卡片上的内容,或者选择某一个卡片时,弹出计算条件输入框。用户可以根据需求在计算条件输入框中输入计算条件,例如数据范围等,在用户点击确认后,按照用户输入的计算条件进行计算,得到计算结果。然后利用得到的计算结果对可视化的数据进行更新。
可选地,为了能对资产数据进行权限管理,所以在本申请另一实施例中,数字探查系统,还可以进一步包括:
权限控制模块,用于基于用户信息对所述用户访问的数据进行权限控制。
具体的,在用户进行数据检索、探查时,基于用户信息判断用户是否具有相应的数据权限,仅向用户反馈其具有权限的数据。
本申请实施例提供的一种数字探查系统,包括基础信息管理模块、预置规则集计算模块、数据自由探查模块以及可视化数据探查模块。基础信息管理模块用于维护数据主题模型、探查表范围以及预置规则集;其中,数据主题模型用于对数据表进行分层以及分领域存储;预置规则集计算模块用于基于预置规则集,对当期更新的数据进行计算,得到预置分析数据;数据自由探查模块用于预置分析数据的展示、配置探查规则,以及检索待探查数据范围,并基于探查规则以及探查表范围,对探查数据范围内的数据进行探查,得到并反馈探查结果;其中,探查规则包括联机探查规则以及异步探查规则;可视化探查模块用于响应用户对可视化的预置分析数据或探查结果中的数据的探查查找,对用户选择的探查范围进行探查。从而通过该系统,用户均可以根据需求配置相应的规则探查到所需要的数据,不再受限与某一类用户,从而可以适用于所有的用户。
本申请另一实施例提供了一种数字探查方法,如图2所示,包括以下:
S201、获取当期更新的数据。
S202、将当期更新的数据按照维护的数据主题模型进行分层以及分领域存储。
S203、基于预置规则集,对当期更新的数据进行计算,得到预置分析数据。
可选地,由于通常不同的数据表用于存储不同类型的数据,而不同类型的数据的处理方式通常会存在差异,所以在本申请另一实施中,步骤S203的一种具体实施方式,包括:
分别针对当期更新数据中的各个数据表,基于预置规则集中的各个子规则,对数据包进行计算,得到数据表对应的预置分析数据。
其中,预置分析数据包括数据表属性信息、数据表统计信息、数据字典类信息、数据血缘分析信息。
可选地,数据表属性信息可以包括数据表中文名、英文名、归属数据模型或业务领域、数据来源系统、数据主题、数据表分类,如增量时点、增量时段、全量时段,或称为增量流水表、增转全表、全量表等。所以可以基于系统表空间信息及日常加工的信息统计得到。
数据表统计信息可以包括数据表占用空间大小、数据表分区以及分片占用空间大小、数据最新日期、数据平均更新时间、数据表加工逻辑、数据表规模统计信息。并且,统计的信息根据数据表分类的不同具有不同的统计口径和规则,具体可以包括总记录条数、每日增量变化数据量、每日全量数据、数据变化率、数据波动情况、周期数据变化情况等。
数据字典类信息可以包括字段类型、字段英文名称、字段中文名称、样例数据预览等。
数据血缘分析信息则为把数据从源系统到最终接口指标的整个路径给刻画出来的数据。并且,可以基于加工过程中的前驱、后驱依赖关系自动读取层次结构关系,形成数据流向。
S204、将预置分析数据进行展示。
S205、当接收到用户的发起检索请求时,响应检索请求,检索出待探查数据范围。
具体的,用户可以输入检索的条件,然后发起检索请求,此时将响应用户发起的检索请求,查找出符合检索条件的数据。并将其作为待探查数据范围。当然,也可以是先反馈给用户,然后根据用户的选择,从中确定出待探查数据范围。
S206、基于用户配置的探查规则以及探查表范围,对探查数据范围内的数据进行探查,得到并反馈探查结果。
其中,探查规则包括联机探查规则以及异步探查规则。
需要说明的是,在本申请实施例中,包括实时探查的联机探查,以能保证用户实时探查,可以对不确定的数据进行频繁的探查。还可以用于对大量数据进行探查的异步探查。可选地,用户可以选择同时进行联机探查和异步探查,可以仅进行其中一种探查方式。
可选地,在本申请另一实施例中,步骤S206的一种具体实施方式,包括:
通过联机探查计算引擎基于联机探查规则以及探查表范围,对探查数据范围内的数据进行实时同步探查,得到并反馈实时探查结果,和/或,通过异步探查计算引擎基于联机探查规则以及探查表范围,对探查数据范围内的数据进行异步探查,得到并反馈异步探查结果。
可选地,在本申请另一实施例中,还可以进一步包括:
将用户配置的联机探查规则以及异步探查规则进行固化。
需要说明的是,若是在后续还希望继续使用当前配置的联机探查规则以及异步探查规则,则可以选择将配置的联机探查规则以及异步探查规则进行固化。
S207、当监测到用户对可视化的预置分析数据或探查结果中的数据的探查操作时,响应探查操作,对用户选择的探查范围进行探查。
可选地,在本申请另一实施例中,还可以进一步包括:
基于用户信息对用户访问的数据进行权限控制。
可选地,可以是在探查数据时,仅探查用户具有权限的数据,也可以是全部探查,在反馈探查的结果时,仅反馈用户具有权限的数据。当然,在用户进行检索时,也可以仅反馈用户具有权限的数据。
可选地,在本申请另一实施例中,还可以进一步包括:
将探查到的数据按照所属的维度,以卡片的方式进行可视化,响应用户对卡片中的任意可视化数据的计算操作,对可视化数据进行计算,得到计算结果,并利用计算结果对卡片中的可视化数据进行更新。
需要说明的是,本申请上述实施例提供的各个步骤的具体实施过程,可相应地参考上述系统中的相应的模块的具体工作过程,此处不再赘述。
本申请实施例提供的一种数字探查方法,获取当期更新的数据,并将当期更新的数据按照维护的数据主题模型进行分层以及分领域存储。然后基于预置规则集,对当期更新的数据进行计算,得到预置分析数据,并将预置分析数据进行展示。当用户需要进行探查时,可以先发起检索请求,以确定探查的范围。当接收到用户的发起检索请求时,响应检索请求,检索出待探查数据范围。然后基于用户配置的探查规则以及探查表范围,对探查数据范围内的数据进行探查,得到并反馈探查结果。其中,探查规则包括联机探查规则以及异步探查规则,从而可以满足实时数据探查以及大数据量的数据探查。对于展示的数据,用户还可以选择进一步进行探查。所以当监测到用户对可视化的预置分析数据或探查结果中的数据的探查操作时,响应探查操作,对用户选择的探查范围进行探查,从而可以更好地满足用户的需求,并且不再受限于某一类用户,方便各类用户进行数据探查。
还需要说明的是,附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。
本申请另一实施例提供了一种电子设备,如图3所示,包括:
存储器301和处理器302。
其中,存储器301用于存储程序。
处理器302用于执行存储器301存储的程序,该程序被执行时,具体用于实现如上述任意一个实施例提供的数字探查方法。
本申请另一实施例提供了一种计算机存储介质,用于存储计算机程序,所述计算机程序被执行时,用于实现如上述任意一个实施例提供的数字探查方法。
计算机存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本发明提供的一种数字探查方法及系统、电子设备、存储介质可用于金融领域或其他领域,例如,可用于金融领域中的学费管理应用场景。其他领域为除金融领域之外的任意领域,例如,5G领域。上述仅为示例,并不对本发明提供的一种数字探查方法及系统、电子设备、存储介质的应用领域进行限定。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种数字探查系统,其特征在于,包括:
基础信息管理模块、预置规则集计算模块、数据自由探查模块以及可视化数据探查模块;
所述基础信息管理模块用于维护数据主题模型、探查表范围以及预置规则集;其中,所述数据主题模型用于对数据表进行分层以及分领域存储;
所述预置规则集计算模块用于基于所述预置规则集,对当期更新的数据进行计算,得到预置分析数据;
所述数据自由探查模块用于所述预置分析数据的展示、配置探查规则,以及检索待探查数据范围,并基于所述探查规则以及所述探查表范围,对所述探查数据范围内的数据进行探查,得到并反馈探查结果;其中,所述探查规则包括联机探查规则以及异步探查规则;
所述可视化探查模块用于响应用户对可视化的所述预置分析数据或所述探查结果中的数据的探查查找,对所述用户选择的探查范围进行探查。
2.根据权利要求1所述的系统,其特征在于,还包括:
探查规则固化模块,用于将用户配置的所述联机探查规则以及所述异步探查规则进行固化。
3.根据权利要求1所述的系统,其特征在于,还包括:
权限控制模块,用于基于用户信息对所述用户访问的数据进行权限控制。
4.根据权利要求1所述的系统,其特征在于,所述数据自由探查模块基于所述探查规则以及所述探查表范围,对所述探查数据范围内的数据进行探查,得到并反馈探查结果时,用于:
通过联机探查计算引擎基于所述联机探查规则以及所述探查表范围,对所述探查数据范围内的数据进行实时同步探查,得到并反馈实时探查结果,和/或,通过异步探查计算引擎基于所述联机探查规则以及所述探查表范围,对所述探查数据范围内的数据进行异步探查,得到并反馈异步探查结果。
5.根据权利要求1所述的系统,其特征在于,所述预置规则集计算模块基于所述预置规则集,对当期更新的数据进行计算,得到预置分析数据时,用于:
分别针对所述当期更新数据中的各个数据表,基于所述预置规则集中的各个子规则,对所述数据包进行计算,得到所述数据表对应的所述预置分析数据;其中,所述预置分析数据包括数据表属性信息、数据表统计信息、数据字典类信息、数据血缘分析信息。
6.根据权利要求1所述的系统,其特征在于,所述可视化探查模块,还用于:
将探查到的数据按照所属的类型,以卡片的方式进行可视化;
响应所述用户对所述卡片中的任意可视化数据的计算操作,对所述可视化数据进行计算,得到计算结果,并利用所述计算结果对所述卡片中的所述可视化数据进行更新。
7.一种数字探查方法,其特征在于,包括:
获取当期更新的数据;
将所述当期更新的数据按照维护的数据主题模型进行分层以及分领域存储;
基于所述预置规则集,对所述当期更新的数据进行计算,得到预置分析数据;
将所述预置分析数据进行展示;
当接收到用户的发起检索请求时,响应所述检索请求,检索出待探查数据范围;
基于所述用户配置的探查规则以及所述探查表范围,对所述探查数据范围内的数据进行探查,得到并反馈探查结果;其中,所述探查规则包括联机探查规则以及异步探查规则;
当监测到所述用户对可视化的所述预置分析数据或所述探查结果中的数据的探查操作时,响应所述探查操作,对所述用户选择的探查范围进行探查。
8.根据权利要求7所述的方法,其特征在于,所述基于所述探查规则以及所述探查表范围,对所述探查数据范围内的数据进行探查,得到并反馈探查结果,包括:
通过联机探查计算引擎基于所述联机探查规则以及所述探查表范围,对所述探查数据范围内的数据进行实时同步探查,得到并反馈实时探查结果,和/或,通过异步探查计算引擎基于所述联机探查规则以及所述探查表范围,对所述探查数据范围内的数据进行异步探查,得到并反馈异步探查结果。
9.一种电子设备,其特征在于,包括:
存储器和处理器;
其中,所述存储器用于存储程序;
所述处理器用于执行所述程序,所述程序被执行时,具体用于实现如权利要求7至8任意一项所述的数字探查方法。
10.一种计算机存储介质,其特征在于,用于存储计算机程序,所述计算机程序被执行时,用于实现如权利要求7至8任意一项所述的数字探查方法。
CN202210679258.3A 2022-06-16 2022-06-16 一种数字探查方法及系统、电子设备、存储介质 Pending CN114996314A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210679258.3A CN114996314A (zh) 2022-06-16 2022-06-16 一种数字探查方法及系统、电子设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210679258.3A CN114996314A (zh) 2022-06-16 2022-06-16 一种数字探查方法及系统、电子设备、存储介质

Publications (1)

Publication Number Publication Date
CN114996314A true CN114996314A (zh) 2022-09-02

Family

ID=83034826

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210679258.3A Pending CN114996314A (zh) 2022-06-16 2022-06-16 一种数字探查方法及系统、电子设备、存储介质

Country Status (1)

Country Link
CN (1) CN114996314A (zh)

Similar Documents

Publication Publication Date Title
US11294914B1 (en) Fast ad-hoc filtering of time series analytics
US11328128B2 (en) System and method for analysis and navigation of data
Slingsby et al. Interactive tag maps and tag clouds for the multiscale exploration of large spatio-temporal datasets
US11100151B2 (en) Interactive patent visualization systems and methods
CN109614507B (zh) 一种基于频繁项挖掘的遥感图像推荐装置
CN110928903B (zh) 数据提取方法及装置、设备和存储介质
US20150269138A1 (en) Publication Scope Visualization and Analysis
Tešendić et al. Business intelligence in the service of libraries
US10803124B2 (en) Technological emergence scoring and analysis platform
CN109791797B (zh) 在大数据库中根据化学结构相似性搜索和显示可用信息的系统、装置和方法
Wen Data aggregation
CN110968676A (zh) 基于lda模型与lstm网络的文本数据语义时空模式探索方法
US11977722B2 (en) Interactive patent visualization systems and methods
US7899776B2 (en) Explaining changes in measures thru data mining
Guo et al. A visualization platform for spatio-temporal data: a data intensive computation framework
CN114996314A (zh) 一种数字探查方法及系统、电子设备、存储介质
US20190318023A1 (en) Efficient Data Processing
CN117056392A (zh) 一种基于动态超图技术的大数据检索服务系统及方法
Dave et al. Identifying big data dimensions and structure
US9208224B2 (en) Business content hierarchy
Jatowt et al. Diachronic analysis of time references in news articles
Hayashi et al. Meta-data generation of analysis tools and connection with structured meta-data of datasets
US12007979B2 (en) Systems and methods for data consistency and alignment in data analytics platforms
Nam et al. Text Mining and Visualization of Time Series Data Utilizing Big Data.
Vo et al. TKES: a novel system for extracting trendy keywords from online news sites

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination