CN110990445B - 一种数据处理方法、装置、设备和介质 - Google Patents

一种数据处理方法、装置、设备和介质 Download PDF

Info

Publication number
CN110990445B
CN110990445B CN201911233971.XA CN201911233971A CN110990445B CN 110990445 B CN110990445 B CN 110990445B CN 201911233971 A CN201911233971 A CN 201911233971A CN 110990445 B CN110990445 B CN 110990445B
Authority
CN
China
Prior art keywords
data table
target data
existing
information
index value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911233971.XA
Other languages
English (en)
Other versions
CN110990445A (zh
Inventor
刘彬彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Milaiwu Network Technology Co ltd
Original Assignee
Beijing Milaiwu Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Milaiwu Network Technology Co ltd filed Critical Beijing Milaiwu Network Technology Co ltd
Priority to CN201911233971.XA priority Critical patent/CN110990445B/zh
Publication of CN110990445A publication Critical patent/CN110990445A/zh
Application granted granted Critical
Publication of CN110990445B publication Critical patent/CN110990445B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24573Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种数据处理方法、装置、设备和介质。所述方法包括:获取用户输入的目标数据表属性信息;将所述目标数据表属性信息和已有数据表的表名信息进行匹配,并根据匹配结果从已有数据表中选择目标数据表;其中所述已有数据表的表名信息根据已有数据表的如下至少一项属性信息生成:所属数据仓库标识、字段名称、特征类型和统计周期;向用户推送所述目标数据表。本发明实施例通过根据用户输入的目标数据表属性信息,与已有数据表的表名信息的匹配结果,选择目标数据表向用户推荐,实现了无需人工监测,就可以自动的依据用户需求向用户推荐数据表的技术效果。

Description

一种数据处理方法、装置、设备和介质
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种数据处理方法、装置、设备和介质。
背景技术
在现有推荐系统中,随着对推荐指标的不断追求,随之会产出越来越多的字段数据。当用户想要获取具有目标属性信息的数据表时,就需要开发人员调取数据仓中各数据表的属性信息,通过人工监测的方法来确定符合目标属性信息的数据表,再反馈给用户。
当字段数据越来越多时,通过人工的方式来监测数据表的属性信息,这无疑大大增加了开发人员的工作量,同时工作效率也会大大下降。
发明内容
本发明实施例提供一种数据处理方法、装置、设备和介质,以解决现有通过人工的方式来对数据表的属性信息进行监测,带来的工作量大且效率低的问题。
第一方面,本发明实施例提供了一种数据处理方法,所述方法包括:
获取用户输入的目标数据表属性信息;
将所述目标数据表属性信息和已有数据表的表名信息进行匹配,并根据匹配结果从已有数据表中选择目标数据表;其中所述已有数据表的表名信息根据已有数据表的如下至少一项属性信息生成:所属数据仓库标识、字段名称、特征类型和统计周期;
向用户推送所述目标数据表。
第二方面,本发明实施例提供了一种数据处理装置,所述装置包括:
属性信息获取模块,用于获取用户输入的目标数据表属性信息;
目标数据表选择模块,用于将所述目标数据表属性信息和已有数据表的表名信息进行匹配,并根据匹配结果从已有数据表中选择目标数据表;其中所述已有数据表的表名信息根据已有数据表的如下至少一项属性信息生成:所属数据仓库标识、字段名称、特征类型和统计周期;
目标数据表推荐模块,用于向用户推送所述目标数据表。
第三方面,本发明实施例提供了一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的数据处理方法。
第四方面,本发明实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的数据处理方法。
本发明实施例通过根据用户输入的目标数据表属性信息,与已有数据表的表名信息的匹配结果,选择目标数据表向用户推荐,实现了无需人工监测,就可以自动的依据用户需求向用户推荐数据表的技术效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明实施例一提供的一种数据处理方法的流程图;
图2为本发明实施例二提供的一种数据处理方法的流程图;
图3为本发明实施例三提供的一种数据处理装置的结构示意图;
图4为本发明实施例四提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明实施例作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明实施例,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明实施例相关的结构而非全部结构。
实施例一
图1是本发明实施例一提供的一种数据处理方法的流程图。本实施例适用于根据用户的输入属性信息,向用户推荐满足要求的数据表的情况,该方法可以由本发明实施例提供的数据处理装置来执行,所述数据处理装置可以由软件和/或硬件的方式来实现。如图1所示,该方法可以包括:
步骤101、获取用户输入的目标数据表属性信息。
其中,目标数据表的属性信息可以包括如下至少一项:所属数据仓库标识、字段名称、特征类型和统计周期。所属数据仓库标识体现了存储目标数据表的期望数据仓库名称,例如目标数据表的所属数据仓库标识为“数据仓库1”,则表示目标数据表期望存储于“数据仓库1”中。字段名称体现了目标数据表中期望包含的字段维度,例如“用户名称”、“年龄”以及“性别”等。特征类型体现了目标数据表中字段的期望特征类型,例如“数值型字段”、“分类型字段”或者是“数值/分类型混合字段”等。统计周期体现了目标数据表中字段值更新的期望时间窗口值,例如统计周期为“1天”,则表示目标数据表中字段值更新的期望时间窗口值是1天,又例如统计周期为“1周”,则表示目标数据表中字段值更新的期望时间窗口值是1周。
具体的,用户在用户端的可视化编辑界面中,输入目标数据表属性信息,输入的方式包括通过外接设备进行手动输入,外接设备包括鼠标、键盘或电子笔等,或者,通过触控操作从候选属性信息中选择目标数据表属性信息,触控操作包括单击、双击或者拖拽等。目标数据表的每项属性信息中,可以包括一个目标取值,也可以包括多个目标取值,例如所属数据仓库标识可以包括“数据仓库1”,也可以包括“数据仓库1”、“数据仓库2”和“数据仓库3”;又例如特征类型可以包括“数值型字段”,也可以包括“数值型字段”、“分类型字段”和“数值/分类型混合字段”。
通过获取用户输入的目标数据表属性信息,为后续根据目标数据表属性信息,从已有数据表中选择目标数据表向用户推荐奠定了基础。
步骤102、将所述目标数据表属性信息和已有数据表的表名信息进行匹配,并根据匹配结果从已有数据表中选择目标数据表;其中所述已有数据表的表名信息根据已有数据表的如下至少一项属性信息生成:所属数据仓库标识、字段名称、特征类型和统计周期。
其中,已有数据表的获取方法包括在数据仓库中通过hive数据仓库工具的showtables指令来获取。对于已有数据表,所属数据仓库标识体现了存储有已有数据表的数据仓库;字段名称体现了已有数据表中包含的字段维度;特征类型体现了已有数据表中字段的特征类型;统计周期体现了已有数据表中字段值更新的时间窗口值。已有数据表的表名信息包含了各已有数据表的所有属性信息,示例性的,已有数据表A表名信息的一种可选形式为“数据仓库8_年龄和性别_数值型字段和分类型字段_1天”,则表示已有数据表A的所属数据仓库标识为“数据仓库8”,字段名称为“年龄和性别”,特征类型为“数值型字段和分类型字段”,统计周期为“1天”。
具体的,获取到已有数据表后,根据已有数据表的表名信息与目标数据表属性信息进行匹配,并根据匹配结果从已有数据表中选择目标数据表。示例性的,例如目标数据表属性信息为“所属数据仓库标识:数据仓库4或数据仓库6”、“字段名称:用户名称或年龄”、“特征类型:“数值型字段或分类型字段”以及“统计周期:1天、1周、1月或1年”,已有数据表B的表名信息为“数据仓库4_用户名称_分类型字段_1月”,已有数据表B的表名信息与目标数据表属性信息相匹配,则将已有数据表B作为目标数据表;已有数据表C的表名信息为“数据仓库7_性别_分类型字段_1月”,则已有数据表C的表名信息与目标数据表属性信息不匹配。
可选的,所述已有数据表的表名信息通过如下方式确定:
从已有数据库的数据字典中提取已有数据库的属性信息;根据已有数据库的属性信息,生成所述已有数据表的表名信息。
具体的,一个数据表对应一个数据库,数据库中的数据都被记录在对应数据表的字段中,并且开发人员在创建数据库时,每个已有数据库会相应的生成数据字典,用来记录对应数据库的属性信息,例如数据名称、数据类型、数据统计周期、关键词信息和数据计算维度信息等,根据已有数据库的属性信息,生成所述已有数据表的表名信息。
通过将目标数据表属性信息和已有数据表的表名信息进行匹配,并根据匹配结果从已有数据表中选择目标数据表,实现了目标数据表的确定,为后续将目标数据表推荐给用户奠定了基础。
步骤103、向用户推送所述目标数据表。
具体的,将步骤102得到的目标数据表反馈给用户端,供用户在用户端中进行选择。
可选的,步骤103包括:通过可视化界面,向用户展示所述目标数据表。
具体的,通过包括监控邮件以及可视化web页面等方式,将目标数据表包括的字段信息向用户进行可视化的展示。
本发明实施例提供的技术方案,通过根据用户输入的目标数据表属性信息,与已有数据表的表名信息的匹配结果,选择目标数据表向用户推荐,实现了无需人工监测,就可以自动的依据用户需求向用户推荐数据表的技术效果。
在上述实施例的基础上,步骤102之后,还包括:
根据目标数据表的表名信息、关键词信息以及字段计算维度信息,生成字段信息字典;向用户推送所述字段信息字典。
其中,关键词信息和字段计算维度信息是根据已有数据库的属性信息确定的,关键词信息对目标数据表中字段信息进行了概括,字段计算维度信息则是体现了目标数据表中字段信息是通过哪些算法得到的。
通过生成并向用户推送字段信息字典,使得用户能够更全面的了解目标数据表中包含的信息。
实施例二
图2为本发明实施例二提供的一种数据处理方法的流程图。本实施例为上述实施例提供了一种具体实现方式,如图2所示,该方法可以包括:
步骤201、获取用户输入的目标数据表属性信息。
步骤202、将所述目标数据表属性信息和已有数据表的表名信息进行匹配,并根据匹配结果从已有数据表中选择目标数据表。
步骤203、根据目标数据表在当前时间窗口中的字段数据,确定所述目标数据表在所述当前时间窗口中的当前字段指标取值。
其中,当前时间窗口是根据目标数据表的统计周期确定的,例如目标数据表的统计周期为“1天”,则当前时间窗口为“1天”。当前字段指标是用来体现当前时间窗口中字段数据的数学统计规律。
可选的,所述字段指标包括如下至少一项:字段的最大值、最小值、均值和方差。
示例性的,若字段指标为字段的最大值,则计算当前时间窗口中字段数据中的最大值;若字段指标为字段的最小值,则计算当前时间窗口中字段数据中的最小值;若字段指标为字段的均值,则计算当前时间窗口中字段数据的均值;若字段指标为字段的方差,则计算当前时间窗口中字段数据的方差。
步骤204、将所述当前字段指标取值与目标数据表在历史时间窗口的历史字段指标取值进行比较,并根据比较结果对所述目标数据表进行筛选。
其中,历史时间窗口是根据当前时间窗口之前的总统计周期时间确定的,例如当前时间窗口之前,总统计周期时间为10天,则历史时间窗口为10天。历史字段指标取值是根据目标数据表在历史时间窗口的字段数据确定的。
具体的,将当前字段指标取值与历史字段指标取值进行比较,若任一目标数据表的当前字段指标取值超出了历史字段指标取值的预设范围,则将该目标数据表剔除。其中,预设范围的上限可选的包括历史字段指标取值的1.1倍,预设范围的下限可选的包括历史字段指标取值的0.9倍。
示例性的,假设历史字段指标取值的预设范围的上限为历史字段指标取值的1.1倍,预设范围的下限为历史字段指标取值的0.9倍。目标数据表A的字段指标为字段的最大值、字段的最小值、字段的均值和字段的方差,当前字段指标取值分别为10、1、5.5和2,而历史字段指标取值分别为10、1、5.65和1.97,则目标数据表A不需要被剔除;假设目标数据表B的字段指标为字段的最大值、字段的最小值、字段的均值和字段的方差,当前字段指标取值分别为10、1、5.5和2,而历史字段指标取值分别为12、1、6.5和2,则目标数据表B需要被剔除。
步骤205、向用户推送筛选后的目标数据表。
本发明实施例提供的技术方案,通过根据目标数据表在当前时间窗口中的字段数据,确定目标数据表在当前时间窗口中的当前字段指标取值,将当前字段指标取值与目标数据表在历史时间窗口的历史字段指标取值进行比较,并根据比较结果对目标数据表进行筛选,最终将筛选后的目标数据表推荐给用户,使得目标数据表中的字段数据更加稳定且可靠,进一步优化了自动向用户推荐目标数据表的质量。
在上述实施例的基础上,步骤204包括:
通过可视化界面,向用户展示目标数据表的当前字段指标取值以及历史字段指标取值。
具体的,通过可视化组件将当前字段指标取值以及历史字段指标取值转换成包括柱状图或线形图的形式,向用户进行可视化展示。
通过可视化界面,向用户展示目标数据表的当前字段指标取值以及历史字段指标取值,使得用户能够更直观的获取当前字段指标取值以及历史字段指标取值的变化趋势。
实施例三
图3为本发明实施例三提供的一种数据处理装置的结构示意图,可执行本发明任一实施例所提供的一种数据处理方法,具备执行方法相应的功能模块和有益效果。如图3所示,该装置可以包括:
属性信息获取模块31,用于获取用户输入的目标数据表属性信息;
目标数据表选择模块32,用于将所述目标数据表属性信息和已有数据表的表名信息进行匹配,并根据匹配结果从已有数据表中选择目标数据表;其中所述已有数据表的表名信息根据已有数据表的如下至少一项属性信息生成:所属数据仓库标识、字段名称、特征类型和统计周期;
目标数据表推荐模块33,用于向用户推送所述目标数据表。
在上述实施例的基础上,所述装置还包括目标数据表筛选模块,具体用于:
根据目标数据表在当前时间窗口中的字段数据,确定所述目标数据表在所述当前时间窗口中的当前字段指标取值;
将所述当前字段指标取值与目标数据表在历史时间窗口的历史字段指标取值进行比较,并根据比较结果对所述目标数据表进行筛选。
在上述实施例的基础上,所述字段指标包括如下至少一项:字段的最大值、最小值、均值和方差。
在上述实施例的基础上,所述已有数据表的表名信息通过如下方式确定:
从已有数据库的数据字典中提取已有数据库的属性信息;
根据已有数据库的属性信息,生成所述已有数据表的表名信息。
在上述实施例的基础上,所述目标数据表推荐模块33,具体用于:
通过可视化界面,向用户展示所述目标数据表。
本发明实施例所提供的一种数据处理装置,可执行本发明任一实施例所提供的一种数据处理方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任一实施例提供的一种数据处理方法。
实施例四
图4为本发明实施例四提供的一种设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性设备400的框图。图4显示的设备400仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,设备400以通用计算设备的形式表现。设备400的组件可以包括但不限于:一个或者多个处理器或者处理单元401,系统存储器402,连接不同系统组件(包括系统存储器402和处理单元401)的总线403。
总线403表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
设备400典型地包括多种计算机系统可读介质。这些介质可以是任何能够被设备400访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器402可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)404和/或高速缓存存储器405。设备400可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统406可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线403相连。存储器402可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块407的程序/实用工具408,可以存储在例如存储器402中,这样的程序模块407包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块407通常执行本发明所描述的实施例中的功能和/或方法。
设备400也可以与一个或多个外部设备409(例如键盘、指向设备、显示器410等)通信,还可与一个或者多个使得用户能与该设备400交互的设备通信,和/或与使得该设备400能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口411进行。并且,设备400还可以通过网络适配器412与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器412通过总线403与设备400的其它模块通信。应当明白,尽管图中未示出,可以结合设备400使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元401通过运行存储在系统存储器402中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的数据处理方法,包括:
获取用户输入的目标数据表属性信息;
将所述目标数据表属性信息和已有数据表的表名信息进行匹配,并根据匹配结果从已有数据表中选择目标数据表;其中所述已有数据表的表名信息根据已有数据表的如下至少一项属性信息生成:所属数据仓库标识、字段名称、特征类型和统计周期;
向用户推送所述目标数据表。
实施例五
本发明实施例五还提供了一种计算机可读存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种数据处理方法,该方法包括:
获取用户输入的目标数据表属性信息;
将所述目标数据表属性信息和已有数据表的表名信息进行匹配,并根据匹配结果从已有数据表中选择目标数据表;其中所述已有数据表的表名信息根据已有数据表的如下至少一项属性信息生成:所属数据仓库标识、字段名称、特征类型和统计周期;
向用户推送所述目标数据表。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的一种数据处理方法中的相关操作。本发明实施例的计算机可读存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (8)

1.一种数据处理方法,其特征在于,所述方法包括:
获取用户输入的目标数据表属性信息;
将所述目标数据表属性信息和已有数据表的表名信息进行匹配,并根据匹配结果从已有数据表中选择目标数据表;其中所述已有数据表的表名信息根据已有数据表的如下至少一项属性信息生成:所属数据仓库标识、字段名称、特征类型和统计周期;
向用户推送所述目标数据表;
向用户推送所述目标数据表之前,还包括:
根据目标数据表在当前时间窗口中的字段数据,确定所述目标数据表在所述当前时间窗口中的当前字段指标取值;所述字段指标包括如下至少一项:字段的最大值、最小值、均值和方差;
将所述当前字段指标取值与目标数据表在历史时间窗口的历史字段指标取值进行比较,并根据比较结果对所述目标数据表进行筛选;
所述将所述当前字段指标取值与目标数据表在历史时间窗口的历史字段指标取值进行比较,并根据比较结果对所述目标数据表进行筛选,包括:
将当前字段指标取值与历史字段指标取值进行比较,若任一目标数据表的当前字段指标取值超出了历史字段指标取值的预设范围,则将该目标数据表剔除;其中,所述历史时间窗口根据当前时间窗口之前的总统计周期时间确定;
所述将所述目标数据表属性信息和已有数据表的表名信息进行匹配,并根据匹配结果从已有数据表中选择目标数据表之后,还包括:
根据目标数据表的表名信息、关键词信息以及字段计算维度信息,生成字段信息字典;向用户推送所述字段信息字典。
2.根据权利要求1所述的方法,其特征在于,所述已有数据表的表名信息通过如下方式确定:
从已有数据库的数据字典中提取已有数据库的属性信息;
根据已有数据库的属性信息,生成所述已有数据表的表名信息。
3.根据权利要求1所述的方法,其特征在于,向用户推送所述目标数据表,包括:
通过可视化界面,向用户展示所述目标数据表。
4.一种数据处理装置,其特征在于,所述装置包括:
属性信息获取模块,用于获取用户输入的目标数据表属性信息;
目标数据表选择模块,用于将所述目标数据表属性信息和已有数据表的表名信息进行匹配,并根据匹配结果从已有数据表中选择目标数据表;其中所述已有数据表的表名信息根据已有数据表的如下至少一项属性信息生成:所属数据仓库标识、字段名称、特征类型和统计周期;
目标数据表推荐模块,用于向用户推送所述目标数据表;
所述装置还包括目标数据表筛选模块,具体用于:
根据目标数据表在当前时间窗口中的字段数据,确定所述目标数据表在所述当前时间窗口中的当前字段指标取值;所述字段指标包括如下至少一项:字段的最大值、最小值、均值和方差;
将所述当前字段指标取值与目标数据表在历史时间窗口的历史字段指标取值进行比较,并根据比较结果对所述目标数据表进行筛选;
所述将所述当前字段指标取值与目标数据表在历史时间窗口的历史字段指标取值进行比较,并根据比较结果对所述目标数据表进行筛选,包括:
将当前字段指标取值与历史字段指标取值进行比较,若任一目标数据表的当前字段指标取值超出了历史字段指标取值的预设范围,则将该目标数据表剔除;其中,所述历史时间窗口根据当前时间窗口之前的总统计周期时间确定;
所述将所述目标数据表属性信息和已有数据表的表名信息进行匹配,并根据匹配结果从已有数据表中选择目标数据表之后,还包括:
根据目标数据表的表名信息、关键词信息以及字段计算维度信息,生成字段信息字典;向用户推送所述字段信息字典。
5.根据权利要求4所述的装置,其特征在于,所述已有数据表的表名信息通过如下方式确定:
从已有数据库的数据字典中提取已有数据库的属性信息;
根据已有数据库的属性信息,生成所述已有数据表的表名信息。
6.根据权利要求4所述的装置,其特征在于,所述目标数据表推荐模块,具体用于:
通过可视化界面,向用户展示所述目标数据表。
7.一种设备,其特征在于,所述设备还包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-3中任一所述的数据处理方法。
8.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-3中任一所述的数据处理方法。
CN201911233971.XA 2019-12-05 2019-12-05 一种数据处理方法、装置、设备和介质 Active CN110990445B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911233971.XA CN110990445B (zh) 2019-12-05 2019-12-05 一种数据处理方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911233971.XA CN110990445B (zh) 2019-12-05 2019-12-05 一种数据处理方法、装置、设备和介质

Publications (2)

Publication Number Publication Date
CN110990445A CN110990445A (zh) 2020-04-10
CN110990445B true CN110990445B (zh) 2024-04-30

Family

ID=70090292

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911233971.XA Active CN110990445B (zh) 2019-12-05 2019-12-05 一种数据处理方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN110990445B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111949662A (zh) * 2020-08-13 2020-11-17 北京字节跳动网络技术有限公司 数据展示方法和装置、存储介质和电子设备
CN112948435A (zh) * 2021-02-25 2021-06-11 苏宁金融科技(南京)有限公司 一种数据处理方法、装置及电子设备
CN113377486A (zh) * 2021-07-16 2021-09-10 西安未来国际信息股份有限公司 数据可视化展示方法、装置、设备及存储介质
CN113535737B (zh) * 2021-09-15 2022-03-01 北京搜狐新媒体信息技术有限公司 特征的生成方法、装置、电子设备及计算机存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105205071A (zh) * 2014-06-24 2015-12-30 阿里巴巴集团控股有限公司 一种数据表展示的方法和系统
CN107305615A (zh) * 2016-04-25 2017-10-31 深圳市深信服电子科技有限公司 数据表识别方法和系统
WO2019205790A1 (zh) * 2018-04-23 2019-10-31 华为技术有限公司 一种数据操作方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105205071A (zh) * 2014-06-24 2015-12-30 阿里巴巴集团控股有限公司 一种数据表展示的方法和系统
CN107305615A (zh) * 2016-04-25 2017-10-31 深圳市深信服电子科技有限公司 数据表识别方法和系统
WO2019205790A1 (zh) * 2018-04-23 2019-10-31 华为技术有限公司 一种数据操作方法及装置

Also Published As

Publication number Publication date
CN110990445A (zh) 2020-04-10

Similar Documents

Publication Publication Date Title
CN110990445B (zh) 一种数据处理方法、装置、设备和介质
CN109992589B (zh) 基于可视化页面生成sql语句的方法、装置、服务器及介质
US11966873B2 (en) Data distillery for signal detection
WO2018132840A1 (en) Methods of assessing long-term indicators of sentiment
US20180032492A1 (en) Generation of annotated computerized visualizations with explanations
CN108829716B (zh) 待召开会议的会议议程生成方法以及装置
CN111125266B (zh) 数据处理方法、装置、设备及存储介质
US10620784B2 (en) Using social data to assist editors in addressing reviewer feedback in a document review workflow
CN113761334A (zh) 一种可视化推荐方法、装置、设备和存储介质
CN114428677A (zh) 任务处理方法、处理装置、电子设备及存储介质
US11868708B2 (en) Method and system for labeling and organizing data for summarizing and referencing content via a communication network
US11514031B2 (en) Product navigator
CN110222017B (zh) 实时数据的处理方法、装置、设备及计算机可读存储介质
CN114201615A (zh) 基于数据快照的科研数据变动回顾方法及服务器
US20150007079A1 (en) Combining parallel coordinates and histograms
US20140108906A1 (en) Providing user-friendly table handling
US11372875B2 (en) Using a single-entry access point to archive data in and out of an electronic document review and reporting system
US20180336242A1 (en) Apparatus and method for generating a multiple-event pattern query
US20150170068A1 (en) Determining analysis recommendations based on data analysis context
CN113780675B (zh) 一种消耗预测方法、装置、存储介质及电子设备
US11675765B2 (en) Top contributor recommendation for cloud analytics
US10296833B2 (en) System and method for estimating missing attributes of future events
US11238110B2 (en) Using a single-entry access point to archive data in and out of an electronic documents review and reporting system
US9349115B2 (en) Data management and control using data importance levels
CN110955837A (zh) 一种产品数据的查看方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant