CN115237934A - 数据查询方法、装置、电子设备及可读存储介质 - Google Patents
数据查询方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN115237934A CN115237934A CN202210729331.3A CN202210729331A CN115237934A CN 115237934 A CN115237934 A CN 115237934A CN 202210729331 A CN202210729331 A CN 202210729331A CN 115237934 A CN115237934 A CN 115237934A
- Authority
- CN
- China
- Prior art keywords
- data
- data set
- query
- level
- metadata
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请适用于数据处理技术领域,提供了数据查询方法、装置、电子设备及可读存储介质,该方法包括:接收数据查询请求,数据查询请求包括数据源和字段。根据数据源和字段,获取匹配的多个第一数据集以及每个第一数据集的元数据,元数据包括第一数据集的聚合级别、广告级别以及数据量。根据预设的条件,获取多个第一数据集中的第二数据集。在第二数据集中进行数据查询。提供了一种高效、准确的数据查询方式。
Description
技术领域
本申请属于数据处理技术领域,尤其涉及一种数据查询方法、装置、电子设备及可读存储介质。
背景技术
随着大数据时代的到来,企业会积累大量的数据集,如用户信息、用户行为等数据集。当需要在这些数据集中查询数据时,往往会采用行为识别(Behavior Identity,BI)工具进行统计分析。
但是,现有的BI工具在查询数据时缺乏一个高效、准确的数据查询方式。
发明内容
本申请实施例提供了一种数据查询方法、装置、电子设备及可读存储介质,可以提供一种高效、准确的数据查询方式。
第一方面,本申请实施例提供了一种数据查询方法,包括:接收数据查询请求,数据查询请求包括数据源和字段。根据数据源和字段,获取匹配的多个第一数据集以及每个第一数据集的元数据,元数据包括第一数据集的聚合级别、广告级别以及数据量。根据预设的条件,获取多个第一数据集中的第二数据集。在第二数据集中进行数据查询。
一些实施方式中,预设的条件包括:聚合级别最大、广告级别颗粒度最粗且数据量最小。
一些实施方式中,在第二数据集中进行数据查询之后,还包括:接收查询结果分析数据。当查询结果分析数据指示查询结果包括错误结果时,更新第二数据集的元数据。
一些实施方式中,在接收数据查询请求之前,包括:对每个数据集进行需求分析,获取每个数据集的聚合级别、广告级别及数据量。
第二方面,本申请实施例提供了一种数据查询装置,包括:接收模块,用于接收数据查询请求,数据查询请求包括数据源和字段。获取模块,用于根据数据源和字段,获取匹配的多个第一数据集以及每个第一数据集的元数据,元数据包括第一数据集的聚合级别、广告级别以及数据量。获取模块,还用于根据预设的条件,获取多个第一数据集中的第二数据集。查询模块,用于在第二数据集中进行数据查询。
一些实施方式中,预设的条件包括:聚合级别最大、广告级别颗粒度最粗且数据量最小。
一些实施方式中,接收模块,还用于接收查询结果分析数据。装置还包括更新模块,用于当查询结果分析数据指示查询结果包括错误结果时,更新第二数据集的元数据。
一些实施方式中,装置还包括分析模块,用于对每个数据集进行需求分析,获取每个数据集的聚合级别、广告级别及数据量。
第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如第一方面中任一项提供的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如第一方面中任一项提供的方法。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项提供的方法。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
本申请实施例与现有技术相比存在的有益效果是:通过接收数据查询请求,数据查询请求包括数据源和字段。根据数据源和字段,获取匹配的多个第一数据集以及每个第一数据集的元数据,元数据包括第一数据集的聚合级别、广告级别以及数据量。根据预设的条件,获取多个第一数据集中的第二数据集。在第二数据集中进行数据查询。提供了一种高效、准确的数据查询方式。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的数据查询方法的流程示意图;
图2是本申请另一实施例提供的数据查询方法的流程示意图;
图3是本申请另一实施例提供的数据查询方法的流程示意图;
图4是本申请实施例提供的数据查询装置的结构示意图;
图5是本申请实施例提供的电子设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
在本申请说明书中描述的参考“一些实施方式”或“一个可能的实施方式”等意味着在本申请的一个或多个实施方式中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施方式中”、“在一些实施方式中”、“在其他一些实施方式中”、“在另外一些实施方式中”、“在一个可能的实施方式中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
本申请实施例提供的数据查询方法可以应用于存储了数据库的服务器、云数据库等电子设备上,本申请实施例对电子设备的具体类型不作任何限制。
图1示出了本申请一实施例提供的数据查询方法的流程示意图,作为示例而非限定,该方法可以应用于上述电子设备中。
如图1所示,本申请实施例提供的数据查询方法包括:
S11、接收数据查询请求。
一些实施方式中,数据查询请求包括数据源和字段。
其中,数据查询请求可以来自前端页面。前端页面可以为网页,包括BI界面,BI界面接收到用户输入的数据源和字段后,打包生成数据查询请求并发送给数据库。
一些实施方式中,数据源即数据查询请求中所查询的数据的来源。数据可以来自一个数据库,或者,也可以来自一组具体相同特征点的数据集的集合。字段即在BI界面中展示查询结果时包括的指标以及每个指标的细分维度。
S12、根据数据源和字段,获取匹配的多个第一数据集以及每个第一数据集的元数据。
一些实施方式中,根据数据查询请求中的数据源,获取该数据源中包括的数据集集合。再根据数据查询请求中的字段,获取的数据集集合中匹配包含全部字段的第一数据集。其中,每个第一数据集都包括元数据。
一些实施方式中,元数据包括第一数据集的聚合级别、广告级别以及数据量。
其中,聚合级别和广告级别是数据集在存储时预先设置的。作为示例,数据集对应的广告级别由粗到细可以包括:广告推广系列、广告组,广告三个级别。
聚合级别为该数据集的细分维度,细分越多,数据颗粒度越细,其数据量理论上越多。聚合级别和广告级别共同影响该数据集的数据量、数据颗粒度。
S13、根据预设的条件,获取多个第一数据集中的第二数据集。
一些实施方式中,可以根据多个第一数据集上的元数据信息,获取符合预设的条件的第二数据集。作为示例,预设的条件可以包括:聚合级别最大、广告级别颗粒度最粗且数据量最小。
第二数据集为最优查询路径对应的数据集。当一个第一数据集符合预设的条件时,可以确认该第一数据集对应的是最优查询路径,即该第一数据集可以被记为第二数据集。
S14、在第二数据集中进行数据查询。
一些实施方式中,当在第二数据集中查询到结果后,可将查询结果返回给前端页面,前端页面接收并展示查询结果。
在本实施例中,通过接收数据查询请求,数据查询请求包括数据源和字段。根据数据源和字段,获取匹配的多个第一数据集以及每个第一数据集的元数据,元数据包括第一数据集的聚合级别、广告级别以及数据量。根据预设的条件,获取多个第一数据集中的第二数据集。在第二数据集中进行数据查询。提供了一种高效、准确的数据查询方式。
图2示出了本申请另一实施例提供的数据查询方法的流程示意图
可选的,参考图2,在第二数据集中进行数据查询之后,还包括:
S15、接收查询结果分析数据。
S16、当查询结果分析数据指示查询结果包括错误结果时,更新第二数据集的元数据。
一些实施方式中,在前端页面接收并展示查询结果后,前端页面还可以接收来自用户的查询结果分析数据,当查询结果分析数据指示查询结果包括错误结果时,更新第二数据集的元数据。
其中,当出现错误结果时,表明查询路径可能出错,即匹配到的第二数据集并不准确。因此需要对第二数据集的元数据进行修正,例如,可以降低聚合级别,降低广告级别颗粒度等,以优化修正该第二数据集的最优查询路径。
图3示出了本申请另一实施例提供的数据查询方法的流程示意图
可选的,参考图3,在接收数据查询请求之前,还包括:
S17、对每个数据集进行需求分析,获取每个数据集的聚合级别、广告级别及数据量。
一些实施方式中,可以通过预先训练的模型,根据预设规则对数据集进行分析,预设规则包括预先定义好的广告级别和细分维度。例如,若数据集A既包含国家也包含设备,同时又包含广告所属的相关字段,则确认该数据集的广告级别为:广告,聚合级别为分国家分设备级别数据。若数据集B包含国家和广告所属的相关字段,则确认该数据集的广告级别为:广告,聚合级别为分国家级别数据。若数据集C包含国家和设备,同时包括广告推广系列所属的相关字段,则确认该数据集的广告级别为:广告推广系列,聚合级别为分国家分设备级别数据。
其中,数据集A的颗粒度细于数据集B,数据集A的数据量远远大于数据集C。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
对应于上文实施例所述的数据查询方法,图4示出了与之对应的数据查询装置的结构示意图,为了便于说明,仅示出了与本申请实施例相关的部分。
参照图4,该装置包括:
一种数据查询装置,包括:
接收模块41,用于接收数据查询请求,数据查询请求包括数据源和字段。
获取模块42,用于根据数据源和字段,获取匹配的多个第一数据集以及每个第一数据集的元数据,元数据包括第一数据集的聚合级别、广告级别以及数据量。
获取模块42,还用于根据预设的条件,获取多个第一数据集中的第二数据集。
查询模块43,用于在第二数据集中进行数据查询。
一些实施方式中,预设的条件包括:聚合级别最大、广告级别颗粒度最粗且数据量最小。
一些实施方式中,接收模块41,还用于接收查询结果分析数据。
该装置还包括更新模块44,用于当查询结果分析数据指示查询结果包括错误结果时,更新第二数据集的元数据。
一些实施方式中,该装置还包括分析模块45,用于对每个数据集进行需求分析,获取每个数据集的聚合级别、广告级别及数据量。
需要说明的是,上述装置中模块之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种电子设备,图5示出了电子设备的结构示意图。
如图5所示,电子设备5包括存储器52、处理器51以及存储在存储器5中并可在处理器51上运行的计算机程序53,处理器51执行计算机程序53时实现上述的数据查询方法。
处理器51可以是中央处理单元(Central Processing Unit,CPU),该处理器51还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器52在一些实施例中可以是电子设备5的内部存储单元,例如电子设备5的硬盘、闪存或内存。存储器52在另一些实施例中也可以是电子设备5的外部存储设备,例如电子设备5上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器52还可以既包括电子设备5的内部存储单元也包括外部存储设备。存储器52用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如计算机程序53的程序代码、视频等。存储器52还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/电子设备和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种数据查询方法,其特征在于,包括:
接收数据查询请求,所述数据查询请求包括数据源和字段;
根据所述数据源和所述字段,获取匹配的多个第一数据集以及每个第一数据集的元数据,所述元数据包括所述第一数据集的聚合级别、广告级别以及数据量;
根据预设的条件,获取所述多个第一数据集中的第二数据集;
在所述第二数据集中进行数据查询。
2.根据权利要求1所述的方法,其特征在于,所述预设的条件包括:
聚合级别最大、广告级别颗粒度最粗且数据量最小。
3.根据权利要求2所述的方法,其特征在于,在所述第二数据集中进行数据查询之后,还包括:
接收查询结果分析数据;
当所述查询结果分析数据指示查询结果包括错误结果时,更新所述第二数据集的元数据。
4.根据权利要求1-3任一项所述的方法,其特征在于,在所述接收数据查询请求之前,包括:
对每个数据集进行需求分析,获取每个数据集的聚合级别、广告级别及数据量。
5.一种数据查询装置,其特征在于,包括:
接收模块,用于接收数据查询请求,所述数据查询请求包括数据源和字段;
获取模块,用于根据所述数据源和所述字段,获取匹配的多个第一数据集以及每个第一数据集的元数据,所述元数据包括所述第一数据集的聚合级别、广告级别以及数据量;
所述获取模块,还用于根据预设的条件,获取所述多个第一数据集中的第二数据集;
查询模块,用于在所述第二数据集中进行数据查询。
6.根据权利要求5所述的装置,其特征在于,所述预设的条件包括:
聚合级别最大、广告级别颗粒度最粗且数据量最小。
7.根据权利要求6所述的装置,其特征在于,所述接收模块,还用于接收查询结果分析数据;
所述装置还包括更新模块,用于当所述查询结果分析数据指示查询结果包括错误结果时,更新所述第二数据集的元数据。
8.根据权利要求5-7任一项所述的装置,其特征在于,所述装置还包括分析模块,用于对每个数据集进行需求分析,获取每个数据集的聚合级别、广告级别及数据量。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210729331.3A CN115237934A (zh) | 2022-06-24 | 2022-06-24 | 数据查询方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210729331.3A CN115237934A (zh) | 2022-06-24 | 2022-06-24 | 数据查询方法、装置、电子设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115237934A true CN115237934A (zh) | 2022-10-25 |
Family
ID=83670494
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210729331.3A Pending CN115237934A (zh) | 2022-06-24 | 2022-06-24 | 数据查询方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115237934A (zh) |
-
2022
- 2022-06-24 CN CN202210729331.3A patent/CN115237934A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110020122B (zh) | 一种视频推荐方法、系统及计算机可读存储介质 | |
CN107784070B (zh) | 一种提高数据清洗效率的方法、装置及设备 | |
CN111104426B (zh) | 一种数据查询方法及系统 | |
CN113704243A (zh) | 数据分析方法、装置、计算机装置及存储介质 | |
CN107291745B (zh) | 一种数据指标的管理方法及装置 | |
CN112329954B (zh) | 物品召回方法、装置、终端设备及存储介质 | |
CN113704307A (zh) | 数据查询方法、装置、服务器及计算机可读存储介质 | |
CN111159329A (zh) | 敏感词检测方法、装置、终端设备和计算机可读存储介质 | |
CN113129150A (zh) | 交易数据的处理方法、装置、终端设备及可读存储介质 | |
CN110888965A (zh) | 一种文档数据提取方法及装置 | |
CN107688959B (zh) | 断点名单的处理方法、存储介质和服务器 | |
CN113609409A (zh) | 一种推荐浏览信息的方法及其系统、电子设备、存储介质 | |
CN112561636A (zh) | 一种推荐方法、装置、终端设备及介质 | |
CN117390011A (zh) | 报表数据处理方法、装置、计算机设备和存储介质 | |
CN111221742A (zh) | 一种测试案例的更新方法、装置、存储介质和服务器 | |
CN115237934A (zh) | 数据查询方法、装置、电子设备及可读存储介质 | |
CN115994830A (zh) | 取数模型的构建方法和数据归集方法及相关装置 | |
CN110751510A (zh) | 一种确定推广名单的方法及装置 | |
CN115185904A (zh) | 云存储数据处理方法、装置、电子设备及可读存储介质 | |
CN115617794A (zh) | 数据分析方法、数据分析设备和计算机可读存储介质 | |
CN111291019B (zh) | 数据模型的相似判别方法及装置 | |
CN113722321A (zh) | 数据导出方法、装置和电子设备 | |
CN112711584A (zh) | 一种数据检查方法、检查装置、终端设备及可读存储介质 | |
CN112434195A (zh) | 数据解析方法、装置、电子设备及计算机可读存储介质 | |
CN117390292B (zh) | 基于机器学习的应用程序信息推荐方法、系统及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |