CN107515875A - 数据查询方法及装置 - Google Patents

数据查询方法及装置 Download PDF

Info

Publication number
CN107515875A
CN107515875A CN201610429851.7A CN201610429851A CN107515875A CN 107515875 A CN107515875 A CN 107515875A CN 201610429851 A CN201610429851 A CN 201610429851A CN 107515875 A CN107515875 A CN 107515875A
Authority
CN
China
Prior art keywords
data
query
dimension
engine
data query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610429851.7A
Other languages
English (en)
Inventor
单利民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201610429851.7A priority Critical patent/CN107515875A/zh
Publication of CN107515875A publication Critical patent/CN107515875A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying

Abstract

本申请提供一种数据查询方法及装置,该方法可以包括:获取用户针对数据存储集合输入的数据查询维度;根据所述数据存储集合中的数据在所述数据查询维度下的分布项,展示各个分布项的数据分布状况;根据被选中的分布项,生成针对所述数据存储集合的数据查询条件,以执行数据查询操作。通过本申请的技术方案,可以在查询前展示数据分布状况,便于用户据此合理设置数据查询条件。

Description

数据查询方法及装置
技术领域
本申请涉及数据查询技术领域,尤其涉及一种数据查询方法及装置。
背景技术
用户时常需要从海量数据中获得自己关心的数据,以用于业务处理或分析等。在相关技术中,提供了诸多形式的即席查询工具,可以根据用户的需求来灵活配置查询条件,并据此实现在海量数据中的实时查询。但是,如果用户并不了解所需要查询的海量数据的大致情况,很可能无法配置出恰当的查询条件,导致需要多次尝试才能够获得需要的数据,从而既浪费用户的时间和精力,又消耗了大量查询资源。
发明内容
有鉴于此,本申请提供一种数据查询方法及装置,可以在查询前展示数据分布状况,便于用户据此合理设置数据查询条件。
为实现上述目的,本申请提供技术方案如下:
根据本申请的第一方面,提出了一种数据查询方法,包括:
获取用户针对数据存储集合输入的数据查询维度;
根据所述数据存储集合中的数据在所述数据查询维度下的分布项,展示各个分布项的数据分布状况;
根据被选中的分布项,生成针对所述数据存储集合的数据查询条件,以执行数据查询操作。
根据本申请的第二方面,提出了一种数据获取查询,包括:
获取单元,获取用户针对数据存储集合输入的数据查询维度;
展示单元,根据所述数据存储集合中的数据在所述数据查询维度下的分布项,展示各个分布项的数据分布状况;
生成单元,根据被选中的分布项,生成针对所述数据存储集合的数据查询条件,以执行数据查询操作。
根据本申请的第三方面,提出了一种数据查询方法,包括:
显示数据查询页面,所述数据查询页面包括维度选择区域,所述维度选择区域中包含预定义的数据查询维度;
当检测到针对所述维度选择区域的第一选择操作时,根据被选中的数据查询维度,在所述数据查询页面示出项目展示窗口,所述项目展示窗口中包含所述数据存储集合中的数据在所述被选中的数据查询维度下的分布项,以及各个分布项的数据分布状况;
当检测到针对所述分布项的第二选择操作时,根据被选中的分布项,生成针对所述数据存储集合的数据查询条件,以执行数据查询操作。
根据本申请的第四方面,提出了一种数据查询装置,包括:
页面显示单元,显示数据查询页面,所述数据查询页面包括维度选择区域,所述维度选择区域中包含预定义的数据查询维度;
窗口显示单元,当检测到针对所述维度选择区域的第一选择操作时,根据被选中的数据查询维度,在所述数据查询页面示出项目展示窗口,所述项目展示窗口中包含所述数据存储集合中的数据在所述被选中的数据查询维度下的分布项,以及各个分布项的数据分布状况;
条件生成单元,当检测到针对所述分布项的第二选择操作时,根据被选中的分布项,生成针对所述数据存储集合的数据查询条件,以执行数据查询操作。
由以上技术方案可见,本申请通过获取用户输入的数据查询维度,并示出基于该数据查询维度的数据分布状况,使得用户可以大致了解所有数据的基本情况,从而配置出合理、恰当的数据查询条件,使得到的查询结果更加符合用户的实际需求,有助于减少查询次数、降低查询资源消耗,并且能够提升查询结果对用户需求的匹配度。
附图说明
图1是本申请一示例性实施例提供的一种数据查询方法的流程图。
图2是本申请一示例性实施例提供的另一种数据查询方法的流程图。
图3是本申请一示例性实施例提供的一种实现数据查询与下载的示意图。
图4是本申请一示例性实施例提供的另一种数据查询方法的流程图。
图5-8是本申请一示例性实施例提供的一种设置筛选条件的界面示意图。
图9是本申请一示例性实施例提供的一种电子设备的结构示意图。
图10是本申请一示例性实施例提供的一种数据查询装置的框图。
图11是本申请一示例性实施例提供的另一种电子设备的结构示意图。
图12是本申请一示例性实施例提供的另一种数据查询装置的框图。
具体实施方式
为对本申请进行进一步说明,提供下列实施例:
图1是本申请一示例性实施例提供的一种数据查询方法的流程图,如图1所示,该方法可以包括以下步骤:
步骤102,获取用户针对数据存储集合输入的数据查询维度。
在本实施例中,本申请并不限制数据存储集合采用的数据架构,比如该数据存储集合可以为数据库、数据仓库(Data Warehouse,DW)等。
在本实施例中,数据存储集合可以用于存储企业从某个时间点至当前各个阶段的历史数据,因而数据存储集合中往往包含有海量数据,比如其数据量可能达到亿级或更大量级。
步骤104,根据所述数据存储集合中的数据在所述数据查询维度下的分布项,展示各个分布项的数据分布状况。
步骤106,根据被选中的分布项,生成针对所述数据存储集合的数据查询条件,以执行数据查询操作。
在本实施例中,分布项可以为根据数据存储集合中的数据创建的语义层中的语义信息,其中语义层为该语义信息与该数据存储集合中相应数据之间的映射关系信息。
以“数据仓库”为例。数据仓库中包括事实表和维度表,可以根据数据仓库的事实表和维度表对应的已建立的语义层,展示该语义层对应的语义信息及其对应的字段数据在预设分类下的分布状况信息,然后通过对用户选取的语义信息进行组合和处理,从而得到数据查询条件。举例而言,假定用户选取查看的语义信息为“地区”,则可以确定出相应的诸如“北京”、“上海”、“深圳”等各个地区,并示出各个地区的数据的分布状况信息,比如“北京”地区的数据分布比例为5.5%、“上海”地区的数据分布比例为5.8%、“深圳”地区的数据分布比例为4.2%等,使得用户无需事先了解数据仓库的详细情况,即可基于对展示内容的查看,选取感兴趣的语义信息(即分布项)并生成数据查询条件,以降低搜索数据量、提升搜索的精准度。
进一步地,可以调用预配置的信息查询引擎和数据获取引擎,并分别根据所述数据查询条件对所述数据存储集合执行搜索操作;然后,展示由所述信息查询引擎得到的查询结果,以及输出所述数据获取引擎得到的数据文件。
在一实施例中,信息查询引擎和数据获取引擎可以分别且同时执行查询操作,从而在用户查看到查询结果后,可以尽快将相应的数据文件提供至用户,可以最大限度地缩短用户的等待时间。
在另一实施例中,信息查询引擎可以首先执行查询操作,然后在接收到用户发起的用户确认指令后,通过数据获取引擎查询并输出相应的数据文件,从而在用户并不存在下载需求的情况下,避免查询资源的浪费。
其中,可以将数据查询条件翻译为预设格式的查询语句,比如SQL语句等,使得信息查询引擎和数据获取引擎可以通过分别执行该SQL语句而实现查询操作,从而屏蔽了信息查询引擎与数据获取引擎之间的语法差异,只需要用户一次输入数据查询条件,即在用户看来仅执行了一次查询操作,就能够分别实现信息查询和对数据文件的下载输出,有助于简化用户操作、提升用户体验。
其中,当采用首先执行实时信息查询、然后执行文件下载的处理方案时,若用户在查看实时查询结果查询结果后,仅选择了该实时查询结果查询结果中的部分数据文件并发起下载需求,则可以结合被选中的查询结果对象(即被选中的数据文件)和最初的数据查询条件,得到更新后的SQL语句,并通过使离线查询引擎数据获取引擎执行该更新后的SQL语句,从而完成对用户下载需求的响应。
在本实施例中,数据存储集合可以存储于分布式计算平台,则数据获取引擎可以采用配合于该分布式计算平台的分布式引擎,使得该数据获取引擎在执行数据文件的查询时,可以充分利用分布式引擎的性能优势,从而缩短用户的等待时长。
由以上技术方案可见,本申请通过获取用户输入的数据查询维度,并示出基于该数据查询维度的数据分布状况,使得用户可以大致了解所有数据的基本情况,从而配置出合理、恰当的数据查询条件,使得到的查询结果更加符合用户的实际需求,有助于减少查询次数、降低查询资源消耗,并且能够提升查询结果对用户需求的匹配度。
图2是本申请一示例性实施例提供的另一种数据查询方法的流程图,如图2所示,在本申请的技术方案中,数据查询实际上可以分为下述两个阶段:阶段一,即步骤202,建立数据仓库;阶段二,即步骤204,执行数据查询;为了便于理解,下面结合图3所示的本申请一示例性实施例提供的一种实现数据查询与下载的示意图,对上述两个阶段进行详细描述。
1)建立数据仓库
步骤10,获取初始数据,并对初始数据进行加工,得到数据仓库的事实表和维度表。
在本实施例中,初始数据可以为预先配置或用户需要的任意数据,比如企业内的业务数据等。通过对初始数据的处理,可以将其加工为数据仓库的事实表和维度表;换言之,可以认为是利用初始数据建立起数据仓库。
如上文所述,本申请的技术方案可以应用于各种形式的数据存储集合,此处以数据仓库形式为例进行说明,但本申请并不对此进行限制。
步骤20,对事实表和维度表进行存储,以使其能够被分别应用于信息查询引擎和数据获取引擎。
在本实施例中,可以将事实表和维度表存储于分布式计算平台,比如该分布式计算平台可以基于Hadoop技术框架建立;当然,本申请对于分布式计算平台的搭建技术并不限制。
在本实施例中,分布式计算平台可以提供相应的基于分布式计算的数据获取引擎;以及,信息查询引擎可以采用诸如Presto、Spark等技术分布式查询引擎;当然,本申请对于查询引擎的技术平台并不限制。
步骤31,分别为事实表和维度表建立语义层。
在本实施例中,通过建立语义层,可以在预配置的语义信息与事实表、维度表中的底层表字段之间建立语义映射。那么,通过对语义信息进行展示,用户可以直接查看和选取示出的语义信息,以生成数据查询条件,并通过语义层实现对相应的底层表字段的数据查询、调用等。
步骤32,在建立语义层的基础上,缓存特征信息及其数据分布的信息。
在本实施例中,针对事实表和维度表的底层表字段中的字段数据,可以提取出在预设维度下的特征信息,并根据该字段数据在该预设维度下的分布状况,预先(在执行数据查询之前)生成并缓存相应的数据分布的信息。
举例而言,假定预设维度包括图7所示的“名称——地区”,那么当该“名称——地区”映射于事实表和维度表中的“宝安”、“深圳”、“温州”等地区的同一类数据时,即相应数据在“名称——地区”维度下存在“宝安”、“深圳”、“温州”等分布项,可以对该类数据进行数据分布的统计计算,使得用户通过图7所示的数据查询页面,可以查看到“宝安”、“深圳”、“温州”等分布项区分别对应的数据分布状况,例如“宝安”对应于2.69%、“深圳”对应于2.43%、“温州”对应于2.35%等,以便于用户通过对上述数据分布状况的参考,进一步选取感兴趣的分布项来生成数据查询条件,比如仅选取“宝安”和“深圳”,那么后续查询时就可以忽略“温州”对应的数据,从而降低查询数据量、缩短查询时间。其中,对于多个分布项(如上述的“宝安”、“深圳”、“温州”等)的数据分布状况,可以按照相应的分布数据的数值高低进行排列,比如图7中按照数值从高到低的顺序进行排列,以便于用户的查看和选择。
类似地,如图8所示,假定预设维度包括图8所示的“名称——部门”,那么当该“名称——部门”映射于事实表和维度表中的“外贸服务三部”、“外贸服务一部”、“外贸服务二部”等部门的同一类数据时,可以对该类数据进行数据分布的统计计算和展示,此处不再赘述。
2)执行数据查询
步骤41,向用户展示语义信息,以由用户进行查看和选择所需的语义信息。
步骤42,根据用户选择的语义信息,生成相应的数据查询条件。
从前端的数据查询页面与用户之间的交互角度,图4示出了步骤41-42的具体处理流程,可以包括:
在步骤402中,显示数据查询页面,所述数据查询页面包括维度选择区域,所述维度选择区域中包含预定义的数据查询维度。
在本实施例中,如图5所示,在数据查询页面中包含“设置筛选条件”子页面或功能区块,使用户可以设置筛选条件,即数据查询条件,以用于对数据存储集合进行数据查询操作。该数据查询页面中包括图5所示的维度选择区域100,该维度选择区域100包括“名称”、“指标”、“关系”等一级维度,其中“名称”可以为默认的必选项,而用户还可以触发更多的一级维度。
当用户触发该一级维度时,以“名称”为例,可以示出图6所示的维度选择窗口200,该维度选择窗口200中包含若干预先配置好的二级维度,比如“地区”、“部门”等;当然,图6仅为维度选择窗口200的一种形式。用户可以选择一个二级维度,也可以同时选择多个二级维度。数据查询维度还可以包括更多层级,本申请并不对此进行限制。
在步骤404中,当检测到针对所述维度选择区域的第一选择操作时,根据被选中的数据查询维度,在所述数据查询页面示出项目展示窗口,所述项目展示窗口中包含所述数据存储集合中的数据在所述被选中的数据查询维度下的分布项,以及各个分布项的数据分布状况。
在本实施例中,假定用户选中的数据查询维度为“名称——地区”,如图7所示,数据查询页面中可以示出项目展示窗口300,该项目展示窗口300中包含该数据查询维度“名称——地区”下的分布项,包括“宝安”、“深圳”、“温州”等分布项,以及各个分布项的数据分布状况。
在步骤406中,当检测到针对所述分布项的第二选择操作时,根据被选中的分布项,生成针对所述数据存储集合的数据查询条件,以执行数据查询操作。
在本实施例中,如图7所示,用户可以从项目展示窗口300查看到各个分布项的数据分布状况,从而选择自己感兴趣的分布项,以缩小甚至大幅度缩小后续的数据查询范围、提升查询效率和精准度。
在上述图5-7所示的实施例中,各个层级的数据查询维度和相应的分布项,均属于上述步骤31中建立的语义层中的语义信息。可见,该语义信息实际上包括多个层级:数据查询维度层级和分布项层级;而从数据查询维度层面,可以进而包括一个或多个层级,比如上述的“一级维度”、“二级维度”等;从分布项层面,也可以进而包括一个或多个层级,比如以“宝安”为“一级分布项”,进而创建“新安”、“西乡”等若干“二级分布项”等。
与上述图5-7所示实施例相类似地,在图8所示的实施例中,假定用户在维度选择区域100选取“名称——部门”为数据查询维度,则相应的项目展示窗口300中示出“外贸服务三部”、“外贸服务一部”等分布项及其数据分布状况,以供用户进行选择,此处不再赘述。
进一步地,在步骤42中,还可以将数据查询条件翻译为预设格式的查询语句。在该实施例中,比如可以将数据查询条件翻译为SQL语句;基于SQL语句的通用性,使得信息查询引擎和数据获取引擎均可以通过执行该SQL语句来实现查询操作,从而可以屏蔽信息查询引擎和数据获取引擎之间的语法差异,有助于简化处理流程。当然,对于除SQL之外的其他语言,也可以应用于本申请的技术方案中,本申请并不对此进行限制。
步骤51,通过调用信息查询引擎来执行SQL语句,以实现实时检索并得到相应的查询结果。
步骤52,通过调用数据获取引擎来执行SQL语句,以实现离线计算并得到相应的数据文件。
在本实施例中,通过信息查询引擎可以满足对少量数据的查询需求,通过实时检索并展示出相应的预览数据,以供用户预览查看,方便其确定是否为感兴趣的数据。同时,通过数据获取引擎可以满足对大量数据的下载导出需求,尤其是当数据获取引擎采用分布式引擎时,可以充分利用分布式架构的高速计算优势,从而快速导出大量数据,有助于缩短用户的等待时间。
对于上述步骤51与步骤52之间,可以采用多种执行逻辑,下面进行举例说明:
实施例一
作为一示例性实施例,可以首先调用信息查询引擎执行查询语句(如SQL语句),以获得并展示查询结果;然后,根据接收到的对查询结果的用户确认指令,调用数据获取引擎执行上述的查询语句,以获得并输出查询到的数据文件。
在本实施例中,依次执行步骤51和步骤52。其中,通过首先执行步骤51,可以得到对少量数据的查询结果,使得用户可以在极短的时间内查看到相应的预览数据,并据此确定相应的数据文件是否为自身所需要或所感兴趣的对象,从而确定是否需要下载导出这些数据文件。那么,当用户确定需要下载导出相应的数据文件后,可以发出相应的用户确认指令,使得数据获取引擎通过执行上述的SQL语句,从而下载和导出相应的大量数据文件。
在另一类似的处理流程中,根据用户选择的语义条件和相应的SQL语句,信息查询引擎和数据获取引擎可以同时执行相应的查询操作,以分别获得实时(或相对具有更高的实时性)检索的查询结果和离线下载的大量数据文件;那么,当用户确实需要获得相应的数据文件时,可以最大程度地减少用户的等待时间(可以减少从用户选中语义信息至输入上述的用户确认指令之间的时间)。
当然,由于用户并不每次都能够一次确定所需下载的数据文件,即用户往往需要经过一次或多次尝试性的搜索后,才能够通过对实时检索到的预览数据进行查看后,确定自己所需下载导出的数据文件(图3中的离线文件),因而通过在接收到的用户确认指令后执行步骤52,可以避免对相应运算资源(即自动执行了步骤52,但用户实际上并不需要相应的数据文件)的浪费,确保对运算资源的合理分配。
实施例二
作为另一示例性实施例,在将数据查询条件翻译为预设格式的查询语句(如上述的SQL语句)后,由信息查询引擎通过执行该查询语句,以获得相应的查询结果;然后,根据接收到的对该查询结果的用户选取指令,结合被选中的查询结果对象和上述的数据查询条件,获得更新后的查询语句,则数据获取引擎通过执行该更新后的查询语句,以获得查询到的数据文件。
在本实施例中,由于信息查询引擎检索到的数据并非都是用户所需数据,比如用户可能仅对前三页的查询结果对象感兴趣,但实际上信息查询引擎检索到的查询结果包括100页数据,那么如果数据获取引擎直接执行与信息查询引擎完全相同的SQL语句,将导致下载导出的大部分数据文件都是无用数据,从而造成对运算资源的浪费。
因此,在上述实施例一的基础上,本实施例中可以根据接收到的用户选取指令对信息查询引擎检索到的查询结果进行筛选,比如在100页数据中仅选取用户感兴趣的三页数据,那么可以根据被选中的查询结果对象(如被选中的三页数据)和用户最初选取的语义信息,生成更新后的查询语句,比如更新后的SQL语句,使得数据获取引擎通过执行该更新后的SQL语句,可以仅下载和导出上述被选中的三页数据,而无需下载用户不感兴趣的其他97页数据,从而既避免了对运算资源的大量浪费,还能够极大地缩短用户的等待时长。
下面结合一具体场景的实施例,针对图8所示的搜索页面,对本申请的搜索方案进行说明:
假定对于某个网络交易平台,运营人员经常需要从该网络交易平台对应的海量数据中获取自己关心的数据进行分析或运营。由于网络交易平台涉及到的交易人员和交易业务十分频繁,因而会产生海量数据,比如达到数亿条数据。
例如,某位运营人员希望从该网络交易平台中导出(即下载)交易量较高的部门相关的交易数据,该交易数据可能达到数百万条。如图8所示,假定交易数据在该运营人员输入的“部门”维度下,分布于“外贸服务一部”、“外贸服务二部”、“外贸服务三部”……“外贸服务x部”等,那么在相关技术中,该运营人员必须将所有这些部门相关的交易数据均进行下载。
但是,该运营人员实际上可能仅关心部分数据比例较高的部门的交易数据,那么其他数据实际上会造成相关数据搜索和下载资源的浪费,而且还会给该运营人员带来后续的数据筛选等额外工作,造成数据分析处理的效率降低。
因此,如图8所示,通过在执行搜索和下载等操作之前,根据该运营人员选取的维度,可以将预先(对应于如图3所示的步骤32)生成的数据分布状况(即在各个分布项的数据分布比例)展示给该运营人员,例如交易数据在“外贸服务三部”的数据分布比例为5.89%、交易数据在“外贸服务一部”的数据分布比例为5.34%、交易数据在“外贸服务二部”的数据分布比例为4.02%等。
那么,该运营人员可以仅选取数据分布比例较高的分布项,比如设置比例阈值为5%,即数据分布比例高于5%时判定为数据分布比例较高,从而仅需要查询及下载“外贸服务三部”和“外贸服务一部”对应的交易数据,而不需要查询及下载诸如“外贸服务二部”等其他部门对应的交易数据,一方面有助于节省查询及下载所需的处理资源,另一方面使得运营人员得到的交易数据更加具有针对性、更加符合其实际需求,有助于提升对交易数据的分析处理效率。
图9示出了根据本申请的一示例性实施例的电子设备的示意结构图。请参考图9,在硬件层面,该电子设备包括处理器902、内部总线904、网络接口906、内存908以及非易失性存储器910,当然还可能包括其他业务所需要的硬件。处理器902从非易失性存储器910中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成数据查询装置。当然,除了软件实现方式之外,本申请并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
请参考图10,在软件实施方式中,该数据查询装置可以包括获取单元1002、展示单元1004和生成单元1006。其中:
获取单元1002,获取用户针对数据存储集合输入的数据查询维度;
展示单元1004,根据所述数据存储集合中的数据在所述数据查询维度下的分布项,展示各个分布项的数据分布状况;
生成单元1006,根据被选中的分布项,生成针对所述数据存储集合的数据查询条件,以执行数据查询操作。
可选的,还包括:
调用单元1008,调用预配置的信息查询引擎和数据获取引擎,并分别根据所述数据查询条件对所述数据存储集合执行搜索操作;
输出单元1010,展示由所述信息查询引擎得到的查询结果,以及输出所述数据获取引擎得到的数据文件。
可选的,还包括:
翻译单元1012,将所述数据查询条件翻译为预设格式的查询语句;
其中,所述调用单元1008使所述信息查询引擎和所述数据获取引擎通过执行所述查询语句,以分别获得所述查询结果和所述数据文件。
图11示出了根据本申请的一示例性实施例的电子设备的示意结构图。请参考图11,在硬件层面,该电子设备包括处理器1102、内部总线1104、网络接口1106、内存1108以及非易失性存储器1110,当然还可能包括其他业务所需要的硬件。处理器1102从非易失性存储器1110中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成数据查询装置。当然,除了软件实现方式之外,本申请并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
请参考图12,在软件实施方式中,该数据查询装置可以包括页面显示单元1202、窗口显示单元1204和条件生成单元1206。其中:
页面显示单元1202,显示数据查询页面,所述数据查询页面包括维度选择区域,所述维度选择区域中包含预定义的数据查询维度;
窗口显示单元1204,当检测到针对所述维度选择区域的第一选择操作时,根据被选中的数据查询维度,在所述数据查询页面示出项目展示窗口,所述项目展示窗口中包含所述数据存储集合中的数据在所述被选中的数据查询维度下的分布项,以及各个分布项的数据分布状况;
条件生成单元1206,当检测到针对所述分布项的第二选择操作时,根据被选中的分布项,生成针对所述数据存储集合的数据查询条件,以执行数据查询操作。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (12)

1.一种数据查询方法,其特征在于,包括:
获取用户针对数据存储集合输入的数据查询维度;
根据所述数据存储集合中的数据在所述数据查询维度下的分布项,展示各个分布项的数据分布状况;
根据被选中的分布项,生成针对所述数据存储集合的数据查询条件,以执行数据查询操作。
2.根据权利要求1所述的方法,其特征在于,所述分布项为根据所述数据存储集合中的数据创建的语义层中的语义信息,其中所述语义层为所述语义信息与所述数据存储集合中相应数据之间的映射关系信息。
3.根据权利要求1所述的方法,其特征在于,还包括:
调用预配置的信息查询引擎和数据获取引擎,并分别根据所述数据查询条件对所述数据存储集合执行搜索操作;
展示由所述信息查询引擎得到的查询结果,以及输出所述数据获取引擎得到的数据文件。
4.根据权利要求3所述的方法,其特征在于,还包括:
将所述数据查询条件翻译为预设格式的查询语句;
其中,所述信息查询引擎和所述数据获取引擎通过执行所述查询语句,以分别获得所述查询结果和所述数据文件。
5.根据权利要求4所述的方法,其特征在于,所述调用预配置的信息查询引擎和数据获取引擎,并分别根据所述数据查询条件对所述数据集合执行搜索操作,包括:
调用所述信息查询引擎执行所述查询语句,以获得并展示所述查询结果;
根据接收到的对所述查询结果的用户确认指令,调用所述数据获取引擎执行所述查询语句,以获得并输出查询到的数据文件。
6.根据权利要求3所述的方法,其特征在于,还包括:
将所述数据查询条件翻译为预设格式的查询语句;其中,所述信息查询引擎通过执行所述查询语句,以获得所述查询结果;
根据接收到的对所述查询结果的用户选取指令,结合被选中的查询结果对象和所述数据查询条件,获得更新后的查询语句;其中,所述数据获取引擎通过执行所述更新后的查询语句,以获得查询到的数据文件。
7.根据权利要求3所述的方法,其特征在于,所述数据存储集合存储于分布式计算平台,所述数据获取引擎为配合于所述分布式计算平台的分布式引擎。
8.一种数据查询装置,其特征在于,包括:
获取单元,获取用户针对数据存储集合输入的数据查询维度;
展示单元,根据所述数据存储集合中的数据在所述数据查询维度下的分布项,展示各个分布项的数据分布状况;
生成单元,根据被选中的分布项,生成针对所述数据存储集合的数据查询条件,以执行数据查询操作。
9.根据权利要求8所述的装置,其特征在于,还包括:
调用单元,调用预配置的信息查询引擎和数据获取引擎,并分别根据所述数据查询条件对所述数据存储集合执行搜索操作;
输出单元,展示由所述信息查询引擎得到的查询结果,以及输出所述数据获取引擎得到的数据文件。
10.根据权利要求9所述的装置,其特征在于,还包括:
翻译单元,将所述数据查询条件翻译为预设格式的查询语句;
其中,所述调用单元使所述信息查询引擎和所述数据获取引擎通过执行所述查询语句,以分别获得所述查询结果和所述数据文件。
11.一种数据查询方法,其特征在于,包括:
显示数据查询页面,所述数据查询页面包括维度选择区域,所述维度选择区域中包含预定义的数据查询维度;
当检测到针对所述维度选择区域的第一选择操作时,根据被选中的数据查询维度,在所述数据查询页面示出项目展示窗口,所述项目展示窗口中包含所述数据存储集合中的数据在所述被选中的数据查询维度下的分布项,以及各个分布项的数据分布状况;
当检测到针对所述分布项的第二选择操作时,根据被选中的分布项,生成针对所述数据存储集合的数据查询条件,以执行数据查询操作。
12.一种数据查询装置,其特征在于,包括:
页面显示单元,显示数据查询页面,所述数据查询页面包括维度选择区域,所述维度选择区域中包含预定义的数据查询维度;
窗口显示单元,当检测到针对所述维度选择区域的第一选择操作时,根据被选中的数据查询维度,在所述数据查询页面示出项目展示窗口,所述项目展示窗口中包含所述数据存储集合中的数据在所述被选中的数据查询维度下的分布项,以及各个分布项的数据分布状况;
条件生成单元,当检测到针对所述分布项的第二选择操作时,根据被选中的分布项,生成针对所述数据存储集合的数据查询条件,以执行数据查询操作。
CN201610429851.7A 2016-06-16 2016-06-16 数据查询方法及装置 Pending CN107515875A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610429851.7A CN107515875A (zh) 2016-06-16 2016-06-16 数据查询方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610429851.7A CN107515875A (zh) 2016-06-16 2016-06-16 数据查询方法及装置

Publications (1)

Publication Number Publication Date
CN107515875A true CN107515875A (zh) 2017-12-26

Family

ID=60721236

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610429851.7A Pending CN107515875A (zh) 2016-06-16 2016-06-16 数据查询方法及装置

Country Status (1)

Country Link
CN (1) CN107515875A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108536853A (zh) * 2018-04-11 2018-09-14 上海驰骛信息科技有限公司 一种基于查询资源与精确度的自动路由数据库查询系统及方法
CN108874926A (zh) * 2018-05-31 2018-11-23 康键信息技术(深圳)有限公司 海量数据查询方法、装置、计算机设备和存储介质
CN109063178A (zh) * 2018-08-22 2018-12-21 四川新网银行股份有限公司 一种自动扩展的自助分析报表的方法及装置
CN109815351A (zh) * 2018-12-27 2019-05-28 深圳云天励飞技术有限公司 信息查询方法及相关产品
CN110083624A (zh) * 2019-03-18 2019-08-02 北京奇艺世纪科技有限公司 流数据处理方法、设备、数据处理设备、计算机介质
CN111831882A (zh) * 2019-04-16 2020-10-27 阿里巴巴集团控股有限公司 一种查询交互方法及装置
CN115686702A (zh) * 2022-08-24 2023-02-03 北京数美时代科技有限公司 一种数据拉取方法、系统、存储介质和电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1858743A (zh) * 2006-03-10 2006-11-08 华为技术有限公司 关系型数据库中信息检索方法及装置
CN101599087A (zh) * 2009-07-02 2009-12-09 金蝶软件(中国)有限公司 数据查询方法和装置
CN102682118A (zh) * 2012-05-15 2012-09-19 北京久其软件股份有限公司 一种多维数据模型访问方法及装置
CN104809254A (zh) * 2015-05-19 2015-07-29 郑州悉知信息技术有限公司 一种数据查询方法及装置
CN105468651A (zh) * 2014-09-12 2016-04-06 阿里巴巴集团控股有限公司 一种关系数据库数据查询方法及系统
US20160110426A1 (en) * 2014-10-20 2016-04-21 International Business Machines Corporation Selectivity estimation for query execution planning in a database
US20160147880A1 (en) * 2014-11-25 2016-05-26 Daniel Scheibli Multi-dimensional visualization of query execution in distributed databases

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1858743A (zh) * 2006-03-10 2006-11-08 华为技术有限公司 关系型数据库中信息检索方法及装置
CN101599087A (zh) * 2009-07-02 2009-12-09 金蝶软件(中国)有限公司 数据查询方法和装置
CN102682118A (zh) * 2012-05-15 2012-09-19 北京久其软件股份有限公司 一种多维数据模型访问方法及装置
CN105468651A (zh) * 2014-09-12 2016-04-06 阿里巴巴集团控股有限公司 一种关系数据库数据查询方法及系统
US20160110426A1 (en) * 2014-10-20 2016-04-21 International Business Machines Corporation Selectivity estimation for query execution planning in a database
US20160147880A1 (en) * 2014-11-25 2016-05-26 Daniel Scheibli Multi-dimensional visualization of query execution in distributed databases
CN104809254A (zh) * 2015-05-19 2015-07-29 郑州悉知信息技术有限公司 一种数据查询方法及装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108536853A (zh) * 2018-04-11 2018-09-14 上海驰骛信息科技有限公司 一种基于查询资源与精确度的自动路由数据库查询系统及方法
CN108874926A (zh) * 2018-05-31 2018-11-23 康键信息技术(深圳)有限公司 海量数据查询方法、装置、计算机设备和存储介质
CN109063178A (zh) * 2018-08-22 2018-12-21 四川新网银行股份有限公司 一种自动扩展的自助分析报表的方法及装置
CN109063178B (zh) * 2018-08-22 2019-12-24 四川新网银行股份有限公司 一种自动扩展的自助分析报表的方法及装置
CN109815351A (zh) * 2018-12-27 2019-05-28 深圳云天励飞技术有限公司 信息查询方法及相关产品
CN110083624A (zh) * 2019-03-18 2019-08-02 北京奇艺世纪科技有限公司 流数据处理方法、设备、数据处理设备、计算机介质
CN110083624B (zh) * 2019-03-18 2021-11-12 北京奇艺世纪科技有限公司 流数据处理方法、设备、数据处理设备、计算机介质
CN111831882A (zh) * 2019-04-16 2020-10-27 阿里巴巴集团控股有限公司 一种查询交互方法及装置
CN115686702A (zh) * 2022-08-24 2023-02-03 北京数美时代科技有限公司 一种数据拉取方法、系统、存储介质和电子设备

Similar Documents

Publication Publication Date Title
CN107515875A (zh) 数据查询方法及装置
CN106682097B (zh) 一种处理日志数据的方法和装置
EP3718000B1 (en) Spreadsheet-based software application development
US8712990B2 (en) Methods and systems for providing a business repository
US20100094843A1 (en) Association of semantic objects with linguistic entity categories
US7702609B2 (en) Adapting to inexact user input
US10311364B2 (en) Predictive intelligence for service and support
US9009850B2 (en) Database management by analyzing usage of database fields
CN110795524A (zh) 主数据映射处理方法、装置、计算机设备及存储介质
WO2019100645A1 (zh) 实现多级联动下拉框的方法、电子装置及存储介质
US10332010B2 (en) System and method for automatically suggesting rules for data stored in a table
CN113157947A (zh) 知识图谱的构建方法、工具、装置和服务器
US9031893B2 (en) Best match processing mode of decision tables
US11030211B2 (en) Migrating page layout representations of database entries
US20080147457A1 (en) Systems and methods for handling attributes used for assignment generation in a value flow environment
US9773003B2 (en) Computer implemented system and method for investigative data analytics
CN109101512B (zh) 法律数据库的构建方法、法律数据查询方法及装置
CN110928903A (zh) 数据提取方法及装置、设备和存储介质
CN107871055B (zh) 一种数据分析方法和装置
JP5457316B2 (ja) レポート作成装置およびそのプログラム
US8504552B2 (en) Query based paging through a collection of values
EP4002152A1 (en) Data tagging and synchronisation system
US20140101154A1 (en) Simplifying grouping of data items stored in a database
US11599919B2 (en) Information exchange using a database system
CN117240819B (zh) 邮件配置方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20171226

RJ01 Rejection of invention patent application after publication