CN107291932A - 一种数据查询方法和装置 - Google Patents

一种数据查询方法和装置 Download PDF

Info

Publication number
CN107291932A
CN107291932A CN201710525440.2A CN201710525440A CN107291932A CN 107291932 A CN107291932 A CN 107291932A CN 201710525440 A CN201710525440 A CN 201710525440A CN 107291932 A CN107291932 A CN 107291932A
Authority
CN
China
Prior art keywords
data
hot
dimension
source
inquiry request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710525440.2A
Other languages
English (en)
Other versions
CN107291932B (zh
Inventor
倪传蕾
马庆祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201710525440.2A priority Critical patent/CN107291932B/zh
Publication of CN107291932A publication Critical patent/CN107291932A/zh
Application granted granted Critical
Publication of CN107291932B publication Critical patent/CN107291932B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据查询方法和装置,所述方法包括:接收对指定数据源的数据查询请求;判断该数据查询请求是否命中一个热门数据源;所述热门数据源包含从所述指定数据源中提取出的热门数据,所述热门数据是根据多个数据查询请求确定的;若该数据查询请求命中一个热门数据源,则在命中的热门数据源中执行所述数据查询请求,并返回相应的查询结果。该技术方案通过减少数据查询时需要检索的数据量,在保证数据查询质量的前提下,大幅提高了数据查询效率。

Description

一种数据查询方法和装置
技术领域
本发明涉及数据查询技术领域,具体涉及一种数据查询方法和装置。
背景技术
在大数据场景下如何实现高效的数据查询是一个受到广泛关注的问题,针对该问题也有了一些解决方案,例如有的数据查询系统偏重解决高并发问题,有的数据查询系统偏重于降低查询延迟,但普遍来说,无论是哪种数据查询系统,所离不开的基础是数据源,而大数据场景下的数据源中存储着的海量数据是数据查询中绕不开的一个阻碍。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的数据查询方法和装置。
依据本发明的一个方面,提供了一种数据查询方法,包括:
接收对指定数据源的数据查询请求;
判断该数据查询请求是否命中一个热门数据源;所述热门数据源包含从所述指定数据源中提取出的热门数据,所述热门数据是根据多个数据查询请求确定的;
若该数据查询请求命中一个热门数据源,则在命中的热门数据源中执行所述数据查询请求,并返回相应的查询结果。
可选地,该方法还包括:
对接收到的数据查询请求进行记录;
对各数据源,从记录的数据查询请求中分析出该数据源的至少一个热门数据维度集合;
从各数据源中分别提取出各热门数据维度集合下的数据作为热门数据,并对应保存为热门数据源。
可选地,所述从记录的数据查询请求中分析出该数据源的至少一个热门数据维度集合包括:
对各数据查询请求,分别从该数据查询请求中提取出包含至少一个数据维度的数据维度集合;
对提取出的所有数据维度集合数量进行统计,将统计数量不小于预设阈值的数据维度集合作为热门数据维度集合。
可选地,所述从各数据源中分别提取出各热门数据维度集合下的数据作为热门数据,并对应保存为热门数据源包括:
按各热门数据维度集合中的数据维度,在各数据源中分别提取出相应数据维度下的数据作为热门数据;
将一个热门数据维度集合对应的热门数据按数据维度进行列式存储,得到一个热门数据源;
将各热门数据源所对应的热门数据集合保存到索引信息中。
可选地,所述判断该数据查询请求是否命中一个热门数据源包括:
从该数据查询请求中提取出包含至少一个数据维度的数据维度集合;
查询所述索引信息,判断该提取出的数据维度集合是否是任一个热门数据维度集合的子集;若是,则判断该数据查询请求命中与该热门数据维度集合对应的热门数据源。
可选地,当提取出的数据维度集合是多个热门数据维度集合的子集时,将所述多个热门数据维度集合中数据维度数量最少的一个热门数据维度集合对应的热门数据源作为该数据查询请求命中的热门数据源;当所述多个热门数据维度集合中数据维度数量最少的热门数据维度集合有多个时,从中随机选取一个热门数据维度集合,将该热门数据维度集合对应的热门数据源作为该数据查询请求命中的热门数据源。
可选地,所述数据查询请求是聚合查询请求;
所述按将一个热门数据维度集合对应的热门数据按数据维度进行列式存储包括:
根据各数据维度下的数据的数据类型,确定各数据维度下的数据在进行列式存储时对应的列的属性。
可选地,所述接收对指定数据源的数据查询请求包括:
为多个数据源提供统一的数据查询页面,在所述数据查询页面中接收对所述多个数据源中的指定数据源的数据查询请求。
依据本发明的另一方面,提供了一种数据查询装置,包括:
接收单元,适于接收对指定数据源的数据查询请求;
判断单元,适于判断该数据查询请求是否命中一个热门数据源;所述热门数据源包含从所述指定数据源中提取出的热门数据,所述热门数据是根据多个数据查询请求确定的;
查询单元,适于在该数据查询请求命中一个热门数据源时,在命中的热门数据源中执行所述数据查询请求,并返回相应的查询结果。
可选地,该装置还包括:
记录单元,适于对接收到的数据查询请求进行记录;
热门数据源生成单元,适于对各数据源,从记录的数据查询请求中分析出该数据源的至少一个热门数据维度集合;从各数据源中分别提取出各热门数据维度集合下的数据作为热门数据,并对应保存为热门数据源。
可选地,所述热门数据源生成单元,适于对各数据查询请求,分别从该数据查询请求中提取出包含至少一个数据维度的数据维度集合;对提取出的所有数据维度集合数量进行统计,将统计数量不小于预设阈值的数据维度集合作为热门数据维度集合。
可选地,所述热门数据源生成单元,适于按各热门数据维度集合中的数据维度,在各数据源中分别提取出相应数据维度下的数据作为热门数据;将一个热门数据维度集合对应的热门数据按数据维度进行列式存储,得到一个热门数据源;将各热门数据源所对应的热门数据集合保存到索引信息中。
可选地,所述判断单元,适于从该数据查询请求中提取出包含至少一个数据维度的数据维度集合;查询所述索引信息,判断该提取出的数据维度集合是否是任一个热门数据维度集合的子集;若是,则判断该数据查询请求命中与该热门数据维度集合对应的热门数据源。
可选地,所述判断单元,适于当提取出的数据维度集合是多个热门数据维度集合的子集时,将所述多个热门数据维度集合中数据维度数量最少的一个热门数据维度集合对应的热门数据源作为该数据查询请求命中的热门数据源;当所述多个热门数据维度集合中数据维度数量最少的热门数据维度集合有多个时,从中随机选取一个热门数据维度集合,将该热门数据维度集合对应的热门数据源作为该数据查询请求命中的热门数据源。
可选地,所述数据查询请求是聚合查询请求;
所述热门数据源生成单元,适于根据各数据维度下的数据的数据类型,确定各数据维度下的数据在进行列式存储时对应的列的属性。
可选地,所述接收单元,适于为多个数据源提供统一的数据查询页面,在所述数据查询页面中接收对所述多个数据源中的指定数据源的数据查询请求。
由上述可知,本发明的技术方案,通过预先根据数据查询请求,得到包含热门数据的热门数据源,在接收到能够命中热门数据源的数据查询请求时,不在该数据源查询请求所指定的数据源中进行查询,而是在数据量较少的热门数据源中查询出结果。该技术方案通过减少数据查询时需要检索的数据量,在保证数据查询质量的前提下,大幅提高了数据查询效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的一种数据查询方法的流程示意图;
图2示出了根据本发明一个实施例的一种数据查询装置的结构示意图;
图3示出了根据本发明一个实施例的另一种数据查询装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的一种数据查询方法的流程示意图,如图1所示包括:
步骤S110,接收对指定数据源的数据查询请求。
其中,数据查询请求可以是SQL语句等数据查询语句,指定的数据源(datasource)可以是数据库中的数据表。
步骤S120,判断该数据查询请求是否命中一个热门数据源;热门数据源包含从指定数据源中提取出的热门数据,热门数据是根据多个数据查询请求确定的。
热门数据可以是用户在一段时间内经常查询的数据,也就是说,热门数据是其所在的数据源中的部分数据。具体地,可以根据用户发送的数据查询请求确定哪些数据是热门数据。
步骤S130,若该数据查询请求命中一个热门数据源,则在命中的热门数据源中执行数据查询请求,并返回相应的查询结果。
如果没有命中热门数据源,则在指定数据源中执行数据查询请求。
可见,图1所示的方法,通过预先根据数据查询请求,得到包含热门数据的热门数据源,在接收到能够命中热门数据源的数据查询请求时,不在该数据源查询请求所指定的数据源中进行查询,而是在数据量较少的热门数据源中查询出结果。该技术方案通过减少数据查询时需要检索的数据量,在保证数据查询质量的前提下,大幅提高了数据查询效率。
在上面的实施例中简单提及了可以根据用户发送的数据查询请求确定哪些数据是热门数据。在下面的实施例中给出了一种具体的实施示例:在本发明的一个实施例中,上述方法还包括:对接收到的数据查询请求进行记录;对各数据源,从记录的数据查询请求中分析出该数据源的至少一个热门数据维度集合;从各数据源中分别提取出各热门数据维度集合下的数据作为热门数据,并对应保存为热门数据源。
数据查询请求可能涉及多个数据维度(例如姓名、年龄、性别……),而如果提供的数据源缺少其中的若干个维度,那么该数据查询请求是无法完成的。因此,在本实施例中,会按用户经常查询的数据维度,将一个或多个数据维度下的数据作为一个整体,保存为热门数据源。
具体地,在本发明的一个实施例中,上述方法中,从记录的数据查询请求中分析出该数据源的至少一个热门数据维度集合包括:对各数据查询请求,分别从该数据查询请求中提取出包含至少一个数据维度的数据维度集合;对提取出的所有数据维度集合数量进行统计,将统计数量不小于预设阈值的数据维度集合作为热门数据维度集合。
其中,可以在记录时为每个数据查询请求添加时间戳,并统计一段时间内的数据查询请求。其中,只有包含的数据维度全部一致的数据维度集合才能被视为同一个数据维度集合。例如,数据维度集合A包括数据维度a和b,数据维度集合B包括数据维度a、b和c,那么这是两个不同的数据维度集合。
在本发明的一个实施例中,上述方法中,从各数据源中分别提取出各热门数据维度集合下的数据作为热门数据,并对应保存为热门数据源包括:按各热门数据维度集合中的数据维度,在各数据源中分别提取出相应数据维度下的数据作为热门数据;将一个热门数据维度集合对应的热门数据按数据维度进行列式存储,得到一个热门数据源;将各热门数据源所对应的热门数据集合保存到索引信息中。
例如,数据源1中的热门维度集合为{年龄,性别},{姓名,年龄,性别},则提取出姓名、年龄、性别这三个数据维度下的数据,并把年龄、性别这两个数据维度下的数据保存为热门数据源1,把姓名、年龄、性别这两个数据维度下的数据保存为热门数据源2。并把每个热门数据源对应的热门数据维度集合保存到索引信息中。这样虽然存储的数据量更大了,但是可以大大降低数据查询所需的时间,是一种“空间换时间”的技术构思。
得到了这样的热门数据源后,在本发明的一个实施例中,上述方法中,判断该数据查询请求是否命中一个热门数据源包括:从该数据查询请求中提取出包含至少一个数据维度的数据维度集合;查询索引信息,判断该提取出的数据维度集合是否是任一个热门数据维度集合的子集;若是,则判断该数据查询请求命中与该热门数据维度集合对应的热门数据源。
例如,新的数据查询请求中包含姓名、性别这两个数据维度,那么就形成了{姓名,性别}这样的一个数据维度集合,该数据维度集合是热门数据维度集合{姓名,年龄,性别}的子集,那么该数据查询请求所需要查询的数据都在相应的热门数据源中,就可以不在该数据查询请求所指定的数据源中进行查询了。
而如果新的数据查询请求中仅包含性别这个数据维度,那么相应的数据维度集合{性别}就同时是{年龄,性别}和{姓名,年龄,性别}这两个热门数据维度集合的子集,也就是在相应的两个热门数据源中进行查询均可。不过如果为了进一步减少查询时间,在本发明的一个实施例中,上述方法中,当提取出的数据维度集合是多个热门数据维度集合的子集时,将多个热门数据维度集合中数据维度数量最少的一个热门数据维度集合对应的热门数据源作为该数据查询请求命中的热门数据源;当多个热门数据维度集合中数据维度数量最少的热门数据维度集合有多个时,从中随机选取一个热门数据维度集合,将该热门数据维度集合对应的热门数据源作为该数据查询请求命中的热门数据源。
也就是说,由于{年龄,性别}这个热门数据维度集合所对应的热门数据源的数据量更小,因此在其中进行查询的速度也就更快。而如果还存在{性别,职业}这样一个热门数据维度集合时,由于该热门数据维度集合与{年龄,性别}这个热门数据维度集合所包含的数据维度数量都是2,那么可以从这两个热门数据维度集合所对应的热门数据源中随机指定一个。
大数据场景下,许多数据查询请求是需要进行求和、求均值等聚合运算的,例如“一个月内安卓手机用户点击广告A的总次数”,其中不仅涉及安卓系统、广告A、点击次数这三个数据维度,还需要进行sum这一求和运算,而只有其中涉及的点击次数这一个数据维度下的数据是可以进行聚合运算的,其他数据维度只能作为筛选条件。因此在本发明的一个实施例中,上述方法中,数据查询请求是聚合查询请求;按将一个热门数据维度集合对应的热门数据按数据维度进行列式存储包括:根据各数据维度下的数据的数据类型,确定各数据维度下的数据在进行列式存储时对应的列的属性。
也就是说,对于性别、职业等用字符串型记录的数据,不支持直接进行聚合运算,可以在存储时将其划分为维度列;而点击次数、年龄等用数值型记录的数据,可以直接进行聚合运算,可以在存储时将其划分为聚合列。
在本发明的一个实施例中,上述方法中,接收对指定数据源的数据查询请求包括:为多个数据源提供统一的数据查询页面,在数据查询页面中接收对多个数据源中的指定数据源的数据查询请求。
在本实施例中对于多个数据源的数据查询请求,可以以同一个数据查询页面来进行接收,这样即使用户希望访问的数据源不同,其都可以通过登录同一个页面来输入自己的数据查询请求,例如,访问同一个地址来获取数据查询页面。而用户也不需要关心数据是否是在指定的数据源中进行查询,因为有可能热门数据源就能够满足用户的查询需求。查询结果同样可以通过数据查询页面来呈现给用户,并且还可以支持以预设格式的图表来呈现。
图2示出了根据本发明一个实施例的一种数据查询装置的结构示意图,如图2所示,数据查询装置200包括:
接收单元210,适于接收对指定数据源的数据查询请求。
判断单元220,适于判断该数据查询请求是否命中一个热门数据源;热门数据源包含从指定数据源中提取出的热门数据,热门数据是根据多个数据查询请求确定的。
查询单元230,适于在该数据查询请求命中一个热门数据源时,在命中的热门数据源中执行数据查询请求,并返回相应的查询结果。
可见,图2所示的装置,在各单元的相互配合下,通过预先根据数据查询请求,得到包含热门数据的热门数据源,在接收到能够命中热门数据源的数据查询请求时,不在该数据源查询请求所指定的数据源中进行查询,而是在数据量较少的热门数据源中查询出结果。该技术方案通过减少数据查询时需要检索的数据量,在保证数据查询质量的前提下,大幅提高了数据查询效率。
图3示出了根据本发明一个实施例的另一种数据查询装置的结构示意图,如图3所示,数据查询装置300除了包括与图2中连接关系和功能相同的接收单元210、判断单元220和查询单元230外,还包括:记录单元340,适于对接收到的数据查询请求进行记录;热门数据源生成单元350,适于对各数据源,从记录的数据查询请求中分析出该数据源的至少一个热门数据维度集合;从各数据源中分别提取出各热门数据维度集合下的数据作为热门数据,并对应保存为热门数据源。
在本发明的一个实施例中,上述装置中,热门数据源生成单元350,适于对各数据查询请求,分别从该数据查询请求中提取出包含至少一个数据维度的数据维度集合;对提取出的所有数据维度集合数量进行统计,将统计数量不小于预设阈值的数据维度集合作为热门数据维度集合。
在本发明的一个实施例中,上述装置中,热门数据源生成单元350,适于按各热门数据维度集合中的数据维度,在各数据源中分别提取出相应数据维度下的数据作为热门数据;将一个热门数据维度集合对应的热门数据按数据维度进行列式存储,得到一个热门数据源;将各热门数据源所对应的热门数据集合保存到索引信息中。
在本发明的一个实施例中,上述装置中,判断单元220,适于从该数据查询请求中提取出包含至少一个数据维度的数据维度集合;查询索引信息,判断该提取出的数据维度集合是否是任一个热门数据维度集合的子集;若是,则判断该数据查询请求命中与该热门数据维度集合对应的热门数据源。
在本发明的一个实施例中,上述装置中,判断单元220,适于当提取出的数据维度集合是多个热门数据维度集合的子集时,将多个热门数据维度集合中数据维度数量最少的一个热门数据维度集合对应的热门数据源作为该数据查询请求命中的热门数据源;当多个热门数据维度集合中数据维度数量最少的热门数据维度集合有多个时,从中随机选取一个热门数据维度集合,将该热门数据维度集合对应的热门数据源作为该数据查询请求命中的热门数据源。
在本发明的一个实施例中,上述装置中,数据查询请求是聚合查询请求;热门数据源生成单元350,适于根据各数据维度下的数据的数据类型,确定各数据维度下的数据在进行列式存储时对应的列的属性。
在本发明的一个实施例中,上述装置中,接收单元210,适于为多个数据源提供统一的数据查询页面,在数据查询页面中接收对多个数据源中的指定数据源的数据查询请求。
需要说明的是,上述各装置实施例的具体实施方式与前述对应方法实施例的具体实施方式相同,在此不再赘述。
综上所述,本发明的技术方案,通过预先根据数据查询请求,得到包含热门数据的热门数据源,在接收到能够命中热门数据源的数据查询请求时,不在该数据源查询请求所指定的数据源中进行查询,而是在数据量较少的热门数据源中查询出结果。该技术方案通过减少数据查询时需要检索的数据量,在保证数据查询质量的前提下,大幅提高了数据查询效率。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的数据查询装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明的实施例公开了A1、一种数据查询方法,其中,该方法包括:
接收对指定数据源的数据查询请求;
判断该数据查询请求是否命中一个热门数据源;所述热门数据源包含从所述指定数据源中提取出的热门数据,所述热门数据是根据多个数据查询请求确定的;
若该数据查询请求命中一个热门数据源,则在命中的热门数据源中执行所述数据查询请求,并返回相应的查询结果。
A2、如A1所述的方法,其中,该方法还包括:
对接收到的数据查询请求进行记录;
对各数据源,从记录的数据查询请求中分析出该数据源的至少一个热门数据维度集合;
从各数据源中分别提取出各热门数据维度集合下的数据作为热门数据,并对应保存为热门数据源。
A3、如A2所述的方法,其中,所述从记录的数据查询请求中分析出该数据源的至少一个热门数据维度集合包括:
对各数据查询请求,分别从该数据查询请求中提取出包含至少一个数据维度的数据维度集合;
对提取出的所有数据维度集合数量进行统计,将统计数量不小于预设阈值的数据维度集合作为热门数据维度集合。
A4、如A2所述的方法,其中,所述从各数据源中分别提取出各热门数据维度集合下的数据作为热门数据,并对应保存为热门数据源包括:
按各热门数据维度集合中的数据维度,在各数据源中分别提取出相应数据维度下的数据作为热门数据;
将一个热门数据维度集合对应的热门数据按数据维度进行列式存储,得到一个热门数据源;
将各热门数据源所对应的热门数据集合保存到索引信息中。
A5、如A4所述的方法,其中,所述判断该数据查询请求是否命中一个热门数据源包括:
从该数据查询请求中提取出包含至少一个数据维度的数据维度集合;
查询所述索引信息,判断该提取出的数据维度集合是否是任一个热门数据维度集合的子集;若是,则判断该数据查询请求命中与该热门数据维度集合对应的热门数据源。
A6、如A5所述的方法,其中,
当提取出的数据维度集合是多个热门数据维度集合的子集时,将所述多个热门数据维度集合中数据维度数量最少的一个热门数据维度集合对应的热门数据源作为该数据查询请求命中的热门数据源;当所述多个热门数据维度集合中数据维度数量最少的热门数据维度集合有多个时,从中随机选取一个热门数据维度集合,将该热门数据维度集合对应的热门数据源作为该数据查询请求命中的热门数据源。
A7、如A4所述的方法,其中,所述数据查询请求是聚合查询请求;
所述按将一个热门数据维度集合对应的热门数据按数据维度进行列式存储包括:
根据各数据维度下的数据的数据类型,确定各数据维度下的数据在进行列式存储时对应的列的属性。
A8、如A1-A7中任一项所述的方法,其中,所述接收对指定数据源的数据查询请求包括:
为多个数据源提供统一的数据查询页面,在所述数据查询页面中接收对所述多个数据源中的指定数据源的数据查询请求。
本发明的实施例还公开了B9、一种数据查询装置,其中,该装置包括:
接收单元,适于接收对指定数据源的数据查询请求;
判断单元,适于判断该数据查询请求是否命中一个热门数据源;所述热门数据源包含从所述指定数据源中提取出的热门数据,所述热门数据是根据多个数据查询请求确定的;
查询单元,适于在该数据查询请求命中一个热门数据源时,在命中的热门数据源中执行所述数据查询请求,并返回相应的查询结果。
B10、如B9所述的装置,其中,该装置还包括:
记录单元,适于对接收到的数据查询请求进行记录;
热门数据源生成单元,适于对各数据源,从记录的数据查询请求中分析出该数据源的至少一个热门数据维度集合;从各数据源中分别提取出各热门数据维度集合下的数据作为热门数据,并对应保存为热门数据源。
B11、如B10所述的装置,其中,
所述热门数据源生成单元,适于对各数据查询请求,分别从该数据查询请求中提取出包含至少一个数据维度的数据维度集合;对提取出的所有数据维度集合数量进行统计,将统计数量不小于预设阈值的数据维度集合作为热门数据维度集合。
B12、如B10所述的装置,其中,
所述热门数据源生成单元,适于按各热门数据维度集合中的数据维度,在各数据源中分别提取出相应数据维度下的数据作为热门数据;将一个热门数据维度集合对应的热门数据按数据维度进行列式存储,得到一个热门数据源;将各热门数据源所对应的热门数据集合保存到索引信息中。
B13、如B12所述的装置,其中,
所述判断单元,适于从该数据查询请求中提取出包含至少一个数据维度的数据维度集合;查询所述索引信息,判断该提取出的数据维度集合是否是任一个热门数据维度集合的子集;若是,则判断该数据查询请求命中与该热门数据维度集合对应的热门数据源。
B14、如B13所述的装置,其中,
所述判断单元,适于当提取出的数据维度集合是多个热门数据维度集合的子集时,将所述多个热门数据维度集合中数据维度数量最少的一个热门数据维度集合对应的热门数据源作为该数据查询请求命中的热门数据源;当所述多个热门数据维度集合中数据维度数量最少的热门数据维度集合有多个时,从中随机选取一个热门数据维度集合,将该热门数据维度集合对应的热门数据源作为该数据查询请求命中的热门数据源。
B15、如B12所述的装置,其中,所述数据查询请求是聚合查询请求;
所述热门数据源生成单元,适于根据各数据维度下的数据的数据类型,确定各数据维度下的数据在进行列式存储时对应的列的属性。
B16、如B9-B15中任一项所述的装置,其中,
所述接收单元,适于为多个数据源提供统一的数据查询页面,在所述数据查询页面中接收对所述多个数据源中的指定数据源的数据查询请求。

Claims (10)

1.一种数据查询方法,其中,该方法包括:
接收对指定数据源的数据查询请求;
判断该数据查询请求是否命中一个热门数据源;所述热门数据源包含从所述指定数据源中提取出的热门数据,所述热门数据是根据多个数据查询请求确定的;
若该数据查询请求命中一个热门数据源,则在命中的热门数据源中执行所述数据查询请求,并返回相应的查询结果。
2.如权利要求1所述的方法,其中,该方法还包括:
对接收到的数据查询请求进行记录;
对各数据源,从记录的数据查询请求中分析出该数据源的至少一个热门数据维度集合;
从各数据源中分别提取出各热门数据维度集合下的数据作为热门数据,并对应保存为热门数据源。
3.如权利要求2所述的方法,其中,所述从记录的数据查询请求中分析出该数据源的至少一个热门数据维度集合包括:
对各数据查询请求,分别从该数据查询请求中提取出包含至少一个数据维度的数据维度集合;
对提取出的所有数据维度集合数量进行统计,将统计数量不小于预设阈值的数据维度集合作为热门数据维度集合。
4.如权利要求2所述的方法,其中,所述从各数据源中分别提取出各热门数据维度集合下的数据作为热门数据,并对应保存为热门数据源包括:
按各热门数据维度集合中的数据维度,在各数据源中分别提取出相应数据维度下的数据作为热门数据;
将一个热门数据维度集合对应的热门数据按数据维度进行列式存储,得到一个热门数据源;
将各热门数据源所对应的热门数据集合保存到索引信息中。
5.如权利要求4所述的方法,其中,所述判断该数据查询请求是否命中一个热门数据源包括:
从该数据查询请求中提取出包含至少一个数据维度的数据维度集合;
查询所述索引信息,判断该提取出的数据维度集合是否是任一个热门数据维度集合的子集;若是,则判断该数据查询请求命中与该热门数据维度集合对应的热门数据源。
6.如权利要求5所述的方法,其中,
当提取出的数据维度集合是多个热门数据维度集合的子集时,将所述多个热门数据维度集合中数据维度数量最少的一个热门数据维度集合对应的热门数据源作为该数据查询请求命中的热门数据源;当所述多个热门数据维度集合中数据维度数量最少的热门数据维度集合有多个时,从中随机选取一个热门数据维度集合,将该热门数据维度集合对应的热门数据源作为该数据查询请求命中的热门数据源。
7.如权利要求4所述的方法,其中,所述数据查询请求是聚合查询请求;
所述按将一个热门数据维度集合对应的热门数据按数据维度进行列式存储包括:
根据各数据维度下的数据的数据类型,确定各数据维度下的数据在进行列式存储时对应的列的属性。
8.如权利要求1-7中任一项所述的方法,其中,所述接收对指定数据源的数据查询请求包括:
为多个数据源提供统一的数据查询页面,在所述数据查询页面中接收对所述多个数据源中的指定数据源的数据查询请求。
9.一种数据查询装置,其中,该装置包括:
接收单元,适于接收对指定数据源的数据查询请求;
判断单元,适于判断该数据查询请求是否命中一个热门数据源;所述热门数据源包含从所述指定数据源中提取出的热门数据,所述热门数据是根据多个数据查询请求确定的;
查询单元,适于在该数据查询请求命中一个热门数据源时,在命中的热门数据源中执行所述数据查询请求,并返回相应的查询结果。
10.如权利要求9所述的装置,其中,该装置还包括:
记录单元,适于对接收到的数据查询请求进行记录;
热门数据源生成单元,适于对各数据源,从记录的数据查询请求中分析出该数据源的至少一个热门数据维度集合;从各数据源中分别提取出各热门数据维度集合下的数据作为热门数据,并对应保存为热门数据源。
CN201710525440.2A 2017-06-30 2017-06-30 一种数据查询方法和装置 Active CN107291932B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710525440.2A CN107291932B (zh) 2017-06-30 2017-06-30 一种数据查询方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710525440.2A CN107291932B (zh) 2017-06-30 2017-06-30 一种数据查询方法和装置

Publications (2)

Publication Number Publication Date
CN107291932A true CN107291932A (zh) 2017-10-24
CN107291932B CN107291932B (zh) 2021-02-05

Family

ID=60099825

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710525440.2A Active CN107291932B (zh) 2017-06-30 2017-06-30 一种数据查询方法和装置

Country Status (1)

Country Link
CN (1) CN107291932B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070156640A1 (en) * 2005-12-29 2007-07-05 International Business Machines Corporation Hot tuple detection
CN101984423A (zh) * 2010-10-21 2011-03-09 百度在线网络技术(北京)有限公司 一种热搜词生成方法及系统
CN102063453A (zh) * 2010-05-31 2011-05-18 百度在线网络技术(北京)有限公司 一种用于基于用户的需求进行搜索的方法和设备
CN102479223A (zh) * 2010-11-25 2012-05-30 中国移动通信集团浙江有限公司 数据查询方法及系统
WO2014127673A1 (en) * 2013-02-25 2014-08-28 Tencent Technology (Shenzhen) Company Limited Method and apparatus for acquiring hot topics
CN106445944A (zh) * 2015-08-06 2017-02-22 阿里巴巴集团控股有限公司 一种数据查询请求的处理方法、装置及电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070156640A1 (en) * 2005-12-29 2007-07-05 International Business Machines Corporation Hot tuple detection
CN102063453A (zh) * 2010-05-31 2011-05-18 百度在线网络技术(北京)有限公司 一种用于基于用户的需求进行搜索的方法和设备
CN101984423A (zh) * 2010-10-21 2011-03-09 百度在线网络技术(北京)有限公司 一种热搜词生成方法及系统
CN102479223A (zh) * 2010-11-25 2012-05-30 中国移动通信集团浙江有限公司 数据查询方法及系统
WO2014127673A1 (en) * 2013-02-25 2014-08-28 Tencent Technology (Shenzhen) Company Limited Method and apparatus for acquiring hot topics
CN106445944A (zh) * 2015-08-06 2017-02-22 阿里巴巴集团控股有限公司 一种数据查询请求的处理方法、装置及电子设备

Also Published As

Publication number Publication date
CN107291932B (zh) 2021-02-05

Similar Documents

Publication Publication Date Title
JP6487201B2 (ja) 推奨ページを生成するための方法及び装置
JP5693746B2 (ja) 製品情報のランク付け
US20110153595A1 (en) System And Method For Identifying Topics For Short Text Communications
US7502774B2 (en) Ring method, apparatus, and computer program product for managing federated search results in a heterogeneous environment
US10061767B1 (en) Analyzing user reviews to determine entity attributes
CN107391561B (zh) 内容源页面中的广告处理方法、服务器及计算机可读介质
CN103714096A (zh) 基于Lucene的倒排索引系统构建、数据处理方法及装置
CN106294794A (zh) 一种内容推荐方法及装置
CN106874335A (zh) 行为数据处理方法、装置及服务器
US20150081690A1 (en) Network sourced enrichment and categorization of media content
CN103309984B (zh) 数据处理的方法和装置
WO2020003109A1 (en) Facet-based query refinement based on multiple query interpretations
CN106294785A (zh) 内容筛选方法以及系统
CN106557556A (zh) 一种网页页面的展示方法、装置、服务器和系统
CN109543113B (zh) 确定点击推荐词的方法、装置、存储介质及电子设备
US9442918B2 (en) Perspective data management for common features of multiple items
Klopfenstein et al. Commentary to Gusenbauer and Haddaway 2020: evaluating retrieval qualities of Google scholar and PubMed
CN112818219A (zh) 解释推荐效果的方法、系统、电子设备及可读存储介质
CN103678312B (zh) 一种推荐网址的方法与客户端
CN104091127B (zh) 一种清理隐私记录的方法和装置
CN108228802B (zh) 一种输入联想的推荐方法及装置
CN107291932A (zh) 一种数据查询方法和装置
CN105893462A (zh) 一种用户网络行为分析方法及装置
CN105426541B (zh) 一种通用数据的存储方法和装置
CN110019697A (zh) 一种刑事文书的推送方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant