CN106959960B - 数据获取方法及装置 - Google Patents

数据获取方法及装置 Download PDF

Info

Publication number
CN106959960B
CN106959960B CN201610016651.9A CN201610016651A CN106959960B CN 106959960 B CN106959960 B CN 106959960B CN 201610016651 A CN201610016651 A CN 201610016651A CN 106959960 B CN106959960 B CN 106959960B
Authority
CN
China
Prior art keywords
key value
identification information
data
keyword
target key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610016651.9A
Other languages
English (en)
Other versions
CN106959960A (zh
Inventor
陈国栋
管国辰
郭峰
邓长春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN201610016651.9A priority Critical patent/CN106959960B/zh
Publication of CN106959960A publication Critical patent/CN106959960A/zh
Application granted granted Critical
Publication of CN106959960B publication Critical patent/CN106959960B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种数据获取方法及装置,所述方法的一具体实施方式包括:接收数据获取请求,所述数据获取请求包括至少一个关键词;确定各关键词的维度属性,并根据各维度属性与各标识信息的对应关系及各关键词与各标识信息的对应关系,确定所述数据获取请求中包括的各关键词对应的标识信息及各关键词的维度属性对应的标识信息;根据预设合并规则,将所述各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到所述数据获取请求对应的至少一个目标键值;基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据。本实施例能够提高数据获取效率。

Description

数据获取方法及装置
技术领域
本发明涉及大数据处理技术领域,特别是涉及一种数据获取方法及装置。
背景技术
在今天的大数据时代,数据获取变得越来越方便,用户可以从大规模的数据中,获得其想要的数据。
现有的数据获取方法,为了快速给用户查询到其想要的数据,服务器可以首先对大数据进行分析。OLAP(Online Analytical Processing,在线联机分析处理)是常用的一种提供决策服务的数据分析手段。在今天的大数据时代,数据分析尤其重要,OLAP也常被应用于不同的大数据平台。
关系型联机分析处理(ROLAP)是OLAP中一种主要的数据分析方法。ROLAP这种方法依赖于操作存储在关系型数据库中的数据,给传统的OLAP新的slicing和dicing功能。本质上,每个slicing或dicing功能和SQL语句中"WHERE"子句的功能是一样的。因为每个ROLAP包裹实际上是一个SQL查询(或多个SQL查询)关系数据库,可能会因为底层数据量很大,使得查询的时间很长。
因此,基于现有的数据分析方法,在进行数据获取时,数据获取效率较低。
发明内容
本发明实施例的目的在于提供一种数据获取方法及装置,以提高数据获取效率。具体技术方案如下:
第一方面,本发明提供了一种数据获取方法,应用于服务器,所述方法包括:
接收数据获取请求,所述数据获取请求包括至少一个关键词;
确定各关键词的维度属性,并根据各维度属性与各标识信息的对应关系及各关键词与各标识信息的对应关系,确定所述数据获取请求中包括的各关键词对应的标识信息及各关键词的维度属性对应的标识信息;
根据预设合并规则,将所述各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到所述数据获取请求对应的至少一个目标键值;
基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据。
进一步地,在所述基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据之前,所述方法还包括:
针对每个目标键值,根据所述目标键值中包含的维度属性的数量,及立方表中包含的总维度属性的数量,判断所述目标键值是否为目的目标键值;
如果是,所述基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据包括:
从预先保存的包含有各键值与各数据对应关系的立方表中,获取所述目的目标键值对应的数据。
进一步地,判断所述目标键值非目的目标键值时,所述基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据包括:
识别所述目标键值中包含的维度属性的标识信息,所述目标键值中包含的关键词的标识信息及每个标识信息所在的位置;根据所述立方表中包含的每个维度属性,根据在对应的位置上是否包含所述维度属性的标识信息及关键词的标识信息,确定所述目标键值对应的每个目的目标键值;并从预先保存的包含有各键值与各数据对应关系的立方表中,获取所述每个目的目标键值对应的数据;或
根据立方表中保存的每个目标键值与键值组的对应关系,查找所述目标键值对应的键值组,将所述键值组中的各个键值作为目的目标键值;并获取所述键值组中每个目的目标键值对应的数据。
进一步地,所述根据预设合并规则,将所述各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到所述数据获取请求对应的至少一个目标键值包括:
判断关键词之间的关系;
如果两个关键词之间是与的关系时,根据所述两个关键词对应的维度属性,维度属性的排列顺序,以及每个标识信息对应的位置,确定该两个关键词对应的目标键值;
如果两个关键词之间是或的关系时,针对每个关键词,根据该关键词对应的维度属性,以及每个标识信息对应的位置,确定每个关键词对应的目标键值。
进一步地,建立所述立方表的过程包括:
针对事实表中记录的每条信息,识别该信息中记录的每个维度属性;
根据各维度属性与各标识信息的对应关系,确定每个维度属性对应的标识信息;并
根据该条信息每个维度属性对应的每个关键词,及各关键词与各标识信息的对应关系,确定每个关键词对应的标识信息;
根据预设合并规则,将所述每个关键词对应的标识信息及每个维度属性对应的标识信息合并,确定该条记录对应的键值;
根据该条信息中包含的数据,在立方表中保存所述键值与所述数据的对应关系。
进一步地,所述方法还包括:
针对所述立方表中包含的每个第一键值,判断所述第一键值是否包含所述立方表中所有维度属性对应的标识信息;
如果否,针对所述第一键值,根据所述第一键值包含的每个标识信息,将在对应的位置上包含相同维度属性的标识信息及关键词的标识信息的第二键值,作为该第一键值对应的键值组中的第二键值;
在所述立方表中针对所述第一键值保存键值组,其中所述键值组中包含每个第二键值及该第二键值对应的数据。
进一步地,所述方法还包括:
按照预定的时间间隔,检测事实表中是否存在未更新到立方表的数据;
若是,则将所述数据更新到所述立方表。
进一步地,所述基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据包括:
检测事实表中是否存在未更新到立方表的数据,若是,则根据立方表中各键值与各数据的对应关系获得所述目标键值对应的第一数据,并合并从所述事实表中未更新数据中获取的与所述数据获取请求中包括的各关键词匹配的第二数据。
进一步地,所述检测事实表中是否存在未更新到立方表的数据包括:
根据事实表中记录的各数据的时间标识信息,判断是否存在位于度量缓存中保存的时间范围内的时间标识信息;
若是,则确定该事实表中存在未更新到立方表的数据。
第二方面,本发明提供了一种数据获取装置,应用于服务器,所述装置包括:
接收模块,用于接收数据获取请求,所述数据获取请求包括至少一个关键词;
第一确定模块,用于确定各关键词的维度属性,并根据各维度属性与各标识信息的对应关系及各关键词与各标识信息的对应关系,确定所述数据获取请求中包括的各关键词对应的标识信息及各关键词的维度属性对应的标识信息;
合并模块,用于根据预设合并规则,将所述各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到所述数据获取请求对应的至少一个目标键值;
获取模块,用于基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据。
进一步地,所述装置还包括:
第一判断模块,用于针对每个目标键值,根据所述目标键值中包含的维度属性的数量,及立方表中包含的总维度属性的数量,判断所述目标键值是否为目的目标键值;
当所述第一判断模块判断结果为是时,所述获取模块具体用于:
从预先保存的包含有各键值与各数据对应关系的立方表中,获取所述目的目标键值对应的数据。
进一步地,当所述第一判断模块判断结果为否时,所述获取模块具体用于:
识别所述目标键值中包含的维度属性的标识信息,所述目标键值中包含的关键词的标识信息及每个标识信息所在的位置;根据所述立方表中包含的每个维度属性,根据在对应的位置上是否包含所述维度属性的标识信息及关键词的标识信息,确定所述目标键值对应的每个目的目标键值;并从预先保存的包含有各键值与各数据对应关系的立方表中,获取所述每个目的目标键值对应的数据;或
根据立方表中保存的每个目标键值与键值组的对应关系,查找所述目标键值对应的键值组,将所述键值组中的各个键值作为目的目标键值;并获取所述键值组中每个目的目标键值对应的数据。
进一步地,所述合并模块具体用于:
判断关键词之间的关系;
如果两个关键词之间是与的关系时,根据所述两个关键词对应的维度属性,维度属性的排列顺序,以及每个标识信息对应的位置,确定该两个关键词对应的目标键值;
如果两个关键词之间是或的关系时,针对每个关键词,根据该关键词对应的维度属性,以及每个标识信息对应的位置,确定每个关键词对应的目标键值。
进一步地,所述装置还包括:
识别模块,用于针对事实表中记录的每条信息,识别该信息中记录的每个维度属性;
第二确定模块,用于根据各维度属性与各标识信息的对应关系,确定每个维度属性对应的标识信息;
第三确定模块,用于根据该条信息每个维度属性对应的每个关键词,及各关键词与各标识信息的对应关系,确定每个关键词对应的标识信息;
组合模块,用于根据预设合并规则,将所述每个关键词对应的标识信息及每个维度属性对应的标识信息合并,确定该条记录对应的键值;
第一存储模块,用于根据该条信息中包含的数据,在立方表中保存所述键值与所述数据的对应关系。
进一步地,所述装置还包括:
第二判断模块,用于针对所述立方表中包含的每个第一键值,判断所述第一键值是否包含所述立方表中所有维度属性对应的标识信息;
第四确定模块,用于当所述第二判断模块判断结果为否时,针对所述第一键值,根据所述第一键值包含的每个标识信息,将在对应的位置上包含相同维度属性的标识信息及关键词的标识信息的第二键值,作为该第一键值对应的键值组中的第二键值;
第二存储模块,用于在所述立方表中针对所述第一键值保存键值组,其中所述键值组中包含每个第二键值及该第二键值对应的数据。
进一步地,所述装置还包括:
检测模块,用于按照预定的时间间隔,检测事实表中是否存在未更新到立方表的数据;
更新模块,用于当检测模块的检测结果为是时,将所述数据更新到所述立方表。
进一步地,所述获取模块具体用于:
检测事实表中是否存在未更新到立方表的数据,若是,则根据立方表中各键值与各数据的对应关系获得所述目标键值对应的第一数据,并合并从所述事实表中未更新数据中获取的与所述数据获取请求中包括的各关键词匹配的第二数据。
进一步地,所述检测模块具体用于:
根据事实表中记录的各数据的时间标识信息,判断是否存在位于度量缓存中保存的时间范围内的时间标识信息;
若是,则确定该事实表中存在未更新到立方表的数据。
本发明实施例提供的数据获取方法及装置,该方法包括:接收数据获取请求,所述数据获取请求包括至少一个关键词;确定各关键词的维度属性,并根据各维度属性与各标识信息的对应关系及各关键词与各标识信息的对应关系,确定所述数据获取请求中包括的各关键词对应的标识信息及各关键词的维度属性对应的标识信息;根据预设合并规则,将所述各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到所述数据获取请求对应的至少一个目标键值;基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据。由于在本发明实施例中直接通过预先保存的键值与数据的对应关系查找与目标键值对应的数据,而不需要遍历服务器中所有的数据来查找与数据获取请求匹配的数据,因此能够提高数据获取效率。并且,由于在立方表中存储的是各键值与各数据的对应关系,利用键值可以实现用较少字节的标识信息来代替关键字,从而可以对源数据进行压缩,减小了源数据的存储空间。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据本发明提供的数据获取方法的一个实施例的示意性流程图;
图2示出了本发明实施例提供的建立立方表的方法的示意性流程图;
图3示出了本发明另一实施例提供的建立立方表的方法的示意性流程图;
图4示出了根据本发明提供的数据获取装置的一个实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
请参考图1,其示出了根据本发明提供的数据获取方法的一个实施例的示意性流程图。
如图1所示,本实施例提供的数据获取方法,应用于服务器,可以包括如下步骤:
步骤101,接收数据获取请求,该数据获取请求包括至少一个关键词。
随着大数据领域的发展,用户可以方便地获取到自己想要的数据。具体地,用户可以基于自己想要的数据,输入包括至少一个关键词的数据获取请求,以供服务器查询相关的数据。
在本实施例中,服务器可以接收用户输入的包括至少一个关键词的数据获取请求,以基于数据获取请求中的关键词,为用户查询其想要的数据。
步骤102,确定各关键词的维度属性,并根据各维度属性与各标识信息的对应关系及各关键词与各标识信息的对应关系,确定所述数据获取请求中包括的各关键词对应的标识信息及各关键词的维度属性对应的标识信息。
在本实施例中,为了快速为用户查询数据,服务器可以首先对大数据进行预处理。通常情况下,每一个大数据事实表中会包括多个维度属性,每个维度属性又对应多个关键词。因此,可以预先设定各维度属性与各标识信息的对应关系,以及各关键词与各标识信息的对应关系。从而可以对事实表进行处理,得到对应的立方表。
服务器接收到包括至少一个关键词的数据获取请求后,可以根据数据获取请求中包括的每个关键词,并根据用于获取数据的立方表,确定各关键词的维度属性。
例如,当数据获取请求中包括的关键词为:苹果、A等级和杭州时,针对上述数据获取请求,服务器根据下表所示的立方表可以分别确定各关键词的维度属性为:水果种类、等级和产地。
键值 数量 键值 数量
a-1-0-0 800 ac-1-0-1 500
a-2-0-0 200 ac-1-0-2 300
b-0-1-0 700 ac-2-0-2 200
b-0-2-0 300 bc-0-1-1 500
c-0-0-1 500 bc-0-1-2 200
c-0-0-2 500 bc-0-2-2 300
ab-1-1-0 500 abc-1-1-1 500
ab-1-2-0 300 abc-1-2-2 300
ab-2-1-0 200 abc-2-1-2 200
确定各关键词的维度属性后,可以根据预设的各维度属性和各标识信息的对应关系以及各关键词和各标识信息的对应关系,确定数据获取请求中各关键词对应的标识信息及各关键词的维度属性对应的标识信息。如下表所示:各维度属性和各标识信息的对应关系以及各关键词和各标识信息的对应关系。
Figure BDA0000904342360000091
根据上述表格,确定的各关键词对应的标识信息分别为:苹果-1、A等级-1和杭州-1,各关键词的维度属性对应的标识信息为:水果种类-a、等级-b、产地-c。
步骤103,根据预设合并规则,将所述各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到所述数据获取请求对应的至少一个目标键值。
确定数据获取请求中各关键词对应的标识信息以及各关键词的维度属性对应的标识信息后,可以根据预设合并规则,将各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到数据获取请求对应的至少一个目标键值,以在立方表中查询相应的数据。
在本实施例的一个可选实现方式中,在得到目标键值之前,可以首先判断关键词之间的关系。每两个关键词之间的关系可以包括:与、或。当关键词之间的关系不同时,可以利用不同的方法得到目标键值。
具体地,如果两个关键词之间是与的关系时,根据该两个关键词对应的维度属性,维度属性的排列顺序,以及每个标识信息对应的位置,确定该两个关键词对应的目标键值。
例如,当上述数据获取请求中的关键词苹果、A等级、杭州之间均是与的关系时,根据各关键词对应的维度属性:水果种类、等级、产地,各维度属性的排列顺序以及每个标识信息对应的位置,可以确定这3个关键词对应的目标键值为:abc-1-1-1。
如果两个关键词之间是或的关系时,针对每个关键词,根据该关键词对应的维度属性,以及每个标识信息对应的位置,确定每个关键词对应的目标键值。
例如,当上述数据获取请求中的关键词苹果、A等级、杭州均为或的关系,则针对每个关键词,根据该关键词对应的维度属性,以及每个标识信息对应的位置,可以确定这3各关键词分别对应的目标键值为:a-1-0-0、b-0-1-0、c-0-0-1。
步骤104,基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据。
得到目标键值后,服务器可以基于该目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据。
具体地,可以首先针对每个目标键值,根据该目标键值中包含的维度属性的数量,及立方表中包含的总维度属性的数量,判断该目标键值是否为目的目标键值。
得到数据获取请求对应的至少一个目标键值后,服务器可以针对每个目标键值,根据该目标键值中包含的维度属性的数量,及立方表中包含的总维度属性的数量,判断该目标键值是否为目的目标键值。也就是说,针对每个目标键值,判断是否只利用该目标键值即可得到与数据获取请求匹配的数据。
例如,当目标键值中包含的维度属性的数量为3,且立方表中包含的总维度属性的数量也为3时,表明该目标键值为根据数据获取请求中的关键词确定的唯一的键值,因此,可以确定该目标键值为目的目标键值。
当目标键值中包含的维度属性的数量为2,而立方表中包含的总维度属性的数量为3时,表明该目标键值只确定了两个维度属性的关键词,当这两个关键词确定之后,另一个维度属性中的关键词取任意值都满足数据获取请求。也就是说,只利用该目标键值不能得到与数据获取请求匹配的数据,在立方表中其它键值中,还有与数据获取请求中各关键词匹配的键值。因此,该目标键值不是目的目标键值。
当目标键值是目的目标键值时,可以从预先保存的包含有各键值与各数据对应关系的立方表中,获取该目的目标键值对应的数据。
当目标键值不是目的目标键值时,服务器可以基于该目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与数据获取请求匹配的数据。
可选地,在一种实现方式中,可以首先根据目标键值中包含的维度属性,及立方表中包含的每个维度属性,确定目标键值对应的每个目的目标键值。
具体地,在确定目标键值对应的每个目的目标键值时,可以首先识别该目标键值中包含的维度属性的标识信息,目标键值中包含的关键词的标识信息及每个标识信息所在的位置,然后根据立方表中包含的每个维度属性,根据在对应的位置上是否包含该维度属性的标识信息及关键词的标识信息,确定目标键值对应的每个目的目标键值。
例如,当目标键值为a-1-0-0时,该目标键值中包含的维度属性为水果种类,其对应的标识信息为a,立方表中包含的全部维度属性为:水果种类、等级和产地,水果种类的标识信息所在的位置为第一位,因此,可以确定该目标键值对应的每个目的目标键值为a-1-0-0、ab-1-*-0、ac-1-0-*、abc-1-*-*,其中,“*”代表相应位置可为该维度属性中任一关键词的标识信息。
确定目标键值对应的目的目标键值后,可以从预先保存的包含有各键值与各数据对应关系的立方表中,获取每个目的目标键值对应的数据。可选地,可以翻译各目的目标键值对应的含义,并展示各目的目标键值的含义及相应的数据。
在上述实现方式中,确定目标键值后,需要进一步从立方表中所有键值中,查找该目标键值对应的目的目标键值。为了提高数据获取效率,可以预先在立方表中保存每个目标键值与键值组的对应关系,每一个键值组中包含了与目标键值在对应的位置上包含相同的维度属性的标识信息及关键词的标识信息的多个目的目标键值。
因此,在另一种实现方式中,得到目标键值后,可以根据立方表中保存的每个目标键值与键值组的对应关系,查找该目标键值对应的键值组,将该键值组中的各个键值作为目的目标键值,并获取该键值组中每个目的目标键值对应的数据。
在本实施例中,通过立方表中保存的各键值与各数据的对应关系,得到目的目标键值对应的数据。有的情况下,当事实表更新时,立方表可能还没更新。这时候,如果用户获取数据,则其可能获取到不太准确的数据。
在一种实现方式中,从立方表中获取数据之前,可以首先检测事实表中是否存在未更新到立方表的数据,若是,则可以根据立方表中各键值与各数据的对应关系获得目标键值对应的第一数据,并合并从事实表中未更新数据中获取的与数据获取请求中包括的各关键词匹配的第二数据。
具体地,可以根据事实表中记录的各数据的时间标识信息,判断是否存在位于度量缓存中保存的时间范围内的时间标识信息,若是,则确定该事实表中存在未更新到立方表的数据。
本实施例提供的数据获取方法,可以直接通过预先保存的键值与数据的对应关系查找与目标键值对应的数据,而不需要遍历服务器中所有的数据来查找与数据获取请求匹配的数据,因此能够提高数据获取效率。并且,由于在立方表中存储的是各键值与各数据的对应关系,利用键值可以实现用较少字节的标识信息来代替关键字,从而可以对源数据进行压缩,减小了源数据的存储空间。在进行数据获取时,同时使用立方表和事实表中未更新到立方表中的数据来获取与数据获取请求匹配的数据,能够提高获取的数据的准确性。在立方表中建立键值组,当得到目标键值不是目的目标键值时,可以直接从立方表中查找相应的键值组,而不需要遍历各目标键值,查找目标键值对应的目的目标键值,能够提高数据获取效率。
在图1所示实施例的基础上,本发明还提供了另外一种实施方式,请参考图2,其示出了本发明实施例提供的建立立方表的方法的示意性流程图。
如图2所示,本实施例提供的建立立方表的方法,可以包括如下步骤:
步骤201,针对事实表中记录的每条信息,识别该信息中记录的每个维度属性。
在本实施例中,可以针对事实表,建立对应的立方表。具体地,可以针对事实表中记录的每条信息,识别该信息中记录的每个维度属性。
例如,针对如下表所示的事实表:
水果种类 等级 产地 数量
苹果 A 杭州 500
苹果 B 上海 300
橘子 A 上海 200
可以识别每个维度属性,即分别为:水果种类、等级和产地。
步骤202,根据各维度属性与各标识信息的对应关系,确定每个维度属性对应的标识信息。
确定事实表中的维度属性后,可以根据各维度属性与各标识信息的对应关系,确定每个维度属性对应的标识信息。
上述事实表中各维度属性对应的标识信息可以为:
水果种类:a 等级:b 产地:c
步骤203,根据该条信息每个维度属性对应的每个关键词,及各关键词与各标识信息的对应关系,确定每个关键词对应的标识信息。
确定每个维度属性对应的标识信息后,可以进一步确定每个维度属性对应的关键词。如,上述事实表中,每个维度属性对应的关键词分别为:
Figure BDA0000904342360000141
并且,可以确定每个维度属性中包括的每个关键词对应的标识信息:
Figure BDA0000904342360000142
步骤204,根据预设合并规则,将所述每个关键词对应的标识信息及每个维度属性对应的标识信息合并,确定该条记录对应的键值。
得到事实表中每个维度属性对应的标识信息及每个关键词对应的标识信息后,可以根据预设合并规则,将所述每个关键词对应的标识信息及每个维度属性对应的标识信息合并,确定该条记录对应的键值。具体地,可以基于预先设定的键值中出现的标识信息及各标识信息的位置等,得到对应的键值。
例如,对上述事实表中出现的各维度属性对应的标识信息以及各关键词对应的标识信息进行合并后,可以得到下列键值:a-1-0-0、a-2-0-0、b-0-1-0、b-0-2-0、c-0-0-1、c-0-0-2、ab-1-1-0、ab-1-2-0、ab-2-1-0、ac-1-0-1、ac-1-0-2、ac-2-0-2、bc-0-1-1、bc-0-1-2、bc-0-2-2、abc-1-1-1、abc-1-2-2、abc-2-1-2。
其中,上述各键值含义解释如下表:
Figure BDA0000904342360000143
Figure BDA0000904342360000151
步骤205,根据该条信息中包含的数据,在立方表中保存所述键值与所述数据的对应关系。
得到各键值后,可以根据事实表中记录的数据,确定每个键值对应的数据。例如,根据键值的含义,可以对事实表中的数据进行求和、求平均等处理,得到键值对应的数据。并在立方表中保存各键值与数据的对应关系。
可选地,在立方表中保存各键值及对应的数据时,可以按照预设的顺序将各键值进行保存。如,当标识信息中包括字母时,可以按照字母顺序将每个键值及其对应的数据保存在立方表中。当标识信息中包括数字时,可以按照数字大小顺序将每个键值及其对应的数据保存在立方表中。
例如,针对上述事实表,可以得到如下所示的立方表:
Figure BDA0000904342360000152
Figure BDA0000904342360000161
可选地,为了保证用户获取到准确的数据,当事实表更新时,可以更新对应的立方表。然而,若在事实表更新的同时更新对应的立方表,会给事实表的数据写入带来很大的性能瓶颈,会增加数据写入的时间。因此,在本实施例中,可以异步更新立方表。
具体地,可以按照预定的时间间隔,检测事实表中是否存在未更新到对应立方表的数据,若是,则将该数据更新到立方表。
例如,当事实表中数据更新时,可以将新更新的数据保存在度量缓存中,当服务器将度量缓存中的数据更新到立方表时,可以将度量缓存中的数据删除。因此,服务器可以通过检测度量缓存中是否保存有数据来确定事实表中是否有未更新到立方表的数据。
可选地,为了减少内存消耗,当事实表中数据更新时,可以在度量缓存中不保存全部的新更新的数据,而只根据新更新的数据的时间标识信息,设定一定的时间范围。在检测事实表是否更新时,可以根据事实表中记录的各数据的时间标识信息,判断是否存在位于度量缓存中保存的时间范围内的时间标识信息,若是,则确定该事实表中存在未更新到立方表的数据。
在事实表中保存数据时,各数据可以有自己的时间标识信息,如,可以将录入数据的时间设定为该数据的时间标识信息。当事实表中录入新的数据时,可以根据新录入的数据的时间标识信息,设定数据更新时间范围,并在度量缓存中保存该时间范围。
有些情况下,如数据获取请求中包括的关键词之间的关系为“或”,或者数据获取请求中包括的关键词对应的维度属性只是立方表中的部分维度属性时,在获取数据时,通过上述立方表中的一个目标键值不能得到与数据获取请求匹配的数据。
因此,本发明提供了另外一种实施方式,请参考图3,其示出了本发明另一实施例提供的建立立方表的方法的示意性流程图。
如图3所示,本实施例提供的建立立方表的方法,可以包括如下步骤:
步骤301,针对事实表中记录的每条信息,识别该信息中记录的每个维度属性。
步骤302,根据各维度属性与各标识信息的对应关系,确定每个维度属性对应的标识信息。
步骤303,根据该条信息每个维度属性对应的每个关键词,及各关键词与各标识信息的对应关系,确定每个关键词对应的标识信息。
步骤304,根据预设合并规则,将所述每个关键词对应的标识信息及每个维度属性对应的标识信息合并,确定该条记录对应的键值。
步骤305,根据该条信息中包含的数据,在立方表中保存所述键值与所述数据的对应关系。
步骤306,针对所述立方表中包含的每个第一键值,判断所述第一键值是否包含所述立方表中所有维度属性对应的标识信息,如果是,针对所述第一键值,在所述立方表中保存该第一键值及第一键值对应的数据,如果否,则进行步骤307。
在本实施例中,可以对立方表中保存的各目标键值与各数据的对应关系进行进一步的处理。具体地,可以根据立方表中包含的每个目标键值,保存其对应的键值组。例如,可以将在对应的位置上包含相同维度属性的标识信息及关键词的标识信息的目标键值组合,得到对应的键值组。在获取数据时,可以根据目标键值,确定对应的目标键值组,然后获取目标键值组中各目标键值对应的数据。
具体地,首先可以针对立方表中包含的每个第一键值,判断该第一键值是否包含立方表中所有维度属性对应的标识信息。当该第一键值包含立方表中所有维度属性对应的标识信息时,此时说明立方表中其它键值中,没有与该第一键值在对应的位置上包含相同维度属性的标识信息及关键词的标识信息的键值,即该第一键值没有对应的键值组。当该第一键值没有包含立方表中所有维度属性对应的标识信息时,此时说明立方表中其它键值中,有与该第一键值在对应的位置上包含相同维度属性的标识信息及关键词的标识信息的键值,即该第一键值有对应的键值组。
步骤307,当该第一键值没有包含所述立方表中所有维度属性对应的标识信息时,针对所述第一键值,根据所述第一键值包含的每个标识信息,将在对应的位置上包含相同维度属性的标识信息及关键词的标识信息的第二键值,作为该第一键值对应的键值组中的第二键值。
在本实施例中,可以针对每个不包含该立方表中所有维度属性对应的标识信息的键值,建立该键值对应的键值组。
例如,针对图2所示实施例中建立的立方表中的键值a-1-0-0,可以获取在对应的位置上包含相同维度属性的标识信息及关键词的标识信息的目标键值组合,即ab-1-1-0、ab-1-2-0、ac-1-0-1、ac-1-0-2、abc-1-1-1、abc-1-2-2。将获取的所有的目标键值组合,得到键值a-1-0-0对应的键值组。
可选地,为了在进行数据获取时,提高数据获取效率,可以为各键值组设定对应的标识信息。例如,针对每一个键值组,可以将该键值组中每个目标键值的共同的维度属性的标识信息及关键词的标识信息设定为该键值组对应的标识信息。如,上述键值组的标识信息可以为:a-1-0-0。
步骤308,在所述立方表中针对所述第一键值保存键值组,其中所述键值组中包含每个第二键值及该第二键值对应的数据。
得到各键值组后,可以根据立方表中保存的各目标键值与数据的对应关系,获得各键值组中包含的每个目标键值对应的数据。并在立方表中对应保存每个键值组中包含的各目标键值与数据的对应关系。
例如,针对上述建立的键值组,获取到该键值组中每个目标键值对应的数据后,可以在立方表中保存将该键值组中包含的各目标键值及对应的数据。如下表所示,上述键值组a-1-0-0保存结果:
键值 数量 键值 数量
a-1-0-0 800 ac-1-0-2 300
ab-1-1-0 500 abc-1-1-1 500
ab-1-2-0 300 abc-1-2-2 300
ac-1-0-1 500
在立方表中建立键值组后,在获取数据时,当得到目标键值不是目的目标键值时,可以直接从立方表中查找与目标键值对应的键值组,而不需要遍历各目标键值,查找目标键值对应的目的目标键值,能够提高数据获取效率。
请参考图4,其示出了根据本发明提供的数据获取装置的一个实施例的结构示意图。
如图4所示,本发明实施例提供的数据获取装置,应用于服务器,可以包括:
接收模块410,用于接收数据获取请求,所述数据获取请求包括至少一个关键词;
第一确定模块420,用于确定各关键词的维度属性,并根据各维度属性与各标识信息的对应关系及各关键词与各标识信息的对应关系,确定所述数据获取请求中包括的各关键词对应的标识信息及各关键词的维度属性对应的标识信息;
合并模块430,用于根据预设合并规则,将所述各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到所述数据获取请求对应的至少一个目标键值;
获取模块440,用于基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据。
进一步地,所述装置还包括:
第一判断模块(未示出),用于针对每个目标键值,根据所述目标键值中包含的维度属性的数量,及立方表中包含的总维度属性的数量,判断所述目标键值是否为目的目标键值;
当第一判断模块判断结果为是时,所述获取模块440具体用于:从预先保存的包含有各键值与各数据对应关系的立方表中,获取所述目的目标键值对应的数据。
进一步地,当第一判断模块判断结果为否时,所述获取模块440具体用于:识别所述目标键值中包含的维度属性的标识信息,所述目标键值中包含的关键词的标识信息及每个标识信息所在的位置;根据所述立方表中包含的每个维度属性,根据在对应的位置上是否包含所述维度属性的标识信息及关键词的标识信息,确定所述目标键值对应的每个目的目标键值;并从预先保存的包含有各键值与各数据对应关系的立方表中,获取所述每个目的目标键值对应的数据;或根据立方表中保存的每个目标键值与键值组的对应关系,查找所述目标键值对应的键值组,将所述键值组中的各个键值作为目的目标键值;并获取所述键值组中每个目的目标键值对应的数据。
进一步地,合并模块430具体用于:判断关键词之间的关系;如果两个关键词之间是与的关系时,根据所述两个关键词对应的维度属性,维度属性的排列顺序,以及每个标识信息对应的位置,确定该两个关键词对应的目标键值;如果两个关键词之间是或的关系时,针对每个关键词,根据该关键词对应的维度属性,以及每个标识信息对应的位置,确定每个关键词对应的目标键值。
进一步地,获取模块440具体用于:检测事实表中是否存在未更新到立方表的数据,若是,则根据立方表中各键值与各数据的对应关系获得所述目标键值对应的第一数据,并合并从所述事实表中未更新数据中获取的与所述数据获取请求中包括的各关键词匹配的第二数据。
在本实施例的一个可选实现方式中,所述装置还包括:
识别模块(未示出),用于针对事实表中记录的每条信息,识别该信息中记录的每个维度属性;
第二确定模块(未示出),用于根据各维度属性与各标识信息的对应关系,确定每个维度属性对应的标识信息;
第三确定模块(未示出),用于根据该条信息每个维度属性对应的每个关键词,及各关键词与各标识信息的对应关系,确定每个关键词对应的标识信息;
组合模块(未示出),用于根据预设合并规则,将所述每个关键词对应的标识信息及每个维度属性对应的标识信息合并,确定该条记录对应的键值;
第一存储模块(未示出),用于根据该条信息中包含的数据,在立方表中保存所述键值与所述数据的对应关系。
进一步地,所述装置还包括:
检测模块(未示出),用于按照预定的时间间隔,检测事实表中是否存在未更新到立方表的数据;
更新模块(未示出),用于当检测模块的检测结果为是时,将所述数据更新到所述立方表。
进一步地,检测模块具体用于:根据事实表中记录的各数据的时间标识信息,判断是否存在位于度量缓存中保存的时间范围内的时间标识信息;若是,则确定该事实表中存在未更新到立方表的数据。
在本实施例的另一个可选实现方式中,所述装置还包括:
第二判断模块(未示出),用于针对所述立方表中包含的每个第一键值,判断所述第一键值是否包含所述立方表中所有维度属性对应的标识信息;
第四确定模块(未示出),用于当所述第二判断模块判断结果为否时,针对所述第一键值,根据所述第一键值包含的每个标识信息,将在对应的位置上包含相同维度属性的标识信息及关键词的标识信息的第二键值,作为该第一键值对应的键值组中的第二键值;
第二存储模块(未示出),用于在所述立方表中针对所述第一键值保存键值组,其中所述键值组中包含每个第二键值及该第二键值对应的数据。
本实施例提供的数据获取装置,可以直接通过预先保存的键值与数据的对应关系查找与目标键值对应的数据,而不需要遍历服务器中所有的数据来查找与数据获取请求匹配的数据,因此能够提高数据获取效率。并且,由于在立方表中存储的是各键值与各数据的对应关系,利用键值可以实现用较少字节的标识信息来代替关键字,从而可以对源数据进行压缩,减小了源数据的存储空间。
对于系统/装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (16)

1.一种数据获取方法,其特征在于,应用于服务器,所述方法包括:
接收数据获取请求,所述数据获取请求包括至少一个关键词;
确定各关键词的维度属性,并根据各维度属性与各标识信息的对应关系及各关键词与各标识信息的对应关系,确定所述数据获取请求中包括的各关键词对应的标识信息及各关键词的维度属性对应的标识信息;
根据预设合并规则,将所述各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到所述数据获取请求对应的至少一个目标键值;
基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据;
所述根据预设合并规则,将所述各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到所述数据获取请求对应的至少一个目标键值包括:
判断关键词之间的关系;
如果两个关键词之间是与的关系时,根据所述两个关键词对应的维度属性,维度属性的排列顺序,以及每个标识信息对应的位置,确定该两个关键词对应的目标键值;
如果两个关键词之间是或的关系时,针对每个关键词,根据该每个关键词对应的维度属性,以及每个标识信息对应的位置,确定每个关键词对应的目标键值。
2.根据权利要求1所述的方法,其特征在于,在所述基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据之前,所述方法还包括:
针对每个目标键值,根据所述目标键值中包含的维度属性的数量,及立方表中包含的总维度属性的数量,判断所述目标键值是否为目的目标键值;
如果是,所述基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据包括:
从预先保存的包含有各键值与各数据对应关系的立方表中,获取所述目的目标键值对应的数据。
3.根据权利要求2所述的方法,其特征在于,判断所述目标键值非目的目标键值时,所述基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据包括:
识别所述目标键值中包含的维度属性的标识信息,所述目标键值中包含的关键词的标识信息及每个标识信息所在的位置;根据所述立方表中包含的每个维度属性,根据在对应的位置上是否包含所述维度属性的标识信息及关键词的标识信息,确定所述目标键值对应的每个目的目标键值;并从预先保存的包含有各键值与各数据对应关系的立方表中,获取所述每个目的目标键值对应的数据;或
根据立方表中保存的每个目标键值与键值组的对应关系,查找所述目标键值对应的键值组,将所述键值组中的各个键值作为目的目标键值;并获取所述键值组中每个目的目标键值对应的数据。
4.根据权利要求1所述的方法,其特征在于,建立所述立方表的过程包括:
针对事实表中记录的每条信息,识别该信息中记录的每个维度属性;
根据各维度属性与各标识信息的对应关系,确定每个维度属性对应的标识信息;并
根据该条信息每个维度属性对应的每个关键词,及各关键词与各标识信息的对应关系,确定每个关键词对应的标识信息;
根据预设合并规则,将所述每个关键词对应的标识信息及每个维度属性对应的标识信息合并,确定该条记录对应的键值;
根据该条信息中包含的数据,在立方表中保存所述键值与所述数据的对应关系。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
针对所述立方表中包含的每个第一键值,判断所述第一键值是否包含所述立方表中所有维度属性对应的标识信息;
如果否,针对所述第一键值,根据所述第一键值包含的每个标识信息,将在对应的位置上包含相同维度属性的标识信息及关键词的标识信息的第二键值,作为该第一键值对应的键值组中的第二键值;
在所述立方表中针对所述第一键值保存键值组,其中所述键值组中包含每个第二键值及该第二键值对应的数据。
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
按照预定的时间间隔,检测事实表中是否存在未更新到立方表的数据;
若是,则将所述数据更新到所述立方表。
7.根据权利要求1所述的方法,其特征在于,所述基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据包括:
检测事实表中是否存在未更新到立方表的数据,若是,则根据立方表中各键值与各数据的对应关系获得所述目标键值对应的第一数据,并合并从所述事实表中未更新数据中获取的与所述数据获取请求中包括的各关键词匹配的第二数据。
8.根据权利要求6或7所述的方法,其特征在于,所述检测事实表中是否存在未更新到立方表的数据包括:
根据事实表中记录的各数据的时间标识信息,判断是否存在位于度量缓存中保存的时间范围内的时间标识信息;
若是,则确定该事实表中存在未更新到立方表的数据。
9.一种数据获取装置,其特征在于,应用于服务器,所述装置包括:
接收模块,用于接收数据获取请求,所述数据获取请求包括至少一个关键词;
第一确定模块,用于确定各关键词的维度属性,并根据各维度属性与各标识信息的对应关系及各关键词与各标识信息的对应关系,确定所述数据获取请求中包括的各关键词对应的标识信息及各关键词的维度属性对应的标识信息;
合并模块,用于根据预设合并规则,将所述各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到所述数据获取请求对应的至少一个目标键值;
获取模块,用于基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据;
所述合并模块具体用于:
判断关键词之间的关系;
如果两个关键词之间是与的关系时,根据所述两个关键词对应的维度属性,维度属性的排列顺序,以及每个标识信息对应的位置,确定该两个关键词对应的目标键值;
如果两个关键词之间是或的关系时,针对每个关键词,根据该每个关键词对应的维度属性,以及每个标识信息对应的位置,确定每个关键词对应的目标键值。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第一判断模块,用于针对每个目标键值,根据所述目标键值中包含的维度属性的数量,及立方表中包含的总维度属性的数量,判断所述目标键值是否为目的目标键值;
当所述第一判断模块判断结果为是时,所述获取模块具体用于:
从预先保存的包含有各键值与各数据对应关系的立方表中,获取所述目的目标键值对应的数据。
11.根据权利要求10所述的装置,其特征在于,当所述第一判断模块判断结果为否时,所述获取模块具体用于:
识别所述目标键值中包含的维度属性的标识信息,所述目标键值中包含的关键词的标识信息及每个标识信息所在的位置;根据所述立方表中包含的每个维度属性,根据在对应的位置上是否包含所述维度属性的标识信息及关键词的标识信息,确定所述目标键值对应的每个目的目标键值;并从预先保存的包含有各键值与各数据对应关系的立方表中,获取所述每个目的目标键值对应的数据;或
根据立方表中保存的每个目标键值与键值组的对应关系,查找所述目标键值对应的键值组,将所述键值组中的各个键值作为目的目标键值;并获取所述键值组中每个目的目标键值对应的数据。
12.根据权利要求9所述的装置,其特征在于,所述装置还包括:
识别模块,用于针对事实表中记录的每条信息,识别该信息中记录的每个维度属性;
第二确定模块,用于根据各维度属性与各标识信息的对应关系,确定每个维度属性对应的标识信息;
第三确定模块,用于根据该条信息每个维度属性对应的每个关键词,及各关键词与各标识信息的对应关系,确定每个关键词对应的标识信息;
组合模块,用于根据预设合并规则,将所述每个关键词对应的标识信息及每个维度属性对应的标识信息合并,确定该条记录对应的键值;
第一存储模块,用于根据该条信息中包含的数据,在立方表中保存所述键值与所述数据的对应关系。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括:
第二判断模块,用于针对所述立方表中包含的每个第一键值,判断所述第一键值是否包含所述立方表中所有维度属性对应的标识信息;
第四确定模块,用于当所述第二判断模块判断结果为否时,针对所述第一键值,根据所述第一键值包含的每个标识信息,将在对应的位置上包含相同维度属性的标识信息及关键词的标识信息的第二键值,作为该第一键值对应的键值组中的第二键值;
第二存储模块,用于在所述立方表中针对所述第一键值保存键值组,其中所述键值组中包含每个第二键值及该第二键值对应的数据。
14.根据权利要求12所述的装置,其特征在于,所述装置还包括:
检测模块,用于按照预定的时间间隔,检测事实表中是否存在未更新到立方表的数据;
更新模块,用于当检测模块的检测结果为是时,将所述数据更新到所述立方表。
15.根据权利要求9所述的装置,其特征在于,所述获取模块具体用于:
检测事实表中是否存在未更新到立方表的数据,若是,则根据立方表中各键值与各数据的对应关系获得所述目标键值对应的第一数据,并合并从所述事实表中未更新数据中获取的与所述数据获取请求中包括的各关键词匹配的第二数据。
16.根据权利要求14所述的装置,其特征在于,所述检测模块具体用于:
根据事实表中记录的各数据的时间标识信息,判断是否存在位于度量缓存中保存的时间范围内的时间标识信息;
若是,则确定该事实表中存在未更新到立方表的数据。
CN201610016651.9A 2016-01-11 2016-01-11 数据获取方法及装置 Active CN106959960B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610016651.9A CN106959960B (zh) 2016-01-11 2016-01-11 数据获取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610016651.9A CN106959960B (zh) 2016-01-11 2016-01-11 数据获取方法及装置

Publications (2)

Publication Number Publication Date
CN106959960A CN106959960A (zh) 2017-07-18
CN106959960B true CN106959960B (zh) 2020-07-03

Family

ID=59481191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610016651.9A Active CN106959960B (zh) 2016-01-11 2016-01-11 数据获取方法及装置

Country Status (1)

Country Link
CN (1) CN106959960B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108182221B (zh) * 2017-12-26 2022-05-31 北京乐蜜科技有限责任公司 数据处理的方法以及相关设备
CN111192149B (zh) * 2019-11-25 2023-06-16 泰康保险集团股份有限公司 一种核保结果数据生成方法和装置
CN111026817B (zh) * 2019-12-09 2023-11-28 北京中电普华信息技术有限公司 一种多维计算方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9183274B1 (en) * 2009-02-11 2015-11-10 Guangsheng Zhang System, methods, and data structure for representing object and properties associations
CN105138583A (zh) * 2015-07-31 2015-12-09 北京奇虎科技有限公司 数据处理方法、装置和电子设备
CN104035980B (zh) * 2014-05-26 2017-08-04 王和平 一种面向结构化医药信息的检索方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9183274B1 (en) * 2009-02-11 2015-11-10 Guangsheng Zhang System, methods, and data structure for representing object and properties associations
CN104035980B (zh) * 2014-05-26 2017-08-04 王和平 一种面向结构化医药信息的检索方法和系统
CN105138583A (zh) * 2015-07-31 2015-12-09 北京奇虎科技有限公司 数据处理方法、装置和电子设备

Also Published As

Publication number Publication date
CN106959960A (zh) 2017-07-18

Similar Documents

Publication Publication Date Title
US9507824B2 (en) Automated creation of join graphs for unrelated data sets among relational databases
CN107844565B (zh) 商品搜索方法和装置
CN109117440B (zh) 一种元数据信息获取方法、系统和计算机可读存储介质
US20160055212A1 (en) Automatic joining of data sets based on statistics of field values in the data sets
CN107690637B (zh) 使用大表语料库连接语义相关的数据
JP2013504118A (ja) クエリのセマンティックパターンに基づく情報検索
CN102693266A (zh) 搜索数据库的方法、生成索引结构的导航设备和方法
Scheffler et al. Matching points of interest from different social networking sites
CN105608113B (zh) 判断文本中poi数据的方法及装置
CN106959960B (zh) 数据获取方法及装置
CN111913954A (zh) 智能数据标准目录生成方法和装置
CN105095436A (zh) 数据源数据自动建模方法
CN104731908A (zh) 一种基于etl的数据清洗方法
CN107291951B (zh) 数据处理方法、装置、存储介质和处理器
CN115577694B (zh) 标准编写的智能推荐方法
CN107562872B (zh) 基于sql的度量空间数据相似度查询方法及装置
CN111090630A (zh) 基于多源空间点数据的数据融合处理方法
CN111475464A (zh) 一种自动发现挖掘Web组件指纹的方法
CN110147396B (zh) 一种映射关系生成方法及装置
CN109710814A (zh) 一种多源遥感数据归档处理方法及装置
CN111428063B (zh) 基于地理空间位置划分的图像特征关联处理方法及系统
CN111325235B (zh) 面向多语种的通用地名语义相似度计算方法及其应用
CN111400339B (zh) 产品数据库标识反向解析的检索方法及系统
CN109408727B (zh) 基于多维感知数据的用户关注信息智能推荐方法及系统
CN109725982B (zh) 数据对象构建方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant