CN106959960A - 数据获取方法及装置 - Google Patents

数据获取方法及装置 Download PDF

Info

Publication number
CN106959960A
CN106959960A CN201610016651.9A CN201610016651A CN106959960A CN 106959960 A CN106959960 A CN 106959960A CN 201610016651 A CN201610016651 A CN 201610016651A CN 106959960 A CN106959960 A CN 106959960A
Authority
CN
China
Prior art keywords
data
identification information
keyword
key assignments
key value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610016651.9A
Other languages
English (en)
Other versions
CN106959960B (zh
Inventor
陈国栋
管国辰
郭峰
邓长春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN201610016651.9A priority Critical patent/CN106959960B/zh
Publication of CN106959960A publication Critical patent/CN106959960A/zh
Application granted granted Critical
Publication of CN106959960B publication Critical patent/CN106959960B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种数据获取方法及装置,所述方法的一具体实施方式包括:接收数据获取请求,所述数据获取请求包括至少一个关键词;确定各关键词的维度属性,并根据各维度属性与各标识信息的对应关系及各关键词与各标识信息的对应关系,确定所述数据获取请求中包括的各关键词对应的标识信息及各关键词的维度属性对应的标识信息;根据预设合并规则,将所述各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到所述数据获取请求对应的至少一个目标键值;基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据。本实施例能够提高数据获取效率。

Description

数据获取方法及装置
技术领域
本发明涉及大数据处理技术领域,特别是涉及一种数据获取方法及装置。
背景技术
在今天的大数据时代,数据获取变得越来越方便,用户可以从大规模的数据中,获得其想要的数据。
现有的数据获取方法,为了快速给用户查询到其想要的数据,服务器可以首先对大数据进行分析。OLAP(Online Analytical Processing,在线联机分析处理)是常用的一种提供决策服务的数据分析手段。在今天的大数据时代,数据分析尤其重要,OLAP也常被应用于不同的大数据平台。
关系型联机分析处理(ROLAP)是OLAP中一种主要的数据分析方法。ROLAP这种方法依赖于操作存储在关系型数据库中的数据,给传统的OLAP新的slicing和dicing功能。本质上,每个slicing或dicing功能和SQL语句中"WHERE"子句的功能是一样的。因为每个ROLAP包裹实际上是一个SQL查询(或多个SQL查询)关系数据库,可能会因为底层数据量很大,使得查询的时间很长。
因此,基于现有的数据分析方法,在进行数据获取时,数据获取效率较低。
发明内容
本发明实施例的目的在于提供一种数据获取方法及装置,以提高数据获取效率。具体技术方案如下:
第一方面,本发明提供了一种数据获取方法,应用于服务器,所述方法包括:
接收数据获取请求,所述数据获取请求包括至少一个关键词;
确定各关键词的维度属性,并根据各维度属性与各标识信息的对应关系及各关键词与各标识信息的对应关系,确定所述数据获取请求中包括的各关键词对应的标识信息及各关键词的维度属性对应的标识信息;
根据预设合并规则,将所述各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到所述数据获取请求对应的至少一个目标键值;
基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据。
进一步地,在所述基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据之前,所述方法还包括:
针对每个目标键值,根据所述目标键值中包含的维度属性的数量,及立方表中包含的总维度属性的数量,判断所述目标键值是否为目的目标键值;
如果是,所述基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据包括:
从预先保存的包含有各键值与各数据对应关系的立方表中,获取所述目的目标键值对应的数据。
进一步地,判断所述目标键值非目的目标键值时,所述基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据包括:
识别所述目标键值中包含的维度属性的标识信息,所述目标键值中包含的关键词的标识信息及每个标识信息所在的位置;根据所述立方表中包含的每个维度属性,根据在对应的位置上是否包含所述维度属性的标识信息及关键词的标识信息,确定所述目标键值对应的每个目的目标键值;并从预先保存的包含有各键值与各数据对应关系的立方表中,获取所述每个目的目标键值对应的数据;或
根据立方表中保存的每个目标键值与键值组的对应关系,查找所述目标键值对应的键值组,将所述键值组中的各个键值作为目的目标键值;并获取所述键值组中每个目的目标键值对应的数据。
进一步地,所述根据预设合并规则,将所述各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到所述数据获取请求对应的至少一个目标键值包括:
判断关键词之间的关系;
如果两个关键词之间是与的关系时,根据所述两个关键词对应的维度属性,维度属性的排列顺序,以及每个标识信息对应的位置,确定该两个关键词对应的目标键值;
如果两个关键词之间是或的关系时,针对每个关键词,根据该关键词对应的维度属性,以及每个标识信息对应的位置,确定每个关键词对应的目标键值。
进一步地,建立所述立方表的过程包括:
针对事实表中记录的每条信息,识别该信息中记录的每个维度属性;
根据各维度属性与各标识信息的对应关系,确定每个维度属性对应的标识信息;并
根据该条信息每个维度属性对应的每个关键词,及各关键词与各标识信息的对应关系,确定每个关键词对应的标识信息;
根据预设合并规则,将所述每个关键词对应的标识信息及每个维度属性对应的标识信息合并,确定该条记录对应的键值;
根据该条信息中包含的数据,在立方表中保存所述键值与所述数据的对应关系。
进一步地,所述方法还包括:
针对所述立方表中包含的每个第一键值,判断所述第一键值是否包含所述立方表中所有维度属性对应的标识信息;
如果否,针对所述第一键值,根据所述第一键值包含的每个标识信息,将在对应的位置上包含相同维度属性的标识信息及关键词的标识信息的第二键值,作为该第一键值对应的键值组中的第二键值;
在所述立方表中针对所述第一键值保存键值组,其中所述键值组中包含每个第二键值及该第二键值对应的数据。
进一步地,所述方法还包括:
按照预定的时间间隔,检测事实表中是否存在未更新到立方表的数据;
若是,则将所述数据更新到所述立方表。
进一步地,所述基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据包括:
检测事实表中是否存在未更新到立方表的数据,若是,则根据立方表中各键值与各数据的对应关系获得所述目标键值对应的第一数据,并合并从所述事实表中未更新数据中获取的与所述数据获取请求中包括的各关键词匹配的第二数据。
进一步地,所述检测事实表中是否存在未更新到立方表的数据包括:
根据事实表中记录的各数据的时间标识信息,判断是否存在位于度量缓存中保存的时间范围内的时间标识信息;
若是,则确定该事实表中存在未更新到立方表的数据。
第二方面,本发明提供了一种数据获取装置,应用于服务器,所述装置包括:
接收模块,用于接收数据获取请求,所述数据获取请求包括至少一个关键词;
第一确定模块,用于确定各关键词的维度属性,并根据各维度属性与各标识信息的对应关系及各关键词与各标识信息的对应关系,确定所述数据获取请求中包括的各关键词对应的标识信息及各关键词的维度属性对应的标识信息;
合并模块,用于根据预设合并规则,将所述各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到所述数据获取请求对应的至少一个目标键值;
获取模块,用于基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据。
进一步地,所述装置还包括:
第一判断模块,用于针对每个目标键值,根据所述目标键值中包含的维度属性的数量,及立方表中包含的总维度属性的数量,判断所述目标键值是否为目的目标键值;
当所述第一判断模块判断结果为是时,所述获取模块具体用于:
从预先保存的包含有各键值与各数据对应关系的立方表中,获取所述目的目标键值对应的数据。
进一步地,当所述第一判断模块判断结果为否时,所述获取模块具体用于:
识别所述目标键值中包含的维度属性的标识信息,所述目标键值中包含的关键词的标识信息及每个标识信息所在的位置;根据所述立方表中包含的每个维度属性,根据在对应的位置上是否包含所述维度属性的标识信息及关键词的标识信息,确定所述目标键值对应的每个目的目标键值;并从预先保存的包含有各键值与各数据对应关系的立方表中,获取所述每个目的目标键值对应的数据;或
根据立方表中保存的每个目标键值与键值组的对应关系,查找所述目标键值对应的键值组,将所述键值组中的各个键值作为目的目标键值;并获取所述键值组中每个目的目标键值对应的数据。
进一步地,所述合并模块具体用于:
判断关键词之间的关系;
如果两个关键词之间是与的关系时,根据所述两个关键词对应的维度属性,维度属性的排列顺序,以及每个标识信息对应的位置,确定该两个关键词对应的目标键值;
如果两个关键词之间是或的关系时,针对每个关键词,根据该关键词对应的维度属性,以及每个标识信息对应的位置,确定每个关键词对应的目标键值。
进一步地,所述装置还包括:
识别模块,用于针对事实表中记录的每条信息,识别该信息中记录的每个维度属性;
第二确定模块,用于根据各维度属性与各标识信息的对应关系,确定每个维度属性对应的标识信息;
第三确定模块,用于根据该条信息每个维度属性对应的每个关键词,及各关键词与各标识信息的对应关系,确定每个关键词对应的标识信息;
组合模块,用于根据预设合并规则,将所述每个关键词对应的标识信息及每个维度属性对应的标识信息合并,确定该条记录对应的键值;
第一存储模块,用于根据该条信息中包含的数据,在立方表中保存所述键值与所述数据的对应关系。
进一步地,所述装置还包括:
第二判断模块,用于针对所述立方表中包含的每个第一键值,判断所述第一键值是否包含所述立方表中所有维度属性对应的标识信息;
第四确定模块,用于当所述第二判断模块判断结果为否时,针对所述第一键值,根据所述第一键值包含的每个标识信息,将在对应的位置上包含相同维度属性的标识信息及关键词的标识信息的第二键值,作为该第一键值对应的键值组中的第二键值;
第二存储模块,用于在所述立方表中针对所述第一键值保存键值组,其中所述键值组中包含每个第二键值及该第二键值对应的数据。
进一步地,所述装置还包括:
检测模块,用于按照预定的时间间隔,检测事实表中是否存在未更新到立方表的数据;
更新模块,用于当检测模块的检测结果为是时,将所述数据更新到所述立方表。
进一步地,所述获取模块具体用于:
检测事实表中是否存在未更新到立方表的数据,若是,则根据立方表中各键值与各数据的对应关系获得所述目标键值对应的第一数据,并合并从所述事实表中未更新数据中获取的与所述数据获取请求中包括的各关键词匹配的第二数据。
进一步地,所述检测模块具体用于:
根据事实表中记录的各数据的时间标识信息,判断是否存在位于度量缓存中保存的时间范围内的时间标识信息;
若是,则确定该事实表中存在未更新到立方表的数据。
本发明实施例提供的数据获取方法及装置,该方法包括:接收数据获取请求,所述数据获取请求包括至少一个关键词;确定各关键词的维度属性,并根据各维度属性与各标识信息的对应关系及各关键词与各标识信息的对应关系,确定所述数据获取请求中包括的各关键词对应的标识信息及各关键词的维度属性对应的标识信息;根据预设合并规则,将所述各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到所述数据获取请求对应的至少一个目标键值;基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据。由于在本发明实施例中直接通过预先保存的键值与数据的对应关系查找与目标键值对应的数据,而不需要遍历服务器中所有的数据来查找与数据获取请求匹配的数据,因此能够提高数据获取效率。并且,由于在立方表中存储的是各键值与各数据的对应关系,利用键值可以实现用较少字节的标识信息来代替关键字,从而可以对源数据进行压缩,减小了源数据的存储空间。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据本发明提供的数据获取方法的一个实施例的示意性流程图;
图2示出了本发明实施例提供的建立立方表的方法的示意性流程图;
图3示出了本发明另一实施例提供的建立立方表的方法的示意性流程图;
图4示出了根据本发明提供的数据获取装置的一个实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
请参考图1,其示出了根据本发明提供的数据获取方法的一个实施例的示意性流程图。
如图1所示,本实施例提供的数据获取方法,应用于服务器,可以包括如下步骤:
步骤101,接收数据获取请求,该数据获取请求包括至少一个关键词。
随着大数据领域的发展,用户可以方便地获取到自己想要的数据。具体地,用户可以基于自己想要的数据,输入包括至少一个关键词的数据获取请求,以供服务器查询相关的数据。
在本实施例中,服务器可以接收用户输入的包括至少一个关键词的数据获取请求,以基于数据获取请求中的关键词,为用户查询其想要的数据。
步骤102,确定各关键词的维度属性,并根据各维度属性与各标识信息的对应关系及各关键词与各标识信息的对应关系,确定所述数据获取请求中包括的各关键词对应的标识信息及各关键词的维度属性对应的标识信息。
在本实施例中,为了快速为用户查询数据,服务器可以首先对大数据进行预处理。通常情况下,每一个大数据事实表中会包括多个维度属性,每个维度属性又对应多个关键词。因此,可以预先设定各维度属性与各标识信息的对应关系,以及各关键词与各标识信息的对应关系。从而可以对事实表进行处理,得到对应的立方表。
服务器接收到包括至少一个关键词的数据获取请求后,可以根据数据获取请求中包括的每个关键词,并根据用于获取数据的立方表,确定各关键词的维度属性。
例如,当数据获取请求中包括的关键词为:苹果、A等级和杭州时,针对上述数据获取请求,服务器根据下表所示的立方表可以分别确定各关键词的维度属性为:水果种类、等级和产地。
键值 数量 键值 数量
a-1-0-0 800 ac-1-0-1 500
a-2-0-0 200 ac-1-0-2 300
b-0-1-0 700 ac-2-0-2 200
b-0-2-0 300 bc-0-1-1 500
c-0-0-1 500 bc-0-1-2 200
c-0-0-2 500 bc-0-2-2 300
ab-1-1-0 500 abc-1-1-1 500
ab-1-2-0 300 abc-1-2-2 300
ab-2-1-0 200 abc-2-1-2 200
确定各关键词的维度属性后,可以根据预设的各维度属性和各标识信息的对应关系以及各关键词和各标识信息的对应关系,确定数据获取请求中各关键词对应的标识信息及各关键词的维度属性对应的标识信息。如下表所示:各维度属性和各标识信息的对应关系以及各关键词和各标识信息的对应关系。
根据上述表格,确定的各关键词对应的标识信息分别为:苹果-1、A等级-1和杭州-1,各关键词的维度属性对应的标识信息为:水果种类-a、等级-b、产地-c。
步骤103,根据预设合并规则,将所述各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到所述数据获取请求对应的至少一个目标键值。
确定数据获取请求中各关键词对应的标识信息以及各关键词的维度属性对应的标识信息后,可以根据预设合并规则,将各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到数据获取请求对应的至少一个目标键值,以在立方表中查询相应的数据。
在本实施例的一个可选实现方式中,在得到目标键值之前,可以首先判断关键词之间的关系。每两个关键词之间的关系可以包括:与、或。当关键词之间的关系不同时,可以利用不同的方法得到目标键值。
具体地,如果两个关键词之间是与的关系时,根据该两个关键词对应的维度属性,维度属性的排列顺序,以及每个标识信息对应的位置,确定该两个关键词对应的目标键值。
例如,当上述数据获取请求中的关键词苹果、A等级、杭州之间均是与的关系时,根据各关键词对应的维度属性:水果种类、等级、产地,各维度属性的排列顺序以及每个标识信息对应的位置,可以确定这3个关键词对应的目标键值为:abc-1-1-1。
如果两个关键词之间是或的关系时,针对每个关键词,根据该关键词对应的维度属性,以及每个标识信息对应的位置,确定每个关键词对应的目标键值。
例如,当上述数据获取请求中的关键词苹果、A等级、杭州均为或的关系,则针对每个关键词,根据该关键词对应的维度属性,以及每个标识信息对应的位置,可以确定这3各关键词分别对应的目标键值为:a-1-0-0、b-0-1-0、c-0-0-1。
步骤104,基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据。
得到目标键值后,服务器可以基于该目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据。
具体地,可以首先针对每个目标键值,根据该目标键值中包含的维度属性的数量,及立方表中包含的总维度属性的数量,判断该目标键值是否为目的目标键值。
得到数据获取请求对应的至少一个目标键值后,服务器可以针对每个目标键值,根据该目标键值中包含的维度属性的数量,及立方表中包含的总维度属性的数量,判断该目标键值是否为目的目标键值。也就是说,针对每个目标键值,判断是否只利用该目标键值即可得到与数据获取请求匹配的数据。
例如,当目标键值中包含的维度属性的数量为3,且立方表中包含的总维度属性的数量也为3时,表明该目标键值为根据数据获取请求中的关键词确定的唯一的键值,因此,可以确定该目标键值为目的目标键值。
当目标键值中包含的维度属性的数量为2,而立方表中包含的总维度属性的数量为3时,表明该目标键值只确定了两个维度属性的关键词,当这两个关键词确定之后,另一个维度属性中的关键词取任意值都满足数据获取请求。也就是说,只利用该目标键值不能得到与数据获取请求匹配的数据,在立方表中其它键值中,还有与数据获取请求中各关键词匹配的键值。因此,该目标键值不是目的目标键值。
当目标键值是目的目标键值时,可以从预先保存的包含有各键值与各数据对应关系的立方表中,获取该目的目标键值对应的数据。
当目标键值不是目的目标键值时,服务器可以基于该目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与数据获取请求匹配的数据。
可选地,在一种实现方式中,可以首先根据目标键值中包含的维度属性,及立方表中包含的每个维度属性,确定目标键值对应的每个目的目标键值。
具体地,在确定目标键值对应的每个目的目标键值时,可以首先识别该目标键值中包含的维度属性的标识信息,目标键值中包含的关键词的标识信息及每个标识信息所在的位置,然后根据立方表中包含的每个维度属性,根据在对应的位置上是否包含该维度属性的标识信息及关键词的标识信息,确定目标键值对应的每个目的目标键值。
例如,当目标键值为a-1-0-0时,该目标键值中包含的维度属性为水果种类,其对应的标识信息为a,立方表中包含的全部维度属性为:水果种类、等级和产地,水果种类的标识信息所在的位置为第一位,因此,可以确定该目标键值对应的每个目的目标键值为a-1-0-0、ab-1-*-0、ac-1-0-*、abc-1-*-*,其中,“*”代表相应位置可为该维度属性中任一关键词的标识信息。
确定目标键值对应的目的目标键值后,可以从预先保存的包含有各键值与各数据对应关系的立方表中,获取每个目的目标键值对应的数据。可选地,可以翻译各目的目标键值对应的含义,并展示各目的目标键值的含义及相应的数据。
在上述实现方式中,确定目标键值后,需要进一步从立方表中所有键值中,查找该目标键值对应的目的目标键值。为了提高数据获取效率,可以预先在立方表中保存每个目标键值与键值组的对应关系,每一个键值组中包含了与目标键值在对应的位置上包含相同的维度属性的标识信息及关键词的标识信息的多个目的目标键值。
因此,在另一种实现方式中,得到目标键值后,可以根据立方表中保存的每个目标键值与键值组的对应关系,查找该目标键值对应的键值组,将该键值组中的各个键值作为目的目标键值,并获取该键值组中每个目的目标键值对应的数据。
在本实施例中,通过立方表中保存的各键值与各数据的对应关系,得到目的目标键值对应的数据。有的情况下,当事实表更新时,立方表可能还没更新。这时候,如果用户获取数据,则其可能获取到不太准确的数据。
在一种实现方式中,从立方表中获取数据之前,可以首先检测事实表中是否存在未更新到立方表的数据,若是,则可以根据立方表中各键值与各数据的对应关系获得目标键值对应的第一数据,并合并从事实表中未更新数据中获取的与数据获取请求中包括的各关键词匹配的第二数据。
具体地,可以根据事实表中记录的各数据的时间标识信息,判断是否存在位于度量缓存中保存的时间范围内的时间标识信息,若是,则确定该事实表中存在未更新到立方表的数据。
本实施例提供的数据获取方法,可以直接通过预先保存的键值与数据的对应关系查找与目标键值对应的数据,而不需要遍历服务器中所有的数据来查找与数据获取请求匹配的数据,因此能够提高数据获取效率。并且,由于在立方表中存储的是各键值与各数据的对应关系,利用键值可以实现用较少字节的标识信息来代替关键字,从而可以对源数据进行压缩,减小了源数据的存储空间。在进行数据获取时,同时使用立方表和事实表中未更新到立方表中的数据来获取与数据获取请求匹配的数据,能够提高获取的数据的准确性。在立方表中建立键值组,当得到目标键值不是目的目标键值时,可以直接从立方表中查找相应的键值组,而不需要遍历各目标键值,查找目标键值对应的目的目标键值,能够提高数据获取效率。
在图1所示实施例的基础上,本发明还提供了另外一种实施方式,请参考图2,其示出了本发明实施例提供的建立立方表的方法的示意性流程图。
如图2所示,本实施例提供的建立立方表的方法,可以包括如下步骤:
步骤201,针对事实表中记录的每条信息,识别该信息中记录的每个维度属性。
在本实施例中,可以针对事实表,建立对应的立方表。具体地,可以针对事实表中记录的每条信息,识别该信息中记录的每个维度属性。
例如,针对如下表所示的事实表:
水果种类 等级 产地 数量
苹果 A 杭州 500
苹果 B 上海 300
橘子 A 上海 200
可以识别每个维度属性,即分别为:水果种类、等级和产地。
步骤202,根据各维度属性与各标识信息的对应关系,确定每个维度属性对应的标识信息。
确定事实表中的维度属性后,可以根据各维度属性与各标识信息的对应关系,确定每个维度属性对应的标识信息。
上述事实表中各维度属性对应的标识信息可以为:
水果种类:a 等级:b 产地:c
步骤203,根据该条信息每个维度属性对应的每个关键词,及各关键词与各标识信息的对应关系,确定每个关键词对应的标识信息。
确定每个维度属性对应的标识信息后,可以进一步确定每个维度属性对应的关键词。如,上述事实表中,每个维度属性对应的关键词分别为:
并且,可以确定每个维度属性中包括的每个关键词对应的标识信息:
步骤204,根据预设合并规则,将所述每个关键词对应的标识信息及每个维度属性对应的标识信息合并,确定该条记录对应的键值。
得到事实表中每个维度属性对应的标识信息及每个关键词对应的标识信息后,可以根据预设合并规则,将所述每个关键词对应的标识信息及每个维度属性对应的标识信息合并,确定该条记录对应的键值。具体地,可以基于预先设定的键值中出现的标识信息及各标识信息的位置等,得到对应的键值。
例如,对上述事实表中出现的各维度属性对应的标识信息以及各关键词对应的标识信息进行合并后,可以得到下列键值:a-1-0-0、a-2-0-0、b-0-1-0、b-0-2-0、c-0-0-1、c-0-0-2、ab-1-1-0、ab-1-2-0、ab-2-1-0、ac-1-0-1、ac-1-0-2、ac-2-0-2、bc-0-1-1、bc-0-1-2、bc-0-2-2、abc-1-1-1、abc-1-2-2、abc-2-1-2。
其中,上述各键值含义解释如下表:
步骤205,根据该条信息中包含的数据,在立方表中保存所述键值与所述数据的对应关系。
得到各键值后,可以根据事实表中记录的数据,确定每个键值对应的数据。例如,根据键值的含义,可以对事实表中的数据进行求和、求平均等处理,得到键值对应的数据。并在立方表中保存各键值与数据的对应关系。
可选地,在立方表中保存各键值及对应的数据时,可以按照预设的顺序将各键值进行保存。如,当标识信息中包括字母时,可以按照字母顺序将每个键值及其对应的数据保存在立方表中。当标识信息中包括数字时,可以按照数字大小顺序将每个键值及其对应的数据保存在立方表中。
例如,针对上述事实表,可以得到如下所示的立方表:
可选地,为了保证用户获取到准确的数据,当事实表更新时,可以更新对应的立方表。然而,若在事实表更新的同时更新对应的立方表,会给事实表的数据写入带来很大的性能瓶颈,会增加数据写入的时间。因此,在本实施例中,可以异步更新立方表。
具体地,可以按照预定的时间间隔,检测事实表中是否存在未更新到对应立方表的数据,若是,则将该数据更新到立方表。
例如,当事实表中数据更新时,可以将新更新的数据保存在度量缓存中,当服务器将度量缓存中的数据更新到立方表时,可以将度量缓存中的数据删除。因此,服务器可以通过检测度量缓存中是否保存有数据来确定事实表中是否有未更新到立方表的数据。
可选地,为了减少内存消耗,当事实表中数据更新时,可以在度量缓存中不保存全部的新更新的数据,而只根据新更新的数据的时间标识信息,设定一定的时间范围。在检测事实表是否更新时,可以根据事实表中记录的各数据的时间标识信息,判断是否存在位于度量缓存中保存的时间范围内的时间标识信息,若是,则确定该事实表中存在未更新到立方表的数据。
在事实表中保存数据时,各数据可以有自己的时间标识信息,如,可以将录入数据的时间设定为该数据的时间标识信息。当事实表中录入新的数据时,可以根据新录入的数据的时间标识信息,设定数据更新时间范围,并在度量缓存中保存该时间范围。
有些情况下,如数据获取请求中包括的关键词之间的关系为“或”,或者数据获取请求中包括的关键词对应的维度属性只是立方表中的部分维度属性时,在获取数据时,通过上述立方表中的一个目标键值不能得到与数据获取请求匹配的数据。
因此,本发明提供了另外一种实施方式,请参考图3,其示出了本发明另一实施例提供的建立立方表的方法的示意性流程图。
如图3所示,本实施例提供的建立立方表的方法,可以包括如下步骤:
步骤301,针对事实表中记录的每条信息,识别该信息中记录的每个维度属性。
步骤302,根据各维度属性与各标识信息的对应关系,确定每个维度属性对应的标识信息。
步骤303,根据该条信息每个维度属性对应的每个关键词,及各关键词与各标识信息的对应关系,确定每个关键词对应的标识信息。
步骤304,根据预设合并规则,将所述每个关键词对应的标识信息及每个维度属性对应的标识信息合并,确定该条记录对应的键值。
步骤305,根据该条信息中包含的数据,在立方表中保存所述键值与所述数据的对应关系。
步骤306,针对所述立方表中包含的每个第一键值,判断所述第一键值是否包含所述立方表中所有维度属性对应的标识信息,如果是,针对所述第一键值,在所述立方表中保存该第一键值及第一键值对应的数据,如果否,则进行步骤307。
在本实施例中,可以对立方表中保存的各目标键值与各数据的对应关系进行进一步的处理。具体地,可以根据立方表中包含的每个目标键值,保存其对应的键值组。例如,可以将在对应的位置上包含相同维度属性的标识信息及关键词的标识信息的目标键值组合,得到对应的键值组。在获取数据时,可以根据目标键值,确定对应的目标键值组,然后获取目标键值组中各目标键值对应的数据。
具体地,首先可以针对立方表中包含的每个第一键值,判断该第一键值是否包含立方表中所有维度属性对应的标识信息。当该第一键值包含立方表中所有维度属性对应的标识信息时,此时说明立方表中其它键值中,没有与该第一键值在对应的位置上包含相同维度属性的标识信息及关键词的标识信息的键值,即该第一键值没有对应的键值组。当该第一键值没有包含立方表中所有维度属性对应的标识信息时,此时说明立方表中其它键值中,有与该第一键值在对应的位置上包含相同维度属性的标识信息及关键词的标识信息的键值,即该第一键值有对应的键值组。
步骤307,当该第一键值没有包含所述立方表中所有维度属性对应的标识信息时,针对所述第一键值,根据所述第一键值包含的每个标识信息,将在对应的位置上包含相同维度属性的标识信息及关键词的标识信息的第二键值,作为该第一键值对应的键值组中的第二键值。
在本实施例中,可以针对每个不包含该立方表中所有维度属性对应的标识信息的键值,建立该键值对应的键值组。
例如,针对图2所示实施例中建立的立方表中的键值a-1-0-0,可以获取在对应的位置上包含相同维度属性的标识信息及关键词的标识信息的目标键值组合,即ab-1-1-0、ab-1-2-0、ac-1-0-1、ac-1-0-2、abc-1-1-1、abc-1-2-2。将获取的所有的目标键值组合,得到键值a-1-0-0对应的键值组。
可选地,为了在进行数据获取时,提高数据获取效率,可以为各键值组设定对应的标识信息。例如,针对每一个键值组,可以将该键值组中每个目标键值的共同的维度属性的标识信息及关键词的标识信息设定为该键值组对应的标识信息。如,上述键值组的标识信息可以为:a-1-0-0。
步骤308,在所述立方表中针对所述第一键值保存键值组,其中所述键值组中包含每个第二键值及该第二键值对应的数据。
得到各键值组后,可以根据立方表中保存的各目标键值与数据的对应关系,获得各键值组中包含的每个目标键值对应的数据。并在立方表中对应保存每个键值组中包含的各目标键值与数据的对应关系。
例如,针对上述建立的键值组,获取到该键值组中每个目标键值对应的数据后,可以在立方表中保存将该键值组中包含的各目标键值及对应的数据。如下表所示,上述键值组a-1-0-0保存结果:
键值 数量 键值 数量
a-1-0-0 800 ac-1-0-2 300
ab-1-1-0 500 abc-1-1-1 500
ab-1-2-0 300 abc-1-2-2 300
ac-1-0-1 500
在立方表中建立键值组后,在获取数据时,当得到目标键值不是目的目标键值时,可以直接从立方表中查找与目标键值对应的键值组,而不需要遍历各目标键值,查找目标键值对应的目的目标键值,能够提高数据获取效率。
请参考图4,其示出了根据本发明提供的数据获取装置的一个实施例的结构示意图。
如图4所示,本发明实施例提供的数据获取装置,应用于服务器,可以包括:
接收模块410,用于接收数据获取请求,所述数据获取请求包括至少一个关键词;
第一确定模块420,用于确定各关键词的维度属性,并根据各维度属性与各标识信息的对应关系及各关键词与各标识信息的对应关系,确定所述数据获取请求中包括的各关键词对应的标识信息及各关键词的维度属性对应的标识信息;
合并模块430,用于根据预设合并规则,将所述各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到所述数据获取请求对应的至少一个目标键值;
获取模块440,用于基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据。
进一步地,所述装置还包括:
第一判断模块(未示出),用于针对每个目标键值,根据所述目标键值中包含的维度属性的数量,及立方表中包含的总维度属性的数量,判断所述目标键值是否为目的目标键值;
当第一判断模块判断结果为是时,所述获取模块440具体用于:从预先保存的包含有各键值与各数据对应关系的立方表中,获取所述目的目标键值对应的数据。
进一步地,当第一判断模块判断结果为否时,所述获取模块440具体用于:识别所述目标键值中包含的维度属性的标识信息,所述目标键值中包含的关键词的标识信息及每个标识信息所在的位置;根据所述立方表中包含的每个维度属性,根据在对应的位置上是否包含所述维度属性的标识信息及关键词的标识信息,确定所述目标键值对应的每个目的目标键值;并从预先保存的包含有各键值与各数据对应关系的立方表中,获取所述每个目的目标键值对应的数据;或根据立方表中保存的每个目标键值与键值组的对应关系,查找所述目标键值对应的键值组,将所述键值组中的各个键值作为目的目标键值;并获取所述键值组中每个目的目标键值对应的数据。
进一步地,合并模块430具体用于:判断关键词之间的关系;如果两个关键词之间是与的关系时,根据所述两个关键词对应的维度属性,维度属性的排列顺序,以及每个标识信息对应的位置,确定该两个关键词对应的目标键值;如果两个关键词之间是或的关系时,针对每个关键词,根据该关键词对应的维度属性,以及每个标识信息对应的位置,确定每个关键词对应的目标键值。
进一步地,获取模块440具体用于:检测事实表中是否存在未更新到立方表的数据,若是,则根据立方表中各键值与各数据的对应关系获得所述目标键值对应的第一数据,并合并从所述事实表中未更新数据中获取的与所述数据获取请求中包括的各关键词匹配的第二数据。
在本实施例的一个可选实现方式中,所述装置还包括:
识别模块(未示出),用于针对事实表中记录的每条信息,识别该信息中记录的每个维度属性;
第二确定模块(未示出),用于根据各维度属性与各标识信息的对应关系,确定每个维度属性对应的标识信息;
第三确定模块(未示出),用于根据该条信息每个维度属性对应的每个关键词,及各关键词与各标识信息的对应关系,确定每个关键词对应的标识信息;
组合模块(未示出),用于根据预设合并规则,将所述每个关键词对应的标识信息及每个维度属性对应的标识信息合并,确定该条记录对应的键值;
第一存储模块(未示出),用于根据该条信息中包含的数据,在立方表中保存所述键值与所述数据的对应关系。
进一步地,所述装置还包括:
检测模块(未示出),用于按照预定的时间间隔,检测事实表中是否存在未更新到立方表的数据;
更新模块(未示出),用于当检测模块的检测结果为是时,将所述数据更新到所述立方表。
进一步地,检测模块具体用于:根据事实表中记录的各数据的时间标识信息,判断是否存在位于度量缓存中保存的时间范围内的时间标识信息;若是,则确定该事实表中存在未更新到立方表的数据。
在本实施例的另一个可选实现方式中,所述装置还包括:
第二判断模块(未示出),用于针对所述立方表中包含的每个第一键值,判断所述第一键值是否包含所述立方表中所有维度属性对应的标识信息;
第四确定模块(未示出),用于当所述第二判断模块判断结果为否时,针对所述第一键值,根据所述第一键值包含的每个标识信息,将在对应的位置上包含相同维度属性的标识信息及关键词的标识信息的第二键值,作为该第一键值对应的键值组中的第二键值;
第二存储模块(未示出),用于在所述立方表中针对所述第一键值保存键值组,其中所述键值组中包含每个第二键值及该第二键值对应的数据。
本实施例提供的数据获取装置,可以直接通过预先保存的键值与数据的对应关系查找与目标键值对应的数据,而不需要遍历服务器中所有的数据来查找与数据获取请求匹配的数据,因此能够提高数据获取效率。并且,由于在立方表中存储的是各键值与各数据的对应关系,利用键值可以实现用较少字节的标识信息来代替关键字,从而可以对源数据进行压缩,减小了源数据的存储空间。
对于系统/装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (18)

1.一种数据获取方法,其特征在于,应用于服务器,所述方法包括:
接收数据获取请求,所述数据获取请求包括至少一个关键词;
确定各关键词的维度属性,并根据各维度属性与各标识信息的对应关系及各关键词与各标识信息的对应关系,确定所述数据获取请求中包括的各关键词对应的标识信息及各关键词的维度属性对应的标识信息;
根据预设合并规则,将所述各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到所述数据获取请求对应的至少一个目标键值;
基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据。
2.根据权利要求1所述的方法,其特征在于,在所述基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据之前,所述方法还包括:
针对每个目标键值,根据所述目标键值中包含的维度属性的数量,及立方表中包含的总维度属性的数量,判断所述目标键值是否为目的目标键值;
如果是,所述基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据包括:
从预先保存的包含有各键值与各数据对应关系的立方表中,获取所述目的目标键值对应的数据。
3.根据权利要求2所述的方法,其特征在于,判断所述目标键值非目的目标键值时,所述基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据包括:
识别所述目标键值中包含的维度属性的标识信息,所述目标键值中包含的关键词的标识信息及每个标识信息所在的位置;根据所述立方表中包含的每个维度属性,根据在对应的位置上是否包含所述维度属性的标识信息及关键词的标识信息,确定所述目标键值对应的每个目的目标键值;并从预先保存的包含有各键值与各数据对应关系的立方表中,获取所述每个目的目标键值对应的数据;或
根据立方表中保存的每个目标键值与键值组的对应关系,查找所述目标键值对应的键值组,将所述键值组中的各个键值作为目的目标键值;并获取所述键值组中每个目的目标键值对应的数据。
4.根据权利要求1所述的方法,其特征在于,所述根据预设合并规则,将所述各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到所述数据获取请求对应的至少一个目标键值包括:
判断关键词之间的关系;
如果两个关键词之间是与的关系时,根据所述两个关键词对应的维度属性,维度属性的排列顺序,以及每个标识信息对应的位置,确定该两个关键词对应的目标键值;
如果两个关键词之间是或的关系时,针对每个关键词,根据该关键词对应的维度属性,以及每个标识信息对应的位置,确定每个关键词对应的目标键值。
5.根据权利要求1所述的方法,其特征在于,建立所述立方表的过程包括:
针对事实表中记录的每条信息,识别该信息中记录的每个维度属性;
根据各维度属性与各标识信息的对应关系,确定每个维度属性对应的标识信息;并
根据该条信息每个维度属性对应的每个关键词,及各关键词与各标识信息的对应关系,确定每个关键词对应的标识信息;
根据预设合并规则,将所述每个关键词对应的标识信息及每个维度属性对应的标识信息合并,确定该条记录对应的键值;
根据该条信息中包含的数据,在立方表中保存所述键值与所述数据的对应关系。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
针对所述立方表中包含的每个第一键值,判断所述第一键值是否包含所述立方表中所有维度属性对应的标识信息;
如果否,针对所述第一键值,根据所述第一键值包含的每个标识信息,将在对应的位置上包含相同维度属性的标识信息及关键词的标识信息的第二键值,作为该第一键值对应的键值组中的第二键值;
在所述立方表中针对所述第一键值保存键值组,其中所述键值组中包含每个第二键值及该第二键值对应的数据。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
按照预定的时间间隔,检测事实表中是否存在未更新到立方表的数据;
若是,则将所述数据更新到所述立方表。
8.根据权利要求1所述的方法,其特征在于,所述基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据包括:
检测事实表中是否存在未更新到立方表的数据,若是,则根据立方表中各键值与各数据的对应关系获得所述目标键值对应的第一数据,并合并从所述事实表中未更新数据中获取的与所述数据获取请求中包括的各关键词匹配的第二数据。
9.根据权利要求7或8所述的方法,其特征在于,所述检测事实表中是否存在未更新到立方表的数据包括:
根据事实表中记录的各数据的时间标识信息,判断是否存在位于度量缓存中保存的时间范围内的时间标识信息;
若是,则确定该事实表中存在未更新到立方表的数据。
10.一种数据获取装置,其特征在于,应用于服务器,所述装置包括:
接收模块,用于接收数据获取请求,所述数据获取请求包括至少一个关键词;
第一确定模块,用于确定各关键词的维度属性,并根据各维度属性与各标识信息的对应关系及各关键词与各标识信息的对应关系,确定所述数据获取请求中包括的各关键词对应的标识信息及各关键词的维度属性对应的标识信息;
合并模块,用于根据预设合并规则,将所述各关键词对应的标识信息及各关键词的维度属性对应的标识信息合并,得到所述数据获取请求对应的至少一个目标键值;
获取模块,用于基于所述目标键值,从预先保存的包含有各键值与各数据对应关系的立方表中,获取与所述数据获取请求匹配的数据。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:
第一判断模块,用于针对每个目标键值,根据所述目标键值中包含的维度属性的数量,及立方表中包含的总维度属性的数量,判断所述目标键值是否为目的目标键值;
当所述第一判断模块判断结果为是时,所述获取模块具体用于:
从预先保存的包含有各键值与各数据对应关系的立方表中,获取所述目的目标键值对应的数据。
12.根据权利要求11所述的装置,其特征在于,当所述第一判断模块判断结果为否时,所述获取模块具体用于:
识别所述目标键值中包含的维度属性的标识信息,所述目标键值中包含的关键词的标识信息及每个标识信息所在的位置;根据所述立方表中包含的每个维度属性,根据在对应的位置上是否包含所述维度属性的标识信息及关键词的标识信息,确定所述目标键值对应的每个目的目标键值;并从预先保存的包含有各键值与各数据对应关系的立方表中,获取所述每个目的目标键值对应的数据;或
根据立方表中保存的每个目标键值与键值组的对应关系,查找所述目标键值对应的键值组,将所述键值组中的各个键值作为目的目标键值;并获取所述键值组中每个目的目标键值对应的数据。
13.根据权利要求10所述的装置,其特征在于,所述合并模块具体用于:
判断关键词之间的关系;
如果两个关键词之间是与的关系时,根据所述两个关键词对应的维度属性,维度属性的排列顺序,以及每个标识信息对应的位置,确定该两个关键词对应的目标键值;
如果两个关键词之间是或的关系时,针对每个关键词,根据该关键词对应的维度属性,以及每个标识信息对应的位置,确定每个关键词对应的目标键值。
14.根据权利要求10所述的装置,其特征在于,所述装置还包括:
识别模块,用于针对事实表中记录的每条信息,识别该信息中记录的每个维度属性;
第二确定模块,用于根据各维度属性与各标识信息的对应关系,确定每个维度属性对应的标识信息;
第三确定模块,用于根据该条信息每个维度属性对应的每个关键词,及各关键词与各标识信息的对应关系,确定每个关键词对应的标识信息;
组合模块,用于根据预设合并规则,将所述每个关键词对应的标识信息及每个维度属性对应的标识信息合并,确定该条记录对应的键值;
第一存储模块,用于根据该条信息中包含的数据,在立方表中保存所述键值与所述数据的对应关系。
15.根据权利要求14所述的装置,其特征在于,所述装置还包括:
第二判断模块,用于针对所述立方表中包含的每个第一键值,判断所述第一键值是否包含所述立方表中所有维度属性对应的标识信息;
第四确定模块,用于当所述第二判断模块判断结果为否时,针对所述第一键值,根据所述第一键值包含的每个标识信息,将在对应的位置上包含相同维度属性的标识信息及关键词的标识信息的第二键值,作为该第一键值对应的键值组中的第二键值;
第二存储模块,用于在所述立方表中针对所述第一键值保存键值组,其中所述键值组中包含每个第二键值及该第二键值对应的数据。
16.根据权利要求14所述的装置,其特征在于,所述装置还包括:
检测模块,用于按照预定的时间间隔,检测事实表中是否存在未更新到立方表的数据;
更新模块,用于当检测模块的检测结果为是时,将所述数据更新到所述立方表。
17.根据权利要求10所述的装置,其特征在于,所述获取模块具体用于:
检测事实表中是否存在未更新到立方表的数据,若是,则根据立方表中各键值与各数据的对应关系获得所述目标键值对应的第一数据,并合并从所述事实表中未更新数据中获取的与所述数据获取请求中包括的各关键词匹配的第二数据。
18.根据权利要求16或17所述的装置,其特征在于,所述检测模块具体用于:
根据事实表中记录的各数据的时间标识信息,判断是否存在位于度量缓存中保存的时间范围内的时间标识信息;
若是,则确定该事实表中存在未更新到立方表的数据。
CN201610016651.9A 2016-01-11 2016-01-11 数据获取方法及装置 Active CN106959960B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610016651.9A CN106959960B (zh) 2016-01-11 2016-01-11 数据获取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610016651.9A CN106959960B (zh) 2016-01-11 2016-01-11 数据获取方法及装置

Publications (2)

Publication Number Publication Date
CN106959960A true CN106959960A (zh) 2017-07-18
CN106959960B CN106959960B (zh) 2020-07-03

Family

ID=59481191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610016651.9A Active CN106959960B (zh) 2016-01-11 2016-01-11 数据获取方法及装置

Country Status (1)

Country Link
CN (1) CN106959960B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108182221A (zh) * 2017-12-26 2018-06-19 珠海市君天电子科技有限公司 数据处理的方法以及相关设备
CN111026817A (zh) * 2019-12-09 2020-04-17 北京中电普华信息技术有限公司 一种多维计算方法及装置
CN111192149A (zh) * 2019-11-25 2020-05-22 泰康保险集团股份有限公司 一种核保结果数据生成方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8380489B1 (en) * 2009-02-11 2013-02-19 Guangsheng Zhang System, methods, and data structure for quantitative assessment of symbolic associations in natural language
CN104035980B (zh) * 2014-05-26 2017-08-04 王和平 一种面向结构化医药信息的检索方法和系统
CN105138583B (zh) * 2015-07-31 2018-09-04 北京奇虎科技有限公司 数据处理方法、装置和电子设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108182221A (zh) * 2017-12-26 2018-06-19 珠海市君天电子科技有限公司 数据处理的方法以及相关设备
CN108182221B (zh) * 2017-12-26 2022-05-31 北京乐蜜科技有限责任公司 数据处理的方法以及相关设备
CN111192149A (zh) * 2019-11-25 2020-05-22 泰康保险集团股份有限公司 一种核保结果数据生成方法和装置
CN111026817A (zh) * 2019-12-09 2020-04-17 北京中电普华信息技术有限公司 一种多维计算方法及装置
CN111026817B (zh) * 2019-12-09 2023-11-28 北京中电普华信息技术有限公司 一种多维计算方法及装置

Also Published As

Publication number Publication date
CN106959960B (zh) 2020-07-03

Similar Documents

Publication Publication Date Title
CN107577688B (zh) 基于媒体信息采集的原创文章影响力分析系统
Dasu et al. Mining database structure; or, how to build a data quality browser
CN107844565B (zh) 商品搜索方法和装置
US20110173197A1 (en) Methods and apparatuses for clustering electronic documents based on structural features and static content features
CN103605752A (zh) 一种基于语义识别的地址匹配方法
CN101425071A (zh) 位置描述检测装置、程序以及存储介质
CN105320778A (zh) 一种适用于电子商务中文网站商品标签化的方法
Scheffler et al. Matching points of interest from different social networking sites
CN111126865B (zh) 一种基于科技大数据的技术成熟度判断方法和系统
CN108846117A (zh) 商业快讯的去重筛选方法及装置
CN110008306A (zh) 一种数据关系分析方法、装置及数据服务系统
CN106959960A (zh) 数据获取方法及装置
CN105608113A (zh) 判断文本中poi数据的方法及装置
CN106446124A (zh) 一种基于网络关系图的网站分类方法
CN108536664A (zh) 商品领域的知识融合方法
CN103605744B (zh) 网站搜索引擎流量数据的分析方法及装置
CN111192015A (zh) 基于核心对象的一体化数据管理系统
CN105159898A (zh) 一种搜索的方法和装置
CN103927365A (zh) 一种基于能量函数的网页时间敏感性度量方法
CN110472019A (zh) 舆情搜索方法及装置
CN103853817A (zh) 基于gis的海量统计数据的空间奇异点发掘方法
CN112131215B (zh) 自底向上的数据库信息获取方法及装置
CN107577667A (zh) 一种实体词处理方法和装置
Wu et al. High efficient methods of content-based 3D model retrieval
CN106777191A (zh) 一种基于搜索引擎的检索模式生成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant