CN103235822B - 数据库的生成及查询方法 - Google Patents

数据库的生成及查询方法 Download PDF

Info

Publication number
CN103235822B
CN103235822B CN201310160877.2A CN201310160877A CN103235822B CN 103235822 B CN103235822 B CN 103235822B CN 201310160877 A CN201310160877 A CN 201310160877A CN 103235822 B CN103235822 B CN 103235822B
Authority
CN
China
Prior art keywords
attention rate
attribute
data
tables
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310160877.2A
Other languages
English (en)
Other versions
CN103235822A (zh
Inventor
杜春生
张勇
孙蓟旅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujing Tiance Beijing Technology Group Co ltd
Original Assignee
Futureweather (beijing) Meteorological Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Futureweather (beijing) Meteorological Technology Co Ltd filed Critical Futureweather (beijing) Meteorological Technology Co Ltd
Priority to CN201310160877.2A priority Critical patent/CN103235822B/zh
Publication of CN103235822A publication Critical patent/CN103235822A/zh
Application granted granted Critical
Publication of CN103235822B publication Critical patent/CN103235822B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种数据库的生成及查询方法,包括:从多个关注度数据表中选取样本区域数据表,样本区域数据表包含属性和与属性的相关的多元组数据;根据样本区域数据表中属性的多元组关注度数据,对属性项进行合并,获取样本属性项;根据样本属性项将多个关注度数据表中的属性项映射为多个优化关注度数据表;以采集时间作为主码,关联同一区域的优化关注度数据表及气象参数数据表,获取目标关注度数据库。从而在对现有数据结构简化的同时,提高的季节性商品关注度数据的可用性和有效性。

Description

数据库的生成及查询方法
技术领域
本发明涉及服务数据及信息处理领域,尤其涉及数据库的生成及查询方法。
背景技术
随着计算机技术的不断普及和发展,数据库处理技术也不断被应用到生产和生活的多个领域。新的数据库处理技术也伴随着这些应用而被开发出来。例如,商品关注度数据作为人群的行为数据越来越多的被应用到了群体行为的预测领域。其中,季节性商品的关注度数据属性更是明显的呈现出了随季节性变化的特性。因此季节性商品的关注度数据对于季节性商品的计划生产、广告投放及库存调配都具有较强的指导意义。随着电子商务及服务计算的快速发展,进一步扩大了人类行为类数据的采集及应用。
在该应用例中,由于关注度数据属于人类行为类数据,因此通常可通过搜索类网站的“搜索”或“成交”记录的统计进行收集。通过上述数据采集过程获得的数据,由于是根据每日作为时间点采集,从而产生了较大的数据量。这一庞大的数据量在进行数据后期处理过程中,将直接导致大负荷数据量计算。
另一方面,在该应用例中,在商品的关注度数据中普遍存在“小份额、小比重”数据,此类“小份额、小比重”数据通常是由于小众季节性消费品或近似类季节性消费品所产生的。在整体的季节性商品的关注度计算中单位数据量级小、但单位数据多,同时关注度数据为倾向性指数数据。因此,此类“小份额、小比重”数据由于单位量较小,因此在计算中往往也无法体现出其数据的倾向性。
同时需要指出的是,对上述“小份额、小比重”数据进行处理时,为了保证整体数据的信息完整性,此类数据的简化不能仅通过删减来实现。另外,现有的季节性商品的关注度数据为单一数据来源,因此其季节性商品的季节性商品的季节特性无法进行体现。如简单的通过采集时间来推算,将无法体现出季节变化及南、北方的地域性差异。
因此,在上述这样的应用例中,现有的例如季节性商品的关注度数据的数据量大,在处理过程中无法对数据项结构进行精简。同时,由于数据来源的单一,无法实现有效的数据聚合,因此在后期的数据使用过程中无法进行有效处理,获得可用数据。
发明内容
鉴于现有技术中存在的情况,根据本发明的一个方面,提供一种数据库的生成方法,包括:
从多个关注度数据表中选取样本区域数据表,所述样本区域数据表包含属性和与所述属性的相关的多元组数据;根据所述样本区域数据表中属性的多元组关注度数据,对所述属性项进行合并,获取样本属性项;根据所述样本属性项将所述多个关注度数据表中的属性项映射为多个优化关注度数据表;以所述采集时间作为主码,关联同一区域的优化关注度数据表及气象参数数据表,获取目标关注度数据库。
在一些实施方式中,所述从多个关注度数据表中选取样本区域数据表的步骤包括:
根据多个区域的年度日气温表及气象学四季温度设定获取多个区域的四季平均天数;根据该四季平均天数在一年中的均衡度从所述的多个区域中选取样本区域,将该样本区域对应的数据表选取为样本区域数据表。
在一些实施方式中,所述获取样本属性项的步骤包括:
根据设定时间间隔提取所述样本区域数据表的元组项,获得样本采样数据表;在所述样本采样数据表中,根据每一属性项中各元组项的关注度建立维度,构成向量余弦模型,在任意两个属性项的向量余弦模型之间通过向量余弦算法获取多个属性近似度;根据所述多个属性近似度对所对应的多个属性项进行合并,获取样本属性项。
在一些实施方式中,所述根据所述多个属性近似度对所对应的多个属性项进行合并的步骤包括:
从所述多个属性近似度中获取最小近似度;将所述最小近似度所对应的两个属性项中的一个确定为基准项;以所述基准项的近似度为基准,对其余属性项的近似度进行排序,获取属性项序列;若所述属性项序列中相邻的属性项间的近似度区间值小于近似度设定值,则将该相邻属性项进行合并。
在一些实施方式中,所述近似度设定值根据所述属性序列中相邻属性项的最小近似度区间值或中间近似度值区间值确定。
在一些实施方式中,所述获取目标关注度数据库的步骤包括:
根据本地IP网络地址确定本地区域;以所述采集时间作为主码,关联所述本地区域的优化关注度数据表及气象参数数据表,获取本地的目标关注度数据库。
同时本发明还提供了一种数据库的查询方法,包括:
根据本地信息从所述季节性商品关注度数据库中调取本地多年季节性商品关注度数据表;
根据设定时间确定本地区域当前气象参数;
将所述本地当前气象参数与本地历史同期区间内气象参数进行匹配,获取与所述本地当前气象参数匹配的本地历史年份;
从所述本地历史年份所对应的本地的关注度数据表中获取属性项的关注度总值及每一属性关注度值,根据所述属性项的关注度总值及每一属性关注度值获取每一属性项的关注度占比数;
根据所述每一属性项的关注度占比数确定本地区域在设定时间中的各属性项的关注度。
在一些实施方式中,所述气象参数包括:日平均气温、日最高气温或气象指数SWD。
在一些实施方式中,所述获取与所述本地当前气象参数匹配的本地历史年份的步骤包括:
将所述本地当前气象参数与本地两年或三年内的历史同期、三日区间或五日区间内气象参数进行匹配,获取与所述本地当前气象参数匹配的本地多个历史年份。
在一些实施方式中,所述获取每一属性项的关注度占比数的步骤包括:
根据本地多个历史年份与当前年份的年度跨度确定年份权重值;根据本地多个历史年份与本地当前气象参数的匹配度确定匹配权重值;从所述本地多个历史年份所对应的本地的优化关注度数据表中获取属性项的关注度总值及每一属性关注度值;根据所述年份权重值和/或匹配权重值将所述多个历史年份所对应的属性项的关注度总值及每一属性关注度值加权后,平均为属性项的关注度总均值及每一属性关注度均值;根据所述属性项的关注度总均值及每一属性关注度均值获取每一属性项的关注度占比数。
在一些实施方式中,所述从所述本地历史年份所对应的本地的季节性商品优化关注度数据表中获取属性项的关注度总值及每一属性关注度值,根据所述属性项的关注度总值及每一属性关注度值获取每一属性项的关注度占比数的步骤包括:从所述本地多个历史年份所对应的本地的季节性商品优化关注度数据表中获取属性项的关注度总值及每一属性关注度值;根据每年度的所述属性项的关注度总值及每一属性关注度值生成每年度玫瑰图;将所述每年度玫瑰图进行图形拟合,获取每一属性项的关注度占比数。
在一些实施方式中,所述根据所述每一属性项的关注度占比数确定本地在设定时间中的各属性项关注度的步骤还包括:
根据所述每一属性项的关注度占比数确定多个本地在设定时间中的各属性项关注度;根据所述多个本地在设定时间中的各属性项关注度获取多个本地区域间的区域近似度;根据所述多个本地区域间的区域近似度对所述多个本地区域进行合并,获取优选区域列表;根据所述优选当前区域列表获取广告区域列表;发送系统根据所述优选当前区域进行所述属性的广告发放。
在一些实施方式中,所述属性项为当前库存产品名称,所述本地区域为多个当前库存区域;所述根据所述每一属性项的关注度占比数确定本地在设定时间中的各属性项关注度的步骤包括:所述根据每一当前库存产品名称所对应的关注度占比数确定多个当前库存区域在设定时间中的各当前库存产品的关注度;根据多个当前库存区域在设定时间中的各当前库存产品的关注度生成库存区域当前库存产品列表。
通过上述技术方案,本发明与现有技术相比具有以下优点:本发明通过商品近似度的分析对季节性商品属性进行组合,将同一类型并且走势趋势相似的属性进行合并,然后利用合并统计的方式让同一属性的数据互相进行对冲,最后得到的给个商品属性占比数据;并且通过这种方式也消除了实际数据的数据量的影响,得到的最后数据实际上是各地区各城市的单位数量关注行为的关注强度分布,由此就比较好的解决了数据城市间分布极不平衡的问题。通过这种数据筛选和清洗方式,我们得到了较小数据杂音的数据,最后我们结合各个城市的实况气象数据制作出了能够反映一个地区一个时段降温影响的预测算法。
附图说明
图1为本发明关注度数据库的生成方法的数据库模型图;
图2为本发明季节性商品关注度数据库的生成方法的流程示意图;
图3为本发明季节性商品关注度数据库的生成方法中样本区域数据表的选取流程示意图;
图4为本发明季节性商品关注度数据库的“方式1”的合并方法流程示意图;
图5为本发明季节性商品关注度向量示意图;
图6为本发明季节性商品关注度的偏移轴示意图;
图7为本发明季节性商品关注度数据库的“方式2”的合并方法流程示意图;
图8为本发明季节性商品关注度数据库的查询方法的流程示意图;
图9为2009~2011年度北京地区温度折线图。
具体实施方式
下面结合附图对本发明作进一步详细的说明。
图1为可实施本发明的季节性商品关注度数据库的生成方法的数据库模型图。该数据库模型为关系型数据库模型,在此数据库中包括:2009年度的北京季节性商品关注度数据表B1、河南季节性商品关注度数据表B2、吉林季节性商品关注度数据表B3、上海季节性商品关注度数据表B4及广东季节性商品关注度数据表B5等多个二维数据表,每个数据表的结构如表1所示,其中,数据表的属性为,即每一列的内容为“围巾、手套、帽子、凉鞋、羽绒服、风衣及外套”等季节性商品的关注度,例如:围巾在2009.3.1所采集的关注度值为653、手套在2009.3.1所采集的关注度值为505......,其每一列的属性项名称可使用“围巾、手套、帽子、凉鞋、羽绒服、风衣及外套”等季节性商品的名称表示;数据表的元组,即每一行为在“围巾、手套、帽子......”等季节性商品的关注度的采集时间,可具体到每个采集日期上,其最小的采集时间间隔可以以日作为基本单位,如:2009年3月1日、2009年3月2日、2009年3月3日、2009年3月4日......。在本实施方式中的上述数据表中,其元组中的采集时间为数据表的主码,上述表格的数据表中所提及的“商品关注度”应理解为:是以网络用户在搜索类或电子商务类数据平台(或网站)上的搜索量或成交量为数据基础,以季节性商品的名称为统计对象,通过分析而获得的指数量,该指数量与搜索量或成交量具有对应关系,可体现出其搜索量或成交量的不同量级。
采集时间 围巾 手套 帽子 凉鞋 羽绒服 风衣 外套
2009.3.1 653 505 495 489 3520 500 407
2009.3.2 520 576 480 602 2879 400 497
2009.3.3 501 499 595 619 2215 500 509
2009.3.4 540 186 460 593 1551 400 510
表1
本发明实现季节性商品关注度数据库的生成方法的步骤如图2所示:
步骤S101:如图1所示,从北京季节性商品关注度数据表B1、河南季节性商品关注度数据表B2、吉林季节性商品关注度数据表B3、上海季节性商品关注度数据表B4及广东季节性商品关注度数据表B5等多个二维数据表中选取一个数据表为样本区域数据表。其具体的选取方式包括以下步骤,如图3所示:
S1011:根据北京、河南、吉林、上海、广东等多地的2008年度、2009年度及2010年度的日平均气温数据表(如下表2所示),及日平均气温值及气象学四季温度设定(如:气象意义上的春天为:若连续5天的日平均气温在一年中首次(北半球)均大于、等于10摄氏度(日平均气温以当地2时、8时、14时、20时的平均温度)。获取北京、河南、吉林、上海、广东等多地的四季天数,如北京:春天为80天、夏天为95天,秋天为:100天、冬天为90天;河南:春天为91天、夏天为92天,秋天为:91天、冬天为91天......。
采集时间 日平均气温值
2009.3.1 10℃
2009.3.2 11℃
2009.3.3 9℃
2009.3.4 12℃
表2
S1012:根据在步骤S1011中获得的北京、河南、吉林、上海、广东等多地的四季平均天数,从中选取四季天数较为平均(均衡度最高)的地区,如,河南,从而确定河南地区所对应的河南季节性商品关注度数据表B2为样本区域数据表。上述样本数据表在选取时,选择四季均衡的几个城市为条件,是为了保证采样数据时各季节性商品的“搜索量或成交量”互相平衡,从而使可保证各季节性商品的相互量化组合在各个区域上可具有最好的普适性。
步骤S102:根据样本区域数据表(河南季节性商品关注度数据表B2)中围巾、手套、帽子、凉鞋、羽绒服、风衣、外套等各季节性商品之间的的关注度值近似度,对季节性商品的品类项(围巾、手套、帽子、凉鞋、羽绒服、风衣、外套等品类)进行合并,从而减小河南季节性商品关注度数据表B2的品类属性项数量,即数据表B2的总列数。此项对数据表B2的列数合并具有很强的现实意义,随着互联网及电子商务的发展,越来越多的小品类产品出现,此类产品具有很强的近似性和替代性,但若单独进行数量分析,由于其数量级小,因此无法体现其数据特征,而上述的属性列合并将有效解决这一问题,通过实际的采集数据特征可正确的描述出近似小品类产品的趋势。使数据表结构更为合理,是通过产品的关注度数据特性进行数据项结构优组的有效方法。
上述所提及的通过各季节性商品之间的的关注度值近似度,对季节性商品的品类项(围巾、手套、帽子、凉鞋、羽绒服、风衣、外套等品类)进行合并可通过多种方式实现,如下述方式1及方式2:
图4所示为“方式1”的合并方法包括以下步骤:
步骤S102-11:元组提取。根据设定时间间隔从步骤S101中所选取出的河南季节性商品关注度数据表B2(样本区域数据表)中进行多个采集时间即多个元组行的提取,为保证数据的精确度,可选用一旬(10天)为设定时间间隔,如:2009年度河南季节性商品关注度数据表B2中共有365行的元组数据,根据10天一旬的间隔,将从2009年度河南季节性商品关注度数据表B2中提取出2009年1月1日、2009年1月11日、2009年1月21日......等36条元组记录组成样本采样数据表,该表中每条元组记录中包括如:围巾、手套、帽子、凉鞋、羽绒服、风衣、外套等属性的关注度值,如以下表3所示:
采集时间 围巾 手套 帽子 凉鞋 羽绒服 风衣 外套
2009.1.1 653 505 495 489 3520 500 407
2009.1.11 520 576 480 602 2879 400 497
2009.1.21 501 499 595 619 2215 500 509
2009.1.31 540 186 460 593 1551 400 510
表3
步骤S102-12:建立模型。根据上述的样本采样数据表3,建立每一种季节性商品的向量余弦模型,以表3中“围巾”产品为例,说明上述向量余弦模型的建立过程,首先,根据表3中的“围巾”的元组(采集次数)的数量为围巾向量余弦模型的维数,其第1维度的值为“围巾”在2009.1.1时(即第一次采集时)的关注度653、其第2维度的值为“围巾”在2009.1.11(即第一旬采集时)时的关注度520、其第3维度的值为“围巾”在2009.1.21(即第二旬采集时)时的关注度501......依次对应获得“围巾”在2009年度36维的关注度值,即为2009年度的围巾向量余弦模型,如图5所示(图中的每个立柱代表关注度值、立柱数量代表维数)。根据相同方法建立“手套、帽子、凉鞋、羽绒服、风衣、外套”的向量余弦模型。
步骤S102-13:根据余弦矩阵提取最小近似度。在获得“手套、帽子、凉鞋、羽绒服、风衣、外套”等季节性产品的向量余弦模型后,在任意两个季节性商品的向量余弦模型之间,通过向量余弦算法获取各属性之间的近似度,即对每两个季节性商品的每一维度进行近似度计算,汇总后得到以下余弦矩阵,如表4所示:
围巾 手套 帽子 凉鞋 羽绒服 风衣 外套
围巾 0.745956 0.782229 0.88125 0.774996 0.711318 0.78461
手套 0.861107 0.942937 0.846001 0.7841 0.849044
帽子 0.918724 0.815095 0.751471 0.816242
凉鞋 0.530145 0.776749 0.844803
羽绒服 0.809894 0.876285
风衣 0.864305
外套
表4
从表4中的矩阵可知,其“凉鞋”与”羽绒服”之间的近似度最低为“0.530145”。
步骤S102-14:根据最小近似度简化季节性产品属性项类别。因此,如图5所示以“凉鞋”与”羽绒服”中任一品类为基准品类项,如,其他类的季节性产品以“羽绒服”为基准,以表4中近似度为偏离值建立偏移轴依次排序。从图6中可知,在偏移轴上的“手套、帽子”相互之间的距离最小为距离0.111,其“风衣、外套”相互之间的距离为0.210......,在此可根据不同的近似度要求从上述多个距离值中选取基准近似度,此基准近似度的选取将意味着对季节性产品关注度数据的合并精度,取值越大说明其合并的产品品类越多,如若上述基准近似度选取为偏移轴上的最小距离值0.111,则只将“手套、围巾”两项产品内容进行合并,若上述基准近似度选取取为偏移轴上的中间近似度0.210,则要将“手套、围巾”及“风衣、外套”都进行合并。在此实施方式中选定最小距离值0.111为基准近似度,因此将“手套、帽子”进行合并,从而得到合并后季节性产品属性项名称为“围巾/手套、帽子、凉鞋、羽绒服、风衣及外套”,减少了原数据表的表属性项(即列)的数量,同时,将此两列所对应的关注度值进行相加合并。
步骤S102-15:进行所有区域的数据表合并。根据上述步骤S102-14中所获得合并后季节性产品属性对数据北京季节性商品关注度数据表B1、河南季节性商品关注度数据表B2、吉林季节性商品关注度数据表B3、上海季节性商品关注度数据表B4及广东季节性商品关注度数据表B5等多个区域数据表中产品属性分别进行合并,得到多个区域的季节性商品优化关注度数据表。如:调整后的如表5所示(此表中合并数据从表1中获得):。
采集时间 围巾/手套 帽子 凉鞋 羽绒服 风衣 外套
2009.3.1 1158 495 489 3520 500 407
2009.3.2 1096 480 602 2879 400 497
2009.3.3 1000 595 619 2215 500 509
2009.3.4 726 460 595 1551 400 510
表5
如图7所示,其“方式2”的合并方法与“方式1”的方法不同之处在于:其步骤S102-13获取最小近似度的方式为:
步骤S102-23:根据余弦向量图提取最小近似度。在获得“手套、帽子、凉鞋、羽绒服、风衣、外套”等季节性产品的向量余弦模型后,通过向量图(图3)的方式对手套、帽子、凉鞋、羽绒服、风衣、外套”等季节性产品的向量余弦模型分别给予表示,之后,在任意两个季节性商品的向量余弦模型图之间进行图形比对,根据图形的比对结果确定各季节性产品之间的近似度,如:比对后图形的重叠面积越大说明两种产品越接近,并提前出最小近似度值(即两产品之间的重叠面积最小)。
其他步骤与“方式1”中的其他步骤相同。由此可知“方式2”不同于“方式1”的地方在于,其方式2将在最小近似度的判断上充分发挥了图形化的优势更为直观,同时,可通过对图形的量级表示形式的变化,提高其处理精度。
步骤S103:将上述步骤S102中所获得的河南多年的季节性商品关注度数据表与河南多年的气象参数数据表(如表2)根据年份分别建立关联,如图1中所示,如,以所述采集时间作为主码,将河南2009季节性商品关注度数据表B2与河南2009年度的气象参数数据表建立关联。使用以上方法,将各个区域多年的季节性商品关注度数据表与该区域多年的气象参数数据表建立关联,最终获取所有区域内的季节性商品关注度数据库。同时可通过对本地IP网络地址确定本地区域,从而实现对本地季节性商品关注度数据库的建立。
需要说明的是,在具体的实现过程中,通常只需对预测的区域进行数据关联,并选用的3~5年的关注度数据即可进行后期预测,如北京为本地区域、采用2009~2011年度数据时,在步骤S102中的步骤S102-14中,在根据最小近似度简化季节性产品属性类别后,在步骤S102-15中只需要对:2009~2011北京季节性商品关注度数据表进行合并。在后续步骤S103中只需将2009~2011年度北京的气象参数数据表与之关联,形成2009~2011年度北京地区季节性商品关注度数据库。
图8为通过本发明中所获得的季节性商品关注度数据库的查询方法的步骤图,在通过上述步骤S101~步骤S103获得地区季节性商品关注度数据库后还包括以下的查询步骤:为更好的给予说明,在本实施方式中设定查询条件为:本地区域:北京地区;设定日期:2012年1月1日;参考气象参数为2009~2011年度,下面将结合上述设定查询条件给予说明。需要说明的是上述设定查询条件中设定日期可为当前日期或未来日期,但考虑到需与历史同期气象参数结合,因此,此设定日期应当同时具有与之对应的气象参数信息。
步骤S104:确定参考年份。首先,从包括北京季节性商品关注度数据表、河南季节性商品关注度数据表、吉林季节性商品关注度数据表、上海季节性商品关注度数据表及广东季节性商品关注度数据表等多地数据表的季节性商品关注度数据库中提取“2009~2011年度北京季节性商品关注度数据表及与之关联的2009~2011年度北京地区(本地区域)的气象参数数据表”,之后根据2012年1月1日(设定日期)的当前温度1℃,从2009~2011年度的1月1日的历史同期温度中进行匹配,并给出1~3天的匹配时间区间(若此区间上仍不存在与当前温度1℃的最接近值,其匹配时间区间还可放大到1~5天),从而确定与1℃最为接近的年份,如图9中所示,2009年1月1日为0℃、2010年1月1日为-1℃、2011年1月1日为2℃即在之前三年中并不存在历史同期一致的温度,若存在即可直接将相应的年份确定为可参考年份,当然也可将与现有温度最为接近的年份确定为参考年份。在历史同期没有参考年份时,还可在2009年1月1日~3日、2010年1月1日~3日及2011年1月1日~3日区间上中寻找是否存在1℃值,通过图9可知,2010年1月2日为1℃,从而将2010年确定为当前北京季节性商品关注度数据的参考年份。
为使气象信息的推算更为准确,因此,在上述“2009~2011年度北京地区的气象参数数据表”中除包括日平均气温数据外,还可包括:日最高气温以及气象指数SWD。其气象指数SWD是根据日平均温度、最高温度、最低温度、相对湿度、平均风速和日照强度数据拟合而成的综合天气指数。
步骤S105:获得查询结果。从已进行商品属性合并的2010年度北京季节性商品关注度数据表中,提取2010年1月1日季节性商品关注度数据,如下表6中所示:
采集时间 围巾/手套 帽子 凉鞋 羽绒服 风衣 外套
2010.1.1 1158 495 50 3520 500 407
表6
从表6中依次将“围巾/手套、帽子、凉鞋、羽绒服、风衣及外套”关注度进行累加总值为6130,其围巾/手套关注度1158在其中的占比为0.188907、其帽子关注度495在其中的占比为0.08075、凉鞋关注度50在其中的占比为0.008157、羽绒服关注度3520在其中的占比为0.57422、其风衣关注度500在其中的占比为0.081566及外套关注度407在其中的占比为0.066395......。其占比结果也可通过玫瑰图给予表示,由此获得了北京地区的2012年1月1日季节性商品关注度数据。由此可知,其羽绒服产品的关注度为最高,从而体现出了一种用户的购买意向及趋势,由于在关注度的获取过程中并不采纳人口基数,而是一种趋势性数据,因此,有效避免了传统关注度数据统计中,由于用户的自身增长或经济购买能力给关注度数据所带来的影响。从而此方法比现有的关注度预测方法更为合理。
作为对上述步骤S105的进一步优化,在北京地区的2012年1月1日季节性商品关注度数据的获取过程中,除了可单独参考“2010年1月1日季节性商品关注度数据”外,还可同时引入2009年1月1日季节性商品关注度数据”及2011年1月1日季节性商品关注度数据”,但由于越靠近现今的数据越有可能在未来发生。因此,为各年度设定年份权重值,距离现今越近的权重值越高,如将2011年1月1日季节性商品关注度数据的权重值设为0.9,将2009年1月1日季节性商品关注度数据的权重值设定为0.6;同时,还可从本地当前气象参数与历史同期温度的匹配度上,通过匹配权重值对不同年份的关注度数据给予优化,之后根据上述2010年1月1日的各季节性商品的关注度占比计算方法对“2011年1月1日季节性商品关注度数据”及“2009年1月1日季节性商品关注度数据”分别计算其占比,在计算后乘以相应年份权重值和/或匹配权重值,之后将2009、2010及2011年度的占比进行关注度平均,从而最终获得2012年1月1日季节性商品关注度数据。除上述对各年度占比数进行平均的方法,还可通过将2009年1月1日季节性商品关注度数据、2010年1月1日季节性商品关注度数据及2011年1月1日季节性商品关注度数据绘制为玫瑰图,通过将每一年度玫瑰图进行图形拟合,获取季节性商品(属性)的关注度占比数。
考虑到对于区域性行为预测或广告发放的需要,本发明还可实现对各个区域进行预测。具体包括:首先,通过上述步骤S105可以获得多个本地或当前地区的2012年1月1日季节性商品关注度数据,之后,在任意两个当前区域上,根据所对应的商品属性中的关注度值为每一维度值、以商品数量为维数,获取任意两个区域的关注度获取区域近似度;并根据该近似度对多个当前区域进行合并,获取优选的当前区域;并根据优选当前区域获取广告区域列表;之后,可通过发送系统(电视传输中的广告节目单)根据优选当前区域进行广告发放。
与上述方法相同,本发明还可实现对库存区域的管理,具体步骤为:首先根据当前库存区域选取多个候选区域,如当前为“北京”、“上海”及“广东”区域则选取北京”、“上海”及“广东”为需计算的候选区域;并根据当前库存产品名称从“北京季节性商品关注度数据表中选取出多个当前预调配商品属性;并从候选区域(北京”、“上海”及“广东”)上的季节性商品关注度数据表中提取当前预调配商品属性的关注度;最后,根据将多个候选区域(北京”、“上海”及“广东”)上的当前预调配商品属性的关注度生成现有库存区域当前库存产品列表。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上公开的仅为本发明的几个具体实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims (12)

1.数据库的生成方法,其特征在于,包括以下步骤:
从多个关注度数据表中选取样本区域数据表,所述样本区域数据表包含属性和与所述属性的相关的多元组数据;
根据所述样本区域数据表中属性的多元组关注度数据,对所述属性项进行合并,获取样本属性项;
根据所述样本属性项将所述多个关注度数据表中的属性项映射为多个优化关注度数据表;
以采集时间作为主码,关联同一区域的优化关注度数据表及气象参数数据表,获取目标关注度数据库。
2.根据权利要求1所述的生成方法,其特征在于,所述从多个关注度数据表中选取样本区域数据表的步骤包括:
根据多个区域的年度日气温表及气象学四季温度设定获取多个区域的四季平均天数;
根据该四季平均天数在一年中的均衡度从所述的多个区域中选取样本区域,将该样本区域对应的数据表选取为样本区域数据表。
3.根据权利要求1或2所述的生成方法,其特征在于,所述获取样本属性项的步骤包括:
根据设定时间间隔提取所述样本区域数据表的元组项,获得样本采样数据表;
在所述样本采样数据表中,根据每一属性项中各元组项的关注度建立维度,构成向量余弦模型,在任意两个属性项的向量余弦模型之间通过向量余弦算法获取多个属性近似度;
根据所述多个属性近似度对所对应的多个属性项进行合并,获取样本属性项。
4.根据权利要求3所述的生成方法,其特征在于,所述根据所述多个属性近似度对所对应的多个属性项进行合并的步骤包括:
从所述多个属性近似度中获取最小近似度;
将所述最小近似度所对应的两个属性项中的一个确定为基准项;
以所述基准项的近似度为基准,对其余属性项的近似度进行排序,获取属性项序列;
若所述属性项序列中相邻的属性项间的近似度区间值小于近似度设定值,则将该相邻属性项进行合并。
5.根据权利要求4所述的生成方法,其特征在于,所述近似度设定值根据所述属性序列中相邻属性项的最小近似度区间值或中间近似度值区间值确定。
6.根据权利要求1所述的生成方法,其特征在于,所述获取目标关注度数据库的步骤包括:
根据本地IP网络地址确定本地区域;
以所述采集时间作为主码,关联所述本地区域的优化关注度数据表及气象参数数据表,获取本地的目标关注度数据库。
7.数据库的查询方法,其特征在于,包括:
根据本地信息从季节性商品关注度数据库中调取本地多年季节性商品关注度数据表;
根据设定时间确定本地区域当前气象参数;
将本地区域当前气象参数与本地历史同期区间内气象参数进行匹配,获取与所述本地区域当前气象参数匹配的本地历史年份;
从所述本地历史年份所对应的本地的关注度数据表中获取属性项的关注度总值及每一属性关注度值,根据所述属性项的关注度总值及每一属性关注度值获取每一属性项的关注度占比数;
根据所述每一属性项的关注度占比数确定本地区域在设定时间中的各属性项的关注度;
其中所述获取与所述本地区域当前气象参数匹配的本地历史年份的步骤包括:
将所述本地区域当前气象参数与本地两年或三年内的历史同期、三日区间或五日区间内气象参数进行匹配,获取与所述本地区域当前气象参数匹配的本地多个历史年份。
8.根据权利要求7所述的查询方法,其特征在于,所述气象参数包括:
日平均气温、日最高气温或气象指数SWD。
9.根据权利要求7所述的查询方法,其特征在于,所述获取每一属性项的关注度占比数的步骤包括:
根据本地多个历史年份与当前年份的年度跨度确定年份权重值;
根据本地多个历史年份与本地区域当前气象参数的匹配度确定匹配权重值;
从所述本地多个历史年份所对应的本地的优化关注度数据表中获取属性项的关注度总值及每一属性关注度值;
根据所述年份权重值和/或匹配权重值将所述多个历史年份所对应的属性项的关注度总值及每一属性关注度值加权后,平均为属性项的关注度总均值及每一属性关注度均值;
根据所述属性项的关注度总均值及每一属性关注度均值获取每一属性项的关注度占比数。
10.根据权利要求7所述的查询方法,其特征在于,所述从所述本地历史年份所对应的本地的关注度数据表中获取属性项的关注度总值及每一属性关注度值,根据所述属性项的关注度总值及每一属性关注度值获取每一属性项的关注度占比数的步骤包括:
从所述本地多个历史年份所对应的本地的关注度数据表中获取属性项的关注度总值及每一属性关注度值;
根据每年度的所述属性项的关注度总值及每一属性关注度值生成每年度玫瑰图;
将所述每年度玫瑰图进行图形拟合,获取每一属性项的关注度占比数。
11.根据权利要求7所述的查询方法,其特征在于,所述根据所述每一属性项的关注度占比数确定本地区域在设定时间中的各属性项关注度的步骤还包括:
根据所述每一属性项的关注度占比数确定多个本地在设定时间中的各属性项关注度;
根据所述多个本地在设定时间中的各属性项关注度获取多个本地区域间的区域近似度;
根据所述多个本地区域间的区域近似度对所述多个本地区域进行合并,获取优选区域列表;
根据所述优选当前区域列表获取广告区域列表;
发送系统根据所述优选当前区域进行所述属性的广告发放。
12.根据权利要求7所述的查询方法,其特征在于,所述属性项为当前库存产品名称,所述本地区域为多个当前库存区域;所述根据所述每一属性项的关注度占比数确定本地在设定时间中的各属性项关注度的步骤包括:
所述根据每一当前库存产品名称所对应的关注度占比数确定多个当前库存区域在设定时间中的各当前库存产品的关注度;
根据多个当前库存区域在设定时间中的各当前库存产品的关注度生成库存区域当前库存产品列表。
CN201310160877.2A 2013-05-03 2013-05-03 数据库的生成及查询方法 Active CN103235822B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310160877.2A CN103235822B (zh) 2013-05-03 2013-05-03 数据库的生成及查询方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310160877.2A CN103235822B (zh) 2013-05-03 2013-05-03 数据库的生成及查询方法

Publications (2)

Publication Number Publication Date
CN103235822A CN103235822A (zh) 2013-08-07
CN103235822B true CN103235822B (zh) 2016-05-25

Family

ID=48883863

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310160877.2A Active CN103235822B (zh) 2013-05-03 2013-05-03 数据库的生成及查询方法

Country Status (1)

Country Link
CN (1) CN103235822B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104133824B (zh) * 2013-08-13 2015-09-09 腾讯科技(深圳)有限公司 一种样本属性的动态分布数据获取方法及系统
CN104424190A (zh) * 2013-08-20 2015-03-18 富士通株式会社 整合多个数据库的方法及装置
CN103605651A (zh) * 2013-08-28 2014-02-26 杭州顺网科技股份有限公司 一种基于olap多维分析的数据处理展现方法
CN108932268B (zh) * 2017-05-26 2020-09-04 华为技术有限公司 数据处理方法及装置
CN110020267B (zh) * 2017-07-27 2021-03-26 杭州海康威视数字技术股份有限公司 列表显示方法及装置
CN112132498B (zh) * 2019-06-25 2024-07-19 北京沃东天骏信息技术有限公司 库存管理方法、装置、设备及存储介质
CN113503633B (zh) * 2021-07-05 2022-08-05 湖南永一节能科技有限公司 一种楼宇中央空调智能管理方法、控制器及管理系统
CN113469461B (zh) * 2021-07-26 2024-07-19 北京沃东天骏信息技术有限公司 生成信息的方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5873093A (en) * 1994-12-07 1999-02-16 Next Software, Inc. Method and apparatus for mapping objects to a data source
CN1795463A (zh) * 2003-05-22 2006-06-28 珀欣投资有限责任公司 客户收入预测方法和系统
CN101763417A (zh) * 2009-12-30 2010-06-30 北京世纪高通科技有限公司 一种数据查询方法及装置
CN102193936A (zh) * 2010-03-09 2011-09-21 阿里巴巴集团控股有限公司 一种数据分类的方法及装置
CN102650996A (zh) * 2011-02-28 2012-08-29 国际商业机器公司 确定数据库表之间的数据映射关系的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5873093A (en) * 1994-12-07 1999-02-16 Next Software, Inc. Method and apparatus for mapping objects to a data source
CN1795463A (zh) * 2003-05-22 2006-06-28 珀欣投资有限责任公司 客户收入预测方法和系统
CN101763417A (zh) * 2009-12-30 2010-06-30 北京世纪高通科技有限公司 一种数据查询方法及装置
CN102193936A (zh) * 2010-03-09 2011-09-21 阿里巴巴集团控股有限公司 一种数据分类的方法及装置
CN102650996A (zh) * 2011-02-28 2012-08-29 国际商业机器公司 确定数据库表之间的数据映射关系的方法和装置

Also Published As

Publication number Publication date
CN103235822A (zh) 2013-08-07

Similar Documents

Publication Publication Date Title
CN103235822B (zh) 数据库的生成及查询方法
Le Bagousse-Pinguet et al. Phylogenetic, functional, and taxonomic richness have both positive and negative effects on ecosystem multifunctionality
CN103377250B (zh) 基于邻域的top‑k推荐方法
CN104700152B (zh) 一种融合季节销售信息与搜索行为信息的烟草销量预测方法
CN105868847A (zh) 一种购物行为的预测方法及装置
CN108205766A (zh) 信息推送方法、装置及系统
CN104965920A (zh) 用于确定目标地址的方法和装置
CN102663616A (zh) 一种基于多触点归因模型的网络广告效果衡量方法和系统
CN110852852A (zh) 一种工业互联网产品推荐系统及方法
CN104820715A (zh) 基于多维度关联的数据共享和分析方法及系统
CN108388974A (zh) 基于随机森林和决策树的优质客户优化识别方法及装置
CN101706926A (zh) 一种卷烟消费信息调查及处理方法
Chelliah et al. Analysis of demand forecasting of agriculture using machine learning algorithm
CN101145231A (zh) 基于搜索引擎的定向广告推送方法
CN103412865B (zh) 网站项目的通知方法和系统
CN107578277A (zh) 用于电力营销的出租房客户定位方法
CN105678590A (zh) 一种面向社交网络基于云模型的topN推荐方法
CN108154311A (zh) 基于随机森林和决策树的优质客户识别方法及装置
Salpekar Design and implementation of mobile application for crop yield prediction using machine learning
CN108898244B (zh) 一种耦合多源要素的数字标牌位置推荐方法
Brown et al. Getting real with energy data: Using the buildings performance database to support data-driven analyses and decision-making
Bera et al. Estimation of spatial association between housing price and local environmental amenities in Kolkata, India Using Hedonic Local Regression
CN105978729A (zh) 一种基于用户上网日志及位置的手机信息推送系统及方法
WO2020119017A1 (zh) 大数据背景下实现数据资产感知及定价功能的系统及其方法
Najmuddin et al. Cropland use preferences under land, water and labour constraints—implications for wheat self-sufficiency in the Kabul River basin, Afghanistan

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 100089 20 floor 2011-1, building 3, 17 Zhongguancun South Street, Haidian District, Beijing.

Patentee after: FUJING TIANCE (BEIJING) TECHNOLOGY GROUP CO.,LTD.

Address before: 100081 room 912, block C, Webb times centre, 17 Zhongguancun South Street, Haidian District, Beijing.

Patentee before: Futureweather (Beijing) Meteorological Technology Co.,Ltd.

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Database generating and querying method

Effective date of registration: 20191224

Granted publication date: 20160525

Pledgee: Beijing first financing Company limited by guarantee

Pledgor: FUJING TIANCE (BEIJING) TECHNOLOGY GROUP CO.,LTD.

Registration number: Y2019990000794

PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20230608

Granted publication date: 20160525

Pledgee: Beijing first financing Company limited by guarantee

Pledgor: FUJING TIANCE (BEIJING) TECHNOLOGY GROUP CO.,LTD.

Registration number: Y2019990000794