CN110475370A - 数据建模中的智能衍生变量构造方法 - Google Patents
数据建模中的智能衍生变量构造方法 Download PDFInfo
- Publication number
- CN110475370A CN110475370A CN201910683234.3A CN201910683234A CN110475370A CN 110475370 A CN110475370 A CN 110475370A CN 201910683234 A CN201910683234 A CN 201910683234A CN 110475370 A CN110475370 A CN 110475370A
- Authority
- CN
- China
- Prior art keywords
- mobile terminal
- data
- transmission
- transmission sequence
- random
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000005540 biological transmission Effects 0.000 claims abstract description 256
- 230000003542 behavioural effect Effects 0.000 claims abstract description 55
- 230000003068 static effect Effects 0.000 claims abstract description 39
- 238000012790 confirmation Methods 0.000 claims description 33
- 230000008859 change Effects 0.000 claims description 2
- 241001269238 Data Species 0.000 abstract description 3
- 238000012545 processing Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000010276 construction Methods 0.000 description 6
- 230000009194 climbing Effects 0.000 description 5
- 230000005012 migration Effects 0.000 description 5
- 238000013508 migration Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 230000007480 spreading Effects 0.000 description 2
- 238000003892 spreading Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W72/00—Local resource management
- H04W72/50—Allocation or scheduling criteria for wireless resources
- H04W72/56—Allocation or scheduling criteria for wireless resources based on priority criteria
- H04W72/566—Allocation or scheduling criteria for wireless resources based on priority criteria of the information or information source or recipient
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W72/00—Local resource management
- H04W72/50—Allocation or scheduling criteria for wireless resources
- H04W72/56—Allocation or scheduling criteria for wireless resources based on priority criteria
- H04W72/566—Allocation or scheduling criteria for wireless resources based on priority criteria of the information or information source or recipient
- H04W72/569—Allocation or scheduling criteria for wireless resources based on priority criteria of the information or information source or recipient of the traffic information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W74/00—Wireless channel access
- H04W74/08—Non-scheduled access, e.g. ALOHA
- H04W74/0833—Random access procedures, e.g. with 4-step access
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种数据建模中的智能衍生变量构造方法,包括如下步骤:由移动终端收集原始数据并将所收集的原始数据划分为静态数据、行为数据以及交易数据;由移动终端接收信息发送优先级信息;由移动终端接收移动终端身份标识符,其中,移动终端身份标识符是由传输接收点生成并分配给移动终端的;由移动终端基于信息发送优先级信息,确定发送顺序;以及由移动终端确定发送随机轮候时间,并由移动终端在发送随机轮候时间之后并按照发送顺序,向传输接收点发送随机接入请求消息,其中,随机接入请求消息中包括发送随机轮候时间以及移动终端身份标识符。本发明通过对移动终端进行分类,保证了一些时延敏感数据能够优先传输。
Description
技术领域
本发明是关于数据处理技术领域,特别是关于一种数据建模中的智能衍生变量构造方法。
背景技术
数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。 将经过系统分析后抽象出来的概念模型转化为物理模型后,在visio或erwin等工具建立数据库实体以及各实体之间关系的过程(实体一般是表)。
在数据建模中,衍生变量的构造是一个非常复杂的问题,不同的业务、不同的产品、不同的客户在不同的分析目标下变量的构造方法都不相同。传统模式下,分析人员需要对所从事的行业、业务及数据有很深的理解,才能进行变量构造产生特征变量,而且不论变量的规则简单或者复杂,都需要依赖手工完成,需要耗费分析人员大量时间。这种方式有两个问题:(1)构造变量工作对分析人员的要求比较高,既要对行业及业务很熟悉,同时对建模技术也要有丰富的经验,使得这样的人才在市场上非常稀缺,大大降低了企业对于数据价值的挖掘和利用;(2)由于分析人员基于自己对业务的理解以手工方式构造衍生变量,出于时间投入和建模效率考虑,会舍弃掉大部分自己认为不重要的数据,仅保留少部分关键数据使用自己熟悉的规则进行变量生成,如此一来,很多价值高而分析师不熟悉的数据以及单一价值低而组合价值高的数据被舍弃,不能挖到或者挖深所有的可能特征,很大程度上会影响最终模型的分析预测精准性。
现有技术CN106294944B公开了一种编码器旋钮轨道数据建模方法,包括获取编码器旋钮轨道的扭矩曲线;根据扭矩或载荷的设计要求,确定结构参数,并通过几何与受力关系构建出爬坡扭矩公式及下坡扭矩公式,且进一步将扭矩曲线划分成多个依序连接的爬坡直线和/或下坡直线,且每一爬坡直线和下坡直线的斜率均可通过极坐标转化后形成由轨道半径随角度增量变化的对应关系;确定起点及其对应的回位角、修正角和轨道半径,并根据预设的角度增量,利用爬坡及下坡扭矩公式,依序计算每一爬坡直线和/或下坡直线的轨道半径;将依序计算得到的轨道半径进行拟合,绘制出目标轨道曲线。
现有技术CN105359146B公开了一种将数据从一个或多个源数据库迁移到一个或多个目标数据库的方法可包括:产生对存储在所述一个或多个源数据库中的多个对象的迁移前分析;以及产生多个迁移脚本,所述多个迁移脚本将所述多个对象从所述一个或多个源数据库转移到所述一个或多个目标数据库。该方法还可包括:产生定义所述多个迁移脚本的执行次序的迁移计划;以及根据迁移计划将所述多个对象从所述一个或多个源数据库迁移到一个或多个目标数据库。
现有技术CN106778048B公开了一种数据处理的方法及装置。该方法包括:获取数据样本;根据未包含缺失值的数据样本的各属性项的属性信息确定未包含缺失值的数据样本的各属性项中与缺失值对应的频繁项集;从频繁项集中选择填充属性项;根据填充属性项中与包含缺失值的数据样本中的缺失值的对应属性的属性值确定填充值,并根据填充值更新包含缺失值的数据样本。
公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
发明内容
本发明的目的在于提供一种数据建模中的智能衍生变量构造方法,其能够克服现有技术的缺点。
为实现上述目的,本发明提供了一种数据建模中的衍生变量信息的传输方法,该数据建模中的衍生变量信息的传输方法包括如下步骤:由移动终端收集原始数据并将所收集的原始数据划分为静态数据、行为数据以及交易数据;由移动终端接收信息发送优先级信息,其中,信息发送优先级信息是由传输接收点广播的,并且其中,信息发送优先级信息包括针对包括静态数据、行为数据以及交易数据的数据包的优先级;由移动终端接收移动终端身份标识符,其中,移动终端身份标识符是由传输接收点生成并分配给移动终端的,并且其中,移动终端身份标识符仅能够用于移动终端以及传输接收点不重复分配移动终端身份标识符;由移动终端基于信息发送优先级信息,确定发送顺序;以及由移动终端确定发送随机轮候时间,并由移动终端在发送随机轮候时间之后并按照发送顺序,向传输接收点发送随机接入请求消息,其中,随机接入请求消息中包括发送随机轮候时间以及移动终端身份标识符。
在一优选的实施方式中,数据建模中的衍生变量信息的传输方法包括如下步骤:由移动终端接收随机接入请求确认消息,其中,随机接入请求确认消息是由传输接收点发送的,并且其中,随机接入请求确认消息中包括移动终端身份标识符;在接收到随机接入请求确认消息之后,由移动终端依据发送顺序向传输接收点发送包括静态数据、行为数据以及交易数据的数据包,其中,数据包中还包括移动终端身份标识符;其中,传输接收点基于以下步骤来生成并发送随机接入请求确认消息:基于所接收的随机接入请求消息来确定发送随机轮候时间;基于发送随机轮候时间将移动终端分类,其中,移动终端至少被分为三类,第一类移动终端的发送随机轮候时间小于第一门限,第二类移动终端的发送随机轮候时间大于第一门限且小于第二门限,第三类移动终端的发送随机轮候时间大于第二门限,并且其中,第一类移动终端包括多个移动终端,第二类移动终端包括多个移动终端,第三类移动终端包括多个移动终端;以及向每一类移动终端分别发送随机接入请求确认消息。
在一优选的实施方式中,其中,基于以下步骤确定信息发送优先级信息:判断移动终端所要发送的数据包中静态数据、行为数据以及交易数据各自所占的百分比;以及如果行为数据以及交易数据所占的百分比总和大于数据包中总数据量的80%,则对数据包分配最高优先级,如果行为数据以及交易数据所占的百分比总和占数据包中总数据量的60%-80%,则对数据包分配次高优先级,如果行为数据以及交易数据所占的百分比总和小于数据包中总数据量的60%,则对数据包分配最低优先级。
在一优选的实施方式中,其中,由移动终端基于信息发送优先级信息,确定发送顺序包括如下步骤:确定所要发送的包括静态数据、行为数据以及交易数据的数据包的内容;基于要发送的包括静态数据、行为数据以及交易数据的数据包,匹配针对数据包的优先级;如果匹配到的优先级为最高优先级,则确定移动终端具有第一发送顺序;如果匹配到的优先级为次高优先级,则确定移动终端具有第二发送顺序;以及如果匹配到的优先级为最低优先级,则确定移动终端具有第三发送顺序。
在一优选的实施方式中,其中,由移动终端确定发送随机轮候时间,并由移动终端在发送随机轮候时间之后并按照发送顺序,向传输接收点发送随机接入请求消息具体包括如下步骤:如果移动终端具有第一发送顺序,则由移动终端确定发送随机轮候时间,并由移动终端在发送随机轮候时间之后,向传输接收点发送随机接入请求消息;如果移动终端具有第二发送顺序,则由具有第二发送顺序的移动终端确定发送随机轮候时间,并由具有第二发送顺序的移动终端确定具有第一发送顺序的移动终端是否完成发送,如果具有第一发送顺序的移动终端完成发送,则由具有第二发送顺序的移动终端在发送随机轮候时间之后,向传输接收点发送随机接入请求消息;以及如果移动终端具有第三发送顺序,则由具有第三发送顺序的移动终端确定发送随机轮候时间,并由具有第三发送顺序的移动终端确定具有第一发送顺序的移动终端和具有第二发送顺序的移动终端是否完成发送,如果具有第一发送顺序的移动终端和具有第二发送顺序的移动终端完成发送,则由具有第三发送顺序的移动终端在发送随机轮候时间之后,向传输接收点发送随机接入请求消息。
本发明还提供了一种数据建模中的衍生变量信息的传输系统,该数据建模中的衍生变量信息的传输系统包括:用于由移动终端收集原始数据并将所收集的原始数据划分为静态数据、行为数据以及交易数据的单元;用于由移动终端接收信息发送优先级信息的单元,其中,信息发送优先级信息是由传输接收点广播的,并且其中,信息发送优先级信息包括针对包括静态数据、行为数据以及交易数据的数据包的优先级;用于由移动终端接收移动终端身份标识符的单元,其中,移动终端身份标识符是由传输接收点生成并分配给移动终端的,并且其中,移动终端身份标识符仅能够用于移动终端以及传输接收点不重复分配移动终端身份标识符;用于由移动终端基于信息发送优先级信息,确定发送顺序的单元;以及用于由移动终端确定发送随机轮候时间,并由移动终端在发送随机轮候时间之后并按照发送顺序,向传输接收点发送随机接入请求消息的单元,其中,随机接入请求消息中包括发送随机轮候时间以及移动终端身份标识符。
在一优选的实施方式中,数据建模中的衍生变量信息的传输系统包括:用于由移动终端接收随机接入请求确认消息的单元,其中,随机接入请求确认消息是由传输接收点发送的,并且其中,随机接入请求确认消息中包括移动终端身份标识符;用于在接收到随机接入请求确认消息之后,由移动终端依据发送顺序向传输接收点发送包括静态数据、行为数据以及交易数据的数据包的单元,其中,数据包中还包括移动终端身份标识符;其中,传输接收点基于以下步骤来生成并发送随机接入请求确认消息:基于所接收的随机接入请求消息来确定发送随机轮候时间;基于发送随机轮候时间将移动终端分类,其中,移动终端至少被分为三类,第一类移动终端的发送随机轮候时间小于第一门限,第二类移动终端的发送随机轮候时间大于第一门限且小于第二门限,第三类移动终端的发送随机轮候时间大于第二门限,并且其中,第一类移动终端包括多个移动终端,第二类移动终端包括多个移动终端,第三类移动终端包括多个移动终端;以及向每一类移动终端分别发送随机接入请求确认消息。
在一优选的实施方式中,其中,基于以下步骤确定信息发送优先级信息:判断移动终端所要发送的数据包中静态数据、行为数据以及交易数据各自所占的百分比;以及如果行为数据以及交易数据所占的百分比总和大于数据包中总数据量的80%,则对数据包分配最高优先级,如果行为数据以及交易数据所占的百分比总和占数据包中总数据量的60%-80%,则对数据包分配次高优先级,如果行为数据以及交易数据所占的百分比总和小于数据包中总数据量的60%,则对数据包分配最低优先级。
在一优选的实施方式中,其中,由移动终端基于信息发送优先级信息,确定发送顺序包括如下步骤:确定所要发送的包括静态数据、行为数据以及交易数据的数据包的内容;基于要发送的包括静态数据、行为数据以及交易数据的数据包,匹配针对数据包的优先级;如果匹配到的优先级为最高优先级,则确定移动终端具有第一发送顺序;如果匹配到的优先级为次高优先级,则确定移动终端具有第二发送顺序;以及如果匹配到的优先级为最低优先级,则确定移动终端具有第三发送顺序。
在一优选的实施方式中,其中,由移动终端确定发送随机轮候时间,并由移动终端在发送随机轮候时间之后并按照发送顺序,向传输接收点发送随机接入请求消息具体包括如下步骤:如果移动终端具有第一发送顺序,则由移动终端确定发送随机轮候时间,并由移动终端在发送随机轮候时间之后,向传输接收点发送随机接入请求消息;如果移动终端具有第二发送顺序,则由具有第二发送顺序的移动终端确定发送随机轮候时间,并由具有第二发送顺序的移动终端确定具有第一发送顺序的移动终端是否完成发送,如果具有第一发送顺序的移动终端完成发送,则由具有第二发送顺序的移动终端在发送随机轮候时间之后,向传输接收点发送随机接入请求消息;以及如果移动终端具有第三发送顺序,则由具有第三发送顺序的移动终端确定发送随机轮候时间,并由具有第三发送顺序的移动终端确定具有第一发送顺序的移动终端和具有第二发送顺序的移动终端是否完成发送,如果具有第一发送顺序的移动终端和具有第二发送顺序的移动终端完成发送,则由具有第三发送顺序的移动终端在发送随机轮候时间之后,向传输接收点发送随机接入请求消息。
与现有技术相比,本发明具有如下优点:随着智能手机的不断普及,目前单位面积内的接入终端数量越来越多,这导致移动终端获得上行接入机会的数量不断减少,终端之间的干扰不断加大,最终这些问题又造成数据传输速度的缓慢和延时。虽然一些后台数据的上行链路传输不会严重影响用户体验,但是一些数据收集机构还是希望能够及时收集到所以后台数据以便能够及时对数据进行分析。针对现有技术的要求,本发明开发了一种数据建模中的衍生变量信息的传输方法,本发明通过对移动终端进行分类,保证了一些时延敏感数据能够优先传输,一些时间不敏感数据虽然因此提高了等待时间,但是这种设计使得数据收集机构的信息量损失最小化,本发明仍然能够取得更好的效果。
附图说明
图1是根据本发明一实施方式的方法流程图。
具体实施方式
下面结合附图,对本发明的具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
除非另有其它明确表示,否则在整个说明书和权利要求书中,术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分,而并未排除其它元件或其它组成部分。
图1是根据本发明一实施方式的数据建模中的衍生变量信息的传输方法流程图。如图所示,本发明的数据建模中的衍生变量信息的传输方法包括如下步骤:
步骤101:由移动终端收集原始数据并将所收集的原始数据划分为静态数据、行为数据以及交易数据;
步骤102:由移动终端接收信息发送优先级信息,其中,信息发送优先级信息是由传输接收点广播的,并且其中,信息发送优先级信息包括针对包括静态数据、行为数据以及交易数据的数据包的优先级;
步骤103:由移动终端接收移动终端身份标识符,其中,移动终端身份标识符是由传输接收点生成并分配给移动终端的,并且其中,移动终端身份标识符仅能够用于移动终端以及传输接收点不重复分配移动终端身份标识符;
步骤104:由移动终端基于信息发送优先级信息,确定发送顺序;以及
步骤105:由移动终端确定发送随机轮候时间,并由移动终端在发送随机轮候时间之后并按照发送顺序,向传输接收点发送随机接入请求消息,其中,随机接入请求消息中包括发送随机轮候时间以及移动终端身份标识符。
在一优选的实施方式中,数据建模中的衍生变量信息的传输方法包括如下步骤:由移动终端接收随机接入请求确认消息,其中,随机接入请求确认消息是由传输接收点发送的,并且其中,随机接入请求确认消息中包括移动终端身份标识符;在接收到随机接入请求确认消息之后,由移动终端依据发送顺序向传输接收点发送包括静态数据、行为数据以及交易数据的数据包,其中,数据包中还包括移动终端身份标识符,传输接收点接收到数据包之后,再经过核心网将数据包转发到运营商服务器;其中,传输接收点基于以下步骤来生成并发送随机接入请求确认消息:基于所接收的随机接入请求消息来确定发送随机轮候时间;基于发送随机轮候时间将移动终端分类,其中,移动终端至少被分为三类,第一类移动终端的发送随机轮候时间小于第一门限,第二类移动终端的发送随机轮候时间大于第一门限且小于第二门限,第三类移动终端的发送随机轮候时间大于第二门限,并且其中,第一类移动终端包括多个移动终端,第二类移动终端包括多个移动终端,第三类移动终端包括多个移动终端;以及向每一类移动终端分别发送随机接入请求确认消息。
在一优选的实施方式中,其中,基于以下步骤确定信息发送优先级信息:判断移动终端所要发送的数据包中静态数据、行为数据以及交易数据各自所占的百分比;以及如果行为数据以及交易数据所占的百分比总和大于数据包中总数据量的80%,则对数据包分配最高优先级,如果行为数据以及交易数据所占的百分比总和占数据包中总数据量的60%-80%,则对数据包分配次高优先级,如果行为数据以及交易数据所占的百分比总和小于数据包中总数据量的60%,则对数据包分配最低优先级。
在一优选的实施方式中,其中,由移动终端基于信息发送优先级信息,确定发送顺序包括如下步骤:确定所要发送的包括静态数据、行为数据以及交易数据的数据包的内容;基于要发送的包括静态数据、行为数据以及交易数据的数据包,匹配针对数据包的优先级;如果匹配到的优先级为最高优先级,则确定移动终端具有第一发送顺序;如果匹配到的优先级为次高优先级,则确定移动终端具有第二发送顺序;以及如果匹配到的优先级为最低优先级,则确定移动终端具有第三发送顺序。
在一优选的实施方式中,其中,由移动终端确定发送随机轮候时间,并由移动终端在发送随机轮候时间之后并按照发送顺序,向传输接收点发送随机接入请求消息具体包括如下步骤:如果移动终端具有第一发送顺序,则由移动终端确定发送随机轮候时间,并由移动终端在发送随机轮候时间之后,向传输接收点发送随机接入请求消息;如果移动终端具有第二发送顺序,则由具有第二发送顺序的移动终端确定发送随机轮候时间,并由具有第二发送顺序的移动终端确定具有第一发送顺序的移动终端是否完成发送,如果具有第一发送顺序的移动终端完成发送,则由具有第二发送顺序的移动终端在发送随机轮候时间之后,向传输接收点发送随机接入请求消息;以及如果移动终端具有第三发送顺序,则由具有第三发送顺序的移动终端确定发送随机轮候时间,并由具有第三发送顺序的移动终端确定具有第一发送顺序的移动终端和具有第二发送顺序的移动终端是否完成发送,如果具有第一发送顺序的移动终端和具有第二发送顺序的移动终端完成发送,则由具有第三发送顺序的移动终端在发送随机轮候时间之后,向传输接收点发送随机接入请求消息(具有第二发送顺序的移动终端确定具有第一发送顺序的移动终端是否完成发送的方法可以有很多种,比较简单的方式就是在传输接收点设计一个定时器,该定时器代表了第一发送顺序的移动终端发送到传输接收点的最大时延,所以定时器到时就代表第一发送顺序的移动终端全部发送完毕,此时,传输接收点可以组播通知使得第二发送顺序的移动终端开始发送)。
本发明还提供了一种数据建模中的衍生变量信息的传输系统,该数据建模中的衍生变量信息的传输系统包括:用于由移动终端收集原始数据并将所收集的原始数据划分为静态数据、行为数据以及交易数据的单元;用于由移动终端接收信息发送优先级信息的单元,其中,信息发送优先级信息是由传输接收点广播的,并且其中,信息发送优先级信息包括针对包括静态数据、行为数据以及交易数据的数据包的优先级;用于由移动终端接收移动终端身份标识符的单元,其中,移动终端身份标识符是由传输接收点生成并分配给移动终端的,并且其中,移动终端身份标识符仅能够用于移动终端以及传输接收点不重复分配移动终端身份标识符;用于由移动终端基于信息发送优先级信息,确定发送顺序的单元;以及用于由移动终端确定发送随机轮候时间,并由移动终端在发送随机轮候时间之后并按照发送顺序,向传输接收点发送随机接入请求消息的单元,其中,随机接入请求消息中包括发送随机轮候时间以及移动终端身份标识符。
在一优选的实施方式中,数据建模中的衍生变量信息的传输系统包括:用于由移动终端接收随机接入请求确认消息的单元,其中,随机接入请求确认消息是由传输接收点发送的,并且其中,随机接入请求确认消息中包括移动终端身份标识符;用于在接收到随机接入请求确认消息之后,由移动终端依据发送顺序向传输接收点发送包括静态数据、行为数据以及交易数据的数据包的单元,其中,数据包中还包括移动终端身份标识符;其中,传输接收点基于以下步骤来生成并发送随机接入请求确认消息:基于所接收的随机接入请求消息来确定发送随机轮候时间;基于发送随机轮候时间将移动终端分类,其中,移动终端至少被分为三类,第一类移动终端的发送随机轮候时间小于第一门限,第二类移动终端的发送随机轮候时间大于第一门限且小于第二门限,第三类移动终端的发送随机轮候时间大于第二门限,并且其中,第一类移动终端包括多个移动终端,第二类移动终端包括多个移动终端,第三类移动终端包括多个移动终端;以及向每一类移动终端分别发送随机接入请求确认消息。
在一优选的实施方式中,其中,基于以下步骤确定信息发送优先级信息:判断移动终端所要发送的数据包中静态数据、行为数据以及交易数据各自所占的百分比;以及如果行为数据以及交易数据所占的百分比总和大于数据包中总数据量的80%,则对数据包分配最高优先级,如果行为数据以及交易数据所占的百分比总和占数据包中总数据量的60%-80%,则对数据包分配次高优先级,如果行为数据以及交易数据所占的百分比总和小于数据包中总数据量的60%,则对数据包分配最低优先级。
在一优选的实施方式中,其中,由移动终端基于信息发送优先级信息,确定发送顺序包括如下步骤:确定所要发送的包括静态数据、行为数据以及交易数据的数据包的内容;基于要发送的包括静态数据、行为数据以及交易数据的数据包,匹配针对数据包的优先级;如果匹配到的优先级为最高优先级,则确定移动终端具有第一发送顺序;如果匹配到的优先级为次高优先级,则确定移动终端具有第二发送顺序;以及如果匹配到的优先级为最低优先级,则确定移动终端具有第三发送顺序。
在一优选的实施方式中,其中,由移动终端确定发送随机轮候时间,并由移动终端在发送随机轮候时间之后并按照发送顺序,向传输接收点发送随机接入请求消息具体包括如下步骤:如果移动终端具有第一发送顺序,则由移动终端确定发送随机轮候时间,并由移动终端在发送随机轮候时间之后,向传输接收点发送随机接入请求消息;如果移动终端具有第二发送顺序,则由具有第二发送顺序的移动终端确定发送随机轮候时间,并由具有第二发送顺序的移动终端确定具有第一发送顺序的移动终端是否完成发送,如果具有第一发送顺序的移动终端完成发送,则由具有第二发送顺序的移动终端在发送随机轮候时间之后,向传输接收点发送随机接入请求消息;以及如果移动终端具有第三发送顺序,则由具有第三发送顺序的移动终端确定发送随机轮候时间,并由具有第三发送顺序的移动终端确定具有第一发送顺序的移动终端和具有第二发送顺序的移动终端是否完成发送,如果具有第一发送顺序的移动终端和具有第二发送顺序的移动终端完成发送,则由具有第三发送顺序的移动终端在发送随机轮候时间之后,向传输接收点发送随机接入请求消息。
以下介绍接收到静态数据、行为数据以及交易数据之后的处理方法,本发明中所有的原始变量通过大量的观察分为三类:静态数据,如个人信息;行为数据,如京东APP浏览行为等;交易数据,例如网上购物、缴纳水电费、投资理财等每类数据中有文本型、枚举型、布尔型、数值型等主要四类,针对每类数据中的四种数据类型,我们分别建立了一套构造变量的规则,以行为数据及交易数据为主,衍生变量的构造规则包括:
时间规则:星期、月、季度、年
交叉规则:将一条记录的描述性分类字段与金额型数值字段按照业务场景差异进行交叉生成衍生变量,例如日期时间与交易金额、产品分类与交易金额等
趋势规则:从近一段时间内的交易波动程度与变化趋势构造衍生变量
语言规则:分为中文和英文,使用不同的处理方法,英文的分词相对简单,中文我们建立了独立的行业词库对产品名称、功能名称、页面名称等中文数据进行分词,然后和交易时间、交易金额进行交叉构造衍生变量
三类数据的衍生变量构造规则封装了多个处理模板,在应用时,将需要的参数传入模板文件,经过计算机大量运算后可得到一套全面的衍生变量,相对于传统的人工构造变量方法,大大提高了工作效率,所需时间只是原先的几分之一到几十分之一,并且不丢失任何一个有价值哪怕是低价值的衍生变量,而且由于构造规则融入了多年的数据建模经验,能够对数据中的特征挖掘做到最彻底和最全面。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
前述对本发明的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本发明限定为所公开的精确形式,并且很显然,根据上述教导,可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本发明的特定原理及其实际应用,从而使得本领域的技术人员能够实现并利用本发明的各种不同的示例性实施方案以及各种不同的选择和改变。本发明的范围意在由权利要求书及其等同形式所限定。
Claims (10)
1.一种数据建模中的智能衍生变量构造方法,其特征在于:所述数据建模中的衍生变量信息的传输方法包括如下步骤:
由移动终端收集原始数据并将所收集的原始数据划分为静态数据、行为数据以及交易数据;
由所述移动终端接收信息发送优先级信息,其中,所述信息发送优先级信息是由传输接收点广播的,并且其中,所述信息发送优先级信息包括针对包括静态数据、行为数据以及交易数据的数据包的优先级;
由所述移动终端接收移动终端身份标识符,其中,所述移动终端身份标识符是由所述传输接收点生成并分配给所述移动终端的,并且其中,所述移动终端身份标识符仅能够用于所述移动终端以及所述传输接收点不重复分配所述移动终端身份标识符;
由所述移动终端基于所述信息发送优先级信息,确定发送顺序;以及
由所述移动终端确定发送随机轮候时间,并由所述移动终端在所述发送随机轮候时间之后并按照所述发送顺序,向所述传输接收点发送随机接入请求消息,其中,所述随机接入请求消息中包括所述发送随机轮候时间以及所述移动终端身份标识符。
2.如权利要求1所述的数据建模中的智能衍生变量构造方法,其特征在于:所述数据建模中的衍生变量信息的传输方法包括如下步骤:
由所述移动终端接收随机接入请求确认消息,其中,所述随机接入请求确认消息是由所述传输接收点发送的,并且其中,所述随机接入请求确认消息中包括所述移动终端身份标识符;
在接收到所述随机接入请求确认消息之后,由所述移动终端依据所述发送顺序向所述传输接收点发送包括静态数据、行为数据以及交易数据的数据包,其中,所述数据包中还包括所述移动终端身份标识符;
其中,所述传输接收点基于以下步骤来生成并发送所述随机接入请求确认消息:
基于所接收的随机接入请求消息来确定所述发送随机轮候时间;
基于所述发送随机轮候时间将所述移动终端分类,其中,所述移动终端至少被分为三类,第一类移动终端的发送随机轮候时间小于第一门限,第二类移动终端的发送随机轮候时间大于第一门限且小于第二门限,第三类移动终端的发送随机轮候时间大于第二门限,并且其中,所述第一类移动终端包括多个移动终端,所述第二类移动终端包括多个移动终端,所述第三类移动终端包括多个移动终端;
向每一类移动终端分别发送所述随机接入请求确认消息。
3.如权利要求2所述的数据建模中的智能衍生变量构造方法,其特征在于:其中,基于以下步骤确定所述信息发送优先级信息:
判断移动终端所要发送的数据包中静态数据、行为数据以及交易数据各自所占的百分比;以及
如果行为数据以及交易数据所占的百分比总和大于数据包中总数据量的80%,则对所述数据包分配最高优先级,如果行为数据以及交易数据所占的百分比总和占数据包中总数据量的60%-80%,则对所述数据包分配次高优先级,如果行为数据以及交易数据所占的百分比总和小于数据包中总数据量的60%,则对所述数据包分配最低优先级。
4.如权利要求3所述的数据建模中的智能衍生变量构造方法,其特征在于:其中,所述由移动终端基于所述信息发送优先级信息,确定发送顺序包括如下步骤:
确定所要发送的包括静态数据、行为数据以及交易数据的数据包的内容;
基于所述要发送的包括静态数据、行为数据以及交易数据的数据包,匹配针对所述数据包的优先级;
如果匹配到的优先级为最高优先级,则确定所述移动终端具有第一发送顺序;
如果匹配到的优先级为次高优先级,则确定所述移动终端具有第二发送顺序;以及
如果匹配到的优先级为最低优先级,则确定所述移动终端具有第三发送顺序。
5.如权利要求4所述的数据建模中的智能衍生变量构造方法,其特征在于:其中,由移动终端确定发送随机轮候时间,并由移动终端在所述发送随机轮候时间之后并按照所述发送顺序,向所述传输接收点发送随机接入请求消息具体包括如下步骤:
如果所述移动终端具有第一发送顺序,则由所述移动终端确定发送随机轮候时间,并由所述移动终端在所述发送随机轮候时间之后,向所述传输接收点发送随机接入请求消息;
如果所述移动终端具有第二发送顺序,则由具有第二发送顺序的移动终端确定发送随机轮候时间,并由具有第二发送顺序的移动终端确定具有第一发送顺序的移动终端是否完成发送,如果具有第一发送顺序的移动终端完成发送,则由具有第二发送顺序的移动终端在所述发送随机轮候时间之后,向所述传输接收点发送随机接入请求消息;以及
如果所述移动终端具有第三发送顺序,则由具有第三发送顺序的移动终端确定发送随机轮候时间,并由具有第三发送顺序的移动终端确定具有第一发送顺序的移动终端和具有第二发送顺序的移动终端是否完成发送,如果具有第一发送顺序的移动终端和具有第二发送顺序的移动终端完成发送,则由具有第三发送顺序的移动终端在所述发送随机轮候时间之后,向所述传输接收点发送随机接入请求消息。
6.一种数据建模中的数据建模中的智能衍生变量构造方法,其特征在于:所述数据建模中的衍生变量信息的传输系统包括:
用于由移动终端收集原始数据并将所收集的原始数据划分为静态数据、行为数据以及交易数据的单元;
用于由所述移动终端接收信息发送优先级信息的单元,其中,所述信息发送优先级信息是由传输接收点广播的,并且其中,所述信息发送优先级信息包括针对包括静态数据、行为数据以及交易数据的数据包的优先级;
用于由所述移动终端接收移动终端身份标识符的单元,其中,所述移动终端身份标识符是由所述传输接收点生成并分配给所述移动终端的,并且其中,所述移动终端身份标识符仅能够用于所述移动终端以及所述传输接收点不重复分配所述移动终端身份标识符;
用于由所述移动终端基于所述信息发送优先级信息,确定发送顺序的单元;以及
用于由所述移动终端确定发送随机轮候时间,并由所述移动终端在所述发送随机轮候时间之后并按照所述发送顺序,向所述传输接收点发送随机接入请求消息的单元,其中,所述随机接入请求消息中包括所述发送随机轮候时间以及所述移动终端身份标识符。
7.如权利要求6所述的数据建模中的智能衍生变量构造方法,其特征在于:所述数据建模中的衍生变量信息的传输系统包括:
用于由所述移动终端接收随机接入请求确认消息的单元,其中,所述随机接入请求确认消息是由所述传输接收点发送的,并且其中,所述随机接入请求确认消息中包括所述移动终端身份标识符;
用于在接收到所述随机接入请求确认消息之后,由所述移动终端依据所述发送顺序向所述传输接收点发送包括静态数据、行为数据以及交易数据的数据包的单元,其中,所述数据包中还包括所述移动终端身份标识符;
其中,所述传输接收点基于以下步骤来生成并发送所述随机接入请求确认消息:
基于所接收的随机接入请求消息来确定所述发送随机轮候时间;
基于所述发送随机轮候时间将所述移动终端分类,其中,所述移动终端至少被分为三类,第一类移动终端的发送随机轮候时间小于第一门限,第二类移动终端的发送随机轮候时间大于第一门限且小于第二门限,第三类移动终端的发送随机轮候时间大于第二门限,并且其中,所述第一类移动终端包括多个移动终端,所述第二类移动终端包括多个移动终端,所述第三类移动终端包括多个移动终端;以及
向每一类移动终端分别发送所述随机接入请求确认消息。
8.如权利要求7所述的数据建模中的智能衍生变量构造方法,其特征在于:其中,基于以下步骤确定所述信息发送优先级信息:
判断移动终端所要发送的数据包中静态数据、行为数据以及交易数据各自所占的百分比;以及
如果行为数据以及交易数据所占的百分比总和大于数据包中总数据量的80%,则对所述数据包分配最高优先级,如果行为数据以及交易数据所占的百分比总和占数据包中总数据量的60%-80%,则对所述数据包分配次高优先级,如果行为数据以及交易数据所占的百分比总和小于数据包中总数据量的60%,则对所述数据包分配最低优先级。
9.如权利要求8所述的数据建模中的智能衍生变量构造方法,其特征在于:其中,所述由移动终端基于所述信息发送优先级信息,确定发送顺序包括如下步骤:
确定所要发送的包括静态数据、行为数据以及交易数据的数据包的内容;
基于所述要发送的包括静态数据、行为数据以及交易数据的数据包,匹配针对所述数据包的优先级;
如果匹配到的优先级为最高优先级,则确定所述移动终端具有第一发送顺序;
如果匹配到的优先级为次高优先级,则确定所述移动终端具有第二发送顺序;以及
如果匹配到的优先级为最低优先级,则确定所述移动终端具有第三发送顺序。
10.如权利要求9所述的数据建模中的智能衍生变量构造方法,其特征在于:其中,由移动终端确定发送随机轮候时间,并由移动终端在所述发送随机轮候时间之后并按照所述发送顺序,向所述传输接收点发送随机接入请求消息具体包括如下步骤:
如果所述移动终端具有第一发送顺序,则由所述移动终端确定发送随机轮候时间,并由所述移动终端在所述发送随机轮候时间之后,向所述传输接收点发送随机接入请求消息;
如果所述移动终端具有第二发送顺序,则由具有第二发送顺序的移动终端确定发送随机轮候时间,并由具有第二发送顺序的移动终端确定具有第一发送顺序的移动终端是否完成发送,如果具有第一发送顺序的移动终端完成发送,则由具有第二发送顺序的移动终端在所述发送随机轮候时间之后,向所述传输接收点发送随机接入请求消息;以及
如果所述移动终端具有第三发送顺序,则由具有第三发送顺序的移动终端确定发送随机轮候时间,并由具有第三发送顺序的移动终端确定具有第一发送顺序的移动终端和具有第二发送顺序的移动终端是否完成发送,如果具有第一发送顺序的移动终端和具有第二发送顺序的移动终端完成发送,则由具有第三发送顺序的移动终端在所述发送随机轮候时间之后,向所述传输接收点发送随机接入请求消息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910683234.3A CN110475370A (zh) | 2019-07-31 | 2019-07-31 | 数据建模中的智能衍生变量构造方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910683234.3A CN110475370A (zh) | 2019-07-31 | 2019-07-31 | 数据建模中的智能衍生变量构造方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110475370A true CN110475370A (zh) | 2019-11-19 |
Family
ID=68508364
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910683234.3A Pending CN110475370A (zh) | 2019-07-31 | 2019-07-31 | 数据建模中的智能衍生变量构造方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110475370A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111539532A (zh) * | 2020-04-01 | 2020-08-14 | 深圳市魔数智擎人工智能有限公司 | 一种面向模型构建的特征自动化衍生方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101394626A (zh) * | 2007-09-19 | 2009-03-25 | 株式会社Ntt都科摩 | 基于无线局域网的分布式业务区分方法和设备 |
CN104823503A (zh) * | 2013-11-15 | 2015-08-05 | 华为技术有限公司 | 通信方法、用户设备和基站 |
CN104994590A (zh) * | 2015-06-29 | 2015-10-21 | 上海华为技术有限公司 | 一种数据传输方法及装置 |
WO2015161434A1 (zh) * | 2014-04-22 | 2015-10-29 | 华为技术有限公司 | 一种用非授权频谱进行数据通信的方法、设备及通信系统 |
CN108811119A (zh) * | 2017-05-05 | 2018-11-13 | 华为技术有限公司 | 随机接入方法、设备和系统 |
KR20190079939A (ko) * | 2017-12-28 | 2019-07-08 | 한국전자통신연구원 | 통신 네트워크에서 랜덤 액세스를 위한 장치 및 방법 |
-
2019
- 2019-07-31 CN CN201910683234.3A patent/CN110475370A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101394626A (zh) * | 2007-09-19 | 2009-03-25 | 株式会社Ntt都科摩 | 基于无线局域网的分布式业务区分方法和设备 |
CN104823503A (zh) * | 2013-11-15 | 2015-08-05 | 华为技术有限公司 | 通信方法、用户设备和基站 |
WO2015161434A1 (zh) * | 2014-04-22 | 2015-10-29 | 华为技术有限公司 | 一种用非授权频谱进行数据通信的方法、设备及通信系统 |
CN104994590A (zh) * | 2015-06-29 | 2015-10-21 | 上海华为技术有限公司 | 一种数据传输方法及装置 |
CN108811119A (zh) * | 2017-05-05 | 2018-11-13 | 华为技术有限公司 | 随机接入方法、设备和系统 |
KR20190079939A (ko) * | 2017-12-28 | 2019-07-08 | 한국전자통신연구원 | 통신 네트워크에서 랜덤 액세스를 위한 장치 및 방법 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111539532A (zh) * | 2020-04-01 | 2020-08-14 | 深圳市魔数智擎人工智能有限公司 | 一种面向模型构建的特征自动化衍生方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110443375A (zh) | 一种联邦学习方法及装置 | |
CN105224959A (zh) | 排序模型的训练方法和装置 | |
CN104462293A (zh) | 搜索处理方法、生成搜索结果排序模型的方法和装置 | |
Zhan et al. | Incentive mechanism design for federated learning: Challenges and opportunities | |
CN100573576C (zh) | 网络环境下大型地下洞室群施工进度实时分析与控制系统及方法 | |
CN104462222A (zh) | 一种卡口车辆通行数据的分布式存储方法及系统 | |
CN103838857B (zh) | 一种基于语义的自动服务组合系统及方法 | |
CN101957845B (zh) | 一种在线应用系统及其实现方法 | |
CN106156257A (zh) | 一种微博舆情事件的态势预测方法 | |
CN104750760A (zh) | 一种推荐应用软件的实现方法及装置 | |
CN106383720A (zh) | 一种软件产品原型的云端分享协作方法 | |
CN109729044A (zh) | 一种通用的互联网数据采集反反爬系统及方法 | |
CN105871585A (zh) | 终端关联方法及装置 | |
CN104750718A (zh) | 一种数据信息的搜索方法和设备 | |
CN110475370A (zh) | 数据建模中的智能衍生变量构造方法 | |
CN101986608B (zh) | 一种异构覆盖网络负载均衡程度的评价方法 | |
CN107995278B (zh) | 一种基于城域级物联网感知数据的场景智能分析系统与方法 | |
CN104636397B (zh) | 用于分布式计算的资源分配方法、计算加速方法以及装置 | |
CN108171538A (zh) | 用户数据处理方法及系统 | |
CN108418871A (zh) | 一种云存储性能优化方法和系统 | |
CN109285015A (zh) | 一种虚拟资源的分配方法及系统 | |
CN101286903B (zh) | 一种网络审计领域提高会话完整性的方法 | |
CN101155341A (zh) | 无线内容服务系统、服务器和相应的终端 | |
CN102654871A (zh) | 一种基于QoS历史记录的服务组合优化方法 | |
CN105577434A (zh) | 一种基于社交网络的多重关联挖掘的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20191119 |