CN112256739A - 一种基于多臂赌博机的动态流大数据中数据项筛选方法 - Google Patents

一种基于多臂赌博机的动态流大数据中数据项筛选方法 Download PDF

Info

Publication number
CN112256739A
CN112256739A CN202011263725.1A CN202011263725A CN112256739A CN 112256739 A CN112256739 A CN 112256739A CN 202011263725 A CN202011263725 A CN 202011263725A CN 112256739 A CN112256739 A CN 112256739A
Authority
CN
China
Prior art keywords
buffer
data items
data
arm
gambling machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011263725.1A
Other languages
English (en)
Other versions
CN112256739B (zh
Inventor
丁春玲
曾国荪
王顺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN202011263725.1A priority Critical patent/CN112256739B/zh
Publication of CN112256739A publication Critical patent/CN112256739A/zh
Application granted granted Critical
Publication of CN112256739B publication Critical patent/CN112256739B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24568Data stream processing; Continuous queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/34Betting or bookmaking, e.g. Internet betting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于多臂赌博机的动态流大数据中数据项筛选方法,包括步骤1:获取动态流大数据的数据项信息;步骤2:构建多臂赌博机模型;步骤3:判断当前时间窗口是否为最后一个时间窗口,若是,则执行步骤6,否则,执行步骤4;步骤4:在当前时间窗口内选取多臂赌博机模型的臂;步骤5:从步骤4选出的臂中选取数据项,并将其合并到数据项集合中,然后返回步骤3;步骤6:输出数据项集合。与现有技术相比,本发明具有筛选结果更加精确、适应性强等优点。

Description

一种基于多臂赌博机的动态流大数据中数据项筛选方法
技术领域
本发明涉及流大数据分析挖掘技术领域,尤其是涉及一种基于多臂赌博机的动态流大数据中数据项筛选方法。
背景技术
分析和挖掘流大数据中蕴藏的价值是大数据处理中的关键任务之一,由此可以提取知识、获得见解,继而帮助人们做出更好的决策。因此,实时处理这些动态产生的流大数据十分重要,其重要性甚至超过数据计算的精度。在这一类应用中,处理每一个数据项将获得一定的价值,每个数据项的价值各不相同,因此从源源不断的数据流中获取更多的价值是这类应用的主要目标。然而,在资源有限条件下,如何充分利用各种计算资源,并从流大数据中选择一批具有较高价值数据是一个重要问题。传统的选择方法难以解决没有先验知识条件下的流数据项选择问题,这为流数据项的选择带来了困难。
在流数据项选择中,现有区分数据“重要”与否的方法大体可以分为两类:有监督算法和无监督算法。有监督学习算法有SVM、贝叶斯网络、决策树归纳、神经网络等。这类算法必须要有已被分类标记的训练数据,这为算法的实施带来了诸多困难。无监督学习算法有K-means、近邻传播、基于密度的聚类、基于层次的聚类算法、核聚类、智能搜索聚类等。这类算法虽然不需要训练数据,但它们仍就只考虑数据本身的特性,在实际应用中,数据的价值高低还与处理数据的环境、业务相关,这就为实时、高效选择流数据项提出了新的挑战。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种筛选结果更加精确、适应性强的基于多臂赌博机的动态流大数据中数据项筛选方法。
本发明的目的可以通过以下技术方案来实现:
一种基于多臂赌博机的动态流大数据中数据项筛选方法,所述的数据项筛选方法包括以下步骤:
步骤1:获取动态流大数据的数据项信息;
步骤2:构建多臂赌博机模型;
步骤3:判断当前时间窗口是否为最后一个时间窗口,若是,则执行步骤6,否则,执行步骤4;
步骤4:在当前时间窗口内选取多臂赌博机模型的臂;
步骤5:从步骤4选出的臂中选取数据项,并将其合并到数据项集合中,然后返回步骤3;
步骤6:输出数据项集合。
优选地,所述的步骤2具体为:
设数据项共有M个类别,根据数据项模的大小,将数据项的模划分为M个区间,即[D1,D2),[D3,D4),…,[DM,DM+1],分别对应M个缓冲区buffer1,buffer2,…,bufferM,M个缓冲区作为多臂赌博机模型的M个臂arm1,arm2,…,armM构建多臂赌博机模型;
每个数据项到达时,首先计算数据项的模,根据模所在区间将其缓存至相应的缓存区内,完成多臂赌博机模型的构建。
优选地,所述的步骤4以UCB-greedy-Mix选择策略选取多臂赌博机模型的臂。
更加优选地,所述的步骤4具体为:
步骤4-1:设置探索概率εi的取值;
步骤4-2:在当前时间窗口Tk内,以概率εi进行多臂赌博机的探索,以概率1-εi进行多臂赌博机的利用;
步骤4-3:获取多臂赌博机进行探索或利用后的臂buffer。
更加优选地,所述的步骤4-1具体为:
定义探索概率εi序列,即
εi∈(0,1]i=1,2,…
Figure BDA0002775452760000021
其中,c和d为调节εi降低速度的常数参数。
更加优选地,所述步骤4-2中以概率εi进行多臂赌博机的探索具体为:
设Sk,j表示在时间窗口Tk内,从bufferj中被取走的数据的总个数,R(Tk,bufferj)表示在Tk时间窗口内,从bufferj中选择的所有数据项处理后的累计回报,即
Figure BDA0002775452760000031
R(→Tk,bufferj)表示从bufferj中选择的所有数据的累计回报,
Figure BDA0002775452760000032
表示单个数据项的回报;
在时间窗口Tk内,多臂赌博机进行探索时,将每个臂累计回报的置信上界R(→Tk,bufferj,UCB)作为选择的依据,即以概率εi选中bufferj=argjmaxR(→Tk,bufferj,UCB)。
更加优选地,所述步骤4-2中以概率1-εi进行多臂赌博机的利用具体为:
对于当前时间窗口Tp,设Op,j表示由时间窗口Tp的初始时刻到当前时刻已经从bufferj中取走的数据项个数,则上述时间段内的总回报为
Figure BDA0002775452760000033
从bufferj选择取走的数据项的累计回报为R(→Tp,bufferj);
在当前时间窗口Tp内,以1-εi的概率选中bufferj=argjmaxR(→Tp,bufferj)。
更加优选地,所述的累计回报R(→Tp,bufferj)的计算方法为:
Figure BDA0002775452760000034
更加优选地,所述的数据项回报的计算方法为:
Figure BDA0002775452760000035
其中,
Figure BDA0002775452760000036
为任意数据项
Figure BDA0002775452760000037
处理后得到的业务价值;
Figure BDA0002775452760000038
为处理数据项
Figure BDA0002775452760000039
所需的硬件资源;
Figure BDA00027754527600000310
为处理数据项
Figure BDA00027754527600000311
所需的时间资源;
Figure BDA00027754527600000312
为直到当前
Figure BDA00027754527600000313
取走时,总共从bufferj取走的数据项的总个数;
Figure BDA00027754527600000314
为补偿系数。
优选地,所述的步骤5具体为:在步骤4选出的臂中随机抽取该臂中的数据项,并将其合并到数据项集合。
与现有技术相比,本发明具有以下优点:
一、筛选结果更加精确:本发明中的数据项筛选方法通过构造多缓冲队列的多臂赌博机模型,并给出了考虑价值、处理时间、消耗资源、损失价值的综合回报计算方法,将多种因素纳入到多臂赌博机模型中,筛选出的数据项的价值也更高,结果也更为精确。
二、适应性强:本发明中的数据项筛选方法使用多臂赌博机模型来对动态流大数据的数据项进行筛选,该方法对动态流大数据的要求较低,算法的适用范围广,适应性强。
附图说明
图1为本发明中数据项筛选方法对的流程示意图;
图2为本发明中多臂赌博机模型的示意图;
图3为本发明中数据项选择流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
一种基于多臂赌博机的动态流大数据中数据项筛选方法,其流程如图1所示,包括:
步骤1:获取动态流大数据的数据项信息;
步骤2:构建多臂赌博机模型,多臂赌博机模型的结构如图2所示,构建过程具体为:
数据流可根据数据项的特征(例如类型、属性、模数等)不同,分成多个类别,且每个类别的数据项对应的价值分布往往不同,这为构造多臂赌博机模型提供了基础。将不同特征的数据项构成不同的队列,放置到不同的缓冲区buffer,从而构成赌博机的多条臂。根据多臂赌博机的原理,可以构造多个臂,即是创建多个存放数据项buffer,这是成功应用多臂赌博机技术的关键步骤。
设数据项共有M个类别,根据数据项模的大小,将数据项的模划分为M个区间,即[D1,D2),[D3,D4),…,[DM,DM+1],分别对应M个缓冲区buffer1,buffer2,…,bufferM,M个缓冲区作为多臂赌博机模型的M个臂arm1,arm2,…,armM构建多臂赌博机模型;
每个数据项到达时,首先计算数据项的模,根据模所在区间将其缓存至相应的缓存区内,完成多臂赌博机模型的构建;
步骤3:判断当前时间窗口是否为最后一个时间窗口,若是,则执行步骤6,否则,执行步骤4;
步骤4:在当前时间窗口内选取多臂赌博机模型的臂;
本专利以ε-Greedy算法为基础,结合UCB策略中的探索思想,提出了一种新的选择策略:UCB-greedy-Mix选择策略。与ε-Greedy类似,UCB-greedy-Mix选择策略也分为探索和利用两个阶段,其中探索阶段将每个臂回报的置信上界作为选择的依据。此外,该策略设置了一个参数εn作为探索概率,εn根据n的增长而递减,选择过程具体为:
步骤4-1:设置探索概率εi的取值;
定义探索概率εi序列,即
εi∈(0,1]i=1,2,…
Figure BDA0002775452760000051
其中,c和d为调节εi降低速度的常数参数,由用户输入。
步骤4-2:在当前时间窗口Tk内,以概率εi进行多臂赌博机的探索,以概率1-εi进行多臂赌博机的利用;
设Sk,j表示在时间窗口Tk内,从bufferj中被取走的数据的总个数,R(Tk,bufferj)表示在Tk时间窗口内,从bufferj中选择的所有数据项处理后的累计回报,即
Figure BDA0002775452760000052
R(→Tk,bufferj)表示从bufferj中选择的所有数据的累计回报,
Figure BDA0002775452760000053
表示单个数据项的回报;
在时间窗口Tk内,多臂赌博机进行探索时,将每个臂累计回报的置信上界R(→Tk,bufferj,UCB)作为选择的依据,即以概率εi选中bufferj=argjmaxR(→Tk,bufferj,UCB);
对于当前时间窗口Tp,设Op,j表示由时间窗口Tp的初始时刻到当前时刻已经从bufferj中取走的数据项个数,则上述时间段内的总回报为
Figure BDA0002775452760000054
从bufferj选择取走的数据项的累计回报为R(→Tp,bufferj);
在当前时间窗口Tp内,以1-εi的概率选中bufferj=argjmaxR(→Tp,bufferj);
回报计算是多臂赌博机进行在线学习的关键之一。每次处理一个数据,都会获得相应的价值,消耗一定的资源,并花费一定的处理时间,这些反馈从不同角度对回报产生影响。在上述模型的基础上,给出一个数据项
Figure BDA0002775452760000055
的综合回报的计算方法如下:
Figure BDA0002775452760000061
其中,
Figure BDA0002775452760000062
为任意数据项
Figure BDA0002775452760000063
处理后得到的业务价值;
Figure BDA0002775452760000064
为处理数据项
Figure BDA0002775452760000065
所需的硬件资源;
Figure BDA0002775452760000066
为处理数据项
Figure BDA0002775452760000067
所需的时间资源;
Figure BDA0002775452760000068
为直到当前
Figure BDA0002775452760000069
取走时,总共从bufferj取走的数据项的总个数;
Figure BDA00027754527600000610
为补偿系数;
以微博社交网络为例,每一条微博数据的业务价值是关于转发量、点赞量、时间以及关注对象粉丝量的一个函数,即
Figure BDA00027754527600000611
Figure BDA00027754527600000612
表示计算
Figure BDA00027754527600000613
在特定计算环境下需要消耗的CPU指令次数,
Figure BDA00027754527600000614
表示计算
Figure BDA00027754527600000615
的时间。由该实例可以得出本市首例中业务价值、硬件资源和时间资源的数据选取方法,由于在不同的应用环境下,选取具体数值的方法不唯一,所以需要根据实际情况选取对应的数据。
对流数据选择处理是一个持续的过程,所有被处理数据的累计回报最大化是进行数据选择的目标。每个buffer的回报分布不同,只有尽可能多地选择回报高的buffer才能获得最佳效果。为此,将每个buffer的累计回报作为多臂赌博机模型中进行下一次选择的依据。这里一个buffer的累计回报是指从第一个时间窗口的初始时刻开始,到当前时间窗口的当前时刻,该buffer上的回报值的累计之和。对于任意时间窗口Tk,当Tk为当前时间窗口时,从buffer中取数据的过程可能尚未完成;当Tk为之前的时间窗口时,由于Tk已结束,buffer已完成取数据和丢弃数据。因此,可以将累计回报分成两部分计算:
Figure BDA00027754527600000616
步骤4-3:获取多臂赌博机进行探索或利用后的臂buffer;
步骤5:从步骤4选出的臂中选取数据项,并将其合并到数据项集合中,然后返回步骤3,具体为:
在步骤4选出的臂中随机抽取该臂中任意数量的数据项,并将其合并到数据项集合。
步骤6:输出数据项集合。
本实施例中的数据项筛选方法提炼了影响数据项选择的四方面因素,包括业务价值、处理时间、消耗资源、损失价值。然后,将流大数据按照一定的规则分成多个缓存队列,作为臂构建了多臂赌博机模型,给出多臂赌博机考虑了业务价值、处理时间、消耗资源和损失的综合回报计算方式。先后给出了基于ε-greedy、UCB策略的流数据选择方法,并将两者结合提出了UCB-greedy-Mix数据选择策略,数据项筛选过程如图3所示。理论和实验对比表明,这种交互在线学习的数据项选择方法,能够更好地适应应用领域数据选择的实际情况。
本实施例进行数据项筛选的具体方法为:
将动态流大数据项选择分为两个阶段,分别是探索阶段和利用阶段。在探索阶段,每次选择置信上界R(→Tk,bufferj,UCB)最大的buffer;在利用阶段每次选择累计回报R(→Tp,bufferj)最大的buffer。
输入:流大数据S={d1,d2,...,dn...},buffer个数M,参数c和d,c>0,0<d<1;
输出:被选择的数据项集合D。
第1步:初始化,即定义一个序列εi∈(0,1];i=1,2,…;
Figure BDA0002775452760000071
第2步:根据具体规则构造M个buffer:buffer1,buffer2,……bufferM
第3步:在任意一个时间窗口Tk内,以概率εi选中bufferj=argjmaxR(→Tk,bufferj,UCB);以概率1-εi选中bufferj=argjmaxR(→Tp,bufferj);在选中的bufferj中,取出数据项
Figure BDA0002775452760000072
放入输出数据集合,即
Figure BDA0002775452760000073
以上操作对所有的时间窗口全部执行完成;
第4步:输出集合D=D1∪D2∪...∪Dp
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种基于多臂赌博机的动态流大数据中数据项筛选方法,其特征在于,所述的数据项筛选方法包括以下步骤:
步骤1:获取动态流大数据的数据项信息;
步骤2:构建多臂赌博机模型;
步骤3:判断当前时间窗口是否为最后一个时间窗口,若是,则执行步骤6,否则,执行步骤4;
步骤4:在当前时间窗口内选取多臂赌博机模型的臂;
步骤5:从步骤4选出的臂中选取数据项,并将其合并到数据项集合中,然后返回步骤3;
步骤6:输出数据项集合。
2.根据权利要求1所述的一种基于多臂赌博机的动态流大数据中数据项筛选方法,其特征在于,所述的步骤2具体为:
设数据项共有M个类别,根据数据项模的大小,将数据项的模划分为M个区间,即[D1,D2),[D3,D4),…,[DM,DM+1],分别对应M个缓冲区buffer1,buffer2,…,bufferM,M个缓冲区作为多臂赌博机模型的M个臂arm1,arm2,…,armM构建多臂赌博机模型;
每个数据项到达时,计算数据项的模,根据模所在区间将其缓存至相应的缓存区内,完成多臂赌博机模型的构建。
3.根据权利要求1所述的一种基于多臂赌博机的动态流大数据中数据项筛选方法,其特征在于,所述的步骤4以UCB-greedy-Mix选择策略选取多臂赌博机模型的臂。
4.根据权利要求3所述的一种基于多臂赌博机的动态流大数据中数据项筛选方法,其特征在于,所述的步骤4具体为:
步骤4-1:设置探索概率εi的取值;
步骤4-2:在当前时间窗口Tk内,以概率εi进行多臂赌博机的探索,以概率1-εi进行多臂赌博机的利用;
步骤4-3:获取多臂赌博机进行探索或利用后的臂buffer。
5.根据权利要求4所述的一种基于多臂赌博机的动态流大数据中数据项筛选方法,其特征在于,所述的步骤4-1具体为:
定义探索概率εi序列,即
εi∈(0,1]i=1,2,…
Figure FDA0002775452750000021
其中,c和d为调节εi降低速度的常数参数。
6.根据权利要求4所述的一种基于多臂赌博机的动态流大数据中数据项筛选方法,其特征在于,所述步骤4-2中以概率εi进行多臂赌博机的探索具体为:
设Sk,j表示在时间窗口Tk内,从bufferj中被取走的数据的总个数,R(Tk,bufferj)表示在Tk时间窗口内,从bufferj中选择的所有数据项处理后的累计回报,即
Figure FDA0002775452750000022
R(→Tk,bufferj)表示从bufferj中选择的所有数据的累计回报,
Figure FDA0002775452750000023
表示单个数据项的回报;
在时间窗口Tk内,多臂赌博机进行探索时,将每个臂累计回报的置信上界R(→Tk,bufferj,UCB)作为选择的依据,即以概率εi选中bufferj=argjmax R(→Tk,bufferj,UCB)。
7.根据权利要求6所述的一种基于多臂赌博机的动态流大数据中数据项筛选方法,其特征在于,所述步骤4-2中以概率1-εi进行多臂赌博机的利用具体为:
对于当前时间窗口Tp,设Op,j表示由时间窗口Tp的初始时刻到当前时刻已经从bufferj中取走的数据项个数,则上述时间段内的总回报为
Figure FDA0002775452750000024
从bufferj选择取走的数据项的累计回报为R(→Tp,bufferj);
在当前时间窗口Tp内,以1-εi的概率选中bufferj=argjmax R(→Tp,bufferj)。
8.根据权利要求7所述的一种基于多臂赌博机的动态流大数据中数据项筛选方法,其特征在于,所述的累计回报R(→Tp,bufferj)的计算方法为:
Figure FDA0002775452750000025
9.根据权利要求6所述的一种基于多臂赌博机的动态流大数据中数据项筛选方法,其特征在于,所述的数据项回报的计算方法为:
Figure FDA0002775452750000026
其中,
Figure FDA0002775452750000031
为任意数据项
Figure FDA0002775452750000032
处理后得到的业务价值;
Figure FDA0002775452750000033
为处理数据项
Figure FDA0002775452750000034
所需的硬件资源;
Figure FDA0002775452750000035
为处理数据项
Figure FDA0002775452750000036
所需的时间资源;
Figure FDA0002775452750000037
为直到当前
Figure FDA0002775452750000038
取走时,总共从bufferj取走的数据项的总个数;
Figure FDA0002775452750000039
为补偿系数。
10.根据权利要求1所述的一种基于多臂赌博机的动态流大数据中数据项筛选方法,其特征在于,所述的步骤5具体为:在步骤4选出的臂中随机抽取该臂中的数据项,并将其合并到数据项集合。
CN202011263725.1A 2020-11-12 2020-11-12 一种基于多臂赌博机的动态流大数据中数据项筛选方法 Active CN112256739B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011263725.1A CN112256739B (zh) 2020-11-12 2020-11-12 一种基于多臂赌博机的动态流大数据中数据项筛选方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011263725.1A CN112256739B (zh) 2020-11-12 2020-11-12 一种基于多臂赌博机的动态流大数据中数据项筛选方法

Publications (2)

Publication Number Publication Date
CN112256739A true CN112256739A (zh) 2021-01-22
CN112256739B CN112256739B (zh) 2022-11-18

Family

ID=74265815

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011263725.1A Active CN112256739B (zh) 2020-11-12 2020-11-12 一种基于多臂赌博机的动态流大数据中数据项筛选方法

Country Status (1)

Country Link
CN (1) CN112256739B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112668721A (zh) * 2021-03-17 2021-04-16 中国科学院自动化研究所 通用的非平稳环境中去中心化多智能系统的决策方法
CN113282747A (zh) * 2021-04-28 2021-08-20 南京大学 一种基于自动机器学习算法选择的文本分类方法
CN113721809A (zh) * 2021-09-08 2021-11-30 遨博(江苏)机器人有限公司 一种窗口展示方法及系统
CN114756287A (zh) * 2022-06-14 2022-07-15 飞腾信息技术有限公司 一种重排序缓冲区的数据处理方法、装置及存储介质

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103686755A (zh) * 2013-12-26 2014-03-26 西南科技大学 一种认知无线电实现最优传输的在线学习方法
CN104991966A (zh) * 2014-07-29 2015-10-21 Tcl集团股份有限公司 媒体内容排序方法及系统
WO2015179373A1 (en) * 2014-05-19 2015-11-26 Baynote, Inc. System and method for context-aware recommendation through user activity change detection
US20170103413A1 (en) * 2015-10-08 2017-04-13 Samsung Sds America, Inc. Device, method, and computer readable medium of generating recommendations via ensemble multi-arm bandit with an lpboost
CN109039797A (zh) * 2018-06-11 2018-12-18 电子科技大学 基于强化学习的大流检测方法
CN109548055A (zh) * 2018-11-19 2019-03-29 西安电子科技大学 一种基于能量收集的超密无线网络中的自主能量管理方法
US20190102676A1 (en) * 2017-09-11 2019-04-04 Sas Institute Inc. Methods and systems for reinforcement learning
CN109982389A (zh) * 2019-03-05 2019-07-05 电子科技大学 一种基于多目标多臂赌博机在线学习的无线缓存方法
CN110020094A (zh) * 2017-07-14 2019-07-16 阿里巴巴集团控股有限公司 一种搜索结果的展示方法和相关装置
CN110189197A (zh) * 2019-05-22 2019-08-30 常熟理工学院 基于上下文多臂赌博机的电商个性化推荐方法
CN110958135A (zh) * 2019-11-05 2020-04-03 东华大学 一种特征自适应强化学习DDoS攻击消除方法及系统
CN111028080A (zh) * 2019-12-09 2020-04-17 北京理工大学 基于多臂老虎机和Shapley值的群智感知数据动态交易方法
CN111507885A (zh) * 2020-04-01 2020-08-07 中国科学院电子学研究所苏州研究院 一种基于最佳缓存空间计算的混合图元渲染方法及系统
CN111711931A (zh) * 2020-06-11 2020-09-25 西南科技大学 一种快速收敛的最优信道选择方法
CN111814079A (zh) * 2020-07-03 2020-10-23 福州大学 结合聚类与cmab的群智感知车联网用户筛选方法

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103686755A (zh) * 2013-12-26 2014-03-26 西南科技大学 一种认知无线电实现最优传输的在线学习方法
WO2015179373A1 (en) * 2014-05-19 2015-11-26 Baynote, Inc. System and method for context-aware recommendation through user activity change detection
CN104991966A (zh) * 2014-07-29 2015-10-21 Tcl集团股份有限公司 媒体内容排序方法及系统
US20170103413A1 (en) * 2015-10-08 2017-04-13 Samsung Sds America, Inc. Device, method, and computer readable medium of generating recommendations via ensemble multi-arm bandit with an lpboost
CN110020094A (zh) * 2017-07-14 2019-07-16 阿里巴巴集团控股有限公司 一种搜索结果的展示方法和相关装置
US20190102676A1 (en) * 2017-09-11 2019-04-04 Sas Institute Inc. Methods and systems for reinforcement learning
CN109039797A (zh) * 2018-06-11 2018-12-18 电子科技大学 基于强化学习的大流检测方法
CN109548055A (zh) * 2018-11-19 2019-03-29 西安电子科技大学 一种基于能量收集的超密无线网络中的自主能量管理方法
CN109982389A (zh) * 2019-03-05 2019-07-05 电子科技大学 一种基于多目标多臂赌博机在线学习的无线缓存方法
CN110189197A (zh) * 2019-05-22 2019-08-30 常熟理工学院 基于上下文多臂赌博机的电商个性化推荐方法
CN110958135A (zh) * 2019-11-05 2020-04-03 东华大学 一种特征自适应强化学习DDoS攻击消除方法及系统
CN111028080A (zh) * 2019-12-09 2020-04-17 北京理工大学 基于多臂老虎机和Shapley值的群智感知数据动态交易方法
CN111507885A (zh) * 2020-04-01 2020-08-07 中国科学院电子学研究所苏州研究院 一种基于最佳缓存空间计算的混合图元渲染方法及系统
CN111711931A (zh) * 2020-06-11 2020-09-25 西南科技大学 一种快速收敛的最优信道选择方法
CN111814079A (zh) * 2020-07-03 2020-10-23 福州大学 结合聚类与cmab的群智感知车联网用户筛选方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SAMARTH GUPTA ET AL.: "Correlated Multi-Armed Bandits with A Latent Random Source", 《ICASSP 2020 - 2020 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)》 *
唐伟康: "推荐系统中动态推荐算法研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *
王顺等: "针对具有稀疏性的流式大数据卸载方法", 《同济大学学报(自然科学版)》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112668721A (zh) * 2021-03-17 2021-04-16 中国科学院自动化研究所 通用的非平稳环境中去中心化多智能系统的决策方法
CN112668721B (zh) * 2021-03-17 2021-07-02 中国科学院自动化研究所 非平稳环境中去中心化多智能系统的决策方法
CN113282747A (zh) * 2021-04-28 2021-08-20 南京大学 一种基于自动机器学习算法选择的文本分类方法
CN113282747B (zh) * 2021-04-28 2023-07-18 南京大学 一种基于自动机器学习算法选择的文本分类方法
CN113721809A (zh) * 2021-09-08 2021-11-30 遨博(江苏)机器人有限公司 一种窗口展示方法及系统
CN113721809B (zh) * 2021-09-08 2023-07-04 遨博(江苏)机器人有限公司 一种窗口展示方法及系统
CN114756287A (zh) * 2022-06-14 2022-07-15 飞腾信息技术有限公司 一种重排序缓冲区的数据处理方法、装置及存储介质

Also Published As

Publication number Publication date
CN112256739B (zh) 2022-11-18

Similar Documents

Publication Publication Date Title
CN112256739B (zh) 一种基于多臂赌博机的动态流大数据中数据项筛选方法
Shen et al. An outranking sorting method for multi-criteria group decision making using intuitionistic fuzzy sets
WO2021135562A1 (zh) 特征有效性评估方法、装置、电子设备及存储介质
CN107392919B (zh) 基于自适应遗传算法的灰度阈值获取方法、图像分割方法
CN111104601B (zh) 一种对抗式多反馈层级成对个性化排名方法
CN111061959B (zh) 一种基于开发者特征的群智化软件任务推荐方法
CN113032367A (zh) 面向动态负载场景的大数据系统跨层配置参数协同调优方法和系统
CN111753215B (zh) 一种多目标推荐优化方法及可读介质
CN115115389A (zh) 一种基于价值细分和集成预测的快递客户流失预测方法
CN105743985A (zh) 一种基于模糊逻辑的虚拟服务迁移方法
CN112348571A (zh) 基于销售预测系统的组合模型销售预测方法
Zhang et al. Online decision trees with fairness
CN113836373A (zh) 一种基于密度聚类的投标信息处理方法、设备及存储介质
CN113591947A (zh) 基于用电行为的电力数据聚类方法、装置和存储介质
CN109919219B (zh) 一种基于粒计算ML-kNN的Xgboost多视角画像构建方法
CN108182288A (zh) 一种基于人工免疫的推荐方法
CN113205185A (zh) 网络模型优化方法、装置、计算机设备和存储介质
Liang et al. Incremental deep forest for multi-label data streams learning
CN113780334A (zh) 基于两阶段混合特征选择的高维数据分类方法
Li et al. Particle propagation model for dynamic node classification
Cabrerizo et al. An adaptive feedback mechanism for consensus reaching processes based on individuals’ credibility
Yang et al. Collaborative Filtering Recommendation Algorithm Based on AdaBoost-Naïve Bayesian Algorithm
Cao et al. Fuzzy genetic algorithms for pairs mining
CN108508149A (zh) 一种基于污染源溯源的药效提升空气检测系统
Liu et al. An enterprise operation management method based on mobile edge computing and data mining

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant