CN112256739A - 一种基于多臂赌博机的动态流大数据中数据项筛选方法 - Google Patents
一种基于多臂赌博机的动态流大数据中数据项筛选方法 Download PDFInfo
- Publication number
- CN112256739A CN112256739A CN202011263725.1A CN202011263725A CN112256739A CN 112256739 A CN112256739 A CN 112256739A CN 202011263725 A CN202011263725 A CN 202011263725A CN 112256739 A CN112256739 A CN 112256739A
- Authority
- CN
- China
- Prior art keywords
- buffer
- data items
- data
- arm
- gambling machine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 208000001613 Gambling Diseases 0.000 title claims abstract description 54
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000012216 screening Methods 0.000 title claims abstract description 23
- 239000000872 buffer Substances 0.000 claims description 84
- 238000012545 processing Methods 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000001186 cumulative effect Effects 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 5
- 230000001105 regulatory effect Effects 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 230000007423 decrease Effects 0.000 claims description 2
- 238000010187 selection method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000010924 continuous production Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24568—Data stream processing; Continuous queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/34—Betting or bookmaking, e.g. Internet betting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于多臂赌博机的动态流大数据中数据项筛选方法,包括步骤1:获取动态流大数据的数据项信息;步骤2:构建多臂赌博机模型;步骤3:判断当前时间窗口是否为最后一个时间窗口,若是,则执行步骤6,否则,执行步骤4;步骤4:在当前时间窗口内选取多臂赌博机模型的臂;步骤5:从步骤4选出的臂中选取数据项,并将其合并到数据项集合中,然后返回步骤3;步骤6:输出数据项集合。与现有技术相比,本发明具有筛选结果更加精确、适应性强等优点。
Description
技术领域
本发明涉及流大数据分析挖掘技术领域,尤其是涉及一种基于多臂赌博机的动态流大数据中数据项筛选方法。
背景技术
分析和挖掘流大数据中蕴藏的价值是大数据处理中的关键任务之一,由此可以提取知识、获得见解,继而帮助人们做出更好的决策。因此,实时处理这些动态产生的流大数据十分重要,其重要性甚至超过数据计算的精度。在这一类应用中,处理每一个数据项将获得一定的价值,每个数据项的价值各不相同,因此从源源不断的数据流中获取更多的价值是这类应用的主要目标。然而,在资源有限条件下,如何充分利用各种计算资源,并从流大数据中选择一批具有较高价值数据是一个重要问题。传统的选择方法难以解决没有先验知识条件下的流数据项选择问题,这为流数据项的选择带来了困难。
在流数据项选择中,现有区分数据“重要”与否的方法大体可以分为两类:有监督算法和无监督算法。有监督学习算法有SVM、贝叶斯网络、决策树归纳、神经网络等。这类算法必须要有已被分类标记的训练数据,这为算法的实施带来了诸多困难。无监督学习算法有K-means、近邻传播、基于密度的聚类、基于层次的聚类算法、核聚类、智能搜索聚类等。这类算法虽然不需要训练数据,但它们仍就只考虑数据本身的特性,在实际应用中,数据的价值高低还与处理数据的环境、业务相关,这就为实时、高效选择流数据项提出了新的挑战。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种筛选结果更加精确、适应性强的基于多臂赌博机的动态流大数据中数据项筛选方法。
本发明的目的可以通过以下技术方案来实现:
一种基于多臂赌博机的动态流大数据中数据项筛选方法,所述的数据项筛选方法包括以下步骤:
步骤1:获取动态流大数据的数据项信息;
步骤2:构建多臂赌博机模型;
步骤3:判断当前时间窗口是否为最后一个时间窗口,若是,则执行步骤6,否则,执行步骤4;
步骤4:在当前时间窗口内选取多臂赌博机模型的臂;
步骤5:从步骤4选出的臂中选取数据项,并将其合并到数据项集合中,然后返回步骤3;
步骤6:输出数据项集合。
优选地,所述的步骤2具体为:
设数据项共有M个类别,根据数据项模的大小,将数据项的模划分为M个区间,即[D1,D2),[D3,D4),…,[DM,DM+1],分别对应M个缓冲区buffer1,buffer2,…,bufferM,M个缓冲区作为多臂赌博机模型的M个臂arm1,arm2,…,armM构建多臂赌博机模型;
每个数据项到达时,首先计算数据项的模,根据模所在区间将其缓存至相应的缓存区内,完成多臂赌博机模型的构建。
优选地,所述的步骤4以UCB-greedy-Mix选择策略选取多臂赌博机模型的臂。
更加优选地,所述的步骤4具体为:
步骤4-1:设置探索概率εi的取值;
步骤4-2:在当前时间窗口Tk内,以概率εi进行多臂赌博机的探索,以概率1-εi进行多臂赌博机的利用;
步骤4-3:获取多臂赌博机进行探索或利用后的臂buffer。
更加优选地,所述的步骤4-1具体为:
定义探索概率εi序列,即
εi∈(0,1]i=1,2,…
其中,c和d为调节εi降低速度的常数参数。
更加优选地,所述步骤4-2中以概率εi进行多臂赌博机的探索具体为:
设Sk,j表示在时间窗口Tk内,从bufferj中被取走的数据的总个数,R(Tk,bufferj)表示在Tk时间窗口内,从bufferj中选择的所有数据项处理后的累计回报,即R(→Tk,bufferj)表示从bufferj中选择的所有数据的累计回报,表示单个数据项的回报;
在时间窗口Tk内,多臂赌博机进行探索时,将每个臂累计回报的置信上界R(→Tk,bufferj,UCB)作为选择的依据,即以概率εi选中bufferj=argjmaxR(→Tk,bufferj,UCB)。
更加优选地,所述步骤4-2中以概率1-εi进行多臂赌博机的利用具体为:
对于当前时间窗口Tp,设Op,j表示由时间窗口Tp的初始时刻到当前时刻已经从bufferj中取走的数据项个数,则上述时间段内的总回报为从bufferj选择取走的数据项的累计回报为R(→Tp,bufferj);
在当前时间窗口Tp内,以1-εi的概率选中bufferj=argjmaxR(→Tp,bufferj)。
更加优选地,所述的累计回报R(→Tp,bufferj)的计算方法为:
更加优选地,所述的数据项回报的计算方法为:
优选地,所述的步骤5具体为:在步骤4选出的臂中随机抽取该臂中的数据项,并将其合并到数据项集合。
与现有技术相比,本发明具有以下优点:
一、筛选结果更加精确:本发明中的数据项筛选方法通过构造多缓冲队列的多臂赌博机模型,并给出了考虑价值、处理时间、消耗资源、损失价值的综合回报计算方法,将多种因素纳入到多臂赌博机模型中,筛选出的数据项的价值也更高,结果也更为精确。
二、适应性强:本发明中的数据项筛选方法使用多臂赌博机模型来对动态流大数据的数据项进行筛选,该方法对动态流大数据的要求较低,算法的适用范围广,适应性强。
附图说明
图1为本发明中数据项筛选方法对的流程示意图;
图2为本发明中多臂赌博机模型的示意图;
图3为本发明中数据项选择流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
一种基于多臂赌博机的动态流大数据中数据项筛选方法,其流程如图1所示,包括:
步骤1:获取动态流大数据的数据项信息;
步骤2:构建多臂赌博机模型,多臂赌博机模型的结构如图2所示,构建过程具体为:
数据流可根据数据项的特征(例如类型、属性、模数等)不同,分成多个类别,且每个类别的数据项对应的价值分布往往不同,这为构造多臂赌博机模型提供了基础。将不同特征的数据项构成不同的队列,放置到不同的缓冲区buffer,从而构成赌博机的多条臂。根据多臂赌博机的原理,可以构造多个臂,即是创建多个存放数据项buffer,这是成功应用多臂赌博机技术的关键步骤。
设数据项共有M个类别,根据数据项模的大小,将数据项的模划分为M个区间,即[D1,D2),[D3,D4),…,[DM,DM+1],分别对应M个缓冲区buffer1,buffer2,…,bufferM,M个缓冲区作为多臂赌博机模型的M个臂arm1,arm2,…,armM构建多臂赌博机模型;
每个数据项到达时,首先计算数据项的模,根据模所在区间将其缓存至相应的缓存区内,完成多臂赌博机模型的构建;
步骤3:判断当前时间窗口是否为最后一个时间窗口,若是,则执行步骤6,否则,执行步骤4;
步骤4:在当前时间窗口内选取多臂赌博机模型的臂;
本专利以ε-Greedy算法为基础,结合UCB策略中的探索思想,提出了一种新的选择策略:UCB-greedy-Mix选择策略。与ε-Greedy类似,UCB-greedy-Mix选择策略也分为探索和利用两个阶段,其中探索阶段将每个臂回报的置信上界作为选择的依据。此外,该策略设置了一个参数εn作为探索概率,εn根据n的增长而递减,选择过程具体为:
步骤4-1:设置探索概率εi的取值;
定义探索概率εi序列,即
εi∈(0,1]i=1,2,…
其中,c和d为调节εi降低速度的常数参数,由用户输入。
步骤4-2:在当前时间窗口Tk内,以概率εi进行多臂赌博机的探索,以概率1-εi进行多臂赌博机的利用;
设Sk,j表示在时间窗口Tk内,从bufferj中被取走的数据的总个数,R(Tk,bufferj)表示在Tk时间窗口内,从bufferj中选择的所有数据项处理后的累计回报,即R(→Tk,bufferj)表示从bufferj中选择的所有数据的累计回报,表示单个数据项的回报;
在时间窗口Tk内,多臂赌博机进行探索时,将每个臂累计回报的置信上界R(→Tk,bufferj,UCB)作为选择的依据,即以概率εi选中bufferj=argjmaxR(→Tk,bufferj,UCB);
对于当前时间窗口Tp,设Op,j表示由时间窗口Tp的初始时刻到当前时刻已经从bufferj中取走的数据项个数,则上述时间段内的总回报为从bufferj选择取走的数据项的累计回报为R(→Tp,bufferj);
在当前时间窗口Tp内,以1-εi的概率选中bufferj=argjmaxR(→Tp,bufferj);
回报计算是多臂赌博机进行在线学习的关键之一。每次处理一个数据,都会获得相应的价值,消耗一定的资源,并花费一定的处理时间,这些反馈从不同角度对回报产生影响。在上述模型的基础上,给出一个数据项的综合回报的计算方法如下:
以微博社交网络为例,每一条微博数据的业务价值是关于转发量、点赞量、时间以及关注对象粉丝量的一个函数,即 表示计算在特定计算环境下需要消耗的CPU指令次数,表示计算的时间。由该实例可以得出本市首例中业务价值、硬件资源和时间资源的数据选取方法,由于在不同的应用环境下,选取具体数值的方法不唯一,所以需要根据实际情况选取对应的数据。
对流数据选择处理是一个持续的过程,所有被处理数据的累计回报最大化是进行数据选择的目标。每个buffer的回报分布不同,只有尽可能多地选择回报高的buffer才能获得最佳效果。为此,将每个buffer的累计回报作为多臂赌博机模型中进行下一次选择的依据。这里一个buffer的累计回报是指从第一个时间窗口的初始时刻开始,到当前时间窗口的当前时刻,该buffer上的回报值的累计之和。对于任意时间窗口Tk,当Tk为当前时间窗口时,从buffer中取数据的过程可能尚未完成;当Tk为之前的时间窗口时,由于Tk已结束,buffer已完成取数据和丢弃数据。因此,可以将累计回报分成两部分计算:
步骤4-3:获取多臂赌博机进行探索或利用后的臂buffer;
步骤5:从步骤4选出的臂中选取数据项,并将其合并到数据项集合中,然后返回步骤3,具体为:
在步骤4选出的臂中随机抽取该臂中任意数量的数据项,并将其合并到数据项集合。
步骤6:输出数据项集合。
本实施例中的数据项筛选方法提炼了影响数据项选择的四方面因素,包括业务价值、处理时间、消耗资源、损失价值。然后,将流大数据按照一定的规则分成多个缓存队列,作为臂构建了多臂赌博机模型,给出多臂赌博机考虑了业务价值、处理时间、消耗资源和损失的综合回报计算方式。先后给出了基于ε-greedy、UCB策略的流数据选择方法,并将两者结合提出了UCB-greedy-Mix数据选择策略,数据项筛选过程如图3所示。理论和实验对比表明,这种交互在线学习的数据项选择方法,能够更好地适应应用领域数据选择的实际情况。
本实施例进行数据项筛选的具体方法为:
将动态流大数据项选择分为两个阶段,分别是探索阶段和利用阶段。在探索阶段,每次选择置信上界R(→Tk,bufferj,UCB)最大的buffer;在利用阶段每次选择累计回报R(→Tp,bufferj)最大的buffer。
输入:流大数据S={d1,d2,...,dn...},buffer个数M,参数c和d,c>0,0<d<1;
输出:被选择的数据项集合D。
第2步:根据具体规则构造M个buffer:buffer1,buffer2,……bufferM;
第3步:在任意一个时间窗口Tk内,以概率εi选中bufferj=argjmaxR(→Tk,bufferj,UCB);以概率1-εi选中bufferj=argjmaxR(→Tp,bufferj);在选中的bufferj中,取出数据项放入输出数据集合,即以上操作对所有的时间窗口全部执行完成;
第4步:输出集合D=D1∪D2∪...∪Dp。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种基于多臂赌博机的动态流大数据中数据项筛选方法,其特征在于,所述的数据项筛选方法包括以下步骤:
步骤1:获取动态流大数据的数据项信息;
步骤2:构建多臂赌博机模型;
步骤3:判断当前时间窗口是否为最后一个时间窗口,若是,则执行步骤6,否则,执行步骤4;
步骤4:在当前时间窗口内选取多臂赌博机模型的臂;
步骤5:从步骤4选出的臂中选取数据项,并将其合并到数据项集合中,然后返回步骤3;
步骤6:输出数据项集合。
2.根据权利要求1所述的一种基于多臂赌博机的动态流大数据中数据项筛选方法,其特征在于,所述的步骤2具体为:
设数据项共有M个类别,根据数据项模的大小,将数据项的模划分为M个区间,即[D1,D2),[D3,D4),…,[DM,DM+1],分别对应M个缓冲区buffer1,buffer2,…,bufferM,M个缓冲区作为多臂赌博机模型的M个臂arm1,arm2,…,armM构建多臂赌博机模型;
每个数据项到达时,计算数据项的模,根据模所在区间将其缓存至相应的缓存区内,完成多臂赌博机模型的构建。
3.根据权利要求1所述的一种基于多臂赌博机的动态流大数据中数据项筛选方法,其特征在于,所述的步骤4以UCB-greedy-Mix选择策略选取多臂赌博机模型的臂。
4.根据权利要求3所述的一种基于多臂赌博机的动态流大数据中数据项筛选方法,其特征在于,所述的步骤4具体为:
步骤4-1:设置探索概率εi的取值;
步骤4-2:在当前时间窗口Tk内,以概率εi进行多臂赌博机的探索,以概率1-εi进行多臂赌博机的利用;
步骤4-3:获取多臂赌博机进行探索或利用后的臂buffer。
6.根据权利要求4所述的一种基于多臂赌博机的动态流大数据中数据项筛选方法,其特征在于,所述步骤4-2中以概率εi进行多臂赌博机的探索具体为:
设Sk,j表示在时间窗口Tk内,从bufferj中被取走的数据的总个数,R(Tk,bufferj)表示在Tk时间窗口内,从bufferj中选择的所有数据项处理后的累计回报,即R(→Tk,bufferj)表示从bufferj中选择的所有数据的累计回报,表示单个数据项的回报;
在时间窗口Tk内,多臂赌博机进行探索时,将每个臂累计回报的置信上界R(→Tk,bufferj,UCB)作为选择的依据,即以概率εi选中bufferj=argjmax R(→Tk,bufferj,UCB)。
10.根据权利要求1所述的一种基于多臂赌博机的动态流大数据中数据项筛选方法,其特征在于,所述的步骤5具体为:在步骤4选出的臂中随机抽取该臂中的数据项,并将其合并到数据项集合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011263725.1A CN112256739B (zh) | 2020-11-12 | 2020-11-12 | 一种基于多臂赌博机的动态流大数据中数据项筛选方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011263725.1A CN112256739B (zh) | 2020-11-12 | 2020-11-12 | 一种基于多臂赌博机的动态流大数据中数据项筛选方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112256739A true CN112256739A (zh) | 2021-01-22 |
CN112256739B CN112256739B (zh) | 2022-11-18 |
Family
ID=74265815
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011263725.1A Active CN112256739B (zh) | 2020-11-12 | 2020-11-12 | 一种基于多臂赌博机的动态流大数据中数据项筛选方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112256739B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112668721A (zh) * | 2021-03-17 | 2021-04-16 | 中国科学院自动化研究所 | 通用的非平稳环境中去中心化多智能系统的决策方法 |
CN113282747A (zh) * | 2021-04-28 | 2021-08-20 | 南京大学 | 一种基于自动机器学习算法选择的文本分类方法 |
CN113721809A (zh) * | 2021-09-08 | 2021-11-30 | 遨博(江苏)机器人有限公司 | 一种窗口展示方法及系统 |
CN114756287A (zh) * | 2022-06-14 | 2022-07-15 | 飞腾信息技术有限公司 | 一种重排序缓冲区的数据处理方法、装置及存储介质 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103686755A (zh) * | 2013-12-26 | 2014-03-26 | 西南科技大学 | 一种认知无线电实现最优传输的在线学习方法 |
CN104991966A (zh) * | 2014-07-29 | 2015-10-21 | Tcl集团股份有限公司 | 媒体内容排序方法及系统 |
WO2015179373A1 (en) * | 2014-05-19 | 2015-11-26 | Baynote, Inc. | System and method for context-aware recommendation through user activity change detection |
US20170103413A1 (en) * | 2015-10-08 | 2017-04-13 | Samsung Sds America, Inc. | Device, method, and computer readable medium of generating recommendations via ensemble multi-arm bandit with an lpboost |
CN109039797A (zh) * | 2018-06-11 | 2018-12-18 | 电子科技大学 | 基于强化学习的大流检测方法 |
CN109548055A (zh) * | 2018-11-19 | 2019-03-29 | 西安电子科技大学 | 一种基于能量收集的超密无线网络中的自主能量管理方法 |
US20190102676A1 (en) * | 2017-09-11 | 2019-04-04 | Sas Institute Inc. | Methods and systems for reinforcement learning |
CN109982389A (zh) * | 2019-03-05 | 2019-07-05 | 电子科技大学 | 一种基于多目标多臂赌博机在线学习的无线缓存方法 |
CN110020094A (zh) * | 2017-07-14 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 一种搜索结果的展示方法和相关装置 |
CN110189197A (zh) * | 2019-05-22 | 2019-08-30 | 常熟理工学院 | 基于上下文多臂赌博机的电商个性化推荐方法 |
CN110958135A (zh) * | 2019-11-05 | 2020-04-03 | 东华大学 | 一种特征自适应强化学习DDoS攻击消除方法及系统 |
CN111028080A (zh) * | 2019-12-09 | 2020-04-17 | 北京理工大学 | 基于多臂老虎机和Shapley值的群智感知数据动态交易方法 |
CN111507885A (zh) * | 2020-04-01 | 2020-08-07 | 中国科学院电子学研究所苏州研究院 | 一种基于最佳缓存空间计算的混合图元渲染方法及系统 |
CN111711931A (zh) * | 2020-06-11 | 2020-09-25 | 西南科技大学 | 一种快速收敛的最优信道选择方法 |
CN111814079A (zh) * | 2020-07-03 | 2020-10-23 | 福州大学 | 结合聚类与cmab的群智感知车联网用户筛选方法 |
-
2020
- 2020-11-12 CN CN202011263725.1A patent/CN112256739B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103686755A (zh) * | 2013-12-26 | 2014-03-26 | 西南科技大学 | 一种认知无线电实现最优传输的在线学习方法 |
WO2015179373A1 (en) * | 2014-05-19 | 2015-11-26 | Baynote, Inc. | System and method for context-aware recommendation through user activity change detection |
CN104991966A (zh) * | 2014-07-29 | 2015-10-21 | Tcl集团股份有限公司 | 媒体内容排序方法及系统 |
US20170103413A1 (en) * | 2015-10-08 | 2017-04-13 | Samsung Sds America, Inc. | Device, method, and computer readable medium of generating recommendations via ensemble multi-arm bandit with an lpboost |
CN110020094A (zh) * | 2017-07-14 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 一种搜索结果的展示方法和相关装置 |
US20190102676A1 (en) * | 2017-09-11 | 2019-04-04 | Sas Institute Inc. | Methods and systems for reinforcement learning |
CN109039797A (zh) * | 2018-06-11 | 2018-12-18 | 电子科技大学 | 基于强化学习的大流检测方法 |
CN109548055A (zh) * | 2018-11-19 | 2019-03-29 | 西安电子科技大学 | 一种基于能量收集的超密无线网络中的自主能量管理方法 |
CN109982389A (zh) * | 2019-03-05 | 2019-07-05 | 电子科技大学 | 一种基于多目标多臂赌博机在线学习的无线缓存方法 |
CN110189197A (zh) * | 2019-05-22 | 2019-08-30 | 常熟理工学院 | 基于上下文多臂赌博机的电商个性化推荐方法 |
CN110958135A (zh) * | 2019-11-05 | 2020-04-03 | 东华大学 | 一种特征自适应强化学习DDoS攻击消除方法及系统 |
CN111028080A (zh) * | 2019-12-09 | 2020-04-17 | 北京理工大学 | 基于多臂老虎机和Shapley值的群智感知数据动态交易方法 |
CN111507885A (zh) * | 2020-04-01 | 2020-08-07 | 中国科学院电子学研究所苏州研究院 | 一种基于最佳缓存空间计算的混合图元渲染方法及系统 |
CN111711931A (zh) * | 2020-06-11 | 2020-09-25 | 西南科技大学 | 一种快速收敛的最优信道选择方法 |
CN111814079A (zh) * | 2020-07-03 | 2020-10-23 | 福州大学 | 结合聚类与cmab的群智感知车联网用户筛选方法 |
Non-Patent Citations (3)
Title |
---|
SAMARTH GUPTA ET AL.: "Correlated Multi-Armed Bandits with A Latent Random Source", 《ICASSP 2020 - 2020 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)》 * |
唐伟康: "推荐系统中动态推荐算法研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
王顺等: "针对具有稀疏性的流式大数据卸载方法", 《同济大学学报(自然科学版)》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112668721A (zh) * | 2021-03-17 | 2021-04-16 | 中国科学院自动化研究所 | 通用的非平稳环境中去中心化多智能系统的决策方法 |
CN112668721B (zh) * | 2021-03-17 | 2021-07-02 | 中国科学院自动化研究所 | 非平稳环境中去中心化多智能系统的决策方法 |
CN113282747A (zh) * | 2021-04-28 | 2021-08-20 | 南京大学 | 一种基于自动机器学习算法选择的文本分类方法 |
CN113282747B (zh) * | 2021-04-28 | 2023-07-18 | 南京大学 | 一种基于自动机器学习算法选择的文本分类方法 |
CN113721809A (zh) * | 2021-09-08 | 2021-11-30 | 遨博(江苏)机器人有限公司 | 一种窗口展示方法及系统 |
CN113721809B (zh) * | 2021-09-08 | 2023-07-04 | 遨博(江苏)机器人有限公司 | 一种窗口展示方法及系统 |
CN114756287A (zh) * | 2022-06-14 | 2022-07-15 | 飞腾信息技术有限公司 | 一种重排序缓冲区的数据处理方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112256739B (zh) | 2022-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112256739B (zh) | 一种基于多臂赌博机的动态流大数据中数据项筛选方法 | |
Shen et al. | An outranking sorting method for multi-criteria group decision making using intuitionistic fuzzy sets | |
WO2021135562A1 (zh) | 特征有效性评估方法、装置、电子设备及存储介质 | |
CN107392919B (zh) | 基于自适应遗传算法的灰度阈值获取方法、图像分割方法 | |
CN111104601B (zh) | 一种对抗式多反馈层级成对个性化排名方法 | |
CN111061959B (zh) | 一种基于开发者特征的群智化软件任务推荐方法 | |
CN113032367A (zh) | 面向动态负载场景的大数据系统跨层配置参数协同调优方法和系统 | |
CN111753215B (zh) | 一种多目标推荐优化方法及可读介质 | |
CN115115389A (zh) | 一种基于价值细分和集成预测的快递客户流失预测方法 | |
CN105743985A (zh) | 一种基于模糊逻辑的虚拟服务迁移方法 | |
CN112348571A (zh) | 基于销售预测系统的组合模型销售预测方法 | |
Zhang et al. | Online decision trees with fairness | |
CN113836373A (zh) | 一种基于密度聚类的投标信息处理方法、设备及存储介质 | |
CN113591947A (zh) | 基于用电行为的电力数据聚类方法、装置和存储介质 | |
CN109919219B (zh) | 一种基于粒计算ML-kNN的Xgboost多视角画像构建方法 | |
CN108182288A (zh) | 一种基于人工免疫的推荐方法 | |
CN113205185A (zh) | 网络模型优化方法、装置、计算机设备和存储介质 | |
Liang et al. | Incremental deep forest for multi-label data streams learning | |
CN113780334A (zh) | 基于两阶段混合特征选择的高维数据分类方法 | |
Li et al. | Particle propagation model for dynamic node classification | |
Cabrerizo et al. | An adaptive feedback mechanism for consensus reaching processes based on individuals’ credibility | |
Yang et al. | Collaborative Filtering Recommendation Algorithm Based on AdaBoost-Naïve Bayesian Algorithm | |
Cao et al. | Fuzzy genetic algorithms for pairs mining | |
CN108508149A (zh) | 一种基于污染源溯源的药效提升空气检测系统 | |
Liu et al. | An enterprise operation management method based on mobile edge computing and data mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |