CN111967798A - 实验样本分配的方法及装置、设备及计算机可读存储介质 - Google Patents

实验样本分配的方法及装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN111967798A
CN111967798A CN202010928005.6A CN202010928005A CN111967798A CN 111967798 A CN111967798 A CN 111967798A CN 202010928005 A CN202010928005 A CN 202010928005A CN 111967798 A CN111967798 A CN 111967798A
Authority
CN
China
Prior art keywords
experiment
experimental
sample
group
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010928005.6A
Other languages
English (en)
Other versions
CN111967798B (zh
Inventor
刘经纬
谭领航
杨木祥
杨云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Du Xiaoman Technology Beijing Co Ltd
Original Assignee
Shanghai Youyang New Media Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Youyang New Media Information Technology Co ltd filed Critical Shanghai Youyang New Media Information Technology Co ltd
Priority to CN202010928005.6A priority Critical patent/CN111967798B/zh
Publication of CN111967798A publication Critical patent/CN111967798A/zh
Application granted granted Critical
Publication of CN111967798B publication Critical patent/CN111967798B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K17/00Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations

Abstract

本申请提供了实验样本分配的方法及装置、设备及计算机可读存储介质,为每个实验样本分配随机码,依据实验样本的随机码,以及预设分配规则,将实验样本分配至实验组中。因为随机码是随机分配的,且实验组的样本比例上限依据实验组包括的实验,以及实验组所在的实验层中的其它实验组包括的实验确定,所以不同的实验组的样本比例上限可以不同,所以根据随机码小于实验组预设的样本比例上限的规定,可实现将不同的实验样本分配到不同的实验组中,另外,根据实验组已分配得到的实验样本的比例小于实验组的样本比例上限,可避免单个实验组分配得到的实验样本的数量大于实验组实际所需的数量。所以,申请提供的技术方案,可以提高实验样本的使用效率。

Description

实验样本分配的方法及装置、设备及计算机可读存储介质
技术领域
本申请涉及数据处理领域,尤其涉及一种实验样本分配的方法及装置、设备及计算机可读存储介质。
背景技术
在金融行业中,一个公司往往有多个不同的金融部门,这些金融部门都使用各自开发的实验系统做金融实验,金融实验可以理解为采用数据处理策略处理用户数据,以得到针对该用户数据的实验结果。
现有技术中,对于多个实验,通常是先把全部的实验样本分配至其中的一个实验,实验完成后,释放实验样本,再将实验样本分配至第下一个实验,直到完成所有的实验。由于将全部的实验样本分配至一个实验组,其中往往有一部分的实验样本并没有被利用,而且实验样本被分配至实验后,实验占用样本时间长,所以要完成所有的实验需要花费很长的时间,所以如何提高实验样本的使用效率成为了亟待解决的问题。
发明内容
为了实现上述目的,本申请提供了以下技术方案:
一种实验样本分配的方法,包括:
为每个实验样本分配随机码;
依据所述实验样本的所述随机码,以及预设分配规则,将所述实验样本分配至实验组中,所述分配规则至少包括满足第一预设条件,所述第一预设条件至少包括所述随机码小于所述实验组预设的样本比例上限、以及所述实验组已分配得到的实验样本的比例小于所述实验组的所述样本比例上限,所述实验组的所述样本比例上限依据所述实验组包括的实验,以及所述实验组所在的实验层中的其它实验组包括的实验确定。
上述的方法,可选的,所述第一预设条件,还包括:所述实验组不配置隔离对象,或配置的所述隔离对象不包括所述实验样本历史被分配至的实验。
上述的方法,可选的,所述依据所述实验样本的所述随机码,以及预设分配规则,将所述实验样本分配至实验组中,包括:
确定所述实验组所在的实验层为互斥实验层、所述互斥实验层中存在第一目标实验组,且所述第一目标实验组满足所述第一预设条件,则将所述实验样本分配至所述第一目标实验组;
确定所述实验组所在的实验层为所述互斥实验层,且所述互斥实验层中不存在第一目标实验组,则将所述实验样本分配至第二目标实验组中,所述第二目标实验组为所述互斥实验层中,满足所述第一预设条件且,优先级最高的实验组;
所述第一目标实验组为,在所述互斥实验层所有预先配置联合对象的实验组中,所述第一目标实验组的目标联合对象的数量最多,或在所述目标联合对象的数量相同的情况下,优先级最高的所述实验组;所述目标联合对象为所述实验组预先配置的联合对象中,与所述实验样本历史被分配至的实验相同的对象;任意一个所述实验组的所述联合对象为所述实验组预设的联合的实验。
上述的方法,可选的,所述依据所述实验样本的所述随机码,以及预设的分配规则,将所述实验样本分配至实验组中,包括:
确定所述实验组所在的实验层为正交实验层、所述正交实验层中存在第三目标实验组,且所述第三目标实验组满足所述第一预设条件,则将所述实验样本分配至所述第三目标实验组中;所述第三目标实验组为:预先配置的联合对象中包括所述实验样本历史被分配至的实验;
确定所述实验组所在的实验层为所述正交实验层,且所述正交实验层不存在所述第三目标实验组,则将所述实验样本分配至第四目标实验组,所述第四目标实验组为满足所述第一预设条件的实验组。
上述的方法,可选的,所述将所述实验样本分配至所述第三目标实验组之后,还包括,将所述实验样本分配至预设的与所述第三目标实验组正交,且满足所述第一预设条件的实验组;
所述将所述实验样本分配至所述第三目标实验组之后,还包括,将所述实验样本分配至预设的与所述第四目标实验组正交,且满足所述第一预设条件的实验组;任意两个相互正交的实验组为预设的不存在关联关系的实验组。
上述的方法,可选的,所述将所述实验样本分配至所述实验层的实验组中,包括:
将所述实验样本分配至所述实验组的目标实验分支中;所述目标实验分支为所述实验组包括的所有实验分支中,权重最大的所述实验分支;所述实验分支的所述权重依据所述实验分支已分配得到的实验样本比例与所述实验分支预设的样本比例上限的差值确定。
上述的方法,可选的,为所述实验样分配所述随机码之前,还包括:
依据所述实验样本预设的身份标识码,确定所述实验样本历史被分配至的实验分支;
确定所述实验组中存在所述实验样本历史被分配至的所述实验分支,且所述实验组的所述实验分支已分配得到的实验样本比例小于所述实验分支预设的样本比例上限后,将所述实验样本分配至所述实验组的所述实验分支中。
一种实验样本分配装置,包括:
第一分配单元,用于为每个实验样本分配随机码;
第二分配单元,用于依据所述实验样本的所述随机码,以及预设分配规则,将所述实验样本分配至实验组中,所述分配规则至少包括满足第一预设条件,所述第一预设条件至少包括所述随机码小于所述实验组预设的样本比例上限、以及所述实验组已分配得到的实验样本的比例小于所述实验组的所述样本比例上限,所述实验组的所述样本比例上限依据所述实验组包括的实验,以及所述实验组所在的实验层中的其它实验组包括的实验确定。
一种电子设备,包括:处理器和存储器,所述存储器用于存储程序;所述处理器用于运行所述程序,以实现上述的实验样本分配的方法。
一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的实验样本分配的方法。
本申请提供的技术方案,因为实验样本的随机码是随机分配的,且实验组的样本比例上限依据实验组包括的实验,以及实验组所在的实验层中的其它实验组包括的实验确定,所以不同的实验组的样本比例上限可以不同,所以根据第一预设条件中,随机码小于实验组预设的样本比例上限的规定,可以实现将不同的实验样本分配到不同的实验组中,另外,第一预设条件中,规定实验组已分配得到的实验样本的比例小于实验组的样本比例上限,所以,可以限定单个实验组分配得到的实验样本的数量,可以避免单个实验组分配得到的实验样本的数量大于实验组实际所需的数量,而导致部分实验样本并没有被利用的问题。综上,本申请提供的技术方案,可以实现将实验样本分配至不同的实验组,且每个实验组的不存在实验样本过量的问题,所以,可以提高实验样本的使用效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种实验样本分配的方法的流程图;
图2为本申请实施例提供的又一种实验样本分配的方法的流程图;
图3为本申请实施例提供的又一种实验样本分配的方法的流程图;
图4为本申请实施例提供的又一种实验样本分配的方法的流程图;
图5为本申请实施例提供的实验样本分配的装置的结构示意图;
图6为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请所述的实验样本分配的方法的执行主体为与多个不同信贷部门交易系统连接的实验平台,实验平台可以用于运行多个实验层,实验层可以是互斥实验层,也可以是正交实验层,任意一个实验层包括至少一个实验组,一个实验组包括至少一个实验分支,一个实验组的多个实验分支为实验组的多个对照组,每个实验分支中包括一个数据处理策略,例如,数据处理策略可以用于根据用户数据(例如用户的个人财产、性别、以及教育水平等数据)计算用户授信度,用户授信度是金融行业中,用户的信用等级。
图1为本申请实施例提供的一种实验样本分配的方法,可以包括以下步骤:
S101、获取用户的身份标识码。
实验平台可以通过用户在使用信贷部门交易系统的情况下,获取用户的身份标识码。用户的身份标识码可以是用户在注册时,信贷交易系统为其分配的号码序列,也可以是用户的身份号码或登记的手机号码等,只要能对用户起到唯一标识作用即可。
S102、对用户的身份标识码进行100取模计算,在余数不小于5的情况下,将该用户的用户数据作为实验样本。
本实施例中,若余数小于5,则将该用户的用户数据作为非实验样本,若余数不小于5,则将该用户的用户数据作为实验样本。非实验样本为,不对其进行数据处理的样本。实验样本为,待分配至实验分支的样本。
需要说明的是,对用户的身份标识码进行100取模,仅仅是示例,也可以采用其他的数值进行取模计算。
S103、将实验平台中与用户的身份标识码预先配置对应的实验层作为第一个目标实验层。
与用户的身份标识码预先配置对应的实验层为单个实验层。
S104、查询在目标实验层中,是否存在实验样本的目标实验分支,如果是,执行S105,如果否,执行S106。
任意一个实验样本的目标实验分支为,包括在目标实验层的实验组中,历史记录的实验样本被分配至的实验分支,因为实验样本被分配至任意一个实验分支后,都记录该实验样本的身份标识码,所以可以依据历史记录结果,确定目标实验层中是否存在目标实验分支。
S105、在目标实验分支当前的流量比例小于预设的流量比例上限的情况下,将实验样本分配至目标实验分支中。
S106、为实验样本分配一个在1%~100%范围内的随机码。
S107、判断目标实验层是互斥实验层还是正交实验层,如果是互斥实验层,则执行S108,如果是正交实验层,则执行S113。
本实施例中,实验层分为互斥实验层和正交实验层,任意一个实验层为互斥实验层或正交实验层是预先设定的。
互斥实验层中的每个实验组为相互独立的实验组,实验样本只能被分配至其中的一个实验组,实验样本一旦被分配至其中的一个实验组后,则不会再被分配至其他的实验组。正交实验层则相反,在正交实验层中,相互正交的多个不同的实验组可以被分配到同一个实验样本,也就是说,在正交实验层中,实验样本可以同时被分配至不同的实验组中。
S108、判断互斥实验层是否存在满足第一预设条件的第一目标实验组,如果存在,则执行S109,如果不存在则执行S110。
第一预设条件为实验样本的随机码小于实验组预设的样本比例上限、以及实验组已分配得到的实验样本的比例小于实验组的样本比例上限,且实验组不配置隔离对象,或配置的隔离对象不包括实验样本历史被分配至的实验。
在互斥实验层中,第一目标实验组的数量仅为一个。
第一目标实验组为,在互斥实验层预先配置联合对象的实验组中,目标联合对象的数量最多,或在目标联合对象的数量相同的情况下,优先级最高的实验组。其中,目标联合对象为第一目标实验组预先配置的联合对象中,与实验样本历史被分配至实验组相同的对象。
第一目标实验组为,在互斥实验层所有预先配置联合对象的实验组中,第一目标实验组的目标联合对象的数量最多,或在目标联合对象的数量相同的情况下,优先级最高的实验组。目标联合对象为实验组预先配置的联合对象中,与实验样本历史被分配至实验相同的对象;任意一个实验组的联合对象为实验组预设的联合的实验。
例如,实验样本历史被分配至的实验分支对应的实验组为,实验A和实验B,互斥实验层中实验组C预先配置的联合对象为实验A,实验组D预先配置的联合对象为实验A和实验B,则将实验组D作为第一目标实验组。
或,互斥实验层中实验组C预先配置的联合对象为实验A,实验组D预先配置的联合对象为实验B,但实验组D的优先级大于实验组C,则将实验组D作为第一目标实验组。
S109、将实验样本分配至第一目标实验组的实验分支中。
本实施例中,在该实验组中含有多个实验分支的情况下,则从该多个实验分支中选取权重最大实验分支,并将实验样本分配至权重最大的实验分支中。
实验分支的权重,由实验分支已分配得到的实验样本比例与实验分支预设的样本比例上限的差值确定,权重最大的实验分支为,差值最小的实验分支。例如,实验分支A1的当前流量比例为8%,其目标流量为10%,实验分支A2的当前流量比例为10%,其目标流量为20%,则将实验样本分配至实验分支A1。
S110、判断互斥实验层是否存在第二目标实验组,如果存在,则执行S111,如果不存在,则执行S112。
S111、将实验样本分配至第二目标实验组的实验分支中。
第二目标实验组为,满足第一预设条件中,优先级最高的实验组。也就是说,在实验层中所有的实验组都不配置联合对象,或配置的联合对象不是实验样本历史被分配至的实验的情况下,第二实验组该实验层包括的所有实验组中满足第一预设条件,且优先级最高的实验组。
本实施例中,任意两个相互隔离的对象,为预设的相互独立的对象。
S112、将实验样本分配至互斥实验层预设的非实验组中,并执行S118。
S113、判断正交实验层是否存在满足第一预设条件的第三目标实验组,如果存在,则执行S114,如果不存在则执行S115。
需要说明的是第三目标实验组的数量可以是一个,也可以是多个。
第三目标实验组为,实验样本历史被分配至的实验分支对应的实验组中,至少有一个为第三目标实验组预先配置的联合对象。
本实施例中,任意两个相互联合的对象,为预设的优先使用相同实验样本的实验。
S114、将实验样本分配至第三目标实验组的目标实验分支,以及预设的与第三目标实验组正交且满足第一预设条件的实验组的目标实验分支中。
在正交实验层中,任意一个实验组都可以预先配置正交实验组。配置的正交实验组的数量不限。任意两个相互正交的实验组为预设的不存在关联关系的实验组。
S115、判断正交实验层是否存在第四目标实验组,如果存在,则执行S116,如果不存在,则执行S117。
S116、将实验样本分配至第四目标实验组的目标实验分支,以及预设的与第四目标实验组正交且满足第一预设条件的实验组的目标实验分支中。
第四目标实验组为满足第一预设条件的实验组。
S117、将实验样本分配至正交实验层预设的非实验组中,并执行S118。
每个实验层中,可以预先配置非实验组,实验层的其他实验组无法满足第一预设条件的下,将实验样本分配至非实验组。
S118、判断是否存在未进行实验样本分配操作的实验层,如果是,则执行S119,如果否,则执行S120。
S119、选择一个未进行实验样本分配操作的实验层作为目标实验层,并返回执行S104。
在未进行实验样本分配操作的实验层为多个的情况下,可随机的选择其中的一个实验层作为目标实验层。
S120、读取并记载每个实验分支的分配到的实验样本的结果。
可以每隔预设的时长,读取并记载每个实验组的实验分支的分配到的实验样本的结果。
本申请提供的方法,具有以下有益效果:
针对每一个实验样本,将实验样本分配至满足条件的目标实验组中,因为实验样本的随机码是随机分配的,且,随机码为分配的依据之一,所以实验样本分配至目标实验组也是随机的,所以在实验样本数量较大的情况下,针对每一个实验样本,能够使各个相互独立的实验同时竞争分配实验样本,不需要等到实验样本被释放后,才可以分配得到实验样本,从而提高实验样本的利用率。
进一步的,在正交实验层中,同一个实验样本可以同时被分配至多个相互正交的实验组,从而可以提高了实验样本的利用率。
进一步的,互斥实验层中,同一个实验样本只能被分配至其中的一个实验组,可以确保互斥实验层的各个相互独立的实验组分到的实验样本与其他实验组的实验样本不同。同时,实验样本不能被分配至预先配置的隔离对象为实验样本历史被分配至的实验分支或实验组,因为任意两个相互隔离的对象为预设的相互独立的对象,所以,针对同一个实验样本,该实验样本被分配到的所有实验组或实验分支都不是相互独立的。可以有效的防止,相互独立的多个实验组对同一个样本进行实验的情况下,导致实验结果不准确的问题。
进一步的,目标实验组预先设置的联合对象为实验样本历史分配至的实验组的情况下,优先将实验样本分配至目标实验组,使联合对象可以优先分配到合适的实验样本。
上述实施例提供的方法,也可以按照各个实验层序号的顺序,依次将实验样本分配至各个实验层的满足条件的实验组的实验分支中,其中实验层序号为各个实验层身份标识,各个实验层序号是连续的号码。
考虑到实验平台包括的实验层都是互斥实验层的情况,为此,本申请实施例提出了又一种实验样本分配的方法,本实施例中的涉及到与上述实施例相同的实施步骤,可参考上述实施例,如图2的流程图所示,本实施例提供的方法可以包括以下步骤:
S201、获取预设的待分配的实验样本。
S202、随机选取一个实验层作为目标实验层。
在实验平台包括多个实验层的情况下,可以随机选择一个实验层作为目标实验层。
S203、为实验样本分配随机码。
S204、判断目标实验层中是否存在满足第一预设条件的第一目标实验组,如果存在,执行S205,如果不存在,则执行S206。
S205、将实验样本分配至第一目标实验组的目标实验分支中。
S206、判断目标实验层中是否存在第二目标实验组,如果存在,则执行S207,如果不存在,则执行S208。
S207、将实验样本分配至第二目标实验组的目标实验分支中。
S208、将实验样本分配至实验层预设的非实验组;
S209、判断是否存在未进行实验样本分配操作的实验层,如果是,则执行S210,如果否,则执行S211。
S210、选择一个未进行实验样本分配操作的实验层作为目标实验层,并返回执行S204。
S211、读取并记载每个实验分支的分配到的实验样本的结果。
本实施例提供的方法,在实验平台包括的实验层为互斥实验层的情况下,针对每一个实验样本,将实验样本分配至满足条件的目标实验组中,因为实验样本的随机码是随机分配的,且,随机码为分配的依据之一,所以实验样本分配至目标实验组也是随机的,所以在实验样本数量较大的情况下,针对每一个实验样本,能够使各个相互独立的实验同时竞争分配实验样本,不需要等到实验样本被释放后,才可以分配得到实验样本,从而提高实验样本的利用率。
并且,互斥实验层中,同一个实验样本只能被分配至其中的一个实验组,可以确保互斥实验层的各个相互独立的实验组分到的实验样本与其他实验组的实验样本不同。同时,实验样本不能被分配至预先配置的隔离对象为实验样本历史被分配至的实验分支或实验组,因为任意两个相互隔离的对象为预设的相互独立的对象,所以,针对同一个实验样本,该实验样本被分配到的所有实验组或实验分支都不是相互独立的。可以有效的防止,相互独立的多个实验组对同一个样本进行实验的情况下,导致实验结果不准确的问题。
考虑到实验平台包括的实验层都是正交实验层的情况,为此,本申请实施例提出了又一种实验样本分配的方法,实施例中的涉及到与上述实施例相同的实施步骤,可参考上述实施例,如图3的流程图所示,本实施例提供的方法可以包括以下步骤:
S301、获取预设的待分配的实验样本。
S302、随机选取一个实验层作为目标实验层。
S303、为实验样本分配随机码。
S304、判断目标实验层中是否存在满足第一预设条件的第三目标实验组,如果存在,执行S305,如果不存在,则执行S306。
S305、将实验样本分配至第三目标实验组的目标实验分支,以及预设的与第三目标实验组正交且满足第一预设条件的实验组的目标实验分支中。
S306、判断目标实验层中是否存在第四目标实验组,如果存在,则执行S307,如果不存在,则执行S308。
S307、将实验样本分配至第四目标实验组的目标实验分支,以及预设的与第四目标实验组正交且满足第一预设条件的实验组的目标实验分支中。
S308、将实验样本分配至实验层预设的非实验组。
S309、判断是否存在未进行实验样本分配操作的实验层,如果是,则执行S310,如果否,则执行S311。
S310、选择一个未进行实验样本分配操作的实验层作为目标实验层,并返回执行S304。
S311、读取并记载每个实验分支的分配到的实验样本的结果。
本实施例提供的方法,在实验平台包括的实验层为正交实验层的情况下,针对每一个实验样本,将实验样本分配至满足条件的目标实验组中,因为实验样本的随机码是随机分配的,且,随机码为分配的依据之一,所以实验样本分配至目标实验组也是随机的,所以在实验样本数量较大的情况下,针对每一个实验样本,能够使各个相互独立的实验同时竞争分配实验样本,不需要等到实验样本被释放后,才可以分配得到实验样本,从而提高实验样本的利用率。
并且,在正交实验层中,同一个实验样本可以同时被分配至多个相互正交的实验组,从而可以提高了实验样本的利用率。
当然,实验平台中也可以同时包括的互斥实验层和正交实验层,对于实验层包括互斥实验层和正交实验层的实验样本分配方式如图1的流程所示。
需要说明的是,上述所有的实施例提供的方法为,针对每个实验样本,都执行上述的实施例所述的方法流程,使实验样本可以被分配至目标实验分支中。
上述实施例提供的实验样本分配的方法的流程,可以概括为图4所示的流程,图4为本申请实施例提供的一种实验样本分配的方法,可以包括以下步骤:
S401、为每个实验样本分配随机码。
本实施例中,随机码为1%-100%之间的任意数值。
S402、针对每个实验样本,依据所述实验样本的随机码,将实验样本分配至满足第一预设条件的实验组中。
本实施例中,第一预设条件至少包括随机码小于实验组预设的样本比例上限、以及实验组已分配得到的实验样本的比例小于实验组的样本比例上限。
其中,实验组的所述样本比例上限依据所述实验组包括的实验,以及所述实验组所在的实验层中的其它实验组包括的实验确定。具体的,确定实验组的样本比例上限的过程为:确定实验层的每个实验组中所包括的实验总数量,以及各个实验预设的重要指数,其中,任意一个实验的重要指数依据实验的内容设定。依据实验总数量和各个实验的重要指数,计算得到实验组的权重,具体的计算方式可以自行设定。按照实验组的权重与实验层中其他实验组的权重之间的比值关系,确定实验组的样本比例上限,例如,实验组A、实验组B,以及实验组C之间的权重比值关系为1:2:2,则实验组A、实验组B,以及实验组C之间样本比例上限分别为20%、40%、和40%。
本实施例提供的方法,因为实验样本的随机码是随机分配的,且实验组的样本比例上限依据实验组包括的实验,以及实验组所在的实验层中的其它实验组包括的实验确定,所以不同的实验组的样本比例上限可以不同,所以根据第一预设条件中,随机码小于实验组预设的样本比例上限的规定,可以实现将不同的实验样本分配到不同的实验组中,另外,第一预设条件中,规定实验组已分配得到的实验样本的比例小于实验组的样本比例上限,所以,可以限定单个实验组分配得到的实验样本的数量,可以避免单个实验组分配得到的实验样本的数量大于实验组实际所需的数量,而导致部分实验样本并没有被利用的问题。综上,本申请提供的技术方案,可以实现将实验样本分配至不同的实验组,且每个实验组的不存在实验样本过量的问题,所以,可以提高实验样本的使用效率。
图5为本申请实施例还提供一种实验样本分配分配的装置500的结构示意图,包括:
第一分配单元501,用于为每个实验样本分配随机码;
第二分配单元502,用于依据实验样本的随机码,以及预设分配规则,将实验样本分配至实验组中,分配规则至少包括满足第一预设条件,第一预设条件至少包括随机码小于实验组预设的样本比例上限、以及实验组已分配得到的实验样本的比例小于实验组的所述样本比例上限,实验组的所述样本比例上限依据实验组包括的实验,以及实验组所在的实验层中的其它实验组包括的实验确定。
可选的,第一预设条件,还包括:实验组不配置隔离对象,或配置的隔离对象不包括实验样本历史被分配至的实验。
可选的,第二分配单元502依据实验样本的所述随机码,以及预设分配规则,将实验样本分配至实验组中的具体实现方式为:
确定实验组所在的实验层为互斥实验层、互斥实验层中存在第一目标实验组,且第一目标实验组满足所述第一预设条件,则将实验样本分配至所述第一目标实验组;
确定实验组所在的实验层为互斥实验层,且互斥实验层中不存在第一目标实验组,则将实验样本分配至第二目标实验组中,第二目标实验组为互斥实验层中,满足第一预设条件且,优先级最高的实验组;
第一目标实验组为,在互斥实验层所有预先配置联合对象的实验组中,第一目标实验组的目标联合对象的数量最多,或在目标联合对象的数量相同的情况下,优先级最高的实验组;目标联合对象为实验组预先配置的联合对象中,与实验样本历史被分配至的实验相同的对象;任意一个实验组的所述联合对象为所述实验组预设的联合的实验。
可选的,第二分配单元502依据实验样本的所述随机码,以及预设分配规则,将实验样本分配至实验组中的具体实现方式为:
确定实验组所在的实验层为正交实验层、正交实验层中存在第三目标实验组,且第三目标实验组满足第一预设条件,则将实验样本分配至所述第三目标实验组中;第三目标实验组为:预先配置的联合对象中包括实验样本历史被分配至的实验;
确定实验组所在的实验层为正交实验层,且正交实验层不存在第三目标实验组,则将实验样本分配至第四目标实验组,第四目标实验组为满足所述第一预设条件的实验组。
可选的,第二分配单元502,还用于将实验样本分配至预设的与所述第三目标实验组正交,且满足第一预设条件的实验组,以及将实验样本分配至预设的与所述第四目标实验组正交,且满足第一预设条件的实验组;任意两个相互正交的实验组为预设的不存在关联关系的实验组。
其中,第二分配单元502将实验样本分配至实验层的实验组中的具体实现方式为:将实验样本分配至实验组的目标实验分支中;目标实验分支为实验组包括的所有实验分支中,权重最大的实验分支;实验分支的权重依据实验分支已分配得到的实验样本比例与实验分支预设的样本比例上限的差值确定。
可选的,第一分配单元501,还用于,依据实验样本预设的身份标识码,确定实验样本历史被分配至的实验分支;
确定实验组中存在所述实验样本历史被分配至的实验分支,且实验组的所述实验分支已分配得到的实验样本比例小于实验分支预设的样本比例上限后,将所述实验样本分配至所述实验组的所述实验分支中。
本申请提供的装置,因为实验样本的随机码是随机分配的,且实验组的样本比例上限依据实验组包括的实验,以及实验组所在的实验层中的其它实验组包括的实验确定,所以不同的实验组的样本比例上限可以不同,所以根据第一预设条件中,随机码小于实验组预设的样本比例上限的规定,可以实现将不同的实验样本分配到不同的实验组中,另外,第一预设条件中,规定实验组已分配得到的实验样本的比例小于实验组的样本比例上限,所以,可以限定单个实验组分配得到的实验样本的数量,可以避免单个实验组分配得到的实验样本的数量大于实验组实际所需的数量,而导致部分实验样本并没有被利用的问题。综上,本申请提供的技术方案,可以实现将实验样本分配至不同的实验组,且每个实验组的不存在实验样本过量的问题,所以,可以提高实验样本的使用效率。
本申请还提供了一种电子设备600,其结构示意图如图6所示,包括:处理器601和存储器602,存储器602于存储应用程序,处理器601用于执行应用程序,以实现本申请的实验样本分配的方法,即执行以下步骤:
为每个实验样本分配随机码;
依据所述实验样本的所述随机码,以及预设分配规则,将所述实验样本分配至实验组中,所述分配规则至少包括满足第一预设条件,所述第一预设条件至少包括所述随机码小于所述实验组预设的样本比例上限、以及所述实验组已分配得到的实验样本的比例小于所述实验组的所述样本比例上限,所述实验组的所述样本比例上限依据所述实验组包括的实验,以及所述实验组所在的实验层中的其它实验组包括的实验确定。
本申请还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执本申请实验样本分配的方法,即执行以下步骤:
为每个实验样本分配随机码;
依据所述实验样本的所述随机码,以及预设分配规则,将所述实验样本分配至实验组中,所述分配规则至少包括满足第一预设条件,所述第一预设条件至少包括所述随机码小于所述实验组预设的样本比例上限、以及所述实验组已分配得到的实验样本的比例小于所述实验组的所述样本比例上限,所述实验组的所述样本比例上限依据所述实验组包括的实验,以及所述实验组所在的实验层中的其它实验组包括的实验确定。
本申请实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种实验样本分配的方法,其特征在于,包括:
为每个实验样本分配随机码;
依据所述实验样本的所述随机码,以及预设分配规则,将所述实验样本分配至实验组中,所述分配规则至少包括满足第一预设条件,所述第一预设条件至少包括所述随机码小于所述实验组预设的样本比例上限、以及所述实验组已分配得到的实验样本的比例小于所述实验组的所述样本比例上限,所述实验组的所述样本比例上限依据所述实验组包括的实验,以及所述实验组所在的实验层中的其它实验组包括的实验确定。
2.根据权利要求1所述的方法,其特征在于,所述第一预设条件,还包括:所述实验组不配置隔离对象,或配置的所述隔离对象不包括所述实验样本历史被分配至的实验。
3.根据权利要求2所述的方法,其特征在于,所述依据所述实验样本的所述随机码,以及预设分配规则,将所述实验样本分配至实验组中,包括:
确定所述实验组所在的实验层为互斥实验层、所述互斥实验层中存在第一目标实验组,且所述第一目标实验组满足所述第一预设条件,则将所述实验样本分配至所述第一目标实验组;
确定所述实验组所在的实验层为所述互斥实验层,且所述互斥实验层中不存在第一目标实验组,则将所述实验样本分配至第二目标实验组中,所述第二目标实验组为所述互斥实验层中,满足所述第一预设条件且,优先级最高的实验组;
所述第一目标实验组为,在所述互斥实验层所有预先配置联合对象的实验组中,所述第一目标实验组的目标联合对象的数量最多,或在所述目标联合对象的数量相同的情况下,优先级最高的所述实验组;所述目标联合对象为所述实验组预先配置的联合对象中,与所述实验样本历史被分配至的实验相同的对象;任意一个所述实验组的所述联合对象为所述实验组预设的联合的实验。
4.根据权利要求2所述的方法,其特征在于,所述依据所述实验样本的所述随机码,以及预设的分配规则,将所述实验样本分配至实验组中,包括:
确定所述实验组所在的实验层为正交实验层、所述正交实验层中存在第三目标实验组,且所述第三目标实验组满足所述第一预设条件,则将所述实验样本分配至所述第三目标实验组中;所述第三目标实验组为:预先配置的联合对象中包括所述实验样本历史被分配至的实验;
确定所述实验组所在的实验层为所述正交实验层,且所述正交实验层不存在所述第三目标实验组,则将所述实验样本分配至第四目标实验组,所述第四目标实验组为满足所述第一预设条件的实验组。
5.根据权利要求4所述的方法,其特征在于,所述将所述实验样本分配至所述第三目标实验组之后,还包括,将所述实验样本分配至预设的与所述第三目标实验组正交,且满足所述第一预设条件的实验组;
所述将所述实验样本分配至所述第三目标实验组之后,还包括,将所述实验样本分配至预设的与所述第四目标实验组正交,且满足所述第一预设条件的实验组;任意两个相互正交的实验组为预设的不存在关联关系的实验组。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述将所述实验样本分配至所述实验层的实验组中,包括:
将所述实验样本分配至所述实验组的目标实验分支中;所述目标实验分支为所述实验组包括的所有实验分支中,权重最大的所述实验分支;所述实验分支的所述权重依据所述实验分支已分配得到的实验样本比例与所述实验分支预设的样本比例上限的差值确定。
7.根据权利要求1所述的方法,其特征在于,为所述实验样分配所述随机码之前,还包括:
依据所述实验样本预设的身份标识码,确定所述实验样本历史被分配至的实验分支;
确定所述实验组中存在所述实验样本历史被分配至的所述实验分支,且所述实验组的所述实验分支已分配得到的实验样本比例小于所述实验分支预设的样本比例上限后,将所述实验样本分配至所述实验组的所述实验分支中。
8.一种实验样本分配的装置,其特征在于,包括:
第一分配单元,用于为每个实验样本分配随机码;
第二分配单元,用于依据所述实验样本的所述随机码,以及预设分配规则,将所述实验样本分配至实验组中,所述分配规则至少包括满足第一预设条件,所述第一预设条件至少包括所述随机码小于所述实验组预设的样本比例上限、以及所述实验组已分配得到的实验样本的比例小于所述实验组的所述样本比例上限,所述实验组的所述样本比例上限依据所述实验组包括的实验,以及所述实验组所在的实验层中的其它实验组包括的实验确定。
9.一种设备,其特征在于,包括:处理器和存储器,所述存储器用于存储程序;所述处理器用于运行所述程序,以实现权利要求1-7任一项所述的实验样本分配的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行权利要求1-7任一项所述的实验样本分配的方法。
CN202010928005.6A 2020-09-07 2020-09-07 实验样本分配的方法及装置、设备及计算机可读存储介质 Active CN111967798B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010928005.6A CN111967798B (zh) 2020-09-07 2020-09-07 实验样本分配的方法及装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010928005.6A CN111967798B (zh) 2020-09-07 2020-09-07 实验样本分配的方法及装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111967798A true CN111967798A (zh) 2020-11-20
CN111967798B CN111967798B (zh) 2023-10-03

Family

ID=73391937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010928005.6A Active CN111967798B (zh) 2020-09-07 2020-09-07 实验样本分配的方法及装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111967798B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114095410A (zh) * 2021-11-11 2022-02-25 北京房江湖科技有限公司 一种测试实验的分流方法、分流装置和存储介质

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090183084A1 (en) * 2007-12-31 2009-07-16 Robertson Ian B System and method for assigning computer users to test groups
CN103077163A (zh) * 2012-12-24 2013-05-01 华为技术有限公司 数据预处理方法、装置及系统
CN104281611A (zh) * 2013-07-08 2015-01-14 阿里巴巴集团控股有限公司 网站测试系统中的用户流量分配方法及装置
CN104348679A (zh) * 2013-08-08 2015-02-11 阿里巴巴集团控股有限公司 一种分桶测试的方法、装置和系统
CN104503842A (zh) * 2014-12-22 2015-04-08 广州唯品会信息科技有限公司 基于多层分流实验框架的策略执行方法和装置
CN105373480A (zh) * 2015-12-15 2016-03-02 广州唯品会信息科技有限公司 优化ABTest系统分流的方法及系统
CN107392655A (zh) * 2017-07-03 2017-11-24 携程计算机技术(上海)有限公司 优惠券推送方法、系统、存储介质、电子设备及分流方法
US20180038980A1 (en) * 2015-01-30 2018-02-08 Halliburton Energy Services, Inc. Peak tracking and rejection in acoustic logs
US20180181911A1 (en) * 2016-11-23 2018-06-28 Beijing Xiaodu Information Technology Co., Ltd. Data object allocation method and apparatus and electronic device
CN109039800A (zh) * 2018-06-28 2018-12-18 腾讯科技(深圳)有限公司 在流量实验中进行流量分配的方法、装置和计算机设备
CN109409923A (zh) * 2018-09-03 2019-03-01 平安普惠企业管理有限公司 销售区域的分配方法、计算机可读存储介质及终端设备
CN109697049A (zh) * 2018-12-28 2019-04-30 拉扎斯网络科技(上海)有限公司 数据处理方法、装置、电子设备及计算机可读存储介质
CN110034953A (zh) * 2019-03-12 2019-07-19 平安城市建设科技(深圳)有限公司 组间实验中策略链的分析方法、装置、设备及存储介质
CN110417729A (zh) * 2019-06-12 2019-11-05 中国科学院信息工程研究所 一种加密流量的服务与应用分类方法及系统
CN110728323A (zh) * 2019-10-12 2020-01-24 中诚信征信有限公司 目标类型用户的识别方法、装置、电子设备及存储介质
CN110808872A (zh) * 2019-10-21 2020-02-18 微梦创科网络科技(中国)有限公司 一种流量实验的实现方法、装置及电子设备
CN111324259A (zh) * 2020-03-18 2020-06-23 腾讯科技(成都)有限公司 群组创建方法、装置和存储介质
CN111523297A (zh) * 2020-04-21 2020-08-11 上海优扬新媒信息技术有限公司 一种数据处理方法及装置

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090183084A1 (en) * 2007-12-31 2009-07-16 Robertson Ian B System and method for assigning computer users to test groups
CN103077163A (zh) * 2012-12-24 2013-05-01 华为技术有限公司 数据预处理方法、装置及系统
CN104281611A (zh) * 2013-07-08 2015-01-14 阿里巴巴集团控股有限公司 网站测试系统中的用户流量分配方法及装置
CN104348679A (zh) * 2013-08-08 2015-02-11 阿里巴巴集团控股有限公司 一种分桶测试的方法、装置和系统
CN104503842A (zh) * 2014-12-22 2015-04-08 广州唯品会信息科技有限公司 基于多层分流实验框架的策略执行方法和装置
US20180038980A1 (en) * 2015-01-30 2018-02-08 Halliburton Energy Services, Inc. Peak tracking and rejection in acoustic logs
CN105373480A (zh) * 2015-12-15 2016-03-02 广州唯品会信息科技有限公司 优化ABTest系统分流的方法及系统
US20180181911A1 (en) * 2016-11-23 2018-06-28 Beijing Xiaodu Information Technology Co., Ltd. Data object allocation method and apparatus and electronic device
CN107392655A (zh) * 2017-07-03 2017-11-24 携程计算机技术(上海)有限公司 优惠券推送方法、系统、存储介质、电子设备及分流方法
CN109039800A (zh) * 2018-06-28 2018-12-18 腾讯科技(深圳)有限公司 在流量实验中进行流量分配的方法、装置和计算机设备
CN109409923A (zh) * 2018-09-03 2019-03-01 平安普惠企业管理有限公司 销售区域的分配方法、计算机可读存储介质及终端设备
CN109697049A (zh) * 2018-12-28 2019-04-30 拉扎斯网络科技(上海)有限公司 数据处理方法、装置、电子设备及计算机可读存储介质
CN110034953A (zh) * 2019-03-12 2019-07-19 平安城市建设科技(深圳)有限公司 组间实验中策略链的分析方法、装置、设备及存储介质
CN110417729A (zh) * 2019-06-12 2019-11-05 中国科学院信息工程研究所 一种加密流量的服务与应用分类方法及系统
CN110728323A (zh) * 2019-10-12 2020-01-24 中诚信征信有限公司 目标类型用户的识别方法、装置、电子设备及存储介质
CN110808872A (zh) * 2019-10-21 2020-02-18 微梦创科网络科技(中国)有限公司 一种流量实验的实现方法、装置及电子设备
CN111324259A (zh) * 2020-03-18 2020-06-23 腾讯科技(成都)有限公司 群组创建方法、装置和存储介质
CN111523297A (zh) * 2020-04-21 2020-08-11 上海优扬新媒信息技术有限公司 一种数据处理方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陶秀杰: "基于比对矩阵模型的信息相似性检测系统设计", 电子设计工程, vol. 28, no. 08, pages 118 - 122 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114095410A (zh) * 2021-11-11 2022-02-25 北京房江湖科技有限公司 一种测试实验的分流方法、分流装置和存储介质
CN114095410B (zh) * 2021-11-11 2023-10-31 贝壳找房(北京)科技有限公司 一种测试实验的分流方法、分流装置和存储介质

Also Published As

Publication number Publication date
CN111967798B (zh) 2023-10-03

Similar Documents

Publication Publication Date Title
CN110766269A (zh) 一种任务分配方法、装置、可读存储介质及终端设备
CN107958349B (zh) 任务分配方法、装置、计算机设备和存储介质
CN108846632A (zh) 线程处理方法及装置
CN106372977B (zh) 一种虚拟账户的处理方法和设备
CN111782383A (zh) 任务分配方法、服务器、电子终端及计算机可读存储介质
CN109146661A (zh) 用户类型预测方法、装置、电子设备及存储介质
CN108805397A (zh) 电子装置、分配任务的方法及存储介质
CN111967798B (zh) 实验样本分配的方法及装置、设备及计算机可读存储介质
CN111428885B (zh) 一种联邦学习中用户的索引方法及联邦学习装置
CN111209111B (zh) 基于区块链系统的资源分配方法、装置、设备和存储介质
CN111092814B (zh) 业务办理请求报文分配方法及设备
CN109544347B (zh) 尾差分配方法、计算机可读存储介质及尾差分配系统
CN112819508B (zh) 电子资源的分配方法及装置
CN111612520A (zh) 资源处理方法、装置、服务器及存储介质
CN107369088B (zh) 帐务交易的处理方法和装置
CN111124672A (zh) 基于Redis集群的数据分配的方法及相关设备
CN115002049B (zh) 资源分配的方法及装置
CN116260876A (zh) 基于K8s的AI应用调度方法、装置及电子设备
WO2018205890A1 (zh) 一种分布式系统的任务分配方法及系统及其计算机可读存储介质和计算机设备
CN107145442B (zh) 一种测试应用的方法及装置
CN108345495A (zh) 一种多线程的加锁方法及服务器
CN112070349A (zh) 一种订单分配方法、装置、设备和存储介质
CN113835862B (zh) 任务处理方法及装置
CN115953008B (zh) 一种任务执行时间分配方法、装置、电子设备及存储介质
CN115495789B (zh) 一种隐私计算方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 401121 b7-7-2, Yuxing Plaza, No.5 Huangyang Road, Yubei District, Chongqing

Applicant after: Chongqing duxiaoman Youyang Technology Co.,Ltd.

Address before: 201800 room 307, 3 / F, building 8, 55 Huiyuan Road, Jiading District, Shanghai

Applicant before: SHANGHAI YOUYANG NEW MEDIA INFORMATION TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
TA01 Transfer of patent application right

Effective date of registration: 20211222

Address after: 100193 Room 606, 6 / F, building 4, West District, courtyard 10, northwest Wangdong Road, Haidian District, Beijing

Applicant after: Du Xiaoman Technology (Beijing) Co.,Ltd.

Address before: 401121 b7-7-2, Yuxing Plaza, No.5 Huangyang Road, Yubei District, Chongqing

Applicant before: Chongqing duxiaoman Youyang Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant