CN111753186A - 群体筛选方法、装置、设备及存储介质 - Google Patents
群体筛选方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111753186A CN111753186A CN202010387855.XA CN202010387855A CN111753186A CN 111753186 A CN111753186 A CN 111753186A CN 202010387855 A CN202010387855 A CN 202010387855A CN 111753186 A CN111753186 A CN 111753186A
- Authority
- CN
- China
- Prior art keywords
- screening
- target
- preset
- data
- portrait data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012216 screening Methods 0.000 title claims abstract description 169
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000004364 calculation method Methods 0.000 claims abstract description 47
- 230000006870 function Effects 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 description 28
- 230000000694 effects Effects 0.000 description 20
- 230000008859 change Effects 0.000 description 7
- 235000019504 cigarettes Nutrition 0.000 description 7
- 230000006399 behavior Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提出了一种群体筛选方法、装置、设备及存储介质,其中,方法包括:获取待筛选对象的画像数据;从画像数据中获取与预设筛选规则匹配的目标画像数据;根据目标画像数据与预设筛选指标进行计算,根据计算结果从待筛选对象获取目标筛选群体。由此,提供了一种通用的大数据群体筛选方案,能够适应主题指标、维度属性的变化,具有较好的扩展性,能够满足复杂的筛选计算需求。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种群体筛选方法、装置、设备及存储介质。
背景技术
基于用户访问记录、访问频率等历史行为信息和物品的属性,为用户推荐合适的物品,可以有效提升用户体验,而基于用户-物品的推荐系统通常存在冷启动的问题,即推荐结果不准确的问题。基于规则的物品推荐是一种能够解决冷启动问题的方法,而规则推荐的核心就是群体定义及筛选。
目前,针对复杂业务系统产生的动态变化数据,需要一种能够适应筛选规则变化、满足业务多级嵌套复杂筛选需求的群体筛选方案。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的第一个目的在于提出一种群体筛选方法,以实现通用的大数据群体筛选方案,能够适应筛选规则的变化,满足复杂的筛选计算需求。
本申请的第二个目的在于提出一种群体筛选装置。
本申请的第三个目的在于提出一种计算机设备。
本申请的第四个目的在于提出一种计算机可读存储介质。
本申请第一方面实施例提出了一种群体筛选方法,包括:
获取待筛选对象的画像数据;
从所述画像数据中获取与预设筛选规则匹配的目标画像数据;
根据所述目标画像数据与预设筛选指标进行计算,根据计算结果从所述待筛选对象获取目标筛选群体。
本申请实施例的群体筛选方法,通过获取待筛选对象的画像数据;从画像数据中获取与预设筛选规则匹配的目标画像数据;根据目标画像数据与预设筛选指标进行计算,根据计算结果从待筛选对象获取目标筛选群体。由此,实现了一种通用的大数据群体筛选方案,能够适应主题指标、维度属性的变化,具有较好的扩展性,例如可支持增加用户/物品的属性/指标,或支持用户修改筛选规则,若筛选规则发生变更可实时下发计算引擎进行计算,能够满足复杂的筛选计算需求,提高系统可维护性。
另外,根据本申请上述实施例的群体筛选方法还可以具有如下附加技术特征:
可选地,所述从所述画像数据中获取与预设筛选规则匹配的目标画像数据,包括:获取预设的对象维度和对象属性;从所述画像数据中确定与所述对象维度和对象属性匹配的对象属性值,以将所述对象属性值确定为目标画像数据。
可选地,所述从所述画像数据中获取与预设筛选规则匹配的目标画像数据,包括:获取预设的模型主题和模型指标;从所述画像数据中确定与所述模型主题和模型指标匹配的模型指标值,以将所述模型指标值确定为目标画像数据,其中,所述模型指标值按照预设规则对对象的事实数据计算得到。
可选地,所述根据所述目标画像数据与预设筛选指标进行计算,包括:通过用户自定义函数对所述目标画像数据和所述预设筛选指标进行计算;若所述目标画像数据满足所述预设筛选指标,则返回值为真;若所述目标画像数据不满足所述预设筛选指标,则返回值为假;其中,所述自定义函数为Z=UDF(X,Y),X为所述预设筛选指标,Y为所述目标画像数据,Z为返回值。
可选地,所述筛选指标有多个,所述根据计算结果从所述待筛选对象获取目标筛选群体,包括:获取所述待筛选对象中每个对象对应的多个计算结果,所述多个计算结果对应于多个筛选指标;若当前对象对应的多个计算结果均为真,则确定所述当前对象属于所述目标筛选群体。
本申请第二方面实施例提出了一种群体筛选装置,包括:
获取模块,用于获取待筛选对象的画像数据;
匹配模块,用于从所述画像数据中获取与预设筛选规则匹配的目标画像数据;
筛选模块,用于根据所述目标画像数据与预设筛选指标进行计算,根据计算结果从所述待筛选对象获取目标筛选群体。
本申请实施例的群体筛选装置,通过获取待筛选对象的画像数据;从画像数据中获取与预设筛选规则匹配的目标画像数据;根据目标画像数据与预设筛选指标进行计算,根据计算结果从待筛选对象获取目标筛选群体。由此,实现了一种通用的大数据群体筛选方案,能够适应主题指标、维度属性的变化,具有较好的扩展性,例如可支持增加用户/物品的属性/指标,或支持用户修改筛选规则,若筛选规则发生变更可实时下发计算引擎进行计算,能够满足复杂的筛选计算需求,提高系统可维护性。
另外,根据本申请上述实施例的群体筛选装置还可以具有如下附加技术特征:
可选地,所述匹配模块具体用于:获取预设的对象维度和对象属性;从所述画像数据中确定与所述对象维度和对象属性匹配的对象属性值,以将所述对象属性值确定为目标画像数据。
可选地,所述匹配模块具体用于:获取预设的模型主题和模型指标;从所述画像数据中确定与所述模型主题和模型指标匹配的模型指标值,以将所述模型指标值确定为目标画像数据,其中,所述模型指标值按照预设规则对对象的事实数据计算得到。
可选地,所述筛选模块包括:计算单元,用于通过用户自定义函数对所述目标画像数据和所述预设筛选指标进行计算;若所述目标画像数据满足所述预设筛选指标,则返回值为真;若所述目标画像数据不满足所述预设筛选指标,则返回值为假;其中,所述自定义函数为Z=UDF(X,Y),X为所述预设筛选指标,Y为所述目标画像数据,Z为返回值。
可选地,所述筛选模块还包括:筛选单元,用于获取所述待筛选对象中每个对象对应的多个计算结果,所述多个计算结果对应于多个筛选指标;若当前对象对应的多个计算结果均为真,则确定所述当前对象属于所述目标筛选群体。
本申请第三方面实施例提出了一种计算机设备,包括处理器和存储器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如第一方面实施例所述的群体筛选方法。
本申请第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面实施例所述的群体筛选方法。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
图1为本申请实施例所提供的一种群体筛选方法的流程示意图;
图2为本申请实施例所提供的一种群体筛选装置的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的群体筛选方法、装置及设备。
图1为本申请实施例所提供的一种群体筛选方法的流程示意图,如图1所示,该方法包括:
步骤101,获取待筛选对象的画像数据。
本申请实施例的群体筛选方法,可以应用于数据仓库。本实施例中,在进行群体筛选时,先获取待筛选对象的画像数据,可选地,待筛选对象的画像数据存储于数据仓库中。
作为一种示例,待筛选对象可以是用户,画像数据可包括用户的姓名、年龄、性别等。
作为另一种示例,待筛选对象可以是物品,画像数据可包括物品的名称、类型等。
举例而言,用户画像数据集合P的一种示例如下所示:
P=((0,USER,USER.AGE,28),
(1,USER,BEHAVIOR,PV,200),
(2,USER,USER.ACTIVITY,'参与过上海车展活动'))
其中,上述用户画像数据子集P中包含三条数据,第一条数据对应序号为0,表示用户在对象维度USER及对象属性AGE下的对象属性值为20,即代表用户年龄为20。第二条数据对应序号为1,表示用户在模型主题BEHAVIOR及模型指标PV下的模型指标值为200。第三条数据对应序号为2,表示用户在对象维度USER及对象属性ACTIVITY下的对象属性值为“参与过上海车展活动”。
需要说明的是,上述画像数据仅为一种示例,在实际应用中,画像数据通常包含了用户/物品的所有对象属性值、模型指标值。
步骤102,从画像数据中获取与预设筛选规则匹配的目标画像数据。
本实施例中,可以预先设置群体筛选的筛选规则,根据筛选规则从画像数据中获取参与计算的目标画像数据。例如,筛选规则对应为从所有用户中筛选出年龄大于20的用户,则获知用户年龄与筛选规则匹配,根据筛选规则从所有用户的画像数据中获取用户年龄数据作为目标画像数据。
为了更加清楚的解释本申请,下面对筛选规则进行说明,筛选规则可包括多个子条件,如下所示:R=COND op COND,其中,R表示筛选规则,COND为规则的子条件。对于每个子条件,如下所示:COND=[]op VALUE,ORDER,其中,[]表示位置参数,位置参数用于在群体筛选计算过程中,以目标画像数据作为输入。op表示运算符,举例如下:op={&&,||,==,>,<,≥,≤},需要说明的是,op包括但不限于逻辑运算、算术运算、自定义运算。VALUE表示值,ORDER是用于排序的序列值,例如从0递增。
作为一种示例,筛选规则为:(USER.AGE>20,0)&&(USER.ACTIVITY='参与过上海车展活动',1),其中,(USER.AGE>20,0)和(USER.ACTIVITY='参与过上海车展活动',1)为两个子条件,筛选规则表示筛选年龄大于20且参加过上海车展活动的用户。
作为另一种示例,筛选规则为:(ITEM.TYPE='精品',0)&&(ITEM.NAME='车载点烟器',1),其中,(ITEM.TYPE='精品',0)和(ITEM.NAME='车载点烟器',1)为两个子条件,筛选规则表示筛选类型为“精品”且名称为“车载点烟器”的物品。
在本申请的一个实施例中,数据仓库中可存储涉及对象维度和对象属性的画像数据,则从画像数据中获取与预设筛选规则匹配的目标画像数据,包括:获取预设的对象维度和对象属性,从画像数据中确定与对象维度和对象属性匹配的对象属性值,以将对象属性值确定为目标画像数据。
作为一种示例,预设筛选规则包括子条件(USER.AGE>20,0),子条件对应的对象维度为USER,对象属性为AGE,则从前述集合P中确定与对象维度USER和对象属性AGE匹配的对象属性值20,作为目标画像数据。需要说明的是,若筛选规则包括多个子条件,则对于每一子条件确定对应的对象维度和对象属性,并从画像数据中确定与当前子条件对应的对象维度和对象属性匹配的对象属性值。其中,对象维度是指与事实数据相关的一系列数据实体,事实用以描述现实世界中的操作型事件所产生的可度量数值。
在本申请的一个实施例中,数据仓库中可存储涉及模型主题和模型指标的画像数据,则从画像数据中获取与预设筛选规则匹配的目标画像数据,包括:获取预设的模型主题和模型指标,从画像数据中确定与模型主题和模型指标匹配的模型指标值,,以将模型指标值确定为目标画像数据,其中,模型指标值按照预设规则对对象的事实数据计算得到。
作为一种示例,预设筛选规则包括子条件(BEHAVIOR,PV>100,0),则从前述集合P中确定与模型主题BEHAVIOR和模型指标PV匹配的模型指标值200,作为目标画像数据。其中,模型主题是指一系列与业务相关的按照维度建模方法设计的数据模型,模型指标是按照预设规则对事实数据计算得到的。
步骤103,根据目标画像数据与预设筛选指标进行计算,根据计算结果从待筛选对象获取目标筛选群体。
本实施例中,根据预先设置的筛选规则可以得到与筛选规则对应的筛选指标,进而,在获取与筛选规则匹配的目标画像数据后,根据目标画像数据与筛选指标进行计算,得到计算结果。可选地,若筛选规则包括多个子条件,则筛选规则对应的筛选指标有多个,其中每个子条件对应一个筛选指标。
在本申请的一个实施例中,通过用户自定义函数对目标画像数据和预设筛选指标进行计算,若目标画像数据满足预设筛选指标,则返回值为真;若目标画像数据不满足预设筛选指标,则返回值为假。其中,用户自定义函数是基于表达式计算引擎开发得到的。
作为一种可能的实现方式,自定义函数为Z=UDF(X,Y),其中,X为预设筛选指标,Y为目标画像数据,Z为返回值,例如UDF(USER.AGE>20,[28])的返回值为真,(USER.AGE>20,[10])的返回值为假。
需要说明的是,用户自定义函数可以返回逻辑值,如True(真)或False(假),也可以返回任意表达式,并将返回的计算结果记为O,此处不作限制。
在本申请的一个实施例中,筛选指标有多个,根据计算结果从待筛选对象获取目标筛选群体,包括:获取待筛选对象中每个对象对应的多个计算结果,多个计算结果对应于多个筛选指标,若当前对象对应的多个计算结果均为真,则确定当前对象符合筛选规则,即属于目标筛选群体;否则,确定当前对象不符合筛选规则,即不属于目标筛选群体。
举例而言,若筛选对象为用户,在获取筛选规则下全部子条件的计算结果后,按用户分组聚合并按照子条件的序列值进行排序,对于每个用户,根据自定义函数的返回值计算得到筛选规则的最终结果,根据最终结果识别出用户是否属于目标筛选群体。例如,筛选规则为(USER.AGE>20,0)&&(USER.ACTIVITY='参与过上海车展活动',1),对于用户A,根据自定义函数得到的计算结果为[True,True],则确定用户A属于目标筛选群体。
相关技术中采用向量矩阵方式存储用户和物品属性,且向量必须结构固定、取值明确,例如用户向量U和物品向量I如下所示:U=(USER,AGE,HEIGHT,ACTIVITY),I=(ITEM,TYPE,PRICE,NAME)。在进行群体筛选时,例如针对年龄大于20且参与过上海车展活动的用户,推荐精品车载点烟器的物品,对应的筛选规则(U.AGE>20&&U.ACTIVITY='参与过上海车展活动',I.TYPE='精品'&&I.NAME='车载点烟器'),上述群体筛选方案计算方法固定,难以适应应用过程中筛选规则发生变化的情况,无法满足业务多级嵌套复杂筛选计算的需求,且50%以上的逻辑基于非SQL(Structured Query Language,结构化查询语言)实现,可维护性差,应用门槛高。
本申请实施例的群体筛选方法,通过获取待筛选对象的画像数据;从画像数据中获取与预设筛选规则匹配的目标画像数据;根据目标画像数据与预设筛选指标进行计算,根据计算结果从待筛选对象获取目标筛选群体。由此,实现了一种通用的大数据群体筛选方案,能够适应主题指标、维度属性的变化,具有较好的扩展性,例如可支持增加用户/物品的属性/指标,或支持用户修改筛选规则,若筛选规则发生变更可实时下发计算引擎进行计算,能够满足复杂的筛选计算需求,提高系统可维护性。
下面结合用户-物品推荐场景对本申请实施例的群体筛选方法进行说明。
针对年龄大于20且参与过上海车展活动的用户,推荐精品车载点烟器的物品时,筛选规则包括(USER.AGE>20,0)&&(USER.ACTIVITY='参与过上海车展活动',1)和(ITEM.TYPE='精品',0)&&(ITEM.NAME='车载点烟器',1)。用户USER的画像数据如下:P=((0,USER,USER.AGE,28),(1,USER,BEHAVIOR,PV,200),(2,USER,USER.ACTIVITY,'参与过上海车展活动')),根据筛选规则确定参与计算的数据分区P'=((0,USER,USER.AGE,28),(2,USER,USER.ACTIVITY,'参与过上海车展活动'))。
筛选计算过程如下:
(0,UDF(USER.AGE>20,[28]))
(1,UDF(USER.ACTIVITY='参与过上海车展活动',['参与过上海车展活动']))
(A[0]&&A[1],[True,True])
若表达式返回结果为真(True),表示用户USER符合该群体定义,由此实现了获取符合筛选规则的目标用户。进而,基于同样的方式实现物品筛选,获取符合筛选规则的目标物品,从而向筛选出的目标用户推荐目标物品,实现基于规则的物品推荐。
为了实现上述实施例,本申请还提出一种群体筛选装置。
图2为本申请实施例所提供的一种群体筛选装置的结构示意图,如图2所示,该装置包括:获取模块10,匹配模块20,筛选模块30。
其中,获取模块10,用于获取待筛选对象的画像数据。
匹配模块20,用于从所述画像数据中获取与预设筛选规则匹配的目标画像数据。
筛选模块30,用于根据所述目标画像数据与预设筛选指标进行计算,根据计算结果从所述待筛选对象获取目标筛选群体。
在本申请的一个实施例中,匹配模块20具体用于:获取预设的对象维度和对象属性;从所述画像数据中确定与所述对象维度和对象属性匹配的对象属性值,以将对象属性值确定为目标画像数据。
在本申请的一个实施例中,匹配模块20具体用于:获取预设的模型主题和模型指标;从所述画像数据中确定与所述模型主题和模型指标匹配的模型指标值,以将模型指标值确定为目标画像数据,所述模型指标值按照预设规则对对象的事实数据计算得到。
在本申请的一个实施例中,筛选模块30包括:计算单元,用于通过用户自定义函数对所述目标画像数据和所述预设筛选指标进行计算;若所述目标画像数据满足所述预设筛选指标,则返回值为真;若所述目标画像数据不满足所述预设筛选指标,则返回值为假;其中,自定义函数为Z=UDF(X,Y),X为预设筛选指标,Y为目标画像数据,Z为返回值。
进一步地,筛选模块30还包括:筛选单元,用于获取所述待筛选对象中每个对象对应的多个计算结果,所述多个计算结果对应于多个筛选指标;若当前对象对应的多个计算结果均为真,则确定所述当前对象属于所述目标筛选群体。
需要说明的是,前述实施例对群体筛选方法的解释说明同样适用于本实施例的群体筛选装置,此处不再赘述。
本申请实施例的群体筛选装置,通过获取待筛选对象的画像数据;从画像数据中获取与预设筛选规则匹配的目标画像数据;根据目标画像数据与预设筛选指标进行计算,根据计算结果从待筛选对象获取目标筛选群体。由此,实现了一种通用的大数据群体筛选方案,能够适应主题指标、维度属性的变化,具有较好的扩展性,例如可支持增加用户/物品的属性/指标,或支持用户修改筛选规则,若筛选规则发生变更可实时下发计算引擎进行计算,能够满足复杂的筛选计算需求,提高系统可维护性。
为了实现上述实施例,本申请还提出一种计算机设备,包括处理器和存储器;其中,处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于实现如前述任一实施例所述的群体筛选方法。
为了实现上述实施例,本申请还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如前述任一实施例所述的群体筛选方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (12)
1.一种群体筛选方法,其特征在于,包括:
获取待筛选对象的画像数据;
从所述画像数据中获取与预设筛选规则匹配的目标画像数据;
根据所述目标画像数据与预设筛选指标进行计算,根据计算结果从所述待筛选对象获取目标筛选群体。
2.如权利要求1所述的方法,其特征在于,所述从所述画像数据中获取与预设筛选规则匹配的目标画像数据,包括:
获取预设的对象维度和对象属性;
从所述画像数据中确定与所述对象维度和对象属性匹配的对象属性值,以将所述对象属性值确定为目标画像数据。
3.如权利要求1所述的方法,其特征在于,所述从所述画像数据中获取与预设筛选规则匹配的目标画像数据,还包括:
获取预设的模型主题和模型指标;
从所述画像数据中确定与所述模型主题和模型指标匹配的模型指标值,以将所述模型指标值确定为目标画像数据;
其中,所述模型指标值按照预设规则对对象的事实数据计算得到。
4.如权利要求1所述的方法,其特征在于,所述根据所述目标画像数据与预设筛选指标进行计算,包括:
通过用户自定义函数对所述目标画像数据和所述预设筛选指标进行计算;
若所述目标画像数据满足所述预设筛选指标,则返回值为真;
若所述目标画像数据不满足所述预设筛选指标,则返回值为假;
其中,所述自定义函数为Z=UDF(X,Y),X为所述预设筛选指标,Y为所述目标画像数据,Z为返回值。
5.如权利要求4所述的方法,其特征在于,所述筛选指标有多个,所述根据计算结果从所述待筛选对象获取目标筛选群体,包括:
获取所述待筛选对象中每个对象对应的多个计算结果,所述多个计算结果对应于多个筛选指标;
若当前对象对应的多个计算结果均为真,则确定所述当前对象属于所述目标筛选群体。
6.一种群体筛选装置,其特征在于,包括:
获取模块,用于获取待筛选对象的画像数据;
匹配模块,用于从所述画像数据中获取与预设筛选规则匹配的目标画像数据;
筛选模块,用于根据所述目标画像数据与预设筛选指标进行计算,根据计算结果从所述待筛选对象获取目标筛选群体。
7.如权利要求6所述的装置,其特征在于,所述匹配模块具体用于:
获取预设的对象维度和对象属性;
从所述画像数据中确定与所述对象维度和对象属性匹配的对象属性值,以将所述对象属性值确定为目标画像数据。
8.如权利要求6所述的装置,其特征在于,所述匹配模块具体用于:
获取预设的模型主题和模型指标;
从所述画像数据中确定与所述模型主题和模型指标匹配的模型指标值,以将所述模型指标值确定为目标画像数据,其中,所述模型指标值按照预设规则对对象的事实数据计算得到。
9.如权利要求6所述的装置,其特征在于,所述筛选模块包括:
计算单元,用于通过用户自定义函数对所述目标画像数据和所述预设筛选指标进行计算;
若所述目标画像数据满足所述预设筛选指标,则返回值为真;
若所述目标画像数据不满足所述预设筛选指标,则返回值为假;
其中,所述自定义函数为Z=UDF(X,Y),X为所述预设筛选指标,Y为所述目标画像数据,Z为返回值。
10.如权利要求9所述的装置,其特征在于,所述筛选模块还包括:
筛选单元,用于获取所述待筛选对象中每个对象对应的多个计算结果,所述多个计算结果对应于多个筛选指标;
若当前对象对应的多个计算结果均为真,则确定所述当前对象属于所述目标筛选群体。
11.一种计算机设备,其特征在于,包括:
存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5中任一所述的群体筛选方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的群体筛选方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010387855.XA CN111753186A (zh) | 2020-05-09 | 2020-05-09 | 群体筛选方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010387855.XA CN111753186A (zh) | 2020-05-09 | 2020-05-09 | 群体筛选方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111753186A true CN111753186A (zh) | 2020-10-09 |
Family
ID=72673342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010387855.XA Pending CN111753186A (zh) | 2020-05-09 | 2020-05-09 | 群体筛选方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111753186A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112528105A (zh) * | 2020-12-28 | 2021-03-19 | 北京中电普华信息技术有限公司 | 数据筛选的方法及装置、电子设备及计算机可读存储介质 |
CN112732740A (zh) * | 2020-12-30 | 2021-04-30 | 航天信息股份有限公司 | 调查对象数据处理方法、装置、存储介质及电子设备 |
CN113379499A (zh) * | 2021-06-18 | 2021-09-10 | 北京沃东天骏信息技术有限公司 | 物品筛选方法及装置、电子设备、存储介质 |
CN113408970A (zh) * | 2021-08-20 | 2021-09-17 | 北京国电通网络技术有限公司 | 用户信息生成方法、装置、电子设备和计算机可读介质 |
CN113704253A (zh) * | 2021-07-28 | 2021-11-26 | 昆山丘钛微电子科技股份有限公司 | 摄像模组筛选方法、系统、装置及服务器 |
CN114997576A (zh) * | 2022-04-27 | 2022-09-02 | 建信金融科技有限责任公司 | 一种达标提示对象的确定方法、装置、设备、介质及产品 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109118296A (zh) * | 2018-09-04 | 2019-01-01 | 南京星邺汇捷网络科技有限公司 | 活动推送方法、装置及电子设备 |
CN110363387A (zh) * | 2019-06-14 | 2019-10-22 | 平安科技(深圳)有限公司 | 基于大数据的画像分析方法、装置、计算机设备及存储介质 |
-
2020
- 2020-05-09 CN CN202010387855.XA patent/CN111753186A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109118296A (zh) * | 2018-09-04 | 2019-01-01 | 南京星邺汇捷网络科技有限公司 | 活动推送方法、装置及电子设备 |
CN110363387A (zh) * | 2019-06-14 | 2019-10-22 | 平安科技(深圳)有限公司 | 基于大数据的画像分析方法、装置、计算机设备及存储介质 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112528105A (zh) * | 2020-12-28 | 2021-03-19 | 北京中电普华信息技术有限公司 | 数据筛选的方法及装置、电子设备及计算机可读存储介质 |
CN112528105B (zh) * | 2020-12-28 | 2024-07-19 | 北京中电普华信息技术有限公司 | 数据筛选的方法及装置、电子设备及计算机可读存储介质 |
CN112732740A (zh) * | 2020-12-30 | 2021-04-30 | 航天信息股份有限公司 | 调查对象数据处理方法、装置、存储介质及电子设备 |
CN113379499A (zh) * | 2021-06-18 | 2021-09-10 | 北京沃东天骏信息技术有限公司 | 物品筛选方法及装置、电子设备、存储介质 |
CN113704253A (zh) * | 2021-07-28 | 2021-11-26 | 昆山丘钛微电子科技股份有限公司 | 摄像模组筛选方法、系统、装置及服务器 |
CN113408970A (zh) * | 2021-08-20 | 2021-09-17 | 北京国电通网络技术有限公司 | 用户信息生成方法、装置、电子设备和计算机可读介质 |
CN114997576A (zh) * | 2022-04-27 | 2022-09-02 | 建信金融科技有限责任公司 | 一种达标提示对象的确定方法、装置、设备、介质及产品 |
CN114997576B (zh) * | 2022-04-27 | 2024-09-06 | 建信金融科技有限责任公司 | 一种达标提示对象的确定方法、装置、设备、介质及产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111753186A (zh) | 群体筛选方法、装置、设备及存储介质 | |
US6662189B2 (en) | Method of performing data mining tasks for generating decision tree and apparatus therefor | |
CN103513983B (zh) | 用于预测性警报阈值确定工具的方法和系统 | |
Acid et al. | An information retrieval model based on simple Bayesian networks | |
Ayetiran et al. | A data mining-based response model for target selection in direct marketing | |
US8538988B2 (en) | Selective storing of mining models for enabling interactive data mining | |
Zhang et al. | An improved consensus-based group decision making model with heterogeneous information | |
CN114638234B (zh) | 应用于线上业务办理的大数据挖掘方法及系统 | |
Zhang et al. | Learning click models via probit bayesian inference | |
Velayutham et al. | Improved Rough set algorithms for optimal attribute reduct | |
CN105989066A (zh) | 一种信息处理方法和装置 | |
Chelly et al. | Qr-dca: A new rough data pre-processing approach for the dendritic cell algorithm | |
Fan et al. | Autogfs: Automated group-based feature selection via interactive reinforcement learning | |
US6286012B1 (en) | Information filtering apparatus and information filtering method | |
CN114048148A (zh) | 一种众包测试报告推荐方法、装置及电子设备 | |
Wache et al. | Scalable instance retrieval for the semantic web by approximation | |
JP2019128925A (ja) | 事象提示システムおよび事象提示装置 | |
CN115687756B (zh) | 一种搜索推荐方法及装置 | |
US6424963B1 (en) | Document retrieval having retrieval conditions that shuffles documents in a sequence of occurrence | |
CN111553762A (zh) | 提高搜索质量的方法、系统及终端设备 | |
EP4002151A1 (en) | Data tagging and synchronisation system | |
CN115841359A (zh) | 一种对象生成方法、装置、设备及存储介质 | |
CN114418114A (zh) | 一种算子融合方法、装置、终端设备及存储介质 | |
US20030109940A1 (en) | Device, storage medium and a method for detecting objects strongly resembling a given object | |
CN107239660B (zh) | 基于混合整数线性规划的粗糙集模型建立方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |