CN109063199A - 资源过滤方法及其装置、电子设备、计算机可读介质 - Google Patents

资源过滤方法及其装置、电子设备、计算机可读介质 Download PDF

Info

Publication number
CN109063199A
CN109063199A CN201811056079.4A CN201811056079A CN109063199A CN 109063199 A CN109063199 A CN 109063199A CN 201811056079 A CN201811056079 A CN 201811056079A CN 109063199 A CN109063199 A CN 109063199A
Authority
CN
China
Prior art keywords
candidate resource
characteristic attribute
attribute parameter
resource
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811056079.4A
Other languages
English (en)
Other versions
CN109063199B (zh
Inventor
隋齐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Uc Mobile Co ltd
Original Assignee
Guangzhou Shenma Mobile Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Shenma Mobile Information Technology Co Ltd filed Critical Guangzhou Shenma Mobile Information Technology Co Ltd
Priority to CN201811056079.4A priority Critical patent/CN109063199B/zh
Publication of CN109063199A publication Critical patent/CN109063199A/zh
Application granted granted Critical
Publication of CN109063199B publication Critical patent/CN109063199B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种资源过滤方法及其装置、电子设备、计算机可读介质。该方法的一具体实施方式包括:根据预先定义的资源筛选规则,得到候选资源集,所述候选资源集包括多个候选资源;根据设定的过滤配置项,确定所述候选资源集中每个候选资源的特征属性参数;根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数,确定所述候选资源集中待过滤掉的候选资源。该具体实施方式提供了一种有效的资源过滤解决方案。

Description

资源过滤方法及其装置、电子设备、计算机可读介质
技术领域
本申请涉及互联网技术领域,具体涉及互联网技术领域,尤其涉及一种资源过滤方法及其装置、电子设备、计算机可读介质。
背景技术
由于应用场景中的不同比如产品的定位或者迭代,以及使用产品的地域、渠道、平台等的差异,导致同一资源在一些应用场景中可呈现给用户,而在另外一些应用场景中需要被过滤掉且不能呈现给用户。比如,在实际应用中,某一类型的文章,在一些数据流产品中需要被过滤掉;实际上,由于文章类型的多样性比如负面、低俗、低质、标题党、政治等,导致在进行资源过滤时难度较大。
因此,亟待提供一种有效的资源过滤解决方案。
发明内容
本申请的目的在于提出一种资源过滤方法及其装置、电子设备、计算机可读介质,用于解决现有技术中上述技术问题。
第一方面,本申请提供了一种资源过滤方法,其包括:
根据预先定义的资源筛选规则,得到候选资源集,所述候选资源集包括多个候选资源;
根据设定的过滤配置项,确定所述候选资源集中每个候选资源的特征属性参数;
根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数,确定所述候选资源集中待过滤掉的候选资源。
可选地,在本申请的一实施例中,所述每个候选资源的特征属性参数为第一特征串,所述第一特征串包括至少一个第一枚举值。
可选地,在本申请的一实施例中,所述搜索请求的特征属性参数为第二特征串,所述第二特征串包括至少一个第二枚举值。
可选地,在本申请的一实施例中,根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数,确定从所述候选资源集中过滤掉的候选资源,包括:
将所述第二特征串中第二枚举值与所述第一特征串中的第一枚举值按照位的对应关系进行比对;
将相同比特位上与所述第二枚举值均相等的所述第一枚举值对应的候选资源确定为待过滤掉的候选资源。
可选地,在本申请的一实施例中,还包括:为所述第一特征串配置一掩码,所述掩码用于屏蔽所述第二特征串不参与所述比对的第二枚举值。
可选地,在本申请的一实施例中,还包括:将所述候选资源集包括的每个候选资源的特征属性参数加载正排索引中;
对应地,根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数,确定所述候选资源集中待过滤掉的候选资源,包括:从所述正排索引获取所述候选资源集中每个候选资源的特征属性参数;
根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数的比对结果,确定所述候选资源集中待过滤掉的候选资源。
可选地,在本申请的一实施例中,还包括:
确定更新后的所述过滤配置项;
根据更新后的所述过滤配置项,更新所述正排索引中所述候选资源集包括的候选资源的特征属性参数。
第二方面,本申请实施例提供一种资源过滤装置,其包括:
筛选单元,用于根据预先定义的资源筛选规则,得到候选资源集,所述候选资源集包括多个候选资源;
参数确定单元,用于根据设定的过滤配置项,确定所述候选资源集中每个候选资源的特征属性参数;
过滤单元,用于根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数,确定所述候选资源集中待过滤掉的候选资源。
可选地,在本申请的一实施例中,所述每个候选资源的特征属性参数为第一特征串,所述第一特征串包括至少一个第一枚举值。
可选地,在本申请的一实施例中,所述搜索请求的特征属性参数为第二特征串,所述第二特征串包括至少一个第二枚举值。
可选地,在本申请的一实施例中,所述过滤单元包括:
比对子单元,用于将所述第二特征串中第二枚举值与所述第一特征串中的第一枚举值按照位的对应关系进行比对;
过滤子单元,用于将相同比特位上与所述第二枚举值均相等的所述第一枚举值对应的候选资源确定为待过滤掉的候选资源。
可选地,在本申请的一实施例中,还包括:掩码配置单元,用于为所述第一特征串配置一掩码,所述掩码用于屏蔽所述第二特征串不参与所述比对的第二枚举值。
可选地,在本申请的一实施例中,还包括:索引单元,用于将所述候选资源集包括的每个候选资源的特征属性参数加载正排索引中;
对应地,所述过滤单元进一步用于从所述正排索引获取所述候选资源集中每个候选资源的特征属性参数;根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数的比对结果,确定所述候选资源集中待过滤掉的候选资源。
第三方面,本申请实施例提供一种电子设备,其包括:
一个或多个处理器;
计算机可读介质,配置为存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如任一实施例中所述的资源过滤方法。
第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如任一实施例中所述的资源过滤方法。
本申请提供的资源过滤方法及其装置、电子设备、计算机可读介质中,通过根据预先定义的资源筛选规则,得到候选资源集,所述候选资源集包括多个候选资源;根据设定的过滤配置项,确定所述候选资源集中每个候选资源的特征属性参数;根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数,确定所述候选资源集中待过滤掉的候选资源,提供了一种有效的资源过滤解决方案。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1为本申请实施例一资源过滤方法流程示意图;
图2为本申请实施例二资源过滤方法流程示意图;
图3为本申请实施例三资源过滤方法流程示意图;
图4为本申请实施例四资源过滤方法流程示意图;
图5为本申请实施例五过滤配置项的设置示意图;
图6为本申请实施例五资源过滤装置结构示意图;
图7为本申请实施例七资源过滤装置结构示意图;
图8为本申请实施例八资源过滤装置结构示意图;
图9为本申请实施例九中电子设备的结构示意图;
图10为本申请实施例十中电子设备的硬件结构。。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅配置为解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1为本申请实施例一资源过滤方法流程示意图;如图1所示,其包括如下步骤S101-S103:
S101、根据预先定义的资源筛选规则,得到候选资源集,所述候选资源集包括多个候选资源;
本实施例中,步骤S101中,资源筛选规则具体根据产品的需求进行自定义,比如资源筛选规则为资源热度大于设定的热度阈值,资源的时效性为最新,资源的质量指标大于设定的质量阈值。
在具体实施时,可以对资源的访问量进行统计,访问量越大表示资源热度越大,热度阈值具体可以访问量阈值。比如,采集用户访问行为数据,并记录所述用户的每一个所述访问行为的起止时间;对所述访问行为数据以及所述访问行为对应的所述起止时间进行分类统计,从而确定访问次数以及访问时长,访问量包括该访问次数以及访问时长。
进一步地,可以直接筛选搜索引擎数据库中的榜单数据;将筛选得到的榜单数据与搜索日志数据做交集,获取数据交集中的热词对应的页面浏览量,该浏览量即作为上述访问统计量,包括浏览总次数以及浏览总时长。
资源的时效性比如原始发布时间或者转发时间最新的,则其时效性定义为最新,即距离当前需求的时间越近。
资源的质量比如具体可以根据资源在各个发布载体中的评论的数量以及发布载体的行业影响因子进行确定。评论越多,行业影响因子越高,则资源的质量越高。
本实施例中,由于对于同一事件往往可来自多个不同的渠道,由此会形成多个候选资源。
S102、根据设定的过滤配置项,确定所述候选资源集中每个候选资源的特征属性参数;
可选地,在本实施例中,所述每个候选资源的特征属性参数为第一特征串,所述第一特征串包括至少一个第一枚举值。
特征串又称bitset,由于其可以存储对象中的每个条件的状态位,每个状态位用二进制数据0或1表示。因此,在一具体应用场景中,每个候选资源对应一个第一特征串,该第一特征串又称为针对每个候选资源的标签(lable)。如果后续通过从多个角度对候选资源进行过滤,则通过在第一特征串中定义多个过滤维度设置域(domain),每个过滤维度设置域设置有若干个第一枚举值,用于表征进行候选资源过滤的角度。
在一具体应用场景中,比如label里需要支持对3个不同的过滤维度设置域domain来进行过滤,分别命名为domainA,domainB,domainC,domainA这个维度,配置的第一可枚举值有4个,因为默认可枚举值全0,共计5个第一枚举值,那么domainA占用3个bit位,domainB的第一枚举值有2个,占用2个bit位,domainC的第一枚举值有5个,占据3个bit位,因此,3个domain总共需要使用8个bit位,对应占据3,2,3个bit位。比如,domainA对应从文章类型进行过滤,domainB定义从文章的时效进行过滤,domainC定义从文章的质量进行过滤。
但是,需要说明的是,候选资源的特征属性参数的设置还可以是其他形式,只要可以与推荐请求参与后续步骤103的处理,从所述候选资源集中确定出待过滤的候选资源即可。
S103、根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数,确定所述候选资源集中待过滤掉的候选资源。
可选地,在本实施例中,为了可直接与候选资源的特征属性参数进行比对,所述搜索请求的特征属性参数为第二特征串,所述第二特征串包括至少一个第二枚举值。
本实施例中,有关搜索请求的第二特征串类似上述第一特征串的解释,用于反映可匹配该搜索请求的资源的特征属性,具体参见上述实施例,当其为第二特征串时,通过在第二特征串中定义多个资源维度设置域(domain),每个资源维度设置域设置有若干个第二枚举值,用于表征满足搜索请求的候选资源应当具备的属性。比如,其对应lable同样设置三个域:domainA,domainB,domainC,那么domain的第二枚举值有5个,即占用3个bit位,domainB的第二枚举值有2个,占用2个bit位,domainC的第二枚举值有5个,占据3个bit位,因此,3个domain总共需要使用8个bit位,对应占据3,2,3个bit位。比如,domainA定义不满足搜索请求的文章类型,domainB定义不满足搜索请求的文章时效,domainC定义不满足搜索请求的文章质量。
为此,本实施例中,步骤S103具体可以包括:
S113、将所述第二特征串中第二枚举值与所述第一特征串中的第一枚举值按照位的对应关系进行比对;
S123、将相同比特位上与所述第二枚举值均相等的所述第一枚举值对应的候选资源确定为待过滤掉的候选资源。
图2为本申请实施例二资源过滤方法流程示意图;如图2所示,其包括:
S201、根据预先定义的资源筛选规则,得到候选资源集,所述候选资源集包括多个候选资源;
本实施例中,步骤S201类似上述实施例一中的步骤S101。
S202、根据设定的过滤配置项,确定所述候选资源集中每个候选资源的述第一特征串;
与上述图1实施例相同,所述第一特征串包括至少一个第一枚举值。每个状态位用二进制数据0或1表示。因此,在一具体应用场景中,每个候选资源对应一个第一特征串,该第一特征串又称为针对每个候选资源的标签(lable)。如果后续通过从多个角度对候选资源进行过滤,则通过在第一特征串中定义多个过滤维度设置域(domain),每个过滤维度设置域设置有若干个第一枚举值,用于表征进行候选资源过滤的角度。
S203、确定搜索请求的第二特征串并为所述第一特征串配置一掩码,所述掩码用于屏蔽所述第二特征串不参与所述比对的第二枚举值。
本实施例中,与上述图1实施例相同,第二特征串类似上述第一特征串的解释,用于反映可匹配该搜索请求的资源的特征属性,具体参见上述实施例,当其为第二特征串时,通过在第二特征串中定义多个资源维度设置域(domain),每个资源维度设置域设置有若干个第二枚举值,用于表征满足搜索请求的候选资源应当具备的属性。
本实施例中,设置掩码的作用主要是为了灵活的配置过滤,将所述第二特征串中不需要与第一特征串进行比对的维度设置域屏蔽掉,
比如,在一具体应用场景中,例来说,如果我们只需要第一特征串中domain A的第一枚举值来进行过滤,那么生成的第一特征串bitset为00000001,而根据搜索请求生成的第二特征串bitset,因为第二特征串中各个domain的第二枚举值都有数值,那么是不可能与第一特征串bitset相等的,为此,给第一特征串bitset匹配一个00000111的掩码,这个掩码会跟根据搜索请求生成的第二特征串bitset做按位与操作,将第二特征串中不需要过滤的domainB、domain c都抹掉,这样第二特征串剩余的为1的domainA就是要与第一特征串bitset中的domainA进行比对的domain,进而可以直接用是否相等的操作来确认该候选资源是否需要被过滤掉。
基于上述第一特征串和第二特征串中枚举值的分别定义,相当值从是否满足搜索请求的文章类型这一个角度进行候选资源的过滤,而不从时效以及质量角度进行文章的过滤。
S204、根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数,确定所述候选资源集中待过滤掉的候选资源。
由此可见,本实施例中,通过设置掩码可以灵活设置参与或者不参与所述比对过程,相当于灵活的实现了有选择性的候选资源过滤。
图3为本申请实施例三资源过滤方法流程示意图;如图3所示,其包括:
S301、根据预先定义的资源筛选规则,得到候选资源集,所述候选资源集包括多个候选资源;
S302、根据设定的过滤配置项,确定所述候选资源集中每个候选资源的特征属性参数;
有关上述步骤S301-302可参见上述图1或者图2的记载。
S303、将所述候选资源集包括的每个候选资源的特征属性参数加载正排索引中;
S304、从所述正排索引获取所述候选资源集中每个候选资源的第一特征串;
对于步骤S303、S304来说,由于正排索引中是以候选资源的ID为关键字,索引中记录每个候选资源的第一特征串中比特位的数值,在后续比对时扫描索引中每个候选资源的第一特征串。正排索引的结构比较简单,建立比较方便且易于维护,当过滤维度设置域有变化时,直接对该索引进行维护即可,若是有过滤维度设置域需要被删除,则直接其对应的索引信息,将其直接删除。
当然,在其他实施例中,也可以采用倒排索引,在倒排索引中以字或词为关键字进行索引,表中关键字所对应的记录表项记录了出现这个字或词的候选资源。在进行后续比对时,可以通过一次得到查询关键字所对应的所有候选资源。
S305、根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数的比对结果,确定所述候选资源集中待过滤掉的候选资源。
图4为本申请实施例四资源过滤方法流程示意图;如图4所示,其包括:
S401、根据预先定义的资源筛选规则,得到候选资源集,所述候选资源集包括多个候选资源;
S402、根据设定的过滤配置项,确定所述候选资源集中每个候选资源的特征属性参数;
S403、将所述候选资源集包括的每个候选资源的特征属性参数加载正排索引中;
S404、从所述正排索引获取所述候选资源集中每个候选资源的第一特征串;
本实施例中,上述步骤S401-S404可参见上述实施例三的记载,详细不再赘述。
S405、确定更新后的所述过滤配置项;
S406、根据更新后的所述过滤配置项,更新所述正排索引中所述候选资源集包括的候选资源的特征属性参数。
本实施例中,与上述实施例不同的是,具体通过过滤配置项的配置来更新候选资源的特征属性参数。过滤配置项具体可以分成多层,比如两层,第一层过滤配置项用于进行定义一级过滤配置,第二层过滤配置项用于定义二级过滤配置,比如,如若候选资源为文章的话,则一级过滤配置包括:文章级别、媒体级别、用户级别和会话级别,每个以及过滤配置下又有所述二级过滤配置,为灵活选择一级过滤配置和二级过滤配置的启动,可以给一级过滤配置和二级过滤配置配置启动组件,从而使得过滤配置项通用于所有的应用场景,当具体应用时,只要针对性的触发启动组件,从而使得对应的过滤配置有效即可,从而最终实现过滤的差异化,提升了新产品和服务的上线速度。
还可以对上述过滤配置进行删除,从而整体上提升了开发效率。
图5为本申请实施例五过滤配置项的设置示意图;如图5所示,配置了一个过滤管理器(filter manager,用于管理所有的过滤配置项目,过滤配置项具体可以分成多层,比如两层,第一层过滤配置项(filter component)用于进行定义一级过滤配置,其数量可以根据场景需求设置为多个;第二层过滤配置项(filter plugin)用于定义二级过滤配置,其数量可以根据场景需求设置为多个。为了灵活启动需要的过滤配置项,对每个过滤配置项设置了一个控制开关,当由于使用场景的不同,即需要启用不同的过滤配置项时,通过启动对应的控制开关启用不同的过滤配置项,从而可以实现利用通用的过滤框架加载不同的过滤配置项,实现差异化的过滤配置。
只需要修改过滤配置并分发,相当于实时调整过滤规则极大提升了时效性,降低了因为过滤策略不及时而带来的脏数据下发的风险,提升了用户体验。
本实施例中,步骤S405、S406可以相对于步骤S401-S404异步执行。
S407、根据搜索请求的特征属性参数与所述正排索引中的每个候选资源的特征属性参数的比对结果,确定所述候选资源集中待过滤掉的候选资源。
上述实施例中,候选资源的特征属性参数可通过离线处理过程得到,该离线处理又可称之为离线打标服务。
图6为本申请实施例五资源过滤装置结构示意图;如图6所示,其包括:
筛选单元601,用于根据预先定义的资源筛选规则,得到候选资源集,所述候选资源集包括多个候选资源;
参数确定单元602,用于根据设定的过滤配置项,确定所述候选资源集中每个候选资源的特征属性参数;
过滤单元603,用于根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数,确定所述候选资源集中待过滤掉的候选资源。
可选地,在本申请的一实施例中,所述每个候选资源的特征属性参数为第一特征串,所述第一特征串包括至少一个第一枚举值。
可选地,在本申请的一实施例中,所述搜索请求的特征属性参数为第二特征串,所述第二特征串包括至少一个第二枚举值。
可选地,在本申请的一实施例中,所述过滤单元603包括:
比对子单元613,用于将所述第二特征串中第二枚举值与所述第一特征串中的第一枚举值按照位的对应关系进行比对;
过滤子单元623,用于将相同比特位上与所述第二枚举值均相等的所述第一枚举值对应的候选资源确定为待过滤掉的候选资源。
图7为本申请实施例七资源过滤装置结构示意图;如图7所示,在包括上述实施例筛选单元601,参数确定单元602,过滤单元603的基础上,还包括:掩码配置单元604,用于为所述第一特征串配置一掩码,所述掩码用于屏蔽所述第二特征串不参与所述比对的第二枚举值。
图8为本申请实施例八资源过滤装置结构示意图;如图8所示,在包括上述实施例筛选单元601,参数确定单元602,过滤单元603的基础上,其还包括:索引单元605,用于将所述候选资源集包括的每个候选资源的特征属性参数加载正排索引中;
对应地,所述过滤单元603进一步用于从所述正排索引获取所述候选资源集中每个候选资源的特征属性参数;根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数的比对结果,确定所述候选资源集中待过滤掉的候选资源。
图9为本申请实施例九中电子设备的结构示意图;该电子设备包括:
一个或多个处理器901;
计算机可读介质902,可以配置为存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任一实施例中所述的过滤方法。
图10为本申请实施例十中电子设备的硬件结构;如图10所示,该电子设备可以包括:处理器1001,通信接口1002,计算机可读介质1003和通信总线1004;
其中处理器1001、通信接口1002、计算机可读介质1003通过通信总线1004完成相互间的通信;
可选的,通信接口1002可以为通信模块的接口,如GSM模块的接口;
其中,处理器1001具体可以配置为:根据预先定义的资源筛选规则,得到候选资源集,所述候选资源集包括多个候选资源;根据设定的过滤配置项,确定所述候选资源集中每个候选资源的特征属性参数;根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数,确定所述候选资源集中待过滤掉的候选资源处理器1001可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含配置为执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(CPU)执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读介质例如可以但不限于是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储介质(RAM)、只读存储介质(ROM)、可擦式可编程只读存储介质(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储介质(CD-ROM)、光存储介质件、磁存储介质件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输配置为由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写配置为执行本申请的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络:包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个配置为实现规定的逻辑功能的可执行指令。上述具体实施例中有特定先后关系,但这些先后关系只是示例性的,在具体实现的时候,这些步骤可能会更少、更多或执行顺序有调整。即在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括:
筛选单元,用于根据预先定义的资源筛选规则,得到候选资源集,所述候选资源集包括多个候选资源;
参数确定单元,用于根据设定的过滤配置项,确定所述候选资源集中每个候选资源的特征属性参数;
过滤单元,用于根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数,确定所述候选资源集中待过滤掉的候选资源。
其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,参数确定单元还可以被描述为“根据设定的过滤配置项,确定所述候选资源集中每个候选资源的特征属性参数的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述任一实施例中所描述的方法。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:根据预先定义的资源筛选规则,得到候选资源集,所述候选资源集包括多个候选资源;根据设定的过滤配置项,确定所述候选资源集中每个候选资源的特征属性参数;根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数,确定所述候选资源集中待过滤掉的候选资源。
需要说明的是,上述实施例中,筛选单元又可以称之为第一程序单元,参数确定单元又可以称之为第二程序单元,筛选单元又可以称之为第三程序单元。
在本公开的各种实施方式中所使用的表述“第一”、“第二”、“所述第一”或“所述第二”可修饰各种部件而与顺序和/或重要性无关,但是这些表述不限制相应部件。以上表述仅配置为将元件与其它元件区分开的目的。例如,第一用户设备和第二用户设备表示不同的用户设备,虽然两者均是用户设备。例如,在不背离本公开的范围的前提下,第一元件可称作第二元件,类似地,第二元件可称作第一元件。
当一个元件(例如,第一元件)称为与另一元件(例如,第二元件)“(可操作地或可通信地)联接”或“(可操作地或可通信地)联接至”另一元件(例如,第二元件)或“连接至”另一元件(例如,第二元件)时,应理解为该一个元件直接连接至该另一元件或者该一个元件经由又一个元件(例如,第三元件)间接连接至该另一个元件。相反,可理解,当元件(例如,第一元件)称为“直接连接”或“直接联接”至另一元件(第二元件)时,则没有元件(例如,第三元件)插入在这两者之间。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (15)

1.一种资源过滤方法,其特征在于,包括:
根据预先定义的资源筛选规则,得到候选资源集,所述候选资源集包括多个候选资源;
根据设定的过滤配置项,确定所述候选资源集中每个候选资源的特征属性参数;
根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数,确定所述候选资源集中待过滤掉的候选资源。
2.根据权利要求1中所述的方法,其特征在于,所述每个候选资源的特征属性参数为第一特征串,所述第一特征串包括至少一个第一枚举值。
3.根据权利要求2所述的方法,其特征在于,所述搜索请求的特征属性参数为第二特征串,所述第二特征串包括至少一个第二枚举值。
4.根据权利要求3所述的方法,其特征在于,根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数,确定从所述候选资源集中过滤掉的候选资源,包括:
将所述第二特征串中第二枚举值与所述第一特征串中的第一枚举值按照位的对应关系进行比对;
将相同比特位上与所述第二枚举值均相等的所述第一枚举值对应的候选资源确定为待过滤掉的候选资源。
5.根据权利要求4所述的方法,其特征在于,还包括:为所述第一特征串配置一掩码,所述掩码用于屏蔽所述第二特征串不参与所述比对的第二枚举值。
6.根据权利要求1所述的方法,其特征在于,还包括:将所述候选资源集包括的每个候选资源的特征属性参数加载正排索引中;
对应地,根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数,确定所述候选资源集中待过滤掉的候选资源,包括:从所述正排索引获取所述候选资源集中每个候选资源的特征属性参数;
根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数的比对结果,确定所述候选资源集中待过滤掉的候选资源。
7.根据权利要求1所述的方法,其特征在于,还包括:
确定更新后的所述过滤配置项;
根据更新后的所述过滤配置项,更新所述正排索引中所述候选资源集包括的候选资源的特征属性参数。
8.一种资源过滤装置,其特征在于,包括:
筛选单元,用于根据预先定义的资源筛选规则,得到候选资源集,所述候选资源集包括多个候选资源;
参数确定单元,用于根据设定的过滤配置项,确定所述候选资源集中每个候选资源的特征属性参数;
过滤单元,用于根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数,确定所述候选资源集中待过滤掉的候选资源。
9.根据权利要求8中所述的装置,其特征在于,所述每个候选资源的特征属性参数为第一特征串,所述第一特征串包括至少一个第一枚举值。
10.根据权利要求9所述的装置,其特征在于,所述搜索请求的特征属性参数为第二特征串,所述第二特征串包括至少一个第二枚举值。
11.根据权利要求10所述的装置,其特征在于,所述过滤单元包括:
比对子单元,用于将所述第二特征串中第二枚举值与所述第一特征串中的第一枚举值按照位的对应关系进行比对;
过滤子单元,用于将相同比特位上与所述第二枚举值均相等的所述第一枚举值对应的候选资源确定为待过滤掉的候选资源。
12.根据权利要求11所述的装置,其特征在于,还包括:掩码配置单元,用于为所述第一特征串配置一掩码,所述掩码用于屏蔽所述第二特征串不参与所述比对的第二枚举值。
13.根据权利要求8所述的装置,其特征在于,还包括:索引单元,用于将所述候选资源集包括的每个候选资源的特征属性参数加载正排索引中;
对应地,所述过滤单元进一步用于从所述正排索引获取所述候选资源集中每个候选资源的特征属性参数;根据搜索请求的特征属性参数与所述每个候选资源的特征属性参数的比对结果,确定所述候选资源集中待过滤掉的候选资源。
14.一种电子设备,包括:
一个或多个处理器;
计算机可读介质,配置为存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
15.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN201811056079.4A 2018-09-11 2018-09-11 资源过滤方法及其装置、电子设备、计算机可读介质 Active CN109063199B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811056079.4A CN109063199B (zh) 2018-09-11 2018-09-11 资源过滤方法及其装置、电子设备、计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811056079.4A CN109063199B (zh) 2018-09-11 2018-09-11 资源过滤方法及其装置、电子设备、计算机可读介质

Publications (2)

Publication Number Publication Date
CN109063199A true CN109063199A (zh) 2018-12-21
CN109063199B CN109063199B (zh) 2022-10-25

Family

ID=64761244

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811056079.4A Active CN109063199B (zh) 2018-09-11 2018-09-11 资源过滤方法及其装置、电子设备、计算机可读介质

Country Status (1)

Country Link
CN (1) CN109063199B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1529863A (zh) * 2001-07-16 2004-09-15 �ʼҷ����ֵ������޹�˾ 个性化网络浏览过滤器
CN101741821A (zh) * 2008-11-07 2010-06-16 华为技术有限公司 一种实现包过滤的方法、媒体网关及系统
CN102314463A (zh) * 2010-07-07 2012-01-11 北京瑞信在线系统技术有限公司 分布式爬虫系统及其提取网页数据的方法
CN102456004A (zh) * 2010-10-18 2012-05-16 金蝶软件(中国)有限公司 一种页面数据查询控制方法及系统
CN102567413A (zh) * 2010-12-31 2012-07-11 中国银联股份有限公司 数据过滤系统和方法
CN104021178A (zh) * 2014-06-04 2014-09-03 深圳市腾讯计算机系统有限公司 多媒体信息过滤方法和装置
CN104462104A (zh) * 2013-09-16 2015-03-25 华为软件技术有限公司 过滤方法和服务器
CN105635821A (zh) * 2015-12-30 2016-06-01 北京奇艺世纪科技有限公司 一种视频过滤方法及装置
CN105843918A (zh) * 2016-03-25 2016-08-10 前锦网络信息技术(上海)有限公司 一种从职位数据库中快速筛选职位的方法
CN108062418A (zh) * 2018-01-05 2018-05-22 北京奇艺世纪科技有限公司 一种数据搜索方法、装置及服务器
CN108431796A (zh) * 2016-04-29 2018-08-21 华为技术有限公司 分布式资源管理系统和方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1529863A (zh) * 2001-07-16 2004-09-15 �ʼҷ����ֵ������޹�˾ 个性化网络浏览过滤器
CN101741821A (zh) * 2008-11-07 2010-06-16 华为技术有限公司 一种实现包过滤的方法、媒体网关及系统
CN102314463A (zh) * 2010-07-07 2012-01-11 北京瑞信在线系统技术有限公司 分布式爬虫系统及其提取网页数据的方法
CN102456004A (zh) * 2010-10-18 2012-05-16 金蝶软件(中国)有限公司 一种页面数据查询控制方法及系统
CN102567413A (zh) * 2010-12-31 2012-07-11 中国银联股份有限公司 数据过滤系统和方法
CN104462104A (zh) * 2013-09-16 2015-03-25 华为软件技术有限公司 过滤方法和服务器
CN104021178A (zh) * 2014-06-04 2014-09-03 深圳市腾讯计算机系统有限公司 多媒体信息过滤方法和装置
CN105635821A (zh) * 2015-12-30 2016-06-01 北京奇艺世纪科技有限公司 一种视频过滤方法及装置
CN105843918A (zh) * 2016-03-25 2016-08-10 前锦网络信息技术(上海)有限公司 一种从职位数据库中快速筛选职位的方法
CN108431796A (zh) * 2016-04-29 2018-08-21 华为技术有限公司 分布式资源管理系统和方法
CN108062418A (zh) * 2018-01-05 2018-05-22 北京奇艺世纪科技有限公司 一种数据搜索方法、装置及服务器

Also Published As

Publication number Publication date
CN109063199B (zh) 2022-10-25

Similar Documents

Publication Publication Date Title
US11442935B2 (en) Determining a record generation estimate of a processing task
US11321321B2 (en) Record expansion and reduction based on a processing task in a data intake and query system
US11341131B2 (en) Query scheduling based on a query-resource allocation and resource availability
US11586627B2 (en) Partitioning and reducing records at ingest of a worker node
US11599541B2 (en) Determining records generated by a processing task of a query
US11615087B2 (en) Search time estimate in a data intake and query system
US11494380B2 (en) Management of distributed computing framework components in a data fabric service system
US20190272271A1 (en) Assigning processing tasks in a data intake and query system
US20190310977A1 (en) Bucket data distribution for exporting data to worker nodes
US20200050586A1 (en) Query execution at a remote heterogeneous data store of a data fabric service
US20200050607A1 (en) Reassigning processing tasks to an external storage system
US20200065303A1 (en) Addressing memory limits for partition tracking among worker nodes
US20200050612A1 (en) Supporting additional query languages through distributed execution of query engines
US20190147084A1 (en) Distributing partial results from an external data system between worker nodes
US10936983B2 (en) Optimized menu planning
CN109634598A (zh) 一种页面显示方法、装置、设备及存储介质
CN107766547A (zh) 电子书推荐方法、电子设备及计算机存储介质
US20140052645A1 (en) Multi-channel customer support and service
CN109815389A (zh) 应用规则引擎的节点匹配方法、装置以及计算机设备
CN107004008A (zh) 使用对不同的数据存储位置的自动化查询的相关文件识别
CN106911757A (zh) 一种业务信息的推送方法和装置
CN106415627A (zh) 日历事件外围视图
CN109725989B (zh) 一种任务执行的方法及装置
CN109063157A (zh) 资源推荐方法及其装置、设备/终端/服务器、计算机可读介质
CN104991778B (zh) 基于树形结构的过滤方法与装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200605

Address after: 310051 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 510627 Guangdong city of Guangzhou province Whampoa Tianhe District Road No. 163 Xiping Yun Lu Yun Ping square B radio tower 12 layer self unit 01

Applicant before: GUANGZHOU SHENMA MOBILE INFORMATION TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room 554, 5 / F, building 3, 969 Wenyi West Road, Wuchang Street, Yuhang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: Room 508, 5 / F, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant before: Alibaba (China) Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20221008

Address after: 100193 A706, Floor 7, Block A, Building B-6, Zhongguancun Dongsheng Science Park, 66 Xixiaokou Road, Haidian District, Beijing

Applicant after: UC MOBILE Co.,Ltd.

Address before: Room 554, 5 / F, building 3, 969 Wenyi West Road, Wuchang Street, Yuhang District, Hangzhou City, Zhejiang Province

Applicant before: Alibaba (China) Co.,Ltd.

GR01 Patent grant
GR01 Patent grant