CN113434270A - 数据资源调度方法、装置、电子设备及存储介质 - Google Patents

数据资源调度方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113434270A
CN113434270A CN202110662487.XA CN202110662487A CN113434270A CN 113434270 A CN113434270 A CN 113434270A CN 202110662487 A CN202110662487 A CN 202110662487A CN 113434270 A CN113434270 A CN 113434270A
Authority
CN
China
Prior art keywords
data
participating node
granularity
sieving
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110662487.XA
Other languages
English (en)
Other versions
CN113434270B (zh
Inventor
刘伟
王鹏
张博
林赛群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202110662487.XA priority Critical patent/CN113434270B/zh
Publication of CN113434270A publication Critical patent/CN113434270A/zh
Application granted granted Critical
Publication of CN113434270B publication Critical patent/CN113434270B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开公开了一种数据资源调度方法、装置、电子设备及存储介质,涉及数据处理领域,具体涉及智能搜索、信息流领域。具体实现方案为:通过获取数据传输链路上需要对数据过筛的至少一个第一参与节点在各个粒度下的数据过筛率;根据每个第一参与节点在各个粒度下的数据过筛率,调度传输至第一参与节点的数据资源。本申请根据过筛率可以对节点的数据资源进行配额动态调整,可以提高优质资源覆盖,降低垃圾资源浪费。

Description

数据资源调度方法、装置、电子设备及存储介质
技术领域
本公开涉及数据处理领域,具体进一步涉及智能搜索、信息流领域。
背景技术
互联网存在海量的数据,同时每天在不断生产新的数据,搜索引擎需要覆盖全网所有数据,但实际资源有限,需要高优先级覆盖优质和高价值的内容,相关技术中,在解决覆盖的资源使用的配额问题时,一般采用各自环节对配额权益进行独立计算的方法,此方法会出现配额权益设置不合理,浪费资源等问题。
发明内容
本公开提供了一种数据资源调度方法、装置、电子设备及存储介质,根据过筛率可以对节点的数据资源进行配额动态调整,可以提高优质资源覆盖,降低垃圾资源浪费。
根据本公开的一方面,提供了一种数据资源调度方法。
根据本公开的另一方面,提供了一种数据资源调度装置。
根据本公开的另一方面,提供了一种电子设备。
根据本公开的另一方面,提供了一种计算机可读存储介质。
根据本公开的另一方面,提供了一种计算机程序产品。
为达上述目的,本公开第一方面实施例提出了一种数据资源调度方法,包括:获取数据传输链路上需要对数据过筛的至少一个第一参与节点在各个粒度下的数据过筛率;根据每个所述第一参与节点在各个粒度下的数据过筛率,调度传输至所述第一参与节点的数据资源。本申请根据过筛率可以对节点的数据资源进行配额动态调整,可以提高优质资源覆盖,降低垃圾资源浪费。
为达上述目的,本公开第二方面实施例提出了一种数据资源调度装置,包括:数据过筛率获取模块,用于获取数据传输链路上需要对数据过筛的至少一个第一参与节点在各个粒度下的数据过筛率;数据资源获取模块,用于根据每个所述第一参与节点在各个粒度下的数据过筛率,调度传输至所述第一参与节点的数据资源。本申请根据过筛率可以对节点的数据资源进行配额动态调整,可以提高优质资源覆盖,降低垃圾资源浪费。
为达上述目的,本公开第三方面实施例提出了一种电子设备,包括存储器、处理器。所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以实现如本公开第一方面实施例所述的数据资源调度方法。
为达上述目的,本公开第四方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于实现如本公开第一方面实施例所述的数据资源调度方法。
为达上述目的,本公开第五方面实施例提出了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时以实现如本公开第一方面实施例所述的数据资源调度方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开一实施例的数据资源调度方法的示意图;
图2是根据本公开一实施例的全链路的示意图;
图3是根据本公开一实施例的调度传输至第一参与节点的数据资源的示意图;
图4是根据本公开一实施例的对数据资源配额进行调整的示意图;
图5是根据本公开一实施例的获取数据过筛率的示意图;
图6是根据本公开一实施例的对数据过筛率进行归一化处理的示意图;
图7是根据本公开一实施例的数据资源调度方法的总体示意图;
图8是根据本公开一实施例的数据资源调度装置的示意图;
图9是根据本公开一实施例的电子设备的示意图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
智能搜索引擎是结合了人工智能技术的新一代搜索引擎。他除了能提供传统的快速检索、相关度排序等功能,还能提供用户角色登记、用户兴趣自动识别、内容的语义理解、智能信息化过滤和推送等功能。
大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
信息流有广义和狭义两种。广义指在空间和时间上向同一方向运动过程中的一组信息,它们有共同的信息源和信息的接收者,即由一个信息源向另一个单位传递的全部信息的集合。狭义指信息的传递运动,这种传递运动是在现代信息技术研究、发展、应用的条件中,信息按照一定要求通过一定渠道进行的。
图1是本公开一实施例的数据资源调度方法的流程示意图。如图1所示,该数据资源调度方法,包括以下步骤:
S101,获取数据传输链路上需要对数据过筛的至少一个第一参与节点在各个粒度下的数据过筛率。
为了清楚描述搜索引擎从海量数据中抓取高价值的优质数据展现给客户的过程,本申请实施例提出一种从全网抓取数据到将数据展现给用户整个过程涉及的节点,所有的节点形成数据传输链路,此处可以称为全链路。图2是一种全链路的示意图,如图2所示,全链路的过程为将全网数据经由调度抓取传输至链接库,将链接库中的数据经由过筛选取数据后传输给网页库,将网页库中的数据经由过筛选取数据后传输给索引库,将索引库中的数据经由过筛选取数据后传输给展现端,从而可以将数据展现给用户。其中,过筛指的是全链路各环节将上游节点的数据经过筛选,传输至下游相邻节点。
本申请实施例中,将需要对数据进行过筛的节点作为第一参与节点,第一参与节点至少有一个。可选地,如图2所示,第一参与节点可包括链接库、网页库和索引库。其中,每个第一参与节点都包括多个对数据进行筛选的粒度。可选地,多个粒度可包括域名粒度、站点粒度、目录粒度和正则粒度中的一个或多个。
本申请实施例中,计算每个第一参与节点在各个粒度下的数据过筛率。其中,每个第一参与节点在各个粒度下的数据过筛率为上游第一参与节点的粒度数据量与其下游相邻的参与节点对应的的粒度数据量的比值。
继续以图2为例,第一参与节点为链接库,则链接库的过筛率为网页库各粒度的数据量分别与链接库其对应的各粒度的数据量的比值;第一参与节点为索引库,则索引库的过筛率为索引库各粒度的数据量分别与网页库其对应的各粒度的数据量的比值;第一参与节点为展现端,则展现端的过筛率为展现端各粒度的数据量分别与索引库其对应的各粒度的数据量的比值。
S102,根据每个第一参与节点在各个粒度下的数据过筛率,调度传输至第一参与节点的数据资源。
每个第一参与节点在各个粒度下的数据过筛率,即表示该第一参与节点对应的粒度通过的数据比例,比如说,若链接库节点到网页库节点的域名粒度的过筛率为95%,则意味着有95%的链接库节点的域名粒度数据能传输至网页库,其他第一参与节点的各粒度的过筛率的意义与之相似。在确定每个第一参与节点在各个粒度下的数据过筛率后,便可根据该过筛率,从每个第一参与节点对应的粒度数据中选取对应比例的数据资源,并传输至下个相邻的参与节点。可选地,为了保证满足下游节点的数据搜索需求,需要根据每个第一参与节点在各个粒度下的数据过筛率,判断是否需要对该参与节点的粒度数据进行增加或者降低。
本申请实施例提出了一种数据资源调度方法,通过获取数据传输链路上需要对数据过筛的至少一个第一参与节点在各个粒度下的数据过筛率;根据每个第一参与节点在各个粒度下的数据过筛率,调度传输至第一参与节点的数据资源。本申请根据过筛率可以对节点的数据资源进行配额动态调整,可以提高优质资源覆盖,降低垃圾资源浪费。
图3是本公开一实施例的数据资源调度方法的流程示意图。如图3所示,在上述实施例基础之上,根据每个第一参与节点在各个粒度下的数据过筛率,调度传输至第一参与节点的数据资源,包括以下步骤:
S301,根据每个第一参与节点在各个粒度下的数据过筛率,对每个第一参与节点的数据资源配额进行调整,以确定第一参与节点的目标数据资源配额。
每个第一参与节点在各个粒度下的数据过筛率,即表示该第一参与节点对应的粒度通过的数据比例,在一些调度场景下,第一参与节点的数据过筛率可能存在不能满足下游参与节点的需求,例如数据搜索需求,为了保证满足数据搜索需求,可以根据每个第一参与节点在各个粒度下的数据过筛率,对每个第一参与节点的数据资源配额进行调整,例如可以综合考虑各个粒度下的数据过筛率对数据资源配额进行调整,再例如,可以根据每个粒度下的数据过筛率,对每个粒度下的数据资源配额进行调整。可选地,可以将数据过筛率与一个过筛阈值进行比较,在小于过筛阈值时说明数据资源被过滤的量较大,为了满足后续节点的数据搜索需求,可以升高第一参与节点的数据资源配额,使得第一参与节点的数据资源可以较多的流向下游数据节点。在数据过筛率在大于过筛阈值时说明数据资源通过的量较大,为了节省后续节点的能耗,可以降低第一参与节点的数据资源配额。可选地,将调整后的第一参与节点的数据资源配额,作为第一参与节点的目标数据资源配额。
举例说明,若第一参与节点的过筛率为80%,已有的数据资源配额为1000条,则该第一参与节点通过过筛后有800条的数据资源从该第一参与节点流向下游相邻参与节点,若下游相邻参与节点需要的数据搜索量为900条,为了使该第一参与节点通过900条流向下游相邻参与节点,在过筛率不变的情况,需要调整该第一参与节点的配额为1125条,即1125条就是该第一参与节点的目标资源配额。
S302,根据目标数据资源配额,调度传输至第一参与节点的数据资源。
根据第一参与节点的目标数据资源配额,对该第一参与节点的数据资源进行增加或者减少,将该目标数据资源配额对应的数据资源传输至下个相邻的参与节点。
本申请根据过筛率可以对节点的数据资源进行配额动态调整,可以提高优质资源覆盖,降低垃圾资源浪费。
图4是本公开一实施例的数据资源调度方法的流程示意图。在上述实施例基础之上,如图4所示,根据每个第一参与节点在各个粒度下的数据过筛率,对每个第一参与节点的数据资源配额进行调整,包括以下步骤:
S401,针对每个第一参与节点,对第一参与节点在各个粒度下的数据过筛率进行加权,确定第一参与节点的过筛得分。
可选地,每个第一参与节点可对应四个粒度,每个粒度都对应一个数据过筛率,对该第一参与节点的每个粒度的数据过筛率赋予权重值。根据每个第一参与节点各个粒度的过筛率和其对应的权重值,对该第一参与节点各个粒度下的数据过筛率进行加权,确定第一参与节点的过筛得分。
作为一种可实现的方式,在对第一参与节点在各个粒度下的数据过筛率进行加权时,可将各粒度的权重分别与其对应的过筛率进行相乘并求和,最后映射到sigmoid函数中,将得到的函数值作为第一参与节点的过筛得分。
作为另一种可实现的方式,以第一参与节点为链接库为例,若其对应的域名粒度、站点粒度、目录粒度和正则粒度的数据过筛率都为10%,对域名粒度、站点粒度、目录粒度和正则粒度的数据过筛率配置的权重都为0.25,则将各粒度的权重分别与其对应的过筛率进行相乘并求和,将得到的分值以百分制形式表现出来,即该第一参与节点的过筛得分为10分。其中,第一参与节点的各个粒度的权重之和为1。
S402,根据所有的第一参与节点的过筛得分,确定一个临界过筛得分。
分别根据上述加权方法计算出上述链接库节点、网页库节点和索引库节点的过筛得分,并对所有的过筛得分进行排序,根据排序结果,确定中间顺序对应的过筛得分,将中间顺序对应的过筛得分,确定为临界过筛得分。
作为一种可实现的方式,以链接库节点、网页库节点和索引库节点的过筛得分分别为10分、30分、20分为例,并对所有的过筛得分进行排序,即排序结果为链接库节点、索引库节点、网页库节点,其对应的筛选得分顺序为10分、20分、30分。将中间顺序对应的过筛得分,确定为临界过筛得分,即将索引库节点对应的20分的过筛得分,确定为临界过筛得分。
S403,将每个第一参与节点的过筛得分和临界过筛得分进行比较。
将每个第一参与节点的过筛得分与所确定的临界过筛得分进行比较,判断其数值之间的大小关系。
S404,响应于过筛得分大于临界过筛得分,升高第一参与节点的数据资源配额。
作为一种可实现的方式,若某个第一参与节点的过筛得分大于临界过筛得分,则说明该第一参与节点的过筛率较好,为了使筛选出来的数据是优质的数据,升高该第一参与节点的数据资源配额。
作为另一种可实现的方式,若某个第一参与节点的过筛得分大于临界过筛得分,且第一参与节点的已有数据资源配额小于第一设定值,说明其配额较自身整体数量比例较少,为了使筛选出来的数据是优质的数据,则升高该第一参与节点的数据资源配额。其中,第一设定值为各个参与节点中数据资源配额的最大值。举例说明,若链接库节点的过筛得分为90分,意味着该第一参与节点的过筛效果比较好,为了使筛选出来的数据是优质的数据,升高该第一参与节点的数据资源配额,使用过该第一参与节点的数据更多更优质。
S405,响应于过筛得分小于或者等于临界过筛得分,降低第一参与节点的数据资源配额。
作为一种可实现的方式,若某个第一参与节点的过筛得分小于或者等于临界过筛得分,则说明该第一参与节点的过筛率较为不好,为了使筛选出来的数据是优质的数据,降低该第一参与节点的数据资源配额。
作为另一种可实现的方式,若某个第一参与节点的过筛得分小于或者等于临界过筛得分,且第一参与节点的已有数据资源配额大于或者等于第二设定值,说明其数据配额较自身整体数量比例较大,而过筛得分小于或者等于临界过筛得分,说明该第一参与节点处的过筛效果不太好,若分配给该第一参与节点更多的数据,其筛选出来的数据会较差,为了使筛选出来的数据是优质的数据,则降低该第一参与节点的数据资源配额。其中,第二设定值为各个参与节点中数据资源配额的最大值。
本申请对第一参与节点在各个粒度下的数据过筛率进行加权,确定第一参与节点的过筛得分,基于得分和临界过筛得分的比较,对过筛效果进行评价,对于得分评价高的第一参与节点,升高该第一参与节点的数据资源配额;对于评价低的第一参与节点,降低该第一参与节点的数据资源配额,以使得可以对节点的数据资源进行配额动态调整,可以提高优质资源覆盖,降低垃圾资源浪费。
图5是本公开一实施例的数据资源调度方法的流程示意图。如图5所示,在上述实施例基础之上,获取数据传输链路上需要对数据过筛的至少一个第一参与节点在各个粒度下的数据过筛率,包括以下步骤:
S501,获取数据传输链路上每个第一参与节点在各个粒度下的数据量。
如图2所示,第一参与节点可包括链接库、网页库和索引库。其中,每个第一参与节点都包括4个粒度,分别为域名粒度,记为Domain;站点粒度,记为Site;目录粒度,记为Dir;正则粒度,记为Pattern。对全链路各环节数据进行粒度处理,分别统计在链接库该4个粒度分别对应的链接量、在网页库该4个粒度分别对应的网页量、在索引库该4个粒度分别对应的分层量、在展现端该4个粒度分别对应的展现量。其中,链接量、网页量、分层量和展现量都可以理解为该节点数据的数量。
S502,针对每个第一参与节点,获取处于第一参与节点下游的相邻参与节点,并根据相邻参与节点在任一粒度下的数据量与第一参与节点在任一粒度下的数据量,确定任一粒度下的数据过筛率。
计算每个第一参与节点在各个粒度下的数据过筛率,可得到12个过筛率数据。其中,每个第一参与节点在各个粒度下的数据过筛率为上游第一参与节点的粒度数据量与其下游相邻的第一个参与节点的粒度数据量的比值。其中,12个过筛率数据包括网页库各粒度的数据量分别与链接库其对应的各粒度的数据量的比值,索引库各粒度的数据量分别与网页库其对应的各粒度的数据量的比值,展现端各粒度的数据量分别与索引库其对应的各粒度的数据量的比值。
本申请通过对过筛率的计算,方便后续对节点的数据资源进行配额动态调整,可以提高优质资源覆盖,降低垃圾资源浪费。
图6是本公开一实施例的数据资源调度方法的流程示意图。如图6所示,对第一参与节点在各个粒度下的数据过筛率进行加权,确定第一参与节点的过筛得分之前,包括以下步骤:
S601,从每个参与节点在任一粒度下的数据过筛率中,确定任一粒度的最大数据过筛率和最小数据过筛率。
对每个参与节点在任一粒度下的数据过筛率进行统计,获取此粒度的所有数据过筛率,从而从此粒度的所有数据过筛率中确定该粒度的最大数据过筛率和最小数据过筛率。可选地,统计区间可为一个设定时间段内或者设定次数内。
S602,根据每个参与节点在任一粒度下的数据过筛率,确定任一粒度的平均数据过筛率。
对每个参与节点在任一粒度下的数据过筛率进行统计,获取此粒度的所有数据过筛率,从而通过求平均数获取该粒度的平均数据过筛率。可选地,统计区间可为一个设定时间段内或者设定次数内。
S603,根据最大数据过筛率、最小数据过筛率和平均数据过筛率,对每个参与节点在任一粒度下的数据过筛率进行归一化处理。
根据上述获得的最大数据过筛率、最小数据过筛率和平均数据过筛率,对每个参与节点在任一粒度下的数据过筛率进行归一化处理。其中,对每个参与节点在任一粒度下的数据过筛率进行归一化处理的公式如下:
S=(value-avg)/(max-min)
式中,S代表归一化处理的值,value代表该粒度当前数据过筛率,avg代表该粒度平均数据过筛率,max代表该粒度最大数据过筛率,min代表该粒度最小数据过筛率。
本申请通过对过筛率进行归一化处理,方便后续对节点的数据资源进行配额动态调整,可以提高优质资源覆盖,降低垃圾资源浪费。
图7是本公开一实施例的数据资源调度方法的总体流程示意图。如图7所示,该数据资源调度方法,包括以下步骤:
S701,获取数据传输链路上每个参与节点在各个粒度下的数据量。
S702,针对每个第一参与节点,获取处于第一参与节点下游的相邻参与节点,并根据相邻参与节点在任一粒度下的数据量与第一参与节点在任一粒度下的数据量,确定任一粒度下的数据过筛率。
关于步骤S701~S702,上述实施例已做具体介绍,在此不再进行赘述。
S703,从每个参与节点在任一粒度下的数据过筛率中,确定任一粒度的最大数据过筛率和最小数据过筛率。
S704,根据每个参与节点在任一粒度下的数据过筛率,确定任一粒度的平均数据过筛率。
S705,根据最大数据过筛率、最小数据过筛率和平均数据过筛率,对每个参与节点在任一粒度下的数据过筛率进行归一化处理。
关于步骤S703~S705,上述实施例已做具体介绍,在此不再进行赘述。
S706,针对每个第一参与节点,对第一参与节点在各个粒度下的数据过筛率进行加权,确定第一参与节点的过筛得分。
S707,对所有的第一参与节点的过筛得分进行排序,根据排序结果,确定中间顺序对应的过筛得分。
S708,将中间顺序对应的过筛得分,确定为临界过筛得分。
S709,将每个第一参与节点的过筛得分和临界过筛得分进行比较。
S710,响应于过筛得分大于临界过筛得分,升高第一参与节点的数据资源配额。
S711,响应于过筛得分小于或者等于临界过筛得分,降低第一参与节点的数据资源配额。
关于步骤S706~S711,上述实施例已做具体介绍,在此不再进行赘述。
S712,根据目标数据资源配额,调度传输至第一参与节点的数据资源。
本申请实施例提出了一种数据资源调度方法,通过获取数据传输链路上需要对数据过筛的至少一个第一参与节点在各个粒度下的数据过筛率;根据每个第一参与节点在各个粒度下的数据过筛率,调度传输至第一参与节点的数据资源。本申请根据过筛率可以对节点的数据资源进行配额动态调整,可以提高优质资源覆盖,降低垃圾资源浪费。
图8是本公开一实施例的数据资源调度装置的示意图。如图8所示,该数据资源调度装置800,包括数据过筛率获取模块81和数据资源获取模块82,其中:
数据过筛率获取模块81,用于获取数据传输链路上需要对数据过筛的至少一个第一参与节点在各个粒度下的数据过筛率;
数据资源获取模块82,用于根据每个第一参与节点在各个粒度下的数据过筛率,调度传输至第一参与节点的数据资源。
本申请实施例提出了一种数据资源调度装置,通过获取数据传输链路上需要对数据过筛的至少一个第一参与节点在各个粒度下的数据过筛率;根据每个第一参与节点在各个粒度下的数据过筛率,调度传输至第一参与节点的数据资源。本申请根据过筛率可以对节点的数据资源进行配额动态调整,可以提高优质资源覆盖,降低垃圾资源浪费。
进一步地,数据资源获取模块82,还用于:根据每个第一参与节点在各个粒度下的数据过筛率,对每个第一参与节点的数据资源配额进行调整,以确定第一参与节点的目标数据资源配额;根据目标数据资源配额,调度传输至第一参与节点的数据资源。
进一步地,数据资源获取模块82,还用于:针对每个第一参与节点,对第一参与节点在各个粒度下的数据过筛率进行加权,确定第一参与节点的过筛得分;根据所有的第一参与节点的过筛得分,确定一个临界过筛得分;将每个第一参与节点的过筛得分和临界过筛得分进行比较;响应于过筛得分大于临界过筛得分,升高第一参与节点的数据资源配额;或者,响应于过筛得分小于或者等于临界过筛得分,降低第一参与节点的数据资源配额。
进一步地,数据资源获取模块82,还用于:对所有的第一参与节点的过筛得分进行排序,根据排序结果,确定中间顺序对应的过筛得分;将中间顺序对应的过筛得分,确定为临界过筛得分。
进一步地,数据资源获取模块82,还用于:响应于过筛得分大于临界过筛得分,且第一参与节点的已有数据资源配额小于第一设定值,则升高第一参与节点的数据资源配额;或者,响应于过筛得分小于或者等于临界过筛得分,且第一参与节点的已有数据资源配额大于或者等于第二设定值,降低第一参与节点的数据资源配额。
进一步地,数据过筛率获取模块81,还用于:获取数据传输链路上每个第一参与节点在各个粒度下的数据量;针对每个第一参与节点,获取处于第一参与节点下游的相邻参与节点,并根据相邻参与节点在任一粒度下的数据量与第一参与节点在任一粒度下的数据量,确定任一粒度下的数据过筛率。
进一步地,数据资源获取模块82,还用于:从每个参与节点在任一粒度下的数据过筛率中,确定任一粒度的最大数据过筛率和最小数据过筛率;根据每个参与节点在任一粒度下的数据过筛率,确定任一粒度的平均数据过筛率;根据最大数据过筛率、最小数据过筛率和平均数据过筛率,对每个参与节点在任一粒度下的数据过筛率进行归一化处理。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图9所示,设备900包括计算单元901,其可以根据存储在只读存储器(ROM)902中的计算机程序或者从存储单元908加载到随机访问存储器(RAM)903中的计算机程序,来执行各种适当的动作和处理。在RAM 903中,还可存储设备900操作所需的各种程序和数据。计算单元901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。
设备900中的多个部件连接至I/O接口905,包括:输入单元906,例如键盘、鼠标等;输出单元907,例如各种类型的显示器、扬声器等;存储单元908,例如磁盘、光盘等;以及通信单元909,例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理,例如数据资源调度方法。例如,在一些实施例中,数据资源调度方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元908。在一些实施例中,计算机程序的部分或者全部可以经由ROM 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到RAM 903并由计算单元901执行时,可以执行上文描述的数据资源调度方法的一个或多个步骤。备选地,在其他实施例中,计算单元901可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行数据资源调度方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网和区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务端可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务(“Virtual Private Server”,或简称“VPS”)中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (17)

1.一种数据资源调度方法,包括:
获取数据传输链路上需要对数据过筛的至少一个第一参与节点在各个粒度下的数据过筛率;
根据每个所述第一参与节点在各个粒度下的数据过筛率,调度传输至所述第一参与节点的数据资源。
2.根据权利要求1所述的方法,其中,所述根据每个所述第一参与节点在各个粒度下的数据过筛率,调度传输至所述第一参与节点的数据资源,包括:
根据每个所述第一参与节点在各个粒度下的数据过筛率,对每个所述第一参与节点的数据资源配额进行调整,以确定所述第一参与节点的目标数据资源配额;
根据所述目标数据资源配额,调度传输至所述第一参与节点的数据资源。
3.根据权利要求1或2任一项所述的方法,其中,所述根据每个所述第一参与节点在各个粒度下的数据过筛率,对每个所述第一参与节点的数据资源配额进行调整,包括:
针对每个所述第一参与节点,对所述第一参与节点在各个粒度下的所述数据过筛率进行加权,确定所述第一参与节点的过筛得分;
根据所有的所述第一参与节点的所述过筛得分,确定一个临界过筛得分;
将每个所述第一参与节点的所述过筛得分和所述临界过筛得分进行比较;
响应于所述过筛得分大于所述临界过筛得分,升高所述第一参与节点的数据资源配额;或者,
响应于所述过筛得分小于或者等于所述临界过筛得分,降低所述第一参与节点的数据资源配额。
4.根据权利要求3所述的方法,其中,所述根据所有的所述第一参与节点的所述过筛得分,确定一个临界过筛得分,包括:
对所有的所述第一参与节点的所述过筛得分进行排序,根据所述排序结果,确定中间顺序对应的所述过筛得分;
将所述中间顺序对应的所述过筛得分,确定为所述临界过筛得分。
5.根据权利要求3所述的方法,其中,所述方法还包括:
响应于所述过筛得分大于所述临界过筛得分,且所述第一参与节点的已有数据资源配额小于第一设定值,则升高所述第一参与节点的数据资源配额;或者,
响应于所述过筛得分小于或者等于所述临界过筛得分,且所述第一参与节点的已有数据资源配额大于或者等于第二设定值,降低所述第一参与节点的数据资源配额。
6.根据权利要求3所述的方法,其中,所述获取数据传输链路上需要对数据过筛的至少一个第一参与节点在各个粒度下的数据过筛率,包括:
获取所述数据传输链路上每个第一参与节点在各个粒度下的数据量;
针对每个所述第一参与节点,获取处于所述第一参与节点下游的相邻参与节点,并根据所述相邻参与节点在任一粒度下的数据量与所述第一参与节点在所述任一粒度下的数据量,确定所述任一粒度下的所述数据过筛率。
7.根据权利要求6所述的方法,其中,所述对所述第一参与节点在各个粒度下的所述数据过筛率进行加权,确定所述第一参与节点的过筛得分之前,还包括:
从每个所述参与节点在所述任一粒度下的所述数据过筛率中,确定所述任一粒度的最大数据过筛率和最小数据过筛率;
根据每个所述参与节点在所述任一粒度下的所述数据过筛率,确定所述任一粒度的平均数据过筛率;
根据所述最大数据过筛率、所述最小数据过筛率和所述平均数据过筛率,对每个所述参与节点在所述任一粒度下的所述数据过筛率进行归一化处理。
8.一种数据资源调度装置,包括:
数据过筛率获取模块,用于获取数据传输链路上需要对数据过筛的至少一个第一参与节点在各个粒度下的数据过筛率;
数据资源获取模块,用于根据每个所述第一参与节点在各个粒度下的数据过筛率,调度传输至所述第一参与节点的数据资源。
9.根据权利要求8所述的装置,其中,所述数据资源获取模块,还用于:
根据每个所述第一参与节点在各个粒度下的数据过筛率,对每个所述第一参与节点的数据资源配额进行调整,以确定所述第一参与节点的目标数据资源配额;
根据所述目标数据资源配额,调度传输至所述第一参与节点的数据资源。
10.根据权利要求8或9任一项所述的装置,其中,所述数据资源获取模块,还用于:
针对每个所述第一参与节点,对所述第一参与节点在各个粒度下的所述数据过筛率进行加权,确定所述第一参与节点的过筛得分;
根据所有的所述第一参与节点的所述过筛得分,确定一个临界过筛得分;
将每个所述第一参与节点的所述过筛得分和所述临界过筛得分进行比较;
响应于所述过筛得分大于所述临界过筛得分,升高所述第一参与节点的数据资源配额;或者,
响应于所述过筛得分小于或者等于所述临界过筛得分,降低所述第一参与节点的数据资源配额。
11.根据权利要求10所述的装置,其中,所述数据资源获取模块,还用于:
对所有的所述第一参与节点的所述过筛得分进行排序,根据所述排序结果,确定中间顺序对应的所述过筛得分;
将所述中间顺序对应的所述过筛得分,确定为所述临界过筛得分。
12.根据权利要求10所述的装置,其中,其中,所述数据资源获取模块,还用于:
响应于所述过筛得分大于所述临界过筛得分,且所述第一参与节点的已有数据资源配额小于第一设定值,则升高所述第一参与节点的数据资源配额;或者,
响应于所述过筛得分小于或者等于所述临界过筛得分,且所述第一参与节点的已有数据资源配额大于或者等于第二设定值,降低所述第一参与节点的数据资源配额。
13.根据权利要求10所述的装置,其中,其中,所述数据过筛率获取模块,还用于:
获取所述数据传输链路上每个第一参与节点在各个粒度下的数据量;
针对每个所述第一参与节点,获取处于所述第一参与节点下游的相邻参与节点,并根据所述相邻参与节点在任一粒度下的数据量与所述第一参与节点在所述任一粒度下的数据量,确定所述任一粒度下的所述数据过筛率。
14.根据权利要求13所述的装置,其中,其中,所述数据资源获取模块,还用于:
从每个所述参与节点在所述任一粒度下的所述数据过筛率中,确定所述任一粒度的最大数据过筛率和最小数据过筛率;
根据每个所述参与节点在所述任一粒度下的所述数据过筛率,确定所述任一粒度的平均数据过筛率;
根据所述最大数据过筛率、所述最小数据过筛率和所述平均数据过筛率,对每个所述参与节点在所述任一粒度下的所述数据过筛率进行归一化处理。
15.一种电子设备,其特征在于,包括处理器和存储器;
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如权利要求1-7中任一所述的方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
17.一种计算机程序产品,其特征在于,当所述计算机程序产品中的指令处理器执行时实现如权利要求1-7中任一所述的方法。
CN202110662487.XA 2021-06-15 2021-06-15 数据资源调度方法、装置、电子设备及存储介质 Active CN113434270B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110662487.XA CN113434270B (zh) 2021-06-15 2021-06-15 数据资源调度方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110662487.XA CN113434270B (zh) 2021-06-15 2021-06-15 数据资源调度方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113434270A true CN113434270A (zh) 2021-09-24
CN113434270B CN113434270B (zh) 2023-06-23

Family

ID=77755882

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110662487.XA Active CN113434270B (zh) 2021-06-15 2021-06-15 数据资源调度方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113434270B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114640513A (zh) * 2022-03-04 2022-06-17 中国互联网络信息中心 一种基于信誉激励的域名滥用治理方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108632365A (zh) * 2018-04-13 2018-10-09 腾讯科技(深圳)有限公司 服务资源调整方法、相关装置和设备
CN110245023A (zh) * 2019-06-05 2019-09-17 欧冶云商股份有限公司 分布式调度方法及装置、电子设备以及计算机存储介质
WO2020000944A1 (zh) * 2018-06-25 2020-01-02 星环信息科技(上海)有限公司 基于抢占式调度的资源共享使用方法、系统及设备
CN111381957A (zh) * 2018-12-29 2020-07-07 上海哔哩哔哩科技有限公司 面向分布式平台的服务实例精细化调度方法及系统
CN111966500A (zh) * 2020-09-07 2020-11-20 网易(杭州)网络有限公司 资源调度方法、装置、电子设备及存储介质
CN112052390A (zh) * 2020-09-02 2020-12-08 北京百度网讯科技有限公司 一种资源筛选方法、装置、电子设备及存储介质
CN112445857A (zh) * 2019-08-28 2021-03-05 北京京东尚科信息技术有限公司 一种基于数据库的资源配额管理方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108632365A (zh) * 2018-04-13 2018-10-09 腾讯科技(深圳)有限公司 服务资源调整方法、相关装置和设备
WO2020000944A1 (zh) * 2018-06-25 2020-01-02 星环信息科技(上海)有限公司 基于抢占式调度的资源共享使用方法、系统及设备
CN111381957A (zh) * 2018-12-29 2020-07-07 上海哔哩哔哩科技有限公司 面向分布式平台的服务实例精细化调度方法及系统
CN110245023A (zh) * 2019-06-05 2019-09-17 欧冶云商股份有限公司 分布式调度方法及装置、电子设备以及计算机存储介质
CN112445857A (zh) * 2019-08-28 2021-03-05 北京京东尚科信息技术有限公司 一种基于数据库的资源配额管理方法和装置
CN112052390A (zh) * 2020-09-02 2020-12-08 北京百度网讯科技有限公司 一种资源筛选方法、装置、电子设备及存储介质
CN111966500A (zh) * 2020-09-07 2020-11-20 网易(杭州)网络有限公司 资源调度方法、装置、电子设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHAO YU等: "SMGuard: A Flexible and Fine-Grained Resource Management Framework for GPUs", 《 IEEE TRANSACTIONS ON PARALLEL AND DISTRIBUTED SYSTEMS》 *
潘佳艺;王芳;杨静怡;谭支鹏;: "异构Hadoop集群下的负载自适应反馈调度策略", 计算机工程与科学, no. 03 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114640513A (zh) * 2022-03-04 2022-06-17 中国互联网络信息中心 一种基于信誉激励的域名滥用治理方法及系统
CN114640513B (zh) * 2022-03-04 2023-06-23 中国互联网络信息中心 一种基于信誉激励的域名滥用治理方法及系统

Also Published As

Publication number Publication date
CN113434270B (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
CN111460384B (zh) 策略的评估方法、装置和设备
CN114500339B (zh) 一种节点带宽监测方法、装置、电子设备及存储介质
CN114065864B (zh) 联邦学习方法、联邦学习装置、电子设备以及存储介质
CN108390793A (zh) 一种分析系统稳定性的方法及装置
US11381635B2 (en) Method of operating a server apparatus for delivering website content, server apparatus and device in communication with server apparatus
CN116489038A (zh) 网络流量的预测方法、装置、设备和介质
CN113434270B (zh) 数据资源调度方法、装置、电子设备及存储介质
CN113132479A (zh) 流量切换、模型生成方法、装置、设备、存储介质及程序
CN112580800A (zh) 数据趋势预测模型的训练方法、数据趋势的预测方法
US11374869B2 (en) Managing bandwidth based on user behavior
CN112416590A (zh) 服务器系统资源调整方法、装置、计算机设备及存储介质
CN115185606A (zh) 业务配置参数的获得方法、装置、设备及存储介质
CN113010782B (zh) 需求量获取方法、装置、电子设备以及计算机可读介质
Lv et al. Analyzing the service availability of mobile cloud computing systems by fluid-flow approximation
CN115186749A (zh) 一种数据识别方法、装置、设备以及存储介质
CN114996930A (zh) 一种建模方法、装置、电子设备及存储介质
CN114048010A (zh) 服务超时时间的控制方法、装置、设备以及存储介质
CN114118420A (zh) 一种因果关系确定方法、装置、电子设备及存储介质
CN114328047A (zh) 系统测试方法、装置、电子设备以及存储介质
CN113220967B (zh) 互联网环境的生态健康程度衡量方法、装置和电子设备
CN116614379B (zh) 迁移服务的带宽调整方法、装置及相关设备
JP7457169B2 (ja) データ解析方法、電子機器及び記憶媒体
CN113989004B (zh) 一种资源分配方法、装置、电子设备和可读存储介质
US20230145408A1 (en) Method of processing feature information, electronic device, and storage medium
CN116484922B (zh) 一种联邦学习方法、系统、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant