CN114021769A - 一种网络测量数据收集方法及系统 - Google Patents
一种网络测量数据收集方法及系统 Download PDFInfo
- Publication number
- CN114021769A CN114021769A CN202111088794.8A CN202111088794A CN114021769A CN 114021769 A CN114021769 A CN 114021769A CN 202111088794 A CN202111088794 A CN 202111088794A CN 114021769 A CN114021769 A CN 114021769A
- Authority
- CN
- China
- Prior art keywords
- task
- measurement data
- network measurement
- target
- workers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005259 measurement Methods 0.000 title claims abstract description 140
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000013480 data collection Methods 0.000 title claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 45
- 230000002776 aggregation Effects 0.000 claims description 17
- 238000004220 aggregation Methods 0.000 claims description 17
- 238000011156 evaluation Methods 0.000 claims description 17
- 238000009826 distribution Methods 0.000 claims description 10
- 230000002068 genetic effect Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 description 34
- 238000004891 communication Methods 0.000 description 10
- 238000003860 storage Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/04—Constraint-based CAD
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Databases & Information Systems (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Educational Administration (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书一个或多个实施例提供一种网络测量数据收集方法及系统,包括:任务发布者向平台发布任务信息;平台根据所述任务信息,向工人发布任务内容,并接收工人的执行任务内容及执行任务报价,以便根据所述任务信息、执行任务内容和执行任务报价招募目标工人,计算目标工人的隐私预算参数,向所述目标工人发送所述隐私预算参数;所述目标工人收集网络测量数据,并根据所述隐私预算参数对所述网络测量数据进行扰动处理后,将扰动处理后的网络测量数据发送给所述平台,以使所述平台将扰动处理后的网络测量数据发送给所述任务发布者。本说明书能够有效收集网络测量数据。
Description
技术领域
本说明书一个或多个实施例涉及网络技术领域,尤其涉及一种网络测量数据收集方法及系统。
背景技术
互联网已经广泛普及,人们对网络服务的整体质量要求越来越高,为建立和维护健壮、可靠、稳定的互联网,需要网络管理者和研究者通过协作发现问题、解决问题。研究的基础是收集网络测量数据,有些网络测量数据因需要获得授权而难以获取,有些网络测量数据因包含隐私数据而存在泄露的风险,影响网络安全性。由此,网络测量数据的有效收集成为影响互联网优化的限制因素。
发明内容
有鉴于此,本说明书一个或多个实施例的目的在于提出一种网络测量数据收集方法及系统,以解决网络测量数据的收集问题。
基于上述目的,本说明书一个或多个实施例提供了一种网络测量数据收集方法,包括:
任务发布者向平台发布任务信息;其中,所述任务信息包括任务内容、任务报价和偏差阈值;
所述平台根据所述任务信息,向工人发布任务内容,并接收工人的执行任务内容及执行任务报价,以便根据所述任务信息、执行任务内容和执行任务报价招募目标工人,计算目标工人的隐私预算参数,向所述目标工人发送所述隐私预算参数;
所述目标工人收集网络测量数据,并根据所述隐私预算参数对所述网络测量数据进行扰动处理后,将扰动处理后的网络测量数据发送给所述平台,以使所述平台将扰动处理后的网络测量数据发送给所述任务发布者。
可选的,所述任务发布者向平台发布任务信息之前,还包括:
所述任务发布者以最大化效用函数为目标确定所述任务报价和偏差阈值。
可选的,所述平台根据所述任务信息、执行任务内容和执行任务报价招募目标工人,包括:
所述平台从区块链获取工人的信誉度;
根据所述任务信息、执行任务内容、执行任务报价和工人的信誉度,以最大化利润为目标招募目标工人;
所述计算目标工人的隐私预算参数为:根据所述目标工人的信誉度,计算所述隐私预算参数。
可选的,以最大化利润为目标招募目标工人为:利用遗传算法以最大化利润为目标,从所有工人中选取目标工人。
可选的,所述执行任务报价包括固定成本和隐私成本;其中,所述隐私成本是收集的网络测量数据中泄露的隐私数据的代价。
可选的,所述方法还包括:
所述目标工人执行任务之后,所述平台对所述目标工人进行信誉评价,以便根据所述信誉评价更新所述目标工人的信誉度。
可选的,所述信誉度包括平台对所述目标工人的直接评价和其他平台对所述目标工人的间接评价。
可选的,所述目标工人根据所述隐私预算参数对所述网络测量数据进行扰动处理为:
向所述网络测量数据中添加随机噪声;其中,所述随机噪声根据拉普拉斯分布参数和目标工人的权重确定,所述权重根据所述任务内容和执行任务内容之间的匹配程度以及所述目标工人的信誉度确定。
可选的,所述平台将扰动处理后的网络测量数据发送给所述任务发布者包括:
所述平台将扰动处理后的网络测量数据进行聚合处理,将聚合处理后的网络测量数据发送给所述任务发布者。
本说明书实施例还提供一种网络测量数据收集系统,包括:
任务发布者,用于向平台发布任务信息;其中,所述任务信息包括任务内容、任务报价和偏差阈值;
所述平台,用于根据所述任务信息,向工人发布任务内容,并接收工人的执行任务内容及执行任务报价,以便根据所述任务信息、执行任务内容和执行任务报价招募目标工人,计算目标工人的隐私预算参数,向所述目标工人发送所述隐私预算参数;
所述目标工人,用于收集网络测量数据,并根据所述隐私预算参数对所述网络测量数据进行扰动处理后,将扰动处理后的网络测量数据发送给所述平台,以使所述平台将扰动处理后的网络测量数据发送给所述任务发布者。
从上面所述可以看出,本说明书一个或多个实施例提供的网络测量数据收集方法及系统,任务发布者向平台发布任务信息;平台根据任务信息,向工人发布任务内容,并接收工人的执行任务内容及执行任务报价,以便招募目标工人,计算目标工人的隐私预算参数,向目标工人发送隐私预算参数;目标工人收集网络测量数据,并根据隐私预算参数对网络测量数据进行扰动处理后,将扰动处理后的网络测量数据发送给平台,平台将扰动处理后的网络测量数据发送给任务发布者。本说明书能够有效收集网络测量数据,保证收集的网络测量数据的准确性和安全性。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一个或多个实施例的方法流程示意图;
图2为本说明书一个或多个实施例的系统架构示意图;
图3为本说明书一个或多个实施例的数据流向示意图;
图4为本说明书一个或多个实施例的电子设备结构示意图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
需要说明的是,除非另外定义,本说明书一个或多个实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本说明书一个或多个实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
如背景技术部分所述,网络测量数据的收集因不具有网络管理员的权限而难以获取,或者可获取的网络测量数据包含隐私数据(如,个人信息、主机信息、网络拓扑结构等等),存在数据泄露的安全风险。
结合图2所示,一些场景中,利用区块链技术任务发布者可通过向平台发布收集网络测量数据的任务,平台根据任务招募工人,由工人执行任务后将收集的网络测量数据经过平台传输给任务发布者,然而,工人所收集的网络测量数据很容易分析出隐私数据,且工人的招募一般未考虑工人的信誉度,影响任务结果的准确性。
有鉴于此,本说明书实施例提供一种网络测量数据收集方法,任务发布者以最大化效用函数为目标确定任务信息,平台根据任务信息以最大化利润为目标结合工人的信誉度招募目标工人,目标工人收集网络测量数据并对网络测量数据进行扰动处理,平台聚合所有目标工人的扰动处理后的网络测量数据后将任务结果传输至任务发布者。由此,任务发布者收集到的网络测量数据不仅能够保证准确性而且具有隐私性,避免数据泄露问题。
如图1-3所示,本说明书一个或多个实施例提供一种网络测量数据收集方法,包括:
S101:任务发布者向平台发布任务信息;其中,任务信息包括任务内容、任务报价和偏差阈值;
本实施例中,任务发布者向平台发布用于收集网络测量数据的任务信息。任务信息包括任务内容,任务报价以及偏差阈值。其中,任务内容是指所需收集的网络测量数据的相关信息,例如数据类型、数据属性等,任务报价是指收集网络测量数据所付出的报酬,偏差阈值是指达到最大化效用函数目标下,网络测量数据的失真程度。
S102:平台根据接收的任务信息,向工人发布任务内容,并接收工人的执行任务内容及执行任务报价,以便根据任务信息、执行任务内容和执行任务报价招募目标工人,计算目标工人的隐私预算参数,向目标工人发送隐私预算参数;
本实施例中,平台接收任务发布者发布的任务信息,向工人发布任务内容,工人接收任务内容之后,将自身能够完成的执行任务内容和执行任务报价发送给平台,平台根据任务内容和执行任务内容进行匹配,确定可以完成任务内容的工人,并根据任务报价和执行任务报价计算平台可获得的利润,从能够完成任务内容的工人中招募可获得一定利润的目标工人。确定所要招募的目标工人之后,计算目标工人的隐私预算参数,将隐私预算参数发送给目标工人,后续由目标工人收集网络测量数据,并根据隐私预算参数对网络测量数据进行扰动处理,用以加强网络测量数据的隐私性。
一些方式中,工人的执行任务内容是指可以收集的网络测量数据的相关信息,例如数据类型、数据属性等。执行任务报价是指收集网络测量数据所需付出的成本,该成本包括固定成本和隐私成本两部分,固定成本包括收集数据、数据处理所需的时间成本,和硬件损耗、资源占用等所需的资源成本,隐私成本是收集的网络测量数据中泄露的隐私数据的代价,隐私成本与所泄露的隐私数据的数据量成正比。
S103:目标工人收集网络测量数据,并根据隐私预算参数对网络测量数据进行扰动处理后,将扰动处理后的网络测量数据发送给平台,以使平台将扰动处理后的网络测量数据发送给任务发布者。
本实施例中,平台招募到目标工人之后,由目标工人收集网络测量数据,基于收集到的网络测量数据,按照任务内容对网络测量数据进行分析和挖掘处理,得到与任务内容匹配的网络测量数据;之后,利用隐私预算参数对匹配的网络测量数据进行扰动处理,得到具有一定隐私性的网络测量数据,扰动处理后的网络测量数据不易分析获得隐私数据;最后,将扰动处理后的网络测量数据发送给平台,由平台将各目标工人收集的网络测量数据进行统一处理后,传输给任务发布者,从而完成网络测量数据的收集任务。
本实施例提供的网络测量数据收集方法,包括任务发布者向平台发布任务信息;平台根据接收的任务信息,向工人发布任务内容,并接收工人的执行任务内容及执行任务报价,以便根据任务信息、执行任务内容和执行任务报价招募目标工人,计算目标工人的隐私预算参数,向目标工人发送隐私预算参数;目标工人收集网络测量数据,并根据隐私预算参数对网络测量数据进行扰动处理后,将扰动处理后的网络测量数据发送给平台,以使平台将扰动处理后的网络测量数据发送给任务发布者。本实施例的方法,由任务发布者发布具有任务要求的任务信息,工人收集满足任务要求的网络测量数据,最终收集的网络测量数据具有隐私性,并能保证准确性。
一些实施例中,任务发布者以最大化效用函数为目标确定任务报价和偏差阈值,确定具有任务要求的任务信息。
具体的,通过分析,任务发布者想要收集准确的网络测量数据,数据越精确任务发布者的满意程度越高,与此同时所需付出的报酬也越高。定义效用函数,用于衡量所获得的收益与付出的成本之间的均衡程度,效用函数表示为:
U(tj)=S(tj)-C(tj) (1)
其中,S(tj)表示任务发布者tj的满意度函数,C(tj)表示任务发布者tj的成本函数。
其中,为任务发布者tj可容忍的网络测量数据的最大失真程度,θj是网络测量数据的失真程度,失真程度越大,满意度越低。αj是权重,由任务发布者tj的特性决定,用于调整满意度函数和成本函数对准确程度的影响程度。
其中,βj表示固定参数,与任务发布者对成本的可容忍程度有关,取值范围为(0,1),失真程度θj越小,成本越高,即所需支付的报酬越高。
根据公式(2)、(3),可得效用函数的综合表达式:
将效用函数U(tj)对失真程度θj求一阶导数、二阶导数,得到:
其中,最大化效用函数U(tj),也是最小化(-U(tj)),则确定最优解的目标函数为:
上述目标函数在KKT求解条件下存在唯一的最优解,放宽约束得到拉格朗日函数:
最优解满足以下条件:
一些实施例中,平台根据任务信息、执行任务内容和执行任务报价招募目标工人,包括:
平台从区块链获取工人的信誉度;
根据任务信息、执行任务内容、执行任务报价和工人的信誉度,以最大化利润为目标招募目标工人;
计算目标工人的隐私预算参数为:根据目标工人的信誉度,计算隐私预算参数。
本实施例中,平台为招募合适的工人,一方面从区块链获取记录的所有工人的信誉度,信誉度越高,工人的可信性越好,所收集的网络测量数据的准确性越高,平台可选取信誉度较高的工人用以保证收集的数据质量;第二方面,根据发布的任务内容和工人可执行的执行任务内容,选取出能够完成任务内容的工人;第三方面,结合发布的任务报价和工人执行任务提出的执行任务报价,选取出能够使平台获得利润的工人。综上,平台需要结合工人信誉度、任务内容的匹配程度以及成本与利润因素,从所有工人中招募合适的目标工人,并在选取出目标工人之后,根据目标工人的信誉度,计算目标工人的隐私预算参数,便于目标工人根据隐私预算参数对所收集的网络测量数据进行扰动处理。
具体的,任务发布者向平台发布任务信息,任务信息包括任务内容γj、偏差阈值及任务报价平台收到任务信息后,先对任务内容γj进行分析,确定所需收集的网络测量数据的数据属性及计算的标签(例如,任务内容为确定明天是否会下雨,标签为1可表示会下雨,标签为0表示不会下雨),向工人发布包括数据属性和标签的任务内容。工人收到任务内容后,将自己能够收集的网络测量数据的数据属性及执行任务报价发送给平台,由平台根据任务发布者发布的任务信息及工人发布的执行任务内容和执行任务报价,以最大化利润为目标招募目标工人。
工人的执行任务报价为:
In(wi)=hci,j+pci,j (10)
其中,hci,j表示工人wi完成任务内容γj所需的固定成本,pci,j为工人wi完成任务内容γj所需的隐私成本,表示为:
pci,j=ωi,jεi,j (11)
其中,ωi,j表示泄露单位隐私数据的成本,εi,j表示泄露的隐私数据的数据量,在网络测量数据中添加的噪声越多,隐私数据泄露越少,隐私成本越低。
目标工人执行任务内容γj后,对收集的网络测量数据进行分析和挖掘,得到与任务发布者发布的任务内容相匹配的网络测量数据;之后,根据隐私预算参数在匹配的网络测量数据中添加噪声,用于对网络测量数据进行扰动处理,增强数据隐私性;最后,目标工人将扰动处理后的网络测量数据传输给平台。
平台根据接收的各目标工人收集的网络测量数据,进行统一的聚合处理,得到完成任务内容γj的最终任务结果rj,表示为:
其中,f(.)为聚合函数,ri,j为工人wi的任务结果(所收集的网络测量数据),qi,j表示针对任务内容γj,工人wi的归一化权重,可根据工人wi的信誉度确定;为在任务内容γj中,工人wi在所收集的网络测量数据中添加的噪声。xi,j是一个二值函数,xi,j∈{0,1},xi,j=1表示工人wi为被选中参与任务内容λj的目标工人,xi,j=0表示工人wi未被选中,Wj表示目标工人的集合,W表示工人的集合。
最终任务结果的失真程度定义为:
对于目标工人收集的网络测量数据,基于差分隐私技术,通过添加随机噪声进行扰动处理用以保证网络测量数据中包含的隐私数据的安全性。
给出有关差分隐私结果聚合的命题1:面向任务内容γj的聚合函数fj:[0,1]S→R满足隐私预算参数εi,j的差分隐私,则需满足,对于任何一对相邻向量和在第i个工人的结果处存在区别,且任何一组聚合结果都满足以下不等式:
Pr[fj(d)∈O]≤exp(εi,j)Pr[fj(d(i))∈O] (14)
其中,εi,j是隐私预算参数。
对于聚合函数fj,将拉普拉斯分布得出的随机噪声添加于聚合函数实现差分隐私。由于聚合函数是根据每个目标工人收集的网络测量数据得到,则每个目标工人可先添加随机噪声,使得将各目标工人的随机噪声聚合后得到的聚合噪声服从拉普拉斯分布,从而实现聚合函数的差分隐私,即平台聚合处理后的最终任务结果实现差分隐私。其中,聚合噪声可表示为:
给出有关工人的隐私预算参数和失真程度的命题2:已知所有工人的二值函数xi,j和权重qi,j,在聚合函数fj中,对于任务内容γj,工人wi的隐私预算参数表示为:
所有工人的聚合失真程度表示为:
其中,σj是拉普拉斯分布参数。
命题2的证明过程是:对于工人的隐私预算参数,在聚合函数fj下,若向量dj中任一元素发生变化,对聚合函数fj的输出的影响可表示为:
可得隐私预算参数为:
由此可知,分配给目标工人的隐私预算参数与目标工人的权重(信誉度)和拉普拉斯分布参数有关。
对于所有工人的聚合失真程度:
设拉普拉斯分布参数为:
则,工人wi的隐私预算参数可简化为:
所有工人的聚合失真程度可简化为:
其中,公式(22)可表征选取目标工人与目标工人的隐私预算参数之间的关系;公式(23)可表征选取目标工人与工人的聚合失真程度之间的关系。
平台建立的最大化利润的目标函数可表示为:
st:
其中,J为任务发布者的数量,X′j={0}表示X′j是一个全零的集合,同时H是任务内容集合。约束条件1)用于保证任务发布者获得的网络测量数据的准确性在偏差阈值之内;约束条件2)用于保证当网络测量数据的准确性不在偏差阈值之内时,不会有工人执行此任务;约束条件3)表明xi,j为二值函数;约束条件4)用于保证每个工人只能参与一个任务(考虑到完成任务内容的时间限制,在特定时间间隔内每个工人只能执行一项任务)。x′i,j是约束条件2映射到xi,j上,如果选取的工人满足约束条件2的阈值,则x′i,j=xi,j,如果不满足约束条件2的阈值,则x′i,j=0。X是xi,j张成的矩阵。
一些方式中,利用遗传算法以最大化利润为目标,从所有工人中选取目标工人。具体的,平台初始种群,种群中的个体为目标工人,按照公式(24)所示目标函数,计算选取目标工人可获得的利润;对种群进行遗传、交叉和变异操作,生成新的种群,计算新的种群中所选取的目标工人可获得的利润;计算初始种群与新的种群中利润最大值的差值是否达到预设阈值,如果达到,将新的种群中所选取的目标工人作为平台最终选取出的目标工人。
平台选取出目标工人之后,按照公式(16)计算分配给目标工人的隐私预算参数εi,j。之后,平台将隐私预算参数εi,j、拉普拉斯分布参数σj以及选定参数xi,j发送给目标工人,目标工人收集网络测量数据,按照公式(25)所示拉普拉斯分布向网络测量数据中添加随机噪声得到扰动后的网络测量数据,将扰动后的网络测量数据发送给平台;平台接收所有目标工人收集的网络测量数据,按照公式(12)对各目标工人收集的网络测量数据进行聚合处理,得到最终任务结果,将最终任务结果发送给任务发布者,从而完成网络测量数据的收集。
即,对于目标工人,xi,j=1,于目标工人收集的网络测量数据中添加的随机噪声根据拉普拉斯分布参数和目标工人的权重确定。
一些实施例中,目标工人完成任务内容之后,平台对目标工人进行信誉评价,以便根据信誉评价更新目标工人的信誉度。
具体的,平台对目标工人的信誉评价为:
平台对目标工人的直接评价为:
由公式(27)所示平台对目标工人的直接评价可知,直接评价为一段时间内的累计信誉,平台会优先选取近期进行过交易且信誉度较高的工人。
其他平台对目标工人的间接评价为:
其中,Mv为目标工人wi执行平台pv发布的任务内容所收集的网络测量数据的数据属性,Mk为目标工人wi执行平台pk发布的任务内容所收集的网络测量数据的数据属性,K为平台数量。目标工人在不同平台所执行的任务内容越接近,间接信誉的影响越大。
一些方式中,公式(12)中,工人wi的归一化权重qi,j根据发布的任务内容和工人的执行任务内容之间的匹配程度、以及工人的信誉度确定,先计算:
再对公式(30)的计算结果进行归一化处理得到即得到权重。其中,用于计算工人wi可收集的数据属性和任务发布者tj所需收集的数据属性之间的相似度,由于工人的权重与任务内容有关,能够度量工人完成任务内容的可信性。
本说明书实施例提供的网络测量数据收集方法,任务发布者将所需收集的网络测量数据以任务信息向平台发布,其中,任务发布者以最大化效用函数为目标确定任务报价和偏差阈值。平台接收发布的任务信息,将任务内容发布给工人,从区块链获取工人的信誉度,并接收工人所能收集的网络测量数据的执行任务内容以及执行任务报价,平台以最大化利润为目标招募目标工人。目标工人按照任务要求收集网络测量数据,在收集的网络测量数据中添加随机噪声,然后将添加噪声的网络测量数据发送给平台,平台将所有目标工人的网络测量数据进行聚合,将聚合处理后的网络测量数据以最终任务结果发送给任务发布者,从而完成网络测量数据的收集。利用本说明书的方法,能够保证收集数据的准确性和安全性。
需要说明的是,本说明书一个或多个实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本说明书一个或多个实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
需要说明的是,上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
结合图2所示,本说明书实施例还提供一种网络测量数据收集系统,包括:
任务发布者,用于向平台发布任务信息;其中,任务信息包括任务内容、任务报价和偏差阈值;
平台,用于根据任务信息,向工人发布任务内容,并接收工人的执行任务内容及执行任务报价,以便根据任务信息、执行任务内容和执行任务报价招募目标工人,计算目标工人的隐私预算参数,向目标工人发送隐私预算参数;
目标工人,用于收集网络测量数据,并根据隐私预算参数对网络测量数据进行扰动处理后,将扰动处理后的网络测量数据发送给平台,以使平台将扰动处理后的网络测量数据发送给任务发布者。
为了描述的方便,描述以上系统时以功能分为各种模块分别描述。当然,在实施本说明书一个或多个实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
上述实施例的系统用于实现前述实施例中相应的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
图4示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
上述实施例的电子设备用于实现前述实施例中相应的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本说明书一个或多个实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本说明书一个或多个实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本说明书一个或多个实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本说明书一个或多个实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本公开的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本说明书一个或多个实施例。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本公开的具体实施例对本公开进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本说明书一个或多个实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (10)
1.一种网络测量数据收集方法,其特征在于,包括:
任务发布者向平台发布任务信息;其中,所述任务信息包括任务内容、任务报价和偏差阈值;
所述平台根据所述任务信息,向工人发布任务内容,并接收工人的执行任务内容及执行任务报价,以便根据所述任务信息、执行任务内容和执行任务报价招募目标工人,计算目标工人的隐私预算参数,向所述目标工人发送所述隐私预算参数;
所述目标工人收集网络测量数据,并根据所述隐私预算参数对所述网络测量数据进行扰动处理后,将扰动处理后的网络测量数据发送给所述平台,以使所述平台将扰动处理后的网络测量数据发送给所述任务发布者。
2.根据权利要求1所述的方法,其特征在于,所述任务发布者向平台发布任务信息之前,还包括:
所述任务发布者以最大化效用函数为目标确定所述任务报价和偏差阈值。
3.根据权利要求1所述的方法,其特征在于,所述平台根据所述任务信息、执行任务内容和执行任务报价招募目标工人,包括:
所述平台从区块链获取工人的信誉度;
根据所述任务信息、执行任务内容、执行任务报价和工人的信誉度,以最大化利润为目标招募目标工人;
所述计算目标工人的隐私预算参数为:根据所述目标工人的信誉度,计算所述隐私预算参数。
4.根据权利要求3所述的方法,其特征在于,以最大化利润为目标招募目标工人为:利用遗传算法以最大化利润为目标,从所有工人中选取目标工人。
5.根据权利要求1所述的方法,其特征在于,
所述执行任务报价包括固定成本和隐私成本;其中,所述隐私成本是收集的网络测量数据中泄露的隐私数据的代价。
6.根据权利要求3所述的方法,其特征在于,还包括:
所述目标工人执行任务之后,所述平台对所述目标工人进行信誉评价,以便根据所述信誉评价更新所述目标工人的信誉度。
7.根据权利要求6所述的方法,其特征在于,所述信誉度包括平台对所述目标工人的直接评价和其他平台对所述目标工人的间接评价。
8.根据权利要求1所述的方法,其特征在于,所述目标工人根据所述隐私预算参数对所述网络测量数据进行扰动处理为:
向所述网络测量数据中添加随机噪声;其中,所述随机噪声根据拉普拉斯分布参数和目标工人的权重确定,所述权重根据所述任务内容和执行任务内容之间的匹配程度以及所述目标工人的信誉度确定。
9.根据权利要求1所述的方法,其特征在于,所述平台将扰动处理后的网络测量数据发送给所述任务发布者包括:
所述平台将扰动处理后的网络测量数据进行聚合处理,将聚合处理后的网络测量数据发送给所述任务发布者。
10.一种网络测量数据收集系统,其特征在于,包括:
任务发布者,用于向平台发布任务信息;其中,所述任务信息包括任务内容、任务报价和偏差阈值;
所述平台,用于根据所述任务信息,向工人发布任务内容,并接收工人的执行任务内容及执行任务报价,以便根据所述任务信息、执行任务内容和执行任务报价招募目标工人,计算目标工人的隐私预算参数,向所述目标工人发送所述隐私预算参数;
所述目标工人,用于收集网络测量数据,并根据所述隐私预算参数对所述网络测量数据进行扰动处理后,将扰动处理后的网络测量数据发送给所述平台,以使所述平台将扰动处理后的网络测量数据发送给所述任务发布者。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111088794.8A CN114021769A (zh) | 2021-09-16 | 2021-09-16 | 一种网络测量数据收集方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111088794.8A CN114021769A (zh) | 2021-09-16 | 2021-09-16 | 一种网络测量数据收集方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114021769A true CN114021769A (zh) | 2022-02-08 |
Family
ID=80054672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111088794.8A Pending CN114021769A (zh) | 2021-09-16 | 2021-09-16 | 一种网络测量数据收集方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114021769A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105976234A (zh) * | 2016-05-04 | 2016-09-28 | 南京邮电大学 | 一种移动众包系统中基于团队的激励机制的实现方法 |
CN108776863A (zh) * | 2018-05-25 | 2018-11-09 | 华南理工大学 | 一种基于用户基数最大化的群智感知激励方法 |
CN109726887A (zh) * | 2018-10-12 | 2019-05-07 | 西安电子科技大学 | 基于区块链的移动众包数据数据采集与处理系统及方法 |
CN110069940A (zh) * | 2019-03-15 | 2019-07-30 | 上海大学 | 移动群感知网络中基于激励机制的隐私保护系统和方法 |
CN110825810A (zh) * | 2019-10-28 | 2020-02-21 | 天津理工大学 | 一种基于区块链的群智感知双重隐私保护方法 |
CN111144888A (zh) * | 2019-12-24 | 2020-05-12 | 安徽大学 | 一种差分隐私保护的移动群智感知任务分配方法 |
CN112053043A (zh) * | 2020-08-21 | 2020-12-08 | 北京邮电大学 | 一种基于区块链的群智感知方法及系统 |
CN112967118A (zh) * | 2021-02-03 | 2021-06-15 | 华南理工大学 | 移动群智感知激励方法、装置、系统及存储介质 |
CN113222720A (zh) * | 2021-05-17 | 2021-08-06 | 陕西师范大学 | 一种基于信誉的隐私保护激励机制方法、装置及存储介质 |
-
2021
- 2021-09-16 CN CN202111088794.8A patent/CN114021769A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105976234A (zh) * | 2016-05-04 | 2016-09-28 | 南京邮电大学 | 一种移动众包系统中基于团队的激励机制的实现方法 |
CN108776863A (zh) * | 2018-05-25 | 2018-11-09 | 华南理工大学 | 一种基于用户基数最大化的群智感知激励方法 |
CN109726887A (zh) * | 2018-10-12 | 2019-05-07 | 西安电子科技大学 | 基于区块链的移动众包数据数据采集与处理系统及方法 |
CN110069940A (zh) * | 2019-03-15 | 2019-07-30 | 上海大学 | 移动群感知网络中基于激励机制的隐私保护系统和方法 |
CN110825810A (zh) * | 2019-10-28 | 2020-02-21 | 天津理工大学 | 一种基于区块链的群智感知双重隐私保护方法 |
CN111144888A (zh) * | 2019-12-24 | 2020-05-12 | 安徽大学 | 一种差分隐私保护的移动群智感知任务分配方法 |
CN112053043A (zh) * | 2020-08-21 | 2020-12-08 | 北京邮电大学 | 一种基于区块链的群智感知方法及系统 |
CN112967118A (zh) * | 2021-02-03 | 2021-06-15 | 华南理工大学 | 移动群智感知激励方法、装置、系统及存储介质 |
CN113222720A (zh) * | 2021-05-17 | 2021-08-06 | 陕西师范大学 | 一种基于信誉的隐私保护激励机制方法、装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2720447C1 (ru) | Вычисление индивидуальных углеродных следов | |
CN108133013B (zh) | 信息处理方法、装置、计算机设备和存储介质 | |
Li et al. | Conditionally independent private information in OCS wildcat auctions | |
EP3923207A2 (en) | Clustering techniques for machine learning models | |
US9984400B2 (en) | Network apparatus and method for control of an electronic data exchange between provider terminal and user terminal based on factor information | |
WO2020150611A1 (en) | Systems and methods for entity performance and risk scoring | |
CN107886241B (zh) | 资源分析方法、装置、介质和电子设备 | |
CN111626767B (zh) | 资源数据的发放方法、装置及设备 | |
CN109711859A (zh) | 客户终生价值的预测方法及装置、存储介质、计算机设备 | |
CN108932658B (zh) | 数据处理方法、装置和计算机可读存储介质 | |
CN110197316B (zh) | 运营数据的处理方法、装置、计算机可读介质及电子设备 | |
Dawood et al. | Factors affecting financial institutions to adopt mobile peer-to-peer platforms | |
WO2020150597A1 (en) | Systems and methods for entity performance and risk scoring | |
CN114021769A (zh) | 一种网络测量数据收集方法及系统 | |
CN116091249A (zh) | 交易风险的评估方法、装置、电子设备和介质 | |
CN116308615A (zh) | 产品推荐方法、装置、电子设备及存储介质 | |
Guarin et al. | Enhancing credit default swap valuation with meshfree methods | |
CN115422467A (zh) | 用于转化评估的方法、装置、设备和存储介质 | |
KR20190117857A (ko) | 신뢰 지수의 시간 의존 특징을 이용한 신뢰지수 예측 방법 및 시스템 | |
JP2019144775A (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
Danilola et al. | FinTech Loan Continuance Intention: How Far Can Self-Efficacies Go? | |
CN114331540A (zh) | 训练模型的方法、确定资产估值的方法和装置 | |
CN113657724A (zh) | 基于多源异构数据的资源分配方法、装置和电子设备 | |
CN112598241A (zh) | 风险的评估方法、装置、系统及计算机可读存储介质 | |
CN111105274A (zh) | 数据处理方法、装置、介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |