CN115048590A - 一种面向隐私保护的基于联邦分析的班车定制方法 - Google Patents

一种面向隐私保护的基于联邦分析的班车定制方法 Download PDF

Info

Publication number
CN115048590A
CN115048590A CN202210609528.3A CN202210609528A CN115048590A CN 115048590 A CN115048590 A CN 115048590A CN 202210609528 A CN202210609528 A CN 202210609528A CN 115048590 A CN115048590 A CN 115048590A
Authority
CN
China
Prior art keywords
user equipment
cluster
server
center point
privacy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210609528.3A
Other languages
English (en)
Other versions
CN115048590B (zh
Inventor
王伟
吕红梅
刘鹏睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiaotong University
Original Assignee
Beijing Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiaotong University filed Critical Beijing Jiaotong University
Priority to CN202210609528.3A priority Critical patent/CN115048590B/zh
Publication of CN115048590A publication Critical patent/CN115048590A/zh
Application granted granted Critical
Publication of CN115048590B publication Critical patent/CN115048590B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioethics (AREA)
  • Business, Economics & Management (AREA)
  • Computer Hardware Design (AREA)
  • Marketing (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Software Systems (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Traffic Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种面向隐私保护的基于联邦分析的班车定制方法。该方法包括服务器确定所有准入的用户设备需要划分的聚类数,每个聚类代表一个班车站点,将各个聚类中心点的位置信息下发到各个用户设备;各个用户设备比较其与各个聚类中心点之间的距离,选择距离最小的聚类中心点对应的聚类作为自己所属的聚类;各个用户设备在本地对其位置数据进行隐私处理后发送给服务器;服务器将接收到的所有用户设备的位置数据进行联邦聚合,更新各个聚类中心点的位置信息。本发明面向隐私保护的基于联邦分析的班车定制方法在数据隐私保护的情况下,进行联邦聚类,分析得到正确的班车站点,便于实施并且精度较高,方便用户的快捷舒适的出行。

Description

一种面向隐私保护的基于联邦分析的班车定制方法
技术领域
本发明涉及计算机应用技术领域,尤其涉及一种面向隐私保护的基于联邦分析的班车定制方法。
背景技术
随着城市化的发展,人们对交通出行的舒适度要求越来越高,使得机动车的数量激增,这也导致了交通拥堵的现象频繁发生,给城市的交通带来了很大压力,尤其是早晚高峰期。公共交通的拥挤和长时间的等候已经无法满足快捷舒适的出行需求。
智慧园区的飞速发展使得很多人共同在一个园区内工作,因此考虑面向工作人员的智慧出行场景。对于园区工作人员来说,他们分布在不同的小区,但是工作地相同。他们面临着公交车拥挤、等待时间长和深夜打车难等问题。因此如果能通过采集用户的数据,在通过人工智能技术进行分析,为其定制班车服务,提供更好的出行建议,可以为用户提供更安全、方便、舒适的服务。
在定制智慧班车的场景下,需要合理安排班车站点位置,以满足不同位置的用户的出行可行性。因此,在该场景下,可以利用聚类算法确定站点位置。K-means聚类算法由于简单、聚类速度快,得到了广泛应用。该算法采用数据点与中心点之间的距离作为评价指标,并对聚类中心点不断更新,最终找到最合适的中心点位置。
然而,在使用K-means聚类方法确定班车站点时,用户需要将家庭住址等敏感信息上传到服务器,以便找到更为准确的站点位置。这将使得用户的位置信息被公开,造成敏感信息的泄露,故定制班车服务在为用户提供便利的同时也带来了隐私泄露的风险。
因此,设计一种既能够保护用户位置隐私数据不泄露同时又为用户提供定制班车、规划路线服务的方法,有着现实的需求。
现有技术中的针对隐私保护的K-means聚类方法,主要分为以下几种:
基于K-means的差分隐私保护聚类方法:设置隐私预算,计算噪声,计算每个聚类的数据点的总和、点的数量,然后对其添加计算后的噪声。在K-means聚类算法的迭代过程中,通过自适应的隐私预算分配,既在数据失真的基础上保护了数据隐私,又保证了数据的可用性。
基于分布式纵向K-means聚类方法:采用了去中心化的分布式模式,选择其中一个客户端作为发起方节点,生成Paillier公私钥,并将公钥分发给其他参与方,之后初始化聚类中心点,每个参与方在本地计算样本点到聚类中心的距离,然后将自己的距离与上一个节点传过来的欧式距离之和相加,直到N个参与方全部计算完毕,并将其发送给发起方,进行聚类中心更新。重复直到相邻两次的聚类中心的距离在合理范围内或者达到了指定的迭代次数。
具有隐私保护的可验证多方K-means联邦学习方法:在该方案中,每个用户将各自的数据加密上传到云服务器,云服务器随机挑选初始聚类中心,利用安全乘法协议和安全距离计算协议计算数据和初始聚心的欧几里得距离的平方;云服务器利用安全位分解协议和安全比较协议进行距离比较,并对数据进行划分;各用户利用秘密共享协议更新聚类中心,加密后上传到云服务器;云服务器计算新的聚类中心和原聚类中心的距离,如果小于阈值,则结束聚类操作,否则更新聚类中心进行下一次迭代。
现有技术中的基于隐私保护的K-means聚类方法的班车定制方法的缺点为:(1)现有技术方案没有涉及到客户端准入的过程。
(2)现有的K-means隐私保护方法中,主要有三种方案。基于加密的K-means聚类方案通过将数据加密的方式实现数据的安全传输和计算,但是存在着加解密阶段效率过低并且计算开销较大,耗费资源过多的问题,不符合实际情况;对于基于差分隐私的K-means聚类方法,在客户端上传位置数据时,尽管对其加入了噪声,进行了模糊处理,但是仍然会有一定程度的隐私泄露。对于基于联邦学习的K-means聚类,在聚类中心点更新的过程中并没有考虑到隐私保护问题。
(3)现有技术没有涉及到最后聚类中心点进行矫正的问题。在实际情况中,最后得到的聚类中心点有可能处于违规停车处,因此需要对聚类中心点进行微小调整,同时调整后的聚类中心点仍然要满足用户的需求。
发明内容
本发明的实施例提供了一种面向隐私保护的基于联邦分析的班车定制方法,以实现有效地解决上班族打车难、交通拥挤等实际问题。
为了实现上述目的,本发明采取了如下技术方案。
一种面向隐私保护的基于联邦分析的班车定制方法,包括:
服务器对请求加入的用户设备进行查询和准入;
服务器确定所有准入的用户设备需要划分的聚类数,每个聚类代表一个班车站点,对各个聚类中心点进行初始化,将各个聚类中心点的位置信息下发到各个用户设备;
各个用户设备比较其与各个聚类中心点之间的距离,选择距离最小的聚类中心点对应的聚类作为自己所属的聚类;
各个用户设备在本地对其位置数据进行隐私处理,将隐私处理后的位置数据发送给服务器;
服务器将接收到的所有用户设备的位置数据进行联邦聚合,更新各个聚类中心点的位置信息。
优选地,所述的服务器对请求加入的用户设备进行查询和准入,包括:
服务器对请求参与定制班车的用户设备发出查询,如果用户设备满足以下两个条件,则准入该用户设备参与定制班车:
条件1:地理位置ri=(xr,yr)位于园区范围内,即满足:
ri∈D,D={(x,y)|xw≤x≤xe,yn≤y≤ys}
其中D表示园区所在范围,xw,xe,ys,yn分别代表园区东西南北的边界位置坐标;
条件2:在园区范围内停留时间t超过设定时间N,即:t≥N,其中N为设定的时间值。
优选地,所述的服务器确定所有准入的用户设备需要划分的聚类数,每个聚类代表一个班车站点,对各个聚类中心点进行初始化,将各个聚类中心点的位置信息下发到各个用户设备,包括:
开始训练之前,服务器确定所有准入的用户设备需要划分的聚类数k,每个聚类代表一个班车站点,需要生成的k个班车站点,对各个聚类中心点的位置信息进行初始化
Figure BDA0003672786990000041
其中,
Figure BDA0003672786990000042
表示当前第j个聚类中心点初始位置坐标,
Figure BDA0003672786990000043
即位置初始经度,
Figure BDA0003672786990000044
即位置初始纬度;
服务器通过无线通信网络将各个聚类中心点的位置信息下发到各个用户设备。
优选地,所述的各个用户设备比较其与各个聚类中心点之间的距离,选择距离最小的聚类中心点对应的聚类作为自己所属的聚类,包括:
客户端的用户设备使用本地位置数据ri=(xr,yr)计算其与各个聚类中心点
Figure BDA0003672786990000045
之间的欧式距离,计算公式为:
Figure BDA0003672786990000046
用户设备比较其与各个聚类中心点之间的距离,选择距离最小的聚类中心点
Figure BDA0003672786990000051
对应的聚类作为自己所属的聚类;
对于每个用户设备,使用si,j={0,1}表示用户设备i的位置数据是否属于聚类j,如果属于,则值为1,否则为0,定义用户设备的one-hot编码向量
Figure BDA0003672786990000052
其中
Figure BDA0003672786990000053
用于表示用户设备所属的聚类。
优选地,所述的各个用户设备在本地对其位置数据进行隐私处理,将隐私处理后的位置数据发送给服务器,包括:
用户设备对于本地位置数据,添加基于压缩本地差分隐私的指数机制的噪声,实现压缩感知差分隐私,得到用户设备的虚假位置ri′=(xr′,yr′);
用户设备在本地维护一个连接表,在每次迭代时,每个用户设备都向其余用户设备发出查询,只有属于同一聚类的用户设备做出应答,发出查询的用户设备将返回应答的用户设备记录在连接表内,其中mi,j=1表示用户设备i和用户设备j属于同一聚类;
用户设备在向服务器上传其位置数据ri′之前,先查询本地维护的连接表,对于表内记录的所有用户设备,通过D-H密钥协商协议两两秘密共享随机数,对于属于同一聚类的用户设备i和用户设备j,共享随机数为ai,j,用户设备i的虚假位置为r′i=r′i-ai,j,用户设备j的虚假位置为r′j=r′j+ai,j
各个用户设备将用秘密共享随机数隐私处理后的虚假位置r′i和one-hot编码向量si发送给服务器。
优选地,所述的服务器将接收到的所有用户设备的位置数据进行联邦聚合,更新各个聚类中心点的位置信息,包括:
服务器接收到各个用户设备上报的用秘密共享随机数隐私处理后的虚假位置r′i和one-hot编码向量后,计算各个用户设备的one-hot编码向量之和:
Figure BDA0003672786990000054
Figure BDA0003672786990000055
向量中每个位置的数据表示每个聚类中对应的用户设备数量;
服务器执行安全聚合协议,用户设备的位置数据r′i中包含的随机数被抵消,服务器计算每个聚类中所有用户设备的位置数据之和
Figure BDA0003672786990000061
服务器根据计算得到的每个聚类中用户设备的数量
Figure BDA0003672786990000062
及位置数据之和
Figure BDA0003672786990000063
计算同一聚类中各个用户设备位置数据的平均值,将该平均值作为更新后的聚类中心点
Figure BDA0003672786990000064
的位置;
迭代执行上述用户设备将隐私处理后的位置数据发送给服务器,服务器将所有用户设备的位置数据进行联邦聚合,更新各个聚类中心点的位置信息的处理过程,直到模型收敛或者达到预先设定迭代次数,得到最终的更新后的各个聚类中心点的位置信息。
优选地,所述的方法还包括:
服务器结合地图中实际地理情况,检查最后生成的所有聚类中心点θj,j∈[k]的位置是否满足实际停车要求,如果某个聚类中心点θi的位置位于违禁停车范围内,则查询与其距离最近的可停靠点,对该聚类中心点进行微小调整,使用θi′表示;
服务器将调整之后的聚类中心点θi′发送到属于该聚类的各个用户设备,各个用户设备在本地计算其位置与修改后的聚类中心点的距离,并执行聚合协议,将此时的距离之和sumi′上传到服务器;
服务器比较当前的距离之和sumi′以及未调整之前各个用户设备与该聚类中心点的距离之和sumi,计算两者偏差bi,如果此时bi≤b,其中b是用户设备能接受的总偏离值,则将调整之后的聚类中心点θi′作为班车停靠站点。
由上述本发明的实施例提供的技术方案可以看出,本发明实施例的面向隐私保护的基于联邦分析的班车定制方法在数据隐私保护的情况下,进行联邦聚类,分析得到正确的班车站点,便于实施并且精度较高,方便用户的快捷舒适的出行。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种面向隐私保护的基于联邦分析的班车定制方法的流程图;
图2为本发明实施例提供的一种用户设备在本地对其位置数据进行隐私处理的流程图;
图3为本发明实施例提供的一种服务器对各个用户设备上传的数据进行联邦聚合,更新聚类中心点的处理过程示意图。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。
本发明实施例设计了一种面向隐私保护的基于联邦分析的班车定制方法,在数据隐私保护的情况下,进行联邦聚类,分析得到正确的班车站点,便于实施并且精度较高,方便用户的快捷舒适的出行。本发明针对班车定制的具体业务场景,服务器首先会进行参与方选择,只有符合一定条件的参与方被允许参与到接下来的更新过程。
本发明实施例提供的一种面向隐私保护的基于联邦分析的班车定制方法的流程图如图1所示,包括如下的具体步骤:
步骤S10:服务器对请求加入的用户设备进行查询和准入。
由于班车服务面向园区内工作人员,因此需要对参与的用户设备进行查询和准入。在选择用户设备时,由第三方服务器对用户设备发出查询,如果用户设备满足以下两个条件:
(1)地理位置ri=(xr,yr)位于园区范围内,即:ri∈D,D={(x,y)|xw≤x≤xe,yn≤y≤ys},其中D表示园区所在范围,xw,xe,ys,yn分别代表园区东西南北的边界位置坐标。。
(2)在园区范围内停留时间t超过设定时间N,即:t≥N,其中N根据实际情况设置,如一周内至少四天且停留的时间超过四小时,则被允许加入多方系统。
步骤S20:服务器初始化聚类中心点。
开始训练之前,服务器选定所有用户设备需要划分的聚类数k,即需要生成的k个班车站点,对各个聚类中心点进行初始化
Figure BDA0003672786990000091
Figure BDA0003672786990000092
表示当前第j个聚类中心点初始位置坐标,
Figure BDA0003672786990000093
即位置初始经度,
Figure BDA0003672786990000094
即位置初始纬度。
将各个聚类中心点的位置信息下发到各个用户设备。
步骤S30:在每次迭代过程中,客户端的用户设备进行本地计算。
步骤3.1:客户端的用户设备使用本地位置数据ri=(xr,yr)计算其与各个聚类中心点
Figure BDA0003672786990000095
之间的欧式距离,计算公式为:
Figure BDA0003672786990000096
用户设备比较其与各个聚类中心点之间的距离,选择距离最小的聚类中心点
Figure BDA0003672786990000097
作为自己的聚类标识。
步骤3.2:对于每个用户设备,使用si,j={0,1}表示用户设备i的位置数据是否属于聚类j,如果属于,则值为1,否则为0。定义one-hot编码向量
Figure BDA0003672786990000098
其中
Figure BDA0003672786990000099
用于表示自己的聚类估计。
步骤S40:用户设备在本地对其位置数据进行隐私处理,处理过程如图2所示,包括如下的步骤:
步骤4.1:用户设备对于本地位置数据,添加基于压缩本地差分隐私(CondensedLocal Differential Privacy)的指数机制的噪声,实现压缩感知差分隐私,以较大概率生成较近的虚拟位置,而以较小概率生成距离较远的虚拟位置,得到虚假位置ri′=(xr′,yr′)。在实现地理位置的不可区分性的同时保持较高的准确性。
步骤4.2:用户设备在本地维护一个连接表,在每次迭代时,每个用户设备都向其余用户设备发出查询,只有属于同一聚类的用户设备做出应答,发出查询的用户设备将应答结果记录在连接表内,其中mi,j=1表示用户设备i和用户设备j属于同一聚类。
步骤4.3:用户设备在向服务器上传其位置数据ri′之前,用户设备查询本地维护的连接表,对于表内记录的所有用户设备,通过D-H密钥协商协议两两秘密共享随机数。对于属于同一聚类的用户设备i和用户设备j,共享随机数为ai,j,用户设备i的虚假位置为r′i=r′i-ai,j,用户设备j的虚假位置为r′j=r′j+ai,j
各个用户设备将用秘密共享随机数隐私处理后的虚假位置r′i和one-hot编码向量si发送给服务器。
步骤S50:图3为本发明实施例提供的一种服务器对各个用户设备上传的数据进行联邦聚合,更新聚类中心点的处理过程示意图,包括如下的处理步骤:
步骤5.1:服务器计算接收到的各个用户设备对应one-hot向量之和
Figure BDA0003672786990000101
则此时向量
Figure BDA0003672786990000102
中每个位置的数据表示每个聚类中对应的用户设备数量。
步骤5.2:服务器执行安全聚合协议,用户设备的位置数据r′i中包含的随机数被抵消,服务器可以得到每个聚类中所有用户设备的位置数据之和
Figure BDA0003672786990000103
而不会得知各个用户设备私有的具体隐私数值,其中n代表每个聚类中的用户设备数量。
步骤5.3:根据计算得到的每个聚类中用户设备的数量
Figure BDA0003672786990000104
及位置数据之和
Figure BDA0003672786990000105
计算同一聚类中各个用户设备的位置数据的平均值,将该平均值作为更新后的聚类中心点
Figure BDA0003672786990000106
的位置数据。
迭代执行步骤S30-步骤S50,直到模型收敛或者达到预先设定迭代次数,得到最后的聚类中心点。
步骤S60:服务器对最后的聚类中心点进行矫正,使其符合实际情况,并满足用户的实际需求。
步骤6.1:服务器结合地图中实际地理情况,检查最后生成的所有聚类中心点θj,j∈[k]是否满足实际停车要求,如果某个聚类中心点θi位于违禁停车范围内,则查询与其距离最近的可停靠点,对该聚类中心点进行微小调整,使用θi′表示。
步骤6.2:服务器将调整之后的聚类中心点θi′发送到属于该聚类的各个用户设备,各个用户设备在本地计算其位置与修改后的聚类中心点的距离,并执行聚合协议,将此时的距离之和sumi′上传到服务器。
步骤6.3:服务器比较当前的距离之和sumi′以及未调整之前各个用户设备与该聚类中心点的距离之和sumi,计算两者偏差bi,如果此时bi≤b,其中b是用户设备能接受的总偏离值,那么将调整之后的聚类中心点作为班车停靠站点,为用户设备提供方便快捷的服务。
综上所述,本发明针对具体的业务场景,设计了一种面向隐私保护的基于联邦分析的班车定制方法,用于解决上班族打车难、交通拥挤等实际问题。
首先,本发明考虑了客户端的准入问题,在开始计算之前,服务器会对请求加入的客户端设备进行查询和筛选,符合一定条件的客户端设备将被允许加入,从而构建完整的多方系统,杜绝了无关设备的加入会对最后结果产生干扰的可能性。
其次,在计算过程中客户端首先利用差分隐私对位置数据进行了扰动,
同时,在聚合时执行了安全聚合协议,使得服务器只能学习到各聚类之和,而无需知道客户端真实位置数据以及其对应的聚类标识。满足用户隐私保护的需求的同时能够准确的进行计算,保证精度。在整个计算过程中,相比于基于加密或者差分隐私的聚类方法,该方案无需大量的计算过程,开销较小,并且能够达到更好的隐私保护强度。
最后,在确定最后的班车停靠站点时,考虑了不符合实际情况的情形,服务器结合地图中实际地理情况,检查最后生成的所有聚类中心点是否满足实际停车要求,如果某个聚类中心点位于违禁停车范围内,则查询与其距离最近的可停靠点,对该聚类中心点进行微小调整,从而使其更好的符合实际情况,并满足用户的实际需求。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (7)

1.一种面向隐私保护的基于联邦分析的班车定制方法,其特征在于,包括:
服务器对请求加入的用户设备进行查询和准入;
服务器确定所有准入的用户设备需要划分的聚类数,每个聚类代表一个班车站点,对各个聚类中心点进行初始化,将各个聚类中心点的位置信息下发到各个用户设备;
各个用户设备比较其与各个聚类中心点之间的距离,选择距离最小的聚类中心点对应的聚类作为自己所属的聚类;
各个用户设备在本地对其位置数据进行隐私处理,将隐私处理后的位置数据发送给服务器;
服务器将接收到的所有用户设备的位置数据进行联邦聚合,更新各个聚类中心点的位置信息。
2.根据权利要求1所述的方法,其特征在于,所述的服务器对请求加入的用户设备进行查询和准入,包括:
服务器对请求参与定制班车的用户设备发出查询,如果用户设备满足以下两个条件,则准入该用户设备参与定制班车:
条件1:地理位置ri=(xr,yr)位于园区范围内,即满足:
ri∈D,D={(x,y)|xw≤x≤xe,yn≤y≤ys}
其中D表示园区所在范围,xw,xe,ys,yn分别代表园区东西南北的边界位置坐标;
条件2:在园区范围内停留时间t超过设定时间N,即:t≥N,其中N为设定的时间值。
3.根据权利要求1或者所述的方法,其特征在于,所述的服务器确定所有准入的用户设备需要划分的聚类数,每个聚类代表一个班车站点,对各个聚类中心点进行初始化,将各个聚类中心点的位置信息下发到各个用户设备,包括:
开始训练之前,服务器确定所有准入的用户设备需要划分的聚类数k,每个聚类代表一个班车站点,需要生成的k个班车站点,对各个聚类中心点的位置信息进行初始化
Figure FDA0003672786980000021
其中,
Figure FDA0003672786980000022
表示当前第j个聚类中心点初始位置坐标,
Figure FDA0003672786980000023
即位置初始经度,
Figure FDA0003672786980000024
即位置初始纬度;
服务器通过无线通信网络将各个聚类中心点的位置信息下发到各个用户设备。
4.根据权利要求3所述的方法,其特征在于,所述的各个用户设备比较其与各个聚类中心点之间的距离,选择距离最小的聚类中心点对应的聚类作为自己所属的聚类,包括:
客户端的用户设备使用本地位置数据ri=(xr,yr)计算其与各个聚类中心点
Figure FDA0003672786980000025
之间的欧式距离,计算公式为:
Figure FDA0003672786980000026
用户设备比较其与各个聚类中心点之间的距离,选择距离最小的聚类中心点
Figure FDA0003672786980000027
对应的聚类作为自己所属的聚类;
对于每个用户设备,使用si,j={0,1}表示用户设备i的位置数据是否属于聚类j,如果属于,则值为1,否则为0,定义用户设备的one-hot编码向量
Figure FDA0003672786980000028
其中
Figure FDA0003672786980000029
用于表示用户设备所属的聚类。
5.根据权利要求4所述的方法,其特征在于,所述的各个用户设备在本地对其位置数据进行隐私处理,将隐私处理后的位置数据发送给服务器,包括:
用户设备对于本地位置数据,添加基于压缩本地差分隐私的指数机制的噪声,实现压缩感知差分隐私,得到用户设备的虚假位置ri′=(xr′,yr′);
用户设备在本地维护一个连接表,在每次迭代时,每个用户设备都向其余用户设备发出查询,只有属于同一聚类的用户设备做出应答,发出查询的用户设备将返回应答的用户设备记录在连接表内,其中mi,j=1表示用户设备i和用户设备j属于同一聚类;
用户设备在向服务器上传其位置数据ri′之前,先查询本地维护的连接表,对于表内记录的所有用户设备,通过D-H密钥协商协议两两秘密共享随机数,对于属于同一聚类的用户设备i和用户设备j,共享随机数为ai,j,用户设备i的虚假位置为ri′=ri′-ai,j,用户设备j的虚假位置为rj′=rj′+ai,j
各个用户设备将用秘密共享随机数隐私处理后的虚假位置r′i和one-hot编码向量si发送给服务器。
6.根据权利要求5所述的方法,其特征在于,所述的服务器将接收到的所有用户设备的位置数据进行联邦聚合,更新各个聚类中心点的位置信息,包括:
服务器接收到各个用户设备上报的用秘密共享随机数隐私处理后的虚假位置ri′和one-hot编码向量后,计算各个用户设备的one-hot编码向量之和:
Figure FDA0003672786980000031
Figure FDA0003672786980000032
向量中每个位置的数据表示每个聚类中对应的用户设备数量;
服务器执行安全聚合协议,用户设备的位置数据ri′中包含的随机数被抵消,服务器计算每个聚类中所有用户设备的位置数据之和
Figure FDA0003672786980000033
服务器根据计算得到的每个聚类中用户设备的数量
Figure FDA0003672786980000034
及位置数据之和
Figure FDA0003672786980000035
计算同一聚类中各个用户设备位置数据的平均值,将该平均值作为更新后的聚类中心点
Figure FDA0003672786980000036
的位置;
迭代执行上述用户设备将隐私处理后的位置数据发送给服务器,服务器将所有用户设备的位置数据进行联邦聚合,更新各个聚类中心点的位置信息的处理过程,直到模型收敛或者达到预先设定迭代次数,得到最终的更新后的各个聚类中心点的位置信息。
7.根据权利要求6所述的方法,其特征在于,所述的方法还包括:
服务器结合地图中实际地理情况,检查最后生成的所有聚类中心点θj,j∈[k]的位置是否满足实际停车要求,如果某个聚类中心点θi的位置位于违禁停车范围内,则查询与其距离最近的可停靠点,对该聚类中心点进行微小调整,使用θi′表示;
服务器将调整之后的聚类中心点θi′发送到属于该聚类的各个用户设备,各个用户设备在本地计算其位置与修改后的聚类中心点的距离,并执行聚合协议,将此时的距离之和sumi′上传到服务器;
服务器比较当前的距离之和sumi′以及未调整之前各个用户设备与该聚类中心点的距离之和sumi,计算两者偏差bi,如果此时bi≤b,其中b是用户设备能接受的总偏离值,则将调整之后的聚类中心点θi′作为班车停靠站点。
CN202210609528.3A 2022-05-31 2022-05-31 一种面向隐私保护的基于联邦分析的班车定制方法 Active CN115048590B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210609528.3A CN115048590B (zh) 2022-05-31 2022-05-31 一种面向隐私保护的基于联邦分析的班车定制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210609528.3A CN115048590B (zh) 2022-05-31 2022-05-31 一种面向隐私保护的基于联邦分析的班车定制方法

Publications (2)

Publication Number Publication Date
CN115048590A true CN115048590A (zh) 2022-09-13
CN115048590B CN115048590B (zh) 2023-05-16

Family

ID=83159681

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210609528.3A Active CN115048590B (zh) 2022-05-31 2022-05-31 一种面向隐私保护的基于联邦分析的班车定制方法

Country Status (1)

Country Link
CN (1) CN115048590B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109740376A (zh) * 2018-12-21 2019-05-10 哈尔滨工业大学(深圳) 基于近邻查询的位置隐私保护方法、系统、设备及介质
US20200100057A1 (en) * 2017-06-18 2020-03-26 Moovit App Global Ltd. System and method for determining transit stop location
CN113011466A (zh) * 2021-02-25 2021-06-22 徐州工程学院 一种虚实公交站点的设置系统和设置方法
CN113222181A (zh) * 2021-04-29 2021-08-06 浙江大学 一种面向k-means聚类算法的联邦学习方法
US20210406782A1 (en) * 2020-06-30 2021-12-30 TieSet, Inc. System and method for decentralized federated learning
CN114092176A (zh) * 2021-10-27 2022-02-25 北京科技大学 一种基于公交车的城市通勤班车规划方法
US20220083904A1 (en) * 2020-09-16 2022-03-17 International Business Machines Corporation Semantic learning in a federated learning system
CN114528916A (zh) * 2022-01-14 2022-05-24 百度在线网络技术(北京)有限公司 样本聚类处理方法、装置、设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200100057A1 (en) * 2017-06-18 2020-03-26 Moovit App Global Ltd. System and method for determining transit stop location
CN109740376A (zh) * 2018-12-21 2019-05-10 哈尔滨工业大学(深圳) 基于近邻查询的位置隐私保护方法、系统、设备及介质
US20210406782A1 (en) * 2020-06-30 2021-12-30 TieSet, Inc. System and method for decentralized federated learning
US20220083904A1 (en) * 2020-09-16 2022-03-17 International Business Machines Corporation Semantic learning in a federated learning system
CN113011466A (zh) * 2021-02-25 2021-06-22 徐州工程学院 一种虚实公交站点的设置系统和设置方法
CN113222181A (zh) * 2021-04-29 2021-08-06 浙江大学 一种面向k-means聚类算法的联邦学习方法
CN114092176A (zh) * 2021-10-27 2022-02-25 北京科技大学 一种基于公交车的城市通勤班车规划方法
CN114528916A (zh) * 2022-01-14 2022-05-24 百度在线网络技术(北京)有限公司 样本聚类处理方法、装置、设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
YANGLIU等: "Privacy-perserving federated k-means for proactive caching in next generation cellular networks", 《INFORMATION SCIENCES》 *
刘旭等: "结合Canopy-K-means算法和出租车轨迹数据的公交车站预测方法", 《测绘通报》 *
岳自豪: "基于多模式分析的公交站点选址可视化系统设计与实现", 《中国优秀硕士论文全文数据库》 *

Also Published As

Publication number Publication date
CN115048590B (zh) 2023-05-16

Similar Documents

Publication Publication Date Title
CN109862114A (zh) 一种基于雾计算的安全车辆群智感知方法
CN111211892B (zh) 基于秘密共享和身份密码学的抗量子计算车联网系统及其认证方法
Li et al. FEEL: Federated end-to-end learning with non-IID data for vehicular ad hoc networks
CN114205091B (zh) 一种基于混沌映射的自动驾驶车辆网络认证和密钥协商方法
WO2021073068A1 (en) Issuing Offline PKI Certificates in Distributed V2X Network
CN113987551A (zh) 一种面向车联网的自适应联邦学习方法
CN111739285A (zh) 交通流量的预测方法、装置、设备及计算机存储介质
CN115052286A (zh) 基于位置服务的用户隐私保护、目标查询方法及系统
CN116321147A (zh) 基于零信任的多属性终端身份认证方法及系统
CN115035720A (zh) 基于卫星定位的交通路况数据采集、处理方法及管理系统
CN108833074A (zh) 基于同态加密的车辆自组织网络的认证系统及方法
CN117576655A (zh) 基于联邦学习的交通标志检测方法与系统
CN114978530A (zh) 空间信息网中分布式空间众包的距离计算与隐私保护方法
CN111710153B (zh) 交通流量的预测方法、装置、设备及计算机存储介质
CN112492545B (zh) 一种基于v2x的网联车辆安全认证方法
CN117851842A (zh) 一种双端聚类联邦学习方法
CN111565374B (zh) 一种基于动态反馈机制的信息分发策略优化方法
CN115048590B (zh) 一种面向隐私保护的基于联邦分析的班车定制方法
CN115527370B (zh) 一种基于隐私计算的出行需求共享与动静态交通协同方法
CN116599653A (zh) 一种卫星通信网络动态安全管理方法、系统及存储介质
CN113645028B (zh) 支持动态密钥管理的车联网条件隐私保护系统及方法
CN114245189B (zh) 视频码率调整方法、装置、设备及存储介质
Olakanmi et al. A trust based secure and privacy aware framework for efficient taxi and car sharing system
CN114125774A (zh) 一种基于车联网的车辆密钥动态更新方法
CN109996218B (zh) 提升车联网无线传输安全性能的资源分配方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant