CN113873441A - 接触者追踪的方法及相应的处理方法、系统、设备和介质 - Google Patents
接触者追踪的方法及相应的处理方法、系统、设备和介质 Download PDFInfo
- Publication number
- CN113873441A CN113873441A CN202110746980.XA CN202110746980A CN113873441A CN 113873441 A CN113873441 A CN 113873441A CN 202110746980 A CN202110746980 A CN 202110746980A CN 113873441 A CN113873441 A CN 113873441A
- Authority
- CN
- China
- Prior art keywords
- signal
- time
- signal strength
- access point
- profile
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 90
- 238000003672 processing method Methods 0.000 title description 6
- 239000013598 vector Substances 0.000 claims abstract description 124
- 241000700605 Viruses Species 0.000 claims abstract description 89
- 230000004083 survival effect Effects 0.000 claims abstract description 49
- 230000003612 virological effect Effects 0.000 claims abstract description 21
- 238000012545 processing Methods 0.000 claims abstract description 18
- 230000001419 dependent effect Effects 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 39
- 238000004891 communication Methods 0.000 abstract description 7
- 230000004888 barrier function Effects 0.000 abstract description 2
- 230000036541 health Effects 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- 238000013459 approach Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 230000001413 cellular effect Effects 0.000 description 5
- 208000025721 COVID-19 Diseases 0.000 description 4
- 238000013480 data collection Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 229960003965 antiepileptics Drugs 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000011524 similarity measure Methods 0.000 description 3
- DWDGSKGGUZPXMQ-UHFFFAOYSA-N OPPO Chemical compound OPPO DWDGSKGGUZPXMQ-UHFFFAOYSA-N 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000004659 sterilization and disinfection Methods 0.000 description 2
- 230000002459 sustained effect Effects 0.000 description 2
- 230000035899 viability Effects 0.000 description 2
- 241001678559 COVID-19 virus Species 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 102000018361 Contactin Human genes 0.000 description 1
- 108060003955 Contactin Proteins 0.000 description 1
- NTSBMKIZRSBFTA-AIDOXSFESA-N Digoxigenin bisdigitoxoside Chemical compound C1[C@H](O)[C@H](O)[C@@H](C)O[C@H]1O[C@@H]1[C@@H](C)O[C@@H](O[C@@H]2C[C@@H]3[C@]([C@@H]4[C@H]([C@]5(CC[C@@H]([C@@]5(C)[C@H](O)C4)C=4COC(=O)C=4)O)CC3)(C)CC2)C[C@@H]1O NTSBMKIZRSBFTA-AIDOXSFESA-N 0.000 description 1
- 241000764238 Isis Species 0.000 description 1
- 244000062793 Sorghum vulgare Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000007733 viral latency Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B17/00—Monitoring; Testing
- H04B17/30—Monitoring; Testing of propagation channels
- H04B17/309—Measuring or estimating channel quality parameters
- H04B17/318—Received signal strength
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/02—Protecting privacy or anonymity, e.g. protecting personally identifiable information [PII]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- Electromagnetism (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
提供用于针对接触者追踪的数据处理的方法和服务器、用于进行接触者追踪的方法和系统及相应的计算机设备和计算机可读存储介质。该方法涉及由与确诊病例相关联的原始信号分布图构造包括经处理的向量的序列的连续的经处理的分布图,使得可用于进行任意时间处的信号向量比较。如此,已知在t处用户的信号向量,如果t落入经处理的向量的病毒存活期的时间范围内,可使用信号相似性来衡量它们的匹配程度;如果相似性大于给定的阈值α,用户被识别为在t处与病毒有接触。本发明支持病毒存活期内接触者检测,不需要设备如电话之间的配对和通信,具有减少的采用障碍,对用户匿名和攻击提供更好的保护,同时能提供数据隐私以及提供更强的位置保密性。
Description
技术领域
本发明涉及接触者追踪,更具体而言,涉及用于针对接触者追踪的信号处理的方法和服务器、用于进行接触者追踪的方法和系统,以及相应的计算机设备和计算机可读存储介质。
背景技术
COVID-19的爆发对人们的生活和全球经济产生了深远影响。像许多其他传染性疾病一样,COVID-19主要通过病毒接触传播。最近的研究表明,该病毒具有一定的存活期:作为空气中的飞沫,该病毒可以存活10分钟以上,并且如果不进行适当的消毒,则该病毒可以在表面上存活数小时至数天(在低温下,该病毒可以存活甚至更长时间)。任何与该病毒接触一持续时间段(比如,15-30分钟)的人的健康都可能处于危险之中。为了有效地遏制该疾病,尽快追踪和隔离这些密切接触者至关重要。
传统上,卫生官员通过对感染者进行个人面谈来手动追踪密切接触者。这样的手动方法是劳动密集型的并且缓慢的。由于记忆错误,接触者信息可能不完整或容易出错。此外,患者可能不会认识他/她附近的人,以及谁在他/她离开之后在病毒存活期内进入过区域。
现有技术中已经存在多种用于接触者追踪的方案。这些方案具有各自的缺点。例如,它们中有些基于电话配对,例如要求用户安装有相应的应用程序;还有一些考虑了病毒存活期内接触者追踪,但提供用户地理位置,因而可能引起隐私问题;另外有一些考虑了保护用户位置隐私,但因此而在被扩展到病毒存活期内接触者追踪方面受限。
发明内容
本申请旨在提出能解决或缓解上述现有技术的问题中的至少部分的方案。
本发明提供至少以下方案:
1.一种用于针对接触者追踪的数据处理的方法,包括:
-获取与确诊病例相关联的信号分布图W;
W={(A1,t1),(A2,t2),...,(Ai,ti),...(An,tn)},
其中,ti和ti+1是在根据所述确诊病例评估的所述确诊病例感染的病毒的病毒存活时间范围内的相继的离散时间,时间ti+1在时间ti之后,
|Ai∪Ai+1|表示并集Ai∪Ai+1中的信号向量的数目,Ai.a表示Ai中的信号ID,Ai+1.a表示Ai+1中的信号ID,和分别表示并集Ai∪Ai+1中第个信号向量中包括的信号ID和信号强度范围,
γ是设置的指示弱信号强度的值,
其中,所述信号ID是相应的信号接入点的MAC地址的散列值,
所述经处理的分布图用于进行接触者追踪。
2.一种用于针对接触者追踪的数据处理的方法,包括:
-获取与确诊病例相关联的一个感染区域的信号分布图W;
W={(A1,t1),(A2,t2),...,(Ai,ti),...(An,tn)},
其中,ti和ti+1是在所述确诊病例停留在所述感染区域的时间范围[t,t′]内的相继的离散时间,时间ti+1在时间ti之后,tstart=t,tend=t′+τ,τ是病毒存活期,
其中,所述信号ID是相应的信号接入点的MAC地址的散列值,
所述经处理的分布图用于进行接触者追踪。
3.根据方案1或2所述的方法,还包括:
-提供所述经处理的分布图用于进行接触者追踪。
4.一种用于进行接触者追踪的方法,包括:
W={(A1,t1),(A2,t2),...,(Ai,ti),...(An,tn)},
其中,ti和ti+1是在根据所述确诊病例评估的所述确诊病例感染的病毒的病毒存活时间范围内的相继的离散时间,时间ti+1在时间ti之后,
|Ai∪Ai+1|表示并集Ai∪Ai+1中的信号向量的数目,Ai.a表示Ai中的信号ID,Ai+1.a表示Ai+1中的信号ID,和分别表示并集Ai∪Ai+1中第个信号向量中包括的信号ID和信号强度范围,
γ是设置的指示弱信号强度的值,
其中,所述信号ID是相应的信号接入点的MAC地址的散列值;
-获取所述感兴趣用户的原始信号分布图W1,
W1={(AU1,t1),(AU2,t2),...,(AUi′,ti′),...(AUn′,tn′)},
-判断所述感兴趣用户是否与病毒有接触,所述判断包括:
对于W1中的在每个时间ti′处的信号向量AUi′,如果该时间ti′落入所述经处理的分布图中涉及的某个时隙[ti,ti+1+τi],计算所述信号向量AUi′与该时隙[ti,ti+1+τi]内的经处理的向量中包括的信号向量的相似性,以及
如果所述相似性大于给定的阈值,判断所述感兴趣用户在时间ti′处与病毒具有接触。
5.根据方案4所述的方法,其中,计算所述相似度包括:
对于AUi′和的共同的信号ID中的每个共同的信号ID,计算表示其在AUi′中对应的信号强度和其在中对应的信号强度的差异的单独信号强度差异,并基于针对每个共同的信号ID计算的单独信号强度差异计算总信号强度差异;
基于所述重叠率和所述总信号强度差异计算所述相似度。
6.根据方案5所述的方法,其中,
计算所述重叠率包括计算重叠率o,
计算所述总信号强度差异包括计算平均信号强度差异D,
7.根据方案4-6中任一项所述的方法,还包括:
-在判断所述感兴趣用户在多个ti′处与病毒具有接触的情况下,计算所述多个ti′中的时间最早者和时间最晚者之间的持续时间段作为所述感兴趣用户与病毒的接触时间;以及
-如果所述接触时间长于阈值持续时间长度,判断所述感兴趣用户为所述确诊病例的密切接触者。
8.一种用于进行接触者追踪的方法,包括:
W={(A1,t1),(A2,t2),...,(Ai,ti),...(An,tn)},
其中,ti和ti+1是在所述确诊病例停留在所述感染区域的时间范围[t,t′]内的相继的离散时间,时间ti+1在时间ti之后,tstart=t,tend=t′+τ,τ是病毒存活期,
其中,所述信号ID是相应的信号接入点的MAC地址的散列值;
-获取所述感兴趣用户的原始信号分布图W1,
W1={(AU1,t1),(AU2,t2),...,(AUi′,ti′),...(AUn′,tn′)},
-判断所述感兴趣用户是否与病毒有接触,所述判断包括:
如果所述相似性大于给定的阈值,判断所述感兴趣用户在时间ti′处与病毒具有接触。
9.根据方案8所述的方法,其中,计算所述相似度包括:
对于AUi′和中的共同的信号ID中的每个共同的信号ID,计算表示其在AUi′中对应的信号强度和其在中对应的信号强度的差异的单独信号强度差异,并基于针对每个共同的信号ID计算的单独信号强度差异计算总信号强度差异;
基于所述重叠率和所述总信号强度差异计算所述相似度。
10.根据方案9所述的方法,其中,
计算所述重叠率包括计算重叠率o,
计算所述总信号强度差异包括计算平均信号强度差异D,
11.根据方案8-10中任一项所述的方法,还包括:
-在判断所述感兴趣用户在多个ti′处与病毒具有接触的情况下,计算所述多个ti′中的时间最早者和时间最晚者之间的持续时间段作为所述感兴趣用户与病毒的接触时间;以及
-如果所述接触时间长于阈值持续时间长度,判断所述感兴趣用户为所述确诊病例的密切接触者。
12.根据方案4-11中任一项所述的方法,其中,所述阈值不小于0.25,或小于0.25且不小于0.20,或小于0.20且不小于0.17。
13.根据方案1-11中任一项所述的方法,其中,所述无线网络信号为WiFi信号。
14.根据方案1-11中任一项所述的方法,其中,所述散列值是经加密的。
15.根据方案1和4-10中任一项所述的方法,其中,所述设备为手机。
16.一种用于针对接触者追踪的数据处理的服务器,包括处理器,所述处理器被配置为执行计算机指令以:
-获取与确诊病例相关联的信号分布图W;
W={(A1,t1),(A2,t2),...,(Ai,ti),...(An,tn)},
其中,ti和ti+1是在根据所述确诊病例评估的所述确诊病例感染的病毒的病毒存活时间范围内的相继的离散时间,时间ti+1在时间ti之后,
|Ai∪Ai+1|表示并集Ai∪Ai+1中的信号向量的数目,Ai.a表示Ai中的信号ID,Ai+1.a表示Ai+1中的信号ID,和分别表示并集Ai∪Ai+1中第个信号向量中包括的信号ID和信号强度范围,
γ是设置的指示弱信号强度的值,
其中,所述信号ID是相应的信号接入点的MAC地址的散列值,
所述经处理的分布图用于进行接触者追踪。
17.一种用于针对接触者追踪的数据处理的服务器,包括处理器,所述处理器被配置为执行计算机指令以:
-获取与确诊病例相关联的一个感染区域的信号分布图W;
W={(A1,t1),(A2,t2),...,(Ai,ti),...(An,tn)},
其中,ti和ti+1是在所述确诊病例停留在所述感染区域的时间范围[t,t′]内的相继的离散时间,时间ti+1在时间ti之后,tstart=t,tend=t′+τ,τ是病毒存活期,
其中,所述信号ID是相应的信号接入点的MAC地址的散列值,
所述经处理的分布图用于进行接触者追踪。
18.根据方案16或17所述的服务器,其中,所述处理器还被配置为执行计算机指令以:
-提供所述经处理的分布图用于进行接触者追踪。
19.一种用于进行接触者追踪的系统,包括处理器,所述处理器被配置为执行计算机指令以导致根据方案4-12中任一项的方法或引用方案4-11中之一的方案13-15中任一项所述的方法被执行。
20.一种计算机设备,包括存储器和处理器,所述存储器上存储有计算机指令,所述计算机指令在由所述处理器执行时导致根据方案1-15中任一项所述的方法被执行。
21.一种非暂时性计算机可读存储介质,其上存储有计算机指令,所述计算机指令在由处理器执行时导致根据方案1-15中任一项所述的方法被执行。
本发明的方案支持病毒存活期内接触者检测,不需要设备如电话之间的配对和通信,因而具有减少的采用障碍,对用户匿名和攻击提供更好的保护,同时能提供数据隐私以及提供更强的位置保密性。此外,本发明的方案是完全去中心化的,因而没有任何实体(用户或服务器)具有完整的信息,有利于防止数据再利用、滥用和误用。
附图说明
以示例的方式参考以下附图描述本发明的非限制性且非穷举性实施例,其中:
图1示意性示出使用WiFi的vContact接触者追踪过程;
图2是示出对vContact中使用WiFi的接触者检测的概述的示意图;
图3示意性示出针对设备被适当配置(例如具有安装的app)的确诊病例的信号分布图处理;
图4示意性示出针对感染区域的信号分布图处理;
图5(a)、图5(b)和图5(c)分别呈现了对于k=1m、k=2m和k=4m的精度和查全率;
图6示出了在不同场地中的精度;
图7示出了在不同场地中的查全率;
图8(a)、图8(b)和图8(c)分别示出了在办公室、公交车站和大型购物中心的情况下信号数量(AP数量)对接触者检测的性能的影响;
图9示出了不同的设备的精度;
图10示出了不同的设备的查全率;
图11示出了针对进出检测的精度和查全率;
图12(a)、图12(b)和图12(c)示出了针对办公室数据集vContact与基准方法的比较;
图13(a)、图13(b)和图13(c)示出了针对公交车站数据集vContact与基准方法的比较;
图14(a)、图14(b)和图14(c)示出了针对大型购物中心数据集vContact与基准方法的比较;
图15(a)、图15(b)、图15(c)和图15(d)分别示出了与“暴露数据收集”、“共享阳性检测结果”、“可能的暴露通知”和“测试模式”相关联的app屏幕截屏。
具体实施方式
发明人提出了一种新颖的、私下的并且数字的病毒存活期内接触者追踪方法,下面进行描述。
I.总体介绍
任何与活病毒接触的人都被认为有危险。这包括与患者同时处于某地的人,以及在患者之后在病毒存活期内访问区域的人。利用到处普遍存在的WiFi信号,发明人提出了一种自动的并且完全分布式的基于WiFi的方法来检测密切接触者,该方法可被称为vContact。据发明人所知,这是在私下接触者追踪中考虑病毒存活期的第一件成果。请注意,尽管为具体起见,本发明的讨论将集中于WiFi信号,但是vContact可以直接扩展到和适用于其他射频信号(诸如蓝牙(Bluetooth))以及其组合。另外,尽管具体提到了Covid-19病毒,但是本发明的方案可以直接扩展到和适用于针对其他传染性病毒的接触者追踪。
发明人已经将vContact实施为软件开发工具包(SDK),并且利用SDK,发明人开发了一款应用程序(app)。发明人在图1中例示了vContact的过程。根据本发明,用户的设备如手机可以安装有或不安装有该app。在安装有该app的情况下,用户的电话可被配置为通过电话的WiFi传感器自动扫描WiFi。例如,用户可以首先安装该app,并且打开电话的WiFi传感器。然后该app会定期扫描WiFi,每次扫描都会有一个包含以下两个元素的信号向量:1)信号ID,所述信号ID是WiFi接入点(AP)的MAC地址的散列(并且可选地加密)值;以及2)信号ID的对应的接收信号强度指示符(RSSI)。一个信号向量与一个时间戳相关联,时间戳是信号的扫描时间/收集时间。每个信号向量可以被保存对应于病毒潜伏期(比如,14至28天)的特定持续时间。当用户在城市中漫游时,随着时间过去,电话收集并且存储信号向量的时间序列,该时间序列被称为信号分布图(signal profile)。
当在医院得到阳性确诊后,患者具有以下两种可能性:
·具有安装的app:经患者同意,卫生官员可以访问他/她的信号分布图(患者可能出于个人原因取消或过滤信号分布图的一些部分,然后再将该信号分布图分享给卫生官员)。请注意,由于AP MAC哈希(并且可能地加密),卫生官员不知道患者地理位置,而仅知道具有不同停留时间的匿名ID的集群(cluster)。基于此,卫生官员与患者一起努力识别对公众具有潜在健康风险的场所。提取这些有风险的匿名ID并且用评估的病毒存活期对其进行标注,并且经处理的信号分布图被上传到安全服务器以供其他用户以分布式方式进行匹配。在匹配后,如果用户与该病毒具有密切接触,则该用户被私下警告。
·不具有app:在此情况下,作为手动情况,确诊病例必须依靠他/她对主要场所以及其访问时间的记忆。然后,一些工作人员将前往这些地方(感染地区)以离线收集其WiFi信息,并且用患者的访问时间对其进行标注。在散列和处理之后,这些信号然后以与上述情况相同的方式由用户上传和匹配。在此方面,明显地,发明人考虑了如下现实状况:一个位置处的所有WiFi信号在某个短时间段(比如,数天)内不急剧改变,因此在患者访问之后一些天收集的信号仍然很好地反映当时的访问的信号。这种情况下,对于获得的信号分布图中的每个时间戳所对应的信号向量,该时间戳可以与进行离线收集时扫描该信号向量所对应的信号(如WiFi信号)的扫描时间/收集时间对应,从而与在该扫描时间/收集时间检测到的信号对应。
关于自动的数字的接触者追踪已经取得一些成果。一些成果使用GPS和蜂窝信号。虽然有效,但是这些方法不能够扩展到室内环境。它们还基于显式用户地理位置,这引起了对位置隐私的关注。一些基于蓝牙的隐私保护式方法引起了人们的广泛关注,并且在最近得到实现。然而,它们仅对于直接面对面的接触者追踪起作用,并且不能够适用于具有非零病毒存活期(环境暴露)的情况。它们还基于电话配对和通信——这导致对安全性的关注,并且要求高采用率才能进行有效追踪。vContact与它们正交,并且可以与它们中的一些集成。与现有成果相比,vContact具有以下优势:
·病毒存活期内接触者检测:vContact是用以充分体现(capture)病毒存活期的现实场景的第一件成果。它在单个构架内全面涵盖与感染者直接面对面接触的人以及间接环境暴露于感染者先前访问过的区域的人。在信号上传时设置的病毒存活期可能是各种各样的、有所不同的,这具体取决于在场所中进行消毒操作的频率。
·没有电话到电话配对和通信:先前的基于蓝牙的接触者追踪提议要求电话配对,这意味着两个电话(包括受感染的一个电话)都必须同时按要求配置例如安装相应的应用程序才能正常工作。为了实现追踪效力,它们因此要求高采用率(据报道在40%–70%的范围内)。相比之下,利用本发明,每个电话可以独立运行,而无需任何配对或通信,并且不要求确诊病例的设备如手机被配置为通过其WiFi传感器自动扫描WiFi(例如,已经安装本发明的app)。这大大减少了采用障碍。此外,应用本发明的用户如app用户不存储其他用户的任何信息或与其他用户交换任何消息;因此,它对用户匿名和攻击提供更好的保护。
·数据隐私:vContact不使用任何个人信息,诸如姓名、电话号码、ID、联系人列表、图像/视频等。因为电话是独立的而没有任何相互信息交换,所以不在电话之间生成和传达数据,也不在电话中保存其他用户的信息。收集的具有哈希ID的WiFi数据专门存储在自己的电话中。未经用户的明确同意,电话数据永远不会离开本地存储装置,即使这样(即,确诊病例的情况),数据仍然在服务器处保持匿名。在检测到密切接触者时,vContact私下将这样的消息传送给其用户,而没有任何数据上传。
·去中心化:vContact是完全去中心化的,其中可以可缩放的方式在用户电话本地计算接触者,而没有任何实体(用户或服务器)具有完整的信息。这样的数据碎片化和最小化防止数据再利用、滥用和误用。由于没有用户数据存储在电话以外的其他任何地方,因此用户可以随时通过卸载来退出系统,而不会留下他/她的数据。一旦流行病结束,还可以通过这样的app卸载来快速拆除系统。
·没有基于GPS的地理位置:vContact不基于GPS信号。因为它仅使用WiFi MAC地址的散列值(信号ID),所以用户的物理地理位置是不透明并且不必要的。与其他基于GPS的地理位置方法相比,vContact提供了更强的位置保密性,因为将所有信号ID与其物理位置相关联需要极其大量的手动工作(换言之,访问城市的每个室内和室外角落并且记录下(log down)遇到的所有MAC地址的位置)。此外,与其他GPS方法不同,vContact可以检测室内接触者,因此通过覆盖室内区域和室外区域更加普遍存在。
因为以下问题,使用WiFi数据来检测密切接触者是具有挑战性的问题。首先,在随机离散时间零星地对信号向量进行采样,从而导致难以在任何任意时间检测接触者。此外,可以在空间中稀疏地对信号进行采样。由于天线设计和灵敏度上的电话异质性,不同的用户的扫描的ID也可能不同。vContact通过采用一种新颖的用以表示连续的信号向量之间的值的方法和一种高效的用以匹配病毒接触者的信号值的相似性度量克服了这些问题。
发明人在图2中呈现了在vContact中使用WiFi进行接触者检测的概观。如果确诊病例的信号分布图可得,本发明将患者的连续的信号向量之间的RSSI表示为经处理的向量,以支持向量比较。这些经处理的向量的所得序列被称为经处理的分布图。对于确诊病例未安装该app的情况,在感染区域中由工作人员收集的WiFi数据被转换为经处理的分布图。已知在t处用户的信号向量,如果t落入经处理的向量的病毒存活期的时间范围内,将使用发明人提出的信号相似性度量来比较它们的匹配程度。如果相似性大于给定的阈值α,则用户被识别为在t处与病毒具有接触。如果接触时间超过由卫生官员规定的特定持续时间段,则用户被识别为密切接触。例如,在判断用户在多个离散时间ti处与病毒具有接触的情况下,可以基于这多个ti确定用户与病毒接触的持续时间。例如,可以将这多个ti中的时间最早者和时间最晚者之间的持续时间段作为用户与病毒的接触时间。如果该接触时间长于设定的阈值持续时间长度,则判断用户为密切接触者。
该专利申请的其余部分被组织如下。在第II节中,与现有技术的相关成果相比对地概述了vContact。第III节提供对本发明的概述。第IV节呈现了vContact的方法。发明人已经将vContact实施为软件开发工具包(SDK),并且在第V节中讨论了SDK上的实验设置和例示性结果。利用SDK,发明人开发了一款app,并且在第VI节中呈现了其实施细节和测量结果。在第VII节中得出结论。
II.vContact与现有技术的比对
由于COVID-19流行病的爆发,接触者追踪引起了人们的极大关注。在本节中,呈现了一些众所周知的在行业和学术界提出的系统和方案,以与本发明比对。
Google和Apple提供了一种使用蓝牙进行隐私保护式接触者追踪的工具包。在一些国家/地区已经部署了各种接触者追踪系统,诸如新加坡的TraceTogether、澳大利亚的COVIDSafe、土耳其的Corowarner、阿根廷的Cotrack、美国的Covid Watch等。TraceTogether、COVIDSafe和Covid Watch使用蓝牙,Corowarner使用GPS和蓝牙,并且Cotrack使用RFID、GPRS、GPS和电信技术。TraceTogether是新加坡政府发布的app。用户使用蓝牙广播他们的ID,并且扫描他们附近的用户的ID。当一个用户被感染时,政府可以基于数据追踪与感染者具有密切接触的人。其他app基于与TraceTogether类似的构思。与它们相比,vContact并非基于电话配对,并且因此它打破了同时安装app的要求。它还可以提供更好的用户隐私,这是因为在接触时私下通知用户。
近年来,接触者追踪成为学术界的热门研究课题。许多研究成果集中于使用不同的信号进行接触者追踪。它们中的一些使用透露用户地理位置的信号,诸如GPS,蜂窝数据和射频识别(RFID)。GPS信号提供用户的准确位置,但是GPS信号在室内环境中通常是微弱并且嘈杂的,这限制了其接触者覆盖范围。蜂窝数据也可以被用于接触者追踪,以推断用户的公共交通出行。已知用户蜂窝数据,可以检测与确诊病例乘坐同一公共汽车、火车或地铁用户。然而,手机信号塔的信号半径大,并且因此难以检测紧密接近。一些研究者还提出使用RFID来了解接触。然而,必须部署额外的设备。GPS数据、蜂窝数据和RFID数据可以扩展到病毒存活期内接触者追踪,但是由于它们提供用户地理位置,因此它们可能引起隐私问题。与它们相比,vContact仅使用WiFi MAC地址的哈希值(信号ID),用户的物理地理位置是不透明并且不必要的,从而提供了更强的位置保密性。
为了保护用户位置隐私,一些成果提出使用磁力计和蓝牙数据进行接触者追踪,其中用户地理位置不是必需的。然而,地磁遭受环境改变的困扰。即使环境的小改变也可能导致某个位置的不同的地磁信号,这限制了其扩展到病毒存活期内接触者追踪。集中于蓝牙数据的成果可以分为两类。一些成果依赖于用于进行接触者追踪的第三方服务器,这引起对可能的数据滥用的担忧。为了解决此问题,其他人提倡完全分布式方法。Chan等人提出了被称为PACT的隐私敏感的协议和机制。Troncoso等人提出了一种被称为DP-3T的用于使用蓝牙数据进行隐私保护式接触者追踪的去中心化系统。用户ID被加密并且随时间改变,并且用户数据存储在本地。与DP-3T类似,一些研究者提出了PACT,其是一种简单的使用智能电话基于蓝牙接近度进行接触者追踪的去中心化方法。Avitabile等人表明,DP-3T中的隐私问题在任何基于BLE的接触者追踪系统中都不是固有的,并且提出了一种名为Pronto-C2的不同的系统。Brack等人使用分布式哈希表来构建用于进行接触者追踪的去中心化消息传递系统。除了实施和效率上的一些细微变化外,所有这些方案都是独立设计的并且非常类似。上述成果中的大部分集中于检测面对面密切接触者,并且它们不能够扩展到病毒存活期内的情况。与它们相比,本发明提出了一种隐私的基于WiFi的检测病毒存活期内的紧密接触者的方法。据发明人所知,本发明的方案是在使用WiFi进行隐私接触者追踪中考虑病毒存活期的第一件成果。此外,在本发明提出的方案中不需要电话配对和通信。
III.概述
Covid-19主要通过与病毒接触传播,根据一些研究,该病毒可以超过几个小时的存活期在表面上存活。因此,为了遏制其传播,至关重要的是检测和隔离在持续时间段内与病毒接触过的人,即所谓的密切接触者。现有的用于接触者追踪的数字方法仅集中于直接面对面接触者。还没有检测间接环境接触——换言之,检测在病毒存活期内进入具有活病毒的区域(即,感染者先前访问过的区域)的人——的任何成果。
在本发明中,首次研究了当病毒具有存活期时进行自动接触者检测。利用WiFi信号的普遍存在,发明人提出了一种新颖的、私有的并且完全分布式的基于WiFi的方法,该方法被称为vContact。安装app的用户持续扫描WiFi并且存储其哈希ID。已知确诊病例,他/她访问过的主要地方的信号然后被上传到服务器,并且与存储的用户的信号匹配以检测接触者。vContact并非基于电话配对,因此不本地存储任何其他用户的信息。确诊病例不必进行特定配置即可利用本发明的方法,不需要安装app,vContact即可正常运行。由于零星地对WiFi数据进行采样,因此发明人提出了高效的信号处理方法和相似性度量以配比(align)和匹配任何时间的信号。发明人进行了大量的室内实验和室外实验,以评估vContact的性能。结果证明,vContact对于接触者检测是高效的并且鲁棒的。对于密切接触者接近度(3m),接触者检测的精度和查全率(recall)很高(在70-90%的范围内)。就信号长度(AP号码)和电话异质性而言,它的性能是鲁棒的。通过将vContact实施为app,发明人呈现了一个案例研究,以证明本发明的设计在通知其用户他们在存活期内暴露于病毒方面的有效性。
IV.vContact中的接触者检测
如前所述,本发明使用信号分布图进行接触者追踪,所述信号分布图是随时间的信号向量的序列。信号向量和信号分布图的正式定义如下。
定义1:(信号向量)信号向量A被表示为(a1,s1),(a2,s2),...,(ai,si),...,(an,sn),其中ai是信号ID(散列并且可能加密的AP MAC地址),并且si是其RSSI。
定义2:(信号分布图)信号分布图被定义为随时间的信号向量的序列:W={(A1,t1),(A2,t2),...,(Ai,ti),...,(An,tn)},其中Ai是在时间ti处扫描的信号向量。
换句话说,信号向量表示在时间戳处由用户设备扫描的信号和RSSI,而信号分布图表示随时间收集的信号向量。如图2中所示,已知用户的信号分布图W={(A1,t1),(A2,t2),...,(Ai,ti),...,(An,tn)},发明人希望针对用户通过比较在t处的信号向量与确诊病例或感染区域的信号分布图的相似性来检测用户在每个ti处是否与病毒具有接触。
在本节中,发明人呈现了用以由已安装app的确诊病例(第IV-A节)和未安装app的确诊病例(即,感染区域病例)(第IV-B节)的原始信号分布图构造经处理的分布图的数据处理方法。然后,发明人提出了一种用以在已知用户的信号向量和经处理的向量的情况下测量信号相似性的高效的信号相似性度量(第IV-C节)。最后,发明人通过呈现接触者检测算法进行总结(第IV-D节)。
A.针对具有app的患者的信号分布图处理
信号不是连续采样,而是以零星和随机间隔采样。发明人提出了一种用以由具有安装的app的患者的原始信号分布图构造连续的经处理的分布图的数据处理方法。
发明人在图3中呈现了信号分布图处理的一个小示例。确认病例的信号分布图{(A1,t1),(A2,t2),(A3,t3),(A4,t4)}由离散时间处的一些信号向量组成。本发明旨在由原始信号分布图构造连续的经处理的分布图,以使得可以比较在任意时间处的信号向量。为了实现该目标,本发明由任何两个连续的信号向量Ai和Ai+1构造经处理的向量Ai,并且考虑病毒存活期τi。对于不同的时隙,病毒存活期τi可以不同。
发明人如下定义经处理的向量。
一个经处理的向量中的一个信号的信号强度被表示为一个信号向量中的一个范围而不是一个精确值。已知信号分布图中的两个连续的信号向量——在ti处的和在ti+1处的在从ti到ti+1的时间范围内的经处理的向量被表示为其中并且被表示为
在此,γ是指示弱信号强度的值,其在发明人的实验中被设置为-100。然后,发明人在考虑病毒存活期的情况下由确诊病例的信号分布图构造连续的经处理的分布图。发明人呈现了经处理的分布图的正式定义。
已知确诊病例的信号分布图W={(A1,t1),(A2,t2),...,(Ai,ti),...(An,tn)},经处理的分布图被表示为其中由Ai和Ai+1构造,并且τi是针对从ti到ti+1的时隙的病毒存活期。请注意,τi由卫生官员给定,并且对于不同的时隙,它可以不同,这取决于在场所中进行消毒操作的频率。
B.针对感染区域的信号分布图处理
本发明考虑患者未安装app的情况。在此情况下,需要通过调查(信号收集过程)来提取感染区域中的信号。可以通过测量用户的信号向量与感染区域中的每个位置的信号向量的相似性来评估他/她是否与该感染区域具有接触。然而,收集感染区域中的每个位置的WiFi数据是低效的。发明人提出使用感染区域中的一些采样的信号数据来构造该感染区域的经处理的分布图。
代替收集在每个位置处的信号数据,工作人员带着内置WiFi的设备(诸如,电话或Raspberry Pi)在该区域中走动。收集的信号分布图是随时间的一些信号向量。为了生成该区域的代表性经处理的分布图,将所有信号以及它们的RSSI合并到信号分布图中。如图4中所示,将信号向量合并到信号分布图{(A1,t1),(A2,t2),(A3,t3),(A4,t4)}中,所述信号向量是在感染区域中收集的。发明人还考虑了当确诊病例停留在感染区域中时的时间范围[t,t′]和病毒存活期τ来构造该感染区域的经处理的分布图。
一个区域的经处理的分布图被表示为其中是经处理的向量,并且[tstart,tend]是病毒的存活时间范围。已知在感染区域中收集的信号分布图W={(A1,t1),(A2,t2),...,(Ai,ti),...(An,tn)}、确诊病例停留在该区域中的时间范围[t,t′]、以及病毒存活期τ,经处理的分布图被构造为如下:其中aj是W中的扫描信号(即,),并且是W中的aj的最小信号强度,而是W中的aj的最大信号强度;在感染区域中病毒的存活时间是从tstart到tend。
C.信号相似性度量
发明人提出一种用以比较信号向量和经处理的向量的相似性以进行接触者检测的信号相似性度量。该度量考虑信号ID重叠率和RSSI差异。
直观的是,用户越接近病毒的位置,用户的信号向量中和经处理的分布图中的经处理的向量中的共同信号就越多。因此,可以使用两个向量的信号ID的重叠率来指示它们的接近度。已知在时间t处的用户信号向量A和经处理的向量重叠率被计算为:
使用的原因是减轻设备异质性的影响。不同的设备具有不同的扫描信号的能力。两个位于同一位置的设备可以扫描不同数量的信号。表I示出了在大型购物中心中多个位于同一位置的电话的信号向量中的平均信号数量。该平均信号数量对于不同的电话有所不同。该差异对于一些电话可以是重要的。在此情况下,使用|A.a|、或其他项(例如,)作为分母将引入更多的方差。
表I:对于多种移动电话信号向量中的平均信号数量
电话 | 平均信号数量 |
Honor | 75.00 |
Huawei Mate 30 | 128.12 |
OPPO | 180.16 |
Huawei Nova | 92.87 |
Xiaomi | 102.09 |
信号可能覆盖很大区域,具有大量共同信号的两个向量可能不紧密接近。因此,本发明还考虑RSSI差异来表示接近度。如果用户靠近病毒停留,两个向量中的相同信号的RSSI差异应较小。已知用户信号向量A={(a1,t1),(a2,t2),...(ai,ti),...(an,tn)}和经处理的向量对于它的RSSI差异被计算为
在时间戳处的平均RSSI差异被定义为
其中|·|表示信号ID的数目。
D.接触者检测算法
与存活病毒具有接触的任何人都可能处于危险之中。已知在ti处用户的信号向量Ai,如果时间戳ti在病毒存活期内,并且Ai和确诊病例或感染区域的经处理的分布图的相似性大于阈值,则用户被检测为在时间ti处与病毒具有接触。该算法被呈现在算法1中。
已知用户的信号分布图W1、确诊病例或感染区域的信号分布图W2、病毒存活期{τi|i=1,2,...,|W2|-1}以及接近度阈值α,首先由W2和{τi|i=1,2,...,|W2|-1}构造经处理的分布图(算法1第4行)。然后,对于W1中的在时间ti处的每个信号向量Ai,如果ti落入经处理的分布图中的经处理的向量的时隙中,计算ti处的信号相似性(等式5)(第7-9行)。如果ti处的相似性大于给定的阈值α,用户被识别为在ti处与病毒具有接触(第11行)。该算法评估W1和中的每个信号向量的相似性,并且返回检测结果的列表。阈值α取决于如何定义表示密切接触者的接触接近度。将在下一节中讨论信号相似性与物理接近度之间的关系以及对接近度阈值α的确定。
V.例示性实验结果
发明人已经将vContact实施和打包为软件开发工具包(SDK)(对于如第VI节中所讨论的app实施方式)。在本节中,将在SDK上呈现例示性实验结果。首先在第V-A节中介绍实验设置。然后,在V-B节中研究如何设置阈值α。分别在V-C节和第V-D节中讨论在不同场所和对于不同AP数量的性能。然后呈现了对异质设备的研究以及感染区域的进出检测(第V-E节和第V-F节)。最后在第V-G节中将vContact与其他最新方法进行比较。
A.设置
为了评估本发明的接触者检测方法的性能,发明人在三个不同的场地中使用五个移动电话收集WiFi数据。手机的品牌不同,包括Honor(荣耀)、华为Noval、华为Mate30、Xiaomi(小米)和OPPO。这三个实验场地分别是办公室、公交车站和大型购物中心中的商店。办公室的大小是约10m×12m。公交车站是室外区域,其大小是约2m×15m。大型购物中心中用于实验的区域是一个大型商店,其大小为20m×25m。办公室中的信号总数是32,公交车站中的信号总数是109,并且大型购物中心中的信号总数为301。
为了评估针对确诊病例的信号分布图可得的情况的检测性能,首先将五个移动设备放置在位置处10分钟,以收集每个场地中的WiFi数据。收集由设备扫描的具有RSSI的WiFi信号。然后,将设备放置在位置处10分钟以进行数据收集,其中i=1,2,3,4,5,6,7,8,9,10,并且和之间的距离是i米。数据采样率被设置为每个记录5s,因此对于在每个场地的每个距离设置内的设备,具有约120个数据记录。
为了评估针对确诊病例的信号分布图不可得的情况的检测性能,发明人走进实验场地,以使用移动电话收集WiFi数据以构造每个场地的已处理的分布图。然后,发明人带着五个移动电话在该区域周围和外部漫步,以收集WiFi数据以供测试。实验期间记录了发明人在区域内和外的时间。
已知通过用户设备收集的数据D,用Da表示当用户与病毒具有接触时(即,在确诊病例的接触接近度内或在感染区域内)收集的数据,并且使用Db表示被检测为与病毒具有接触的数据。Da是真实(ground-truth)数据,而Db是检测结果。精度、查全率和F1分数被用作评估接触者检测结果的度量。精度被定义为
其中|·|表示数据大小。类似地,查全率被定义为
基于精度和查全率的定义,F1分数被定义为
B.阈值α
如第IV节中所介绍的,接触者检测算法依赖于阈值α来识别接触者。在本节中,讨论α的选择。已知接触接近度k米,如果用户和病毒之间的距离小于k米,则他/她应被检测为与病毒具有接触。直观上,α与接触接近度有关,并且对于不同的接触接近度它应不同。发明人将在一个场地中在处收集的数据用作来自确诊病例的数据,并且针对在同一场地中在(i>0)处收集的数据检测接触者。当k米被设置为接触接近度时,Da包含在处收集的数据,其中i≤k。这三个场地的数据在本部分中被用于评估。
精度和查全率被用作度量,并且在图5(a)、图5(b)和图5(c)中呈现了对于k=1m、k=2m和k=4m,α与精度和查全率的关系的结果。随着阈值α增加,精度提高,而查全率降低。原因是较大的阈值指示较紧密的接近度。因此,增加阈值将导致高精度。然而,如果阈值被设置得太大,则距离小于k米的某些数据将不被检测,从而导致查全率下降。
可以根据精度和查全率的要求来选择阈值,以进行密切接触者检测。为了平衡精度和查全率,对于以下的讨论,选择相交点,相交点的精度和查全率是相等的。在图5(a)中,当α被设置为0.25时,针对k=1m的精度和查全率是低的,这表明在1m以内识别接触者是困难的。如图5(b)中所示,当阈值是约0.20时,针对k=2m的精度和查全率具有显著提高。如果阈值是约0.17,图5(c)中的针对k=4m的精度和查全率是高的(约70%)。使用相同的策略来选择用于其他接触接近度的阈值。
C.场地研究
在本节中,呈现了在不同场地中进行接触者检测的性能。使用不同的距离(k=1m、2m、3m、4m、5m)来表示接触接近度,阈值是根据第V-B节中的讨论设置的。接触接近度与精度的关系的结果被示出在图6中,而接触接近度与查全率的关系的结果被示出在图7中。
在图6中,随着接触接近度增加,三个场地中的精度也提高,这表明在较大的接近度内更容易检测到接触者。在所有场地中,针对k=1m的精度是低的。结果示出,由于在1m范围内的WiFi信号通常是类似的,因此难以识别是否在1m内发生接触。然而,对于较大的接触接近度,精度被提高。当接近度是3m时,精度是高的(72%-79%)。在室内(办公室和大型购物中心)的精度好于在室外的精度,因为WiFi信号在室内更稳定。与大型购物中心场景相比,办公室场景中的改善更为显著。图7中所示的查全率与精度的结果类似。当k≥2m时,本发明的方法在查全率方面具有良好的性能。
D.AP数量
在本部分中,评估AP数量对性能的影响。办公室、公交车站和大型购物中心的信号向量中的平均信号数量(即,扫描的AP)分别是19.02、24.0、46.29。从每个场地的信号向量随机过滤σ%的信号,并且比较两个设备的信号相似性以进行接触者检测。过滤率σ%被设置为10%-90%。精度和查全率与平均信号数量的关系被呈现在图8(a)、图8(b)和图8(c)中。根据在第V-B节中的讨论,接触接近度被设置为k=2m,并且阈值被设置为0.20以进行接触者检测。
在图8(a)、图8(b)和图8(c)中,随着平均信号数量增加,精度略微提高。当平均信号数量小时,精度仍然是可接受的。即使去除90%的信号,对于办公室场地和大型购物中心场地,精度也未显著下降。在户外(公交车站)的精度比其他地方更稳定。随着信号数量改变,图8(a)、图8(b)和图8(c)中所示的查全率没有明显改变,证明了本发明的方法的鲁棒性。
E.异质设备
不同的设备具有不同的扫描WiFi信号的能力。两个位于同一位置的设备可能扫描不同的信号和RSSI。发明人评估不同的设备的性能。对于每个设备,将它在处的数据与在同一场地中的其他设备在处的数据进行比较。发明人根据第V-B节中的讨论将接触接近度设置为1m-5m并且设置阈值。精度和查全率被用作度量。
办公室场地中不同的设备的精度与接触接近度的关系被呈现在图9中。己知接触接近度,对于不同的设备,精度是不同的,这与本文中的讨论一致。随着接触接近度增加,所有设备的精度都提高。当k≥2m时,所有设备的精度都显著提高。图10中呈现了在办公室中不同的设备的查全率与接触接近度的关系。类似于精度的结果,当k=2m时,所有设备的性能在查全率上都有大的提高。当k≥2m时,所有设备都实现高查全率,这表明本发明的方法在查全率上具有良好的性能。结果证明,本发明的方法是高效的,并且它可以适用于不同品牌的电话。在其他两个场地上的实验中,发明人具有类似的发现。鉴于此,这里未示出其他场地的结果。
F.感染区域的进出检测
针对不具有app的确诊病例的接触者检测是检测用户是在感染区域之内还是之外。发明人使用收集的WiFi数据构造办公室、公交车站和大型购物中心中的商店的经处理的分布图。然后,比较该区域的经处理的分布图与在该区域内和外收集的数据之间的相似性。如果相似性大于阈值α,则数据被识别为在该区域中被收集并且与病毒具有接触。在实验中α被设置为0.2。精度和查全率被用作用于评估的度量。结果被示出在图11中。在所有场地中的检测都实现良好的性能。对于这三个场地,精度和查全率是高的,这例示vContact对于感染区域的进出检测是非常高效的。
G.与其他方法的比较
将vContact与一些其他最先进的方法进行比较,所述最先进的方法被介绍如下,
·蓝牙:它广泛用于数字接触者追踪。为了收集蓝牙数据,将两个移动设备在三个实验场地中以k米的距离放置10分钟,其中k被设置为{1,2,3,4,5,6,7,8,9,10}。将一个设备用作广播器,将另一个设备用作扫描仪。扫描仪可以扫描来自广播器的蓝牙信号,并且随时间记录RSSI。对于每个接触接近度k米,选择一个阈值进行接触者检测。如果接收到的信号强度大于该阈值,它们被检测为具有接触。
·杰卡德相似性(Jaccard similarity):它被用来评估两个集合的相似性,并且它被定义为两个集合的交集的大小除以两个集合的并集的大小。如果两个信号向量的杰卡德相似性大于阈值,它们被识别为在接触接近度内。
·平均L-1距离(ALD):它是信号强度差异的平均L-1范数。如果两个信号向量的ALD小于阈值,它们被识别为在接触接近度内。
·欧几里德距离(AED):它是信号强度差异的平均欧几里德距离。如果两个信号向量的AED小于阈值,它们被识别为在接触接近度内。
对于基准方法ALD和AED,已知两个信号向量A和B,如果在A中扫描到信号但在B中未扫描到信号,则在B中信号强度被设置为-100以进行计算。
由于基准方法依赖于所选择的用以检测接触者的阈值,因此对于给定的接触接近度,使用相同的策略来选择阈值,如在第V-B节中所讨论的。精度、查全率和F1分数被用作性能比较的度量。
在图12(a)、图12(b)和图12(c)(办公室)、图13(a)、图13(b)和图13(c)(公交车站)以及图14(a)、图14(b)和图14(c)(大型购物中心)中呈现了针对三个数据集的精度、查全率和F1分数与接近度的关系的结果。在图12(a)、图12(b)和图12(c)中,不同的方法的精度、查全率和F1分数随着接触接近度增加而提高。在精确度和F1分数的度量上,vContact始终优于其他基准方法。当接触接近度小于5m时,vContact具有比其他方法高的查全率;当接触接近度是5m时,vContact具有与蓝牙类似的性能。针对其他数据集的精度、查全率和F1分数的曲线具有与针对办公室数据集的精度、查全率和F1分数的曲线类似的趋势。如图13(a)中所示,蓝牙的精度略微高于针对公交车站数据集的vContact。但是就查全率和F1分数而言,vContact的性能优于蓝牙和其他方法。至于针对大型购物中心数据集的性能,当接触接近度是1m和2m时,vContact具有与蓝牙类似的精度,但是当接触接近度是3m和4m时,vContact的精度具有显著提高。在图14(b)中,vContact具有与蓝牙和ALD类似的查全率。vContact始终优于使用WiFi数据进行检测的其他方法。总体而言,vContact在所有数据集中具有比其他方法高的F1分数,这表明vContact对于接触者检测而言更高效。还可以从图中得知,vContact和其他方法在室内场景中具有更好的性能,并且就室外场所相比较而言,vContact的改进更显著。
VI.APP实施方式作为一个案例研究
借助vContact SDK,发明人实现了一款Android app,该app通知其用户对病毒的暴露持续时间。在本节中,首先在第VI-A节中报告其实施细节和用户界面,接着是在第VI-B节中报告该app的一些测量结果,以证明和验证其设计。
A.用于暴露通知的实施方式
发明人使用本发明的方法开发了一款app以进行曝光通知。该app的一些屏幕截图被示出在图15(a)、图15(b)、图15(c)和图15(d)中。如图15(a)中所示,一旦用户打开“Exposure data collection”按钮,该app将扫描附近的WiFi并且每1分钟在本地存储一次数据。当数据被存储时,将对信号ID(即,AP MAC地址)进行加密。如果一个人被确诊为感染,他/她可以将其信号分布图上传到服务器(图15(b)),以使得其他人可以下载数据以进行匹配。如果一个用户与确诊病例有密切接触,她/他将收到通知,示出何时发生了密切接触以及接触持续时间有多长(图15(c))。在该app中,每天自动下载并且匹配数据。出于测试的目的,该app还具有如图15(d)中所示的测试模式,通过该测试模式可以下载数据,并且在测试期间手动触发检测。
B.测试和验证
将接触接近度设置为2m以进行测试。该app每1分钟收集一次WiFi数据。因此,在第IV节中介绍的检测方法将每分钟报告一次数据的检测结果(即,真或假)。在发明人的测试中,如果一个用户在10分钟的滑动时间窗口内在2m内与病毒在一起停留超过5分钟,他/他将收到可能暴露通知。请注意,接触持续时间和滑动时间窗口的长度是该app的参数,所述参数可以根据卫生官员的建议进行改变。
发明人在办公室中使用五个不同品牌的电话测试该app。程序如下。将电话之一选择作为确认病例,将其他电话放置在远离该确认病例2m的位置处。打开“Exposure datacollection”按钮15分钟。然后,该确诊病例上传其信号分布图,并且其他电话下载该信号分布图以进行匹配。在此之后,将其他手机放置在远离该确诊病例4m的位置处,并且重复测试。依次将每个电话选择作为确诊病例。理想的结果是,电话仅在它远离确诊病例2m时收到通知,而在它远离确诊病例4m时不会收到通知。测试结果被呈现在表II和III中。√是指电话接收到通知,而×是指电话未接收到通知。
表II:对于2M的间距暴露通知的结果
表III:对于4M的间距暴露通知的结果
表II示出了在2m的情况下暴露通知的结果。它例示了本发明的app用于进行曝光通知的良好性能。Honor电话的性能不如其他电话,表明电话扫描WiFi信号的能力不同。
在表III中示出了在4m的情况下暴露通知的结果。与表II中的结果相比,更多电话被检测为具有非密切接触,这与发明人的预期一致。对于不同的电话,性能不同,但是总体性能是良好的。
VII.结论
在本发明中,考虑到病毒具有存活期,发明人考虑自动数字接触者追踪。利用普遍存在的WiFi信号,发明人提出了一种隐私的基于WiFi的检测病毒存活期内的密切接触者的方法,该方法被称为vContact。本发明的方法既充分体现与感染者同时位于同一位置的人的情况,又充分体现在病毒存活期内进入先前由感染者访问过的区域的人的情况。据发明人所知,这是在使用WiFi进行隐私的接触者追踪中考虑病毒存活期的第一件成果。发明人提出数据处理方法和信号相似性度量以用于进行密切接触者检测。发明人进行了广泛的实验以进行评估。实验结果表明,本发明的方法是高效的、稳定的并且可部署的。本发明的方法对于不同的实验场所实现高精度和查全率(当接触接近度是3m时,为70%–90%),并且相对于不同信号数量和不同品牌的设备的影响,它是鲁棒的。已经实现了基于vContact的Android应用,并且证明了本发明的设计的有效性。
本发明可以实现为一种计算机设备,其包括存储器和处理器,所述存储器上存储有可由处理器执行的计算机指令,所述计算机指令在由所述处理器执行时指示所述处理器执行本发明的方法的各步骤。可执行的计算机指令可以应用程序(如上述的本发明的app)的形式体现和实施。表现为该计算机设备可以广义地为服务器、终端,或任何其他具有必要的计算和/或处理能力的电子设备。在一个实施例中,该计算机设备可包括通过系统总线连接的处理器、存储器、网络接口、通信接口等。该计算机设备的处理器可用于提供必要的计算、处理和/或控制能力。该计算机设备的存储器可包括非易失性存储介质和内存储器。该非易失性存储介质中或上可存储有操作系统、计算机程序等。该内存储器可为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口和通信接口可用于与外部的设备通过网络连接和通信。该计算机程序被处理器执行时执行本发明的方法的步骤。
本发明可以实现为一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在由处理器执行时导致本发明的方法的步骤被执行。在一个实施例中,所述计算机程序被分布在网络耦合的多个计算机设备或处理器上,以使得所述计算机程序由一个或多个计算机设备或处理器以分布式方式存储、访问和执行。单个方法步骤/操作,或者两个或更多个方法步骤/操作,可以由单个计算机设备或处理器或由两个或更多个计算机设备或处理器执行。一个或多个方法步骤/操作可以由一个或多个计算机设备或处理器执行,并且一个或多个其他方法步骤/操作可以由一个或多个其他计算机设备或处理器执行。一个或多个计算机设备或处理器可以执行单个方法步骤/操作,或执行两个或更多个方法步骤/操作。
本领域普通技术人员可以理解,本发明的全部或部分步骤可以通过计算机程序来指示相关的硬件如计算机设备或处理器完成,所述的计算机程序可存储于非暂时性计算机可读存储介质中,该计算机程序被执行时导致本发明的方法的步骤被执行。根据情况,本文中对存储器、存储、数据库或其它介质的任何引用可包括非易失性和/或易失性存储器。非易失性存储器的示例包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)、闪存、磁带、软盘、磁光数据存储装置、光学数据存储装置、硬盘、固态盘等。易失性存储器的示例包括随机存取存储器(RAM)、外部高速缓冲存储器等。
以上描述的各技术特征可以任意地组合。尽管未对这些技术特征的所有可能组合进行描述,但这些技术特征的任何组合都应当被认为由本说明书涵盖,只要这样的组合不存在矛盾。
尽管结合实施例对本发明进行了描述,但本领域技术人员应理解,上文的描述和附图仅是示例性而非限制性的,本发明不限于所公开的实施例。在不偏离本发明的精神的情况下,各种改型和变体是可能的。
Claims (21)
1.一种用于针对接触者追踪的数据处理的方法,包括:
-获取与确诊病例相关联的信号分布图W;
W={(A1,t1),(A2,t2),...,(Ai,ti),...(An,tn)},
其中,ti和ti+1是在根据所述确诊病例评估的所述确诊病例感染的病毒的病毒存活时间范围内的相继的离散时间,时间ti+1在时间ti之后,
|Ai∪Ai+1|表示并集Ai∪Ai+1中的信号向量的数目,Ai.a表示Ai中的信号ID,Ai+1.a表示Ai+1中的信号ID,al和分别表示并集Ai∪Ai+1中第l个信号向量中包括的信号ID和信号强度范围,
γ是设置的指示弱信号强度的值,
其中,所述信号ID是相应的信号接入点的MAC地址的散列值,
所述经处理的分布图用于进行接触者追踪。
2.一种用于针对接触者追踪的数据处理的方法,包括:
-获取与确诊病例相关联的一个感染区域的信号分布图W;
W={(A1,t1),(A2,t2),...,(Ai,ti),...(An,tn)},
其中,ti和ti+1是在所述确诊病例停留在所述感染区域的时间范围[t,t′]内的相继的离散时间,时间ti+1在时间ti之后,tstart=t,tend=t′+τ,τ是病毒存活期,
其中,所述信号ID是相应的信号接入点的MAC地址的散列值,
所述经处理的分布图用于进行接触者追踪。
3.根据权利要求1或2所述的方法,还包括:
-提供所述经处理的分布图用于进行接触者追踪。
4.一种用于进行接触者追踪的方法,包括:
W={(A1,t1),(A2,t2),...,(Ai,ti),...(An,tn)},
其中,ti和ti+1是在根据所述确诊病例评估的所述确诊病例感染的病毒的病毒存活时间范围内的相继的离散时间,时间ti+1在时间ti之后,
|Ai∪Ai+1|表示并集Ai∪Ai+1中的信号向量的数目,Ai.a表示Ai中的信号ID,Ai+1.a表示Ai+1中的信号ID,al和分别表示并集Ai∪Ai+1中第l个信号向量中包括的信号ID和信号强度范围,
γ是设置的指示弱信号强度的值,
其中,所述信号ID是相应的信号接入点的MAC地址的散列值;
-获取所述感兴趣用户的原始信号分布图W1,
W1={(AU1,t1),(AU2,t2),...,(AUi′,ti′),...(AUn′,tn′)},
-判断所述感兴趣用户是否与病毒有接触,所述判断包括:
对于W1中的在每个时间ti′处的信号向量AUi′,如果该时间ti′落入所述经处理的分布图中涉及的某个时隙[ti,ti+1+τi],计算所述信号向量AUi′与该时隙[ti,ti+1+τi]内的经处理的向量中包括的信号向量的相似性,以及
如果所述相似性大于给定的阈值,判断所述感兴趣用户在时间ti′处与病毒具有接触。
7.根据权利要求4-6中任一项所述的方法,还包括:
-在判断所述感兴趣用户在多个ti′处与病毒具有接触的情况下,计算所述多个ti′中的时间最早者和时间最晚者之间的持续时间段作为所述感兴趣用户与病毒的接触时间;以及
-如果所述接触时间长于阈值持续时间长度,判断所述感兴趣用户为所述确诊病例的密切接触者。
8.一种用于进行接触者追踪的方法,包括:
W={(A1,t1),(A2,t2),...,(Ai,ti),...(An,tn)},
其中,ti和ti+1是在所述确诊病例停留在所述感染区域的时间范围[t,t′]内的相继的离散时间,时间ti+1在时间ti之后,tstart=t,tend=t′+τ,τ是病毒存活期,
其中,所述信号ID是相应的信号接入点的MAC地址的散列值;
-获取所述感兴趣用户的原始信号分布图W1,
W1={(AU1,t1),(AU2,t2),...,(AUi′,ti′),...(AUn′,tn′)},
-判断所述感兴趣用户是否与病毒有接触,所述判断包括:
如果所述相似性大于给定的阈值,判断所述感兴趣用户在时间ti′处与病毒具有接触。
11.根据权利要求8-10中任一项所述的方法,还包括:
-在判断所述感兴趣用户在多个ti′处与病毒具有接触的情况下,计算所述多个ti′中的时间最早者和时间最晚者之间的持续时间段作为所述感兴趣用户与病毒的接触时间;以及
-如果所述接触时间长于阈值持续时间长度,判断所述感兴趣用户为所述确诊病例的密切接触者。
12.根据权利要求4-11中任一项所述的方法,其中,所述阈值不小于0.25,或小于0.25且不小于0.20,或小于0.20且不小于0.17。
13.根据权利要求1-11中任一项所述的方法,其中,所述无线网络信号为WiFi信号。
14.根据权利要求1-11中任一项所述的方法,其中,所述散列值是经加密的。
15.根据权利要求1和4-10中任一项所述的方法,其中,所述设备为手机。
16.一种用于针对接触者追踪的数据处理的服务器,包括处理器,所述处理器被配置为执行计算机指令以:
-获取与确诊病例相关联的信号分布图W;
W={(A1,t1),(A2,t2),...,(Ai,ti),...(An,tn)},
其中,ti和ti+1是在根据所述确诊病例评估的所述确诊病例感染的病毒的病毒存活时间范围内的相继的离散时间,时间ti+1在时间ti之后,
|Ai∪Ai+1|表示并集Ai∪Ai+1中的信号向量的数目,Ai.a表示Ai中的信号ID,Ai+1.a表示Ai+1中的信号ID,al和分别表示并集Ai∪Ai+1中第l个信号向量中包括的信号ID和信号强度范围,
γ是设置的指示弱信号强度的值,
其中,所述信号ID是相应的信号接入点的MAC地址的散列值,
所述经处理的分布图用于进行接触者追踪。
17.一种用于针对接触者追踪的数据处理的服务器,包括处理器,所述处理器被配置为执行计算机指令以:
-获取与确诊病例相关联的一个感染区域的信号分布图W;
W={(A1,t1),(A2,t2),...,(Ai,ti),...(An,tn)},
其中,ti和ti+1是在所述确诊病例停留在所述感染区域的时间范围[t,t′]内的相继的离散时间,时间ti+1在时间ti之后,tstart=t,tend=t′+τ,τ是病毒存活期,
其中,所述信号ID是相应的信号接入点的MAC地址的散列值,
所述经处理的分布图用于进行接触者追踪。
18.根据权利要求16或17所述的服务器,其中,所述处理器还被配置为执行计算机指令以:
-提供所述经处理的分布图用于进行接触者追踪。
19.一种用于进行接触者追踪的系统,包括处理器,所述处理器被配置为执行计算机指令以导致根据权利要求4-12中任一项的方法或引用权利要求4-11中之一的权利要求13-15中任一项所述的方法被执行。
20.一种计算机设备,包括存储器和处理器,所述存储器上存储有计算机指令,所述计算机指令在由所述处理器执行时导致根据权利要求1-15中任一项所述的方法被执行。
21.一种非暂时性计算机可读存储介质,其上存储有计算机指令,所述计算机指令在由处理器执行时导致根据权利要求1-15中任一项所述的方法被执行。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063102753P | 2020-06-30 | 2020-06-30 | |
US63/102,753 | 2020-06-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113873441A true CN113873441A (zh) | 2021-12-31 |
CN113873441B CN113873441B (zh) | 2024-02-09 |
Family
ID=78990118
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110746980.XA Active CN113873441B (zh) | 2020-06-30 | 2021-06-30 | 接触者追踪的方法及相应的处理方法、系统、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113873441B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114842980A (zh) * | 2022-04-14 | 2022-08-02 | 浙江大学 | 一种基于WiFi匹配的传染病易感人群接触追踪预筛选方法 |
CN115348578A (zh) * | 2022-10-13 | 2022-11-15 | 芯昇科技有限公司 | 一种接触者追踪方法及装置 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040236850A1 (en) * | 2003-05-19 | 2004-11-25 | Microsoft Corporation, Redmond, Washington | Client proximity detection method and system |
US8989101B1 (en) * | 2013-06-27 | 2015-03-24 | Google Inc. | Systems, methods, and computer-readable media for identifying virtual access points of wireless networks |
CN105740615A (zh) * | 2016-01-28 | 2016-07-06 | 中山大学 | 利用手机轨迹追踪传染源和预测传染病流行趋势的方法 |
US20180052970A1 (en) * | 2016-08-16 | 2018-02-22 | International Business Machines Corporation | Tracking pathogen exposure |
CN108989987A (zh) * | 2017-06-05 | 2018-12-11 | 慧与发展有限责任合伙企业 | 使用频繁客户端移动性模式确定客户端设备存在于场所中 |
CN110378002A (zh) * | 2019-07-11 | 2019-10-25 | 华中农业大学 | 基于移动轨迹的社会关系建模方法 |
CN110959181A (zh) * | 2017-07-28 | 2020-04-03 | 皇家飞利浦有限公司 | 使用实时定位系统监测医疗保健设施中感染的直接传播和间接传播 |
CN111027525A (zh) * | 2020-03-09 | 2020-04-17 | 中国民用航空总局第二研究所 | 疫情期间公共场所潜在被感染者追踪方法、装置及系统 |
CN111261301A (zh) * | 2020-02-13 | 2020-06-09 | 姜通渊 | 一种大数据传染病防控方法及系统 |
CN111261302A (zh) * | 2020-02-26 | 2020-06-09 | 汤一平 | 基于时空轨迹数据的流行传染病病毒场可视化方法及系统 |
CN111312406A (zh) * | 2020-03-15 | 2020-06-19 | 智博云信息科技(广州)有限公司 | 一种疫情标签数据处理方法及系统 |
CN111342916A (zh) * | 2020-04-13 | 2020-06-26 | 北京智源人工智能研究院 | 人员管控方法及系统 |
-
2021
- 2021-06-30 CN CN202110746980.XA patent/CN113873441B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040236850A1 (en) * | 2003-05-19 | 2004-11-25 | Microsoft Corporation, Redmond, Washington | Client proximity detection method and system |
US8989101B1 (en) * | 2013-06-27 | 2015-03-24 | Google Inc. | Systems, methods, and computer-readable media for identifying virtual access points of wireless networks |
CN105740615A (zh) * | 2016-01-28 | 2016-07-06 | 中山大学 | 利用手机轨迹追踪传染源和预测传染病流行趋势的方法 |
US20180052970A1 (en) * | 2016-08-16 | 2018-02-22 | International Business Machines Corporation | Tracking pathogen exposure |
CN108989987A (zh) * | 2017-06-05 | 2018-12-11 | 慧与发展有限责任合伙企业 | 使用频繁客户端移动性模式确定客户端设备存在于场所中 |
CN110959181A (zh) * | 2017-07-28 | 2020-04-03 | 皇家飞利浦有限公司 | 使用实时定位系统监测医疗保健设施中感染的直接传播和间接传播 |
CN110378002A (zh) * | 2019-07-11 | 2019-10-25 | 华中农业大学 | 基于移动轨迹的社会关系建模方法 |
CN111261301A (zh) * | 2020-02-13 | 2020-06-09 | 姜通渊 | 一种大数据传染病防控方法及系统 |
CN111261302A (zh) * | 2020-02-26 | 2020-06-09 | 汤一平 | 基于时空轨迹数据的流行传染病病毒场可视化方法及系统 |
CN111027525A (zh) * | 2020-03-09 | 2020-04-17 | 中国民用航空总局第二研究所 | 疫情期间公共场所潜在被感染者追踪方法、装置及系统 |
CN111312406A (zh) * | 2020-03-15 | 2020-06-19 | 智博云信息科技(广州)有限公司 | 一种疫情标签数据处理方法及系统 |
CN111342916A (zh) * | 2020-04-13 | 2020-06-26 | 北京智源人工智能研究院 | 人员管控方法及系统 |
Non-Patent Citations (4)
Title |
---|
PENGJIA TU: "Epidemic Contact Tracing With Campus WiFi Network and Smartphone-Based Pedestrian Dead Reckoning", 《IEEE SENSORS JOURNAL》 * |
应申;徐雅洁;窦小影;陈学业;赵军;郭晗;: "地理位置关联的COVID-19传播时空分析", 武汉大学学报(信息科学版), no. 06 * |
纪航军;尹新;杨宏亮;: "快速追踪感染者接触同行人问题研究", 通讯世界, no. 03 * |
胡佳雄;马敬东;: "基于Wi-Fi探针的新冠肺炎患者轨迹追溯系统设计", 医疗卫生装备, no. 06 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114842980A (zh) * | 2022-04-14 | 2022-08-02 | 浙江大学 | 一种基于WiFi匹配的传染病易感人群接触追踪预筛选方法 |
CN114842980B (zh) * | 2022-04-14 | 2023-07-25 | 浙江大学 | 一种基于WiFi匹配的传染病易感人群接触追踪预筛选方法 |
CN115348578A (zh) * | 2022-10-13 | 2022-11-15 | 芯昇科技有限公司 | 一种接触者追踪方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113873441B (zh) | 2024-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sapiezynski et al. | Inferring person-to-person proximity using WiFi signals | |
US8922344B2 (en) | Detecting rogue radio frequency based tags based on locationing | |
JP5871928B2 (ja) | 所定の領域内のユーザトラフィックを分析するための方法及び装置 | |
Wu et al. | Mitigating large errors in WiFi-based indoor localization for smartphones | |
Tippenhauer et al. | Attacks on public WLAN-based positioning systems | |
US9544721B2 (en) | Address point data mining | |
KR101089995B1 (ko) | 핑거 프린트 방식의 위치 추적 시스템 및 그 방법 | |
Chon et al. | Sensing WiFi packets in the air: Practicality and implications in urban mobility monitoring | |
He et al. | Chameleon: Survey-free updating of a fingerprint database for indoor localization | |
US10440579B1 (en) | Internet of things location spoofing detection | |
Li et al. | vContact: Private WiFi-based IoT contact tracing with virus lifespan | |
KR101286169B1 (ko) | 무선 통신 단말의 위치 측정 장치, 위치 측정 방법 및 핑거프린트 정보 수집 방법, 핑거프린트 서버 및 그의 위치 제공 방법 | |
CN113873441B (zh) | 接触者追踪的方法及相应的处理方法、系统、设备和介质 | |
Vhaduri et al. | Opportunistic discovery of personal places using multi-source sensor data | |
US20150373692A1 (en) | Anonymous fingerprint generation for mobile communication device | |
Yan et al. | Location verification systems under spatially correlated shadowing | |
US20190356571A1 (en) | Determining attributes using captured network probe data in a wireless communications system | |
Chernyshev et al. | Revisiting urban war nibbling: Mobile passive discovery of classic bluetooth devices using ubertooth one | |
US8519884B2 (en) | Distance estimation | |
Liu et al. | Location-aware smart campus security application | |
WO2022193170A1 (zh) | 一种针对手机信令数据的停留识别评估方法、系统、终端以及存储介质 | |
Kyaw et al. | Wi-Pi: a study of WLAN security in Auckland CBD | |
CN113434786A (zh) | 一种基于时空序列检索的确诊患者密切接触人员快速识别方法及装置 | |
Li et al. | An indoor collaborative pedestrian dead reckoning system | |
Malloy et al. | Network-side digital contact tracing on a large university campus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |