CN111459723B - 终端数据处理系统 - Google Patents

终端数据处理系统 Download PDF

Info

Publication number
CN111459723B
CN111459723B CN202010571061.9A CN202010571061A CN111459723B CN 111459723 B CN111459723 B CN 111459723B CN 202010571061 A CN202010571061 A CN 202010571061A CN 111459723 B CN111459723 B CN 111459723B
Authority
CN
China
Prior art keywords
terminal
grid
wifi
counter
time window
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010571061.9A
Other languages
English (en)
Other versions
CN111459723A (zh
Inventor
方毅
姚建明
陈文容
朱金星
尹雅露
汤灵玲
郑杰
盛国平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shu Lan Hangzhou Hospital Ltd
Merit Interactive Co Ltd
Original Assignee
Shu Lan Hangzhou Hospital Ltd
Zhejiang Meiri Interdynamic Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shu Lan Hangzhou Hospital Ltd, Zhejiang Meiri Interdynamic Network Technology Co ltd filed Critical Shu Lan Hangzhou Hospital Ltd
Publication of CN111459723A publication Critical patent/CN111459723A/zh
Application granted granted Critical
Publication of CN111459723B publication Critical patent/CN111459723B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种终端数据处理系统,包括服务器、数据库和存储有计算机程序的存储介质,服务器与数据库通信连接;其特征在于,所述数据库中存储有终端数据,所述终端数据包括终端ID、终端的历史网格、历史网格的上传时间t1、终端连接的WIFI‑ID、WIFI‑ID的上传时间t2,所述服务器执行所述计算机程序完成相应的步骤并实现相应的功能。

Description

终端数据处理系统
技术领域
本发明涉及计算机技术领域,尤其涉及一种终端数据处理系统。
背景技术
随着计算机技术的发展,人们常利用计算机对相关数据进行处理,并进行直观显示。现有的数据处理系统通常包括数据输入系统、处理子系统和输出显示系统。输入系统可以接收用户的输入数据、传感器数据、数据库中存储的数据等,输出显示系统用于向用户显示数据处理的结果,处理子系统是数据处理系统的核心,包括可运行数据处理程序的处理服务器或服务器集群,在处理相对少量数据的时候,几乎所有的计算设备均可以实时的进行数据处理。
但是,很多应用场景下需要处理海量的动态数据,例如,2019新型冠状病毒(2019-nCoV)疫情期间,需要对全国(甚至全球)的移动终端数据进行实时处理,从而对疫情传播、监测、防控,以及疫情后恢复等提供帮助。这种场景下,每天涉及处理的实时数据达到百亿级,处理子系统的实时性会大大降低,通过增加硬件数量或采用更高速的硬件设备可以线性提升处理速度,部分缓解实时性问题,但是这样会大幅增加成本,且布置及调试大量新加入的硬件设备也需要花费大量的时间,因此,如何在已有的硬件设备上提高处理海量动态数据的实时性成为亟待解决的技术问题。
发明内容
本发明实施例提供了一种终端数据处理方法及装置、电子设备和存储介质,旨在解决相关技术中识别去过疫区的人群的方式效率和准确性均低下的技术问题。
本发明提供了一种终端数据处理系统,包括服务器、数据库和存储有计算机程序的存储介质,服务器与数据库通信连接;其特征在于,所述数据库中存储有终端数据,所述终端数据包括终端ID、终端的历史网格、历史网格的上传时间t1、终端连接的WIFI-ID、WIFI-ID的上传时间t2,所述服务器执行所述计算机程序完成相应的步骤并实现相应的功能。
通过以上技术方案,可自动、高效地判断当前地理区域的所有移动终端在指定时段是否在指定地理区域上传过历史位置,换言之,可快速、准确地判定自动识别移动终端的持有者在指定时段是否去过疫区。由此,大大提升了数据处理的效率,节省了时间成本和人工成本。而由于该技术方案耗时相对相关技术中的数据处理方式较短,则更能够适应疫区分布的实时变动,可根据疫区分布的实时变动随时进行待管控对象的识别,大大提升了疫情管控的效率和有效性。
具体实施方式
为了更好的理解本发明的技术方案,下面对本发明实施例进行详细描述。应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
根据本发明,提供了一种终端数据处理系统,包括服务器、数据库和存储有计算机程序的存储介质,服务器与数据库通信连接。本领域技术人员知晓,服务器和数据库并非特指一台硬件设备和/或软件设备,还可以是服务器集群、存储集群等。换言之,能够进行数据处理的任何计算设备或多个计算设备的组合均可以认为是服务器,能够进行数据存储的任何存储设备或多个存储设备的组合均可以认为是数据库。服务器和数据库可以是独立的设备,也可以共享一个或多个独立设备。
优选的,服务器还与多个移动终端通信连接,接收并处理移动终端上传的数据,并将处理后的数据存储到数据库中。一个示例中,数据库中移动终端的数量级为亿级到十亿级,移动终端每日上传数据的数量级为百亿级。
根据本发明,移动终端上传到服务器的上传内容包括:终端ID、终端位置P、终端连接的WIFI-ID和/或上传时间t。
根据本发明,移动终端上传数据的方式包括:可配置的轮询和/或中断方式。轮询方式为,终端每隔固定时间向服务器上传数据;中断方式为,终端状态发生变化时向服务器上传数据,例如终端从连接或断开到某个WIFI时,或者终端从基站甲的覆盖范围变换到基站乙的覆盖范围时,或者终端启动或关闭APP时等。本发明并不对终端数据的上传途径予以限定。例如,可以为移动终端中安装的APP所上传的终端信息,或移动终端经由通信连接的基站所上传的终端信息,或移动终端中集成在APP中的SDK所上传的终端信息等。示例性的,移动终端在使用出行APP的过程中,出行APP识别出移动终端的实时位置并上传。
根据本发明,终端ID为可用来区分不同移动终端的唯一编码。示例性地,终端ID可以为移动终端的IMEI、IMSI、MAC地址、SIM卡号之任一或其组合,和/或经过加密处理(例如MD5加密处理)的移动终端的IMEI、IMSI、MAC地址、SIM卡号之任一或其组合。
根据本发明,终端位置P可以通过以下任一或任意组合的方式获取:(1)通过移动终端的GPS获取;(2)通过移动终端连接或扫描到的WIFI获取;(3)通过移动终端连接的基站获取。终端位置P的格式可以为终端的经纬度坐标,也可以为经纬度坐标进行变换后的地理网格,例如Geohash网格。
根据本发明,移动终端向服务器上传数据具有的采样特点包括:第一、高采样率,在“日”时间周期内,采样率约30%,在“月”时间周期内,采样率为80%以上。第二、采样不均匀,受移动终端的使用情况和环境影响,例如地图导航期间,几秒上传一次终端位置P;不使用移动终端期间,0.5-2个小时才上传一次数据;信号不好的地方,不会上传数据等。
优选的,服务器对上传数据的处理包括:
S1,终端ID的合并,即把经常同时出现在临近位置的终端ID合并为一个终端ID,排除一人双机/多机/测试机/工程机/手机农场等情况。具体合并的方法可以采用现有技术方式或申请人特有技术进行。
S2,根据预设的网格和时间段,对上传数据进行有损压缩。当上传的终端位置P为经纬度坐标时,可以根据终端位置P进行坐标变换确定唯一的网格,当然本发明也不排斥终端在上传前就在终端本地完成了坐标转换。时间段可以配置,优选配置为1小时,即00:00:00-00:00:59为第一个时间段,01:00:00-01:00:59为第二时间段,以此类推;当然可以0.5个小时、2个小时、24个小时(即天)等。
本发明中,如无相反定义或特殊说明:术语“网格”指矩形排布的地理空间区域;网格优选为一个Geohash网格或者相邻的多个Geohash网格,Geohash网格例如7位或8位的Geohash网格,其唯一标识为7位或8位的字符串。示例性的一种实施方式中,网格为一个7位的Geohash网格,示例性的另一种实施方式中,网格为两个相邻的构成(近似)正方形的8位Geohash网格。“网格集合”指一个或多个不存在重叠地理空间区域的网格,如两个网格集合之间存在相同的网格,可以认为两个网格集合存在交集。“区域”可以指行政区域;也可以是用户定义的区域,例如用户在电子地图上圈选的区域;对于行政区域,终端数据处理系统中存储有行政区域与网格集合的映射关系;对于用户定义的区域,终端数据处理系统通过坐标变换程序,可以将区域转换为对应的多个网格集合。
有损压缩方式为,将经过S1处理后的同一终端ID在同一时间段内出现在同一网格内的多个数据压缩为一个数据,将同一时间段内连接到同一WIFI-ID的多个数据压缩为一个数据。例如,终端ID1上传的数据(以cvs格式为例说明)中包括:
1、ID1,XXXX年XX月XX日07:00:03,P1;
2、ID1,XXXX年XX月XX日07:10:23,P2;
3、ID1,XXXX年XX月XX日07:33:26,P3。
如P1、P2、P3位于同一个地理网格G1内时,将数据1-3压缩为:
1、ID1,XXXX年XX月XX日07时,G1。
通过步骤S2后处理的上传数据,可以被存储到数据库中。即数据库中存储有移动终端的终端ID(例如ID1)、终端位置P对应的终端历史网格(例如G1)和历史网格的上传时间t1(例如XXXX年XX月XX日07时)。
通过步骤S2的有损压缩处理后,能够取得的技术效果包括:(1)数据量得到大幅度的减少,节约存储空间、提高查询效率;(2)数据中的时间从变长改为定长,提高查询和处理效率。
WIFI-ID的处理方式与之类似,不再赘述。
S3,将有损压缩后的数据形成终端数据,并存储到数据库中。该终端数据包括:终端ID、终端的历史网格、历史网格的上传时间(段)t1、终端连接的WIFI-ID、上传WIFI-ID的时间(段)t2。数据库可以采用现在的数据库存储,例如包括支持列族的Hbase等数据库;移动终端位置数据可以存储在一张表中,也可以存储在相互关联的多张数据表中,本发明不对具体的存储方式进行限定。
显然,服务器可以在进行有损压缩之前,将原始数据备份到数据库或其他数据库。
本发明中,将通过多个实施例详细介绍具体实施方式,如无特殊说明,各实施例的技术内容均相互引用。
实施例一
根据本发明,存储介质中存储的计算及程序包括第一计算机程序。对于数据库中存储的每一个终端数据,所述服务器执行所述第一计算机程序实现以下处理步骤:
S102,获取终端数据的第一网格集合,所述第一网格集合包括上传时间t1处于第一历史时间窗内的历史网格。所述的第一历史时间窗包括可以由用户指定的起始时间和时间窗长度。比如,可设置第一历史时间窗为2020年2月1日至2020年2月14日这14天,即起始时间为2月1日,长度为14天;也可设置第一历史时间窗为2020年2月15日这24小时,即起始时间为2月15日00时,长度为24小时。优选的,第一历史时间窗的长度根据医学认定的特定病毒的潜伏时间确定,例如对于2019新型冠状病毒(下称2019-nCoV),第一历史时间窗的长度被设置为14天;第一历史时间窗的起始时间被设置为当前时间减去长度。根据本发明,当前时间具有以下特点:第一、当前时间为用户指定的能够被终端数据处理系统所接收并处理时间,当前时间可以由用户通过输入设备输入,也可以由终端数据处理系统自动获取,例如从时间服务器中获取等。第二、当前时间的单位应与历史时间窗的单位一致,例如均为“日”或均为“小时”等;如果用户输入的当前时间或自动获取的当前时间与历史时间窗的单位不一致,可以采用任意时间单位转换方法将单位转换为一致。值得注意的是,当前时间并非绝对是“当日”、“今天”或“当时”,例如今天为2020年2月20日,当前时间可能是2020年2月15日。
S104,在第一网格集合与指定网格集合存在交集时,将所述移动终端的状态设置为第一标记,否则设置为第二标记。其中,所述指定网格集合包括指定地理区域的网格。进一步的,第一、二标记优选为位标记,例如第一标记可以为1,第二标记可以为0;当然,第一标记和第二标记还可以设置为任何其他类型的标记。
S106,可选的,将所述终端数据中的终端ID、和状态关联存储到所述数据库中。
通过步骤S102和S104可知,若移动终端的状态为第一标记,即第一网格集合与指定网格集合具有交集,说明移动终端在第一历史时间窗内于指定地理区域内上传了终端位置P,因此,可推定移动终端的持有者在第一历史时间窗内有极高的概率去过指定地理区域。相反的,若移动终端的状态为第二标记,即第一网格集合与第二网格集合没有交集,说明移动终端在第一历史时间窗内未在指定地理区域内上传过终端位置P。因此,可认定移动终端的持有者在第一历史时间窗内有极高的概率未去过指定地理区域。
根据本发明,可选的,所述数据库中还关联存储有状态为第一标记的终端ID和移动终端在所述第一历史时间窗内最后一次上传的历史网格LL(Last Location)。
所述服务器执行所述第一计算机程序还实现以下处理步骤:
S110,接收用户输入的查询区域网格集合;所述查询区域为用户选定的区域。
S112,在所述数据库中,如果终端ID的LL位于查询区域网格集合中、且终端ID对应的状态为第一标识,那么将终端ID和/或终端ID的数量作为查询结果。
由于对数据库中亿级到十亿级的终端数据均进行了步骤S102和S104的处理,因此可自动、高效地判断某个地理区域的所有移动终端在指定时段是否在指定地理区域上传过历史位置,提升了判断效率,节省了时间,更能够适应于重大事件发生后的全局性实时处理,例如2019-nCoV期间的全局性实时处理。
为便于理解本发明,下面结合示例性的应用场景进行详细描述。本领域技术人员知晓,应用场景中的表1-4均是示例性的,其他格式的数据表也可以在本发明中使用,且不会影响本发明的保护范围。
例如,2020年2月15日,根据第一历史时间窗2020年2月1日至2020年2月14日和指定地理区域确定数据库中的全部移动终端的状态。
可选的实施例中,数据库中包括表1,存储有数据对形式的上传时间和终端历史网格,表1中t和L的下标标识具体的时间和历史网格。显然,随着移动终端实时上传数据,数据对也在实时更新。
表1
终端ID (上传时间,终端历史网格)
ID1 (t<sub>11</sub>,L<sub>11</sub>),(t<sub>12</sub>,L<sub>12</sub>),……
ID2 (t<sub>21</sub>,L<sub>21</sub>),(t<sub>22</sub>,L<sub>22</sub>),……
…… ……
IDn (t<sub>n1</sub>,L<sub>n1</sub>),(t<sub>n2</sub>,L<sub>n2</sub>),……
对于数据库中的每个终端ID,获取其对应的、且上传时间处于2020年2月1日至2020年2月14日期间的所有历史网格L,作为第一网格集合。
同样,指定地理区域的多个网格组成为指定网格集合。
若第一网格集合与指定网格集合无交集,可设置该移动终端的状态为0。若有交集,可设置该移动终端的状态为1。
至此,示例性可以在数据库的表1中,增加移动终端的状态,形成表2。
表2
终端ID (上传时间,终端历史网格) 状态
ID1 (t<sub>11</sub>,L<sub>11</sub>),(t<sub>12</sub>,L<sub>12</sub>),…… 0
ID2 (t<sub>21</sub>,L<sub>21</sub>),(t<sub>22</sub>,L<sub>22</sub>),…… 1
…… …… ……
IDn (t<sub>n1</sub>,L<sub>n1</sub>),(t<sub>n2</sub>,L<sub>n2</sub>),…… 1
也可以在数据库中,额外增加格式如表3所示的临时数据表。表3中仅包括终端ID和状态。
表3
终端ID 状态
ID1 0
ID2 1
…… ……
IDn 1
优选的,上述步骤可以被服务器在每天凌晨开始自动执行。服务器或服务器集群的运算能力被配置为预定时间内(例如约4个小时内)处理完成数据库中所有终端ID,并获得对应的状态,即在2月15日凌晨4:00左右完成2月1日-14日中的数据处理。
由此,通过查询数据库中各移动终端的状态,即可确定该移动终端的持有者是否在2020年2月1日至2020年2月14日期间去过指定地理区域。
进一步的,在步骤108,对数据库中状态为1的每个移动终端,根据表2的数据对获得其最后上传的历史网格LL,即数据对中的上传时间最晚的终端历史网格,并将该历史网格作为移动终端的当前位置,形成表4。至此,表3中可能有1亿到10亿级别的终端ID,表4中仅剩余指定地理区域,例如千万级别的终端ID。步骤108也是在前述预定时间内完成。
表4
终端ID LL 状态
ID2 LL<sub>2</sub> 1
…… …… ……
IDn LL<sub>n</sub> 1
S110可以进一步包括,接收用户输入的查询区域对应的网格集合。例如,通过电子地图圈选查询区域,从而获得对应的的网格集合。
S112可以进一步包括,在表4的LL中进行检索,如果某个LL(例如LL2)位于查询区域的网格集合中,那么获得LL2对应的终端ID2,作为检索结果。
其中,检索结果还可以包括状态为1的终端ID的数量,该数量可以标识2月1日-14日指定地理区域上传过数据的移动终端在查询区域的数量。
通过以上技术方案,由于凌晨4:00左右数据库可完成更新,因此在实际使用的时候,各省市县的用户均可以在表4这一低数量级的数据表中查询,实时获得有多少人去过查询区域。由此,提高了查询效率,节省了查询时间;同时,使用14天的终端数据,也大幅度提升了采样率,使得查询结果的准确性也随之升高。
实施例二
实施例一中,第一历史时间窗的时长根据医学认定的特定病毒的潜伏时间确定。在潜伏时间较长的情况下,每日更新均需要回溯遍历过去第一历史时间窗的所有历史网格。这对服务器的算力提出了较高的要求,为解决这一技术问题,本发明还提供了实施例二。
根据本发明,第一历史时间窗由指定数量的多个第二历史时间窗组成;优选的,第二历史时间窗的时长与所述终端数据处理系统中的终端的状态更新周期相同。示例性例子中,第一历史时间窗的时长为14天时,可以设置第二历史时间窗的时长为1天,也即移动终端的状态更新周期为1天。
进一步的,所述存储介质还存储有第二计算机程序,所述服务器执行所述第二计算机程序实现以下处理步骤:
S202,获取终端数据的第二网格集合,所述第二网格集合包括终端ID对应的、且上传时间t1处于第二历史时间窗内的历史网格。
S204,在第二网格集合与指定网格集合具有交集时,将所述移动终端的状态位设置为第一标记,否则设置为第二标记。
根据本发明,所述状态位的位数与所述第二历史时间窗的指定数量相同,示例性例子中,状态位的位数为14位。
为便于理解本发明的技术方案,仍以移动终端在2020年2月1日至2020年2月14日为例说明。如果移动终端2月3日的第二历史网格集合与指定网格集合存在交集,而其他日期内都不存在交集,那么移动终端的状态位为“00100000000000”。
S206,优选的,第一、二标记为位标记,从而可以对所述第一历史时间窗中所有所述第二历史时间窗对应的状态位进行或运算,将所述或运算的结果设置为所述移动终端的状态。
如前述状态位为“00100000000000”时,移动终端的状态按位或运算的结果为“1”。
进一步的,所述服务器执行所述第二计算机程序还实现以下更新步骤:
S208,基于当前时间,获取未更新的前一移动终端状态更新周期的第二历史时间窗。延续前述示例,在当前时间为2020年2月16日时,系统对数据库中的移动终端状态进行更新,可以获取2月15日为未更新的第二历史时间窗。
S210,获取终端数据的上传时间t1处于未更新的第二历史时间窗内的历史网格,作为未更新的第二历史网格集合。
S212,在未更新的第二历史网格集合与指定网格集合存在交集时,将所述移动终端的新增的状态位设置为第一标记,否则设置为第二标记。
S214,删除移动终端的状态位中的第一位。
例如前述移动终端在2月15日的第一历史网格集合与第二网格集合存在交集,那么经过步骤212和步骤214将“00100000000000”更新为“0100000000001”。
S216,可选的,对更新后的移动终端的状态位按位进行逻辑或运算,从而更新移动终端的状态。显然,移动终端的状态仍然包括14个第一标记和第二标记。如前述状态位为“0100000000001”时,移动终端的状态为“1”。
通过以上技术方案,每次更新只需要回溯第二历史时间窗内的移动终端数据,而不必回溯第一历史时间窗内的数据,进一步提高了数据处理效率。本领域技术人员知悉,实施例二中完成移动终端的状态标记后的查询过程,与上述实施例一相同,在此不再赘述。
实施例三
根据本发明,指定地理区域包括源区域,源区域为医学认定的特定病毒开始流行的区域。随着病毒传播的发展,指定地理区域会在源区域的基础上扩大,反之,随着病毒传播被阻断,指定地理区域会缩减,即合理的指定地理区域是动态变化的。为确保对终端状态获取的时效性,优选的,指定地理区域还包括根据源区域确定的邻接区域。
根据本发明,所述存储介质还存储有第三计算机程序,所述服务器执行所述第三计算机程序实现以下处理步骤:
S302,在数据库中,获取目标终端数据;所述目标终端为上传时间t1处于起源历史时间窗内的、且上传时间t1对应的历史网格集合与所述源区域网格集合存在交集的终端。
S304,在数据库中,获取扩散网格集合及每个扩散网格中目标终端的位置数量;所述扩散网格为所述目标终端数据对应的、在扩散历史时间窗内的目标终端的历史网格。
其中,所述起源历史时间窗根据医学认定的特定病毒开始流行时间确定,所述扩散历史时间窗根据医学认定的特定病毒开始扩散时间确定。
为便于理解本发明,仍以2019-nCoV期间为例予以说明。起源历史时间窗可以被设置为病毒开始流行的时间,例如2019年12月A日-2020年1月B日,扩散历史时间窗口可以被设置为2020年1月C日-D日,C可以小于B,但优选的为B+1。这样,经过步骤S302和304,即可以获知2019年12月A日-2020年1月B日期间出现在源区域的移动终端在2020年1月C日-D日期间扩散到了哪些地方。显然,源区域和/或邻接区域在地理上可以为连续的区域,也可以为离散的区域。
S306,基于扩散网格集合及每个扩散网格中目标终端的位置数量,确定邻接区域。根据本发明,所述位置数量为扩散网格中出现的目标终端数据的数量,或者目标终端数据的次数。
扩散网格集合中位置数量较多的区域客观上会成为源区域以外的另一病毒感染高发区,这类区域可以认为是源区域的邻接区域。
在一种可能的设计中,在所述扩散网格集合中,选择位置数量大于或等于第一指定数量的网格,组成所述邻接区域。也就是说,当一个网格中目标终端的数量大于或等于第一指定数量时,即该网格具有足够多的来自源区域的移动终端,能够有较大概率使病毒在该网格所属的地理区域内发展。此时,将该网格归属于源区域的邻接区域。
在另一种可能的设计中,在所述扩散网格集合中,选择分布的所述目标历史位置的数量排名为前第二指定数量排名的网格,组成所述邻接区域。也就是说,对按照分布有所述目标历史位置的数量,对扩散网格集合中的网格进行排序。排序越靠前,其所在地理区域中的目标移动终端越多,其为源区域的邻接区域的可能性也就越大。
但是优选的,步骤S306进一步包括:
S3062,基于扩散网格集合和每个扩散网格中目标终端的位置数量,生成热力图。
S3064,获取针对所述热力图的选择操作。
S3066,基于所述选择操作,确定所述邻接区域。
通过步骤S3062-3066。用户可直观的看到源区域中移动终端的扩散程度,通过简单的选择操作,即可在热力图中圈选热力值较高的区域,作为邻接区域。
根据该实施例的另一种可选的具体实施方式,源区域具有优先级为1至k的邻接区域,即所述邻接区域包括k个优先级,例如第1邻接区域、第2邻接区域、...、第k邻接区域,优选的,这些邻接区域的优先级从1至k逐步降低。显然,第i邻接区域在地理上可以为连续的区域,也可以为离散的区域。优选的,源区域和/或k级邻接区域的网格集合之间相互不存在交集。
其中,第j+1邻接区域可以根据第j邻接区域获取,具体实现如下。
根据本发明,所述服务器执行所述第三计算机程序还实现以下处理步骤:
S320,在数据库中,获取目标邻接j终端ID;所述目标邻接终端为上传时间t1处于起源历史时间窗内的、且上传时间t1对应的历史网格集合与第j邻接区域网格集合存在交集的终端;
S322,在数据库中,获取扩散j网格集合及每个扩散j网格中目标邻接j终端的位置数量;所述扩散j网格为所述目标邻接j终端ID对应的、在扩散j历史时间窗内的目标终端的历史网格;
S324,基于扩散j网格集合及每个扩散j网格中目标终端的位置数量,确定第j+1邻接区域;具体获取方式与前述根据源区域获取邻接区域的方式相同,不再赘述。
其中,j的取值范围为1到k-1。所述扩散j历史时间窗根据医学认定的特定病毒在特定阶段的扩散时间确定。
为便于理解本发明,仍延续之前2019-nCoV期间的例子予以说明。起源历史时间窗可以被设置为病毒开始流行的时间,例如2019年12月A日-2020年1月B日,扩散1历史时间窗口可以被设置为2020年1月C日-D日。
实施例四
根据本发明,终端数据处理系统的存储介质中还存储有第一画像程序,用于对用户指定的特定地理区域进行画像。延续之前2019-nCoV的例子,该画像能够辅助判断特定地理区域内病毒的潜在状态。
具体的,所述服务器执行所述第一画像程序实现以下处理步骤:
S402,获取待画像的输入网格集合。可选的,输入网格可以为一个,也可以为多个。
S404,在数据库中检索获取历史网格LL对应于输入网格的终端ID,如前述实施例所定义的,所述历史网格LL为终端在第一历史时间窗内上传时间t1为最后一次的上传的历史网格。显然,终端ID可能为一个,也可能为多个。
S406,根据终端ID获取终端权重。可选的,所述数据库中关联存储有终端ID和终端权重,因此可以根据终端ID检索获得终端权重。根据本发明,源和/或邻接区域网格集合为M个,第i个源和/或邻接区域的区域权重为wi,终端权重还根据wi、第一网格集合、M个源和/或邻接区域网格集合确定;其中,M>=1,i的取值为1..M。与前述实施例中的定义或获取方式相同,所述第一网格集合包括终端ID对应的、且上传时间t1处于第一历史时间窗内的历史网格;所述源区域为医学认定的特定病毒开始流行的区域,所述邻接区域根据所述源区域获得。
可选的,所述步骤S406还包括:
S4062,初始化终端权重为0;
S4064,遍历M个源和/或邻接区域网格集合,在第一网格集合与第i个源和/或邻接区域网格集合具有交集时,将移动终端ID对应的终端权重增加wi;直到完成M个源和/或邻接区域网格集合的遍历。
可选的,所述步骤S406还包括:
S4062,初始化终端权重为0;
S4068,遍历M个源和/或邻接区域网格集合,在第一网格集合与第i个源和/或邻接区域网格集合具有交集时,将移动终端ID对应的终端权重增加wi;终止遍历。
在一种可能的设计中,每个区域权重wi都相同,此时终端权重实现为或类似于终端状态。
另一种可能的设计中,每个区域权重wi可以通过用户输入指定。
再一种可能的设计中,M 个源和/或邻接区域包括M0个源区域、M1个第1邻接区域、M2个第2邻接区域、......、Mk个第k邻接区域,其中M0+M1+M2+...+Mk=M,M0,...,Mk的最小取值为1;M0个源区域的区域权重相同,均为m0,且大于所述邻接区域的区域权重;Mj个第j邻接区域的区域权重相同,均为mj,且大于第j+1个邻接区域的区域权重;j的取值范围为1...k-1。
优选的,
Figure 608680DEST_PATH_IMAGE001
;其中,N可选的为预设时间段内基准区域中的感染者人数,本领 域技术人员知晓可以采用现有技术从公开网站上自动获取该感染者人数,在2019-nCoV的 例子中,感染者例如可以为经过核酸检测确诊者或临床确诊者。
N0为数据库中预设时间段内基准区域网格集合对应的终端ID的集合与源区域网格集合对应的终端ID的集合的交集中终端ID的数量。
Figure 309789DEST_PATH_IMAGE002
,其中,Nx为数据库中预设时间段内基准区域网格集合 对应的终端ID的集合与第x邻接区域网格集合对应的终端ID的集合的交集中终端ID的数 量。
可选的,基准区域为用户选择的区域,该区域的网格集合可以与输入网格集合相 同,也可以不同。优选的,所述基准区域中感染者人数大于预设的第一阈值,
Figure 363720DEST_PATH_IMAGE003
大于预设的第二阈值,第一、二阈值被设置为能够满足医学和统计学的最低统计数值要求, 从而保证权重计算的精度。基准区域另一种的确定方式参见实施例五。
为便于理解本发明,仍延续之前2019-nCoV期间的例子予以说明。2019-nCoV传播早期,用户输入的基准区域内的感染者人数为1000,预设时间段内,终端在基准区域的第一网格集合与源区域网格集合存在交集的为2000,与第一级邻接区域(不含源区域)的为20000,第二级邻接区域(不含第一级邻接区域)的为40000;那么源区域权重=1000/2000,即假设所有的感染者人数都是源区域带来的,第一级邻接区域权重=1000/(2000+20000),即假设所有的感染者人数都是源区域和第一邻接区域带来的,第二级邻接区域权重=1000/(2000+20000+40000),即假设所有的感染者人数都是源区域和第一、二邻接区域带来的。显然,源和/或邻接区域的区域权重可以根据预设时间段的变化动态更新,但优选的,区域权重在确定预设时间段后,设置为静态值,以避免消耗过多的服务器的算力。
在优选的设计中,区域权重依据病毒传播流行病学的基本规律确定,持续观察的数据证明,其使得的区域画像的准确度更高。
S408,根据终端权重确定输入网格的第一区域画像。进一步的,所述第一区域画像包括对应于输入网格的所有终端ID对应的终端权重的和。
进一步的,所述第一区域画像为
Figure 771568DEST_PATH_IMAGE004
,其中,Ic为输入网格内感染 者人数,Iw为预定义的感染权重,Twi为输入网格对应的第i个终端权重,TN为输入网格中终 端ID的数量。优选的,感染权重Iw大于源区域的区域权重,延续之前2019-nCoV期间的例子, Iw可以设置为1。
根据该实施例,本发明的终端数据处理系统能够获得输入网格对应区域的第一区域画像,该画像反映出对应区域中的来自源区域和/或邻接区域输入的移动终端的加权数量。在病毒传播的场景中,感染者会潜在的传播病毒,输入的移动终端持有者也会潜在的传播病毒,因此,该第一区域画像能够反应该区域中病毒潜伏传播的状态。
实施例五
流行病学认为,病毒无差别传播,因此传播早期确诊与第一区域画像之间存在正相关关系,而部分区域实际公布的感染者人数(尤其是早期公布的感染者人数)受限于管理措施和检测技术手段,有滞后性。
为解决上述技术问题,本发明的终端数据处理系统的存储介质中还存储有区域感染预测程序,所述服务器执行所述区域感染预测程序实现以下处理步骤:
S502,获取基准区域网格集合和非基准区域网格集合。优选的,基准区域与非基准区域的网格集合没有交集。可选的,非基准区域也为用户选择的区域。进一步的,所述非基准区域为地理面积超过预设面积阈值的区域,从而使得非基准区域内承载了足够多的人口。可选的,所述非基准区域网格满足以下条件:即在数据库中根据非基准区域网格集合,在第一历史时间窗内检索对应的移动终端的终端ID,如果终端状态为第一标识的终端ID的数量超过预设输入阈值,那么非基准区域是满足条件的,存在区域感染预测的基础,否则是不满足条件的,例如可以通过终端数据处理系统的用户界面向用户提示。仍延续之前2019-nCoV期间的例子,非基准区域一般选择为省级/市级/区县级行政区所在的地理区域。
S504,根据基准区域的感染者人数、当前时间获取的基准区域的第一区域画像和非基准区域的第一区域画像,确定非基准区域的预测感染者人数。
如前述实施例四所示,所述基准区域的第一区域画像可以根据所述基准区域网格集合、终端ID、终端的历史网格、历史网格的上传时间t1以及终端权重确定;所述非基准区域的第一区域画像可以根据所述非基准区域网格集合、终端ID、终端的历史网格、历史网格的上传时间t1以及终端权重确定。即,将所述基准区域和/或非基准区域的网格集合作为实施例四的输入网格,即可分别获取基准区域和/或非基准区域的第一区域画像。
具体的,所述步骤S504中,确定基准区域和/或非基准区域的第一区域画像可包括:
S5042,在数据库中检索获取历史网格LL属于基准区域和/或非基准区域的网格集合的终端ID,并获取终端ID对应的终端权重;优选的,还同时获取终端ID的数量。
S5044,根据终端权重确定基准区域和/或非基准区域的第一区域画像。
可替代的,根据本发明,数据库中还可以存储有当前时间预先获取的所有网格的第一区域画像,而不必存储终端数据和终端权重。所述基准区域和/或的第一区域画像根据基准区域和/或非基准区域网格集合中所有网格的第一区域画像确定,例如为所有网格的第一区域画像的和。
优选的,非基准区域预测感染者人数/非基准区域区域第一区域画像=基准区域感染者人数/基准区域第一区域画像。
S506,可选的,还确定非基准区域的感染密度为非基准区域的感染者人数/历史网格LL属于非基准区域的网格集合的终端ID的数量。
根据本发明,步骤S504中的预测感染者人数和步骤S506中的感染密度均可以可视化的呈现在电子地图上,以便用户清晰快捷的了解区域内的感染状态。
根据本发明,所述基准区域从用户选择的一个或多个备选区域中确定,所述服务器执行所述区域感染预测程序实现以下处理步骤:
S520,如果备选区域的感染者人数大于预设的第一阈值,那么执行步骤S522。
S522,获取多个备选区域的感染比例,所述感染比例根据备选区域的感染者人数和第一区域画像确定,例如感染比例=感染者人数/第一区域画像。进一步的,所述备选区域网格集合之间没有交集。
S524,根据感染比例降序向用户显示,显示内容包括备选区域和感染比例,可选的还包括感染人数;示例性的,通过终端数据处理系统的用户界面向用户显示。
S526,接收用户的选择指令,根据选择指令选择一个或多个备选区域作为基准区域。
可选的,步骤S524中,将部分降序的感染比例以第一显示方式显示,将其他降序的 感染比例以第二显示方式显示,以第一显示方式显示的感染比例均大于以第二方式显示的 感染比例。所述第一、二显示方式例如为呈现不同的颜色。具体的,如果
Figure 921926DEST_PATH_IMAGE005
大于预 设阈值(例如25%),那么将第1至i个降序的感染比例以第一显示方式呈现,将第i+1个之后 的感染比例以第二显示方式呈现,其中Si为第i个降序的感染比例,Si+1为第i+1个降序的感 染比例。通过该步骤,能够将备选区域根据感染比例的断层进行明显区分,便于用户选择基 准区域与非基准区域。
根据步骤S522-S526,能够辅助用户以最高相关的且具备采样基础的一个或多个备选区域作为基准区域,从而相对准确的预测非基准区域的感染者人数。仍然延续之前2019-nCoV期间的例子,根据该实施例,2019-nCoV初期,将备选区域设置为全国的省级行政区所在的地理区域,通过备选区域的第一区域画像和公开的感染者人数,执行S520-526后,确定若干省级行政区作为基准区域,并预测其他非基准区域的感染者人数。根据观察预测之后一段时间内非基准区域公布的感染者人数可知,预测准确率非常高。
实施例六
本发明的终端数据处理系统的存储介质中还存储有区域活跃程序,所述服务器执行所述区域活跃程序实现以下处理步骤:
S610,获取输入区域网格集合和第三时间窗口。所述输入区域可以有用户指定,但是优选的,所述输入区域为重大事件所发生的区域。所述第三时间窗口可以由用户指定,但是优选的,所述第三时间窗口为重大事件发生时间点或时间段之后的时间窗口,第三时间窗口的起始时间优选为零点,长度优选为7日或24小时。
进一步的,所述第三时间窗口为根据当前时间变化的动态窗口,即第三时间窗口的起始时间还根据当前时间确定。示例性的,在长度为24小时,起始时间为零点的基础上,当前时间为3月2日,那么起始时间为3月1日零点,当前时间为3月3日,那么起始时间为3月2日零点。
S612,在数据库中,获取第三时间窗口内,预设类型的终端最后上传的历史网格LL属于输入区域网格集合的p个终端ID,p>=1。预设类型的终端包括数据库中的所有终端、感染终端、状态为第一标记的终端、与感染终端在时空间上存在近距离接触的终端(具体获取方法参见后续实施例)中的任意一种或多种。根据本发明,感染终端为用户指定的移动终端;一般情况下,用户会指定医学确诊的特定病毒感染者在历史时间窗内随身携带的终端;感染者拥有物权的但并非在历史时间窗内随身携带的移动终端不会被认定为感染终端。例如,历史时间窗为2月1日-14日,感染者于2月15日将旧的移动终端A更换为新的移动终端B,则移动终端A可以作为感染终端,B不能被认定为感染终端。
S614,在数据库中,获取第i个终端ID对应的第i个第三历史网格集合;所述第三网格集合包括终端ID对应的终端数据中,上传时间t1处于第三历史时间窗内的历史网格;i的取值范围为1到p。
S616,获取第i个第三历史网格集合与输入区域网格集合的交集中历史网格的数量Qi
S618,将输入区域活跃度
Figure 579173DEST_PATH_IMAGE006
呈现给用户。示例性的,通过终端数据处理系统 的用户界面向用户显示。
根据本发明,当预设类型的终端包括多种类型时,需要分别获取预设类型对应的区域活跃度,并以对比的方式呈现给用户;对比的方式可以通过柱状图或折线图等实现。例如,当预设类型的终端至少包括数据库中的所有终端和状态为第一标记的终端,分别获取所有终端和第一标记的终端的输入区域活跃度。
进一步的,当预设类型为所有终端时,S618中还将基准区域活跃度呈现给用户。
所述基准区域活跃度为
Figure 165356DEST_PATH_IMAGE007
,其中,p0为基准时间窗口内,终端最后上传的 历史网格LL属于输入区域网格集合的终端ID的数量。所述基准时间窗口可以由用户指定, 但是优选的,所述基准时间窗口为重大事件发生时间点或时间段之前的时间窗口,且基准 时间窗口的长度与第三时间窗口的长度相同。Q0j为第j个基准历史网格集合与输入区域网 格集合的交集中历史网格的数量,第j个基准历史网格集合包括第j个终端ID对应的终端数 据中,上传时间t1处于基准时间窗内的历史网格,j的取值范围为1到p0
进一步的,基准时间窗口为不根据当前时间变化的静态窗口。延续前述示例,例如基准时间窗口为1月15日,那么不管当前时间为3月2日,还是3月3日,基准时间窗口均为1月15日。
进一步的,终端数据处理系统还包括配置文件,所述配置文件中存储有基准区域 活跃度
Figure 224448DEST_PATH_IMAGE008
,所述区域活跃程序被执行时,能够从配置文件中读取所述基准区域活 跃度。
进一步的,所述S612中的值得注意的是,当S612的终端的预设类型不是上述所有终端时,S618中不必将基准区域活跃度呈现给用户。
根据该实施例,本发明能够取得以下技术效果:(1)能够实时获取输入区域内的不同预设类型的终端活跃程度并直观的显示;(2)能够实时获取输入区域的终端活跃程度并与基准区域活跃度的进行比较性显示。因此,在重大事件发生前后,使用本发明的技术方案,能够实时的观察重大事件对输入区域的影响。延续之前2019-nCoV期间的例子,通过与基准区域活跃度的比较,即能够直观呈现疫情早期管控时,不同输入区域活跃度的降低幅度(管控效果),也能够直观呈现疫情后期复工时,不同输入区域活跃度的恢复幅度(复工效果)。
实施例七
对于特定的具有高传染性的病毒,在病毒潜伏期间,因感染者自身并不能够清楚的知悉自己被感染,从而并未限制自身的活动区域;或者感染者因某种特殊原因,虽然知晓自身被感染,但仍然未限制自身的活动区域。这些情况下,非感染者有可能与感染者出现同时空的情况,即(基本)同时出现在(基本)相同的地理区域内,从而产生被病毒感染的概率。因此,非感染者希望能够获知自身是否与感染者同时空。解决该问题的一种技术手段是,在感染者被确诊后,回忆自身不同的时间出现的地点,并将时间与地点进行存储到云端的数据库中,例如XX日乘坐了XXXX次航班,便于其他任何非感染者用户查询并获知是否与感染者同时空的信息。但是,这种技术手段也存在不足,例如感染者回忆不完整、不准确而导致的查询结果不完整、不准确;再如,需要非感染者用户启动查询,才能够获得自身的信息,既受查询工具推广的限制,也无法获取与感染者同时空的整体情况。
针对以上技术问题,根据本发明,终端数据处理系统的存储介质中还存储有第一终端同时空状态判断程序,所述服务器执行所述第一终端同时空判断程序实现以下处理步骤:
S710,获取非源终端第一历史时间窗内的第i个第二网格集合,所述第二网格集合包括非源终端的终端ID对应的、且上传时间t1处于第i个第二历史时间窗内的历史网格。如前述实施例二所述,第一历史时间窗由指定数量的多个第二历史时间窗组成,i的取值范围为1到指定数量。
S720,根据非源终端的第i个第二网格集合与V个源终端的第i个第二网格集合的交集关系,确定非源终端的终端ID对应的同时空状态;所述源终端的第i个第二网格集合包括源终端的终端ID对应的,且上传时间t1处于第二历史时间窗内的历史网格。显然,V的取值大于或等于1。
进一步的,数据库中还关联存储有非源终端的终端ID与同网格计数器,所述同网格计数器初始化为0。
在一种可能的设计中,所述步骤S720进一步包括:
S722,在
Figure 545708DEST_PATH_IMAGE009
与非源终端的第i个第二网格集合具有交集时,将非源终端的终端 ID对应的同网格计数器加1。其中Aj为第j个源终端的第i个第二网格集合,j的取值范围为1 到V。
另一种可能的设计中,所述步骤S720进一步包括:
S724,在Aj与非源终端的第i个第二网格集合具有交集时,将终端ID对应的同网格计数器加1。其中Aj为第j个源终端的第i个第二网格集合,j的取值范围为1到V。
为更简洁的理解该设计中的技术方案,给出以下示例,其中,终端1和终端2均为源终端;终端A为非源终端。
终端1的第i个第二网格集合为{G1、G2、G4};
终端2的第i个第二网格集合为{G1、G3、G5};
终端A的第i个第二网格集合为{G1、G2、G3};
Figure 221409DEST_PATH_IMAGE010
为{G1、G2、G3、G4、G5}。
根据S722,终端A的计数器加1。
根据S724,终端A的计数器加2。
可选的,所述同时空状态根据所述同网格计数器的值确定。例如,所述同时空状态为所述同网格计数器的值;再如,当所述同网格计数器的值大于或等于预设计数阈值时,所述同时空状态设置为第一标识,否则,设置为第二标识。
根据该实施例,网格的大小根据医学认定的特定病毒的传播距离确定,例如针对2019-nCoV病毒,可设置为两个相邻的构成(近似)正方形的8位Geohash网格。第一历史时间窗的时长与前述实施例一中一致,即根据医学认定的特定病毒的潜伏时间确定,例如针对2019-nCoV病毒,可设置为14日。第二历史时间窗的时长根据医学认定的特定病毒的存活时间确定,例如针对2019-nCoV病毒,可设置为1小时或1日。
S730,可选的,将所述非源终端的终端ID、和同时空状态关联存储到所述数据库中。即数据库中存储有所有非源终端的终端ID和终端与源终端的同时空状态。
针对该实施例的技术问题,本发明还提供了另一种技术方案,具体的,还提供了一种终端数据处理系统,包括服务器、数据库和存储有计算机程序的存储介质,服务器与数据库通信连接。所述数据库中存储有终端数据,所述终端数据包括终端ID、终端连接的WIFI-ID、上传WIFI-ID的时间t2。终端数据处理系统的存储介质中还存储有第二终端同时空状态判断程序,所述服务器执行所述第二终端同时空判断程序实现以下处理步骤:
S750,获取非源终端第一历史时间窗内的第i个第二WIFI-ID集合,所述第二WIFI-ID集合包括非源终端的终端ID对应的、且上传时间t2处于第i个第二历史时间窗内的WIFI-ID。如前述实施例二所述,第一历史时间窗由指定数量的多个第二历史时间窗组成,i的取值范围为1到指定数量。
S760,根据非源终端的第i个第二WIFI-ID集合与V个源终端的第i个第二WIFI-ID集合的交集关系,确定非源终端的终端ID对应的同时空状态;所述源终端的第i个第二WIFI-ID集合包括源终端的终端ID对应的,且上传时间t2处于第二历史时间窗内的WIFI-ID。显然,V的取值大于或等于1。
进一步的,数据库中还关联存储有非源终端的终端ID与同WIFI计数器,所述同WIFI计数器初始化为0。
在一种可能的设计中,所述步骤S750进一步包括:
S752,在
Figure 85984DEST_PATH_IMAGE011
与非源终端的第i个第二WIFI-ID集合具有交集时,将非源终端的 终端ID对应的同WIFI计数器加1。其中Bj为第j个源终端的第i个第二WIFI-ID集合,j的取值 范围为1到V。
另一种可能的设计中,所述步骤S750进一步包括:
S754,在Bj与非源终端的第i个第二WIFI-ID集合具有交集时,将终端ID对应的同WIFI计数器加1。其中Bj为第j个源终端的第i个第二WIFI-ID集合,j的取值范围为1到V。
可选的,所述同时空状态根据所述同WIFI计数器的值确定。例如,所述同时空状态为所述同WIFI计数器的值;再如,当所述同WIFI计数器的值大于或等于预设计数阈值时,所述同时空状态设置为第一标识,否则,设置为第二标识。
S770,可选的,将所述非源终端的终端ID、和同时空状态关联存储到所述数据库中。即数据库中存储有所有非源终端的终端ID和终端与源终端的同时空状态。
在该实施例中,使用终端连接的WIFI代替了实施例七中的网格,能够在实时确定与源终端存在同时空(网格)的非源终端的基础上,还使得类似于2019-nCoV期间的同时空的判断更为准确,具体理由如下:(1)WIFI网络信号自身有一定的覆盖范围,且一般的WIFI覆盖范围与病毒在空气中的传播范围有较大的相近性;(2)能够同时连接同一WIFI的多个移动终端持有者存在很高的概率的空间密切关系,例如经常位于同空间内的家人或同事,更容易引发2019-nCoV传播。
实施例八
根据本发明,延续实施例七且与实施例四类似,终端数据处理系统的存储介质中还存储有第二画像程序,用于对用户指定的特定地理区域进行画像。延续之前2019-nCoV的例子,该画像能够辅助判断特定地理区域内病毒的潜在状态。
具体的,所述服务器执行所述第二画像程序实现以下处理步骤:
S802,获取待画像的输入网格集合。可选的,输入网格可以为一个,也可以为多个。
S804,在数据库中检索获取历史网格LL对应于输入网格的终端ID,如前述实施例所定义的,所述历史网格LL为终端在第一历史时间窗内上传时间t1为最后一次的上传的历史网格。显然,终端ID可能为一个,也可能为多个。
S806,根据终端ID获取终端同时空权重。可选的,所述数据库中关联存储有终端ID和终端同时空权重,因此可以根据终端ID检索获得终端权重。
优选的,所述终端ID为非源终端的终端ID。非源终端和源终端的判断可以采用任意技术手段。例如,源终端ID被存储在配置文件中,对于数据库中检索到的任何终端ID,均与配置文件中的源终端ID进行比较,如果相符,则将该终端ID认为是源终端ID,否则认为是非源终端ID。再如,对于源终端ID,在数据库中设置源终端标记,而非源终端不设置标记等。
进一步的,所述终端同时空权重还根据U1个第一权重的取值Y1和U2个第二权重的取值Y2确定,显然Y1包括U1个值,Y2包括U2个值。所述第一权重的取值Y1根据第二历史时间窗的时长、同网格计数器的值、网格计数器预设计数阈值确定;所述第二权重的取值Y2根据第二历史时间窗的时长、同WIFI计数器的值、WIFI计数器预设计数阈值确定。所述同网格计数器的值和同WIFI计数器的值与实施例七中的描述相同,不再赘述。根据该设置方式,不同的第一权重和第二权重能够反映出非源终端与源终端在同时空的接触程度,仍延续2019-nCoV的例子,在源终端为感染终端的情况下,这种接触程度反映了非源终端持有者被感染的概率,且能够有效消除数据库中终端数据采样率所带来的遗漏。
进一步的,当同网格计数器的值小于网格计数器预设计数阈值时,Y1被设置为0;同WIFI计数器的值小于WIFI计数器预设计数阈值是,Y2被设置为0。
优选的,终端同时空权重为
Figure 734003DEST_PATH_IMAGE012
。其中,Y1i为第i个第一权重的取值; Y2j为第j个第二权重的取值。
优选的,当第二历史时间窗的时长相同,且网格计数器和WIFI计数器的预设计数阈值也相同时,Y1小于Y2。
优选的,Y1与所述第二历史时间窗的时长反相关,与网格计数器的预设计数阈值正相关。即其他条件相同的情况下,时长越长,Y1越低,计数阈值越大,Y1越高。
类似的,Y2与所述第二历史时间窗的时长反相关,与WIFI计数器的预设计数阈值正相关。即其他条件相同的情况下,时长越长,Y2越低,计数阈值越大,Y2越高。
示例性的,U1的取值为3,具体的:
当第二历史时间窗的时长为1小时,网格计数器的预设计数阈值为3时,所述终端ID对应的第二同时空权重被设置为Y11
当第二历史时间窗的时长为1日,网格计数器的预设计数阈值为3时;所述终端ID对应的第三同时空权重被设置为Y12
当第二历史时间窗的时长为1日,网格计数器的预设计数阈值为1时,所述终端ID对应的第四同时空权重被设置为Y13
示例性的,U2的取值为1,具体的:
当第二历史时间窗的时长为1日,WIFI计数器的预设计数阈值为1时,所述终端ID对应的第一同时空权重被设置为Y21
S808,根据终端同时空权重确定输入网格的第二区域画像。进一步的,所述第二区域画像包括对应于输入网格的所有终端ID对应的终端同时空权重的和。
根据该实施例,本发明的终端数据处理系统能够获得输入网格对应区域的第二区域画像,该画像反映出对应区域中的与感染终端存在同时空的移动终端的加权数量。在病毒传播的场景中,感染者会潜在的传播病毒,与感染终端同时空的移动终端持有者也会因被感染者传染而潜在的传播病毒,因此,该第二区域画像也能够反应该区域中病毒潜伏传播的状态。
实施例九
根据本发明,终端数据处理系统的存储介质中还存储有密接画像程序,用于对用户指定的特定地理区域进行画像。延续之前2019-nCoV的例子,该画像根据前述输入区域的区域第一画像、区域第二画像、区域内的感染终端、区域活跃度和基准区域活跃度的加权,综合辅助判断特定地理区域内病毒的潜在状态。
具体的,所述服务器执行所述密接画像程序实现以下处理步骤:
S910,获取待画像的输入区域的输入网格集合和感染终端数量。
S920,在数据库中检索获取历史网格LL对应于输入网格集合的终端ID。
S930,根据终端ID获取潜伏状态;所述潜伏状态根据终端ID对应的终端权重、终端同时空权重、感染终端数量加权确定;其中,所述感染终端的权重大于所述终端权重和所述终端同时空权重。
获取终端权重的具体技术方案可参见本发明的实施例四、获取终端同时空权重的具体技术方案可参见本发明的实施例七,不再赘述。
S940,根据输入区域获取管控状态,所述管控状态根据输入区域的区域活跃度和基准区域活跃度确定;所述管控状态与输入区域的基准区域活跃度正相关,与输入区域的区域活跃度反相关。获取区域活跃度和基准区域活跃度具体技术方案可参见本发明的实施例六、不再赘述。
S950,根据潜伏状态和管控状态确定输入区域的密接画像;所述密接画像与潜伏状态正相关,与所述管控状态反相关。
实施例十
根据本发明,终端数据处理系统的存储介质中还存储有获取健康状态程序,用于获取特定终端的持有者的可能被病毒感染的健康状态。所述服务器执行所述获取健康状态程序实现以下处理步骤:
S1010,获取终端ID。终端ID既可以由用户输入,也可以根据用户注册诸如支付宝等APP时的信息自动获取。
S1020,如果所述终端ID为感染终端的终端ID,那么设置健康状态为感染终端的权重。
S1030,如果所述终端ID不是感染终端的终端ID,那么根据终端ID获取第一、二、三健康状态。
所述终端第一健康状态根据以下步骤确定:
S1052,在数据库中获取终端ID对应的上传时间t在指定时间段内的常在网格;可选的,常在网格可以是历史网格LL或者出现次数最多的历史网格。
S1054,获取常在网格的密接画像。
S1056,获取第一、二、三地理围栏区域的预测感染人数。所述第一地理围栏区域包括所述第二地理围栏区域,所述第二地理围栏区域包括第三地理围栏区域,所述第三地理围栏区域包括所述常在网格。示例性的,第一、二、三地理围栏区域分别为常在网格所在的省级、市级、县级行政区所在的地理区域。
获取预测感染人数的具体技术方案可参见本发明的实施例五,不再赘述。
S1056,根据常在网格的密接画像和第一、二、三地理围栏区域的预测感染人数,确定终端第一健康状态。
所述终端第二健康状态根据以下步骤确定:
S1062,在数据库中获取终端ID对应的上传时间t在指定时间段内的历史网格和历史网格的数量。
S1064,获取每个历史网格的密接画像。
S1066;根据历史网格的数量和密接画像,确定终端第二健康状态。
所述终端第三健康状态根据终端权重和终端同时空权重确定。
所述终端健康状态可用于个人的健康码,示例性的健康码的定义可参见标准编号为DB 3301/T 0305-2020,标准名称为《杭州健康码管理与服务指南》中的定义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二等来描述XXX,但这些XXX不应限于这些术语。这些术语仅用来将XXX彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一XXX也可以被称为第二XXX,类似地,第二XXX也可以被称为第一XXX。
应当理解,尽管在本发明中各步骤编制了序号,但是这些序号仅是为了描述方便,在没有明确指示的情况下或者技术上必然具有顺序关系的情况下,序号的大小不能被理解为步骤执行的顺序。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (11)

1.一种终端数据处理系统,包括服务器、数据库和存储有第一终端同时空判断程序的存储介质,服务器与数据库通信连接;其特征在于:所述数据库中存储有终端数据,所述终端数据包括终端ID、终端的历史网格、历史网格的上传时间t1;所述服务器执行所述第一终端同时空判断程序实现以下处理步骤:
S710,获取非源终端第一历史时间窗内的第i个第二网格集合,所述第二网格集合包括非源终端的终端ID对应的、且上传时间t1处于第i个第二历史时间窗内的历史网格;所述第一历史时间窗由指定数量的多个第二历史时间窗组成,i的取值范围为1到指定数量;
S720,根据非源终端的第i个第二网格集合与V个源终端的第i个第二网格集合的交集关系,确定非源终端的终端ID对应的同时空状态;所述源终端的第i个第二网格集合包括源终端的终端ID对应的,且上传时间t1处于第二历史时间窗内的历史网格;其中,V的取值大于或等于1;
所述源终端为感染终端,所述感染终端为用户指定的医学确诊的特定病毒感染者在第一历史时间窗内随身携带的终端;
所述网格的大小根据医学认定的特定病毒的传播距离确定;所述第一历史时间窗的时长根据医学认定的特定病毒的潜伏时间确定;所述第二历史时间窗的时长根据医学认定的特定病毒的存活时间确定。
2.根据权利要求1所述的终端数据处理系统,其特征在于,所述数据库中还关联存储有非源终端的终端ID与同网格计数器,所述同网格计数器初始化为0;
所述步骤S720进一步包括:
S722,在
Figure 963691DEST_PATH_IMAGE001
与非源终端的第i个第二网格集合具有交集时,将非源终端的终端ID对应的同网格计数器加1;
其中Aj为第j个源终端的第i个第二网格集合,j的取值范围为1到V;
所述同时空状态根据所述同网格计数器的值确定。
3.根据权利要求1所述的终端数据处理系统,其特征在于,所述数据库中还关联存储有非源终端的终端ID与同网格计数器,所述同网格计数器初始化为0;
所述步骤S720进一步包括:
S724,在Aj与非源终端的第i个第二网格集合具有交集时,将终端ID对应的同网格计数器加1;
其中Aj为第j个源终端的第i个第二网格集合,j的取值范围为1到V;
所述同时空状态根据所述同网格计数器的值确定。
4.根据权利要求2或3所述的终端数据处理系统,其特征在于,所述同时空状态为所述同网格计数器的值。
5.根据权利要求2或3所述的终端数据处理系统,其特征在于,当所述同网格计数器的值大于或等于预设计数阈值时,所述同时空状态设置为第一标识,否则,设置为第二标识。
6.一种终端数据处理系统,包括服务器、数据库和存储有第二终端同时空判断程序的存储介质,服务器与数据库通信连接;其特征在于:所述数据库中存储有终端数据,所述终端数据包括终端ID、终端连接的WIFI-ID、上传WIFI-ID的时间t2;所述服务器执行所述第二终端同时空判断程序实现以下处理步骤:
S750,获取非源终端第一历史时间窗内的第i个第二WIFI-ID集合,所述第二WIFI-ID集合包括非源终端的终端ID对应的、且上传时间t2处于第i个第二历史时间窗内的WIFI-ID;所述第一历史时间窗由指定数量的多个第二历史时间窗组成,i的取值范围为1到指定数量;
S760,根据非源终端的第i个第二WIFI-ID集合与V个源终端的第i个第二WIFI-ID集合的交集关系,确定非源终端的终端ID对应的同时空状态;所述源终端的第i个第二WIFI-ID集合包括源终端的终端ID对应的,且上传时间t2处于第二历史时间窗内的WIFI-ID;其中,V的取值大于或等于1;
所述源终端为感染终端,所述感染终端为用户指定的医学确诊的特定病毒感染者在第一历史时间窗内随身携带的终端;
所述第一历史时间窗的时长根据医学认定的特定病毒的潜伏时间确定;所述第二历史时间窗的时长根据医学认定的特定病毒的存活时间确定。
7.根据权利要求6所述的终端数据处理系统,其特征在于,所述数据库中还关联存储有非源终端的终端ID与同WIFI计数器,所述同WIFI计数器初始化为0;所述步骤S750进一步包括:
S752,在
Figure 681112DEST_PATH_IMAGE003
与非源终端的第i个第二WIFI-ID集合具有交集时,将非源终端的终端ID对应的同WIFI计数器加1;
其中Bj为第j个源终端的第i个第二WIFI-ID集合,j的取值范围为1到V;
所述同时空状态根据所述同WIFI计数器的值确定。
8.根据权利要求6所述的终端数据处理系统,其特征在于,所述数据库中还关联存储有非源终端的终端ID与同WIFI计数器,所述同WIFI计数器初始化为0;所述步骤S750进一步包括:
S754,在Bj与非源终端的第i个第二WIFI-ID集合具有交集时,将终端ID对应的同WIFI计数器加1;
其中Bj为第j个源终端的第i个第二WIFI-ID集合,j的取值范围为1到V;
所述同时空状态根据所述同WIFI计数器的值确定。
9.根据权利要求7或8所述的终端数据处理系统,其特征在于,所述同时空状态为所述同WIFI计数器的值。
10.根据权利要求7或8所述的终端数据处理系统,其特征在于,当所述同WIFI计数器的值大于或等于预设计数阈值时,所述同时空状态设置为第一标识,否则,设置为第二标识。
11.根据权利要求1-3或6-8之任一所述的终端数据处理系统,其特征在于,还将所述非源终端的终端ID、和同时空状态关联存储到所述数据库中。
CN202010571061.9A 2020-05-11 2020-06-22 终端数据处理系统 Active CN111459723B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010394419 2020-05-11
CN2020103944195 2020-05-11

Publications (2)

Publication Number Publication Date
CN111459723A CN111459723A (zh) 2020-07-28
CN111459723B true CN111459723B (zh) 2020-10-30

Family

ID=71683912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010571061.9A Active CN111459723B (zh) 2020-05-11 2020-06-22 终端数据处理系统

Country Status (1)

Country Link
CN (1) CN111459723B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111522842A (zh) * 2020-07-04 2020-08-11 杭州城市大数据运营有限公司 一种etl数据处理方法、装置、计算机设备和存储介质
CN112269842B (zh) * 2020-10-15 2024-03-19 Tcl通讯(宁波)有限公司 一种信息处理方法、装置、存储介质及计算机设备
CN112465197B (zh) * 2020-11-16 2024-03-05 浙江云合数据科技有限责任公司 区域人口数量的预测方法、装置、计算机设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609616A (zh) * 2012-01-29 2012-07-25 上海美慧软件有限公司 一种基于手机定位数据的动态人口分布密度检测方法
US20130035823A1 (en) * 2011-08-02 2013-02-07 Denso Corporation Electric power transmission reception system
CN106097112A (zh) * 2016-06-21 2016-11-09 李振国 一种缘分记录系统及基于该系统的社交方法
CN109492894A (zh) * 2018-10-31 2019-03-19 北京摩拜科技有限公司 监控车辆投放的方法、装置及服务器

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106777935A (zh) * 2016-12-05 2017-05-31 广东石油化工学院 一种基于网络结构的疾病动态预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130035823A1 (en) * 2011-08-02 2013-02-07 Denso Corporation Electric power transmission reception system
CN102609616A (zh) * 2012-01-29 2012-07-25 上海美慧软件有限公司 一种基于手机定位数据的动态人口分布密度检测方法
CN106097112A (zh) * 2016-06-21 2016-11-09 李振国 一种缘分记录系统及基于该系统的社交方法
CN109492894A (zh) * 2018-10-31 2019-03-19 北京摩拜科技有限公司 监控车辆投放的方法、装置及服务器

Also Published As

Publication number Publication date
CN111459723A (zh) 2020-07-28

Similar Documents

Publication Publication Date Title
CN111459723B (zh) 终端数据处理系统
CN106709606B (zh) 个性化场景预测方法及装置
JP7407209B2 (ja) 情報プッシュ方法及び装置
JP7210086B2 (ja) エリアの分割方法と装置、電子装置およびプログラム
CN109104688A (zh) 使用聚集技术生成无线网络接入点模型
CN104902438A (zh) 一种基于移动通信终端分析客流特征信息的统计方法及其系统
CN111639092B (zh) 一种人员流动分析方法、装置、电子设备及存储介质
CN109977324B (zh) 一种兴趣点挖掘方法及系统
CN107038620A (zh) 基于用户打车偏好的信息推送及装置
CN107291784B (zh) 地理围栏类别的获取方法、装置及业务设备
CN111143639B (zh) 用户亲密度计算方法、装置、设备及介质
CN112115382A (zh) 数据处理方法及装置、存储介质、电子装置
CN112507044B (zh) 终端数据处理系统
CN112507046B (zh) 终端数据处理系统
CN112507045B (zh) 终端数据处理系统
CN112148818B (zh) 终端数据处理系统
CN112507043B (zh) 终端数据处理系统
CN114078269A (zh) 一种人脸图像聚类方法、装置、服务器和存储介质
CN111611337B (zh) 终端数据处理系统
WO2023087722A1 (zh) 一种物体聚集方法、装置、电子设备及存储介质
TW202024964A (zh) 使用者位置確定方法、裝置、設備及電腦可讀儲存媒體
JP5422436B2 (ja) 滞在場所推定装置、方法及びプログラム
CN111242723B (zh) 用户子女情况判断方法、服务器及计算机可读存储介质
CN110428627B (zh) 一种公交出行潜力区域识别方法及识别系统
JP5900487B2 (ja) 移動体管理システム、移動体管理サーバ、移動体管理方法および移動体管理プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 418, room 310012, A West, building 525, Xixi Road, Xihu District, Zhejiang, Hangzhou

Patentee after: Daily interactive Co., Ltd

Patentee after: Shu Lan (Hangzhou) Hospital Ltd.

Address before: 418, room 310012, A West, building 525, Xixi Road, Xihu District, Zhejiang, Hangzhou

Patentee before: ZHEJIANG MEIRI INTERDYNAMIC NETWORK TECHNOLOGY Co.,Ltd.

Patentee before: Shu Lan (Hangzhou) Hospital Ltd.