CN112507044B - 终端数据处理系统 - Google Patents
终端数据处理系统 Download PDFInfo
- Publication number
- CN112507044B CN112507044B CN202010394420.8A CN202010394420A CN112507044B CN 112507044 B CN112507044 B CN 112507044B CN 202010394420 A CN202010394420 A CN 202010394420A CN 112507044 B CN112507044 B CN 112507044B
- Authority
- CN
- China
- Prior art keywords
- terminal
- grid
- time
- area
- time window
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
- G06F3/1454—Digital output to display device ; Cooperation and interconnection of the display device with other functional units involving copying of the display data of a local workstation or window to a remote workstation or window so that an actual copy of the data is displayed simultaneously on two or more displays, e.g. teledisplay
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/80—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Fuzzy Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Human Computer Interaction (AREA)
- Remote Sensing (AREA)
- Information Transfer Between Computers (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供了一种终端数据处理系统,包括服务器、数据库和存储有计算机程序的存储介质,服务器与数据库通信连接;其特征在于,所述数据库中存储有终端数据,所述终端数据包括终端ID、终端的历史网格、历史网格的上传时间t1、终端连接的WIFI‑ID、WIFI‑ID的上传时间t2,所述服务器执行所述计算机程序完成相应的步骤并实现相应的功能。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种终端数据处理系统。
背景技术
随着计算机技术的发展,人们常利用计算机对相关数据进行处理,并进行直观显示。现有的数据处理系统通常包括数据输入系统、处理子系统和输出显示系统。输入系统可以接收用户的输入数据、传感器数据、数据库中存储的数据等,输出显示系统用于向用户显示数据处理的结果,处理子系统是数据处理系统的核心,包括可运行数据处理程序的处理服务器或服务器集群,在处理相对少量数据的时候,几乎所有的计算设备均可以实时的进行数据处理。
但是,很多应用场景下需要处理海量的动态数据,这种场景下,每天涉及处理的实时数据达到百亿级,处理子系统的实时性会大大降低,通过增加硬件数量或采用更高速的硬件设备可以线性提升处理速度,部分缓解实时性问题,但是这样会大幅增加成本,且布置及调试大量新加入的硬件设备也需要花费大量的时间,因此,如何在已有的硬件设备上提高处理海量动态数据的实时性成为亟待解决的技术问题。
发明内容
本发明实施例提供了一种终端数据处理方法及装置、电子设备和存储介质,旨在解决相关技术中识别去过灾区的人群的方式效率和准确性均低下的技术问题。
本发明提供了一种终端数据处理系统,包括服务器、数据库和存储有计算机程序的存储介质,服务器与数据库通信连接;其特征在于,所述数据库中存储有终端数据,所述终端数据包括终端ID、终端的历史网格、历史网格的上传时间t1、终端连接的WIFI-ID、WIFI-ID的上传时间t2,所述服务器执行所述计算机程序完成相应的步骤并实现相应的功能。
通过以上技术方案,可自动、高效地判断当前地理区域的所有移动终端在指定时段是否在指定地理区域上传过历史位置,换言之,可快速、准确地判定自动识别移动终端的持有者在指定时段是否去过灾区。由此,大大提升了数据处理的效率,节省了时间成本和人工成本。而由于该技术方案耗时相对相关技术中的数据处理方式较短,则更能够适应灾区分布的实时变动,可根据灾区分布的实时变动随时进行待管控对象的识别,大大提升了疫情管控的效率和有效性。
具体实施方式
为了更好的理解本发明的技术方案,下面对本发明实施例进行详细描述。应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
根据本发明,提供了一种终端数据处理系统,包括服务器、数据库和存储有计算机程序的存储介质,服务器与数据库通信连接。本领域技术人员知晓,服务器和数据库并非特指一台硬件设备和/或软件设备,还可以是服务器集群、存储集群等。换言之,能够进行数据处理的任何计算设备或多个计算设备的组合均可以认为是服务器,能够进行数据存储的任何存储设备或多个存储设备的组合均可以认为是数据库。服务器和数据库可以是独立的设备,也可以共享一个或多个独立设备。
优选的,服务器还与多个移动终端通信连接,接收并处理移动终端上传的数据,并将处理后的数据存储到数据库中。一个示例中,数据库中移动终端的数量级为亿级到十亿级,移动终端每日上传数据的数量级为百亿级。
根据本发明,移动终端上传到服务器的上传内容包括:终端ID、终端位置P、终端连接的WIFI-ID和/或上传时间t。
根据本发明,移动终端上传数据的方式包括:可配置的轮询和/或中断方式。轮询方式为,终端每隔固定时间向服务器上传数据;中断方式为,终端状态发生变化时向服务器上传数据,例如终端从连接或断开到某个WIFI时,或者终端从基站甲的覆盖范围变换到基站乙的覆盖范围时,或者终端启动或关闭APP时等。本发明并不对终端数据的上传途径予以限定。例如,可以为移动终端中安装的APP所上传的终端信息,或移动终端经由通信连接的基站所上传的终端信息,或移动终端中集成在APP中的SDK所上传的终端信息等。示例性的,移动终端在使用出行APP的过程中,出行APP识别出移动终端的实时位置并上传。
根据本发明,终端ID为可用来区分不同移动终端的唯一编码。示例性地,终端ID可以为移动终端的IMEI、IMSI、MAC地址、SIM卡号之任一或其组合,和/或经过加密处理(例如MD5加密处理)的移动终端的IMEI、IMSI、MAC地址、SIM卡号之任一或其组合。
根据本发明,终端位置P可以通过以下任一或任意组合的方式获取:(1)通过移动终端的GPS获取;(2)通过移动终端连接或扫描到的WIFI获取;(3)通过移动终端连接的基站获取。终端位置P的格式可以为终端的经纬度坐标,也可以为经纬度坐标进行变换后的地理网格,例如Geohash网格。
根据本发明,移动终端向服务器上传数据具有的采样特点包括:第一、高采样率,在“日”时间周期内,采样率约30%,在“月”时间周期内,采样率为80%以上。第二、采样不均匀,受移动终端的使用情况和环境影响,例如地图导航期间,几秒上传一次终端位置P;不使用移动终端期间,0.5-2个小时才上传一次数据;信号不好的地方,不会上传数据等。
优选的,服务器对上传数据的处理包括:
S1,终端ID的合并,即把经常同时出现在临近位置的终端ID合并为一个终端ID,排除一人双机/多机/测试机/工程机/手机农场等情况。具体合并的方法可以采用现有技术方式或申请人特有技术进行。
S2,根据预设的网格和时间段,对上传数据进行有损压缩。当上传的终端位置P为经纬度坐标时,可以根据终端位置P进行坐标变换确定唯一的网格,当然本发明也不排斥终端在上传前就在终端本地完成了坐标转换。时间段可以配置,优选配置为1小时,即00:00:00-00:00:59为第一个时间段,01:00:00-01:00:59为第二时间段,以此类推;当然可以0.5个小时、2个小时、24个小时(即天)等。
本发明中,如无相反定义或特殊说明:术语“网格”指矩形排布的地理空间区域;网格优选为一个Geohash网格或者相邻的多个Geohash网格,Geohash网格例如7位或8位的Geohash网格,其唯一标识为7位或8位的字符串。示例性的一种实施方式中,网格为一个7位的Geohash网格,示例性的另一种实施方式中,网格为两个相邻的构成(近似)正方形的8位Geohash网格。“网格集合”指一个或多个不存在重叠地理空间区域的网格,如两个网格集合之间存在相同的网格,可以认为两个网格集合存在交集。“区域”可以指行政区域;也可以是用户定义的区域,例如用户在电子地图上圈选的区域;对于行政区域,终端数据处理系统中存储有行政区域与网格集合的映射关系;对于用户定义的区域,终端数据处理系统通过坐标变换程序,可以将区域转换为对应的多个网格集合。
有损压缩方式为,将经过S1处理后的同一终端ID在同一时间段内出现在同一网格内的多个数据压缩为一个数据,将同一时间段内连接到同一WIFI-ID的多个数据压缩为一个数据。例如,终端ID1上传的数据(以cvs格式为例说明)中包括:
1、ID1,XXXX年XX月XX日07:00:03,P1;
2、ID1,XXXX年XX月XX日07:10:23,P2;
3、ID1,XXXX年XX月XX日07:33:26,P3。
如P1、P2、P3位于同一个地理网格G1内时,将数据1-3压缩为:
1、ID1,XXXX年XX月XX日07时,G1。
通过步骤S2后处理的上传数据,可以被存储到数据库中。即数据库中存储有移动终端的终端ID(例如ID1)、终端位置P对应的终端历史网格(例如G1)和历史网格的上传时间t1(例如XXXX年XX月XX日07时)。
通过步骤S2的有损压缩处理后,能够取得的技术效果包括:(1)数据量得到大幅度的减少,节约存储空间、提高查询效率;(2)数据中的时间从变长改为定长,提高查询和处理效率。
WIFI-ID的处理方式与之类似,不再赘述。
S3,将有损压缩后的数据形成终端数据,并存储到数据库中。该终端数据包括:终端ID、终端的历史网格、历史网格的上传时间(段)t1、终端连接的WIFI-ID、上传WIFI-ID的时间(段)t2。数据库可以采用现在的数据库存储,例如包括支持列族的Hbase等数据库;移动终端位置数据可以存储在一张表中,也可以存储在相互关联的多张数据表中,本发明不对具体的存储方式进行限定。
显然,服务器可以在进行有损压缩之前,将原始数据备份到数据库或其他数据库。
本发明中,将通过多个实施例详细介绍具体实施方式,如无特殊说明,各实施例的技术内容均相互引用。
实施例一
根据本发明,存储介质中存储的计算及程序包括第一计算机程序。对于数据库中存储的每一个终端数据,所述服务器执行所述第一计算机程序实现以下处理步骤:
S102,获取终端数据的第一网格集合,所述第一网格集合包括上传时间t1处于第一历史时间窗内的历史网格。所述的第一历史时间窗包括可以由用户指定的起始时间和时间窗长度。比如,可设置第一历史时间窗为XXXX年X月1日至XXXX年X月5日这5天,即起始时间为X月1日,长度为5天;也可设置第一历史时间窗为XXXX年C月D日这24小时,即起始时间为C月D日00时,长度为24小时。优选的,第一历史时间窗的长度根据传染病病毒的潜伏时间确定,例如,第一历史时间窗的长度被设置为5天;第一历史时间窗的起始时间被设置为当前时间减去长度。根据本发明,当前时间具有以下特点:第一、当前时间为用户指定的能够被终端数据处理系统所接收并处理时间,当前时间可以由用户通过输入设备输入,也可以由终端数据处理系统自动获取,例如从时间服务器中获取等。第二、当前时间的单位应与历史时间窗的单位一致,例如均为“日”或均为“小时”等;如果用户输入的当前时间或自动获取的当前时间与历史时间窗的单位不一致,可以采用任意时间单位转换方法将单位转换为一致。值得注意的是,当前时间并非绝对是“当日”、“今天”或“当时”。
S104,在第一网格集合与指定网格集合存在交集时,将所述移动终端的状态设置为第一标记,否则设置为第二标记。其中,所述指定网格集合包括指定地理区域的网格。进一步的,第一、二标记优选为位标记,例如第一标记可以为1,第二标记可以为0;当然,第一标记和第二标记还可以设置为任何其他类型的标记。
S106,可选的,将所述终端数据中的终端ID、和状态关联存储到所述数据库中。
通过步骤S102和S104可知,若移动终端的状态为第一标记,即第一网格集合与指定网格集合具有交集,说明移动终端在第一历史时间窗内于指定地理区域内上传了终端位置P,因此,可推定移动终端的持有者在第一历史时间窗内有极高的概率去过指定地理区域。相反的,若移动终端的状态为第二标记,即第一网格集合与第二网格集合没有交集,说明移动终端在第一历史时间窗内未在指定地理区域内上传过终端位置P。因此,可认定移动终端的持有者在第一历史时间窗内有极高的概率未去过指定地理区域。
根据本发明,可选的,所述数据库中还关联存储有状态为第一标记的终端ID和移动终端在所述第一历史时间窗内最后一次上传的历史网格LL(Last Location)。
所述服务器执行所述第一计算机程序还实现以下处理步骤:
S110,接收用户输入的查询区域网格集合;所述查询区域为用户选定的区域。
S112,在所述数据库中,如果终端ID的LL位于查询区域网格集合中、且终端ID对应的状态为第一标识,那么将终端ID和/或终端ID的数量作为查询结果。
由于对数据库中亿级到十亿级的终端数据均进行了步骤S102和S104的处理,因此可自动、高效地判断某个地理区域的所有移动终端在指定时段是否在指定地理区域上传过历史位置,提升了判断效率,节省了时间,更能够适应于重大事件发生后的全局性实时处理。
为便于理解本发明,下面结合示例性的应用场景进行详细描述。本领域技术人员知晓,应用场景中的表1-4均是示例性的,其他格式的数据表也可以在本发明中使用,且不会影响本发明的保护范围。
例如,XXXX年X月6日,根据第一历史时间窗XXXX年X月1日至XXXX年X月5日和指定地理区域确定数据库中的全部移动终端的状态。
可选的实施例中,数据库中包括表1,存储有数据对形式的上传时间和终端历史网格,表1中t和L的下标标识具体的时间和历史网格。显然,随着移动终端实时上传数据,数据对也在实时更新。
表1
终端ID | (上传时间,终端历史网格) |
ID1 | (t<sub>11</sub>,L<sub>11</sub>),(t<sub>12</sub>,L<sub>12</sub>),…… |
ID2 | (t<sub>21</sub>,L<sub>21</sub>),(t<sub>22</sub>,L<sub>22</sub>),…… |
…… | …… |
IDn | (t<sub>n1</sub>,L<sub>n1</sub>),(t<sub>n2</sub>,L<sub>n2</sub>),…… |
对于数据库中的每个终端ID,获取其对应的、且上传时间处于XXXX年X月1日至XXXX年X月5日期间的所有历史网格L,作为第一网格集合。
同样,指定地理区域的多个网格组成为指定网格集合。
若第一网格集合与指定网格集合无交集,可设置该移动终端的状态为0。若有交集,可设置该移动终端的状态为1。
至此,示例性可以在数据库的表1中,增加移动终端的状态,形成表2。
表2
终端ID | (上传时间,终端历史网格) | 状态 |
ID1 | (t<sub>11</sub>,L<sub>11</sub>),(t<sub>12</sub>,L<sub>12</sub>),…… | 0 |
ID2 | (t<sub>21</sub>,L<sub>21</sub>),(t<sub>22</sub>,L<sub>22</sub>),…… | 1 |
…… | …… | …… |
IDn | (t<sub>n1</sub>,L<sub>n1</sub>),(t<sub>n2</sub>,L<sub>n2</sub>),…… | 1 |
也可以在数据库中,额外增加格式如表3所示的临时数据表。表3中仅包括终端ID和状态。
表3
优选的,上述步骤可以被服务器在每天凌晨开始自动执行。服务器或服务器集群的运算能力被配置为预定时间内(例如约4个小时内)处理完成数据库中所有终端ID,并获得对应的状态,即在X月6日凌晨4:00左右完成X月1日-5日中的数据处理。
由此,通过查询数据库中各移动终端的状态,即可确定该移动终端的持有者是否在XXXX年X月1日至XXXX年X月5日期间去过指定地理区域。
进一步的,在步骤108,对数据库中状态为1的每个移动终端,根据表2的数据对获得其最后上传的历史网格LL,即数据对中的上传时间最晚的终端历史网格,并将该历史网格作为移动终端的当前位置,形成表4。至此,表3中可能有1亿到10亿级别的终端ID,表4中仅剩余指定地理区域的终端ID。步骤108也是在前述预定时间内完成。
表4
终端ID | LL | 状态 |
ID2 | LL<sub>2</sub> | 1 |
…… | …… | …… |
IDn | LL<sub>n</sub> | 1 |
S110可以进一步包括,接收用户输入的查询区域对应的网格集合。例如,通过电子地图圈选查询区域,从而获得对应的网格集合。
S112可以进一步包括,在表4的LL中进行检索,如果某个LL(例如LL2)位于查询区域的网格集合中,那么获得LL2对应的终端ID2,作为检索结果。
其中,检索结果还可以包括状态为1的终端ID的数量,该数量可以标识X月1日-5日指定地理区域上传过数据的移动终端在查询区域的数量。
通过以上技术方案,由于凌晨4:00左右数据库可完成更新,因此在实际使用的时候,各省市县的用户均可以在表4这一低数量级的数据表中查询,实时获得有多少人去过查询区域。由此,提高了查询效率,节省了查询时间;大幅度提升了采样率,使得查询结果的准确性也随之升高。
实施例二
实施例一中,第一历史时间窗的时长根据传染病病毒的潜伏时间确定。在潜伏时间较长的情况下,每日更新均需要回溯遍历过去第一历史时间窗的所有历史网格。这对服务器的算力提出了较高的要求,为解决这一技术问题,本发明还提供了实施例二。
根据本发明,第一历史时间窗由指定数量的多个第二历史时间窗组成;优选的,第二历史时间窗的时长与所述终端数据处理系统中的终端的状态更新周期相同。示例性例子中,第一历史时间窗的时长为5天时,可以设置第二历史时间窗的时长为1天,也即移动终端的状态更新周期为1天。
进一步的,所述存储介质还存储有第二计算机程序,所述服务器执行所述第二计算机程序实现以下处理步骤:
S202,获取终端数据的第二网格集合,所述第二网格集合包括终端ID对应的、且上传时间t1处于第二历史时间窗内的历史网格。
S204,在第二网格集合与指定网格集合具有交集时,将所述移动终端的状态位设置为第一标记,否则设置为第二标记。
根据本发明,所述状态位的位数与所述第二历史时间窗的指定数量相同,示例性例子中,状态位的位数为5位。
为便于理解本发明的技术方案,仍以移动终端在XXXX年X月1日至XXXX年X月5日为例说明。如果移动终端X月3日的第二历史网格集合与指定网格集合存在交集,而其他日期内都不存在交集,那么移动终端的状态位为“00100000000000”。
S206,优选的,第一、二标记为位标记,从而可以对所述第一历史时间窗中所有所述第二历史时间窗对应的状态位进行或运算,将所述或运算的结果设置为所述移动终端的状态。
如前述状态位为“00100000000000”时,移动终端的状态按位或运算的结果为“1”。
进一步的,所述服务器执行所述第二计算机程序还实现以下更新步骤:
S208,基于当前时间,获取未更新的前一移动终端状态更新周期的第二历史时间窗。延续前述示例,在当前时间为XXXX年X月7日时,系统对数据库中的移动终端状态进行更新,可以获取X月6日为未更新的第二历史时间窗。
S210,获取终端数据的上传时间t1处于未更新的第二历史时间窗内的历史网格,作为未更新的第二历史网格集合。
S212,在未更新的第二历史网格集合与指定网格集合存在交集时,将所述移动终端的新增的状态位设置为第一标记,否则设置为第二标记。
S214,删除移动终端的状态位中的第一位。
例如前述移动终端在X月6日的第一历史网格集合与第二网格集合存在交集,那么经过步骤212和步骤214将“00100000000000”更新为“0100000000001”。
S216,可选的,对更新后的移动终端的状态位按位进行逻辑或运算,从而更新移动终端的状态。显然,移动终端的状态仍然包括5个第一标记和第二标记。如前述状态位为“0100000000001”时,移动终端的状态为“1”。
通过以上技术方案,每次更新只需要回溯第二历史时间窗内的移动终端数据,而不必回溯第一历史时间窗内的数据,进一步提高了数据处理效率。本领域技术人员知悉,实施例二中完成移动终端的状态标记后的查询过程,与上述实施例一相同,在此不再赘述。
实施例三
根据本发明,指定地理区域包括目标区域,目标区域为传染病病毒开始流行的区域。随着病毒传播的发展,指定地理区域会在目标区域的基础上扩大,反之,随着病毒传播被阻断,指定地理区域会缩减,即合理的指定地理区域是动态变化的。为确保对终端状态获取的时效性,优选的,指定地理区域还包括根据目标区域确定的邻接区域。
根据本发明,所述存储介质还存储有第三计算机程序,所述服务器执行所述第三计算机程序实现以下处理步骤:
S302,在数据库中,获取目标终端数据;所述目标终端为上传时间t1处于F历史时间窗内的、且上传时间t1对应的历史网格集合与所述目标区域网格集合存在交集的终端。
S304,在数据库中,获取第三历史时间网格集合及每个第三历史时间网格中目标终端的位置数量;所述第三历史时间网格为所述目标终端数据对应的、在第三历史时间窗内的目标终端的历史网格。
其中,所述F历史时间窗根据传染病病毒开始流行时间确定,所述第三历史时间窗根据传染病病毒开始扩散时间确定。
为便于理解本发明,F历史时间窗可以被设置为病毒开始流行的时间,例如XXXX年X月A日-XXXX年X月B日,第三历史时间窗口可以被设置为XXXX年X月C日-D日,C可以小于B,但优选的为B+1。这样,经过步骤S302和304,即可以获知XXXX年X月A日-XXXX年X月B日期间出现在目标区域的移动终端在XXXX年X月C日-D日期间扩散到了哪些地方。显然,目标区域和/或邻接区域在地理上可以为连续的区域,也可以为离散的区域。
S306,基于第三历史时间网格集合及每个第三历史时间网格中目标终端的位置数量,确定邻接区域。根据本发明,所述位置数量为第三历史时间网格中出现的目标终端数据的数量,或者目标终端数据的次数。
第三历史时间网格集合中位置数量较多的区域客观上会成为目标区域以外的另一病毒感染高发区,这类区域可以认为是目标区域的邻接区域。
在一种可能的设计中,在所述第三历史时间网格集合中,选择位置数量大于或等于第一指定数量的网格,组成所述邻接区域。也就是说,当一个网格中目标终端的数量大于或等于第一指定数量时,即该网格具有足够多的来自目标区域的移动终端,能够有较大概率使病毒在该网格所属的地理区域内发展。此时,将该网格归属于目标区域的邻接区域。
在另一种可能的设计中,在所述第三历史时间网格集合中,选择分布的所述目标历史位置的数量排名为前第二指定数量排名的网格,组成所述邻接区域。也就是说,对按照分布有所述目标历史位置的数量,对第三历史时间网格集合中的网格进行排序。排序越靠前,其所在地理区域中的目标移动终端越多,其为目标区域的邻接区域的可能性也就越大。
但是优选的,步骤S306进一步包括:
S3062,基于第三历史时间网格集合和每个第三历史时间网格中目标终端的位置数量,生成热力图。
S3064,获取针对所述热力图的选择操作。
S3066,基于所述选择操作,确定所述邻接区域。
通过步骤S3062-3066。用户可直观的看到目标区域中移动终端的扩散程度,通过简单的选择操作,即可在热力图中圈选热力值较高的区域,作为邻接区域。
根据该实施例的另一种可选的具体实施方式,目标区域具有优先级为1至k的邻接区域,即所述邻接区域包括k个优先级,例如第1邻接区域、第2邻接区域、...、第k邻接区域,优选的,这些邻接区域的优先级从1至k逐步降低。显然,第i邻接区域在地理上可以为连续的区域,也可以为离散的区域。优选的,目标区域和/或k级邻接区域的网格集合之间相互不存在交集。
其中,第j+1邻接区域可以根据第j邻接区域获取,具体实现如下。
根据本发明,所述服务器执行所述第三计算机程序还实现以下处理步骤:
S320,在数据库中,获取目标邻接j终端ID;所述目标邻接终端为上传时间t1处于F历史时间窗内的、且上传时间t1对应的历史网格集合与第j邻接区域网格集合存在交集的终端;
S322,在数据库中,获取第三历史时间j网格集合及每个第三历史时间j网格中目标邻接j终端的位置数量;所述第三历史时间j网格为所述目标邻接j终端ID对应的、在第三历史时间j历史时间窗内的目标终端的历史网格;
S324,基于第三历史时间j网格集合及每个第三历史时间j网格中目标终端的位置数量,确定第j+1邻接区域;具体获取方式与前述根据目标区域获取邻接区域的方式相同,不再赘述。
其中,j的取值范围为1到k-1。所述第三历史时间j历史时间窗根据传染病病毒在特定阶段的扩散时间确定。
实施例四
根据本发明,终端数据处理系统的存储介质中还存储有第一画像程序,用于对用户指定的特定地理区域进行画像。该画像能够辅助判断特定地理区域内病毒的潜在状态。
具体的,所述服务器执行所述第一画像程序实现以下处理步骤:
S402,获取待画像的输入网格集合。可选的,输入网格可以为一个,也可以为多个。
S404,在数据库中检索获取历史网格LL对应于输入网格的终端ID,如前述实施例所定义的,所述历史网格LL为终端在第一历史时间窗内上传时间t1为最后一次的上传的历史网格。显然,终端ID可能为一个,也可能为多个。
S406,根据终端ID获取终端权重。可选的,所述数据库中关联存储有终端ID和终端权重,因此可以根据终端ID检索获得终端权重。根据本发明,目标和/或邻接区域网格集合为M个,第i个目标和/或邻接区域的区域权重为wi,终端权重还根据wi、第一网格集合、M个目标和/或邻接区域网格集合确定;其中,M>=1,i的取值为1..M。与前述实施例中的定义或获取方式相同,所述第一网格集合包括终端ID对应的、且上传时间t1处于第一历史时间窗内的历史网格;所述目标区域为传染病病毒开始流行的区域,所述邻接区域根据所述目标区域获得。
可选的,所述步骤S406还包括:
S4062,初始化终端权重为0;
S4064,遍历M个目标和/或邻接区域网格集合,在第一网格集合与第i个目标和/或邻接区域网格集合具有交集时,将移动终端ID对应的终端权重增加wi;直到完成M个目标和/或邻接区域网格集合的遍历。
可选的,所述步骤S406还包括:
S4062,初始化终端权重为0;
S4068,遍历M个目标和/或邻接区域网格集合,在第一网格集合与第i个目标和/或邻接区域网格集合具有交集时,将移动终端ID对应的终端权重增加wi;终止遍历。
在一种可能的设计中,每个区域权重wi都相同,此时终端权重实现为或类似于终端状态。
另一种可能的设计中,每个区域权重wi可以通过用户输入指定。
再一种可能的设计中,M个目标和/或邻接区域包括M0个目标区域、M1个第1邻接区域、M2个第2邻接区域、......、Mk个第k邻接区域,其中M0+M1+M2+...+Mk=M,M0,...,Mk的最小取值为1;M0个目标区域的区域权重相同,均为m0,且大于所述邻接区域的区域权重;Mj个第j邻接区域的区域权重相同,均为mj,且大于第j+1个邻接区域的区域权重;j的取值范围为1...k-1。
N0为数据库中预设时间段内基准区域网格集合对应的终端ID的集合与目标区域网格集合对应的终端ID的集合的交集中终端ID的数量。
可选的,基准区域为用户选择的区域,该区域的网格集合可以与输入网格集合相同,也可以不同。优选的,所述基准区域中感染者人数大于预设的第一阈值,大于预设的第二阈值,第一、二阈值被设置为能够满足医学和统计学的最低统计数值要求,从而保证权重计算的精度。基准区域另一种的确定方式参见实施例五。
为便于理解本发明,例如,用户输入的基准区域内的感染者人数为1000,预设时间段内,终端在基准区域的第一网格集合与目标区域网格集合存在交集的为2000,与第一级邻接区域(不含目标区域)的为20000,第二级邻接区域(不含第一级邻接区域)的为40000;那么目标区域权重=1000/2000,即假设所有的感染者人数都是目标区域带来的,第一级邻接区域权重=1000/(2000+20000),即假设所有的感染者人数都是目标区域和第一邻接区域带来的,第二级邻接区域权重=1000/(2000+20000+40000),即假设所有的感染者人数都是目标区域和第一、二邻接区域带来的。显然,目标和/或邻接区域的区域权重可以根据预设时间段的变化动态更新,但优选的,区域权重在确定预设时间段后,设置为静态值,以避免消耗过多的服务器的算力。
在优选的设计中,区域权重依据病毒传播流行病学的基本规律确定,持续观察的数据证明,其使得的区域画像的准确度更高。
S408,根据终端权重确定输入网格的第一区域画像。进一步的,所述第一区域画像包括对应于输入网格的所有终端ID对应的终端权重的和。
进一步的,所述第一区域画像为其中,Ic为输入网格内感染者人数,Iw为预定义的感染权重,Twi为输入网格对应的第i个终端权重,TN为输入网格中终端ID的数量。优选的,感染权重Iw大于目标区域的区域权重,例如,Iw可以设置为1。
根据该实施例,本发明的终端数据处理系统能够获得输入网格对应区域的第一区域画像,该画像反映出对应区域中的来自目标区域和/或邻接区域输入的移动终端的加权数量。在病毒传播的场景中,感染者会潜在的传播病毒,输入的移动终端持有者也会潜在的传播病毒,因此,该第一区域画像能够反应该区域中病毒潜伏传播的状态。
实施例五
流行病学认为,病毒无差别传播,因此传播早期确诊与第一区域画像之间存在正相关关系,而部分区域实际公布的感染者人数(尤其是早期公布的感染者人数)受限于管理措施和检测技术手段,有滞后性。
为解决上述技术问题,本发明的终端数据处理系统的存储介质中还存储有区域感染预测程序,所述服务器执行所述区域感染预测程序实现以下处理步骤:
S502,获取基准区域网格集合和非基准区域网格集合。优选的,基准区域与非基准区域的网格集合没有交集。可选的,非基准区域也为用户选择的区域。进一步的,所述非基准区域为地理面积超过预设面积阈值的区域,从而使得非基准区域内承载了足够多的人口。可选的,所述非基准区域网格满足以下条件:即在数据库中根据非基准区域网格集合,在第一历史时间窗内检索对应的移动终端的终端ID,如果终端状态为第一标识的终端ID的数量超过预设输入阈值,那么非基准区域是满足条件的,存在区域感染预测的基础,否则是不满足条件的,例如可以通过终端数据处理系统的用户界面向用户提示。例如,非基准区域一般选择为省级/市级/区县级行政区所在的地理区域。
S504,根据基准区域的感染者人数、当前时间获取的基准区域的第一区域画像和非基准区域的第一区域画像,确定非基准区域的预测感染者人数。
如前述实施例四所示,所述基准区域的第一区域画像可以根据所述基准区域网格集合、终端ID、终端的历史网格、历史网格的上传时间t1以及终端权重确定;所述非基准区域的第一区域画像可以根据所述非基准区域网格集合、终端ID、终端的历史网格、历史网格的上传时间t1以及终端权重确定。即,将所述基准区域和/或非基准区域的网格集合作为实施例四的输入网格,即可分别获取基准区域和/或非基准区域的第一区域画像。
具体的,所述步骤S504中,确定基准区域和/或非基准区域的第一区域画像可包括:
S5042,在数据库中检索获取历史网格LL属于基准区域和/或非基准区域的网格集合的终端ID,并获取终端ID对应的终端权重;优选的,还同时获取终端ID的数量。
S5044,根据终端权重确定基准区域和/或非基准区域的第一区域画像。
可替代的,根据本发明,数据库中还可以存储有当前时间预先获取的所有网格的第一区域画像,而不必存储终端数据和终端权重。所述基准区域和/或的第一区域画像根据基准区域和/或非基准区域网格集合中所有网格的第一区域画像确定,例如为所有网格的第一区域画像的和。
优选的,非基准区域预测感染者人数/非基准区域区域第一区域画像=基准区域感染者人数/基准区域第一区域画像。
S506,可选的,还确定非基准区域的感染密度为非基准区域的感染者人数/历史网格LL属于非基准区域的网格集合的终端ID的数量。
根据本发明,步骤S504中的预测感染者人数和步骤S506中的感染密度均可以可视化的呈现在电子地图上,以便用户清晰快捷的了解区域内的感染状态。
根据本发明,所述基准区域从用户选择的一个或多个备选区域中确定,所述服务器执行所述区域感染预测程序实现以下处理步骤:
S520,如果备选区域的感染者人数大于预设的第一阈值,那么执行步骤S522。
S522,获取多个备选区域的感染比例,所述感染比例根据备选区域的感染者人数和第一区域画像确定,例如感染比例=感染者人数/第一区域画像。进一步的,所述备选区域网格集合之间没有交集。
S524,根据感染比例降序向用户显示,显示内容包括备选区域和感染比例,可选的还包括感染人数;示例性的,通过终端数据处理系统的用户界面向用户显示。
S526,接收用户的选择指令,根据选择指令选择一个或多个备选区域作为基准区域。
可选的,步骤S524中,将部分降序的感染比例以第一显示方式显示,将其他降序的感染比例以第二显示方式显示,以第一显示方式显示的感染比例均大于以第二方式显示的感染比例。所述第一、二显示方式例如为呈现不同的颜色。具体的,如果大于预设阈值(例如25%),那么将第1至i个降序的感染比例以第一显示方式呈现,将第i+1个之后的感染比例以第二显示方式呈现,其中Si为第i个降序的感染比例,Si+1为第i+1个降序的感染比例。通过该步骤,能够将备选区域根据感染比例的断层进行明显区分,便于用户选择基准区域与非基准区域。
根据步骤S522-S526,能够辅助用户以最高相关的且具备采样基础的一个或多个备选区域作为基准区域,从而相对准确的预测非基准区域的感染者人数。例如,将备选区域设置为省级行政区所在的地理区域,通过备选区域的第一区域画像和公开的感染者人数,执行S520-526后,确定若干省级行政区作为基准区域,并预测其他非基准区域的感染者人数。根据观察预测之后一段时间内非基准区域公布的感染者人数可知,预测准确率非常高。
实施例六
本发明的终端数据处理系统的存储介质中还存储有区域活跃程序,所述服务器执行所述区域活跃程序实现以下处理步骤:
S610,获取输入区域网格集合和第三时间窗口。所述输入区域可以有用户指定,但是优选的,所述输入区域为重大事件所发生的区域。所述第三时间窗口可以由用户指定,但是优选的,所述第三时间窗口为重大事件发生时间点或时间段之后的时间窗口,第三时间窗口的起始时间优选为零点,长度优选为7日或24小时。
进一步的,所述第三时间窗口为根据当前时间变化的动态窗口,即第三时间窗口的起始时间还根据当前时间确定。示例性的,在长度为24小时,起始时间为零点的基础上,当前时间为X月2日,那么起始时间为X月1日零点,当前时间为X月3日,那么起始时间为X月2日零点。
S612,在数据库中,获取第三时间窗口内,预设类型的终端最后上传的历史网格LL属于输入区域网格集合的p个终端ID,p>=1。预设类型的终端包括数据库中的所有终端、感染终端、状态为第一标记的终端、与感染终端在时空间上存在近距离接触的终端(具体获取方法参见后续实施例)中的任意一种或多种。根据本发明,感染终端为用户指定的移动终端;一般情况下,用户会指定医学确诊的特定病毒感染者在历史时间窗内随身携带的终端;感染者拥有物权的但并非在历史时间窗内随身携带的移动终端不会被认定为感染终端。例如,历史时间窗为X月1日-5日,感染者于X月6日将旧的移动终端A更换为新的移动终端B,则移动终端A可以作为感染终端,B不能被认定为感染终端。
S614,在数据库中,获取第i个终端ID对应的第i个第四历史网格集合;所述第四网格集合包括终端ID对应的终端数据中,上传时间t1处于第四历史时间窗内的历史网格;i的取值范围为1到p。
S616,获取第i个第四历史网格集合与输入区域网格集合的交集中历史网格的数量Qi。
根据本发明,当预设类型的终端包括多种类型时,需要分别获取预设类型对应的区域活跃度,并以对比的方式呈现给用户;对比的方式可以通过柱状图或折线图等实现。例如,当预设类型的终端至少包括数据库中的所有终端和状态为第一标记的终端,分别获取所有终端和第一标记的终端的输入区域活跃度。
进一步的,当预设类型为所有终端时,S618中还将基准区域活跃度呈现给用户。
所述基准区域活跃度为其中,p0为基准时间窗口内,终端最后上传的历史网格LL属于输入区域网格集合的终端ID的数量。所述基准时间窗口可以由用户指定,但是优选的,所述基准时间窗口为重大事件发生时间点或时间段之前的时间窗口,且基准时间窗口的长度与第三时间窗口的长度相同。Q0j为第j个基准历史网格集合与输入区域网格集合的交集中历史网格的数量,第j个基准历史网格集合包括第j个终端ID对应的终端数据中,上传时间t1处于基准时间窗内的历史网格,j的取值范围为1到p0。
进一步的,基准时间窗口为不根据当前时间变化的静态窗口。延续前述示例,例如基准时间窗口为X月6日,那么不管当前时间为X月2日,还是X月3日,基准时间窗口均为X月6日。
进一步的,所述S612中的值得注意的是,当S612的终端的预设类型不是上述所有终端时,S618中不必将基准区域活跃度呈现给用户。
根据该实施例,本发明能够取得以下技术效果:(1)能够实时获取输入区域内的不同预设类型的终端活跃程度并直观的显示;(2)能够实时获取输入区域的终端活跃程度并与基准区域活跃度的进行比较性显示。因此,在重大事件发生前后,使用本发明的技术方案,能够实时的观察重大事件对输入区域的影响。
实施例七
对于特定的具有高传染性的病毒,在病毒潜伏期间,因感染者自身并不能够清楚的知悉自己被感染,从而并未限制自身的活动区域;或者感染者因某种特殊原因,虽然知晓自身被感染,但仍然未限制自身的活动区域。这些情况下,非感染者有可能与感染者出现同时空的情况,即(基本)同时出现在(基本)相同的地理区域内,从而产生被病毒感染的概率。因此,非感染者希望能够获知自身是否与感染者同时空。解决该问题的一种技术手段是,在感染者被确诊后,回忆自身不同的时间出现的地点,并将时间与地点进行存储到云端的数据库中,例如XX日乘坐了XXXX次航班,便于其他任何非感染者用户查询并获知是否与感染者同时空的信息。但是,这种技术手段也存在不足,例如感染者回忆不完整、不准确而导致的查询结果不完整、不准确;再如,需要非感染者用户启动查询,才能够获得自身的信息,既受查询工具推广的限制,也无法获取与感染者同时空的整体情况。
针对以上技术问题,根据本发明,终端数据处理系统的存储介质中还存储有第一终端同时空状态判断程序,所述服务器执行所述第一终端同时空判断程序实现以下处理步骤:
S710,获取R终端第一历史时间窗内的第i个第二网格集合,所述第二网格集合包括R终端的终端ID对应的、且上传时间t1处于第i个第二历史时间窗内的历史网格。如前述实施例二所述,第一历史时间窗由指定数量的多个第二历史时间窗组成,i的取值范围为1到指定数量。
S720,根据R终端的第i个第二网格集合与V个Z终端的第i个第二网格集合的交集关系,确定R终端的终端ID对应的同时空状态;所述Z终端的第i个第二网格集合包括Z终端的终端ID对应的,且上传时间t1处于第二历史时间窗内的历史网格。显然,V的取值大于或等于1。
进一步的,数据库中还关联存储有R终端的终端ID与同网格计数器,所述同网格计数器初始化为0。
在一种可能的设计中,所述步骤S720进一步包括:
另一种可能的设计中,所述步骤S720进一步包括:
S724,在Aj与R终端的第i个第二网格集合具有交集时,将终端ID对应的同网格计数器加1。其中Aj为第j个Z终端的第i个第二网格集合,j的取值范围为1到V。
为更简洁的理解该设计中的技术方案,给出以下示例,其中,终端1和终端2均为Z终端;终端A为R终端。
终端1的第i个第二网格集合为{G1、G2、G4};
终端2的第i个第二网格集合为{G1、G3、G5};
终端A的第i个第二网格集合为{G1、G2、G3};
根据S722,终端A的计数器加1。
根据S724,终端A的计数器加2。
可选的,所述同时空状态根据所述同网格计数器的值确定。例如,所述同时空状态为所述同网格计数器的值;再如,当所述同网格计数器的值大于或等于预设计数阈值时,所述同时空状态设置为第一标识,否则,设置为第二标识。
根据该实施例,网格的大小根据传染病病毒的传播距离确定,例如,可设置为两个相邻的构成(近似)正方形的8位Geohash网格。第一历史时间窗的时长与前述实施例一中一致,即根据传染病病毒的潜伏时间确定,例如,可设置为5日。第二历史时间窗的时长根据传染病病毒的存活时间确定,例如,可设置为1小时或1日。
S730,可选的,将所述R终端的终端ID、和同时空状态关联存储到所述数据库中。即数据库中存储有所有R终端的终端ID和终端与Z终端的同时空状态。
针对该实施例的技术问题,本发明还提供了另一种技术方案,具体的,还提供了一种终端数据处理系统,包括服务器、数据库和存储有计算机程序的存储介质,服务器与数据库通信连接。所述数据库中存储有终端数据,所述终端数据包括终端ID、终端连接的WIFI-ID、上传WIFI-ID的时间t2。终端数据处理系统的存储介质中还存储有第二终端同时空状态判断程序,所述服务器执行所述第二终端同时空判断程序实现以下处理步骤:
S750,获取R终端第一历史时间窗内的第i个第二WIFI-ID集合,所述第二WIFI-ID集合包括R终端的终端ID对应的、且上传时间t2处于第i个第二历史时间窗内的WIFI-ID。如前述实施例二所述,第一历史时间窗由指定数量的多个第二历史时间窗组成,i的取值范围为1到指定数量。
S760,根据R终端的第i个第二WIFI-ID集合与V个Z终端的第i个第二WIFI-ID集合的交集关系,确定R终端的终端ID对应的同时空状态;所述Z终端的第i个第二网格集合包括Z终端的终端ID对应的,且上传时间t2处于第二历史时间窗内的历史网格。显然,V的取值大于或等于1。
进一步的,数据库中还关联存储有R终端的终端ID与同WIFI计数器,所述同WIFI计数器初始化为0。
在一种可能的设计中,所述步骤S750进一步包括:
另一种可能的设计中,所述步骤S750进一步包括:
S754,在Bj与R终端的第i个第二WIFI-ID集合具有交集时,将终端ID对应的同WIFI计数器加1。其中Bj为第j个Z终端的第i个第二WIFI-ID集合,j的取值范围为1到V。
可选的,所述同时空状态根据所述同WIFI计数器的值确定。例如,所述同时空状态为所述同WIFI计数器的值;再如,当所述同WIFI计数器的值大于或等于预设计数阈值时,所述同时空状态设置为第一标识,否则,设置为第二标识。
S770,可选的,将所述R终端的终端ID、和同时空状态关联存储到所述数据库中。即数据库中存储有所有R终端的终端ID和终端与Z终端的同时空状态。
在该实施例中,使用终端连接的WIFI代替了实施例七中的网格,能够在实时确定与Z终端存在同时空(网格)的R终端的基础上,还使得同时空的判断更为准确,具体理由如下:(1)WIFI网络信号自身有一定的覆盖范围,且一般的WIFI覆盖范围与病毒在空气中的传播范围有较大的相近性;(2)能够同时连接同一WIFI的多个移动终端持有者存在很高的概率的空间密切关系,例如经常位于同空间内的家人或同事,更容易引发传播。
实施例八
根据本发明,延续实施例七且与实施例四类似,终端数据处理系统的存储介质中还存储有第二画像程序,用于对用户指定的特定地理区域进行画像。例如,该画像能够辅助判断特定地理区域内病毒的潜在状态。
具体的,所述服务器执行所述第二画像程序实现以下处理步骤:
S802,获取待画像的输入网格集合。可选的,输入网格可以为一个,也可以为多个。
S804,在数据库中检索获取历史网格LL对应于输入网格的终端ID,如前述实施例所定义的,所述历史网格LL为终端在第一历史时间窗内上传时间t1为最后一次的上传的历史网格。显然,终端ID可能为一个,也可能为多个。
S806,根据终端ID获取终端同时空权重。可选的,所述数据库中关联存储有终端ID和终端同时空权重,因此可以根据终端ID检索获得终端权重。
优选的,所述终端ID为R终端的终端ID。R终端和Z终端的判断可以采用任意技术手段。例如,Z终端ID被存储在配置文件中,对于数据库中检索到的任何终端ID,均与配置文件中的Z终端ID进行比较,如果相符,则将该终端ID认为是Z终端ID,否则认为是R终端ID。再如,对于Z终端ID,在数据库中设置Z终端标记,而R终端不设置标记等。
进一步的,所述终端同时空权重还根据U1个第一权重的取值Y1和U2个第二权重的取值Y2确定,显然Y1包括U1个值,Y2包括U2个值。所述第一权重的取值Y1根据第二历史时间窗的时长、同网格计数器的值、网格计数器预设计数阈值确定;所述第二权重的取值Y2根据第二历史时间窗的时长、同WIFI计数器的值、WIFI计数器预设计数阈值确定。所述同网格计数器的值和同WIFI计数器的值与实施例七中的描述相同,不再赘述。根据该设置方式,不同的第一权重和第二权重能够反映出R终端与Z终端在同时空的接触程度,例如,在Z终端为感染终端的情况下,这种接触程度反映了R终端持有者被感染的概率,且能够有效消除数据库中终端数据采样率所带来的遗漏。
进一步的,当同网格计数器的值小于网格计数器预设计数阈值时,Y1被设置为0;同WIFI计数器的值小于WIFI计数器预设计数阈值是,Y2被设置为0。
优选的,当第二历史时间窗的时长相同,且网格计数器和WIFI计数器的预设计数阈值也相同时,Y1小于Y2。
优选的,Y1与所述第二历史时间窗的时长反相关,与网格计数器的预设计数阈值正相关。即其他条件相同的情况下,时长越长,Y1越低,计数阈值越大,Y1越高。
类似的,Y2与所述第二历史时间窗的时长反相关,与WIFI计数器的预设计数阈值正相关。即其他条件相同的情况下,时长越长,Y2越低,计数阈值越大,Y2越高。
示例性的,U1的取值为3,具体的:
当第二历史时间窗的时长为1小时,网格计数器的预设计数阈值为3时,所述终端ID对应的第二同时空权重被设置为Y11;
当第二历史时间窗的时长为1日,网格计数器的预设计数阈值为3时;所述终端ID对应的第三同时空权重被设置为Y12;
当第二历史时间窗的时长为1日,网格计数器的预设计数阈值为1时,所述终端ID对应的第四同时空权重被设置为Y13。
示例性的,U2的取值为1,具体的:
当第二历史时间窗的时长为1日,WIFI计数器的预设计数阈值为1时,所述终端ID对应的第一同时空权重被设置为Y21。
S808,根据终端同时空权重确定输入网格的第二区域画像。进一步的,所述第二区域画像包括对应于输入网格的所有终端ID对应的终端同时空权重的和。
根据该实施例,本发明的终端数据处理系统能够获得输入网格对应区域的第二区域画像,该画像反映出对应区域中的与感染终端存在同时空的移动终端的加权数量。在病毒传播的场景中,感染者会潜在的传播病毒,与感染终端同时空的移动终端持有者也会因被感染者传染而潜在的传播病毒,因此,该第二区域画像也能够反应该区域中病毒潜伏传播的状态。
实施例九
根据本发明,终端数据处理系统的存储介质中还存储有密接画像程序,用于对用户指定的特定地理区域进行画像。例如,该画像根据前述输入区域的区域第一画像、区域第二画像、区域内的感染终端、区域活跃度和基准区域活跃度的加权,综合辅助判断特定地理区域内病毒的潜在状态。
具体的,所述服务器执行所述密接画像程序实现以下处理步骤:
S910,获取待画像的输入区域的输入网格集合和感染终端数量。
S920,在数据库中检索获取历史网格LL对应于输入网格集合的终端ID。
S930,根据终端ID获取潜伏状态;所述潜伏状态根据终端ID对应的终端权重、终端同时空权重、感染终端数量加权确定;其中,所述感染终端的权重大于所述终端权重和所述终端同时空权重。
获取终端权重的具体技术方案可参见本发明的实施例四、获取终端同时空权重的具体技术方案可参见本发明的实施例七,不再赘述。
S940,根据输入区域获取管控状态,所述管控状态根据输入区域的区域活跃度和基准区域活跃度确定;所述管控状态与输入区域的基准区域活跃度正相关,与输入区域的区域活跃度反相关。获取区域活跃度和基准区域活跃度具体技术方案可参见本发明的实施例六、不再赘述。
S950,根据潜伏状态和管控状态确定输入区域的密接画像;所述密接画像与潜伏状态正相关,与所述管控状态反相关。
实施例十
根据本发明,终端数据处理系统的存储介质中还存储有获取健康状态程序,用于获取特定终端的持有者的可能被病毒感染的健康状态。所述服务器执行所述获取健康状态程序实现以下处理步骤:
S1010,获取终端ID。终端ID既可以由用户输入,也可以根据用户注册诸如支付宝等APP时的信息自动获取。
S1020,如果所述终端ID为感染终端的终端ID,那么设置健康状态为感染终端的权重。
S1030,如果所述终端ID不是感染终端的终端ID,那么根据终端ID获取第一、二、三健康状态。
所述终端第一健康状态根据以下步骤确定:
S1052,在数据库中获取终端ID对应的上传时间t在指定时间段内的常在网格;可选的,常在网格可以是历史网格LL或者出现次数最多的历史网格。
S1054,获取常在网格的密接画像。
S1056,获取第一、二、三地理围栏区域的预测感染人数。所述第一地理围栏区域包括所述第二地理围栏区域,所述第二地理围栏区域包括第三地理围栏区域,所述第三地理围栏区域包括所述常在网格。示例性的,第一、二、三地理围栏区域分别为常在网格所在的省级、市级、县级行政区所在的地理区域。
获取预测感染人数的具体技术方案可参见本发明的实施例五,不再赘述。
S1056,根据常在网格的密接画像和第一、二、三地理围栏区域的预测感染人数,确定终端第一健康状态。
所述终端第二健康状态根据以下步骤确定:
S1062,在数据库中获取终端ID对应的上传时间t在指定时间段内的历史网格和历史网格的数量。
S1064,获取每个历史网格的密接画像。
S1066;根据历史网格的数量和密接画像,确定终端第二健康状态。
所述终端第三健康状态根据终端权重和终端同时空权重确定。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二等来描述XXX,但这些XXX不应限于这些术语。这些术语仅用来将XXX彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一XXX也可以被称为第二XXX,类似地,第二XXX也可以被称为第一XXX。
应当理解,尽管在本发明中各步骤编制了序号,但是这些序号仅是为了描述方便,在没有明确指示的情况下或者技术上必然具有顺序关系的情况下,序号的大小不能被理解为步骤执行的顺序。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (8)
1.一种终端数据处理系统,包括服务器、数据库和存储有区域活跃程序的存储介质,服务器与数据库通信连接;其特征在于:所述数据库中存储有终端数据,所述终端数据包括终端ID、终端的历史网格、历史网格的上传时间t1;
所述服务器执行所述区域感染预测程序实现以下处理步骤:
S610,获取输入区域网格集合和用户指定的第三时间窗口,其中,所述输入区域为用户指定的重大事件所发生的区域,所述第三时间窗口为重大事件发生时间点或时间段之后的时间窗口;
S612,在数据库中,获取第三时间窗口内,预设类型的终端最后上传的历史网格LL属于输入区域网格集合的p个终端ID,p>=1;所述历史网格LL根据终端的历史网格和历史网格的上传时间t1确定;
S614,在数据库中,获取第i个终端ID对应的第i个第四历史网格集合;所述第四网格集合包括终端ID对应的终端数据中,上传时间t1处于第四历史时间窗内的历史网格;i的取值范围为1到p;
S616,获取第i个第四历史网格集合与输入区域网格集合的交集中历史网格的数量Qi;
其中,网格的大小根据传染病病毒的传播距离确定。
2.根据权利要求1所述的数据处理系统,其特征在于,所述预设类型的终端包括数据库中的所有终端、感染终端、状态为第一标记的终端、与感染终端在时空间上存在近距离接触的终端中的任意一种或多种。
3.根据权利要求2所述的数据处理系统,其特征在于,所述预设类型的终端为数据库中的所有终端。
5.根据权利要求4所述的数据处理系统,其特征在于,所述基准时间窗口为重大事件发生时间点或时间段之前的时间窗口,且基准时间窗口的长度与第三时间窗口的长度相同。
7.根据权利要求2所述的数据处理系统,其特征在于,所述预设类型的终端为多种类型的终端,所述步骤S618中还分别获取多种类型的终端对应的区域活跃度,并以对比的方式呈现给用户。
8.根据权利要求7所述的数据处理系统,其特征在于,所述步骤S618中不将基准区域活跃度呈现给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010394420.8A CN112507044B (zh) | 2020-05-11 | 2020-05-11 | 终端数据处理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010394420.8A CN112507044B (zh) | 2020-05-11 | 2020-05-11 | 终端数据处理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112507044A CN112507044A (zh) | 2021-03-16 |
CN112507044B true CN112507044B (zh) | 2022-07-08 |
Family
ID=74953359
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010394420.8A Active CN112507044B (zh) | 2020-05-11 | 2020-05-11 | 终端数据处理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112507044B (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2014131311A (ru) * | 2014-07-29 | 2016-02-20 | Общество С Ограниченной Ответственностью "Яндекс" | Способ (варианты) генерации страницы результатов поиска, сервер, используемый в нем, и способ определения позиции веб-страницы в списке веб-страниц |
CN105554695A (zh) * | 2014-11-04 | 2016-05-04 | 中兴通讯股份有限公司 | 一种实现位置确认的方法、基站及终端 |
CN104537594A (zh) * | 2014-12-24 | 2015-04-22 | 青岛智德安信息科技有限公司 | 一种用于体温分享和监控的智能体温地图服务系统 |
CN108986921A (zh) * | 2018-07-04 | 2018-12-11 | 泰康保险集团股份有限公司 | 疾病预测方法、装置、介质及电子设备 |
-
2020
- 2020-05-11 CN CN202010394420.8A patent/CN112507044B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN112507044A (zh) | 2021-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111459723B (zh) | 终端数据处理系统 | |
US11481666B2 (en) | Method and apparatus for acquiring information | |
Yuan et al. | Measuring similarity of mobile phone user trajectories–a Spatio-temporal Edit Distance method | |
JP5560026B2 (ja) | 地図表示装置、地図表示方法及び地図表示プログラム | |
CN111639092B (zh) | 一种人员流动分析方法、装置、电子设备及存储介质 | |
JP7407209B2 (ja) | 情報プッシュ方法及び装置 | |
CN107038620A (zh) | 基于用户打车偏好的信息推送及装置 | |
CN107291784B (zh) | 地理围栏类别的获取方法、装置及业务设备 | |
CN107784046B (zh) | Poi信息处理方法和装置 | |
CN107835486A (zh) | 交通出行量计算方法及装置 | |
CN110019989A (zh) | 一种数据处理方法及装置 | |
CN112860831A (zh) | 处理、展现城管事件的gis点位的方法、系统 | |
CN111159583A (zh) | 用户行为分析方法、装置、设备及存储介质 | |
CN112115382B (zh) | 数据处理方法及装置、存储介质、电子装置 | |
CN112507044B (zh) | 终端数据处理系统 | |
CN112507046B (zh) | 终端数据处理系统 | |
CN112507045B (zh) | 终端数据处理系统 | |
CN112507043B (zh) | 终端数据处理系统 | |
CN112148818B (zh) | 终端数据处理系统 | |
CN115658779B (zh) | 一种人口数据显示方法和装置 | |
WO2023087722A1 (zh) | 一种物体聚集方法、装置、电子设备及存储介质 | |
CN111611337B (zh) | 终端数据处理系统 | |
CN107801418B (zh) | 利用地图检索记录的流动人口推算装置及方法 | |
JP5900487B2 (ja) | 移動体管理システム、移動体管理サーバ、移動体管理方法および移動体管理プログラム | |
CN111611336B (zh) | 终端数据处理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 310012 Room 418, West District, Building A, 525 Xixi Road, Xihu District, Hangzhou City, Zhejiang Province Applicant after: Daily interactive Co.,Ltd. Applicant after: Hangzhou Yunshen Technology Co.,Ltd. Address before: 310012 Room 418, West District, Building A, 525 Xixi Road, Xihu District, Hangzhou City, Zhejiang Province Applicant before: ZHEJIANG MEIRI INTERDYNAMIC NETWORK TECHNOLOGY Co.,Ltd. Applicant before: Hangzhou Yunshen Technology Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |