CN111275599A - 一种基于大数据集成算法的群租房预警方法、装置、存储介质及终端 - Google Patents

一种基于大数据集成算法的群租房预警方法、装置、存储介质及终端 Download PDF

Info

Publication number
CN111275599A
CN111275599A CN202010078948.4A CN202010078948A CN111275599A CN 111275599 A CN111275599 A CN 111275599A CN 202010078948 A CN202010078948 A CN 202010078948A CN 111275599 A CN111275599 A CN 111275599A
Authority
CN
China
Prior art keywords
data
group
data integration
user
early warning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010078948.4A
Other languages
English (en)
Other versions
CN111275599B (zh
Inventor
王夕雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Terminus Technology Co Ltd
Original Assignee
Chongqing Terminus Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Terminus Technology Co Ltd filed Critical Chongqing Terminus Technology Co Ltd
Priority to CN202010078948.4A priority Critical patent/CN111275599B/zh
Publication of CN111275599A publication Critical patent/CN111275599A/zh
Application granted granted Critical
Publication of CN111275599B publication Critical patent/CN111275599B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于大数据集成算法的群租房预警方法、装置、存储介质及终端,所述方法包括:获取群租房的数据源;将所述群租房的数据源输入预设大数据分布式实时计算框架进行数据集成,生成数据集成结果;基于所述数据集成结果判断进行群租房预警。因此,采用本申请实施例,可以减少群租房的数量。

Description

一种基于大数据集成算法的群租房预警方法、装置、存储介质 及终端
技术领域
本发明涉及计算机技术领域,特别涉及一种基于大数据集成算法的群租房预警方法、装置、存储介质及终端。
背景技术
“群租房”是将住宅通过改变房屋结构和平面布局,把房间分割成若干个小间分别按间出租或按床位出租。这种数人一屋造成噪音扰民和垃圾成堆,线路乱接、燃气乱用乱放导致的火灾隐患,搭建隔断住多人改变房屋原本结构导致承重墙不堪重负带来的房屋坍塌隐患。居住者鱼龙混杂,更易催生各种犯罪事件,给社会治安带来严重危害和隐患。
目前在判断某一房屋是否为“群租房”,主要是无业人员通过判断某一房屋消耗的燃气水电的数值进行判断。这种判断方式需要依靠人力进行判断,浪费时间,判断周期长,从而导致群租房不容易发现,加大了群租房的数量。
发明内容
本申请实施例提供了一种基于大数据集成算法的群租房预警方法、装置、存储介质及终端。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
第一方面,本申请实施例提供了一种基于大数据集成算法的群租房预警方法,所述方法包括:
获取群租房的数据源;
将所述群租房的数据源输入预设大数据分布式实时计算框架进行数据集成,生成数据集成结果;
基于所述数据集成结果判断进行群租房预警。
可选的,所述获取群租房的数据源之前,还包括:
采集用户制卡信息、用户亲缘关系以及用户通行日志生成基础数据;
利用分布式存储将所述基础数据进行存储后生成群租房的数据源。
可选的,所述基于所述数据集成结果判断进行群租房预警,包括:
当所述数据集成结果对应的用户制卡数量大于预设阈值时,标记为1,否则标记为0;
当所述数据集成结果对应的用户通行次数在预设时间内通行次数超过预设次数时,标记为1,否则标记为0;
当所述数据集成结果对应的用户亲缘关系值大于预设值范围时,标记为1,否则标记为0;
将所述标记相乘后生成的值为1时,生成群租房位置信息;
将所述位置信息发送至物业部门,进行群租房预警。
可选的,所述预设大数据分布式实时计算框架包括Apache Spark或ApacheHadoop或Apache Storm或Apach Flink。
可选的,所述预设大数据分布式实时计算框架包含的数据集成算法为布隆过滤器,所述布隆过滤器的算法公式为:
Figure BDA0002379583860000021
第二方面,本申请实施例提供了一种基于大数据集成算法的群租房预警装置,所述装置包括:
数据源获取模块,用于获取群租房的数据源;
结果生成模块,用于将所述群租房的数据源输入预设大数据分布式实时计算框架进行数据集成,生成数据集成结果;
群租房预警模块,用于基于所述数据集成结果判断进行群租房预警。
可选的,所述装置还包括:
数据采集模块,用于采集用户制卡信息、用户亲缘关系以及用户通行日志生成基础数据;
数据源生成模块,用于利用分布式存储将所述基础数据进行存储后生成群租房的数据源。
可选的,所述群租房预警模块,包括:
第一标记单元,用于当所述数据集成结果对应的用户制卡数量大于预设阈值时,标记为1,否则标记为0;
第二标记单元,用于当所述数据集成结果对应的用户通行次数在预设时间内通行次数超过预设次数时,标记为1,否则标记为0;
第三标记单元,用于当所述数据集成结果对应的用户亲缘关系值大于预设值范围时,标记为1,否则标记为0;
位置信息生成单元,用于将所述标记相乘后生成的值为1时,生成群租房位置信息;
群租房预警单元,用于将所述位置信息发送至物业部门,进行群租房预警。
第三方面,本申请实施例提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。
第四方面,本申请实施例提供一种终端,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
本申请实施例提供的技术方案可以包括以下有益效果:
在本申请实施例中,用户终端首先通过分布式数据库海量存储实时查询后获取群租房的数据源,然后将所述群租房的数据源输入预设大数据分布式实时计算框架进行数据集成,生成数据集成结果,最后基于所述数据集成结果判断进行群租房预警。在本申请中,由于利用了分布式海量存储来实现实时查询数据库,再通过该数据库存储群租房智能预测需要的数据源,从而可以实现通过实时查询数据库信息进行数据分析来进行群租房预警,根据预警结果对群租房进行处理,从而有效减少了群租房数量。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是本申请实施例提供的一种基于大数据集成算法的群租房预警方法的流程示意图;
图2是本申请实施例提供的基于大数据集成算法的群租房预警过程的过程示意图;
图3是本申请实施例提供的另一种基于大数据集成算法的群租房预警方法的流程示意图;
图4是本申请实施例提供的一种基于大数据集成算法的群租房预警装置的结构示意图;
图5是本申请实施例提供的另一种基于大数据集成算法的群租房预警装置的结构示意图;
图6是本申请实施例提供的一种群租房预警模块的结构示意图;
图7是本申请实施例提供的一种终端的结构示意图。
具体实施方式
以下描述和附图充分地示出本发明的具体实施方案,以使本领域的技术人员能够实践它们。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。此外,在本发明的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
到目前为止,对于群租房识别,目前在判断某一房屋是否为“群租房”,主要是无业人员通过判断某一房屋消耗的燃气水电的数值进行判断。这种判断方式需要依靠人力进行判断,浪费时间,判断周期长,从而导致群租房不容易发现,加大了群租房的数量。为此,本申请提供了一种基于大数据集成算法的群租房预警方法、装置、存储介质及终端,以解决上述相关技术问题中存在的问题。本申请提供的技术方案中,由于利用了分布式海量存储来实现实时查询数据库,再通过该数据库存储群租房智能预测需要的数据源,从而可以实现通过实时查询数据库信息进行数据分析来进行群租房预警,根据预警结果对群租房进行处理,从而有效减少了群租房数量,下面采用示例性的实施例进行详细说明。
下面将结合附图1-附图3,对本申请实施例提供的基于大数据集成算法的群租房预警方法进行详细介绍。该方法可依赖于计算机程序实现,可运行于基于冯诺依曼体系的基于大数据集成算法的群租房预警装置上。该计算机程序可集成在应用中,也可作为独立的工具类应用运行。其中,本申请实施例中的基于大数据集成算法的群租房预警装置可以为用户终端,包括但不限于:个人电脑、平板电脑、手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其它处理设备等。在不同的网络中用户终端可以叫做不同的名称,例如:用户设备、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置、蜂窝电话、无绳电话、个人数字处理(personal digital assistant,PDA)、5G网络或未来演进网络中的终端设备等。
请参见图1,为本申请实施例提供了一种基于大数据集成算法的群租房预警方法的流程示意图。如图1所示,本申请实施例的所述方法可以包括以下步骤:
S101,获取群租房的数据源;
其中,“群租房”是将住宅通过改变房屋结构和平面布局,把房间分割成若干个小间分别按间出租或按床位出租。数据源是用户预先进行采集的数据进过分布式存储技术将采集的数据进行存储后生成的数据,该数据包括用户制卡信息、用户亲缘关系信息和刷卡通行日志信息等。
在一种可能的实现方式中,本申请是基于大数据进行数据分析,而海量数据是大数据分析的基础。利用分布式存储技术首先实现实时查询的数据库存放海量数据,然后采集海量数据,海量数据包括但不限于住户制卡信息、户主亲缘关系和卡片通行日志。
具体的,首先需要获得社区住户门禁卡制卡信息,在保证卡片在有效期的前提下,按照一个住户有且只能持有本人身份证制卡一张的标准,可通过统计一户制卡数量来推断该户的居住人数。然后从社区通行日志中,计算得出每一房间中每位住户的通行记录,包括且不限于社区门禁、单元门锁、社区摄像头抓拍等任一通行方式生成的通行信息。最后,为避免亲人或自住的误判情况,建议物业制卡发卡进行户主亲缘关系的备案,形成户主亲缘关系表。最后将采集到的这三种数据信息利用分布式存储技术进行存储生成数据源,即基础数据。
在数据分析时,首先分布式数据库海量存储实时查询基础数据获取数据源。
S102,将所述群租房的数据源输入预设大数据分布式实时计算框架进行数据集成,生成数据集成结果;
其中,数据集成数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为系统提供全面的数据共享。大数据分布式实时计算框架是用户预先设定的数据计算框架,该框架包括Apache Spark或Apache Hadoop或Apache Storm或ApachFlink其中的一种或几种。大数据分布式实时计算框架包括流处理和批处理。ApacheHadoop是一种专用于批处理的处理框架。Apache Storm是一种侧重于极低延迟的流处理框架,Apache Spark是一种包含流处理能力的下一代批处理框架。与Hadoop的MapReduce引擎基于各种相同原则开发而来的Spark主要侧重于通过完善的内存计算和处理优化机制加快批处理工作负载的运行速度。Apache Flink是一种可以处理批处理任务的流处理框架。该技术可将批处理数据视作具备有限边界的数据流,借此将批处理任务作为流处理的子集加以处理。
在本申请实施例中,大数据分布式实时计算框架中进行快速数据集成的算法是隆过滤器的算法公式为:
Figure BDA0002379583860000061
在一种可能的实现方式中,基于步骤S101可获取到数据源,然后将获取的数据源输入到预先设定的大数据分布式实时计算框架中进行处理,在处理过程中利用快速集成数据的算法隆过滤器算法进行数据集成,集成结束后得到数据集成结果。
S103,基于所述数据集成结果判断进行群租房预警。
其中,集成结果是根据数据集成算法进行计算后生成的结果,预警是根据结果进行判断后生成的判断结果而产生的一种警报信息。
在本申请实施例中,根据步骤S102可得到数据集成结果,当数据集成结果对应的用户制卡数量大于预设阈值时,标记为1,否则标记为0,当数据集成结果对应的用户通行次数在预设时间内通行次数超过预设次数时,标记为1,否则标记为0,当数据集成结果对应的用户亲缘关系值大于预设值范围时,标记为1,否则标记为0,将标记进行相乘后生成的值为1时,生成群租房位置信息,将所述位置信息发送至物业部门,进行群租房预警。
在一种可能的实现方式中,当集成结果生成后,用户终端利用预先设定的判断程序对集成结果进行判断,对数据集成结果对应的用户制卡数量进行判断后生成的判断结果为1,对数据集成结果对应的用户通行次数判断后生成的判断结果为1,对数据集成结果对应的用户亲缘关系判断后生成的判断结果为1。最后将三个结果1进行相乘后值为1,生成群租房位置信息发送至物业部门,物业部门得到预警信息后进行处理。
在另一种可能的实现方式中,当集成结果生成后,用户终端利用预先设定的判断程序对集成结果进行判断,对数据集成结果对应的用户制卡数量进行判断后生成的判断结果为0,对数据集成结果对应的用户通行次数判断后生成的判断结果为0,对数据集成结果对应的用户亲缘关系判断后生成的判断结果为1。最后将三个结果0、0和1进行相乘后值为0,说明该户主不存在群租房嫌疑,此时系统继续获取数据进行分析处理。
在本申请实施例中,用户终端首先通过分布式数据库海量存储实时查询后获取群租房的数据源,然后将所述群租房的数据源输入预设大数据分布式实时计算框架进行数据集成,生成数据集成结果,最后基于所述数据集成结果判断进行群租房预警。在本申请中,由于利用了分布式海量存储来实现实时查询数据库,再通过该数据库存储群租房智能预测需要的数据源,从而可以实现通过实时查询数据库信息进行数据分析来进行群租房预警,根据预警结果对群租房进行处理,从而有效减少了群租房数量。
请参见图3,为本申请实施例提供的一种数据安全存储方法的流程示意图。本实施例以数据安全存储方法应用于用户终端中来举例说明。该数据安全存储方法可以包括以下步骤:
S201,采集用户制卡信息、用户亲缘关系以及用户通行日志生成基础数据;
其中,用户制卡信息是用户利用有效证件办理的通行卡片,该卡片通过门时进行刷卡后会产生通行信息。亲缘关系是户主的有亲属关系的人,此关系在限制范围外,比如非直系儿孙也非直系父辈,排除亲人嫌疑。通行日志是住户进出门刷卡是产生的信息。
在一种可能的实现方式中,首先采集用户制卡信息、用户亲缘关系以及用户通行日志生成基础数据。
S202,利用分布式存储将所述基础数据进行存储后生成群租房的数据源;
其中,分布式存储是为了简化用户端的使用,提供了一个分布式缓存系统来提供对此分布式存储系统的访问接口以及本地数据缓冲以降低网络压力。
在一种可能的实现方式中,利用分布式存储技术将S201采集的数据进行保存后生成的数据源。
S203,获取群租房的数据源;
具体可参见步骤S101,此处不再赘述。
S204,将所述群租房的数据源输入预设大数据分布式实时计算框架进行数据集成,生成数据集成结果;
通常,利用预设大数据分布式实时计算框架进行数据集成时,在进行计算的时候,这些需要匹配的集合一般会使用哈希表的方式存储,这样确实查询快速准确,但是一旦集合巨大,哈希存储及其浪费存储空间的缺点凸显出来了。为了解决这个问题,本申请采用了布隆过滤器算法,这个算法的基本思想是将元素映射成一个位阵列中一个点,这样以来我们只需要判断这个点是否为1就能知道集合中有没有它。相比于其他数据结构,该算法在空间和时间方面都有巨大的优势,它可以表示全集,而且不需要存储元素本身,在本案对用户基本信息有保密需求的场合占有绝对优势。但散列映射过滤算法的缺点也同样明显,比如误算率,随着存入元素数量增加,误算率也会随之增加,下面进行误算率的推导:
假设Hash函数以等概率条件选择并设置Bit Array中的某一位,m是该位数组的大小,k是Hash函数的个数,那么位数组中某一特定的位在进行元素插入时的Hash操作中没有被置位的概率是:
Figure BDA0002379583860000091
那么在所有k次Hash操作后该位都没有被置"1"的概率是:
Figure BDA0002379583860000092
如果我们插入了n个元素,那么某一位仍然为"0"的概率是:
Figure BDA0002379583860000093
因而该位为"1"的概率是:
Figure BDA0002379583860000094
现在检测某一元素是否在该集合中。标明某个元素是否在集合中所需的k个位置都按照如上的方法设置为"1",但是该方法可能会使算法错误的认为某一原本不在集合中的元素却被检测为在该集合中(False Positives),该概率由以下公式确定:
Figure BDA0002379583860000095
其实上述结果是在假定由每个Hash计算出需要设置的位(bit)的位置是相互独立为前提计算出来的,不难看出,随着m(位数组大小)的增加,假正例(False Positives)的概率会下降,同时随着插入元素个数n的增加,False Positives的概率又会上升,对于给定的m,n,如何选择Hash函数个数k由以下公式确定:
Figure BDA0002379583860000096
此时False Positives的概率为:2-k≈0.6185m/n
而对于给定的False Positives概率p,如何选择最优的位数组大小m呢,
Figure BDA0002379583860000097
上式表明,位数组的大小最好与插入元素的个数成线性关系,对于给定的m,n,k,假正例概率最大为:
Figure BDA0002379583860000098
只要计算过程中位数组大小、Hash函数和插入元素符合上述公式,就能最大限度的避免误算,减少算法对系统最终预判所产生的影响。
最后利用该公式进行数据集成。
S205,当所述数据集成结果对应的用户制卡数量大于预设阈值时,标记为1,否则标记为0;
具体可参见步骤S103,此处不再赘述。
S206,当所述数据集成结果对应的用户通行次数在预设时间内通行次数超过预设次数时,标记为1,否则标记为0;
具体可参见步骤S103,此处不再赘述。
S207,当所述数据集成结果对应的用户亲缘关系值大于预设值范围时,标记为1,否则标记为0;
具体可参见步骤S103,此处不再赘述。
S208,将所述标记相乘后生成的值为1时,生成群租房位置信息;
具体可参见步骤S103,此处不再赘述。
S209,将所述位置信息发送至物业部门,进行群租房预警。
例如图2所示,图2是本申请实施例提供的基于大数据集成算法的群租房预警过程的过程示意图,首先采集数据,在数据采集时,获取住户制卡信息,例如某房间、某证件号、用户制卡时间和制卡何时失效等,获取户主亲缘关系,例如某证件号、某房间户主上下两代亲缘关系信息,获取卡片通行日志,例如实时上报某卡在某时某地的刷卡记录,将采集的信息作为基础数据。
然后利用分布式数据库海量存储实时查询基础数据获取数据源,将数据源输入大数据分布式实时计算框架中进行计算,利用快速集成数据算法
Figure BDA0002379583860000101
进行数据集成,集成结束后根据集成结果进行判断,用户终端判断每户制卡数量是否超过限制,判断预定时间段内该户每人通行记录,判断亲缘关系是否在两代限制范围外。当三者判断结果都是都满足时,生成该房屋的位置信息发送至物业管理部门进行群租房预警。
在本申请实施例中,用户终端首先通过分布式数据库海量存储实时查询后获取群租房的数据源,然后将所述群租房的数据源输入预设大数据分布式实时计算框架进行数据集成,生成数据集成结果,最后基于所述数据集成结果判断进行群租房预警。在本申请中,由于利用了分布式海量存储来实现实时查询数据库,再通过该数据库存储群租房智能预测需要的数据源,从而可以实现通过实时查询数据库信息进行数据分析来进行群租房预警,根据预警结果对群租房进行处理,从而有效减少了群租房数量。
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
请参见图4,其示出了本发明一个示例性实施例提供的基于大数据集成算法的群租房预警装置的结构示意图。该基于大数据集成算法的群租房预警装置可以通过软件、硬件或者两者的结合实现成为终端的全部或一部分。该装置1包括数据源获取模块10、结果生成模块20、群租房预警模块30。
数据源获取模块10,用于获取群租房的数据源;
结果生成模块20,用于将所述群租房的数据源输入预设大数据分布式实时计算框架进行数据集成,生成数据集成结果;
群租房预警模块30,用于基于所述数据集成结果判断进行群租房预警。
可选的,如图5所示,所述基于大数据集成算法的群租房预警装置1还包括:
数据采集模块40,用于采集用户制卡信息、用户亲缘关系以及用户通行日志生成基础数据;
数据源生成模块50,用于利用分布式存储将所述基础数据进行存储后生成群租房的数据源。
可选的,如图6所示,所述群租房预警模块30,包括:
第一标记单元310,用于当所述数据集成结果对应的用户制卡数量大于预设阈值时,标记为1,否则标记为0;
第二标记单元320,用于当所述数据集成结果对应的用户通行次数在预设时间内通行次数超过预设次数时,标记为1,否则标记为0;
第三标记单元330,用于当所述数据集成结果对应的用户亲缘关系值大于预设值范围时,标记为1,否则标记为0;
位置信息生成单元340,用于将所述标记相乘后生成的值为1时,生成群租房位置信息;
群租房预警单元350,用于将所述位置信息发送至物业部门,进行群租房预警。
需要说明的是,上述实施例提供的基于大数据集成算法的群租房预警装置在执行基于大数据集成算法的群租房预警方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的基于大数据集成算法的群租房预警装置与基于大数据集成算法的群租房预警方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请实施例中,用户终端首先通过分布式数据库海量存储实时查询后获取群租房的数据源,然后将所述群租房的数据源输入预设大数据分布式实时计算框架进行数据集成,生成数据集成结果,最后基于所述数据集成结果判断进行群租房预警。在本申请中,由于利用了分布式海量存储来实现实时查询数据库,再通过该数据库存储群租房智能预测需要的数据源,从而可以实现通过实时查询数据库信息进行数据分析来进行群租房预警,根据预警结果对群租房进行处理,从而有效减少了群租房数量。
本发明还提供一种计算机可读介质,其上存储有程序指令,该程序指令被处理器执行时实现上述各个方法实施例提供的基于大数据集成算法的群租房预警方法。
本发明还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各个方法实施例所述的基于大数据集成算法的群租房预警方法。
请参见图7,为本申请实施例提供了一种终端的结构示意图。如图7所示,所述终端1000可以包括:至少一个处理器1001,至少一个网络接口1004,用户接口1003,存储器1005,至少一个通信总线1002。
其中,通信总线1002用于实现这些组件之间的连接通信。
其中,用户接口1003可以包括显示屏(Display)、摄像头(Camera),可选用户接口1003还可以包括标准的有线接口、无线接口。
其中,网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
其中,处理器1001可以包括一个或者多个处理核心。处理器1001利用各种借口和线路连接整个电子设备1000内的各个部分,通过运行或执行存储在存储器1005内的指令、程序、代码集或指令集,以及调用存储在存储器1005内的数据,执行电子设备1000的各种功能和处理数据。可选的,处理器1001可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器1001可集成中央处理器(Central Processing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器1001中,单独通过一块芯片进行实现。
其中,存储器1005可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。可选的,该存储器1005包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器1005可用于存储指令、程序、代码、代码集或指令集。存储器1005可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图7所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于大数据集成算法的群租房预警应用程序。
在图7所示的终端1000中,用户接口1003主要用于为用户提供输入的接口,获取用户输入的数据;而处理器1001可以用于调用存储器1005中存储的基于大数据集成算法的群租房预警应用程序,并具体执行以下操作:
获取群租房的数据源;
将所述群租房的数据源输入预设大数据分布式实时计算框架进行数据集成,生成数据集成结果;
基于所述数据集成结果判断进行群租房预警。
在一个实施例中,所述处理器1001在执行所述所述获取群租房的数据源之前时,还执行以下操作:
采集用户制卡信息、用户亲缘关系以及用户通行日志生成基础数据;
利用分布式存储将所述基础数据进行存储后生成群租房的数据源。
在一个实施例中,所述处理器1001在执行所述基于所述数据集成结果判断进行群租房预警时,具体执行以下操作:
当所述数据集成结果对应的用户制卡数量大于预设阈值时,标记为1,否则标记为0;
当所述数据集成结果对应的用户通行次数在预设时间内通行次数超过预设次数时,标记为1,否则标记为0;
当所述数据集成结果对应的用户亲缘关系值大于预设值范围时,标记为1,否则标记为0;
将所述标记相乘后生成的值为1时,生成群租房位置信息;
将所述位置信息发送至物业部门,进行群租房预警。
在本申请实施例中,用户终端首先通过分布式数据库海量存储实时查询后获取群租房的数据源,然后将所述群租房的数据源输入预设大数据分布式实时计算框架进行数据集成,生成数据集成结果,最后基于所述数据集成结果判断进行群租房预警。在本申请中,由于利用了分布式海量存储来实现实时查询数据库,再通过该数据库存储群租房智能预测需要的数据源,从而可以实现通过实时查询数据库信息进行数据分析来进行群租房预警,根据预警结果对群租房进行处理,从而有效减少了群租房数量。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (10)

1.一种基于大数据集成算法的群租房预警方法,其特征在于,所述方法包括:
获取群租房的数据源;
将所述群租房的数据源输入预设大数据分布式实时计算框架进行数据集成,生成数据集成结果;
基于所述数据集成结果判断进行群租房预警。
2.根据权利要求1所述的方法,其特征在于,所述获取群租房的数据源之前,还包括:
采集用户制卡信息、用户亲缘关系以及用户通行日志生成基础数据;
利用分布式存储将所述基础数据进行存储后生成群租房的数据源。
3.根据权利要求1所述的方法,其特征在于,所述基于所述数据集成结果判断进行群租房预警,包括:
当所述数据集成结果对应的用户制卡数量大于预设阈值时,标记为1,否则标记为0;
当所述数据集成结果对应的用户通行次数在预设时间内通行次数超过预设次数时,标记为1,否则标记为0;
当所述数据集成结果对应的用户亲缘关系值大于预设值范围时,标记为1,否则标记为0;
将所述标记相乘后生成的值为1时,生成群租房位置信息;
将所述位置信息发送至物业部门,进行群租房预警。
4.根据权利要求1所述的方法,其特征在于,所述预设大数据分布式实时计算框架包括Apache Spark或Apache Hadoop或Apache Storm或Apach Flink。
5.根据权利要求4所述的方法,其特征在于,所述预设大数据分布式实时计算框架包含的数据集成算法为布隆过滤器,所述布隆过滤器的算法公式为:
Figure FDA0002379583850000011
6.一种基于大数据集成算法的群租房预警装置,其特征在于,所述装置包括:
数据源获取模块,用于获取群租房的数据源;
结果生成模块,用于将所述群租房的数据源输入预设大数据分布式实时计算框架进行数据集成,生成数据集成结果;
群租房预警模块,用于基于所述数据集成结果判断进行群租房预警。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
数据采集模块,用于采集用户制卡信息、用户亲缘关系以及用户通行日志生成基础数据;
数据源生成模块,用于利用分布式存储将所述基础数据进行存储后生成群租房的数据源。
8.根据权利要求6所述的装置,其特征在于,所述群租房预警模块,包括:
第一标记单元,用于当所述数据集成结果对应的用户制卡数量大于预设阈值时,标记为1,否则标记为0;
第二标记单元,用于当所述数据集成结果对应的用户通行次数在预设时间内通行次数超过预设次数时,标记为1,否则标记为0;
第三标记单元,用于当所述数据集成结果对应的用户亲缘关系值大于预设值范围时,标记为1,否则标记为0;
位置信息生成单元,用于将所述标记相乘后生成的值为1时,生成群租房位置信息;
群租房预警单元,用于将所述位置信息发送至物业部门,进行群租房预警。
9.一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1~5任意一项的方法步骤。
10.一种终端,其特征在于,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1~5任意一项的方法步骤。
CN202010078948.4A 2020-02-03 2020-02-03 一种基于大数据集成算法的群租房预警方法、装置、存储介质及终端 Active CN111275599B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010078948.4A CN111275599B (zh) 2020-02-03 2020-02-03 一种基于大数据集成算法的群租房预警方法、装置、存储介质及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010078948.4A CN111275599B (zh) 2020-02-03 2020-02-03 一种基于大数据集成算法的群租房预警方法、装置、存储介质及终端

Publications (2)

Publication Number Publication Date
CN111275599A true CN111275599A (zh) 2020-06-12
CN111275599B CN111275599B (zh) 2022-09-20

Family

ID=71002015

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010078948.4A Active CN111275599B (zh) 2020-02-03 2020-02-03 一种基于大数据集成算法的群租房预警方法、装置、存储介质及终端

Country Status (1)

Country Link
CN (1) CN111275599B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112084240A (zh) * 2020-09-15 2020-12-15 浙江新再灵科技股份有限公司 一种群租房智能识别、联动治理方法及系统
CN112364263A (zh) * 2020-11-11 2021-02-12 深圳力维智联技术有限公司 基于多维度数据的群租房识别方法、装置、设备及介质
CN112732962A (zh) * 2021-01-12 2021-04-30 南京大学 基于深度学习与Flink的线上实时预测垃圾图片类别方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473844A (zh) * 2013-10-12 2013-12-25 东信和平科技股份有限公司 公租房智能控制方法及系统
CN104123477A (zh) * 2014-08-15 2014-10-29 上海博路信息技术有限公司 一种基于生活数据的群租分析方法
US20170140458A1 (en) * 2015-11-12 2017-05-18 Douglas Mallach Method of estimating tenancy duration and mobility in rental properties
CN107146130A (zh) * 2017-04-21 2017-09-08 无锡房查查网络科技有限公司 一种房屋租赁方法及系统
CN107492181A (zh) * 2017-09-29 2017-12-19 苏州见真物联科技有限公司 一种基于指纹识别的门禁系统
CN108062809A (zh) * 2017-11-28 2018-05-22 特斯联(北京)科技有限公司 一种实现人员大数据采集分析的住宅门禁系统
CN108305363A (zh) * 2018-01-31 2018-07-20 上海与德通讯技术有限公司 群租房的监控方法及智能终端
CN110211262A (zh) * 2018-11-19 2019-09-06 北京玮家技术有限公司 房屋使用状态判断系统、方法及门禁设备
CN110675206A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 群租发现方法、装置、设备及计算机可读介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473844A (zh) * 2013-10-12 2013-12-25 东信和平科技股份有限公司 公租房智能控制方法及系统
CN104123477A (zh) * 2014-08-15 2014-10-29 上海博路信息技术有限公司 一种基于生活数据的群租分析方法
US20170140458A1 (en) * 2015-11-12 2017-05-18 Douglas Mallach Method of estimating tenancy duration and mobility in rental properties
CN107146130A (zh) * 2017-04-21 2017-09-08 无锡房查查网络科技有限公司 一种房屋租赁方法及系统
CN107492181A (zh) * 2017-09-29 2017-12-19 苏州见真物联科技有限公司 一种基于指纹识别的门禁系统
CN108062809A (zh) * 2017-11-28 2018-05-22 特斯联(北京)科技有限公司 一种实现人员大数据采集分析的住宅门禁系统
CN108305363A (zh) * 2018-01-31 2018-07-20 上海与德通讯技术有限公司 群租房的监控方法及智能终端
CN110675206A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 群租发现方法、装置、设备及计算机可读介质
CN110211262A (zh) * 2018-11-19 2019-09-06 北京玮家技术有限公司 房屋使用状态判断系统、方法及门禁设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
于怡佳: "智能安防门禁卡在平安社区中的应用", 《机电产品开发与创新》 *
蒋林秀等: "基于机器学习的群租房精准治理研究", 《公共管理与政策评论》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112084240A (zh) * 2020-09-15 2020-12-15 浙江新再灵科技股份有限公司 一种群租房智能识别、联动治理方法及系统
CN112084240B (zh) * 2020-09-15 2023-11-10 浙江新再灵科技股份有限公司 一种群租房智能识别、联动治理方法及系统
CN112364263A (zh) * 2020-11-11 2021-02-12 深圳力维智联技术有限公司 基于多维度数据的群租房识别方法、装置、设备及介质
CN112732962A (zh) * 2021-01-12 2021-04-30 南京大学 基于深度学习与Flink的线上实时预测垃圾图片类别方法
CN112732962B (zh) * 2021-01-12 2023-10-13 南京大学 基于深度学习与Flink的线上实时预测垃圾图片类别方法

Also Published As

Publication number Publication date
CN111275599B (zh) 2022-09-20

Similar Documents

Publication Publication Date Title
CN111275599B (zh) 一种基于大数据集成算法的群租房预警方法、装置、存储介质及终端
CN112561684B (zh) 金融欺诈风险识别方法、装置、计算机设备及存储介质
CN110275965B (zh) 假新闻检测方法、电子装置及计算机可读存储介质
CN110597943A (zh) 基于人工智能的兴趣点处理方法、装置及电子设备
CN111488594B (zh) 一种基于云服务器的权限检查方法、装置、存储介质及终端
CN107730375B (zh) 一种税务地图管理的方法、系统及终端设备
CN111522838A (zh) 地址相似度计算方法及相关装置
CN111726352A (zh) 可视化监测探针状态的方法、装置、计算机设备和介质
CN114996675A (zh) 数据查询方法、装置、计算机设备及存储介质
CN117093619A (zh) 一种规则引擎处理方法、装置、电子设备及存储介质
CN112199374A (zh) 针对数据缺失的数据特征挖掘方法及其相关设备
CN116028467A (zh) 智能服务大数据建模方法、系统、存储介质及计算机设备
CN116955390A (zh) 一种数据库语句的处理方法、装置、设备及存储介质
CN115471582A (zh) 地图生成方法、装置、计算机设备及存储介质
JP6371346B2 (ja) データ製品構築システム
CN114722361A (zh) 基于摩斯编码的数据防护方法、装置、设备及存储介质
CN114972925A (zh) 一种语音和图像识别芯片及其识别算法
CN110781314B (zh) 用户关系图的分层显示方法、装置及电子设备
CN113468037A (zh) 一种数据质量评估方法、装置、介质和电子设备
CN112650763A (zh) 产品额度的配置方法、相关设备和存储介质
CN113365113A (zh) 目标节点识别方法及装置
CN112036501A (zh) 基于卷积神经网络的图片的相似度检测方法及其相关设备
CN111950282A (zh) 一种基于网络行为特征的扩线分析方法及装置
CN115102920B (zh) 基于关系网络的个体的传输管控方法
CN107451286A (zh) 一种亲属关系的分析方法、装置、存储介质及智能终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant