CN112988837A - 群租房识别方法、装置及设备 - Google Patents

群租房识别方法、装置及设备 Download PDF

Info

Publication number
CN112988837A
CN112988837A CN202110271724.XA CN202110271724A CN112988837A CN 112988837 A CN112988837 A CN 112988837A CN 202110271724 A CN202110271724 A CN 202110271724A CN 112988837 A CN112988837 A CN 112988837A
Authority
CN
China
Prior art keywords
delivery
garbage
data
identification information
house
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110271724.XA
Other languages
English (en)
Inventor
吕景旭
员晓毅
王德旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen ZNV Technology Co Ltd
Nanjing ZNV Software Co Ltd
Original Assignee
Shenzhen ZNV Technology Co Ltd
Nanjing ZNV Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen ZNV Technology Co Ltd, Nanjing ZNV Software Co Ltd filed Critical Shenzhen ZNV Technology Co Ltd
Priority to CN202110271724.XA priority Critical patent/CN112988837A/zh
Publication of CN112988837A publication Critical patent/CN112988837A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0645Rental transactions; Leasing transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/16Real estate

Abstract

一种群租房识别方法、装置及设备,通过获取预设时长内目标小区的垃圾投递数据,垃圾投递数据至少用于记录每次垃圾投递的投递时间、投递卡标识信息和垃圾桶标识信息;根据垃圾投递数据以及房屋标识信息与投递卡标识信息之间的对应关系,确定目标小区内各个房屋在预设时长内的垃圾投递次数;将目标小区中在预设时长内垃圾投递次数大于预设阈值的房屋确定为疑似群租房。通过统计垃圾投递次数,判断某一房屋是否产生了大量垃圾,从而推断该房屋实有人口数量是否处于超标状态,这样可以及时、自动地发现疑似群租房,提高了群租房的识别效率和群租房的判断准确度,从而帮助相关部门提高了群租整治效率。

Description

群租房识别方法、装置及设备
技术领域
本发明涉及计算机技术领域,具体涉及一种群租房识别方法、装置及设备。
背景技术
随着社会的发展,大城市人口越来越多,群租成为了大城市普遍存在的现象。具体的,将住宅通过改变房屋结构和平面布局,把房间分割改建成若干小间分别按间出租或按床位出租给多人的方式就叫作群租。然而这种大量的人口密集居住在狭小空间内、人均居住面积不过几个平方米、没有基本生活措施的群租房存在各种安全隐患,同时对周边住户产生了较大的影响。
目前可以通过判断某一房屋的水、电、气等用量数据是否超标来确定该房屋是否为群租房,但是该方法依赖于多家公司的水、电、气的抄表数据,采集难度大,并且分析周期长,从而导致群租房的识别效率较低。
发明内容
本发明实施例提供一种群租房识别方法、装置及设备,用以提高群租房的识别效率。
根据第一方面,一种实施例中提供一种群租房识别方法,包括:
获取预设时长内目标小区的垃圾投递数据,所述垃圾投递数据至少用于记录每次垃圾投递的投递时间、投递卡标识信息和垃圾桶标识信息;
根据所述垃圾投递数据以及房屋标识信息与投递卡标识信息之间的对应关系,确定所述目标小区内各个房屋在所述预设时长内的垃圾投递次数;
将所述目标小区中在所述预设时长内垃圾投递次数大于预设阈值的房屋确定为疑似群租房。
可选的,在所述根据所述垃圾投递数据以及房屋标识信息与投递卡标识信息之间的对应关系,确定所述目标小区内各个房屋在所述预设时长内的垃圾投递次数之前,所述方法还包括:
对所述垃圾投递数据进行数据清洗;
所述对所述垃圾投递数据进行数据清洗包括:删除所述垃圾投递数据中的重复数据、错误数据和不完整数据。
可选的,所述删除所述垃圾投递数据中的重复数据、错误数据和不完整数据,包括:
将投递时间、投递卡标识信息和垃圾桶标识信息中至少一项格式错误或者取值错误的垃圾投递数据删除;
保留投递时间与投递卡标识信息相同的多条垃圾投递数据中的一条垃圾投递数据;
将投递时间、投递卡标识信息和垃圾桶标识信息中至少一项缺失的垃圾投递数据删除。
可选的,所述方法还包括:
定时更新所述目标小区中房屋标识信息与投递卡标识信息之间的对应关系以及所述目标小区中的垃圾桶标识信息。
可选的,在所述将所述目标小区中在所述预设时长内垃圾投递次数大于预设阈值的房屋确定为疑似群租房之后,所述方法还包括:
生成告警信息,所述告警信息包括疑似群租房的房屋标识信息;
将所述告警信息推送至工作人员,以使工作人员根据所述告警信息对疑似群租房进行核实。
可选的,所述方法还包括:
接收来自所述工作人员反馈的核实数据;
根据所述告警信息和所述核实数据,调整所述预设阈值。
可选的,所述方法还包括:
提供导出所述告警信息和/或所述核实数据的接口。
根据第二方面,一种实施例中提供一种群租房识别装置,包括:
获取模块,用于获取预设时长内目标小区的垃圾投递数据,所述垃圾投递数据至少用于记录每次垃圾投递的投递时间、投递卡标识信息和垃圾桶标识信息;
第一确定模块,用于根据所述垃圾投递数据以及房屋标识信息与投递卡标识信息之间的对应关系,确定所述目标小区内各个房屋在所述预设时长内的垃圾投递次数;
第二确定模块,用于将所述目标小区中在所述预设时长内垃圾投递次数大于预设阈值的房屋确定为疑似群租房。
根据第三方面,一种实施例中提供一种电子设备,包括:至少一个处理器和存储器;
所述存储器,用于存储程序;
所述处理器,用于通过执行所述存储器存储的程序以实现上述第一方面中任一项所述的群租房识别方法。
根据第四方面,一种实施例中提供一种计算机可读存储介质,所述介质上存储有程序,所述程序能够被处理器执行以实现上述第一方面中任一项所述的群租房识别方法。
本发明实施例提供一种群租房识别方法、装置及设备,包括:获取预设时长内目标小区的垃圾投递数据,垃圾投递数据至少用于记录每次垃圾投递的投递时间、投递卡标识信息和垃圾桶标识信息;根据垃圾投递数据以及房屋标识信息与投递卡标识信息之间的对应关系,确定目标小区内各个房屋在预设时长内的垃圾投递次数;将目标小区中在预设时长内垃圾投递次数大于预设阈值的房屋确定为疑似群租房。通过统计垃圾投递次数,判断某一房屋是否产生了大量垃圾,从而推断该房屋实有人口数量是否处于超标状态,这样可以及时、自动地发现疑似群租房,提高了群租房的识别效率和群租房的判断准确度,从而帮助相关部门提高了群租整治效率。
附图说明
图1为本发明实施例提供的一种群租房识别方法的实施例一的流程示意图;
图2为本发明实施例提供的一种群租房识别方法的实施例二的流程示意图;
图3为本发明实施例提供的一种群租房识别方法的实施例三的流程示意图;
图4为本发明实施例提供的一种群租房识别方法的实施例四的流程示意图;
图5为本发明实施例提供的一种群租房识别方法的实施例五的流程示意图;
图6为本发明实施例提供的一种群租房识别装置的结构示意图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。而本申请所说“连接”、“联接”,如无特别说明,均包括直接和间接连接(联接)。
由于现有技术中通过判断某一房屋的水、电、气等用量数据是否超标来确定该房屋是否为群租房时,依赖于多家公司的水、电、气的抄表数据,采集难度大,并且分析周期长,从而导致群租房的识别效率较低。为了提高群租房的识别效率,本发明实施例提供了一种群租房识别方法、装置及设备,以下分别进行详细说明。
图1为本发明实施例提供的一种群租房识别方法的实施例一的流程示意图,本发明实施例的执行主体可以为任意具有处理能力的设备,本发明实施例的执行主体以后台服务器为例进行说明。如图1所示,本实施例提供的群租房识别方法可以包括:
S101,获取预设时长内目标小区的垃圾投递数据。
其中,上述垃圾投递数据可以至少用于记录每次垃圾投递的投递时间、投递卡标识信息和垃圾桶标识信息。
随着垃圾分类的推广,垃圾桶产品的功能也越来越完善,用户可以采用刷卡、扫码、刷脸等方式进行垃圾投递。具体实现时,后台服务器与垃圾桶之间可以制定统一的数据规约,以兼容不同的厂家平台协议,支持HTTP(Hypertext Transfer Protocol,超文本传输协议)协议、中间库、消息中间件等数据对接方式。以常见的刷卡方式举例说明,当用户通过刷卡方式进行垃圾投递后,生成的垃圾投递数据可以至少用于记录每次垃圾投递的投递时间、投递卡标识信息和垃圾桶标识信息,而后台服务器可以获取到预设时长内目标小区的垃圾投递数据,例如,预设时长可以为一天、一个周或一个月等。
S102,根据垃圾投递数据以及房屋标识信息与投递卡标识信息之间的对应关系,确定目标小区内各个房屋在预设时长内的垃圾投递次数。
具体实现时,可能会为某个房屋配发多张投递卡,因此可以统计对应于房屋的所有投递卡的垃圾投递数据,确定目标小区内各个房屋在预设时长内的垃圾投递次数。例如,假设为房屋A配发了投递卡a、投递卡b和投递卡c,那么在确定房屋A在2021年3月内的垃圾投递次数时,可以计算投递卡a、投递卡b和投递卡c在2021年3月内的垃圾投递次数之和。
S103,将目标小区中在预设时长内垃圾投递次数大于预设阈值的房屋确定为疑似群租房。
由于某个房屋产生垃圾的多少,将体现在刷卡次数(即垃圾投递次数)上。若刷卡总次数过多,则确定该房屋产生的垃圾过多,于是怀疑该房屋所住人口较多,从而判断该房屋是疑似群租房。具体的,可以设置一个预设阈值,将在预设时长内垃圾投递次数大于预设阈值的房屋确定为疑似群租房。例如,记录每一房屋当天(即,预设时长为一天)的垃圾投递次数,当某一房屋在当天的垃圾投递次数大于预设阈值4时,那么将该房屋确定为疑似群租房;或者,也可以采用统计日均投递次数的方式,即,每天定时执行分析任务,采集目标小区内所有垃圾桶七天内(即,预设时长为一周)的垃圾投递数据,并关联房屋信息,统计每个房屋对应的平均每天的垃圾投递次数,将平均投递次数大于4的房屋确定为疑似群租房。
本发明实施例提供的群租房识别方法,包括:获取预设时长内目标小区的垃圾投递数据,垃圾投递数据至少用于记录每次垃圾投递的投递时间、投递卡标识信息和垃圾桶标识信息;根据垃圾投递数据以及房屋标识信息与投递卡标识信息之间的对应关系,确定目标小区内各个房屋在预设时长内的垃圾投递次数;将目标小区中在预设时长内垃圾投递次数大于预设阈值的房屋确定为疑似群租房。通过统计垃圾投递次数,判断某一房屋是否产生了大量垃圾,从而推断该房屋实有人口数量是否处于超标状态,这样可以及时、自动地发现疑似群租房,提高了群租房的识别效率和群租房的判断准确度,从而帮助相关部门提高了群租整治效率。
图2为本发明实施例提供的一种群租房识别方法的实施例二的流程示意图,如图2所示,本实施例提供的群租房识别方法可以包括:
S201,获取预设时长内目标小区的垃圾投递数据。
其中,垃圾投递数据至少用于记录每次垃圾投递的投递时间、投递卡标识信息和垃圾桶标识信息。
S202,对垃圾投递数据进行数据清洗。
具体实现时,上述对垃圾投递数据进行数据清洗可以包括:删除垃圾投递数据中的重复数据、错误数据和不完整数据。
具体的,删除垃圾投递数据中的重复数据、错误数据和不完整数据,可以通过下面的步骤实现:
步骤a:将投递时间、投递卡标识信息和垃圾桶标识信息中至少一项格式错误或者取值错误的垃圾投递数据删除。
具体的,对于具有条件约束且明显不符合该条件的数据,则认为是错误值或异常值,从数据源中剔除掉。举例说明,投递时间的预设格式为“××年-××月-××日-××时-××分-××秒”,例如可以为“2021年-3月-1日-08时-08分-31秒”,假设后台服务器获取到的一个垃圾投递数据所包括的投递时间的格式为“1日-08时-08分-31秒”,由于该格式不符合投递时间的预设格式,因此将包括该格式的投递时间的垃圾投递数据删除;假设投递时间中的“××时”的预设取值为0,1,2,…,24,假设后台服务器获取到的一个垃圾投递数据所包括的投递时间为“2021年-3月-1日-26时-08分-31秒”,由于该投递时间中的“26时”的取值错误,因此将包括该错误取值的投递时间的垃圾投递数据删除。
步骤b:保留投递时间与投递卡标识信息相同的多条垃圾投递数据中的一条垃圾投递数据。
当多条垃圾投递数据中包括的投递时间与投递卡标识信息均相同,则可以认为该投递卡的持有者在同一时间的同一地点刷了多次投递卡,此时认为该投递卡的持有者可能是重复刷卡,因此只保留其中一条垃圾投递数据即可;或者,该投递卡的持有者在同一时间的不同地点刷了多次投递卡,这种场景下的垃圾投递情况是不合理的,也可以只保留其中一条垃圾投递数据。
可选的,原始数据中属性完全相同的多条记录被认为是数据重复,可以只保留其中一条。例如,同一住户房号在同一小区同一楼栋出现多条,如在“××小区8号楼”出现三个房号“1102室”,此时可以只保留一条。
步骤c:将投递时间、投递卡标识信息和垃圾桶标识信息中至少一项缺失的垃圾投递数据删除。
对于关键属性(投递时间、投递卡标识信息和垃圾桶标识信息)为空的垃圾投递数据,将从数据源中剔除掉。例如:垃圾桶唯一标识为空、投递时间为空等。
上述步骤a、b、c可以同时执行,也可以按照其他执行顺序(例如,先执行步骤b,再执行步骤c,最后执行步骤a)进行,本发明实施例不限制上述步骤a、b、c的执行顺序。
S203,根据垃圾投递数据以及房屋标识信息与投递卡标识信息之间的对应关系,确定目标小区内各个房屋在预设时长内的垃圾投递次数。
S204,将目标小区中在预设时长内垃圾投递次数大于预设阈值的房屋确定为疑似群租房。
S201、S203和S204的具体实现方式可以参考上述实施例一中对于S101-S103的相关说明。
本发明实施例提供的群租房识别方法,通过对垃圾投递数据进行数据清洗,可以起到异常检测、错误处理以及合并过滤的数据处理作用,更有利于后续的目标小区内各个房屋在预设时长内的垃圾投递次数的统计,从而在一定程度上提高了群租房的判断准确度。
作为一种可以实现的方式,在上述实施例一的基础上,上述群租房识别方法还可以包括:定时更新目标小区中房屋标识信息与投递卡标识信息之间的对应关系以及目标小区中的垃圾桶标识信息。例如,当以下情况出现时:为某个房屋增加或者减少配发投递卡,目标小区里新添置了10个垃圾桶或者目标小区里有5个垃圾桶出现设备故障,目标小区里为15个新入住了住户的房屋配发新的投递卡等情况,需要定时更新目标小区中房屋标识信息与投递卡标识信息之间的对应关系以及目标小区中的垃圾桶标识信息,避免设备异常和住户信息发生变化而导致的信息不一致问题,这样有利于后续的目标小区内各个房屋在预设时长内的垃圾投递次数的统计,从而在一定程度上提高了群租房的判断准确度。
图3为本发明实施例提供的一种群租房识别方法的实施例三的流程示意图,如图3所示,本实施例提供的群租房识别方法可以包括:
S301,获取预设时长内目标小区的垃圾投递数据。
其中,上述垃圾投递数据可以至少用于记录每次垃圾投递的投递时间、投递卡标识信息和垃圾桶标识信息。
S302,根据垃圾投递数据以及房屋标识信息与投递卡标识信息之间的对应关系,确定目标小区内各个房屋在预设时长内的垃圾投递次数。
S303,将目标小区中在预设时长内垃圾投递次数大于预设阈值的房屋确定为疑似群租房。
S301-S303的具体实现方式可以参考上述实施例一中对于S101-S103的相关说明。
S304,生成告警信息。
其中,上述告警信息可以包括疑似群租房的房屋标识信息。
S305,将告警信息推送至工作人员,以使工作人员根据告警信息对疑似群租房进行核实。
具体实现时,可以通过接口方式将告警信息推送至第三方管理平台,再由第三方管理平台将告警信息推送至工作人员,例如,可以将告警信息发送至固定工作人员的手机中安装的APP(Application,应用程序),以提示该工作人员根据告警信息对疑似群租房进行群租核实、群租处置、群租反馈等操作。或者,也可以通过邮箱、短信的方式,将告警信息直接发送至指定的工作人员,以提示该工作人员根据告警信息对疑似群租房进行核实。本发明实施例不对推送告警信息的实现方式做具体的限定。
本发明实施例提供的群租房识别方法,通过生成告警信息,并将告警信息推送至工作人员,以使工作人员根据告警信息对疑似群租房进行核实,可以进一步对疑似群租房进行群租核实、群租处置、群租反馈等操作,从而在一定程度上提高了群租房的判断准确度。
图4为本发明实施例提供的一种群租房识别方法的实施例四的流程示意图,如图4所示,本实施例提供的群租房识别方法可以包括:
S401,获取预设时长内目标小区的垃圾投递数据。
其中,上述垃圾投递数据可以至少用于记录每次垃圾投递的投递时间、投递卡标识信息和垃圾桶标识信息。
S402,根据垃圾投递数据以及房屋标识信息与投递卡标识信息之间的对应关系,确定目标小区内各个房屋在预设时长内的垃圾投递次数。
S403,将目标小区中在预设时长内垃圾投递次数大于预设阈值的房屋确定为疑似群租房。
S404,生成告警信息。
其中,上述告警信息可以包括疑似群租房的房屋标识信息。
S405,将告警信息推送至工作人员,以使工作人员根据告警信息对疑似群租房进行核实。
S401-S405的具体实现方式可以参考上述实施例三中对于S301-S305的相关说明。
S406,接收来自工作人员反馈的核实数据。
具体的,可以通过接口方式接收第三方管理平台获取的来自工作人员反馈的核实数据,其中,核实数据可以包括告警信息推送时间、告警信息推送人、告警信息接收时间、告警信息接收人、核实时间、核实人、处置完成时间、处置人、处置结果、处置照片等其他相关数据。
可选的,根据该核实数据,更新疑似群租房的类别,疑似群租房的类别包括:群租和非群租。例如,若核实人进行上门核实疑似群租房时,发现该疑似群租房是因为近日家中有亲朋好友聚会,从而导致垃圾投递次数陡增,因此当后台服务器接收到反馈的核实数据后,可以解除该疑似群租房的告警标签。
S407,根据告警信息和核实数据,调整预设阈值。
举例说明,当预设阈值为4次时,确定目标小区内存在50个疑似群租房,针对这50个疑似群租房,经工作人员上门核实后,对其中的40个疑似群租房解除该疑似群租房的告警标签,由于解除率高达80%,因此可以将预设阈值调整为5次。
本发明实施例提供的群租房识别方法,通过接收来自工作人员反馈的核实数据,根据告警信息和核实数据,调整预设阈值,可以降低误报率,帮助相关部门高效地整治群租现象。
作为一种可以实现的方式,对于疑似群租房上门排查结果,可以采用不同的告警推送策略。例如,对于核实后确认是群租房的住户,若该住户一周后的垃圾投递次数大于4次,将再次产生告警;对于核实后不是群租房的住户,若该住户一个月后的垃圾投递次数大于4次,将再次产生告警。
作为一种可以实现的方式,在上述实施例四的基础上,上述群租房识别方法还可以包括:提供导出告警信息和/或核实数据的接口,并支持excel(一个电子表格软件)导出,便于相关处置部门对数据整体进行分析,并可以对相关判断阈值进行调优。
下面以一个具体的实现方式为例对本发明实施例提供的群租房识别方法进行说明。图5为本发明实施例提供的一种群租房识别方法的实施例五的流程示意图,如图5所示,本实施例提供的群租房识别方法可以包括:
S501,数据采集。
后台服务器对接智能垃圾桶厂家平台,获取预设时长内目标小区的垃圾投递数据,例如获取智能垃圾桶、小区居民住户、垃圾投递等原始数据,本发明实施例制定了统一的数据规约,如下面的表1-表3所示,其中,表1为智能垃圾桶设备的数据规约,表2为小区居民住户的数据规约,表3为垃圾投递的数据规约。通过制定统一的数据规约,可以兼容不同的厂家平台协议,支持HTTP协议、中间库、消息中间件等数据对接方式。
表1
Figure BDA0002974254230000101
表2
Figure BDA0002974254230000102
Figure BDA0002974254230000111
表3
Figure BDA0002974254230000112
S502,数据清洗。
对通过上述S401采集到的原始数据进行数据清洗,一般需要对以下几种情况进行处理:
(1)数据不完整:对于关键属性为空,无法补全,将从数据源中剔除掉,例如:智能垃圾桶唯一标识为空、投递数据没有住户标识等。
(2)数据错误值:对于具有条件约束且明显不符合该条件的数据,则认为是错误值或异常值,从数据源中剔除掉,例如:时间格式不正确。
(3)数据重复:原始数据中属性完全相同的记录被认为是数据重复,应只保留一条,例如:同一住户房号在同一小区同一楼栋出现多条。
S503,模型分析。
在本发明实施例中,例如可以对最近7天的小区住户垃圾投递数据进行聚合,分组统计出投递次数大于28次的住户,即,日均投递垃圾超过了4次,则确定该住户是疑似群租房,将自动生成该疑似群租房对应的告警信息。可选的,如果此疑似群租房的告警信息此前已被分析标记,且没有反馈排查结果,则不再推送。
S504,告警推送。
通过接口方式,将经由上述S503生成的告警信息推送至第三方处置平台,由第三方处置平台推送至处置人,并进行群租核实、群租处置、群租反馈等操作。
并且,可以通过接口方式获取第三方处置平台的处置状态数据,其中,处置状态数据可以包括推送时间、推送人、接收时间、接收人、核实时间、核实人、处置完成时间、处置人、处置结果、处置照片等。对于不是疑似群租房的住户,需解除疑似群租告警标签。
S505,数据共享。
将疑似群租房的告警信息、核实数据、处置数据以及统计数据生成报表,并支持excel导出,便于相关处置部门对数据整体进行分析,并可以对相关判断阈值进行调优。
图6为本发明实施例提供的一种群租房识别装置的结构示意图,如图6所示,该群租房识别装置60可以包括:
获取模块610,可以用于获取预设时长内目标小区的垃圾投递数据,垃圾投递数据至少用于记录每次垃圾投递的投递时间、投递卡标识信息和垃圾桶标识信息;
第一确定模块620,可以用于根据垃圾投递数据以及房屋标识信息与投递卡标识信息之间的对应关系,确定目标小区内各个房屋在预设时长内的垃圾投递次数;
第二确定模块630,可以用于将目标小区中在预设时长内垃圾投递次数大于预设阈值的房屋确定为疑似群租房。
本发明实施例提供的群租房识别装置,通过获取模块,获取预设时长内目标小区的垃圾投递数据,垃圾投递数据至少用于记录每次垃圾投递的投递时间、投递卡标识信息和垃圾桶标识信息;通过第一确定模块,根据垃圾投递数据以及房屋标识信息与投递卡标识信息之间的对应关系,确定目标小区内各个房屋在预设时长内的垃圾投递次数;通过第二确定模块,将目标小区中在预设时长内垃圾投递次数大于预设阈值的房屋确定为疑似群租房。通过统计垃圾投递次数,判断某一房屋是否产生了大量垃圾,从而推断该房屋实有人口数量是否处于超标状态,这样可以及时、自动地发现疑似群租房,提高了群租房的识别效率和群租房的判断准确度,从而帮助相关部门提高了群租整治效率。
可选的,上述群租房识别装置60还可以包括:清洗模块(图中未示出),可以用于对垃圾投递数据进行数据清洗。具体的,清洗模块在实现对垃圾投递数据进行数据清洗时,可以具体用于:删除垃圾投递数据中的重复数据、错误数据和不完整数据。
可选的,清洗模块在实现删除垃圾投递数据中的重复数据、错误数据和不完整数据时,可以具体用于:
将投递时间、投递卡标识信息和垃圾桶标识信息中至少一项格式错误或者取值错误的垃圾投递数据删除;
保留投递时间与投递卡标识信息相同的多条垃圾投递数据中的一条垃圾投递数据;
将投递时间、投递卡标识信息和垃圾桶标识信息中至少一项缺失的垃圾投递数据删除。
可选的,上述群租房识别装置60还可以包括:更新模块(图中未示出),可以用于定时更新目标小区中房屋标识信息与投递卡标识信息之间的对应关系以及目标小区中的垃圾桶标识信息。
可选的,上述群租房识别装置60还可以包括:推送模块(图中未示出),可以用于生成告警信息,告警信息包括疑似群租房的房屋标识信息;将告警信息推送至工作人员,以使工作人员根据告警信息对疑似群租房进行核实。
可选的,上述群租房识别装置60还可以包括:调整模块(图中未示出),可以用于接收来自工作人员反馈的核实数据;根据告警信息和核实数据,调整预设阈值。
可选的,上述群租房识别装置60还可以包括:导出模块(图中未示出),可以用于提供导出告警信息和/或核实数据的接口。
另外,相应于上述实施例所提供的群租房识别方法,本发明实施例还提供了一种电子设备,该电子设备可以包括:存储器,用于存储程序;处理器,用于通过执行存储器存储的程序以实现本发明实施例提供的群租房识别方法的所有步骤。
另外,相应于上述实施例所提供的群租房识别方法,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时实现本发明实施例的群租房识别方法的所有步骤。
本领域技术人员可以理解,上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。

Claims (10)

1.一种群租房识别方法,其特征在于,包括:
获取预设时长内目标小区的垃圾投递数据,所述垃圾投递数据至少用于记录每次垃圾投递的投递时间、投递卡标识信息和垃圾桶标识信息;
根据所述垃圾投递数据以及房屋标识信息与投递卡标识信息之间的对应关系,确定所述目标小区内各个房屋在所述预设时长内的垃圾投递次数;
将所述目标小区中在所述预设时长内垃圾投递次数大于预设阈值的房屋确定为疑似群租房。
2.如权利要求1所述的方法,其特征在于,在所述根据所述垃圾投递数据以及房屋标识信息与投递卡标识信息之间的对应关系,确定所述目标小区内各个房屋在所述预设时长内的垃圾投递次数之前,所述方法还包括:
对所述垃圾投递数据进行数据清洗;
所述对所述垃圾投递数据进行数据清洗包括:删除所述垃圾投递数据中的重复数据、错误数据和不完整数据。
3.如权利要求2所述的方法,其特征在于,所述删除所述垃圾投递数据中的重复数据、错误数据和不完整数据,包括:
将投递时间、投递卡标识信息和垃圾桶标识信息中至少一项格式错误或者取值错误的垃圾投递数据删除;
保留投递时间与投递卡标识信息相同的多条垃圾投递数据中的一条垃圾投递数据;
将投递时间、投递卡标识信息和垃圾桶标识信息中至少一项缺失的垃圾投递数据删除。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
定时更新所述目标小区中房屋标识信息与投递卡标识信息之间的对应关系以及所述目标小区中的垃圾桶标识信息。
5.如权利要求1所述的方法,其特征在于,在所述将所述目标小区中在所述预设时长内垃圾投递次数大于预设阈值的房屋确定为疑似群租房之后,所述方法还包括:
生成告警信息,所述告警信息包括疑似群租房的房屋标识信息;
将所述告警信息推送至工作人员,以使工作人员根据所述告警信息对疑似群租房进行核实。
6.如权利要求5所述的方法,其特征在于,所述方法还包括:
接收来自所述工作人员反馈的核实数据;
根据所述告警信息和所述核实数据,调整所述预设阈值。
7.如权利要求6所述的方法,其特征在于,所述方法还包括:
提供导出所述告警信息和/或所述核实数据的接口。
8.一种群租房识别装置,其特征在于,包括:
获取模块,用于获取预设时长内目标小区的垃圾投递数据,所述垃圾投递数据至少用于记录每次垃圾投递的投递时间、投递卡标识信息和垃圾桶标识信息;
第一确定模块,用于根据所述垃圾投递数据以及房屋标识信息与投递卡标识信息之间的对应关系,确定所述目标小区内各个房屋在所述预设时长内的垃圾投递次数;
第二确定模块,用于将所述目标小区中在所述预设时长内垃圾投递次数大于预设阈值的房屋确定为疑似群租房。
9.一种电子设备,其特征在于,包括:
存储器,用于存储程序;
处理器,用于通过执行所述存储器存储的程序以实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述介质上存储有程序,所述程序能够被处理器执行以实现如权利要求1-7中任一项所述的方法。
CN202110271724.XA 2021-03-12 2021-03-12 群租房识别方法、装置及设备 Pending CN112988837A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110271724.XA CN112988837A (zh) 2021-03-12 2021-03-12 群租房识别方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110271724.XA CN112988837A (zh) 2021-03-12 2021-03-12 群租房识别方法、装置及设备

Publications (1)

Publication Number Publication Date
CN112988837A true CN112988837A (zh) 2021-06-18

Family

ID=76335442

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110271724.XA Pending CN112988837A (zh) 2021-03-12 2021-03-12 群租房识别方法、装置及设备

Country Status (1)

Country Link
CN (1) CN112988837A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123477A (zh) * 2014-08-15 2014-10-29 上海博路信息技术有限公司 一种基于生活数据的群租分析方法
CN109034969A (zh) * 2018-07-19 2018-12-18 上海小蚁科技有限公司 公租房的监控方法及装置、存储介质、计算设备
CN109284988A (zh) * 2018-12-24 2019-01-29 上海市浦东新区城市运行综合管理中心 数据分析系统及方法
CN110211262A (zh) * 2018-11-19 2019-09-06 北京玮家技术有限公司 房屋使用状态判断系统、方法及门禁设备
CN111401431A (zh) * 2020-03-12 2020-07-10 成都小步创想慧联科技有限公司 群租房识别方法及系统及存储介质
CN112084240A (zh) * 2020-09-15 2020-12-15 浙江新再灵科技股份有限公司 一种群租房智能识别、联动治理方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123477A (zh) * 2014-08-15 2014-10-29 上海博路信息技术有限公司 一种基于生活数据的群租分析方法
CN109034969A (zh) * 2018-07-19 2018-12-18 上海小蚁科技有限公司 公租房的监控方法及装置、存储介质、计算设备
CN110211262A (zh) * 2018-11-19 2019-09-06 北京玮家技术有限公司 房屋使用状态判断系统、方法及门禁设备
CN109284988A (zh) * 2018-12-24 2019-01-29 上海市浦东新区城市运行综合管理中心 数据分析系统及方法
CN111401431A (zh) * 2020-03-12 2020-07-10 成都小步创想慧联科技有限公司 群租房识别方法及系统及存储介质
CN112084240A (zh) * 2020-09-15 2020-12-15 浙江新再灵科技股份有限公司 一种群租房智能识别、联动治理方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
宁海新闻网: "前童镇:以垃圾‘智’分类强化群租房管理", 《宁海新闻网》 *

Similar Documents

Publication Publication Date Title
CN107835121B (zh) 一种基于微信公众号的物业线下线上服务平台及其实现方法
CN106779955A (zh) 一种房屋租赁信息系统
CN111327514A (zh) 微信图文消息群发方法、系统、服务器及存储介质
CN113722301A (zh) 基于教育信息的大数据处理方法、装置及系统、存储介质
CN106846090A (zh) 一种房屋出租管理系统
CN111813966B (zh) 数据审核方法及装置
CN113902416A (zh) 建筑信息资产全过程的管理方法和相关设备
CN112988837A (zh) 群租房识别方法、装置及设备
CN112288567A (zh) 银行账目信息处理方法、装置及可读介质
CN106651680A (zh) 一种房屋出租智能管理系统
CN115271514A (zh) 通讯企业的监控方法、装置、电子设备及存储介质
KR101415528B1 (ko) 분산된 시스템을 위한 데이터 오류 처리 장치 및 방법
CN114090634A (zh) 一种基于数据仓库的酒店数据管理方法及装置
CN113761854A (zh) 一种实现列控数据处理的方法和装置
CN106779609A (zh) 一种房屋中介管理系统
CN113344506A (zh) 档案数字化整理系统
CN111309758A (zh) 一种计费数据验证比对方法及装置
CN111382159A (zh) 费用信息处理的方法、服务器及计算机可读介质
CN110956445A (zh) 用于生成风险文件的方法和装置
Cortes et al. Information mining platforms: an infrastructure for KDD rapid deployment
CN109491921A (zh) 埋点信息的管理方法和系统
CN113327063B (zh) 资源检测方法、装置、电子设备及计算机可读存储介质
CN115423592B (zh) 一种计提引擎数据处理系统及其工作方法
CN110378089B (zh) 大数据平台
CN110555625B (zh) 一种信息处理方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210618

RJ01 Rejection of invention patent application after publication