CN111401431A - 群租房识别方法及系统及存储介质 - Google Patents

群租房识别方法及系统及存储介质 Download PDF

Info

Publication number
CN111401431A
CN111401431A CN202010172254.7A CN202010172254A CN111401431A CN 111401431 A CN111401431 A CN 111401431A CN 202010172254 A CN202010172254 A CN 202010172254A CN 111401431 A CN111401431 A CN 111401431A
Authority
CN
China
Prior art keywords
house
data
historical
identified
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010172254.7A
Other languages
English (en)
Other versions
CN111401431B (zh
Inventor
樊浩圣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Xiaobu Chuangxiang Huilian Technology Co ltd
Original Assignee
Chengdu Xiaobu Chuangxiang Huilian Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Xiaobu Chuangxiang Huilian Technology Co ltd filed Critical Chengdu Xiaobu Chuangxiang Huilian Technology Co ltd
Priority to CN202010172254.7A priority Critical patent/CN111401431B/zh
Publication of CN111401431A publication Critical patent/CN111401431A/zh
Application granted granted Critical
Publication of CN111401431B publication Critical patent/CN111401431B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本申请涉及一种群租房识别方法,获取待识别房屋业务数据,可以具体到每户进行识别。获取的待识别房屋业务数据包括:房屋用水量数据,房屋用电量数据,房屋用气量数据和房屋建筑面积数据,在识别时还考虑了房屋建筑面积数据,识别准确率更高。本申请中,预先构建了群租识别模型,根据待识别房屋的业务数据,基于预先构建的群租识别模型,得到待识别房屋的类别数据,待识别房屋的类别数据包括:群租和非群租。根据待识别房屋业务数据,通过预先训练好的群租识别模型对待识别房屋的类别进行识别,相较于仅通过分析水电气使用数据的异常情况来识别房屋类别,准确率更高,不容易对水电气用量大户进行误识别。

Description

群租房识别方法及系统及存储介质
技术领域
本申请涉及社区管理技术领域,尤其涉及一种群租房识别方法及系统及存储介质。
背景技术
群租房屋识别是社会治理中社区管理的重要保障之一,群租房屋识别可以帮助物业管理部门及时准确识别潜在群租房屋并予以管理,降低群租房导致的消防安全、邻里矛盾风险等问题。现有的群租房屋识别方法有以下两种。一种群租房屋识别方法是在门口安装人体感应器,统计进出人数,计算居住人数,来判断是否是群租房,但是如果要达到监控一座城市的住房是否为群租房的目标,那么每一个房屋都需要安装人体感应设备,安装运营成本过高,且房主不一定同意。另有一种群租房屋识别方法是统计小区单元水电气使用数据,对统计指标或分布区间异常的小区单元进行预警,通过分析水电气使用数据的异常情况,来识别房屋类型,实现成本较低,但具有以下几个缺点:该方法统计水电气使用总量作为识别依据,但水电气使用量较少的群租户则难以识别出,且容易对水电气用量大户误识别,群租只能识别到小区单元,不能识别到具体的群租房屋,且该方法没有考虑房屋面积不同,承载人口数量不同,群租预警阈值也会不同,该方法不具有普适性。
发明内容
为至少在一定程度上克服相关技术中存在的问题,本申请提供一种群租房识别方法及系统及存储介质。
本申请的方案如下:
根据本申请实施例的第一方面,提供一种群租房识别方法,包括:
获取待识别房屋业务数据,所述待识别房屋业务数据包括:房屋用水量数据,房屋用电量数据,房屋用气量数据和房屋建筑面积数据;
根据所述待识别房屋的业务数据,基于预先构建的群租识别模型,得到待识别房屋的类别数据,所述待识别房屋的类别数据包括:群租和非群租。
优选地,在本申请一种可实现的方式中,还包括:
从预先建立的动态数据池中获取房屋历史数据作为样本数据,所述房屋历史数据包括:房屋历史类别数据,以及所述房屋历史类别数据对应的房屋历史业务数据;所述房屋历史业务数据包括:房屋历史用水量数据,房屋历史用电量数据,房屋历史用气量数据和房屋历史建筑面积数据;
计算群租房屋历史类别和非群租房屋历史类别的先验概率;
计算所述房屋历史用水量数据,房屋历史用电量数据,房屋历史用气量数据和房屋历史建筑面积数据的先验概率;
分别计算所述房屋历史用水量数据,房屋历史用电量数据,房屋历史用气量数据和房屋历史建筑面积数据在群租房屋历史类别条件下和非群租房屋历史类别条件下的条件概率;
根据房屋历史类别数据的先验概率,房屋历史业务数据的先验概率,以及房屋历史业务数据在群租房屋历史类别条件下和非群租房屋历史类别条件下的条件概率,建立群租识别模型。
优选地,在本申请一种可实现的方式中,所述根据所述待识别房屋的业务数据,基于预先构建的群租识别模型,得到待识别房屋的类别,具体包括:
根据所述待识别房屋的业务数据,所述房屋历史类别数据的先验概率,房屋历史业务数据的先验概率,以及房屋历史业务数据在群租房屋历史类别条件下和非群租房屋历史类别条件下的条件概率,计算所述待识别房屋的群租类别后验概率和非群租类别后验概率;
在所述待识别房屋的群租类别后验概率大于非群租类别后验概率时,输出所述待识别房屋的类别为群租类别;
在所述待识别房屋的非群租类别后验概率大于等于群租类别后验概率时,输出所述待识别房屋的类别为非群租类别。
优选地,在本申请一种可实现的方式中,还包括:
验证所述待识别房屋的类别,得到所述待识别房屋的类别数据;
将验证后的所述待识别房屋的类别数据和业务数据作为房屋历史数据加入所述动态数据池;
在确定循环进行时,将动态数据池中的全部数据作为下次建立群租识别模型时的房屋历史数据。
优选地,在本申请一种可实现的方式中,还包括:
将所述动态数据池中存储时间超过预设时间值的房屋历史数据剔除。
优选地,在本申请一种可实现的方式中,还包括:
对所述待识别房屋业务数据进行预处理,具体包括:
判断所述待识别房屋业务数据是否出现缺失值,若所述待识别房屋业务数据出现缺失值,获取所述待识别房屋同楼层的房屋业务数据平均值,采用所述平均值填补所述缺失值;
判断所述待识别房屋业务数据是否出现异常值,若所述待识别房屋业务数据出现异常值,获取所述待识别房屋同楼层的房屋业务数据平均值,采用所述平均值替换所述异常值。
优选地,在本申请一种可实现的方式中,所述获取待识别房屋业务数据,具体包括:周期性的获取待识别房屋业务数据;所述周期具体为日,或周,或月。
优选地,在本申请一种可实现的方式中,所述群租识别模型基于高斯朴素贝叶斯分类算法进行计算。
根据本申请实施例的第二方面,提供一种群租房识别系统,包括:
处理器和存储器;
所述处理器与存储器通过通信总线相连接:
其中,所述处理器,用于调用并执行所述存储器中存储的程序;
所述存储器,用于存储程序,所述程序至少用于执行以上任一项所述的群租房识别方法。
根据本申请实施例的第三方面,提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现如以上任一项所述的群租房识别方法。
本申请提供的技术方案可以包括以下有益效果:
本申请中的群租房识别方法,获取待识别房屋业务数据,可以具体到每户进行识别。获取的待识别房屋业务数据包括:房屋用水量数据,房屋用电量数据,房屋用气量数据和房屋建筑面积数据,在识别时还考虑了房屋建筑面积数据,识别准确率更高。本申请中,预先构建了群租识别模型,根据待识别房屋的业务数据,基于预先构建的群租识别模型,得到待识别房屋的类别数据,待识别房屋的类别数据包括:群租和非群租。根据待识别房屋业务数据,通过预先训练好的群租识别模型对待识别房屋的类别进行识别,相较于仅通过分析水电气使用数据的异常情况来识别房屋类别,准确率更高,不容易对水电气用量大户进行误识别。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是本申请一个实施例提供的一种群租房识别方法的流程示意图;
图2是本申请一个实施例提供的一种群租房识别方法中建立群租识别模型的流程示意图;
图3是本申请一个实施例提供的一种群租房识别方法中基于预先构建的群租识别模型得到待识别房屋的类别的流程示意图;
图4是本申请一个实施例提供的另一种群租房识别方法的流程示意图;
图5是本申请一个实施例提供的一种群租房识别系统的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
图1是本申请一个实施例提供的一种群租房识别方法的流程示意图,参照图1,一种群租房识别方法,包括:
S11:获取待识别房屋业务数据,待识别房屋业务数据包括:房屋用水量数据,房屋用电量数据,房屋用气量数据和房屋建筑面积数据;
物业管理部门一般都设置有专门的数据统计系统来统计住户的业务数据,业务数据包括:房屋用水量数据,房屋用电量数据,房屋用气量数据和房屋建筑面积数据。其中房屋用水量数据,房屋用电量数据,房屋用气量数据均可通过查表获取,房屋建筑面积数据在房屋建成时就已经具有备案。
S12:根据待识别房屋的业务数据,基于预先构建的群租识别模型,得到待识别房屋的类别数据,待识别房屋的类别数据包括:群租和非群租。
建立群租识别模型的流程参照图2:
S21:从预先建立的动态数据池中获取房屋历史数据作为样本数据,房屋历史数据包括:房屋历史类别数据,以及房屋历史类别数据对应的房屋历史业务数据;房屋历史业务数据包括:房屋历史用水量数据,房屋历史用电量数据,房屋历史用气量数据和房屋历史建筑面积数据;
房屋历史类别数据用yi表示,包括:y群租和y非群租,房屋历史业务数据用xi表示,包括:x,x,x,x面积
S22:计算群租房屋历史类别和非群租房屋历史类别的先验概率;
S23:计算房屋历史用水量数据,房屋历史用电量数据,房屋历史用气量数据和房屋历史建筑面积数据的先验概率;
S24:分别计算房屋历史用水量数据,房屋历史用电量数据,房屋历史用气量数据和房屋历史建筑面积数据在群租房屋历史类别条件下和非群租房屋历史类别条件下的条件概率;
基于高斯朴素贝叶斯分类算法进行计算,该算法假设属性xi服从高斯分布,能将x,x,x,x面积连续变量转换为离散变量,从而适用于高斯朴素贝叶斯分类算法。
高斯朴素贝叶斯分类算法,是依据每个类别出现的概率进行预测分类的一种分类算法。相比传统贝叶斯分类算法,其假设特征属性之间相互独立,为特征相互独立难以满足时的一种放松策略。
概率密度函数:
Figure BDA0002409595250000061
先验概率是指根据以往经验和分析得到的概率,如全概率公式,它往往作为“由因求果”问题中的“因”出现的概率。
在贝叶斯统计推断中,不确定数量的先验概率分布是在考虑一些因素之前表达对这一数量的置信程度的概率分布。
对房屋历史类别计算先验概率P(y群租)、P(y非群租);对房屋历史业务数据计算先验概率P(x)、P(x)、P(x)、P(x面积)。
对每种房屋历史业务数据计算条件概率:P(x|y非群租)、P(x|y非群租)、P(x|y非群租)、P(x面积|y非群租)、P(x|y群租)、P(x|y群租)、P(x|y群租)、P(x面积|y群租)。
S25:根据房屋历史类别数据的先验概率,房屋历史业务数据的先验概率,以及房屋历史业务数据在群租房屋历史类别条件下和非群租房屋历史类别条件下的条件概率,建立群租识别模型。
进一步的,参照图3:
S12:基于预先构建的群租识别模型,得到待识别房屋的类别,具体包括:
S121:根据待识别房屋的业务数据,房屋历史类别数据的先验概率,房屋历史业务数据的先验概率,以及房屋历史业务数据在群租房屋历史类别条件下和非群租房屋历史类别条件下的条件概率,计算待识别房屋的群租类别后验概率和非群租类别后验概率;
S122:在待识别房屋的群租类别后验概率大于非群租类别后验概率时,输出待识别房屋的类别为群租类别;
S123:在待识别房屋的非群租类别后验概率大于等于群租类别后验概率时,输出待识别房屋的类别为非群租类别。
后验概率是信息理论的基本概念之一,在一个通信系统中,在收到某个消息之后,接收端所了解到的该消息发送的概率称为后验概率。
后验概率是指在得到“结果”的信息后重新修正的概率,是“执果寻因”问题中的"果"。先验概率与后验概率有不可分割的联系,后验概率的计算要以先验概率为基础,后验概率可以根据通过贝叶斯公式,用先验概率和似然函数计算出来。
事情还没有发生,要求这件事情发生的可能性的大小,是先验概率。事情已经发生,要求这件事情发生的原因是由某个因素引起的可能性的大小,是后验概率。
房屋类别判断朴素贝叶斯公式:
Figure BDA0002409595250000081
带入先验概率、条件概率,计算P(y非群租|xxxx面积)、P(y群租|xxxx面积)。
当P(y群租|xxxx面积)>P(y非群租|xxxx面积)时,输出待识别房屋的类别为群租类别;
当P(y非群租|xxxx面积)≥P(y群租|xxxx面积)时,输出待识别房屋的类别为非群租类别。
一些实施例中的群租房识别方法,参照图4,还包括:
S31:验证待识别房屋的类别,得到待识别房屋的类别数据;
识别完毕后,物业管理部门的管理人员去核查该房屋是否群租房,核查完毕将待识别房屋的类别数据上传数据库,从数据库中调出待识别房屋的类别数据。
S32:将验证后的待识别房屋的类别数据和业务数据作为房屋历史数据加入动态数据池;
动态数据池数据量随时间增长,群租识别准确率越来越高。每当有新的待识别房屋被验证,该房屋的水电气历史使用数据自动汇入到动态训练池,训练池的数据量随着时间越来越大,群租模式涵盖地越来越全,模型识别也越来越准确。
S33:在确定循环进行时,将动态数据池中的全部数据作为下次建立群租识别模型时的房屋历史数据。
本实施例中,采用迭代过程不断优化群租识别模型,迭代是重复反馈过程的活动,其目的通常是为了逼近所需目标或结果。每一次对过程的重复称为一次“迭代”,而每一次迭代得到的结果会作为下一次迭代的初始值迭代是重复反馈过程的活动,其目的通常是为了逼近所需目标或结果。每一次对过程的重复称为一次“迭代”,而每一次迭代得到的结果会作为下一次迭代的初始值。在每次训练群租识别模型时,将上一次动态数据池中新增的数据也作为房屋历史数据,提高群租识别准确率。
一些实施例中的群租房识别方法,还包括:
将动态数据池中存储时间超过预设时间值的房屋历史数据剔除。
因为人们的生活状况,生活节奏是不断变化的,若使用很久之前的历史数据与新增的历史数据一起训练群租识别模型,会影响训练群租识别模型的准确率,群租识别模型也应该与时俱进,所以将动态数据池中新增的房屋历史数据保留预设时间值,将存储时间超过预设时间值的房屋历史数据剔除。
预设时间值可以为三年。
一些实施例中的群租房识别方法,还包括:
对待识别房屋业务数据进行预处理,具体包括:
判断待识别房屋业务数据是否出现缺失值,若待识别房屋业务数据出现缺失值,获取待识别房屋同楼层的房屋业务数据平均值,采用平均值填补缺失值;
判断待识别房屋业务数据是否出现异常值,若待识别房屋业务数据出现异常值,获取待识别房屋同楼层的房屋业务数据平均值,采用平均值替换异常值。
获取的待识别房屋业务数据可能会出现缺失值和异常值,所以在获取待识别房屋业务数据后,需要对待识别房屋业务数据进行预处理。
判断待识别房屋业务数据是否出现缺失值,缺失值是指待识别房屋业务数据可能丢失房屋用水量数据,房屋用电量数据,房屋用气量数据和房屋建筑面积数据中的一项,若待识别房屋业务数据出现缺失值,则获取待识别房屋同楼层的房屋业务数据,取待识别房屋同楼层全部房屋业务数据的平均值,采用平均值填补缺失值,在一定程度上不影响群租识别模型的准确率。
判断待识别房屋业务数据是否出现异常值,异常值是指待识别房屋业务数据中房屋用水量数据,房屋用电量数据,房屋用气量数据可能会出现异常,比如偏大或者偏小,若待识别房屋业务数据出现异常值,获取待识别房屋同楼层的房屋业务数据平均值,取待识别房屋同楼层全部房屋业务数据的平均值,采用平均值替换异常值,在一定程度上不影响群租识别模型的准确率。
一些实施例中的群租房识别方法,获取待识别房屋业务数据,具体包括:周期性的获取待识别房屋业务数据;周期具体为日,或周,或月。
本实施例中,支持待识别房屋业务数据周期性接入,具体看物理管理部门的选择。若周期为年则过长,所以周期具体为日,或周,或月。
图5是本申请一个实施例提供的一种群租房识别系统的结构示意图,参照图5,一种群租房识别系统,包括:
处理器41和存储器42;
处理器41与存储器42通过通信总线相连接:
其中,处理器41,用于调用并执行存储器42中存储的程序;
存储器42,用于存储程序,程序至少用于执行以上任一实施例中的群租房识别方法。
一种存储介质,存储有计算机程序,计算机程序被处理器执行时,实现如以上任一实施例中的群租房识别方法。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种群租房识别方法,其特征在于,包括:
获取待识别房屋业务数据,所述待识别房屋业务数据包括:房屋用水量数据,房屋用电量数据,房屋用气量数据和房屋建筑面积数据;
根据所述待识别房屋的业务数据,基于预先构建的群租识别模型,得到待识别房屋的类别数据,所述待识别房屋的类别数据包括:群租和非群租。
2.根据权利要求1所述的方法,其特征在于,还包括:
从预先建立的动态数据池中获取房屋历史数据作为样本数据,所述房屋历史数据包括:房屋历史类别数据,以及所述房屋历史类别数据对应的房屋历史业务数据;所述房屋历史业务数据包括:房屋历史用水量数据,房屋历史用电量数据,房屋历史用气量数据和房屋历史建筑面积数据;
计算群租房屋历史类别和非群租房屋历史类别的先验概率;
计算所述房屋历史用水量数据,房屋历史用电量数据,房屋历史用气量数据和房屋历史建筑面积数据的先验概率;
分别计算所述房屋历史用水量数据,房屋历史用电量数据,房屋历史用气量数据和房屋历史建筑面积数据在群租房屋历史类别条件下和非群租房屋历史类别条件下的条件概率;
根据房屋历史类别数据的先验概率,房屋历史业务数据的先验概率,以及房屋历史业务数据在群租房屋历史类别条件下和非群租房屋历史类别条件下的条件概率,建立群租识别模型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述待识别房屋的业务数据,基于预先构建的群租识别模型,得到待识别房屋的类别,具体包括:
根据所述待识别房屋的业务数据,所述房屋历史类别数据的先验概率,房屋历史业务数据的先验概率,以及房屋历史业务数据在群租房屋历史类别条件下和非群租房屋历史类别条件下的条件概率,计算所述待识别房屋的群租类别后验概率和非群租类别后验概率;
在所述待识别房屋的群租类别后验概率大于非群租类别后验概率时,输出所述待识别房屋的类别为群租类别;
在所述待识别房屋的非群租类别后验概率大于等于群租类别后验概率时,输出所述待识别房屋的类别为非群租类别。
4.根据权利要求2所述的方法,其特征在于,还包括:
验证所述待识别房屋的类别,得到所述待识别房屋的类别数据;
将验证后的所述待识别房屋的类别数据和业务数据作为房屋历史数据加入所述动态数据池;
在确定循环进行时,将动态数据池中的全部数据作为下次建立群租识别模型时的房屋历史数据。
5.根据权利要求4所述的方法,其特征在于,还包括:
将所述动态数据池中存储时间超过预设时间值的房屋历史数据剔除。
6.根据权利要求1所述的方法,其特征在于,还包括:
对所述待识别房屋业务数据进行预处理,具体包括:
判断所述待识别房屋业务数据是否出现缺失值,若所述待识别房屋业务数据出现缺失值,获取所述待识别房屋同楼层的房屋业务数据平均值,采用所述平均值填补所述缺失值;
判断所述待识别房屋业务数据是否出现异常值,若所述待识别房屋业务数据出现异常值,获取所述待识别房屋同楼层的房屋业务数据平均值,采用所述平均值替换所述异常值。
7.根据权利要求1所述的方法,其特征在于,所述获取待识别房屋业务数据,具体包括:周期性的获取待识别房屋业务数据;所述周期具体为日,或周,或月。
8.根据权利要求3所述的方法,其特征在于,所述群租识别模型基于高斯朴素贝叶斯分类算法进行计算。
9.一种群租房识别系统,其特征在于,包括:
处理器和存储器;
所述处理器与存储器通过通信总线相连接:
其中,所述处理器,用于调用并执行所述存储器中存储的程序;
所述存储器,用于存储程序,所述程序至少用于执行权利要求1-8任一项所述的群租房识别方法。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1-8任一项所述的群租房识别方法。
CN202010172254.7A 2020-03-12 2020-03-12 群租房识别方法及系统及存储介质 Active CN111401431B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010172254.7A CN111401431B (zh) 2020-03-12 2020-03-12 群租房识别方法及系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010172254.7A CN111401431B (zh) 2020-03-12 2020-03-12 群租房识别方法及系统及存储介质

Publications (2)

Publication Number Publication Date
CN111401431A true CN111401431A (zh) 2020-07-10
CN111401431B CN111401431B (zh) 2023-07-25

Family

ID=71432353

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010172254.7A Active CN111401431B (zh) 2020-03-12 2020-03-12 群租房识别方法及系统及存储介质

Country Status (1)

Country Link
CN (1) CN111401431B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112084240A (zh) * 2020-09-15 2020-12-15 浙江新再灵科技股份有限公司 一种群租房智能识别、联动治理方法及系统
CN112330476A (zh) * 2020-11-27 2021-02-05 中国人寿保险股份有限公司 一种团单保险业务预测方法及装置
CN112364263A (zh) * 2020-11-11 2021-02-12 深圳力维智联技术有限公司 基于多维度数据的群租房识别方法、装置、设备及介质
CN112381610A (zh) * 2020-11-16 2021-02-19 国网上海市电力公司 一种群租风险指数的预测方法及计算机设备
CN112396813A (zh) * 2020-10-30 2021-02-23 四川天翼网络服务有限公司 一种水表数据分析预警系统
CN112509277A (zh) * 2020-11-13 2021-03-16 北京软通智慧城市科技有限公司 一种出租房监测方法、装置、设备及存储介质
CN112988837A (zh) * 2021-03-12 2021-06-18 深圳力维智联技术有限公司 群租房识别方法、装置及设备
CN113688870A (zh) * 2021-07-22 2021-11-23 国网江苏省电力有限公司营销服务中心 一种采用混合算法的基于用户用电行为的群租房识别方法

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005029242A2 (en) * 2000-06-16 2005-03-31 Bodymedia, Inc. System for monitoring and managing body weight and other physiological conditions including iterative and personalized planning, intervention and reporting capability
WO2011002735A1 (en) * 2009-07-01 2011-01-06 Carnegie Mellon University Methods and apparatuses for monitoring energy consumption and related operations
CN104123477A (zh) * 2014-08-15 2014-10-29 上海博路信息技术有限公司 一种基于生活数据的群租分析方法
US20160275375A1 (en) * 2015-03-20 2016-09-22 Netra, Inc. Object detection and classification
CN107578277A (zh) * 2017-08-24 2018-01-12 国网浙江省电力公司电力科学研究院 用于电力营销的出租房客户定位方法
CN108170909A (zh) * 2017-12-13 2018-06-15 中国平安财产保险股份有限公司 一种智能建模的模型输出方法、设备及存储介质
CN108287327A (zh) * 2017-12-13 2018-07-17 广西电网有限责任公司电力科学研究院 基于贝叶斯分类的计量自动化终端故障诊断方法
CN108305363A (zh) * 2018-01-31 2018-07-20 上海与德通讯技术有限公司 群租房的监控方法及智能终端
CN108596227A (zh) * 2018-04-12 2018-09-28 广东电网有限责任公司 一种用户用电行为主导影响因素挖掘方法
CN109034969A (zh) * 2018-07-19 2018-12-18 上海小蚁科技有限公司 公租房的监控方法及装置、存储介质、计算设备
CN109214648A (zh) * 2018-07-27 2019-01-15 中国联合网络通信集团有限公司 新能源交易方法、装置、设备及存储介质
CN109284988A (zh) * 2018-12-24 2019-01-29 上海市浦东新区城市运行综合管理中心 数据分析系统及方法
CN109902140A (zh) * 2019-03-14 2019-06-18 成都小步创想慧联科技有限公司 事件智能分析方法、装置和用户设备
CN110096793A (zh) * 2019-04-28 2019-08-06 山东建筑大学 一种基于居住用户活动模式的住宅能耗预测方法
CN110413601A (zh) * 2019-07-04 2019-11-05 东南大学 一种基于高斯朴素贝叶斯分类器和预报误差法相结合的发电机组辨识数据筛选方法
CN110675206A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 群租发现方法、装置、设备及计算机可读介质
CN110728537A (zh) * 2019-09-24 2020-01-24 国网河北省电力有限公司信息通信分公司 一种基于电力用户行为标签的预测缴费方法
WO2020019403A1 (zh) * 2018-07-26 2020-01-30 平安科技(深圳)有限公司 用电量异常检测方法、装置、设备及可读存储介质

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005029242A2 (en) * 2000-06-16 2005-03-31 Bodymedia, Inc. System for monitoring and managing body weight and other physiological conditions including iterative and personalized planning, intervention and reporting capability
WO2011002735A1 (en) * 2009-07-01 2011-01-06 Carnegie Mellon University Methods and apparatuses for monitoring energy consumption and related operations
CN104123477A (zh) * 2014-08-15 2014-10-29 上海博路信息技术有限公司 一种基于生活数据的群租分析方法
US20160275375A1 (en) * 2015-03-20 2016-09-22 Netra, Inc. Object detection and classification
CN107578277A (zh) * 2017-08-24 2018-01-12 国网浙江省电力公司电力科学研究院 用于电力营销的出租房客户定位方法
CN108170909A (zh) * 2017-12-13 2018-06-15 中国平安财产保险股份有限公司 一种智能建模的模型输出方法、设备及存储介质
CN108287327A (zh) * 2017-12-13 2018-07-17 广西电网有限责任公司电力科学研究院 基于贝叶斯分类的计量自动化终端故障诊断方法
CN108305363A (zh) * 2018-01-31 2018-07-20 上海与德通讯技术有限公司 群租房的监控方法及智能终端
CN108596227A (zh) * 2018-04-12 2018-09-28 广东电网有限责任公司 一种用户用电行为主导影响因素挖掘方法
CN110675206A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 群租发现方法、装置、设备及计算机可读介质
CN109034969A (zh) * 2018-07-19 2018-12-18 上海小蚁科技有限公司 公租房的监控方法及装置、存储介质、计算设备
WO2020019403A1 (zh) * 2018-07-26 2020-01-30 平安科技(深圳)有限公司 用电量异常检测方法、装置、设备及可读存储介质
CN109214648A (zh) * 2018-07-27 2019-01-15 中国联合网络通信集团有限公司 新能源交易方法、装置、设备及存储介质
CN109284988A (zh) * 2018-12-24 2019-01-29 上海市浦东新区城市运行综合管理中心 数据分析系统及方法
CN109902140A (zh) * 2019-03-14 2019-06-18 成都小步创想慧联科技有限公司 事件智能分析方法、装置和用户设备
CN110096793A (zh) * 2019-04-28 2019-08-06 山东建筑大学 一种基于居住用户活动模式的住宅能耗预测方法
CN110413601A (zh) * 2019-07-04 2019-11-05 东南大学 一种基于高斯朴素贝叶斯分类器和预报误差法相结合的发电机组辨识数据筛选方法
CN110728537A (zh) * 2019-09-24 2020-01-24 国网河北省电力有限公司信息通信分公司 一种基于电力用户行为标签的预测缴费方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蒋林秀: "基于机器学习的群租房精准治理研究", 公共管理与政策评论, no. 2, pages 85 - 96 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112084240A (zh) * 2020-09-15 2020-12-15 浙江新再灵科技股份有限公司 一种群租房智能识别、联动治理方法及系统
CN112084240B (zh) * 2020-09-15 2023-11-10 浙江新再灵科技股份有限公司 一种群租房智能识别、联动治理方法及系统
CN112396813A (zh) * 2020-10-30 2021-02-23 四川天翼网络服务有限公司 一种水表数据分析预警系统
CN112364263A (zh) * 2020-11-11 2021-02-12 深圳力维智联技术有限公司 基于多维度数据的群租房识别方法、装置、设备及介质
CN112509277A (zh) * 2020-11-13 2021-03-16 北京软通智慧城市科技有限公司 一种出租房监测方法、装置、设备及存储介质
CN112381610A (zh) * 2020-11-16 2021-02-19 国网上海市电力公司 一种群租风险指数的预测方法及计算机设备
CN112330476A (zh) * 2020-11-27 2021-02-05 中国人寿保险股份有限公司 一种团单保险业务预测方法及装置
CN112988837A (zh) * 2021-03-12 2021-06-18 深圳力维智联技术有限公司 群租房识别方法、装置及设备
CN113688870A (zh) * 2021-07-22 2021-11-23 国网江苏省电力有限公司营销服务中心 一种采用混合算法的基于用户用电行为的群租房识别方法
CN113688870B (zh) * 2021-07-22 2023-09-26 国网江苏省电力有限公司营销服务中心 一种采用混合算法的基于用户用电行为的群租房识别方法

Also Published As

Publication number Publication date
CN111401431B (zh) 2023-07-25

Similar Documents

Publication Publication Date Title
CN111401431B (zh) 群租房识别方法及系统及存储介质
Wilson et al. Analyzing variability and the rate of decline of migratory shorebirds in Moreton Bay, Australia
CN106952159B (zh) 一种不动产抵押品风险控制方法、系统及存储介质
CN111176953B (zh) 一种异常检测及其模型训练方法、计算机设备和存储介质
CN110910004A (zh) 一种多重不确定性的水库调度规则提取方法及系统
CN112381610A (zh) 一种群租风险指数的预测方法及计算机设备
CN109684320B (zh) 监测数据在线清洗的方法和设备
CN108416630A (zh) 一种目标受众的确定方法及装置
CN109116299A (zh) 一种指纹定位方法、终端、计算机可读存储介质
CN115660262B (zh) 一种基于数据库应用的工程智慧质检方法、系统及介质
CN111160472B (zh) 对象的目标特征的预测方法、装置、存储介质与电子设备
CN111861120B (zh) 企业关联图谱的构建方法、装置、设备及计算机可读介质
CN113283824A (zh) 智慧园区数据综合管理方法及系统
CN116794510A (zh) 故障预测方法、装置、计算机设备和存储介质
CN110807546A (zh) 社区网格人口变化预警方法及系统
CN112035570A (zh) 一种商户的评价方法及系统
CN112052346A (zh) 实有人员库的更新方法、装置、电子设备及存储介质
Alamsyah et al. Monte Carlo simulation and clustering for customer segmentation in business organization
CN116307879A (zh) 一种斑节对虾虾苗高效培育方法、系统及介质
CN111768031B (zh) 一种基于arma算法预测人群聚集趋势的方法
CN114330136A (zh) 基于水表用水生活状态监测方法、系统、装置及存储介质
CN113935788A (zh) 模型评估方法、装置、设备及计算机可读存储介质
CN111882429B (zh) 一种银行系统字段长度分段方法和装置
CN117557415A (zh) 一种基于智慧物业的社区资源管理方法及系统
CN115936749A (zh) 活动信息推送方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant