CN112084240A - 一种群租房智能识别、联动治理方法及系统 - Google Patents
一种群租房智能识别、联动治理方法及系统 Download PDFInfo
- Publication number
- CN112084240A CN112084240A CN202010968689.2A CN202010968689A CN112084240A CN 112084240 A CN112084240 A CN 112084240A CN 202010968689 A CN202010968689 A CN 202010968689A CN 112084240 A CN112084240 A CN 112084240A
- Authority
- CN
- China
- Prior art keywords
- group
- deep learning
- network model
- data
- learning network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000013135 deep learning Methods 0.000 claims abstract description 70
- 210000004556 brain Anatomy 0.000 claims abstract description 58
- 238000012544 monitoring process Methods 0.000 claims abstract description 37
- 238000012549 training Methods 0.000 claims abstract description 27
- 238000012545 processing Methods 0.000 claims abstract description 24
- 238000005516 engineering process Methods 0.000 claims description 12
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000012790 confirmation Methods 0.000 claims description 8
- 230000009193 crawling Effects 0.000 claims description 7
- 238000010219 correlation analysis Methods 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000013136 deep learning model Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000007619 statistical method Methods 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 claims description 3
- 230000006855 networking Effects 0.000 claims description 2
- 238000011161 development Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000007667 floating Methods 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000003915 air pollution Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/259—Fusion by voting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Fuzzy Systems (AREA)
- Educational Administration (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Quality & Reliability (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种群租房智能识别、联动治理方法及系统,其中,识别方法,包括:S1.基于电梯系统和城市大脑平台获取布置电梯系统的区域的多维异构数据;S2.对多维异构数据进行处理并提取因素特征,并基于深度学习网络模型进行在线监测推断,并判断是否存在群租房,若是,则执行S3;S3.将多维异构数据发布至城市大脑平台,对区域是否存在群租房作进一步确认,若存在,则将该真实群租房案例添加至用于离线训练网络模型的群租房标签样本库,否则执行S4;S4.城市大脑平台对多维异构数据进行分析,获取导致网络模型出现误报的影响因素特征,并将影响因素特征反馈至S2对因素特征进行特征加强。本发明在不依赖于房屋用户的隐私数据情况下,达到群租房的识别。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种群租房智能识别、联动治理方法及系统。
背景技术
随着城市化的政策进一步加强贯彻,大量人口涌入城市,给城市带来有效的生产力,成为了城市开发建设和经济社会发展的生力军。但同时,也出现了一系列的“城市病”,如空气污染、交通拥堵、住房紧张等,这对政府的城市化科学精准治理提出了更高的要求。而这其中,群租房是“城市病”的典型难题代表,表现出的问题主要为:1、消防安全隐患较大;2、治安违法案件高发;3、政府被动排查为主。而现有技术中,缺乏有效识别群租房的方案。
发明内容
本发明的目的在于提供一种群租房智能识别、联动治理方法及系统,解决难以有效识别群租房的问题。
为实现上述发明目的,本发明提供一种群租房智能识别方法,包括:
S1.基于电梯系统和城市大脑平台获取布置所述电梯系统的区域的多维异构数据;
S2.对所述多维异构数据进行处理并提取因素特征,并基于深度学习网络模型对提取的所述因素特征进行在线监测推断,并基于推断结果判断所述区域是否存在群租房,若是,则执行步骤S3;
S3.将所述多维异构数据发布至所述城市大脑平台,所述城市大脑平台对所述区域是否存在群租房作进一步确认,若确认存在,则将该真实群租房案例添加至用于离线训练所述深度学习网络模型的群租房标签样本库,若确认不存在,则执行步骤S4;
S4.所述城市大脑平台对所述多维异构数据进行分析,获取导致所述深度学习网络模型出现误报的影响因素特征,并将所述影响因素特征反馈至步骤S2对提取的所述因素特征进行特征加强。
根据本发明的一个方面,所述多维异构数据包括:基于所述电梯系统获取的电梯基础信息、物联网信息、房屋信息,以及基于所述城市大脑平台获取的处置信息。
根据本发明的一个方面,步骤S2中,对所述多维异构数据进行处理的步骤中,对所述多维异构数据进行异常噪音数据和缺失数据进行处理,其中,包括:
S21.通过采用箱型图和/或可视化的方式进行异常噪音数据识别和缺失数据识别,
S22.利用统计分析方法进行处理,其中,对于极端异常的数据和缺失率超过一定阈值的记录进行剔除,否则进行替换和填补。
根据本发明的一个方面,步骤S2中,基于深度学习网络模型对提取的所述因素特征进行在线监测推断的步骤中,采用异常检测的方式进行群租房识别。
根据本发明的一个方面,步骤S2中,基于深度学习网络模型对提取的所述因素特征进行在线监测推断的步骤中包括:
S01.利用大数据爬虫技术对网络新闻舆情里涉及到的群租房信息以及公开数据集进行爬取,并将爬取结果作为标签样本库信息添加至群租房标签样本库;
S02.对所述群租房标签样本库中存储的标签样本库信息与基于所述多维异构数据提取的所述因素特征进行相关性分析,基于分析结果获取影响群租房的关键因素特征;
S03.选取用于离线训练的所述深度学习网络模型;
S04.在所述深度学习网络模型的基础上融合专家模型,用于对所述关键因素特征进行加权;
S05.判断所述深度学习网络模型的训练结果是否满足预设条件,若满足,则将所述深度学习网络模型在线上发布并用于对所述因素特征进行在线监测推断。
根据本发明的一个方面,步骤S03中,选取用于离线训练的所述深度学习网络模型的步骤中,包括:
S031.获取关于群租房的目标表达式,其表示为:
Scorerisk=f(X)
其中,Scorerisk表示算法输出,即疑似群租房的风险得分;X表示算法输入,即用于基于所述因素特征计算风险得分的多维矩阵向量;f(·)表示映射算法模型;
S032.基于所述目标表达式确定所述深度学习网络模型,其中,所述深度学习网络模型确定为黑箱深度学习模型,其表示为:
ScoreDeeprisk=f(X)。
根据本发明的一个方面,步骤S04中,所述专家模型为加权算法类模型,其表示为:
ScoreExpertrisk=∑wixi
其中,ScoreExpertrisk表示专家模型计算出的风险得分,wi表示权重,xi表示风险因子。
根据本发明的一个方面,步骤S4中,在所述深度学习网络模型的基础上融合专家模型后的模型表示为:
Scorerisk=g(ScoreDeeprisk,ScoreExpertrisk)
其中,g(·)是max()、min()、逻辑且、逻辑或,以及加权投票形式中的一种。
为实现上述发明目的,本发明提供一种采用前述的群租房智能识别方法的联动治理方法,包括:
S001.获取所述城市大脑平台在布置所述电梯系统的区域所确认存在的群租房的群租房信息;
S002.所述城市大脑平台将所述群租房信息推送至相关治理部门,协助相关治理部门进行群租房治理。
为实现上述发明目的,本发明提供一种用于前述的群租房智能识别方法的群租房智能识别系统,包括:
数据采集模块,基于电梯系统和城市大脑平台获取布置所述电梯系统的区域的多维异构数据;
数据预处理模块,对所述多维异构数据进行处理;
因素特征提取模块,对处理后的所述多维异构数据进行因素特征提取;
线上监测识别模块,基于深度学习网络模型对提取的所述因素特征进行在线监测推断,并基于推断结果判断所述区域是否存在群租房,若存在,则将所述多维异构数据发布至所述城市大脑平台。
根据本发明的一个方面,还包括:
群租房案例获取模块,利用大数据爬虫技术对网络新闻舆情里涉及到的群租房信息以及公开数据集进行爬取,并将爬取结果作为标签样本库信息添加至群租房标签样本库;
线下模型训练模块,用于获取所述深度学习网络模型,并将训练完成的所述深度学习网络模型发布至所述线上监测识别模块。
为实现上述发明目的,本发明提供一种用于前述的联动治理方法的联动治理系统,包括:
数据采集模块,基于电梯系统和城市大脑平台获取布置所述电梯系统的区域的多维异构数据;
数据预处理模块,对所述多维异构数据进行处理;
因素特征提取模块,对处理后的所述多维异构数据进行因素特征提取;
线上监测识别模块,基于深度学习网络模型对提取的所述因素特征进行在线监测推断,并基于推断结果判断所述区域是否存在群租房,若存在,则将所述多维异构数据发布至所述城市大脑平台;
联动治理模块,获取城市大脑平台的确认结果,基于所述确认结果获取所述群租房的群租房信息,并将所述群租房信息发布至所述城市大脑平台,通过所述城市大脑平台将所述群租房信息推送至相关治理部门,协助相关治理部门进行群租房治理。
根据本发明的一个方面,还包括:
群租房案例获取模块,利用大数据爬虫技术对网络新闻舆情里涉及到的群租房信息以及公开数据集进行爬取,并将爬取结果作为标签样本库信息添加至群租房标签样本库;
线下模型训练模块,用于获取所述深度学习网络模型,并将训练完成的所述深度学习网络模型发布至所述线上监测识别模块。
根据本发明的一种方案,在不依赖于房屋用户的隐私数据情况下,采用智能算法达到群租房的识别,且联动城市大脑,实现联动治理,达到科学监管治理的目的。
根据本发明的一种方案,从电梯场景出发,不依赖于房屋用户私人数据,而是结合用户日常乘梯行为数据、公开数据集以及融合城市大脑等相关数据,且利用异常检测等智能算法,实现群租房的精准识别,并集成到电梯系统,做到“创新驱动”、“统筹发展”,打造社会治理的“智慧大脑”,丰富加强“城市大脑”智慧化建设,统筹整合资源进行有效地科学治理。
根据本发明的一种方案,本发明的方案不依赖于房屋用户私人数据,利用大数据挖掘技术,结合深度学习和专家模型精准识别群租房,为政府治理解决“城市病”提供了新的模式。且通过分析发现,群租房所在楼层出行人流高、出行时间早出等明显特点,以及群租房的分布与地区经济发展、交通区域分布、流动人口分布等存在极大相关性,这些分析发现构成了政府精细化治理的必要技术支持。
根据本发明的一种方案,依托城市大脑平台,联合相关单位部门进行联合治理,有效排除并治理群租房,提高城市的智慧化运转。
附图说明
图1是示意性表示根据本发明的一种实施方式的群租房智能识别方法的步骤框图;
图2是示意性表示根据本发明的一种实施方式的群租房智能识别方法的流程图;
图3是示意性表示根据本发明的一种实施方式的深度学习网络模型的结构图。
具体实施方式
为了更清楚地说明本发明实施方式或现有技术中的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
在针对本发明的实施方式进行描述时,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”所表达的方位或位置关系是基于相关附图所示的方位或位置关系,其仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此上述术语不能理解为对本发明的限制。
下面结合附图和具体实施方式对本发明作详细地描述,实施方式不能在此一一赘述,但本发明的实施方式并不因此限定于以下实施方式。
本发明的方案首先利用爬虫技术爬取新闻舆情信息里面的已有群租房信息或者公开数据集,再根据这些标签样本信息,基于智能算法,进行深度分析挖掘群租房模式特征,对学习到特征模型保存到模型库。继而将模型发布线上,实时在线监测疑是群租房,并发布到城市大脑平台,进行联动治理确认,对于告警确认的,则将案例群租房添加到已有标签样本库,对于告警误报的,则进一步分析,并扩充加强已有的因素特征,以实现“智慧大脑”的有效管理闭环工作,加强城市大脑平台的智能化管理。
结合图1和图2所示,根据本发明的一种实施方式,本发明的一种群租房智能识别方法,包括:
S1.基于电梯系统和城市大脑平台获取布置电梯系统的区域的多维异构数据;
S2.对多维异构数据进行处理并提取因素特征,并基于深度学习网络模型对提取的因素特征进行在线监测推断,并基于推断结果判断区域是否存在群租房,若是,则执行步骤S3;
S3.将多维异构数据发布至城市大脑平台,城市大脑平台对区域是否存在群租房作进一步确认,若确认存在,则该真实群租房案例添加至用于离线训练深度学习网络模型的群租房标签样本库,若确认不存在,则执行步骤S4;
S4.城市大脑平台对多维异构数据进行分析,获取导致深度学习网络模型出现误报的影响因素特征,并将影响因素特征反馈至步骤S2对提取的因素特征进行特征加强。
结合图1和图2所示,根据本发明的一种实施方式,步骤S1中,基于电梯系统和城市大脑平台获取布置电梯系统的区域的多维异构数据的步骤中,通过对处于在线状态的电梯系统进行数据收集,以及基于城市大脑平台获取与该电梯系统相对应的其它数据信息。在本实施方式中,多维异构数据包括:基于电梯系统获取的电梯基础信息、物联网信息、房屋信息,以及基于所述城市大脑平台获取的处置信息。为进一步对多维异构数据详细说明,对多维异构数据进行列表说明,如下表1:
表1
结合图1和图2所示,根据本发明的一种实施方式,步骤S2中,对多维异构数据进行处理的步骤中,对多维异构数据进行异常噪音数据和缺失数据进行处理,其中,包括:
S21.通过采用箱型图和/或可视化的方式进行异常噪音数据识别和缺失数据识别;
S22.利用统计分析方法进行处理,其中,对于极端异常(如超过95%或低于5%分位数的数据)的数据和缺失率超过一定阈值的记录进行剔除,否则进行替换和填补。在本实施方式中,替换和填补的方法利用前后值、均值、邻居值等方式进行处理。
结合图1和图2所示,根据本发明的一种实施方式,步骤S2中,对多维异构数据进行处理并提取因素特征的步骤中,通过对多维异构数据进行因素特征提取的结果是决定在线监测推断结果准确性高第的关键步骤。在本实施方式中,主要提取的因素特征包括:
电梯系统的出行信息
1.电梯系统各楼层出行的人流数,并根据分箱映射为低、中、高、极高;
2.电梯系统各楼层出行的人数,并根据分箱映射为低、中、高、极高;
3.电梯系统各楼层出行人的年龄分布统计信息,并根据分箱映射为婴儿、儿童、少年、青年、中年、老年;
4.电梯系统各楼层出行人的性别分布统计信息;
5.电梯系统各楼层出行人的穿着属性分布统计信息,并映射为低端、中端、高端;
6.电梯系统各楼层出行人的不文明行为分布统计信息,并映射为极不文明、不文明、文明;
7.电梯系统各楼层出行的时间统计信息,并映射为早出、晚出、早归、晚归、节假日较不出行、节假日较出行。
电梯系统所在区域的房屋信息
1.一梯户数;
2.房屋所在区域历史“群租房”舆情次数;
3.小区所在区域房源供给数量;
4.是否出租房;
5.是否安置房;
6.出租率;
7.出租价格;
8.所在区域是否是流动人口、暂住人口较多区域;
9.小区所在区域房源供给数量;
10.小区周边1公里(该范围是可设置的)是否有核心配套设施(包括医院、地铁、公交、学校、企业等);
11.小区周边1公里(该范围是可设置的)的核心配套设施类型。
其他信息
1.历史治理统计信息(包括消防出行量、历史处置量)。
结合图1和图2所示,根据本发明的一种实施方式,步骤S2中,基于深度学习网络模型对提取的因素特征进行在线监测推断的步骤中,采用异常检测的方式进行群租房识别。在本实施方式中,根据同线下一致的处理逻辑,得到线上待检测识别的输入,然后调用线上模型,从而输出是否群租房。
结合图1和图2所示,根据本发明的一种实施方式,步骤S2中,基于深度学习网络模型对提取的因素特征进行在线监测推断的步骤中包括:
S01.利用大数据爬虫技术对网络新闻舆情里涉及到的群租房信息以及公开数据集进行爬取(包括群租房所在地理小区信息等),并将爬取结果作为标签样本库信息添加至群租房标签样本库;在本实施方式中,通过对上述标签样本库信息与电梯系统相关的信息进行匹配,以期得到群租房目标信息。
S02.对群租房标签样本库中存储的标签样本库信息与基于多维异构数据提取的因素特征进行相关性分析,基于分析结果获取影响群租房的关键因素特征;在本实施方式中,在进行深度学习网络模型训练前,首先利用匹配好的群租房标签样本信息和提取的因素特征进行相关性分析,以期从中找出影响群租房的关键因素。主要方法包括但不限于卡方检验、因子分析、关联分析等。
S03.选取用于离线训练的所述深度学习网络模型;
S04.在深度学习网络模型的基础上融合专家模型,用于对关键因素特征进行加权;
S05.判断深度学习网络模型的训练结果是否满足预设条件,若满足,则将深度学习网络模型在线上发布并用于对步骤S2中提取的因素特征进行在线监测推断。
结合图1和图2所示,根据本发明的一种实施方式,步骤S03中,选取用于离线训练的所述深度学习网络模型的步骤中,目标是分析得到某楼层疑是“群租房”的风险得分,对于得分满足条件的进行告警,包括:
S031.获取关于群租房的目标表达式,其表示为:
Scorerisk=f(X)
其中,Scorerisk表示算法输出,即疑似群租房的风险得分;X表示算法输入,即用于基于所述因素特征计算风险得分的多维矩阵向量;f(·)表示映射算法模型;
S032.基于目标表达式确定深度学习网络模型,在本实施方式中,由于获取的多维异构数据中只有表征是群租房的异常样本信息,且没有表明哪些是非群租房信息。因此,在本实施方式中,采用异常检测的方式进行群租房识别。在本实施方式中,采用的是异常检测的神经网络模型Autoencoder,根据输入的多维异构数据的重构误差作为是否推出群租房的判断标准。需要指出的是,神经网络模型Autoencoder中文称作自编码器,是一种无监督式学习模型,具体结构如图3所示。本质该模型使用了一个神经网络来产生一个高维输入的低维表示。Autoencoder包含两个主要的部分,encoder(编码器)和decoder(解码器)。Encoder的作用是用来发现给定数据的压缩表示,decoder是用来重建原始输入。在训练时,decoder强迫autoencoder选择最有信息量的特征,最终保存在压缩表示中,最终压缩后的表示就在中间的coder层当中,是个黑箱模型,但随着数据量的增多,准确性会显著增高。
因此,在本实施方式中,所采用的深度学习网络模型确定为黑箱深度学习模型,其表示为:
ScoreDeeprisk=f(X)。
结合图1和图2所示,根据本发明的一种实施方式,步骤S04中,在深度学习网络模型的基础上融合专家模型,对前述的相关性分析出重要影响特征进行加权,致使触发“群租房”告警。例如,群租房所处楼层的出行人数一般较正常楼层要多,并且出行人员的年龄分布也比较特色,另外群租房所在地理位置、所处房屋类型也有一定特点。因此可根据这些重要特征,基于专家经验,设计专家模型,对“群租房”事件进行告警。在本实施方式中,该专家模型采用加权算法类模型,其表示为:
ScoreExpertrisk=∑wixi
其中,ScoreExpertrisk表示专家模型计算出的风险得分,wi表示权重,xi表示风险因子。
结合图1和图2所示,根据本发明的一种实施方式,步骤S4中,深度学习网络模型融合专家模型的算法,有效兼具了准确性和可解释性,做到了二者模型的扬长避短有效结合,能够实现更好的预警效果。进而在深度学习网络模型的基础上融合专家模型后的模型表示为:
Scorerisk=g(ScoreDeeprisk,ScoreExpertrisk)
其中,g(·)是max()、min()、逻辑且、逻辑或,以及加权投票形式中的一种,即对来自深度学习模型计算出的风险得分risk1(ScoreDeeprisk)和专家模型计算出的风险得分risk2(ScoreExpertrisk),做出最终决策得分。决策逻辑包括,取二者的最大值(max())、最小值(min())、两个都满足阈值条件(逻辑且)、其中一个满足阈值条件(逻辑或),取其中之一即可。
结合图1和图2所示,在本实施方式中,在完成最终模型的生成后,判断深度学习网络模型的训练结果是否满足预设条件,若满足,则将上述训练好的深度学习网络模型保存到模型库中,并在线上发布用于对步骤S2提取的因素特征进行在线监测推断,
结合图1和图2所示,根据本发明的一种实施方式,当步骤S2中在线监测推断结果为存在群租房,则执行步骤S3,在步骤S3中,城市大脑平台接收用于在线监测推断过程中的多维异构数据,并对该多维异构数据作进一步确认判断。若确认存在,则将该真实群租房案例(可包含有步骤S2中提取到的因素特征)添加至用于离线训练深度学习网络模型的群租房标签样本库,若确认不存在,则执行步骤S4。
结合图1和图2所示,根据本发明的一种实施方式,步骤S4中,城市大脑平台对多维异构数据进行分析,获取导致深度学习网络模型出现误报的影响因素特征,并将影响因素特征反馈至步骤S2对提取的因素特征进行特征加强(即在因素特征提取过程中对其进行扩充。例如,该误报案例下每天出行次数居多且人员年龄多为老年,而原有特征未考虑出行次数和年龄的交叉特征,那么就把该特征扩充至原来的模型输入,加强模式)。
结合图1和图2所示,根据本发明的一种实施方式,本发明的一种联动治理方法,包括:
S001.获取城市大脑平台在布置电梯系统的区域所确认存在的群租房的群租房信息。在本实施方式中,群租房信息包括所在街道、小区、楼幢的楼层信息、人物出行电梯的监控信息,以有效支撑政府的有效治理。
S002.城市大脑平台将群租房信息推送至相关治理部门,协助相关治理部门进行群租房治理。
通过上述设置,本发明的方案不依赖于房屋用户私人数据,利用大数据挖掘技术,结合深度学习和专家模型精准识别群租房,为政府治理解决“城市病”提供了新的模式。且通过分析发现,群租房所在楼层出行人流高、出行时间早出等明显特点,以及群租房的分布与地区经济发展、交通区域分布、流动人口分布等存在极大相关性,这些分析发现构成了政府精细化治理的必要技术支持。
通过上述设置,依托城市大脑平台,联合相关单位部门进行联合治理,有效排除并治理“群租房”,提高城市的智慧化运转。
根据本发明的一种实施方式,本发明的一种群租房智能识别系统,包括:
数据采集模块,基于电梯系统和城市大脑平台获取布置电梯系统的区域的多维异构数据;
数据预处理模块,对多维异构数据进行处理;
因素特征提取模块,对处理后的多维异构数据进行因素特征提取;
线上监测识别模块,基于深度学习网络模型对提取的因素特征进行在线监测推断,并基于推断结果判断区域是否存在群租房,若存在,则将多维异构数据发布至城市大脑平台。
根据本发明的一种实施方式,本发明的一种群租房智能识别系统,还包括:
群租房案例获取模块,利用大数据爬虫技术对网络新闻舆情里涉及到的群租房信息以及公开数据集进行爬取,并将爬取结果作为标签样本库信息添加至群租房标签样本库;
线下模型训练模块,用于获取深度学习网络模型,并将训练完成的深度学习网络模型发布至所述线上监测识别模块。
根据本发明的一种实施方式,本发明的一种联动治理系统,包括:
数据采集模块,基于电梯系统和城市大脑平台获取布置电梯系统的区域的多维异构数据;
数据预处理模块,对多维异构数据进行处理;
因素特征提取模块,对处理后的多维异构数据进行因素特征提取;
线上监测识别模块,基于深度学习网络模型对提取的因素特征进行在线监测推断,并基于推断结果判断区域是否存在群租房,若存在,则将多维异构数据发布至所述城市大脑平台;
联动治理模块,获取城市大脑平台的确认结果,基于确认结果获取群租房的群租房信息,并将群租房信息发布至城市大脑平台,通过城市大脑平台将群租房信息推送至相关治理部门,协助相关治理部门进行群租房治理。
根据本发明的一种实施方式,本发明的一种联动治理系统,还包括:
群租房案例获取模块,利用大数据爬虫技术对网络新闻舆情里涉及到的群租房信息以及公开数据集进行爬取,并将爬取结果作为标签样本库信息添加至群租房标签样本库;
线下模型训练模块,用于获取深度学习网络模型,并将训练完成的深度学习网络模型发布至线上监测识别模块。
上述内容仅为本发明的具体方案的例子,对于其中未详尽描述的设备和结构,应当理解为采取本领域已有的通用设备及通用方法来予以实施。
以上所述仅为本发明的一个方案而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (13)
1.一种群租房智能识别方法,包括:
S1.基于电梯系统和城市大脑平台获取布置所述电梯系统的区域的多维异构数据;
S2.对所述多维异构数据进行处理并提取因素特征,并基于深度学习网络模型对提取的所述因素特征进行在线监测推断,并基于推断结果判断所述区域是否存在群租房,若是,则执行步骤S3;
S3.将所述多维异构数据发布至所述城市大脑平台,所述城市大脑平台对所述区域是否存在群租房作进一步确认,若确认存在,则将该真实群租房案例添加至用于离线训练所述深度学习网络模型的群租房标签样本库,若确认不存在,则执行步骤S4;
S4.所述城市大脑平台对所述多维异构数据进行分析,获取导致所述深度学习网络模型出现误报的影响因素特征,并将所述影响因素特征反馈至步骤S2对提取的所述因素特征进行特征加强。
2.根据权利要求1所述的群租房智能识别方法,其特征在于,所述多维异构数据包括:基于所述电梯系统获取的电梯基础信息、物联网信息、房屋信息,以及基于所述城市大脑平台获取的处置信息。
3.根据权利要求2所述的群租房智能识别方法,其特征在于,步骤S2中,对所述多维异构数据进行处理的步骤中,对所述多维异构数据进行异常噪音数据和缺失数据进行处理,其中,包括:
S21.通过采用箱型图和/或可视化的方式进行异常噪音数据识别和缺失数据识别,
S22.利用统计分析方法进行处理,其中,对于极端异常的数据和缺失率超过一定阈值的记录进行剔除,否则进行替换和填补。
4.根据权利要求3所述的群租房智能识别方法,其特征在于,步骤S2中,基于深度学习网络模型对提取的所述因素特征进行在线监测推断的步骤中,采用异常检测的方式进行群租房识别。
5.根据权利要求4所述的群租房智能识别方法,其特征在于,步骤S2中,基于深度学习网络模型对提取的所述因素特征进行在线监测推断的步骤中包括:
S01.利用大数据爬虫技术对网络新闻舆情里涉及到的群租房信息以及公开数据集进行爬取,并将爬取结果作为标签样本库信息添加至群租房标签样本库;
S02.对所述群租房标签样本库中存储的标签样本库信息与基于所述多维异构数据提取的所述因素特征进行相关性分析,基于分析结果获取影响群租房的关键因素特征;
S03.选取用于离线训练的所述深度学习网络模型;
S04.在所述深度学习网络模型的基础上融合专家模型,用于对所述关键因素特征进行加权;
S05.判断所述深度学习网络模型的训练结果是否满足预设条件,若满足,则将所述深度学习网络模型在线上发布并用于对所述因素特征进行在线监测推断。
6.根据权利要求5所述的群租房智能识别方法,其特征在于,步骤S03中,选取用于离线训练的所述深度学习网络模型的步骤中,包括:
S031.获取关于群租房的目标表达式,其表示为:
Scorerisk=f(X)
其中,Scorerisk表示算法输出,即疑似群租房的风险得分;X表示算法输入,即用于基于所述因素特征计算风险得分的多维矩阵向量;f(·)表示映射算法模型;
S032.基于所述目标表达式确定所述深度学习网络模型,其中,所述深度学习网络模型确定为黑箱深度学习模型,其表示为:
ScoreDeeprisk=f(X)。
7.根据权利要求6所述的群租房智能识别方法,其特征在于,步骤S04中,所述专家模型为加权算法类模型,其表示为:
ScoreExpertrisk=∑wixi
其中,ScoreExpertrisk表示专家模型计算出的风险得分,wi表示权重,xi表示风险因子。
8.根据权利要求7所述的群租房智能识别方法,其特征在于,步骤S4中,在所述深度学习网络模型的基础上融合专家模型后的模型表示为:
Scorerisk=g(ScoreDeeprisk,ScoreExpertrisk)
其中,g(·)是max()、min()、逻辑且、逻辑或,以及加权投票形式中的一种。
9.一种采用权利要求1至8任一项所述的群租房智能识别方法的联动治理方法,包括:
S001.获取所述城市大脑平台在布置所述电梯系统的区域所确认存在的群租房的群租房信息;
S002.所述城市大脑平台将所述群租房信息推送至相关治理部门,协助相关治理部门进行群租房治理。
10.一种用于权利要求1至8任一项所述的群租房智能识别方法的群租房智能识别系统,其特征在于,包括:
数据采集模块,基于电梯系统和城市大脑平台获取布置所述电梯系统的区域的多维异构数据;
数据预处理模块,对所述多维异构数据进行处理;
因素特征提取模块,对处理后的所述多维异构数据进行因素特征提取;
线上监测识别模块,基于深度学习网络模型对提取的所述因素特征进行在线监测推断,并基于推断结果判断所述区域是否存在群租房,若存在,则将所述多维异构数据发布至所述城市大脑平台。
11.根据权利要求10所述的群租房智能识别系统,其特征在于,还包括:
群租房案例获取模块,利用大数据爬虫技术对网络新闻舆情里涉及到的群租房信息以及公开数据集进行爬取,并将爬取结果作为标签样本库信息添加至群租房标签样本库;
线下模型训练模块,用于获取所述深度学习网络模型,并将训练完成的所述深度学习网络模型发布至所述线上监测识别模块。
12.一种用于权利要求9所述的联动治理方法的联动治理系统,其特征在于,包括:
数据采集模块,基于电梯系统和城市大脑平台获取布置所述电梯系统的区域的多维异构数据;
数据预处理模块,对所述多维异构数据进行处理;
因素特征提取模块,对处理后的所述多维异构数据进行因素特征提取;
线上监测识别模块,基于深度学习网络模型对提取的所述因素特征进行在线监测推断,并基于推断结果判断所述区域是否存在群租房,若存在,则将所述多维异构数据发布至所述城市大脑平台;
联动治理模块,获取城市大脑平台的确认结果,基于所述确认结果获取所述群租房的群租房信息,并将所述群租房信息发布至所述城市大脑平台,通过所述城市大脑平台将所述群租房信息推送至相关治理部门,协助相关治理部门进行群租房治理。
13.根据权利要求12所述的联动治理系统,其特征在于,还包括:
群租房案例获取模块,利用大数据爬虫技术对网络新闻舆情里涉及到的群租房信息以及公开数据集进行爬取,并将爬取结果作为标签样本库信息添加至群租房标签样本库;
线下模型训练模块,用于获取所述深度学习网络模型,并将训练完成的所述深度学习网络模型发布至所述线上监测识别模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010968689.2A CN112084240B (zh) | 2020-09-15 | 2020-09-15 | 一种群租房智能识别、联动治理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010968689.2A CN112084240B (zh) | 2020-09-15 | 2020-09-15 | 一种群租房智能识别、联动治理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112084240A true CN112084240A (zh) | 2020-12-15 |
CN112084240B CN112084240B (zh) | 2023-11-10 |
Family
ID=73737162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010968689.2A Active CN112084240B (zh) | 2020-09-15 | 2020-09-15 | 一种群租房智能识别、联动治理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112084240B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112988837A (zh) * | 2021-03-12 | 2021-06-18 | 深圳力维智联技术有限公司 | 群租房识别方法、装置及设备 |
CN113947788A (zh) * | 2021-08-27 | 2022-01-18 | 浙江新再灵科技股份有限公司 | 建筑物内人员流动异常识别方法、装置及设备 |
CN117196736A (zh) * | 2023-11-06 | 2023-12-08 | 湖南智信房地产土地资产评估有限公司 | 基于位置及场景的图数一体化智能评估系统 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES495309A0 (es) * | 1980-09-24 | 1981-10-16 | Yamanouchi Pharma Co Ltd | Un procedimiento para preparar un compuesto de bezamida |
CN104123477A (zh) * | 2014-08-15 | 2014-10-29 | 上海博路信息技术有限公司 | 一种基于生活数据的群租分析方法 |
US20150213360A1 (en) * | 2014-01-24 | 2015-07-30 | Microsoft Corporation | Crowdsourcing system with community learning |
US20170021282A1 (en) * | 2015-07-21 | 2017-01-26 | Disney Enterprises, Inc. | Sensing and managing vehicle behavior based on occupant awareness |
US20180316707A1 (en) * | 2017-04-26 | 2018-11-01 | Elasticsearch B.V. | Clustering and Outlier Detection in Anomaly and Causation Detection for Computing Environments |
CN109284988A (zh) * | 2018-12-24 | 2019-01-29 | 上海市浦东新区城市运行综合管理中心 | 数据分析系统及方法 |
CN109859087A (zh) * | 2019-02-19 | 2019-06-07 | 特斯联(北京)科技有限公司 | 一种应用城市超脑的智能社区软环境配置系统和方法 |
CN111275599A (zh) * | 2020-02-03 | 2020-06-12 | 重庆特斯联智慧科技股份有限公司 | 一种基于大数据集成算法的群租房预警方法、装置、存储介质及终端 |
US20200211131A1 (en) * | 2018-12-28 | 2020-07-02 | The Beekin Company Limited | Generating rental rates in a real estate management system |
CN111401431A (zh) * | 2020-03-12 | 2020-07-10 | 成都小步创想慧联科技有限公司 | 群租房识别方法及系统及存储介质 |
CN111563671A (zh) * | 2020-04-28 | 2020-08-21 | 重庆中科云从科技有限公司 | 一种区域人员管理方法、系统、机器可读介质及设备 |
CN111612113A (zh) * | 2020-05-26 | 2020-09-01 | 宁波军鸽防务科技有限公司 | 防疫管控方法、装置、系统、存储介质以及处理器 |
-
2020
- 2020-09-15 CN CN202010968689.2A patent/CN112084240B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES495309A0 (es) * | 1980-09-24 | 1981-10-16 | Yamanouchi Pharma Co Ltd | Un procedimiento para preparar un compuesto de bezamida |
US20150213360A1 (en) * | 2014-01-24 | 2015-07-30 | Microsoft Corporation | Crowdsourcing system with community learning |
CN104123477A (zh) * | 2014-08-15 | 2014-10-29 | 上海博路信息技术有限公司 | 一种基于生活数据的群租分析方法 |
US20170021282A1 (en) * | 2015-07-21 | 2017-01-26 | Disney Enterprises, Inc. | Sensing and managing vehicle behavior based on occupant awareness |
US20180316707A1 (en) * | 2017-04-26 | 2018-11-01 | Elasticsearch B.V. | Clustering and Outlier Detection in Anomaly and Causation Detection for Computing Environments |
CN109284988A (zh) * | 2018-12-24 | 2019-01-29 | 上海市浦东新区城市运行综合管理中心 | 数据分析系统及方法 |
US20200211131A1 (en) * | 2018-12-28 | 2020-07-02 | The Beekin Company Limited | Generating rental rates in a real estate management system |
CN109859087A (zh) * | 2019-02-19 | 2019-06-07 | 特斯联(北京)科技有限公司 | 一种应用城市超脑的智能社区软环境配置系统和方法 |
CN111275599A (zh) * | 2020-02-03 | 2020-06-12 | 重庆特斯联智慧科技股份有限公司 | 一种基于大数据集成算法的群租房预警方法、装置、存储介质及终端 |
CN111401431A (zh) * | 2020-03-12 | 2020-07-10 | 成都小步创想慧联科技有限公司 | 群租房识别方法及系统及存储介质 |
CN111563671A (zh) * | 2020-04-28 | 2020-08-21 | 重庆中科云从科技有限公司 | 一种区域人员管理方法、系统、机器可读介质及设备 |
CN111612113A (zh) * | 2020-05-26 | 2020-09-01 | 宁波军鸽防务科技有限公司 | 防疫管控方法、装置、系统、存储介质以及处理器 |
Non-Patent Citations (3)
Title |
---|
V. ATILLA ÖVEN等: "Office Rent Determinants Utilising Factor Analysis—A Case Study for İstanbul", 《THE JOURNAL OF REAL ESTATE FINANCE AND ECONOMICS》, pages 51 * |
北京日报: "北京朝阳"城市大脑"上线 助力城市精细化管理", pages 1, Retrieved from the Internet <URL:《https://www.zhjsw.cn/news/show-2180.html》> * |
颜格: "组织吸纳技术:信息技术应用于基层治理的机制研究", 《中国优秀硕士学位论文全文数据库社会科学Ⅰ辑》, no. 7, pages 110 - 290 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112988837A (zh) * | 2021-03-12 | 2021-06-18 | 深圳力维智联技术有限公司 | 群租房识别方法、装置及设备 |
CN113947788A (zh) * | 2021-08-27 | 2022-01-18 | 浙江新再灵科技股份有限公司 | 建筑物内人员流动异常识别方法、装置及设备 |
CN117196736A (zh) * | 2023-11-06 | 2023-12-08 | 湖南智信房地产土地资产评估有限公司 | 基于位置及场景的图数一体化智能评估系统 |
CN117196736B (zh) * | 2023-11-06 | 2024-02-09 | 湖南智信房地产土地资产评估有限公司 | 基于位置及场景的图数一体化智能评估系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112084240B (zh) | 2023-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Application of computational intelligence technologies in emergency management: a literature review | |
Ma et al. | Driving style recognition and comparisons among driving tasks based on driver behavior in the online car-hailing industry | |
CN112084240A (zh) | 一种群租房智能识别、联动治理方法及系统 | |
CN113254594B (zh) | 一种面向智慧电厂的安全知识图谱构建方法及系统 | |
Chen et al. | Learning deep representation from big and heterogeneous data for traffic accident inference | |
Sheu | Dynamic relief-demand management for emergency logistics operations under large-scale disasters | |
Liu et al. | Incorporating household gathering and mode decisions in large‐scale no‐notice evacuation modeling | |
CN113888368B (zh) | 基于图编码面向刑事案件羁押风险评估的特征选择方法 | |
Bench-Capon | The need for good old fashioned ai and law | |
CN111476177A (zh) | 嫌疑人检测方法及装置 | |
CN110909195A (zh) | 基于区块链的图片标注方法、装置及存储介质、服务器 | |
CN112884179A (zh) | 基于机器故障和文本主题分析的城轨折返故障诊断方法 | |
CN116541755A (zh) | 一种基于时序图表征学习的金融行为模式分析预测方法 | |
Adderley et al. | Modus operandi modelling of group offending: a data-mining case study | |
CN115017244A (zh) | 一种地理信息大数据与人口数据融合服务社区治理的方法 | |
CN106779214A (zh) | 一种基于主题模型的多因素融合民航旅客出行预测方法 | |
CN109753541A (zh) | 一种关系网络构建方法和装置、计算机可读存储介质 | |
CN116545679A (zh) | 一种工业情境安全基础框架及网络攻击行为特征分析方法 | |
Oki et al. | Model for estimation of building structure and built year using building façade images and attributes obtained from a real estate database | |
CN116205350A (zh) | 基于法律文书的再犯人身危险性分析预测系统和方法 | |
Xu et al. | MM-UrbanFAC: Urban functional area classification model based on multimodal machine learning | |
Chiew et al. | A spatial analysis of the relationship between socio-demographic characteristics with burglar behaviours on burglary crime | |
Sundaram | Classification rules by decision tree for disease prediction | |
CN113034262A (zh) | 一种基于大数据技术的个人信用评价动态集成算法 | |
Tariq et al. | Analysis of Road Traffic Accidents to Improve Safety and Protection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |