CN112364263A - 基于多维度数据的群租房识别方法、装置、设备及介质 - Google Patents

基于多维度数据的群租房识别方法、装置、设备及介质 Download PDF

Info

Publication number
CN112364263A
CN112364263A CN202011259757.4A CN202011259757A CN112364263A CN 112364263 A CN112364263 A CN 112364263A CN 202011259757 A CN202011259757 A CN 202011259757A CN 112364263 A CN112364263 A CN 112364263A
Authority
CN
China
Prior art keywords
data
group
address
identified
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011259757.4A
Other languages
English (en)
Inventor
余飞
冯薛琦
杨冠荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen ZNV Technology Co Ltd
Nanjing ZNV Software Co Ltd
Original Assignee
Shenzhen ZNV Technology Co Ltd
Nanjing ZNV Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen ZNV Technology Co Ltd, Nanjing ZNV Software Co Ltd filed Critical Shenzhen ZNV Technology Co Ltd
Priority to CN202011259757.4A priority Critical patent/CN112364263A/zh
Publication of CN112364263A publication Critical patent/CN112364263A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Mathematical Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Algebra (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Human Resources & Organizations (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)

Abstract

本发明公开了一种基于多维度数据的群租房识别方法、装置、设备及介质,获取待识别地址在预设周期内的多维度数据,分别计算所述多维度数据中各维度数据的概率信息;根据所述多维度数据中各所述维度数据的概率信息,计算得到所述多维度数据的概率总和;根据所述概率总和,确定所述待识别地址是否为群租房,若所述待识别地址为群租房,则将所述待识别地址推送至群租处置部门。由于本发明先获取待识别地址的多维度数据,再计算多维度数据的概率总和,并根据概率总和确定待识别地址是否为群租房,通过大数据分析计算代替人工的识别方式,有效提高群租房识别的速度与准确度,有利于提高群租治理的效率。

Description

基于多维度数据的群租房识别方法、装置、设备及介质
技术领域
本发明涉及社区治理领域,尤其涉及一种基于多维度数据的群租房识别方法、装置、设备及介质。
背景技术
随着社会的不断发展,城市化进程越来越快,城市中的人口数量也越来越多,群租就成为了大城市中普遍存在的现象,而群租给社区带来了很多消防隐患,对整个居住环境造成了许多负面影响。因此,相关部门经常对各种群租房进行治理,以防止安全事故的发生。但由于当前治理工作太消耗人力与时间,并且由于大城市中人口和房屋体量巨大,使得实际治理效果并不明显。现有的群租治理手段一般是通过社区的物管部门日常走访,或者社区群众的投诉举报等基于人工识别的方式进行识别并整治,由于基于人工的识别方式无法快速对群租房进行识别,导致群租治理的效率低下。
发明内容
本发明的主要目的在于提供一种基于多维度数据的群租房识别方法、装置、设备及介质,旨在解决当前群租治理的效率低下的技术问题。
为实现上述目的,本发明实施例提供一种基于多维度数据的群租房识别方法,所述基于多维度数据的群租房识别方法包括:
获取待识别地址在预设周期内的多维度数据,分别计算所述多维度数据中各维度数据的概率信息;
根据所述多维度数据中各所述维度数据的概率信息,计算得到所述多维度数据的概率总和;
根据所述概率总和,确定所述待识别地址是否为群租房,若所述待识别地址为群租房,则将所述待识别地址推送至群租处置部门。
优选地,所述分别计算所述多维度数据中各维度数据的概率信息的步骤包括:
针对所述多维度数据中各维度数据,分别执行以下步骤:
获取所述维度数据对应的第一预设阈值,根据所述维度数据与所述第一预设阈值,计算所述维度数据的权重值;
获取所述维度数据对应的目标比重信息,并根据所述权重值与所述目标比重信息,计算所述维度数据的概率信息。
优选地,所述根据所述权重值与所述目标比重信息,计算所述维度数据的概率信息的步骤包括:
获取预设概率公式,将所述权重值与所述目标比重信息输入所述预设概率公式;
根据所述预设概率公式对所述权重值与所述目标比重信息进行运算,生成所述维度数据的概率信息。
优选地,所述获取所述维度数据对应的目标比重信息的步骤包括:
获取群租房识别的预设比重表,将所述维度数据与所述预设比重表中的多个比重信息进行匹配;
若多个所述比重信息中存在与所述维度数据匹配的比重信息,则将与所述维度数据匹配的比重信息确定为目标比重信息。
优选地,所述根据所述概率总和,确定所述待识别地址是否为群租房的步骤包括:
获取第二预设阈值,将所述概率总和与所述第二预设阈值进行对比;
若所述概率总和大于或等于所述第二预设阈值,则判定所述待识别地址是群租房。
优选地,所述根据所述概率总和,确定所述待识别地址是否为群租房的步骤之后,还包括:
将所述第二预设阈值输入预设学习机制,根据所述预设学习机制对所述第二预设阈值进行优化,生成更新阈值,以根据所述更新阈值确定新的待识别地址是否为群租房。
优选地,所述根据所述概率总和,确定所述待识别地址是否为群租房的步骤之后,还包括:
若所述待识别地址不是群租房,则对所述待识别地址进行合法标记,并将合法标记后的待识别地址确定为合法租房。
为实现上述目的,本发明还提供一种基于多维度数据的群租房识别装置,所述基于多维度数据的群租房识别装置包括:
获取模块,用于获取待识别地址在预设周期内的多维度数据,分别计算所述多维度数据中各维度数据的概率信息;
计算模块,用于根据所述多维度数据中各所述维度数据的概率信息,计算得到所述多维度数据的概率总和;
确定模块,用于根据所述概率总和,确定所述待识别地址是否为群租房,若所述待识别地址为群租房,则将所述待识别地址推送至群租处置部门。
进一步地,为实现上述目的,本发明还提供一种基于多维度数据的群租房识别设备,所述基于多维度数据的群租房识别设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的基于多维度数据的群租房识别程序,所述基于多维度数据的群租房识别程序被所述处理器执行时实现上述的基于多维度数据的群租房识别方法的步骤。
进一步地,为实现上述目的,本发明还提供一种介质,所述介质上存储有基于多维度数据的群租房识别程序,所述基于多维度数据的群租房识别程序被处理器执行时实现上述的基于多维度数据的群租房识别方法的步骤。
本发明实施例提供一种基于多维度数据的群租房识别方法、装置、设备及介质,获取待识别地址在预设周期内的多维度数据,分别计算所述多维度数据中各维度数据的概率信息;根据所述多维度数据中各所述维度数据的概率信息,计算得到所述多维度数据的概率总和;根据所述概率总和,确定所述待识别地址是否为群租房,若所述待识别地址为群租房,则将所述待识别地址推送至群租处置部门。由于本发明先获取待识别地址的多维度数据,再计算多维度数据的概率总和,并根据概率总和确定待识别地址是否为群租房,通过大数据分析计算代替人工的识别方式,有效提高群租房识别的速度与准确度,有利于提高群租治理的效率。
附图说明
图1为本发明基于多维度数据的群租房识别方法实施例方案涉及的硬件运行环境的结构示意图;
图2为本发明基于多维度数据的群租房识别方法第一实施例的流程示意图;
图3为本发明基于多维度数据的群租房识别方法第二实施例的流程示意图;
图4为本发明基于多维度数据的群租房识别方法第三实施例的流程示意图;
图5为本发明基于多维度数据的群租房识别方法第四实施例的流程示意图;
图6为本发明基于多维度数据的群租房识别装置较佳实施例的功能模块示意图;
图7为本发明基于多维度数据的群租房识别方法的场景示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例提供一种基于多维度数据的群租房识别方法、装置、设备及介质,获取待识别地址在预设周期内的多维度数据,分别计算所述多维度数据中各维度数据的概率信息;根据所述多维度数据中各所述维度数据的概率信息,计算得到所述多维度数据的概率总和;根据所述概率总和,确定所述待识别地址是否为群租房,若所述待识别地址为群租房,则将所述待识别地址推送至群租处置部门。由于本发明先获取待识别地址的多维度数据,再计算多维度数据的概率总和,并根据概率总和确定待识别地址是否为群租房,通过大数据分析计算代替人工的识别方式,有效提高群租房识别的速度与准确度,有利于提高群租治理的效率。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的基于多维度数据的群租房识别设备结构示意图。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
本发明实施例基于多维度数据的群租房识别设备可以是PC,也可以是平板电脑、便携计算机等可移动式终端设备。
如图1所示,该基于多维度数据的群租房识别设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的基于多维度数据的群租房识别设备结构并不构成对基于多维度数据的群租房识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于多维度数据的群租房识别程序。
在图1所示的设备中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的基于多维度数据的群租房识别程序,并执行以下操作:
获取待识别地址在预设周期内的多维度数据,分别计算所述多维度数据中各维度数据的概率信息;
根据所述多维度数据中各所述维度数据的概率信息,计算得到所述多维度数据的概率总和;
根据所述概率总和,确定所述待识别地址是否为群租房,若所述待识别地址为群租房,则将所述待识别地址推送至群租处置部门。
进一步地,所述分别计算所述多维度数据中各维度数据的概率信息的步骤包括:
针对所述多维度数据中各维度数据,分别执行以下步骤:
获取所述维度数据对应的第一预设阈值,根据所述维度数据与所述第一预设阈值,计算所述维度数据的权重值;
获取所述维度数据对应的目标比重信息,并根据所述权重值与所述目标比重信息,计算所述维度数据的概率信息。
进一步地,所述根据所述权重值与所述目标比重信息,计算所述维度数据的概率信息的步骤包括:
获取预设概率公式,将所述权重值与所述目标比重信息输入所述预设概率公式;
根据所述预设概率公式对所述权重值与所述目标比重信息进行运算,生成所述维度数据的概率信息。
进一步地,所述获取所述维度数据对应的目标比重信息的步骤包括:
获取群租房识别的预设比重表,将所述维度数据与所述预设比重表中的多个比重信息进行匹配;
若多个所述比重信息中存在与所述维度数据匹配的比重信息,则将与所述维度数据匹配的比重信息确定为目标比重信息。
进一步地,所述根据所述概率总和,确定所述待识别地址是否为群租房的步骤包括:
获取第二预设阈值,将所述概率总和与所述第二预设阈值进行对比;
若所述概率总和大于或等于所述第二预设阈值,则判定所述待识别地址是群租房。
进一步地,所述根据所述概率总和,确定所述待识别地址是否为群租房的步骤之后,处理器1001可以用于调用存储器1005中存储的基于多维度数据的群租房识别程序,并执行以下操作:
将所述第二预设阈值输入预设学习机制,根据所述预设学习机制对所述第二预设阈值进行优化,生成更新阈值,以根据所述更新阈值确定新的待识别地址是否为群租房。
进一步地,所述根据所述概率总和,确定所述待识别地址是否为群租房的步骤之后,处理器1001可以用于调用存储器1005中存储的基于多维度数据的群租房识别程序,并执行以下操作:
若所述待识别地址不是群租房,则对所述待识别地址进行合法标记,并将合法标记后的待识别地址确定为合法租房。
为了更好的理解上述技术方案,下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
参照图2,本发明第一实施例提供一种基于多维度数据的群租房识别方法的流程示意图。该实施例中,所述基于多维度数据的群租房识别方法包括以下步骤:
步骤S10,获取待识别地址在预设周期内的多维度数据,分别计算所述多维度数据中各维度数据的概率信息;
本实施例中基于多维度数据的群租房识别方法应用于群租模型分析系统,群租模型分析系统可以为政府机构监管,并拥有一定的用户信息获取权限,在本申请后续过程中将群租模型分析系统简称为系统,系统可以与外卖平台、快递平台、物业平台、政府服务平台等平台通信连接,并通过任务指示,定时从各平台中对接数据,例如系统从外卖平台中对接某地址中相关人员的外卖信息,根据地址计算一定周期时间内的外卖数量与接收外卖的手机号码数量;从快递平台中对接某地址中相关人员的快递信息,根据地址计算一定周期时间内的快递数量与接收快递的手机号码数量;从物业平台中对接某地址中相关人员的门禁信息,根据地址计算一定周期时间内相关人员进出小区的门禁次数;从政府服务平台如12345工单平台中对接某地址中相关人员的投诉信息,通过分析12345工单数据,提取出该地址关于群租、投诉等关键字的工单信息;从物业平台中对接某地址的房型数据,如三房一厅、两房一厅等;其中外卖平台在本实施例为用于向用户提供外卖配送服务的平台,快递平台在本实施例为用于向用户提供快递配送服务的平台,物业平台在本实施例为用于监控用户门禁刷卡行为的平台,政府服务平台在本实施例为专门受理热线事项的公共服务平台。
可以理解地,现有的群租治理手段一般是通过社区的物管部门日常走访,或者社区群众的投诉举报等基于人工识别的方式进行识别并整治,由于基于人工的识别方式无法快速对群租房进行识别,导致群租治理的效率低下。因此,本发明提出一种基于多维度数据的群租房识别方法,先获取待识别地址的多维度数据,再计算多维度数据的概率总和,并根据概率总和确定待识别地址是否为群租房,通过大数据分析计算代替人工的识别方式,有效提高群租房识别的速度与准确度,有利于提高群租治理的效率。
进一步地,系统可以对群租现象高发地区进行监测,具体地,分别对高发地区的多个租房进行监测,确定监测的租房是否为群租房。在需要对租房进行监测时,系统将需要监测的租房确定为待识别地址,并通过与各平台的通信连接关系,从各平台中获取待识别地址在预设周期内的多维度数据,在本实施例中多维度数据可以但不限于包括外卖数据、快递数据、门禁数据、工单数据以及房型数据等维度数据,预设周期可以根据实际识别需求设定,例如一个月、一个季度、一年等。在获取多维度数据后,系统分别计算出每一维度数据对应的概率信息,例如分别计算外卖数据、快递数据、门禁数据、工单数据以及房型数据在判断是否为群租房时的概率信息,以根据各维度数据的概率信息计算概率总和,并根据概率总和确定待识别地址是否为群租房。
步骤S20,根据所述多维度数据中各所述维度数据的概率信息,计算得到所述多维度数据的概率总和;
进一步地,在计算出多维度数据中各个维度数据的概率信息后,系统从内部存储器中获取概率总和计算公式:P=P1+P2+P3+P4+P5,其中P为概率总和,P1-P5为多维度数据中计算顺序为1-5的维度数据分别对应的概率信息,概率总和计算公式为用于计算多维度数据概率总和而设置的公式。进一步地,系统分别将多维度数据中各维度数据的概率信息输入至概率总和计算公式P=P1+P2+P3+P4+P5中,通过概率总和计算公式对各维度数据的概率信息进行加和运算,并在运算完成后生成多维度数据的概率总和,以根据概率总和确定待识别地址是否为群租房。参照图7,系统通过与外卖、快递、门禁、工单等平台对接多维度数据,并对多维度数据进行群租模型分析,以分析计算得到外卖概率P1,快递概率P2,门禁概率P3,工单投诉概率P4,房型概率P5等概率信息,并在计算得到多维度数据的概率总和超过一定阈值时将待识别地址发送给群租处置部门。例如系统通过对接的多维度数据获知一个月内某小区2栋一单元701室有外卖数量32条,不同的手机号码数量6个,对应比重信息为80%,外卖阈值为40,手机号码数量阈值为6,则计算外卖数据的概率信息为P1=40%*80%=32%;同时该地址下的快递数量为8条,不同的手机号码数量6个,对应比重信息为70%,快递阈值为40,手机号码数量阈值为6,则计算快递数据的概率信息为P2=20%*70%=14%;该地址下的门禁次数为100条,对应比重信息为90%,门禁阈值为1000,则计算门禁数据的概率信息为P3=10%*90%=9%;同时该地址下的工单投诉群租相关工单数量有1条,对应比重信息为50%,工单阈值为5,则计算工单数据的概率信息为P4=20%*50%=10%;该地址下的房型为三室一厅,对应的群租房高发房型的比重信息为80%,三室一厅的权重值为10%,则计算该项概率P5=10%*80%=8%;因此,由于外卖数据的概率信息为32%,快递数据的概率信息为14%,门禁数据的概率信息为9%,工单数据的概率信息为10%,房型数据的概率信息为8%,系统分别将32%、14%、9%、10%、8%输入P=P1+P2+P3+P4+P5中,通过加和运算计算得到多维度数据的概率总和73%。
步骤S30,根据所述概率总和,确定所述待识别地址是否为群租房,若所述待识别地址为群租房,则将所述待识别地址推送至群租处置部门。
进一步地,在计算出多维度数据的概率总和后,系统将概率总和与用于判定待识别地址是否为群租房的第二预设阈值进行对比,通过概率总和与第二预设阈值的对比确定待识别地址是否为群租房,具体地,若经对比确定待识别地址为群租房,为了确保该地区其他租户的人身与利益安全,系统将待识别地址推送给群租处置部门,提醒群租处置部门待识别地址具有较高的概率为群租房,便于群租处置部门对待识别地址进行排查,核实待识别地址是否的确为群租房,若是则采取一定的手段进行处理,其中群租处置部门用于排查并处理群租房现象的部门。
进一步地,所述根据所述概率总和,确定所述待识别地址是否为群租房的步骤之后,还包括:
步骤S40,若所述待识别地址不是群租房,则对所述待识别地址进行合法标记,并将合法标记后的待识别地址确定为合法租房。
进一步地,若经对比确定待识别地址不属于群租房,系统判定不需要对待识别地址进行排查,对待识别地址进行合法标记,具体地,可以在待识别地址中添加“合法”、“合格”等标识,说明待识别地址合法,并在设置合法标记后,将待识别地址确定为合法租房,以提醒群租处置部门暂时不需要对待识别地址进行排查,以节省人力资源。可以理解地,若在将概率总和与第二预设阈值对比后,发现概率总和与第二预设阈值比较接近,例如概率总和与第二预设阈值的运算差值在预设差值内,其中预设差值可以由群租处置部门的工作人员提供或由系统根据实际情况设置,系统可以对待识别地址进行持续的监测,例如延长预设周期,将原来一个月的预设周期延长为一个季度,以对待识别地址是否为群租房进行更准确的判断。
本实施例提供一种基于多维度数据的群租房识别方法、装置、设备及介质,获取待识别地址在预设周期内的多维度数据,分别计算所述多维度数据中各维度数据的概率信息;根据所述多维度数据中各所述维度数据的概率信息,计算得到所述多维度数据的概率总和;根据所述概率总和,确定所述待识别地址是否为群租房,若所述待识别地址为群租房,则将所述待识别地址推送至群租处置部门。由于本发明先获取待识别地址的多维度数据,再计算多维度数据的概率总和,并根据概率总和确定待识别地址是否为群租房,通过大数据分析计算代替人工的识别方式,有效提高群租房识别的速度与准确度,有利于提高群租治理的效率。
进一步地,参照图3,基于本发明基于多维度数据的群租房识别方法的第一实施例,提出本发明基于多维度数据的群租房识别方法的第二实施例,在第二实施例中,所述分别计算所述多维度数据中各维度数据的概率信息的步骤包括:
步骤S11,针对所述多维度数据中各维度数据,分别执行以下步骤:
步骤S12,获取所述维度数据对应的第一预设阈值,根据所述维度数据与所述第一预设阈值,计算所述维度数据的权重值;
步骤S13,获取所述维度数据对应的目标比重信息,并根据所述权重值与所述目标比重信息,计算所述维度数据的概率信息。
进一步地,为了通过概率总和确定待识别地址是否为群租房,需要先计算出多维度数据中各维度数据的概率信息,再由各维度数据的概率信息计算得到概率总和,因此,系统先针对多维度数据中的每一维度数据,分别计算出每一维度数据的概率信息,直到计算出多维度数据中所有维度数据的概率信息,例如计算出外卖数据、快递数据、门禁数据、工单数据以及房型数据分别对应的概率信息,具体地,系统首先确定需要进行概率信息计算的维度数据,获取该维度数据对应的第一预设阈值,例如确定要计算外卖数据的概率信息,则获取外卖数据对应的第一预设阈值,其中第一预设阈值用于与相应的维度数据进行比值运算,得到该维度数据的权重值,可以理解地,第一预设阈值中阈值数量可以为一个或多个,可以根据维度数据中需要计算的数据种类来确定第一预设阈值中阈值的数量,例如:外卖数据中需要计算外卖数量与手机号码数量,快递数据中需要计算快递数量与手机号码数量,则外卖数据与快递数据的第一预设阈值均有两个阈值;又例如:门禁数据中只需要计算门禁次数,则门禁数据的第一预设阈值只有一个阈值。进一步地,系统将维度数据与第一预设阈值进行比值运算,得到维度数据的权重值,可以理解地,若维度数据中需要计算多个数据的权重值,则将计算得到的多个权重值进行乘积运算,得到该维度数据最终的权重值,例如外卖数据中需要计算外卖数量的权重值与手机号码数量的权重值,在计算得到外卖数量的权重值与手机号码数量的权重值后,将两个权重值相乘,得到外卖数据最终的权重值,以外卖数据举例:一个月内某小区2栋一单元701室有外卖数量32条,不同的手机号码数量6个,系统分别计算外卖数量和手机号码数量的权重值,其中外卖数量的权重值为(外卖数量/外卖阈值),大于100%时默认为100%,手机号码数量的权重值为(手机号码数量/手机号码数量阈值),其中外卖阈值初始值为40,手机号码数量阈值初始值为6,计算得到最终外卖数据的权重值为(32/40)*(6/6)*100%=80%。而由于门禁数据中只需要计算门禁次数的权重值,则在计算出门禁次数的权重值后,即可将门禁次数的权重值作为门禁数据的权重值。进一步地,在计算出维度数据的权重值后,系统还需要从内部存储的预设比重表中获取与维度数据对应的目标比重信息,例如当前计算的是外卖数据的概率信息,则从预设比重表中获取外卖数据的比重信息作为目标比重信息。在获取目标比重信息后,系统将计算的权重值与目标比重信息进行运算,在运算完成后得到当前维度数据的概率信息,例如将外卖数据的权重值与外卖数据的目标比重信息进行运算,得到外卖数据的概率信息,以此类推,得到多维度数据中各维度数据的概率信息。
进一步地,所述根据所述权重值与所述目标比重信息,计算所述维度数据的概率信息的步骤包括:
步骤S131,获取预设概率公式,将所述权重值与所述目标比重信息输入所述预设概率公式;
步骤S132,根据所述预设概率公式对所述权重值与所述目标比重信息进行运算,生成所述维度数据的概率信息。
进一步地,系统中还设置有用于计算各维度数据概率信息的预设概率公式,当需要进行维度数据的概率信息计算时,系统从内部存储器中获取预设概率公式P1=W1*T1,其中P1为计算的第一个维度数据的概率信息,W1为第一个维度数据的目标比重信息,T1为第一个维度数据的权重值,第一个计算的维度数据使用的预设概率公式为P1=W1*T1,第二个计算的维度数据使用的预设概率公式为P2=W2*T2,以此类推,本实施例中不进行一一赘述;进一步地,系统将当前维度数据的权重值与目标比重信息输入至预设概率公式P1=W1*T1中,通过预设概率公式P1=W1*T1对当前维度数据的权重值与目标比重信息进行运算,得到当前维度数据的概率信息。例如:系统第一个计算的维度数据为外卖数据,则将外卖数据的权重值80%与目标比重信息40%输入至预设概率公式P1=W1*T1,通过预设概率公式计算出外卖数据的概率信息32%。
进一步地,所述获取所述维度数据对应的目标比重信息的步骤包括:
步骤S133,获取群租房识别的预设比重表,将所述维度数据与所述预设比重表中的多个比重信息进行匹配;
步骤S134,若多个所述比重信息中存在与所述维度数据匹配的比重信息,则将与所述维度数据匹配的比重信息确定为目标比重信息。
进一步地,系统从内部存储器中获取用于进行群租房识别的预设比重表,预设比重表中设置有多维度数据及其分布对应的比重信息,例如外卖数据对应比重40%,快递数据对应比重20%,门禁数据对应比重10%,12345工单数据对应比重20%,房型数据对应比重10%等等。进一步地,系统将当前的维度数据作为匹配条件,与预设比重表中的多个比重信息进行匹配,查找与当前的维度数据对应的比重信息,当系统在预设比重表中查找到与当前的维度数据对应的比重信息时,将查找到与当前的维度数据对应的比重信息确定为目标比重信息,例如当前计算的是外卖数据的概率信息,则系统将从预设比重表中查找与外卖数据匹配的比重信息,若发现预设比重表中存在与外卖数据对应的比重信息(即40%),则将查找到的比重信息确定为外卖数据的目标比重信息,以便于根据当前维度数据的权重值与目标比重信息,计算出当前维度数据的概率信息。
本实施例分别计算所述多维度数据中各维度数据的概率信息,以便通过各维度数据的概率信息共同确定出待识别地址是否为群租房,提高群租房的识别准确度,有利于提高群租治理的效率。
进一步地,参照图4,基于本发明基于多维度数据的群租房识别方法的第一实施例,提出本发明基于多维度数据的群租房识别方法的第三实施例,在第三实施例中,所述根据所述概率总和,确定所述待识别地址是否为群租房的步骤包括:
步骤S31,获取第二预设阈值,将所述概率总和与所述第二预设阈值进行对比;
步骤S32,若所述概率总和大于或等于所述第二预设阈值,则判定所述待识别地址是群租房。
进一步地,系统获取用于判定待识别地址是否为群租房的第二预设阈值,将计算得到的概率总和与获取的第二预设阈值进行对比,具体地,将概率总和与第二预设阈值进行数值大小比较,根据数值大小比较结果确定待识别地址是否为群租房。进一步地,若经比较确定多维度数据的概率总和大于或等于第二预设阈值,说明待识别地址的综合环境符合群租房的条件,具有较大的概率为群租房,系统判定待识别地址为群租房,并将待识别地址发送给群租处置部门,通知群租处置部门待识别地址需要进行排查确认。
相反地,若经比较确定多维度数据的概率总和小于第二预设阈值,说明待识别地址的综合环境不符合群租房的条件,是群租房的概率较低,系统判定待识别地址不是群租房,暂时不需要对待识别地址进行排查,以节省人力资源。
本实施例通过将概率总和与第二预设阈值来判定待识别地址是否为群租房,有效提高群租房识别的准确度,有利于提高群租治理的效率。
进一步地,参照图5,基于本发明基于多维度数据的群租房识别方法的第一实施例,提出本发明基于多维度数据的群租房识别方法的第四实施例,在第四实施例中,所述根据所述概率总和,确定所述待识别地址是否为群租房的步骤之后,还包括:
步骤S50,将所述第二预设阈值输入预设学习机制,根据所述预设学习机制对所述第二预设阈值进行优化,生成更新阈值,以根据所述更新阈值确定新的待识别地址是否为群租房。
进一步地,为了使群租房识别的准确度更高,系统还需要对第二预设阈值进行优化调整,直到用于核实群租房/疑似群租房的第二预设阈值达到一个理想值,具体地,系统将第二预设阈值输入预设学习机制,通过预设学习机制对第二预设阈值进行优化调整,以生成更新阈值,以便于根据预设学习机制优化后的更新阈值,来对新的待识别地址是否为群租房进行判断,使得判断的准确度更高。可以理解地,在将第二预设阈值输入预设学习机制之前,还需要通过大量的维度数据与判定阈值对预设学习机制进行训练,使得预设学习机制具有对第二预设阈值进行优化的功能,其中预设学习机制可以为随机森林、神经网络等。
本实施例通过预设学习机制对第二预设阈值进行优化调整,使得用于核实群租房/疑似群租房的第二预设阈值达到一个理想值,提高群租房识别的准确度,有利于提高群租治理的效率。
进一步地,本发明还提供一种基于多维度数据的群租房识别装置。
参照图6,图6为本发明基于多维度数据的群租房识别装置第一实施例的功能模块示意图。
所述基于多维度数据的群租房识别装置包括:
获取模块10,用于获取待识别地址在预设周期内的多维度数据,分别计算所述多维度数据中各维度数据的概率信息;
计算模块20,用于根据所述多维度数据中各所述维度数据的概率信息,计算得到所述多维度数据的概率总和;
确定模块30,用于根据所述概率总和,确定所述待识别地址是否为群租房,若所述待识别地址为群租房,则将所述待识别地址推送至群租处置部门。
进一步地,所述获取模块10包括:
执行单元,用于针对所述多维度数据中各维度数据,分别执行步骤S12-步骤S13:
第一计算单元,用于获取所述维度数据对应的第一预设阈值,根据所述维度数据与所述第一预设阈值,计算所述维度数据的权重值;
第二计算单元,用于获取所述维度数据对应的目标比重信息,并根据所述权重值与所述目标比重信息,计算所述维度数据的概率信息。
进一步地,所述获取模块10还包括:
输入单元,用于获取预设概率公式,将所述权重值与所述目标比重信息输入所述预设概率公式;
运算单元,用于根据所述预设概率公式对所述权重值与所述目标比重信息进行运算,生成所述维度数据的概率信息。
进一步地,所述获取模块10还包括:
匹配单元,用于获取群租房识别的预设比重表,将所述维度数据与所述预设比重表中的多个比重信息进行匹配;
确定单元,用于若多个所述比重信息中存在与所述维度数据匹配的比重信息,则将与所述维度数据匹配的比重信息确定为目标比重信息。
进一步地,所述确定模块30包括:
对比单元,用于获取第二预设阈值,将所述概率总和与所述第二预设阈值进行对比;
判定单元,用于若所述概率总和大于或等于所述第二预设阈值,则判定所述待识别地址是群租房。
进一步地,所述确定模块30还包括:
优化单元,用于将所述第二预设阈值输入预设学习机制,根据所述预设学习机制对所述第二预设阈值进行优化,生成更新阈值,以根据所述更新阈值确定新的待识别地址是否为群租房。
进一步地,所述确定模块30还包括:
标记单元,用于若所述待识别地址不是群租房,则对所述待识别地址进行合法标记,并将合法标记后的待识别地址确定为合法租房。
此外,本发明还提供一种介质,所述介质优选为计算机可读介质,其上存储有基于多维度数据的群租房识别程序,所述基于多维度数据的群租房识别程序被处理器执行时实现上述基于多维度数据的群租房识别方法各实施例的步骤。
在本发明基于多维度数据的群租房识别装置和计算机可读介质的实施例中,包含了上述基于多维度数据的群租房识别方法各实施例的全部技术特征,说明和解释内容与上述基于多维度数据的群租房识别方法各实施例基本相同,在此不做赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是固定终端,如物联网智能设备,包括智能空调、智能电灯、智能电源、智能路由器等智能家居;也可以是移动终端,包括智能手机、可穿戴的联网AR/VR装置、智能音箱、自动驾驶汽车等诸多联网设备)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于多维度数据的群租房识别方法,其特征在于,所述基于多维度数据的群租房识别方法包括:
获取待识别地址在预设周期内的多维度数据,分别计算所述多维度数据中各维度数据的概率信息;
根据所述多维度数据中各所述维度数据的概率信息,计算得到所述多维度数据的概率总和;
根据所述概率总和,确定所述待识别地址是否为群租房,若所述待识别地址为群租房,则将所述待识别地址推送至群租处置部门。
2.如权利要求1所述的基于多维度数据的群租房识别方法,其特征在于,所述分别计算所述多维度数据中各维度数据的概率信息的步骤包括:
针对所述多维度数据中各维度数据,分别执行以下步骤:
获取所述维度数据对应的第一预设阈值,根据所述维度数据与所述第一预设阈值,计算所述维度数据的权重值;
获取所述维度数据对应的目标比重信息,并根据所述权重值与所述目标比重信息,计算所述维度数据的概率信息。
3.如权利要求2所述的基于多维度数据的群租房识别方法,其特征在于,所述根据所述权重值与所述目标比重信息,计算所述维度数据的概率信息的步骤包括:
获取预设概率公式,将所述权重值与所述目标比重信息输入所述预设概率公式;
根据所述预设概率公式对所述权重值与所述目标比重信息进行运算,生成所述维度数据的概率信息。
4.如权利要求2所述的基于多维度数据的群租房识别方法,其特征在于,所述获取所述维度数据对应的目标比重信息的步骤包括:
获取群租房识别的预设比重表,将所述维度数据与所述预设比重表中的多个比重信息进行匹配;
若多个所述比重信息中存在与所述维度数据匹配的比重信息,则将与所述维度数据匹配的比重信息确定为目标比重信息。
5.如权利要求1所述的基于多维度数据的群租房识别方法,其特征在于,所述根据所述概率总和,确定所述待识别地址是否为群租房的步骤包括:
获取第二预设阈值,将所述概率总和与所述第二预设阈值进行对比;
若所述概率总和大于或等于所述第二预设阈值,则判定所述待识别地址是群租房。
6.如权利要求5所述的基于多维度数据的群租房识别方法,其特征在于,所述根据所述概率总和,确定所述待识别地址是否为群租房的步骤之后,还包括:
将所述第二预设阈值输入预设学习机制,根据所述预设学习机制对所述第二预设阈值进行优化,生成更新阈值,以根据所述更新阈值确定新的待识别地址是否为群租房。
7.如权利要求1所述的基于多维度数据的群租房识别方法,其特征在于,所述根据所述概率总和,确定所述待识别地址是否为群租房的步骤之后,还包括:
若所述待识别地址不是群租房,则对所述待识别地址进行合法标记,并将合法标记后的待识别地址确定为合法租房。
8.一种基于多维度数据的群租房识别装置,其特征在于,所述基于多维度数据的群租房识别装置包括:
获取模块,用于获取待识别地址在预设周期内的多维度数据,分别计算所述多维度数据中各维度数据的概率信息;
计算模块,用于根据所述多维度数据中各所述维度数据的概率信息,计算得到所述多维度数据的概率总和;
确定模块,用于根据所述概率总和,确定所述待识别地址是否为群租房,若所述待识别地址为群租房,则将所述待识别地址推送至群租处置部门。
9.一种基于多维度数据的群租房识别设备,其特征在于,所述基于多维度数据的群租房识别设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的基于多维度数据的群租房识别程序,所述基于多维度数据的群租房识别程序被所述处理器执行时实现如权利要求1-7中任一项所述的基于多维度数据的群租房识别方法的步骤。
10.一种介质,其特征在于,所述介质上存储有基于多维度数据的群租房识别程序,所述基于多维度数据的群租房识别程序被处理器执行时实现如权利要求1-7中任一项所述的基于多维度数据的群租房识别方法的步骤。
CN202011259757.4A 2020-11-11 2020-11-11 基于多维度数据的群租房识别方法、装置、设备及介质 Pending CN112364263A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011259757.4A CN112364263A (zh) 2020-11-11 2020-11-11 基于多维度数据的群租房识别方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011259757.4A CN112364263A (zh) 2020-11-11 2020-11-11 基于多维度数据的群租房识别方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN112364263A true CN112364263A (zh) 2021-02-12

Family

ID=74514467

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011259757.4A Pending CN112364263A (zh) 2020-11-11 2020-11-11 基于多维度数据的群租房识别方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN112364263A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822343A (zh) * 2021-09-03 2021-12-21 国网江苏省电力有限公司营销服务中心 一种基于细粒度用能数据的群租房识别方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020055869A1 (en) * 2000-01-13 2002-05-09 David Hegg Housing market analysis method
US20070073477A1 (en) * 2005-09-29 2007-03-29 Microsoft Corporation Methods for predicting destinations from partial trajectories employing open- and closed-world modeling methods
CN104123477A (zh) * 2014-08-15 2014-10-29 上海博路信息技术有限公司 一种基于生活数据的群租分析方法
CN108305363A (zh) * 2018-01-31 2018-07-20 上海与德通讯技术有限公司 群租房的监控方法及智能终端
CN110555617A (zh) * 2019-09-05 2019-12-10 消检通(深圳)科技有限公司 一种基于物联网的建筑火灾风险实时动态定量评估方法
CN110675206A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 群租发现方法、装置、设备及计算机可读介质
CN111160846A (zh) * 2019-12-09 2020-05-15 浙江微天下信息科技股份有限公司 一种出租房管理系统
CN111275599A (zh) * 2020-02-03 2020-06-12 重庆特斯联智慧科技股份有限公司 一种基于大数据集成算法的群租房预警方法、装置、存储介质及终端
CN111401431A (zh) * 2020-03-12 2020-07-10 成都小步创想慧联科技有限公司 群租房识别方法及系统及存储介质
CN111612113A (zh) * 2020-05-26 2020-09-01 宁波军鸽防务科技有限公司 防疫管控方法、装置、系统、存储介质以及处理器

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020055869A1 (en) * 2000-01-13 2002-05-09 David Hegg Housing market analysis method
US20070073477A1 (en) * 2005-09-29 2007-03-29 Microsoft Corporation Methods for predicting destinations from partial trajectories employing open- and closed-world modeling methods
CN104123477A (zh) * 2014-08-15 2014-10-29 上海博路信息技术有限公司 一种基于生活数据的群租分析方法
CN108305363A (zh) * 2018-01-31 2018-07-20 上海与德通讯技术有限公司 群租房的监控方法及智能终端
CN110675206A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 群租发现方法、装置、设备及计算机可读介质
CN110555617A (zh) * 2019-09-05 2019-12-10 消检通(深圳)科技有限公司 一种基于物联网的建筑火灾风险实时动态定量评估方法
CN111160846A (zh) * 2019-12-09 2020-05-15 浙江微天下信息科技股份有限公司 一种出租房管理系统
CN111275599A (zh) * 2020-02-03 2020-06-12 重庆特斯联智慧科技股份有限公司 一种基于大数据集成算法的群租房预警方法、装置、存储介质及终端
CN111401431A (zh) * 2020-03-12 2020-07-10 成都小步创想慧联科技有限公司 群租房识别方法及系统及存储介质
CN111612113A (zh) * 2020-05-26 2020-09-01 宁波军鸽防务科技有限公司 防疫管控方法、装置、系统、存储介质以及处理器

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822343A (zh) * 2021-09-03 2021-12-21 国网江苏省电力有限公司营销服务中心 一种基于细粒度用能数据的群租房识别方法
CN113822343B (zh) * 2021-09-03 2023-08-25 国网江苏省电力有限公司营销服务中心 一种基于细粒度用能数据的群租房识别方法

Similar Documents

Publication Publication Date Title
CN110417721B (zh) 安全风险评估方法、装置、设备及计算机可读存储介质
CN110232006B (zh) 设备告警方法及相关装置
CN110020002A (zh) 事件处理方案的查询方法、装置、设备和计算机存储介质
CN111754044A (zh) 员工行为审计方法、装置、设备及可读存储介质
CN111383130A (zh) 一种全生命周期管控平台、移动运维客户端及终端
CN111401976B (zh) 一种异常行为检测方法、装置、设备及存储介质
CN111898918A (zh) 一种设备使用跟踪管理方法、装置、设备及存储介质
CN112364263A (zh) 基于多维度数据的群租房识别方法、装置、设备及介质
CN110489142B (zh) 设备软件升级的评估方法及装置、存储介质、终端
JP4310648B2 (ja) 設備環境データ分析システムおよび設備環境データ分析方法
CN109902196B (zh) 一种商标类别推荐方法、装置、计算机设备及存储介质
CN115982646B (zh) 一种基于云平台的多源测试数据的管理方法及系统
CN115809796A (zh) 基于用户画像的项目智能派工方法及系统
CN114970495A (zh) 人名消歧方法、装置、电子设备及存储介质
CN111427900B (zh) 一种标签库更新方法、装置、设备及可读存储介质
CN113469709A (zh) 感知确定方法、装置及服务器
CN113590484A (zh) 算法模型服务测试方法、系统、设备及存储介质
CN112232997A (zh) 一种用于智慧城市的用户请求数据处理方法
CN111383032A (zh) 一种房源信息的真实性检测方法和装置
CN117421198B (zh) 一种基于安全的可视化资产管理系统和方法
CN109615412A (zh) 小区均价预估方法、电子装置及存储介质
CN116595509B (zh) 一种程序白名单构建方法及系统
CN111414944B (zh) 一种电子设备控制方法及电子设备
CN117893025B (zh) 一种基于综合布线装置的布线管理方法及系统
CN115936355A (zh) 工单匹配方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination