CN114240499A - 基于人工智能的数据分析方法、装置、设备及存储介质 - Google Patents
基于人工智能的数据分析方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114240499A CN114240499A CN202111553863.8A CN202111553863A CN114240499A CN 114240499 A CN114240499 A CN 114240499A CN 202111553863 A CN202111553863 A CN 202111553863A CN 114240499 A CN114240499 A CN 114240499A
- Authority
- CN
- China
- Prior art keywords
- cell
- target
- price
- data
- artificial intelligence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007405 data analysis Methods 0.000 title claims abstract description 58
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 37
- 238000004458 analytical method Methods 0.000 claims abstract description 67
- 238000004364 calculation method Methods 0.000 claims description 23
- 239000013598 vector Substances 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 6
- 230000006872 improvement Effects 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Biology (AREA)
- Marketing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及人工智能技术领域,公开了一种基于人工智能的数据分析方法、装置、设备及存储介质,其中方法包括:确认待分析房屋所在目标小区,并获取目标小区的目标基础信息;根据目标基础信息查询与目标小区相似的多个参考小区;获取每个参考小区的画像信息,并将每个参考小区的画像信息分别输入至预先训练好的数据分析模型,得到每个小区的价格分析数据;根据价格分析数据,结合预设规则计算得到目标小区的目标价格数据。通过上述方式,本发明能够在不依赖小区周边环境的情况下对小区的住房价格进行高准确率的预测。
Description
技术领域
本申请涉及人工智能技术领域,特别是涉及一种基于人工智能的数据分析方法、装置、设备及存储介质。
背景技术
在传统评估行业,通常会面对的一个难题是,如果某个小区挂牌成交不活跃,可能长达一到两年没有挂牌和成交案例可以作为参考,在信息缺乏的情况下,人工较难对房屋开展有效的评估。针对这种案例缺乏的评估单,传统估价师一般采用周边小区价格拟合的方法,即用周边有案例的小区价格对无案例小区价格进行估计。
目前,对房屋价格的分析都是基于人工来实现,其需要具备丰富经验的人员根据自身经验对房屋的相关信息做出分析,然后给房屋标定价格,其过程需要耗费大量精力去了解大量相关房屋信息才能做出较高准确度地判断,难以快速确定房价。然后即使借住计算机处理,也只能实现对房屋相关信息的统计,例如,同小区房屋或周边小区房屋的历史成交价格,然后以此作为目标房屋价格,其中缺乏对房屋相关信息的合理分析,使得得到的结论不够理想,分析方式过于刻板、不够灵活。
发明内容
本申请提供一种基于人工智能的数据分析方法、装置、设备及存储介质,以解决现有房屋价格分析方式耗费人力且准确率低的问题。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种基于人工智能的数据分析方法,包括:确认待分析房屋所在目标小区,并获取目标小区的目标基础信息;根据目标基础信息查询与目标小区相似的多个参考小区;获取每个参考小区的画像信息,并将每个参考小区的画像信息分别输入至预先训练好的数据分析模型,得到每个小区的价格分析数据;根据价格分析数据,结合预设规则计算得到目标小区的目标价格数据。
作为本申请的进一步改进,根据目标基础信息查询与目标小区相似的多个参考小区,包括:获取目标小区的目标基础信息,并将目标基础信息转换为目标特征向量;获取预设区域内每个小区的当前基础信息,并将每个当前基础信息转换为当前特征向量;计算目标特征向量与每个当前特征向量之间的相似度;筛选相似度达到预设要求的小区作为参考小区。
作为本申请的进一步改进,当达到预设要求的小区数目低于预设阈值时,将相似度最高的小区作为唯一参考小区,并以唯一参考小区的价格分析数据作为目标小区的目标价格数据。
作为本申请的进一步改进,根据价格分析数据,结合预设规则计算得到目标小区的目标价格数据,包括:根据相似度从高至低对所有参考小区进行降序排序;选取排列在前预设数量个参考小区对应的当前价格分析数据,并计算当前价格分析数据的平均值,再将平均值作为目标小区的目标价格数据。
作为本申请的进一步改进,根据价格分析数据,结合预设规则计算得到目标小区的目标价格数据,包括:根据参考小区与目标小区的相似度计算每个参考小区的权重;根据权重对参考小区的价格分析数据进行加权计算,得到目标小区的目标价格数据。
作为本申请的进一步改进,根据价格分析数据,结合预设规则计算得到目标小区的目标价格数据,包括:根据相似度从高至低对所有参考小区进行降序排序;选取排列在前预设数量个参考小区,并结合选取的参考小区的相似度计算选取的参考小区的权重;根据权重对参考小区的价格分析数据进行加权计算,得到目标小区的目标价格数据。
作为本申请的进一步改进,基础信息包括小区建成年份、小区楼龄、小区物业费、小区绿化率、小区板块、小区POI、小区容积率和小区经纬度;小区画像信息包括小区建成年份、小区楼龄、小区物业费、小区绿化率、小区板块、小区POI、小区容积率、小区经纬度、小区历史挂牌均价和小区历史成交均价。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种基于人工智能的数据分析装置,包括:获取模块,用于确认待分析房屋所在目标小区,并获取目标小区的目标基础信息;查询模块,用于根据目标基础信息查询与目标小区相似的多个参考小区;分析模块,用于获取每个参考小区的画像信息,并将每个参考小区的画像信息分别输入至预先训练好的数据分析模型,得到每个小区的价格分析数据;计算模块,用于根据价格分析数据,结合预设规则计算得到目标小区的目标价格数据。
为解决上述技术问题,本申请采用的再一个技术方案是:提供一种计算机设备,所述计算机设备包括处理器、与所述处理器耦接的存储器,所述存储器中存储有程序指令,所述程序指令被所述处理器执行时,使得所述处理器执行如上述中任一项所述的基于人工智能的数据分析方法的步骤。
为解决上述技术问题,本申请采用的再一个技术方案是:提供一种存储介质,存储有能够实现上述基于人工智能的数据分析方法的程序指令。
本申请的有益效果是:本申请的基于人工智能的数据分析方法通过根据房屋所在目标小区的基础信息来确认与目标小区相似的多个参考小区,再利用数据分析模型来根据参考小区的画像信息进行预测,得到每个参考小区的价格分析数据,再结合多个价格分析数据来计算目标小区的目标价格数据,其利用小区的基础信息来匹配相似的小区,而不局限于小区周边的小区,降低附近小区差异化带来的影响,并且,其对目标价格数据的预测不再局限于小区的历史挂牌价格和历史成交价格,使得对于无挂牌或成交案例的小区也能够得到准确的数据分析,提高了最终预测的准确性。
附图说明
图1是本发明第一实施例的基于人工智能的数据分析方法的流程示意图;
图2是本发明第二实施例的基于人工智能的数据分析方法的流程示意图;
图3是本发明第三实施例的基于人工智能的数据分析方法的流程示意图;
图4是本发明实施例的基于人工智能的数据分析装置的功能模块示意图;
图5是本发明实施例的计算机设备的结构示意图;
图6是本发明实施例的存储介质的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请中的术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。本申请实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
图1是本发明第一实施例的基于人工智能的数据分析方法的流程示意图。需注意的是,若有实质上相同的结果,本发明的方法并不以图1所示的流程顺序为限。如图1所示,该方法包括步骤:
步骤S101:确认待分析房屋所在目标小区,并获取目标小区的目标基础信息。
具体地,用户可通过客户端提交小区房屋的价格评估请求,在接收到该评估请求后,用户可根据房屋的地址信息确认该待分析房屋所在的小区,并将该小区作为目标小区,再获取该目标小区的目标基础信息。
需要说明的是,所述基础信息包括小区建成年份、小区楼龄、小区物业费、小区绿化率、小区板块、小区POI、小区容积率和小区经纬度。
需要理解的是,小区房屋的均价通常与小区的建成时间、小区的物业服务、小区的环境、小区所在地理位置的交通情况等信息息息相关,因此,该基础信息能够充分反馈小区自身具备的特性,其可作为与其他小区进行区分的特征信息,通过该基础信息,可实现对小区之间相似性的评估。
步骤S102:根据目标基础信息查询与目标小区相似的多个参考小区。
具体地,在确认目标小区的目标基础信息后,利用该目标基础信息来查询与目标小区相似的参考小区,通过比对两个小区之间的基础信息来确认两个小区之间的相似性。需要说明的是,本实施例中,在查询参考小区时,还需对查询参考小区的区域范围进行一定的限定,例如,该区域范围可以为以目标小区为中,以预设距离为半径的范围。进一步的,在一些实施例中,在限定该区域范围时,可以限定为同一个市级区域或同一个区级区域,需要理解的是,该区域范围不需要是以目标小区为中心的一定范围内,在同一市级区域或同一区级区域范围内的小区均可参与查询,而该种方式的限定使得对参考小区的查询不再局限于目标小区周围,可供查询的小区数量更多,进而可以使得最终查询到的结果更为准确。
进一步的,在一些实施例中,步骤S102具体包括:
1、获取目标小区的目标基础信息,并将目标基础信息转换为目标特征向量;
2、获取预设区域内每个小区的当前基础信息,并将每个当前基础信息转换为当前特征向量;
具体地,为了方便计算小区之间的相似度,通过将小区的基础信息转换为特征向量,再利用特征向量来计算两者之间的相似性。
3、计算目标特征向量与每个当前特征向量之间的相似度;
具体地,相似度就是比较两个对象之间的相似性,一般通过计算对象的特征之间的距离,如果距离小,那么相似度大;如果距离大,那么相似度小。其中,该距离可以是曼哈顿距离、欧式距离、余弦距离、汉明距离、马氏距离等距离中的一种。本实施例中,以欧式距离为例进行说明,欧式距离的计算公式为:
其中,X、Y分别表示两个对象,dist(X,Y)表示X、Y之间的欧式距离,xi表示X的特征向量,yi表示Y的特征向量,p为预设参数。
本实施例中,通过目标小区的目标特征向量和参考小区的当前特征向量计算得到目标小区与参考小区之间的相似度。
需要理解的是,本实施例对小区间相似度的计算方式不做限定。
4、筛选相似度达到预设要求的小区作为参考小区。
具体地,该预设要求预先设置。在一些实施例中,该预设要求可以为相似度阈值达到预设阈值,该预设阈值预先设置,通过设置预设阈值,即可过滤掉选取的小区中与目标小区相似程度较低的小区,避免影响最终的预测结果准确性。在另一些实施例中,该预设要求可以为从所有小区中选取一定比例的小区作为参考小区,该比例预先设定,具体地,本实施例中,对于参与计算的小区的数量未作限定,当参与计算的小区的数量过多或过少时,利用预设阈值的选取方式均可能会导致选取出的参考小区的数量过多或过少,当数量过多时,会大大增加后续数据分析模型的计算量,当数量过少时,会导致最终计算的结果不够准确,因此,本实施例中可以从所有小区中选取一定比例的小区作为参考小区来进行计算。
进一步的,筛选相似度达到预设要求的小区作为参考小区的过程中,当达到预设要求的小区数目低于预设阈值时,将相似度最高的小区作为唯一参考小区,并以唯一参考小区的价格分析数据作为目标小区的目标价格数据。
具体地,当达到预设要求的小区数目过低时,数据量过少,会导致最终计算的结果不够准确,因此还可以直接以与目标小区相似性最高的参考小区的价格分析数据作为目标小区的目标价格数据。
步骤S103:获取每个参考小区的画像信息,并将每个参考小区的画像信息分别输入至预先训练好的数据分析模型,得到每个小区的价格分析数据。
进一步的,所述小区画像信息包括小区建成年份、小区楼龄、小区物业费、小区绿化率、小区板块、小区POI、小区容积率、小区经纬度、小区历史挂牌均价和小区历史成交均价。
具体地,在确定参考小区后,再次获取每个参考小区的画像信息,再将该画像信息分别输入至数据分析模型,通过数据分析模型预测得到每个小区的价格分析数据。
优选地,该数据分析模型优选采用XGBoost算法来实现,该数据分析模型预先训练得到,本实施例中,构建训练集和测试集对该数据分析模型进行训练,具体以训练集和小区的实际目标价格数据对数据分析模型进行训练,训练后以测试集对数据分析模型进行测试,直至数据分析模型的精度达到预设阈值或者是训练次数达到预设次数时为止。
步骤S104:根据价格分析数据,结合预设规则计算得到目标小区的目标价格数据。
具体地,在预测得到的各个参考小区的价格分析数据后,根据各个参考小区的价格分析数据进行计算,从而得到目标小区的目标价格数据。例如,可以计算各个参考小区的价格分析数据的均价,以该均价作为目标小区的目标价格数据。
本发明第一实施例的基于人工智能的数据分析方法通过根据房屋所在目标小区的基础信息来确认与目标小区相似的多个参考小区,再利用数据分析模型来根据参考小区的画像信息进行预测,得到每个参考小区的价格分析数据,再结合多个价格分析数据来计算目标小区的目标价格数据,其利用小区的基础信息来匹配相似的小区,而不局限于小区周边的小区,降低附近小区差异化带来的影响,并且,其对目标价格数据的预测不再局限于小区的历史挂牌价格和历史成交价格,使得对于无挂牌或成交案例的小区也能够得到准确的数据分析,提高了最终预测的准确性。
图2是本发明第二实施例的基于人工智能的数据分析方法的流程示意图。需注意的是,若有实质上相同的结果,本发明的方法并不以图2所示的流程顺序为限。如图2所示,该方法包括步骤:
步骤S201:确认待分析房屋所在目标小区,并获取目标小区的目标基础信息。
在本实施例中,图2中的步骤S201和图1中的步骤S101类似,为简约起见,在此不再赘述。
步骤S202:根据目标基础信息查询与目标小区相似的多个参考小区。
在本实施例中,图2中的步骤S202和图1中的步骤S102类似,为简约起见,在此不再赘述。
步骤S203:获取每个参考小区的画像信息,并将每个参考小区的画像信息分别输入至预先训练好的数据分析模型,得到每个小区的价格分析数据。
在本实施例中,图2中的步骤S203和图1中的步骤S103类似,为简约起见,在此不再赘述。
步骤S204:根据相似度从高至低对所有参考小区进行降序排序。
步骤S205:选取排列在前预设数量个参考小区对应的当前价格分析数据,并计算当前价格分析数据的平均值,再将平均值作为目标小区的目标价格数据。
在步骤S204~步骤S205中,在得到参考小区的相似度之后,将参考小区按相似度从高至低排列,再选取排列在前预设数量个的参考小区对应的当且价格分析数据,再计算这些选取出的参考小区的当前价格分析数据的平均值,以该平均值作为目标小区的目标价格数据。
本发明第二实施例的基于人工智能的数据分析方法在第一实施例的基础上,通过在获取到参考小区的相似度之后,以该相似度选取与目标小区相似度最高的预设数量个参考小区的当前价格分析数据来计算目标小区的目标价格数据,其更为有效地过滤掉了与目标小区相似度低的参考小区,进而提升最终预测结果的准确性。
图3是本发明第三实施例的基于人工智能的数据分析方法的流程示意图。需注意的是,若有实质上相同的结果,本发明的方法并不以图3所示的流程顺序为限。如图3所示,该方法包括步骤:
步骤S301:确认待分析房屋所在目标小区,并获取目标小区的目标基础信息。
在本实施例中,图3中的步骤S301和图1中的步骤S101类似,为简约起见,在此不再赘述。
步骤S302:根据目标基础信息查询与目标小区相似的多个参考小区。
在本实施例中,图3中的步骤S302和图1中的步骤S102类似,为简约起见,在此不再赘述。
步骤S303:获取每个参考小区的画像信息,并将每个参考小区的画像信息分别输入至预先训练好的数据分析模型,得到每个小区的价格分析数据。
在本实施例中,图3中的步骤S303和图1中的步骤S103类似,为简约起见,在此不再赘述。
步骤S304:根据参考小区与目标小区的相似度计算每个参考小区的权重。
具体地,在得到每个参考小区的相似度后,以每个参考小区的相似度总和与每个参考小区的相似度计算得到每个参考小区的权重,该权重=每个参考小区的相似度/每个参考小区的相似度总和。
步骤S305:根据权重对参考小区的价格分析数据进行加权计算,得到目标小区的目标价格数据。
具体地,在得到每个参考小区的权重后,对每个参考小区的价格分析数据按权重进行加权计算,并将加权计算的结果作为目标小区的最终的目标价格数据。
本发明第三实施例的基于人工智能的数据分析方法在第一实施例的基础上,通过结合参考小区与目标小区的相似度确定各个参考小区的权重,再以该权重结合参考小区的价格分析数据进行加权计算,将得到的结果作为目标小区的目标价格数据,该加权计算的方式使得最终预测的结果更为准确。
进一步的,在一些实施例中,该步骤S104还可以为:
1、根据相似度从高至低对所有参考小区进行降序排序。
2、选取排列在前预设数量个参考小区,并结合选取的参考小区的相似度计算选取的参考小区的权重。
3、根据权重对参考小区的价格分析数据进行加权计算,得到目标小区的目标价格数据。
本实施例一方面选取的是与目标小区相似度最高的预设数量个参考小区,另一方面是结合参考小区与目标小区的相似度确定各个参考小区的权重,再以选取出的参考小区对应的权重计算得到目标小区的目标价格数据,从而使得最终预测结果更为准确。
图4是本发明实施例的基于人工智能的数据分析装置的功能模块示意图。如图4所示,该基于人工智能的数据分析装置40包括获取模块41、查询模块42、分析模块43和计算模块44。
获取模块41,用于确认待分析房屋所在目标小区,并获取目标小区的目标基础信息;
查询模块42,用于根据目标基础信息查询与目标小区相似的多个参考小区;
分析模块43,用于获取每个参考小区的画像信息,并将每个参考小区的画像信息分别输入至预先训练好的数据分析模型,得到每个小区的价格分析数据;
计算模块44,用于根据价格分析数据,结合预设规则计算得到目标小区的目标价格数据。
可选地,查询模块42执行根据目标基础信息查询与目标小区相似的多个参考小区的操作,具体包括:获取目标小区的目标基础信息,并将目标基础信息转换为目标特征向量;获取预设区域内每个小区的当前基础信息,并将每个当前基础信息转换为当前特征向量;计算目标特征向量与每个当前特征向量之间的相似度;筛选相似度达到预设要求的小区作为参考小区。
可选地,当达到预设要求的小区数目低于预设阈值时,将相似度最高的小区作为唯一参考小区,并以唯一参考小区的价格分析数据作为目标小区的目标价格数据。
可选地,计算模块44执行根据价格分析数据,结合预设规则计算得到目标小区的目标价格数据的操作,具体包括:根据相似度从高至低对所有参考小区进行降序排序;选取排列在前预设数量个参考小区对应的当前价格分析数据,并计算当前价格分析数据的平均值,再将平均值作为目标小区的目标价格数据。
可选地,计算模块44执行根据价格分析数据,结合预设规则计算得到目标小区的目标价格数据的操作,具体包括:根据参考小区与目标小区的相似度计算每个参考小区的权重;根据权重对参考小区的价格分析数据进行加权计算,得到目标小区的目标价格数据。
可选地,计算模块44执行根据价格分析数据,结合预设规则计算得到目标小区的目标价格数据的操作,具体包括:根据相似度从高至低对所有参考小区进行降序排序;选取排列在前预设数量个参考小区,并结合选取的参考小区的相似度计算选取的参考小区的权重;根据权重对参考小区的价格分析数据进行加权计算,得到目标小区的目标价格数据。
可选地,基础信息包括小区建成年份、小区楼龄、小区物业费、小区绿化率、小区板块、小区POI、小区容积率和小区经纬度;
小区画像信息包括小区建成年份、小区楼龄、小区物业费、小区绿化率、小区板块、小区POI、小区容积率、小区经纬度、小区历史挂牌均价和小区历史成交均价。
关于上述实施例基于人工智能的数据分析装置中各模块实现技术方案的其他细节,可参见上述实施例中的基于人工智能的数据分析方法中的描述,此处不再赘述。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
请参阅图5,图5为本发明实施例的计算机设备的结构示意图。如图5所示,该计算机设备50包括处理器51及和处理器51耦接的存储器52,存储器52中存储有程序指令,程序指令被处理器51执行时,使得处理器51执行上述任一实施例所述的基于人工智能的数据分析方法的步骤。
其中,处理器51还可以称为CPU(Central Processing Unit,中央处理单元)。处理器51可能是一种集成电路芯片,具有信号的处理能力。处理器51还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
参阅图6,图6为本发明实施例的存储介质的结构示意图。本发明实施例的存储介质存储有能够实现上述所有方法的程序指令61,其中,该程序指令61可以以软件产品的形式存储在上述存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,或者是计算机、服务器、手机、平板等计算机设备设备。
在本申请所提供的几个实施例中,应该理解到,所揭露的计算机设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。以上仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种基于人工智能的数据分析方法,其特征在于,包括:
确认待分析房屋所在目标小区,并获取所述目标小区的目标基础信息;
根据所述目标基础信息查询与所述目标小区相似的多个参考小区;
获取每个参考小区的画像信息,并将每个所述参考小区的画像信息分别输入至预先训练好的数据分析模型,得到每个小区的价格分析数据;
根据所述价格分析数据,结合预设规则计算得到所述目标小区的目标价格数据。
2.根据权利要求1所述的基于人工智能的数据分析方法,其特征在于,所述根据所述目标基础信息查询与所述目标小区相似的多个参考小区,包括:
获取所述目标小区的目标基础信息,并将所述目标基础信息转换为目标特征向量;
获取所述预设区域内每个小区的当前基础信息,并将每个所述当前基础信息转换为当前特征向量;
计算所述目标特征向量与每个所述当前特征向量之间的相似度;
筛选所述相似度达到预设要求的小区作为所述参考小区。
3.根据权利要求2所述的基于人工智能的数据分析方法,其特征在于,当达到预设要求的小区数目低于预设阈值时,将相似度最高的小区作为唯一参考小区,并以所述唯一参考小区的价格分析数据作为所述目标小区的目标价格数据。
4.根据权利要求1所述的基于人工智能的数据分析方法,其特征在于,所述根据所述价格分析数据,结合预设规则计算得到所述目标小区的目标价格数据,包括:
根据所述相似度从高至低对所有参考小区进行降序排序;
选取排列在前预设数量个参考小区对应的当前价格分析数据,并计算所述当前价格分析数据的平均值,再将所述平均值作为所述目标小区的目标价格数据。
5.根据权利要求1所述的基于人工智能的数据分析方法,其特征在于,所述根据所述价格分析数据,结合预设规则计算得到所述目标小区的目标价格数据,包括:
根据所述参考小区与所述目标小区的相似度计算每个参考小区的权重;
根据所述权重对所述参考小区的价格分析数据进行加权计算,得到所述目标小区的目标价格数据。
6.根据权利要求1所述的基于人工智能的数据分析方法,其特征在于,所述根据所述价格分析数据,结合预设规则计算得到所述目标小区的目标价格数据,包括:
根据所述相似度从高至低对所有参考小区进行降序排序;
选取排列在前预设数量个参考小区,并结合选取的参考小区的相似度计算选取的参考小区的权重;
根据所述权重对所述参考小区的价格分析数据进行加权计算,得到所述目标小区的目标价格数据。
7.根据权利要求1所述的基于人工智能的数据分析方法,其特征在于,所述基础信息包括小区建成年份、小区楼龄、小区物业费、小区绿化率、小区板块、小区POI、小区容积率和小区经纬度;
所述小区画像信息包括小区建成年份、小区楼龄、小区物业费、小区绿化率、小区板块、小区POI、小区容积率、小区经纬度、小区历史挂牌均价和小区历史成交均价。
8.一种基于人工智能的数据分析装置,其特征在于,包括:
获取模块,用于确认待分析房屋所在目标小区,并获取所述目标小区的目标基础信息;
查询模块,用于根据所述目标基础信息查询与所述目标小区相似的多个参考小区;
分析模块,用于获取每个参考小区的画像信息,并将每个所述参考小区的画像信息分别输入至预先训练好的数据分析模型,得到每个小区的价格分析数据;
计算模块,用于根据所述价格分析数据,结合预设规则计算得到所述目标小区的目标价格数据。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器、与所述处理器耦接的存储器,所述存储器中存储有程序指令,所述程序指令被所述处理器执行时,使得所述处理器执行如权利要求1-7中任一项权利要求所述的基于人工智能的数据分析方法的步骤。
10.一种存储介质,其特征在于,存储有能够实现如权利要求1-7中任一项所述的基于人工智能的数据分析方法的程序指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111553863.8A CN114240499A (zh) | 2021-12-17 | 2021-12-17 | 基于人工智能的数据分析方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111553863.8A CN114240499A (zh) | 2021-12-17 | 2021-12-17 | 基于人工智能的数据分析方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114240499A true CN114240499A (zh) | 2022-03-25 |
Family
ID=80758268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111553863.8A Pending CN114240499A (zh) | 2021-12-17 | 2021-12-17 | 基于人工智能的数据分析方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114240499A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116229318A (zh) * | 2023-02-24 | 2023-06-06 | 云贵亮 | 基于分向数据的信息解析系统 |
-
2021
- 2021-12-17 CN CN202111553863.8A patent/CN114240499A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116229318A (zh) * | 2023-02-24 | 2023-06-06 | 云贵亮 | 基于分向数据的信息解析系统 |
CN116229318B (zh) * | 2023-02-24 | 2023-09-22 | 湖北联投咨询管理有限公司 | 基于分向数据的信息解析系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111327377B (zh) | 场强预测方法、装置、设备及存储介质 | |
CN109635056B (zh) | 用电地址数据处理方法、装置、计算机设备和存储介质 | |
WO2021208079A1 (zh) | 获取动力电池寿命数据的方法、装置、计算机设备及介质 | |
CN111726765B (zh) | 一种面向大规模复杂场景的wifi室内定位方法及系统 | |
CN112069281B (zh) | 兴趣点位置的确定方法、装置、计算机设备及存储介质 | |
CN110492480A (zh) | 配电网拓扑识别方法、装置、计算机设备和可读存储介质 | |
CN109165309B (zh) | 负例训练样本采集方法、装置及模型训练方法、装置 | |
CN111757464B (zh) | 一种区域轮廓提取方法及装置 | |
CN107995682B (zh) | 无线接入点定位方法、装置、电子设备及存储介质 | |
CN106776925B (zh) | 一种移动终端用户性别的预测方法、服务器和系统 | |
CN103916954A (zh) | 基于wlan的概率定位方法及定位装置 | |
CN108304935A (zh) | 机器学习模型训练方法、装置和计算机设备 | |
CN114374449A (zh) | 一种干扰源确定方法、装置、设备及介质 | |
CN114240499A (zh) | 基于人工智能的数据分析方法、装置、设备及存储介质 | |
CN110348717B (zh) | 基于栅格粒度的基站价值评分方法和装置 | |
CN108680897B (zh) | 一种室内定位方法、装置、电子设备及存储介质 | |
CN110784837A (zh) | 室内定位方法、装置、介质及电子设备 | |
CN111506624B (zh) | 一种电力缺失数据辨识方法和相关装置 | |
CN109635057B (zh) | 用电业务处理方法、装置、计算机设备和存储介质 | |
CN108540926B (zh) | 一种无线信号指纹的构建方法及装置 | |
Li et al. | Validation of a probabilistic approach to outdoor localization | |
CN115190587A (zh) | Wifi位置确定方法、装置、电子设备及存储介质 | |
CN116228316A (zh) | 投放选址的确定方法、装置、电子设备及可读存储介质 | |
CN112996011B (zh) | 小区价值评估方法、装置、计算机设备和可读存储介质 | |
CN109788431B (zh) | 一种基于相邻节点组的蓝牙定位方法、装置、设备和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |