CN116821386B - 一种基于多源异构数据结构化的单一特征评估控制方法 - Google Patents
一种基于多源异构数据结构化的单一特征评估控制方法 Download PDFInfo
- Publication number
- CN116821386B CN116821386B CN202311098851.XA CN202311098851A CN116821386B CN 116821386 B CN116821386 B CN 116821386B CN 202311098851 A CN202311098851 A CN 202311098851A CN 116821386 B CN116821386 B CN 116821386B
- Authority
- CN
- China
- Prior art keywords
- data
- evaluation
- characteristic
- feature
- source heterogeneous
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 164
- 238000000034 method Methods 0.000 title claims abstract description 40
- 239000011159 matrix material Substances 0.000 claims abstract description 53
- 238000004458 analytical method Methods 0.000 claims abstract description 44
- 238000006243 chemical reaction Methods 0.000 claims abstract description 28
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 238000010606 normalization Methods 0.000 claims abstract description 11
- 238000013507 mapping Methods 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 claims description 14
- 238000012216 screening Methods 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 9
- 238000007637 random forest analysis Methods 0.000 claims description 8
- 239000013598 vector Substances 0.000 claims description 8
- 230000008878 coupling Effects 0.000 claims description 7
- 238000010168 coupling process Methods 0.000 claims description 7
- 238000005859 coupling reaction Methods 0.000 claims description 7
- 230000007246 mechanism Effects 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 239000000470 constituent Substances 0.000 claims description 3
- 238000007405 data analysis Methods 0.000 claims description 3
- 230000009849 deactivation Effects 0.000 claims description 3
- 238000012854 evaluation process Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 230000002093 peripheral effect Effects 0.000 claims description 3
- 238000012937 correction Methods 0.000 claims description 2
- 238000004140 cleaning Methods 0.000 abstract description 2
- 238000007781 pre-processing Methods 0.000 abstract description 2
- 230000010354 integration Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000009435 building construction Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000011157 data evaluation Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于多源异构数据结构化的单一特征评估控制方法,包括:根据具有矩阵特征时空数据的评估参数进行结构化线性化数据目标提取;基于预设的转换逻辑对多源异构数据的空间物理结构、业务逻辑关系和时序应用功能进行解析,得到具有特征标签的评估属性解析数据包;根据具评估属性解析数据包进行非线性解耦与非结构二叉树分层,得到多于三个具有解析特性的评估因子;对特征评估因子依次进行归一化处理和拉普拉斯特征映射,得到低维解耦方阵;根据低维解耦方阵进行要素提取得到测评要素;根据测评要素对具有矩阵特征时空数据的项目进行评估和控制。本发明能够解决海量非清洗数据的预处理能力,提高非线性非结构化数据的单一指标评估效率。
Description
技术领域
本发明涉及数据处理及评估技术领域,特别是涉及一种基于多源异构数据结构化的单一特征评估控制方法。
背景技术
具有矩阵特征时空数据是在项目确定之后,用户和设计人员对数据库所涉及的内容和功能的整理和描述。具有矩阵特征时空数据是后续设计及实现项目的基础,以后的数据库设计都会以此为基础。
由于数据来源不同,其编码方式和命名规则都各不相同。为了能够充分利用各类数据,需要将不同来源的数据之间建立关联,使零散的数据成为相连的整体,从而发挥其更大的使用价值。这种建立不同来源数据之间关联的过程即是多源数据集成,通俗来讲也叫数据匹配,是数据处理工作的重要环节。
但是目前现有技术中,由于数据来源的方式差异巨大,缺乏针对性的规则制定,数据来源随机性强,从而使得对应的项目的具有矩阵特征时空数据的效率低下,置信度不足。
发明内容
为了克服现有技术的不足,本发明的目的是提供一种基于多源异构数据结构化的单一特征评估控制方法。
为实现上述目的,本发明提供了如下方案:
一种基于多源异构数据结构化的单一特征评估控制方法,包括:
获取预设的具有矩阵特征时空数据的评估参数;
根据所述评估参数进行结构化线性化数据目标提取,得到归一化后的单一特征评估指标;
基于预设的转换逻辑对多源异构数据的空间物理结构、业务逻辑关系和时序应用功能进行解析,得到具有特征标签的评估属性解析数据包;
根据所述具有特征标签的评估属性解析数据包进行非线性解耦与非结构二叉树分层,得到多于三个具有解析特性的评估因子;
对所述特征评估因子依次进行归一化处理和拉普拉斯特征映射,得到低维解耦方阵;
基于归一化后的单一特征评估指标,所述根据所述低维解耦方阵进行要素提取,得到测评要素;
根据所述测评要素对具有矩阵特征时空数据的项目进行评估和控制。
优选地,所述评估参数包括:地产信息、交通信息和周边配套信息;所述地产信息包括区域位置、土地利用率、抵押情况、商铺预售占比、库存占比、年均滞销率、去化周期、价格波动率。
优选地,根据所述评估参数进行结构化线性化数据目标提取,得到归一化后的单一特征评估指标,包括:
通过随机森林算法获取各评估参数的指标权重值;
根据各所述评估参数对应的指标权重值,从所述评估参数中筛选用于进行评估控制的所述归一化后的单一特征评估指标。
优选地,基于预设的转换逻辑对多源异构数据的空间物理结构、业务逻辑关系和时序应用功能进行解析,得到具有特征标签的评估属性解析数据包,包括:
基于预设的转换逻辑对多源异构数据进行数据转换,得到转换后的待解析数据;
按照所述空间物理结构、所述业务逻辑关系和所述时序应用功能分别对所述待解析数据进行标注,得到标注数据;
根据标注数据进行数据解析,得到具有特征标签的评估属性解析数据包。
优选地,根据所述具有特征标签的评估属性解析数据包进行非线性解耦与非结构二叉树分层,得到多于三个具有解析特性的评估因子,包括:
基于所述具有特征标签的评估属性解析数据包分析自动具有矩阵特征时空数据的项目的层级耦合机理;
根据所述层级耦合机理建立具有矩阵特征时空数据的项目的多变量控制系统;所述多变量控制系统包括解耦变量配对关系;
根据所述多变量控制系统设计逆系统;
根据所述逆系统对所述多变量控制系统进行层级解耦,得到构成要素间的影响关系;
根据所述影响关系提取特征评估因子。
优选地,对所述特征评估因子依次进行归一化处理和拉普拉斯特征映射,得到低维解耦方阵,包括:
将各个所述特征评估因子统一至预设区间内,得到各个测评要素的归一化值;
根据所述归一化值确定数据谱图;所述数据谱图中的各个数据点为所述归一化值对应的所述测评要素;
针对每个数据点,将距离所述数据点最近的K个点进行连接;K为预设值;
根据所述数据点的连接线,确定数据点之间的权重;
根据所述权重确定拉普拉斯矩阵的特征向量与特征值;
根据所述特征向量与所述特征值得到所述低维解耦方阵。
优选地,所述基于归一化后的单一特征评估指标,根据所述低维解耦方阵进行要素提取,得到测评要素
针对任一所述归一化后的单一特征评估指标,计算所述低维解耦方阵中的元素与所述归一化后的单一特征评估指标的相似度;
根据所述相似度和预设阈值对所述低维解耦方阵中的元素进行筛选,得到所述测评要素。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供了一种基于多源异构数据结构化的单一特征评估控制方法,包括:获取预设的具有矩阵特征时空数据的评估参数;根据所述评估参数进行结构化线性化数据目标提取,得到归一化后的单一特征评估指标;基于预设的转换逻辑对多源异构数据的空间物理结构、业务逻辑关系和时序应用功能进行解析,得到具有特征标签的评估属性解析数据包;根据所述具有特征标签的评估属性解析数据包进行非线性解耦与非结构二叉树分层,得到多于三个具有解析特性的评估因子;对所述特征评估因子依次进行归一化处理和拉普拉斯特征映射,得到低维解耦方阵;基于归一化后的单一特征评估指标,所述根据所述低维解耦方阵进行要素提取,得到测评要素;根据所述测评要素对具有矩阵特征时空数据的项目进行评估和控制。本发明能够解决海量非清洗数据的预处理能力,和提高非线性非结构化数据的单一指标评估效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于多源异构数据结构化的单一特征评估控制方法,能够提高数据评估的效率。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明实施例提供的方法流程图,如图1所示,本发明提供了一种基于多源异构数据结构化的单一特征评估控制方法,包括:
步骤100:获取预设的具有矩阵特征时空数据的评估参数;
步骤200:根据所述评估参数进行结构化线性化数据目标提取,得到归一化后的单一特征评估指标;
步骤300:基于预设的转换逻辑对多源异构数据的空间物理结构、业务逻辑关系和时序应用功能进行解析,得到具有特征标签的评估属性解析数据包;
步骤400:根据所述具有特征标签的评估属性解析数据包进行非线性解耦与非结构二叉树分层,得到多于三个具有解析特性的评估因子;
步骤500:对所述特征评估因子依次进行归一化处理和拉普拉斯特征映射,得到低维解耦方阵;
步骤600:基于归一化后的单一特征评估指标,所述根据所述低维解耦方阵进行要素提取,得到测评要素;
步骤700:根据所述测评要素对具有矩阵特征时空数据的项目进行评估和控制。
优选地,所述评估参数包括:地产信息、交通信息和周边配套信息;所述地产信息包括区域位置、土地利用率、抵押情况、商铺预售占比、库存占比、年均滞销率、去化周期、价格波动率。
具体的,本实施例中公开了多种评估参数,其中交通信息主要包括评估目标的周边的各个交通要素,包括地铁数据、公交数据、历史车流量数据和路口数据等。
优选地,根据所述评估参数进行结构化线性化数据目标提取,得到归一化后的单一特征评估指标,包括:
通过随机森林算法获取各评估参数的指标权重值;
根据各所述评估参数对应的指标权重值,从所述评估参数中筛选用于进行评估控制的所述归一化后的单一特征评估指标。
具体的,随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树,而它的本质属于机器学习的一大分支——集成学习(Ensemble Learning)方法。直观角度来解释,每棵决策树都是一个分类器(假设现在针对的是分类问题),那么对于一个输入样本,N棵树会有N个分类结果。而随机森林集成了所有的分类投票结果,将投票次数最多的类别指定为最终的输出,这就是一种最简单的Bagging思想。本实施例依据随机森林方法,能够将上述评估参数的指标权重进行确定,并根据指标权重的具体数值完成指标的筛选。
优选地,基于预设的转换逻辑对多源异构数据的空间物理结构、业务逻辑关系和时序应用功能进行解析,得到具有特征标签的评估属性解析数据包,包括:
基于预设的转换逻辑对多源异构数据进行数据转换,得到转换后的待解析数据;
按照所述空间物理结构、所述业务逻辑关系和所述时序应用功能分别对所述待解析数据进行标注,得到标注数据;
根据标注数据进行数据解析,得到具有特征标签的评估属性解析数据包。
具体的,由于数据来源不同,其编码方式和命名规则都各不相同。为了能够充分利用各类数据,我们需要将不同来源的数据之间建立关联,使零散的数据成为相连的整体,从而发挥其更大的使用价值。这种建立不同来源数据之间关联的过程即是多源数据集成,通俗来讲也叫数据匹配,是数据处理工作的重要环节。
本实施例中主要采用计算机自动匹配和人工匹配两种方式。计算机自动匹配主要是通过发现两种数据间特定的对应规律,将其内化为具体的计算机程序来实现匹配。根据匹配精度的不同,分为完全匹配和模糊匹配。当两种数据间的对应规律不明显或者毫无规律,无法内化为具体的计算机程序去自动匹配时,需要借由人工判断完成匹配,这种匹配过程叫人工匹配。
一般来讲,计算机自动匹配效率高,匹配过程可控,匹配结果较为准确,而人工匹配效率较低,匹配过程可控性较低,匹配结果准确度因人为判断依据的不同而不尽相同,但人工匹配仍然是数据匹配中非常重要的一环,是对计算机自动匹配最有效的补充。
首先,本实施例进行了属性集成,属性集成主要是基于属性数据进行数据集成,因此不需考虑数据的空间位置,而只需关注属性值的吻合程度。在地产领域的评估中,具体在租赁价格评估中,属性集成主要指的是产权登记数据与预售备案数据、二手房交易数据、个案评估数据、挂牌数据等的关联。
在租赁价格评估中,商品房对象来源于在产权登记中心作房屋产权登记的数据,因此在建立不同来源数据间的联系时,以产权登记数据为核心,建立起产权登记数据与交易案例之间、与租赁价格数据之间、与个案评估数据之间、与挂牌租赁价格数据之间以及与建筑物普查数据之间的联系。
其次,本实施例进行了空间集成,空间集成是以GIS技术为手段,根据不同数据之间的空间拓扑关系来完成。在租赁价格评估实践中,空间集成主要指的是利用房屋建筑的图层与其他级别的区域图层(如行政区、街道、社区、规划分区、评估分区等)来实现房屋建筑与区域的关联。由于已将产权登记楼栋与相应的房屋建筑相对应,而前面已经将产权登记楼栋与相关租赁价格数据进行了属性关联,那么当完成产权登记楼栋与区域的空间关联后,相关租赁价格数据也就实现了与空间区域的关联,因此在空间范围内可以实现各类租赁价格数据的分析。
再次,本实施例中对多源异构数据进行了数据转换,数据转换是将数据从一种表现形式变为另一种表现形式的过程,通过转换,可以确保不同的源数据在语义上的一致性,包括数据格式转换、数据类型转换以及数据内容转换。数据格式转换是指将不同格式的数据文件转换成统一的数据格式类型,如将Excel、Access、Oracle文件类型统一转换成Oracle格式在统一的数据库平台中使用。数据类型转换是指同一属性在不同的数据格式中,由于其数据类型(如文本型、数值型、日期型)不一致,需统一数据类型的转换,如楼层属性,有文本型和数值型,在评估中需要将文本型统一为数值型。数据内容转换将不同表现形式的数据转换为指定规则的标准化信息,使其能直接被计算机程序识别和应用。数据内容转换是本实施例中数据转换的重点,也是租赁价格评估数据处理工作中的重要环节。
由于原始属性数据表达缺乏规范性要求,属性值为不规范的描述性信息,因此要将租赁价格评估过程中的关键属性进行数据内容转换,如物业名称、户型、物业类型等属性。数据内容转换就是通过建立规则,对数据进行合并、清理和整合。
本实施例中还对多源异构数据进行了空间操作,其是对空间数据进行分析操作的统称,根据作用的数据性质不同,可以分为:基于空间图形数据的操作:如地图矢量化、坐标变换、图形拼接、空间量算、缓冲区分析、叠加分析、网络分析等;基于非空间属性的操作:如基于非空间属性的逻辑运算和数理统计分析等;空间和非空间数据的联合操作:如空间与非空间数据的属性关联等。
①为了精细化评估的需要,本实施例在多源异构的房地产数据处理中采用GIS矢量化工具对影响房地产租赁价格的重要地物要素进行了矢量化处理,如对地铁站点、星级酒店、建筑物基底边界等进行矢量化处理,以便于进行空间分析和量算。对于空间地物要素的矢量化类型根据地物要素特点和评估需要而定,如地铁站点可矢量化为点要素,建筑物可矢量化为多边形要素,道路可以矢量化为线要素等。
②坐标变换:在评估过程中对栅格数据和矢量数据进行坐标变换,栅格数据利用GIS的空间配准工具进行坐标变换,矢量数据利用GIS的空间校正工具进行坐标变换。不论采用哪种方法进行坐标变换,都是为了使得空间数据具有一致的空间坐标系统,以便于对空间数据进行统一的处理和分析。
③图形拼接:是指按照空间位置关系,将若干幅地图拼接成一套整幅的地图,以便于从整体上对数据进行分析。评估主要是对遥感影像数据进行图形拼接,使得分幅采集的影像数据成为整体。
④空间量算:主要包括距离量算、周长量算和面积量算。通过空间量算,可以便捷地获取房地产之间的距离,如可利用距离量算获取房地产与地铁站点之间的直线距离等。
⑤缓冲区分析:是以某一个点(线或者面)为中心,以某一距离为半径,围绕地图要素形成具有一定范围的多边形实体。该方法在空间案例选择、房地产租赁价格影响因素分析等方面非常有用。例如、可以基于某一个公园建立缓冲区,分析缓冲区内房地产租赁价格的分布和空间变化趋势,从而得出公园对周边房地产租赁价格的影响程度。还可以针对地铁站点进行缓冲区分析,对距离地铁站点不同范围内的房地产进行筛选、提取和处理。在评估中,主要利用缓冲区分析进行非住房房地产的空间查询、提取和影响范围分析。
⑥叠加分析:是地理信息系统中用来提取空间隐含信息的重要方法。叠加分析是将代表不同主题的各个数据层面进行叠加产生一个新的数据层面。空间叠加可以用于空间案例的选择,可以基于空间距离或范围进行交易案例的选择,要实现空间选择案例,交易案例必须要具有空间位置,基于空间位置选择交易案例对于传统的基于属性选择案例是一个非常好的补充,这使得基于区位的案例筛选可以做得更精细。
⑦空间统计:是指基于某一空间范围,统计范围内空间要素的相关信息,常用的如统计某一范围内的房地产数量、面积、租赁价格等。使用空间统计主要是基于空间数据统计房地产物业数量、面积、交易均价等,将租赁价格或数理信息与空间数据关联,综合利用各种地图符号对租赁价格信息进行渲染,使得租赁价格或数理分布与变化通过空间和颜色表现出来,一方面可以更直观的分析租赁价格的空间分布规律,另一方面通过将房地产租赁价格上图,可以更高效的进行评估结果的检验与校核。
优选地,根据所述具有特征标签的评估属性解析数据包进行非线性解耦与非结构二叉树分层,得到多于三个具有解析特性的评估因子,包括:
基于所述具有特征标签的评估属性解析数据包分析自动具有矩阵特征时空数据的项目的层级耦合机理;
根据所述层级耦合机理建立具有矩阵特征时空数据的项目的多变量控制系统;所述多变量控制系统包括解耦变量配对关系;
根据所述多变量控制系统设计逆系统;
根据所述逆系统对所述多变量控制系统进行层级解耦,得到构成要素间的影响关系;
根据所述影响关系提取特征评估因子。
具体的,本实施例中,基于专家经验法,解析具有特征标签的评估属性解析数据包的物理构成、业务逻辑关系及应用服务,分析项目评估的层级耦合机理,提出复杂环境下项目评估的动态解耦策略,实现对项目评估的层级解耦;分析其构成要素间的影响关系,分层提取测评要素。在系统充分解耦之后,对各个系统要素进行归化处理,然后基于拉普拉斯特征映射等方法进行降维处理,提取系统关键的测评要素,明确不同被测对象的测试需求。
优选地,对所述特征评估因子依次进行归一化处理和拉普拉斯特征映射,得到低维解耦方阵,包括:
将各个所述特征评估因子统一至预设区间内,得到各个测评要素的归一化值;
根据所述归一化值确定数据谱图;所述数据谱图中的各个数据点为所述归一化值对应的所述测评要素;
针对每个数据点,将距离所述数据点最近的K个点进行连接;K为预设值;
根据所述数据点的连接线,确定数据点之间的权重;
根据所述权重确定拉普拉斯矩阵的特征向量与特征值;
根据所述特征向量与所述特征值得到所述低维解耦方阵。
本实施例中将所有的特征评估因子都统一到一个大致相同的数值区间内,以便不同维度之间的特征能有一定比较性。归一化处理后将所有的特征评估因子分别作为一个点,点构建成一个图,将每个点最近的K个点连上边。K是一个预先设定的值。确定点与点之间的权重大小,选用热核函数来确定,如果点i和点j相连,那么它们关系的权重设定为:。另外一种可选的简化设定是Wjj=1如果点i,j相连,否则Wii=0。计算拉普拉斯矩阵L的特征向量与特征值:/>,其中D是对角矩阵,满足。使用最小的m个非零特征值对应的特征向量作为降维后的结果输出,得到低维方阵。
优选地,所述基于归一化后的单一特征评估指标,根据所述低维解耦方阵进行要素提取,得到测评要素
针对任一所述归一化后的单一特征评估指标,计算所述低维解耦方阵中的元素与所述归一化后的单一特征评估指标的相似度;
根据所述相似度和预设阈值对所述低维解耦方阵中的元素进行筛选,得到所述测评要素。
具体的,本实施例在得到低维解耦方阵中,通过上述方法确定的归一化后的单一特征评估指标能够对低维解耦方阵中的元素进行针对性的筛选,从而得到匹配度更高的测评要素。最后,本实施例中根据测评要素,能够实现多种项目需求的分析,并能够根据测评要素完成对于项目进程的有效监管和控制。
本发明的有益效果如下:
本发明首先要对多源异构数据进行解构,具有特征标签的评估属性解析数据包的物理构成、业务逻辑关系及时序应用功能等,提高了项目具有矩阵特征时空数据评估的针对性。且利用特征评估因子进行低维解耦,从而使得得到的特征要素更加准确,并且能够进一步地提高了项目评估的针对性和评估效率。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (6)
1.一种基于多源异构数据结构化的单一特征评估控制方法,其特征在于,包括:
获取预设的具有矩阵特征时空数据的评估参数;
根据所述评估参数进行结构化线性化数据目标提取,得到归一化后的单一特征评估指标;
基于预设的转换逻辑对多源异构数据的空间物理结构、业务逻辑关系和时序应用功能进行解析,得到具有特征标签的评估属性解析数据包;
根据所述具有特征标签的评估属性解析数据包进行非线性解耦与非结构二叉树分层,得到多于三个具有解析特性的特征评估因子;
对所述特征评估因子依次进行归一化处理和拉普拉斯特征映射,得到低维解耦方阵;
基于归一化后的单一特征评估指标,所述根据所述低维解耦方阵进行要素提取,得到测评要素;
根据所述测评要素对具有矩阵特征时空数据的项目进行评估和控制;
所述评估参数包括:地产信息、交通信息和周边配套信息;所述地产信息包括区域位置、土地利用率、抵押情况、商铺预售占比、库存占比、年均滞销率、去化周期、价格波动率;
所述基于预设的转换逻辑对多源异构数据的空间物理结构、业务逻辑关系和时序应用功能进行解析,包括:
对所述多源异构数据中的空间数据进行分析操作;所述分析操作包括基于空间图形数据的操作、基于非空间属性的操作以及空间和非空间数据的联合操作;
在所述多源异构数据的房地产数据处理中采用GIS矢量化工具对影响房地产租赁价格的重要地物要素进行矢量化处理;
在评估过程中对所述多源异构数据的栅格数据和矢量数据进行坐标变换,栅格数据利用GIS的空间配准工具进行坐标变换,矢量数据利用GIS的空间校正工具进行坐标变换;
按照空间位置关系,将若干幅地图拼接成一套整幅的地图,以从整体上对数据进行分析。
2.根据权利要求1所述的基于多源异构数据结构化的单一特征评估控制方法,其特征在于,根据所述评估参数进行结构化线性化数据目标提取,得到归一化后的单一特征评估指标,包括:
通过随机森林算法获取各评估参数的指标权重值;
根据各所述评估参数对应的指标权重值,从所述评估参数中筛选用于进行评估控制的所述归一化后的单一特征评估指标。
3.根据权利要求1所述的基于多源异构数据结构化的单一特征评估控制方法,其特征在于,基于预设的转换逻辑对多源异构数据的空间物理结构、业务逻辑关系和时序应用功能进行解析,得到具有特征标签的评估属性解析数据包,包括:
基于预设的转换逻辑对多源异构数据进行数据转换,得到转换后的待解析数据;
按照所述空间物理结构、所述业务逻辑关系和所述时序应用功能分别对所述待解析数据进行标注,得到标注数据;
根据标注数据进行数据解析,得到具有特征标签的评估属性解析数据包。
4.根据权利要求1所述的基于多源异构数据结构化的单一特征评估控制方法,其特征在于,根据所述具有特征标签的评估属性解析数据包进行非线性解耦与非结构二叉树分层,得到多于三个具有解析特性的特征评估因子,包括:
基于所述具有特征标签的评估属性解析数据包分析自动具有矩阵特征时空数据的项目的层级耦合机理;
根据所述层级耦合机理建立具有矩阵特征时空数据的项目的多变量控制系统;所述多变量控制系统包括解耦变量配对关系;
根据所述多变量控制系统设计逆系统;
根据所述逆系统对所述多变量控制系统进行层级解耦,得到构成要素间的影响关系;
根据所述影响关系提取特征评估因子。
5.根据权利要求1所述的基于多源异构数据结构化的单一特征评估控制方法,其特征在于,对所述特征评估因子依次进行归一化处理和拉普拉斯特征映射,得到低维解耦方阵,包括:
将各个所述特征评估因子统一至预设区间内,得到各个测评要素的归一化值;
根据所述归一化值确定数据谱图;所述数据谱图中的各个数据点为所述归一化值对应的所述测评要素;
针对每个数据点,将距离所述数据点最近的K个点进行连接;K为预设值;
根据所述数据点的连接线,确定数据点之间的权重;
根据所述权重确定拉普拉斯矩阵的特征向量与特征值;
根据所述特征向量与所述特征值得到所述低维解耦方阵。
6.根据权利要求1所述的基于多源异构数据结构化的单一特征评估控制方法,其特征在于,所述基于归一化后的单一特征评估指标,根据所述低维解耦方阵进行要素提取,得到测评要素,包括:
针对任一所述归一化后的单一特征评估指标,计算所述低维解耦方阵中的元素与所述归一化后的单一特征评估指标的相似度;
根据所述相似度和预设阈值对所述低维解耦方阵中的元素进行筛选,得到所述测评要素。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311098851.XA CN116821386B (zh) | 2023-08-30 | 2023-08-30 | 一种基于多源异构数据结构化的单一特征评估控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311098851.XA CN116821386B (zh) | 2023-08-30 | 2023-08-30 | 一种基于多源异构数据结构化的单一特征评估控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116821386A CN116821386A (zh) | 2023-09-29 |
CN116821386B true CN116821386B (zh) | 2023-11-21 |
Family
ID=88126085
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311098851.XA Active CN116821386B (zh) | 2023-08-30 | 2023-08-30 | 一种基于多源异构数据结构化的单一特征评估控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116821386B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106384302A (zh) * | 2016-09-30 | 2017-02-08 | 南方电网科学研究院有限责任公司 | 配电网可靠性评估方法和系统 |
CN111104640A (zh) * | 2019-11-14 | 2020-05-05 | 河海大学 | 一种基于层次分析法的降雨观测评价方法及系统 |
CN111681021A (zh) * | 2020-04-16 | 2020-09-18 | 北京信息科技大学 | 一种基于gca-rfr模型的数字内容资源价值评估方法 |
CN113657545A (zh) * | 2021-08-30 | 2021-11-16 | 平安医疗健康管理股份有限公司 | 用户业务数据的处理方法、装置、设备及存储介质 |
CN115230736A (zh) * | 2022-06-07 | 2022-10-25 | 江苏清车熟路智能科技有限公司 | 一种面向测试的自动驾驶车辆分层解耦方法及系统 |
CN116362569A (zh) * | 2023-06-02 | 2023-06-30 | 北京建工环境修复股份有限公司 | 一种场地污染的多维度评估方法及系统 |
CN116384754A (zh) * | 2023-06-02 | 2023-07-04 | 北京建工环境修复股份有限公司 | 一种基于深度学习的在产化工园区环境污染风险评估方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160070828A1 (en) * | 2013-04-08 | 2016-03-10 | China University of Mining & Technology, Beijng | Vulnerability Assessment Method of Water Inrush from Aquifer Underlying Coal Seam |
-
2023
- 2023-08-30 CN CN202311098851.XA patent/CN116821386B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106384302A (zh) * | 2016-09-30 | 2017-02-08 | 南方电网科学研究院有限责任公司 | 配电网可靠性评估方法和系统 |
CN111104640A (zh) * | 2019-11-14 | 2020-05-05 | 河海大学 | 一种基于层次分析法的降雨观测评价方法及系统 |
CN111681021A (zh) * | 2020-04-16 | 2020-09-18 | 北京信息科技大学 | 一种基于gca-rfr模型的数字内容资源价值评估方法 |
CN113657545A (zh) * | 2021-08-30 | 2021-11-16 | 平安医疗健康管理股份有限公司 | 用户业务数据的处理方法、装置、设备及存储介质 |
CN115230736A (zh) * | 2022-06-07 | 2022-10-25 | 江苏清车熟路智能科技有限公司 | 一种面向测试的自动驾驶车辆分层解耦方法及系统 |
CN116362569A (zh) * | 2023-06-02 | 2023-06-30 | 北京建工环境修复股份有限公司 | 一种场地污染的多维度评估方法及系统 |
CN116384754A (zh) * | 2023-06-02 | 2023-07-04 | 北京建工环境修复股份有限公司 | 一种基于深度学习的在产化工园区环境污染风险评估方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116821386A (zh) | 2023-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111680025B (zh) | 面向自然资源多源异构数据时空信息智能同化的方法及系统 | |
US5179643A (en) | Method of multi-dimensional analysis and display for a large volume of record information items and a system therefor | |
US8392352B2 (en) | Creation of neuro-fuzzy expert system from online analytical processing (OLAP) tools | |
US11720606B1 (en) | Automated geospatial data analysis | |
Baloui Jamkhaneh et al. | Inspection error and its effects on single sampling plans with fuzzy parameters | |
CN108170769A (zh) | 一种基于决策树算法的装配制造质量数据处理方法 | |
CN112861972A (zh) | 一种展业区域的选址方法、装置、计算机设备和介质 | |
CN111797188B (zh) | 一种基于开源地理空间矢量数据的城市功能区定量识别方法 | |
CN106203787A (zh) | 基于一张图加的产业信息分析方法及系统 | |
Bai et al. | Querying fuzzy spatiotemporal data using XQuery | |
Guo et al. | Study on landscape architecture model design based on big data intelligence | |
CN116186594A (zh) | 基于决策网络结合大数据实现环境变化趋势智能检测方法 | |
Feng et al. | Research on the construction of intelligent management platform of garden landscape environment system based on remote sensing images | |
CN114329240A (zh) | 选址特征筛选方法、装置、电子设备及存储介质 | |
CN116821386B (zh) | 一种基于多源异构数据结构化的单一特征评估控制方法 | |
CN116246076B (zh) | 一种传统民居院落肌理特征识别应用方法和系统 | |
CN116629904A (zh) | 一种基于大数据的客户分层匹配方法 | |
CN113792726B (zh) | 一种基于视觉图像快速生成poi的方法及系统 | |
Chen | Characteristic scales, scaling, and geospatial analysis | |
CN114549195A (zh) | 基于产业链图谱的市值重估分析方法及可视化分析系统 | |
Kulothungan | Loan Forecast by Using Machine Learning | |
Li et al. | Quantitative morphology of polder landscape based on SOM identification model: Case study of typical polders in the south of Yangtze River | |
Wang et al. | Application of modern GIS and remote sensing technology based on big data analysis in intelligent agriculture | |
Hesse et al. | Modeling and presentation of interdependencies between key performance indicators for visual analysis support | |
CN117952658B (zh) | 基于大数据的城市资源配置和产业特色分析方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |