CN117217779A - 预测模型的训练方法、装置及信息预测方法、装置 - Google Patents
预测模型的训练方法、装置及信息预测方法、装置 Download PDFInfo
- Publication number
- CN117217779A CN117217779A CN202311302785.3A CN202311302785A CN117217779A CN 117217779 A CN117217779 A CN 117217779A CN 202311302785 A CN202311302785 A CN 202311302785A CN 117217779 A CN117217779 A CN 117217779A
- Authority
- CN
- China
- Prior art keywords
- community
- property
- target
- sample
- attribute information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 111
- 238000012549 training Methods 0.000 title claims abstract description 47
- 239000013598 vector Substances 0.000 claims abstract description 122
- 239000000203 mixture Substances 0.000 claims abstract description 11
- 230000000875 corresponding effect Effects 0.000 claims description 58
- 238000013210 evaluation model Methods 0.000 claims description 25
- 238000011156 evaluation Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 19
- 238000010276 construction Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 4
- 230000002596 correlated effect Effects 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 24
- 238000009826 distribution Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 238000013528 artificial neural network Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 238000013135 deep learning Methods 0.000 description 7
- 210000004027 cell Anatomy 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 230000001788 irregular Effects 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 210000002569 neuron Anatomy 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000010438 heat treatment Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 240000006432 Carica papaya Species 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000000059 patterning Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种预测模型的训练方法、装置及信息预测方法、装置。房产评估模型通过如下方式训练得到:获取房产样本的房产属性信息及房产样本对应的社区样本的社区属性信息;基于房产属性信息及社区属性信息构建异构图;根据目标房产所属目标社区发生的房产交易事件确定目标社区在异构图中的历史状态嵌入向量;基于历史状态嵌入向量以及社区样本中的其他社区的状态嵌入向量对目标社区的状态嵌入向量进行更新,得到更新后的异构图;对更新后的异构图进行多任务学习,得到房产评估模型。本申请实施例所提供的方案提高了房产估值的准确性。
Description
技术领域
本申请属于房地产领域,尤其涉及一种预测模型的训练方法、装置及信息预测方法、装置。
背景技术
房产估值对房产交易的双方以及抵押出资方具有重要的指导意义。在相关技术中,可采用收益法、成本法、销售比较法、享乐价格法等方式来对房产进行估值。然而,上述方法的使用严重依赖专业的领域知识,无法在非专业群体中广泛普及。
对此,现有的自动房产估值方法可通过机器学习算法(例如,支持向量回归、提升回归树、人工神经网络模型)以数据驱动的方式自动对房产进行估值。该方式不依赖专业的领域知识,可在非专业群体中广泛普及。
然而,现有的自动房产估值方法通常仅依据房产自身所具有的属性(例如,面积、户型、位置)来对房产进行估值,而未考虑历史交易之间的相关性以及历史房产交易与实时房价之间的不规则时空相关性,也未充分考虑住宅社区之间的房产价值分布的差异性和同质性,从而导致房产估值不准确。
发明内容
本申请实施例提供一种预测模型的训练方法、装置及信息预测方法、装置,能够提高房产估值的准确性。
第一方面,本申请实施例提供一种预测模型的训练方法,该方法包括:获取房产样本的房产属性信息以及房产样本所对应的社区样本的社区属性信息;基于房产样本的房产属性信息以及社区样本的社区属性信息构建异构图,其中,异构图用于表征待评估房产与待评估房产的归属社区,以及归属社区与其他社区之间的关联关系;根据目标房产所属目标社区发生的房产交易事件确定目标社区在异构图中的历史状态嵌入向量,其中,目标社区为社区样本中的任意一个社区,目标房产为目标社区所包含的多个房产中的任意一个,历史状态嵌入向量为由目标社区的历史社区属性信息以及目标社区的历史房产交易信息所组成的向量;基于历史状态嵌入向量以及社区样本中的其他社区的状态嵌入向量对目标社区的状态嵌入向量进行更新,得到更新后的异构图;对更新后的异构图进行多任务学习,得到用于评估房产价值的房产评估模型。
第二方面,本申请实施例提供一种信息预测方法,应用于采用如第一方面的方法训练得到的房产评估模型中,该方法包括:获取待评估房产的位置信息以及待评估房产的房产属性信息;根据待评估房产的位置信息确定待评估房产所归属的归属社区;从预设的异构图中确定与归属社区的社区属性信息相匹配的目标社区,其中,异构图用于表征待评估房产与归属社区,以及归属社区与其他社区之间的关联关系;根据待评估房产的房产属性信息以及目标社区所对应的历史房产交易信息,对待评估房产的价值进行估算,得到待评估房产的估算价值。
第三方面,本申请实施例提供了一种预测模型的训练装置,该装置包括:第一获取模块,用于获取房产样本的房产属性信息以及房产样本所对应的社区样本的社区属性信息;异构图构建模块,用于基于房产样本的房产属性信息以及社区样本的社区属性信息构建异构图,其中,异构图用于表征待评估房产与待评估房产的归属社区,以及归属社区与其他社区之间的关联关系;向量确定模块,用于根据目标房产所属目标社区发生的房产交易事件确定目标社区在异构图中的历史状态嵌入向量,其中,目标社区为社区样本中的任意一个社区,目标房产为目标社区所包含的多个房产中的任意一个,历史状态嵌入向量为由目标社区的历史社区属性信息以及目标社区的历史房产交易信息所组成的向量;嵌入更新模块,用于基于历史状态嵌入向量以及社区样本中的其他社区的状态嵌入向量对目标社区的状态嵌入向量进行更新,得到更新后的异构图;模型训练模块,用于对更新后的异构图进行多任务学习,得到用于评估房产价值的房产评估模型。
第四方面,本申请实施例提供了一种信息预测装置,该装置包括:第二获取模块,用于获取待评估房产的位置信息以及待评估房产的房产属性信息;社区确定模块,用于根据待评估房产的位置信息确定待评估房产所归属的归属社区;社区匹配模块,用于从预设的异构图中确定与归属社区的社区属性信息相匹配的目标社区,其中,异构图用于表征待评估房产与归属社区,以及归属社区与其他社区之间的关联关系;房产评估模块,用于根据待评估房产的房产属性信息以及目标社区所对应的历史房产交易信息,对待评估房产的价值进行估算,得到待评估房产的估算价值。
第五方面,本申请实施例提供了一种电子设备,该电子设备包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现如第一方面所述的预测模型的训练方法或如第二方面所述的信息预测方法。
第六方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面所述的预测模型的训练方法或如第二方面所述的信息预测方法。
第七方面,本申请实施例提供了一种计算机程序产品,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行如第一方面所述的预测模型的训练方法或如第二方面所述的信息预测方法。
由上述内容可知,在本申请实施例中,异构图能够表征房产与社区之间以及社区与社区之间的关联关系,即在对房产进行估值的过程中,本申请实施例根据其他社区的房产交易信息以及社区属性信息对目标社区的状态嵌入向量进行更新,考虑到了社区之间的房产价值分布的差异性和同质性,避免了由于目标社区中与房产交易相关的数据较少,导致目标社区的房产估值准确率低的问题,在一定程度上提高了房产估值的准确性。另外,在对房产进行估值的过程中,还考虑到了历史房产交易信息,为房产估值提供了依据,进一步提高了房产估值的准确性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例提供的预测模型的训练方法的流程示意图;
图2是本申请一个实施例提供的异构图的示意图;
图3是本申请另一个实施例提供的信息预测方法的流程示意图;
图4是本申请另一个实施例提供的预测模型的训练装置的结构示意图;
图5是本申请另一个实施例提供的信息预测装置的结构示意图;
图6是本申请又一个实施例提供的电子设备的结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
为便于理解,在对本申请所提供的方案进行解释说明之前,首先对本申请实施例所使用到的专业术语进行介绍。
(1)深度学习(Deep learning),机器学习的一个子领域,主要关注模拟人类大脑的神经网络结构,以实现类似于人类的学习和推理能力。它是一种特殊的ANN(ArtificialNeural Network,人工神经网络)方法,具有多层隐藏层,能够自动从大量数据中提取特征和模式,进而实现预测和决策。深度学习的基本构建模块是人工神经元,其模拟了生物神经元的工作原理。典型的深度学习模型通常包含多个层次的神经元,按照层级结构组织,可分为输入层、隐藏层和输出层。每层的神经元与上下层的神经元相互连接,通过加权求和和激活函数的计算,传递和转换信息。训练深度学习模型时,需要大量的标记数据,以便算法根据数据不断调整神经元间的连接权重,最终使模型的预测结果与实际结果尽可能接近。在训练过程中,可采用梯度下降法优化权重,以最小化损失函数。同时,通过使用反向传播算法计算梯度,高效地更新权重。深度学习可应用于图像识别、语音识别、自然语言处理、推荐系统以及各大垂直领域。
(2)图链接标签预测(Graph Link Label Prediction),是图挖掘和图学习领域的一个重要任务,主要实现图中节点对之间的关系类型的预测。在现实世界中,关系数据可以以图结构来表示,例如,社交网络、生物网络、知识图谱等。在图结构中,节点代表实体,边代表实体之间的关系,关系可以具有多种类型,例如,朋友、亲属、合作者等。图链接标签预测旨在预测给定节点对之间的关系类型或值,从而为进一步分析提供基础。可采用图学习算法来解决图链接标签预测问题,主要包括基于传统特征工程的方法、基于矩阵分解的方法以及基于深度学习的方法。图链接标签预测可应用于图神经网络(Graph NeuralNetworks,GNN)中,该图神经网络能够自动提取图结构中的局部和全局特征,较好地捕获节点之间的复杂依赖关系。其中,图链接标签预测流程包括:首先根据节点对生成训练数据;然后利用图学习算法学习节点表示,包括节点嵌入或图结构特征;接着使用预测器(例如,神经网络等)预测节点间的链接类型或值;最后评估预测性能。
(3)多任务学习(Multi-Task Learning),是机器学习领域的一个研究方向,其可在一个统一的模型中同时学习多个相关任务,从而提高模型在单个任务上的性能。与传统的单任务学习相比,多任务学习通过共享不同任务之间的信息和知识,可以更好地泛化到新的数据和场景,提高模型的鲁棒性和准确性。在多任务学习中,相关任务可以共享模型的一部分参数或者结构,例如,在深度学习中共享底层的神经网络层。这使得模型可以自动地捕捉到不同任务之间的潜在关联,从而学习更具有代表性和泛化能力的特征表示。此外,由于来自多个任务的数据可以提供更丰富的训练样本,因此,多任务学习还有助于减小过拟合的风险。
为了解决现有技术问题,本申请实施例提供了一种预测模型的训练方法、装置及信息预测方法、装置。下面首先对本申请实施例所提供的预测模型的训练方法进行介绍。
本申请实施例通过引入多种先进的深度学习技术(例如,图神经网络、多任务学习等)解决房产估值不准确的问题。在训练房产评估模型的过程中,将房产估值问题建模为一个多任务动态图链接标签预测问题,并设计演化图网络来捕捉房产交易演变的相关信息,并提出了基于超网络的多任务学习模块,以便在促进社区间知识共享的同时为每个社区生成具有社区特色房产交易价格分布的社区特定参数。以下对本申请实施例所提供的预测模型的训练方法进行解释说明。
图1示出了本申请一个实施例提供的预测模型的训练方法的流程示意图。如图1所示,该方法包括如下步骤:
步骤S101,获取房产样本的房产属性信息以及房产样本所对应的社区样本的社区属性信息。
在步骤S101中,一个城市包含一组社区集合C={c1,…,c{|C|}},其中,每个社区ci表示为li是ci的位置,/>是ci在时刻t的属性,例如,社区周围地铁站、公交站、幼儿园、小中学、大学、医院、药店、商场、超市、银行、餐厅、咖啡厅、公园、电影院、体育馆的数量,以及到最近的上述各种设施的距离。社区通常由一组房产组成,每个房产e都有其自身的房产属性x,例如,房间数量、房屋面积、结构、装修、朝向、供暖方式、楼层数、是否免税、交易所有权、建筑类型、电梯户比例、竣工年份等。
也即,在本申请实施例中,房产样本由多个房产组成,房产属性信息可以包括但不限于每个房产所具有不同类型房间的数量、房屋面积、房屋结构、房屋装修信息、房屋朝向信息、供暖方式、房产所在楼层、是否免税、交易所有权信息、建筑类型、电梯户比例、竣工年份、房产在社区中的位置等信息。相应地,社区样本由多个社区组成,社区属性信息可以包括但不限于每个社区所对应是周边资源信息(例如,医疗、交通、商场、公园、学校、餐饮、小区配套)、环境信息(例如,水质、空气质量、噪音、景观情况)、物业属性信息(例如,物业费、车位、小区绿化率、物业、土地使用年限)。
作为一个示例,可以对不同区域(例如,市)内的不同社区的社区属性信息进行统计,即可得到社区样本以及社区样本所对应的社区属性信息;进一步,对每个社区所包含的房产的房产属性信息进行统计,即可得到房产样本以及房产样本对应的房产属性信息。
步骤S102,基于房产样本的房产属性信息以及社区样本的社区属性信息构建异构图。
在步骤S102中,异构图用于房产与社区,以及社区与社区之间的关联关系,其中,异构图至少包括多个异构节点以及连接多个异构节点的边,多个异构节点至少包括房产样本所对应的房产节点以及社区样本所对应的社区节点。相应地,边可以连接两个社区节点,也可以连接房产节点与社区节点,其中,连接两个社区节点的边表征两个社区节点具有相关性,例如,距离相近的两个社区节点通过边连接,又例如,具有相似特征的两个社区节点通过边连接;连接房产节点与社区节点的边可以保证房产节点与社区节点之间的归属关系,即表征该房产节点对应的房产位于该社区节点对应的社区中。
需要说明的是,异构图能够表征房产与社区之间以及社区与社区之间的关联关联关系,即在对房产进行估值的过程中,本申请实施例考虑到了社区之间的房产价值分布的差异性和同质性,在一定程度上提高了房产估值的准确性。
步骤S103,根据目标房产所属目标社区发生的房产交易事件确定目标社区在异构图中的历史状态嵌入向量。
在步骤S103中,目标社区为社区样本中的任意一个社区,目标房产为目标社区所包含的多个房产中的任意一个,状态嵌入向量为由目标社区的历史社区属性信息以及目标社区的历史房产交易信息所组成的向量,其中,每个房产交易事件均有对应的房产交易信息。
在本申请实施例中,房产样本所对应的房产交易信息可以用于表征一个交易事件,将城市中第n个按时间顺序排列的房产交易事件定义为sn=<en,ci,t,yn>∈S,表示位于住宅社区ci的房地产en在时刻t以单位价格yn每平方米的价格成交,S表示城市中的交易事件集合。
进一步,在本申请实施例中,将社区ci的房产在时刻/>被评估的单位价格/>表示为一个潜在交易事件/>房产价值评估问题可以下式表示:
在公式(1)中,f为希望从历史交易数据中学习的房产评估模型。
需要说明的是,通过步骤S103可得到目标社区的历史状态嵌入向量,该向量可用于后续对目标社区的状态嵌入向量的更新中,即在本申请实施例中,在对房产进行估值的过程中,还考虑到了历史房产交易信息,为房产估值提供了依据,进一步提高了房产估值的准确性。
步骤S104,基于历史状态嵌入向量以及社区样本中的其他社区的状态嵌入向量对目标社区的状态嵌入向量进行更新,得到更新后的异构图。
在步骤S104中,其他社区可以是与目标社区具有关联关系的社区,例如,其他社区为在空间上与目标社区距离较近的社区,又例如,其他社区可以是与目标社区具有较高的特征相似度的社区。即在本申请实施例中,在对目标社区的状态嵌入向量进行更新的过程中,考虑到了其他社区的状态嵌入向量,并通过其他社区的状态嵌入向量来对目标社区的状态嵌入向量进行更新,从而在目标社区所具有的房产交易数据较少时,通过目标社区的历史房产交易信息以及与目标社区具有关联关系的其他社区的房产交易信息来对待评估房产进行估值,也能够实现对待评估房产的准确估值。
步骤S105,对更新后的异构图进行多任务学习,得到用于评估房产价值的房产评估模型。
需要说明的是,由于不同社区的房产价格的分布是不同的,因此,为了实现房产估值过程中考虑房产价格的分布多样性,在本申请实施例中,将每个社区的房产评估视为一个单独的任务,并将在社区发生的房产交易视为任务的实例,然后将房产评估重新构造为多任务的动态图链接标签预测问题,从而实现了对异构图的多任务学习。通过对异构图进行多任务学习可实现对房产评估模型的模型参数的迭代更新,从而实现了用于评估房产价值的房产评估模型的训练。
基于上述步骤S101至步骤S105所限定的方案,可以获知,在本申请实施例中,异构图能够表征房产与社区之间以及社区与社区之间的关联关系,即在对房产进行估值的过程中,本申请实施例根据其他社区的房产交易信息以及社区属性信息对目标社区的状态嵌入向量进行更新,考虑到了社区之间的房产价值分布的差异性和同质性,避免了由于目标社区中与房产交易相关的数据较少,导致目标社区的房产估值准确率低的问题,在一定程度上提高了房产估值的准确性。另外,在对房产进行估值的过程中,还考虑到了历史房产交易信息,为房产估值提供了依据,进一步提高了房产估值的准确性。
以下对训练房产评估模型的各个步骤进行详细地解释说明。
房产的市场价值不仅取决于该房产本身的属性,还取决于其所归属社区的属性。例如,位于周边设施齐全的社区(如商场、地铁站和学校)的房产价通常高于位于荒凉地区的社区。此外,房产价格与同一社区及相邻社区的历史房产交易高度相关。在本申请实施例中,通过构建的异构图来表征上述复杂的时空相关性。即在获取到房产样本以及社区样本之后,执行步骤S102,即基于房产样本的房产属性信息以及社区样本的社区属性信息构建异构图。
具体的,首先,获取社区样本中多个社区之间的社区距离,并根据社区距离确定多个社区所对应的社区节点之间的关联关系,生成社区节点之间的第一边;同时,获取房产样本与社区样本之间的关联关系,生成房产样本对应的房产节点与社区节点之间的第二边;然后,对房产样本所对应的房产交易价格与第二边进行关联,生成与第二边关联的标签;最后,基于社区节点、房产节点、第一边、第二边以及标签生成异构图。
在一个示例中,演化的异构图可定义为其中,t表示时间,Vt是一组包括房产和社区在内的异构节点,εt是一组表示节点之间连通性的无向边。
由于异构图中的异构节点具有异构性,因此,在本申请实施例中,异构图中的边可以包括两种类型的边,即第一边c-c和第二边e-c。其中,第二边e-c可以表示为<e,c,t,y>,其用于表征在时刻t位于社区c的房产e发生的交易事件,交易价格为y;而第二边c-c反映了两个社区之间的空间接近性,即第二边用于连接空间距离较近的两个社区。因此,随着新交易事件发生或新社区的加入,异构图将不断演化。
作为一个示例,交易事件sn=<en,ci,t,yn>发生时,房产en与社区ci之间的边连接可由下式表示:
在公式(2)中,en-ci=1表示在异构图中连接房产与社区,即关联房产与社区;en-ci=0表示在异构图中不连接房产与社区,即不对房产与社区进行关联。
社区ci与社区cj之间的边可由下式表示:
在公式(3)中,dij是ci和cj之间的球面距离,∈是距离阈值,每个社区均有一个自环边与自己相连。其中,每个e-c均与一个标签y关联,该标签可表示房产交易的价格。例如,在图2所示的异构图中,社区节点与社区节点之间通过边连接,同时,房产节点与社区节点之间也通过边连接,并且,交易价格与第二边关联。
在确定房产节点、社区节点以及它们边的交易时间,房产评估模型可在演化的异构图上重新建模为链接标签预测问题。
除了时空相关性(即在同一时间段内,同一社区内的不同房产的交易价格在一定的区间内)外,不同社区的房产价格分布也不相同。为了处理这种多样性,如图2所示,在本申请实施例中,将每个社区的房产评估视为单独的社区任务并将在社区发生的房产交易视为社区任务的实例。然后,将每个城市的房产评估进一步重新构造为多任务动态图链接标签预测问题。即给定一个演化的异构图/>一组社区任务/>一个待评估的房产及其所归属的社区ci,则上述问题可以标识为在任务/>下,在时刻/>预测/>和ci之间的链接标签,即交易单位价格/>
需要说明的是,交易事件可能在社区的任何时间发生,社区之间的空间连接也是不规则的,例如,与社区A关联的社区数量为4,而与社区B关联的社区数量为2,社区A与社区B为邻近社区,由于社区之间的空间连接是不规则的,从而导致演化的异构图中的时空不规则性,即在异构图中,不同社区的关联社区的数量不同,并且,不同社区在同一时间段内的房产交易事件的发生次数也不相同。为此,在本申请实施例中,基于演化异构图捕捉不规则的时空相关性,从而得到演化图网络。其中,演化图网络可通过时间感知的循环神经网络整合演化的交易事件,并按照预设顺序更新参与交易事件的社区的状态嵌入向量,并通过维度注意力图卷积整合相邻社区的最新嵌入向量。该过程主要包括嵌入更新和嵌入聚合两个阶段。
对于嵌入更新,在构建异构图之后,可据目标房产所属目标社区发生的房产交易事件确定目标社区在异构图中的历史状态嵌入向量,并采用历史状态嵌入向量来对目标社区的状态嵌入向量进行更新。
具体的,首先获取目标社区发生相邻两次房产交易事件的时间间隔,并对时间间隔进行傅里叶特征表示,得到时间嵌入向量;然后,按照预设顺序对时间嵌入向量、目标房产的房产属性信息、目标房产的房产交易价格、目标社区在目标时间的状态嵌入向量进行连接操作,生成目标权重向量;再对目标社区的上一状态嵌入向量和目标权重向量进行元素间的乘积,得到历史状态嵌入向量;之后,按照预设顺序对目标房产的房产属性信息、目标房产的房产交易价格、目标社区在目标时间的社区属性信息进行连接操作,得到目标数据;并通过门控循环单元,采用目标数据对历史状态嵌入向量进行更新,得到目标社区在目标时间的状态嵌入向量。
需要说明的是,上述的时间间隔为目标社区在目标时间发送房产交易事件的时间,与上一次发生房产交易事件的时间的差值。
在嵌入更新阶段中,通过交易事件sn=<en,ci,t,yn>来更新ci的状态嵌入向量在实际应用中,社区中两个连续交易事件之间的时间间隔对房产价格波动具有重要意义,而时间间隔通常变化很大。因此,为了有效地模拟时变不规则的交易事件,在本申请实施例中,将门控循环单元扩展为时间感知的门控循环单元。其中,门控循环单元(GateRecurrent Unit,GRU)是一种简单而有效的循环神经网络变体。
作为一个示例,在确定交易事件sn=<en,ci,t,yn>和社区ci的上一状态嵌入向量之后,采用时间门控制机来控制社区过去知识的影响,其中,t-Δt表示在sn之前涉及ci的最后一次交易的时间,目标权重向量可通过公式(4)来计算得到:
在公式(4)和公式(5)中,表示社区ci在上一时间t-Δt的目标向量权重,t为目标时间,Δt为时间间隔,xn为目标房产的房产属性信息,yn为目标房产的房产交易价格,表示社区ci在上一时间t-Δt的状态嵌入向量;/>为历史状态嵌入向量;||表示连接操作,Wg和ReLU(·)分别是可学习的参数和激活函数,⊙表示元素间的积,φ(Δt)为时间嵌入向量。
在本申请实施例中,采用Fourier特征表示的原始时间间隔来得到时间嵌入向量,即时间嵌入向量可由公式(6)来确定:
在公式(6)中,是可学习的参数。
在一个示例中,可采用公式(7)通过门控循环单元操作对状态嵌入向量进行更新:
在公式(7)中,xn为房产样本所对应的房产属性信息,yn为房产样本所对应的房产交易信息,为在目标时刻t所对应社区的属性信息,/>为对上述三个数据进行连接操作后所得到的目标数据;/>表示使用/>对/>进行更新。
在嵌入聚合阶段中,首先获取与目标社区具有关联关系的其他社区所对应的状态嵌入向量,然后再基于其他社区所对应的状态嵌入向量以及目标数据对目标社区的状态嵌入向量进行嵌入更新,得到更新后的异构图。
在一个示例中,对于待评估房产和其所归属的社区ci的最新状态嵌入向量/>在本申请实施例中,可将房产节点的房产属性信息对应的特征向量/>社区节点的状态嵌入向量/>和潜在交易的时间/>组合起来预测链接标签,即房产交易价格/>然而,通常当社区发生交易事件时,才会更新该社区的嵌入状态。如果一个社区在较长时间内没有交易事件,则过去房产市场知识的状态嵌入向量/>会变得陈旧,从而对当前市场环境下的房产估值产生负面影响,也无法展现房产交易在空间上的相似性。
为解决上述问题,在本申请实施例中,采用维度注意力图卷积,通过自适应地整合邻近社区的最新知识来刷新社区的状态嵌入向量。由于邻近社区的不同维度知识可能具有不同的影响,在本申请实施例中,通过维度相关权重来实现对社区的嵌入状态信息的更新。
需要说明的是,上述的维度相关权重是通过基于特征的注意力操作来得到的,其中,维度相关权重可通过公式(8)来表示:
其中,
在公式(8)中,αij为维度相关权重, 为社区ci的邻近社区(包括ci本身),tj表示在cj发生最近交易事件时/>的最后更新时间,/>是可学习的参数;βij为归一化前的αij。
需要注意的是,还可考虑边特征的影响,即时间间隔和距离dij,用于计算相关权重。在得到αij后,可通过聚合其邻居的最新状态嵌入向量来更新社区ci的状态嵌入向量,如公式(9)所示:
在公式(9)中,W3表示可学习的参数。
如前所述,城市中的每个社区都可构建为一个单独的任务,以满足独特的房产价格分布。由于社区的交易数据有限甚至缺失,直接为每个社区学习单独的参数是不切实际的。实际上,房产交易中隐藏的大量通用知识可以被一个城市的所有任务共享。为了实施城市内部知识共享并同时捕捉任务特定知识,通常可采用共同学习用于城市中所有任务的共享特征提取器,来同时分别学习任务特定的输出层。然而,由于许多任务只有极度稀疏的交易数据甚至没有数据可用,无法支持任务特定参数的学习,而且,城市中有大量的社区,为如此庞大的任务训练任务特定的输出层可能会导致低学习效率,可扩展性差,因此,上述方法无法直接应用于本申请实施例中。对此,本申请实施例使用基于超网络的多任务学习模块来实现房产评估模型的训练。
具体的,首先为更新后的异构图中的多个社区构建任务,得到与每个社区所对应的社区任务,然后,将多个社区所对应的社区属性信息输入至目标网络模型中,通过目标网络模型确定每个社区任务所对应的任务特征,并通过多层感知机对每个社区任务所对应的任务特征进行实例化处理,得到每个社区任务所对应的模型参数;最后,基于每个社区任务所对应的模型参数构建房产评估模型。
作为一个示例,多任务学习的核心思想是基于一个可学习的超网络(即上述的目标网络模型)生成特定任务的输出层参数,该超网络在城市所有任务之间共享。具体而言,超网络以社区属性作为输入,捕捉每个任务的独特特征,然后通过公式(10)来为每个任务生成个性化的输出层参数:
通过公式(10)使用多层感知机来实例化超网络中的和/>其中,/>为超网络中的权重参数,/>为超网络中的偏差项参数,ΦW为对超网络中的权重参数进行实例化的函数,Φb为对超网络中的偏差项参数进行实例化的函数。
在得到每个社区任务所生成的模型参数之后,即可基于异构节点和链接关联的嵌入向量来评估位于社区ci的房产的价值,如公式(11)所示:
在公式(11)中,为可学习的特征融合函数,该函数可通过多层感知机实例化来得到。
通过上述过程,具有相似社区属性的社区任务将获得相似的模型参数,因此,通用知识可以进一步在这些社区任务之间共享,有效缓解了稀疏或甚至没有实例的社区任务的数据稀缺问题。此外,超网络由所有社区任务共享,可学习参数与任务数量无关,因此,在大规模任务上能够显著提高模型的学习效率和可扩展性。
为了提高房产评估模型对房产估值的精准度,在对更新后的异构图进行多任务学习,得到房产评估模型之后,还确定房产评估模型对房产样本中的每个房产进行估值的估值结果,并计算估值结果与目标交易价格之间的差异值;在差异值大于或等于预设差异值的情况下,对房产评估模型进行参数更新,直至差异值小于预设差异值。
作为一个示例,房产评估模型旨在最小化所有社区任务的估计单价和实际房产交易单价之间的平均绝对误差损失,即房产评估模型的损失函数可由公式(12)来确定:
在公式(12)中,为房产评估模型的损失函数,θ为房产评估模型中所有可学习参数,可通过梯度下降法来实现房产评估模型的自动化训练;yn为实际房产交易单价,/>为目标交易价格;S为该社区所对应的交易事件的数量。
由上述内容可知,本申请实施例将房产估价问题建模为多任务动态图链接标签预测问题,并设计了演化图网络来捕捉演变的房产交易间的不规则时空相关性,提高了房产评估模型的精准度。同时,本申请实施例还提出了基于超网络的多任务学习方法,以在促进社区间知识共享的同时,为每个社区生成具有社区特色房地产价格分布的社区特定参数。
本申请实施例还提供了一种信息预测方法,该方法可应用于采用上述实施例中的方法训练得到的房产评估模型中。
在一个示例中,图3示出了信息预测方法的流程示意图,如图3所示,该方法包括如下步骤:
步骤S301,获取待评估房产的位置信息以及待评估房产的房产属性信息。
在步骤S301中,待评估房产可以是卖方所要售卖的房产,也可以是买房所要购买的房产,还可以是抵押出资方所要估值的房产。上述待评估房产的房产属性信息可以包括但不限于每个房产所具有不同类型房间的数量、房屋面积、房屋结构、房屋装修信息、房屋朝向信息、供暖方式、房产所在楼层、是否免税、交易所有权信息、建筑类型、电梯户比例、竣工年份、房产在社区中的位置等信息。
作为一个示例,在抵押方需要抵押房产时,出资方需对抵押的房产进行估值,以确定为抵押方提供贷款的额度等信息。在该场景中,出资方可将抵押方所要抵押的房产(即待评估房产)的相关信息(即位置信息和房产属性信息)输入至房产评估模型中,从而房产评估模型即可根据出资方所输入的房产的相关信息来对房产进行评估。
容易注意到的是,用户仅需向房产评估模型输入房产的相关信息即可,无需用户拥有房产领域的专业知识,房产评估模型即可对待评估房产进行准确估值。由此可见,通过本申请中预测模型的训练方法所训练得到的房产评估模型具有较强的通用性和实用性,能够在非专业群体中得到普及。
步骤S302,根据待评估房产的位置信息确定待评估房产所归属的归属社区。
作为一个示例,首先根据待评估房产的位置信息粗略的确定待评估房产所对应的区域,进而再根据该区域内每个社区所对应的位置范围来确定待评估房产所归属的归属社区,例如,根据待评估房产的位置信息可确定待评估房产位于北京市海淀区的万寿路街道。然后,再获取万寿路街道周围的小区的位置信息,检测待评估房产的位置信息是否位于这些小区的位置范围内,如果待评估房产处于某个小区的位置范围内,则可确定该小区即为待评估房产所归属的归属社区。
步骤S303,从预设的异构图中确定与归属社区的社区属性信息相匹配的目标社区。
在步骤S303中,异构图用于表征待评估房产与归属社区,以及归属社区与其他社区之间的关联关系。社区属性信息可以包括但不限于每个社区所对应是周边资源信息(例如,医疗、交通、商场、公园、学校、餐饮、小区配套)、环境信息(例如,水质、空气质量、噪音、景观情况)、物业属性信息(例如,物业费、车位、小区绿化率、物业、土地使用年限)。
作为一个示例,在确定了待评估房产所归属的归属社区之后,从异构图中确定与该归属社区具有相似社区特征的目标社区,该目标社区可以是与归属社区距离最近的社区,也可以是周边资源信息、环境信息、物业属性信息中的一个或多个的相似度较高的社区,例如,归属社区和目标社区均为位于地铁周围、小区绿化率大于30%的社区。
另外,在实际应用中,可通过特征匹配的方式来计算每个社区与归属社区的特征相似度,并从异构图中与归属社区具有关联关系的多个社区中确定特征相似度最大的社区为目标社区。
需要说明的是,异构图能够表征房产与社区之间以及社区与社区之间的关联关联关系,即在对房产进行估值的过程中,本申请实施例考虑到了社区之间的房产价值分布的差异性和同质性,在一定程度上提高了房产估值的准确性。
步骤S304,根据待评估房产的房产属性信息以及目标社区所对应的历史房产交易信息,对待评估房产的价值进行估算,得到待评估房产的估算价值。
作为一个示例,在得到待评估房产的房产属性信息以及待评估房产所归属的归属社区之后,房产评估模型可统计该归属社区所完成的房产交易数量。如果房产交易数量大于预设数量,即房产交易数量超过一定数量时,则房产评估模型可使用该归属社区已完成的房产交易的房产价格(即归属社区所对应的历史房产交易信息)来对待评估房产进行估值;如果房产交易数量不大于预设数量,则房产评估模型可使用与归属社区具有相似特征的目标社区的历史房产交易信息来对待评估房产进行估值。
容易注意到的是,由于目标社区与归属社区具有较高的特征相似度,因此,在归属社区所具有的房产交易数据较少时,通过目标社区的历史房产交易信息来对待评估房产进行估值,也能够实现对待评估房产的准确估值。
基于上述步骤S301至步骤S304所限定的方案,可以获知,在本申请实施例中,异构图能够表征房产与社区之间以及社区与社区之间的关联关联关系,即在对房产进行估值的过程中,本申请实施例考虑到了社区之间的房产价值分布的差异性和同质性,在一定程度上提高了房产估值的准确性。另外,在对房产进行估值的过程中,还考虑到了历史房产交易信息,为房产估值提供了依据,进一步提高了房产估值的准确性。
本申请实施例还提供一种预测模型的训练装置,如图4所示,该装置400包括:第一获取模块401、异构图构建模块402、向量确定模块403、嵌入更新模块404以及模型训练模块405。
第一获取模块401,用于获取房产样本的房产属性信息以及房产样本所对应的社区样本的社区属性信息;
异构图构建模块402,用于基于房产样本的房产属性信息以及社区样本的社区属性信息构建异构图,其中,异构图用于表征待评估房产与待评估房产的归属社区,以及归属社区与其他社区之间的关联关系;
向量确定模块403,用于根据目标房产所属目标社区发生的房产交易事件确定目标社区在异构图中的历史状态嵌入向量,其中,目标社区为社区样本中的任意一个社区,目标房产为目标社区所包含的多个房产中的任意一个,历史状态嵌入向量为由目标社区的历史社区属性信息以及目标社区的历史房产交易信息所组成的向量;
嵌入更新模块404,用于基于历史状态嵌入向量以及社区样本中的其他社区的状态嵌入向量对目标社区的状态嵌入向量进行更新,得到更新后的异构图;
模型训练模块405,用于对更新后的异构图进行多任务学习,得到用于评估房产价值的房产评估模型。
在一个示例中,异构图构建模块具体用于获取社区样本中多个社区之间的社区距离;根据社区距离确定多个社区所对应的社区节点之间的关联关系,生成社区节点之间的第一边;获取房产样本与社区样本之间的关联关系,生成房产样本对应的房产节点与社区节点之间的第二边;对房产样本所对应的房产交易价格与第二边进行关联,生成与第二边关联的标签;基于社区节点、房产节点、第一边、第二边以及标签生成异构图。
在一个示例中,向量确定模块具体用于获取目标社区发生相邻两次房产交易事件的时间间隔,其中,时间间隔为目标社区在目标时间发送房产交易事件的时间,与上一次发生房产交易事件的时间的差值;对时间间隔进行傅里叶特征表示,得到时间嵌入向量;按照预设顺序对时间嵌入向量、目标房产的房产属性信息、目标房产的房产交易价格、目标社区在目标时间的状态嵌入向量进行连接操作,生成目标权重向量;对目标社区的上一状态嵌入向量和目标权重向量进行元素间的乘积,得到历史状态嵌入向量,其中,上一状态嵌入向量为目标社区上一次发生房产交易事件时的状态嵌入向量。
在一个示例中,嵌入更新模块具体用于按照预设顺序对目标房产的房产属性信息、目标房产的房产交易价格、目标社区在目标时间的社区属性信息进行连接操作,得到目标数据;通过门控循环单元,采用目标数据对历史状态嵌入向量进行更新,得到目标社区在目标时间的状态嵌入向量;获取与目标社区具有关联关系的其他社区的状态嵌入向量;基于其他社区的状态嵌入向量以及目标数据对目标社区在目标时间的状态嵌入向量进行嵌入更新,得到更新后的异构图。
在一个示例中,模型训练模块具体用于为更新后的异构图中的多个社区构建任务,得到与每个社区所对应的社区任务;将多个社区所对应的社区属性信息输入至目标网络模型中,通过目标网络模型确定每个社区任务所对应的任务特征;通过多层感知机对每个社区任务所对应的任务特征进行实例化处理,得到每个社区任务所对应的模型参数;基于每个社区任务所对应的模型参数构建房产评估模型。
在一个示例中,预测模型的训练装置还包括:参数更新模块,用于确定房产评估模型对房产样本中的每个房产进行估值的估值结果;计算估值结果与目标交易价格之间的差异值;在差异值大于或等于预设差异值的情况下,对房产评估模型进行参数更新,直至差异值小于预设差异值。
本申请实施例还提供一种信息预测装置,如图5所示,该装置500包括:第二获取模块501、社区确定模块502、社区匹配模块503以及房产评估模块504。
第二获取模块501,用于获取待评估房产的位置信息以及待评估房产的房产属性信息;
社区确定模块502,用于根据待评估房产的位置信息确定待评估房产所归属的归属社区;
社区匹配模块503,用于从预设的异构图中确定与归属社区的社区属性信息相匹配的目标社区,其中,异构图用于表征待评估房产与归属社区,以及归属社区与其他社区之间的关联关系;
房产评估模块504,用于根据待评估房产的房产属性信息以及目标社区所对应的历史房产交易信息,对待评估房产的价值进行估算,得到待评估房产的估算价值。
本申请实施例提供的预测模型的训练装置及信息预测装置能够实现前述方法实施例实现的各个过程,为避免重复,这里不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图6示出了本申请实施例提供的电子设备的硬件结构示意图。
电子设备可以包括处理器601以及存储有计算机程序指令的存储器602。
具体地,上述处理器601可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器602可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器602可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器602可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器602可在综合网关容灾设备的内部或外部。在特定实施例中,存储器602是非易失性固态存储器。
存储器可包括只读存储器(ROM),随机存取存储器(RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本公开的一方面的方法所描述的操作。
处理器601通过读取并执行存储器602中存储的计算机程序指令,以实现上述实施例中的任意一种预测模型的训练方法或信息预测方法。
在一个示例中,电子设备还可包括通信接口603和总线610。其中,如图6所示,处理器601、存储器602、通信接口603通过总线610连接并完成相互间的通信。
通信接口603,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线610包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线610可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
另外,结合上述实施例中的预测模型的训练方法或信息预测方法,本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种预测模型的训练方法或信息预测方法。
另外,结合上述实施例中的预测模型的训练方法或信息预测方法,本申请实施例可提供一种计算机程序产品来实现。该计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行实现如上述实施例中任意一种预测模型的训练方法或信息预测方法。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能模块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本公开的实施例的方法、装置和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。
Claims (12)
1.一种预测模型的训练方法,其特征在于,包括:
获取房产样本的房产属性信息以及所述房产样本所对应的社区样本的社区属性信息;
基于所述房产样本的房产属性信息以及所述社区样本的社区属性信息构建异构图,其中,所述异构图用于表征待评估房产与所述待评估房产的归属社区,以及所述归属社区与其他社区之间的关联关系;
根据目标房产所属目标社区发生的房产交易事件确定所述目标社区在所述异构图中的历史状态嵌入向量,其中,所述目标社区为所述社区样本中的任意一个社区,所述目标房产为所述目标社区所包含的多个房产中的任意一个,所述历史状态嵌入向量为由所述目标社区的历史社区属性信息以及所述目标社区的历史房产交易信息所组成的向量;
基于所述历史状态嵌入向量以及所述社区样本中的其他社区的状态嵌入向量对所述目标社区的状态嵌入向量进行更新,得到更新后的异构图;
对所述更新后的异构图进行多任务学习,得到用于评估房产价值的房产评估模型。
2.根据权利要求1所述的方法,其特征在于,基于所述房产样本的房产属性信息以及所述社区样本的社区属性信息构建异构图,包括:
获取所述社区样本中多个社区之间的社区距离;
根据所述社区距离确定所述多个社区所对应的社区节点之间的关联关系,生成所述社区节点之间的第一边;
获取所述房产样本与所述社区样本之间的关联关系,生成所述房产样本对应的房产节点与所述社区节点之间的第二边;
对所述房产样本所对应的房产交易价格与所述第二边进行关联,生成与所述第二边关联的标签;
基于所述社区节点、所述房产节点、所述第一边、所述第二边以及所述标签生成所述异构图。
3.根据权利要求1所述的方法,其特征在于,根据目标房产所属目标社区发生的房产交易事件确定所述目标社区在所述异构图中的历史状态嵌入向量,包括:
获取所述目标社区发生相邻两次房产交易事件的时间间隔,其中,所述时间间隔为所述目标社区在目标时间发送房产交易事件的时间,与上一次发生房产交易事件的时间的差值;
对所述时间间隔进行傅里叶特征表示,得到时间嵌入向量;
按照预设顺序对所述时间嵌入向量、所述目标房产的房产属性信息、所述目标房产的房产交易价格、所述目标社区在所述目标时间的状态嵌入向量进行连接操作,生成目标权重向量;
对所述目标社区的上一状态嵌入向量和所述目标权重向量进行元素间的乘积,得到所述历史状态嵌入向量,其中,所述上一状态嵌入向量为所述目标社区上一次发生房产交易事件时的状态嵌入向量。
4.根据权利要求3所述的方法,其特征在于,基于所述历史状态嵌入向量以及所述社区样本中的其他社区的状态嵌入向量对所述目标社区的状态嵌入向量进行更新,得到更新后的异构图,包括:
按照预设顺序对所述目标房产的房产属性信息、所述目标房产的房产交易价格、所述目标社区在所述目标时间的社区属性信息进行连接操作,得到目标数据;
通过门控循环单元,采用所述目标数据对所述历史状态嵌入向量进行更新,得到所述目标社区在所述目标时间的状态嵌入向量;
获取与所述目标社区具有关联关系的其他社区的状态嵌入向量;
基于所述其他社区的状态嵌入向量以及所述目标数据对所述目标社区在所述目标时间的状态嵌入向量进行嵌入更新,得到所述更新后的异构图。
5.根据权利要求1所述的方法,其特征在于,对所述更新后的异构图进行多任务学习,得到所述房产评估模型,包括:
为所述更新后的异构图中的多个社区构建任务,得到与每个社区所对应的社区任务;
将所述多个社区所对应的社区属性信息输入至目标网络模型中,通过所述目标网络模型确定每个社区任务所对应的任务特征;
通过多层感知机对所述每个社区任务所对应的任务特征进行实例化处理,得到所述每个社区任务所对应的模型参数;
基于所述每个社区任务所对应的模型参数构建所述房产评估模型。
6.根据权利要求1所述的方法,其特征在于,在对所述更新后的异构图进行多任务学习,得到所述房产评估模型之后,所述方法还包括:
确定所述房产评估模型对所述房产样本中的每个房产进行估值的估值结果;
计算所述估值结果与目标交易价格之间的差异值;
在所述差异值大于或等于预设差异值的情况下,对所述房产评估模型进行参数更新,直至所述差异值小于所述预设差异值。
7.一种信息预测方法,其特征在于,应用于采用权利要求1-6中任意一项所述的方法训练得到的房产评估模型中,所述方法包括:
获取待评估房产的位置信息以及所述待评估房产的房产属性信息;
根据所述待评估房产的位置信息确定所述待评估房产所归属的归属社区;
从预设的异构图中确定与所述归属社区的社区属性信息相匹配的目标社区,其中,所述异构图用于表征所述待评估房产与所述归属社区,以及所述归属社区与其他社区之间的关联关系;
根据所述待评估房产的房产属性信息以及所述目标社区所对应的历史房产交易信息,对所述待评估房产的价值进行估算,得到所述待评估房产的估算价值。
8.一种预测模型的训练装置,其特征在于,包括:
第一获取模块,用于获取房产样本的房产属性信息以及所述房产样本所对应的社区样本的社区属性信息;
异构图构建模块,用于基于所述房产样本的房产属性信息以及所述社区样本的社区属性信息构建异构图,其中,所述异构图用于表征待评估房产与所述待评估房产的归属社区,以及所述归属社区与其他社区之间的关联关系;
向量确定模块,用于根据目标房产所属目标社区发生的房产交易事件确定所述目标社区在所述异构图中的历史状态嵌入向量,其中,所述目标社区为所述社区样本中的任意一个社区,所述目标房产为所述目标社区所包含的多个房产中的任意一个,所述历史状态嵌入向量为由所述目标社区的历史社区属性信息以及所述目标社区的历史房产交易信息所组成的向量;
嵌入更新模块,用于基于所述历史状态嵌入向量以及所述社区样本中的其他社区的状态嵌入向量对所述目标社区的状态嵌入向量进行更新,得到更新后的异构图;
模型训练模块,用于对所述更新后的异构图进行多任务学习,得到用于评估房产价值的房产评估模型。
9.一种信息预测装置,其特征在于,应用于采用权利要求1-6中任意一项所述的方法训练得到的房产评估模型中,包括:
第二获取模块,用于获取待评估房产的位置信息以及所述待评估房产的房产属性信息;
社区确定模块,用于根据所述待评估房产的位置信息确定所述待评估房产所归属的归属社区;
社区匹配模块,用于从预设的异构图中确定与所述归属社区的社区属性信息相匹配的目标社区,其中,所述异构图用于表征所述待评估房产与所述归属社区,以及所述归属社区与其他社区之间的关联关系;
房产评估模块,用于根据所述待评估房产的房产属性信息以及所述目标社区所对应的历史房产交易信息,对所述待评估房产的价值进行估算,得到所述待评估房产的估算价值。
10.一种电子设备,其特征在于,电子设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-6任意一项所述的预测模型的训练方法或权利要求7所述的信息预测方法。
11.一种计算机可读存储介质,其特征在于,计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-6任意一项所述的预测模型的训练方法或权利要求7所述的信息预测方法。
12.一种计算机程序产品,其特征在于,计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如权利要求1-6任意一项所述的预测模型的训练方法或权利要求7所述的信息预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311302785.3A CN117217779A (zh) | 2023-10-09 | 2023-10-09 | 预测模型的训练方法、装置及信息预测方法、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311302785.3A CN117217779A (zh) | 2023-10-09 | 2023-10-09 | 预测模型的训练方法、装置及信息预测方法、装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117217779A true CN117217779A (zh) | 2023-12-12 |
Family
ID=89040662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311302785.3A Pending CN117217779A (zh) | 2023-10-09 | 2023-10-09 | 预测模型的训练方法、装置及信息预测方法、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117217779A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117539920A (zh) * | 2024-01-04 | 2024-02-09 | 上海途里信息科技有限公司 | 基于房产交易多维度数据的数据查询方法及系统 |
-
2023
- 2023-10-09 CN CN202311302785.3A patent/CN117217779A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117539920A (zh) * | 2024-01-04 | 2024-02-09 | 上海途里信息科技有限公司 | 基于房产交易多维度数据的数据查询方法及系统 |
CN117539920B (zh) * | 2024-01-04 | 2024-04-05 | 上海途里信息科技有限公司 | 基于房产交易多维度数据的数据查询方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cheng et al. | A non-linear case-based reasoning approach for retrieval of similar cases and selection of target credits in LEED projects | |
Sun et al. | Understanding architecture age and style through deep learning | |
CN114220271B (zh) | 基于动态时空图卷积循环网络的交通流预测方法、设备及存储介质 | |
Lv et al. | Blind travel prediction based on obstacle avoidance in indoor scene | |
Zaki et al. | House price prediction using hedonic pricing model and machine learning techniques | |
CN113673769B (zh) | 基于多元时间序列插补的图神经网络交通流预测方法 | |
Seya et al. | A comparison of residential apartment rent price predictions using a large data set: Kriging versus deep neural network | |
Konstantakopoulos et al. | Design, benchmarking and explainability analysis of a game-theoretic framework towards energy efficiency in smart infrastructure | |
CN117217779A (zh) | 预测模型的训练方法、装置及信息预测方法、装置 | |
Zhang et al. | MugRep: A multi-task hierarchical graph representation learning framework for real estate appraisal | |
CN110210656A (zh) | 基于站点行为分析的共享单车流量预测方法及系统 | |
CN114579892B (zh) | 一种基于跨城市兴趣点匹配的用户异地访问位置预测方法 | |
CN113314188B (zh) | 图结构增强的小样本学习方法、系统、设备及存储介质 | |
Abdul-Rahman et al. | Advanced machine learning algorithms for house price prediction: case study in Kuala Lumpur | |
CN116884222B (zh) | 一种卡口节点的短时交通流预测方法 | |
Ragapriya et al. | Machine Learning Based House Price Prediction Using Modified Extreme Boosting | |
Meng et al. | POI recommendation for occasional groups Based on hybrid graph neural networks | |
Li et al. | Graph convolution recurrent denoising diffusion model for multivariate probabilistic temporal forecasting | |
Alghamdi | Smart city urban planning using an evolutionary deep learning model | |
CN113590971A (zh) | 一种基于类脑时空感知表征的兴趣点推荐方法及系统 | |
Chen et al. | Research on object detection algorithm based on multilayer information fusion | |
WO2023174064A1 (zh) | 自动搜索方法、自动搜索的性能预测模型训练方法及装置 | |
CN117116048A (zh) | 基于知识表示模型和图神经网络的知识驱动交通预测方法 | |
CN117079148A (zh) | 城市功能区的识别方法、装置、设备和介质 | |
Ma et al. | Research and application of second-hand housing price prediction model based on LSTM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |