CN114817480A - 一种土地资源值确定方法、装置、电子设备及存储介质 - Google Patents

一种土地资源值确定方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114817480A
CN114817480A CN202210553645.2A CN202210553645A CN114817480A CN 114817480 A CN114817480 A CN 114817480A CN 202210553645 A CN202210553645 A CN 202210553645A CN 114817480 A CN114817480 A CN 114817480A
Authority
CN
China
Prior art keywords
word vector
land
feature
decoding
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210553645.2A
Other languages
English (en)
Inventor
杨罡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
CCB Finetech Co Ltd
Original Assignee
China Construction Bank Corp
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp, CCB Finetech Co Ltd filed Critical China Construction Bank Corp
Priority to CN202210553645.2A priority Critical patent/CN114817480A/zh
Publication of CN114817480A publication Critical patent/CN114817480A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Tourism & Hospitality (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Educational Administration (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本申请提供一种土地资源值确定方法、装置、电子设备及存储介质,涉及土地数据分析技术领域。其中,土地资源值确定方法包括:获取多个维度的土地特征数据,将多个维度的土地特征数据输入已训练的词向量模型,得到词向量特征矩阵,将词向量特征矩阵输入到已训练的编解码模型中,得到土地资源值分析结果。对多个维度的土地特征进行分析,得到的土地资源值分析结果相较于现有技术中仅能对某些单一的土地特征进行分析更具有说服力,并且通过已训练的词向量模型和已训练的编解码模型对数据进行自动的,智能化处理,相比于现有技术中通过人为的对土地资源值进行计算,本申请可以快速、准确且科学的得到土地资源值分析结果。

Description

一种土地资源值确定方法、装置、电子设备及存储介质
技术领域
本申请涉及土地数据分析技术领域,特别涉及一种土地资源值确定方法、装置、电子设备及存储介质。
背景技术
现有技术中,在涉及到土地流转时,一般是人为的通过简单的数学公式进行分析,在分析的过程中,无法有效的处理如此庞大的数据,单靠人力以及简单的公式进行处理最终得到的土地资源值分析结果,准确率较低,且可靠性不高。
如何能够提供一种准确的,针对土地流转的土地资源值确定方法是一个亟待解决的问题。
发明内容
为了解决上述现有技术中的问题,本申请实施例提供了一种土地资源值确定方法、装置、电子设备及存储介质,通过网络模型对多个维度的土地特征数据进行分析,可以准确、得到科学的土地资源值分析结果。
第一方面,本申请实施例提供了一种土地资源值确定方法,所述方法包括:
获取多个维度的土地特征数据;所述多个维度的土地特征数据与土地资源值存在关联关系;
将所述多个维度的土地特征数据输入已训练的词向量模型,得到词向量特征矩阵;
将所述词向量特征矩阵输入到已训练的编解码模型中,得到土地资源值分析结果。
在一种可能的实施方式中,所述多个维度的土地特征数据包括土地面积、土地所属地区的气候、地形、土地种植作物的类型和作物种植密度。
在一种可能的实施方式中,所述词向量模型包括输入层、汇总嵌入层以及输出层;所述将所述多个维度的土地特征数据输入已训练的词向量模型,得到词向量特征矩阵,包括:
将所述多个维度的土地特征数据输入所述输入层,通过所述输入层对所述多个维度的土地特征数据进行特征提取,得到多个土地特征向量;
将所述多个土地特征向量输入所述汇总嵌入层进行特征拼接,得到特征拼接矩阵;
将所述特征拼接矩阵输入所述输出层进行归一化处理,得到所述词向量特征矩阵。
在一种可能的实施方式中,所述编解码模型包括编码器和解码器;所述将所述词向量特征矩阵输入到已训练的编解码模型中,得到土地资源值分析结果,包括:
将所述词向量特征矩阵输入所述编码器,得到词向量编码结果;
将所述词向量编码结果输入所述解码器,通过所述解码器对所述词向量编码结果进行解码,得到所述土地资源值分析结果。
在一种可能的实施方式中,所述编码器包括多个编码层;所述将所述词向量特征矩阵输入到所述编码器中,得到词向量编码结果,包括:
基于多个编码层对所述词向量特征矩阵进行编码处理,得到多个编码结果;其中,每个编码层输出一个编码结果;所述编码器中的第一编码层的输入为所述词向量编码结果,除所述第一编码层以外的每个编码层的输入为各自对应的上一编码层输出的编码结果;
将所述编码器中最后一个编码层输出的编码结果作为词向量编码结果。
在一种可能的实施方式中,所述解码器包括多个解码层;所述将所述词向量编码结果输入所述解码器,通过所述解码器对所述词向量编码结果进行解码,得到所述土地资源值分析结果,包括:
基于多个解码层多所述词向量编码结果进行解码,得到多个解码结果;其中,每个解码层输出一个解码结果;所述解码器中的第一解码层的输入为所述词向量编码结果,除所述第一解码层以外的每个解码层的输入为各自对应的上一解码层输出的解码结果以及所述词向量编码结果;
将所述解码器中最后一个解码层输出的解码结果作为土地资源值分析结果。
在一种可能的实施方式中,所述词向量模型的训练过程,包括:
获取第一文本数据训练集和特征矩阵标签;所述第一文本数据训练集包括多个维度的土地特征训练样本;所述特征矩阵标签为表征所述多个维度的土地特征训练样本对应的语义信息的特征矩阵;
基于所述第一文本数据训练集以及所述特征矩阵标签,对所述词向量模型进行迭代训练;其中,一次迭代训练过程包括:
从所述第一文本数据训练集中抽取多个土地特征训练样本,输入所述词向量模型中,确定训练特征矩阵;
基于所述训练特征矩阵和所述特征矩阵标签,确定词向量损失值;
根据所述词向量损失值,调整所述词向量模型的网络参数,直至所述词向量损失值满足第一预设值,得到已训练的词向量模型。
在一种可能的实施方式中,所述编解码模型的训练过程,包括:
获取第二文本数据训练集和土地资源值标签数据;所述第二文本数据训练集包括多个词向量样本特征矩阵;所述土地资源值标签数据为表征所述多个词向量样本特征矩阵与土地资源值之间关联关系的数据;
基于所述第二文本数据训练集和所述土地资源值标签数据,对所述编解码模型进行迭代训练;其中,一次迭代训练过程包括:
从所述第二文本数据训练集中抽取多个词向量样本特征矩阵,输入所述编解码模型中,得到土地资源值训练结果;
基于所述土地资源值训练结果和所述土地资源值标签数据,确定编解码损失值;
根据所述编解码损失值,调整所述编解码模型的网络参数,直至所述编解码损失值满足第二预设值,得到已训练的编解码模型。
第二方面,本申请实施例提供了一种土地资源值确定装置,所述装置包括:
获取单元,用于获取多个维度的土地特征数据;所述多个维度的土地特征数据与土地资源值存在关联关系;
确定单元,用于将所述多个维度的土地特征数据输入已训练的词向量模型,得到词向量特征矩阵;
编解码单元,用于将所述词向量特征矩阵输入到已训练的编解码模型中,得到土地资源值分析结果。
在一种可能的实施方式中,所述确定单元,还用于:
将所述多个维度的土地特征数据输入所述输入层,通过所述输入层对所述多个维度的土地特征数据进行特征提取,得到多个土地特征向量;
将所述多个土地特征向量输入所述汇总嵌入层进行特征拼接,得到特征拼接矩阵;
将所述特征拼接矩阵输入所述输出层进行归一化处理,得到所述词向量特征矩阵。
在一种可能的实施方式中,所述编解码单元,还用于:
将所述词向量特征矩阵输入所述编码器,得到词向量编码结果;
将所述词向量编码结果输入所述解码器,通过所述解码器对所述词向量编码结果进行解码,得到所述土地资源值分析结果。
在一种可能的实施方式中,所述编解码单元,还用于:
基于多个编码层对所述词向量特征矩阵进行编码处理,得到多个编码结果;其中,每个编码层输出一个编码结果;所述编码器中的第一编码层的输入为所述词向量编码结果,除所述第一编码层以外的每个编码层的输入为各自对应的上一编码层输出的编码结果;
将所述编码器中最后一个编码层输出的编码结果作为词向量编码结果。
在一种可能的实施方式中,所述编解码单元,还用于:
基于多个解码层多所述词向量编码结果进行解码,得到多个解码结果;其中,每个解码层输出一个解码结果;所述解码器中的第一解码层的输入为所述词向量编码结果,除所述第一解码层以外的每个解码层的输入为各自对应的上一解码层输出的解码结果以及所述词向量编码结果;
将所述解码器中最后一个解码层输出的解码结果作为土地资源值分析结果。
在一种可能的实施方式中,所述土地资源值确定装置,还包括:
第一训练单元,用于获取第一文本数据训练集和特征矩阵标签;所述第一文本数据训练集包括多个维度的土地特征训练样本;所述特征矩阵标签为表征所述多个维度的土地特征训练样本对应的语义信息的特征矩阵;
基于所述第一文本数据训练集以及所述特征矩阵标签,对所述词向量模型进行迭代训练;其中,一次迭代训练过程包括:
从所述第一文本数据训练集中抽取多个土地特征训练样本,输入所述词向量模型中,确定训练特征矩阵;
基于所述训练特征矩阵和所述特征矩阵标签,确定词向量损失值;
根据所述词向量损失值,调整所述词向量模型的网络参数,直至所述词向量损失值满足第一预设值,得到已训练的词向量模型。
在一种可能的实施方式中,所述土地资源值确定装置,还包括:
第二训练单元,用于获取第二文本数据训练集和土地资源值标签数据;所述第二文本数据训练集包括多个词向量样本特征矩阵;所述土地资源值标签数据为表征所述多个词向量样本特征矩阵与土地资源值之间关联关系的数据;
基于所述第二文本数据训练集和所述土地资源值标签数据,对所述编解码模型进行迭代训练;其中,一次迭代训练过程包括:
从所述第二文本数据训练集中抽取多个词向量样本特征矩阵,输入所述编解码模型中,得到土地资源值训练结果;
基于所述土地资源值训练结果和所述土地资源值标签数据,确定编解码损失值;
根据所述编解码损失值,调整所述编解码模型的网络参数,直至所述编解码损失值满足第二预设值,得到已训练的编解码模型。
第三方面,本申请实施例提供了一种电子设备,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,当所述计算机程序被所述处理器执行时,实现第一方面中任一项土地资源值确定方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现第一方面中任一项土地资源值确定方法的步骤。
第五方面,本申请实施例提供了一种计算机程序产品,包括有计算机可执行指令,所述计算机可执行指令用于使计算机执行第一方面中任一项土地资源值确定方法的步骤。
本申请实施例提供了一种土地资源值确定方法,获取多个维度的土地特征数据,多个维度的土地特征数据与土地资源值存在关联关系,将多个维度的土地特征数据输入已训练的词向量模型,得到词向量特征矩阵,将词向量特征矩阵输入到已训练的编解码模型中,得到土地资源值分析结果。对多个维度的土地特征进行分析,得到的土地资源值分析结果相较于现有技术中仅能对某些单一的特征进行分析更具有说服力。并且本申请在处理数据之前,会先通过机器学习的方式对需要使用的模型进行训练,可以通过机器学习的方式挖掘出土地特征数据中的隐藏特征,再通过已训练的词向量模型和已训练的编解码模型对多个维度的土地特征数据进行自动的,智能化处理,在网络模型使用过程汇总,处理数据的过程全程没有人为参与,相比于现有技术中通过人为的对土地资源值进行计算,本申请可以快速、准确且科学的得到土地资源值分析结果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种土地资源值确定方法的流程示意图;
图2为本申请实施例提供的一种词向量模型的结构示意图;
图3为本申请实施例提供的一种编解码模型的结构示意图;
图4为本申请实施例提供的一种编码器处理词向量特征矩阵的流程示意图;
图5为本申请实施例提供的一种编码器处理词向量编码结果的流程示意图;
图6为本申请实施例提供的一种词向量模型的训练过程的流程示意图;
图7为本申请实施例提供的一种编解码模型的训练过程的流程示意图;
图8为本申请实施例提供的一种土地资源值确定装置的结构示意图;
图9为本申请实施例提供的另一种土地资源值确定装置的结构示意图;
图10为本申请实施例提供一种电子设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
需要说明的是,本申请的文件中涉及的术语“包括”和“具有”以及它们的变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
针对下列词汇进行解释:
土地流转:土地流转是指土地使用权流转。土地使用权流转的含义,是指拥有土地承包经营权的农户将土地经营权(使用权)转让给其他农户或经济组织,即保留承包权,转让使用权。
针对现有技术中,针对土地流转问题,一般是通过简单的数学公式进行分析,在分析的过程中,无法有效的处理如此庞大的数据,单靠人力以及简单的公式进行处理最终得到的分析结果,准确率较低,缺乏说服力。
发明人针对现有技术中存在的问题,为了实现一种可以准确,科学的,针对一块土地在进行土地流转时,得到土地资源值的分析结果。通过准确的分析结果可以帮助涉及土地流转的用户进行决策。
本申请提供了一种土地资源值确定方法,获取多个维度的土地特征数据;多个维度的土地特征数据与土地资源值存在关联关系,将多个维度的土地特征数据输入已训练的词向量模型,得到词向量特征矩阵,将词向量特征矩阵输入到已训练的编解码模型中,得到土地资源值分析结果。通过已训练的词向量模型和已训练的编解码模型对多个维度的土地特征数据进行处理,不仅可以准确的得到土地资源值分析结果,并且通过训练好的词向量模型和已训练的编解码模型还可以模拟土地流转过程,对土地流转过程进行分析,得到土地流转过程中保证土地资源值最高的最佳方式。
需要说明的是,本申请技术方案中,对数据的采集、传播、使用等,均符合国家相关法律法规要求。
图1示出了本申请实施例提供的一种土地资源值确定方法,应用于电子设备,该电子设备可以为服务器。如图1所示,本申请实施例提供的土地资源值确定方法包括以下步骤:
步骤S101:获取多个维度的土地特征数据。
在一种可能的实施例中,上述多个维度的土地特征数据可以包括土地面积、土地所属地区气候、地形、土地种植作物类型和作物种植密度等,还可以包括其他各种土地特征数据。上述土地特征数据为表征土地特征的一些文字文本,例如,土地面积为5亩,作物种植密度为作物间距50厘米等。
其中,多个维度的土地特征数据与土地资源值存在关联关系。土地特征数据的不同会影响土地资源值的大小,通过对多个维度的土地特征数据进行处理,最终可以得到土地资源值,若改变其中一个维度的土地特征数据,最终的土地资源值可能就会发生改变。土地资源值可以表征土地流转时的土地产生的价值。
上述多个维度的土地特征数据可以为通过待进行土地流转的土地测量得到的,也可以是通过对土地的模拟得到的一些数据。
步骤S102:将多个维度的土地特征数据输入已训练的词向量模型,得到词向量特征矩阵。
在一种可能的实施例中,将上述多个维度的土地特征数据输入到已训练的词向量模型中,已训练的词向量模型可以对文字文本进行处理,得到最终的词向量特征矩阵。词向量特征矩阵即为可以表征土地特征数据的特征矩阵,可以理解为将文字文本转换成可以网络模型可以识别出的特征矩阵。
在一种可能的实施例中,如图2所示,词向量模型(word2vex)包括输入层、汇总嵌入层以及输出层。将多个维度的土地特征数据输入输入层,通过输入层对多个维度的土地特征数据进行特征提取,得到多个土地特征向量,将多个土地特征向量输入汇总嵌入层进行特征拼接,得到特征拼接矩阵,将特征拼接矩阵输入输出层进行归一化处理,得到词向量特征矩阵。
步骤S103:将词向量特征矩阵输入到已训练的编解码模型中,得到土地资源值分析结果。
在一种可能的实施例中,如图3所示,编解码模型(Bidirectional EncoderRepresentation from Transformers,BERT)包括编码器(Encoder)和解码器(Decoder)。将词向量特征矩阵输入编码器,得到词向量编码结果,将词向量编码结果输入解码器,通过解码器对词向量编码结果进行解码,得到土地资源值分析结果。
其中,以编码器中包括6个编码层为例,如图4所示,则对词向量特征矩阵输入到编码器中进行处理的具体过程为:
第一编码层的输入为词向量特征矩阵,输出为第一编码结果。
第二编码层的输入为第一编码结果,输出为第二编码结果,以此类推,除第一编码层以外的每个编码层的输入为各自对应的上一编码层输出的编码结果,最终通过最后一层编码层,可以得到第六编码结果,此处的第六编码结果即为词向量编码结果。
其中,以解码器中包括6个解码层为例,如图5所示,则对词向量编码结果输入到解码器中进行处理的具体过程为:
第一解码层的输入为词向量编码结果,输出为第一解码结果。
第二解码层的输入为第一解码结果和词向量编码结果,输出为第二解码结果,以此类推,除第一解码层以外的每个解码层的输入为各自对应的上一解码层输出的解码结果以及词向量编码结果。通过最后一层解码层,可以得到第六解码结果,此处的第六解码结果即为土地资源值分析结果。
本申请实施例提供的土地资源值确定方法,通过已训练的词向量模型和已训练的编解码模型对多个维度的土地特征数据进行处理,不仅可以准确的得到土地资源值分析结果。
通过训练好的词向量模型和已训练的编解码模型还可以模拟土地流转过程,对土地流转过程进行分析,得到土地流转过程中保证土地资源值最高的最佳方式。例如,可以通过对某一块地进行模拟,并对这一块地的土地特征进行分析,得到此块土地在土地流转的过程中,如何才能体现出最大的价值,以此来对此块土地的使用者进行一定的指导,使此块土地在土地流转的过程中获取最大的价值。
还可以通过得到的土地资源值分析结果进行分析,哪些土地特征数据对土地资源值的影响更大,以及将土地资源值分析结果和土地特征数据进行关联。
在上述过程中,获取到的全部数据均可以存储在数据库中,以在需要使用时提取出来。通过上述词向量模型和编解码模型对土地特征数据进行分析,得到土地资源值分析结果时,可以通过对土地资源值分析结果进行结果可视化,通过超文本标记语言(HyperText Mark-up Language,HTMT)前端页面或者网页服务器(Web Sereve)的方式将土地资源值分析结果可视化。
上述对土地特征进行分析过程中使用到的词向量模型可以采用如图6所示的训练方法得到,如图6所示,词向量模型的训练过程包括以下步骤:
步骤S601:获取第一文本数据训练集和特征矩阵标签。
在一种可能的实施例中,在训练词向量模型的过程中,需要用到的数据很多,并且需要数据都带有对应的标签。所以,可以通过对以往的土地流转过程中的数据进行采集,用土地流转的数据作为词向量模型的训练集。
具体地,针对土地流转过程中需要用到的多个维度的土地特征训练样本进行提取关键词,通过关键词检索的方式,在数据库或者网页中进行检索来采集数据。其中,可以通过设置关键词的方式,在网页中通过自定义接口或者一些其他方式获取土地流转的数据。
在获取到土地流转的数据之后,将这些土地流转的数据作为训练数据集保存至本地数据库中。
在一种可能的实施例中,将训练数据集保存至本地数据库中之后,可以对训练数据集中的一部分数据进行整理,得到中间数据集。例如,在土地流转的过程中,若季节对土地流转过程中的土地资源值影响几乎没有,则可以在训练词向量模型的过程中将季节这里因素删除。
得到中间数据集之后,可以将这些数据通过表格的方式进行排布和整理,即可以得到第一文本数据训练集。
由于在网页中得到的数据均是可以明确文本的语义信息的,可以直接针对第一文本数据训练集获取到特征矩阵标签,特征矩阵标签为表征多个维度的土地特征训练样本对应的语义信息的特征矩阵。
步骤S602:从第一文本数据训练集中抽取多个土地特征训练样本,输入词向量模型中,确定训练特征矩阵。
在一种可能的实施例中,词向量模型对多个土地特征训练样本的处理过程与步骤S102中的过程类似,具体过程不再赘述,最终可以得到训练特征矩阵Xn
Figure BDA0003651509200000121
步骤S603:基于训练特征矩阵和特征矩阵标签,确定词向量损失值。
步骤S604:判断词向量损失值是否满足第一预设值。若满足,则执行步骤S606;若不满足,则执行步骤S605。
步骤S605:根据词向量损失值,调整词向量模型的网络参数。
步骤S606:将当前的网络参数作为词向量模型的网络参数,得到已训练的词向量模型。
编解码模型可以采用如图7所示的训练方法得到,如图7所示,编解码模型的训练过程包括以下步骤:
步骤S701:获取第二文本数据训练集和土地资源值标签数据。
其中,第二文本数据训练集包括多个词向量样本特征矩阵。土地资源值标签数据为表征多个词向量样本特征矩阵与土地资源值之间关联关系的数据。
在一种可能的实施例中,将步骤S601中获取训练数据集的方式用在步骤S701中,可以获取到第二文本数据训练集和土地资源值标签数据。
步骤S702:从第二文本数据训练集中抽取多个词向量样本特征矩阵,输入编解码模型中,得到土地资源值训练结果。
在一种可能的实施例中,编解码模型对多个词向量样本特征矩阵的处理过程与步骤S103中的过程类似,具体过程不再赘述。
步骤S703:基于土地资源值训练结果和土地资源值标签数据,确定编解码损失值。
步骤S704:判断编解码损失值是否满足第二预设值。若满足,则执行步骤S706;若不满足,则执行步骤S705。
步骤S705:根据编解码损失值,调整编解码模型的网络参数。
步骤S706:将当前的网络参数作为编解码模型的网络参数,得到已训练的编解码模型。
本申请实施例还提供了一种土地资源值确定装置。图8为本申请实施例提供的一种土地资源值确定装置的结构示意图;如图8所示,该土地资源值确定装置包括:
获取单元801,用于获取多个维度的土地特征数据;多个维度的土地特征数据与土地资源值存在关联关系;
确定单元802,用于将多个维度的土地特征数据输入已训练的词向量模型,得到词向量特征矩阵;
编解码单元803,用于将词向量特征矩阵输入到已训练的编解码模型中,得到土地资源值分析结果。
在一种可能的实施方式中,确定单元802,还用于:
将多个维度的土地特征数据输入输入层,通过输入层对多个维度的土地特征数据进行特征提取,得到多个土地特征向量;
将多个土地特征向量输入汇总嵌入层进行特征拼接,得到特征拼接矩阵;
将特征拼接矩阵输入输出层进行归一化处理,得到词向量特征矩阵。
在一种可能的实施方式中,编解码单元803,还用于:
将词向量特征矩阵输入编码器,得到词向量编码结果;
将词向量编码结果输入解码器,通过解码器对词向量编码结果进行解码,得到土地资源值分析结果。
在一种可能的实施方式中,编解码单元803,还用于:
基于多个编码层对词向量特征矩阵进行编码处理,得到多个编码结果;其中,每个编码层输出一个编码结果;编码器中的第一编码层的输入为词向量编码结果,除第一编码层以外的每个编码层的输入为各自对应的上一编码层输出的编码结果;
将编码器中最后一个编码层输出的编码结果作为词向量编码结果。
在一种可能的实施方式中,编解码单元803,还用于:
基于多个解码层多词向量编码结果进行解码,得到多个解码结果;其中,每个解码层输出一个解码结果;解码器中的第一解码层的输入为词向量编码结果,除第一解码层以外的每个解码层的输入为各自对应的上一解码层输出的解码结果以及词向量编码结果;
将解码器中最后一个解码层输出的解码结果作为土地资源值分析结果。
在一种可能的实施方式中,图9示出了本申请实施例提供的另一种土地资源值确定装置,该土地资源值确定装置还包括:
第一训练单元901,用于获取第一文本数据训练集和特征矩阵标签;第一文本数据训练集包括多个维度的土地特征训练样本;特征矩阵标签为表征多个维度的土地特征训练样本对应的语义信息的特征矩阵;
基于第一文本数据训练集以及特征矩阵标签,对词向量模型进行迭代训练;其中,一次迭代训练过程包括:
从第一文本数据训练集中抽取多个土地特征训练样本,输入词向量模型中,确定训练特征矩阵;
基于训练特征矩阵和特征矩阵标签,确定词向量损失值;
根据词向量损失值,调整词向量模型的网络参数,直至词向量损失值满足第一预设值,得到已训练的词向量模型。
在一种可能的实施方式中,该装置还包括:
第二训练单元902,用于获取第二文本数据训练集和土地资源值标签数据;第二文本数据训练集包括多个词向量样本特征矩阵;土地资源值标签数据为表征多个词向量样本特征矩阵与土地资源值之间关联关系的数据;
基于第二文本数据训练集和土地资源值标签数据,对编解码模型进行迭代训练;其中,一次迭代训练过程包括:
从第二文本数据训练集中抽取多个词向量样本特征矩阵,输入编解码模型中,得到土地资源值训练结果;
基于土地资源值训练结果和土地资源值标签数据,确定编解码损失值;
根据编解码损失值,调整编解码模型的网络参数,直至编解码损失值满足第二预设值,得到已训练的编解码模型。
本申请实施例还提供了一种电子设备,该电子设备至少包括用于存储数据的存储器和处理器,其中,对于用于数据处理的处理器而言,在执行处理时,可以采用微处理器、CPU、GPU(Graphics Processing Unit,图形处理单元)、DSP或FPGA实现。对于存储器来说,存储器中存储有操作指令,该操作指令可以为计算机可执行代码,通过该操作指令来实现上述本申请实施例的土地资源值确定方法的流程中的各个步骤。
图10为本申请实施例提供的一种电子设备的结构示意图。如图10所示,电子设备1000包括存储器1001、处理器1002、数据获取模块1003和总线1004。该存储器1001、处理器1002和数据获取模块1003均通过总线1004连接,该总线1004用于该存储器1001、处理器1002和数据获取模块1003之间传输数据。
其中,存储器1001可用于存储软件程序以及模块,处理器1002通过运行存储在存储器1001中的软件程序以及模块,从而执行电子设备1000的各种功能应用以及数据处理,如本申请实施例提供的土地资源值确定方法。存储器1001可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个应用的应用程序等;存储数据区可存储根据电子设备1000的使用所创建的数据等。此外,存储器1001可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器1002是电子设备1000的控制中心,利用总线1004以及各种接口和线路连接整个电子设备1000的各个部分,通过运行或执行存储在存储器1001内的软件程序和/或模块,以及调用存储在存储器1001内的数据,执行电子设备1000的各种功能和处理数据。可选的,处理器1002可包括一个或多个处理单元,如CPU、GPU(Graphics Processing Unit,图形处理单元)、数字处理单元等。
本申请实施例还提供了一种计算机可读存储介质,该计算机存储介质中存储有计算机可执行指令,该计算机程序被处理器执行时可用于实现本申请任一实施例所记载的土地资源值确定方法。
本申请实施例还提供了一种计算机程序产品,本申请实施例提供的土地资源值确定方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在计算机设备上运行时,所述程序代码用于使所述计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的土地资源值确定方法的步骤,例如,所述计算机设备可以执行如图1所示的步骤S101~S103的土地资源值确定方法的流程。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (16)

1.一种土地资源值确定方法,其特征在于,所述方法包括:
获取多个维度的土地特征数据;所述多个维度的土地特征数据与土地资源值存在关联关系;
将所述多个维度的土地特征数据输入已训练的词向量模型,得到词向量特征矩阵;
将所述词向量特征矩阵输入到已训练的编解码模型中,得到土地资源值分析结果。
2.根据权利要求1所述的方法,其特征在于,所述多个维度的土地特征数据包括土地面积、土地所属地区的气候、地形、土地种植作物的类型和作物种植密度。
3.根据权利要求1或2所述的方法,其特征在于,所述词向量模型包括输入层、汇总嵌入层以及输出层;所述将所述多个维度的土地特征数据输入已训练的词向量模型,得到词向量特征矩阵,包括:
将所述多个维度的土地特征数据输入所述输入层,通过所述输入层对所述多个维度的土地特征数据进行特征提取,得到多个土地特征向量;
将所述多个土地特征向量输入所述汇总嵌入层进行特征拼接,得到特征拼接矩阵;
将所述特征拼接矩阵输入所述输出层进行归一化处理,得到所述词向量特征矩阵。
4.根据权利要求1或2所述的方法,其特征在于,所述编解码模型包括编码器和解码器;所述将所述词向量特征矩阵输入到已训练的编解码模型中,得到土地资源值分析结果,包括:
将所述词向量特征矩阵输入所述编码器,得到词向量编码结果;
将所述词向量编码结果输入所述解码器,通过所述解码器对所述词向量编码结果进行解码,得到所述土地资源值分析结果。
5.根据权利要求4所述的方法,其特征在于,所述编码器包括多个编码层;所述将所述词向量特征矩阵输入到所述编码器中,得到词向量编码结果,包括:
基于多个编码层对所述词向量特征矩阵进行编码处理,得到多个编码结果;其中,每个编码层输出一个编码结果;所述编码器中的第一编码层的输入为所述词向量编码结果,除所述第一编码层以外的每个编码层的输入为各自对应的上一编码层输出的编码结果;
将所述编码器中最后一个编码层输出的编码结果作为词向量编码结果。
6.根据权利要求4所述的方法,其特征在于,所述解码器包括多个解码层;所述将所述词向量编码结果输入所述解码器,通过所述解码器对所述词向量编码结果进行解码,得到所述土地资源值分析结果,包括:
基于多个解码层多所述词向量编码结果进行解码,得到多个解码结果;其中,每个解码层输出一个解码结果;所述解码器中的第一解码层的输入为所述词向量编码结果,除所述第一解码层以外的每个解码层的输入为各自对应的上一解码层输出的解码结果以及所述词向量编码结果;
将所述解码器中最后一个解码层输出的解码结果作为土地资源值分析结果。
7.根据权利要求1所述的方法,其特征在于,所述词向量模型的训练过程,包括:
获取第一文本数据训练集和特征矩阵标签;所述第一文本数据训练集包括多个维度的土地特征训练样本;所述特征矩阵标签为表征所述多个维度的土地特征训练样本对应的语义信息的特征矩阵;
基于所述第一文本数据训练集以及所述特征矩阵标签,对所述词向量模型进行迭代训练;其中,一次迭代训练过程包括:
从所述第一文本数据训练集中抽取多个土地特征训练样本,输入所述词向量模型中,确定训练特征矩阵;
基于所述训练特征矩阵和所述特征矩阵标签,确定词向量损失值;
根据所述词向量损失值,调整所述词向量模型的网络参数,直至所述词向量损失值满足第一预设值,得到已训练的词向量模型。
8.根据权利要求1所述的方法,其特征在于,所述编解码模型的训练过程,包括:
获取第二文本数据训练集和土地资源值标签数据;所述第二文本数据训练集包括多个词向量样本特征矩阵;所述土地资源值标签数据为表征所述多个词向量样本特征矩阵与土地资源值之间关联关系的数据;
基于所述第二文本数据训练集和所述土地资源值标签数据,对所述编解码模型进行迭代训练;其中,一次迭代训练过程包括:
从所述第二文本数据训练集中抽取多个词向量样本特征矩阵,输入所述编解码模型中,得到土地资源值训练结果;
基于所述土地资源值训练结果和所述土地资源值标签数据,确定编解码损失值;
根据所述编解码损失值,调整所述编解码模型的网络参数,直至所述编解码损失值满足第二预设值,得到已训练的编解码模型。
9.一种土地资源值确定装置,其特征在于,所述装置包括:
获取单元,用于获取多个维度的土地特征数据;所述多个维度的土地特征数据与土地资源值存在关联关系;
确定单元,用于将所述多个维度的土地特征数据输入已训练的词向量模型,得到词向量特征矩阵;
编解码单元,用于将所述词向量特征矩阵输入到已训练的编解码模型中,得到土地资源值分析结果。
10.根据权利要求9所述的装置,其特征在于,所述确定单元,还用于:
将所述多个维度的土地特征数据输入所述输入层,通过所述输入层对所述多个维度的土地特征数据进行特征提取,得到多个土地特征向量;
将所述多个土地特征向量输入所述汇总嵌入层进行特征拼接,得到特征拼接矩阵;
将所述特征拼接矩阵输入所述输出层进行归一化处理,得到所述词向量特征矩阵。
11.根据权利要求9所述的装置,其特征在于,所述编解码单元,还用于:
将所述词向量特征矩阵输入所述编码器,得到词向量编码结果;
将所述词向量编码结果输入所述解码器,通过所述解码器对所述词向量编码结果进行解码,得到所述土地资源值分析结果。
12.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第一训练单元,用于获取第一文本数据训练集和特征矩阵标签;所述第一文本数据训练集包括多个维度的土地特征训练样本;所述特征矩阵标签为表征所述多个维度的土地特征训练样本对应的语义信息的特征矩阵;
基于所述第一文本数据训练集以及所述特征矩阵标签,对所述词向量模型进行迭代训练;其中,一次迭代训练过程包括:
从所述第一文本数据训练集中抽取多个土地特征训练样本,输入所述词向量模型中,确定训练特征矩阵;
基于所述训练特征矩阵和所述特征矩阵标签,确定词向量损失值;
根据所述词向量损失值,调整所述词向量模型的网络参数,直至所述词向量损失值满足第一预设值,得到已训练的词向量模型。
13.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第二训练单元,用于获取第二文本数据训练集和土地资源值标签数据;所述第二文本数据训练集包括多个词向量样本特征矩阵;所述土地资源值标签数据为表征所述多个词向量样本特征矩阵与土地资源值之间关联关系的数据;
基于所述第二文本数据训练集和所述土地资源值标签数据,对所述编解码模型进行迭代训练;其中,一次迭代训练过程包括:
从所述第二文本数据训练集中抽取多个词向量样本特征矩阵,输入所述编解码模型中,得到土地资源值训练结果;
基于所述土地资源值训练结果和所述土地资源值标签数据,确定编解码损失值;
根据所述编解码损失值,调整所述编解码模型的网络参数,直至所述编解码损失值满足第二预设值,得到已训练的编解码模型。
14.一种电子设备,其特征在于,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,当所述计算机程序被所述处理器执行时,实现权利要求1~8中任一项所述的方法。
15.一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,其特征在于:所述计算机程序被处理器执行时,实现权利要求1~8中任一项所述的方法。
16.一种计算机程序产品,其特征在于,包括有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1~8中任一项所述的方法。
CN202210553645.2A 2022-05-19 2022-05-19 一种土地资源值确定方法、装置、电子设备及存储介质 Pending CN114817480A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210553645.2A CN114817480A (zh) 2022-05-19 2022-05-19 一种土地资源值确定方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210553645.2A CN114817480A (zh) 2022-05-19 2022-05-19 一种土地资源值确定方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114817480A true CN114817480A (zh) 2022-07-29

Family

ID=82517148

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210553645.2A Pending CN114817480A (zh) 2022-05-19 2022-05-19 一种土地资源值确定方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114817480A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116137061A (zh) * 2023-04-20 2023-05-19 北京睿芯通量科技发展有限公司 数量统计模型的训练方法、装置、电子设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116137061A (zh) * 2023-04-20 2023-05-19 北京睿芯通量科技发展有限公司 数量统计模型的训练方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN107832299B (zh) 基于人工智能的标题的改写处理方法、装置及可读介质
CN112214610B (zh) 一种基于跨度和知识增强的实体关系联合抽取方法
CN109670191B (zh) 机器翻译的校准优化方法、装置与电子设备
CN110929038B (zh) 基于知识图谱的实体链接方法、装置、设备和存储介质
CN110287961A (zh) 中文分词方法、电子装置及可读存储介质
CN109948340B (zh) 一种卷积神经网络和XGBoost相结合的PHP-Webshell检测方法
CN108664512B (zh) 文本对象分类方法及装置
CN113434685B (zh) 一种资讯分类处理的方法及系统
CN112182167B (zh) 一种文本匹配方法、装置、终端设备和存储介质
CN107844558A (zh) 一种分类信息的确定方法以及相关装置
CN111090860A (zh) 一种基于深度学习的代码漏洞检测方法及装置
CN1629837A (zh) 电子文档的处理、浏览及分类查询的方法、装置及其系统
CN115186780B (zh) 学科知识点分类模型训练方法、系统、存储介质及设备
CN114817480A (zh) 一种土地资源值确定方法、装置、电子设备及存储介质
CN108664464B (zh) 一种语义相关度的确定方法及确定装置
CN115935983A (zh) 事件抽取方法、装置、电子设备及存储介质
CN112328469B (zh) 一种基于嵌入技术的函数级缺陷定位方法
CN117407505A (zh) 一种融合文档知识和问答对数据的问答检索方法及系统
CN114580354B (zh) 基于同义词的信息编码方法、装置、设备和存储介质
CN115718889A (zh) 针对公司简介的行业分类方法及装置
CN112925889B (zh) 自然语言处理方法、装置、电子设备和存储介质
CN114386048A (zh) 基于排序的开源软件安全漏洞补丁定位方法
CN114021555A (zh) 知识点自动标注的方法、装置、设备及可读存储介质
CN113886520A (zh) 一种基于图神经网络的代码检索方法、系统及计算机可读存储介质
CN111401034B (zh) 文本的语义分析方法、语义分析装置及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination