CN116883026B - 基于大数据的农产品产地溯源方法及系统 - Google Patents
基于大数据的农产品产地溯源方法及系统 Download PDFInfo
- Publication number
- CN116883026B CN116883026B CN202311144786.XA CN202311144786A CN116883026B CN 116883026 B CN116883026 B CN 116883026B CN 202311144786 A CN202311144786 A CN 202311144786A CN 116883026 B CN116883026 B CN 116883026B
- Authority
- CN
- China
- Prior art keywords
- tracing
- agricultural product
- network
- sample
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000000605 extraction Methods 0.000 claims abstract description 78
- 238000011156 evaluation Methods 0.000 claims abstract description 38
- 238000004458 analytical method Methods 0.000 claims abstract description 16
- 230000008878 coupling Effects 0.000 claims abstract description 8
- 238000010168 coupling process Methods 0.000 claims abstract description 8
- 238000005859 coupling reaction Methods 0.000 claims abstract description 8
- 238000004519 manufacturing process Methods 0.000 claims description 29
- 230000011218 segmentation Effects 0.000 claims description 15
- 230000008859 change Effects 0.000 claims description 13
- 230000007613 environmental effect Effects 0.000 claims description 13
- 238000005192 partition Methods 0.000 claims description 12
- 238000003306 harvesting Methods 0.000 claims description 10
- 230000002776 aggregation Effects 0.000 claims description 7
- 238000004220 aggregation Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 abstract description 4
- 238000009826 distribution Methods 0.000 description 7
- 238000012549 training Methods 0.000 description 7
- 239000002689 soil Substances 0.000 description 5
- 230000010198 maturation time Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000005070 ripening Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000009412 basement excavation Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000013097 stability assessment Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Business, Economics & Management (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- Agronomy & Crop Science (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- Mining & Mineral Resources (AREA)
- Marine Sciences & Fisheries (AREA)
- Animal Husbandry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于大数据的农产品产地溯源方法及系统,属于农产品管理领域,其中方法包括:构建基础信息数据库;建立标准农产品样本为参考基准,对农产品进行特异化特征提取,构建多维特征提取集;进行同地区的样本特征分析,设定同地区样本的特征极限区间;建立产地溯源网络,并基于建立结果进行不同地区的特征相似评价,确定相似溯源地区;对相似溯源地区搭建定位识别子网络,并将子网络耦合至产地溯源网络;提取目标农产品数据集,将目标农产品数据集输入产地溯源网络,生成产地溯源结果。本申请解决了现有技术中农产品溯源依据单一,导致农产品溯源不准确的技术问题,达到了利用农产品多维特征提高农产品溯源准确度的技术效果。
Description
技术领域
本发明涉及农产品管理领域,具体涉及基于大数据的农产品产地溯源方法及系统。
背景技术
随着人民生活水平的提高,消费者对农产品质量安全的要求也越来越高,实现农产品的源头溯源对于监管农产品质量安全具有重要意义。目前,条形码、二维码、RFID等技术手段已用于部分农产品的溯源。但这些方法存在溯源粒度粗、溯源依据单一,导致溯源准确度有限的问题,针对不同品种农产品的特异性特征挖掘也不够全面,难以实现精细化溯源与准确定位。
发明内容
本申请通过提供了基于大数据的农产品产地溯源方法及系统,旨在解决现有技术中农产品溯源依据单一,导致农产品溯源不准确的技术问题。
鉴于上述问题,本申请提供了基于大数据的农产品产地溯源方法及系统。
本申请公开的第一个方面,提供了基于大数据的农产品产地溯源方法,该方法包括:建立基础信息数据库,基础信息数据库依据大数据构建,且基础信息数据库中每一组数据均带有唯一产地标识;建立标准农产品样本,以标准农产品样本作为参考基准,对基础信息数据库中的农产品进行特异化特征提取,构建多维特征提取集;对多维特征提取集进行同地区的样本特征分析,设定同地区样本的特征极限区间;以多维特征提取集和特征极限区间建立产地溯源网络,并基于建立结果进行不同地区的特征相似评价,确定相似溯源地区;对相似溯源地区搭建定位识别子网络,并将定位识别子网络耦合至产地溯源网络;提取目标农产品数据集,将目标农产品数据集输入产地溯源网络,生成产地溯源结果。
本申请公开的另一个方面,提供了基于大数据的农产品产地溯源系统,该系统包括:信息数据库建立模块,用于建立基础信息数据库,基础信息数据库依据大数据构建,且基础信息数据库中每一组数据均带有唯一产地标识;特异化特征提取模块,用于建立标准农产品样本,以标准农产品样本作为参考基准,对基础信息数据库中的农产品进行特异化特征提取,构建多维特征提取集;样本特征分析模块,用于对多维特征提取集进行同地区的样本特征分析,设定同地区样本的特征极限区间;特征相似评价模块,用于以多维特征提取集和特征极限区间建立产地溯源网络,并基于建立结果进行不同地区的特征相似评价,确定相似溯源地区;定位识别子网络模块,用于对相似溯源地区搭建定位识别子网络,并将定位识别子网络耦合至产地溯源网络;产地溯源结果模块,用于提取目标农产品数据集,将目标农产品数据集输入产地溯源网络,生成产地溯源结果。
本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
由于采用了依据大数据建立基础信息数据库,存储农产品的基础信息,扩大信息量,有助于提高溯源分析的覆盖面;建立标准农产品样本,作为特征提取的参考基准,提高提取精度;对基础信息数据库中的农产品进行特异化特征提取,获取具有区分度的特征,构建多维特征提取集,为溯源提供特征依据;对多维特征提取集进行分析,设定同一产地的特征极限区间,使得溯源时可根据目标农产品特征与不同产地进行匹配定位;建立产地溯源网络,进行产地间的特征相似性分析,明确不同产地之间的特征对应关系,使网络模型在定位时考虑区域间的相似性;建立定位识别子网络,进行精确的定位,提高溯源的精细化程度;输入目标农产品的特征,基于产地溯源网络进行溯源,得出产地溯源结果的技术方案,解决了现有技术中农产品溯源依据单一,导致农产品溯源不准确的技术问题,达到了利用农产品多维特征提高农产品溯源准确度的技术效果。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
图1为本申请实施例提供了基于大数据的农产品产地溯源方法的一种流程示意图;
图2为本申请实施例提供了基于大数据的农产品产地溯源方法中确定分割时间节点的一种流程示意图;
图3为本申请实施例提供了基于大数据的农产品产地溯源系统的一种结构示意图。
附图标记说明:信息数据库建立模块11,特异化特征提取模块12,样本特征分析模块13,特征相似评价模块14,定位识别子网络模块15,产地溯源结果模块16。
具体实施方式
本申请提供的技术方案总体思路如下:
本申请实施例提供了基于大数据的农产品产地溯源方法及系统。首先利用大数据技术构建包含丰富数据的农产品基础信息数据库,并建立标准农产品样本。然后,以标准农产品样本为基准,对数据库中的农产品提取特异化特征,形成多维特征提取集。接着,分析同地区样本特征的极限区间,建立产地溯源网络。另外,考虑不同地区的特征相似评价,确定相似溯源地区,并建立定位识别子网络,耦合至产地溯源网络终。最后,输入目标农产品特征,基于所建产地溯源网络进行精确溯源。
在介绍了本申请基本原理后,下面将结合说明书附图来具体介绍本申请的各种非限制性的实施方式。
实施例一
如图1所示,本申请实施例提供了基于大数据的农产品产地溯源方法,该方法包括:
建立基础信息数据库,所述基础信息数据库依据大数据构建,且所述基础信息数据库中每一组数据均带有唯一产地标识;
在本申请实施例中,基础信息数据库是指收集和存储有关农产品的各类基础数据的数据库。该数据库依据大数据技术构建,通过互联网、物联网、RFID等信息技术采集各类与农产品相关的结构化和非结构化数据,并进行处理、整合,构成农产品的基础信息数据库。
基础信息数据库中包含的农产品基础信息包括但不限于农产品的地域分布、生长环境、种植方式、生长周期、收割时间等数据。同时,基础信息数据库中每一组数据都带有唯一的产地标识,该标识通过GPS坐标、区县编码等方式赋予,用于确定每个农产品的地理位置。为后续特征提取、产地溯源网络构建等步骤奠定数据基础。
建立标准农产品样本,以所述标准农产品样本作为参考基准,对所述基础信息数据库中的农产品进行特异化特征提取,构建多维特征提取集;
在本申请实施例中,标准农产品样本是指根据不同农产品类别,由相关专家人工选取的能代表该类别特征的一组样本,作为特异化特征提取的标准参考基准。
首先,预先建立好标准农产品样本库,其中包含不同主要产地和类别的代表性实体样本。然后,通过对比分析等方法,用这组标准样本对基础信息数据库中的农产品数据进行遍历和比对,提取出能够区分不同产地和类别的特征参数作为多维特征提取集,为后续产地溯源网络的构建奠定特征基础。
进一步的,本步骤还包括:
建立地区的实时环境特征集;
以所述实时环境特征集生成更新补偿特征;
通过所述更新补偿特征对所述多维特征提取集进行周期补偿。
在一种优选的实施方式中,首先,在目标地区的主要农田和生产区安装物联网环境监测设备,如温湿度传感器、土壤检测仪等,采集环境数据,同时结合公开的气象数据接口、土壤数据库API,获取目标地区的实时或定期更新的温度、湿度、土壤成分等参数。其次,综合所采集的环境信息,构建为标准化的实时环境特征集,包括温度、湿度、光照等气候特征和土壤pH、养分水平等土壤特征,为农产品溯源提供动态的环境数据支持。然后,通过机器学习训练得到实时环境特征集和历史环境数据集之间的映射模型。以温度参数为例,训练出实时温度与历史温度之间的相关性模型,在获得实时温度数据后,将其输入上述映射模型,生成如“预期成熟时间提前5天”等的更新补偿特征,反映相对历史情况,当前气候对农产品生长周期的影响。类似地,还可以获得其他环境参数的更新补偿特征,如预期营养成分、预期产品品质等。这些补偿特征可以帮助调整多维特征提取集,使其反映当前环境状态。
在获得更新补偿特征后,识别出多维特征提取集中那些易受环境影响的特征参数,如成熟时间、糖分含量等。用生成的更新补偿特征对应调整这些特征参数。例如,使用“预期成熟时间提前5天”的更新补偿特征,相应缩短多维特征提取集中该农产品的成熟时间特征参数的值。通过周期性地应用更新补偿特征,实现对多维特征提取集的动态维护,以实时反映当前的环境状态和其对农产品特征的影响,进一步增强后续基于该数据集的溯源结果的准确性和适应性。
对所述多维特征提取集进行同地区的样本特征分析,设定同地区样本的特征极限区间;
在本申请实施例中,在构建好多维特征提取集后,对同地区的样本特征进行统计分析,以设定该地区样本特征的正常变化范围即特征极限区间。
具体来说,对于同一产地的样本,对同地区样本特征进行聚类分析,统计分析其在各维特征上的具体值分布情况,然后计算出该产地在各特征维度上正常波动的区间范围,即表征该地区样本固的特征极限区间。例如,通过分析同一产地所有样本的成熟时间特征,设定出该区域农产品成熟时间的正常区间为[198天,203天]。
通过设定特征极限区间,表征该地区农产品的标准特征区域,为后续针对农产品的产地判定提供参考约束,避免依赖主观经验,使产地溯源判定更加客观和智能化。
以所述多维特征提取集和所述特征极限区间建立产地溯源网络,并基于建立结果进行不同地区的特征相似评价,确定相似溯源地区;
在本申请实施例中,在获得多维特征提取集和特征极限区间后,利用这两者来建立产地溯源的神经网络模型。首先,使用多维特征提取集作为输入,不同产地标识作为类别标签,构建产地类别的训练数据集。然后,在模型训练时,设置特征极限区间作为样本特征的约束条件,限定同类样本特征的正常范围。随后,通过多维特征提取集和特征极限区间进行神经网络模型的训练,构建既具有泛化能力又符合特征约束条件的产地溯源网络。
接着,利用训练好的产地溯源网络,对每个产地的样本提取深层特征向量,获得产地的特征表达。采用向量相似度算法,如余弦相似度,计算并比较不同产地的特征向量间的相似程度。继而,根据产地特征的可分性,确定相似度阈值,用于判定产地间是否存在高度相似。利用类似K-Means的相似性聚类算法,基于特征向量和相似度阈值将产地分为不同的相似聚类。从相似聚类结果中,识别出与目标产地特征最接近的那些地区,确定为相似溯源地区,为构建更为精准的定位识别子网络提供数据基础。
对所述相似溯源地区搭建定位识别子网络,并将所述定位识别子网络耦合至所述产地溯源网络;
进一步的,本申请实施例还包括:
依据所述相似溯源地区调用所述基础信息数据库的样本数据;
对所述样本数据进行样本集中值评价,生成样本集中值约束;
以所述样本集中值约束作为集中线,对所述样本数据进行离散评价,生成离散相似约束;
通过所述样本集中值约束和所述离散相似约束搭建所述定位识别子网络。
在一种优选的实施方式中,首选,依据获取的相似溯源地区的区域信息,从基础信息数据库中调用与其对应的样本数据。其次,对这些样本数据进行集中趋势的评估分析,计算样本数据集在各特征维度上的集中数值,比如均值、中位数等,以生成表示样本集总体趋势的样本集中值约束,代表样本集在各维度上的整体集中趋势,如计算出某地区样本在糖度特征上的平均值为7.2%,则生成的样本糖度集中值约束为7.2%。
在得到样本数据的样本集中值约束后,以其作为样本分布的集中线,进一步对样本的离散程度进行评估,生成表示样本离散分布的参数作为离散相似约束。例如,计算样本数据相对于集中线的偏离程度,并求取偏离值的方差、标准差等统计值,表征样本分布的离散范围,为定位识别子网络提供数据支持。
然后,以相似溯源地区的样本数据集作为训练数据集,以其产地标识作为监督标签,以样本集中值约束和离散相似约束作为判别条件,训练定位识别子网络模型。训练过程中,通过在损失函数中加入约束条件,使网络既拟合样本标识,又符合数据分布的约束要求,获得定位识别子网络。
随后,去掉产地溯源网络最后的产地分类输出层,替换为定位识别子网络的产地细分类层,使定位识别子网络耦合到产地溯源网络中,使产地溯源网络既保留对一般样本溯源的能力,又增强对相似样本区分的精度。
提取目标农产品数据集,将所述目标农产品数据集输入所述产地溯源网络,生成产地溯源结果。
进一步的,本步骤具体包括:
建立特征获取约束,所述特征获取约束依据地区往来频率和所述多维特征提取集构建;
通过所述特征获取约束执行特征的顺序获取,以构建所述目标农产品数据集。
进一步的,本步骤还包括:
对同地区的多维特征提取集进行时间维度的特征变化评价,依据特征变化评价结果进行时间的自适应聚合,确定分割时间节点,且每一时间周期均对应有一独立特征极限区间;
以所述分割时间节点和所述独立特征极限区间搭建辅助识别子网络,并将所述辅助识别子网络添加至所述产地溯源网络;
将所述目标农产品数据集输入所述产地溯源网络后,提取所述目标农产品数据集的收割时间节点;
以所述收割时间节点作为辅助信息,与目标农产品数据集同步输入所述辅助识别子网络,生成辅助识别结果;
基于所述辅助识别结果获得所述产地溯源结果。
进一步的,如图2所示,确定分割时间节点包括:
对所述多维特征提取集进行极限特征抓取,并根据抓取差值确定差值区间;
以所述多维特征提取集的时间周期确定初始分割粒度;
根据所述差值区间和所述初始分割粒度进分布初始等级节点;
通过所述初始等级节点对所述多维特征提取集进行时间划分,获得时间划分结果;
对所述时间划分结果进行上下时间分割节点间的变化寻优搜索,根据搜索结果完成自适应聚合,确定分割时间节点。
在一种优选的实施方式中,为构建输入到产地溯源网络的目标农产品数据集,首先,建立特征获取约束,该约束依据不同地区之间的贸易往来频率以及多维特征提取集中的特征重要性确定;对于往来频率更高或特征更重要的地区,给予更高的获取优先级。然后,在获取目标农产品数据时,根据特征获取约束的顺序要求,执行对不同地区不同特征的顺序采集。例如,优先获取频率更高地区的核心特征,构建目标农产品数据集。相较于传统的随机采样方式,通过特征获取约束实现更有针对性和代表性的数据采集,使构建的目标农产品数据集对产地判别任务更加有效,提高基于该数据集的产地溯源结果的精确度和可靠性。
对多维特征提取集的各特征维度的最大值和最小值进行获取,确定特征变化的差值区间。同时,获得多维特征提取集样本的时间跨度信息,将以其原始的时间周期粒度为基础,确定初始分割粒度,例如,多维特征提取集的样本采集以日为周期,则以1天为初始分割粒度;如果特征提取集的时间周期采用月份,则初始分割粒度置为1个月。随后,将差值区间等分成若干等级,在每个相邻差值等级对应的时间跨度内,依次分割出初始时间节点。在生成初始时间等级节点后,将这些初始时间节点作为时间段的截断点,将多维特征提取集按时间顺序进行分割成多个时间段,每个时间段以两个相邻节点为边界,获取时间划分结果。接着,考察相邻时间段的特征变化情况,通过移动上下节点边界的方式,搜索最小化两个时间段之间特征变化的最佳节点位置,使得最终确定的各个时间段内,特征保持较为稳定的分布状态。通过这种逐次调整时间段边界的方式,完成对数据集时间维度的自适应、动态聚合,确定数据集特征变化的最佳分割时间节点,由分割时间节点形成的每一时间周期均对应有一独立特征极限区间。
在获得分割时间节点后,以分割时间节点划分的不同时间周期为样本标签,以对应时间周期的独立特征极限区间为约束条件,训练出辅助时间识别子网络。并将此辅助识别子网络加入产地溯源网络中,与原有模型构建为新的混合网络结构,使产地溯源网络新增对时间段辅助识别的判别能力。在目标农产品数据集进入产地溯源网络进行溯源判断后,提取目标数据集中每组样本的收割时间节点,其中,收割时间节点是指目标农产品从田间收获起始的时间点。随后,将收割时间节点作为辅助信息,与目标农产品数据集中的每个样本一一对应,输入辅助识别子网络中,生成辅助识别结果,为获取产地溯源结果提供基础。随后,把目标农产品数据集的特征判别结果与辅助判别结果进行决策融合,优化生成融合了时间匹配信息的产地溯源结果,使产地溯源结果更加准确可靠。
进一步的,本申请实施例还包括:
设置N级样本量约束,其中,N为大于1的正整数;
从第一级样本量约束随机对目标农产品进行数据采集,建立第一级产品数据集;
以所述第一级样本量约束映射第一稳态系数,以产地溯源结果作为第一稳态评价结果,进行结果稳定评价;
若稳态评价结果不能满足预设阈值,则执行第一级样本量约束到第N级样本量约束的逐级迭代,直至稳态评价结果满足所述预设阈值终止;
根据终止位置对应的产地溯源结果进行溯源管理。
在一种优选的实施方式中,采用样本量逐级约束实现结果稳定性评估。首先,设置N级样本量约束,其中,N为大于1的正整数,样本量约束是指对提取目标农产品数据集时样本数量的限定条件,设置不同级别的样本量约束,是为了通过多次迭代来提高产地溯源结果的稳定性和可靠性。然后,从第一级样本量约束随机抽取目标农产品进行数据采集,建立第一级产品数据集,即先利用第一级样本量约束,抽取较少量样本,来构建初始的目标产品数据集,为后续迭代提供基础。
随后,以第一级样本量约束映射第一稳态系数,并将产地溯源结果作为第一稳态评价结果,进行结果稳定性评价。具体而言,稳态系数是评估结果稳定性的指标,通过样本量约束与稳定性之间的经验映射关系来确定。将产地溯源结果与稳态系数比较,判断结果是否达到了预期的稳定水平,得到稳定评价结果。如果稳态评价结果不能满足预设的阈值,则执行从第一级到第N级样本量约束的逐级迭代,直至稳态评价结果满足阈值要求时终止迭代,使产地溯源结果越来越稳定和可靠。最后,根据终止时对应的产地溯源结果,进行溯源管理。此时,产地溯源结果已经通过多轮迭代达到了预期的稳定性要求,作为最终的溯源依据进行后续溯源管理。
综上所述,本申请实施例所提供的基于大数据的农产品产地溯源方法具有如下技术效果:
建立基础信息数据库,基础信息数据库依据大数据构建,且基础信息数据库中每一组数据均带有唯一产地标识,为后续特征提取和溯源分析提供数据支撑。建立标准农产品样本,提供特征提取的参考基准,提高提取精度。以标准农产品样本作为参考基准,对基础信息数据库中的农产品进行特异化特征提取,构建多维特征提取集,为溯源提供依据。对多维特征提取集进行同地区的样本特征分析,设定同地区样本的特征极限区间,明确同一产地样本特征的正常区间,用于后续的产地溯源分析。以多维特征提取集和特征极限区间建立产地溯源网络,并基于建立结果进行不同地区的特征相似评价,确定相似溯源地区,分析不同产地特征的对应关系。对相似溯源地区搭建定位识别子网络,并将定位识别子网络耦合至产地溯源网络,提高定位的精细化程度。提取目标农产品数据集,将目标农产品数据集输入产地溯源网络,生成产地溯源结果,提高农产品溯源准确度。
实施例二
基于与前述实施例中基于大数据的农产品产地溯源方法相同的发明构思,如图3所示,本申请实施例提供了基于大数据的农产品产地溯源系统,该系统包括:
信息数据库建立模块11,用于建立基础信息数据库,所述基础信息数据库依据大数据构建,且所述基础信息数据库中每一组数据均带有唯一产地标识;
特异化特征提取模块12,用于建立标准农产品样本,以所述标准农产品样本作为参考基准,对所述基础信息数据库中的农产品进行特异化特征提取,构建多维特征提取集;
样本特征分析模块13,用于对所述多维特征提取集进行同地区的样本特征分析,设定同地区样本的特征极限区间;
特征相似评价模块14,用于以所述多维特征提取集和所述特征极限区间建立产地溯源网络,并基于建立结果进行不同地区的特征相似评价,确定相似溯源地区;
定位识别子网络模块15,用于对所述相似溯源地区搭建定位识别子网络,并将所述定位识别子网络耦合至所述产地溯源网络;
产地溯源结果模块16,用于提取目标农产品数据集,将所述目标农产品数据集输入所述产地溯源网络,生成产地溯源结果。
进一步的,定位识别子网络模块15包括以下执行步骤:
依据所述相似溯源地区调用所述基础信息数据库的样本数据;
对所述样本数据进行样本集中值评价,生成样本集中值约束;
以所述样本集中值约束作为集中线,对所述样本数据进行离散评价,生成离散相似约束;
通过所述样本集中值约束和所述离散相似约束搭建所述定位识别子网络。
进一步的,产地溯源结果模块16包括以下执行步骤:
对同地区的多维特征提取集进行时间维度的特征变化评价,依据特征变化评价结果进行时间的自适应聚合,确定分割时间节点,且每一时间周期均对应有一独立特征极限区间;
以所述分割时间节点和所述独立特征极限区间搭建辅助识别子网络,并将所述辅助识别子网络添加至所述产地溯源网络;
将所述目标农产品数据集输入所述产地溯源网络后,提取所述目标农产品数据集的收割时间节点;
以所述收割时间节点作为辅助信息,与目标农产品数据集同步输入所述辅助识别子网络,生成辅助识别结果;
基于所述辅助识别结果获得所述产地溯源结果。
进一步的,产地溯源结果模块16还包括以下执行步骤:
对所述多维特征提取集进行极限特征抓取,并根据抓取差值确定差值区间;
以所述多维特征提取集的时间周期确定初始分割粒度;
根据所述差值区间和所述初始分割粒度进分布初始等级节点;
通过所述初始等级节点对所述多维特征提取集进行时间划分,获得时间划分结果;
对所述时间划分结果进行上下时间分割节点间的变化寻优搜索,根据搜索结果完成自适应聚合,确定分割时间节点。
进一步的,本申请实施例还包括溯源管理模块,该模块包括以下执行步骤:
设置N级样本量约束,其中,N为大于1的正整数;
从第一级样本量约束随机对目标农产品进行数据采集,建立第一级产品数据集;
以所述第一级样本量约束映射第一稳态系数,以产地溯源结果作为第一稳态评价结果,进行结果稳定评价;
若稳态评价结果不能满足预设阈值,则执行第一级样本量约束到第N级样本量约束的逐级迭代,直至稳态评价结果满足所述预设阈值终止;
根据终止位置对应的产地溯源结果进行溯源管理。
进一步的,本申请实施例还包括产品数据集构建模块,该模块包括以下执行步骤:
建立特征获取约束,所述特征获取约束依据地区往来频率和所述多维特征提取集构建;
通过所述特征获取约束执行特征的顺序获取,以构建所述目标农产品数据集。
进一步的,本申请实施例还包括提取集周期补偿模块,该模块包括以下执行步骤:
建立地区的实时环境特征集;
以所述实时环境特征集生成更新补偿特征;
通过所述更新补偿特征对所述多维特征提取集进行周期补偿。
综上所述的方法的任意步骤都可作为计算机指令或者程序存储在不设限制的计算机存储器中,并可以被不设限制的计算机处理器调用识别用以实现本申请实施例中的任一项方法,在此不做多余限制。
进一步的,综上所述的第一或第二可能不止代表次序关系,也可能代表某项特指概念,和/或指的是多个元素之间可单独或全部选择。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样,倘若本申请的这些修改和变型属于本申请及其等同技术的范围之内,则本申请意图包括这些改动和变型在内。
Claims (7)
1.基于大数据的农产品产地溯源方法,其特征在于,所述方法包括:
建立基础信息数据库,所述基础信息数据库依据大数据构建,且所述基础信息数据库中每一组数据均带有唯一产地标识;
建立标准农产品样本,以所述标准农产品样本作为参考基准,对所述基础信息数据库中的农产品进行特异化特征提取,构建多维特征提取集;
对所述多维特征提取集进行同地区的样本特征分析,设定同地区样本的特征极限区间;
以所述多维特征提取集和所述特征极限区间建立产地溯源网络,并基于建立结果进行不同地区的特征相似评价,确定相似溯源地区;
对所述相似溯源地区搭建定位识别子网络,并将所述定位识别子网络耦合至所述产地溯源网络;
提取目标农产品数据集,将所述目标农产品数据集输入所述产地溯源网络,生成产地溯源结果,包括:
对同地区的多维特征提取集进行时间维度的特征变化评价,依据特征变化评价结果进行时间的自适应聚合,确定分割时间节点,且每一时间周期均对应有一独立特征极限区间;
以所述分割时间节点和所述独立特征极限区间搭建辅助识别子网络,并将所述辅助识别子网络添加至所述产地溯源网络;
将所述目标农产品数据集输入所述产地溯源网络后,提取所述目标农产品数据集的收割时间节点;
以所述收割时间节点作为辅助信息,与目标农产品数据集同步输入所述辅助识别子网络,生成辅助识别结果;
基于所述辅助识别结果获得所述产地溯源结果。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
依据所述相似溯源地区调用所述基础信息数据库的样本数据;
对所述样本数据进行样本集中值评价,生成样本集中值约束;
以所述样本集中值约束作为集中线,对所述样本数据进行离散评价,生成离散相似约束;
通过所述样本集中值约束和所述离散相似约束搭建所述定位识别子网络。
3.如权利要求1所述的方法,其特征在于,所述方法还包括:
对所述多维特征提取集进行极限特征抓取,并根据抓取差值确定差值区间;
以所述多维特征提取集的时间周期确定初始分割粒度;
根据所述差值区间和所述初始分割粒度进分布初始等级节点;
通过所述初始等级节点对所述多维特征提取集进行时间划分,获得时间划分结果;
对所述时间划分结果进行上下时间分割节点间的变化寻优搜索,根据搜索结果完成自适应聚合,确定分割时间节点。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
设置N级样本量约束,其中,N为大于1的正整数;
从第一级样本量约束随机对目标农产品进行数据采集,建立第一级产品数据集;
以所述第一级样本量约束映射第一稳态系数,以产地溯源结果作为第一稳态评价结果,进行结果稳定评价;
若稳态评价结果不能满足预设阈值,则执行第一级样本量约束到第N级样本量约束的逐级迭代,直至稳态评价结果满足所述预设阈值终止;
根据终止位置对应的产地溯源结果进行溯源管理。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
建立特征获取约束,所述特征获取约束依据地区往来频率和所述多维特征提取集构建;
通过所述特征获取约束执行特征的顺序获取,以构建所述目标农产品数据集。
6.如权利要求1所述的方法,其特征在于,所述方法还包括:
建立地区的实时环境特征集;
以所述实时环境特征集生成更新补偿特征;
通过所述更新补偿特征对所述多维特征提取集进行周期补偿。
7.基于大数据的农产品产地溯源系统,其特征在于,用于实施权利要求1-6任意一项所述的基于大数据的农产品产地溯源方法,所述系统包括:
信息数据库建立模块,所述信息数据库建立模块用于建立基础信息数据库,所述基础信息数据库依据大数据构建,且所述基础信息数据库中每一组数据均带有唯一产地标识;
特异化特征提取模块,所述特异化特征提取模块用于建立标准农产品样本,以所述标准农产品样本作为参考基准,对所述基础信息数据库中的农产品进行特异化特征提取,构建多维特征提取集;
样本特征分析模块,所述样本特征分析模块用于对所述多维特征提取集进行同地区的样本特征分析,设定同地区样本的特征极限区间;
特征相似评价模块,所述特征相似评价模块用于以所述多维特征提取集和所述特征极限区间建立产地溯源网络,并基于建立结果进行不同地区的特征相似评价,确定相似溯源地区;
定位识别子网络模块,所述定位识别子网络模块用于对所述相似溯源地区搭建定位识别子网络,并将所述定位识别子网络耦合至所述产地溯源网络;
产地溯源结果模块,所述产地溯源结果模块用于提取目标农产品数据集,将所述目标农产品数据集输入所述产地溯源网络,生成产地溯源结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311144786.XA CN116883026B (zh) | 2023-09-06 | 2023-09-06 | 基于大数据的农产品产地溯源方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311144786.XA CN116883026B (zh) | 2023-09-06 | 2023-09-06 | 基于大数据的农产品产地溯源方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116883026A CN116883026A (zh) | 2023-10-13 |
CN116883026B true CN116883026B (zh) | 2023-12-26 |
Family
ID=88272013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311144786.XA Active CN116883026B (zh) | 2023-09-06 | 2023-09-06 | 基于大数据的农产品产地溯源方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116883026B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117314908B (zh) * | 2023-11-29 | 2024-03-01 | 四川省烟草公司凉山州公司 | 一种烤烟病毒溯源方法、介质及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112839061A (zh) * | 2021-03-04 | 2021-05-25 | 哈尔滨安天科技集团股份有限公司 | 一种基于区域特征的溯源方法和装置 |
CN113406246A (zh) * | 2021-03-31 | 2021-09-17 | 广州海关技术中心 | 一种基于lc-q-tof-ms表征甘油三酯进行大豆和大豆油的产地溯源方法 |
CN116167777A (zh) * | 2023-02-15 | 2023-05-26 | 无锡科技职业学院 | 一种基于区块链的航空货物智能追溯查询系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11151096B2 (en) * | 2013-03-15 | 2021-10-19 | Locus Lp | Dynamic syntactic affinity group formation in a high-dimensional functional information system |
US9990380B2 (en) * | 2013-03-15 | 2018-06-05 | Locus Lp | Proximity search and navigation for functional information systems |
US20210366106A1 (en) * | 2018-11-21 | 2021-11-25 | Enlitic, Inc. | System with confidence-based retroactive discrepancy flagging and methods for use therewith |
-
2023
- 2023-09-06 CN CN202311144786.XA patent/CN116883026B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112839061A (zh) * | 2021-03-04 | 2021-05-25 | 哈尔滨安天科技集团股份有限公司 | 一种基于区域特征的溯源方法和装置 |
CN113406246A (zh) * | 2021-03-31 | 2021-09-17 | 广州海关技术中心 | 一种基于lc-q-tof-ms表征甘油三酯进行大豆和大豆油的产地溯源方法 |
CN116167777A (zh) * | 2023-02-15 | 2023-05-26 | 无锡科技职业学院 | 一种基于区块链的航空货物智能追溯查询系统 |
Non-Patent Citations (1)
Title |
---|
三七主根稀土元素指纹特征及产地判别;徐向东等;农业环境科学学报;1-15 * |
Also Published As
Publication number | Publication date |
---|---|
CN116883026A (zh) | 2023-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108399748B (zh) | 一种基于随机森林与聚类算法的道路旅行时间预测方法 | |
CN116883026B (zh) | 基于大数据的农产品产地溯源方法及系统 | |
Hammer et al. | Sugarcane yield prediction through data mining and crop simulation models | |
WO2018099220A1 (zh) | 一种种植设备中植物病虫害预测方法及装置 | |
CN107341577A (zh) | 一种农作物产量预测方法及系统 | |
CN113269825B (zh) | 基于地基激光雷达技术林木胸径值提取的方法 | |
CN112352523B (zh) | 一种基于智能决策的茶园水肥灌溉控制方法和系统 | |
NL2029693B1 (en) | Remote sensing prediction method for fragrant pear maturity period based on multi-source remote sensing data | |
CN117291444B (zh) | 一种数字乡村业务管理方法及系统 | |
CN117332283B (zh) | 一种中药材生长信息采集分析方法及系统 | |
CN111950530A (zh) | 农作物种植结构提取的多特征优选与融合方法 | |
CN114897423B (zh) | 基于作物水分指示线的农田灌溉概率指数计算方法 | |
Anindya et al. | IoT Based Climate Prediction System Using Long Short-Term Memory (LSTM) Algorithm as Part of Smart Farming 4.0 | |
CN116595333B (zh) | 土壤-气候智慧型的水稻目标产量与氮肥用量确定方法 | |
CN117169388A (zh) | 基于机器学习的标志代谢物模型预测山药最佳采收期方法 | |
CN117652267A (zh) | 一种用于园林绿化维护的监测管理方法及系统 | |
CN113127464A (zh) | 农业大数据环境特征处理方法、装置及电子设备 | |
CN116616019A (zh) | 基于物联网和人工智能的油茶水肥一体化滴灌方法及系统 | |
CN211908856U (zh) | 一种基于物联网的植物数据采集系统 | |
CN114372611A (zh) | 水资源优化分配方法和装置 | |
CN115661674A (zh) | 一种基于多源卫星土壤湿度数据的作物灌溉信息提取方法 | |
Liu et al. | Estimation and spatiotemporal variation analysis of net primary productivity in the upper Luanhe River Basin in China from 2001 to 2017 combining with a downscaling method | |
CN111262950A (zh) | 一种基于物联网的植物数据采集系统 | |
Balaji et al. | Big data application in the Neyman-Pearson regression and deep bernoulli and boltzmann for iot based soil quality prediction | |
CN113098963B (zh) | 面向物联网云计算的处理分析系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |