CN110674964A - 基于农业溯源信息的搜索预测系统及方法 - Google Patents

基于农业溯源信息的搜索预测系统及方法 Download PDF

Info

Publication number
CN110674964A
CN110674964A CN201910396995.0A CN201910396995A CN110674964A CN 110674964 A CN110674964 A CN 110674964A CN 201910396995 A CN201910396995 A CN 201910396995A CN 110674964 A CN110674964 A CN 110674964A
Authority
CN
China
Prior art keywords
information
agricultural
user
search
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910396995.0A
Other languages
English (en)
Inventor
郑锴
孙知信
宫婧
赵学健
陈松乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nupt Institute Of Big Data Research At Yancheng Co Ltd
Nanjing Post and Telecommunication University
Nanjing University of Posts and Telecommunications
Original Assignee
Nupt Institute Of Big Data Research At Yancheng Co Ltd
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nupt Institute Of Big Data Research At Yancheng Co Ltd, Nanjing Post and Telecommunication University filed Critical Nupt Institute Of Big Data Research At Yancheng Co Ltd
Priority to CN201910396995.0A priority Critical patent/CN110674964A/zh
Publication of CN110674964A publication Critical patent/CN110674964A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Agronomy & Crop Science (AREA)
  • Animal Husbandry (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明揭示了一种基于农业溯源信息的搜索预测系统及方法,系统包括溯源数据采集模块、数据处理与储存模块以及搜索预测模块,方法包括溯源数据采集步骤、数据处理与储存步骤以及搜索预测步骤。本发明实现了在大数据技术背景下对农产品信息的采集、存储与挖掘,能够通过对用户搜索行为的分析、判断,预测出用户的搜索倾向,再根据所得到的搜索倾向在用户搜索时进行相关推荐,从而提升企业的市场化水平和农产品的竞争力。

Description

基于农业溯源信息的搜索预测系统及方法
技术领域
本发明涉及一种搜索预测系统及其相对应的搜索预测方法,具体涉及一种基于农业溯源信息的搜索预测系统及方法,属于计算机数据挖掘及信息处理领域。
背景技术
近年来,我国的经济、科技水平得到了快速的发展提高,为农业现代化的实现积聚了丰厚的物质条件和技术基础。在以大数据、物联网、云计算、人工智能等为代表的新一代信息技术的推动下,“互联网+农业”正成为推动我国农业产业转型升级的新动力。
以目前被广泛应用于药品、食品农副产品、工业制造等行业内的溯源系统为例,这一类系统的普及应用不仅有效地规范了行业准则,而且保证了产品的质量、为消费者提供了更加透明的信息。其中,农产品溯源系统利用先进的物联网、二维码、RFID等物联网技术手段,能够为消费者提供农产品在生产流程中的全套信息。尽管目前具备了这样的技术条件,但是由于现阶段针对农产品溯源信息的分析与挖掘并不常见,因此在农产品的生产和使用过程中所产生绝大多数信息仍然得不到有效地利用、被白白浪费。
此外,在现有技术中,对于热度词的预测方式较为单一,大多都仅仅是根据用户信息来进行预测。而如果能够针对溯源过程中产生的海量数据与用户信息进行综合分析与挖掘,从而为用户提供更加精准的搜素热点预测,毫无疑问将会为企业带来更多的利润。
综上所述,如何针对数据的海量特性、引入大数据的概念,进而提出一种基于农业溯源信息的搜索预测系统及方法,也就成为了本领域内技术人员共同的研究目标。
发明内容
鉴于现有技术存在上述缺陷,本发明的目的是提出一种基于农业溯源信息的搜索预测系统及方法,具体如下。
一种基于农业溯源信息的搜索预测系统,包括:
溯源数据采集模块,用于采集农业溯源信息并将所采集的农业溯源信息进行上传;
数据处理与储存模块,用于接收来自溯源数据采集模块的农业溯源信息,并对所采集的农业溯源信息进行分类、处理与储存;
搜索预测模块,用于建立训练模型,使用经过分类处理后的农业溯源信息作为数据集,对训练模型进行训练并完成搜索预测。
优选地,所述溯源数据采集模块包括:
QRcode采集单元,用于生成QRcode数据,QRcode数据与农产品间一对一认证;
WSN采集单元,用于采集农产品运输过程中相应地理位置的温度、湿度信息;
农业网站日志与用户搜索内容采集单元,用于采集用户访问的农业网站日志以及用户搜索内容,并对所采集的内容进行过滤留下搜索内容与用户订单日志;
快递订单信息采集单元,用于通过物流配送采集快递订单信息。
优选地,在所述数据处理与储存模块中,将所采集的农业溯源信息分为三类,即农产品信息、搜索内容信息以及用户信息;
所述农产品信息至少包括二维码、环境数据以及销售信息;
所述搜索内容信息至少包括搜索内容以及搜索次数;
所述用户信息至少包括用户ID,农产品ID以及购买属性。
优选地,所述搜索预测模块包括:
搜索内容处理单元,用于使用大数据平台下的MapReduce计算框架从搜索内容中统计出搜索频率作为搜索热度参考;
销售信息与用户日志分析单元,用于提取农产品中的销售信息与用户日志中的购买信息并对用户信息进行加权;
预测结果输出单元,用于建立训练模型,对训练模型进行训练,产生并输出预测结果。
一种基于农业溯源信息的搜索预测方法,包括如下步骤:
S1、溯源数据采集步骤,采集农业溯源信息并将所采集的农业溯源信息进行上传;
S2、数据处理与储存步骤,接收农业溯源信息,并对所采集的农业溯源信息进行分类、处理与储存;
S3、搜索预测步骤,建立训练模型,使用经过分类处理后的农业溯源信息作为数据集,对训练模型进行训练并完成搜索预测。
优选地,S1所述溯源数据采集步骤包括:
S11、QRcode采集步骤,生成QRcode数据,QRcode数据与农产品间一对一认证;
S12、WSN采集步骤,采集农产品运输过程中相应地理位置的温度、湿度信息;
S13、农业网站日志与用户搜索内容采集步骤,采集用户访问的农业网站日志以及用户搜索内容,并对所采集的内容进行过滤留下搜索内容与用户订单日志;
S14、快递订单信息采集步骤,通过物流配送采集快递订单信息。
优选地,在S2所述数据处理与储存步骤中,将所采集的农业溯源信息分为三类,即农产品信息、搜索内容信息以及用户信息;
所述农产品信息至少包括二维码、环境数据以及销售信息;
所述搜索内容信息至少包括搜索内容以及搜索次数;
所述用户信息至少包括用户ID,农产品ID以及购买属性。
优选地,S3所述搜索预测步骤包括:
S31、搜索内容处理步骤,使用大数据平台下的MapReduce计算框架从搜索内容中统计出搜索频率作为搜索热度参考;
S32、销售信息与用户日志分析步骤,提取农产品中的销售信息与用户日志中的购买信息并对用户信息进行加权;
S33、预测结果输出步骤,建立训练模型,对训练模型进行训练,产生并输出预测结果。
优选地,S33所述预测结果输出步骤包括:
S331、设置矩阵分解的模型,公式如下,
R=UTSV,
其中,UT为用户特征矩阵,V为产品特征矩阵,R为打分矩阵,S为特征矩阵。
S332、确定特征值,将评分矩阵R(m*n)分解为与V(n*k),其中k为user/product的特征值数量;
S333、确定损失函数,对于产品特征矩阵V(n*k)中第j个产品的特征向量vj和用户特征矩阵U(m*k)中的第i个用户的特征向量ui来进行预测评分矩阵A(m*n)中的aij,公式如下,
Figure BDA0002058498600000052
S334、使用交叉最小二乘法对损失函数进行优化,根据用户对于农产品的评分信息对于模型进行训练,交替使用最小二乘法逐步计算用户或农产品的特征向量,使差平方和最小;
S335、固定U0求解V0,随机生成U0一般取0值或全局均值,公式如下,
Figure BDA0002058498600000053
带入M1=U(0)(UT)0+λE,
Figure BDA0002058498600000054
得到
Figure BDA0002058498600000055
其中,
Figure BDA0002058498600000056
为评价过农产品j的用户评分组成的向量,U为评价过农产品的用户的特征向量组成的特征矩阵,E为评价过农产品j的用户数量,
随后按照上述公式,依次代入v1,v2,v3,v4…vn,最终得到v0
S337、固定V0求解U0,得到
Figure BDA0002058498600000057
按照S335中的公式,依次代入u1,u2,u3,u4…un,得到u0
S338、迭代,根据S336及S337得到V,U直至均方差很小时得到C对应最优矩阵,公式如下,
Figure BDA0002058498600000061
Figure BDA0002058498600000062
S339、确定参数,将数据代入进行预测。
与现有技术相比,本发明的优点主要体现在以下几个方面:
本发明所提出的一种基于农业溯源信息的搜索预测系统及相对应的搜索预测方法,实现了在大数据技术背景下对农产品信息的采集、存储与挖掘。本发明能够通过对用户搜索行为的分析、判断,预测出用户的搜索倾向,再根据所得到的搜索倾向在用户搜索时进行相关推荐,从而提升企业的市场化水平和农产品的竞争力。
同时,本发明的系统中所存储的在农产品溯源、销售、售后等过程中所积累的海量数据,也将会对使用者的生产指导、销售策略、公司运营等过程中提供重要的指导意见。
此外,本发明也为同领域内的其他相关问题提供了参考,可以以此为依据进行拓展延伸,运用于与数据挖掘、搜索预测等有关的其他技术方案中,具有十分广阔的应用前景。
以下便结合实施例附图,对本发明的具体实施方式作进一步的详述,以使本发明技术方案更易于理解、掌握。
附图说明
图1为本发明的方法流程图;
图2为本发明中溯源数据采集步骤的流程示意图;
图3为本发明中数据建表字段示意图;
图4为本发明中数据处理与储存步骤的流程示意图;
图5为本发明中所使用的MapReduce框架的计算过程示意图;
图6为本发明中搜索预测步骤的流程示意图。
具体实施方式
针对现有技术中所存在的诸多问题,本发明提出了一种基于农业溯源信息的搜索预测系统及方法,具体如下。
一种基于农业溯源信息的搜索预测系统,包括:
溯源数据采集模块,用于采集农业溯源信息并将所采集的农业溯源信息进行上传。
所述溯源数据采集模块包括:
QRcode采集单元,用于生成QRcode数据,QRcode数据与农产品间一对一认证;
WSN采集单元,用于采集农产品运输过程中相应地理位置的温度、湿度信息;
农业网站日志与用户搜索内容采集单元,用于采集用户访问的农业网站日志以及用户搜索内容,并对所采集的内容进行过滤留下搜索内容与用户订单日志;
快递订单信息采集单元,用于通过物流配送采集快递订单信息。
数据处理与储存模块,用于接收来自溯源数据采集模块的农业溯源信息,并对所采集的农业溯源信息进行分类、处理与储存。
在所述数据处理与储存模块中,将所采集的农业溯源信息分为三类,即农产品信息、搜索内容信息以及用户信息;
所述农产品信息至少包括二维码、环境数据以及销售信息;
所述搜索内容信息至少包括搜索内容以及搜索次数;
所述用户信息至少包括用户ID,农产品ID以及购买属性,一般而言,所述用户信息可以包括用户ID、用户性别、用户年龄、农产品ID、农产品名称、农产品类别以及购买属性。
搜索预测模块,用于建立训练模型,使用经过分类处理后的农业溯源信息作为数据集,对训练模型进行训练并完成搜索预测。
所述搜索预测模块包括:
搜索内容处理单元,用于使用大数据平台下的MapReduce计算框架从搜索内容中统计出搜索频率作为搜索热度参考;
销售信息与用户日志分析单元,用于提取农产品中的销售信息与用户日志中的购买信息并对用户信息进行加权;
预测结果输出单元,用于建立训练模型,对训练模型进行训练,产生并输出预测结果。
本发明重点揭示了一种基于农业溯源信息的搜索预测方法,如图1所示,包括如下步骤:
S1、溯源数据采集步骤,采集农业溯源信息并将所采集的农业溯源信息进行上传。
S1所述溯源数据采集步骤如图2所示,包括:
S11、QRcode采集步骤,根据数据载体生成模块生成数据,QRcode与产品进行一对一认证,进出仓时对于产品信息进行实时收集,经销商通过手持终端进行物流追踪。其收集到的数据筛选出基于QRCode的销售信息。
S12、WSN采集步骤,对于运输过程中增加传感器节点,通过温度传感器、湿度传感器分别采集相应地理位置的温度、湿度等信息。并将WSN数据进行规范化,录入数据库。
S13、农业网站日志与用户搜索内容采集步骤,通过用户对于某个页面跳转到的页面,在页面一渲染完成加载埋点的js,执行业务逻辑采集信息;采集页面完成之后,把参数拼接发送给采集服务器;通过Nigex服务器对于用户日志与用户搜索内容采集,过滤日志留下搜索内容与用户订单日志。
S14、快递订单信息采集步骤,通过物流配送对于快递订单信息进行采集,对于用户/企业的订单信息进行统计,企业归为一个整体用户。其中取订单中用户id字段、订单id字段、配送地址字段、签收时间字段。
S2、数据处理与储存步骤,接收农业溯源信息,并对所采集的农业溯源信息进行分类、处理与储存。
在S2所述数据处理与储存步骤中,将所采集的农业溯源信息分为三类,即农产品信息、搜索内容信息以及用户信息;
所述农产品信息至少包括二维码、环境数据以及销售信息。具体而包含有产品的QRcode,配送时采集到的温度湿度等数据,其销售过程信息(物流,配送时间等),最后是其他信息。将此类信息存入大数据分布式平台下的Hbase数据库,方便查询。其建表字段如图3所示。
设置其rowkey为产品ID,列簇(column family)设定为环境信息(EnvironmentInfo)与销售信息(SaleInfo):
A.其中环境信息EnvironmentInfo的列字段设计为:温度(temperature),单位为摄氏度,湿度(humidity),单位为百分之,光照强度(light),单位为勒克斯,经度(longtitude),纬度(latitude)
B.销售信息(SaleInfo)包括的列字段设计为:签收时间(signTime),联系方式(telephone),产品类ID(productID),地址(address)。
所述搜索内容信息至少包括搜索内容以及搜索次数。即将搜索内容中的数据进行关键字的提取,利用Hadoop平台下的MapReduce计算框架对于搜索频率进行计,将其对应关系在Hive中进行映射建表,存入HDFS中。
所述用户信息至少包括用户ID、农产品ID以及购买属性。即对于用户Id购买的农产品Id进行对应,根据用户行为记录其浏览、加购物车、购买属性,存入HDFS中。同上所述,所述用户信息一般可以包括用户ID、用户性别、用户年龄、农产品ID、农产品名称、农产品类别以及购买属性。
具体的数据处理过程如图4所示。
S3、搜索预测步骤,建立训练模型,使用经过分类处理后的农业溯源信息作为数据集,对训练模型进行训练并完成搜索预测。
S3所述搜索预测步骤包括:
S31、搜索内容处理步骤,使用大数据平台下的MapReduce计算框架从搜索内容中统计出搜索频率作为搜索热度参考。即对于搜索内容统计出其搜索频率,作为搜索热度参考;使用大数据平台下MapReduce计算框架对销售数据中的农产品ID、用户信息中农产品ID进行分析。MapReduce分析过程如图5所示。
S32、销售信息与用户日志分析步骤,提取农产品中的销售信息与用户日志中的购买信息并对用户信息进行加权;
S33、预测结果输出步骤,建立训练模型,对训练模型进行训练,产生并输出预测结果。即交替使用最小二乘法对于数据进行迭代。使用现有数据作为数据集,用户ID、农产品ID、得分Score进行训练并产生预测,得出预测结果。
S33所述预测结果输出步骤如图6所示,包括:
S331、设置矩阵分解的模型,公式如下,
R=UTSV,
其中,UT为用户特征矩阵(用户ID-用户性别-用户年龄),V为产品特征矩阵(为农产品ID-农产品名称-农产品种类),R为打分矩阵(用户ID-农产品ID-评分Score),S为特征矩阵。
S332、确定特征值,在本实施例中所述特征值为3。将评分矩阵R(m*n)分解为
Figure BDA0002058498600000111
与V(n*k),其中k为user/product的特征值数量。本方法结合溯源信息与搜索信息,对于农产品从两个角度进行评价:搜索热度Hot、用户行为Type;将农产品的搜索热度Hot进行排序,前25%打分a为4,前25%~50%打分为3,50%~75%打分为2,75%~100%打分为1。用户行为中浏览打分b为1,加购物车打分为2,购买打分为3,其他为0。用户A对其综合评分对于热度与行为进行加权,Score=(a+b)/2。
S333、确定损失函数,对于产品特征矩阵V(n*k)中第j个产品的特征向量vj和用户特征矩阵U(m*k)中的第i个用户的特征向量ui来进行预测评分矩阵A(m*n)中的aij,公式如下,
Figure BDA0002058498600000121
即aij
Figure BDA0002058498600000122
越来越逼近。
S334、对于损失函数使用交叉最小二乘法(ALS)进行优化,ALS算法核心思想是将评分矩阵分解成用户特征矩阵与产品特征矩阵的乘积,根据用户对于产品的评分信息对于模型进行训练,交替使用最小二乘法逐步计算用户/产品特征向量,使差平方和最小。使用现有数据作为数据集,用户ID、农产品ID、得分Score进行训练并产生预测。
S335、固定U0求解V0,随机生成U0一般取0值或全局均值,公式如下,
Figure BDA0002058498600000123
带入M1=U(0)(UT)0+λE,
Figure BDA0002058498600000124
得到
Figure BDA0002058498600000125
其中,为评价过农产品j的用户评分组成的向量,U为评价过农产品的用户的特征向量组成的特征矩阵,E为评价过农产品j的用户数量,
随后按照上述公式,依次代入v1,v2,v3,v4…vn,最终得到v0
S337、固定V0求解U0,得到
Figure BDA0002058498600000131
按照S335中的公式,依次代入u1,u2,u3,u4…un,得到u0
S338、迭代,根据S336及S337得到V,U直至均方差很小时得到C对应最优矩阵,公式如下,
Figure BDA0002058498600000132
S339、确定参数,将数据代入进行预测。具体步骤如下。
输入已有训练集,所述训练集包含用户特征(用户ID-用户性别-用户年龄)、产品特征(包含农产品ID-农产品名称-农产品种类)以及该用户对于该农产品评分Score。在用户对于农产品搜索购买等行为可以对其加权设置打分,但是对于用户行为分析,不会对所有农产品进行打分。因此打分矩阵S(用户ID-农产品ID-打分Score)存在缺失值,对于缺失的评分进行填补,为用户提供搜索预测。
分解训练数据模型,公式如下,R=UTSV。
随机化用户矩阵U、代入S335的第一项公式中,通过目标函数S335的第二项公式求得产品矩阵V,再对V进行归一化处理后,求出U。随后不断迭代、直到U*V满足收敛条件,即将UV代入S338中,通过RMSE收敛情况得到判断打分矩阵R训练情况。取其较优RMSE收敛情况的Score,填补缺失的打分矩阵R。最后根据用户对于不同农产品的评分进行比较,从而进行搜索预测。
综上所述,本发明所提出的一种基于农业溯源信息的搜索预测系统及相对应的搜索预测方法,实现了在大数据技术背景下对农产品信息的采集、存储与挖掘。本发明能够通过对用户搜索行为的分析、判断,预测出用户的搜索倾向,再根据所得到的搜索倾向在用户搜索时进行相关推荐,从而提升企业的市场化水平和农产品的竞争力。
同时,本发明的系统中所存储的在农产品溯源、销售、售后等过程中所积累的海量数据,也将会对使用者的生产指导、销售策略、公司运营等过程中提供重要的指导意见。
此外,本发明也为同领域内的其他相关问题提供了参考,可以以此为依据进行拓展延伸,运用于与数据挖掘、搜索预测等有关的其他技术方案中,具有十分广阔的应用前景。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神和基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内,不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (9)

1.一种基于农业溯源信息的搜索预测系统,其特征在于,包括:
溯源数据采集模块,用于采集农业溯源信息并将所采集的农业溯源信息进行上传;
数据处理与储存模块,用于接收来自溯源数据采集模块的农业溯源信息,并对所采集的农业溯源信息进行分类、处理与储存;
搜索预测模块,用于建立训练模型,使用经过分类处理后的农业溯源信息作为数据集,对训练模型进行训练并完成搜索预测。
2.根据权利要求1所述的基于农业溯源信息的搜索预测系统,其特征在于,所述溯源数据采集模块包括:
QRcode采集单元,用于生成QRcode数据,QRcode数据与农产品间一对一认证;
WSN采集单元,用于采集农产品运输过程中相应地理位置的温度、湿度信息;
农业网站日志与用户搜索内容采集单元,用于采集用户访问的农业网站日志以及用户搜索内容,并对所采集的内容进行过滤留下搜索内容与用户订单日志;
快递订单信息采集单元,用于通过物流配送采集快递订单信息。
3.根据权利要求1所述的基于农业溯源信息的搜索预测系统,其特征在于:在所述数据处理与储存模块中,将所采集的农业溯源信息分为三类,即农产品信息、搜索内容信息以及用户信息;
所述农产品信息至少包括二维码、环境数据以及销售信息;
所述搜索内容信息至少包括搜索内容以及搜索次数;
所述用户信息至少包括用户ID,农产品ID以及购买属性。
4.根据权利要求1所述的基于农业溯源信息的搜索预测系统,其特征在于,所述搜索预测模块包括:
搜索内容处理单元,用于使用大数据平台下的MapReduce计算框架从搜索内容中统计出搜索频率作为搜索热度参考;
销售信息与用户日志分析单元,用于提取农产品信息中的销售信息与用户日志中的购买信息并对用户信息进行加权;
预测结果输出单元,用于建立训练模型,对训练模型进行训练,产生并输出预测结果。
5.一种基于农业溯源信息的搜索预测方法,其特征在于,包括如下步骤:
S1、溯源数据采集步骤,采集农业溯源信息并将所采集的农业溯源信息进行上传;
S2、数据处理与储存步骤,接收农业溯源信息,并对所采集的农业溯源信息进行分类、处理与储存;
S3、搜索预测步骤,建立训练模型,使用经过分类处理后的农业溯源信息作为数据集,对训练模型进行训练并完成搜索预测。
6.根据权利要求5所述的基于农业溯源信息的搜索预测方法,其特征在于,S1所述溯源数据采集步骤包括:
S11、QRcode采集步骤,生成QRcode数据,QRcode数据与农产品间一对一认证;
S12、WSN采集步骤,采集农产品运输过程中相应地理位置的温度、湿度信息;
S13、农业网站日志与用户搜索内容采集步骤,采集用户访问的农业网站日志以及用户搜索内容,并对所采集的内容进行过滤留下搜索内容与用户订单日志;
S14、快递订单信息采集步骤,通过物流配送采集快递订单信息。
7.根据权利要求5所述的基于农业溯源信息的搜索预测方法,其特征在于:在S2所述数据处理与储存步骤中,将所采集的农业溯源信息分为三类,即农产品信息、搜索内容信息以及用户信息;
所述农产品信息至少包括二维码、环境数据以及销售信息;
所述搜索内容信息至少包括搜索内容以及搜索次数;
所述用户信息至少包括用户ID,农产品ID以及购买属性。
8.根据权利要求5所述的基于农业溯源信息的搜索预测方法,其特征在于,S3所述搜索预测步骤包括:
S31、搜索内容处理步骤,使用大数据平台下的MapReduce计算框架从搜索内容中统计出搜索频率作为搜索热度参考;
S32、销售信息与用户日志分析步骤,提取农产品信息中的销售信息与用户日志中的购买信息并对用户信息进行加权;
S33、预测结果输出步骤,建立训练模型,对训练模型进行训练,产生并输出预测结果。
9.根据权利要求8所述的基于农业溯源信息的搜索预测方法,其特征在于,S33所述预测结果输出步骤包括:
S331、设置矩阵分解的模型,公式如下,
R=UTSV,
其中,UT为用户特征矩阵,V为产品特征矩阵,R为打分矩阵,S为特征矩阵。
S332、确定特征值,将评分矩阵R(m*n)分解为与V(n*k),其中k为user/product的特征值数量;
S333、确定损失函数,对于产品特征矩阵V(n*k)中第j个产品的特征向量vj和用户特征矩阵U(m*k)中的第i个用户的特征向量ui来进行预测评分矩阵A(m*n)中的aij,公式如下,
Figure FDA0002058498590000042
S334、使用交叉最小二乘法对损失函数进行优化,根据用户对于农产品的评分信息对于模型进行训练,交替使用最小二乘法逐步计算用户或农产品的特征向量,使差平方和最小;
S335、固定U0求解V0,随机生成U0一般取0值或全局均值,公式如下,
Figure FDA0002058498590000043
带入M1=U(0)(UT)0+λE,
Figure FDA0002058498590000044
得到
Figure FDA0002058498590000045
其中,为评价过农产品j的用户评分组成的向量,U为评价过农产品的用户的特征向量组成的特征矩阵,E为评价过农产品j的用户数量,
随后按照上述公式,依次代入v1,v2,v3,v4…vn,最终得到v0
S337、固定V0求解U0,得到
Figure FDA0002058498590000053
按照S335中的公式,依次代入u1,u2,u3,u4…un,得到u0
S338、迭代,根据S336及S337得到V,U直至均方差很小时得到C对应最优矩阵,公式如下,
Figure FDA0002058498590000051
Figure FDA0002058498590000052
S339、确定参数,将数据代入进行预测。
CN201910396995.0A 2019-05-14 2019-05-14 基于农业溯源信息的搜索预测系统及方法 Pending CN110674964A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910396995.0A CN110674964A (zh) 2019-05-14 2019-05-14 基于农业溯源信息的搜索预测系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910396995.0A CN110674964A (zh) 2019-05-14 2019-05-14 基于农业溯源信息的搜索预测系统及方法

Publications (1)

Publication Number Publication Date
CN110674964A true CN110674964A (zh) 2020-01-10

Family

ID=69068761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910396995.0A Pending CN110674964A (zh) 2019-05-14 2019-05-14 基于农业溯源信息的搜索预测系统及方法

Country Status (1)

Country Link
CN (1) CN110674964A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111563759A (zh) * 2020-06-24 2020-08-21 浙江天演维真网络科技股份有限公司 基于ai技术的农产品溯源过程的识别与分析系统
CN112053182A (zh) * 2020-08-05 2020-12-08 北京一人一亩田网络科技有限公司 鲜活农产品的竞争力的评估方法和系统
CN113378383A (zh) * 2021-06-10 2021-09-10 北京工商大学 一种食品供应链危害物预测方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488216A (zh) * 2015-12-17 2016-04-13 上海中彦信息科技有限公司 基于隐式反馈协同过滤算法的推荐系统及方法
CN106296305A (zh) * 2016-08-23 2017-01-04 上海海事大学 大数据环境下的电商网站实时推荐系统与方法
CN107563709A (zh) * 2017-10-20 2018-01-09 中农网购(江苏)电子商务有限公司 一种基于云平台的农化产品销售预测系统及其方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488216A (zh) * 2015-12-17 2016-04-13 上海中彦信息科技有限公司 基于隐式反馈协同过滤算法的推荐系统及方法
CN106296305A (zh) * 2016-08-23 2017-01-04 上海海事大学 大数据环境下的电商网站实时推荐系统与方法
CN107563709A (zh) * 2017-10-20 2018-01-09 中农网购(江苏)电子商务有限公司 一种基于云平台的农化产品销售预测系统及其方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111563759A (zh) * 2020-06-24 2020-08-21 浙江天演维真网络科技股份有限公司 基于ai技术的农产品溯源过程的识别与分析系统
CN111563759B (zh) * 2020-06-24 2023-09-01 浙江天演维真网络科技股份有限公司 基于ai技术的农产品溯源过程的识别与分析系统
CN112053182A (zh) * 2020-08-05 2020-12-08 北京一人一亩田网络科技有限公司 鲜活农产品的竞争力的评估方法和系统
CN113378383A (zh) * 2021-06-10 2021-09-10 北京工商大学 一种食品供应链危害物预测方法及装置
CN113378383B (zh) * 2021-06-10 2024-02-27 北京工商大学 一种食品供应链危害物预测方法及装置

Similar Documents

Publication Publication Date Title
CN110222272B (zh) 一种潜在客户挖掘与推荐方法
Yucesan et al. An integrated best-worst and interval type-2 fuzzy TOPSIS methodology for green supplier selection
Bag et al. Predicting the consumer's purchase intention of durable goods: An attribute-level analysis
CN107944986B (zh) 一种o2o商品推荐方法、系统及设备
US20130339350A1 (en) Ranking Search Results Based on Click Through Rates
CN108921602B (zh) 一种基于集成神经网络的用户购买行为预测方法
CN107113466A (zh) 向用户推荐项目
CN110674964A (zh) 基于农业溯源信息的搜索预测系统及方法
KR102142126B1 (ko) 계층적 카테고리 군집 기반 장바구니 상품 추천 방법
CN105205188A (zh) 采购物料供应商的推荐方法及推荐装置
CN107644036A (zh) 一种数据对象推送的方法、装置及系统
CN111079014A (zh) 基于树结构的推荐方法、系统、介质和电子设备
Lin et al. Green suppliers performance evaluation in belt and road using fuzzy weighted average with social media information
Sato et al. Design of fusion technique-based mining engine for smart business
CN112085525A (zh) 一种基于混合模型的用户网络购买行为预测研究方法
CN106294410A (zh) 一种个性化信息推送时间的确定方法及确定系统
CN111429161B (zh) 特征提取方法、特征提取装置、存储介质及电子设备
Kuo et al. An integrated Kano model, fuzzy analytical hierarchy process, and decision matrix for sustainable supplier selection in palm oil industries Indonesia, a case study
Ozyurt et al. A deep Markov model for clickstream analytics in online shopping
CN114399367A (zh) 保险产品推荐方法、装置、设备及存储介质
Ok et al. Recommendation framework combining user interests with fashion trends in apparel online shopping
Ba et al. Classification and Identification of Contaminants in Recyclable Containers Based on a Recursive Feature Elimination-Light Gradient Boosting Machine Algorithm Using an Electronic Nose
Ren et al. A review of combinatorial optimization problems in reverse logistics and remanufacturing for end-of-life products
Ming et al. Hybrid recommendation scheme based on deep learning
Chu et al. Deep graph embedding for ranking optimization in e-commerce

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200110

RJ01 Rejection of invention patent application after publication