CN117911107B - 一种基于大数据的产业数字化综合服务系统 - Google Patents

一种基于大数据的产业数字化综合服务系统 Download PDF

Info

Publication number
CN117911107B
CN117911107B CN202410025527.3A CN202410025527A CN117911107B CN 117911107 B CN117911107 B CN 117911107B CN 202410025527 A CN202410025527 A CN 202410025527A CN 117911107 B CN117911107 B CN 117911107B
Authority
CN
China
Prior art keywords
user
users
purchase
agricultural products
agricultural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410025527.3A
Other languages
English (en)
Other versions
CN117911107A (zh
Inventor
罗西
丰年
童小龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongchuang Fangwei Digital Technology Co ltd
Original Assignee
Beijing Zhongchuang Fangwei Digital Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhongchuang Fangwei Digital Technology Co ltd filed Critical Beijing Zhongchuang Fangwei Digital Technology Co ltd
Priority to CN202410025527.3A priority Critical patent/CN117911107B/zh
Publication of CN117911107A publication Critical patent/CN117911107A/zh
Application granted granted Critical
Publication of CN117911107B publication Critical patent/CN117911107B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及数字化推荐技术领域,具体涉及一种基于大数据的产业数字化综合服务系统,所述系统包括:农产品电子商务平台的相关数据采集模块:获取农产品电子商务平台的相关数据;农产品与用户购买数据分析模块:根据用户对各种农产品在每年的购买数据之间的相似性、不同时令时间段的购买情况、任意两个用户之间购买农产品的重叠情况以及农产品之间的替代情况优化对用户的聚类过程,得到各聚类簇;根据各种农产品对各用户所在聚类簇内用户的购买情况得到各种农产品对各用户的用户推荐率;农产品种植与用户推荐模块:根据各种农产品对各用户的用户推荐率得到各种农产品的种植推荐率。本发明旨在提高农产品电子商务平台的营销效率与效益。

Description

一种基于大数据的产业数字化综合服务系统
技术领域
本申请涉及数字化推荐技术领域,具体涉及一种基于大数据的产业数字化综合服务系统。
背景技术
随着计算机技术的蓬勃发展,大数据技术在不同领域得到广泛应用,社会进入了智能大数据时代。大数据技术拥有强大的信息处理和分析能力,将大数据技术和农业生产充分结合,有助于改善农业经济结构,推动农业发展。实现,必须利用好大数据这一技术助推器。的重点是推广大数据、人工智能等绿色技术,让这些技术驱动人们发展绿色生活方式,将丰富的绿色资源转化为绿色资本,实现可持续发展。
其中,农产品电子商务是的重要的一环。农产品电子商务是指将当前先进的信息网络技术与农业生产、初级加工、销售和运输相结合。而在这一过程中,为了增加农产品的销售率,往往需要对客户进行精确营销,完成相关农产品的推荐。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种基于大数据的产业数字化综合服务系统,所采用的技术方案具体如下:
本发明提出了基于一种基于大数据的产业数字化综合服务系统,所述系统包括:
农产品电子商务平台的相关数据采集模块:获取农产品电子商务平台的相关数据,包括但不限于:用户购买记录数据、农产品销售数据以及农产品时令数据;
农产品与用户购买数据分析模块:根据用户对各种农产品在每年的购买数据之间的相似性、不同时令时间段的购买情况获取用户的高价值度;根据任意两个用户的高价值度、购买农产品的重叠情况以及农产品之间的替代情况得到任意两个用户之间修正后的购买近似度;根据待选用户中任意两个用户之间修正后的购买近似度、高价值度以及用户特征数据差异优化对用户的聚类过程,得到各聚类簇;根据各种农产品对各用户所在聚类簇内用户的购买情况得到各种农产品对各用户的用户推荐率;
农产品种植与用户推荐模块:根据各种农产品对各用户的用户推荐率得到各种农产品的种植推荐率;针对大于预设推荐阈值的用户推荐率与种植推荐率的农产品和用户进行精准推荐。
优选的,所述根据用户对各种农产品在每年的购买数据之间的相似性、不同时令时间段的购买情况获取用户的高价值度,包括:
对于任意一种农产品,将用户对农产品每年的购买时间与购买数据进行线性拟合得到每年的特征曲线;
根据用户对农产品每年的特征曲线之间的相似情况得到用户对农产品的需求稳定性;根据用户对农产品在每年的特征曲线上不同时令时间段的购买数据得到用户对农产品的花费度;计算所述需求稳定性与所述花费度的乘积,将用户对所有农产品的所述乘积的和值与用户购买农产品的种类数量的乘积结果作为用户的高价值度。
优选的,所述根据用户对农产品每年的特征曲线之间的相似情况得到用户对农产品的需求稳定性,包括:
对于任意一条特征曲线,获取特征曲线与其他特征曲线之间的最小DTW距离;获取特征曲线上的购买记录个数、最大购买量与最小购买量;
对于特征曲线上各购买记录,计算与该购买记录在时序上最近邻的购买记录的购买量之间的差值绝对值;获取特征曲线上所有购买记录的所述差值绝对值的和值作为第一和值;
计算所述最大购买量与所述最小购买量的差值绝对值的相反数,将所述相反数与所述第一和值的乘积作为以自然常数为底数的指数函数的指数;
计算所述指数函数的计算结果、所述购买记录个数、所述最小DTW距离之间的乘积结果,将所有特征曲线的所述乘积结果的和值作为用户对农产品的需求稳定性。
优选的,所述根据用户对农产品在每年的特征曲线上不同时令时间段的购买数据得到用户对农产品的花费度,包括:
对于任意一条特征曲线上各购买记录,获取购买记录的购买时间、购买量;获取农产品的时令时间段;计算所述购买时间与最邻近的时令时间段的时间距离;
将所述时间距离与所述购买量的乘积作为第一乘积,将所有特征曲线上的所有购买记录的所述第一乘积的和值作为用户对农产品的花费度。
优选的,所述根据任意两个用户的高价值度、购买农产品的重叠情况以及农产品之间的替代情况得到任意两个用户之间修正后的购买近似度,包括:
对于任意两个用户,根据两个用户的高价值度、购买农产品的重叠情况得到两个用户之间的购买近似度;根据两个用户中未同时购买的任意两种农产品之间的替代情况得到任意两种农产品之间的可替代性;
计算两个用户之间未同时购买的所有农产品与未同时购买的其他所有农产品之间最大的可替代性之和,将所述最大的可替代性之和与两个用户之间的购买近似度的乘积结果作为两个用户之间修正后的购买近似度。
优选的,所述根据两个用户的高价值度、购买农产品的重叠情况得到两个用户之间的购买近似度,包括:
获取两个用户共同购买过的农产品种类个数;获取两个用户购买对方未购买的农产品种类个数之和;计算所述共同购买过的农产品种类个数与所述农产品种类个数之和的比值;
获取两个用户之间所有年份的特征曲线,将两个用户同一年份的特征曲线组成匹配特征曲线对,当其中一个用户不存在对应年份时,将距离该年份最近年份的特征曲线组成匹配特征曲线对;
对于各匹配特征曲线对,获取匹配特征曲线对之间的DTW距离;计算匹配特征曲线对上所有对应数据点之间的差值绝对值的和值的相反数,将所述相反数作为以自然常数为底数的指数函数的指数;
将所有匹配特征曲线对的所述指数函数的计算结果与所述DTW距离之间比值的和值记为第二和值;计算两个用户的高价值度的差值绝对值的倒数;将所述比值、所述第二和值与所述倒数的乘积作为两个用户之间的购买近似度。
优选的,所述根据两个用户中未同时购买的任意两种农产品之间的替代情况得到任意两种农产品之间的可替代性,包括:
计算购买所述两种农产品中的一种农产品的各用户与购买另一种农产品的各用户之间的购买近似度和值;
采用关联规则挖掘算法获取两种农产品之间的支持度、置信度;获取同时购买所述两种农产品的用户个数;
将所述购买近似度和值、所述支持度、所述置信度的乘积与所述用户个数的比值作为两种农产品之间的可替代性。
优选的,所述根据待选用户中任意两个用户之间修正后的购买近似度、高价值度以及用户特征数据差异优化对用户的聚类过程,得到各聚类簇,包括:
对于待选用户中的各用户,计算用户与其他所有用户之间修正后的购买近似度的和值作为第三和值,将所述第三和值与用户的高价值度的乘积作为用户作为第一初始聚类中心的可能性;将待选用户中所述可能性最大的用户作为第一初始聚类中心;
其中,剩余各初始聚类中心与第一初始聚类中心的计算过程相同;将各初始聚类簇中心作为K-means聚类算法中的各聚类中心;
对于任意两个用户之间的距离度量指标,计算两个用户的高价值度的差值绝对值,计算两个用户共同填写的所有个人特征数据之间的距离和值,将所述差值绝对值与所述距离和值的乘积结果除以所述修正后的购买近似度作为两个用户之间的距离度量指标;将所述距离度量指标作为K-means聚类算法中的聚类距离。
优选的,所述根据各种农产品对各用户所在聚类簇内用户的购买情况得到各种农产品对各用户的用户推荐率,包括:
对于农产品m与用户A,计算用户A所在聚类簇中购买农产品m的用户数量与聚类簇中用户数量的比值;
对于聚类簇内购买农产品m的各用户,分别计算各用户与用户A的修正后的购买近似度、各用户的高价值度以及各用户购买农产品m的购买量的乘积;计算聚类簇内所有购买农产品m的用户的所述乘积的和值;
将所述和值、所述比值与用户A的高价值度的乘积作为农产品m对用户A的用户推荐率。
优选的,所述根据各种农产品对各用户的用户推荐率得到各种农产品的种植推荐率,包括:
对于各种农产品,计算所有用户对于农产品的用户推荐率与其高价值度的乘积的和值,将所述和值与农产品的整体销售量的乘积作为农产品的种植推荐率。
本发明至少具有如下有益效果:
本发明通过对电商平台的用户购买数据进行分析,基于用户的购买习惯特征与相应的购买数据自适应构建购买近似度,同时基于农产品之间的销售关联性特征对购买近似度进行修正,基于修正后的购买近似度以及用户个人特征数据自适应选择K-means聚类算法中的聚类中心,并构建距离度量指标,对用户进行分类,进而基于同一类别的用户的关联性与不同类别用户的差异构建农产品对用户的推荐率,以及农产品的种植推荐率,提高了农产品电子商务平台的营销效率与效益。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种基于大数据的产业数字化综合服务系统的流程图;
图2为K-means聚类算法的聚类效果;
图3为K-means聚类算法的优化示意图;
图4为用户推荐率、种植推荐率的指标构建流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于大数据的产业数字化综合服务系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种基于大数据的产业数字化综合服务系统的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种基于大数据的产业数字化综合服务系统的流程图,该系统包括:农产品电子商务平台的相关数据采集模块101、农产品与用户购买数据分析模块102、农产品种植与用户推荐模块103。
农产品电子商务平台的相关数据采集模块101,为了实现,本实施例针对产业中的农产品电子商务平台,对客户进行精确营销以及农产品的收购。
本实施例通过农产品电子商务平台获取用户相关数据,包括:各项农产品的历史购买记录数据与用户基本数据例如年龄,收入,购买反馈数据等,农产品的相关销售数据以及农产品所对应的时令时间数据。
至此,完成农产品电子商务平台内相关数据的获取。
农产品与用户购买数据分析模块102,农产品电子商务平台是通过电商平台推广农产品,帮助农民增加销售收入的一种方式,在农产品电商平台的帮助下,农民可方便地将农产品销售到全国各地,从而获得更多的种植收益,同时电商平台可以对农产品的销售数据进行分析和预测,获取农产品的推荐率,帮助农民进行生产决策,提高农产品质量和市场竞争力,进而更好的实现。
为了实现,关键在于对农产品销售数据的分析,提高农产品的销售数据,本实施例使用改进的K-means聚类算法对电商平台的用户购买数据进行分析,对用户进行分类,进而基于同一类别的用户的关联性与不同类别用户的差异构建农产品对用户的用户推荐率,进而更好的提高农产品的销售率。
然而,传统的K-means聚类中初始聚类中心点往往是随机选取,初始聚类中心点的选取会直接影响K-means聚类的结果,不同的初始聚类中心点在进行聚类时,其所对应的聚类收敛速度与聚类效果也不同,当初始聚类中心点的选择较差时,聚类时可能会导致收敛到局部最优解而非全局最优解。
根据上述步骤已经获取了用户的相关数据,其中每个用户均有其对应的自身特征数据如收入,年龄以及农产品购买记录数据。
首先根据先验知识人为设定K-means算法中的聚类类别数目K=6,实施者可进行调节,再选取初始聚类中心点,其中每个用户可视为聚类算法中的一个数据点。
对于其中任意一个用户而言,获取其所购买农产品的购买记录,假设用户共购买了YH种农产品。
对于每一种农产品而言,获取每次的购买时间与购买量,再通过最小二乘法拟合算法进行拟合,对于用户注册后每年的购买记录均可获取一条农产品购买特征曲线,其中,特征曲线的横坐标为时间,纵坐标为该农产品的购买量,假设用户对应了QX条特征曲线,每条特征曲线实际为一个时间序列数据。
本实施例通过DTW算法获取其中任意两条特征曲线之间的DTW距离,则每两条特征曲线之间均有其相应的DTW距离,距离越小,相似性越大,则说明用户该农产品的需求越稳定。对每条曲线获取其所对应的最小DTW距离。其中,最小二乘法拟合算法与DTW算法均为公知技术,本实施例不再赘述。
再通过先验知识获取农产品所对应的每年时令时间段,即在这个时间段内,该农产品会成熟。例如小麦,根据先验知识可得小麦一般在每年的6月至8月份成熟,其6月至8月时间段内即为小麦的时令时间段。则对于农产品而言,每年的时间可分为时令时间段与非时令时间段,通过不同时间段内特征曲线内农产品购买数据的变化以及农产品获取农产品的需求稳定性,通过基于相应的购买数据以及购买数据变化构建用户高价值度F:
式中,表示用户对农产品的需求稳定性。表示用户对农产品购买的特征曲线个数,当QX=1时,表示第c条特征曲线与其余特征曲线之间的DTW距离最小值。表示第c条特征曲线上的购买记录个数,每个购买记录表征了曲线上的一个特征数据点,包含了购买时间与购买量。表示以自然常数e为底数的指数函数。表示第c条特征曲线上的最大购买量,表示第c条特征曲线上的最小购买量。表示第c条特征曲线上第g个特征数据点与其时序上最邻近的特征数据点之间的购买量的差值绝对值,其中,记为第一和值。
表示用户在该农产品上的花费度。表示第c条特征曲线上第g个特征数据点的购买量。表示第c条特征曲线上第g个特征数据点的购买时间,表示与该购买时间数据最邻近的时令时间段数据,为极小正数,防止购买时间位于时令时间段内而导致部分数据为0,示例值为0.001,其中,记为第一乘积。
表示了用户的高价值度。YH表示了用户购买了YH种农产品,表示了第yh种农产品所对应的用户需求稳定性。则表示了用户对该农产品的花费度。用户高价值度越大,则说明用户对农产品的需求量越大,越稳定,其所能带来的价值越大,作为后续商品推荐时的权重,其所对应的权重也应越大。用户高价值度越小,则说明用户对农产品的需求量越小,越不稳定,其所带来的价值越小,则后续的推荐权重越小。
根据上述步骤完成了用户的高价值度指标的构建,假设电子商务平台内共有N个用户,由于不同聚类中心往往代表了不同的类别,故聚类中心之间的差异越大则聚类效果往往越好。而用户初筛度仅反映了用户自身数据的部分特性,而对于用户之间的差异特性未能进行表征,直接使用用户初筛度进行初始聚类中心的筛选时,其效率与聚类效果均较差。
故本实施例通过用户的购买农产品在不同时期的变化自适应构建用户的购买近似度,由于农产品的类别较多,同一类农产品往往可能有较多的品种,例如西瓜有麒麟西瓜,也有黑美人瓜等各种品种,同时也具有一定的可替代性,例如哈密瓜也在一定程度上可替代西瓜。则可构建农产品之间的可替代性,此处假设为农产品NC1与NC2。
而直接对比购买农产品的差异时,往往不能够准确的反映出用户的购买近似度,故本实施例中通过农产品之间的可替代性作为购买近似度的修正因子。基于修正因子对购买近似度进行修正,得到修正后的购买近似度
此处以用户Q与用户W为例,首先获取其均购买过的农产品种类个数,以及用户Q购买但用户W未购买过的农产品个数,用户W购买但用户Q未购买过的农产品个数,对于均购买过的农产品而言,每个用户均有其对应的特征曲线。
由于每个特征曲线表征了用户每年的购买数据状况,对于用户Q与用户W,首先获取匹配的特征曲线对。以2022年为例,2022年的用户购买数据生成的用户Q的特征曲线与用户W的特征曲线即为相匹配的特征曲线,若不存在年份相同的特征曲线,则获取年份差异最小的两特征曲线作为匹配的特征曲线对。
通过匹配的特征曲线对之间的差异以及整体购买农产品的差异以及用户高价值度自适应构建用户之间的购买近似度
公式中,表示两个用户之间的购买近似度。表示用户Q与用户W共同购买过的农产品种类个数,表示用户Q购买但用户W未购买过的农产品种类个数,表示用户W购买但用户Q未购买过的农产品种类个数。分别表示用户Q与用户W的用户高价值度。表示匹配特征曲线对的组数,表示以自然常数e为底数的指数函数,表示第v组匹配特征曲线对上特征数据点的总个数,表示了第x个特征数据点在用户Q的特征曲线上的购买量,表示了第x个特征数据点在用户W的特征曲线上的购买量,表示了匹配的第v组特征曲线对之间的DTW距离。为极小正数,防止分母为0,示例值0.001,其中,记为第二和值。
而由于农产品之间具有可替代性,故值不能够精确的反映出用户之间的购买近似度。
表示两类农产品之间的可替代性。其中表示两个农产品之间的支持度与置信度,其可以通过关联规则挖掘算法获取,APriori算法为公知技术,此处不再赘述。表示了农产品电子商务平台中同时购买农产品NC1与NC2的用户个数,表示了仅购买农产品NC1而未购买农产品NC2的用户个数,表示了仅购买农产品NC2而未购买农产品NC1的用户个数。表示第b个购买农产品NC1而未购买农产品NC2的用户与第d个购买农产品NC2而未购买农产品NC1的用户之间的购买近似度。
则对于用户Q与用户W中仅有一个用户购买的农产品而言,每个农产品与另一个用户购买的特征农产品之间均可计算出相应的可替代性。
为修正后的购买近似度。表示了第q类农产品与两个用户未同时购买的所有农产品中的最大可替代性。
购买近似度越大,则说明两用户之间购买农产品的习惯越相近。购买近似度越小,则说明两用户之间购买农产品的习惯差异越大。
根据上述步骤则待选用户之间均存在相应的购买近似度,而同一类别内的用户之间的购买近似度往往较大,聚类中心所对应的用户必然跟一定的其他用户之间的购买近似度较大,基于此特性,自适应获取待选用户Q作为第一初始聚类中心的可能性
公式中,表示用户Q作为第一初始聚类中心的可能性,表示用户Q的高价值度,表示待选用户个数,表示了用户Q与第y个待选用户之间修正后的购买近似度,其中,记为第三和值。
根据上述步骤可得每个待选用户均有其对应的第一初始聚类中心可能性,本实施例选择第一初始聚类中心可能性最大值作为第一初始聚类中心,此处假设为用户Q。
再从剩余的待选用户中采用与第一初始聚类中心相同的方法获取K个初始聚类中心。本实施例通过用户之间的购买近似度以及用户特征数据间的差异自适应构建距离度量指标
公式中,表示距离度量指标,表示了用户A与用户Q均填写过的个人特征数据个数,表示了用户A的第i类个人数据,表示了用户Q的第i类个人特征数据,其数据之间的距离越大,则距离度量指标越大。则表示了用户A与用户Q修正后的购买近似度。其值越小距离指标越大。此处以用户A与Q为例,分别表示了用户A与用户Q的高价值度。
聚类过程中的距离度量指标越小,则说明用户之间越可能属于同种类别。其中,K-means聚类算法的聚类效果如图2所示,K-means聚类算法的优化示意图如图3所示。
根据上述步骤完成了K-means聚类的初始聚类中心的选择与距离度量指标的构建,聚类过程为公知技术,此处不再赘述,则可得到K个类别。则对于任意一类农产品而言,可获取农产品对用户A的用户推荐率
公式中,表示农产品对用户A的用户推荐率,表示了用户A的高价值度,表示了用户A所属类别的用户个数,表示了用户A所属类别中购买了该农产品的用户个数,表示了第j个用户与用户A之间的修正后的购买近似度。表示了第j个用户的高价值度。表示了第j个用户购买该类农产品的购买量。用户推荐率越大,则说明该用户购买该农产品的可能性越大。
通过农产品对用户的推荐率以及农产品的整体销售数据自适应构建农产品的种植推荐率,以第m种农产品的种植推荐率为例:
公式中,表示第m种农产品的种植推荐率,表示了农产品m的整体销售量,表示了用户个数,表示了该农产品对第a个用户的用户推荐率,表示了第a个用户的高价值度。
种植推荐率越大,则说明农民在种植该农产品后,其所得到的产品被销售出去的概率越大,获得的收益越稳定。种植推荐率越小,则说明该农产品的销售越困难,收益越小。其中,用户推荐率、种植推荐率的指标构建流程图如图4所示。
农产品种植与用户推荐模块103,根据上述步骤完成了各种农产品相应的用户推荐率与种植推荐率,对所有的推荐率均进行归一化处理,当推荐率大于等于推荐阈值时,即可进行推荐营销。其中,本实施例设置推荐阈值为0.6,实施者可根据实际情况自行设定。
其中用户推荐率可以使得电商平台完成更精准的营销推荐,提高农产品的销售率,保障了农产品的销售利润。而种植推荐率可以有效的帮助农民完成生产种植的决策,不仅保障了农民的利益,也提高了农产品电子商务平台的货源。进而更有效的实现目标。
至此,基于大数据完成了产业数字化综合服务。
综上所述,本发明实施例通过对电商平台的用户购买数据进行分析,基于用户的购买习惯特征与相应的购买数据自适应构建购买近似度,同时基于农产品之间的销售关联性特征对购买近似度进行修正,基于修正后的购买近似度以及用户个人特征数据自适应选择K-means聚类算法中的聚类中心,并构建距离度量指标,对用户进行分类,进而基于同一类别的用户的关联性与不同类别用户的差异构建农产品对用户的推荐率,以及农产品的种植推荐率,提高了农产品电子商务平台的营销效率与效益。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于大数据的产业数字化综合服务系统,其特征在于,所述系统包括:
农产品电子商务平台的相关数据采集模块:获取农产品电子商务平台的相关数据,包括但不限于:用户购买记录数据、农产品销售数据以及农产品时令数据;
农产品与用户购买数据分析模块:根据用户对各种农产品在每年的购买数据之间的相似性、不同时令时间段的购买情况获取用户的高价值度;根据任意两个用户的高价值度、购买农产品的重叠情况以及农产品之间的替代情况得到任意两个用户之间修正后的购买近似度;根据待选用户中任意两个用户之间修正后的购买近似度、高价值度以及用户特征数据差异优化对用户的聚类过程,得到各聚类簇;根据各种农产品对各用户所在聚类簇内用户的购买情况得到各种农产品对各用户的用户推荐率;
农产品种植与用户推荐模块:根据各种农产品对各用户的用户推荐率得到各种农产品的种植推荐率;针对大于预设推荐阈值的用户推荐率与种植推荐率的农产品和用户进行精准推荐;
所述根据用户对各种农产品在每年的购买数据之间的相似性、不同时令时间段的购买情况获取用户的高价值度,包括:
对于任意一种农产品,将用户对农产品每年的购买时间与购买数据进行线性拟合得到每年的特征曲线;
根据用户对农产品每年的特征曲线之间的相似情况得到用户对农产品的需求稳定性;根据用户对农产品在每年的特征曲线上不同时令时间段的购买数据得到用户对农产品的花费度;计算所述需求稳定性与所述花费度的乘积,将用户对所有农产品的所述乘积的和值与用户购买农产品的种类数量的乘积结果作为用户的高价值度;
所述根据任意两个用户的高价值度、购买农产品的重叠情况以及农产品之间的替代情况得到任意两个用户之间修正后的购买近似度,包括:
对于任意两个用户,根据两个用户的高价值度、购买农产品的重叠情况得到两个用户之间的购买近似度;根据两个用户中未同时购买的任意两种农产品之间的替代情况得到任意两种农产品之间的可替代性;
计算两个用户之间未同时购买的所有农产品与未同时购买的其他所有农产品之间最大的可替代性之和,将所述最大的可替代性之和与两个用户之间的购买近似度的乘积结果作为两个用户之间修正后的购买近似度。
2.如权利要求1所述的一种基于大数据的产业数字化综合服务系统,其特征在于,所述根据用户对农产品每年的特征曲线之间的相似情况得到用户对农产品的需求稳定性,包括:
对于任意一条特征曲线,获取特征曲线与其他特征曲线之间的最小DTW距离;获取特征曲线上的购买记录个数、最大购买量与最小购买量;
对于特征曲线上各购买记录,计算与该购买记录在时序上最近邻的购买记录的购买量之间的差值绝对值;获取特征曲线上所有购买记录的所述差值绝对值的和值作为第一和值;
计算所述最大购买量与所述最小购买量的差值绝对值的相反数,将所述相反数与所述第一和值的乘积作为以自然常数为底数的指数函数的指数;
计算所述指数函数的计算结果、所述购买记录个数、所述最小DTW距离之间的乘积结果,将所有特征曲线的所述乘积结果的和值作为用户对农产品的需求稳定性。
3.如权利要求1所述的一种基于大数据的产业数字化综合服务系统,其特征在于,所述根据用户对农产品在每年的特征曲线上不同时令时间段的购买数据得到用户对农产品的花费度,包括:
对于任意一条特征曲线上各购买记录,获取购买记录的购买时间、购买量;获取农产品的时令时间段;计算所述购买时间与最邻近的时令时间段的时间距离;
将所述时间距离与所述购买量的乘积作为第一乘积,将所有特征曲线上的所有购买记录的所述第一乘积的和值作为用户对农产品的花费度。
4.如权利要求1所述的一种基于大数据的产业数字化综合服务系统,其特征在于,所述根据两个用户的高价值度、购买农产品的重叠情况得到两个用户之间的购买近似度,包括:
获取两个用户共同购买过的农产品种类个数;获取两个用户购买对方未购买的农产品种类个数之和;计算所述共同购买过的农产品种类个数与所述农产品种类个数之和的比值;
获取两个用户之间所有年份的特征曲线,将两个用户同一年份的特征曲线组成匹配特征曲线对,当其中一个用户不存在对应年份时,将距离该年份最近年份的特征曲线组成匹配特征曲线对;
对于各匹配特征曲线对,获取匹配特征曲线对之间的DTW距离;计算匹配特征曲线对上所有对应数据点之间的差值绝对值的和值的相反数,将所述相反数作为以自然常数为底数的指数函数的指数;
将所有匹配特征曲线对的所述指数函数的计算结果与所述DTW距离之间比值的和值记为第二和值;计算两个用户的高价值度的差值绝对值的倒数;将所述比值、所述第二和值与所述倒数的乘积作为两个用户之间的购买近似度。
5.如权利要求1所述的一种基于大数据的产业数字化综合服务系统,其特征在于,所述根据两个用户中未同时购买的任意两种农产品之间的替代情况得到任意两种农产品之间的可替代性,包括:
计算购买所述两种农产品中的一种农产品的各用户与购买另一种农产品的各用户之间的购买近似度和值;
采用关联规则挖掘算法获取两种农产品之间的支持度、置信度;获取同时购买所述两种农产品的用户个数;
将所述购买近似度和值、所述支持度、所述置信度的乘积与所述用户个数的比值作为两种农产品之间的可替代性。
6.如权利要求1所述的一种基于大数据的产业数字化综合服务系统,其特征在于,所述根据待选用户中任意两个用户之间修正后的购买近似度、高价值度以及用户特征数据差异优化对用户的聚类过程,得到各聚类簇,包括:
对于待选用户中的各用户,计算用户与其他所有用户之间修正后的购买近似度的和值作为第三和值,将所述第三和值与用户的高价值度的乘积作为用户作为第一初始聚类中心的可能性;将待选用户中所述可能性最大的用户作为第一初始聚类中心;
其中,剩余各初始聚类中心与第一初始聚类中心的计算过程相同;将各初始聚类簇中心作为K-means聚类算法中的各聚类中心;
对于任意两个用户之间的距离度量指标,计算两个用户的高价值度的差值绝对值,计算两个用户共同填写的所有个人特征数据之间的距离和值,将所述差值绝对值与所述距离和值的乘积结果除以所述修正后的购买近似度作为两个用户之间的距离度量指标;将所述距离度量指标作为K-means聚类算法中的聚类距离。
7.如权利要求6所述的一种基于大数据的产业数字化综合服务系统,其特征在于,所述根据各种农产品对各用户所在聚类簇内用户的购买情况得到各种农产品对各用户的用户推荐率,包括:
对于农产品m与用户A,计算用户A所在聚类簇中购买农产品m的用户数量与聚类簇中用户数量的比值;
对于聚类簇内购买农产品m的各用户,分别计算各用户与用户A的修正后的购买近似度、各用户的高价值度以及各用户购买农产品m的购买量的乘积;计算聚类簇内所有购买农产品m的用户的所述乘积的和值;
将所述和值、所述比值与用户A的高价值度的乘积作为农产品m对用户A的用户推荐率。
8.如权利要求7所述的一种基于大数据的产业数字化综合服务系统,其特征在于,所述根据各种农产品对各用户的用户推荐率得到各种农产品的种植推荐率,包括:
对于各种农产品,计算所有用户对于农产品的用户推荐率与其高价值度的乘积的和值,将所述和值与农产品的整体销售量的乘积作为农产品的种植推荐率。
CN202410025527.3A 2024-01-08 2024-01-08 一种基于大数据的产业数字化综合服务系统 Active CN117911107B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410025527.3A CN117911107B (zh) 2024-01-08 2024-01-08 一种基于大数据的产业数字化综合服务系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410025527.3A CN117911107B (zh) 2024-01-08 2024-01-08 一种基于大数据的产业数字化综合服务系统

Publications (2)

Publication Number Publication Date
CN117911107A CN117911107A (zh) 2024-04-19
CN117911107B true CN117911107B (zh) 2024-07-09

Family

ID=90686406

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410025527.3A Active CN117911107B (zh) 2024-01-08 2024-01-08 一种基于大数据的产业数字化综合服务系统

Country Status (1)

Country Link
CN (1) CN117911107B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110427565A (zh) * 2019-06-10 2019-11-08 深圳大学 一种基于协同过滤的物品推荐方法、智能终端及存储介质
CN112967100A (zh) * 2021-04-02 2021-06-15 杭州网易云音乐科技有限公司 相似人群扩展方法、装置、计算设备以及介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6668892B2 (ja) * 2016-03-31 2020-03-18 富士通株式会社 アイテム推薦プログラム、アイテム推薦方法およびアイテム推薦装置
KR102008696B1 (ko) * 2019-03-27 2019-08-08 주식회사 페이크럭스컴퍼니 거래 이력 데이터의 클러스터링에 기초한 상품 추천 장치 및 방법
CN112488807A (zh) * 2020-12-19 2021-03-12 闫耀伟 一种基于大数据的农产品销售推荐方法
CN114219558B (zh) * 2021-12-03 2023-04-11 江苏业派生物科技有限公司 基于数据挖掘的农产品智能推荐系统
CN114581042A (zh) * 2022-02-21 2022-06-03 浙江力石科技股份有限公司 一种数字化乡村产业互联网综合服务系统
CN115170244A (zh) * 2022-07-21 2022-10-11 中国工商银行股份有限公司 新产品的冷启动推荐方法、装置、电子设备和介质
CN116703520A (zh) * 2023-06-15 2023-09-05 中国平安财产保险股份有限公司 基于改进K-means算法的产品推荐方法及其相关设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110427565A (zh) * 2019-06-10 2019-11-08 深圳大学 一种基于协同过滤的物品推荐方法、智能终端及存储介质
CN112967100A (zh) * 2021-04-02 2021-06-15 杭州网易云音乐科技有限公司 相似人群扩展方法、装置、计算设备以及介质

Also Published As

Publication number Publication date
CN117911107A (zh) 2024-04-19

Similar Documents

Publication Publication Date Title
Tsiptsis et al. Data mining techniques in CRM: inside customer segmentation
Deng et al. A three-way decision methodology to multi-attribute decision-making in multi-scale decision information systems
Amiri et al. A hybrid multi-criteria decision-making model for firms competence evaluation
Aouad et al. Market segmentation trees
CN114219169A (zh) 颖幡供应链销售和库存预测算法模型和应用系统
CN110866782A (zh) 一种客户分类方法、系统以及电子设备
US20230385857A1 (en) Predictive systems and processes for product attribute research and development
CN116385048B (zh) 一种农产品智慧营销方法和系统
CN112488863A (zh) 一种在用户冷启动场景下的险种推荐方法及相关设备
US11062377B1 (en) Fit prediction
CN111861679A (zh) 一种基于人工智能的商品推荐方法
Zheng et al. Graph-convolved factorization machines for personalized recommendation
CN111612583B (zh) 一种基于聚类的个性化导购系统
Rostami et al. A novel healthy food recommendation to user groups based on a deep social community detection approach
CN117911107B (zh) 一种基于大数据的产业数字化综合服务系统
CN117056761A (zh) 一种基于x-dbscan算法的客户细分方法
Zhao et al. Bank customer churn prediction based on support vector machine: Taking a commercial bank's VIP customer churn as the example
CN116703533A (zh) 一种商业管理数据优化存储分析方法
CN114418318A (zh) 一种采购任务优先级队列的生成方法
Purnamasari et al. Demand forecasting for improved inventory management in small and medium-sized businesses
Lady et al. Analysis of E-Marketing Implementation in Mediating the Effect of Strategic Market Orientation on Strategic Mses Performance
CN117436936B (zh) 基于销量预测与bom成品加工系统及方法
Mendikowski et al. Creating customers that never existed: Synthesis of e-commerce data using CTGAN
Filipe Using tree-based ensemble methods to improve the B2B customer acquisition process in the fashion industry
CN115082129B (zh) 一种农产品自动报价的方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant