CN116777508B - 一种基于大数据的医药供应分析管理系统及方法 - Google Patents
一种基于大数据的医药供应分析管理系统及方法 Download PDFInfo
- Publication number
- CN116777508B CN116777508B CN202310748345.4A CN202310748345A CN116777508B CN 116777508 B CN116777508 B CN 116777508B CN 202310748345 A CN202310748345 A CN 202310748345A CN 116777508 B CN116777508 B CN 116777508B
- Authority
- CN
- China
- Prior art keywords
- data
- sales
- network environment
- historical
- medical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 title claims abstract description 20
- 229940127554 medical product Drugs 0.000 claims abstract description 45
- 238000007418 data mining Methods 0.000 claims abstract description 24
- 238000012545 processing Methods 0.000 claims abstract description 24
- 230000008859 change Effects 0.000 claims abstract description 18
- 238000007405 data analysis Methods 0.000 claims abstract description 15
- 238000005065 mining Methods 0.000 claims abstract description 12
- 238000007726 management method Methods 0.000 claims description 19
- 230000008451 emotion Effects 0.000 claims description 17
- 230000010354 integration Effects 0.000 claims description 13
- 238000003066 decision tree Methods 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 10
- 238000004140 cleaning Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000009826 distribution Methods 0.000 claims description 4
- 238000013079 data visualisation Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000008569 process Effects 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001932 seasonal effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于大数据的医药供应分析管理系统及方法,涉及大数据技术领域,包括以下步骤:S1:采集目标区域内的人员组成信息数据、医药产品的历史销售相关数据和历史网络环境数据;S2:对采集的各项数据进行处理,得到用于数据挖掘的数据集;S3:分析网络环境数据对销售情况的影响,挖掘得到网络环境数据与医药产品销售数据的关系;S4:分析网络环境数据的变化趋势,通过销售预测模型对医药产品的销量进行预测;通过人员组成、历史销售情况和历史网络环境之间的关联性,结合网络环境变化,对医药产品销量的波动进行分析,根据数据分析结果,为企业的市场定位、销售策略调整提供依据。
Description
技术领域
本发明涉及大数据技术领域,具体为一种基于大数据的医药供应分析管理系统及方法。
背景技术
近年来,随着医药市场的不断扩大和供应管理的不断优化,大数据技术在医药领域中的应用也日渐广泛。大数据技术可以帮助医药企业实现对货物供应、销售渠道等方面的全面监测和管理,从而实现对供应关系的智能预测和风险控制。
为了保证医药供应关系的平衡,目前对于医药产品销量的预测大多基于历史销售数据,通过统计和数据分析,进一步推测未来的销售情况发展趋势,用于保证持续的药品供应,以及减少货物存储等运营成本。但是,如果只考虑时间因素而不考虑外界环境因素对医药产品销量的影响,当外界环境因素影响较大时,会导致医药产品销量出现较大波动,使得预测结果与实际情况不符,如果预测数据远高于实际需求,可能会导致货物留置,增加货物存储成本,如果预测数据小于实际需求,则可能导致货物短缺,不能及时满足顾客的购买需求,减少了实际收益。
因此,人们需要一种基于大数据的医药供应分析管理系统及方法来解决上述问题或部分问题。
发明内容
本发明的目的在于提供一种基于大数据的医药供应分析管理系统及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种基于大数据的医药供应分析管理方法,包括以下步骤:
S1:采集目标区域内的人员组成信息数据、医药产品的历史销售相关数据和历史网络环境数据;
所述医药产品的历史销售数据包括产品信息数据、销售时间数据和销售量数据;所述网络环境数据包括产品信息触发数量、情感极性、发生时间等;
所述情感极性是指对事物、人或者事件等所产生的情感倾向,通常包括积极情感和消极情感两种类型,应用于多个领域,本发明中通过文本情感分析了解网络环境对医药产品的影响方向。
S2:对采集的各项数据进行处理,得到用于数据挖掘的数据集;
S3:分析网络环境数据对销售情况的影响,挖掘得到网络环境数据与医药产品销售数据的关系,分析医药产品销售情况出现波动是否受到网络环境影响;
S4:分析网络环境数据的变化趋势,调节销售预测模型中的网络环境数据相关参数。
进一步的,所述S1包括:
步骤S1-1:根据医药产品销售点位置,选择数据采集范围,确定数据采集目标区域;
步骤S1-2:确定数据采集方式和数据采集工具,对目标区域内的人员组成信息数据、医药产品的历史销售相关数据和历史网络环境数据进行采集;
步骤S1-3:通过数据整合工具对采集的各项数据进行整合,将采集的不同数据源中的各项数据进行整理,建立一个同一的数据仓库对整合的数据进行存储,使其以便于后期的查询和提取。
进一步的,所述S2包括:
步骤S2-1:对采集的数据进行清洗,去除空值、异常值、重复值等无效数据,保证数据的准确性,并对多个数据源的数据进行集成,将不同数据源的数据合并为一个数据集,保证数据的一致性和完整性,使数据符合数据挖掘的要求;
其中,数据清洗和集成可以通过数据清洗工具、数据集成工具等实现。
步骤S2-2:对数据进行变换,包括数据离散化、归一化、标准化等处理,并对数据进行特征选择,减少无用特征的干扰,提高数据挖掘的效率;
步骤S2-3:将选择的特征数据整合为数据集,并将其存储至数据库中,以便于后续步骤中的数据挖掘和分析。
进一步的,所述步骤S3包括:
步骤S3-1:通过分析数据集中目标区域内的人员组成特征,包括年龄特征、教育程度特征和社会身份特征,根据不同属性特征人员对网络环境的信息接受情况,将目标区域内人员根据自身属性特征进行划分为不同人群,对不同人群设定相应的网络环境影响度;通过目标区域内的人员组成占比得到该区域内的网络环境影响比重g;
步骤S3-2:通过将数据集中的各时间段内网络环境数据特征与医药产品的历史销售数据特征进行特征结合,得到用于建立预测模型的历史特征集,其中,网络环境数据特征包括产品信息触发特征和情感极性特征,医药产品的历史销售数据特征包括产品信息、销售时间数据特征和销售量数据特征;
步骤S3-3:将销售时间和销售量作为输出结果,将产品信息触发特征和情感极性特征作为输入特征,基于决策树模型,挖掘网络环境数据与医药产品销售数据的关系:
Y=f(x1,x2,...,xn);
其中,Y表示网络环境数据特征的影响系数,f表示决策树模型,接收n个特征变量x1、x2、...、xn作为输入,生成网络环境数据特征影响系数;
决策树模型可以用于分类和回归问题,其中回归问题可以使用回归树模型进行建模。在基于决策树建立销售预测模型时,可以选择网络环境数据中的任一特征来选择分裂点。
步骤S3-4:建立销售预测模型:
其中,H表示销售量,η0表示历史销售量的平均值,δ表示误差项,由相关工作人员进行预设;η1表示网络环境数据特征的权重系数,Zi表示除网络环境数据特征外的其他任一影响销售量的变量,ηi+1表示除网络环境数据特征外的其他任一影响销售量的变量的权重系数,k表示除网络环境数据特征外的其他影响销售量的因子数量;
通过对数据进行分析,可以发现人员组成、历史销售情况和历史网络环境之间的关系,根据数据分析结果,为企业的市场定位、销售策略调整提供依据,也可以制定合适的仓储、运输规划、产品推广计划等,提高产品销售业绩。
进一步的,在S4中,包括以下步骤:
S4-1:将网络环境数据特征影响系数按照时间顺序进行排列,通过数据可视化工具绘制时间序列图,通过时间序列图,可以发现短期内的波动趋势;
S4-2:通过趋势拟合方法对时间序列图中的趋势变化进行分析,趋势线拟合得到曲线方程,能够描述网络环境数据随时间变化的趋势方向;通过趋势线拟合,可以更准确地预测数据未来的走势方向;
S4-3:结合网络环境数据变化趋势,调节输入销售预测模型的网络环境数据特征的影响系数。
具体的,本发明中的销量预测用于保证医药供应关系的平衡,对销量的预测能够判断商家剩余库存能否满足销售需求,进一步能够判断是否需要向供应方发起采购请求。步骤S4中通过趋势拟合预测得到的网络环境数据特征变量参数对短期内的网络环境变化进行了预测,结合步骤S3中的销售预测模型,对模型中的网络环境数据特征的影响系数进行更新,将预测得到的未来某一时刻的网络环境数据特征的影响系数输入模型中,以便于避免由于网络环境变化导致的销量预测情况与实际需求不符。
通过对网络环境因素影响的分析,减少预测结果与实际情况的误差,分析得到目标区域内的供应实际需求,避免因导致货物留置增加的货物存储成本,以及因为货物短缺造成的实际收益减少。
一种基于大数据的医药供应分析管理系统,所述系统包括:数据采集模块、数据处理模块和数据挖掘模块;
所述数据采集模块用于对历史销售数据和网络环境数据进行采集,收集和整理医药供应的相关数据;
所述数据处理模块用于对采集到的相关数据进行处理;以便于后续的数据挖掘和分析。数据处理模块可以对数据进行去重、缺失值填充、异常值处理、数据格式转换等操作,以确保数据的准确性和完整性。
所述数据挖掘模块用于对处理后的相关数据进行分析和建模,挖掘网络环境数据与医药产品销售情况的关系,数据挖掘模块可以使用各种数据挖掘方法,预测市场需求和销售趋势等;
优选的,数据挖掘模块还可以将分析结果可视化展示,以便于管理者和决策者了解供应链的状态和趋势,及时采取相应的措施。
进一步的,所述数据采集模块包括人员组成数据采集单元、历史销售数据采集单元和网络环境数据采集单元;
所述人员组成数据采集单元用于对目标区域内的人员组成信息进行采集,
所述历史销售数据采集单元用于对目标区域内各供应点的医药产品相关历史销售数据进行采集,包括产品信息数据、销售时间数据和销售量数据;
所述网络环境数据采集单元用于对历史时间段内的网络环境相关数据进行采集,包括产品信息触发数量、情感极性、发生时间。
进一步的,所述数据处理模块包括数据预处理单元和数据归一化单元;
所述数据预处理单元用于对数据采集模块采集的数据进行预处理,包括数据清洗、数据集成、数据转换和数据整合;
所述数据归一化单元用于在保留数据分布特征的前提下,将其映射到一个预定的区间内,将数据进行归一化处理可以消除不同数据变量之间因为量纲不同而产生的影响,保证变量之间权重的公平性,以便于提高数据分析的准确性和稳定性。
进一步的,所述数据挖掘模块包括数据分析单元、预测模型建立单元和数据预测单元;
所述数据分析单元用于对数据处理模块处理后的特征数据进行分析,分析影响销量的各因素的变化趋势;
所述预测模型建立单元用于根据历史数据特征集建立销售预测模型,并结合影响销量的各因素的变化趋势对模型参数进行调整;
所述数据预测单元用于根据销量预测模型对医药产品的未来销量继续预测。
与现有技术相比,本发明所达到的有益效果是:
本发明通过数据采集模块对历史销售数据和网络环境数据进行采集,收集和整理医药供应的相关数据;通过数据处理模块对采集到的相关数据进行处理;通过数据挖掘模块对处理后的相关数据进行分析和建模,挖掘网络环境数据与医药产品销售情况的关系,数据挖掘模块可以使用各种数据挖掘方法,预测市场需求和销售趋势等;通过对数据进行分析,可以发现人员组成、历史销售情况和历史网络环境之间的关联性,考虑了网络环境因素对医药产品销量的影响,结合网络环境变化,对医药产品销量的波动进行分析,根据数据分析结果,为企业的市场定位、销售策略调整提供依据,提高产品销售业绩。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明一种基于大数据的医药供应分析管理系统的模块结构示意图;
图2是本发明一种基于大数据的医药供应分析管理方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1、图2和具体实施例对本发明作进一步的说明。
实施例1:如图1所示,本实施例提供了一种基于大数据的医药供应分析管理系统,所述系统包括:数据采集模块、数据处理模块和数据挖掘模块;
数据采集模块,用于对历史销售数据和网络环境数据进行采集,收集和整理医药供应的相关数据;包括人员组成数据采集单元、历史销售数据采集单元和网络环境数据采集单元;
人员组成数据采集单元用于对目标区域内的人员组成信息进行采集,
历史销售数据采集单元用于对目标区域内各供应点的医药产品相关历史销售数据进行采集,包括产品信息数据、销售时间数据和销售量数据;
网络环境数据采集单元用于对历史时间段内的网络环境相关数据进行采集,包括产品信息触发数量、情感极性、发生时间。
数据处理模块,用于对采集到的相关数据进行处理;包括数据预处理单元和数据归一化单元;
数据预处理单元用于对数据采集模块采集的数据进行预处理,包括数据清洗、数据集成、数据转换和数据整合;
数据归一化单元用于在保留数据分布特征的前提下,将其映射到一个预定的区间内,将数据进行归一化处理可以消除不同数据变量之间因为量纲不同而产生的影响,保证变量之间权重的公平性,以便于提高数据分析的准确性和稳定性。
数据挖掘模块,用于对处理后的相关数据进行分析和建模,挖掘网络环境数据与医药产品销售情况的关系;包括数据分析单元、预测模型建立单元和数据预测单元;
数据分析单元用于对数据处理模块处理后的特征数据进行分析,分析影响销量的各因素的变化趋势;
预测模型建立单元用于根据历史数据特征集建立销售预测模型,并结合影响销量的各因素的变化趋势对模型参数进行调整;
数据预测单元用于根据销量预测模型对医药产品的未来销量继续预测。
实施例2:如图2所示,本实施例提供了一种基于大数据的医药供应分析管理方法,其基于实施例中的一种基于大数据的医药供应分析管理系统实现,具体包括以下步骤:
S1:采集目标区域内的人员组成信息数据、医药产品的历史销售相关数据和历史网络环境数据;
在S1中,包括以下步骤:
步骤S1-1:根据医药产品销售点位置,选择数据采集范围,确定数据采集目标区域;
步骤S1-2:确定数据采集方式和数据采集工具,对目标区域内的人员组成信息数据、医药产品的历史销售相关数据和历史网络环境数据进行采集;
例如,根据数据类型和范围,可以通过社会调查、商业数据库、官方公开数据等方式收集人员组成信息数据;通过提取销售报告收集历史销售相关数据;通过监控官方网站、信息监测等方式收集历史网络环境数据。
步骤S1-3:通过数据整合工具对采集的各项数据进行整合,使其符合分析需求。
例如,对于人员组成信息数据,可采集目标区域内不同人群的人数、年龄、性别、教育程度等信息;对于历史销售相关数据,可整理出目标区域内不同公司和不同产品的销售情况;对于历史网络环境数据,可整理出所销售医药产品相关的网络环境变化情况。
S2:对采集的各项数据进行处理,得到用于数据挖掘的数据集;
在S2中,包括以下步骤:
步骤S2-1:对采集的数据进行清洗,去除空值、异常值、重复值等无效数据,保证数据的准确性,并对多个数据源的数据进行集成,将不同数据源的数据合并为一个数据集,保证数据的一致性和完整性,使数据符合数据挖掘的要求;
其中,数据清洗和集成可以通过数据清洗工具、数据集成工具等实现。
步骤S2-2:对数据进行变换,包括数据离散化、归一化、标准化等处理,并对数据进行特征选择,减少无用特征的干扰,提高数据挖掘的效率;
步骤S2-3:将选择的特征数据整合为数据集,并将其存储至数据库中,以便于后续步骤中的数据挖掘和分析。
S3:分析网络环境数据对销售情况的影响,挖掘得到网络环境数据与医药产品销售数据的关系,分析医药产品销售情况出现波动是否受到网络环境影响;
在S3中,包括以下步骤:
步骤S3-1:通过分析数据集中目标区域内的人员组成特征,包括年龄特征、教育程度特征和社会身份特征,将目标区域内人员根据自身属性特征进行划分,分析不同属性特征人员对网络环境的信息接受情况,对不同人群受网络环境影响对医药产品的购买行为进行挖掘;通过目标区域内的人员组成占比得到该区域内的网络环境影响范围比重g;
例如,年轻人更加习惯使用社交媒体等新兴平台获取信息,而老年人则更依赖传统的媒体渠道,而相关工作人员更容易获取到信息。
步骤S3-2:通过将数据集中的各时间段内网络环境数据特征与医药产品的历史销售数据特征进行特征结合,得到用于建立预测模型的历史特征集,其中,网络环境数据特征包括产品信息触发特征和情感极性特征,医药产品的历史销售数据特征包括产品信息、销售时间数据特征和销售量数据特征;
步骤S3-3:将销售时间和销售量作为输出结果,将产品信息触发特征和情感极性特征作为输入特征,基于决策树模型,挖掘网络环境数据与医药产品销售数据的关系:
Y=f(x1,x2,...,xn);
其中,Y表示网络环境数据特征的影响系数,f表示决策树模型,接收n个特征变量x1、x2、...、xn作为输入,生成网络环境数据特征影响系数;
决策树模型可以用于分类和回归问题,其中回归问题可以使用回归树模型进行建模。在基于决策树建立销售预测模型时,可以选择网络环境数据中的任一特征来选择分裂点。例如,可以选择情感极性作为分裂点,将数据集分为正面和负面两个子集,在每个子集中,可以继续选择其他自变量作为分裂点,直到满足停止条件为止。
步骤S3-4:建立销售预测模型:
H=η0+g×Y×η1+Z1×η2+Z2×η3+δ;
其中,H表示销售量,η0表示历史销售量的平均值,δ表示误差项,由相关工作人员进行预设;η1表示网络环境数据特征的权重系数,Z1表示季节性影响因素,η2表示季节性影响因素的权重系数,Z2表示商品价格因素,η3表示商品价格因素的权重系数;
S4:分析网络环境数据的变化趋势,调节销售预测模型中的网络环境数据相关参数;在S4中,包括以下步骤:
S4-1:将网络环境数据特征影响系数按照时间顺序进行排列,通过数据可视化工具绘制时间序列图,通过时间序列图,可以发现短期内的波动和长期的趋势;例如,可以以天、周、月等为单位,绘制出在不同时间点上的网络讨论度、情感极性、热度等指标的折线图,从而观察这些指标的趋势变化;
S4-2:通过趋势拟合方法对时间序列图中的趋势变化进行分析,趋势线拟合得到曲线方程,以多项式模型为例,以时间为自变量,以网络环境数据特征影响系数为因变量建立坐标系,对坐标系中的各数据点可以通过拟合曲线方程f(x)=ax2+bx+c来描述其变化趋势,利用最小二乘法可以得到最佳的系数值,使得曲线拟合效果最佳。
能够描述网络环境数据随时间变化的趋势方向;通过趋势线拟合,可以更准确地预测数据未来的走势方向;
S4-3:结合网络环境数据变化趋势,调节输入销售预测模型的网络环境数据特征变量参数。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种基于大数据的医药供应分析管理方法,其特征在于:包括以下步骤:
S1:采集目标区域内的人员组成信息数据、医药产品的历史销售相关数据和历史网络环境数据;
S2:对采集的各项数据进行处理,得到用于数据挖掘的数据集;
S3:分析网络环境数据对销售情况的影响,挖掘得到网络环境数据与医药产品销售数据的关系;
S4:分析网络环境数据的变化趋势,调节销售预测模型中的网络环境数据相关参数;
所述S1包括:
步骤S1-1:根据医药产品销售点位置,选择数据采集范围,确定数据采集目标区域;
步骤S1-2:确定数据采集方式和数据采集工具,对目标区域内的人员组成信息数据、医药产品的历史销售相关数据和历史网络环境数据进行采集;
步骤S1-3:通过数据整合工具对采集的各项数据进行整合;
所述S2包括:
步骤S2-1:对采集的数据进行清洗,并对多个数据源的数据进行集成,将不同数据源的数据合并为一个数据集;
步骤S2-2:对数据进行变换,并对数据进行特征选择;
步骤S2-3:将选择的特征数据整合为数据集,并将其存储至数据库中;
所述步骤S3包括:
步骤S3-1:通过分析数据集中目标区域内的人员组成特征,包括年龄特征、教育程度特征和社会身份特征,根据不同属性特征人员对网络环境的信息接受情况,将目标区域内人员根据自身属性特征进行划分为不同人群,对不同人群设定相应的网络环境影响度;通过目标区域内的人员组成占比得到该区域内的网络环境影响比重g;
步骤S3-2:通过将数据集中的各时间段内网络环境数据特征与医药产品的历史销售数据特征进行特征结合,得到用于建立预测模型的历史特征集,其中,网络环境数据特征包括产品信息触发特征和情感极性特征,医药产品的历史销售数据特征包括产品信息、销售时间数据特征和销售量数据特征;
步骤S3-3:将销售时间和销售量作为输出结果,将产品信息触发特征和情感极性特征作为输入特征,基于决策树模型,挖掘网络环境数据与医药产品销售数据的关系:
;
其中,Y表示网络环境数据特征的影响系数,f表示决策树模型,接收n个特征变量作为输入,生成网络环境数据特征影响系数;
步骤S3-4:建立销售预测模型:
;
其中,H表示销售量,η0表示历史销售量的平均值,δ表示误差项,η1表示网络环境数据特征的权重系数,Zi表示除网络环境数据特征外的其他任一影响销售量的变量,ηi+1表示除网络环境数据特征外的其他任一影响销售量的变量的权重系数,k表示除网络环境数据特征外的其他影响销售量的因子数量;
在S4中,包括以下步骤:
S4-1:将网络环境数据特征影响系数按照时间顺序进行排列,通过数据可视化工具绘制时间序列图;
S4-2:通过趋势拟合方法对时间序列图中的趋势变化进行分析,趋势线拟合得到曲线方程,能够描述网络环境数据随时间变化的趋势方向;
S4-3:结合网络环境数据变化趋势,调节输入销售预测模型的网络环境数据特征的影响系数。
2.一种基于大数据的医药供应分析管理系统,所述系统执行权利要求1中所述的一种基于大数据的医药供应分析管理方法,其特征在于:所述系统包括:数据采集模块、数据处理模块和数据挖掘模块;
所述数据采集模块用于对历史销售数据和网络环境数据进行采集,收集和整理医药供应的相关数据;
所述数据处理模块用于对采集到的相关数据进行处理;
所述数据挖掘模块用于对处理后的相关数据进行分析和建模,挖掘网络环境数据与医药产品销售情况的关系。
3.根据权利要求2所述的一种基于大数据的医药供应分析管理系统,其特征在于:所述数据采集模块包括人员组成数据采集单元、历史销售数据采集单元和网络环境数据采集单元;
所述人员组成数据采集单元用于对目标区域内的人员组成信息进行采集,
所述历史销售数据采集单元用于对目标区域内各供应点的医药产品相关历史销售数据进行采集,包括产品信息数据、销售时间数据和销售量数据;
所述网络环境数据采集单元用于对历史时间段内的网络环境相关数据进行采集,包括产品信息触发数量、情感极性、发生时间。
4.根据权利要求3所述的一种基于大数据的医药供应分析管理系统,其特征在于:所述数据处理模块包括数据预处理单元和数据归一化单元;
所述数据预处理单元用于对数据采集模块采集的数据进行预处理,包括数据清洗、数据集成、数据转换和数据整合;
所述数据归一化单元用于在保留数据分布特征的前提下,将其映射到一个预定的区间内。
5.根据权利要求4所述的一种基于大数据的医药供应分析管理系统,其特征在于:所述数据挖掘模块包括数据分析单元、预测模型建立单元和数据预测单元;
所述数据分析单元用于对数据处理模块处理后的特征数据进行分析,分析影响销量的各因素的变化趋势;
所述预测模型建立单元用于根据历史数据特征集建立销售预测模型,并结合影响销量的各因素的变化趋势对模型参数进行调整;
所述数据预测单元用于根据销量预测模型对医药产品的未来销量继续预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310748345.4A CN116777508B (zh) | 2023-06-25 | 2023-06-25 | 一种基于大数据的医药供应分析管理系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310748345.4A CN116777508B (zh) | 2023-06-25 | 2023-06-25 | 一种基于大数据的医药供应分析管理系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116777508A CN116777508A (zh) | 2023-09-19 |
CN116777508B true CN116777508B (zh) | 2024-03-12 |
Family
ID=87985496
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310748345.4A Active CN116777508B (zh) | 2023-06-25 | 2023-06-25 | 一种基于大数据的医药供应分析管理系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116777508B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102385719A (zh) * | 2011-11-01 | 2012-03-21 | 中国科学院计算技术研究所 | 回归预测方法及装置 |
CN106951514A (zh) * | 2017-03-17 | 2017-07-14 | 合肥工业大学 | 一种考虑品牌情感的汽车销量预测方法 |
CN108230085A (zh) * | 2017-11-27 | 2018-06-29 | 重庆邮电大学 | 一种基于用户评论的商品评价系统及方法 |
CN108764646A (zh) * | 2018-04-27 | 2018-11-06 | 车智互联(北京)科技有限公司 | 一种销量预测方法及计算设备 |
CN109785003A (zh) * | 2019-01-17 | 2019-05-21 | 四川骏逸富顿科技有限公司 | 一种药品零售行业药品销售预测系统及方法 |
CN110060075A (zh) * | 2018-01-15 | 2019-07-26 | 北京京东尚科信息技术有限公司 | 用于预测销量的方法、装置、系统及介质 |
CN110751497A (zh) * | 2018-07-23 | 2020-02-04 | 北京京东尚科信息技术有限公司 | 一种商品补货方法和装置 |
CN111091241A (zh) * | 2019-12-11 | 2020-05-01 | 亿达信息技术有限公司 | 一种基于bp神经网络的药品销量预测与决策方法及系统 |
CN111652657A (zh) * | 2020-06-10 | 2020-09-11 | 创新奇智(南京)科技有限公司 | 商品销量预测方法、装置、电子设备及可读存储介质 |
CN113743969A (zh) * | 2020-05-29 | 2021-12-03 | 北京京东智能城市大数据研究院 | 用于销量数据预测的方法、装置、设备及存储介质 |
CN114022176A (zh) * | 2021-09-26 | 2022-02-08 | 上海电信工程有限公司 | 一种电商平台上的商品销量预测的方法及电子设备 |
CN114239946A (zh) * | 2021-12-09 | 2022-03-25 | 上海维智卓新信息科技有限公司 | 基于区域划分的店铺销售效果预测方法及装置 |
CN115423535A (zh) * | 2022-10-17 | 2022-12-02 | 深圳市秦丝科技有限公司 | 基于市场先验大数据的产品采购方法、装置、设备及介质 |
-
2023
- 2023-06-25 CN CN202310748345.4A patent/CN116777508B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102385719A (zh) * | 2011-11-01 | 2012-03-21 | 中国科学院计算技术研究所 | 回归预测方法及装置 |
CN106951514A (zh) * | 2017-03-17 | 2017-07-14 | 合肥工业大学 | 一种考虑品牌情感的汽车销量预测方法 |
CN108230085A (zh) * | 2017-11-27 | 2018-06-29 | 重庆邮电大学 | 一种基于用户评论的商品评价系统及方法 |
CN110060075A (zh) * | 2018-01-15 | 2019-07-26 | 北京京东尚科信息技术有限公司 | 用于预测销量的方法、装置、系统及介质 |
CN108764646A (zh) * | 2018-04-27 | 2018-11-06 | 车智互联(北京)科技有限公司 | 一种销量预测方法及计算设备 |
CN110751497A (zh) * | 2018-07-23 | 2020-02-04 | 北京京东尚科信息技术有限公司 | 一种商品补货方法和装置 |
CN109785003A (zh) * | 2019-01-17 | 2019-05-21 | 四川骏逸富顿科技有限公司 | 一种药品零售行业药品销售预测系统及方法 |
CN111091241A (zh) * | 2019-12-11 | 2020-05-01 | 亿达信息技术有限公司 | 一种基于bp神经网络的药品销量预测与决策方法及系统 |
CN113743969A (zh) * | 2020-05-29 | 2021-12-03 | 北京京东智能城市大数据研究院 | 用于销量数据预测的方法、装置、设备及存储介质 |
CN111652657A (zh) * | 2020-06-10 | 2020-09-11 | 创新奇智(南京)科技有限公司 | 商品销量预测方法、装置、电子设备及可读存储介质 |
CN114022176A (zh) * | 2021-09-26 | 2022-02-08 | 上海电信工程有限公司 | 一种电商平台上的商品销量预测的方法及电子设备 |
CN114239946A (zh) * | 2021-12-09 | 2022-03-25 | 上海维智卓新信息科技有限公司 | 基于区域划分的店铺销售效果预测方法及装置 |
CN115423535A (zh) * | 2022-10-17 | 2022-12-02 | 深圳市秦丝科技有限公司 | 基于市场先验大数据的产品采购方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116777508A (zh) | 2023-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Serrano-Guerrero et al. | A new interval prediction methodology for short-term electric load forecasting based on pattern recognition | |
WO2019049546A1 (ja) | 予測システム及び方法 | |
CN108280541A (zh) | 基于随机森林和决策树的客户服务策略制定方法、装置 | |
JP2018092439A5 (zh) | ||
CN112614011B (zh) | 电力配网物资需求预测方法和装置、存储介质及电子设备 | |
CN111291076A (zh) | 基于大数据的异常用水监测报警系统及其构建方法 | |
CN108492134A (zh) | 基于多周期回归树集成的大数据用户用电行为分析系统 | |
CN111985701A (zh) | 一种基于供电企业大数据模型库的用电预测方法 | |
CN110689190A (zh) | 一种电网负荷预测方法、装置及相关设备 | |
CN117557299B (zh) | 基于计算机辅助的营销策划方法及系统 | |
CN108364191A (zh) | 基于随机森林和逻辑回归的优质客户优化识别方法及装置 | |
CN116596580A (zh) | 一种基于天气预报信息的季节性服装短期销量预测方法 | |
CN116308494A (zh) | 供应链需求预测方法 | |
CN116777508B (zh) | 一种基于大数据的医药供应分析管理系统及方法 | |
CN112288187A (zh) | 一种基于大数据的售电量预测方法 | |
CN112256681A (zh) | 一种空管数字化指标应用系统及方法 | |
Kharkyanen et al. | Development of information technology for supporting the process of adjustment of the food enterprise assortment | |
Henzel et al. | Impact of time series clustering on fuel sales prediction results. | |
CN114581263A (zh) | 一种电网负荷分析方法、装置、电子设备及存储介质 | |
Novitasari et al. | K-nearest neighbor analysis to predict the accuracy of product delivery using administration of raw material model in the cosmetic industry (PT Cedefindo) | |
CN112100246A (zh) | 一种基于多维图码标签的客户用电价值挖掘方法 | |
Ompusunggu et al. | Implementation of Data Mining To Predict the Value of Indonesian Oil and Non-Oil and Gas Import Exports Using the Linear Regression Method | |
CN113361750A (zh) | 一种基于业扩报装大数据的售电量预测方法 | |
Abbasi et al. | Applying Neural Networks to Predict Ventilator Demand: A Study of Pakistan's Healthcare Sector | |
Hartanto et al. | Multivariate Sales Forecast Model Towards Trend Shifting During COVID-19 Pandemic: A Case Study in Global Beauty Industry |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |