CN116503093A - 一种基于样本数据的市场数据分析方法及系统 - Google Patents
一种基于样本数据的市场数据分析方法及系统 Download PDFInfo
- Publication number
- CN116503093A CN116503093A CN202310753233.8A CN202310753233A CN116503093A CN 116503093 A CN116503093 A CN 116503093A CN 202310753233 A CN202310753233 A CN 202310753233A CN 116503093 A CN116503093 A CN 116503093A
- Authority
- CN
- China
- Prior art keywords
- data
- market
- model
- market data
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007405 data analysis Methods 0.000 title claims abstract description 141
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 238000011156 evaluation Methods 0.000 claims description 25
- 238000012360 testing method Methods 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 15
- 238000013461 design Methods 0.000 claims description 13
- 230000000694 effects Effects 0.000 claims description 13
- 238000005070 sampling Methods 0.000 claims description 12
- 238000004140 cleaning Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 10
- 238000013499 data model Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 9
- 230000004927 fusion Effects 0.000 claims description 7
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 238000012502 risk assessment Methods 0.000 claims description 6
- 238000007418 data mining Methods 0.000 claims description 4
- 238000010801 machine learning Methods 0.000 claims description 4
- 238000012407 engineering method Methods 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 claims description 3
- 230000006872 improvement Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 238000011161 development Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000004148 unit process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Medical Informatics (AREA)
- Economics (AREA)
- Computing Systems (AREA)
- Game Theory and Decision Science (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及市场数据分析技术领域,具体地说,涉及一种基于样本数据的市场数据分析方法及系统。其包括获取市场数据集合、从市场数据集合中随机抽取数据,并进行预处理、根据分析出来的数据样本集合的数据建立市场数据分析模型、使用优化后的市场数据分析模型对未来市场数据进行预测。本发明通过在市场数据集合中抽取数据样本集合,再通过对数据样本集合中的数据进行分析,来建立市场数据分析模型,并在模型建立后,通过向市场数据集合中抽取数据,再向市场中获取新的数据来使用市场数据分析模型进行预测,通过预测的结果和市场数据对应的结果来对市场数据分析模型不断的优化,来提高市场数据分析模型对市场的预测准确度。
Description
技术领域
本发明涉及市场数据分析技术领域,具体地说,涉及一种基于样本数据的市场数据分析方法及系统。
背景技术
随着市场经济和全球化进程的加速推进,数据分析在市场经济中发挥着越来越重要的作用;传统的市场数据分析方法存在着数据量有限、数据分析效果互不相同、缺乏足够的细节等问题,使市场的变化无法被清晰、清除的被观看到。而为了使用户可以看到市场的大致辩护啊,目前有对市场情况进行预测的系统来预测市场未来的趋势,但在预测时,因市场变化的不确定性,使预测出的结果和实际结果之间存在较大的偏差,如此便会导致市场预测的不准确,给用户带来影响,故需要一种基于样本数据的市场数据分析方法及系统,来提高市场数据分析的精度和效率,帮助用户进行未来市场的分析。
发明内容
本发明的目的在于提供一种基于样本数据的市场数据分析方法及系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明目的之一在于,提供了一种基于样本数据的市场数据分析方法,包括如下方法步骤:
S1、获取对应市场的数据,并将获取的数据组合起来形成市场数据集合;
S2、从市场数据集合中随机抽取数据,并使抽取数据生成数据样本集合,将数据样本集合中的数据进行预处理,分析出不同的数据对应的不同市场情况,其中,该数据样本集合代表市场数据的分布情况;
S3、根据分析出来的数据样本集合的数据建立市场数据分析模型,并对建立的市场数据分析模型进行测试并优化;
S4、使用优化后的市场数据分析模型对未来市场数据进行预测。
作为本技术方案的进一步改进,所述S3中对市场数据分析模型进行优化的步骤为:
①、向市场数据集合提取多组数据,并将提取的数据带入到市场数据分析模型中;
②、根据提取的数据和市场数据分析模型之间的差异情况,对市场数据分析模型进行精度评估,并在评估后,根据评估的结果,对市场数据分析模型进行调整;
③、重复①、②的步骤,对市场数据分析模型进行不断优化;
④、将优化后的市场数据分析模型批量应用于监测市场数据,根据监测的市场数据和市数据分析模型之间的差异,对市场数据分析模型进行重复优化,提高市场数据分析模型对市场数据的推测的准确性。
作为本技术方案的进一步改进,所述S4中,在使用市场数据分析模型对未来的市场数据进行预测的过程中,持续对是市场出现的数据进行获取,并将获取的数据和市场分析数据模型进行比较,并根据比较的结果对市场分析数据模型进行持续性的优化。
本发明目的之二在于,提供了一种用于实现包括上述任意一项所述的基于样本数据的市场数据分析方法的系统,包括数据获取单元、数据处理单元、模型建立单元、模型测试单元和预测单元;
所述数据获取单元用于获取客户提供或其他来源的市场数据集合,并生成数据样本集合,该数据样本集合代表市场数据的分布情况;
所述数据处理单元用于对数据样本集合进行预处理,获取市场数据和市场之间的关系;
所述模型建立单元用于运用数据挖掘和机器学习技术,对样本数据进行训练和优化,建立市场数据分析模型;
所述模型测试单元对模型建立单元建立的市场数据分析模型进行测试并优化,提高市场数据分析模型预测结果的精度;
所述预测单元将模型测试单元优化后的市场数据分析模型对未来市场数据进行预测;
所述预测单元在对未来市场数据进行预测的过程中,向模型建立单元中进行反馈,使模型建立单元对目前市场更新的数据进行处理和优化。
作为本技术方案的进一步改进,所述数据获取单元包括抽样模块和数据生成模块,所述抽样模块用于获取市场数据集合,并在市场数据集合中随机抽取小样本,该抽样模块能够确保数据样本集合能够代表市场数据的分布情况;
所述数据生成模块将抽样模块随机抽取的小样本生成数据样本集合,并对数据样本集合进行去重处理,确保数据样本集合的唯一性。
作为本技术方案的进一步改进,所述数据处理单元包括数据清洗模块、特征工程模块;
所述数据清洗模块对数据生成模块生成的数据样本集合中的数据中出现的异常数据或错误数据进行数据清除;
所述特征工程模块采用特征工程方法对数据样本集合中的数据进行特征数据的处理,提取持续变化的数据,并将提取的数据进行整合,获取数据和市场之间的关系。
作为本技术方案的进一步改进,所述模型建立单元包括模型设计模块、模型参数调整模块和训练模块;
所述模型设计模块接收特征工程模块处理的数据,并根据接收的数据设计对应市场数据分析的模型;
所述模型参数调整模块向模型设计模块建立的模型中输送数据样本集合中的数据,并根据输送的数据对应的数据和模型反馈出来的数据进行比较,并根据比较的结构对市场数据分析模型的参数进行优化;
所述训练模块根据模型参数调整模块优化后的模型进行数据样本模型数据的再提取,然后根据提取的数据反馈的结果进行训练和优化,并建立市场数据分析模型。
作为本技术方案的进一步改进,所述模型测试单元包括预测效果评估模块和预测融合模块;
所述预测效果评估模块提取市场数据集合中的数据,并将市场数据集合中的数据带入到市场数据分析模型中,根据市场数据分析模型反馈的结果和市场数据对应的数据结果进行精度评估和风险分析,并根据评估结果和风险分析情况对市场数据分析模型进行优化,以此来提高预测效果;
所述预测融合模块根据预测效果评估模块优化的结果对多个市场数据分析模型的预测结果进行融合处理,找寻到预测的数据共性,并根据数据共性对市场数据分析模型进行再优化,提高预测结果的准确性和精度。
作为本技术方案的进一步改进,所述预测单元包括预测模型批量化模块和预测结果展示模块;
所述预测模型批量化模块优化后的市场数据分析模型对未来市场数据进行预测;
所述预测结果展示模块将预测模型批量化模块预测的结果以图表或报表形式展示出来,使用户或客户可以看到市场数据的预测方向和情况,方便用户或客户根据预测的结果进行选择。
作为本技术方案的进一步改进,所述预测模型批量化模块在使用市场数据分析模型对未来市场数据进行预测时,向模型参数调整模块中进行数据的反馈,使模型参数调整模块对市场新出现的数据进行处理,并有训练模块根据新出现的数据反馈的结果进行模型的再建立,使市场数据分析模型得到不断地革新,使市场数据分析模型适应市场的变化。
与现有技术相比,本发明的有益效果:
1、该基于样本数据的市场数据分析方法及系统中,通过在市场数据集合中抽取数据样本集合,再通过对数据样本集合中的数据进行分析,来建立市场数据分析模型,并在模型建立后,通过向市场数据集合中抽取数据,再向市场中获取新的数据来使用市场数据分析模型进行预测,通过预测的结果和市场数据对应的结果来对市场数据分析模型不断的优化,来提高市场数据分析模型对市场的预测准确度,如此来帮助客户对市场进行准确的预测,给客户显示出合理的市场未来趋势情况。
2、该基于样本数据的市场数据分析方法及系统中,在预测单元对未来市场趋势进行预测的时候,向模型建立单元进行反馈,使模型建立单元对市场新出现的数据进行分析,并根据新出现的数据进行新模型的再建立,使市场数据分析模型得到不断的革新,使市场数据分析模型适合目前的市场,避免了市场数据分析模型无法适应市场变化而导致预测未来市场趋势出现较大误差的情况,提高市场数据分析模型预测的准确性。
附图说明
图1为本发明的方法的步骤框图;
图2为本发明的系统的整体结构框图;
图3为本发明的数据获取单元的框图;
图4为本发明的数据处理单元的框图;
图5为本发明的模型建立单元的框图;
图6为本发明的模型测试单元的框图;
图7为本发明的预测单元的框图。
图中各个标号意义为:
1、数据获取单元;11、抽样模块;12、数据生成模块;
2、数据处理单元;21、数据清洗模块;22、特征工程模块;
3、模型建立单元;31、模型设计模块;32、模型参数调整模块;33、训练模块;
4、模型测试单元;41、预测效果评估模块;42、预测融合模块;
5、预测单元;51、预测模型批量化模块;52、预测结果展示模块。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
请参阅图1所示,本实施例目的之一在于,提供了一种基于样本数据的市场数据分析方法,包括如下方法步骤:
S1、获取对应市场的数据,并将获取的数据组合起来形成市场数据集合,以此来形成属于提取的数据库;
S2、从市场数据集合中随机抽取数据,并使抽取数据生成数据样本集合,将数据样本集合中的数据进行预处理,分析出不同的数据对应的不同市场情况,其中,该数据样本集合代表市场数据的分布情况;数据预处理采用包括数据清洗、特征工程的步骤,对数据进行预处理,获取不同的数据对应不同市场的情况,以便于通过对比不同的数据情况与对应市场的不同情况,来获取市场和数据之间的关系,方便对数据和市场的关系进行分析;
S3、根据分析出来的数据样本集合的数据建立市场数据分析模型,并对建立的市场数据分析模型进行测试并优化;进一步提高预测结果的精度;
所述S3中对市场数据分析模型进行优化的步骤为:
①、向市场数据集合提取多组数据,并将提取的数据带入到市场数据分析模型中;
②、根据提取的数据和市场数据分析模型之间的差异情况,对市场数据分析模型进行精度评估,并在评估后,根据评估的结果,对市场数据分析模型进行调整;
③、重复①、②的步骤,对市场数据分析模型进行不断优化;
④、将优化后的市场数据分析模型批量应用于监测市场数据,根据监测的市场数据和市数据分析模型之间的差异,对市场数据分析模型进行重复优化,提高市场数据分析模型对市场数据的推测的准确性,并进一步优化预测精度和效率。
S4、使用优化后的市场数据分析模型对未来市场数据进行预测。
所述S4中,在使用市场数据分析模型对未来的市场数据进行预测的过程中,持续对是市场出现的数据进行获取,并将获取的数据和市场分析数据模型进行比较,并根据比较的结果对市场分析数据模型进行持续性的优化,使市场分析数据模型不断的革新,以便于市场分析数据模型适用于多变的市场环境,提高市场分析数据模型对市场未来发展趋势的预测准确度。
本发明目的之二在于,提供了一种用于实现包括上述任意一项的基于样本数据的市场数据分析方法的系统,参考图2-图7所示,包括数据获取单元1、数据处理单元2、模型建立单元3、模型测试单元4和预测单元5;
数据获取单元1用于获取客户提供或其他来源的市场数据集合,并生成数据样本集合,该数据样本集合代表市场数据的分布情况;
数据获取单元1包括抽样模块11和数据生成模块12;
抽样模块11用于获取市场数据集合,并在市场数据集合中随机抽取小样本,该抽样模块能够确保数据样本集合能够代表市场数据的分布情况;随机抽取小样本使用Python中的random.sample函数进行实现,生成数据样本集合并向数据生成模块12中传输数据;
数据生成模块12将抽样模块11随机抽取的小样本生成数据样本集合,并对数据样本集合进行去重处理,确保数据样本集合的唯一性。
数据处理单元2用于对数据样本集合进行预处理,获取市场数据和市场之间的关系;
数据处理单元2包括数据清洗模块21、特征工程模块22;
数据清洗模块21对数据生成模块12生成的数据样本集合中的数据中出现的异常数据或错误数据进行数据清除;对异常数据或错误数据进行数据清除,可以确保数据集合的准确性,提高后面建立模型的准确度;对异常数据或错误数据进行数据清除可以采用Python中的pandas库进行实现,去除数据集合中的异常值或错误数据;
特征工程模块22采用特征工程方法对数据样本集合中的数据进行特征数据的处理,提取持续变化的数据,并将提取的数据进行整合,获取数据和市场之间的关系,方便根据数据和市场之间的关系建立相关的模型,以便于后期根据建立的模型进行未来市场的推测,使用Python中的scikit-learn库进行提取持续变化的数据,通过变量转换和处理技术来提取数据和市场之间的关系,便根据数据和市场之间的关系建立相关的模型。
模型建立单元3用于运用数据挖掘和机器学习技术,对样本数据进行训练和优化,建立市场数据分析模型;
模型建立单元3包括模型设计模块31、模型参数调整模块32和训练模块33;
模型设计模块31接收特征工程模块22处理的数据,处理的方法采用数据挖掘和机器学习技术,根据数据样本集合中的样本数据进行,设计对应市场数据分析的模型;
模型参数调整模块32向模型设计模块31建立的模型中输送数据样本集合中的数据,并根据输送的数据对应的数据和模型反馈出来的数据进行比较,并根据比较的结构对市场数据分析模型的参数进行优化,以此来提高模型建立的准确性;
训练模块33根据模型参数调整模块32优化后的模型进行数据样本模型数据的再提取,然后根据提取的数据反馈的结果进行训练和优化,并建立市场数据分析模型,建立的市场数据分析模型可以对未来的市场发展趋势进行预测,有效地分析市场趋势和变化,方便客户根据市场数据分析模型预测出的市场发展趋势来做出选择和判断。
模型测试单元4对模型建立单元3建立的市场数据分析模型进行测试并优化,提高市场数据分析模型预测结果的精度;
模型测试单元4包括预测效果评估模块41和预测融合模块42;
预测效果评估模块41提取市场数据集合中的数据,并将市场数据集合中的数据带入到市场数据分析模型中,根据市场数据分析模型反馈的结果和市场数据对应的数据结果进行精度评估和风险分析,并根据评估结果和风险分析情况对市场数据分析模型进行优化,以此来提高预测效果;
预测融合模块42根据预测效果评估模块41优化的结果对多个市场数据分析模型的预测结果进行融合处理,找寻到预测的数据共性,并根据数据共性对市场数据分析模型进行再优化,提高预测结果的准确性和精度。
预测单元5将模型测试单元4优化后的市场数据分析模型对未来市场数据进行预测;
预测单元5包括预测模型批量化模块51和预测结果展示模块52;
预测模型批量化模块51优化后的市场数据分析模型对未来市场数据进行预测;
预测结果展示模块52将预测模型批量化模块51预测的结果以图表或报表形式展示出来,使用户或客户可以看到市场数据的预测方向和情况,方便用户或客户根据预测的结果进行选择。
通过在市场数据集合中抽取数据样本集合,再通过对数据样本集合中的数据进行分析,来建立市场数据分析模型,并在模型建立后,通过向市场数据集合中抽取数据,再向市场中获取新的数据来使用市场数据分析模型进行预测,通过预测的结果和市场数据对应的结果来对市场数据分析模型不断的优化,来提高市场数据分析模型对市场的预测准确度,如此来帮助客户对市场进行准确的预测,给客户显示出合理的市场未来趋势情况。
预测单元5在对未来市场数据进行预测的过程中,向模型建立单元3中进行反馈,使模型建立单元3对目前市场更新的数据进行处理和优化。
预测模型批量化模块51在使用市场数据分析模型对未来市场数据进行预测时,向模型参数调整模块32中进行数据的反馈,使模型参数调整模块32对市场新出现的数据进行处理,并有训练模块33根据新出现的数据反馈的结果进行模型的再建立,使市场数据分析模型得到不断地革新,使市场数据分析模型适应市场的变化。
在预测单元5对未来市场趋势进行预测的时候,向模型建立单元3进行反馈,使模型建立单元3对市场新出现的数据进行分析,并根据新出现的数据进行新模型的再建立,使市场数据分析模型得到不断的革新,使市场数据分析模型适合目前的市场,避免了市场数据分析模型无法适应市场变化而导致预测未来市场趋势出现较大误差的情况,提高市场数据分析模型预测的准确性。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (10)
1.一种基于样本数据的市场数据分析方法,其特征在于:包括如下方法步骤:
S1、获取对应市场的数据,并将获取的数据组合起来形成市场数据集合;
S2、从市场数据集合中随机抽取数据,并使抽取数据生成数据样本集合,将数据样本集合中的数据进行预处理,分析出不同的数据对应的不同市场情况;
S3、根据分析出来的数据样本集合的数据建立市场数据分析模型,并对建立的市场数据分析模型进行测试并优化;
S4、使用优化后的市场数据分析模型对未来市场数据进行预测。
2.根据权利要求1所述的基于样本数据的市场数据分析方法,其特征在于:所述S3中对市场数据分析模型进行优化的步骤为:
①、向市场数据集合提取多组数据,并将提取的数据带入到市场数据分析模型中;
②、根据提取的数据和市场数据分析模型之间的差异情况,对市场数据分析模型进行精度评估,并在评估后,根据评估的结果,对市场数据分析模型进行调整;
③、重复①、②的步骤,对市场数据分析模型进行不断优化;
④、将优化后的市场数据分析模型批量应用于监测市场数据,根据监测的市场数据和市数据分析模型之间的差异,对市场数据分析模型进行重复优化,提高市场数据分析模型对市场数据的推测的准确性。
3.根据权利要求1所述的基于样本数据的市场数据分析方法,其特征在于:所述S4中,在使用市场数据分析模型对未来的市场数据进行预测的过程中,持续对是市场出现的数据进行获取,并将获取的数据和市场分析数据模型进行比较,并根据比较的结果对市场分析数据模型进行持续性的优化。
4.一种基于样本数据的市场数据分析系统,用于实现如权利要求1-3中任一一个权利要求所述的市场数据分析方法,其特征在于,包括数据获取单元(1)、数据处理单元(2)、模型建立单元(3)、模型测试单元(4)和预测单元(5);
所述数据获取单元(1)用于获取客户提供或其他来源的市场数据集合,并生成数据样本集合;
所述数据处理单元(2)用于对数据样本集合进行预处理,获取市场数据和市场之间的关系;
所述模型建立单元(3)用于运用数据挖掘和机器学习技术,对样本数据进行训练和优化,建立市场数据分析模型;
所述模型测试单元(4)对模型建立单元(3)建立的市场数据分析模型进行测试并优化,提高市场数据分析模型预测结果的精度;
所述预测单元(5)将模型测试单元(4)优化后的市场数据分析模型对未来市场数据进行预测;
所述预测单元(5)在对未来市场数据进行预测的过程中,向模型建立单元(3)中进行反馈,使模型建立单元(3)对目前市场更新的数据进行处理和优化。
5.根据权利要求4所述的一种基于样本数据的市场数据分析系统,其特征在于:所述数据获取单元(1)包括抽样模块(11)和数据生成模块(12),所述抽样模块(11)用于获取市场数据集合,并在市场数据集合中随机抽取小样本;
所述数据生成模块(12)将抽样模块(11)随机抽取的小样本生成数据样本集合,并对数据样本集合进行去重处理。
6.根据权利要求5所述的一种基于样本数据的市场数据分析系统,其特征在于:所述数据处理单元(2)包括数据清洗模块(21)、特征工程模块(22);
所述数据清洗模块(21)对数据生成模块(12)生成的数据样本集合中的数据中出现的异常数据或错误数据进行数据清除;
所述特征工程模块(22)采用特征工程方法对数据样本集合中的数据进行特征数据的处理,提取持续变化的数据,并将提取的数据进行整合,获取数据和市场之间的关系。
7.根据权利要求6所述的一种基于样本数据的市场数据分析系统,其特征在于:所述模型建立单元(3)包括模型设计模块(31)、模型参数调整模块(32)和训练模块(33);
所述模型设计模块(31)接收特征工程模块(22)处理的数据,并根据接收的数据设计对应市场数据分析的模型;
所述模型参数调整模块(32)向模型设计模块(31)建立的模型中输送数据样本集合中的数据,并根据输送的数据对应的数据和模型反馈出来的数据进行比较,并根据比较的结构对市场数据分析模型的参数进行优化;
所述训练模块(33)根据模型参数调整模块(32)优化后的模型进行数据样本模型数据的再提取,然后根据提取的数据反馈的结果进行训练和优化,并建立市场数据分析模型。
8.根据权利要求4所述的一种基于样本数据的市场数据分析系统,其特征在于:所述模型测试单元(4)包括预测效果评估模块(41)和预测融合模块(42);
所述预测效果评估模块(41)提取市场数据集合中的数据,并将市场数据集合中的数据带入到市场数据分析模型中,根据市场数据分析模型反馈的结果和市场数据对应的数据结果进行精度评估和风险分析,并根据评估结果和风险分析情况对市场数据分析模型进行优化;
所述预测融合模块(42)根据预测效果评估模块(41)优化的结果对多个市场数据分析模型的预测结果进行融合处理,找寻到预测的数据共性,并根据数据共性对市场数据分析模型进行再优化。
9.根据权利要求7所述的一种基于样本数据的市场数据分析系统,其特征在于:所述预测单元(5)包括预测模型批量化模块(51)和预测结果展示模块(52);
所述预测模型批量化模块(51)优化后的市场数据分析模型对未来市场数据进行预测;
所述预测结果展示模块(52)将预测模型批量化模块(51)预测的结果以图表或报表形式展示出来。
10.根据权利要求9所述的一种基于样本数据的市场数据分析系统,其特征在于:所述预测模型批量化模块(51)在使用市场数据分析模型对未来市场数据进行预测时,向模型参数调整模块(32)中进行数据的反馈,使模型参数调整模块(32)对市场新出现的数据进行处理,并有训练模块(33)根据新出现的数据反馈的结果进行模型的再建立。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310753233.8A CN116503093A (zh) | 2023-06-26 | 2023-06-26 | 一种基于样本数据的市场数据分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310753233.8A CN116503093A (zh) | 2023-06-26 | 2023-06-26 | 一种基于样本数据的市场数据分析方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116503093A true CN116503093A (zh) | 2023-07-28 |
Family
ID=87325116
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310753233.8A Pending CN116503093A (zh) | 2023-06-26 | 2023-06-26 | 一种基于样本数据的市场数据分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116503093A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103985055A (zh) * | 2014-05-30 | 2014-08-13 | 西安交通大学 | 一种基于网络分析和多模型融合的股市投资决策方法 |
CN110826935A (zh) * | 2019-11-22 | 2020-02-21 | 国网陕西省电力公司电力科学研究院 | 一种基于机器学习的中长期电力市场风险评估方法 |
CN111028004A (zh) * | 2019-11-28 | 2020-04-17 | 国网吉林省电力有限公司 | 一种基于大数据技术的市场评估分析方法 |
CN111369276A (zh) * | 2019-08-22 | 2020-07-03 | 重庆菲欧坦软件开发有限公司 | 一种评估亚马逊产品市场趋势的方法 |
CN115375471A (zh) * | 2022-06-17 | 2022-11-22 | 同济大学 | 一种基于自适应特征工程的股票市场量化方法 |
-
2023
- 2023-06-26 CN CN202310753233.8A patent/CN116503093A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103985055A (zh) * | 2014-05-30 | 2014-08-13 | 西安交通大学 | 一种基于网络分析和多模型融合的股市投资决策方法 |
CN111369276A (zh) * | 2019-08-22 | 2020-07-03 | 重庆菲欧坦软件开发有限公司 | 一种评估亚马逊产品市场趋势的方法 |
CN110826935A (zh) * | 2019-11-22 | 2020-02-21 | 国网陕西省电力公司电力科学研究院 | 一种基于机器学习的中长期电力市场风险评估方法 |
CN111028004A (zh) * | 2019-11-28 | 2020-04-17 | 国网吉林省电力有限公司 | 一种基于大数据技术的市场评估分析方法 |
CN115375471A (zh) * | 2022-06-17 | 2022-11-22 | 同济大学 | 一种基于自适应特征工程的股票市场量化方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3361330B1 (en) | Event analyzing device, event analyzing system, event analyzing method, event analyzing program, and non-transitory computer readable storage medium | |
KR20180061769A (ko) | 머신 러닝 기반 반도체 제조 수율 예측 시스템 및 방법 | |
CN108491991B (zh) | 基于工业大数据产品工期的约束条件分析系统与方法 | |
CN111461431A (zh) | 一种基于手机制造中锁螺丝工艺的优化方法和系统 | |
CN112529036A (zh) | 一种故障预警方法、装置、设备及存储介质 | |
CN113084388A (zh) | 焊接质量的检测方法、系统、装置及存储介质 | |
CN116985183A (zh) | 一种近红外光谱分析仪质量监测管理方法及系统 | |
CN115269958A (zh) | 互联网可靠性数据信息采集分析系统 | |
CN115757150A (zh) | 一种生产环境测试方法、装置、设备及存储介质 | |
CN115277261A (zh) | 基于工控网络病毒的异常机器智能识别方法、装置、设备 | |
CN111160393A (zh) | 一种基于数据驱动的运载火箭健康评估模型模块化建模方法 | |
CN114441463A (zh) | 全光谱水质数据分析方法 | |
CN112346966B (zh) | 一种专用控制器测试数据自动分析方法 | |
CN116503093A (zh) | 一种基于样本数据的市场数据分析方法及系统 | |
CN112860348A (zh) | 一种注塑机智能诊断分析系统 | |
CN111737067A (zh) | 一种硬盘故障预测模型解释方法及装置 | |
CN111124816B (zh) | 一种基于hdp算法的服务器日志分析方法及系统 | |
CN117056533A (zh) | 一种基于知识图谱的工业知识挖掘建模方法及系统 | |
CN115186935B (zh) | 一种机电设备非线性故障预测方法及系统 | |
CN108427837B (zh) | 一种装配粗差判定方法及系统 | |
CN114153725B (zh) | 一种面向复杂显控系统的自动化测试验证方法 | |
CN114116831B (zh) | 一种大数据挖掘处理方法及装置 | |
CN115344495A (zh) | 批量任务测试的数据分析方法、装置、计算机设备及介质 | |
CN115841845A (zh) | 一种lcms图谱质量检测系统及lcms数据自动化处理解析收集系统 | |
CN101118423A (zh) | 虚拟测量预估模型的适用性选择方法与系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230728 |
|
RJ01 | Rejection of invention patent application after publication |