CN114549082A - 一种基于网络大数据的经济信息预测分析系统 - Google Patents
一种基于网络大数据的经济信息预测分析系统 Download PDFInfo
- Publication number
- CN114549082A CN114549082A CN202210193837.7A CN202210193837A CN114549082A CN 114549082 A CN114549082 A CN 114549082A CN 202210193837 A CN202210193837 A CN 202210193837A CN 114549082 A CN114549082 A CN 114549082A
- Authority
- CN
- China
- Prior art keywords
- module
- data
- analysis
- prediction
- linear regression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 81
- 238000011156 evaluation Methods 0.000 claims abstract description 23
- 238000007781 pre-processing Methods 0.000 claims abstract description 22
- 238000007431 microscopic evaluation Methods 0.000 claims abstract description 18
- 238000012417 linear regression Methods 0.000 claims description 65
- 238000012216 screening Methods 0.000 claims description 33
- 238000012549 training Methods 0.000 claims description 30
- 238000004364 calculation method Methods 0.000 claims description 28
- 238000012360 testing method Methods 0.000 claims description 25
- 230000009193 crawling Effects 0.000 claims description 21
- 238000000265 homogenisation Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 16
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 238000004452 microanalysis Methods 0.000 claims description 10
- 230000000052 comparative effect Effects 0.000 claims description 8
- 238000012886 linear function Methods 0.000 claims description 7
- 238000000034 method Methods 0.000 claims description 7
- 238000000611 regression analysis Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 6
- 230000007547 defect Effects 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Pure & Applied Mathematics (AREA)
- Software Systems (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Operations Research (AREA)
- Life Sciences & Earth Sciences (AREA)
- Marketing (AREA)
- Algebra (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Fuzzy Systems (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及经济数据预测领域,尤其涉及一种基于网络大数据的经济信息预测分析系统,包括数据集输入模块,还包括数据获取模块,所述数据模块与数据集输入模块共同连接有数据预处理模块,所述数据预处理模块连接有宏观分析模块以及微观分析模块,所述宏观分析模块与微观分析模块的结果分别经过线下评估模块进行结果评估,本发明中采用两种数据集的分析方法进行预测,来推断预测结果是否准确,系统中输入的计算模型是否合理,以利于作出后续调整;在网络经济数据集中,数据预处理模块对数据集进行预处理,将无用数据刨除,减少人力。
Description
技术领域
本发明涉及经济数据预测领域,尤其涉及一种基于网络大数据的经济信息预测分析系统。
背景技术
对于产品销售额、股市股值等经济数据分析预测一直颇受人们关注,科学的网络数据收集与分析预测可以协助人们对公司发展作出合理的评估,进而协助对公司进行风投、股票买入等操作,在经融领域尤为重要。
现有的经济数据分析与预测系统存在相当大的弊端,基本通过单一的模型进行预测,预测结果不够准确,或者通过线性回归模型进行演算推测,由于常出现欠拟合的问题,使得预测结果并不能达到目的需求,对于获取的数据需要耗费大量人工进行整合,去除掉多余数据、过时数据等,带来严重弊端。
发明内容
本发明的目的是为了解决背景技术中存在的缺点,而提出的一种基于网络大数据的经济信息预测分析系统。
为达到以上目的,本发明采用的技术方案为:一种基于网络大数据的经济信息预测分析系统,包括数据集输入模块,还包括数据获取模块,所述数据模块与数据集输入模块共同连接有数据预处理模块,所述数据预处理模块连接有宏观分析模块以及微观分析模块,所述宏观分析模块与微观分析模块的结果分别经过线下评估模块进行结果评估,其中:
所述数据获取模块用来爬取网络中的经济数据集;
所述数据集输入模块用来人为输入经济数据集;
所述数据预处理模块对数据集进行预处理,将无用数据刨除;
所述宏观分析模块通过一次性函数模型进行经济数据的快速分析预测;
所述微观分析模块通过线性回归预测的方式进行经济数据的详细分析预测。
优选的,所述数据获取模块包括爬取算法输入模块与爬取实施模块,所述爬取算法输入模块用来人为输入爬取算法,所述爬取实施模块用来运行爬取算法将经济数据从网络中获取。
优选的,所述数据预处理模块包括重复删除模块、符合度筛选模块、完整度分析模块与时效性分析模块,所述重复删除模块用来筛选数据集中的数据将重复的数据删除,所述符合度筛选模块用来筛选出预定范围内的数据集,所述完整度分析模块用来评估数据集中数据的完整度,所述时效性分析模块用来分析数据的实时程度并将过时数据刨除。
优选的,所述宏观分析模块包括一次性函数快速预测分析模块,所述一次性函数快速预测分析模块包括计算模型输入模块,所述计算模型输入模块连接有数据集输入模块,所述数据集输入模块连接有均化处理模块,所述均化处理模块连接有模型训练与预测模块,所述模型训练与预测模块连接有图表转化模块,所述图表转化模块连接有宏观结果输出模块,其中:
所述计算模型输入模块用来人为输入一次函数计算模型;
所述数据集输入模块将输入集输入算法编程中;
所述均化处理模块用来将数据集划分训练集与测试集,且均进行均化处理;
所述模型训练与预测模块用来创建线性回归对象、使用训练集训练模型以及在测试集上进行预测;
所述图表转化模块将所得预测结果通过图表的方式展示出来;
所述宏观结构输出模块将图表显示。
优选的,所述图表转化模块转化的图表为二维坐标系中数据的点状分布图。
优选的,所述微观分析模块包括比较线性回归预测模块,所述比较线性回归预测模块连接有连续数据段筛选模块,所述连续数据段筛选模块连接有局部加权线性回归预算模块, 所述局部加权线性回归预算模块连接有微观结果输出模块,其中:
所述比较线性回归预测模块用来进行数据集的线性回归分析;
所述连续数据段筛选模块用来摘取线性回归中连续样本点范围内的数据集线性回归分析结果;
所述局部加权线性回归预算模块用来对连续段内的回归结果进行核回归分析得到新的线性回归分析结果;
所述微观结果输出模块用来输出微观分析预测结果。
优选的,所述局部加权线性回归预算模块包括高斯核确定模块与回归系数确定模块,所述高斯核确定模块用来计算出核回归预算中的核权重数据,所述回归系数确定模块用最小二乘法求解最佳回归系数。
优选的,所述线下评估模块包括打分模块,所述打分模块连接有判断分输入模块,所述判断分输入模块连接有AUC值计算模块,所述AUC值计算模块连接有加权平均模块,所述加权平均模块连接有评估结果输出模块,其中:
所述打分模块为人群体根据实际结果对预测结果进行打分;
所述判断分输入模块即输入一个分的评判点,超过所述评判点的分数记为正,低于所述评判点的分数记为负;
所述AUC值计算模块算出若干评分的综合AUC值;
所述加权平均模块根据人群量将所述AUC值加权平均;
所述评估结果输出模块将评估的结果输出。
与现有技术相比,本发明具有以下有益效果:
1、本方案中采用两种数据集的分析方法进行预测,宏观分析模块通过一次性函数模型进行经济数据的快速分析预测,微观分析模块通过线性回归预测的方式进行经济数据的详细分析预测,并且通过宏观分析模块与微观分析模块的结果分别经过线下评估模块进行结果评估,来推断预测结果是否准确,系统中输入的计算模型是否合理,以利于作出后续调整;在网络经济数据集中,数据预处理模块对数据集进行预处理,将无用数据刨除,减少人力。
2、重复删除模块用来筛选数据集中的数据将重复的数据删除,符合度筛选模块用来筛选出预定范围内的数据集,完整度分析模块用来评估数据集中数据的完整度,时效性分析模块用来分析数据的实时程度并将过时数据刨除,用来将网络上爬取的数据以及人为输入的数据进行预处理,将无用数据刨除,减少系统负担,也免去了人为筛选去除带来的不便。
3、宏观分析模块中,计算模型输入模块用来人为输入一次函数计算模型,数据集输入模块将输入集输入算法编程中,均化处理模块用来将数据集划分训练集与测试集,且均进行均化处理,模型训练与预测模块用来创建线性回归对象、使用训练集训练模型以及在测试集上进行预测,图表转化模块将所得预测结果通过图表的方式展示出来,宏观结构输出模块将图表显示,通过一次函数预测可以有效降低系统的运算复杂程度,减少系统负担,对应的图表显示更为直观,主要用来比对微观分析模块给出参考,在两者预测偏差过大的情况下给出提示,提示预测精确度。
4、比较线性回归预测模块用来进行数据集的线性回归分析,连续数据段筛选模块用来摘取线性回归中连续样本点范围内的数据集线性回归分析结果,局部加权线性回归预算模块用来对连续段内的回归结果进行核回归分析得到新的线性回归分析结果,微观结果输出模块用来输出微观分析预测结果,局部加权线性回归预算模块包括高斯核确定模块与回归系数确定模块,高斯核确定模块用来计算出核回归预算中的核权重数据,回归系数确定模块用最小二乘法求解最佳回归系数,相比于传统的局部加权线性回归预算来说该方案进行分段式的回归预算,有效降低服务器负担,显然的设置多个局部加权线性回归预算模块即可进行多段样本点的同时分析预测,大大提升了预测效率。
附图说明
图1为本发明一种基于网络大数据的经济信息预测分析系统的结构示意图;
图2为本发明一种基于网络大数据的经济信息预测分析系统的数据获取模块原理图;
图3为本发明一种基于网络大数据的经济信息预测分析系统的数据预处理模块原理图;
图4为本发明一种基于网络大数据的经济信息预测分析系统的宏观分析模块原理图;
图5为本发明一种基于网络大数据的经济信息预测分析系统的微观分析模块原理图;
图6为本发明一种基于网络大数据的经济信息预测分析系统的线下评估模块原理图。
具体实施方式
以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例,本领域技术人员可以想到其他显而易见的变型。
如图1-图6所示的一种基于网络大数据的经济信息预测分析系统,包括数据集输入模块,还包括数据获取模块,数据模块与数据集输入模块共同连接有数据预处理模块,数据预处理模块连接有宏观分析模块以及微观分析模块,宏观分析模块与微观分析模块的结果分别经过线下评估模块进行结果评估,其中:
数据获取模块用来爬取网络中的经济数据集;
数据集输入模块用来人为输入经济数据集;
数据预处理模块对数据集进行预处理,将无用数据刨除;
宏观分析模块通过一次性函数模型进行经济数据的快速分析预测;
微观分析模块通过线性回归预测的方式进行经济数据的详细分析预测。
数据获取模块包括爬取算法输入模块与爬取实施模块,爬取算法输入模块用来人为输入爬取算法,爬取实施模块用来运行爬取算法将经济数据从网络中获取。
数据预处理模块包括重复删除模块、符合度筛选模块、完整度分析模块与时效性分析模块,重复删除模块用来筛选数据集中的数据将重复的数据删除,符合度筛选模块用来筛选出预定范围内的数据集,完整度分析模块用来评估数据集中数据的完整度,时效性分析模块用来分析数据的实时程度并将过时数据刨除。
宏观分析模块包括一次性函数快速预测分析模块,一次性函数快速预测分析模块包括计算模型输入模块,计算模型输入模块连接有数据集输入模块,数据集输入模块连接有均化处理模块,均化处理模块连接有模型训练与预测模块,模型训练与预测模块连接有图表转化模块,图表转化模块连接有宏观结果输出模块,其中:
计算模型输入模块用来人为输入一次函数计算模型;
数据集输入模块将输入集输入算法编程中;
均化处理模块用来将数据集划分训练集与测试集,且均进行均化处理;
模型训练与预测模块用来创建线性回归对象、使用训练集训练模型以及在测试集上进行预测;
图表转化模块将所得预测结果通过图表的方式展示出来;
宏观结构输出模块将图表显示。
图表转化模块转化的图表为二维坐标系中数据的点状分布图。
微观分析模块包括比较线性回归预测模块,比较线性回归预测模块连接有连续数据段筛选模块,连续数据段筛选模块连接有局部加权线性回归预算模块,局部加权线性回归预算模块连接有微观结果输出模块,其中:
比较线性回归预测模块用来进行数据集的线性回归分析;例如,在此采用如下模型进行计算:
连续数据段筛选模块用来摘取线性回归中连续样本点范围内的数据集线性回归分析结果;例如,在此采用如下模型进行计算:
局部加权线性回归预算模块用来对连续段内的回归结果进行核回归分析得到新的线性回归分析结果;
微观结果输出模块用来输出微观分析预测结果。
局部加权线性回归预算模块包括高斯核确定模块与回归系数确定模块,高斯核确定模块用来计算出核回归预算中的核权重数据,回归系数确定模块用最小二乘法求解最佳回归系数。其中的回归系数即为上述提及的r。
线下评估模块包括打分模块,打分模块连接有判断分输入模块,判断分输入模块连接有AUC值计算模块,AUC值计算模块连接有加权平均模块,加权平均模块连接有评估结果输出模块,其中:
打分模块为人群体根据实际结果对预测结果进行打分;
判断分输入模块即输入一个分的评判点,超过评判点的分数记为正,低于评判点的分数记为负;
AUC值计算模块算出若干评分的综合AUC值;
加权平均模块根据人群量将AUC值加权平均;
评估结果输出模块将评估的结果输出。
本方案中采用两种数据集的分析方法进行预测,宏观分析模块通过一次性函数模型进行经济数据的快速分析预测,微观分析模块通过线性回归预测的方式进行经济数据的详细分析预测,并且通过宏观分析模块与微观分析模块的结果分别经过线下评估模块进行结果评估,来推断预测结果是否准确,系统中输入的计算模型是否合理,以利于作出后续调整;在网络经济数据集中,数据预处理模块对数据集进行预处理,将无用数据刨除,减少人力。
重复删除模块用来筛选数据集中的数据将重复的数据删除,符合度筛选模块用来筛选出预定范围内的数据集,完整度分析模块用来评估数据集中数据的完整度,时效性分析模块用来分析数据的实时程度并将过时数据刨除,用来将网络上爬取的数据以及人为输入的数据进行预处理,将无用数据刨除,减少系统负担,也免去了人为筛选去除带来的不便。
宏观分析模块中,计算模型输入模块用来人为输入一次函数计算模型,数据集输入模块将输入集输入算法编程中,均化处理模块用来将数据集划分训练集与测试集,且均进行均化处理,模型训练与预测模块用来创建线性回归对象、使用训练集训练模型以及在测试集上进行预测,图表转化模块将所得预测结果通过图表的方式展示出来,宏观结构输出模块将图表显示,通过一次函数预测可以有效降低系统的运算复杂程度,减少系统负担,对应的图表显示更为直观,主要用来比对微观分析模块给出参考,在两者预测偏差过大的情况下给出提示,提示预测精确度。例如采用如下算法进行:
from skl.datasets import load_boston //skl 内置的数据集,load_boston是加载数据集的函数
from skl.model_selection import train_test_split //使用skl 中的train_test_split 划分数据集
from skl.linear_model import LinearRegression //线性回归预测
X, y = load_boston(return_X_y=True) //加载数据集,样本点为X,结果点y
X = X[:,5:6] //对选取的特征列进行限定,该处限定至取第6列
X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.2,random_state=2020) //划分为训练集和测试集,此处具体的测试集取的占总数据集数量的20%
regr = LinearRegression() //为创建的回归对象
regr.fit(X_train,y_train) //训练集进行训练
y_pred = regr.predict(X_test) //预算
print('y_pred:',y_pred[:3])
print('y_test:',y_test[:3])
print(regr.coef_,regr.intercept_) //输出前3个预测值与真实值。
比较线性回归预测模块用来进行数据集的线性回归分析,连续数据段筛选模块用来摘取线性回归中连续样本点范围内的数据集线性回归分析结果,局部加权线性回归预算模块用来对连续段内的回归结果进行核回归分析得到新的线性回归分析结果,微观结果输出模块用来输出微观分析预测结果,局部加权线性回归预算模块包括高斯核确定模块与回归系数确定模块,高斯核确定模块用来计算出核回归预算中的核权重数据,回归系数确定模块用最小二乘法求解最佳回归系数,相比于传统的局部加权线性回归预算来说该方案进行分段式的回归预算,有效降低服务器负担,显然的设置多个局部加权线性回归预算模块即可进行多段样本点的同时分析预测,大大提升了预测效率。
在本发明中,术语“安装”、“相连”、“连接”、“固定”等术语均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本说明书的描述中,若出现术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。
Claims (8)
1.一种基于网络大数据的经济信息预测分析系统,包括数据集输入模块,其特征在于:还包括数据获取模块,所述数据模块与数据集输入模块共同连接有数据预处理模块,所述数据预处理模块连接有宏观分析模块以及微观分析模块,所述宏观分析模块与微观分析模块的结果分别经过线下评估模块进行结果评估,其中:
所述数据获取模块用来爬取网络中的经济数据集;
所述数据集输入模块用来人为输入经济数据集;
所述数据预处理模块对数据集进行预处理,将无用数据刨除;
所述宏观分析模块通过一次性函数模型进行经济数据的快速分析预测;
所述微观分析模块通过线性回归预测的方式进行经济数据的详细分析预测。
2.根据权利要求1所述的一种基于网络大数据的经济信息预测分析系统,其特征在于:所述数据获取模块包括爬取算法输入模块与爬取实施模块,所述爬取算法输入模块用来人为输入爬取算法,所述爬取实施模块用来运行爬取算法将经济数据从网络中获取。
3.根据权利要求1所述的一种基于网络大数据的经济信息预测分析系统,其特征在于:所述数据预处理模块包括重复删除模块、符合度筛选模块、完整度分析模块与时效性分析模块,所述重复删除模块用来筛选数据集中的数据将重复的数据删除,所述符合度筛选模块用来筛选出预定范围内的数据集,所述完整度分析模块用来评估数据集中数据的完整度,所述时效性分析模块用来分析数据的实时程度并将过时数据刨除。
4.根据权利要求1所述的一种基于网络大数据的经济信息预测分析系统,其特征在于:所述宏观分析模块包括一次性函数快速预测分析模块,所述一次性函数快速预测分析模块包括计算模型输入模块,所述计算模型输入模块连接有数据集输入模块,所述数据集输入模块连接有均化处理模块,所述均化处理模块连接有模型训练与预测模块,所述模型训练与预测模块连接有图表转化模块,所述图表转化模块连接有宏观结果输出模块,其中:
所述计算模型输入模块用来人为输入一次函数计算模型;
所述数据集输入模块将输入集输入算法编程中;
所述均化处理模块用来将数据集划分训练集与测试集,且均进行均化处理;
所述模型训练与预测模块用来创建线性回归对象、使用训练集训练模型以及在测试集上进行预测;
所述图表转化模块将所得预测结果通过图表的方式展示出来;
所述宏观结构输出模块将图表显示。
5.根据权利要求4所述的一种基于网络大数据的经济信息预测分析系统,其特征在于:所述图表转化模块转化的图表为二维坐标系中数据的点状分布图。
6.根据权利要求1所述的一种基于网络大数据的经济信息预测分析系统,其特征在于:所述微观分析模块包括比较线性回归预测模块,所述比较线性回归预测模块连接有连续数据段筛选模块,所述连续数据段筛选模块连接有局部加权线性回归预算模块,所述局部加权线性回归预算模块连接有微观结果输出模块,其中:
所述比较线性回归预测模块用来进行数据集的线性回归分析;
所述连续数据段筛选模块用来摘取线性回归中连续样本点范围内的数据集线性回归分析结果;
所述局部加权线性回归预算模块用来对连续段内的回归结果进行核回归分析得到新的线性回归分析结果;
所述微观结果输出模块用来输出微观分析预测结果。
7.根据权利要求6所述的一种基于网络大数据的经济信息预测分析系统,其特征在于:所述局部加权线性回归预算模块包括高斯核确定模块与回归系数确定模块,所述高斯核确定模块用来计算出核回归预算中的核权重数据,所述回归系数确定模块用最小二乘法求解最佳回归系数。
8.根据权利要求1所述的一种基于网络大数据的经济信息预测分析系统,其特征在于:所述线下评估模块包括打分模块,所述打分模块连接有判断分输入模块,所述判断分输入模块连接有AUC值计算模块,所述AUC值计算模块连接有加权平均模块,所述加权平均模块连接有评估结果输出模块,其中:
所述打分模块为人群体根据实际结果对预测结果进行打分;
所述判断分输入模块即输入一个分的评判点,超过所述评判点的分数记为正,低于所述评判点的分数记为负;
所述AUC值计算模块算出若干评分的综合AUC值;
所述加权平均模块根据人群量将所述AUC值加权平均;
所述评估结果输出模块将评估的结果输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210193837.7A CN114549082A (zh) | 2022-03-01 | 2022-03-01 | 一种基于网络大数据的经济信息预测分析系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210193837.7A CN114549082A (zh) | 2022-03-01 | 2022-03-01 | 一种基于网络大数据的经济信息预测分析系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114549082A true CN114549082A (zh) | 2022-05-27 |
Family
ID=81661658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210193837.7A Pending CN114549082A (zh) | 2022-03-01 | 2022-03-01 | 一种基于网络大数据的经济信息预测分析系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114549082A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117745492A (zh) * | 2023-12-20 | 2024-03-22 | 华南师范大学 | 一种基于教育云平台的教育资源共享方法及系统 |
-
2022
- 2022-03-01 CN CN202210193837.7A patent/CN114549082A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117745492A (zh) * | 2023-12-20 | 2024-03-22 | 华南师范大学 | 一种基于教育云平台的教育资源共享方法及系统 |
CN117745492B (zh) * | 2023-12-20 | 2024-05-24 | 华南师范大学 | 一种基于教育云平台的教育资源共享方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110598736B (zh) | 一种电力设备红外图像故障定位、识别与预测方法 | |
CN109271374B (zh) | 一种基于机器学习的数据库健康度打分方法和打分系统 | |
WO2021232856A1 (zh) | 基于大数据的网销商品检验抽样方法 | |
CN105719048A (zh) | 一种基于主成分分析法及熵权法的中压配电网运行状态模糊综合评价方法 | |
CN104461682B (zh) | 一种轧钢钢板仿真分切质量判定系统及方法 | |
CN113627739B (zh) | 工程建设项目安全风险评价指标体系的构建方法 | |
CN113378831B (zh) | 一种小鼠胚胎器官识别与评分方法与系统 | |
CN110765268A (zh) | 一种基于客户诉求的配网精准投资策略方法 | |
CN111144749A (zh) | 电网图像智能标注众包平台及工作方法 | |
CN114549082A (zh) | 一种基于网络大数据的经济信息预测分析系统 | |
CN116883393B (zh) | 一种基于无锚框目标检测算法的金属表面缺陷检测方法 | |
CN111931992A (zh) | 一种电力负荷预测指标选取方法及装置 | |
CN114898220A (zh) | 一种高空作业车结构件的智能生产控制方法 | |
CN111429028A (zh) | 一种适用于山区地形的输电线路覆冰灾害风险评估方法 | |
CN116955939A (zh) | 基于图形相似度的气象要素结构特征预报误差量化表达方法 | |
CN117634965A (zh) | 一种光伏发电电能质量评估方法及系统 | |
CN117408550A (zh) | 水电站运维人员技能评估方法及系统 | |
CN111784169A (zh) | 一种基于互联网的国有企业目标管理测评方法和系统 | |
CN111931425A (zh) | 一种基于rf算法的热轧q355b钢种的性能预测系统 | |
CN112488869B (zh) | 一种适用于农业生产多因素管理决策系统 | |
Chen et al. | An intelligent online detection approach based on big data for mechanical properties of hot-rolled strip | |
CN112966907A (zh) | 一种投资驱动和创新驱动联动影响经济发展的评估系统 | |
CN114331176A (zh) | 基于最小交叉熵准则融合主客观评价的评价方法及其应用 | |
CN112052430A (zh) | 一种基于改进topsis的光伏场站相关性综合评估系统 | |
CN115132298A (zh) | 弹簧钢脱碳分析预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20220527 |