CN111984707A - 一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法 - Google Patents
一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法 Download PDFInfo
- Publication number
- CN111984707A CN111984707A CN202010850491.4A CN202010850491A CN111984707A CN 111984707 A CN111984707 A CN 111984707A CN 202010850491 A CN202010850491 A CN 202010850491A CN 111984707 A CN111984707 A CN 111984707A
- Authority
- CN
- China
- Prior art keywords
- data
- algorithm
- boundary
- mode cross
- fusion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004927 fusion Effects 0.000 title claims abstract description 33
- 238000005065 mining Methods 0.000 title claims abstract description 24
- 238000000034 method Methods 0.000 title claims abstract description 23
- 230000009467 reduction Effects 0.000 claims abstract description 21
- 241000288113 Gallirallus australis Species 0.000 claims abstract description 8
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000005516 engineering process Methods 0.000 claims abstract description 6
- 238000007418 data mining Methods 0.000 claims abstract description 4
- 238000004088 simulation Methods 0.000 claims description 20
- 238000011217 control strategy Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 238000003066 decision tree Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 4
- 230000008520 organization Effects 0.000 claims description 4
- 238000005192 partition Methods 0.000 claims description 4
- 238000007500 overflow downdraw method Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 abstract description 3
- 239000011159 matrix material Substances 0.000 abstract 1
- 239000013604 expression vector Substances 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Educational Administration (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Economics (AREA)
- Fuzzy Systems (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Human Resources & Organizations (AREA)
- Algebra (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,包括如下步骤;S1、收集车辆多模式跨界大数据的原始数据集;S2、对收集到的所述原始数据集进行数据预处理;S3、对预处理后的数据利用WEKA算法进行数据挖掘提取出特征关键字;S4、通过TF‑IDF技术计算出特征关键字权重和不同特征关键字之间的相似度,构建权重和相似度矩阵;S5、基于样本构建回归模型。本发明通过t‑SNE降维、WEKA算法特征提取和TF‑IDF算法,针对高维数据采取先降维再提取特征的分析策略,不仅实现了跨界大数据多层次深度融合挖掘的有效融合,解决了由数据类型复杂、数据特征众多的高维数据集造成的融合效率低下和工作效率没有显著提高的问题。
Description
技术领域
本发明涉及大数据技术领域,尤其涉及一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法。
背景技术
随着大数据时代来临和国民经济的快速发展,机动车辆增长迅速,使得在对机动车行驶时的路况信息需要及时的进行掌握,以便确定城市交通的流畅性。
虽然基础应用系统已经达到了较高的技术和应用水平,但也存在着一些问题和不足:各应用系统只针对本系统的数据处理,局限于简单的统计,统计信息都有其局限性,出现“信息孤岛”现象,无法实现数据融合、信息共享,使得在车辆营运过程中,工作效率仍没有显著提高。
基于此,本发明提出一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法。
发明内容
本发明的目的是为了解决现有技术中存在的缺点,而提出的一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,其通过t-SNE降维、WEKA算法特征提取和TF-IDF算法,针对高维数据采取先降维再提取特征的分析策略,不仅实现了跨界大数据多层次深度融合挖掘的有效融合,解决了由数据类型复杂、数据特征众多的高维数据集造成的融合效率低下和工作效率没有显著提高的问题。
为了实现上述目的,本发明采用了如下技术方案:
本发明提出一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,包括如下步骤;
S1、收集车辆多模式跨界大数据的原始数据集;
S2、对收集到的所述原始数据集进行数据预处理;
S3、对预处理后的数据利用WEKA算法进行数据挖掘提取出特征关键字;
S4、通过TF-IDF技术计算出特征关键字权重和不同特征关键字之间的相似度,构建权重以获得样本;
S5、基于样本构建回归模型,并随之使用所构建的回归模型确定所有已知的第二类目标对象中的每个是否潜在地属于第一类目标对象;
S6、对构建回归模型后的数据进行融合;
S7、对融合后的数据进行分析模拟,体现交通流的真实状态,描述各种交通控制策略的实施过程。
优选地,在所述步骤S1中,所述原始数据集包括车辆信息数据、城市交通管理数据、城市智能监管数据和城市道路管理数据。
优选地,在所述步骤S2中,所述数据预处理包括对数据进行数据降维,所述数据降维的具体步骤为:对于维度小于3的数据利用t-SNE算法直接降维;对于维度大于等于3的高维大数据首先利用PCA算法进行第一次降维,使其降到2维,再对第一次降维后的数据采用t-SNE算法进行第二次降维。
优选地,在所述步骤S3中,所述挖掘提取特征关键字的具体步骤为:加载预处理后的数据集;选择并设置C4.5算法;设置分类测试选项;构件和评估C4.5算法;进行多次分类后显示可视化决策树模型。
优选地,在所述步骤S4中,所述计算出特征关键字权重和不同特征关键字之间的相似度的具体步骤为:加载挖掘提取的特征关键字;对关键字分别进行词频和逆文档频率;通过词频乘以逆文档频率的积计算出文档的每个数据的TF-IDF值;根据TF-IDF值对每个词进行降序排列。
优选地,在所述步骤S5中,所述回归模型的构建的具体步骤为:在构建所述回归模型之前对每个样本中的每个字段执行规范化操作,包括处理缺失值、处理奇异值、对离散型的字符型字段进行重新编码、对每个样本中的每个字段进行规范化;在规范化操作执行完成之后进一步对每个样本中的每个字段执行离散化操作,包括对连续型的数据以划分区间的方式进行离散化、根据TF-IDF值曲线的趋势来判断区间划分结果的优劣。
优选地,在所述步骤S6中,所述数据融合的具体步骤为:提取根据TF-IDF值降序排列中相似度高且权重大的数据;通过特征级融合方法融合这些数据。
优选地,在所述步骤S7中,所述对数据进行分析模拟包括车辆个体模拟、交通控制策略模拟、交通状态模拟、交通管理模拟和交通组织模拟。
本发明具有以下有益效果:
1、通过t-SNE降维、WEKA算法特征提取和TF-IDF算法,针对高维数据采取先降维再提取特征的分析策略,实现了跨界大数据多层次深度融合挖掘的有效融合,解决了由数据类型复杂、数据特征众多的高维数据集造成的融合效率低下和工作效率没有显著提高的问题;
2、通过对数据进行分析模拟加强了道路交通安全大数据应用,实现跨部门、跨地区的信息资源共享共用,健省、市、县三级道路交通安全常态化分析研判机制,实现面向不同地区、不同类型道路交通安全及运行态势的分析研判和集成应用,建立完善交通大数据信息安全保障体系,为数据的大范围应用提供基础;
3、通过使用回归模型进行判定,能够根据目标对象的综合特征来挖掘和分类目标对象,因此复用性较高,能够显著地提高判定操作的效率和准确性。
附图说明
图1为本发明提出的一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法的流程示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施的限制。
需要说明的是,当元件被称为“固定于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的,并不表示是唯一的实施方式。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
参照图1,一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,包括如下步骤;
S1、收集车辆多模式跨界大数据的原始数据集;
S2、对收集到的所述原始数据集进行数据预处理;
S3、对预处理后的数据利用WEKA算法进行数据挖掘提取出特征关键字;
S4、通过TF-IDF技术计算出特征关键字权重和不同特征关键字之间的相似度,构建权重以获得样本;
S5、基于样本构建回归模型,并随之使用所构建的回归模型确定所有已知的第二类目标对象中的每个是否潜在地属于第一类目标对象;
S6、对构建回归模型后的数据进行融合;
S7、对融合后的数据进行分析模拟,体现交通流的真实状态,描述各种交通控制策略的实施过程。
在步骤S1中,原始数据集包括车辆信息数据、城市交通管理数据、城市智能监管数据和城市道路管理数据。
在步骤S2中,数据预处理包括对数据进行数据降维,进一步的,降维是通过单幅图像数据的高维化,将单幅图像转化为高维空间中的数据集合,对其进行非线性降维,寻求其高维数据流形本征结构的一维表示向量,将其作为图像数据的特征表达向量,降维处理是将高维数据化为低维度数据的操作,可以加快后续对数据的融合,数据降维的具体步骤为:对于维度小于3的数据利用t-SNE算法直接降维;对于维度大于等于3的高维大数据首先利用PCA算法进行第一次降维,使其降到2维,再对第一次降维后的数据采用t-SNE算法进行第二次降维。
在步骤S3中,挖掘提取特征关键字的具体步骤为:加载预处理后的数据集;选择并设置C4.5算法,在WEKA预处理面板中单击开启按钮,选择并打开目录中的数据文件;设置分类测试选项,首先切换到Classify面板,然后Choose按钮打开对话框,并单击trees条目并展开子条目,最后单击J48选择C4.5分类器及默认参数设置;构件和评估C4.5算法,单击Classify面板中开设按钮,通过训练集构建C4.5算法,然后对所有数据进行分类并评估;进行多次分类后显示可视化决策树模型,决策树模型可以用来对数据特征进行明确的分析。
在步骤S4中,计算出特征关键字权重和不同特征关键字之间的相似度的具体步骤为:加载挖掘提取的特征关键字;对关键字分别进行词频和逆文档频率,词频=某个词在文章中出现的次数/文章的总词数,逆文档频率=log(语料库的文档总数/(包含该词的文档数+1));通过词频乘以逆文档频率的积计算出文档的每个数据的TF-IDF值;根据TF-IDF值对每个词进行降序排列。
在步骤S5中,所述回归模型的构建的具体步骤为:在构建所述回归模型之前对每个样本中的每个字段执行规范化操作,包括处理缺失值,具体的为如果数值型字段缺失数据,则采用列均值填充,如果字符型字段缺失数据,则丢弃该样本、处理奇异值,具体的为采用盒装图技术过滤出极值异常点、对离散型的字符型字段进行重新编码、对每个样本中的每个字段进行规范化,以便消除量纲不一致的影响;在规范化操作执行完成之后进一步对每个样本中的每个字段执行离散化操作,包括对连续型的数据以划分区间的方式进行离散化,其中,区间之间的划分点是导致目标变量出现明显转折的点、根据TF-IDF值曲线的趋势来判断区间划分结果的优劣,其中,如果TF-IDF值曲线是递增、递减或者只有一个转折点的趋势,则确定划分结果是优良的并随之终止离散化操作,其能够根据目标对象的综合特征来挖掘和分类目标对象,并且由于使用回归模型进行判定,故复用性较高并且能够显著地提高判定操作的效率和准确性。
在步骤S6中,数据融合的具体步骤为:提取根据TF-IDF值降序排列中相似度高且权重大的数据选取出相似度高的关键字优先进行特征提取,提取的特征信息应尽量体现原始信息;通过特征级融合方法融合这些数据,实现了跨界大数据多层次深度融合挖掘的有效融合,解决了由数据类型复杂、数据特征众多的高维数据集造成的融合效率低下和工作效率没有显著提高的问题。
在步骤S7中,对数据进行分析模拟包括车辆个体模拟、交通控制策略模拟、交通状态模拟、交通管理模拟和交通组织模拟,进一步的,对车辆个体模拟能够基于车辆个体模拟人-车-路的相互作用,再现交通流的真实状态,描述各种交通控制策略的实施过程,所得到的各种数据可用于对交通状态的分析、预测,对交通管理交通组织等方案进行评估,提出针对性、系统性的解决措施,实现跨部门跨地区的信息资源共享共用,实现面向不同地区、不同类型道路交通运行态势的分析研判和集成应用,建立完善跨界大数据信息安全保障体系,为数据的大范围应用提供基础;通过对具体项目或案例进行仿真模拟,为业务管理部门完善行业管理提供依据,为领导及上级部门提供决策支持,根据仿真设置和仿真输出的不同,可以实现交通工程、交通控制、交通管理、交通评价等功能,通过对数据进行分析模拟加强了道路交通安全大数据应用,实现跨部门、跨地区的信息资源共享共用,健省、市、县三级道路交通安全常态化分析研判机制,实现面向不同地区、不同类型道路交通安全及运行态势的分析研判和集成应用,建立完善交通大数据信息安全保障体系,为数据的大范围应用提供基础。
本发明中,通过t-SNE降维、WEKA算法特征提取和TF-IDF算法,针对高维数据采取先降维再提取特征的分析策略,实现了跨界大数据多层次深度融合挖掘的有效融合,并且通过使用回归模型进行判定,能够根据目标对象的综合特征来挖掘和分类目标对象,因此复用性较高,能够显著地提高判定操作的效率和准确性,进而实现了跨部门、跨地区的信息资源共享共用。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (8)
1.一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,其特征在于,包括如下步骤;
S1、收集车辆多模式跨界大数据的原始数据集;
S2、对收集到的所述原始数据集进行数据预处理;
S3、对预处理后的数据利用WEKA算法进行数据挖掘提取出特征关键字;
S4、通过TF-IDF技术计算出特征关键字权重和不同特征关键字之间的相似度,构建权重以获得样本;
S5、基于样本构建回归模型,并随之使用所构建的回归模型确定所有已知的第二类目标对象中的每个是否潜在地属于第一类目标对象;
S6、对构建回归模型后的数据进行融合;
S7、对融合后的数据进行分析模拟,体现交通流的真实状态,描述各种交通控制策略的实施过程。
2.根据权利要求1所述的一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,其特征在于,在所述步骤S1中,所述原始数据集包括车辆信息数据、城市交通管理数据、城市智能监管数据和城市道路管理数据。
3.根据权利要求1所述的一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,其特征在于,在所述步骤S2中,所述数据预处理包括对数据进行数据降维,所述数据降维的具体步骤为:对于维度小于3的数据利用t-SNE算法直接降维;对于维度大于等于3的高维大数据首先利用PCA算法进行第一次降维,使其降到2维,再对第一次降维后的数据采用t-SNE算法进行第二次降维。
4.根据权利要求1所述的一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,其特征在于,在所述步骤S3中,所述挖掘提取特征关键字的具体步骤为:加载预处理后的数据集;选择并设置C4.5算法;设置分类测试选项;构件和评估C4.5算法;进行多次分类后显示可视化决策树模型。
5.根据权利要求1所述的一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,其特征在于,在所述步骤S4中,所述计算出特征关键字权重和不同特征关键字之间的相似度的具体步骤为:加载挖掘提取的特征关键字;对关键字分别进行词频和逆文档频率;通过词频乘以逆文档频率的积计算出文档的每个数据的TF-IDF值;根据TF-IDF值对每个词进行降序排列。
6.根据权利要求1所述的一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,其特征在于,在所述步骤S5中,所述回归模型的构建的具体步骤为:在构建所述回归模型之前对每个样本中的每个字段执行规范化操作,包括处理缺失值、处理奇异值、对离散型的字符型字段进行重新编码、对每个样本中的每个字段进行规范化;在规范化操作执行完成之后进一步对每个样本中的每个字段执行离散化操作,包括对连续型的数据以划分区间的方式进行离散化、根据TF-IDF值曲线的趋势来判断区间划分结果的优劣。
7.根据权利要求1所述的一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,其特征在于,在所述步骤S6中,所述数据融合的具体步骤为:提取根据TF-IDF值降序排列中相似度高且权重大的数据;通过特征级融合方法融合这些数据。
8.根据权利要求1所述的一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,其特征在于,在所述步骤S7中,所述对数据进行分析模拟包括车辆个体模拟、交通控制策略模拟、交通状态模拟、交通管理模拟和交通组织模拟。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010850491.4A CN111984707A (zh) | 2020-08-21 | 2020-08-21 | 一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010850491.4A CN111984707A (zh) | 2020-08-21 | 2020-08-21 | 一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111984707A true CN111984707A (zh) | 2020-11-24 |
Family
ID=73442870
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010850491.4A Pending CN111984707A (zh) | 2020-08-21 | 2020-08-21 | 一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111984707A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112885080A (zh) * | 2021-01-11 | 2021-06-01 | 重庆长安新能源汽车科技有限公司 | 一种新能源汽车的行驶工况构建方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104699717A (zh) * | 2013-12-10 | 2015-06-10 | 中国银联股份有限公司 | 数据挖掘方法 |
CN106250461A (zh) * | 2016-07-28 | 2016-12-21 | 北京北信源软件股份有限公司 | 一种基于Spark框架利用梯度提升决策树进行数据挖掘的算法 |
CN108427753A (zh) * | 2018-03-13 | 2018-08-21 | 河海大学 | 一种新的数据挖掘方法 |
CN109033497A (zh) * | 2018-06-04 | 2018-12-18 | 南瑞集团有限公司 | 一种面向高并发的多阶段数据挖掘算法智能选择方法 |
CN110990498A (zh) * | 2020-03-04 | 2020-04-10 | 杭州信雅达数码科技有限公司 | 一种基于fcm算法的数据融合方法 |
-
2020
- 2020-08-21 CN CN202010850491.4A patent/CN111984707A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104699717A (zh) * | 2013-12-10 | 2015-06-10 | 中国银联股份有限公司 | 数据挖掘方法 |
CN106250461A (zh) * | 2016-07-28 | 2016-12-21 | 北京北信源软件股份有限公司 | 一种基于Spark框架利用梯度提升决策树进行数据挖掘的算法 |
CN108427753A (zh) * | 2018-03-13 | 2018-08-21 | 河海大学 | 一种新的数据挖掘方法 |
CN109033497A (zh) * | 2018-06-04 | 2018-12-18 | 南瑞集团有限公司 | 一种面向高并发的多阶段数据挖掘算法智能选择方法 |
CN110990498A (zh) * | 2020-03-04 | 2020-04-10 | 杭州信雅达数码科技有限公司 | 一种基于fcm算法的数据融合方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112885080A (zh) * | 2021-01-11 | 2021-06-01 | 重庆长安新能源汽车科技有限公司 | 一种新能源汽车的行驶工况构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111352971A (zh) | 银行系统监控数据异常检测方法及系统 | |
CN108417033B (zh) | 基于多维因素的高速路交通事故分析预测方法 | |
CN110555989B (zh) | 一种基于Xgboost算法的交通量预测方法 | |
CN109635296A (zh) | 新词挖掘方法、装置计算机设备和存储介质 | |
Degtyareva et al. | Finding patterns in employee attrition rates using self-organizing Kohonen maps and decision trees | |
CN112491891B (zh) | 物联网环境下基于混合深度学习的网络攻击检测方法 | |
CN113688558A (zh) | 一种基于大数据库样本的汽车行驶工况构建方法及系统 | |
CN105389471A (zh) | 一种机器学习训练集缩减方法 | |
CN117114941B (zh) | 一种基于动态学情数据链的教育教学管理平台 | |
CN113378458A (zh) | 一种基于大数据的拥堵预警方法、装置、介质及设备 | |
CN111984707A (zh) | 一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法 | |
He et al. | [Retracted] Visualization and Analysis of Mapping Knowledge Domain of Heterogeneous Traffic Flow | |
CN114819449A (zh) | 预测车辆除霜性能的方法、装置、设备及存储介质 | |
CN116956212A (zh) | 一种多源视觉信息特征识别与提取方法 | |
CN109523031B (zh) | 一种用于深度分析的大数据智能机器学习系统 | |
CN104102716A (zh) | 基于聚类分层抽样补偿逻辑回归的失衡数据预测方法 | |
CN107274100A (zh) | 基于电力大数据的经济预警分析方法 | |
CN111209158A (zh) | 服务器集群的挖矿监控方法及集群监控系统 | |
CN109635008A (zh) | 一种基于机器学习的设备故障检测方法 | |
CN112967759B (zh) | 基于内存堆栈技术的dna物证鉴定str分型比对方法 | |
Tang et al. | Design of university financial decision-making platform based on data mining | |
CN113807857A (zh) | 一种资金交易异常的存款账户识别方法及装置 | |
Liu | Collaborative mining method of traffic accident data based on decision tree and association rules. | |
CN114049522A (zh) | 一种基于深度学习的垃圾分类系统 | |
CN112084332A (zh) | 一种基于深度双向语言文本处理网络的违章分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201124 |