CN104182461A - 一种时间序列数据挖掘系统 - Google Patents
一种时间序列数据挖掘系统 Download PDFInfo
- Publication number
- CN104182461A CN104182461A CN201410347432.XA CN201410347432A CN104182461A CN 104182461 A CN104182461 A CN 104182461A CN 201410347432 A CN201410347432 A CN 201410347432A CN 104182461 A CN104182461 A CN 104182461A
- Authority
- CN
- China
- Prior art keywords
- time series
- time
- data
- module
- series data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
Abstract
本发明提出了一种时间序列数据挖掘系统,适用范围广,易于理解,便于操作,适合中小企业竞争情报分析系统,其包括依次连接的原始数据处理模块、时间序列聚类分析模块、单条时间序列模式发现模块、同类别多条时间序列模式发现模块。其中,原始数据处理模块,按访问时间顺序采集时间序列数据,并对其进行划分和平滑处理;时间序列聚类分析模块,分析接收到的时间序列数据相似度,利用聚类算法对时间序列数据进行聚类,将时间序列数据按关联程度分为第一类别时间序列……第N-1类别时间序列、第N类别时间序列;单条时间序列模式发现模块,整理第一元模式集……第N-1元模式集、第N元模式集;同类别多条时间序列模式发现模块,计算时间序列频繁模式。
Description
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种时间序列数据挖掘系统。
背景技术
数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者做出正确的决策。
数据库中的数据量非常庞大,分析数据时必须遵循一定的规律。由于时间序列时普遍存在的,现在常用的数据挖掘为时间序列数据挖掘,即在不同时间点上收集数据,这类数据反映了某一事物、现象等随时间的变化状态或程度。
时间序列数据挖掘是现有的数据挖掘最常用的手段,但是,现有的时间序列数据挖掘方法针对性强,不同环境、不同对象之间的时间序列挖掘方法及模型往往相差巨大,例如,季节降雨量、中国GDP的变化、金融市场分析等等都需要不同的时间序列数据挖掘模型。另外,随着企业竞争的日益激烈,竞争情报分析也越来越受到重视,但是现有的竞争情报数据分析系统耗资甚巨,中小型企业难以承受,他们急需一种简洁、快速、方便的数据挖掘方法。
发明内容
基于背景技术存在的问题,本发明提出了一种时间序列数据挖掘系统,适用范围广,且易于理解,便于操作,适用于中小企业竞争情报分析系统。
本发明提出的一种时间序列数据挖掘系统,包括依次连接的原始数据处理模块、时间序列聚类分析模块、单条时间序列模式发现模块、同类别多条时间序列模式发现模块;其中,
原始数据处理模块,按访问时间顺序采集时间序列数据,并对其进行划分和平滑处理,并将处理后的时间序列数据发送到时间序列聚类分析模块;
时间序列聚类分析模块,分析接收到的时间序列数据相似度,利用聚类算法对时间序列数据进行聚类,将时间序列数据按关联程度分为第一类别时间序列……第N-1类别时间序列、第N类别时间序列并发送到单条时间序列模式发现模块,N>1;
单条时间序列模式发现模块,分别针对第一类别时间序列……第N-1类别时间序列、第N类别时间序列,分析其变化模式,整理对应的第一元模式集……第N-1元模式集、第N元模式集并发送到同类别多条时间序列模式发现模块;
同类别多条时间序列模式发现模块,根据第一元模式集……第N-1元模式集、第N元模式集,分析整理多条时间序列通用的模式,计算时间序列频繁模式。
优选地,原始数据处理模块中,采集时间序列数据的时间顺序可自动设置和/或手动设置。
优选地,时间序列数据为确定时间序列数据和/或随机时间序列数据。
优选地,时间序列聚类分析模块中,通过相似度计算方法分析时间序列数据相似度,相似度计算方法可自动设置和/或手动设置。
本发明提出的时间序列数据挖掘系统,符合大多数数据挖掘场景的应用需求,适用范围广泛,能够满足竞争情报分析的需要;而且本发明中,采集数据的时间顺序、数据相似度算法既可以自动设置又可以手动设置,自动设置时,效率高,人工成本低,手动设置时,针对性强,准确率高;同理,时间序列数据可根据需要选择确定时间序列数据和/或随机时间序列数据,确定时间序列数据比较适合事件时间确定的分析场合,大大减少了数据量,提高分析速率并节约成本,随机时间序列数据更为适合事件时间不确定的分析场合,采用大面积撒网的策略,防止重要数据遗漏。本发明条理清晰,便于理解,可操作性强,尤其适合中小型企业的竞争情报分析系统。
附图说明
图1为本发明提出的一种时间序列数据挖掘系统的结构图;
图2为图1所示系统的工作流程图。
具体实施方式
参照图1、图2,本发明提出的一种时间序列数据挖掘系统,包括依次连接的原始数据处理模块、时间序列聚类分析模块、单条时间序列模式发现模块、同类别多条时间序列模式发现模块。
原始数据处理模块,按访问时间顺序采集时间序列数据,并对其进行划分和平滑处理,使得时间序列数据变化模式更加清晰也更具有代表性。处理后的时间序列数据被发送到时间序列聚类分析模块。
时间序列聚类分析模块,分析接收到的时间序列数据相似度,利用聚类算法对时间序列数据进行聚类,将时间序列数据按关联程度分为第一类别时间序列……第N-1类别时间序列、第N类别时间序列并发送到单条时间序列模式发现模块,N>1。
单条时间序列模式发现模块,分别针对第一类别时间序列……第N-1类别时间序列、第N类别时间序列,分析其变化模式,整理对应的第一元模式集……第N-1元模式集、第N元模式集并发送到同类别多条时间序列模式发现模块。
同类别多条时间序列模式发现模块,根据第一元模式集……第N-1元模式集、第N元模式集,分析整理多条时间序列通用的模式,计算时间序列频繁模式。
以上实施方式的原始数据处理模块中,采集时间序列数据的时间顺序可自动设置也可手动设置,时间序列数据可以是确定时间序列数据也可以是随机时间序列数据,确定时间序列数据比较适合事件时间确定的分析场合,大大减少了数据量,提高分析速率并节约成本,随机时间序列数据更为适合事件时间不确定的分析场合,采用大面积撒网的策略,防止重要数据遗漏。
以上实施方式的时间序列聚类分析模块中,通过相似度计算方法分析时间序列数据相似度,相似度计算方法可自动设置也可手动设置,自动设置时,效率高,人工成本低,手动设置时,针对性强,准确率高。
以上实施方式中的时间序列数据挖掘系统,符合大多数数据挖掘场景的应用需要,适用范围广泛,能够满足竞争情报分析的需要,而且,条理清晰,便于理解,可操作性强,尤其适合中小型企业的竞争情报分析系统。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (4)
1.一种时间序列数据挖掘系统,其特征在于,包括依次连接的原始数据处理模块、时间序列聚类分析模块、单条时间序列模式发现模块、同类别多条时间序列模式发现模块;其中,
原始数据处理模块,按访问时间顺序采集时间序列数据,并对其进行划分和平滑处理,并将处理后的时间序列数据发送到时间序列聚类分析模块;
时间序列聚类分析模块,分析接收到的时间序列数据相似度,利用聚类算法对时间序列数据进行聚类,将时间序列数据按关联程度分为第一类别时间序列……第N-1类别时间序列、第N类别时间序列并发送到单条时间序列模式发现模块,N>1;
单条时间序列模式发现模块,分别针对第一类别时间序列……第N-1类别时间序列、第N类别时间序列,分析其变化模式,整理对应的第一元模式集……第N-1元模式集、第N元模式集并发送到同类别多条时间序列模式发现模块;
同类别多条时间序列模式发现模块,根据第一元模式集……第N-1元模式集、第N元模式集,分析整理多条时间序列通用的模式,计算时间序列频繁模式。
2.如权利要求1所述的时间序列数据挖掘系统,其特征在于,原始数据处理模块中,采集时间序列数据的时间顺序可自动设置和/或手动设置。
3.如权利要求1或2所述的时间序列数据挖掘系统,其特征在于,时间序列数据为确定时间序列数据和/或随机时间序列数据。
4.如权利要求1所述的时间序列数据挖掘系统,其特征在于,时间序列聚类分析模块中,通过相似度计算方法分析时间序列数据相似度,相似度计算方法可自动设置和/或手动设置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410347432.XA CN104182461B (zh) | 2014-07-21 | 2014-07-21 | 一种时间序列数据挖掘系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410347432.XA CN104182461B (zh) | 2014-07-21 | 2014-07-21 | 一种时间序列数据挖掘系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104182461A true CN104182461A (zh) | 2014-12-03 |
CN104182461B CN104182461B (zh) | 2018-06-26 |
Family
ID=51963501
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410347432.XA Expired - Fee Related CN104182461B (zh) | 2014-07-21 | 2014-07-21 | 一种时间序列数据挖掘系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104182461B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108334519A (zh) * | 2017-01-19 | 2018-07-27 | 腾讯科技(深圳)有限公司 | 一种用户画像中的用户标签获取方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070239753A1 (en) * | 2006-04-06 | 2007-10-11 | Leonard Michael J | Systems And Methods For Mining Transactional And Time Series Data |
JP4734559B2 (ja) * | 2004-12-02 | 2011-07-27 | 大学共同利用機関法人情報・システム研究機構 | 時系列データ分析装置および時系列データ分析プログラム |
CN102867118A (zh) * | 2012-08-30 | 2013-01-09 | 重庆汉光电子工程有限责任公司 | 不确定时间序列中不确定频繁模式的确定方法 |
CN103676645A (zh) * | 2013-12-11 | 2014-03-26 | 广东电网公司电力科学研究院 | 一种时间序列数据流中的关联规则的挖掘方法 |
-
2014
- 2014-07-21 CN CN201410347432.XA patent/CN104182461B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4734559B2 (ja) * | 2004-12-02 | 2011-07-27 | 大学共同利用機関法人情報・システム研究機構 | 時系列データ分析装置および時系列データ分析プログラム |
US20070239753A1 (en) * | 2006-04-06 | 2007-10-11 | Leonard Michael J | Systems And Methods For Mining Transactional And Time Series Data |
CN102867118A (zh) * | 2012-08-30 | 2013-01-09 | 重庆汉光电子工程有限责任公司 | 不确定时间序列中不确定频繁模式的确定方法 |
CN103676645A (zh) * | 2013-12-11 | 2014-03-26 | 广东电网公司电力科学研究院 | 一种时间序列数据流中的关联规则的挖掘方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108334519A (zh) * | 2017-01-19 | 2018-07-27 | 腾讯科技(深圳)有限公司 | 一种用户画像中的用户标签获取方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN104182461B (zh) | 2018-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kim et al. | A capsule network for traffic speed prediction in complex road networks | |
CN103259962B (zh) | 一种目标追踪方法和相关装置 | |
Rajeswari et al. | Analysing soil data using data mining classification techniques | |
Wang et al. | An improved K-Means clustering algorithm | |
WO2016101628A1 (zh) | 一种数据建模中的数据处理方法及装置 | |
CN104317681A (zh) | 针对计算机系统的行为异常自动检测方法及检测系统 | |
CN102915347A (zh) | 一种分布式数据流聚类方法及系统 | |
CN110705029B (zh) | 一种基于迁移学习的振荡扑翼能量采集系统流场预测方法 | |
CN104346481A (zh) | 一种基于动态同步模型的社区检测方法 | |
CN110458096A (zh) | 一种基于深度学习的大规模商品识别方法 | |
CN106600965B (zh) | 基于尖锐度的交通流早晚高峰时段自动识别方法 | |
CN110869942A (zh) | 自馈深度学习方法和系统 | |
CN112132014A (zh) | 基于非督导金字塔相似性学习的目标重识别方法及系统 | |
CN102609501A (zh) | 一种基于实时历史数据库的数据清洗方法 | |
CN105894014B (zh) | 基于多因素不一致度量的异常行为序贯检测方法 | |
CN112286977A (zh) | 基于云计算的数据推送方法、电子设备及系统 | |
Ding et al. | Mit-avt clustered driving scene dataset: Evaluating perception systems in real-world naturalistic driving scenarios | |
CN102722732A (zh) | 一种基于数据二阶统计量建模的图像集合匹配方法 | |
CN105224941A (zh) | 对象辨识与定位方法 | |
CN103336963A (zh) | 一种图像特征提取的方法及装置 | |
CN114020811A (zh) | 数据异常检测方法及其装置、电子设备 | |
CN105468676A (zh) | 一种大数据处理方法 | |
CN104182461A (zh) | 一种时间序列数据挖掘系统 | |
CN106203526B (zh) | 基于多维特征的目标行为模式在线分类方法 | |
CN109210268B (zh) | 一种基于超低功率电磁阀的大数据处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180626 Termination date: 20210721 |