CN104182461A - 一种时间序列数据挖掘系统 - Google Patents

一种时间序列数据挖掘系统 Download PDF

Info

Publication number
CN104182461A
CN104182461A CN201410347432.XA CN201410347432A CN104182461A CN 104182461 A CN104182461 A CN 104182461A CN 201410347432 A CN201410347432 A CN 201410347432A CN 104182461 A CN104182461 A CN 104182461A
Authority
CN
China
Prior art keywords
time series
time
data
module
series data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410347432.XA
Other languages
English (en)
Other versions
CN104182461B (zh
Inventor
贾岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ANHUI HUAZHEN INFORMATION SCIENCE & TECHNOLOGY Co Ltd
Original Assignee
ANHUI HUAZHEN INFORMATION SCIENCE & TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ANHUI HUAZHEN INFORMATION SCIENCE & TECHNOLOGY Co Ltd filed Critical ANHUI HUAZHEN INFORMATION SCIENCE & TECHNOLOGY Co Ltd
Priority to CN201410347432.XA priority Critical patent/CN104182461B/zh
Publication of CN104182461A publication Critical patent/CN104182461A/zh
Application granted granted Critical
Publication of CN104182461B publication Critical patent/CN104182461B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification

Abstract

本发明提出了一种时间序列数据挖掘系统,适用范围广,易于理解,便于操作,适合中小企业竞争情报分析系统,其包括依次连接的原始数据处理模块、时间序列聚类分析模块、单条时间序列模式发现模块、同类别多条时间序列模式发现模块。其中,原始数据处理模块,按访问时间顺序采集时间序列数据,并对其进行划分和平滑处理;时间序列聚类分析模块,分析接收到的时间序列数据相似度,利用聚类算法对时间序列数据进行聚类,将时间序列数据按关联程度分为第一类别时间序列……第N-1类别时间序列、第N类别时间序列;单条时间序列模式发现模块,整理第一元模式集……第N-1元模式集、第N元模式集;同类别多条时间序列模式发现模块,计算时间序列频繁模式。

Description

一种时间序列数据挖掘系统
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种时间序列数据挖掘系统。
背景技术
数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者做出正确的决策。
数据库中的数据量非常庞大,分析数据时必须遵循一定的规律。由于时间序列时普遍存在的,现在常用的数据挖掘为时间序列数据挖掘,即在不同时间点上收集数据,这类数据反映了某一事物、现象等随时间的变化状态或程度。
时间序列数据挖掘是现有的数据挖掘最常用的手段,但是,现有的时间序列数据挖掘方法针对性强,不同环境、不同对象之间的时间序列挖掘方法及模型往往相差巨大,例如,季节降雨量、中国GDP的变化、金融市场分析等等都需要不同的时间序列数据挖掘模型。另外,随着企业竞争的日益激烈,竞争情报分析也越来越受到重视,但是现有的竞争情报数据分析系统耗资甚巨,中小型企业难以承受,他们急需一种简洁、快速、方便的数据挖掘方法。
发明内容
基于背景技术存在的问题,本发明提出了一种时间序列数据挖掘系统,适用范围广,且易于理解,便于操作,适用于中小企业竞争情报分析系统。
本发明提出的一种时间序列数据挖掘系统,包括依次连接的原始数据处理模块、时间序列聚类分析模块、单条时间序列模式发现模块、同类别多条时间序列模式发现模块;其中,
原始数据处理模块,按访问时间顺序采集时间序列数据,并对其进行划分和平滑处理,并将处理后的时间序列数据发送到时间序列聚类分析模块;
时间序列聚类分析模块,分析接收到的时间序列数据相似度,利用聚类算法对时间序列数据进行聚类,将时间序列数据按关联程度分为第一类别时间序列……第N-1类别时间序列、第N类别时间序列并发送到单条时间序列模式发现模块,N>1;
单条时间序列模式发现模块,分别针对第一类别时间序列……第N-1类别时间序列、第N类别时间序列,分析其变化模式,整理对应的第一元模式集……第N-1元模式集、第N元模式集并发送到同类别多条时间序列模式发现模块;
同类别多条时间序列模式发现模块,根据第一元模式集……第N-1元模式集、第N元模式集,分析整理多条时间序列通用的模式,计算时间序列频繁模式。
优选地,原始数据处理模块中,采集时间序列数据的时间顺序可自动设置和/或手动设置。
优选地,时间序列数据为确定时间序列数据和/或随机时间序列数据。
优选地,时间序列聚类分析模块中,通过相似度计算方法分析时间序列数据相似度,相似度计算方法可自动设置和/或手动设置。
本发明提出的时间序列数据挖掘系统,符合大多数数据挖掘场景的应用需求,适用范围广泛,能够满足竞争情报分析的需要;而且本发明中,采集数据的时间顺序、数据相似度算法既可以自动设置又可以手动设置,自动设置时,效率高,人工成本低,手动设置时,针对性强,准确率高;同理,时间序列数据可根据需要选择确定时间序列数据和/或随机时间序列数据,确定时间序列数据比较适合事件时间确定的分析场合,大大减少了数据量,提高分析速率并节约成本,随机时间序列数据更为适合事件时间不确定的分析场合,采用大面积撒网的策略,防止重要数据遗漏。本发明条理清晰,便于理解,可操作性强,尤其适合中小型企业的竞争情报分析系统。
附图说明
图1为本发明提出的一种时间序列数据挖掘系统的结构图;
图2为图1所示系统的工作流程图。
具体实施方式
参照图1、图2,本发明提出的一种时间序列数据挖掘系统,包括依次连接的原始数据处理模块、时间序列聚类分析模块、单条时间序列模式发现模块、同类别多条时间序列模式发现模块。
原始数据处理模块,按访问时间顺序采集时间序列数据,并对其进行划分和平滑处理,使得时间序列数据变化模式更加清晰也更具有代表性。处理后的时间序列数据被发送到时间序列聚类分析模块。
时间序列聚类分析模块,分析接收到的时间序列数据相似度,利用聚类算法对时间序列数据进行聚类,将时间序列数据按关联程度分为第一类别时间序列……第N-1类别时间序列、第N类别时间序列并发送到单条时间序列模式发现模块,N>1。
单条时间序列模式发现模块,分别针对第一类别时间序列……第N-1类别时间序列、第N类别时间序列,分析其变化模式,整理对应的第一元模式集……第N-1元模式集、第N元模式集并发送到同类别多条时间序列模式发现模块。
同类别多条时间序列模式发现模块,根据第一元模式集……第N-1元模式集、第N元模式集,分析整理多条时间序列通用的模式,计算时间序列频繁模式。
以上实施方式的原始数据处理模块中,采集时间序列数据的时间顺序可自动设置也可手动设置,时间序列数据可以是确定时间序列数据也可以是随机时间序列数据,确定时间序列数据比较适合事件时间确定的分析场合,大大减少了数据量,提高分析速率并节约成本,随机时间序列数据更为适合事件时间不确定的分析场合,采用大面积撒网的策略,防止重要数据遗漏。
以上实施方式的时间序列聚类分析模块中,通过相似度计算方法分析时间序列数据相似度,相似度计算方法可自动设置也可手动设置,自动设置时,效率高,人工成本低,手动设置时,针对性强,准确率高。
以上实施方式中的时间序列数据挖掘系统,符合大多数数据挖掘场景的应用需要,适用范围广泛,能够满足竞争情报分析的需要,而且,条理清晰,便于理解,可操作性强,尤其适合中小型企业的竞争情报分析系统。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (4)

1.一种时间序列数据挖掘系统,其特征在于,包括依次连接的原始数据处理模块、时间序列聚类分析模块、单条时间序列模式发现模块、同类别多条时间序列模式发现模块;其中,
原始数据处理模块,按访问时间顺序采集时间序列数据,并对其进行划分和平滑处理,并将处理后的时间序列数据发送到时间序列聚类分析模块;
时间序列聚类分析模块,分析接收到的时间序列数据相似度,利用聚类算法对时间序列数据进行聚类,将时间序列数据按关联程度分为第一类别时间序列……第N-1类别时间序列、第N类别时间序列并发送到单条时间序列模式发现模块,N>1;
单条时间序列模式发现模块,分别针对第一类别时间序列……第N-1类别时间序列、第N类别时间序列,分析其变化模式,整理对应的第一元模式集……第N-1元模式集、第N元模式集并发送到同类别多条时间序列模式发现模块;
同类别多条时间序列模式发现模块,根据第一元模式集……第N-1元模式集、第N元模式集,分析整理多条时间序列通用的模式,计算时间序列频繁模式。
2.如权利要求1所述的时间序列数据挖掘系统,其特征在于,原始数据处理模块中,采集时间序列数据的时间顺序可自动设置和/或手动设置。
3.如权利要求1或2所述的时间序列数据挖掘系统,其特征在于,时间序列数据为确定时间序列数据和/或随机时间序列数据。
4.如权利要求1所述的时间序列数据挖掘系统,其特征在于,时间序列聚类分析模块中,通过相似度计算方法分析时间序列数据相似度,相似度计算方法可自动设置和/或手动设置。
CN201410347432.XA 2014-07-21 2014-07-21 一种时间序列数据挖掘系统 Expired - Fee Related CN104182461B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410347432.XA CN104182461B (zh) 2014-07-21 2014-07-21 一种时间序列数据挖掘系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410347432.XA CN104182461B (zh) 2014-07-21 2014-07-21 一种时间序列数据挖掘系统

Publications (2)

Publication Number Publication Date
CN104182461A true CN104182461A (zh) 2014-12-03
CN104182461B CN104182461B (zh) 2018-06-26

Family

ID=51963501

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410347432.XA Expired - Fee Related CN104182461B (zh) 2014-07-21 2014-07-21 一种时间序列数据挖掘系统

Country Status (1)

Country Link
CN (1) CN104182461B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108334519A (zh) * 2017-01-19 2018-07-27 腾讯科技(深圳)有限公司 一种用户画像中的用户标签获取方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070239753A1 (en) * 2006-04-06 2007-10-11 Leonard Michael J Systems And Methods For Mining Transactional And Time Series Data
JP4734559B2 (ja) * 2004-12-02 2011-07-27 大学共同利用機関法人情報・システム研究機構 時系列データ分析装置および時系列データ分析プログラム
CN102867118A (zh) * 2012-08-30 2013-01-09 重庆汉光电子工程有限责任公司 不确定时间序列中不确定频繁模式的确定方法
CN103676645A (zh) * 2013-12-11 2014-03-26 广东电网公司电力科学研究院 一种时间序列数据流中的关联规则的挖掘方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4734559B2 (ja) * 2004-12-02 2011-07-27 大学共同利用機関法人情報・システム研究機構 時系列データ分析装置および時系列データ分析プログラム
US20070239753A1 (en) * 2006-04-06 2007-10-11 Leonard Michael J Systems And Methods For Mining Transactional And Time Series Data
CN102867118A (zh) * 2012-08-30 2013-01-09 重庆汉光电子工程有限责任公司 不确定时间序列中不确定频繁模式的确定方法
CN103676645A (zh) * 2013-12-11 2014-03-26 广东电网公司电力科学研究院 一种时间序列数据流中的关联规则的挖掘方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108334519A (zh) * 2017-01-19 2018-07-27 腾讯科技(深圳)有限公司 一种用户画像中的用户标签获取方法及装置

Also Published As

Publication number Publication date
CN104182461B (zh) 2018-06-26

Similar Documents

Publication Publication Date Title
Kim et al. A capsule network for traffic speed prediction in complex road networks
CN103259962B (zh) 一种目标追踪方法和相关装置
Rajeswari et al. Analysing soil data using data mining classification techniques
Wang et al. An improved K-Means clustering algorithm
WO2016101628A1 (zh) 一种数据建模中的数据处理方法及装置
CN104317681A (zh) 针对计算机系统的行为异常自动检测方法及检测系统
CN102915347A (zh) 一种分布式数据流聚类方法及系统
CN110705029B (zh) 一种基于迁移学习的振荡扑翼能量采集系统流场预测方法
CN104346481A (zh) 一种基于动态同步模型的社区检测方法
CN110458096A (zh) 一种基于深度学习的大规模商品识别方法
CN106600965B (zh) 基于尖锐度的交通流早晚高峰时段自动识别方法
CN110869942A (zh) 自馈深度学习方法和系统
CN112132014A (zh) 基于非督导金字塔相似性学习的目标重识别方法及系统
CN102609501A (zh) 一种基于实时历史数据库的数据清洗方法
CN105894014B (zh) 基于多因素不一致度量的异常行为序贯检测方法
CN112286977A (zh) 基于云计算的数据推送方法、电子设备及系统
Ding et al. Mit-avt clustered driving scene dataset: Evaluating perception systems in real-world naturalistic driving scenarios
CN102722732A (zh) 一种基于数据二阶统计量建模的图像集合匹配方法
CN105224941A (zh) 对象辨识与定位方法
CN103336963A (zh) 一种图像特征提取的方法及装置
CN114020811A (zh) 数据异常检测方法及其装置、电子设备
CN105468676A (zh) 一种大数据处理方法
CN104182461A (zh) 一种时间序列数据挖掘系统
CN106203526B (zh) 基于多维特征的目标行为模式在线分类方法
CN109210268B (zh) 一种基于超低功率电磁阀的大数据处理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180626

Termination date: 20210721