CN117992811A - 基于物联网洗衣机在大学宿舍的洗衣服务提供方法及系统 - Google Patents
基于物联网洗衣机在大学宿舍的洗衣服务提供方法及系统 Download PDFInfo
- Publication number
- CN117992811A CN117992811A CN202410396230.8A CN202410396230A CN117992811A CN 117992811 A CN117992811 A CN 117992811A CN 202410396230 A CN202410396230 A CN 202410396230A CN 117992811 A CN117992811 A CN 117992811A
- Authority
- CN
- China
- Prior art keywords
- sample
- data
- samples
- dimension
- moment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005406 washing Methods 0.000 title claims abstract description 99
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000009826 distribution Methods 0.000 claims abstract description 22
- 238000001514 detection method Methods 0.000 claims abstract description 10
- 230000011218 segmentation Effects 0.000 claims description 19
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 230000002159 abnormal effect Effects 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 230000001186 cumulative effect Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Control Of Washing Machine And Dryer (AREA)
Abstract
本发明涉及数据处理技术领域,具体涉及基于物联网洗衣机在大学宿舍的洗衣服务提供方法及系统,包括:根据每个样本中所有维度数据在每个时刻的左右邻域数据之间的数据分布差异将每个样本划分为若干个阶段,根据任意两个样本中不同阶段数据之间的相关系数差异、数据分布之间的差异,得到任意两个样本中不同阶段的数据之间的相似性,得到每种组合方式中的样本选择优度,根据每种组合方式中的样本选择优度得到初始代表点;根据初始代表点对所有样本进行聚类,得到若干个类簇,并对洗衣机故障检测。本发明优化了初始代表点选取的精度,提高了大学宿舍洗衣机的故障检测的准确性。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及基于物联网洗衣机在大学宿舍的洗衣服务提供方法及系统。
背景技术
在大学宿舍中,洗衣机在使用过程中可能会出现各种各样的故障,此时就需要工作人员进行洗衣机的维护,但是这种情况经常都是通过用户反馈以及定期维护的方式进行洗衣机的故障检测的,这样导致这种反馈方式浪费的时间长,因此需要一种通过物联网的方式进行对大学宿舍洗衣机的故障检测的方法,以此来提高洗衣机故障检测的效率。
在常规的通过物联网进行大学宿舍洗衣机的故障检测时,可以通过CURE聚类算法根据每次洗衣服时洗衣机的各种数据对所有的洗衣样本进行聚类,根据聚类后每个类簇的数据个数来判断洗衣机是否出现故障;但是在使用CURE聚类算法进行对所有的洗衣样本进行聚类时,初始代表点都是随机选取的,由于洗衣机在洗衣过程中会有多个洗衣状态,因此随机选取的初始代表点周围的密度差异大小不同,导致在各类簇中选择的初始代表点的准确性不佳,无法较好的表示对应类簇的形态特征,即最终聚类结果的准确性不高,则会降低大学宿舍的物联网洗衣机的故障检测的准确性。
发明内容
本发明提供基于物联网洗衣机在大学宿舍的洗衣服务提供方法及系统,以解决现有的问题。
本发明的基于物联网洗衣机在大学宿舍的洗衣服务提供方法及系统采用如下技术方案:
本发明一个实施例提供了基于物联网洗衣机在大学宿舍的洗衣服务提供方法,该方法包括以下步骤:
采集每次洗衣过程中若干个时刻的多种洗衣机数据,将每次洗衣过程中若干个时刻的多种洗衣机数据记为一个样本,并连续获取多个样本,将多种洗衣机数据中的一种数据记为一个维度数据;
获取每个样本中每个维度数据在每个时刻的左邻域数据和右邻域数据,根据每个样本中所有维度数据在每个时刻的左邻域数据和右邻域数据之间的数据分布差异将每个样本划分为若干个阶段,根据任意两个样本中不同阶段数据之间的相关系数差异、任意两个样本中不同阶段数据分布之间的差异,得到任意两个样本中不同阶段的数据之间的相似性;
根据任意两个样本中不同阶段的数据之间的相似性,得到任意两个样本之间的总相似度,根据任意两个样本之间的总相似度获得每个样本的相似样本集合,根据每个样本的相似样本集合中任意两个样本之间的总相似度,得到每个样本的代表程度,从所有样本中选取预设数量的样本进行组合,获得若干种组合方式,根据每个样本的代表程度和任意两个样本之间的总相似度,得到每种组合方式中的样本选择优度,根据每种组合方式中的样本选择优度得到初始代表点;
根据初始代表点对所有样本进行聚类,得到若干个类簇,通过若干个类簇进行大学生宿舍的洗衣机故障检测。
进一步地,所述获取每个样本中每个维度数据在每个时刻的左邻域数据和右邻域数据,根据每个样本中所有维度数据在每个时刻的左邻域数据和右邻域数据之间的数据分布差异将每个样本划分为若干个阶段,包括的具体步骤如下:
将每个样本中每个维度数据的每个时刻左侧的个数据,记为每个样本中每个维度数据在每个时刻的左邻域数据,将每个样本中每个维度数据的每个时刻右侧的/>个数据,记为每个样本中每个维度数据在每个时刻的右邻域数据,其中,/>为预设第一参数;
根据每个样本中所有维度数据在每个时刻的左邻域数据和右邻域数据之间的数据分布差异,得到每个样本中每个时刻点为分段点的可能性;
以每个样本中的每个时刻点为局部窗口的中心点,以为局部窗口的大小,依次获取每个样本中的每个时刻点的局部窗口;将每个样本中的每个时刻点的局部窗口内所有时刻点为分段点的可能性最大的一个时刻点作为分段点,依次获取每个样本的所有分段点,根据每个样本的所有分段点将每个样本划分为若干个阶段。
进一步地,所述根据每个样本中所有维度数据在每个时刻的左邻域数据和右邻域数据之间的数据分布差异,得到每个样本中每个时刻点为分段点的可能性,包括的具体步骤如下:
将每个样本中的每个维度数据在每个时刻的左邻域中的所有数据的均值,记为每个样本中的每个维度数据在每个时刻的第一均值,将每个样本中的每个维度数据在每个时刻的右邻域中的所有数据的均值,记为每个样本中的每个维度数据在每个时刻的第二均值,将每个样本中的每个维度数据在每个时刻的第一均值和第二均值之间差值的绝对值,记为每个样本中的每个维度数据在每个时刻的第一绝对值,将每个样本中的所有维度数据在每个时刻的第一绝对值的均值,作为每个样本中每个时刻点为分段点的可能性。
进一步地,所述根据任意两个样本中不同阶段数据之间的相关系数差异、任意两个样本中不同阶段数据分布之间的差异,得到任意两个样本中不同阶段的数据之间的相似性,包括的具体步骤如下:
将每个样本中的每个阶段的每个维度的数据和另一个维度的数据之间的皮尔逊相关系数、与任意一个样本中的任意一个阶段的每个维度的数据和另一个维度的数据之间的皮尔逊相关系数之间差值的绝对值,记为每个维度的数据和另一个维度的数据之间第二绝对值,将每个维度的数据和其余所有维度的数据之间第二绝对值的均值,作为任意两个样本中的不同阶段的每个维度数据的相似性权重系数,将每个样本中的每个阶段的每个维度的所有数据的均值、与任意一个样本中的任意一个阶段的每个维度的所有数据的均值之间差值的绝对值,记为第三绝对值/>,将/>记为任意两个样本中的不同阶段的每个维度数据的第一数值,将任意两个样本中的不同阶段的所有维度数据的第一数值的均值,作为任意两个样本中不同阶段的数据之间的相似性;
其中,表示以自然常数为底的指数函数。
进一步地,所述根据任意两个样本中不同阶段的数据之间的相似性,得到任意两个样本之间的总相似度,包括的具体步骤如下:
根据两个样本中的阶段个数,将阶段个数最多的样本记为第一阶段样本,将阶段个数最少的样本记为第二阶段样本;
将第二阶段样本中每个阶段与第一阶段样本中所有阶段的数据之间的相似性的最大值,记为第二阶段样本中每个阶段与第一阶段样本的第二数值,将第二阶段样本中所有阶段与第一阶段样本的第二数值的均值,记为第二阶段样本和第一阶段样本之间的总相似度;
其中,当两个样本中的阶段个数相同时,两个样本都可以是第一阶段样本或者第二阶段样本。
进一步地,所述根据任意两个样本之间的总相似度获得每个样本的相似样本集合,包括的具体步骤如下:
对所有的任意两个样本之间的总相似度进行线性归一化,得到任意两个样本之间归一化后的总相似度;将每个样本与其它所有样本之间归一化后的总相似度大于预设第一阈值A的所有样本记为每个样本的相似样本,将每个样本的相似样本组成一个集合,记为每个样本的相似样本集合;
其中,A为预设第一阈值。
进一步地,所述根据每个样本的相似样本集合中任意两个样本之间的总相似度,得到每个样本的代表程度,包括的具体步骤如下:
将每个样本的相似样本集合中任意一个样本的相似样本集合中所有样本与任意一个样本之间的总相似度的累加和、与每个样本的相似样本集合中与任意一个样本之间的总相似度最低的样本的相似样本集合中所有样本与任意一个样本之间的总相似度最低的样本之间的总相似度的累加和、之间的差值的绝对值,记为每个样本的相似样本集合中任意一个样本的第三数值,将每个样本的相似样本集合中所有样本的第三数值的累加和,作为每个样本的代表程度。
进一步地,所述从所有样本中选取预设数量的样本进行组合,获得若干种组合方式,根据每个样本的代表程度和任意两个样本之间的总相似度,得到每种组合方式中的样本选择优度,根据每种组合方式中的样本选择优度得到初始代表点,包括的具体步骤如下:
从所有样本中随机选取个样本,进行组合,得到所有样本的组合方式;其中,/>为预设个数;
对所有样本的代表程度进行线性归一化,得到每个样本归一化后的代表程度,将每种组合方式中每个样本归一化后的代表程度与每种组合方式中其余任意一个样本归一化后的代表程度之和,记为每种组合方式中每个样本和其余任意一个样本之间的第四数值,将每种组合方式中每个样本和其余任意一个样本之间的总相似度,记为每种组合方式中每个样本和其余任意一个样本之间的第五数值,将/>记为每种组合方式中每个样本和其余任意一个样本之间的第六数值,将每种组合方式中每个样本和其余任意一个样本之间的第四数值与第六数值的乘积结果,记为每种组合方式中每个样本和其余任意一个样本之间的第一特征,将每种组合方式中每个样本和其余所有样本之间的第一特征的累加和,记为每种组合方式中每个样本的第二特征,将每种组合方式中所有样本的第二特征的累加和,作为每种组合方式中的样本选择优度;
选取所有组合方式中的样本作为初始代表点的选择优度最大的一种组合中的样本作为初始代表点。
进一步地,所述根据初始代表点对所有样本进行聚类,得到若干个类簇,通过若干个类簇进行大学生宿舍的洗衣机故障检测,包括的具体步骤如下:
根据初始代表点通过CURE聚类算法对所有的样本进行聚类,得到若干个类簇;
当每个类簇中的数据点个数少于预设第二阈值F时,则将类簇记为异常类簇;当每个类簇中的数据点个数大于或者等于预设第二阈值F时,则将类簇记为正常类簇;当所有类簇中出现异常类簇时,则判定大学生宿舍的洗衣机存在故障。
本发明还提供了基于物联网洗衣机在大学宿舍的洗衣服务提供系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项基于物联网洗衣机在大学宿舍的洗衣服务提供方法的步骤。
本发明的技术方案的有益效果是:本发明根据每个样本中所有维度数据在每个时刻的左邻域数据和右邻域数据之间的数据分布差异将每个样本划分为若干个阶段,根据任意两个样本中不同阶段数据之间的相关系数差异、任意两个样本中不同阶段数据分布之间的差异,得到任意两个样本中不同阶段的数据之间的相似性,提高了对不同阶段之间相似性判断的准确性;根据任意两个样本中不同阶段的数据之间的相似性,得到任意两个样本之间的总相似度,根据任意两个样本之间的总相似度获得每个样本的相似样本集合,提高了对不同样本之间相似性判断的准确性;根据每个样本的相似样本集合中任意两个样本之间的总相似度,得到每个样本的代表程度,获取所有样本的组合方式,根据每个样本的代表程度和任意两个样本之间的总相似度,得到每种组合方式中的样本选择优度,根据每种组合方式中的样本选择优度得到初始代表点;根据初始代表点对所有样本进行聚类,得到若干个类簇,通过若干个类簇进行大学生宿舍的洗衣机故障检测,优化了初始代表点选取的精度,提高了大学宿舍洗衣机的故障检测的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于物联网洗衣机在大学宿舍的洗衣服务提供方法的步骤流程图;
图2为大学生宿舍的洗衣机故障检测的流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的基于物联网洗衣机在大学宿舍的洗衣服务提供方法及系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的基于物联网洗衣机在大学宿舍的洗衣服务提供方法及系统的具体方案。
请参阅图1,其示出了本发明一个实施例提供的基于物联网洗衣机在大学宿舍的洗衣服务提供方法的步骤流程图,该方法包括以下步骤:
步骤S001:采集每次洗衣过程中若干个时刻的洗衣机数据,并获取连续多次洗衣过程的数据。
需要说明的是,为了分析大学宿舍洗衣机是否出现故障,因此需要采集多次洗衣时的洗衣机的数据,根据洗衣机的数据来进行分析,以此来判断大学宿舍的洗衣机有无故障情况。
具体地,以30秒为时间采样间隔,获取每次洗衣过程中洗衣机的电压数据、转速数据、振动数据和水位数据等维度的数据,再对/>维度的数据进行标准化预处理;将每次洗衣过程中的所有时刻的/>维度数据记为一个样本;再连续获取多次洗衣过程中的数据,即得到多个样本。其中,在本实施例中采集的样本个数为50,但是在本实施例中采集的样本个数不进行具体限定,实施者可根据具体情况而定。
其中,电压数据通过电压传感器进行采集,转速数据通过转速传感器进行采集,振动数据通过振动传感器进行采集,水位数据通过水位传感器进行采集。
至此,得到多个样本数据。
步骤S002:获取每个样本中每个维度数据在每个时刻的左邻域数据和右邻域数据,根据每个样本中所有维度数据在每个时刻的左邻域数据和右邻域数据之间的数据分布差异将每个样本划分为若干个阶段,根据任意两个样本中不同阶段数据之间的相关系数差异、任意两个样本中不同阶段数据分布之间的差异,得到任意两个样本中不同阶段的数据之间的相似性。
需要说明的是,在传统的CURE聚类算法中,在聚类时的初始代表点只是根据样本之间的距离获取的,并没有考虑洗衣过程中的各种洗衣状态;因此在本实施例了中将根据样本之间的洗衣状态来选取CURE聚类算法中的初始代表点。
进一步需要说明的是,在洗衣过程中会有主洗阶段、漂洗阶段、脱水阶段等多个不同的阶段,而由于模式的选择不同,不同的洗衣过程中对应阶段可能有所不同,又因为不同洗衣阶段之间的各种数据存在很大的差异,因此通过每个时刻的左邻域所有数据与右邻域所有数据之间的差异来分析每个时刻点为分段点的可能性。
具体地,预设一个第一参数,其中本实施例以/>为例进行叙述,本实施例不进行具体限定,其中/>可根据具体实施情况而定。
将每个样本中每个维度数据的每个时刻左侧的个数据,记为每个样本中每个维度数据在每个时刻的左邻域数据,将每个样本中每个维度数据的每个时刻右侧的/>个数据,记为每个样本中每个维度数据在每个时刻的右邻域数据。至此,得到每个样本中每个维度数据在每个时刻的左邻域数据和右邻域数据。
根据每个样本中所有维度数据在每个时刻的左邻域数据和右邻域数据之间的数据分布差异,得到每个样本中每个时刻点为分段点的可能性,作为一种实施例,具体计算方法为:
式中,表示第/>个样本中的第/>维度数据在第/>个时刻的右邻域中的所有数据的均值,/>表示第/>个样本中的第/>维度数据在第/>个时刻的左邻域中的所有数据的均值,/>表示每个样本中的所有维度的个数,/>表示每个样本中第/>个时刻点为分段点的可能性,/>为绝对值符号。
其中,表示每个样本中所有维度数据在每个时刻的左邻域数据的均值和右邻域数据的均值之间的差异,当该差异越大时,则表示每个样本中的每个时刻点为分段点的可能性越大;当该差异越小时,则表示每个样本中的每个时刻点为分段点的可能性越小。其中,差异表示差值的绝对值。
以每个样本中的每个时刻点为局部窗口的中心点,以为局部窗口的大小,依次获取每个样本中的每个时刻点的局部窗口;将每个样本中的每个时刻点的局部窗口内所有时刻点为分段点的可能性最大的一个时刻点作为分段点,依次获取每个样本的所有分段点。其中,每个样本中的每个时刻点的局部窗口的左侧数据个数等于右侧数据个数等于/>。
根据每个样本的所有分段点将每个样本划分为若干个阶段。
需要说明的是,由于在洗衣过程中存在多个不同的阶段,因此根据每个样本中同一阶段的不同维度数据之间的相关系数来分析每个阶段的异常情况,当同一阶段的不同维度数据之间的相关系数越小,则洗衣机存在故障的可能性越大,当同一阶段的不同维度数据之间的相关系数越大,则洗衣机存在故障的可能性越小。
进一步需要说明的是,当任意两个样本中的两个阶段数据之间的相关性差异越大,则说明两个阶段数据之间的相似性越低,当任意两个样本中的两个阶段数据之间的相关性差异越小,则说明两个阶段数据之间的相似性越高;当任意两个样本中的两个阶段数据分布之间的差异越大,则说明两个阶段数据之间的相似性越低,当任意两个样本中的两个阶段数据分布之间的差异越小,则说明两个阶段数据之间的相似性越高。
具体地,根据任意两个样本中不同阶段数据之间的相关系数差异、任意两个样本中不同阶段数据分布之间的差异,得到任意两个样本中不同阶段的数据之间的相似性,作为一种实施例,具体计算方法为:
式中,表示每个样本中的每个阶段的第/>维度的数据和第/>维度的数据之间的皮尔逊相关系数,/>表示任意一个样本中的任意一个阶段的第/>维度的数据和第/>维度的数据之间的皮尔逊相关系数,/>表示任意两个样本中不同阶段的第/>维度数据的相似性权重系数,/>表示每个样本中的每个阶段的第/>维度的所有数据的均值,/>表示任意一个样本中的任意一个阶段的第/>维度的所有数据的均值,/>表示任意两个样本中不同阶段的数据之间的相似性,/>表示每个样本中的所有维度的个数,/>为绝对值符号,/>表示以自然常数为底的指数函数。其中,皮尔逊相关系数的获取过程为公知技术,此处不再进行具体赘述。
其中,表示任意两个样本中不同阶段的两个维度的数据之间的皮尔逊相关系数的差异,当该差异越小,则说明两个阶段数据之间的相似性越大;当该差异越大,则说明两个阶段数据之间的相似性越小。/>表示任意两个样本中不同阶段的统一维度的所有数据的均值之间的差异,当该差异越小,则说明两个阶段数据之间的相似性越大;当该差异越大,则说明两个阶段数据之间的相似性越小。
至此,得到任意两个样本中不同阶段的数据之间的相似性。
步骤S003:根据任意两个样本中不同阶段的数据之间的相似性,得到任意两个样本之间的总相似度,根据任意两个样本之间的总相似度获得每个样本的相似样本集合,根据每个样本的相似样本集合中任意两个样本之间的总相似度,得到每个样本的代表程度,从所有样本中选取预设数量的样本进行组合,获得若干种组合方式,根据每个样本的代表程度和任意两个样本之间的总相似度,得到每种组合方式中的样本选择优度,根据每种组合方式中的样本选择优度得到初始代表点。
需要说明的是,由于不同阶段之间存在差异,因此不能只根据样本之间的时间差异作为其聚类的距离进行分析,这样会降低每个样本附近样本数据的密度的计算;因此还要根据不同阶段之间的相似性来分析获取任意两个样本之间的距离,则来确定出每个样本附近样本数据的密度,以此提高聚类时初始代表点的选取的准确性。
进一步需要说明的是,由于每个样本中有多个阶段,因此需要根据两个样本中的多个阶段中的两个阶段数据之间的相似性来确定出两个样本之间的总相似度。
具体地,根据任意两个样本中不同阶段的数据之间的相似性,得到任意两个样本之间的总相似度,作为一种实施例,具体计算方法为:
式中,表示第/>个样本中的第/>个阶段和第/>个样本中的第/>个阶段的数据之间的相似可能性,/>表示第/>个样本中的所有阶段的个数,/>表示第/>个样本中的所有阶段的个数,/>表示第/>个样本中的第/>个阶段和第/>个样本中的所有阶段的数据之间的相似可能性的最大值,/>表示第/>个样本中的所有阶段和第/>个样本中的第/>个阶段的数据之间的相似可能性的最大值,/>表示第/>个样本和第/>个样本之间的总相似度。
预设一个第一阈值A,其中本实施例以A=0.8为例进行叙述,本实施例不进行具体限定,其中A可根据具体实施情况而定。对所有的任意两个样本之间的总相似度进行线性归一化,得到任意两个样本之间归一化后的总相似度;将每个样本与其它所有样本之间归一化后的总相似度大于预设第一阈值A的所有样本记为每个样本的相似样本。将每个样本的相似样本组成一个集合,记为每个样本的相似样本集合。
根据每个样本的相似样本集合中任意两个样本之间的总相似度,得到每个样本的代表程度,作为一种实施例,具体计算方法为:
式中,表示第/>个样本的相似样本集合中第/>个样本的相似样本集合中第/>个样本与第/>个样本之间的总相似度,/>表示第/>个样本的相似样本集合中第/>个样本的相似样本集合中第/>个样本与第/>个样本之间的总相似度,其中,第/>个样本是和第/>个样本之间的总相似度最低的样本;/>表示每个样本的相似样本集合中第/>个样本的相似样本集合中所有样本的个数,/>表示每个样本的相似样本集合中第/>个样本的相似样本集合中所有样本的个数,/>表示每个样本的相似样本集合中所有样本的个数,/>表示第/>个样本的代表程度,/>为绝对值符号。
其中,表示每个样本的相似样本集合中任意一个样本的相似样本集合中所有样本与任意一个样本之间的总相似度的累加、与任意一个样本的相似样本集合中每个样本的相似样本集合中所有样本与每个样本之间的总相似度的累加之间的差异,当该差异越大,则该样本周围样本的密度越大,则该样本作为初始代表点的可能性越大;当该差异越小,则该样本周围样本的密度越小,则该样本作为初始代表点的可能性越小。
至此,得到每个样本的代表程度。
需要说明的是,当每个样本的代表程度越大,表示该样本的作为初始代表点的可能性越大,当每个样本的代表程度越小,表示该样本的作为初始代表点的可能性越小。为了让各个初始代表点都具有代表每个类簇的特征,则类簇之间尽可能的要差异越大越好,因此应该让各个初始代表点之间的相似度越低越好,即越具有代表性。
具体地,预设个数,其中本实施例以/>为例进行叙述,本实施例不进行具体限定,其中/>可根据具体实施情况而定。从所有样本中随机选取/>个样本,进行组合,得到所有样本的组合方式。
根据每个样本的代表程度和任意两个样本之间的总相似度,得到每种组合方式中的样本选择优度,作为一种实施例,具体计算方法为:
式中,表示每种组合方式中第/>个样本的代表程度,/>表示每种组合方式中第/>个样本的代表程度,/>表示每种组合方式中第/>个样本和第/>个样本之间的总相似度,/>为预设个数,表示每种组合方式中的所有样本的个数,/>表示每种组合方式中的样本选择优度,/>表示线性归一化函数。
其中,当每种组合方式中的样本的代表程度越大,任意两个样本之间的总相似度越小,则每种组合方式中的样本选择优度就越大;当每种组合方式中的样本的代表程度越小,任意两个样本之间的总相似度越大,则每种组合方式中的样本选择优度就越小。
选取所有组合方式中的样本作为初始代表点的选择优度最大的一种组合中的样本作为初始代表点。
至此,得到初始代表点。
步骤S004:根据初始代表点对所有样本进行聚类,得到若干个类簇,通过若干个类簇进行大学生宿舍的洗衣机故障检测。
根据初始代表点通过CURE聚类算法对所有的样本进行聚类,得到若干个类簇;其中,CURE聚类算法为公知技术,此处不再进行赘述。
预设一个第二阈值F,其中本实施例以F=3为例进行叙述,本实施例不进行具体限定,其中F可根据具体实施情况而定。
当每个类簇中的数据点个数少于预设第二阈值F时,则将类簇记为异常类簇;当每个类簇中的数据点个数大于或者等于预设第二阈值F时,则将类簇记为正常类簇。当所有类簇中出现异常类簇时,则判定大学生宿舍的洗衣机存在故障。其大学生宿舍的洗衣机故障检测的流程图如图2所示。
至此,本实施例完成。
需要说明的是,本实施例中所用的模型仅用于表示负相关关系和约束模型输出的结果处于/>区间内,具体实施时,可替换成具有同样目的的其他模型,本实施例只是以/>模型为例进行叙述,不对其做具体限定,其中/>是指该模型的输入。
本实施例提供了基于物联网洗衣机在大学宿舍的洗衣服务提供系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现步骤S001至步骤S004中的基于物联网洗衣机在大学宿舍的洗衣服务提供方法。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.基于物联网洗衣机在大学宿舍的洗衣服务提供方法,其特征在于,该方法包括以下步骤:
采集每次洗衣过程中若干个时刻的多种洗衣机数据,将每次洗衣过程中若干个时刻的多种洗衣机数据记为一个样本,并连续获取多个样本,将多种洗衣机数据中的一种数据记为一个维度数据;
获取每个样本中每个维度数据在每个时刻的左邻域数据和右邻域数据,根据每个样本中所有维度数据在每个时刻的左邻域数据和右邻域数据之间的数据分布差异将每个样本划分为若干个阶段,根据任意两个样本中不同阶段数据之间的相关系数差异、任意两个样本中不同阶段数据分布之间的差异,得到任意两个样本中不同阶段的数据之间的相似性;
根据任意两个样本中不同阶段的数据之间的相似性,得到任意两个样本之间的总相似度,根据任意两个样本之间的总相似度获得每个样本的相似样本集合,根据每个样本的相似样本集合中任意两个样本之间的总相似度,得到每个样本的代表程度,从所有样本中选取预设数量的样本进行组合,获得若干种组合方式,根据每个样本的代表程度和任意两个样本之间的总相似度,得到每种组合方式中的样本选择优度,根据每种组合方式中的样本选择优度得到初始代表点;
根据初始代表点对所有样本进行聚类,得到若干个类簇,通过若干个类簇进行大学生宿舍的洗衣机故障检测。
2.根据权利要求1所述基于物联网洗衣机在大学宿舍的洗衣服务提供方法,其特征在于,所述获取每个样本中每个维度数据在每个时刻的左邻域数据和右邻域数据,根据每个样本中所有维度数据在每个时刻的左邻域数据和右邻域数据之间的数据分布差异将每个样本划分为若干个阶段,包括的具体步骤如下:
将每个样本中每个维度数据的每个时刻左侧的个数据,记为每个样本中每个维度数据在每个时刻的左邻域数据,将每个样本中每个维度数据的每个时刻右侧的/>个数据,记为每个样本中每个维度数据在每个时刻的右邻域数据,其中,/>为预设第一参数;
根据每个样本中所有维度数据在每个时刻的左邻域数据和右邻域数据之间的数据分布差异,得到每个样本中每个时刻点为分段点的可能性;
以每个样本中的每个时刻点为局部窗口的中心点,以为局部窗口的大小,依次获取每个样本中的每个时刻点的局部窗口;将每个样本中的每个时刻点的局部窗口内所有时刻点为分段点的可能性最大的一个时刻点作为分段点,依次获取每个样本的所有分段点,根据每个样本的所有分段点将每个样本划分为若干个阶段。
3.根据权利要求2所述基于物联网洗衣机在大学宿舍的洗衣服务提供方法,其特征在于,所述根据每个样本中所有维度数据在每个时刻的左邻域数据和右邻域数据之间的数据分布差异,得到每个样本中每个时刻点为分段点的可能性,包括的具体步骤如下:
将每个样本中的每个维度数据在每个时刻的左邻域中的所有数据的均值,记为每个样本中的每个维度数据在每个时刻的第一均值,将每个样本中的每个维度数据在每个时刻的右邻域中的所有数据的均值,记为每个样本中的每个维度数据在每个时刻的第二均值,将每个样本中的每个维度数据在每个时刻的第一均值和第二均值之间差值的绝对值,记为每个样本中的每个维度数据在每个时刻的第一绝对值,将每个样本中的所有维度数据在每个时刻的第一绝对值的均值,作为每个样本中每个时刻点为分段点的可能性。
4.根据权利要求1所述基于物联网洗衣机在大学宿舍的洗衣服务提供方法,其特征在于,所述根据任意两个样本中不同阶段数据之间的相关系数差异、任意两个样本中不同阶段数据分布之间的差异,得到任意两个样本中不同阶段的数据之间的相似性,包括的具体步骤如下:
将每个样本中的每个阶段的每个维度的数据和另一个维度的数据之间的皮尔逊相关系数、与任意一个样本中的任意一个阶段的每个维度的数据和另一个维度的数据之间的皮尔逊相关系数之间差值的绝对值,记为每个维度的数据和另一个维度的数据之间第二绝对值,将每个维度的数据和其余所有维度的数据之间第二绝对值的均值,作为任意两个样本中的不同阶段的每个维度数据的相似性权重系数,将每个样本中的每个阶段的每个维度的所有数据的均值、与任意一个样本中的任意一个阶段的每个维度的所有数据的均值之间差值的绝对值,记为第三绝对值/>,将/>记为任意两个样本中的不同阶段的每个维度数据的第一数值,将任意两个样本中的不同阶段的所有维度数据的第一数值的均值,作为任意两个样本中不同阶段的数据之间的相似性;
其中,表示以自然常数为底的指数函数。
5.根据权利要求1所述基于物联网洗衣机在大学宿舍的洗衣服务提供方法,其特征在于,所述根据任意两个样本中不同阶段的数据之间的相似性,得到任意两个样本之间的总相似度,包括的具体步骤如下:
根据两个样本中的阶段个数,将阶段个数最多的样本记为第一阶段样本,将阶段个数最少的样本记为第二阶段样本;
将第二阶段样本中每个阶段与第一阶段样本中所有阶段的数据之间的相似性的最大值,记为第二阶段样本中每个阶段与第一阶段样本的第二数值,将第二阶段样本中所有阶段与第一阶段样本的第二数值的均值,记为第二阶段样本和第一阶段样本之间的总相似度;
其中,当两个样本中的阶段个数相同时,两个样本都可以是第一阶段样本或者第二阶段样本。
6.根据权利要求1所述基于物联网洗衣机在大学宿舍的洗衣服务提供方法,其特征在于,所述根据任意两个样本之间的总相似度获得每个样本的相似样本集合,包括的具体步骤如下:
对所有的任意两个样本之间的总相似度进行线性归一化,得到任意两个样本之间归一化后的总相似度;将每个样本与其它所有样本之间归一化后的总相似度大于预设第一阈值A的所有样本记为每个样本的相似样本,将每个样本的相似样本组成一个集合,记为每个样本的相似样本集合;
其中,A为预设第一阈值。
7.根据权利要求1所述基于物联网洗衣机在大学宿舍的洗衣服务提供方法,其特征在于,所述根据每个样本的相似样本集合中任意两个样本之间的总相似度,得到每个样本的代表程度,包括的具体步骤如下:
将每个样本的相似样本集合中任意一个样本的相似样本集合中所有样本与任意一个样本之间的总相似度的累加和、与每个样本的相似样本集合中与任意一个样本之间的总相似度最低的样本的相似样本集合中所有样本与任意一个样本之间的总相似度最低的样本之间的总相似度的累加和、之间的差值的绝对值,记为每个样本的相似样本集合中任意一个样本的第三数值,将每个样本的相似样本集合中所有样本的第三数值的累加和,作为每个样本的代表程度。
8.根据权利要求1所述基于物联网洗衣机在大学宿舍的洗衣服务提供方法,其特征在于,所述从所有样本中选取预设数量的样本进行组合,获得若干种组合方式,根据每个样本的代表程度和任意两个样本之间的总相似度,得到每种组合方式中的样本选择优度,根据每种组合方式中的样本选择优度得到初始代表点,包括的具体步骤如下:
从所有样本中随机选取个样本,进行组合,得到所有样本的组合方式;其中,/>为预设个数;
对所有样本的代表程度进行线性归一化,得到每个样本归一化后的代表程度,将每种组合方式中每个样本归一化后的代表程度与每种组合方式中其余任意一个样本归一化后的代表程度之和,记为每种组合方式中每个样本和其余任意一个样本之间的第四数值,将每种组合方式中每个样本和其余任意一个样本之间的总相似度,记为每种组合方式中每个样本和其余任意一个样本之间的第五数值,将/>记为每种组合方式中每个样本和其余任意一个样本之间的第六数值,将每种组合方式中每个样本和其余任意一个样本之间的第四数值与第六数值的乘积结果,记为每种组合方式中每个样本和其余任意一个样本之间的第一特征,将每种组合方式中每个样本和其余所有样本之间的第一特征的累加和,记为每种组合方式中每个样本的第二特征,将每种组合方式中所有样本的第二特征的累加和,作为每种组合方式中的样本选择优度;
选取所有组合方式中的样本作为初始代表点的选择优度最大的一种组合中的样本作为初始代表点。
9.根据权利要求1所述基于物联网洗衣机在大学宿舍的洗衣服务提供方法,其特征在于,所述根据初始代表点对所有样本进行聚类,得到若干个类簇,通过若干个类簇进行大学生宿舍的洗衣机故障检测,包括的具体步骤如下:
根据初始代表点通过CURE聚类算法对所有的样本进行聚类,得到若干个类簇;
当每个类簇中的数据点个数少于预设第二阈值F时,则将类簇记为异常类簇;当每个类簇中的数据点个数大于或者等于预设第二阈值F时,则将类簇记为正常类簇;当所有类簇中出现异常类簇时,则判定大学生宿舍的洗衣机存在故障。
10.基于物联网洗衣机在大学宿舍的洗衣服务提供系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-9任意一项所述基于物联网洗衣机在大学宿舍的洗衣服务提供方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410396230.8A CN117992811B (zh) | 2024-04-03 | 一种大学宿舍物联网洗衣机的故障检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410396230.8A CN117992811B (zh) | 2024-04-03 | 一种大学宿舍物联网洗衣机的故障检测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117992811A true CN117992811A (zh) | 2024-05-07 |
CN117992811B CN117992811B (zh) | 2024-06-28 |
Family
ID=
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106844692A (zh) * | 2017-01-23 | 2017-06-13 | 武汉万般上品信息技术有限公司 | 一种面向大数据中任意形状数据簇的快速聚类方法 |
CN111737431A (zh) * | 2020-06-19 | 2020-10-02 | 海尔优家智能科技(北京)有限公司 | 设备异常的处理方法及装置、存储介质、电子装置 |
CN112948345A (zh) * | 2021-04-15 | 2021-06-11 | 苏州数海长云数据信息科技有限公司 | 一种基于云计算平台的大数据聚类方法 |
US20210365478A1 (en) * | 2020-05-19 | 2021-11-25 | Hewlett Packard Enterprise Development Lp | Updating data models to manage data driftand outliers |
US20220066533A1 (en) * | 2019-02-06 | 2022-03-03 | Tohoku University | Clustering device and clustering method |
CN116701973A (zh) * | 2023-08-09 | 2023-09-05 | 无锡市明通动力工业有限公司 | 基于大数据的电机异常振动检测预警方法 |
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106844692A (zh) * | 2017-01-23 | 2017-06-13 | 武汉万般上品信息技术有限公司 | 一种面向大数据中任意形状数据簇的快速聚类方法 |
US20220066533A1 (en) * | 2019-02-06 | 2022-03-03 | Tohoku University | Clustering device and clustering method |
US20210365478A1 (en) * | 2020-05-19 | 2021-11-25 | Hewlett Packard Enterprise Development Lp | Updating data models to manage data driftand outliers |
CN111737431A (zh) * | 2020-06-19 | 2020-10-02 | 海尔优家智能科技(北京)有限公司 | 设备异常的处理方法及装置、存储介质、电子装置 |
CN112948345A (zh) * | 2021-04-15 | 2021-06-11 | 苏州数海长云数据信息科技有限公司 | 一种基于云计算平台的大数据聚类方法 |
CN116701973A (zh) * | 2023-08-09 | 2023-09-05 | 无锡市明通动力工业有限公司 | 基于大数据的电机异常振动检测预警方法 |
Non-Patent Citations (2)
Title |
---|
卢鹏丽;王祖东;: "密度敏感的层次化聚类算法研究", 计算机工程与应用, 13 November 2012 (2012-11-13) * |
李海林;魏苗;: "基于近邻传播的限定簇数聚类方法研究", 电子科技大学学报, no. 05, 30 September 2018 (2018-09-30) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111314353B (zh) | 一种基于混合采样的网络入侵检测方法及系统 | |
CN109873779B (zh) | 一种基于lstm的分级式无线信号调制类型识别方法 | |
CN115412455B (zh) | 一种基于时间序列的服务器多性能指标异常检测方法及装置 | |
WO2020108159A1 (zh) | 一种网络故障根因检测方法、系统及存储介质 | |
CN113569903A (zh) | 数控机床刀具磨损预测方法、系统、设备、介质、终端 | |
CN109934301B (zh) | 一种电力负荷聚类分析方法、装置和设备 | |
CN117077044B (zh) | 一种发电机用真空断路器故障判别方法及装置 | |
CN112070208B (zh) | 基于编码器-解码器阶段注意力机制的刀具磨损预测方法 | |
CN108280236A (zh) | 一种基于LargeVis的随机森林可视化数据分析方法 | |
CN110795690A (zh) | 风电场运行异常数据检测方法 | |
CN112101765A (zh) | 一种配电网运行指标数据异常数据处理方法及系统 | |
CN113255591A (zh) | 一种基于随机森林和融合特征的轴承故障诊断方法 | |
CN115112372A (zh) | 轴承故障诊断方法、装置、电子设备及存储介质 | |
CN116383743A (zh) | 基于机器学习的光伏运行异常检测方法及系统 | |
CN117992811B (zh) | 一种大学宿舍物联网洗衣机的故障检测方法及系统 | |
CN117992811A (zh) | 基于物联网洗衣机在大学宿舍的洗衣服务提供方法及系统 | |
CN117010442A (zh) | 设备剩余寿命预测模型训练方法、剩余寿命预测方法及系统 | |
CN109508350B (zh) | 一种对数据进行采样的方法和装置 | |
Jia et al. | Bearing fault diagnosis method based on CNN-LightGBM | |
CN115017988A (zh) | 一种用于状态异常诊断的竞争聚类方法 | |
CN112269778B (zh) | 一种设备故障诊断方法 | |
CN111343165B (zh) | 基于birch和smote的网络入侵检测方法及系统 | |
CN114528906A (zh) | 一种旋转机械的故障诊断方法、装置、设备和介质 | |
CN110942089A (zh) | 一种基于多级决策的击键识别方法 | |
CN115269583B (zh) | 一种用于大数据处理的无监督清洗方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |