CN118134539A - 基于智慧厨房多源数据融合的用户行为预测方法 - Google Patents
基于智慧厨房多源数据融合的用户行为预测方法 Download PDFInfo
- Publication number
- CN118134539A CN118134539A CN202410545224.4A CN202410545224A CN118134539A CN 118134539 A CN118134539 A CN 118134539A CN 202410545224 A CN202410545224 A CN 202410545224A CN 118134539 A CN118134539 A CN 118134539A
- Authority
- CN
- China
- Prior art keywords
- data
- value
- sequence
- characteristic
- obtaining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000004927 fusion Effects 0.000 title claims abstract description 20
- 238000012512 characterization method Methods 0.000 claims abstract description 102
- 238000012544 monitoring process Methods 0.000 claims abstract description 70
- 238000005070 sampling Methods 0.000 claims abstract description 54
- 230000006399 behavior Effects 0.000 claims description 35
- 238000012937 correction Methods 0.000 claims description 23
- 238000013507 mapping Methods 0.000 claims description 15
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 3
- 230000002159 abnormal effect Effects 0.000 description 26
- 238000012216 screening Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及数据处理技术领域,具体涉及一种基于智慧厨房多源数据融合的用户行为预测方法;根据预设步长对数据监测序列采样获得采样序列;根据采样序列中的数据变化特征获得最优窗口长度;根据数据监测序列中数据点的最优窗口长度范围内的数据种类特征获得离散表征值;根据离散表征值的概率密度函数曲线与正态分布曲线的相似程度获得曲线相似度;根据离散表征值和曲线相似度获得子特征数据段。本发明根据子特征数据段中的数据波动特征获得波动数据点和去噪数据序列;根据多源特征的去噪数据序列进行用户行为预测,提高了去噪准确性和用户行为预测的精确性。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种基于智慧厨房多源数据融合的用户行为预测方法。
背景技术
随着科技的发展,智慧厨房广泛应用于家庭和商业场所;智慧厨房通过集成各种传感器、设备和控制系统,实现对厨房环境的智能监测和控制。智慧厨房通过日常采集的各种数据例如温度、湿度和设备能耗,能够对用户的使用行为进行预测,提高用户的使用体验。
智慧厨房采集的数据中通常存在异常数据,异常数据可能是由于传感器异常、噪声和用户的操作失误引起,异常数据会对用户行为的预测准确性造成下降,故在预测时需要对异常数据修改。异常数据的传统筛选方法通过聚类,通过聚类筛选出孤立数据点作为异常数据;但聚类过程是基于全局整体数据,而智慧厨房中的数据是存在变化趋势的,可能出现部分正常变化的数据被认为异常数据而被修改,导致用户行为的预测准确性低。
发明内容
为了解决上述通过聚类方法筛选异常数据,导致用户行为的预测准确性低的技术问题,本发明的目的在于提供一种基于智慧厨房多源数据融合的用户行为预测方法,所采用的技术方案具体如下:
获取智慧厨房多源特征的数据监测序列;根据预设步长对所述数据监测序列进行采样获得采样序列;根据所述采样序列中的数据变化特征获得最优窗口长度;
根据所述数据监测序列中数据点的最优窗口长度范围内的数据种类特征获得离散表征值;根据所述离散表征值的分布特征获得离散表征值的概率密度函数曲线和对应位置的正态分布曲线;根据所述概率密度函数曲线与所述正态分布曲线的相似程度获得曲线相似度;
根据所述离散表征值的数据特征和所述曲线相似度获得划分数据点;根据所述划分数据点对数据监测序列进行划分获得子特征数据段;根据所述子特征数据段中的数据波动特征获得波动数据点;
对波动数据点去噪获得去噪数据序列;根据多源特征的去噪数据序列进行用户行为预测。
进一步地,所述根据预设步长对所述数据监测序列进行采样获得采样序列的步骤包括:
根据所述预设步长的长度间隔对所述数据监测序列进行采样,获得预设步长数量个采样序列。
进一步地,所述根据所述采样序列中的数据变化特征获得最优窗口长度的步骤包括:
获得所述采样序列的差分序列,计算所述差分序列中数据出现频率最低的出现次数,获得最小频率表征值;计算所述差分序列中众数对应的数值数量与所述最小频率表征值的差值并归一化,获得数据分布特征值;计算所述差分序列中不同种类数据数值的方差并负相关映射,获得差异特征值;
计算所述数据分布特征值与所述差异特征值的乘积,获取采样特征值;计算所述预设步长对应的采样序列的采样特征值的平均值,获得所述预设步长的步长适宜值;选取步长适宜值最大值对应的预设步长作为所述最优窗口长度。
进一步地,所述根据所述数据监测序列中数据点的最优窗口长度范围内的数据种类特征获得离散表征值的步骤包括:
在所述数据监测序列中以所述数据点为窗口起点,计算所述数据点的最优窗口长度范围内数据数值的信息熵,获得所述数据点的离散表征值。
进一步地,所述根据所述概率密度函数曲线与所述正态分布曲线的相似程度获得曲线相似度的步骤包括:
根据DTW算法计算所述概率密度函数曲线与所述正态分布曲线的动态时间规整距离并负相关映射,获得所述曲线相似度。
进一步地,所述根据所述离散表征值的数据特征和所述曲线相似度获得划分数据点的步骤包括:
计算任意离散表征值与离散表征值的平均值的差值绝对值,获得所述任意离散表征值的差异程度;当所述曲线相似度超过预设相似阈值时;计算预设第一常数与所述离散表征值的标准差的乘积,获得划分表征值;若所述差异程度超过所述划分表征值时,所述任意离散表征值对应的数据点为划分数据点;
当所述曲线相似度不超过预设相似阈值时,计算所述预设相似阈值与曲线相似度的差值并负相关映射,获取修正系数;计算预设第一常数和预设第二常数的差值,获得标准差参数区间;计算所述标准差参数区间和所述修正系数的乘积,获取标准差修正程度;计算所述标准差修正程度和所述预设第二常数的和值,获取修正标准差参数;计算所述修正标准差参数和所述离散表征值的标准差的乘积;获取修正划分表征值;当所述差异程度超过所述修正划分表征值时,所述任意离散表征值对应的数据点为划分数据点。
进一步地,所述根据所述划分数据点对数据监测序列进行划分获得子特征数据段的步骤包括:
在所述数据监测序列中根据任意相邻的划分数据点之间的数据区间作为所述子特征数据段。
进一步地,所述根据所述子特征数据段中的数据波动特征获得波动数据点的步骤包括:
根据聚类算法对所述子特征数据段中的数据点进行聚类,获得聚类中心、聚类空间中数据点之间的特征距离;对于子特征数据段中任意数据点,将所述任意数据点与聚类中心的特征距离正相关映射,获得距离表征值;
在聚类空间中计算所述任意数据点的预设半径范围内的其他数据点的数量,获得所述任意数据点的邻域特征值;计算所述子特征数据段的数据点数量与所述邻域特征值的差值,获得所述任意数据点的偏离指数;计算所述偏离指数与所述子特征数据段的数据点数量的比值并负相关映射,获得偏离特征值;
计算所述距离表征值与所述偏离特征值的乘积,获得所述任意数据点的目标程度;当所述目标程度超过预设目标程度阈值时,所述任意数据点为波动数据点。
进一步地,所述对波动数据点去噪获得去噪数据序列的步骤包括:
根据所述波动数据点所在子特征数据段的数据特征通过移动平均算法对所述波动数据点进行去噪,获得去噪数据点,将所述数据监测序列中的波动数据点替换为对应的去噪数据点,获得所述去噪数据序列。
进一步地,所述根据多源特征的去噪数据序列进行用户行为预测的步骤包括:
将不同特征的去噪数据序列融合成多维特征去噪数据序列,通过神经网络算法对所述多维特征去噪序列进行数据预测获得特征预测数据,根据所述特征预测数据对用户行为进行预测。
本发明具有如下有益效果:
在本发明中,获取采样序列能够反映数据监测序列的变化趋势的长度,获取最优窗口长度能够表征数据监测序列的一个变化趋势的大概长度,从而提高离散表征值的计算准确性,降低离散表征值因窗口选取不合适导致的数据误差;获取离散表征值能够为划分数据监测序列提供基础,提高划分准确性。根据概率密度函数曲线和正态分布曲线的曲线相似度能够反映离散表征值的分布特征符合正态分布特征的程度,基于曲线相似度能够提高划分数据点的选取准确性,进而获得合适的子特征数据段,为异常数据的筛选提供可靠基础,保证了去噪效果。获取波动数据点能够准确地将数据监测序列中异常数据筛选出来,进一步提供了去噪准确性,最终保证了用户行为预测的精确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种基于智慧厨房多源数据融合的用户行为预测方法流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于智慧厨房多源数据融合的用户行为预测方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种基于智慧厨房多源数据融合的用户行为预测方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种基于智慧厨房多源数据融合的用户行为预测方法流程图,该方法包括以下步骤:
步骤S1,获取智慧厨房多源特征的数据监测序列;根据预设步长对数据监测序列进行采样获得采样序列;根据采样序列中的数据变化特征获得最优窗口长度。
在本发明实施例中,实施场景为对智慧厨房采集的数据进行筛选去噪后对用户行为预测;首先获取智慧厨房多源特征的数据监测序列,通过不同传感器进行采集,例如不同家电的温度数据、湿度和功率变化数据等,实施者可根据实施场景自行确定采集对象和采集频率,将每个采集对象的时间数据序列作为一维特征的数据监测序列,多个采集对象的时间数据序列组合为多源特征的数据监测序列,每个特征的数据监测序列的去噪步骤相同。
获取的数据监测序列中存在一定的异常数据,导致用户行为预测的准确性降低,故在预测过程中需要首先将异常数据进行修正;聚类是现有传统的异常数据检测方法,通过数据点的数据特征根据聚类算法筛选出孤立的异常数据点,但聚类过程是基于数据监测序列中的所有数据筛选异常数据点,而智慧厨房中的数据监测序列中的数据是存在变化周期的,不同时刻的数据会存在一定的差异,使得聚类算法难以筛选出准确的异常数据点。为了提高异常数据点的筛选准确性,则需要区分数据监测序列中不同的变化趋势,在每个变化趋势的数据段中进行异常数据点的筛选;首先分析数据监测序列的不同的变化趋势的长度,故根据预设步长对数据监测序列进行采样获得采样序列。
优选地,在本发明一个实施例中,获取采样序列的步骤包括:根据预设步长的长度间隔对数据监测序列进行采样,获得预设步长数量个采样序列;实施者可根据实施场景自行确定预设步长的取值范围。例如预设步长为3,则以数据监测序列中第一个数据点开始采样,然后间隔3个数据点采样第4个数据点,直至遍历数据监测序列后获得第一个采样序列;以数据监测序列中第二个数据点开始采样,然后间隔3个数据点采样第5个数据点,直至遍历数据监测序列后获得第二个采样序列;同理以数据监测序列中第三个数据点开始采样获得第三个采样序列,当预设步长为3时,共获得3个不同的采样序列。
进一步地,若预设步长的选取越符合一个变化趋势的长度时,则采样序列中的数据越相似,故可根据采样序列中的数据变化特征获得最优窗口长度,具体包括:获得采样序列的差分序列,需要说明的是,差分序列属于现有技术,获取步骤不再赘述;计算差分序列中数据出现频率最低的出现次数,获得最小频率表征值;计算差分序列中众数对应的数值数量与最小频率表征值的差值并归一化,获得数据分布特征值;当该预设步长越接近一个变化趋势的长度时,则众数对应的数值数量越大,最小频率表征值越小,数据分布特征值越大。计算差分序列中不同种类数据数值的方差并负相关映射,获得差异特征值;当预设步长越接近一个变化趋势的长度时,差分序列中的不同种类的数据数值越接近,方差越小,差异特征值越大。计算数据分布特征值与差异特征值的乘积,获取采样特征值,采样特征值越大,意味着该预设步长越接近一个变化趋势的长度;计算该预设步长对应的采样序列的采样特征值的平均值,获得该预设步长的步长适宜值;选取步长适宜值最大值对应的预设步长作为最优窗口长度;该最优窗口长度最符合数据监测序列中一个变化趋势的长度。
步骤S2,根据数据监测序列中数据点的最优窗口长度范围内的数据种类特征获得离散表征值;根据离散表征值的分布特征获得离散表征值的概率密度函数曲线和对应位置的正态分布曲线;根据概率密度函数曲线与正态分布曲线的相似程度获得曲线相似度。
获得数据监测序列中的变化趋势的最优窗口长度后,则可对数据监测序列进行划分,将不同变化趋势的数据段进行分割;不同变化趋势中的数据差异较大,故可根据数据监测序列中数据点的最优窗口长度范围内的数据种类特征获得离散表征值。
优选地,在本发明一个实施例中,获取离散表征值包括:在数据监测序列中以数据点为窗口起点,计算该数据点的最优窗口长度范围内数据数值的信息熵,获得该数据点的离散表征值;需要说明的是,当数据点后的数据长度不满足最优窗口长度时,只计算实际存在的数据数值的信息熵;信息熵属于现有技术,具体计算步骤不再赘述,当数据集中的数据类型越多,意味着该数据集越混乱,则对应的信息熵越大。故当离散表征值越大,意味着该数据点的最优窗口长度范围内数据的数值类型越多,越离散;当该数据点的最优窗口长度内的数据处于同一个变化趋势的范围内时,离散表征值越小;反之,当该数据点的最优窗口长度内的数据处于两个相邻的变化趋势的范围内时,数据种类越多,离散表征值越大。故可根据离散表征值的数值差异对数据监测序列进行分段。
通过获取最优窗口长度范围内的数据数值的信息熵能够排除窗口选择不当造成的信息熵的数值分布混乱,正常情况下,数据监测序列中数据点对应的离散表征值的出现概率的分布符合正态分布特征;故首先根据离散表征值的分布特征获得离散表征值的概率密度函数曲线和对应位置的正态分布曲线;概率密度函数曲线表征了不同离散表征值的出现概率;因数据监测序列中大部分的数据点都处于对应的变化趋势的内部,故该类数据点对应的离散表征值较为相似,且出现频率较高,而小部分的数据点处于两个相邻变化趋势的边界处,则对应的离散表征值较为相似,且出现频率较低,故离散表征值的整体出现概率的分布特征接近正态分布。该正态分布曲线的位置需要基于离散表征值的取值范围确定,即正态分布曲线的中心线对应离散表征值的均值;需要说明的是,概率密度函数曲线和正态分布曲线属于现有技术,具体获取步骤不再赘述。
若概率密度函数曲线和正态分布曲线较为接近,则可直接根据正态分布中的拉依达准则判断出现概率低的离散表征值,从而实现数据段的划分;但由于数据监测序列中存在异常数据,导致某些数据点对应的离散表征值较为异常,使得某些离散表征值的出现概率异常,概率密度函数曲线分布情况与正态分布曲线存在一定差异;故需要根据概率密度函数曲线与正态分布曲线的相似程度获得曲线相似度,后续根据曲线相似度进一步筛选离散表征值和对应的划分数据点。优选地,在本发明实施例中,获取曲线相似度包括:根据DTW算法计算概率密度函数曲线与正态分布曲线的动态时间规整距离并负相关映射,获得曲线相似度。DTW算法属于现有技术,当两个曲线的变化趋势越相似,则动态时间规整距离越小,具体计算步骤不再赘述。当概率密度函数曲线和正态分布曲线越相似时,则曲线相似度越大。
步骤S3,根据离散表征值的数据特征和曲线相似度获得划分数据点;根据划分数据点对数据监测序列进行划分获得子特征数据段;根据子特征数据段中的数据波动特征获得波动数据点。
获取概率密度曲线和正态分布曲线的曲线相似度后,可根据离散表征值的数据特征和曲线相似度获得划分数据点;具体包括:计算任意离散表征值与离散表征值的平均值的差值绝对值,获得任意离散表征值的差异程度;计算差异程度能够表征任意离散表征值与离散表征值的平均值之间的差异特征,便于后续基于拉依达准则筛选出现概率较低的离散表征值;拉依达准则值指:若数据集符合正态分布,则在三个标准差之内的数据占比为百分之九十九,拉依达准则属于现有技术,不再赘述。当曲线相似度超过预设相似阈值时;在本发明实施例中,预设相似阈值为0.8,实施者可根据实施场景自行确定,此时意味着概率密度函数曲线符合正态分布的特征;计算预设第一常数与离散表征值的标准差的乘积,获得划分表征值;在本发明实施例中,预设第一常数为3,即拉依达准则中的3个标准差,划分表征值指3个离散表征值的标准差。若差异程度超过该划分表征值时,即超过3个离散表征值的标准差,该任意离散表征值对应的数据点为划分数据点;此时意味着该任意离散表征值的出现频率较低,对应的数据点处于数据监测序列中两个变化趋势的边界附近,可作为划分数据点。
进一步地,当曲线相似度不超过预设相似阈值时,此时意味着概率密度函数曲线与正态分布曲线差异较大,需要修改拉依达准则中标准差前面的系数,选取合适的划分表征值。计算预设相似阈值与曲线相似度的差值并负相关映射,获取修正系数;当曲线相似度越小,意味着概率密度函数曲线和正态分布曲线的差异越大,数据监测序列中异常数据越明显,需要度数据监测序列中划分更多的数据段,提高聚类结果的灵敏度,修正系数越小。计算预设第一常数和预设第二常数的差值,获得标准差参数区间;预设第一常数和预设第二常数分别为拉依达准则中标准差前面的常数3和1,标准差参数区间为2。计算标准差参数区间和修正系数的乘积,获取标准差修正程度;当修正系数越小,则标准差修正程度越小。计算标准差修正程度和预设第二常数的和值,获取修正标准差参数;当曲线相似度越小,则修正标准差参数越小;计算修正标准差参数和离散表征值的标准差的乘积,获取修正划分表征值;当曲线相似度越小,则修正划分表征值越小,能够使得更多的离散表征值被筛选出来,增加数据段的数量,提高异常数据的检测准确性。当差异程度超过修正划分表征值时,该任意离散表征值对应的数据点为划分数据点,基于对拉依达准则进行改进,能够获得更多的划分数据点。修正划分表征值的获取公式包括:
式中,表示修正划分表征值,/>表示预设第一常数,/>表示预设第二常数,/>表示预设相似阈值,/>表示曲线相似度,/>表示以自然常数为底的指数函数,表示修正系数,/>表示标准差参数区间,/>表示标准差修正程度。
通过对概率密度函数曲线和正态分布曲线的相似程度进行分析,当曲线相似度越大时,意味着数据监测序列中数据点对应的离散表征值的分布较为正常,符合正态分布特征,故基于拉依达准则对于划分数据点的获取能够将数据监测序列中不同变化趋势的数据段进行区分,若数据监测序列中异常数据较多,曲线相似度越小时,则不仅需要将不同变化趋势的数据段进行区分,还需要将同一变化趋势的数据段进一步分割,提高聚类算法对异常数据点的获取准确性,故对拉依达准则进行改进,提高划分数据点的数量。
进一步地,可根据划分数据点对数据监测序列进行划分获得子特征数据段,具体包括:在数据监测序列中根据任意相邻的划分数据点之间的数据区间作为子特征数据段;每个子特征数据段中的变化趋势相似,数值大小接近;对子特征数据段中的数据进行聚类能够较好的筛选波动数据点,故根据子特征数据段中的数据波动特征获得波动数据点。
优选地,在本发明一个实施例中,获取波动数据点包括:根据聚类算法对子特征数据段中的数据点进行聚类,获得聚类中心、聚类空间中数据点之间的特征距离;需要说明的是,在本发明实施例中使用现有的DBSCAN聚类算法,具体聚类过程不再赘述,实施者可根据实施场景自行确定该算法中的超参数;在聚类空间中当数据点距聚类中心越远则越可能为异常数据点。对于子特征数据段中任意数据点,将任意数据点与聚类中心的特征距离正相关映射,获得距离表征值;当距离越远,距离表征值越大。
在聚类空间中计算该任意数据点的预设半径范围内的其他数据点的数量,获得该任意数据点的邻域特征值;在本发明中预设半径为10,实施者可根据实施场景自行确定。计算子特征数据段的数据点数量与邻域特征值的差值,获得任意数据点的偏离指数;当邻域特征值越小,偏离指数越大,意味着该任意数据点越孤立。计算偏离指数与子特征数据段的数据点数量的比值并负相关映射,获得偏离特征值;偏离特征值越大,意味着该任意数据点越可能为异常数据点。计算距离表征值与偏离特征值的乘积,获得该任意数据点的目标程度;当目标程度超过预设目标程度阈值时,该任意数据点为波动数据点;当目标程度越大,意味着该任意数据点越可能为异常数据,波动越明显;在本发明实施例中,预设目标程度阈值为0.8,实施者可根据实施场景自行确定。获取目标程度的公式包括:
式中,表示目标程度,/>表示距离表征值,/>表示子特征数据段的数据点数量,/>表示邻域特征值,/>表示偏离指数,/>表示以自然常数为底的指数函数,表示偏离特征值。
步骤S4,对波动数据点去噪获得去噪数据序列;根据多源特征的去噪数据序列进行用户行为预测。
获得数据监测序列中所有的波动数据点后,可对波动数据点去噪获得去噪数据序列,具体包括:根据波动数据点所在子特征数据段的数据特征通过移动平均算法对波动数据点进行去噪,获得去噪数据点,需要说明的是,移动平均算法是现有的去噪算法,具体步骤不再赘述。将数据监测序列中的波动数据点替换为对应的去噪数据点,获得去噪数据序列。进一步地,可根据多源特征的去噪数据序列进行用户行为预测,将不同特征的去噪数据序列融合成多维特征去噪数据序列,通过神经网络算法对多维特征去噪序列进行数据预测获得特征预测数据,根据特征预测数据对用户行为进行预测;需要说明的是,神经网络算法预测属于现有技术,具体步骤不再赘述;实施者可根据实施场景根据多维特征去噪数据序列通过其他手段进行预测,在此不做限定。
综上所述,本发明实施例提供了一种基于智慧厨房多源数据融合的用户行为预测方法;根据预设步长对数据监测序列采样获得采样序列;根据采样序列中的数据变化特征获得最优窗口长度;根据数据监测序列中数据点的最优窗口长度范围内的数据种类特征获得离散表征值;根据离散表征值的概率密度函数曲线与正态分布曲线的相似程度获得曲线相似度;根据离散表征值和曲线相似度获得子特征数据段。本发明根据子特征数据段中的数据波动特征获得波动数据点和去噪数据序列;根据多源特征的去噪数据序列进行用户行为预测,提高了去噪准确性和用户行为预测的精确性。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
Claims (10)
1.一种基于智慧厨房多源数据融合的用户行为预测方法,其特征在于,所述方法包括以下步骤:
获取智慧厨房多源特征的数据监测序列;根据预设步长对所述数据监测序列进行采样获得采样序列;根据所述采样序列中的数据变化特征获得最优窗口长度;
根据所述数据监测序列中数据点的最优窗口长度范围内的数据种类特征获得离散表征值;根据所述离散表征值的分布特征获得离散表征值的概率密度函数曲线和对应位置的正态分布曲线;根据所述概率密度函数曲线与所述正态分布曲线的相似程度获得曲线相似度;
根据所述离散表征值的数据特征和所述曲线相似度获得划分数据点;根据所述划分数据点对数据监测序列进行划分获得子特征数据段;根据所述子特征数据段中的数据波动特征获得波动数据点;
对波动数据点去噪获得去噪数据序列;根据多源特征的去噪数据序列进行用户行为预测。
2.根据权利要求1所述的一种基于智慧厨房多源数据融合的用户行为预测方法,其特征在于,所述根据预设步长对所述数据监测序列进行采样获得采样序列的步骤包括:
根据所述预设步长的长度间隔对所述数据监测序列进行采样,获得预设步长数量个采样序列。
3.根据权利要求2所述的一种基于智慧厨房多源数据融合的用户行为预测方法,其特征在于,所述根据所述采样序列中的数据变化特征获得最优窗口长度的步骤包括:
获得所述采样序列的差分序列,计算所述差分序列中数据出现频率最低的出现次数,获得最小频率表征值;计算所述差分序列中众数对应的数值数量与所述最小频率表征值的差值并归一化,获得数据分布特征值;计算所述差分序列中不同种类数据数值的方差并负相关映射,获得差异特征值;
计算所述数据分布特征值与所述差异特征值的乘积,获取采样特征值;计算所述预设步长对应的采样序列的采样特征值的平均值,获得所述预设步长的步长适宜值;选取步长适宜值最大值对应的预设步长作为所述最优窗口长度。
4.根据权利要求1所述的一种基于智慧厨房多源数据融合的用户行为预测方法,其特征在于,所述根据所述数据监测序列中数据点的最优窗口长度范围内的数据种类特征获得离散表征值的步骤包括:
在所述数据监测序列中以所述数据点为窗口起点,计算所述数据点的最优窗口长度范围内数据数值的信息熵,获得所述数据点的离散表征值。
5.根据权利要求1所述的一种基于智慧厨房多源数据融合的用户行为预测方法,其特征在于,所述根据所述概率密度函数曲线与所述正态分布曲线的相似程度获得曲线相似度的步骤包括:
根据DTW算法计算所述概率密度函数曲线与所述正态分布曲线的动态时间规整距离并负相关映射,获得所述曲线相似度。
6.根据权利要求1所述的一种基于智慧厨房多源数据融合的用户行为预测方法,其特征在于,所述根据所述离散表征值的数据特征和所述曲线相似度获得划分数据点的步骤包括:
计算任意离散表征值与离散表征值的平均值的差值绝对值,获得所述任意离散表征值的差异程度;当所述曲线相似度超过预设相似阈值时;计算预设第一常数与所述离散表征值的标准差的乘积,获得划分表征值;若所述差异程度超过所述划分表征值时,所述任意离散表征值对应的数据点为划分数据点;
当所述曲线相似度不超过预设相似阈值时,计算所述预设相似阈值与曲线相似度的差值并负相关映射,获取修正系数;计算预设第一常数和预设第二常数的差值,获得标准差参数区间;计算所述标准差参数区间和所述修正系数的乘积,获取标准差修正程度;计算所述标准差修正程度和所述预设第二常数的和值,获取修正标准差参数;计算所述修正标准差参数和所述离散表征值的标准差的乘积;获取修正划分表征值;当所述差异程度超过所述修正划分表征值时,所述任意离散表征值对应的数据点为划分数据点。
7.根据权利要求1所述的一种基于智慧厨房多源数据融合的用户行为预测方法,其特征在于,所述根据所述划分数据点对数据监测序列进行划分获得子特征数据段的步骤包括:
在所述数据监测序列中根据任意相邻的划分数据点之间的数据区间作为所述子特征数据段。
8.根据权利要求1所述的一种基于智慧厨房多源数据融合的用户行为预测方法,其特征在于,所述根据所述子特征数据段中的数据波动特征获得波动数据点的步骤包括:
根据聚类算法对所述子特征数据段中的数据点进行聚类,获得聚类中心、聚类空间中数据点之间的特征距离;对于子特征数据段中任意数据点,将所述任意数据点与聚类中心的特征距离正相关映射,获得距离表征值;
在聚类空间中计算所述任意数据点的预设半径范围内的其他数据点的数量,获得所述任意数据点的邻域特征值;计算所述子特征数据段的数据点数量与所述邻域特征值的差值,获得所述任意数据点的偏离指数;计算所述偏离指数与所述子特征数据段的数据点数量的比值并负相关映射,获得偏离特征值;
计算所述距离表征值与所述偏离特征值的乘积,获得所述任意数据点的目标程度;当所述目标程度超过预设目标程度阈值时,所述任意数据点为波动数据点。
9.根据权利要求1所述的一种基于智慧厨房多源数据融合的用户行为预测方法,其特征在于,所述对波动数据点去噪获得去噪数据序列的步骤包括:
根据所述波动数据点所在子特征数据段的数据特征通过移动平均算法对所述波动数据点进行去噪,获得去噪数据点,将所述数据监测序列中的波动数据点替换为对应的去噪数据点,获得所述去噪数据序列。
10.根据权利要求1所述的一种基于智慧厨房多源数据融合的用户行为预测方法,其特征在于,所述根据多源特征的去噪数据序列进行用户行为预测的步骤包括:
将不同特征的去噪数据序列融合成多维特征去噪数据序列,通过神经网络算法对所述多维特征去噪序列进行数据预测获得特征预测数据,根据所述特征预测数据对用户行为进行预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410545224.4A CN118134539A (zh) | 2024-05-06 | 2024-05-06 | 基于智慧厨房多源数据融合的用户行为预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410545224.4A CN118134539A (zh) | 2024-05-06 | 2024-05-06 | 基于智慧厨房多源数据融合的用户行为预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118134539A true CN118134539A (zh) | 2024-06-04 |
Family
ID=91243012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410545224.4A Pending CN118134539A (zh) | 2024-05-06 | 2024-05-06 | 基于智慧厨房多源数据融合的用户行为预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118134539A (zh) |
-
2024
- 2024-05-06 CN CN202410545224.4A patent/CN118134539A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109542740B (zh) | 异常检测方法及装置 | |
CN106714109B (zh) | 基于众包数据的WiFi指纹库更新方法 | |
CN116484307B (zh) | 基于云计算智能戒指远程控制方法 | |
EP3008633A1 (en) | Fast grouping of time series | |
CN117540238B (zh) | 一种工业数字化信息采集装置用数据安全管理方法 | |
CN117407700B (zh) | 一种带电作业过程中作业环境的监测方法 | |
CN117349220B (zh) | 一种基于pci总线的数据处理方法及系统 | |
CN116701983B (zh) | 一种冷链物流实时监测数据处理方法及系统 | |
CN117271987B (zh) | 一种配电设备环境状态数据智能采集处理方法 | |
CN116066343A (zh) | 一种输油泵机组故障模型的智能预警方法及系统 | |
CN116909339B (zh) | 基于人工智能的智能家居安全预警方法及系统 | |
CN116610938B (zh) | 曲线模式分段的半导体制造无监督异常检测方法及设备 | |
CN114817228A (zh) | 一种湖泊水位长时间序列监测数据的异常值剔除方法 | |
CN111161097A (zh) | 基于假设检验的事件检测算法检测开关事件的方法和装置 | |
CN117540325B (zh) | 基于数据变化量捕获的业务数据库异常检测方法及系统 | |
CN117473351B (zh) | 基于物联网的电源信息远程传输系统 | |
CN109976986B (zh) | 异常设备的检测方法及装置 | |
CN116821836B (zh) | 基于多传感器的轮轴瓦异常状态监测方法及系统 | |
CN113553319A (zh) | 基于信息熵加权的lof离群点检测清洗方法、装置、设备及存储介质 | |
CN118134539A (zh) | 基于智慧厨房多源数据融合的用户行为预测方法 | |
CN116304963A (zh) | 一种适用于地质灾害预警的数据处理系统 | |
CN111339986A (zh) | 基于时域/频域分析的装备用频规律挖掘方法和系统 | |
CN117932445B (zh) | 高稳定性的htcc氧化铝陶瓷制备参数异常识别方法 | |
CN118051800B (zh) | 基于云边协同的矿内监测数据智能处理方法 | |
CN117348635B (zh) | 一种智能酒柜温度控制系统及其控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |