CN116304796A - 一种数据分类方法、装置、设备及介质 - Google Patents
一种数据分类方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116304796A CN116304796A CN202310040144.9A CN202310040144A CN116304796A CN 116304796 A CN116304796 A CN 116304796A CN 202310040144 A CN202310040144 A CN 202310040144A CN 116304796 A CN116304796 A CN 116304796A
- Authority
- CN
- China
- Prior art keywords
- sequence
- time response
- time
- sequences
- reference time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本申请实施例公开了一种数据分类方法、装置、设备及介质,涉及数据处理技术领域。该方法包括:获取不同待分类对象的时间响应序列;其中,各时间响应序列的时间点对齐;根据时间响应序列的时间响应变化情况,从各时间响应序列中选取基准时间序列;根据基准时间序列,对至少一个时间响应序列进行分类。采用上述技术方案,根据时间响应序列的时间响应变化情况,选取基准时间序列,并根据基准时间序列对时间响应序列进行分类,提高了对不同待分类对象的时间响应序列进行分类的分类结果准确度。
Description
技术领域
本申请实施例涉及数据处理技术领域,尤其涉及一种数据分类方法、装置、设备及介质。
背景技术
随时间变化的数据广泛存在于各领域中,同一个随时间变化的数据可以存在多种不同的随时间变化规律,不同的随时间变化规律之间的差异程度不同。若不同的随时间变化规律之间仅存在细微差异,则难以准确区分随时间变化数据的不同的随时间变化规律。因此,如何对随时间变化数据的不同的随时间变化规律进行准确度较高的分类十分重要。
发明内容
本申请提供一种数据分类方法、装置、设备及介质,以提高对时间响应序列进行分类的分类结果的准确度。
第一方面,本申请实施例提供了一种数据分类方法,该方法包括:
获取不同待分类对象的时间响应序列;其中,各时间响应序列的时间点对齐;
根据时间响应序列的时间响应变化情况,从各时间响应序列中选取基准时间序列;
根据基准时间序列,对至少一个时间响应序列进行分类。
第二方面,本申请实施例还提供了一种数据分类装置,该装置包括:
时间响应序列获取模块,用于获取不同待分类对象的时间响应序列;其中,各时间响应序列的时间点对齐;
基准序列获取模块,用于根据时间响应序列的时间响应变化情况,从各时间响应序列中选取基准时间序列;
时间响应序列分类模块,用于根据基准时间序列,对至少一个时间响应序列进行分类。
第三方面,本申请实施例还提供了一种电子设备,包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够实现如第一方面实施例所提供的数据分类方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面实施例所提供的数据分类方法。
本申请实施例通过获取不同待分类对象的时间响应序列;其中,各时间响应序列的时间点对齐;根据时间响应序列的变化情况,从各时间响应序列中选取基准时间序列;根据基准时间序列,对至少一个时间响应序列进行分类。采用上述技术方案,根据时间响应序列的时间响应变化情况,选取基准时间序列,并根据基准时间序列对时间响应序列进行分类,提高了对不同待分类对象的时间响应序列进行分类的分类结果准确度。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
图1是本申请实施例一中的一种数据分类方法的流程图;
图2是本申请实施例二中的一种数据分类方法的流程图;
图3是本申请实施例三中的一种数据分类方法的流程图;
图4是本申请实施例四中的一种数据分类装置的结构图;
图5是本申请实施例五中的一种电子设备的结构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”和“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1为本申请实施例一提供的一种数据分类方法的流程图,本实施例可适用于对待分类对象的时间响应序列进行分类的情况,该方法可以由数据分类装置来执行,该数据分类装置可以由软件和/或硬件实现,并具体配置于电子设备中。
如图1所示的数据分类方法,包括:
S101、获取不同待分类对象的时间响应序列;其中,各时间响应序列的时间点对齐。
本实施例中,待分类对象可以是企业、组织、机构或个人等。时间响应序列可以是将待分类对象在各时间点的时间响应值,根据时间点的先后顺序排列组合后得到的时间序列。时间点的时间格式可以是月份、季度、年份、分钟和秒等。其中,各待分类对象的时间响应序列的时间点对齐,即各待分类对象的时间响应序列中的起始时间点、时间点个数和相邻时间点之间的间隔相同,以确保在相同的时间条件下对各待分类对象的时间响应序列进行分类,从而有助于提高分类结果准确度。
在一个可选实施例中,时间响应序列可以是能量消耗时间序列,即时间响应序列可以是将待分类对象在各时间点的能量消耗值,根据时间点的先后顺序排列组合后得到的时间序列;或者,时间响应序列可以是生理参数时间序列,即时间响应序列可以是将待分类对象在各时间点的生理参数值,根据时间点的先后顺序排列组合后得到的时间序列。其中,生理参数可以包括但不限于血压、血糖、血脂、血氧和心率等。
S102、根据时间响应序列的时间响应变化情况,从各时间响应序列中选取基准时间序列。
其中,时间响应变化情况可以是时间响应序列中的时间响应值随时间点变化的情况;基准时间序列可以是时间响应变化情况明显区分于其他时间响应序列的时间响应序列,数量为至少一个,例如基准时间序列可以是时间响应变化情况最平稳的时间响应序列、或时间响应变化情况最剧烈的时间响应序列等。
示例性的,从各时间响应序列中选取时间响应变化情况较平稳(如最平稳)的时间响应序列,即选取各时间响应序列中的时间响应值随时间点变化较小(如最小)的时间响应序列,作为基准时间序列。
示例性的,从各时间响应序列中选取时间响应变化情况较剧烈(如最剧烈)的时间响应序列,即选取各时间响应序列中的时间响应值随时间点变化较大(如最大)的时间响应序列,作为基准时间序列。
S103、根据基准时间序列,对至少一个时间响应序列进行分类。
具体的,根据各时间响应序列与至少一个基准时间序列之间的相似程度,对至少一个时间响应序列进行分类。
在一个可选实施例中,对至少一个时间响应序列进行分类后,根据时间响应序列的分类结果,对各时间响应序列对应的待分类对象进行分类。根据各待分类对象的分类结果,对不同分类结果的待分类对象实施针对性的措施。示例性的,若时间响应序列为能量消耗时间序列,则可以对分类结果为能量消耗变化剧烈的待分类对象进行削峰填谷,以实现能量的合理分配,进而提高能量的综合利用率;若时间响应序列为生理参数时间序列,则可以及时提醒分类结果为生理参数变化剧烈的待分类对象,从而有助于该分类结果的待分类对象的生理体征保持平稳。
本申请实施例的技术方案,通过获取不同待分类对象的时间响应序列;其中,各时间响应序列的时间点对齐;根据时间响应序列的时间响应变化情况,从各时间响应序列中选取基准时间序列;根据基准时间序列,对至少一个时间响应序列进行分类。采用上述技术方案,根据时间响应序列的时间响应变化情况,选取基准时间序列,并根据基准时间序列对时间响应序列进行分类,提高了对不同待分类对象的时间响应序列进行分类的准确度。
实施例二
图2为本申请实施例二提供的一种数据分类方法的流程图,本实施例在上述各实施例的基础上,对基准时间序列的选取操作进行了优化改进。
进一步地,将“根据时间响应序列的时间响应变化情况,从各时间响应序列中选取基准时间序列”细化为“分别确定各时间响应序列的累计概率分布;累计概率分布用于表征相应时间响应序列的时间响应变化情况;根据累计概率分布,从各时间响应序列中选取基准时间序列”,以完善基准时间序列的选取操作。
需要说明的是,在本申请实施例中未详述部分,可参见其他实施例的相关表述,在此不再赘述。
如图2所示的数据分类方法,该方法包括:
S201、获取不同待分类对象的时间响应序列;其中,各时间响应序列的时间点对齐。
S202、分别确定各时间响应序列的累计概率分布;累计概率分布用于表征相应时间响应序列的时间响应变化情况。
本实施例中,分别确定各时间响应序列的累计概率分布,以累计概率分布表征相应时间响应序列的时间响应变化情况,通过累计概率分布单调不减和各累计概率分布区间相同的特性,增强了时间响应序列的时间响应变化情况的特征,进而增强了不同时间响应序列的时间响应变化情况之间的差异程度。
需要说明的是,时间响应序列的累积概率分布的确定方法可以采用现有技术中的至少一种加以实现,本发明对此不作限定。
S203、根据累计概率分布,从各时间响应序列中选取基准时间序列。
可选的,根据累计概率分布,从各时间响应序列中选取基准时间序列,包括:确定各累计概率分布的曲线下面积AUC(Area Under the Curve,曲线下面积);AUC用于量化相应时间响应序列的时间响应变化情况;根据AUC,从各时间响应序列中选取基准时间序列。
其中,AUC可以是累计概率分布曲线与累计概率分布曲线所属坐标系的横坐标轴围成的区域面积。由于各累计概率分布用于表征相应时间响应序列的时间响应变化情况,通过确定各累计概率分布的AUC,可以量化相应时间响应时间的时间响应变化情况,从而根据各AUC,直接从各时间响应序列中选取基准时间序列。
可以理解的是,采用上述技术方案,通过确定各累计概率分布的AUC,并根据AUC,从各时间响应序列中选取基准时间序列,量化了相应时间响应序列的时间响应变化情况,各AUC之间的差值,即为各时间响应序列的时间响应变化情况之间的差异,提高了选取基准时间序列的选取效率和选取结果准确度。
可选的,根据AUC,从各时间响应序列中选取基准时间序列,包括:选取各AUC中的最值对应时间响应序列,作为基准时间序列;或者,选取距离预设中间阈值最近的AUC对应时间响应序列,作为基准时间序列。
其中,AUC的最值可以是AUC的最小值和/或最大值;预设中间阈值可以由技术人员根据实际需求或实践经验自主设定,本申请对此不作限定。优选的,预设中间阈值为0.5。
具体的,比较各累计概率分布的AUC值,选取AUC最大值和/或AUC最小值对应的时间响应序列作为基准时间序列;或者,确定各累计概率分布的AUC值与预设中间阈值的差值,将与预设中间阈值的差值最小的AUC对应的时间响应序列,作为基准时间序列。
可以理解的是,采用上述技术方案,选取各AUC中的最值对应时间响应序列或距离预设中间阈值最近的AUC对应时间响应序列,作为基准时间序列,丰富了基准时间序列的选取方式,提高了确定基准时间序列的灵活性。
S204、根据基准时间序列,对至少一个时间响应序列进行分类。
示例性的,在分类过程中,可以在不同迭代分类过程中选取相同或不同的基准时间序列,对未分类的时间响应序列进行分类。不同迭代分类过程中各基准时间序列的选取方式可以由技术人员根据需要或经验进行设置或调整。
由于通常情况下时间响应变化相对平稳的耗能对象的数量较多,因此,通常在使用变化相对剧烈的基准时间序列之前,均会使用时间响应变化相对平稳的基准时间序列进行迭代分类,从而显著减少未分类的时间响应序列的数量。
需要说明的是,在每次迭代分类过程中,均需要进行不同基准时间序列的重新计算,并从各基准时间序列中,选取本次迭代分类所需的基准时间序列,从而避免出现将已分类的时间响应序列作为基准时间序列,而造成的时间响应序列重复分类的情况,进而有助于提高分类结果的准确度。
本申请实施例的技术方案,通过分别确定各时间响应序列的累计概率分布;累计概率分布用于表征相应时间响应序列的时间响应变化情况;根据累计概率分布,从各时间响应序列中选取基准时间序列。采用上述技术方案,通过分别确定各时间响应序列的累计概率分布,放大了时间响应序列的时间响应变化情况的特征,增强了不同时间响应序列之间的时间响应变化情况的差异度;根据累计概率分布选取基准时间序列,提高了所选取的基准时间序列的准确度。
实施例三
图3为本申请实施例三提供的一种数据分类方法的流程图,本实施例在上述各实施例的基础上,对时间响应序列的分类操作进行了优化改进。
进一步地,将“根据基准时间序列,对至少一个时间响应序列进行分类”细化为“选取与基准时间序列相似的至少一个时间响应序列,作为基准时间序列的候选同类别序列;根据候选同类别序列的数量,对至少一个候选同类别序列进行归类”,以完善时间响应序列的分类操作。
需要说明的是,在本申请实施例中未详述部分,可参见其他实施例的相关表述,在此不再赘述。
如图3所示的数据分类方法,该方法包括:
S301、获取不同待分类对象的时间响应序列;其中,各时间响应序列的时间点对齐。
S302、根据时间响应序列的时间响应变化情况,从各时间响应序列中选取基准时间序列。
S303、选取与基准时间序列相似的至少一个时间响应序列,作为基准时间序列的候选同类别序列。
本实施例中,候选同类别序列可以是时间响应序列中,时间响应变化差异相对较小的时间响应序列。
可选的,选取与基准时间序列相似的至少一个时间响应序列,作为基准时间序列的候选同类别序列,包括:针对一个时间响应序列,确定该时间响应序列与基准时间序列在各时间点的时间响应差值;将该时间响应序列的最大时间响应差值作为该时间响应序列与基准时间序列之间的相似度;选取相似度小于预设相似度阈值的各时间响应序列作为基准时间序列的候选同类别序列。
其中,时间响应差值可以是相应时间响应序列与基准时间序列在各对应时间点的时间响应值的差值;相似度用于表征相应时间响应序列与基准时间序列之间的时间响应变化情况的相似程度;选取最大时间响应差值作为时间响应序列与基准时间序列之间的相似度,使得相似度能够最大限度反映相应的时间响应序列与基准时间序列之间的差异情况,有助于减少误分类或错分类的情况发生,从而有助于提高分类结果的准确度。其中,预设相似度阈值可以由技术人员根据实际需求或实践经验自主设定,本申请对此不做限定,例如可以是0.3。
可以理解的是,采用上述技术方案,通过确定时间响应序列与基准时间序列在各时间点的时间响应差值,确定时间响应序列与基准时间序列之间的相似度,选取相似度小于预设相似度阈值的各时间响应序列作为基准时间序列的候选同类别序列,提高了选取时间响应序列作为候选同类别序列的准确度。
S304、根据候选同类别序列的数量,对至少一个候选同类别序列进行归类。
在一个可选实施例中,若候选同类别序列的数量不小于第一预设数量,则根据与基准时间序列的相似情况,选取第一预设数量的候选同类别序列进行归类;若候选同类别序列的数量小于第一预设数量,则在候选同类别序列的数量不小于第二预设数量的情况下,将各候选同类别序列进行归类。
其中,第一预设数量为时间响应序列的总数量,与第一预设占比的乘积;第二预设数量为除去候选同类别序列的未分类的时间响应序列的总数量,与第二预设占比的乘积;第一预设比和第二预设比可以由技术人员根据实际需求或实践经验自主设定,本申请对此不作限定。在一个具体实现方式中,第二预设比大于第一预设比。
举例说明,在时间响应序列总数量为100,第一预设比为15%,第二预设比为20%的情况下,第一预设数量为固定的15。若候选同类别序列数量为20,大于第一预设数量,则从候选同类别序列选取与基准时间序列的相似度最小的15个时间响应序列归为一类。若候选同类别序列数量为10个,已分类的时间响应序列为50个,除去候选同类别序列的10个,则未分类的时间响应序列的总数量为40,相应的,第二预设数量为8;候选同类别序列数量(10)小于第一预设数量(15),大于第二预设数量(8),则将该10个候选同类别序列归为一类。
在另一个可选实施例中,若候选同类别序列的数量小于第一预设数量,且候选同类别序列的数量小于第二预设数量,则将异常次数加一;若异常次数达到预设累计次数,则将未分类的时间响应序列归类为异常类别。
其中,异常次数可以是候选同类别序列的数量小于第一预设数量,且候选同类别序列的数量小于第二预设数量的次数;预设累计次数可以有技术人员根据实际需求或实践经验自主设定,本发明对此不作限定。
以预设累计次数为4,基准时间序列数量为3为例进行说明。其中,异常次数初始为0,第一基准时间序列为距离预设中间阈值最近的AUC对应的时间响应序列,第二基准时间序列为AUC最小值对应的时间响应序列,第三基准时间序列为AUC最大值对应的时间响应序列:
选取与第一基准时间序列相似的至少一个时间响应序列,作为第一基准时间序列的候选同类别序列;若第一基准时间序列的候选同类别序列的数量小于第一预设数量,且小于第二预设数量,则异常次数加一,异常次数由0更新为1,不进行归类;选取与第二基准时间序列相似的至少一个时间响应序列,作为第二基准时间序列的候选同类别序列;若第二基准时间序列的候选同类别序列的数量小于第一预设数量,且候选同类别序列的数量小于第二预设数量,则异常次数加一,异常次数由1更新为2,不进行归类;选取与第一基准时间序列相似的至少一个时间响应序列,作为第三基准时间序列的候选同类别序列;若第三基准时间序列的候选同类别序列的数量小于第一预设数量,且小于第二预设数量,则异常次数加一,异常次数由2更新为3,不进行归类;再次选取与第三基准时间序列相似的至少一个时间响应序列,作为第一基准时间序列的新候选同类别序列;若第一基准时间序列的新候选同类别序列的数量小于第一预设数量,且小于第二预设数量,则异常次数加一,异常次数由3更新为4,达到预设累计次数,将未分类的时间响应序列归类为异常类别。其中,第一基准时间序列对应AUC距离预设中间阈值最近时的时间响应序列;第二基准时间序列和第三基准时间序列,可以分别对应AUC最大时对应的时间响应序列和AUC最小时对应的时间响应序列。
在又一个可选实施例中,若候选同类别序列的数量小于第一预设数量,候选同类别序列的数量小于第二预设数量,且未分类的时间响应序列数量不大于预设允许异常数量,则将未分类的时间响应序列归类为异常类别。
其中,预设允许异常数量为时间响应序列的总数量,与预设允许异常比的乘积。预设允许异常比可以由技术人员根据实际需求或实践经验自主设定,本发明对此不做限定。
举例说明,在时间响应序列总数量为100,预设允许异常比为10%,的情况下,则预设允许异常数量为10。在一次分类过程中,若所采用的第一预设数量为15,第二预设数量为12,且未分类的时间响应序列总数量为9,候选同类别序列数量为8,则候选同类别序列数量(8)小于第一预设数量(15),且小于第二预设数量(12),未分类的时间响应序列总数量(9)小于预设允许异常数量(10),则各未分类的时间响应序列,归类为异常类别。
可以理解的是,采用上述技术方案,通过候选同类别序列的数量、第一预设数量、第二预设数量,对候选同类别序列进行归类,提高了对候选同类别序列进行归类的灵活性和准确度。
本申请实施例通过选取与基准时间序列相似的至少一个时间响应序列,作为基准时间序列的候选同类别序列;根据候选同类别序列的数量,对至少一个候选同类别序列进行归类。采用上述技术方案,选取基准时间序列的候选同类别序列,并根据候选同序列的数量,对至少一个候选同类别序列进行归类,提高了对时间响应序列分类的灵活性。
实施例四
图4为本申请实施例四提供的一种数据分类装置的结构图,本申请实施例可适用于对待分类对象的时间响应序列进行分类的情况,该装置可以由软件和/或硬件实现,并具体配置于电子设备中。如图4所示的数据分类装置,包括:时间响应序列获取模块401、基准序列获取模块402和时间响应序列分类模块403。其中,
时间响应序列获取模块401,用于获取不同待分类对象的时间响应序列;其中,各时间响应序列的时间点对齐;
基准序列获取模块402,用于根据时间响应序列的变化情况,从各时间响应序列中选取基准时间序列;
时间响应序列分类模块403,用于根据基准时间序列,对至少一个时间响应序列进行分类。
本申请实施例通过时间响应序列获取模块获取不同待分类对象的时间响应序列;其中,各时间响应序列的时间点对齐;通过基准序列获取模块根据时间响应序列的变化情况,从各时间响应序列中选取基准时间序列;通过时间响应序列分类模块根据基准时间序列,对至少一个时间响应序列进行分类。采用上述技术方案,根据时间响应序列的时间响应变化情况,选取基准时间序列,并根据基准时间序列对时间响应序列进行分类,提高了对不同待分类对象的时间响应序列进行分类的分类结果准确度。
可选的,基准序列获取模块402,包括:
累计概率分布确定单元,用于分别确定各时间响应序列的累计概率分布;累计概率分布用于表征相应时间响应序列的变化情况;
基准序列选取单元,用于根据累计概率分布,从各时间响应序列中选取基准时间序列。
可选的,基准序列选取单元,包括:
AUC确定子单元,用于确定各累计概率分布的曲线下面积AUC;AUC用于量化相应时间响应序列的变化情况;
基准序列选取子单元,用于根据AUC,从各时间响应序列中选取基准时间序列。
可选的,基准序列选取子单元,具体用于:
选取各AUC中的最值对应时间响应序列,作为基准时间序列;或者,
选取距离预设中间阈值最近的AUC对应时间响应序列,作为基准时间序列。
可选的,时间响应序列分类模块403,包括:
同类别序列确定单元,用于选取与基准时间序列相似的至少一个时间响应序列,作为基准时间序列的候选同类别序列;
同类别序列归类单元,用于根据候选同类别序列的数量,对至少一个候选同类别序列进行归类。
可选的,同类别序列确定单元,包括:
差值确定子单元,用于针对各时间响应序列,确定该时间响应序列与基准时间序列在各时间点的时间响应差值;
相似度确定子单元,用于将该时间响应序列的最大时间响应差值作为该时间响应序列与基准时间序列之间的相似度;
同类别序列确定子单元,用于选取相似度小于预设相似度阈值的各时间响应序列作为基准时间序列的候选同类别序列。
可选的,同类别序列归类单元,包括:
第一同类别序列归类子单元,用于若候选同类别序列的数量不小于第一预设数量,则根据与基准时间序列的相似情况,选取第一预设数量的候选同类别序列进行归类;
第二同类别序列归类子单元,用于若候选同类别序列的数量小于第一预设数量,则在候选同类别序列的数量不小于第二预设数量的情况下,将各候选同类别序列进行归类;
其中,第一预设数量为时间响应序列的总数量,与第一预设占比的乘积;第二预设数量为除去候选同类别序列的未分类的时间响应序列的总数量,与第二预设占比的乘积;所述第二预设占比大于所述第一预设占比。
可选的,时间响应序列获取模块401,其中,时间响应序列为能量消耗时间序列;或者,时间响应序列为生理参数时间序列。
上述数据分类装置可执行本申请任意实施例所提供的数据分类方法,具备执行各数据分类方法相应的功能模块和有益效果。
实施例五
图5示出了可以用来实施本申请的实施例的电子设备510的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图5所示,电子设备510包括至少一个处理器511,以及与至少一个处理器511通信连接的存储器,如只读存储器(ROM)512、随机访问存储器(RAM)513等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器511可以根据存储在只读存储器(ROM)512中的计算机程序或者从存储单元518加载到随机访问存储器(RAM)513中的计算机程序,来执行各种适当的动作和处理。在RAM 513中,还可存储电子设备510操作所需的各种程序和数据。处理器511、ROM 512以及RAM 513通过总线514彼此相连。输入/输出(I/O)接口515也连接至总线514。
电子设备510中的多个部件连接至I/O接口515,包括:输入单元516,例如键盘、鼠标等;输出单元517,例如各种类型的显示器、扬声器等;存储单元518,例如磁盘、光盘等;以及通信单元519,例如网卡、调制解调器、无线通信收发机等。通信单元519允许电子设备510通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器511可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器511的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器511执行上文所描述的各个方法和处理,例如数据分类方法。
在一些实施例中,数据分类方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元518。在一些实施例中,计算机程序的部分或者全部可以经由ROM 512和/或通信单元519而被载入和/或安装到电子设备510上。当计算机程序加载到RAM 513并由处理器511执行时,可以执行上文描述的数据分类方法的一个或多个步骤。备选地,在其他实施例中,处理器511可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行数据分类方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本申请的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本申请的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (11)
1.一种数据分类方法,其特征在于,包括:
获取不同待分类对象的时间响应序列;其中,各所述时间响应序列的时间点对齐;
根据所述时间响应序列的时间响应变化情况,从各所述时间响应序列中选取基准时间序列;
根据所述基准时间序列,对至少一个所述时间响应序列进行分类。
2.根据权利要求1所述的方法,其特征在于,所述根据所述时间响应序列的时间响应变化情况,从各所述时间响应序列中选取基准时间序列,包括:
分别确定各所述时间响应序列的累计概率分布;所述累计概率分布用于表征相应时间响应序列的时间响应变化情况;
根据所述累计概率分布,从各所述时间响应序列中选取基准时间序列。
3.根据权利要求2所述的方法,其特征在于,所述根据所述累计概率分布,从各所述时间响应序列中选取基准时间序列,包括:
确定各所述累计概率分布的曲线下面积AUC;所述AUC用于量化相应时间响应序列的时间响应变化情况;
根据所述AUC,从各所述时间响应序列中选取所述基准时间序列。
4.根据权利要求3所述的方法,其特征在于,所述根据所述AUC,从各所述时间响应序列中选取所述基准时间序列,包括:
选取各所述AUC中的最值对应时间响应序列,作为所述基准时间序列;或者,
选取距离预设中间阈值最近的AUC对应时间响应序列,作为所述基准时间序列。
5.根据权利要求1所述的方法,其特征在于,所述根据所述基准时间序列,对至少一个所述时间响应序列进行分类,包括:
选取与所述基准时间序列相似的至少一个时间响应序列,作为所述基准时间序列的候选同类别序列;
根据所述候选同类别序列的数量,对至少一个所述候选同类别序列进行归类。
6.根据权利要求5所述的方法,其特征在于,所述选取与所述基准时间序列相似的至少一个时间响应序列,作为所述基准时间序列的候选同类别序列,包括:
针对一个时间响应序列,确定该时间响应序列与所述基准时间序列在各时间点的时间响应差值;
将该时间响应序列的最大时间响应差值作为该时间响应序列与所述基准时间序列之间的相似度;
选取相似度小于预设相似度阈值的各时间响应序列作为所述基准时间序列的候选同类别序列。
7.根据权利要求5所述的方法,其特征在于,所述根据所述候选同类别序列的数量,对至少一个所述候选同类别序列进行归类,包括:
若所述候选同类别序列的数量不小于第一预设数量,则根据与所述基准时间序列的相似情况,选取所述第一预设数量的候选同类别序列进行归类;
若所述候选同类别序列的数量小于所述第一预设数量,则在所述候选同类别序列的数量不小于第二预设数量的情况下,将各所述候选同类别序列进行归类;
其中,所述第一预设数量为所述时间响应序列的总数量,与第一预设占比的乘积;所述第二预设数量为除去所述候选同类别序列的未分类的时间响应序列的总数量,与第二预设占比的乘积;所述第二预设占比大于所述第一预设占比。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述时间响应序列为能量消耗时间序列;或者,所述时间响应序列为生理参数时间序列。
9.一种数据分类装置,其特征在于,包括:
时间响应序列获取模块,用于获取不同待分类对象的时间响应序列;其中,各所述时间响应序列的时间点对齐;
基准序列获取模块,用于根据所述时间响应序列的时间响应变化情况,从各所述时间响应序列中选取基准时间序列;
时间响应序列分类模块,用于根据所述基准时间序列,对至少一个所述时间响应序列进行分类。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7任一项所述的一种数据分类方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一项所述的一种数据分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310040144.9A CN116304796A (zh) | 2023-01-12 | 2023-01-12 | 一种数据分类方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310040144.9A CN116304796A (zh) | 2023-01-12 | 2023-01-12 | 一种数据分类方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116304796A true CN116304796A (zh) | 2023-06-23 |
Family
ID=86784126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310040144.9A Pending CN116304796A (zh) | 2023-01-12 | 2023-01-12 | 一种数据分类方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116304796A (zh) |
-
2023
- 2023-01-12 CN CN202310040144.9A patent/CN116304796A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112818013B (zh) | 时序数据库查询优化方法、装置、设备以及存储介质 | |
CN114580916A (zh) | 一种企业风险评估方法、装置、电子设备及存储介质 | |
CN114065864A (zh) | 联邦学习方法、联邦学习装置、电子设备以及存储介质 | |
CN115794578A (zh) | 一种电力系统的数据管理方法、装置、设备及介质 | |
CN115202847A (zh) | 任务的调度方法和装置 | |
CN116431505A (zh) | 一种回归测试方法、装置、电子设备、存储介质及产品 | |
CN116228301A (zh) | 一种目标用户的确定方法、装置、设备及介质 | |
CN115665783A (zh) | 一种异常指标溯源方法、装置、电子设备及存储介质 | |
CN114999665A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN115599687A (zh) | 一种软件测试场景的确定方法、装置、设备及介质 | |
CN115563310A (zh) | 一种关键业务节点的确定方法、装置、设备及介质 | |
CN115344495A (zh) | 批量任务测试的数据分析方法、装置、计算机设备及介质 | |
CN116304796A (zh) | 一种数据分类方法、装置、设备及介质 | |
CN116431698B (zh) | 一种数据提取方法、装置、设备及存储介质 | |
CN113326890B (zh) | 标注数据处理方法、相关装置及计算机程序产品 | |
CN115511014B (zh) | 信息匹配方法、装置、设备及存储介质 | |
CN114037057B (zh) | 预训练模型的生成方法、装置、电子设备以及存储介质 | |
CN116244413B (zh) | 新意图确定方法、设备和存储介质 | |
CN113761379B (zh) | 商品推荐方法及装置、电子设备和介质 | |
CN115455019A (zh) | 一种基于用户行为分析的搜索意图识别方法、装置及设备 | |
CN116502841A (zh) | 一种事件的处理方法、装置、电子设备以及介质 | |
CN115329940A (zh) | 一种卷积算法的推荐方法、装置、设备及存储介质 | |
CN115455060A (zh) | 一种数据处理方法、装置、设备及介质 | |
CN117709902A (zh) | 基于bom文件的物料录入方法、装置、设备及介质 | |
CN116703109A (zh) | 一种配电网项目选取方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |