CN114419528B - 异常识别方法、装置、计算机设备及计算机可读存储介质 - Google Patents

异常识别方法、装置、计算机设备及计算机可读存储介质 Download PDF

Info

Publication number
CN114419528B
CN114419528B CN202210336675.8A CN202210336675A CN114419528B CN 114419528 B CN114419528 B CN 114419528B CN 202210336675 A CN202210336675 A CN 202210336675A CN 114419528 B CN114419528 B CN 114419528B
Authority
CN
China
Prior art keywords
data
identified
abnormal
sample
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210336675.8A
Other languages
English (en)
Other versions
CN114419528A (zh
Inventor
王帅
杨攸奕
张勇
郭春晓
邵帅
叶孝璐
马赞华
孙会业
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Koubei Network Technology Co Ltd
Original Assignee
Zhejiang Koubei Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Koubei Network Technology Co Ltd filed Critical Zhejiang Koubei Network Technology Co Ltd
Priority to CN202210336675.8A priority Critical patent/CN114419528B/zh
Publication of CN114419528A publication Critical patent/CN114419528A/zh
Application granted granted Critical
Publication of CN114419528B publication Critical patent/CN114419528B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • G08B21/02Alarms for ensuring the safety of persons
    • G08B21/04Alarms for ensuring the safety of persons responsive to non-activity, e.g. of elderly persons
    • G08B21/0438Sensor means for detecting
    • G08B21/0476Cameras to detect unsafe condition, e.g. video cameras

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Gerontology & Geriatric Medicine (AREA)
  • Business, Economics & Management (AREA)
  • Emergency Management (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种异常识别方法、装置、计算机设备及计算机可读存储介质,涉及互联网技术领域,通过对多元数据进行多层级的深度学习,实现从易到难的异常识别,泛化能力强,保证异常的识别结果的准确性。所述方法包括:获取数据采集设备采集到的待识别数据;同时或分别基于时间序列、神经网络模型对待识别数据进行识别;当基于时间序列确定待识别数据随时间变化的趋势符合预设条件且基于神经网络模型识别确定待识别数据的误差值满足误差阈值时,获取特征识别模型,匹配数据采集设备绑定的用户的基本属性信息;采用特征识别模型以及基本属性信息对待识别数据进行特征识别,得到至少两个识别结果;根据至少两个识别结果,输出数据异常概率。

Description

异常识别方法、装置、计算机设备及计算机可读存储介质
技术领域
本申请涉及互联网技术领域,特别是涉及一种异常识别方法、装置、计算机设备及计算机可读存储介质。
背景技术
目前,我国已成为世界上老年人口最多的国家,也是人口老龄化发展速度最快的国家之一,与此同时,我国养老产业面临严重资源供给不足,难以满足人民对专业养老的需求。其中,特别独居老人的生命安全保障问题,尤为牵动子女的心弦。
独居老人在家容易出现意外或麻烦,比如突发疾病或意外摔伤,有时无法动弹不能及时通知子女,从而无法第一时间得到救治或照顾,生命安全将会受到严重威胁。因此,亟需一种识别老人行为是否发生异常的方法,以便及时发现老人的异常行为并进行异常警报,保证老人日常活动的安全。
发明内容
有鉴于此,本申请提供了一种异常识别方法、装置、计算机设备及计算机可读存储介质,主要目的在于解决目前独居老人在家容易出现意外或麻烦,比如突发疾病或意外摔伤,有时无法动弹不能及时通知子女,从而无法第一时间得到救治或照顾,生命安全将会受到严重威胁的问题。
依据本申请第一方面,提供了一种异常识别方法,该方法包括:
获取至少一个数据采集设备采集到的数据作为待识别数据;
同时或分别基于时间序列、神经网络模型对所述待识别数据进行识别,所述时间序列用于识别所述待识别数据随时间变化的趋势,所述神经网络模型采用所述至少一个数据采集设备在历史时间段内上传的未发生异常的数据构建;
当基于所述时间序列确定所述待识别数据随时间变化的趋势符合预设条件且基于所述神经网络模型识别确定所述待识别数据的误差值满足误差阈值时,获取特征识别模型,匹配至少一个数据采集设备绑定的用户的基本属性信息;
采用所述特征识别模型以及所述基本属性信息对所述待识别数据进行特征识别,得到至少两个识别结果;
根据所述至少两个识别结果,输出所述待识别数据的数据异常概率。
可选地,所述获取至少一个数据采集设备采集到的数据作为待识别数据之前,所述方法还包括:
获取所述至少一个数据采集设备在所述历史时间段内上传的多个历史数据,在所述多个历史数据中提取对应的数据异常概率指示未发生异常的多个历史数据作为多个样本数据;
采用深度学习算法对所述多个样本数据进行编译,得到多个样本编码;
对所述多个样本编码进行反编译,确定用于指示未发生异常的编码方式;
基于多层感知器对所述编码方式进行训练,得到多个第一输出值,以及采用分类器对所述多个第一输出值进行逻辑回归训练,得到所述神经网络模型,以及每隔更新周期,重新获取多个新的样本数据,基于所述多个新的样本数据对所述神经网络模型进行更新。
可选地,所述获取所述至少一个数据采集设备在所述历史时间段内上传的多个历史数据,在所述多个历史数据中提取对应的数据异常概率指示未发生异常的多个历史数据作为多个样本数据之后,所述方法还包括:
在所述多个样本数据中提取视频图像类的指定样本数据,对所述指定样本数据进行图像特征提取,得到多个样本图像特征;
采用深度学习算法对所述多个图像特征进行编译,得到多个特征编码,以及对所述多个特征编码进行反编译,得到用于指示视频图像数据未发生异常的多个视频图像编码方式;
基于多层感知器对所述多个视频图像编码方式进行训练,得到多个第二输出值,以及采用分类器对所述多个第二输出值进行逻辑回归训练,将训练得到用于识别视频图像类数据是否存在异常的数据模型作为所述特征识别模型。
可选地,所述获取所述至少一个数据采集设备在所述历史时间段内上传的多个历史数据,在所述多个历史数据中提取对应的数据异常概率指示未发生异常的多个历史数据作为多个样本数据之后,所述方法还包括:
分别确定上传所述多个样本数据中每个样本数据的数据采集设备,将由同一数据采集设备上传的传感器类的样本数据划分至同一组,得到至少一个第一数据组;
对所述至少一个第一数据组中每个第一数据组进行以下处理:确定所述第一数据组的数据属性对应的数据期望值,统计所述第一数据组中每个样本数据的取值与所述数据期望值之间的样本误差值,得到所述数据组的多个样本误差值,以及采用所述数据属性对所述多个样本误差值进行标注;
获取所述至少一个第一数据组中每个第一数据组对应的多个样本误差值组成训练集,以及采用误差逆向传播算法对所述训练集进行训练,将训练得到的用于识别传感器类数据是否存在异常的数据模型作为所述特征识别模型。
可选地,基于时间序列对所述待识别数据进行识别,包括:
确定多个预设行为,在所述待识别数据中提取与所述多个预设行为相关的多个子数据,根据所述时间序列以及所述多个子数据的数据取值,确定所述多个预设行为中每个预设行为的行为持续时长,以及根据所述多个预设行为之间的关联关系,计算存在关联关系的两个预设行为的持续时间的比值,判断所述比值是否符合所述预设条件;和/或,
将所述待识别数据中同一数据采集设备上传的数据划分至同一组,得到至少一个第二数据组,对所述至少一个第二数据组中每个第二数据组执行以下处理:按照所述时间序列,计算所述第二数据组包括的相邻两个时间点对应的数据的数据变化值,以及判断所述数据变化值是否符合所述预设条件;和/或,
确定所述时间序列指示的峰值时间点,在所述待识别数据中提取在所述峰值时间点采集到的至少一个子数据,分别查询所述至少一个子数据的数据属性在所述预设条件中对应的数据阈值,判断所述至少一个子数据的数据取值是否高于对应的数据阈值。
可选地,基于初始神经网络对所述待识别数据进行识别,包括:
采用深度学习算法对所述待识别数据进行编译,得到待识别编码;
将所述待识别编码输入至所述神经网络模型,获取所述神经网络模型输出的误差值,以及判断所述误差值是否满足所述误差阈值,所述误差值用于指示所述待识别编码与用于指示未发生异常的编码方式之间的误差。
可选地,所述同时或分别基于时间序列、神经网络模型对所述待识别数据进行识别之后,所述方法还包括:
当基于所述时间序列确定所述待识别数据随时间变化的趋势不符合所述预设条件或基于所述神经网络模型识别确定所述待识别数据的误差值不满足所述误差阈值时,确定所述待识别数据存在异常;
查询产生所述待识别数据的异常对象,生成用于指示所述异常对象发生异常的第一预警提醒,以及向预设接收方发送所述第一预警提醒,所述异常对象是数据采集设备或所述数据采集设备绑定的用户。
可选地,所述采用所述特征识别模型以及所述基本属性信息对所述待识别数据进行特征识别,得到至少两个识别结果,包括:
在所述待识别数据中提取视频图像类的目标数据,将所述目标数据输入至用于识别视频图像类数据是否存在异常的特征识别模型,得到输出的识别结果,以及同时或分别将其他数据输入至用于识别传感器类数据是否存在异常的特征识别模型,得到输出的识别结果,所述其他数据是所述待识别数据中除所述目标数据外的数据;
同时或分别查询与所述基本属性信息匹配的标准体征参数,在所述待识别数据中确定用于指示生物体征的生物体征信息,以及将所述生物体征信息与所述标准体征参数进行比对,确定所述生物体征信息与所述标准体征参数之间的参数区别点,生成指示所述参数区别点的识别结果,得到所述至少两个识别结果。
可选地,所述根据所述至少两个识别结果,输出所述待识别数据的数据异常概率,包括:
对所述至少两个识别结果进行归一化处理,得到所述至少两个识别结果的结果特征分布;
对所述结果特征分布进行逻辑回归处理,将处理后得到的值作为所述待识别数据的数据异常概率。
可选地,所述获取至少一个数据采集设备采集到的数据作为待识别数据之后,所述方法还包括:
当所述待识别数据中包括视频图像类的数据时,在所述待识别数据中提取所述视频图像类的数据;
将所述视频图像类的数据输入至用于识别视频图像类数据是否存在异常的特征识别模型,得到图像数据识别结果;
若所述图像数据识别结果指示所述视频图像类的数据存在异常,则识别所述视频图像类的数据中包括的视频对象,在所述视频图像类的数据中标记所述视频对象,以及生成携带标记后的所述视频图像类的数据的第二预警提醒,向预设接收方发送所述第二预警提醒。
依据本申请第二方面,提供了一种异常识别装置,该装置包括:
获取模块,用于获取至少一个数据采集设备采集到的数据作为待识别数据;
识别模块,用于同时或分别基于时间序列、神经网络模型对所述待识别数据进行识别,所述时间序列用于识别所述待识别数据随时间变化的趋势,所述神经网络模型采用所述至少一个数据采集设备在历史时间段内上传的未发生异常的数据构建;
所述获取模块,还用于当基于所述时间序列确定所述待识别数据随时间变化的趋势符合预设条件且基于所述神经网络模型识别确定所述待识别数据的误差值满足误差阈值时,获取特征识别模型,匹配至少一个数据采集设备绑定的用户的基本属性信息;
所述识别模块,用于采用所述特征识别模型以及所述基本属性信息对所述待识别数据进行特征识别,得到至少两个识别结果;
输出模块,用于根据所述至少两个识别结果,输出所述待识别数据的数据异常概率。
可选地,所述获取模块,还用于获取所述至少一个数据采集设备在所述历史时间段内上传的多个历史数据,在所述多个历史数据中提取对应的数据异常概率指示未发生异常的多个历史数据作为多个样本数据;
所述装置还包括:
编译模块,用于采用深度学习算法对所述多个样本数据进行编译,得到多个样本编码;
所述编译模块,还用于对所述多个样本编码进行反编译,确定用于指示未发生异常的编码方式;
训练模块,用于基于多层感知器对所述编码方式进行训练,得到多个第一输出值,以及采用分类器对所述多个第一输出值进行逻辑回归训练,得到所述神经网络模型,以及每隔更新周期,重新获取多个新的样本数据,基于所述多个新的样本数据对所述神经网络模型进行更新。
可选地,所述装置还包括:
第一提取模块,用于在所述多个样本数据中提取视频图像类的指定样本数据,对所述指定样本数据进行图像特征提取,得到多个样本图像特征;
所述编译模块,还用于采用深度学习算法对所述多个图像特征进行编译,得到多个特征编码,以及对所述多个特征编码进行反编译,得到用于指示视频图像数据未发生异常的多个视频图像编码方式;
所述训练模块,还用于基于多层感知器对所述多个视频图像编码方式进行训练,得到多个第二输出值,以及采用分类器对所述多个第二输出值进行逻辑回归训练,将训练得到用于识别视频图像类数据是否存在异常的数据模型作为所述特征识别模型。
可选地,所述装置还包括:
划分模块,用于分别确定上传所述多个样本数据中每个样本数据的数据采集设备,将由同一数据采集设备上传的传感器类的样本数据划分至同一组,得到至少一个第一数据组;
统计模块,用于对所述至少一个第一数据组中每个第一数据组进行以下处理:确定所述第一数据组的数据属性对应的数据期望值,统计所述第一数据组中每个样本数据的取值与所述数据期望值之间的样本误差值,得到所述数据组的多个样本误差值,以及采用所述数据属性对所述多个样本误差值进行标注;
所述训练模块,还用于获取所述至少一个第一数据组中每个第一数据组对应的多个样本误差值组成训练集,以及采用误差逆向传播算法对所述训练集进行训练,将训练得到的用于识别传感器类数据是否存在异常的数据模型作为所述特征识别模型。
可选地,所述识别模块,用于确定多个预设行为,在所述待识别数据中提取与所述多个预设行为相关的多个子数据,根据所述时间序列以及所述多个子数据的数据取值,确定所述多个预设行为中每个预设行为的行为持续时长,以及根据所述多个预设行为之间的关联关系,计算存在关联关系的两个预设行为的持续时间的比值,判断所述比值是否符合所述预设条件;和/或,将所述待识别数据中同一数据采集设备上传的数据划分至同一组,得到至少一个第二数据组,对所述至少一个第二数据组中每个第二数据组执行以下处理:按照所述时间序列,计算所述第二数据组包括的相邻两个时间点对应的数据的数据变化值,以及判断所述数据变化值是否符合所述预设条件;和/或,确定所述时间序列指示的峰值时间点,在所述待识别数据中提取在所述峰值时间点采集到的至少一个子数据,分别查询所述至少一个子数据的数据属性在所述预设条件中对应的数据阈值,判断所述至少一个子数据的数据取值是否高于对应的数据阈值。
可选地,所述识别模块,用于采用深度学习算法对所述待识别数据进行编译,得到待识别编码;将所述待识别编码输入至所述神经网络模型,获取所述神经网络模型输出的误差值,以及判断所述误差值是否满足所述误差阈值,所述误差值用于指示所述待识别编码与用于指示未发生异常的编码方式之间的误差。
可选地,所述装置还包括:
确定模块,用于当基于所述时间序列确定所述待识别数据随时间变化的趋势不符合所述预设条件或基于所述神经网络模型识别确定所述待识别数据的误差值不满足所述误差阈值时,确定所述待识别数据存在异常;
查询模块,用于查询产生所述待识别数据的异常对象,生成用于指示所述异常对象发生异常的第一预警提醒,以及向预设接收方发送所述第一预警提醒,所述异常对象是数据采集设备或所述数据采集设备绑定的用户。
可选地,所述识别模块,用于在所述待识别数据中提取视频图像类的目标数据,将所述目标数据输入至用于识别视频图像类数据是否存在异常的特征识别模型,得到输出的识别结果,以及同时或分别将其他数据输入至用于识别传感器类数据是否存在异常的特征识别模型,得到输出的识别结果,所述其他数据是所述待识别数据中除所述目标数据外的数据;同时或分别查询与所述基本属性信息匹配的标准体征参数,在所述待识别数据中确定用于指示生物体征的生物体征信息,以及将所述生物体征信息与所述标准体征参数进行比对,确定所述生物体征信息与所述标准体征参数之间的参数区别点,生成指示所述参数区别点的识别结果,得到所述至少两个识别结果。
可选地,所述输出模块,用于对所述至少两个识别结果进行归一化处理,得到所述至少两个识别结果的结果特征分布;对所述结果特征分布进行逻辑回归处理,将处理后得到的值作为所述待识别数据的数据异常概率。
可选地,所述装置还包括:
第二提取模块,用于当所述待识别数据中包括视频图像类的数据时,在所述待识别数据中提取所述视频图像类的数据;
输入模块,用于将所述视频图像类的数据输入至用于识别视频图像类数据是否存在异常的特征识别模型,得到图像数据识别结果;
标记模块,用于若所述图像数据识别结果指示所述视频图像类的数据存在异常,则识别所述视频图像类的数据中包括的视频对象,在所述视频图像类的数据中标记所述视频对象,以及生成携带标记后的所述视频图像类的数据的第二预警提醒,向预设接收方发送所述第二预警提醒。
依据本申请第三方面,提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面中任一项所述方法的步骤。
依据本申请第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任一项所述的方法的步骤。
借由上述技术方案,本申请提供的一种异常识别方法、装置、计算机设备及计算机可读存储介质,本申请获取到数据采集设备采集到的待识别数据后,同时或分别基于时间序列、神经网络模型对待识别数据进行识别,当基于时间序列确定待识别数据随时间变化的趋势符合预设条件且基于神经网络识别确定待识别数据的误差值满足误差阈值时,获取特征识别模型,匹配至少一个数据采集设备绑定的用户的基本属性信息,并采用特征识别模型以及基本属性信息对待识别数据进行特征识别,得到至少两个识别结果,根据至少两个识别结果,输出待识别数据的数据异常概率,通过对多元数据进行多层级的深度学习,实现从易到难的异常识别,泛化能力强,保证异常的识别结果的准确性。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本申请实施例提供的一种异常识别方法流程示意图;
图2A示出了本申请实施例提供的一种异常识别方法流程示意图;
图2B示出了本申请实施例提供的一种算法结构的示意图;
图3示出了本申请实施例提供的一种异常识别装置的结构示意图;
图4示出了本申请实施例提供的一种计算机设备的装置结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
本申请实施例提供了一种异常识别方法,如图1所示,该方法包括:
101、获取至少一个数据采集设备采集到的数据作为待识别数据。
目前,我国已成为世界上老年人口最多的国家,也是人口老龄化发展速度最快的国家之一,与此同时,我国养老产业面临严重资源供给不足,难以满足人民对专业养老的需求。其中,特别独居老人的生命安全保障问题,尤为牵动子女的心弦。空巢老人的照料主要依靠配偶,对于丧偶、子女又不在身边的独居老人,问题更为突出,独居老人突发疾病或者不小心摔倒受伤时,如果抢救不及时,生命安全将会受到严重威胁。因此,本申请提出了一种异常识别方法,采用多层级、多模态的识别方式,实现端到端的老人行为的异常识别。
本申请实施例提供的异常识别方法可以由服务器或具有计算能力的计算机设备执行。为了实现对老人是否发生异常进行识别,需要设置至少一个数据采集设备,将至少一个数据采集设备与服务器或计算机设备进行对接,使至少一个数据采集设备采集老人自身以及其当前所处环境内的数据进行上传,以便服务器或计算机设备执行本申请实施例描述的技术方案,及时识别确定至少一个数据采集设备上传的数据中是否存在异常。其中,至少一个数据采集设备可以包括具有体征数据采集功能的手环、手表等等,用户佩戴数据采集设备后,数据采集设备可以获取用户的心率、睡眠时间等等;或者,也可以包括具有视频、音频采集功能的摄像头等,使得数据采集设备采集用户当前所处环境的画面;或者,还可以包括具有烟感、温感、光感等功能的传感器设备,使得这些数据采集设备采集一些能够描述用户当前所处环境的环境状态的参数,进而基于这些环境状态的参数,及时发现摄像头、手环等设备无法发现的异常。
实际应用的过程中,上述提及的数据采集设备可以同时进行工作并实时将采集到的数据上传给服务器或计算机设备,使得服务器或计算机设备获取至少一个数据采集设备采集到的数据作为待识别数据,后续开始对待识别数据进行识别。在本申请实施例中,以服务器执行异常识别过程为例进行说明,需要说明的是,数据采集设备向服务器提供的采集到的数据可以包括数据采集设备基于其自身的采集功能采集到的有关用户或用户所处场景的数据,还可以包括用于指示数据采集设备自身工作状态的数据,比如数据采集设备的电量、温度等设备状态参数,以使得服务器接收到数据采集设备上传的数据后不仅能够对用户的行为或环境中是否存在异常进行识别,还能够对数据采集设备本身是否存在设备异常进行识别。本申请对数据采集设备上传至服务器的具体数据内容不进行限定。
102、同时或分别基于时间序列、神经网络模型对待识别数据进行识别。
在本申请实施例中,为了对待识别数据有一个初步的识别,从而及时确定一些较为明显的异常,对异常进行迅速响应,服务器获取到待识别数据后,会同时或分别基于时间序列、神经网络模型对待识别数据进行识别,实现待识别数据的纵向单维特征无监督异常检测、横向多维特征无监督异常检测。
其中,时间序列用于识别待识别数据随时间变化的趋势,利用纵向时间序列的特征进行数据的单维特征自身对比,通过容忍度测算、突变测算、差值测算、峰值测算等进行数据变化的同比、环比等计算,从而确定数据是否存在异常。具体地,容忍度测算也即测算不同维度之间的比例,如坐时间占所有行为时间比例;突变测算也即测算数据在年、月、日、时、分、秒维度上的同比、环比的变化;差值测算也即测算数据在年、月、日、时、分、秒维度上的差值的变化;峰值测算也即为单点设置阈值,从而判断待识别数据中单点数据的取值是否超出该阈值。基于时间序列进行待识别数据的识别时,能够快速发现待识别数据是否存在异常,比如指示用户心率的数据由145毫秒突降为95毫秒,已经超出了141毫秒加减39毫秒的正常范围,便可以直接确定用户发生异常,及时进行异常响应。需要说明的是,基于时间序列进行数据的识别不仅可以识别人体异常,也可以识别设备异常,比如识别到数据采集设备的电量由90%突降至20%时,可以直接确定数据采集设备存在异常,进行异常响应。在实际应用的过程中,由于基于时间序列实际上能够描述各项参数随时间变化的趋势,因此,实际上基于时间序列确定数据不存在异常后,可将该不存在异常的数据保留存储,用作后续用于构建神经网络模型的样本数据,为建模提供特征,从而减轻样本收集的压力。
神经网络模型采用至少一个数据采集设备在历史时间段内上传的未发生异常的数据构建,也即采用基于时间序列确定的不存在异常的数据构建。也就是说,基于时间序列对采集到的待识别数据的单维特征进行处理,基于神经网络模型对采集到的待识别数据的多维特征进行处理。实际应用的过程中,在构建神经网络模型时,可以使用AutoEncoder(自编码)算法,通过Encoder(编码)、Decoder(解码)的重建过程,学习到未发生异常的数据的编码方式,进而预测出异常的数据。采用该算法能够高效的识别待识别数据中的异常,对长尾异常行为的处理较好。
103、当基于时间序列确定待识别数据随时间变化的趋势符合预设条件且基于神经网络识别确定待识别数据的误差值满足误差阈值时,获取特征识别模型,匹配至少一个数据采集设备绑定的用户的基本属性信息。
其中,当基于时间序列确定待识别数据随时间变化的趋势符合预设条件且基于神经网络识别确定待识别数据的误差值满足误差阈值(也即待识别数据与正常数据之间的差距较小,足以被忽略)时,表示待识别数据已经通过了初始的数据识别,在上述两层级的识别中为发现数据中的异常。而为了更加准确的识别出数据中不够明显的异常,本申请实施例中设置了有监督、基于深度学习的第三层级,在第三层级中服务器获取特征识别模型,匹配至少一个数据采集设备绑定的用户的基本属性信息,使得在第三层级采用特征识别模型和基本属性信息对待识别数据进行全方位的识别。
104、采用特征识别模型以及基本属性信息对待识别数据进行特征识别,得到至少两个识别结果。
在该层级中,特征识别模型可以包括两种不同的模型,一种是用于识别视频图像类数据是否存在异常的数据模型,另一种是用于识别传感器类数据是否存在异常的数据模型。一方面,用于识别视频图像类数据是否存在异常的数据模型是根据视频图像特征识别用户的行为,该数据模型可以采用ViT(Vision Transformer,图像分类)模型算法进行数据的识别,在识别视频图像类数据时,将输入图片拆分成多个patches(小片),每个patch做一次线性变换降维同时嵌入位置信息,然后送入Transformer,也即在Transformer输入序列前增加了一个额外可学习的[class]标记位,且该位置的Transformer Encoder输出作为图像特征进行识别。由于ViT 首先在大规模的图片数据集上进行预训练,然后再迁移到目标数据集上,因此,分类效果较好且能够节省大量的计算资源。基于该数据模型,可以识别用户的诸如摔倒、下蹲、坐、弯腰等行为动作,进一步地,还能够识别一些诸如烟雾、火焰、聚会等场景。另一方面,用于识别传感器类数据是否存在异常的数据模型可以基于BP(BackPropagation,误差逆向传播算法)神经网络构建,进而通过各种传感器获得体温、心率、血压、脉搏、呼吸数据等人类体征特征后,采用BP神经网络识别用户的身体状况,比如健康、生病、体质弱等。
基本属性信息可以是至少一个数据采集设备绑定的用户的用户画像,在匹配用户画像时,可以请求用户进行授权,并在确定用户授权后自动匹配用户的用户画像。基本属性信息具体可以包括用于指示用户身体素养的一些特征,将基本属性信息与标准体征参数进行比对,从而判断用户的体征数据是否正常。其中,标准体征参数可以事先设置,不同的用户可以设置不同的标准体征参数,比如对于30至40的成年人,其标准体征参数中的脉率值可以设置为60至100次/分,对于55岁以上的老年人,其标准体征参数中的脉率值可以设置为55至60次/分等等。
需要说明的是,由于在本层级采用多种不同的方式进行数据的识别,因此,服务器可以实现按照每种方式识别的数据类型,将待识别数据进行拆分,分成不同的Domain(域),将不同的Domain分别传入用于识别传感器类数据是否存在异常的数据模型、用于识别视频图像类数据是否存在异常的数据模型以及基本属性信息进行同步识别,提升数据识别的效率。另外,考虑到基于特征识别模型和基本属性信息识别数据的难易程度不同,因此,也可以先基于基本属性信息对待识别数据进行识别,再基于用于识别传感器类数据是否存在异常的数据模型进行识别,最后基于用于识别视频图像类数据是否存在异常的数据模型进行识别,从而得到至少两个识别结果。本申请不限制并行还是同步识别不同类的数据。
105、根据所述至少两个识别结果,输出所述待识别数据的数据异常概率。
通过上述步骤得到至少两个识别结果后,服务器根据所述至少两个识别结果,输出所述待识别数据的数据异常概率。也即将至少两个识别结果进行整合,通过深度网络端到端的综合预测一个待识别数据的数据异常概率,进而在后续参考该数据异常概率确定是否需要进行预警提醒。其中,在进行数据异常概率的预测时,可以确定至少两个识别结果的特征分布,进行特征分布的逻辑回归处理,得到一个数值,将该数值作为数据异常概率。
本申请实施例提供的方法,获取到数据采集设备采集到的待识别数据后,同时或分别基于时间序列、神经网络模型对待识别数据进行识别,当基于时间序列确定待识别数据随时间变化的趋势符合预设条件且基于神经网络识别确定待识别数据的误差值满足误差阈值时,获取特征识别模型,匹配至少一个数据采集设备绑定的用户的基本属性信息,并采用特征识别模型以及基本属性信息对待识别数据进行特征识别,得到至少两个识别结果,根据至少两个识别结果,输出待识别数据的数据异常概率,通过对多元数据进行多层级的深度学习,实现从易到难的异常识别,泛化能力强,保证异常的识别结果的准确性。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例的具体实施过程,本申请实施例提供了另一种异常识别方法,如图2A所示,该方法包括:
201、获取至少一个数据采集设备在历史时间段内上传的多个历史数据,在多个历史数据中提取对应的数据异常概率指示未发生异常的多个历史数据作为多个样本数据。
在本申请实施例中,为了实现神经网络模型、特征识别模型的构建,服务器会获取至少一个数据采集设备在历史时间段内上传的多个历史数据,在多个历史数据中提取对应的数据异常概率指示未发生异常的多个历史数据作为多个样本数据。具体地,可以获取过去7天、过去15天、过去30天内至少一个数据采集设备上传的历史数据,在这些历史数据中将异常的数据过滤掉,剩下的历史数据作为样本数据用于后续的模型训练。
202、采用多个样本数据,构建神经网络模型、特征识别模型。
在本申请实施例中,获取到多个样本数据后,服务器采用多个样本数据,构建神经网络模型、特征识别模型。
首先,对神经网络模型的构建过程进行描述:
服务器采用深度学习算法对多个样本数据进行编译,得到多个样本编码,对多个样本编码进行反编译,确定用于指示未发生异常的编码方式,并基于多层感知器对编码方式进行训练,得到多个第一输出值,以及采用分类器对多个第一输出值进行逻辑回归训练,得到神经网络模型。也即通过Encoder、Decoder的重建过程学习到正常数据的编码方式,进而在后续利用这一编码方式确定待识别数据中的异常点。需要说明的是,为了保证神经网络模型的准确性,服务器中可以设置更新周期,从而每隔更新周期,重新获取多个新的样本数据,基于多个新的样本数据对神经网络模型进行更新。
接着,对特征识别模型的构建过程进行描述:
由于特征识别模型可以包括两种不同的数据模型,分别为用于识别视频图像类数据是否存在异常的数据模型以及用于识别传感器类数据是否存在异常的数据模型,因此,分别对两种不同的数据模型的构建过程进行描述:
在构建用于识别视频图像类数据是否存在异常的数据模型时,服务器会在多个样本数据中提取视频图像类的指定样本数据,对指定样本数据进行图像特征提取,得到多个样本图像特征。随后,采用深度学习算法对多个图像特征进行编译,得到多个特征编码,以及对多个特征编码进行反编译,得到用于指示视频图像数据未发生异常的多个视频图像编码方式,并基于多层感知器对多个视频图像编码方式进行训练,得到多个第二输出值,以及采用分类器对多个第二输出值进行逻辑回归训练,将训练得到用于识别视频图像类数据是否存在异常的数据模型作为特征识别模型。实际应用的过程中,可以采用VIT算法构建用于识别视频图像类数据是否存在异常的数据模型,利用 Transformer 对指定样本数据进行分类,不需要卷积网络,采用MLP(Multilayer Perceptron,多层感知机)进行特征训练,以及通过Softmax函数(一种逻辑回归函数)进行回归处理,得到用于识别视频图像类数据是否存在异常的数据模型。需要说明的是,考虑到训练模型时人工定义的行为是有限的,难以实现行为的穷举,因此,可以直接将数据采集设备在历史时间段内采集到的视频图像类数据链接到训练识别视频图像类数据的数据模型的过程中,使训练的数据模型能够自学习一些行为,无需人工频繁定义行为,很大程度解决长尾异常问题。
在构建用于识别传感器类数据是否存在异常的数据模型时,服务器分别确定上传多个样本数据中每个样本数据的数据采集设备,将由同一数据采集设备上传的传感器类的样本数据划分至同一组,得到至少一个第一数据组。接着,对至少一个第一数据组中每个第一数据组进行以下处理:确定第一数据组的数据属性对应的数据期望值,统计第一数据组中每个样本数据的取值与数据期望值之间的样本误差值,得到数据组的多个样本误差值,以及采用数据属性对多个样本误差值进行标注。这样,服务器获取至少一个第一数据组中每个第一数据组对应的多个样本误差值组成训练集,以及采用误差逆向传播算法对训练集进行训练,将训练得到的用于识别传感器类数据是否存在异常的数据模型作为特征识别模型。实际应用的过程中,可以采用BP神经网络进行该数据模型的训练,在训练的正向传播过程中,输入模式从输入层经隐单元层逐层处理,并转向输出层,每一层神经元的状态只影响下一层神经元的状态。如果在输出层不能得到期望的输出,则转入反向传播,将误差信号沿原来的连接通路返回,通过修改各神经元的权值,使得误差信号最小,完成数据模型的训练。
203、获取至少一个数据采集设备采集到的数据作为待识别数据。
在本申请实施例中,服务器会持续接收到至少一个数据采集设备实时采集并上传的数据,服务器获取这些数据作为待识别数据用于后续的异常识别。
需要说明的是,在实际应用的过程中,为了解决长尾异常问题,获取到待识别数据后,当确定待识别数据中包括视频图像类的数据时,服务器可以在待识别数据中提取视频图像类的数据,直接将视频图像类的数据输入至用于识别视频图像类数据是否存在异常的特征识别模型,得到图像数据识别结果。若图像数据识别结果指示视频图像类的数据存在异常,则识别视频图像类的数据中包括的视频对象,在视频图像类的数据中标记视频对象,以及生成携带标记后的视频图像类的数据的第二预警提醒,向预设接收方发送第二预警提醒。其中,视频对象可以是视频中的人物、火焰等,在标记视频对象时,可以采用实线框将视频对象在视频中框起来,使接收到第二预警提醒的预设接收方能够注意到视频对象。预设接收方可以是用户事先在服务器中设置的紧急联系人、看护人员等等。这样,通过上述过程可以直接识别图像中用户的行为或发生的状况,利用视频图像类数据快速定位异常以及快速进行异常的响应。
204、同时或分别基于时间序列、神经网络模型对待识别数据进行识别,当基于时间序列确定待识别数据随时间变化的趋势不符合预设条件或基于神经网络模型识别确定待识别数据的误差值不满足误差阈值时,执行下述步骤205;当基于时间序列确定待识别数据随时间变化的趋势符合预设条件且基于神经网络模型识别确定待识别数据的误差值满足误差阈值时,执行下述步骤206至步骤208。
在本申请实施例中,获取到待识别数据后,服务器同时或分别基于时间序列、神经网络模型对待识别数据进行识别,具体可以二者同步识别,或者也可以先基于时间序列进行识别,确定未识别到异常后,再基于神经网络模型进行识别,本申请对此不进行具体限定。下面,先对基于时间序列对待识别数据进行识别的过程进行描述:
基于时间序列的识别可以采用多种不同的策略:一种策略是确定多个预设行为,在待识别数据中提取与多个预设行为相关的多个子数据,根据时间序列以及多个子数据的数据取值,确定多个预设行为中每个预设行为的行为持续时长,以及根据多个预设行为之间的关联关系,计算存在关联关系的两个预设行为的持续时间的比值,判断比值是否符合预设条件。也即容忍度测算,比如计算坐时间占所有行为时间比例,判断该时间比例是否超出了预设条件规定的时间比例。另一种策略是将待识别数据中同一数据采集设备上传的数据划分至同一组,得到至少一个第二数据组,对至少一个第二数据组中每个第二数据组执行以下处理:按照时间序列,计算第二数据组包括的相邻两个时间点对应的数据的数据变化值,以及判断数据变化值是否符合预设条件。也即差值、突变测算,判断某项数据在相邻时间点的变化或者差值是否超过了预设条件规定的变化范围,从而确定该项数据是否发生突变或者指标是否较多下降。再有一种策略是确定时间序列指示的峰值时间点,在待识别数据中提取在峰值时间点采集到的至少一个子数据,分别查询至少一个子数据的数据属性在预设条件中对应的数据阈值,判断至少一个子数据的数据取值是否高于对应的数据阈值。也即峰值测算,判断峰值时间点上子数据的数据取值是否超出预设条件规定的阈值范围,进而确定是否发生异常。
接着,对基于神经网络模型对待识别数据进行识别的过程进行描述:由于采用编码的方式构建神经网络模型,因此,在识别数据时,也需要采用深度学习算法对待识别数据进行编译,得到待识别编码,将待识别编码输入至神经网络模型,获取神经网络模型输出的误差值,以及判断用于指示待识别编码与用于指示未发生异常的编码方式之间的误差的误差值是否满足误差阈值。需要说明的是,对待识别数据进行编译时采用的深度学习算法也可以是Autoencoder算法,具体编译过程参见上述步骤102,此处不再进行赘述。
这样,通过上述过程完成对待识别数据的识别后,当基于时间序列确定待识别数据随时间变化的趋势不符合预设条件或基于神经网络模型识别确定待识别数据的误差值不满足误差阈值时,表示待识别数据存在异常,需要进行预警提醒,因此执行下述步骤205。需要说明的是,实际应用的过程中,由于基于时间序列进行数据的识别较为迅速,因此,可以先基于时间序列对待识别数据进行识别,在确定待识别数据随时间变化的趋势不符合预设条件时,直接确定待识别数据存在异常,无需再执行神经网络模型的识别,反之则再进行神经网络模型的识别,从而避免对异常数据的反复识别,节省数据资源。或者也可以同步进行时间序列、神经网络模型的识别过程,无论哪种方式识别到待识别数据存在异常,均可以执行下述步骤205,进行告警提醒。
而当基于时间序列确定待识别数据随时间变化的趋势符合预设条件且基于神经网络模型识别确定待识别数据的误差值满足误差阈值时,表示初步确定待识别数据不存在异常,需要继续进行深度的识别,使用多元数据通过多模态深度学习端到端的检测异常,因此,执行下述步骤206至步骤208。
205、当基于时间序列确定待识别数据随时间变化的趋势不符合预设条件或基于神经网络模型识别确定待识别数据的误差值不满足误差阈值时,确定待识别数据存在异常,查询产生待识别数据的异常对象,生成用于指示异常对象发生异常的第一预警提醒,以及向预设接收方发送第一预警提醒,异常对象是数据采集设备或数据采集设备绑定的用户。
在本申请实施例中,当基于时间序列确定待识别数据随时间变化的趋势不符合预设条件或基于神经网络模型识别确定待识别数据的误差值不满足误差阈值时,待识别数据存在异常,需要进行预警提醒。而考虑到数据采集设备会将其采集到的与用户相关的数据以及其自身的工作状态的数据同时上传给服务器,因此,为了明确故障点,服务器会查询产生待识别数据的异常对象,异常对象是数据采集设备或数据采集设备绑定的用户,生成用于指示异常对象发生异常的第一预警提醒,以及向预设接收方发送第一预警提醒。具体地,预设接收方也可以是用户事先在服务器中设置的紧急联系人、看护人员等等,在发送第一预警提醒时,可以突出异常对象,比如异常对象为摄像头时,存在的异常为温度过高时,可以生成“摄像头温度过高!”之类的提醒发送给预设接收方,或者也可以采用语音播报的方式通知数据采集设备绑定的用户以及预设接收方,本申请对通知异常的方式不进行具体限定。
206、当基于时间序列确定待识别数据随时间变化的趋势符合预设条件且基于神经网络识别确定待识别数据的误差值满足误差阈值时,获取特征识别模型,匹配至少一个数据采集设备绑定的用户的基本属性信息。
在本申请实施例中,当基于时间序列确定待识别数据随时间变化的趋势符合预设条件且基于神经网络模型识别确定待识别数据的误差值满足误差阈值时,表示初步确定待识别数据不存在异常,需要继续进行深度的识别,使用多元数据通过多模态深度学习端到端的检测异常,因此,服务器获取特征识别模型,匹配至少一个数据采集设备绑定的用户的基本属性信息,后续利用特征识别模型和基本属性信息继续对待识别数据进行识别。
其中,基本属性信息的相关内容与上述步骤104中描述的内容一致,此处不再赘述。进一步地,由上述步骤202中的内容可知,可以生成两种用于处理不同类型数据的数据模型作为特征识别模型,因此,在获取特征识别模型时,可以获取两种数据模型用于后续的数据识别过程,或者也可以根据待识别数据包括的具体数据内容确定使用哪个数据模型进行数据的识别。比如,待识别数据中只包括传感器类数据,不包括视频图像类数据,则仅基于识别传感器类数据的数据模型进行数据识别即可,无需利用识别视频图像类数据的数据模型。
207、采用特征识别模型以及基本属性信息对待识别数据进行特征识别,得到至少两个识别结果。
在本申请实施例中,服务器开始采用特征识别模型以及基本属性信息对待识别数据进行特征识别,得到至少两个识别结果。由于特征识别模型可能包括两种不同的数据模型,因此,在采用特征识别模型进行待识别数据的识别时,需要在待识别数据中提取视频图像类的目标数据,将目标数据输入至用于识别视频图像类数据是否存在异常的特征识别模型,得到输出的识别结果,以及同时或分别将待识别数据中除目标数据外的其他数据输入至用于识别传感器类数据是否存在异常的特征识别模型,得到输出的识别结果。具体采用特征识别模型的识别过程与上述步骤104中描述的内容一致,此处不再进行赘述。
而对于基本属性信息,服务器会同时或分别查询与基本属性信息匹配的标准体征参数,在待识别数据中确定用于指示生物体征的生物体征信息,以及将生物体征信息与标准体征参数进行比对,确定生物体征信息与标准体征参数之间的参数区别点,生成指示参数区别点的识别结果,得到至少两个识别结果。其中,基本属性信息的内容以及标准体征参数的设置与上述步骤104中描述的内容一致,此处不再进行赘述。在基于基本属性信息进行数据的识别时,可以将生物体征信息拆分为多个数据项,比如可以拆分为心率、脉率值等等,并将这些数据项的取值依次与基于基本属性信息确定的标准体征参数进行比对。比如标准体征参数中规定脉率值为55至60次/分,如果在生物体征信息中获取用户的实际脉率值为58,可以确定用户的脉率值符合标准体征参数的规定,脉率值正常;而如果用户的实际脉率值为67,可以确定用户的脉率值已经超出了正常的范围,脉率值存在异常,则脉率值便可以作为生物体征信息与标准体征参数之间的参数区别点,在识别结果中需要指示脉率值存在异常。
通过上述过程,便可以得到至少两个识别结果,后续综合至少两个识别结果,输出用户当前可能发生异常的概率。
208、对至少两个识别结果进行归一化处理,得到至少两个识别结果的结果特征分布,对结果特征分布进行逻辑回归处理,将处理后得到的值作为待识别数据的数据异常概率。
在本申请实施例中,得到至少两个识别结果后,服务器对至少两个识别结果进行归一化处理,得到至少两个识别结果的结果特征分布,对结果特征分布进行逻辑回归处理,将处理后得到的值作为待识别数据的数据异常概率。具体地,可以采用BN(BatchNormalization,批标准化)算法进行归一化处理,接着,采用MLP确定结果特征分布,并利用Softmax函数进行逻辑回归处理得到的值即为通过深度网络端到端综合预测的一个数据异常概率。
综上所述,本申请实际上公开了一种多层级、多模态端到端行为异常识别方法的整体算法结构。本申请使用一种层级结构,同时考虑横纵向信息,也可以看成一种网状结构。如图2B所示,本申请中的算法结构分为三个层级,第一层级为无监督任务,基于时间序列进行识别,使用纵向单维特征无监督识别异常,比如容忍度测算、突变测算、差值测算、峰值测算等等;第二层级也为无监督任务,基于神经网络进行识别,使用横向多维特征无监督识别异常,在第二层级中可以基于第一层级传回的不存在异常的数据进行神经网络的训练,或者也可以基于收集到的样本数据进行训练,还可以同时基于传回的数据和样本数据进行训练;第三层级为有监督任务,基于深度学习进行识别,使用多元数据、基于多模态深度学习有监督识别异常。其中,前两层是无监督任务,无监督任务是很必要的,有些明显的异常无需经过后面复杂的有监督模型的识别,能够快速响应,而且初期还可以基于无监督任务进行数据采集,以便后面更好的做有监督任务。最后一层则是复杂的有监督任务,使用包括基本属性信息(比如用户画像数据)、传感器类数据、视频图像类数据的多元数据,通过多模态深度学习端到端的异常识别,采用深度网络输出数据异常概率,进而保证识别到更深层次的异常,三个层级之间相互配合,实现从易到难的异常识别。
本申请实施例提供的方法,获取到数据采集设备采集到的待识别数据后,同时或分别基于时间序列、神经网络模型对待识别数据进行识别,当基于时间序列确定待识别数据随时间变化的趋势符合预设条件且基于神经网络识别确定待识别数据的误差值满足误差阈值时,获取特征识别模型,匹配至少一个数据采集设备绑定的用户的基本属性信息,并采用特征识别模型以及基本属性信息对待识别数据进行特征识别,得到至少两个识别结果,根据至少两个识别结果,输出待识别数据的数据异常概率,通过对多元数据进行多层级的深度学习,实现从易到难的异常识别,泛化能力强,保证异常的识别结果的准确性。
进一步地,作为图1所述方法的具体实现,本申请实施例提供了一种异常识别装置,如图3所示,所述装置包括:获取模块301,识别模块302和输出模块303。
该获取模块301,用于获取至少一个数据采集设备采集到的数据作为待识别数据;
该识别模块302,用于同时或分别基于时间序列、神经网络模型对所述待识别数据进行识别,所述时间序列用于识别所述待识别数据随时间变化的趋势,所述神经网络模型采用所述至少一个数据采集设备在历史时间段内上传的未发生异常的数据构建;
该获取模块301,还用于当基于所述时间序列确定所述待识别数据随时间变化的趋势符合预设条件且基于所述神经网络模型识别确定所述待识别数据的误差值满足误差阈值时,获取特征识别模型,匹配至少一个数据采集设备绑定的用户的基本属性信息;
该识别模块302,用于采用所述特征识别模型以及所述基本属性信息对所述待识别数据进行特征识别,得到至少两个识别结果;
该输出模块303,用于根据所述至少两个识别结果,输出所述待识别数据的数据异常概率。
在具体的应用场景中,该获取模块301,还用于获取所述至少一个数据采集设备在所述历史时间段内上传的多个历史数据,在所述多个历史数据中提取对应的数据异常概率指示未发生异常的多个历史数据作为多个样本数据;
该装置还包括:
编译模块,用于采用深度学习算法对所述多个样本数据进行编译,得到多个样本编码;
该编译模块,还用于对所述多个样本编码进行反编译,确定用于指示未发生异常的编码方式;
训练模块,用于基于多层感知器对所述编码方式进行训练,得到多个第一输出值,以及采用分类器对所述多个第一输出值进行逻辑回归训练,得到所述神经网络模型,以及每隔更新周期,重新获取多个新的样本数据,基于所述多个新的样本数据对所述神经网络模型进行更新。
在具体的应用场景中,该装置还包括:
第一提取模块,用于在所述多个样本数据中提取视频图像类的指定样本数据,对所述指定样本数据进行图像特征提取,得到多个样本图像特征;
该编译模块,还用于采用深度学习算法对所述多个图像特征进行编译,得到多个特征编码,以及对所述多个特征编码进行反编译,得到用于指示视频图像数据未发生异常的多个视频图像编码方式;
该训练模块,还用于基于多层感知器对所述多个视频图像编码方式进行训练,得到多个第二输出值,以及采用分类器对所述多个第二输出值进行逻辑回归训练,将训练得到用于识别视频图像类数据是否存在异常的数据模型作为所述特征识别模型。
在具体的应用场景中,该装置还包括:
划分模块,用于分别确定上传所述多个样本数据中每个样本数据的数据采集设备,将由同一数据采集设备上传的传感器类的样本数据划分至同一组,得到至少一个第一数据组;
统计模块,用于对所述至少一个第一数据组中每个第一数据组进行以下处理:确定所述第一数据组的数据属性对应的数据期望值,统计所述第一数据组中每个样本数据的取值与所述数据期望值之间的样本误差值,得到所述数据组的多个样本误差值,以及采用所述数据属性对所述多个样本误差值进行标注;
该训练模块,还用于获取所述至少一个第一数据组中每个第一数据组对应的多个样本误差值组成训练集,以及采用误差逆向传播算法对所述训练集进行训练,将训练得到的用于识别传感器类数据是否存在异常的数据模型作为所述特征识别模型。
在具体的应用场景中,该识别模块302,用于确定多个预设行为,在所述待识别数据中提取与所述多个预设行为相关的多个子数据,根据所述时间序列以及所述多个子数据的数据取值,确定所述多个预设行为中每个预设行为的行为持续时长,以及根据所述多个预设行为之间的关联关系,计算存在关联关系的两个预设行为的持续时间的比值,判断所述比值是否符合所述预设条件;和/或,将所述待识别数据中同一数据采集设备上传的数据划分至同一组,得到至少一个第二数据组,对所述至少一个第二数据组中每个第二数据组执行以下处理:按照所述时间序列,计算所述第二数据组包括的相邻两个时间点对应的数据的数据变化值,以及判断所述数据变化值是否符合所述预设条件;和/或,确定所述时间序列指示的峰值时间点,在所述待识别数据中提取在所述峰值时间点采集到的至少一个子数据,分别查询所述至少一个子数据的数据属性在所述预设条件中对应的数据阈值,判断所述至少一个子数据的数据取值是否高于对应的数据阈值。
在具体的应用场景中,该识别模块302,用于采用深度学习算法对所述待识别数据进行编译,得到待识别编码;将所述待识别编码输入至所述神经网络模型,获取所述神经网络模型输出的误差值,以及判断所述误差值是否满足所述误差阈值,所述误差值用于指示所述待识别编码与用于指示未发生异常的编码方式之间的误差。
在具体的应用场景中,该装置还包括:
确定模块,用于当基于所述时间序列确定所述待识别数据随时间变化的趋势不符合所述预设条件或基于所述神经网络模型识别确定所述待识别数据的误差值不满足所述误差阈值时,确定所述待识别数据存在异常;
查询模块,用于查询产生所述待识别数据的异常对象,生成用于指示所述异常对象发生异常的第一预警提醒,以及向预设接收方发送所述第一预警提醒,所述异常对象是数据采集设备或所述数据采集设备绑定的用户。
在具体的应用场景中,该识别模块302,用于在所述待识别数据中提取视频图像类的目标数据,将所述目标数据输入至用于识别视频图像类数据是否存在异常的特征识别模型,得到输出的识别结果,以及同时或分别将其他数据输入至用于识别传感器类数据是否存在异常的特征识别模型,得到输出的识别结果,所述其他数据是所述待识别数据中除所述目标数据外的数据;同时或分别查询与所述基本属性信息匹配的标准体征参数,在所述待识别数据中确定用于指示生物体征的生物体征信息,以及将所述生物体征信息与所述标准体征参数进行比对,确定所述生物体征信息与所述标准体征参数之间的参数区别点,生成指示所述参数区别点的识别结果,得到所述至少两个识别结果。
在具体的应用场景中,该输出模块303,用于对所述至少两个识别结果进行归一化处理,得到所述至少两个识别结果的结果特征分布;对所述结果特征分布进行逻辑回归处理,将处理后得到的值作为所述待识别数据的数据异常概率。
在具体的应用场景中,该装置还包括:
第二提取模块,用于当所述待识别数据中包括视频图像类的数据时,在所述待识别数据中提取所述视频图像类的数据;
输入模块,用于将所述视频图像类的数据输入至用于识别视频图像类数据是否存在异常的特征识别模型,得到图像数据识别结果;
标记模块,用于若所述图像数据识别结果指示所述视频图像类的数据存在异常,则识别所述视频图像类的数据中包括的视频对象,在所述视频图像类的数据中标记所述视频对象,以及生成携带标记后的所述视频图像类的数据的第二预警提醒,向预设接收方发送所述第二预警提醒。
本申请实施例提供的装置,获取到数据采集设备采集到的待识别数据后,同时或分别基于时间序列、神经网络模型对待识别数据进行识别,当基于时间序列确定待识别数据随时间变化的趋势符合预设条件且基于神经网络识别确定待识别数据的误差值满足误差阈值时,获取特征识别模型,匹配至少一个数据采集设备绑定的用户的基本属性信息,并采用特征识别模型以及基本属性信息对待识别数据进行特征识别,得到至少两个识别结果,根据至少两个识别结果,输出待识别数据的数据异常概率,通过对多元数据进行多层级的深度学习,实现从易到难的异常识别,泛化能力强,保证异常的识别结果的准确性。
需要说明的是,本申请实施例提供的一种异常识别装置所涉及各功能单元的其他相应描述,可以参考图1和图2A至图2B中的对应描述,在此不再赘述。
在示例性实施例中,参见图4,还提供了一种计算机设备,该计算机设备包括总线、处理器、存储器和通信接口,还可以包括输入输出接口和显示设备,其中,各个功能单元之间可以通过总线完成相互间的通信。该存储器存储有计算机程序,处理器,用于执行存储器上所存放的程序,执行上述实施例中的异常识别方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的异常识别方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。
本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。
以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (13)

1.一种异常识别方法,其特征在于,包括:
获取至少一个数据采集设备采集到的数据作为待识别数据;
同时或分别基于时间序列、神经网络模型对所述待识别数据进行识别,所述时间序列用于识别所述待识别数据随时间变化的趋势,所述神经网络模型采用所述至少一个数据采集设备在历史时间段内上传的未发生异常的数据构建,其中,基于所述时间序列进行识别时,利用纵向时间序列的特征对所述待识别数据的单维特征变化进行同比或环比计算,确定所述待识别数据是否存在异常;
当基于所述时间序列确定所述待识别数据随时间变化的趋势符合预设条件且基于所述神经网络模型识别确定所述待识别数据的误差值满足误差阈值时,获取特征识别模型,匹配至少一个数据采集设备绑定的用户的基本属性信息;
采用所述特征识别模型以及所述基本属性信息对所述待识别数据进行特征识别,得到至少两个识别结果;
根据所述至少两个识别结果,输出所述待识别数据的数据异常概率。
2.根据权利要求1所述的方法,其特征在于,所述获取至少一个数据采集设备采集到的数据作为待识别数据之前,所述方法还包括:
获取所述至少一个数据采集设备在所述历史时间段内上传的多个历史数据,在所述多个历史数据中提取对应的数据异常概率指示未发生异常的多个历史数据作为多个样本数据;
采用深度学习算法对所述多个样本数据进行编译,得到多个样本编码;
对所述多个样本编码进行反编译,确定用于指示未发生异常的编码方式;
基于多层感知器对所述编码方式进行训练,得到多个第一输出值,以及采用分类器对所述多个第一输出值进行逻辑回归训练,得到所述神经网络模型,以及每隔更新周期,重新获取多个新的样本数据,基于所述多个新的样本数据对所述神经网络模型进行更新。
3.根据权利要求2所述的方法,其特征在于,所述获取所述至少一个数据采集设备在所述历史时间段内上传的多个历史数据,在所述多个历史数据中提取对应的数据异常概率指示未发生异常的多个历史数据作为多个样本数据之后,所述方法还包括:
在所述多个样本数据中提取视频图像类的指定样本数据,对所述指定样本数据进行图像特征提取,得到多个样本图像特征;
采用深度学习算法对所述多个图像特征进行编译,得到多个特征编码,以及对所述多个特征编码进行反编译,得到用于指示视频图像数据未发生异常的多个视频图像编码方式;
基于多层感知器对所述多个视频图像编码方式进行训练,得到多个第二输出值,以及采用分类器对所述多个第二输出值进行逻辑回归训练,将训练得到用于识别视频图像类数据是否存在异常的数据模型作为所述特征识别模型。
4.根据权利要求2所述的方法,其特征在于,所述获取所述至少一个数据采集设备在所述历史时间段内上传的多个历史数据,在所述多个历史数据中提取对应的数据异常概率指示未发生异常的多个历史数据作为多个样本数据之后,所述方法还包括:
分别确定上传所述多个样本数据中每个样本数据的数据采集设备,将由同一数据采集设备上传的传感器类的样本数据划分至同一组,得到至少一个第一数据组;
对所述至少一个第一数据组中每个第一数据组进行以下处理:确定所述第一数据组的数据属性对应的数据期望值,统计所述第一数据组中每个样本数据的取值与所述数据期望值之间的样本误差值,得到所述数据组的多个样本误差值,以及采用所述数据属性对所述多个样本误差值进行标注;
获取所述至少一个第一数据组中每个第一数据组对应的多个样本误差值组成训练集,以及采用误差逆向传播算法对所述训练集进行训练,将训练得到的用于识别传感器类数据是否存在异常的数据模型作为所述特征识别模型。
5.根据权利要求1所述的方法,其特征在于,基于时间序列对所述待识别数据进行识别,包括:
确定多个预设行为,在所述待识别数据中提取与所述多个预设行为相关的多个子数据,根据所述时间序列以及所述多个子数据的数据取值,确定所述多个预设行为中每个预设行为的行为持续时长,以及根据所述多个预设行为之间的关联关系,计算存在关联关系的两个预设行为的持续时间的比值,判断所述比值是否符合所述预设条件;和/或,
将所述待识别数据中同一数据采集设备上传的数据划分至同一组,得到至少一个第二数据组,对所述至少一个第二数据组中每个第二数据组执行以下处理:按照所述时间序列,计算所述第二数据组包括的相邻两个时间点对应的数据的数据变化值,以及判断所述数据变化值是否符合所述预设条件;和/或,
确定所述时间序列指示的峰值时间点,在所述待识别数据中提取在所述峰值时间点采集到的至少一个子数据,分别查询所述至少一个子数据的数据属性在所述预设条件中对应的数据阈值,判断所述至少一个子数据的数据取值是否高于对应的数据阈值。
6.根据权利要求1所述的方法,其特征在于,基于初始神经网络对所述待识别数据进行识别,包括:
采用深度学习算法对所述待识别数据进行编译,得到待识别编码;
将所述待识别编码输入至所述神经网络模型,获取所述神经网络模型输出的误差值,以及判断所述误差值是否满足所述误差阈值,所述误差值用于指示所述待识别编码与用于指示未发生异常的编码方式之间的误差。
7.根据权利要求1所述的方法,其特征在于,所述同时或分别基于时间序列、神经网络模型对所述待识别数据进行识别之后,所述方法还包括:
当基于所述时间序列确定所述待识别数据随时间变化的趋势不符合所述预设条件或基于所述神经网络模型识别确定所述待识别数据的误差值不满足所述误差阈值时,确定所述待识别数据存在异常;
查询产生所述待识别数据的异常对象,生成用于指示所述异常对象发生异常的第一预警提醒,以及向预设接收方发送所述第一预警提醒,所述异常对象是数据采集设备或所述数据采集设备绑定的用户。
8.根据权利要求1所述的方法,其特征在于,所述采用所述特征识别模型以及所述基本属性信息对所述待识别数据进行特征识别,得到至少两个识别结果,包括:
在所述待识别数据中提取视频图像类的目标数据,将所述目标数据输入至用于识别视频图像类数据是否存在异常的特征识别模型,得到输出的识别结果,以及同时或分别将其他数据输入至用于识别传感器类数据是否存在异常的特征识别模型,得到输出的识别结果,所述其他数据是所述待识别数据中除所述目标数据外的数据;
同时或分别查询与所述基本属性信息匹配的标准体征参数,在所述待识别数据中确定用于指示生物体征的生物体征信息,以及将所述生物体征信息与所述标准体征参数进行比对,确定所述生物体征信息与所述标准体征参数之间的参数区别点,生成指示所述参数区别点的识别结果,得到所述至少两个识别结果。
9.根据权利要求1所述的方法,其特征在于,所述根据所述至少两个识别结果,输出所述待识别数据的数据异常概率,包括:
对所述至少两个识别结果进行归一化处理,得到所述至少两个识别结果的结果特征分布;
对所述结果特征分布进行逻辑回归处理,将处理后得到的值作为所述待识别数据的数据异常概率。
10.根据权利要求1所述的方法,其特征在于,所述获取至少一个数据采集设备采集到的数据作为待识别数据之后,所述方法还包括:
当所述待识别数据中包括视频图像类的数据时,在所述待识别数据中提取所述视频图像类的数据;
将所述视频图像类的数据输入至用于识别视频图像类数据是否存在异常的特征识别模型,得到图像数据识别结果;
若所述图像数据识别结果指示所述视频图像类的数据存在异常,则识别所述视频图像类的数据中包括的视频对象,在所述视频图像类的数据中标记所述视频对象,以及生成携带标记后的所述视频图像类的数据的第二预警提醒,向预设接收方发送所述第二预警提醒。
11.一种异常识别装置,其特征在于,包括:
获取模块,用于获取至少一个数据采集设备采集到的数据作为待识别数据;
识别模块,用于同时或分别基于时间序列、神经网络模型对所述待识别数据进行识别,所述时间序列用于识别所述待识别数据随时间变化的趋势,所述神经网络模型采用所述至少一个数据采集设备在历史时间段内上传的未发生异常的数据构建,其中,基于所述时间序列进行识别时,利用纵向时间序列的特征对所述待识别数据的单维特征变化进行同比或环比计算,确定所述待识别数据是否存在异常;
所述获取模块,还用于当基于所述时间序列确定所述待识别数据随时间变化的趋势符合预设条件且基于所述神经网络模型识别确定所述待识别数据的误差值满足误差阈值时,获取特征识别模型,匹配至少一个数据采集设备绑定的用户的基本属性信息;
所述识别模块,用于采用所述特征识别模型以及所述基本属性信息对所述待识别数据进行特征识别,得到至少两个识别结果;
输出模块,用于根据所述至少两个识别结果,输出所述待识别数据的数据异常概率。
12.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至10中任一项所述方法的步骤。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法的步骤。
CN202210336675.8A 2022-04-01 2022-04-01 异常识别方法、装置、计算机设备及计算机可读存储介质 Active CN114419528B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210336675.8A CN114419528B (zh) 2022-04-01 2022-04-01 异常识别方法、装置、计算机设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210336675.8A CN114419528B (zh) 2022-04-01 2022-04-01 异常识别方法、装置、计算机设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN114419528A CN114419528A (zh) 2022-04-29
CN114419528B true CN114419528B (zh) 2022-07-08

Family

ID=81262961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210336675.8A Active CN114419528B (zh) 2022-04-01 2022-04-01 异常识别方法、装置、计算机设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN114419528B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115062242B (zh) * 2022-07-11 2023-06-09 金润方舟科技股份有限公司 一种基于区块链和人工智能的信息智能识别方法及大数据系统
CN116149896B (zh) * 2023-03-27 2023-07-21 阿里巴巴(中国)有限公司 时序数据异常检测方法、存储介质和电子设备
CN116523475B (zh) * 2023-06-30 2023-09-19 中国市政工程西南设计研究总院有限公司 基于bim的水务工程设备管理方法和系统
CN116884649B (zh) * 2023-09-06 2023-11-17 山西数字政府建设运营有限公司 一种用于监测用户安全的控制系统
CN116929437B (zh) * 2023-09-15 2023-12-08 深圳和润达科技有限公司 应用于电芯化成分容系统的传感器信息识别方法及装置
CN117249921B (zh) * 2023-11-15 2024-04-05 宁德时代新能源科技股份有限公司 温度采样的异常识别方法、相关装置、车辆及存储介质
CN117421199B (zh) * 2023-12-19 2024-04-02 湖南三湘银行股份有限公司 一种行为确定方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109032829A (zh) * 2018-07-23 2018-12-18 腾讯科技(深圳)有限公司 数据异常检测方法、装置、计算机设备及存储介质
CN111858275A (zh) * 2020-07-03 2020-10-30 深圳前海微众银行股份有限公司 一种异常媒体行为的识别方法、装置、设备及存储介质
CN111898758A (zh) * 2020-09-29 2020-11-06 苏宁金融科技(南京)有限公司 一种用户异常行为识别方法、装置及计算机可读存储介质

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105718857B (zh) * 2016-01-13 2019-06-04 兴唐通信科技有限公司 一种人体异常行为检测方法及系统
US11860971B2 (en) * 2018-05-24 2024-01-02 International Business Machines Corporation Anomaly detection
CN109697830B (zh) * 2018-12-21 2020-10-20 山东大学 一种基于目标分布规律的人员异常行为检测方法
CN109815084B (zh) * 2018-12-29 2020-12-29 北京城市网邻信息技术有限公司 异常识别方法、装置和电子设备及存储介质
CN109960631B (zh) * 2019-03-19 2020-01-03 山东九州信泰信息科技股份有限公司 一种安全事件异常的实时侦测方法
CN110348471B (zh) * 2019-05-23 2023-09-01 平安科技(深圳)有限公司 异常对象识别方法、装置、介质及电子设备
CN110781771A (zh) * 2019-10-08 2020-02-11 北京邮电大学 一种基于深度学习的异常行为实时监测方法
CN111079518B (zh) * 2019-10-31 2023-08-29 高新兴科技集团股份有限公司 一种基于执法办案区场景下的倒地异常行为识别方法
CN111178456B (zh) * 2020-01-15 2022-12-13 腾讯科技(深圳)有限公司 异常指标检测方法、装置、计算机设备和存储介质
CN111949702B (zh) * 2020-07-03 2021-07-23 浙江口碑网络技术有限公司 异常交易数据的识别方法、装置及设备
CN114078603A (zh) * 2020-08-12 2022-02-22 锐可医疗科技(上海)有限公司 智能养老监护系统、方法及计算机设备、可读存储介质
CN112861696B (zh) * 2021-02-01 2023-08-18 电子科技大学中山学院 一种异常行为识别方法、装置、电子设备及存储介质
CN113657536A (zh) * 2021-08-24 2021-11-16 深圳市腾讯网络信息技术有限公司 基于人工智能的对象分类方法、装置
CN114202803A (zh) * 2021-12-17 2022-03-18 北方工业大学 一种基于残差网络的多阶段人体异常动作检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109032829A (zh) * 2018-07-23 2018-12-18 腾讯科技(深圳)有限公司 数据异常检测方法、装置、计算机设备及存储介质
CN111858275A (zh) * 2020-07-03 2020-10-30 深圳前海微众银行股份有限公司 一种异常媒体行为的识别方法、装置、设备及存储介质
CN111898758A (zh) * 2020-09-29 2020-11-06 苏宁金融科技(南京)有限公司 一种用户异常行为识别方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN114419528A (zh) 2022-04-29

Similar Documents

Publication Publication Date Title
CN114419528B (zh) 异常识别方法、装置、计算机设备及计算机可读存储介质
CN106956271A (zh) 预测情感状态的方法和机器人
CN110415821B (zh) 一种基于人体生理数据的健康知识推荐系统及其运行方法
CN105528754A (zh) 一种基于双神经网络行为识别模型的老年人信息服务系统
WO2020224433A1 (zh) 基于机器学习的目标对象属性预测方法及相关设备
CN110363090A (zh) 智能心脏疾病检测方法、装置及计算机可读存储介质
CN116311539B (zh) 基于毫米波的睡眠动作捕捉方法、装置、设备及存储介质
CN114066421A (zh) 基于人工智能的任务催办方法、装置及电子设备
CN114224343B (zh) 认知障碍检测方法、装置、设备及存储介质
CN115662631A (zh) 基于ai智能判别的养老院管理系统
Li et al. Introduce structural equation modelling to machine learning problems for building an explainable and persuasive model
CN114241270A (zh) 一种家庭护理智能监督方法、系统及装置
CN113096792B (zh) 一种基于机器学习的智能健康监测预警方法及系统
CN113693564A (zh) 基于人工智能的睡眠质量监测方法、装置、设备及介质
CN116884612A (zh) 疾病风险等级的智能分析方法、装置、设备及存储介质
Urosevic et al. Temporal clustering for behavior variation and anomaly detection from data acquired through IoT in smart cities
JP6801902B1 (ja) 子供虐待兆候判別プログラム及びシステム
CN112733634A (zh) 一种米粉质量监测方法及装置
CN112133405A (zh) 一种智慧社区的儿童营养状态评定方法及系统
CN113436703B (zh) 基于神经网络的运动步数数据的运动模式推断方法及系统
CN113421643B (zh) 一种ai模型可靠性判断方法、装置、设备及存储介质
CN112863686B (zh) 基于多源大数据的传染病协同监测方法和机器人
Wang et al. Analysis of Digital Long Jump Take‐off Wearable Sensor Monitoring System
Kovacevic et al. Chapter Temporal Clustering for Behavior Variation and Anomaly Detection from Data Acquired Through IoT in Smart Cities
CN114692938A (zh) 防止收入下降时空人工智能方法和深度学习系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant