CN109036461A - 一种通知信息的输出方法、服务器及监控系统 - Google Patents

一种通知信息的输出方法、服务器及监控系统 Download PDF

Info

Publication number
CN109036461A
CN109036461A CN201710436582.1A CN201710436582A CN109036461A CN 109036461 A CN109036461 A CN 109036461A CN 201710436582 A CN201710436582 A CN 201710436582A CN 109036461 A CN109036461 A CN 109036461A
Authority
CN
China
Prior art keywords
audio
information
frequency information
characteristic value
warning level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710436582.1A
Other languages
English (en)
Inventor
崔枝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN201710436582.1A priority Critical patent/CN109036461A/zh
Priority to PCT/CN2018/090388 priority patent/WO2018228280A1/zh
Priority to EP18817001.3A priority patent/EP3640935B1/en
Priority to US16/622,159 priority patent/US11275628B2/en
Publication of CN109036461A publication Critical patent/CN109036461A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/542Event management; Broadcasting; Multicasting; Notifications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/65Clustering; Classification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/54Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Alarm Systems (AREA)
  • Emergency Alarm Devices (AREA)

Abstract

本发明实施例公开了一种通知信息的输出方法、服务器及监控系统,在本方案中,预先建立数据库,该数据库中包含特征值模型与预警级别的对应关系;获取音频信息的特征值,将所获取的特征值与该数据库中的特征值模型进行匹配,进而确定出该音频信息对应的预警级别;当预警级别满足预设条件时,输出通知信息。由此可见,本发明实施例通过对音频信息进行分析来输出通知信息,不需要确定视频图像中的活动目标,即使场景中活动目标较多,轨迹较乱,应用本方案,仍可以准确地输出通知信息。

Description

一种通知信息的输出方法、服务器及监控系统
技术领域
本发明涉及多媒体信息处理技术领域,特别涉及一种通知信息的输出方法、服务器及监控系统。
背景技术
在视频监控过程中,通常需要针对一些异常事件输出通知信息,以提醒相关人员及时处理。比如,当采集到的视频图像中出现抢劫的事件,则需要针对该抢劫事件,输出通知信息。或者,在对商场或超市收银台进行视频监控的过程中,如果出现财物纠纷,也可以输出通知信息,等等。
目前,输出通知信息的方案通常包括:对视频采集设备采集到的视频图像进行分析,比如,确定该视频图像中的活动目标、以及活动目标的运动轨迹;根据分析结果,判断该视频图像中是否出现异常事件;如果是,则输出通知信息。
但是,应用上述方式,如果视频图像中的活动目标较多,活动目标的轨迹较混乱,则不能针对每个活动目标准确地判断是否发生了异常事件,导致输出通知信息的准确性较低。
发明内容
本发明实施例的目的在于提供一种通知信息的输出方法、服务器及监控系统,提高输出通知信息的准确性。
为达到上述目的,本发明实施例公开了一种通知信息的输出方法,包括:
获取音频信息;
对所述音频信息进行特征值提取;
将所提取的特征值与预设数据库中的特征值模型进行匹配,所述数据库中存储有特征值模型与预警级别的对应关系;
根据匹配结果,确定所述音频信息对应的预警级别;
判断所述预警级别是否满足预设条件,如果是,确定所述音频信息对应的通知信息;
输出所确定的通知信息。
可选的,所述特征值模型包含场景声音模型;所述场景声音模型为针对预设场景声音建立的特征值模型;
所述将所提取的特征值与预设数据库中的特征值模型进行匹配,可以包括:
将所提取的特征值与所述场景声音模型进行匹配。
可选的,在所述获取音频信息之后,还可以包括:
判断所述音频信息是否为多类型音频信息,所述多类型音频信息中包含多种类型的声音;
如果是,先将所述多类型音频信息分解为至少一个单类型音频信息,所述单类型音频信息中包含一种类型的声音;再执行对所述音频信息进行特征值提取的步骤;
如果否,执行对所述音频信息进行特征值提取的步骤;
所述对所述音频信息进行特征值提取,包括:
对每个单类型音频信息进行特征值提取;
所述将所提取的特征值与预设数据库中的特征值模型进行匹配,包括:
针对每个单类型音频信息,将从所述单类型音频信息提取的特征值与所述预设数据库中的特征值模型进行匹配;
所述根据匹配结果,确定所述音频信息对应的预警级别,包括:
若所述音频信息为单类型音频信息:
根据匹配结果,确定所述单类型音频信息对应的预警级别;
若所述音频信息为多类型音频信息:
获得所述多类型音频信息中包含的每个单类型音频信息对应的匹配结果;
确定所述每个单类型音频信息对应的权重;
根据所确定的权重及所述匹配结果,确定所述多类型音频信息对应的预警级别。
可选的,所述将所述多类型音频信息分解为至少一个单类型音频信息,可以包括:
根据预设切分规则,将所述多类型音频信息切分为多个音频段;
针对每个音频段,判断所述音频段中是否包含多种声音类型;
如果否,将所述音频段作为一个单类型音频信息;
如果是,根据所述音频段中的声音参数,将所述音频段分解为至少一个单类型音频信息,所述声音参数包含以下一种或多种:音调、响度、音色。
可选的,在判断所述音频信息为多类型音频信息的情况下,所述方法还可以包括:
将所述多类型音频信息与预先设定的至少一种场景声音模型进行匹配;
根据匹配结果,确定所述多类型音频信息中包含的每一种场景声音;
确定所述每一种场景声音对应的预警级别及权重;
所述将所述多类型音频信息分解为至少一个单类型音频信息,可以包括:
确定所述多类型音频信息中包含的语音信息;
根据所述语音信息的音色,确定所述语音信息对应的每个单类型音频信息;
所述根据所确定的权重及所述匹配结果,确定所述多类型音频信息对应的预警级别,可以包括:
根据每个单类型音频信息对应的权重及匹配结果、以及所述每一种场景声音对应的预警级别及权重,确定所述多类型音频信息对应的预警级别。
可选的,所述确定所述音频信息对应的通知信息,可以包括:
获取所述音频信息对应的视频图像和/或地理位置信息;
将所述视频图像和/或地理位置信息确定为所述音频信息对应的通知信息。
可选的,在所述输出所确定的通知信息之前,还可以包括:
提示用户是否输出所述通知信息;
判断在预设时间段内是否接收到用户发送的拒绝信息;
如果否,执行所述输出所确定的通知信息的步骤。
可选的,构建所述数据库的过程可以包括:
获取异常事件的模拟音频信息;
对所述模拟音频信息进行特征值提取;
根据所提取的特征值构建特征值模型;
将所构建的特征值模型与用户设定的预警级别对应存储至所述数据库。
可选的,所述方法还可以包括:
接收用户发送的添加指令;
提取所述添加指令对应的目标音频信息的特征值;
根据所述目标音频信息的特征值,构建目标特征值模型;
将所述目标特征值模型与所述添加指令中包含的预警级别对应添加至所述数据库。
为达到上述目的,本发明实施例还公开了一种服务器,包括:处理器和存储器,其中,存储器用于存储可执行程序代码,处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行以下步骤:
获取音频信息;
对所述音频信息进行特征值提取;
将所提取的特征值与预设数据库中的特征值模型进行匹配,所述数据库中存储有特征值模型与预警级别的对应关系;
根据匹配结果,确定所述音频信息对应的预警级别;
判断所述预警级别是否满足预设条件,如果是,确定所述音频信息对应的通知信息;
输出所确定的通知信息。
可选的,所述特征值模型包含场景声音模型;所述场景声音模型为针对预设场景声音建立的特征值模型;所述处理器还用于执行如下步骤:
将所提取的特征值与所述场景声音模型进行匹配。
可选的,所述处理器还用于执行如下步骤:
在获取音频信息之后,判断所述音频信息是否为多类型音频信息,所述多类型音频信息中包含多种类型的声音;
如果是,先将所述多类型音频信息分解为至少一个单类型音频信息,所述单类型音频信息中包含一种类型的声音;再对每个单类型音频信息进行特征值提取;
如果否,直接对单类型音频信息进行特征值提取;
针对每个单类型音频信息,将从所述单类型音频信息提取的特征值与所述预设数据库中的特征值模型进行匹配;
若所述音频信息为单类型音频信息:
根据匹配结果,确定所述单类型音频信息对应的预警级别;
若所述音频信息为多类型音频信息:
获得所述多类型音频信息中包含的每个单类型音频信息对应的匹配结果;
确定所述每个单类型音频信息对应的权重;
根据所确定的权重及所述匹配结果,确定所述多类型音频信息对应的预警级别。
可选的,所述处理器还用于执行如下步骤:
根据预设切分规则,将所述多类型音频信息切分为多个音频段;
针对每个音频段,判断所述音频段中是否包含多种声音类型;
如果否,将所述音频段作为一个单类型音频信息;
如果是,根据所述音频段中的声音参数,将所述音频段分解为至少一个单类型音频信息,所述声音参数包含以下一种或多种:音调、响度、音色。
可选的,所述处理器还用于执行如下步骤:
在判断所述音频信息为多类型音频信息的情况下,将所述多类型音频信息与预先设定的至少一种场景声音模型进行匹配;
根据匹配结果,确定所述多类型音频信息中包含的每一种场景声音;
确定所述每一种场景声音对应的预警级别及权重;
确定所述多类型音频信息中包含的语音信息;
根据所述语音信息的音色,确定所述语音信息对应的每个单类型音频信息;
根据每个单类型音频信息对应的权重及匹配结果、以及所述每一种场景声音对应的预警级别及权重,确定所述多类型音频信息对应的预警级别。
可选的,所述处理器还用于执行如下步骤:
获取所述音频信息对应的视频图像和/或地理位置信息;
将所述视频图像和/或地理位置信息确定为所述音频信息对应的通知信息。
可选的,所述处理器还用于执行如下步骤:
在输出所确定的通知信息之前,提示用户是否输出所述通知信息;
判断在预设时间段内是否接收到用户发送的拒绝信息;
如果否,执行所述输出所确定的通知信息的步骤。
可选的,所述处理器还用于执行如下步骤:
获取异常事件的模拟音频信息;
对所述模拟音频信息进行特征值提取;
根据所提取的特征值构建特征值模型;
将所构建的特征值模型与用户设定的预警级别对应存储至所述数据库。
可选的,所述处理器还用于执行如下步骤:
接收用户发送的添加指令;
提取所述添加指令对应的目标音频信息的特征值;
根据所述目标音频信息的特征值,构建目标特征值模型;
将所述目标特征值模型与所述添加指令中包含的预警级别对应添加至所述数据库。
为达到上述目的,本发明实施例还公开了一种监控系统,包括:服务器,
所述服务器,用于获取音频信息;对所述音频信息进行特征值提取;将所提取的特征值与预设数据库中的特征值模型进行匹配,所述数据库中存储有特征值模型与预警级别的对应关系;根据匹配结果,确定所述音频信息对应的预警级别;判断所述预警级别是否满足预设条件,如果是,确定所述音频信息对应的通知信息;输出所确定的通知信息。
可选的,所述系统还包括:音频采集设备,
所述音频采集设备,用于采集音频信息,并将所采集的音频信息发送给所述服务器。
可选的,所述系统还包括:视频采集设备,
所述视频采集设备,用于采集视频图像、以及确定自身地理位置信息,并将所采集的音频图像、以及所确定的地理位置信息发送给所述服务器;
所述服务器还用于,在确定所述音频信息对应的通知信息的过程中,确定所述音频信息对应的视频图像及地理位置信息,将所述视频图像及地理位置信息添加至所述通知信息。
可选的,所述服务器包括通信服务器和数据库服务器,其中,
所述数据库服务器,用于获取异常事件的模拟音频信息;对所述模拟音频信息进行特征值提取;根据所提取的特征值构建特征值模型;将所构建的特征值模型与用户设定的预警级别对应存储至所述数据库服务器的数据库;
所述通信服务器,用于获取音频信息;对所述音频信息进行特征值提取;将所提取的特征值与所述数据库服务器的数据库中的特征值模型进行匹配,所述数据库中存储有特征值模型与预警级别的对应关系;根据匹配结果,确定所述音频信息对应的预警级别;判断所述预警级别是否满足预设条件,如果是,确定所述音频信息对应的通知信息;输出所确定的通知信息。
应用本发明实施例,预先建立数据库,该数据库中包含特征值模型与预警级别的对应关系;获取音频信息的特征值,将所获取的特征值与该数据库中的特征值模型进行匹配,进而确定出该音频信息对应的预警级别;当预警级别满足预设条件时,输出通知信息。由此可见,本发明实施例通过对音频信息进行分析来输出通知信息,不需要确定视频图像中的活动目标,即使场景中活动目标较多,轨迹较乱,应用本方案,仍可以准确地输出通知信息。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的通知信息的输出方法的第一种流程示意图;
图2为本发明实施例提供的通知信息的输出方法的第二种流程示意图;
图3为本发明实施例提供的通知信息的输出方法的第三种流程示意图;
图4为本发明实施例提供的一种服务器的结构示意图;
图5为本发明实施例提供的监控系统的第一种结构示意图;
图6为本发明实施例提供的监控系统的第二种结构示意图;
图7为本发明实施例提供的监控系统的第三种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决上述技术问题,本发明实施例提供了一种通知信息的输出方法、服务器及监控系统。该方法可以应用于监控系统中的服务器,或者,也可以应用于各种电子设备,具体不做限定。
下面首先对本发明实施例提供的一种通知信息的输出方法进行详细说明。
图1为本发明实施例提供的一种通知信息的输出方法的流程示意图,包括:
S101:获取音频信息。
作为一种实施方式,执行本方案的设备(以下简称本设备)可以具备音频采集功能,S101中获取的可以为本设备自身采集的音频信息。
作为另一种实施方式,本设备可以与音频采集设备通信连接,从音频采集设备中获取音频信息。
在本实施例中,可以每隔预设时长执行一次本方案,也就是每隔预设时长获取一次音频信息。或者,也可以在接收到用户的触发指令后,执行本方案,具体不做限定。
S102:对所述音频信息进行特征值提取。
在本实施例中,可以先对获取的音频信息进行过滤、降噪等处理,再进行特征值的提取。
举例来说,所提取的特征值可以包括如下一种或多种类型:
语速、语义信息、音量过零率、音量最大值、音量最小值、音量平均值、音量变化率最大值、音量变化率最小值、音量变化率平均值、声音频率最大值、声音频率最小值、声音频率平均值、声音频率变化率最大值、声音频率变化率最小值、声音频率变化率平均值、音频曲线向量、音量曲线向量等等。
S103:将所提取的特征值与预设数据库中的特征值模型进行匹配。
在本实施例中,执行本方案之前,预先构建数据库。该数据库中存储有特征值模型与预警级别的对应关系,该特征值模型可以为多个特征值的集合。
在本实施例中,特征值模型中包含的特征值的种类与S102中提取的特征值的种类相一致。这样,才能得到较好的匹配效果。
举例来说,假设预警级别分为三级,三级表示级别最高。在数据库中,一级的预警级别对应的特征值模型可以为:语速200字/分钟、音量平均值70dB、语义信息“小心”。二级的预警级别对应的特征值模型可以为:语速300字/分钟、音量平均值80dB、语义信息“来人哪”。三级的预警级别对应的特征值模型可以为:语速400字/分钟、音量平均值90dB、语义信息“救命”。
需要说明的是,每级预警级别可以对应多个特征值模型,这里为了简化描述,仅以上述模型为例进行说明。
S104:根据匹配结果,确定所述音频信息对应的预警级别。
假设S102中获取的特征值包括:语速300字/分钟、音量平均值80dB、语义信息“来人哪”;将这些特征值与上述数据库中的特征值模型进行匹配,匹配到二级的预警级别。确定S101中获取的音频信息对应的预警级别为二级。
需要说明的是,将提取的特征值与数据库中的特征值模型进行匹配时,匹配成功的标准可以根据实际情况进行设定,比如,可以设定匹配率高于预设值时,匹配成功。该匹配结果中可以包括与某特征值模型匹配成功、或者与某特征值模型匹配失败的信息,或者其他,具体不做限定。
作为一种可选的实施方式,预设数据库中存储的特征值模型可以包含场景声音模型,场景声音模型可以为针对预设场景声音建立的特征值模型。场景声音可以包含枪声、哭声、鸣笛声等等,具体不做限定。可以理解,商场、超市、银行等场景下发生混乱时,通常伴随着枪声、鸣笛声、哭声,本实施例中,将这些声音称为场景声音。
具体的,可以利用机器学习算法,预先对这些场景声音进行模型训练,得到场景声音模型。可以理解,当存在这些场景声音时,发生异常事件的概率较大,因此,场景声音模型对应的预警级别可以设定的较高一些。
将S102中提取的特征值与这些场景声音模型进行匹配,将匹配成功的场景声音对应的预警级别确定为音频信息的预警级别。
S105:判断所述预警级别是否满足预设条件,如果是,执行S106。
S106:确定所述音频信息对应的通知信息。
延续上述例子,假设预设条件为预警级别一级以上,则满足该条件,确定S101中获取的音频信息对应的通知信息。
作为一种实施方式,S106可以包括:获取所述音频信息对应的视频图像和/或地理位置信息;将所述视频图像和/或地理位置信息确定为所述音频信息对应的通知信息。
可以理解,本设备可以具备视频采集功能及定位功能,这样,可以获取自身采集的视频图像、自身确定的地理位置信息;或者,本设备可以与其他设备通信连接,从其他设备中获取音频信息对应的视频图像和/或地理位置信息,具体不做限定。
音频信息对应的视频图像,是指与音频信息针对同一场景,且采集时刻相同的视频图像;音频信息对应的地理位置信息,是指采集音频信息的设备所在的地理位置信息。
如果本设备从其他设备中获取音频信息对应的视频图像和/或地理位置信息,则该其他设备与采集该音频信息的设备针对同一场景进行音频或视频采集。
S107:输出所确定的通知信息。
在上述实施方式中,通知信息中包含视频图像和/或地理位置信息,这样,便可以将异常事件更准确地告知相关人员进行处理。
作为一种实施方式,在执行S107之前,可以提示用户是否输出所述通知信息;判断在预设时间段内是否接收到用户发送的拒绝信息;如果否,再执行S107。
在这种实施方式中,提示信息可以包括以下一种或多种:音频信息对应的预警级别、视频图像、地理位置信息或者其他,具体不做限定。将这些提示信息展示给用户,展示形式有多种,比如弹窗、闪烁提醒等等,具体不做限定。
可以理解,用户针对该提示信息,可以选择确认输出,可以选择拒绝输出,也可以不做选择;如果接收到用户发送的确认信息(用户选择确认输出)、或者在预设时间段内未接收到用户的反馈(用户未做选择),执行S107;如果接收到用户发送的拒绝信息(用户选择拒绝输出),则不输出该通知信息。
作为一种实施方式,构建上述数据库的过程可以包括:
获取异常事件的模拟音频信息;对所述模拟音频信息进行特征值提取;根据所提取的特征值构建特征值模型;将所构建的特征值模型与用户设定的预警级别对应存储至所述数据库。
该异常事件可以理解为抢劫事件、财物纠纷事件等等,具体不做限定。
本领域技术人员可以理解,可以根据实际需求,构建上述数据库。比如,可以录制抢劫事件的模拟音频信息,提取该模拟音频信息的特征值。假设提取的特征值包括:语速400字/分钟、音量平均值90dB、语义信息“救命”,根据所提取的特征值构建特征值模型,该特征值模型可以为上述特征值的集合;将该特征值模型与用户设定的预警级别对应存储。这样,数据库中便存储了各个特征值模型与预警级别的对应关系。
作为一种实施方式,可以对构建的数据库进行更新:
接收用户发送的添加指令;提取所述添加指令对应的目标音频信息的特征值;根据所述目标音频信息的特征值,构建目标特征值模型;将所述目标特征值模型与所述添加指令中包含的预警级别对应添加至所述数据库。
可以理解,如果用户认为某条音频信息符合期望,为了方便描述,将用户认为符合期望的音频信息称为目标音频信息,用户便可以向设备发送添加指令,该添加指令中可以包含目标音频信息的标识、以及用户针对该目标音频信息设定的预警级别。设备接收到该添加指令后,根据该添加指令中的标识,确定目标音频信息,并提取该目标音频信息的特征值;根据所提取的特征值,构建目标特征值模型,将构建的目标特征值模型与添加指令中包含的预警级别对应添加至数据库。
可见,应用上述实施方式,实现了对数据库的更新,进一步地,将所获取的音频信息的特征值与更新后的数据库中的特征值模型进行匹配,可以提高匹配的准确性。
应用本发明图1所示实施例,预先建立数据库,该数据库中包含特征值模型与预警级别的对应关系;获取音频信息的特征值,将所获取的特征值与该数据库中的特征值模型进行匹配,进而确定出该音频信息对应的预警级别;当预警级别满足预设条件时,输出通知信息。由此可见,本发明实施例通过对音频信息进行分析来输出通知信息,不需要确定视频图像中的活动目标,即使场景中活动目标较多,轨迹较乱,应用本方案,仍可以准确地输出通知信息。
图2为本发明实施例提供的通知信息的输出方法的第二种流程示意图,包括:
S201:获取音频信息。
S202:判断所述音频信息是否为多类型音频信息,如果是,执行S203,如果否,直接执行S204。
S203:将所述多类型音频信息分解为至少一个单类型音频信息。
需要说明的是,上述多类型音频信息中包含多种类型的声音,单类型音频信息中包含一种类型的声音。
可以理解,本方案的应用场景可以为单一声音场景,比如,应用在家庭场景中,采集到的音频信息中可以仅包含一个人的语音信息,这样的音频信息也就是上述单类型音频信息。
或者,本方案的应用场景也可以为多类型声音场景,比如超市、商场、银行等场景中,采集到的音频信息中包含多人的语音信息,这样的音频信息也就是上述多类型音频信息。
或者,在超市、商场、银行等场景中,采集到的音频信息中包含一个人的语音信息、以及环境中的声音信息,这样的音频信息也是多类型音频信息。
或者,在超市、商场、银行等场景中,采集到的音频信息中包含多人的语音信息、以及环境中的声音信息,这样的音频信息也是多类型音频信息。
如果S201中获取的音频信息为多类型音频信息,则可以先将多类型音频信息分解为单类型音频信息,再执行后续步骤。
作为一种实施方式,S203可以包括:根据预设切分规则,将所述多类型音频信息切分为多个音频段;针对每个音频段,判断所述音频段中是否包含多种声音类型;如果否,将所述音频段作为一个单类型音频信息;如果是,根据所述音频段中的声音参数,将所述音频段分解为至少一个单类型音频信息,所述声音参数包含以下一种或多种:音调、响度、音色。
该预设切分规则可以有多种,比如,可以将多类型音频信息切分为时间长度相等的多个音频段,或者,切分为体积大小相等的多个音频段,或者,也可以根据多类型音频信息的总时长,确定切分音频段的数量,根据该数量切分音频段,或者,也可以根据多类型音频信息的总体积大小,确定切分音频段的数量,根据该数量切分音频段,等等,具体切分规则不做限定。
举例来说,可以将多类型音频信息切分为多个时长为1秒的音频段,假设该多类型音频信息的总时长为1分钟,则得到60个音频段。
针对每个音频段,判断其中是否包含多种声音类型。举个例子,该多类型音频信息为人员A与人员B的对话,时长一分钟,人员A的语音信息与人员B的语音信息没有交叉。假设切分得到的前30个音频段中仅包含人员A的语音信息,后30个音频段中仅包含人员A的语音信息,则这60个音频段都仅包含一种声音类型,都为单类型音频信息。
这个例子情况较为理想,恰好每个音频段中都仅包含一个人的语音信息,实际上,一个音频段中也会出现多种声音类型。仍假设多类型音频信息为人员A与人员B的对话,时长一分钟,但切分得到的音频段中有的仅包含一个人的语音信息,有的包含两个人的语音信息。将包含一个人的语音信息的音频段作为单类型音频信息,而对于包含两个人语音信息的音频段,根据音频段中的声音参数,将该音频段作进一步的分解。
再举一个例子,在一些较嘈杂的较场景中,同一时刻出现多人的语音信息、并且混杂了鸣笛声、哭声。针对这些场景采集到多类型音频信息,将该多类型音频信息进行切分,得到多个音频段。由于同一时刻存在多种类型的声音,该时刻对应的音频段包含多种声音类型。针对该音频段,根据其中的声音参数,将该音频段作进一步的分解。
声音参数可以包含以下一种或多种:音调、响度、音色。本领域技术人员可以理解,利用不同声音的音调、响度、音色等声音参数,可以提取出该不同的声音。因此,也就可以将包含多种声音类型的音频段继续分解,得到各个单类型音频信息。
在图2所示实施例中,S204对应图1中S102,S205对应图1中S103,但图2中特征值提取以及特征值匹配的步骤是针对各个单类型音频信息的,因此:
S204:对每个单类型音频信息进行特征值提取。
S205:针对每个单类型音频信息,将从所述单类型音频信息提取的特征值与所述预设数据库中的特征值模型进行匹配。
图2中,S206对应图1中S104,S206为:
若(S201中获取的音频信息)为单类型音频信息,根据匹配结果,确定所述单类型音频信息对应的预警级别;
若(S201中获取的音频信息)为多类型音频信息,获得所述多类型音频信息中包含的每个单类型音频信息对应的匹配结果;确定所述每个单类型音频信息对应的权重;根据所确定的权重及所述匹配结果,确定所述多类型音频信息对应的预警级别。
可以理解,如果音频信息为多类型音频信息,则执行S205后,多类型音频信息中包含的每个单类型音频信息都对应了一个匹配结果,这种情况下,可以确定每个单类型音频信息对应的权重。具体方式有多种,比如,根据分解得到单类型音频信息的顺序确定权重;或者,根据各个单类型音频信息的音量平均值大小确定权重,等等,具体不做限定。
举例来说,假设S201中获取的多类型音频信息中包含鸣笛声、哭声和多人的语音信息,对该多类型音频信息进行分解,得到“鸣笛声”、“哭声”、“人员A的语音信息”及“人员B的语音信息”四个单类型音频信息。
假设“鸣笛声”与数据库中的二级预警级别对应的特征值模型匹配成功,也就是说,根据“鸣笛声”对应的匹配结果,确定出的预警级别为二级;另外,假设根据“哭声”对应的匹配结果,确定出的预警级别为三级,根据“人员A的语音信息”对应的匹配结果,确定出的预警级别为三级,根据“人员B的语音信息”对应的匹配结果,确定出的预警级别为一级。
假设“鸣笛声”对应的权重为0.7,“哭声”对应的权重为0.9、“人员A的语音信息”对应的权重为0.8,“人员B的语音信息”对应的权重为0.6,则确定该多类型音频信息对应的预警级别=(0.7*2+0.9*3+0.8*3+0.6*1)/4=1.775。可以认为该预警级别大于一级小于二级,或者,也可以直接将该预警级别约等于二级,具体不做限定。
或者,可以将“鸣笛声”“哭声”这类场景声音的权重及预警级别设定的较高一些。作为一种实施方式,如果对S201中获取的多类型音频信息进行分解后,得到场景声音对应的单类型音频信息及其他单类型音频信息(比如,人员的语音信息),可以仅考虑场景声音对应的预警级别及权重,来计算该多类型音频信息的预警级别,这也是合理的。
图2中,S207与图1中S105相同,S208与图1中S106相同,S209与图1中S107相同。
如果所确定的预警级别满足预设条件,则确定该多音频信息对应的通知信息,后续步骤与图1实施例类似,不再赘述。
应用本发明图2所示实施例,在多类型声音场景下,获取到多类型音频信息,将多类型音频信息分解成单类型音频信息后,再对单类型音频信息进行分析来输出通知信息,进一步提高了输出通知信息的准确性。
图3为本发明实施例提供的通知信息的输出方法的第三种流程示意图,包括:
S301:获取音频信息。
S302:判断所述音频信息是否为多类型音频信息,如果是,执行S303,如果否,直接执行S308。
S303:将所述多类型音频信息与预先设定的至少一种场景声音模型进行匹配。
S304:根据匹配结果,确定所述多类型音频信息中包含的每一种场景声音。
S305:确定所述每一种场景声音对应的预警级别及权重。
该场景声音模型可以包括:枪声模型、鸣笛声模型、哭声模型等等,具体不做限定。可以理解,商场、超市、银行等场景下发生混乱时,通常伴随着枪声、鸣笛声、哭声,图3实施例中,将这些声音称为场景声音。
可以利用机器学习算法,预先对这些场景声音进行模型训练,得到场景声音模型。在对多类型音频信息进行分解之前,可以先将多类型音频信息与这些场景声音模型进行匹配。
举例来说,假设S301中获取的多类型音频信息中包含鸣笛声、哭声和多人的语音信息。先将该多类型音频信息与预先设定的各种场景声音模型进行匹配,假设匹配结果为:与鸣笛声模型和哭声模型匹配成功,也就是确定出该多类型音频信息中包含鸣笛声和哭声。
作为一种实施方式,可以预先为各种场景声音设定其对应的预警级别及权重。可以将设定的预警级别及权重与上述场景声音模型对应存储,这样,根据S303中的匹配结果,可以直接确定出每一种场景声音(鸣笛声和哭声)对应的预警级别及权重。
作为另一种实施方式,S305可以包括:在所述多类型音频信息中,提取所述每一种场景声音;针对所提取的每一种场景声音,对所述场景声音进行特征值提取,将所提取的特征值与预设数据库中的特征值模型进行匹配,将匹配成功的特征值模型对应的预警级别确定为所述场景声音的预警级别。
延续上述例子,该多类型音频信息中包含鸣笛声和哭声。可以根据音调、响度、音色或者其他声音参数,分别提取出鸣笛声和哭声。在本实施方式中,将场景声音也作为单类型音频信息来处理。具体的,对鸣笛声和哭声进行特征值提取、特征值匹配,具体过程与图2实施例中S204、S205类似,不再赘述。
本实施方式中的数据库与图1实施例中的数据库可以为同一数据库,或者,也可以为不同的数据库,具体不做限定。
在图3所示实施例中,将多类型音频信息中的场景声音与语音信息分开处理,可以先处理场景声音,再处理语音信息,也可以先处理语音信息,再处理场景声音,也就是说,可以先执行S303-305,再执行S306-S309,也可以先执行S306-S309,再执行S303-305,具体顺序不做限定。
本实施例中的语音信息是指“人发出的、具有语义的语音”,不包括上述哭声等不具有语义的声音。
S306:确定所述多类型音频信息中包含的语音信息。
S307:根据所述语音信息的音色,确定所述语音信息对应的每个单类型音频信息。
本领域技术人员可以理解,人发出的语音信息可以通过音色来提取,或者,也可以通过其他方式来提取,具体不做限定。
然后对语音信息对应的每个单类型音频信息进行特征值提取(S308)、特征值匹配(S309),图3中,S308与图2中S204相对应,S309与图2中S205相对应,具体过程不再赘述。
S310:若(S301中获取的音频信息)为单类型音频信息,根据匹配结果,确定所述单类型音频信息对应的预警级别;
若(S301中获取的音频信息)为多类型音频信息,获得所述多类型音频信息中包含的每个单类型音频信息对应的匹配结果;确定所述每个单类型音频信息对应的权重;根据每个单类型音频信息对应的权重及匹配结果、以及所述每一种场景声音对应的预警级别及权重,确定所述多类型音频信息对应的预警级别。
可以理解,如果音频信息为多类型音频信息,则执行S309之后,多类型音频信息中包含的每个单类型音频信息都对应了一个匹配结果,这种情况下,可以确定每个单类型音频信息对应的权重。具体方式有多种,比如,根据分解得到单类型音频信息的顺序确定权重;或者,随机分配权重;或者,根据各个单类型音频信息的音量平均值大小确定权重,等等,具体不做限定。
综合考虑S305中确定的预警级别及权重,以及上述单类型音频信息对应的匹配结果及权重,确定该多类型音频信息对应的预警级别。也就是说,综合考虑每一种场景声音对应的预警级别及权重、以及每一种语音信息对应的预警级别及权重,确定该多类型音频信息对应的预警级别。
假设S301获取的多类型音频信息中包含鸣笛声和哭声两种场景声音、以及人员A和人员B的语音信息。先将该多类型音频信息与场景声音模型进行匹配,确定出该多类型音频信息中包含“鸣笛声”和“哭声”,再确定该多类型音频信息中包含的语音信息对应了“人员A的语音信息”及“人员B的语音信息”两个单类型音频信息。
或者,也可以先确定该多类型音频信息中包含的语音信息对应了“人员A的语音信息”及“人员B的语音信息”两个单类型音频信息,再将该多类型音频信息与场景声音模型进行匹配,确定出该多类型音频信息中包含“鸣笛声”和“哭声”。
假设通过S305确定出“鸣笛声”对应的预警级别为二级、权重为0.7,确定出“哭声”对应的预警级别为三级、权重为0.9;通过S306-S309,确定出“人员A的语音信息”对应的预警级别为三级、权重为0.8,确定出“人员B的语音信息”对应的预警级别为一级、权重为0.6。
执行S310,确定该多类型音频信息对应的预警级别=(0.7*2+0.9*3+0.8*3+0.6*1)/4=1.775。可以认为该预警级别大于一级小于二级,或者,也可以直接将该预警级别约等于二级,具体不做限定。
图3中,S311与图1中S105相同,S312与图1中S106相同,S313与图1中S107相同。
如果所确定的预警级别满足预设条件,则确定该多音频信息对应的通知信息,后续步骤与图1实施例类似,不再赘述。
应用本发明图3所示实施例,在多类型声音场景下,获取到多类型音频信息,将多类型音频信息中的场景声音与语音信息分开处理,能够针对场景声音与语音信息的不同,对其区分处理。
与上述方法实施例相对应,本发明实施例还提供一种服务器。
图4为本发明实施例提供的一种服务器的结构示意图,包括:处理器401和存储器402,其中,存储器402用于存储可执行程序代码;处理器401通过读取存储器402中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行以下步骤:
获取音频信息;
对所述音频信息进行特征值提取;
将所提取的特征值与预设数据库中的特征值模型进行匹配,所述数据库中存储有特征值模型与预警级别的对应关系;
根据匹配结果,确定所述音频信息对应的预警级别;
判断所述预警级别是否满足预设条件,如果是,确定所述音频信息对应的通知信息;
输出所确定的通知信息。
作为一种实施方式,所述特征值模型包含场景声音模型;所述场景声音模型为针对预设场景声音建立的特征值模型;处理器401还可以用于执行如下步骤:
将所提取的特征值与所述场景声音模型进行匹配。
作为一种实施方式,处理器401还可以用于执行如下步骤:
在获取音频信息之后,判断所述音频信息是否为多类型音频信息,所述多类型音频信息中包含多种类型的声音;
如果是,先将所述多类型音频信息分解为至少一个单类型音频信息,所述单类型音频信息中包含一种类型的声音;再对每个单类型音频信息进行特征值提取;
如果否,直接对单类型音频信息进行特征值提取;
针对每个单类型音频信息,将从所述单类型音频信息提取的特征值与所述预设数据库中的特征值模型进行匹配;
若所述音频信息为单类型音频信息:
根据匹配结果,确定所述单类型音频信息对应的预警级别;
若所述音频信息为多类型音频信息:
获得所述多类型音频信息中包含的每个单类型音频信息对应的匹配结果;
确定所述每个单类型音频信息对应的权重;
根据所确定的权重及所述匹配结果,确定所述多类型音频信息对应的预警级别。
作为一种实施方式,处理器401还可以用于执行如下步骤:
根据预设切分规则,将所述多类型音频信息切分为多个音频段;
针对每个音频段,判断所述音频段中是否包含多种声音类型;
如果否,将所述音频段作为一个单类型音频信息;
如果是,根据所述音频段中的声音参数,将所述音频段分解为至少一个单类型音频信息,所述声音参数包含以下一种或多种:音调、响度、音色。
作为一种实施方式,处理器401还可以用于执行如下步骤:
在判断所述音频信息为多类型音频信息的情况下,将所述多类型音频信息与预先设定的至少一种场景声音模型进行匹配;
根据匹配结果,确定所述多类型音频信息中包含的每一种场景声音;
确定所述每一种场景声音对应的预警级别及权重;
确定所述多类型音频信息中包含的语音信息;
根据所述语音信息的音色,确定所述语音信息对应的每个单类型音频信息;
根据每个单类型音频信息对应的权重及匹配结果、以及所述每一种场景声音对应的预警级别及权重,确定所述多类型音频信息对应的预警级别。
作为一种实施方式,处理器401还可以用于执行如下步骤:
在所述多类型音频信息中,提取所述每一种场景声音;
针对所提取的每一种场景声音,对所述场景声音进行特征值提取,将所提取的特征值与预设数据库中的特征值模型进行匹配,将匹配成功的特征值模型对应的预警级别确定为所述场景声音的预警级别。
作为一种实施方式,处理器401还可以用于执行如下步骤:
获取所述音频信息对应的视频图像和/或地理位置信息;
将所述视频图像和/或地理位置信息确定为所述音频信息对应的通知信息。
作为一种实施方式,处理器401还可以用于执行如下步骤:
在输出所确定的通知信息之前,提示用户是否输出所述通知信息;
判断在预设时间段内是否接收到用户发送的拒绝信息;
如果否,执行所述输出所确定的通知信息的步骤。
作为一种实施方式,处理器401还可以用于执行如下步骤:
获取异常事件的模拟音频信息;
对所述模拟音频信息进行特征值提取;
根据所提取的特征值构建特征值模型;
将所构建的特征值模型与用户设定的预警级别对应存储至所述数据库。
作为一种实施方式,处理器401还可以用于执行如下步骤:
接收用户发送的添加指令;
提取所述添加指令对应的目标音频信息的特征值;
根据所述目标音频信息的特征值,构建目标特征值模型;
将所述目标特征值模型与所述添加指令中包含的预警级别对应添加至所述数据库。
应用本发明图4所示实施例,预先建立数据库,该数据库中包含特征值模型与预警级别的对应关系;获取音频信息的特征值,将所获取的特征值与该数据库中的特征值模型进行匹配,进而确定出该音频信息对应的预警级别;当预警级别满足预设条件时,输出通知信息。由此可见,本发明实施例通过对音频信息进行分析来输出通知信息,不需要确定视频图像中的活动目标,即使场景中活动目标较多,轨迹较乱,应用本方案,仍可以准确地输出通知信息。
本发明实施例还提供一种监控系统,该监控系统可以仅包括服务器,该服务器具有音频采集功能;或者也可以如图5所示,包括服务器和音频采集设备;或者也可以如图6所示,包括服务器和多媒体采集设备,该多媒体采集设备具有音频、视频采集功能;或者,也可以如图7所示,包括服务器、音频采集设备和视频采集设备。
在图5、图6或图7所示实施例中,音频采集设备或者多媒体采集设备,用于采集音频信息,并将所采集的音频信息发送给服务器。
在图6或图7所示实施例中,视频采集设备或者多媒体采集设备,用于采集视频图像、以及确定自身地理位置信息,并将所采集的音频图像、以及所确定的地理位置信息发送给所述服务器;
服务器还用于,在确定所述音频信息对应的通知信息的过程中,确定所述音频信息对应的视频图像及地理位置信息,将所述视频图像及地理位置信息添加至所述通知信息。
作为一种实施方式,服务器可以包括通信服务器和数据库服务器,其中,
所述数据库服务器,用于获取异常事件的模拟音频信息;对所述模拟音频信息进行特征值提取;根据所提取的特征值构建特征值模型;将所构建的特征值模型与用户设定的预警级别对应存储至所述数据库服务器的数据库;
所述通信服务器,用于获取音频信息;对所述音频信息进行特征值提取;将所提取的特征值与所述数据库服务器的数据库中的特征值模型进行匹配,所述数据库中存储有特征值模型与预警级别的对应关系;根据匹配结果,确定所述音频信息对应的预警级别;判断所述预警级别是否满足预设条件,如果是,确定所述音频信息对应的通知信息;输出所确定的通知信息。
在本发明实施例提供的监控系统中,服务器可以用于:
获取音频信息;对所述音频信息进行特征值提取;将所提取的特征值与预设数据库中的特征值模型进行匹配,所述数据库中存储有特征值模型与预警级别的对应关系;根据匹配结果,确定所述音频信息对应的预警级别;判断所述预警级别是否满足预设条件,如果是,确定所述音频信息对应的通知信息;输出所确定的通知信息。
作为一种实施方式,所述特征值模型包含场景声音模型;所述场景声音模型为针对预设场景声音建立的特征值模型;服务器还可以用于:
将所提取的特征值与所述场景声音模型进行匹配。
作为一种实施方式,服务器还可以用于:
在获取音频信息之后,判断所述音频信息是否为多类型音频信息,所述多类型音频信息中包含多种类型的声音;如果是,先将所述多类型音频信息分解为至少一个单类型音频信息,所述单类型音频信息中包含一种类型的声音;再对每个单类型音频信息进行特征值提取;如果否,直接对单类型音频信息进行特征值提取;针对每个单类型音频信息,将从所述单类型音频信息提取的特征值与所述预设数据库中的特征值模型进行匹配;若所述音频信息为单类型音频信息:根据匹配结果,确定所述单类型音频信息对应的预警级别;若所述音频信息为多类型音频信息:获得所述多类型音频信息中包含的每个单类型音频信息对应的匹配结果;确定所述每个单类型音频信息对应的权重;根据所确定的权重及所述匹配结果,确定所述多类型音频信息对应的预警级别。
作为一种实施方式,服务器还可以用于:
根据预设切分规则,将所述多类型音频信息切分为多个音频段;
针对每个音频段,判断所述音频段中是否包含多种声音类型;
如果否,将所述音频段作为一个单类型音频信息;
如果是,根据所述音频段中的声音参数,将所述音频段分解为至少一个单类型音频信息,所述声音参数包含以下一种或多种:音调、响度、音色。
作为一种实施方式,服务器还可以用于:
在判断所述音频信息为多类型音频信息的情况下,将所述多类型音频信息与预先设定的至少一种场景声音模型进行匹配;
根据匹配结果,确定所述多类型音频信息中包含的每一种场景声音;
确定所述每一种场景声音对应的预警级别及权重;
确定所述多类型音频信息中包含的语音信息;
根据所述语音信息的音色,确定所述语音信息对应的每个单类型音频信息;
根据每个单类型音频信息对应的权重及匹配结果、以及所述每一种场景声音对应的预警级别及权重,确定所述多类型音频信息对应的预警级别。
作为一种实施方式,服务器还可以用于:
在所述多类型音频信息中,提取所述每一种场景声音;
针对所提取的每一种场景声音,对所述场景声音进行特征值提取,将所提取的特征值与预设数据库中的特征值模型进行匹配,将匹配成功的特征值模型对应的预警级别确定为所述场景声音的预警级别。
作为一种实施方式,服务器还可以用于:
获取所述音频信息对应的视频图像和/或地理位置信息;
将所述视频图像和/或地理位置信息确定为所述音频信息对应的通知信息。
作为一种实施方式,服务器还可以用于:
提示用户是否输出所述通知信息;
判断在预设时间段内是否接收到用户发送的拒绝信息;
如果否,执行所述输出所确定的通知信息的步骤。
作为一种实施方式,服务器构建所述数据库的过程可以包括:
获取异常事件的模拟音频信息;
对所述模拟音频信息进行特征值提取;
根据所提取的特征值构建特征值模型;
将所构建的特征值模型与用户设定的预警级别对应存储至所述数据库。
作为一种实施方式,服务器还可以用于:
接收用户发送的添加指令;
提取所述添加指令对应的目标音频信息的特征值;
根据所述目标音频信息的特征值,构建目标特征值模型;
将所述目标特征值模型与所述添加指令中包含的预警级别对应添加至所述数据库。
应用本发明实施例,预先建立数据库,该数据库中包含特征值模型与预警级别的对应关系;获取音频信息的特征值,将所获取的特征值与该数据库中的特征值模型进行匹配,进而确定出该音频信息对应的预警级别;当预警级别满足预设条件时,输出通知信息。由此可见,本发明实施例通过对音频信息进行分析来输出通知信息,不需要确定视频图像中的活动目标,即使场景中活动目标较多,轨迹较乱,应用本方案,仍可以准确地输出通知信息。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现上述任一种通知信息的输出方法。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如:ROM/RAM、磁碟、光盘等。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (22)

1.一种通知信息的输出方法,其特征在于,包括:
获取音频信息;
对所述音频信息进行特征值提取;
将所提取的特征值与预设数据库中的特征值模型进行匹配,所述数据库中存储有特征值模型与预警级别的对应关系;
根据匹配结果,确定所述音频信息对应的预警级别;
判断所述预警级别是否满足预设条件,如果是,确定所述音频信息对应的通知信息;
输出所确定的通知信息。
2.根据权利要求1所述的方法,其特征在于,所述特征值模型包含场景声音模型;所述场景声音模型为针对预设场景声音建立的特征值模型;
所述将所提取的特征值与预设数据库中的特征值模型进行匹配,包括:
将所提取的特征值与所述场景声音模型进行匹配。
3.根据权利要求1所述的方法,其特征在于,在所述获取音频信息之后,还包括:
判断所述音频信息是否为多类型音频信息,所述多类型音频信息中包含多种类型的声音;
如果是,先将所述多类型音频信息分解为至少一个单类型音频信息,所述单类型音频信息中包含一种类型的声音;再执行对所述音频信息进行特征值提取的步骤;
如果否,执行对所述音频信息进行特征值提取的步骤;
所述对所述音频信息进行特征值提取,包括:
对每个单类型音频信息进行特征值提取;
所述将所提取的特征值与预设数据库中的特征值模型进行匹配,包括:
针对每个单类型音频信息,将从所述单类型音频信息提取的特征值与所述预设数据库中的特征值模型进行匹配;
所述根据匹配结果,确定所述音频信息对应的预警级别,包括:
若所述音频信息为单类型音频信息:
根据匹配结果,确定所述单类型音频信息对应的预警级别;
若所述音频信息为多类型音频信息:
获得所述多类型音频信息中包含的每个单类型音频信息对应的匹配结果;
确定所述每个单类型音频信息对应的权重;
根据所确定的权重及所述匹配结果,确定所述多类型音频信息对应的预警级别。
4.根据权利要求3所述的方法,其特征在于,所述将所述多类型音频信息分解为至少一个单类型音频信息,包括:
根据预设切分规则,将所述多类型音频信息切分为多个音频段;
针对每个音频段,判断所述音频段中是否包含多种声音类型;
如果否,将所述音频段作为一个单类型音频信息;
如果是,根据所述音频段中的声音参数,将所述音频段分解为至少一个单类型音频信息,所述声音参数包含以下一种或多种:音调、响度、音色。
5.根据权利要求3所述的方法,其特征在于,在判断所述音频信息为多类型音频信息的情况下,所述方法还包括:
将所述多类型音频信息与预先设定的至少一种场景声音模型进行匹配;
根据匹配结果,确定所述多类型音频信息中包含的每一种场景声音;
确定所述每一种场景声音对应的预警级别及权重;
所述将所述多类型音频信息分解为至少一个单类型音频信息,包括:
确定所述多类型音频信息中包含的语音信息;
根据所述语音信息的音色,确定所述语音信息对应的每个单类型音频信息;
所述根据所确定的权重及所述匹配结果,确定所述多类型音频信息对应的预警级别,包括:
根据每个单类型音频信息对应的权重及匹配结果、以及所述每一种场景声音对应的预警级别及权重,确定所述多类型音频信息对应的预警级别。
6.根据权利要求1所述的方法,其特征在于,所述确定所述音频信息对应的通知信息,包括:
获取所述音频信息对应的视频图像和/或地理位置信息;
将所述视频图像和/或地理位置信息确定为所述音频信息对应的通知信息。
7.根据权利要求1所述的方法,其特征在于,在所述输出所确定的通知信息之前,还包括:
提示用户是否输出所述通知信息;
判断在预设时间段内是否接收到用户发送的拒绝信息;
如果否,执行所述输出所确定的通知信息的步骤。
8.根据权利要求1所述的方法,其特征在于,构建所述数据库的过程包括:
获取异常事件的模拟音频信息;
对所述模拟音频信息进行特征值提取;
根据所提取的特征值构建特征值模型;
将所构建的特征值模型与用户设定的预警级别对应存储至所述数据库。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收用户发送的添加指令;
提取所述添加指令对应的目标音频信息的特征值;
根据所述目标音频信息的特征值,构建目标特征值模型;
将所述目标特征值模型与所述添加指令中包含的预警级别对应添加至所述数据库。
10.一种服务器,其特征在于,包括:处理器和存储器,其中,存储器用于存储可执行程序代码,处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行以下步骤:
获取音频信息;
对所述音频信息进行特征值提取;
将所提取的特征值与预设数据库中的特征值模型进行匹配,所述数据库中存储有特征值模型与预警级别的对应关系;
根据匹配结果,确定所述音频信息对应的预警级别;
判断所述预警级别是否满足预设条件,如果是,确定所述音频信息对应的通知信息;
输出所确定的通知信息。
11.根据权利要求10所述的服务器,其特征在于,所述特征值模型包含场景声音模型;所述场景声音模型为针对预设场景声音建立的特征值模型;所述处理器还用于执行如下步骤:
将所提取的特征值与所述场景声音模型进行匹配。
12.根据权利要求10所述的服务器,其特征在于,所述处理器还用于执行如下步骤:
在获取音频信息之后,判断所述音频信息是否为多类型音频信息,所述多类型音频信息中包含多种类型的声音;
如果是,先将所述多类型音频信息分解为至少一个单类型音频信息,所述单类型音频信息中包含一种类型的声音;再对每个单类型音频信息进行特征值提取;
如果否,直接对单类型音频信息进行特征值提取;
针对每个单类型音频信息,将从所述单类型音频信息提取的特征值与所述预设数据库中的特征值模型进行匹配;
若所述音频信息为单类型音频信息:
根据匹配结果,确定所述单类型音频信息对应的预警级别;
若所述音频信息为多类型音频信息:
获得所述多类型音频信息中包含的每个单类型音频信息对应的匹配结果;
确定所述每个单类型音频信息对应的权重;
根据所确定的权重及所述匹配结果,确定所述多类型音频信息对应的预警级别。
13.根据权利要求12所述的服务器,其特征在于,所述处理器还用于执行如下步骤:
根据预设切分规则,将所述多类型音频信息切分为多个音频段;
针对每个音频段,判断所述音频段中是否包含多种声音类型;
如果否,将所述音频段作为一个单类型音频信息;
如果是,根据所述音频段中的声音参数,将所述音频段分解为至少一个单类型音频信息,所述声音参数包含以下一种或多种:音调、响度、音色。
14.根据权利要求12所述的服务器,其特征在于,所述处理器还用于执行如下步骤:
在判断所述音频信息为多类型音频信息的情况下,将所述多类型音频信息与预先设定的至少一种场景声音模型进行匹配;
根据匹配结果,确定所述多类型音频信息中包含的每一种场景声音;
确定所述每一种场景声音对应的预警级别及权重;
确定所述多类型音频信息中包含的语音信息;
根据所述语音信息的音色,确定所述语音信息对应的每个单类型音频信息;
根据每个单类型音频信息对应的权重及匹配结果、以及所述每一种场景声音对应的预警级别及权重,确定所述多类型音频信息对应的预警级别。
15.根据权利要求10所述的服务器,其特征在于,所述处理器还用于执行如下步骤:
获取所述音频信息对应的视频图像和/或地理位置信息;
将所述视频图像和/或地理位置信息确定为所述音频信息对应的通知信息。
16.根据权利要求10所述的服务器,其特征在于,所述处理器还用于执行如下步骤:
在输出所确定的通知信息之前,提示用户是否输出所述通知信息;
判断在预设时间段内是否接收到用户发送的拒绝信息;
如果否,执行所述输出所确定的通知信息的步骤。
17.根据权利要求10所述的服务器,其特征在于,所述处理器还用于执行如下步骤:
获取异常事件的模拟音频信息;
对所述模拟音频信息进行特征值提取;
根据所提取的特征值构建特征值模型;
将所构建的特征值模型与用户设定的预警级别对应存储至所述数据库。
18.根据权利要求10所述的服务器,其特征在于,所述处理器还用于执行如下步骤:
接收用户发送的添加指令;
提取所述添加指令对应的目标音频信息的特征值;
根据所述目标音频信息的特征值,构建目标特征值模型;
将所述目标特征值模型与所述添加指令中包含的预警级别对应添加至所述数据库。
19.一种监控系统,其特征在于,包括:服务器,
所述服务器,用于获取音频信息;对所述音频信息进行特征值提取;将所提取的特征值与预设数据库中的特征值模型进行匹配,所述数据库中存储有特征值模型与预警级别的对应关系;根据匹配结果,确定所述音频信息对应的预警级别;判断所述预警级别是否满足预设条件,如果是,确定所述音频信息对应的通知信息;输出所确定的通知信息。
20.根据权利要求19所述的系统,其特征在于,所述系统还包括:音频采集设备,
所述音频采集设备,用于采集音频信息,并将所采集的音频信息发送给所述服务器。
21.根据权利要求19所述的系统,其特征在于,所述系统还包括:视频采集设备,
所述视频采集设备,用于采集视频图像、以及确定自身地理位置信息,并将所采集的音频图像、以及所确定的地理位置信息发送给所述服务器;
所述服务器还用于,在确定所述音频信息对应的通知信息的过程中,确定所述音频信息对应的视频图像及地理位置信息,将所述视频图像及地理位置信息添加至所述通知信息。
22.根据权利要求19所述的系统,其特征在于,所述服务器包括通信服务器和数据库服务器,其中,
所述数据库服务器,用于获取异常事件的模拟音频信息;对所述模拟音频信息进行特征值提取;根据所提取的特征值构建特征值模型;将所构建的特征值模型与用户设定的预警级别对应存储至所述数据库服务器的数据库;
所述通信服务器,用于获取音频信息;对所述音频信息进行特征值提取;将所提取的特征值与所述数据库服务器的数据库中的特征值模型进行匹配,所述数据库中存储有特征值模型与预警级别的对应关系;根据匹配结果,确定所述音频信息对应的预警级别;判断所述预警级别是否满足预设条件,如果是,确定所述音频信息对应的通知信息;输出所确定的通知信息。
CN201710436582.1A 2017-06-12 2017-06-12 一种通知信息的输出方法、服务器及监控系统 Pending CN109036461A (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201710436582.1A CN109036461A (zh) 2017-06-12 2017-06-12 一种通知信息的输出方法、服务器及监控系统
PCT/CN2018/090388 WO2018228280A1 (zh) 2017-06-12 2018-06-08 一种通知信息的输出方法、服务器及监控系统
EP18817001.3A EP3640935B1 (en) 2017-06-12 2018-06-08 Notification information output method, server and monitoring system
US16/622,159 US11275628B2 (en) 2017-06-12 2018-06-08 Notification information output method, server and monitoring system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710436582.1A CN109036461A (zh) 2017-06-12 2017-06-12 一种通知信息的输出方法、服务器及监控系统

Publications (1)

Publication Number Publication Date
CN109036461A true CN109036461A (zh) 2018-12-18

Family

ID=64630058

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710436582.1A Pending CN109036461A (zh) 2017-06-12 2017-06-12 一种通知信息的输出方法、服务器及监控系统

Country Status (4)

Country Link
US (1) US11275628B2 (zh)
EP (1) EP3640935B1 (zh)
CN (1) CN109036461A (zh)
WO (1) WO2018228280A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110197663A (zh) * 2019-06-30 2019-09-03 联想(北京)有限公司 一种控制方法、装置及电子设备
CN110532888A (zh) * 2019-08-01 2019-12-03 悉地国际设计顾问(深圳)有限公司 一种监控方法、装置及系统
CN111028860A (zh) * 2019-11-22 2020-04-17 深圳市康冠智能科技有限公司 音频数据处理方法、装置、计算机设备以及存储介质
CN111178883A (zh) * 2019-12-16 2020-05-19 秒针信息技术有限公司 异常确定方法及装置、存储介质、电子装置
CN113838478A (zh) * 2020-06-08 2021-12-24 华为技术有限公司 异常事件检测方法、装置和电子设备

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112188427A (zh) * 2020-08-19 2021-01-05 天津大学 一种公共场所群体异常事件物联传感系统和方法

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101421707A (zh) * 2006-04-13 2009-04-29 伊默生公司 从数字音频信号自动产生触觉事件的系统和方法
CN101587710A (zh) * 2009-07-02 2009-11-25 北京理工大学 一种基于音频突发事件分类的多码本编码参数量化方法
CN102014278A (zh) * 2010-12-21 2011-04-13 四川大学 一种基于语音识别技术的智能视频监控方法
CN102521945A (zh) * 2011-12-02 2012-06-27 无锡奥盛信息科技有限公司 一种呼叫探测报警方法与装置
CN102970438A (zh) * 2012-11-29 2013-03-13 广东欧珀移动通信有限公司 一种手机自动报警方法及自动报警装置
CN103366740A (zh) * 2012-03-27 2013-10-23 联想(北京)有限公司 语音命令识别方法及装置
CN104036617A (zh) * 2014-06-11 2014-09-10 广东安居宝数码科技股份有限公司 报警方法和报警系统
CN104156297A (zh) * 2014-08-07 2014-11-19 浪潮(北京)电子信息产业有限公司 告警方法和装置
CN104239372A (zh) * 2013-06-24 2014-12-24 浙江大华技术股份有限公司 一种音频数据分类方法及装置
CN104347068A (zh) * 2013-08-08 2015-02-11 索尼公司 音频信号处理装置和方法以及监控系统
CN104795064A (zh) * 2015-03-30 2015-07-22 福州大学 低信噪比声场景下声音事件的识别方法
CN105022835A (zh) * 2015-08-14 2015-11-04 武汉大学 一种群智感知大数据公共安全识别方法及系统
EP3059733A2 (en) * 2015-02-18 2016-08-24 Honeywell International Inc. Automatic alerts for video surveillance systems
CN106328134A (zh) * 2016-08-18 2017-01-11 都伊林 监狱语音数据识别及监测预警系统
CN106558317A (zh) * 2015-09-24 2017-04-05 佳能株式会社 声音处理装置和声音处理方法
CN106683361A (zh) * 2017-01-24 2017-05-17 宇龙计算机通信科技(深圳)有限公司 声音监控方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102810311B (zh) 2011-06-01 2014-12-03 株式会社理光 说话人估计方法和说话人估计设备
CN103456301B (zh) 2012-05-28 2019-02-12 中兴通讯股份有限公司 一种基于环境声音的场景识别方法及装置及移动终端
JP6127422B2 (ja) 2012-09-25 2017-05-17 セイコーエプソン株式会社 音声認識装置及び方法、並びに、半導体集積回路装置
CN103198838A (zh) 2013-03-29 2013-07-10 苏州皓泰视频技术有限公司 一种用于嵌入式系统的异常声音监控方法和监控装置
CN105812721A (zh) 2014-12-30 2016-07-27 浙江大华技术股份有限公司 一种跟踪监控方法及跟踪监控设备
CN105679313A (zh) 2016-04-15 2016-06-15 福建新恒通智能科技有限公司 一种音频识别报警系统及方法

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101421707A (zh) * 2006-04-13 2009-04-29 伊默生公司 从数字音频信号自动产生触觉事件的系统和方法
CN101587710A (zh) * 2009-07-02 2009-11-25 北京理工大学 一种基于音频突发事件分类的多码本编码参数量化方法
CN102014278A (zh) * 2010-12-21 2011-04-13 四川大学 一种基于语音识别技术的智能视频监控方法
CN102521945A (zh) * 2011-12-02 2012-06-27 无锡奥盛信息科技有限公司 一种呼叫探测报警方法与装置
CN103366740A (zh) * 2012-03-27 2013-10-23 联想(北京)有限公司 语音命令识别方法及装置
CN102970438A (zh) * 2012-11-29 2013-03-13 广东欧珀移动通信有限公司 一种手机自动报警方法及自动报警装置
CN104239372A (zh) * 2013-06-24 2014-12-24 浙江大华技术股份有限公司 一种音频数据分类方法及装置
CN104347068A (zh) * 2013-08-08 2015-02-11 索尼公司 音频信号处理装置和方法以及监控系统
CN104036617A (zh) * 2014-06-11 2014-09-10 广东安居宝数码科技股份有限公司 报警方法和报警系统
CN104156297A (zh) * 2014-08-07 2014-11-19 浪潮(北京)电子信息产业有限公司 告警方法和装置
EP3059733A2 (en) * 2015-02-18 2016-08-24 Honeywell International Inc. Automatic alerts for video surveillance systems
CN104795064A (zh) * 2015-03-30 2015-07-22 福州大学 低信噪比声场景下声音事件的识别方法
CN105022835A (zh) * 2015-08-14 2015-11-04 武汉大学 一种群智感知大数据公共安全识别方法及系统
CN106558317A (zh) * 2015-09-24 2017-04-05 佳能株式会社 声音处理装置和声音处理方法
CN106328134A (zh) * 2016-08-18 2017-01-11 都伊林 监狱语音数据识别及监测预警系统
CN106683361A (zh) * 2017-01-24 2017-05-17 宇龙计算机通信科技(深圳)有限公司 声音监控方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
朱玉媛 等: "《档案学研究进展》", 31 July 2007 *
栾悉道 等: "《多媒体情报处理技术》", 30 May 2016 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110197663A (zh) * 2019-06-30 2019-09-03 联想(北京)有限公司 一种控制方法、装置及电子设备
CN110197663B (zh) * 2019-06-30 2022-05-31 联想(北京)有限公司 一种控制方法、装置及电子设备
CN110532888A (zh) * 2019-08-01 2019-12-03 悉地国际设计顾问(深圳)有限公司 一种监控方法、装置及系统
CN111028860A (zh) * 2019-11-22 2020-04-17 深圳市康冠智能科技有限公司 音频数据处理方法、装置、计算机设备以及存储介质
CN111178883A (zh) * 2019-12-16 2020-05-19 秒针信息技术有限公司 异常确定方法及装置、存储介质、电子装置
CN113838478A (zh) * 2020-06-08 2021-12-24 华为技术有限公司 异常事件检测方法、装置和电子设备
CN113838478B (zh) * 2020-06-08 2024-04-09 华为技术有限公司 异常事件检测方法、装置和电子设备

Also Published As

Publication number Publication date
US20200364097A1 (en) 2020-11-19
WO2018228280A1 (zh) 2018-12-20
US11275628B2 (en) 2022-03-15
EP3640935A1 (en) 2020-04-22
EP3640935B1 (en) 2024-02-14
EP3640935A4 (en) 2020-06-17

Similar Documents

Publication Publication Date Title
CN109036461A (zh) 一种通知信息的输出方法、服务器及监控系统
US11178275B2 (en) Method and apparatus for detecting abnormality of caller
CN111091832B (zh) 一种基于语音识别的意向评估方法和系统
CN104519124B (zh) 一种虚拟资源的分配方法以及装置
CN104104910B (zh) 一种进行双向实况共享与智能监控的终端及方法
CN108810296B (zh) 一种智能外呼方法及装置
CN106603849A (zh) 一种移动终端设置闹钟提醒的方法及系统
CN104038473A (zh) 用于插播音频广告的方法、装置、设备和系统
CN105205756A (zh) 一种行为监控的方法和系统
CN107770371A (zh) 信息提示方法、电子设备及网络设备
CN105975879A (zh) 一种终端显示电量的控制方法及装置
CN108320757B (zh) 配送信息提示方法、装置、智能音箱及存储介质
CN111126411B (zh) 一种异常行为识别方法及装置
CN109658776A (zh) 一种背诵流畅度的检测方法及电子设备
CN105721292A (zh) 一种信息读取方法、装置及终端
CN103838861B (zh) 一种基于三维gis动态显示信息的方法和显示系统
CN110782622A (zh) 一种安全监控系统、安全检测方法、装置及电子设备
CN109582780A (zh) 一种基于用户情绪的智能问答方法及装置
CN108764215A (zh) 基于视频的目标搜索追踪方法、系统、服务中心以及终端
WO2013054241A1 (en) System and method with automated media-file-based quizzing
CN104240004B (zh) 监控中心值班人员的查岗方法及其系统
EP1802115A1 (en) Person estimation device and method, and computer program
CN108924482B (zh) 一种视频记录方法和系统
CN113438457B (zh) 提高示警准确性的居家监控方法和居家监控系统
CN109615731A (zh) 一种基于人脸识别的音频输出方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181218