CN107591162A - 基于模式匹配的哭声识别方法及智能看护系统 - Google Patents

基于模式匹配的哭声识别方法及智能看护系统 Download PDF

Info

Publication number
CN107591162A
CN107591162A CN201710628135.6A CN201710628135A CN107591162A CN 107591162 A CN107591162 A CN 107591162A CN 201710628135 A CN201710628135 A CN 201710628135A CN 107591162 A CN107591162 A CN 107591162A
Authority
CN
China
Prior art keywords
sob
voice signal
characteristic vector
database
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710628135.6A
Other languages
English (en)
Other versions
CN107591162B (zh
Inventor
张晖
毛小旺
高财政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201710628135.6A priority Critical patent/CN107591162B/zh
Publication of CN107591162A publication Critical patent/CN107591162A/zh
Application granted granted Critical
Publication of CN107591162B publication Critical patent/CN107591162B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种基于模式匹配的哭声识别方法及智能看护系统,该方法首先建立婴儿哭声数据库;其次,实时采集当前环境中的语音信息,经过预处理成语音特征向量序列,与哭声数据库进行特征匹配,并将匹配的结果进行哭声判决。若识别结果为哭声语音,则立即触发报警指令。智能看护系统一方面会向用户发送婴儿哭闹报警信号;另一方面,通过播放预先录制的具有安抚婴儿情绪功能的语音,对婴儿进行情绪安抚。本发明提出的哭声识别方法及智能看护系统能及时发现婴儿哭闹,解决部分家长的看护难题。此外,还为智能家居实现智能看护功能提供了解决方案。

Description

基于模式匹配的哭声识别方法及智能看护系统
技术领域
本发明涉及一种基于模式匹配的哭声识别方法及智能看护系统,属于智能家居领域。
背景技术
随着物联网技术的高速发展,智能家居已经越来越多的出现在人们的生活中,使人们的生活起居越来越便捷,大大提升了用户的体验。
随着工作压力越来越大,年轻父母在外忙碌的时间越来越多,对自己孩子的照顾主要依赖雇佣保姆或交给家中老人照看,保姆的人力成本太高,而老人因年纪原因可能出现婴儿哭闹没有被及时护理等现象。因此,赋予智能家居以婴儿看护的功能,将极大解决大多工作族的烦恼。
但当今市场上,具有婴儿看护功能的智能家居设备还较为少见,大多婴儿看护产品仅仅停留在远程视频监控功能上,若没有一直监视画面,亦不能及时发现婴儿的哭闹,看护效果并不理想。
发明内容
为了克服上述现有技术的不足,本发明提供一种基于模式匹配的哭声识别方法及智能看护系统。该方法首先,建立婴儿哭声数据库;其次,实时采集当前环境中的语音信息,经过预处理成语音特征向量序列,与哭声数据库进行特征匹配,并将匹配的结果进行哭声判决。若识别结果为哭声语音,则立即触发报警指令。智能看护系统一方面会向用户发送婴儿哭闹报警信号;另一方面,通过播放预先录制的具有安抚婴儿情绪功能的语音,对婴儿进行情绪安抚。本发明提出的哭声识别方法及智能看护系统能及时发现婴儿哭闹,解决部分家长的看护难题。此外,还为智能家居实现智能看护功能提供了解决方案。
本发明为解决上述技术问题采用以下技术方案:
一方面,本发明提供一种基于模式匹配的哭声识别方法,包括以下具体步骤:
步骤1,采集婴儿哭声语音信号,建立哭声数据库,具体为:
S101,采集若干婴儿哭声语音信号,并将其分别转换成数字语音信号;
S102,在设定的时间窗内,对S101中的数字语音信号进行分帧加窗处理,得到多帧语音信号;对每帧语音信号分别提取12维的梅尔频率倒谱系数MFCC作为其特征向量,从而得到多帧语音信号对应的特征向量序列;
S103,采用K-means算法对S102中得到的若干特征向量序列进行聚类,并对聚类后每类中的特征向量序列求取平均值后,存入哭声数据库;
步骤2,实时采集当前环境中的语音信号并转换成数字语音信号,根据S102中的方法对提取实时数字语音信号的特征向量序列;
步骤3,将步骤2中提取的实时数字语音信号的特征向量序列与步骤1中聚类后每类特征向量序列的均值进行逐帧匹配,将每帧匹配到的相似度最大的类别作为该帧的识别结果;
步骤4,根据步骤3中得到的每帧的识别结果,判断实时语音信号是否为哭声,完成识别;具体为:
S401,统计实时数字语音信号的特征向量序列中识别结果为第i类的帧数Si,其中,1≤i≤n,n为聚类的类别总数;
S402,选取S401中得到的Si的最大值对应的类别作为实时数字语音信号的特征向量序列的识别结果;
S403,判断是否超过实时数字语音信号的特征向量序列长度的一半,若是,则判定实时语音信号为哭声,否则判定为非哭声。
作为本发明的进一步优化方案,该方法还包括将步骤4中判定结果为哭声的特征向量序列加入哭声数据库中,通过K-means算法对哭声数据库进行重新聚类。
作为本发明的进一步优化方案,步骤S102中对数字语音信号进行分帧加窗处理之前,还包括对数字语音信号依次进行归一化和预加重处理。
作为本发明的进一步优化方案,步骤S102中设定的时间窗为5s。
作为本发明的进一步优化方案,步骤S102中分帧加窗处理具体为:每帧长度为20ms,窗函数为汉明窗,前后相邻两帧具有半帧的重叠区。
另一方面,本发明还提供一种基于上述基于模式匹配的哭声识别方法的智能看护装置,包括:
音频模块,用于实时采集当前环境中的语音信号,并对实时语音信号进行预处理;根据控制模块的指令播放预存的语音;
哭声识别模块,用于建立哭声数据库,并对预处理后的实时语音信号进行匹配,判断该语音是否为哭声;
控制模块,用于接收哭声识别模块的识别结果,若结果是哭声,则向用户端发送报警信号,同时向音频模块发送指令以播放预存的语音;接收用户端发送的指令,直接控制音频模块播放预存的语音。
作为本发明的进一步优化方案,音频模块包括:
语音采集单元,用于实时采集当前环境中的语音信号;
预处理单元,用于将实时语音信号转换成数字语音信号后,在设定的时间窗内对数字语音信号依次进行归一化、预加重、分帧、加窗处理,并提取实时语音特征向量序列,将特征向量序列发送至哭声数据库存储;
音频存储单元,用于存储具有安抚婴儿情绪功能的语音数据;
音频播放单元,用于接收控制模块发送的播放指令,从音频存储单元获取语音数据,并解码播放。
作为本发明的进一步优化方案,哭声识别模块包括:
哭声数据库,用于存储哭声语音信号对应的语音特征向量序列;
模型训练单元,用于对哭声数据库中存储的哭声特征向量序列,使用K-means算法进行聚类,并对聚类后每类中的特征向量序列求取平均值后存入哭声数据库中;
哭声判决单元,用于将提取的实时数字语音信号的特征向量序列与哭声数据库进行逐帧匹配,按照基于模式匹配的哭声识别方法判断实时语音信号是否为哭声,并将识别结果发送至控制单元,且若是哭声则将实时数字语音信号的特征向量序列存入哭声数据库。
作为本发明的进一步优化方案,控制模块包括:
指令收发单元,用于接收来自哭声识别模块的识别结果和来自用户端的指令,根据识别结果向音频模块发送控制指令和向用户端发出报警信号;
无线传输单元,用于用户端与指令收发单元之间的通信。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:本发明一种基于模式匹配的哭声识别方法及智能看护系统,该方法首先建立婴儿哭声数据库;其次,实时采集当前环境中的语音信息,经过预处理成语音特征向量序列,与哭声数据库进行特征匹配,并将匹配的结果进行哭声判决。若识别结果为哭声语音,则立即触发报警指令。智能看护系统一方面会向用户发送婴儿哭闹报警信号;另一方面,通过播放预先录制的具有安抚婴儿情绪功能的语音,对婴儿进行情绪安抚。本发明提出的哭声识别方法及智能看护系统能及时发现婴儿哭闹,解决部分家长的看护难题。此外,还为智能家居实现智能看护功能提供了解决方案。
附图说明
图1为本发明提供的一种基于模式匹配的哭声识别方法流程图;
图2为本发明提供的基于模式匹配的智能看护系统模块化结构示意图。
具体实施方式
下面结合附图以及具体实施例对本发明的技术方案做进一步的详细说明:
图1显示了本发明提出的一种基于模式匹配的哭声识别方法流程图,具体执行步骤如下:
步骤S101,采集若干婴儿哭声语音信号,并将其分别转换成数字语音信号,得到若干完整语音段。
步骤S102,在设定的时间窗内,对每段语音依次进行归一化、预加重、分帧、加窗处理后,得到多帧语音信号;固设定的时间窗大小取5s;归一化的目的是为了减小音量大小不同对识别结果的影响;预加重的目的是提升高频部分,使信号频谱变得平坦,可通过传递函数为H(z)=1-az-1的预加重滤波器实现。根据哭声的短时平稳特性,每帧大小取20ms,为了相邻两帧之间能够平滑过度,取半帧帧移。
步骤S103,对每帧语音信号提取哭声特征向量,得到哭声特征向量序列,存入哭声数据库中;所述哭声特征向量为12维的梅尔频率倒谱系数MFCC;具体如下:
由于人耳对不同的频率声音具有不同的感知能力,在1000Hz以下,感知能力与频率成线性关系;在1000Hz以上,感知能力与频率成对数关系,而Mel频率尺度与人耳的感知特性成线性关系。频率f与Mel频率B之间的转换公式如下:
103-1:原始语音信号经过预加重、分帧、加窗处理后得到每个语音帧的时域信号x(n);
103-2:将时域信号经过快速傅里叶变换(FFT)后得到线性频谱x(k);
103-3:将上述线性频谱x(k)通过Mel滤波器组得到Mel频率。滤波器组中滤波器的个数取值在24-40之间,本例取M=25;
103-4:计算Mel滤波器的对数能量S(m),并对其做离散余弦变化(DCT)就得到了Mel频率倒谱系数C(n):
其中,l表示Mel频率倒谱系数的阶数,本例取l=12;M为Mel滤波器组中滤波器的总个数;m表示滤波器组的滤波器序号,0≤m≤M;n表示Mel频率倒谱系数C(n)的维度序号,1≤n≤l。
步骤S104,根据S103获取的哭声特征序列,所述哭声特征向量序列,采用K-means算法对S103中获得的若干特征向量序列进行聚类,并对聚类后每类中的特征向量序列求取平均值后,存入哭声数据库。
步骤S105,实时采集当前环境中的语音信号并转换成数字语音信号,按照步骤S102、S103的方式进行处理,得到实时语音特征向量序列;
步骤S106,根据步骤S105获取的实时语音特征向量序列与步骤1中聚类后每类特征向量序列的均值进行逐帧匹配,每帧匹配到的相似度最大的类别作为该帧识别结果。
步骤S107,根据步骤S106获取的每帧的识别结果,判断实时语音信号是否为哭声,完成识别。具体为:
S107-1,统计特征向量序列中每帧对应的识别结果的数量Si;其中,i表示K-means聚类后的第i个类别的序号,i=1,2,....,n;n为聚类的类别总数;
S107-2,取Si中最大值作为实时语音特征向量序列的识别结果;
S107-3,判断是否超过特征向量序列长度的一半,若是,则判定实时语音信号为哭声,否则判定为非哭声。
图2显示了本发明提供的基于模式匹配的智能看护系统模块化结构示意图,包括音频模块、控制模块、哭声识别模块。
其中,音频模块,用于采集语音数据,并对数据进行预处理;此外,还将存储用户预先录制的语音,用于安慰哭闹的婴儿。其中,音频模块具体包括:语音采集单元,用于采集当前环境中的语音信号;预处理单元,用于对采集的语音信号进行模数变换,转换成数字信号后,在在固定时间窗内,对所述数字信号依次进行归一化、预加重、分帧、加窗处理,并提取实时语音特征向量序列,将特征向量序列发送至哭声数据库存储;音频存储单元,用于存储用来具有安抚婴儿情绪功能的语音数据;音频播放单元,接收控制模块发送的播放指令,从音频存储单元获取语音数据,并解码播放。
其中,控制模块,用于接收哭声识别模块的识别结果,若结果是哭声,则向用户端发送报警信号,同时向音频模块发送指令以播放预存的语音;接收用户端发送的指令,直接控制音频模块播放预存的语音。其中,控制模块具体包括:指令收发单元,接收来自哭声识别模块的报警指令和来自用户的直接播放指令,若是报警指令,则还需要无线传输单元和音频模块发送报警信号,否则直接向音频模块发送报警信号;无线传输单元,与用户手机端通过WIFI技术传输报警信号和接收直接播放指令。
其中,哭声识别模块,用于建立哭声数据库,使用K-means算法进行聚类,并对实时采集的语音数据进行匹配,判断该段语音是否为哭声。其中,哭声识别模块具体包括:哭声数据库,接收来自音频模块的语音特征向量序列,对于哭声特征向量序列则存储入库,对于实时采集的语音特征向量序列则进行缓存;模型训练单元,对哭声数据库中存储的哭声特征向量序列,使用K-means算法训练哭声分类模型,并存储入库;哭声判决单元,针对哭声数据库中缓存的语音特征向量序列,进行逐帧匹配,按照哭声识别方法进行判断此段语音特征向量序列,是否为哭声特征向量序列;若是,则存储到哭声数据库,并向控制模块发送哭声报警指令;否则直接清空缓存区。
以上所述,仅为本发明中的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的包含范围之内,因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (9)

1.基于模式匹配的哭声识别方法,其特征在于,包括以下具体步骤:
步骤1,采集婴儿哭声语音信号,建立哭声数据库,具体为:
S101,采集若干婴儿哭声语音信号,并将其分别转换成数字语音信号;
S102,在设定的时间窗内,对S101中的数字语音信号进行分帧加窗处理,得到多帧语音信号;对每帧语音信号分别提取12维的梅尔频率倒谱系数MFCC作为其特征向量,从而得到多帧语音信号对应的特征向量序列;
S103,采用K-means算法对S102中得到的若干特征向量序列进行聚类,并对聚类后每类中的特征向量序列求取平均值后,存入哭声数据库;
步骤2,实时采集当前环境中的语音信号并转换成数字语音信号,根据S102中的方法对提取实时数字语音信号的特征向量序列;
步骤3,将步骤2中提取的实时数字语音信号的特征向量序列与步骤1中聚类后每类特征向量序列的均值进行逐帧匹配,将每帧匹配到的相似度最大的类别作为该帧的识别结果;
步骤4,根据步骤3中得到的每帧的识别结果,判断实时语音信号是否为哭声,完成识别;具体为:
S401,统计实时数字语音信号的特征向量序列中识别结果为第i类的帧数Si,其中,1≤i≤n,n为聚类的类别总数;
S402,选取S401中得到的Si的最大值对应的类别作为实时数字语音信号的特征向量序列的识别结果;
S403,判断是否超过实时数字语音信号的特征向量序列长度的一半,若是,则判定实时语音信号为哭声,否则判定为非哭声。
2.根据权利要求1所述的基于模式匹配的哭声识别方法,其特征在于,该方法还包括将步骤4中判定结果为哭声的特征向量序列加入哭声数据库中,通过K-means算法对哭声数据库进行重新聚类。
3.根据权利要求1所述的基于模式匹配的哭声识别方法,其特征在于,步骤S102中对数字语音信号进行分帧加窗处理之前,还包括对数字语音信号依次进行归一化和预加重处理。
4.根据权利要求1所述的基于模式匹配的哭声识别方法,其特征在于,步骤S102中设定的时间窗为5s。
5.根据权利要求1所述的基于模式匹配的哭声识别方法,其特征在于,步骤S102中分帧加窗处理具体为:每帧长度为20ms,窗函数为汉明窗,前后相邻两帧具有半帧的重叠区。
6.基于如权利要求1至5中任一所述的基于模式匹配的哭声识别方法的智能看护装置,其特征在于,包括:
音频模块,用于实时采集当前环境中的语音信号,并对实时语音信号进行预处理;根据控制模块的指令播放预存的语音;
哭声识别模块,用于建立哭声数据库,并对预处理后的实时语音信号进行匹配,判断该语音是否为哭声;
控制模块,用于接收哭声识别模块的识别结果,若结果是哭声,则向用户端发送报警信号,同时向音频模块发送指令以播放预存的语音;接收用户端发送的指令,直接控制音频模块播放预存的语音。
7.根据权利要求6所述的智能看护装置,其特征在于,音频模块包括:
语音采集单元,用于实时采集当前环境中的语音信号;
预处理单元,用于将实时语音信号转换成数字语音信号后,在设定的时间窗内对数字语音信号依次进行归一化、预加重、分帧、加窗处理,并提取实时语音特征向量序列,将特征向量序列发送至哭声数据库存储;
音频存储单元,用于存储具有安抚婴儿情绪功能的语音数据;
音频播放单元,用于接收控制模块发送的播放指令,从音频存储单元获取语音数据,并解码播放。
8.根据权利要求6所述的智能看护装置,其特征在于,哭声识别模块包括:
哭声数据库,用于存储哭声语音信号对应的语音特征向量序列;
模型训练单元,用于对哭声数据库中存储的哭声特征向量序列,使用K-means算法进行聚类,并对聚类后每类中的特征向量序列求取平均值后存入哭声数据库中;
哭声判决单元,用于将提取的实时数字语音信号的特征向量序列与哭声数据库进行逐帧匹配,按照基于模式匹配的哭声识别方法判断实时语音信号是否为哭声,并将识别结果发送至控制单元,且若是哭声则将实时数字语音信号的特征向量序列存入哭声数据库。
9.根据权利要求6所述的基于智能构图及微表情分析的智能拍照装置,其特征在于,控制模块包括:
指令收发单元,用于接收来自哭声识别模块的识别结果和来自用户端的指令,根据识别结果向音频模块发送控制指令和向用户端发出报警信号;
无线传输单元,用于用户端与指令收发单元之间的通信。
CN201710628135.6A 2017-07-28 2017-07-28 基于模式匹配的哭声识别方法及智能看护系统 Active CN107591162B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710628135.6A CN107591162B (zh) 2017-07-28 2017-07-28 基于模式匹配的哭声识别方法及智能看护系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710628135.6A CN107591162B (zh) 2017-07-28 2017-07-28 基于模式匹配的哭声识别方法及智能看护系统

Publications (2)

Publication Number Publication Date
CN107591162A true CN107591162A (zh) 2018-01-16
CN107591162B CN107591162B (zh) 2021-01-12

Family

ID=61041978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710628135.6A Active CN107591162B (zh) 2017-07-28 2017-07-28 基于模式匹配的哭声识别方法及智能看护系统

Country Status (1)

Country Link
CN (1) CN107591162B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108492829A (zh) * 2018-03-13 2018-09-04 广州势必可赢网络科技有限公司 一种婴儿哭闹提醒方法、装置及系统
CN108564967A (zh) * 2018-03-14 2018-09-21 南京邮电大学 面向哭声检测系统的Mel能量声纹特征提取方法
CN108615333A (zh) * 2018-05-25 2018-10-02 朱利 基于人工智能的婴儿窒息预警系统和方法
CN108831456A (zh) * 2018-05-25 2018-11-16 深圳警翼智能科技股份有限公司 一种通过语音识别对视频标记的方法、装置及系统
CN109065071A (zh) * 2018-08-31 2018-12-21 电子科技大学 一种基于迭代k-means算法的歌曲聚类方法
CN110706449A (zh) * 2019-09-04 2020-01-17 中移(杭州)信息技术有限公司 一种婴幼儿监测方法、装置与摄像设备及存储介质
CN110726898A (zh) * 2018-07-16 2020-01-24 北京映翰通网络技术股份有限公司 一种配电网故障类型识别方法
CN110808071A (zh) * 2019-10-29 2020-02-18 浙江萌宠日记信息科技股份有限公司 基于信息融合的母婴信息传递方法及系统
CN111354375A (zh) * 2020-02-25 2020-06-30 咪咕文化科技有限公司 一种哭声分类方法、装置、服务器和可读存储介质
WO2020259057A1 (zh) * 2019-06-26 2020-12-30 深圳数字生命研究院 声音的识别方法及装置、存储介质和电子装置
CN112743551A (zh) * 2019-10-31 2021-05-04 珠海市一微半导体有限公司 保姆机器人的控制方法、保姆机器人及芯片
CN112992136A (zh) * 2020-12-16 2021-06-18 呼唤(上海)云计算股份有限公司 智能婴儿监护系统及方法
CN113779301A (zh) * 2021-08-18 2021-12-10 北京艺旗网络科技有限公司 一种音乐教学方法及装置
EP3940698A1 (en) 2020-07-13 2022-01-19 Zoundream AG A computer-implemented method of providing data for an automated baby cry assessment
CN115376544A (zh) * 2021-05-19 2022-11-22 漳州立达信光电子科技有限公司 数据处理方法、装置及终端设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101807396A (zh) * 2010-04-02 2010-08-18 陕西师范大学 婴儿哭闹自动记录装置及方法
CN103280220A (zh) * 2013-04-25 2013-09-04 北京大学深圳研究生院 一种实时的婴儿啼哭声识别方法
US20150073306A1 (en) * 2012-03-29 2015-03-12 The University Of Queensland Method and apparatus for processing patient sounds
CN105809890A (zh) * 2016-05-13 2016-07-27 中国人民解放军国防科学技术大学 面向校车安全的遗漏孩童检测方法
CN106653001A (zh) * 2016-11-17 2017-05-10 沈晓明 婴儿哭声的辩识方法及其系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101807396A (zh) * 2010-04-02 2010-08-18 陕西师范大学 婴儿哭闹自动记录装置及方法
US20150073306A1 (en) * 2012-03-29 2015-03-12 The University Of Queensland Method and apparatus for processing patient sounds
CN103280220A (zh) * 2013-04-25 2013-09-04 北京大学深圳研究生院 一种实时的婴儿啼哭声识别方法
CN105809890A (zh) * 2016-05-13 2016-07-27 中国人民解放军国防科学技术大学 面向校车安全的遗漏孩童检测方法
CN106653001A (zh) * 2016-11-17 2017-05-10 沈晓明 婴儿哭声的辩识方法及其系统

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108492829A (zh) * 2018-03-13 2018-09-04 广州势必可赢网络科技有限公司 一种婴儿哭闹提醒方法、装置及系统
CN108564967B (zh) * 2018-03-14 2021-05-18 南京邮电大学 面向哭声检测系统的Mel能量声纹特征提取方法
CN108564967A (zh) * 2018-03-14 2018-09-21 南京邮电大学 面向哭声检测系统的Mel能量声纹特征提取方法
CN108615333A (zh) * 2018-05-25 2018-10-02 朱利 基于人工智能的婴儿窒息预警系统和方法
CN108831456A (zh) * 2018-05-25 2018-11-16 深圳警翼智能科技股份有限公司 一种通过语音识别对视频标记的方法、装置及系统
CN110726898B (zh) * 2018-07-16 2022-02-22 北京映翰通网络技术股份有限公司 一种配电网故障类型识别方法
CN110726898A (zh) * 2018-07-16 2020-01-24 北京映翰通网络技术股份有限公司 一种配电网故障类型识别方法
CN109065071A (zh) * 2018-08-31 2018-12-21 电子科技大学 一种基于迭代k-means算法的歌曲聚类方法
CN109065071B (zh) * 2018-08-31 2021-05-14 电子科技大学 一种基于迭代k-means算法的歌曲聚类方法
WO2020259057A1 (zh) * 2019-06-26 2020-12-30 深圳数字生命研究院 声音的识别方法及装置、存储介质和电子装置
CN110706449A (zh) * 2019-09-04 2020-01-17 中移(杭州)信息技术有限公司 一种婴幼儿监测方法、装置与摄像设备及存储介质
CN110808071A (zh) * 2019-10-29 2020-02-18 浙江萌宠日记信息科技股份有限公司 基于信息融合的母婴信息传递方法及系统
CN112743551A (zh) * 2019-10-31 2021-05-04 珠海市一微半导体有限公司 保姆机器人的控制方法、保姆机器人及芯片
CN111354375A (zh) * 2020-02-25 2020-06-30 咪咕文化科技有限公司 一种哭声分类方法、装置、服务器和可读存储介质
EP3940698A1 (en) 2020-07-13 2022-01-19 Zoundream AG A computer-implemented method of providing data for an automated baby cry assessment
WO2022012777A1 (en) 2020-07-13 2022-01-20 Zoundream Ag A computer-implemented method of providing data for an automated baby cry assessment
CN112992136A (zh) * 2020-12-16 2021-06-18 呼唤(上海)云计算股份有限公司 智能婴儿监护系统及方法
CN115376544A (zh) * 2021-05-19 2022-11-22 漳州立达信光电子科技有限公司 数据处理方法、装置及终端设备
CN113779301A (zh) * 2021-08-18 2021-12-10 北京艺旗网络科技有限公司 一种音乐教学方法及装置

Also Published As

Publication number Publication date
CN107591162B (zh) 2021-01-12

Similar Documents

Publication Publication Date Title
CN107591162A (zh) 基于模式匹配的哭声识别方法及智能看护系统
CN105206271A (zh) 智能设备的语音唤醒方法及实现所述方法的系统
US9769296B2 (en) Techniques for voice controlling bluetooth headset
US10224019B2 (en) Wearable audio device
CN109298642A (zh) 采用智能音箱进行监控的方法及装置
CN101424924A (zh) 声控智能家居控制系统
EP3451330A1 (en) Apparatus and method for residential speaker recognition
JP2023535341A (ja) 自動赤ちゃん泣き声判定のためにデータを提供するコンピュータ実装方法
CN103945140B (zh) 视频字幕的生成方法及系统
CN109040641A (zh) 一种视频数据合成方法及装置
CN110097875A (zh) 基于麦克风信号的语音交互唤醒电子设备、方法和介质
CN110223711A (zh) 基于麦克风信号的语音交互唤醒电子设备、方法和介质
CN111967770A (zh) 基于大数据的问卷调查数据处理方法、装置及存储介质
CN110516265A (zh) 一种基于智能语音的单一识别实时翻译系统
CN111508491A (zh) 一种基于深度学习的智能语音交互设备
CN110111776A (zh) 基于麦克风信号的语音交互唤醒电子设备、方法和介质
CN113947376B (zh) 基于多重生物特征的c/s打卡方法和装置
CN201181413Y (zh) 声控智能家居控制装置
WO2016142672A2 (en) Activity monitor
WO2024140430A1 (zh) 基于多模态深度学习的文本分类方法、设备及存储介质
CN113035203A (zh) 一种动态变换语音应答风格的控制方法
WO2024140434A1 (zh) 基于多模态知识图谱的文本分类方法、设备及存储介质
CN111027675B (zh) 一种多媒体播放设置自动调节方法及系统
CN207010925U (zh) 一种自带语音唤醒识别的耳机装置
CN206057845U (zh) 智能终端、智能家居系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant