CN103456301A - 一种基于环境声音的场景识别方法及装置及移动终端 - Google Patents

一种基于环境声音的场景识别方法及装置及移动终端 Download PDF

Info

Publication number
CN103456301A
CN103456301A CN2012101679805A CN201210167980A CN103456301A CN 103456301 A CN103456301 A CN 103456301A CN 2012101679805 A CN2012101679805 A CN 2012101679805A CN 201210167980 A CN201210167980 A CN 201210167980A CN 103456301 A CN103456301 A CN 103456301A
Authority
CN
China
Prior art keywords
module
sound
scene
characteristic information
scene recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012101679805A
Other languages
English (en)
Other versions
CN103456301B (zh
Inventor
薛涛
杜军朝
刘惠
刘悦韡
陈文靖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201210167980.5A priority Critical patent/CN103456301B/zh
Priority to PCT/CN2013/074355 priority patent/WO2013177981A1/zh
Priority to US14/395,538 priority patent/US9542938B2/en
Priority to EP13797320.2A priority patent/EP2827326A4/en
Publication of CN103456301A publication Critical patent/CN103456301A/zh
Application granted granted Critical
Publication of CN103456301B publication Critical patent/CN103456301B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供了一种基于环境声音的场景识别方法及装置及移动终端,所述装置包括:声音采集模块、预处理模块、特征提取模块、场景识别模块、数据库;声音采集模块用于采集声音信号并传输到所述预处理模块;预处理模块用于将所述声音信号处理为频域信号并传输至所述特征提取模块;特征提取模块用于从所述频域信号中提取声音特征信息;数据库用于存储不同场景的声音样本模型权重值;识别控制模块用于在预设模型下输入所述声音特征信息将模型输出结果与所述场景声音样本模型权重值进行匹配,并确定所述声音特征信息对应的场景。本发明依靠背景声音信息作为场景的特征来实现定位,使移动终端在保持低能耗的状态下快速准确的识别当前所在的场景。

Description

一种基于环境声音的场景识别方法及装置及移动终端
技术领域
本发明涉及智能终端技术领域,尤其涉及基于环境声音的场景识别方法及装置及移动终端。
背景技术
声音识别技术广泛应用于通讯系统,例如,在移动通信系统中应用声音识别检测技术,可以提高系统的流量处理能力。此外,声音识别技术被越来越多的应用到语音识别的领域,并且技术已经相当成熟,如IBM语音识别输入系统ViaVoice,微软语音识别系统SpeechSDK等等。
随着智能手机在日常生活中越来越常见,语音识别也很好的被运用到智能手机中,iphone就发布了一个语音识别的应用Google Mobile App。该语音搜索的另外一个改进是可以选择口音了,Google都可以顺利识别不同地域性的发音。
由于智能手机的流行,定位技术也是智能手机应用的一大热点,目前,场景识别问题可以利用已经被广泛研究过的基于天线的定位技术(例如WIFI,GSM和GPS)来解决。对于室外定位而言,GPS已经提供了非常理想的识别精度。但是,对于室内定位,当前尚未出现一个理想且全面的定位解决方案。受制于建筑物内部的拓扑和强烈的电磁干扰等因素,天线信号的强度往往会不规则的变化,从而使得感知设备无法进行合理的位置推测。研究发现WIFI信号在一天的不同时间段内波动很大,并且其强度的变化并不均匀,况且我们不能保证WIFI信号在所有环境中都存在。另一方面,基站的信号在不同时间上则显得更加稳定。但是由于其部署的不够密集,其在定位上也遇到了许多困难。另外,这类定位方法往往对基础设施的完善有极高的要求。但是对于发展中区域而言,这样的成本无疑太高了。基于GPS,GSM,WIFI信号的定位,在室内环境中不能工作,或者存在较大的定位误差,不能区分地理位置上比较近的室内场所。
发明内容
本发明要解决的技术问题是提供一种基于环境声音的场景识别方法及装置及移动终端,解决移动终端无法识别当前所在的场景的问题。
为了解决上述技术问题,本发明提供了一种基于环境声音的场景识别装置,所述装置包括:声音采集模块、预处理模块、特征提取模块、场景识别模块、数据库;
所述声音采集模块,用于采集声音信号并传输到所述预处理模块;
所述预处理模块,用于将所述声音信号处理为频域信号并传输至所述特征提取模块;
所述特征提取模块,用于从所述频域信号中提取声音特征信息;
所述数据库,用于存储不同场景的声音样本模型权重值;
所述识别控制模块,用于在预设模型下输入所述声音特征信息将模型输出结果与所述场景声音样本模型权重值进行匹配,并确定所述声音特征信息对应的场景。
进一步地,上述装置还可以具有以下特点:
所述场景是指不同声音环境下的空间场景。
进一步地,上述装置还可以具有以下特点:
所述声音采集模块、所述预处理模块、所述特征提取模块、所述场景识别模块、所述数据库均位于移动终端。
进一步地,上述装置还可以具有以下特点:
所述声音采集模块、所述预处理模块、所述特征提取模块、所述场景识别模块均位于移动终端中,所述数据库位于服务端设备。
进一步地,上述装置还可以具有以下特点:
所述声音采集模块、所述预处理模块、所述特征提取模块均位于移动终端中,所述场景识别模块和所述数据库位于服务端设备;
所述移动终端还包括场景识别控制模块,用于接收声音特征信息并发送至所述服务端设备,还用于接收所述场景识别模块输出的识别结果。
为了解决上述技术问题,本发明还提供了一种移动终端,包括声音采集模块、预处理模块、特征提取模块、场景识别模块、数据库;
所述声音采集模块,用于采集声音信号并传输到所述预处理模块;
所述预处理模块,用于将所述声音信号处理为频域信号并传输至所述特征提取模块;
所述特征提取模块,用于从所述频域信号中提取声音特征信息;
所述数据库,用于存储不同场景的声音样本模型权重值;
所述场景识别模块,用于接收所述声音特征信息,在预设模型下输入所述声音特征信息将模型输出结果与所述场景声音样本模型权重值进行匹配,并确定所述声音特征信息对应的场景。
为了解决上述技术问题,本发明还提供了一种移动终端,包括声音采集模块、预处理模块、特征提取模块、场景识别模块;
所述声音采集模块,用于采集声音信号并传输到所述预处理模块;
所述预处理模块,用于将所述声音信号处理为频域信号并传输至所述特征提取模块;
所述特征提取模块,用于从所述频域信号中提取声音特征信息;
所述场景识别模块,用于接收所述声音特征信息,还用于从服务端设备接收场景的声音样本模型权重值,在预设模型下输入所述声音特征信息将模型输出结果与所述场景声音样本模型权重值进行匹配,并确定所述声音特征信息对应的场景。
为了解决上述技术问题,本发明还提供了一种移动终端,包括声音采集模块、预处理模块、特征提取模块、识别控制模块;
所述声音采集模块,用于采集声音信号并传输到所述预处理模块;
所述预处理模块,用于将所述声音信号处理为频域信号并传输至所述特征提取模块;
所述特征提取模块,用于从所述频域信号中提取声音特征信息;
所述识别控制模块,用于接收所述声音特征信息,将所述声音特征信息发送至服务端设备,并接收服务端设备返回的场景识别结果。
为了解决上述技术问题,本发明还提供了一种基于环境声音的场景识别方法,包括:采集声音信号;
将所述声音信号处理为频域信号;
从所述频域信号中提取声音特征信息;
在预设模型下输入所述声音特征信息将模型输出结果与场景声音样本模型权重值进行匹配,并确定所述声音特征信息对应的场景。
进一步地,上述方法还可以具有以下特点:
所述场景是指不同声音环境下的空间场景。
本发明依靠背景声音信息作为场景的特征来实现定位,使移动终端在保持低能耗的状态下快速准确的识别当前所在的场景。本发明的场景定位可以与天线位置定位互补并且共同提高精度的,提高移动终端性能。
附图说明
图1是现有技术中声音识别的处理流程示意图;
图2是实施例中基于环境声音的场景识别装置的结构示意图;
图3是实施例一中场景识别装置的结构示意图;
图4是实施例二中场景识别装置的结构示意图;
图5是实施例三中场景识别装置的结构示意图;
图6是具体实施例中特征向量提取过程示意图;
图7是具体实施例中场景分类识别模型结构示意图。
具体实施方式
图1是现有技术中声音识别的处理流程示意图,对声音进行分割以及特征提取后通过分类器对声音进行识别。
基于环境声音的场景识别方法包括:采集声音信号;将所述声音信号处理为频域信号;从所述频域信号中提取声音特征信息;在预设模型下输入所述声音特征信息将模型输出结果与场景声音样本模型权重值进行匹配,并确定所述声音特征信息对应的场景。
所述场景是指不同声音环境下的空间场景,例如场景是指以下中的一种:食堂、教室、实验室、宿舍、楼道、羽毛球场、乒乓球场、电梯、会议室、操场和街道。
如图2所示,本方案中基于环境声音的场景识别装置包括:声音采集模块(201)、预处理模块(202)、特征提取模块(203)、场景识别模块(204)、数据库(205)。
声音采集模块(201),用于采集声音信号并传输到所述预处理模块(202);
预处理模块(202),用于将所述声音信号处理为频域信号并传输至所述特征提取模块(203);
特征提取模块(203),用于从所述频域信号中提取声音特征信息;
数据库(205),用于存储不同场景的声音样本模型权重值;
识别控制模块(204),用于在预设模型下输入所述声音特征信息将模型输出结果与所述场景声音样本模型权重值进行匹配,并确定所述声音特征信息对应的场景。
预处理模块(202)对采集到的声音信号进行采样,设定采样频率为8000Hz,采集样本长度为15s,再对段声音样本进行分帧操作,每个帧包含256个采样点,即每段帧长为32ms。这样,原始音频就会变成468个长度为32ms的帧。分帧操作的目的在于任何一段声音样本都会随机出现一些或大或小的突发声音,突发声音没有规律可言,并不是能够代表场景特征的声音,会导致声音波形出现较大的毛刺,从而影响声音识别的准确率,时长越短的音频波形表现的越发平稳。但是,帧长过短也会导致运算成本的增加,即计算能耗和耗时的增加。本方案采用了32ms做为每一帧的长度,达到了精确度和计算成本的平衡。
特征提取模块(203)中提取的声音特征可以是梅尔倒谱系数(MFCC),例如13维的MFCC系数。例如,从每段15s声音样本都可以提取出468组13维的特征向量。在计算出每一帧的特征向量后,必须要对这468组特征向量进行算术平均。上述将每段声音样本分成长度为32ms的帧是为了消除声音样本中的毛刺,但是只对每段音频分帧还是不能起到消除毛刺的作用。所以,本方案在对每帧音频提取特征向量后,必须把这468组特征向量进行算术平均,从而得到唯一一组13维特征向量。这样的一组特征向量降低了样本中的毛刺带来的影响,正确的表示了该段场景的特征。
本方案中的预设模型可以是神经网络等分类模型。
本方案使用了一个模式分类领域的算法。该算法分为两个部分,训练部分和识别部分。在训练部分,该算法使用一定规模的训练集,生成若干个我们称之为中间矩阵数据集合。在识别部分,使用这些矩阵与从声音样本中提取的特征向量进行运算,从而获得最终结果,即识别结果。在开发的过程中,所述算法的训练部分不需要写入手机系统,不需要每次识别都进行运算,这样可以很大程度地减少运算时间。所述识别算法使用的训练集采集于每个需要识别的场景,每个场景需要收集160到200段声音样本,并对每段声音样本提取特征向量,把这些声音样本的特征向量统一作为参数传给算法的训练部分,最终得到中间矩阵。这些中间矩阵存储于数据库中,供所述算法的识别部分调用。由于场景识别的准确率需要不断提高,同时需要识别的场景要不断进行更新,所以,本方案中的分类识别算法所需要的中间矩阵就需要不断的更新。随着场景的更新,该技术就会拥有更强大的时效性和可用性。
如图3所示,实施例一中声音采集模块(201)、预处理模块(202)、特征提取模块(203)、场景识别模块(204)、数据库(205)均位于移动终端内。
如图4所示,实施例二中声音采集模块(201)、预处理模块(202)、特征提取模块(203)、场景识别模块(204)均位于移动终端内,数据库(205)位于服务端设备。
如图5所示,实施例三中声音采集模块(201)、预处理模块(202)、特征提取模块(203)均位于移动终端,场景识别模块(204)、数据库(205)位于服务端设备。移动终端还包括场景识别控制模块(206),用于接收声音特征信息并发送至服务端设备,还用于接收所述场景识别模块(204)输出的识别结果。
下面通过具体实施例进行详细说明。
本发明是基于Android系统开发,选用了一台智能手机作为试验机,识别过程包括以下步骤:
步骤1,声音采集过程
由智能手机中的麦克风进行声音采集集工作,采样率为8000Hz,采样编码为16bit,每段声音样本的时长都是15s。
步骤2,场景识别过程
在预处理过程中,对音频进行分帧处理并将信号从时域信号转换为频域信号。实验发现当帧长为256,即时长为32ms时,可以得到最高的识别正确率。同时,在每段音频的开始,都会出现若干个坏点,所以删去每段音频最开始的一些采样点,保证留下的音频采样点都能显示出该段音频的特征。为了节省更多的硬件空间,可以每分出一个帧,就把它作为参数传给特征提取函数进行计算。这样,只需要存储从每个帧提取的特征向量,而不需要浪费控件用于存储每个帧的音频。
提取特征的步骤包括:
步骤2.1,执行快速傅里叶变换,将时域信号变换成频域信号。
X a ( k ) = Σ n = 0 N - 1 x ( n ) e - j 2 π N , 0 ≤ k ≤ N
式中,x(n)为输入的音频信号,N为傅里叶变换的点数。
步骤2.2,对信号的频谱幅度求算术平方,可以得到功率谱。
步骤2.3,如图6所示,用一组梅尔频标上线性分布的三角窗滤波器(共24个三角窗滤波器),对信号的功率谱滤波,每一个三角窗滤波器覆盖的范围都近似于人耳的一个临界带宽,以此来模拟人耳的掩蔽效应。其中,梅尔频标
Figure BDA00001690978200082
三角滤波器的中心频率为f(y),y=1,2,...,24,且三角滤波器的频率响应定义式如下式所示:
H y ( k ) = 0 , k < f ( y - 1 ) 2 ( k - f ( y - 1 ) ) ( f ( y + 1 ) - f ( y - 1 ) ) ( f ( y ) - f ( m - 1 ) ) , f ( y - 1 ) &le; k &le; f ( y ) 2 ( f ( y + 1 ) - k ) ( f ( y + 1 ) - f ( y - 1 ) ) ( f ( y + 1 ) - f ( y ) ) , f ( y ) &le; k &le; ( y + 1 ) 0 , k &GreaterEqual; f ( y + 1 ) , 式中 &Sigma; y = 0 23 H y ( k ) = 1
步骤2.4,对每个通过滤波器的功率频谱取对数,可以得到近似于同态变换的结果S(y)。
S ( y ) = ln ( &Sigma; 0 23 | X a ( k ) | 2 H y ( k ) ) , 0 &le; y &le; 24
式中,Xa(k)是音频信号的功率谱,Hy(k)是滤波器组。
步骤2.5,再通过离散余弦变换各得到最终的特征向量C(n)。
C ( n ) = &Sigma; y = 0 23 S ( y ) cos ( &pi;n ( y - 0.5 ) 24 ) , 0 &le; n &le; 24
式中,n表示需求得特征向量的维数,设定特征向量有13维,设置n为12即可。
步骤2.6,把所求13维的特征向量存储在内存中,待这段声音样本每帧的特征向量都计算完成的时候,做算术平均,求得该段音频样本的特征向量。
步骤3,场景识别过程
特征向量提取完成后,这组13维的特征向量就要作为参数传给分类识别算法。采用概率神经网络结构(如图7所示),其中,有d个输入层单元,n个模式层单元和c个类别层单元。每一个模式曾但愿能够对它的权重向量和归一化的样本相连x做内积,得到z=wtx,然后映射为exp[(z-1)/σ2]。
识别分类算法分为两个部分,即训练部分和识别部分。
训练部分:
步骤3.1,归一化参加训练的样本x为单位长度,也就是说
Figure BDA00001690978200091
第一个经过归一化了的样本被至于输入层单元上。
步骤3.2,连接输入单元和第一个模式层单元的那些连接被初始化为w1=x1。然后,从模式层的第一个单元到类别层中代表x1所属的类别的那个单元之间建立了一个连接。同样地的过程对剩下的各个模式单元都重复进行,即wk=xk,其中k=1,2,3,…,n。
步骤3.3,在步骤3.2完成后,可以得到一个特殊的网络,即输入层单元与模式层单元之间是完全连通的,而模式层单元到类别层单元之间是系数连接的。记第j个样本的第k个分量记为xjk,把这个分量到第j个模式层单元的连接权重系数记为wjk,其中j=1,2,…,n,k=1,2,…,d。
在这个算法中出现的矩阵w就是中间矩阵,中间矩阵将会在算法的识别部分中使用到。
算法的识别部分主要是围绕着两个元素进行计算,首先是被称为净激活的netk=wtx,利用它构造关于netk的非线性函数
Figure BDA00001690978200092
其中,σ为自定参数,在本算法中被设定为10。其次,就是利用计算出来的判别函数gi(x),通过在算法最后计算
Figure BDA00001690978200094
来识别出输入此神经网络的声音特征信息的场景。
本发明依靠背景声音信息作为场景的特征来实现定位,使移动终端在保持低能耗的状态下快速准确的识别当前所在的场景。本发明的场景定位可以与天线位置定位互补并且共同提高精度的,提高移动终端性能。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。

Claims (10)

1.一种基于环境声音的场景识别装置,其特征在于,
所述装置包括:声音采集模块、预处理模块、特征提取模块、场景识别模块、数据库;
所述声音采集模块,用于采集声音信号并传输到所述预处理模块;
所述预处理模块,用于将所述声音信号处理为频域信号并传输至所述特征提取模块;
所述特征提取模块,用于从所述频域信号中提取声音特征信息;
所述数据库,用于存储不同场景的声音样本模型权重值;
所述识别控制模块,用于在预设模型下输入所述声音特征信息将模型输出结果与所述场景声音样本模型权重值进行匹配,并确定所述声音特征信息对应的场景。
2.如权利要求1所述的装置,其特征在于,
所述场景是指不同声音环境下的空间场景。
3.如权利要求1所述的装置,其特征在于,
所述声音采集模块、所述预处理模块、所述特征提取模块、所述场景识别模块、所述数据库均位于移动终端。
4.如权利要求1所述的装置,其特征在于,
所述声音采集模块、所述预处理模块、所述特征提取模块、所述场景识别模块均位于移动终端中,所述数据库位于服务端设备。
5.如权利要求1所述的装置,其特征在于,
所述声音采集模块、所述预处理模块、所述特征提取模块均位于移动终端中,所述场景识别模块和所述数据库位于服务端设备;
所述移动终端还包括场景识别控制模块,用于接收声音特征信息并发送至所述服务端设备,还用于接收所述场景识别模块输出的识别结果。
6.一种移动终端,其特征在于,
包括声音采集模块、预处理模块、特征提取模块、场景识别模块、数据库;
所述声音采集模块,用于采集声音信号并传输到所述预处理模块;
所述预处理模块,用于将所述声音信号处理为频域信号并传输至所述特征提取模块;
所述特征提取模块,用于从所述频域信号中提取声音特征信息;
所述数据库,用于存储不同场景的声音样本模型权重值;
所述场景识别模块,用于接收所述声音特征信息,在预设模型下输入所述声音特征信息将模型输出结果与所述场景声音样本模型权重值进行匹配,并确定所述声音特征信息对应的场景。
7.一种移动终端,其特征在于,
包括声音采集模块、预处理模块、特征提取模块、场景识别模块;
所述声音采集模块,用于采集声音信号并传输到所述预处理模块;
所述预处理模块,用于将所述声音信号处理为频域信号并传输至所述特征提取模块;
所述特征提取模块,用于从所述频域信号中提取声音特征信息;
所述场景识别模块,用于接收所述声音特征信息,还用于从服务端设备接收场景的声音样本模型权重值,在预设模型下输入所述声音特征信息将模型输出结果与所述场景声音样本模型权重值进行匹配,并确定所述声音特征信息对应的场景。
8.一种移动终端,其特征在于,
包括声音采集模块、预处理模块、特征提取模块、识别控制模块;
所述声音采集模块,用于采集声音信号并传输到所述预处理模块;
所述预处理模块,用于将所述声音信号处理为频域信号并传输至所述特征提取模块;
所述特征提取模块,用于从所述频域信号中提取声音特征信息;
所述识别控制模块,用于接收所述声音特征信息,将所述声音特征信息发送至服务端设备,并接收服务端设备返回的场景识别结果。
9.一种基于环境声音的场景识别方法,其特征在于,
采集声音信号;
将所述声音信号处理为频域信号;
从所述频域信号中提取声音特征信息;
在预设模型下输入所述声音特征信息将模型输出结果与场景声音样本模型权重值进行匹配,并确定所述声音特征信息对应的场景。
10.如权利要求9所述的方法,其特征在于,
所述场景是指不同声音环境下的空间场景。
CN201210167980.5A 2012-05-28 2012-05-28 一种基于环境声音的场景识别方法及装置及移动终端 Active CN103456301B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201210167980.5A CN103456301B (zh) 2012-05-28 2012-05-28 一种基于环境声音的场景识别方法及装置及移动终端
PCT/CN2013/074355 WO2013177981A1 (zh) 2012-05-28 2013-04-18 一种基于环境声音的场景识别方法、装置及移动终端
US14/395,538 US9542938B2 (en) 2012-05-28 2013-04-18 Scene recognition method, device and mobile terminal based on ambient sound
EP13797320.2A EP2827326A4 (en) 2012-05-28 2013-04-18 METHOD, DEVICE AND MOBILE TERMINAL FOR RECOGNIZING SCENE BASED ON AMBIENT SOUND

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210167980.5A CN103456301B (zh) 2012-05-28 2012-05-28 一种基于环境声音的场景识别方法及装置及移动终端

Publications (2)

Publication Number Publication Date
CN103456301A true CN103456301A (zh) 2013-12-18
CN103456301B CN103456301B (zh) 2019-02-12

Family

ID=49672375

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210167980.5A Active CN103456301B (zh) 2012-05-28 2012-05-28 一种基于环境声音的场景识别方法及装置及移动终端

Country Status (4)

Country Link
US (1) US9542938B2 (zh)
EP (1) EP2827326A4 (zh)
CN (1) CN103456301B (zh)
WO (1) WO2013177981A1 (zh)

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104464733A (zh) * 2014-10-28 2015-03-25 百度在线网络技术(北京)有限公司 一种语音对话的多场景管理方法及装置
CN104880693A (zh) * 2014-02-27 2015-09-02 华为技术有限公司 室内定位方法和装置
CN104952449A (zh) * 2015-01-09 2015-09-30 珠海高凌技术有限公司 环境噪声声源识别方法及装置
CN105118516A (zh) * 2015-09-29 2015-12-02 浙江图维电力科技有限公司 基于声音线性预测倒谱系数的工程机械的识别方法
CN105355201A (zh) * 2015-11-27 2016-02-24 百度在线网络技术(北京)有限公司 基于场景的语音服务处理方法、装置和终端设备
CN105761657A (zh) * 2016-05-11 2016-07-13 梁辉 一种采用彩色点阵显示音乐频谱或动画的方法和系统
CN106128476A (zh) * 2016-06-15 2016-11-16 汤美 网络课程的老师识别方法及系统
CN106941653A (zh) * 2017-04-03 2017-07-11 浙江诺尔康神经电子科技股份有限公司 人工耳蜗智能预测系统和方法
CN107103901A (zh) * 2017-04-03 2017-08-29 浙江诺尔康神经电子科技股份有限公司 人工耳蜗声音场景识别系统和方法
CN107105095A (zh) * 2017-04-25 2017-08-29 努比亚技术有限公司 一种声音处理方法及移动终端
CN107247928A (zh) * 2017-05-23 2017-10-13 武汉秀宝软件有限公司 一种基于识别图的水平角度构建ar场景的方法及系统
CN107316035A (zh) * 2017-08-07 2017-11-03 北京中星微电子有限公司 基于深度学习神经网络的对象识别方法及装置
CN107492153A (zh) * 2016-06-07 2017-12-19 腾讯科技(深圳)有限公司 考勤系统、方法、考勤服务器及考勤终端
CN107644641A (zh) * 2017-07-28 2018-01-30 深圳前海微众银行股份有限公司 对话场景识别方法、终端以及计算机可读存储介质
CN107690034A (zh) * 2017-10-27 2018-02-13 中国科学技术大学苏州研究院 基于环境背景声音的智能情景模式切换系统及方法
CN107808659A (zh) * 2017-12-02 2018-03-16 宫文峰 智能语音信号模式识别系统装置
CN108257596A (zh) * 2017-12-22 2018-07-06 北京小蓦机器人技术有限公司 一种用于提供目标呈现信息的方法与设备
CN108538311A (zh) * 2018-04-13 2018-09-14 腾讯音乐娱乐科技(深圳)有限公司 音频分类方法、装置及计算机可读存储介质
CN108711419A (zh) * 2018-07-31 2018-10-26 浙江诺尔康神经电子科技股份有限公司 一种人工耳蜗的环境声感知方法和系统
CN108766454A (zh) * 2018-06-28 2018-11-06 浙江飞歌电子科技有限公司 一种语音噪声抑制方法及装置
WO2018228280A1 (zh) * 2017-06-12 2018-12-20 杭州海康威视数字技术股份有限公司 一种通知信息的输出方法、服务器及监控系统
CN109298642A (zh) * 2018-09-20 2019-02-01 三星电子(中国)研发中心 采用智能音箱进行监控的方法及装置
CN109741747A (zh) * 2019-02-19 2019-05-10 珠海格力电器股份有限公司 语音场景识别方法和装置、语音控制方法和设备、空调
CN109977731A (zh) * 2017-12-27 2019-07-05 深圳市优必选科技有限公司 一种场景的识别方法、识别设备及终端设备
CN110414312A (zh) * 2019-06-05 2019-11-05 平安科技(深圳)有限公司 人脸识别方法、装置、服务器及存储介质
WO2020087716A1 (zh) * 2018-10-30 2020-05-07 上海力声特医学科技有限公司 人工耳蜗听觉场景识别方法
CN111145915A (zh) * 2019-12-31 2020-05-12 重庆医科大学附属儿童医院 儿童保健随访及病案管理系统
CN111161876A (zh) * 2019-12-31 2020-05-15 重庆医科大学附属儿童医院 一种儿童病案辅助判断系统的训练方法
WO2020098679A1 (zh) * 2018-11-15 2020-05-22 华为技术有限公司 网络场景识别的方法及接入网设备
CN111276138A (zh) * 2018-12-05 2020-06-12 北京嘀嘀无限科技发展有限公司 一种语音唤醒系统中处理语音信号的方法及装置
CN113409041A (zh) * 2020-03-17 2021-09-17 华为技术有限公司 一种电子卡的选取方法、装置、终端以及存储介质
CN113470654A (zh) * 2021-06-02 2021-10-01 国网浙江省电力有限公司绍兴供电公司 一种声纹自动识别系统及方法
WO2021203930A1 (zh) * 2020-04-08 2021-10-14 华为技术有限公司 一种心律检测控制方法及终端
US11218842B2 (en) 2018-03-26 2022-01-04 Huawei Technologies Co., Ltd. Method for activating service based on user scenario perception, terminal device, and system

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9626963B2 (en) * 2013-04-30 2017-04-18 Paypal, Inc. System and method of improving speech recognition using context
JP2016524724A (ja) * 2013-05-28 2016-08-18 トムソン ライセンシングThomson Licensing 家庭環境内で音声コマンドに関連付けられた位置を特定して家庭用電気機器を制御する方法およびシステム
US10475471B2 (en) * 2016-10-11 2019-11-12 Cirrus Logic, Inc. Detection of acoustic impulse events in voice applications using a neural network
CN107967457B (zh) * 2017-11-27 2024-03-19 全球能源互联网研究院有限公司 一种适应视觉特征变化的地点识别与相对定位方法及系统
CN110164426B (zh) * 2018-02-10 2021-10-26 佛山市顺德区美的电热电器制造有限公司 语音控制方法和计算机存储介质
JP2019205114A (ja) * 2018-05-25 2019-11-28 ヤマハ株式会社 データ処理装置、及びデータ処理方法。
KR20200063290A (ko) * 2018-11-16 2020-06-05 삼성전자주식회사 오디오 장면을 인식하는 전자 장치 및 그 방법
CN109783047B (zh) * 2019-01-18 2022-05-06 三星电子(中国)研发中心 一种终端上的智能音量控制方法和装置
US11531516B2 (en) 2019-01-18 2022-12-20 Samsung Electronics Co., Ltd. Intelligent volume control
CN110730473B (zh) * 2019-09-03 2023-04-28 中国人民解放军陆军工程大学 面向WiFi活动识别的信号特征提取方法
WO2022232457A1 (en) * 2021-04-29 2022-11-03 Dolby Laboratories Licensing Corporation Context aware audio processing
CN113608082B (zh) * 2021-07-30 2024-03-22 环宇集团(南京)有限公司 一种基于音频信号的环网柜放电状态识别方法

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030061037A1 (en) * 2001-09-27 2003-03-27 Droppo James G. Method and apparatus for identifying noise environments from noisy signals
CN1637740A (zh) * 2003-11-20 2005-07-13 阿鲁策株式会社 对话控制设备和对话控制方法
CN1835073A (zh) * 2006-04-20 2006-09-20 南京大学 基于语音特征判别的静音检测方法
CN101107845A (zh) * 2005-01-21 2008-01-16 皇家飞利浦电子股份有限公司 运行模式调节设备和调节电子产品运行模式的方法
CN101145280A (zh) * 2007-10-31 2008-03-19 北京航空航天大学 基于独立分量分析的车辆声音识别方法
CN101175265A (zh) * 2006-10-31 2008-05-07 英华达(上海)电子有限公司 对手机上情景模式进行自动切换的方法
CN201315622Y (zh) * 2008-11-21 2009-09-23 康佳集团股份有限公司 一种可自动调节铃音的手机
US20090271188A1 (en) * 2008-04-24 2009-10-29 International Business Machines Corporation Adjusting A Speech Engine For A Mobile Computing Device Based On Background Noise
CN101790000A (zh) * 2010-02-20 2010-07-28 华为终端有限公司 一种环境声音提醒方法和移动终端
CN101840700A (zh) * 2010-04-28 2010-09-22 宇龙计算机通信科技(深圳)有限公司 基于移动终端的声音识别方法及移动终端
CN101980336A (zh) * 2010-10-18 2011-02-23 福州星网视易信息系统有限公司 一种基于隐马尔可夫模型的汽车声音识别方法
CN101984340A (zh) * 2010-10-28 2011-03-09 浙江工业大学 一种基于人工智能的软性磨粒两相湍流流型识别方法
US20110106587A1 (en) * 2009-10-30 2011-05-05 Wendell Lynch Distributed audience measurement systems and methods
CN102247124A (zh) * 2011-04-13 2011-11-23 深圳市理邦精密仪器股份有限公司 一种监护仪自适应环境的方法和装置
CN202221609U (zh) * 2011-08-02 2012-05-16 杭州威威网络科技有限公司 基于音频识别的联网报警装置
CN101529929B (zh) * 2006-09-05 2012-11-07 Gn瑞声达A/S 具有基于直方图的声环境分类的助听器

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6006175A (en) * 1996-02-06 1999-12-21 The Regents Of The University Of California Methods and apparatus for non-acoustic speech characterization and recognition
US7295977B2 (en) * 2001-08-27 2007-11-13 Nec Laboratories America, Inc. Extracting classifying data in music from an audio bitstream
FR2842014B1 (fr) * 2002-07-08 2006-05-05 Lyon Ecole Centrale Procede et appareil pour affecter une classe sonore a un signal sonore
JP4357867B2 (ja) * 2003-04-25 2009-11-04 パイオニア株式会社 音声認識装置、音声認識方法、並びに、音声認識プログラムおよびそれを記録した記録媒体
US7469209B2 (en) * 2003-08-14 2008-12-23 Dilithium Networks Pty Ltd. Method and apparatus for frame classification and rate determination in voice transcoders for telecommunications
US8219386B2 (en) * 2009-01-21 2012-07-10 King Fahd University Of Petroleum And Minerals Arabic poetry meter identification system and method
US8812310B2 (en) * 2010-08-22 2014-08-19 King Saud University Environment recognition of audio input

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030061037A1 (en) * 2001-09-27 2003-03-27 Droppo James G. Method and apparatus for identifying noise environments from noisy signals
CN1637740A (zh) * 2003-11-20 2005-07-13 阿鲁策株式会社 对话控制设备和对话控制方法
CN101107845A (zh) * 2005-01-21 2008-01-16 皇家飞利浦电子股份有限公司 运行模式调节设备和调节电子产品运行模式的方法
CN1835073A (zh) * 2006-04-20 2006-09-20 南京大学 基于语音特征判别的静音检测方法
CN101529929B (zh) * 2006-09-05 2012-11-07 Gn瑞声达A/S 具有基于直方图的声环境分类的助听器
CN101175265A (zh) * 2006-10-31 2008-05-07 英华达(上海)电子有限公司 对手机上情景模式进行自动切换的方法
CN101145280A (zh) * 2007-10-31 2008-03-19 北京航空航天大学 基于独立分量分析的车辆声音识别方法
US20090271188A1 (en) * 2008-04-24 2009-10-29 International Business Machines Corporation Adjusting A Speech Engine For A Mobile Computing Device Based On Background Noise
CN201315622Y (zh) * 2008-11-21 2009-09-23 康佳集团股份有限公司 一种可自动调节铃音的手机
US20110106587A1 (en) * 2009-10-30 2011-05-05 Wendell Lynch Distributed audience measurement systems and methods
CN101790000A (zh) * 2010-02-20 2010-07-28 华为终端有限公司 一种环境声音提醒方法和移动终端
CN101840700A (zh) * 2010-04-28 2010-09-22 宇龙计算机通信科技(深圳)有限公司 基于移动终端的声音识别方法及移动终端
CN101980336A (zh) * 2010-10-18 2011-02-23 福州星网视易信息系统有限公司 一种基于隐马尔可夫模型的汽车声音识别方法
CN101984340A (zh) * 2010-10-28 2011-03-09 浙江工业大学 一种基于人工智能的软性磨粒两相湍流流型识别方法
CN102247124A (zh) * 2011-04-13 2011-11-23 深圳市理邦精密仪器股份有限公司 一种监护仪自适应环境的方法和装置
CN202221609U (zh) * 2011-08-02 2012-05-16 杭州威威网络科技有限公司 基于音频识别的联网报警装置

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
HELLI APRILIA: ""The Development Speech Recognition Model using MFCC as Feature Extraction and PNN as Pattern Recognition"", 《INSTITUT PERTANIAN BOGOR》 *
LING MA ET AL: ""Environmental Noise classification for context-aware applications"", 《DATABASE AND EXPERT SYSTEMS APPLICATIONS, LECTURE NOTES IN COMPUTER SCIENCE》 *
TODOR GANCHEV ET AL: ""Automatic_acoustic_identification_of_singing_insects"", 《BIOACOUSTICS》 *
ZHU LE-QING: ""Insect sound recognition based on MFCC and PNN"", 《2011 INTERNATIONAL CONFERENCE ON MULTIMEDIA AND SIGNAL PROCESSING》 *
薛涛 等: ""基于智能手机的室内外定位技术在物联网中的应用"", 《物联网技术》 *
高文婷: ""稳健语音特征和音频场景识别方法的研究"", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104880693A (zh) * 2014-02-27 2015-09-02 华为技术有限公司 室内定位方法和装置
WO2015127858A1 (zh) * 2014-02-27 2015-09-03 华为技术有限公司 室内定位方法和装置
CN104880693B (zh) * 2014-02-27 2018-07-20 华为技术有限公司 室内定位方法和装置
CN104464733A (zh) * 2014-10-28 2015-03-25 百度在线网络技术(北京)有限公司 一种语音对话的多场景管理方法及装置
CN104464733B (zh) * 2014-10-28 2019-09-20 百度在线网络技术(北京)有限公司 一种语音对话的多场景管理方法及装置
CN104952449A (zh) * 2015-01-09 2015-09-30 珠海高凌技术有限公司 环境噪声声源识别方法及装置
CN105118516A (zh) * 2015-09-29 2015-12-02 浙江图维电力科技有限公司 基于声音线性预测倒谱系数的工程机械的识别方法
CN105355201A (zh) * 2015-11-27 2016-02-24 百度在线网络技术(北京)有限公司 基于场景的语音服务处理方法、装置和终端设备
CN105761657A (zh) * 2016-05-11 2016-07-13 梁辉 一种采用彩色点阵显示音乐频谱或动画的方法和系统
CN107492153A (zh) * 2016-06-07 2017-12-19 腾讯科技(深圳)有限公司 考勤系统、方法、考勤服务器及考勤终端
CN106128476A (zh) * 2016-06-15 2016-11-16 汤美 网络课程的老师识别方法及系统
CN106941653A (zh) * 2017-04-03 2017-07-11 浙江诺尔康神经电子科技股份有限公司 人工耳蜗智能预测系统和方法
CN107103901B (zh) * 2017-04-03 2019-12-24 浙江诺尔康神经电子科技股份有限公司 人工耳蜗声音场景识别系统和方法
CN107103901A (zh) * 2017-04-03 2017-08-29 浙江诺尔康神经电子科技股份有限公司 人工耳蜗声音场景识别系统和方法
CN107105095A (zh) * 2017-04-25 2017-08-29 努比亚技术有限公司 一种声音处理方法及移动终端
CN107247928B (zh) * 2017-05-23 2020-06-23 武汉秀宝软件有限公司 一种基于识别图的水平角度构建ar场景的方法及系统
CN107247928A (zh) * 2017-05-23 2017-10-13 武汉秀宝软件有限公司 一种基于识别图的水平角度构建ar场景的方法及系统
WO2018228280A1 (zh) * 2017-06-12 2018-12-20 杭州海康威视数字技术股份有限公司 一种通知信息的输出方法、服务器及监控系统
US11275628B2 (en) 2017-06-12 2022-03-15 Hangzhou Hikvision Digital Technology Co., Ltd. Notification information output method, server and monitoring system
CN107644641A (zh) * 2017-07-28 2018-01-30 深圳前海微众银行股份有限公司 对话场景识别方法、终端以及计算机可读存储介质
CN107316035A (zh) * 2017-08-07 2017-11-03 北京中星微电子有限公司 基于深度学习神经网络的对象识别方法及装置
CN107690034A (zh) * 2017-10-27 2018-02-13 中国科学技术大学苏州研究院 基于环境背景声音的智能情景模式切换系统及方法
CN107808659A (zh) * 2017-12-02 2018-03-16 宫文峰 智能语音信号模式识别系统装置
CN108257596A (zh) * 2017-12-22 2018-07-06 北京小蓦机器人技术有限公司 一种用于提供目标呈现信息的方法与设备
CN109977731A (zh) * 2017-12-27 2019-07-05 深圳市优必选科技有限公司 一种场景的识别方法、识别设备及终端设备
US11218842B2 (en) 2018-03-26 2022-01-04 Huawei Technologies Co., Ltd. Method for activating service based on user scenario perception, terminal device, and system
US11711670B2 (en) 2018-03-26 2023-07-25 Huawei Technologies Co., Ltd. Method for activating service based on user scenario perception, terminal device, and system
CN108538311A (zh) * 2018-04-13 2018-09-14 腾讯音乐娱乐科技(深圳)有限公司 音频分类方法、装置及计算机可读存储介质
CN108766454A (zh) * 2018-06-28 2018-11-06 浙江飞歌电子科技有限公司 一种语音噪声抑制方法及装置
CN108711419A (zh) * 2018-07-31 2018-10-26 浙江诺尔康神经电子科技股份有限公司 一种人工耳蜗的环境声感知方法和系统
CN108711419B (zh) * 2018-07-31 2020-07-31 浙江诺尔康神经电子科技股份有限公司 一种人工耳蜗的环境声感知方法和系统
CN109298642B (zh) * 2018-09-20 2021-08-27 三星电子(中国)研发中心 采用智能音箱进行监控的方法及装置
CN109298642A (zh) * 2018-09-20 2019-02-01 三星电子(中国)研发中心 采用智能音箱进行监控的方法及装置
WO2020087716A1 (zh) * 2018-10-30 2020-05-07 上海力声特医学科技有限公司 人工耳蜗听觉场景识别方法
WO2020098679A1 (zh) * 2018-11-15 2020-05-22 华为技术有限公司 网络场景识别的方法及接入网设备
CN111276138A (zh) * 2018-12-05 2020-06-12 北京嘀嘀无限科技发展有限公司 一种语音唤醒系统中处理语音信号的方法及装置
CN109741747A (zh) * 2019-02-19 2019-05-10 珠海格力电器股份有限公司 语音场景识别方法和装置、语音控制方法和设备、空调
CN110414312A (zh) * 2019-06-05 2019-11-05 平安科技(深圳)有限公司 人脸识别方法、装置、服务器及存储介质
CN111161876A (zh) * 2019-12-31 2020-05-15 重庆医科大学附属儿童医院 一种儿童病案辅助判断系统的训练方法
CN111145915A (zh) * 2019-12-31 2020-05-12 重庆医科大学附属儿童医院 儿童保健随访及病案管理系统
CN113409041A (zh) * 2020-03-17 2021-09-17 华为技术有限公司 一种电子卡的选取方法、装置、终端以及存储介质
CN113409041B (zh) * 2020-03-17 2023-08-04 华为技术有限公司 一种电子卡的选取方法、装置、终端以及存储介质
WO2021203930A1 (zh) * 2020-04-08 2021-10-14 华为技术有限公司 一种心律检测控制方法及终端
CN113470654A (zh) * 2021-06-02 2021-10-01 国网浙江省电力有限公司绍兴供电公司 一种声纹自动识别系统及方法

Also Published As

Publication number Publication date
US9542938B2 (en) 2017-01-10
EP2827326A4 (en) 2015-08-12
EP2827326A1 (en) 2015-01-21
US20150120291A1 (en) 2015-04-30
WO2013177981A1 (zh) 2013-12-05
CN103456301B (zh) 2019-02-12

Similar Documents

Publication Publication Date Title
CN103456301A (zh) 一种基于环境声音的场景识别方法及装置及移动终端
CN110428808B (zh) 一种语音识别方法及装置
CN110600017B (zh) 语音处理模型的训练方法、语音识别方法、系统及装置
WO2021128741A1 (zh) 语音情绪波动分析方法、装置、计算机设备及存储介质
CN110428842A (zh) 语音模型训练方法、装置、设备及计算机可读存储介质
CN107993071A (zh) 电子装置、基于声纹的身份验证方法及存储介质
CN108630209B (zh) 一种基于特征融合与深度置信网络的海洋生物识别方法
Ng et al. Convmixer: Feature interactive convolution with curriculum learning for small footprint and noisy far-field keyword spotting
CN107767861A (zh) 语音唤醒方法、系统及智能终端
CN108198561A (zh) 一种基于卷积神经网络的翻录语音检测方法
CN109637525B (zh) 用于生成车载声学模型的方法和装置
CN103685520A (zh) 基于语音识别的歌曲推送的方法和装置
CN108281158A (zh) 基于深度学习的语音活体检测方法、服务器及存储介质
CN104658538A (zh) 一种基于鸟鸣声的移动式鸟类识别方法
CN109919295A (zh) 一种基于轻量级卷积神经网络的嵌入式音频事件检测方法
CN104123930A (zh) 喉音识别方法及装置
CN102982351A (zh) 基于bp神经网络的瓷绝缘子振动声学检测数据分类方法
CN110556126A (zh) 语音识别方法、装置以及计算机设备
CN108877809A (zh) 一种说话人语音识别方法及装置
CN105895082A (zh) 声学模型训练方法、语音识别方法及装置
CN110972112A (zh) 地铁运行方向的确定方法、装置、终端及存储介质
CN109003607B (zh) 语音识别方法、装置、存储介质及电子设备
CN105825857A (zh) 基于声纹识别帮助失聪患者判断声音类别的方法
CN105654955A (zh) 语音识别方法及装置
Chen et al. An audio scene classification framework with embedded filters and a DCT-based temporal module

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant