CN103117061B - 一种基于语音的动物识别方法及装置 - Google Patents

一种基于语音的动物识别方法及装置 Download PDF

Info

Publication number
CN103117061B
CN103117061B CN201310043802.6A CN201310043802A CN103117061B CN 103117061 B CN103117061 B CN 103117061B CN 201310043802 A CN201310043802 A CN 201310043802A CN 103117061 B CN103117061 B CN 103117061B
Authority
CN
China
Prior art keywords
voice
animal
animal species
source signal
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310043802.6A
Other languages
English (en)
Other versions
CN103117061A (zh
Inventor
曾元清
刘立森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201310043802.6A priority Critical patent/CN103117061B/zh
Publication of CN103117061A publication Critical patent/CN103117061A/zh
Application granted granted Critical
Publication of CN103117061B publication Critical patent/CN103117061B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Eye Examination Apparatus (AREA)
  • Telephone Function (AREA)

Abstract

一种基于语音的动物识别方法及装置,所述方法包括:采集若干动物物种的语音样本,提取各语音样本的声波特征参数建立声纹模型,构成一声纹数据库;获取待分析的动物语音信号,利用单声道语音分离技术从所述动物语音信号中分离出至少一个源信号;提取各源信号的声纹,并与声纹数据库中各动物物种的声纹模型进行匹配;记录匹配成功的源信号所对应的动物物种。利用手机等移动终端监听用户周围动物的叫声,通过语音频谱分析的方法,提取出动物叫声的声波特征参数与数据库模型匹配,从而识别周围的动物物种及其数量分布,尤其在野外可以达到趋利避害的目的,而且操作体验具有娱乐趣味性。

Description

一种基于语音的动物识别方法及装置
技术领域
本发明涉及具有语音识别功能的移动终端,尤其涉及一种基于语音的动物识别方法及装置。
背景技术
人类有人类的语言,而且可以听其声知其人,原因是每个人语音中的音调,音色等一些语音的特征参数是难以改变的。动物也有动物的语言,不同的动物所发出的叫声也是不同的,每个物种、每个物种的不同个体均有其独特的叫声特征,例如通过人耳即可轻松地区别出猫的叫声和狗的叫声。对于人们所熟悉的物种叫声往往可以通过人耳轻松地识别该物种,但是对于不熟悉的物种就难以识别,而且人耳听力有限,容易受到主观认知的影响。
当人们处在野外环境中,有时需要警惕周围野生动物的出没,需要掌握周围的动物物种及其数量分布,达到趋利避害的目的。另外,出于野外观测或野生动物监测保护的目的,经常地也需要随时关注周围的动物物种。在这些情况下,动物的叫声是识别物种、追寻动物踪迹的重要线索之一。因而提供一种能通过其叫声识别动物的方法和便携式装置具有现实的意义和实际的需求。
发明内容
为了克服上述所指的现有技术中的不足之处,本发明提供一种基于语音的动物识别方法及装置,以实现利用手机等移动终端监听用户周围动物的叫声,识别周围的动物物种及其数量分布。
本发明是通过以下技术方案实现的:
一种基于语音的动物识别方法,应用于移动终端,其步骤包括:
a、采集若干动物物种的语音样本,提取各语音样本的声波特征参数建立声纹模型,构成一声纹数据库;
b、获取待分析的动物语音信号,利用单声道语音分离技术从所述动物语音信号中分离出至少一个源信号;
c、提取各源信号的声纹,并与声纹数据库中各动物物种的声纹模型进行匹配;
d、记录匹配成功的源信号所对应的动物物种。
进一步地,所述所述步骤a采集若干动物物种的语音样本包括:采集至少一类动物物种的动物语音样本;采集从属于一类动物物种的至少一品种的动物语音样本。
所述步骤d中的匹配成功是指源信号的声纹与声纹数据库中一动物物种的声纹模型的相似值在预设的阀值范围以内。
所述步骤d之后,还包括:分别统计对应同一类动物物种的经匹配成功的源信号数目;在移动终端的显示装置上显示统计结果。
所述声波特征参数包括线性预测倒谱系数、Mel频率倒谱系数、基于小波分析的特征参数中的一种或两种以上,所述声纹数据库中的声纹模型及源信号的声纹为宽带声纹、窄带声纹、振幅声纹、等高线声纹、时间波谱声纹、断面声纹中的一种或两种以上。
所述单声道语音分离技术基于计算场景分析方法、非负矩阵分解算法、带稀疏限制性条件的非负矩阵分解算法中一种或两种以上的组合。
本发明还公开了一种基于语音的动物识别装置,包括:
数据库单元,用于采集若干动物物种的语音样本,提取各语音样本的声波特征参数建立声纹模型,构成一声纹数据库;
语音分离单元,用于获取待分析的动物语音信号,利用单声道语音分离技术从所述动物语音信号中分离出至少一个源信号;
匹配单元,用于提取各源信号的声纹,并与声纹数据库中各动物物种的声纹模型进行匹配;
记录单元,用于记录匹配成功的源信号所对应的动物物种,所述匹配成功是指源信号的声纹与声纹数据库中一动物物种的声纹模型的相似值在预设的阀值范围以内。
进一步地,所述所述数据库单元用于采集若干动物物种的语音样本包括:用于采集至少一类动物物种的动物语音样本;用于采集从属于一类动物物种的至少一品种的动物语音样本。
本发明的基于语音的动物识别装置还包括:一统计单元,用于分别统计对应同一类动物物种的经匹配成功的源信号数目;一显示单元,用于显示统计结果。
与现有技术相比,通过本发明可实现利用手机等移动终端监听用户周围动物的叫声,可以通过语音频谱分析的方法,提取出动物叫声的声波特征参数与数据库模型匹配,作为识别不同动物物种和数量的依据,从而掌握周围的动物物种及其数量分布,尤其在野外可以达到趋利避害的目的,而且操作体验具有娱乐趣味性。
附图说明
附图1为本发明实施例的智能手机的基于语音的动物识别方法的实现流程示意图。
具体实施方式
为了便于本领域技术人员的理解,下面结合附图对本发明作进一步的描述。
一种基于语音的动物识别方法,应用于移动终端,其步骤包括:
a、采集若干动物物种的语音样本,提取各语音样本的声波特征参数建立声纹模型,构成一声纹数据库;
b、获取待分析的动物语音信号,利用单声道语音分离技术从所述动物语音信号中分离出至少一个源信号;
c、提取各源信号的声纹,并与声纹数据库中各动物物种的声纹模型进行匹配;
d、记录匹配成功的源信号所对应的动物物种。
进一步地,所述所述步骤a采集若干动物物种的语音样本包括:采集至少一类动物物种的动物语音样本;采集从属于一类动物物种的至少一品种的动物语音样本。在具体实现中,对于一类动物物种可采集多个品种的动物语音样本,以提高识别的准确性和应用广泛性。
所述步骤d中的匹配成功是指源信号的声纹与声纹数据库中一动物物种的声纹模型的相似值在预设的阀值范围以内。若源信号的声纹与声纹数据库中一动物物种的声纹模型匹配成功,则记录此动物物种对应该源信号。
所述步骤d之后,还包括:分别统计对应同一类动物物种的经匹配成功的源信号数目;在移动终端的显示装置上显示统计结果,即显示获取的动物语音信号中所包含的若干类动物物种的叫声,及所识别的对应每一类动物物种的动物个体的数目。比如识别获取的动物语音信号中包含一只猫和3只狗的叫声。
本发明的语音识别方法为某种动物的种群进行识别,根据这种动物的整体发声特征来进行识别,这与语音识别中的语种识别系统和孤立词识别系统有相似之处。语音信号分析往往分为时域、频域、倒频域等方法,时域分析具有简单直观、清晰易懂、运算量小等优点,但是由于语音信号的频域对外界环境变化具有一定的顽健性,语音中最重要的特性大多反映在其功率谱上,更为有效的分析多是围绕频域进行,利用频域分析获得的共振峰、基音周期等参数反映了语音的声学特性。在本发明中,提取各语音样本的声波特征参数利用快速傅里叶变换等方法,所述声波特征参数包括但不限于线性预测倒谱系数、Mel频率倒谱系数、基于小波分析的特征参数中的一种或两种以上,所述声纹数据库中的声纹模型及源信号的声纹为宽带声纹、窄带声纹、振幅声纹、等高线声纹、时间波谱声纹、断面声纹中的一种或两种以上。其中,前二种显示语声的频率与强度随时间推移的变化特征;中间三种显示语音强度或声压随时间变化的特征;断面声纹只是显示某一时间点上声波强度和频率特征的声纹图。
本发明的较佳实施例中,所述单声道语音分离技术基于现有技术中的计算场景分析方法CASA、非负矩阵分解算法NMF、带稀疏限制性条件的非负矩阵分解算法SNMF中一种或两种以上的组合,还可采用或结合语音客观质量评估方法OQAS等用于单声道的盲信号分离方法。计算场景分析方法CASA是在计算机听觉研究领域里,借鉴计算机视觉研究中的“视觉场景分析”概念而建立声音信号处理模型,至2006年时,根据人类听觉信号处理规则和特点建立起来的听觉场景分析模型,已经达到了相当高的水平,能够较好的将基频分布范围处于相同频带上的多个同时语音进行分离。而利用NMF算法或SNMF算法实现声音信号的分离,就是使系统能像人的大脑一样识别声音的局部特征,实质就是在声音频域中提取所需的声音信号的局部特征,实现声音信号的分离后,合成若干个源信号。上述算法及其组合应用于单声道盲信号的分离为现有技术,在此不进一步展开赘述。而在具体实现中,所述移动终端可提供选项供用户选择是否对声音信号进行分离处理,当用户确信获取的声音信号中只包含单一动物个体的叫声时,可选择不对声音信号进行分离处理,而直接进行声纹的匹配,以提高系统运算速度,避免资源的浪费。
具体地,如附图1所示,以智能手机为例,本发明还提供了一种实施例的智能手机的基于语音的动物识别方法的实现流程,其步骤包括:
001、采集若干动物物种的语音样本;
002、提取各语音样本的声波特征参数,建立声纹数据库;
003、手机耳麦或听筒获取待分析的动物语音信号;
004、利用单声道语音分离技术从所述动物语音信号中分离出至少一个源信号;
005、提取各源信号的声纹;
006、将源信号的声纹并与声纹数据库中各动物物种的声纹模型进行匹配;
007、判断是否匹配成功,若是,执行步骤008,否则,忽略该源信号;
008、记录匹配成功的源信号所对应的动物物种;
009、在显示屏幕上显示识别的动物物种及对应个体数目。
本发明还公开了一种基于语音的动物识别装置,包括:
数据库单元,用于采集若干动物物种的语音样本,提取各语音样本的声波特征参数建立声纹模型,构成一声纹数据库;
语音分离单元,用于获取待分析的动物语音信号,利用单声道语音分离技术从所述动物语音信号中分离出至少一个源信号;
匹配单元,用于提取各源信号的声纹,并与声纹数据库中各动物物种的声纹模型进行匹配;
记录单元,用于记录匹配成功的源信号所对应的动物物种,所述匹配成功是指源信号的声纹与声纹数据库中一动物物种的声纹模型的相似值在预设的阀值范围以内。
进一步地,所述所述数据库单元用于采集若干动物物种的语音样本包括:用于采集至少一类动物物种的动物语音样本;用于采集从属于一类动物物种的至少一品种的动物语音样本。
本发明的基于语音的动物识别装置还包括:一统计单元,用于分别统计对应同一类动物物种的经匹配成功的源信号数目;一显示单元,用于显示统计结果。在具体应用中,所述显示单元可为智能手机的显示屏幕。
以上内容是结合具体的优选方式对本发明所作的进一步详细说明,不应认定本发明的具体实施只局限于以上说明。对于本技术领域的技术人员而言,在不脱离本发明构思的前提下,还可以作出若干简单推演或替换,均应视为由本发明所提交的权利要求确定的保护范围之内。

Claims (4)

1.一种基于语音的动物识别方法,应用于移动终端,其步骤包括:
a、采集若干动物物种的语音样本,提取各语音样本的声波特征参数建立声纹模型,构成一声纹数据库;
b、获取待分析的动物语音信号,利用单声道语音分离技术从所述动物语音信号中分离出至少一个源信号;
c、提取各源信号的声纹,并与声纹数据库中各动物物种的声纹模型进行匹配;
d、记录匹配成功的源信号所对应的动物物种;
所述步骤a采集若干动物物种的语音样本包括:
采集至少一类动物物种的动物语音样本;
采集从属于一类动物物种的至少一品种的动物语音样本;
所述步骤d中的匹配成功是指源信号的声纹与声纹数据库中一动物物种的声纹模型的相似值在预设的阀值范围以内;
所述步骤d之后,还包括:
分别统计对应同一类动物物种的经匹配成功的源信号数目;
在移动终端的显示装置上显示统计结果。
2.根据权利要求1所述的基于语音的动物识别方法,其特征在于:所述声波特征参数包括线性预测倒谱系数、Mel频率倒谱系数、基于小波分析的特征参数中的一种或两种以上,所述声纹数据库中的声纹模型及源信号的声纹为宽带声纹、窄带声纹、振幅声纹、等高线声纹、时间波谱声纹、断面声纹中的一种或两种以上。
3.根据权利要求1所述的基于语音的动物识别方法,其特征在于:所述单声道语音分离技术基于计算场景分析方法、非负矩阵分解算法、带稀疏限制性条件的非负矩阵分解算法中一种或两种以上的组合。
4.一种基于语音的动物识别装置,其特征在于,包括:
数据库单元,用于采集若干动物物种的语音样本,提取各语音样本的声波特征参数建立声纹模型,构成一声纹数据库;
语音分离单元,用于获取待分析的动物语音信号,利用单声道语音分离技术从所述动物语音信号中分离出至少一个源信号;
匹配单元,用于提取各源信号的声纹,并与声纹数据库中各动物物种的声纹模型进行匹配;
记录单元,用于记录匹配成功的源信号所对应的动物物种;
统计单元,用于分别统计对应同一类动物物种的经匹配成功的源信号数目;
显示单元,用于显示统计结果;
所述数据库单元用于采集若干动物物种的语音样本包括:
用于采集至少一类动物物种的动物语音样本;
用于采集从属于一类动物物种的至少一品种的动物语音样本;
所述匹配成功是指源信号的声纹与声纹数据库中一动物物种的声纹模型的相似值在预设的阀值范围以内。
CN201310043802.6A 2013-02-05 2013-02-05 一种基于语音的动物识别方法及装置 Expired - Fee Related CN103117061B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310043802.6A CN103117061B (zh) 2013-02-05 2013-02-05 一种基于语音的动物识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310043802.6A CN103117061B (zh) 2013-02-05 2013-02-05 一种基于语音的动物识别方法及装置

Publications (2)

Publication Number Publication Date
CN103117061A CN103117061A (zh) 2013-05-22
CN103117061B true CN103117061B (zh) 2016-01-20

Family

ID=48415419

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310043802.6A Expired - Fee Related CN103117061B (zh) 2013-02-05 2013-02-05 一种基于语音的动物识别方法及装置

Country Status (1)

Country Link
CN (1) CN103117061B (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103985385A (zh) * 2014-05-30 2014-08-13 安庆师范学院 基于波谱特征鉴定蛙类个体信息的方法
CN104468001B (zh) * 2014-11-26 2017-04-19 北京邮电大学 基于无线电信号频谱特征模板的信号识别方法及系统
CN104392722B (zh) * 2014-11-28 2018-11-09 电子科技大学 一种基于声音的生物种群识别方法及系统
CN104485102A (zh) * 2014-12-23 2015-04-01 智慧眼(湖南)科技发展有限公司 声纹识别方法和装置
CN106156009A (zh) * 2015-04-13 2016-11-23 中兴通讯股份有限公司 语音翻译方法及装置
CN104835498B (zh) * 2015-05-25 2018-12-18 重庆大学 基于多类型组合特征参数的声纹识别方法
CN105336331A (zh) * 2015-11-21 2016-02-17 太原理工大学 基于声音的猪异常行为智能监测方法及智能监测系统
CN105976820B (zh) * 2016-06-14 2019-12-31 上海质良智能化设备有限公司 一种语音情感分析系统
CN107766372A (zh) * 2016-08-19 2018-03-06 中兴通讯股份有限公司 一种维护动物数据库的方法、装置和系统
CN107202559B (zh) * 2017-05-08 2020-04-03 西北工业大学 基于室内声学信道扰动分析的物体识别方法
CN107369451B (zh) * 2017-07-18 2020-12-22 北京市计算中心 一种辅助鸟类繁殖期的物候研究的鸟类声音识别方法
WO2019104556A1 (zh) * 2017-11-29 2019-06-06 深圳市沃特沃德股份有限公司 翻译方法及装置
CN110033777A (zh) * 2018-01-11 2019-07-19 深圳市诚壹科技有限公司 鸟类识别方法、装置、终端设备及计算机可读存储介质
CN110415727B (zh) * 2018-04-28 2021-12-07 科大讯飞股份有限公司 宠物情绪识别方法及装置
CN108734114A (zh) * 2018-05-02 2018-11-02 浙江工业大学 一种结合面部和声纹的宠物识别方法
CN111626093B (zh) * 2020-03-27 2023-12-26 国网江西省电力有限公司电力科学研究院 一种基于鸣声功率谱密度的输电线路相关鸟种识别方法
CN111598062B (zh) * 2020-07-21 2020-10-27 深圳市天和荣科技有限公司 一种宠物识别方法、系统、可读存储介质及计算机设备
CN112885357A (zh) * 2021-01-13 2021-06-01 上海英粤汽车科技有限公司 一种通过语音识别动物类别的方法
CN115188387B (zh) * 2022-07-12 2023-04-07 四川农业大学 一种有效的海洋哺乳动物声音自动检测和分类方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101976564A (zh) * 2010-10-15 2011-02-16 中国林业科学研究院森林生态环境与保护研究所 昆虫声音识别方法
CN102054480A (zh) * 2009-10-29 2011-05-11 北京理工大学 一种基于分数阶傅立叶变换的单声道混叠语音分离方法
CN202650528U (zh) * 2012-07-02 2013-01-02 昆明信诺莱伯科技有限公司 一种基于声信号处理的动物监测分析系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030125946A1 (en) * 2002-01-03 2003-07-03 Wen-Hao Hsu Method and apparatus for recognizing animal species from an animal voice

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102054480A (zh) * 2009-10-29 2011-05-11 北京理工大学 一种基于分数阶傅立叶变换的单声道混叠语音分离方法
CN101976564A (zh) * 2010-10-15 2011-02-16 中国林业科学研究院森林生态环境与保护研究所 昆虫声音识别方法
CN202650528U (zh) * 2012-07-02 2013-01-02 昆明信诺莱伯科技有限公司 一种基于声信号处理的动物监测分析系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
小波变换在基于动物叫声的物种识别系统中的应用;苏健民等;《自动化技术与应用》;20081231;第27卷(第8期);全文 *

Also Published As

Publication number Publication date
CN103117061A (zh) 2013-05-22

Similar Documents

Publication Publication Date Title
CN103117061B (zh) 一种基于语音的动物识别方法及装置
WO2021128741A1 (zh) 语音情绪波动分析方法、装置、计算机设备及存储介质
CN110782920B (zh) 音频识别方法、装置及数据处理设备
CN106504754B (zh) 一种根据音频输出的实时字幕生成方法
CN110880329B (zh) 一种音频识别方法及设备、存储介质
CN101023469B (zh) 数字滤波方法和装置
WO2017092216A1 (zh) 一种语音质量评估方法、装置及设备
CN105679310A (zh) 一种用于语音识别方法及系统
CN111477250A (zh) 音频场景识别方法、音频场景识别模型的训练方法和装置
CN108962229B (zh) 一种基于单通道、无监督式的目标说话人语音提取方法
Stowell et al. Birdsong and C4DM: A survey of UK birdsong and machine recognition for music researchers
CN104916289A (zh) 行车噪声环境下快速声学事件的检测方法
CN102723078A (zh) 基于自然言语理解的语音情感识别方法
CN103971681A (zh) 一种语音识别方法及系统
CN112669820B (zh) 基于语音识别的考试作弊识别方法、装置及计算机设备
CN104142831B (zh) 应用程序搜索方法及装置
WO2017045429A1 (zh) 一种音频数据的检测方法、系统及存储介质
CN112382300A (zh) 声纹鉴定方法、模型训练方法、装置、设备及存储介质
CN103985390A (zh) 一种基于伽马通相关图语音特征参数提取方法
Ting Yuan et al. Frog sound identification system for frog species recognition
CN112820275A (zh) 一种基于声音信号分析哺乳仔猪异常的自动监测方法
CN109817227A (zh) 一种养殖场的异常声音监测方法和系统
CN112259123B (zh) 一种鼓点检测方法、装置及电子设备
CN106356054A (zh) 一种基于语音识别的农产品信息采集方法和系统
CN115048984A (zh) 一种基于深度学习的母猪发情声识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18

Patentee after: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS Corp.,Ltd.

Address before: Changan Town, Guangdong province 523860 usha Beach Road Dongguan City, No. 18 Guangdong Oupo Mobile Communication Co Ltd

Patentee before: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS Corp.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160120