CN110631064B - 一种声音识别方法及应用有该声音识别方法的吸油烟机的自动控制方法 - Google Patents
一种声音识别方法及应用有该声音识别方法的吸油烟机的自动控制方法 Download PDFInfo
- Publication number
- CN110631064B CN110631064B CN201810552003.4A CN201810552003A CN110631064B CN 110631064 B CN110631064 B CN 110631064B CN 201810552003 A CN201810552003 A CN 201810552003A CN 110631064 B CN110631064 B CN 110631064B
- Authority
- CN
- China
- Prior art keywords
- voice
- order difference
- sound
- range hood
- identified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 239000013598 vector Substances 0.000 claims abstract description 59
- 238000005070 sampling Methods 0.000 claims abstract description 20
- 238000004364 calculation method Methods 0.000 claims abstract description 17
- 230000005236 sound signal Effects 0.000 claims abstract description 14
- 238000001514 detection method Methods 0.000 claims description 9
- 238000010411 cooking Methods 0.000 claims description 8
- 238000013459 approach Methods 0.000 claims 1
- 238000004891 communication Methods 0.000 description 4
- 239000000779 smoke Substances 0.000 description 3
- 238000013500 data storage Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
Images
Classifications
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F24—HEATING; RANGES; VENTILATING
- F24C—DOMESTIC STOVES OR RANGES ; DETAILS OF DOMESTIC STOVES OR RANGES, OF GENERAL APPLICATION
- F24C15/00—Details
- F24C15/20—Removing cooking fumes
- F24C15/2021—Arrangement or mounting of control or safety systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Chemical & Material Sciences (AREA)
- Combustion & Propulsion (AREA)
- Mechanical Engineering (AREA)
- General Engineering & Computer Science (AREA)
- Air Conditioning Control Device (AREA)
Abstract
本发明涉及一种声音识别方法,对声音采样信号X进行一阶差分计算,获取一阶差分数据组Y,进而将一阶差分数据组Y中各一阶差分数据yj与一阶差分数据阈值yth进行比较计算而获取一阶差分特征数据组VY=[v1,v2,...,vj,...vn],获取一阶差分特征数据组中vj=K2的序号数据组,进而获取待识别声音信号的识别特征向量V,将该待识别声音信号的识别特征向量V与声音模板特征向量Vsam进行契合度比较计算,进而确定待识别的声音信号内容。该声音识别方法能够有效减少数据处理量。本发明还涉及一种应用有该声音识别方法的吸油烟机的控制方法,吸油烟机根据识别的声音内容对吸油烟机进行操作控制。该吸油烟机的自动控制方法的声音识别性能好、成本低。
Description
技术领域
本发明涉及声音识别技术领域,特别涉及一种声音识别方法,还涉及应有有该声音识别方法的吸油烟机的自动控制方法。
背景技术
在日常生活中,吸油烟机和燃气灶通常情况下是同时使用的,现有烟灶联动使得吸油烟机和燃气灶配合工作。常见的烟灶联动方式是在燃气灶中使用红外线、射频通信发射模块,在吸油烟机中安装相应的接收模块。当燃气灶开启时通信发射模块向吸油烟机发射控制信号,吸油烟机接收到控制信号后开启,从而完成烟灶联动。但此方法存在一定的缺陷:通信发射接收模块必须匹配,若吸油烟机和燃气灶不是同一品牌,这就导致无法配合使用,而且无线通信模块也容易收到电磁干扰,在电磁复杂环境下可靠性难以保证。
授权公布号为CN103673008B(申请号为201310422741.4)的中国发明专利《一种智能吸油烟机以及该吸油烟机的控制方法》,以及申请公布号为CN107031533A(申请号为201710348689.0)的中国发明专利申请《一种吸油烟机的自动驱动系统及其控制方法》,其中均公开了采用声音检测识别的方法来实现对吸油烟机的自动控制,如此则解决了需要吸油烟机和燃气灶配合的问题,但是公开的文件中并未给出声音识别的具体方法,而采用现有的声音识别方法,往往需要将采集的声音数据转换为频域信号进行处理,数据处理量以及存储量大。而应用在吸油烟机中声音处理模块通常采用单片机作为处理核心,而常见的单片机的内存有限,处理能力也有限,如果增加内存则相应成本较高。
发明内容
本发明所要解决的第一个技术问题是针对上述现有技术提供一种能够有效减少数据处理量的声音识别方法。
本发明所要解决的第二个技术问题是针对上述现有技术提供一种声音识别性能好、成本低的吸油烟机的自动控制方法。
本发明解决上述第一个技术问题所采用的技术方案为:一种声音识别方法,其特征在于:包括
对采集的待识别声音信号进行采样,进而获取待识别声音信号的采样信号X=[x0,x1,x2,...,xi,...xn],其中,i和n为自然数,0≤i≤n;
计算采样信号X的一阶差分数据组Y=[y1,y2,...,yj,...yn],yj=xj-xj-1,其中j为正整数,1≤j≤n;
获取VY中满足vj=K2的一阶差分数据yj对应的序号数据组,进而获取待识别声音信号的识别特征向量V:
V=[m1,m2,...,mp,...,ma],其中a和p为正整数,m1≤mp≤ma,ma∈[1,2,3,...,j,...,n];
将该待识别声音信号的识别特征向量V与声音模板特征向量Vsam进行契合度比较计算,进而确定待识别的声音信号内容。
为了有效截取出待识别的声音信号,当前待识别声音信号的识别特征向量V是否获取结束的判断方法为:
计算当前采样信号对应的一阶差分特征数据如果则获取当前一阶差分特征数据对应的序号mb与前一个一阶差分特征数据对应的序号mc进行差值计算,如果mb-mc>M,则判断当前一段待识别声音信号的识别特征向量V获取完毕;
其中mb∈[1,2,3,...,j,...,n],mc∈[1,2,3,...,j,...,n],M为设置的结束点序号差判断阈值。
优选地,该待识别声音信号的识别特征向量V与声音模板特征向量Vsam进行契合度比较计算的方法为:
判断V与Vsam的向量长度是否相同;
如果不同,则判断待识别声音信号与声音模板特征向量Vsam对应的声音内容不同;
如果相同,则计算V与Vsam的之间的契合度值S;
其中,Vsam=[r1,r2,...,rp,...,ra],r1≤rp≤ra,ra∈[1,2,3,...,j,...,n];
判断是否S<Sth,其中Sth为设定的契合度阈值;
如果是,则表示V与Vsam的之间的契合度满足要求,判断待识别声音信号为声音模板特征向量Vsam对应的声音内容,如果否,则判断待识别声音信号与声音模板特征向量Vsam对应的声音内容不同。
本发明解决上述第二个技术问题所采用的技术方案为:一种应用有所述的声音识别方法的吸油烟机的控制方法,其特征在于:
设置存储有各种声音模板对应的声音模板特征向量的模板库;
将待识别声音信号的识别特征向量V与模板库中各声音模板特征向量进行比较计算,进而获取待识别声音信号对应的声音内容;
吸油烟机根据识别的声音内容对吸油烟机进行操作控制。
更智能化地,利用红外检测装置检测人体是否靠近烹饪区域,如果是则吸油烟机启动声音采集工作,开始采集待识别声音信号,并利用所述的声音识别方法进行声音识别;如果否则进行计时,如果在设定时间阈值的时长内未检测到人体靠近烹饪区则控制吸油烟机进入休眠状态。
与现有技术相比,本发明的优点在于:本发明中的声音识别方法,对采样的待识别声音信号进行一阶差分计算,进而减少了数据量,在此基础上再对获取的一阶差分数据组进行特征量计算,进而获取数据量更少的识别特征向量,识别特征向量中均存储一阶差分特征时间点序号而并非声音信号本身,该过程中无需将声音信号转换为频率信号,大大减少了数据计算量,同时在进行识别时,是通过向量中序号的比对进行识别,声音模板特征向量数据的存储量也大大减小。该声音识别方法特别适用于家电中声音特点比较单一的声音的识别,识别准确率、效率高。
本发明中应用有声音识别方法的吸油烟机的控制方法,根据对声音的识别实现对吸油烟机的控制,由于声音识别方法对数据处理量、数据存储量要求低,则大大减少了吸油烟机的生产成本。
附图说明
图1为本发明实施例中声音识别方法的流程图。
具体实施方式
以下结合附图实施例对本发明作进一步详细描述。
本实施例中的声音识别方法可以应用在各种环境中,特别适合应用在声音特征比较单调的家电中。本实施例中以该声音识别方法在吸油烟机中的使用为例进行说明。
吸油烟机中可以设置红外检测装置、声音采集装置以及控制器,红外检测装置、声音采集装置分别与控制器电连接,进而向控制器内传送数据,控制器可以针对声音采集装置采集的声音信号利用下述的声音识别方法进行识别,进而控制吸油烟机进行启动、吸油烟工作、调节档位、关闭吸油烟机等操作。
该红外检测装置可以用来检测是否有人体靠近烹饪区域,该烹饪区域根据具体需要进行设置,如该烹饪区域可以为厨房整个空间区域,也可以为吸油烟机附近的区域。红外检测装置的检测范围与需求相匹配。
在使用时,红外检测装置检测人体是否靠近烹饪区域,如果是则吸油烟机启动声音采集工作,开始采集待识别声音信号,并利用下述声音识别方法进行声音识别;如果否则进行计时,如果在设定时间阈值的时长内未检测到人体靠近烹饪区则控制吸油烟机进入休眠状态。
在吸油烟机出厂前,提前训练吸油烟机使用过程中会遇到的各种操作对应的声音模板信号,计算获取各声音模板对应的声音模板特征向量,进而存储形成模板库。
声音采集装置启动声音采集工作后,则通过下述的声音识别方法将待识别声音信号的识别特征向量V与模板库中各声音模板特征向量进行比较计算,进而获取待识别声音信号对应的声音内容,吸油烟机根据识别的声音内容对吸油烟机进行操作控制。
如图1所示,本实施例中的声音识别方法的具体内容为:
按照设定的采样周期对吸油烟机中声音采集装置采集的待识别声音信号进行AD采样,进而获取待识别声音信号的采样信号为X=[x0,x1,x2,...,xi,...xn],其中,i和n为自然数,0≤i≤n;
对采样信号X进行一阶差分计算,进而获取采样信号X对应的一阶差分数据组Y=[y1,y2,...,yj,...yn],yj=xj-xj-1,其中j为正整数,1≤j≤n;
获得采样信号X的一节查分数据组Y后,为了提取出该一段采样的语音信号的特征,进一步计算一阶差分数据组Y中各一阶差分数据yj的一阶差分特征数据vj,本实施例中,即将各一阶差分数据yj与一个经测试设定的一阶差分数据阈值yth进行比较即获得相应的一阶差分特征数据vj,具体计算为:vj即为各一阶差分数据yj对应的特征向量数据,K1和K2可以根据需要设置成任意不相同的数值,简单地,本实施例中K1=0,K2=1;
对各一阶差分数据yj对应的特征向量值vj进行统计计算,进而获取一阶差分数据组Y对应的特征向量VY=[v1,v2,...,vj,...vn];
获取VY中满足vj=K2的一阶差分数据yj对应的序号数据组,进而获取待识别声音信号的识别特征向量V:
V=[m1,m2,...,mp,...,ma],其中a和p为正整数,m1≤mp≤ma,ma∈[1,2,3,...,j,...,n]。
举例说明如下:如果X=[x0,x1,x2,x3,x4,x5],对应的Y=[y1,y2,y3,y4,y5],相应获取的VY=[1,0,0,1,1],则V=[1,4,5],其中m1=1,m2=4,m3=5。
将该待识别声音信号的识别特征向量V与声音模板特征向量Vsam进行契合度比较计算,进而确定待识别的声音信号内容。当然,在模板库中可以存储多个声音模板特征向量,待识别声音信号的识别特征向量V与各个声音模板特征向量分别进行比较,均采用下述的方法进行契合度的比较计算。本实施例中,待识别声音信号的识别特征向量V与声音模板特征向量Vsam进行契合度比较计算的方法具体为:
首先判断V与Vsam的向量长度是否相同;或者根据实际情况可以判断V与Vsam的向量长度差是否在允许的向量长度差阈值范围内;
如果V与Vsam的向量长度不同,则直接判断待识别声音信号与声音模板特征向量Vsam对应的声音内容不同;
如果V与Vsam的向量长度相同或者在允许的向量长度差阈值范围内,则计算V与Vsam的之间的契合度值S;
其中,Vsam=[r1,r2,...,rp,...,ra],r1≤rp≤ra,ra∈[1,2,3,...,j,...,n];
判断是否S<Sth,其中Sth为设定的契合度阈值;
如果是,则表示V与Vsam的之间的契合度满足要求,判断待识别声音信号为声音模板特征向量Vsam对应的声音内容;如果否,则判断待识别声音信号与声音模板特征向量Vsam对应的声音内容不同。
以上的数据处理过程为实时处理过程,即在按照采样周期对声音信号进行采样的同时,实时进行对当前采样信号的计算,如此在采样过程中则需要对当前待识别声音信号是否采样结束进行判断。本实施中,当前待识别声音信号是否采样结束,可以直接通过对当前待识别声音信号的识别特征向量V是否获取结束进行判断而获取结果。当前待识别声音信号的识别特征向量V是否获取结束的判断方法为:
先计算当前采样信号对应的一阶差分数据进而再计算一阶差分数据对应的一阶差分特征数据如果则获取当前一阶差分特征数据对应的序号mb与前一个一阶差分特征数据对应的序号mc进行差值计算,如果mb-mc>M,则判断当前一段待识别声音信号的识别特征向量V获取完毕。
其中mb∈[1,2,3,...,j,...,n],mc∈[1,2,3,...,j,...,n],M为设置的结束点序号差判断阈值。
通过前述的声音识别方法可以对灶具的打火声音等类周期声音信号、炒菜声音等突发声音信号进行有效的检测,如当识别出打火声音后,则控制开启吸油烟机按照小档位进行工作,当检测到炒菜声音后,则控制吸油烟机调高档位进行工作。
Claims (5)
1.一种声音识别方法,其特征在于:包括
对采集的待识别声音信号进行采样,进而获取待识别声音信号的采样信号X=[x0,x1,x2,...,xi,...xn],其中,i和n为自然数,0≤i≤n;
计算采样信号X的一阶差分数据组Y=[y1,y2,...,yj,...yn],yj=xj-xj-1,其中j为正整数,1≤j≤n;
获取VY中满足vj=K2的一阶差分数据yj对应的序号数据组,进而获取待识别声音信号的识别特征向量V:
V=[m1,m2,...,mp,...,ma],其中a和p为正整数,m1≤mp≤ma,ma∈[1,2,3,...,j,...,n];
将该待识别声音信号的识别特征向量V与声音模板特征向量Vsam进行契合度比较计算,进而确定待识别的声音信号内容。
3.根据权利要求1或2所述的声音识别方法,其特征在于:该待识别声音信号的识别特征向量V与声音模板特征向量Vsam进行契合度比较计算的方法为:
判断V与Vsam的向量长度是否相同;
如果不同,则判断待识别声音信号与声音模板特征向量Vsam对应的声音内容不同;
如果相同,则计算V与Vsam的之间的契合度值S;
其中,Vsam=[r1,r2,...,rp,...,ra],r1≤rp≤ra,ra∈[1,2,3,...,j,...,n];
判断是否S<Sth,其中Sth为设定的契合度阈值;
如果是,则表示V与Vsam的之间的契合度满足要求,判断待识别声音信号为声音模板特征向量Vsam对应的声音内容,如果否,则判断待识别声音信号与声音模板特征向量Vsam对应的声音内容不同。
4.一种应用有如权利要求1至3任一权利要求所述的声音识别方法的吸油烟机的控制方法,其特征在于:
设置存储有各种声音模板对应的声音模板特征向量的模板库;
将待识别声音信号的识别特征向量V与模板库中各声音模板特征向量进行比较计算,进而获取待识别声音信号对应的声音内容;
吸油烟机根据识别的声音内容对吸油烟机进行操作控制。
5.根据权利要求4所述的吸油烟机的控制方法,其特征在于:利用红外检测装置检测人体是否靠近烹饪区域,如果是则吸油烟机启动声音采集工作,开始采集待识别声音信号,并利用所述的声音识别方法进行声音识别;如果否则进行计时,如果在设定时间阈值的时长内未检测到人体靠近烹饪区则控制吸油烟机进入休眠状态。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810552003.4A CN110631064B (zh) | 2018-05-31 | 2018-05-31 | 一种声音识别方法及应用有该声音识别方法的吸油烟机的自动控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810552003.4A CN110631064B (zh) | 2018-05-31 | 2018-05-31 | 一种声音识别方法及应用有该声音识别方法的吸油烟机的自动控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110631064A CN110631064A (zh) | 2019-12-31 |
CN110631064B true CN110631064B (zh) | 2021-01-15 |
Family
ID=68966228
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810552003.4A Active CN110631064B (zh) | 2018-05-31 | 2018-05-31 | 一种声音识别方法及应用有该声音识别方法的吸油烟机的自动控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110631064B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113703359A (zh) * | 2021-08-23 | 2021-11-26 | 胜斗士(上海)科技技术发展有限公司 | 联动设备及其控制系统和方法 |
CN114140982A (zh) * | 2021-12-09 | 2022-03-04 | 北京航空航天大学 | 一种基于痰鸣音传感器的无线式痰液淤积报警器 |
CN116336517A (zh) * | 2021-12-24 | 2023-06-27 | 佛山市顺德区美的洗涤电器制造有限公司 | 吸油烟机及其控制方法和控制装置、可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5842168A (en) * | 1995-08-21 | 1998-11-24 | Seiko Epson Corporation | Cartridge-based, interactive speech recognition device with response-creation capability |
CN101516005A (zh) * | 2008-02-23 | 2009-08-26 | 华为技术有限公司 | 一种语音识别频道选择系统、方法及频道转换装置 |
CN101833951A (zh) * | 2010-03-04 | 2010-09-15 | 清华大学 | 用于说话人识别的多背景模型建立方法 |
CN104200814A (zh) * | 2014-08-15 | 2014-12-10 | 浙江大学 | 基于语义细胞的语音情感识别方法 |
-
2018
- 2018-05-31 CN CN201810552003.4A patent/CN110631064B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5842168A (en) * | 1995-08-21 | 1998-11-24 | Seiko Epson Corporation | Cartridge-based, interactive speech recognition device with response-creation capability |
CN101516005A (zh) * | 2008-02-23 | 2009-08-26 | 华为技术有限公司 | 一种语音识别频道选择系统、方法及频道转换装置 |
CN101833951A (zh) * | 2010-03-04 | 2010-09-15 | 清华大学 | 用于说话人识别的多背景模型建立方法 |
CN104200814A (zh) * | 2014-08-15 | 2014-12-10 | 浙江大学 | 基于语义细胞的语音情感识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110631064A (zh) | 2019-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110631064B (zh) | 一种声音识别方法及应用有该声音识别方法的吸油烟机的自动控制方法 | |
CN105844216B (zh) | 一种利用WiFi信号识别手写字母的检测与匹配机制 | |
WO2017092224A1 (zh) | 基于rfid的手势识别方法及系统 | |
CN113609976B (zh) | 一种基于WiFi设备的方向敏感多手势识别系统及方法 | |
CN104866099A (zh) | 基于运动传感器提高智能设备手势识别精度的误差补偿方法 | |
CN105447506B (zh) | 一种基于区间分布概率特征的手势识别方法 | |
CN105429719B (zh) | 基于功率谱和多尺度小波变换分析强干扰信号检测方法 | |
CN108737318A (zh) | 基于信号结构特性的ofdm信号识别方法及系统 | |
CN108924847B (zh) | 一种基于ann的认知无线电频谱预测方法及设备 | |
CN105807903A (zh) | 一种智能设备的控制方法及装置 | |
CN112381063A (zh) | 一种基于信道状态信息的人数统计方法 | |
CN103886296B (zh) | 基于反馈的指纹识别方法及装置 | |
CN101762808A (zh) | 基于自适应阈值的雷达脉冲提取方法 | |
CN101582113A (zh) | 一种具有身份的人脸图像分层比对识别方法 | |
CN110690931A (zh) | 一种基于多小波基联合的数字信号自适应码率估计方法和装置 | |
CN111142668B (zh) | 一种基于Wi-Fi指纹的定位和活动手势联合识别的交互方法 | |
CN111402883A (zh) | 一种复杂环境下分布式语音交互系统中就近响应系统和方法 | |
CN115951124A (zh) | 一种时频域联合的连续与突发信号检测方法及系统 | |
CN105743756B (zh) | WiFi系统中基于adaboost算法的帧检测方法 | |
CN104125050A (zh) | 超高频rfid读卡器协议一致性测试方法 | |
CN101656070A (zh) | 一种语音检测方法 | |
CN110197120B (zh) | 用于无人值守传感器系统的人员目标识别方法 | |
CN109782616B (zh) | 基于感应阵列的控制方法、装置、存储介质及计算机设备 | |
CN111257589A (zh) | 一种基于crfid标签的风速测量方法 | |
CN110554368A (zh) | 一种基于四维信息权重的人车识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |