CN109862408A - 一种用于智能电视语音遥控器的用户语音识别控制方法 - Google Patents
一种用于智能电视语音遥控器的用户语音识别控制方法 Download PDFInfo
- Publication number
- CN109862408A CN109862408A CN201811634398.9A CN201811634398A CN109862408A CN 109862408 A CN109862408 A CN 109862408A CN 201811634398 A CN201811634398 A CN 201811634398A CN 109862408 A CN109862408 A CN 109862408A
- Authority
- CN
- China
- Prior art keywords
- smart television
- remote controller
- feature
- voice
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
本发明公开了一种用于智能电视语音遥控器的用户语音识别控制方法,包括以下步骤,启动智能电视、语音遥控器,建立智能电视、语音遥控器的连接,进入智能电视中语音遥控器的语音学习模式,在安静环境下记录家庭内各用户的语音数据,提取各用户对应的具有时序信息语音特征;进入智能电视中语音遥控器的智能控制模式,接收用户输出的音频数据信号;根据当前语音特征采样,遍历语音学习数据库,进行特征值匹配,若匹配成功,从接收到的音频数据信号,提取关键词信息,并与关键词数据库相匹配,进行相关控制操作。本发明响应速度快,方法巧妙,容易实现,具有良好的应用前景。
Description
技术领域
本发明涉及智能电视控制技术领域,具体涉及一种用于智能电视语音遥控器的用户语音识别控制方法。
背景技术
随着Android、苹果等操作系统的广泛应用,如今的智能电视与计算机之间的区别越来越小,它不再是只提供单一、单向的视频服务的设备,用户可以在电视平台上获得更多的应用体验,如网络浏览,电视购物,网络视频聊天等服务。
目前,用户与智能电视之间传统的互动方式是通过遥控器的物理按键输入来对网络信息进行浏览。传统的按键式遥控器,虽然使用简单方便,但受其自身固件大小的限制,只能制定一些基本命令,更在输入字符等信息内容时展现出极大的劣势,其只能靠上、下、左、右移动光标选择对应的字母完成字符的输入,操作速度极低。
随着智能电视的普及,传统的遥控器使得用户体验的效果变差,无法再满足人们对智能电视日益增长的高要求。因此,通过语音控制的智能遥控器,应运而生,语音控制方便快速,提高用户的体验效果。
但是,由于用户发出的语音各种各样,有时候还夹杂着环境噪声,很容易存在误操作,如何快速准确对用户发出的语音第一时间进行准确识别是当前需要解决的问题。
发明内容
本发明的目的是克服现有的语音控制的智能遥控器,识别不清楚,很容易存在误操作的问题。本发明的用于智能电视语音遥控器的用户语音识别控制方法,具备语音学习模式、智能控制模式两组模式,在语音学习数据库内匹配合格的声音才能控制遥控器,并增加了学习能力,对接收到的音频数据信号,统一归一化处理,便于提高控制的精确度,防止无操作,取关键词信息,并与关键词数据库相匹配,进行相关控制操作,响应速度快,方法巧妙,容易实现,具有良好的应用前景。
为了达到上述目的,本发明所采用的技术方案是:
一种用于智能电视语音遥控器的用户语音识别控制方法,包括以下步骤,
步骤(A),启动智能电视、语音遥控器,建立智能电视、语音遥控器的连接,进入智能电视中语音遥控器的语音学习模式,在安静环境下记录家庭内各用户的语音数据,提取各用户对应的具有时序信息语音特征;
步骤(B),对各用户对应的具有时序信息语音特征,进行补零操作,建立各用户等长的语音特征样本,并存储到智能电视对应的语音学习数据库中,存在新的用户,返回步骤(A),更新语音学习数据库;
步骤(C),建立遥控控制的关键词数据库,将关键词数据库存储到智能电视存储空间内;
步骤(D),进入智能电视中语音遥控器的智能控制模式,接收用户输出的音频数据信号;
步骤(E),从接收到的音频数据信号,统一归一化处理;
步骤(F),对统一归一化处理的语音进行切分,并加窗分帧处理,提取各分帧数据单元的语音特征;
步骤(G),对各语音特征进行补零操作,得到当前语音特征采样;
步骤(H),根据当前语音特征采样,遍历语音学习数据库,进行特征值匹配,若匹配成功,执行步骤(I);若匹配不成功,则报警,提醒用户进入语音学习模式;
步骤(J),从接收到的音频数据信号,提取关键词信息,并与关键词数据库相匹配,进行相关控制操作。
前述的用于智能电视语音遥控器的用户语音识别控制方法,步骤(A),在安静环境下记录家庭内各用户的语音数据,所述安静环境为低于12分贝情况下。
前述的用于智能电视语音遥控器的用户语音识别控制方法,步骤(B),对各用户对应的具有时序信息语音特征,不等长的进行前端补零操作,与最长的具有时序信息语音特征的长度相同。
前述的用于智能电视语音遥控器的用户语音识别控制方法,步骤(C),建立遥控控制的关键词数据库,包括电台关键词、声音关键词、操作关键词、常用词关键词。
前述的用于智能电视语音遥控器的用户语音识别控制方法,步骤(E),从接收到的音频数据信号,统一归一化处理,归一化后整段语音的范围是[-1,1],归一化前后的整段语音在数值为零处所表达的物理意义不变,均是无声段。
前述的用于智能电视语音遥控器的用户语音识别控制方法,步骤(F),对统一归一化处理的语音进行切分,并加窗分帧处理,提取各分帧数据单元的语音特征,包括以下步骤,
(F1),标记统一归一化处理的语音的出无声段,根据无声段的数量统一归一化处理的语音进行切分,形成各分帧数据单元;
(F2),增加的窗函数为hamming窗W(n,α),其的计算公式如下,
W(n,α)=(1-α)-αcos(2πn/(n-1)),0≤n≤N-1
其中,α取值0.6,N为n的取值范围,表示Hamming窗的长度;
(F3),通过增加的的窗函数,提取各分帧数据单元的语音特征。
前述的用于智能电视语音遥控器的用户语音识别控制方法,步骤(A),具有时序信息语音特征、各分帧数据单元的语音特征,均包括93维的时序相关特征,分别为声音概率、谐噪比、基频、无声段的基频原始值、基频包络、连续周期之间的平均绝对差、连续周期之间的连续差的平均绝对差值、连续周期内插值峰值振幅的平均绝对差、谐波分量的均方根能量、噪声的均方根能量、响度、响度增量回归系数。
前述的用于智能电视语音遥控器的用户语音识别控制方法,步骤(H),根据当前语音特征采样,遍历语音学习数据库,进行特征值匹配,匹配过程,当93维的时序相关特征中存在相识度达到90%以上的时序相关特征的数量超过60%以上,则认定为特征值匹配。
本发明的有益效果是:本发明的用于智能电视语音遥控器的用户语音识别控制方法,具备语音学习模式、智能控制模式两组模式,在语音学习数据库内匹配合格的声音才能控制遥控器,并增加了学习能力,对接收到的音频数据信号,统一归一化处理,便于提高控制的精确度,防止无操作,取关键词信息,并与关键词数据库相匹配,进行相关控制操作,响应速度快,方法巧妙,容易实现,具有良好的应用前景。
附图说明
图1是本发明的用于智能电视语音遥控器的用户语音识别控制方法的流程图。
具体实施方式
下面将结合说明书附图,对本发明作进一步的说明。
如图1所示,本发明的用于智能电视语音遥控器的用户语音识别控制方法,包括以下步骤,
步骤(A),启动智能电视、语音遥控器,建立智能电视、语音遥控器的连接,进入智能电视中语音遥控器的语音学习模式,在安静环境下记录家庭内各用户的语音数据,提取各用户对应的具有时序信息语音特征,所述安静环境为低于12分贝情况下,具有时序信息语音特征包括93维的时序相关特征,分别为声音概率、谐噪比、基频、无声段的基频原始值、基频包络、连续周期之间的平均绝对差、连续周期之间的连续差的平均绝对差值、连续周期内插值峰值振幅的平均绝对差、谐波分量的均方根能量、噪声的均方根能量、响度、响度增量回归系数,能够准确的反应各用户的声音特征;
步骤(B),对各用户对应的具有时序信息语音特征,进行补零操作,建立各用户等长的语音特征样本,并存储到智能电视对应的语音学习数据库中,存在新的用户,返回步骤(A),更新语音学习数据库,对各用户对应的具有时序信息语音特征,不等长的进行前端补零操作,与最长的具有时序信息语音特征的长度相同;
步骤(C),建立遥控控制的关键词数据库,将关键词数据库存储到智能电视存储空间内,建立遥控控制的关键词数据库,包括电台关键词、声音关键词、操作关键词、常用词关键词,关键词数据库可更新,人工更新或者互相网搜索,进行更新;
步骤(D),进入智能电视中语音遥控器的智能控制模式,接收用户输出的音频数据信号;
步骤(E),从接收到的音频数据信号,统一归一化处理,归一化后整段语音的范围是[-1,1],归一化前后的整段语音在数值为零处所表达的物理意义不变,均是无声段;
步骤(F),对统一归一化处理的语音进行切分,并加窗分帧处理,提取各分帧数据单元的语音特征,包括以下步骤,
(F1),标记统一归一化处理的语音的出无声段,根据无声段的数量统一归一化处理的语音进行切分,形成各分帧数据单元;
(F2),增加的窗函数为hamming窗W(n,α),其的计算公式如下,
W(n,α)=(1-α)-αcos(2πn/(n-1)),0≤n≤N-1
其中,α取值0.6,N为n的取值范围,表示Hamming窗的长度;
(F3),通过增加的的窗函数,提取各分帧数据单元的语音特征,各分帧数据单元的语音特征,均包括93维的时序相关特征,分别为声音概率、谐噪比、基频、无声段的基频原始值、基频包络、连续周期之间的平均绝对差、连续周期之间的连续差的平均绝对差值、连续周期内插值峰值振幅的平均绝对差、谐波分量的均方根能量、噪声的均方根能量、响度、响度增量回归系数;
步骤(G),对各语音特征进行补零操作,得到当前语音特征采样;
步骤(H),根据当前语音特征采样,遍历语音学习数据库,进行特征值匹配,若匹配成功,执行步骤(I);若匹配不成功,则报警,提醒用户进入语音学习模式,根据当前语音特征采样,遍历语音学习数据库,进行特征值匹配,匹配过程,当93维的时序相关特征中存在相识度达到90%以上的时序相关特征的数量超过60%以上,则认定为特征值匹配,用户可根据需要进行调整;
步骤(J),从接收到的音频数据信号,提取关键词信息,并与关键词数据库相匹配,进行相关控制操作。
综上所述,本发明的用于智能电视语音遥控器的用户语音识别控制方法,具备语音学习模式、智能控制模式两组模式,在语音学习数据库内匹配合格的声音才能控制遥控器,并增加了学习能力,对接收到的音频数据信号,统一归一化处理,便于提高控制的精确度,防止无操作,取关键词信息,并与关键词数据库相匹配,进行相关控制操作,响应速度快,方法巧妙,容易实现,具有良好的应用前景。
以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (8)
1.一种用于智能电视语音遥控器的用户语音识别控制方法,其特征在于:包括以下步骤,
步骤(A),启动智能电视、语音遥控器,建立智能电视、语音遥控器的连接,进入智能电视中语音遥控器的语音学习模式,在安静环境下记录家庭内各用户的语音数据,提取各用户对应的具有时序信息语音特征;
步骤(B),对各用户对应的具有时序信息语音特征,进行补零操作,建立各用户等长的语音特征样本,并存储到智能电视对应的语音学习数据库中,存在新的用户,返回步骤(A),更新语音学习数据库;
步骤(C),建立遥控控制的关键词数据库,将关键词数据库存储到智能电视存储空间内;
步骤(D),进入智能电视中语音遥控器的智能控制模式,接收用户输出的音频数据信号;
步骤(E),从接收到的音频数据信号,统一归一化处理;
步骤(F),对统一归一化处理的语音进行切分,并加窗分帧处理,提取各分帧数据单元的语音特征;
步骤(G),对各语音特征进行补零操作,得到当前语音特征采样;
步骤(H),根据当前语音特征采样,遍历语音学习数据库,进行特征值匹配,若匹配成功,执行步骤(I);若匹配不成功,则报警,提醒用户进入语音学习模式;
步骤(J),从接收到的音频数据信号,提取关键词信息,并与关键词数据库相匹配,进行相关控制操作。
2.根据权利要求1所述的用于智能电视语音遥控器的用户语音识别控制方法,其特征在于:步骤(A),在安静环境下记录家庭内各用户的语音数据,所述安静环境为低于12分贝情况下。
3.根据权利要求1所述的用于智能电视语音遥控器的用户语音识别控制方法,其特征在于:步骤(B),对各用户对应的具有时序信息语音特征,不等长的进行前端补零操作,与最长的具有时序信息语音特征的长度相同。
4.根据权利要求1所述的用于智能电视语音遥控器的用户语音识别控制方法,其特征在于:步骤(C),建立遥控控制的关键词数据库,包括电台关键词、声音关键词、操作关键词、常用词关键词。
5.根据权利要求1所述的用于智能电视语音遥控器的用户语音识别控制方法,其特征在于:步骤(E),从接收到的音频数据信号,统一归一化处理,归一化后整段语音的范围是[-1,1],归一化前后的整段语音在数值为零处所表达的物理意义不变,均是无声段。
6.根据权利要求1所述的用于智能电视语音遥控器的用户语音识别控制方法,其特征在于:步骤(F),对统一归一化处理的语音进行切分,并加窗分帧处理,提取各分帧数据单元的语音特征,包括以下步骤,
(F1),标记统一归一化处理的语音的出无声段,根据无声段的数量统一归一化处理的语音进行切分,形成各分帧数据单元;
(F2),增加的窗函数为hamming窗W(n,α),其的计算公式如下,
W(n,α)=(1-α)-αcos(2πn/(n-1)),0≤n≤N-1
其中,α取值0.6,N为n的取值范围,表示Hamming窗的长度;
(F3),通过增加的的窗函数,提取各分帧数据单元的语音特征。
7.根据权利要求6所述的用于智能电视语音遥控器的用户语音识别控制方法,其特征在于:步骤(A),具有时序信息语音特征、各分帧数据单元的语音特征,均包括93维的时序相关特征,分别为声音概率、谐噪比、基频、无声段的基频原始值、基频包络、连续周期之间的平均绝对差、连续周期之间的连续差的平均绝对差值、连续周期内插值峰值振幅的平均绝对差、谐波分量的均方根能量、噪声的均方根能量、响度、响度增量回归系数、15个美尔倒谱系数MFCC,15个MFCC的增量回归系数、26个美尔谱,8个对数美尔频段,8个线性预测编码系数、8个线谱对频率、过零率。
8.根据权利要求7所述的用于智能电视语音遥控器的用户语音识别控制方法,其特征在于:步骤(H),根据当前语音特征采样,遍历语音学习数据库,进行特征值匹配,匹配过程,当93维的时序相关特征中存在相识度达到90%以上的时序相关特征的数量超过60%以上,则认定为特征值匹配。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811634398.9A CN109862408B (zh) | 2018-12-29 | 2018-12-29 | 一种用于智能电视语音遥控器的用户语音识别控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811634398.9A CN109862408B (zh) | 2018-12-29 | 2018-12-29 | 一种用于智能电视语音遥控器的用户语音识别控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109862408A true CN109862408A (zh) | 2019-06-07 |
CN109862408B CN109862408B (zh) | 2021-05-11 |
Family
ID=66893277
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811634398.9A Active CN109862408B (zh) | 2018-12-29 | 2018-12-29 | 一种用于智能电视语音遥控器的用户语音识别控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109862408B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114189725A (zh) * | 2021-12-10 | 2022-03-15 | 国微集团(深圳)有限公司 | 一种条件接收卡 |
CN114863915A (zh) * | 2022-07-05 | 2022-08-05 | 中科南京智能技术研究院 | 一种基于语义保留的语音唤醒方法及系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN2518278Y (zh) * | 2001-12-31 | 2002-10-23 | 海尔集团公司 | 声控电视遥控器 |
CN202472930U (zh) * | 2012-02-03 | 2012-10-03 | 上海交通大学 | 一种万能电视声控遥控器 |
CN202838947U (zh) * | 2012-08-20 | 2013-03-27 | 上海闻通信息科技有限公司 | 一种语音遥控器 |
CN202872948U (zh) * | 2012-09-26 | 2013-04-10 | 广东长虹电子有限公司 | 一种具有语音控制功能的电视 |
CN203015049U (zh) * | 2012-11-08 | 2013-06-19 | 上海理工大学 | 电视机无线语音遥控装置 |
CN103546790A (zh) * | 2013-09-18 | 2014-01-29 | 深圳市掌世界网络科技有限公司 | 基于移动终端与互动电视语言交互的方法及系统 |
CN103632669A (zh) * | 2012-08-20 | 2014-03-12 | 上海闻通信息科技有限公司 | 一种语音控制遥控器的方法以及一种语音遥控器 |
CN104575504A (zh) * | 2014-12-24 | 2015-04-29 | 上海师范大学 | 采用声纹和语音识别进行个性化电视语音唤醒的方法 |
CN105392035A (zh) * | 2014-09-03 | 2016-03-09 | 深圳市同方多媒体科技有限公司 | 一种智能电视机播放节目切换系统及方法 |
CN105894794A (zh) * | 2015-01-04 | 2016-08-24 | 宁波聚轩信息科技有限公司 | 一种家用声控遥控器及其控制方法 |
CN108520753A (zh) * | 2018-02-26 | 2018-09-11 | 南京工程学院 | 基于卷积双向长短时记忆网络的语音测谎方法 |
-
2018
- 2018-12-29 CN CN201811634398.9A patent/CN109862408B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN2518278Y (zh) * | 2001-12-31 | 2002-10-23 | 海尔集团公司 | 声控电视遥控器 |
CN202472930U (zh) * | 2012-02-03 | 2012-10-03 | 上海交通大学 | 一种万能电视声控遥控器 |
CN202838947U (zh) * | 2012-08-20 | 2013-03-27 | 上海闻通信息科技有限公司 | 一种语音遥控器 |
CN103632669A (zh) * | 2012-08-20 | 2014-03-12 | 上海闻通信息科技有限公司 | 一种语音控制遥控器的方法以及一种语音遥控器 |
CN202872948U (zh) * | 2012-09-26 | 2013-04-10 | 广东长虹电子有限公司 | 一种具有语音控制功能的电视 |
CN203015049U (zh) * | 2012-11-08 | 2013-06-19 | 上海理工大学 | 电视机无线语音遥控装置 |
CN103546790A (zh) * | 2013-09-18 | 2014-01-29 | 深圳市掌世界网络科技有限公司 | 基于移动终端与互动电视语言交互的方法及系统 |
CN105392035A (zh) * | 2014-09-03 | 2016-03-09 | 深圳市同方多媒体科技有限公司 | 一种智能电视机播放节目切换系统及方法 |
CN104575504A (zh) * | 2014-12-24 | 2015-04-29 | 上海师范大学 | 采用声纹和语音识别进行个性化电视语音唤醒的方法 |
CN105894794A (zh) * | 2015-01-04 | 2016-08-24 | 宁波聚轩信息科技有限公司 | 一种家用声控遥控器及其控制方法 |
CN108520753A (zh) * | 2018-02-26 | 2018-09-11 | 南京工程学院 | 基于卷积双向长短时记忆网络的语音测谎方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114189725A (zh) * | 2021-12-10 | 2022-03-15 | 国微集团(深圳)有限公司 | 一种条件接收卡 |
CN114863915A (zh) * | 2022-07-05 | 2022-08-05 | 中科南京智能技术研究院 | 一种基于语义保留的语音唤醒方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109862408B (zh) | 2021-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106980624A (zh) | 一种文本数据的处理方法和装置 | |
WO2018036555A1 (zh) | 会话处理方法及装置 | |
CN109101620A (zh) | 相似度计算方法、聚类方法、装置、存储介质及电子设备 | |
CN107613400A (zh) | 一种语音弹幕的实现方法和装置 | |
CN113139036B (zh) | 一种信息交互方法及设备 | |
CN101424924A (zh) | 声控智能家居控制系统 | |
CN110619050B (zh) | 意图识别方法及设备 | |
CN109145213A (zh) | 基于历史信息的查询推荐方法及装置 | |
WO2021051514A1 (zh) | 一种语音识别方法、装置、计算机设备及非易失性存储介质 | |
CN109862408A (zh) | 一种用于智能电视语音遥控器的用户语音识别控制方法 | |
CN201181413Y (zh) | 声控智能家居控制装置 | |
WO2023155678A1 (zh) | 用于确定信息的方法和装置 | |
CN111949806A (zh) | 一种基于Resnet-Bert网络模型的跨媒体检索方法 | |
CN113868427A (zh) | 一种数据处理方法、装置及电子设备 | |
CN113342948A (zh) | 一种智能问答方法及装置 | |
CN109325178A (zh) | 用于处理信息的方法和装置 | |
CN114187914A (zh) | 一种语音识别方法及系统 | |
CN101222703A (zh) | 一种基于语音辨识的移动终端的身份验证方法 | |
CN109241265B (zh) | 一种面向多轮查询的领域识别方法及系统 | |
CN102546034B (zh) | 一种语音信号处理方法及设备 | |
CN114756646A (zh) | 一种对话方法、对话装置及智能设备 | |
CN109461440A (zh) | 一种获取多轮语音通话最大可能意图的方法和智能设备 | |
Li et al. | Overview and Analysis of Speech Recognition | |
CN108073294A (zh) | 一种智能组词方法和装置、一种用于智能组词的装置 | |
CN111798853A (zh) | 语音识别的方法、装置、设备和计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |