CN109862408B - 一种用于智能电视语音遥控器的用户语音识别控制方法 - Google Patents

一种用于智能电视语音遥控器的用户语音识别控制方法 Download PDF

Info

Publication number
CN109862408B
CN109862408B CN201811634398.9A CN201811634398A CN109862408B CN 109862408 B CN109862408 B CN 109862408B CN 201811634398 A CN201811634398 A CN 201811634398A CN 109862408 B CN109862408 B CN 109862408B
Authority
CN
China
Prior art keywords
voice
remote controller
user
intelligent television
time sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811634398.9A
Other languages
English (en)
Other versions
CN109862408A (zh
Inventor
张金国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Astarte Electronics Co ltd
Original Assignee
Jiangsu Astarte Electronics Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Astarte Electronics Co ltd filed Critical Jiangsu Astarte Electronics Co ltd
Priority to CN201811634398.9A priority Critical patent/CN109862408B/zh
Publication of CN109862408A publication Critical patent/CN109862408A/zh
Application granted granted Critical
Publication of CN109862408B publication Critical patent/CN109862408B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种用于智能电视语音遥控器的用户语音识别控制方法,包括以下步骤,启动智能电视、语音遥控器,建立智能电视、语音遥控器的连接,进入智能电视中语音遥控器的语音学习模式,在安静环境下记录家庭内各用户的语音数据,提取各用户对应的具有时序信息语音特征;进入智能电视中语音遥控器的智能控制模式,接收用户输出的音频数据信号;根据当前语音特征采样,遍历语音学习数据库,进行特征值匹配,若匹配成功,从接收到的音频数据信号,提取关键词信息,并与关键词数据库相匹配,进行相关控制操作。本发明响应速度快,方法巧妙,容易实现,具有良好的应用前景。

Description

一种用于智能电视语音遥控器的用户语音识别控制方法
技术领域
本发明涉及智能电视控制技术领域,具体涉及一种用于智能电视语音遥控器的用户语音识别控制方法。
背景技术
随着Android、苹果等操作系统的广泛应用,如今的智能电视与计算机之间的区别越来越小,它不再是只提供单一、单向的视频服务的设备,用户可以在电视平台上获得更多的应用体验,如网络浏览,电视购物,网络视频聊天等服务。
目前,用户与智能电视之间传统的互动方式是通过遥控器的物理按键输入来对网络信息进行浏览。传统的按键式遥控器,虽然使用简单方便,但受其自身固件大小的限制,只能制定一些基本命令,更在输入字符等信息内容时展现出极大的劣势,其只能靠上、下、左、右移动光标选择对应的字母完成字符的输入,操作速度极低。
随着智能电视的普及,传统的遥控器使得用户体验的效果变差,无法再满足人们对智能电视日益增长的高要求。因此,通过语音控制的智能遥控器,应运而生,语音控制方便快速,提高用户的体验效果。
但是,由于用户发出的语音各种各样,有时候还夹杂着环境噪声,很容易存在误操作,如何快速准确对用户发出的语音第一时间进行准确识别是当前需要解决的问题。
发明内容
本发明的目的是克服现有的语音控制的智能遥控器,识别不清楚,很容易存在误操作的问题。本发明的用于智能电视语音遥控器的用户语音识别控制方法,具备语音学习模式、智能控制模式两组模式,在语音学习数据库内匹配合格的声音才能控制遥控器,并增加了学习能力,对接收到的音频数据信号,统一归一化处理,便于提高控制的精确度,防止无操作,取关键词信息,并与关键词数据库相匹配,进行相关控制操作,响应速度快,方法巧妙,容易实现,具有良好的应用前景。
为了达到上述目的,本发明所采用的技术方案是:
一种用于智能电视语音遥控器的用户语音识别控制方法,包括以下步骤,
步骤(A),启动智能电视、语音遥控器,建立智能电视、语音遥控器的连接,进入智能电视中语音遥控器的语音学习模式,在安静环境下记录家庭内各用户的语音数据,提取各用户对应的具有时序信息语音特征;
步骤(B),对各用户对应的具有时序信息语音特征,进行补零操作,建立各用户等长的语音特征样本,并存储到智能电视对应的语音学习数据库中,存在新的用户,返回步骤(A),更新语音学习数据库;
步骤(C),建立遥控控制的关键词数据库,将关键词数据库存储到智能电视存储空间内;
步骤(D),进入智能电视中语音遥控器的智能控制模式,接收用户输出的音频数据信号;
步骤(E),从接收到的音频数据信号,统一归一化处理;
步骤(F),对统一归一化处理的语音进行切分,并加窗分帧处理,提取各分帧数据单元的语音特征;
步骤(G),对各语音特征进行补零操作,得到当前语音特征采样;
步骤(H),根据当前语音特征采样,遍历语音学习数据库,进行特征值匹配,若匹配成功,执行步骤(I);若匹配不成功,则报警,提醒用户进入语音学习模式;
步骤(J),从接收到的音频数据信号,提取关键词信息,并与关键词数据库相匹配,进行相关控制操作。
前述的用于智能电视语音遥控器的用户语音识别控制方法,步骤(A),在安静环境下记录家庭内各用户的语音数据,所述安静环境为低于12分贝情况下。
前述的用于智能电视语音遥控器的用户语音识别控制方法,步骤(B),对各用户对应的具有时序信息语音特征,不等长的进行前端补零操作,与最长的具有时序信息语音特征的长度相同。
前述的用于智能电视语音遥控器的用户语音识别控制方法,步骤(C),建立遥控控制的关键词数据库,包括电台关键词、声音关键词、操作关键词、常用词关键词。
前述的用于智能电视语音遥控器的用户语音识别控制方法,步骤(E),从接收到的音频数据信号,统一归一化处理,归一化后整段语音的范围是[-1,1],归一化前后的整段语音在数值为零处所表达的物理意义不变,均是无声段。
前述的用于智能电视语音遥控器的用户语音识别控制方法,步骤(F),对统一归一化处理的语音进行切分,并加窗分帧处理,提取各分帧数据单元的语音特征,包括以下步骤,
(F1),标记统一归一化处理的语音的出无声段,根据无声段的数量统一归一化处理的语音进行切分,形成各分帧数据单元;
(F2),增加的窗函数为hamming窗W(n,α),其的计算公式如下,
W(n,α)=(1-α)-αcos(2πn/(n-1)),0≤n≤N-1
其中,α取值0.6,N为n的取值范围,表示Hamming窗的长度;
(F3),通过增加的的窗函数,提取各分帧数据单元的语音特征。
前述的用于智能电视语音遥控器的用户语音识别控制方法,步骤(A),具有时序信息语音特征、各分帧数据单元的语音特征,均包括93维的时序相关特征,分别为声音概率、谐噪比、基频、无声段的基频原始值、基频包络、连续周期之间的平均绝对差、连续周期之间的连续差的平均绝对差值、连续周期内插值峰值振幅的平均绝对差、谐波分量的均方根能量、噪声的均方根能量、响度、响度增量回归系数。
前述的用于智能电视语音遥控器的用户语音识别控制方法,步骤(H),根据当前语音特征采样,遍历语音学习数据库,进行特征值匹配,匹配过程,当93维的时序相关特征中存在相识度达到90%以上的时序相关特征的数量超过60%以上,则认定为特征值匹配。
本发明的有益效果是:本发明的用于智能电视语音遥控器的用户语音识别控制方法,具备语音学习模式、智能控制模式两组模式,在语音学习数据库内匹配合格的声音才能控制遥控器,并增加了学习能力,对接收到的音频数据信号,统一归一化处理,便于提高控制的精确度,防止无操作,取关键词信息,并与关键词数据库相匹配,进行相关控制操作,响应速度快,方法巧妙,容易实现,具有良好的应用前景。
附图说明
图1是本发明的用于智能电视语音遥控器的用户语音识别控制方法的流程图。
具体实施方式
下面将结合说明书附图,对本发明作进一步的说明。
如图1所示,本发明的用于智能电视语音遥控器的用户语音识别控制方法,包括以下步骤,
步骤(A),启动智能电视、语音遥控器,建立智能电视、语音遥控器的连接,进入智能电视中语音遥控器的语音学习模式,在安静环境下记录家庭内各用户的语音数据,提取各用户对应的具有时序信息语音特征,所述安静环境为低于12分贝情况下,具有时序信息语音特征包括93维的时序相关特征,分别为声音概率、谐噪比、基频、无声段的基频原始值、基频包络、连续周期之间的平均绝对差、连续周期之间的连续差的平均绝对差值、连续周期内插值峰值振幅的平均绝对差、谐波分量的均方根能量、噪声的均方根能量、响度、响度增量回归系数,能够准确的反应各用户的声音特征;
步骤(B),对各用户对应的具有时序信息语音特征,进行补零操作,建立各用户等长的语音特征样本,并存储到智能电视对应的语音学习数据库中,存在新的用户,返回步骤(A),更新语音学习数据库,对各用户对应的具有时序信息语音特征,不等长的进行前端补零操作,与最长的具有时序信息语音特征的长度相同;
步骤(C),建立遥控控制的关键词数据库,将关键词数据库存储到智能电视存储空间内,建立遥控控制的关键词数据库,包括电台关键词、声音关键词、操作关键词、常用词关键词,关键词数据库可更新,人工更新或者互相网搜索,进行更新;
步骤(D),进入智能电视中语音遥控器的智能控制模式,接收用户输出的音频数据信号;
步骤(E),从接收到的音频数据信号,统一归一化处理,归一化后整段语音的范围是[-1,1],归一化前后的整段语音在数值为零处所表达的物理意义不变,均是无声段;
步骤(F),对统一归一化处理的语音进行切分,并加窗分帧处理,提取各分帧数据单元的语音特征,包括以下步骤,
(F1),标记统一归一化处理的语音的出无声段,根据无声段的数量统一归一化处理的语音进行切分,形成各分帧数据单元;
(F2),增加的窗函数为hamming窗W(n,α),其的计算公式如下,
W(n,α)=(1-α)-αcos(2πn/(n-1)),0≤n≤N-1
其中,α取值0.6,N为n的取值范围,表示Hamming窗的长度;
(F3),通过增加的的窗函数,提取各分帧数据单元的语音特征,各分帧数据单元的语音特征,均包括93维的时序相关特征,分别为声音概率、谐噪比、基频、无声段的基频原始值、基频包络、连续周期之间的平均绝对差、连续周期之间的连续差的平均绝对差值、连续周期内插值峰值振幅的平均绝对差、谐波分量的均方根能量、噪声的均方根能量、响度、响度增量回归系数;
步骤(G),对各语音特征进行补零操作,得到当前语音特征采样;
步骤(H),根据当前语音特征采样,遍历语音学习数据库,进行特征值匹配,若匹配成功,执行步骤(I);若匹配不成功,则报警,提醒用户进入语音学习模式,根据当前语音特征采样,遍历语音学习数据库,进行特征值匹配,匹配过程,当93维的时序相关特征中存在相识度达到90%以上的时序相关特征的数量超过60%以上,则认定为特征值匹配,用户可根据需要进行调整;
步骤(J),从接收到的音频数据信号,提取关键词信息,并与关键词数据库相匹配,进行相关控制操作。
综上所述,本发明的用于智能电视语音遥控器的用户语音识别控制方法,具备语音学习模式、智能控制模式两组模式,在语音学习数据库内匹配合格的声音才能控制遥控器,并增加了学习能力,对接收到的音频数据信号,统一归一化处理,便于提高控制的精确度,防止无操作,取关键词信息,并与关键词数据库相匹配,进行相关控制操作,响应速度快,方法巧妙,容易实现,具有良好的应用前景。
以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (5)

1.一种用于智能电视语音遥控器的用户语音识别控制方法,其特征在于:包括以下步骤,
步骤(A),启动智能电视、语音遥控器,建立智能电视、语音遥控器的连接,进入智能电视中语音遥控器的语音学习模式,在安静环境下记录家庭内各用户的语音数据,提取各用户对应的具有时序信息语音特征;
步骤(B),对各用户对应的具有时序信息语音特征,进行补零操作,建立各用户等长的语音特征样本,并存储到智能电视对应的语音学习数据库中,存在新的用户,返回步骤(A),更新语音学习数据库;
步骤(C),建立遥控控制的关键词数据库,将关键词数据库存储到智能电视存储空间内;
步骤(D),进入智能电视中语音遥控器的智能控制模式,接收用户输出的音频数据信号;
步骤(E),从接收到的音频数据信号,统一归一化处理;
步骤(F),对统一归一化处理的语音进行切分,并加窗分帧处理,提取各分帧数据单元的语音特征;
步骤(G),对各语音特征进行补零操作,得到当前语音特征采样;
步骤(H),根据当前语音特征采样,遍历语音学习数据库,进行特征值匹配,若匹配成功,执行步骤(J);若匹配不成功,则报警,提醒用户进入语音学习模式;
步骤(J),从接收到的音频数据信号,提取关键词信息,并与关键词数据库相匹配,进行相关控制操作,
其中,步骤(E),从接收到的音频数据信号,统一归一化处理,归一化后整段语音的范围是[-1,1],归一化前后的整段语音在数值为零处所表达的物理意义不变,均是无声段,步骤(F),对统一归一化处理的语音进行切分,并加窗分帧处理,提取各分帧数据单元的语音特征,包括以下步骤,
(F1),标记统一归一化处理的语音的无声段,根据无声段的数量统一归一化处理的语音进行切分,形成各分帧数据单元;
(F2),增加的窗函数为hamming窗W(n,α),其的计算公式如下,
W(n,α)=(1-α)-αcos(2πn/(n-1)),0≤n≤N-1
其中,α取值0.6,N为n的取值范围,表示Hamming窗的长度;
(F3),通过增加的窗函数,提取各分帧数据单元的语音特征,其中,步骤(A),具有时序信息语音特征的语音特征,包括93维的时序相关特征,分别为声音概率、谐噪比、基频、无声段的基频原始值、基频包络、连续周期之间的平均绝对差、连续周期之间的连续差的平均绝对差值、连续周期内插值峰值振幅的平均绝对差、谐波分量的均方根能量、噪声的均方根能量、响度、响度增量回归系数、15个美尔倒谱系数MFCC,15个MFCC的增量回归系数、26个美尔谱,8个对数美尔频段,8个线性预测编码系数、8个线谱对频率、过零率。
2.根据权利要求1所述的用于智能电视语音遥控器的用户语音识别控制方法,其特征在于:步骤(A),在安静环境下记录家庭内各用户的语音数据,所述安静环境为低于12分贝情况下。
3.根据权利要求1所述的用于智能电视语音遥控器的用户语音识别控制方法,其特征在于:步骤(B),对各用户对应的具有时序信息语音特征,进行不等长的进行前端补零操作,使其与最长的具有时序信息语音特征的长度相同。
4.根据权利要求1所述的用于智能电视语音遥控器的用户语音识别控制方法,其特征在于:步骤(C),建立遥控控制的关键词数据库,包括电台关键词、声音关键词、操作关键词、常用词关键词。
5.根据权利要求1所述的用于智能电视语音遥控器的用户语音识别控制方法,其特征在于:步骤(H),根据当前语音特征采样,遍历语音学习数据库,进行特征值匹配,匹配过程,当93维的时序相关特征中存在相似度达到90%以上的时序相关特征的数量超过60%以上,则认定为特征值匹配。
CN201811634398.9A 2018-12-29 2018-12-29 一种用于智能电视语音遥控器的用户语音识别控制方法 Active CN109862408B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811634398.9A CN109862408B (zh) 2018-12-29 2018-12-29 一种用于智能电视语音遥控器的用户语音识别控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811634398.9A CN109862408B (zh) 2018-12-29 2018-12-29 一种用于智能电视语音遥控器的用户语音识别控制方法

Publications (2)

Publication Number Publication Date
CN109862408A CN109862408A (zh) 2019-06-07
CN109862408B true CN109862408B (zh) 2021-05-11

Family

ID=66893277

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811634398.9A Active CN109862408B (zh) 2018-12-29 2018-12-29 一种用于智能电视语音遥控器的用户语音识别控制方法

Country Status (1)

Country Link
CN (1) CN109862408B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114189725A (zh) * 2021-12-10 2022-03-15 国微集团(深圳)有限公司 一种条件接收卡
CN114863915A (zh) * 2022-07-05 2022-08-05 中科南京智能技术研究院 一种基于语义保留的语音唤醒方法及系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2518278Y (zh) * 2001-12-31 2002-10-23 海尔集团公司 声控电视遥控器
CN202472930U (zh) * 2012-02-03 2012-10-03 上海交通大学 一种万能电视声控遥控器
CN202838947U (zh) * 2012-08-20 2013-03-27 上海闻通信息科技有限公司 一种语音遥控器
CN202872948U (zh) * 2012-09-26 2013-04-10 广东长虹电子有限公司 一种具有语音控制功能的电视
CN203015049U (zh) * 2012-11-08 2013-06-19 上海理工大学 电视机无线语音遥控装置
CN103546790A (zh) * 2013-09-18 2014-01-29 深圳市掌世界网络科技有限公司 基于移动终端与互动电视语言交互的方法及系统
CN103632669A (zh) * 2012-08-20 2014-03-12 上海闻通信息科技有限公司 一种语音控制遥控器的方法以及一种语音遥控器
CN104575504A (zh) * 2014-12-24 2015-04-29 上海师范大学 采用声纹和语音识别进行个性化电视语音唤醒的方法
CN105392035A (zh) * 2014-09-03 2016-03-09 深圳市同方多媒体科技有限公司 一种智能电视机播放节目切换系统及方法
CN105894794A (zh) * 2015-01-04 2016-08-24 宁波聚轩信息科技有限公司 一种家用声控遥控器及其控制方法
CN108520753A (zh) * 2018-02-26 2018-09-11 南京工程学院 基于卷积双向长短时记忆网络的语音测谎方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2518278Y (zh) * 2001-12-31 2002-10-23 海尔集团公司 声控电视遥控器
CN202472930U (zh) * 2012-02-03 2012-10-03 上海交通大学 一种万能电视声控遥控器
CN202838947U (zh) * 2012-08-20 2013-03-27 上海闻通信息科技有限公司 一种语音遥控器
CN103632669A (zh) * 2012-08-20 2014-03-12 上海闻通信息科技有限公司 一种语音控制遥控器的方法以及一种语音遥控器
CN202872948U (zh) * 2012-09-26 2013-04-10 广东长虹电子有限公司 一种具有语音控制功能的电视
CN203015049U (zh) * 2012-11-08 2013-06-19 上海理工大学 电视机无线语音遥控装置
CN103546790A (zh) * 2013-09-18 2014-01-29 深圳市掌世界网络科技有限公司 基于移动终端与互动电视语言交互的方法及系统
CN105392035A (zh) * 2014-09-03 2016-03-09 深圳市同方多媒体科技有限公司 一种智能电视机播放节目切换系统及方法
CN104575504A (zh) * 2014-12-24 2015-04-29 上海师范大学 采用声纹和语音识别进行个性化电视语音唤醒的方法
CN105894794A (zh) * 2015-01-04 2016-08-24 宁波聚轩信息科技有限公司 一种家用声控遥控器及其控制方法
CN108520753A (zh) * 2018-02-26 2018-09-11 南京工程学院 基于卷积双向长短时记忆网络的语音测谎方法

Also Published As

Publication number Publication date
CN109862408A (zh) 2019-06-07

Similar Documents

Publication Publication Date Title
US20200402500A1 (en) Method and device for generating speech recognition model and storage medium
CN110349564B (zh) 一种跨语言语音识别方法和装置
US11514891B2 (en) Named entity recognition method, named entity recognition equipment and medium
CN110097870B (zh) 语音处理方法、装置、设备和存储介质
WO2021051514A1 (zh) 一种语音识别方法、装置、计算机设备及非易失性存储介质
CN113327609A (zh) 用于语音识别的方法和装置
US10229701B2 (en) Server-side ASR adaptation to speaker, device and noise condition via non-ASR audio transmission
US11100932B2 (en) Robust start-end point detection algorithm using neural network
US20160012819A1 (en) Server-Side ASR Adaptation to Speaker, Device and Noise Condition via Non-ASR Audio Transmission
CN109862408B (zh) 一种用于智能电视语音遥控器的用户语音识别控制方法
CN111292745B (zh) 一种语音识别结果的处理方法、装置及电子设备
WO2023193394A1 (zh) 语音唤醒模型的训练、唤醒方法、装置、设备及存储介质
CN108877779B (zh) 用于检测语音尾点的方法和装置
CN112217947A (zh) 客服电话语音转录文本方法、系统、设备及存储介质
CN106550268B (zh) 视频处理方法和视频处理装置
CN111798846A (zh) 语音命令词识别方法、装置、会议终端及会议终端系统
JPS62232000A (ja) 音声認識装置
CN114187914A (zh) 一种语音识别方法及系统
CN114267342A (zh) 识别模型的训练方法、识别方法、电子设备及存储介质
US20230395094A1 (en) Speech processing method, computer storage medium, and electronic device
CN115206321A (zh) 语音关键词的识别方法、装置和电子设备
CN113782005B (zh) 语音识别方法及装置、存储介质及电子设备
CN114399992A (zh) 语音指令响应方法、装置及存储介质
CN113470652A (zh) 一种基于工业互联网的语音识别及处理方法
CN113838467B (zh) 语音处理方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant