CN109862408B

CN109862408B - 一种用于智能电视语音遥控器的用户语音识别控制方法

Info

Publication number: CN109862408B
Application number: CN201811634398.9A
Authority: CN
Inventors: 张金国
Original assignee: Jiangsu Astarte Electronics Co ltd
Current assignee: Jiangsu Astarte Electronics Co ltd
Priority date: 2018-12-29
Filing date: 2018-12-29
Publication date: 2021-05-11
Anticipated expiration: 2038-12-29
Also published as: CN109862408A

Abstract

本发明公开了一种用于智能电视语音遥控器的用户语音识别控制方法，包括以下步骤，启动智能电视、语音遥控器，建立智能电视、语音遥控器的连接，进入智能电视中语音遥控器的语音学习模式，在安静环境下记录家庭内各用户的语音数据，提取各用户对应的具有时序信息语音特征；进入智能电视中语音遥控器的智能控制模式，接收用户输出的音频数据信号；根据当前语音特征采样，遍历语音学习数据库，进行特征值匹配，若匹配成功，从接收到的音频数据信号，提取关键词信息，并与关键词数据库相匹配，进行相关控制操作。本发明响应速度快，方法巧妙，容易实现，具有良好的应用前景。

Description

一种用于智能电视语音遥控器的用户语音识别控制方法

技术领域

本发明涉及智能电视控制技术领域，具体涉及一种用于智能电视语音遥控器的用户语音识别控制方法。

背景技术

随着Android、苹果等操作系统的广泛应用，如今的智能电视与计算机之间的区别越来越小，它不再是只提供单一、单向的视频服务的设备，用户可以在电视平台上获得更多的应用体验，如网络浏览，电视购物，网络视频聊天等服务。

目前，用户与智能电视之间传统的互动方式是通过遥控器的物理按键输入来对网络信息进行浏览。传统的按键式遥控器，虽然使用简单方便，但受其自身固件大小的限制，只能制定一些基本命令，更在输入字符等信息内容时展现出极大的劣势，其只能靠上、下、左、右移动光标选择对应的字母完成字符的输入，操作速度极低。

随着智能电视的普及，传统的遥控器使得用户体验的效果变差，无法再满足人们对智能电视日益增长的高要求。因此，通过语音控制的智能遥控器，应运而生，语音控制方便快速，提高用户的体验效果。

但是，由于用户发出的语音各种各样，有时候还夹杂着环境噪声，很容易存在误操作，如何快速准确对用户发出的语音第一时间进行准确识别是当前需要解决的问题。

发明内容

本发明的目的是克服现有的语音控制的智能遥控器，识别不清楚，很容易存在误操作的问题。本发明的用于智能电视语音遥控器的用户语音识别控制方法，具备语音学习模式、智能控制模式两组模式，在语音学习数据库内匹配合格的声音才能控制遥控器，并增加了学习能力，对接收到的音频数据信号，统一归一化处理，便于提高控制的精确度，防止无操作，取关键词信息，并与关键词数据库相匹配，进行相关控制操作，响应速度快，方法巧妙，容易实现，具有良好的应用前景。

为了达到上述目的，本发明所采用的技术方案是：

一种用于智能电视语音遥控器的用户语音识别控制方法，包括以下步骤，

步骤(A)，启动智能电视、语音遥控器，建立智能电视、语音遥控器的连接，进入智能电视中语音遥控器的语音学习模式，在安静环境下记录家庭内各用户的语音数据，提取各用户对应的具有时序信息语音特征；

步骤(B)，对各用户对应的具有时序信息语音特征，进行补零操作，建立各用户等长的语音特征样本，并存储到智能电视对应的语音学习数据库中，存在新的用户，返回步骤(A)，更新语音学习数据库；

步骤(C)，建立遥控控制的关键词数据库，将关键词数据库存储到智能电视存储空间内；

步骤(D)，进入智能电视中语音遥控器的智能控制模式，接收用户输出的音频数据信号；

步骤(E)，从接收到的音频数据信号，统一归一化处理；

步骤(F)，对统一归一化处理的语音进行切分，并加窗分帧处理，提取各分帧数据单元的语音特征；

步骤(G)，对各语音特征进行补零操作，得到当前语音特征采样；

步骤(H)，根据当前语音特征采样，遍历语音学习数据库，进行特征值匹配，若匹配成功，执行步骤(I)；若匹配不成功，则报警，提醒用户进入语音学习模式；

步骤(J)，从接收到的音频数据信号，提取关键词信息，并与关键词数据库相匹配，进行相关控制操作。

前述的用于智能电视语音遥控器的用户语音识别控制方法，步骤(A)，在安静环境下记录家庭内各用户的语音数据，所述安静环境为低于12分贝情况下。

前述的用于智能电视语音遥控器的用户语音识别控制方法，步骤(B)，对各用户对应的具有时序信息语音特征，不等长的进行前端补零操作，与最长的具有时序信息语音特征的长度相同。

前述的用于智能电视语音遥控器的用户语音识别控制方法，步骤(C)，建立遥控控制的关键词数据库，包括电台关键词、声音关键词、操作关键词、常用词关键词。

前述的用于智能电视语音遥控器的用户语音识别控制方法，步骤(E)，从接收到的音频数据信号，统一归一化处理，归一化后整段语音的范围是[-1，1]，归一化前后的整段语音在数值为零处所表达的物理意义不变，均是无声段。

前述的用于智能电视语音遥控器的用户语音识别控制方法，步骤(F)，对统一归一化处理的语音进行切分，并加窗分帧处理，提取各分帧数据单元的语音特征，包括以下步骤，

(F1)，标记统一归一化处理的语音的出无声段，根据无声段的数量统一归一化处理的语音进行切分，形成各分帧数据单元；

(F2)，增加的窗函数为hamming窗W(n,α)，其的计算公式如下，

W(n,α)＝(1-α)-αcos(2πn/(n-1)),0≤n≤N-1

其中，α取值0.6，N为n的取值范围，表示Hamming窗的长度；

(F3)，通过增加的的窗函数，提取各分帧数据单元的语音特征。

前述的用于智能电视语音遥控器的用户语音识别控制方法，步骤(A)，具有时序信息语音特征、各分帧数据单元的语音特征，均包括93维的时序相关特征，分别为声音概率、谐噪比、基频、无声段的基频原始值、基频包络、连续周期之间的平均绝对差、连续周期之间的连续差的平均绝对差值、连续周期内插值峰值振幅的平均绝对差、谐波分量的均方根能量、噪声的均方根能量、响度、响度增量回归系数。

前述的用于智能电视语音遥控器的用户语音识别控制方法，步骤(H)，根据当前语音特征采样，遍历语音学习数据库，进行特征值匹配，匹配过程，当93维的时序相关特征中存在相识度达到90％以上的时序相关特征的数量超过60％以上，则认定为特征值匹配。

本发明的有益效果是：本发明的用于智能电视语音遥控器的用户语音识别控制方法，具备语音学习模式、智能控制模式两组模式，在语音学习数据库内匹配合格的声音才能控制遥控器，并增加了学习能力，对接收到的音频数据信号，统一归一化处理，便于提高控制的精确度，防止无操作，取关键词信息，并与关键词数据库相匹配，进行相关控制操作，响应速度快，方法巧妙，容易实现，具有良好的应用前景。

附图说明

图1是本发明的用于智能电视语音遥控器的用户语音识别控制方法的流程图。

具体实施方式

下面将结合说明书附图，对本发明作进一步的说明。

如图1所示，本发明的用于智能电视语音遥控器的用户语音识别控制方法，包括以下步骤，

步骤(A)，启动智能电视、语音遥控器，建立智能电视、语音遥控器的连接，进入智能电视中语音遥控器的语音学习模式，在安静环境下记录家庭内各用户的语音数据，提取各用户对应的具有时序信息语音特征，所述安静环境为低于12分贝情况下，具有时序信息语音特征包括93维的时序相关特征，分别为声音概率、谐噪比、基频、无声段的基频原始值、基频包络、连续周期之间的平均绝对差、连续周期之间的连续差的平均绝对差值、连续周期内插值峰值振幅的平均绝对差、谐波分量的均方根能量、噪声的均方根能量、响度、响度增量回归系数，能够准确的反应各用户的声音特征；

步骤(B)，对各用户对应的具有时序信息语音特征，进行补零操作，建立各用户等长的语音特征样本，并存储到智能电视对应的语音学习数据库中，存在新的用户，返回步骤(A)，更新语音学习数据库，对各用户对应的具有时序信息语音特征，不等长的进行前端补零操作，与最长的具有时序信息语音特征的长度相同；

步骤(C)，建立遥控控制的关键词数据库，将关键词数据库存储到智能电视存储空间内，建立遥控控制的关键词数据库，包括电台关键词、声音关键词、操作关键词、常用词关键词，关键词数据库可更新，人工更新或者互相网搜索，进行更新；

步骤(E)，从接收到的音频数据信号，统一归一化处理，归一化后整段语音的范围是[-1，1]，归一化前后的整段语音在数值为零处所表达的物理意义不变，均是无声段；

步骤(F)，对统一归一化处理的语音进行切分，并加窗分帧处理，提取各分帧数据单元的语音特征，包括以下步骤，

(F2)，增加的窗函数为hamming窗W(n,α)，其的计算公式如下，

W(n,α)＝(1-α)-αcos(2πn/(n-1)),0≤n≤N-1

其中，α取值0.6，N为n的取值范围，表示Hamming窗的长度；

(F3)，通过增加的的窗函数，提取各分帧数据单元的语音特征，各分帧数据单元的语音特征，均包括93维的时序相关特征，分别为声音概率、谐噪比、基频、无声段的基频原始值、基频包络、连续周期之间的平均绝对差、连续周期之间的连续差的平均绝对差值、连续周期内插值峰值振幅的平均绝对差、谐波分量的均方根能量、噪声的均方根能量、响度、响度增量回归系数；

步骤(H)，根据当前语音特征采样，遍历语音学习数据库，进行特征值匹配，若匹配成功，执行步骤(I)；若匹配不成功，则报警，提醒用户进入语音学习模式，根据当前语音特征采样，遍历语音学习数据库，进行特征值匹配，匹配过程，当93维的时序相关特征中存在相识度达到90％以上的时序相关特征的数量超过60％以上，则认定为特征值匹配，用户可根据需要进行调整；

综上所述，本发明的用于智能电视语音遥控器的用户语音识别控制方法，具备语音学习模式、智能控制模式两组模式，在语音学习数据库内匹配合格的声音才能控制遥控器，并增加了学习能力，对接收到的音频数据信号，统一归一化处理，便于提高控制的精确度，防止无操作，取关键词信息，并与关键词数据库相匹配，进行相关控制操作，响应速度快，方法巧妙，容易实现，具有良好的应用前景。

以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.一种用于智能电视语音遥控器的用户语音识别控制方法，其特征在于：包括以下步骤，

步骤(E)，从接收到的音频数据信号，统一归一化处理；

步骤(H)，根据当前语音特征采样，遍历语音学习数据库，进行特征值匹配，若匹配成功，执行步骤(J)；若匹配不成功，则报警，提醒用户进入语音学习模式；

步骤(J)，从接收到的音频数据信号，提取关键词信息，并与关键词数据库相匹配，进行相关控制操作，

其中，步骤(E)，从接收到的音频数据信号，统一归一化处理，归一化后整段语音的范围是[-1，1]，归一化前后的整段语音在数值为零处所表达的物理意义不变，均是无声段，步骤(F)，对统一归一化处理的语音进行切分，并加窗分帧处理，提取各分帧数据单元的语音特征，包括以下步骤，

(F1)，标记统一归一化处理的语音的无声段，根据无声段的数量统一归一化处理的语音进行切分，形成各分帧数据单元；

(F2)，增加的窗函数为hamming窗W(n,α)，其的计算公式如下，

W(n,α)＝(1-α)-αcos(2πn/(n-1)),0≤n≤N-1

其中，α取值0.6，N为n的取值范围，表示Hamming窗的长度；

(F3)，通过增加的窗函数，提取各分帧数据单元的语音特征，其中，步骤(A)，具有时序信息语音特征的语音特征，包括93维的时序相关特征，分别为声音概率、谐噪比、基频、无声段的基频原始值、基频包络、连续周期之间的平均绝对差、连续周期之间的连续差的平均绝对差值、连续周期内插值峰值振幅的平均绝对差、谐波分量的均方根能量、噪声的均方根能量、响度、响度增量回归系数、15个美尔倒谱系数MFCC，15个MFCC的增量回归系数、26个美尔谱，8个对数美尔频段，8个线性预测编码系数、8个线谱对频率、过零率。

2.根据权利要求1所述的用于智能电视语音遥控器的用户语音识别控制方法，其特征在于：步骤(A)，在安静环境下记录家庭内各用户的语音数据，所述安静环境为低于12分贝情况下。

3.根据权利要求1所述的用于智能电视语音遥控器的用户语音识别控制方法，其特征在于：步骤(B)，对各用户对应的具有时序信息语音特征，进行不等长的进行前端补零操作，使其与最长的具有时序信息语音特征的长度相同。

4.根据权利要求1所述的用于智能电视语音遥控器的用户语音识别控制方法，其特征在于：步骤(C)，建立遥控控制的关键词数据库，包括电台关键词、声音关键词、操作关键词、常用词关键词。

5.根据权利要求1所述的用于智能电视语音遥控器的用户语音识别控制方法，其特征在于：步骤(H)，根据当前语音特征采样，遍历语音学习数据库，进行特征值匹配，匹配过程，当93维的时序相关特征中存在相似度达到90％以上的时序相关特征的数量超过60％以上，则认定为特征值匹配。