CN106875950A

CN106875950A - 语音指令管理的方法及其系统

Info

Publication number: CN106875950A
Application number: CN201611267507.9A
Authority: CN
Inventors: 徐伟智
Original assignee: Shenzhen Tinno Wireless Technology Co Ltd
Current assignee: Shenzhen Tinno Wireless Technology Co Ltd
Priority date: 2016-12-31
Filing date: 2016-12-31
Publication date: 2017-06-20

Abstract

本发明是一种语音指令管理的方法及其系统，其特征在于，包括如下步骤：通过一语音接收模块接收一语音指令，通过一语音特征相似度判断模块，比对所述语音指令与一预输入语音样本的一特征参数是否相符；若相符，则通过一语音辨识模块，比对所述语音指令与一预输入指令样本，判断出对应所述语音指令的一目标指令；以及通过一指令执行模块执行对应所述语音指令的所述目标指令。

Description

语音指令管理的方法及其系统

技术领域

本发明是有关于一种语音控制的电子装置，更具体地描述是一种用以协助一用户透过自身穿戴的一语音接收模块，或是利用内建于所述电子装置上的所述语音接收模块，利用一语音频号指令的方式触发所述电子装置的功能。使所述用户运用所述电子装置进行操作时，能以所述语音频号指令的方式进行控制，不须再经由点击功能键，又或是以其它电子控制开关装置的方式。

背景技术

就现有技术而言，用户操作电子装置时往往是利用点击触控屏幕操作，上述操作情境用户皆须用手进行操作，然而在特定的应用状况下用户不方便用手来进行操控，强迫用户用手操控的状况下，用户体验不佳，，如此一来既不实用又降低用户体验，使得产品的实用性不高，进而降低产品竞争力。目前的解决方案，语音指令的输入是最方便的。若能以语音指令的输入取代繁琐的触控点选屏幕，并配合语音问答导引的操作方式，相信对不习惯使用手机输入界面的人会是一大福音。

目前语音识别技术已经非常成熟，商品化产品已陆续出现，可以应用在读写机、语音查询、声控家电...等等。也有应用在人与机器沟通的界面上。手机上也有类似的语音人机界面应用程序，但实际启动语音指令功能时，因其设定的辨识条件是声音的强度与持续长度到达一个门坎就启动辨识功能。如此一来，往往会因背景的语音杂音(如电视、收音机或旁人说话声...等)而产生误动作，从而令使用者感到困扰，因而放弃使用。

发明内容

针对现有技术中存在的上述弊端，本发明即是为解决此一问题，本发明于系统在接收到语音讯号时，先启动声纹辨识程序，声纹符合用户所预存的才启动语音指令辨识。这样可以达到减少误动作的机会。

本发明的目的及解决其技术问题是采用以下技术方案来实现的。

依据本发明提出的语音指令管理的方法，其特征在于，包括如下步骤：通过一语音接收模块接收一语音指令，通过一语音特征相似度判断模块，比对所述语音指令与一预输入语音样本的一特征参数是否相符；当判定所述语音指令与所述预输入语音样本的一特征参数相符时，则通过一语音辨识模块，比对所述语音指令与一预输入指令样本，判断出对应所述语音指令的一目标指令；以及通过一指令执行模块执行对应所述语音指令的所述目标指令。

在本发明的一实施例中，所述语音指令管理的方法，其特征在于，更包括:通过所述语音特征相似度判断模块，比对所述音指令与所述预输入语音样本的所述特征参数，发现结果为不相符；以及通过一提示模块，提示所述语音指令与所述预输入语音样本的所述特征参数不相符。

在本发明的一实施例中，所述语音指令管理的方法，其特征在于，更包括：通过所述语音辨识模块，比对所述语音指令与所述预输入指令样本，无法判断出对应所述语音指令的所述指令时；以及通过一语音助理模块，进行问答引导。

在本发明的一实施例中，所述语音指令管理的方法，其特征在于，更包括:通过无线传输的方式连接所述语音接收模块与所述语音特征相似度判断模块。

在本发明的一实施例中，所述语音指令管理的方法，其特征在于，更包括:利用一蓝牙耳麦、一智能型手表、一智能眼镜或一具有语音接收功能的穿戴型装置作为所述语音接收模块。

本发明的目的及解决其技术问题还可采用以下技术措施进一步实现。

依据本发明提出的语音指令管理的系统，其特征在于，一语音接收模块，用以接收一语音指令，一语音特征相似度判断模块，比对所述语音指令与一预输入语音样本的一特征参数是否相符，一语音辨识模块，比对所述语音指令与一预输入指令样本，判断出对应所述语音指令的一目标指令；以及一指令执行模块，执行对应所述语音指令的所述目标指令。

在本发明的一实施例中，所述语音指令管理的系统，其特征在于，所述语音特征相似度判断模块，比对所述音指令与所述预输入语音样本的所述特征参数，并发现结果为不相符时，通过一提示模块，提示所述语音指令与所述预输入语音样本的所述特征参数不相符。

在本发明的一实施例中，所述语音指令管理的系统，其特征在于，所述语音辨识模块，比对所述语音指令与所述预输入指令样本，无法判断出对应所述语音指令的所述指令时，通过一语音助理模块，进行问答引导。

在本发明的一实施例中，所述语音指令管理的系统，其特征在于，所述语音接收模块利用无线传输的方式与所述语音特征相似度判断模块连接。

在本发明的一实施例中，所述语音指令管理的系统，其特征在于，所述语音接收模块为一蓝牙耳麦、一智能型手表、一智能眼镜或一具有语音接收功能的穿戴型装置。

本发明在于系统在接收语音指令的同时，先行启动声纹辨识程序，以确认接收到之语音为用户本人的声纹，若是才续行语音指令辨识功能，并于辨识后执行命令，以达到减少误动作的机会，进一步提高语音指令辨识成功率。

附图说明

图1是本发明语音指令管理的系统架构示意图。

图2是本发明语音指令管理的方法流程示意图。

图3至7是本发明一实施例的语音指令管理的系统流程示意图。

具体实施方式

为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例，对依据本发明提出的语音指令管理的控制方法及设备其具体实施方式、结构、特征及其功效，详细说明如后。

下面结合附图详细说明本发明的具体实施例。

请参照图1，是本发明的语音指令管理的系统架构示意图，在图1中，所述语音指令管理的系统1包括：

一语音接收模块110，用以接收一语音指令；

一语音特征相似度判断模块120，比对所述语音指令与一预输入语音样本的一特征参数是否相符；

一语音辨识模块130，比对所述语音指令与一预输入指令样本，判断出对应所述语音指令的一指令；以及

一指令执行模块140，执行对应所述语音指令的所述目标指令。

在本实施例中，更包括：所述语音特征相似度判断模块120，比对所述音指令与所述预输入语音样本的所述特征参数，并发现结果为不相符时，通过一提示模块，提示所述语音指令与所述预输入语音样本的所述特征参数不相符。

在本实施例中，更包括：所述语音辨识模块130，比对所述语音指令与所述预输入指令样本，无法判断出对应所述语音指令的所述指令时，通过一语音助理模块，进行问答引导。

在本实施例中，更包括：所述语音接收模块110，利用无线传输的方式与所述语音特征相似度判断模块120连接。

在本实施例中，更包括：所述语音接收模块110为一蓝牙耳麦、一智能型手表、一智能眼镜或一具有语音接收功能的穿戴型装置。

请参照图2，是本发明的语音指令管理的方法流程示意图。

步骤S210：通过一语音接收模块接收一语音指令。

步骤S220：通过一语音特征相似度判断模块，比对所述语音指令与一预输入语音样本的一特征参数是否相符。

步骤S230：当判定所述语音指令与所述预输入语音样本的一特征参数相符时，则通过一语音辨识模块，比对所述语音指令与一预输入指令样本，判断出对应所述语音指令的一目标指令。

在本实施例中所述语音辨识模块利用一语音识别达成判断出对应所述语音指令的一指令的功效

在本实施例中所述语音识别最主要的目的是计算机听懂人类说话的声音，进而命令计算机执行相对应的工作。当声音藉由模拟到数字的转换装置输入计算机内部，并以数值方式储存后，语音识别程序便开始已事先储存好的声音样本与输入的测试声音样本进行比对工作。比对完成后，就可以知道用户刚刚发出的声音代表何意，进而命令计算机做事。

在本实施例中采用的语音识别可有以下几种方式：

一、按照辨识字汇的多寡：少量字汇(数百字)、中量字汇(数千字)、大量字汇(数万字)。

二、按照使用对象：特定对象(Speaker Dependent)、不特定对象(SpeakerIndependent)。

三、按照使用方式：不连续语音识别、连续语音识别。

在本实施例中所述应用程序更包含大词汇量语音识别系统，所述大词汇量语音识别系统采用统计模式识别技术。

典型的基于统计模式识别方法的语音识别系统由以下几个基本模块所构成：

一、信号处理及特征提取模块

二、声学模型

三、发音词典

四、语言模型

五、译码器

所述信号处理及特征提取模块的主要任务是从输入信号中提取特征，供声学模型处理。同时，它一般也包括了一些信号处理技术，以尽可能降低环境噪声、说话人等因素对特征造成的影响。

所述声学模型采用基于一阶隐马尔科夫模型进行建模。

所述发音词典包含系统所能处理的词汇集及其发音。

所述发音词典实际提供了声学模型建模单元与语言模型建模单元间的映像。

所述语言模型对系统所针对的语言进行建模。理论上，包括正则语言，上下文无关文法在内的各种语言模型都可以作为语言模型，本发明利用是基于统计的N元文法及其变体。

所述译码器是语音识别系统的核心之一，其任务是对输入的信号，根据声学、语言模型及词典，寻找能够以最大机率输出该信号的词串。

步骤S240：通过一指令执行模块执行对应所述语音指令的所述目标指令。

图3至7是本发明一实施例的语音指令管理流程示意图。

在图3中，一用户发出『拨电话给爸爸』的语音指令301至手机302。

在图4中，所要表现的是，手机通过一语音接收模块接收一语音指令，通过一语音特征相似度判断模块，比对所述语音指令与一预输入语音样本的一特征参数是否相符；当判定所述语音指令301为本人发出时，则通过一语音辨识模块，比对所述语音指令与一预输入指令样本，判断出对应所述语音指令的一目标指令，通过一指令执行模块执行对应所述语音指令的所述目标指令，拨电话给爸爸。

在图5中，一用户发出『现在打电话回家』的语音指令501至手机502。

在图6中，手机通过一语音接收模块接收一语音指令；通过一语音特征相似度判断模块，比对所述语音指令与一预输入语音样本的一特征参数是否相符；当判定所述语音指令02为本人发出时，则通过一语音辨识模块，比对所述语音指令与一预输入指令样本，无法判断出对应所述语音指令的一指令，并显示无法完全辨识语音指令的讯息。

在图7中，利用语音指令中的关键词『打电话』与『家』作为组合，询问用户是否要打电话回家。

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，虽然本发明已以较佳实施例揭露如上，然而并非用以限定本发明,任何熟悉本专业的技术人员，在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰，均仍属于本发明技术方案的范围内。

Claims

1.一种语音指令管理的方法，其特征在于，包括如下步骤：

通过一语音接收模块接收一语音指令；

通过一语音特征相似度判断模块，比对所述语音指令与一预输入语音样本的一特征参数是否相符；

当判定所述语音指令与所述预输入语音样本的一特征参数相符时，则通过一语音辨识模块，比对所述语音指令与一预输入指令样本，判断出对应所述语音指令的一目标指令；以及

通过一指令执行模块执行对应所述语音指令的所述目标指令。

2.根据权利要求1所述语音指令管理的方法，其特征在于，更包括:

通过所述语音特征相似度判断模块，比对所述音指令与所述预输入语音样本的所述特征参数，发现结果为不相符；以及

通过一提示模块，提示所述语音指令与所述预输入语音样本的所述特征参数不相符。

3.根据权利要求1所述语音指令管理的方法，其特征在于，更包括:

通过所述语音辨识模块，比对所述语音指令与所述预输入指令样本，当无法判断出对应所述语音指令的所述目标指令时；以及

通过一语音助理模块，进行问答引导。

4.根据权利要求1所述语音指令管理的方法，其特征在于，更包括:

通过无线传输的方式连接所述语音接收模块与所述语音特征相似度判断模块。

5.根据权利要求1所述语音指令管理的方法，其特征在于，更包括：

利用一蓝牙耳麦、一智能型手表、一智能眼镜或一具有语音接收功能的穿戴型装置作为所述语音接收模块。

6.一种语音指令管理的系统，其特征在于，所述语音指令管理的系统包括：

一语音接收模块，用以接收一语音指令；

一语音特征相似度判断模块，比对所述语音指令与一预输入语音样本的一特征参数是否相符；

一语音辨识模块，比对所述语音指令与一预输入指令样本，判断出对应所述语音指令的一目标指令；以及

一指令执行模块，执行对应所述语音指令的所述目标指令。

7.根据权利要求6所述语音指令管理的系统，其特征在于，所述语音特征相似度判断模块，比对所述音指令与所述预输入语音样本的所述特征参数，并发现结果为不相符时，通过一提示模块，提示所述语音指令与所述预输入语音样本的所述特征参数不相符。

8.根据权利要求6所述语音指令管理的系统，其特征在于，所述语音辨识模块，比对所述语音指令与所述预输入指令样本，无法判断出对应所述语音指令的所述指令时，通过一语音助理模块，进行问答引导。

9.根据权利要求6所述语音指令管理的系统，其特征在于，所述语音接收模块利用无线传输的方式与所述语音特征相似度判断模块连接。

10.根据权利要求6所述语音指令管理的系统，其特征在于，所述语音接收模块为一蓝牙耳麦、一智能型手表、一智能眼镜或一具有语音接收功能的穿戴型装置。