CN101290767A

CN101290767A - 具有语音识别功能的便携式计算机与其处理方法

Info

Publication number: CN101290767A
Application number: CNA2007100978599A
Authority: CN
Inventors: 梁宏隆; 周柏崴
Original assignee: Asustek Computer Inc
Current assignee: Asustek Computer Inc
Priority date: 2007-04-20
Filing date: 2007-04-20
Publication date: 2008-10-22

Abstract

一种具有语音识别功能的便携式计算机与其处理方法，在语音指令的处理方法中，而此语音指令包括Y个指令字符串，其中Y为大于等于1的正整数。本发明的处理方法包括提供多个语音识别数据库，并且可以为了执行语音指令中第X个指令字符串加载对应的语音识别数据库，而X为大于等于1且小于等于N的正整数。当在所加载的语音识别数据库中搜寻到符合第X个指令字符串的字符串时，则执行第X个指令字符串所代表的动作，并且当X不等于Y时，则将X加1。

Description

具有语音识别功能的便携式计算机与其处理方法

技术领域

本发明涉及一种语音指令的处理技术，且特别涉及一种具有多层级数据库的语音指令的处理技术。

背景技术

随着计算机系统的普及，使用者对于计算机使用上的便利性有愈来愈多的要求。因此，计算机系统的输入设备，从传统的键盘、鼠标与遥控器等，渐渐地发展成更为人性化的操作技术，例如语音输入控制。而语音控制的关键，就在于语音指令的识别率。

一般而言，语音识别技术都是以语音指令中的关键词词为基底进行识别，是较简单也较有效率的语音识别技术。此方法乃是直接以存储在关键词数据库中所有的关键词词作为识别率的依据，因为只需要对此特定范围的关键词词进行识别，所以能使语音识别的识别率达成一定的水平。

然而，已知的语音识别技术的识别率，会随着数据库中关键词词的数量增大而降低。也就是说，当使用者将愈多的关键词词存入数据库中，则系统进行字词比较的时间就愈长，并且比较的复杂度也更为提升，而导致准确度相对地下降。

发明内容

因此，本发明提供一种语音指令的处理方法，可以提高语音指令的识别率。

此外，本发明也提供一种具有语音识别功能的便携式计算机，其具有较佳的语音识别效率。

本发明提供一种语音指令的处理方法，而此语音指令包括Y个指令字符串，其中，Y为大于等于1的正整数。本发明的处理方法包括提供多个语音识别数据库，并且为了执行语音指令中第X个指令字符串而加载对应的语音识别数据库，其中X为大于等于1且小于等于N的正整数。当在所加载的语音识别数据库中搜寻到符合第X个指令字符串的字符串时，则执行第X个指令字符串所代表的动作。且当X不等于Y时，则将X加1。

此外，当在所加载的语音识别数据库中搜寻不到符合第X个指令字符串的字符串时，则放弃执行此语音指令。

从另一观点来看，本发明也提供一种具有语音识别功能的便携式计算机，包括输入单元、存储单元和处理单元。其中，输入单元可以用来接收一语音指令，而存储单元内存储有多个语音识别数据库。另外，处理单元则是耦接输入单元和存储单元。藉此，当便携式计算机的语音识别功能被启动，而且一包含有N个指令字符串的语音指令从上述的输入单元输入时，则处理单元可以为了执行语音指令中第X个指令字符串而从存储单元加载对应的语音识别数据库，并且在加载的语音识别数据库内搜寻是否有符合第X个指令字符串的字符串。当从加载的语音识别数据库内搜寻到符合第X个指令字符串的字符串时，则执行第X个指令字符串所代表的动作。另外，当X不等于N时，则将X加1。其中，N为大于等于1的正整数，而X则为大于等于1而小于等于N的正整数。

由于在本发明中，每一指令字符串不一定都是在同一数据库内，而是采取分级的架构。因此，本发明可以提高语音指令的识别率，并且可以提升指令字符串搜寻的速度，进而提升语音指令处理的速度。

有益效果：

综上所述，由于本发明具有多层级的数据库结构来搜寻语音指令中的指令字符串。因此，本发明可以缩短搜寻的时间，并且进而提升语音指令的执行效率。另外，指令字符串是分配到不同的语音识别数据库，因此不同层级的语音数据库内不会含有太多的字符串需要比较，是以本发明具有较佳的语音识别率。

为让本发明的上述和其它目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合附图，作详细说明如下。

附图说明

图1所示为依照本发明的一实施例的一种具有语音识别功能的便携式计算机的内部方块图。

图2所示为依照本发明的一较佳实施例的一种语音指令的处理方法的步骤流程图。

图3所示为依照本发明的一较佳实施例的一种数据库的层级架构图。

图4所示为依照本发明的一较佳实施例的一种比较指令字符串的步骤流程图。

具体实施方式

图1所示为依照本发明的一实施例的一种具有语音识别功能的便携式计算机的内部方块图。请参照图1，本发明较佳实施例所提供的便携式计算机100例如是笔记本计算机或超级行动个人计算机(UMPC)系统，其包括输入单元102、处理单元104、存储单元106、及存储单元118。上述输入单元102与处理单元104电性连接，处理单元104与存储单元118电性连接。处理单元104亦与存储单元106电性连接。

在本实施例中，输入单元102为指向性麦克风，其可组设在便携式计算机100的显示器上缘，以获得较佳的收音，且输入单元102在接收一外界的声音后，并将其所接收的声音讯号输出至与其耦接的处理单元104。在其它实施例中，输入单元102亦可为一般型的麦克风。另外，存储单元106可以是各种不同的存储设备，例如硬盘、存储卡等，并且也是耦接至处理单元104。

在本实施例中，存储单元106内存有多个语音识别数据库110。另外，在存储单元106中，更可以存储有多个应用程序112和大量的数据文件114。

请继续参照图1，若是使用者要使用语音控制来操作便携式计算机100时，可以先启动存储装置106中关于语音识别功能的应用程序112。假设便携式计算机100的语音识别功能已经被开启，则使用者就可以藉由输入单元102将一语音指令输入至便携式计算机100中。特别的是，本发明较佳实施例允许使用者所输入的语音指令可以包括多个指令字符串，并且每个指令字符串又可以包括多个字符。另外，每个指令字符串内所含的字符也不一定需要相同。

图2所示为依照本发明的一较佳实施例的一种语音指令的处理方法的步骤流程图。请合并参照图1和图2，以下举一实施例来说明本发明的精神。若是一使用者想要利用本发明实施例所提供的便携式计算机100播放一位歌手AAA的歌曲，歌名叫做DDDD时，使用者可通过便携式计算机100的输入单元102输入一包含有Y个指令字符串的语音指令，就如步骤S202所述。Y可以是大于等于1的正整数。例如，使用者说出“播放AAADDDD”的语音指令，则此语音指令就可以包括“播放”、“AAA”、“DDDD”等三个指令字符串，也就是说Y等于3。

当语音指令通过输入单元102送进便携式计算机100后，处理单元104为执行所输入的语音指令中第X个指令字符串，而如步骤S204所述，从存储单元106内加载对应的语音识别数据库110，其中X为大于等于1而小于等于Y的正整数。例如，当X等于1，则处理单元104所要处理的指令字符串就是“播放”。因此，处理单元104可以为了执行此第1个指令字符串而从存储单元106内加载对应于指令字符串为“播放”的语音识别数据库。

一般来说，处理单元104可以具有寄存区116，而被加载的语音识别数据库110就可以被存放在此寄存区116中。而在另外一些选择实施例中，处理单元116也可以将被加载的语音识别数据库110存放在例如动态随机存取内存等的外部存储单元118，并不会影响本发明主要的精神。

当处理单元104从存储单元106加载对应的数据库110后，可以如步骤S206所述，检查所加载的语音识别数据库110内，是否存在有字符串可以符合第X个指令字符串。当没有从加载的语音识别数据库110中搜寻到有符合的字符串时(就是步骤S206所标示的“否”)，代表此语音指令可能是无效的语音指令，或是使用者所说出(输入)的语音指令不清楚。此时，本实施例可以执行步骤S208，就是放弃执行所输入的语音指令。

相对地，当处理单元104在加载的语音识别数据库110中搜寻到符合第X个指令字符串的字符串时(就是步骤S206所标示的“是”)，则如步骤S210所述，执行第X个字符串所代表的动作。假设，处理单元104在加载的语音识别数据库110中搜寻到“播放”的指令字符串，就可以使处理单元104启动存储单元106中关于多媒体播放的应用程序112，以准备播放歌曲。

另一方面，本实施例可以如步骤S212所述，检查X是否等于Y。在本实施例中，Y等于3，而此时X等于1，因此X不等于Y(就是步骤S212所标示的“否”)，则执行步骤S214，就是将X加1，并且重复执行步骤S204等步骤。

另外，处理单元104所执行的第X个指令字符串所代表的动作，不一定是要执行某个应用程序。假设在步骤S206中，目前X等于3，也就是在加载的语音识别数据库中搜寻是否符合歌名为“DDDD”的歌曲。若是在加载语音识别数据库中寻找到符合“DDDD”的字符串，就可以使处理单元104对存储单元106执行存取“DDDD”歌曲的档案数据114(S210)。并且由于X等于Y(就是步骤S212所标示的“是”)，则结束整个图2的流程。

综合图2的说明，图3提供了一个数据库层级架构图。请参照图3，其中包括了不同层级的语音识别数据库302、304和306。首先，本发明较佳实施例为了要执行一语音指令，可以先在较上级的语音识别数据库302中搜寻是否有符合的字符串。以上述的例子来说明，假设字符串312代表上述“播放”的指令字符串，当搜寻到312时，不但可以执行字符串312所代表的动作(例如启动播放媒体)，并且可以呼叫并加载下一层语音识别数据库304。

假设，语音识别数据库304的内容包含所有歌手的名字，则本发明较佳实施例可以在字符串312所代表的动作被执行完时，继续搜寻有否符合歌手姓名为“AAA”的字符串。假设字符串314是符合的字符串时，则本发明可以依据字符串314而呼叫语音识别数据库306，例如是此歌手所有歌曲的列表。藉此，使用者就可以利用便携式计算机100正确的执行「播放歌手AAA的歌曲，其歌名叫DDDD」的动作。

图4所示为依照本发明的一较佳实施例的一种比较指令字符串的步骤流程图。请参照图4，当本实施例如上所述，要从加载的语音识别数据库中比较是否有符合的字符串时，可以如步骤S402所述，依序组合此语音指令中第k个字符到第m个字符间所有的字符，以产生一组合字符串。假设此语音指令具有n个字符，则k可以为大于等于1而小于m的正整数，而m可以是大于k而小于等于n的正整数，且n为大于1的正整数。

以上述的例子来说明，假设本实施例在搜寻在加载的语音识别数据库中是否有符合“AAA”的字符串。此时，k被设为3，而m的初始值被设为4，因此所产生的组合字符串就为“AA”。接着，本实施例可以如步骤S404所述，在所加载的语音识别数据库中，搜寻是否有字符串符合此组合字符串。

假设，在加载的数据库中，并没有符合“AA”的字符串(就是步骤S404中所标示的“否”)，此时本实施例可以如步骤S406所述，判断m是否等于n。以上述为例，此语音指令包含9个字符，也就是说n等于9。因此，m不等于n(就是步骤S406中所标示的“否”)，则本实施例可以执行步骤S408，就是将m加1，此时m的值为5。反的，若是m等于n(就是步骤S406中所标示的“是”)，则如步骤S410所述，放弃执行此语音指令。

回到步骤S408，由于m最新的值为5，因此新产生出来的组合字符串就为“AAA”。接着，重复步骤S404。此时，假设在加载的语音识别数据库中搜寻到符合“AAA”的字符串时(就是步骤S404中所标示的“是”)，则将此组合字符串当作指令字符串，就如步骤S412所述。

虽然本发明已以较佳实施例揭露如上，然其并非用以限定本发明，任何熟习此技艺者，在不脱离本发明的精神和范围内，当可作些许的更动与润饰，因此本发明的保护范围当视权利要求书所界定者为准。

Claims

1.一种语音指令的处理方法，其特征是上述的语音指令包括Y个指令字符串，其中，Y为大于等于1的正整数，上述的处理方法包括下述步骤：

提供多个语音识别数据库；

为了执行上述的语音指令中第X个指令字符串，而从上述这些语音识别数据库中加载对应的数据库，其中，X为大于等于1而小于等于Y的正整数；

检查所加载的语音识别数据库内是否有符合上述的第X个指令字符串的字符串；

当从所加载的语音识别数据库中搜寻到符合上述的第X个指令字符串的字符串时，则执行上述的第X个指令字符串所代表的动作；以及

当X不等于Y时，则将X加1。

2.根据权利要求1所述的处理方法，其中，当X等于Y时，则结束整个处理方法的流程。

3.根据权利要求1所述的处理方法，其中，当所加载的语音识别数据库内没有符合上述的语音指令的字符串时，则放弃执行上述的语音指令。

4.根据权利要求1所述的处理方法，其中，当所加载的语音识别数据库内没有符合上述的语音指令的字符串时，则放弃执行上述的语音指令。

5.根据权利要求1所述的处理方法，其中，上述的语音指令包括n个字符，而n为正整数。

6.根据权利要求5所述的处理方法，其中，比较上述的第X个指令字符串的步骤，包括：

依序组合上述的语音指令中第k个字符到第m个字符间所有的字符，以产生一组合字符串，其中k为大于等于1而小于m的正整数，而m为大于k而小于等于n的正整数；

在对应的语音识别数据库中搜寻是否有字符串符合上述的组合字符串；

当在对应的语音识别数据库中搜寻到有字符串符合上述的组合字符串时，则将上述的组合字符串当作上述的第X个指令字符串；

当没有在对应的语音识别数据库中搜寻到有字符串符合上述的组合字符串时，则检查m是否等于n；

当m不等于n时，则将m加1，并重新产生上述的组合字符串；以及

当m等于n时，则放弃执行上述的语音指令。

7.根据权利要求1所述的处理方法，其中，执行上述的第X个指令字符串所代表的动作，包括执行一应用程序和存取一数据文件二者其中之一。

8.根据权利要求1所述的处理方法，更包括检查一语音识别功能是否被启动。

9.一种具有语音识别功能的便携式计算机，其特征是包括：

一输入单元，用以接收一语音指令；

一存储单元，存储有多个语音识别数据库；以及

一处理单元，耦接上述的输入单元和上述的存储单元，

其中，当上述的语音识别功能被启动，且一包含N个指令字符串的语音指令从上述的输入单元输入后，则上述的处理单元为了执行上述的语音指令中第X个指令字符串，而从上述的存储单元加载对应的语音识别数据库，并在加载的语音识别数据库内搜寻是否有符合上述的第X个指令字符串的字符串，当从加载的语音识别数据库内搜寻到符合上述的第X个指令字符串的字符串时，则执行上述的第X个指令字符串所代表的动作，且当X不等于N时，将X加1，而N为大于等于1的正整数，X则为大于等于1而小于等于N的正整数。

10.根据权利要求9所述的便携式计算机，其中，上述的输入单元为一指向性麦克风。

11.根据权利要求9所述的便携式计算机，其中，上述的存储单元为一硬盘。

12.根据权利要求9所述的便携式计算机，其中，上述的处理单元具有一寄存区，用以存储加载的上述这些语音识别数据库。

13.根据权利要求9所述的便携式计算机，更包括一存储单元，耦接上述的处理单元，用以存放上述这些语音识别数据库。

14.根据权利要求13所述的便携式计算机，其中，上述的存储单元为一动态随机存取内存。

15.根据权利要求9所述的便携式计算机，其中，上述的处理单元依据上述的第X个指令字符串而执行上述的存储单元内的一应用程序。

16.根据权利要求9所述的便携式计算机，其中，上述的处理单元依据上述的第X个指令字符串而对上述的存储单元执行一存取数据文件的程序二者其中之一。