CN1188829C

CN1188829C - 能够防止语音识别中的错误和提高语音识别率的电子设备

Info

Publication number: CN1188829C
Application number: CNB021055165A
Authority: CN
Inventors: 吴润学; 车淳伯
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2001-07-19
Filing date: 2002-04-12
Publication date: 2005-02-09
Anticipated expiration: 2022-04-12
Also published as: CN1399247A; EP1278183A1; DE60217444D1; KR100552468B1; KR20030008726A; EP1278183B1; JP2003044069A; DE60217444T2; US20030018479A1

Abstract

一种能够防止语音识别中的错误并提高语音识别率的电子设备。该设备具有：扬声器，用于输出音频信号；声音接收器，用于接收外部声音；检测器，用于检测插入到声音接收器接收的声音中的水印信息；声音去除器，用于去除包括由检测器检测的水印信息的音频信号；语音识别器，用于识别该声音并输出对应于该识别声音的命令；以及控制单元，用于接收命令并控制对应于该命令的操作。在声音识别期间，由于去除了从扬声器中输出的声音并且仅识别用户语音，所以能够防止电子设备的误操作。

Description

能够防止语音识别中的错误和提高语音识别率的电子设备

技术领域

本发明涉及诸如电视机的电子设备，更具体地涉及能够通过语音识别控制其中的操作的电子设备。本申请基于第2001-43581号韩国申请，在此，将该申请作为参考而引用。

背景技术

随着语音识别技术的发展，已经开发出了能够通过识别用户语音来控制其中的操作、并能够输入对应的命令的电子设备。当用户发出“播放”或“记录”的声音时，该设备识别该语音的声音模型，产生对应的命令代码，并根据该命令代码控制操作。

图1是作为能够通过语音识别控制其中的操作的电子设备的例子的电视机的简单示图。传统的电视机具有：调谐器1，用于接收广播信号；外部信号输入单元，用于接收从诸如VTR(录象机)的图像再现设备中所再现的信号；微处理器3，用于选择地输出从调谐器1和外部信号输入单元2输入的信号；视频放大器4，用于放大从微处理器3输出的信号中的视频信号；屏幕7，用于显示放大的视频信号；音频放大器5，用于放大从微处理器3输出的信号中的音频信号；以及扬声器6，用于放大和输出已放大的音频信号以便收听。而且传统的电视机具有允许用户输入控制信号的按键输入单元8。

而且，该电视机具有：语音识别器9，用于识别用户语音并发送对应的命令至微处理器3；以及无线麦克风10，用于接收用户发出的声音，并将其以无线形式发送到语音识别器9。在这种情况下，语音识别器9具有用户语音的频段信息。语音识别器9具有一滤波器(未示出)，使属于用户语音频段的声音信号通过，并阻挡不属于用户语音频段的声音信号通过。同时，无线麦克风10具有遥控功能，它具有能够无线控制电视操作的按键输入板(未示出)。无线麦克风10包括模式转换按键，其能够在电视机的一般模式和语音识别模式之间进行转换。

在传统的使用语音识别的电视机控制中，用户在观看电视的同时，通过选择无线麦克风10上的模式转换按键将该电视模式转换成语音识别模式。当将电视转换成语音识别模式时，用户向无线麦克风10发出对应于所需的命令的声音。此时，无线麦克风10不仅接收人的语音，还接收从扬声器6输出的声音，并且将所接收的这两种信号提供给语音识别器9。语音识别器9使属于用户声音的频段的信号通过，并阻止包括从扬声器6输出的音频信号的其余信号。接着，语音识别器9识别所接收的用户话音的语音模型，并将其发送到微处理器3。

但是，在这样的传统电视机中，当从扬声器6输出的音频信号的声音频段覆盖了用户语音的声音频段时，语音识别器9很难从所接收的声音中检测和移去所有的音频信号。此外，如果从扬声器6输出的音频信号的声音属于语音识别器9的通带频率，并且对应于能够控制电视机的声音，则语音识别器9会将从扬声器6输出的声音误识别成控制信号，从而导致电视机误动作的问题。

为避免上述问题，用户在观看电视时，可在调整扬声器6之后向无线扬声器10发出对应操作命令的声音。接着语音识别器9仅接收能够将所对应命令发送到微处理器3的用户语音。但是，用户在给出命令到语音识别器9时不能收听来自扬声器6的声音，由此导致了观看电视时的不方便。

这种类型的问题同样发生在能产生声音的电子设备以及能够根据所接收的语音命令被操作的电子设备之间。这种能产生声音的电子设备的例子如电视机和收音机，能够根据所收到的声音被操作的电子设备的例子如诸如电视机、收音机、录象机和电饭煲、吸尘器、空调和电扇等。

为使用能够输出声音的收音机以及能够通过接收语音执行对应动作的电扇的例子说明通过语音识别所激活的传统操作，当收音机产生了属于电扇能够识别的频段并能操作电扇的声音时，电扇将该声音误认为用户控制语音，结果可以执行对应于收音机给出的声音的命令。因此，电扇执行了用户不打算执行的操作。此外，如果从收音机输出的声音和用户语音同时输入，则因为很难分离和移去扬声器的音频信号，所以可能无法正确执行语音命令。

发明内容

本发明的目的在于解决上述问题，提供一种电子设备，其由语音识别操作，并能够防止接收从扬声器输出的声音而导致的误动作。

本发明的另一个目的在于提供一种电子设备，当从在其内的扬声器产生音频信号时，其能够提供包括关于所产生的声音的信息的声音，

本发明的再一个目的是提供一种电子设备，其根据语音识别被操作，并通过能够区分在所接收的声音中包含的可识别信息的语音识别而被操纵。

为实现上述目的，本发明提供一种电子设备，包括：扬声器，用于输出音频信号；声音接收机，用于接收外部声音；确定器，用于确定在声音接收器中所接收的外部声音的信号是否是从扬声器输出的音频信号；语音识别器，用于当确定器确定外部声音信号和该音频信号不同时，识别外部声音并输出对应于外部声音的命令；以及控制单元，用于接收命令并执行对应于该命令的操作。

最好，根据本发明的电子设备还包括：水印生成器，用于添加为该音频信号的识别信息的预定识别信息。在这种情况下，根据由语音识别器接收的外部声音的信号中存在的识别信息，确定器确定外部声音的信号是否是该语音信号。

同时，确定器最好包括：检测器，用于搜索插入声音接收器接收的外部声音信号中的水印信息；声音去除器，用于在检测到水印信息的情况中，使用该检测器中检测的谱信息，去除包括水印信息的音频信号；以及语音信号识别器，用于根据来自被去除的音频信号中的外部声音信号的能量电平，识别语音信号的存在。

在根据本发明的电子设备中，能够设置该电子设备的操作模式，由此可由用户选择是否操作识别信息提供器。

同时，为实现另一个目的，本发明提供一种电子设备，包括：识别信息提供器，用于将预定识别信息添加到音频信号上；以及扬声器，用于输出包括识别信息的音频信号。在这种情况中，识别信息可以是包括关于音频信号的谱信息的水印信息，并且识别信息提供器可以是用于将水印信息添加到音频信号并通过扬声器输出音频信号的水印生成器。

而且，为实现再一个目的，本发明提供一种电子设备，包括：声音接收器，用于接收外部声音；确定器，用于确定在声音接收器接收的外部声音信号中的预定识别信息；语音识别器，用于在确定器确定在外部声音信号中不存在识别信息的情况下输出对应于外部声音的命令；以及控制单元，用于接收命令并控制对应于该命令的操作。

识别信息是包括外部声音信号的谱信息的水印信息。确定器根据语音识别器接收的外部声音信号中的水印信息是否存在来确定识别信息是否存在。

确定器最好包括：检测器，用于搜索插入在声音接收器接收的外部声音信号中的水印信息；声音去除器，用于在检测到水印信息的情况中，使用该检测器中检测的谱信息，去除包括水印信息的音频信号；以及语音信号识别器，用于根据来自被去除的音频信号中的外部声音信号的能量电平，识别语音信号的存在。

同时，根据本发明，提供一种用于防止在执行语音识别中电子设备的误动作的方法。

根据本发明的一个方面，提供一种电子设备，包括：识别信息提供器，用于将预定的识别信息添加到音频信号中；扬声器，用于输出已添加了该识别信息的音频信号；声音接收器，用于接收外部声音；确定器，用于根据在接收的外部声音的信号中识别信息的存在来确定在声音接收器接收的外部声音的信号是否为从扬声器输出的该音频信号；语音识别器，用于当确定器确定外部声音的信号和该音频信号不同时，识别外部声音并输出对应于该外部声音的命令；以及控制单元，用于接收命令并控制对应于该命令的操作。所述确定器包括：检测器，用于搜索插入到声音接收器接收的外部声音的信号中的识别信息；声音去除器，用于在检测到识别信息的情况下，使用检测器检测的谱信息去除包括识别信息的该音频信号；以及语音信号识别器，用于根据从去除了该音频信号的外部声音的信号的能量电平来识别语音信号的存在。

根据本发明的一个方面，提供一种电子设备，包括：识别信息提供器，用于将预定识别信息添加到音频信号中；以及扬声器，用于输出包括该识别信息的音频信号。

根据本发明的一个方面，提供一种电子设备，包括：声音接收器，用于接收外部声音；确定器，用于确定在声音接收器接收的外部声音的信号中预定识别信息的存在；语音识别器，用于在确定器确定在外部声音信号中不存在识别信息的情况下，输出对应于该外部声音的命令；以及控制单元，用于接收该命令和控制对应于该命令的操作。其中确定器包括：检测器，用于搜索插入到声音接收器接收的外部声音的信号中的识别信息；声音去除器，用于在检测到识别信息的情况下，使用检测器检测的谱信息去除包括识别信息的该音频信号；以及语音信号识别器，用于根据从去除了音频信号的外部声音的信号的能量电平来识别语音信号的存在。

根据本发明的一个方面，提供一种用于接收声音的方法，包括步骤：将预定的识别信息添加到音频信号中；通过扬声器输出该已添加了所述识别信息的音频信号；接收外部声音信号；在根据外部声音的信号中识别信息的存在而确定在外部声音信号中包括该音频信号的情况下，从外部声音信号中去除该音频信号；通过识别该外部声音，输出对应于该外部声音的命令；以及接收该命令并控制对应于该命令的操作。

根据本发明，可以防止电子设备的误动作，因为在电视的语音识别模式中水印信息被添加到从扬声器输出的音频信号中，并且由检测器检测在所接收的外部声音信号中水印信息的存在。

附图说明

通过参考附图对本发明的优选实施例的详细描述，本发明的上述目的和特点将会变得更加清楚，其中：

图1是能够通过语音识别控制其操作的电视机的示意图；

图2示出了根据本发明优选实施例的能够防止语音识别中的错误和提高识别率的电子设备；

图3是图2中确定器的详细方框图；以及

图4是根据本发明优选实施例的用于防止语音识别中的错误并提高语音识别率的方法的流程图。

具体实施方式

以下，参照附图来详细说明本发明的实施例。

图2示出了根据本发明优选实施例的能够防止语音识别中的错误并提高语音识别率的电子设备。本实施例是以电视机作为电子设备的例子进行说明的。参照图2，本发明的电子设备包括：调谐器21，用于接收广播信号；外部信号输入单元22，用于接收来自诸如VTR和DVDP之类的图像再现器的再现信号；微处理器24，用于选择地输出从调谐器21和外部信号输入单元22输入的信号；电源23，用于提供电源至微处理器24；按键输入单元25，用于将涉及所需操作的控制命令输入到微处理器24；以及声音接收控制单元50，用于相对于通过语音识别的对应的操作，控制微处理器24。

图中的电视机组成如下：视频放大器26，用于放大从微处理器24输出的信号中的视频信号；显现单元27，用于将放大的视频信号转换成能够显示的格式；以及屏幕28，用于显示该重新格式化的视频信号。另外，该电视机包括音频放大器30，用于放大从微处理器24输出的信号中的音频信号；水印生成器40，用于提取该放大音频信号的谱信息，并将所提取的谱信息添加到该放大的音频信号中；以及扬声器31，用于放大和输出添加了谱信息作为可听的声音的音频信号。

同时，声音接收控制单元50包括：声音接收器52，用于接收从无线麦克风60输入的音频信号；确定器54，用于确定在声音接收器52中接收的音频信号是否是从扬声器31输出的声音或用户的语音信号；以及语音识别器56，用于检测对应于该接收声音的语音模型识别结果的命令，并在确定器54中将该语音信号识别为用户语音信号之后，将该命令发送到微处理器24。

图3是图2中所示的确定器54的详细方框图。根据该图，确定器54包括：检测器54a，用于从声音接收器52接收的音频信号中搜索所插入的水印信息；声音去除器54b，用于当检测到水印信息时，通过使用检测器54a中识别的音频谱来去除包括水印信息的音频信号；以及语音信号识别器54c，用于通过被去除音频信号的声音信号中的音频信号的能量电平来识别话音信号的存在。

无线麦克风60具有无线遥控功能，其配置有能够无线控制电视机操作的按键输入板(未示出)。麦克风60配置有模式转换按键，用于在电视观看的一般模式和语音识别模式之间切换。一般模式是根据无线麦克风60和按键输入单元25的按键选择通过控制微处理器24的操作能够观看电视的模式。语音识别模式是通过声音接收控制单元50接收语音能够控制微处理器的模式。

同时，设置水印生成器40的操作以仅当通过无线麦克风60选择语音识别模式时进行选择地操作。最好，如果用户通过选择无线麦克风60上的模式转换按键将该模式转换成语音识别模式，则声音接收控制单元50发送改变该转换成语音识别模式的信号至微处理器24。因此，在一般模式中，微处理器24输出被放大的音频信号而不需要通过扬声器31的水印生成器40的操作。

当从声音接收控制单元50接收通知将该模式转换成语音识别模式的信号时，微处理器24控制水印生成器以便将该音频信号的谱信息添加到放大的音频信号中，并将其通过扬声器31输出。音频信号的谱信息称为水印信息。该水印信息是隐藏信息，它包含关于原始信号的信息并对原始信号的质量没有任何影响。因此，尽管通过扬声器输出了包含水印信息的音频信号，用户仅收听到对应于该音频信号的声音。

同时，通过检测水印生成器40中音频信号的谱信息的水印信息识别一般使用线性预测编码(LPC)，采样音频信号并通过谱变换计算系数。因此，检测器54a从声音接收器52接收的音频信号中搜索作为水印信息插入的谱信息，并且声音去除器54b使用检测器54a检测的声音的谱信息去除包括水印信息的音频信号。在这点上，话音信号识别器54c对剩余的声音信号不进行处理。即，语音信号识别器54c去除那些被认为不包括任何语音信号的外部声音信号，因为它们的能量电平比阈值低。语音信号识别器54c发送那些被认为包括语音信号的外部声音信号，因为它们的能量电平比阈值高。语音识别器56通过语音模型识别来识别输入的语音信号。所检测的命令被发送到微处理器24，使得微处理器24执行对应于该命令的操作。

因此，在语音识别模式中，在确定器54通过检测水印生成器40生成的音频信号的水印信息而进行的语音识别过程中，可以通过水印信息检测音频信号并在通过扬声器31生成该音频信号之前将该音频信息添加到该音频信号中。

接着，语音识别器56能够通过仅对外部声音的信号中的语音信号的语音模型识别来检测对应的命令，并且微处理器24能够防止由语音识别错误所引起的电子设备的不期望的操作。

同时，可通过用户语音控制的命令的一些例子是开机/关机、频道选择、音量控制和静音开/关操作。开机/关机操作控制电源23至电视机的各部分的电能提供，并且当发出对应于频道号的声音时，频道选择控制微处理器24选择频道。根据用户发出的“音量增加”和“音量减小”的声音，音量控制控制音频放大器30进行音量调整。根据用户发出的“静音开”的声音，静音开/关通过控制音频放大器31来控制音频信号的输出。

图4是根据本发明的用于防止电子设备的语音识别中的错误的方法的优选实施例的流程图。参照该图，当开机时，在接收从广播信号或再现设备输入的再现信号的同时，微处理器24首先根据无线麦克风60上的模式接键的选择确定当前控制信号输入模式是否为语音控制模式(步骤S42)。如果在该步骤(S42)识别为非语音控制模式，则微处理器24使用一般模式，使所接收的广播信号和再现信号通过屏幕28和扬声器31输出(S44)。如果在该步骤(S42)识别为语音控制模式，则微处理器24控制水印生成器40使其将水印信息添加到放大的音频信号中(S46)。带有所添加的水印信息的音频信号被放大并通过扬声器31被输出(S48)。

同时，检测器54a从外部声音信号中检测水印信息的存在(S52)。如果在该步骤(S52)从外部声音信号中检测到包括水印信息的信号，则检测器54a能够识别出在外部声音信号中，包括来自扬声器31的音频信号。因此，声音去除器54b从外部声音信号中去除所检测的、包括水印信息的、从扬声器31输出的音频信号的信号(S54)。

因此，通过将在从外部声音信号中去除音频信号后剩余的声音信号的能量电平与阈值相比较，语音信号识别器54c识别语音信号的存在(S56)。如果从外部声音信号中去除音频信号后剩余的声音信号的能量电平比阈值低，则将这样的声音信号识别为不包含任何语音信号，并对其不做任何处理；如果从外部声音信号中去除音频信号后剩余的声音信号的能量电平比阈值高，则将这样的声音信号识别为包含语音信号，并将其发送到语音识别器56(S58)。

同时，如果在该步骤(S52)从外部声音信号中没有检测到包括水印信息，则这些信号被发送到语音信号识别器54c，并且语音信号识别器54c通过将这些信号的能量电平与阈值相比较识别语音信号的存在(S56)。如果该声音信号的能量电平比阈值低，则这些信号被识别成不包含任何语音信号，并对它们不做任何处理。如果该声音信号的能量电平比阈值高，则这些信号被识别成包含语音信号，并将这些信号发送到语音识别器56(S58)。

对于在步骤S58被识别为语音信号的所接收的话音信号，通过对接收的语音信号的语音模型识别，语音识别器56通过微处理器24输出与该语音信号相关的命令(S60)。因此，微处理器24根据所接收的命令控制电视机(S62)。

因此，通过将水印信息添加到从扬声器31输出的音频信号中以及识别通过无线麦克风60发送的外部声音信号的水印信息的存在和检测用户语音信号，能够防止由于错误的语音识别引起的电视机操作的错误。

同时，本发明的实施例说明了配置有水印生成器40和声音接收控制单元50的电子设备。但是，在水印生成器40和声音接收控制单元50分别存在于两个不同的电子设备中的情况下，也可以使用本实施例。即，如果在能够通过扬声器输出音频信号的电子设备的扬声器之前采用了水印生成器40，以及如果在能够通过语音识别进行操作的电子设备中采用了声音接收控制单元50，同样可以使用本实施例。

根据本发明，由于将音频信号的水印信息添加到该音频信号中并随后通过扬声器31将该音频信号输出，因而当确定器54确定语音信号时，根据水印信息能够检测音频信号。因此，语音识别器56通过仅识别外部声音信号中的语音信号的模型来检测对应的命令，因此，微处理器24能够防止由于语音识别中的错误所造成的电子设备的误操作。

尽管已经描述了本发明的优选实施例，本领域技术人员将理解本发明不限于所描述的优选实施例。在所附的权利要求书限定的本发明的实质和范围内，可以产生许多改变和修改。

Claims

1.一种电子设备，包括：

识别信息提供器，用于将预定的识别信息添加到音频信号中；

扬声器，用于输出已添加了该识别信息的音频信号；

声音接收器，用于接收外部声音；

确定器，用于根据在接收的外部声音的信号中识别信息的存在来确定在声音接收器接收的外部声音的信号是否为从扬声器输出的该音频信号，所述确定器包括：

检测器，用于搜索插入到声音接收器接收的外部声音的信号中的识别信息；

声音去除器，用于在检测到识别信息的情况下，使用检测器检测的谱信息去除包括识别信息的该音频信号；以及

语音信号识别器，用于根据从去除了该音频信号的外部声音的信号的能量电平来识别语音信号的存在；

语音识别器，用于当确定器确定外部声音的信号和该音频信号不同时，识别外部声音并输出对应于该外部声音的命令；以及

控制单元，用于接收命令并控制对应于该命令的操作。

2.如权利要求1所述的电子设备，其中识别信息是包括关于音频信号的谱信息的水印信息，识别信息提供器是用于将水印信息添加到音频信号中的水印生成器，确定器根据在语音识别器接收的外部声音信号中水印信息的存在确定该音频信号的存在。

3.如权利要求1所述的电子设备，其中根据用户选择设置识别信息提供器的操作模式。

4.一种电子设备，包括：

识别信息提供器，用于将预定识别信息添加到音频信号中；以及

扬声器，用于输出包括该识别信息的音频信号。

5.如权利要求4所述的电子设备，其中识别信息是包括关于音频信号的谱信息的水印信息，识别信息提供器是用于将水印信息添加到音频信号中并通过扬声器输出该音频信号的水印生成器。

6.一种电子设备，包括：

声音接收器，用于接收外部声音；

确定器，用于确定在声音接收器接收的外部声音的信号中预定识别信息的存在，其中确定器包括：

语音信号识别器，用于根据从去除了音频信号的外部声音的信号的能量电平来识别语音信号的存在；

语音识别器，用于在确定器确定在外部声音信号中不存在识别信息的情况下，输出对应于该外部声音的命令；以及

控制单元，用于接收该命令和控制对应于该命令的操作。

7.如权利要求6所述的电子设备，其中识别信息是包括外部声音信号的谱信息的水印信息，确定器根据在语音识别器接收的外部声音信号中水印信息的存在确定识别信息的存在。

8.一种用于接收声音的方法，包括步骤：

a)将预定的识别信息添加到音频信号中；

b)通过扬声器输出该已添加了所述识别信息的音频信号；

c)接收外部声音信号；

d)在根据外部声音的信号中识别信息的存在而确定在外部声音信号中包括该音频信号的情况下，从外部声音信号中去除该音频信号；

e)通过识别该外部声音，输出对应于该外部声音的命令；以及

f)接收该命令并控制对应于该命令的操作。

9.如权利要求8所述的接收声音的方法，其中识别信息是包括关于音频信号的谱信息的水印信息，在步骤a)中，将水印信息添加到音频信号中，根据在步骤d)中外部声音的信号中的水印信息的存在来确定该音频信号的存在。