CN1188829C - 能够防止语音识别中的错误和提高语音识别率的电子设备 - Google Patents

能够防止语音识别中的错误和提高语音识别率的电子设备 Download PDF

Info

Publication number
CN1188829C
CN1188829C CNB021055165A CN02105516A CN1188829C CN 1188829 C CN1188829 C CN 1188829C CN B021055165 A CNB021055165 A CN B021055165A CN 02105516 A CN02105516 A CN 02105516A CN 1188829 C CN1188829 C CN 1188829C
Authority
CN
China
Prior art keywords
signal
sound
identifying information
external voice
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB021055165A
Other languages
English (en)
Other versions
CN1399247A (zh
Inventor
吴润学
车淳伯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN1399247A publication Critical patent/CN1399247A/zh
Application granted granted Critical
Publication of CN1188829C publication Critical patent/CN1188829C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Details Of Television Systems (AREA)
  • Selective Calling Equipment (AREA)

Abstract

一种能够防止语音识别中的错误并提高语音识别率的电子设备。该设备具有:扬声器,用于输出音频信号;声音接收器,用于接收外部声音;检测器,用于检测插入到声音接收器接收的声音中的水印信息;声音去除器,用于去除包括由检测器检测的水印信息的音频信号;语音识别器,用于识别该声音并输出对应于该识别声音的命令;以及控制单元,用于接收命令并控制对应于该命令的操作。在声音识别期间,由于去除了从扬声器中输出的声音并且仅识别用户语音,所以能够防止电子设备的误操作。

Description

能够防止语音识别中的错误 和提高语音识别率的电子设备
                        技术领域
本发明涉及诸如电视机的电子设备,更具体地涉及能够通过语音识别控制其中的操作的电子设备。本申请基于第2001-43581号韩国申请,在此,将该申请作为参考而引用。
                        背景技术
随着语音识别技术的发展,已经开发出了能够通过识别用户语音来控制其中的操作、并能够输入对应的命令的电子设备。当用户发出“播放”或“记录”的声音时,该设备识别该语音的声音模型,产生对应的命令代码,并根据该命令代码控制操作。
图1是作为能够通过语音识别控制其中的操作的电子设备的例子的电视机的简单示图。传统的电视机具有:调谐器1,用于接收广播信号;外部信号输入单元,用于接收从诸如VTR(录象机)的图像再现设备中所再现的信号;微处理器3,用于选择地输出从调谐器1和外部信号输入单元2输入的信号;视频放大器4,用于放大从微处理器3输出的信号中的视频信号;屏幕7,用于显示放大的视频信号;音频放大器5,用于放大从微处理器3输出的信号中的音频信号;以及扬声器6,用于放大和输出已放大的音频信号以便收听。而且传统的电视机具有允许用户输入控制信号的按键输入单元8。
而且,该电视机具有:语音识别器9,用于识别用户语音并发送对应的命令至微处理器3;以及无线麦克风10,用于接收用户发出的声音,并将其以无线形式发送到语音识别器9。在这种情况下,语音识别器9具有用户语音的频段信息。语音识别器9具有一滤波器(未示出),使属于用户语音频段的声音信号通过,并阻挡不属于用户语音频段的声音信号通过。同时,无线麦克风10具有遥控功能,它具有能够无线控制电视操作的按键输入板(未示出)。无线麦克风10包括模式转换按键,其能够在电视机的一般模式和语音识别模式之间进行转换。
在传统的使用语音识别的电视机控制中,用户在观看电视的同时,通过选择无线麦克风10上的模式转换按键将该电视模式转换成语音识别模式。当将电视转换成语音识别模式时,用户向无线麦克风10发出对应于所需的命令的声音。此时,无线麦克风10不仅接收人的语音,还接收从扬声器6输出的声音,并且将所接收的这两种信号提供给语音识别器9。语音识别器9使属于用户声音的频段的信号通过,并阻止包括从扬声器6输出的音频信号的其余信号。接着,语音识别器9识别所接收的用户话音的语音模型,并将其发送到微处理器3。
但是,在这样的传统电视机中,当从扬声器6输出的音频信号的声音频段覆盖了用户语音的声音频段时,语音识别器9很难从所接收的声音中检测和移去所有的音频信号。此外,如果从扬声器6输出的音频信号的声音属于语音识别器9的通带频率,并且对应于能够控制电视机的声音,则语音识别器9会将从扬声器6输出的声音误识别成控制信号,从而导致电视机误动作的问题。
为避免上述问题,用户在观看电视时,可在调整扬声器6之后向无线扬声器10发出对应操作命令的声音。接着语音识别器9仅接收能够将所对应命令发送到微处理器3的用户语音。但是,用户在给出命令到语音识别器9时不能收听来自扬声器6的声音,由此导致了观看电视时的不方便。
这种类型的问题同样发生在能产生声音的电子设备以及能够根据所接收的语音命令被操作的电子设备之间。这种能产生声音的电子设备的例子如电视机和收音机,能够根据所收到的声音被操作的电子设备的例子如诸如电视机、收音机、录象机和电饭煲、吸尘器、空调和电扇等。
为使用能够输出声音的收音机以及能够通过接收语音执行对应动作的电扇的例子说明通过语音识别所激活的传统操作,当收音机产生了属于电扇能够识别的频段并能操作电扇的声音时,电扇将该声音误认为用户控制语音,结果可以执行对应于收音机给出的声音的命令。因此,电扇执行了用户不打算执行的操作。此外,如果从收音机输出的声音和用户语音同时输入,则因为很难分离和移去扬声器的音频信号,所以可能无法正确执行语音命令。
                        发明内容
本发明的目的在于解决上述问题,提供一种电子设备,其由语音识别操作,并能够防止接收从扬声器输出的声音而导致的误动作。
本发明的另一个目的在于提供一种电子设备,当从在其内的扬声器产生音频信号时,其能够提供包括关于所产生的声音的信息的声音,
本发明的再一个目的是提供一种电子设备,其根据语音识别被操作,并通过能够区分在所接收的声音中包含的可识别信息的语音识别而被操纵。
为实现上述目的,本发明提供一种电子设备,包括:扬声器,用于输出音频信号;声音接收机,用于接收外部声音;确定器,用于确定在声音接收器中所接收的外部声音的信号是否是从扬声器输出的音频信号;语音识别器,用于当确定器确定外部声音信号和该音频信号不同时,识别外部声音并输出对应于外部声音的命令;以及控制单元,用于接收命令并执行对应于该命令的操作。
最好,根据本发明的电子设备还包括:水印生成器,用于添加为该音频信号的识别信息的预定识别信息。在这种情况下,根据由语音识别器接收的外部声音的信号中存在的识别信息,确定器确定外部声音的信号是否是该语音信号。
同时,确定器最好包括:检测器,用于搜索插入声音接收器接收的外部声音信号中的水印信息;声音去除器,用于在检测到水印信息的情况中,使用该检测器中检测的谱信息,去除包括水印信息的音频信号;以及语音信号识别器,用于根据来自被去除的音频信号中的外部声音信号的能量电平,识别语音信号的存在。
在根据本发明的电子设备中,能够设置该电子设备的操作模式,由此可由用户选择是否操作识别信息提供器。
同时,为实现另一个目的,本发明提供一种电子设备,包括:识别信息提供器,用于将预定识别信息添加到音频信号上;以及扬声器,用于输出包括识别信息的音频信号。在这种情况中,识别信息可以是包括关于音频信号的谱信息的水印信息,并且识别信息提供器可以是用于将水印信息添加到音频信号并通过扬声器输出音频信号的水印生成器。
而且,为实现再一个目的,本发明提供一种电子设备,包括:声音接收器,用于接收外部声音;确定器,用于确定在声音接收器接收的外部声音信号中的预定识别信息;语音识别器,用于在确定器确定在外部声音信号中不存在识别信息的情况下输出对应于外部声音的命令;以及控制单元,用于接收命令并控制对应于该命令的操作。
识别信息是包括外部声音信号的谱信息的水印信息。确定器根据语音识别器接收的外部声音信号中的水印信息是否存在来确定识别信息是否存在。
确定器最好包括:检测器,用于搜索插入在声音接收器接收的外部声音信号中的水印信息;声音去除器,用于在检测到水印信息的情况中,使用该检测器中检测的谱信息,去除包括水印信息的音频信号;以及语音信号识别器,用于根据来自被去除的音频信号中的外部声音信号的能量电平,识别语音信号的存在。
同时,根据本发明,提供一种用于防止在执行语音识别中电子设备的误动作的方法。
根据本发明的一个方面,提供一种电子设备,包括:识别信息提供器,用于将预定的识别信息添加到音频信号中;扬声器,用于输出已添加了该识别信息的音频信号;声音接收器,用于接收外部声音;确定器,用于根据在接收的外部声音的信号中识别信息的存在来确定在声音接收器接收的外部声音的信号是否为从扬声器输出的该音频信号;语音识别器,用于当确定器确定外部声音的信号和该音频信号不同时,识别外部声音并输出对应于该外部声音的命令;以及控制单元,用于接收命令并控制对应于该命令的操作。所述确定器包括:检测器,用于搜索插入到声音接收器接收的外部声音的信号中的识别信息;声音去除器,用于在检测到识别信息的情况下,使用检测器检测的谱信息去除包括识别信息的该音频信号;以及语音信号识别器,用于根据从去除了该音频信号的外部声音的信号的能量电平来识别语音信号的存在。
根据本发明的一个方面,提供一种电子设备,包括:识别信息提供器,用于将预定识别信息添加到音频信号中;以及扬声器,用于输出包括该识别信息的音频信号。
根据本发明的一个方面,提供一种电子设备,包括:声音接收器,用于接收外部声音;确定器,用于确定在声音接收器接收的外部声音的信号中预定识别信息的存在;语音识别器,用于在确定器确定在外部声音信号中不存在识别信息的情况下,输出对应于该外部声音的命令;以及控制单元,用于接收该命令和控制对应于该命令的操作。其中确定器包括:检测器,用于搜索插入到声音接收器接收的外部声音的信号中的识别信息;声音去除器,用于在检测到识别信息的情况下,使用检测器检测的谱信息去除包括识别信息的该音频信号;以及语音信号识别器,用于根据从去除了音频信号的外部声音的信号的能量电平来识别语音信号的存在。
根据本发明的一个方面,提供一种用于接收声音的方法,包括步骤:将预定的识别信息添加到音频信号中;通过扬声器输出该已添加了所述识别信息的音频信号;接收外部声音信号;在根据外部声音的信号中识别信息的存在而确定在外部声音信号中包括该音频信号的情况下,从外部声音信号中去除该音频信号;通过识别该外部声音,输出对应于该外部声音的命令;以及接收该命令并控制对应于该命令的操作。
根据本发明,可以防止电子设备的误动作,因为在电视的语音识别模式中水印信息被添加到从扬声器输出的音频信号中,并且由检测器检测在所接收的外部声音信号中水印信息的存在。
                        附图说明
通过参考附图对本发明的优选实施例的详细描述,本发明的上述目的和特点将会变得更加清楚,其中:
图1是能够通过语音识别控制其操作的电视机的示意图;
图2示出了根据本发明优选实施例的能够防止语音识别中的错误和提高识别率的电子设备;
图3是图2中确定器的详细方框图;以及
图4是根据本发明优选实施例的用于防止语音识别中的错误并提高语音识别率的方法的流程图。
                        具体实施方式
以下,参照附图来详细说明本发明的实施例。
图2示出了根据本发明优选实施例的能够防止语音识别中的错误并提高语音识别率的电子设备。本实施例是以电视机作为电子设备的例子进行说明的。参照图2,本发明的电子设备包括:调谐器21,用于接收广播信号;外部信号输入单元22,用于接收来自诸如VTR和DVDP之类的图像再现器的再现信号;微处理器24,用于选择地输出从调谐器21和外部信号输入单元22输入的信号;电源23,用于提供电源至微处理器24;按键输入单元25,用于将涉及所需操作的控制命令输入到微处理器24;以及声音接收控制单元50,用于相对于通过语音识别的对应的操作,控制微处理器24。
图中的电视机组成如下:视频放大器26,用于放大从微处理器24输出的信号中的视频信号;显现单元27,用于将放大的视频信号转换成能够显示的格式;以及屏幕28,用于显示该重新格式化的视频信号。另外,该电视机包括音频放大器30,用于放大从微处理器24输出的信号中的音频信号;水印生成器40,用于提取该放大音频信号的谱信息,并将所提取的谱信息添加到该放大的音频信号中;以及扬声器31,用于放大和输出添加了谱信息作为可听的声音的音频信号。
同时,声音接收控制单元50包括:声音接收器52,用于接收从无线麦克风60输入的音频信号;确定器54,用于确定在声音接收器52中接收的音频信号是否是从扬声器31输出的声音或用户的语音信号;以及语音识别器56,用于检测对应于该接收声音的语音模型识别结果的命令,并在确定器54中将该语音信号识别为用户语音信号之后,将该命令发送到微处理器24。
图3是图2中所示的确定器54的详细方框图。根据该图,确定器54包括:检测器54a,用于从声音接收器52接收的音频信号中搜索所插入的水印信息;声音去除器54b,用于当检测到水印信息时,通过使用检测器54a中识别的音频谱来去除包括水印信息的音频信号;以及语音信号识别器54c,用于通过被去除音频信号的声音信号中的音频信号的能量电平来识别话音信号的存在。
无线麦克风60具有无线遥控功能,其配置有能够无线控制电视机操作的按键输入板(未示出)。麦克风60配置有模式转换按键,用于在电视观看的一般模式和语音识别模式之间切换。一般模式是根据无线麦克风60和按键输入单元25的按键选择通过控制微处理器24的操作能够观看电视的模式。语音识别模式是通过声音接收控制单元50接收语音能够控制微处理器的模式。
同时,设置水印生成器40的操作以仅当通过无线麦克风60选择语音识别模式时进行选择地操作。最好,如果用户通过选择无线麦克风60上的模式转换按键将该模式转换成语音识别模式,则声音接收控制单元50发送改变该转换成语音识别模式的信号至微处理器24。因此,在一般模式中,微处理器24输出被放大的音频信号而不需要通过扬声器31的水印生成器40的操作。
当从声音接收控制单元50接收通知将该模式转换成语音识别模式的信号时,微处理器24控制水印生成器以便将该音频信号的谱信息添加到放大的音频信号中,并将其通过扬声器31输出。音频信号的谱信息称为水印信息。该水印信息是隐藏信息,它包含关于原始信号的信息并对原始信号的质量没有任何影响。因此,尽管通过扬声器输出了包含水印信息的音频信号,用户仅收听到对应于该音频信号的声音。
同时,通过检测水印生成器40中音频信号的谱信息的水印信息识别一般使用线性预测编码(LPC),采样音频信号并通过谱变换计算系数。因此,检测器54a从声音接收器52接收的音频信号中搜索作为水印信息插入的谱信息,并且声音去除器54b使用检测器54a检测的声音的谱信息去除包括水印信息的音频信号。在这点上,话音信号识别器54c对剩余的声音信号不进行处理。即,语音信号识别器54c去除那些被认为不包括任何语音信号的外部声音信号,因为它们的能量电平比阈值低。语音信号识别器54c发送那些被认为包括语音信号的外部声音信号,因为它们的能量电平比阈值高。语音识别器56通过语音模型识别来识别输入的语音信号。所检测的命令被发送到微处理器24,使得微处理器24执行对应于该命令的操作。
因此,在语音识别模式中,在确定器54通过检测水印生成器40生成的音频信号的水印信息而进行的语音识别过程中,可以通过水印信息检测音频信号并在通过扬声器31生成该音频信号之前将该音频信息添加到该音频信号中。
接着,语音识别器56能够通过仅对外部声音的信号中的语音信号的语音模型识别来检测对应的命令,并且微处理器24能够防止由语音识别错误所引起的电子设备的不期望的操作。
同时,可通过用户语音控制的命令的一些例子是开机/关机、频道选择、音量控制和静音开/关操作。开机/关机操作控制电源23至电视机的各部分的电能提供,并且当发出对应于频道号的声音时,频道选择控制微处理器24选择频道。根据用户发出的“音量增加”和“音量减小”的声音,音量控制控制音频放大器30进行音量调整。根据用户发出的“静音开”的声音,静音开/关通过控制音频放大器31来控制音频信号的输出。
图4是根据本发明的用于防止电子设备的语音识别中的错误的方法的优选实施例的流程图。参照该图,当开机时,在接收从广播信号或再现设备输入的再现信号的同时,微处理器24首先根据无线麦克风60上的模式接键的选择确定当前控制信号输入模式是否为语音控制模式(步骤S42)。如果在该步骤(S42)识别为非语音控制模式,则微处理器24使用一般模式,使所接收的广播信号和再现信号通过屏幕28和扬声器31输出(S44)。如果在该步骤(S42)识别为语音控制模式,则微处理器24控制水印生成器40使其将水印信息添加到放大的音频信号中(S46)。带有所添加的水印信息的音频信号被放大并通过扬声器31被输出(S48)。
同时,检测器54a从外部声音信号中检测水印信息的存在(S52)。如果在该步骤(S52)从外部声音信号中检测到包括水印信息的信号,则检测器54a能够识别出在外部声音信号中,包括来自扬声器31的音频信号。因此,声音去除器54b从外部声音信号中去除所检测的、包括水印信息的、从扬声器31输出的音频信号的信号(S54)。
因此,通过将在从外部声音信号中去除音频信号后剩余的声音信号的能量电平与阈值相比较,语音信号识别器54c识别语音信号的存在(S56)。如果从外部声音信号中去除音频信号后剩余的声音信号的能量电平比阈值低,则将这样的声音信号识别为不包含任何语音信号,并对其不做任何处理;如果从外部声音信号中去除音频信号后剩余的声音信号的能量电平比阈值高,则将这样的声音信号识别为包含语音信号,并将其发送到语音识别器56(S58)。
同时,如果在该步骤(S52)从外部声音信号中没有检测到包括水印信息,则这些信号被发送到语音信号识别器54c,并且语音信号识别器54c通过将这些信号的能量电平与阈值相比较识别语音信号的存在(S56)。如果该声音信号的能量电平比阈值低,则这些信号被识别成不包含任何语音信号,并对它们不做任何处理。如果该声音信号的能量电平比阈值高,则这些信号被识别成包含语音信号,并将这些信号发送到语音识别器56(S58)。
对于在步骤S58被识别为语音信号的所接收的话音信号,通过对接收的语音信号的语音模型识别,语音识别器56通过微处理器24输出与该语音信号相关的命令(S60)。因此,微处理器24根据所接收的命令控制电视机(S62)。
因此,通过将水印信息添加到从扬声器31输出的音频信号中以及识别通过无线麦克风60发送的外部声音信号的水印信息的存在和检测用户语音信号,能够防止由于错误的语音识别引起的电视机操作的错误。
同时,本发明的实施例说明了配置有水印生成器40和声音接收控制单元50的电子设备。但是,在水印生成器40和声音接收控制单元50分别存在于两个不同的电子设备中的情况下,也可以使用本实施例。即,如果在能够通过扬声器输出音频信号的电子设备的扬声器之前采用了水印生成器40,以及如果在能够通过语音识别进行操作的电子设备中采用了声音接收控制单元50,同样可以使用本实施例。
根据本发明,由于将音频信号的水印信息添加到该音频信号中并随后通过扬声器31将该音频信号输出,因而当确定器54确定语音信号时,根据水印信息能够检测音频信号。因此,语音识别器56通过仅识别外部声音信号中的语音信号的模型来检测对应的命令,因此,微处理器24能够防止由于语音识别中的错误所造成的电子设备的误操作。
尽管已经描述了本发明的优选实施例,本领域技术人员将理解本发明不限于所描述的优选实施例。在所附的权利要求书限定的本发明的实质和范围内,可以产生许多改变和修改。

Claims (9)

1.一种电子设备,包括:
识别信息提供器,用于将预定的识别信息添加到音频信号中;
扬声器,用于输出已添加了该识别信息的音频信号;
声音接收器,用于接收外部声音;
确定器,用于根据在接收的外部声音的信号中识别信息的存在来确定在声音接收器接收的外部声音的信号是否为从扬声器输出的该音频信号,所述确定器包括:
检测器,用于搜索插入到声音接收器接收的外部声音的信号中的识别信息;
声音去除器,用于在检测到识别信息的情况下,使用检测器检测的谱信息去除包括识别信息的该音频信号;以及
语音信号识别器,用于根据从去除了该音频信号的外部声音的信号的能量电平来识别语音信号的存在;
语音识别器,用于当确定器确定外部声音的信号和该音频信号不同时,识别外部声音并输出对应于该外部声音的命令;以及
控制单元,用于接收命令并控制对应于该命令的操作。
2.如权利要求1所述的电子设备,其中识别信息是包括关于音频信号的谱信息的水印信息,识别信息提供器是用于将水印信息添加到音频信号中的水印生成器,确定器根据在语音识别器接收的外部声音信号中水印信息的存在确定该音频信号的存在。
3.如权利要求1所述的电子设备,其中根据用户选择设置识别信息提供器的操作模式。
4.一种电子设备,包括:
识别信息提供器,用于将预定识别信息添加到音频信号中;以及
扬声器,用于输出包括该识别信息的音频信号。
5.如权利要求4所述的电子设备,其中识别信息是包括关于音频信号的谱信息的水印信息,识别信息提供器是用于将水印信息添加到音频信号中并通过扬声器输出该音频信号的水印生成器。
6.一种电子设备,包括:
声音接收器,用于接收外部声音;
确定器,用于确定在声音接收器接收的外部声音的信号中预定识别信息的存在,其中确定器包括:
检测器,用于搜索插入到声音接收器接收的外部声音的信号中的识别信息;
声音去除器,用于在检测到识别信息的情况下,使用检测器检测的谱信息去除包括识别信息的该音频信号;以及
语音信号识别器,用于根据从去除了音频信号的外部声音的信号的能量电平来识别语音信号的存在;
语音识别器,用于在确定器确定在外部声音信号中不存在识别信息的情况下,输出对应于该外部声音的命令;以及
控制单元,用于接收该命令和控制对应于该命令的操作。
7.如权利要求6所述的电子设备,其中识别信息是包括外部声音信号的谱信息的水印信息,确定器根据在语音识别器接收的外部声音信号中水印信息的存在确定识别信息的存在。
8.一种用于接收声音的方法,包括步骤:
a)将预定的识别信息添加到音频信号中;
b)通过扬声器输出该已添加了所述识别信息的音频信号;
c)接收外部声音信号;
d)在根据外部声音的信号中识别信息的存在而确定在外部声音信号中包括该音频信号的情况下,从外部声音信号中去除该音频信号;
e)通过识别该外部声音,输出对应于该外部声音的命令;以及
f)接收该命令并控制对应于该命令的操作。
9.如权利要求8所述的接收声音的方法,其中识别信息是包括关于音频信号的谱信息的水印信息,在步骤a)中,将水印信息添加到音频信号中,根据在步骤d)中外部声音的信号中的水印信息的存在来确定该音频信号的存在。
CNB021055165A 2001-07-19 2002-04-12 能够防止语音识别中的错误和提高语音识别率的电子设备 Expired - Fee Related CN1188829C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020010043581A KR100552468B1 (ko) 2001-07-19 2001-07-19 음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할수 있는 전자기기 및 방법
KR43581/2001 2001-07-19

Publications (2)

Publication Number Publication Date
CN1399247A CN1399247A (zh) 2003-02-26
CN1188829C true CN1188829C (zh) 2005-02-09

Family

ID=19712317

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB021055165A Expired - Fee Related CN1188829C (zh) 2001-07-19 2002-04-12 能够防止语音识别中的错误和提高语音识别率的电子设备

Country Status (6)

Country Link
US (1) US20030018479A1 (zh)
EP (1) EP1278183B1 (zh)
JP (1) JP2003044069A (zh)
KR (1) KR100552468B1 (zh)
CN (1) CN1188829C (zh)
DE (1) DE60217444T2 (zh)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7324947B2 (en) 2001-10-03 2008-01-29 Promptu Systems Corporation Global speech user interface
DE10251209A1 (de) * 2002-10-31 2004-05-19 Sennheiser Electronic Gmbh & Co. Kg Mikrofonsystem
KR20040048435A (ko) * 2002-12-03 2004-06-10 조미화 음성 제어 텔레비젼 수상기 및 음성 제어 방법
JP2005338454A (ja) * 2004-05-27 2005-12-08 Toshiba Tec Corp 音声対話装置
US10032452B1 (en) * 2016-12-30 2018-07-24 Google Llc Multimodal transmission of packetized data
CN100426768C (zh) * 2004-12-16 2008-10-15 智捷科技股份有限公司 无线网络传输发送器与接收器及建立无线网络传输的方法
US20080086311A1 (en) * 2006-04-11 2008-04-10 Conwell William Y Speech Recognition, and Related Systems
US11017428B2 (en) 2008-02-21 2021-05-25 Google Llc System and method of data transmission rate adjustment
US10013986B1 (en) 2016-12-30 2018-07-03 Google Llc Data structure pooling of voice activated data packets
JP2010164992A (ja) * 2010-03-19 2010-07-29 Toshiba Tec Corp 音声対話装置
TWI412019B (zh) * 2010-12-03 2013-10-11 Ind Tech Res Inst 聲音事件偵測模組及其方法
US9922334B1 (en) 2012-04-06 2018-03-20 Google Llc Providing an advertisement based on a minimum number of exposures
US10776830B2 (en) 2012-05-23 2020-09-15 Google Llc Methods and systems for identifying new computers and providing matching services
US10152723B2 (en) 2012-05-23 2018-12-11 Google Llc Methods and systems for identifying new computers and providing matching services
US9065971B2 (en) * 2012-12-19 2015-06-23 Microsoft Technology Licensing, Llc Video and audio tagging for active speaker detection
CN104956436B (zh) 2012-12-28 2018-05-29 株式会社索思未来 带有语音识别功能的设备以及语音识别方法
JP6115152B2 (ja) * 2013-01-29 2017-04-19 コニカミノルタ株式会社 情報処理システム、情報処理装置、情報処理端末及びプログラム
US10650066B2 (en) 2013-01-31 2020-05-12 Google Llc Enhancing sitelinks with creative content
US10735552B2 (en) 2013-01-31 2020-08-04 Google Llc Secondary transmissions of packetized data
US9384754B2 (en) 2013-03-12 2016-07-05 Comcast Cable Communications, Llc Removal of audio noise
CN104238379B (zh) * 2013-06-07 2017-07-28 艾默生过程控制流量技术有限公司 变送器、现场仪表以及用于控制变送器的方法
CN103366744B (zh) * 2013-07-04 2015-10-14 三星半导体(中国)研究开发有限公司 基于语音控制便携式终端的方法和装置
CN104135619A (zh) * 2014-08-12 2014-11-05 广东欧珀移动通信有限公司 一种摄像头控制方法及装置
CN104456830A (zh) * 2014-10-29 2015-03-25 无锡悟莘科技有限公司 一种智能空调的声音控制方法
US9818414B2 (en) * 2015-06-04 2017-11-14 Intel Corporation Dialogue system with audio watermark
US10074364B1 (en) * 2016-02-02 2018-09-11 Amazon Technologies, Inc. Sound profile generation based on speech recognition results exceeding a threshold
JP6810527B2 (ja) * 2016-03-11 2021-01-06 パイオニア株式会社 再生制御装置、再生制御システム、並びに再生制御方法、プログラム及び記録媒体
US11138987B2 (en) 2016-04-04 2021-10-05 Honeywell International Inc. System and method to distinguish sources in a multiple audio source environment
US10708313B2 (en) 2016-12-30 2020-07-07 Google Llc Multimodal transmission of packetized data
US10593329B2 (en) 2016-12-30 2020-03-17 Google Llc Multimodal transmission of packetized data
US10395650B2 (en) 2017-06-05 2019-08-27 Google Llc Recorded media hotword trigger suppression
CN107464560A (zh) * 2017-08-14 2017-12-12 广东九联科技股份有限公司 一种智能语音回采方法及其系统
MX2020002591A (es) 2017-09-15 2020-07-13 Sony Corp Aparato de procesamiento de la informacion y metodo de procesamiento de informacion.
US10276175B1 (en) 2017-11-28 2019-04-30 Google Llc Key phrase detection with audio watermarking
JP7013093B2 (ja) * 2018-05-01 2022-01-31 アルパイン株式会社 故障検出装置、移動体搭載装置、故障検出方法
US10692496B2 (en) 2018-05-22 2020-06-23 Google Llc Hotword suppression
JP7106120B2 (ja) * 2018-11-22 2022-07-26 国立大学法人東北大学 音声対話装置および音声対話システム
US11922953B2 (en) * 2018-12-18 2024-03-05 Nissan Motor Co., Ltd. Voice recognition device, control method of voice recognition device, content reproducing device, and content transmission/reception system
KR20200076441A (ko) * 2018-12-19 2020-06-29 삼성전자주식회사 전자 장치 및 그의 제어 방법
KR102584588B1 (ko) 2019-01-21 2023-10-05 삼성전자주식회사 전자 장치 및 전자 장치의 제어 방법
KR20200098025A (ko) 2019-02-11 2020-08-20 삼성전자주식회사 전자 장치 및 그 제어 방법
US20220406306A1 (en) * 2019-11-21 2022-12-22 Sony Group Corporation Information processing system, information processing device, information processing method, and program
KR20210123633A (ko) * 2020-04-03 2021-10-14 삼성전자주식회사 음성 명령에 대응하는 태스크를 수행하는 전자 장치 및 그 동작 방법
CN116959438A (zh) * 2022-04-18 2023-10-27 华为技术有限公司 唤醒设备的方法、电子设备和存储介质

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3004104A (en) * 1954-04-29 1961-10-10 Muzak Corp Identification of sound and like signals
JPS60193000A (ja) * 1984-03-14 1985-10-01 富士重工業株式会社 自動車の音声認識装置
JPS63171071A (ja) * 1987-01-08 1988-07-14 Matsushita Commun Ind Co Ltd 音声制御装置
US5267323A (en) * 1989-12-29 1993-11-30 Pioneer Electronic Corporation Voice-operated remote control system
JPH05197385A (ja) * 1992-01-20 1993-08-06 Sanyo Electric Co Ltd 音声認識装置
US5452289A (en) * 1993-01-08 1995-09-19 Multi-Tech Systems, Inc. Computer-based multifunction personal communications system
US5765130A (en) * 1996-05-21 1998-06-09 Applied Language Technologies, Inc. Method and apparatus for facilitating speech barge-in in connection with voice recognition systems
EP0941597B1 (en) * 1996-11-28 2002-01-30 BRITISH TELECOMMUNICATIONS public limited company Interactive apparatus and method
US6480825B1 (en) * 1997-01-31 2002-11-12 T-Netix, Inc. System and method for detecting a recorded voice
JPH10257583A (ja) * 1997-03-06 1998-09-25 Asahi Chem Ind Co Ltd 音声処理装置およびその音声処理方法
DE19712632A1 (de) * 1997-03-26 1998-10-01 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Sprachfernsteuerung von Geräten
US6385176B1 (en) * 1998-06-04 2002-05-07 Lucent Technologies Inc. Communication system based on echo canceler tap profile
JP2000132200A (ja) * 1998-10-27 2000-05-12 Matsushita Electric Ind Co Ltd 音声認識機能付きオーディオ/ビデオ装置および音声認識方法
US6522769B1 (en) * 1999-05-19 2003-02-18 Digimarc Corporation Reconfiguring a watermark detector
KR20010004832A (ko) * 1999-06-30 2001-01-15 구자홍 음성인식을 이용한 기기 제어장치
JP4554044B2 (ja) * 1999-07-28 2010-09-29 パナソニック株式会社 Av機器用音声認識装置
WO2001050665A1 (en) * 1999-12-30 2001-07-12 Digimarc Corporation Watermark-based personal audio appliance
WO2001052178A1 (en) * 2000-01-13 2001-07-19 Digimarc Corporation Authenticating metadata and embedding metadata in watermarks of media signals
US6737957B1 (en) * 2000-02-16 2004-05-18 Verance Corporation Remote control signaling using audio watermarks
KR20020058116A (ko) * 2000-12-29 2002-07-12 조미화 음성 제어 텔레비젼 수상기 및 음성 제어 방법
CN1910823A (zh) * 2003-05-19 2007-02-07 金泰克斯公司 包含免提电话部件的后视镜组件

Also Published As

Publication number Publication date
CN1399247A (zh) 2003-02-26
EP1278183A1 (en) 2003-01-22
DE60217444D1 (de) 2007-02-22
KR100552468B1 (ko) 2006-02-15
KR20030008726A (ko) 2003-01-29
EP1278183B1 (en) 2007-01-10
JP2003044069A (ja) 2003-02-14
DE60217444T2 (de) 2007-05-24
US20030018479A1 (en) 2003-01-23

Similar Documents

Publication Publication Date Title
CN1188829C (zh) 能够防止语音识别中的错误和提高语音识别率的电子设备
CN1741596A (zh) 视频设备及其控制方法
US20080094524A1 (en) Audio Source Selection
CN1212097A (zh) 借助于感觉编码的辅助信号和声频信号同时传送
CN1186963C (zh) 用于互联网装置的带有送话器/扬声器的无线遥控系统以及用于控制其中遥控器工作的方法
CN1943222A (zh) 用于控制媒体内容处理设备的方法和媒体内容处理设备
CN101998077A (zh) 语音控制装置、语音控制方法及相关显示装置
US7020292B1 (en) Apparatuses and methods for recognizing an audio input and muting an audio device
JP2004219728A (ja) 音声認識装置
CN2681491Y (zh) 电视语音点播器
EP0639933A2 (en) Method and apparatus for processing an audio signal by surround modes
US20050021607A1 (en) Network system, electronic equipment terminal, server apparatus and method for distributing and reproducing the contents
JP2008108166A (ja) 楽曲選択装置、楽曲選択方法
CN101035213A (zh) 根据周围噪音将声音模式转换成字幕模式的电视机及控制方法
KR100499032B1 (ko) 텔레비젼 수신기를 기반으로 하는 오디오 및 비디오 합성편집장치
CN1627800A (zh) 以电视接收机为基础的音频和视频合成编辑装置
CN1675833A (zh) 铃声触发的静音
CN1612260A (zh) 具有来电显示的影音播放装置
CN1535075A (zh) 具有调谐单元和数字再现单元的音频装置
KR19980040390A (ko) 스테레오 프로그램 방송 검파에 의한 디지털 비디오 디스크 드라이브 장치의 음량 자동 조정 장치
CN2665866Y (zh) 具有来电显示的影音播放装置
KR19980040384A (ko) 스테레오 프로그램 방송검파에 의한 음량자동조정장치
KR100252617B1 (ko) 주변소음 적응식 텔레비전 수상기
JP2008085754A (ja) デジタル放送受信装置、並びにデジタル放送受信装置の制御方法及び制御プログラム。
CN101057429A (zh) 分析音频内容以及仅再现期望的音频数据的方法和装置

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20050209

Termination date: 20100412